這道「博弈題」真的那麼簡單?

關於一道決策論題引發的思考

題目如下:

這看似是一道經典的決策論/博弈論題,但是非理論情況下涉及心理暗示與統計論,下文我會有解釋。

假設一共n人,多半人就是(n/2)+m,少半人就是(n/2)-m,除了「我「一共n-1人

註:所有人選A和大部分選A是一樣的,同理適用於B。當n/2是整數時,可能存在m為0情況,所以當A與B的人相同時,此題無解

從簡單表格來看,似乎只有多半人選A時無論我選什麼才有分

而當多半人選B的時候我選什麼都是沒分的

註:單從表格分析只能解部分無主觀不確定成分的題型,而此題涉及到主觀與統計性的p類問題。所以單從表格看無法看出答案,但是卻可以看出均衡信息。

我的得分與否只能取決於我是否選在(n/2)+1中,如果把此題作為博弈題來解,既用Nash均衡,從表格看來似乎均衡點落在所有人都選B上,當所有人包括自己在內選B是一個對稱均衡,因為只要(n/2)+1選則B無論我選什麼都是沒分,所以為了要的分,如何獲得A為均衡點的條件是要做的。以下是某位網友解法:

以下結論均建立在博弈理論基礎上:

1. 決策主體是理性的,最大化自己的利益

2. 完全理性是共同認知

3. 每個參與人都被假定為對所處環境及其他參與者的行為形成正確信念與預期

(博弈論研究假設)

一般認為,博弈主要可以分為合作博弈和非合作博弈。合作博弈和非合作博弈的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。所以,以上這種情況發生在與這次博弈相反的情況,也就是開放博弈,即所有個體都可以與外界有信息交流,這樣就可以商討出使所有人都有收益的情況並落實,也就是達到剛剛所說的合作博弈,所以在開放博弈中,B將不會是一個均衡點,反而A將是一個均衡點,且所有人都選A是公平的,所以上圖就是圍繞著如何使A點作為均衡點的條件來寫的。

(完全信息博弈: 完全博弈是指在博弈過程中,每一位參與人對其他參與人的特徵、策略空間收益函數有準確的信息。)

這種博弈狀態就像合作博弈一樣只存在與開放博弈中。

(不完全信息博弈: 不完全信息博弈是指如果參與人對其他參與人的特徵、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函數都有準確的信息,在這種情況下進行的博弈就是不完全信息博弈。)

這種博弈狀態並存於開放博弈和非開放博弈中。

(納什均衡點:均衡點是在沒有必然條件與客觀事實答案約束的問題或博弈中的個體或團體能找到最佳的收益點,此點應使博弈中利益/損失達到最大化的平衡,否則就是失利點。)

納什均衡的表達:

但納什均衡點定義只局限於任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結論缺乏說服力,研究者們形象地稱之為「天真可愛的納什均衡點」。

(封閉博弈:封閉博弈是指在博弈中所有個體或局內人沒有任何信息交流且不存在合作博弈的狀態,在此狀態下能否達到均衡點的決策有且只有一個,否則就是開放博弈。)

所以對於封閉博弈狀態,局中人有且只有一種策略,所以納什均衡點完全存在在封閉博弈中。

博弈的基本成分:

1. 局中人:在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為「兩人博弈」,而多於兩個局中人的博弈稱為 「多人博弈」。

2. 策略:一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全局籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為「有限博弈」,否則稱為「無限博弈」。

3. 得失:一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全局中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的「得失」是全體局中人所取定的一組策略的函數,通常稱為支付(payoff)函數。

4. 對於博弈參與者來說,存在著一博弈結果 。

博弈涉及到均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,它是一穩定的博弈結果。

個人認為,這樣解這道題是錯的,或者說,「解」這道題本身就是錯的,首先,不能把其作為一道題,既然屬於博弈,而且是個體博弈,也就是說在個體組成的集體中沒有互相的信息來往,所以可以說是一個封閉博弈,在封閉博弈的前提下,即使知道如何能使所有個體利益達到最大化,個體與個體之間沒有信息交流也是沒用的。所以現在最重要的使分析哪個選項是均衡點,前面已經給出,B是一個均衡點,為什麼B一定均衡呢?

當你拿到這三個條件的時候,首先要做的其實是分析,所以應該拋棄先入為主的概念,現在我們回顧一下這三個條件:

1. 過半人選A,A,+2

2. 過半人選A,B,+10

3. 過半人選B,A/B, +0

兩個選項A或B

所以:當你選A時,如果大部分人選A,你有兩份收益

當你選B且大部分人選A時,你有十份收益

當大於一半人選B,無論選什麼都沒有收益

且應先思考別人會選什麼,而不是自己會選什麼的時候,最終答案應該是:

A.+2 +0

B.+10+0

顯然,B是一個均衡,大部分人都會選B(原因1:猜疑鏈是導致無法把收益最大方案落實的根,技術爆炸就像收益一樣,你肯定不想讓自己收益最小或讓對方收益爆炸(前提是沒有任何信息交流),所以顯而易見黑暗森林法則巧妙地適用於封閉博弈)這道題的初衷是不給分的,再說一次,沒有信息交流,就沒有每個人收益最大的方案,用信息熵打個比方,就好比群體的熵值保持不變,永遠等於題目熵值,而個體熵值在不斷變大,如果沒有信息來往,個體熵是永遠無法影響到群體的。這就是一場巧妙地看似公平其實單方面平衡的博弈,最終答案肯定是所有人沒有收益。

如果還是沒有說服力,我現在模擬一下其中的一個理性的人的心理想法:

「如果所有人都選B,沒分,所以我想得分就要估算一下是否有大於一半的人選B,如果沒有,那麼如果我選A我就得兩分,如果我選B,我得十分,但是是否大部分人都願意選A呢?如果我選A,那麼這些選B的人就得十分,或者是我們都不得分,不公平,所以只要大部分人選A,選B的就會有分數增益,而且不能保證大部分人都選A,所以如果我選B,事情就簡單了,要麼所有人不得分,要麼我得10分,這樣我不得分其他人也不會得分,所以歸總一下:A.+2 +0 B.+10+0,在不能保證別人選什麼的時候,均衡點就落在B上。」

結束。

——————分—————— 界——————線—————— 以上就是這道封閉博弈題的分析。不難看出,分析後一定會產生無數種方法來改良這道題從而達到不同的博弈或者是難度,以下兩種改進方案均為個人觀點:

重複一下:

以上我所敘述的只存在於理論情況下,即:

1.決策主體是理性的,最大化自己的利益

2.完全理性是共同認知

3.每個參與人都被假定為對所處環境及其他參與者的行為形成正確信念與預期

(博弈論研究假設)

這就意味著實際情況並非都如此,即只要有一個假設不成立就要歸為實際情況來考慮,實際情況帶來的主觀的不確定性最終導致了均衡點的偏離,也就是選A的人超過一半,或多少人沒有想到B是一個均衡點,還有多少人想到B是均衡點而還是去選A,以至於違背了最基本的博弈論假設。所以我現在修改一下這道博弈題且可以根據實際情況決定選A的人有多少從而推測出幾率範圍,從而使這個封閉博弈更有意義。

第三個選項——C

既然已知是一個封閉博弈,即不存在「零或非零與博弈(大部分情況只存在於開放博弈)」狀態,那麼又知道B是均衡點,所有人沒有收益,只能說出這道題的意義不明確,且為了使這道題有意義且有連貫性,要麼把他變成一個開放式博弈,要麼加入了一個新的開放式選項C現在我提出兩種可能可行的c選項的方案,先來探討一下

第一個C選項的定義如下:

即如果你選C,則代表自動退出這場博弈且不計算進總人數(還記得前面說過的(n/2)嗎,當選則C選項的時候將不計入n的值),所以現在有可能出現2/n為整數情況,也就有可能使此題無解

選C之後,仍然可以獲得一次得分機會,猜測A,B,C三個選項的選擇人數比例關係,哪個選項的選擇人數佔比最大(這裡的選擇人數和上面的n沒關係,選擇人數是指所有選A,B,C這三個選項的人的人數),如果選對了,將會獲得2分,選錯沒有分。但是為了保留原有題目的設定,即前提條件為封閉博弈,我們只能加入一個選項從而產生單向信息思考而不是雙向思考。現在試著先用一張圖表達一下目前加入此C選項後的博弈:

要想使這道題活起來就必須有「思考互動」,或者是促進思考互動的條件,當然,雖然整道題從客觀看來仍然是一個封閉式博弈,但是隨著C選項的加入,封閉式博弈內部將產生迴流,而且這些迴流恰恰是由參加博弈的個體產生的,所以因此達到活性的目的,從而大大加大對此題估測的難度,甚至一開始很難預算均衡點(此處納什均衡點是存在的,因為此封閉博弈中沒有信息的交互而導致所有參與者無法獲取信息來修改自己的選擇)的位置,C選項的猜測使被動性信息思考變為主動性信息思考,從而達到單向的主動思考的制導。所以加入此C選項的優點在於其形成了一個半開放式博弈環境。

以上雖然加入了信息思考流動,但是博弈意義卻沒有增加,為什麼博弈意義和原來是一樣的?

分析一下:當加入C選項後會有什麼後果:

選C的人與選A與B的人之間沒有糾纏,也就是說加入C選項之後原本的博弈從根本上沒有變化,只不過是多了一些「賭博」的成分,而且賭的結果和博弈本身毫無關係,即使我不考慮C選項,其結果對博弈本身也沒有什麼影響,原因就在於整個博弈系統是分開的,C選項是「糾纏」於A,B的,而A,B則不「糾纏」於C:

所以此時就單個A,B系統博弈而言當然均衡點還在B上,但是既然C選項也在所有這道題中當然也要考慮在內,所以就整個系統來說均衡點在(A,B)與(C)之間,或者說是選B還是選C,在博弈論研究假設情況下所有人都會選C,且所有人都會得分,因為當選A,B系統時是肯定不得分的,而選C系統還有三分之一幾率,且所有人都會猜測C選項的選擇人數最多,所以選C就是均衡點。

也可以稍微做些修改使兩個系統糾纏,但是其過程太過於繁瑣,所以可以直接奧卡姆剃刀了。

【統一整個系統,讓所有選A,B的人也能考慮到C,也就是使所有選項互相糾纏,所以使A,B糾纏於C選項,可以做以下調整:

過半人選A,你也選A 選A人數大於三分之一,你也選A +2

過半人選A,你選B 選A人數大於三分之一,你選B +10

過半人選B,不得分 選B人數大於三分之一,則選A,B不得分

選A,B,C的人數相等時,所有人不得分

而此時的均衡點也就更複雜了。

總結:這裡的C選項的概念更趨向於「不選」這個定義,而剩下的選項A,B為「選」這個定義,當選擇「選」的那一時刻,則你就是局內人,當選擇「不選」時,則你就是局外人。反過來,當「選」與「不選」糾纏後,自然就沒有局內外之分了。

還有一種中規中矩的方案:當不存在改變本題目本質的可能性後,延展性應收縮為線性,根據實際情況增加選項的數量。當所有選項為一個元素為n的集合時,即其中每一個獨立元素都屬於此集合,所以在選擇性存在於封閉靜態博弈,不存在開放信息,且只有一次選則機會,所以建立在此基礎上的均衡點自然可循,所以在基於博弈論基礎理論之上的選項延展性將達到極限,所以答案也必將為線性,所以可增加的選項也自然為線性,所以假設增加1個選項C,則整體題目的定義基本如下:

1過三分之一人選A,你選A,+2

2過三分之一人選A,你選B,+2

3過三分之一人選A,你選C,+10

4過三分之一人選B,你選A,+2

5過三分之一人選B,你選C,+10

6過三分之一人選B,你選B,+2

7過三分之一人選C,你選什麼都沒分

以上就是加入C選項之後的各條件情況的變化,不難看出,建立在新的選項上的條件似乎只是增加或改變了幾個基本參數的取值,比如說「三分之一,+10,+2」。這些數值是隨著新的選項的加入而變化的,當然,這些變化從本質上來說並沒有偏離封閉博弈的大綱,變化的只是存在在其中的均衡點。所以自然也就暴露了出題的局限性。

但是值得注意的是所有參數的改變是可以按照比例進行的,上面列出的7個條件完全遵循「雙選項」的比例,所以看似均衡點在隨著參數在一直變化,但是這種變化是有規律的,先打個比方,加入了C選項但參數比例保持不變的情況下均衡點在C,固原因和雙選項相似,當選C的時候你不但決定了別人的收益情況,還能保證自己的收益在最大範圍內,所以規律就是在參數比例和最初的比例相同時,無論有多少個選項,均衡點不隨選項變化而變化。相反,在比例持續變化的題設當中,比如加入D選項,人數參數為「四分之一/四分之二…」,收益參數為「+2/+3/+4…」。當選項直線性增加時,均衡點的變化可以說是「波」狀的,也就是說均衡點的位置非常難找,類似於「波函數」的性質。這樣的計算對於人腦來說就是龐大的計算量。

打個比方,還只是C選項,我們改一下條件:

1過三分之二人選A,你選A,+4

2過三分之二人選A,你選B,+0

3過三分之一人選A,你選C,+2

4過三分之一人選B,你選A,+4

5過三分之二人選B,你選C,+10

6過三分之一人選B,你選B,+2

7過三分之二人選C,你選什麼都沒分

現在再找規律就不可能那麼簡單了,用一張圖表達函數關係一下:

上面的大箭頭為選項參數比例隨著選項的數量增加而變化,橫坐標為均衡點隨箭頭的變化而變化,縱坐標為均衡點在選項中的位置。中間的標示出的縱線就表示某一數量的選項與隨機的比例帶來的均衡點的位置。

——————————結——————束—————————

綜上所述,一,二兩種設想中都只是保留了最初的封閉博弈,不完全信息博弈,非合作博弈這三種情況之上的,而均衡點則是純戰略形式的。

補充一下納什均衡的分類:

那麼到底怎麼知道納什均衡的存在?在每個參與者都只有有限種策略選擇並允許混合策略的前提下,納什均衡一定存在,均衡點在開放博弈與封閉博弈中的區別也是顯而易見的。而納什均衡本身也有兩種分類:純戰略納什均衡與混合戰略納什均衡。

所謂純戰略是提供給玩家要如何進行賽局的一個完整的定義。特別地是,純戰略決定在任何一種情況下要做的移動。戰略集合是由玩家能夠施行的純戰略所組成的集合。而混合戰略是對每個純戰略分配一個機率而形成的戰略。混合戰略允許玩家隨機選擇一個純戰略。混合戰略博弈均衡中要用概率計算,因為每一種策略都是隨機的,達到某一概率時,可以實現支付最優。因為機率是連續的,所以即使集合是有限的,也會有無限多個混合戰略。

故「純戰略納什均衡」,即參與之中的所有玩家都玩純戰略;而相應的「混合戰略納什均衡」,之中至少有一位玩家玩混合戰略。並不是每個賽局都會有純戰略納什均衡,例如「錢幣問題"就只有混合戰略納什均衡,而沒有純戰略納什均衡。不過,還是有許多賽局有純戰略納什均衡(如協調賽局,囚徒困境和獵鹿賽局)。甚至,有些賽局能同時有純戰略和混合戰略均衡。


推薦閱讀:
相关文章