有兩個人搶銀行,被抓到了。兩個人分開審問,如果兩個人同時說真話,那就沒有價值,都被判九年。如果其中一個人說了真話,另一個人說了假話,那麼真話的人被判兩年,假話的人被判五年。如果兩個人都說了假話,那麼將沒有機會出來。如果是你,會怎麼選擇?


實驗本身需要具有合理性,你覺得這個實驗合理嗎?寶貝


目錄

Assumptions

Set-up

Strategic Form

Pure Strategy Nash Equilibrium

Mixed Strategy Nash Equilibrium

Repeated Game

不認真審題啊都!別管錯沒錯,既然出了就按照這個set up來看唄!

大家都說是囚徒困境……這其實明明是Battle of Sex嘛!!正好來複習一下。純屬娛樂,勿噴!

先碼一下再追更!


Assumptions

題目給的條件很籠統,為了嚴謹一點,我們做一些簡單的假設。

【Assumption 1】假設每個人的payoff和所盼年數是完全負相關的。這個條件很重要,因為萬一兩個人中有人覺得……

進了裡面個個都是人才,說話又好聽,超喜歡在裡面。

也就是說,每個人的felicity function為

[公式]

  • [公式] 表示所判年限。

這樣的felicity function是否合理值得討論,後面如果我還有興趣的話可以試試放寬這個條件。

【Assumption 2】假說兩個人還可以活50年。題目裏還有個條件不是很明確:

如果兩個人都說了假話,那麼將沒有機會出來。

如果我沒理解錯的話,樓主指的是無期。人的預期壽命是有限的,因此我認為假設這時候的payoff為 [公式] 並不是十分合理。如果說人的預期壽命是70歲,兩人搶銀行時是20歲(年輕氣盛hh),那麼兩人預期還可以活50年這個假設還可以接受。也就是說,當兩個人都說假話時,payoff是 [公式]

當然這個assumption也可以放寬,但是為了簡單還是先用著。


Set-up

博弈裏的三個元素:

  • Players[公式] (假設把兩個人編號成1和2)
  • Strategies:每個人都有兩個策略。說真話(Truth)寫作 [公式] ,說假話(Lie)寫作 [公式] 。策略集合用 [公式] 表示, [公式] 是player編碼。

[公式]

  • Payoffs:我們用小寫的 [公式] 表示player [公式] 的純策略, [公式] 。此外,為了表達payoff function,我們用 [公式] 來表示player [公式] 在給定對手策略的情況下選擇 [公式] 的收益。

[公式]

[公式]


Strategic Form

1 2 真話(T) 假話(L)
真話(T) -9,-9 -2,-5
假話(L) -5,-2 -50,-50

Pure Strategy Nash Equilibrium

知乎表格竟然不能劃線加粗……那我寫一下。

先定義一下best response:best response 是在給定對手策略的情況下可以讓player獲得最高payoff的策略,表示成一個關於 [公式] 的函數:

[公式]

如果有一個策略組合,在給定對手策略的情況下兩個人都是Best response,那麼那個策略組合就是Nash equilibrium(NE)。

  • 當player 2選 [公式] 時, [公式]
  • 當player 2選 [公式] 時, [公式]
  • 當player 1選 [公式] 時, [公式]
  • 當player 1選 [公式] 時, [公式]

所以有兩個NE: [公式]


Mixed Strategy Nash Equilibrium

現在允許玩家在一定概率下選擇策略(mixed strategy)。

假設player [公式] 選擇 [公式] 的概率是 [公式]

  • 給定 [公式] ,player 2選擇 [公式] 的預期收益為

[公式]

  • 給定 [公式] ,player 2選擇 [公式] 的預期收益為

[公式]

如果player 1選擇 [公式] ,則說明 [公式]

[公式]

[公式]

同理, [公式]

所以mixed strategy NE是 [公式] 。此策略下,兩個人的payoff是 [公式] ,僅僅比 [公式] 稍微強一點,因為 [公式] 這個策略太差了……即使只有一點點可能性,也會降低預期收益很多,這導致混合策略向 [公式] 策略傾斜很多。

Repeated Game

如果允許重複博弈的話呢?

好像因為有個 [公式] 重複博弈奇奇怪怪的……那我們假設他們子承父業吧!兒子的選擇會受到父親之前選擇結果的影響,但這個影響隨著時間會減弱:爺爺輩的選擇相比爸爸輩的選擇影響更小。假設這個discount factor是 [公式]

我們之前提到mixed strategy NE 的payoff是比 pure strategy NE要更差的。

我們可以把幾個策略畫在圖上:

其中,橙色的兩個點是(-9, -9)和(-110/13,-110/13)。

我們放大左上角,根據 Nash Threat Folk Theorem,整個橙色區域(沒標點的位置,你們大概體會一下)裏的payoff組合在infinite repeated game下都存在相應的 [公式] 使其成為subgame perfect equilibrium。

懶惰了……之後佛系再更。


囚徒困境的題不是這麼出的,一個真話一個撒謊,撒謊的人判的時間很長。

你這題直接就是向著撒謊去的。問題出錯了!聯繫看看博弈論中的囚徒困境!


經濟學裡做實驗可是要有真實激勵的哈哈哈,付錢才能看出真的選擇,否則說了都是白說。


這也不是囚徒困境啊,不過要說的話分類討論看看。

假設囚徒A說真話,B有可能判9年(真)或者2年(假)。

假設囚徒A說假話,B有可能判5年(真)或者無期(假)。

並不存在納什均衡。

這時候感覺只能假設兩囚徒是風險中性的純以期望做判斷。

A說真話,可能被判9年或者5年。

A說假話,可能被判2年或無期。

A會選擇說真話,B也一樣。


推薦閱讀:
相關文章