問問大佬經濟學的問題?
有兩個人搶銀行,被抓到了。兩個人分開審問,如果兩個人同時說真話,那就沒有價值,都被判九年。如果其中一個人說了真話,另一個人說了假話,那麼真話的人被判兩年,假話的人被判五年。如果兩個人都說了假話,那麼將沒有機會出來。如果是你,會怎麼選擇?
實驗本身需要具有合理性,你覺得這個實驗合理嗎?寶貝
目錄
AssumptionsSet-upStrategic FormPure Strategy Nash EquilibriumMixed Strategy Nash EquilibriumRepeated Game
不認真審題啊都!別管錯沒錯,既然出了就按照這個set up來看唄!
大家都說是囚徒困境……這其實明明是Battle of Sex嘛!!正好來複習一下。純屬娛樂,勿噴!
先碼一下再追更!
Assumptions
題目給的條件很籠統,為了嚴謹一點,我們做一些簡單的假設。
【Assumption 1】假設每個人的payoff和所盼年數是完全負相關的。這個條件很重要,因為萬一兩個人中有人覺得……
進了裡面個個都是人才,說話又好聽,超喜歡在裡面。
也就是說,每個人的felicity function為
- 表示所判年限。
這樣的felicity function是否合理值得討論,後面如果我還有興趣的話可以試試放寬這個條件。
【Assumption 2】假說兩個人還可以活50年。題目裏還有個條件不是很明確:
如果兩個人都說了假話,那麼將沒有機會出來。
如果我沒理解錯的話,樓主指的是無期。人的預期壽命是有限的,因此我認為假設這時候的payoff為 並不是十分合理。如果說人的預期壽命是70歲,兩人搶銀行時是20歲(年輕氣盛hh),那麼兩人預期還可以活50年這個假設還可以接受。也就是說,當兩個人都說假話時,payoff是 。
當然這個assumption也可以放寬,但是為了簡單還是先用著。
Set-up
博弈裏的三個元素:
- Players: (假設把兩個人編號成1和2)
- Strategies:每個人都有兩個策略。說真話(Truth)寫作 ,說假話(Lie)寫作 。策略集合用 表示, 是player編碼。
- Payoffs:我們用小寫的 表示player 的純策略, 。此外,為了表達payoff function,我們用 來表示player 在給定對手策略的情況下選擇 的收益。
Strategic Form
1 2 | 真話(T) | 假話(L) |
---|---|---|
真話(T) | -9,-9 | -2,-5 |
假話(L) | -5,-2 | -50,-50 |
Pure Strategy Nash Equilibrium
知乎表格竟然不能劃線加粗……那我寫一下。
先定義一下best response:best response 是在給定對手策略的情況下可以讓player獲得最高payoff的策略,表示成一個關於 的函數:
如果有一個策略組合,在給定對手策略的情況下兩個人都是Best response,那麼那個策略組合就是Nash equilibrium(NE)。
- 當player 2選 時,
- 當player 2選 時,
- 當player 1選 時,
- 當player 1選 時,
所以有兩個NE: 。
Mixed Strategy Nash Equilibrium
現在允許玩家在一定概率下選擇策略(mixed strategy)。
假設player 選擇 的概率是 。
- 給定 ,player 2選擇 的預期收益為
- 給定 ,player 2選擇 的預期收益為
如果player 1選擇 ,則說明 ,
即
同理, 。
所以mixed strategy NE是 。此策略下,兩個人的payoff是 ,僅僅比 稍微強一點,因為 這個策略太差了……即使只有一點點可能性,也會降低預期收益很多,這導致混合策略向 策略傾斜很多。
Repeated Game
如果允許重複博弈的話呢?
好像因為有個 重複博弈奇奇怪怪的……那我們假設他們子承父業吧!兒子的選擇會受到父親之前選擇結果的影響,但這個影響隨著時間會減弱:爺爺輩的選擇相比爸爸輩的選擇影響更小。假設這個discount factor是 。
我們之前提到mixed strategy NE 的payoff是比 pure strategy NE要更差的。
我們可以把幾個策略畫在圖上:
其中,橙色的兩個點是(-9, -9)和(-110/13,-110/13)。
我們放大左上角,根據 Nash Threat Folk Theorem,整個橙色區域(沒標點的位置,你們大概體會一下)裏的payoff組合在infinite repeated game下都存在相應的 使其成為subgame perfect equilibrium。
懶惰了……之後佛系再更。
囚徒困境的題不是這麼出的,一個真話一個撒謊,撒謊的人判的時間很長。
你這題直接就是向著撒謊去的。問題出錯了!聯繫看看博弈論中的囚徒困境!
經濟學裡做實驗可是要有真實激勵的哈哈哈,付錢才能看出真的選擇,否則說了都是白說。
這也不是囚徒困境啊,不過要說的話分類討論看看。
假設囚徒A說真話,B有可能判9年(真)或者2年(假)。
假設囚徒A說假話,B有可能判5年(真)或者無期(假)。
並不存在納什均衡。
這時候感覺只能假設兩囚徒是風險中性的純以期望做判斷。
A說真話,可能被判9年或者5年。
A說假話,可能被判2年或無期。
A會選擇說真話,B也一樣。
推薦閱讀: