有两个人抢银行,被抓到了。两个人分开审问,如果两个人同时说真话,那就没有价值,都被判九年。如果其中一个人说了真话,另一个人说了假话,那么真话的人被判两年,假话的人被判五年。如果两个人都说了假话,那么将没有机会出来。如果是你,会怎么选择?


实验本身需要具有合理性,你觉得这个实验合理吗?宝贝


目录

Assumptions

Set-up

Strategic Form

Pure Strategy Nash Equilibrium

Mixed Strategy Nash Equilibrium

Repeated Game

不认真审题啊都!别管错没错,既然出了就按照这个set up来看呗!

大家都说是囚徒困境……这其实明明是Battle of Sex嘛!!正好来复习一下。纯属娱乐,勿喷!

先码一下再追更!


Assumptions

题目给的条件很笼统,为了严谨一点,我们做一些简单的假设。

【Assumption 1】假设每个人的payoff和所盼年数是完全负相关的。这个条件很重要,因为万一两个人中有人觉得……

进了里面个个都是人才,说话又好听,超喜欢在里面。

也就是说,每个人的felicity function为

[公式]

  • [公式] 表示所判年限。

这样的felicity function是否合理值得讨论,后面如果我还有兴趣的话可以试试放宽这个条件。

【Assumption 2】假说两个人还可以活50年。题目里还有个条件不是很明确:

如果两个人都说了假话,那么将没有机会出来。

如果我没理解错的话,楼主指的是无期。人的预期寿命是有限的,因此我认为假设这时候的payoff为 [公式] 并不是十分合理。如果说人的预期寿命是70岁,两人抢银行时是20岁(年轻气盛hh),那么两人预期还可以活50年这个假设还可以接受。也就是说,当两个人都说假话时,payoff是 [公式]

当然这个assumption也可以放宽,但是为了简单还是先用著。


Set-up

博弈里的三个元素:

  • Players[公式] (假设把两个人编号成1和2)
  • Strategies:每个人都有两个策略。说真话(Truth)写作 [公式] ,说假话(Lie)写作 [公式] 。策略集合用 [公式] 表示, [公式] 是player编码。

[公式]

  • Payoffs:我们用小写的 [公式] 表示player [公式] 的纯策略, [公式] 。此外,为了表达payoff function,我们用 [公式] 来表示player [公式] 在给定对手策略的情况下选择 [公式] 的收益。

[公式]

[公式]


Strategic Form

1 2 真话(T) 假话(L)
真话(T) -9,-9 -2,-5
假话(L) -5,-2 -50,-50

Pure Strategy Nash Equilibrium

知乎表格竟然不能划线加粗……那我写一下。

先定义一下best response:best response 是在给定对手策略的情况下可以让player获得最高payoff的策略,表示成一个关于 [公式] 的函数:

[公式]

如果有一个策略组合,在给定对手策略的情况下两个人都是Best response,那么那个策略组合就是Nash equilibrium(NE)。

  • 当player 2选 [公式] 时, [公式]
  • 当player 2选 [公式] 时, [公式]
  • 当player 1选 [公式] 时, [公式]
  • 当player 1选 [公式] 时, [公式]

所以有两个NE: [公式]


Mixed Strategy Nash Equilibrium

现在允许玩家在一定概率下选择策略(mixed strategy)。

假设player [公式] 选择 [公式] 的概率是 [公式]

  • 给定 [公式] ,player 2选择 [公式] 的预期收益为

[公式]

  • 给定 [公式] ,player 2选择 [公式] 的预期收益为

[公式]

如果player 1选择 [公式] ,则说明 [公式]

[公式]

[公式]

同理, [公式]

所以mixed strategy NE是 [公式] 。此策略下,两个人的payoff是 [公式] ,仅仅比 [公式] 稍微强一点,因为 [公式] 这个策略太差了……即使只有一点点可能性,也会降低预期收益很多,这导致混合策略向 [公式] 策略倾斜很多。

Repeated Game

如果允许重复博弈的话呢?

好像因为有个 [公式] 重复博弈奇奇怪怪的……那我们假设他们子承父业吧!儿子的选择会受到父亲之前选择结果的影响,但这个影响随著时间会减弱:爷爷辈的选择相比爸爸辈的选择影响更小。假设这个discount factor是 [公式]

我们之前提到mixed strategy NE 的payoff是比 pure strategy NE要更差的。

我们可以把几个策略画在图上:

其中,橙色的两个点是(-9, -9)和(-110/13,-110/13)。

我们放大左上角,根据 Nash Threat Folk Theorem,整个橙色区域(没标点的位置,你们大概体会一下)里的payoff组合在infinite repeated game下都存在相应的 [公式] 使其成为subgame perfect equilibrium。

懒惰了……之后佛系再更。


囚徒困境的题不是这么出的,一个真话一个撒谎,撒谎的人判的时间很长。

你这题直接就是向著撒谎去的。问题出错了!联系看看博弈论中的囚徒困境!


经济学里做实验可是要有真实激励的哈哈哈,付钱才能看出真的选择,否则说了都是白说。


这也不是囚徒困境啊,不过要说的话分类讨论看看。

假设囚徒A说真话,B有可能判9年(真)或者2年(假)。

假设囚徒A说假话,B有可能判5年(真)或者无期(假)。

并不存在纳什均衡。

这时候感觉只能假设两囚徒是风险中性的纯以期望做判断。

A说真话,可能被判9年或者5年。

A说假话,可能被判2年或无期。

A会选择说真话,B也一样。


推荐阅读:
相关文章