如何理解50个人中至少两个人生日相同的概率高达97%?
概率论的经典问题,我能理解推导过程,但是从直观上并不能接受这个结果,想知道有什么好的理解方式?
但是为什么大多数人会对这个概率的感觉发生偏差呢?
大多数人对生日问题的概率感觉发生偏差,并不是因为对这个问题的理解发生错误。本质上是因为我们日常理解的「生日相同问题」,与概率学里的生日问题是不同的,我们的直觉压根理解的就是另外一种问题描述。
概率学中的生日问题是在问n个同学中至少任意两人生日相同的概率。
而我们在生活中对「生日相同问题」的直觉理解其实是这样的:n个同学中,除我之外的人中至少有1个和我生日相同的概率。
我们来算算这种概率。
假设除你之外有n个同学,那么算上你总共有n+1个人。于是
除你之外的人中至少有1个和你生日相同的概率=1-他们所有人都和你不同的几率=
我们直观的理解 区别就在这里,因为你是指定的特定人选,所以其他任何一个人和你生日不同的几率都是364/365,都是相同的,连乘即可。
但是如果是概率学里的任意两人生日相同问题,就不是这么算的了,由于没有特定人选,每核算一个人就得排除掉他,结果就变成了这样
真实情况 我们来对比一下这两种结果的函数图像:
p (n) = 任意至少2人生日相同概率;q (n) =至少1个和指定人(你)生日相同的概率 你看是不是一目了然,我们总觉得50个人中任意至少两人生日相同的概率没有那么高,其实是因为我们下意识理解的是「那两个人里一定有我!50个人中至少有1个人和我生日相同的概率」,这个几率当然不高。
综上可以得出这么个结论:大多数人对数学概率的直观认识都是以「我」为中心的。这很哲学。
欢迎精神小伙们入驻圈子!
奇怪的知识岛?www.zhihu.com假设都不相同
独立事件:第一个人 不相同概率:P1=365/365
独立事件:第二个人需要在剩下的364天里选:P2=(365-1)/365
独立事件:第n个人:Pn=(365-n+1)/365
求所有独立事件发生概率 即50个人都不相同: P=P1??P2…??P50=2.963%
那么有人相同概率为:1-P=97.03%
———————
闲聊
首先,相信大多数人直觉上会认为这50名同学生日各不相同的可能性有很多。的确没错,共有3.9??10^126种可能
同时,我们还会感觉这50名同学的生日组合可能性有很多。实际上也对,共有1.3??10^128种可能
但是,在日常生活中,这两个数对于我们来说都太大了。判断起来就是一个「大数」除以另一个「大数」,形成了一种余下的选择很少的错觉。
为什么我们很少主动去主动分析「至少2人相同」情况下的可能性有多少呢?
原因出在「至少」二字上。至少2人相同,意味著可能性中既有1对生日相同的,有2对生日相同的,还有3人日生日相同的,甚至分成好几组…等等,光是分类就非常复杂,何况去估计不同组合后面的具体数值之和。
有一种认知偏差或许可以解释:
可得性偏差(Availability Heuristic)也是一种常见的认知偏差,它是启发式偏差的一种,人们往往会根据自己认知上的易得性来判断事情的可能性,而不是根据统计学数据和系统化的知识来做判断。
不恰当的例子,好比设计彩票的,如果把中奖规则做的既多样又易懂,给大家留下的容易中奖的错觉就越大。
不考虑闰年,随便找50个人,他们的生日有
种可能情况,而如果要求他们的生日两两不同,只有
种可能情况。这样就可以算出50个人生日两两不同的概率 为
我们观察这个问题中的计算式
它是 个分数连乘,虽然每个分数都比 小不了多少,但是根据我们对指数运算的直觉,连乘的结果往往比这些分数小得多。
其实我们可以运用均值不等式得到对概率 的一个放大估计
其中的分数化成小数是 看上去和 差不多,但是它的 次方只有
另外我们还有一个经验,当 充分小时关于不大的整数 成立近似计算
那么 约为 的 次方。然而如果 比较大,这么算的误差就很大了,例如
但实际上
对 的缩小就是对 的放大,即便按照如此程度的放大计算,概率 也没有超过 那么正常计算得到 也就不足为奇了。
这个问题虽然被概率论提出,但本质上依然是指数放大,可见指数放大在直观上是很有威力的,而且它会在各个领域中被体现。
下面本人的回答的目的在于用大学的知识(泊松近似的想法)粗略而相对简单的估计出50这个数字。如果你希望超快的建立直观上的正确感觉,可以移步到这个回答,个人认为还是言简意赅的好回答。
如何理解50个人中至少两个人生日相同的概率高达97%??www.zhihu.com下面是原回答。
粗略的讲,这个50能够很简单的大概估计出来。对于两个人,他们生日相同的概率是多少呢?很好算,就是1/365。是个小概率事件对不对。再选两个人,他们生日相同的概率还是1/365。如果这两组人没有重复的话,第一组生日相同和第二组生日相同还是独立的。现在我们考虑n个人,一共有n(n-1)/2对。每对相同都是小概率事件,而且对与对之间近乎是独立的。现在我们问有多少对生日相同。这个是大量近乎独立的小概率事件的累次发生次数。根据小数定律,这大约就是个泊松分布啊。泊松分布就是大量近乎独立小概率事件的累次发生次数。泊松分布的参数 是平均意义下有多少对相同,也就是 。没有一对生日相同的概率是多少?根据泊松分布律,这就是 。现在令 ,解得 , 。
许多人日常对概率的理解是错误的,不够理性的。人们心理上天然地会把发生在身边的事情的概率调高,而没发生在身边的事情概率调低。
因为,人的认知是以「我」为中心的。
不过不要紧,学概率不就是为了更加科学,纯粹地认识这个世界吗。
对于题主所说的生日悖论,其实可以用另一个思路来理解(解答),也许就会豁然开朗了。
为了保证您有解答这个问题的能力,我先问一个问题:
就拿你和我举例吧,你的生日和我的生日不一样的概率是多少?
好简单是吧
嗯,如果你能答出这个答案,那你一定能很容易明白这个问题了。
这个思路就是递归方法。递归方法在我看来是最直观的解决一些复杂问题的思路之一。
而且,它在概率的讨论中,具有极其广泛的应用。如果您是学生,请务必掌握这种方法,许多问题会迎刃而解。
首先我们设想:
有一个房间里,现在只有一个人,小明。
过一会,又进来一个人,小黑,小黑的生日和小明不一样的概率有多大?
很简单是吧——(我们现在仅仅考虑一年365天的情况,366天其实一样的)
我们不妨用一个记号 来表示这个概率,这个概率的意思就是,2个人生日不同的概率。
接下来,这个屋子又进来一个人,不给他起名字了,反正你们也不认识。
他和里面两个人生日都不一样的概率是多少?
好简单是吧——
前三个人生日都不同的概率就很好算了吧?:
一个又一个人进来了……
我们很容易知道,如果前 个人生日都不同的概率记作
那么,第 个人进来,他和前面 个人生日都不相同的概率超级简单,就是
所以,第 个人进来后,所有这 个人生日都不相同的概率就是
那么,现在的问题就是, 个人生日都不同的概率是多少。也就是 等于多少呢?
我相信每个朋友都能写出来吧:
没错,这个数字恰好等于 (请稍微把左边的式子化简一下)
这样一看,是不是最后的结果一点都不突兀了呢~
推荐阅读: