概率论的经典问题,我能理解推导过程,但是从直观上并不能接受这个结果,想知道有什么好的理解方式?

但是为什么大多数人会对这个概率的感觉发生偏差呢?

大多数人对生日问题的概率感觉发生偏差,并不是因为对这个问题的理解发生错误。本质上是因为我们日常理解的「生日相同问题」,与概率学里的生日问题是不同的,我们的直觉压根理解的就是另外一种问题描述。


概率学中的生日问题是在问n个同学中至少任意两人生日相同的概率。

而我们在生活中对「生日相同问题」的直觉理解其实是这样的:n个同学中,除我之外的人中至少有1个和生日相同的概率。

我们来算算这种概率。

假设除你之外有n个同学,那么算上你总共有n+1个人。于是

除你之外的人中至少有1个和你生日相同的概率=1-他们所有人都和不同的几率=

我们直观的理解

区别就在这里,因为你是指定的特定人选,所以其他任何一个人和你生日不同的几率都是364/365,都是相同的,连乘即可。

但是如果是概率学里的任意两人生日相同问题,就不是这么算的了,由于没有特定人选,每核算一个人就得排除掉他,结果就变成了这样

真实情况

我们来对比一下这两种结果的函数图像:

p (n) = 任意至少2人生日相同概率;q (n) =至少1个和指定人(你)生日相同的概率

你看是不是一目了然,我们总觉得50个人中任意至少两人生日相同的概率没有那么高,其实是因为我们下意识理解的是「那两个人里一定有我!50个人中至少有1个人和我生日相同的概率」,这个几率当然不高。

综上可以得出这么个结论:大多数人对数学概率的直观认识都是以「我」为中心的。这很哲学。


欢迎精神小伙们入驻圈子!

奇怪的知识岛?

www.zhihu.com图标

假设都不相同

独立事件:第一个人 不相同概率:P1=365/365

独立事件:第二个人需要在剩下的364天里选:P2=(365-1)/365

独立事件:第n个人:Pn=(365-n+1)/365

求所有独立事件发生概率 即50个人都不相同: P=P1??P2…??P50=2.963%

那么有人相同概率为:1-P=97.03%

———————

闲聊

首先,相信大多数人直觉上会认为这50名同学生日各不相同的可能性有很多。的确没错,共有3.9??10^126种可能

同时,我们还会感觉这50名同学的生日组合可能性有很多。实际上也对,共有1.3??10^128种可能

但是,在日常生活中,这两个数对于我们来说都太大了。判断起来就是一个「大数」除以另一个「大数」,形成了一种余下的选择很少的错觉。

为什么我们很少主动去主动分析「至少2人相同」情况下的可能性有多少呢?

原因出在「至少」二字上。至少2人相同,意味著可能性中既有1对生日相同的,有2对生日相同的,还有3人日生日相同的,甚至分成好几组…等等,光是分类就非常复杂,何况去估计不同组合后面的具体数值之和。

有一种认知偏差或许可以解释:

可得性偏差(Availability Heuristic)也是一种常见的认知偏差,它是启发式偏差的一种,人们往往会根据自己认知上的易得性来判断事情的可能性,而不是根据统计学数据和系统化的知识来做判断。

不恰当的例子,好比设计彩票的,如果把中奖规则做的既多样又易懂,给大家留下的容易中奖的错觉就越大。


不考虑闰年,随便找50个人,他们的生日有

[公式]

种可能情况,而如果要求他们的生日两两不同,只有

[公式]

种可能情况。这样就可以算出50个人生日两两不同的概率 [公式][公式]

我们观察这个问题中的计算式

[公式]

它是 [公式] 个分数连乘,虽然每个分数都比 [公式] 小不了多少,但是根据我们对指数运算的直觉,连乘的结果往往比这些分数小得多。

其实我们可以运用均值不等式得到对概率 [公式] 的一个放大估计

[公式]

其中的分数化成小数是 [公式] 看上去和 [公式] 差不多,但是它的 [公式] 次方只有 [公式]

另外我们还有一个经验,当 [公式] 充分小时关于不大的整数 [公式] 成立近似计算

[公式]

那么 [公式] 约为 [公式][公式] 次方。然而如果 [公式] 比较大,这么算的误差就很大了,例如

[公式]

但实际上 [公式]

[公式] 的缩小就是对 [公式] 的放大,即便按照如此程度的放大计算,概率 [公式] 也没有超过 [公式] 那么正常计算得到 [公式] 也就不足为奇了。

这个问题虽然被概率论提出,但本质上依然是指数放大,可见指数放大在直观上是很有威力的,而且它会在各个领域中被体现。


下面本人的回答的目的在于用大学的知识(泊松近似的想法)粗略而相对简单的估计出50这个数字。如果你希望超快的建立直观上的正确感觉,可以移步到这个回答,个人认为还是言简意赅的好回答。

如何理解50个人中至少两个人生日相同的概率高达97%??

www.zhihu.com图标

下面是原回答。


粗略的讲,这个50能够很简单的大概估计出来。对于两个人,他们生日相同的概率是多少呢?很好算,就是1/365。是个小概率事件对不对。再选两个人,他们生日相同的概率还是1/365。如果这两组人没有重复的话,第一组生日相同和第二组生日相同还是独立的。现在我们考虑n个人,一共有n(n-1)/2对。每对相同都是小概率事件,而且对与对之间近乎是独立的。现在我们问有多少对生日相同。这个是大量近乎独立的小概率事件的累次发生次数。根据小数定律,这大约就是个泊松分布啊。泊松分布就是大量近乎独立小概率事件的累次发生次数。泊松分布的参数 [公式] 是平均意义下有多少对相同,也就是 [公式] 。没有一对生日相同的概率是多少?根据泊松分布律,这就是 [公式] 。现在令 [公式] ,解得 [公式][公式]


许多人日常对概率的理解是错误的,不够理性的。人们心理上天然地会把发生在身边的事情的概率调高,而没发生在身边的事情概率调低

因为,人的认知是以「我」为中心的

不过不要紧,学概率不就是为了更加科学,纯粹地认识这个世界吗。

对于题主所说的生日悖论,其实可以用另一个思路来理解(解答),也许就会豁然开朗了

为了保证您有解答这个问题的能力,我先问一个问题:

就拿你和我举例吧,你的生日和我的生日不一样的概率是多少?

好简单是吧

[公式]

嗯,如果你能答出这个答案,那你一定能很容易明白这个问题了。

这个思路就是递归方法。递归方法在我看来是最直观的解决一些复杂问题的思路之一。

而且,它在概率的讨论中,具有极其广泛的应用。如果您是学生,请务必掌握这种方法,许多问题会迎刃而解。


首先我们设想:

有一个房间里,现在只有一个人,小明。

过一会,又进来一个人,小黑,小黑的生日和小明不一样的概率有多大?

很简单是吧——(我们现在仅仅考虑一年365天的情况,366天其实一样的)

[公式]

我们不妨用一个记号 [公式] 来表示这个概率,这个概率的意思就是,2个人生日不同的概率。

接下来,这个屋子又进来一个人,不给他起名字了,反正你们也不认识。

他和里面两个人生日都不一样的概率是多少?

好简单是吧—— [公式]

前三个人生日都不同的概率就很好算了吧?: [公式]

一个又一个人进来了……

我们很容易知道,如果前 [公式] 个人生日都不同的概率记作 [公式]

那么,第 [公式] 个人进来,他和前面 [公式] 个人生日都不相同的概率超级简单,就是 [公式]

所以,第 [公式] 个人进来后,所有这 [公式] 个人生日都不相同的概率就是 [公式]

那么,现在的问题就是, [公式] 个人生日都不同的概率是多少。也就是 [公式] 等于多少呢?

我相信每个朋友都能写出来吧:

[公式]

没错,这个数字恰好等于 [公式] (请稍微把左边的式子化简一下)

这样一看,是不是最后的结果一点都不突兀了呢~


推荐阅读:
相关文章