如何理解50个人中至少两个人生日相同的概率高达97%？

概率论的经典问题，我能理解推导过程，但是从直观上并不能接受这个结果，想知道有什么好的理解方式？
但是为什么大多数人会对这个概率的感觉发生偏差呢？

大多数人对生日问题的概率感觉发生偏差，并不是因为对这个问题的理解发生错误。本质上是因为我们日常理解的「生日相同问题」，与概率学里的生日问题是不同的，我们的直觉压根理解的就是另外一种问题描述。

概率学中的生日问题是在问n个同学中至少任意两人生日相同的概率。
而我们在生活中对「生日相同问题」的直觉理解其实是这样的：n个同学中，除我之外的人中至少有1个和我生日相同的概率。
我们来算算这种概率。
假设除你之外有n个同学，那么算上你总共有n+1个人。于是
除你之外的人中至少有1个和你生日相同的概率＝1-他们所有人都和你不同的几率＝
我们直观的理解
区别就在这里，因为你是指定的特定人选，所以其他任何一个人和你生日不同的几率都是364/365，都是相同的，连乘即可。
但是如果是概率学里的任意两人生日相同问题，就不是这么算的了，由于没有特定人选，每核算一个人就得排除掉他，结果就变成了这样
真实情况

我们来对比一下这两种结果的函数图像：
p (n) = 任意至少2人生日相同概率；q (n) =至少1个和指定人(你)生日相同的概率
你看是不是一目了然，我们总觉得50个人中任意至少两人生日相同的概率没有那么高，其实是因为我们下意识理解的是「那两个人里一定有我！50个人中至少有1个人和我生日相同的概率」，这个几率当然不高。
综上可以得出这么个结论：大多数人对数学概率的直观认识都是以「我」为中心的。这很哲学。

欢迎精神小伙们入驻圈子！
奇怪的知识岛?
www.zhihu.com
假设都不相同
独立事件：第一个人不相同概率：P1=365/365
独立事件：第二个人需要在剩下的364天里选：P2=（365-1）/365

独立事件：第n个人：Pn=（365-n+1）/365
求所有独立事件发生概率即50个人都不相同: P=P1??P2…??P50=2.963%
那么有人相同概率为：1-P=97.03%
———————
闲聊
首先，相信大多数人直觉上会认为这50名同学生日各不相同的可能性有很多。的确没错，共有3.9??10^126种可能
同时，我们还会感觉这50名同学的生日组合可能性有很多。实际上也对，共有1.3??10^128种可能
但是，在日常生活中，这两个数对于我们来说都太大了。判断起来就是一个「大数」除以另一个「大数」，形成了一种余下的选择很少的错觉。
为什么我们很少主动去主动分析「至少2人相同」情况下的可能性有多少呢？
原因出在「至少」二字上。至少2人相同，意味著可能性中既有1对生日相同的，有2对生日相同的，还有3人日生日相同的，甚至分成好几组…等等，光是分类就非常复杂，何况去估计不同组合后面的具体数值之和。

有一种认知偏差或许可以解释：
可得性偏差（Availability Heuristic）也是一种常见的认知偏差，它是启发式偏差的一种，人们往往会根据自己认知上的易得性来判断事情的可能性，而不是根据统计学数据和系统化的知识来做判断。
不恰当的例子，好比设计彩票的，如果把中奖规则做的既多样又易懂，给大家留下的容易中奖的错觉就越大。

不考虑闰年，随便找50个人，他们的生日有

种可能情况，而如果要求他们的生日两两不同，只有

种可能情况。这样就可以算出50个人生日两两不同的概率为
我们观察这个问题中的计算式

它是个分数连乘，虽然每个分数都比小不了多少，但是根据我们对指数运算的直觉，连乘的结果往往比这些分数小得多。
其实我们可以运用均值不等式得到对概率的一个放大估计

其中的分数化成小数是看上去和差不多，但是它的次方只有
另外我们还有一个经验，当充分小时关于不大的整数成立近似计算

那么约为的次方。然而如果比较大，这么算的误差就很大了，例如

但实际上
对的缩小就是对的放大，即便按照如此程度的放大计算，概率也没有超过那么正常计算得到也就不足为奇了。

这个问题虽然被概率论提出，但本质上依然是指数放大，可见指数放大在直观上是很有威力的，而且它会在各个领域中被体现。

下面本人的回答的目的在于用大学的知识（泊松近似的想法）粗略而相对简单的估计出50这个数字。如果你希望超快的建立直观上的正确感觉，可以移步到这个回答，个人认为还是言简意赅的好回答。
如何理解50个人中至少两个人生日相同的概率高达97%？?
www.zhihu.com
下面是原回答。

粗略的讲，这个50能够很简单的大概估计出来。对于两个人，他们生日相同的概率是多少呢？很好算，就是1/365。是个小概率事件对不对。再选两个人，他们生日相同的概率还是1/365。如果这两组人没有重复的话，第一组生日相同和第二组生日相同还是独立的。现在我们考虑n个人，一共有n(n-1)/2对。每对相同都是小概率事件，而且对与对之间近乎是独立的。现在我们问有多少对生日相同。这个是大量近乎独立的小概率事件的累次发生次数。根据小数定律，这大约就是个泊松分布啊。泊松分布就是大量近乎独立小概率事件的累次发生次数。泊松分布的参数是平均意义下有多少对相同，也就是。没有一对生日相同的概率是多少？根据泊松分布律，这就是。现在令，解得，。

许多人日常对概率的理解是错误的，不够理性的。人们心理上天然地会把发生在身边的事情的概率调高，而没发生在身边的事情概率调低。
因为，人的认知是以「我」为中心的。
不过不要紧，学概率不就是为了更加科学，纯粹地认识这个世界吗。
对于题主所说的生日悖论，其实可以用另一个思路来理解（解答），也许就会豁然开朗了。
为了保证您有解答这个问题的能力，我先问一个问题:
就拿你和我举例吧，你的生日和我的生日不一样的概率是多少？

好简单是吧

嗯，如果你能答出这个答案，那你一定能很容易明白这个问题了。
这个思路就是递归方法。递归方法在我看来是最直观的解决一些复杂问题的思路之一。
而且，它在概率的讨论中，具有极其广泛的应用。如果您是学生，请务必掌握这种方法，许多问题会迎刃而解。

首先我们设想：
有一个房间里，现在只有一个人，小明。
过一会，又进来一个人，小黑，小黑的生日和小明不一样的概率有多大？
很简单是吧——（我们现在仅仅考虑一年365天的情况，366天其实一样的）

我们不妨用一个记号来表示这个概率，这个概率的意思就是，2个人生日不同的概率。
接下来，这个屋子又进来一个人，不给他起名字了，反正你们也不认识。
他和里面两个人生日都不一样的概率是多少？
好简单是吧——
前三个人生日都不同的概率就很好算了吧？：
一个又一个人进来了……
我们很容易知道，如果前个人生日都不同的概率记作
那么，第个人进来，他和前面个人生日都不相同的概率超级简单，就是
所以，第个人进来后，所有这个人生日都不相同的概率就是
那么，现在的问题就是，个人生日都不同的概率是多少。也就是等于多少呢？

我相信每个朋友都能写出来吧：

没错，这个数字恰好等于（请稍微把左边的式子化简一下）
这样一看，是不是最后的结果一点都不突兀了呢~

推荐阅读：

如何理解50个人中至少两个人生日相同的概率高达97%？

热门新闻

周热门

如何理解50个人中至少两个人生日相同的概率高达97%？

泰勒公式那边的题，高阶的无穷小和高阶无穷小作差怎么算？

初等函数之上有无定义「高等函数」？

这个数列极限问题如何解决呢？

研究数学的人看见数字会像看小说一样吗？

学数论有必要提前系统学拓扑学吗？还是学到再补？

数学很差如何才能提高？

两相邻素数的最大间距能够多大？

数学几何体中母线是什么？

如何将一根黄瓜，沿一个方向切片，使得最后平铺的表面积最大，厚度为1mm?

无限和无限个无限在数量上有区别吗？

圆周率pi比较著名的无穷级数公式有哪些？

数学如何应用于音乐中？

你见过什么复杂到让你目瞪口呆的公式？

到底是用实数定义了复数，还是用复数定义了实数？

为什么球的表面积不是π2R2?

热门新闻

周热门