如何理解50個人中至少兩個人生日相同的概率高達97%?
概率論的經典問題,我能理解推導過程,但是從直觀上並不能接受這個結果,想知道有什麼好的理解方式?
但是為什麼大多數人會對這個概率的感覺發生偏差呢?
大多數人對生日問題的概率感覺發生偏差,並不是因為對這個問題的理解發生錯誤。本質上是因為我們日常理解的「生日相同問題」,與概率學裡的生日問題是不同的,我們的直覺壓根理解的就是另外一種問題描述。
概率學中的生日問題是在問n個同學中至少任意兩人生日相同的概率。
而我們在生活中對「生日相同問題」的直覺理解其實是這樣的:n個同學中,除我之外的人中至少有1個和我生日相同的概率。
我們來算算這種概率。
假設除你之外有n個同學,那麼算上你總共有n+1個人。於是
除你之外的人中至少有1個和你生日相同的概率=1-他們所有人都和你不同的幾率=
我們直觀的理解 區別就在這裡,因為你是指定的特定人選,所以其他任何一個人和你生日不同的幾率都是364/365,都是相同的,連乘即可。
但是如果是概率學裡的任意兩人生日相同問題,就不是這麼算的了,由於沒有特定人選,每核算一個人就得排除掉他,結果就變成了這樣
真實情況 我們來對比一下這兩種結果的函數圖像:
p (n) = 任意至少2人生日相同概率;q (n) =至少1個和指定人(你)生日相同的概率 你看是不是一目了然,我們總覺得50個人中任意至少兩人生日相同的概率沒有那麼高,其實是因為我們下意識理解的是「那兩個人里一定有我!50個人中至少有1個人和我生日相同的概率」,這個幾率當然不高。
綜上可以得出這麼個結論:大多數人對數學概率的直觀認識都是以「我」為中心的。這很哲學。
歡迎精神小伙們入駐圈子!
奇怪的知識島?www.zhihu.com假設都不相同
獨立事件:第一個人 不相同概率:P1=365/365
獨立事件:第二個人需要在剩下的364天里選:P2=(365-1)/365
獨立事件:第n個人:Pn=(365-n+1)/365
求所有獨立事件發生概率 即50個人都不相同: P=P1??P2…??P50=2.963%
那麼有人相同概率為:1-P=97.03%
———————
閑聊
首先,相信大多數人直覺上會認為這50名同學生日各不相同的可能性有很多。的確沒錯,共有3.9??10^126種可能
同時,我們還會感覺這50名同學的生日組合可能性有很多。實際上也對,共有1.3??10^128種可能
但是,在日常生活中,這兩個數對於我們來說都太大了。判斷起來就是一個「大數」除以另一個「大數」,形成了一種餘下的選擇很少的錯覺。
為什麼我們很少主動去主動分析「至少2人相同」情況下的可能性有多少呢?
原因出在「至少」二字上。至少2人相同,意味著可能性中既有1對生日相同的,有2對生日相同的,還有3人日生日相同的,甚至分成好幾組…等等,光是分類就非常複雜,何況去估計不同組合後面的具體數值之和。
有一種認知偏差或許可以解釋:
可得性偏差(Availability Heuristic)也是一種常見的認知偏差,它是啟發式偏差的一種,人們往往會根據自己認知上的易得性來判斷事情的可能性,而不是根據統計學數據和系統化的知識來做判斷。
不恰當的例子,好比設計彩票的,如果把中獎規則做的既多樣又易懂,給大家留下的容易中獎的錯覺就越大。
不考慮閏年,隨便找50個人,他們的生日有
種可能情況,而如果要求他們的生日兩兩不同,只有
種可能情況。這樣就可以算出50個人生日兩兩不同的概率 為
我們觀察這個問題中的計算式
它是 個分數連乘,雖然每個分數都比 小不了多少,但是根據我們對指數運算的直覺,連乘的結果往往比這些分數小得多。
其實我們可以運用均值不等式得到對概率 的一個放大估計
其中的分數化成小數是 看上去和 差不多,但是它的 次方只有
另外我們還有一個經驗,當 充分小時關於不大的整數 成立近似計算
那麼 約為 的 次方。然而如果 比較大,這麼算的誤差就很大了,例如
但實際上
對 的縮小就是對 的放大,即便按照如此程度的放大計算,概率 也沒有超過 那麼正常計算得到 也就不足為奇了。
這個問題雖然被概率論提出,但本質上依然是指數放大,可見指數放大在直觀上是很有威力的,而且它會在各個領域中被體現。
下面本人的回答的目的在於用大學的知識(泊松近似的想法)粗略而相對簡單的估計出50這個數字。如果你希望超快的建立直觀上的正確感覺,可以移步到這個回答,個人認為還是言簡意賅的好回答。
如何理解50個人中至少兩個人生日相同的概率高達97%??www.zhihu.com下面是原回答。
粗略的講,這個50能夠很簡單的大概估計出來。對於兩個人,他們生日相同的概率是多少呢?很好算,就是1/365。是個小概率事件對不對。再選兩個人,他們生日相同的概率還是1/365。如果這兩組人沒有重複的話,第一組生日相同和第二組生日相同還是獨立的。現在我們考慮n個人,一共有n(n-1)/2對。每對相同都是小概率事件,而且對與對之間近乎是獨立的。現在我們問有多少對生日相同。這個是大量近乎獨立的小概率事件的累次發生次數。根據小數定律,這大約就是個泊松分布啊。泊松分布就是大量近乎獨立小概率事件的累次發生次數。泊松分布的參數 是平均意義下有多少對相同,也就是 。沒有一對生日相同的概率是多少?根據泊松分布律,這就是 。現在令 ,解得 , 。
許多人日常對概率的理解是錯誤的,不夠理性的。人們心理上天然地會把發生在身邊的事情的概率調高,而沒發生在身邊的事情概率調低。
因為,人的認知是以「我」為中心的。
不過不要緊,學概率不就是為了更加科學,純粹地認識這個世界嗎。
對於題主所說的生日悖論,其實可以用另一個思路來理解(解答),也許就會豁然開朗了。
為了保證您有解答這個問題的能力,我先問一個問題:
就拿你和我舉例吧,你的生日和我的生日不一樣的概率是多少?
好簡單是吧
嗯,如果你能答出這個答案,那你一定能很容易明白這個問題了。
這個思路就是遞歸方法。遞歸方法在我看來是最直觀的解決一些複雜問題的思路之一。
而且,它在概率的討論中,具有極其廣泛的應用。如果您是學生,請務必掌握這種方法,許多問題會迎刃而解。
首先我們設想:
有一個房間里,現在只有一個人,小明。
過一會,又進來一個人,小黑,小黑的生日和小明不一樣的概率有多大?
很簡單是吧——(我們現在僅僅考慮一年365天的情況,366天其實一樣的)
我們不妨用一個記號 來表示這個概率,這個概率的意思就是,2個人生日不同的概率。
接下來,這個屋子又進來一個人,不給他起名字了,反正你們也不認識。
他和裡面兩個人生日都不一樣的概率是多少?
好簡單是吧——
前三個人生日都不同的概率就很好算了吧?:
一個又一個人進來了……
我們很容易知道,如果前 個人生日都不同的概率記作
那麼,第 個人進來,他和前面 個人生日都不相同的概率超級簡單,就是
所以,第 個人進來後,所有這 個人生日都不相同的概率就是
那麼,現在的問題就是, 個人生日都不同的概率是多少。也就是 等於多少呢?
我相信每個朋友都能寫出來吧:
沒錯,這個數字恰好等於 (請稍微把左邊的式子化簡一下)
這樣一看,是不是最後的結果一點都不突兀了呢~
推薦閱讀: