概率論的經典問題,我能理解推導過程,但是從直觀上並不能接受這個結果,想知道有什麼好的理解方式?

但是為什麼大多數人會對這個概率的感覺發生偏差呢?

大多數人對生日問題的概率感覺發生偏差,並不是因為對這個問題的理解發生錯誤。本質上是因為我們日常理解的「生日相同問題」,與概率學裡的生日問題是不同的,我們的直覺壓根理解的就是另外一種問題描述。


概率學中的生日問題是在問n個同學中至少任意兩人生日相同的概率。

而我們在生活中對「生日相同問題」的直覺理解其實是這樣的:n個同學中,除我之外的人中至少有1個和生日相同的概率。

我們來算算這種概率。

假設除你之外有n個同學,那麼算上你總共有n+1個人。於是

除你之外的人中至少有1個和你生日相同的概率=1-他們所有人都和不同的幾率=

我們直觀的理解

區別就在這裡,因為你是指定的特定人選,所以其他任何一個人和你生日不同的幾率都是364/365,都是相同的,連乘即可。

但是如果是概率學裡的任意兩人生日相同問題,就不是這麼算的了,由於沒有特定人選,每核算一個人就得排除掉他,結果就變成了這樣

真實情況

我們來對比一下這兩種結果的函數圖像:

p (n) = 任意至少2人生日相同概率;q (n) =至少1個和指定人(你)生日相同的概率

你看是不是一目了然,我們總覺得50個人中任意至少兩人生日相同的概率沒有那麼高,其實是因為我們下意識理解的是「那兩個人里一定有我!50個人中至少有1個人和我生日相同的概率」,這個幾率當然不高。

綜上可以得出這麼個結論:大多數人對數學概率的直觀認識都是以「我」為中心的。這很哲學。


歡迎精神小伙們入駐圈子!

奇怪的知識島?

www.zhihu.com圖標

假設都不相同

獨立事件:第一個人 不相同概率:P1=365/365

獨立事件:第二個人需要在剩下的364天里選:P2=(365-1)/365

獨立事件:第n個人:Pn=(365-n+1)/365

求所有獨立事件發生概率 即50個人都不相同: P=P1??P2…??P50=2.963%

那麼有人相同概率為:1-P=97.03%

———————

閑聊

首先,相信大多數人直覺上會認為這50名同學生日各不相同的可能性有很多。的確沒錯,共有3.9??10^126種可能

同時,我們還會感覺這50名同學的生日組合可能性有很多。實際上也對,共有1.3??10^128種可能

但是,在日常生活中,這兩個數對於我們來說都太大了。判斷起來就是一個「大數」除以另一個「大數」,形成了一種餘下的選擇很少的錯覺。

為什麼我們很少主動去主動分析「至少2人相同」情況下的可能性有多少呢?

原因出在「至少」二字上。至少2人相同,意味著可能性中既有1對生日相同的,有2對生日相同的,還有3人日生日相同的,甚至分成好幾組…等等,光是分類就非常複雜,何況去估計不同組合後面的具體數值之和。

有一種認知偏差或許可以解釋:

可得性偏差(Availability Heuristic)也是一種常見的認知偏差,它是啟發式偏差的一種,人們往往會根據自己認知上的易得性來判斷事情的可能性,而不是根據統計學數據和系統化的知識來做判斷。

不恰當的例子,好比設計彩票的,如果把中獎規則做的既多樣又易懂,給大家留下的容易中獎的錯覺就越大。


不考慮閏年,隨便找50個人,他們的生日有

[公式]

種可能情況,而如果要求他們的生日兩兩不同,只有

[公式]

種可能情況。這樣就可以算出50個人生日兩兩不同的概率 [公式][公式]

我們觀察這個問題中的計算式

[公式]

它是 [公式] 個分數連乘,雖然每個分數都比 [公式] 小不了多少,但是根據我們對指數運算的直覺,連乘的結果往往比這些分數小得多。

其實我們可以運用均值不等式得到對概率 [公式] 的一個放大估計

[公式]

其中的分數化成小數是 [公式] 看上去和 [公式] 差不多,但是它的 [公式] 次方只有 [公式]

另外我們還有一個經驗,當 [公式] 充分小時關於不大的整數 [公式] 成立近似計算

[公式]

那麼 [公式] 約為 [公式][公式] 次方。然而如果 [公式] 比較大,這麼算的誤差就很大了,例如

[公式]

但實際上 [公式]

[公式] 的縮小就是對 [公式] 的放大,即便按照如此程度的放大計算,概率 [公式] 也沒有超過 [公式] 那麼正常計算得到 [公式] 也就不足為奇了。

這個問題雖然被概率論提出,但本質上依然是指數放大,可見指數放大在直觀上是很有威力的,而且它會在各個領域中被體現。


下面本人的回答的目的在於用大學的知識(泊松近似的想法)粗略而相對簡單的估計出50這個數字。如果你希望超快的建立直觀上的正確感覺,可以移步到這個回答,個人認為還是言簡意賅的好回答。

如何理解50個人中至少兩個人生日相同的概率高達97%??

www.zhihu.com圖標

下面是原回答。


粗略的講,這個50能夠很簡單的大概估計出來。對於兩個人,他們生日相同的概率是多少呢?很好算,就是1/365。是個小概率事件對不對。再選兩個人,他們生日相同的概率還是1/365。如果這兩組人沒有重複的話,第一組生日相同和第二組生日相同還是獨立的。現在我們考慮n個人,一共有n(n-1)/2對。每對相同都是小概率事件,而且對與對之間近乎是獨立的。現在我們問有多少對生日相同。這個是大量近乎獨立的小概率事件的累次發生次數。根據小數定律,這大約就是個泊松分布啊。泊松分布就是大量近乎獨立小概率事件的累次發生次數。泊松分布的參數 [公式] 是平均意義下有多少對相同,也就是 [公式] 。沒有一對生日相同的概率是多少?根據泊松分布律,這就是 [公式] 。現在令 [公式] ,解得 [公式][公式]


許多人日常對概率的理解是錯誤的,不夠理性的。人們心理上天然地會把發生在身邊的事情的概率調高,而沒發生在身邊的事情概率調低

因為,人的認知是以「我」為中心的

不過不要緊,學概率不就是為了更加科學,純粹地認識這個世界嗎。

對於題主所說的生日悖論,其實可以用另一個思路來理解(解答),也許就會豁然開朗了

為了保證您有解答這個問題的能力,我先問一個問題:

就拿你和我舉例吧,你的生日和我的生日不一樣的概率是多少?

好簡單是吧

[公式]

嗯,如果你能答出這個答案,那你一定能很容易明白這個問題了。

這個思路就是遞歸方法。遞歸方法在我看來是最直觀的解決一些複雜問題的思路之一。

而且,它在概率的討論中,具有極其廣泛的應用。如果您是學生,請務必掌握這種方法,許多問題會迎刃而解。


首先我們設想:

有一個房間里,現在只有一個人,小明。

過一會,又進來一個人,小黑,小黑的生日和小明不一樣的概率有多大?

很簡單是吧——(我們現在僅僅考慮一年365天的情況,366天其實一樣的)

[公式]

我們不妨用一個記號 [公式] 來表示這個概率,這個概率的意思就是,2個人生日不同的概率。

接下來,這個屋子又進來一個人,不給他起名字了,反正你們也不認識。

他和裡面兩個人生日都不一樣的概率是多少?

好簡單是吧—— [公式]

前三個人生日都不同的概率就很好算了吧?: [公式]

一個又一個人進來了……

我們很容易知道,如果前 [公式] 個人生日都不同的概率記作 [公式]

那麼,第 [公式] 個人進來,他和前面 [公式] 個人生日都不相同的概率超級簡單,就是 [公式]

所以,第 [公式] 個人進來後,所有這 [公式] 個人生日都不相同的概率就是 [公式]

那麼,現在的問題就是, [公式] 個人生日都不同的概率是多少。也就是 [公式] 等於多少呢?

我相信每個朋友都能寫出來吧:

[公式]

沒錯,這個數字恰好等於 [公式] (請稍微把左邊的式子化簡一下)

這樣一看,是不是最後的結果一點都不突兀了呢~


推薦閱讀:
相关文章