數(shù)據(jù)分析誤區(qū)系列(四):生日悖論

0 評論 301 瀏覽 1 收藏 5 分鐘

一個23人以上的群體,就有50%的可能有至少兩個人同一天生日。這個生日悖論,是我們在數(shù)據(jù)分析中常常忽略的誤區(qū)。這篇文章,我們看看作者的分析。

公司運(yùn)營團(tuán)隊精心構(gòu)想了一個年終大促活動,通過完成特定任務(wù)獲得財神卡片。玩家只需集齊五路財神方可兌換精美禮品??ㄆ歇劯怕史謩e為0.1、0.1、0.15、0.15、0.5。這下內(nèi)側(cè)同學(xué)鬧騰了,有人認(rèn)為玩家大概需要嘗試10次就可以拿齊所有卡片,也有人斷言至少需要100次方可達(dá)成此目標(biāo),還為此爭執(zhí)的不可開交。

當(dāng)然這種概率問題有個比較好的一種解決方案叫蒙特卡洛算法。不過這里我們先不討論解決方案(感興趣的同學(xué)可以翻看以前的文章,有篇專門講基于蒙特卡洛測算概率的)。

在概率學(xué)上我們把前面提到類似集齊財神需要10次還是100次,這種根據(jù)自身直覺做出的非理性判斷,稱為“生日悖論”。

如果我告訴你在一個人群中只需要23人,就有50%的可能性其中至少兩個人共享同一天生日,你會不會感到驚訝?這就是所謂的”生日悖論”,一個人們常常忽視的數(shù)據(jù)分析中的誤區(qū)。

許多人第一次聽說生日悖論時,往往會感到非常驚訝。 因?yàn)橹庇X上我們會認(rèn)為365天的日歷年里,需要至少183人(即365的一半)才能使至少兩人生日相同的概率達(dá)到50%。這種直覺反應(yīng)實(shí)際上揭示了我們在處理相關(guān)性數(shù)據(jù)分析時的一個突出誤區(qū)。

這個誤區(qū)的產(chǎn)生源自于我們對問題的理解方式。實(shí)際上,這個問題并不是在問:“在23個人中,有多大的可能性有人和你生日相同?”而是在問:“在23個人中,有多大的可能性有任何兩個人生日相同?”這里的區(qū)別十分微妙,但卻有著巨大的影響。

原因在于,我們并不是在找一個特定日期(例如你的生日),而是在找任何可能的配對,這大大增加了找到匹配生日的機(jī)會。在23個人的情況下,實(shí)際上有253種可能的配對方式。

數(shù)學(xué)家通過以下公式計算出生日悖論的每個概率:

P = 1 – [(365/365) * (364/365) * (363/365) * … * ((365-n+1)/365)]

其中 n 是群體中的人數(shù)。使用這個公式,我們可以發(fā)現(xiàn)只需要23人,就有50%的可能性至少兩個人生日相同。到達(dá)60人時,這個可能性已經(jīng)超過99%。

生日悖論揭示的數(shù)據(jù)分析的誤區(qū)它提醒我們:從集體而非個體角度看問題,可以大大改變我們的看法。在處理數(shù)據(jù)和概率時,我們需對直覺的可靠性保持警惕,正確地理解問題所需的條件和組成。

我們應(yīng)從生日悖論中吸取的教訓(xùn),即提醒我們在數(shù)據(jù)分析時不僅要關(guān)注直覺,更應(yīng)注意實(shí)證的、數(shù)理的分析方法。我們在處理復(fù)雜的概率問題時,通常需要深入理解問題的本質(zhì)。只有通過準(zhǔn)確而深思熟慮的分析,我們才能做出最佳決策。

本文由 @佑佑和博博~ 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!