1761年,英國哲學家、統計數學家貝葉斯在彌留之際,將傾注了自己畢生心血的研究手稿交給了家人,並再三囑託:一定要在其死後才能發表!為什麼要等到死後才能發表?因為他知道,這項研究成果一經發表,必將驚起數學界的軒然大波,遭到古典機率流派的猛烈抨擊和批判!家人們謹遵囑託,足足推遲了三年之久才將這一理論公佈於世!
只是,貝葉斯先生僅猜到了事情的開頭---一定會遭到抨擊和批判,卻沒有料到這場抨擊竟然持續了近百年,更是沒有猜到最後的結局——反轉的結局——他的貝葉斯公式竟成為AI的核心機率方法!
托馬斯.貝葉斯
貝葉斯公式(理論)到底是什麼驚天理論?為了讓讀者能快速理解這一數字知識,筆者先從他為什麼遭受抨擊和批判的原因講起。一般情況下,古典機率流派的學者在描述某事件發生的機率時,首先是基於該事件本身為主體,然後透過大量實驗結果,統計出該事件可能發生的頻率。因此,這一流派也被稱為基於實驗統計的頻率派。
上述內容,說人話就是:例如,你要拋一枚硬幣,想描述其落地時正面朝上的機率(可能性)。按照古典流派的方法就是不斷地做拋硬幣的實驗,每次統計其是正面還是反面。假設你拋了10000次,正面朝上落地的頻次是接近5000次,那麼你就可以得出結論:正面朝上的機率是50%。
在貝葉斯推斷公式面世之前,上述的這種透過做大量實驗統計出機率的方法是當時業界的主流思維模式。而貝葉斯推斷公式則完全不去埋頭做實驗,只憑第六感(也稱先驗機率)和自己多年走南闖北察言觀色得來的經驗(也稱似然度)就能預測出某件事發生的機率!這在古典機率流派的眼裡簡直是“大逆不道”!這簡直就是神棍,算命先生,騙子!彼時,古典機率流派的學者就是這麼抨擊貝葉斯的!
可是,在我們的世界裡,很多事情的發生都不可能透過做很多次實驗預測出機率的!比如,某支基金會不會上漲?特朗普會不會四年後捲土重來?男朋友出軌的可能有多少?……
在近代,隨著人工智慧AI的蓬勃發展,我們需要一種不借助實驗就能清楚預測的方法。於是乎,“神棍”貝葉斯就華麗麗地登場啦!貝葉斯公式如下:
貝葉斯公式
在貝葉斯公式中,P(A)和P(A |B)分別稱為事件的先驗機率和後驗機率。其中,P(A) 是在沒有進一步資訊(不知道事件B是否發生)的情況下,人們對諸事件發生可能性大小的認識。當有了新的資訊(知道B發生),人們對諸事件發生可能性大小P(A| B)有了新的估計。貝葉斯公式從數量上刻劃了這種變化。例如,某天你在男朋友的手機裡發現一條曖昧語音短訊,你是要立即去質問他還是偷偷抹眼淚,決定默默忍受;還是翻出我的這篇文章,用貝葉斯計算一下他出軌的機率有多少?
來吧,咱們新時代的女性還是基於貝葉斯算算:
1.設定先驗機率p(A):你男朋友在沒有任何徵兆的情況下出軌的機率是多少? 這個設定其實考察了在未發生這件事的平時,你有多信任他。
2.擬合似然度p(B|A): 如果他出軌了, 那麼他收到曖昧語音資訊機率是多少? 如果他沒出軌, 出現這個情況機率有多少? 想想有沒有可能是某個暗戀他的人的單方面表白或是網路電信詐騙?
3. 求後驗機率p(A|B):即存在這條曖昧資訊,他出軌的機率!根據1 和2,利用貝葉斯公式求解。
套用貝葉斯公式的過程中,你會發現,其實先驗和似然度都決定了最終的結果。
再比如,小明在某天拿到了某項疾病的化驗結果,化驗結果為陽性,那麼小明到底有沒有患此項疾病呢?醫生到底如何診斷的呢?看完下面的內容,你就會發現,現代醫生其實就是一位運用“貝葉斯公式”高手。
根據以往的記錄,這種診斷疾病的試驗有如下效果:對患病的病人的試驗呈陽性的機率為0.95;非患病病人的試驗呈陰性的機率為0.95.對自然人群進行普查的結果為:有千分之五的人患有此疾病。現有小明做此試驗結果為陽性,小明確有患病的機率為多少?
貝葉斯式醫生診病過程
雖然P(B |A)=0.95和P(B |A) 這兩個似然度都很高.但是,小明患病的機率只有8.7%。
因此,當體檢結果出來時,即使結果有陽性,也別先把自己“嚇死”,等得及的就等掛上號去找醫生幫你做貝葉斯推斷;等不及的,用我教你的貝葉斯公式自己推斷一下
明天太陽照常升起!