貝葉斯公式(發(fā)表于1763年)為:
這就是著名的“貝葉斯定理”,一些文獻中把P(B[1])、P(B[2])稱為基礎(chǔ)概率,P(A│B[1])為擊中率,P(A│B[2])為誤報率。
貝葉斯定理在檢測吸毒者時很有用。假設(shè)一個常規(guī)的檢測結(jié)果的敏感度與可靠度均為99%,也就是說,當(dāng)被檢者吸毒時,每次檢測呈陽性(+)的概率為99%。而被檢者不吸毒時,每次檢測呈陰性(-)的概率為99%。從檢測結(jié)果的概率來看,檢測結(jié)果是比較準確的,但是貝葉斯定理卻可以揭示一個潛在的問題。假設(shè)某公司將對其全體雇員進行一次鴉片吸食情況的檢測,已知0.5%的雇員吸毒。我們想知道,每位醫(yī)學(xué)檢測呈陽性的雇員吸毒的概率有多高?令“D”為雇員吸毒事件,“N”為雇員不吸毒事件,“+”為檢測呈陽性事件??傻?/p>
P(D)代表雇員吸毒的概率,不考慮其他情況,該值為0.005。因為公司的預(yù)先統(tǒng)計表明該公司的雇員中有0.5%的人吸食毒品,所以這個值就是D的先驗概率。
P(N)代表雇員不吸毒的概率,顯然,該值為0.995,也就是1-P(D)。
P(+|D)代表吸毒者陽性檢出率,這是一個條件概率,由于陽性檢測準確性是99%,因此該值為0.99。
P(+|N)代表不吸毒者陽性檢出率,也就是出錯檢測的概率,該值為0.01,因為對于不吸毒者,其檢測為陰性的概率為99%,因此,其被誤檢測成陽性的概率為1-99%。
P(+)代表不考慮其他因素的影響的陽性檢出率。該值為0.0149或者1.49%。我們可以通過全概率公式計算得到:此概率 = 吸毒者陽性檢出率(0.5% x 99% = 0.00495)+ 不吸毒者陽性檢出率(99.5% x 1% = 0.00995)。P(+)=0.0149是檢測呈陽性的先驗概率。用數(shù)學(xué)公式描述為:
根據(jù)上述描述,我們可以計算某人檢測呈陽性時確實吸毒的條件概率P(D|+):
P(D|+) = P(+|D)P(D)/(P(+|D)P(D)+P(+|N)P(N))=0.99 *0.005/0.0149=0.332215
盡管我們的檢測結(jié)果可靠性很高,但是只能得出如下結(jié)論:如果某人檢測呈陽性,那么此人是吸毒的概率只有大 約33%,也就是說此人不吸毒的可能性比較大。我們測試的條件(本例中指D,雇員吸毒)越難發(fā)生,發(fā)生誤判的可能性越大。
但如果讓此人再次復(fù)檢(相當(dāng)于P(D)=33.2215%,為吸毒者概率,替換了原先的0.5%),再使用貝葉斯定理計算,將會得到此人吸毒的概率為98.01%。但這還不是貝葉斯定理最強的地方,如果讓此人再次復(fù)檢,再重復(fù)使用貝葉斯定理計算,會得到此人吸毒的概率為99.8%(99.9794951%)已經(jīng)超過了檢測的可靠度。
貝葉斯定理用于投資決策分析是在已知相關(guān)項目B的資料,而缺乏論證項目A的直接資料時,通過對B項目的有關(guān)狀態(tài)及發(fā)生概率分析推導(dǎo)A項目的狀態(tài)及發(fā)生概率。如果我們用數(shù)學(xué)語言描繪,即當(dāng)已知事件Bi的概率P(Bi)和事件Bi已發(fā)生條件下事件A的概率P(A│Bi),則可運用貝葉斯定理計算出在事件A發(fā)生條件下事件Bi的概率P(Bi│A)。按貝葉斯定理進行投資決策的基本步驟是:
1 列出在已知項目B條件下項目A的發(fā)生概率,即將P(A│B)轉(zhuǎn)換為 P(B│A);
2 繪制樹型圖;
3 求各狀態(tài)結(jié)點的期望收益值,并將結(jié)果填入樹型圖;
4 根據(jù)對樹型圖的分析,進行投資項目決策。
搜索巨人Google和Autonomy,一家出售信息恢復(fù)工具的公司,都使用了貝葉斯定理(Bayesian principles)為數(shù)據(jù)搜索提供近似的(但是技術(shù)上不確切)結(jié)果。研究人員還使用貝葉斯模型來判斷癥狀和疾病之間的相互關(guān)系,創(chuàng)建個人機器人,開發(fā)能夠根據(jù)數(shù)據(jù)和經(jīng)驗來決定行動的人工智能設(shè)備。