貝葉斯公式(發表于1763年)為:
這就是著名的“貝葉斯定理”,一些文獻中把P(B[1])、P(B[2])稱為基礎概率,P(A│B[1])為擊中率,P(A│B[2])為誤報率。
貝葉斯定理在檢測吸毒者時很有用。假設一個常規的檢測結果的敏感度與可靠度均為99%,也就是說,當被檢者吸毒時,每次檢測呈陽性(+)的概率為99%。而被檢者不吸毒時,每次檢測呈陰性(-)的概率為99%。從檢測結果的概率來看,檢測結果是比較準確的,但是貝葉斯定理卻可以揭示一個潛在的問題。假設某公司將對其全體雇員進行一次鴉片吸食情況的檢測,已知0.5%的雇員吸毒。我們想知道,每位醫學檢測呈陽性的雇員吸毒的概率有多高?令“D”為雇員吸毒事件,“N”為雇員不吸毒事件,“+”為檢測呈陽性事件。可得
P(D)代表雇員吸毒的概率,不考慮其他情況,該值為0.005。因為公司的預先統計表明該公司的雇員中有0.5%的人吸食毒品,所以這個值就是D的先驗概率。
P(N)代表雇員不吸毒的概率,顯然,該值為0.995,也就是1-P(D)。
P(+|D)代表吸毒者陽性檢出率,這是一個條件概率,由于陽性檢測準確性是99%,因此該值為0.99。
P(+|N)代表不吸毒者陽性檢出率,也就是出錯檢測的概率,該值為0.01,因為對于不吸毒者,其檢測為陰性的概率為99%,因此,其被誤檢測成陽性的概率為1-99%。
P(+)代表不考慮其他因素的影響的陽性檢出率。該值為0.0149或者1.49%。我們可以通過全概率公式計算得到:此概率 = 吸毒者陽性檢出率(0.5% x 99% = 0.00495)+ 不吸毒者陽性檢出率(99.5% x 1% = 0.00995)。P(+)=0.0149是檢測呈陽性的先驗概率。用數學公式描述為:
根據上述描述,我們可以計算某人檢測呈陽性時確實吸毒的條件概率P(D|+):
P(D|+) = P(+|D)P(D)/(P(+|D)P(D)+P(+|N)P(N))=0.99 *0.005/0.0149=0.332215
盡管我們的檢測結果可靠性很高,但是只能得出如下結論:如果某人檢測呈陽性,那么此人是吸毒的概率只有大 約33%,也就是說此人不吸毒的可能性比較大。我們測試的條件(本例中指D,雇員吸毒)越難發生,發生誤判的可能性越大。
但如果讓此人再次復檢(相當于P(D)=33.2215%,為吸毒者概率,替換了原先的0.5%),再使用貝葉斯定理計算,將會得到此人吸毒的概率為98.01%。但這還不是貝葉斯定理最強的地方,如果讓此人再次復檢,再重復使用貝葉斯定理計算,會得到此人吸毒的概率為99.8%(99.9794951%)已經超過了檢測的可靠度。
貝葉斯定理用于投資決策分析是在已知相關項目B的資料,而缺乏論證項目A的直接資料時,通過對B項目的有關狀態及發生概率分析推導A項目的狀態及發生概率。如果我們用數學語言描繪,即當已知事件Bi的概率P(Bi)和事件Bi已發生條件下事件A的概率P(A│Bi),則可運用貝葉斯定理計算出在事件A發生條件下事件Bi的概率P(Bi│A)。按貝葉斯定理進行投資決策的基本步驟是:
1 列出在已知項目B條件下項目A的發生概率,即將P(A│B)轉換為 P(B│A);
2 繪制樹型圖;
3 求各狀態結點的期望收益值,并將結果填入樹型圖;
4 根據對樹型圖的分析,進行投資項目決策。
搜索巨人Google和Autonomy,一家出售信息恢復工具的公司,都使用了貝葉斯定理(Bayesian principles)為數據搜索提供近似的(但是技術上不確切)結果。研究人員還使用貝葉斯模型來判斷癥狀和疾病之間的相互關系,創建個人機器人,開發能夠根據數據和經驗來決定行動的人工智能設備。