資源描述:
《【最新資料】什么是貝葉斯推理》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、什么是貝葉斯推理,貝葉斯定理2007年09月29日星期六上午08:22人們根據(jù)不確定性信息作出推理和決策需要對各種結論的概率作出估計,這類推理稱為概率推理。概率推理既是概率學和邏輯學的研究對象,也是心理學的研究對象,但研究的角度是不同的。概率學和邏輯學研究的是客觀概率推算的公式或規(guī)則;而心理學研究人們主觀概率估計的認知加工過程規(guī)律。貝葉斯推理的問題是條件概率推理問題,這一領域的探討對揭示人們對概率信息的認知加工過程與規(guī)律、指導人們進行有效的學習和判斷決策都具有十分重要的理論意義和實踐意義?! ? 什么是貝葉斯推理 早在18世
2、紀,英國學者貝葉斯(1702~1761)曾提出計算條件概率的公式用來解決如下一類問題:假設H[,1],H[,2]…互斥且構成一個完全事件,已知它們的概率P(H[,i],i=1,2,…,現(xiàn)觀察到某事件A與H[,1],H[,2]…相伴隨而出現(xiàn),且已知條件概率P(A/H[,i]),求P(H[,i]/A)。貝葉斯公式(發(fā)表于1763年)為:P(H[,i]/A)=P(H[,i])P(A/H[,i])/[P(H[,1])P(A/H[,1])P(H[,2])P(A/H[,2])…] 這就是著名的“貝葉斯定理”,一些文獻中把P(H[,1])、P
3、(H[,2])稱為基礎概率,P(A/H[,1])為擊中率,P(A/H[,2])為誤報率[1]。現(xiàn)舉一個心理學研究中常被引用的例子來說明: 參加常規(guī)檢查的40歲的婦女患乳腺癌的概率是1%。如果一個婦女有乳腺癌,則她有80%的概率將接受早期胸部腫瘤X射線檢查。如果一個婦女沒有患乳腺癌,也有9.6%的概率將接受早期胸部腫瘤X射線測定法檢查。在這一年齡群的常規(guī)檢查中某婦女接受了早期胸部腫瘤X射線測定法檢查。問她實際患乳腺癌的概率是多大?[2] 設H[,1]=乳腺癌,H[,2]=非乳腺癌,A=早期胸部腫瘤X射線檢查(以下簡稱“X射線檢查
4、”),已知P(H[,1])=1%,P(H[,2])=99%,P(A/H[,1])=80%,P(A/H[,2])=9.6%,求P(H[,1]/A)。根據(jù)貝葉斯定理,P(H[,1]/A)=(1%)(80%)/[(1%)(80%)(99%)(9.6%)]=0.078 心理學家所關心的是,一個不懂貝葉斯原理的人對上述問題進行直覺推理時的情形是怎樣的,并將他們的判斷結果與貝葉斯公式計算的結果做比較來研究推理過程的規(guī)律。因此有關這類問題的推理被稱為貝葉斯推理。 2 貝葉斯推理研究概況 2.1 基礎概率忽略現(xiàn)象的發(fā)現(xiàn)與爭論 Ka
5、hneman和Tversky開辟了概率推理這一重要的研究領域。他們在20世紀70年代初期的研究首先發(fā)現(xiàn),人們的直覺概率推理并不遵循貝葉斯原理,表現(xiàn)在判斷中往往忽略問題中的基礎概率信息,而主要根據(jù)擊中率信息作出判斷。他們一個經典性的研究[3]是:告知被試100人中有70人是律師,30人是工程師,從中隨機選出一人,當把該人的個性特征描述得象工程師時,被試判斷該人為工程師的概率接近0.90。顯然被試忽略了工程師的基礎概率只有30%。后來他們還采用多種問題驗證基礎概率忽略現(xiàn)象[4],如讓被試解決如下出租車問題:一個城市85%的出租車屬于綠
6、車公司,15%屬于藍車公司,現(xiàn)有一出租車卷入肇事逃逸事件,根據(jù)一目擊者確認,肇事車屬于藍車公司,目擊者的可靠性為80%。問肇事車是藍車的概率是多少。結果大多數(shù)被試判斷為80%,但如果考慮基礎概率則應是41%。HAO37hao37.net 這一研究結果引發(fā)了20世紀70年代以來的大量研究。有研究支持其結論,如Eddy用前述乳腺癌問題讓內科醫(yī)生判斷,結果95%的人判斷介于70%~80%,遠高于7.8%[2]。Casscells等人的研究結果表明,即使哈佛醫(yī)學院的工作人員對解決如乳腺癌和與之相類似的問題都出現(xiàn)同樣的偏差[5]?! 〉?/p>
7、有研究發(fā)現(xiàn),在許多條件下,被試對基礎概率的反應是敏感的。例如,如果問題的措辭強調要理解基礎概率與判斷的相關性[6]或強調事件是隨機抽樣的[7],則基礎概率忽略現(xiàn)象就會減少或消除。另一個引人注意的是Gigerenzer和Hoffrage1995年的研究,他們強調概率信息形式對概率判斷的影響。采用15個類似前述乳腺癌的文本問題進行了實驗,問題的概率信息用兩種形式呈現(xiàn),一種沿用標準概率形式(百分數(shù));一種用自然數(shù)表示的頻率形式,如“1000名婦女中有10名患有乳腺癌,在患有乳腺癌的婦女中8名婦女接受早期胸部X射線測定法檢查,在沒有患乳腺
8、癌的990名婦女中有95名接受早期胸部X射線測定法檢查”。結果在頻率形式條件下,接近50%的判斷符合貝葉斯算法,而在標準概率條件下只有20%的判斷符合貝葉斯算法[8]?! 《硪恍┭芯空邔Υ艘蔡岢霎愖h,有人認為他們在改變信息形式的操作中,同時也改變