資源描述:
《貝葉斯統(tǒng)計讀書報告》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、蘇州大學(xué)研究生考試答卷封面考試科目:貝葉斯統(tǒng)計考試得分:________________院別:數(shù)學(xué)科學(xué)學(xué)院專業(yè):應(yīng)用統(tǒng)計專碩學(xué)生姓名:林挺挺學(xué)號:20154507001授課教師:朱信樞考試日期:年月日貝葉斯統(tǒng)計讀書報告一、背景——貝葉斯學(xué)派的起源與發(fā)展簡介在國際統(tǒng)計學(xué)術(shù)界中有貝葉斯統(tǒng)計和經(jīng)典統(tǒng)計兩大學(xué)派,這兩個學(xué)派之間長期存在爭論,至今也沒有定論。貝葉斯學(xué)派起源于貝葉斯的《機會學(xué)說中一個問題的解》,隨后拉普拉斯不僅獨立的發(fā)現(xiàn)了貝葉斯定理,而且闡述的比貝葉斯更為清晰,并用它來解決天體力學(xué)、醫(yī)學(xué)統(tǒng)計和法學(xué)問題
2、。二十世紀50年代后,經(jīng)拉姆齊、杰弗里斯、薩維奇等統(tǒng)計學(xué)家的努力,形成了系統(tǒng)的方法和學(xué)說,日益受到人們的重視,并滲透到非統(tǒng)計領(lǐng)域。事實上,這兩個學(xué)派的爭論構(gòu)成了現(xiàn)代數(shù)理統(tǒng)計發(fā)展過程的一個特色。英國統(tǒng)計學(xué)家Lindely認為21世紀將是貝葉斯統(tǒng)計的世界,而Efrom認為出現(xiàn)這個局面的可能性只有15%。但無論如何,這兩個學(xué)派學(xué)者都認為:這場爭論對現(xiàn)代統(tǒng)計理論的發(fā)展將起著積極的促進作用。二、貝葉斯統(tǒng)計方法與經(jīng)典統(tǒng)計方法的比較在統(tǒng)計推斷的基本理論和方法兩個方面,貝葉斯學(xué)派與經(jīng)典學(xué)派之間存在著本質(zhì)性的差異,這主要表現(xiàn)在以
3、下幾個方面:1.經(jīng)典學(xué)派在進行統(tǒng)計推斷時,依據(jù)兩類信息:一是總體信息,即統(tǒng)計總體服從何種概率分布,這是制定統(tǒng)計方法的基礎(chǔ);另外一個是樣本信息,即觀察或?qū)嶒灥慕Y(jié)果。貝葉斯學(xué)派則除了以上兩類信息外,尚利用另外一類信息,即總體分布中未知參數(shù)的分布信息。2.經(jīng)典學(xué)派堅持概率的頻率解釋,并在這個基礎(chǔ)上去理解一切統(tǒng)計推斷的結(jié)論,如在Neyman的區(qū)間估計理論中,“某區(qū)間估計[θ,θ]的置信水平為1-α”這一推斷,此處應(yīng)θ理解為一無隨機性的未知參數(shù),當區(qū)間估計[θ,θ]反復(fù)大量使用時,100次中大約平均有(1-α)100次包
4、含了參數(shù)θ。與此相反,貝葉斯學(xué)派贊成主觀概率,概率是認識主體對事件出現(xiàn)可能性大小的相信程度,它并不依賴時間能否重復(fù)。3.貝葉斯方法只能基于參數(shù)的后驗分布來分析問題。也就是說,在獲得后驗分布后,如果把樣本、原來的統(tǒng)計模型(包括總體分布和先驗分布)都丟掉,一點也不會影響將來的統(tǒng)計推斷問題,凡是符合這個準則的推斷就是貝葉斯推斷。就此,經(jīng)典學(xué)派中的矩估計、顯著性檢驗和置信區(qū)間估計都不屬于貝葉斯推斷的范疇,但MLE估計則可視為均勻先驗分布之下的貝葉斯估計。因此,作為經(jīng)典學(xué)派中一個很重要的極大似然估計,不過是在一種很特殊先
5、驗分布下的貝葉斯估計而已。三、第一章先驗分布和后驗分布1.1貝葉斯公式(一)貝葉斯公式的密度函數(shù)形式1.依賴于參數(shù)θ的密度函數(shù)在經(jīng)典統(tǒng)計中記為p(x;θ)或pθ(x),它表示在參數(shù)空間Θ={θ}中不同的θ對應(yīng)不同的分布??稍谪惾~斯統(tǒng)計中記為p(x
6、θ)它表示在隨機變量θ給定某個值時,總體指標X的條件分布。2.根據(jù)參數(shù)θ的先驗信息確定先驗分布π(θ)。這是貝葉斯學(xué)派在最近幾十年里重點研究的問題。3.從貝葉斯觀點看,樣本x=(x1,…,xn)的產(chǎn)生要分兩步進行。首先設(shè)想從先驗分布π(θ)產(chǎn)生一個樣本θ‘,這一步是“
7、老天爺”做的,人們是看不到的,故用“設(shè)想”二字。第二部是從總體分布p(x
8、θ‘)產(chǎn)生一個樣本x=(x1,…,xn),這個樣本是具體的,人們能看到的,此樣本x發(fā)生的概率是與如下聯(lián)合密度函數(shù)成正比。pxθ‘=i=1npxiθ‘這個聯(lián)合密度函數(shù)是綜合了總體信息和樣本信息,常稱為似然函數(shù),記為L(θ‘)。頻率學(xué)派和貝葉斯學(xué)派都承認似然函數(shù),兩派認為:在有了樣本觀察值x=(x1,…,xn)后,總體和樣本中所含θ的信息都被包含在似然函數(shù)L(θ‘)之中,可在使用似然函數(shù)作統(tǒng)計推斷時,兩派之間還是有差異的。4.由于θ‘是設(shè)想出
9、來的,它仍然是未知的,它是按先驗分布π(θ)而產(chǎn)生的,要把先驗信息進行綜合,不能只考慮θ‘,而應(yīng)對θ的一切可能加以考慮。故要用π(θ)參與進一步綜合。這樣一來,樣本x和參數(shù)θ的聯(lián)合分布hx,θ=p(x
10、θ)π(θ)把三種可用的信息都綜合進去了。5.我們的任務(wù)是要求未知數(shù)θ做出統(tǒng)計推斷。在沒有樣本信息時,人們只能據(jù)先驗分布對θ作出推斷。在有樣本觀察值x=(x1,…,xn)之后,我們依據(jù)hx,θ對θ作出推斷。為此我們需把hx,θ作如下分解:hx,θ=π(θ
11、x)m(x)其中m(x)是x的邊緣密度函數(shù)。mx=Θhx,
12、θdθ=Θp(x
13、θ)π(θ)它與θ無關(guān),或者說,m(x)中不含θ的任何信息。因此能用來對θ作出推斷的僅是條件分布π(θ
14、x)。它的計算公式是πθx=h(x
15、θ)m(x)=p(x
16、θ)π(θ)Θp(x
17、θ)π(θ)dθ這就是貝葉斯公式的密度函數(shù)形式。這個在樣本x給定下,θ的條件分布被稱為θ的后驗分布。它是集中了總體、樣本和先驗等三種信息中有關(guān)θ的一切信息,而又是排除一切與θ無關(guān)的信息之