資源描述:
《《貝葉斯統(tǒng)計(jì)》word版》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、《貝葉斯統(tǒng)計(jì)》課程設(shè)計(jì)班級(jí):姓名:學(xué)號(hào):9目錄《貝葉斯統(tǒng)計(jì)》1目錄2一、貝葉斯統(tǒng)計(jì)的意義3二、貝葉斯統(tǒng)計(jì)的基本思想4先驗(yàn)分布4后驗(yàn)分布5三、貝葉斯估計(jì)5點(diǎn)估計(jì)5區(qū)間估計(jì)6假設(shè)檢驗(yàn)7四、貝葉斯估計(jì)應(yīng)用實(shí)例89一、貝葉斯統(tǒng)計(jì)的意義貝葉斯統(tǒng)計(jì)起源于英國學(xué)者貝葉斯的一篇論文“論有關(guān)機(jī)遇問題的求解”。在這篇論文中,他提出了著名的貝葉斯公式。又設(shè)參數(shù)θ已知時(shí),樣本x的分布密度為f(x
2、θ),θ的先驗(yàn)密度為(θ),則已知樣本Y后,參數(shù)θ的后驗(yàn)密度為h(θ
3、X)=(1)貝葉斯公式、參數(shù)θ的后驗(yàn)密度公式(1)及貝葉斯假
4、設(shè)構(gòu)成了貝葉斯統(tǒng)計(jì)的起點(diǎn)。頻率學(xué)派進(jìn)行統(tǒng)計(jì)推斷時(shí),依據(jù)兩種信息:一是總體信息,即統(tǒng)計(jì)總體服從何種概率分布,例如總體服從正態(tài)分布。另一是樣本信息,即從總體抽取的樣本給我們提供的信息。貝葉斯學(xué)派則除以上兩種信息外,還須利用先驗(yàn)信息,即在抽樣(試驗(yàn))之前有關(guān)總體分布的未知參數(shù)的信息。貝葉斯學(xué)派受到的批評(píng)集中于以下兩點(diǎn):1)參數(shù)日看成是隨機(jī)變量是否合適;2)先驗(yàn)分布是否存在,如何確定。貝葉斯統(tǒng)計(jì)在參數(shù)的點(diǎn)估計(jì)、區(qū)間估計(jì)及假設(shè)檢驗(yàn)方面形成了與頻率統(tǒng)計(jì)相平行的理論方法,并賦予統(tǒng)汁推斷以新的解釋”,9它在可靠性方面
5、有著成功的應(yīng)用。貝葉斯分析與統(tǒng)計(jì)決策論也是難以分開的,貝葉斯統(tǒng)計(jì)具有簡潔實(shí)用的特點(diǎn)。貝葉斯方法的關(guān)鍵是先驗(yàn)分布的確定。由于現(xiàn)實(shí)世界中的事物的發(fā)生常不具備大量可重復(fù)性,事件發(fā)生的概率較難具有頻率解釋,而又面臨解決問題,這導(dǎo)致主觀概率、先驗(yàn)分布的提出,試圖通過科學(xué)的思維活動(dòng)來彌補(bǔ)經(jīng)驗(yàn)的不足,再利用樣本X調(diào)整先驗(yàn)分布π(θ)為后驗(yàn)分布h(θ
6、X),完成對(duì)參數(shù)目認(rèn)識(shí)的再認(rèn)識(shí)。二、貝葉斯統(tǒng)計(jì)的基本思想1、貝葉斯統(tǒng)計(jì)認(rèn)為一些事件的概率在大量重復(fù)試驗(yàn)中去獲得是不現(xiàn)實(shí)的,而我們可以根據(jù)對(duì)此事件的了解和積累的經(jīng)驗(yàn)做出此
7、事件發(fā)生可能性的判斷。2、貝葉斯學(xué)派很注重先驗(yàn)信息的收集、挖掘和加工,使他們數(shù)量化成先驗(yàn)分布,參加到統(tǒng)計(jì)推斷中,以此提高統(tǒng)計(jì)推斷的質(zhì)量。3、貝葉斯統(tǒng)計(jì)把任何一個(gè)未知的參數(shù)都看作是隨機(jī)變量,都有不確定性,用一個(gè)概率分布去描述這個(gè)未知的參數(shù),在統(tǒng)計(jì)推斷中只利用已經(jīng)出現(xiàn)的數(shù)據(jù),即樣本信息,這就是貝葉斯統(tǒng)計(jì)中的“條件觀點(diǎn)”。4、貝葉斯的判斷方法是在獲得后驗(yàn)分布之后,可分別計(jì)算原假設(shè)H0和備擇假設(shè)H1的后驗(yàn)概率。先驗(yàn)分布它是總體分布參數(shù)θ的一個(gè)概率分布。貝葉斯學(xué)派的根本觀點(diǎn),是認(rèn)為在關(guān)于θ的任何統(tǒng)計(jì)推斷問題中,
8、除了使用樣本X所提供的信息外,還必須對(duì)θ規(guī)定一個(gè)先驗(yàn)分布,它是在進(jìn)行推斷時(shí)不可或缺的一個(gè)要素。貝葉斯學(xué)派把先驗(yàn)分布解釋為在抽樣前就有的關(guān)于θ的先驗(yàn)信息的概率表述,先驗(yàn)分布不必有客觀的依據(jù),它可以部分地或完全地基于主觀信念。9后驗(yàn)分布根據(jù)樣本X的分布Pθ及θ的先驗(yàn)分布π(θ),用概率論中求條件概率分布的方法,可算出在已知X=x的條件下,θ的條件分布π(θ
9、x)。因?yàn)檫@個(gè)分布是在抽樣以后才得到的,故稱為后驗(yàn)分布。貝葉斯學(xué)派認(rèn)為:這個(gè)分布綜合了樣本X及先驗(yàn)分布π(θ)所提供的有關(guān)的信息。抽樣的全部目的,就在
10、于完成由先驗(yàn)分布到后驗(yàn)分布的轉(zhuǎn)換。如上例,設(shè)p=P(θ=1)=0.001,而π(θ=1
11、x)=0.86,則貝葉斯學(xué)派解釋為:在某甲的指標(biāo)量出之前,他患病的可能性定為0.001,而在得到X后,認(rèn)識(shí)發(fā)生了變化:其患病的可能性提高為0.86,這一點(diǎn)的實(shí)現(xiàn)既與X有關(guān),也離不開先驗(yàn)分布。計(jì)算后驗(yàn)分布的公式本質(zhì)上就是概率論中著名的貝葉斯公式(見概率),這公式正是上面提到的貝葉斯1763年的文章的一個(gè)重要內(nèi)容。貝葉斯推斷方法的關(guān)鍵在于所作出的任何推斷都必須也只須根據(jù)后驗(yàn)分布π(θ│X),而不能再涉及X的樣本分布Pθ
12、。三、貝葉斯估計(jì)點(diǎn)估計(jì)后驗(yàn)分布π(θ
13、x)估計(jì)θ的三種常用方法:·使用后驗(yàn)分布的密度函數(shù)最大值點(diǎn)作為θ的點(diǎn)估計(jì)的最大后驗(yàn)估計(jì)9·使用后驗(yàn)分布的中位數(shù)作為θ的點(diǎn)估計(jì)的后驗(yàn)中位數(shù)估計(jì)·使用后驗(yàn)分布的均值作為θ的點(diǎn)估計(jì)的后驗(yàn)期望估計(jì)例、設(shè)總體為均勻分布U(θ,θ+1),θ的先驗(yàn)分布是均勻分布U(10,16).現(xiàn)有三個(gè)觀測(cè)值:11.7,12.1,12.0求θ的后驗(yàn)分布。解:參數(shù)θ的先驗(yàn)分布為(θ)=I總體X的條件分布為P(X
14、θ)=I有樣本X,X,X的聯(lián)合條件分布為P(x,x,x
15、θ)=I則樣本X,X,X和參
16、數(shù)θ的聯(lián)合分布為h(x,x,x,θ)=I,=I,可得樣本X,X,X的邊際分布為m(x,x,x)=Idθ=dθ=0.1,故參數(shù)θ的后驗(yàn)分布為(θ
17、x,x,x)==I.區(qū)間估計(jì)用數(shù)軸上的一段經(jīng)歷或一個(gè)數(shù)據(jù)區(qū)間,表示總體參數(shù)的可能范圍.這一段距區(qū)間估計(jì)離或數(shù)據(jù)區(qū)間稱為區(qū)間估計(jì)的置信區(qū)間。參數(shù)估計(jì)一般是指根據(jù)樣本信息,對(duì)總體分布中的未知參數(shù)θ進(jìn)行估計(jì),而我們通常都是對(duì)均值或方差進(jìn)行估計(jì)。區(qū)間估計(jì)9是參數(shù)估計(jì)的一種,它是指對(duì)于給定的置信度1-α,總體參數(shù)θ的取值在