資源描述:
《專題:貝葉斯統(tǒng)計簡介》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、統(tǒng)計學(xué)專題(一)貝葉斯統(tǒng)計學(xué)簡介重慶工商大學(xué)數(shù)統(tǒng)學(xué)院李勇(023)62002579liongcq@163.com先做人,后做事只有一門學(xué)科是必須要教給孩子的,這門學(xué)科就是做人的天職。……我寧愿把有這種知識的老師稱為導(dǎo)師而不稱為教師,因為問題不在于要他拿什么東西去教孩子,而是要他指導(dǎo)孩子怎樣做人。——[法國]盧梭一、貝葉斯統(tǒng)計學(xué)的歷史二、統(tǒng)計推斷與決策利用的基本信息三、條件觀點與似然原理四、貝葉斯公式、先驗分布和后驗分布五、先驗分布的確定一、貝葉斯統(tǒng)計學(xué)的歷史約三百年以前,人們開始去嚴(yán)肅的考慮面對不確定性時如何進(jìn)行推理。JamesBernoulli是第一個構(gòu)造該問題的人,
2、他意識到在可應(yīng)用于機(jī)會游戲的演繹邏輯和每日生活中的歸納邏輯之間的區(qū)別。對于他來說,這個未回答的問題在于前者的機(jī)理如何能幫助處理后者的推斷問題。英國學(xué)者托馬斯.貝葉斯(ThomasBayes,1702-1761)生前所作的一篇論文——《論有關(guān)機(jī)遇問題的求解》,對Bernoulli的問題提供了回答。在文章中他提出了著名的貝葉斯公式和一種歸納推理的方法。然而,當(dāng)時他的理論成果并沒有得到足夠的重視,后來在他理論的基礎(chǔ)上逐漸形成了貝葉斯學(xué)派。時至今日,貝葉斯學(xué)派已經(jīng)與經(jīng)典學(xué)派共同成為統(tǒng)計學(xué)的兩大主流學(xué)派。貝葉斯學(xué)派的基本觀點任一未知參數(shù)都可以看作是隨機(jī)變量,可用一個概率分布去描述
3、,這是經(jīng)典學(xué)派和貝葉斯學(xué)派爭論的焦點所在。貝葉斯學(xué)派認(rèn)為:可以把任一未知參數(shù)看作隨機(jī)變量,并且通過利用主觀的判斷和直覺,提供先驗信息(即先驗分布);經(jīng)典學(xué)派只承認(rèn)利用樣本信息,不承認(rèn)利用主觀的判斷和直覺,即不承認(rèn)利用先驗信息。關(guān)于未知參數(shù)是否可以看作隨機(jī)變量在經(jīng)典學(xué)派和貝葉斯學(xué)派間爭論了很長時間,如今經(jīng)典學(xué)派已經(jīng)不反對這一觀點?,F(xiàn)在爭論的焦點是:如何利用各種先驗信息合理的確定先驗分布。貝葉斯學(xué)派發(fā)展幾個階段ThomasBayes:1736年ThomasBayes提出了重要的貝葉斯定理,其遺著《論有關(guān)機(jī)遇問題的求解》被他的朋友RichardPrice整理于1763年發(fā)表。
4、貝葉斯理論的價值才被世人認(rèn)識,貝葉斯理論開始奠基。Laplace:目前以他姓名命名的定理的現(xiàn)代形式實際上歸功于Laplace。Laplace本人不僅重新發(fā)現(xiàn)了貝葉斯定理,且闡述的遠(yuǎn)比貝葉斯更為清晰,還用它來解決天體力學(xué),醫(yī)學(xué)統(tǒng)計,甚至法律問題。他全心全意的贊成用于推斷問題的貝葉斯公式。遺憾的是,Laplace取得的成功和他對概率論的發(fā)展做出的巨大貢獻(xiàn),卻并不為當(dāng)時有勢力的歐洲數(shù)學(xué)家所認(rèn)可。之后雖還有一些零星的研究,由于理論的不完善和應(yīng)用中出現(xiàn)了一些問題,貝葉斯學(xué)派的一些理論長期不被人們所接受?,F(xiàn)代發(fā)展:進(jìn)入到上世紀(jì)50年代,貝葉斯理論得到了充分發(fā)展,60、70年代以來,
5、其發(fā)展達(dá)到鼎盛時期。許多專家學(xué)者投身于貝葉斯理論的研究和應(yīng)用推廣中來,力圖從不同的角度對貝葉斯理論進(jìn)行進(jìn)一步的探討和研究,形成了具有多分支的理論系統(tǒng)。目前被承認(rèn)的現(xiàn)代貝葉斯統(tǒng)計工具應(yīng)當(dāng)歸功于Jeffry、Wald、Savage、Raiffa&Schlaifer、Lindly及DeFinett。他們都曾做過大量有意義的工作,為建立統(tǒng)一的理論體系和方法論奠定了基礎(chǔ)。A.Wald統(tǒng)計決策理論是著名統(tǒng)計學(xué)家A.Wald(1902-1950)在上世紀(jì)四十年代建立起來的,他在其文章《統(tǒng)計決策函數(shù)》中系統(tǒng)、詳細(xì)的闡述了統(tǒng)計決策理論,統(tǒng)計決策理論與經(jīng)典統(tǒng)計學(xué)的差別在于是否涉及后果,經(jīng)典
6、統(tǒng)計學(xué)著重于推斷,而不考慮用在何處和效益如何,而統(tǒng)計決策理論引入損失函數(shù),用來度量效益大小,評價統(tǒng)計推斷結(jié)果的優(yōu)劣。二、統(tǒng)計推斷與決策利用的基本信息1、總體信息2、樣本信息3、先驗信息4、損失函數(shù)1、總體信息指總體分布或總體所屬分布族所蘊(yùn)涵的信息。如:“總體是正態(tài)分布”蘊(yùn)涵:它的密度函數(shù)是一條鐘形曲線;它的一切階矩都存在;可以計算一些事件的概率;可以導(dǎo)出χ2分布、t分布和F分布;還有成熟的點估計、區(qū)間估計和假設(shè)檢驗方法等等。2、樣本信息樣本信息:指從總體抽取的樣本所提供的信息?;诳傮w和樣本信息進(jìn)行的統(tǒng)計推斷,稱為經(jīng)典(頻率派)統(tǒng)計學(xué)?;居^點:1)把未知參數(shù)θ看作是一
7、個固定的,未知的常數(shù)(向量),是估計和檢驗等問題的目標(biāo)。2)利用的樣本信息涉及到試驗所有可能出現(xiàn)的數(shù)據(jù),即把樣本數(shù)據(jù)看成是來自具有一定概率分布的總體,所研究的對象是指這個總體,而不局限于已獲得的樣本數(shù)據(jù)本身。3)其概率論基礎(chǔ)是頻率概率:表示在大量重復(fù)試驗下的相對頻率。遵守概率三條公理(非負(fù)性、正規(guī)性、可加性)。3、先驗信息指在抽樣之前有關(guān)統(tǒng)計問題的非樣本信息。主要來自過去的經(jīng)驗和歷史資料。關(guān)于先驗信息的重要性,英國統(tǒng)計學(xué)家L.J.Savage1961年提出一個令人信服的例子。例(英L.J.Savage,1961)以下有三個試驗:(1)一位