貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習總結(jié).pdf

貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習總結(jié).pdf

ID:48022779

大?。?65.18 KB

頁數(shù):13頁

時間:2020-01-27

貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習總結(jié).pdf_第1頁
貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習總結(jié).pdf_第2頁
貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習總結(jié).pdf_第3頁
貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習總結(jié).pdf_第4頁
貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習總結(jié).pdf_第5頁
資源描述:

《貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習總結(jié).pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習總結(jié)一、貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習的原理從數(shù)據(jù)中學(xué)習貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)就是對給定的數(shù)據(jù)集,找到一個與數(shù)據(jù)集擬合最好的網(wǎng)絡(luò)。首先定義一個隨機變量hS,表示網(wǎng)絡(luò)結(jié)構(gòu)的不確定性,并賦予先驗概率分布hhpS()。然后計算后驗概率分布pS(

2、)D。根據(jù)Bayesian定理有hhhhpS(

3、)D??pSD(,)/()pDpSpDS()(

4、)/()pD其中hpD()是一個與結(jié)構(gòu)無關(guān)的正規(guī)化常數(shù),pDS(

5、)是邊界似然。于是確定網(wǎng)絡(luò)結(jié)構(gòu)的后驗分布只需要為每一個可能的結(jié)構(gòu)計算數(shù)據(jù)的邊界似然。在無約束多項分布、參數(shù)獨立、采用Dirichlet先驗和數(shù)據(jù)完整的前提下,數(shù)據(jù)的邊界似

6、然正好等于每一個(i,j)對的邊界似然的乘積,即nqrii??()???(N)hijijkijkpDS(

7、)????i?1j?1???(ijNij)k?1??(ijk)二、貝葉斯網(wǎng)絡(luò)完整數(shù)據(jù)集下結(jié)構(gòu)學(xué)習方法貝葉斯網(wǎng)絡(luò)建模一般有三種方法:1)依靠專家建模;2)從數(shù)據(jù)中學(xué)習;3)從知識庫中創(chuàng)建。在實際建模過程中常常綜合運用這些方法,以專家知識為主導(dǎo),以數(shù)據(jù)庫和知識庫為輔助手段,揚長避短,發(fā)揮各自優(yōu)勢,來保證建模的效率和準確性。但是,在不具備專家知識或知識庫的前提下,從數(shù)據(jù)中學(xué)習貝葉斯網(wǎng)絡(luò)模型結(jié)構(gòu)的研究顯得尤為重要。常用的結(jié)構(gòu)學(xué)習方法主要有兩類,分別是基于依賴性測試的學(xué)

8、習和基于搜索評分的學(xué)習。第一類方法是基于依賴性測試的方法,它是在給定數(shù)據(jù)集D中評估變量之間的條件獨立性關(guān)系,構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)?;跅l件獨立測試方法學(xué)習效率最好,典型的算法包括三階段分析算法(TPDA)。基于依賴性測試的方法比較直觀,貼近貝葉斯網(wǎng)絡(luò)的語義,把條件獨立性測試和網(wǎng)絡(luò)結(jié)構(gòu)的搜索分離開,不足之處是對條件獨立性測試產(chǎn)生的誤差非常敏感。且在某些情況下條件獨立性測試的次數(shù)相對于變量的數(shù)目成指數(shù)級增長。第二類方法是基于評分搜索的方法,其原理是在所有節(jié)點的結(jié)構(gòu)空間內(nèi)按照一定的搜索策略及評分準則構(gòu)建貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),這種算法雖然能夠搜索到精確的網(wǎng)絡(luò)結(jié)構(gòu),但是由于結(jié)構(gòu)空間很大,

9、從所有可能的網(wǎng)絡(luò)結(jié)構(gòu)空間搜索最佳的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)被證明為NP-hard問題,所以一般需要使用啟發(fā)式算法,代表性算法有K2算法等?;谒阉髟u分的方法是一種統(tǒng)計驅(qū)動的方法,試圖在準確性、稀疏性、魯棒性等多個因素之間找個平衡點。但由于搜索方法的先天弱點,導(dǎo)致用搜索評分的方法不一定能找到最好的結(jié)構(gòu),但是應(yīng)用范圍很廣。當觀察到的數(shù)據(jù)足夠充分且計算次數(shù)足夠多時,基于搜索評分的方法和基于依賴性測試的方法都可以學(xué)到“正確”的網(wǎng)絡(luò)結(jié)構(gòu)。此外,有人結(jié)合上述兩種方法,提出了一些混合算法,這類算法首先利用獨立性測試降低搜索空間的復(fù)雜度,然后執(zhí)行評分搜索找到最佳網(wǎng)絡(luò),如稀疏候選算法(spa

10、rsecandidate)及MMHC(max-minhill-climbing)算法等。1.基于依賴性測試結(jié)構(gòu)學(xué)習方法基于依賴性測試的結(jié)構(gòu)學(xué)習算法將貝葉斯網(wǎng)絡(luò)看作是編碼了變量間獨立性關(guān)系的圖結(jié)構(gòu)。它的核心思想是:通過樣本集D驗證條件獨立性I(Xi,Xj

11、C)是否成立,若成立,則在網(wǎng)絡(luò)S中節(jié)點Xi和Xj被C有向分割,節(jié)點Xi和Xj之間不存在邊,若不成立,變量Xi和Xj是依賴的,網(wǎng)絡(luò)中節(jié)點Xi和Xj之間存在邊。然后,利用節(jié)點集之間的條件獨立性,建造一個有向無環(huán)圖,以盡可能多地覆蓋這些條件獨立性。常用的獨立性檢驗的方法有2?檢驗和基于互信息的檢驗方法?;谝蕾囆詼y試的學(xué)

12、習方法學(xué)習效率較高,而且能夠獲得全局最優(yōu)解;但存在以下問題:1.判斷兩個節(jié)點是否獨立或條件獨立是困難的,變量間條件獨立性檢驗的次數(shù)是隨著變量的個數(shù)的增加指數(shù)級增長的;2.高階的條件獨立性檢驗的結(jié)果不夠可靠。1993年Sprites等提出的SGS算法是典型的以條件獨立性測試確定拓撲結(jié)構(gòu)的算法。該算法從無向完全圖出發(fā),如果相節(jié)點間存在無向分割集,則刪除它們間的邊;然后通過統(tǒng)計測試來確定剩余邊的方向。2002年,Cheng將信息論與統(tǒng)計測試相結(jié)合,使用相互信息代替了條件獨立性測試。經(jīng)過Drafting、Thickening、Thinning三個步驟,通過計算相互信息量來

13、確定節(jié)點間的條件獨立性。從而構(gòu)造出多連接有向圖模型。2.基于評分搜索的結(jié)構(gòu)學(xué)習方法:貝葉斯網(wǎng)絡(luò)基于評分搜索的結(jié)構(gòu)學(xué)習方法主要包括兩步:模型選擇和模型優(yōu)化。模型選擇部分要制定模型選擇準則,即評分函數(shù),目前較常用的幾個評分函數(shù)如下:最優(yōu)參數(shù)對數(shù)似然函數(shù),CH評分,BIC評分等,還有MDL(minimumdescriptionlength),AIC(Akaikeinformationcriterion)評分函數(shù),HVL(holdoutvalidationlikelihood)評分(驗證數(shù)據(jù)似然度)。CVL(crossvalidationlikelihood)評分(交叉驗

14、證)。模型

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。