貝葉斯網(wǎng)絡(luò)研究

貝葉斯網(wǎng)絡(luò)研究

ID:37555187

大?。?.43 MB

頁數(shù):122頁

時(shí)間:2019-05-25

貝葉斯網(wǎng)絡(luò)研究_第1頁
貝葉斯網(wǎng)絡(luò)研究_第2頁
貝葉斯網(wǎng)絡(luò)研究_第3頁
貝葉斯網(wǎng)絡(luò)研究_第4頁
貝葉斯網(wǎng)絡(luò)研究_第5頁
資源描述:

《貝葉斯網(wǎng)絡(luò)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、中國科學(xué)院計(jì)算技術(shù)研究所博士學(xué)位論文貝葉斯網(wǎng)絡(luò)研究姓名:黃友平申請(qǐng)學(xué)位級(jí)別:博士專業(yè):計(jì)算機(jī)軟件與理論指導(dǎo)教師:史忠植20050607摘要貝葉斯網(wǎng)絡(luò)是研究不確定性問題的重要方法之一.它基于概率和統(tǒng)計(jì)理論,具有堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)。由于具有自然的表達(dá)方式、強(qiáng)大的推理能力和方便的決策機(jī)制等許多優(yōu)點(diǎn),貝葉斯網(wǎng)絡(luò)在許多領(lǐng)域得到了廣泛的應(yīng)用.本文在貝葉斯網(wǎng)絡(luò)基礎(chǔ)理論框架的基礎(chǔ)上,主要研究了以下幾個(gè)方面的內(nèi)容:基于信息幾何理論的貝葉斯網(wǎng)絡(luò)研究、樸素貝葉斯分類器的提升、規(guī)則方法與貝葉斯網(wǎng)絡(luò)結(jié)合文本信息抽取研究、層次貝葉斯網(wǎng)絡(luò)文本分類器.本文的主要貢獻(xiàn)

2、如下:(1)分析了貝葉斯網(wǎng)絡(luò)這一特殊類型的概率分布簇所對(duì)應(yīng)的統(tǒng)計(jì)流形的特點(diǎn):由于貝葉斯網(wǎng)絡(luò)引入了條件獨(dú)立性,從而降低了流形的維度,簡化了統(tǒng)計(jì)流形上的Riemman度量矩陣。提出了基于信息幾何理論的不完備數(shù)據(jù)條件下貝葉斯網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)算法:貝葉斯網(wǎng)絡(luò)的自然梯度學(xué)習(xí)算法(NGBN).推導(dǎo)出了離散型、連續(xù)型、條件Gaussian網(wǎng)、父節(jié)點(diǎn)連續(xù)而子節(jié)點(diǎn)離散等不同的貝葉斯網(wǎng)絡(luò)類型其自然梯度的計(jì)算公式.通過理論分析和試驗(yàn),說明了自然梯度學(xué)習(xí)比歐式梯度學(xué)習(xí)更合理,更快速。(2)提出了一種通過在原有屬性的基礎(chǔ)上重新構(gòu)造屬性集,從而提高屬性問的條件

3、獨(dú)立性的方式來提高樸素貝葉斯分類器性能的新方法:基于Fisher分構(gòu)建樸素貝葉斯分類器(FS--NBC)。新屬性集的分量為貝葉斯網(wǎng)概率分布函數(shù)的對(duì)數(shù)對(duì)每個(gè)分布參數(shù)的偏微分。我們證明了在一定條件下,經(jīng)過Fisher分映射后得到的新屬性集是條件獨(dú)立的,并從理論上分析了對(duì)于無先驗(yàn)信息的多項(xiàng)分布和原屬性集已經(jīng)是條件獨(dú)立的情況下新屬性集的獨(dú)立性。試驗(yàn)表明該方法較好地提高了樸素貝葉斯分類器的性能.(3)提出了一種新的文本信息抽取算法:結(jié)合規(guī)則的動(dòng)態(tài)貝葉斯信息抽取網(wǎng)(RDBIEN).在半結(jié)構(gòu)化文本抽取任務(wù)中,主要有兩種技術(shù)手段:一種是基于規(guī)則的

4、方法,另一種是基于概率的方法?;谝?guī)則的方法是處理確定性問題的重要手段,它具有充分吸取專家經(jīng)驗(yàn)和更為直觀、更易于獲得的優(yōu)點(diǎn)。而基于概率的方法則更魯棒,性能更高。我們把規(guī)則方法與貝葉斯網(wǎng)絡(luò)相結(jié)合,既保持了概率方法的魯棒性等優(yōu)點(diǎn),又結(jié)合了規(guī)則方法在吸取專家經(jīng)驗(yàn)等方面的優(yōu)點(diǎn).試驗(yàn)表明該算法具有較高的抽取性能。(4)提出了基于主題詞樹的貝葉斯文本層次分類算法.對(duì)于Web文本分類問題,存在文本的類別數(shù)太多、相對(duì)獲得大量有標(biāo)注的訓(xùn)練數(shù)據(jù)成本較高、特征維數(shù)太高從而使模型訓(xùn)練非常復(fù)雜等難點(diǎn).本算法通過對(duì)同一主題詞的子主題詞的合并,有效地降低了文本

5、特征詞的維數(shù),強(qiáng)化了關(guān)鍵維的作用.此算法不僅降低了訓(xùn)練的復(fù)雜度,而且有效提高了樣本的質(zhì)量,降低了噪聲數(shù)據(jù)對(duì)分類的影響,從而可以在類別數(shù)太多而樣本數(shù)相對(duì)較少的情況下獲得較滿意的分類精度。關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);條件獨(dú)立關(guān)系:樸素貝葉斯分類器;動(dòng)態(tài)貝葉斯網(wǎng)絡(luò):信息幾何:統(tǒng)計(jì)流形;Riemman度量:Fisher信息矩陣:Fisher分;信息抽?。阂?guī)則方法;文本分類;主題詞樹;層次分類ResearchonBayesianNetworkHuungYouping(ComputerSoftware&Theory)DirectedByProfess

6、orShiZhongzhiAbstractBayesiannetwork(BN)isoneofthemostimportantmethodsofdealingwithuncertaintyproblems.Ithascompletemathematicsupportandisbasedontheprobabilisticandstatisticstheory.Becameofitsnaturalknowledgerepresentation,powerfulreasoningability,aswell勰convenientdec

7、ision-makingmechanism,itisappliedinmanydomainsnOW.AfterintroducingthetheoryframeworkofBayesiannetwork,thispapercarriedoutthefollowingresearch:researchingBayesiannetworkbasedoninformationgeometrytheory,improvingtheperformanceofnaiveBayesianclassificationfN-BC),retrievi

8、nginformationfromsemi-structuredtextusingrulesembeddeddynamicBayesiannetwork,andhierarchicaltextclassificationmodelbasedonBa

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。