資源描述:
《貝葉斯網(wǎng)絡(luò)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、中國科學(xué)院計(jì)算技術(shù)研究所博士學(xué)位論文貝葉斯網(wǎng)絡(luò)研究姓名:黃友平申請(qǐng)學(xué)位級(jí)別:博士專業(yè):計(jì)算機(jī)軟件與理論指導(dǎo)教師:史忠植20050607摘要貝葉斯網(wǎng)絡(luò)是研究不確定性問題的重要方法之一.它基于概率和統(tǒng)計(jì)理論,具有堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)。由于具有自然的表達(dá)方式、強(qiáng)大的推理能力和方便的決策機(jī)制等許多優(yōu)點(diǎn),貝葉斯網(wǎng)絡(luò)在許多領(lǐng)域得到了廣泛的應(yīng)用.本文在貝葉斯網(wǎng)絡(luò)基礎(chǔ)理論框架的基礎(chǔ)上,主要研究了以下幾個(gè)方面的內(nèi)容:基于信息幾何理論的貝葉斯網(wǎng)絡(luò)研究、樸素貝葉斯分類器的提升、規(guī)則方法與貝葉斯網(wǎng)絡(luò)結(jié)合文本信息抽取研究、層次貝葉斯網(wǎng)絡(luò)文本分類器.本文的主要貢獻(xiàn)
2、如下:(1)分析了貝葉斯網(wǎng)絡(luò)這一特殊類型的概率分布簇所對(duì)應(yīng)的統(tǒng)計(jì)流形的特點(diǎn):由于貝葉斯網(wǎng)絡(luò)引入了條件獨(dú)立性,從而降低了流形的維度,簡化了統(tǒng)計(jì)流形上的Riemman度量矩陣。提出了基于信息幾何理論的不完備數(shù)據(jù)條件下貝葉斯網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)算法:貝葉斯網(wǎng)絡(luò)的自然梯度學(xué)習(xí)算法(NGBN).推導(dǎo)出了離散型、連續(xù)型、條件Gaussian網(wǎng)、父節(jié)點(diǎn)連續(xù)而子節(jié)點(diǎn)離散等不同的貝葉斯網(wǎng)絡(luò)類型其自然梯度的計(jì)算公式.通過理論分析和試驗(yàn),說明了自然梯度學(xué)習(xí)比歐式梯度學(xué)習(xí)更合理,更快速。(2)提出了一種通過在原有屬性的基礎(chǔ)上重新構(gòu)造屬性集,從而提高屬性問的條件
3、獨(dú)立性的方式來提高樸素貝葉斯分類器性能的新方法:基于Fisher分構(gòu)建樸素貝葉斯分類器(FS--NBC)。新屬性集的分量為貝葉斯網(wǎng)概率分布函數(shù)的對(duì)數(shù)對(duì)每個(gè)分布參數(shù)的偏微分。我們證明了在一定條件下,經(jīng)過Fisher分映射后得到的新屬性集是條件獨(dú)立的,并從理論上分析了對(duì)于無先驗(yàn)信息的多項(xiàng)分布和原屬性集已經(jīng)是條件獨(dú)立的情況下新屬性集的獨(dú)立性。試驗(yàn)表明該方法較好地提高了樸素貝葉斯分類器的性能.(3)提出了一種新的文本信息抽取算法:結(jié)合規(guī)則的動(dòng)態(tài)貝葉斯信息抽取網(wǎng)(RDBIEN).在半結(jié)構(gòu)化文本抽取任務(wù)中,主要有兩種技術(shù)手段:一種是基于規(guī)則的
4、方法,另一種是基于概率的方法?;谝?guī)則的方法是處理確定性問題的重要手段,它具有充分吸取專家經(jīng)驗(yàn)和更為直觀、更易于獲得的優(yōu)點(diǎn)。而基于概率的方法則更魯棒,性能更高。我們把規(guī)則方法與貝葉斯網(wǎng)絡(luò)相結(jié)合,既保持了概率方法的魯棒性等優(yōu)點(diǎn),又結(jié)合了規(guī)則方法在吸取專家經(jīng)驗(yàn)等方面的優(yōu)點(diǎn).試驗(yàn)表明該算法具有較高的抽取性能。(4)提出了基于主題詞樹的貝葉斯文本層次分類算法.對(duì)于Web文本分類問題,存在文本的類別數(shù)太多、相對(duì)獲得大量有標(biāo)注的訓(xùn)練數(shù)據(jù)成本較高、特征維數(shù)太高從而使模型訓(xùn)練非常復(fù)雜等難點(diǎn).本算法通過對(duì)同一主題詞的子主題詞的合并,有效地降低了文本
5、特征詞的維數(shù),強(qiáng)化了關(guān)鍵維的作用.此算法不僅降低了訓(xùn)練的復(fù)雜度,而且有效提高了樣本的質(zhì)量,降低了噪聲數(shù)據(jù)對(duì)分類的影響,從而可以在類別數(shù)太多而樣本數(shù)相對(duì)較少的情況下獲得較滿意的分類精度。關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);條件獨(dú)立關(guān)系:樸素貝葉斯分類器;動(dòng)態(tài)貝葉斯網(wǎng)絡(luò):信息幾何:統(tǒng)計(jì)流形;Riemman度量:Fisher信息矩陣:Fisher分;信息抽?。阂?guī)則方法;文本分類;主題詞樹;層次分類ResearchonBayesianNetworkHuungYouping(ComputerSoftware&Theory)DirectedByProfess
6、orShiZhongzhiAbstractBayesiannetwork(BN)isoneofthemostimportantmethodsofdealingwithuncertaintyproblems.Ithascompletemathematicsupportandisbasedontheprobabilisticandstatisticstheory.Becameofitsnaturalknowledgerepresentation,powerfulreasoningability,aswell勰convenientdec
7、ision-makingmechanism,itisappliedinmanydomainsnOW.AfterintroducingthetheoryframeworkofBayesiannetwork,thispapercarriedoutthefollowingresearch:researchingBayesiannetworkbasedoninformationgeometrytheory,improvingtheperformanceofnaiveBayesianclassificationfN-BC),retrievi
8、nginformationfromsemi-structuredtextusingrulesembeddeddynamicBayesiannetwork,andhierarchicaltextclassificationmodelbasedonBa