樸素貝葉斯分類及其應(yīng)用研究.pdf

樸素貝葉斯分類及其應(yīng)用研究.pdf

ID:57745851

大小:2.62 MB

頁數(shù):80頁

時間:2020-03-27

樸素貝葉斯分類及其應(yīng)用研究.pdf_第1頁
樸素貝葉斯分類及其應(yīng)用研究.pdf_第2頁
樸素貝葉斯分類及其應(yīng)用研究.pdf_第3頁
樸素貝葉斯分類及其應(yīng)用研究.pdf_第4頁
樸素貝葉斯分類及其應(yīng)用研究.pdf_第5頁
資源描述:

《樸素貝葉斯分類及其應(yīng)用研究.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、分類號UDC密級樸素貝葉斯分類及其應(yīng)用研究段晶指導(dǎo)教師魯明羽職稱學(xué)位授予單位大連海事大學(xué)教授申請學(xué)位級別工學(xué)碩士學(xué)科(專業(yè))計算機(jī)科學(xué)與技術(shù)論文完成日期2011-6—2答辯日期2011-7-2答辯委員會主席r一?大連海事大學(xué)學(xué)位論文原創(chuàng)性聲明和使用授權(quán)』!罌Y腳1腳8㈣95fI㈣5『fffIIl7fffIfl聊原創(chuàng)性聲明本人鄭重聲明:本論文是在導(dǎo)師的指導(dǎo)下,獨立進(jìn)行研究工作所取得的成果,撰寫成博/碩士學(xué)位論文:查[丞貝吐塹坌差區(qū)墓座旦嬰究:。除論文中已經(jīng)注明引用的內(nèi)容外,對論文的研究做出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。本論文中不包含任何未加明確注明的其他個人或集體已經(jīng)公開發(fā)

2、表或未公開發(fā)表的成果。本聲明的法律責(zé)任由本人承擔(dān)。學(xué)位論文作者簽名:奎笙晶學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者及指導(dǎo)教師完全了解大連海事大學(xué)有關(guān)保留、使用研究生學(xué)位論文的規(guī)定,即:大連海事大學(xué)有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交學(xué)位論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)大連海事大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,也可采用影印、縮印或掃描等復(fù)制手段保存和匯編學(xué)位論文。同意將本學(xué)位論文收錄到《中國優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫》(中國學(xué)術(shù)期刊(光盤版)電子雜志社)、《中國學(xué)位論文全文數(shù)據(jù)庫》(中國科學(xué)技術(shù)信息研究所)等數(shù)據(jù)庫中,并以電子出版物形式出版發(fā)行和提供

3、信息服務(wù)。保密的論文在解密后遵守此規(guī)定。本學(xué)位論文屬于:保密口在——年解密后適用本授權(quán)書。不保密/(請在以上方框內(nèi)打t‘√”)論文作者簽名:彩晶導(dǎo)師簽名:名叫丁刁日期:沙叩年.7月多日ResearchonNaiveBayesianClassificationanditsApplicationAthesisSubmittedtoDalianMaritimeUniversityInpartialfulfillmentoftherequirementsforthedegreeofMasterofEngineeringbyDuanJing(ComputerScienceandTechnology)

4、ThesisSupervisor:ProfessorLuMingyuJuly2011中文摘要摘要樸素貝葉斯是數(shù)據(jù)挖掘領(lǐng)域重要的分類算法之一,與其它方法相比,樸素貝葉斯方法具有算法簡單、分類效果穩(wěn)定和速度快等特點。樸素貝葉斯模型一般假設(shè)屬性之間相互獨立,然而這個假設(shè)在實際應(yīng)用中往往是不成立的,這給樸素貝葉斯模型的分類性能帶來一定影響。對此,現(xiàn)有大量研究工作試圖通過放松屬性間的獨立性假設(shè)來提高樸素貝葉斯分類的性能,主要可以分為結(jié)構(gòu)擴(kuò)展、局部學(xué)習(xí)、屬性選擇和屬性加權(quán)。本文重點從結(jié)構(gòu)擴(kuò)展和屬性加權(quán)兩個方面改進(jìn)樸素貝葉斯分類模型。具體研究工作包括:·1)結(jié)構(gòu)擴(kuò)展方面:采用關(guān)聯(lián)規(guī)則中的頻繁項集來體現(xiàn)多

5、屬性之間的關(guān)聯(lián)性,從而避免了強(qiáng)屬性集的選擇過程,并構(gòu)造了一種雙層貝葉斯結(jié)構(gòu);針對基于頻繁項集的貝葉斯分類算法(FISC)存在的概率估計方式粗糙和分類器集成過于簡單的缺點,分別提出了基于M.估計的貝葉斯分類算法(FISC—M)和加權(quán)集成的貝葉斯分類算法(wFIsC);為解決FISC時間開銷較大的問題,提出了項集長度約束條件,在保證分類精度的前提下縮短了算法的運行時間,進(jìn)一步提升了FISC—M和WFISC的性能。實驗結(jié)果表明,F(xiàn)ISC.M與WFISC的性能大大超越了原始的FISC,并且優(yōu)于目前性能較優(yōu)的一些貝葉斯分類算法。2)屬性加權(quán)方面:將變精度粗糙集理論應(yīng)用到貝葉斯分類算法中,提出了一種基

6、于變精度粗糙集的屬性加權(quán)樸素貝葉斯分類算法(AwNB.vPRS)。該算法采用變精度粗糙集方法來確定屬性的重要程度,綜合考慮了屬性的加權(quán)近似精度和屬性的信息增益。實驗結(jié)果表明AWNB.VPRS模型在許多領(lǐng)域比基于傳統(tǒng)粗糙集的貝葉斯分類模型更有效。3)實際應(yīng)用方面:將所提算法應(yīng)用于冠心病中醫(yī)診療臨床規(guī)律的分析挖掘中,建立了冠心病中醫(yī)辨證診斷模型,在一定程度上進(jìn)一步驗證了算法的有效性。關(guān)鍵詞:分類算法;樸素貝葉斯;頻繁項集;變精度粗糙集;冠心病中醫(yī)診療ABSTRACTNaheBayes(NB)isoneofthemostimportantclassificationalgorithmsindat

7、amining.IthasmaIlyfeatherssuchassimple,fastandstablecomparedtoothermethods·NBhasastrongindependenceassumptionbetweenpredictiveattributesglVentheclassvaluewhichwouldhaHnitsperformanceasinmanyrealapplicationsthecon

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。