資源描述:
《樸素貝葉斯分類及其應(yīng)用研究.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、分類號(hào)UDC密級(jí)樸素貝葉斯分類及其應(yīng)用研究段晶指導(dǎo)教師魯明羽職稱學(xué)位授予單位大連海事大學(xué)教授申請(qǐng)學(xué)位級(jí)別工學(xué)碩士學(xué)科(專業(yè))計(jì)算機(jī)科學(xué)與技術(shù)論文完成日期2011-6—2答辯日期2011-7-2答辯委員會(huì)主席r一?大連海事大學(xué)學(xué)位論文原創(chuàng)性聲明和使用授權(quán)』!罌Y腳1腳8㈣95fI㈣5『fffIIl7fffIfl聊原創(chuàng)性聲明本人鄭重聲明:本論文是在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果,撰寫成博/碩士學(xué)位論文:查[丞貝吐塹坌差區(qū)墓座旦嬰究:。除論文中已經(jīng)注明引用的內(nèi)容外,對(duì)論文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本論文中不包含任何未加明確注明的其他個(gè)人或集體已經(jīng)公開發(fā)
2、表或未公開發(fā)表的成果。本聲明的法律責(zé)任由本人承擔(dān)。學(xué)位論文作者簽名:奎笙晶學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者及指導(dǎo)教師完全了解大連海事大學(xué)有關(guān)保留、使用研究生學(xué)位論文的規(guī)定,即:大連海事大學(xué)有權(quán)保留并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交學(xué)位論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)大連海事大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,也可采用影印、縮印或掃描等復(fù)制手段保存和匯編學(xué)位論文。同意將本學(xué)位論文收錄到《中國(guó)優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫(kù)》(中國(guó)學(xué)術(shù)期刊(光盤版)電子雜志社)、《中國(guó)學(xué)位論文全文數(shù)據(jù)庫(kù)》(中國(guó)科學(xué)技術(shù)信息研究所)等數(shù)據(jù)庫(kù)中,并以電子出版物形式出版發(fā)行和提供
3、信息服務(wù)。保密的論文在解密后遵守此規(guī)定。本學(xué)位論文屬于:保密口在——年解密后適用本授權(quán)書。不保密/(請(qǐng)?jiān)谝陨戏娇騼?nèi)打t‘√”)論文作者簽名:彩晶導(dǎo)師簽名:名叫丁刁日期:沙叩年.7月多日ResearchonNaiveBayesianClassificationanditsApplicationAthesisSubmittedtoDalianMaritimeUniversityInpartialfulfillmentoftherequirementsforthedegreeofMasterofEngineeringbyDuanJing(ComputerScienceandTechnology)
4、ThesisSupervisor:ProfessorLuMingyuJuly2011中文摘要摘要樸素貝葉斯是數(shù)據(jù)挖掘領(lǐng)域重要的分類算法之一,與其它方法相比,樸素貝葉斯方法具有算法簡(jiǎn)單、分類效果穩(wěn)定和速度快等特點(diǎn)。樸素貝葉斯模型一般假設(shè)屬性之間相互獨(dú)立,然而這個(gè)假設(shè)在實(shí)際應(yīng)用中往往是不成立的,這給樸素貝葉斯模型的分類性能帶來(lái)一定影響。對(duì)此,現(xiàn)有大量研究工作試圖通過(guò)放松屬性間的獨(dú)立性假設(shè)來(lái)提高樸素貝葉斯分類的性能,主要可以分為結(jié)構(gòu)擴(kuò)展、局部學(xué)習(xí)、屬性選擇和屬性加權(quán)。本文重點(diǎn)從結(jié)構(gòu)擴(kuò)展和屬性加權(quán)兩個(gè)方面改進(jìn)樸素貝葉斯分類模型。具體研究工作包括:·1)結(jié)構(gòu)擴(kuò)展方面:采用關(guān)聯(lián)規(guī)則中的頻繁項(xiàng)集來(lái)體現(xiàn)多
5、屬性之間的關(guān)聯(lián)性,從而避免了強(qiáng)屬性集的選擇過(guò)程,并構(gòu)造了一種雙層貝葉斯結(jié)構(gòu);針對(duì)基于頻繁項(xiàng)集的貝葉斯分類算法(FISC)存在的概率估計(jì)方式粗糙和分類器集成過(guò)于簡(jiǎn)單的缺點(diǎn),分別提出了基于M.估計(jì)的貝葉斯分類算法(FISC—M)和加權(quán)集成的貝葉斯分類算法(wFIsC);為解決FISC時(shí)間開銷較大的問(wèn)題,提出了項(xiàng)集長(zhǎng)度約束條件,在保證分類精度的前提下縮短了算法的運(yùn)行時(shí)間,進(jìn)一步提升了FISC—M和WFISC的性能。實(shí)驗(yàn)結(jié)果表明,F(xiàn)ISC.M與WFISC的性能大大超越了原始的FISC,并且優(yōu)于目前性能較優(yōu)的一些貝葉斯分類算法。2)屬性加權(quán)方面:將變精度粗糙集理論應(yīng)用到貝葉斯分類算法中,提出了一種基
6、于變精度粗糙集的屬性加權(quán)樸素貝葉斯分類算法(AwNB.vPRS)。該算法采用變精度粗糙集方法來(lái)確定屬性的重要程度,綜合考慮了屬性的加權(quán)近似精度和屬性的信息增益。實(shí)驗(yàn)結(jié)果表明AWNB.VPRS模型在許多領(lǐng)域比基于傳統(tǒng)粗糙集的貝葉斯分類模型更有效。3)實(shí)際應(yīng)用方面:將所提算法應(yīng)用于冠心病中醫(yī)診療臨床規(guī)律的分析挖掘中,建立了冠心病中醫(yī)辨證診斷模型,在一定程度上進(jìn)一步驗(yàn)證了算法的有效性。關(guān)鍵詞:分類算法;樸素貝葉斯;頻繁項(xiàng)集;變精度粗糙集;冠心病中醫(yī)診療ABSTRACTNaheBayes(NB)isoneofthemostimportantclassificationalgorithmsindat
7、amining.IthasmaIlyfeatherssuchassimple,fastandstablecomparedtoothermethods·NBhasastrongindependenceassumptionbetweenpredictiveattributesglVentheclassvaluewhichwouldhaHnitsperformanceasinmanyrealapplicationsthecon