資源描述:
《樸素貝葉斯分類算法的改進(jìn)及其應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、分類號(hào)盡公UDC\m卷敬thesis享恆巧又牛h素貝葉斯分類算法的改進(jìn)及其應(yīng)用(中文題名)民.esearchonImprovingNaiveBayesClassifiersanditsAlicationpp(英文題名)喻凱西(作者姓名)指導(dǎo)教師李刀I副教才受.碩±申請(qǐng)學(xué)位級(jí)別統(tǒng)計(jì)學(xué)學(xué)科專業(yè)名稱應(yīng)臟計(jì)研究方向誦年論文提交日期論文答辯屬年6月日期學(xué)位授予日期答辯委員會(huì)主席:評(píng)閱人:化素襪A大學(xué)獨(dú)創(chuàng)性聲明
2、……本人聲明所呈交的論文是我個(gè)人在導(dǎo)師指導(dǎo)下(或我個(gè)人)進(jìn)行的研究工作及取得的研究成果。盡我所知,陳了文中特別加W標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得北京林業(yè)大學(xué)一或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均己在論文中作了明確的說明并表示了謝意。i如.p聳/V欣IpI.簽名日期::秦葉關(guān)于論文使用授權(quán)的說明:本人完全了解北京化業(yè)大學(xué)有關(guān)保留,即學(xué)校有權(quán)、使用學(xué)位論文的規(guī)定保留送交論文的復(fù)印件,
3、允許論文被査閱和借閱;學(xué)??桑坠颊撐牡娜炕虿浚崳?、。分內(nèi)容,可W采用影印縮印或其他復(fù)制手段保存論文保密的論文在解密后應(yīng)進(jìn)守此規(guī)定)(本曰期tA’化簽名:導(dǎo)師簽名::、?摘要一分類能力是人類在社會(huì)活動(dòng)中最重要而基本的能力之,分類技術(shù)是數(shù)據(jù)挖一掘領(lǐng)域研巧的項(xiàng)核也內(nèi)容。樸素貝葉斯分類算法W完善的理論體系、清晰簡(jiǎn)單的星形結(jié)構(gòu)、良好的適應(yīng)能力和較高的分類正確率而聞名,但其前提假設(shè)在現(xiàn)實(shí)一運(yùn)用中往往無法成立。為了解決這問題并提高算法性能,本文W樸素貝葉斯分類算法為基礎(chǔ),研究現(xiàn)有的屬
4、性加權(quán)樸素貝葉斯算法,并考慮了實(shí)際應(yīng)用中數(shù)據(jù)-類型對(duì)分類算法的影響,提出了基于Tauy相關(guān)系數(shù)的加權(quán)樸素貝葉斯分類算法和基于KendaTll相關(guān)系數(shù)的加權(quán)樸素貝葉斯分類算法。.具體研究工作如下:-(1)通過研究樸素貝葉斯分類算法及其各種改進(jìn)算法,提出了基于Tauy相關(guān)系數(shù)的加權(quán)樸素貝葉斯分類算法au-通過實(shí)驗(yàn)檢驗(yàn),WTy系數(shù)確定權(quán)值,并,其分類性能,新改進(jìn)算法能有效的提高分類效率特別是在樣本總量較小的數(shù)據(jù)集中展現(xiàn)了良好的分類效果。(2),為了更好的提取數(shù)據(jù)中的有用信息解決實(shí)際中
5、的某些特殊問題,引TKlT入非參數(shù)統(tǒng)計(jì)中的Kendall相關(guān)系數(shù),提出了基于endal相關(guān)系數(shù)的加權(quán)樸素巧葉斯分類算法,實(shí)驗(yàn)結(jié)果顯示該算法能獲得較高的分類正確率,且在類標(biāo)記數(shù)量較多的數(shù)據(jù)中性能更佳。一(3)對(duì)新算法在銀行個(gè)人客戶分類這實(shí)際問題中的應(yīng)用進(jìn)行了研究,在一一定程度上進(jìn)步驗(yàn)證了新算法的性能。關(guān)鍵詞:分類算法;樸素貝葉斯;權(quán)值;相關(guān)系數(shù)IAbductResearchonImrovinNaiveBaesClassifiersanditspgyAUca村
6、onppMasterCandidate:YuKaixiStatistics)DirectedbyLiChuanABSTRACTClassi丘catio打abUitisoneofthemostimortantandbasicabilitinhumansocialactivitiesy,pytheclassificatio打algorithmhasbecome過coreconte打tofdatamining.NaiveBayesi
7、anCla巧ifierlleisfamousforitserfecttheorsstemearandsimstructureexcellentadatabilitandhihpyy,cp,pyg^cassicaccuracueaormcanuweinraccaacaionnsomecondiliftionay,btthlgithtsitllptilpplitiitons.Tosolvethisroblemandimrove化eerfor
8、manceofthealorithminthisaerthe仿searchispppg,pp,basedonNaiveBayesianClassifieralgorithm,bystudyingallkindsofAttributeWeightedNaiveBaesaasieconsdernlceacoheaael