資源描述:
《面向中文資訊文本的分類算法研究及應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、■■>>--ri.'蠢s分類號(hào);TP39.單位代碼;10361姜獲巧玉乂學(xué)?ANHUIUNIVERSITYOFSCIENCE*TECHNOLOGYCPiF論文題目:面向中文資訊文本的分類算貓巧究及應(yīng)用作者姓名;洪宏專業(yè)名稱:詩(shī)算機(jī)技術(shù)導(dǎo)師姓名:吳明降教授完成時(shí)間—:二〇六年六月;TP39論文編號(hào):中圖分類號(hào)學(xué)科分類號(hào):520密級(jí):公開(kāi)安徽理王大學(xué)碩去學(xué)位論文面向中文資訊文本的分類算法研究及應(yīng)用作者姓名:洪
2、宏專業(yè)名稱:計(jì)算機(jī)巧乂研巧方向:信息智能導(dǎo)師姓名:吳明陣教巧導(dǎo)師單位:浙江大學(xué)城市學(xué)院答辯委員會(huì)主席:何留進(jìn)論文答辯日巧:20化年6月4日安巧理工大學(xué)研巧生處201k年k月4日ADissertationinComputertechnologyResearchandapplicationoftextclassificationalgorithmforChineseinformationCandidate:HonHonggSuperviso
3、rWuMinghuiSchoolofComputerscienceandengineeringAnHuiUniversityofScienceandTechnologyNo.168,ShungengRoad,Huainan,232001,P.R.CHINA獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加W標(biāo)注和致謝的地方W外,論文中不包含其他人己經(jīng)發(fā)表或撰寫(xiě)過(guò)的研究成果,也不包含為獲得安徽理工大學(xué)或
4、其他教育機(jī)構(gòu)的學(xué)化或化書(shū)而傳用過(guò)的材料一。與我同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均己在論文中作了明確的說(shuō)明并表示謝意。學(xué)位論文作者簽名:恭房.日期:W!占年b月日_^學(xué)位論文版權(quán)使用授權(quán)書(shū)未學(xué)位論文作者完全了解安徽理工大學(xué)有化留、使用學(xué)位論文的規(guī)定,即:研究生在校攻讀學(xué)位期間論文工作的知識(shí)產(chǎn)權(quán)單位屬于安徽理工大學(xué)。學(xué)校有權(quán)保留并向國(guó)家有關(guān)部口或機(jī)構(gòu)送交論文的復(fù)印件和磁盤(pán),允許論文被查閱和借閱。本人授權(quán)安徽理工大學(xué)可W將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可L乂采用影印
5、、縮印或擔(dān)描等復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后適用本授權(quán)書(shū))學(xué)位論文作者簽名:來(lái)孩簽字日期:年t月i日導(dǎo)師簽名:簽字日期:年&月b日安徽理工大學(xué)碩±學(xué)位論文摘要摘要在信息W及科技高速發(fā)展的今天,互聯(lián)網(wǎng)己經(jīng)成為正常的工作和生活中不可缺少的部分,由于每時(shí)毎刻都會(huì)產(chǎn)生來(lái)自各個(gè)領(lǐng)域的,紛繁復(fù)雜的新聞信息、圖。片W及視頻信息等等,這些數(shù)據(jù)正呈現(xiàn)著飛速的增長(zhǎng)狀態(tài)如何在繁雜的信息資一源中尋找自己需要的,把它們分口別類的歸置好,己經(jīng)成為當(dāng)今研究的個(gè)熱口。本文是面向中文資訊文本
6、的分類實(shí)法的研巧及應(yīng)用,首先,就要了解送些分類算法,在本文中,主要介紹并實(shí)現(xiàn)了幾種算法,包括樸素貝葉斯分類算法、K最鄰近分類算法W及支持向量機(jī)分類算法,在此之前就有很多來(lái)自不同學(xué)科的人。們對(duì)這些算法進(jìn)行了各式各樣的探索和研巧,也應(yīng)用在不同的環(huán)境模式中本文通過(guò)研巧和分析送幾種算法的數(shù)學(xué)原理,然后再與本文的環(huán)境所結(jié)合,最終使得送幾種算法都能夠很好的適用于本文中對(duì)于資訊文本的分類。同時(shí)還對(duì)樸素貝葉斯分類算法進(jìn)行了增加關(guān)聯(lián)規(guī)則和屬性簡(jiǎn)約的方式來(lái)改進(jìn)其分類的準(zhǔn)確率,經(jīng)過(guò)實(shí)驗(yàn)證明,該算法在本文所對(duì)應(yīng)的模型下
7、,提高了對(duì)本文中中文文本分類的準(zhǔn)確率。一本文所研巧的環(huán)境是款名為圓澄高考的手機(jī)APP,這款手機(jī)APP是可家長(zhǎng)或者考生的身份來(lái)做高考方面的相關(guān)咨詢,還可W查看各個(gè)城市的各個(gè)學(xué)校一一在不同的年份中的高考分?jǐn)?shù)線等等方面的信息。而在其中有資訊這欄,這欄一些相應(yīng)的資訊一個(gè)新就是,其中有報(bào)考、就業(yè)、留學(xué)和校園幾個(gè)部分。如何把聞或者文本資訊按照內(nèi)容分到相應(yīng)的類中去,由于每天可能會(huì)有成千上萬(wàn)的數(shù)據(jù),,那樣的工作量會(huì)非常大如果單憑手工去分類,幾乎也是不可能的,所W采用自動(dòng)分類的算法來(lái)代替繁瑣的人工操作,這樣不
8、僅減少人力,物力,也能提高效率。圖[7]表凹參[54]關(guān)鍵詞:貝葉斯分類巧法,K最鄰近分類算法,支持向量機(jī)算法,關(guān)聯(lián)規(guī)則,屬性簡(jiǎn)約—.分類號(hào);2):〇-I-安徽理工大學(xué)碩±學(xué)位論文AbstractAbstract’h虹todasinformatio凸aswel