資源描述:
《基于hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、分類號密級UDC編號10736碩士學位論文基于Hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)研究生姓名:林紀坡指導教師姓名、職稱:杜小妮教授專業(yè)名稱:軟件工程研究方向:信息安全二零一三年五月DesignandImplementionofhighperformancetextclusteringalgorithmBasiconHadoopLinJiPo西北師范大學研究生學位論文作者信息論文題目基于Hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)姓名林紀坡學號2011221171專業(yè)名稱軟件工程答辯日期2013-5-25聯(lián)系電話15136217986E_ma
2、illinjipo@gmail.com通信地址(郵編):甘肅省蘭州市西北師范大學計算機科學與工程學院(730070)備注:目錄摘要...............................................................IAbstract..........................................................II1緒論.............................................................11.1課題的研究背景和意義..
3、.......................................11.2課題研究的動機和目的.........................................21.3論文的主要內(nèi)容...............................................31.4論文的組織和結(jié)構(gòu).............................................32文本聚類算法綜述.................................................52.1聚類的定義
4、...................................................52.2聚類算法的性能要求...........................................52.3文本聚類及其一般流程.........................................62.4文本聚類相關(guān)技術(shù).............................................72.4.1中文分詞...............................................7
5、2.4.2文本表示...............................................82.4.3文本相似度計算.........................................92.4.4類間距離度量..........................................102.5文本聚類算法................................................102.5.1基于劃分的聚類算法....................................11
6、2.5.2基于層次的聚類算法....................................112.5.3基于密度的聚類算法....................................122.5.4基于網(wǎng)格的聚類算法....................................132.5.5基于模型的聚類算法....................................132.6本章小結(jié)...................................................143Hadoop平臺
7、概述..................................................153.1云計算平臺概述..............................................153.2分布式系統(tǒng)概述..............................................153.3Hadoop分布式系統(tǒng)...........................................153.4Hadoop總體架構(gòu)...................................
8、..........163.5Hadoop分布式文件系統(tǒng)—HDFS............................