基于hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)

基于hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)

ID:33506132

大?。?.91 MB

頁數(shù):63頁

時間:2019-02-26

基于hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)_第1頁
基于hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)_第2頁
基于hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)_第3頁
基于hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)_第4頁
基于hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)_第5頁
資源描述:

《基于hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。

1、分類號密級UDC編號10736碩士學位論文基于Hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)研究生姓名:林紀坡指導教師姓名、職稱:杜小妮教授專業(yè)名稱:軟件工程研究方向:信息安全二零一三年五月DesignandImplementionofhighperformancetextclusteringalgorithmBasiconHadoopLinJiPo西北師范大學研究生學位論文作者信息論文題目基于Hadoop的高性能文本聚類算法的設(shè)計與實現(xiàn)姓名林紀坡學號2011221171專業(yè)名稱軟件工程答辯日期2013-5-25聯(lián)系電話15136217986E_ma

2、illinjipo@gmail.com通信地址(郵編):甘肅省蘭州市西北師范大學計算機科學與工程學院(730070)備注:目錄摘要...............................................................IAbstract..........................................................II1緒論.............................................................11.1課題的研究背景和意義..

3、.......................................11.2課題研究的動機和目的.........................................21.3論文的主要內(nèi)容...............................................31.4論文的組織和結(jié)構(gòu).............................................32文本聚類算法綜述.................................................52.1聚類的定義

4、...................................................52.2聚類算法的性能要求...........................................52.3文本聚類及其一般流程.........................................62.4文本聚類相關(guān)技術(shù).............................................72.4.1中文分詞...............................................7

5、2.4.2文本表示...............................................82.4.3文本相似度計算.........................................92.4.4類間距離度量..........................................102.5文本聚類算法................................................102.5.1基于劃分的聚類算法....................................11

6、2.5.2基于層次的聚類算法....................................112.5.3基于密度的聚類算法....................................122.5.4基于網(wǎng)格的聚類算法....................................132.5.5基于模型的聚類算法....................................132.6本章小結(jié)...................................................143Hadoop平臺

7、概述..................................................153.1云計算平臺概述..............................................153.2分布式系統(tǒng)概述..............................................153.3Hadoop分布式系統(tǒng)...........................................153.4Hadoop總體架構(gòu)...................................

8、..........163.5Hadoop分布式文件系統(tǒng)—HDFS............................

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。