基于核心集粗化的多層次聚類算法

基于核心集粗化的多層次聚類算法

ID:33904545

大小:2.40 MB

頁數(shù):49頁

時(shí)間:2019-02-28

基于核心集粗化的多層次聚類算法_第1頁
基于核心集粗化的多層次聚類算法_第2頁
基于核心集粗化的多層次聚類算法_第3頁
基于核心集粗化的多層次聚類算法_第4頁
基于核心集粗化的多層次聚類算法_第5頁
資源描述:

《基于核心集粗化的多層次聚類算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、中圖分類號:TP391論文編號:102870814-S011學(xué)科分類號:080202碩士學(xué)位論文基于核心集粗化的多層次聚類算法研究生姓名王萍學(xué)科、專業(yè)應(yīng)用數(shù)學(xué)研究方向模式識別指導(dǎo)教師馬儒寧副教授南京航空航天大學(xué)研究生院理學(xué)院二О一四年一月萬方數(shù)據(jù)NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofScienceMultilevelCore-setsCoarseningbasedClusteringAlgorithmAThesisinMathema

2、ticsbyWangPingAdvisedbyProf.MaRuningSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofScienceJanuary,2014萬方數(shù)據(jù)承諾書本人聲明所呈交的碩士學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果.除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得南京航空航天大學(xué)或其他教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料.本人授權(quán)南京航空航天大學(xué)可以將學(xué)位論文的全部或部

3、分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文.(保密的學(xué)位論文在解密后適用本承諾書)作者簽名:日期:萬方數(shù)據(jù)南京航空航天大學(xué)碩士學(xué)位論文摘要聚類分析是一種無監(jiān)督的學(xué)習(xí)方式,是海量數(shù)據(jù)分析的重要工具之一。對于同一數(shù)據(jù)集,使用不同的聚類算法產(chǎn)生的聚類結(jié)果也不同。至今,眾研究學(xué)者提出了各種各樣的聚類算法?;诙鄬哟慰蚣艿木垲愃惴ㄊ墙陙沓霈F(xiàn)的一類備受關(guān)注的聚類算法,能聚類大規(guī)模且任意形狀的數(shù)據(jù),經(jīng)典的算法有METIS,Graclus,F(xiàn)AP等。多層次聚類算法的步驟一般分為粗化、劃分、細(xì)化三部分,其中粗化

4、過程旨在逐層尋找每層數(shù)據(jù)集的代表點(diǎn),以獲得易于劃分的小規(guī)模數(shù)據(jù)集,顯然是多層次聚類框架的關(guān)鍵步驟。在METIS、Graclus等方法中,利用頂點(diǎn)和邊的權(quán)重的某些準(zhǔn)則合并頂點(diǎn)和邊,來實(shí)現(xiàn)粗化,其缺點(diǎn)是粗化之后的小規(guī)模數(shù)據(jù)集無法準(zhǔn)確表述原數(shù)據(jù)集的全局信息和結(jié)構(gòu)。為此,本文通過定義“多層核心集”,提出一種基于多層核心集的粗化算法,并建立了相應(yīng)的多層次聚類算法(MultilevelCore-setsCoarseningbasedClusteringAlgorithm)。基于多層核心集的粗化可以逐層保留數(shù)據(jù)集的全局信息,其最頂層核心點(diǎn)的個(gè)數(shù)與聚

5、類個(gè)數(shù)相同,每個(gè)核心點(diǎn)對應(yīng)了一個(gè)單獨(dú)的類,因此不需要經(jīng)典多層次聚類框架中的劃分過程,即可通過細(xì)化算法映射到原數(shù)據(jù)集,完成整個(gè)聚類過程。實(shí)驗(yàn)結(jié)果表明了本文提出算法的有效性。關(guān)鍵詞:多層,粗化,核心集,聚類I萬方數(shù)據(jù)基于核心集粗化的多層次聚類算法AbstractAsanimportantcomponentofunsupervisedpatternclassification,clusteringanalysishasbecomeanimportanttoolinmoderndataanalysis.Tothesamedataset,dif

6、ferentclusteringalgorithmsusuallygeneratedifferentresults.Sofar,manyresearchershasputforwardvariousclusteringalgorithms.Inrecentdecades,themultilevelframeworkbasedclusteringalgorithm,suchasMETIS,Graclusandsoon,hasattractedmuchattentionforthefactthatitcanbeappliedtoclust

7、erlarge-scaleandarbitraryshapedatasets.Suchapproachcanbedividedintothreesteps,includingcoarsening,initialpartitioningandrefinement.Thecoarseningphaseistoobtainsmalldatasetsthroughsearchingtherepresentativepointofdatasetlocatedineverylevel,forwhichitisthecriticalstepamon

8、gthemultilevelclusteringframework.InMETISandGraclus,thecoarseningprocedurecanbeinterpretedasaprocessofaggregat

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。