資源描述:
《基于核心集粗化的多層次聚類算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、中圖分類號:TP391論文編號:102870814-S011學(xué)科分類號:080202碩士學(xué)位論文基于核心集粗化的多層次聚類算法研究生姓名王萍學(xué)科、專業(yè)應(yīng)用數(shù)學(xué)研究方向模式識別指導(dǎo)教師馬儒寧副教授南京航空航天大學(xué)研究生院理學(xué)院二О一四年一月萬方數(shù)據(jù)NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofScienceMultilevelCore-setsCoarseningbasedClusteringAlgorithmAThesisinMathema
2、ticsbyWangPingAdvisedbyProf.MaRuningSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofScienceJanuary,2014萬方數(shù)據(jù)承諾書本人聲明所呈交的碩士學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果.除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得南京航空航天大學(xué)或其他教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料.本人授權(quán)南京航空航天大學(xué)可以將學(xué)位論文的全部或部
3、分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文.(保密的學(xué)位論文在解密后適用本承諾書)作者簽名:日期:萬方數(shù)據(jù)南京航空航天大學(xué)碩士學(xué)位論文摘要聚類分析是一種無監(jiān)督的學(xué)習(xí)方式,是海量數(shù)據(jù)分析的重要工具之一。對于同一數(shù)據(jù)集,使用不同的聚類算法產(chǎn)生的聚類結(jié)果也不同。至今,眾研究學(xué)者提出了各種各樣的聚類算法?;诙鄬哟慰蚣艿木垲愃惴ㄊ墙陙沓霈F(xiàn)的一類備受關(guān)注的聚類算法,能聚類大規(guī)模且任意形狀的數(shù)據(jù),經(jīng)典的算法有METIS,Graclus,F(xiàn)AP等。多層次聚類算法的步驟一般分為粗化、劃分、細(xì)化三部分,其中粗化
4、過程旨在逐層尋找每層數(shù)據(jù)集的代表點(diǎn),以獲得易于劃分的小規(guī)模數(shù)據(jù)集,顯然是多層次聚類框架的關(guān)鍵步驟。在METIS、Graclus等方法中,利用頂點(diǎn)和邊的權(quán)重的某些準(zhǔn)則合并頂點(diǎn)和邊,來實(shí)現(xiàn)粗化,其缺點(diǎn)是粗化之后的小規(guī)模數(shù)據(jù)集無法準(zhǔn)確表述原數(shù)據(jù)集的全局信息和結(jié)構(gòu)。為此,本文通過定義“多層核心集”,提出一種基于多層核心集的粗化算法,并建立了相應(yīng)的多層次聚類算法(MultilevelCore-setsCoarseningbasedClusteringAlgorithm)。基于多層核心集的粗化可以逐層保留數(shù)據(jù)集的全局信息,其最頂層核心點(diǎn)的個(gè)數(shù)與聚
5、類個(gè)數(shù)相同,每個(gè)核心點(diǎn)對應(yīng)了一個(gè)單獨(dú)的類,因此不需要經(jīng)典多層次聚類框架中的劃分過程,即可通過細(xì)化算法映射到原數(shù)據(jù)集,完成整個(gè)聚類過程。實(shí)驗(yàn)結(jié)果表明了本文提出算法的有效性。關(guān)鍵詞:多層,粗化,核心集,聚類I萬方數(shù)據(jù)基于核心集粗化的多層次聚類算法AbstractAsanimportantcomponentofunsupervisedpatternclassification,clusteringanalysishasbecomeanimportanttoolinmoderndataanalysis.Tothesamedataset,dif
6、ferentclusteringalgorithmsusuallygeneratedifferentresults.Sofar,manyresearchershasputforwardvariousclusteringalgorithms.Inrecentdecades,themultilevelframeworkbasedclusteringalgorithm,suchasMETIS,Graclusandsoon,hasattractedmuchattentionforthefactthatitcanbeappliedtoclust
7、erlarge-scaleandarbitraryshapedatasets.Suchapproachcanbedividedintothreesteps,includingcoarsening,initialpartitioningandrefinement.Thecoarseningphaseistoobtainsmalldatasetsthroughsearchingtherepresentativepointofdatasetlocatedineverylevel,forwhichitisthecriticalstepamon
8、gthemultilevelclusteringframework.InMETISandGraclus,thecoarseningprocedurecanbeinterpretedasaprocessofaggregat