資源描述:
《基于流形距離核的譜聚類算法研究及其應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、哈爾濱工程大學(xué)碩士學(xué)位論文基于流形距離核的譜聚類算法研究及其應(yīng)用姓名:宋少宇申請學(xué)位級別:碩士專業(yè):信號與信息處理指導(dǎo)教師:陶新民2012-03-14基于流形距離核的譜聚類算法研究及其應(yīng)用摘要近些年來,譜聚類:章法在模式識別中獲得了廣泛的應(yīng)用,是目前較為流行的聚類分析方法之一。譜聚類算法是以譜圖理論為基礎(chǔ)的,與之前人們所熟知的聚類方法相比,其克服了傳統(tǒng)聚類算法只能在凸圖形上聚類的缺點,除此之外該算法具有收斂到全局最優(yōu)解的優(yōu)點。譜聚類算法首先是對相似矩陣進行特征分解,將得到的特征向量構(gòu)造成新的簡化的數(shù)據(jù)空間,即降低了數(shù)據(jù)維度又使待聚類的原數(shù)據(jù)在子空間
2、中的分布結(jié)構(gòu)更加清晰。為了更好的反哆原數(shù)據(jù)中點與點之間的關(guān)系,本文提出將流形距離引入譜聚類中得到一種基于流形距蓓;核的譜聚類算法。本文的主要內(nèi)容tL括以下幾個方面:1.系統(tǒng)介紹了聚類分析以及譜聚類算法,在譜聚類的基礎(chǔ)知識中又介紹了圖的基本知識、矩陣表示、尼!矩陣及拉普拉斯矩陣,并系統(tǒng)闡述了譜圖理論、圖劃分準(zhǔn)則以及譜聚類算法的實現(xiàn)。2.針對原始譜募:類基于歐式距離的相似性度量,提出一種能夠反映數(shù)據(jù)聚類復(fù)雜空間分布特性的基于流形距離核的譜聚類算法,它能充分挖掘數(shù)據(jù)集中的內(nèi)在結(jié)構(gòu)信息,從而較好地反映面部和全局一致性。該算法在具有“挑戰(zhàn)性”的人工數(shù)據(jù)集中得
3、到了很好的驗證,并且選擇幾個UCI數(shù)據(jù)集作為實驗數(shù)據(jù),將本文提出的譜聚類改進算法同其它聚類算法進行分類比較,實驗結(jié)果表明此改進算法具有很好的聚類效果。3.將改進后的i雪聚類算法作為欠取樣的一種方式,提出一種基于流形距離核的譜聚類欠取樣方法,用于SVM不均衡數(shù)據(jù)的分類中,從而解決數(shù)據(jù)不均衡性,因此提高了SVM分類器的性能。最后利用基于流形距離核的譜聚類欠取樣SVM算法對滾動軸承故障檢測數(shù)據(jù)集避:行檢測性能測試,并同其他對于不均衡數(shù)據(jù)預(yù)處理的算法進行檢測性能比較,結(jié)果表圊J,對于滾動軸承故障,該算法具有較好的檢測性能。關(guān)鍵詞:聚類;譜聚類;流形距離核;
4、不均衡數(shù)據(jù);故障檢測基于流形距離核的譜聚類算法研究及其應(yīng)用i;ii;ii;;i;;ii;;i;iii置ii;宣ii;魯i;ii;;ii;暑iii;;;;;;;;;暑;;;;;置;;ABSTRACTInrecentyears,Sp三ctralclusteringalgorithmsinpattemrecognitiontoobtainawiderangeof印plicationsa11dbecomeoneofthemostpopularclusteringanalysismethods.Spectralclusteringalg(ritllrllba
5、sedonthespectralgraphtheoⅨThespectralclusteringalgorlthIllcajloVercomethedrawbackoftraditionalclusteringalgoritllIllontheconvexgraphcomparedwithtraditioralclusteringmethods.Sothatitcanbeconve瑪edtoglobaloptimalsolutlon·Itconstructsasimplifieddataspacemakinguseoftheeigenvectorsa
6、Rerspectraldecomposltlonthatnotonltreducesthedimensionofdatabutals0givescleaurerdistributionofdatalnthesubspaceInordertobetterrenecttherelationshipbetweenthepointandpoint士ortheorlgmaldata,t11isp印erpresentsacombinationofmanifolddistaJlceaJldspectralclustenngandobtalna;pectralcl
7、usteringalgorithmbasedonmanif-01ddistancekemel.Inthisthesis,a1)tofresearchhasbeendoneforspectralclusteringalgorithmanditsappIication,whichcan)esummeredaSfollows:1·Thispaperint“ducesclusteringanalysisandspectralclusteringalgorithmindetail.a(chǎn)jldalsodescribesb砸icknowledgeofthegrap
8、h,matrixrepesentation,degreematrix,and1印laclanmatrlx,thenmake