資源描述:
《魯棒自適應(yīng)圖正則化聚類算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、分類號(hào):學(xué)校代碼:10165密級(jí):學(xué)號(hào):201511000557碩士學(xué)位論文魯棒自適應(yīng)圖正則化聚類算法RobustAdaptiveGraph-RegularizationClusteringAlgorithm作者姓名:董昊學(xué)科、專業(yè):應(yīng)用數(shù)學(xué)研究方向:模式識(shí)別導(dǎo)師姓名:姜偉副教授2018年3月遼寧師范大學(xué)碩士學(xué)位論文摘要21世紀(jì),互聯(lián)網(wǎng)和數(shù)據(jù)挖掘技術(shù)蓬勃發(fā)展,社會(huì)飛速進(jìn)入大數(shù)據(jù)時(shí)代。持續(xù)并不斷增長(zhǎng)的海量數(shù)據(jù)改善了人們的生活方式的同時(shí),它的儲(chǔ)存、挖掘及應(yīng)用卻成為信息時(shí)代人們面臨的一大挑戰(zhàn)。從海量的數(shù)據(jù)中高效、低成本獲取潛在的知識(shí)成為學(xué)者們探求的重大問題。近年來(lái),聚類分析技術(shù)在模式識(shí)別和數(shù)據(jù)挖掘
2、領(lǐng)域被高度重視。傳統(tǒng)的聚類方法如:k-means聚類算法、譜聚類算法等已經(jīng)被成功應(yīng)用到各個(gè)領(lǐng)域。然而,傳統(tǒng)的基于圖的聚類方法通常是基于一個(gè)給定的近鄰圖,聚類時(shí)需要對(duì)近鄰圖采用有效算法,進(jìn)而獲取數(shù)據(jù)的最終聚類結(jié)果。然而,數(shù)據(jù)往往存在噪聲,所構(gòu)建的近鄰圖不能滿足實(shí)際應(yīng)用的需要。為了解決上述問題,學(xué)者們提出了許多旨在降低誤差、噪聲及孤立點(diǎn)影響,提高構(gòu)建近鄰圖有效性的算法。本文首先對(duì)聚類分析的相關(guān)內(nèi)容進(jìn)行簡(jiǎn)明闡述,其中包括研究背景、意義以及研究現(xiàn)狀,系統(tǒng)的介紹了聚類算法所涉及的定義、定理等相關(guān)理論知識(shí)。針對(duì)圖聚類算法中存在的問題,基于L2,1范數(shù)及圖正則化思想提出了一種將構(gòu)建數(shù)據(jù)相似矩陣和聚類同時(shí)進(jìn)
3、行的聚類模型:魯棒自適應(yīng)圖正則化聚類算法(RobustAdaptiveGraph-RegularizationClusteringAlgorithm,RAGR)。算法用L2,1范數(shù)取代F范數(shù),不但能確保數(shù)據(jù)行稀疏,而且保持矩陣的旋轉(zhuǎn)不變性和對(duì)噪聲數(shù)據(jù)的魯棒性。我們給出模型的優(yōu)化算法,并使用matlab軟件在合成數(shù)據(jù)集和真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),驗(yàn)證本文提出的RAGR聚類算法的有效性。關(guān)鍵詞:k-means聚類;譜聚類;拉普拉斯矩陣;圖正則化;魯棒-I-魯棒自適應(yīng)圖正則化聚類算法RobustAdaptiveGraph-RegularizationClusteringAlgorithmAbstrac
4、tInthe21stcentury,Internetanddataminingtechnologiesarebooming,andsocietyisrapidlyenteringtheeraofbigdata.Thecontinuousandgrowingbigdatahasimprovedpeople'swayoflife,whileitsstorage,miningandapplicationhavebecomeachallengeforpeopleintheinformationage.Obtainingthepotentialknowledgeefficientlyandlowcos
5、tfrommassivedatahasbecomeamajorproblemforscholars.Inrecentyears,clusteranalysistechnologyishighlyvaluedinthefieldofpatternrecognitionanddatamining.Traditionalclusteringmethodssuchask-meansclusteringalgorithmandspectralclusteringalgorithmhavebeenappliedtovariousfields.However,thetraditionalgraph-bas
6、edclusteringmethodisusuallybasedonagivendatagraphanditsadjacencygraph.Inclustering,weneedaneffectivealgorithmtogettheresultofdataclustering.However,thereareoftennoiseinthedata.Thenearneighborgraphcannotmeettheneedsofpracticalapplication.Tosolvetheaboveproblems,scholarshaveproposedmanyalgorithmstore
7、ducetheeffectoferror,noiseandoutliers,andimprovethevalidityofthenearneighborgraph.Firstly,thispapergivesabriefdescriptiontotherelatedcontentofclusteranalysis,includingtheresearchbackground,significanceandth