資源描述:
《數(shù)據(jù)的多流形及子空間的聚類模型研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、參賽密碼(由組委會(huì)填寫)第十二屆“中關(guān)村青聯(lián)杯”全國研究生數(shù)學(xué)建模競賽學(xué)校北京航空航天大學(xué)參賽隊(duì)號(hào)B10006005?1.朱日東隊(duì)員姓名2.黃博3.王敬凱參賽密碼(由組委會(huì)填寫)第十二屆“中關(guān)村青聯(lián)杯”全國研究生數(shù)學(xué)建模競賽題目數(shù)據(jù)的多流形和子空間聚類模型研究摘要:本文通過對(duì)子空間聚類問題和多流形聚類問題的分析,針對(duì)相應(yīng)的數(shù)據(jù)結(jié)構(gòu)建立了多種聚類數(shù)學(xué)模型:K均值聚類、譜聚類(SpectralClusteerring,SC)、基于CVX的稀疏子空間聚類(SparseSubspaceClustering,SSC-CVX)
2、、基于交替方向乘子法的稀疏子空間聚類(SSC-ADMM)、譜曲率聚類(SpectralCurvatureClustering,SCC)、稀疏流形聚類(SparseManifoldClusteringandEmbedding,SMCE)和譜多流形聚類(SpectralMulti-ManifoldClustering,SMMC)模型,并綜合運(yùn)用這些模型完成了數(shù)據(jù)的分類,并且實(shí)現(xiàn)的聚類效果是非??捎^的。第一問中,數(shù)據(jù)在兩個(gè)獨(dú)立的子空間,聚類相對(duì)容易,因此我們首先采用經(jīng)典的K均值聚類與SC進(jìn)行聚類,得出分類結(jié)果。為一步驗(yàn)證
3、分類結(jié)果,我們采用SSC-CVX、SSC-ADMM、SCC、SMCE四個(gè)模型分別對(duì)數(shù)據(jù)進(jìn)行分類,實(shí)驗(yàn)結(jié)果表明所有算法均可得到相同的分類結(jié)果:第1個(gè)數(shù)據(jù)到第40個(gè)數(shù)據(jù)以及第141個(gè)數(shù)據(jù)到第200個(gè)數(shù)據(jù)屬于第一類,第41個(gè)數(shù)據(jù)到第140個(gè)數(shù)據(jù)屬第二類。第二問中,要解決四個(gè)低維空間中的子空間聚類問題和多流形聚類問題。本文采用SMMC,SCC,SMCE三個(gè)模型對(duì)四組數(shù)據(jù)分別進(jìn)行分類。其中通過選取合適的參數(shù),SMMC非常好的對(duì)四組數(shù)據(jù)進(jìn)行了分類,得到了題目要求的結(jié)果;SCC對(duì)(a),(b)中的數(shù)據(jù)進(jìn)行了很很好的分類,得到了題
4、目要求的結(jié)果;SMCE對(duì)(c)中的數(shù)據(jù)進(jìn)行了很好的分類,得到了題目要求的結(jié)果。第三問中,(a)的數(shù)據(jù)在分布上與第二問中(a)的數(shù)據(jù)具有一定的相似性,因此對(duì)該數(shù)據(jù)采用SCC和SMMC模型進(jìn)行聚類,兩種方法都實(shí)現(xiàn)了題目要求的分類格式,將數(shù)據(jù)按照“橫”和“豎”分兩類。(b)中采用SSC-ADMM模型對(duì)運(yùn)動(dòng)的特征點(diǎn)軌跡進(jìn)行分類。本文首先采用此算法進(jìn)行分類。又已知,同一運(yùn)動(dòng)的特征點(diǎn)軌跡在同一個(gè)線性流形上。所以我們也嘗試采用流形聚類方法:SMCE和SMMC模型對(duì)運(yùn)動(dòng)特征軌跡分類。為了驗(yàn)證和分析分類結(jié)果,我們還采用了K均值、SC
5、模型、SCC模型進(jìn)行聚類。實(shí)驗(yàn)結(jié)果表明,以上方法都一致的將第1個(gè)數(shù)據(jù)和第138數(shù)據(jù)分為同一類,將其余的數(shù)據(jù)歸于其它兩類。在第267個(gè)數(shù)據(jù),第275個(gè)數(shù)據(jù),第276個(gè)數(shù)據(jù)與第297個(gè)數(shù)據(jù)的分類中存在差異。我們分析這兩類運(yùn)動(dòng)的特征點(diǎn)軌跡可能較為相似,在移動(dòng)中,存在相交,因而在這兩類運(yùn)動(dòng)的相交邊界處的特征點(diǎn)軌跡可能會(huì)出現(xiàn)分類上的不同。(c)中采用SSC-ADMM模型對(duì)人臉進(jìn)行分類。我們?nèi)韵炔捎么怂惴▽?duì)人臉數(shù)據(jù)進(jìn)行分類。為驗(yàn)證分類結(jié)果,我們采用適宜處理高維數(shù)據(jù)分類的SCC、SMCE、SSC-CVX模型進(jìn)行分類實(shí)驗(yàn)。通過實(shí)驗(yàn)
6、可以發(fā)現(xiàn)這幾種方法均可得到與SSC-ADMM算法一致的分類結(jié)果:第1個(gè)到第5個(gè)人臉數(shù)據(jù)以及第11個(gè)到第15個(gè)人臉數(shù)據(jù)屬于一個(gè)人,其余的屬于另一個(gè)人。第四問中,(a)問題中圓臺(tái)數(shù)據(jù)屬于多流形結(jié)構(gòu),所以我們采用SMMC算法對(duì)圓臺(tái)數(shù)據(jù)進(jìn)行分類,調(diào)整參數(shù)的選取,可將圓臺(tái)的頂、底、側(cè)面分成三類。(b)機(jī)器工件外部邊緣輪廓的圖像數(shù)據(jù)用SMCE算法分成三類和四類,得到較好的聚類效果。關(guān)鍵詞:譜多流形聚類稀疏流形聚類與嵌入稀疏子空間聚類譜曲率聚類譜聚類一、問題重述隨著計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的飛速發(fā)展,我們已經(jīng)進(jìn)入高維和海量數(shù)據(jù)的時(shí)代,
7、迫切需要對(duì)這些大數(shù)據(jù)進(jìn)行有效的分析,以至數(shù)據(jù)的分析和處理方法成為了諸多問題成功解決的關(guān)鍵,涌現(xiàn)出了大量的數(shù)據(jù)分析方法。幾何結(jié)構(gòu)分析是進(jìn)行數(shù)據(jù)處理的重要方法,已經(jīng)被廣泛應(yīng)用在人臉識(shí)別、手寫體數(shù)字識(shí)別、圖像分類、等模式識(shí)別和數(shù)據(jù)分類問題,此外,如何快速有效的在大規(guī)模高維數(shù)據(jù)上求解各種數(shù)學(xué)模型,也成為目前數(shù)據(jù)分析與處理領(lǐng)域亟待解決的重要問題。以及圖象分割、運(yùn)動(dòng)分割等計(jì)算機(jī)視覺問題中。更一般地,對(duì)于高維數(shù)據(jù)的相關(guān)性分析、聚類分析等基本問題,結(jié)構(gòu)分析也格外重要。而本次建模就是采用數(shù)據(jù)處理及其應(yīng)用領(lǐng)域經(jīng)典的子空間聚類的求解方法
8、,并著重使用了基于譜聚類的多種方法解決了子空間聚類問問題和多流行聚類問題。在題目給定的數(shù)據(jù)和參考文獻(xiàn)下,求解以下4個(gè)問題:1.當(dāng)子空間獨(dú)立時(shí),子空間聚類問題相對(duì)容易。附件一中1.mat中有一組高維數(shù)據(jù)(.mat所存矩陣的每列為一個(gè)數(shù)據(jù)點(diǎn),以下各題均如此),它采樣于兩個(gè)獨(dú)立的子空間。請將該組數(shù)據(jù)分成兩類。2.請?zhí)幚砀郊兴膫€(gè)低維空間中的子空間聚類問題和多流形