基于譜聚類的混合流形學(xué)習(xí)算法研究

基于譜聚類的混合流形學(xué)習(xí)算法研究

ID:35070494

大?。?.67 MB

頁數(shù):68頁

時間:2019-03-17

基于譜聚類的混合流形學(xué)習(xí)算法研究_第1頁
基于譜聚類的混合流形學(xué)習(xí)算法研究_第2頁
基于譜聚類的混合流形學(xué)習(xí)算法研究_第3頁
基于譜聚類的混合流形學(xué)習(xí)算法研究_第4頁
基于譜聚類的混合流形學(xué)習(xí)算法研究_第5頁
資源描述:

《基于譜聚類的混合流形學(xué)習(xí)算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、'分類號:TP392單位代巧:10361安獲化玉乂爹VEROFSCTECHNOLOGY?ANHUIUNISITY化NCE&^PeE2^3II:心…….mU■.'.;巧'V?.—.V,''-,:,II論文題目;基于譜聚類的混合流形學(xué)習(xí)算法研究作者姓名:付剛專業(yè)名稱;計算機科學(xué)與技術(shù)肆師姓名:吳觀茂副教授完成時間—;二〇六年六月:TP392論文編號:中間分類巧學(xué)科分類巧:520.40密級:公開安徽理工大學(xué)碩壬學(xué)位論文基于譜聚類的混合流形學(xué)習(xí)算法研究作

2、者姓名:過迎專業(yè)名稱:計算機科學(xué)與巧術(shù)研巧方向:數(shù)據(jù)挖掘導(dǎo)師姓名:吳觀巧副教授導(dǎo)師單位1:大學(xué)計算機科學(xué)與11:程學(xué)院;安徽理1答辯委員會主席;尹玉龍論文答辯日期:2016年06月04日安徽理工大學(xué)研究生處200年月日ADissertationinComputerscienceandt:echnol〇gvResearchofHybridManifoldClusteringalgon化msBasedonSpectralClusteringCandidate:FuGangSupervisor

3、:WuGuanmaoAnHuiUniversityofScienceandTechnologyNo.168ShunenRoadHuainan232001P.R.CHINA,gg,,,獨創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加L乂標(biāo)注和致謝的地方W外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得室徽理工大學(xué)或其他教育化構(gòu)的學(xué)位或證書而使用過的材料一。與我同王作的同志對本研究所做的任何貢獻均己在論文中作了明確的說明并表示謝意。:學(xué)位論文作者簽名:餅日期《

4、年(>月^日如)_學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解安徽理工大學(xué)有俱留、使用學(xué)位論文的規(guī)定,即:研究生在??匙x學(xué)位期間論文工作的知識產(chǎn)權(quán)單位屬于安徽理工大學(xué)。學(xué)校有權(quán)保留并向國家有關(guān)部口或機構(gòu)送交論文的復(fù)印件和碰盤,允許論文被查閱和借閱。本人授權(quán)安徽理工大學(xué)可W將學(xué)位論義的全部或部分容編入有關(guān)數(shù)據(jù)庫進行檢索,.可W采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后適用本授權(quán)書)學(xué)位論文作者簽名;簽字曰期年(月S曰導(dǎo)師簽名:簽字日期么年月曰'仁乂夢^摘要隨著電子信息技術(shù)進步,各種形態(tài)的數(shù)據(jù)不斷指數(shù)

5、級爆炸増長。當(dāng)我們面對這些海量的高維數(shù)據(jù),需要能夠按照我們預(yù)期的目的進行有效的處理W及利用。從大量的信息當(dāng)中挖掘出有用的信息是模式識別w及計算機視覺等很多領(lǐng)域共同關(guān)注的研究難題。一流形學(xué)習(xí)是種極為有效的數(shù)據(jù)處理方式,從原始數(shù)據(jù)當(dāng)中挖掘出我們可W利用的有效信息。本文研巧了復(fù)雜分布數(shù)據(jù)的混合流形聚類,包括現(xiàn)實生活中的真實物體數(shù)據(jù)集,人造的數(shù)據(jù)集,W及人臉數(shù)據(jù)集等等。,,對于混合流形數(shù)據(jù),由于分布的復(fù)雜性特別是不同流形相互重疊的部分傳統(tǒng)的算法思想僅僅考慮了數(shù)據(jù)集中點與點之間的聯(lián)系,并沒有考慮到重基區(qū)域數(shù)據(jù)一點由于歐式距離較近,將會使得本來處于兩個聚類的數(shù)據(jù)點會被

6、劃分到個聚類當(dāng),中,從而導(dǎo)致數(shù)據(jù)聚類錯誤率的増加。基于這種情況我們除了考慮數(shù)據(jù)點本身的(特性:,還要考慮其他方面的因素。比如數(shù)據(jù)點的幾何切空間衡量數(shù)據(jù)分布狀態(tài)一的種方式。)等傳統(tǒng)的K均值聚類n。使得計算速度慢,消耗,需要數(shù)據(jù)點必須為維空間向量一很多內(nèi)存一些特征向量來近似代。而譜聚類基于這問題,對高維數(shù)據(jù)降維,使用。表高維的原始數(shù)據(jù)因此,譜聚類具有計算速度快,并且不容易受到噪聲W及邊界的影響,具有很強的魯棒性。借鑒譜聚類算法的優(yōu)點,對于相似矩陣的選取,在傳統(tǒng)基于歐式距離的基礎(chǔ)上,。充分考慮了數(shù)據(jù)內(nèi)含的其他幾何信息,構(gòu)造出更加適合與混合流形聚類的親和矩陣另

7、外,從最初的近鄰點的選取,到親和矩陣的構(gòu)造,再到拉普拉斯矩陣,從而求得低維嵌入數(shù)據(jù)。因此,基于譜聚類的算法最根本的就是近鄰點的選取。考慮到是混一合流形,盡管可能距離很近,要求近鄰點應(yīng)該盡可能地來自同個流形。我們深入研巧了除了距離還有局部幾何信息的近鄰點的選取方法。本論文還提出了迭代加權(quán)的子空間聚類。對于這種算法,核也就是迭代的加權(quán)算法框架,相比于原來的標(biāo)準最小化框架,迭代最小框架聚類效果更

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。