正則化低秩子空間譜聚類算法

ID：31369882

大小：108.50 KB

頁數(shù)：6頁

時間：2019-01-09

資源描述：

《正則化低秩子空間譜聚類算法》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。

1、正則化低秩子空間譜聚類算法　　摘要：為解決缺損數(shù)據(jù)譜聚類中的不適定問題，提出一種正則化低秩子空間譜聚類算法。首先根據(jù)數(shù)據(jù)集建立核范數(shù)正則化低秩矩陣分解模型，然后用迭代法求解模型得出系數(shù)矩陣，由此構(gòu)造相似矩陣，最后利用譜聚類算法得出聚類結(jié)果。實驗表明，該算法在一定程度上可以解決缺損數(shù)據(jù)的譜聚類問題，抑制噪聲，獲得質(zhì)量較高的聚類結(jié)果。　　關(guān)鍵詞：聚類分析；譜聚類；低秩子空間；不適定；正則化　　DOIDOI：10.11907/rjdk.162025　　中圖分類號：TP311　　文獻標識碼：A文章編號：1672-7800（2016）012-

2、0022-03　　0引言　　聚類分析是數(shù)據(jù)挖掘的一個重要研究領(lǐng)域，在統(tǒng)計學、生物學、模式識別、機器學習和社會科學中有著極為廣泛的應(yīng)用。所謂聚類就是將數(shù)據(jù)對象分組成為多個類或簇，使得在同一簇中的對象之間具有較高的相似度，而不同簇中的對象差別較大。k-均值聚類是聚類分析中最經(jīng)典的算法，算法簡單，可用于多種類型數(shù)據(jù)的聚類。但當數(shù)據(jù)集為非凸時，k-均值聚類往往陷于局部最優(yōu)，聚類效果欠佳。另外，對于大小或密度不均勻的簇，k-均值聚類通常無法處理[1]。6　　譜聚類是一種新型的聚類分析方法，可以克服k-均值聚類等經(jīng)典方法的一些缺陷[2]。譜聚類

3、方法以圖論中的譜圖理論為基礎(chǔ)，將聚類問題轉(zhuǎn)化為圖的最優(yōu)劃分問題。在眾多圖的最優(yōu)劃分準則中，歸一化割集準則的劃分效果相對較好，是譜聚類中常用的劃分準則[3]。對于給定的劃分準則和聚類數(shù)目k，譜聚類通常采用多路譜聚類算法將數(shù)據(jù)集劃分為k個簇[4]?！　∽钤绲淖V聚類算法是Ng，Bach和Jordan[4-5]提出的多路譜聚類方法。代表性的譜聚類算法還有Meila[6]提出的多路歸一化割譜聚類方法；Vidal[7]提出的子空間譜聚類方法；Wang等[8]提出的多流形譜聚類方法；Cheng等[9]提出的低秩譜聚類方法；Elhamifar等[1

4、0]提出的稀疏子空間譜聚類方法?！　≡诒姸嘧V聚類算法中，低秩稀疏子空間譜聚類越來越受到學者的重視。在有些實際問題中，數(shù)據(jù)并不符合混合子空間的假設(shè)，分析這種數(shù)據(jù)具有很大的挑戰(zhàn)性。研究表明，基于譜聚類的方法是處理該類問題的有效方法。雖然這類數(shù)據(jù)本身無法使用相互表示的方式，但是數(shù)據(jù)的特征可相互線性表示，且表示系數(shù)具有稀疏性或低秩性的特點。目前，這種低秩表示方法已被擴展用于圖像處理?！　”疚脑诘椭茸涌臻g譜聚類算法的基礎(chǔ)上，引入正則化過程以解決不適定問題，并根據(jù)數(shù)值實驗對該算法進行性能測試。　　1譜聚類矩陣　　譜聚類的基本思想是將聚類問題轉(zhuǎn)化

5、為圖的最優(yōu)劃分問題，利用圖的最優(yōu)劃分準則，使劃分出的子圖之間的邊權(quán)之和較小，而子圖內(nèi)的邊權(quán)之和較大。下面簡要介紹本文算法設(shè)計過程中涉及到的譜聚類矩陣。6　　上述譜聚類矩陣性質(zhì)類似但又有差異，不同的譜聚類算法可以選用不同的譜聚類矩陣?！　?正則化低秩子空間譜聚類算法　　2.1不適定問題與正則化　　問題的適定性最早由法國數(shù)學家Hadamard[11]指出問題的解存在且唯一。不適定性通常包含兩重含義：問題解的多重性和問題對擾動的敏感性。在很長一段時間內(nèi)，人們認為研究不適定問題沒有意義。直到1956年，人們逐漸發(fā)現(xiàn)適定問題并不能正確描述許多

6、自然現(xiàn)象，許多現(xiàn)象均具有不適定性。至此，不適定問題的研究才引起相關(guān)學者的重視?！　∧壳?，對于不適定問題，已有PST、GPST、MonteCarlo、最佳攝動量、正則化等方法。其中，正則化是求解不適定問題的主要方法。不適定問題的正則化最早由前蘇聯(lián)數(shù)學家吉洪諾夫提出，其基本思想是：將所研究問題的解和相應(yīng)空間加以適當限制，以保證當原始數(shù)據(jù)有缺損或擾動時，問題的近似解與真解具有較高的近似度。由于這種方法是通過對原問題附加“規(guī)則”，從而保證解的存在性和數(shù)值穩(wěn)定性，因而稱之為“正則化”方法?！　?.2低秩矩陣分解　　大部分圖像中都含有一些公共模

7、式，這些基本模式稱為基底或字典。通過這些基底的線性組合，可以表示出幾乎所有的圖像。在許多情況下，基底的數(shù)量是較少的，即許多圖像的數(shù)據(jù)矩陣是低秩或近似低秩的。因為低秩矩陣可以被映射到低維空間進行分析，這就給圖像處理帶來了極大便利。6　　但在有些情況下，由于數(shù)據(jù)缺損及噪聲影響，破壞了矩陣的低秩性。因為噪聲往往是分布稀疏的，為了恢復(fù)矩陣的低秩性，可將略低數(shù)據(jù)矩陣D分解為兩個矩陣A與E之和，其中第一個矩陣A低秩，第二個矩陣E稀疏。具體分解模型如下[13]：　　3數(shù)值實驗　　為了檢驗正則化低秩子空間譜聚類算法的性能，本文選取了兩組典型的譜聚類

8、仿真數(shù)據(jù)和兩個人在不同光照下的共20幅人臉圖像進行實驗?！　D1是視覺重建中的問題。特征提取是視覺重建的一個關(guān)鍵環(huán)節(jié)，圖1中的十字的位置信息已經(jīng)提取出來，為了確定十字的中心位置，要求將十字中的點按照“橫”和“豎”分為兩類?！　D2為一

當前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 6



此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

正則化低秩子空間譜聚類算法

正則化低秩子空間譜聚類算法

相關(guān)文章

相關(guān)標簽