資源描述:
《基于譜分解的冗余模糊c均值聚類算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、基于譜分解的冗余模糊C均值聚類算法在圖像粗大項(xiàng)目來源:研究生創(chuàng)新基金作者簡介:白?。?992-),男,主要研究方向:機(jī)器學(xué)習(xí)。輪廓提取中的應(yīng)用白?。ㄎ錆h紡織大學(xué)數(shù)學(xué)與計(jì)算機(jī)學(xué)院)摘要:本文對傳統(tǒng)的模糊C均值聚類算法(FCM)進(jìn)行了改進(jìn),根據(jù)類間分離度和類內(nèi)緊縮度實(shí)現(xiàn)了對樣本特征的加權(quán),提升了FCM算法的聚類性能;通過引入冗余聚類的思想,突破了FCM算法對“凸”形數(shù)據(jù)集聚類的限制;采用貼近度來表征冗余類之間的特征,通過對貼近度的譜分解,選取了合適的譜特征再次采用FCM算法來完成冗余類的合并。圖像粗大輪廓的提取是圖像處理研究領(lǐng)域的一
2、個(gè)重要中間環(huán)節(jié),針對基于區(qū)域邊緣檢測的圖像輪廓提取原理,本文首次采用基于譜分解的冗余FCM算法完成了對圖像區(qū)域的分割,進(jìn)而運(yùn)用Canny邊緣算子提取到圖像的粗大輪廓。通過實(shí)驗(yàn)表明,本文算法能夠較好的去除一般邊緣算法檢測到的偽邊緣和弱邊緣,提取到圖像目標(biāo)的粗大輪廓。關(guān)鍵詞:模糊C均值聚類算法(FCM);冗余聚類;譜分解;粗大輪廓提取0引言圖像的邊緣像素是指局部圖像范圍內(nèi)灰度急劇變化的奇異點(diǎn),在圖像中表現(xiàn)為圖像的非連續(xù)性,而粗大輪廓為圖像中不同材質(zhì)所形成的顯著邊緣,即圖像中對象間的顯著邊緣特征,描述了圖像中顯著的輪廓信息。目標(biāo)圖像的
3、粗大輪廓包含了目標(biāo)的形狀、方位等眾多信息,是圖像處理和模式識(shí)別的重要中間環(huán)節(jié)。早期文獻(xiàn)[1]就提出了一種基于圖像輪廓提取的模板匹配算法,并應(yīng)用于機(jī)器人視覺技術(shù)中;文獻(xiàn)[2]提出了基于蟻群模糊聚類算法的粗大輪廓提取方法,接著文獻(xiàn)[3]又提出了基于核空間的PFCM聚類算法的粗大邊緣提取方法,并都較好的應(yīng)用于異源圖像的匹配中;文獻(xiàn)[4]基于力場轉(zhuǎn)換理論對灰度值分布集中且噪聲較大的紅外(IR)圖像進(jìn)行了粗大邊緣的檢測,并應(yīng)用于導(dǎo)航制導(dǎo)領(lǐng)域。本文基于粗大輪廓提取的原理,并在前人的基礎(chǔ)上將改進(jìn)的基于譜分解的冗余模糊C均值聚類算法應(yīng)用到圖像粗
4、大輪廓的提取中,通過運(yùn)用改進(jìn)的FCM算法對反應(yīng)圖像目標(biāo)主輪廓的特征信息聚類,實(shí)現(xiàn)圖像的分割,并利用邊緣檢測Canny算子對分割后的區(qū)域圖像進(jìn)行了圖像粗大輪廓的提取。接下來部分將按照如下安排:第一部分將詳細(xì)介紹改進(jìn)的基于譜分解的冗余模糊C均值聚類算法的原理及實(shí)現(xiàn)步驟;第二部分給出了實(shí)驗(yàn)測試結(jié)果及分析;第三部分對全文做出了總結(jié),并給出了將來研究的方向。1基于譜分解的冗余模糊C均值聚類算法1.1聚類分析聚類分析是數(shù)據(jù)挖掘的一種重要方法,它們根據(jù)“物以類聚”的道理,對樣本數(shù)據(jù)進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法,要求能合理地按各自的特性來對大
5、量的樣本進(jìn)行合理的分類,沒有任何模式可供參考。雖然聚類也可起到分類的作用,但和大多數(shù)分類不同。大多數(shù)分類方法都是演繹的,即人們事先確定某種事物分類的準(zhǔn)則或各類別的標(biāo)準(zhǔn),分類的過程就是比較分類的要素與各類別標(biāo)準(zhǔn),然后將各要素劃歸于各類別中,確定事物的分類準(zhǔn)則或各類別的標(biāo)準(zhǔn)或多或少帶有主觀色彩。聚類分析的目標(biāo)就是在相似的基礎(chǔ)上對一個(gè)給定的數(shù)據(jù)集進(jìn)行劃分,這種劃分應(yīng)滿足以下兩個(gè)特性:(1)類內(nèi)相似性:屬于同一類的數(shù)據(jù)應(yīng)盡可能相似。(2)類間相異性:屬于不同類的數(shù)據(jù)應(yīng)盡可能相異。圖1是一個(gè)簡單聚類分析的例子。圖1聚類分析的簡單圖例聚類分
6、析實(shí)現(xiàn)的一般步驟為:(1)選擇聚類的某種方法,例如最短距離法;(2)選擇度量距離,比如歐氏距離,并計(jì)算出初始距離矩陣;(3)在距離矩陣中找出最小數(shù),并把此數(shù)所在行的類與所在列的類歸為一類,得到新的一類。(4)計(jì)算新的一類與其他舊的幾類的距離,把距離最短的再歸為一類,形成新類,依次繼續(xù)下去,直到把所有的樣本歸為一類,然后根據(jù)需要,再選取分類結(jié)果。1.2模糊C均值聚類算法(FCM)在模糊聚類算法中最常見的是模糊C均值聚類算法(FCM)[5],模糊C均值算法是普通C均值算法的改進(jìn),普通C均值算法對于數(shù)據(jù)的劃分是硬性的,而FCM則是一種
7、柔性的模糊劃分。在FCM中,每個(gè)待分配的數(shù)據(jù)對象并不完全屬于某個(gè)特定的類,而是對某個(gè)特定的類有個(gè)隸屬程度,這更符合實(shí)際應(yīng)用。模糊C均值聚類方法是基于目標(biāo)函數(shù)的模糊聚類算法理論中最為完善、應(yīng)用最為廣泛的一種算法,F(xiàn)CM算法把聚類歸結(jié)為一個(gè)帶約束的非線性規(guī)劃問題,通過優(yōu)化求解獲得數(shù)據(jù)集的模糊劃分和聚類。其基本思想是通過反復(fù)修改聚類中心V和分類矩陣U來實(shí)現(xiàn)動(dòng)態(tài)的迭代聚類,使得被劃分到同一類的對象之間相似度最大,而不同類之間的相似度最小。讓X是一個(gè)N個(gè)數(shù)據(jù)對象的集合,每個(gè)數(shù)據(jù)對象是一個(gè)P維特征矢量,,其中。N個(gè)特征矢量的集合就可以被看做
8、是一個(gè)PxN數(shù)據(jù)矩陣。模糊聚類算法將數(shù)據(jù)X劃分進(jìn)C模糊類,在X中形成一個(gè)模糊劃分。一個(gè)模糊劃分可以方便的用一個(gè)矩陣U來表示,其中U中的元素表示數(shù)據(jù)對象對于類j的相關(guān)度。因此,U中的第j行包含著在模糊劃分中第j個(gè)從屬函數(shù)的值。模糊C均值算法基于下邊目標(biāo)函數(shù)的最小化