資源描述:
《模糊聚類綜述》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、模糊聚類綜述摘要:本文首先對(duì)模糊聚類進(jìn)行了概述,然后論述了模糊據(jù)類分析法,最后從四個(gè)方面綜述模糊聚類的研宄進(jìn)展,并論述了其在模式識(shí)別及圖像處理中的應(yīng)用。關(guān)鍵詞:模糊聚類,模糊相似矩陣,圖像處理聚類分析是一種數(shù)據(jù)劃分或分組處理的重要手段和方法。其操作的目的在于將特征空間中一組沒冇類別標(biāo)記的矢量按某種相似性準(zhǔn)則劃分到若干個(gè)子集中,使得每個(gè)子集代表整個(gè)樣本集的某個(gè)或者某些特征和性質(zhì)。從這個(gè)意義上講,聚類又稱為無監(jiān)督的分類。傳統(tǒng)的聚類分析把每個(gè)樣本嚴(yán)格地劃分到某一類,屬于硬劃分的范疇。實(shí)際上,樣木并沒有嚴(yán)格的屬性,它們?cè)谛詰B(tài)和類屬方面存在著中介性。隨著模糊集理論的提出,硬聚類被推廣為
2、模糊聚類。在模糊聚類中,每個(gè)樣本不再僅屬于某一類,而是以一定的隸屬度分屬于每一類。換句話說,通過模糊聚類分析,得到了樣本屬于各個(gè)類別的不確定性程度,即逑立起了樣本對(duì)于類別的不確定性的描述,這樣就能更準(zhǔn)確地反映現(xiàn)實(shí)世界。1.模糊聚類分析法聚類分析是對(duì)事物按一定要求進(jìn)行分類的數(shù)學(xué)方法。實(shí)際的分類問題常伴有模糊性,因此,聚類問題用模糊數(shù)學(xué)的方法解決更確切。在實(shí)際的模糊聚類問題中,主要有用模糊等價(jià)關(guān)系進(jìn)行的聚類分析和基于模糊擬序關(guān)系的聚類分析。其中,前者較為常用。1.1聚類分析的步驟步*驟一■:標(biāo)定。設(shè)x:為被分類對(duì)象全體,每一對(duì)象七由一組數(shù)據(jù)表征。建立X上的模糊相似關(guān)系R,R可表示
3、為模糊相似矩陣1^=k.l,其屮;與~的相似度&可根據(jù)實(shí)際情況,從不列方法屮選擇一種來規(guī)定。1)數(shù)量積:(Sxikxjk)/Mi^j,其中M為一適當(dāng)正數(shù)滿足臉max(Ixikxjk).2)夾角余弦:3)相關(guān)系數(shù):_1⑺其屮'=m^XJk其它還有:最人最小法,算術(shù)平均最小法,幾何平均最小法,絕對(duì)值指數(shù)法等。以上各種方法,究竟選擇哪一種,根據(jù)實(shí)際問題的特點(diǎn)進(jìn)行選擇。步驟二:聚類(両聚類圖)。用上述方法建立起來的模糊關(guān)系R,一般只具有自反性與對(duì)稱性,不滿足傳遞性。一般需求模糊矩陣R的傳遞閉包t(R)(包含R的最小的模糊傳遞矩陣),使其具有傳遞性,再進(jìn)行分類,求聚類圖。最后,確定最佳
4、閾值入。聚類圖給出各k值的分類,形成一種動(dòng)態(tài)聚類,便于全面了解樣本的聚類。最后根據(jù)實(shí)際需要合理選擇某閾值X,在適當(dāng)閾值上進(jìn)行截取,便可得到所需分類。1.2聚類的方法方法一:傳遞閉包法。步驟如下:(1)從傳遞矩陣R出發(fā),利用平方法,依次計(jì)算……直至首次出現(xiàn)#。=V,可以證明V就是R的傳遞閉包t(R)。各自將X分類。(2)^=t(R)為模糊等價(jià)矩陣,取A從1取到0,依次截得等價(jià)關(guān)系&,它們由于****^2—,叉(Xj,?^/)e于',X,.,'屬于同一類,則對(duì)于A,,X,.,~也屬于同一類。因而由'所得的分類是由f所得分類的加細(xì)。這樣當(dāng)A從1取到0時(shí),所得分類逐步歸并,可形成一個(gè)
5、聚類圖。方法二:直接聚類法。即建立模糊相似矩陣K后,不需求其傳遞閉包,直接從R出發(fā),可求得聚類圖。其步驟如下:(1)取及=1(最大值),求每個(gè)X,.的相似類{xz}
6、~=l}將滿兄。=1的X,■與~放在一類,構(gòu)成相似類。由于R不滿足傳遞性,不同的相似類可能有公共元素,此時(shí)將有公共元素的相似類歸并。可以證明:關(guān)于&的相似類可歸并為關(guān)于的等價(jià)類。于是可得關(guān)于傳遞閉包F對(duì)應(yīng)于4=1的等價(jià)類。(2)取本等于次大值。從R中找出所有^二丕,將上述對(duì)應(yīng)于'=1的等價(jià)類中歸并。可以證明:通過對(duì)高閾值人的等價(jià)類(關(guān)于f的歸并,可直接得到對(duì)應(yīng)低閾值岑的等價(jià)類(關(guān)于<),歸并原則是,若義=毛,將與
7、合并,于是可得萬對(duì)應(yīng)于岑的等價(jià)類。(3)取名等于第三大值。從F屮找出所有~=岑,將對(duì)應(yīng)于木的萬的等價(jià)類中^^廠與歸并,將所有這種情況歸并后,可得萬的對(duì)應(yīng)于人的等價(jià)2乂2類、(4)依此類推,直至歸并至X成為一類。方法三:聚類分析的最大樹法。(1)先畫出被分類的元素集,從矩陣R中按~從大到小的順序依次連邊,標(biāo)上權(quán)重,若在某一步會(huì)出現(xiàn)冋路,便不畫那一步。直至所有元素有路相通為止,這樣就得到一棵最大樹T。(2)取定閾值/I,在T中砍去權(quán)重小于2的邊,便可將元素分類,互相連通的元素歸為同類??梢宰C明:T中去掉小于A的邊,將T分裂成若干樹7;,r2,…,7;,則7;(i=l,2,…,m)
8、的頂點(diǎn)集對(duì)應(yīng)f的等價(jià)類。2.在Ruspini和Bezdek等學(xué)者的努力下,模糊聚類逐步成為聚類分析研究的主流。八十年代后,其研究主要集中在:(1)模糊聚類新方法研究;(2)模糊聚類算法的實(shí)現(xiàn)途徑;(3)聚類有效性研究;(4)聚類的實(shí)際應(yīng)用等四個(gè)方面。以下就這四個(gè)方面綜述模糊聚類的研宂進(jìn)展,并指出進(jìn)一步研宄的主要方向。2.1模糊聚類新方法研宄進(jìn)展第一個(gè)系統(tǒng)地研宄模糊聚類的是Ruspinio1969年他定義了數(shù)據(jù)集模糊劃分的概念。同時(shí),Zadeh,Tarmtira等也提出基于相似關(guān)系和模糊關(guān)系的聚類方法。但