fcm模糊均值與改進算法

fcm模糊均值與改進算法

ID:3445916

大?。?48.50 KB

頁數(shù):21頁

時間:2017-11-21

fcm模糊均值與改進算法_第1頁
fcm模糊均值與改進算法_第2頁
fcm模糊均值與改進算法_第3頁
fcm模糊均值與改進算法_第4頁
fcm模糊均值與改進算法_第5頁
資源描述:

《fcm模糊均值與改進算法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、模糊C均值聚類算法的實現(xiàn)研究背景聚類分析是多元統(tǒng)計分析的一種,也是無監(jiān)督模式識別的一個重要分支,在模式分類圖像處理和模糊規(guī)則處理等眾多領(lǐng)域中獲得最廣泛的應(yīng)用。它把一個沒有類別標(biāo)記的樣本按照某種準(zhǔn)則劃分為若干子集,使相似的樣本盡可能歸于一類,而把不相似的樣本劃分到不同的類中。硬聚類把每個待識別的對象嚴(yán)格的劃分某類中,具有非此即彼的性質(zhì),而模糊聚類建立了樣本對類別的不確定描述,更能客觀的反應(yīng)客觀世界,從而成為聚類分析的主流。模糊聚類算法是一種基于函數(shù)最優(yōu)方法的聚類算法,使用微積分計算技術(shù)求最優(yōu)代價函數(shù),在基于概率算法的聚類方法中將使用概率密度函數(shù),為此要假定合適的模型,模糊聚類算法

2、的向量可以同時屬于多個聚類,從而擺脫上述問題。模糊聚類分析算法大致可分為三類1)分類數(shù)不定,根據(jù)不同要求對事物進行動態(tài)聚類,此類方法是基于模糊等價矩陣聚類的,稱為模糊等價矩陣動態(tài)聚類分析法。2)分類數(shù)給定,尋找出對事物的最佳分析方案,此類方法是基于目標(biāo)函數(shù)聚類的,稱為模糊C均值聚類。3)在攝動有意義的情況下,根據(jù)模糊相似矩陣聚類,此類方法稱為基于攝動的模糊聚類分析法我所學(xué)習(xí)的是模糊C均值聚類算法,要學(xué)習(xí)模糊C均值聚類算法要先了解慮屬度的含義,隸屬度函數(shù)是表示一個對象x隸屬于集合A的程度的函數(shù),通常記做μA(x),其自變量范圍是所有可能屬于集合A的對象(即集合A所在空間中的所有點

3、),取值范圍是[0,1],即0<=μA(x)<=1。μA(x)=1表示x完全隸屬于集合A,相當(dāng)于傳統(tǒng)集合概念上的x∈A。一個定義在空間X={x}上的隸屬度函數(shù)就定義了一個模糊集合A,或者叫定義在論域X={x}上的模糊子集。對于有限個對象x1,x2,……,xn模糊集合可以表示為:(6.1)有了模糊集合的概念,一個元素隸屬于模糊集合就不是硬性的了,在聚類的問題中,可以把聚類生成的簇看成模糊集合,因此,每個樣本點隸屬于簇的隸屬度就是[0,1]區(qū)間里面的值。FCM算法需要兩個參數(shù)一個是聚類數(shù)目C,另一個是參數(shù)m。一般來講C要遠(yuǎn)遠(yuǎn)小于聚類樣本的總個數(shù),同時要保證C>1。對于m,它是一個控

4、制算法的柔性的參數(shù),如果m過大,則聚類效果會很次,而如果m過小則算法會接近HCM聚類算法。算法的輸出是C個聚類中心點向量和C*N的一個模糊劃分矩陣,這個矩陣表示的是每個樣本點屬于每個類的隸屬度。根據(jù)這個劃分矩陣按照模糊集合中的最大隸屬原則就能夠確定每個樣本點歸為哪個類。聚類中心表示的是每個類的平均特征,可以認(rèn)為是這個類的代表點。從算法的推導(dǎo)過程中我們不難看出,算法對于滿足正態(tài)分布的數(shù)據(jù)聚類效果會很好,另外,算法對孤立點是敏感的。21聚類算法是一種比較新的技術(shù),基于曾次的聚類算法文獻中最早出現(xiàn)的Single-Linkage層次聚類算法是1957年在Lloyd的文章中最早出現(xiàn)的,之

5、后MacQueen獨立提出了經(jīng)典的模糊C均值聚類算法,F(xiàn)CM算法中模糊劃分的概念最早起源于Ruspini的文章中,但關(guān)于FCM的算法的詳細(xì)的分析與改進則是由Dunn和Bezdek完成的。模糊c均值聚類算法因算法簡單收斂速度快且能處理大數(shù)據(jù)集,解決問題范圍廣,易于應(yīng)用計算機實現(xiàn)等特點受到了越來越多人的關(guān)注,并應(yīng)用于各個領(lǐng)域。算法描述模糊C均值聚類算法的步驟還是比較簡單的,模糊C均值聚類(FCM),即眾所周知的模糊ISODATA,是用隸屬度確定每個數(shù)據(jù)點屬于某個聚類的程度的一種聚類算法。1973年,Bezdek提出了該算法,作為早期硬C均值聚類(HCM)方法的一種改進。FCM把n個

6、向量xi(i=1,2,…,n)分為c個模糊組,并求每組的聚類中心,使得非相似性指標(biāo)的價值函數(shù)達到最小。FCM與HCM的主要區(qū)別在于FCM用模糊劃分,使得每個給定數(shù)據(jù)點用值在0,1間的隸屬度來確定其屬于各個組的程度。與引入模糊劃分相適應(yīng),隸屬矩陣U允許有取值在0,1間的元素。不過,加上歸一化規(guī)定,一個數(shù)據(jù)集的隸屬度的和總等于1:(6.9)那么,F(xiàn)CM的價值函數(shù)(或目標(biāo)函數(shù))就是式(6.2)的一般化形式:,(6.10)這里uij介于0,1間;ci為模糊組I的聚類中心,dij=

7、

8、ci-xj

9、

10、為第I個聚類中心與第j個數(shù)據(jù)點間的歐幾里德距離;且是一個加權(quán)指數(shù)。構(gòu)造如下新的目標(biāo)函數(shù),可

11、求得使(6.10)式達到最小值的必要條件:(6.11)這里lj,j=1到n,是(6.9)式的n個約束式的拉格朗日乘子。對所有輸入?yún)⒘壳髮?dǎo),使式(6.10)達到最小的必要條件為:(6.12)和21(6.13)由上述兩個必要條件,模糊C均值聚類算法是一個簡單的迭代過程。在批處理方式運行時,F(xiàn)CM用下列步驟確定聚類中心ci和隸屬矩陣U[1]:步驟1:用值在0,1間的隨機數(shù)初始化隸屬矩陣U,使其滿足式(6.9)中的約束條件步驟2:用式(6.12)計算c個聚類中心ci,i=1,…,c。步驟3:根據(jù)式(

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。