資源描述:
《開題報(bào)告-模糊聚類算法改進(jìn)與應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、模糊聚類算法的改進(jìn)與應(yīng)用研究1研究的背景及意義1.1聚類研究背景及意義我們正處在一個(gè)信息大爆炸的時(shí)代,時(shí)間數(shù)據(jù)庫(kù)、空間數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)、工程數(shù)據(jù)庫(kù)、統(tǒng)計(jì)數(shù)據(jù)庫(kù)等面向特殊應(yīng)用的數(shù)據(jù)庫(kù)系統(tǒng)的出現(xiàn),使得數(shù)據(jù)庫(kù)存儲(chǔ)的信息量大大增加,此時(shí)對(duì)于這些大數(shù)量、寬涉及面的數(shù)據(jù),依靠以往那種由簡(jiǎn)單匯總、按指定模式分析的方式已無法實(shí)現(xiàn)對(duì)數(shù)據(jù)的有效分析處理。數(shù)據(jù)的豐富帶來了對(duì)強(qiáng)有力數(shù)據(jù)分析工具的需求,人們希望有能夠提高更高層次的數(shù)據(jù)分析工具,希望計(jì)算機(jī)能幫助我們分析數(shù)據(jù)、理解數(shù)據(jù),并能從大量數(shù)據(jù)中提取知識(shí)模式,進(jìn)而幫助我們
2、做岀決策。正是為了滿足這種耍求,越來越多的專家、學(xué)者投身到了研究數(shù)據(jù)、分析數(shù)據(jù)的浪潮當(dāng)中,推動(dòng)了此項(xiàng)研究不斷向廣度和深度發(fā)展。聚類是一種無監(jiān)督的分類,是在沒有任何先驗(yàn)知識(shí)的情況下,把事物按照某種相似性度量劃分為若干個(gè)類,使得類內(nèi)事物之間盡可能相似,而不同類的事物之間盡可能相異。物以類聚,人以群分,人類認(rèn)識(shí)世界的過程就是在不斷區(qū)分不同事物,總結(jié)相似事物Z間的共同點(diǎn)或相似性的過程。聚類分析是用數(shù)學(xué)和統(tǒng)計(jì)學(xué)的方法研究所給事物集合的分類問題。由于研究角度的不同,聚類分析可能出應(yīng)用于不同的研究領(lǐng)域,如數(shù)據(jù)挖掘、模
3、式識(shí)別、多元統(tǒng)計(jì)分析等學(xué)科。聚類的研究成果豐富和促進(jìn)了很多相關(guān)領(lǐng)域的應(yīng)用,對(duì)模式識(shí)別、圖像處理、模糊控制等的發(fā)展產(chǎn)生了重耍影響。因此,研究聚類分析具有重大的理論研究?jī)r(jià)值和現(xiàn)實(shí)意義。傳統(tǒng)的聚類分析是一種硬劃分,它把每個(gè)待辨識(shí)的對(duì)象嚴(yán)格地劃分到某類中,具有“非此即彼”的性質(zhì),然而在實(shí)際的問題處理中,大多數(shù)對(duì)象并沒有嚴(yán)格的屬性,它們?cè)谛詰B(tài)和類屬方面存在著中介性,因此人們提出了軟劃分,用模糊的方法來處理聚類問題,即現(xiàn)在的FCM聚類算法。模糊聚類引入模糊集理論使用模糊隸屬度的概念,來表達(dá)一個(gè)對(duì)彖屬于某個(gè)類的程度,
4、很好地解決了這個(gè)問題。由于模糊聚類能夠更客觀地描述事實(shí),因而成為聚類分析的主流研究方向。1965年美國(guó)自動(dòng)控制論專家和數(shù)學(xué)家扎徳教授(L.A.zadeh)提出了模糊集合理論(FuzzysetThcory)[1]□在模糊集合理論中,集合中的元素具有較為靈活的隸屬關(guān)系,且其在模糊集合中的隸屬度可以在(O,1)Z間任意取值。1978年,扎德教授又提出了可能性理論,其理論意義在于它為模糊集理論建立了一個(gè)實(shí)際應(yīng)用上的理論框架。伴隨著模糊數(shù)學(xué)理論和可能性理論的形成、發(fā)展和深化,RusPini⑵又提岀了模糊劃分的概念
5、,隨后Dunn又將Ruspini的類內(nèi)平方謀差和(WGSS)J,推廣到模糊聚類的類內(nèi)加權(quán)平方誤差和函數(shù)L,形成了最初的模糊聚類理論。在模糊聚類中,基于目標(biāo)函數(shù)的方法具有設(shè)計(jì)簡(jiǎn)單、解決問題范圍廣、結(jié)果準(zhǔn)確率較高等特點(diǎn),而且可以轉(zhuǎn)化為數(shù)學(xué)上的極值問題,因此應(yīng)用廣泛,逐漸成為聚類研究的熱點(diǎn)。模糊C■均值算法是圖像分割中使用最多的方法之一,模糊聚類算法在模式識(shí)別、數(shù)據(jù)挖掘、邊緣檢測(cè)、圖像處理、入侵檢測(cè)、文本聚類、客戶分類等領(lǐng)域也都發(fā)揮著重要作用。因此研究模糊聚類尤其是基于目標(biāo)函數(shù)的模糊聚類具有重大的現(xiàn)實(shí)意義和廣
6、闊的應(yīng)用前景。1.2圖像分割的相關(guān)背景知識(shí)圖像分割是指將一副圖像分解為若干互不交疊的、有意義的、具有相同性質(zhì)的區(qū)域。好的圖像分割應(yīng)具備以下特征
7、3]:⑴分割出來的各區(qū)域?qū)δ撤N性質(zhì)(灰度、紋理)而言具有相似性,區(qū)域內(nèi)部是聯(lián)通的且沒有過多的小孔;(2)相鄰區(qū)域?qū)Ψ指钏罁?jù)的性質(zhì)有明顯的差異;(3)區(qū)域邊界是明確的。大多數(shù)的圖像分割算法只滿足上述的部分特征,而U實(shí)際的圖像處理和分析都是面向某種具體應(yīng)用的。在具體處理時(shí),不同的圖像分割方法總是在各種約束條件之間尋找一種合理的平衡。同時(shí),圖像的分割性能受諸多因素的
8、影響,包括圖像的同質(zhì)性、空間結(jié)構(gòu)特性、連續(xù)性、紋理、內(nèi)容、物理視覺特性等等。因此,當(dāng)前圖像分割的發(fā)展趨勢(shì)主要有以下幾點(diǎn):(1)多種分割方法的結(jié)合;(2)人機(jī)交互的分割方法;⑶人工智能技術(shù)的應(yīng)用。2主要聚類方法的分類冃前常見的聚類算法很多,主要的聚類算法可以劃分為如下幾類[4]:1)劃分方法(partitioningmethods):該類方法是在給定N個(gè)待聚類的數(shù)據(jù)對(duì)象和已知?jiǎng)澐謹(jǐn)?shù)目k的條件下,將數(shù)據(jù)劃分為k組,其中每組中的元素個(gè)數(shù)不能少于一個(gè)。這類算法的常見步驟為:首先建立一個(gè)初始劃分,然后采用迭代重定
9、位技術(shù),通過組間移動(dòng)的方式,使劃分逐漸變“好”。好的標(biāo)準(zhǔn)通常是同一分組屮的樣本越接近越好,而不同分組中的樣本離得越遠(yuǎn)越好。這類算法的代表算法有:基于距離的聚類(K-MEANS)算法、K中心點(diǎn)(K-MEDOIDS)算法、隨機(jī)搜索優(yōu)化(CLARANS)算法等。這類算法的缺點(diǎn)是對(duì)初始聚類中心敏感,容易陷入局部最優(yōu)。2)層次方法(hierarchicalmethods):這種算法把數(shù)據(jù)對(duì)象分解為許多層,每層的數(shù)據(jù)對(duì)彖代表一個(gè)聚類結(jié)果,最底層的聚類結(jié)