資源描述:
《基于微粒群優(yōu)化算法的聚類分析及應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、分類號::TP391單位代碼::10110學(xué)號:S20080668基于中北大學(xué)微粒群優(yōu)碩士學(xué)位論文化算法的聚基于微粒群優(yōu)化算法的聚類分析及應(yīng)分析及應(yīng)用用吳變樣中碩士研究生指導(dǎo)教師吳變樣楊明北大學(xué)學(xué)科專業(yè)應(yīng)用數(shù)學(xué)2011年5月30日圖書分類號TP391密級非密UDC碩士學(xué)位論文基于微粒群優(yōu)化算法的聚類分析及應(yīng)用吳變樣指導(dǎo)教師(姓名、職稱)楊明副教授申請學(xué)位級別專業(yè)名稱論文提交日期論文答辯日期理學(xué)碩士應(yīng)用數(shù)學(xué)年______月______日年______月______日學(xué)位授予日期期______年_
2、_____月______日論文評閱人人__________________________________________________________答辯委員會(huì)主席席_______________________年月日原創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在指導(dǎo)教師的指導(dǎo)下,獨(dú)立進(jìn)行研究所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含其他個(gè)人或集體已經(jīng)發(fā)表或撰寫過的科研成果。對本文的研究作出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本聲明的法律責(zé)任由本人承擔(dān)。論文作者簽名:日期:關(guān)于學(xué)位論文使用權(quán)的說明本人完全了解中北大學(xué)有
3、關(guān)保管、使用學(xué)位論文的規(guī)定,其中包括:①學(xué)校有權(quán)保管、并向有關(guān)部門送交學(xué)位論文的原件與復(fù)印件;②學(xué)??梢圆捎糜坝?、縮印或其它復(fù)制手段復(fù)制并保存學(xué)位論文;③學(xué)??稍试S學(xué)位論文被查閱或借閱;④學(xué)??梢詫W(xué)術(shù)交流為目的,復(fù)制贈(zèng)送和交換學(xué)位論文;⑤學(xué)??梢怨紝W(xué)位論文的全部或部分內(nèi)容(保密學(xué)位論文在解密后遵守此規(guī)定)。簽名:日期:導(dǎo)師簽名:日期:中北大學(xué)學(xué)位論文基于微粒群優(yōu)化算法的聚類分析及應(yīng)用摘要聚類分析作為數(shù)據(jù)挖掘和模式識別的主要方法之一,越來越引起人們的關(guān)注。在眾多的聚類方法中,C-均值算法是目前最實(shí)用也最受歡迎的算法之一。它不僅有著深厚的數(shù)學(xué)基礎(chǔ),而且
4、在很多領(lǐng)域獲得了成功的應(yīng)用。但C-均值聚類算法的致命缺陷是對初始值比較敏感,往往只能得到模型的局部極值點(diǎn),造成聚類結(jié)果的隨機(jī)性,影響聚類的效果。微粒群優(yōu)化算法(particleswarmoptimization,PSO)是一種應(yīng)用廣泛的全局優(yōu)化算法,它的主要特點(diǎn)是結(jié)構(gòu)簡單、易于實(shí)現(xiàn)、通用性強(qiáng)、具有記憶功能。因此,把微粒群優(yōu)化算法同C-均值算法相結(jié)合,既能發(fā)揮微粒群優(yōu)化算法的全局尋優(yōu)能力,又可以兼顧C(jī)-均值算法的局部尋優(yōu)能力,從而更好的解決聚類問題。本文主要對微粒群優(yōu)化算法在聚類分析中的應(yīng)用進(jìn)行了研究。首先采用模糊球殼聚類算法FCSS(fuzzycspher
5、icalshells)分別對非同心球殼狀數(shù)據(jù)集和同心圓數(shù)據(jù)集進(jìn)行了聚類實(shí)驗(yàn)。結(jié)果發(fā)現(xiàn)FCSS算法對非同心球殼狀數(shù)據(jù)集分類的效果還是比較好的,而對于同心球殼狀數(shù)據(jù)集的聚類基本無效。因此提出使用標(biāo)準(zhǔn)微粒群優(yōu)化算法與FCSS相結(jié)合的球殼聚類方法(PSO-FCSS)來解決同心球殼聚類問題。通過實(shí)驗(yàn)發(fā)現(xiàn):在對同心圓數(shù)據(jù)集的聚類問題上,PSO-FCSS算法與GA-FCSS算法(基于遺傳算法的模糊球殼聚類算法)相比,有相對較快的收斂速度,但是全局收斂性較差,表現(xiàn)為隨著數(shù)據(jù)點(diǎn)數(shù)和聚類類別數(shù)的增加,PSO-FCSS算法的聚類效果明顯不盡人意;而GA-FCSS算法具有較好的全
6、局收斂能力,但其缺陷是收斂速度慢。綜合上述因素,將GA(遺傳算法)、PSO算法以及FCSS相結(jié)合,提出混合球殼聚類算法PSO-GA-FCSS,用遺傳算法的交叉因子和變異因子來優(yōu)化微粒位置,增加其收斂到全局最優(yōu)解的能力,用于解決球殼狀數(shù)據(jù)的聚類問題。此外,本文還將基于微粒群優(yōu)化算法的C-均值聚類算法應(yīng)用于電信企業(yè)的客戶細(xì)分中。在細(xì)分過程中,先采用微粒群優(yōu)化算法產(chǎn)生初始解群后再進(jìn)行迭代更新,在算法后期對新產(chǎn)生的個(gè)體用C-均值算法進(jìn)行優(yōu)化,提高算法的收斂速度。這樣,算法基本不存在隨機(jī)尋優(yōu)的退化現(xiàn)象,后期收斂比較平穩(wěn),很少有波動(dòng)現(xiàn)象,可以很好的解決客戶分中北大學(xué)學(xué)
7、位論文類問題,對企業(yè)決策和運(yùn)營有很大的指導(dǎo)意義。關(guān)鍵詞:聚類,模糊C-均值算法,模糊球殼聚類算法,微粒群優(yōu)化,客戶細(xì)分中北大學(xué)學(xué)位論文ClusteringanalysisandapplicationbasedonparticleswarmoptimizationalgorithmABSTRACTAsoneofthemostimportanttoolfordataminingandpatternrecognition,clusteringanalysishasbeenwidespreadwidelyandhasbeenahottopic.C-meansclu
8、steringalgorithmisthemostwidespre