資源描述:
《一種改進(jìn)的基于粒子群的聚類算法.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、第31卷第9期計(jì)算機(jī)應(yīng)用研究V01.31No.92014年9月ApplicationResearchofComputersSep.2014一種改進(jìn)的基于粒子群的聚類算法水楊志,羅可(長(zhǎng)沙理工大學(xué)計(jì)算機(jī)與通信工程學(xué)院,長(zhǎng)沙410014)摘要:針對(duì)K—means對(duì)初始聚類中心敏感和易陷入局部最優(yōu)的缺點(diǎn),提出了一種改進(jìn)的基于粒子群的聚類算法。該算法結(jié)合基于密度和最大最小距離法來(lái)確定初始聚類中心,解決K—means對(duì)初始值敏感的問(wèn)題;利用粒子群算法全局尋優(yōu)能力強(qiáng)的優(yōu)點(diǎn),避免K-means陷入局部最優(yōu)。通過(guò)對(duì)樣本集各維屬性的規(guī)范化處理,慣性權(quán)值采用凹函數(shù)遞減,計(jì)算相異度矩陣,引入用
2、群體適應(yīng)度方差,進(jìn)一步優(yōu)化混合算法。實(shí)驗(yàn)結(jié)果表明,該算法具有更高的準(zhǔn)確率和更強(qiáng)的收斂能力。關(guān)鍵詞:聚類算法;粒子群優(yōu)化算法;相異度矩陣;最大最小距離法;K-means;適應(yīng)度方差中圖分類號(hào):TP311;TP301.6文獻(xiàn)標(biāo)志碼:A文章編號(hào):1001—3695(2014)09—2597—03doi:10.3969/j.issn.1001-3695.2014.09.008ImprovedclusteringalgorithmbasedonparticleswarmoptimizationYANGZhi,LUOKe(InstituteofComputer&Communicati
3、onEngineering,ChangshaUnive~iqofScience&Technology,Changsha410014,China)Abstract:ThispaperproposedanimprovedclusteringalgorithmbasedonparticleswarInoptimizationthatwasaimedtore—solvetheK—meansalgorithmshortcomingofsensitivingtotheinitialclusteringcenterandeasinesstofallintolocaloptimum.Th
4、eimprovedalgorithmcombineddensity—basedandmaximumminimumdistancemethodtodetermineinitialclusteringcenter,solvedproblemoftheK-meanswassensitivetotheinitialclusteringcenter.TheadvantagesofPSO’SstrongglobaloptimizationabilitywereusedtoavoidK—meansfallingintolocaloptimum.Bynormalizingeachattr
5、ibuteofthesampleset,inertiaweightwasdecreasedbyconcavefunction,calculatedthedissimilaritymatrixandintroducedparticleswarm’Sfitnessvariancetoopti—mizethehybridalgorithmfurther.Theexperimentalresultsshowthatthisalgorithmhashigheraccuracyandstrongerconver—gencecapability.Keywords:clusteringa
6、lgorithm;particleswarmoptimization;dissimilaritymatrix;max—mindistancemethod;K-means;fitt—nessVariance聚類是一種無(wú)監(jiān)督學(xué)習(xí),它廣泛地應(yīng)用在多個(gè)領(lǐng)域,包括對(duì)K.means算法進(jìn)行優(yōu)化,文獻(xiàn)[6]利用粒子群全局尋優(yōu)能力數(shù)據(jù)挖掘、模式識(shí)別、計(jì)算機(jī)視覺(jué)和生物信息學(xué),是重要的數(shù)據(jù)強(qiáng)的特點(diǎn)改進(jìn)K-means算法易陷入局部最優(yōu)的缺點(diǎn),但沒(méi)有利分析方法之一。聚類是根據(jù)數(shù)據(jù)集中數(shù)據(jù)的相關(guān)性將其劃分用好K.means算法的局部搜索能力強(qiáng)的特點(diǎn)。本文利用文獻(xiàn)為若干簇的過(guò)程,目的是使同一簇內(nèi)數(shù)據(jù)
7、點(diǎn)之間的相似性大,[7~9]的方法動(dòng)態(tài)地自動(dòng)確定聚類數(shù)和初始聚類中心,結(jié)合不同簇之間數(shù)據(jù)點(diǎn)相似性小。文獻(xiàn)[10—12]的方法對(duì)樣本集的規(guī)范化處理、調(diào)整粒子群權(quán)聚類算法中的劃分和層次的方法是最流行的聚類技術(shù)。重、計(jì)算相異度矩陣和群體適應(yīng)度方差進(jìn)行優(yōu)化,提出了一種基于劃分的聚類算法主要是K—means及其優(yōu)化算法;基于層次改進(jìn)的基于粒子群的聚類算法,取得了較好的聚類效果。的聚類算法有UPGMA及改進(jìn)算法。1967年,由MacQueen提1預(yù)備知識(shí)出的基于目標(biāo)函數(shù)的K-means算法是一種有代表性的劃分方法,具有簡(jiǎn)單、快速、有效處理