資源描述:
《基于改進(jìn)粒計(jì)算的K-medoids聚類算法.pdf》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、JournalofComputerApplicationsISSN1oo1.90812014.07.10計(jì)算機(jī)應(yīng)用,2014,34(7):1997—2000CODENJYIIDUhttp://www.joca.cn文章編號:1001.9081(2014)07.1997.04doi:10.11772/j.issn.1001-9081.2014.07.1997基于改進(jìn)粒計(jì)算的K-medoids聚類算法潘楚。,羅可(長沙理工大學(xué)計(jì)算機(jī)與通信工程學(xué)院,長沙410114)(通信作者電子郵箱panchu2012@163.corn)摘要:針對傳統(tǒng)K-
2、medoids聚類算法對初始聚類中心敏感、收斂速度緩慢以及聚類精度不夠高等缺點(diǎn),提出一種基于改進(jìn)粒計(jì)算、粒度迭代搜索策略和優(yōu)化適應(yīng)度函數(shù)的新算法。該算法利用粒計(jì)算思想在有效粒子中選擇K個(gè)密度大且距離較遠(yuǎn)的粒子,選擇其中心點(diǎn)作為個(gè)聚類初始中心點(diǎn);并在對應(yīng)的K個(gè)有效粒子中進(jìn)行中心點(diǎn)更新,來減少迭代次數(shù);采用類間距離和類內(nèi)距離優(yōu)化適應(yīng)度函數(shù)來提高聚類的精度。實(shí)驗(yàn)結(jié)果表明:該算法在UCI多個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集中測試,在有效縮短迭代次數(shù)的同時(shí)提高了算法聚類準(zhǔn)確率。關(guān)鍵詞:K-medoids聚類算法;改進(jìn)粒計(jì)算;粒度迭代搜索策略;優(yōu)化適應(yīng)度函數(shù)中圖分類號:
3、TP301.6文獻(xiàn)標(biāo)志碼:AImprovedK—medoidsclusteringalgorithmbasedonimprovedgranularcomputingPANChu.LUOKe(SchoolofComputerandCommunicationEngineering,ChangshaUniversityofScienceandTechnology,ChangshaHunan410114,China)Abstract:Duetothedisadvantagessuchassensitivetotheinitialselectio
4、nofthecenter,slowconvergentspeedandpooraccuracyintraditionalK-medoidsclusteringalgorithm,anovelK-medoidsalgorithmbasedonimprovedGranularComputing(GrC),granuleiterativesearchstrategyandanewfitnessfunctionwasproposedinthispaper.ThealgorithmselectedKgranulesusingthegranular
5、computingthinkinginthehigh-densityareawhichwerefarapart,selecteditscenterpointastheKinitialclustercenters,andupdatedKcenterpointsincandidategranulestoreducethenumberofiterations.What’Smore,anewfitnessfunctionwaspresentedbasedonbetween-classdistanceandwithin—classdistance
6、toimproveclusteringaccuracy.TestedonanumberofstandarddatasetsinUCI,theexperimentalresultsshowthatthisnewalgorithmreuducesthenumberofiterationsefectivelyandimprovestheaccuracyofclustering.Keywords:K-medoidsclusteringalgorithm;improvedgranularcomputing;granuleiterativesear
7、chstrategy;improvedfitnessfunction確率但增加了時(shí)間復(fù)雜度。文獻(xiàn)[8—9]分別提出了基于最0引言小支撐樹初始化聚類中心點(diǎn),基于metricaccessmethod的聚聚類算法是根據(jù)數(shù)據(jù)的相似性將數(shù)據(jù)對象劃分在不同簇類方法,提高了聚類的準(zhǔn)確率但也增加了額外的開銷。文獻(xiàn)中的過程,使得同一簇中的對象具有較高的相似度,不同簇中[10—12]結(jié)合人工智能仿生算法優(yōu)化K-medoids聚類算法,數(shù)據(jù)對象不相似。K-medoids算法是屬于基于劃分方法的一提高算法全局搜索能力,但同時(shí)也犧牲時(shí)間復(fù)雜度。種?,是K-mea
8、ns算法的改進(jìn)。K-medoids算法能有效處理異上述文獻(xiàn)中,雖然對K-medoids聚類算法進(jìn)行了改進(jìn)。常數(shù)據(jù)和噪聲數(shù)據(jù),具有很好的魯棒性,所以在聚類算法中得有些算法解決了初始化敏感問題,但增加了時(shí)間復(fù)雜