資源描述:
《0-基于尺度轉(zhuǎn)換機制的多尺度聚類挖掘算法-org》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、基于尺度轉(zhuǎn)換機制的多尺度聚類挖掘算法摘要:提出了一種基于秉要尺度的多尺度聚類挖掘算法iMSCA(importantMultiScaleClusteringAlgorithm),M傳統(tǒng)的多尺度聚類挖掘算法不M,某于重耍尺度的多尺度聚類挖掘算法首先在指定的重要尺度實現(xiàn)聚類挖掘結(jié)果,再通過尺度轉(zhuǎn)換機制求得用戶感興趣的K它尺度的聚類結(jié)果。實驗數(shù)據(jù)表明,木文提出的算法iMSCA同傳統(tǒng)的多尺度聚類挖掘算法相比其較好的性能。關(guān)鍵詞:聚類挖掘、多尺度、尺度轉(zhuǎn)換機制Abstract:AnimportantMultiScaleClusteringAlgorithm(iMSCA)isproposed.Unlike
2、thetraditionalmultiscaleclusteringalgorithms,iMSCAclustersthedataonanimportantscale,thenobtainstheclusteringresultsontheotherscaleswhichusersareinterestedinwiththehelpofScaleConvertMechanism.TheexperimentsturnsoutthatiMSCApresentedinthispaperdoeswellcomparedwiththetraditionalmultiscaleclusteringalg
3、orithms.KeyWords:ClusteringMining,Multiscalc,SealeConvertMechanism1.引言聚類挖掘是數(shù)據(jù)挖掘研究領域重要的組成部分,而多尺度聚類挖掘是解決具行多尺度特性的空間或時空數(shù)據(jù)的挖掘算法,亦將數(shù)據(jù)挖掘理論研究推向了另一個新的研究層次與方向。在國外,針對空間或時空數(shù)據(jù)的多尺度特性進行的研究人多集中于多尺度效應與多尺度建模方面等應川方面,如以非監(jiān)督多尺度數(shù)據(jù)流算法基于數(shù)據(jù)驅(qū)動的數(shù)據(jù)流對涉及吋間尺度的數(shù)裾流進行趨勢預測u,并將這種算法成功地應用于股票數(shù)椐的分析。:W冇學者將平穩(wěn)小波變換應川于多尺度分析提出了應川性強的尺度選擇方法進而構(gòu)建了W
4、種分類器一SVM分類器和Bayes分類器11。通過引入多尺度超像素分割生成屮間點,有學考提出了一種從雜亂影像中恢和分組物體對稱部分的方法n。但對多尺度聚類挖掘的理論研究還比較缺乏,在國內(nèi)奮學者通過引入多尺度控制參數(shù)米調(diào)節(jié)聚類挖掘的尺度特性而提出的多尺度譜聚類算法[],基于多尺度外行免疫克隆優(yōu)化聚類算法11實現(xiàn)Y在不同的進化吋期分別以人小不同的多種尺度并行地實現(xiàn)敁優(yōu)解空間的快速定位與精確查找,某于小波分解和領域信息的多尺度FCM聚類算法[]人人提高了圖像分割的效率、抗噪性和均勻性。似這些基于數(shù)據(jù)的多尺度特性進行的聚類挖掘人多足通過引入調(diào)節(jié)聚類尺度的控制參數(shù)[]來實現(xiàn)在每種尺度上的聚類挖掘。但這
5、種挖掘算法需要在每一種尺度上進行挖掘,計算fi大,在用戶不感興趣的尺度上進行的挖掘結(jié)果得不到川戶的認可,造成資源浪費,也不能實現(xiàn)在某-?指定尺度上的實時聚類挖掘。針對這些多尺度聚類挖掘算法的不足,本文提出了一種基于尺度轉(zhuǎn)換機制的多尺度聚類挖掘算法iMSCA(importantMulti-ScalebasedClusteringAlgorithm),算法先在指定的基尺度BS(BasicScale)上進行聚類挖棚,再借助于尺度轉(zhuǎn)換機制SCM(ScaleConvertMechanism)對K它尺度進行挖掘。實驗數(shù)據(jù)表明,木算法很好地克服了傳統(tǒng)多尺度聚類算法存在的不足,聚類效果亦能得到保證。本文第二
6、部分對算法忍想進行闡述,并引入了某尺度的概念和尺度轉(zhuǎn)換機制;第三部分詳細描述/本文的算法過稈:第四部分對本文算法的性能進行了分析和驗證;蛣后對木文研究工作進行了總結(jié)和展望。1.基尺度與尺度轉(zhuǎn)換機制針對傳統(tǒng)多尺度聚類挖掘存在的不足,本文通過引入基尺度與尺度轉(zhuǎn)換機制具奮多尺度特性的空間或時空數(shù)裾庫進行挖掘。尺度在學術(shù)界并沒冇一個確定的概念,1992年,Lam和Quattrochi對尺度總結(jié)了四種含義1g胃,分別是a)傳統(tǒng)意義下的制圖比例尺或地圖比例尺,b)地理范圍或研究問題的域,c)空間分辨率,d)研究對象的尺度。鑒于此并結(jié)合本文研究的需要冇必要對尺度的一些葙本概念進行定義,并在此葙礎上引入尺度
7、轉(zhuǎn)換機制定義1尺度(Scale):是桁對某一事物或現(xiàn)象0(Qbject)進行研究時所采用的空間或時間單位,記作S(文中若無特殊說叨均指研究所采用的空間單位,如某地區(qū)5mx5m的影像數(shù)據(jù),對某竹人U1數(shù)據(jù)按村級單位進行統(tǒng)計等)。定義2大、小尺度:設S、S’是研究某一事物或現(xiàn)象0時所采用的空尺度,若尺度s所表示的空問單位比尺度s’更大(更小),則稱尺度s比尺度s’更大(更小),記作sy而尺度S’比尺度S更小(更大