資源描述:
《0-基于尺度轉換機制的多尺度聚類挖掘算法-(摘要-引言-定義-算法部分)》由會員上傳分享,免費在線閱讀,更多相關內容在工程資料-天天文庫。
1、基于尺度轉換機制的多尺度聚類挖掘算法摘要:捉出了-?種基于重要尺度的多尺度聚類挖掘算法iMSCA(importantMultiScaleClusteringAlgorithm),同傳統(tǒng)的多尺度聚類挖掘算法不同,基于重要尺度的多尺度聚類挖掘算法首先在指定的重要尺度實現(xiàn)聚類挖掘結果,再通過尺度轉換機制求得用戶感興趣的其它尺度的聚類結果。實驗數(shù)據(jù)表切,木文捉出的算法iMSCA同傳統(tǒng)的多尺度聚類挖掘算法相比具較好的性能。關鍵詞:聚類挖掘、多尺度、尺度轉換機制Abstract:AnimportantMultiScalcClusterin
2、gAlgorithm(iMSCA)isproposed.Unlikethetraditionalmultiscaleclusteringalgorithms,iMSCAclustersthedataonanimportantscale,thenobtainstheclusteringresultsontheotherscaleswhichusersareinterestedinwiththehelpofScaleConvertMechanism?TheexperimentsturnsoutthatiMSCApresentedi
3、nthispaperdocswellcomparedwiththetraditionalmultiscaleclusteringalgorithms.KeyWords:ClusteringMining,Multiscale,SealeConvertMechanism1.引言聚類挖掘是數(shù)據(jù)挖掘研究領域重要的組成部分,而多尺度聚類挖掘是解決具冇多尺度特性的空間或時空數(shù)據(jù)的挖掘算法,亦將數(shù)據(jù)挖掘理論研究推向了另一個新的研究層次與方向。在國外,針對空間或時空數(shù)據(jù)的多尺度特性進行的研究大多集中于多尺度效應與多尺度建模方面等應用方而,如以
4、非監(jiān)督多尺度數(shù)據(jù)流算法基于數(shù)據(jù)驅動的數(shù)據(jù)流對涉及時間尺度的數(shù)據(jù)流進行趨勢預測",并將這種算法成功地應用于股票數(shù)據(jù)的分析。另冇學者將平穩(wěn)小波變換應用于多尺度分析提出了應用性強的尺度選擇方法進而構建了兩種分類器-SVM分類器和Bayes分類器-通過引入多尺度超像索分割生成小I'可點,有學者提出了一種從雜亂影像中恢復和分組物體對稱部分的方法“。但對多尺度聚類挖掘的理論研究還比較缺乏,在國內有學者通過引入多尺度控制參數(shù)來調節(jié)聚類挖掘的尺度特性而提出的多尺度譜聚類算法[】,基于多尺度并行免疫克隆優(yōu)化聚類算法U實現(xiàn)了在不同的進化時期分別以
5、大小不同的多種尺度并行地實現(xiàn)最優(yōu)解空間的快速定位與精確查找,基于小波分解和領域信息的多尺度FCM聚類算法口大人提高了圖像分割的效率、抗噪性和均勻性。但這些基于數(shù)據(jù)的多尺度特性進行的聚類挖掘大多是通過引入調節(jié)聚類尺度的控制參數(shù)U來實現(xiàn)在每種尺度上的聚類挖掘。但這種挖掘算法需要在每一種尺度上進行挖掘,計算雖大,在用戶不感興趣的尺度上進行的挖掘結果得不到用戶的認可,造成資源浪費,也不能實現(xiàn)在某一-指定尺度上的實時聚類挖掘。針對這些多尺度聚類挖掘算法的不足,本文提出了一種基于尺度轉換機制的多尺度聚類挖掘算法iMSCA(importan
6、tMulti-ScalcbasedClusteringAlgorithm),算法先在指定的基尺度BS(BasicScale)_h進行聚類挖掘,再借助于尺度轉換機制SCM(ScaleConvertMechanism)對其它尺度進行挖掘。實驗數(shù)據(jù)表明,木算法很好地克服了傳統(tǒng)多尺度聚類算法存在的不足,聚類效果亦能得到保證。木文第二部分對算法思想進行闡述,并引入了基尺度的概念和尺度轉換機制;第三部分詳細描述了本文的算法過程;第四部分對本文算法的性能進行了分析和驗證;最后對本文研究工作進行了總結和展望。2.基尺度與尺度轉換機制針對傳統(tǒng)多
7、尺度聚類挖掘存在的不足,本文通過引入基尺度與尺度轉換機制具有多尺度特性的空間或時空數(shù)據(jù)庫進行挖掘。尺度在學術界并沒冇一個確定的概念,1992年,Lam和Quattrochi對尺度總結了四種含義涉多尺咖機喚其咖,分別是a)傳統(tǒng)意義下的制圖比例尺或地圖比例尺,b)地理范圍或研究問題的域,c)空間分辨率,cl)研究對象的尺度。鑒于此并結合木文研究的盂要冇必要對尺度的一些基木概念進行定義,并在此基礎上引入尺度轉換機制。定義1尺度(Scale):是指對某一事物或現(xiàn)彖0(Qbject)進行研究時所采用的空間或時間單位,記作S(文中若無特殊
8、說明均指研究所采用的空間單位,如某地區(qū)5mx5m的影像數(shù)據(jù),對某省人口數(shù)據(jù)按村級單位進行統(tǒng)計等)。定義2大、小尺度:設S、S'是研究某一事物或現(xiàn)象0時所采用的空間尺度,若尺度S所表示的空間單位比尺度S'更大(更小),則稱尺度S比尺度S*更人(更小),記作s》°s*(Sy°S‘