資源描述:
《中期檢查——基于加權(quán)向量提升的多尺度聚類數(shù)據(jù)挖掘》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、碩士學(xué)位論文中期檢查基于加權(quán)向量提升的多尺度聚類數(shù)據(jù)挖掘名業(yè)向師間專方教科究導(dǎo)姓學(xué)研指時蘇東海計算機應(yīng)用技術(shù)數(shù)據(jù)挖掘趙書良教授2013-03-27基于加權(quán)向量提升的多尺度聚類數(shù)據(jù)挖掘目錄基于加權(quán)向量提升的多尺度聚類數(shù)據(jù)挖掘11.研究H的和意義31.1.聚類挖掘是數(shù)據(jù)挖掘的一個重要研究方向31.2.多尺度聚類挖掘是聚類挖掘研究的一個新方向31.3.多尺度聚類數(shù)據(jù)挖掘面臨緊迫要求。32.國內(nèi)外研究現(xiàn)狀32.1.多尺度數(shù)裾挖掘的三種途徑32.2.某于三種途徑的多尺度聚類挖掘算法研究43.主要研究內(nèi)容44.目前己完成情況44.1.基
2、于加權(quán)叫撒提升的多尺度聚類挖掘算法44.2.基準(zhǔn)尺度的選取準(zhǔn)則54.3.加權(quán)14量提升的權(quán)重的確定方法55.尚未完成的工作66.后期工作安排61.研究目的和意義聚類挖掘是數(shù)據(jù)挖掘的一個重要研究方向聚類挖掘的R的適將人景的數(shù)據(jù)對象按其£)身的屬性劃分成若千類別,以保證同類對象間盡可能相近,而類間對象盡可能相異,從中發(fā)現(xiàn)一些對用戶有川的信息以指導(dǎo)川戶進行更深層次的數(shù)據(jù)挖掘或分析。因此,有效地進行聚類挖掘至關(guān)重要。多尺度聚類挖掘是聚類挖掘研究的一個新方向多尺度聚類挖掘是針對數(shù)據(jù)的多尺度特性進行的聚類挖掘,g在對數(shù)據(jù)的不M尺度進行聚
3、類,數(shù)裾的多尺度聚類挖掘主要表現(xiàn)在兩個方ifti:時間尺度的可仲縮性和空間尺度的可擴展性。使用P在不同的尺度層而對數(shù)據(jù)進行觀察與分析。多尺度聚類數(shù)據(jù)挖掘面臨緊迫要求隨著數(shù)據(jù)挖掘技術(shù)的普及和放川,聚類挖掘作為數(shù)據(jù)挖掘領(lǐng)域屮的重要技術(shù)而得到廣泛的應(yīng)用,然而僅從數(shù)據(jù)的單一尺度進行的聚類挖掘已不能滿足用廣觀察和分析數(shù)裾的要求。為適應(yīng)用戶從多個尺度探索數(shù)據(jù)的緊迫耍求,提Hi了一種基于加權(quán)A量提升的多尺度聚類挖掘算法,以實現(xiàn)在多個尺度層沏對數(shù)椐進行聚類挖掘。內(nèi)外研究現(xiàn)狀多尺度數(shù)據(jù)挖掘的三種途徑孫慶先,方濤,郭達志等通過對空間數(shù)據(jù)挖掘屮的
4、尺度轉(zhuǎn)換進行研究將數(shù)據(jù)的多尺度數(shù)據(jù)挖掘歸結(jié)為以卜三個途徑:在挖掘前將單一尺度的數(shù)據(jù)轉(zhuǎn)換為多個尺度的數(shù)據(jù),然后對多個尺度的數(shù)據(jù)分別進行挖掘,即實現(xiàn)數(shù)裾的多尺度轉(zhuǎn)換;b)在數(shù)據(jù)挖掘算法屮增加調(diào)負(fù)尺度用的操作部件,以控制挖掘出的知識的尺度;c>將挖掘出的單一尺度的知識轉(zhuǎn)換為多個尺度的知識,即實現(xiàn)知識的多尺度轉(zhuǎn)換?;谌N途徑的多尺度聚類挖掘算法研究對數(shù)裾的多尺度特性進行聚類挖掘算法研究的方法主要集中于前兩種途徑,即實現(xiàn)數(shù)據(jù)的多尺度轉(zhuǎn)換。如施培蓓,郭玉堂等2011年通過比較聚類屮心與原點的距離和引入尺度參數(shù)來控制數(shù)據(jù)點與聚類中心的距
5、離的方法提ili了一種改進的K-Means聚類算法實現(xiàn)了多尺度的i普聚類數(shù)據(jù)挖掘。這種類型的聚類算法需要對數(shù)據(jù)的每一個尺度應(yīng)用一次聚類挖掘算法,計算S大。而第三種途徑的多尺度聚類挖掘算法研究較少,剛好可以克服前兩種途徑的缺點。主要研究內(nèi)容木文研究的核心是通過多尺度數(shù)據(jù)挖掘的第三種途挽,提出丼實現(xiàn)基于加權(quán)14景提升的多尺度聚類數(shù)據(jù)挖掘算法。算法酋先對選定的基準(zhǔn)尺度進行聚類挖掘,再通過加權(quán)向量提介的尺度轉(zhuǎn)換方法獲取其它尺度上的聚類結(jié)果,因此木文的主要研究內(nèi)容為:D基于加權(quán)句量提升的多尺度聚類挖掘算法2)葙準(zhǔn)尺度的選取準(zhǔn)則3)加權(quán)
6、昀景提升的權(quán)重的確定萬法4)多尺度聚類挖掘結(jié)果的評估目前已完成情況4.1.基于加權(quán)向量提升的多尺度聚類挖掘算法choosetheBasicScaleof0,BS0obtainclustersof0onthescaleBS0fortheotherscaleSof0,whichisnottheBasicScaleifS<0BS0thenSD(BS0—S)inverseclustersof0onscaleSifS>0BS0thenSU(BS0->tS)inverseclustersof0onscaleSexitwhentherei
7、snoanyscale基準(zhǔn)尺度的選取準(zhǔn)則1)距離設(shè)人準(zhǔn)則基準(zhǔn)尺度選擇時,若所選擇的基準(zhǔn)尺度使得在所有目標(biāo)尺度上聚類結(jié)果的距離和達到最大,則該某準(zhǔn)尺度就是最佳的基準(zhǔn)尺度,定義兩基準(zhǔn)尺度聚類結(jié)果作為神經(jīng)網(wǎng)絡(luò)輸入端,R標(biāo)尺度聚類結(jié)果作為祌經(jīng)網(wǎng)絡(luò)輸出端,來構(gòu)建反向傳輸?shù)膬蓪由窠?jīng)網(wǎng)絡(luò)來學(xué)4加權(quán)向量提升中的權(quán)重。定義兩個基準(zhǔn)尺度間的距離度量:sie^BSi其屮f足基準(zhǔn)尺度在各個目稱尺度上的聚類結(jié)果。2)能量最大差異準(zhǔn)則對于L個類別,當(dāng)其屮其有相M的均值或者均值很接近時,其特征向量的平方和即能量便提供Y—種分類信息:若不同類別的特征向fi
8、之間的能S相差越大,則類別的可分性就真好。因此定義如下的能M差異函數(shù),選取某一基準(zhǔn)尺度使得以其為參數(shù)的能量差異最大,這一基準(zhǔn)尺度便足最侏的基準(zhǔn)尺度:△£(叫,嘩S
9、/(^)2-/fe)2siensrsj^BSi-其中f是葙準(zhǔn)尺度在各個目標(biāo)尺度上的能s。3)相關(guān)系數(shù)最小準(zhǔn)則若所選擇的基