資源描述:
《中期檢查——基于加權(quán)向量提升的多尺度聚類數(shù)據(jù)挖掘》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、碩士學(xué)位論文中期檢查基于加權(quán)向量提升的多尺度聚類數(shù)據(jù)挖掘名業(yè)向師間專方教科究導(dǎo)姓學(xué)研指時(shí)蘇東海計(jì)算機(jī)應(yīng)用技術(shù)數(shù)據(jù)挖掘趙書良教授2013-03-27基于加權(quán)向量提升的多尺度聚類數(shù)據(jù)挖掘目錄基于加權(quán)向量提升的多尺度聚類數(shù)據(jù)挖掘11.研究H的和意義31.1.聚類挖掘是數(shù)據(jù)挖掘的一個(gè)重要研究方向31.2.多尺度聚類挖掘是聚類挖掘研究的一個(gè)新方向31.3.多尺度聚類數(shù)據(jù)挖掘面臨緊迫要求。32.國內(nèi)外研究現(xiàn)狀32.1.多尺度數(shù)裾挖掘的三種途徑32.2.某于三種途徑的多尺度聚類挖掘算法研究43.主要研究?jī)?nèi)容44.目前己完成情況44.1.基
2、于加權(quán)叫撒提升的多尺度聚類挖掘算法44.2.基準(zhǔn)尺度的選取準(zhǔn)則54.3.加權(quán)14量提升的權(quán)重的確定方法55.尚未完成的工作66.后期工作安排61.研究目的和意義聚類挖掘是數(shù)據(jù)挖掘的一個(gè)重要研究方向聚類挖掘的R的適將人景的數(shù)據(jù)對(duì)象按其£)身的屬性劃分成若千類別,以保證同類對(duì)象間盡可能相近,而類間對(duì)象盡可能相異,從中發(fā)現(xiàn)一些對(duì)用戶有川的信息以指導(dǎo)川戶進(jìn)行更深層次的數(shù)據(jù)挖掘或分析。因此,有效地進(jìn)行聚類挖掘至關(guān)重要。多尺度聚類挖掘是聚類挖掘研究的一個(gè)新方向多尺度聚類挖掘是針對(duì)數(shù)據(jù)的多尺度特性進(jìn)行的聚類挖掘,g在對(duì)數(shù)據(jù)的不M尺度進(jìn)行聚
3、類,數(shù)裾的多尺度聚類挖掘主要表現(xiàn)在兩個(gè)方ifti:時(shí)間尺度的可仲縮性和空間尺度的可擴(kuò)展性。使用P在不同的尺度層而對(duì)數(shù)據(jù)進(jìn)行觀察與分析。多尺度聚類數(shù)據(jù)挖掘面臨緊迫要求隨著數(shù)據(jù)挖掘技術(shù)的普及和放川,聚類挖掘作為數(shù)據(jù)挖掘領(lǐng)域屮的重要技術(shù)而得到廣泛的應(yīng)用,然而僅從數(shù)據(jù)的單一尺度進(jìn)行的聚類挖掘已不能滿足用廣觀察和分析數(shù)裾的要求。為適應(yīng)用戶從多個(gè)尺度探索數(shù)據(jù)的緊迫耍求,提Hi了一種基于加權(quán)A量提升的多尺度聚類挖掘算法,以實(shí)現(xiàn)在多個(gè)尺度層沏對(duì)數(shù)椐進(jìn)行聚類挖掘。內(nèi)外研究現(xiàn)狀多尺度數(shù)據(jù)挖掘的三種途徑孫慶先,方濤,郭達(dá)志等通過對(duì)空間數(shù)據(jù)挖掘屮的
4、尺度轉(zhuǎn)換進(jìn)行研究將數(shù)據(jù)的多尺度數(shù)據(jù)挖掘歸結(jié)為以卜三個(gè)途徑:在挖掘前將單一尺度的數(shù)據(jù)轉(zhuǎn)換為多個(gè)尺度的數(shù)據(jù),然后對(duì)多個(gè)尺度的數(shù)據(jù)分別進(jìn)行挖掘,即實(shí)現(xiàn)數(shù)裾的多尺度轉(zhuǎn)換;b)在數(shù)據(jù)挖掘算法屮增加調(diào)負(fù)尺度用的操作部件,以控制挖掘出的知識(shí)的尺度;c>將挖掘出的單一尺度的知識(shí)轉(zhuǎn)換為多個(gè)尺度的知識(shí),即實(shí)現(xiàn)知識(shí)的多尺度轉(zhuǎn)換。基于三種途徑的多尺度聚類挖掘算法研究對(duì)數(shù)裾的多尺度特性進(jìn)行聚類挖掘算法研究的方法主要集中于前兩種途徑,即實(shí)現(xiàn)數(shù)據(jù)的多尺度轉(zhuǎn)換。如施培蓓,郭玉堂等2011年通過比較聚類屮心與原點(diǎn)的距離和引入尺度參數(shù)來控制數(shù)據(jù)點(diǎn)與聚類中心的距
5、離的方法提ili了一種改進(jìn)的K-Means聚類算法實(shí)現(xiàn)了多尺度的i普聚類數(shù)據(jù)挖掘。這種類型的聚類算法需要對(duì)數(shù)據(jù)的每一個(gè)尺度應(yīng)用一次聚類挖掘算法,計(jì)算S大。而第三種途徑的多尺度聚類挖掘算法研究較少,剛好可以克服前兩種途徑的缺點(diǎn)。主要研究?jī)?nèi)容木文研究的核心是通過多尺度數(shù)據(jù)挖掘的第三種途挽,提出丼實(shí)現(xiàn)基于加權(quán)14景提升的多尺度聚類數(shù)據(jù)挖掘算法。算法酋先對(duì)選定的基準(zhǔn)尺度進(jìn)行聚類挖掘,再通過加權(quán)向量提介的尺度轉(zhuǎn)換方法獲取其它尺度上的聚類結(jié)果,因此木文的主要研究?jī)?nèi)容為:D基于加權(quán)句量提升的多尺度聚類挖掘算法2)葙準(zhǔn)尺度的選取準(zhǔn)則3)加權(quán)
6、昀景提升的權(quán)重的確定萬法4)多尺度聚類挖掘結(jié)果的評(píng)估目前已完成情況4.1.基于加權(quán)向量提升的多尺度聚類挖掘算法choosetheBasicScaleof0,BS0obtainclustersof0onthescaleBS0fortheotherscaleSof0,whichisnottheBasicScaleifS<0BS0thenSD(BS0—S)inverseclustersof0onscaleSifS>0BS0thenSU(BS0->tS)inverseclustersof0onscaleSexitwhentherei
7、snoanyscale基準(zhǔn)尺度的選取準(zhǔn)則1)距離設(shè)人準(zhǔn)則基準(zhǔn)尺度選擇時(shí),若所選擇的基準(zhǔn)尺度使得在所有目標(biāo)尺度上聚類結(jié)果的距離和達(dá)到最大,則該某準(zhǔn)尺度就是最佳的基準(zhǔn)尺度,定義兩基準(zhǔn)尺度聚類結(jié)果作為神經(jīng)網(wǎng)絡(luò)輸入端,R標(biāo)尺度聚類結(jié)果作為祌經(jīng)網(wǎng)絡(luò)輸出端,來構(gòu)建反向傳輸?shù)膬蓪由窠?jīng)網(wǎng)絡(luò)來學(xué)4加權(quán)向量提升中的權(quán)重。定義兩個(gè)基準(zhǔn)尺度間的距離度量:sie^BSi其屮f足基準(zhǔn)尺度在各個(gè)目稱尺度上的聚類結(jié)果。2)能量最大差異準(zhǔn)則對(duì)于L個(gè)類別,當(dāng)其屮其有相M的均值或者均值很接近時(shí),其特征向量的平方和即能量便提供Y—種分類信息:若不同類別的特征向fi
8、之間的能S相差越大,則類別的可分性就真好。因此定義如下的能M差異函數(shù),選取某一基準(zhǔn)尺度使得以其為參數(shù)的能量差異最大,這一基準(zhǔn)尺度便足最侏的基準(zhǔn)尺度:△£(叫,嘩S
9、/(^)2-/fe)2siensrsj^BSi-其中f是葙準(zhǔn)尺度在各個(gè)目標(biāo)尺度上的能s。3)相關(guān)系數(shù)最小準(zhǔn)則若所選擇的基