資源描述:
《投影尋蹤方法及其應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、投影尋蹤方法及其應(yīng)用金菊良合肥工業(yè)大學(xué)土木建筑工程學(xué)院水利系(郵編230009,電話0551-2903357,JINJL66@126.com)報告內(nèi)容1投影尋蹤方法的基本原理與建模步驟4總結(jié)與討論3基于加速遺傳算法的投影尋蹤等級評價模型2基于加速遺傳算法的投影尋蹤聚類模型1投影尋蹤方法的基本原理與建模型步驟1.1投影尋蹤方法的基本原理投影尋蹤(projectionpursuit,PP)方法屬于直接由樣本數(shù)據(jù)驅(qū)動的探索性數(shù)據(jù)分析方法。它把高維數(shù)據(jù){x(i,j)}通過某種組合投影到低維子空間上{z(i)},對于投影到的構(gòu)形,采用投
2、影指標(biāo)函數(shù)Q(z(i))來描述投影暴露原系統(tǒng)某種分類排序結(jié)構(gòu)的可能性大小,尋找出使投影指標(biāo)函數(shù)達(dá)到最優(yōu)(即能反映高維數(shù)據(jù)結(jié)構(gòu)或特征)的投影值z(i),然后根據(jù)該投影值來分析高維數(shù)據(jù)的分類結(jié)構(gòu)特征(如投影尋蹤聚類評價模型),或根據(jù)該投影值與研究系統(tǒng)的實際輸出值之間的散點圖構(gòu)造適當(dāng)?shù)臄?shù)學(xué)模型以模擬系統(tǒng)輸出(如投影尋蹤等級評價模型)。1投影尋蹤方法的基本原理與建模步驟1.2投影尋蹤方法的建模步驟步驟1:高維樣本數(shù)據(jù)的預(yù)處理,確定系統(tǒng)輸入。步驟2:構(gòu)造投影指標(biāo)函數(shù)。步驟3:優(yōu)化投影指標(biāo)函數(shù)。步驟4:建立系統(tǒng)模型。2基于加速遺傳算法的投
3、影尋蹤聚類模型AGA-PPCE2.1基于加速遺傳算法的投影尋蹤聚類模型的建立步驟1:評價指標(biāo)值的歸一化處理。設(shè)樣本集為{x*(i,j)
4、i=1~n,j=1~p}。其中x*(i,j)為第i個樣本第j個指標(biāo)值。為消除各指標(biāo)值的量綱和統(tǒng)一各指標(biāo)值的變化范圍,可采用下式進(jìn)行極值歸一化處理:式中,xmin(j)、xmax(j)分別為樣本集中第j個指標(biāo)值的最小值和最大值。2基于加速遺傳算法的投影尋蹤聚類模型AGA-PPCE2.1基于加速遺傳算法的投影尋蹤聚類模型的建立步驟2:構(gòu)造投影指標(biāo)函數(shù)。PP方法就是把p維數(shù)據(jù){x(i,j)
5、j=1~
6、p}綜合成以a=(a(1),a(2),…,a(p))為投影方向的一維投影值z(i)然后根據(jù){z(i)
7、i=1~n}的一維散布圖進(jìn)行分類。式(2.2)中a為單位長度向量。在綜合投影值時,要求投影值z(i)的散布特征應(yīng)為:局部投影點盡可能密集,最好凝聚成若干個點團(tuán);而在整體上投影點團(tuán)之間盡可能散開。據(jù)此投影指標(biāo)函數(shù)可構(gòu)造為Q(a)=SzDz(2.3)式中,Sz為投影值z(i)的標(biāo)準(zhǔn)差,Dz為投影值z(i)的局部密度,即2基于加速遺傳算法的投影尋蹤聚類模型AGA-PPCE2.1基于加速遺傳算法的投影尋蹤聚類模型的建立步驟3:優(yōu)化投影
8、指標(biāo)函數(shù)。當(dāng)各指標(biāo)值的樣本集給定時,投影指標(biāo)函數(shù)Q(a)只隨投影方向a的變化而變化??赏ㄟ^求解投影指標(biāo)函數(shù)最大化問題來估計最大可能暴露高維數(shù)據(jù)某類特征結(jié)構(gòu)的最佳投影方向:maxQ(a)=SzDz(2.4)這是一個以{a(j)
9、j=1~p}為優(yōu)化變量的復(fù)雜非線性優(yōu)化問題,用模擬生物優(yōu)勝劣汰規(guī)則與群體內(nèi)部染色體信息交換機(jī)制的加速遺傳算法(AGA)來求解上述問題較為簡便和有效。加速遺傳算法(AGA)步驟1:模型參數(shù)的編碼。設(shè)碼長為e,第j個參數(shù)的變化區(qū)間為[aj,bj],j=1~p。把這些區(qū)間等分成2e-1個子區(qū)間:cj=aj+Ij
10、dj(2)式中子區(qū)間長度dj=(bj-aj)/(2e-1)是常數(shù);搜索步數(shù)Ij為小于2e的十進(jìn)制整數(shù),是變數(shù);j=1~p(下同)。把Ij轉(zhuǎn)化成e位二進(jìn)制數(shù){ia(j,k)|,k=1~e}(下同),即式(3):步驟2:初始父代群體的隨機(jī)生成。生成n組各p個均勻隨機(jī)數(shù)(簡稱隨機(jī)數(shù)){u(j,i)|,i=1~n},經(jīng)下式轉(zhuǎn)換成十進(jìn)制整數(shù)。Ij(i)=INT[u(j,i)2e](4)式中INT為取整函數(shù)。由式(3)得對應(yīng)二進(jìn)制數(shù)ia(j,k,i),它們與n組模型參數(shù)cj(i)對應(yīng),并把它們作為初始父代個體群。編碼與解碼的邏輯過程:cj
11、(i)~Ij(i)~ia(j,k,i)步驟3:父代個體適應(yīng)能力評價。把第i組參數(shù)代入式(1)得目標(biāo)函數(shù)值fi,fi越小表示模型與觀測值擬合得越好,適應(yīng)能力越強,設(shè)第i個個體的適應(yīng)能力與fi成反比。構(gòu)造選擇概率序列{pi},把[0,1]區(qū)間分成n個子區(qū)間:(0,p1),(p1,p2),…,[pn-1,pn],它們與n個個體一一對應(yīng),fi越小的個體對應(yīng)的子區(qū)間長度越大。步驟4:父代個體的概率選擇。生成n個隨機(jī)數(shù){ui
12、i=1~n},若ui∈[pi-1,pi],則選取第i個父代個體,其二進(jìn)制數(shù)記為ia1(j,k,i)。同理可得另外的
13、n個父代個體ia2(j,k,i)。選擇是遺傳算法的關(guān)鍵,它體現(xiàn)了優(yōu)勝劣汰的思想。步驟5:父代個體的雜交。由步4得到的父代個體配對成n對雙親。生成兩隨機(jī)數(shù)u1和u2,再轉(zhuǎn)成十進(jìn)制整數(shù):IU1=INT(1+u1·e),IU2=INT(1+u2·e),設(shè)IU1≤IU2(否則互換其值