資源描述:
《基于主成分分析和灰色關(guān)聯(lián)聚類分析的指標(biāo)綜合方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、萬(wàn)方數(shù)據(jù)第13卷專輯2005年10月中國(guó)管理科學(xué)ChineseJournalofManagementScienceV01.13,SpecialIssueOctober,2005文章編號(hào):1003—207(2005)zk一0018一05基于主成分分析和灰色關(guān)聯(lián)聚類分析的指標(biāo)綜合方法研究孫曉東,胡勁松,焦胡(青島大學(xué)管理科學(xué)與工程系,山東青島266071)摘要:在進(jìn)行多指標(biāo)分析和評(píng)價(jià)的過(guò)程中,首先對(duì)指標(biāo)進(jìn)行灰色關(guān)聯(lián)聚類分析,將指標(biāo)分成若干可以定義的類,每個(gè)聚類代表同一類指標(biāo);其次對(duì)每個(gè)聚類進(jìn)行主成分分析,提取主成分,獲得該類指標(biāo)的主成分集合;最后基于權(quán)重思想綜合所有聚類的主成分
2、集合,形成既反映全體指標(biāo)信息又體現(xiàn)指標(biāo)聚類差異性的綜合指標(biāo)。通過(guò)一個(gè)算例說(shuō)明該方法計(jì)算方便,客觀合理。關(guān)鍵詞:灰色關(guān)聯(lián)聚類分析;絕對(duì)關(guān)聯(lián)度;主成分分析中圖分類號(hào):F272文獻(xiàn)標(biāo)識(shí)碼:A1引言在多指標(biāo)綜合評(píng)價(jià)或分析的過(guò)程中,往往會(huì)遇到這樣的矛盾:一是指標(biāo)多,帶來(lái)計(jì)算和分析上的不便,而且浪費(fèi)大量存儲(chǔ)空間和消耗過(guò)多機(jī)器處理時(shí)間;二是多指標(biāo)間的相關(guān)性,造成指標(biāo)提供的整體信息發(fā)生重疊,不易得出簡(jiǎn)明的規(guī)律。為了解決這方面的問(wèn)題,Hotelling在1933年提出了主成分分析(PCA)方法。該方法是利用降維的思想將多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)分析。然而,主成分分析方法基于數(shù)據(jù)全
3、體,在對(duì)全體指標(biāo)籠統(tǒng)綜合的同時(shí)忽視了指標(biāo)之間的類別性差異問(wèn)題,也就是是否有若干個(gè)指標(biāo)關(guān)系十分密切而同屬一類。事實(shí)上,指標(biāo)之間不僅僅具有相關(guān)性,也具有類別性。顯然,對(duì)同類指標(biāo)進(jìn)行主成分分析比對(duì)全體指標(biāo)進(jìn)行主成分分析更易于解釋,更具合理性和客觀性。為此,解決這一問(wèn)題的思路便是,首先對(duì)指標(biāo)進(jìn)行聚類分析,將指標(biāo)聚集成幾個(gè)可以定義的類;其次對(duì)每一個(gè)聚類進(jìn)行主成分分析,得到每類指標(biāo)的主成分集合,并對(duì)集合中的元素進(jìn)行綜合;最后基于每類的權(quán)重,綜合所有指標(biāo)聚類形成反映全體指標(biāo)信息的綜合指標(biāo)?;诨疑到y(tǒng)分析所需原始數(shù)據(jù)少、原理簡(jiǎn)單、運(yùn)算方便、易于挖掘數(shù)據(jù)規(guī)律等優(yōu)點(diǎn),本文提出了一種主成分分析
4、和灰色關(guān)聯(lián)聚類分析相結(jié)合的指標(biāo)綜合方法。2基于主成分分析和灰色關(guān)聯(lián)聚類分析的指標(biāo)綜合方法2.1指標(biāo)的主成分分析主成分分析¨。o(PrincipalComponentsAnaly—sis)也稱為主分量分析,是利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)分析方法。主成分分析研究的目的就是如何將多指標(biāo)進(jìn)行最佳綜合簡(jiǎn)化,最終轉(zhuǎn)化為較少的綜合指標(biāo)。也就是說(shuō),要在力保數(shù)據(jù)丟失最少的原則下,對(duì)高維變量空間進(jìn)行降維處理。主成分分析的基本方法是通過(guò)構(gòu)造原指標(biāo)的適當(dāng)?shù)木€性組合,以產(chǎn)生一系列互不相關(guān)的新綜合指標(biāo),從中選出少數(shù)幾個(gè)新指標(biāo)并使它們含有盡可能多的原指標(biāo)集合帶有的信息,從而使
5、得用這幾個(gè)新指標(biāo)代替原指標(biāo)分析問(wèn)題和解決問(wèn)題成為可能。綜合指標(biāo)是原來(lái)多個(gè)指標(biāo)的線性組合,雖然這些線性綜合指標(biāo)不能直接觀測(cè)到,但綜合指標(biāo)問(wèn)相互不相關(guān),又能反映多個(gè)指標(biāo)的信息。如果原指標(biāo)為艽。,戈:,?,并。,主成分分析后得到的新指標(biāo)兒,扎,?,扎均是菇,,石:,?,省。的線性組合(p≥m):收稿日期:2005—06—07基金項(xiàng)目:國(guó)家自然科學(xué)基金(70371024);山東省自然科學(xué)基金(Y2003H01)作者簡(jiǎn)介:孫曉東(1979一),男(漢族),山東安丘人,青島大學(xué)管理科學(xué)與工程系碩士研究生,研究方向:系統(tǒng)優(yōu)化、決策分析、物流工程其中Yl=ull菇l+u12戈2+?+Mlm
6、石m),22“2l戈l+u22X2+?+2mxm或?qū)懗蒷,:Ury%=upl戈l+Up2+?+UpmXm萬(wàn)方數(shù)據(jù)專輯孫曉東等:基于主成分分析和灰色關(guān)聯(lián)聚類分析的指標(biāo)綜合方法研究U=UllU21U12//'22U1m/Z2m=(阢,%,?,虬)×=酲xY.,Y:,?,Y。稱為主成分,其中Y。為第一主成分,Y:為第二主成分,依此類推。主成分分析的任務(wù)就是求出系數(shù)矩陣u,找到戈。,戈:,.?,戈。的線性組合來(lái)表示各主成分。其具體計(jì)算步驟為(1)指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化分析或評(píng)價(jià)中確定的各個(gè)指標(biāo),都有不同的量綱、不同的數(shù)量級(jí),而不同量綱、不同數(shù)量級(jí)的數(shù)據(jù)不能放在一起直接進(jìn)行比較,也不能直接
7、用于多元統(tǒng)計(jì)分析,需要對(duì)指標(biāo)的數(shù)值進(jìn)行標(biāo)準(zhǔn)化處理,以消除其量綱、數(shù)量級(jí)上的差異,使其具有可比性。指標(biāo)數(shù)值的標(biāo)準(zhǔn)化處理通常采用數(shù)據(jù)變換處理,主要有中心變換、規(guī)格化變換、標(biāo)準(zhǔn)化變換、對(duì)數(shù)變換等,而最為常用的方法則是標(biāo)準(zhǔn)化變換:茁一Z菇:=——三蘭=蘭i=1,2,?,n;J=1,2,?,m。4var(戈J)其中,戈,和~/var(戈,)分別為第,個(gè)指標(biāo)的均值和標(biāo)準(zhǔn)差,得到標(biāo)準(zhǔn)化數(shù)據(jù)矩陣X;=(xi:,x:,x:,?,x二)1,i=1,2,?,n(2)計(jì)算x的相關(guān)矩陣R以及尺的特征根設(shè)為Al≥A2≥?≥A?!?相應(yīng)的正交標(biāo)