資源描述:
《基于主成分分析和灰色關聯(lián)聚類分析的指標綜合方法研究》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、萬方數(shù)據(jù)第13卷專輯2005年10月中國管理科學ChineseJournalofManagementScienceV01.13,SpecialIssueOctober,2005文章編號:1003—207(2005)zk一0018一05基于主成分分析和灰色關聯(lián)聚類分析的指標綜合方法研究孫曉東,胡勁松,焦胡(青島大學管理科學與工程系,山東青島266071)摘要:在進行多指標分析和評價的過程中,首先對指標進行灰色關聯(lián)聚類分析,將指標分成若干可以定義的類,每個聚類代表同一類指標;其次對每個聚類進行主成分分析,提取主成分,獲得該類指標的主成分集合;最后基于權重思想綜合所有聚類的主成分
2、集合,形成既反映全體指標信息又體現(xiàn)指標聚類差異性的綜合指標。通過一個算例說明該方法計算方便,客觀合理。關鍵詞:灰色關聯(lián)聚類分析;絕對關聯(lián)度;主成分分析中圖分類號:F272文獻標識碼:A1引言在多指標綜合評價或分析的過程中,往往會遇到這樣的矛盾:一是指標多,帶來計算和分析上的不便,而且浪費大量存儲空間和消耗過多機器處理時間;二是多指標間的相關性,造成指標提供的整體信息發(fā)生重疊,不易得出簡明的規(guī)律。為了解決這方面的問題,Hotelling在1933年提出了主成分分析(PCA)方法。該方法是利用降維的思想將多指標轉化為少數(shù)幾個綜合指標的多元統(tǒng)計分析。然而,主成分分析方法基于數(shù)據(jù)全
3、體,在對全體指標籠統(tǒng)綜合的同時忽視了指標之間的類別性差異問題,也就是是否有若干個指標關系十分密切而同屬一類。事實上,指標之間不僅僅具有相關性,也具有類別性。顯然,對同類指標進行主成分分析比對全體指標進行主成分分析更易于解釋,更具合理性和客觀性。為此,解決這一問題的思路便是,首先對指標進行聚類分析,將指標聚集成幾個可以定義的類;其次對每一個聚類進行主成分分析,得到每類指標的主成分集合,并對集合中的元素進行綜合;最后基于每類的權重,綜合所有指標聚類形成反映全體指標信息的綜合指標?;诨疑到y(tǒng)分析所需原始數(shù)據(jù)少、原理簡單、運算方便、易于挖掘數(shù)據(jù)規(guī)律等優(yōu)點,本文提出了一種主成分分析
4、和灰色關聯(lián)聚類分析相結合的指標綜合方法。2基于主成分分析和灰色關聯(lián)聚類分析的指標綜合方法2.1指標的主成分分析主成分分析¨。o(PrincipalComponentsAnaly—sis)也稱為主分量分析,是利用降維的思想,把多指標轉化為少數(shù)幾個綜合指標的多元統(tǒng)計分析方法。主成分分析研究的目的就是如何將多指標進行最佳綜合簡化,最終轉化為較少的綜合指標。也就是說,要在力保數(shù)據(jù)丟失最少的原則下,對高維變量空間進行降維處理。主成分分析的基本方法是通過構造原指標的適當?shù)木€性組合,以產(chǎn)生一系列互不相關的新綜合指標,從中選出少數(shù)幾個新指標并使它們含有盡可能多的原指標集合帶有的信息,從而使
5、得用這幾個新指標代替原指標分析問題和解決問題成為可能。綜合指標是原來多個指標的線性組合,雖然這些線性綜合指標不能直接觀測到,但綜合指標問相互不相關,又能反映多個指標的信息。如果原指標為艽。,戈:,?,并。,主成分分析后得到的新指標兒,扎,?,扎均是菇,,石:,?,省。的線性組合(p≥m):收稿日期:2005—06—07基金項目:國家自然科學基金(70371024);山東省自然科學基金(Y2003H01)作者簡介:孫曉東(1979一),男(漢族),山東安丘人,青島大學管理科學與工程系碩士研究生,研究方向:系統(tǒng)優(yōu)化、決策分析、物流工程其中Yl=ull菇l+u12戈2+?+Mlm
6、石m),22“2l戈l+u22X2+?+2mxm或寫成l,:Ury%=upl戈l+Up2+?+UpmXm萬方數(shù)據(jù)專輯孫曉東等:基于主成分分析和灰色關聯(lián)聚類分析的指標綜合方法研究U=UllU21U12//'22U1m/Z2m=(阢,%,?,虬)×=酲xY.,Y:,?,Y。稱為主成分,其中Y。為第一主成分,Y:為第二主成分,依此類推。主成分分析的任務就是求出系數(shù)矩陣u,找到戈。,戈:,.?,戈。的線性組合來表示各主成分。其具體計算步驟為(1)指標數(shù)據(jù)的標準化分析或評價中確定的各個指標,都有不同的量綱、不同的數(shù)量級,而不同量綱、不同數(shù)量級的數(shù)據(jù)不能放在一起直接進行比較,也不能直接
7、用于多元統(tǒng)計分析,需要對指標的數(shù)值進行標準化處理,以消除其量綱、數(shù)量級上的差異,使其具有可比性。指標數(shù)值的標準化處理通常采用數(shù)據(jù)變換處理,主要有中心變換、規(guī)格化變換、標準化變換、對數(shù)變換等,而最為常用的方法則是標準化變換:茁一Z菇:=——三蘭=蘭i=1,2,?,n;J=1,2,?,m。4var(戈J)其中,戈,和~/var(戈,)分別為第,個指標的均值和標準差,得到標準化數(shù)據(jù)矩陣X;=(xi:,x:,x:,?,x二)1,i=1,2,?,n(2)計算x的相關矩陣R以及尺的特征根設為Al≥A2≥?≥A。≥0相應的正交標