資源描述:
《【精品】多元分析5.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、第五章主成分分析引言在實(shí)際問(wèn)題的研究中,i方面為了獲収充分多的信息,往往選擇許多指標(biāo)(變量)去進(jìn)行觀測(cè)。另一方而,希望能把多指標(biāo)綜合成盡可能少的幾個(gè)綜合指標(biāo),使分析簡(jiǎn)化。如人口普查往往要調(diào)査每個(gè)人的姓名、年齡、性別、文化程度、職業(yè)等,對(duì)企業(yè)的統(tǒng)計(jì)中,往往有產(chǎn)量、產(chǎn)值、品種、消耗、費(fèi)用、成本、生產(chǎn)率、收入、利潤(rùn)等。主成分分析就是把多個(gè)指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo)的一種通曲適用的統(tǒng)計(jì)分析方法。如在“服裝定型”研究中,耍加工一件上衣,需要測(cè)量身高、臂長(zhǎng)、胸圍等?!?主成分一、主成分的概念設(shè)X=(X1,X2,---,為隨機(jī)向量,它的數(shù)學(xué)期望向量為//=0,協(xié)差陣為V>0,作標(biāo)
2、準(zhǔn)化的線性紐合,乙=0:x(即0Q=1),如果y,方差垠大,則稱(chēng)r,=pX為x的第一主成分;作標(biāo)準(zhǔn)化線性組合嶺=0;X,如果Yr方差第r大且};與E(i=l,2,???,—l)不相關(guān),則稱(chēng)Yr=/3;X為X的第I?個(gè)主成分(一般地,V>0,//=0,0;0「=1)o二、主成分的求法設(shè)X=(X],X2,…,X”)',V>0,//=0,作標(biāo)準(zhǔn)化的線性組合Y=哄,則Y的方差為E(r2)=E(0'XX'f3)=0'E(X?X')0二0V0,那么求第一主成就是求在00=1條件下,使0V0最大,求0的條件極值。令0=0V0—2(00—1),求導(dǎo)后令其為零,理=2U0—220
3、=080GP(V-AE)/3=0(1)???07?=1??.0H()故M—2科=0(2)求⑵的特征根2,>220'x(l)得:0'(U-2E)0=O即0V0=2故y=fJ'X的方差為;I,要使方差最大,取最大值入,因此X的第一主成分為其中01為對(duì)應(yīng)入的標(biāo)準(zhǔn)化特征向量;若;I?為第二大,對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量為02,則X的第二主成分為Y?=/3;X綜上所述,從p個(gè)指標(biāo)出發(fā),求主成分步驟為:設(shè)資料矩陣為/尤11X2…XpXn2…Xnp⑴計(jì)算協(xié)差陣(或相關(guān)陣)V⑵求IV-AE=0的特征根:2,>22>???>(3)求(V_2E)0=0的標(biāo)準(zhǔn)化特征向量肉,02,…,
4、0“(4)寫(xiě)出主成分:h=0:X(r=l,2,…,p)三、主成分的性質(zhì)主成分向量Y=哄(00=E)G、其中0=(0】,02,???,0P),記人=???k'p丿1.若Y=/3'X,且陽(yáng)=E,則Y的協(xié)差陣E(yyz)=/3(Vf3=A,且pl]A=???<幾p丿證:丁(J=1,2…,P)A=0A(*)0'x(*)得:0V0=00A又???/3,/3=E:.0V0=p'/3=A即E(yy')=0V0=a就是說(shuō),Y的協(xié)差陣0V0為對(duì)■角陣A???
5、V一ZE
6、=
7、00
8、
9、V-AE=
10、0爐-征
11、
12、0
13、=
14、0V0-W=A-AE=f[3—A)/=!就是說(shuō),
15、V-AE
16、
17、=O的根2為A對(duì)角線上元素。1.若X=(X「X2,…,XJ,且V>0,//=0,則經(jīng)正交變換Y=0:X(00=E)后,廣義方差及各主成分方差之和都不變。證:???E(X)=O,E(XX')=V???E(Y)=O,E(rr)=0V0于是,
18、0V0
19、=
20、0M
21、
22、0
23、=
24、00
25、
26、V
27、=
28、V
29、就是說(shuō),主成分向量Y的廣義方差
30、0V0
31、等于原向量X的廣義方差
32、V
33、又有^E(y2,)=rr(/?v/?)=tr(vm=tr(VE)=tr(V)二fE(X[)/=!/=!DP即=;=l/=1pp就是說(shuō),乞主成分Y方差和工人等于原有變量X方差和工匕,則nP個(gè)變量變成P/=!/=!個(gè)主成
34、分,其總方差沒(méi)有變化。四、例題設(shè)市場(chǎng)上肉類(lèi)X
35、,雞蛋X2,水果X3,三種商晶價(jià)格的月份資料的協(xié)差陣為-2-4522V=25-2一4試求三種商品月份價(jià)格的主成分。解:
36、V-2E
37、=(2-10)(2-l)22,=10,22==I對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量分別為:所求主成分分別為:
38、22K=-X.+—X.——X.13334272比=—X.+—x3-2~22a/27272K=^X.-—X.+—X33丨6一6其方差分別為:v(yI)=io,v(r2)=v(y3)=i第一主成分方差占總方差的83%,所以第一主成分綜合反映了三種商品價(jià)格的絕大部分變動(dòng)?!?主成分分析的方法一、樣本主成
39、分…求樣本主成分的步/設(shè)樣本資料矩陣為x=(X],???,x”y=(?),“=…驟為:(1)數(shù)據(jù)標(biāo)準(zhǔn)化Y_y作標(biāo)準(zhǔn)化變換:X)二仝丄上Si其中n*=1S2i=SH?=—!—V(xw-Xz)2(i=l,2,???,P;k=l,2,???,n)?_1Jt=i(2)計(jì)算協(xié)差陣或相關(guān)陣卩二巴)嶺=丄^“或R=(?n-其中(2)求R的特征根及其標(biāo)準(zhǔn)化的特征向量:R-久科=0:入〉X)〉…〉0(R-花)0=0:0],02,…,0人(3)寫(xiě)出主成分:Yr=/?;X(廠=1,2,…,Q二、方差貢獻(xiàn)率1?稱(chēng)為第j個(gè)主成分的方差貢獻(xiàn)率Ea/=!2p如第一主成分乙=&X的方差入最大,
40、比值萬(wàn)亠表