【精品】多元分析5.doc

【精品】多元分析5.doc

ID:51078771

大小:143.00 KB

頁(yè)數(shù):10頁(yè)

時(shí)間:2020-03-18

【精品】多元分析5.doc_第1頁(yè)
【精品】多元分析5.doc_第2頁(yè)
【精品】多元分析5.doc_第3頁(yè)
【精品】多元分析5.doc_第4頁(yè)
【精品】多元分析5.doc_第5頁(yè)
資源描述:

《【精品】多元分析5.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、第五章主成分分析引言在實(shí)際問(wèn)題的研究中,i方面為了獲収充分多的信息,往往選擇許多指標(biāo)(變量)去進(jìn)行觀測(cè)。另一方而,希望能把多指標(biāo)綜合成盡可能少的幾個(gè)綜合指標(biāo),使分析簡(jiǎn)化。如人口普查往往要調(diào)査每個(gè)人的姓名、年齡、性別、文化程度、職業(yè)等,對(duì)企業(yè)的統(tǒng)計(jì)中,往往有產(chǎn)量、產(chǎn)值、品種、消耗、費(fèi)用、成本、生產(chǎn)率、收入、利潤(rùn)等。主成分分析就是把多個(gè)指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo)的一種通曲適用的統(tǒng)計(jì)分析方法。如在“服裝定型”研究中,耍加工一件上衣,需要測(cè)量身高、臂長(zhǎng)、胸圍等?!?主成分一、主成分的概念設(shè)X=(X1,X2,---,為隨機(jī)向量,它的數(shù)學(xué)期望向量為//=0,協(xié)差陣為V>0,作標(biāo)

2、準(zhǔn)化的線性紐合,乙=0:x(即0Q=1),如果y,方差垠大,則稱(chēng)r,=pX為x的第一主成分;作標(biāo)準(zhǔn)化線性組合嶺=0;X,如果Yr方差第r大且};與E(i=l,2,???,—l)不相關(guān),則稱(chēng)Yr=/3;X為X的第I?個(gè)主成分(一般地,V>0,//=0,0;0「=1)o二、主成分的求法設(shè)X=(X],X2,…,X”)',V>0,//=0,作標(biāo)準(zhǔn)化的線性組合Y=哄,則Y的方差為E(r2)=E(0'XX'f3)=0'E(X?X')0二0V0,那么求第一主成就是求在00=1條件下,使0V0最大,求0的條件極值。令0=0V0—2(00—1),求導(dǎo)后令其為零,理=2U0—220

3、=080GP(V-AE)/3=0(1)???07?=1??.0H()故M—2科=0(2)求⑵的特征根2,>220'x(l)得:0'(U-2E)0=O即0V0=2故y=fJ'X的方差為;I,要使方差最大,取最大值入,因此X的第一主成分為其中01為對(duì)應(yīng)入的標(biāo)準(zhǔn)化特征向量;若;I?為第二大,對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量為02,則X的第二主成分為Y?=/3;X綜上所述,從p個(gè)指標(biāo)出發(fā),求主成分步驟為:設(shè)資料矩陣為/尤11X2…XpXn2…Xnp⑴計(jì)算協(xié)差陣(或相關(guān)陣)V⑵求IV-AE=0的特征根:2,>22>???>(3)求(V_2E)0=0的標(biāo)準(zhǔn)化特征向量肉,02,…,

4、0“(4)寫(xiě)出主成分:h=0:X(r=l,2,…,p)三、主成分的性質(zhì)主成分向量Y=哄(00=E)G、其中0=(0】,02,???,0P),記人=???k'p丿1.若Y=/3'X,且陽(yáng)=E,則Y的協(xié)差陣E(yyz)=/3(Vf3=A,且pl]A=???<幾p丿證:丁(J=1,2…,P)A=0A(*)0'x(*)得:0V0=00A又???/3,/3=E:.0V0=p'/3=A即E(yy')=0V0=a就是說(shuō),Y的協(xié)差陣0V0為對(duì)■角陣A???

5、V一ZE

6、=

7、00

8、

9、V-AE=

10、0爐-征

11、

12、0

13、=

14、0V0-W=A-AE=f[3—A)/=!就是說(shuō),

15、V-AE

16、

17、=O的根2為A對(duì)角線上元素。1.若X=(X「X2,…,XJ,且V>0,//=0,則經(jīng)正交變換Y=0:X(00=E)后,廣義方差及各主成分方差之和都不變。證:???E(X)=O,E(XX')=V???E(Y)=O,E(rr)=0V0于是,

18、0V0

19、=

20、0M

21、

22、0

23、=

24、00

25、

26、V

27、=

28、V

29、就是說(shuō),主成分向量Y的廣義方差

30、0V0

31、等于原向量X的廣義方差

32、V

33、又有^E(y2,)=rr(/?v/?)=tr(vm=tr(VE)=tr(V)二fE(X[)/=!/=!DP即=;=l/=1pp就是說(shuō),乞主成分Y方差和工人等于原有變量X方差和工匕,則nP個(gè)變量變成P/=!/=!個(gè)主成

34、分,其總方差沒(méi)有變化。四、例題設(shè)市場(chǎng)上肉類(lèi)X

35、,雞蛋X2,水果X3,三種商晶價(jià)格的月份資料的協(xié)差陣為-2-4522V=25-2一4試求三種商品月份價(jià)格的主成分。解:

36、V-2E

37、=(2-10)(2-l)22,=10,22==I對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量分別為:所求主成分分別為:

38、22K=-X.+—X.——X.13334272比=—X.+—x3-2~22a/27272K=^X.-—X.+—X33丨6一6其方差分別為:v(yI)=io,v(r2)=v(y3)=i第一主成分方差占總方差的83%,所以第一主成分綜合反映了三種商品價(jià)格的絕大部分變動(dòng)?!?主成分分析的方法一、樣本主成

39、分…求樣本主成分的步/設(shè)樣本資料矩陣為x=(X],???,x”y=(?),“=…驟為:(1)數(shù)據(jù)標(biāo)準(zhǔn)化Y_y作標(biāo)準(zhǔn)化變換:X)二仝丄上Si其中n*=1S2i=SH?=—!—V(xw-Xz)2(i=l,2,???,P;k=l,2,???,n)?_1Jt=i(2)計(jì)算協(xié)差陣或相關(guān)陣卩二巴)嶺=丄^“或R=(?n-其中(2)求R的特征根及其標(biāo)準(zhǔn)化的特征向量:R-久科=0:入〉X)〉…〉0(R-花)0=0:0],02,…,0人(3)寫(xiě)出主成分:Yr=/?;X(廠=1,2,…,Q二、方差貢獻(xiàn)率1?稱(chēng)為第j個(gè)主成分的方差貢獻(xiàn)率Ea/=!2p如第一主成分乙=&X的方差入最大,

40、比值萬(wàn)亠表

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。