資源描述:
《多元統(tǒng)計(jì)分析方法》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、<多元統(tǒng)計(jì)分析方法>Ch1基本概念1.多元總體:該總體有多個屬性,可表示為X=x1…xp,考察一個P元總體即是考察這個總體中每個對象的P個屬性。2.多元樣本數(shù)據(jù):X=x1,x2…xn=x11,x12,…,x1n…xp1,xp2,…,xpn3.多元總體的樣本統(tǒng)計(jì)參數(shù):3.1單總體3.1.1分屬性行樣本統(tǒng)計(jì)參數(shù)樣本平均值向量:中心化數(shù)據(jù):原始數(shù)據(jù)-平均數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)=中心化數(shù)據(jù)/該行樣本標(biāo)準(zhǔn)差樣本離差矩陣Q:Q=XX’,即兩兩中心化屬性行乘積和,qαβ=1nxαi-xαxβi-xβ(1≤α,β≤p)樣本協(xié)方差矩陣S:S=Q/n=XX’/n(n為樣本數(shù))樣本相關(guān)矩陣R:用X中的兩行計(jì)算兩屬性間
2、的相關(guān),rαβ=sαβsααsββ=qαβqααqββ3.1.2樣本間統(tǒng)計(jì)參數(shù)各種距離:歐氏距離,馬氏距離,B模距離,絕對距離,切比雪夫距離相似系數(shù):定量:用X中的兩列算出的相關(guān)系數(shù);夾角余弦cαβ=xi'xjxixj1pxαixαj1pxαi21nxαj2定性:首先轉(zhuǎn)化為0,1型定性數(shù)據(jù);對于p元總體的變量α,兩樣本單元i,j配對情況有四種(1,1),(1,0),(0,1),(0,0),分別用a,b,c,d表示所有變量中這四種情況出現(xiàn)的次數(shù)。顯然a,d出現(xiàn)的次數(shù)越多,兩樣本越接近。由此定義匹配系數(shù):fij=a+dp=1-絕對距離p;修正的夾角余弦fij=ada+ba+cb+d(c+d
3、)3.2兩總體(樣本數(shù)均為n)兩組樣本的協(xié)方差矩陣:Yp×n,Xq×n,Y與X的協(xié)方差矩陣covy,x=c11,c12,…,c1q…cp1,cp2,…,cpq=YX'(Y,X分別表示Y,X中心化數(shù)據(jù)),其中cαβ=1n1nyαi-yαxβi-xβ(α≤p,β≤q),注意兩個樣本的協(xié)方差一般不對稱,即cαβ≠cβα。小結(jié)多元總體該總體有多個屬性,可表示為X=x1…xp,考察一個P元總體即是考察這個總體中每個對象的P個屬性多元樣本矩陣X=x1,x2…xn=x11,x12,…,x1n…xp1,xp2,…,xpn多元總體的統(tǒng)計(jì)參數(shù)單總體分屬性行樣本統(tǒng)計(jì)參數(shù)樣本平均值向量中心化數(shù)據(jù)原始數(shù)據(jù)-平均
4、數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)中心化數(shù)據(jù)/該行樣本標(biāo)準(zhǔn)差樣本離差矩陣Qqαβ=1nxαi-xαxβi-xβ(1≤α,β≤p)樣本協(xié)方差矩陣SS=Q/n=XX’/n(n為樣本數(shù))樣本相關(guān)矩陣R用X中的兩行計(jì)算兩屬性間的相關(guān),rαβ=sαβsααsββ=qαβqααqββ各種距離歐氏距離,樣本間統(tǒng)計(jì)參數(shù)馬氏距離,B模距離,絕對距離,切比雪夫距離相似系數(shù)定量用X中的兩列算出的相關(guān)系數(shù)夾角余弦cαβ=xi'xjxixj1pxαixαj1pxαi21nxαj2定性首先轉(zhuǎn)化為0,1型定性數(shù)據(jù);對于p元總體的變量α,兩樣本單元i,j配對情況有四種(1,1),(1,0),(0,1),(0,0),分別用a,b,c,d表示
5、所有變量中這四種情況出現(xiàn)的次數(shù)。顯然a,d出現(xiàn)的次數(shù)越多,兩樣本越接近匹配系數(shù):fij=a+dp=1-絕對距離p修正的夾角余弦fij=ada+ba+cb+d(c+d)兩總體(樣本數(shù)均為n)Yp×n,Xq×n,Y與X的協(xié)方差矩陣covy,x=c11,c12,…,c1q…cp1,cp2,…,cpq=YX'(Y,X分別表示Y,X中心化數(shù)據(jù)),其中cαβ=1n1nyαi-yαxβi-xβ(α≤p,β≤q),兩組樣本的協(xié)方差矩陣注意兩個樣本的協(xié)方差一般不對稱,即cαβ≠cβα。Ch2主分量分析2.1主分量分析2.1.1原理:從變量著手分析,將原來多個指標(biāo)化為少數(shù)幾個相互獨(dú)立的綜合指標(biāo)的一種統(tǒng)計(jì)方
6、法。2.1.2數(shù)學(xué)表示:原變量X經(jīng)正交變換U得到Y(jié),Y=UX,使y1,yi,…,yn獨(dú)立,且yi在所有與y1,y2,…,yi-1獨(dú)立的隨機(jī)變量中,yi具有最大方差。至于如何求U,事實(shí)上,所謂的最大方差即Dx=1n1nxαi-xαxβi-xβ的特征根,U’的第j列向量即為λj的特征向量。2.1.3求解正交變換:實(shí)際中無法得到D(x),而是利用樣本方差Sx來求正交變換。2.1.4貢獻(xiàn)率:代表樣本點(diǎn)在這個主分量方向上的分散程度,若其值很小,表示樣本在該方向上的分散很小,這個主分量在分析樣本數(shù)據(jù)時所起作用不大。ηj=λjλ1+λ2+。。。+λp=λjS11+S22+。。。+Sppj=1,2,…
7、,p(Sii為Sx主對角線上元素)2.1.5因子負(fù)荷量:主分量yk與原分量xj相關(guān)系數(shù)稱為第j因子在第k個主分量上的負(fù)荷量。幾何解釋為原坐標(biāo)上單位長度在某個主坐標(biāo)軸上的投影長度。其樣本估計(jì)值為r(λk?xj)=λkUkjSij2.2R分析:從標(biāo)準(zhǔn)化數(shù)據(jù)出發(fā)的主分量分析。2.3q分析:從樣本著手分析,2.3.1原理:壓縮樣本,找出典型的綜合樣本2.3.2數(shù)學(xué)表示:仍然先求樣本間的相似系數(shù),Qnni,j=X'X=1p1pxαi-xixαj-xj再找