資源描述:
《主成分分析講解》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、主成分分析PrincipalComponentAnalysis統(tǒng)計學(xué)研究的核心問題?沒有變異就沒有統(tǒng)計學(xué)變異VARIATION變異性的度量?方差Variance7/4/20212Dept.ofEpidemio&Biostat,SPH方差是什么?方差是信息多元世界的信息度量多元世界的每個變量的包含信息不同在單個變量方差不變的情況下,各變量相關(guān)性越高,則總信息量越小7/4/20213Dept.ofEpidemio&Biostat,SPH7/4/20214Dept.ofEpidemio&Biostat,SPH兩組變量:AB7/4/20215Dept.ofEpi
2、demio&Biostat,SPH7/4/20216Dept.ofEpidemio&Biostat,SPH7/4/20217Dept.ofEpidemio&Biostat,SPH7/4/20218Dept.ofEpidemio&Biostat,SPH協(xié)方差矩陣樣本的方差-協(xié)方差矩陣(variance-covariancematrix)如果有p個觀測變量,則樣本的協(xié)方差矩陣記為7/4/20219Dept.ofEpidemio&Biostat,SPH相關(guān)矩陣如果有p個觀測變量,其相關(guān)陣(correlationmatrix)記為7/4/202110Dept.o
3、fEpidemio&Biostat,SPH矩陣的特征值和特征向量對于方陣A,如存在常數(shù)λ及非零向量x,使Ax=λx則λ為A的一個特征值,x為與λ對應(yīng)的矩陣A的特征向量。n介方陣有n對特征值和特征向量7/4/202111Dept.ofEpidemio&Biostat,SPH正交向量(陣)、單位向量正交向量:a=(a1,…,ap)’,b=(b1,…,bp)’如果a’b=a1b1+…+apbp=0,則稱a、b正交單位向量:向量a=(a1,…,ap)’,如果則稱a為單位向量正交陣:n階方陣A,如果AA’=A’A=I,則稱A為n階正交陣,其中A的列向量(或行向量)
4、為正交向量,A’=A-17/4/202112Dept.ofEpidemio&Biostat,SPH7/4/202113Dept.ofEpidemio&Biostat,SPH7/4/202114Dept.ofEpidemio&Biostat,SPH7/4/202115Dept.ofEpidemio&Biostat,SPH7/4/202116Dept.ofEpidemio&Biostat,SPH7/4/202117Dept.ofEpidemio&Biostat,SPH主成分的概念1設(shè)x1,x2,…xp為p維隨機變量X1,X2,…,Xp的標(biāo)準(zhǔn)化變換如果其線性組
5、合滿足則稱C1為第一主成分。7/4/202118Dept.ofEpidemio&Biostat,SPH主成分的概念2若滿足則稱C2為第二主成分。類似地,共可得到至多p個主成分。7/4/202119Dept.ofEpidemio&Biostat,SPH主成分的性質(zhì)主成分C1,C2,…,Cp具有以下性質(zhì):(1)主成分間互不相關(guān)Corr(Ci,Cj)=0i?j(2)組合系數(shù)(ai1,ai2,…,aip)構(gòu)成的向量為單位向量(3)各主成分的方差是依次遞減的,即Var(C1)≥Var(C2)≥…≥Var(Cp)(4)總方差不增不減,即Var(C1)+Var(C2)
6、+…+Var(Cp)=Var(x1)+Var(x2)+…+Var(xp)=p7/4/202120Dept.ofEpidemio&Biostat,SPH主成分的計算1設(shè)R為X1,X2,…,Xp的相關(guān)矩陣,則存在?1≥?2≥…≥?p≥0,和正交矩陣A,使其中?i為相關(guān)矩陣R的第i個特征值(eigenvalue)(ai1ai2…aip)’則是相關(guān)矩陣R的第i個特征值對應(yīng)的特征向量。?i是第i個主成分的方差7/4/202121Dept.ofEpidemio&Biostat,SPH主成分的計算2記主成分C=(C1C2…Cp)’,則C=A’x即7/4/202122D
7、ept.ofEpidemio&Biostat,SPH主成分的計算3因子模型(全分量模型)表達(dá)形式x=AC即矩陣A稱載荷矩陣,反映各主成分對原始變量x各分量的貢獻大小。7/4/202123Dept.ofEpidemio&Biostat,SPH主成分的計算4因子模型(全分量模型)表達(dá)--主成分標(biāo)準(zhǔn)化變換7/4/202124Dept.ofEpidemio&Biostat,SPHx=Lclij是xj和ci的相關(guān)系數(shù)SPSS輸出的系數(shù)矩陣是L矩陣7/4/202125Dept.ofEpidemio&Biostat,SPH實例城市男生形態(tài)資料數(shù)據(jù)來自方積乾《醫(yī)學(xué)統(tǒng)計學(xué)
8、與電腦試驗》第2版7/4/202126Dept.ofEpidemio&Biost