成功大學(xué)的,非常透徹的主成份分析,含例子

成功大學(xué)的,非常透徹的主成份分析,含例子

ID:43104460

大?。?90.00 KB

頁數(shù):114頁

時(shí)間:2019-09-30

成功大學(xué)的,非常透徹的主成份分析,含例子_第1頁
成功大學(xué)的,非常透徹的主成份分析,含例子_第2頁
成功大學(xué)的,非常透徹的主成份分析,含例子_第3頁
成功大學(xué)的,非常透徹的主成份分析,含例子_第4頁
成功大學(xué)的,非常透徹的主成份分析,含例子_第5頁
資源描述:

《成功大學(xué)的,非常透徹的主成份分析,含例子》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、第一章主成份分析陳順宇教授成功大學(xué)統(tǒng)計(jì)系1主成份分析(PrincipalComponentAnalysis,PCA)主要目的是訂定指標(biāo)它是對多個(gè)變數(shù)決定各變數(shù)權(quán)重而成加權(quán)平均,依此訂出總指標(biāo)2經(jīng)由線性組合而得的主成份能保有原來變數(shù)最多的資訊即主成份有最大的變異數(shù)也就是使受測者在這些主成份上會(huì)顯出最大的個(gè)別差異3主成份分析3個(gè)重要目標(biāo)代表性獨(dú)立性精簡性4xi的線性組合研究者常會(huì)找到很多項(xiàng)目(指示變數(shù)),然後做加權(quán)平均,但問題就在於如何給定權(quán)重,5一種是主觀的人為訂定(它是在資料收集前訂定),一種是客觀的透過

2、資料本身所傳達(dá)的訊息而訂定權(quán)重(它是資料收集分析後再訂定)6權(quán)重主成份分析就是要將重要變數(shù)適當(dāng)?shù)慕o予較大的權(quán)重不重要的變數(shù)給予較小的權(quán)重7矩陣的應(yīng)用及特徵值、特徵向量8特徵值的定義9例:求矩陣A的特徵值、 特徵向量1011特徵值為的根12解之得特徵值分別為13A為正定(positivedefinitep.d.)矩陣14定理1516例1.1身高、體重的 主成份分析17如何將身高與體重做一線性組合使y1更能代表一個(gè)人的體型呢?身高(x1)、體重(x2)的資料,都是用來代表一個(gè)人體型的一部份只用身高或只用體重都

3、不足以說明體型18算出各種線性組合轉(zhuǎn)換後資料及平均數(shù)、變異數(shù)、標(biāo)準(zhǔn)差19以上各種組合以W4的變異數(shù)最大下面討論如何找到此最佳解W420有分辨能力表示變異數(shù)大要先討論什麼樣的單一變數(shù)y1才能代表原來的變數(shù)x1,x2?所謂有代表性,就是最能分辨“人”的體型,而什麼樣的情形分辨能力才強(qiáng)呢?21變異數(shù)小表示內(nèi)部有一致性,表示品質(zhì)均勻?qū)ζ饭芏允呛矛F(xiàn)象但是在評分或分辨能力等問題,如果變異數(shù)小,就表示分辨能力差。22線性組合的變異數(shù)愈大愈好在的限制下,找a1,a2使Var(y1)最大2324特徵向量在下,使a??a最

4、大,解a是矩陣?的最大特徵值所對應(yīng)的單位特徵向量25但在實(shí)務(wù)上?通常是未知的,由抽樣資料可以求出樣本共變異矩陣S,然後以S代替?26樣本共變異矩陣S27特徵值?1,?228特徵值29求最大特徵值98.9511特徵向量a30第一主成份31求第二大特徵值3.0489特徵向量b32第二主成份33第一主成份的係數(shù)向量與第二主成份的係數(shù)向量有直交的現(xiàn)象,即a?b=034主成份分析的特點(diǎn)(1)第一主成份的係數(shù)向量a1與第二主成份的係數(shù)向量a2直交(2)第一主成份y1與第二主成份y2也是直交(即相關(guān)係數(shù)為0)35(3)

5、主成份的幾何意義36(a)照相角度的選取對一群人照團(tuán)體照就要選一角度,它能將每個(gè)人都照的很清楚,也就是要找一個(gè)角度,它能分辨出每個(gè)人這種想法與主成份分析找主成份很類似,37圖1.2身高體重資料主成份分析38(b)橢圓長軸的想法從散佈圖上找最佳的方向,通常是利用畫橢圓(儘可能的扁)能將所有資料點(diǎn)包含橢圓長軸的方向即為第一主成份的方向。而短軸的方向即為第二主成份方向。39圖1.3身高體重資料橢圖長軸40迴歸線比第一主成份線平坦41(4)各個(gè)主成份的變異數(shù)等於其對應(yīng)的特徵值Var(yi)=?i42(5)所有主成

6、份的變異數(shù)的和與所有變數(shù)之變異數(shù)的和相等43(6)第一主成份y1解釋變異比例44第一第二主成份解釋變異比例45身高、體重的例題46(7)主成份負(fù)荷第j主成份yj與第i個(gè)變數(shù)xi的 相關(guān)係數(shù)(主成份負(fù)荷)47如第一主成份y1與身高(x1)的 相關(guān)係數(shù)為48第一主成份y1與體重(x2)的 相關(guān)係數(shù)49(8)共通性主成份解釋變數(shù)(xi)的變異數(shù)比例稱為的共通性(Communality),寫成50第1主成份解釋身高第1主成份解釋體重51(9)以共變異數(shù)矩陣S做 分析主成份得點(diǎn)52如第一位學(xué)生的 第一主成份得點(diǎn)53

7、(10)以相關(guān)矩陣做分析如果由於變數(shù)的單位不同,因此考慮將資料先標(biāo)準(zhǔn)化後再做主成份分析可以相關(guān)矩陣R取代共變異數(shù)矩陣S再求特徵值、特徵向量54以相關(guān)矩陣做主成份分析則 第一主成份為55(11)STATISTICA進(jìn)行 主成份分析Statistics?MultivariateExploratoryTechniques?PrincipalComponents&ClassificationAnalysis5657特徵值與解釋變異比例58特徵向量(主成份權(quán)重)59主成份與身高體重相關(guān)係數(shù)60共通性61主成份得點(diǎn)6

8、2主成份得點(diǎn)散佈圖63(13)主成份分析的SAS程式64656667(14)先標(biāo)準(zhǔn)化再做主成份分析如果由於變數(shù)的單位不同,將資料先標(biāo)準(zhǔn)化後再做主成份分析,可以相關(guān)矩陣R取代共變異數(shù)矩陣S,再求特徵值、特徵向量。68如以相關(guān)矩陣做主成份分析則第一主成份69例1.3英文、國文、統(tǒng)計(jì)、 會(huì)計(jì)、經(jīng)濟(jì)5科成績總指標(biāo)70算出五個(gè)變數(shù)的平均數(shù)、 標(biāo)準(zhǔn)差及相關(guān)矩陣R71五個(gè)特徵值72陡坡圖7374表1.1例1.3主成份負(fù)荷75主成份負(fù)荷(或相

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。