資源描述:
《matlab經(jīng)驗正交函數(shù)EOF(轉(zhuǎn)載)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、A.7EOF分分分析析析經(jīng)驗正交函數(shù)分析方法(empiricalorthogonalfunction,縮寫為EOF),也稱特征向量分析(eigenvectoranalysis),或者主成分分析(principalcomponentanalysis,縮寫PCA),是一種分析矩陣數(shù)據(jù)中的結(jié)構(gòu)特征,提取主要數(shù)據(jù)特征量的一種方法。Lorenz在1950年代首次將其引入氣象和氣候研究,現(xiàn)在在地學(xué)及其他學(xué)科中得到了非常廣泛的應(yīng)用。地學(xué)數(shù)據(jù)分析中通常特征向量對應(yīng)的是空間樣本,所以也稱空間特征向量或者空間模態(tài);主成分對應(yīng)的是時間變化,也稱時間系數(shù)。
2、因此地學(xué)中也將EOF分析稱為時空分解。原原原理理理與與與算算算法法法2選定要分析的數(shù)據(jù),進行數(shù)據(jù)預(yù)處理,通常處理成距平的形式。得到一個數(shù)據(jù)矩陣Xm£n2計算X與其轉(zhuǎn)置矩陣XT的交叉積,得到方陣1TCm£m=X£Xn如果X是已經(jīng)處理成了距平的話,則C稱為協(xié)方差陣;如果X已經(jīng)標(biāo)準(zhǔn)化(即C中每行數(shù)據(jù)的平均值為0,標(biāo)準(zhǔn)差為1),則C稱為相關(guān)系數(shù)陣2計算方陣C的特征根(?1;:::;m)和特征向量Vm£m,二者滿足Cm£m£Vm£m=Vm£m£^m£m其中^是m£m維對角陣,即23?10:::06760?2:::07^=67674::::::
3、::::::500:::?m一般將特征根?按從大到小順序排列,即?1>?2>:::>?m。因為數(shù)據(jù)X是真實的觀測值,所以?應(yīng)該大于或者等于0。每個非0的特征根對應(yīng)42一列特征向量值,也稱EOF。如?1對應(yīng)的特征向量值稱第一個EOF模態(tài),也就是V的第一列即EOF1=V(:;1);第?k對應(yīng)的特征向量是V的第k列,即EOFk=V(:;k)。2計算主成分。將EOF投影到原始資料矩陣X上,就得到所有空間特征向量對應(yīng)的時間系數(shù)(即主成分),即TPCm£n=Vm£m£Xm£n其中PC中每行數(shù)據(jù)就是對應(yīng)每個特征向量的時間系數(shù)。第一行PC(1,:)
4、就是第一個EOF的時間系數(shù),其他類推。上面是對數(shù)據(jù)矩陣X進行計算得到的EOF和主成分(PC),因此利用EOF和PC也可以完全恢復(fù)原來的數(shù)據(jù)矩陣X,即X=EOF£P(guān)C有時可以用前面最突出的幾個EOF模態(tài)就可以擬合出矩陣X的主要特征。此外,EOF和PC都具有正交性的特點,可以證明1PC£P(guān)CT=^;即不同的PC之n間相關(guān)為0。E£ET=I。I為對角單位矩陣,即對角線上值為1,其他元素都為0。這表明各個模態(tài)之間相關(guān)為0,是獨立的。由上面的計算過程可以看出,EOF分析的核心是計算矩陣C的特征根和特征向量。計算矩陣特征根和特征向量的方法很多,
5、下面具體給出Matlab中進行EOF分析的兩種不同的方法。具體步驟可參考下面兩個框圖中的實例。方法1:調(diào)用[EOF,E]=eig(C),其中EOF為計算得到的空間特征向量,E為特征根。然后計算主成分PC=EOFT£X。需要指出的時,當(dāng)數(shù)據(jù)量很大時,例如分析高分辨率的資料(如1km分辨率的NDVI資料),空間范圍很大維數(shù)m很容易超過數(shù)萬個點,則矩陣C的維數(shù)是個巨大量,需要占用大量內(nèi)存,也會導(dǎo)致計算速度異常緩慢。而且很可能超出計算機的計算極限而死機。方法2:直接對矩陣X進行奇異值分解XTX=UVPP其中為奇異值對交陣(對角線上的元素為奇
6、異值),奇異值與特征根成倍數(shù)關(guān)系。43Pp2如果矩陣C=1XXT,C的特征根為?,則有=n?;nPp2如果矩陣C=XXT,C的特征根為?,則有=?;由于該方法是直接對矩陣X進行分解,所以對內(nèi)存的要求遠(yuǎn)小于方法1。計算速度很快。兩種方法對比練習(xí)。顯顯顯著著著性性性檢檢檢驗驗驗可以證明XmXmXmX2=?=PC2ikki=1k=1k=1這說明矩陣X的方差大小可以簡單的用特征根的大小來表示。?越高說明其對應(yīng)的模態(tài)越重要,對總方差的貢獻(xiàn)越大。第k個模態(tài)對總的方差解釋率為?kPm£100%i=1?i即使是隨機數(shù)或者虛假數(shù)據(jù),放在一起進行EOF
7、分析,也可以將其分解成一系列的空間特征向量和主成分。因此,實際資料分析中得到的空間模態(tài)是否是隨機的,需要進行統(tǒng)計檢驗。North等(1982)的研究指出,在95%置信度水平下的特征根的誤差r2¢?=?N¤?是特征根,N¤是數(shù)據(jù)的有效自由度,這在前面相關(guān)系數(shù)分析中已經(jīng)有介紹(見4頁相關(guān)內(nèi)容)。將?按順序依次檢查,標(biāo)上誤差范圍。如果前后兩個?之間誤差范圍有重疊,那么他們之間沒有顯著差別。圖A.16是對1949?2002年北半球1月平均海平面氣壓,做距平處理處理及面積加權(quán)后進行EOF分析的結(jié)果。從特征根誤差范圍看,第一和第二模態(tài)存在顯著差
8、別,第二和第三模態(tài)之間也存在顯著差別。但是第三特征根和第四及以后的特征根之間沒有顯著的差別。如果要分析主要的模態(tài)的話,最好只選擇前三個進行分析。44練習(xí):利用[E,V]=eig(C)計算矩陣X的特征向量和主成分%X=[26152;94