資源描述:
《多元正態(tài)分布(新)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、多元正態(tài)分布及其參數(shù)估計(jì)多元正態(tài)分布的重要性:(1)多元統(tǒng)計(jì)分析中很多重要的理論和方法都是直接或間接地建立在正態(tài)分布基礎(chǔ)上的,許多統(tǒng)計(jì)量的極限分布往往和正態(tài)分布有關(guān)。(2)許多實(shí)際問題涉及的隨機(jī)向量服從多元正態(tài)分布或近似服從正態(tài)分布。因此多元正態(tài)分布是多元統(tǒng)計(jì)分析的基礎(chǔ)。一、多元正態(tài)分布的定義定義1:若p維隨機(jī)向量的密度函數(shù)為:其中,是p維向量是p階正定矩陣,則稱X服從p維正態(tài)分布,記為§1多元正態(tài)分布的定義及其性質(zhì)定義2:獨(dú)立標(biāo)準(zhǔn)正態(tài)變量的有限線性組合稱為p維正態(tài)隨機(jī)變量,記為其中但是的分解一般不是唯一的。定義3:若隨機(jī)向量X的特征函數(shù)為
2、:其中t為實(shí)向量,則稱X服從p元正態(tài)分布。特征函數(shù)定義的優(yōu)點(diǎn)在于可以包含的情況。特別地,二元正態(tài)分布:二元正態(tài)分布曲面()二元正態(tài)分布曲面()即,兩個(gè)隨機(jī)變量獨(dú)立而可以求得的邊緣密度函數(shù)為:當(dāng)時(shí)X1與X2不相關(guān),對(duì)于正態(tài)分布來說不相關(guān)和獨(dú)立等價(jià)。因?yàn)榇藭r(shí):為X1和X2的相關(guān)系數(shù)。二、多元正態(tài)分布的性質(zhì)性質(zhì)1:若,是對(duì)角矩陣,則相互獨(dú)立。性質(zhì)2:若則性質(zhì)3:若,將作剖分:則性質(zhì)4:p元正態(tài)分布的條件分布仍服從正態(tài)分布。即在某些變量取固定值時(shí),另外一些變量的分布仍然服從多元正態(tài)分布。三、正態(tài)分布數(shù)據(jù)的變換若一批多元數(shù)據(jù)不滿足正態(tài)分布時(shí),可以對(duì)數(shù)
3、據(jù)進(jìn)行正態(tài)變換。一般來說常采用冪變換,如果想使值變小可以采用變換:如果想使值變大,則采用變換:不管使用哪種冪變換,還應(yīng)該對(duì)變換后的數(shù)據(jù)的正態(tài)性做檢驗(yàn).§2多元正態(tài)分布的參數(shù)估計(jì)一、多元樣本及其樣本數(shù)字特征1.多元樣本陣記2、多元樣本的數(shù)字特征樣本均值:樣本均值向量可以用樣本矩陣表示出來,即因?yàn)椋簶颖倦x差陣樣本協(xié)方差矩陣或樣本離差陣用樣本資料陣表示為:因?yàn)槎?、多元正態(tài)總體的最大似然估計(jì)及其性質(zhì)利用最大似然法求出和的最大似然估計(jì)為:求解過程似然函數(shù)為:對(duì)數(shù)似然函數(shù)為:(引理:設(shè)A為p階正定矩陣,則當(dāng)A=I等號(hào)成立。最大似然估計(jì)的性質(zhì),即是的無偏
4、估計(jì)。,即不是的無偏估計(jì)。,即是無偏估計(jì)。分別是的最小方差無偏估量。3.分別是的一致估計(jì)。三、維斯特(Wishart)分布---一元分布的推廣定義:設(shè)個(gè)隨機(jī)向量獨(dú)立同分布于,則隨機(jī)矩陣服從自由度為n的非中心維斯特分布,記為隨機(jī)矩陣的分布:將該矩陣的列向量(或行向量)連接起來組成的長(zhǎng)向量稱為拉直向量,拉直向量的分布定義為該矩陣的分布,如果是對(duì)稱矩陣則只取其下三角的部分拉直即可。性質(zhì):(1)若W1和W2獨(dú)立,其分布分別為和,則分布為,即維斯特(Wishart)分布有可加性。(2),C為m×p階的矩陣,則的分布為定理:設(shè)分別是來自正態(tài)總體的樣本均
5、值和離差陣,則(1)(2)相互獨(dú)立。S為正定矩陣的充分必要條件是n>p。11一元正態(tài)總體:為來自一元正態(tài)總體的一組樣本定理:證明:構(gòu)造正交矩陣做變換第三章多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)一、HotellingT2分布—一元t分布的推廣定義設(shè),且X與S相互獨(dú)立,,則稱統(tǒng)計(jì)量的分布為非中心的HotellingT2分布,記為,當(dāng)時(shí)稱為中心的HotellingT2分布。記為一元t分布:設(shè)總體是一組樣本,則統(tǒng)計(jì)量其中與類似并且定理:設(shè)且X與S相互獨(dú)立,令基本性質(zhì):則二、多元正態(tài)總體均值向量的假設(shè)檢驗(yàn)1.單個(gè)正態(tài)總體(1)協(xié)方差矩陣已知時(shí)均值向量的檢驗(yàn)檢驗(yàn)統(tǒng)
6、計(jì)量設(shè)水平為,查表確定,使得(當(dāng)H0成立時(shí))拒絕域?yàn)椋寒?dāng)原假設(shè)成立時(shí)(2)協(xié)方差矩陣未知時(shí)均值向量的檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量拒絕域?yàn)椋豪喝说某龊苟嗌儆谌梭w內(nèi)鉀和鈉的含量有一定的關(guān)系。測(cè)得20名健康成年女性的出汗多少(X1)、鈉的含量(X2)和鉀的含量(X3)的數(shù)據(jù),做如下的假設(shè)檢驗(yàn):例:在企業(yè)市場(chǎng)結(jié)構(gòu)研究中,起關(guān)鍵作用的指標(biāo)有市場(chǎng)份額X1,企業(yè)規(guī)模(資產(chǎn)凈值總額的對(duì)數(shù))X2,資本收益率X3,總收益增長(zhǎng)率X4.為了研究市場(chǎng)結(jié)構(gòu)的變動(dòng)Shepherd(1972)抽取了美國(guó)231個(gè)大型企業(yè),調(diào)查了這些企業(yè)1960-1969年的資料。假設(shè)以前企業(yè)市場(chǎng)結(jié)構(gòu)指
7、標(biāo)的均值向量為:而該次調(diào)查得到的企業(yè)市場(chǎng)結(jié)構(gòu)指標(biāo)的均值向量和協(xié)方差矩陣為:試問市場(chǎng)結(jié)構(gòu)是否發(fā)生了變化?帶入到T2統(tǒng)計(jì)量中得到臨界值因此拒絕原假設(shè),認(rèn)為市場(chǎng)結(jié)構(gòu)已經(jīng)發(fā)生了顯著的變化。2.協(xié)方差陣相等時(shí),兩個(gè)正態(tài)總體均值向量的檢驗(yàn)設(shè)且兩組樣本相互獨(dú)立。(1)有共同已知的協(xié)方差矩陣檢驗(yàn)統(tǒng)計(jì)量為:拒絕域?yàn)椋海?)有共同的未知協(xié)方差矩陣檢驗(yàn)統(tǒng)計(jì)量為:用代替∑即可得到上述統(tǒng)計(jì)量。例:為了研究日美企業(yè)在華投資企業(yè)對(duì)中國(guó)經(jīng)營(yíng)環(huán)境的評(píng)價(jià)是否存在差異,現(xiàn)從兩國(guó)在華投資企業(yè)中各抽出10家,讓其對(duì)如下指標(biāo)進(jìn)行打分。假設(shè)兩組來自正態(tài)總體,有共同的未知協(xié)方差矩陣,且兩
8、組樣本相互獨(dú)立。經(jīng)計(jì)算代入統(tǒng)計(jì)量中得:查F分布表得:顯然有:故拒絕原假設(shè),認(rèn)為日、美兩國(guó)在華投資企業(yè)對(duì)中國(guó)經(jīng)營(yíng)環(huán)境的評(píng)價(jià)存在差別。3.協(xié)方差陣不相等時(shí),兩個(gè)正態(tài)總體均值向量的檢驗(yàn)