資源描述:
《實用多元統(tǒng)計分析 第四講new》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。
1、二多元線性回歸分析1回歸模式考慮p個自變量xx,,Lx和一個因變量y它們之間的線性關系12pyx=+αβ()?x+L+β(x?x)+eii111pippi1N其中x=∑xjp=1,L,jijNi=12e是獨立同分布((N0,σ))i仍用最小二乘法估計回歸系數(shù)αβ,,L,β1pN2誤差平方和為∑[]yx??αβ()?x?L?β(x?x)ii111pippi=1用矩陣形式來表示線性方程為YX=+βe?α??y1??1x11?x1Lx1p?xp??β??e1??????1???Y=?M?X=?MMLM?β=?M?ei=?M??y??1x?xLx?x????e??N??N11Npp
2、??β??N??p?誤差平方和為SY()ββ=?(X)′(Y?Xβ)?βS()=?22XY′+XX′β=0?β$?1XY′=XX′ββ=()XX′′(XY)將X陣分為[]jX,1[]′[]?j′?[]?j′jj′x1??NO′?X′X=j,X1j,X1=?'?jX1=??=???X1??X1′jX1′X1??OX1′X1?N2X′X在對角線上第j項為∑()xx?11ijji=1NX′X在非對角線上第jh項為∑()xx??(xx)11ijjihhi=1?j′??Ny?1N同樣X′Y=?Y=?y=∑y??i?X′??X1′y?Ni=1NNX′Y的第j項為∑()xx?y=∑()x
3、??x(yy)1ijjiijjii==11i?1$?α$??NO′??Ny??y?β=?$?=????=??1?βOX′XXy′()XX′′Xy?1??11??11??11?2回歸方程評價N2$$殘差平方和SSE=?∑()yy?(Xβ)(′Xβ)自由度為N-P-1i1111i=1N2總離差平方和SSY=∑(y?y)自由度為N-1ii=1$'$回歸平方和SSR=βX′Xβ自由度為P1111212隨機誤差的方差σ$=SSE誤差的標準差S=σNP??12SSRSSE在y的總方差中被線性方程所解釋的方差量為R==1?SSYSSY22由SSE和SSY的自由度不同常用R代替RaSSE/
4、(N??P1)?PN?122R=?1=+RaSSY/(N?11)NP??NP??12R沒有自由度不同造成的影響在比較二個回歸方程好壞時常用a3殘差的圖象分析分析目的主要是檢驗模式選用是否合適令zy=?y$jii作z和y$的散點圖此圖應是隨機分布如果呈線性分布或方差隨y$變化應對自jii變量進行變換后重新建立模式2z和每個x的散點圖或z和xi或z和xx等如果散點圖發(fā)生對稱分布說jijj12明模式需要加入新的項z的直方圖和Q-Q圖檢查個別誤差和誤差分布jQ-Q圖作法a.將z從小到大排列zi()j1b.算出每個zi()的發(fā)生頻率(iN?)/2c.根據(jù)頻率查標準正態(tài)表得到qi()d
5、.作qi()和z的散點圖此散點圖趨于直線為好j將zj按j的順序作散點圖檢查隨機ei假設如果zj隨j增加而變化可能指示yi之間不獨立有自相關存在4回歸系數(shù)檢驗2σ根據(jù)a.E(α$)=αVar(α$)=正態(tài)分布Nb.Cov(,αβ)=01$$2?1c.β是P維正態(tài)分布E(β)=βCov()βσ=(X′X)111111β$~N(,βσ2α)α是(XX′)?1的第j個對角元素jjjjjj11$$2Cov(ββ,)為σαijijd.(ββ$?$)~N((ββ?+),σ2(αα?2α))ijijiijjij估計值?檢驗參數(shù)t=~tα,NP??1估計值的均方差(y?α0)Nσ$對于αt=
6、置信區(qū)間yt±ασ?2;NP??1N$$ββ?β?βii$$對于βiti==βσi±tα2;NP??1αii$σα$Var(β)iii()1()2()3H:β=βagainstH:β≠β,H:ββ?,H:ββ?0jj01jj01jj01jj0()1如果tt?α2;NP??1拒絕H0接受H1:βjj≠β0()2如果t??t拒絕H接受H:ββ?α;N?P?101jj0()3如果t?t拒絕H接受H:ββ?α;N?p?101jj0?β??0?1????檢驗所有βj都為0H0:?MM?=???β??0??P???2SSR/PNP??11SSRNR??RF===2SSE/1N??PPS
7、SEP1?R如果FF<接受Hα;,PN??P105多元回歸注意的問題$?1模式YX=+βeβ=()XX′′XY1111?1(XX′)存在的條件是(XX′)非退化要求XX′≠0或其秩等于P向量組線性無關111111應用時注意檢查自變量間是否線性相關即x,x相關系數(shù)為1ij樣本量N>>P,自由度大6預報和置信區(qū)間′預報區(qū)間在XX=[]1,,L,X的情況下預報出y的區(qū)間0010P0模式y(tǒng)=+αβ′X+e注X以距平表示01000預報模式y(tǒng)$=+αβ$′X預報誤差為y?y$010002對yEy()=+αβ′xVar()y=σ