資源描述:
《應用統(tǒng)計學回歸分析ppt課件.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第四章多元線性回歸模型經(jīng)典多元回歸模型回歸分析的機理經(jīng)典回歸模型及其參數(shù)估計殘差分析與假設檢驗含有虛擬變量的回歸線性回歸過程一、回歸分析的機理任意抽出一個婦女,試猜測其體重如何猜?準確性如何?猜平均體重,最大偏差:26如何猜得更準確?影響體重的最直接因素是身高:一般身高高的人體重大。平均身高:62.85inch,標準差:3.3以平均身高分界:最大偏差20E(weight/height)=b0+b1height,例:20個婦女的體重資料如表,平均體重:123.6pound,標準差:15.5最低體重:93pound,最大體重:155一個身高60的婦女體重平均111.5,最大偏差1
2、293155體重均值123.6猜體重平均值,最大偏差:26身高相同的人體重不一定相同平均來看,體重隨身高的增加而增加平均身高62.85134.0113.2以平均身高分界,高于平均身高猜134,低于平均身高猜113.2:最大偏差20能不能猜得更準?這條直線的含義是什么?一個身高60的婦女體重平均111.5,最大偏差12觀測值weighti估計值weight身高體重總體回歸線通常,身高高的人體重大。同樣身高的人體重不同,即在給定身高下,體重有一個分布。大樣本下為正態(tài)分布??傮w回歸線反映了給定身高下,體重的平均水平:E(weight/height)=b0+b1height,b0,b
3、1是未知的參數(shù)已知20個婦女的身高體重資料以此為樣本估計總體參數(shù)樣本回歸線為什么要有?回歸分析的任務:從樣本回歸線估計總體回歸線總體回歸函數(shù)說明在給定的身高下,體重平均水平。但對某一個婦女,其體重可能與該平均水平有偏差。被解釋變量觀察值圍繞其期望值的離差,是一個不可觀測的隨機變量,稱為隨機誤差項。weightheight?為什么要設隨機誤差項?在解釋變量中被忽略的因素的影響;變量觀測值的觀測誤差的影響;模型關(guān)系的設定誤差的影響;其它隨機因素的影響。產(chǎn)生并設計隨機誤差項的主要原因:理論的模糊性;數(shù)據(jù)的欠缺;節(jié)省原則;weightheight?樣本回歸函數(shù)從被研究總體中隨機抽取n
4、個樣本(本例n=20),利用樣本觀測數(shù)據(jù)可得到樣本回歸函數(shù):樣本回歸函數(shù)是對總體回歸函數(shù)的一個估計對某一個婦女,其體重觀測值不會恰好等于估計值,而是會有殘差殘差是對隨機誤差項的一個估計回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計總體回歸函數(shù)PRF。一、回歸分析的機理任意抽出一個婦女,試猜測其體重影響體重的最直接因素是身高:利用身高與體重的關(guān)系推測如何猜得更準確(提高回歸線的解釋程度R2)?除了身高,還有哪些因素影響體重?例:20個婦女的體重資料二、經(jīng)典回歸模型及其參數(shù)估計多元回歸模型及其經(jīng)典假設多元回歸模型的參數(shù)估計偏回歸系數(shù)的含義1.多元回歸模型及其經(jīng)典假設找到導致被解
5、釋變量變化的主要因素作為解釋變量,構(gòu)建多元回歸模型:設因變量Y是k個解釋變量X1,…Xk和誤差項的線性函數(shù):其中:?0為常數(shù)項,?1,…?k為偏回歸系數(shù),?i為隨機誤差項對容量為n的樣本,這一模型實際上包含n個方程:y1=??0+?1x11+?kxk1+?1……yn=??0+?1x1n+?kxkn+?n總體回歸模型多元回歸模型的矩陣表示注意:解釋變量個數(shù)為k,參數(shù)個數(shù)為k+1樣本回歸函數(shù)(SRF)ei稱為殘差或剩余項(residuals),可看成是總體回歸函數(shù)中隨機擾動項?i的近似替代。樣本回歸函數(shù)的矩陣表達:多元回歸模型的經(jīng)典假設假設1:x1,x3,…xk是非隨機的。假設2
6、:E(?i)=0i=1,2,…n假設3:同方差Var(?i)=?2(E(?i?i)=?2)假設4:無序列相關(guān),cov(?i?j)=E(?i?j)=0假設5:x諸變量間無準確的線性關(guān)系,即:無多重共線性。不存在一組不全為零的數(shù)?1、?2、…?k,使得:?1x1i+?2x2i+…+?kxki=0假設6:?i?N(0,?2)關(guān)于多重共線性的進一步說明如果存在一組不全為零的數(shù)?1、?2、…?k,使得:?1x1i+?2x2i+…+?kxki=0不妨設?1?0,則上式可變?yōu)椋簒1i=-(?2x2i+…+?kxki)/?1稱解釋變量之間存在完全共線性,此時,某個解釋變量可以寫為其它解釋變量
7、的線性組合。如果,會不會破壞無多重共線假定?不會,因為這兩個變量的關(guān)系是非線性的??!經(jīng)典假設的矩陣表示假設2:假設3和4:假設5:矩陣x的秩等于回歸參數(shù)的個數(shù)(或解釋變量個數(shù)加1),R(x)=k+1,n>k2.回歸參數(shù)的普通最小二乘估計:殘差平方和最小已知假定正規(guī)方程組正規(guī)方程組的矩陣形式條件?點估計OLS估計的矩陣表示正規(guī)方程組的另一種表達該正規(guī)方程組成立的條件是什么?可以證明,隨機誤差項?的方差的無偏估計量為:?隨機誤差項?的方差?的無偏估計例:二元回歸模型的參數(shù)估計?1的置信區(qū)間:OLS參數(shù)估計量