資源描述:
《一元線性回歸模型》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第三章一元線性回歸模型(教材第二、三章)第三章一元線性回歸模型3.1回歸的涵義3.2隨機(jī)擾動(dòng)項(xiàng)的來源3.3參數(shù)的最小二乘估計(jì)3.4參數(shù)估計(jì)的性質(zhì)3.5顯著性檢驗(yàn)3.6擬合優(yōu)度3.7預(yù)測學(xué)習(xí)要點(diǎn)回歸模型的涵義,參數(shù)的OLS估計(jì)及其性質(zhì),顯著性檢驗(yàn)3.1回歸的涵義回歸分析(regressionanalysis)用于研究一個(gè)變量(稱為被解釋變量或應(yīng)變量)與另一個(gè)或多個(gè)變量(稱為解釋變量或自變量)之間的關(guān)系。Y代表被解釋變量,X代表解釋變量;解釋變量有多個(gè)時(shí),用X1,X2,X3等表示。例:商品的需求量與該商品價(jià)格、消費(fèi)者收入以及其他競爭性商品價(jià)格之間的關(guān)系??傮w回歸函數(shù)(popul
2、ationregressionfunction,PRF)例:學(xué)生的家庭收入與數(shù)學(xué)分?jǐn)?shù)有怎樣的關(guān)系?3.1回歸的涵義3.1回歸的涵義總體回歸函數(shù)(populationregressionfunction,PRF)根據(jù)上面數(shù)據(jù)做散點(diǎn)圖3.1回歸的涵義總體回歸函數(shù)(populationregressionfunction,PRF)上圖中,圓圈點(diǎn)稱為條件均值;條件均值的連線稱為總體回歸線。總體回歸線表明了Y的均值與每個(gè)X的變動(dòng)關(guān)系。上圖近似線性的總體回歸線可以表示成:表示給定的X值所對(duì)應(yīng)的Y的均值;、稱為參數(shù)(parameters),也稱回歸系數(shù)(regressioncoeffic
3、ients);稱為截距(intercept),稱為斜率(slope)。斜率系數(shù)度量了X每變動(dòng)一單位,Y(條件)均值的變化率。舉例:,含義?3.1回歸的涵義樣本回歸函數(shù)(sampleregressionfunction,SRF)實(shí)際中往往無法獲得整個(gè)總體的數(shù)據(jù),怎么估計(jì)總體回歸函數(shù)?即如何求參數(shù)B1、B2?通常,我們僅僅有來自總體的一個(gè)樣本。我們的任務(wù)就是根據(jù)樣本信息估計(jì)總體回歸函數(shù)。怎么實(shí)現(xiàn)?3.1回歸的涵義樣本回歸函數(shù)(sampleregressionfunction,SRF)表2-2、2-3的數(shù)據(jù)都是從表2-1中隨機(jī)抽取得到的。3.1回歸的涵義樣本回歸函數(shù)(sample
4、regressionfunction,SRF)通過散點(diǎn)得到兩條“擬合”樣本數(shù)據(jù)的樣本回歸線。3.1回歸的涵義樣本回歸函數(shù)(sampleregressionfunction,SRF)可用樣本回歸函數(shù)(SRF)表示樣本回歸線:其中,總體條件均值的估計(jì)量;并非所有樣本數(shù)據(jù)都準(zhǔn)確地落在樣本回歸線上,因此建立隨機(jī)樣本回歸函數(shù):其中,是的估計(jì)量,稱為殘差(residual)。表示了Y的實(shí)際值與樣本回歸估計(jì)值的差。3.1回歸的涵義樣本回歸函數(shù)(sampleregressionfunction,SRF)回歸分析:根據(jù)樣本回歸函數(shù)估計(jì)總體回歸函數(shù)。3.1回歸的涵義“線性”回歸的特殊含義對(duì)“線
5、性”有兩種解釋:變量線性和參數(shù)線性。變量線性:例如前面的總體(或樣本)回歸函數(shù);下面的函數(shù)不是變量線性的:參數(shù)線性:參數(shù)B1、B2僅以一次方的形式出現(xiàn)。下面的模型是參數(shù)非線性的:本書主要關(guān)注參數(shù)線性模型。從現(xiàn)在起,線性回歸(linearregression)是指參數(shù)線性的回歸,而解釋變量并不一定是線性的。3.2隨機(jī)擾動(dòng)項(xiàng)的來源總體回歸函數(shù)說明在給定的家庭收入下,美國學(xué)生平均的數(shù)學(xué)分?jǐn)?shù)。但對(duì)于某一個(gè)學(xué)生,他的數(shù)學(xué)分?jǐn)?shù)可能與該平均水平有偏差??梢越忉尀椋瑐€(gè)人數(shù)學(xué)分?jǐn)?shù)等于這一組的平均值加上或減去某個(gè)值。用數(shù)學(xué)公式表示為:其中,表示隨機(jī)擾動(dòng)項(xiàng),簡稱擾動(dòng)項(xiàng)。擾動(dòng)項(xiàng)是一個(gè)隨機(jī)變量,通常
6、用概率分布來描述。3.2隨機(jī)擾動(dòng)項(xiàng)的來源對(duì)于回歸模型稱為被解釋變量(explainedvariable)也稱應(yīng)變量或因變量(dependentvariable)稱為解釋變量(explanatoryvariable)也稱自變量(independentvariable)稱為參數(shù)(parameter)稱為隨機(jī)擾動(dòng)項(xiàng)(randomerrorterm)3.2隨機(jī)擾動(dòng)項(xiàng)的來源上式如何解釋?可以認(rèn)為,在給定家庭收入水平上,第i個(gè)學(xué)生的數(shù)學(xué)分?jǐn)?shù)可以表達(dá)為兩部分之和:一是,即,是該收入水平上的平均數(shù)學(xué)分?jǐn)?shù)。這一部分稱為系統(tǒng)或確定性部分。二是,稱為非系統(tǒng)或隨機(jī)成本,由收入以外的因素決定。此時(shí),
7、稱為隨機(jī)總體回歸函數(shù)(stochasticPRF)。3.2隨機(jī)擾動(dòng)項(xiàng)的來源3.2隨機(jī)擾動(dòng)項(xiàng)的來源性質(zhì)1:擾動(dòng)項(xiàng)代表了未納入模型變量的影響。例如個(gè)人健康狀況、居住區(qū)域等等。性質(zhì)2:反映了人類行為的內(nèi)在隨機(jī)性。即使模型中包括了決定數(shù)學(xué)分?jǐn)?shù)的所有變量,其內(nèi)在隨機(jī)性也不可避免,這是做任何努力都無法解釋的。性質(zhì)3:還代表了度量誤差,例如收入的數(shù)據(jù)可能不等于真實(shí)值。性質(zhì)4:“奧卡姆剃刀原則”——即描述應(yīng)該盡可能簡單,只要不遺漏重要的信息,此時(shí)可以把影響Y的次要因素歸入隨機(jī)擾動(dòng)項(xiàng)。3.3參數(shù)的最小二乘估計(jì)參數(shù)估計(jì):普通最小二乘法