資源描述:
《線性回歸的基本思想:雙變量模型.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、線性回歸的基本思想:雙變量模型第二章2.1回歸的含義回歸一詞最先由F.加爾頓(FrancisGalton)引入,在一篇著名的論文中,加爾頓指出,雖然有一個(gè)趨勢(shì),父母高,兒女也高;父母矮,兒女也矮,但給定父母的身高,兒女輩的平均身高卻趨向于或者“回歸”到全體人口的平均身高。K.皮爾遜(KarlPearson)證實(shí)了加爾頓的普遍回歸定律皮爾遜收集過一些家庭群體的1千多名成員的身高記錄。他發(fā)現(xiàn),對(duì)于一個(gè)父親高的群體,兒輩的平均身高低于他們父輩的身高,而對(duì)于一個(gè)父親矮的群體,兒輩的平均身高則高于其父輩的身高。這樣就把高的和矮的兒輩一同“回歸”到所有男子的平均身高。用加爾頓的話說,這是“回歸到中
2、等”。2.1回歸的含義(1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。(2)統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。經(jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:2.1回歸的含義對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)和回歸分析(regressionanalysis)來完成的:例如:函數(shù)關(guān)系:統(tǒng)計(jì)依賴關(guān)系/統(tǒng)計(jì)相關(guān)關(guān)系:2.1回歸的含義①不線性相關(guān)并不意味著不相關(guān);②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析/相關(guān)分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,但它們并不意味著一定有因果關(guān)系。④相關(guān)分析對(duì)稱地對(duì)待
3、任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的?;貧w分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是?!⒁猓?.1回歸的含義回歸的現(xiàn)代解釋回歸分析是關(guān)于研究一個(gè)叫做應(yīng)變量(被解釋變量)的變量對(duì)另一個(gè)或多個(gè)叫做自變量(解釋變量)的變量的依賴關(guān)系,其用意在于通過后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測(cè)前者的(總體)均值。統(tǒng)一符號(hào):Y代表被解釋變量(應(yīng)變量或因變量)X代表解釋變量(自變量)2.1回歸的含義幾個(gè)簡單的例子闡述回歸的基本思想1.加爾頓的興趣在于發(fā)現(xiàn)為什么人口身高分布有一種穩(wěn)定性。但從現(xiàn)代的觀點(diǎn)考慮,我們并不關(guān)心這種解釋。我們關(guān)
4、心的,卻是給定父輩身高的情形下找出兒輩平均身高的變化。2.1回歸的含義2.經(jīng)濟(jì)學(xué)家也許想研究個(gè)人消費(fèi)支出對(duì)稅后或可支配實(shí)際個(gè)人收入的依賴關(guān)系。這種分析會(huì)有助于估計(jì)邊際消費(fèi)傾向(MPC),就是實(shí)際收入每美元價(jià)值的變化所引起的消費(fèi)支出的平均變化。2.1回歸的含義3.一位勞工經(jīng)濟(jì)學(xué)家也許要研究貨幣工資變化率對(duì)失業(yè)率的關(guān)系。橫坐標(biāo)為失業(yè)率,縱坐標(biāo)為貨幣工資變化率建立著名的菲利普斯曲線。這樣的分析能使勞工經(jīng)濟(jì)學(xué)家預(yù)測(cè)在給定某個(gè)失業(yè)率下貨幣工資的平均變化。2.1回歸的含義4.由貨幣經(jīng)濟(jì)學(xué)中得知,其他條件不變,通貨膨脹率越愈高,人們?cè)敢庖载泿判问奖4娴氖杖氡壤?,?duì)這種關(guān)系作一數(shù)量分析,將使貨幣經(jīng)
5、濟(jì)學(xué)家能夠?qū)Ω鞣N通貨膨脹率預(yù)測(cè)人們?cè)敢庖载泿判问奖4娴氖杖氡壤?.1回歸的含義5.農(nóng)業(yè)經(jīng)濟(jì)學(xué)家想研究作物(比方說小麥)收成對(duì)氣溫、降雨量、陽光量和施肥量的依賴關(guān)系。這種依賴性分析能使他對(duì)給定的解釋變量的信息預(yù)測(cè)或預(yù)報(bào)作物的平均收成。2.1回歸的含義回歸分析的基本思想技巧,就是在研究這種變量之間的依從關(guān)系的基礎(chǔ)上,分析一個(gè)叫做應(yīng)變量的變量,對(duì)另一個(gè)或多個(gè)叫做解釋變量的變化的統(tǒng)計(jì)依賴性,這種分析的目的,是要在解釋變量已知或固定值的基礎(chǔ)上,估計(jì)和預(yù)測(cè)應(yīng)變量的均值。2.1回歸的含義回歸并不意味著存在因果關(guān)系!自變量并不意味是原因應(yīng)變量也并不見得是結(jié)果自變量與應(yīng)變量的關(guān)系的判定或推斷必須經(jīng)過實(shí)
6、踐檢驗(yàn)的相關(guān)理論2.1回歸的含義2.1回歸的含義回歸分析的目的:根據(jù)自變量的取值,估計(jì)應(yīng)變量的均值。檢驗(yàn)(建立在經(jīng)濟(jì)理論基礎(chǔ)之上的)假設(shè)。根據(jù)樣本外自變量的取值,預(yù)測(cè)應(yīng)變量的均值??赏瑫r(shí)進(jìn)行上述各項(xiàng)分析。2.2總體歸函數(shù)(PRF):假想一例圖2-1家庭年收入與數(shù)學(xué)S.A.T分?jǐn)?shù)2.2總體歸函數(shù)(PRF):假想一例(1)由于不確定因素的影響,對(duì)同一收入水平X,不同學(xué)生的成績不完全相同;(2)但由于調(diào)查的完備性,給定收入水平X的分?jǐn)?shù)Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)是已知的,如:P(Y=460
7、X=5000)=1/5。因此
8、,給定收入X的值Xi,可得分?jǐn)?shù)Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):E(Y
9、X=Xi)分析:2.2總體歸函數(shù)(PRF):假想一例描出散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,成績“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。總體回歸直線—可用函數(shù)(PRF)表示和為未知然而固定的參數(shù),稱為回歸系數(shù);也分別稱為截距和斜率系數(shù)。方程本身則稱線性總體回歸函數(shù)。