資源描述:
《《虛擬變量回歸模型》PPT課件.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第6章虛擬變量回歸模型Y代表數(shù)學(xué)分?jǐn)?shù)X代表家庭年收入數(shù)值變量定量變量6.1虛擬變量的性質(zhì)調(diào)查研究顯示,在其它條件相同的情況下,大學(xué)女教師的收入低于男教師。這意味著在影響教師收入的因素中,需要考慮到性別這個(gè)變量。性別男女取值0取值1虛擬變量的定義:我們將這類取值為0,1的變量稱為虛擬變量。用符號(hào)D表示,而不是X,從而與以前的定量變量相區(qū)分。啞變量1建立原假設(shè)和備擇假設(shè):2建立回歸模型Y的條件均值的含義:3應(yīng)用OLS方法估計(jì)回歸模型Se=(233.0446)(329.5749)t=(13.6318)(-1.5267)3176.833的經(jīng)濟(jì)含義是什么?女性的平均食品支出又是多少?-503.1667
2、的經(jīng)濟(jì)含義是什么?男女之間在食品支出上的差異是否在統(tǒng)計(jì)上顯著?虛擬變量設(shè)置的原則比如文化程度可分為五類:文盲、小學(xué)、初中、高中、大學(xué),那么需要引入4個(gè)虛擬變量。如果虛擬變量有M個(gè)分類,引入M個(gè)虛擬變量,會(huì)導(dǎo)致什么后果。如果模型有共同的截距項(xiàng),且一個(gè)虛擬變量有M種分類,則需要引入M-1個(gè)虛擬變量。比如性別有兩個(gè)分類,則引入1個(gè)虛擬變量即可建立回歸模型形式如下:比如對(duì)于性別這個(gè)變量,它有兩個(gè)分類:男和女,如果引入兩個(gè)虛擬變量的話D2D3男女取值0取值1男女取值1取值0D2D3男01男01女10女10男01女10男01D2=1-D36.2包含一個(gè)定量變量,一個(gè)兩分定性變量的回歸注意區(qū)分當(dāng)虛擬變量取
3、不同值時(shí),Y的條件均值的含義,以及虛擬變量的回歸系數(shù)的含義。Y代表食品支出,X代表稅后收入,D取值1代表女,0代表男回歸結(jié)果如下:6.3包含一個(gè)定量變量、一個(gè)多分定性變量的回歸根據(jù)虛擬變量的引入原則,變量有三個(gè)分類,需要引入?個(gè)虛擬變量。如果根據(jù)地區(qū)不同將學(xué)校分為三類:南部;東北和中北部;西部。D2D310東北和中北部地區(qū)其他地區(qū)10西部地區(qū)其他地區(qū)*在5%的水平下是統(tǒng)計(jì)顯著的,**在5%的水平下是統(tǒng)計(jì)不顯著的,在10%的水平下是統(tǒng)計(jì)顯著。6.4包含一個(gè)定量變量和多個(gè)定性變量的回歸Y代表小時(shí)工資,X代表受教育年限,D2D310女男10非白種人和非西班牙裔人其他男女食品支出的回歸結(jié)果如下:注意
4、:虛擬變量以加法形式或乘法形式進(jìn)入回歸模型有不同的含義。虛擬變量以加法形式進(jìn)入模型,影響的是截距,其系數(shù)值表現(xiàn)為兩個(gè)不同的類之間的截距的差別。虛擬變量若以乘法形式進(jìn)入模型,即虛擬變量與其它定量變量X相乘,影響的是斜率,其系數(shù)值表現(xiàn)為兩個(gè)不同的類之間的斜率的差別。6.5比較兩個(gè)回歸以乘法形式進(jìn)入模型以加法形式進(jìn)入模型11111為了檢驗(yàn)兩回歸模型的截距是否相同,需要以加法方式引入虛擬變量,為了檢驗(yàn)兩回歸模型的斜率是否相同,需要以乘法方式引入虛擬變量。Y代表個(gè)人儲(chǔ)蓄X代表個(gè)人可支配收入D101970-1981年1982-1995年當(dāng)D取值0時(shí),Y的條件均值當(dāng)D取值1時(shí),Y的條件均值1970-198
5、1年期間的回歸方程1982-1995年期間的回歸方程