資源描述:
《解釋變量包含虛擬變量.ppt》由會員上傳分享,免費在線閱讀,更多相關內容在應用文檔-天天文庫。
1、第五章解釋變量包含虛擬變量的回歸模型一、虛擬變量的基本含義二、虛擬變量的引入三、虛擬變量的設置原則一、虛擬變量的基本含義許多經濟變量是可以定量度量的,如:商品需求量、價格、收入、產量等。但也有一些影響經濟變量的因素無法定量度量,如:職業(yè)、性別對收入的影響,戰(zhàn)爭、自然災害對GDP的影響,季節(jié)對某些產品(如冷飲)銷售的影響等等。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。這種“量化”通常是通過引入“虛擬變量”來完成的。根據這些因素的屬性類型,構造只取“0”或“1”的人工變量
2、,通常稱為虛擬變量(dummyvariables),記為D。例如,反映文化程度的虛擬變量可取為:1,本科學歷D=0,非本科學歷一般地,在虛擬變量的設置中:基礎類型、肯定類型取值為1;比較類型,否定類型取值為0。概念:同時含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一個以性別為虛擬變量考察企業(yè)職工薪金的模型:其中:Yi為企業(yè)職工的薪金,Xi為工齡,Di=1,若是男性,Di=0,若是女性。二、虛擬變量的引入虛擬變量做為解釋變量引
3、入模型有兩種基本方式:加法方式和乘法方式。上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(?i)=0,則企業(yè)女職工的平均薪金為:1.加法方式企業(yè)男職工的平均薪金為:幾何意義:假定?2>0,則兩個函數有相同的斜率,但有不同的截距。意即,男女職工平均薪金對工齡的變化率是一樣的,但兩者的平均薪金水平相差?2??梢酝ㄟ^傳統(tǒng)的回歸檢驗,對?2的統(tǒng)計顯著性進行檢驗,以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。?0?2又例:在橫截面數據基礎上,考慮個人保健支出對個人收入和教育
4、水平的回歸。教育水平考慮三個層次:高中以下,高中,大學及其以上。這時需要引入兩個虛擬變量:模型可設定如下:在E(?i)=0的初始假定下,高中以下、高中、大學及其以上教育水平下個人保健支出的函數:高中以下:高中:大學及其以上:假定?3>?2,其幾何意義:還可將多個虛擬變量引入模型中以考察多種“定性”因素的影響。如在上述職工薪金的例中,再引入代表學歷的虛擬變量D2:本科及以上學歷本科以下學歷職工薪金的回歸模型可設計為:女職工本科以下學歷的平均薪金:女職工本科以上學歷的平均薪金:于是,不同性別、不同學歷職
5、工的平均薪金分別為:男職工本科以下學歷的平均薪金:男職工本科以上學歷的平均薪金:2.乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下:往往是斜率就有變化,或斜率、截距同時發(fā)生變化。斜率的變化可通過以乘法的方式引入虛擬變量來測度。例:根據消費理論,消費水平C主要取決于收入水平Y,但在一個較長的時期,人們的消費傾向會發(fā)生變化,尤其是在自然災害、戰(zhàn)爭等反常年份,消費傾向往往出現變化。這種消費傾向的變化可通過在收入的系數中引入虛擬變量來考察。如,設消費模型可建立如下:這里,虛擬變量D以與X相乘的方
6、式引入了模型中,從而可用來考察消費傾向的變化。假定E(?i)=0,上述模型所表示的函數可化為:正常年份:反常年份:當截距與斜率發(fā)生變化時,則需要同時引入加法與乘法形式的虛擬變量。例,考察1990年前后的中國居民的總儲蓄-收入關系是否已發(fā)生變化。表中給出了中國1979~2001年以城鄉(xiāng)儲蓄存款余額代表的居民儲蓄以及以GNP代表的居民收入的數據。以Y為儲蓄,X為收入,可令:1990年前:Yi=?1+?2Xi+?1ii=1,2…,n11990年后:Yi=?1+?2Xi+?2ii=1,2…,n2則有可能出現
7、下述四種情況中的一種:(1)?1=?1,且?2=?2,即兩個回歸相同,稱為重合回歸(CoincidentRegressions);(2)?1??1,但?2=?2,即兩個回歸的差異僅在其截距,稱為平行回歸(ParallelRegressions);(3)?1=?1,但?2??2,即兩個回歸的差異僅在其斜率,稱為匯合回歸(ConcurrentRegressions);(4)?1??1,且?2??2,即兩個回歸完全不同,稱為相異回歸(DissimilarRegressions)。平行回歸匯合回歸相異回歸可
8、以運用鄒氏結構變化的檢驗。這一問題也可通過引入乘法形式的虛擬變量來解決。將n1與n2次觀察值合并,并用以估計以下回歸:Di為引入的虛擬變量:于是有:可分別表示1990年后期與前期的儲蓄函數。在統(tǒng)計檢驗中,如果?3=0的假設被拒絕,則說明兩個時期中儲蓄函數的截距不同,如果?4=0的假設被拒絕,則說明兩個時期中儲蓄函數的斜率不同。具體的回歸結果為:(-6.11)(22.89)(4.33)(-2.55)由?3與?4的t檢驗可知:參數顯著地不等于0,強烈示出兩個時期的回歸是相