資源描述:
《嶺回歸在財政收入中應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、嶺回歸在財政收入中的應(yīng)用信息與計算科學(xué)2003級母培松指導(dǎo)老師杜世平副教授摘要:本論文介紹了嶺回歸的統(tǒng)計學(xué)原理與方法,闡述了嶺回歸與最小偏二乘法的差別與關(guān)系,總結(jié)了評價嶺回歸的k效應(yīng)的性質(zhì)與其確定方法,討論了嶺回歸在經(jīng)濟領(lǐng)域中的具體應(yīng)用,并用matlab軟件來實現(xiàn)計算程序。關(guān)鍵詞:嶺回歸,嶺跡,病態(tài)矩陣,有偏估計RidgeregressionreturnforrevenueMuPeisongInformationandComputationalScience,Grade2003DirectedbyDushiping(AssociateProfessor)Abstract
2、:Thispaperintroducedtheridgeregressionstatisticaltheoryandmethods,Describedthedifferencesandrelationshipsintheridgeregressionandthepartialleasttwomultiplication,RaisedridgeRegressionevaluationofthekeffectofnatureanditsmethod,Moredetaileddiscussionsontheridgeregressionintheeconomicfieldth
3、especificapplication,usingMatlabsoftwaretoachieveprogram.Keywords:RidgeRegression,RidgeTrace,PathologicalMatrix.BiasedEstimate1引言在回歸分析中最小二乘法是最常用的方法,使用最小二乘法的一個前提是
4、x,x
5、不為零,即矩陣XX非奇異,當(dāng)所有變量之間有較強的線性相關(guān)性時
6、;rx
7、=o,或者變量之間的數(shù)據(jù)變化比較小或者部分變量之間有線性相關(guān)性吋,矩陣的行列式
8、x,x
9、比較小,M至趨近于o,—般在實際應(yīng)用中處理:當(dāng)
10、x*x
11、<0.01時x,x常被稱為病態(tài)
12、矩陣11-2J,它表明最小二乘法并非在各方面都盡善盡美,因為這種矩陣在計算過程中極易造成約數(shù)誤差,因此得到的數(shù)據(jù)往往缺乏穩(wěn)定性與可靠性。嶺回歸是在自變量信息矩陣的主對角線元素上人為地加入一個非負因子從而使回歸系數(shù)的估計稍有偏差、而估計的穩(wěn)定性卻可能明顯提高的一種回歸分析方法,它是最小二乘法的一種補充,嶺回歸可以修復(fù)病態(tài)矩陣,達到較好的效果。近年來,它在經(jīng)濟、工業(yè)生產(chǎn)、工程技術(shù)、環(huán)境保護等方面已有一定的應(yīng)用。木論文介紹了嶺回歸的相關(guān)理論,以及嶺回歸與常回歸的聯(lián)系與區(qū)別,并結(jié)合實際例子闡述嶺回歸的應(yīng)用。2嶺回歸的統(tǒng)計基礎(chǔ)2.1嶺跡的概念線性回歸分析的正規(guī)方程組可以寫成:XX
13、b=XY(1)其最小平方解則為:b=(xy}xr(2)式(1)與(2)中的X為口變量的心加階矩陣,X’為X的轉(zhuǎn)置,(XX)為對稱的加X/7?方陣,通常xx稱為信息矩陣,(xx)t為xx的逆陣,丫為因變量的心1向量,b為待解元,即冋歸系數(shù)的加xl向量,這里的n為觀察值組數(shù),加為待估計的冋歸系數(shù)。當(dāng)
14、XX卜0時,矩陣x,x為病態(tài)矩陣,這樣最小偏二乘法就會產(chǎn)生較大的誤差,B是0的無偏估計,但B很不穩(wěn)定,在具體取值上與真值有較大的偏差,甚至有吋會出現(xiàn)與實際經(jīng)濟意義不符的正負號。如果我們在XX的主對角線元素上加上一個非負因子比,即令:驅(qū))二(XX+燦”廠XV(3)(I,n為血階
15、單位矩陣),那么b(k)與h有何不同呢(下文在這些統(tǒng)計數(shù)后均加標記(k),便于與最小二乘法,即R=0的統(tǒng)計數(shù)相區(qū)別)?最先研究這一問題的是Hoerl與Kennard以及Marquardt151,他們的基本結(jié)論是:b(k)是£的非線性函數(shù);"0時,h(k)=b同為最小平方估計數(shù);而后,隨著k的增人,b(燈中各元素勺伙)的絕對值均趨于不斷變小(由于自變數(shù)間的相關(guān),個別勺伙)可能有小范圍的向上波動或改變正、負號),它們對勺的偏差也將愈來愈大;如果Ptoo,則b伙)TO。b伙)隨k的改變而變化的軌跡,就稱為嶺跡,參見圖1,嶺跡圖表明,比的加入使b伙)成為回歸系數(shù)的有偏估計數(shù)。2
16、.2k的效應(yīng)實際上,k的加入會影響到回歸分析中的許多統(tǒng)計數(shù)2化而不僅是上述的以燈。其中最重要的還有以下兩項:1)隨著£的增大,離回歸平方與Q仗)=工[5)]2與離冋歸均方s2(k)=Q(k)/(n-m-l)都將增大,亦即必有Q⑷>0與2⑴>2,這是隨著R增大驅(qū))的偏差也愈來愈大的直接反應(yīng)L3^9Jo2)隨著k的增大,(XX+好)的逆陣、即(XX+好)"的主對角元素s伙)(心1,2,…,加)將不斷減小2化亦即必有c,(^)<C,o由于回歸系數(shù)的誤差均方=c,52,所以在k適當(dāng)可能使q?(小2伙)VC瀘2與£認)<£九,即回歸系數(shù)的誤差均方之