資源描述:
《線性回歸模型的研究論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、線性回歸模型的研究畢業(yè)論文1引言回歸分析最早是由19世紀(jì)末期高爾頓(Sir?Francis?Galton)發(fā)展的。1855年,他發(fā)表了一篇文章名為“遺傳的身高向平均數(shù)方向的回歸”,分析父母與其孩子之間身高的關(guān)系,發(fā)現(xiàn)父母的身高越高或的其孩子也越高,反之則越矮。他把兒子跟父母身高這種現(xiàn)象擬合成一種線性關(guān)系。但是他還發(fā)現(xiàn)了個(gè)有趣的現(xiàn)象,高個(gè)子的人生出來的兒子往往比他父親矮一點(diǎn)更趨向于平均身高,矮個(gè)子的人生出來的兒子通常比他父親高一點(diǎn)也趨向于平均身高。高爾頓選用“回歸”一詞,把這一現(xiàn)象叫做“向平均數(shù)方向的回歸”。于是“線形回歸”的術(shù)
2、語被沿用下來了?;貧w分析中,當(dāng)研究的因果關(guān)系只涉及因變量和一個(gè)自變量時(shí),叫做一元回歸分析;當(dāng)研究的因果關(guān)系涉及因變量和兩個(gè)或兩個(gè)以上自變量時(shí),叫做多元回歸分析。此外,回歸分析中,又依據(jù)描述自變量與因變量之間因果關(guān)系的函數(shù)表達(dá)式是線性的還是非線性的,分為線性回歸分析和非線性回歸分析。按照參數(shù)估計(jì)方法可以分為主成分回歸、偏最小二乘回歸、和嶺回歸。一般采用線性回歸分析,由自變量和規(guī)定因變量來確定變量之間的因果關(guān)系,從而建立線性回歸模型。模型的各個(gè)參數(shù)可以根據(jù)實(shí)測數(shù)據(jù)解。接著評(píng)價(jià)回歸模型能否夠很好的擬合實(shí)際數(shù)據(jù);如果不能夠很好的擬合,
3、則重新擬合;如果能很好的擬合,就可以根據(jù)自變量進(jìn)行下一步推測?;貧w分析是重要的統(tǒng)計(jì)推斷方法。在實(shí)際應(yīng)用中,醫(yī)學(xué)、農(nóng)業(yè)、生物、林業(yè)、金融、管理、經(jīng)濟(jì)、社會(huì)等諸多方面隨著科學(xué)的發(fā)展都需要運(yùn)用到這個(gè)方法。從而推動(dòng)了回歸分析的快速發(fā)展。2回歸分析的概述2.1回歸分析的定義回歸分析是應(yīng)用極其廣泛的數(shù)據(jù)分析方法之一?;貧w分析(regressionanalysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。2.2回歸分析的主要內(nèi)容15(1)從一組數(shù)據(jù)出發(fā),確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計(jì)其中的未知參數(shù)
4、。估計(jì)參數(shù)的常用方法是最小二乘法。(2)對(duì)這些關(guān)系式的可信程度進(jìn)行檢驗(yàn)。(3)在許多自變量共同影響著一個(gè)因變量的關(guān)系中,判斷哪個(gè)(或哪些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。(4)利用所求的關(guān)系式對(duì)某一生產(chǎn)過程進(jìn)行預(yù)測或控制?;貧w分析的應(yīng)用是非常廣泛的,統(tǒng)計(jì)軟件包使各種回歸方法計(jì)算十分方便。2.3一元線性回歸與多元線性回歸的分析一元線性回歸模型,是分析兩個(gè)變量之間相互關(guān)系的數(shù)學(xué)方程式,其一般表達(dá)式為y=a+bx式中,y
5、表示因變量的估計(jì)值,x表示自變量,a,b稱為回歸模型的待定參數(shù),其中b又稱為回歸系數(shù)。上述的回歸方程式在平面坐標(biāo)系中表現(xiàn)為一條直線即回歸直線。當(dāng)b>0時(shí)y隨x的增加而增加,兩變量之間為正相關(guān)關(guān)系;當(dāng)b<0時(shí),y隨x的增加而減少,兩變量之間為負(fù)相關(guān)關(guān)系;當(dāng)y為一個(gè)常量時(shí),不隨x的變動(dòng)而變動(dòng)。這樣就為我們判斷現(xiàn)象之間的關(guān)系,分析現(xiàn)象之間是否處于正常狀態(tài)提供了一條標(biāo)準(zhǔn)。多元線性回歸模型旨在分析兩個(gè)或者兩個(gè)以上的自變量作用后產(chǎn)生的結(jié)果,即多個(gè)自變量下的因變量結(jié)果,研究的是隨機(jī)變量y與多個(gè)普通變量x1,x2,…xp,(p≥2),的相關(guān)關(guān)
6、系。表達(dá)式為y=β0+β1x1+β2x2+…βpxp+ε,對(duì)隨機(jī)誤差項(xiàng)ε常假定E(ε)=0,Var(ε)=σ2。并且稱E(y)=β0+β1x1+β2x2+…βpxp為理論回歸方程。在實(shí)際應(yīng)用中,如果獲得n組觀測數(shù)據(jù)(xi1,xi2,…,xip;yi),i=1,2,…,n,則線性回歸模型變?yōu)閥=β0+β1xi1+β2xi2+…βpxip+εi。并且,量y與自變量x之間的關(guān)系往往是非線性關(guān)系,而不是簡單的線性關(guān)系。但在非線性回歸分析研究實(shí)際問題時(shí),往往選擇可以通過一定變換后能轉(zhuǎn)換成線性關(guān)系的研究模型,從而避免了非線性回歸分析的計(jì)算
7、的復(fù)雜性。隨著技術(shù)的不斷進(jìn)步,研究過程中經(jīng)常運(yùn)用到計(jì)算機(jī),復(fù)雜的非線性回歸分析模型也將被應(yīng)用在研究中,而且會(huì)越來越頻繁。2.4回歸分析的基本思想在回歸分析中,把變量分為兩類。一類是因變量,它們通常是實(shí)際問題中所關(guān)心的一類指標(biāo),通常用Y表示;而影響因變量取值的的另一類變量稱為自變量,用X來表示?;貧w分析研究的主要問題是:(1)確定Y與X間的定量關(guān)系表達(dá)式,這種表達(dá)式稱為回歸方程;(2)對(duì)求得的回歸方程的可信度進(jìn)行檢驗(yàn);15(3)判斷自變量X對(duì)因變量Y有無影響;(4)利用所求得的回歸方程進(jìn)行預(yù)測和控制。2.5回歸分析的實(shí)現(xiàn)過程(1
8、)確定變量:明確預(yù)測的具體目標(biāo),也就確定了因變量。如預(yù)測具體目標(biāo)是下一年度的銷售量,那么銷售量Y就是因變量。通過市場調(diào)查和查閱資料,尋找與預(yù)測目標(biāo)的相關(guān)影響因素,即自變量,并從中選出主要的影響因素。(2)建立預(yù)測模型:依據(jù)自變量和因變量的歷史統(tǒng)計(jì)資料進(jìn)行計(jì)算,在此基礎(chǔ)上建立回