資源描述:
《線性回歸模型的研究_畢設(shè)論文.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、麗水學(xué)院2014屆學(xué)生畢業(yè)(設(shè)計)論文線性回歸模型的研究學(xué)院:理學(xué)院班級:金融數(shù)學(xué)10本姓名:俞超迪指導(dǎo)老師:楊毅【摘要】:本文首先對回歸分析的定義、主要內(nèi)容、基本思想、實現(xiàn)過程進(jìn)行了闡述,指出了它的優(yōu)點及存在的問題。對NBA比賽中的各因素和中國人口的預(yù)測進(jìn)行了研究。最后對整篇文章做了個總結(jié)。【關(guān)鍵詞】:回歸分析;回歸模型;檢驗;預(yù)測1引言回歸分析最早是由19世紀(jì)末期高爾頓(Sir?Francis?Galton)發(fā)展的。1855年,他發(fā)表了一篇文章名為“遺傳的身高向平均數(shù)方向的回歸”,分析父母與其孩子之間身高的關(guān)系,發(fā)現(xiàn)父母的身高越高或的其孩子也越高,反之則越矮。他把兒子跟父母身高這種現(xiàn)象擬
2、合成一種線性關(guān)系。但是他還發(fā)現(xiàn)了個有趣的現(xiàn)象,高個子的人生出來的兒子往往比他父親矮一點更趨向于平均身高,矮個子的人生出來的兒子通常比他父親高一點也趨向于平均身高。高爾頓選用“回歸”一詞,把這一現(xiàn)象叫做“向平均數(shù)方向的回歸”。于是“線形回歸”的術(shù)語被沿用下來了?;貧w分析中,當(dāng)研究的因果關(guān)系只涉及因變量和一個自變量時,叫做一元回歸分析;當(dāng)研究的因果關(guān)系涉及因變量和兩個或兩個以上自變量時,叫做多元回歸分析。此外,回歸分析中,又依據(jù)描述自變量與因變量之間因果關(guān)系的函數(shù)表達(dá)式是線性的還是非線性的,分為線性回歸分析和非線性回歸分析。按照參數(shù)估計方法可以分為主成分回歸、偏最小二乘回歸、和嶺回歸。一般采用線
3、性回歸分析,由自變量和規(guī)定因變量來確定變量之間的因果關(guān)系,從而建立線性回歸模型。模型的各個參數(shù)可以根據(jù)實測數(shù)據(jù)解。接著評價回歸模型能否夠很好的擬合實際數(shù)據(jù);如果不能夠很好的擬合,則重新擬合;如果能很好的擬合,就可以根據(jù)自變量進(jìn)行下一步推測?;貧w分析是重要的統(tǒng)計推斷方法。在實際應(yīng)用中,醫(yī)學(xué)、農(nóng)業(yè)、生物、林業(yè)、金融、管理、經(jīng)濟(jì)、社會等諸多方面隨著科學(xué)的發(fā)展都需要運用到這個方法。從而推動了回歸分析的快速發(fā)展。15麗水學(xué)院2014屆學(xué)生畢業(yè)(設(shè)計)論文2回歸分析的概述2.1回歸分析的定義回歸分析是應(yīng)用極其廣泛的數(shù)據(jù)分析方法之一。回歸分析(regressionanalysis)是確定兩種或兩種以上變數(shù)
4、間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。2.2回歸分析的主要內(nèi)容(1)從一組數(shù)據(jù)出發(fā),確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計其中的未知參數(shù)。估計參數(shù)的常用方法是最小二乘法。(2)對這些關(guān)系式的可信程度進(jìn)行檢驗。(3)在許多自變量共同影響著一個因變量的關(guān)系中,判斷哪個(或哪些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。(4)利用所求的關(guān)系式對某一生產(chǎn)過程進(jìn)行預(yù)測或控制?;貧w分析的應(yīng)用是非常廣泛的,統(tǒng)計軟件包使各種回歸方法計算十分方便。2.3一元線性回歸與多元線性回歸的分析一元線性
5、回歸模型,是分析兩個變量之間相互關(guān)系的數(shù)學(xué)方程式,其一般表達(dá)式為y=a+bx式中,y表示因變量的估計值,x表示自變量,a,b稱為回歸模型的待定參數(shù),其中b又稱為回歸系數(shù)。上述的回歸方程式在平面坐標(biāo)系中表現(xiàn)為一條直線即回歸直線。當(dāng)b>0時y隨x的增加而增加,兩變量之間為正相關(guān)關(guān)系;當(dāng)b<0時,y隨x的增加而減少,兩變量之間為負(fù)相關(guān)關(guān)系;當(dāng)y為一個常量時,不隨x的變動而變動。這樣就為我們判斷現(xiàn)象之間的關(guān)系,分析現(xiàn)象之間是否處于正常狀態(tài)提供了一條標(biāo)準(zhǔn)。多元線性回歸模型旨在分析兩個或者兩個以上的自變量作用后產(chǎn)生的結(jié)果,即多個自變量下的因變量結(jié)果,研究的是隨機(jī)變量y與多個普通變量x1,x2,…xp,(
6、p≥2),的相關(guān)關(guān)系。表達(dá)式為y=β0+β1x1+β2x2+…βpxp+ε,對隨機(jī)誤差項ε常假定E(ε)=0,Var(ε)=σ2。并且稱E(y)=β0+β1x1+β2x2+…βpxp為理論回歸方程。在實際應(yīng)用中,如果獲得n組觀測數(shù)據(jù)(xi1,xi2,…,xip;yi),i=1,2,…,n,則線性回歸模型變?yōu)閥=β0+β1xi1+β2xi2+…βpxip+εi。并且,量y與自變量x之間的關(guān)系往往是非線性關(guān)系,而不是簡單的線性關(guān)系。但在非線性回歸分析研究實際問題時,往往選擇可以通過一定變換后能轉(zhuǎn)換成線性關(guān)系的研究模型,從而避免了非線性回歸分析的計算的復(fù)雜性。隨著技術(shù)的不斷進(jìn)步,研究過程中經(jīng)常運用
7、到計算機(jī),復(fù)雜的非線性回歸分析模型也將被應(yīng)用在研究中,而且會越來越頻繁。15麗水學(xué)院2014屆學(xué)生畢業(yè)(設(shè)計)論文2.4回歸分析的基本思想在回歸分析中,把變量分為兩類。一類是因變量,它們通常是實際問題中所關(guān)心的一類指標(biāo),通常用Y表示;而影響因變量取值的的另一類變量稱為自變量,用X來表示?;貧w分析研究的主要問題是:(1)確定Y與X間的定量關(guān)系表達(dá)式,這種表達(dá)式稱為回歸方程;(2)對求得的回歸方程的可信度進(jìn)行檢驗