資源描述:
《線(xiàn)性回歸模型的研究畢業(yè)論文》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、麗水學(xué)院2014屆學(xué)生畢業(yè)(設(shè)計(jì))論文線(xiàn)性回歸模型的研究【摘要】:本文首先對(duì)回歸分析的定義、主要內(nèi)容、基本思想、實(shí)現(xiàn)過(guò)程進(jìn)行了闡述,指出了它的優(yōu)點(diǎn)及存在的問(wèn)題。對(duì)NBA比賽中的各因素和中國(guó)人口的預(yù)測(cè)進(jìn)行了研究。最后對(duì)整篇文章做了個(gè)總結(jié)?!娟P(guān)鍵詞】:回歸分析;回歸模型;檢驗(yàn);預(yù)測(cè)1引言回歸分析最早是由19世紀(jì)末期高爾頓(Sir?Francis?Galton)發(fā)展的。1855年,他發(fā)表了一篇文章名為“遺傳的身高向平均數(shù)方向的回歸”,分析父母與其孩子之間身高的關(guān)系,發(fā)現(xiàn)父母的身高越高或的其孩子也越高,反之則越矮。他把兒子跟父母身高這種現(xiàn)象擬合成一種線(xiàn)性關(guān)系。但是他還發(fā)現(xiàn)了個(gè)有趣的現(xiàn)象,高個(gè)子的人生出
2、來(lái)的兒子往往比他父親矮一點(diǎn)更趨向于平均身高,矮個(gè)子的人生出來(lái)的兒子通常比他父親高一點(diǎn)也趨向于平均身高。高爾頓選用“回歸”一詞,把這一現(xiàn)象叫做“向平均數(shù)方向的回歸”。于是“線(xiàn)形回歸”的術(shù)語(yǔ)被沿用下來(lái)了?;貧w分析中,當(dāng)研究的因果關(guān)系只涉及因變量和一個(gè)自變量時(shí),叫做一元回歸分析;當(dāng)研究的因果關(guān)系涉及因變量和兩個(gè)或兩個(gè)以上自變量時(shí),叫做多元回歸分析。此外,回歸分析中,又依據(jù)描述自變量與因變量之間因果關(guān)系的函數(shù)表達(dá)式是線(xiàn)性的還是非線(xiàn)性的,分為線(xiàn)性回歸分析和非線(xiàn)性回歸分析。按照參數(shù)估計(jì)方法可以分為主成分回歸、偏最小二乘回歸、和嶺回歸。一般采用線(xiàn)性回歸分析,由自變量和規(guī)定因變量來(lái)確定變量之間的因果關(guān)系,從而
3、建立線(xiàn)性回歸模型。模型的各個(gè)參數(shù)可以根據(jù)實(shí)測(cè)數(shù)據(jù)解。接著評(píng)價(jià)回歸模型能否夠很好的擬合實(shí)際數(shù)據(jù);如果不能夠很好的擬合,則重新擬合;如果能很好的擬合,就可以根據(jù)自變量進(jìn)行下一步推測(cè)。回歸分析是重要的統(tǒng)計(jì)推斷方法。在實(shí)際應(yīng)用中,醫(yī)學(xué)、農(nóng)業(yè)、生物、林業(yè)、金融、管理、經(jīng)濟(jì)、社會(huì)等諸多方面隨著科學(xué)的發(fā)展都需要運(yùn)用到這個(gè)方法。從而推動(dòng)了回歸分析的快速發(fā)展。15麗水學(xué)院2014屆學(xué)生畢業(yè)(設(shè)計(jì))論文2回歸分析的概述2.1回歸分析的定義回歸分析是應(yīng)用極其廣泛的數(shù)據(jù)分析方法之一?;貧w分析(regressionanalysis)是確定兩種或兩種以上變數(shù)間相互依賴(lài)的定量關(guān)系的一種統(tǒng)計(jì)分析方法。2.2回歸分析的主要內(nèi)容
4、(1)從一組數(shù)據(jù)出發(fā),確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計(jì)其中的未知參數(shù)。估計(jì)參數(shù)的常用方法是最小二乘法。(2)對(duì)這些關(guān)系式的可信程度進(jìn)行檢驗(yàn)。(3)在許多自變量共同影響著一個(gè)因變量的關(guān)系中,判斷哪個(gè)(或哪些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。(4)利用所求的關(guān)系式對(duì)某一生產(chǎn)過(guò)程進(jìn)行預(yù)測(cè)或控制?;貧w分析的應(yīng)用是非常廣泛的,統(tǒng)計(jì)軟件包使各種回歸方法計(jì)算十分方便。2.3一元線(xiàn)性回歸與多元線(xiàn)性回歸的分析一元線(xiàn)性回歸模型,是分析兩個(gè)變量之間相互關(guān)系的數(shù)學(xué)方程式,其一般表達(dá)式為y
5、=a+bx式中,y表示因變量的估計(jì)值,x表示自變量,a,b稱(chēng)為回歸模型的待定參數(shù),其中b又稱(chēng)為回歸系數(shù)。上述的回歸方程式在平面坐標(biāo)系中表現(xiàn)為一條直線(xiàn)即回歸直線(xiàn)。當(dāng)b>0時(shí)y隨x的增加而增加,兩變量之間為正相關(guān)關(guān)系;當(dāng)b<0時(shí),y隨x的增加而減少,兩變量之間為負(fù)相關(guān)關(guān)系;當(dāng)y為一個(gè)常量時(shí),不隨x的變動(dòng)而變動(dòng)。這樣就為我們判斷現(xiàn)象之間的關(guān)系,分析現(xiàn)象之間是否處于正常狀態(tài)提供了一條標(biāo)準(zhǔn)。多元線(xiàn)性回歸模型旨在分析兩個(gè)或者兩個(gè)以上的自變量作用后產(chǎn)生的結(jié)果,即多個(gè)自變量下的因變量結(jié)果,研究的是隨機(jī)變量y與多個(gè)普通變量x1,x2,…xp,(p≥2),的相關(guān)關(guān)系。表達(dá)式為y=β0+β1x1+β2x2+…βpx
6、p+ε,對(duì)隨機(jī)誤差項(xiàng)ε常假定E(ε)=0,Var(ε)=σ2。并且稱(chēng)E(y)=β0+β1x1+β2x2+…βpxp為理論回歸方程。在實(shí)際應(yīng)用中,如果獲得n組觀測(cè)數(shù)據(jù)(xi1,xi2,…,xip;yi),i=1,2,…,n,則線(xiàn)性回歸模型變?yōu)閥=β0+β1xi1+β2xi2+…βpxip+εi。并且,量y與自變量x之間的關(guān)系往往是非線(xiàn)性關(guān)系,而不是簡(jiǎn)單的線(xiàn)性關(guān)系。但在非線(xiàn)性回歸分析研究實(shí)際問(wèn)題時(shí),往往選擇可以通過(guò)一定變換后能轉(zhuǎn)換成線(xiàn)性關(guān)系的研究模型,從而避免了非線(xiàn)性回歸分析的計(jì)算的復(fù)雜性。隨著技術(shù)的不斷進(jìn)步,研究過(guò)程中經(jīng)常運(yùn)用到計(jì)算機(jī),復(fù)雜的非線(xiàn)性回歸分析模型也將被應(yīng)用在研究中,而且會(huì)越來(lái)越頻繁
7、。15麗水學(xué)院2014屆學(xué)生畢業(yè)(設(shè)計(jì))論文2.4回歸分析的基本思想在回歸分析中,把變量分為兩類(lèi)。一類(lèi)是因變量,它們通常是實(shí)際問(wèn)題中所關(guān)心的一類(lèi)指標(biāo),通常用Y表示;而影響因變量取值的的另一類(lèi)變量稱(chēng)為自變量,用X來(lái)表示。回歸分析研究的主要問(wèn)題是:(1)確定Y與X間的定量關(guān)系表達(dá)式,這種表達(dá)式稱(chēng)為回歸方程;(2)對(duì)求得的回歸方程的可信度進(jìn)行檢驗(yàn);(3)判斷自變量X對(duì)因變量Y有無(wú)影響;(4)利用所求得的