資源描述:
《多元線性回歸方法應(yīng)用文獻綜述》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、多元線性回歸方法應(yīng)用摘要回歸分析是統(tǒng)計分析的重要組成部分,在生產(chǎn)實際和科學(xué)實驗中有著廣泛應(yīng)用,用回歸分析方法建立模型來研究實際問題是一種常用的有效方法。它通過研究隨機變量之間的關(guān)系來描述數(shù)據(jù)群體的主要特征。本文首先給出回歸分析方法的主要內(nèi)容及解決問題的一般步驟,簡單的介紹了變量間的兩類關(guān)系,敘述了多元線性回歸理論模型,列舉了多元線性回歸模型應(yīng)遵從的假定條件,探討了多元線性回歸模型中未知參數(shù)的估計方法及其參數(shù)的檢驗問題。最后通過具體的案例來總結(jié)了多元回歸分析在各個科學(xué)領(lǐng)域的廣泛應(yīng)用,重點描述了多元線性回歸分析方法
2、在自變量對因變量影響的顯著性判斷中的應(yīng)用。關(guān)鍵詞:多元線性回歸模型;模型檢驗;實例應(yīng)用引言回歸分析方法是統(tǒng)計分析的重要組成部分,在研究實際問題時,用回歸分析方法建立模型來研究問題就是一種常用的有效方法。什么是回歸分析呢?大家知道:回歸分析是研究隨機變量之間的關(guān)系。回歸分方法一般與實際聯(lián)系比較密切,因為隨機變量的取值是隨機的,大多數(shù)是通過實驗得到的,這種來自于實際中與隨機變量相關(guān)的模型的準(zhǔn)確度(可信度)如何,需通過進一步的統(tǒng)計實驗來判斷其模型中隨機變量(回歸變量)的顯著性,而且,往往需要經(jīng)過反復(fù)地進行檢驗和修改模
3、型,直到得到最佳的結(jié)果,最后應(yīng)用于實際中去?;貧w分析是一種傳統(tǒng)的應(yīng)用性較強的科學(xué)方法,在各個科學(xué)領(lǐng)域都得到了廣泛的應(yīng)用。它不僅能夠把隱藏在大規(guī)模原始數(shù)據(jù)群體中的重要信息提煉出來,得到其變量間相關(guān)關(guān)系的數(shù)學(xué)表達式,從而把握住數(shù)據(jù)群體的主要特征,進而利用相關(guān)概率統(tǒng)計知識以判別其有效性;另外,還可以利用關(guān)系式,由一個或多個變量值去預(yù)測和控制另一個因變量的取值,從而知道這種預(yù)測和控制達到的程度,并進行因素分析?;貧w分析的主要內(nèi)容是:(1)從一組數(shù)據(jù)出發(fā),確定這些變量(參數(shù))間的定量關(guān)系(回歸模型);(2)對模型的可信度
4、進行統(tǒng)計檢驗;(3)從有關(guān)的許多變量中,判斷變量的顯著性(即哪些是顯著的,哪些是不顯著的,顯著的保留,不顯著的忽略);(1)應(yīng)用的結(jié)果是對實際問題作出的判斷。在利用回歸分析解決問題時,首先要建立模型,即函數(shù)關(guān)系式,其自變量稱為回歸變量,因變量稱為應(yīng)變量或響應(yīng)變量。如果模型中只含有一個回歸變量,稱為一元回歸模型,否則稱為多元回歸模型(實際中所見到的大都是線性回歸模型,非線性的一般可以化為線性的來處理)[2]。多元線性回歸數(shù)學(xué)模型許多現(xiàn)象往往不是簡單的與某一因素有關(guān),而是受多個因素的影響,此時就需要用兩個或兩個以上
5、的影響因素作為自變量來解釋因變量的變化,這就是多元回歸亦稱多重回歸。當(dāng)多個自變量與因變量之間是線性關(guān)系時,所進行的回歸分析就是多元線性回歸。設(shè)可預(yù)測的隨機變量為,它受到個非隨機因素,和不可預(yù)測的隨機因素的影響。多元線性回歸數(shù)學(xué)模型為:其中,為回歸系數(shù),對和分別進行次獨立觀測,取得組數(shù)據(jù)(本)則有:(4)其中相互獨立,且服從分布。令,,則式(4)用矩陣形式表式為(5)2.4模型檢驗多元線性回歸數(shù)學(xué)模型建立后,是否與實際數(shù)據(jù)有較好的擬合度,其模型線性關(guān)系的顯著性如何等,還需通過數(shù)理統(tǒng)計進行檢驗。多元性回歸模型與一元
6、線性回歸模型一樣,在得到參數(shù)的最小二乘法的估計值之后,也需要進行必要的檢驗與評價,以決定模型是否可以應(yīng)用。常用的統(tǒng)計檢驗有R檢驗和F檢驗[4]。2.4.1回歸方程的顯著性檢驗(F檢驗)F檢驗即方程的顯著性檢驗,旨在對模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。為了從總體上檢驗?zāi)P椭斜唤忉屪兞颗c解釋變量之間的線性關(guān)系是否顯著成立,檢驗的原假設(shè)為:(表示方程中回歸系數(shù)的個數(shù),也可以稱為自變量的個數(shù))若成立,則模型中被解釋變量與解釋變量之間不存在顯著的線性關(guān)系。備擇解釋為:不全為零。若原假設(shè)
7、成立,則檢驗統(tǒng)計量:(12)其中為自變量個數(shù),為數(shù)據(jù)個數(shù)。F服從分布取顯著性水平為,可以從F分布表中查出相應(yīng)的自由度。設(shè)檢驗水平為,則檢驗規(guī)則是:若,接受原假設(shè);若,則接受備選假設(shè)。如果,表明回歸模型顯著,可從用于預(yù)測。反之,回歸模型不能用于預(yù)測。2.4.2回歸方程擬合度檢驗(R檢驗)(11)是復(fù)相關(guān)系數(shù),用于測定回歸模型的擬合優(yōu)度,越大,說明與的線性關(guān)系越顯著,為的平均值,取值范圍為2.4.3回歸系數(shù)的顯著性檢驗(t檢驗)對于多元線性回歸模型,總體回歸方程線性關(guān)系的顯著性,并不意味著每個解釋變量對被解釋變量的
8、影響都是顯著的。因此,有必要通過檢驗把那些對被解釋變量影響不顯著的解釋變量從模型中剔除,只保留對被解釋變量影響顯著的解釋變量,以建立更為簡單合理的多元線性回歸模型。如果一個解釋變量對被解釋變量的影響不顯著,則對應(yīng)于該解釋變量的回歸系數(shù)的值等于0。因此,我們只要檢驗一個解釋變量的回歸系數(shù)的值是否為0就可以了。檢驗原假設(shè):;備擇假設(shè):。判別標(biāo)準(zhǔn),若接受原假設(shè);若接受備擇假設(shè)。Matlab的