資源描述:
《應(yīng)用統(tǒng)計學第6章 相關(guān)與回歸分析課件.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第6章相關(guān)及回歸分析相關(guān)分析與回歸分析可以定量地建立一個變量關(guān)于另一個變量或另幾個變量的數(shù)學模型,從而對變量進行預(yù)測或控制。主要內(nèi)容6.1相關(guān)分析6.2一元線性回歸分析6.3多元線性回歸分析6.4非線性回歸分析6.5用SPSS進行相關(guān)及回歸分析§6.1相關(guān)分析6.1.1變量間的關(guān)系變量關(guān)系確定性關(guān)系:相關(guān)關(guān)系可用確定的函數(shù)表達式表達相關(guān)方向正相關(guān)負相關(guān)相關(guān)程度完全相關(guān)完全不相關(guān)不完全相關(guān)相關(guān)形式線性相關(guān)非線性相關(guān)變量的個數(shù):單相關(guān)/復(fù)相關(guān)/偏相關(guān)例:現(xiàn)調(diào)查了15個地區(qū)化妝品的銷量、地區(qū)人數(shù)與人均收入,試對銷量與人均收入、地區(qū)人數(shù)的關(guān)系進行討論6.1.2相
2、關(guān)分析相關(guān)分析(CorrelationAnalysis)是根據(jù)觀察的數(shù)據(jù)資料,在具有相關(guān)關(guān)系的變量之間,對現(xiàn)象之間的依存關(guān)系的表現(xiàn)形式和密切程度的研究,它處理的是一種相互關(guān)系。兩種方法散點圖:相關(guān)系數(shù):詳細的定量分析之前,對變量之間存在的相關(guān)關(guān)系的方向、形式和密切程度進行大致判斷(如上一例)定量分析相關(guān)系數(shù)的定義:又稱Pearson相關(guān)系數(shù),是根據(jù)樣本數(shù)據(jù)計算的對兩個變量之間線性關(guān)系強弱的度量值。樣本相關(guān)系數(shù)的計算公式設(shè)(xi,yi)(i=1,2,…,n)是來自總體(X,Y)的樣本,則樣本相關(guān)系數(shù)的計算公式為:式中,相關(guān)系數(shù)的意義:r無單位,-1≤r≤1
3、①0<r<1表示兩個變量間存在正線性相關(guān)關(guān)系。②-1<r<0表示兩個變量間存在負線性相關(guān)關(guān)系。③r=0表示兩個變量間不存在線性相關(guān)關(guān)系。④
4、r
5、=1表示兩個變量間存在完全線性相關(guān)關(guān)系。⑤
6、r
7、越接近于0,表示兩變量間線性相關(guān)程度越低。⑥
8、r
9、越接近于1,表示兩變量間線性相關(guān)程度越高。相關(guān)系數(shù)等級劃分表r的取值
10、r
11、<0.30.3≤
12、r
13、<0.50.5≤
14、r
15、<0.8
16、r
17、≥0.8相關(guān)程度不線性相關(guān)低度線性相關(guān)中度線性相關(guān)高度線性相關(guān)相關(guān)系數(shù)是無量綱的量,可以進行比較。兩個變量相關(guān)程度的高低取決于
18、r
19、的大小,而不是r數(shù)值的大小。相關(guān)系數(shù)是一種對稱測量,因
20、此相關(guān)關(guān)系≠因果關(guān)系計算相關(guān)系數(shù)要求樣本容量n要大一些,否則不易做出正確判斷;另外,極端值也可能影響相關(guān)系數(shù)。相關(guān)系數(shù)只度量變量間的線性關(guān)系。因此,當r=0或很小時,只能說明線性相關(guān)關(guān)系較弱,并不能說明變量之間沒有任何關(guān)系,比如可能存在非線性相關(guān)關(guān)系。注意:相關(guān)系數(shù)的檢驗由于存在抽樣的隨機性和樣本數(shù)量較少等原因,通常導(dǎo)致推斷的可信程度不高。因此需要通過假設(shè)檢驗的方式對樣本來自的兩個總體是否存在顯著的線性相關(guān)進行統(tǒng)計推斷。相關(guān)系數(shù)檢驗的步驟如下:(1)提出假設(shè):H0:ρ=0H1:ρ≠0(2)構(gòu)造檢驗統(tǒng)計量。在H0成立時,檢驗統(tǒng)計量t=(3)給定顯著性水平α
21、,查表確定臨界點(4)確定拒絕域:(5)做統(tǒng)計決策:若拒絕H0,說明兩總體之間線性關(guān)系顯著;否則,認為兩總體之間線性關(guān)系不顯著。§6.2一元線性回歸分析回歸分析(RegressionAnalysis),是在分析變量之間相關(guān)關(guān)系的基礎(chǔ)上,進一步考察變量之間的數(shù)量變化規(guī)律,并通過回歸方程的形式加以描述和反映變量之間的關(guān)系,幫助人們準確把握變量受其他一個或多個變量影響的程度,進而為控制和預(yù)測提供依據(jù)?!盎貧w”名稱的由來回歸名稱的由來要歸功于英國統(tǒng)計學F.高爾頓(F.Galton:1822~1911)。高爾頓和他的學生、現(xiàn)代統(tǒng)計學的奠基者之一K.皮爾遜(K.Pe
22、arson:1856~1936)在研究父母身高與其子女身高的遺傳問題時,在觀察了1078對夫婦后,以每對夫婦的平均身高作為x,取他們的一個成年兒子的身高為y,將結(jié)果繪成散點圖后發(fā)現(xiàn)成一條直線。計算出回歸方程為這種趨勢說明父母平均身高x每增加一個單位,其成年兒子的平均身高增加0.516個單位。該結(jié)果表明:高個子父親確實有生高個子兒子的趨勢。子代人的身高有回歸到同齡人平均身高的趨勢。此例形象的說明了生物學物種的穩(wěn)定性。分類6.2.2一元線性回歸模型回歸分析正是要建立Y關(guān)于X1,X2,…,Xn的回歸方程,并在給定X1,X2,…,Xn的條件下,通過回歸方程來預(yù)測
23、Y的平均值。回歸分析中的兩類主要變量解釋變量(因變量Dependentvariable)記為Y被解釋變量(自變量Independent~)記為X1,X2,…,Xn?;貧w分析一元回歸分析—被解釋變量只有一個多元回歸分析—被解釋變量有一個以上被解釋變量的個數(shù)線性回歸分析非線性回歸分析回歸分析回歸方程的形式可以用相關(guān)分析或非線性回歸分析1.一元線性回歸模型的建立畫出兩個變量X和Y的散點圖由X的變化引起的Y的線性變化部分Y=a+bXY=a+bX+ε由于其他隨機因素引起的Y的變化部分ε,ε~N(0,σ2)觀察散點是否呈直線趨勢是否建立一元線性回歸模型:Y=a+bX
24、+ε如何建立方程???最小二乘法根據(jù)距離觀測值的各點平方和最小原則確定參數(shù)的方法