資源描述:
《《統(tǒng)計學基礎(第2版)》(06511)第9章.ppt》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、第9章相關分析與回歸分析相關分析回歸分析應用相關與回歸分析應注意問題7/29/202119.1相關分析9.1.1相關關系(correlation)的概念現象間的非確定性的數量上的依存關系兩個特點⑴確實存在數量上的依存關系⑵數量依存關系的值不確定7/29/20212函數關系≠數量依存關系值確定數量依存關系值不確定相關分析(correlationanalysis)工具對象相關關系7/29/202139.1.2相關關系的種類1.按相關程度不同完全相關不完全相關不相關完全相關不相關不完全相關7/29/202142.按相關方向不同正相關負相關正相關負相關7/29/202153.
2、按相關的表現形式不同線性相關非線性相關線性相關非線性相關7/29/202164.按相關的變量多少不同單相關復相關兩個變量之間的相關關系三個或三個以上變量的相關關系單相關復相關7/29/20217完全相關不完全相關不相關正相關負相關線性相關非線性相關單相關復相關我們重點研究的相關關系7/29/202189.1.3相關圖表1.相關表(correlationtable)將一個變量按取值大小順序排列,將與其相關的另一變量數值對應列出來,便可形成簡單相關表。通過相關表,可初步看出相關關系的形式、密切程度和相關方向。7/29/20219【實例9.1】對我國部分省市人均GDP及人均
3、消費水平進行調查,得原始資料如下表9.1,通過相關表,判斷兩者相關關系。地區(qū)北京遼寧上海江西河南貴州陜西人均GDP2246011226345474851544426624549人均消費73264490115462396220816082035地區(qū)貴州陜西江西河南遼寧北京上海人均GDP2662454948515444112262246034547人均消費160820352396220844907326115467/29/2021102.相關圖(correlationdiagram)又稱散點圖(scatterplot),以橫軸表示自變量(dependentvariable
4、),縱軸表示因變量(independentvariable),通過標出的每對變量值的坐標點或散布點,觀察分布狀況。7/29/202111簡單方便形象直觀粗、略不精確7/29/2021129.1.4相關系數1.相關系數的意義(correlationcoefficient)是在直線相關條件下,說明兩個變量之間相關關系密切程度和方向的統(tǒng)計分析指標,通常用r表示。表現形式為相對數不受變量值水平和計量單位的影響7/29/202113-1≤r≤+1r>0正相關負相關r<0r=+1完全正線性相關r=-1完全負線性相關r=0完全不線性相關0<
5、r
6、<0.3微相關0.3≤
7、r
8、<0.5
9、低度相關0.5≤
10、r
11、<0.8顯著相關0.8≤
12、r
13、<1高度相關取值范圍7/29/2021142.相關系數的計算n表示相關表中數據項數【實例9.2】根據表9.1的資料,已知人均GDP與人均消費水平為直線相關關系,計算人均GDP與人均消費水平的相關系數。7/29/202115編號人均GDPx人均消費yx2y2xy12662160870862442585664428049624549203520693401414122592572153485123962353220157408161162299645444220829637136487526412020352511226
14、44901260230762016010050404740622460732650445160053670276164541960734547115461193495209133310116398879662合計85739316091904918867224483461651007421r=7×651007421-85739×31609=0.9981高度正相關7/29/202116應注意的問題相關關系不等于因果關系r只度量線性關系,弱相關不一定表明沒有關系極端值可能影響相關系數注意相關關系成立的數據范圍警惕虛假相關7/29/2021179.2回歸分析9.2.1回歸分析
15、的意義1.回歸(regression)平均身高1877年英國弗朗西斯?高爾頓爵士遺傳學研究回歸線7/29/2021182.回歸分析(regressionanalysis)研究一個或幾個變量的變動對另一個變量的變動影響程度的方法。根據資料建立相應的數學表達式通過給定自變量的數值估計因變量的可能值這種分析就叫回歸分析所建立的數學模型稱回歸模型7/29/2021199.2.2回歸分析的特點兩變量是隨機變量因變量是隨機變量兩變量對等一個相關系數兩變量不對等兩個回歸方程相關系數是抽象數值反映相關程度回歸方程具體可利用自變量估計因變量值相關分析回歸分析7/29/