資源描述:
《相關(guān)分析和回歸分析SPSS》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第SPSS章相關(guān)分析與回歸分析本章內(nèi)容8.1相關(guān)分析和回歸分析概述8.2相關(guān)分析8.3偏相關(guān)分析8.4線性回歸分析8.5曲線估計(jì)8.6二項(xiàng)Logistic回歸分析8.1相關(guān)分析和回歸分析概述客觀事物之間的關(guān)系大致可歸納為兩大類,即函數(shù)關(guān)系:指兩事物之間的一種一一對(duì)應(yīng)的關(guān)系,如商品的銷售額和銷售量之間的關(guān)系。相關(guān)關(guān)系(統(tǒng)計(jì)關(guān)系):指兩事物之間的一種非一一對(duì)應(yīng)的關(guān)系,例如家庭收入和支出、子女身高和父母身高之間的關(guān)系等。相關(guān)關(guān)系又分為線性相關(guān)和非線性相關(guān)。相關(guān)分析和回歸分析都是分析客觀事物之間相關(guān)關(guān)系的數(shù)量分析方法。雙變量關(guān)系強(qiáng)度測(cè)量的主要指標(biāo)
2、8.2相關(guān)分析相關(guān)分析通過(guò)圖形和數(shù)值兩種方式,有效地揭示事物之間相關(guān)關(guān)系的強(qiáng)弱程度和形式。8.2.1散點(diǎn)圖它將數(shù)據(jù)以點(diǎn)的的形式畫在直角坐標(biāo)系上,通過(guò)觀察散點(diǎn)圖能夠直觀的發(fā)現(xiàn)變量間的相關(guān)關(guān)系及他們的強(qiáng)弱程度和方向。8.2.2相關(guān)系數(shù)利用相關(guān)系數(shù)進(jìn)行變量間線性關(guān)系的分析通常需要完成以下兩個(gè)步驟:第一,計(jì)算樣本相關(guān)系數(shù)r;相關(guān)系數(shù)r的取值在-1~+1之間R>0表示兩變量存在正的線性相關(guān)關(guān)系;r<0表示兩變量存在負(fù)的線性相關(guān)關(guān)系R=1表示兩變量存在完全正相關(guān);r=-1表示兩變量存在完全負(fù)相關(guān);r=0表示兩變量不相關(guān)
3、r
4、>0.8表示兩變量有較強(qiáng)的
5、線性關(guān)系;
6、r
7、<0.3表示兩變量之間的線性關(guān)系較弱第二,對(duì)樣本來(lái)自的兩總體是否存在顯著的線性關(guān)系進(jìn)行推斷。對(duì)不同類型的變量應(yīng)采用不同的相關(guān)系數(shù)來(lái)度量,常用的相關(guān)系數(shù)主要有Pearson簡(jiǎn)單相關(guān)系數(shù)、Spearman等級(jí)相關(guān)系數(shù)和Kendall相關(guān)系數(shù)等。8.2.2.1Pearson簡(jiǎn)單相關(guān)系數(shù)(適用于兩個(gè)變量都是數(shù)值型的數(shù)據(jù))Pearson簡(jiǎn)單相關(guān)系數(shù)的檢驗(yàn)統(tǒng)計(jì)量為:8.2.2.2Spearman等級(jí)相關(guān)系數(shù)Spearman等級(jí)相關(guān)系數(shù)用來(lái)度量定序變量間的線性相關(guān)關(guān)系,設(shè)計(jì)思想與Pearson簡(jiǎn)單相關(guān)系數(shù)相同,只是數(shù)據(jù)為非定距的,故計(jì)算
8、時(shí)并不直接采用原始數(shù)據(jù),而是利用數(shù)據(jù)的秩,用兩變量的秩代替代入Pearson簡(jiǎn)單相關(guān)系數(shù)計(jì)算公式中,于是其中的和的取值范圍被限制在1和n之間,且可被簡(jiǎn)化為:如果兩變量的正相關(guān)性較強(qiáng),它們秩的變化具有同步性,于是的值較小,r趨向于1;如果兩變量的正相關(guān)性較弱,它們秩的變化不具有同步性,于是的值較大,r趨向于0;在小樣本下,在零假設(shè)成立時(shí),Spearman等級(jí)相關(guān)系數(shù)服從Spearman分布;在大樣本下,Spearman等級(jí)相關(guān)系數(shù)的檢驗(yàn)統(tǒng)計(jì)量為Z統(tǒng)計(jì)量,定義為:Z統(tǒng)計(jì)量近似服從標(biāo)準(zhǔn)正態(tài)分布。8.2.3計(jì)算相關(guān)系數(shù)的基本操作相關(guān)分析用于描述兩
9、個(gè)變量間關(guān)系的密切程度,其特點(diǎn)是變量不分主次,被置于同等的地位。在Analyze的下拉菜單Correlate命令項(xiàng)中有三個(gè)相關(guān)分析功能子命令Bivariate過(guò)程、Partial過(guò)程、Distances過(guò)程,分別對(duì)應(yīng)著相關(guān)分析、偏相關(guān)分析和相似性測(cè)度(距離)的三個(gè)spss過(guò)程。Bivariate過(guò)程用于進(jìn)行兩個(gè)或多個(gè)變量間的相關(guān)分析,如為多個(gè)變量,給出兩兩相關(guān)的分析結(jié)果。Partial過(guò)程,當(dāng)進(jìn)行相關(guān)分析的兩個(gè)變量的取值都受到其他變量的影響時(shí),就可以利用偏相關(guān)分析對(duì)其他變量進(jìn)行控制,輸出控制其他變量影響后的偏相關(guān)系數(shù)。Distances過(guò)
10、程用于對(duì)各樣本點(diǎn)之間或各個(gè)變量之間進(jìn)行相似性分析,一般不單獨(dú)使用,而作為聚類分析和因子分析等的預(yù)分析。Bivariate相關(guān)分析步驟(1)選擇菜單Analyze-Correlate-Bivariate,出現(xiàn)窗口:(2)把參加計(jì)算相關(guān)系數(shù)的變量選到Variables框。(3)在CorrelationCoefficents框中選擇計(jì)算哪種相關(guān)系數(shù)。(4)在TestofSignificance框中選擇輸出相關(guān)系數(shù)檢驗(yàn)的雙邊(Two-Tailed)概率p值或單邊(One-Tailed)概率p值。(5)選中Flagsignificancecorre
11、lation選項(xiàng)表示分析結(jié)果中除顯示統(tǒng)計(jì)檢驗(yàn)的概率p值外,還輸出星號(hào)標(biāo)記,以標(biāo)明變量間的相關(guān)性是否顯著;不選中則不輸出星號(hào)標(biāo)記。(6)在Option按鈕中的Statistics選項(xiàng)中,選中Cross-productdeviationsandcovariances表示輸出兩變量的離差平方和協(xié)方差。8.2.4相關(guān)分析應(yīng)用舉例為研究高等院校人文社會(huì)科學(xué)研究中立項(xiàng)課題數(shù)會(huì)受哪些因素的影響,收集1999年31個(gè)省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),研究立項(xiàng)課題數(shù)(當(dāng)年)與投入的具有高級(jí)職稱的人年數(shù)(當(dāng)年)、發(fā)表的論文數(shù)(上年)之間是否具有較強(qiáng)的
12、線性關(guān)系。對(duì)該問(wèn)題的研究可以采用相關(guān)分析的方法,首先可繪制矩陣散點(diǎn)圖;其次可以計(jì)算Pearson簡(jiǎn)單相關(guān)系數(shù)。8.3偏相關(guān)分析8.3.1偏相關(guān)分析和偏相關(guān)系數(shù)上節(jié)中的相關(guān)系數(shù)是研究?jī)勺兞块g線性