資源描述:
《spss回歸分析相關分析》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、相關分析Correlations線性相關:當一個變量的值發(fā)生變化時,另外的一個變量也發(fā)生大致相同的變化。(+-)非線性相關:如果一個變量發(fā)生變動,另外的變量也隨之變動,但是,其觀察值分布近似的在一條曲線上。如果僅僅研究變量之間的相互關系的密切程度和變化趨勢,并用適當的統(tǒng)計指標描述。這就是相關分析。如果要把變量間相互關系用函數表達出來,用一個或多個變量的取值來估計另一個變量的取值,這就是回歸分析。繪制散點圖和計算相關系數是相關分析最常用的工具,它們的相互結合能夠達到較為理想的分析效果相關分析Corre
2、lations是將數據以點的形式畫在直角坐標系上,通過觀察散點圖能夠直觀的發(fā)現(xiàn)變量間的相關關系及它們的強弱程度和方向。散點圖:完全負相關負相關無相關完全正相關正相關無相關實際操作:簡單散點圖:生成一對相關變量的散點圖重疊散點圖:生成多對相關變量的散點圖矩陣散點圖:同時生成多對相關變量的矩陣散點圖三維散點圖:生產成三個變量之間的三維散點圖相關分析Correlations①表示一對變量間統(tǒng)計關系的散點圖②將縱軸變量選入【Y軸】,③將橫軸變量選入【X軸】,④將分組變量選入【設置標記】:用該變量分組,并在一
3、張圖上用不同顏色繪制若干個散點圖。⑤將標記變量選入【標注個案】:將標記變量的各變量值標記在散點圖相應點的旁邊。簡單散點圖:計算相關系數:利用相關系數進行變量間線性關系的分析通常需要完成以下兩個步驟:1.計算樣本相關系數r;相關系數r的取值在-1---+1之間r>0表示兩變量存在正的線性相關關系;r<0表示兩變量存在負的線性相關關系r=1表示兩變量存在完全正相關;r=-1表示兩變量存在完全負相關;r=0表示兩變量不相關
4、r
5、>0.8表示兩變量有較強的線性關系;
6、r
7、<0.3表示兩變量之間的線性關系較弱
8、2.對樣本來自的兩總體是否存在顯著的線性關系進行推斷。由于存在隨機抽樣和樣本數量較少等原因,通常樣本相關系數不能直接用來說明樣本來自的總體是否具有顯著的線性相關而需要通過假設檢驗的方式對樣本來自的總體是否存在顯著的線性相關關系進行統(tǒng)計推斷。基本步驟是:(1)提出原假設,即兩總體無顯著的線性關系。(2)選擇檢驗統(tǒng)計量,即不同的相關系數。(3)計算檢驗統(tǒng)計量的觀測值和對應的概率值。(4)決策:p與a的關系。對不同類型的變量應采用不同的相關系數來度量,常用的相關系數主要有Pearson簡單相關系數、Spe
9、arman等級相關系數和Kendall相關系數等。1.Pearson簡單相關系數(適用于兩個變量都是數值型的數據)Pearson簡單相關系數的檢驗統(tǒng)計量為:相關分析CorrelationsPearson系數用來度量定距型變量間的相關系數。積距相關分析,即最常用的參數相關分析,適用于雙正態(tài)連續(xù)變量。Spearman相關等級系數用來度量定序變量間的線性相關系數。該系數的設計思想與Pearson簡單相關系數完全相同,只是應用的范圍不一樣。對數據沒有嚴格的要求。Kendall采用非參數檢驗方法用來度量定序變
10、量的線性相關關系。對數據分布沒有嚴格要求,適用于有序(等級)變量之間的關聯(lián)程度。相關分析Correlations嘗試把收入分為等級然后kendell正態(tài)分布:皮爾遜積矩相關只適用于雙元正態(tài)分別的變量。如果正態(tài)分布的前提不滿足,兩變量之間的關系可能屬于非線性相關。樣本獨立性:被試必須來自于總體的隨機樣本,且被試之間必須相互獨立。替換極值:變量中的極端如極值、離群值對相關系數的影響較大,最好加以剔除或代之以均值或中數。相關分析Correlations2Spearman等級相關系數Spearman等級相關
11、系數用來度量定序變量間的線性相關關系,設計思想與Pearson簡單相關系數相同,只是數據為非定距的,故計算時不直接采用原始數據而是利用數據的秩,用兩變量的秩代替代入Pearson簡單相關系數計算公式于是其中的和的取值范圍被限制在1和n之間,且可被簡化為:相關分析Correlations如果兩變量的正相關性較強,它們秩的變化具有同步性,于是較小,r趨向于1;如果兩變量的正相關性較弱,它們秩的變化不具有同步性,于是較大,r趨向于0;小樣本下,在零假設成立時,Spearman等級相關系數服從Spearma
12、n分布;在大樣本下,Spearman等級相關系數的檢驗統(tǒng)計量為Z統(tǒng)計量,定義為Z統(tǒng)計量近似服從標準正態(tài)分布。3.Kendall相關系數用非參數檢驗方法度量定序變量間的線性相關關系利用變量秩數據計算一致對數目和非一致對數目。當兩個變量具有較強的正相關關系,則一致對數目較大,非一致對數目較小,當兩個變量具有較強的負相關關系,則一致對數目較小,非一致對數目較大,當兩個變量相關性較弱,則一致對數目和非一致對數目大致相等Kendall相關系數在小樣本下,Kendall相關系數服