資源描述:
《SPSS的相關(guān)分析和回歸分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第八章SPSS的相關(guān)分析和回歸分析概述(一)相關(guān)關(guān)系(1)函數(shù)關(guān)系:(如:銷售額與銷售量;圓面積和圓半徑.)是事物間的一種一一對(duì)應(yīng)的確定性關(guān)系.即:當(dāng)一個(gè)變量x取一定值時(shí),另一變量y可以依確定的關(guān)系取一個(gè)確定的值(2)統(tǒng)計(jì)關(guān)系:(如:收入和消費(fèi);身高的遺傳.)事物間的關(guān)系不是確定性的.即:當(dāng)一個(gè)變量x取一定值時(shí),另一變量y的取值可能有幾個(gè).一個(gè)變量的值不能由另一個(gè)變量唯一確定概述統(tǒng)計(jì)關(guān)系的常見類型:線性相關(guān):正線性相關(guān)、負(fù)線性相關(guān)非線性相關(guān)統(tǒng)計(jì)關(guān)系不象函數(shù)關(guān)系那樣直接,但卻普遍存在,且有強(qiáng)有弱.如何測(cè)度?概述(二)相關(guān)分析和回歸分析的任務(wù)研究
2、對(duì)象:統(tǒng)計(jì)關(guān)系相關(guān)分析旨在測(cè)度變量間線性關(guān)系的強(qiáng)弱程度.回歸分析側(cè)重考察變量之間的數(shù)量變化規(guī)律,并通過一定的數(shù)學(xué)表達(dá)式來描述這種關(guān)系,進(jìn)而確定一個(gè)或幾個(gè)變量的變化對(duì)另一個(gè)變量的影響程度.相關(guān)分析(一)目的通過樣本數(shù)據(jù),研究?jī)勺兞块g線性相關(guān)程度的強(qiáng)弱.(例如:職工的年齡和收入之間的關(guān)系、工人數(shù)和管理人員之間的數(shù)量關(guān)系)(二)基本方法繪制散點(diǎn)圖、計(jì)算相關(guān)系數(shù)繪制散點(diǎn)圖(一)散點(diǎn)圖將數(shù)據(jù)以點(diǎn)的形式繪制在直角平面上.比較直觀,可以用來發(fā)現(xiàn)變量間的關(guān)系和可能的趨勢(shì).體現(xiàn)了正相關(guān)趨勢(shì)繪制散點(diǎn)圖(二)基本操作步驟(1)菜單選項(xiàng):graphs->scatte
3、r(2)選擇散點(diǎn)圖類型:simple:簡(jiǎn)單散點(diǎn)圖(顯示一對(duì)變量的散點(diǎn)圖)overlay:重疊散點(diǎn)圖(顯示多對(duì)變量的散點(diǎn)圖)(3)選擇x軸和y軸的變量(4)選擇分組變量(setmarkersby):分別以不同顏色點(diǎn)的表示(5)選擇標(biāo)記變量(labelcaseby):散點(diǎn)圖上可帶有標(biāo)記變量的值(如:職工號(hào))繪制散點(diǎn)圖(三)應(yīng)用舉例通過27家企業(yè)普通員工人數(shù)和管理人員數(shù),利用散點(diǎn)圖分析人數(shù)之間的關(guān)系散點(diǎn)圖在進(jìn)行相關(guān)分析時(shí)較為粗略計(jì)算相關(guān)系數(shù)(一)相關(guān)系數(shù)(1)作用:以精確的相關(guān)系數(shù)(r)體現(xiàn)兩個(gè)變量間的線性關(guān)系程度.r:[-1,+1];r=1:完全
4、正相關(guān);r=-1:完全負(fù)相關(guān);r=0:無線性相關(guān);
5、r
6、>0.8:強(qiáng)相關(guān);
7、r
8、<0.3:弱相關(guān)計(jì)算相關(guān)系數(shù)(一)相關(guān)系數(shù)(2)說明:相關(guān)系數(shù)只是較好地度量了兩變量間的線性相關(guān)程度,不能描述非線性關(guān)系.如:x和y的取值為:(-1,-1)(-1,1)(1,-1)(1,1)r=0但xi2+yi2=2數(shù)據(jù)中存在極端值時(shí)不好如:(1,1)(2,2)(3,3),(4,4),(5,5),(6,1)r=0.33但總體上表現(xiàn)出:x=y應(yīng)結(jié)合散點(diǎn)圖分析計(jì)算相關(guān)系數(shù)(一)相關(guān)系數(shù)(3)種類:簡(jiǎn)單線性相關(guān)系數(shù)(Pearson):針對(duì)定距數(shù)據(jù).(如:身高和體重)計(jì)算
9、相關(guān)系數(shù)(一)相關(guān)系數(shù)(3)種類:Spearman相關(guān)系數(shù):用來度量定序或定類變量間的線性相關(guān)關(guān)系(如:不同年齡段與不同收入段,職稱和受教育年份)利用秩(數(shù)據(jù)的排序次序).認(rèn)為:如果x與y相關(guān),則相應(yīng)的秩Ui、Vi也具有同步性.首先得到兩變量中各數(shù)據(jù)的秩(Ui、Vi),并計(jì)算Di2統(tǒng)計(jì)量.計(jì)算Spearman秩相關(guān)系數(shù),與簡(jiǎn)單相關(guān)系數(shù)形式完全相同.若兩變量存在強(qiáng)正相關(guān)性,則Di2應(yīng)較小,秩序相關(guān)系數(shù)較大.若兩變量存在強(qiáng)負(fù)相關(guān)性,則Di2應(yīng)較大,秩序相關(guān)系數(shù)為負(fù),絕對(duì)值較大計(jì)算相關(guān)系數(shù)(一)相關(guān)系數(shù)(3)種類:Kendall相關(guān)系數(shù):度量定序定
10、類變量間的線性相關(guān)關(guān)系首先計(jì)算一致對(duì)數(shù)目(U)和非一致對(duì)數(shù)目(V)如:對(duì)x和y求秩后為:x:24351y:34152x的秩按自然順序排序后:x:12345y:23145一致對(duì):(2,3)(2,4)(2,5)(3,4)(3,5)(1,4)(1,5)(4,5)非一致對(duì):(2,1)(3,1)然后計(jì)算Kendall相關(guān)系數(shù).若兩變量存在強(qiáng)相關(guān)性,則V較小,秩序相關(guān)系數(shù)較大;若兩變量存在強(qiáng)負(fù)關(guān)性,則V較大,秩序相關(guān)系數(shù)為負(fù),絕對(duì)值較大計(jì)算相關(guān)系數(shù)(二)相關(guān)系數(shù)檢驗(yàn)應(yīng)對(duì)兩變量來自的總體是否相關(guān)進(jìn)行統(tǒng)計(jì)推斷.原因:抽樣的隨機(jī)性、樣本容量小等(1)H0:兩總
11、體零相關(guān)(2)構(gòu)造統(tǒng)計(jì)量簡(jiǎn)單相關(guān)系數(shù)Spearman系數(shù),大樣本下,近似正態(tài)分布kendall系數(shù),大樣本下,近似正態(tài)分布計(jì)算相關(guān)系數(shù)(二)相關(guān)系數(shù)檢驗(yàn)(3)計(jì)算統(tǒng)計(jì)量的值,并得到對(duì)應(yīng)的相伴概率p(4)結(jié)論:如果p<=a,則拒絕H0,兩總體存在線性相關(guān);如果p>a,不能拒絕H0.計(jì)算相關(guān)系數(shù)(三)基本操作步驟(1)菜單選項(xiàng):analyze->correlate->bivariate...(2)選擇計(jì)算相關(guān)系數(shù)的變量到variables框.(3)選擇相關(guān)系數(shù)(correlationcoefficients).(4)顯著性檢驗(yàn)(testofsig
12、nificance)tow-tailed:輸出雙尾概率P.one-tailed:輸出單尾概率P計(jì)算相關(guān)系數(shù)(四)其他選項(xiàng)statistics選項(xiàng):僅當(dāng)計(jì)算簡(jiǎn)單相關(guān)系