資源描述:
《spss 10.0高級(jí)教程十三:分類資料的logistic回歸分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、SPSS?10.0高級(jí)教程十三:分類資料的Logistic回歸分析(2009-02-0515:32:54)轉(zhuǎn)載所謂Logistic模型,或者說Logistic回歸模型,就是人們想為兩分類的應(yīng)變量作一個(gè)回歸方程出來,可概率的取值在0~1之間,回歸方程的應(yīng)變量取值可是在實(shí)數(shù)集中,直接做會(huì)出現(xiàn)0~1范圍之外的不可能結(jié)果,因此就有人耍小聰明,將率做了一個(gè)Logit變換,這樣取值區(qū)間就變成了整個(gè)實(shí)數(shù)集,作出來的結(jié)果就不會(huì)有問題了,從而該方法就被叫做了Logistic回歸。隨著模型的發(fā)展,Logistic家族也變得人丁興旺起來,
2、除了最早的兩分類Logistic外,還有配對(duì)Logistic模型,多分類Logistic模型、隨機(jī)效應(yīng)的Logistic模型等。由于SPSS的能力所限,對(duì)話框只能完成其中的兩分類和多分類模型,下面我們就介紹一下最重要和最基本的兩分類模型。10.3.1界面詳解與實(shí)例例11.1某研究人員在探討腎細(xì)胞癌轉(zhuǎn)移的有關(guān)臨床病理因素研究中,收集了一批行根治性腎切除術(shù)患者的腎癌標(biāo)本資料,現(xiàn)從中抽取26例資料作為示例進(jìn)行l(wèi)ogistic回歸分析(本例來自《衛(wèi)生統(tǒng)計(jì)學(xué)》第四版第11章)?!:標(biāo)本序號(hào)·x1:確診時(shí)患者的年齡(歲)·x2
3、:腎細(xì)胞癌血管內(nèi)皮生長(zhǎng)因子(VEGF),其陽性表述由低到高共3個(gè)等級(jí)?·x3:腎細(xì)胞癌組織內(nèi)微血管數(shù)(MVC)?·x4:腎癌細(xì)胞核組織學(xué)分級(jí),由低到高共4級(jí)?·x5:腎細(xì)胞癌分期,由低到高共4期?·y:腎細(xì)胞癌轉(zhuǎn)移情況(有轉(zhuǎn)移y=1;無轉(zhuǎn)移y=0)。i?x1?x2?x3?x4?x5?y1?59?2?43.4?2?1?02?36?1?57.2?1?1?03?61?2?190?2?1?04?58?3?128?4?3?15?55?3?80?3?4?16?61?1?94.4?2?1?07?38?1?76?1?1?08?42?
4、1?240?3?2?09?50?1?74?1?1?010?58?3?68.6?2?2?011?68?3?132.8?4?2?012?25?2?94.6?4?3?113?52?1?56?1?1?014?31?1?47.8?2?1?015?36?3?31.6?3?1?116?42?1?66.2?2?1?017?14?3?138.6?3?3?118?32?1?114?2?3?019?35?1?40.2?2?1?020?70?3?177.2?4?3?121?65?2?51.6?4?4?122?45?2?124?2?4?023
5、?68?3?127.2?3?3?124?31?2?124.8?2?3?025?58?1?128?4?3?026?60?3?149.8?4?3?1在菜單上選擇Analyze==》Regression==》BinaryLogistic...,系統(tǒng)彈出Logistic回歸對(duì)話框如下:左側(cè)是候選變量框,右上角是應(yīng)變量框,選入二分類的應(yīng)變量,下方的Covariates框是用于選入自變量的,只不過這里按國外的習(xí)慣被稱為了協(xié)變量。兩框中間的是BLOCK系列按扭,我在上一課已經(jīng)講過了,不再重復(fù)。中下部的>a*b>框是用于選入交互作用
6、的,和其他的對(duì)話框不太相同(我也不知道為什么SPSS偏在這里做得不同),下方的Method列表框用于選擇變量進(jìn)入方法,有進(jìn)入法、前進(jìn)法和后退法三大類,三類之下又有細(xì)分。最下面的四個(gè)按鈕比較重要,請(qǐng)大家聽我慢慢道來:oSelect>>鈕:用于限定一個(gè)篩選條件,只有滿足該條件的記錄才會(huì)被納入分析,單擊它后對(duì)話框會(huì)展開讓你填入相應(yīng)的條件。不過我覺得該功能純屬多余,和專門的Select對(duì)話框的功能重復(fù)了。oCategorical鈕:如果你的自變量是多分類的(如血型等),你必須要將它用啞變量的方式來分析,那么就要用該按鈕將該變
7、量指定為分類變量,如果有必要,可用里面的選擇按鈕進(jìn)行詳細(xì)的定義,如以哪個(gè)取值作為基礎(chǔ)水平,各水平間比較的方法是什么等。當(dāng)然,如果你弄不明白,不改也可以,默認(rèn)的是以最大取值為基礎(chǔ)水平,用Deviance做比較。oSave鈕:將中間結(jié)果存儲(chǔ)起來供以后分析,共有預(yù)測(cè)值、影響強(qiáng)度因子和殘差三大類。oOptions鈕:這一部分非常重要,但又常常被忽視,在這里我們可以對(duì)模型作精確定義,還可以選擇模型預(yù)測(cè)情況的描述方式,如StatisticsandPlots中的Classificationplots就是非常重要的模型預(yù)測(cè)工具,Co
8、rrelationsofestimates則是重要的模型診斷工具,Iterationhistory可以看到迭代的具體情況,從而得知你的模型是否在迭代時(shí)存在病態(tài),下方則可以確定進(jìn)入和排除的概率標(biāo)準(zhǔn),這在逐步回歸中是非常有用的。好,根據(jù)我們的目的,應(yīng)變量為Y,而X1~X5為自變量,具體的分析操作如下:1.Analyze==》Regression==