Logistic回歸分析方法

Logistic回歸分析方法

ID:37770271

大小:323.31 KB

頁(yè)數(shù):29頁(yè)

時(shí)間:2019-05-30

Logistic回歸分析方法_第1頁(yè)
Logistic回歸分析方法_第2頁(yè)
Logistic回歸分析方法_第3頁(yè)
Logistic回歸分析方法_第4頁(yè)
Logistic回歸分析方法_第5頁(yè)
資源描述:

《Logistic回歸分析方法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、Logistic回歸分析公共衛(wèi)生學(xué)院一、前言應(yīng)變量為分類指標(biāo)的資料線性回歸分析:應(yīng)變量為連續(xù)計(jì)量資料二、Logistic回歸模型Logistic回歸的分類二分類多分類條件Logistic回歸非條件Logistic回歸Logit變換也稱對(duì)數(shù)單位轉(zhuǎn)換logitP=流行病學(xué)概念:設(shè)P表示暴露因素X時(shí)個(gè)體發(fā)病的概率,則發(fā)病的概率P與未發(fā)病的概率1-P之比為優(yōu)勢(shì)(odds),logitP就是odds的對(duì)數(shù)值。Logistic回歸模型Logistic回歸的logit模型Logistic回歸模型三、參數(shù)估計(jì)最大似然估計(jì)法(M

2、aximumlikehoodestimate)似然函數(shù):L=∏Pi對(duì)數(shù)似然函數(shù):lnL=∑(lnP)=lnP1+lnP2+…+lnPn非線性迭代方法——Newton-Raphson法四、參數(shù)檢驗(yàn)似然比檢驗(yàn)(likehoodratiotest)通過(guò)比較包含與不包含某一個(gè)或幾個(gè)待檢驗(yàn)觀察因素的兩個(gè)模型的對(duì)數(shù)似然函數(shù)變化來(lái)進(jìn)行,其統(tǒng)計(jì)量為G(又稱Deviance)。G=-2(lnLp-lnLk)樣本量較大時(shí),G近似服從自由度為待檢驗(yàn)因素個(gè)數(shù)的?2分布。比分檢驗(yàn)(scoretest)以未包含某個(gè)或幾個(gè)變量的模型為基礎(chǔ),

3、保留模型中參數(shù)的估計(jì)值,并假設(shè)新增加的參數(shù)為零,計(jì)算似然函數(shù)的一價(jià)偏導(dǎo)數(shù)(又稱有效比分)及信息距陣,兩者相乘便得比分檢驗(yàn)的統(tǒng)計(jì)量S。樣本量較大時(shí),S近似服從自由度為待檢驗(yàn)因素個(gè)數(shù)的?2分布。Wald檢驗(yàn)(waldtest)即廣義的t檢驗(yàn),統(tǒng)計(jì)量為uu服從正態(tài)分布,即為標(biāo)準(zhǔn)正態(tài)離差。Logistic回歸系數(shù)的區(qū)間估計(jì)上述三種方法中,似然比檢驗(yàn)最可靠,比分檢驗(yàn)一般與它相一致,但兩者均要求較大的計(jì)算量;而Wald檢驗(yàn)未考慮各因素間的綜合作用,在因素間有共線性時(shí)結(jié)果不如其它兩者可靠。五、回歸系數(shù)的意義單純從數(shù)學(xué)上講,與

4、多元線性回歸分析中回歸系數(shù)的解釋并無(wú)不同,亦即bi表示xi改變一個(gè)單位時(shí),logitP的平均變化量。流行病學(xué)中的一些基本概念:相對(duì)危險(xiǎn)度(relativerisk):RR=P1/P2比數(shù)Odds=P/(1-P)比數(shù)比OR=[P1/(1-P1)]/[P2/(1-P2)]在患病率較小情況下,OR≈RRLogistic回歸中的常數(shù)項(xiàng)(b0)表示,在不接觸任何潛在危險(xiǎn)/保護(hù)因素條件下,效應(yīng)指標(biāo)發(fā)生與不發(fā)生事件的概率之比的對(duì)數(shù)值。Logistic回歸中的回歸系數(shù)(bi)表示,某一因素改變一個(gè)單位時(shí),效應(yīng)指標(biāo)發(fā)生與不發(fā)生事

5、件的概率之比的對(duì)數(shù)變化值,即OR的對(duì)數(shù)值。Logistic回歸系數(shù)的意義分析因素xi為二分類變量時(shí),存在(暴露)xi=1,不存在(未暴露)xi=0,則Logistic回歸中xi的系數(shù)bi就是暴露與非暴露優(yōu)勢(shì)比的對(duì)數(shù)值.即OR=exp(bi)=e(bi)分析因素xi為多分類變量時(shí),為方便起見(jiàn),常用1,2,…,k分別表示k個(gè)不同的類別。進(jìn)行Logistic回歸分析前需將該變量轉(zhuǎn)換成k-1個(gè)指示變量或啞變量(design/dummyvariable),這樣指示變量都是一個(gè)二分變量,每一個(gè)指示變量均有一個(gè)估計(jì)系數(shù),即回

6、歸系數(shù),其解釋同前。分析因素xi為等級(jí)變量時(shí),如果每個(gè)等級(jí)的作用相同,可按計(jì)量資料處理:如以最小或最大等級(jí)作參考組,并按等級(jí)順序依次取為0,1,2,…。此時(shí),e(bi)表示xi增加一個(gè)等級(jí)時(shí)的優(yōu)勢(shì)比,e(k*bi)表示xi增加k個(gè)等級(jí)時(shí)的優(yōu)勢(shì)比。如果每個(gè)等級(jí)的作用不相同,則應(yīng)按多分類資料處理。分析因素xi為連續(xù)性變量時(shí),e(bi)表示xi增加一個(gè)計(jì)量單位時(shí)的優(yōu)勢(shì)比。多因素Logistic回歸分析時(shí),對(duì)回歸系數(shù)的解釋都是指在其它所有自變量固定的情況下的優(yōu)勢(shì)比。存在因素間交互作用時(shí),Logistic回歸系數(shù)的解釋變

7、得更為復(fù)雜,應(yīng)特別小心。根據(jù)Wald檢驗(yàn),可知Logistic回歸系數(shù)bi服從u分布。因此其可信區(qū)間為進(jìn)而,優(yōu)勢(shì)比e(bi)的可信區(qū)間為六、Logistic回歸分析方法基本思想同線性回歸分析。從所用的方法看,有強(qiáng)迫法、前進(jìn)法、后退法和逐步法。在這些方法中,篩選變量的過(guò)程與線性回歸過(guò)程的完全一樣。但其中所用的統(tǒng)計(jì)量不再是線性回歸分析中的F統(tǒng)計(jì)量,而是以上介紹的參數(shù)檢驗(yàn)方法中的三種統(tǒng)計(jì)量之一。為計(jì)算方便,通常向前選取變量用似然比或比分檢驗(yàn),而向后剔除變量常用Wald檢驗(yàn)。七、條件Logistic回歸對(duì)配對(duì)/比調(diào)查資

8、料,應(yīng)該用條件Logistic回歸分析。對(duì)于配比資料,第i個(gè)配比組可以建立一個(gè)Logistic回歸:假設(shè)自變量在各配比組中對(duì)結(jié)果變量的作用是相同的,即自變量的回歸系數(shù)與配比組無(wú)關(guān)。配比設(shè)計(jì)的Logistic回歸模型其中不含常數(shù)項(xiàng)??梢钥闯龃嘶貧w模型與非條件Logistic回歸模型十分相似,只不過(guò)這里的參數(shù)估計(jì)是根據(jù)條件概率得到的,因此稱為條件Logistic回歸模型。條件Logisti

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。