資源描述:
《ARIMA時(shí)間序列在乙肝發(fā)病預(yù)測(cè)中的應(yīng)用-論文.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、·646·中國(guó)衛(wèi)生統(tǒng)計(jì)2014年8月第31卷第4期ARIMA時(shí)間序列在乙肝發(fā)病預(yù)測(cè)中的應(yīng)用北京市昌平區(qū)疾病預(yù)防控制中心(102200)王濤苑新海朱宗龍【提要】目的探討ARIMA模型在乙型肝炎發(fā)病預(yù)測(cè)中的應(yīng)用,為乙型肝炎的早期預(yù)警提供決策依據(jù)。方法應(yīng)用時(shí)問(wèn)序列分析方法對(duì)昌平區(qū)2005—2012年乙肝月發(fā)病數(shù)據(jù)進(jìn)行分析并建立預(yù)測(cè)模型,對(duì)建立的預(yù)測(cè)模型進(jìn)行參數(shù)估計(jì)、模型診斷、模型評(píng)價(jià),選擇最優(yōu)預(yù)測(cè)模型。結(jié)果昌平區(qū)2005—2012年乙肝的發(fā)病呈周期性波動(dòng),并具有趨勢(shì)性變化。建立的ARIMA模型的擬合精度和預(yù)測(cè)效果較為理想。結(jié)論ARIMA模型能較好的模擬昌平區(qū)乙肝的發(fā)病趨勢(shì),可用于乙肝的短期預(yù)測(cè)
2、和動(dòng)態(tài)分析?!娟P(guān)鍵詞】ARIMA模型時(shí)間序列乙肝預(yù)測(cè)傳染病預(yù)測(cè)是根據(jù)傳染病發(fā)生、發(fā)展規(guī)律及有關(guān)個(gè)模型的優(yōu)劣,最常用的是調(diào)整后的決定系數(shù)、AIC和因素,用分析判斷和數(shù)學(xué)模型等方法對(duì)傳染病的發(fā)生、SC統(tǒng)計(jì)量。⑤模型的預(yù)測(cè)。運(yùn)用模型預(yù)測(cè)未來(lái)某一發(fā)展和流行趨勢(shì)作出預(yù)測(cè),是制定預(yù)防和控制傳染病時(shí)間段的乙肝發(fā)病情況。的長(zhǎng)期或近期應(yīng)對(duì)策略的前提¨J。本文以昌平區(qū)乙(3)統(tǒng)計(jì)分析肝的月發(fā)病數(shù)為基礎(chǔ),應(yīng)用時(shí)間序列分析法對(duì)其發(fā)病使用SPSS17.0軟件進(jìn)行統(tǒng)計(jì)分析。將北京市昌情況建模,并預(yù)測(cè)其發(fā)病趨勢(shì),為早期發(fā)現(xiàn)乙肝的流行平區(qū)2005—2012年乙肝月發(fā)病數(shù)據(jù)建立ARIMA模及制定相關(guān)防治策略提供依據(jù)。型進(jìn)
3、行時(shí)間序列分析。方法和原理結(jié)果1.資料1.發(fā)病情況及變化趨勢(shì)北京市昌平區(qū)2005—2012年乙肝發(fā)病數(shù)據(jù)來(lái)源對(duì)北京市昌平區(qū)2005—2012年乙肝月發(fā)病數(shù)于疾病監(jiān)測(cè)信息報(bào)告管理系統(tǒng)。同時(shí)由于昌平區(qū)人口(Z)曲線(圖1)直觀分析可看出,昌平區(qū)除2006年和基數(shù)較大且相對(duì)穩(wěn)定,最終確定以乙肝發(fā)病數(shù)代替發(fā)2007年乙肝高發(fā)外,其余各年發(fā)病較為平穩(wěn),全年均病率來(lái)進(jìn)行預(yù)測(cè)分析。有發(fā)病。2.方法2.序列平穩(wěn)性判斷(1)基本思想序列平穩(wěn)性檢驗(yàn)是建模的重要前提。除從序列圖標(biāo)準(zhǔn)的ARIMA模型為ARIMA(P,d,q)(P,D,Q)(圖1)判斷原始序列存在長(zhǎng)期趨勢(shì),同時(shí)采用游程檢S,其中P、q分別表示自相
4、關(guān)函數(shù)(ACF)和偏自相關(guān)函驗(yàn)法對(duì)時(shí)間序列進(jìn)行平穩(wěn)性檢驗(yàn),得出游程數(shù)為l6,數(shù)(PACF)的階,d表示差分的次數(shù),P、Q、D分別表示檢驗(yàn)統(tǒng)計(jì)量Z=一6.446,P=0.000,表明其為非平穩(wěn)季節(jié)性自相關(guān)函數(shù)和偏自相關(guān)函數(shù)的階和差分的次性時(shí)間序列。數(shù),S表示季節(jié)性的周期J。3.?dāng)?shù)據(jù)預(yù)處理(2)建模過(guò)程從原始序列圖和游程檢驗(yàn)結(jié)果可看出原始數(shù)據(jù)為①數(shù)據(jù)預(yù)處理。首先判斷原序列是否平穩(wěn),若為非平穩(wěn)序列,因此對(duì)原始序列進(jìn)行自然對(duì)數(shù)轉(zhuǎn)換和一非平穩(wěn)序列,首先變換為平穩(wěn)序列,根據(jù)變換后序列的自相關(guān)和偏自相關(guān)圖,確定非季節(jié)差分階數(shù)d和季節(jié)差分階數(shù)D。②模型參數(shù)估計(jì)。根據(jù)變換后平穩(wěn)時(shí)間序列的自相關(guān)和偏自相關(guān)圖
5、,估計(jì)模型的P、P、q、Q的值,采用最大似然估計(jì)或最小二乘法估計(jì)等對(duì)初步估計(jì)模型進(jìn)行檢驗(yàn)。模型參數(shù)必須通過(guò)t檢驗(yàn),且全部特征根的倒數(shù)都小于1l4J。③模型診斷檢驗(yàn)。模型參數(shù)估計(jì)后,對(duì)模型殘差是否為白噪聲進(jìn)行檢驗(yàn),若殘差序列不是白噪聲序列,意味著殘差序列還存在有沒(méi)被量星墨墨量gg昌答驀昌8g蠹2昌2呈==.~-.q昌提取的信息,需要進(jìn)一步改進(jìn)模型。④模型的篩選。年份為了得到最佳模型,可借助擬合優(yōu)度統(tǒng)計(jì)量來(lái)比較各圖1昌平區(qū)2005—2012年乙肝月發(fā)病數(shù)(z)原始序列圖ChineseJourna1ofHealthStatistics,Aug2014.Vo1.31.No.4階非季節(jié)性差分和一階
6、季節(jié)性差分,以消除趨勢(shì)和季節(jié)影響而達(dá)到平穩(wěn)化,使序列呈現(xiàn)為一組平穩(wěn)的隨機(jī)數(shù)據(jù)以符合時(shí)間序列分析的條件J。從差分后序列的序列圖(圖2)可以看出,近似為平穩(wěn)序列。4.模型參數(shù)估計(jì)由于原始時(shí)間序列經(jīng)一階非季節(jié)性差分和一階季節(jié)性差分后達(dá)到平穩(wěn),因此d=1、D=1。首先建立ARIMA(2,1,1)(2,1,1):模型,經(jīng)檢驗(yàn),變量AR(2)、SAR(2)的P>0.05,沒(méi)有通過(guò)t檢驗(yàn),然后考慮刪除變量AR(2)、SAR(2),嘗試建立ARIMA(0,1,1)(0,1,25811258112581125811258112581125811MONTH,period121)模型,經(jīng)檢驗(yàn),該模型的所有參數(shù)
7、均通過(guò)了t檢驗(yàn)轉(zhuǎn)換:自然對(duì)數(shù),差別(1),季節(jié)性差別(1,周期12)(表1)。圖2昌平區(qū)2005—2012年乙肝月發(fā)病數(shù)差分后序列圖表1不同AR1MA模型的檢驗(yàn)結(jié)果5.模型診斷檢驗(yàn)擬合可見(jiàn)(圖4),模型預(yù)測(cè)值的動(dòng)態(tài)趨勢(shì)與實(shí)際值基對(duì)ARIMA(0,1,1)(0,1,1),模型殘差進(jìn)行是否本一致。為白噪聲的LB統(tǒng)計(jì)量檢驗(yàn)l6』,最大滯后期m取16,O,=8.428,P=0.935>0.05,故不能拒絕殘差序列為20O白噪聲的原假設(shè),檢驗(yàn)