資源描述:
《基于matlab的時(shí)間序列檢測方法探討》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、ISSN1009-3044E-mail:eduf@cccc.net.cnCCoommppuutteerrKKnnoowwleleddggeeaannddTTeecchhnnoolologgyy電腦知識電腦知識與技術(shù)與技術(shù)第8卷第http://www.dnzs.net.cn4期(2012年2月)Vol.8,No.4,February2012Tel:+86-551-56909635690964基于MATLAB的時(shí)間序列異常檢測方法探討11,2王翔宇,張引瓊(1.湖南農(nóng)業(yè)大學(xué)東方科技學(xué)院信息工程系,湖南長沙410128;2
2、.湖南農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院信息工程系,湖南長沙410128)摘要:對基于MATLAB的時(shí)間序列異常檢測進(jìn)行了分析和研究,在闡述MATLAB時(shí)間序列異常檢測方法的基礎(chǔ)上對各種異常檢測方法進(jìn)行了檢測試驗(yàn),比較了各種異常檢測方法的優(yōu)劣度。對各科學(xué)領(lǐng)域的數(shù)據(jù)分析具有一定的參考價(jià)值。關(guān)鍵詞:MATLAB;時(shí)間序列;異常檢測;數(shù)據(jù)分析中圖分類號:TP393文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)04-0866-07DiscussiononTimeSeriesAbnormalDetectionMethodsBas
3、edonMATLABWANGXiang-yu1,ZHANGYin-qiong1,2(1.OrientalScience&TechnologyCollegeofHunanAgriculturalUniversity,Changsha410128,China;2.CollegeofInformationScienceTechnology,HunanAgriculturalUniversity,Changsha410128,China)Abstract:Analyzedandstudiedtimeseriesabnorma
4、ldetectionbasedonMATLAB.Expoundedtimeseriesabnormaldetectionmethods,implementeddetectiontestbasedondifferentabnormaldetectionmethodsandcomparedtheirqualitydegrees.Thispaperhasreferenceval?uetodataanalysisofdifferentsciencerealm.Keywords:MATLAB;timeseries;abnorm
5、aldetection;dataanalysis時(shí)間序列分析是概率統(tǒng)計(jì)學(xué)科中應(yīng)用性較強(qiáng)的分支之一,是數(shù)據(jù)分析的重要領(lǐng)域[1]。時(shí)間序列是按時(shí)間順序排列、隨時(shí)間變化且相互關(guān)聯(lián)的數(shù)據(jù)序列。時(shí)間序列分析即分析時(shí)間序列的方法。時(shí)間序列分析在信號處理、自動化、信息管理、金融、控制與系統(tǒng)工程、氣象水文、數(shù)據(jù)挖掘等眾多領(lǐng)域應(yīng)用廣泛。時(shí)間序列的分析處理在現(xiàn)實(shí)生活中具有重要價(jià)值,例如:分析股票信息,預(yù)測股票走勢;分析商品銷售信息,預(yù)測商品銷售的趨勢;分析地震前后的一些數(shù)據(jù)異常,為地震的預(yù)測提供相關(guān)數(shù)據(jù)依據(jù)。對時(shí)間序列進(jìn)行分析,可以揭示
6、事物運(yùn)動、變化和發(fā)展的內(nèi)在規(guī)律,對人們正確認(rèn)識事物并據(jù)此做出科學(xué)決策具有重要的現(xiàn)實(shí)意義。對時(shí)間序列的異常檢測能夠發(fā)掘時(shí)間序列在不同時(shí)間段形態(tài)間的關(guān)聯(lián),這種關(guān)聯(lián)一般表現(xiàn)為時(shí)間序列中頻繁出現(xiàn)的變化模式和極少出現(xiàn)的變化模式。極少出現(xiàn)的變化模式稱之為異常模式,在某些領(lǐng)域,異常模式的發(fā)現(xiàn)往往更有價(jià)值。例如,醫(yī)院可以從病人的心電圖序列中發(fā)現(xiàn)異常模式從而進(jìn)行診斷和治療。本文分析了時(shí)間異常序列檢測的相關(guān)算法,并利用四種不同的算法進(jìn)行了時(shí)間異常序列檢測實(shí)驗(yàn),比較了四種算法的優(yōu)劣度。1時(shí)間序列異常分析方法綜述1.1四分位法四分位數(shù)(Qu
7、artile)把所有數(shù)值由小到大排列并分成四等份,處于三個(gè)分割點(diǎn)位置的得分就是四分位數(shù)。第一四分位數(shù)(Q1),又稱“較小四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字。第二四分位數(shù)(Q2),又稱“中位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字。第三四分位數(shù)(Q3),又稱“較大四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字。第三四分位數(shù)與第一四分位數(shù)的差距即為四分位距(IQR,InterQuartileRange)。1.2方差法方差分析是分析和觀測試驗(yàn)數(shù)據(jù)的統(tǒng)一方法。在農(nóng)業(yè)生產(chǎn)和
8、科學(xué)研究中,利用方差分析來分析各種因素間的交互作用對研究對象某些指標(biāo)值的影響,并依此推斷其對所考察指標(biāo)的影響度。標(biāo)準(zhǔn)差(S或SD):標(biāo)準(zhǔn)差反映變異程度。當(dāng)兩組觀察值在單位相同、均數(shù)相近的情況下,標(biāo)準(zhǔn)差越大則觀察值間的變異程度越大,觀察值圍繞均數(shù)的分布較離散,均數(shù)的代表性較差。反之,標(biāo)準(zhǔn)差越小則觀察值間的變異較小,觀察值圍繞均數(shù)的分布較密集,均數(shù)