資源描述:
《聚類分析在交通流時序數(shù)據(jù)挖掘中的應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、』E塞窯擅態(tài)堂亟±堂焦迨塞主塞垣堊中文摘要摘要:在中國智能交通系統(tǒng)快速發(fā)展的大背景下,如何利用豐富的交通檢測數(shù)據(jù)進(jìn)行交通規(guī)劃及控制優(yōu)化是交通控制領(lǐng)域中需要解決的重要問題之一,而數(shù)據(jù)挖掘技術(shù)的發(fā)展正好給海量交通數(shù)據(jù)的知識發(fā)現(xiàn)提供了理論基礎(chǔ)和技術(shù)實(shí)現(xiàn)手段。數(shù)據(jù)挖掘指的是從大量數(shù)據(jù)中提取出有效的、新穎的、潛在有用的,以及最終可理解的模式的高級過程。聚類分析是數(shù)據(jù)挖掘研究的一個十分重要的方面。在智能交通系統(tǒng)中,時間序列是最常見的數(shù)據(jù)形式。采用聚類分析方法對海量交通流時間序列進(jìn)行研究分析具有很大的應(yīng)用價值,一方面可以發(fā)
2、現(xiàn)典型的交通流變化趨勢規(guī)律,另一方面可以對檢測點(diǎn)具有不同交通流特性的時段進(jìn)行合理分組,進(jìn)而針對各時段制定出相應(yīng)的交通控制策略,同時還可進(jìn)一步結(jié)合空間信息發(fā)現(xiàn)一些有意義的交通流時空分布規(guī)律。本文詳細(xì)介紹了聚類算法在時間序列數(shù)據(jù)挖掘中的研究和應(yīng)用,借助某市網(wǎng)絡(luò)化智能交通系統(tǒng)數(shù)據(jù)庫中的歷史車流量數(shù)據(jù),結(jié)合聚類分析理論,對快速路段上兩個月的單點(diǎn)車流量數(shù)據(jù)進(jìn)行了聚類分析。作者將傳統(tǒng)聚類算法進(jìn)行改進(jìn),提出了一種階梯型系統(tǒng)聚類方案,在得到交通流量分類初始模式的基礎(chǔ)上進(jìn)一步挖掘具有相應(yīng)交通流特征的時段模式,最終得到了較為滿意
3、的實(shí)驗(yàn)結(jié)果,發(fā)現(xiàn)了有意義的交通流時間分布模式并以c++、MATLAB程序?qū)崿F(xiàn)了階梯型系統(tǒng)聚類挖掘的整個過程,最后分析了此次聚類結(jié)果,并提出了進(jìn)一步的研究方向。關(guān)鍵詞:數(shù)據(jù)挖掘;系統(tǒng)聚類;時間序列;時段模式分類號:U491;TP311.1韭塞鑾疆盔塋亟±堂僮監(jiān)塞△曼S工B△£至ABSTRACTABSTRACT:WiththerapiddevelopmentofITSinChina,itseemstobeaproblemthathowtousethemassdatatoprovidethemeaningfulfo
4、recastoutcomesbettercontributingtothetrafficmanagementandDataminingtechnologyservesasapowerfultooltosolveit.Timeseriesisoneofthemostcol砌ondatatypeinIntelligentTransportationSystem,SOtheanalysisoftrafficflowtimeseriesturnsparticularlyimportant.U.1izingcluste
5、ringminingtechnologytoanalyzetimeseriesoftrafficflownotonlycandiscoverthetraflicflowrolesbehindmassdata,butalsoCanproduceanoptimalTOD(thetimeofday)plan.Furthermore,combined砸thsomespatialinformation,someusefulspatialandtemporaldistributedlawsintransportation
6、couldberevealed.ThispaperpresentsaschemeofdatadrivenmethodologybasedhierarchicalclusteringthatdeterminesoptimalbreakpointsforTODtrafficcontrolafterthefirstclusteringprocessandprovesthescheme’SvalidationunderC抖BuilderandMatlabprogram.111estudymsuRsshowthatth
7、emethodproducesfairlygoodclusters.Inthispaper,someresearchworkontrafficflowtimeseriesdatamininghasbeendone.Firstly,cleanthedataandgivecompensationtothedataset.Secondly,proposeaschemebasedhierarchicalclusteringforthevariationtendencyoftimeseries.ndrdly,analy
8、zetheclusteringstatisticsandtrafficflowtimeseriesclusteringoutcomes.Moreover,visualizationofclusteringresultswouldbepresented.KEYWORDS:datamining;hierarchicalclustering;timeseries;TODCLASSNO:U49l:TP311