資源描述:
《基于bp神經(jīng)網(wǎng)絡(luò)的上海地鐵日客流量預(yù)測(cè)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、基于BP神經(jīng)網(wǎng)絡(luò)的上海日客流量預(yù)測(cè)摘要:地鐵作為短途出行工具,影響客流量的主要因素源自乘客的主觀選擇,而這種主觀選擇性又很大程度上受到天氣,節(jié)假日等因素影響。根據(jù)這些因素采集足夠多的樣本,利用BP網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練及預(yù)測(cè),結(jié)果比較可靠,可為相關(guān)部門(mén)及顧客出行提供預(yù)測(cè)客流量作為參考。在此基礎(chǔ)上利用GUI強(qiáng)大的人際界面設(shè)計(jì)功能,設(shè)計(jì)出具有良好交互性的預(yù)測(cè)平臺(tái)。關(guān)鍵詞:地鐵GUIBP網(wǎng)絡(luò)1概論上海軌道交通,又稱上海地鐵,其第一條線路于1995年4月10日正式運(yùn)營(yíng)。截止2013年01月01日,上海軌道交通全路網(wǎng)開(kāi)通運(yùn)營(yíng)12條線、291座車(chē)站,運(yùn)營(yíng)里程達(dá)420公里。作者研究了2012年全年
2、每日的客流量,發(fā)現(xiàn)日客流量分布大體從400萬(wàn)至700萬(wàn)人次之間。其客流量特點(diǎn)大致可歸納為如下:(1)乘客出行受到許多不可預(yù)知因素的影響,故影響日客流量的因素比較復(fù)雜。(2)影響客流量的各因素與流量之間呈現(xiàn)非線性相關(guān)關(guān)系。但是各影響因素相互之間又存在著相關(guān)聯(lián)系。地鐵日客流量的這些特點(diǎn),正好適應(yīng)了神經(jīng)網(wǎng)絡(luò)的性能。所以從理論上講,進(jìn)行地鐵日客流量的預(yù)測(cè),神經(jīng)網(wǎng)絡(luò)是一個(gè)比較優(yōu)越的研究方法。基于以上,本文利用4層BP神經(jīng)網(wǎng)絡(luò)對(duì)采集的54組數(shù)據(jù)進(jìn)行合理的訓(xùn)練并進(jìn)行仿真。2BP網(wǎng)絡(luò)結(jié)構(gòu)BP網(wǎng)絡(luò)是一種具有3層或3層以上的單向傳播神經(jīng)網(wǎng)絡(luò),包括輸出層、中間層(隱層)和輸入層。BP神經(jīng)網(wǎng)絡(luò)是一種多層
3、網(wǎng)絡(luò)的“逆推”學(xué)習(xí)算法。其基本思想是,學(xué)習(xí)過(guò)程由信號(hào)的正向傳播與誤差的反向傳播兩個(gè)過(guò)程組成。正向傳播時(shí),輸入樣本從輸入層傳入,經(jīng)隱層逐層處理后,傳向輸出層。若輸出層的實(shí)際輸出與期望輸出(教師信號(hào))不符,則轉(zhuǎn)向誤差的反向傳播階段。誤差的反向傳播是將輸出誤差以某種形式通過(guò)隱層向輸入層逐層反傳,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號(hào),此誤差信號(hào)即作為修正各單元權(quán)值的依據(jù)。這種信號(hào)正向傳播與誤差反向傳播的各層權(quán)值調(diào)整過(guò)程,是周而復(fù)始地進(jìn)行的。權(quán)值不斷調(diào)整過(guò)程,也就是網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過(guò)程。此過(guò)程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差減少到可以接受的程度,或進(jìn)行到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止[1
4、]。2.1網(wǎng)絡(luò)輸入變量的選取建立模型的首要問(wèn)題是自變量的選擇,它是建模成功的基礎(chǔ)。在預(yù)測(cè)時(shí),模型中若包含與因變量即預(yù)測(cè)對(duì)象關(guān)系不大的因素或者對(duì)預(yù)測(cè)對(duì)象影響不明顯的因素,既會(huì)增大計(jì)算分析的工作量又會(huì)降低預(yù)測(cè)的精度;反之,若選擇的自變量雖然對(duì)預(yù)測(cè)對(duì)象影響很大,但彼此之間高度線性相關(guān),則會(huì)導(dǎo)致一系列的錯(cuò)誤,使模型無(wú)法用于預(yù)測(cè)。選擇自變量時(shí)要注意依據(jù)兩條準(zhǔn)則:一是選擇的自變量應(yīng)是與那些預(yù)測(cè)對(duì)象密切相關(guān)的因素;二是所選擇的自變量之間不能有較強(qiáng)的線性關(guān)系。依據(jù)這兩條準(zhǔn)則選定的輸入變量包括以下四維數(shù)據(jù):上海當(dāng)日是否有雨、當(dāng)日的溫度、是否為節(jié)假日以及當(dāng)日是星期幾。2.2輸出層的確定由本系統(tǒng)的功能
5、可確定輸出節(jié)點(diǎn)為一個(gè),即上海地鐵的日客流量。2.3隱層的確定確定最佳隱層節(jié)點(diǎn)數(shù)的一種常用方法稱為試湊法,其計(jì)算公式為式中:m為隱層節(jié)點(diǎn)數(shù),n為輸入層節(jié)點(diǎn)數(shù),l為輸出層層節(jié)點(diǎn)數(shù),為1~10之間的常數(shù)。得隱層節(jié)點(diǎn)數(shù)4~13個(gè),最后根據(jù)訓(xùn)練結(jié)果對(duì)BP網(wǎng)絡(luò)進(jìn)行調(diào)整,確定隱層節(jié)點(diǎn)的個(gè)數(shù)。2.4基于Matlab的BP神經(jīng)網(wǎng)絡(luò)改進(jìn)算法在本文中,旅游交通客流量神經(jīng)網(wǎng)絡(luò)模型的建立與實(shí)現(xiàn)都是借助Matlab提供的神經(jīng)網(wǎng)絡(luò)工具箱編程實(shí)現(xiàn)的。在Matlab神經(jīng)網(wǎng)絡(luò)工具箱中集成了BP網(wǎng)絡(luò)的各種算法。改進(jìn)BP算法及其相應(yīng)的訓(xùn)練函數(shù)有:附加動(dòng)量法(traindm)、自適應(yīng)學(xué)習(xí)速率法(traingda,trai
6、ngdx)、RPROP方法(trainrp)、共扼梯度法(traincgf,traincgp,traincgb,trainscg)、擬牛頓法(trainbfg)以及Levenberg-Marquardt方法(trainlm)。編程中通過(guò)采用不同的訓(xùn)練函數(shù)訓(xùn)練網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)不同改進(jìn)BP算法的使用[2]。3Matlab設(shè)計(jì)流程分析3.1樣本的選擇樣本的數(shù)量是神經(jīng)網(wǎng)絡(luò)建模的質(zhì)量保障,一個(gè)神經(jīng)網(wǎng)絡(luò)模型性能的優(yōu)劣最主要的體現(xiàn)就是它的泛化能力。神經(jīng)網(wǎng)絡(luò)模型的泛化能及,即當(dāng)輸入網(wǎng)絡(luò)遇到未“見(jiàn)過(guò)”的樣本,他也能映射出正確的輸出。保障網(wǎng)絡(luò)泛化能力的必要條件是:樣本的數(shù)量要足夠大,一般講,樣本與隱層
7、結(jié)點(diǎn)須相互匹配??傊?,只有把充分的“知識(shí)”讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、領(lǐng)會(huì),才能有歸納推理能力。在建模的過(guò)程中,要把樣本分為訓(xùn)練樣本和測(cè)試樣本兩部分,測(cè)試樣本用于對(duì)所建的網(wǎng)絡(luò)模型的檢驗(yàn)和測(cè)試。本文使用上海市2012年4月1日至2012年5月24日的地鐵日客流作為樣本數(shù)據(jù)。通過(guò)控制Slider的值來(lái)改變訓(xùn)練樣本和測(cè)試樣本占總樣本數(shù)量的比例。原始樣本數(shù)據(jù)見(jiàn)表1。表1原始樣本由圖,本文的輸入數(shù)據(jù)包括當(dāng)日是星期幾、是否是節(jié)假日、上海當(dāng)日是否有雨或雪及上海當(dāng)日的溫度,輸出數(shù)據(jù)則為當(dāng)日的客流量。由于訓(xùn)練