資源描述:
《華中科技大學現(xiàn)代控制理論 7.6 動態(tài)規(guī)劃與離散系統(tǒng)最優(yōu)控制》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、Ch.7最優(yōu)控制原理目錄(1/1)目錄7.1最優(yōu)控制概述7.2變分法7.3變分法在最優(yōu)控制中的應(yīng)用7.4極大值原理7.5線性二次型最優(yōu)控制7.6動態(tài)規(guī)劃與離散系統(tǒng)最優(yōu)控制7.7Matlab問題本章小結(jié)動態(tài)規(guī)劃與離散系統(tǒng)最優(yōu)控制(1/3)7.6動態(tài)規(guī)劃與離散系統(tǒng)最優(yōu)控制前面討論了連續(xù)系統(tǒng)最優(yōu)控制問題的基于經(jīng)典變分法和龐特里亞金的極大值原理的兩種求解方法。所謂連續(xù)系統(tǒng),即系統(tǒng)方程是用線性或非線性微分方程描述的動態(tài)系統(tǒng)。該類系統(tǒng)的控制問題是與傳統(tǒng)的控制系統(tǒng)和控制元件的模擬式實現(xiàn)相適應(yīng)的,如模擬式電子運算放大器件、模擬式自動化運算儀表、模擬式液壓放大元件等
2、。隨著計算機技術(shù)的發(fā)展及計算機控制技術(shù)的日益深入,離散系統(tǒng)的最優(yōu)控制問題也必然成為最優(yōu)控制中需深入探討的控制問題,而且成為現(xiàn)代控制技術(shù)更為關(guān)注的問題。動態(tài)規(guī)劃與離散系統(tǒng)最優(yōu)控制(2/3)離散系統(tǒng)的控制問題為人們所重視的原因有二。1)有些連續(xù)系統(tǒng)的控制問題在應(yīng)用計算機控制技術(shù)、數(shù)字控制技術(shù)時,通過采樣后成為離散化系統(tǒng),如許多現(xiàn)代工業(yè)控制領(lǐng)域的實際計算機控制問題。2)有些實際控制問題本身即為離散系統(tǒng),如某些經(jīng)濟計劃系統(tǒng)、人口系統(tǒng)的時間坐標只能以小時、天或月等標記;再如機床加工中心的時間坐標是以一個事件(如零件加工活動)的發(fā)生或結(jié)束為標志的。動態(tài)規(guī)劃與離
3、散系統(tǒng)最優(yōu)控制(3/3)本節(jié)將介紹解決離散系統(tǒng)最優(yōu)控制的強有力工具--貝爾曼動態(tài)規(guī)劃,以及線性離散系統(tǒng)的二次最優(yōu)控制問題。內(nèi)容為最優(yōu)性原理與離散系統(tǒng)的動態(tài)規(guī)劃法線性離散系統(tǒng)的二次型最優(yōu)控制最優(yōu)性原理與離散系統(tǒng)的動態(tài)規(guī)劃法(1/3)7.6.1最優(yōu)性原理與離散系統(tǒng)的動態(tài)規(guī)劃法基于對多階段決策過程的研究,貝爾曼在20世紀50年代首先提出了求解離散多階段決策優(yōu)化問題的動態(tài)規(guī)劃法。如今,這種決策優(yōu)化方法在許多領(lǐng)域得到應(yīng)用和發(fā)展,如在生產(chǎn)計劃、資源配置、信息處理、模式識別等方面都有成功的應(yīng)用。下面要介紹的是,貝爾曼本人將動態(tài)規(guī)劃優(yōu)化方法成功地應(yīng)用于動態(tài)系統(tǒng)的最
4、優(yōu)控制問題,即構(gòu)成最優(yōu)控制的兩種主要求解方法之一的最優(yōu)控制動態(tài)規(guī)劃法。最優(yōu)性原理與離散系統(tǒng)的動態(tài)規(guī)劃法(2/3)動態(tài)規(guī)劃的核心是貝爾曼最優(yōu)性原理。這個原理歸結(jié)為一個基本的遞推公式,求解多階段決策問題時,要從末端開始,逆向遞推,直至始端。動態(tài)規(guī)劃的離散基本形式受到問題的維數(shù)的限制,應(yīng)用有一定的局限性。但是,它用于解決線性離散系統(tǒng)的二次型性能指標的最優(yōu)控制問題特別有效。至于連續(xù)系統(tǒng)的最優(yōu)控制問題的動態(tài)規(guī)劃法,不僅是一種可供選擇的有充分性的最優(yōu)控制求解法,它還揭示了動態(tài)規(guī)劃與變分法、極大值原理之間的關(guān)系,具有重要的理論價值。最優(yōu)性原理與離散系統(tǒng)的動態(tài)規(guī)劃
5、法(3/3)下面分別介紹多階段決策問題最優(yōu)性原理一般問題的問題描述離散系統(tǒng)的動態(tài)規(guī)劃法多階段決策問題(1/12)1.多階段決策問題在討論動態(tài)規(guī)劃法之前,先考察一個簡單的最短時間行車問題,簡稱行車問題。例如圖7-10所示,某交通工具從S站出發(fā),終點為F站,全程可分為4段。圖7-10某行車路線圖中間可以經(jīng)過的各站及它們之間的行車時間均已標記在圖上。試求最短行車時間的行車路線。多階段決策問題(2/12)由S站出發(fā)至終點F站可有多種不同的行車路線,沿各種行車路線所耗費的時間不同。為使總的行車時間最短,司機在路程的前3段要作出3次決策。也就是說,一開始司機要
6、在經(jīng)過x1(1)站還是x2(1)站兩種情況中作出決策。到x1(1)站或x2(1)后,又面臨下一站是經(jīng)過x1(2)站還是x2(2)站的第2次決策。同樣,在后續(xù)的每個階段都要作出類似的決策。多階段決策問題(3/12)在該行車問題中,階段數(shù)n=4,需作n-1=3次決策。由于每次決策只有兩種可能的選擇,3次選擇共有2n-1=23=8種不同的行車路線。因此,計算8種不同的行車路線所耗費的總行車時間,取最小者即可求出最短時間行車路線。若行車問題需作決策的階段數(shù)n較大,每次決策中可供選擇的方案較多時,用上述窮舉法來解決最短行車時間問題計算量非常大。一般說來,用窮
7、舉法計算時間與作決策的階段數(shù)n和每次決策中可供選擇的方案數(shù)成指數(shù)關(guān)系,即通常所稱的指數(shù)爆炸、維數(shù)災(zāi)難。多階段決策問題(4/12)通過分析發(fā)現(xiàn),另一種求最短時間行車路線方法的是:從最后一段開始,先分別算出x1(3)站和x2(3)站到終點F的最短時間,并分別記為J[x1(3)]和J[x2(3)]。實際上,最后一段沒有選擇的余地。因此,由圖7-10可求得J[x1(3)]=4,J[x2(3)]=3多階段決策問題(5/12)為便于今后求解過程的應(yīng)用,可將從x1(3)站和x2(3)站到終點的最短時間J[x1(3)]和J[x2(3)]的數(shù)值標記于代表該站的小圓圈
8、內(nèi),如圖7-11所示。其他站的情況依此類推。圖7-11最優(yōu)行車路線圖多階段決策問題(6/12)由此向后倒推,繼續(xù)考察倒數(shù)第