資源描述:
《基于時變神經(jīng)網(wǎng)絡(luò)的非線性時變系統(tǒng)迭代學(xué)習(xí)辨識與控制》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、浙江工業(yè)大學(xué)碩士學(xué)位論文基于時變神經(jīng)網(wǎng)絡(luò)的非線性時變系統(tǒng)迭代學(xué)習(xí)辨識與控制作者姓名:何海港指導(dǎo)教師:孫明軒教授浙江工業(yè)大學(xué)信息工程學(xué)院2014年5月fIllllllllllUJIIfllUIIfY2620640DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMasterTIME—VARYINGNEURALNETWoRKBASEDITERATIVELEARNINGIDENTIFICATIoNANDCoNTRoLoFTIME.VARYINGNONLINEARSYSTEMSCandidate:Haiga
2、ngHeAdvisor:Prof.MingxuanSunCollegeofInformationEngineeringZhejiangUniversityofTechnologyMay2014浙江工業(yè)大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所提交的學(xué)位論文是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的研究成果。除文中已經(jīng)加以標(biāo)注引用的內(nèi)容外,本論文不包含其他個人或集體已經(jīng)發(fā)表或撰寫過的研究成果,也不含為獲得浙江工業(yè)大學(xué)或其它教育機(jī)構(gòu)的學(xué)位證書而使用過的材料。對本文的研究作出重要貢獻(xiàn)的個人和集體,均己在文中以明確方式標(biāo)明。本人承擔(dān)本聲明的法律責(zé)任。作者簽名:儷洫.熬目期:馴鈔年鄉(xiāng)月17日
3、學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)浙江工業(yè)大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。本學(xué)位論文屬于1、保密口,在年解密后適用本授權(quán)書。2、不保密留。(請在以上相應(yīng)方框內(nèi)打“√”)日期:刀,睥j月,7日E漕\鏟l瑪晦王}
4、7El搭氣緣哪可以t)名名奎謄剖蜊怍導(dǎo)浙江工業(yè)大學(xué)碩士學(xué)位論文基于時變神經(jīng)網(wǎng)絡(luò)的非線性時變系統(tǒng)迭代學(xué)習(xí)辨識與控制摘要神經(jīng)網(wǎng)絡(luò)憑借自身內(nèi)在的強(qiáng)逼近能力,廣泛應(yīng)用于
5、非線性系統(tǒng)辨識與控制。常規(guī)神經(jīng)網(wǎng)絡(luò)權(quán)重往往為常值,采用積分學(xué)習(xí)律調(diào)整網(wǎng)絡(luò)權(quán)值。時變神經(jīng)網(wǎng)絡(luò)擁有時變權(quán)值,當(dāng)網(wǎng)絡(luò)結(jié)構(gòu)確定后,網(wǎng)絡(luò)權(quán)重的訓(xùn)練便成為時變神經(jīng)網(wǎng)絡(luò)能否成功應(yīng)用的關(guān)鍵。迭代學(xué)習(xí)控制與重復(fù)控制在一定條件下能夠?qū)崿F(xiàn)期望軌跡的精確跟蹤。借鑒迭代學(xué)習(xí)思想訓(xùn)練時變神經(jīng)網(wǎng)絡(luò)權(quán)值成為一種可行方案。非線性時變系統(tǒng)具有復(fù)雜的非線性時變動態(tài)特性,針對這類系統(tǒng)的辨識與控制的研究成果還不多見。本文給出時變RBF網(wǎng)絡(luò)與時變動態(tài)神經(jīng)網(wǎng)絡(luò),借助迭代學(xué)習(xí)思想沿重復(fù)軸訓(xùn)練網(wǎng)絡(luò)權(quán)值?;诮o出的兩類時變神經(jīng)網(wǎng)絡(luò)完成非線性時變系統(tǒng)辨識及自適應(yīng)迭代學(xué)習(xí)控制。本文的主要研究工作和取得的成果如下:1.在常規(guī)RBF網(wǎng)絡(luò)基礎(chǔ)
6、上,給出時變RBF網(wǎng)絡(luò)。并將兩種不同連接權(quán)值的RBF網(wǎng)絡(luò)分別用于非線性時變系統(tǒng)辨識。考慮逼近誤差存在的情形,采用帶死區(qū)修正的積分學(xué)習(xí)律調(diào)整常規(guī)RBF網(wǎng)絡(luò)權(quán)值:借助迭代學(xué)習(xí)思想,根據(jù)帶死區(qū)修正的半飽和迭代學(xué)習(xí)算法訓(xùn)練時變RBF網(wǎng)絡(luò)權(quán)值。理論分析了辨識算法的有效性。2.借鑒常規(guī)高階動態(tài)神經(jīng)網(wǎng)絡(luò)連接形式,網(wǎng)絡(luò)連接權(quán)取時變值時構(gòu)成時變動態(tài)神經(jīng)網(wǎng)絡(luò)。分別基于常規(guī)動態(tài)神經(jīng)網(wǎng)絡(luò)與時變動態(tài)神經(jīng)網(wǎng)絡(luò)辨識非線性時變系統(tǒng)。最dx-C乘結(jié)合死區(qū)修正策略用于更新常規(guī)網(wǎng)絡(luò)權(quán)值;時變網(wǎng)絡(luò)權(quán)值調(diào)整采用死區(qū)修正的迭代學(xué)習(xí)最小二乘及其改進(jìn)算法。通過引入時變向量證明了辨識算法使得辨識誤差漸近收斂至死區(qū)界定的鄰域內(nèi)。3.
7、將重復(fù)思想引入RBF網(wǎng)絡(luò)連接權(quán)值的變化中,給出周期RBF網(wǎng)絡(luò)。通過在辨識模型中加入逼近誤差補(bǔ)償措施,從而實現(xiàn)非線性周期系統(tǒng)的完全辨識。采用積分學(xué)習(xí)律更新RBF網(wǎng)絡(luò)定常權(quán)值;依據(jù)系統(tǒng)重復(fù)運(yùn)行特性,利用全飽和重復(fù)學(xué)習(xí)算法訓(xùn)練周期RBF網(wǎng)絡(luò)的周期時變權(quán)值。4.常規(guī)高階動態(tài)神經(jīng)網(wǎng)絡(luò)連接權(quán)值替換為周期時變權(quán)值后,形成周期動態(tài)神經(jīng)網(wǎng)絡(luò)。浙江工業(yè)大學(xué)碩士學(xué)位論文為達(dá)到非線性周期系統(tǒng)完全辨識效果,將逼近誤差上界估值加入基于動態(tài)神經(jīng)網(wǎng)絡(luò)的辨識模型用以抵消逼近誤差影響。最小二乘積分學(xué)習(xí)律用來調(diào)整定常權(quán)值;采用最小二乘重復(fù)學(xué)習(xí)算法實現(xiàn)周期網(wǎng)絡(luò)權(quán)值的訓(xùn)練。通過引入周期向量,分析了最小二乘重復(fù)學(xué)習(xí)算法的有效
8、性。5.針對一類非線性時變系統(tǒng),利用時變RBF網(wǎng)絡(luò)逼近控制器設(shè)計中整體未知不確定非線性部分,同時采用白適應(yīng)學(xué)習(xí)律估計逼近誤差上界。為實現(xiàn)完全跟蹤任務(wù),控制器中嵌入逼近誤差補(bǔ)償措施。理論分析保證閉環(huán)系統(tǒng)所有信號有界的同時,實現(xiàn)了跟蹤誤差及其各階導(dǎo)數(shù)沿迭代軸漸近收斂至零。6.基于時變動態(tài)神經(jīng)網(wǎng)絡(luò)直接設(shè)計自適應(yīng)迭代學(xué)習(xí)控制器,從而實現(xiàn)一類非線性時變系統(tǒng)的有效跟蹤控制。為處理逼近誤差,采用帶死區(qū)修正的迭代學(xué)習(xí)最小二乘算法訓(xùn)練網(wǎng)絡(luò)權(quán)值。借助Lyapunov—like方法保證閉環(huán)