多智能體q學(xué)習(xí)在多auv協(xié)調(diào)中的應(yīng)用與仿真

多智能體q學(xué)習(xí)在多auv協(xié)調(diào)中的應(yīng)用與仿真

ID:34769341

大小:4.61 MB

頁(yè)數(shù):74頁(yè)

時(shí)間:2019-03-10

多智能體q學(xué)習(xí)在多auv協(xié)調(diào)中的應(yīng)用與仿真_第1頁(yè)
多智能體q學(xué)習(xí)在多auv協(xié)調(diào)中的應(yīng)用與仿真_第2頁(yè)
多智能體q學(xué)習(xí)在多auv協(xié)調(diào)中的應(yīng)用與仿真_第3頁(yè)
多智能體q學(xué)習(xí)在多auv協(xié)調(diào)中的應(yīng)用與仿真_第4頁(yè)
多智能體q學(xué)習(xí)在多auv協(xié)調(diào)中的應(yīng)用與仿真_第5頁(yè)
資源描述:

《多智能體q學(xué)習(xí)在多auv協(xié)調(diào)中的應(yīng)用與仿真》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、分類號(hào):——UDC:——密級(jí):編號(hào):工學(xué)碩士學(xué)位論文多智能體Q學(xué)習(xí)在多AUV協(xié)調(diào)中的應(yīng)用與仿真碩士研究生:指導(dǎo)教師:學(xué)位級(jí)別:學(xué)科、專業(yè):所在單位:論文提交日期:論文答辯日期:學(xué)位授予單位;李鋒嚴(yán)浙平教授工學(xué)碩士交通信息工程及控制自動(dòng)化學(xué)院2008年1月2008年3月哈爾濱工程大學(xué)多智能體Q學(xué)習(xí)在多AUV協(xié)調(diào)中的應(yīng)用與仿真摘要AUV(AutonomousUnderwaterVehicle,簡(jiǎn)稱AUV)作為一種高技術(shù)手段,在海洋環(huán)境監(jiān)測(cè)、海底資源調(diào)查、科學(xué)考察、危險(xiǎn)環(huán)境作業(yè)和打撈救生等方面起到了至關(guān)重要的作用。隨著執(zhí)行任務(wù)的復(fù)雜性日益增加,單AUV在大范圍內(nèi)作業(yè)的時(shí)效性、魯棒性和柔性等方面就

2、表現(xiàn)出明顯不足。需要多個(gè)AUV構(gòu)成系統(tǒng)來(lái)共同完成任務(wù),而多AUV的協(xié)調(diào)控制成為關(guān)鍵問(wèn)題,本論文主要討論了一種新的多AUV協(xié)調(diào)控制方法、系統(tǒng)設(shè)計(jì)及仿真。本文首先介紹了多AUV技術(shù)的發(fā)展動(dòng)態(tài)以及課題研究的意義,然后根據(jù)多AUV協(xié)調(diào)控制系統(tǒng)的需要建立AUV運(yùn)動(dòng)模型、多智能體Q學(xué)習(xí)模型,在此基礎(chǔ)上建立了面向任務(wù)的多AUV系統(tǒng)結(jié)構(gòu)。對(duì)比分析了近幾年的幾種重要的多智能體強(qiáng)化算法,然后提出了一種新的多智能體Q學(xué)習(xí)算法,這種算法結(jié)構(gòu)簡(jiǎn)單,能夠大大簡(jiǎn)化狀態(tài)空間,加快收斂速度。試驗(yàn)表明,本文提出的多智能體Q學(xué)習(xí)方法是有效的。然后對(duì)多智能體Q學(xué)習(xí)算法實(shí)現(xiàn)多AUV協(xié)調(diào)的系統(tǒng)進(jìn)行了設(shè)計(jì),用多個(gè)仿真實(shí)例說(shuō)明了多智能體

3、Q學(xué)習(xí)算法在多AUV系統(tǒng)中的應(yīng)用,試驗(yàn)證明,此本文提出的多智能體Q學(xué)習(xí)協(xié)調(diào)算法在滿足Nash均衡的同時(shí),避免了研究多個(gè)均衡點(diǎn)同時(shí)存在的問(wèn)題,收斂速度快并且非常有效。關(guān)鍵詞:多智能體;Q學(xué)習(xí);hash均衡;多AUV;仿真哈爾濱T群人學(xué)碩十學(xué)何論文ABSTRACTAutonomousUnderwaterVehicle(AUV)playsanimportantroleinmarineenvironmentmonitoting,seabedresourcesinvestigating,sciencerespecting,dangerousenvironmentexploring,rescueand

4、salvageandSOon.Alongwiththemissionbecomemorecomplicatedly,thesingleAUVobviouslyshowsinsufficientateffectiveness,robustnessandflexibilityinalarge。scaleoperatingmission-ItISnecessarytocoordinatewiththehelpofMulti—AUVsoperatingtogether,alldcooperationisthekeytechniquesofMulti-AUVs.Inthispaperacoopera

5、tivestrategy,aMulti.AUVscooperativesystem’sdesignandit’Ssimulationarediscussed.Firstly,thetrendofmultipleAUVsdevelopmentandtheresearchmeaningarepresented.ThenaAUVdynamicmodel,multiagentQ·learningmodelisdesignedbasedontheneedofmultipleAUVssystem,andanewarchitecture0tAUVbasedonmissionisproposed.Then

6、,severalsingleagentandmultiagentreinforcementlearningalgorithmsproposedinrecentyearsareinvestigated,comparedandanalyzeddeeplyinthispaper.AndamuliagentQ‘learningalgorithmisproposed.Thisalgorithminvolvessimpleproceduresandeasycomputations,andcanguaranteegoodlearningconvergence·Experimentresultsofmul

7、ti.AUV,scoordinationandcontrolshowthatthisalgorithmiseffective·Then.a(chǎn)Multi.AUVscooperativesystembasedonmuliagentQ。learningalgorithmisdesinged.SeveralsimulationexperimentshowtheapplicationofmuliagentQ.1earningalgo

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。