資源描述:
《基于博弈論的多Agent協(xié)商模型_申靜》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、,.:云南大學(xué)學(xué)報(bào)(自然科學(xué)版)2側(cè)場(chǎng)28《S2)89~93CN53一1045/Nl島N0258一7971J.口,Ialofy.山..U川忱招l(wèi)ty基At‘于博弈論的多gen協(xié)商模型,,,,申靜夏幼明孫喻李紅林楊莉(,云南師范大學(xué)計(jì)算機(jī)科學(xué)與信息技術(shù)學(xué)院云南昆明650092:、、,ent、摘要在開(kāi)放動(dòng)態(tài)具有自適應(yīng)性和自治性的多掩即t系統(tǒng)(M八S)中協(xié)商是多弋系統(tǒng)實(shí)現(xiàn)協(xié)調(diào)協(xié)作和解決沖突的關(guān)鍵.博弈論是使用嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)模型研究沖突條件下最優(yōu)決策問(wèn)題的理論,本文以此為數(shù)學(xué)工具.基于對(duì)時(shí)間的限制,結(jié)合協(xié)商的歷史知識(shí),考慮各協(xié)商者在擁有不完全信息的情況下,提出了基于博弈論的多,,掩即t協(xié)商模型
2、(GTM人NM)并給出了協(xié)商策略求解的算法描述用以來(lái)解決分布式環(huán)境下不完全信息的多人,,協(xié)商決策問(wèn)題以獲得最大的期望收益為以后把博弈論中其他更復(fù)雜的博弈思想引人到多弋即t協(xié)商中來(lái)莫定了基礎(chǔ).關(guān)抽詞:協(xié)商;多掩即t系統(tǒng);博弈論::A文:一7l(2僅拓)一一中圈分類(lèi)號(hào)即18文獻(xiàn)標(biāo)識(shí)碼章編號(hào)025879義08905,,entt隨著計(jì)算機(jī)科學(xué)技術(shù)的飛速發(fā)展瑰技術(shù)的發(fā)展越來(lái)越多地受到社會(huì)和業(yè)界的關(guān)注多弋en系.AS中,統(tǒng)(MAS)已成為分布式人工智能的一個(gè)重要研究領(lǐng)域在M由于不存在全局控制和全局共享目,,,,t標(biāo)因此掩ent間往往不可避免會(huì)存在競(jìng)爭(zhēng)行為從而導(dǎo)致出現(xiàn)沖突如資源沖突(不同掩en競(jìng)
3、爭(zhēng)同一、.,,,消費(fèi)性資源)目標(biāo)沖突等另一方面在M叭S中由于掩ent擁有的信息不完全和有限的問(wèn)題求解能力,ent因此當(dāng)戈ent面臨的問(wèn)題難以獨(dú)立求解而又要求合作才能更有效地求解時(shí)掩播要通過(guò)與其他A-.,e,nt來(lái)完成egent協(xié)商將其部分或全部任務(wù)委托其他掩國(guó)內(nèi)外在這方面做了大童的研究J耐ngs針對(duì),。fle:PT系統(tǒng)〔‘〕中定義了一個(gè)面向服務(wù)的協(xié)商模型川電信服務(wù)行業(yè)的特點(diǎn)和決定的內(nèi)容問(wèn)題在趕犯其模型對(duì)掩ent的協(xié)商結(jié)構(gòu)增加了相對(duì)復(fù)雜的思考機(jī)制(deliberativechanism);zeng[21等人基于對(duì)協(xié)商過(guò)me,entart程中戈學(xué)習(xí)的重要性的認(rèn)識(shí)設(shè)計(jì)了基于連續(xù)決策過(guò)程的
4、協(xié)商模型(玫圈)其目的在于支持弋en在.[2.【4],協(xié)商過(guò)程的學(xué)習(xí)但是目前對(duì)協(xié)商的研究往往只是單純地研究協(xié)商協(xié)議3]或者只重視研究協(xié)商策略er,,ents且掩之間的協(xié)商只是簡(jiǎn)單地交換試l的過(guò)程因此通用性較差而有關(guān)協(xié)商模型的理論研究是博弈,,論領(lǐng)域的主要工作[5]本文結(jié)合協(xié)商的歷史知識(shí)和時(shí)間資源的約束考慮各協(xié)商者在擁有不完全信息的,,,情況下引人貝葉斯博弈的思想提出了基于博弈論的多戈ent協(xié)商模型(GTM[ANM)從而能更好地解決分布ent具有不完全信息時(shí)的協(xié)商問(wèn)題.式環(huán)境下戈1假設(shè)和協(xié)商模型1.1徹:ent協(xié)商中的博弈博弈論又名對(duì)策論,是研究機(jī)智而又理性的決策者之間的沖突及合作的
5、學(xué),、,,,科[6]即是一些個(gè)人一些團(tuán)隊(duì)或其他組織面對(duì)一定的環(huán)境條件在一定的規(guī)則約束下依靠所掌握的信,、,息同時(shí)或先后一次或多次從各自允許選擇的行為或策略進(jìn)行選擇并加以實(shí)施并從中取得各自相應(yīng)結(jié).、,ent果或收益的過(guò)程博弈論研究的主要目的是研究博弈者行為的特征掩是具有人的思維能力可以代、、、、,表人的行為擁有自己的目標(biāo)或意圖可以自己決定執(zhí)行動(dòng)作的目的時(shí)間以及在什么環(huán)境下主動(dòng)自發(fā)二20(巧一07一收稿日期10:云南省自然科學(xué)墓金項(xiàng)目(0‘全項(xiàng)目3FI洲)38M).:19一,,山東人,,主要從事ent作衡簡(jiǎn)介申靜(81)女碩士生橄技術(shù)方面的研究.:19一.,,主要從事人工智能、通訊作者
6、復(fù)幼明(56)教授碩士生導(dǎo)師知識(shí)處理等方面的研究云南大學(xué)學(xué)報(bào)(自然科學(xué)版)第28卷,,地做出適當(dāng)?shù)臎Q策控制自身的行為并能對(duì)環(huán)境的變化作出響應(yīng)或自主地改變自己行為的可持續(xù)運(yùn)行的.,.,ent協(xié)商的目的是為了共同完成一定的任務(wù)軟件多個(gè)戈并且在完成任務(wù)的過(guò)程中協(xié)調(diào)各自的利益協(xié),,商即在一定的協(xié)商空間中經(jīng)過(guò)一定的時(shí)間和不同的協(xié)商次數(shù)最終達(dá)到使每個(gè)個(gè)體都能接受的狀態(tài)的一.,,ent協(xié)商也可以看作是一種博弈個(gè)決策過(guò)程由此多掩具體地說(shuō)是多人動(dòng)態(tài)完美但不完全信息混合有限策略博弈.,、ent戈協(xié)商中的博弈根據(jù)信息的完美性和完全性可分為完美信息博弈和不完美信息博弈完全信息.,,;博弈和不完全信息博弈所
7、謂完美信息即是指在博弈之前完全了解自己的行為完全信息即是指各博弈,,,;又叫做貝葉斯博弈方都有關(guān)于各方得益的全部知識(shí)不完全信息博弈即是在均衡路徑上的信息集處作.,出的判斷由貝葉斯法則和各博弈方的均衡策略決定的博弈過(guò)程據(jù)此本文提出了一種基于博弈論的多ent協(xié)商模型GTM叭NM(A儀叻e一eory一玫嶸dMulti一entNegotiationel).瑰Th弋M記1.2協(xié)商中的假設(shè)實(shí),如多項(xiàng)目協(xié)商際應(yīng)用主要是面對(duì)不完全信息的分布式環(huán)境下多人協(xié)商決策問(wèn)題.,ent雙方就多個(gè)