資源描述:
《4 完全信息動態(tài)博弈》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、完全信息動態(tài)博弈CompleteInformationDynamicGame主要內(nèi)容博弈的擴(kuò)展式表述子博弈精練Nash均衡應(yīng)用舉例2擴(kuò)展式表述(博弈樹)一般需確定的要素參與人集合參與人行動順序參與人的行動空間(集合)參與人的信息集參與人的支付函數(shù)外生事件的發(fā)生概率/概率分布擴(kuò)展式表述的三個(gè)基本要素參與人的集合每個(gè)參與人的策略集合由策略組合決定的每個(gè)參與人的支付動態(tài)博弈中參與人的“行動”與“策略”相同?3地產(chǎn)開發(fā)博弈4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)
2、開發(fā)開發(fā)商B需求小的情況需求大的情況4地產(chǎn)開發(fā)博弈的擴(kuò)展式表述A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)結(jié),決策結(jié)枝初始結(jié)信息集參與人集合參與人行動順序參與人的行動空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布5博弈數(shù)的基本結(jié)構(gòu)結(jié):包括決策結(jié)和終點(diǎn)結(jié)兩類;決策結(jié)是參與人行動的始點(diǎn),終點(diǎn)結(jié)是決策人行動的終點(diǎn).結(jié)滿足傳遞性和非對稱性x之前的所有結(jié)的集合,稱為x的前列集P(x),x之后的所有結(jié)的集合稱為x的后續(xù)集T(
3、x)。枝:枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動選擇.信息集:每個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié):每個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié);該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié).6博弈數(shù)表述(1)A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B在決策時(shí)不確切地知道自然的選擇;B的決策結(jié)由4個(gè)變?yōu)?個(gè)7博弈數(shù)表述(2)A開發(fā)不開發(fā)NN大小1/21/2
4、大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策)8博弈樹的幾點(diǎn)說明只包含一個(gè)決策結(jié)的信息集稱為單結(jié)信息集,如果博弈樹的所有信息都是單結(jié)的,該博弈稱為完美信息博弈。自然總是假定是單結(jié)的,因?yàn)樽匀辉趨⑴c人決策之后行動等價(jià)于自然在參與人之前行動但參與人不能觀測到自然的行動。不同的博弈樹可以代表相同的博弈,但是有一個(gè)基本規(guī)則:一個(gè)參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。9囚徒困境博弈的擴(kuò)展式表述AB坦白抵賴BB
5、AA坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)10智豬博弈的擴(kuò)展式表述(練習(xí))5,14,49,-10,0等待小豬大豬按等待按11主要內(nèi)容博弈的擴(kuò)展式表述子博弈精練Nash均衡應(yīng)用舉例12思考問題:為什么需要“子博弈精煉納什均衡”?對完全信息動態(tài)博弈,考慮以下問題:一個(gè)博弈可能有多個(gè)(甚至無窮多個(gè))納什均衡,究竟哪個(gè)更合理?納什均衡假定每一個(gè)參與人在選擇自己的最優(yōu)戰(zhàn)略時(shí)假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動有先有后,后行動者的選擇空間依賴于前行動者的
6、選擇,前行動者在選擇時(shí)不可能不考慮自己的行動對后行動者的影響。子博弈精練納什均衡的一個(gè)重要改進(jìn)是將“合理納什均衡”與“不合理納什均衡”分開。博弈的基本類型:完全信息、不完全信息博弈靜態(tài)博弈、動態(tài)博弈13子博弈精煉納什均衡一個(gè)納什均衡稱為精練納什均衡,當(dāng)只當(dāng)參與人的戰(zhàn)略在每個(gè)子博弈中都構(gòu)成納什均衡,也就是說,組成精練納什均衡的戰(zhàn)略必須在每一個(gè)子博弈中都是最優(yōu)的。一個(gè)精練納什均衡首先必須是一個(gè)納什均衡,但納什均衡不一定是精練納什均衡。澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個(gè)合理的預(yù)測結(jié)果,簡單說,子博弈精練
7、納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。14子博弈(sub-game)子博弈:是原博弈的一部分,它本身也可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析:子博弈必須從一個(gè)單結(jié)信息點(diǎn)開始:只有決策者在原博弈中確切地知道博弈進(jìn)入一個(gè)特定的決策結(jié)時(shí),該決策結(jié)才能作為一個(gè)子博弈的初始結(jié)。如果信息集包含兩個(gè)以上的決策結(jié),則這兩個(gè)都不可以作為子博弈的初始結(jié)。子博弈的信息集和支付向量都直接繼承自原博弈。習(xí)慣上,任何博弈的本身稱為自身的一個(gè)子博弈。15一個(gè)例子A開發(fā)不開發(fā)XX大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)