資源描述:
《不完全信息動(dòng)態(tài)博弈》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、4不完全信息動(dòng)態(tài)博弈4.1精煉貝葉斯均衡概述不完全信息動(dòng)態(tài)博弈就其基本要素來看是不完全信息與博弈的動(dòng)態(tài)性質(zhì)的一種綜合。在處理不完全信息要素時(shí),通過將某些參與人“類型”的不確定性作為信息不完全性的一種表征,這種方法將繼續(xù)得以采用,即博弈中參與人面臨的信息不完全性(無論它是指何種信息)將完全由某些參與人的“類型”的不確定性加以刻畫。同時(shí),作為動(dòng)態(tài)博弈,“序貫理性”的思想將一直得到貫徹。我們在不完全信息動(dòng)態(tài)博弈中將信息不完全程度削減到零,則不完全信息動(dòng)態(tài)博弈就自然應(yīng)退化成一種完全信息動(dòng)態(tài)博弈,其相應(yīng)的精煉均衡概念就由精煉貝葉斯回到子博弈精煉均衡。從這種意義
2、上來看,不完全信息動(dòng)態(tài)博弈的精煉均衡概念是子博弈精煉均衡概念的一種推廣,正如不完全信息動(dòng)態(tài)博弈應(yīng)被視作完全信息動(dòng)態(tài)博弈的一種推廣一樣。例簡單的非完全信息動(dòng)態(tài)博弈Nt1(p)t2(1–p)11LRLR22L¢R¢L¢R¢L¢R¢L¢R¢u1u1u1u1u1u1u1u1u2u2u2u2u2u2u2u2參與人1的類型t為個(gè)人信息。參與人2不知道t,但知道t的概率分布。博弈的時(shí)序:(1)參與人1選擇行動(dòng)a1?A1;(2)參與人2觀察a1,選擇a2?A2博弈的收益:u1(a1,a2,t),u2(a1,a2,t)精煉貝葉斯均衡博弈的納什均衡是一種“僵持”狀態(tài)的戰(zhàn)
3、略組合,當(dāng)所有的參與人都選擇該戰(zhàn)略組合中給出的相應(yīng)戰(zhàn)略時(shí),任何一個(gè)參與人都不會(huì)有單方面偏離這一選擇的動(dòng)機(jī)。作為動(dòng)態(tài)博弈,一個(gè)戰(zhàn)略是參與人在其可能進(jìn)行行動(dòng)選擇的所有信息集上將作何選擇的一整套規(guī)定或計(jì)劃,而作為不完全信息博弈,這種規(guī)定或計(jì)劃還是“類型依存”的,即不同類型的參與人將選擇不同的戰(zhàn)略規(guī)定。因此,一個(gè)不完全信息動(dòng)態(tài)博弈的納什均衡將是指這樣的一種類型依存性的戰(zhàn)略組合(或戰(zhàn)略組合的族),當(dāng)給定其他參與人的戰(zhàn)略時(shí)(其他參與人的戰(zhàn)略是類型依存的,所以,說給定其他參與人的戰(zhàn)略即指給定其他參與人的戰(zhàn)略與類型的依存關(guān)系),任一參與人在其任何類型下由該組合給出的
4、類型依存戰(zhàn)略是其最優(yōu)的。顯然,這里還需要附加一個(gè)條件,即給定一參與人對其他參與人的類型分布的先驗(yàn)概率密度,否則他將無法對選擇的“最優(yōu)性”加以判斷。這種概率分布或密度來自于博弈開始之前參與人所擁有的信息,故稱為“先驗(yàn)”信息或“先驗(yàn)”概率。定義一個(gè)人不完全信息動(dòng)態(tài)博弈的參與人類型空間,條件概率,其中是參與人的類型,,的確定是通過Harsanyi轉(zhuǎn)換實(shí)現(xiàn)的,因而參與人知道而其他除參與人之外的參與人不一定知道。一個(gè)類型依存的戰(zhàn)略組合是一個(gè)納什均衡,當(dāng)且僅當(dāng)有條件概率是先驗(yàn)的,因?yàn)樗遣┺乃o定的條件,來自博弈開始之前參與人關(guān)于其他參與人類型的相關(guān)信息。當(dāng)然,
5、“自然”這個(gè)“參與人”并不包括在由下標(biāo)標(biāo)記的個(gè)參與人之中,但由Harsanyi轉(zhuǎn)換所假定的參與人“自然”首先行動(dòng),它決定每一個(gè)參與人的類型,但除每個(gè)參與人自己能“觀察”到自己的類型外,對于其他參與人的類型,他是只具有不完全信息的。按照上式定義的納什均衡被稱為貝葉斯納什均衡,它在本質(zhì)上并未體現(xiàn)出不完全信息靜態(tài)博弈與不完全信息動(dòng)態(tài)博弈的區(qū)別。動(dòng)態(tài)博弈與靜態(tài)博弈的本質(zhì)區(qū)別在于動(dòng)態(tài)博弈均衡中存在對“序貫理性”的要求。這樣,我們需要對上式給出的納什均衡加以精煉,以剔除含有不可置信承諾和威脅的均衡,這就是下面將要引入的“精煉貝葉斯納什均衡”。序貫理性在完全信息動(dòng)
6、態(tài)博弈中指的是參與人在任一子博弈上都選擇最優(yōu)的行動(dòng)計(jì)劃,而精煉均衡要求所有參與人的戰(zhàn)略在任一子博弈上都是其在給定其他參與人戰(zhàn)略選擇下的該子博弈上的最優(yōu)戰(zhàn)略,即納什均衡戰(zhàn)略。在不完全信息動(dòng)態(tài)博弈中,信息集不一定是單結(jié)的,因而真子博弈可能不存在。此時(shí),序貫理性指的是任一參與人在從其任一信息集開始的隨后的博弈中(后續(xù)博弈)所選擇的行動(dòng)計(jì)劃都是最優(yōu)的。對于任一參與人來說,當(dāng)他處于某一信息集上時(shí),他對其他的每一個(gè)參與人的類型有一個(gè)概率判斷。在不完全信息動(dòng)態(tài)博弈中,他在此時(shí)并不準(zhǔn)確知道其他參與人的類型是什么,但知道其他參與人的類型為每一種特定的類型組合的概率是多
7、少。于是,假定所有參與人都是風(fēng)險(xiǎn)中性的,則他將根據(jù)這種概率分布來選擇使他的期望支付最大化的行動(dòng)計(jì)劃。例:市場進(jìn)入博弈例:不完美信息博弈的精煉貝葉斯均衡1RLM13p21-pL¢R¢L¢R¢20001021標(biāo)準(zhǔn)式表示參與人2L¢R¢L2,10,0參與人1M0,20,1R1,31,3純戰(zhàn)略納什均衡:(L,L¢),(R,R¢)均為子博弈精煉納什均衡(唯一的子博弈是原博弈本身)。但是(R,R¢)不可信。排除不可信的納什均衡:要求1參與人的戰(zhàn)略必須滿足序貫理性(sequentiallyrational).要求2參與人必須有一個(gè)推斷(belief).定義處于均衡
8、路徑上(ontheequilibriumpath)的信息集:在均衡戰(zhàn)略下,博弈以正的概率到達(dá)該集.處于均衡路