資源描述:
《序貫決策博弈.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、序貫決策博弈第一部分同時(shí)博弈與序貫博弈主要內(nèi)容本章主要介紹:1、如何用正規(guī)型表示和展開型表示來表述同一個(gè)博弈。2、博弈論中的兩個(gè)重要概念:信息集和不完美信息。3、考察包含同時(shí)決策行動(dòng)和序貫決策行動(dòng)的復(fù)合型博弈(混合博弈)的納什均衡。第一節(jié)博弈的正規(guī)型表示與展開型表示第二節(jié)同時(shí)決策與序貫決策的混合博弈第三節(jié)樹形博弈的子博弈第四節(jié)子博弈精煉納什均衡第五節(jié)完美博弈的庫恩定理第六節(jié)動(dòng)態(tài)博弈的運(yùn)用第一節(jié)博弈的正規(guī)型表示與展開型表示一、如何將博弈的展開型形式轉(zhuǎn)化為正規(guī)型表示案例:“進(jìn)入障礙”博弈進(jìn)入者●進(jìn)入不進(jìn)●
2、壟斷者容忍抵抗●容忍抵抗◆(1,5)(-2,2)◆◆◆(0,10)(0,4)壟斷者abc“進(jìn)入障礙”的矩陣表達(dá)1,5-2,2-2,21,50,100,40,100,4進(jìn)入者壟斷者進(jìn)入不進(jìn)入{容忍,容忍}{抵抗,抵抗}{抵抗,容忍}{容忍,抵抗}小結(jié)1、一般我們將先行動(dòng)者放在行局中人的位置,把后行動(dòng)者放在列局中人的位置。2、每個(gè)局中人的策略必須是一個(gè)完整的計(jì)劃,必須考慮自己在對(duì)方每一個(gè)行動(dòng)下的行動(dòng)。例如:{容忍,容忍}。在本例中,進(jìn)入者有兩個(gè)純策略,而壟斷者有四個(gè)純策略。3、每個(gè)局中人的決策輪數(shù)越多,則他
3、的純策略選擇的數(shù)目越多。思考:如果有三輪博弈,如何寫矩陣形式。4、矩陣形式表示的可能的博弈結(jié)果比樹形表示的結(jié)果要多,這是因?yàn)橛胁恢挂粋€(gè)純策略可以導(dǎo)致相同的博弈結(jié)果。二、如何將正規(guī)型的博弈轉(zhuǎn)化為展開型比前面簡單,尤其是序貫博弈,但如果是同時(shí)博弈,如何表示?信息集案例:情侶博弈2,10,00,01,2足球芭蕾足球芭蕾丈夫妻子夫妻之爭信息集根據(jù)同時(shí)博弈的定義,每個(gè)局中人決策時(shí)不知道別人的策略,即每個(gè)局中人在做自己的行動(dòng)選擇時(shí),并不知道自己處在哪個(gè)決策節(jié)點(diǎn)上。例如妻子在選芭蕾時(shí),并不知道丈夫選的是芭蕾還是足球。
4、局中人不能是別人對(duì)方“已經(jīng)”做出的行動(dòng)或決策,就等于同時(shí)行動(dòng)或決策。此時(shí),我們用一個(gè)扁橢圓形的虛線的圈,把所論局中人的若干決策節(jié)點(diǎn)罩起來,成為他的一個(gè)信息集。即局中人知道博弈已經(jīng)進(jìn)行到他的這個(gè)信息集,但不知道博弈究竟進(jìn)行到這個(gè)信息集中的哪個(gè)決策節(jié)點(diǎn)。信息集妻子雖然知道博弈已經(jīng)進(jìn)行到她的信息集,但不知道進(jìn)行到信息集中的那個(gè)決策點(diǎn),即她不知道丈夫會(huì)選什么,因此是同時(shí)博弈。丈夫●足球芭蕾●妻子足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,-1)(1,2)妻子注意一個(gè)信息集罩住的必須是同一個(gè)局中人的決策
5、點(diǎn)。必須是同一個(gè)局中人在同一個(gè)時(shí)點(diǎn)的決策節(jié)點(diǎn)。ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒這兩個(gè)虛線罩住的都不是信息集。注意同時(shí),即使是同一個(gè)人在同一時(shí)點(diǎn)進(jìn)行決策,也不一定構(gòu)成一個(gè)信息集,他還必須滿足:在每一個(gè)決策點(diǎn)他的行動(dòng)選擇集合必須是相同的。因?yàn)榫种腥嗽谧鲂袆?dòng)選擇時(shí)并不知道自己位于哪個(gè)決策點(diǎn),因此,他不可能做出不同的行動(dòng)選擇?!瘛馎●◆◆◆BB◆◆該虛線罩住的不是信息集。其必須滿足:同集同注,即從各個(gè)決策點(diǎn)出發(fā)的策略選擇數(shù)目相同,名稱也相同
6、。單點(diǎn)集和非單點(diǎn)集我們把不被扁橢圓虛線罩住的每個(gè)決策節(jié)點(diǎn)也給以信息集的地位,稱為單點(diǎn)集。因此,每一個(gè)決策位置都是一個(gè)信息集,只有單點(diǎn)集和非單點(diǎn)集之分。●●A●◆◆BB◆◆●◆非單點(diǎn)集單點(diǎn)集完美信息博弈和不完美信息博弈當(dāng)博弈走到一個(gè)單點(diǎn)集的信息集時(shí),面臨決策的局中人對(duì)于博弈迄今的歷史清清楚楚,他清楚了博弈具體走到了他的這個(gè)決策節(jié)點(diǎn)而不是別的決策點(diǎn)。我們把這種歷史清楚的博弈稱為完美信息博弈。但是當(dāng)博弈走到一個(gè)非單點(diǎn)集的信息集時(shí),面臨決策的局中人對(duì)于博弈迄今的歷史是不清楚的,他不清楚博弈具體走到了他的這個(gè)信息
7、集里面的那個(gè)決策點(diǎn)。我們把這種歷史不清楚的博弈稱為不完美信息博弈。如果一個(gè)序貫博弈的每個(gè)信息集都是一個(gè)單點(diǎn)集,那么該序貫博弈就是完美信息博弈,否則他就是不完美信息博弈。信息集舉例情愛博弈的擴(kuò)展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0
8、)(0,1)(0,0)房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策)房地產(chǎn)開發(fā)博弈第二節(jié)同時(shí)決策與序貫決策的混合博弈(完全不完美信息的兩階段博弈)我們把包含同時(shí)決策行動(dòng)和序貫決策行動(dòng)的博弈稱為混合博弈。假設(shè)有兩家計(jì)算機(jī)公司:方正和聯(lián)想。彼此對(duì)