資源描述:
《博弈論及其應用.ppt》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、博弈方法及其應用典型的囚徒問題兩個嫌犯受到指控,但除非至少一個招認,否則警方不能將二人判有罪。警察把二人分別帶到不同的房間,告之后果:如果二人均不坦白,將被判入獄一個月。如果雙方均坦白,將被判入獄6個月。如果一方招認,另一方不招,招認一方馬上釋放,另一方判入獄9個月(6+3)。囚徒甲囚徒乙沉默招認沉默-1,-1-9,0招認0,-9-6,-6博弈現(xiàn)象的三要素局中人-參與博弈但利益不完全一致者。有二人博弈與多人博弈之分。策略集-每個局中人都會有一系列的策略可選,稱為對應于每個局中人的策略集。有限和無限個對策。收益-在每策略組
2、合下每一局中人的收益情況。是選擇策略的標準。收益函數(shù)或支付函數(shù)。例1:甲乙二人在桌上各放一枚硬幣,如果同向。甲贏一場;兩面不同,乙贏一場。比賽兩場告終。二戰(zhàn)全勝者可占有對方的硬幣。局中人:甲、乙二人策略集合:二人均為:正正、正反、反正、反反四個策略。(有限)甲的收益函數(shù)見下表(乙的為甲的相反數(shù)):正正正反反正反反正正1,-10,00,0-1,1正反0,01,-1-1,10,0反正0,0-1,11,-10,0反反-1,10,00,01,-1乙的策略收益甲的策略重復剔除嚴格劣勢策略嚴格劣勢策略如果某一局中人的兩個策略S1與S
3、2,有如下關系:對于其他局中人的所有策略,均有S1的所有收益>S2的所有收益,則稱S2相對于S1是嚴格劣勢策略。還需要假定所有局中人間相互了解所有局中人是理性的所有局中人都知道上述假定有時沒有嚴格劣勢策略例2囚徒問題的求解囚徒乙囚徒甲沉默招認沉默-1,-1-9,0招認0,-9-6,-6例1的求解--無嚴格劣勢策略正正正反反正反反正正1,-10,00,0-1,1正反0,01,-1-1,10,0反正0,0-1,11,-10,0反反-1,10,00,01,-1乙的策略收益甲的策略一個新問題--無法剔除AB左中右左0,44,05
4、,3中4,00,45,3右3,53,56,6納什均衡對于每一個局中人i,在其他人所有策略的任一組合中,均有一個策略Si*的收益不小于S的其它策略的收益,稱所有的S*是這個博弈問題的一個納什均衡。納什均衡比重復剔除嚴格劣勢策略要求更嚴格,不會被剔除掉。1950年納什證明任何有限博弈中都存在一個納什均衡。囚徒問題的納什均衡囚徒乙囚徒甲沉默招認沉默-1,-1-9,0招認0,-9-6,-6例1的納什均衡:混合戰(zhàn)略在概率意義上的均衡正正正反反正反反正正1,-10,00,0-1,1正反0,01,-1-1,10,0反正0,0-1,11
5、,-10,0反反-1,10,00,01,-1乙的策略收益甲的策略新問題的納什均衡AB左中右左0,44,05,3中4,00,45,3右3,53,56,6性別戰(zhàn)博弈不在同一地方工作的帕特與克里斯安排周末晚上的娛樂節(jié)目:帕特克里斯歌劇拳擊歌劇2,10,0拳擊0,01,2二人0和博弈如例一,A的收益等于B的損失可簡化矩陣為正正正反反正反反正正100-1正反01-10反正0-110反反-1001乙的策略甲的收益甲的策略例3某鄉(xiāng)村學校在秋季購買冬季取暖用煤的總費用如下:較暖正常較冷10噸-100-175-30015噸-150-150
6、-25020噸-200-200-200氣象支付數(shù)量較暖正常較冷10噸-100-175-30015噸-150-150-25020噸-200-200-200氣象支付數(shù)量鞍點的求法:行最小與列最大例4與外商談判購買設備C1C2C3C4R120151235R224-68-12R34021135R4-50114外方中方降價思考例1有無鞍點?鞍點與嚴格劣勢策略及納什均衡的關系。構造就業(yè)談判中關于薪水的博弈問題。