資源描述:
《混合策略課件.ppt》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在PPT專區(qū)-天天文庫。
1、混合策略找到不確定情況下的最優(yōu)反應(yīng)2021/8/131張醒洲,大連定義在一個(gè)n人博弈的標(biāo)準(zhǔn)式表述中,參與人的策略空間為,收益函數(shù)為,我們用表示此博弈。納什均衡博弈的標(biāo)準(zhǔn)式和納什均衡2021/8/132張醒洲,大連舉例:猜硬幣模型兩個(gè)參與人{(lán)1,2}每個(gè)參與人的策略空間為{H,T}收益零和試著找到納什均衡參與人2參與人1正面背面正面-1,11,-1背面1,-1-1,1兩個(gè)男孩各自有一個(gè)硬幣并且他們必須選擇將硬幣的正面朝上還是背面朝上。如果兩個(gè)硬幣朝上的面相同(即都是正面或都是背面),則參與人2將贏
2、得參與人1的硬幣;否則,參與人1將贏得參與人2的硬幣。2021/8/133張醒洲,大連猜硬幣如果參與人的策略一致——(正面,正面)或(反面,反面)—?jiǎng)t參與人1會偏向于改變策略;但是如果兩者策略不一致—(正面,反面)或(反面,正面)—?jiǎng)t參與人2偏向于改變策略。參與人2正面背面正面-1,11,-1參與人1背面1,-1-1,1沒有一組策略滿足(NE)石頭-剪刀-布博弈此博弈也不存在納什均衡無論參與人1選擇哪個(gè)純策略,參與人都可以打敗他。參與人2石頭剪刀布石頭0,01,00,1參與人1剪刀0,10,01
3、,0布1,00,10,02021/8/135張醒洲,大連猜對方策略猜硬幣博弈一個(gè)非常突出的特點(diǎn)是每個(gè)參與人都試圖猜中對方的策略。任何這一類都沒有納什均衡至少不存在1.1.C節(jié)所定義的納什均衡因?yàn)檫@一類博弈的解包含了一個(gè)參與人對其他參與人行為的不確定?,F(xiàn)在我們介紹混合策略2021/8/136張醒洲,大連純策略,混合策略考慮標(biāo)準(zhǔn)式博弈G={S1,····,Sn;u1,····,un}此后我們定義Si中的策略為參與人i的純策略在本節(jié)的完全信息同時(shí)行動(dòng)博弈中,一個(gè)參與人的純策略就是他可以選擇的不同行動(dòng);
4、例如,在猜硬幣的博弈中,Si包含兩個(gè)純策略:正面和背面。參與人i的一個(gè)混合策略是在其策略空間Si中的(一些或全部)策略的概率分布。2021/8/137張醒洲,大連概率和信念隨機(jī)事件事件有明確定義.我們可以區(qū)分不同的事件.在進(jìn)行觀察或試驗(yàn)前,我們不能肯定的說一個(gè)具體的事件會出現(xiàn).我們可以判斷哪些事件有可能出現(xiàn),并且能判斷每一個(gè)事件出現(xiàn)的可能性大小.概率事件的概率是對一次隨機(jī)試驗(yàn)中該事件出現(xiàn)的可能性的度量如果對可能性的度量以某種客觀規(guī)律或物質(zhì)屬性為基礎(chǔ),我們就用“概率”一詞如果對可能性的度量以個(gè)人經(jīng)
5、驗(yàn)、主觀判斷為基礎(chǔ),就用“主觀概率”、“信念”、“置信度”等術(shù)語2021/8/138張醒洲,大連概率分布樣本空間:Ω={ω1,ω2,…,ωn,…}試驗(yàn)中可能出現(xiàn)的所有基本結(jié)果ωi的集合事件由基本結(jié)果組成,是樣本空間的子集。如果在試驗(yàn)中事件A中的一個(gè)結(jié)果出現(xiàn)了,就說事件A發(fā)生。概率分布就是將總概率P(Ω)=1分解到所有可能的樣本點(diǎn)或事件上的一種方式.2021/8/139張醒洲,大連概率的公理化定義概率測度樣本空間Ω上的一個(gè)概率測度是Ω的子集的一個(gè)函數(shù)P(·),它滿足三條公理:公理(1)0≤P(E)
6、≤1,對任一事件E公理(2)P(Ω)=1公理(3)對任何一列互不相容的事件E1,E2,….,即Ei∩Ej=Ф(空集),i≠j,有我們稱P(E)為事件E的概率。2021/8/1310張醒洲,大連混合粗略:猜硬幣參與人i的一個(gè)混合策略是在其策略空間Si中的策略的概率分布舉例:猜硬幣S2包含兩個(gè)純策略即正面和反面,因此參與人2的一個(gè)混合策略為概率分布(q,1-q),其中q為正面朝上的概率,1-q是背面朝上的概率,并且07、合策略(0,1)是背面朝上的純策略;類似地,混合策略(1,0)是正面朝上的純策略。2021/8/1311張醒洲,大連混合策略:舉例參與人2的一個(gè)混合策略為概率分布(q,r,1-q-r),其中q表示出左的概率,r表示出中的概率,1-q–r表示出右的概率。和前面一樣,08、12,0圖1.1.1atPager6參與人的一個(gè)純策略只是其混合策略的一個(gè)特例,例如參與人2出左的純策略可表示為混合策略(1,0.0)。2021/8/1312張醒洲,大連混合策略:定義更為一般地,假定參與人i有K個(gè)純策略:Si={si1,…,siK}.參與人i的一個(gè)混合策略是一個(gè)概率分布(pi1,…,piK),其中piK表示對所有k=1,…,K,參與人i選擇策略sik的概率,由于pik是一個(gè)概率,對所有k=1,…,K,有0≤pik≤1且pi1+···+piK=1。我們用pi表示基于Si的任意一個(gè)