資源描述:
《博弈論及其對(duì)策行為課件.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、博弈論和對(duì)策行為博弈論和對(duì)策行為概論博弈論(theGameTheory)也就是運(yùn)籌學(xué)中的對(duì)策論。博弈思想最早產(chǎn)生于我國(guó)古代。早在兩千多年的春秋時(shí)期,孫武在《孫子兵法》中論述的軍事思想和治國(guó)策略,就蘊(yùn)育了豐富和深刻的博弈論思想。孫武的后代孫臏,為田忌謀劃,巧勝齊王,這個(gè)著名的“田忌賽馬”,就是典型的博弈思想的成功運(yùn)用。博弈論和對(duì)策行為概論博弈思想明確地應(yīng)用于經(jīng)濟(jì)領(lǐng)域,始于Cournot(1838),Bertrand(1883),Edgeworth(1925)等人關(guān)于寡頭競(jìng)爭(zhēng)、產(chǎn)量與價(jià)格壟斷、產(chǎn)品交易行為的研究。然而,作為一門(mén)學(xué)科的創(chuàng)立,則是以美國(guó)數(shù)學(xué)家馮.諾依曼(JohnV
2、onNeumann)和經(jīng)濟(jì)學(xué)家?jiàn)W斯卡.摩根斯坦(OskarMorgenstern)合著的《博弈論與經(jīng)濟(jì)行為》(TheGameTheoryandEconomicBehavior)(1944)一書(shū)出版為標(biāo)志,他們奠定和形成了這門(mén)學(xué)科的理論與方法論基礎(chǔ)。博弈論和對(duì)策行為概論博弈論是一門(mén)內(nèi)容廣泛且復(fù)雜的學(xué)科,不僅是經(jīng)濟(jì)學(xué),政治學(xué)、軍事、外交、國(guó)際關(guān)系、公共選擇,還有犯罪學(xué)等,都涉及到博弈論。實(shí)際上,很多人把博弈論看成數(shù)學(xué)的一個(gè)分支,博弈論的一個(gè)重要代表人物---納什(Nash,曾獲1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),該年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授與了三位博弈論專家),在1951年的一篇奠基性的文
3、章就是發(fā)表在數(shù)學(xué)雜志上,而非在經(jīng)濟(jì)學(xué)雜志上。但是,本講只是介紹博弈論的最基本的內(nèi)容,且限于博弈論在經(jīng)濟(jì)學(xué)中的應(yīng)用。博弈論和對(duì)策行為基本概念本書(shū)討論博弈論模型的最基本表述方式---策略型表述,它主要用于表現(xiàn)靜態(tài)博弈。這里介紹策略型表述中的基本概念,明確有關(guān)術(shù)語(yǔ)的準(zhǔn)確含義。博弈論和對(duì)策行為基本概念在策略型博弈中,一個(gè)博弈有以下幾種基本要素:一.局中人(players):即博弈的參與者,他們是博弈的決策主體行為。根據(jù)自己的利益要求決定自己的,記局中人為i,局中人集合為{1,2,…,I},即共有I個(gè)局中人。我們將某個(gè)局中人以外的其它局中人稱為“i的對(duì)手”,記為-i。博弈論和對(duì)策行
4、為基本概念在策略型博弈中,一個(gè)博弈有以下幾種基本要素:一.局中人即指每個(gè)局中人在博弈中可以選擇采用的行動(dòng)方案,但這個(gè)方案必須是一個(gè)完整的行動(dòng),而不是行動(dòng)的某一步。每個(gè)局中人均有可供選擇的多種策略。二.策略(strategies):博弈論和對(duì)策行為基本概念在策略型博弈中,一個(gè)博弈有以下幾種基本要素:一.局中人即指多個(gè)獨(dú)立的局中人在博弈中選擇采用行動(dòng)方案的先后次序,次序不同,博弈類(lèi)型不同二.策略(strategies)三.次序(order):四.支付或收益(payoffs):二.策略三.次序(order):一.局中人在策略型博弈中,一個(gè)博弈有以下幾種基本要素:博弈論和對(duì)策行為
5、基本概念是指一局博弈的得失?;蛘哒f(shuō)是局中人從各種策略組合中獲得的效用,它是策略組合的函數(shù)。如果局中人得失的總和為零,則稱這種博弈為零和博弈;否則,稱為非零和博弈。例1. 囚徒困境(prisoner’sdilemma)博弈論和對(duì)策行為策略型博弈的實(shí)例和解(囚徒困境)囚徒B坦白抵賴囚徒A坦白-8,-80,-10抵賴-10,0-1,-1例1. 囚徒困境(prisoner’sdilemma)博弈論和對(duì)策行為策略型博弈的實(shí)例和解(囚徒困境)這個(gè)例子可以看作是非合作博弈現(xiàn)象的一個(gè)抽象概括。它講的是兩個(gè)嫌疑犯被隔離審訊。他們面臨的處境是:如果兩人都坦白,各判刑8年;如果兩人都抵賴,各判
6、刑1年(或許證據(jù)不足);如果一人坦白另一人抵賴,則坦白的放出去,不坦白的判刑10年,(“坦白從寬、抗拒從嚴(yán)”)。這里,兩個(gè)囚徒就是兩個(gè)局中人,每個(gè)局中人都有兩個(gè)策略可供選擇:坦白或抵賴。表中每一格的一對(duì)數(shù)字分別表示局中人不同策略組合的收益,第一個(gè)數(shù)字是囚徒A的收益,第二個(gè)數(shù)字是囚徒B的收益。這種有限博弈(局中人是有限個(gè),每個(gè)局中人的策略數(shù)也是有限的)往往用矩陣形式表示。例1. 囚徒困境(prisoner’sdilemma)博弈論和對(duì)策行為策略型博弈的實(shí)例和解(囚徒困境)在對(duì)博弈局勢(shì)進(jìn)行描述后,博弈論分析就是要求出局中人進(jìn)行策略選擇的理性結(jié)局,或者說(shuō)找出博弈問(wèn)題的解。在非合
7、作博弈中,有兩種解的技術(shù):一種是納什均衡,一種是優(yōu)超解。定義1:給定其它局中人的策略s,局中人i的最優(yōu)反應(yīng)記為s*,是指能給他帶來(lái)最大收益的策略,即博弈論和對(duì)策行為納什均衡當(dāng)每個(gè)局中人都選擇了自己的最優(yōu)反應(yīng)策略,并且這些最優(yōu)反應(yīng)形成一個(gè)策略組合,便形成了納什均衡。定義2:一個(gè)策略組合s*=(s1*,s2*,…,sn*)被稱為納什均衡是指,對(duì)于所有的i,博弈論和對(duì)策行為納什均衡納什均衡的思想就是,博弈的理性結(jié)局是這樣一種策略組合,其中每個(gè)局中人選擇的策略都已是對(duì)其它局中人所選策略的最優(yōu)反應(yīng),所以,誰(shuí)也沒(méi)有積極性去選擇其它策略。