資源描述:
《耶魯公開課--博弈論筆記》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、耶魯公開課—博弈論筆記第一節(jié)、名詞解釋優(yōu)勢策略(Dominantstrategy):不論其他局中人采取什么策略,優(yōu)勢策略對一個(gè)局中人而言都是最好的策略?! 〖茨承r(shí)候它勝于其他策略,且任何時(shí)候都不會比其他策略差?! ∽ⅲ?、“優(yōu)勢策略”的優(yōu)勢是指你的這個(gè)策略對你的其他策略占有優(yōu)勢,而不是無論對手采用什么策略,都占有優(yōu)勢的策略?! ?、采用優(yōu)勢策略得到的最壞的結(jié)果不一定比采用另外一個(gè)策略得到的最佳的結(jié)果略勝一籌。嚴(yán)格劣勢策略(strictlydominatedstrategy):被全面的嚴(yán)格優(yōu)勢策略壓住的那個(gè)策略,也就是說不是嚴(yán)格優(yōu)勢策略
2、以外的策略。弱劣勢策略:原來不是嚴(yán)格劣勢策略,但是經(jīng)過剔除嚴(yán)格劣勢策略后,這個(gè)策略就成了嚴(yán)格劣勢策略。例:囚徒困境囚徒到底應(yīng)該選擇哪一項(xiàng)策略,才能將自己個(gè)人的刑期縮至最短?兩名囚徒由于隔絕監(jiān)禁,并不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個(gè)人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設(shè)想困境中兩名理性囚徒會如何作出選擇:若對方沉默、背叛會讓我獲釋,所以會選擇背叛。若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。二人面對的情況一樣,所以二人的理性思考都會得出相同的結(jié)論——選擇
3、背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達(dá)到的納什均衡,就是雙方參與者都背叛對方,結(jié)果二人同樣服刑2年。例:協(xié)和謬誤20世紀(jì)60年代,英法兩國政府聯(lián)合投資開發(fā)大型超音速客機(jī),即協(xié)和飛機(jī)。該種飛機(jī)機(jī)身大、裝飾豪華并且速度快,其開發(fā)可以說是一場豪賭,單是設(shè)計(jì)一個(gè)新引擎的成本就可能高達(dá)數(shù)億元。難怪政府也會被牽涉進(jìn)去,竭力要為本國企業(yè)提供更大的支持?! №?xiàng)目開展不久,英法兩國政府發(fā)現(xiàn):繼續(xù)投資開發(fā)這樣的機(jī)型,花費(fèi)會急劇增加,但這樣的設(shè)計(jì)定位能否適應(yīng)市場還不知道;但是停止研制也是可怕的,因?yàn)橐郧暗耐顿Y將付諸東流。隨著研制工作
4、的深入,他們更是無法做出停止研制工作的決定。協(xié)和飛機(jī)最終研制成功,但因飛機(jī)的缺陷(如耗油大、噪音大、污染嚴(yán)重等)以及運(yùn)營成本太高,不適合市場競爭,英法政府為此蒙受很大的損失?! ≡谘兄七^程中,如果英法政府能及早放棄,本來可以使損失減少,但他們沒能做到。最后,英國和法國航空公司宣布協(xié)和飛機(jī)退出民航市場,才算是從這個(gè)無底洞中脫身。這也是“壯士斷腕”的無奈之舉?! ∪藗兺鶗萑腩愃频恼`區(qū):一項(xiàng)工作的成本越大,對它的后續(xù)投入就越多。其實(shí)不僅是在制造協(xié)和飛機(jī)這樣的重大項(xiàng)目上,就是在日常的生活中,人們在決定是否繼續(xù)做一件事情的時(shí)候,不僅是看它對自
5、己有沒有好處,而且也過于注意自己是不是已經(jīng)在這件事情上面有過投入?! ∥覀儼涯切┮呀?jīng)發(fā)生、不可收回的支出,如時(shí)間、金錢、精力稱為“沉沒成本”。沉沒的意思是說,你在正式完成交易之前投入的成本,如果一旦交易不成,就會白白損失掉。但如果對沉沒成本過分眷戀,就會繼續(xù)原來的錯(cuò)誤,造成更大的虧損。在第一節(jié)課中得出的五個(gè)結(jié)論:1、不要選擇劣勢策略?????????????????????????????????????????????????2、理性選擇導(dǎo)致次優(yōu)結(jié)果???????????????????????????????????????????
6、????3、站在他人立場分析他們會怎么做????????????????????????????????????????????????4、先弄清你想要的,才能得到你想要的????????????????????????????????????????????????5、人人都是自私的第二節(jié)、囚徒困境的解決之道:1、多次博弈;2、設(shè)立規(guī)章制度,懲罰違規(guī)者;3、思想教育(效果待定)。博弈的要素:參與者i;策略S;收益U。符號的定義:Si表示參與者i的策略。S-i表示除參與者i以外其他人的策略。Ui表示i的收益。名詞解釋:共同知識:我知道這
7、件事;你也知道這事;我知道你知道這事;你知道我知道你知道這事這事;此后循環(huán)。案例:老師在課堂上讓每位學(xué)生從1-100中選擇一個(gè)數(shù)字。選擇到最接近全班平均數(shù)的2/3的學(xué)生為勝利者。學(xué)生共有50個(gè)左右。勝利者平分獎金5美元。解決方案:step1、假設(shè)每個(gè)人都選擇100,平均數(shù)100*2/3=66.66。所以不能選擇67-100之間的數(shù)(嚴(yán)格劣勢策略)。現(xiàn)實(shí)中有兩名學(xué)生選擇了。?????????????????step2、剔除了step1中的嚴(yán)格劣勢策略后,重復(fù)迭代,66*2/3=44。所以不能選擇44-67之間的數(shù)(弱劣勢策略)。現(xiàn)實(shí)中有四
8、名學(xué)生選擇了。????????????????step3、44*2/3=29,所以不能選擇29-44之間的數(shù)?,F(xiàn)實(shí)中有13個(gè)左右選擇了30-34區(qū)間,。選擇這個(gè)數(shù)區(qū)間的學(xué)生想法是1-100平均數(shù)是50,50