資源描述:
《“石頭剪刀布制勝策略”的研究,是浪費(fèi)錢嗎?》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、u石頭剪刀布制勝策略”的研究,是浪費(fèi)錢嗎?Ent發(fā)表于2014-05-06昨天,一篇來(lái)自浙江大學(xué)、浙江工商人學(xué)和中科院理論物理研究所的論文公布在了預(yù)印木網(wǎng)站上。根據(jù)媒體的宣傳,研究者“找到了石頭剪刀布的制勝策略”??谌欢坏兀芏嗑W(wǎng)友的反應(yīng)是:“這還需耍你研究?”中國(guó)科學(xué)家通過(guò)實(shí)駒發(fā)現(xiàn)石頭剪刀布的制曲策略「盍環(huán)刃罠於評(píng)論量新評(píng)論卸彌人帕與1評(píng)論21273條
2、區(qū)服網(wǎng)中國(guó)冋友:手機(jī)用戶發(fā)衰曰期:2014/05/031612?分國(guó)獲合發(fā)的¥顧干這名堂掩理【心“】1凹蔓1?J十民眼網(wǎng)中國(guó)網(wǎng)妄:手機(jī)用戶發(fā)養(yǎng)曰默:2014/08AX316
3、12妙}中囘的科學(xué)家原來(lái)只會(huì)研究這個(gè)。國(guó)之悲哀!笊薦[9154]
4、回夏
5、爲(wèi)制鳳限冋北時(shí)舷,于機(jī)用戶發(fā)衰曰期:2014/05/53!€:!31£齊中匡J科學(xué)家研究這巴暖話!怪不心瘠若推祿【5191】
6、回理1變制鳳凰岡北空布網(wǎng)友:手譏用戶岌衣曰期:2014/05/031<>12科學(xué)靈闈的玉疼。雄禪[457$]1
7、農(nóng)觀【網(wǎng)友評(píng)論截圖。圖片來(lái)源:鳳凰網(wǎng)】但是只需掃一眼就會(huì)發(fā)現(xiàn),研究者不幸又被標(biāo)題黨坑了。他們尋找的不是怎樣玩贏剪了包袱錘,而是通過(guò)人們?cè)诩袅税ゅN里的行為來(lái)判斷哪一種理論更能預(yù)測(cè)人類——是傳統(tǒng)博弈論的納什均衡,還是演化博
8、弈論。因此,我打算從我熟悉的演化博弈論角度來(lái)越俎代庖,嘗試解讀這項(xiàng)研究為什么不是在浪費(fèi)錢。為了幫助理解它,我會(huì)講四個(gè)故事。這四個(gè)故事從易到難,如果你匕經(jīng)對(duì)這個(gè)領(lǐng)域很熟悉了,可以跳過(guò)前面的幾個(gè)故事。第一個(gè)故事:囚徒困境…個(gè)有錢人被發(fā)現(xiàn)死于家中。警方抓獲了兩個(gè)犯罪嫌疑人并査獲了贓物,但兩人辯稱說(shuō)他們只是小偷,進(jìn)屋時(shí)那個(gè)人已經(jīng)死了。沒(méi)有更多證據(jù),調(diào)查陷入僵局。于是警方把兩人分開(kāi),分別對(duì)他們說(shuō):如果你倆都不認(rèn)罪,我只能判你盜竊,一年了事;如果你招了他沒(méi)招,你算作立功,不用坐牢,而他得十五年。如果如果他招了你沒(méi)招,那反過(guò)來(lái)。但如果他和你
9、都認(rèn)了,謀殺罪每人十年。嫌疑人X心想:如果丫不招,那么我也不招的話會(huì)判一年,我招了無(wú)罪釋放。招了更劃算。而如果Y招了,那我不招的話十五年,招了只有十年。還是招了更劃算。顯然我應(yīng)該招啊。而嫌疑人丫當(dāng)然也是這么想的。結(jié)果,兩人都判了I年。任何一人改策略都只會(huì)讓自己處境更糟,這便是一個(gè)納什均衡??墒牵绻麖恼w上看,最好的結(jié)果顯然是兩人都不招,各判一年。雙方都是理性考慮謀求自己的最大利益,結(jié)果卻是兩人都遭遇了壞場(chǎng)景;無(wú)論是整體授好場(chǎng)景(各判一年)還是個(gè)人最好場(chǎng)景(直接禪放)都不可能發(fā)生。這就是為何囚徒困境是個(gè)“困境”。每個(gè)人都很精明
10、,最后怎么弄了這么個(gè)爛攤子?prisonerB境招供(背叛沉默(合作)<」euosud年?,丄X—【囚徒困境示意圖(或者,“收益矩陣”)。圖片來(lái)源:EncyclopaediaBritannica]按照囚徒困境術(shù)語(yǔ),不招的行為算作“合作”(和你的獄友合作,不是和警方合作),而招認(rèn)的行為算作“背叛”。雙方都合作最好,雙方都背叛則兩敗俱傷。按照這個(gè)故事,合作根本不可能出現(xiàn)啊。現(xiàn)實(shí)屮類似囚徒困境的場(chǎng)呆簾常出現(xiàn)。但是,更多的結(jié)局似乎是合作,而不是背叛。為什么?可能的原因是,困境不止這一次。第二個(gè)故事:重復(fù)囚徒博弈如果嫌疑人X和Y是陌生人
11、,那么兩人的下場(chǎng)都是十年。但是他們也許是兩肋插刀的好哥們,或者冇血親,或者屬于同一個(gè)紐織一一總而言Z,用博弈論的術(shù)語(yǔ),他們以前也許打過(guò)交道,將來(lái)還很可能繼續(xù)打交道。這時(shí),“合作”就不是什么難以想彖的事情了吧。因此,?位名叫羅們特?阿克斯羅徳的政治學(xué)家在上世紀(jì)80年代初做了?個(gè)名垂青史的實(shí)驗(yàn)。他在計(jì)算機(jī)里擺了一場(chǎng)錦標(biāo)賽,有很多名虛擬的參賽選手,雙方捉對(duì)嘶殺——哦不,是捉對(duì)進(jìn)行重復(fù)仄1徒博弈。按照博弈的結(jié)果記分,你背叛他合作,則你得5分他得0分,雙方都合作各得3分,雙方都背叛各得1分。然后,他向全世界征集策略,每一個(gè)得到的策略變成
12、一個(gè)參賽選手。提交的策略共有14個(gè),來(lái)自經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、政治學(xué)和數(shù)學(xué)等等領(lǐng)域,再加上一個(gè)“完全隨機(jī)”的對(duì)照策略,共15“人”進(jìn)行比賽。這里面有些策略極其復(fù)雜極其精妙,比如有-個(gè)策略用馬爾科夫過(guò)程為對(duì)方的行為建立模型,然后用貝葉斯推斷最好的選擇。但是,最后得分最高的競(jìng)?cè)皇撬刑峤徊呗岳镒詈?jiǎn)單的一個(gè)——“-?報(bào)還一報(bào)”(TFT,titfortat)o這個(gè)策略一共只有兩條規(guī)則:(1)第一步先合作,(2)從第二步開(kāi)始,對(duì)方上一輪出的是什么,我就出什么。提交這個(gè)策略的是維也納的安納托?拉們波特,他寫(xiě)這個(gè)策略只用了4行BASIC代碼。阿克
13、斯羅徳發(fā)表了錦標(biāo)賽的分析結(jié)果,并邀請(qǐng)人家吸取經(jīng)驗(yàn)教訓(xùn)提交新一輪策略——這次他獲得了62個(gè)策略,不但冇上面提到的領(lǐng)域,還包括了演化生物學(xué)、物理學(xué)和計(jì)算科學(xué)等新學(xué)科。只有一個(gè)人厚顏無(wú)恥地原樣提交了上次的衛(wèi)冕冠軍,那就是拉伯波特本人。你猜對(duì)了。他又一次獲得了勝利。TFT這個(gè)“報(bào)仇者