本章介紹一個解決囚徒悖論目前來說最好的策略一報還一報。 一報還一報具體的意思是不首先背叛,對方合作就合作,對方背叛就背叛,接下來的每一步都模仿對方的行為,這個策略之所以能在其他策略中脫穎而出是因為它具備了四個特點: 善良性,不首先背叛。 可激怒性,善有善報,惡有惡報,及時回報。 寬容性,可以再次合作只要背叛者愿意回歸到合作上來。 清晰性,非常清楚,減少雙方的誤判。 前言:自私是天性,合作才是出路。 自私是天性 理查德·道金斯寫了一本書叫做《自私的基因》,對當時的人們道德觀有很大的沖擊,竟讓很多人看完這本書自殺。人生沒有意義,我們注定自私,書中透漏著一股濃濃的宿命論,但是最讓人深惡痛絕的是那么多年過去了(1976),很少人能找出有力的證據(jù)來反對他的理論。 歌德《少年維特的煩惱》,故事的結尾少年維特自殺了,導致很多歐洲青少年自殺。這個和本文沒有關系。 道金斯說從生命的起源開始,生命最初形式是海洋里一串串基因,他稱之為“原始湯”,生命的形式一步步進化,進化成細菌、微生物、昆蟲、恐龍、哺乳動物和人類,基因行動的法則從未改變,改變的不過是生命形式和表現(xiàn)形式,基因的法則是以復制為手段,以永續(xù)保留為目的,一個基因成功的標準就是有沒有成功的進行復制并擴散。 在生命形式上的表現(xiàn)為,生物以繁衍為手段,以種群存續(xù)為目的。為了使基因存續(xù)下去,生命的個體之間相互競爭使自己基因更好的存活和擴散。同理病毒的目的不是為了干掉人類,而是通過人類復制基因,實現(xiàn)和宿主共存,所以病毒的毒性下降是有益于其長期存在的利益的。 根據(jù)道金斯的觀點,我們每個人都具有自私的基因,導致自私的行為,這里的自私并不具有道德色彩,這里的自私是指每個人都具有個人利益最大化的意圖,因此道金斯認為自私是天性,也因為如此受到了很大的非議,盡管他后來一再解釋,讀者依然不依不饒的在道德上審判他的別有用心。 自私的天性導致我們生活無處不在的囚徒悖論現(xiàn)象,即每個人從個人利益最大化出發(fā),最終在次優(yōu)解取得平衡,而不是最優(yōu)解。 如下: 警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇: 若一人認罪并作證檢控對方(相關術語稱“背叛”對方),而對方保持沉默,此人將即時獲釋,沉默者將判監(jiān)10年。 若二人都保持沉默(相關術語稱互相“合作”),則對二人各判一年。 若二人都互相檢舉(互相“背叛”),則二人同樣判監(jiān)3年。
但是在甲、乙軍均不知道對方的想法的情況下, 若對方沉默、背叛會讓我獲釋,所以會選擇背叛。 若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。 二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。 從整體利益出發(fā),對二人最好的方案是選擇沉默,但是從個體的角度看最好的選擇是選擇背叛,這里產(chǎn)生嚴重的悖論,稱之為囚徒悖論。 合作才是出路 《自私的基因》問世以后,引起學界很大的震動,對社會帶來很大的沖擊,尤其是對人的道德感帶來很大的破壞。還好一個人拯救了當時脆弱的道德觀,這個人便是羅伯特·阿克塞爾羅德,《合作的進化》破解了自私帶來的短視行為,順便將理查德·道金斯從十字架上解救下來,從此以后道金斯的《自私的基因》一書后面增加了一張好人終有好報,其中大部分是原文引用羅伯特·阿克塞爾羅德的《合作的進化》一書的內(nèi)容,阿克塞爾羅德拯救了人類的靈魂,讓人們重新看到道德必要性。 在《合作的進化》一書中,作者在互聯(lián)網(wǎng)上征求來自英國、加拿大、澳大利亞、美國和其他國家的學者、教授、企業(yè)家、學生提供解決囚徒悖論的策略,通過評審團去掉一些重復和搞笑的策略后,挑出了最為大家認可的69個方案,通過計算機模擬策略之間的競爭、入侵和最終受益。 由于策略在實行的過程會自我迭代,不同的環(huán)境相同的策略表現(xiàn)不同,通過將近200次的迭代后,其中,一報還一報“的策略(Tit for Tat)的策略脫穎而出,無論從魯棒性、最終受益都是遙遙領先其他策略。 魯棒性,那些策略不容易被入侵。 最終受益,這些策略對其他策略的得分情況,能贏過其他策略的次數(shù)。 舉個例子 其中有一個以德報怨的策略,即無限制的寬容,這個策略遇到永遠背叛的策略時候,以德報怨的策略得分為0,而永遠背叛的策略收益最高。但是永遠背叛的策略遇到另外一個相同的策略得分就會因為雙方?jīng)]有合作的可能變得很低。但是一報還一報的策略無論遇到什么樣的策略都能保持魯棒性和優(yōu)秀的表現(xiàn),而且經(jīng)過計算機模擬該策略無法被入侵、 這個策略是:一報還一報具體的意思是不首先背叛,對方合作就合作,對方背叛就背叛,接下來的每一步都模仿對方的行為,這個策略之所以能在其他策略中脫穎而出是因為它具備了四個特點: 善良性,不首先背叛 可激怒性,善有善報,惡有惡報,及時回報。 寬容性,可以再次合作只要背叛者愿意回歸到合作上來。 清晰性,非常清楚,減少雙方的誤判。 合作的進化與真實的歷史 一戰(zhàn)期間,英國士兵和德國士兵在塹壕里對峙,按道理講戰(zhàn)場的士兵不是你死便是我亡的零和博弈,但是這樣情況本次沒有發(fā)生,相反最后雙方產(chǎn)生一種:”自己活也讓別人活“系統(tǒng)。 大概的情況是,雙方會例行開戰(zhàn),但是故意不打中對方,最后英國的一個士兵可以推斷出德國炮手的開炮方位、持續(xù)時間和炮彈的落點,居然大搖大擺的在炮火中穿梭而毫發(fā)無傷。德國士兵也可以推斷出英國士兵的射擊點,雙方在長期的博弈中選擇了自己活也讓別人活的整體利益最大化,讓人嘆為觀止。 老子說:以德報怨。 孔子說:何以報德? 所以,以德報德,以怨報怨。 最后,雖然自私是天性,但是合作才是最好的選項。 |
|
來自: 風雨無阻nm0udo > 《思想》