免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

 月滿大江流 2021-04-30

約翰納什是個(gè)非常著名也非常傳奇的人物,他的著名也來源于他的傳奇。約翰納什出生于1928年,在21歲的時(shí)候,約翰納什就以一篇僅僅27頁的論文獲得了博士學(xué)位。其中有一項(xiàng)重要的發(fā)現(xiàn),就是后來被稱為“納什均衡”的博弈理論。約翰納什在1994年獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。

約翰納什更為最出名的就是他因精神分裂導(dǎo)致瘋癲,1958年,30歲的約翰納什開始陷入了臆想的空虛世界,分不清虛幻和現(xiàn)實(shí)了。直到80年代末期,納什才漸漸康復(fù),從瘋癲中蘇醒。這段時(shí)間長達(dá)30年。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

普林斯頓學(xué)院對約翰納什體現(xiàn)出了極大的容納,對科學(xué)家的極大尊重是美國強(qiáng)大的原因之一。更令人感動(dòng)的是,約翰納什的妻子也是他的學(xué)生艾里西亞一直沒有放棄他,即便是后來實(shí)在無法忍受約翰納什的狂躁瘋癲被迫離婚,也沒有再婚,而是一直在默默照顧他,直到納什蘇醒。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

這段感人的故事被好萊塢拍成了電影,這就是《美麗心靈》,該片于2001年12月21日在美國上映,并獲得了第74屆奧斯卡金像獎(jiǎng)最佳影片獎(jiǎng)。

在影片中,還是大學(xué)生的約翰納什和同學(xué)在下圍棋,他邊下邊說“我的每一步時(shí)都最優(yōu),我一定可以贏你”,但結(jié)果卻是納什輸了,納什表現(xiàn)出對結(jié)果的無法理解和無法接受,他推倒了棋盤,在同學(xué)的哄笑中慌亂生氣的走了,一邊走一邊說“圍棋是個(gè)有缺陷的游戲”。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

細(xì)心的觀眾會(huì)發(fā)現(xiàn)電影中的對局基本就是在亂下,這個(gè)情節(jié)只是為了突出博弈的特點(diǎn),也就是對弈中對手的選擇會(huì)根據(jù)你的選擇發(fā)生變化,并不是靜止的一直能線性演進(jìn)下去。

我們試著推演一下圍棋和博弈論的關(guān)系。

“博弈論”是一種研究“斗爭”的科學(xué),是探究在“自利”的大前提下,個(gè)體如何獲得最大收益的策略。其實(shí)圍棋就是一種斗爭的游戲,最終也是要以雙方圍空的多少分出勝負(fù)。

博弈論中的核心就是大名鼎鼎的“納什均衡”,納什均衡中最經(jīng)典的案例就是廣為人知的“囚徒困境”

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

兩個(gè)共謀犯罪的人被關(guān)入監(jiān)獄,不能互相溝通情況。如果兩個(gè)人都不揭發(fā)對方,則由于證據(jù)不確定,每個(gè)人都坐牢一年;若一人揭發(fā),而另一人沉默,則揭發(fā)者因?yàn)榱⒐Χ⒓传@釋,沉默者因不合作而入獄十年;若互相揭發(fā),則因證據(jù)確鑿,二者都判刑八年。由于囚徒無法信任對方,因此傾向于互相揭發(fā),而不是同守沉默。

我們簡單了解一下什么是“納什均衡”?

納什均衡(Nash equilibrium)又稱非合作博弈均衡,是指在一個(gè)博弈過程中,無論對方的策略選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略,則該策略被稱作支配性策略。如果任意一位參與者在其他所有參與者的策略確定的情況下,其選擇的策略是最優(yōu)的,那么這個(gè)組合就被定義為納什均衡。

納什均衡可以分成兩類:“純戰(zhàn)略納什均衡”和“混合戰(zhàn)略納什均衡”。

混合戰(zhàn)略博弈均衡中要用概率計(jì)算,因?yàn)槊恳环N策略都是隨機(jī)的,達(dá)到某一概率時(shí),可以實(shí)現(xiàn)支付最優(yōu)。因?yàn)闄C(jī)率是連續(xù)的,所以即使戰(zhàn)略集合是有限的,也會(huì)有無限多個(gè)混合戰(zhàn)略。

圍棋可以看做是一個(gè)混合戰(zhàn)略博弈均衡。由于AI的引入,大家對圍棋中的勝率其實(shí)也就是“獲勝的概率”已經(jīng)很熟悉了。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

圍棋是兩個(gè)人之間的非合作博弈游戲,兩個(gè)人每一個(gè)回合都是一個(gè)混合戰(zhàn)略,一盤棋就是一個(gè)上百甚至數(shù)百個(gè)回合的混合戰(zhàn)略集合。每個(gè)回合實(shí)際都有一個(gè)最優(yōu)解,以前由于人們的水平不同,理解也不同,所以很難給出最優(yōu)解。阿法狗出現(xiàn)后,它給出的勝率基本就是每個(gè)回合的最優(yōu)解了,因?yàn)樗鼞?zhàn)勝了所有的人類棋手,大家不得不信服。之所以說基本,是因?yàn)槿祟惼迨峙紶栆矔?huì)下出比AI更好勝率更高的棋來。這也從另一個(gè)角度證明了圍棋的復(fù)雜程度。

AI能戰(zhàn)勝人類棋手,就是因?yàn)樗诿恳粋€(gè)博弈回合都取得了最優(yōu)解,也就是勝率最高的下法,這些勝率持續(xù)累加起來自然也就是取得了勝利。

人類棋手則很難做到這一點(diǎn),除了計(jì)算力和判斷力的原因,還有就是人類總想下自己喜歡的棋,喜歡的棋并不代表是勝率最高的棋。舉例來說,日本超一流武宮正樹九段酷愛“宇宙流”下法,但現(xiàn)在的AI根本不推薦宇宙流,這樣人類棋手就會(huì)很痛苦。站在博弈論的角度也很好理解,在水平相當(dāng)也就是認(rèn)知能力相當(dāng)?shù)那闆r下,你想下的棋,一定是對手千方百計(jì)不讓你走到的棋,所以現(xiàn)在的圍棋基本沒有定式了。

我們再回到文章開頭,約翰納什認(rèn)為自己每一步下法都是最優(yōu)解,他理所應(yīng)當(dāng)會(huì)取得最后的勝利,但實(shí)際上,他認(rèn)為的最優(yōu)解可能并不是真正的最優(yōu)解,用圍棋行話說就是“判斷失誤”,所以輸?shù)袅恕?/p>

不是圍棋游戲有缺陷,而是人們的認(rèn)知水準(zhǔn)有缺陷?!扒敉嚼Ь场钡某闪⑶疤峋褪莾蓚€(gè)罪犯對彼此的認(rèn)知不同,也就是雙方都不相信對方能死扛,也就是信息不對稱,所以寧肯獲得8年刑期,也不冒險(xiǎn)獲得10年刑期。

圍棋是有缺陷的游戲?圍棋的博弈論與納什均衡

“知己知彼,百戰(zhàn)不殆”,實(shí)際早在2000年前,孫子就已經(jīng)告訴世人,信息的獲取能力才是博弈獲勝與否的關(guān)鍵。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多