免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

納什均衡

 荒蕪搖曳 2018-05-10
?納什均衡
納什均衡是指博弈中這樣的局面,對于每個(gè)參與者來說,只要其他人不改變策略,他就無法改善自己的狀況。納什證明了在每個(gè)參與者都只有有限種策略選擇并允許混合策略的前提下,納什均衡定存在。以兩家公司的價(jià)格大戰(zhàn)為例,價(jià)格大戰(zhàn)存在著兩敗俱傷的可能,在對方不改變價(jià)格的條件下既不能提價(jià),否則會進(jìn)一步喪失市場;也不能降價(jià),因?yàn)闀霈F(xiàn)賠本甩賣。于是兩家公司可以改變原先的利益格局,通過談判尋求新的利益評估分?jǐn)偡桨?。相互作用的?jīng)濟(jì)主體假定其他主體所選擇的戰(zhàn)略為既定時(shí),選擇自己的最優(yōu)戰(zhàn)略的狀態(tài),也就是納什均衡。[1]
中文名
納什均衡
外文名
Nash equilibrium
又稱
非合作博弈均衡
解釋
策略組合
含義
假設(shè)有n個(gè)局中人參與博弈,如果某情況下無一參與者可以獨(dú)自行動而增加收益(即為了自身利益的最大化,沒有任何單獨(dú)的一方愿意改變其策略的[2]),則此策略組合被稱為納什均衡。所有局中人策略構(gòu)成一個(gè)策略組合(Strategy Profile)。納什均衡,從實(shí)質(zhì)上說,是一種非合作博弈狀態(tài)。
納什均衡達(dá)成時(shí),并不意味著博弈雙方都處于不動的狀態(tài),在順序博弈中這個(gè)均衡是在博弈者連續(xù)的動作與反應(yīng)中達(dá)成的。納什均衡也不意味著博弈雙方達(dá)到了一個(gè)整體的最優(yōu)狀態(tài),需要注意的是,最優(yōu)策略不一定達(dá)成納什均衡,嚴(yán)格劣勢策略不可能成為最佳對策,而弱優(yōu)勢和弱劣勢策略是有可能達(dá)成納什均衡的。在一個(gè)博弈中可能有一個(gè)以上的納什均衡,而囚徒困境中有且只有一個(gè)納什均衡。
數(shù)學(xué)定義
納什均衡的定義:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合(s1*,…,sn*)中,任一博弈方i的策略si*,都是對其余博弈方策略的組合(s1*,…s*i-1,s*i+1,…,sn*)的最佳對策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)對任意sij∈Si都成立,則稱(s1*,…,sn*)為G的一個(gè)納什均衡。
經(jīng)濟(jì)學(xué)定義
所謂納什均衡,指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨(dú)改變策略都不會得到好處。換句話說,如果在一個(gè)策略組合上,當(dāng)所有其他人都不改變策略時(shí),沒有人會改變自己的策略,則該策略組合就是一個(gè)納什均衡。[3]
定理
矩陣博弈中,必定存在一個(gè)混合策略納什均衡。
分類
納什均衡可以分成兩類:“純戰(zhàn)略納什均衡”和“混合戰(zhàn)略納什均衡”。
要說明純戰(zhàn)略納什均衡和混合戰(zhàn)略納什均衡,要先說明純戰(zhàn)略和混合戰(zhàn)略。
所謂純戰(zhàn)略是提供給玩家要如何進(jìn)行賽局的一個(gè)完整的定義。特別地是,純戰(zhàn)略決定在任何一種情況下要做的移動。戰(zhàn)略集合是由玩家能夠施行的純戰(zhàn)略所組成的集合。而混合戰(zhàn)略是對每個(gè)純戰(zhàn)略分配一個(gè)機(jī)率而形成的戰(zhàn)略。混合戰(zhàn)略允許玩家隨機(jī)選擇一個(gè)純戰(zhàn)略?;旌蠎?zhàn)略博弈均衡中要用概率計(jì)算,因?yàn)槊恳环N策略都是隨機(jī)的,達(dá)到某一概率時(shí),可以實(shí)現(xiàn)支付最優(yōu)。因?yàn)闄C(jī)率是連續(xù)的,所以即使戰(zhàn)略集合是有限的,也會有無限多個(gè)混合戰(zhàn)略。
當(dāng)然,嚴(yán)格來說,每個(gè)純戰(zhàn)略都是一個(gè)“退化”的混合戰(zhàn)略,某一特定純戰(zhàn)略的機(jī)率為 1,其他的則為 0。
故“純戰(zhàn)略納什均衡”,即參與之中的所有玩家都玩純戰(zhàn)略;而相應(yīng)的“混合戰(zhàn)略納什均衡”,之中至少有一位玩家玩混合戰(zhàn)略。并不是每個(gè)賽局都會有純戰(zhàn)略納什均衡,例如“錢幣問題"就只有混合戰(zhàn)略納什均衡,而沒有純戰(zhàn)略納什均衡。不過,還是有許多賽局有純戰(zhàn)略納什均衡(如協(xié)調(diào)賽局,囚徒困境和獵鹿賽局)。甚至,有些賽局能同時(shí)有純戰(zhàn)略和混合戰(zhàn)略均衡。
經(jīng)典案例
囚徒困境
(1950年,數(shù)學(xué)家塔克任斯坦福大學(xué)客座教授,在給一些心理學(xué)家作講演時(shí),講到兩個(gè)囚犯的故事。)
假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。
?? 囚徒困境博弈
A╲B
坦白
抵賴
坦白
-8,-8
0,-10
抵賴
-10,0
-1,-1
關(guān)于案例,顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況,首先應(yīng)該是從心理學(xué)的角度來看,當(dāng)事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當(dāng)·斯密的理論,假設(shè)每個(gè)人都是“理性的經(jīng)濟(jì)人”,都會從利己的目的出發(fā)進(jìn)行選擇。這兩個(gè)人都會有這樣一個(gè)盤算過程:假如他坦白,如果我抵賴,得坐10年監(jiān)獄,如果我坦白最多才8年;假如他要是抵賴,如果我也抵賴,我就會被判一年,如果我坦白就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了劃算。兩個(gè)人都會動這樣的腦筋,最終,兩個(gè)人都選擇了坦白,結(jié)果都被判8年刑期。
基于經(jīng)濟(jì)學(xué)中Rational agent的前提假設(shè),兩個(gè)囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判處一年就不會出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局,納什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn):按照斯密的理論,在市場經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會達(dá)到利他的效果。但是我們可以從“納什均衡”中引出“看不見的手”原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。
硬幣正反
你正在圖書館枯坐,一位陌生美女主動過來和你搭訕,并要求和你一起玩?zhèn)€數(shù)學(xué)游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了?!蹦敲丛摬辉摵瓦@位姑娘玩這個(gè)游戲呢?這基本是廢話,當(dāng)然該。問題是,這個(gè)游戲公平嗎?
每一種游戲依具其規(guī)則的不同會存在兩種納什均衡,一種是純策略納什均衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什均衡,而在這個(gè)游戲中,便應(yīng)該采用混合策略納什均衡。
你\美女
美女出正面
美女出反面
你出正面
+3,-3
-2,+2
你出反面
-2,+2
+1,-1
假設(shè)我們出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。為了使利益最大化,應(yīng)該在對手出正面或反面的時(shí)候我們的收益都相等(不然在這個(gè)游戲中,對方可以改變正反面出現(xiàn)的概率讓我們的期望收入減少),由此列出方程就是
3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
?
納什均衡
解方程得x=3/8。
同樣,美女的收益,列方程
-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)
解得y也等于3/8,而美女每次的期望收益則是 2(1-y)- 3y = 1/8元。這告訴我們,在雙方都采取最優(yōu)策略的情況下,平均每次美女贏1/8元。
其實(shí)只要美女采取了(3/8,5/8)這個(gè)方案,不論你再采用什么方案,都是不能改變局面的。
命名原因
約翰·福布斯·納什(John Forbes Nash Jr)1948年作為年輕數(shù)學(xué)博士生進(jìn)入普林斯頓大學(xué)。其研究成果見于題為《非合作博弈》(1950)的博士論文。該博士論文導(dǎo)致了《n人博弈中的均衡點(diǎn)》(1950)和題為《非合作博弈》(1951)兩篇論文的發(fā)表。納什在上述論文中,介紹了合作博弈與非合作博弈的區(qū)別。他對非合作博弈的最重要貢獻(xiàn)是闡明了包含任意人數(shù)局中人和任意偏好的一種通用解概念,也就是不限于兩人零和博弈。該解概念后來被稱為納什均衡。
?
納什
納什的主要學(xué)術(shù)貢獻(xiàn)體現(xiàn)在1950年和1951年的兩篇論文,1950年他才把自己的研究成果寫成題為“非合作博弈”的文章刊登在美國全國科學(xué)院每月公報(bào)上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低,嘲笑幾天之后,他遇到蓋爾,像說夢話似的告訴他自己已經(jīng)將馮·諾依曼的“最小最大原理”找到了普遍化的方法和均衡點(diǎn)。納什這個(gè)初出茅廬的小子,根本不知道競爭的險(xiǎn)惡,從沒想到學(xué)術(shù)欺騙的后果。結(jié)果還是戴維·蓋爾充當(dāng)了他的“經(jīng)紀(jì)人”,起草致科學(xué)院的短信,系主任列夫謝茨則利用方便的人脈關(guān)系親自將文稿遞交給科學(xué)院。納什寫的文章不多,他辯解說:少了才是精品。1996年諾貝爾經(jīng)濟(jì)學(xué)獎得主莫爾里斯當(dāng)牛津大學(xué)艾奇沃思經(jīng)濟(jì)學(xué)講座教授時(shí)也沒有發(fā)表過什么文章,特殊的人才,必須有特殊的選拔辦法。
Nash平衡是指博弈中這樣的局面,對于每個(gè)參與者來說,只要其他人不改變策略,他就無法改善自己的狀況。Nash在證明了在每個(gè)參與者都只有有限種策略選擇、并允許混合策略的前提下,Nash平衡一定存在。以兩家公司的價(jià)格大戰(zhàn)為例,Nash平衡意味著兩敗俱傷的可能:在對方不改變價(jià)格的條件下,既不能提價(jià),否則會進(jìn)一步喪失市場;也不能降價(jià),因?yàn)闀霈F(xiàn)賠本甩賣。于是兩家公司可以改變原先的利益格局,通過談判尋求新的利益評估分?jǐn)偡桨?,也就是Nash均衡。類似的推理當(dāng)然也可以用到選舉,群體之間的利益沖突,潛在戰(zhàn)爭爆發(fā)前的僵局,議會中的法案爭執(zhí)等。
重要影響
納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),正如克瑞普斯(Kreps,1990)在《博弈論和經(jīng)濟(jì)建?!芬粫囊灾兴f,“在過去的一二十年內(nèi),經(jīng)濟(jì)學(xué)在方法論以及語言、概念等方面,經(jīng)歷了一場溫和的革命,非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融、會計(jì)、營銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域?!奔{什均衡的重要影響可以概括為以下六個(gè)方面
1.改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動經(jīng)濟(jì)學(xué)、國際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。
2.?dāng)U展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。
3.加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿足于對經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡單化處理,分析問題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問題。
4.形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類型或特征進(jìn)行分類,并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究,將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。
5.?dāng)U大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大,就因?yàn)樗胀?,而且普通到幾乎無處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運(yùn)動和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會科學(xué)、自然科學(xué)的聯(lián)系更加緊密,形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。
6.改變了經(jīng)濟(jì)學(xué)的語言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的日本經(jīng)濟(jì)學(xué)家神取道宏(Kandori Michihiro,1997)對保羅·薩繆爾森(Paul Samuelson)的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,那就是‘供給’和‘需求’”,曾做過一個(gè)幽默的引申,他說,“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,那就是納什均衡

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多