免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

博弈論Lecture7

 昵稱55050614 2018-11-21

知識(shí)安排:

個(gè)體理性決策(已學(xué)習(xí))

博弈的表示理論(在學(xué)習(xí))

博弈的解的理論(solution)

 

博弈的表示理論

1、展開(kāi)型(extensive form)——強(qiáng)調(diào)過(guò)程

組成:(1)博弈者-即博弈者的行動(dòng)順序

         (2)自然的行為選擇-由局部行動(dòng)集作出行為選擇

         (3)信息集(信息完美,信息完全)

         (4)自然的行動(dòng)-考慮到參與者賦予自然的先驗(yàn)概率

         (5)Pay off function-即utinity function

流程:自然行動(dòng)-結(jié)果-評(píng)價(jià)-Pay off function

For example:

                                      終節(jié)點(diǎn)- 結(jié)果-效用評(píng)價(jià)

         

       賄賂  ————被告

                                     不賄賂————70   0                  

原告

                                       賄賂————0  70

       不賄賂————被告

                                      不賄賂 ————60 40

       決策節(jié)點(diǎn)—自然選擇  ,節(jié)點(diǎn)前的虛線代表被告不知道前面發(fā)生了什么,這是一種信息不完美

 

 

被告

 

 

 

原告

30,10

70,0

 

0,70

60,40

 

是一種,理論動(dòng)態(tài)(按順序行動(dòng)),經(jīng)驗(yàn)靜態(tài)(行動(dòng)者只做一次行為選擇,相當(dāng)于同時(shí)行動(dòng))的博弈。

 

2.策略性(strategic form)-對(duì)一個(gè)策略互動(dòng)博弈的最基本描述(用符號(hào)G代替)

G的組成:

 I :博弈者的集合——原告和被告

 A i € I: 純策略集合,行動(dòng)集——原告的賄賂和不賄賂,被告的賄賂和不賄賂

 F  i € I: ×A i (i€I )R:一個(gè)pay off function 建立 在所有Ai集合的笛卡爾積。此處的笛卡爾積是所有可能結(jié)果的配對(duì)。

(笛卡兒積即笛卡爾乘積是指在數(shù)學(xué)中,兩個(gè)集合 XY的笛卡尓積(Cartesian product),又稱直積 ,表示為X × Y,第一個(gè)對(duì)象是X的成員而第二個(gè)對(duì)象是Y的所有可能有序?qū)?/span> 的其中一個(gè)成員)

 

3.經(jīng)驗(yàn)意義上的靜態(tài)博弈——同時(shí)行動(dòng)的博弈——games of simultaneous moves

(1)首先,沒(méi)有完全靜態(tài)的博弈

(2)定義:只做一次行動(dòng),不知道對(duì)方行動(dòng),前不知后,后不知前,可以看作同時(shí)行動(dòng)

 

原告                     相當(dāng)于         被告

                        

(3)靜態(tài)博弈一般是信息完全的

 

4.信息完美與信息完全

(1)從展開(kāi)型看信息完美:

     接上面例子:只要你行動(dòng)的時(shí)候,對(duì)過(guò)去發(fā)生的事情都了解(被告知道了原告是否賄賂)

(2)從經(jīng)典博弈論看信息完全:

      在經(jīng)典博弈論中,假設(shè)參與者是理性而又智能的人(即了解信息多,明白整個(gè)博弈的表示,會(huì)有不完美的信息,但他知道他不懂的地方是哪里)

      認(rèn)為,博弈結(jié)構(gòu)表示(比賽規(guī)則)是博弈者之間的commom konwledge,這就是信息完全的假設(shè)。所以在理論上,經(jīng)典博弈論研究的都是信息完全。雖然有信息不完美,但是可以信息完全。

(3)經(jīng)驗(yàn)意義上的信息不完全:

      在G : I A F 中存在三種情況

I : 知人知面不知心。A:在給與不給朋友抄襲中,他選擇了告訴老師。明槍暗箭。F:面對(duì)同樣結(jié)果,對(duì)于對(duì)方的效用不了解。  

 

(4)信息不完全導(dǎo)致了效u的信息不完全,對(duì)于不同的博弈者會(huì)有不同的類型。經(jīng)驗(yàn)意義上的信息不完全會(huì)轉(zhuǎn)化為理論上的信息不完美博弈?!蘸笊钊雽W(xué)習(xí)(本人沒(méi)有聽(tīng)懂)

 

5.策略間的兩種關(guān)系:

知識(shí)準(zhǔn)備:

G: I ——A(行動(dòng)集)——Si(策略集)(Si>A) : 其中 Si=Δ(Ai) 即 行動(dòng)所有概率分布集,分為混合策略(mixed)和純策略(pure)。

 

例如:在原告中:賄賂、不賄賂,找大官二叔,這就是一個(gè)混合策略,以正的概率使用兩個(gè)或兩個(gè)以上的行動(dòng),“0.1、0.5”——在博弈者的plan of action中,即一個(gè)人在具體的情況下,有一個(gè)可欲的行動(dòng)集,在選擇規(guī)則作用下,在可欲行動(dòng)集中以一個(gè)概率選擇某一行動(dòng)。賄賂就是一種純策略。

保持策略的模糊性、不確定性意味著混合策略。

 

(1)同一個(gè)博弈者的不同策略間的優(yōu)超關(guān)系-dominance

符號(hào)引入:i 即  myself.     Si Si'€Si,Si、Si'即同一個(gè)博弈者的不同策略

當(dāng)Si dominates Si',

?S-i.€S-i. (-i除了i外的其他人,即對(duì)于對(duì)手的所有策略)  Fi(Si.S-i)>Fi(Si'.S-i)(Si應(yīng)付對(duì)手S-i所帶來(lái)的支付函數(shù))

混合策略:

舉例:2/3賄賂+1/3不賄賂——S-i.

         1/4賄賂+3/4不賄賂——Si.

則:2/3x1/4x30(賄賂,賄賂)+2/3x3/4x70(賄賂,不賄賂)+1/3x1/4x0(不賄賂,賄賂)+1/3x3/4x60(不賄賂,不賄賂)

加起來(lái),就是原告應(yīng)付被告所得到的期望效用

 

或者:

=∑Si(am)xS-i(ak)xFi(amxak)——Si(am)即am出現(xiàn)的概率,S-i(ak)即ak出現(xiàn)的概率。

am,ak)€(Ai,A-i)

以上,將期望效用 用函數(shù)建立在策略組合之下

所以:Si' dominated str——被優(yōu)超或者劣次優(yōu)超

如果這個(gè)對(duì)手的策略是一個(gè)無(wú)限多集合,那么這個(gè)定義可以簡(jiǎn)化為: Fi(Si.S-i)>Fi(Si'.S-i)

 

純策略:

檢驗(yàn)一個(gè)純策略優(yōu)超于另外一個(gè)純策略,利用期望效用的函數(shù)的線性關(guān)系。

 

舉例:論證賄賂優(yōu)超于不賄賂

1.應(yīng)對(duì)對(duì)方賄賂時(shí),(賄賂,賄賂)>(不賄賂,賄賂)

 應(yīng)對(duì)對(duì)方不賄賂時(shí),(賄賂,不賄賂)>(不賄賂,不賄賂)

2.對(duì)方采取混合策略,我方采取純策略:

1/4(賄賂,賄賂)>1/4(不賄賂,賄賂)

3/4(賄賂,不賄賂)>3/4(不賄賂,不賄賂)

推廣開(kāi)來(lái):

比較同一博弈者的不同策略

(賄賂,q賄賂+(1-q)不賄賂)>(1/2賄賂+1/2不賄賂,q賄賂+(1-q)不賄賂)

根本在于期望值的計(jì)算

注意:優(yōu)超只定義在對(duì)手的行動(dòng)組合上

 

劣策略:

以正的概率使用一個(gè)劣策略,這個(gè)混合策略是一個(gè)劣策略

舉例:買餃子可能買到少鹽或多鹽的,我喜歡面條

我以1/2的概率買餃子(以正的概率使用一個(gè)劣策略),我以1/2的概率買面條,這是一個(gè)劣策略

舉例:

 

 

 

 

 

3,-

0,-

 

0,-

3,-

 

1,-

1,-

中不會(huì)被上下超越,只是一個(gè)劣策略,中會(huì)被一個(gè)混合策略(1/2上,1/2下超過(guò)

 

F(中,左)=1 > F(1/2上,1/2下,左)=1/2x3+1/2x0=3/2,此時(shí),用中應(yīng)付左不如以1/2上和1/2下應(yīng)付左好。

當(dāng)數(shù)值改變,會(huì)發(fā)生不同后果。

占優(yōu)策略-dominant stragedy

一個(gè)博弈者只有一個(gè)純策略,這個(gè)純策略優(yōu)于所有行動(dòng)純策略,這就是一個(gè)占優(yōu)策略。

例如:原告賄賂就是一個(gè)占優(yōu)策略。

在此角度下看,個(gè)體理性決策

根據(jù)效用最大化,一個(gè)理性的博弈者,有劣策略,是不會(huì)使用劣策略的;有占優(yōu)策略,他應(yīng)該使用占優(yōu)策略。

下集預(yù)告:

劣策略的刪除

最優(yōu)反應(yīng)關(guān)系的納什均衡

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多