博弈論Lecture7

昵稱55050614 2018-11-21

展開(kāi)全文

知識(shí)安排：

個(gè)體理性決策（已學(xué)習(xí)）

博弈的表示理論（在學(xué)習(xí)）

博弈的解的理論（solution)

博弈的表示理論

1、展開(kāi)型（extensive form)——強(qiáng)調(diào)過(guò)程

組成：（1）博弈者-即博弈者的行動(dòng)順序

（2）自然的行為選擇-由局部行動(dòng)集作出行為選擇

（3）信息集（信息完美，信息完全）

（4）自然的行動(dòng)-考慮到參與者賦予自然的先驗(yàn)概率

（5）Pay off function-即utinity function

流程：自然行動(dòng)-結(jié)果-評(píng)價(jià)-Pay off function

For example:

終節(jié)點(diǎn)- 結(jié)果-效用評(píng)價(jià)

賄賂 ————被告

不賄賂————70 0

原告

賄賂————0 70

不賄賂————被告

不賄賂 ————60 40

決策節(jié)點(diǎn)—自然選擇，節(jié)點(diǎn)前的虛線代表被告不知道前面發(fā)生了什么，這是一種信息不完美

		被告
		賄	不
原告	賄	30，10	70，0
	不	0，70	60，40

是一種，理論動(dòng)態(tài)（按順序行動(dòng)），經(jīng)驗(yàn)靜態(tài)（行動(dòng)者只做一次行為選擇，相當(dāng)于同時(shí)行動(dòng)）的博弈。

2.策略性（strategic form）-對(duì)一個(gè)策略互動(dòng)博弈的最基本描述（用符號(hào)G代替）

G的組成：

I :博弈者的集合——原告和被告

A i € I: 純策略集合，行動(dòng)集——原告的賄賂和不賄賂，被告的賄賂和不賄賂

F i € I: ×A i (i€I )→R：一個(gè)pay off function 建立在所有Ai集合的笛卡爾積。此處的笛卡爾積是所有可能結(jié)果的配對(duì)。

（笛卡兒積即笛卡爾乘積是指在數(shù)學(xué)中，兩個(gè)集合 X和Y的笛卡尓積（Cartesian product），又稱直積，表示為X × Y，第一個(gè)對(duì)象是X的成員而第二個(gè)對(duì)象是Y的所有可能有序?qū)?/span> 的其中一個(gè)成員）

3.經(jīng)驗(yàn)意義上的靜態(tài)博弈——同時(shí)行動(dòng)的博弈——games of simultaneous moves

（1）首先，沒(méi)有完全靜態(tài)的博弈

（2）定義：只做一次行動(dòng)，不知道對(duì)方行動(dòng)，前不知后，后不知前，可以看作同時(shí)行動(dòng)

原告相當(dāng)于被告

（3）靜態(tài)博弈一般是信息完全的

4.信息完美與信息完全

（1）從展開(kāi)型看信息完美：

接上面例子：只要你行動(dòng)的時(shí)候，對(duì)過(guò)去發(fā)生的事情都了解（被告知道了原告是否賄賂）

（2）從經(jīng)典博弈論看信息完全：

在經(jīng)典博弈論中，假設(shè)參與者是理性而又智能的人（即了解信息多，明白整個(gè)博弈的表示，會(huì)有不完美的信息，但他知道他不懂的地方是哪里）

認(rèn)為，博弈結(jié)構(gòu)表示（比賽規(guī)則）是博弈者之間的commom konwledge，這就是信息完全的假設(shè)。所以在理論上，經(jīng)典博弈論研究的都是信息完全。雖然有信息不完美，但是可以信息完全。

（3）經(jīng)驗(yàn)意義上的信息不完全：

在G : I A F 中存在三種情況

I : 知人知面不知心。A:在給與不給朋友抄襲中，他選擇了告訴老師。明槍暗箭。F:面對(duì)同樣結(jié)果，對(duì)于對(duì)方的效用不了解。

（4）信息不完全導(dǎo)致了效u的信息不完全，對(duì)于不同的博弈者會(huì)有不同的類型。經(jīng)驗(yàn)意義上的信息不完全會(huì)轉(zhuǎn)化為理論上的信息不完美博弈?！蘸笊钊雽W(xué)習(xí)（本人沒(méi)有聽(tīng)懂）

5.策略間的兩種關(guān)系：

知識(shí)準(zhǔn)備：

G: I ——A(行動(dòng)集）——Si（策略集）(Si>A) : 其中 Si=Δ（Ai) 即行動(dòng)所有概率分布集，分為混合策略（mixed)和純策略（pure)。

例如：在原告中：賄賂、不賄賂，找大官二叔，這就是一個(gè)混合策略，以正的概率使用兩個(gè)或兩個(gè)以上的行動(dòng)，“0.1、0.5”——在博弈者的plan of action中，即一個(gè)人在具體的情況下，有一個(gè)可欲的行動(dòng)集，在選擇規(guī)則作用下，在可欲行動(dòng)集中以一個(gè)概率選擇某一行動(dòng)。賄賂就是一種純策略。

保持策略的模糊性、不確定性意味著混合策略。

（1）同一個(gè)博弈者的不同策略間的優(yōu)超關(guān)系-dominance

符號(hào)引入：i 即 myself. Si Si'€Si，Si、Si'即同一個(gè)博弈者的不同策略

當(dāng)Si dominates Si'，

則?S-i.€S-i. (-i除了i外的其他人，即對(duì)于對(duì)手的所有策略） Fi(Si.S-i)>Fi(Si'.S-i)（Si應(yīng)付對(duì)手S-i所帶來(lái)的支付函數(shù)）

混合策略：

舉例：2/3賄賂+1/3不賄賂——S-i.

1/4賄賂+3/4不賄賂——Si.

則：2/3x1/4x30（賄賂，賄賂）+2/3x3/4x70（賄賂，不賄賂）+1/3x1/4x0（不賄賂，賄賂）+1/3x3/4x60（不賄賂，不賄賂）

加起來(lái)，就是原告應(yīng)付被告所得到的期望效用

或者：

=∑Si(am)xS-i(ak)xFi(amxak)——Si(am)即am出現(xiàn)的概率，S-i(ak)即ak出現(xiàn)的概率。

（am，ak）€（Ai,A-i)

以上，將期望效用用函數(shù)建立在策略組合之下

所以：Si' dominated str——被優(yōu)超或者劣次優(yōu)超

如果這個(gè)對(duì)手的策略是一個(gè)無(wú)限多集合，那么這個(gè)定義可以簡(jiǎn)化為： Fi(Si.S-i)>Fi(Si'.S-i)

純策略：

檢驗(yàn)一個(gè)純策略優(yōu)超于另外一個(gè)純策略，利用期望效用的函數(shù)的線性關(guān)系。

舉例：論證賄賂優(yōu)超于不賄賂

1.應(yīng)對(duì)對(duì)方賄賂時(shí)，（賄賂，賄賂）>（不賄賂，賄賂）

應(yīng)對(duì)對(duì)方不賄賂時(shí)，（賄賂，不賄賂）>（不賄賂，不賄賂）

2.對(duì)方采取混合策略，我方采取純策略：

1/4（賄賂，賄賂）>1/4（不賄賂，賄賂）

3/4（賄賂，不賄賂）>3/4（不賄賂，不賄賂）

推廣開(kāi)來(lái)：

比較同一博弈者的不同策略

（賄賂，q賄賂+(1-q)不賄賂）>（1/2賄賂+1/2不賄賂，q賄賂+(1-q)不賄賂）

根本在于期望值的計(jì)算

注意：優(yōu)超只定義在對(duì)手的行動(dòng)組合上

劣策略：

以正的概率使用一個(gè)劣策略，這個(gè)混合策略是一個(gè)劣策略

舉例：買餃子可能買到少鹽或多鹽的，我喜歡面條

我以1/2的概率買餃子（以正的概率使用一個(gè)劣策略），我以1/2的概率買面條，這是一個(gè)劣策略

舉例：

		乙
		左	右
甲	上	3，-	0，-
	下	0，-	3，-
	中	1，-	1，-

中不會(huì)被上下超越，只是一個(gè)劣策略，中會(huì)被一個(gè)混合策略（1/2上，1/2下超過(guò)

F（中，左）=1 > F(1/2上，1/2下，左）=1/2x3+1/2x0=3/2,此時(shí)，用中應(yīng)付左不如以1/2上和1/2下應(yīng)付左好。

當(dāng)數(shù)值改變，會(huì)發(fā)生不同后果。

占優(yōu)策略-dominant stragedy

一個(gè)博弈者只有一個(gè)純策略，這個(gè)純策略優(yōu)于所有行動(dòng)純策略，這就是一個(gè)占優(yōu)策略。

例如：原告賄賂就是一個(gè)占優(yōu)策略。

在此角度下看，個(gè)體理性決策

根據(jù)效用最大化，一個(gè)理性的博弈者，有劣策略，是不會(huì)使用劣策略的；有占優(yōu)策略，他應(yīng)該使用占優(yōu)策略。

下集預(yù)告：

劣策略的刪除

最優(yōu)反應(yīng)關(guān)系的納什均衡

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：昵稱55050614 > 《博弈論》

舉報(bào)/認(rèn)領(lǐng)