博弈论笔记(1)—— 完全信息博弈(施工中)

it2022-05-05  99

基本假设

玩家只关心自己的回报(效益)。玩家是理性的,如果可以,他们会在所有可选项目中选择能最大化他们效益的。玩家不受智力和其他选择上的限制。

即,在该假设下,玩家追求效用最大化。

一般形式(Strategic form)

A set of players N = {1,…,n}. 代表玩家的集合。

Ex: N = {1,2}.

A set of pure strategies Si per player i ∈ N combined to form the strategy space S = S1 ×S2 ×···×Sn. An element s ∈S is called a strategy profile. 纯策略:一个确定性的行动计划。 Si :玩家i的纯策略集,其中包含了玩家i的所有纯策略。 所有玩家的纯策略集组合成为博弈的策略空间。

Ex: Si = {enter, don’t enter} are identical for both players, i.e., S = S1 ×S2 = Si2 .

A set of expected utility payoff fns ui(s ∈ S): ui: S→R. We write u(s) = u1(s),…,un(s). 效用函数集,在确定策略下玩家可获得的收益。

Ex: discrete values ui(e,e) = 1.5, ui(de,de) = 0, i∈{1,2}, and u1(e,de) = 3 = u2(de,e), u1(de,e) = 0 = u2(e,de).

通过以上 {N,S,u} 可以唯一确定某一特定的静态博弈,我们把它称作gsf。

信息矩阵

便于直观展示博弈的内容,矩阵位于2维空间,适用于2名玩家的博弈。 3名玩家的博弈用cube或者多个矩阵表示。

dcd0,04,-1c-1,43,3 其中,列表头代表玩家1的纯策略,行表头代表玩家2的纯策略。矩阵中每一格对应着相应的玩家1和玩家2的策略组合(strategy profile),我们将之称作结果(outcome)。每个结果形如 (u1,u2) ,分别代表着玩家1和玩家2的期望效益。

对称博弈(Symmetry)

博弈的结果只取决于策略组合中的策略,而与该策略是哪位玩家选择的无关。

在对称博弈中,可以通过对一名玩家的策略研究,得到适用于所有玩家的结果。

混合策略

A mixed strategy of player i is a probability distribution σi over i’s pure strategy space Si. We denote by Σi the space of i’s mixed strategies and the full space by Σ = Σ1 ×…×Σn. 混合策略是Si上的一个概率分布。

Ex: S1={a,b},σ1=(σ1(a),σ1(b)),σ1(a)+σ1(b)=1

严格劣势策略

A strategy si ∈Σi is called strictly dominated for player i if there is a σ′ i ∈ Σi such that ui(σ′ i,s−i) > ui(si,s−i) for all s−i ∈ S−i (⋆) where S−i = S1 ×…×Si−1 ×Si+1 ×…×Sn. 如果在其他玩家采取任何策略时,某策略的效用永远低于某另一个确定的策略,则称该低效用的策略为严格劣势策略。

重复剔除劣战略

一名理性的玩家永远不会选择严格劣战略

(I)ESDS:(iterative)elimination of strictly dominated strategies (严格)剔除劣战略

占优可解(dominance solvable):如果严格劣势策略的迭代消除(IESDS)过程中幸存下唯一博弈组合sES,则称该博弈为占优可解的。


最新回复(0)