博弈论笔记（1）—— 完全信息博弈（施工中）

it2022-05-05 102

基本假设

玩家只关心自己的回报（效益）。玩家是理性的，如果可以，他们会在所有可选项目中选择能最大化他们效益的。玩家不受智力和其他选择上的限制。

即，在该假设下，玩家追求效用最大化。

一般形式（Strategic form）

A set of players N = {1,…,n}. 代表玩家的集合。

Ex: N = {1,2}.

A set of pure strategies S_i per player i ∈ N combined to form the strategy space S = S₁ ×S₂ ×···×S_n. An element s ∈S is called a strategy proﬁle. 纯策略：一个确定性的行动计划。 S_i ：玩家i的纯策略集，其中包含了玩家i的所有纯策略。所有玩家的纯策略集组合成为博弈的策略空间。

Ex: S_i = {enter, don’t enter} are identical for both players, i.e., S = S₁ ×S₂ = S_i² .

A set of expected utility payoﬀ fns u_i(s ∈ S): u_i: S→R. We write u(s) = u₁(s),…,u_n(s). 效用函数集，在确定策略下玩家可获得的收益。

Ex: discrete values u_i(e,e) = 1.5, u_i(de,de) = 0, i∈{1,2}, and u₁(e,de) = 3 = u₂(de,e), u₁(de,e) = 0 = u₂(e,de).

通过以上 {N,S,u} 可以唯一确定某一特定的静态博弈，我们把它称作gsf。

信息矩阵

便于直观展示博弈的内容，矩阵位于2维空间，适用于2名玩家的博弈。 3名玩家的博弈用cube或者多个矩阵表示。

dcd0,04,-1c-1,43,3 其中，列表头代表玩家1的纯策略，行表头代表玩家2的纯策略。矩阵中每一格对应着相应的玩家1和玩家2的策略组合（strategy proﬁle），我们将之称作结果（outcome）。每个结果形如 (u₁,u₂) ，分别代表着玩家1和玩家2的期望效益。

对称博弈（Symmetry）

博弈的结果只取决于策略组合中的策略，而与该策略是哪位玩家选择的无关。

在对称博弈中，可以通过对一名玩家的策略研究，得到适用于所有玩家的结果。

混合策略

A mixed strategy of player i is a probability distribution σ_i over i’s pure strategy space S_i. We denote by Σ_i the space of i’s mixed strategies and the full space by Σ = Σ₁ ×…×Σ_n. 混合策略是S_i上的一个概率分布。

Ex: S₁={a,b}，σ₁=(σ₁(a),σ₁(b))，σ₁(a)+σ₁(b)=1

严格劣势策略

A strategy s_i ∈Σ_i is called strictly dominated for player i if there is a σ′ _i ∈ Σ_i such that u_i(σ′ _i,s_−i) > u_i(s_i,s_−i) for all s_−i ∈ S_−i (⋆) where S_−i = S₁ ×…×S_i−1 ×S_i+1 ×…×S_n. 如果在其他玩家采取任何策略时，某策略的效用永远低于某另一个确定的策略，则称该低效用的策略为严格劣势策略。

重复剔除劣战略

一名理性的玩家永远不会选择严格劣战略

（I）ESDS：（iterative）elimination of strictly dominated strategies （严格）剔除劣战略

占优可解（dominance solvable）：如果严格劣势策略的迭代消除(IESDS)过程中幸存下唯一博弈组合s^ES，则称该博弈为占优可解的。

专利

最新回复(0)