(每个参与者在的点称为
信息
集,每一个“
博弈
树终端”有各个参与者的收益情况。)
完美
信息
perfect
若每一个参与者采取行动时准确的掌握其他人的行动以及在采取行动之前其他参与人的行动,则称该
博弈
信息
是完美
信息
博弈
;是一个关于其他局中人行动的
完全
知识的状态;
典型例子:国际象棋,围棋,斯坦伯格模型
完全
信息
complete
博弈
中全部参与者的共同知识是整个
博弈
的规则、策略及、效用函数等但并不知道对手的动作。
引入虚拟的参与人-“自然”(nature);自然首先行动决定参与人的特征(成本函数),参与人知道自己的特征,其他参与人不知道。这样,上述不
完全
信息
博弈
就转换为
完全
但不完美
信息
博弈
(game of complete but imperfect inf ormation)。·将对得益的不了解转化为对类型的不了解。·在不
完全
信息
静态
博弈
中,参与人的行动空间可能依赖于它的类型,行动空间是类型依存的( type - contingent)。G={A1,A2,⋯ ,An;t1,t2,⋯ ,tn;p1,p2,⋯ ,pn;
(书接上文)纯化定理( purification theorem;Harsanyi,1973):
完全
信息
静态
博弈
中的一个混合战略
博弈
几乎总是可以被解释成一个有少量不
完全
信息
的近似
博弈
的一个纯战略贝叶斯纳什均衡。
进一步可理解成“一个混合战略纳什均衡的根本特征不是参与人以随机的方法选择战略(即行为),而是各参与人对其他参与人的选择不能确定,这种不确定性既可以是随机性引起,也可以是少量
信息
的不
完全
性引起。”
(大白话翻译就是:一个混合战略的纳什均衡可以简单的分成几个纯战略纳什均衡问题)【例题】夫妻之争
先看一个
完全
信息
的动态
博弈
过程:
本题的描述为:
已经在市场中进行销售行为的是在位者,他会通过调整价格来达到两个结果:在下一轮影响进入者是否进入的决策;以及影响自己在本轮的收益情况。
最下面给出了竖着的两行得益,第一行是在第一阶段,进入者还没有进入的时候,在位者的收益,可以看到由于在位者不同的价格选择,他的得益值会有所波动。并且由于第一轮进入者还没有进入,所以进入者的收益一直为0。
第二阶段进入者会根据上一轮在位者的定价选择是否进入市场,然后第二行所显示的收益就是第二轮进入者
其一是六子棋问题;
其二是麻将AI问题;
前者是经典的
完全
信息
博弈
问题,根据我已有的知识,利用
博弈
树和合理的剪枝可以提供一种高效的解法(当然只是框架思路,具体实现会伴随各种细节问题)
而对于后者,也就是不
完全
信息
博弈
,目前大二的博主基本没有任何相对应的知识储备,也正是出于想扩展自己的专业知识这样一种想法,博主与另外...
海萨尼转换指的是把不确定性条件下的选择转换为风险条件下的选择。
如果一些局中人不知道另一些局中人的支付函数,或支付函数不是共同知识,局中人就不知道他在与谁
博弈
,
博弈
的规则是没有定义的。
每个局中人知道自己的特征,但不知道别的局中人特征。
第一个阶段是自然N的行动选择,第二阶段是除N外的局中人的
静态
博弈
。
这种方法将不
完全
信息
静态
博弈
变成一个两阶段动态
博弈
,这种转换被称为“海萨尼转换”,这个转换把“不
完全
信息
”转变成为
完全
但不完美
信息
,从而可以用分析
完全
信息
博弈
的方法进行分析。
1967年,海萨尼(John
1、
博弈论
概念
博弈论
(Game Theory),
博弈论
是指研究多个个体或团队之间在特定条件制约下的对局中利用相关方的策略,而实施对应策略的学科。有时也称为对策论,或者赛局理论,是研究具有斗争或竞争性质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一个新分支,也是运筹学的一个重要学科。目前在生物学、经济学、国际关系学、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构(游戏或者
博弈
(Game))间的相互作用。
2、
博弈论
分类
3、部分
博弈论
术语解释
1)合作
博弈
纳什均衡定义:纳什均衡描述了一种策略组合,在这种组合中,任何一个参与者都无法通过单方面改变自己的策略来获得更好的结果。即,在给定别人策略的情况下,没有人有足够理由打破这种均衡。本质:一种基于占优策略的策略组合。在
完全
信息
静态
博弈
中,如果每个参与者的策略都是对其他参与者策略的最佳回应,则这个策略组合就构成了纳什均衡。贝叶斯均衡(通常指贝叶斯纳什均衡)定义:贝叶斯纳什均衡是不
完全
信息
静态
博弈
中的一种均衡状态。在这种
博弈
中,参与人同时行动,且没有机会观察到别人的选择。