求真百科欢迎当事人提供第一手真实资料,洗刷冤屈,终结网路霸凌。

正则形式的博弈查看源代码讨论查看历史

事实揭露 揭密真相
跳转至: 导航搜索

来自 搜狐网 的图片

正则形式的博弈是全国科学技术名词审定委员会审定、公布的一个科技名词术语。

语言文字是一个民族文化的结晶。这个民族[1]过去的文化靠着它来流传,未来的文化也仗着它来推进,从大约是在公元前14世纪,殷商后期的“甲骨文”被认为是“汉字”的第一种形式[2]西周后期,汉字发展演变为大篆,后秦始皇统一中国,中国文字才逐渐走上了发展的道路,直至今天。

名词解释

正则形式的博弈(Normal form game)

正则形式的博弈

在博弈论中,正则形式是描述博弈的一种方式。与延展形式不同,正则形式不用图形来描述博弈,而是用矩阵来陈述博弈。与延展形式的表述方式相比,这种方式在识别出严格优势策略和纳什均衡上更有用,但会丢失某些信息。博弈的正则形式的表述方式包括如下部分:每个参与者所有显然的和可能的策略,以及和与其相对应的收益。

在非完美信息的完全静态博弈中,正则形式的表述方式详细地说明了参与者策略空间和收益函数。策略空间是某个参与者的所有可能策略的集合。策略是参与者在博弈的每个阶段——不管在博弈中这个阶段实际上是否会出现——将要采取的行动的完整计划。每个参与者的收益函数,是从参与者策略空间的向量积到该参与者收益集合(一般是实数集,数字表示基数效用或序数效用——在正则形式的表述方式中常常是基数效用)的映射。也就是说,参与者的收益函数把策略组合(所有参与者策略的清单)作为它的输入量,然后输出参与者的收益。

正则形式的使用

占优策略

合作 背叛

合作 2, 2 0, 3

背叛 3, 0 1, 1

收益矩阵有助于剔除劣势策略,而且经常被用于说明这个概念。例如,在囚徒困境中(右图),参与者会发现因为其他人的背叛,合作成了严格劣势策略。参与者会比较每列的第一个数字,在这个例子中,3>2且1>0。这表明无论横排参与者怎样选择,竖排参与者选择背叛都比较好些。类似地,参与者会比较每列的第二个数字,同样也是3>2且1>0。这说明无论竖排参与者怎么做,横排参与者选择背叛都比较好些。这就证明了此博弈唯一的纳什均衡是(背叛,背叛)。

正则形式的连续博弈

一个连续博弈

左,左 左,右 右,左 右,右

顶 4, 3 4, 3 -1, -1 -1, -1

底 0, 0 3, 4 0, 0 3, 4

这些矩阵只表述同时(或者更一般地,信息不完美的)做出行动的博弈。上述矩阵不能表述甲先做出行动,被乙观察到,然后乙再做出行动的博弈。因为在这个例子中,无法确定乙每次的策略。为了表述这种连续博弈,我们要列出乙在博弈进行期间所有的行动——尽管根据实际情况,某种行动决不会出现。和前面一样,在这个博弈中乙有两种选择,左和右。与前面不一样的是,视甲的行动不同而定,乙有四种策略。这些策略是:

1. 如果甲选择顶,选择左;否则,选择左

2. 如果甲选择顶,选择左;否则,选择右

3. 如果甲选择顶,选择右;否则,选择左

4. 如果甲选择定,选择右;否则,选择右

右图是这个博弈的正则形式的表述方式。

参考文献