【零基础学经济Ep146】《西方经济学》经济概念梳理P291:博弈论初步
第十章 博弈论初步
经济主体之间的相互关系有两种重要的类型——
某经济主体的行为对其他经济主体不会产生任何影响,或者,即使有影响,其影响也微不足道,完全可以忽略不计——该经济主体在决定自己行动的时候,就无须考虑其他经济主体的反应;
某经济主体的行为对其他经济主体有重要和显著的影响——该经济主体在采取行动之前,就必须考虑这一行动对其他经济主体的影响,以及由此而引起的其他经济主体的反应。
博弈论的任务:在相互作用、相互影响的环境中如何科学地决策。
第一节 博弈论和策略行为
博弈论:
定义:研究在策略性环境中如何进行策略性决策和采取策略性行为的科学。
策略性环境:每个人进行的决策和采取的行动都会对其他人产生显著的影响;
策略性决策和策略性行动:每个人都要根据其他人的可能反应来决定自己的决策和行动——不同于非策略性的环境、决策和行动;
作用:分析寡头厂商行为的一个恰当工具;
三个基本要素:
参与人(或称局中人):在博弈中进行决策的主体,参与人通过在博弈中选择最优的决策和行动来使自己的目标函数(如效用或利润)达到最大;
参与人的策略:一项规则,根据该规则,参与人在博弈的每一时点上决定如何行动——至少两个;
参与人的支付:在所有参与人都选择了各自的策略且博弈已经完成之后,参与人所得到的结果(如效用或利润)。
分类:
参与人的数量:二人博弈、多人博弈;
参与人拥有的策略的数量:有限博弈、无限博弈;
参与人的支付情况:零(常)和博弈、非零(常)和博弈;
参与人是否能够达成有效的契约:合作博弈、非合作博弈;
参与人是否了解有关博弈的所有信息(如所有参与人的策略和支付等):完全信息博弈、非完全信息博弈;
参与人在策略的实施上是否具有“同时性”:静态博弈(或同时博弈)、动态博弈(或序贯博弈);
考虑最后两个有关信息和时间的划分标准:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。
讨论对象:参与人为两个、每个参与人都只有两个策略的完全信息博弈——
静态博弈是参与人同时进行决策或行动的博弈;
动态博弈是参与人的决策和行动有先有后的博弈;
“同时”/“先后”:参与人在决策时是否已经知道其他参与人的决策,而并不一定取决于物理意义上的时间。
第二节 完全信息静态博弈:纯策略均衡
a.例子:寡头博弈
关系:
甲合作、乙合作:分别得5、6个单位的支付;
甲合作、乙不合作:分别得1、5个单位的支付;
甲不合作、乙合作:分别得7、1个单位的支付;
甲不合作、乙不合作:分别得2、3个单位的支付;
b.支付矩阵
定义:一个只有两人参加且两人同时进行决策的简单博弈,可以以二元数组为元素的矩阵来描述和分析,称为博弈矩阵或支付矩阵。
c.条件策略和条件策略组合
定义:
条件策略:一个厂商在给定条件下的最优策略,叫做该厂商的条件优势策略(或相对优势策略),简称条件策略;
条件策略组合:包括参与人的条件策略以及这些条件在内的优势策略组合。
d.纳什均衡
定义:
均衡:当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单独改变策略的倾向时,整个博弈就达到了均衡——博弈均衡时博弈各方最终选取的策略组合,是博弈的最终结果,是博弈的解;
纳什均衡:指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处;两个问题——
“单独改变策略”:任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略;
“不会得到好处”:任何一个参与人在单独改变策略之后这种情况下(即支付不变时),由于存在改变的成本和风险,参与人也不愿意单独改变策略。
e.寻找纳什均衡的方法——条件策略下的划线法
五个步骤:
把整个的支付矩阵分解为甲厂商的支付矩阵和乙厂商的支付矩阵;
在甲厂商的支付矩阵中,找出每一列的最大者(每列的最大者可能不止一个);
在乙厂商的支付矩阵中,找出每一行的最大者(每行的最大者可能不止一个);
将已经画好线的甲厂商的支付矩阵和乙厂商的支付矩阵合并起来,得到一个向量的支付矩阵;
在带有下划线的整个支付矩阵中,找到两个数字之下均画有线的支付组合。
f.纳什均衡的存在性、唯一性、稳定性和最优性
f.1存在性
含义:在完全信息静态博弈中,(纯策略的)纳什均衡既可能存在,也可能不存在。
注意:在不存在纯策略纳什均衡中,两个厂商对策略的选择会出现一种永不停歇的周期状态。
f.2唯一性
含义:在完全信息静态博弈中,如果纳什均衡存在,则它既可能是唯一的,也可能是不唯一的。
注意:当纳什均衡不存在或不唯一时,我们无法对博弈的最终结果作出肯定的说明。
f.3稳定性
含义:在完全信息静态博弈中,如果纳什均衡存在,则它既可能是稳定的,也可能是不稳定的。
注意:在存在多个纳什均衡的条件下,稳定均衡和不稳定均衡也可能同时出现。
f.4最优性
含义:在完全信息静态博弈中,如果纳什均衡存在,则它既可能是最优的,也可能不是最优的。
g.纳什均衡和社会福利
g.1囚徒困境和寡头合作的不稳定性
结论:
纳什均衡是存在的;
存在唯一的纳什均衡;
只有唯一一个稳定的非最优纳什均衡。
启示:寡头市场的一个重要特征,即寡头厂商之间合作的不稳定性——与囚徒困境的情况一样,寡头之间这种合作(如共谋垄断)的不稳定性尽管对参与人不利,但有利于促进竞争,从而提高整个社会的福利。
g.2广告大战
结论:广告大战中,纳什均衡不仅对参与人不是最优的——因为他们没有得到都不做广告的更好的结果;而且对整个社会不是最优的——因为在很大程度上,可口可乐和百事可乐之间的竞争是一种纯粹的资源浪费。
第三节 完全信息静态博弈:混合策略均衡
内容:即使纯策略纳什均衡不存在,相应的混合策略纳什均衡也会存在。
重点:纯策略纳什均衡往往作为特例包括中混合策略纳什均衡中。
a.不存在纯策略均衡时的混合策略均衡
a.1混合策略
现实:人们对策略的选择常常并不是“非此即彼”的,而是以一定的可能性来选择某个策略。
定义:将”非此即彼“的策略称为纯策略,把它们赋予这些纯策略概率的向量叫做混合策略。
特点:与原来的纯策略不同,现在的混合策略不再是有限的,而成为无限的,同样,混合策略组合也不再是有限的,而成为无限的;在一个博弈中,纯策略可以是有限的,但以有限的纯策略为基础的混合策略却一定是无限的——源于概率取值的无限性。
a.2混合策略组合
定义:混合策略的组合。
特点:与纯策略组合不同,混合策略组合是一个概率向量组合,其中,每一个概率向量都是相应参与人的一个混合策略。
a.3期望支付
背景:在混合策略博弈中,对于每一个混合策略组合,也都存在着一个支付组合,其中,每一项也都是相应参与人在该混合策略组合条件下所得到的支付,由于现在每个参与人都是以一定的概率选择其纯策略,故相应的支付也就成了所谓的期望支付。
定义:支付的期望值。
a.4条件混合策略
定义:甲厂商在乙厂商选择某个既定的混合策略时所选择的可以使其期望支付达到最大的混合策略。
a.5混合策略的纳什均衡
条件:两个厂商的条件混合策略曲线的交点代表了混合策略博弈的纳什均衡。
存在性定理:在每一个参与人都只有有限多个纯策略的博弈中,至少存在一个混合策略纳什均衡。
b.只有一个纯策略均衡时的混合策略均衡
情况:原来的纯策略博弈中的纳什均衡现在被作为特例包括到了混合策略纳什均衡之中,只有一个交点。
c.具有多个纯策略均衡时的混合策略均衡
情况:有两个纯策略那是均衡的博弈模型对应的两条曲线有三个交点。
d.具有无穷多个混合策略均衡的博弈
情况:具有任意有限多个纯策略的博弈至多存在无穷多个混合策略纳什均衡。
第四节 完全信息动态博弈
情况:参与人的决策有先有后,特别是,后行动的参与人可以观察到先行动的参与人已经采取了的策略。
a.例子:竞争者—垄断者博弈
在该博弈中——
竞争者先决策:他决定进入还是不进入此由垄断者独霸的市场;
垄断者后决策:他根据竞争者的行动决定对其“容忍”还是“抵抗”。
b.博弈树
博弈树
作用:分析完全信息动态博弈的工具;
名词:博弈树模型又称为扩展式博弈模型,以博弈树来描述的完全信息动态博弈又叫做扩展型博弈;
组成:
起点:初始决策点,通常只有一个,是完全信息动态博弈开始的地方,是博弈的最先行动或者进行决策的地方;
初始决策点向右伸展的两条线段:竞争者可以采取的两个行动或策略;
中间点:中间决策点,至少两个,由于假定在竞争者的初始决策之后紧跟着的是垄断者的决策,故这些中间决策点都属于垄断者;
终点:博弈结束的地方,不是决策点,不属于任何参与人,两层含义——
博弈的一个策略组合;
与某个策略组合相应的一个支付组合。
c.纳什均衡
定义:参与者都不会单独改变自己的策略,否则所得支付会下降。
特点:也可能不止一个纳什均衡。
d.纳什均衡的精炼:逆向归纳法
定义:从众多的纳什均衡中进一步确定“更好”的纳什均衡。
方法:逆向归纳法——
先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到博弈的一个简化博弈;
对简化博弈重复第一步骤的程序,直到最后,得到原博弈的一个最简博弈——原博弈的解。
“先动优势”:先行动者的得益大于后行动者。
完全信息动态博弈和完全信息静态博弈的一个重要的区别:
当博弈是“同时”的时候,如果出现多重纳什博弈,常常无法确定最终实现的是哪一个纳什均衡;
当博弈是“有先有后”的时候,即使纳什均衡是多重的,往往也能够从中确定一个最终的均衡;
原因:与完全信息静态博弈相比,完全信息动态博弈提供了更多的信息——关于参与人决策秩序的信息。
e.精炼的纳什均衡与效率
结论:对参与人来说,由逆向归纳法“精炼”出来的完全信息动态博弈的纳什均衡也不一定是有效率的。
“蜈蚣博弈”:每个参与人在轮到自己选择时,总是觉得“卖”,结果使得博弈“一开始就结束”——参与人放弃了有可能得到更高净收益的机会。

