【博弈论】耶鲁大学公开课(中英双语字幕)

第一到三节课笔记

Imperfect competition👆
行为(自己的&其他人的)影响结果
博弈论:经济学 政治学 法学 生物学(生物进化论) 体育
(中间有介绍录播的回事)
评分标准🔼
Problem set习题集
推荐书本🔽

更难一些🔽

课本只是救命稻草,课下想深入可以看对应章节。

睡前读物🔽

这课有趣,但又有点难:因为学习博弈论需要通过一些游戏来学习

游戏I(成绩博弈)
分为两两一组,每个人选择α或者β
你选α,对手选β,你得A对手C
都选α,都得B-;都选β,都得B+
你选β,对手选α,你得C对手A
博弈论思考方式是像右边的表格🔽(矩阵)

涉及行为 策略 参与人(神学:考虑他人)

要了解动机和收益Payoff,才能真正分析
数字代表效用或功利🔽

英格兰叫法:饭桶恶魔Evil gits (只考虑自己)


从Dominated strategy里面总结:
结论1⃣Don't play a strictly dominated strategy
🔼原因🔽

如果我在每次选了优势策略dominate it,我在每次博弈都能得到更好的收益。
不管别人怎么选择,我总得到更好的结果。
🔼漏洞:不管我选了什么,都不会/会影响你。
在超现实状态了。
🔼漏洞:如果我说服你选β,我选择α,那么我可以收获3效用
就算上条可行,我仍然选择α
结论2⃣Rational Choice can lead to outcomes that"Suck"(美国人说的“糟糕”)

在经济学里面,会导致Inefficient=Pareto Inefficient
都不选择最坏就会是次优
著名案例:囚徒困境Prisoner's Dilemma
eg.期末、年末的时候,寝室会乱,因为没有人打扫,都指望别人。
离婚纠纷🔼

经济学案例🔼Price War

怎么化解?🔼
1.Collusion串通-Contract合同(Illegal 无效)
2.Enforceable强制性
3.重复--可以达成协议 沟通 互相相信
(我想到石头剪刀布也是同理)
神学院
收益不同?
列出可能的收益Possible Playoff

就叫(起名)Evil gits 饭桶恶魔👿(只考虑自己)
和 Indignant angels愤怒的天使(考虑别人)

由于罪恶感最后从收益3到-1 道德谴责



🔼这种叫做“协和谬误Coordination Problem”
⏯注意收益的重要性
⏩结论:收益很重要
在博弈中当一件事情参与者已经投入了一定的成本和精力之后,发现进行下去的结果是不易进行下去的低效率,低回报时,却因各种因素而不停止事件的进行,继续做这件事,此时便是 博弈论 中的“协和谬误”。(搜狗百科)【有点像SUNK COST】

🔼逻辑上不成立
因为很多可能想要的东西,在不经意之间就来了。
(但是知道想要的才会更好追求)-收益很重要。
混搭
局内人和👿
你是👿Evil git,对方是😇Indignant angel
α dominates β(总比后面好)

🔼根据对手的最优来决定我的选择
4⃣博弈最重要的是“换位思考”
Put yourself into some's shoes

现实中
再玩一个游戏
本节课的五个结论:
- Don't play a strictly dominated strategy不要选择劣势策略
- Rational choices can lead to bad outcomes理性选择会导致次优的结果
- Put yourself in other people's shoes学会换位思考
- You can't get what you want你无法得到你想要的
- 不要相信耶鲁的学生
〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰
回顾

先是矩阵写出结果
知道收益Payoff才能进行博弈
⬆️属于“Normal-Form Game”
In game theory, normal form is a description of a game. Unlike extensive form, normal-form representations are not graphical per se, but rather represent the game by way of a matrix. While this Approach can be of greater use in identifying strictly dominated strategies and Nash equilibria, some information is lost as compared to extensive-form representations. The normal-form representation of a game includes all perceptible and conceivable strategies, and their corresponding payoffs, for each player.
*博弈论与现实世界是紧密联系的
Has some real world relevance.
Prisoner's Dilemma囚徒困境⏬
和别人要进行合作项目
价格竞争
不管对手怎么做,都想削弱他们
双方逗采用这样的策略,那么价格将会下降到边际成本,行业利润会遭受损失。

- 1⃣大家都想偷懒,结果不堪设想
- 2⃣两家企业相互削弱,最终压低价格⏩对消费者有利,但是企业不利
- 3⃣加入有一个可利用的公共资源(鱼群 新鲜空气 全球变暖 碳排放)

*存在沟通问题 但沟通并不能化解囚徒困境
一直都有动机 指望别人

- 🔽可以签订协议 置顶规章制度=改变动机和结果就是好的
- 用教育来改变收益* 要慎用
最接近全班2/3的那个游戏
结果留下悬念
Formal Stuff
博弈的Ingredients要素
1⃣Players参与人:i j
*规定 表述法
2⃣策略:si(表示i 的某个策略)
*区分特定策略和可能策略
用Si表示set of alternatives(参与人i 的所有可能策略的集合)
eg.上次课的游戏
策略的集合是:从1 2 3到100
s表示一次博弈 所有人的都在一个电子表格
称为Strategy profile策略组合(策略向量Strategy Vector/策略列表Strategy list)
表示每个参与人都有一个对应的策略--数字游戏的电子表格spreadsheet/游戏中的一个样本
3⃣收益U
U for utile,to the Player i 's payoff
符号U表示参与人的收益,取决于参与人1的策略
Ui will depend on Player 1's choices
所有都影响参与人I的收益 一直到参与人N的策略
Ui由所有的参与人的策略决定(包括他自己)
简写是Ui(s)由策略组合决定
在数字博弈中Ui(s)代表这两件事

很可能是平局tie

s-i 表示除了i外 其参与人的策略

不要因为数学恐惧或者数学符号恐惧而放弃这门课
举个例子
博弈有两个参与人 I II
I有两种选择:上和下
II有三种选择:左中右
(5,-1)(11,3)(0,0)
(6,4)(0,2)(0,2)

Strategy set:
SI:{T,B}
SII:{L,C,R}?

上不总是优于下,反之亦然
Another Example

si strategy is weakly dominated by her strategy
si
当且仅当无论对手怎么做
if player i 's payoff from choosing "si"against"s-i"
她选择si的收益至少与选si的相等

1-100的游戏
剔除
dominated处于劣势:>67(全部人选择100的话,66才是平均数的2/3)
因为去除了68-100(运用了第一结论 不要用劣势策略)
所以45-67也剔除了(从别人的角度换位思考)

30-45在原来不是劣势,去除之后变成了劣势策略

接着就是20+的数字

自己是Rational,对方也是Rational
要让自己有理性KR(Rationality)

Common knowledge: I know ,you know I know,I know you know I know you know...
Then optimal choice will be 1.

Mutual knowledge doesn't imply common knowledge.
这个过程被叫做“迭代剔除劣势策略”

换位思考 从对手的角度入手 推测意图(相互的)
*所有人的劣势策略一次又一次剔除
政治领域中著名的立场选择问题

需要&解决平局问题

竞选者=玩家
政治立场=策略
尽可能最大化获得选票=收益

规律:立场2总比立场1多5%

政治里的经典模型 Prediction:candidates and the voters
“Median Voter Theorem”中间选民定理

所以:会选择与对手相近的政治立场,相当中立

现实里面:肯尼迪和尼克松1960年竞选(政治)
美国历史说明这个策略有效
经济学里面的模型:
表现为firm's crowding together to try to get shoppers who are close to them
Application:Product Placement
eg.加油站⛽️ 更倾向于集中在路口吸引更多加油
Anthony Downs (政治)写本著作
Hotelling霍特林 写篇论文1992
Evaluation:多位 不坚定立场/不一定相信 不能每个人都投票或者参与 占比不平均/不平均分配

建立模型:更好地描述事实激发灵感
模型总是抽象的,要看看有没有疏漏
看一些遗漏的影响因素并且如何影响
发生在英国的97年八九十年代的事情(不相信)
在这里没有劣势策略,所以前面的模型不奏效了

选上是对手选左的最佳对策
选择左边,中间是最佳对策









