欢迎光临散文网 会员登陆 & 注册

【博弈论】耶鲁大学公开课(中英双语字幕)

2021-09-25 09:29 作者:元气少女SX-Lucky  | 我要投稿

第一到三节课笔记


01 导论:五个入门结论 P1 - 00:56


Imperfect competition👆

行为(自己的&其他人的)影响结果


01 导论:五个入门结论 P1 - 02:22


博弈论:经济学 政治学 法学 生物学(生物进化论) 体育

(中间有介绍录播的回事)


01 导论:五个入门结论 P1 - 06:20


评分标准🔼

Problem set习题集

推荐书本🔽

更难一些🔽

课本只是救命稻草,课下想深入可以看对应章节。

睡前读物🔽

这课有趣,但又有点难:因为学习博弈论需要通过一些游戏来学习



01 导论:五个入门结论 P1 - 11:27


游戏I(成绩博弈)

分为两两一组,每个人选择α或者β

你选α,对手选β,你得A对手C

都选α,都得B-;都选β,都得B+

你选β,对手选α,你得C对手A

博弈论思考方式是像右边的表格🔽(矩阵)

涉及行为 策略 参与人(神学:考虑他人)

要了解动机和收益Payoff,才能真正分析

数字代表效用或功利🔽

英格兰叫法:饭桶恶魔Evil gits (只考虑自己)


从Dominated strategy里面总结:

结论1⃣Don't play a strictly dominated strategy


01 导论:五个入门结论 P1 - 28:12


🔼原因🔽

如果我在每次选了优势策略dominate it,我在每次博弈都能得到更好的收益。

不管别人怎么选择,我总得到更好的结果。

🔼漏洞:不管我选了什么,都不会/会影响你。

在超现实状态了。

🔼漏洞:如果我说服你选β,我选择α,那么我可以收获3效用

就算上条可行,我仍然选择α


01 导论:五个入门结论 P1 - 32:17


结论2⃣Rational Choice can lead to outcomes that"Suck"(美国人说的“糟糕”)

在经济学里面,会导致Inefficient=Pareto Inefficient

都不选择最坏就会是次优



01 导论:五个入门结论 P1 - 33:38


著名案例:囚徒困境Prisoner's Dilemma


eg.期末、年末的时候,寝室会乱,因为没有人打扫,都指望别人。


01 导论:五个入门结论 P1 - 37:09


离婚纠纷🔼


01 导论:五个入门结论 P1 - 37:15


经济学案例🔼Price War



01 导论:五个入门结论 P1 - 37:41


怎么化解?🔼

1.Collusion串通-Contract合同(Illegal 无效)

2.Enforceable强制性

3.重复--可以达成协议 沟通 互相相信

(我想到石头剪刀布也是同理)



01 导论:五个入门结论 P1 - 41:56


神学院

收益不同?

列出可能的收益Possible Playoff

就叫(起名)Evil gits 饭桶恶魔👿(只考虑自己)

Indignant angels愤怒的天使(考虑别人)

由于罪恶感最后从收益3到-1 道德谴责



🔼这种叫做协和谬误Coordination Problem

⏯注意收益的重要性

⏩结论:收益很重要

在博弈中当一件事情参与者已经投入了一定的成本和精力之后,发现进行下去的结果是不易进行下去的低效率,低回报时,却因各种因素而不停止事件的进行,继续做这件事,此时便是 博弈论 中的“协和谬误”。(搜狗百科)【有点像SUNK COST】

🔼逻辑上不成立

因为很多可能想要的东西,在不经意之间就来了。

(但是知道想要的才会更好追求)-收益很重要。



01 导论:五个入门结论 P1 - 49:05


 混搭 

局内人和👿

你是👿Evil git,对方是😇Indignant angel


α dominates β(总比后面好)

🔼根据对手的最优来决定我的选择


4⃣博弈最重要的是“换位思考”

Put yourself into some's shoes



01 导论:五个入门结论 P1 - 59:32


现实中



01 导论:五个入门结论 P1 - 01:02:52


再玩一个游戏



01 导论:五个入门结论 P1 - 01:07:50


本节课的五个结论:


  1. Don't play a strictly dominated strategy不要选择劣势策略
  2. Rational choices can lead to bad outcomes理性选择会导致次优的结果
  3. Put yourself in other people's shoes学会换位思考
  4. You can't get what you want你无法得到你想要的
  5. 不要相信耶鲁的学生

〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰〰



02 学会换位思考 P2 - 00:02


回顾

先是矩阵写出结果

知道收益Payoff才能进行博弈

⬆️属于“Normal-Form Game”

In game theory, normal form is a description of a game. Unlike extensive form, normal-form representations are not graphical per se, but rather represent the game by way of a matrix. While this Approach can be of greater use in identifying strictly dominated strategies and Nash equilibria, some information is lost as compared to extensive-form representations. The normal-form representation of a game includes all perceptible and conceivable strategies, and their corresponding payoffs, for each player.

*博弈论与现实世界是紧密联系的

Has some real world relevance.


Prisoner's Dilemma囚徒困境⏬

和别人要进行合作项目

价格竞争

不管对手怎么做,都想削弱他们

双方逗采用这样的策略,那么价格将会下降到边际成本,行业利润会遭受损失。

  • 1⃣大家都想偷懒,结果不堪设想
  • 2⃣两家企业相互削弱,最终压低价格⏩对消费者有利,但是企业不利
  • 3⃣加入有一个可利用的公共资源(鱼群 新鲜空气 全球变暖 碳排放)

*存在沟通问题 但沟通并不能化解囚徒困境

一直都有动机 指望别人

  • 🔽可以签订协议 置顶规章制度=改变动机和结果就是好的


  • 用教育来改变收益* 要慎用



02 学会换位思考 P2 - 06:11


最接近全班2/3的那个游戏

结果留下悬念


Formal Stuff

博弈的Ingredients要素

1⃣Players参与人:i j

*规定 表述法

2⃣策略:si(表示i 的某个策略)

*区分特定策略和可能策略

用Si表示set of alternatives(参与人i 的所有可能策略的集合)


eg.上次课的游戏

策略的集合是:从1 2 3到100


s表示一次博弈 所有人的都在一个电子表格

称为Strategy profile策略组合(策略向量Strategy Vector/策略列表Strategy list)

表示每个参与人都有一个对应的策略--数字游戏的电子表格spreadsheet/游戏中的一个样本



02 学会换位思考 P2 - 11:59


3⃣收益U

U for utile,to the Player i 's payoff

符号U表示参与人的收益,取决于参与人1的策略


Ui will depend on Player 1's choices

所有都影响参与人I的收益 一直到参与人N的策略


Ui由所有的参与人的策略决定(包括他自己)

简写是Ui(s)由策略组合决定


在数字博弈中Ui(s)代表这两件事

很可能是平局tie



02 学会换位思考 P2 - 14:02


s-i 表示除了i外 其参与人的策略



02 学会换位思考 P2 - 15:00


不要因为数学恐惧或者数学符号恐惧而放弃这门课



02 学会换位思考 P2 - 16:04


举个例子

博弈有两个参与人 I II

I有两种选择:上和下

II有三种选择:左中右

(5,-1)(11,3)(0,0)

(6,4)(0,2)(0,2)

Strategy set:

SI:{T,B}

SII:{L,C,R}?

上不总是优于下,反之亦然


02 学会换位思考 P2 - 20:45




02 学会换位思考 P2 - 24:45


Another Example

si strategy is weakly dominated by her strategy

si

当且仅当无论对手怎么做

if player i 's payoff from choosing "si"against"s-i"

她选择si的收益至少与选si的相等


02 学会换位思考 P2 - 35:33


1-100的游戏

剔除

dominated处于劣势:>67(全部人选择100的话,66才是平均数的2/3)

因为去除了68-100(运用了第一结论 不要用劣势策略)

所以45-67也剔除了(从别人的角度换位思考)

30-45在原来不是劣势,去除之后变成了劣势策略

接着就是20+的数字

自己是Rational,对方也是Rational

要让自己有理性KR(Rationality)

Common knowledge: I know ,you know I know,I know you know I know you know...

Then optimal choice will be 1.

Mutual knowledge doesn't imply common knowledge.




03 迭代剔除和中位选民定理 P3 - 00:27


这个过程被叫做“迭代剔除劣势策略”

换位思考 从对手的角度入手 推测意图(相互的)

*所有人的劣势策略一次又一次剔除



03 迭代剔除和中位选民定理 P3 - 02:11


政治领域中著名的立场选择问题

需要&解决平局问题

竞选者=玩家

政治立场=策略

尽可能最大化获得选票=收益

规律:立场2总比立场1多5%

政治里的经典模型 Prediction:candidates and the voters

“Median Voter Theorem”中间选民定理

所以:会选择与对手相近的政治立场,相当中立



03 迭代剔除和中位选民定理 P3 - 24:37


现实里面:肯尼迪和尼克松1960年竞选(政治

美国历史说明这个策略有效



03 迭代剔除和中位选民定理 P3 - 25:53


经济学里面的模型:

表现为firm's crowding together to try to get shoppers who are close to them

Application:Product Placement

eg.加油站⛽️ 更倾向于集中在路口吸引更多加油



03 迭代剔除和中位选民定理 P3 - 26:60


Anthony Downs (政治)写本著作

Hotelling霍特林 写篇论文1992

Evaluation:多位 不坚定立场/不一定相信 不能每个人都投票或者参与 占比不平均/不平均分配

建立模型:更好地描述事实激发灵感

模型总是抽象的,要看看有没有疏漏

看一些遗漏的影响因素并且如何影响



03 迭代剔除和中位选民定理 P3 - 36:58


发生在英国的97年八九十年代的事情(不相信)




03 迭代剔除和中位选民定理 P3 - 40:15


在这里没有劣势策略,所以前面的模型不奏效了


03 迭代剔除和中位选民定理 P3 - 42:32


选上是对手选左的最佳对策

选择左边,中间是最佳对策














【博弈论】耶鲁大学公开课(中英双语字幕)的评论 (共 条)

分享到微博请遵守国家法律