【游戏泛论3】博弈的本质
在上一期中,我一直在强调,那种表格法将现实过度简化了,那么本文中我们就回到最初,去考察一下这个简化的过程,更细化地去反思一下,在将问题转化为表格的这个过程中,我们究竟是怎么想的?

博弈的拓展
我们在数学上都做过鸡兔同笼问题,比如8条腿,3个头,那么我们会假设鸡x只,兔子y只,x+y=3;兔子有4条腿,鸡有两只脚,那么2x+4y=8;最终得到x=2,y=1,那么鸡就有2只,兔子有1只。
这种思维就叫作数学建模,或者说建立模型。
也就是说,你把鸡兔同笼这个偏现实的应用问题,简化成了x+y=3,2x+4y=8这两个方程再去解决,这个简化的过程就叫建模,通过这类解方程的思路,我们很方便地去解决很多各式各样的现实问题。
不难理解,这种我们建立的模型也就是一种理论,那么,这种数学建模的方法则代表了一种建立理论的方法,或者说关于从特殊到一般,关于如何建立理论的一种理论,正如你可以把鸡兔同笼中的鸡和兔换成其他动物,同样也可以通过解二元一次方程组解决。
或者说,这种解二元一次方程组的思想就代表了所有能用它解决的实际问题共有的一种特征,它们都可以被我们用这种方法解决。
当然,你也可以认为我们一切从实践到理论的过程,就等同于数学建模的过程,因为数学这个词我认为本来就代表了一种普遍意义上的抽象。
回过头来看,就鸡兔同笼而言,你有没有考虑过如果有的兔子因为残疾只有3条腿呢?
我们说,鸡兔同笼这个问题是显得很蠢的,它可能主要是被出题人设想出来用来出这种解方程的题目,但即便它几乎在现实中不存在,它作为一种对现实的模拟,依然是足够复杂的;也就是说,对于这个现实问题,二元一次方程组将现实过度简化了。
同样的,之前的表格法,作为将现实中二人之间的选择转换为一张表格的这样一种建模,一种理论,它也存在着这个问题,因此接下来,这次我们尝试从复杂的现实出发去考虑。
首先,我们主要会运用以下两种思想,当然你也可以说是两种理论。第一,对于这类表格,我们在思考别人的可能的选择时需要换位思考;第二,进而,我们在考虑双方收益时需要分类讨论,当然换位思考同样也需要。
我在这里之所以要强调这两种思想,是因为它们在我看来也的确是很重要的,无论是在游戏中还是现实中,我希望各位读者也能够意识到它们的重要性。
当然,我们还可以更细地去想,比如那些选择是如何被我想到的?事实上,在现实世界中,我们在任何情况下都存在无穷个选择,因此这几个被我们最终写在表格中的选择其实已经可以被认为是我们挑选出来的一些最优解了,那么其中思考的过程可能就更和潜意识中的信息处理相关了,也就是说,潜意识中也或许存在一种一般性的理论帮我们更快速地做出了这个初步的筛选。
那么,通过之前的许多理论的叠加、或者说迭代,最终这个2*2的表格作为一种更有实用性的理论展现在我们面前;但在之前,我们已经做了一些最基本的假设和简化,即同一时间,2个人,各自都有2个选择,2*2的表格,总共4种情况,而现实中显然不止2个人的合作,每个人远不止2个选择。
如果2个人,各自3个选择,那就是3*3的表格,总共9种情况:

如果3个人,各自2个选择,那就是2*2*2,总共8种情况,那么其对应的表格其实就是一个立方体了,每种情况各自的收益就可以用(a,b,c)来表示了:

那么对于这类更多人的情形,比如3个人,我们可以依次固定住其中一个人的各个选择,再去用2个人的思维去考虑,依此类推,并且我们在实际情况中其实往往也的确是这么去考虑的。
那么x个人,各自y个选择,每个人各自的选择数相乘,就是总情况数,总共y^x种情况,同样的,每种情况各自的收益就都可以用(a,b,c,d……)来表示。
我们可以先在脑海中把握一下以上这些概念。

博弈的变换
接下来,我们进一步思考,通常情况下,我们认为人与人之间的不同选择才会构成博弈,但如果沿用这种表格的思想,我们尝试考虑,一个人的博弈会是怎么样的?
换句话说,也就是我只需要列出我自己的选择,比如之前我一直提到的,关于我对我写不写下这些想法的考虑。

通过这个表格,我们发现这种思路也是一定程度上符合实际的,就拿电子游戏来举例,我们在玩单机游戏的时候,其实不能说我们不是这么去考虑的。
但随之,也引入了一个问题,对于一些有pvp要素的单机游戏,其中的具有一定程度模拟人类智能的电脑方,我们究竟应该将它看作一个人类对手,还是看作一个用于评判收益的要素?
你可能会说,根据实用性去判断,哪种思路的结果好就用哪种,这当然是一个正确的思考方式,但更重要的是,我们要知道这两种对同一个问题的不同思维方式之间是如何转换的,这同时也是一个非常普遍的问题。
我在前面提到过,对于英雄联盟,有时候需要根据队友的水平来改变打法。具体来说,有时候队友水平不够,你就不能够把队友看作另几个自己去考虑问题,因为某些情况下,你小亏,队友大赚,总体上是赚的,但他们不一定能够像你一样将这些优势扩大,同时你也因此基本上只能围绕队友去作战了,很难掌握自身的命运;也就是说,队友并不值得被信任和被托付的时候,我的打法可能更倾向于自己的利益,甚至有些时候,不把他们当人看,当单机玩,反而能有更好的结果。
因此,我借此想说明的是,有些情况下,其实有时候真正的人类玩家的确也不是不可以只被看作一个用于评判收益的要素。
回到这个表格,既然我们说,收益是通过权衡各个因素得来的,那么我们把收益写作一个函数f(a,b,c,……),括号中的a,b,c代表了一个个我们可以具体写出来的不同的因素,而f则代表了我们综合考虑这些因素得出收益的一个复杂的过程。

接着,对于这张表,如果我们把B这个人也看作是计算收益时的因素,那么就是这样:

反之,将他看作是我们的对手,就是这样:

我们对比一下这两张表,不难看出这是一种什么样的变换,也就是,我将第一张表的收益中共有的一个因素提取到了括号外面去,而让这个表格增加了一个维度。
好了,根据这个说法,我们现在就掌握了一种理论上可以将任何博弈展开或者收缩到任意维度的方法,只要括号中的这些因素足够多。
那么,我们首先考虑,如果将一个非人因素从括号中提取出来会怎么样?
同样拿我“写不写下这些想法”这件事来说:

在这个表中,出不出意外显然很难说是我的选择,比如夸张一点,地震了,你很难说我可以预测到这一点;同时,这当然也不可能是别人的选择,但我们未必不会去考虑类似这些意外。
那么,我们发现由上面那个我们总结出来的方法,所得到的这个表格,其实也是很符合现实的,我们评判收益时其实未必也不是这么想的。
当然,两个也可以都是我,只要那个被提取出来的因素也可以被看作是我的选择,比如:

(当然,现实中我不喝酒也不开车,我只是举个例子。)
进而,我们也可以在两个人的博弈中加上一个非人因素,也就是一个三维的表格,不难理解,比如地震和不地震的两种情况分别对应一个人与人之间的二维的表格。

剥离了主观性的博弈/自然博弈
那么,反过来,如果我们把A和B这些代表人的因素全都塞到括号里,再把一个非人因素拉出来会怎么样?

问题在于,前面也说过,f代表着A对收益的评判,但是A现在已经被塞入了括号,那么“收益”自然无从谈起,这里的f似乎失去了意义。
如果你说,照这张表格来思考也没问题,的确如此,我们一般来说都会认为没地震会比地震对我们来说要好,但这么去想,其实就不是这个表格想要表达的,你在本质上其实想的还是类似上面那个关于我写不写文章的例子,只是没把自己的选择详细列出来罢了。
换句话说,我们前面所谓的“收益”还是太过狭隘了,它只能够基于一种主观性去描述表格中的内容,而对上面这个表格就不适用了。
那么,我们反思一下,所谓“收益”,到底是什么?
在前面,我们说,f代表了我们综合考虑这些因素得出收益的过程,或者说一种用于判断的逻辑,但它又是基于何物呢?很简单,基于我们的目标。
换句话说,回想我之前举过的一个个例子,写下的一个个表格,但无论当时我们认为的影响收益的因素有多多,对收益的判断有多复杂,在最终,在最后的最后,我们总存在一个相对清晰明了的目标,比如英雄联盟最终无非是为了赢,为了看到对面基地爆炸,比如对于合作与背叛,可能你最终是为了赚更多的钱,乃至于,长远一点来说,为了追求一个幸福的人生。
而这里就涉及到一种时间上的先后了。我们在追求某个目标的途中,为了它作出了很多的博弈和选择,那么这些选择在时间上,一定是在这个我们所想的目标之前的。
换句话说,我们想要达到那样一个未来,也因此,我们才会建立起这样一种博弈的理论,去更好地认识到我们要做出哪些选择,才更可能达到那样的未来;换个角度来看,它作为一种理论,本就是用于预测未来的,这和我之前所讲的关于理论和实践的内容也是一致的。
回过头来,既然收益本质上其实就代表了一种对未来的判断,那么对于这张图,在剥离了主观性后,很简单,它其实就代表了某个未来,比如一个地震后的未来,以及一个没有发生地震的未来。
换句话说,我们可以尝试从一种所谓的上帝视角去看待。上帝是全知全能的,而我们相比之下是愚笨的,因此我们的许多对收益的评判,其实是远远做不到完全准确的;
或者说,虽然我不能够完完全全地考虑到,但很多事物也的的确确在影响着我所作出选择的收益,我考虑不到只是因为我的能力有限罢了。
我无法判断我现在熬一天夜最终减少了我多少寿命,或许事实上熬的这一夜为我带来的好处又间接让我最终多活了几年,谁也不知道,但上帝可以推算到这一步;
或者说,我这里说的上帝实际上就代表了一种绝对的客观性,并且我假设这种客观性是存在的,也就是说,这里的“收益”是客观的,它其实就是这个现实世界本身。
由此,我们可以索性把一切都放入括号中,那么博弈就变成了:

那么,如果说这个括号中的事物代表了世间的一切事物当前的状态,比如可以是每个原子和分子的状态,那么F就代表了这个世界运行的基本规律,它可以计算出这个世界绝对准确的未来,而这个F(……)整体就代表了我们此时此刻所处于的现实世界。
进一步,我们可以尝试将两个非人因素提出来,这实际上就是博弈在进化论上的一种运用,我们可以称之为一种自然博弈。
我记得初中还是高中的时候,生物课上有这样一个例子:有一个地区都是黄绿色翅膀的蝴蝶,不过某些基因会导致存在少数的黑色翅膀的蝴蝶,工业革命期间,由于黑烟排放,许多树丛都被染成了黑色,从而黑色翅膀的蝴蝶具有生存上的优势,因为能够在这种环境下更隐蔽,那么自然而然,优胜劣汰,黑色翅膀的蝴蝶逐渐占据了多数。
关于这个博弈我们可以这么描述:

它向我们清晰地揭示了对于这些蝴蝶,它们所处环境与翅膀颜色的某些关系。
蝴蝶没有我们那么聪明,无法认识到这一点,也无法通过主动伪装自己的翅膀颜色来更好地生存,因此,我们可以认为,它们对于这个博弈来说并没有主观能动性。
同样的,对我们人来说,比如有一种亲属选择的说法,意思是,我们之所以会对亲人或者朋友会比较好,是因为亲人和我们的基因类似,而朋友之所以是朋友,也是因为他们的某些表现和我相似才会成为朋友,而这些相似的表现也代表着一些基因上的相似,因此,我们会对他们好,在基因层面上的解释就是这些基因在做出能够让它们能够更好的延续和存活下去的选择罢了。
但如果一般情况下,我问你,为什么你会对亲人和朋友会更好?不管怎么说,至少你不太可能用上面这个说法去解释,而会更偏向于一种基于人的、主观的解释方式,因为这种解释跳过了我们这个“对亲人和朋友会更好”的这个行为所体现的主观能动性,直接来到了基因层面,当然,在这个层面,我们本来就还没出生,也本来就没有所谓的主观能动性。
从中我们也可以初步意识到,一个现象,它可以有相对主观的解释方式,也可以有相对客观的解释,并且它们之间的界限是很模糊的,正如前文中所说,既然我们也都可以被放入f或者F的括号中,那么我们和那些所谓客观的因素又有什么太大的差别呢?关于这一点,以后有机会再详细说说。

“简单”博弈
接下来,再回到这个F:

对于这个1*1的表格,我们反过来,再把其中的A提出来,尝试和原先的表格比较一下有何区别。

不难发现,这张表体现的其实就是我之前所说的那些“不同的未来”。在生活中,我也会常常听到过这样的言语,比如“人生就是一个个选择的叠加”,比如“我们的每个不同的选择后面都分叉出了一个新的平行世界”等等,而这些话语,无非就在说明着,代表f的愚蠢的我们不能够像F一样彻底地描述这个时间点后的那个世界。
画个图来表示就是这样:

而这个思路和象棋、围棋等棋类就非常贴合了。
在这些棋类游戏中,时间的最小刻度就是一方的一次落子,并且它们明确地规定只存在双方,而且双方每一步可能的选择都是公开的,能走的步再多也只有那些;
同时,我们借此也可以很容易理解上面那个平行世界的思想,比如开局,A在所有可能的选择中下了一步棋,从而整个世界的状态,也就是整个棋盘的状态,清晰地变成了A下了这一步后的样子,并且轮到对方落子;换句话说,你前面下了什么已经过去了,现在的棋盘世界已经变为了现在的状态,这就是一盘从现在开始的由对方先动的拥有一个新的开始状态的棋局了。
那么,既然这些棋类已经简化到了如此程度,那么它们是完全信息博弈吗?
根据前面对完全信息博弈的定义,我们现在只需要考虑两人心中各自对任何一步棋的收益是否是一致的。
这显然是不一致的,因为正是双方对有些落子心中的判断不同,才会有输有赢;不然,因为双方对任何一个局面的最优落子都是同一个,那么这两个人无论下多少盘,结局都是一样的,不是吗?因此它们并不是完全信息博弈。
那为什么也有人会认为它们是完全信息博弈呢?
因为这些人把f和F混淆了,至少在我对完全信息博弈的定义下,收益指的是双方各自对各个选择作出的收益判断,即便知道了棋盘上的一切信息,我们作为f也几乎不可能像F一样看到所有可能的未来,这也是我前面一直在说的。
说句题外话,如果我们能够计算出棋盘上所有可能的情况呢?
那就更没意思了,因为对于象棋、围棋这些棋类,它们在理论上先手或后手中必有一方存在必胜/必不败的策略,这是已经被证明的,感兴趣的可以自己上网搜一下;但是,人类目前计算能力最强的计算机都无法找到这些策略,更不用说我们靠自己的大脑了,况且棋类比赛也不可能没有时间限制。
更具体一点来说,一张19*19的围棋棋盘,简单来考虑,第一个落子有361种可能性,第二个有360种,依此类推,所有的可能就有361*360*……*2*1约等于10^768,这个数量是什么概念呢,人类已知宇宙中的原子数量也只有10^80个左右。
那么,棋手要怎么思考每一步的收益呢?我们对此其实都有一个比较普遍的认知,也就是棋手会去算很多步;当然,我知道对下棋来说,单纯的计算能力肯定不是全部,毕竟开局都是相同的,但它绝对是棋类所考察的最重要的能力之一。
我们说算5步,通常会指棋手能够思考到,从当前这一步,当前局面开始,往后5步时的一些局面;换句话说,这就是我们常说的一种思维的深度,在前面也提到过,这在现实中其实就代表了一个人他考虑问题是否长远。
举个最简单的例子,天气预报说明天要下雨,那我们会提前在包里准备一把伞,其中我们用到的思维方式其实和上面在本质上是一样的;之前的文章中,我也举过一些有关英雄联盟的例子,其中有许多博弈的收益的确也依赖于未来的其他博弈。
同时,计算当然不仅仅指深度这种在时间上的跨越,还有你是否能够对当前你所有可能的选择都作出一定的考虑,那么在现实中,就代表一个人他考虑问题是否周到。
但正如前文中我也一直在表达着这样一个意思,也就是我们人是不可能在深度和广度上做到完美的。
棋类,最终也无非赢和输等等几种情况,对于我们人,除非是已经能够算到最后胜负的残局,绝大多数情况下,我们的思维深度都是远远达不到尽头的;我们只能尽可能地模拟这种F所代表的思维,最终在我们能力的尽头,依旧只能对之后的未来作出相对模糊的评估。
而在下棋中,这一点就体现在,棋手会排除一些明显会让自己处于劣势的选项。

正如图中所示,我们有可能在第一次思考时就排除了,也就是图中0到1的过程,当然,也可能在思考到不同的深度时才进行排除;也由于这张图形似一棵树,我们也可以称这种排除的行为叫做剪枝。
那么,何时需要剪枝呢?这个思路就更像我们上一章中去评估收益的方法了。
比如一个棋手对于某条他正在思考的路线,他想到第5步的时候,认为如果下到这个局面,他会占有一些优势,那么他可能会转而去思考其他路线,从而通过比较它们,作出当前的自己认为是最优的选择;当然,如果仍有余力,时间也充裕,那么自然可以在深度和广度上更进一步。
关键在于,为什么对于某些局面,他可以快速地判断自身是否优势,而不需要像之前一样进行无微不至的思考呢?
我曾经看过象棋的一些最基本的教程,虽然自己完全没去下过,但我在这里还是拿象棋举个例子。
在象棋中,有着许多可以用于大致判断自身优劣的概念,当然,别的棋类中肯定也有类似的,比如最基本的,在一方少子的情况下棋子价值的对比,还有,比如得到或者失去了先手,某一侧子力对于进攻或者防守相对空虚,乃至子和势的关系,有些时候可能通过弃子来发动攻势是更好的选择,等等。
因此,我们在明白了这种可以说是相对宏观的一些概念,再加上丰富的经验后,有时候就可以凭借它们去对局势进行判断,当然,这同样也需要思考,只是相比一步一个脚印的计算,我们不需要花费大量的时间和精力。
不过,弊端也在于,它不是完全和彻底的思考,因此在某些情况下,我们也许会因此疏忽了某些可以制胜的选项,相比之前那种最小时间刻度下的思考,至少在思考的范围内,那些局面都是绝对的。
总结一下就是,先基于深度和广度的尽可能精细地思考,进而在各个分支的尽头进行相对不严谨的评估和比较后再进行剪枝,从而比较得出当前的最优解,这就是我们作出选择前的一系列思维过程。
那么对这张图来说,那些尽头就代表了图中的那个“目标时间点”,对应了我们想得最远的那个时间点,我们可以把这段时间称为“一个时间阶段”,比如,算5步就是指5个最小时间刻度组成了一个时间阶段。


“复杂”博弈
那么,我们再来谈谈英雄联盟,它无非也是敌方基地爆炸和我方基地爆炸两个最终结果,为何玩家们不会像棋类一样在深度和广度上思考那么多?
因为英雄联盟比棋类复杂得多。
英雄联盟服务器的tick数为30,可以理解为,玩家的输入每1/30秒也就是每0.0333s被服务器处理一次;也就是说,我们可以简单理解成,英雄联盟这个游戏中时间的最小刻度是33ms。
那么这里就要涉及到一个新东西了,叫做人的思维刻度(时间)。
我们之前提到的最小时间刻度,是棋盘所代表的,是下棋的规则所规定的,换句话说,就是“那个世界”定下的,而人的思维不一定能达到这个刻度,就比如英雄联盟,玩家的思维再细也达不到33ms这种程度,而棋类作为一种现实世界很大的简化,棋手的思维刻度是可以达到那个世界的上限的。
同样的,选择的多少也是如此,棋类中每一步的可能选择是可以被穷举的,但英雄联盟不可以,一个玩家在任何一个tick中可能的输入序列几乎也是无穷无尽的。
因此,对于英雄联盟,由于我们大脑的处理能力有限,人的思维刻度远远达不到世界的刻度,我们不可能每33ms作出一个判断,不可能全部考虑到自己当前所有可能的行动,因此其中总会存在一些玩家带有随机性的操作,比如甚至说在某处多点了一下地板,但不可否认,它也会对后续的游戏发展起到影响,但这种影响对我们而言是不可预测的,我们很难意识到,并且就算意识到了也几乎不可能去知道;更何况,假设一把游戏25分钟,那么换算到棋类中就有45000步,这种深度更加扩大了这种随机性和复杂性。
如果从信息的角度去考虑,棋类的不完全信息可以说仅仅体现在双方的计算能力,而对于英雄联盟,由于思维刻度的原因,其中许多博弈所对应的表格都是千疮百孔的;何况除此之外,还有战争迷雾等等的存在,对局中的信息,相比象棋而言,对每个玩家都太不完全了。
综上,英雄联盟局面的复杂度是棋类游戏无论如何都远远不可能触及的,那么玩家是如何去思考这个游戏的呢?
实际上,在英雄联盟中,玩家们更多的会去想,这一波团打完了赚不赚,经济差和等级差怎么样等等,依此来判断局势。
这其实和棋类是一致的,玩家们会思考下波团怎么打好,而不是直接想到胜负那么远,也就是和之前说的一样,玩家们将一个或许多自己思维的时间刻度合在一起,成为了一个时间阶段,并且每个时间阶段都有着对应的一个短期的目标。
比如下波要打小龙团,那我会思考我要为这个团战做哪些准备,但我们往往就不会往下思考了,因为对于这个复杂的游戏,团战的可能性太多了,突发情况也可能非常多,因此这种过于提前的思考就没那么有价值,从而没那么必要。
并且,由于这种分段的思维,我们还需要注意这些时间段之间的联系,也的确如此,英雄联盟中也会有滚雪球这类概念的提出。
再往回看,这些和前面我提到的象棋中的那些概念其实也是一个道理,包括所谓一些开局、中局以及布局的思路,它们其实也就是对其中几个回合整体,作出的对胜负的一种评估。
并且,从这个例子中,可以更容易地意识到,我们在对某些整体作出评估时,首先会整理出对其对应短期目标的各种影响因素,其次我们还会对其进行一定“降维”,从而筛选出最适合我们基于去评判的特征,比如团战胜负乃至游戏胜负对应的可能就是“经济差”这个指标,甚至也可以归纳和抽象出一些新的指标和特征,比如前面提到的象棋中的子和势,或是可以对博弈表格中的选项进行分类;以及,前文中所说的时间阶段和短期目标,本质上也可以被认为是一种降维,从而能够简化问题。
当然,由此而来的弊端,在英雄联盟中也是有所体现的。比如,最普遍的,当经济差很大的时候,其实拖到大后期,可能打好一波团,说不定就逆经济翻盘了;再比如,我们看到门牙塔掉了,常常会说游戏性质发生了变化,完全没错,这说明我们知道在这个情况下,对面偷塔来取得胜利会突变一个非常不错的选择;还有,我还记得之前克隆大作战中也有5个大头中路平推的套路,对于这种直指最终胜负的思路,我们就无法用经济差去评判了。
这些也就对应了我之前提到的剪枝思维的局限性,它的确会存在一些漏洞。

现实世界所对应的博弈模型
那么,再来看现实世界,我们在很多时候也的确是通过制定一些短期的目标来让我们更好地、更明确地行动起来,比如下周要做几个视频,下个月要减肥多少斤、赚多少钱等等。
当然,我们之前也说过,现实世界无非是就是F(),但接下来,我们尝试保留人的概念来思考。
那么,对于棋类中的2人,在现实中就是人口数,比如80亿;棋类中的最小时间刻度,在现实中不妨认为是一段无限短的时间;棋类中的每个时间点的可能选项,在现实中就不妨认为有无穷多;而棋类中当前时间点代表的m*n的一个表格,在现实中当前时间点所代表的就是∞^80亿的一个表格。
至于时间阶段,就比较灵活了,更多的是看我们的需求和目标,但我们需要知道,无论这个阶段有多短,由于最小时间刻度的原因,它总是可以被分得更细,这也是棋类和现实世界的一个很大的差别。
再回到之前这张图,我们就能够很好地理解左下角那句话了。

“基于主观性的”其实指的就是我们从F()中提出了人,我们在用人脑去思考;
“相对片面的”指的就是我们思考的能力在思维刻度上是有限的;
而“对某个相对短期目标的” 指的就是我们思考的能力在深度和广度上是有限的;
当然,不难理解,实际上后两者已经包含在“基于主观性的”这个修饰的语句中了,我只是加以解释了一下。
进而,基于这个现实世界对应的博弈模型,我们可以回过头去想想,最开始的那个关于合作和背叛的2*2的表格根本上是由此如何一步步简化而来的,是不是就更加容易理解了,并且这种理解也更加深刻和本质了。

附:两个问题,以及一些展开
那么接下来,谈谈几个我之前没机会提的问题。
第一个问题,当我们是博弈的一方时,为什么我们倾向于把他人从因素中提取出来?
首先,我们要知道,无论我们自己在不在这个表格中,这个表格都是我们画出来的,也就是说,这种表格的方式本身代表了我们作为人的,一种自然而然的思维。
比如,我问你,你能不能不像我前面说的那样去思考?能不能换一种思考方式?
这一定是不可能的,因为我们本来就是在这么思考,上面那些理论也正是从我们的这种自然的思考方式中分析和提取出来的。
因此,唯有当对方也是人的时候,这个博弈才会更可能满足完全信息博弈中的这一点:“对方也在这么思考。”从而这种博弈的思维才更可能具有实用性。
说白了,很简单,因为人与人是更加对等的;当然,也只是更倾向于,比如我之前也举过英雄联盟中的例子,有些时候把人放到括号中去考虑的确会是更好的选择。
第二个问题,我们可以发现,在那些棋类中,对收益的评判是不需要分析过去的,只需要分析未来,但为什么在现实中,或者复杂一点的游戏中,我们考虑f时不仅要像棋类中那样考虑未来,过去的信息实际上可能会更重要?
第一,之前也说过,对于越复杂的问题,就越难往后想,并且越往后,价值也往往越小,因此考虑未来的思考可能就会显得相对不重要;
第二,我们可以想一想,“寻找规律”作为现实中的一类行为,它们在我的这个现实世界所代表的博弈模型中 ,该如何体现?
不难理解,寻找规律并且进行运用,也就是通过过去的已知的信息,从而对未来的博弈中未知的信息进行预测。
在象棋中,因为我们知道这个世界的一切运行规则,比如马走日、象走田,所以不需要过去的信息;反过来看,如果棋手都不知道这些子是怎么动的,又怎么可能能够像之前那么去思考呢?
同样的,我们为什么要将现实世界分为一个个时间点,每个时间点对应着一个当前的世界状态,用这种方式去看待?
正是由于我们一开始完全不知道它的规则,无法很好地认识到现实世界的规律,它所对应博弈模型中的信息太过不完全,因此,我们才会基于这种方式,尝试去总结规律,想要通过归纳得到理论,从而去更高效地去获取信息,填补我们对现实世界的认知缺失,进而更好地去预测未来。
英雄联盟中也是如此,如果我通过过去的一些现象,发现对面习惯性向下走位,如果他没有意识到他的这种习惯,那么根据他的这种行为规律,我就可以预判向下钩,从而获取优势;以及一直说的,我们可以通过队友的一些行为,初步判断出他们的水平,从而可以更好地去规划如何赢下游戏,这也是一个道理。
更不用说,对于这些“可重复”的游戏,实际上过往的那些重复同样也能够被理解为是一种过去,我们由此获取信息同样也是这样一个由过去预测未来的过程。
或者说,我建立起的这种模型代表的也许是一种更原初的思维。
不难理解,我们作为人,也无非就是在一个个相对离散的时间点上通过感官等等收集着周围事物当时的状态,从而,我们将这些离散归纳为连续,由特殊到达一般,才有了所谓“规律”的概念;
我之前也说过,某些所谓科学思想、数学思维,在不适当的传播方式下,反而会禁锢人的思维,但如果按照这种方式来看待世界,其实就能够很好地避免这个问题,也能够更本质地认知这个世界。
总结一下,也就是,在我们分析收益做出决策的时候,分析过去和分析未来这两种思维是需要融汇贯通的,这样才能够带来更准确的预测和更好的结果。
另外,我们可以想一想,在前文中,我基于“理论”得到了有关博弈的理论,从而又用这个理论解释了“理论”,这是否又一种“自指”呢?
的确如此,但在这个例子中,我们能够相对明确地感受到,我所基于的“理论”和我后面所解释的“理论”实际上是有所差别的,它们不完全是同一个事物。
与其说是“自指”,不如说是一种“交织”,很多事物和概念之间,正如理论和实践一样,本就是互相依存、互相促进的;基于博弈去解释世界,还是基于理论和实践去解释世界,它们之所以能够在对方身上互相体现,正是因为它们本身就是不完全的、也是不同角度的对世界的一种“侧写”;然而我们向前追寻和还原,又会触碰到潜意识的壁障,或者说,它们一定是首先经历了潜意识中的某些过程,之后在某个阶段中同时涌现在我们的意识层面,因此对我们的意识来说,前面的过程才会显得是一个“黑箱”,模糊而令人困惑。
综上,这些就是我想说的我认为的关于博弈的本质。
在前文中,我为了便于各位理解,模拟了一种自然的、由浅入深的思维过程来讲述,这种方式的确会让整体看上去有些乱,希望读者可以仔细阅读和思考,从而能够很好地吸收其中对你有用的一些观点,那么本文就讲到这里。