欢迎光临散文网 会员登陆 & 注册

战舰世界数学教室3简单的心理学

2019-03-28 23:17 作者:伊斯-染  | 我要投稿

阅读此系列需要有基本的游戏机制知识,详见官方运作机制系列视频官方小教室

当玩家发现有炮弹来袭时会采取一定的策略,包括但不限于外切、内切、加减速。相应的,对手也会估计对方的策略并采取相应的行动。我们常常将对手的行为作为一个不确定量,实际上人类没有我们想的那么复杂。运用唯物主义的观点,­­认为人是按照某种算法决定自己的行动策略的,通俗来说,就是习惯。见到来袭就外切,这是条件反射,你甚至可以教猴子玩游戏;假设对方会判断距离和角度之类的,比如大于90度外切,距离小于15km外切,这就是加了一个判断条件。也许越有经验的人应对方法越多,反应越快,但人类还是有极限的。在一轮炮击的时间你不能做出那么多的思考,你总会按照自己的习惯决定行动。

我们拿游戏ai做类比,我们生成一套算法(自己的风格),根据输入(观察得到的信息),给一个输出(操作)。这个算法是在对方行动(炮击)之前就决定,我们的策略采用的输入信息越多,策略越复杂,行动就越难被预测。而攻击方要做的事情也差不多,就是估计对手的策略而行动。举个例子,你开着共和国,打了亨利一轮外切位,他减速了,下一轮你判断他会加速,然后爆了他一个核心,开心的大叫:加减速的菜逼骗谁呢!(pyo颜)这就是一次成功的预测。

游戏ai有一种经典的方法叫做αβ搜索,一般是用于下棋的,我预测几个回合,搜索我所有做法中收益最高的,然后再搜索对手所有可能做法中收益最高的,反复预测回合数,选择使自己受益最高的做法。αβ搜索并不是假设对手一定是明智的,而是选取最不亏的策略,如果对手没有采取自己估计的最优策略,会只赚不亏。但由于预测回合数有限,假如对手也是一个采用αβ搜索的ai,但是比你的ai多预测两个回合,对手就更可能战胜你。可是应用到wows中就不是那么简单了,拿战列舰距离,我一轮一轮打炮就像回合制一样。我打对面一个横着的巡洋外切位,因为如果他外切了我能打出很好的伤害,如果他内切我之后还有机会能打他。结果他内切了,也在我预期之内,结果在我装填的功夫他转身转过去了或者灭点了,这就是一次比较失败的搜索。αβ搜索是不知道对方策略下的方法,如果我们知道对方的策略,那么αβ搜索得到的做法收益通常不是最高的,αβ搜索只是得到最不亏的策略。而对手的策略,也就是习惯,是可以预测的。

然后来说一个流行的神经网络做法:强化学习。强化,就是给我的结果一个评分,让ai向更高的得分方向修改参数。对于人类来说,这就是经验。对于很多游戏来说评分是很方便的。拿到窝窝屎里,感觉强化学习的ai和人类也差不多,我打个几千场练我的炮术,走位,意识。打得好的局(高评分)考虑优点,暴毙的局(低评分)想想为什么暴毙下次不这么干了。所以一个人能比强化学习完的ai强在哪呢,答案是不如ai,围棋输了,星际2输了,人类不用玩了,看着ai打游戏算了趁着ai还没广泛的暴打人类好好玩吧。

(关于游戏ai的科普推荐up主 柯力卬Kleon 的视频如何制作训练有素的游戏AI

信号系统与齐射

         虽说战列舰也有dpm的概念,但是装填时间也是很重要的,比如共和国的抓机会能力就是指较快的射速。战列舰的dpm不是持续的,而是脉冲的,每次齐射产生一次高额输出,而装填的时间,她的输出就是0。在这个时间内,你就是横着,他也不能把你怎么样,这就是我们为什么要等对方开过一轮炮再转拖刀。

         另外,由于存在炮弹飞行时间,对方发出攻击的输入到你受到攻击的输出,服务器是一个延时系统,把实际伤害相对于开火信息延后炮弹飞行时间传递给你。

         因为装填时间固定,可以把开火视为一个周期脉冲。我们常常能估计对方的开火时间,所谓的节奏就是周期。不过出于个人习惯,这个周期只能作为最短开火间隔,有些人会多瞄那么一两秒。

         至于为什么大部分人喜欢齐射,可能有这样几方面原因。

1有气势

2轮射需要瞄准两次:只要对方在转向或加减速(有加速度)你就必须更改瞄准点

3机会只有一轮,不适合轮射:对方巡洋转身只有5秒左右的时间可以打出最高伤害,这样的时间内完成两次提前量计算比较困难。

4轮射伤害预期标准差较大。由前一节的知识,我们知道一轮炮弹越少,相对不确定度就越大,比如大法一次四颗炮弹,你不指望能打多准。

但是是不是总要齐射呢,肯定不是的。对于加减速的,在他的前进路线打一条线通常是好的选择,按住鼠标拖一段,也不会太耗费计算。

我们提到了ai和齐射是想用来决策战列舰如何射巡洋和巡洋舰如何躲炮。通过经验,我们可以在对方未决策时由验估计给出一个对方的策略集合,当对方做出一次应对后,可以排除一些不符合实际的策略,可以迅速缩小对方可能到达范围,使我们的攻击更好的覆盖对手最可能到达的位置。巡洋舰的工作就是反过来,实际上两个人就像在打赌一样,赌对方猜不到自己的行动。

实际上我们肯定不能在一局游戏甚至几轮射击里进行一个猜疑链,比较划算的做法还是事先计划好一个策略用来分析和预测,对于人类来说,明确这个策略是比较好的,总是凭感觉就不能验证自己的猜测然后改进策略了。

战舰世界数学教室3简单的心理学的评论 (共 条)

分享到微博请遵守国家法律