战舰世界数学教室3简单的心理学

2019-03-28 23:17 作者:伊斯-染 0人读过 | 我要投稿

阅读此系列需要有基本的游戏机制知识，详见官方运作机制系列视频官方小教室

当玩家发现有炮弹来袭时会采取一定的策略，包括但不限于外切、内切、加减速。相应的，对手也会估计对方的策略并采取相应的行动。我们常常将对手的行为作为一个不确定量，实际上人类没有我们想的那么复杂。运用唯物主义的观点，认为人是按照某种算法决定自己的行动策略的，通俗来说，就是习惯。见到来袭就外切，这是条件反射，你甚至可以教猴子玩游戏；假设对方会判断距离和角度之类的，比如大于90度外切，距离小于15km外切，这就是加了一个判断条件。也许越有经验的人应对方法越多，反应越快，但人类还是有极限的。在一轮炮击的时间你不能做出那么多的思考，你总会按照自己的习惯决定行动。

我们拿游戏ai做类比，我们生成一套算法（自己的风格），根据输入（观察得到的信息），给一个输出（操作）。这个算法是在对方行动（炮击）之前就决定，我们的策略采用的输入信息越多，策略越复杂，行动就越难被预测。而攻击方要做的事情也差不多，就是估计对手的策略而行动。举个例子，你开着共和国，打了亨利一轮外切位，他减速了，下一轮你判断他会加速，然后爆了他一个核心，开心的大叫：加减速的菜逼骗谁呢！（pyo颜）这就是一次成功的预测。

游戏ai有一种经典的方法叫做αβ搜索，一般是用于下棋的，我预测几个回合，搜索我所有做法中收益最高的，然后再搜索对手所有可能做法中收益最高的，反复预测回合数，选择使自己受益最高的做法。αβ搜索并不是假设对手一定是明智的，而是选取最不亏的策略，如果对手没有采取自己估计的最优策略，会只赚不亏。但由于预测回合数有限，假如对手也是一个采用αβ搜索的ai，但是比你的ai多预测两个回合，对手就更可能战胜你。可是应用到wows中就不是那么简单了，拿战列舰距离，我一轮一轮打炮就像回合制一样。我打对面一个横着的巡洋外切位，因为如果他外切了我能打出很好的伤害，如果他内切我之后还有机会能打他。结果他内切了，也在我预期之内，结果在我装填的功夫他转身转过去了或者灭点了，这就是一次比较失败的搜索。αβ搜索是不知道对方策略下的方法，如果我们知道对方的策略，那么αβ搜索得到的做法收益通常不是最高的，αβ搜索只是得到最不亏的策略。而对手的策略，也就是习惯，是可以预测的。

然后来说一个流行的神经网络做法：强化学习。强化，就是给我的结果一个评分，让ai向更高的得分方向修改参数。对于人类来说，这就是经验。对于很多游戏来说评分是很方便的。拿到窝窝屎里，感觉强化学习的ai和人类也差不多，我打个几千场练我的炮术，走位，意识。打得好的局（高评分）考虑优点，暴毙的局（低评分）想想为什么暴毙下次不这么干了。所以一个人能比强化学习完的ai强在哪呢，答案是不如ai，围棋输了，星际2输了，人类不用玩了，看着ai打游戏算了趁着ai还没广泛的暴打人类好好玩吧。

（关于游戏ai的科普推荐up主柯力卬Kleon 的视频如何制作训练有素的游戏AI

信号系统与齐射

虽说战列舰也有dpm的概念，但是装填时间也是很重要的，比如共和国的抓机会能力就是指较快的射速。战列舰的dpm不是持续的，而是脉冲的，每次齐射产生一次高额输出，而装填的时间，她的输出就是0。在这个时间内，你就是横着，他也不能把你怎么样，这就是我们为什么要等对方开过一轮炮再转拖刀。

另外，由于存在炮弹飞行时间，对方发出攻击的输入到你受到攻击的输出，服务器是一个延时系统，把实际伤害相对于开火信息延后炮弹飞行时间传递给你。

因为装填时间固定，可以把开火视为一个周期脉冲。我们常常能估计对方的开火时间，所谓的节奏就是周期。不过出于个人习惯，这个周期只能作为最短开火间隔，有些人会多瞄那么一两秒。

至于为什么大部分人喜欢齐射，可能有这样几方面原因。

1有气势

2轮射需要瞄准两次：只要对方在转向或加减速（有加速度）你就必须更改瞄准点

3机会只有一轮，不适合轮射：对方巡洋转身只有5秒左右的时间可以打出最高伤害，这样的时间内完成两次提前量计算比较困难。

4轮射伤害预期标准差较大。由前一节的知识，我们知道一轮炮弹越少，相对不确定度就越大，比如大法一次四颗炮弹，你不指望能打多准。

但是是不是总要齐射呢，肯定不是的。对于加减速的，在他的前进路线打一条线通常是好的选择，按住鼠标拖一段，也不会太耗费计算。

我们提到了ai和齐射是想用来决策战列舰如何射巡洋和巡洋舰如何躲炮。通过经验，我们可以在对方未决策时由验估计给出一个对方的策略集合，当对方做出一次应对后，可以排除一些不符合实际的策略，可以迅速缩小对方可能到达范围，使我们的攻击更好的覆盖对手最可能到达的位置。巡洋舰的工作就是反过来，实际上两个人就像在打赌一样，赌对方猜不到自己的行动。

实际上我们肯定不能在一局游戏甚至几轮射击里进行一个猜疑链，比较划算的做法还是事先计划好一个策略用来分析和预测，对于人类来说，明确这个策略是比较好的，总是凭感觉就不能验证自己的猜测然后改进策略了。

标签：

战舰世界数学教室3简单的心理学

战舰世界数学教室3简单的心理学的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

战舰世界数学教室3简单的心理学

本文作者的其他文章

战舰世界数学教室3简单的心理学的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

战舰世界数学教室3简单的心理学的评论 (共条)