欢迎光临散文网 会员登陆 & 注册

零之审判的统计学麻将——点数2

2021-11-24 11:42 作者:零之审判者  | 我要投稿

前言:这个专栏是我个人基于兴趣得到的统计结果,包括1. 简单的数据统计或随机模拟, 2. 专业的统计检验或参数估计研究,3.一些机器学习模型的应用。 如果出现数据统计,基本来自于2010-2021年的近三百万个四凤南的牌谱,感谢nodocchi.moe网站作者提供资源。 

这期的主题来自于上期用户的评论:

在上上期 https://www.bilibili.com/read/cv14109435 中,我们统计了三个问题对应的几百个牌谱中主视角在半庄结束时的顺位:

在上期 https://www.bilibili.com/read/cv14126923 中,我们介绍了两种检验方法,t检验(适合大样本或近似正态样本)、贝叶斯检验(适合多项分布等已知参数模型)。我们证明了这三个问题的pt期望是有显著差异的。但这个用户的评论刚好指出了应用统计方法时常常要考虑的问题:模型中是否有其他重要的变量。我们知道,在这种两百战左右的小对战数下,点数高低的座次之类的变量很难影响最终顺位。但是主视角的实力很可能影响了最终的顺位,而在三个问题的设定中,主视角的实力应该是一样的。因此有一定必要去进一步观察这三个问题对应的牌谱主视角的段位和r值。

统计结果

统计发现问题1的146个牌谱主视角中有94个七段、 38个八段、14个九段、0个十段;问题2的221个牌谱主视角中有129个七段、 67个八段、21个九段、4个十段;问题3的209个牌谱主视角中有111个七段、 76个八段、19个九段、3个十段。

段位分布是多项分布,我们使用贝叶斯检验,代码如下:


由此可知问题1对应的段位显著低于问题3对应的段位,贝叶斯因子达到了18。

由于r值在牌谱中不是整数,且实际分布也近似正态,因此我们采用t检验,代码如下:

由此可知三个问题对应的r值没有显著差别。这也符合我们的直觉:在凤凰场,段位相比r值更反映获取pt的实力。

那么问题就来了,由于问题1和问题2之间、问题2和问题3之间的段位和r值分布不存在差异,我们之前的结论“问题1差于问题2,问题3差于问题2”不会有问题。但问题1段位显著低于问题3,所以之前的结论“问题1差于问题3”是不是得撤回?有没有可能仅仅是过去的凤南中遭遇问题1的人显著弱于遭遇问题3的人而导致的呢?其实不是这样,我们可以采用传统的方法:

控制变量

既然这些牌谱中的主视角七段占多数,我们就把统计的牌谱筛选为主视角为七段。

首先,我们对三个问题对应的七段牌谱中主视角r值重新进行检验,代码如下:

由此可知r值还是没有显著区别。

统计得到这三个问题对应的七段牌谱中主视角最终顺位为[16, 7, 22, 49], [1, 46, 57, 25], [6, 32, 34, 39]。我们使用贝叶斯检验,代码如下:

所有检验的贝叶斯因子都远大于10。因此三个问题下的pt期望依然有显著的差异。

结论

我们发现对于之前讨论的三个问题,实际遭遇了类似的点数分布的人,其段位分布是有差异的。但是当我们只统计七段的主视角之后,仍然说明了三个问题下的pt期望为显著的2>3>1。感谢评论区的提醒,我以后在进行统计时会尽可能控制段位这一变量。


















零之审判的统计学麻将——点数2的评论 (共 条)

分享到微博请遵守国家法律