欢迎光临散文网 会员登陆 & 注册

网络麻将数据的使用方法

2021-12-30 20:25 作者:連鎖  | 我要投稿


1.引言

华语日麻圈语境下的“科学麻将”出自突击东北著《科学化麻将》一书,此书的翻译是通称《79博客》的一部分。由于《79博客》至今仍是华语圈传播最广的日麻教程,“科学麻将”一词便也随之深入人心,几近成为正确打法的代名词。然而截至2021年出版的日麻书籍中,除了突氏的《科学化麻将》、《新科学化麻将》之外,再无一本标题中含有“科学”一词——看来在日语语境下,“科学麻将”竟是很边缘的词。那么当我们在汉语语境谈及“科学麻将”时,究竟谈的是什么的科学,以及科学的什么?

2.不科学的科学麻将

《科学化麻将》得称“科学”的基础是其使用了大量统计数据。巧的是《79博客》的另一部分,《beginner's luck》中,除了一些简单的枚数比较,我们很难看到什么数据和计算,整部教程依靠的基础是作者自己的风格和理解,这也是日麻战术书的常见体例,而通常我们一并称其为“科学麻将”。但是一旦某种打法依靠的基础是自己的风格和理解,又不能穷尽所有可能时,它必然不会属于科学的范畴。就好比围棋定式,纵然再怎么符合人类的棋理,也不免被AI大规模淘汰。而AI本身虽然是科学成果,但它们弈出的定式同样不可能得到严格证明,只能回归名为“棋理”的玄学。

麻将自然也有类似的“牌理[1]”,它是人的感觉,人的经验,人的语言,难以精确,难以证明。以图1为例,有这样一条牌理认为,应该先从下家的风牌,即南风开始打起,因为越晚打的牌越容易被碰,而根据被碰后距离自家下次摸牌的远近,碰牌家是上家时对自家最有利,是下家时对自家最不利。这条牌理逻辑清晰,推论简明,这牌又是配牌第一打,完全不涉及其他要素,对人来讲极易掌握,极易接受,没有副作用,不会学歪。但由于各个选择之间的差距太过微小,手牌距离收益的路又太过漫长,以致于统计数据或基于统计的模拟无力处理滔天的波动,难以得出有效的结果。也就是说,这个牌理既无法证明也无法证伪——尽管它看上去有理有据,但本质上和萨满信仰没什么区别。

图1

人类一思考,上帝就发笑。事实上诸如“立3过7”之类的,看上去更加有理有据的牌理已经由统计数据推翻了[2]。人总是会有所忽略,而牌友们对麻将又不可能有科研级别的谨慎,这些个人经验总结出的牌理、口诀,哪怕经过集体研究,即使当下看着再像回事,也难保不错得离谱。同时,这些牌理虽然我们学习、接纳,照着样去对局,但这就好像前AI时代人们学围棋棋理口诀一样,我们学的永远是人类模糊的经验,这些经验没有实验手段,没有足够的证据支撑,甚至有时候所指不明、适用范围暧昧。因此,牌理不是通过科学方法得出的理论。

现有统计数据的体量也说明了这一点。图2是《新科学化麻将》的目录,可以看到除了第1、2节讲的是牌效率的最后阶段,先制立直判断外,剩下的内容全部属于攻守判断的范畴。《统计学的麻将战术》的内容类似,只多了弃和时的放铳率的内容。这些内容完全不牵扯具体牌形,全是抽象的模型,不会告诉我们翼形、跳一形,或着图1那样的牌怎么打期望高。从这个意义上讲,听牌以前的牌效率,大家打的都是“玄学麻将”[3]。在另一方面,统计数据对场况判断的范畴也几乎无有涉猎。仅考虑all last的点差组合,也能分出二三十种类别,要把这些搞得像现在的攻守判断一样清楚,那至少需要二十倍于图2的内容。可以说,些微的统计数据根本撑不起一个基于数据的打牌体系,实际上没有什么“数据流”,大家都是“感觉流”。

图2

3.不科学的统计数据

统计数据虽不全面,但是否能说至少在攻守判断范畴内我们能打“科学麻将”呢?很可惜,从科学的方法论出发,我们难以给出肯定的回答。即使没有受够统计学训练,相信大家也听说过诸如吃冰激凌导致溺水、美国海军死亡率低于纽约市民之类的段子,数据会骗人,不是把数字堆在一起排排队就叫统计学。比数据更重要的是合理的解释,解释不到位的数据比题图中的金字塔高明的有限。而无论是《统计学的麻将战术》还是《新科学化麻将》,在这方面虽不至于有意忽略,但也是强调不足的。再加之翻译损失的语义,大部分读者对于这些数据都有或多或少的误解,以至于战术手段出现偏差。具体来说,现有的统计在方法上存在如下问题。

试做如下思想实验。玩家群体A先制只立8枚残两面1469,统计这个群体的两面和率得出x翻a巡即立好于默听;玩家群体B先制什么两面都立,统计这个群体的两面和率得出x翻b巡即立好于默听。易见a>b。也就是保守样本统计出了激进策略,而激进样本统计出了保守策略。出现这一现象是因为统计没有区分两面的种类,而只选最好的两面立直,相当于玩家手动帮统计筛掉了不太好的部分,数据自然更激进。如今的数据区分两面的种类是容易的,但总有些难以筛选的项目,比如“我感觉他慢”、“我感觉他虽然是一副露但听了”,这些项目很难转化成精确的筛选条件。

统计学麻将常常被戏称为通通立麻将,这其中有多大程度是受到凤凰玩家规避了一些不利局面,导致统计结果偏激进的影响,值得思考。这些统计没有给出更细的条件,每位凤凰的打法又是一个个黑箱,对“不利局面”的判断也各不相同,即使去筛选,应该采取谁的标准?事实上,上述两本书中的条件设定本就有颇为随意之处,对好形、先制、默听等概念的定义并没有什么特别合理的依据,书中也缺乏关于采取那种定义的论述,不免有诉诸主观情感的嫌疑。另一方面,作为读者我们如何判断书中的结论在何时适用?学习者正是因为没有凤凰的判断能力才需要学习,但没有凤凰的判断能力又难以准确使用书中结论,真是进退两难。当然,凤凰们也许凭经验可以判断书中的内容至少在方向上大体无误,上述所谓保守策略的影响不会大到影响大致结论的地步。但一旦凭借经验,就又难免滑向主观,加之凤凰的打法本来也受这些统计的薰陶,这下更是有了循环论证的危险。

如上,我们知道了即使有统计数据支撑,“科学麻将”也不那么科学。了解这些问题之后,如果还看愿意相信统计数据,那这种相信,也只能算是信仰了。褪去了科学光环,我们终于可以来聊聊怎么使用这些数据了。

4.数据的使用方法

一、注意条件

一如前文提到的,不同作者的统计样本不同,对好形、先制、默听等概念的定义不同。使用数据之前我们首先要确认的就是他们设定的这些筛选条件,而平时群内交流时通常会忽略这一点。更尴尬的是,有时候作者并不会明确写明所有条件,进一步加大了读者的误会。此前就有读者质疑过《统计学的麻将战术》和《新科学化麻将》中的数据不一致,为此突击东北还专门撰文回答[4]。以先制两面立直为例,首先《统》的数据来源于2015年止的凤南对局,而《新》的数据来源于2017年后的凤南对局。这两段时期的总体风格在某些项目上有显著差异。同时,《新》中的诸多表格中的数字,并未直接来自上述统计,而是来自基于统计的模拟。其次,《统》中未区别数牌种类,而《新》中仅选取了两面2558为代表;《统》定义先制为他家未立直,而《新》定义先制为他家未立直且未副露;《统》中未考虑一发、里宝、赤等小项,而《新》考虑到了。以上区别共同作用,导致《新》中的数据显得比《统》更激进了。类似的不一致在每个项目上都存在,读者需随时注意,在实际使用中自己遇到的局面和数据中设定的条件有多少出入,偏离了“平均”多少。


二、牢记比较

麻将是选择的游戏,仅仅知道一种打法的期望是没法做决策的——即立好,可有没有更好的呢?有时候选项又不限于两种——即立比默听好,可是不是还有更好的呢?以有役愚形立直为例,图3是《统》给出的即立和默听的局收支,注意第一行愚形nomi没有默听的数值,因为nomi不存在有役默听。如此一来,第一行的数字就失去了比较的对象,我们即使看到这些数字,也没法用来决策,因为不知道真的选择无役默听时的期望是怎样的。书中后文也确实提到了比较差的愚形nomi应当选择默听,但这只是作者的理解,并未给出数据。其余的愚形虽然给出了立直和默听两方的数据,但读者在实际运用时,切记不要忽略还有诸如默听等改、直接拒听等选项,不要看到立直高就选了立直,遗忘了其他可能。有时候,我们要比较的对象不在同一张表上,比如存在多种听牌选择时,此时需要查阅复数表格才能得到参考。

图3

三、警惕局收支

局收支是统计数据中最重要的指标。一切攻守判断比较的就是局收支。通常认为平场各选择的优劣基本同局收支的优劣一致。然而在类天凤规则中,不说局收支假设的绝对平场,就连相对的平场,从东一局开始就有些崎岖了。图4展示了东一0本场子家听半筋非现物4枚残坎5追立8000点和有役默听5200点的各项数据的差值(使用nisi作hosimyu4模拟,凤南七段pt设置)。可以看到立直的局收支一直领先到12巡,但pt收支从一开始就不如默听了。其原因在于天凤的pt只与顺位相关,并且各顺位的间距不平均。细看顺位分布,能够发现立直很大程度只是把2位变成1位,却把23位变成了4位。如果说在实战能出现的最平的平场,局收支都要减500点才能应用的话[5],那这个指标的价值还有多少呢?这是需要此后的研究反思的。而在实际使用中,我们又发现给局收支加多少修正又只能依靠读者自身的水平,这也说明了统计数据终归只能是辅助。

图4

5.结语

至此,我们指出了人类的经验总结出的牌理不能称为“科学麻将”,意图通过统计学方法研究麻将的尝试也不怎么“科学”。而从学习的角度上讲,统计数据更像是工具书而非教科书。我们不能完全依靠数据构建打法,使用数据时要辨明可能导致数据和实际情况偏差的原因。而要做到这一点,还是需要不断实战与总结。没有科学手段铺出捷径,那就只能靠传统方法一点一滴打磨。如果说还有什么是科学的,至少,我们应该保持科学的麻将观,尊敬概率,相信随机,少谈流势,多讲逻辑。


[1] 指类比于棋理的牌理,不是天凤牌理的牌理。

[2] https://t.bilibili.com/569798283076947104

[3] 现在网上有不下三种“一人麻将计算器”类程序能给出高向听时各选择的局收支期望,但顾名思义,它们通常不能考虑到副露影向、不同牌的荣和率和存量的不同、他家动向的影响等要素,指导作用有限。

[4] http://hobbyjapan.co.jp/mahjong/explanation.html

[5] 当然,先制和弃和时,局收支和pt收支的不一致没有这么严重。



网络麻将数据的使用方法的评论 (共 条)

分享到微博请遵守国家法律