欢迎光临散文网 会员登陆 & 注册

占卜师的占卜术(1-背景篇)

2023-01-08 10:11 作者:二阶堂crazy  | 我要投稿

一、前言

       知识不应该收费,因为知识是无价的。请尊重他人的劳动成果。

       对此文的任何部分有任何不明确的点或者异议、以及有任何深入研究的想法,欢迎私戳笔者友好讨论。


二、背景

       请看以下牌型:

背景-图1

       图1切7p后默听满贯,4p是传统意义上的“大中张”,这里就有两种逻辑:第一是“反正其他人也不会切,那不如立直压制他们做牌,自摸还能有跳满”,第二是“不立直还是有可能可以捡到其他人漏出来的4p的,自摸满贯也不亏”。之前有教练对这种愚型中张有役默听x翻(x∈[3,6])进行了局收支期望的讨论,这里先按下不表,想回答一个更本质的问题:在这个巡目,其他三家舍出4p的概率到底有多大?

背景-图2

       在图1的基础上,有了图2。打点和图1完全相同,区别是4p在“大中张”的基础上,变成了dora。同样是前面的两种逻辑,“反正其他人也不会切”的感觉进一步提升了,或许判断相比图1又有了一些变化。同样,这里想回答一个更本质的问题:在这个巡目,其他三家舍出身为dora的4p的概率有多大,相比普通的情况减小了多少?


背景-图3

       图3切9m后虽然听牌14m,但对4m完全没有兴趣。这里也有两种逻辑:第一是“他家在这个巡目切1m的概率比切4m高多了,那不如默听等1m,他家切4m见逃,自己自摸4m可以振立”,第二是“即使立直后1m的荣和期待也显然高于4m,与其这样不如追求自摸1m的倍满,自摸4m也能稍微好受一点”。类似图1和图2,这里也存在一个本质的问题:在这个巡目,其他三家切1m的概率到底比4m高多少?


背景-图4


       在图3的基础上,有了图4。相比图3,1m变成了dora,默听荣和其他家1m的期待显然是下降了,或许判断也有了一些变化。同样,这里的本质问题是:在这个巡目,当1m是dora的情况下,其他家是更容易切出1m还是4m,相差多少,相比1m不是dora的情况变了多少?

        为了定量讨论这些问题,需要从大量实战牌谱出发,抽取每一巡的舍牌,并对其进行统计分析。为此,笔者爬取了2021年所有四凤南喰赤的牌谱,提取每一小局的前48张舍牌以及dora信息,并进行整合、分析和讨论。


三、方法

1.牌谱提取

       天凤提供了从2006-2021年间、按年区分的牌谱合计,从https://tenhou.net/sc/raw 即可下载。本文选取2021年的所有凤凰卓牌谱,并从中筛选出规则为四凤南喰赤的对局,约有18.7万局。

       下载到的牌谱链接格式如https://tenhou.net/3/?log=2022120216gm-00e1-0000-98e2fb83&tw=3 。此类格式会自动生成常见的动态牌谱而非可文字化处理的牌谱。对其中某些关键字符进行替换后,变成如http://tenhou.net/0/log/?2022120216gm-00e1-0000-98e2fb83 的链接,即文字版牌谱。

       对下载下来的所有牌谱,批量替换上述关键字符,爬取得到约18.7万个文字版的四凤南喰赤牌谱。

2.文字版牌谱解释

       以上述链接中的东一局零本场对应的文字版牌谱“<mjloggm ver="2.3"><SHUFFLE seed="mt19937ar-sha512-n288-base64,1GUPHze3P5…" dan="18,17,17,17" rate="2322.21,2183.54,2299.71,2192.52" sx="M,M,M,M"/><TAIKYOKU oya="0"/><INIT seed="0,0,0,0,4,83" ten="250,250,250,250" oya="0" hai0="39,121,3,112,134,115,107,130,111,59,63,10,22" hai1="104,135,58,44,9,88,61,81,42,57,55,82,132" hai2="109,100,37,26,86,13,106,103,119,12,51,62,46" hai3="43,126,102,21,77,2,73,66,116,85,27,129,11"/><T89/><D121/><U98/><E58/><V78/><F37/><W93/><G116/><T71/><D130/><U99/><E9/><V133/><F119/><W127/><G73/><T35/><D35/><U34/><E34/><V50/><F109/><W122/><G129/><T28/><D39/><U118/><E118/><V36/><F36/><W117/><G117/><T45/><D107/><U49/><E104/><V4/><F133/><N who="1" m="51273" /><E82/><N who="2" m="47447" /><F106/><W97/><G122/><T56/><D10/><U125/><E125/><N who="3" m="47626" /><G66/><T38/><D56/><U41/><E41/><N who="2" m="24911" /><F62/><W29/><G43/><T40/><D40/><U0/><E0/><V75/><F75/><W87/><G77/><T15/><D63/><U30/><E30/><V95/><F4/><AGARI ba="0,0" hai="2,4,11,21,27,29,85,87,93,97,102" m="47626" machi="4" ten="30,3900,0" yaku="18,1,52,2" doraHai="83" who="3" fromWho="2" sc="250,0,250,0,250,-39,250,39" />”为例,进行如下解释:

1)      数字与牌的对应

       整体顺序为1m→9m→1p→9p→1s→9s→1z→7z,即数字0-3均对应1m,数字4-7均对应2m,以此类推。特别的,16表示0m,52表示0p,88表示0s。

2)      版本号与种子码

       以“<mjloggm ver="2.3"><SHUFFLE seed=”开头,和研究内容无关,无视。

3)      玩家信息

       “dan=”表示四位玩家的段位,“rate=”表示四位玩家的R值,“sx=”表示四位玩家的性别,无视。

4)      对局信息

       “INIT seed=”对应单一小局信息,其中例如" INIT seed=0,0,0,0,4,83",第一个0表示东一局(1表示东二局…11表示西四局,以此类推),第二个0表示供托0根,第三个0表示0本场,第四和第五个数字意义不明,第6个数字83表示dora指示物,83对应3s,因此本局dora为4s。

“ten=”表示小局开始时四位玩家的持有点数,无视。“oya=”表示本小局的亲,0代表东起玩家,1代表南起玩家,以此类推,无视。

5)      配牌

       “hai0=”,“hai1=”,“hai2=”,“hai3=”表示四位玩家的配牌信息,无视。

6)      摸牌与打牌

       每一对尖括号里的字母+数字即代表摸牌与打牌。其中,T, U, V, W开头的分别对应东南西北玩家的摸牌,无视;D, E, F, G开头的分别对应东南西北玩家的打牌,是需要提取的核心信息。这里仅提取前48打,即对应前十二巡的舍牌。

7)      鸣牌与立直

       N开头的尖括号表示鸣牌信息,包括鸣牌人、鸣牌方式、鸣牌后打牌等信息。笔者在处理时认为鸣牌后场况发生显著变化,因此所有鸣牌后的打牌不纳入研究。

       Reach开头的尖括号表示立直信息,包括立直玩家、立直后玩家点数、立直宣言牌等信息。同鸣牌,立直后场况发生显著变化,因此立直后的打牌不纳入研究。

8)      和牌与流局

       AGARI开头的尖括号表示和牌信息,包括和牌玩家、场供、和了牌型、役种、打点、和了后点数等信息,无视。

       RYUUKYOKU开头的尖括号表示流局信息,包括场供、听牌与否、听牌玩家牌型、流局后点数等信息,无视。

3.牌谱处理

       对约18.7万个牌谱进行处理。

       由于南场通常点数分布不均匀,会存在舍牌的偏倚,因此笔者仅纳入了东场的数据。利用INIT seed对应的单一小局信息,筛选第一个数字为0-3的对局,分别对应东一局、东二局、东三局和东四局。共从约18.7万个牌谱中提取到约107万个对局信息。

       利用INIT seed的最后一个数字,存留dora指示物信息,其余信息删除。

       记录D, E, F, G开头的尖括号内的数字,即为对应玩家的舍牌。利用数字和牌的对应关系,将数字转换为牌,并进行分类统计。同时,对每一小局,根据dora指示物的信息进行归类,以分析dora相关的舍牌特征。

4.处理软件

       信息爬取、大批量的文本处理使用python。

       舍牌的统计分析使用excel。

       统计图绘制使用thinkcell。

5.术语解释

       此文的“dora”指第一张表宝牌指示物确定的宝牌,不包括赤宝牌、里宝牌、杠宝牌等。

       此文的“役牌”仅包括白、发、中三种,不包括自风、场风。





占卜师的占卜术(1-背景篇)的评论 (共 条)

分享到微博请遵守国家法律