七对子相关的NAGA分析【2】——七对子待牌的选择——以宝牌0平场亲家三巡先制听牌为例
二、七对子待牌的选择——以宝牌0平场亲家三巡先制听牌为例
右上角的打牌检出选择,表示的是此阈值下NAGA给出白条异议,选择下一个阈值时NAGA表示无异议。(由于设计问题,立否判断(红条异议)不能以此法表示,该项无意义)
1.待牌的选择
宝牌0平场亲家三巡先制听牌的情况下,选择待牌的顺序为:
无筋28D*>现1客风≈现0客风>>现1役牌>无筋0DD?>>>无筋357D*>现1双役牌>役牌>筋19>无筋46D>>双役牌>无筋0*>现1筋19>>无筋19*>筋28>>>筋37>地狱单骑字>无筋28>现1无筋19,除极少数情况下应立直。
这里要说明的是,“全、多、并、少”评判体系是按照NAGA的检测阈值决定的,与局收支之类的判断标准相关但并不能等同。因此“>”判断的传递性是存疑的。即A>B,B>C实际上并不能直接推出A>C。但为此不重不漏地两两检查未免过于复杂,故我们往往默认优于判断的这一传递性。但仍需注意,出于相同的原因,从"无筋0DD>>>无筋5D>现1双役牌”推出"无筋0DD>>>现1双役牌"类似的推断,也是不成立的。
另外要指出的是,“>”判断往往跟场况有关(即使这是三巡的情况),场况的改变后得到相反的判断也不奇怪。因此实际上只有一个“>”的优于判断是不稳定的。对其中很不稳定的“>”判断,给出了“*”标识。
对于不能在只有1个表宝牌指示牌的情况下进行的判断,给出了“?”标识。


















2.现0客风与现1客风的优劣讨论
文中给出了现1客风≈现0客风的结果,因为二者的差别无法通过NAGA进行分析。试看以下四则试验:




可以看到客风究竟是现1还是现0对NAGA的选择几乎没有影响,不如南西北各自之间本身的差异大。因此,本文给出现0客风≈现1客风的结论。
3.待牌优劣的半定量分析
在为待牌优劣排列的基础上,我们想知道具体的两种待牌之间的差距究竟有多大。因此针对一些待牌选择选择进行的优劣的判断。

需要说明的是,实际上无筋28D、无筋0DD、无筋5D、无筋37D、无筋46D是不能在只有一个表宝牌指示牌的情况下直接比较的,故其彼此之间的比较必然存在有人开杠的情况。
根据上图的数据,加以一定的逻辑推断,我们填充空白区域得到下图的比较表:

有人提出疑问,为什么会出现负数呢?如前文所言,“全、多、并、少”评价体系是按照NAGA的检测阈值决定的,与局收支之类的判断标准相关但并不能等同,并且NAGA作为深度学习的AI,在AB二择时A胜出的情况多,BC二择时B胜出的情况多,CA二择时C胜出的情况多,从而得到A>B,B>C,C>A的结论也不是不可能…诚言之,麻将本身就是概率的游戏,在没有足够多的样本量之前,这样的评价其实意义有限。
回到表格本身而言,根据理论进行推导,表格的趋势应当是从右上至左下,数字逐渐变大。但是直观地去观察这个表格,第一感觉却并非是从右上至左下绿色渐深,而根据感觉大致可将其划分为两个部分:现1筋幺九以上A部分和现1筋幺九以下B部分。A部分的排列明显散乱而缺乏规律,B部分的排列则基本规整,色块均匀。
那么,理论和实际不符之中存在着什么问题呢?有人或许认为:B部分的数字大部分都是自己填充的,所以造成了这一现象,实际上以如果继续试验下去,B部分也会一样散乱,AI的“神经质”罢了……那么,我们这样去填充原始数据的空白区域,是合理的吗?
我们不妨看看下面这张图:

直观感受是什么呢?确实有从右上至左下颜色逐渐变深的感觉了。而这张图片和原始图片的区别,在于将所有A部分中带有宝牌的行列去掉了。
我们再看看去掉A部分中所有不带有宝牌的行列是什么样子的

大体上讲依旧符合理论趋势
这里也能看出将单骑待牌分为A、B两类的合理性。A部分的待牌是字牌、类字牌、宝牌待牌,以和率或得点面对B部分待牌时拥有决定性优势。只以和率或只以得点论时,A部分和B部分的组合能形成符合理论期望的形态,因为二者的差别往往是明显直观的;而若将其耦合在一起考虑,则出现了混乱的情况。这正是优于判断并非局收支判断,在存在多种影响因素时判断传递性大大衰减的结果。
4.地狱单骑字牌
地狱单骑字牌可以说是试验中相当恼人的部分了,其虽然是B类待牌,但又在B类待牌中表现出极大的跳脱性,有时比筋28还要强,有时又不如无筋28了。因此对于地狱单骑字牌来说,可能最佳的答案是:看情况。


5.结果与讨论
宝牌0平场亲家三巡先制听牌的情况下,选择待牌的顺序为:
无筋28D*>现1客风≈现0客风>>现1役牌>无筋0DD?>>>无筋357D*>现1双役牌>役牌>筋19>无筋46D>>双役牌>无筋0*>现1筋19>>无筋19*>筋28>>>筋37>地狱单骑字>无筋28>现1无筋19,除极少数情况下应立直。

相比于第一期而言,本期结论的适用范围无疑狭窄的多,考虑到表格本身就耦合了打点与和率因素,故宝牌数量的改变、巡目的推进、亲子的变化等等都可能产生显著的影响。故,要得到全面的结果,类似工作量的试验可能还需十余次,其中最为重要的无疑也就是巡目的推进和宝牌数量的变化了。
在牌理层面的讨论,我们可以发现数牌5与数牌46的显著区别。从七对子狭窄的待牌而言,占据待牌总数1/3的红宝牌已经可以对结果产生显著影响了。但换个角度看,这又仿佛说明了无筋5D和无筋46D之间的广大区域,差距甚至不如1/3的红宝牌大。考虑到这1/3的红宝牌要发挥出实际作用,要不然需要在自摸的同时复合一发/海底,要不然需要他人主动打出双宝牌红5放铳……怎么看都是很微小的差别了。
然而,又考虑到所谓“全多并少”判断体系没有传递性,其中的差别或许又没有我们想象的那般小了……