【三国杀】单挑模式简要释疑
有关三国杀单挑的讨论自标风时代起就一直在各种三国杀论坛、群聊及线下玩家的交流中屡见不鲜。后来有前辈创立并完善了一套基于加权人头表和单挑赛的全扩人头测试排名体系,并历经三国杀数年间的种种变革传承至今,测试总局数能以十万计。在我的印象中,单挑测试之前始终是个圈地自萌的小圈子,大众讨论的单挑内容也大多都是一些老生常谈的话题。然而,随着游卡公司和三国杀近几年日渐“蒸蒸日上”,加上新媒体和部分测试者的推动,最近我见到对单挑模式或单挑测试的讨论日益增多,其中当然也少不了误解、疑问乃至质疑或讽刺,写此专栏的目的便是尽量全面地回答各种相关的问题,以期达到的效果是,当看过此专栏的您以后再见到有人在某视频评论区或是某贴子下问出类似“单挑为什么不禁闪电”,或是说出像“A武将为什么不能打过B,我用A内奸单挑B主公没输过”这样的问题或言论时,可以直接复制此专栏链接予以回应。另外,有关问题也可以给新的测试者一个简要的参考。

声明
1.我才疏学浅,正式参与测试的时间也短,有些问题未必了解。单挑领域的前辈很多,如有错漏,还请斧正。
2.写这样的东西就不可避免要回应一些争议问题,我会尽量以相对委婉的描述介绍这些问题,力求避免或减少文章本身带来的新争议。同时,我也会尽力绕过一些个人观点性的陈述,除非这种观点已经得到单挑组内广泛认可。
3.受个人精力所限,我只会长期参与三国杀移动版(手杀)的单挑测试。本文中所写的内容对于各服测试基本上是共通的,对于一些手杀与其他服不同之处,我会单独说明。
4.本文不对某组特定对局的优劣或者某个武将的强度展开讨论。

目录
(一)意义篇
1.单挑的意义
2.测试对局的意义
3.测试是否有物质利益
(二)规则篇
1.单挑规则
2.关于“运气牌”和运气
3.关于身份、势力等
(三)结论篇
1-2.如何确定结论
3.先后手相等的原因
4.如何知道结论
5-7.关于结论不一致及修改
(四)排名篇
1-2.单挑排名及其计算方式
3.关于禁将

(一)意义篇
1.
问:打单挑有什么意义?
答:作为一个只有两个人参与的相对简单的模式,纯单挑模式可以帮助玩家快速地熟悉武将操作、粗略感受武将在类似情境下的发挥、了解技能特点及克制关系,进而学习一些处理实战残局单挑的方式。正是因为这个模式难度相对简单且没有多方制衡因素,使得玩家尽力追求并接近操作的极限成为了可能。在此基础上,产生了一批单挑测试的爱好者,旨在用统一的标准测试武将之间的单挑优劣,并整理出武将单挑的排行榜。
特别要说明的是,虽说单挑模式与其他模式有一些可以互相借鉴参考的地方,但请不要将武将在单挑测试中的排行与武将强度划等号。
2.
问:用两个起手秒人的爆将单挑有什么意思?用一个控牌将打一个菜刀有什么好玩的?拿一个壕将去打平民将,就算打赢了又能证明什么?……
答:如果上问仍不能回答您关于单挑测试意义的疑问的话,那您只需了解,我们只是基于自己的兴趣参与测试的。我们想探究武将的单挑强度,想知道单挑强将的任何一组对局的优劣,并不带有任何针对性的目的。
3.
问:游卡会给你们全武将的号用作测试吗?会给你们钱作为回报吗?
答:不会,单挑测试与游卡公司没有合作,几乎完全是零物质回报地在做测试。同样因为这个原因,你也可以相信单挑测试的初衷应是客观地通过实际对局数据把握武将之间优劣,而非出于利益或者对武将的个人感情。
有些观众可能想要数据又够快又绝对准确,甚至想要我们在(以手杀为例)测试服的将刚一上线时就把对局结论测明白,方便决定氪金策略,这在目前的人员规模下确实是无能为力,另外我个人也不会在测试组内助长只关心强将、贵将单挑结论的风气。部分测试者还会为了测试进度的正常推进牺牲很多休息时间,去测一些存在感不高、对局节奏慢或是测起来比较无趣的对局。在回报与产出不成正比的情况下,愿意稳定投入时间做这件事、能和他人正常合作交流并且技术不差的人在玩家群体中的比例很低,也希望大家不要对测试者太过苛责,至少不要因为测试结果不符合心意就随随便便恶语相向。

(二)规则篇
1.
问:纯单挑测试的规则是什么?
答:两名玩家参与,各一名武将直接对垒。初始状态下两名武将的体力、体力上限与武将牌上标注相同,各4张手牌。神将和双势力将开局可在已知对方武将但是不知道先后手的情况下自选势力。
如无特殊说明的话,牌堆与军争模式使用牌堆相同,对于移动版来说,使用160张军争牌堆,不包含【木牛流马】(OL及十周年单挑表默认使用包含【木牛流马】的161张牌堆)。
纯单挑模式双方没有身份,也无法使用任何包括主公技在内的任何与身份直接相关的技能。随机一方作为先手先行动,先击杀对手一方为胜利,其余规则与军争模式相同。
2.
问:单挑为什么不禁【闪电】?为什么不禁【乐不思蜀】?这不就是运气牌吗?
答:我不否认这些牌的确有非常大的运气因素,但这些牌既然已经作为牌堆的一部分,那就没有任何禁掉它们的理由。在普通的实战中,劣势一方使用挂闪电求翻盘也是非常重要的事情,很多对局尤其是节奏较慢的对局,分出优劣的主要区别便是双方抵抗闪电能力的高低,就更不用提一些具有更改或控制判定能力的将了。
至于这些牌带来的方差影响应该如何解决,答案也是显而易见的:加局数。正如扔十次硬币有八次正面的概率远大于扔一百次硬币有八十次正面的概率一样,当总局数足够多的时候,这些问题就不再是问题了。
当然,说起来容易做起来难,“加局数”背后隐藏的是成倍增加的测试精力,在实际操作上远没有禁闪电简单。但是,即便牌堆本就没有闪电和乐不思蜀这样的牌,也不会对在保证同等准确度下所需的测试局数有多大改善,更不必说在有这种牌的牌堆强行禁掉这种牌本身就带来了一定程度的数据准确度损耗了。
3.
问:为什么单挑没有身份,不是一主一反吗?凭什么神将可以自选势力而不是随机?又是为什么不能根据先后手选不同的势力?这不是和实战不一样吗?
答:任何一种规则都无法做到令所有人满意,因此我们只能在武将强度测试、对局测试与传统的身份游戏规则三者之间找到一个平衡点。单挑测试的规则都是基于测试者讨论所得到的最被认同或是最利于测试的标准。如果您不能接受我们这样“定义”单挑规则的话,您也可以只将其理解为我们这些测试者之间的“村规”。

(三)结论篇
有关定结论和结论正确性的东西事实上足够单拿出来专门写一篇专栏了,不过为了尽量避免观点上的争议,有些不值得说、不适合说或是单挑组内仍未统一意见的问题我会适当略过。
1.
问:一组对局的优劣是怎么确定的?
答:对于通常双方比分较为接近的对局,正常流程是由双方测试者在测试前或测试途中约定测至某个局数,这个局数一定是偶数,一般会是三五十左右,对于部分重要、难分优劣或是在测试途中被认为有明显运气偏向的对局可能达数百。然后测试至约定的对局数量,并保证测试途中双方先手局数相等。此期间如果一方有改良打法,此前的数据理应视作“学费”全部舍弃。之后再根据对局结果确定优劣,比较传统的标准是,一方胜率在47.5%以下定劣,52.5%以上定优,二者之间定平。现在的实际测试过程中对这一标准有一定程度的适应性改变,但总体思路基本相同,在此也不详述。
2.
问:如果最后胜率卡到边界上,不还是会出现改变其中一局结果就会改变整组对局结果的“运气”情况吗?
答:是的,而且这是无法避免的。我们无法创造一种确定优劣的方式,使得每组对局都能根据有限次对局结果得出确定的结论。以我个人的理解来说,“平”这个档位的出现意义很大程度上也是作为优劣两端的缓冲地带。没有人有条件为了百分之一、百分之二的胜率波动而无止境地加测下去。
不过,还是值得说明的是,在一组对局几十局的测试途中会出现成千上万个多多少少带有随机性的“运气”点,一组对局的测试结果与理论值间的波动其实是所有这些因素的叠加。依旧以扔硬币来举例的话,这就像扔999次硬币比较正面多还是反面多,前998次试验恰巧正反面次数相等,仅由第999次试验确定结果,在数据置信概率上显然也不能认为前998次白扔了。同样道理,把一整组对局的结论归结为某一特定对局的某一个或几个运气点也是不科学的。
3.
问:为什么测试对局要双方先手相同?先后手不也是对局的一部分,应当依靠加局数解决吗?
答:因为先后手是很容易控制,具有标杆意义,且对任何武将任何对局都有共同确定概率的因素,它与具体对局无关,同时对对局结果的影响又很大。简单来说,不同于在(二).2.中谈到的运气牌问题,控制双方先手相同是百利而无一害的。
4.
问:从哪里才能知道测试结论?
答:如果想知道手杀某一组、某几组对局的结论,或是想知道某武将在单挑榜中的排名,都可以私聊问我。至于OL、十周年(以及跨服)的测试结论最好是去找对应的数据测试者询问情况。国战的单挑也有测试者在测。其他模式或者海外服、小程序欢乐杀等其他服暂时不在测试范围内。
5.
问:XX武将凭什么能赢XX?明明我上次排位用XX吊打XX!写这个结论的人会玩XX吗,是不是**?……
答:单挑模式和其他模式进入单挑时的情况是不同的(随机先手、不刷手气卡、初始状态),单挑排行榜的排名和武将在其他模式中的表现更是没有必然联系。另外,部分单挑对局的结论和克制关系可能是与您想象中的结果不一致甚至相去甚远的。所以对于自己没测试过对局就来质疑数据准确性,特别是言辞不太好听的人,我们是不太欢迎的。
在此之上,对于结果相差不大的每组单挑榜前50名武将的相关对局,基本上都是经过二三十以至上百局的测试才确定的结论,参与测试的双方测试者对武将纯单挑模式下的玩法和特点一般也有几十几百局的了解。我们还会一起探讨并完善打法、作废掉技术不精或者打法不成熟的对局数据、选出最合适的测试者参与测试,显然也不是不会玩某个武将就随意定的结论。
这么说绝对不是想自吹自擂或是说明测试数据有多准确。事实上前50名武将的单挑人头表中是一定存在许多问题的,我也完全不掩饰这些问题的客观存在性。而且即使测试者的数量再多十倍,且个个都是有充足时间打单挑对局的顶尖高手,因为测试数据量和运气的偏差,出现零星的结论问题也仍是难以避免的。只不过,路人没头没脑的质疑确实很难让人相信,而即便是自己声称经过大量测试的“踢馆”准确率也不高,希望能被理解。例如,截至写到这里时,我个人就回应过三次来自测试组外的踢馆,一次在QQ群,两次在贴吧,这三个人最开始都觉得自己测的数据多且不可能出错,最终全部铩羽而归。我还见有人在贴吧自称他自己实测过,听了我测了32场得出的结论之后二话不说一口咬定我根本就没测,说我是脑杀在装测过,不是真傻就是装傻,那我当然也只能“顺从”他并且不再回复了。
6.
问:如果我测出了不同的单挑结论?
答:(只对于手杀来说)
如果你的测试量不大,或是实测结果和我们的结论相差不大,那都是很正常的情况。包括有的对局在小优小劣与平之间的,正如(三).2.中提到,出现一点偏差在容忍范围内。
如果测试数据之间有明显偏差,且你对你的数据比较自信的话。可以私信联系我,尽量不要打扰其他测试者。
7.
问:为什么部分对局的单挑结论会改变?
答:在排除了消息来源不同、武将版本不同、测试临时数据外泄、部分人对部分对局结论观点不同等原因后,剩下的那一部分改变的结论也会被称为“翻案”。大致就是测试者对原先的数据进行了重测(可能伴随打法改进)并对结论进行了更改。与之相关的问题存在一定争议,不在此详细讲。
8.
问:怎么加入手杀测试组?
答:如果你对单挑感兴趣、愿意且能够(有时间有号)长期参与测试(特别是一些关注度没那么高或对局节奏慢的武将的测试)、阅读了本文其他内容并且能接受这种测试方式的,欢迎私信联系我,仅限手杀。这一问不会写在目录里。

(四)排名篇
1.
问:单挑排名是什么?怎么计算出来的?为什么A会被B吊打,还能排在B前面?为什么这个排行榜里A在B前面,另一个排行榜B在A前面?
答:单挑排名是根据已有测试结论,评估武将单挑相对强度的工具。主要衡量标准为某武将打得过和打不过的武将数量。具体方法为:对于排行榜前列的武将(目前对于三服来说都是前50),根据这个武将劣和平的各档次武将数,加权算出一个值(叫做“人头数”),“人头数”少的武将在前。对于排行榜靠后的武将,只粗略排名,如果曾经进过前50的,或是离前50不远,在测试时也测了完整“人头”的,那就有了大概的单挑位次;如果没有进过前50,可能要依靠与实力相近的“标杆武将”的相互战绩或是在单挑赛中的战绩来确定排名。
因此,排名靠后的武将不一定打不过排名相对靠前的武将,两个完全相同的武将的相对位置在不同服也可能不一样,甚至随着武将的增添修改,在同一个服的不同时期发生位置交换也是常有的事情。可以认为在单挑表中排名相近的武将单挑处于同一档次,很难确定地说谁比谁强。
当然也存在一些其他的单挑排名方案,其中有的合理但是不适合现在使用,有的从根源上就不合理。
2.
问:人头数的加权是什么?
答:加权是为了更客观真实地展示武将单挑强度。劣一个S级将计3人头,劣一个A级将计2人头,劣一个BC级将计1人头,打平则减半。在手杀,S级将指单挑排行中前30名的武将,A级将指前100名的武将,其余为BC级。
可能会有读者留意到这本身是个循环计算,不过在实际操作中这并不会带来什么难以解决的问题。
3.
问:禁将是什么?为什么会禁?
答:禁将是因为某些原因,已经正式上线身份场,却不被排入排行榜,也不计入其他武将人头的武将。
对于目前的手杀来说,长期禁将主要分为以下几种:
(1)界限突破前的标将
其中很多武将的技能组都和界将有一定重复,武将同名且界将一般都比标将更强(虽然不都如此),加上为与其他服的测试统一标准起见,全部禁掉。也正是因为这个原因,在讨论单挑时,如果这个武将有界限突破版本,那么直接说武将名字,默认指的就是对应界限突破版本。
(2)心理博弈在对局中占比过大的武将,例:于吉
这种武将只能给出一个大概的强度,换两个测试者来测同样的对局可能会得出完全不同的结果。甚至同样的两个人随着对彼此打法越来越熟悉,都可能出现类似“石头剪刀布”一样的循环打法,这会给测试结果带来很大不确定性。
(3)无法消除有关身份技能影响,例:袁绍
在手杀测单挑的方式是两人开军争自由房,双方有身份,与单挑测试规则不太相同。以袁绍为例,袁绍的主公技〖血裔〗在单挑群雄对手时会带来增益,而且测试者无法避免。在当前测试主战场只有手杀正式服的环境下只能禁掉。
(4)机制不透明,例:郑玄
可能存在的情况是,我们测完一个武将,游卡暗改了这个武将的概率,全部白测。更可怕的是,如果我们没发现它被暗改了,就相当于是测出了很多错误的结论。这是我们不能接受的。
(5)化身类,例:左慈
化身将池也在调整,没有一个稳定版本供测试用。而且这种武将本身也不太适合测试。
(6)对局过慢,例:华佗
进攻太弱,却有额外的防守/回复实力,和其他类似特点且强度相近的武将存在互相打不进去,一小时也结束不了一局之类的问题。
这个榜单可能还会被调整,例如关于仍在测试服的谋攻篇如果加入身份模式该如何处理还有待讨论。细节到某个将的归类或者被禁是否合理这种细节问题不在本文讨论范围内。

其他问题可能会在之后修改或补充。