【IZE】衡量珍珑精确操作的标准若干

0. 前言
本文是一份讨论软性标准的指导性文件,主要适用对象为IZE珍珑中的精确操作。
下图展示了一种IZE阵型的分类方式(仅供参考):

嗯,讨论上图中每个概念的含义实在太费篇幅了……暂且略过。我们只需要知道,平常所说的“珍珑”只是排阵里的一部分(所有人为且有目的性地布出的阵型都可以称作排阵),本文也只照顾这一部分。
那么“精确操作”指什么呢?顾名思义,精确操作指对【精度】有硬性要求的操作,掐准过,掐歪死;手快过,手慢死。这里还有另一种分类方式,即:1)核心操作,是珍珑质量与价值的关键来源。可以理解为:若失去了核心操作,珍珑也就失去了意义。2)是非核心操作,仅为摆图方便,不具有必要性。因此有些精确操作属于核心操作,有些不属于。
如何区分这些操作应当是很直观简明的。若有杠精执意钻牛角尖,我想说本文可能不是很适合你,请自行右上角。事实上接下来的任何内容都不适合杠精阅读,在此先作提醒(

1. 从基础出发:理解IZE里的操作
一套泛用于不同领域的对“操作”的定义是:游戏内鼠标光标显示为【可交互】,或任何有意义的键盘输入,均属游戏内的操作元素。简单枚举后,可以得到六大基本操作元素如下:
用卡
用炮
用铲
收集资源
暂停
键入指令
窗口模式下,还有一些可能的附加操作,例如拖动窗口、点击屏幕外暂停(与ESC/空格键效果相当)等,尽管有意义,但一般不作为游戏内操作讨论。
当然,我们知道上述有些操作在IZE内是不存在或无意义的。
在IZE里,具体操作主要有四种:用卡(拿僵尸与放僵尸)、暂停(补手速或女仆秘籍等)、收集资源、键入指令(如dance)。常规珍珑规则禁止女仆秘籍与dance指令的使用,而收集资源通常无关紧要(满溢危机:察觉.jpg),故我们只需关注【用卡】与【暂停补手速】,提取出下列四项操作任务:
迅速放置任务 —— 使用暂停补手速,快速放置多个僵尸
掐秒任务 —— 存在合理参照物(包括视觉/听觉)且不被暂停干扰掐秒连贯性时,在尽可能最优的时机放置单个或多个僵尸
反应任务 —— 对某可预见但不可预判的随机事件进行迅速反应,尽可能快地在事件发生后放置僵尸
判断任务 —— 根据可见信息,判断接下来应当执行的操作分支
一直以来,我们对任务④的态度是放之任之;这也很好理解,毕竟判断难度难以衡量,判断能力又个人差巨大。秉持着多一事不如少一事的理念,笔者机智地决定避开④相关的问题不谈,假设优秀的解珍珑者拥有完美无瑕的精准判断能力(反正大部分珍珑也不关心这一点)。

2. 提纲掣领:衡量精确操作的三条标准
其实就是三个词:
合规性 —— 针对珍珑性质
完备性 —— 针对珍珑质量
稳定性 —— 同2,针对珍珑质量
接下来我们会一一分析这些概念。

2.1 合规性
合规性存在的唯一意义在于将“普通珍珑”与“预设解法需要使用高精度辅助工具的珍珑”区分开来。理由很简单,“允许神操作”不是让神来操作,使用辅助工具借助高等力量是不包括在内的。
参考各方资料反复讨论后,规定标准如下:
掐秒最低精度范围为10cs,途中需插入暂停或参照物难以寻找的特殊情况另行讨论;
连续放置多个僵尸的最短间隔为20cs;
对可预见不可预判的随机事件最快反应时间为30cs。
统称为“10-20-30标准”。
首先,这个10cs是怎么来的呢?从笔者这个连掐12个精确矿的视频的逐帧分析可知,12次掐秒中最短间隔为551cs,最长间隔为561cs,浮动范围约10cs。很巧合地,手控超多炮里精准冰的操作能稳定实现的精度范围也在10cs左右。
由此,我们认为在无暂停操作干扰掐秒连贯性且有合理参照物(包括植物/僵尸状态,子弹,bgm,甚至外设秒表)的一般情况下,可实现的最短精度范围为10cs。为简化问题,认为此10cs范围内操作落在每一cs上的概率均相同。
然后是连续暂停放置的20cs间隔。这个其实由来已久,自打IZT出世且人们发现一些模型的僵尸过率和放置间隔成显著反比时,就有了对最小放置间隔的20cs限制。和前面一样,逐帧分析可得:普通人类【点击→暂停→移动鼠标→取消暂停→点击】的流程约耗费10cs游戏时间,而放一张僵尸卡需要两次点击,故总间隔约20cs。
最后是最短反应时间30cs。这个非常好解释……生物学告诉我们人类平均反应时间为25cs,受过专业训练的运动员也难以突破10cs。从一些实测反应速度的网站实测可知,30cs是比较合理的最短稳定反应间隔。这条其实用到的频率不高,IZE里绝大多数的随机事件都是可预判的,即便是【植物开火后立刻放僵尸】这种也因为植物攻击动画而可以预判。
若某一珍珑预设解法要求的精确操作明显违反了“10-20-30标准”中的任意一条,则有必要探讨引入高精度辅助的必要性,并重新评估其作为“常规珍珑”或“特殊珍珑”的归类。
补充资料1:热心群友掐bgm法自测

PS:实际上的bgm法需拖窗口重置bgm,误差会更大一些。
补充资料2:医学奇迹


2.2 完备性
与合规性不同,完备性和稳定性不直接影响珍珑性质,而是用于衡量珍珑质量。当然,它们存在对珍珑性质的间接影响,比如某操作手操的完备性或稳定性过低,但逐帧操作可行,可能就会将其重新归类为特殊珍珑。
对于某一精确操作,称其过率最高的操作时机(精确至cs)为最佳时机,对应过率(N≥10000下测定)为最高过率。
则:一项精确操作当且仅当【最高过率】≥99%时,称作具有完备性。
完备性对标的概念是以前说的的“必过时机”(或称“完美时机”)。但随着科技发展,我们发现随机数的上下限实在太宽,但极端情况的出现概率又天文级别地小。比如【底线单冰豆 vs 铁桶】,诚然全程锁0.23+植物最大攻速铁桶的确会死,但这种“会死”又具备多少讨论价值呢?不锁随机数的话,哪怕连测一万次都可能是全过,难道还要再测一万次么?
更合理的做法是讨论【完备】而非【完美】,在测试样本足够大(N≥10000)的前提下,设定阈值x,若测定过率不小于x,就认为具有完备性。IZE界约定俗成的过率描述词如下(见本文定义):

可见过率≥99%就可称为“完爆”。因此,将完备性的阈值设定为99%也十分合理。
有人会问:既然手操存在精度误差,为何还要讨论完备性,岂非太过理想化?这是因为完备性展示的是某操作思路的收益上限,是在理想情况下的最大潜力。好比手控超多炮中,“若操作时机足够精确,某操作是否具有严谨性”是很重要的一项议题。测试条件有限时,检查完备性也比检查稳定性来得简单许多。

2.3 稳定性
单靠完备性,我们无法完整地衡量某项操作。譬如操作A完备时机2cs,但不在完备时机里必死;操作B无完备时机,但前后20cs内任意时机过率都>90%。我们很容易发现,尽管后者没有完备时机,但综合稳定性完爆前者。
基于合规性中对掐秒最低浮动范围10cs的规定,我们称平均过率最高的连续10cs区间为最佳操作区间,其对应的平均过率为浮动过率。
则:若一项精确操作的【浮动过率】≥95%(小样本下允许±1%误差),认为具有稳定性。
例如底线冰豆的精确矿模型,最佳10cs操作区间为延迟910~919cs,在n=250(N=2500)下测定得到的浮动过率为94.92%。考虑到样本量偏小带来的误差,认为精确矿操作是能够稳定实现的。
注:n代表单次cs测试样本量,N代表总样本量。
无独有偶,95%的阈值不仅与先前过率描述体系(≥95%被称作“稳定过”)吻合,也符合一般实践采用的标准,后文会详细阐述。

3. 举一反三:从精确操作延伸至整体阵解
尽管“合规性、完备性、稳定性”三项标准是针对精确操作制定的,这并不代表这些概念无法外推。
我们发现,“合规性”的概念同样适用于完整阵解,即:若珍珑预设阵解包含不具合规性的操作,则该珍珑也不具备合规性。对珍珑作者而言,应对方式无非是:若该操作重要,需考虑重新划分珍珑性质的可能性;若该操作不重要,舍去即可。
至于“完备性”,我们在讨论非精确操作时一般不会提及,因为许多平凡且普遍的操作本就无法确保≥99%的过率,比如【喷花花嘴】这种,总不见得丢个撑杆也不让吧。
“稳定性”的概念对全图阵解一样适用。我们常用的阈值为90%,即:一般珍珑预设解的整体成功率不应小于90%。
除此之外,预设解也要考虑【期望花费】等其它因素,见下。

4. 面面俱到:珍珑最优解的界定标准
对于一般珍珑,衡量某套解法是否是最优解时,应考虑以下因素:
最优解必须同时也是期望最优解;
最优解的整体成功率不应低于90%(对操作时机要求高的,以10cs范围浮动过率为准);
与其余所有解法相比,最优解的期望花费都应保持至少15阳光的优势。
附加说明:
开局与残局判断条件较为特殊,部分或所有标准不一定适用;
若预设解存在重要分支,需仔细衡量各分支解法是否符合上述标准(第二条除外)。
当然了,上述这些只是软性标准,推荐采用但非强制。不过且说一句,未来的年度珍珑赏或其它珍珑集是很有可能采纳此套标准的(或是其改进版)。
另外,即便某珍珑不符合某条标准,也不代表它应当被划为“特殊珍珑”之类,这是严重的概念错位。珍珑归类看的是性质,而符合或不符合上述标准影响的是质量,低质量的常规珍珑与高质量的特殊珍珑都是大量存在的。

5. 部分过往珍珑精确操作的测定
例1 —— 精确矿与“极限矿”的爱恨情仇


一份来自2012年的古早攻略中,称上图中图1为“极限矿工”,图2为精确矿工。
2020年末,经TSV+Rnd测试,最差随机情况下精确矿工仍有必过时机,“极限矿工”则没有,便有了作废“极限矿工”概念的相关提法。
新A类阵通论(2021年1月)对“极限矿”相关阐述如下:
以前“极限矿工”的概念业已作废。实验可知,若矿工速度过慢,即使时机完美亦无法通过原极限矿工模型(1列杨桃+2/3列裂荚),在实战或珍珑中都只能作为一种RP解存在。所以这里不讲极限矿工,只讲精确矿工。
但这样的说法不免具有一定时代局限性,只讨论了完美时机,忽略了完备性以及稳定性。
结合新标准,现作测定如下:

最左侧一列为第一矿(放置后立刻被吸附)与第二矿(于6列放置)的延迟,单位cs。绿色高亮代表平均过率最高的10cs区间;第一行数据为对应的浮动过率。“*”代表白板,“三线”指永动三线。
不难看出,在【稳定性】方面上绝大部分“极限矿工”操作与精确矿工类似,甚至更高。唯一不符合95%稳定性标准的是【1列永动三线、3列裂荚】的模型。
然而,经大样本(N=10000)测定,【1列杨桃、3列裂荚】模型仍旧不符合完备性要求,其最高过率为 9873 / 10000 [98.73%],低于99%。若改为【1列杨桃、4列裂荚】,则具有完备性,最高过率 9984 / 10000 [99.84%]。
综上所述,兼具完备性与稳定性的操作有:
常规精确矿工,1列冰豆+任意列裂荚
非永动杨桃于1列,裂荚于4/5列
以上两者仍统称“精确矿”,因其在精度上的要求类似,不存在谁比谁更高一级。
不具备完备性的操作:
永动三线于1列,裂荚于5列(98.42%,N=10k)
永动杨桃于1列,裂荚于5列(98.38%,N=10k)
若预设解中包括不在上述范围内的“极限矿”模型,非常推荐修改或舍去之,因为它作为核心操作不符合一般要求(也无甚亮点,都是多老的型了),作为非核心操作又无关紧要可以舍去。
例2 —— 双鬼杀星(生物钟1路)

最高过率:100%;浮动过率:98.2%;均符合标准。
在1-5星星有右下方向子弹作为明确参考的情况下,该操作的稳定性是有保障的。但是上述测定比较简单,将两鬼的间距定死在了20cs,实际浮动过率可能偏低。若星星在其它位置且无明确参照物,则不一定能确保稳定性,有必要另行讨论。
例3 —— 梯鬼卡刺卡坚果(雁影分飞2路)

从结论上说,此操作既具备完备性,也具备稳定性。
这里模型较为复杂,既要结合梯子速度卡小鬼过刺,又要控制小鬼放置时机卡坚果。不过实际研究下来,带梯梯子速度浮动带来的影响极小,如上图所示,0.79梯子对应小鬼放置时机为 437~477(延迟,单位cs);0.8仍对应 437~477;即使是0.81也只变为了 434~474。
由于卡刺容错较大,当小鬼范围为 984~993时,理论上梯子于 519~550放置均可确保卡刺。由于3线的存在(极小概率打2下),实际过率并非100%,但无伤大雅。
例4 —— 障鬼鬼卡刺(魔鬼·鱼图4路)
这个图似乎不是很出名,是收录于2020年度珍珑赏的一张特殊珍珑。

解法很直接,4路桶鬼鬼后接1反向,再接2、3,5路控图层双鬼。
按原贴作者的说法:
对于3大嘴4刺 5刺这个模型,路障被扎后,在25cs~71cs选择两个差在24cs~64cs的时间点相继放置两个鬼,就可以保证路帮1鬼2鬼过1刺,同时1鬼帮2鬼过2刺。
原贴说该容错范围对人较小,除此之外并未继续探讨手操的可能性。年度珍珑赏里将其划为特殊珍珑,理由是“允许高精度辅助的使用”。
其实如果使用新标准分析,这项操作并没有超出稳定手操的精度范围。以10cs浮动范围计,一次暂停可以稳定控制在24cs~33cs内(实际可以更短,因为24cs恰巧与常规暂停间隔20cs相近,操作起来很容易),而第一鬼的放置时机在25cs~34cs内浮动。
最差情况下,第一鬼于34cs放置,第二鬼延迟33cs于67cs放置,仍落在必过的25cs~71cs范围内。因此,此操作不仅具备完备性,浮动过率也是100%。笔者也打过一个障鬼鬼连破5路的视频作为辅助证明。
由于此图其它操作对精度要求也不高,可认定为常规珍珑。
例5 —— 卡MJ暴走(舍身取义2路)

此图刚出时,笔者使用TSV+Rnd测试得到【前伴舞不被2列大喷攻击】的MJ完美时机为2cs。然而,当时并未考虑也不知道【小喷+白板】的型里伴舞有一定死率。
现重新测定,得到最高过率约96.8%,浮动过率74.00%,不符合精确操作的一般标准,改为允许使用高精度辅助更加合理。
例6 —— 梯障卡坚果(作壁上观4路)

数据说明:以磁铁吸附矿工为t=0cs,路障于t=252放置,扶梯于t=[延迟时机]放置。
最高过率98.56%,不符合完备性要求;浮动过率96.3%,满足稳定性要求。
比较可惜的一张图,尽管思路上佳,但属实是被梯子速度浮动坑了一把。从结果上说,其完备性与稳定性都和1杨桃3裂荚的“极限矿”模型相近。
例7 —— 梯子卡刺卡杨桃(东壁余光3路)
这张图的苦肉计有一定失败概率,但不是这里要讨论的重点。此处特指3路梯子卡不被地刺扎到也不被杨桃打到的无伤间隙(如下)。

具体测定如下。

最高过率>99.9%,浮动过率95.32%,兼具完备性与稳定性。
例8 —— 三鬼过两刺(神出鬼没1路)
模型如下。

原作者给出于0、461、630放置三鬼,必过,但未测定容错区间。
现作测定如下:

可以明显看出这个容错范围已经超过人类极限了…… 即使第二鬼于最优的461cs放,第三鬼的容错也只有区区8cs,而第二鬼晚放1cs,第三鬼的容错就少1cs。
因此,此模型不具备合规性,应允许使用高精度辅助。
例9 —— 减速橄榄精确偷渡(咫尺天涯4路)
举这个例子,主要是为了阐明【精确操作】与【非精确操作】的区别。
从例1到例8,每一个操作容许的精度范围都很小,有些甚至只接受最佳时机。但像下图这样的精确偷渡橄榄,容错范围其实是很大的,足足有50cs,且有明确参照物。

像这样的就难以界定为精确操作,相关标准并不适用。作为一般操作,确保解法成功率>90%且有至少15的期望优势即可。说到底,即便发生橄榄被打死的小概率事件(实际概率<3%),只消常规补鬼即可。

总结
上述9例,虽无法涵盖过往所有珍珑,但已足够以一推多,以小见大。如果你是珍珑创作者,今后测试时也务必记得测试浮动过率。一个很便捷的方法是确定最佳时机X后,先试试X-5与X+5的过率,由此再仔细测定最佳10cs区间。注意实际的最佳操作区间不一定以最佳时机为中点。
以上就是关于“精确操作”以及“珍珑最优解”的一些事情啦。如果有什么想法的话,欢迎在评论区给小编留言。