春时觅宝最优路线的原理

这个图相信大多数人都看过,但该策略和很多人最开始的想法并不一致,下面通过计算说明一下为什么是这个图
此外还有基于这个路线,加上后期收尾方案计算出的理论最优解,见https://bbs.nga.cn/read.php?tid=34122595
有很多人看到这个路线,会产生主要的两个疑问
内圈收益更高,为什么开局不投一个6走内圈
为什么在部分情况下,不去定向到20积分的格子,反而去投随机使得有概率错过20积分
下面计算怎样操作使得消耗相同魂玉时获得的平均积分更高
一、计算全随机时平均消耗
首先给每个位置进行编号

核心思想就是通过迭代的方法计算处于每一个位置时,到终点平均消耗的魂玉和这一圈平均还能再获得的积分,全随机时,每走一步消耗一个骰子,对应1.2魂玉,先算内圈再算外圈
处于位置30时,投任何结果都直接到终点,消耗1.2魂玉,获得30积分
处于位置29时,有1/6的概率投1到30,5/6的概率直接到重点,平均消耗1.4魂玉,获得30积分
处于位置26A时,有1/6的概率投到29,此时需要再花平均1.4魂玉到终点,获得额外的10积分;有1/6的概率投到30,需要再花1.2魂玉;2/3的概率直接到终点
因此处于26A时到终点的平均消耗为1.2+1.4/6+1.2/6=1.633,平均获得的积分为30+10/6=31.667
以此类推,处于25A时平均消耗为1.2+1.633/6(投1)+1.4/6(投2)+1.2/6(投3)+0*3/6(投456)=1.906,平均获得的积分为(10+31.667)/6[投1]+(10+30)/6[投2]+30/6[投3]+30*3/6[投456]=33.611
后面的计算过程不再详细赘述,直到位置6
处于位置6时,平均消耗为1.2+(处于7A时平均消耗+处于8A时平均消耗+处于9A时平均消耗+处于10A时平均消耗+处于11A时平均消耗+处于12A时平均消耗)/6,约为8.457
平均获得积分为 处于7A时平均积分/6+(处于8A时平均积分+10)/6+处于9A时平均积分/6+(处于10A时平均积分+20)/6+处于11A时平均积分/6+(处于12A时平均积分+10)/6,约为66.358
接下来计算外圈,计算方法和内圈一样,只有两个地方有区别
投到位置16时会立即传送到位置22并获得10积分,因此位置16的平均消耗和平均积分不按照迭代公式计算,直接按位置16的平均消耗和平均积分=位置22的平均消耗和平均积分计算
投到位置6时会走内圈,因此位置6的平均消耗和平均积分不按照外圈的迭代公式计算,而是代入前面算内圈时位置6的平均消耗和平均积分
最终得到起点(位置0)时,全随机走到终点平均消耗为10.576魂玉,平均获得积分为66.151,平均1魂玉能获得6.255的积分

二、分析什么地方用定向更优
由于到达终点的30积分不需要经过就一定能拿到,因此跑较多圈时可以大致认为平均每前进一格就能有1积分(外圈31步,内圈29步),下面记为“跑圈积分”
因此进行一次随机时,能获得平均3.5的“跑圈积分”,另外根据后面6格的积分分布,还能获得(后面6格积分之和/6)的积分,该部分积分记为"奖励积分"
(1)若定向X步到10积分格,相当于获得了X的跑圈积分和10的奖励积分。若随机则获得平均3.5的跑圈积分和Y/6的奖励积分(Y为后6格总积分,至少为10)。此时定向比随机多花的2魂玉,平均多获得了X+10-3.5-Y/6,最多为10.83(此时X=6,Y=10),相当于多花2魂玉的收益不超过10.83元,低于全随机的1魂玉6.25积分
因此除极端情况外(如离目标只需要10分且只剩下1个骰子),定向到10积分的格子一定是亏的
(2)若定向X步到20积分格,用同样的算法,多花2魂玉平均多获得了X+20-3.5-Y/6=X+16.5-Y/6的收益,最低为9.17(X=1,Y=50),最高为19.17(X=6,Y=20),平均多消耗1魂玉的收益在4.585-9.585之间,因此定向到20积分的格子收益和随机相比需要看情况,走的步数越多,后面6格积分越少则更倾向定向,反之倾向随机
(3)若定向X步到终点,由于X不超过6,因此即便是后面这一段全随机,平均要投的次数也不会超过2次,也就是随机直到终点的平均消耗不超过2.4,低于一次定向需要的3.2,再加上全随机还有概率额外获得后面几格的积分奖励
因此除极端情况外(如离目标还需要的积分刚好为30,且只剩下1个骰子),定向到终点一定是亏的
(4)若定向X步到16号位置(山兔位),相当于额外跑了6格并获得10积分,相当于获得X+6的跑圈积分和10的奖励积分。由于10-15号位置的后面6格积分都为30-40,再加上随机到16号位也能额外获得6的跑圈积分,因此定向到16号位多花的2魂玉的额外平均积分为X+6+10-3.5-Y/6-6/6,最高为12.5(X=6,Y=30),因此定向到16号位平均1魂玉的额外积分不超过6.25,刚好等于全随机。
由于最优策略平均收益一定是高于全随机的,因此除极端情况外,定向到16号位(山兔格)一定是亏的
(5)若开局定向6步到木牌位强制走内圈,假设后面全随机,根据前面的表格,走一圈平均消耗11.657魂玉,获得66.358积分。和随机相比,额外消耗1魂玉多,但只多了0.2分,巨亏。后面部分格子用定向后该数值会有变化,但很难改变开局走6巨亏的结论,后面还会再次计算验证一下
三、在定向可能最优的位置计算定向收益
前面的计算说明,只从积分考虑,定向骰子只有定向到20积分的格子才有可能是最优的。因此在后面6格有20积分的格子分别计算定向的收益
计算时需要从后往前计算,后面计算的结果若定向更优,则对策略进行更新,前面格子的平均消耗和平均积分也会因此调整
还是先算内圈,内圈最后面的20积分格子为24A,因此从23A开始往前计算
处于位置23A时,若定向1格到24A,根据前面的表格,平均消耗为2.223+3.2=5.423,平均积分为34.213+20=54.213;若随机,平均消耗为2.594,平均积分为38.248。因此在23A定向1平均多消耗5.423-2.594=2.829,平均多获得积分为54.213-38.248=15.965,平均每多消耗1魂玉,获得5.64的额外积分,低于目前的整圈平均收益6.25,因此随机
处于位置22A时,用相同的计算方法,定向2格和随机相比,平均每多消耗1魂玉获得6.09积分,仍低于6.25,因此随机
处于21A时,定向3和随机相比每多消耗1魂玉的额外积分为6.20,仍然随机
处于20A时,定向4和随机相比每多消耗1魂玉的额外积分为6.27,比6.25高了0.02,按理说应该先把这一格的策略改为定向,但大概率最终的整圈平均收益会高于6.27,因此在后面的步骤中大概率还是会把这一步的策略调整回随机,因此暂且将该位置的策略定为随机
处于19A时,定向5和随机相比每多消耗1魂玉的额外积分为7.58,相比目前的整圈平均收益提升较大,因此将19A的策略改为定向5。调整之后,对前面的格子平均消耗和平均积分都有影响,因此需要对表格进行更新,如下图

此时19A前面的格子平均消耗和平均积分都有变化,整圈平均收益由6.255提升到了6.273,已经高于了20A定向4的收益,因此在20A处应该随机
继续计算18A,定向6相比随机,平均多消耗1魂玉获得的额外积分为8.77,高于目前的整圈平均收益6.273,因此将18A的策略更改为定向6。更改策略后再次进行更新,更新后的整圈平均收益增加为6.293。然后再检查一下此时的整圈收益是否超过了之前计算的定向格子的平均收益,若超过了则将超过的格子策略改回随机并再次更新策略(实际未超过,无需调整)
然后从后往前依次计算每个6格内有20积分的格子,判断定向收益是否高于此时的整圈平均收益,若超过该数值则调整为定向,并对策略进行更新且计算新的整圈平均收益,再检查新的整圈平均收益是否高于之前的定向收益,若超过了则将超过的格子改回随机并再次更新策略
对于个别后面6格有两个20积分格子时,分别计算定向到这两格的平均收益,选取较高的那一个和整圈平均收益进行对比
计算完内圈后计算外圈,方法相同不再写了
所有格子计算完成后,得到最终的每一格的平均消耗和平均积分

该结果即为最前面那个图
最后再验证一下开局定向投6走内圈的收益
若在起点随机,则消耗13魂玉,获得84.94积分;若定向6则消耗10.49+3.2=13.69,获得积分为80.75
结果显而易见,若开局投一个6,相比随机花的钱更多不说,获得的积分还变少了,绝对是巨亏的
后面进行了几个小试验,计算了一下内圈收益到底有多少和开局投6亏多少,下面只放结果
(1)若开局投6,则整圈平均收益仅为5.898,需要多花10%左右的钱,巨亏
(2)若去掉内圈,即把6号位的木牌去掉,改为什么都没有的格子,此时整圈平均收益为6.456,仅仅少了1.2%的收益
(3)若去掉内圈,即把6号位的木牌去掉,并且在6号位放一定的积分作为补偿。结果放4分时,整圈平均收益为6.535,和有内圈的收益一样。也就是说,走到6号位的木牌走内圈的收益实际上只有4分,开局额外花一个定踪券投6,相当于定向到了一个只放了4分的格子,再次说明该方案巨亏!
(4)若保留木牌,即走到6号位仍然走内圈,并且在6号位放一定的积分作为补偿,则需要在6号位放12分,开局投6的收益才开始高于随机,又一次说明开局投6是一个超级吃亏的方案!