欢迎光临散文网 会员登陆 & 注册

青雀机制研究(二):战技点的使用价值。【崩坏铁道】

2023-05-18 10:21 作者:徘徊于阳世间  | 我要投稿

上篇结论:

(4)=0(31)=3/2( 3)=2,(22)=3,(211)=7/2,(111)=9/2,(21)=11/3,(2)=37/9,(11)=89/18,(1)=17/3,(0)=20/3. 

如果轮到青雀的剩余回合数不多于以上计算的平均回合数,则不宜开大招。 

如果青雀两次行动其间平均穿插了(0)=20/3次队友行动那么说明青雀速度太慢了需要装个加速度的装备来提速。 


上期考虑了无战技点情况,那么有战技点该怎么办?众所周知,战技摸2牌,大致上等于上期给的转移图连续走两步,但是如果牌已经4张没有空余,战技的顺序是摸摸弃弃,但是连续走两步是摸弃摸弃,而我们知道先摸后弃要优于先弃后摸。而因为转移状态构成偏序集,且每一步弃牌为最优,结合仅有的4种满牌情况发现居然刚好一样。


那我们相当于用一个战技点等于走2步。也就是平均只需(X)/2个战技点就能加强攻击了!


而战技还有个效果是加伤r,基础伤害为a, 加强伤害为b。那么考虑现在的状态为(X)。则一个战技点往前走了2步,伤害原本为a,要走(X)步到b。用到线性插值的话,现在的均伤为r((b-a)/(X)*{(X)-2}+a), {u}为u和0取较大值。于是得到

第1个点的增伤价值是r((b-a)/(X)*{(X)-2}+a)-a。第n个点其实可以依次类推,但是可以发现有边际效用。

根据战技点的价值,我们可以有一种策略a,使得只有当战技点价值大于某设定价值才使用,否则不用战技点。


===============================

由于可能会有不少脑溢血的情况,这里我将给出一种计算马尔科夫链的置信区间算法。

设从状态(A)到(B)的步数是个随机变量,设为(A->B)。那么我们其实关心的是当前状态(X)到(4)的步数的分布。因为是离散型随机变量,其实关注概率质量函数(PMF)即可。


所幸,青雀问题是一个偏序集,所以里面的链式结构都是单向的,我们首先从简单的算起。


考虑2个点组成的马氏链,A有1-p的概率回到自身,p概率跑去B,而B为吸收态用于终结状态,则很容易算出分布列满足(A->B)~1+Geo(p)。其中Geo是从0开始的几何分布。而如果n个点串联,比如A1,A2,..., An, 则(A1->An)~(n-1)+Geo(p1)+...+Geo(pn-1)。

如果p1=...=pn-1=p,则Geo(p1)+...+Geo(pn-1)=NB(n-1,p),NB是负二项分布。

而如果是并联就更加简单了,其实就是mixture混合分布,举例,A为起点,而其相邻的下一个点为A1,。。。,Am,对应的转移概率为q1,。。。,qm,B为终点,则(A->B)的pmf为

q1*(A1->B)的pmf+。。。+qm*(Am->B)的pmf。


注意一下,并联的相加为pmf的相加,而串联的相加为随机变量的相加,特别地,因为q1+。。。+qm=1,则其实这两种相加其实都是一类随机变量的卷积(大一统理论)。

于是青雀问题,可以从终点的0开始一点一点倒推所有状态的步数分布(因为偏序集所以良定义well-defined)。有了分布自然就有分位数,然后求得置信区间【是单侧的】。

但是现实中,其实写个代码跑个MCMC就完事了毕竟不要数值解。

======================================

比作物理电路图的话。状态自循环(A)直接回到(A)其实可以看成一个随机电阻,也就是要经过Geo(p)的时间才会继续前进,而串联为电阻的随机变量求和(加法原理),并联为分布列求和(乘法原理)。




青雀机制研究(二):战技点的使用价值。【崩坏铁道】的评论 (共 条)

分享到微博请遵守国家法律