【LL SIF】国服7周年大富翁活动策略及收益精算

前言:前几次的大富翁活动我都做过计算,把之前的各个部分重新整合了一下,结合最新的价值体系搬到b站来。总体来看这次策略和以往差不多。

【目录】
1. 大富翁游戏规则及蒙特卡洛 模拟
2. 常见策略模拟结果
3. 活动收益构成与分析(一次投料模型)
4. 不同情况下的策略选择及收益总览
5. 两次投料的策略选择及收益总览
6. 策略讨论与分析
7. 总结
8. 附件

1. 大富翁游戏规则及蒙特卡洛模拟
大富翁是玩家们喜闻乐见的活动,具有高趣味性、高收益的特点。活动简要介绍如下:

玩家位于上述的棋盘中。有两种骰子,一种叫随机骰子,另一种叫指定骰子。骰子在往期活动中也叫红包、音符,如果本文出现红包音符其意就是骰子。随机骰子可以随机前进1-3步,指定骰子可以在1-3中前进指定的步数。一开始玩家位于start的位置,每走一步可以获得1pt,踩到蓝色pt点可以再额外+3pt,踩到黄色礼物点可以获得1颗心,或1个50%糖罐,或1个100%糖罐,三者等概率发生。踩指的是正好落到这一格上,路过不算。踩到7号位的大礼物点,相当于踩两次黄色礼物点,可以一次性获得两次礼物奖励。棋盘中会有荧光棒随机出现,踩中荧光棒后将会获得该荧光棒,下一个荧光棒会出现在当前格子的后7-11格之中。获得的荧光棒可以额外兑换其他奖励。每走一圈,可以额外获得1心。随机骰子每天免费赠送三个,过期不候必须当天用完;指定骰子每日签到以及任务会送一些,根据以往来推测大概8-12个,本届目测9个。更多需要每额外消耗25爱心获得一个,指定骰子可以攒。
上述绿色部分为根据以往游戏规律的总结和推测,并非官方告知的明确的游戏规则。下文会根据这些绿色的信息进行后续推导,但如果这些信息不准,会较大影响结论,因此予以标注。
于是,根据上述这些信息,我们写出下述模拟代码。该代码固定随机骰子数为60(不考虑随机骰子必须当日用完),指定骰子数从8到150,每2为一个步进单位,每次每种策略模拟20w局,得出该情况下通过该策略能获得pt、爱心、荧光棒的期望值。为求计算简便,我们不对糖罐及心进行区分,默认50%糖=0.5心,100%=1心,并且后续评估收益时可以将获得的心再次投入大富翁。主要是我懒得重新改代码,而且上次大富翁时已经把各种策略的期望都跑好了,这次只需要根据奖励更新收益函数即可。重新改代码就得重新跑,感觉没太大必要……

通过手动修改上述代码的策略处,就可以轻松得出各策略下获得的pt、荧光棒和爱心数量。上述代码是策略1的,限于篇幅,不展示其余策略的代码。上述代码输出结果如下:

相应行数代表指定骰子数的数量。比如,当随机骰子为60,指定骰子为16时,采取策略1,最终可获得pt195.49点,荧光棒16.49个,爱心39.07个。表格最多列到150行。

2. 常见策略与模拟结果
接下来,我们将手动设置各种策略,得出各种策略下获得资源的期望数。根据前几次的集思广益,我们将验证下述13种策略。

根据历届活动的经验,最佳策略需要根据自己所能获得的指定骰子数进行调整,并不存在一个所有情况都能通吃的策略,因此每种策略都需要计算。我们将13种策略编为相应代码,将跑出的结果集中于下表:

但是,不同策略获得的pt、荧光棒、爱心数量各不相同,有的pt多荧光棒少,有的荧光棒多pt少,到底哪种策略更好很难互相比较。因此,我们下一步将建立活动收益与pt、荧光棒、爱心的函数关系,从而对13种策略通过一个数值进行比较。

3. 活动收益构成与分析(一次投料模型)
本研究采用的价值体系为7.0经验本位制体系,具体详见https://tieba.baidu.com/p/7112019333。大致定价如下:

心的定价为初始4级,1/4/15/80的box,对应实例是维纳斯。由于8周年box不一定常驻,因此本研究不以8周年box(约58左右)来定价心、绿券的价值。
另外,我们人为定价个人宝石的价值为1800。个宝收藏意义远高于强度意义,1800只是人为随意定的一个数值,并没什么道理。
近半年来,可以明显感觉到经验的获取速度显著的加快了,因此心的价值在不断上升,但经验还是经验没有变,彩贴由于普U获取途径的增多贬值了。目前从国服进度来看,这套价值体系还是站得住脚的。

通过大富翁活动,我们可以获得pt、荧光棒、爱心。Pt达到固定值后可以直接领取pt奖励,超出部分每7pt获取一张机票,收益如下所示:

由于60个随机骰子打底,pt最低也低不到哪里去,我们将穿奖前的pt固定收益从150pt起,到235pt,拟合为函数,得:


下文以此函数计算pt穿奖前收益,而不是分为多个档,这样更方便计算,拟合的结果更平滑。穿奖后按每pt获得136/7计算价值。

再看荧光棒:

在一次投料模型中,默认兑换顺序为先技能券再爱心,在荧光棒50以前,每个产生290收益,50以后,每个产生217.5,是个分段函数。

最后是爱心,直接按每个43.5折为相应收益。

严格来说,获得的爱心和荧光棒兑换的爱心,可以再次投入大富翁活动产出pt、荧光棒、爱心。但考虑到大部分玩家并不会在大富翁期间耗竭所有资源,具体抽多少更取决于自己的抽卡规划,所以我们先计算一次投料的收益。对于指定骰子极少,难以穿奖的玩家,将荧光棒优先兑换为爱心再次投料产出pt来穿奖,可能更为划算,这部分我们放最后计算,而且计算多次投料时会用到一次投料的结论。
由此,我们得到了荧光棒、pt、爱心分别各自和收益的函数关系式,接下来我们将这三个相互不尽相同的资源统一化为收益,通过比较收益的大小决定具体选用的策略。

4. 不同情况下的策略选择及收益总览
于是,我们得到了下表,在指定骰子数固定后,即可看到对应的最佳策略以及获得资源期望。

可见,在指定骰子>54时,策略8全面胜出;22-52时,策略4胜出。其中夹杂了两个策略1,是因为正好聚集在穿奖线附近,所以有一点变动,但1和4的差距极小,完全可视作全部采用策略4。在指定骰子极少的情况下,一次投料模型给出的结论是采用策略10。但这种情况下往往会将荧光棒兑换为心,加上直接获得心再次投入大富翁,所以我们继续计算二次投料模型。

5. 两次投料的策略选择及收益总览
出于计算简便,我们仅计算到两次投料,即第一次产出的荧光棒兑换的爱心,和直接获得的爱心,再次投入大富翁产出荧光棒和爱心,这个过程只循环一次,不考虑第二次产出的资源再投入。事实上,二次投料和三次投料相差无几。
荧光棒在一次投料时,毫无疑问应该优先选择技能券,但在2次投料时,可能不再是这样。第四节数据显示,pt穿奖后,约每心额外获得7.07收益,因此,爱心在多次投料的价值为43.5+7.1=50.6(如果爱心直接用于本次八周年box,则约为65,此时5心>2技能券)。如果玩家能稳定穿奖,则仍然优先兑换技能券。如果玩家①不能稳定穿奖,以及②全部爱心仅用于本次大富翁覆盖的八周年box时,此时荧光棒可优先兑换爱心并再次投料。我们仍然以43.5来计算心的价值,但分别计算荧光棒优先兑换技能券(收益1)和优先兑换爱心(收益2)的收益。
爱心稍微复杂一点,以策略1为例,我们将第五节数据中,以指定骰子数为x,荧光棒、pt、爱心分别为y,行线性回归,得到的系数/25代表的就是每多投入一个爱心,可以额外产出资源的数量,他们的r2都非常的高,线性趋势极佳。结果是,如果以策略1进行游戏,每多投入一个爱心,可以额外获得0.126pt,0.012荧光棒,0.023爱心。我们将这部分叠加在一次投料直接获得的资源上面。所以,在二次投料模型中,玩家用于二次投料的爱心数=一次投料直接获得的爱心+一次投料获得的荧光棒兑换的爱心,后者需要分别计算优先兑换技能券和优先兑换爱心的两种情况。最终获得的pt=一次投料pt+(二次投料爱心数)*系数;荧光棒及爱心计算方式同理。然后计算总收益。值得注意的是,爱心仍然按照43.5计算,不能按51计。如果按51计的话,则不能叠加二次投料的pt、荧光棒、爱心。对13种策略重复该操作,最终得到下表:

对于部分优先pt的策略,当指定骰子数非常多时,一旦随机骰子用完,就会在3-6-9-12进行循环,只要荧光棒没有随机在这几个格子上,之后就永远吃不到了。这部分策略的荧光棒数到一定数量后,不再会随指定红包数而进一步增加。对这部分策略,荧光棒的回归范围为平台期之前,会对平台期前更为可靠(例如穿奖前),但会高估平台期之后,不过这部分策略本身就是为穿奖前考虑的,因此不影响结论。
在指定骰子多少个,应该采取策略几,应该优先兑换爱心还是技能券(最佳策略为小数说明荧光棒优先兑换爱心,否则优先荧光棒),都一目了然。

将指定骰子数和最大总收益作图:

可见,曲线分为两段,穿奖前收益是最可观的,穿奖后收益放缓。由于多次投料时,5心价值和2技能券十分接近,因此两者没有明显的分界点,线性趋势良好。

6. 策略讨论与分析

不论二次投料还是一次投料,策略基本一致。纵观13种策略,仅有策略10(适用于指定红包≤20)、策略4(22≤指定红包≤54)、策略8(>54)可用,其余均败走。

策略1是绝大部分玩家最直觉的策略,然而计算表明,仅在极少情况下可略微胜出策略4,但两者差距极小,简洁起见,可以统一使用策略4,而且策略4pt更多,和策略1相比,以少拿1-2个棒子的代价,在脸黑时候优先确保穿奖。
策略2或策略3是指定骰子极少时的,大部分玩家直觉的策略。然而计算表明,策略2或3均远远不如策略10。在指定红包不足20时,最优策略是3/3,并将荧光棒优先换为爱心再次投料。原因在于,60个随机骰子的步数期望是恒定的,120,这种情况下,尽可能让指定骰子全扔3是最好的,让指定骰子扔1来获取特定的道具步数上很亏。而且荧光棒可以兑换爱心再次投料,因此用3/3策略,稍微兼顾一下荧光棒,比只顾pt的0/1-3收益更高。
在指定骰子极其富余时,大部分玩家直觉的策略是策略4-7,兼顾pt和红包。但实际计算表明策略8才是最强的,其原因和策略10一致,尽可能让指定骰子走出最大步数,强行走1或2来补刀一个pt点并不值得。策略8和策略9十分巧妙,通过检测和下一个荧光棒的距离,选择使用随机或用指定全部走3的倍数,万不得已再补刀,这种策略下基本可以使指定骰子都走出最大步数,而且不漏荧光棒。策略8和策略9相比,策略9随机红包消耗的更少,很容易出现指定用完了但随机还有的局面,没法合理搭配使用两种骰子,因此全面落败策略8。

7. 总结
① 如果你现有资源难以穿奖,荧光棒优先兑换爱心,获得的爱心再次投入大富翁以图更高pt;如果你打算在大富翁覆盖期间耗竭自己所有的心来抽8周年box,此时也优先兑换爱心,因为8周年box的每心收益+二次投料收益将大于技能券。其余情形均优先兑换技能券,其次爱心。这个兑换顺序其实随性即可,我的计算只是基于我的定价体系,不同道具的价值对不同玩家本就是不一样的。
② 穿奖后,每消耗一心,可额外获得约7.3点收益。所以说298=250心性价比低于5红券+21技能券+21糖。
③ 在资源难以穿奖时(指定骰子≤18),建议选用策略10并优先兑换爱心再次投料。
④ 对于大部分玩家(20≤指定红包≤54),建议选用策略4
⑤ 对于土豪玩家(>54),建议选用策略8
⑥ 极限穿奖所需最少心数:175(需要指定16个-送的9个),采用策略10并兑换爱心再次投料,最终pt237。不过这种策略会因指定骰子不足而漏掉大量荧光棒,自然情况下兼顾荧光棒穿奖需要指定骰子20-22个(策略4),折合心数300-350。

8. 附件
本研究的表格汇总文件、模拟文件、以及一个简易计算器,均附赠下载。格式都是xlsm。


大富翁pt音符计算器说一下,这个文件可以自行输入当前的位置和状态,然后双击任意单元格即可开始模拟计算,模拟了七种最常用的策略,并输出每种策略的五分位数和平均数,以供参考和策略调整,是个十分实用的小工具。核心代码不变,但具体计算方式略有不同,具体详见文件内的说明区。每种策略模拟5w次生成一个5w个数的数组,对7个这样的数组排序后才能输出五分位数,排序是整个程序最消耗算力的步骤。试错时用冒泡插入慢的很,快排要溢出,最终采取堆排快了很多。基本双击单元格等几秒就能出结果了。

链接:https://pan.baidu.com/s/1LTnKfG22XENpY_cA6qIIvw
提取码:w9nk

大概就这些内容了,欢迎指正、讨论~
