关于一个游戏数值问题的一些思考
最近一个朋友问了我一个游戏数值上的计算问题,我觉得他没搞明白概率论。在被他洗脑几次之后,我感觉他的想法可能也有道理,在自习思考后又得出了一些哲学结论(???),所以想总结的说一下。
问题描述
这个问题说起来也很简单,他在玩一个赌博小游戏,初始拥有资金1,小游戏的获胜概率是0.7,失败概率是0.3,获胜后可以得到双倍的投入金额,失败后失去所有的投入金额。他的问题是,如何选择投注策略使得玩家可以稳定的快速获利。
我一看到就得出了结论,就是每次all in。这样必然可以使得最终的获利期望最大,这个结论是显然的,因为对于任意的投注x,单次的收入期望是1.4x ,也就是说收入期望正比于投入,显然每次all in可以获得最大的期望。
现实冲突
但是这个结论对于他的实战没有任何指导意义,因为一旦他失败一次,所有的积蓄就瞬间消失。对于一个玩家来说,这往往意味着弃游。他觉得这和他的直觉“相谬”,于是自己进行了其他方法的计算。他的计算方法一开始令人困惑,仔细想想也有道理。他的计算方法是这样的:
假设每次投入的金额占据总金额的比例是x,经过一定的投入次数后,根据大数定律,最终的胜负比例大概是7:3,也就是说,最终的金额应该是:

其中,n是一个无穷大量。
也就是说,计算上式的最大值,等于计算x,使得上式去掉n的部分最大,即:

他通过excel列表计算出了上式的最大值。显然,这个并不需要那么复杂,直接用均值不等式就可以求解:

当且仅当 时上式等号成立,x=0.4。
显然,他用这种办法计算出了一个所谓的“最优解”,虽然这种办法需要平均10次,才能增长到1.6倍,但是他说用这个办法确实增加了他的收入(而不是猝死)。即他每次把当前财产的0.4倍投入游戏。
问题解决
他的这个所谓的“最优解”和我计算的最大收入期望算法得出了不同的结论。这令我一开始非常困惑,花了一点时间我想明白了为什么。其实道理很简单,如果仔细分析一下,就会发现他并不是在计算期望,而是最大可能性发生的一个情况下的收入,只是计算期望的一部分。
N次游戏后,假设胜利次数是v,期望的完整表达式应该是:

显然这是高中学的,是一个二项分布。他的算法实际上是计算了发生概率最大的那种情况,对应的收入是多少(i=n*0.7),然后用这一种情况代替了期望,所以得出了不同的结论——我们算的目标不一样。
一些思考
1. 显然他的结论是有一定指导意义的,但是意义有限。这个游戏依然是越多投入盈利越快。
2. 如果说,这个社会是这样一个游戏。每个人都是玩家,可以有自己的游戏策略。对于社会而言,最优的策略是所有人每次都all in,这样社会财富一个周期就可以1.4倍。但是对于个体而言,可能最优的策略就会改变,例如变成x=0.4,或者干脆不投入。在前一种情况下,如果放任玩家自由游戏,那么“看不见的手”会使得“终产者”必然出现;后一种情况,可能会使得社会财产停滞不前或者增长缓慢。也就是说,这时集体利益和个人利益很可能是矛盾的。这时可能就需要补偿制度来促进再分配了。
3. 游戏中的货币数量是可以无限的,但是滥发会使得货币贬值。货币贬值对用户不一定是很好的体验,因为他的“人生价值”会因为货币贬值而下降,所谓“合理的再分配”就必然导致玩家的劳动时间贬值(“商品的价值是生产该商品的社会必要劳动时间决定的”),这似乎也是不可避免的。