欢迎光临散文网 会员登陆 & 注册

2P璀璨宝石游戏机制的一些猜想(暨脱坑毕业论文)

2022-05-11 01:56 作者:何好的小粉丝  | 我要投稿

笔者萌军矿车,从不会玩到目前对局数大致bga快速局50,长考局9,steam局62(胜率61%),哇哦app45(胜率62%),总对局100+,哇哦上等级分1700,如果保持现在的水平不变再打打应该至少能1800到1900+,时间有限,已毕业脱坑。


一、互动机制的解释


游戏在每个回合策略上大致分为跑高分和卡对方两种选择。

至于采用哪种选择,就是效率的对比。

有的时候两方采用相同的高分路径,使得跑高分和卡对方是同一种选择,自然是最高效选择。

游戏的互动机制提供了两种方式:第一是卡宝石;第二是预定发展卡。


卡宝石的意思是不放出对方想要的宝石,因为2P宝石每种颜色只有4个(黄色5个),所以很容易实现。

因为宝石很难不放出,为了实现卡住宝石,有以下技巧:

1.在对方不能拿取宝石时放出宝石,从而在下一轮收回宝石;

2.手里做一张对应要卡颜色的发展卡,减少宝石放出。


预定发展卡就是我们预定下对方要做的发展卡。


二、效率的对比


这个效率的对比大计算是我的猜想。

效率猜想:

第一,1分=4.5宝石。

第二,1回合=3宝石。

第三,扣牌=-2宝石。

第四,做牌=1回合=-3宝石


比如说一张73的发展卡,73就是-10,有其他卡牌做底帮助+3,卡面5分为+22.5,做牌一回合-3,做之前扣了它-2,为了做它还多拿了三个没有用的宝石-3,为了做它还专门单独做了一张五费低级发展卡,但是这一张都因为其他卡,一共只花了2宝石,-5,这样就是-10+3+22.5-3-2-3-5=2.5,等于大概赚了2.5/3回合。


你大致可以用这样的方法评估几个不同的路线,我相信不同的玩家都有自己的评估公式。评估说到底就是加减乘除。


但是效率还包含一部分,就是概率部分。

比如刚才这张73,扣它的时候要翻一张高级牌,然后共20张高级牌,现在剩余牌堆里还有13张,然后在13张里有3张是对方的牌,比如说一张633,一张5333,再一张7,然后三张牌对对方的效率分别是9,7,4.5。那么我们还要扣掉这部分,-(9+7+4.5)/13,大概-1.58左右,2.5-1.58,大概赚了1/3回合。


效率中还包含一些其他的部分,比如对手如果卡你,你的效率会减缓多少,策略的鲁棒性部分。


具体计算人算当然是很复杂的,而且其中很多粗算,计算机算就很快了,不过人的直觉往往是很准的。


三、先后手的问题


根据统计数据两人宝石是后手优势,高手对局先手胜率大概在45%。


这个数据是普遍性数据,具体到某个个别玩家上,可能这个玩家自身的数据先手胜率高。


要对这个问题进行解释就必须思索互动机制的问题。

先后手的区别在哪里呢?


猜想一:在桌游中,先手往往处于进攻性位置,拥有更多主动权,后手往往处于防守性位置。


讨论进攻,就需要讨论互动。

讨论防守,就需要讨论追赶和补偿机制,我假设这个补偿机制来自掌握更多信息。


猜想二:进攻和防守的界定。

德式桌游这个语境下,进攻这个词语其实是个非常模糊的词语,到底什么行为是进攻?跑高分是进攻,还是卡对方是进攻???

我们往往倾向于将直接涉及到互动的称之为进攻,但我们不用这个概念,统一词语,我们这里约定进攻指的是“冒险”行为,既不是自闭跑分,也不是卡人。

当你觉得这一手有很大赌性在里头的时候,就是进攻行为。

继续界定防守和进攻。

我们讨论第二个互动机制,预定发展卡。卡对方的发展卡是收益行为,往往冒险但是有收益,因此游戏机制上伴随着暴露信息给对方的缺点。

我们将卡对方发展卡,自己又不做的行为看作进攻行为。

我们将预定发展卡,是为了让自己能更安全的做出来的行为看作防守行为。

为了稳定获得一个金币,又不暴露新卡给对方,玩家有的时候会选择盲抽预定,这种行为我们看作防守行为。

因此我们的概念定义,不在于行为本身,而在于意图。


猜想三:应该采用如何的策略?


首先,全文的讨论都是我们在假定了一些结论的基础上进行的,如果你首先就不认为这些假设成立,那么多说无益,因为意图本身就是主观性的,在这个点上自然可以无止境的讨论,但是那样纯属浪费精力罢了,虽然这个定义确实是我的理论核心,希望读文章不要忙着先抓字眼,有用则读之,无用则略过。


先手应该采用激进的策略,后手应该采用保守的策略。

道理是什么呢?比如说胜率的分布是两个正态分布图,先手A的分布为FA(x),期望值在45%,后手B的FB(x),期望值在55%,激进的策略意味着方差更大,两者做差FA-B(x)的分布就落在中心轴为-10%的正态分布上,方差DFA-B为DFA+DFB,当A采用更激进的策略,原点以右的面积越大,当B采用更保守的策略,原点以右的面积越小。当然前提是这两种策略本身的胜率期望值之间不相伯仲。

如果是数学不好的人,这段差不多就是穷人靠变异,富人靠科技的意思。


四、提一些其他的体悟


1.如果有两张同色费卡,且对手不需要的,预定低费好做的,瞄着高费的。

比如一张中级6黑和一张高级7黑,那么我们预定掉中级6黑却做高级7黑。原因有两个:1.第一是防止就缺一宝石却做不出来卡手牌空间;2.中级6本身就是本色,黑卡就是黑卡。


2.有种很少的情况是,如果对方需要大量黄色宝石(万能宝石)去做牌,我们甚至可以卡住黄色宝石,这种策略往往预定多张低级发展卡来防止卡手。


3.提一嘴多人局的猜想,第一多人局策略往往偏冒险,第二你最管得着下家,第三卡人也可以计算效率,第四多人局的先后手胜率因为应该是先手最高。


五、总结

没啥好总结的。



从计算机编程的角度考虑,宝石是一个很简单的游戏,计算机是可以穷尽计算的,包括概率部分。而且可以加入一些风格因子,使得AI具有不同的对局风格,避免人熟悉AI的套路。


从人的角度考虑,宝石也是一个很简单的游戏:

第一,学习套路,深研,总结,丰富技术细节,有追求的人拿取比赛荣誉,脱坑,如所有德式一般,当然我没有过深去了解这个游戏的细节和每一张卡牌;

第二,也是我真正想表达的简单的意思。游戏机制上,因为考虑到未来十几回合的事情并不现实,而且是不完全信息博弈,一般高手最多推算2-3个回合,或者模糊地用“那个底复用度高”直觉感受一下,因为运气的存在,所以游戏整体变得简单,这里的简单指的是玩家心理的“我要算清楚”的压力没有围棋象棋那么大,当然对于比赛型选手,效率部分的牌堆概率期望也都是计算射程之内的东西;

第三,所有脱坑文我必说的一句话,说白了,德式终归还是在熟悉整数的加减乘除计算,游戏虽好,切勿沉迷游戏。 


2P璀璨宝石游戏机制的一些猜想(暨脱坑毕业论文)的评论 (共 条)

分享到微博请遵守国家法律