AI迷思 2023.02.14

说到了解AI,我突然想起之前那个AI狼抓羊的故事,最初由于迭代间局数太少导致狼选择一头撞死而不是吃羊,AI判断一头撞死比花时间去吃不一定吃得到的羊扣的分少所以还不如一头撞死。这是一个很有意思的结果,意料之外情理之中还非常合乎逻辑,有没有什么办法解决这个问题让AI以我们希望的方式解决问题呢?
故事的后续通过增加每次迭代间的局数和调整算法解决了问题,但是还有一种更简单有效的方法,即增加存活时间影响分数的规则,存活时间低于一定程度直接扣大分,那么AI就算要自杀也会混过这个最低存活时限,在混这个时限的时候说不定就会抓到羊,迭代几次说不定就会正常抓羊以至于这个最低存活时限的规则就失去了它的作用。
用这个逻辑去套,很多人觉得AI一开始一头撞死的选择像极了人类摆烂,我觉得不尽然,如果你觉得像,为什么摆烂的人不像AI一样直接选择辞职而仅仅是在自己的工作岗位上混日子不求上进不期望抓羊呢?这分明和加了最低存活时限后的情况更像。

我们改一下规则,假设AI只能存活100年,初始分数3,153,600,000分,每存活1秒扣1分,死亡直接扣5,000,000,000分,让AI去尽可能获得更高分数,这种情况下AI会怎么做呢?我们可以试着思考一下。
一头撞死肯定是不会的,因为就算出生就撞死分数也会是负的,一直活到死就算一只羊不吃也只会是0分,所以绝对不要撞死会成为AI的首要目标。
接着来抓羊,可以控制的细节就更多了,假如抓到羊的概率很高,每只羊的分数也很高,那AI抓羊的积极性肯定也会很高,假如抓到羊的概率很低,每只羊的分数也很低,那AI抓羊的积极性肯定也会很低,但AI肯定还会抓羊,因为在等死的过程中只要抓到羊就会增加分数,以AI绝对理性的判断而言不管如何只要有一丝抓到羊的希望AI就会去抓羊。
我觉得这个结果不是很理想,没有我想要的拟真效果,无论如何AI都不会选择一头撞死似乎有些无趣,得想办法让戏剧性再强一点。

还是假设AI只能存活100年,初始分数3,153,600,000分,每存活1秒扣1分,但没有死亡扣大分的设定,换成只要存活每秒都有可能随机增加一定分数,然后让AI去尽可能获得更高分数,这种情况下AI会怎么做呢?我们可以试着思考一下。
理性如AI肯定会做一个期望分析,假设每秒有100%概率获得2分,那么存活时间越久分越高AI肯定选择存活哪怕什么都不做;假设每秒有50%概率获得2分,那么算下来存活时间越久分数越倾向于不增不减;假设每秒有1%概率获得2分,那么算下来存活时间越久越亏,AI肯定会倾向于撞死;假设每秒有1%概率获得200分,虽然算下来存活时间越久越赚但概率有点小了,换成每秒有0.01%概率获得20,000分则更甚,AI肯定会权衡收益。
这就像自己送上门的羊。
对于这个结果我依然觉得不是很理性,有点赌博的成分,对于AI这种绝对理想的计算逻辑结果还是相对确定,依然戏剧性不太足。

经过多次尝试,我们修改了很多参数,最终获得了充满戏剧性的结果,把大堆AI放在一个环境里一起迭代,每个AI的具体规则和参数有些区别。
AI的存活时间不尽相同,有些能活200年,有些能活100年,有些能活50年,有些只能活10年;
AI的初始分数不尽相同,有些初始10,000,000,000分,有些初始3,153,600,000分,有些初始1,000,000分,有些初始1分;
AI死亡的分数变化不尽相同,有些死亡不扣分,有些死亡扣1分,有些死亡扣3,153,600,000分,有些死亡扣10,000,000,000分;
AI存活的随机分数奖励不尽相同,有些每秒100%概率获得1,000分,有些每秒50%概率获得2分,有些每秒1%概率获得1分,有些每秒100%概率扣10分;
AI抓羊的能力不尽相同,有些每秒100%概率能抓到,有些每秒10%概率能抓到,有些每秒1%概率能抓到,某些每秒0.01%概率能抓到;
AI抓到的羊分数不尽相同,有些抓到羊增加10,000,000,000分,有些抓到羊增加3,153,600,000分,有些抓到羊增加1,000,000分,有些抓到羊增加1分;
AI对自身参数的认知不尽相同,有些AI以为自己抓到羊的概率是每秒1%其实是50%,有些AI以为自己抓到羊的概率是每秒100%其实是0.01%,有些AI以为自己抓到的羊分数是1,000,000分其实是1分,有些AI以为自己抓到的羊分数是1,000分其实是1~10,000,000,000分随机;
AI对羊的认知不尽相同,有些认为羊是无限的丰富的会刷新的,有些认为羊是有限的匮乏的不会刷新的;
AI对AI的认知不尽相同,有些认为有很多AI和自己一起抓羊,有些认为只有自己一个AI在抓羊;
…………
由于参数差异,AI迭代训练出来的后的行为也各种各样,完美符合我充满戏剧性的期望,某些AI由于存活的分数期望是负的所以选择一头撞死,但因为其初始分数比某些存活几十年存活的分数期望是正的的AI一直抓羊抓到死的分数都还高所以在积分榜里排在前列,某些AI迭代几次后发现无论如何因为自身参数问题都不可能获得很高的分数所以虽然可以在积分榜里小幅提高排名但还是选择一头撞死,某些AI发现虽然自身很多参数不行但存活时间的随机奖励和抓到羊的奖励可以搏一搏于是选择疯狂存活疯狂抓羊,等等行为不胜枚举。
迭代久了,稍显乏味,于是我又给AI们增加了新的规则和参数。对于那些期望低选择撞死的AI我选择修改它的目标,不在以分数为唯一目的,将存活时间也纳入考量,或者不将其分数计入积分榜,只要求其挑战自己获得更高分数。对于抓羊积极性低的AI我增加了一些规则,比如除了抓羊也可以从别的AI身上夺取部分分数,比如自身周围只要存在别的AI就可以在那些AI抓到羊时窃取部分分数,比如可以控制别的AI给自己抓羊,比如可以阻止别的AI抓羊,如此这般。
整个场面就变得更加欢乐了。

说了这么多似乎有点跑题,我想表达的其实一句话就可以总结,你以为AI很复杂其实很简单,你只是没有搞清楚AI得出这个结果的逻辑和它所参考的规矩和数据罢了。
但其实复杂对于很多人来说就是根本问题。
我也觉得从AI抓羊选择一头撞死这个现象去分析一些哲学问题社会问题是很傻〇很弱〇的行为。