【AI杂谈】对齐、曲别针与影之实力者

2023-10-11 15:32 作者:花师小哲-中二 0人读过 | 我要投稿

这篇文章算是AI小杂谈，不过刚开始想的时候我有点犹豫是要主讲AI呢还是二次元呢，后来觉得影实已经写了很多了，还是来讲AI吧。

是这样的，中午我突然想到了一个久违的AI的例子，即曲别针例子。

我们知道，人类是不希望发生终结者之类的剧情的，我们希望AI能够和人类和谐共处，认可我们的“价值观”，而不希望“邪恶”的AI掌控世界。

由此比较著名的机器人三原则（当然也适用于AI，特别是搭载了AI的机器人）就出现了，这三原则实际上是很有问题的，当然，在我们进行逻辑讨论之前，就面临着一个很大的问题，即AI他甚至都做不到理解这三条原则，我们也不能以一种完备地方式写一堆规则实现这三条原则，就不要谈后续的“逻辑游戏”了。

不过像ChatGPT这样的大语言模型的出现让情况稍微有点不同了，虽然我们不能断言ChatGPT能理解语言，但实验确实表明至少大模型能够突破简单的统计信息、有很多抽象且high-level的问题了。

这时候我们就要将价值观的对齐作为一个很重要的课题了，OpenAI也是说要做超级对齐。为什么说价值观对齐很重要呢，是否只要保证模型不会输出恶意的内容就可以了呢？实际上是不够的，一个典型的例子就是“曲别针制作AI”

“曲别针制作AI”是一个强大的AI，但是它唯一的目的就是做曲别针。这看似和我们的价值观不冲突，或者说和我们人类的价值观是“正交”的。但是，这个AI很可能会带来严重的后果，虽则对“做曲别针”这一目标的追求，它会想尽一切可能更快地去生产曲别针，它完全不会考虑供需平衡，又因为它足够强大，所以可以抢其他生产线的原料，最终毁灭地球甚至是整个宇宙（不断自身复制、并发展科技来侵占其他星球）来生产曲别针，最后一步是把自己也变成曲别针，然后我们就得到一个只存在曲别针的宇宙（因为它足够强大，所以能保证这样的宇宙是能永恒存在的）

这个例子很好，说明了即使是和人类价值观有些许偏差，AI就有可能带来灾难性的后果。当然，这种想法当然会有一些批评意见，但这里就不展开了，大家喜欢的话可以自己思考。

某种程度上《影实》的男主希德也是一样，他的目标“影之实力者”就是一种“正交目标”，而且他有足够的能力，所以很多人都会下意识地担心男主可能会带来灾难性的后果，这当然可以理解。虽然我认为对于这样一部误解电波系带有强烈喜剧成分的作品来说，没有必要担心，甚至会毁掉这部作品就是了。

标签：

【AI杂谈】对齐、曲别针与影之实力者

【AI杂谈】对齐、曲别针与影之实力者的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

【AI杂谈】对齐、曲别针与影之实力者

本文作者的其他文章

【AI杂谈】对齐、曲别针与影之实力者的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

【AI杂谈】对齐、曲别针与影之实力者的评论 (共条)