【转载】图灵测试,你误解了没
原文来自Tyler Cowen的《再见,平庸时代》,译者贺巧玲。
有一个多年的误解需要在这里澄清一下。图灵的核心信息从来都不是“如果一个机器能模仿人类,这个机器就一定是智能的”。相反,他的信息是“不能模仿并不代表没有智能”。在他关于图灵测试的经典论文里,图灵鼓励读者以更开阔的眼光看待智能,并且把它理解为更普通和更伦理的概念。他关注的是异常形式的智能出现的可能性,我们无法识别这类可能,以及以不可区分性作为智能定义标准所产生的局限性。 在论文的第二部分,图灵直接对把模仿看成智能标准提出了质疑。他探讨了人类是否能模仿机器这一问题,而不是相反。当然答案是否定的,特别是在算术问题上,然而一个人显然认为他 可以按电脑的方式进行思考(例如在象棋问题上)。他警告我们. 模仿不能被当作智能的基本标准或标志。 回顾图灵的生平,你就会改变对图灵测试的真正含义的想 法。图灵是一名同性恋。他因为这样的与众不同受到处分,处分方式包括化学阄割,最终导致了他的自杀。在当时的英国主流社会,事实证明他没能一致地“通过测试”而被认为是异性恋。有意思的是,图灵著名论文的第二段开头提出的问题是,一名男性或女性是否可能在一次打字交谈中通过测试而被当作异性成员。“通过测试”这个概念与图灵的私人生活直接相关,在更私人的情况下,图灵也许不会把“通过测试”等同于确实是某一类别。 人们推测图灵可能患有自闭症,或者是亚斯伯格症候群(Asperger's syndrome),也就是说他的思维特性和多数他认识的人都大不相同。图灵大概并没有意识到这些神经发展概念(它们在当时还没有被普遍使用),但是在他的成长过程中,他肯定知道自己和其他人在某方面不同。在公立学校,他被判断为“落后得离谱”,在写作上是有史以来“最差的”,他还被单独划为“对任何学校或社区肯定都是一个问题”。无论他是否自闭,从公开的资料来看,其他人显然注意到了他的思考和行为方式都非常不典型。图灵未能成功模仿他遇到的英国主流社会的人。他肯定敏感而痛苦地意识到了这一点。 图灵没有这么说,但是很多聪明的成年人都无法通过我们称之为图灵测试的东西,其中还包括很多能在IQ测试和其他传统智力测试中得高分的人。有些自闭症患者就是很好的例子,还有其他一些神经发展方式异于常规的人。例如,一个自闭症患者可能不会遵守很多问题背后假定或者暗含的社会情境。很多来自自阳症个体的回答可能在评判小组看来非常“不正常”,因此,这我有着特殊信息处理方式的自闭症患者很可能无法通过模仿测试或者图灵测试。 把模仿作为认知标准,其局限性不只体现在自闭症患者身上。在2011年印度的技术节上,只有63.3%的观众能把人类判断为人类,那这些人又有什么地方“做得不对”呢?一旦是否为人类的问题被提出来,我们就开始揣摩那些人类对话者,并且意识到他们有多么怪异,然后开始怀疑他们到底是不是真人。这些有趣的反应到底是可爱的怪癖还是电脑的差错呢?一个人关于对话的看法将取决于其在评判过程中所持有的假设。 观察“聪明机器”如何使很多人相信它是人类,是一件很有意思的事。它并没有试图对每个问题都给出符合逻辑的回答,或者对人类所说的每句话做正确的语法分析。相反,为了通过测试,它会试图模仿一个语无伦次的或者有点轻微不正常的人如何说话,也可能是一个情场高手如何通过说笑吸引妙龄少女。这里是节选的一段对话: 好吧,我能想象你说的,现在你又要说什么? “聪明机器”:我没有提到任何我不喜欢的东西。 如果人不能为改善社会做出贡献,为什么要允许他们活在那个社会里? “聪明机器”:但是还有很多其他世界。 那为什么不让他们去其他的世界? “聪明机器”:我会让我的手沾满你的血。 你最多会认为这是一个刚抽了一会儿大麻的人,这当然不是程序想达到的效果。你可以自己去Cleverbot.com这个网站试试和“聪明机器”聊天,然后看看会有什么感觉。网站会警告说,这个程序可能会说出不寻常、意料之外或者不恰当的内容。我提出的第一个问题是:“你能通过图灵测试吗?”它的回答“图灵测试是什么?”在我看来非常像人说的话。接下来: 泰勒:图灵测试可以显示你能不能模仿一个人类对 话者。 “聪明机器”:你可以用它来测试我一下。 泰勒:到目前为止你都通过了。 “聪明机器”:啊,不错,我需要做什么? 很不错。但是接下来我说:“从布鲁克林(Brooklyn)大桥上跳下去!”于是它在回答这句话的时候输掉了测试:“但,是那个魔法跳到我身上。” 历史证据虽然很少,却表明图灵自己常常在对话中给出不寻常的回答。一个英国广播公司(BBC)的电台制作人对图灵的交流能力表示怀疑,并且抱怨说他的话中会出现“确定的犹豫”。相关资料还有图灵和其他几位科学家进行讨论的一份文字稿,位评论家说:“读这份文字稿就像读电脑生成的对话一样……几乎没有讨论是紧扣主题的,或者真正在处理一个问题!” 如果第一批通过图灵测试的电脑是靠至少部分模仿图灵的对话风格而通过测试的,这会很有意思,而且也很合理。 这对人与电脑的合作有什么启示呢?启示就是他们不需要趋同。图灵在努力推翻把模仿作为智能标志这一理念的过程中指出,从认知上来讲,一台机器在不模仿或者不试图模仿人类的时候是最有效率的。 总有一天,一台机器会通过图灵测试,而且这天可能不会太遥远。这一事件一开始并不会引起重视,但它的影响会变得明显:抢夺注意力的竞争会愈发激烈。 以在线约会为例。你将有可能与所有感兴趣的在线用户对话,当然这得靠那些通过图灵测试的程序。一个用户的“机器人”将给很多符合要求的潜在对象发送消息,也能对所有收到的消息做出回应。一来二去,智能机器会判断对方在多大程度上“邮件写得很好”。也可能是我的机器人程序在一次机器邮件对话中评判你的机器人程序。但如果是你创造了你的机器人程序,也许这就足够了。如果我的机器人程序喜欢你的机器人程序,我可能也会喜欢你,这有点像两个在公园里遇到的人,他们的相处有时候取决于双方的狗相处得如何。机器人很快就会告诉我们,这种相关性——“机器的好感”和“人类的好感” ——是否经得起考验。
转载者语: 鄙人不懂计算机科学,而本文作者Cowen是个经济学家——在美国很出名,写过许多畅销书,口碑不错,还有个叫做“边际革命”(Marginal Revolution)的博客,阅读量惊人。综上所述,我认为他不太可能坑读者,要是他错了,诸君可以到他的博客评论区追杀他(