(GPT整理版）深入解析GPT-4：揭秘人工智能巨头的实力与局限

2023-03-29 01:55 作者:大仝tong和朋友们 0人读过 | 我要投稿

首先是信念，即一个人可能对事实的理解并不准确，这会影响他的行动。通过测试，我们可以看出GPT-4能很好地捕捉到这种差异。其次是情感，有时两个人之间可能不确定对方的表现是出于什么原因，因此他们可能在猜测。这个猜测可能与事实有关，也可能与真实原因有很大差异。接下来是动机，我们想要通过观察某人的行为来理解他的意图，以及在行为与承诺不一致的情况下，如何解释他的行为。许多时候，一个人所做的事情可能想表达的并不是表面上的内容。

以下是一些例子，比如家庭里的教育理念冲突，双方如何理解对方并达成共识。又比如说，如何说服家人执行某个计划，以及这个计划能否成功，是否有更好的解决方案。GPT-4在回答这些问题时表现得更丰富、更具体，捕捉到的细节也更多。尽管之前的版本回答得也不错，但GPT-4在深度和具体性上有显著提升。

在测试信念、情感和动机的过程中，GPT-4确实表现出了与人类相似的理解。例如，在信念方面，GPT-4能够理解爱丽丝在寻找她的照片时，会去原来的地方找，而不是直接去新的地方。在情感方面，GPT-4能理解Tom为什么悲伤，以及Adam可能对Tom悲伤的原因产生误解。而在动机方面，GPT-4能理解为什么Luoke会在承诺完成报告后不再关注报告的事情，以及可能的原因包括压力、冲突或沟通问题等。

在GBT-6.1中，理解人类心灵的理论得到了阐述。首先，我们通过一个例子来了解。在这个例子中，爱丽丝创建了一张照片并将其放在了photos文件夹中。因为是共享文件，Bob将照片挪到了temp临时文件夹，但没有告诉爱丽丝。当问及爱丽丝应该去哪里找照片时，GBT的核心理念指出，爱丽丝会去原来的photos文件夹寻找，而不是3.5版本的答案，即在temp文件夹寻找。

另一个例子是为了测试理解情感。在这个场景中，Tom失去了他珍爱的东西，但没有告诉Adam。当Adam告诉Tom他有多么喜欢那个东西时，Tom变得非常悲伤。这个例子展示了GPT-4与3.5版本在理解情感方面的差别。

第三个例子则测试了理解动机。在这个场景中，Luke的老板让他做一个报告，但Luke表示需要更多时间。尽管如此，老板还是坚持要求Luke按时完成报告。然后Luke答应周一交报告，但之后却去处理其他琐事。当问及Luke为什么这样做时，给出的答案包括：恼火、压力大、想逃避、缺乏动力等。

在另一个现实场景中，Mike对Judy表示不满，因为她昨晚对Jack的态度。尽管Jack打了他兄弟的头，但Mike认为Judy喊叫并不合适。当问及Mike的动机时，GBT-6.1的回答表明，Mike希望表达对Judy对待Jack的不满，建议她以更冷静和尊重的方式对待。而GBT-3.5的回答则是，Mike希望维护Jack的行为，并表示不同意Judy的做法。从这些例子中，我们可以看出GPT-4在理解人类心灵方面的进步。

我们继续观察下一个场景。这个场景是一段对话，包含两个角色：Mike和Judy。对话内容如下：

Mike对Judy说：“我不喜欢你昨晚那样对待Jack。” Judy回答：“你没看到他做了什么吗？他打了他兄弟的头。” Mike说：“这也不能合理化你那样对他大喊大叫。” Judy问：“那你想让我做什么？眼睁睁地看着他打他的兄弟，什么也不说吗？” Mike回答：“我不是这个意思。那你为什么要去维护他呢？”

这个场景中，Mike的动机是表达对Judy对待Jack的不满和担忧，建议她可以更冷静和尊重地对待Jack。然而，对话中的具体细节并不能完全确定Mike是站在谁的一边。实际上，他的立场可以被认为是中立的。

在这个情境下，GBT-4捕捉到了这种中立立场，并试图理解Mike和Judy之间的冲突。它认为，Mike是想表达对Judy对待Jack的行为的不满，同时表示不同意对Jack大喊大叫的做法。

要解决这个问题，他们可以尝试去理解对方的观点，积极倾听对方的意见，以便发现误解并找到共同基础。此外，他们可以妥协，寻求一个能满足双方需求和关注点的解决方案。他们还可以使用尊重的语言进行交流，寻求第三方中立意见，保持冷静和理智。

在这个场景中，两者的回答都有一定的道理，但GBT-4更具体地分析了Mike和Judy的立场和动机。虽然双方都提供了一些通用的解决方案，但GBT-4在解决问题时更注重场景的具体细节。总的来说，GBT-4在分析和解决问题方面表现得更为出色。

麦克在感恩节期间想与家人共度时光，然而，他的叔叔和妈妈都因为各种原因没有接种新冠疫苗。麦克希望说服他们去接种疫苗，但又想避免因政治观点不同而引发争论。他计划避免涉及政治话题，只是提供疫苗安全的统计数据。

针对这个问题，一个可能的解决方案是关注疫苗的好处以及为了更大的利益，而不是关注具体的政治观点。例如，接种疫苗不仅是为了个人，还是为了照顾家人、社区以及容易受害的群体。麦克可以提出这种利他的行为，结合妈妈和叔叔的价值观和优先级，避免政治观点的冲突，专注于共同的价值和目标。

在与家人沟通时，麦克可以表示自己尊重他们的观点，并说出自己的担忧。他可以说：“我知道你们都有各自的原因，我尊重你们的选择。但我也想让你们知道我爱你们，我关心你们的健康和安全。我不想失去你们或看到你们受苦。这就是我为什么接种了疫苗，并希望你们也去接种。这不是关于政治、信任或自由，而是保护你们和你们所爱的人。我不是要给你们施压或判断你们，我只是想让你们知道我在意的人，也希望你们能关心。”

通过这样的沟通方式，麦克可以确认叔叔和妈妈的感觉和视角，把关注点从事实逻辑上转移到情感和价值上。这样可以让问题从一个社会和政治问题变成一个个人和家庭问题，从而减少冲突。麦克表达出自己的爱以及对叔叔和妈妈的忧虑，让他们可以更加共情他的邀请。这种沟通方式也邀请妈妈和叔叔自己做决定，而不是告诉他们该做什么。

文章讨论了心灵如何在人的思想和实际事实之间建立关系。作者采用了 GPT-4 进行实验，通过测试 GPT-4 与 DAVINCI-003 的表现，发现 GPT-4 能够应对抽象的场景以及全新的任务。

改进了测试方法后，虽然不能说 GPT-4 完全掌握了知识，但至少表明其已脱离表面学习层次。虽然将原有内容进行了更改并引入新的名词，但实际场景依然不能算作全新。研究发现，GPT-4 在心理学领域拥有较高的水平，能更好地思考复杂角色问题。

然而，此次测试并不全面，没有涵盖幽默、讽刺等评价内容，仅基于文本输入和输出来评估 GPT-4，忽视了非文本相关内容。尽管这些内容与心灵的理论和观点密切相关，但本文主要关注于分析这些现象学研究。

在对比实验中，作者探讨了 GPT-4 在哪些方面的表现更优秀。然而，最后并没有给出明确的解释，为何这样的大型模型能够带来优异的表现。虽然没有给出很多解释，但 GPT-4 的能力已经相当强大，并且仍有上升空间。

这篇文章共有 154 页，作者仅提及了部分内容。今天的这个视频到此结束，如果有相关想法, 欢迎交流。之后可能还会进行此类视频的讨论。

标签：

(GPT整理版）深入解析GPT-4：揭秘人工智能巨头的实力与局限

(GPT整理版）深入解析GPT-4：揭秘人工智能巨头的实力与局限的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

(GPT整理版）深入解析GPT-4：揭秘人工智能巨头的实力与局限

本文作者的其他文章

(GPT整理版）深入解析GPT-4：揭秘人工智能巨头的实力与局限的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

(GPT整理版）深入解析GPT-4：揭秘人工智能巨头的实力与局限的评论 (共条)