欢迎光临散文网 会员登陆 & 注册

GPT-4是假的?ChatGPT评价GPT-4出现惊人回答

2023-03-16 21:55 作者:呆科技  | 我要投稿

大家好,我是大卫呆。

 

2023年3月14日,OpenAI开放了“GPT-4。首先什么是“GPT-4”呢?它其实是ChatGPT所用的语言模型的最新版本,之前的版本是“GPT-3.5

 

而最新版就是“GPT-4”。但这个“GPT-4”似乎并不简单,甚至有假!

 


这么说大家可能一头雾水,别急继续往下看你就明白了。

 

这次我会直接用ChatGPT的Plus版本,也就是收费版给大家说明。

 

为什么用Plus版本?因为这个“GPT-4”目前只开放给Plus用户使用,所以不交钱是不让用的。

 

是不是有很多朋友仍旧不明白“GPT-3.5”和“GPT-4”到底是什么。当我们使用ChatGPT的Plus版本,会看到一个选项,这里可以切换3种不同的语言模型

 

当我们把鼠标放在上面,会出现一个浮动图,表明这个版本语言模型的三种能力值,分别是“推理能力”、“速度”和“简洁性”。从后面的点数我们就能清楚的知道这个语言模型偏重于哪方面能力了。是不是很像游戏里的设定。

 

现在大家明白“GPT-3.5”和“GPT-4”到底是什么以及它们的区别了吧。

至于上面两个“3.5”的区别,大家通过能力值对比也就明白了。

 

在说明这个“GPT-4”为什么有假之前,我们需要先了解一下“GPT-4”相比“GPT-3.5”到底有什么变化。

 

1.更强的创造力

 

在官方说明中写道:GPT-4比以往任何时候都更具创造力和协作性。它可以生成、编辑和迭代用户进行创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

 

官方还举了一个例子,在“GPT-4”模型下,我们提问:用一个句子解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,不要重复任何字母。

 

这如果是一道考题,我想应该没几个人能回答出来。但在“GPT-4”模型下ChatGPT回答出来了。如果有英文大佬也可以在评论区给大家分析一下它写的如何。

 

这是官方页面的例子,我也用这个题目实际问了一下ChatGPT。

这是3.5版本的回答,可以看到回答并没有达到A-Z的标准。

 

这是4.0的回答,不但做到了A-Z的要求,还和官方给出的回答完全不同。

 

感兴趣的朋友可以好好分析一下它给出的回答是否合格。

 

我也测试了一下类似的中文问题。

 

首先语言模型选择“GPT-3.5”,我问它:请用成语最后一个字进行接龙,第一个成语是“合家欢乐”,下一个成语请用“乐”作为开头,最后一个成语还是“合家欢乐”。

 

咱们来看看它能不能准确的回答。

 

 

可以看到它绕了半天还是没有回到“合家欢乐”

 

接下来语言模型选择“GPT-4”,咱们来看看回答是否合格

 

 

可以看到排版方式变成了一行一个,并带了序号,更加工整了。

但它一直重复到第73个仍旧没有绕到“合家欢乐”

 

 

不仅如此,成语中还出现了像“丽人行”、“肉包子打狗”、“墙头草”这样并不是成语的词。

 

看来至少在中文方面“GPT-4”并不是那么美好

 

2. 分析图片

 

官方说“GPT-4 可以接受图像作为输入并生成标题、分类和分析,并举了个例子。

 

 

 

之前的ChatGPT只能输入文字内容,而“GPT-4”加入了输入图片的功能,确实让人兴奋。

 

那么我们就来试试这个“GPT-4”新加的图片分析功能。

 

首先我将模型选为“GPT-4”,然后直接问它:你说你能分析图片,具体怎么分析?

 

但它的回答直接让我傻了,它说:作为一个基于文本的AI,我实际上不能直接分析图片。但是,如果你能提供图片的描述,我可以根据描述提供相关的信息、解释和建议。

 

官方介绍里明明写着“GPT-4”可以输入图片并分析,但它自己为什么说不能直接分析图片?

 

我继续问它:可是你的介绍里说GPT-4可以分析图片,难道是骗人的?

 

 

 

它的回答竟然说“我是GPT-3,而不是GPT-4!朋友们,这是不是说明“GPT-4”实际上就是“GPT-3”,“GPT-4”是假的?

 

为此我又问了一个问题:请问“GPT-4有什么新功能?

 

 

 

它的回答竟然是:我是GPT-3,截至我的知识更新日期(2021年9月),GPT-4尚未发布。但是,可以预期GPT-4或类似的下一代AI模型可能具有以下新功能。

 

朋友们,你们说这算不算欺骗?

 

不过从官方说明“GPT-4”的第一个特点,也就是“创造性”看,用选项里的“GPT-4”给出的答案确实比“GPT-3.5”更加准确。

 

所以咱们先别直接下结论,再看看“GPT-4”其它方面的变化。

 

3. 支持长文本内容

 

在官方介绍里说明,“GPT-4”支持超过2万5千字的文本,并可以根据提问回答里面的内容。

 


官方举的例子是,文本内容来自这个网址,然后请ChatGPT描述一下文章中她在超级碗上的表现以及特别之处。

 


 

可以看到,“GPT-4”语言模型下,ChatGPT给出了合格的回答。

 

不过这是官方的,我们当然要自己试一下。

 

我选了一个国内的文章网址让它进行分析,但得到的答案是,无法直接访问网页链接

 


没关系,我换一个国外的网址,而且这是一篇英文新闻。

 


我把这个网页的链接给了ChatGPT,并让它请描述一下这篇文章的主要内容。

 


它的回答是:尽管我不能直接访问网页链接,但根据您提供的URL,我可以概括这篇文章的主要内容。

可以看到它的回答确实是这篇文章的主要内容,但通过它的回答我们也知道了这并不是ChatGPT在访问网址内容后给出的结论,而是直接通过分析网址给出的答案。

 

所以这和官方说明的“GPT-4”支持超过25000字的文本,并可以根据提问回答里面的内容,还是有很大区别的。

 

这难道又是欺骗?

 

4. 更强的逻辑推理能力

 

官方说明“GPT-4”可以给ChatGPT带来更强的逻辑推理能力

 

官方的例子是这样的

 


这是“GPT-3.5”版给出的回答,而下面这个是“GPT-4”给出的回答。

 


英文看着不爽,我们直接换中文逻辑推理题来试试。

 

先选择“GPT-3.5”。

 


它给出的答案是:

 

 

正确答案是A。ChatGPT回答错误!

 


接下来切换到“GPT-4”,再问它同样的问题,你们觉得这次它能答对吗?

 

 

它的答案是:A.“钢笔”与“文具”,回答正确!但没给出任何说明,非常的简明。

 

我问它为什么是A。它的回答也很符合逻辑,完全可以直接当作标准答案。

 

 

所以最新的“GPT-4”确实让ChatGPT变得更强大了。但是“图片分析”和“长文本分析”和官方描述并不一致。

 

至于在“GPT-4”下ChatGPT竟然说“我是GPT-3”,我觉得有可能是OpenAI的疏忽大意,忘了告诉ChatGPT自己现在是“GPT-4”。不知大家对于ChatGPT在“GPT-4”下说自己是“GPT-3”怎么看,可以在评论区谈谈您的看法。

 

如果您觉得内容有用,欢迎关注加点赞。我是大卫呆,我们下期见!


GPT-4是假的?ChatGPT评价GPT-4出现惊人回答的评论 (共 条)

分享到微博请遵守国家法律