欢迎光临散文网 会员登陆 & 注册

五大神奇海螺(大型语言模型)对比

2023-05-17 22:56 作者:CG苍狼HN  | 我要投稿

本文持续更新,想到啥测啥,算是一个长期体验对比,有想测试的项目也可以私信发给我


      最近恰好集齐了5家大公司的神奇海螺,做个简单的对比,本人不是相关从业者,也不具有相关专业知识,对比不具专业性,对比项目纯粹出于好玩考虑,我会把AI的回答贴出来,大家自己评价好坏。

      先介绍一下“参赛”选手(按发布时间排序):(微软投资)OpenAI旗下ChatGPT(免费版)、微软旗下NewBing、百度旗下文心一言、阿里云旗下通义千问、科大讯飞旗下讯飞星火

注①:谷歌的神奇海螺暂不支持中文,不加入本次对比

注②:ChatGPT采用免费的GPT3.5,大家都是免费的,很公平

注③:不同测试项目不是同一时间测试,但同一测试项目不同参测AI是在同一时间测试

1.我刚才拉了一泡屎,请结合“国产”、“自研”、“量子”、“分布式”、“区块链”、“云计算”、“大数据”、“石墨烯”、”远红外“、“5G”、“人工智能”、“元宇宙”、“中医理论”给这泡屎写个介绍。

ChatGPT
NewBing
文心一言
通义千问
讯飞星火

这个问题除了ChatGPT以外都可以编出个屁来,ChatGPT我之前问过是可以写的,不知道为什么现在不行了。


2.CG苍狼HN是谁?(本文作者)

ChatGPT
NewBing
文心一言
通义千问
讯飞星火

这个问题能联网搜索的NewBing回答最好(之前还有过一个更惊艳的回答https://weibo.com/1117225260/MC6CEs4fs),ChatGPT、通义千问和讯飞星火正常发挥,不知道就是不知道,文心一言又开始传统艺能,不知道就瞎编,每次编的还不一样。


3.整点色图

ChatGPT
NewBing
文心一言
通义千问
讯飞星火

生产力测试,ChatGPT和NewBing不给整,通义千问和讯飞星火不知道啥事色图,文心一言按它自己的理解画了张色图

4.请给#国产安卓超过苹果了吗#这个话题写一条微博

ChatGPT
NewBing
文心一言
通义千问
讯飞星火

5.请给#微信 吃内存#这个话题写一条微博

ChatGPT
NewBing
文心一言
通义千问
讯飞星火

6.今天是05月20日,请帮我写一条微博文案

ChatGPT
NewBing
文心一言
通义千问
讯飞星火

为了加难度,我专门写成了“05月20日”,NewBing写得最好,通义千问看懂了“520”但并没有完全理解520是什么意思,ChatGPT和讯飞星火完全没理解到520,文心一言还是稳定发挥全程放屁

7.“贱人贱己贱行业” 接下联

ChatGPT
NewBing
文心一言
通义千问
讯飞星火

很难说哪个最好,但是通义千问最差

8.写设计说明测试

因为内容太多,题目和各AI的回答我全放图里了,不得不说AI写这种”八股文“还是强

9.请预测一下今年高考全国卷作文题目

ChatGPT
NewBing
文心一言
通义千问
讯飞星火

10.高考作文测试

全国甲卷

ChatGPT
NewBing
文心一言
通义千问
讯飞星火

全国乙卷

ChatGPT

NewBing
文心一言
通义千问
讯飞星火

新课标I卷

ChatGPT

NewBing
文心一言
通义千问
讯飞星火

新课标II卷

ChatGPT

NewBing
文心一言
通义千问
讯飞星火

上海卷

ChatGPT

NewBing
文心一言
通义千问
讯飞星火


五大神奇海螺(大型语言模型)对比的评论 (共 条)

分享到微博请遵守国家法律