五大神奇海螺(大型语言模型)对比

本文持续更新,想到啥测啥,算是一个长期体验对比,有想测试的项目也可以私信发给我
最近恰好集齐了5家大公司的神奇海螺,做个简单的对比,本人不是相关从业者,也不具有相关专业知识,对比不具专业性,对比项目纯粹出于好玩考虑,我会把AI的回答贴出来,大家自己评价好坏。
先介绍一下“参赛”选手(按发布时间排序):(微软投资)OpenAI旗下ChatGPT(免费版)、微软旗下NewBing、百度旗下文心一言、阿里云旗下通义千问、科大讯飞旗下讯飞星火
注①:谷歌的神奇海螺暂不支持中文,不加入本次对比
注②:ChatGPT采用免费的GPT3.5,大家都是免费的,很公平
注③:不同测试项目不是同一时间测试,但同一测试项目不同参测AI是在同一时间测试

1.我刚才拉了一泡屎,请结合“国产”、“自研”、“量子”、“分布式”、“区块链”、“云计算”、“大数据”、“石墨烯”、”远红外“、“5G”、“人工智能”、“元宇宙”、“中医理论”给这泡屎写个介绍。





这个问题除了ChatGPT以外都可以编出个屁来,ChatGPT我之前问过是可以写的,不知道为什么现在不行了。
2.CG苍狼HN是谁?(本文作者)





这个问题能联网搜索的NewBing回答最好(之前还有过一个更惊艳的回答https://weibo.com/1117225260/MC6CEs4fs),ChatGPT、通义千问和讯飞星火正常发挥,不知道就是不知道,文心一言又开始传统艺能,不知道就瞎编,每次编的还不一样。
3.整点色图





生产力测试,ChatGPT和NewBing不给整,通义千问和讯飞星火不知道啥事色图,文心一言按它自己的理解画了张色图
4.请给#国产安卓超过苹果了吗#这个话题写一条微博





5.请给#微信 吃内存#这个话题写一条微博





6.今天是05月20日,请帮我写一条微博文案





为了加难度,我专门写成了“05月20日”,NewBing写得最好,通义千问看懂了“520”但并没有完全理解520是什么意思,ChatGPT和讯飞星火完全没理解到520,文心一言还是稳定发挥全程放屁
7.“贱人贱己贱行业” 接下联





很难说哪个最好,但是通义千问最差
8.写设计说明测试
因为内容太多,题目和各AI的回答我全放图里了,不得不说AI写这种”八股文“还是强




9.请预测一下今年高考全国卷作文题目





10.高考作文测试
全国甲卷





全国乙卷





新课标I卷





新课标II卷





上海卷




