梳理国产大模型四阶段:科技互联网巨头形成“混战”,场景出现“分流”
在ChatGPT爆火之后,“大模型”一词成为近期人工智能领域的高频词,却在短时间内引发巨大关注,各大科技互联网巨头的新一轮较量拉开序幕。不同大模型产品纷纷面世。值得一提的是,大模型并非定义清晰的学术名词,而是一个文学化的描述,它们往往具有庞大的参数量,需要在大规模数据集上训练。

但实际上在大模型落地方面,基于各大科技互联网巨头的自身发展基因,其大模型AI也展现出不同特色,开始“分流”。今天就来梳理一下国内大模型的发展阶段。
第一阶段:国产大模型坚实的“地基”
打响“大模型之战第一枪”的是百度。2023年2月7日,百度官宣“文心一言”(ERNIE Bot)将在3月份完成内测。此后3月16日,百度正式发布大语言模型、生成式AI产品“文心一言”。
紧接着,360、阿里、华为、腾讯等互联网科技巨头接连发布了自己的大模型。作为国内第一梯队,成功打下国产大模型坚实的地基。
第二阶段:互联网公司接连入局
5月6日,科大讯飞宣布推出新一代认知智能大模型——“星火认知大模型”,商汤宣布推出大模型“商汤日日新”,昆仑万维和奇点智源合作发布“天工”3.5,知乎联合面壁智能发布中文大模型“知海图AI”,实在智能上线内测自研垂直大模型TARS(塔斯)……一大片大模型产品正在发布或者形成,国产“大模型混战”已然开启。
第三阶段:应用场景“分流”
显然,国产大模型产品,尤其是通用大模型,几乎都有着与ChatGPT相似的影子,人工智能对话几乎成为标配。不过,蜂拥而上的新锐科技互联网巨头们也研发出各具特色的大模型产品,在商业场景上开始“分流”。
以实在智能为例,从创业以来一直“押注”人工智能赛道的实在智能,2018年BERT模型提出后,即率先在国内发布了中文预训练模型,并将其与产品深度融合;2019年谷歌发布ALBERT模型论文后,实在智能再次在极短时间内,于谷歌正式开源之前,在国内率先发布中文预训练模型,并牵头发起成立CLUE组织。
到2022年底,OpenAI公布ChatGPT后,实在智能密切关注并迅速跟进大语言模型的研究进展;直到2023年初,实在智能正式启动TARS大语言模型研发项目,并将目标确定为“构建自研、有效、安全、可信任、可落地的垂直领域大语言模型。”
第四阶段:正在进行时
有人担心,对于这场快速掀起的“大模型混战”,一方面展示了国产人工智能在遍地开花,另一方面也暗藏泡沫。即使在当前国产大模型“阵营”里比较多的是语言模型,但大模型理念和技术在迅速向不同模态扩展。
大模型训练确确实实是国家需要重点推进的产业方向,是重点科研攻关方向,这对于人工智能行业的发展、各行各业的发展,乃至是国家的发展,都具有深远意义。总之,在科技时代发展如此之快之时,大模型是风口还是泡沫,还是要看国内科技企业的切实努力,用一个成语概括,那便是“事在人为”。