欢迎光临散文网 会员登陆 & 注册

四川盛通美华教育咨询有限公司:大厂模型商用开源

2023-08-07 15:07 作者:llllllqww  | 我要投稿

8月3日,同易钱文70亿参数通用模型和对话模型(简称Qwen-7B和Qwen-7B-Chat)亮相AI模型社区MagicModelScope。这两种模型都是开源、免费且可商用的。

由此,阿里云成为国内大公司中第一家大规模开源的企业。

Qwen-7B是基础型号,支持中文、英文等多种语言。Qwen-7B-Chat是基于基础模型的中英文对话模型。在MMLU和C-Eval等多项基准测试中,Qwen-7B在70亿参数的规模上取得了良好的表现。阿里云表示,其部分能力甚至可以超越一些120亿参数的大型模型。

用户已经可以直接从Mota社区下载模型,也可以通过阿里云灵机平台访问和调用这些模型。通过开源代码,用户可以轻松地在消费级显卡上部署和运行模型。阿里云基于大模型的服务,包括训练、推理、部署、微调等,都可以应用于上述两个模型。

这并不是国内第一个免费商用的大型模型。就在半个月前,智普AI宣布ChatGLM-6B和ChatGLM2-6B允许免费商用,百川智能的百川13B模型一发布就开源、免费商用。

然而,统一钱文却成为第一个大型科技公司大规模开源的典范。它的开源将被视为国内“百模大战”进入新阶段的一个标志——现在无论是中国还是美国,无论是巨头还是中小型初创公司,对大开源模型正在趋同。

当Meta宣布开源LLaMA2时,Meta首席科学家、图灵奖得主YannLeCun宣称大型模型行业的竞争格局将发生改变。这是因为,闭源依靠蓬勃的奇迹证明了大模型路线的可行性和局限性,而开源则通过繁荣的生态让大模型真正可用、好用。

也就是说,大模型本身的神秘光环正在逐渐褪去。当技术不再难以逾越时,繁荣的开源生态以及由此带来的头脑风暴的技术迭代和突破将成为新的护城河。在7月份举行的世界人工智能大会上,阿里云将推动中国大规模模型生态的繁荣作为首要目标。

为此,阿里云打出了一套组合拳。

例如,阿里云的灵机模型服务平台提供了一系列自动化模型云工具链接,使得模型不仅可以通过推理API进行集成,还可以通过训练和微调API进行定制。此外,去年推出的AI模型社区Mota聚集了20多家顶级人工智能机构贡献的1000多个开源模型。它们之间的部署环节是相连的,也就是说,来自社区的模型可以通过精神积累来服务——这似乎是一个处于萌芽阶段的模型自由市场,当然可以通过开源来实现。

任何市场都需要充分的竞争。归根结底,阿里云想要降低门槛,让开源大规模模型生态蓬勃发展,就需要提供足够丰富、优质的开源大规模模型参与其中。

统一钱文开源势在必行。

如此一来,千帆赛的千帆模型之战,现在已经进入了真刀真枪的肉搏战阶段——模型好不好,不只是吹出来的,是公开的来源于社区,大众将对其进行测试。


四川盛通美华教育咨询有限公司:大厂模型商用开源的评论 (共 条)

分享到微博请遵守国家法律