中国电信千亿参数大模型：幻觉率降低40% 今年底逐步开源

2023-11-24 15:34 作者:ITtimes 0人读过 | 我要投稿

作者／ IT时报记者郝俊慧

编辑／钱立富孙妍

ChatGPT掀起的这轮AI狂欢，正演变为一次新的技术革命，谁都不愿意在这场决定未来的变革中，成为旁观者。

不久前，已经“卷”出天际的通用大模型赛道再添一名重磅级新成员——中国电信星辰大模型，它拥有千亿级参数，并首次提出缓解多轮幻觉的解决方案，“幻觉率”降低了40%。“中国电信要以‘网络+云计算+AI+应用’的模式，为社会数字化转型提供服务。”中国电信总经理邵广禄在不久前召开的2023数字科技生态大会上如是表示。

当AI成为社会经济发展的新动能，已经走过三年云改数转的中国电信毫不迟疑，躬身相迎，对于AI的“星辰”与“大海”，这艘巨轮已然启航。

01 星辰：幻觉率降低40%

幻觉，伴随AI“涌现”而来的副产品，当ChatGPT“煞有其事”地描述“孙悟空如何倒拔垂杨柳”时，对于开发者而言，降低“幻觉率”便成为大模型能否真正落地商用的核心问题。不少大模型厂商告诉《IT时报》记者，客户对于“幻觉”容忍率很低，尤其是在金融、政务行业最先落地的智能客服，甚至有客户提出了“零幻觉”要求。

也正因如此，此次中国电信提出的“星辰将幻觉率降低了40%”格外引人注意。

“幻觉是什么？他像不像你问一个人微积分，他不知道，然后开始胡说八道？其实，大模型像人一样，他并没有真正理解这个问题，如果他理解了并回答正确，我们自然而然认为它出现了知识的涌现。”在谈及对于幻觉的思考时，中电信人工智能科技有限公司总经理何忠江认为，采用增加参数量、革新算法技术、强化知识图谱等多重方式，可以逐渐降低幻觉率。

中电信人工智能科技有限公司副总经理刘翼向《IT时报》记者详细介绍了星辰降低幻觉的方式：首先，运用关键信息注意力增强技术，对关键信息进行关注和强调，提升模型的理解能力，提高答案回复的一致性；其次，采用模型知识记忆方案和关联信息的强化训练方案，强化模型对上下文信息的记忆能力，提高关联知识的理解能力，使模型上下文回复的一致性得到增强。

此外，通过知识图谱的强化技术，确保训练数据集知识的事实准确性。并且，知识图谱的提示能力被用来辅助模型提升知识问答能力，从而大幅减少幻觉现象的发生。最后，该模型还具备知识溯源的能力。采用多种溯源方式，关联问题的参考出处，使生成的答案更加可靠。

更重要的是，在降低幻觉的同时，通过技术创新，星辰降低了对算力的需求，完成千亿规模的模型训练，只用了以往五成的算力服务器。

据了解，下个月星辰会将7b、13b参数级大模型全量开放，明年4月千亿级参数大模型开放，同步开放更多数据和底座工具。

02 数据：日增数据超1.2PB

星辰与ChatGPT相差整整一岁。

这一年间，全球人工智能浪潮一波高过一波。据不完全统计，截至今年10月，国内开发的大模型已有238个。姗姗来迟的星辰，或许将为这场大模型之争的上半场画上休止符，毕竟能在算力、算法、数据上同时具备强大实力的入场者，不多了，尤其是数据。

一个基本的共识是：高质量的训练数据比算法更重要，而硬币的另一面是，合法合规地使用数据，确保数据安全性也成为大模型能持续进化的重要条件。

作为数字中国的建设者，中国电信是国内重要的数据生产工厂之一。据了解，在结构化数据方面，中国电信拥有的数据超过600PB，每天新增数据超过1.2PB，同时与政务、金融、互联网、研究机构等40多家生态伙伴打通了150多个数据接口；在非结构化数据方面，中国电信拥有超500TB文本数据、12亿张图文数据，且第五张网——视联网，日增2PB视频数据。

庞大的数据集为星辰的快速成熟奠定了基础。刘翼透露，为了保障问答数据的高质量，中国电信组建了一支由几百名专业人员组成的数据飞轮团队，对训练数据进行严格的人工清洗，除了过滤涉黄、涉暴、涉恐、涉赌等数据外，还加入了意识形态数据过滤机制，从答案的规范性、安全性、准确率、完整性、逻辑性等多维度确保数据高质量。

不过，在大模型的建设和使用过程中，仅有单一维度的数据并不能满足大模型的“胃口”，多样性、广泛覆盖的数据，可以增强模型的泛化能力。这意味着模型在面对新的、未曾见过的数据时能够更好地进行预测和推理，而且有助于减少模型中的偏见和不公平，因此，打造数据要素资源流通体系对于大模型厂商尤为重要。

据中国电信集团数据发展中心副主任张鑫介绍，中国电信正从三个方面加快数据生态的建设：首先，建立数据智能开发者联盟，面向金融风控、精准广告、数字康养等应用领域，吸引更多开发者开发加工各领域高质量数据集，从而创新应用场景；其次，打造数据要素产业生态，中国电信数据发展中心联手海南省大数据管理局、中国信通院云大所、上海人工智能实验室、清华大学技术创新研究中心、上海数据交易所等12个合作单位和企业发起数据要素生态联盟，为数据价值释放提供场景、政策、合规保障；三是构建大模型语料生态体系，和上海人工智能实验室、人民网等机构一起，推进建设优质的中文数据集，促进大模型闭环发展。

03 大海：AI融产数“早使用早受益”

如果说星辰是基石，数据是流动的血液，那被AI赋能的智能化社会就是面向未来的“大海”。

“对AI大模型，大家逐渐形成共识，早使用早受益。”在2023数字科技生态大会演讲中，邵广禄表示，大模型可能是迄今为止最为复杂的系统性软硬件工程，将大模型技术赋能到千行百业，形成新质生产力更是任重道远，需要共同探索，共同发展。

基于星辰，中国电信“大手笔”发布了面向政务、应急、文旅、交通、金融等场景的 12 个行业大模型，并且将这些大模型预制在“星辰MaaS生态服务平台”上。

“预制在 MaaS 平台上的行业大模型就像应届毕业生一样，有一定的行业理解能力，但不一定完全适合业务场景。”中国电信政企客户事业部群副总经理冯炜告诉《IT时报》记者，用户可以通过三种方式使用星辰 MaaS，第一种是客户直接调用标准的行业/场景大模型API能力，结合 Agent、Prompt工程和自建知识库完成智能业务搭建；第二种是有研发能力的客户结合平台上的大模型、工具集和数据集能力，进行微调、Prompt 工程等完成专属模型的训练；第三种是选取电信的自营或者是第三方服务合作伙伴，由大模型专家结合 MaaS 平台能力和客户应用场景，进行定制化大模型产品的训练，“星辰MaaS 可以支持从数据标注到微调到部署的全面能力，让这个‘应届毕业生’很快成为一个具备丰富经验的‘助手’。”

尽管相较其他互联网厂商，中国电信的通用大模型和MaaS“姗姗来迟”，但当大模型赋能千行百业时，多年深厚的产数积淀，让这家新入场者拥有友商很难复制的优势。

“很多客户对大模型的需求共性通常有三点：一是数据安全，二是满足个性化需求，三是服务及时，”一位大模型产业链人士告诉《IT时报》记者，对于企业而言，通用大模型不可能满足所有需求，未来一定是每家企业都有自己的大模型，但未必所有的大模型公司都有同样的服务能力。

“中国电信分布在全国的大模型团队，可以将大模型产业化难度大幅度下降，另外还可以解决客户在数据出域前提下本地化微调、推理和部署的难题。”刘翼告诉记者，目前中国电信大模型已在“深圳市政数局民生诉求大模型项目”“黑龙江医保大模型项目”“ 广东‘粤省心’项目”等项目中落地应用。

根据规划，中国电信研发人员到“十四五”末要达6万人，在员工中占比15%，同时培养大约2万名具有创新能力的卓越工程师，加速创新成果的落地推广。

排版／季嘉颖

图片／中国电信

来源／《IT时报》公众号vittimes

标签：

中国电信千亿参数大模型：幻觉率降低40% 今年底逐步开源

01 星辰：幻觉率降低40%

02 数据：日增数据超1.2PB

03 大海：AI融产数“早使用早受益”