欢迎光临散文网 会员登陆 & 注册

中国电信千亿参数大模型:幻觉率降低40% 今年底逐步开源

2023-11-24 15:34 作者:ITtimes  | 我要投稿


中国电信的“星辰大海”


作者/ IT时报记者 郝俊慧

编辑/ 钱立富 孙妍

ChatGPT掀起的这轮AI狂欢,正演变为一次新的技术革命,谁都不愿意在这场决定未来的变革中,成为旁观者。

不久前,已经“卷”出天际的通用大模型赛道再添一名重磅级新成员——中国电信星辰大模型,它拥有千亿级参数,并首次提出缓解多轮幻觉的解决方案,“幻觉率”降低了40%。“中国电信要以‘网络+云计算+AI+应用’的模式,为社会数字化转型提供服务。”中国电信总经理邵广禄在不久前召开的2023数字科技生态大会上如是表示。

当AI成为社会经济发展的新动能,已经走过三年云改数转的中国电信毫不迟疑,躬身相迎,对于AI的“星辰”与“大海”,这艘巨轮已然启航。

01 星辰:幻觉率降低40%

幻觉,伴随AI“涌现”而来的副产品,当ChatGPT“煞有其事”地描述“孙悟空如何倒拔垂杨柳”时,对于开发者而言,降低“幻觉率”便成为大模型能否真正落地商用的核心问题。不少大模型厂商告诉《IT时报》记者,客户对于“幻觉”容忍率很低,尤其是在金融、政务行业最先落地的智能客服,甚至有客户提出了“零幻觉”要求。

也正因如此,此次中国电信提出的“星辰将幻觉率降低了40%”格外引人注意。

“幻觉是什么?他像不像你问一个人微积分,他不知道,然后开始胡说八道?其实,大模型像人一样,他并没有真正理解这个问题,如果他理解了并回答正确,我们自然而然认为它出现了知识的涌现。”在谈及对于幻觉的思考时,中电信人工智能科技有限公司总经理何忠江认为,采用增加参数量、革新算法技术、强化知识图谱等多重方式,可以逐渐降低幻觉率。

中电信人工智能科技有限公司副总经理刘翼向《IT时报》记者详细介绍了星辰降低幻觉的方式:首先,运用关键信息注意力增强技术,对关键信息进行关注和强调,提升模型的理解能力,提高答案回复的一致性;其次,采用模型知识记忆方案和关联信息的强化训练方案,强化模型对上下文信息的记忆能力,提高关联知识的理解能力,使模型上下文回复的一致性得到增强。

此外,通过知识图谱的强化技术,确保训练数据集知识的事实准确性。并且,知识图谱的提示能力被用来辅助模型提升知识问答能力,从而大幅减少幻觉现象的发生。最后,该模型还具备知识溯源的能力。采用多种溯源方式,关联问题的参考出处,使生成的答案更加可靠。

更重要的是,在降低幻觉的同时,通过技术创新,星辰降低了对算力的需求,完成千亿规模的模型训练,只用了以往五成的算力服务器。

据了解,下个月星辰会将7b、13b参数级大模型全量开放,明年4月千亿级参数大模型开放,同步开放更多数据和底座工具。

02 数据:日增数据超1.2PB

星辰与ChatGPT相差整整一岁。

这一年间,全球人工智能浪潮一波高过一波。据不完全统计,截至今年10月,国内开发的大模型已有238个。姗姗来迟的星辰,或许将为这场大模型之争的上半场画上休止符,毕竟能在算力、算法、数据上同时具备强大实力的入场者,不多了,尤其是数据。

一个基本的共识是:高质量的训练数据比算法更重要,而硬币的另一面是,合法合规地使用数据,确保数据安全性也成为大模型能持续进化的重要条件。

作为数字中国的建设者,中国电信是国内重要的数据生产工厂之一。据了解,在结构化数据方面,中国电信拥有的数据超过600PB,每天新增数据超过1.2PB,同时与政务、金融、互联网、研究机构等40多家生态伙伴打通了150多个数据接口;在非结构化数据方面,中国电信拥有超500TB文本数据、12亿张图文数据,且第五张网——视联网,日增2PB视频数据。

庞大的数据集为星辰的快速成熟奠定了基础。刘翼透露,为了保障问答数据的高质量,中国电信组建了一支由几百名专业人员组成的数据飞轮团队,对训练数据进行严格的人工清洗,除了过滤涉黄、涉暴、涉恐、涉赌等数据外,还加入了意识形态数据过滤机制,从答案的规范性、安全性、准确率、完整性、逻辑性等多维度确保数据高质量。

不过,在大模型的建设和使用过程中,仅有单一维度的数据并不能满足大模型的“胃口”,多样性、广泛覆盖的数据,可以增强模型的泛化能力。这意味着模型在面对新的、未曾见过的数据时能够更好地进行预测和推理,而且有助于减少模型中的偏见和不公平,因此,打造数据要素资源流通体系对于大模型厂商尤为重要。

据中国电信集团数据发展中心副主任张鑫介绍,中国电信正从三个方面加快数据生态的建设:首先,建立数据智能开发者联盟,面向金融风控、精准广告、数字康养等应用领域,吸引更多开发者开发加工各领域高质量数据集,从而创新应用场景;其次,打造数据要素产业生态,中国电信数据发展中心联手海南省大数据管理局、中国信通院云大所、上海人工智能实验室、清华大学技术创新研究中心、上海数据交易所等12个合作单位和企业发起数据要素生态联盟,为数据价值释放提供场景、政策、合规保障;三是构建大模型语料生态体系,和上海人工智能实验室、人民网等机构一起,推进建设优质的中文数据集,促进大模型闭环发展。

03 大海:AI融产数“早使用早受益”

如果说星辰是基石,数据是流动的血液,那被AI赋能的智能化社会就是面向未来的“大海”。

“对AI大模型,大家逐渐形成共识,早使用早受益。”在2023数字科技生态大会演讲中,邵广禄表示,大模型可能是迄今为止最为复杂的系统性软硬件工程,将大模型技术赋能到千行百业,形成新质生产力更是任重道远,需要共同探索,共同发展。

基于星辰,中国电信“大手笔”发布了面向政务、应急、文旅、交通、金融等场景的 12 个行业大模型,并且将这些大模型预制在“星辰MaaS生态服务平台”上。

“预制在 MaaS 平台上的行业大模型就像应届毕业生一样,有一定的行业理解能力,但不一定完全适合业务场景。”中国电信政企客户事业部群副总经理冯炜告诉《IT时报》记者,用户可以通过三种方式使用星辰 MaaS,第一种是客户直接调用标准的行业/场景大模型API能力,结合 Agent、Prompt工程和自建知识库完成智能业务搭建;第二种是有研发能力的客户结合平台上的大模型、工具集和数据集能力,进行微调、Prompt 工程等完成专属模型的训练;第三种是选取电信的自营或者是第三方服务合作伙伴,由大模型专家结合 MaaS 平台能力和客户应用场景,进行定制化大模型产品的训练,“星辰MaaS 可以支持从数据标注到微调到部署的全面能力,让这个‘应届毕业生’很快成为一个具备丰富经验的‘助手’。”

尽管相较其他互联网厂商,中国电信的通用大模型和MaaS“姗姗来迟”,但当大模型赋能千行百业时,多年深厚的产数积淀,让这家新入场者拥有友商很难复制的优势。

“很多客户对大模型的需求共性通常有三点:一是数据安全,二是满足个性化需求,三是服务及时,”一位大模型产业链人士告诉《IT时报》记者,对于企业而言,通用大模型不可能满足所有需求,未来一定是每家企业都有自己的大模型,但未必所有的大模型公司都有同样的服务能力。

“中国电信分布在全国的大模型团队,可以将大模型产业化难度大幅度下降,另外还可以解决客户在数据出域前提下本地化微调、推理和部署的难题。”刘翼告诉记者,目前中国电信大模型已在“深圳市政数局民生诉求大模型项目”“黑龙江医保大模型项目”“ 广东‘粤省心’项目”等项目中落地应用。

根据规划,中国电信研发人员到“十四五”末要达6万人,在员工中占比15%,同时培养大约2万名具有创新能力的卓越工程师,加速创新成果的落地推广。

排版/ 季嘉颖

图片/ 中国电信

来源/《IT时报》公众号vittimes


中国电信千亿参数大模型:幻觉率降低40% 今年底逐步开源的评论 (共 条)

分享到微博请遵守国家法律