欢迎光临散文网 会员登陆 & 注册

SeqGPT:阿里发布适用于自然语言理解任务的大模型

2023-08-29 20:50 作者:AI日日新  | 我要投稿

可在线运行的notebook:在kaggle网站搜索

SeqGPT-560M


我们首先加载该模型:

然后使用源模型完成信息抽取任务:

同样的,我们还可以使用该模型完成文本分类任务:

当然,以上的代码中有多处地方是重复的,后续可以将它们形成一个函数或者类方便调用。

该模型是使用bloom模型微调得到,所以若模型在某些场景效果不好,可以将它进行微调得到适用于业务场景的新模型

SeqGPT:阿里发布适用于自然语言理解任务的大模型的评论 (共 条)

分享到微博请遵守国家法律