欢迎光临散文网 会员登陆 & 注册

九天菜菜GPT大模型与AIGC技术实战课

2023-06-21 21:42 作者:呀我滴sixgod尼  | 我要投稿

以GPT系列为例:

1)GPT-1是上亿规模的参数量,数据集使用了1万本书的BookCorpus,25亿单词量;

2)GPT-2参数量达到了15亿规模,其中数据来自于互联网,使用了800万在Reddit被链接过的网页数据,清洗后越40GB(WebText);

3)GPT-3参数规模首次突破百亿,数据集上将语料规模扩大到570GB的CC数据集(4千亿词)+WebText2(190亿词)+BookCorpus(670亿词)+维基百科(30亿词)。

可以看到,数据上面,每一代均相比前一代有了数量级的飞跃,无论是语料的覆盖范围、丰富度上都是绝对规模的增长。可以预测到,下一代万亿模型,使用的数据如果相比GPT-3在质量、来源和规模上没有量级的变化,很难有质的提升。

九天菜菜GPT大模型与AIGC技术实战课的评论 (共 条)

分享到微博请遵守国家法律