欢迎光临散文网 会员登陆 & 注册

【莫得门槛】别光顾着玩,让我来告诉你ChatGPT的原理!

2022-12-10 09:47 作者:層林尽染  | 我要投稿




18:34

奖赏模型根据排序高低选择输出,奖赏模型的损失函数要让被打了勾的回答尽可能高,让被打叉的回答尽可能低。


如此,实现了根据用户偏好关系来训练奖赏模型。

【莫得门槛】别光顾着玩,让我来告诉你ChatGPT的原理!的评论 (共 条)

分享到微博请遵守国家法律