欢迎光临散文网会员登陆 & 注册

【莫得门槛】别光顾着玩，让我来告诉你ChatGPT的原理！

2022-12-10 09:47 作者:層林尽染 0人读过 | 我要投稿

18:34

奖赏模型根据排序高低选择输出，奖赏模型的损失函数要让被打了勾的回答尽可能高，让被打叉的回答尽可能低。

如此，实现了根据用户偏好关系来训练奖赏模型。

标签：

【莫得门槛】别光顾着玩，让我来告诉你ChatGPT的原理！的评论 (共条)