欢迎光临散文网 会员登陆 & 注册

什么是 Attention(注意力机制)?【知多少】

2022-12-23 10:19 作者:_-JIA-_-  | 我要投稿

Attention

是一种复杂的简化方法,能够找出对当前输出最重要的部分

一个典型的ATTENTION包括3部分

Q K V

K和V成组出现

Q是query

KEY和Query通常是源语言,原始文本等已有的信息

计算Q和K的相关性


得出不同的K对输出的重要程度



再与对应的V相乘求和


Self-Attention 自注意力机制

只关注输入序列的关系


Multi-head Attention




什么是 Attention(注意力机制)?【知多少】的评论 (共 条)

分享到微博请遵守国家法律