欢迎光临散文网 会员登陆 & 注册

64 注意力机制【动手学深度学习v2】

2022-03-24 10:17 作者:如果我是泡橘子  | 我要投稿

注意力机制



从心理学的角度出发


动物需要在复杂的环境下有效地关注值得注意的点

  • 心理学框架:人类根据随意线索(主动、有意识)和不随意线索选择注意点





注意力机制


卷积、全连接、池化层都只考虑不随意线索(没有明确的目标)

  • 池化操作通常是将感受野范围中的最大值提取出来(最大池化)
  • 卷积操作通常是对输入全部通过卷积核进行操作,然后提取出一些比较明显的特征



注意力机制是显式地考虑随意线索

  • 随意线索被称之为查询(query)---- 所想要做的事情
  • 每个输入是一个值(value)和不随意线索(key)的对 ---- 可以理解为环境,就是一些键值对,key 和 value 可以相同,也可以不同
  • 通过注意力池化层来有偏向性地选择某些输入 ---- 根据 query 有偏向地选择输入,跟之前的池化层有所不同,这里显式地加入了 query,然后根据 query 查询所需要的东西





非参注意力池化层


  • 非参:不需要学习参数
  • x -- key
  • y -- value
  • f(x)-- 对应所要查询的东西
  • (x,y) -- key-value对(候选)
  • 平均池化:之所以是最简单的方案,是因为不需要管所查询的东西(也就是f(x)中的 x ),而只需要无脑地对 y 求和取平均就可以了



Nadaraya-Watson 核回归:

  • 核:K 函数,它可以认为是衡量 x 和 xi 之间距离的函数
  • 数据就是给定的数据,对于新给定的值来讲,只需要在给定的数据中进行查询就可以了(选择和新给定的值比较相近的数据,然后将这些数据对应的 value 值然后进行加权求和,从而得到最终的 query),所以不需要学习参数


K 的选择:高斯核

  • u:代表 x 和 xi 之间的距离
  • exp:作用是将最终的结果变成大于 0 的数
  • softmax:得到 0 到 1 之间的数作为权重
  • 在上式的基础上添加一个可以学习的 w :





总结


1、心理学认为人通过随意线索不随意线索选择注意点


2、注意力机制中,通过query(随意线索)key(不随意线索)来有偏向性地选择输入,一般可以写作

  • f(x)的 key 和所有的不随意线索的 key 做距离上的计算(α(x,xi),通常称为注意力权重),分别作为所有的 value 的权重
  • 这并不是一个新兴的概念,早在 60 年代就已经有非参数的注意力机制了





----end----

64 注意力机制【动手学深度学习v2】的评论 (共 条)

分享到微博请遵守国家法律