【沈向洋带你读论文】Dynamic Head——首次突破COCO单模型测试60A

多重注意力机制统一目标检测

动机

单类别到多类别
骨干网提特征,第二个目标检测头
骨干网得到的特征适配到目标检测的任务上
尺度问题很重要,相机拍摄的时候它总是有透视变化,近大远小,不同物体也会有大有小
空间性,物体看的角度不同,它呈现出的旋转或者大小都会有差别
任务性,不光要检测这个物体还要把它所对应的mask也弄出来,甚至来说表达这个物体的时候,我们不光可以用框也可以用这个点,甚至用一些extreme point来表达这个物体,任务多样性就是
这篇文章考虑到不同的work侧重的点都不一样,输入的角度也不一样,考虑能否把这些事情统一起来,提供一个统一的框架来更好的表达

统一模型

级联
decouple
作为插件普适性,插拔

实验,不同组合有效性
先后顺序没有做彻底

开源代码

14:40
transformer的大数据适配能力是非常强的
参数动态
transformer vs CNN
