CV EfficeintDet:将多尺度特征融合和模型缩放结合的高效目标检...

学习目标

整篇文章课程安排

论文导读

单阶段vs双阶段

双阶段目标检测更多出现在anchor base的这一大的主流思想
anchor free思想
anchor-base(无论是单阶段or双阶段)就是在output的特征图上生成大量anchor,这些anchor就会映射回原图生成密密麻麻的先验框
anchor-free思想认为anchor-base消耗了大量资源,会使得网络速度变慢,所以直接对关键点预测,不会生成大量anchor
无论anchor base还是anchor free都离不开两个任务:1、特征提取 2、特征融合
特征提取:就像人类一样,我们在判断图片是什么的时候,我们会从图片中提取有用信息(颜色、轮廓),通过这些特征判断这是一只猫or一只狗,通过背景判断我们知道其所处环境,目标检测中把特征提取交给CNN(搭建一个复杂网络,使得图片进来以后,特征会逐层被分离,变成一个高维信息)
特征融合:在特征提取时,随着网络进行,图片会越来越小,维度越来越深,不同大小下的特征图(100x100,10x10)进行融合,特征多次利用使得最终目标检测精度(precision和recall)都会很高
最终任务落到2个地方:1、backbone网络 2、多尺度特征融合 3、不同设备、不同复杂程度

网络结构
注:efficientdet是efficientnet加上特征提取部分组合而成
efficientnet解决分类的事,根据网络复杂程度可分为B0-B7,与efficientnet对应的det也有从d0-d7的检测任务

横坐标flops,纵坐标map
我们用更加简单,复杂程度更小的网络就可以达到之前比较复杂网络的map


研究意义

论文泛读

摘要

1、BIFPN,简单搞笑的多尺度特征融合
2、复合缩放方法,对不同尺度进行统一缩放(网络分辨率,深度,宽度,所有主干,特征融合网络,box预测和分类的预测),根据不同缩放得到d0-d7八个不同模型

