多目标检测涨点神器:CO-MOT:提升基于端到端 Transformer 的多目标跟踪性能
CO-MOT以高效的方式在多个数据集上实现了显著的性能提升,只需要 MOTRv2 38% 的 FLOPs 即可获得类似的性能,推理速度提高了 1.4 倍!
现有的端到端多目标跟踪(e2e-MOT)方法尚未超越非端到端检测跟踪方法。 一个潜在的原因是它在训练期间的标签分配策略,始终将跟踪对象与跟踪查询绑定在一起,然后将少数新生儿分配给检测查询。 通过一对一的二分匹配,这样的分配将产生不平衡的训练,如用于检测查询的正样本稀缺,特别是对于封闭的场景,因为大多数newborns 在开始时就上台。因此,与其他检测跟踪方法相比,e2e-MOT 将更容易产生跟踪终端,而无需更新或重新初始化。为了缓解这个问题,我们提出了 Co-MOT,这是一种简单有效的方法,通过具有影子概念的新颖的合作竞争标签分配来促进 e2e-MOT。 具体来说,在执行用于训练中间解码器的标签分配时,我们将跟踪对象添加到检测查询的匹配目标中。对于查询初始化,我们通过一组对其自身干扰有限的影子对应项来扩展每个查询。通过广泛的消融,Co-MOT 在无需额外成本的情况下实现了卓越的性能,例如,DanceTrack 上的 HOTA 为 69.4%,BDD100K 上的 TETA 为 52.8%。令人印象深刻的是,Co-MOT 只需要 MOTRv2 38% 的 FLOPs 即可获得类似的性能,推理速度提高了 1.4 倍。附上代码以供重新实现。









论文地址:https://openreview.net/forum?id=WLgbjzKJkk
更多论文创新点加微信群:Lh1141755859
公众号:CV算法小屋