想找自动驾驶算法工作的同学看过来

2023-09-04 08:57 作者:听取蛙蛙声一片 0人读过 | 我要投稿

ICCV 2023 第五届 LSVOS 视频实例分割赛道第一名解决方案

本文提出一种去噪训练策略，并介绍三种显著提高DVIS视频实例分割模型性能的策略，还研究了引入视觉基础模型对VIS任务的影响，最终在ICCV 2023第五届LSVOS视频实例分割赛道上获得冠军!代码已开源!单位: 武汉大学快手，北航

注: 论文PDF已上传至星球，可一键秒下载

视频实例分割是一项具有挑战性的任务，是视频编辑和自动驾驶等众多下游应用的基石。本报告提出了对 SOTA VIS 方法 DVIS 的进一步改进。首先为可训练跟踪器引入了一种去噪训练策略，使其能够在复杂且长的视频中实现更稳定和准确的目标跟踪。此外，我们还探讨了视觉基础模型在视频实例分割中的作用。通过利用 DINO V2 预训练的冻结 VIT-L 模型，DVIS 展示了显著的性能改进。通过这些增强，该方法在开发和测试阶段分别达到了 57.9AP 和 56.0 AP，并最终在第五届 LSVOS 挑战赛的 VIS 赛道中排名第一。