欢迎光临散文网 会员登陆 & 注册

想找自动驾驶算法工作的同学看过来

2023-09-04 08:57 作者:听取蛙蛙声一片  | 我要投稿

ICCV 2023 第五届 LSVOS 视频实例分割赛道第一名解决方案

本文提出一种去噪训练策略,并介绍三种显著提高DVIS视频实例分割模型性能的策略,还研究了引入视觉基础模型对VIS任务的影响,最终在ICCV 2023第五届LSVOS视频实例分割赛道上获得冠军!代码已开源!单位: 武汉大学快手,北航

注: 论文PDF已上传至星球,可一键秒下载

视频实例分割是一项具有挑战性的任务,是视频编辑和自动驾驶等众多下游应用的基石。本报告提出了对 SOTA VIS 方法 DVIS 的进一步改进。首先为可训练跟踪器引入了一种去噪训练策略,使其能够在复杂且长的视频中实现更稳定和准确的目标跟踪。 此外,我们还探讨了视觉基础模型在视频实例分割中的作用。 通过利用 DINO V2 预训练的冻结 VIT-L 模型,DVIS 展示了显著的性能改进。 通过这些增强,该方法在开发和测试阶段分别达到了 57.9AP 和 56.0 AP,并最终在第五届 LSVOS 挑战赛的 VIS 赛道中排名第一。

代码:https://github.com/zhang-tao-whu/DVIS

论文:https://arxiv.org/abs/2308.14392


关注公众号 CV算法小屋 了解更多aigc大语言模型信息 

加技术交流群掌握最新校招面试题和真实提升项目:加我微信 Lh1141755859   

想找自动驾驶算法工作的同学看过来的评论 (共 条)

分享到微博请遵守国家法律