欢迎光临散文网 会员登陆 & 注册

极市直播预告|大模型时代目标检测的三点尝试

2023-08-01 15:40 作者:极市平台  | 我要投稿

|极市线上分享第118期 |

一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了117 期极市线上直播分享。

往期分享请前往bbs.cvmart.net/topics/149,也欢迎各位小伙伴自荐或推荐更多优秀的技术嘉宾到极市进行技术分享,与大家一起交流学习~~

本次分享我们邀请到了香港大学的博士生孙培泽,为大家介绍他们的一些探索工作:

Learning Object-Language Alignments for Open-Vocabulary Object Detection(ICLR2023)

Going Denser with Open-Vocabulary Part Segmentation(ICCV2023)

Semantic-SAM: Segment and Recognize Anything at Any Granularity.

GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest

01

直播信息

时间

2023年8月3日(周四):21:00-22:00


主题

大模型时代目标检测的三点尝试

直播

极市平台视频号

B站也将同步进行

http://live.bilibili.com/3344545

02

嘉宾介绍


孙培泽

香港大学博士生,指导老师为罗平副教授。研究方向为计算机视觉和深度学习,包括目标检测分割追踪和视觉语言多模态模型。


03

关于分享

➤分享大纲

1.回顾目标检测的发展历程

2.目标检测的三点尝试

- 从封闭环境到开放世界

- 从单一模型到交互系统

- 从视觉感知到多模态推理

3. 目标检测的新展望:多模态大模型


➤论文

Learning Object-Language Alignments for Open-Vocabulary Object Detection(ICLR2023)

论文地址:
https://openreview.net/pdf?id=mjHlitXvReu

项目地址:
https://github.com/clin1223/VLDet

Going Denser with Open-Vocabulary Part Segmentation(ICCV2023)

论文地址:
https://arxiv.org/abs/2305.11173

项目地址:
https://github.com/facebookresearch/VLPart

Semantic-SAM: Segment and Recognize Anything at Any Granularity

论文地址:
https://arxiv.org/abs/2307.04767

项目地址:
https://github.com/UX-Decoder/Semantic-SAM

GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest

论文地址:
https://arxiv.org/abs/2307.03601

项目地址:
https://github.com/jshilong/GPT4RoI



极市直播预告|大模型时代目标检测的三点尝试的评论 (共 条)

分享到微博请遵守国家法律