极市直播预告|大模型时代目标检测的三点尝试
|极市线上分享第118期 |
一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,并完成了117 期极市线上直播分享。
往期分享请前往bbs.cvmart.net/topics/149,也欢迎各位小伙伴自荐或推荐更多优秀的技术嘉宾到极市进行技术分享,与大家一起交流学习~~
本次分享我们邀请到了香港大学的博士生孙培泽,为大家介绍他们的一些探索工作:
Learning Object-Language Alignments for Open-Vocabulary Object Detection(ICLR2023)
Going Denser with Open-Vocabulary Part Segmentation(ICCV2023)
Semantic-SAM: Segment and Recognize Anything at Any Granularity.
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest
01
直播信息
时间
2023年8月3日(周四):21:00-22:00
主题
大模型时代目标检测的三点尝试
直播
极市平台视频号
B站也将同步进行
http://live.bilibili.com/3344545
02
嘉宾介绍

孙培泽
香港大学博士生,指导老师为罗平副教授。研究方向为计算机视觉和深度学习,包括目标检测分割追踪和视觉语言多模态模型。
03
关于分享
➤分享大纲
1.回顾目标检测的发展历程
2.目标检测的三点尝试
- 从封闭环境到开放世界
- 从单一模型到交互系统
- 从视觉感知到多模态推理
3. 目标检测的新展望:多模态大模型
➤论文
Learning Object-Language Alignments for Open-Vocabulary Object Detection(ICLR2023)
论文地址:
https://openreview.net/pdf?id=mjHlitXvReu
项目地址:
https://github.com/clin1223/VLDet
Going Denser with Open-Vocabulary Part Segmentation(ICCV2023)
论文地址:
https://arxiv.org/abs/2305.11173
项目地址:
https://github.com/facebookresearch/VLPart
Semantic-SAM: Segment and Recognize Anything at Any Granularity
论文地址:
https://arxiv.org/abs/2307.04767
项目地址:
https://github.com/UX-Decoder/Semantic-SAM
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest
论文地址:
https://arxiv.org/abs/2307.03601
项目地址:
https://github.com/jshilong/GPT4RoI
