Talk预告 | ICCV'23清华大学刘世隆：From Detection to Grounding-迈向更强的开集目标

2023-08-08 10:55 作者:TechBeat人工智能社区 0人读过 | 我要投稿

本期为TechBeat人工智能社区第521期线上Talk！

北京时间8月10日(周四)20:00，清华大学博士生—刘世隆的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是: “From Detection to Grounding-迈向更强的开集目标检测”，届时将分享其在开集目标检测的探索并展示Grounding DINO的优异结果。

Talk·信息

▼

主题：From Detection to Grounding-迈向更强的开集目标检测

嘉宾：清华大学博士生刘世隆

时间：北京时间 8月10日(周四)20:00
地点：TechBeat人工智能社区
http://www.techbeat.net/

长按识别二维码，一键预约TALK！

Talk·介绍

▼

目标检测是计算机视觉的基础任务，但是传统的目标检测器只能处理固定类别，实现“检测一切”这一目标仍是一个有挑战性的内容。我们会分享我们在开集目标检测的探索，展示Grounding DINO的优异结果，这也许是当前最强的开集目标检测模型。

Talk大纲

介绍和对比开放词表检测中的两个范式：Referring (CLIP-based)和Grounding。
在Grounding方向的探索：Grounding DINO的模型设计思路和方案及其优异结果。
Grounding DINO和SAM结合带来的Grounded-SAM、组合开集模型的优异性能。

Talk·预习资料

▼

代码链接：

https://github.com/IDEA-Research/GroundingDINO

https://github.com/IDEA-Research/Grounded-Segment-Anything

Talk·提问交流

▼

在Talk界面下的【交流区】参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

▼

刘世隆，清华大学计算机系三年级博士生，导师为朱军教授，也长期在粤港澳大湾区数字经济研究院 (IDEA Research)接受张磊教授指导。他长期关注计算机视觉中的物体理解问题，主要研究方向包括检测分割以及开放场景下的理解问题。他的代表作包括DAB-DETR, DINO, Grounding DINO等。Google Scholar引用超过900，GitHub累计超过1.4万stars。

个人主页:

https://www.techbeat.net/grzytrkj?id=26396