Talk预告 | 新加坡国立大学寿政：大规模视频-语言预训练模型

2022-07-21 13:03 作者:TechBeat人工智能社区 0人读过 | 我要投稿

本期为TechBeat人工智能社区第424期线上Talk。北京时间7月21日(周四)20:00，新加坡国立大学助理教授、博士生导师——寿政Mike的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是: “大规模视频-语言预训练模型”，届时将介绍多模态、大规模预训练模型，和第一视角视频的预训练。

Talk·信息

主题：大规模视频-语言预训练模型

嘉宾：新加坡国立大学助理教授、博士生导师寿政 Mike

地点：TechBeat人工智能社区

完整版怎么看？

扫描下方二维码，或复制链接https://datayi.cn/w/rREpg819至浏览器，一键完成预约！上线后会在第一时间收到通知哦

Talk·介绍

多模态、大规模预训练模型，如OpenAI的CLIP和DALL-E，效果非常惊艳。Show Lab团队，聚焦在视频多模态上，最近开发了一系列的，大规模预训练模型，在多类任务（文本-视频检索，问答，动作识别等等），十几个数据集上取得了很好的进展。

具体分享提纲如下：

1. 首次在端到端的视频-语言预训练中加入物体信息

2. all-in-one，一个独立模型在9个数据集4类任务上

3. 第一个第一视角的视频-语言预训练模型

Talk·预习资料

1. Object-aware Video-language Pre-training for Retrieval. CVPR 2022.

https://github.com/FingerRec/OA-Transformer

2. All in One: Exploring Unified Video-Language Pre-training. Preprint, 2022.

https://github.com/showlab/all-in-one

3. Egocentric video-language pretraining. Preprint, 2022.

https://github.com/showlab/EgoVLP

Talk·提问交流
通过以下两种方式提问都将获得微信现金红包奖励哦！

方式 ①在Talk界面下的【交流区】参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

方式 ②在本文留言区直接提出你的问题，或扫描下方二维码提问！

Talk·嘉宾介绍

新加坡国立大学助理教授、博导、独立项目负责人，创立Show Lab。他受邀担任学术会议如CVPR，ECCV，ACM Multimedia等的领域主席，曾获best paper finalist at CVPR'22, best student paper nomination at CVPR'17。他带领团队在国际比赛中获得第一名，包括ActivityNet 2017, Ego4D 2022, EPIC-Kitchens 2022. 他当选新加坡国家科研基金委Fellow，入选福布斯30 Under 30亚洲区精英榜。

个人主页：

https://sites.google.com/view/showlab

关于TechBeat人工智能社区

TechBeat (www.techbeat.net) 是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验，加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地，分享自己最新工作的沃土，在AI进阶之路上的升级打怪的根据地！

更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ

标签：