Talk预告 | 鲁汶大学在读博士生万博：基于统一结构建模的无监督视觉语言语法归纳

2022-06-14 14:42 作者:TechBeat人工智能社区 0人读过 | 我要投稿

本期为TechBeat人工智能社区第 412 期线上Talk。北京时间6月15日(周三)20:00，鲁汶大学在读博士生——万博的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是: “基于统一结构建模的无监督视觉语言语法归纳”，届时将分享在无监督的条件下建立一个统一的VL结构，以帮助下游的多模态结合任务的理解。

Talk·信息

主题：基于统一结构建模的无监督视觉语言语法归纳

嘉宾：鲁汶大学在读博士生万博

时间：北京时间 6月15日 (周三) 20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

完整版怎么看？

扫描下方二维码，或复制链接https://datayi.cn/w/noqymADo至浏览器，一键完成预约！上线后会在第一时间收到通知哦

Talk·介绍

现阶段视觉和语言的多模态理解吸引了很多研究者的注意，例如CLIP和DALLE已经在工业界得到了大规模的应用。然而，视觉图像和自然语言均包含了丰富的结构化信息，例如图像的scene graph表达，以及NLP领域里的grammar induction。目前很少有工作同时对这两个模态的结构信息进行归一化建模，我们是第一个提出在无监督的条件下建立一个统一的VL结构，以帮助下游的多模态结合任务的理解。

具体分享提纲如下：

1.任务介绍

2.背景知识

3.解决方法

4.实验结果

5.结论

Talk·预习资料

▼

1. Shi et. al. Visually Grounded Neural Syntax Acquisition. ACL 2019 Best Paper Nominee

2. Zhao et. al. Visually Grounded Compound PCFGs. EMNLP 2020 Honorable Mention Paper

3. Zhang et. al. Video-aided Unsupervised Grammar Induction. NAACL 2021 Best Long Paper

4. Drozdov et. al . Unsupervised Latent Tree Induction with Deep Inside-Outside Recursive Autoencoders. NAACL 2019

5. Wang et. al. MAF: Multimodal alignment framework for weakly-supervised phrase grounding. EMNLP 2020

Talk·提问交流

通过以下两种方式提问都将获得微信现金红包奖励哦！

方式 ①

在Talk界面下的【交流区】参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

方式 ②

在本文留言区直接提出你的问题，或扫描下方二维码提问！

Talk·嘉宾介绍

万博现阶段是鲁汶大学博士二年级研究生，导师是Tinne Tuytelaars。他本科毕业于北京邮电大学，硕士阶段在上海科技大学何旭明教授的指导下进行研究。他的主要研究方向包括视觉和语言理解，多模态匹配和结构解析，以及视觉关系理解。他的研究成果发表在多个国际会议上，包括CVPR，ICCV，ICLR，AAAI，ACMMM等。

具体参考：

https://scholar.google.com/citations?user=_7KkpE4AAAAJ&hl=en

关于TechBeat人工智能社区

TechBeat (www.techbeat.net) 是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验，加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地，分享自己最新工作的沃土，在AI进阶之路上的升级打怪的根据地！

更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ

标签：