Talk预告 | ICCV'23 华南理工大学林炜丰：视觉基础模型-尺度卷积调制遇上Transformer

2023-07-31 15:22 作者:TechBeat人工智能社区 0人读过 | 我要投稿

本期为TechBeat人工智能社区第519期线上Talk！

北京时间8月3日(周四)20:00，华南理工大学—林炜丰的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是: “视觉基础模型-尺度卷积调制遇上Transformer”，届时将介绍一种新的基础模型SMT（Scale-Aware Modulation Transformer），它以更低的参数量（params）和计算量（flops）取得了大幅性能的提升。

Talk·信息
▼

主题：视觉基础模型-尺度卷积调制遇上Transformer

嘉宾：华南理工大学林炜丰

时间：北京时间 8月3日(周四)20:00
地点：TechBeat人工智能社区
http://www.techbeat.net/

长按识别二维码，一键预约TALK！

Talk·介绍

▼

近年来，基于Transformer和CNN的视觉基础模型取得巨大成功。有许多研究进一步地将Transformer结构与CNN架构结合，设计出了更为高效的hybrid CNN-Transformer Network，但它们的精度仍然不尽如意。本文介绍了一种新的基础模型SMT（Scale-Aware Modulation Transformer），它以更低的参数量（params）和计算量（flops）取得了大幅性能的提升。

Talk大纲

研究背景
研究动机和出发点
模型架构
实验结果
总结与展望

Talk·预习资料

▼

论文链接：

https://arxiv.org/abs/2307.08579

https://github.com/AFeng-x/SMT

https://zhuanlan.zhihu.com/p/642582425

Talk·提问交流

▼

在Talk界面下的【交流区】参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

▼

林炜丰，华南理工大学在读研究生，目前也在阿里云智能进行科研实习。主要研究方向包括计算机视觉，图文多模态，生成模型等。

个人主页:

https://www.techbeat.net/grzytrkj?id=3148