Talk预告 | ICCV'23 华南理工大学林炜丰:视觉基础模型-尺度卷积调制遇上Transformer

本期为TechBeat人工智能社区第519期线上Talk!
北京时间8月3日(周四)20:00,华南理工大学—林炜丰的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “视觉基础模型-尺度卷积调制遇上Transformer”,届时将介绍一种新的基础模型SMT(Scale-Aware Modulation Transformer),它以更低的参数量(params)和计算量(flops)取得了大幅性能的提升。
Talk·信息
▼
主题:视觉基础模型-尺度卷积调制遇上Transformer
嘉宾:华南理工大学 林炜丰
时间:北京时间 8月3日(周四)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
长按识别二维码,一键预约TALK!

Talk·介绍
▼
近年来,基于Transformer和CNN的视觉基础模型取得巨大成功。有许多研究进一步地将Transformer结构与CNN架构结合,设计出了更为高效的hybrid CNN-Transformer Network,但它们的精度仍然不尽如意。本文介绍了一种新的基础模型SMT(Scale-Aware Modulation Transformer),它以更低的参数量(params)和计算量(flops)取得了大幅性能的提升。
Talk大纲
研究背景
研究动机和出发点
模型架构
实验结果
总结与展望
Talk·预习资料
▼

论文链接:
https://arxiv.org/abs/2307.08579
https://github.com/AFeng-x/SMT
https://zhuanlan.zhihu.com/p/642582425
Talk·提问交流
▼
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍
▼

华南理工大学
林炜丰,华南理工大学在读研究生,目前也在阿里云智能进行科研实习。主要研究方向包括计算机视觉,图文多模态,生成模型等。
个人主页:
https://www.techbeat.net/grzytrkj?id=3148
长按识别二维码,一键预约TALK!



关于TechBeat人工智能社区
▼
TechBeat (www.techbeat.net) 是一个荟聚全球华人AI精英的成长社区。 我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。 期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!