欢迎光临散文网 会员登陆 & 注册

CVPR'21 Talk预告+在线交流 | Oral一作面对面 理论侧专场

2021-06-21 20:44 作者:TechBeat人工智能社区  | 我要投稿



⚡由将门-TechBeat人工智能社区所主办的「CVPR 2021 群星闪耀·云际会」现已进行过半,上周末来自字节、清华、港大、港中文等七个Lab专场的在线直播交流已火热结束。本周继续为你带来13位Oral一作的分享!

⏰北京时间6月21日今晚8点,四位Oral一作同学的Talk合辑(理论侧)将准时在TechBeat人工智能社区开播!届时中国科学技术大学博士陈鹏美国加州大学洛杉矶分校统计学博士范丽凤美国东北大学博士生李振纲、美国加州大学洛杉矶分校博士郑子隆将一起分享他们的工作内容,带领大家完成一场头脑、能力和眼界的巅峰碰撞。

6月26日(周六)上午10点,四位嘉宾将与大家相约腾讯会议直播交流,更有莫纳什大学助理教授庄博涵老师作为空降特邀主持人,带领大家一起与学术新星0距离对话!欢迎踊跃报名!

(嘉宾工作介绍及报名方式见下文)


Oral一作面对面·报名通道

特邀主持人

庄博涵

莫纳什大学助理教授,博士生导师

庄博涵,澳大利亚Monash University助理教授,博士生导师。庄博士于2018年在澳大利亚阿德莱德大学获得博士学位,尤其关注于模型压缩和加速以及高效计算机视觉算法的研究。庄博士在CVPR, ICCV, ECCV, NeurIPS, TPAMI等顶级国际会议和期刊发表论文二十余篇,庄博士亦担任TPAMI, IJCV, CVPR, NeurIPS, ICML, ICLR等顶级学术期刊会议审稿人。


论文信息&嘉宾介绍

面向物体检测的高精度低比特量化网络的设计

模型量化技术旨在将全精度的深度学习模型离散化为对应的低比特量化网络,以获取运行时执行速度的提升,以及内存占用和功耗的降低。本文提出了一种面向物体检测应用的高精度低比特量化网络设计流程。该量化流程允许物体检测网络在推理阶段的网络执行部分只使用整型计算,同时能够做到4bit量化取得接近全精度网络的性能。这项工作能够适用于其他类型的计算机视觉任务,为算法在资源受限平台上的部署提供了参考。

论文链接:

https://arxiv.org/abs/2007.06919

项目链接:

https://github.com/aim-uofa/model-quantization

https://github.com/blueardour/AdelaiDet

https://github.com/blueardour/detectron2

陈鹏 | 中国科学技术大学博士

陈鹏,博士毕业于中国科学技术大学,计算机体系结构专业。毕业后加入上海华为科技有限公司消费者BG部门,从事NPU架构规划方面的工作。2019~2020年在澳洲阿德莱德大学沈春华老师课题组做博后,主要的研究方向是基于深度学习模型的计算机视觉算法和模型压缩技术。

个人主页:

https://blueardour.github.io/


从视频中学习非口头交流里的三元信念动态变化

非口头交流可以在人与人之间传达丰富的社会交互信息。我们结合不同的非口头交流信号(例如,眼神,体态和手势),从纯视觉视频输入中对人与人交互过程中的信念动态变化进行建模学习和推断,基于“共同心智”提出“五心”模型。我们的模型在社交互动视频的总结摘要问题上具有很好的表现。

论文链接:

https://lifengfan.github.io/files/cvpr21/TBD_paper.pdf

项目链接:

https://github.com/LifengFan/Triadic-Belief-Dynamics


范丽凤 | 美国加州大学洛杉矶分校统计学博士

范丽凤,本科毕业于浙江大学统计学专业,现于美国加州大学洛杉矶分校(UCLA)攻读统计学博士学位,师从朱松纯教授,研究计算机视觉和人工智能,主要研究方向为社会交互场景的深度理解,包括非口头交流中的行为识别和认知建模等等。

个人主页:

https://lifengfan.github.io/


一款移动端基于编译器超实时加速的神经网络剪枝与搜索统一框架

随着在移动边缘设备上部署DNN的需求不断增加,减少不必要的神经网络计算并提高执行速度变得越来越重要。为了实现这一点,人们尝试了不同方法,包括模型压缩,以及网络架构搜索(NAS)。但这些工作大多是独立进行的,且没有充分考虑编译器级别的优化。在这篇论文中,我们完善了细粒度模型裁剪类别,并提出了相对应的可以支持不同DNN结构与裁剪模式的编译器自动代码生成框架,基于以上两点,我们提出了将网络剪枝,网络结构搜索相结合的统一搜索框架NPAS。我们的框架在三星S10手机上实现了6.7ms、5.9ms、3.9ms的ImageNet推断时间,并分别达到了78.2%、75%(MobileNet-V3级别)和71%(MobileNet-V2级别)的Top-1准确率,这些结果稳定优于之前的工作。

论文链接:

https://arxiv.org/pdf/2012.00596.pdf

李振纲 | 美国东北大学博士生李振纲,本科毕业于浙江大学电子信息工程,研究生毕业于美国Northeastern University,现继续在Northeastern University攻读Computer Engineering博士学位。主要研究方向包括深度学习算法,模型压缩与加速,机器视觉。

个人主页:

https://www.linkedin.com/in/zhengang-li-2a7aba156/


PatchGenCN:基于单张图片的能量模型学习

研究单张自然图片的内在统计分布在计算机视觉领域有极大的意义和挑战。本论文提出通过能量模型对单张图片进行显示表征,并直接基于学到的模型进行由粗到细的采样以获得相似分布的自然图片。实验表明,本模型可以简洁、有效地应用在图片生成、图片修改、风格迁移等任务中。

论文链接:

https://zilongzheng.github.io/assets/projects/PatchGenCN/CVPR21_PatchGenCN.pdf

代码链接:

https://github.com/zilongzheng/PatchGenCN

郑子隆 | 美国加州大学洛杉矶分校博士

郑子隆,2021年毕业于美国加州大学洛杉矶分校,主要研究方向包括多模态建模、能量模型学习、对话管理等。博士期间发表CVPR、AAAI等顶级国际期刊十余篇,并三次以第一作者/并列一作发表CVPR的Oral论文,多次参加CVPR、ICCV、AAAI、NeurIPS等顶级会议的审稿。

个人主页:

web.cs.ucla.edu/~zilongzheng


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ

CVPR'21 Talk预告+在线交流 | Oral一作面对面 理论侧专场的评论 (共 条)

分享到微博请遵守国家法律