CVPR'21 Talk | 香港中文大学(深圳)GAP-Lab

⚡由将门-TechBeat人工智能社区所主办的CVPR 2021 群星闪耀·云际会将携手51位分享嘉宾,10场论文解读Talk,5天10场在线交流活动,云端实时开讲,让你建立真正属于自己的能量级学术网络,同时一次性解锁学术的101种姿势。
⏰北京时间6月16日(周三)晚8点,第③场——香港中文大学(深圳)GAP-Lab的论文解读Talk已经准时在TechBeat人工智能社区开播!团队负责人香港中文大学(深圳)助理教授韩晓光老师携其学生聂隐愚、邱宇达、刘浩霖分享了他们在CVPR 2021的工作。
⚡ 点击【https://datayi.cn/w/j9yBJJyR】,免费收看talk~
Talk·信息
分享人:香港中文大学(深圳)GAP-Lab
时间:北京时间 6月16日 (周三) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
⚡ 点击【https://datayi.cn/w/j9yBJJyR】,免费收看talk~
直播交流活动·报名通道

团队介绍
香港中文大学(深圳)GAP-Lab
• 团队成立于2018年,由香港中文大学(深圳)助理教授韩晓光带领的GAP为Generation and Analysis of Pixels, Points and Polygons, 团队主要围绕着图像、视频和三维内容的分析和生成开展研究。研究方向包括计算机视觉和计算机图形学,近年来主要重心在室内场景和数字人的理解和三维重建方向以及几何深度学习的理论和应用研究。
• 团队常年招收优秀的博士后、博士、硕士等以及工程师,也希望和产业界建立紧密合作关系。
• 详情请见:
https://mypage.cuhk.edu.cn/academics/hanxiaoguang/
韩晓光
香港中文大学(深圳)助理教授
韩晓光博士,现任香港中文大学(深圳)助理教授,2009年本科于南京航空航天大学毕业,2011年获得浙江大学应用数学系硕士学位,2011年至2013年于香港城市大学创意媒体学院任研究助理,之后于2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉、计算机图形学、虚拟现实和医疗图像处理等,在该方向著名国际期刊和会议发表论文40余篇,包括顶级会议和期刊SIGGRAPH, CVPR, ICCV, ECCV, NeurIPS, IEEE TPAMI, ACM TOG 等。他的工作曾获得CCF 图形开源数据集奖,计算机图形学顶级会议Siggraph Asia 2013新兴技术最佳演示奖,2019年和2020年连续两年计算机视觉顶级会议CVPR最佳论文列表(入选率分别为0.8%和0.4%),他的团队于2018年11月获得IEEE ICDM 全球气象挑战赛冠军(参赛队伍1700多)。
个人主页:https://mypage.cuhk.edu.cn/academics/hanxiaoguang/
①
RfD-Net: 通过语义实例重建从点云中理解三维场景

从点云中理解三维场景的语义与几何是目前具有挑战性的任务。以往工作通常将点云转化为规则的网格并基于三维卷积来进行场景理解。其通常需要消耗巨大的算力以导致几何分辨率不高。本文提出一种直接基于稀疏点云的网络框架,核心为“先检测再重建”实现语义实例级别的场景理解。
论文链接:https://arxiv.org/abs/2011.14744
代码链接:https://github.com/yinyunie/RfDNet
聂隐愚 | 慕尼黑工业大学博士后
聂隐愚,目前为慕尼黑工业大学Visual Computing Group博士后。此前于英国计算机动画中心,伯恩茅斯大学获得博士学位。博士期间曾为香港中文大学(深圳)访问博士生。他的研究兴趣主要包括三维场景/物体理解,分析与重建。目前在CVPR,NeurIPS等会议发表工作多篇。
个人主页:https://yinyunie.github.io/
②
3DCaricShop: 应用于夸张人脸图像的三维数据库及单张图三维重建的方法

夸张人脸图像是一种广泛应用的艺术表达形式。它通过对人脸五官的特征进行夸张处理,增加作品的幽默或讽刺效果,使图像能更好地被观众识别并记忆。然而从夸张图像中重建出对应的三维人脸是一个具有挑战性的任务,其主要困难在于缺少相适应的三维数据集。我们在这个工作中提出了一个大规模的夸张人脸数据集,包含风格多样的二维图像及相对应的人工建模三维人脸。我们同时提出了一个单张图像重建三维人脸的算法,来验证数据库的有效。算法结合了隐式三维重建和参数化模型两者的优势,合理地重建出了图像中的人脸模型。
论文链接:https://arxiv.org/abs/2103.08204
代码链接:https://qiuyuda.github.io/3DCaricShop/
邱宇达 | 香港中文大学(深圳)博士生邱宇达,来自于香港中文大学(深圳)的一年级博士生。目前师从韩晓光老师,研究课题为人脸三维的理解与重建。
个人主页:https://github.com/qiuyuda
③
一个应用于RGBD图片,自上而下的三维文本视觉定位方法

三维文本视觉定位(3D visual grounding)任务是目前计算机视觉领域中十分具有挑战性的任务。先前的方法使用经过重建处理的完整场景数据作为输入,再加上用户指定的一句描述目标物体的语句,最终输出一个三维bounding box来定位目标物体。考虑到现实环境可能会发生动态调整,且完整的场景不易得到,我们把该任务拓展到仅包含不完整场景信息的单视角RGBD图片上,提出了一个基于RGBD图片的文本三维视觉定位任务(3D visual grounding)。由于三维几何信息的部分缺失,在RGBD图片上进行三维视觉定位是更有挑战性的任务。我们提出了一个自下而上的方法,来解决这一任务所带来的挑战。
论文链接:https://arxiv.org/abs/2103.07894
代码链接:https://unclemedm.github.io/Refer-it-in-RGBD
刘浩霖 | 香港中文大学(深圳) 博士生
刘浩霖,香港中文大学(深圳)的二年级博士生。目前师从韩晓光老师,研究课题为室内场景的理解与重建。
个人主页:https://github.com/UncleMEDM
⚡ 点击【https://datayi.cn/w/j9yBJJyR】,免费收看talk~
关于TechBeat人工智能社区
TechBeat(www.techbeat.net)是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ