机器人感知新突破!整体3D人体场景重建方案揭秘

以下内容来自小六的机器人SLAM学习圈知识星球每日更新内容
点击领取学习资料 → 机器人SLAM学习资料大礼包
#论文# RAL2023| 莫纳什大学牛津大学与印度理工学院发布使用对抗性学习方法从单目RGB图像进行物理上合理的3D人体场景重建方案
【Physically Plausible 3D Human-Scene Reconstruction from Monocular RGB Image using an Adversarial Learning Approach】
文章链接:https://arxiv.org/pdf/2307.14570.pdf
整体3D人体场景重建是机器人感知领域的关键和新兴研究领域。整体3D人体场景重建的一个关键挑战是从单个单目RGB图像生成物理上合理的3D场景。现有研究主要提出了基于优化的方法,用于从不同场景元素(人类和物体)之间明确定义的物理定律和约束的RGB帧序列中重建场景。然而,很难在每个场景中明确定义和建模每个物理定律。本文建议使用场景元素的隐含特征表示来区分人类和物体的物理合理对齐和难以置信的对齐。我们建议使用基于图形的整体表示和场景的编码物理表示来分析场景中的人类-物体和物体-物体的相互作用。使用此图形表示,我们进行对抗性训练我们的模型,以从训练数据本身中学习场景元素的可行对齐,而无需明确定义它们之间的规律和约束。与现有的基于推理时间优化的方法不同,我们使用这种经过对抗训练的模型来生成遵守物理定律和约束的场景的单帧3D重建。我们基于学习的方法实现了与现有基于优化的整体人体场景重建方法相当的三维重建质量,并且不需要推理时间优化。这使得它与现有方法相比更适合在机器人应用中的潜在应用,如机器人导航等。






以上内容来自小六的机器人SLAM学习圈知识星球每日更新内容
最后介绍一下我们最近的几个学习活动:
1、【挑战赛报名】从零掌握GNSS、RTK定位
从零开始讲授GNSS的基础知识,帮助同学们形成完整的GNSS知识脉络。详细介绍GNSS相关的坐标框架、时间框架、观测值产生以及各误差的特性、会详细介绍单点定位的原理以及RTK定位的原理,并会对RTK定位中的数据预处理、周跳探测、模糊度固定展开详细的讲述,帮助学习者可以达到初步工程开发实践的水准。
目前早鸟优惠中(限额),8月28日开始上课。详见 自动驾驶与GNSS之恋
2、【挑战赛】从零开始ChatGPT编程
全面讲解如何利用GPT写代码,调试,框架重构、提交测试等,效率10倍提升!详情见 程序员可以用ChatGPT做什么?
3、第1期编辑部成员招募
一起对AR/MR、机器人、自动驾驶、无人机等SLAM相关的细分行业的梳理和分析,在AI热潮下能够和大家一起理清思路,看清发展脉络和趋势。 仅限 「小六的机器人SLAM学习圈」参与。
4、【报名】招募项目实战合作者
SLAM项目实战课程,基于开源算法做一些拓展项目。仅限 「小六的机器人SLAM学习圈」参与。
5、小六的机器人SLAM圈!
全国最大的机器人SLAM交流圈,详情戳我的机器人SLAM学习圈!
