欢迎光临散文网 会员登陆 & 注册

UAD149A0011 3BHE014135R0011作为高性能控制是如何工作的

2023-12-12 10:32 作者:小赖总-17750010683  | 我要投稿

UAD149A0011 3BHE014135R0011作为高性能控制是如何工作的

UAD149A0011 3BHE014135R0011作为高性能控制是如何工作的

NVIDIA Research 开发的一款名为 Eureka 的新型 AI 智能体可以教机器人复杂的技能,它教会了机器人手快速转笔,并且第一次转得像人类一样好。

上面视频中所展示的令人惊叹的“魔术”是机器人通过 Eureka 学会熟练完成的近 30 项任务之一,Eureka 可以自动编写奖励算法来训练机器人。

Eureka 还教会了机器人完成打开抽屉和柜子、抛接球、操作剪刀等任务。

于 10 月 20 日发布的这一 Eureka 研究包含一篇论文和该项目的 AI 算法,开发者可以使用 NVIDIA Isaac Gym(一款用于强化学习研究的物理模拟参考应用)进行实验。Isaac Gym 基于 NVIDIA Omniverse 而构建,后者是一个用于基于 OpenUSD 框架构建 3D 工具和应用的开发平台。Eureka 自身是由 GPT-4 大型语言模型驱动的。

NVIDIA AI 研究高级总监、Eureka 论文作者之一的 Anima Anandkumar 表示:“在过去十年,强化学习取得了空前成功,但依然面临许多挑战,比如奖励设计需要不断试错才能完成。Eureka 是朝着开发将生成式和强化学习方法结合以解决这些艰巨的任务的新算法迈出的第一步。”

AI训练机器人

据该论文介绍,Eureka 生成的奖励程序(可让机器人进行试错学习)在超过 80% 的任务上优于人类专家编写的程序,这使得机器人的平均性能提高了 50% 以上。

Eureka 教机械臂打开一个抽屉。

该 AI 智能体使用 GPT-4 LLM 和生成式 AI 编写软件代码,为机器人进行强化学习提供奖励。它不需要任何特定任务提示或预定义的奖励模板,并且能够随时结合人类的反馈改进其奖励,使结果更加精准地符合开发者的愿望。

利用 Isaac Gym 中的 GPU 加速模拟,Eureka 能够快速评估大批奖励候选者的质量,从而提高训练效率。

Eureka 随后会基于训练结果汇总关键统计数据,并指导 LLM 改进其奖励函数的生成。通过这种方式,AI 可以自我完善。Eureka 教会了各类机器人,包括四足机器人、双足机器人、四旋翼机器人、灵巧手、协作机器人臂等,来完成不同类型的任务。

该研究论文对 20 个 Eureka 训练任务进行了深入评估,这些任务基于开源的灵巧性基准,要求机器人手展示一系列复杂的双手任务。

这些来自九个 Isaac Gym 环境的测试结果通过使用 NVIDIA Omniverse 生成的可视化进行了展示。

类人型机器人通过 Eureka 学习跑步步态。

该项目的贡献者之一、NVIDIA 高级研究科学家 Linxi “Jim” Fan 表示:“Eureka 是一个独特的组合,将大型语言模型与 NVIDIA GPU 加速的模拟技术相结合,可以实现灵巧的机器人控制,并且为艺术家提供了一种制作物理逼真动画的新方法。”

除了 NVIDIA Research 最近取得的进展(比如使用 GPT-4 构建的能够自主玩 《我的世界》的 AI 智能体 Voyager)之外,这项突破性的研究成果也必将让开发者们脑洞大开。

NVIDIA Research 由全球数百名科学家和工程师组成,团队专注于 AI、计算机图形学、计算机视觉、自动驾驶汽车、机器人学等领域的研究。

进一步了解 Eureka 与 NVIDIA Research。

HIMA X-SB01 985210207

REXROTH R911323057

ABB PM665

SEM MTS30M4-38

ABB TC560V2 3BSE022178R1

ABB TC561V2 3BSE022179R1

ABB CI860K01

REXROTH MKD071B-061-KP1-KN

KONGSBERG RCU501

ABB 3BHE006412R0101

ABB 3BHE021083R0101

ABB 3BHE006373R0101

ABB S-123H 3BHB030479R0512

KUKA KPS-600/20-ESC

KUKA ECMAS3D2224BE531

GE 531X304IBDAMG1

GE H201TI

EMERSON 3-2350-034

EMERSON DA7281440

ABB XVC767AE105

PROSOFT 5105-MCM-PDPS

KOLLMORGEN DBL3M00190-0R2-000-S40

ABB UCC922A 3BHE036012R0001

GE ACC-5595-208

ABB 3BHB005243R0105

ABB 3BHB005243R0117

EMERSON NTE-207-CONS-0000

EMERSON A6312

ABB 1TGE120021R0110

BENTLY 3500/53M

ABB 3BHE022293R0101

ABB 3BHE022291R0101

ABB PM860AK01

HONEYWELL 51198651-100

HONEYWELL ACX631

EMERSON VE4003S2B1

EMERSON VE4005S2B1

HONEYWELL 51198651-100

HONEYWELL 51198947-100F

BENTLY 3500/93 135785-02

GE IS200STCIH4A

ABB PM864AK01

SCHNEIDER AS-P840-000

PROSOFT MVI69-MNET

PROSOFT MVI56E-MNET

AMAT 0190-77062

AMAT 9907-1290

REXROTH HMV01.1E-W0075-A-07-NNNN


UAD149A0011 3BHE014135R0011作为高性能控制是如何工作的的评论 (共 条)

分享到微博请遵守国家法律