在真实机器人硬件上进行离线强化学习的Benchmark
#论文##开源# ICLR 2023|马克斯-普朗克智能系统研究所(图宾根)与哈佛大学和瑞典皇家理工学院发布在真实机器人硬件上进行离线强化学习的Benchmark 【Benchmarking Offline Reinforcement Learning on Real-Robot Hardware】 数据集地址:GitHub - rr-learning/trifinger_rl_datasets: A pyth... 项目地址: https://sites.google.com/view/benchmarking-offline... 文章链接:[2307.15690] Benchmarking Offline Reinforcement Le... 从以前记录的数据中学习策略是实现真实世界机器人任务的一个有希望的方向,因为在线学习通常是不可行的。特别是灵巧的操作在其一般形式下仍然是一个尚未解决的问题。然而,将离线强化学习与大规模多样化的数据集相结合,有潜力在这一具有挑战性的领域取得突破,类似于近年来在监督学习中取得的快速进展。 为了协调研究者们的努力来解决这个问题,我们提出了一个基准,其中包括:i)一个来自灵巧操作平台的大量离线学习数据,涵盖两个任务,数据是由在仿真中训练的能力强化学习代理获得的;ii)在真实世界机器人系统和仿真环境上执行学习策略的选项,以进行高效调试。我们在这些数据集上评估了知名的开源离线强化学习算法,并为在真实系统上进行离线强化学习提供了可复现的实验设置。