图灵小伙伴 | 「星动纪元」人形机器人研究成果以全满分入选机器人顶会RSS
2024-05-16
星动纪元联合清华大学交叉信息研究院、上海期智研究院最新研究成果以全满分成绩入选机器人顶会RSS。
近期,星动纪元在具身智能领域取得重要突破,联合清华大学交叉信息研究院、上海期智研究院提出了一种新颖的人形机器人学习算法框架,有效去除真实世界噪声扰动,解决机器人复杂环境中的适应性。
这一研究成果《Advancing Humanoid Locomotion: Mastering Challenging Terrains with Denoising World Model Learning》(DWL)被机器人领域难度最高的顶会Robotics: Science and Systems(RSS)接收,并获得了全体审稿人满分4.0的优秀成绩。星动纪元为论文第一作者单位。
RSS会议全称机器人科学与系统会议,是机器人领域的最顶级学术会议之一,迄今已成功举办19届。RSS 会议以其高标准的论文筛选过程而著称,历史上国内企业在上面发表文章数量极少。
人形机器人泛化移动面临的挑战
相较于四足机器人,人形机器人之所以在执行作业任务时具有显著优势,原因在于其能最大程度适应围绕人类需求和能力设计的真实物理环境与基础设施。但这也为人形机器人的人形泛化移动,尤其是与复杂地形环境的步态移动与交互提出了巨大挑战。
此前,人形机器人步态发展极大依赖于模型控制技术,如零力矩点(ZMP)、模型预测控制(MPC)和全身控制(WBC)。这些技术推动了机器人在行走、跳跃乃至后空翻等动作上的进步。然而,这些方法的效果往往受限于对环境动力学的精确建模,特别是在环境交互复杂的场景中,如穿越难行地形,控制复杂度增加。
与之相对,强化学习(RL)对环境建模的需求较低。近期在无模型RL领域的进展,显示了其在创建普适性腿部运动控制器方面的巨大潜力。此方法使机器人能从多样环境中学习并适应,其性能完全超过传统的基于模型的控制方法。
尽管如此,想要实现鲁棒的人形机器人运动控制仍然存在问题,如较高的重心、摆动腿时的不稳定性、增加的腿部惯性、来自躯干和手臂的额外重量,以及通常更大的尺寸等。目前,将RL应用于人形机器人在现实世界中的控制,仍局限于相对简单的地形。
DWL:缩小仿真训练与现实差距
为应对人形机器人控制领域的挑战,星动纪元研发团队在之前开发的Humanoid-Gym平台(点击查看)基础上,提出了去噪世界模型学习(DWL)技术,在全球范围内首次实现了人形机器人通过端到端强化学习(RL)和无样本仿真到真实的转换。能极大缩小机器人运动控制训练过程中仿真训练与现实之间的差距,赋予机器人穿越多样化和复杂地形的能力,适用于各类具有挑战性的现实世界地形。
目前,该技术已在星动纪元的两种尺寸的人形机器人“小星(XBot-S)”及“小星Max(XBot-L)”上进行了验证,在包括雪地、倾斜面、楼梯和不规则表面等各种地形上,表现出出色的行走稳定性与抗干扰性。
值得关注的是,在上述所有场景中,课题组使用的是同一个神经网络策略,展示了其鲁棒性和泛化能力。
星动纪元人形机器人