分享自:

四足机器人敏捷导航技术研究

期刊:Science RoboticsDOI:10.1126/scirobotics.eadi7566

这项研究的主要作者包括 David Hoeller、Nikita Rudin、Dhionis Sako 以及 Marco Hutter,他们分别来自瑞士苏黎世联邦理工学院 (ETH Zurich) 的 Robotic Systems Lab 和 NVIDIA 苏黎世团队。研究发表在 Science Robotics 2024 年 3 月 13 日的第 9 卷上,文章编号为 eadi7566。这篇文章详细介绍了一项关于四足机器人高机动性导航的原创研究,研究标题为《AnyMal Parkour: Learning Agile Navigation for Quadrupedal Robots》。

研究背景

这项研究的主要科学领域为机器人学,重点在于提高四足机器人的敏捷导航性能。机器人学研究人员长期以来希望开发能够在人类或动物一样敏捷地穿越复杂地形的机器人,其主要应用领域包括灾后救援、复杂自然地形探测等。然而,四足机器人在高动态运动、与不同地形接触以及受限传感器视野等方面仍面临重要挑战。

研究团队旨在开发一种完全基于学习的方法,使四足机器人能够进行如同“跑酷”一样的敏捷导航。他们提出了一种分层学习的策略,综合了感知、低级运动技能与高级导航模块,目标是在无需专家演示、外部计算或环境先验知识的情况下,实现对动态复杂地形的自主有效跨越。

实验设计与工作流程

研究的实验流程分为三个主要模块:感知模块、运动模块与导航模块,每个模块由神经网络支撑并通过仿真数据进行训练。这些模块分工明确,并通过分层结构连接起来,实现完全自主的跑酷式导航。以下是各部分的详细描述:

1. 感知模块

该模块负责为机器人提供周围环境的场景理解。感知模块从机器人搭载的深度摄像头和激光雷达 (light detection and ranging, LiDAR) 中获取的点云数据入手,通过卷积编码-解码网络(fully convolutional encoder-decoder network)生成一个3D的环境重建和一个潜在张量 (latent tensor)。网络采用了多分辨率结构,由两个不同尺度的神经网络结合组成: - 粗分辨率网络:具有12.5 cm 的体素大小,覆盖约4米范围,为导航模块提供整体环境观测。 - 高分辨率网络:具有6.25 cm 的体素大小,专注于机器人周围约2米范围的更精确重建,以保证运动模块进行精准的步态规划。

感知模块还利用了时空多帧累计 (auto-regressive feedback) 技术,能在被遮挡环境下正确推断被隐藏的场景,如在桌下导航或攀爬时重建高表面结构。

2. 运动模块

该模块包含多个低级运动技能,每个技能针对特定地形挑战,如行走、跳跃、攀爬、下坡和蹲伏。研究者通过强化学习训练了这些技能,每个技能都有独立的奖励函数并在仿真环境中实现。训练过程中使用了地形高度图 (elevation map),以避免生成体素点云的额外计算负担并加速训练效率。

  • 跳跃技能:机器人需从一个平台跳跃至另一平台之间,最大跨越距离达到1米。
  • 攀爬与下坡:机器人需克服高达1米的障碍,灵活使用膝关节挂钩动作或前腿支撑重心完成攀爬与下坡。
  • 蹲伏技能:机器人需通过低至0.4米的狭窄通道,动态调整身体高度并保持平衡。
  • 行走技能:应对多样化不规则地形,包括楼梯和斜坡,最高行走速度达到每秒2米。

3. 导航模块

导航模块是该系统的高级控制层,用于整合感知与运动模块以完成目标导航任务。研究团队设计了分层强化学习,在外层循环中执行导航策略(更新频率为5 Hz),在内层循环中激活具体运动技能(更新频率为50 Hz)。导航策略通过感知模块提供的潜在张量以及全局目标位置自动规划路径。

导航模块需要对位置指令、机器人姿态和定时器命令进行详细组合,以实现对不同运动技能的精准控制。在训练中,研究人员为导航策略设定了自动化课程训练(curriculum training),初期目标点被设置在靠近机器人处以快速收敛,随后逐步扩大目标距离。

实验结果

实验验证了提出管道的有效性,机器人不仅能够实现灵活的跑酷式运动,还能以每秒高达2米的速度穿越复杂地形。以下是一些具体表现: - 技能成功率分析:各低级技能在仿真环境中测试时均可完成超过90%难度范围内的任务。例如,攀爬1米高的平台或通过狭窄通道时表现出色。 - 导航策略表现:仿真与真实环境结果均表明,导航模块能够理解技能能力极限,制定非直线路径以避免失败。例如,在1米以上高度障碍时选择绕行更安全路径。 - 感知模块表现:模块能高效处理传感器噪声和遮挡,通过自监督学习实现3D场景精准重建。与传统高程图方法相比,该系统能够识别垂直表面并估算遮挡区域的三维结构。

从机器人实际运行的多组轨迹与速度曲线可见,其对从仿真到现实的迁移表现出极佳的鲁棒性。

研究结论

该研究提出了一种分层学习架构,提供了系统化解决方案使四足机器人实现复杂动态环境中的敏捷导航。结果表明,无需先验知识或专家演示,机器人能够自主规划路径并在高动态动态下执行敏捷运动。

  • 科学价值:揭示了设计灵活导航机器人工具链的关键技术应用,并为未来灾后救援场景中的机器人导航奠定理论基础。
  • 应用潜力:扩展机器人在复杂真实地形中的自主能力,在建筑坍塌救援或探索复杂自然地形中具有广泛意义。

研究亮点与创新点

  • 完全基于学习的导航方式,无需专家干预、先验地形或离线规划。
  • 自创多分辨率感知模块,能够重建部分遮挡的环境。
  • 针对关键机器人技能实现了定制化强化学习,并显著提升难度范围内任务完成率。
  • 在挑战性的四足机器人跑酷场景下首次实现每秒2米的高效导航速度。

研究团队通过实验性验证阐明了所提出的导航系统的全面性与鲁棒性,虽然此方法目前仍存在部分非结构化场景中的通用性限制,但已展示出未来进一步优化和扩展的巨大潜力。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com