分享自:

全能抓取:利用模拟人形机器人抓取多样化物体

期刊:38th conference on neural information processing systems (NeurIPS 2024)

这篇文档属于类型a,是一篇关于模拟人形机器人抓取和操控物体的原创研究论文。以下是详细的学术报告:

主要作者及机构
本研究由Zhengyi Luo(卡内基梅隆大学及Meta Reality Labs Research)、Jinkun Cao(卡内基梅隆大学)、Sammy Christen(苏黎世联邦理工学院及Meta)、Alexander Winkler(Meta)、Kris Kitani(卡内基梅隆大学及Meta)和Weipeng Xu(Meta)合作完成,发表于第38届NeurIPS(Conference on Neural Information Processing Systems)2024会议。

学术背景
研究领域为机器人学与计算机视觉交叉的物理模拟人形控制(physics-based humanoid control)。传统方法多采用“ disembodied hand”(脱离身体的手部模型)进行抓取任务,仅支持垂直抓取或短轨迹跟踪,限制了在动画、虚拟现实(VR)及机器人操作中的应用。本研究旨在解决两大挑战:
1. 高自由度控制问题:人形机器人需协调全身153个自由度(degrees of freedom, DoF),包括平衡维持与灵巧手部操作。
2. 泛化性问题:需适应超过1200种不同形状的物体及随机生成的复杂运动轨迹。

研究方法与流程
研究分为两个核心阶段:

  1. PULSE-X:通用灵巧人形运动表征学习

    • 数据增强:针对现有运动数据集(如AMASS)缺乏手部动作的问题,将身体动作与手部动作(来自GRAB和Re:InterHand数据集)随机配对,构建“Dexterous AMASS”数据集。
    • 运动模仿器PHC-X训练:通过强化学习(RL)训练人形模仿含手部动作的参考运动,输入为当前状态与目标姿态差,输出为关节驱动信号。
    • 运动表征蒸馏:将PHC-X蒸馏为低维潜空间(48维)的PULSE-X模型,采用变分信息瓶颈(variational information bottleneck)技术,提升RL探索效率。
  2. OmniGrasp:基于预抓取引导的物体操控策略

    • 状态与动作设计:输入仅包含物体网格(mesh)、目标轨迹及预抓取姿态(pre-grasp),无需配对的人体运动数据。动作空间为PULSE-X的潜变量,通过残差策略生成自然运动。
    • 奖励函数:分阶段设计:
      • 接近阶段(Approach phase):鼓励手部靠近预抓取位置。
      • 抓取阶段(Grasp phase):精确匹配预抓取姿态。
      • 轨迹跟踪阶段:最小化物体位置与目标轨迹的误差。
    • 训练流程:使用PPO(Proximal Policy Optimization)算法,通过硬负样本挖掘(hard-negative mining)提升难样本学习效率。

实验结果
1. 抓取与轨迹跟踪成功率
- 在GRAB数据集上,对未见过的物体和运动轨迹,抓取成功率(succgrasp)达100%,轨迹跟踪成功率(succtraj)为94.1%,远超基线方法(如Braun et al.的79%)。
- 在Oakink数据集(1700个物体)上,训练集抓取成功率为93.7%,测试集为94.3%,验证了泛化能力。

  1. 关键发现
    • 预抓取的指导作用:预抓取姿态显著提升抓取稳定性(对比实验显示,移除预抓取奖励后成功率下降至77.1%)。
    • 运动表征的重要性:PULSE-X潜空间使训练样本效率提升10倍,且生成动作更接近人类运动。

结论与价值
1. 科学价值
- 提出首个支持全身协调与灵巧手部操作的通用人形控制器,突破了传统方法在物理真实性与任务多样性上的限制。
- 证明了无需配对运动数据即可学习抓取策略,为无监督强化学习提供了新范式。

  1. 应用价值
    • 可应用于虚拟角色动画、VR交互及人形机器人抓取任务,例如在物流分拣或家庭服务场景中操控多样物体。

研究亮点
1. 创新方法
- 结合运动表征蒸馏与分层强化学习,解决了高自由度探索难题。
- 提出“合成轨迹生成器”(3D trajectory generator),无需真实运动捕捉数据即可训练。

  1. 技术突破
    • 在Isaac Gym物理引擎中实现实时模拟(30Hz控制频率),支持双手机器人操作(bimanual manipulation)。

其他有价值内容
- 鲁棒性分析:在输入噪声(±0.01m扰动)下,策略性能仅下降3%,显示潜在的实际应用可行性。
- 失败案例:旋转误差(erot)较高(0.93 radian),未来需改进手-物体接触建模。

OmniGrasp为模拟人形控制提供了可扩展的解决方案,其方法框架与开源代码(即将发布)或将成为后续研究的基准。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com