基于语义分割和履带动作的铰接式履带机器人越障地形规划框架

分享自：
基于语义分割和履带动作的铰接式履带机器人越障地形规划框架

工程学
机械
期刊:BiomimeticsDOI:10.3390/biomimetics10090627
【点击此处】阅读全文、收藏及针对性提问
学术研究报告：基于语义分割和履带臂运动的关节式履带机器人越障地形规划框架
本研究由北京航空航天大学机械工程及自动化学院的张璞、刘君航、付永玲、孙健共同完成，研究成果以论文“A Planning Framework Based on Semantic Segmentation and Flipper Motions for Articulated Tracked Robot in Obstacle-Crossing Terrain”的形式，发表于期刊《Biomimetics》2025年第10卷第627期，具体发表日期为2025年9月17日。
一、 研究背景与目标
本研究隶属于机器人学、自主导航与运动规划领域，特别是针对非结构化复杂地形移动机器人的自主操作研究。关节式履带机器人凭借其底盘配备的前后主动式履带臂（flipper），能够像有腿动物一样调整姿态，跨越台阶、楼梯等多种障碍，在灾难救援、环境探索等领域具有广泛应用前景。然而，传统操作高度依赖人工远程遥控，操作员需同时控制机器人移动和履带臂角度，负担重、效率低，且难以保证运动的稳定性和最优性。尽管基于同步定位与地图构建技术的二维室内导航已相对成熟，但关节式履带机器人在包含越障动作的三维空间运动规划仍面临挑战，其轨迹超出了平面工作空间，且不同于无人机规划，机器人必须始终保持与地面的接触。因此，开发一种能够自主生成全局路径并协同规划履带臂动作的框架，对于提升此类机器人在复杂环境中的作业效率和自主性至关重要。
现有研究或采用离散的履带臂状态切换，忽视了运动的平滑性；或基于简化骨架模型进行局部连续运动生成，缺乏全局效率；或通过混合地形优化进行实时模式切换，但缺乏全局路径规划；亦有研究应用神经网络和强化学习，但通常局限于特定地形。针对这些不足，本研究旨在开发一种普适性强的规划方法。受到动物在复杂环境中灵活运动的启发，研究目标是让机器人具备对地图的“生物式”语义理解能力，从而能够自主规划自身的“肢体”（履带臂）动作和可行的全局路径。具体而言，本研究提出一个创新的规划框架，包含三个核心组件：1）用于地图实时语义分割的轻量化DeepLab V3+网络；2）基于接触点遍历的履带臂姿态快速计算方法；3）融合了履带臂运动平滑性成本的全局路径规划算法。该框架最终旨在实现越障路径与履带臂动作的协同规划，降低操作员负担，并生成平滑高效的运动。
二、 研究详细工作流程
本研究的工作流程环环相扣，主要包含三个核心步骤：环境语义分割、履带臂姿态计算和全局路径协同规划。研究使用了一台名为“Climber”的自研关节式履带机器人作为实验平台，配备了RoboSense Helios 32三维激光雷达、WIT 9073惯性测量单元、微软D435i相机以及Nvidia Orin计算单元。算法框架的整体流程是：首先，机器人通过SLAM技术构建环境的高程栅格地图；其次，该地图被送入语义分割网络进行区域分类；最后，规划算法利用分类结果和地形几何信息，在线生成包含机器人位姿和履带臂角度的最优运动序列。
步骤一：地图语义分割 该步骤的目标是将机器人感知到的地形实时分类为“平坦区域”、“越障区域”和“不可通行区域”，为后续规划提供语义指导，避免在无需越障的区域进行冗余计算。 1. 数据处理：研究首先将SLAM生成的点云地图转换为高程栅格地图。规划时，提取以机器人为中心的一块区域，并将其高度值映射为一张224x224像素的灰度图像。研究团队在Gazebo仿真平台上搭建了15个包含不同平台和楼梯的越障环境，控制机器人运动并采集了2500张实时高程栅格地图及其对应的图像，按9：1的比例划分为训练集和验证集。人工对训练图像进行标注，使用红色标注越障区域，蓝色标注不可通行区域，其余为平坦区域。 2. 网络设计与训练：研究提出了一种改进的轻量化DeepLab V3+网络架构，命名为MB-DeepLab V3+。具体改进包括：（a）编码器采用轻量级的MobileNet V3作为特征提取网络，并将其输入改为单通道以适应高度图；（b）由于MobileNet V3输出的特征图尺寸较小（7x7），调整了ASPP模块中空洞卷积的膨胀系数为1、3、5，以确保覆盖不同尺度的上下文信息，同时避免感受野超出边界导致信息不足；（c）在解码器中引入了一个边缘感知模块。该模块借鉴了B2CNet网络中的思想，由轻量级注意力机制SimAM、平均池化层、1x1卷积和Sigmoid激活函数组成，旨在增强特征图的边界特征，提升分割精度。网络训练分为两阶段：第一阶段冻结特征提取层，仅训练新添加的分类器头；第二阶段解冻并进行端到端训练。使用Focal Loss作为损失函数，Adam优化器，初始学习率0.005，批次大小16，总训练周期300（第一阶段50，第二阶段250）。 3. 分析与验证：使用平均交并比和平均像素精度作为模型识别精度的评估指标，使用帧率评估推理速度。研究在自建数据集上对比了PSPNet、UNet、以及使用不同骨干网络的DeepLab V3+模型。实验结果表明，提出的MB-DeepLab V3+模型取得了最优的识别性能，MIoU和MPA分别达到92.44%和94.98%，推理速度达到56.45 FPS，满足了实时规划的需求。在实际场景测试中，该模型能在80-100毫秒内完成识别，准确区分出三类区域，为运动规划提供了有效输入。
步骤二：履带臂姿态计算 该步骤的目标是，给定机器人在水平面上的一个目标位置和预设的前后履带臂角度，快速计算出机器人在地形上的稳定姿态，包括底盘离地高度和俯仰角。这是评估路径点是否可行以及进行后续协同规划的基础。 1. 机器人简化建模：为了高效计算，研究对机器人-地形接触进行了简化建模。首先，将履带臂上的小轮概念性地“膨胀”至与大轮直径相同，以简化履带臂角度的定义，并引入一个角度偏移量θ0。接着，将地形点云沿轮廓法线方向向外膨胀一个轮子半径的距离。经过这些处理后，机器人被简化为一个由三条线段（代表前履带臂、底盘、后履带臂）组成的“三连杆”厚道机器人模型。这样，复杂的几何接触计算被转化为寻找与膨胀后地形点接触的简化模型姿态的问题。 2. 姿态求解算法：求解姿态即寻找满足两个约束条件的机器人模型参数。约束一（稳定性）：机器人重心前后必须各至少有一个点与地形接触。约束二（无碰撞）：机器人模型上的所有点必须高于其可达范围内的所有地形点。算法在机器人局部坐标系中进行计算。通过遍历地形点集，选取一对候选接触点，并根据它们可能位于履带臂或底盘的不同情况，列出几何方程。通过巧妙的代数变换（引入t = tan(φ/2)），将关于底盘高度h和俯仰角φ的非线性方程组转化为关于h的多项式方程，利用多项式求根算法快速求解。然后，从所有满足约束一的解中，筛选出同时满足约束二（无碰撞）的解，即为该位置和履带臂配置下的可行姿态。该方法是一种解析/数值结合的方法，当单个位置的地形点数量在30-40个时，平均求解时间约为0.7毫秒，每秒可预测1000-1500个姿态，满足实时性要求。
步骤三：全局路径与履带臂运动协同规划 该步骤是框架的核心，旨在生成一条从起点到终点的最优运动序列，该序列不仅包含空间路径，还包含了沿路径每个点的最优履带臂角度。 1. 算法框架：FMP-RRT*：研究提出了履带臂运动规划RRT*算法。该算法基于Informed-RRT*框架，但进行了关键扩展。算法树中的每个节点不仅包含三维空间位置，还包含机器人状态（底盘高度、俯仰角、前后履带臂角度）以及该节点所在区域的语义标签。 2. 成本函数设计：连接两个节点的边的成本函数综合考量了路径长度和越障难度。具体公式为 f(n1, n2) = (1 + j * ω) * L12，其中L12是三维欧氏距离，j是越障惩罚比例因子（可调参数），ω是归一化的越障难度成本，其物理意义近似为机器人爬坡所需的最小功率输出。这使得算法倾向于选择更短且更容易通过的路径。 3. 协同规划流程：算法的主要创新在于将履带臂动作规划嵌入到采样树的扩展过程中。 * 采样与扩展：算法在二维平面上采样并扩展得到新的路径点，然后将其映射到三维地形上，生成新节点。 * 语义引导：判断新节点所在区域。若为“越障区域”，则启动履带臂动作预测。调用步骤二的“姿态计算”函数，根据当前父节点的履带臂角度和预设的角度变化分辨率，计算在新节点处所有可能的机器人姿态，形成一个离散的状态集合。 * 动态规划寻优：在连接父节点和新节点的过程中，不是简单地选择某个姿态，而是使用动态规划在状态空间中寻找最优的状态转移路径。设计了一个评价单步动作（履带臂角度变化Δθf, Δθr）的成本函数g，该函数包含三部分：俯仰角变化成本gφ（追求运动平滑）、质心高度与局部地形平均高度差成本gh（追求稳定性）、当前俯仰角绝对值的成本gs（防止过度倾斜）。通过最小化从起点状态到新节点所有可能状态的累积成本，可以确定到达新节点的最优履带臂角度、底盘高度和俯仰角。 * 树连接与优化：在找到新节点的最优状态后，将其加入树中，并执行RRT*标准的“重布线”操作，以优化整棵树的路径成本。 4. 实验验证：研究在三种典型场景（跨越平台、平台旁绕行、攀爬楼梯）中测试了FMP-RRT*算法。算法能够在数百毫秒内找到初始路径，并在数秒内进行渐进优化。实验展示了算法能够根据不同的越障惩罚因子j，自主决定是跨越障碍还是绕行，验证了成本函数的有效性。规划出的路径在三维空间中清晰显示了机器人的越障动作序列。
三、 主要研究结果
语义分割性能卓越：MB-DeepLab V3+网络在自建数据集上表现最佳，其高精度（MIoU 92.44%）和高效率（56.45 FPS）证明其能够可靠、实时地为规划框架提供准确的地形语义信息。这是实现智能化、仿生式规划的第一步，使机器人能够“理解”哪里可以走、哪里需要“抬腿”、哪里不能走。
姿态计算快速准确：提出的基于接触点遍历的简化模型和快速求解算法，成功地将单个姿态预测时间压缩到亚毫秒级。这一结果为后续需要大量调用姿态计算的全局规划算法（如FMP-RRT*）奠定了实时性的基础，使得在线协同规划成为可能。
协同规划框架有效：FMP-RRT*算法成功地在三种测试场景中生成了可行的运动路径。关键结果是，该算法不仅规划了几何路径，还同步输出了平滑、协调的履带臂角度序列。场景二的对比实验（调整j值导致路径从绕行变为跨越）直接证明了算法能够根据成本权衡做出不同的行为决策，体现了其灵活性和可调节性。
运动质量优于人工操作：通过量化对比自主规划与专业操作员遥控，在跨越平台和楼梯的场景中，自主规划在多个指标上均表现出优势：总时间更短（例如场景一：30.23秒 vs 40.48秒），最大俯仰角更小（表明稳定性更好），履带臂累计转动角度更小（表明运动更平滑、能量消耗更低）。这些数据强有力地证明了所提框架的实用价值：它能够替代或辅助人工操作，生成更高效、更稳定、更节能的运动方案。在纯避障场景（场景二绕行）中，两者性能相近，因为都不涉及履带臂动作。
四、 研究结论与价值
本研究成功提出并验证了一个面向关节式履带机器人的、集语义理解、快速姿态求解与协同规划于一体的自主越障规划框架。结论表明，该框架能够使机器人在复杂非结构化地形中，实时生成包含平滑履带臂动作的全局运动路径，显著减少了对人工远程操控的依赖。
其科学价值在于：第一，将语义分割引入到移动机器人三维运动规划中，提升了环境表示的层次和机器人的决策智能。第二，提出了一种高效的机器人-地形接触简化模型与快速姿态求解方法，为类似系统的实时运动规划提供了新思路。第三，创新性地将履带臂运动平滑性成本融入基于采样的全局规划算法，实现了路径几何与关节动作的深度融合与协同优化，为解决高自由度机器人在接触约束下的运动规划问题提供了有效范式。
其应用价值显著：该框架直接提升了关节式履带机器人在搜救、勘探等危险或复杂环境中的作业自主性、效率和安全性。更短的作业时间、更稳定的运动过程和更低的能量消耗，对于延长机器人续航、保障任务成功具有重要意义。
五、 研究亮点
框架的创新性与完整性：研究并非聚焦于单个技术点，而是构建了一个从环境感知（语义分割）、到模型计算（姿态求解）、再到决策规划（FMP-RRT*）的完整技术链条，各部分紧密耦合，系统性解决了关节式履带机器人自主越障的难题。
语义与几何的融合：采用轻量化深度学习网络进行地形语义实时分割，使规划器具备“任务级”理解能力（哪里该越障），避免了在平坦区域的无效计算，同时保留了传统几何规划在“越障区域”的精确控制能力。
高效的协同规划算法：FMP-RRT*算法是核心亮点。它通过在RRT*扩展节点时，有选择地（仅在越障区）进行履带臂状态预测，并通过动态规划在状态空间寻优，巧妙地实现了全局路径与局部关节动作的同步优化，且计算开销可控。
详实的实验验证：研究不仅进行了算法仿真测试，还在真实机器人平台上进行了系统集成与性能对比实验。通过与传统人工操作在多场景、多指标下的定量对比，客观、有力地证明了所提框架的优越性和实用潜力。
六、 其他有价值内容
研究团队在论文中详细公开了算法的伪代码、网络结构图、机器人模型参数以及实验设置细节，具有很好的可复现性。同时，他们也指出了未来工作的方向，包括进一步优化算法的实时性和鲁棒性，以应对更加复杂和动态的环境。这显示了该研究领域的持续发展空间。此外，文中引用了大量相关文献，并对现有方法进行了清晰的梳理和对比，为读者了解该领域的研究现状提供了很好的参考。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问