本文旨在向国内研究同行详细介绍一项发表于机器人学与智能系统领域顶级会议的高水平研究成果。该工作提出了一种名为LIO-SAM的紧耦合激光雷达惯性里程计与建图框架,代表了移动机器人高精度、实时状态估计与建图技术的重要进展。
本研究的主要作者包括Tixiao Shan、Brendan Englot、Drew Meyers、Wei Wang、Carlo Ratti及Daniela Rus。作者团队主要来自两所知名研究机构:麻省理工学院(Massachusetts Institute of Technology, MIT)的城市研究与规划系、计算机科学与人工智能实验室,以及史蒂文斯理工学院(Stevens Institute of Technology)的机械工程系。
该研究成果以论文形式发表,论文标题为《LIO-SAM: Tightly-coupled Lidar Inertial Odometry via Smoothing and Mapping》。论文被收录于2020年IEEE/RSJ智能机器人与系统国际会议(2020 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS),会议于2020年10月25日至29日以虚拟形式在拉斯维加斯举行。IROS是机器人领域最具影响力的国际学术会议之一,在此发表标志着该工作获得了学界的广泛认可。
本研究属于机器人学中的同时定位与建图(Simultaneous Localization and Mapping, SLAM)领域,具体聚焦于利用激光雷达(LiDAR)和惯性测量单元(IMU)进行高精度状态估计与建图。状态估计、定位与建图是智能移动机器人实现反馈控制、避障、路径规划等高级功能的基础前提。
尽管基于视觉和激光雷达的SLAM研究已取得长足进步,但二者各有局限。视觉方法对光照、初始化和距离变化敏感,单独使用时在自主导航系统中可靠性不足。激光雷达则对光照变化不敏感,尤其随着Velodyne VLS-128、Ouster OS1-128等远距离、高分辨率3D激光雷达的出现,激光雷达能更直接地捕捉环境的精细三维细节,因此成为本研究的关注重点。
在众多激光雷达方法中,由Zhang和Singh提出的激光雷达里程计与建图(Lidar Odometry and Mapping, LOAM)方法因其低漂移和实时性能,成为被广泛使用的标杆。然而,LOAM存在明显局限:它依赖于全局体素地图进行扫描匹配,这使得回环检测和融入GPS等绝对测量值进行位姿校正变得困难;在特征丰富的环境中,随着体素地图变得稠密,其在线优化过程效率降低;作为本质上基于扫描匹配的方法,其在大规模测试中仍然存在漂移问题。
为此,本研究旨在解决LOAM的上述不足,提出一个全新的框架。具体研究目标包括:1)构建一个基于因子图(Factor Graph)的紧耦合激光雷达惯性里程计框架,实现多传感器融合与全局优化;2)设计一种高效的、基于局部滑动窗口的扫描匹配方法,通过选择性地将新关键帧与一组固定数量的先验“子关键帧”进行配准,确保实时性能;3)在多种不同规模、不同平台、不同环境中对所提框架进行广泛验证,证明其鲁棒性与优越性。
LIO-SAM框架的核心思想是将激光雷达-惯性里程计问题构建于一个因子图之上。因子图是一种用于概率推理的图模型,非常适合处理来自不同源的多种约束。该系统接收来自3D激光雷达、IMU和可选GPS的传感器数据,通过求解最大后验概率问题来估计机器人状态和轨迹。
1. 系统总体流程与因子图构建: 机器人状态x定义为位置、姿态、速度和IMU偏置。系统将不同传感器提供的约束转化为四种类型的因子,与代表机器人状态的节点一同构建因子图。这四种因子分别是:(a)IMU预积分因子:利用IMU原始测量值推断相对运动,并为点云去畸变和激光雷达里程计优化提供初始猜测;(b)激光雷达里程计因子:通过扫描匹配计算相邻关键帧之间的相对变换;(c)GPS因子:在可用时提供绝对位置测量,以消除长期累积的漂移;(d)回环闭合因子:当检测到机器人回到之前访问过的区域时,添加约束以校正累积误差。系统使用增量平滑与建图(iSAM2)算法对因子图进行高效优化。
2. 关键帧选择与局部地图构建(创新工作流程): 为了平衡计算负担和地图密度,LIO-SAM并未使用所有激光雷达帧,而是引入了关键帧选择机制。当机器人位姿变化超过用户定义的阈值(位置1米,旋转10度)时,当前激光雷达帧被选为关键帧,并关联一个新的状态节点加入因子图。这是本研究提升实时性能的关键设计之一。
生成激光雷达里程计因子时,LIO-SAM采用了一种新颖的局部滑动窗口方法,而非像LOAM那样匹配到全局地图。具体步骤如下: * 创建局部体素地图:维护一个包含最近N个(文中N=25)关键帧的滑动窗口,这些帧被称为“子关键帧”。将这些子关键帧根据其估计的位姿转换到世界坐标系下,并融合成一个局部体素地图Mi。该地图包含边缘特征子体素地图Me_i和平面特征子体素地图Mp_i。随后对地图进行下采样以去除重复特征(边缘特征分辨率0.2米,平面特征0.4米)。这一步骤显著减少了每次优化需要处理的数据量。 * 扫描匹配:对于新到来的激光雷达帧Fi+1,首先利用IMU提供的运动预测T̃i+1将其初步转换到世界坐标系,得到{‘Fe_i+1, ‘Fp_i+1}。然后,将该帧中的每个特征与局部体素地图Mi中对应的边缘线或平面块进行匹配。匹配过程借鉴了LOAM的方法,通过点到线、点到面的距离计算来构建优化问题。 * 求解相对变换:使用高斯-牛顿法最小化所有特征点到其对应几何元素的距离之和,求解出当前帧Fi+1相对于世界坐标系的最优位姿Ti+1。进而,可以计算出当前状态节点Xi+1与上一个节点Xi之间的相对变换ΔTi,i+1,这个变换就作为连接这两个位姿的激光雷达里程计因子加入因子图。
3. GPS与回环闭合因子的融入: GPS因子仅在估计的位置协方差大于接收到的GPS位置协方差时加入,避免了不必要的计算。回环闭合检测采用了一种基于欧氏距离的简单方法:当新状态节点加入时,在因子图中搜索与之空间距离接近(例如15米内)的历史状态节点,然后将当前帧与以该历史节点为中心的若干子关键帧(文中前后各12个)进行扫描匹配。若匹配成功,则计算得到的相对变换将作为回环闭合因子加入图优化,有效校正长期漂移,特别是在GPS高程测量不准确时,对校正高度漂移尤为重要。
4. 实验设计与评估方法: 为了全面验证LIO-SAM的性能,研究团队设计了详尽的实验方案,采集了5个不同数据集,覆盖了多种规模、平台和环境: * 平台:包括手持设备(用于旋转、行走、校园数据集)、Clearpath Jackal无人地面车辆(用于公园数据集)以及Duffy 21电动船(用于阿姆斯特丹数据集)。 * 环境:涵盖校园建筑区、植被覆盖的公园、城市运河等。 * 挑战:测试场景包括快速旋转、剧烈平移、特征稀疏(如运河)、特征丰富(如植被)、GPS信号断续、光照干扰(激光雷达受阳光直射)等。 * 对比方法:将LIO-SAM与两个主流方法进行对比:LOAM(要求实时运行)和LIO-Mapping(LIOM,允许无限时间处理所有数据)。评估指标包括轨迹精度(与GPS或起点对齐的误差)、地图视觉效果、以及运行时间(处理单帧扫描的平均耗时和最大实时播放倍数)。
实验结果表明,LIO-SAM在所有测试中均表现出色,在精度和效率上均优于或等同于对比方法。
1. 旋转与行走数据集(验证鲁棒性与精度): 在仅使用IMU和激光雷达因子的“旋转”测试中,机器人进行剧烈旋转(最大转速213.9°/s)。LOAM的地图出现模糊,而LIO-SAM生成的地图保留了环境更多的精细结构细节,证明了其在快速旋转下SO(3)空间中的精确配准能力。LIOM则因初始化敏感而失败。在“行走”测试中,LOAM在地图多处发生发散,LIOM的地图虽优于LOAM但仍存在模糊结构且仅能以0.56倍实时速度运行。LIO-SAM则产生了与谷歌地球图像高度一致的地图,且保持实时运行。
2. 校园与公园数据集(验证多传感器融合与回环闭合): 在“校园”数据集中,研究者对比了不同配置:LOAM漂移严重(终点误差192.43米);仅用里程计因子的LIO-odom在后期开始漂移;加入GPS因子的LIO-GPS能在GPS可用时校正,但在GPS缺失的后段无法闭合回环;完整的LIO-SAM通过回环闭合因子成功消除了漂移,实现了轨迹的完美闭合(终点误差仅0.12米)。在“公园”数据集中,类似趋势再次出现。LOAM、LIOM和LIO-odom均因缺乏绝对校正而漂移。LIO-GPS和LIO-SAM在水平面轨迹重合,但LIO-GPS由于GPS高程不准确而存在高度漂移,无法闭合回环;LIO-SAM则利用回环闭合解决了这一问题(终点误差0.04米)。在拥有完整GPS覆盖的公园数据集中,LIO-SAM相对于GPS的RMSE平移误差为0.96米,与LIO-GPS(1.09米)相当且精度很高。
3. 阿姆斯特丹数据集(验证极端挑战环境下的鲁棒性): 该数据集环境极具挑战性:运河上桥梁导致特征退化(类似长廊)、缺少地面平面特征、阳光导致激光雷达误检、GPS信号断续。在这种极端条件下,LOAM、LIOM和LIO-odom全部失败,未能产生有意义的结果。LIO-GPS再次因高度漂移无法闭合回环。而LIO-SAM是唯一能够成功完成整个长达3小时、轨迹超19公里的运河地图构建的方法,并成功闭合了回环(终点误差0.17米),充分证明了其框架的强大鲁棒性。
4. 运行效率结果: 实时性能是LIO-SAM的核心优势之一。如表IV所示,在所有数据集中,LIO-SAM处理单帧扫描的平均运行时间均显著低于LOAM和LIOM。例如,在行走数据集上,LIO-SAM耗时58.4毫秒,而LOAM为253.6毫秒,LIOM为339.8毫秒。更重要的是,通过压力测试,LIO-SAM能够处理高达实时速度13倍的数据流而不失效。研究还指出,LIO-SAM的运行时间主要受特征地图密度影响,而非因子图中节点和因子的数量,这得益于其局部滑动窗口设计。
本研究成功提出了LIO-SAM,一个基于因子图的紧耦合激光雷达惯性里程计与建图框架。该框架通过将多传感器约束集成于统一的因子图中,特别适合进行传感器融合。额外的传感器测量值可以轻松地以新因子的形式融入系统。提供绝对测量的传感器(如GPS、罗盘、高度计)可用于消除激光雷达惯性里程计在长时间运行或特征贫乏环境中累积的漂移。地点识别(回环闭合)也能便捷地融入系统。
其科学价值在于:提出并验证了一种将紧耦合激光雷达-惯性里程计与因子图优化、局部滑动窗口、选择性关键帧等先进概念深度融合的系统架构,为SLAM领域提供了一种新的高性能解决方案范式。
其应用价值极为突出:LIO-SAM在保持高精度的同时,实现了卓越的实时性能和鲁棒性。它能够处理剧烈运动、复杂环境、多变的传感器条件(如断续GPS),并且计算效率高,适合部署在计算资源有限的嵌入式系统或需要长时间自主运行的移动机器人平台上,如无人车、无人机、无人船等,为实际环境中的可靠导航与高精度建图提供了强大工具。
研究团队在论文中详细阐述了IMU预积分因子的数学推导、特征提取(边缘与平面)的具体方法、以及扫描匹配中点到线/面距离的计算公式,为研究者复现和理解算法提供了充分依据。此外,论文对LIOM等同期紧耦合方法进行了客观评述,并指出了其计算效率上的不足,为读者厘清了技术发展脉络。实验部分设计得非常系统,从不同维度(运动类型、传感器可用性、环境特征)验证系统性能,论证过程严谨、全面。