《collaborative visual slam for multiple agents: a brief survey》(多代理协作视觉SLAM:简要综述)是一篇综述性学术文章,此类文章的目的是对某一领域的重要技术与研究进展进行总结与分析。文章由Danping Zou(来自上海交通大学导航与基于位置的服务上海重点实验室,以及上海智能感知与识别实验室)、Ping Tan(来自加拿大Simon Fraser University计算科学学院)和Wenxian Yu(同为上海交通大学)撰写,发表于《virtual reality & intelligent hardware》期刊2019年第1卷第5期,文章编号为461-482。本文旨在对双目视觉同步定位与地图构建(Simultaneous Localization and Mapping, SLAM)在多移动代理协作中的应用现状进行综述和分类,探讨多代理协作SLAM系统的关键组件以及研究热点,重点强调基于视频摄像头的多代理方法。
SLAM是机器人学、计算机视觉、增强现实等领域的核心技术之一。在传统SLAM研究中,通常通过摄像头实现单-agent视觉SLAM,该技术可以估测摄像头的自我运动轨迹(ego motion)并同时重建环境的3D地图。这对于标记无关增强现实、机器人自主导航等具有重要意义。然而,单-agent SLAM存在的限制在于它仅关注单个设备或机器人,而忽略了多个设备间的信息协作。
文章分析了单-agent SLAM中的技术框架及其当前应用基础,包括特征点提取、几何计算、全局优化等技术。同样,摄像头作为SLAM体系中的主要传感器,相较于LiDAR等其他类型传感器具有轻量化、低成本和信息丰富等优势。然而,在多代理场景下(如无人机集群、多用户AR/VR系统),多设备之间的协作需求显而易见。多代理SLAM不仅要求设备能够单独完成位姿估计与3D建图,更需要不同设备间共享信息以提升效率、鲁棒性和精确性。
出于这些需求,文章的目标是对过去十年间多代理SLAM的研究成果进行总结,提出其分类系统,总结关键组件及系统趋势,并重点探讨去中心化框架的兴起。
本文围绕【协作视觉SLAM的现状】、【现有关键技术】、【去中心化(decentralized architecture)挑战】、【研究意义】展开,共分为多个主要观点:
文章对SLAM技术的演化进行了简要回顾,从20世纪80年代SLAM在机器人社区的起步,到21世纪初视觉SLAM逐步崛起的背景。早期SLAM系统主要依赖LiDAR等传感器,而视觉SLAM之所以在近期更加受到关注,是由于计算机设备运算能力提升,计算机视觉中“运动中的结构”(Structure-from-Motion, SFM)方法成熟,摄像头成本低、重量轻且信息丰富。
文章指出,多代理SLAM(collaborative visual SLAM)的需求不断上升,各种应用场景促使其技术化逐步升温。例如在机器人领域,无人机无人移动群体需要协作SLAM进行状态估计、避撞及轨迹规划;在多用户增强/虚拟现实领域(AR/VR)中,设备间必须保持相同坐标系以实现虚拟内容无缝交付。
尽管视觉SLAM在单平台已经取得较高的技术成熟度,将其扩展到多平台则面临更多复杂性,包括信息交互、资源协调、全局优化等问题。
文章对多代理协作视觉SLAM方法进行了分类,大致分为两种架构:集中化(centralized architecture)与去中心化(decentralized architecture)。
在集中化架构中,前端处理模块一般部署于各代理设备,负责存储并传输局部地图以及位姿估计等数据;而后端部分则通过一个强处理能力的中央服务器完成,例如全局地图生成、信息优化与融合。相比之下,去中心化在典型方案上实际更具挑战性,因其需要分布计算算法分散至多个设备,同时减少通信负载。
文章以多年的案例档案阐述了两种架构的代表性方法,并区分其在硬件、数据处理能力及算法复杂度上的适用性。
比如文中表1列出了包括PTAMM、CCM-SLAM、C2TAM等若干视觉SLAM框架,以及它们对相机位姿估测、图优化等子任务所配置优化方案。
这是确保实时估算各设备6自由度(6 Degrees Of Freedom, 6DOF)位姿所需的核心功能。文章介绍了基于滤波器(Filter-based)和基于关键帧(Key-frame-based)的两种技术方法。前者如EKF滤波器有较低实时复杂度,但精度易受状态变量规模约束;后者涉及捆绑调整(Bundle Adjustment)解决全局优化问题。
多代理视觉SLAM中的建图任务可被进一步划分: - Intra-camera Mapping: 每个代理摄像头独立处理的局部地图; - Inter-camera Mapping: 不同摄像头协作生成的全局地图。重点在于跨设备对特征点匹配与联接。
文章分别探讨了单设备回环检测与多设备间跨设备回环检测,通过检测匹配帧间位置相似性降低累积漂移误差。特别在多地图合并过程中的冲突管理,提出了一种基于“几何一致性”检查的过滤处理。
特征点检测与匹配是SLAM系统见效快的重要前沿技术工具。文章对以FAST角点、ORB、KLT光流法所代表的热点系统能力对比解析,如光流适用短时间序列,而复杂场景要求子比对器解决全局匹配。
另本文对动态环境中“伪动态”或真正异常值检测重点讨论多通道差范围点,使动态帧对分配仍在其中保存数据。
虽然去中心化结构可最大限度发挥每个代理的计算资源,多数据同步、通信带宽限制作支配因素仍属于解决特征对算效率性能问题关键点。相关文章将某些点囊括入边缘智能(eg.传感融合,全局较验最大P-groups)。
文中指出分布式视觉SLAM研究问题,包括机器人迁移场景、分工可靠性等交叉层系统体优化设计难点。
为总结进一步提出价值,文章澄明多代理视觉SLAM沿革新动潜仍大担当与现实背景相关,尤其结合机器人自主无人飞行任务与整合工业环境IP-无人力量构图创新逻辑如传染增强/全局演算数化IRIR样多维纳抢占代表…