多自主水下航行器协同声光融合跟踪高机动水下目标研究
一、 研究团队与发表信息 本文的研究由上海交通大学自动化与智能感知学院、水下技术科学教育部重点实验室及上海市网络化控制与实时信息处理重点实验室的杨洋(学生会员)、李奕辰(会员)、于文斌(会员)和关新平(Fellow)合作完成。研究论文《Underwater Target Tracking Based on Acoustic-Optical Fusion for Multi-AUV Systems》发表于IEEE的期刊《IEEE Transactions on Network Science and Engineering》,具体卷期为第13卷,2026年。论文于2025年9月30日收稿,历经修改后于2026年2月18日被接受,并于2026年2月24日在线发表。
二、 研究背景与目标 本研究属于水下机器人(Autonomous Underwater Vehicle, AUV)协同感知与目标跟踪领域。其核心科学问题是:在动态、复杂的水下环境中,如何实现对高速、高机动性非合作目标的连续、稳定、高精度跟踪。
研究动机源于现有水下目标跟踪技术面临的瓶颈。声学测量(如水声测距)因其在水介质中传播距离远的优势而被广泛使用,但其存在更新频率低(通常0.5-2 Hz)、信息延迟显著的固有缺陷。这导致在跟踪高速机动目标时,基于纯声学的跟踪方法存在严重的“时间滞后效应”,跟踪精度和实时性难以满足近距离、高动态任务(如自主跟随仿生机器鱼、监测晃动的电缆、实时避障等)的需求。另一方面,光学观测(如摄像头)虽然作用距离短(通常在5-20米),但能提供高达40-50 Hz的更新频率和丰富的细节信息,恰好可以弥补声学测量的低频率缺陷。然而,单目光学观测缺乏深度信息。因此,将声学与光学信息进行融合,发挥二者优势互补的潜力,成为提升水下目标跟踪性能的关键路径。
尽管已有研究探索声光融合,但多数集中在图像融合层面(如图像增强、检测识别),未能从机理层面有效解决因两种传感器在更新频率、量程和观测特性上的本质差异所带来的时空失配和可靠性问题。特别是在多AUV协同的短距离、高动态场景下,亟需一种能够充分利用声学测距的鲁棒性和光学测向的高频特性的融合框架。
基于此,本研究旨在提出一种面向多AUV系统的声光融合目标跟踪(Acoustic-Optical Fusion Target Tracking, AOFTT)框架。其主要目标是:利用光学观测的高频更新优势,缓解传统单一/低频声学跟踪对高机动目标产生的时间滞后影响,通过多AUV协同融合声学距离与光学方位信息,实现高精度、高实时性的水下目标跟踪。
三、 研究流程与详细方法 本研究采用理论建模、算法设计与仿真/实验验证相结合的研究流程。研究的主体对象是一个由多个(至少三个)AUV组成的协同跟踪系统,每个AUV均配备声学测距模块和单目光学相机。目标为具有高机动特性的非合作水下物体。
研究的主要流程分为以下几个核心部分:
问题建模与系统模型构建: 研究首先建立了多AUV协同跟踪场景的数学模型。将目标与每个AUV的三维位置、速度建模为状态向量,并采用近似的恒定速度线性动态模型进行描述。观测模型则定义了声学测距方程和光学方位测量方程。声学测距值被视为包含高斯噪声的距离量测,而光学信息则通过相机成像模型转换为目标相对于AUV的方位角,进而表示为三维单位向量。该模型明确了声学提供距离、光学提供方位的互补关系,为后续融合算法设计奠定了基础。
声光融合跟踪框架设计: 本研究提出了核心的AOFTT框架,该框架设计的关键在于区分处理声学与光学信息的不同更新频率。框架包含两个核心部分,其工作流程与时序对应关系如图2和图3所示。
关键算法开发与详述: A. 高频光学估计中的BCPLKF算法: 该算法是“高频光学估计”环节的核心。首先,为解决光学方位测量中的乘性噪声,研究将带噪声的方位向量投影到其正交平面上,将几何约束转化为一个等效的、具有加性噪声的线性测量模型,从而可以使用伪线性卡尔曼滤波进行状态估计。然而,这种线性化处理会引入估计偏差。研究深入分析了偏差的来源,推导出偏差项的近似表达式,并在此基础上设计了偏置补偿策略,形成了最终的BCPLKF。该算法在每一步滤波更新后,对状态估计值进行偏置补偿,从而显著提高了仅使用光学和滞后距离信息进行跟踪的准确性。 B. 基于帧间变化的光学距离近似方法: 为了在声学信息更新间隙获得更准确的距离信息以辅助BCPLKF,本研究提出了一种创新的距离近似方法。该方法不依赖目标的三维精确模型,而是利用目标在连续图像帧中感兴趣区域的变化。通过分析目标在图像平面上投影区域的尺度、长宽比变化,并结合历史距离信息,推导出当前帧目标与AUV之间相对距离的近似公式。这种方法有效降低了因直接使用过时声学距离而产生的累积误差。 C. 声光融合中的ITLS算法: 该算法是“声光融合”环节的核心。当多个AUV同时提供声学距离和光学方位时,理想情况下多条方位射线应与以各AUV为中心、距离为半径的球面相交于目标点。但由于测量噪声,它们并不严格相交。ITLS算法的思路是:首先,基于光学方位信息,构建一个最小化目标估计点到所有方位射线距离之和的优化问题(交会原理),导出一组线性方程。其次,基于声学距离信息,利用球面相交原理(三边测量),通过两两作差消除二次项,得到另一组线性方程。最后,将这两组方程整合成一个超定线性系统,通过最小二乘法求解出目标位置的最优估计。这种方法将两种异构信息统一在一个数学框架下进行优化,充分利用了几何约束。
仿真与实验验证流程: 研究通过大量仿真和初步实验对所提框架和算法进行验证。
四、 主要研究结果 1. BCPLKF算法性能: 仿真结果表明,在不同目标运动模型下,BCPLKF的跟踪RMSE均显著低于传统的PLKF和MGPLKF。特别是在模拟目标进行随机、剧烈机动的场景下,BCPLKF表现出了更好的稳定性和准确性,有效抑制了误差积累,验证了所提偏置补偿策略的必要性和有效性。 2. 光学距离近似方法性能: Gazebo仿真和水下实验结果表明,与仅依赖低频率更新的历史声学距离相比,利用连续帧间光学信息进行实时距离近似的方法,能够将距离估计误差显著降低。在模拟距离变化为4-8米的场景中,估计误差可控制在0.5米以内。将此近似距离用于跟踪,可以有效减少因距离信息滞后导致的位置估计累积误差。 3. ITLS融合算法性能: 多AUV协同跟踪仿真显示,ITLS算法的跟踪精度明显优于仅使用单一信息源(纯方位或纯距离)的方法,也优于简单的加权平均法和仅基于距离的分布式EKF。这证明了将声学距离与光学方位在几何约束层面进行最小二乘融合的有效性。 4. AOFTT整体框架性能: 集成BCPLKF和ITLS的完整AOFTT框架在长时间跟踪仿真中表现出色。结果显示,在声学信息更新间隔内,通过“高频光学估计”部分,目标位置误差增长缓慢;而在声光信息同步的时刻,通过“声光融合”部分,误差被及时纠正并收敛到更低水平。整个跟踪过程的RMSE远低于仅使用声学跟踪的方法,成功实现了利用高频光学信息缓解声学延迟的目标。 5. 可扩展性与鲁棒性结果: 仿真分析表明,增加协同AUV的数量能够持续提升ITLS的跟踪精度,因为更多的测量提供了更强的几何约束。此外,在不同的声学测距和光学测角噪声水平组合下,ITLS均能保持相对最优且稳定的性能,表明算法对测量噪声具有一定的鲁棒性。
五、 研究结论与价值 本研究得出结论:所提出的声光融合目标跟踪框架及其配套算法,能够有效解决因声学测量低更新频率导致的对高机动目标跟踪存在时间滞后的问题。通过“高频光学估计”与“声光融合”两部分的分工协作,AOFTT框架充分发挥了声学测距的鲁棒性和光学测向的高频优势。BCPLKF算法通过偏置补偿提升了纯光学辅助跟踪的精度,ITLS算法通过最优融合提升了多AUV协同定位的精度。两者结合,实现了在动态水下环境中对高机动目标连续、稳定、高精度的跟踪。
本研究的科学价值在于:从机理层面而非简单的图像层面,提出了一套系统性的声光异构信息融合理论和方法,为解决水下目标跟踪中的“高频需求与低频供给”矛盾提供了新的思路和可行的技术方案。其应用价值显著,可直接应用于需要近距离、高实时性跟踪的水下任务,如对海洋生物的精细观测、对水下设施的动态监测、多AUV协同作业中的目标跟踪与导引等,提升水下无人系统的自主感知与作业能力。
六、 研究亮点 1. 创新的融合框架设计: 提出的AOFTT框架创造性地根据声、光传感器的不同更新频率,设计了“高频光学估计”与“周期性声光融合”交替进行的工作模式,在系统层面实现了对信息延迟的主动补偿。 2. 针对性的算法创新: 针对光学乘性噪声问题,提出了带有理论推导偏置补偿的BCPLKF算法;针对单目视觉缺深度问题,提出了基于图像序列帧间变化的距离近似方法;针对多源异构信息融合,提出了结合几何交会与三边测量原理的ITLS算法。这些算法紧密围绕核心问题,形成了完整的解决方案链。 3. 面向实际需求的场景设定: 研究明确聚焦于“短距离、高动态”这一具有强烈实际应用背景且技术挑战性高的场景,使得研究成果具有明确的针对性和实用潜力。 4. 详尽严谨的验证: 研究通过多运动模型仿真、半物理仿真以及真实水下初步实验,多层次、多角度地验证了所提方法和框架的有效性、优越性和鲁棒性,论证充分。
七、 其他有价值内容 论文在引言和第二章“相关工作”中,对水下目标跟踪领域进行了非常全面和深入的综述。不仅梳理了声学基础跟踪、多源融合策略的演进,还特别对声光融合技术进行了细致的分类总结(图像级、机制级、特征级、任务级),并指出了现有研究大多未充分考虑声光更新频率差异这一关键局限。这部分内容为读者提供了清晰的学术背景和本研究定位,本身具有很高的参考价值。此外,论文还提及了与通信层优化(如基于信息价值的调度)研究的区别,明确了本工作在感知与估计层面的专注点。