本文的主要作者是曹翔、任璐与孙长银。曹翔来自安徽大学人工智能学院,同时也在东南大学自动化学院从事研究工作;任璐隶属于安徽大学人工智能学院;孙长银(IEEE高级会员)则任职于东南大学自动化学院。该项研究成果于2023年3月,以《Dynamic Target Tracking Control of Autonomous Underwater Vehicle Based on Trajectory Prediction》为题,发表于 IEEE Transactions on Cybernetics (第53卷,第3期)。
本研究隶属于海洋机器人学、自主系统与智能控制交叉领域,核心目标是解决自主水下航行器(AUV, Autonomous Underwater Vehicle)在水下环境中对动态目标进行稳定、可靠跟踪的控制难题。
研究背景:水下动态目标跟踪技术在海洋资源勘探、水下工程作业、海军战场监视和水下精确制导等方面具有广泛应用前景。然而,AUV的动力学模型具有非线性、强耦合特性,且极易受到海洋环境中未知扰动的影响,使得其控制异常复杂。传统的跟踪控制方案存在诸多局限:基于精确模型的控制方法(如比例积分微分(PID, Proportion Integration Differentiation)控制、反步法)因难以获得准确的水动力参数而应用受限;滑模控制(Sliding-mode Control)虽具有鲁棒性但存在固有的抖振问题;自适应控制(Adaptive Control)结构复杂,缺乏统一设计方法;而基于神经网络的被动跟踪方法,在目标机动性优于AUV时容易导致跟踪任务失败。
研究目标:为克服现有方法的不足,本文研究并提出了一种融合目标检测、轨迹预测与先进控制器的AUV动态目标跟踪综合解决方案。其核心思想在于变被动跟踪为主动预测,通过预测目标的未来运动轨迹,引导AUV提前机动,从而克服自身动力学性能的限制,提高跟踪的成功率与精度。
本研究构建了一个完整的技术闭环,主要包含三个核心步骤:基于深度学习的前视声纳目标检测、基于改进神经网络的动态目标轨迹预测,以及基于模型预测控制器(MPC, Model Predictive Controller)的跟踪控制。整体研究流程如图1所示。
第一步:基于深度学习的动态目标检测
第二步:基于时间收益Elman神经网络的动态轨迹预测
r和角度θ,结合AUV自身的位置(x, y),利用公式 xd = x + r cos θ, yd = y + r sin θ 计算出目标在惯性坐标系下的位置 (xd, yd)。ftp(t) 引入到Elman网络的目标函数中(公式8, 9)。该因子能够增强近期样本数据对预测结果的影响,削弱远期数据的影响,从而更好地反映目标运动的时变特性。(x, y, z)作为一个整体输入,本研究认为坐标的变化与航向角、俯仰角直接相关。因此,采用独立预测各坐标轴位置并结合对应角度信息的策略。例如,预测x坐标时,输入数据为前n个时刻的x坐标与航向角数据对 (xi, ai),输出为下一个时刻的x坐标预测值xd(公式11)。通过滑动窗口方式生成大量训练和测试样本(公式12, 13)。第三步:基于模型预测控制器的动态目标跟踪
J(t)(公式19)包含两项:第一项衡量AUV对预测轨迹(而非目标当前位置)的跟踪能力;第二项则是对控制增量平滑性的约束,旨在避免控制指令的剧烈变化,提高跟踪稳定性。Q和R为权重矩阵,用于权衡跟踪精度与控制平顺性。v和控制增量v的约束条件(公式20, 21)。最终,控制问题被转化为一个带有线性约束的典型二次规划(QP, Quadratic Programming)问题(公式23)。在每一个采样时刻,求解该QP问题,得到未来控制时域内的一系列最优控制增量,并仅将第一个控制增量作用于AUV系统。此过程在每个控制周期重复进行,实现滚动优化。研究通过仿真和实验,在二维和三维环境中全面验证了所提方法的有效性、鲁棒性和优越性。
1. 轨迹预测性能验证: * 使用1500组目标AUV的连续导航数据(包含三维坐标、航向角和俯仰角)进行测试。其中900组用于训练,600组用于测试。 * 将提出的TPENN与普通Elman神经网络进行对比。如图9和图10所示,TPENN的预测相对误差普遍小于1%,且收敛速度更快、预测精度更高。这证明了时间收益因子能有效提升网络对近期运动趋势的学习能力,从而提高预测准确性。此外,采用“坐标-角度”独立预测的策略也比传统三维坐标整体预测方法效果更优。
2. 动态目标跟踪仿真验证: * 二维与三维环境跟踪:图11(2D)和图12(3D)的仿真结果表明,基于MPC的控制器能够有效跟踪动态目标的预测轨迹。跟踪误差在x, y, z各方向上均小于0.3米,表现出高控制精度和稳定性。 * 鲁棒性分析:为验证控制器对模型不确定性的鲁棒性,研究在系统动力学矩阵中分别引入了-30%、-20%和+10%的误差。如图13所示,即使在参数存在误差的情况下,所提算法仍能快速、稳定地跟踪预测轨迹,各坐标轴跟踪误差均很小,表现出极强的鲁棒性。 * 性能对比分析: * 与反步法(Backstepping)对比:图14(所提方法)与图15(反步法)的对比清晰显示,MPC方法的跟踪轨迹与预测轨迹重合度极高,误差显著小于反步法。反步法的跟踪轨迹虽与预测轨迹形状相似,但存在持续的、较大的跟踪误差。表IV和表V进一步显示,无论跟踪螺旋曲线还是折线轨迹,无论反步法的增益如何调整,所提MPC算法在跟踪性能上均更优。 * 与滑模控制(SMC)对比:研究还将MPC与滑模控制级联,构成如图16所示的MPC-SMC级联控制系统。表VI的对比结果显示,在跟踪十种不同3D目标轨迹的测试中,MPC-SMC级联系统的平均位置误差更小,进入稳定跟踪状态所需的时间更短。分析认为,这得益于两点:一是引入了轨迹预测,使AUV能同步预动;二是MPC中加入了速度变化约束,限制了控制量的剧烈变化,提升了稳定性,而传统滑模控制未考虑此约束。
本研究成功提出并验证了一套完整的AUV水下动态目标跟踪控制方法。结论表明: 1. 方法有效性:基于YOLO v3的深度学习目标检测算法对水下动态目标具有高识别精度;提出的TPENN轨迹预测方法相比普通Elman网络,收敛更快、预测更准;基于MPC的跟踪控制器通过引入轨迹预测和速度约束,实现了稳定、精确且鲁棒的跟踪控制。 2. 科学价值:该研究将计算机视觉(目标检测)、机器学习(轨迹预测)与现代控制理论(模型预测控制)深度融合,为解决复杂非线性系统在不确定环境下的跟踪问题提供了一个创新的技术框架。它展示了“感知-预测-决策-控制”一体化智能系统设计的可行性与优越性。 3. 应用价值:所提出的方法显著提升了AUV在真实海洋环境中执行动态目标跟踪、监视、协同等任务的能力,具有直接应用于海洋资源开发、水下安防、军事侦察等领域的潜力。
尽管本研究取得了良好效果,但作者也指出了未来的研究方向:当前研究未考虑海洋流等动态复杂环境干扰,这可能会影响目标检测精度和控制器性能。未来计划使用性能更优的YOLO v5进行目标检测;完善AUV的避障规则与算法,增强其在突发情况下的应急处理能力;并进一步改进MPC的优化算法,以追求更精确的跟踪效果。