基于轨迹预测的自主水下航行器动态目标跟踪控制

分享自：
基于轨迹预测的自主水下航行器动态目标跟踪控制

船舶与海洋工程
自动化
期刊:IEEE Transactions on CyberneticsDOI:10.1109/TCYB.2022.3189688
【点击此处】阅读全文、收藏及针对性提问
基于轨迹预测的自洽水下航行器动态目标跟踪控制方法研究作者、机构与发表信息本文的主要作者是曹翔、任璐与孙长银。曹翔来自安徽大学人工智能学院，同时也在东南大学自动化学院从事研究工作；任璐隶属于安徽大学人工智能学院；孙长银（IEEE高级会员）则任职于东南大学自动化学院。该项研究成果于2023年3月，以《Dynamic Target Tracking Control of Autonomous Underwater Vehicle Based on Trajectory Prediction》为题，发表于 IEEE Transactions on Cybernetics (第53卷，第3期)。
学术背景与研究动机本研究隶属于海洋机器人学、自主系统与智能控制交叉领域，核心目标是解决自主水下航行器（AUV, Autonomous Underwater Vehicle）在水下环境中对动态目标进行稳定、可靠跟踪的控制难题。
研究背景：水下动态目标跟踪技术在海洋资源勘探、水下工程作业、海军战场监视和水下精确制导等方面具有广泛应用前景。然而，AUV的动力学模型具有非线性、强耦合特性，且极易受到海洋环境中未知扰动的影响，使得其控制异常复杂。传统的跟踪控制方案存在诸多局限：基于精确模型的控制方法（如比例积分微分（PID, Proportion Integration Differentiation）控制、反步法）因难以获得准确的水动力参数而应用受限；滑模控制（Sliding-mode Control）虽具有鲁棒性但存在固有的抖振问题；自适应控制（Adaptive Control）结构复杂，缺乏统一设计方法；而基于神经网络的被动跟踪方法，在目标机动性优于AUV时容易导致跟踪任务失败。
研究目标：为克服现有方法的不足，本文研究并提出了一种融合目标检测、轨迹预测与先进控制器的AUV动态目标跟踪综合解决方案。其核心思想在于变被动跟踪为主动预测，通过预测目标的未来运动轨迹，引导AUV提前机动，从而克服自身动力学性能的限制，提高跟踪的成功率与精度。
详细工作流程本研究构建了一个完整的技术闭环，主要包含三个核心步骤：基于深度学习的前视声纳目标检测、基于改进神经网络的动态目标轨迹预测，以及基于模型预测控制器（MPC, Model Predictive Controller）的跟踪控制。整体研究流程如图1所示。
第一步：基于深度学习的动态目标检测
研究对象与数据准备：研究使用安装在AUV头部的多波束前视声纳采集实时水下环境图像。从采集的多个声纳序列中选取了800张声纳图像构建数据集。其中，600张用于训练，200张用于测试。使用Labellmg工具对图像中的目标（例如另一个AUV）进行边界框标注。
数据预处理：由于声纳图像易受海底或海面反射的脉冲噪声干扰，研究首先采用中值滤波（Median Filtering）对图像进行预处理。使用OpenCV库中的5×5滤波器，在滤除脉冲噪声的同时，有效保留了目标区域的边缘信息，为后续检测奠定了基础。
目标检测算法：研究采用YOLO v3（You Only Look Once version 3）这一基于回归的深度学习目标检测算法。该算法将检测问题视为回归问题，通过单个神经网络直接从输入图像预测目标的边界框位置和类别。 网络结构：YOLO v3主要由特征提取网络和检测网络构成。 特征提取网络：采用 Darknet-53 深度残差网络。它包含53个卷积层，通过连续的下采样（卷积步长为2）得到不同尺度的特征图（13×13， 26×26， 52×52）。
检测网络：采用特征金字塔网络（FPN, Feature Pyramid Network） 结构进行多尺度检测。深层特征图通过上采样与浅层特征图融合，从而结合了深层的强语义信息和浅层的精确定位信息，实现对不同尺寸目标的良好检测。
性能评估：算法通过计算平均精度均值（mAP, mean Average Precision）和单帧处理时间来评估性能。如表III所示，在多个交并比（IoU, Intersection over Union）阈值下，算法均能取得较高的mAP值，且平均每帧处理时间较短，满足实时性要求。图8的检测结果直观展示了算法能有效识别声纳图像中的AUV目标，分割效果好，无明显误判或漏判。
第二步：基于时间收益Elman神经网络的动态轨迹预测
目标位置获取：在通过声纳图像检测到目标后，需要将其像素位置转换为AUV本体坐标系下的实际位置。研究建立了声纳模型（图5），通过目标在声纳波束内的距离r和角度θ，结合AUV自身的位置(x, y)，利用公式 xd = x + r cos θ, yd = y + r sin θ 计算出目标在惯性坐标系下的位置 (xd, yd)。
预测模型构建与改进：为实现主动跟踪，研究构建了一个时间收益Elman神经网络（TPENN, Time Profit Elman Neural Network） 用于预测目标的未来轨迹。 模型选择与改进：Elman神经网络是一种具有内部反馈结构的动态递归神经网络，对历史数据敏感，适合处理时间序列问题。本文的创新在于，将时间收益因子（Time Profit Factor） ftp(t) 引入到Elman网络的目标函数中（公式8, 9）。该因子能够增强近期样本数据对预测结果的影响，削弱远期数据的影响，从而更好地反映目标运动的时变特性。
样本数据构造：不同于传统方法将三维坐标(x, y, z)作为一个整体输入，本研究认为坐标的变化与航向角、俯仰角直接相关。因此，采用独立预测各坐标轴位置并结合对应角度信息的策略。例如，预测x坐标时，输入数据为前n个时刻的x坐标与航向角数据对 (xi, ai)，输出为下一个时刻的x坐标预测值xd（公式11）。通过滑动窗口方式生成大量训练和测试样本（公式12, 13）。
模型训练与应用流程：TPENN模型流程如图7所示。确定网络结构（输入层、隐藏层、承接层、输出层）后，使用带时间回溯的随时间反向传播算法（BPTT, Backpropagation Through Time） 对网络进行训练（公式10）。训练完成后，模型可在线接收实时获取的目标历史轨迹数据，并预测其未来位置。
第三步：基于模型预测控制器的动态目标跟踪
控制问题建模：研究将AUV跟踪动态目标的问题转化为一个模型预测控制问题。首先，基于AUV的运动学模型（公式1）和跟踪误差模型（公式2），推导出离散化的状态空间方程（公式14）。通过引入控制增量作为新的状态量，构建了适用于MPC设计的预测模型（公式16, 17）。
优化问题构建：在每个控制周期，MPC需要求解一个有限时域内的优化问题，以得到最优的控制序列。本文构建的优化目标函数J(t)（公式19）包含两项：第一项衡量AUV对预测轨迹（而非目标当前位置）的跟踪能力；第二项则是对控制增量平滑性的约束，旨在避免控制指令的剧烈变化，提高跟踪稳定性。Q和R为权重矩阵，用于权衡跟踪精度与控制平顺性。
约束处理与求解：考虑到AUV推进系统的物理限制，优化问题加入了控制量v和控制增量v的约束条件（公式20, 21）。最终，控制问题被转化为一个带有线性约束的典型二次规划（QP, Quadratic Programming）问题（公式23）。在每一个采样时刻，求解该QP问题，得到未来控制时域内的一系列最优控制增量，并仅将第一个控制增量作用于AUV系统。此过程在每个控制周期重复进行，实现滚动优化。
主要实验结果与分析研究通过仿真和实验，在二维和三维环境中全面验证了所提方法的有效性、鲁棒性和优越性。
1. 轨迹预测性能验证： * 使用1500组目标AUV的连续导航数据（包含三维坐标、航向角和俯仰角）进行测试。其中900组用于训练，600组用于测试。 * 将提出的TPENN与普通Elman神经网络进行对比。如图9和图10所示，TPENN的预测相对误差普遍小于1%，且收敛速度更快、预测精度更高。这证明了时间收益因子能有效提升网络对近期运动趋势的学习能力，从而提高预测准确性。此外，采用“坐标-角度”独立预测的策略也比传统三维坐标整体预测方法效果更优。
2. 动态目标跟踪仿真验证： * 二维与三维环境跟踪：图11（2D）和图12（3D）的仿真结果表明，基于MPC的控制器能够有效跟踪动态目标的预测轨迹。跟踪误差在x, y, z各方向上均小于0.3米，表现出高控制精度和稳定性。 * 鲁棒性分析：为验证控制器对模型不确定性的鲁棒性，研究在系统动力学矩阵中分别引入了-30%、-20%和+10%的误差。如图13所示，即使在参数存在误差的情况下，所提算法仍能快速、稳定地跟踪预测轨迹，各坐标轴跟踪误差均很小，表现出极强的鲁棒性。 * 性能对比分析： * 与反步法（Backstepping）对比：图14（所提方法）与图15（反步法）的对比清晰显示，MPC方法的跟踪轨迹与预测轨迹重合度极高，误差显著小于反步法。反步法的跟踪轨迹虽与预测轨迹形状相似，但存在持续的、较大的跟踪误差。表IV和表V进一步显示，无论跟踪螺旋曲线还是折线轨迹，无论反步法的增益如何调整，所提MPC算法在跟踪性能上均更优。 * 与滑模控制（SMC）对比：研究还将MPC与滑模控制级联，构成如图16所示的MPC-SMC级联控制系统。表VI的对比结果显示，在跟踪十种不同3D目标轨迹的测试中，MPC-SMC级联系统的平均位置误差更小，进入稳定跟踪状态所需的时间更短。分析认为，这得益于两点：一是引入了轨迹预测，使AUV能同步预动；二是MPC中加入了速度变化约束，限制了控制量的剧烈变化，提升了稳定性，而传统滑模控制未考虑此约束。
研究结论与价值本研究成功提出并验证了一套完整的AUV水下动态目标跟踪控制方法。结论表明： 1. 方法有效性：基于YOLO v3的深度学习目标检测算法对水下动态目标具有高识别精度；提出的TPENN轨迹预测方法相比普通Elman网络，收敛更快、预测更准；基于MPC的跟踪控制器通过引入轨迹预测和速度约束，实现了稳定、精确且鲁棒的跟踪控制。 2. 科学价值：该研究将计算机视觉（目标检测）、机器学习（轨迹预测）与现代控制理论（模型预测控制）深度融合，为解决复杂非线性系统在不确定环境下的跟踪问题提供了一个创新的技术框架。它展示了“感知-预测-决策-控制”一体化智能系统设计的可行性与优越性。 3. 应用价值：所提出的方法显著提升了AUV在真实海洋环境中执行动态目标跟踪、监视、协同等任务的能力，具有直接应用于海洋资源开发、水下安防、军事侦察等领域的潜力。
研究亮点主动性跟踪策略：核心创新在于引入了轨迹预测环节，将传统的“跟随式”被动跟踪转变为“预测-拦截式”的主动跟踪，从根本上解决了AUV动力学性能可能劣于目标而导致的跟踪失败问题。
改进的预测模型：提出了时间收益Elman神经网络（TPENN），通过改进目标函数，使预测模型更能聚焦于目标近期的运动趋势，从而提高了轨迹预测的时效性和准确性。
级联优化控制架构：采用了模型预测控制（MPC）与滑模控制（SMC）级联的双闭环控制结构。外层MPC负责基于预测轨迹生成优化的参考指令，并施加物理约束；内层SMC负责强鲁棒地跟踪该指令。这种架构兼顾了优化性能与鲁棒性。
针对性的数据处理策略：在轨迹预测中，采用了结合角度信息独立预测各坐标轴的数据处理方法，比传统的整体坐标预测更符合运动学原理，取得了更好的效果。
未来展望尽管本研究取得了良好效果，但作者也指出了未来的研究方向：当前研究未考虑海洋流等动态复杂环境干扰，这可能会影响目标检测精度和控制器性能。未来计划使用性能更优的YOLO v5进行目标检测；完善AUV的避障规则与算法，增强其在突发情况下的应急处理能力；并进一步改进MPC的优化算法，以追求更精确的跟踪效果。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问