基于湖试数据的自主水下航行器运动预测可解释机器学习方法

分享自：
基于湖试数据的自主水下航行器运动预测可解释机器学习方法

期刊:journal of ocean engineering and scienceDOI:10.1016/j.joes.2025.11.002
基于湖试数据的自主水下航行器运动预测可解释机器学习方法研究报告
本研究发表于 *Journal of Ocean Engineering and Science*，第11卷（2026年），第180至190页。通讯作者为上海交通大学的曹仰宇（Caoyang Yu）。研究团队由来自上海交通大学、华中科技大学以及中国船舶研究设计中心等多家单位的科研人员共同组成，包括第一作者裴天琪（Tianqi Pei）等。
一、 学术背景与研究目的
本研究主要聚焦于海洋工程领域的海洋运载器（如船舶、自主水下航行器等）运动建模与预测领域。准确可靠的海洋运载器运动数学模型，对于分析其动态特性、开发避碰系统以及实现自主导航至关重要。传统的建模方法，如计算流体动力学（Computational Fluid Dynamics， CFD）仿真和拘束模型试验，通常存在计算复杂或耗时费力的缺点。而系统辨识（System Identification）作为一种高效、低成本的数据驱动方法，正变得越来越重要。
近年来，以深度学习为代表的人工智能算法，如支持向量机（Support Vector Machine, SVM）、长短期记忆网络（Long Short-Term Memory， LSTM）等，被广泛应用于非参数化的“黑箱”（black-box）建模。这些模型虽然预测精度高，但结构复杂、内部机理不透明，其决策过程难以理解和解释。这种“黑箱”特性在涉及安全关键（safety-critical）的应用中（如重大疾病诊断或航行轨迹预测）带来了潜在风险，因为无法验证模型预测的逻辑，可能导致严重后果。因此，在海洋工程等领域，“打开”黑箱模型，提升其可解释性（interpretability），对于模型在实际应用中的可信度、可靠性与可采纳性至关重要。
本研究旨在解决上述矛盾。研究者提出了一种新颖的、基于可解释机器学习的方法，用于自主水下航行器（Autonomous Underwater Vehicle， AUV）的运动预测。其核心目标并非仅仅追求更高的预测精度，而是要建立一个既保持高性能、又具备高可解释性的预测模型。为此，研究者采用了“代理模型”（Surrogate Model）的思想，用一个结构简单、表达透明的模型来解释一个复杂的深度神经网络模型，从而在“黑箱”与“白箱”之间架起桥梁。
二、 研究详细工作流程
本研究的工作流程设计严谨，环环相扣，主要包括以下三个核心步骤：
构建复杂的“黑箱”预测模型：研究者首先建立了一个复杂的多输入多输出长短期记忆网络（Multi-input Multi-output LSTM， MIMO-LSTM）作为基础预测模型。该模型被设计用于执行“一步预测”（one-step prediction）。其输入是t时刻AUV的四个状态变量：前向速度（surge speed, u(t)）、横荡速度（sway speed, v(t)）、偏航率（yaw rate, r(t)）和舵角（rudder angle, δ(t)）。模型的输出是t+1时刻的u、v、r三个速度变量。这个LSTM网络包含一个输入层、一个拥有128个隐藏单元的LSTM层、一个用于防止过拟合的dropout层（丢弃概率为0.1）以及一个全连接输出层。研究者使用来自名为“NGC4MR-XAUV3”的AUV在实际湖泊（致远湖）中进行的25°/25° Z形操舵（Zigzag maneuvering）实验数据来训练和测试这个模型。所有数据归一化处理，其中90%用作训练集。实验平台配备了高精度的姿态传感器和多普勒计程仪（Doppler Velocity Log）来采集数据。
训练可解释的“代理模型”：为了解释上述复杂LSTM模型的内在预测逻辑，研究者引入了最小二乘支持向量机（Least-Squares Support Vector Machine, LS-SVM）来构建一个代理模型。代理模型的任务是：学习并拟合 LSTM模型的行为，即，以相同的输入数据（t时刻的u, v, r, δ）为输入，以LSTM模型对t+1时刻状态的预测结果为目标输出，进行训练。LS-SVM被选中的原因是其具有优越的拟合与泛化能力，且其最终模型可以表示为一个清晰的线性方程形式。通过求解一个线性方程组，可以得到模型的权重和偏置项。研究者使用与步骤1相同的数据集来训练这个LS-SVM代理模型。
模型验证与可解释性分析：完成代理模型的训练后，研究者在新的、模型未见过的一系列机动实验数据上进行了泛化能力测试。这些实验包括：15°/15° Z形操舵、15°/15°正弦操舵（Sine maneuvering）、25°/25°正弦操舵、6°回转圈（Turning Circle）操舵以及13°回转圈操舵。通过比较代理模型预测结果、原始LSTM模型预测结果与真实实验数据，评估代理模型的保真度（fidelity）和预测速度。更重要的是，研究者对代理模型的线性方程权重进行了可视化分析。通过绘制柱状图等方式，直观展示了输入变量（u(t), v(t), r(t), δ(t)）对每一个输出变量（u(t+1), v(t+1), r(t+1)）的贡献程度（权重绝对值的大小和正负），从而将黑箱模型的预测逻辑转化为人类可以理解的、与物理常识相关联的定量关系。
三、 主要研究成果
MIMO-LSTM模型的准确性：如图4所示，MIMO-LSTM模型在训练和测试过程中都表现出了令人满意的预测性能。这证明了该复杂的深度学习模型能够有效地从数据中学习AUV的运动动力学特征。
代理模型的性能与效率：
高保真度：如图5、8至12所示，LS-SVM代理模型在各种机动实验（Z形、正弦形、回转圈）的预测结果中，均能与原始LSTM模型的预测结果以及实际数据保持良好的吻合。研究人员定量计算了代理模型相对于原始模型的预测误差（以均方根误差RMSE和平均绝对误差MAE衡量），发现在多种机动测试中，代理模型的预测精度损失很小（保真度在86.5%至95.8%之间，参见表3、表4）。
极高的计算效率：这是代理模型最突出的优势之一。结果显示，完成一次预测计算，原始的MIMO-LSTM网络需要80.56秒，而LS-SVM代理模型仅需1.14秒，计算速度提升了约98.6%。这对于需要在线实时进行运动预测和决策的AUV应用场景具有重大实用价值。
对比优势：作为对比，研究者还构建了一个基于普通神经网络（NN）的代理模型。结果显示，NN代理模型在保持相似精度的同时，计算时间（5.06秒）显著长于LS-SVM模型（1.14秒），且结构同样复杂、不易解释。此外，与传统的最小二乘（LS）方法相比，LS-SVM在处理非线性关系时表现出更好的拟合效果（图7）。
模型的可解释性：这是本研究最核心的贡献。研究者最终得到了一个清晰的、线性化的代理模型表达式： > u(t+1) = 0.9473*u(t) + 0.0340*v(t) - 8.29E-4*r(t) - 0.0035*δ(t)
 > v(t+1) = 0.0192*u(t) + 0.8783*v(t) + 8.89E-4*r(t) + 9.95E-4*δ(t)
 > r(t+1) = 0.3142*u(t) - 1.7767*v(t) + 1.0100*r(t) + 1.2324*δ(t)
通过对这些方程权重进行可视化分析（图14），研究者发现了与物理常识一致的模式：
每个输出变量受其自身前一时刻状态的影响权重最大（如u(t+1)中的u(t)权重0.9473，v(t+1)中的v(t)权重0.8783，r(t+1)中的r(t)权重1.0100），这体现了系统状态的“惯性”或连续性。
对偏航率r(t+1)影响最大的变量是舵角δ(t)，其权重为1.2324，呈现强正相关性。这完全符合船舶操纵基本原理：舵角是控制航向变化率（偏航率）的主要输入。
方程中也存在一些“异常”权重，例如r(t+1)方程中v(t)的权重为-1.7767，看起来是强负相关。但研究者指出，通过分析数值量级（图4-12），v(t)的数值本身比r(t)小近两个数量级，因此这个看似很大的权重在实际计算中的贡献是微乎其微的，不会影响模型的物理合理性。
研究者进一步通过“饼图”形式（图14），具体量化了在某个特定时刻（t=200），每个输入变量对预测值的具体贡献值。这使得研究人员和工程师能够“透视”模型在做出每一个具体预测时的内部逻辑，验证其是否符合物理直觉，从而建立对模型的信任。
四、 研究结论
本研究成功引入了一种基于LS-SVM的代理模型，用于解释AUV运动预测中的数据驱动黑箱模型（MIMO-LSTM网络）。该方法在保证足够预测精度的前提下，实现了快速、可解释的预测。其主要贡献在于： 1. 构建了能够处理三自由度（3-DOF）运动多变量耦合的MIMO-LSTM预测模型。 2. 利用LS-SVM将复杂的LSTM网络“翻译”成一个可表示为线性方程的代理模型，从而为理解模型的预测结果提供了直观途径。 3. 该方法在AUV的真实湖试数据（包括Z形、正弦形、回转圈机动）上得到了验证，并通过代理模型的权重进行可视化分析，使预测结果与领域先验知识（prior knowledge）保持一致，实现了模型的可解释性。
五、 研究亮点
问题导向的创新：研究抓住了深度学习方法在安全关键领域应用的“阿喀琉斯之踵”——可解释性问题，并提出了一个实用化的解决方案。
巧妙的“代理”思路：采用代理模型（LS-SVM）来解释黑箱模型（LSTM），在保持模型高性能（>95%保真度）的同时，实现了两个数量级的计算加速（98.6%速度提升），为AUV的在线实时预测与控制铺平了道路。
透明的定量解释：最终的线性方程及其权重分析，为模型的每个预测提供了定量的、可追溯的解释。这使得工程人员不仅知道“模型预测了什么”，更能理解“模型为何这样预测”，这在自主系统、尤其是与操作人员交互有限的水下航行器中至关重要。
严格的实验验证：研究不仅使用训练数据验证模型，更重要的是在多种复杂的、与训练数据模式不同的机动（如回转圈）上进行了广泛的泛化测试，证明了方法的鲁棒性和普适性。
六、 其他重要内容
研究者也对研究局限性和未来方向进行了探讨： 1. 局限性：该方法中的参数调优过程仍需一定时间；当前实验未考虑外部环境干扰（如风、浪、流），这可能会影响模型的泛化能力。 2. 未来工作：将探索更高效的参数优化技术，并计划将环境干扰变量纳入模型框架，以增强模型的鲁棒性和实际应用能力。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问