基于湖试数据的自主水下航行器运动预测可解释机器学习方法研究报告
本研究发表于 *Journal of Ocean Engineering and Science*,第11卷(2026年),第180至190页。通讯作者为上海交通大学的曹仰宇(Caoyang Yu)。研究团队由来自上海交通大学、华中科技大学以及中国船舶研究设计中心等多家单位的科研人员共同组成,包括第一作者裴天琪(Tianqi Pei)等。
一、 学术背景与研究目的
本研究主要聚焦于海洋工程领域的海洋运载器(如船舶、自主水下航行器等)运动建模与预测领域。准确可靠的海洋运载器运动数学模型,对于分析其动态特性、开发避碰系统以及实现自主导航至关重要。传统的建模方法,如计算流体动力学(Computational Fluid Dynamics, CFD)仿真和拘束模型试验,通常存在计算复杂或耗时费力的缺点。而系统辨识(System Identification)作为一种高效、低成本的数据驱动方法,正变得越来越重要。
近年来,以深度学习为代表的人工智能算法,如支持向量机(Support Vector Machine, SVM)、长短期记忆网络(Long Short-Term Memory, LSTM)等,被广泛应用于非参数化的“黑箱”(black-box)建模。这些模型虽然预测精度高,但结构复杂、内部机理不透明,其决策过程难以理解和解释。这种“黑箱”特性在涉及安全关键(safety-critical)的应用中(如重大疾病诊断或航行轨迹预测)带来了潜在风险,因为无法验证模型预测的逻辑,可能导致严重后果。因此,在海洋工程等领域,“打开”黑箱模型,提升其可解释性(interpretability),对于模型在实际应用中的可信度、可靠性与可采纳性至关重要。
本研究旨在解决上述矛盾。研究者提出了一种新颖的、基于可解释机器学习的方法,用于自主水下航行器(Autonomous Underwater Vehicle, AUV)的运动预测。其核心目标并非仅仅追求更高的预测精度,而是要建立一个既保持高性能、又具备高可解释性的预测模型。为此,研究者采用了“代理模型”(Surrogate Model)的思想,用一个结构简单、表达透明的模型来解释一个复杂的深度神经网络模型,从而在“黑箱”与“白箱”之间架起桥梁。
二、 研究详细工作流程
本研究的工作流程设计严谨,环环相扣,主要包括以下三个核心步骤:
构建复杂的“黑箱”预测模型:研究者首先建立了一个复杂的多输入多输出长短期记忆网络(Multi-input Multi-output LSTM, MIMO-LSTM)作为基础预测模型。该模型被设计用于执行“一步预测”(one-step prediction)。其输入是t时刻AUV的四个状态变量:前向速度(surge speed, u(t))、横荡速度(sway speed, v(t))、偏航率(yaw rate, r(t))和舵角(rudder angle, δ(t))。模型的输出是t+1时刻的u、v、r三个速度变量。这个LSTM网络包含一个输入层、一个拥有128个隐藏单元的LSTM层、一个用于防止过拟合的dropout层(丢弃概率为0.1)以及一个全连接输出层。研究者使用来自名为“NGC4MR-XAUV3”的AUV在实际湖泊(致远湖)中进行的25°/25° Z形操舵(Zigzag maneuvering)实验数据来训练和测试这个模型。所有数据归一化处理,其中90%用作训练集。实验平台配备了高精度的姿态传感器和多普勒计程仪(Doppler Velocity Log)来采集数据。
训练可解释的“代理模型”:为了解释上述复杂LSTM模型的内在预测逻辑,研究者引入了最小二乘支持向量机(Least-Squares Support Vector Machine, LS-SVM)来构建一个代理模型。代理模型的任务是:学习并拟合 LSTM模型的行为,即,以相同的输入数据(t时刻的u, v, r, δ)为输入,以LSTM模型对t+1时刻状态的预测结果为目标输出,进行训练。LS-SVM被选中的原因是其具有优越的拟合与泛化能力,且其最终模型可以表示为一个清晰的线性方程形式。通过求解一个线性方程组,可以得到模型的权重和偏置项。研究者使用与步骤1相同的数据集来训练这个LS-SVM代理模型。
模型验证与可解释性分析:完成代理模型的训练后,研究者在新的、模型未见过的一系列机动实验数据上进行了泛化能力测试。这些实验包括:15°/15° Z形操舵、15°/15°正弦操舵(Sine maneuvering)、25°/25°正弦操舵、6°回转圈(Turning Circle)操舵以及13°回转圈操舵。通过比较代理模型预测结果、原始LSTM模型预测结果与真实实验数据,评估代理模型的保真度(fidelity)和预测速度。更重要的是,研究者对代理模型的线性方程权重进行了可视化分析。通过绘制柱状图等方式,直观展示了输入变量(u(t), v(t), r(t), δ(t))对每一个输出变量(u(t+1), v(t+1), r(t+1))的贡献程度(权重绝对值的大小和正负),从而将黑箱模型的预测逻辑转化为人类可以理解的、与物理常识相关联的定量关系。
三、 主要研究成果
MIMO-LSTM模型的准确性:如图4所示,MIMO-LSTM模型在训练和测试过程中都表现出了令人满意的预测性能。这证明了该复杂的深度学习模型能够有效地从数据中学习AUV的运动动力学特征。
代理模型的性能与效率:
模型的可解释性:这是本研究最核心的贡献。研究者最终得到了一个清晰的、线性化的代理模型表达式: > u(t+1) = 0.9473*u(t) + 0.0340*v(t) - 8.29E-4*r(t) - 0.0035*δ(t)
> v(t+1) = 0.0192*u(t) + 0.8783*v(t) + 8.89E-4*r(t) + 9.95E-4*δ(t)
> r(t+1) = 0.3142*u(t) - 1.7767*v(t) + 1.0100*r(t) + 1.2324*δ(t)
通过对这些方程权重进行可视化分析(图14),研究者发现了与物理常识一致的模式:
研究者进一步通过“饼图”形式(图14),具体量化了在某个特定时刻(t=200),每个输入变量对预测值的具体贡献值。这使得研究人员和工程师能够“透视”模型在做出每一个具体预测时的内部逻辑,验证其是否符合物理直觉,从而建立对模型的信任。
四、 研究结论
本研究成功引入了一种基于LS-SVM的代理模型,用于解释AUV运动预测中的数据驱动黑箱模型(MIMO-LSTM网络)。该方法在保证足够预测精度的前提下,实现了快速、可解释的预测。其主要贡献在于: 1. 构建了能够处理三自由度(3-DOF)运动多变量耦合的MIMO-LSTM预测模型。 2. 利用LS-SVM将复杂的LSTM网络“翻译”成一个可表示为线性方程的代理模型,从而为理解模型的预测结果提供了直观途径。 3. 该方法在AUV的真实湖试数据(包括Z形、正弦形、回转圈机动)上得到了验证,并通过代理模型的权重进行可视化分析,使预测结果与领域先验知识(prior knowledge)保持一致,实现了模型的可解释性。
五、 研究亮点
六、 其他重要内容
研究者也对研究局限性和未来方向进行了探讨: 1. 局限性:该方法中的参数调优过程仍需一定时间;当前实验未考虑外部环境干扰(如风、浪、流),这可能会影响模型的泛化能力。 2. 未来工作:将探索更高效的参数优化技术,并计划将环境干扰变量纳入模型框架,以增强模型的鲁棒性和实际应用能力。