学术研究报告:自主水下航行器向移动平台安全对接的分层模型预测控制方法
第一,作者、机构及发表信息
本研究的核心作者团队来自中国西北工业大学航海学院,主要作者包括 Yuanxu Zhang(张元旭?)、Jian Gao(高建?,通讯作者)、Guofang Chen(陈国芳?)、Peng Wang(王鹏?)、Xiaoxu Du(杜晓旭?)和 Guang Pan(潘光?)。这项研究以学术论文形式发表在期刊 Ocean Engineering 第349卷(2026年),文章于2025年9月4日提交,2025年12月7日修改,最终于2025年12月13日被接受,并于2026年1月7日在线发布。文章的DOI标识符为10.1016/j.oceaneng.2025.123993。
第二,研究背景与目的
本研究属于海洋工程与水下机器人控制领域,具体聚焦于自主水下航行器的动态对接技术。AUV在海洋环境监测、海底测绘、基础设施巡检等任务中扮演着关键角色,但其长期自主运行能力受限于有限的机载能源。因此,发展高效可靠的对接机制,使AUV能够与母船或移动平台对接以进行能源补给和数据交换,成为提升AUV自主性和任务续航能力的核心技术挑战。
早期的AUV对接研究主要集中于与固定在海底或平台上的静态站对接。然而,随着任务时长和范围扩展,依赖固定回收系统变得不切实际,研究范式逐渐转向移动回收平台,如水面船只、无人水面艇、潜艇乃至协同作业的AUV。尽管已有一些针对移动平台对接的研究,但许多研究假设对接目标是静止的,或者其轨迹是完美已知且连续可观测的。这些理想化假设忽略了现实动态环境中一个根本性难题:在动态对接过程中,准确估计移动平台的状态。现实水下环境给动态对接带来三大核心挑战:1) 间歇性与延迟的声学定位:用于测量AUV与移动平台相对位置的超短基线等声学系统,存在数据包丢失、更新频率低以及可变的时间延迟,导致状态信息异步且不准确。2) 环境障碍物:包括静态障碍物(如岩石)和动态障碍物(如母船螺旋桨产生的强湍流尾迹区),AUV必须在对接过程中安全规避。3) 外部扰动:主要是洋流干扰,会影响AUV和移动平台两者的运动。
传统的状态估计方法(如扩展卡尔曼滤波)通常假设测量同步,对时间错位数据性能不佳;而延迟补偿滤波器又常假设恒定延迟或计算量大,难以实时应用。在控制方面,模型预测控制(Model Predictive Control, MPC)因其处理约束和预测系统演化的能力而被广泛用于AUV。然而,单层MPC需要在长时域规划与高频率反馈之间权衡,受限于机载计算能力,往往导致性能次优或处理时间过长。现有的分层MPC方法,其高层规划器常使用过于简化的运动学模型,导致生成的轨迹在底层动力学层面不可行或不稳定,且规划层与跟踪层之间协调不佳,使得轨迹在动态和环境约束下难以被可靠跟踪。
鉴于此,本研究旨在解决现有方法在动态水下对接中状态估计和运动控制的不足。主要研究目标是:开发一个集成的、鲁棒的控制架构,使AUV能够在存在声学延迟、洋流扰动和环境障碍物的复杂不确定条件下,安全、精确地对接移动平台。具体而言,研究力求提出一种能够同时估计平台状态与延迟的算法,并设计一个分层MPC框架,实现前瞻性的轨迹规划和鲁棒的轨迹跟踪。
第三,详细研究流程与方法
本研究提出并验证了一个完整的“估计-规划-控制”集成框架,主要包括三大核心模块:基于变分贝叶斯期望最大化(Variational Bayesian Expectation-Maximization, VBEM)的状态与延迟估计器、高层轨迹规划MPC(Planning MPC, PMPC)以及底层鲁棒跟踪MPC(Robust Tracking MPC, RTMPC)。整个工作流程通过仿真进行验证。
流程一:系统建模与问题定义 首先,研究建立了AUV的运动学与动力学模型。模型采用地球固定坐标系和载体固定坐标系,包含了位置、姿态、速度以及恒定的未知洋流速度(假设在短时对接过程中缓慢变化)。动力学方程考虑了水动力效应、科里奥利力、阻尼力和恢复力,并包含了有界的模型不确定性。随后,将连续时间模型离散化,得到用于预测控制设计的离散时间非线性系统方程,并定义了状态和输入必须满足的紧凑多面体约束集。对接站被建模为安装于水面母船下方的刚性锥形导向装置,其运动状态向量包括三维位置、航向以及影响其漂移的二维洋流分量。对接站沿近似直线、恒定速度的路径运动,但受洋流影响而产生位置漂移。研究还定义了环境障碍物,包括静态球形障碍物和母船螺旋桨产生的时变圆锥形尾迹区,并形式化地定义了无碰撞区域。
流程二:改进的VBEM估计器设计与实现 为了处理声学定位的时变延迟问题,研究提出了一种改进的自适应窗口VBEM算法。该算法的核心创新在于将每个时间步的测量延迟建模为离散的潜变量,并与对接站状态(包括洋流)进行联合估计。 * 研究对象的处理:算法处理的是来自声学定位系统的异步、带延迟的观测序列。延迟被假设为在有限集合内(例如0, 1, …, D秒)取值的离散变量。 * 新算法开发:不同于标准滤波器,该VBEM框架通过均值场分解来近似状态和延迟序列的联合后验分布。算法交替优化两个变分因子:状态序列的后验和延迟序列的后验。在E步,根据当前状态估计计算每个可能延迟的后验概率。在M步,采用一种高效的“硬分配”更新策略:仅使用最可能的延迟(最大后验估计,MAP),对相应的延迟状态进行非线性贝叶斯滤波更新(文中采用无迹变换方法),然后前向传播至当前时刻,而非对所有延迟假设进行边际化,这显著降低了计算复杂度。 * 自适应机制:为了平衡计算复杂性与对延迟变化的适应性,算法引入了自适应窗口长度调整机制。通过计算延迟后验分布的熵来评估延迟不确定性:若熵高(延迟不确定性大),则增加推理窗口长度以利用更多历史信息;若熵低(延迟确定性高),则减小窗口以节省计算。窗口长度被限制在预设的最小值与最大值之间。 * 数据流分析:该算法接收带噪声和延迟的声学观测数据,在线输出经过延迟补偿的对接站状态估计(包括位置、航向和洋流速度)以及估计的延迟值,这些信息将提供给规划器。
流程三:高层轨迹规划MPC设计 高层PMPC利用VBEM估计器提供的对接站预测状态和环境障碍物信息,生成一条光滑、动态可行且无碰撞的参考轨迹。 * 研究对象的处理:PMPC优化问题以当前AUV状态为初始条件,考虑未来N_p个时间步的系统动力学演化。 * 新颖方法集成:PMPC的关键创新在于将人工势场(Artificial Potential Field, APF)的排斥项直接集成到优化器的目标函数中,作为一种软约束。与将障碍物作为硬约束的经典MPC不同,这种集成方式允许规划器在目标跟踪、控制输入调节和排斥势能之间进行联合权衡。APF项在AUV靠近障碍物时产生排斥成本,促使其提前规划避让路径,从而生成更平滑、更具前瞻性的轨迹,同时避免了经典APF方法可能陷入局部最小值的问题。 * 约束收紧:为了确保生成的参考轨迹能够被底层的RTMPC鲁棒跟踪,PMPC中的状态/输入约束和避障约束都进行了“收紧”。这意味着在规划层使用了比原始约束更严格的集合,为跟踪误差和扰动预留了安全裕度。这些收紧的集合是基于RTMPC的稳定性分析(特别是终端集合)推导而来的,从而保证了整个分层框架的递归可行性。 * 工作流程:在每个规划周期,PMPC求解一个有限时域最优控制问题,最小化包括跟踪目标偏差、控制能量和APF排斥项在内的综合成本,同时满足收紧的动态、输入及几何约束。求解后得到最优的参考状态和参考控制输入序列。
流程四:底层鲁棒跟踪MPC设计 底层RTMPC接收PMPC生成的参考轨迹,并负责在存在有界模型不确定性和外部扰动的情况下,精确跟踪该轨迹。 * 研究对象的处理:RTMPC基于AUV的标称(无扰动)离散模型进行预测,但优化时考虑扰动的影响。 * 鲁棒性保障设计:RTMPC采用了一种基于“管”的MPC框架来确保鲁棒性。其核心是离线设计一组鲁棒终端组件,包括一个局部线性反馈控制律K、一个终端代价矩阵P和一个终端集合X_f_robust。 * 新颖算法/工具开发:终端集合和反馈增益是通过求解一个半定规划(Semidefinite Programming, SDP)问题得到的。这个SDP问题在优化中同时考虑了系统线性化误差动态的稳定性条件以及由有界扰动引起的约束收紧量。由此得到的终端集合是鲁棒正不变的,意味着一旦系统误差进入该集合,在指定的局部反馈控制律下,即使存在扰动,误差也将始终停留在该集合内,且终端李雅普诺夫函数满足耗散不等式。 * 在线工作流程:在每个控制周期,RTMPC求解一个有限时域优化问题,最小化跟踪误差和控制偏差,约束条件包括:标称动力学、收紧的状态/输入约束、收紧的避障约束以及一个关键的终端约束——要求预测时域末端的标称状态误差必须位于上述鲁棒终端集合内。这个终端约束结合SDP设计的终端组件,从理论上保证了闭环系统的递归可行性和输入到状态稳定性。 * 协同设计:一个重要的亮点是,高层PMPC的约束收紧正是基于底层RTMPC的鲁棒终端集合进行的。这种跨层的协同设计确保了规划器产生的参考轨迹对于跟踪控制器而言是严格可行的,从而解决了传统分层方法中规划与跟踪脱节的问题。
流程五:仿真验证与对比分析 研究通过在高保真仿真环境中构建多个代表性场景来验证所提框架的有效性和鲁棒性。 * 实验设置:仿真场景包括:动态对接移动平台、存在洋流扰动、声学定位存在随机延迟(1-2秒)和间歇性丢失(10%丢包率)、以及存在静态球形障碍物和母船螺旋桨尾迹区。AUV和对接站的初始位置、运动参数、控制输入限幅、障碍物位置和尾迹区几何参数均被详细设定。VBEM估计器、PMPC和RTMPC的参数(如预测时域、权重矩阵、噪声协方差)也被明确给出。 * 实验过程:仿真运行50秒,控制层和规划层以不同频率(分别为0.2秒和0.4秒)异步执行。整个框架使用CasADi建模,并通过IPOPT非线性求解器进行求解,采用“热启动”策略加速。研究记录了完整的对接轨迹、状态误差、控制输入、与障碍物的距离以及估计器的性能。 * 对比实验:为了突出所提方法的优势,研究还进行了对比仿真,基准方法包括:1) 单层鲁棒MPC:在一个优化层中同时处理规划和跟踪,但计算负担集中;2) 标准分层MPC:高层使用简化模型进行规划,底层进行跟踪,但缺乏鲁棒性设计和层间协同。研究从对接时间、最终位置/姿态误差、最小障碍物距离以及平均求解时间等多个维度进行了定量比较。
第四,主要研究结果
结果一:VBEM估计器性能 仿真结果表明,尽管声学观测存在随机延迟和间歇,所提出的自适应窗口VBEM算法能有效估计对接站的状态和延迟。如图5和图8所示,估计器在仿真开始后约12秒内,其对接站位置估计和洋流扰动估计均收敛到真实值。同时,延迟的后验分布熵被用于动态调整推理窗口,体现了算法对时变延迟环境的自适应能力。这验证了该算法在异步、延迟测量条件下进行鲁棒状态估计的有效性,为后续规划和控制提供了准确、及时的输入。
结果二:整体对接性能与轨迹分析 在复杂的仿真环境下,所提出的分层框架成功引导AUV完成了安全、精确的动态对接。如图4所示,AUV从起始点开始,在t=10.2秒时主动转向以规避静态障碍物(得益于PMPC中APF的前瞻性作用),随后朝向对接目标运动,并成功避开了母船螺旋桨尾迹区,最终在t=33.4秒完成对接。图6和图7显示了最终的对接精度:位置误差为0.12米,偏航角误差为0.009弧度,俯仰角误差为0.022弧度;在x, y, z轴方向的位置跟踪误差分别收敛至0.05米、0.095米和0.054米,表现出了高精度的位姿对准能力。
结果三:安全避障验证 在整个对接过程中,安全约束得到严格遵守。如图9所示,AUV与静态障碍物始终保持安全距离,最小距离为4.47米,远大于障碍物半径(3米),证明了APF集成到MPC中的避障有效性。同时,AUV在整个过程中也成功避开了时变的螺旋桨尾迹区,避免了强湍流干扰。控制输入(螺旋桨转速和舵角)如图10所示,均在预设的物理限幅内,平滑且可行。
结果四:对比实验结果 定量对比结果(表1)清晰展示了所提方法的优越性。在对接精度上,所提出的分层鲁棒MPC取得了最佳成绩(位置误差0.12米,偏航误差0.009弧度),优于单层鲁棒MPC(0.15米,0.0209弧度)和标准分层MPC(0.26米,0.031弧度)。在安全性上,所提方法保持了最大的最小障碍物距离(4.47米)。在计算效率上,虽然单层MPC每次迭代求解时间更长(0.347秒),而所提方法的控制器和规划器平均求解时间分别为0.1549秒和0.2852秒,但由于其分层异步执行的特性(规划频率低于控制频率),在实际应用中整体实时性更优。标准分层MPC虽然求解较快,但因其模型失配和缺乏鲁棒设计,导致控制性能和安全裕度下降。这些结果综合表明,所提框架在精度、安全性和实时可行性之间取得了更好的平衡。
结果间的逻辑关系:VBEM估计器提供的准确、延迟补偿的状态预测,是PMPC生成高质量参考轨迹的基础。PMPC生成的平滑、可行且具有安全裕度的参考轨迹,则为RTMPC实现鲁棒跟踪创造了条件。RTMPC的鲁棒性保障(尤其是终端集合)反过来指导了PMPC的约束收紧,形成了闭环设计。仿真结果验证了这一逻辑链条的有效性,各模块的结果相互支撑,共同促成了最终安全、精确的对接。
第五,结论与价值
本研究成功开发并验证了一个用于AUV动态对接的集成化分层MPC框架。主要结论是:该框架能够有效应对声学定位间歇延迟、时变洋流扰动以及复杂环境障碍等多重挑战,实现AUV向移动平台的安全、平滑、高精度对接。
研究的科学价值在于:1) 估计方法创新:提出了改进的自适应窗口VBEM算法,将延迟作为潜变量进行联合估计,为处理水下异步测量提供了新的概率推断思路。2) 控制架构创新:设计了一个紧密协同的分层MPC架构,其中高层规划集成APF实现前瞻避障,底层跟踪通过SDP设计的终端组件保证鲁棒稳定性,且两层采用相同的非线性动力学模型并基于稳定性分析进行约束协同收紧,从理论上保证了递归可行性和闭环系统的输入到状态稳定性。这为解决规划与跟踪脱节这一分层控制经典难题提供了系统性的方案。
研究的应用价值显著:所提出的框架大大提升了AUV在真实、复杂水下环境中执行长期自主任务的能力。它使得AUV能够可靠地与移动母船对接,进行能源补给和数据回传,从而减少对水面支援的依赖,延长任务周期,对于海洋科学研究、资源勘探、国防安全等领域具有重要的现实意义。
第六,研究亮点
第七,其他有价值内容
文章末尾指出了当前工作的局限性,为未来研究指明了方向:1) 障碍物模型较为简化;2) 目前主要在仿真中验证,需要在嵌入式平台上进一步优化以实现实时应用;3) 尚未在可变流场和复杂海况的大规模、长航时试验中进行验证。未来的工作将集中于将该框架扩展至多智能体协同对接场景,并在真实海试中利用移动平台和可变洋流条件进行验证。这些坦诚的评述增加了研究的严谨性和参考价值。
此外,文章的结构非常清晰,遵循了“引言-问题定义-方法设计-仿真结果-结论”的标准学术论文格式,并在每个技术章节提供了详细的公式推导和解释,使得研究内容易于理解和复现。