基于高阶内模的高速铁路衰落信道数据驱动迭代学习控制

分享自：
基于高阶内模的高速铁路衰落信道数据驱动迭代学习控制

工程学
电气科学与工程
期刊:IEEE Transactions on Intelligent Transportation SystemsDOI:10.1109/TITS.2025.3629079
【点击此处】阅读全文、收藏及针对性提问
该文档属于类型a：单篇原创研究报告。
本研究的主要作者为Deqing Huang、Wei Yu以及Xuefang Li，他们分别来自西南交通大学电气工程学院（先进能源牵引与综合节能铁路行业重点实验室）以及中山大学智能系统工程学。该项研究发表在《IEEE Transactions on Intelligent Transportation Systems》期刊上，于2026年1月第27卷第1期正式出版。
学术背景与研究目标 本研究的学术领域集中于高速铁路的智能化控制，具体而言，是针对高速列车（High-speed Railways, HSRs）的运行控制问题。随着高速铁路在全球范围内的广泛应用，自动列车控制系统（Automatic Train Control System, ATCS）对于保障行车安全、提高运行效率和准时性至关重要。传统控制方法，如基于单质点或多质点模型的控制策略，往往依赖于精确的系统模型，这对于非线性、强耦合且受未知阻力干扰的高速列车系统而言，建模困难且计算复杂。此外，在实际运行中，列车通常按照运行图在同一条线路上重复行驶，线路条件（如弯道、坡道、桥梁、隧道）的重复性也导致了列车动力学的重复性变化，这一特性尚未被现有控制系统充分利用。
与此同时，随着通信网络在列车控制系统中的应用日益广泛，网络诱导问题（如数据丢包、时延、恶意攻击）对控制性能构成了新的挑战。其中，衰落信道（faded channels）引起的信号衰减问题，可能导致控制器接收到不完整的列车状态信息，严重时甚至引发系统崩溃，而这一问题在高速列车控制领域的研究相对较少。另一方面，实际运营中列车的期望速度轨迹并非一成不变，而是会随着运行图的季度性调整而迭代变化，传统的迭代学习控制（Iterative Learning Control, ILC）方法通常假设期望轨迹完全重复，无法有效处理这种迭代变化的轨迹。
基于以上背景，本研究旨在解决三个核心挑战：1）如何仅依赖列车的输入/输出（I/O）数据，构建不依赖精确数学模型的数据驱动控制器？2）如何对运行中迭代变化的因素（主要是期望速度轨迹的变化规律）进行建模？3）如何处理列车通信网络中由衰落信道引起的不稳定数据传输问题？为此，研究团队提出了一种融合高阶内模（High-Order Internal Model, HOIM）的数据驱动无模型自适应迭代学习控制（Model Free Adaptive Iterative Learning Control, MFAILC）策略，专门用于应对衰落信道影响下的高速列车速度跟踪控制问题。研究目标是通过学习控制器，使高速列车在有限的迭代次数内，能够完全跟踪具有迭代变化规律的期望速度轨迹，即使在实际通信质量不佳的情况下。
详细工作流程 本研究的工作流程主要包括以下几个步骤：动态模型转换、信道与轨迹建模、控制器设计、理论收敛性分析以及仿真与半物理平台验证。研究的具体对象是CRH-380型高速列车的动力学模型及其在虚拟运行环境中的表现。
首先，在动态模型转换阶段，研究基于牛顿定律和戴维斯方程，建立了高速列车的非线性连续时间动态模型，描述了位置、速度、加速度与牵引力、基本阻力、附加阻力之间的关系。为了方便数字控制器的设计和信息传输，研究采用欧拉法对该连续模型进行了离散化，得到一个非线性离散时间系统。为了绕过对复杂非线性模型精确信息的依赖，研究引入了动态线性化技术。在满足系统关于控制输入连续及满足广义Lipschitz条件的前提下，该非线性系统被等价转换为一个仅依赖于当前时刻伪偏导数（Pseudo-Partial Derivative, PPD）的线性数据模型。这个转换是关键的数据驱动基础，它将复杂的非线性控制问题转化为一个可以仅用输入/输出数据进行参数估计和控制的线性时变系统框架。
其次，在模型构建阶段，研究团队同时处理了衰落信道和迭代变化轨迹的建模。对于衰落信道，模型假设控制器接收到的速度测量值 v̄(k, i) 是真实速度 v(k, i) 乘以一个独立同分布的随机衰减系数 θ(k, i)。该系数期望值 θ̄ 已知，方差为 θ∗。这一模型刻画了无线信道中信号幅值随机衰减的现象。对于期望速度轨迹，研究引入了基于移位算子的高阶内模（HOIM）来描述其沿迭代轴的变化规律。假设期望速度 vd(k, i) 满足一个m阶的内部模型，即当前迭代的期望速度可以由前m次迭代的期望速度的线性组合来表示。其系数构成一个临界稳定的特征多项式。这一建模方法将传统ILC中“完全重复”的轨迹扩展为“按某种规律迭代变化”的轨迹，极大地增强了控制器的实用性。文中以季度调整的中国列车运行图为例，说明这种变化规律是存在的且可以通过HOIM进行有效刻画。
接下来，在控制器设计阶段，研究基于构建的等效线性数据模型、衰落测量模型以及HOIM轨迹模型，设计了无模型自适应迭代学习控制器。设计的核心是构造两个性能指标函数：一个用于优化控制输入 u(k, i)，旨在最小化速度跟踪误差的同时限制控制输入的变化；另一个用于在线估计伪偏导数 ψ̂(k, i)。通过对这两个函数分别求极值，并考虑衰落后的输出 v̄(k, i) 和期望速度的HOIM关系，推导出最终的MFAILC控制律。该控制律由三部分组成：伪偏导数的估计算法、估计算法的重置条件以及控制输入的更新算法。其中，控制输入更新算法巧妙地结合了HOIM的系数 h_j 和一组可调的学习增益 γ_j，使得控制器能够主动学习和适应期望轨迹的变化模式，而不仅仅是被动地响应当前误差。
然后，在理论分析阶段，研究对提出的控制方案进行了严格的收敛性分析。为了处理迭代变化轨迹带来的分析困难，研究引入了λ-范数作为分析工具。在系统满足若干合理假设（如伪偏导数符号恒定且不为零）的前提下，通过数学推导证明了：1）伪偏导数估计值的期望是有界的；2）当学习增益 γ_j 的选取满足一组与HOIM系数 h_j、衰落期望 θ̄ 和控制器参数相关的充分条件时，列车速度的期望值能够沿迭代轴渐近收敛到期望速度轨迹。定理1及其证明为所提方法的有效性提供了坚实的理论保证。
最后，在验证阶段，研究通过仿真和硬件在环（Hardware-in-Loop, HIL）半物理平台实验来检验控制方案的有效性。仿真在MATLAB/Simulink环境中进行，并最终部署在StarSim HIL半物理平台上。实验设置包括：迭代次数50次，采样周期1秒，总运行时间2500秒；衰落信道参数 θ̄=0.99, θ∗=0.01；期望速度采用2阶HOIM生成（h1=0, h2=1），表示轨迹每两次迭代重复一次但不收敛为零；控制器参数根据经验设置。实验中不仅模拟了列车运行的基本阻力和附加阻力（随时间和位置变化），还引入了高斯白噪声作为外部干扰。为了凸显所提方法的优势，研究将其与多种先进控制方法进行了对比，包括自适应ILC、传统MFAILC、无模型自适应控制（MFAC）、模型预测控制（MPC）以及滑模控制（SMC）。性能通过速度/位置跟踪曲线、最大跟踪误差随迭代的变化、以及积分平方误差（ISE）、积分绝对误差（IAE）等量化指标进行评估。
主要结果 在仿真与半物理平台测试中，所提出的基于HOIM的MFAILC方案表现出了优异的性能。
在跟踪性能方面，随着迭代次数的增加，列车的实际速度 v(k, i) 和位置 s(k, i) 能够快速、准确地跟踪上迭代变化的期望速度轨迹 vd(k, i) 和对应的期望位置。图6和图7清晰地展示了这一收敛过程。特别地，图8显示的最大跟踪误差 ev,max(i) 沿迭代轴迅速下降并维持在很低的水平，这表明控制器具有强大的学习能力，能够在有限迭代内实现近乎完全的跟踪。尽管由于衰落现象和期望轨迹的不完全匹配，误差曲线存在微小波动，但整体收敛趋势非常明显。
在抗干扰与鲁棒性方面，研究引入的高斯白噪声干扰测试（图5）表明，所提控制器在面对外部扰动时依然能够保持稳定的跟踪性能，验证了其在复杂运行环境下的鲁棒性。
在衰落信道影响分析方面，研究测试了不同衰落统计特性（期望 θ̄ 减小或方差 θ∗ 增大）对控制性能的影响（图9）。结果显示，尽管存在衰落，控制器仍能通过迭代学习实现跟踪，但跟踪精度会随着信道质量的恶化而有所下降。这符合实际预期，并定量展示了所提方法对信道质量的适应范围。
在与其它控制方法的对比中（图10及表I），结果最具说服力。所提出的基于HOIM的MFAILC在各项误差指标（ISE, IAE, ITSE, ITAE）上均表现最佳。它明显优于未使用HOIM的传统MFAILC [38]，这直接证明了引入HOIM处理迭代变化轨迹的有效性。与自适应ILC [43]相比，本文的数据驱动方法也显示出优势。更重要的是，与所有非迭代学习的方法（MFAC, MPC, SMC）相比，学习类方法（AILC, MFAILC）的误差波动更小，最终精度更高，这凸显了迭代学习机制在利用重复运行特性方面的根本优势。表II进一步显示，所提方法在计算资源消耗（CPU时间和内存占用率）方面与对比方法处于同一水平，结合其更高的跟踪精度，体现了良好的综合性能。
结论与价值 本研究成功开发并验证了一种适用于衰落信道环境下、具有迭代变化期望轨迹的高速列车数据驱动迭代学习控制方案。主要结论是：通过引入高阶内模（HOIM）来刻画期望速度的迭代变化规律，并结合衰落信道模型，所设计的无模型自适应迭代学习控制器能够仅利用列车的输入和带有衰减的输出数据，实现高速列车速度的精确渐近跟踪。理论分析证明了闭环系统的收敛性，仿真和半物理平台实验则证实了其在实际复杂环境（含噪声、时变阻力、衰落信道）下的有效性和优越性。
该研究的科学价值在于：1）将HOIM与数据驱动MFAILC相结合，为解决具有非严格重复运行特性的复杂非线性系统的控制问题提供了一种新颖且通用的框架；2）建立了一套基于λ-范数的收敛性分析框架，不仅完善了MFAILC的理论体系，也拓宽了其应用范围；3）首次在高速列车控制领域统一考虑了迭代变化的轨迹和随机衰落信道，丰富了网络化列车控制理论。
其应用价值则非常直接和显著：该方案不依赖于精确的列车动力学模型，降低了控制器对先验知识的依赖，更易于工程实现；能够主动适应运行图的调整，提升运营灵活性；对通信网络中的信号衰减具有一定容忍度，增强了系统的可靠性和安全性。这对于推动高速列车控制向更智能化、自适应化、网络化方向发展具有重要意义。
研究亮点 本研究的亮点突出体现在以下几个方面： 1. 方法创新性：核心创新点在于将高阶内模（HOIM）集成到数据驱动的MFAILC中。与现有大多假设期望轨迹完全重复的研究不同，该方法能有效处理实际中常见的、按规律迭代变化的期望轨迹，极大地提升了控制策略的实用性和普适性。 2. 理论完备性：针对迭代变化轨迹带来的分析难点，创造性引入了λ-范数并给出了严格的收敛性证明（定理1），为方法提供了坚实的理论支撑，这是对现有MFAILC理论的重要深化和拓展。 3. 问题综合性：研究没有孤立地看待某个问题，而是将高速列车控制中的三个关键难题——模型未知性、轨迹迭代变化性、信道不可靠性——置于一个统一的框架下一并解决，体现了研究的系统性和工程前瞻性。 4. 验证先进性：验证手段不仅限于数值仿真，还采用了StarSim硬件在环（HIL）半物理平台进行测试，使得验证结果更接近真实物理系统，增强了研究成果的可信度和说服力。 5. 对比全面性：与多达五种不同类型的先进控制算法进行了详尽的对比实验，并通过多维度量化指标（图形与表格）客观展示了所提方法的综合优势，论证充分有力。
其他有价值内容 研究在讨论部分还指出了未来可能的研究方向，例如：1）采用多质点模型和改进的HOIM来进一步提升乘客舒适度；2）考虑牵引供电网络的复杂动态；3）开发结合机器学习和ILC的混合控制框架。这些展望为后续研究提供了清晰的思路。此外，文中备注部分（如Remark 8）提到，所提方法可以较为直接地扩展到多列车协调控制的多智能体框架下，显示了该方法良好的可扩展性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问