分享自:

非线性系统的双层迭代学习控制

期刊:IEEE Transactions on Systems, Man, and Cybernetics: SystemsDOI:10.1109/TSMC.2024.3417378

类型a:学术研究报告

作者及机构
本文由Na Lin(青岛科技大学自动化与电子工程学院)、Ronghu Chi(IEEE会员,青岛科技大学自动化与电子工程学院)和Biao Huang(IEEE会士,加拿大阿尔伯塔大学化工与材料工程系)共同完成,发表于《IEEE Transactions on Systems, Man, and Cybernetics: Systems》2024年10月第54卷第10期。

学术背景
该研究属于控制工程领域,聚焦于非线性系统的迭代学习控制(Iterative Learning Control, ILC)。传统ILC在有限时间内的重复系统中表现出色,但其性能受限于固定设定值(set-point)的重复跟踪,且依赖系统模型信息,难以应对复杂工业过程中模型未知或工况变化的情况。此外,现有最优设定控制(Optimal-Setting Control, OSC)方法虽能优化设定值,但仅适用于时间渐近收敛场景,无法满足有限时间迭代的高精度需求。

本研究旨在提出一种双层迭代学习控制(Double-Layered Iterative Learning Control, DILC)框架,通过内层控制输入迭代学习和外层设定值迭代优化,提升非线性非仿射系统的跟踪性能,同时仅依赖输入输出(I/O)数据实现无模型控制。

研究流程与方法
1. 问题建模与算法设计
- 系统模型:研究对象为强非线性非仿射系统,其动态特性由未知非线性函数描述,假设其输出变化率受输入变化率的约束(假设3-4)。
- 双层控制机制
- 内层ILC:采用传统P型ILC(公式1),以虚拟设定值(virtual set-point)更新控制输入,学习增益为( k_p )。
- 外层学习优化:设计设定点学习优化(Set-Point Learning Optimization, SPLO)算法(公式2),通过非线性动态线性化(Iterative Dynamic Linearization, IDL)将其转化为线性参数化形式(公式3),其中未知参数( \vartheta(n, \ell) )通过投影算法(公式21-22)在线估计。
- 数据驱动实现:利用IDL技术将非线性系统等效为线性数据模型(LDM,公式11),参数( \psi(n, \ell) )通过投影更新(公式16)。

  1. 参数估计与收敛性保障

    • SPLO参数优化:基于目标函数(公式12)设计参数更新律(公式21),加入重置机制(公式22)保证估计方向一致性。
    • 系统参数估计:采用投影算法(公式19-20)更新LDM参数( \hat{\psi}(n, \ell) ),确保其有界性。
    • 收敛性证明:通过数学归纳法(定理1)分析闭环系统的迭代有界收敛性,需满足学习增益( k_p )和系统增益( \alpha )的约束条件(公式34)。
  2. 仿真验证

    • 案例1:数值非线性系统(分段非线性函数),目标轨迹为迭代时变的混合信号(公式52)。结果显示DILC在随机扰动下仍能实现高精度跟踪(图2-3),且误差收敛速度优于传统单层ILC(图3)。
    • 案例2:汽车悬架系统(二阶差分方程),目标轨迹含随机噪声(图4)。DILC在100次迭代后跟踪误差显著降低(图5-6),验证了其对实际工程的适用性。

主要结果
1. 理论贡献
- 提出首个结合内层输入学习和外层设定值学习的DILC框架,突破了传统ILC固定设定值的限制。
- 通过IDL技术实现了非线性系统与SPLO算法的双重线性化,仅需I/O数据即可完成控制设计。

  1. 性能优势
    • 仿真表明,DILC在迭代时变轨迹下的跟踪误差比单层ILC降低约30%(图3,6),且对随机干扰鲁棒。
    • 外层SPLO机制通过动态调整设定值,将内层ILC的稳态误差进一步压缩。

结论与价值
1. 科学意义:为非线性非仿射系统的数据驱动控制提供了新思路,弥合了传统ILC与OSC方法的鸿沟。
2. 应用价值:适用于工业批次过程(如化工、机器人),尤其在模型未知或工况频繁变化场景中,可替代依赖精确模型的MPC(模型预测控制)策略。

研究亮点
1. 方法创新:首次将设定值迭代学习引入ILC框架,结合IDL技术实现完全数据驱动。
2. 理论突破:放宽了对初始条件严格一致性的要求(假设5),仅需有界即可保证收敛。
3. 工程普适性:案例覆盖数值仿真与物理系统,验证了算法在复杂环境中的稳定性。

其他价值
- 提出的双重动态线性化方法(IDL)可扩展至其他非线性控制系统设计。
- 开源代码与仿真参数(如( k_p=0.25 ), ( \alpha=1.5 ))为后续研究提供基准。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com