分享自:

连续时间系统的数据驱动迭代学习控制

期刊:2023 62nd IEEE Conference on Decision and Control (CDC)

针对连续时间系统的数据驱动迭代学习控制研究

主要作者及机构:本论文由University of Southampton电子与计算机科学学院的Bing Chu和Paolo Rapisarda共同完成,发表于2023年12月IEEE第62届决策与控制会议(CDC)。

学术背景

本论文属于控制系统领域的创新研究,聚焦于迭代学习控制(Iterative Learning Control,ILC)技术。在工业自动化应用中,如机器人装配线上机械臂重复执行相同任务时,ILC技术能通过历史执行数据学习优化控制策略,从而提高跟踪精度。传统ILC设计方法大多依赖于显式或隐式的系统模型识别,面临着参数调优困难、性能受限和收敛性难以保证等问题。

研究团队针对连续时间系统,开发了完全基于数据驱动的控制框架,创新性地采用Chebyshev多项式正交基(Chebyshev Polynomial Orthogonal Bases,COPBs)进行系统表征。该工作的核心目标是:不通过任何模型识别过程,直接利用足够丰富的输入输出数据来实现范数最优迭代学习控制(Norm-Optimal ILC,NOILC),同时保证跟踪误差范数的单调收敛特性。

研究流程与方法

理论基础构建阶段

研究首先建立COPBs与连续时间系统行为之间的数学对应关系。通过定理1证明了:当输入信号满足l>ℓ+n阶持续激励条件时(其中ℓ是系统滞后阶数,n是系统阶数),一组足够丰富的输入输出数据的COPBs系数可以完整表征所有系统轨迹。这项工作实质上是将文献[3]中的”基本引理”扩展到连续时间系统,形成数据驱动控制的理论基础。

算法开发阶段

研究团队提出了一种基于COPBs的数据驱动NOILC算法,其主要流程包括: 1. 输入输出表征:将连续时间信号投影到COPBs空间,利用式(6)将信号表示为无限维系数矩阵。通过式(12)的微分矩阵D,系统微分方程被转化为COPBs系数空间的线性代数运算。

  1. 优化问题重构:将传统NOILC问题(2)转化为COPBs系数空间的二次优化问题(23)。该转换的关键在于利用定理1的结果,通过式(21)表示所有可能的系统轨迹,避免了显式系统模型的使用。

  2. 数值实现:通过引理1-3建立的Chebyshev多项式积分性质,将无限维优化问题转化为有限维可计算问题。特别地,式(25)定义的H矩阵确保了二次型目标函数(26)的正定性。

实验验证阶段

研究者以一个简单动态系统为例进行数值仿真: - 系统模型:ẋ = -x + u,y = x,运行区间[-1,1] - 参考轨迹:r(t) = sin(π(t+1)/2) - 初始输入:u₀ = 0 - 权重矩阵:Q = I,R取0.1至0.00625不同值

通过构建持续激励输入u(t) = -3e⁻⁴ᵗ -2e⁻³ᵗ -e⁻²ᵗ及对应输出数据,按照式(20)构造Wₗ矩阵并计算基础矩阵[Vᵤ;Vᵧ],最终求解优化问题(27)。

主要研究成果

  1. 理论证明:严格证明了数据驱动NOILC算法保持了模型基于NOILC的所有收敛特性(命题2):

    • 跟踪误差范数单调收敛:∥eₖ₊₁∥Q ≤ ∥eₖ∥Q
    • 特定条件下可实现完美跟踪:lim eₖ = 0
    • 输入序列收敛到最优解
  2. 数值实验结果

    • 仿真显示随着迭代次数增加,跟踪误差范数确实呈现单调下降趋势(图1)
    • 较小的R值允许更大的输入变化,从而带来更快的误差收敛速度
    • 经过1000次迭代后,系统输出与参考轨迹几乎无法区分
  3. 计算效率优势

    • COPBs表示允许通过有限维截断实现任意精度近似
    • 微分运算转化为矩阵乘法,避免了数值微分方法
    • 投影导数与导数投影的误差可控且可计算

研究结论与价值

本研究建立了连续时间系统数据驱动ILC的完整框架,具有双重理论创新:

科学价值: 1. 扩展了数据驱动控制理论在连续时间系统中的应用 2. 发展了基于COPBs的系统行为表征新方法 3. 证明了非模型方法与模型方法在收敛性上的等价性

应用价值: 1. 消除了传统ILC对精确模型的依赖,降低实现门槛 2. COPBs表示具有优秀的数值性质和收敛速率 3. 为实际工程系统提供可靠的数据驱动控制方案

研究亮点

  1. 方法论创新:首次将COPBs引入数据驱动ILC设计,实现了模型无关的连续时间系统控制。

  2. 理论完整性:从基本引理到算法设计再到收敛性证明,形成了完整的理论体系。

  3. 工程友好性

    • 无需测量或数值近似导数信号
    • 微分运算转化为有限维线性代数运算
    • 截断误差有明确的数学界限
  4. 可扩展框架:论文指出该方法可扩展到非线性系统、带约束系统等更复杂场景,为后续研究指明方向。

其他有价值的內容

研究者还讨论了多项延伸方向: 1. 系统约束的处理方法 2. 噪声和扰动情况下的鲁棒性设计 3. 点对点跟踪(point-to-point tracking)问题的扩展应用 4. 其他基函数(如Legendre多项式)的适用性比较

这些开放问题为进一步研究提供了丰富的可能性。总体而言,这项工作代表了数据驱动控制领域的重要进展,为连续时间系统的智能控制提供了新的理论工具和实践方法。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com