主要作者及机构:本论文由University of Southampton电子与计算机科学学院的Bing Chu和Paolo Rapisarda共同完成,发表于2023年12月IEEE第62届决策与控制会议(CDC)。
本论文属于控制系统领域的创新研究,聚焦于迭代学习控制(Iterative Learning Control,ILC)技术。在工业自动化应用中,如机器人装配线上机械臂重复执行相同任务时,ILC技术能通过历史执行数据学习优化控制策略,从而提高跟踪精度。传统ILC设计方法大多依赖于显式或隐式的系统模型识别,面临着参数调优困难、性能受限和收敛性难以保证等问题。
研究团队针对连续时间系统,开发了完全基于数据驱动的控制框架,创新性地采用Chebyshev多项式正交基(Chebyshev Polynomial Orthogonal Bases,COPBs)进行系统表征。该工作的核心目标是:不通过任何模型识别过程,直接利用足够丰富的输入输出数据来实现范数最优迭代学习控制(Norm-Optimal ILC,NOILC),同时保证跟踪误差范数的单调收敛特性。
研究首先建立COPBs与连续时间系统行为之间的数学对应关系。通过定理1证明了:当输入信号满足l>ℓ+n阶持续激励条件时(其中ℓ是系统滞后阶数,n是系统阶数),一组足够丰富的输入输出数据的COPBs系数可以完整表征所有系统轨迹。这项工作实质上是将文献[3]中的”基本引理”扩展到连续时间系统,形成数据驱动控制的理论基础。
研究团队提出了一种基于COPBs的数据驱动NOILC算法,其主要流程包括: 1. 输入输出表征:将连续时间信号投影到COPBs空间,利用式(6)将信号表示为无限维系数矩阵。通过式(12)的微分矩阵D,系统微分方程被转化为COPBs系数空间的线性代数运算。
优化问题重构:将传统NOILC问题(2)转化为COPBs系数空间的二次优化问题(23)。该转换的关键在于利用定理1的结果,通过式(21)表示所有可能的系统轨迹,避免了显式系统模型的使用。
数值实现:通过引理1-3建立的Chebyshev多项式积分性质,将无限维优化问题转化为有限维可计算问题。特别地,式(25)定义的H矩阵确保了二次型目标函数(26)的正定性。
研究者以一个简单动态系统为例进行数值仿真: - 系统模型:ẋ = -x + u,y = x,运行区间[-1,1] - 参考轨迹:r(t) = sin(π(t+1)/2) - 初始输入:u₀ = 0 - 权重矩阵:Q = I,R取0.1至0.00625不同值
通过构建持续激励输入u(t) = -3e⁻⁴ᵗ -2e⁻³ᵗ -e⁻²ᵗ及对应输出数据,按照式(20)构造Wₗ矩阵并计算基础矩阵[Vᵤ;Vᵧ],最终求解优化问题(27)。
理论证明:严格证明了数据驱动NOILC算法保持了模型基于NOILC的所有收敛特性(命题2):
数值实验结果:
计算效率优势:
本研究建立了连续时间系统数据驱动ILC的完整框架,具有双重理论创新:
科学价值: 1. 扩展了数据驱动控制理论在连续时间系统中的应用 2. 发展了基于COPBs的系统行为表征新方法 3. 证明了非模型方法与模型方法在收敛性上的等价性
应用价值: 1. 消除了传统ILC对精确模型的依赖,降低实现门槛 2. COPBs表示具有优秀的数值性质和收敛速率 3. 为实际工程系统提供可靠的数据驱动控制方案
方法论创新:首次将COPBs引入数据驱动ILC设计,实现了模型无关的连续时间系统控制。
理论完整性:从基本引理到算法设计再到收敛性证明,形成了完整的理论体系。
工程友好性:
可扩展框架:论文指出该方法可扩展到非线性系统、带约束系统等更复杂场景,为后续研究指明方向。
研究者还讨论了多项延伸方向: 1. 系统约束的处理方法 2. 噪声和扰动情况下的鲁棒性设计 3. 点对点跟踪(point-to-point tracking)问题的扩展应用 4. 其他基函数(如Legendre多项式)的适用性比较
这些开放问题为进一步研究提供了丰富的可能性。总体而言,这项工作代表了数据驱动控制领域的重要进展,为连续时间系统的智能控制提供了新的理论工具和实践方法。