本文由IEEE院士Jian-Xin Xu教授(新加坡国立大学电气与计算机工程系)和沈栋教授(中国人民大学数学学院,原北京化工大学)合作完成,发表于2020年3月的《IEEE Transactions on Automatic Control》第65卷第3期(1280-1287页)。研究获得国家自然科学基金(61673045、61304085)、北京市自然科学基金(4152040)和国家留学基金委(201506885019)资助。
这项研究属于控制理论领域的随机系统迭代学习控制(Iterative Learning Control, ILC)方向。迭代学习控制是一种通过在迭代轴上不断修正输入信号来提升跟踪性能的智能控制方法。近三十年来,ILC已被成功应用于机器人、制造装备等重复性作业系统。然而,当系统存在随机噪声(如机械振动、测量误差)时,传统ILC算法的性能会显著下降。
针对随机系统的ILC设计存在两个核心挑战:一是传统随机逼近(Stochastic Approximation, SA)类ILC算法收敛速度慢,因其需要预设递减的学习增益序列;二是卡尔曼滤波等方法虽能处理随机噪声,但依赖精确的系统矩阵和噪声统计特性,实际应用受限。本研究的目标是开发一种数据驱动的增益自适应机制,使算法在噪声主导阶段自动启动SA机制,在跟踪误差主导阶段保持恒定增益以加速收敛。
研究考虑离散时间随机系统:
xk(t+1) = Atxk(t) + Btuk(t) + wk(t) yk(t) = Ctxk(t) + vk(t) 其中wk(t)和vk(t)分别为系统噪声和测量噪声。通过引入升降维表示将系统转化为向量形式,定义跟踪误差ek=yd-yk=Hδuk-ξk,其中H为下三角块矩阵,ξk为噪声的累积效应。
核心创新是提出增益调节参数:
sk = sk-1 + 1[e_k^T e_{k-1} <0] (k≥2) 其中1[·]为指示函数。该参数通过监测相邻迭代误差向量的内积符号变化,智能识别噪声主导状态。基于此,构建新型ILC算法:
uk+1 = uk + s_k^{-1}Lek 其中学习增益矩阵L分为两种设计: 1. 非因果形式:L=(1-γ)(H^T H)^{-1}H^T,保证Q=I-LH满足ρ(Q) 2. 块对角形式:L=σL0(σ为足够小的正数),实现时间维度分解
研究通过严格数学证明给出两个关键定理: - 定理1(无噪声系统):当L满足Q=I-LH拟正定时,算法退化为经典P型ILC,误差呈指数收敛,且sk≡1。 - 定理2(随机系统):若LH特征值为正实数,则输入误差δuk几乎必然收敛于0,且sk/k→P(ξ_1^T ξ_2)。
特别地,当噪声对称分布时,由推论1可得sk/k→1/2,此时算法与SA-based ILC(ak=1/k)具有相似形式,但前期收敛速度更快。
以永磁同步电机MIMO模型为例进行仿真: - 被控对象:两轴电流跟踪0.5sin(2πt/T)和1.5sin(2πt/T) - 噪声设置:τ=0,0.01,0.05,0.3四种水平 - 对比算法:SA-based ILC(ak=1/k)、KF算法[5]
实验结果验证: 1. 无噪声时(τ=0),新算法与P型ILC完全等效,误差指数收敛 2. 噪声存在时,sk/k趋近理论值0.5,且噪声越大趋近越快 3. 在τ=0.01/0.05时,新算法收敛速度显著快于SA和KF方法 4. 时变噪声场景(τ从0.1→0.05→0.01)下,算法表现出优越的适应能力
该方法特别适合具有以下特征的工业控制系统: - 重复运行过程(如晶圆加工、机器人轨迹跟踪) - 存在不可测随机扰动 - 系统模型信息不完整 - 对收敛速度有较高要求
作者指出未来可沿三个方向拓展: 1. 建立基于噪声主导事件的触发机制 2. 研究最优增益调节策略(如结合LMI优化) 3. 拓展到非对称噪声分布和马尔可夫跳变系统
这项工作为随机系统的学习控制提供了新的方法论工具,其核心思想——通过数据驱动方式识别系统状态并自适应调整学习策略——对更广泛的智能控制研究具有启发意义。特别值得关注的是,算法在永磁同步电机控制中展现的快速适应能力,显示了其在智能制造、精密机电系统等领域的应用潜力。