分享自:

非严格重复系统未知控制增益的自适应迭代学习控制研究

期刊:international journal of robust and nonlinear controlDOI:10.1002/rnc.7996

本文档属于类型a(单个原创研究的学术论文报告)。以下为针对该研究的学术报告:


作者及机构
本研究的通讯作者为Xuefang Li(隶属中山大学深圳校区智能系统工程系及广东省火灾科学与智能应急技术重点实验室),合作作者包括Ruohan ShenShuyu Zhang(同属中山大学深圳校区)。研究成果发表于《International Journal of Robust and Nonlinear Control》,于2025年4月正式接受,资助来源于中国国家自然科学基金(62373385)、深圳市科技创新计划(202305063000008-2023a006, 20231121093427001)等多项科研项目。


学术背景
本研究属于自适应控制与迭代学习控制(Adaptive Iterative Learning Control, AILC)领域,聚焦非严格重复性非线性系统的跟踪控制问题。传统迭代学习控制(ILC)依赖系统严格重复性和已知控制增益的假设,但实际工程中(如机器人、自动驾驶),系统常面临迭代间初始状态变化、操作时长波动(iteration-varying trial lengths)及控制增益未知等挑战。此前研究多采用Nussbaum函数处理未知控制方向(UCD),但其算法复杂且缺乏普适性。本研究旨在提出一种新型AILC框架,通过自适应估计技术替代Nussbaum函数,解决非重复性系统在控制增益未知下的鲁棒性控制问题。


研究流程与方法
1. 问题建模与假设
- 系统模型:针对非线性系统(公式1)$$ \dot{x}_k(t) = \theta^T f(x_k,t) + B(x_k,t)\mathcal{S}{u_k(t)} $$,其中$B(x_k,t)$为未知控制增益,$\mathcal{S}{u_k(t)}$为饱和输入。
- 核心假设:包括初始状态有界非重复(Assumption 1)、操作时长随机波动(Assumption 2)、控制增益范数有界(Assumption 3)及系统BIBO稳定性(Assumption 4)。

  1. 控制增益不确定性转化

    • 将未知$B(x_k,t)$重构为范数有界不确定性(公式9):$$ |B_k(t)\mathcal{S}{u_k(t)} - \mathcal{S}{u_k(t)}| \leq \iota $$,通过自适应估计标量参数$\iota$替代矩阵增益的直接估计。
  2. 自适应迭代学习控制器设计

    • 核心算法(公式11-13):
      • 控制律$$ u_k(t) = -\left[ K\check{e}_k(t) + \frac{\hat{\zeta}_k(t)\phik^2(t)e{\varsigma k}(t)}{\eta_k + \phik(t)|e{\varsigma k}(t)|} + \frac{\hat{\iota}k(t)e{\varsigma k}(t)}{\etak + |e{\varsigma k}(t)|} \right] $$
      • 参数更新律采用分段更新策略,仅在$[0,L_k]$区间内迭代学习,解决操作时长波动问题。
    • 辅助系统(公式10):设计$$ \dot{\varsigma}_k(t) = -K\varsigma_k(t) + \Delta u_k(t) $$补偿输入饱和效应。
  3. 收敛性证明

    • 基于Lyapunov-like复合能量函数(CEF)(公式15)分析闭环系统稳定性,证明跟踪误差在有限迭代次数后收敛至有界域(定理1)。
  4. 仿真验证

    • 数值算例:针对具有时变控制增益的非线性系统(公式41-42),AILC在200次迭代后跟踪误差降低99.8%(图2-3)。
    • 自动驾驶应用:后轮驱动车辆路径跟踪任务中,算法处理了非重复操作长度和未知扰动(图7-8),最大误差减少96.4%。

主要结果与逻辑关联
- 算法性能:仿真显示所提AILC在控制增益未知时仍实现高精度跟踪(图4),且相比Nussbaum函数法收敛更快(图4对比曲线)。
- 理论贡献
- 无需控制增益先验知识:通过标量参数$\zeta$和$\iota$的自适应估计,避免矩阵求逆或Nussbaum函数的复杂性。
- 非重复性兼容:分段参数更新律与误差跟踪方法结合,同步处理初始状态偏移和操作时长波动。
- 数据支持:理论证明的收敛界(公式40)$$ \lim_{k\to\infty} \int_0^t e_k^T(s)e_k(s)ds \leq \frac{4L_d\omega_u^2}{2\rho-1} + 2L_d\xi_0 $$ 被仿真结果验证。


结论与价值
1. 科学价值
- 提出首个无需控制增益信息的非重复性系统AILC框架,扩展了自适应控制理论的适用范围。
- 为高维不确定性系统提供降维处理范式(将矩阵不确定性转化为标量估计)。

  1. 工程应用
    • 可直接应用于自动驾驶(如路径跟踪)、机器人(重复任务学习)等场景,尤其在系统建模不精确或控制增益时变的复杂环境中显著提升鲁棒性。

研究亮点
- 方法创新性:通过控制增益的范数有界重构,首次实现无需Nussbaum函数的UCD处理。
- 计算效率:标量化设计降低算法复杂度(对比文献[11-12]的Nussbaum函数法)。
- 多场景适应性:统一框架同时解决初始状态偏移、操作时长波动及输入饱和问题(图1框图)。


其他价值内容
- 开放性问题:未调整初始误差项$2L_d\xi_0$的局限性(Remark 2)为后续研究提供方向(如结合初始学习策略[27-28])。
- 扩展潜力:作者指出该框架可进一步结合事件触发控制(Remark 5)或输出反馈(Remark 5引用[29-30]),提升实时性。


全文通过理论创新与多场景验证,为非线性学习控制领域提供了兼具普适性与实用性的解决方案。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com