基于迭代学习控制的空间路径跟踪方法

分享自：
基于迭代学习控制的空间路径跟踪方法

期刊:2016 IEEE 55th Conference on Decision and Control (CDC)
基于迭代学习控制的空间路径跟踪：一项新型控制方法的研究报告
一、 研究作者、机构与发表信息
本研究由Yiyang Chen, Bing Chu 和 Christopher T. Freeman共同完成。他们均隶属于英国南安普顿大学电子与计算机科学系（Department of Electronics and Computer Science, University of Southampton, Southampton, SO17 1BJ, United Kingdom）。该项研究成果以论文形式发表，并于2016年12月12日至14日在美国拉斯维加斯举行的第55届IEEE决策与控制会议（2016 IEEE 55th Conference on Decision and Control, CDC）上宣读，并收录于该会议的论文集中。
二、 学术背景与研究目的
本研究属于自动控制领域，具体聚焦于迭代学习控制（Iterative Learning Control, ILC）这一高性能控制方法。ILC的核心思想是针对一个在有限时间区间内重复执行相同任务的系统，利用先前试验（trials）的数据来更新输入信号，从而逐步提升系统的跟踪性能。传统ILC通常要求系统输出精确跟踪一个预先定义好时间轨迹的参考信号，即同时规定了空间路径和时间进度。
然而，在焊接、机械加工、激光切割、机器人制造乃至康复训练等大量实际工业任务中，通常只对执行器末端需要遵循的空间路径有严格要求，而对沿该路径运动的时间进度（即何时到达路径上的哪一点）并无先验规定。这种控制问题被称为“空间ILC”（Spatial ILC）。已有的研究虽然针对特定机械应用（如开关磁阻电机、非线性旋转系统等）探索了空间跟踪，但尚未提出一个通用、系统的算法框架和性能分析体系。这限制了该方法的潜力，使其无法更广泛地解决诸如降低工业能耗、避免机器损伤、提高制造效率等具有显著实际效益的问题。
因此，本研究旨在填补这一空白。其主要目标在于：1）为空间路径跟踪问题提供一个严格、通用的定义；2）针对分段线性路径（Piecewise Linear Paths）这一重要子类，将该问题转化为一个包含空间跟踪约束和时间“经由点”（via-point）约束的约束优化问题；3）提出一个实用的两阶段设计框架及相应的迭代算法来解决此优化问题，该算法需具备对模型不确定性的鲁棒性；4）通过三轴龙门机器人实验平台验证所提方法的有效性和实用性。研究的核心优化目标是在保证精确空间路径跟踪的前提下，最小化控制输入的能量消耗。
三、 详细研究流程与方法
本研究的工作流程主要分为理论框架构建、算法设计以及实验验证三个核心部分。
第一部分：问题定义与理论框架构建 首先，研究考虑了多输入多输出的线性时不变系统，并在状态空间和算子理论框架下对其进行了描述。随后，论文对一般性的空间路径跟踪问题进行了形式化定义：给定一个由连续函数f定义的输出空间路径，要求系统输出跟随该路径，但对沿路径运动的时间没有规定。由于时间自由度无限，解不唯一，因此引入了一个额外的目标函数（本文中为输入能量）进行最小化，从而将问题表述为一个具有无限多等价路径的优化问题。
为了利用ILC工具求解，研究将问题聚焦于分段线性路径。这类路径由一系列顶点（vertices）和连接它们的直线段构成。研究提出了一个关键见解：对于分段线性路径，如果要求按顺序完成各线段（即完成第i段后才开始第i+1段），那么精确的空间路径跟踪要求可以等价转化为一组混合约束：1）在由未知时间点 λ = [t̂1, …, t̂m-1]⊤ 划分的每个时间子区间内，系统输出必须位于对应的直线段上（通过投影矩阵Pi施加的约束）；2）在每个时间点 t̂i，系统输出必须精确到达对应的顶点ri。这一转化（论文中的定理1）是核心贡献之一，它将原本无限维的路径跟踪约束，简化为了包含有限维时间点变量和分段投影输出约束的混合约束优化问题。
第二部分：两阶段设计框架与迭代算法实现 针对上述优化问题（同时优化输入信号u和时间分配λ），研究扩展了作者先前在点对点ILC工作中的思路，提出了一个两阶段设计框架。 * 第一阶段（固定时间分配）：假设时间分配λ固定，求解一个经典的约束优化问题：在满足由λ决定的输出约束（顶点到达约束和线段投影约束）的前提下，寻找最小化输入能量‖u‖²的输入信号u∞(λ)。这是一个标准的ILC跟踪问题，但带有中间点和子区间跟踪约束。论文证明，若系统是状态可控的，则可以使用范数最优ILC（Norm Optimal ILC） 算法（论文中定理2给出的算法(23)式）迭代求解此问题。该算法通过前一次试验的跟踪误差来更新下一次试验的输入，并最终收敛到给定λ下的最优输入u∞(λ)。 * 第二阶段（优化时间分配）：将第一阶段得到的最优输入u∞(λ)代入目标函数，得到仅关于时间分配λ的函数h̃(λ)。然后，通过优化λ来最小化h̃(λ)。由于h̃(λ)没有解析表达式，论文提出使用梯度投影法（Gradient Projection Method） 进行迭代求解（定理3）。梯度信息可以通过对λ进行微小扰动（±Δt），并分别运行第一阶段算法来估计（见Remark 1）。初始时间分配λ0可以任意选择，也可以通过网格搜索获得一个低分辨率的近似最优解作为起点（Remark 2）。
将这两个阶段结合，便形成了算法1：一个集成的、可在实验中实施的迭代流程。该算法交替进行：1）用范数最优ILC（基于实验数据）为当前时间分配λj寻找最优输入u(λj)并记录其能量h̃(λj)；2）用梯度投影法（利用u(λj)计算梯度）更新λj得到λj+1。此过程循环直至能量收敛。算法的关键优势在于，即使系统模型不精确，它也能利用实验数据直接进行优化，从而嵌入了对模型不确定性的鲁棒性。
第三部分：实验平台与验证方案 研究选择了一个三轴龙门机器人作为实验验证平台。研究对象是该机器人的X轴和Z轴（m=2输出），要求其末端执行器在二维平面内跟踪一个由5个线段（m=5）组成的星形路径（顶点坐标由(30)式给出）。总任务时间固定为T=2秒，但四个中间顶点（r1到r4）的到达时间t̂1到t̂4是需要优化的变量。
实验分为两种情景进行，以全面评估算法性能： 1. 模型不准确的情况：假设仅能获得一个非常粗略的近似模型（两个轴均简化为0.04/s的积分器）。在此情况下，应用所提算法（参数：q/r=10,000，q̂/r=10,000,000，梯度步长γj=0.03），从初始时间分配λ0=[0.4,0.8,1.2,1.6]⊤开始，运行30次循环（loops）。 2. 模型准确的情况：使用通过频响测试辨识得到的更精确的高阶传递函数模型（见(32)式）进行算法设计和对比。应用算法（梯度步长γj=0.06）运行20次循环。
在每种情景下，研究记录了每次循环后得到的最小输入能量h̃(λj)和最优时间分配λj的演变过程，并将最终结果（λopt及其对应的输入能量）与基于（可能不准确的）模型仿真得到的理论最优解λ*进行对比。同时，还绘制了初始分配λ0和最终优化分配λopt下的输入电压轨迹和实际输出空间轨迹，以直观展示跟踪性能和能量消耗的变化。
四、 主要研究结果与分析
实验结果表明，所提出的算法在不同模型精度下均能有效工作，并显著降低了控制输入能量。
在模型不准确的鲁棒性测试中（图3，图4），算法经过约30次循环后收敛。最终得到的最优时间分配λopt = [0.48, 0.66, 1.30, 1.64]⊤，对应的最小输入能量为92.36（单位取决于权重）。值得注意的是，基于不准确模型仿真得到的“理论”最优分配λ* = [0.41,0.79,1.21,1.59]⊤及其预测能量100.5。实际算法找到的λopt不仅与之不同，而且实现了更低的能量消耗（降低了约8.09%）。这清晰地证明了所提算法能够利用实验数据超越不准确模型的局限，找到真正适合实际物理系统的最优时间分配。图5显示，优化后的输入信号（最终输入）幅值总体上比初始分配的输入信号更小、更平滑。图6的空间轨迹对比表明，尽管X轴由于机械静摩擦在转折段存在一些跟踪误差，但Z轴能精确跟踪顶点，整体路径跟踪得以保持。
在模型准确的测试中（图7，图8），算法收敛更快，约在10次循环内趋于稳定。最终得到的最优时间分配λopt = [0.49,0.67,1.33,1.51]⊤，与基于精确模型仿真得到的理论最优λ* = [0.49,0.67,1.33,1.51]⊤完全一致。对应的实验最小输入能量为83.39，与理论预测值83.54几乎吻合（微小差异源于未建模动态和扰动）。与初始分配λ0下的能量97.26相比，能量降低了约14.25%。图9和图10再次验证了输入能量的减少和空间路径跟踪的准确性。
这些结果之间存在清晰的逻辑关系：首先，理论部分成功地将空间跟踪问题转化为可处理的优化问题（定理1）。接着，两阶段框架（定理2和定理3）提供了可行的求解途径。最终的实验结果表明，算法1这一具体实现不仅能在理论上求解该问题，更能在实践中有效运行，即使在模型存在显著不确定性时，也能通过实验数据驱动的方式找到降低能耗的最优时间分配，从而验证了整个理论框架和算法的有效性与鲁棒性。实验结果直接支撑了论文的结论：所提方法能够在不指定时间信息的前提下实现精确空间路径跟踪，并显著降低控制能量。
五、 研究结论与价值
本研究成功提出并验证了一个用于空间路径跟踪问题的通用ILC设计框架。主要结论是：通过将空间跟踪问题重新表述为包含输出约束和时间经由点约束的优化问题，并采用一个结合了范数最优ILC和梯度更新的两阶段迭代算法，可以在保证精确路径跟踪的同时，有效优化如输入能量等性能指标。
该研究的科学价值在于：1）为“空间ILC”这一非传统ILC问题提供了一个严谨的数学定义和通用的公式化表述；2）提出了一种创新的、将空间约束转化为混合时空约束的解决思路；3）设计了一个具有理论保证（收敛性）且易于实现的迭代算法框架。
其应用价值非常显著：该方法使控制系统在完成如切割、焊接、涂胶等路径跟踪任务时，不再需要人为指定运动的时间律，系统可以自动寻找能耗最低（或优化其他指标）的运动节奏。这有助于降低工业能耗、减少机械磨损、提高生产效率。实验在龙门机器人上的成功验证，预示了其在各类高精度工业机器人、数控机床等领域的应用潜力。
六、 研究亮点
问题定义新颖：明确区分了空间路径跟踪与时间轨迹跟踪，抓住了许多实际应用的核心需求，将ILC的应用范围拓展到了一个新的方向。
理论转化巧妙：将无限维的空间路径约束等价转化为有限维时间点约束加分段线性投影约束，这是将复杂问题纳入经典优化和ILC框架求解的关键一步。
算法框架鲁棒实用：提出的两阶段迭代算法（算法1）紧密结合了ILC的在线学习能力和优化理论的梯度搜索。其最大亮点在于利用实验数据驱动优化过程，从而天然地具备了应对模型误差和不确定性的鲁棒性，这对于实际工程应用至关重要。
实验验证充分：研究不仅提供了理论推导，还通过精心设计的对比实验（有/无精确模型），全面验证了算法的有效性、优化性能以及对模型不确定性的鲁棒性，增强了研究的说服力。
七、 其他有价值的内容
论文在讨论部分也指出了当前方法的局限和未来研究方向。例如，文中提到的跟踪约束允许输出在直线段上存在“超调”（overshoot），即实际路径可能会短暂偏离线段（只要满足投影约束）。作者指出，未来将通过添加硬约束来解决此问题。此外，理论框架可扩展至其他类型的空间路径和优化指标，这也是未来的研究重点。这些讨论显示了作者对研究问题有深入的思考和完善的计划。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问