基于迭代学习控制的机器人空间路径跟踪:一种最小化能量消耗的新方法
作者与发表信息 本文作者为 Yiyang Chen, Bing Chu 和 Christopher T. Freeman,均来自英国南安普顿大学电子与计算机科学系。该研究发表于2016年12月在美国拉斯维加斯举行的第55届IEEE决策与控制会议(IEEE 55th Conference on Decision and Control, CDC)的会议论文集上。
研究背景 本研究的核心科学领域是迭代学习控制。迭代学习控制是一种高性能控制方法,旨在通过重复执行同一有限时间任务,并利用先前试验的数据更新输入信号,从而显著提升系统的跟踪性能。其特点是每个试验周期结束后系统状态会重置,理论上可以实现跟踪误差在经过足够多次迭代后收敛至零,因此在机器人、化工批次处理、伺服系统等需要高精度重复操作的工业领域有广泛应用。
然而,在大量的自动化任务中,如焊接、加工、激光切割、机器人制造甚至康复训练,对末端执行器的要求通常是在空间中精确跟踪一条给定的路径,但并未对沿该路径运动的时间轨迹(即“何时”到达路径上的“何点”)做任何预先规定。这类问题被称为空间迭代学习控制问题。与传统的、要求同时跟踪空间路径和时间轨迹(即“点对点”跟踪)的ILC相比,空间ILC不预先指定时间信息,这为优化其他性能指标(如能耗、平滑性)提供了额外的自由度。已有研究表明,这种自由度可以带来显著的实际效益,例如更平滑的运动和更低的控制能耗。然而,在本文研究之前,缺乏一个通用、系统性的算法框架来解决此类空间跟踪问题,并对其性能进行分析,这限制了该方法的潜力,例如在减少工业能耗、避免机器损伤和提高制造效率等方面的应用。
因此,本研究旨在填补这一空白。其目标是:提出一个通用的空间路径跟踪问题定义,并将其转化为一个包含空间跟踪约束和时间“途经点”约束的优化问题。进而,设计一个两阶段的迭代学习控制算法框架,在保证路径跟踪精度的同时,最小化一个额外的目标函数(本研究聚焦于输入能量),并验证该框架在存在模型不确定性时的鲁棒性和实际有效性。
研究方法与流程 本研究主要包括理论框架构建、算法设计及实验验证三个核心部分,具体流程如下:
1. 问题定义与数学建模 首先,研究考虑了一个多输入多输出的线性时不变系统。研究将广义的空间路径跟踪问题形式化为一个优化问题:在系统输出必须严格跟踪一条由连续函数定义的空间路径(但允许路径参数化时间任意变化)的约束下,最小化一个关于输入的成本函数(如输入能量)。为了利用ILC工具求解,研究将问题聚焦于分段线性路径这一重要且常见的路径类别。
通过引入“排序约束”(即要求机器按顺序完成路径的各个线段,不允许跳跃),研究证明了跟踪一条分段线性路径的问题,可以等价地转化为跟踪一组空间约束(在每一时间段内,输出必须位于由投影矩阵定义的超平面上)和一组时间点约束(在特定时间点,输出必须精确到达路径的顶点)。这个转化是关键的一步,它将一个无限维的、与时间参数化耦合的复杂问题,简化为了一个包含有限个时间决策变量和线性约束的优化问题。
2. 两阶段设计框架与算法实现 为了解决上述优化问题,研究扩展了作者之前关于“点对点”ILC的工作,提出了一个两阶段设计框架。 * 第一阶段(固定时间分配下的最优输入求解):假设路径顶点之间的时间分配(即何时到达每个拐点)是固定的。在此条件下,问题退化为一个标准的、带有中间点及子区间跟踪约束的ILC跟踪问题,同时要求最小化输入能量。研究证明,对于一个状态可控的系统,可以使用范数最优迭代学习控制算法迭代求解此问题。该算法能够利用每次实验的误差数据,更新输入信号,最终收敛到满足所有跟踪约束且能量最小的最优输入。文中给出了该算法及其伴随算子的具体形式。 * 第二阶段(最优时间分配求解):将第一阶段得到的最优输入视为时间分配变量的函数,然后将其代入成本函数(输入能量)。第二阶段的目标就是优化这些时间分配变量,以找到使总输入能量全局最小的最优时间分配。由于成本函数关于时间分配变量的解析表达式通常难以获得,研究提出采用梯度投影法进行迭代求解。梯度信息可以通过微扰时间分配并重新运行第一阶段(或通过仿真)来数值估计。该框架保证了在适当步长下,每次迭代都能降低总成本。
研究将这两个阶段整合为一个实用的迭代算法(算法1)。该算法交替进行:1)在给定的时间分配下,运行NO-ILC直至跟踪误差满足要求,记录最终输入能量;2)基于当前输入信号,利用梯度信息更新时间分配。此过程循环直至时间分配收敛。算法的关键优势在于,它主要依赖实验数据(第一阶段必须实验运行),而非精确的数学模型,从而嵌入了对模型不确定性的鲁棒性。
3. 实验验证 为了验证所提框架和算法的有效性,研究在一个三轴龙门机器人实验平台上进行了实物测试。实验目标是用X轴和Z轴控制末端执行器在平面上跟踪一条由5个线段组成的空间路径。研究设置了两种场景来全面评估算法性能:
在两种场景下,研究都将算法优化得到的结果(最优时间分配λ_opt及对应的最小输入能量)与基于(不准确或准确的)模型仿真得到的理论最优解进行了对比。实验记录了每一轮迭代后的输入能量消耗和时间分配的变化,并绘制了优化前后的输入电压轨迹和空间输出轨迹。
主要研究结果 1. 理论框架构建成功:研究成功地将空间路径跟踪问题,特别是分段线性路径的跟踪,严格地表述为一个包含空间投影约束和时间点约束的优化问题(定理1),为后续算法设计奠定了坚实的数学基础。
2. 两阶段算法有效收敛:实验结果表明,所提出的两阶段迭代算法在两种模型条件下均能有效运行并收敛。 * 在模型不准确时:算法从初始分配出发,经过约30次迭代后收敛到一个稳定的时间分配(λ_opt = [0.48, 0.66, 1.30, 1.64]⊤秒)。此时实验测得的最小输入能量为92.36(单位),比基于不准确模型仿真得到的“理论最优”分配下的能耗(100.5)降低了约8.1%。这强有力地证明了算法不依赖于精确模型,能够通过实验数据自主找到更节能的实际操作方式,展现了良好的鲁棒性。 * 在模型较准确时:算法收敛更快(约20次迭代),最终得到的时间分配(λ_opt = [0.49, 0.67, 1.33, 1.51]⊤秒)与基于准确模型仿真得到的最优分配(λ* = [0.49, 0.67, 1.33, 1.51]⊤秒)几乎一致。对应的实验最小输入能量为83.39,与理论值83.54高度吻合,且相比初始时间分配下的能耗(97.26)降低了约14.3%。这验证了算法在模型信息充足时,能够逼近理论最优性能。
3. 跟踪性能得到保持:尽管算法以最小化输入能量为主要目标,并自由调整了时间分配,但从输出的空间轨迹图(图6和图10)可以看出,机器人的末端执行器始终精确地跟踪了给定的空间路径,并准确通过了所有指定顶点。在X轴由于机械静摩擦导致过渡段跟踪略有偏差的情况下,整体路径跟踪任务仍被成功完成,表明算法在优化能耗的同时并未牺牲核心的路径跟踪精度。
4. 输入能量显著降低:两种场景下的实验结果都清晰表明,通过优化沿路径运动的时间分配,可以显著降低执行相同空间任务所需的控制能量。输入电压轨迹图(图5和图9)显示,优化后的输入信号幅值普遍减小,变化更为平缓,这直接对应着更低的能耗和可能更低的执行器磨损。
研究结论与价值 本研究成功提出并验证了一个用于解决空间路径跟踪问题的通用迭代学习控制框架。主要结论与价值如下:
研究亮点 1. 问题定义新颖:明确区分了空间路径跟踪与传统时空轨迹跟踪,抓住了许多工业应用的本质需求,并给出了严谨的数学定义。 2. 解决方案巧妙:通过引入“排序约束”和投影矩阵,将复杂的空间跟踪问题转化为ILC可处理的混合约束优化问题,构思巧妙。 3. 算法鲁棒性强:提出的两阶段算法不依赖于精确的数学模型,其性能通过实验数据来保证和优化,这对工程应用至关重要。 4. 实验验证充分:通过在真实机器人平台上进行“模型不准”和“模型较准”的对比实验,全面评估了算法的鲁棒性和最优性,增强了结果的说服力。 5. 节能效果显著:实验数据明确显示了超过8%(模型不准)和14%(模型较准)的能耗降低,直观展示了该研究的经济效益潜力。
其他有价值内容 文中还简要讨论了算法的初始化策略(如可采用网格搜索获得低分辨率初始分配以加速收敛),并指出了未来研究的几个方向:对算法鲁棒性进行严格的理论分析、在约束中添加对超调的硬限制以防止路径跟踪中的过冲现象、将框架拓展至其他类型路径和其他性能指标等。这些都为该领域的后续研究提供了清晰的路线图。