本文旨在介绍一种用于实现工业混合机器人精确动态前馈控制的迭代学习方法,该研究由清华大学机械工程系摩擦学国家重点实验室与制造工程研究所的吴军、张彬彬、王立平、于广等人完成,发表于《中国科学:技术科学》(SCIENCE CHINA Technological Sciences)2021年6月第64卷第6期。本研究针对工业机器人动态控制中模型不精确导致性能受限的核心难题,提出了一种创新的离线迭代学习框架,为未开放的工业控制系统应用先进学习算法开辟了有效路径。
研究背景 作为串联机器人的补充,并联机器人具备高加速度、高刚度重量比和低成本等优势,但工作空间较小。结合了串联与并联结构优点的混合机器人(Hybrid robot)因此在机床、拾放操作、行走机器人等领域得到日益广泛的应用。然而,混合机器人属于强耦合、非线性机构,其动力学特性随机器人在大工作空间内的位姿变化而变化,这使得在全工作空间内保证其高运动性能变得困难。因此,在控制系统设计中考虑机器人动力学至关重要。
基于模型的动态前馈控制(Feedforward control)结合反馈控制是一种广泛使用且能有效提高多自由度系统运动精度的控制方法。然而,在工业应用中,由于复杂工作环境中存在大量不确定性,难以获得机器人的高精度动态模型,同时控制系统模型也难以精确辨识。即使采用系统辨识技术,模型的不准确性仍会导致所设计的前馈控制参数并非最优,从而严重限制了系统性能的进一步提升。
迭代学习控制(Iterative Learning Control, ILC)作为一种典型的学习方法,能够有效改善不确定动态系统的瞬态响应和跟踪性能,其优点在于无需建立精确的机器人动力学模型。然而,典型的工业伺服系统通常不具备ILC功能,因此无法直接在机器人上实现在线迭代学习。结合基于动态模型的前馈控制与ILC两者的优势,利用基函数来反映动态行为,并运用ILC算法来设计控制参数,成为一种理想的解决思路。本研究正是基于此,提出了一种在工业环境下实现精确动态前馈控制的迭代学习方法。
研究详细工作流程 本研究的工作流程主要包含三个核心部分:基于标准动态模型的完整前馈控制器设计、迭代学习方程的建立与加速策略、以及在工业机器人原型上的实验验证。整个方法通过一个后处理程序离线实现,以适应未开放的工业控制系统。
第一部分:动态模型分析与前馈控制器设计 首先,研究团队为图1所示的混合机器人建立了基于拉格朗日方程的动态模型,并将其等效转化为紧凑形式。模型考虑了惯性力、科里奥利力与离心力(通过赫斯矩阵表示)、重力项以及由库仑摩擦和粘性摩擦组成的摩擦力。该模型可进一步重写为与加速度、速度、位置及常数项相关的线性组合形式。为了便于工业应用,研究将机器人视为线性系统,通过取整个工作空间或给定轨迹上相关矩阵的平均值来获得近似的线性动态模型。
在控制架构方面,研究针对图2所示的典型工业单关节控制系统进行分析。该系统包括控制对象、反馈控制器、前馈控制器以及迭代学习控制器。由于工业控制系统未开放,ILC无法直接在线实现。因此,如图3所示,迭代学习通过后处理程序离线进行:收集并存储运动误差信号,基于误差信号和迭代方程计算新的前馈控制器参数,离线更新至控制系统,然后控制机器人运动产生新误差,如此循环迭代直至误差最小。
为了补偿动态效应,基于标准动态模型,研究设计了一个完整的前馈控制器。如图4所示,针对一个n自由度机器人,其动态模型和前馈控制器被分解为n+1个部分,分别对应n个主动关节的耦合效应补偿和一个恒定的外部负载补偿。通过理论推导(公式4至公式12),研究证明了当前馈控制器参数满足特定形式时,可以完全抵消外部动态负载扰动,理论上将控制误差降为零。该前馈补偿包含了恒值补偿信号、低阶补偿信号和高阶补偿信号,构成一个完整的补偿体系。
第二部分:迭代学习方法与加速策略 在理想情况下,通过模型计算的前馈参数可以实现完美补偿。但实际上,由于模型不精确和系统未建模动态的存在,直接计算难以达到最优性能。因此,研究引入了迭代学习方法来逐步更新和优化前馈参数。
研究团队建立了迭代学习方程。通过分析第k次试验的运动误差信号,并进行拉普拉斯逆变换和泰勒一阶展开,得到了误差关于前馈参数向量的表达式及其雅可比矩阵。基于摩尔-彭罗斯逆(Moore-Penrose inverse),推导出了参数更新的递归方程(公式18)。为了解决方程数少于待辨识参数数的问题,研究通过让机器人在不同位姿下运动并收集一组时间序列上的误差信号,组合成超定方程,并利用最小二乘法获得最优辨识参数。
为了提高迭代效率并应对系统非线性,研究采用了PID学习率(PID learning rate)来优化迭代速度(公式21)。在学习过程中,可以根据迭代结果调整比例(Kp)、积分(Ki)和微分(Kd)学习增益矩阵。例如,在迭代初期误差信号信噪比较高时,可采用PD或P学习律加快收敛;在迭代后期误差减小、信噪比降低时,可采用PI学习律以提高迭代精度和鲁棒性。
图5总结了完整的迭代策略流程,包括:1) 准备:根据动态模型和经验手动设置初始前馈参数和学习参数;2) 信号收集:控制机器人沿典型轨迹运动,采集各关节误差信号;3) 迭代:根据迭代方程更新前馈参数;4) 参数更新:将新参数更新至控制系统;5) 重复信号收集:机器人重复运动,收集新误差;6) 提升迭代速度:根据新旧误差比较调整学习参数Kp,Ki,Kd;7) 误差分析:若误差均方根值不再减小甚至增加,则停止迭代,否则返回步骤3。
第三部分:实验验证 为了验证所提方法的可行性与有效性,研究在一台由清华大学与江苏长虹智能装备有限公司联合研制的5自由度(5-DOF)工业混合喷涂机器人(图6)原型上进行了实验。机器人采用Delta Tau公司的Turbo UMAC控制器,编码器分辨率为每转2500线。
首先,基于机器人的运动学模型(公式22,23)和已有的动力学模型(公式24),规划了一条如图8所示的复杂喷涂轨迹。该轨迹持续40秒,涵盖了机器人大部分工作空间和所有工作状态(图9展示了初始就位、侧躺、直立等不同姿态),确保了优化的全局性。
实验中,控制系统的前馈部分采用了工业中常见的简化形式(图7),主要包括加速度前馈(Kaff)、速度前馈(Kvff)和恒值前馈(Ktff)参数。初始参数基于动力学模型和工程经验设定。随后,严格遵循图5的迭代流程对前馈参数进行优化学习。
主要结果 迭代学习过程取得了显著效果。从图10可以看出,随着试验次数增加,加速度前馈参数(Kaff)和恒值前馈参数(Ktff)迅速收敛至稳定值,而速度前馈参数(Kvff)变化很小。这一现象通过理论分析得到了解释(公式25-30):速度前馈参数主要与控制系统内部的传递函数(比例增益Kp、微分增益Kd和缩放系数Ktr)相关,而与外部机器人动力学特性关系不大。因此,经验调参法在机器人静止状态下即可较准确地设定速度前馈参数。然而,加速度和恒值前馈参数与机器人动态特性(如惯性力、重力、摩擦)强相关,传统方法难以在全工作空间内精确设定。迭代学习正是有效优化了这两类参数。
参数优化的直接结果是机器人跟踪性能的大幅提升。图11显示了各主动关节的跟踪误差均方根值随着迭代次数的增加而显著下降。更为直观的是,通过运动学正解得到的机器人末端喷枪轨迹跟踪误差(图12)显示:经过10次迭代后,平均位置误差从0.18毫米降至0.06毫米,减少了约66%。这有力地证明了所提出的迭代学习方法能够有效补偿机器人未建模的动态不确定性,显著提高其伺服性能。
结论与价值 本研究提出并验证了一种用于工业混合机器人精确动态前馈控制的迭代学习方法。其核心贡献在于,在不改动未开放工业控制系统的前提下,通过离线后处理程序实现了迭代学习控制。该方法基于标准动力学模型设计了完整的前馈控制器结构,并推导了结合摩尔-彭罗斯逆和PID学习率的迭代更新策略,从而能够系统性地优化前馈参数。
本研究的科学价值在于为复杂非线性系统(混合机器人)在模型不精确和存在未建模动态条件下的高性能控制提供了一种有效的离线学习框架。其实用价值尤为突出:它使得在广泛使用的商用、封闭式工业机器人控制系统上应用先进的迭代学习算法成为可能,为工业现场实际控制性能的提升提供了极具操作性的解决方案。
研究亮点 1. 创新性方法:首次提出了一种专门针对“未开放工业控制系统”的离线迭代学习框架,解决了先进算法在工业现场落地应用的关键障碍。 2. 完整理论推导:从标准动力学模型出发,完整推导了前馈控制器结构及参数迭代更新方程,保证了方法的理论严谨性。 3. 显著的性能提升:在真实的5-DOF工业混合机器人上的实验表明,该方法能将末端轨迹平均跟踪误差降低约66%,效果显著。 4. 深入的现象分析:不仅展示了实验结果,还对实验中观察到的“速度前馈参数变化小”的现象进行了深入的理论分析,揭示了其内在原因,增强了研究的深度。
未来工作 由于商用控制系统未开放且无法更改,迭代学习目前只能通过离线后处理程序实现。研究团队指出,未来的工作将聚焦于提高该方法的迭代效率。