在IEEE Transactions on Automation Science and Engineering期刊2025年第22卷上,发表了一项针对机器人操作器在数据包丢失环境下控制问题的原创性研究,题为《*Intermittent Iterative Learning Control for Robot Manipulators under Packet Dropouts*》。该研究由来自中国南京工业大学、中国矿业大学、美国德州农工大学卡塔尔分校以及华东理工大学和成都大学等多所高校的研究者合作完成,通讯作者为南京工业大学的沈谋全。
本研究聚焦于自动化与控制科学领域,特别是机器人控制这一重要分支。随着工业自动化的深入,机器人操作器因其执行重复性任务的特性而被广泛应用。迭代学习控制(Iterative Learning Control, ILC)作为一种通过历史操作数据进行学习以提升重复系统跟踪精度的有效策略,在该领域备受关注。然而,当控制系统部署于网络环境中时,有限的网络带宽可能导致数据包丢失,使得控制器无法获得完整的传感器或执行器信息,从而严重挑战了传统ILC的性能。另一方面,为节省能量或满足特定控制需求,间歇控制策略被提出,它周期性地开启或关闭控制器。现有研究大多分别处理数据包丢失的影响或间歇控制的稳定性,鲜有工作探讨在网络环境下,当控制输入本身是间歇的且同时面临数据包丢失时,如何设计有效的ILC算法以保证机器人操作器的精确跟踪性能。本研究旨在填补这一空白,其核心目标是:为面临数据包丢失和间歇输入双重挑战的机器人操作器,设计一种新型的、能够保证跟踪误差有界且估计器误差收敛的间歇迭代学习控制方案。
研究的工作流程和理论方法构建可以分为以下几个核心步骤。首先,研究基于标准的刚性机器人操作器动力学模型建立问题框架。模型描述了关节位置、速度、加速度与控制扭矩及未知扰动之间的关系。研究考虑了两个关键现实因素:一是将运行时间周期划分为工作区间和休息区间,以描述间歇输入的特性;二是引入伯努利随机变量来描述数据包丢失现象,即传感器数据(如关节位置和速度)在传输到控制器时可能以一定概率丢失。
其次,研究提出了一个复合控制器结构,作为解决方案的核心。该控制器由两部分构成:比例-微分反馈部分和迭代学习前馈部分。对于反馈部分,为应对数据包丢失,研究采用了最新可用数据包补偿策略。具体而言,当当前时刻数据包成功到达时,直接使用当前跟踪误差及其导数;若发生丢失,则使用上一次成功接收并缓存的数据进行补偿。对于前馈部分,研究设计了一个基于迭代估计器的结构来生成前馈输入。该估计器的关键创新在于引入了一种插值方法来处理数据包丢失问题。由于原始传感器数据可能因丢失而不完整,研究首先对接收到的离散采样数据进行插值(例如,采用样条插值),生成一个连续的、可微的估计轨迹。基于此插值轨迹,迭代估计器通过一个包含参数估计和扰动估计的更新律进行学习,以逼近理想的前馈控制律。这种方法避免了因数据丢失而导致的学习过程无效,确保了学习过程的连续性。
第三,为了处理间歇输入带来的挑战,研究提出了一个修正的参考轨迹策略。在间歇控制的工作区间内,该修正轨迹平滑地从上一间歇周期结束时的实际系统状态过渡到期望的参考轨迹;在休息区间,则直接采用原始期望轨迹。这一设计的巧妙之处在于,它使得即使在控制输入被间歇性切断(休息期)后重新启动(工作期)时,前馈控制器也能基于一个与系统实际状态相匹配的“虚拟”期望轨迹进行计算,从而有效缓解了因间歇性造成的轨迹偏差问题,使间歇控制机制与迭代学习前馈能够兼容。
第四,为了从理论上严格证明所提出控制方案的有效性,研究采用了复合能量函数(Composite Energy Function, CEF) 和李雅普诺夫函数相结合的分析方法。整个过程分为两大核心证明。首先,针对迭代估计器,研究构造了一个包含估计状态误差、估计参数误差和估计扰动误差的复合能量函数。通过分析该函数在两次连续估计迭代之间的差值,并结合所设计的参数更新律,研究严格证明了在迭代次数趋于无穷时,估计器的状态跟踪误差以及参数和扰动的估计误差均能在L2范数意义下收敛。这为前馈部分的学习能力提供了理论保障。其次,针对整个闭环跟踪控制系统,研究构造了一个基于跟踪误差及其组合变量的李雅普诺夫函数。在考虑了数据包丢失的数学期望和间歇控制(工作期与休息期交替)的动态特性后,研究通过微分不等式分析,证明了系统的跟踪误差在数学期望意义下是最终一致有界的。这满足了实际工程应用中对系统稳定性和性能的基本要求。
研究的主要结果通过两个详细的仿真实验得到了验证。第一个实验针对一个单连杆操作器模型,并将所提出的算法与文献[32]中的方法进行对比。仿真设置了25%的数据包丢失率。结果显示,在第一次迭代时,新方法就能实现近乎完美的轨迹跟踪,而对比方法则存在明显偏差。随着迭代次数增加至第10次和第30次,新方法始终保持优异的跟踪性能,而对比方法仅在初始阶段表现良好。通过绘制前30次迭代的平均跟踪误差和最大跟踪误差曲线,直观地展示了新方法在收敛速度和精度上的显著优势,证明了其补偿数据包丢失策略的有效性。第二个实验针对一个更复杂的二自由度平面操作器模型,并同时引入了数据包丢失(丢失率50%)和间歇输入(工作0.9秒,休息0.1秒)的复杂场景。仿真结果表明,即使在这种双重挑战下,所提出的算法在经过10次迭代后,两个关节的位置输出都能很好地跟踪期望的周期轨迹。最大和平均跟踪误差曲线也显示误差随着迭代迅速下降并维持在很小的有界范围内。此外,研究还展示了插值误差,证明了所用插值方法的可靠性。作为深入分析,研究探讨了修正轨迹中关键设计参数ta(过渡时间)对性能的影响。结果表明,较小的ta能带来更快的跟踪收敛速度,但会导致控制输入扭矩峰值增大;较大的ta则相反。这为在实际应用中根据执行器能力和性能要求进行参数权衡提供了指导。
本研究的结论是,成功地为存在数据包丢失的机器人操作器设计并理论证明了一种有效的间歇迭代学习控制方案。该方案的核心贡献在于:1)通过结合比例-微分反馈(采用最新数据补偿丢失)和迭代学习前馈(基于插值数据的估计器),有效处理了数据包丢失问题,提升了跟踪性能;2)通过设计修正的参考轨迹,巧妙地解决了间歇输入与学习型前馈控制器之间的兼容性问题;3)利用复合能量函数方法,为估计器误差的收敛性和系统跟踪误差的有界性提供了严谨的理论证明。仿真实例进一步证实了该方法在单连杆和复杂多连杆机器人系统中的有效性和优越性。
该研究的亮点和价值体现在多个方面。在科学价值上,它首次系统性地将数据包丢失补偿与间歇输入处理结合在一个统一的迭代学习控制框架内,丰富了网络化控制系统和迭代学习控制的理论体系。所提出的基于插值的估计器更新方法和修正参考轨迹策略具有创新性。在应用价值上,该研究为实际工业机器人系统在网络环境下面临通信不可靠和节能需求时,实现高精度重复跟踪控制提供了直接可行的算法设计和理论依据,具有明确的工程实践指导意义。研究方法上的创新性尤为突出:提出的“插值-估计”前馈学习机制避免了数据缺失导致的学习中断;设计的修正参考轨迹是处理间歇学习控制的一个巧妙构思;而结合CEF和Lyapunov的理论分析则为这类复杂非线性随机间歇系统的稳定性证明提供了范例。最后,研究也指出了未来的可能方向,如将所提算法扩展到事件触发控制框架和非周期性间歇机制中,显示了该工作具有持续拓展的潜力。