用于机器人辅助上肢康复的不确定性补偿高阶自适应迭代学习控制

分享自：
用于机器人辅助上肢康复的不确定性补偿高阶自适应迭代学习控制

生物医学工程
信息科学
期刊:IEEE Transactions on Automation Science and EngineeringDOI:10.1109/TASE.2023.3335401
【点击此处】阅读全文、收藏及针对性提问
2024年10月，IEEE Transactions on Automation Science and Engineering 期刊的第四期发表了一项针对机器人辅助上肢康复控制策略的重要研究。该研究由来自武汉理工大学的Qingsong Ai（艾青松）、Zemin Liu（刘泽民）、Wei Meng（孟伟）、Quan Liu（刘泉）以及英国利兹大学的Sheng Q. Xie（谢胜强）共同完成，题为“Uncertainty Compensated High-Order Adaptive Iterative Learning Control for Robot-Assisted Upper Limb Rehabilitation”（机器人辅助上肢康复的不确定性补偿高阶自适应迭代学习控制）。这项研究旨在解决康复机器人在辅助卒中患者进行日常活动轨迹跟踪时，面临的机器人内部不确定性以及患者无意识扰动所带来的挑战。
研究背景与意义 随着全球社会逐步进入老龄化，卒中患者的数量不断增加，其中约85%的患者患有上肢运动功能障碍。重复性的康复训练有助于促进受损运动神经中枢的恢复。传统的治疗依赖于治疗师长期的一对一辅助训练，耗时耗力。而机器人辅助康复已被证明能够提供高强度、重复性、任务特异性的治疗，对促进卒中患者运动功能恢复具有积极效果。许多患者由于上肢运动能力缺失，无法独立完成如进食、饮水等日常活动。因此，在康复训练中结合日常生活活动轨迹，对于促进上肢功能恢复具有重要意义。然而，康复机器人作为一个多变量、非线性、时变系统，其运动控制充满挑战。这些挑战源于机器人内部的不确定性（如模型不确定性、末端执行器负载与摩擦等）以及外部环境的不确定性（如患者因肌张力或肌肉痉挛等病理状态变化引起的时变干扰）。此外，日常生活活动轨迹通常是不规则且难以用常规函数表达的，这为精确的轨迹跟踪带来了巨大困难。
为了确保康复过程的安全性和有效性，避免因跟踪误差过大对患者造成二次伤害，高精度的位置跟踪控制是机器人辅助康复的重要前提。目前，多数康复机器人采用基于模型的控制方法来保证跟踪精度。然而，由于系统复杂非线性，难以获得精确的动态模型参数，且模型参数本身以及康复训练中肌肉和肌腱行为都具有时变和非线性特性，导致基于模型的控制方法性能下降。数据驱动控制是一种适用于非线性系统的可行方法，其中迭代学习控制（Iterative Learning Control， ILC） 是一种典型的数据驱动控制方法，它利用先前迭代周期中的控制知识来更新当前参数，从而提高跟踪性能。模型无关自适应迭代学习控制（Model-Free Adaptive Iterative Learning Control， MFAILC）是数据驱动控制的一种扩展，它仅利用系统的输入输出数据建立等效的动态线性化模型，无需任何机器人模型信息。但是，传统的模型无关自适应迭代学习控制通常只依赖输入输出数据，需要大量的迭代次数才能收敛，收敛速度较慢。在康复应用中，过度的迭代时间和消耗使其不够实用。
为此，本文提出了一种新型控制器——不确定性补偿高阶自适应迭代学习控制器，旨在提升康复机器人在存在内外不确定性的情况下，对不规则、类人轨迹的跟踪精度和收敛速度。
研究方法与流程 本研究主要包含两个核心部分：一是为康复机器人生成类人的日常生活活动轨迹；二是提出并验证所提出的不确定性补偿高阶自适应迭代学习控制器。研究流程包括仿真验证和实体机器人实验验证两个主要阶段。
1. 类人轨迹生成 为了生成康复机器人所需的类人轨迹，研究采用了高斯混合模型（Gaussian Mixture Model, GMM）来学习和生成来自健康受试者的示教轨迹。 * 数据采集与预处理：研究利用动作捕捉系统记录健康受试者执行“饮水”动作时的手部运动序列。在受试者手部设置四个标记点，通过坐标变换计算手部在空间中的位置和方向。一个完整的日常活动演示路径被表示为一组位置和方向的数据集合，其中包含多个演示轨迹。 * 轨迹生成：采用高斯混合模型对采集到的多组示教轨迹进行拟合。GMM基于多个高斯分量密度函数的加权和构建。然后，使用高斯混合回归（Gaussian Mixture Regression， GMR）来预测给定时间条件下的条件概率分布，从而生成平滑的、概率意义上的最佳末端轨迹。如图3所示，由绿色曲线代表的原始示教轨迹，经过GMM/GMR处理后，生成了如红色曲线所示的机器人末端执行器轨迹。
2. 不确定性补偿高阶自适应迭代学习控制器 该部分是研究的核心创新。研究者首先将带有不确定性的离散时间非线性康复机器人系统，通过引理转化为一个具有不确定性补偿的动态线性化数据模型。该模型仅依赖于系统的输入输出数据，实现了“模型无关”。 * 控制器设计：提出的不确定性补偿高阶自适应迭代学习控制器主要贡献包括三点：第一，设计了一个带不确定性补偿的通用动态线性化框架来表示非线性机器人系统；第二，分别通过优化准则函数技术估计伪偏导数参数和不确定性，避免了两者估计之间的耦合；第三，采用高阶学习律重新设计伪偏导数参数和控制输入，利用更多先前迭代周期的参数来计算当前迭代的控制参数，从而提高收敛速度和跟踪性能。 * 参数更新与控制律：研究定义了包含不确定性估计和伪偏导数参数估计的中间变量。为了估计未知且有界的不确定性，采用了改进的投影算法设计准则函数，并通过最小化该函数得到不确定性的迭代估计算法。类似地，也为时变的伪偏导数参数设计了准则函数，并推导出其估计算法。为了防止参数漂移并适应不同的操作点，设计了重置算法。最终，基于跟踪误差和权重因子构建了控制器的成本函数，通过最小化该函数，推导出控制输入更新律，该控制律包含跟踪部分和不确定性补偿部分。为了加速收敛，研究进一步将高阶学习方案应用于伪偏导数参数和控制输入的估计中，即利用多个先前迭代（如前m次迭代）的加权信息来更新当前迭代的参数，而非仅使用前一次迭代的信息。 * 收敛性证明：研究在理论部分对控制器进行了严格的收敛性分析。提出了若干假设，并通过定理证明了在满足特定参数条件（如估计步长因子、权重常数、输入增量等的边界条件）下，不确定性估计值、伪偏导数估计值是有界的，并且当迭代次数趋于无穷时，系统输出跟踪误差是收敛的，控制律也是有界的。这为控制器的实际应用提供了理论保障。
3. 仿真与实验验证 为验证所提出控制器的有效性，研究在Matlab环境中进行了仿真，并在一个七自由度（7-DOF）的康复机器人平台上进行了实物控制实验。康复机器人系统采用KUKA LBR iiwa R700协作机械臂，通过手柄与患者连接。 * 仿真验证：将提出的不确定性补偿高阶自适应迭代学习控制器与传统的模型无关自适应迭代学习控制器应用于一个包含时变参数和随机扰动的非线性系统进行对比仿真。仿真结果表明，在处理不确定性方面，不确定性补偿高阶自适应迭代学习控制器在相同迭代次数下具有更小的跟踪误差和更快的收敛速度。特别是在迭代初期（如第10次、第20次迭代），其轨迹明显更接近期望轨迹。 * 机器人轨迹跟踪控制实验： * 圆形轨迹跟踪：首先在笛卡尔空间中设计了机器人末端执行器跟踪圆形轨迹的任务，并通过逆运动学将其转换到关节空间。在康复机器人上分别应用模型无关自适应迭代学习控制器和不确定性补偿高阶自适应迭代学习控制器进行对比实验。参数经过调试选择在机器人平台上性能最佳的一组。实验结果表明，不确定性补偿高阶自适应迭代学习控制器在大约10次迭代后就能达到满意的跟踪精度，而模型无关自适应迭代学习控制器需要近30次迭代才能达到类似精度。在关节空间跟踪曲线、控制输入曲线以及笛卡尔空间末端轨迹对比中，不确定性补偿高阶自适应迭代学习控制器都显示出更优的性能和更强的鲁棒性。 * 类人轨迹跟踪：进一步将控制器应用于更具挑战性的、由GMM生成的“饮水”类人轨迹跟踪任务。该轨迹不规则且包含微小扰动。实验结果显示，对于这种复杂轨迹，不确定性补偿高阶自适应迭代学习控制器同样表现出更快的收敛速度。在表I和表II的最大跟踪误差率对比中，对于同一种轨迹，不确定性补偿高阶自适应迭代学习控制器的误差率明显更低；对于两种不同类型的轨迹（圆形和类人），类人轨迹的跟踪误差率更大，验证了不规则轨迹跟踪的难度更高，同时也凸显了所提控制器在处理此类任务时的优势。
研究结论与价值 本研究的主要结论是，为七自由度上肢康复机器人提出的不确定性补偿高阶自适应迭代学习控制器，能够有效提升系统在存在内外不确定性情况下的轨迹跟踪精度和收敛速度。不确定性补偿机制增强了机器人系统对模型不确定性和外部扰动的适应能力，确保了系统的鲁棒性。高阶学习律利用先前多次迭代的数据，显著加快了迭代学习控制的收敛过程。实体机器人上的跟踪控制实验结果证实了该方法具有更快的收敛速率和更好的跟踪性能。
该研究的价值体现在以下几个方面： 1. 科学价值：提出了一种融合了不确定性补偿和高阶学习律的新型数据驱动控制框架，为非线性、不确定系统的控制理论提供了新的思路和方法。严格的收敛性证明增强了该方法的理论可靠性。 2. 应用价值：直接面向机器人辅助康复这一重要临床需求，所提出的控制器不依赖于具体的机器人动力学模型和硬件驱动模式，是一种“模型无关”的方法，因此易于移植到其他具有不确定性的非线性控制系统，具有广泛的应用前景。它能够提高康复训练的安全性和物理治疗效果，对于促进患者上肢运动功能恢复具有重要意义。 3. 工程价值：通过集成高斯混合模型进行类人轨迹生成，并结合先进的控制算法，为实现个性化、任务导向的康复训练提供了完整的技术解决方案。
研究亮点 1. 方法新颖性：首次将不确定性补偿与高阶学习律相结合，应用于康复机器人的模型无关自适应迭代学习控制中，同时提升了控制器的鲁棒性和收敛效率。 2. 问题针对性：精准地瞄准了康复机器人控制中的核心难题——系统内外不确定性和不规则类人轨迹的精确、快速跟踪。 3. 验证全面性：研究不仅提供了严格的理论收敛性证明，还通过仿真和实体机器人上的两类轨迹（规则圆形和不规则类人ADL轨迹）跟踪实验，多角度、多层次地验证了方法的有效性，论证充分。 4. 实用性强：所提方法无需精确的机器人模型，便于工程实现和跨平台移植，为康复机器人及其他类似非线性系统的控制提供了实用的工具。
其他有价值的方面 论文在最后部分展望了未来的研究方向，例如可以将基于患者训练数据的自动康复评估结合到康复训练中，以制定个性化的康复策略（如根据恢复情况调整训练轨迹的范围和速度）；还可以引入表面肌电信号来识别患者的肌肉疲劳状态，从而合理调整训练周期，进一步提高康复效果。这些展望指出了该领域未来值得深入探索的方向。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问