面向MIMO非重复不确定系统的数据驱动鲁棒有限迭代学习控制

分享自：
面向MIMO非重复不确定系统的数据驱动鲁棒有限迭代学习控制

期刊:IEEE Transactions on CyberneticsDOI:10.1109/TCYB.2024.3398717
在《IEEE Transactions on Cybernetics》第54卷第11期（2024年11月）上，来自青岛科技大学数学与物理学院的刘志清、青岛科技大学自动化与电子工程学院的池荣虎（Member， IEEE）和刘洋（Member， IEEE），以及阿尔伯塔大学化学与材料工程系的黄彪（Fellow， IEEE）共同发表了一篇题为“Data-Driven Robust Finite-Iteration Learning Control for MIMO Nonrepetitive Uncertain Systems”（面向MIMO非重复不确定系统的数据驱动鲁棒有限迭代学习控制）的研究论文。该研究隶属于控制理论与工程，特别是迭代学习控制这一细分领域。本文旨在解决现有迭代学习控制方法在实际应用中面临的三个核心难题：其一，传统的ILC方法通常追求无限次迭代后达到零误差收敛，而在实际生产中，为了降低成本和提高效率，更期望在预设的有限次迭代内就将跟踪误差收敛到一个预先指定的、满足产品质量要求的误差界内，即实现有限迭代收敛。其二，现有的有限迭代学习控制方法主要针对单输入单输出系统且严重依赖于精确的机理模型，然而实际工业过程多为多输入多输出系统，并且普遍存在因参数摄动、环境变化等导致的非重复性不确定性，这使得依赖精确模型的方法失效。其三，许多复杂被控对象难以建立精确的机理模型，需要发展完全基于输入输出数据的数据驱动控制方法。
为了应对这些挑战，本研究提出了一种全新的数据驱动鲁棒有限迭代学习控制算法。研究的工作流程与核心设计可以概括为以下几个关键步骤：
首先，研究者考虑了一类具有非重复性不确定矩阵的线性时变MIMO系统。在系统精确模型未知的假设下，他们引入状态转移技术，将原MIMO系统重新表述为一个迭代增量线性模型。该模型的核心是一个被称为“伪分区雅可比矩阵”的时变参数矩阵，它浓缩了原系统的动态特性以及非重复性不确定性。PPJM的引入是构建数据驱动框架的关键一步，因为它将控制器的设计从依赖未知的精确系统矩阵，转向了估计这个时变的、与输入输出数据直接相关的矩阵。
其次，针对这个迭代增量模型，研究提出了一种基于投影算法的PPJM在线迭代更新律。该更新律仅利用当前迭代和上一迭代的输入输出增量数据，实时估计PPJM。理论分析证明了该估计算法能够保证估计误差有界。这一步完全摆脱了对机理模型的依赖，实现了纯粹的数据驱动。
接下来是整个方法的核心——控制律与学习增益的可调设计。控制律采用了经典的ILC形式，即下一迭代的输入等于当前迭代的输入加上一个学习增益乘以当前迭代的跟踪误差。然而，与固定增益或基于模型计算增益的传统方法不同，本研究提出通过求解一组线性矩阵不等式来动态计算和调整这个学习增益。这组LMIs是精心构造的，其独特之处在于：它不仅包含了从数据中实时估计得到的PPJM信息，还显式地考虑了PPJM估计误差的上界。更重要的是，这组LMIs的可行解条件直接关联了两个由用户预先指定的关键性能指标：期望的最终跟踪误差边界c和允许的最大迭代次数K。也就是说，控制器设计者可以根据生产要求，事先指定“在K次迭代内，误差必须小于c”，然后算法通过求解LMIs来反推出能够实现这一性能目标的可变学习增益。这一机制使得“有限迭代收敛”从一种事后分析的性质，转变为一种可以预先设计和保证的性能指标。
然后，研究者将PPJM迭代更新律、基于LMI的可调学习增益计算算法以及控制律整合在一起，构成了完整的DDRFILC算法。为了验证所提算法的理论有效性，他们进行了详尽的Lyapunov稳定性分析。分析过程中，通过定义一个二维Lyapunov函数，并巧妙运用杨氏不等式处理估计误差带来的耦合项，最终严格证明了所提算法能同时保证三个性能：PPJM估计的有界性、随着迭代次数增加跟踪误差的渐近收敛性，以及最关键的——在预设的迭代次数K内，跟踪误差进入预设边界c的有限迭代收敛性。
为了全面评估DDRFILC算法的性能，论文在仿真研究部分设计了三个具有代表性的例子。例1考察了一个SISO线性系统，其目的主要是与现有的FILC方法进行对比。仿真设置了两种情景：一是在精确模型已知（仅用于对比的FILC）和模型存在非重复不确定性（用于测试DDRFILC的鲁棒性）下的性能对比。结果清晰显示，在存在非重复不确定性时，依赖精确模型的FILC无法在指定迭代内达到预设误差精度，而DDRFILC凭借其数据驱动的在线估计和鲁棒LMI设计，依然能够实现有限迭代收敛目标。这凸显了DDRFILC处理非重复不确定性的鲁棒性。此外，该例子还展示了通过调整算法参数（如投影算法中的η），可以影响收敛速度；以及通过改变预设的c和K，控制器能够重新计算学习增益以实现不同的性能指标，证明了其设计的灵活性。
例2将算法应用于一个MIMO线性系统。仿真结果表明，DDRFILC能够成功处理多变量之间的耦合，使两个输出通道的跟踪误差均在预设的5次迭代内收敛到0.1的边界内，验证了算法对MIMO系统的有效性。
例3则将DDRFILC应用于一个非线性系统。重要的是，在控制器设计过程中，完全未使用该非线性系统的任何模型信息，仅依靠其产生的输入输出数据。仿真结果成功实现了有限迭代收敛，这有力地证明了DDRFILC的“数据驱动”本质，表明它不依赖于被控对象的线性假设，对于一类可通过迭代增量线性模型描述的非线性系统同样适用。
基于上述理论推导和仿真验证，本研究得出明确结论：所提出的数据驱动鲁棒有限迭代学习控制方法，能够有效解决MIMO非重复不确定系统的有限迭代收敛控制问题。该方法通过构建迭代增量模型和在线估计PPJM实现了数据驱动；通过将PPJM及其估计误差界融入LMI条件增强了鲁棒性；最终通过求解与性能指标直接挂钩的LMIs来动态调整学习增益，从而实现了对收敛误差界和收敛迭代次数的双重预设保障。
本研究的价值与亮点十分突出。其科学价值在于首次将数据驱动、鲁棒控制和有限区域稳定性理论相结合，系统性地解决了MIMO非重复不确定系统的预设性能有限迭代学习控制问题，丰富了迭代学习控制的理论体系。应用价值则在于其高度的实用性：算法不依赖于难以获取的精确机理模型，能够处理广泛存在的非重复不确定性，并以MIMO系统为对象，更贴近多数工业过程；同时，允许工程师根据经济成本和产品质量要求，直观地指定“在多少次尝试内达到多高的精度”，这对于减少试产浪费、提升生产效率具有重要意义。
研究的核心亮点可归纳为三点：第一，可调的学习增益设计。与以往FILC方法中学习增益一旦选定即固定不变不同，DDRFILC的学习增益是通过求解LMIs在线计算的，且该计算直接服务于用户预设的(c， K)性能对，实现了性能的“按需定制”。第二，开创性地提出了面向MIMO非重复不确定系统的数据驱动FILC框架。这是该领域的首次尝试，通过引入PPJM及其迭代估计算法，并构建包含估计误差界的复杂LMIs，同时攻克了“多变量耦合”、“模型不确定性”和“无模型”三大难题。第三，严谨且具有挑战性的理论证明。在同时考虑非重复不确定性和MIMO维数扩展的情况下，基于Lyapunov方法并利用杨氏不等式完成了有限区域稳定的收敛性分析，其复杂度和严谨性超过了前期的SISO确定性系统工作。
此外，论文在讨论部分也指出了未来可能的研究方向，例如如何进一步处理系统约束和执行器故障、如何降低因运行时间增长导致的矩阵维数爆炸带来的计算复杂度、以及如何对控制器参数进行综合优化等，为后续研究提供了有价值的思路。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问