分享自:

基于自监督学习的伺服系统多参数优化框架

期刊:IEEE Transactions on Power ElectronicsDOI:10.1109/TPEL.2025.3592233

伺服系统多参数优化新范式:基于物理约束自监督学习的特征提取框架

本文旨在向您介绍一篇近期发表在电力电子领域顶级期刊《IEEE Transactions on Power Electronics》上的创新性研究。这项工作由来自浙江大学先进电气设备创新中心的科研团队(李宏杰、王淦、施婷娜(通讯作者)、曹彦飞、夏长亮)以及杭州曦诺瓦科技有限公司的李晨合作完成,于2025年11月在第40卷第11期正式发表。该研究题为《自监督学习下的伺服系统多参数优化框架》,提出了一种颠覆传统思路的伺服控制系统参数整定方法。

一、 研究的学术背景与动因

本研究隶属于电机驱动与伺服控制领域,核心科学问题是如何高效、稳定地优化具有强耦合特性的多个控制参数。在现代高端制造业,如半导体和医疗设备中,永磁同步电机伺服系统是实现高精度运动控制的关键。这类系统普遍采用基于PID(比例-积分-微分)或自抗扰控制(Active Disturbance Rejection Control, ADRC)的磁场定向控制策略。然而,这些控制结构中的多个参数(如比例增益、积分增益、前馈增益、观测器带宽等)之间存在强烈的相互依赖和耦合关系,使得协同整定异常困难,成为限制系统性能进一步提升的主要瓶颈。

传统的参数整定方法面临诸多挑战:1) 试错法效率低下且精度有限;2) 基于模型的参数整定(如Ziegler-Nichols法、主导极点配置法)依赖于精确的系统线性化模型,难以处理实际系统中的非线性与时变特性;3) 自适应参数整定(如模糊控制、滑模控制)需要将自适应律嵌入核心控制结构,增加了调节负担并可能威胁系统稳定性;4) 智能参数整定方法中,启发式算法(如粒子群优化)对初始条件敏感、优化效率低,而基于神经网络的方法则面临对大量高质量数据的依赖、网络结构复杂(离线学习)或需要深度介入控制逻辑(在线学习)导致侵入性强等问题。

为了应对上述挑战,本研究团队旨在开发一种不依赖于底层控制结构、高效且非侵入式的多参数协同优化框架。他们从一个全新的视角审视该问题:将参数优化问题重新定义为以目标为导向的特征提取问题。具体而言,研究的目标是构建一个自监督学习框架,能够从系统的理想参考轨迹中提取出隐含的、最优的控制参数特征,从而实现对伺服系统多个强耦合参数的高效、自动寻优。

二、 研究的详细工作流程与方法创新

本研究的工作流程围绕其提出的核心框架——“物理约束自监督优化”(Physics-Constrained Self-supervised Optimization, PC-SO)展开,可分为以下几个关键步骤:

1. 框架整体构思与结构设计: 研究团队受到自编码器(Autoencoder, AE)用于特征学习和信号去噪的启发,但进行了关键性的改造。传统AE旨在从含噪输入中重建原始数据,而PC-SO框架的目标是从理想位置参考轨迹θr中,通过编码器提取出控制参数潜在变量z,再通过一个特殊的“解码器”重建出实际位置轨迹θa。这个“解码器”并非传统的神经网络,而是由控制器、逆变器和电机组成的真实物理系统本身。这种设计巧妙地嵌入了物理约束,迫使编码器学习到的潜在变量z(即待优化的控制参数)必须能够使物理系统产生尽可能接近理想轨迹θa的输出。

2. 双阶段分层编码器(Biphasic Hierarchical Encoder, BHE)的设计: 为了引入先验知识、降低编码复杂度,研究者设计了BHE结构。编码过程分为两个阶段: - 第一阶段(曲线特征提取器φ):针对伺服控制中常用的S型曲线轨迹,显式地提取五个可预先定义的特征:运动时长T、最大位置P_max、最大速度V_max、最大加速度A_max、最大加加速度J_max。这五个特征构成向量x,作为下一阶段的输入。这一步将高维的轨迹数据压缩为低维的、具有明确物理意义的特征,注入了工程经验。 - 第二阶段(编码器g):这是一个轻量化的三层前馈神经网络(输入层5个神经元,隐藏层25个神经元,输出层5个神经元)。它接收特征向量x,并输出5维的潜在变量z,即待优化的5个控制参数。隐藏层使用了高斯核函数进行非线性映射。这种设计确保了模型紧凑,适合在计算资源有限的嵌入式控制器(如实验所用的TMS320F28379D微控制器)上运行。

3. 优化模型的训练与预训练策略: 在整个PC-SO框架中,只有编码器g的参数是可训练的。训练过程是自监督的,损失函数定义为理想轨迹θr与实际轨迹θa之间的均方误差。通过梯度下降法更新编码器g的权重、核函数中心和宽度参数。一个关键的创新点是利用先验分布进行网络预训练。在实际在线优化开始前,研究者使用控制参数先验分布的下界作为目标,对编码器g进行离线预训练。这使得网络初始参数已经蕴含了电机系统的部分物理特性,从而显著提升了后续在线优化的效率和稳定性,降低了对大量真实交互数据的依赖。

4. 实验验证平台与方案设置: 为验证PC-SO框架的通用性和有效性,研究搭建了基于2.3 kW表贴式永磁同步电机的测试平台。实验在两种典型的控制结构下进行: - PI控制结构:同时优化位置环和速度环的5个参数:[K_pp(位置环比例增益), K_wf(速度前馈增益), K_pw(速度环比例增益), K_iw(速度环积分增益), K_af(加速度前馈增益)]。 - ADRC控制结构:同时优化位置环和电流环的5个参数:[K_pp, K_dw(速度环微分增益), ω_c(扩张状态观测器带宽), K_pi(电流环比例增益), K_ii(电流环积分增益)]。 在每种场景下,PC-SO框架的结构保持不变(相同的BHE和编码器g设计),体现了其非侵入性和控制结构无关的通用性。优化算法直接在200 MHz的微控制器上运行,每次优化迭代基于1000个采样点的位置轨迹数据。

5. 数据分析工作流程: 实验结果的分析主要围绕两个核心指标:总体跟踪误差e_o(定义为实际轨迹与理想轨迹之差的二范数)和优化迭代过程。研究者绘制了误差随迭代次数下降的曲线,并利用主成分分析(Principal Component Analysis, PCA)将5维参数空间投影到2维,可视化参数在优化过程中的演化轨迹,以观察其收敛性和聚类情况。同时,记录了完成优化所需的时间和迭代次数,以评估算法的效率。

三、 研究的主要结果及其逻辑关联

1. PI控制参数优化结果: - 性能提升:优化前,系统跟踪误差e_o高达7941.92,轨迹存在显著偏差;经过PC-SO框架25次迭代优化后,误差急剧下降至1.31,跟踪精度提升了约6063倍。优化后的实际轨迹与理想轨迹几乎完全重合。 - 对比实验:研究人员进行了手动整定作为对比。手动整定获得了e_o为3.54的不错结果,但精度仍低于PC-SO的优化结果(1.31)。同时,手动整定得到的参数值多为整数或简单小数(如[0.09, 1, 1.4, 30, 0.007]),而PC-SO优化出的参数是高精度的浮点数(如[0.0759, 0.998, 1.256, 31.425, 0.00678]),这解释了精度差异的部分原因,也凸显了算法在精细寻优上的优势。 - 优化过程分析:误差曲线显示,e_o在10次迭代内就迅速收敛到5以下。参数轨迹在PCA降维后的二维空间内快速移动并最终紧密聚集,表明算法能够高效、稳定地找到最优参数区域。 - 效率评估:在当前的实验平台上,完成25次迭代优化耗时约7.19秒,被认为在可接受范围内,并指出在更强大的计算平台上时间可进一步缩短。

2. ADRC控制参数优化结果: - 性能提升:在ADRC结构下,优化前的跟踪误差e_o为205.23,轨迹在起始和结束阶段存在明显偏差。经过30次迭代优化,误差降至2.02,跟踪精度提升了约102倍。 - 对比实验:手动整定ADRC参数的结果为e_o = 6.03,再次逊于PC-SO的优化结果(2.02)。参数值同样呈现算法高精度与人工整定粗略化的对比。 - 优化过程分析:误差在优化初期(约10次迭代)迅速下降至15以下,参数轨迹快速向高精度区域移动。虽然参数轨迹未像PI案例中那样高度聚集,但误差已降至很低且跟踪效果良好,支持采用早期停止策略,体现了算法的实用性和灵活性。 - 通用性验证:尽管ADRC优化所需迭代次数略多(耗时约9.48秒),但PC-SO框架本身未做任何针对ADRC的特定修改。这强有力地证明了该框架具有控制结构无关性,能够作为一种通用工具应用于不同的伺服控制架构。

结果间的逻辑关系:PI和ADRC两个场景的实验结果构成了相互支撑、递进验证的关系。首先,在相对经典的PI控制上验证了PC-SO框架的基本有效性和超高效率(误差下降数千倍)。然后,在更复杂、参数耦合特性可能不同的ADRC控制上再次成功应用,不仅验证了其有效性,更关键地证明了其核心优势——非侵入性与通用性。两个场景使用了完全相同的优化框架结构,仅改变了编码器g输出的参数定义(对应表I中的不同参数集),这直接支撑了论文关于其方法不依赖于特定控制方案的结论。优化过程的快速收敛(均在10次迭代左右达到主要性能提升)和可视化轨迹分析,共同证明了该自监督特征提取框架能够高效、直接地导航到高性能的参数空间。

四、 研究的结论与价值意义

本研究得出结论:通过将伺服系统多参数优化问题重新定义为特征提取问题,并提出的PC-SO框架,能够有效解决强耦合多参数协同优化的难题。该框架的创新之处在于结合了双阶段分层编码器(融入先验知识)和以真实物理系统为解码器(嵌入物理约束)的自监督学习结构,从而实现了不依赖精确数学模型、无需大量标注数据、非侵入式且控制结构通用的高效参数优化

其科学价值在于:为控制参数优化领域提供了一种全新的方法论视角(从“寻优”到“特征提取”),并成功地将自监督学习与物理系统约束相结合,为数据驱动与模型驱动方法的融合提供了优秀范例。

其应用价值极为显著:对于高端装备制造业,该方法可以大幅缩短伺服系统的调试时间,降低对专家经验的依赖,并能自动寻找到优于人工经验的高精度参数组合,从而提升装备的整体性能与一致性。框架的轻量化设计使其具备在嵌入式控制器上在线运行的潜力,为下一代智能伺服驱动器的自主调谐功能奠定了基础。

五、 研究的亮点

  1. 视角创新:首次将强耦合多参数优化问题重构为“以目标为导向的特征提取”问题,开辟了新的解决思路。
  2. 框架创新:提出了“物理约束自监督优化”框架,独创性地将真实物理系统作为解码器,确保了优化结果的物理可实现性,同时避免了传统数据驱动方法对大量数据的依赖和可能出现的“捷径解”。
  3. 结构通用与非侵入性:所提框架独立于底层控制结构(PI或ADRC),无需修改或深度访问控制逻辑,具有良好的通用性和工程实用性。
  4. 效率与性能卓越:实验表明,该方法能在少量迭代(25-30次)内实现跟踪精度数量级式的提升,且优化结果稳定可靠,优于人工经验整定。
  5. 轻量化与可部署性:采用分层编码和紧凑网络设计,结合预训练策略,使算法适合在资源受限的工业控制器上运行,打通了从理论到应用的链路。

六、 其他有价值的内容

论文还对未来研究方向进行了展望,指出虽然当前工作聚焦于单自由度位置伺服控制,但该框架有望扩展至更复杂的任务,如复杂轨迹跟踪多自由度协调控制。这暗示了PC-SO框架在机器人、多轴数控机床等更广阔领域中的应用潜力。此外,文中对先验知识使用的讨论(在缺乏经验时使用更广的搜索空间,有经验时可构建更高效的搜索域)为工程人员灵活应用该方法提供了指导。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com