分享自:

基于概率量化的网络线性系统学习控制框架

期刊:ieee transactions on neural networks and learning systemsDOI:10.1109/tnnls.2021.3085559

这项研究由来自中国人民大学数学学院的Dong Shen(IEEE高级会员)和Niu Huo,以及黎巴嫩美国大学工程学院的Samer S. Saab(IEEE高级会员)合作完成,论文发表于2022年12月的《IEEE Transactions on Neural Networks and Learning Systems》第33卷第12期。研究聚焦控制科学领域中的网络化学习控制问题,针对线性网络系统在信道噪声环境下的高精度跟踪控制需求,提出了一种概率量化学习控制(Probabilistically Quantized Learning Control, PQLC)的创新框架。

学术背景与研究目标

在工业4.0背景下,网络控制系统因通信技术赋能而广泛应用。然而,长距离数据传输会引入信道噪声、带宽限制等问题。传统量化控制采用对数或均匀量化器,但存在两类缺陷:一是仅能实现有界收敛(bounded convergence),二是需依赖附加机制(如误差传输或编解码策略)才能达到零误差跟踪。本研究的目标是设计一种无需复杂配置即可在量化误差和信道噪声下实现完美跟踪的新型控制框架。其核心科学挑战在于如何通过概率量化器(probabilistic quantizer)降低通信负担,同时保证系统的学习控制性能。

研究框架与方法流程

研究包含五个关键步骤:

  1. 系统建模与假设
    研究对象为离散时间线性系统(如工业机器人关节模型),状态空间表述为 ( x_{k}(t+1) = A_t x_k(t) + B_t u_k(t), y_k(t) = C_t xk(t) )。提出三个基本假设:(1)输入-输出耦合矩阵 ( C{t+1}B_t ) 满秩;(2)参考轨迹 ( y_r(t) ) 可实现;(3)初始状态严格重置。系统通过添加伯努利噪声的信道传输量化后的输出信号。

  2. 概率量化器设计
    提出基于均匀分布的概率量化器(式5):对于实数 ( v \in [(j-1)\Delta, j\Delta] ),以概率 ( (j-v/\Delta) ) 输出 ( (j-1)\Delta ),以概率 ( (v/\Delta-j+1) ) 输出 ( j\Delta )。该设计等效于减性抖动量化(subtractive dithering),其核心性质为无偏估计(Lemma 1:( \mathbb{E}[q\Delta(v)] = v ))和有限方差(( \mathbb{E}[(q\Delta(v)-v)^2] \leq \Delta^24 ))。

  3. 三种学习控制方案

    • LCS-I(恒定增益方案):输入更新规则 ( u_{k+1}(t) = u_k(t) + \gamma L^T \epsilon_k(t+1) ),其中 ( \gamma ) 为常数增益。理论证明(Theorem 1)其输入误差均方收敛至有界球域,半径与 ( \gamma ) 成正比。
    • LCS-II(递减增益方案):采用满足 ( \sum \gamma_k = \infty )、( \gamma_k \to 0 ) 的增益序列。分析表明(Theorem 2)其可实现均方零误差收敛。
    • LCS-III(递归增益方案):通过Lyapunov函数最小化性能指标,推导出最优增益 ( \gamma_k^* \propto 1/k )(Lemma 3),其收敛速度不超过 ( O(1/k) )。
  4. 性能分析
    通过李雅普诺夫函数和随机逼近理论,严格证明:

    • 恒定增益方案的收敛率为指数级,但稳态误差与增益正相关(Corollary 1)。
    • 递减/递归增益方案虽收敛速度较慢(非快于指数趋势),但能实现渐近零误差(Theorem 3),且对模型不确定性和非高斯噪声(如拉普拉斯/柯西分布)具有鲁棒性(Section VI-B)。
  5. 仿真验证
    以工业机器人模型(传递函数 ( G(s) = 948/(s^2 + 42s + 948) ))为对象,量化密度 ( \Delta = 0.5 ),信道噪声 ( \omega_k(t) \sim \mathcal{N}(0,0.1^2) \)。结果显示:

    • LCS-I在60次迭代后跟踪误差波动明显(图3),而LCS-II/III可实现精确跟踪(图2)。
    • 与传统舍入量化器(rounding quantizer)相比,概率量化器能将均方误差降低约40%(图7)。
    • 量化密度 ( \Delta ) 越小,稳态精度越高(图8)。

核心结论与价值

本研究的主要贡献体现在三个方面: 1. 理论创新:首次将概率量化器引入网络化学习控制框架,突破了传统量化器需依赖附加机制的局限,通过随机近似理论证明了零误差收敛的可行性。 2. 方法优势:递归增益方案的计算复杂度显著低于基于卡尔曼滤波的方法(如文献[30]的KFS),且不依赖精确系统模型(Remark 8)。 3. 工程意义:提出的概率量化器可通过简单硬件实现(如均匀随机数发生器),适用于大规模网络控制系统(如工业机器人集群)。

研究亮点

  1. 量化机制突破:概率量化器的无偏特性(Lemma 1)是保证渐近收敛的关键,而传统均匀/对数量化器因确定性映射必然存在残差。
  2. 增益设计创新:递归增益序列 ( \gamma_k^* ) 的推导(Proposition 3)提供了性能指标最优化范本,其 ( O(1/k) ) 收敛速度达到理论下界。
  3. 鲁棒性验证:在模型参数摄动( ( \pm 10\% ) )和非高斯噪声下仍保持稳定性(Section VI-B),凸显了方法的实用价值。

该研究为网络化控制系统的通信-控制协同优化提供了新思路,后续可拓展至非线性系统和非重复性扰动场景。论文中的Lifting transformation技术(Section II-D)和随机分析框架(Section III-V)对其他量化控制研究具有方法论参考意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com