这项研究由来自中国人民大学数学学院的Dong Shen(IEEE高级会员)和Niu Huo,以及黎巴嫩美国大学工程学院的Samer S. Saab(IEEE高级会员)合作完成,论文发表于2022年12月的《IEEE Transactions on Neural Networks and Learning Systems》第33卷第12期。研究聚焦控制科学领域中的网络化学习控制问题,针对线性网络系统在信道噪声环境下的高精度跟踪控制需求,提出了一种概率量化学习控制(Probabilistically Quantized Learning Control, PQLC)的创新框架。
在工业4.0背景下,网络控制系统因通信技术赋能而广泛应用。然而,长距离数据传输会引入信道噪声、带宽限制等问题。传统量化控制采用对数或均匀量化器,但存在两类缺陷:一是仅能实现有界收敛(bounded convergence),二是需依赖附加机制(如误差传输或编解码策略)才能达到零误差跟踪。本研究的目标是设计一种无需复杂配置即可在量化误差和信道噪声下实现完美跟踪的新型控制框架。其核心科学挑战在于如何通过概率量化器(probabilistic quantizer)降低通信负担,同时保证系统的学习控制性能。
研究包含五个关键步骤:
系统建模与假设
研究对象为离散时间线性系统(如工业机器人关节模型),状态空间表述为 ( x_{k}(t+1) = A_t x_k(t) + B_t u_k(t), y_k(t) = C_t xk(t) )。提出三个基本假设:(1)输入-输出耦合矩阵 ( C{t+1}B_t ) 满秩;(2)参考轨迹 ( y_r(t) ) 可实现;(3)初始状态严格重置。系统通过添加伯努利噪声的信道传输量化后的输出信号。
概率量化器设计
提出基于均匀分布的概率量化器(式5):对于实数 ( v \in [(j-1)\Delta, j\Delta] ),以概率 ( (j-v/\Delta) ) 输出 ( (j-1)\Delta ),以概率 ( (v/\Delta-j+1) ) 输出 ( j\Delta )。该设计等效于减性抖动量化(subtractive dithering),其核心性质为无偏估计(Lemma 1:( \mathbb{E}[q\Delta(v)] = v ))和有限方差(( \mathbb{E}[(q\Delta(v)-v)^2] \leq \Delta^2⁄4 ))。
三种学习控制方案
性能分析
通过李雅普诺夫函数和随机逼近理论,严格证明:
仿真验证
以工业机器人模型(传递函数 ( G(s) = 948/(s^2 + 42s + 948) ))为对象,量化密度 ( \Delta = 0.5 ),信道噪声 ( \omega_k(t) \sim \mathcal{N}(0,0.1^2) \)。结果显示:
本研究的主要贡献体现在三个方面: 1. 理论创新:首次将概率量化器引入网络化学习控制框架,突破了传统量化器需依赖附加机制的局限,通过随机近似理论证明了零误差收敛的可行性。 2. 方法优势:递归增益方案的计算复杂度显著低于基于卡尔曼滤波的方法(如文献[30]的KFS),且不依赖精确系统模型(Remark 8)。 3. 工程意义:提出的概率量化器可通过简单硬件实现(如均匀随机数发生器),适用于大规模网络控制系统(如工业机器人集群)。
该研究为网络化控制系统的通信-控制协同优化提供了新思路,后续可拓展至非线性系统和非重复性扰动场景。论文中的Lifting transformation技术(Section II-D)和随机分析框架(Section III-V)对其他量化控制研究具有方法论参考意义。