Lennart Ljung 教授(IEEE 会员)于1977年8月在《IEEE Transactions on Automatic Control》(第AC-22卷第4期)发表了题为《Recursive Stochastic Algorithms》的里程碑式论文。该研究由瑞典林雪平大学(Linköping University)电气工程系完成,并获得瑞典技术发展委员会(Swedish Board for Technical Development)的项目支持(合同号733546)。
本文属于系统辨识与自适应控制领域的理论性研究。递归随机算法广泛存在于自适应控制、在线辨识和随机逼近等问题中,但传统分析方法(如鞅理论)存在两大局限:一是要求观测噪声独立(即算法中矩阵a(x)与x无关),二是对增益序列γ(t)的限制过严(如需满足∑γ²(t)<∞)。Ljung的研究旨在突破这些限制,建立适用于更广泛递归算法的通用收敛性分析框架。
Ljung提出通过确定性微分方程(Deterministic Differential Equation)分析递归算法的渐近行为。其核心思想是将随机递归算法:
x(t) = x(t-1) + γ(t)Q(t; x(t-1), φ(t)) φ(t) = A(x(t-1))φ(t-1) + B(x(t-1))e(t) ``` 与确定性微分方程:
(d/dτ)x_d(τ) = f(x_d(τ)), 其中f(x) = lim E[Q(t,x,φ(t,x))] “`
相关联。这种关联通过三个关键定理实现:
1. 收敛性定理(Theorem 1):证明算法轨迹会收敛到微分方程的稳定平衡点。
2. 收敛点判定定理(Theorem 2):指出仅当平衡点满足雅可比矩阵H(x*)特征值均位于左半平面时,算法才可能收敛至x*。
3. 轨迹逼近定理(Theorem 3):量化算法路径与微分方程解的逼近概率。
论文通过五个典型案例验证理论:
1. 随机逼近(Robbins-Monro算法):证明传统独立噪声假设可放宽,增益序列选择更自由。
2. 自动分类器:展示微分方程数值解如何揭示算法存在多个稳定平衡点(图3-4)。
3. 方程误差辨识:分析最小二乘算法在反馈控制下的收敛性,指出仅当噪声协方差R=0时估计一致。
4. 确定性框架扩展(Assumptions C):适用于非随机观测序列,仅需时间平均收敛条件。
5. 自校正调节器(Self-Tuning Regulator):证明自适应控制中参数估计收敛至使闭环稳定的集合。
文末指出该理论可扩展至连续时间算法(Appendix V),并为时变参数跟踪问题提供分析思路。这些思想在作者后续著作《System Identification: Theory for the User》中得到进一步发展,成为自适应控制领域的经典方法论。