分享自:

自动驾驶车辆迭代学习控制的优化信号设计

期刊:2019 International Conference on Advanced Technologies for Communications (ATC)

泰国太原理工大学(Thai Nguyen University of Technology)的Lanh Van Nguyen与Du Huy Dao两位学者在2019年国际通信先进技术会议(International Conference on Advanced Technologies for Communications, ATC)上发表了一篇关于自动驾驶车辆迭代学习控制(Iterative Learning Control, ILC)的研究论文。该研究聚焦于自动驾驶汽车在重复轨迹跟踪任务中的控制优化问题,提出了一种基于ILC的新型控制方法,旨在解决传统控制技术(如PID控制器)在应对重复扰动(如斜坡道路)时的性能不足问题。

学术背景与研究目标

自动驾驶技术近年来在研究和商业化领域快速发展,例如福特、丰田雷克萨斯、奥迪A6等车型已实现自动泊车功能。然而,轨迹跟踪问题仍是核心挑战之一。现有方法如PID控制、模型预测控制(Model Predictive Control, MPC)和神经网络控制虽各有优势,但存在局限性:PID控制对横向和纵向运动分开处理且无法处理系统约束;MPC虽能处理多输入多输出(MIMO)系统,但缺乏迭代学习能力;神经网络控制需要大量训练数据且收敛性难以保证。而ILC通过利用历史迭代数据优化控制信号,可显著提升跟踪性能,尤其适用于重复任务场景(如赛车或泊车)。本研究的目标是设计一种结合ILC的优化控制算法,确保车辆在重复干扰下高效跟踪预定轨迹,同时满足控制信号的平滑性和约束条件。

研究方法与流程

1. 车辆动力学建模

研究采用经典的“自行车模型”(bicycle model)简化车辆动力学,假设后轮驱动、前轮转向,忽略横向和滚动运动。模型方程为:
- 全局坐标(x, y, φ)描述车辆位置与方向;
- 纵向速度v由加速度a和摩擦力参数(cr0, cr2)决定;
- 转向角δ通过几何参数(c1=lr/l, c2=1/l)影响运动。
模型参数通过实验标定(如表格所示),例如c1=0.22,c2=12.4 m⁻¹,cr0=0.0175。

2. ILC算法设计

研究提出了四种ILC设计方法:
1. PD型设计:基于比例-微分增益(如式4),无需精确模型,通过调参优化;
2. 植物逆模型方法:直接使用逆动力学模型作为学习函数(如式5),依赖模型精度;
3. 二次最优设计(Q-ILC):通过最小化二次成本函数(式6)优化控制输入,考虑系统动力学矩阵P的时变特性;
4. 最优ILC与非线性规划结合:将ILC转化为非线性规划问题(式9),目标函数包括跟踪误差、输入调节项及时域/迭代域变化约束,权重矩阵可调(如W=diag(10⁻⁶), R1=diag(1))。

3. 控制实现与迭代流程

  • 初始迭代:采用传统PID反馈控制生成初始控制信号,分离横向(转向角)和纵向(加速度)控制;
  • 后续迭代:基于历史误差信号(式10的ε[i])更新控制输入,通过ILC逐步优化;
  • 终止条件:误差范数收敛后停止学习,输出最优控制信号。

实验结果与分析

1. 反馈控制性能

首次迭代中,PID控制器在斜坡干扰(t=8~18秒)下出现明显速度滞后和位置误差(图6),表明传统方法的局限性。

2. ILC优化效果

  • 收敛性:ILC在6次迭代内使误差范数快速收敛(图7);
  • 跟踪精度:第10次迭代时,位置误差降至0.02米以下(图8),且控制信号(加速度、转向角)平滑;
  • 抗干扰性:斜坡扰动下的速度波动显著减小。

结论与价值

研究表明,ILC能有效利用历史数据优化控制信号,在重复任务中实现高精度轨迹跟踪,且对模型不确定性和重复扰动具有鲁棒性。其科学价值在于:
1. 提出了一种融合非线性规划与ILC的优化框架;
2. 验证了ILC在自动驾驶MIMO系统中的实用性;
3. 为工业应用(如自动泊车、赛道赛车)提供了高效解决方案。

研究亮点

  1. 方法创新:首次将Q-ILC与非线性规划结合,解决自动驾驶中的多目标优化问题;
  2. 工程适用性:ILC可直接集成于现有反馈控制系统,无需重构;
  3. 快速收敛:仅需数次迭代即可显著提升性能,优于神经网络等复杂学习方法。

其他价值

论文还探讨了ILC与反馈控制的协同机制,指出ILC作为前馈补偿可弥补反馈控制在非重复干扰下的不足,为混合控制策略设计提供了理论参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com