分享自:

自动驾驶车辆在不确定驾驶环境下的鲁棒自适应学习路径跟踪控制

期刊:IEEE Transactions on Intelligent Transportation SystemsDOI:10.1109/TITS.2022.3176970

本文属于”类型a:原创性研究论文”,以下是学术报告:

作为智能交通系统领域的重要突破,IEEE Transactions on Intelligent Transportation Systems于2022年11月刊登了Xuefang Li(中山大学)、Chengyuan Liu(拉夫堡大学)、Boli Chen(伦敦大学学院)和Jingjing Jiang(拉夫堡大学)团队的研究成果”Robust Adaptive Learning-Based Path Tracking Control of Autonomous Vehicles Under Uncertain Driving Environments”。该研究针对自动驾驶车辆路径跟踪控制中的建模不确定性和外部干扰问题,提出了一种新型鲁棒自适应学习控制(Robust Adaptive Learning Control, RALC)方法。

学术背景与研究目标 在自动驾驶技术快速发展的背景下,路径跟踪控制作为车辆自主行驶的基础功能面临三大挑战:(1)车辆动力学固有的非线性特性与模型不确定性;(2)外界环境的时变干扰;(3)传统控制方法在重复性任务中无法实现渐进优化。现有方法如PID控制、滑模控制(Sliding Mode Control, SMC)和模型预测控制(Model Predictive Control, MPC)分别存在参数调优复杂、控制信号抖动和计算成本高等固有缺陷。该研究旨在开发一种能充分利用系统重复特性的学习型控制器,实现在不确定驾驶环境下:(1)通过迭代学习逐步提升跟踪精度;(2)有效补偿模型不确定性和外部干扰;(3)解决车辆动力学欠驱动特性带来的非方输入分布矩阵难题。

研究方法与技术路线 研究采用理论推导与仿真验证相结合的方法,主要包含五个关键环节:

  1. 车辆动力学重构: 建立包含侧向和横摆动力学的2自由度(2-DOF)车辆模型,具体包含侧偏角β和横摆角速度γ的动态方程(式1-2)。考虑轮胎侧向力不确定性(式3-6)和运动学约束(式8-9),将系统重构成级联形式(式16-17)。创新性地引入状态变量x1=β+lfγ/vx和x2=β-lrγ/vx(式15),将原系统转化为参数化形式,其中系统不确定性被集中为未知参数向量θ=[1,1+Δr/cr0]T。

  2. 控制算法设计: 提出RALC框架(式31),包含三个核心组件:

  • 自适应学习项:通过参数更新律(式32)在线估计后轮侧偏刚度不确定性Δr
  • 鲁棒补偿项:采用双曲正切函数ζ(ex,k)=[tanh(ex1,k/ε),tanh(ex2,k/ε)]T抑制外部干扰
  • 伪逆技术:针对非方输入分布矩阵b∈R^2×1,设计bt/‖bbt‖结构解决欠驱动问题
  1. 稳定性证明: 构建复合能量函数(Composite Energy Function, CEF)(式33),结合λ-范数分析框架,严格证明算法在Lyapunov意义下的收敛性。关键不等式(式46)表明跟踪误差可在有限迭代次数内进入预设邻域。

  2. 仿真验证: 设置两种典型场景:

  • 零曲率场景(Case 1):双移线轨迹跟踪,纵向速度vx∈[10,30]m/s
  • 非零曲率场景(Case 2):ρ=0.02e^(-0.02t)sin(0.5t)的弯道跟踪 采用表I所示车辆参数,在Matlab2019b平台实施,对比PI控制、反向步滑模控制(Backstepping Variable Structure Control, BVSC)和PD型迭代学习控制(PD-type ILC)三种基准方法。
  1. 性能指标: 定义最大跟踪误差范数‖ek‖sup=maxt√(eβ,k²+eγ,k²+eφl,k²+eyl,k²)作为评价标准,每个工况进行250次迭代学习。

主要研究成果 1. 收敛性能: - Case 1中,vx=10m/s时,经过250次迭代后最大跟踪误差降低90%(图4) - 不同速度下均保持稳定收敛(图5),vx=30m/s时稳态误差增大但仍属合理范围 - 计算效率方面,单次迭代耗时0.46秒,全流程115.75秒,具备工程应用潜力

  1. 鲁棒性验证:
  • 在μ∈[0.5,1]的路面摩擦系数变化下,8字形轨迹跟踪误差增量可控(图9)
  • 外部干扰(df=10cos(3t)+sin(t), dr=10sin(3t)+sin(t))和参数不确定性(Δf=5sin(2t)+cos(t))下仍保持稳定
  1. 对比实验: Case 2中,RALC在150次迭代后的 lateral deviation(yl)和heading error(φl)跟踪精度显著优于基准方法(图7-8)。具体表现为:
  • 相较于PI控制:消除了稳态误差
  • 相较于BVSC:避免了抖振现象
  • 相较于PD-type ILC:克服了初始阶段振荡问题

理论贡献与工程价值 1. 理论创新: - 首次将自适应学习控制(Adaptive Learning Control, ALC)从方系统扩展到非方系统 - 提出伪逆式矩阵处理方法,为欠驱动系统控制提供新思路 - 建立基于CEF和λ-范数的非重复轨迹收敛分析框架

  1. 技术优势:
  • 仅需最近两次迭代的I/O数据,避免大数据训练需求
  • 通过”在线学习+鲁棒补偿”双机制处理时变干扰
  • 控制信号二阶可微(remark 4),保证执行器平稳性
  1. 应用价值: 论文成果在智能驾驶领域具有三重意义: (1)为自动驾驶系统在不确定环境下的路径跟踪提供可靠性保障 (2)通过迭代学习机制实现控制性能的自主进化 (3)计算效率满足车载ECU的实时性要求(单迭代<0.5s)

研究亮点 1. 创新性方法: - 参数化重构技术将模型误差/干扰集中处理 - 非方系统的自适应学习控制理论突破 - 混合指标设计(λ-范数+CEF)的创新应用

  1. 全面性验证:
  • 覆盖零/非零曲率、不同车速、多变附着系数等复杂工况
  • 包含与传统方法的定量对比
  • 硬件在环测试的可行性论证
  1. 潜在影响: 为解决自动驾驶在极限工况下的控制问题提供新范式,特别适用于:
  • 重复性驾驶任务(自主泊车、封闭区域物流)
  • 参数时变场景(负载变化、轮胎磨损)
  • 干扰频繁环境(侧风、路面不平等)

特别值得注意的是,该研究通过理论推导与实验验证的深度结合,成功将学习控制理论的优势引入车辆动力学控制领域。研究者开发的阈值切换机制(remark 4)有效避免了数值奇异问题,而收敛精度与参数ε的关联性分析(remark 5)为工程实施提供了调参依据。研究结果不仅推动了智能控制理论的发展,也为自动驾驶系统的工程化落地提供了重要技术支撑。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com