分享自:

结合强化学习与传统控制改进自动导引车复杂轨迹跟踪

期刊:Expert SystemsDOI:10.1111/exsy.13076

本文档属于类型a(单篇原创研究论文),以下为针对该研究的学术报告:


一、作者与发表信息

本研究由J. Enrique Sierra-Garcia(西班牙布尔戈斯大学机电工程系)与Matilde Santos(马德里康普顿斯大学知识技术研究所)合作完成,发表于期刊Expert Systems(2024年卷41期,文章编号e13076),开放获取许可为CC-BY-NC。


二、学术背景

研究领域与动机

研究聚焦于工业4.0物流运输中的自动导引车(Automated Guided Vehicle, AGV)控制,针对AGV在复杂路径跟踪中的两大耦合控制问题:
1. 纵向速度控制(确保吞吐量、标签时间等应用需求);
2. 轨迹跟踪控制(保障装卸操作的精度)。

传统PID控制器在平滑路径中表现良好,但在短路径或方向突变场景下因运动学约束限制性能下降。为此,作者提出结合强化学习(Reinforcement Learning, RL)与常规PI控制的混合策略,以提升AGV的动态适应能力。

研究目标

  • 设计混合控制架构,同时解决速度与轨迹跟踪问题;
  • 验证算法在混合三轮-差动AGV模型上的有效性;
  • 对比RL控制器与遗传算法优化的PID性能。

三、研究流程与方法

1. AGV建模与参数设定

  • 模型类型:混合三轮-差动AGV(工业常见牵引单元+车身结构),包含运动学与动力学方程(式1-12)。
  • 关键参数:车轮间距(lh=30 cm)、牵引单元惯性矩(ih=0.11 kg·m²)、摩擦系数(静态/黏滞)等(表1)。
  • 导航传感器:磁传感器模拟实际工业磁带路径跟踪,通过几何投影计算导向误差(errgui)(图2)。

2. 混合控制架构设计

  • 分层控制
    • 底层:PI控制器调节车轮转速(式23-24),增益[kvp,kvi]=[2,0.1];
    • 上层:RL控制器生成角速度参考(wref),通过逆运动学转换为左右轮速参考(式19-20)。
  • RL控制器实现
    • 状态离散化:将导向误差(errgui)及其导数(ėrrgui)离散化为整数(式26-28),组合为状态st;
    • 奖励策略:根据误差减小方向分配正/负奖励(式29);
    • 策略更新:采用累计奖励的Q-learning(式30),动作选择通过ε-greedy策略(式31)。

3. 实验验证

  • 测试轨迹:椭圆、双纽线、8边/24边多边形(式39-44),设计参数挑战AGV机动性极限。
  • 对比基准:遗传算法优化的PID控制器(增益[kp,kd,ki]=[9.8,1,0.1])。
  • 性能指标:平均绝对误差(MAE)、均方根误差(RMSE)、标准差(Std)、最大误差(Max)(式34-38)。

四、主要结果

1. 轨迹跟踪性能

  • RL控制器显著优于PID
    • 椭圆路径:MAE降低85%(PID 2.51 cm → RL 0.37 cm),最大误差减少82%(11.07 cm → 2.02 cm);
    • 多边形路径:24边多边形RMSE降低80%(PID 4.3 cm → RL 0.84 cm)。
  • 鲁棒性测试
    • 摩擦系数变化:RL容忍的静摩擦系数(fsw)为PID的20倍(表4);
    • 车轮不平衡:RL在80%极限摩擦下仍能保持路径跟踪(表5)。

2. 学习过程分析

  • 收敛速度:平滑路径(如椭圆)需5次训练迭代,复杂路径(如24边多边形)需10次(图11);
  • 速度控制:RL与PID均能稳定跟踪正弦速度曲线(图9-10),但RL在加速阶段波动略大。

五、结论与价值

科学价值

  1. 方法创新:首次将RL与PI控制结合用于AGV耦合控制问题,解决传统PID在非线性场景的局限性;
  2. 理论贡献:提出基于离散状态和累计奖励的RL算法,适用于实时控制系统(10 ms周期)。

应用价值

  • 工业场景:提升AGV在狭窄通道、急转弯路径的跟踪精度,减少生产中断风险;
  • 适应性:自动应对摩擦变化、机械磨损等不确定性,降低维护成本。

六、研究亮点

  1. 混合控制架构:分而治之策略(RL处理非线性跟踪,PI处理线性速度)实现性能突破;
  2. 全面验证:涵盖几何曲线与工业常见多边形路径,结合动态摩擦测试;
  3. 开源数据:模型参数与实验代码公开,支持复现与扩展。

七、其他价值

  • 工程启示:提出两种硬件实现方案(图4),可直接部署于工业PLC或电机驱动器;
  • 未来方向:扩展至叉车等复杂AGV,探索多智能体协同控制。

(报告字数:约1500字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com