结合强化学习与传统控制改进自动导引车复杂轨迹跟踪

分享自：

结合强化学习与传统控制改进自动导引车复杂轨迹跟踪

工程学

电气科学与工程

信息科学

人工智能

自动化

期刊:Expert SystemsDOI:10.1111/exsy.13076

【点击此处】阅读全文、收藏及针对性提问

本文档属于类型a（单篇原创研究论文），以下为针对该研究的学术报告：
一、作者与发表信息本研究由J. Enrique Sierra-Garcia（西班牙布尔戈斯大学机电工程系）与Matilde Santos（马德里康普顿斯大学知识技术研究所）合作完成，发表于期刊Expert Systems（2024年卷41期，文章编号e13076），开放获取许可为CC-BY-NC。
二、学术背景研究领域与动机研究聚焦于工业4.0物流运输中的自动导引车（Automated Guided Vehicle, AGV）控制，针对AGV在复杂路径跟踪中的两大耦合控制问题：
 1. 纵向速度控制（确保吞吐量、标签时间等应用需求）；
 2. 轨迹跟踪控制（保障装卸操作的精度）。
传统PID控制器在平滑路径中表现良好，但在短路径或方向突变场景下因运动学约束限制性能下降。为此，作者提出结合强化学习（Reinforcement Learning, RL）与常规PI控制的混合策略，以提升AGV的动态适应能力。
研究目标设计混合控制架构，同时解决速度与轨迹跟踪问题；
 
验证算法在混合三轮-差动AGV模型上的有效性；
 
对比RL控制器与遗传算法优化的PID性能。
 
三、研究流程与方法1. AGV建模与参数设定模型类型：混合三轮-差动AGV（工业常见牵引单元+车身结构），包含运动学与动力学方程（式1-12）。
 
关键参数：车轮间距（lh=30 cm）、牵引单元惯性矩（ih=0.11 kg·m²）、摩擦系数（静态/黏滞）等（表1）。
 
导航传感器：磁传感器模拟实际工业磁带路径跟踪，通过几何投影计算导向误差（errgui）（图2）。
 
2. 混合控制架构设计分层控制：
 底层：PI控制器调节车轮转速（式23-24），增益[kvp,kvi]=[2,0.1]；
 
上层：RL控制器生成角速度参考（wref），通过逆运动学转换为左右轮速参考（式19-20）。
 
RL控制器实现：
 状态离散化：将导向误差（errgui）及其导数（ėrrgui）离散化为整数（式26-28），组合为状态st；
 
奖励策略：根据误差减小方向分配正/负奖励（式29）；
 
策略更新：采用累计奖励的Q-learning（式30），动作选择通过ε-greedy策略（式31）。
 
3. 实验验证测试轨迹：椭圆、双纽线、8边/24边多边形（式39-44），设计参数挑战AGV机动性极限。
 
对比基准：遗传算法优化的PID控制器（增益[kp,kd,ki]=[9.8,1,0.1]）。
 
性能指标：平均绝对误差（MAE）、均方根误差（RMSE）、标准差（Std）、最大误差（Max）（式34-38）。
 
四、主要结果1. 轨迹跟踪性能RL控制器显著优于PID：
 椭圆路径：MAE降低85%（PID 2.51 cm → RL 0.37 cm），最大误差减少82%（11.07 cm → 2.02 cm）；
 
多边形路径：24边多边形RMSE降低80%（PID 4.3 cm → RL 0.84 cm）。
 
鲁棒性测试：
 摩擦系数变化：RL容忍的静摩擦系数（fsw）为PID的20倍（表4）；
 
车轮不平衡：RL在80%极限摩擦下仍能保持路径跟踪（表5）。
 
2. 学习过程分析收敛速度：平滑路径（如椭圆）需5次训练迭代，复杂路径（如24边多边形）需10次（图11）；
 
速度控制：RL与PID均能稳定跟踪正弦速度曲线（图9-10），但RL在加速阶段波动略大。
 
五、结论与价值科学价值方法创新：首次将RL与PI控制结合用于AGV耦合控制问题，解决传统PID在非线性场景的局限性；
 
理论贡献：提出基于离散状态和累计奖励的RL算法，适用于实时控制系统（10 ms周期）。
 
应用价值工业场景：提升AGV在狭窄通道、急转弯路径的跟踪精度，减少生产中断风险；
 
适应性：自动应对摩擦变化、机械磨损等不确定性，降低维护成本。
 
六、研究亮点混合控制架构：分而治之策略（RL处理非线性跟踪，PI处理线性速度）实现性能突破；
 
全面验证：涵盖几何曲线与工业常见多边形路径，结合动态摩擦测试；
 
开源数据：模型参数与实验代码公开，支持复现与扩展。
 
七、其他价值工程启示：提出两种硬件实现方案（图4），可直接部署于工业PLC或电机驱动器；
 
未来方向：扩展至叉车等复杂AGV，探索多智能体协同控制。
 
（报告字数：约1500字）

上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com

【点击此处】阅读全文、收藏及针对性提问