该文档属于类型a,是一篇关于无人电动拖拉机多智能体协同优化控制方法的原创性研究论文。以下为针对该研究的学术报告:
主要作者及机构
本研究由南京农业大学工程学院Wenxiang Xu、Yejun Zhu、Maohua Xiao(通讯作者)等组成的团队,联合中国一拖集团有限公司(YTO Group Corporation)及智能农业动力装备国家重点实验室(State Key Laboratory of Intelligent Agricultural Power Equipment)共同完成,发表于2025年7月的《Engineering Applications of Artificial Intelligence》期刊(卷159,文章编号111665)。
研究领域与动机
本研究属于农业机械智能化与新能源技术交叉领域。随着全球农业现代化推进,电动农用装备因其环保、低噪音和高效特性成为发展趋势。然而,无人电动拖拉机在运输工况下存在驱动系统与能源系统协同性差、电机能耗高、路径跟踪精度低等核心问题。现有研究多聚焦于耕作场景(如旋耕、犁地),而运输工况下的协同控制研究严重不足。
科学问题
传统控制方法难以同时优化能耗与路径跟踪精度:
1. 电机效率优化受运输时间约束限制;
2. 路径跟踪精度受路面类型(硬质路面与越野地形)影响显著;
3. 现有电动车辆(EVs)的协同控制策略无法直接移植至拖拉机,因二者工况需求差异大(如EVs需优先保障行驶安全,而拖拉机更注重能效与作业精度)。
研究目标
提出一种基于多智能体(multi-agent)的协同优化控制方法,通过改进深度确定性策略梯度算法(Improved Deep Deterministic Policy Gradient, IDDPG)优化纵向速度以降低能耗,结合深度Q网络算法(Deep Q-Network, DQN)提升横向路径跟踪精度,最终实现运输工况下无人电动拖拉机的高效能与高精度控制。
研究对象
以”金色海马YL-254E”电动拖拉机为原型,分别在硬质路面(A→B路径)和越野地形(C→D路径)设计运输轨迹。
方法细节
- 路径生成:采用大疆H20无人机搭载RTK300-GPS北斗设备获取地块边界坐标,通过高斯-克吕格投影(Gauss–Krüger projection)转换为平面坐标,规划S形作业路径与半圆形地头转向。
- 曲率计算:基于公式 ( \kappa = \frac{|x’y” - y’x”|}{(x’^2 + y’^2)^{3⁄2}} ) 量化路径复杂度(图3)。
- 自适应模型预测控制(AMPC):在传统MPC基础上引入参数自适应更新机制(公式10-11),解决速度变化导致的控制器超调问题。
纵向速度控制(IDDPG算法)
- 状态空间:包含车速、电机效率、目标速度、位置等;动作空间为连续加速度。
- 奖励函数:( r_t = k_1(\etat - \eta{\text{base}}) - k2|t{\text{actual}} - t_{\text{target}}| ),平衡电机效率与运输时间。
- 创新点:
- 优先经验回放(Prioritized Experience Replay)提升学习效率;
- 目标网络软更新(( \theta’ \leftarrow \tau\theta + (1-\tau)\theta’ ))增强稳定性;
- 探索噪声(公式17)增加动作多样性。
横向速度控制(DQN算法)
- 状态空间:横向偏差、相对偏航角及其导数;动作空间为离散转向角(-15°至15°,步长1°)。
- 奖励函数:( r_t = -(10e_1^2 + 5e_2^2 + 2u^2 + 5\dot{e}_1^2 + 5\dot{e}_2^2) ),强化跟踪精度。
多智能体耦合机制
Agent 1(IDDPG)与Agent 2(DQN)通过功率需求与轨迹偏差反馈形成闭环控制(图8),实现能耗与精度的动态平衡。
电机能耗测试
- 平台:高精度电机测试台架,模拟运输载荷。
- 结果:
- 硬质路面:IDDPG-DQN方案比原型机降低能耗38.8%(SOC消耗从0.0031降至0.0019);
- 越野地形:能耗降低25.3%(SOC消耗从0.019降至0.0142)(图10)。
路径跟踪测试
- 场景:开放场地RTK-GPS定位,对比原型机、AMPC、IDDPG-DQN-AMPC三种控制器。
- 结果:
- 直线行驶最大横向偏差:硬质路面从13.6 cm(原型)降至2.5 cm(IDDPG-DQN),越野地形从11.3 cm降至2.9 cm(图12-13);
- 转向时前轮角波动显著减小。
科学意义
- 首次提出运输工况下无人电动拖拉机的多目标协同控制框架;
- 验证了深度强化学习在农业机械非线性控制中的适用性。
应用价值
- 为智能农业装备提供理论支持,推动电动拖拉机在物流运输场景的落地;
- 算法可扩展至其他非结构化环境下的车辆控制(如果园运输)。
局限性
- 未考虑多机协同运输的通信延迟问题;
- 奖励函数的安全裕度仅依赖速度与制动约束,未来需集成安全距离等指标。
此研究为高阶农业无人系统的智能控制提供了可扩展的技术范式,其方法论对复杂工况下的多目标优化具有普适参考价值。