谢晓轩1,2、孔德义2、潘斌1,2、单建华3、谢淮北1,2等研究人员在《农机化研究》2025年第10期(第47卷)发表了题为《基于ROS的植物工厂番茄采摘机器人控制系统设计》的原创性研究论文。该研究由中国科学技术大学、中国科学院合肥物质科学研究院及安徽工业大学机械工程学院合作完成,聚焦农业机器人领域,旨在解决植物工厂环境下番茄采摘自动化程度低的核心问题。
植物工厂作为融合信息技术、生物技术与智能装备的现代农业系统,其自动化需求日益凸显。番茄采摘作为劳动密集型作业,现有机器人多针对大田或温室环境,存在移动灵活性差(如轨道依赖)、控制系统功能单一等局限。研究团队基于机器人操作系统(Robot Operating System, ROS)架构,开发了具备自主导航、视觉识别、高度调节与语音交互能力的分布式控制系统,以适配植物工厂多层种植场景的高效采摘需求。
机器人硬件分为三大模块:
- 移动平台:四轮差速底盘搭载STM32控制器,集成激光雷达(LiDAR)、惯性测量单元(IMU)及编码器,通过ROS的cartographer算法实现同步定位与建图(SLAM),引入IMU与里程计数据约束激光点云匹配误差。
- 采摘模块:采用eye-in-hand型视觉系统(RealSense D435深度相机),七自由度机械臂配合两级滚珠丝杠升降平台,通过MoveIt!功能包实现运动规划;末端夹爪采用伺服电机控制,升降机构通过RS485通信实现高度调节。
- 人机交互:环形六麦克风阵列结合科大讯飞离线SDK实现语音指令识别与反馈,工控机(Intel i7)作为中央处理器协调各模块。
基于ROS的松耦合架构,将功能分解为四大子系统:
- 自主导航子系统:采用cartographer建图算法生成二维栅格地图(图5),结合自适应蒙特卡洛定位(AMCL)算法实现全局位姿估计,通过Dijkstra全局规划与动态窗口法(DWA)局部规划生成路径,控制底盘电机到达目标点。
- 视觉识别子系统:YOLOv5模型检测成熟番茄,通过坐标变换(式1)将相机坐标系下的目标位置转换为机械臂基坐标系坐标,并广播至TF管理器。
- 采摘执行子系统:机械臂路径规划失败时,计算目标高度差(式2)驱动升降平台调节,结合夹爪开合控制完成采摘。
- 人机交互子系统:语音指令触发导航或采摘任务,并通过语音合成反馈状态。
导航精度实验(表1)验证了SLAM算法在植物工厂环境中的鲁棒性,为视觉识别提供了稳定的位姿基准;采摘实验证明分布式控制系统能协调机械臂、升降平台与夹爪的协同作业,高度调节功能显著扩展了机械臂工作空间(图11(f))。语音交互模块的加入提升了系统灵活性,支持任务中断与指令切换。
该研究实现了植物工厂环境下番茄采摘的全程自动化,其创新点包括:
1. 模块化ROS架构:通过分布式节点通信实现功能解耦,便于系统扩展与调试。
2. 多层适应设计:升降平台与eye-in-hand视觉系统解决了高层果实采摘难题。
3. 高精度导航:融合多传感器数据的SLAM算法定位误差<5.5 cm,优于同类研究[8]。
科学价值在于为农业机器人提供了可复用的控制系统框架,应用价值体现在提升植物工厂生产效率,单果采摘耗时较日本松下机器人[5]缩短47.8%。
研究团队开源了部分ROS功能包代码,为后续农业机器人开发提供参考。未来可进一步优化机械臂轨迹规划算法以缩短采摘周期,或扩展至其他果蔬采摘场景。