本文介绍了一项关于基于机器学习的食用昆虫(黄粉虫,Tenebrio molitor)养殖多用途监测系统的研究。该研究由Paweł Majewski、Piotr Zapotoczny、Piotr Lampa、Robert Burduk和Jacek Reiner等人合作完成,研究团队分别来自波兰弗罗茨瓦夫理工大学信息与通信技术学院、奥尔什丁大学系统工程系以及弗罗茨瓦夫理工大学机械工程学院。该研究于2022年发表在《Scientific Reports》期刊上。
随着全球人口的增长,动物蛋白的需求不断增加,传统的畜牧业面临着水资源消耗、空间占用和温室气体排放等环境问题。联合国预测,到2030年,人类每日蛋白质摄入量将达到39克,到2050年将达到57克。为了解决这一问题,工业化的昆虫养殖被认为是一种可持续的替代方案。黄粉虫因其丰富的营养价值和低碳足迹,被欧洲食品安全局(EFSA)列为新型食品目录中的第一种昆虫。然而,大规模养殖黄粉虫需要自动化技术的支持,尤其是监测系统的开发,以提高生产效率并减少人工干预。
本研究旨在开发一个基于机器学习的多模块监测系统,用于黄粉虫养殖的自动化监测。该系统包括三个主要模块:实例分割模块(Instance Segmentation Module, ISM)、语义分割模块(Semantic Segmentation Module, SSM)和幼虫表型模块(Larvae Phenotyping Module, LPM)。通过这些模块,系统能够自动识别黄粉虫的不同生长阶段(幼虫、蛹、成虫),检测异常情况(如死亡幼虫和害虫),并提取饲料、几丁质和粪便等区域。此外,系统还能够计算幼虫的长度、曲率、质量等表型特征,并分析整个种群的生长分布。
研究采用了多种机器学习模型,包括Mask R-CNN、U-Net和线性判别分析(LDA),并通过合成图像生成技术来减少模型开发时间。具体步骤如下:
问题定义与系统概念:研究将问题分为三类,分别对应实例分割、语义分割和幼虫表型分析。实例分割模块用于检测黄粉虫的生长阶段和异常情况;语义分割模块用于提取饲料、几丁质和粪便区域;幼虫表型模块则用于计算幼虫的长度、曲率、质量等特征。
数据采集:研究团队在黄粉虫养殖箱中采集了高分辨率的RGB图像,使用Phoenix PHX120S-CC相机进行图像采集,并通过中性白光照明减少昆虫的应激反应。
数据标注:标注过程分为两个阶段。第一阶段是手动标注,第二阶段通过改进的标注工具(LabelTenebrioApp)进行半自动标注,以提高标注效率。
合成图像生成:为了减少标注时间和提高模型的鲁棒性,研究提出了一种基于对象池的2D合成图像生成方法。通过随机放置对象池中的图像元素,生成高密度的合成图像,用于训练实例分割和语义分割模型。
模型训练与评估:研究使用了Mask R-CNN进行实例分割,U-Net进行语义分割,并通过线性判别分析(LDA)等方法进行幼虫表型分析。模型的性能通过F1分数、精度和召回率等指标进行评估。
研究结果表明,开发的监测系统在黄粉虫生长阶段的检测和异常情况的识别上表现出色。实例分割模块的平均F1分数超过0.88,语义分割模块的平均F1分数超过0.95。此外,幼虫表型模块能够准确计算幼虫的长度、曲率和质量,并有效估计整个种群的生长分布。研究还发现,合成图像生成技术显著提高了模型的鲁棒性,尤其是在处理高密度场景和少数类对象时。
本研究开发的基于机器学习的黄粉虫养殖监测系统具有重要的科学和应用价值。它不仅能够提高黄粉虫养殖的自动化水平,减少人工干预,还能够为养殖者提供实时的生长监测和异常检测。该系统的成功应用为未来大规模昆虫养殖提供了技术支持,尤其是在实验室研究和实际养殖环境中。此外,研究提出的合成图像生成方法和多模块监测系统的设计思路,也为其他农业自动化监测系统的开发提供了参考。
未来的研究将集中在以下几个方面:1)改进合成图像生成过程,提高生成图像的质量;2)提高幼虫表型模块的计算效率;3)扩展幼虫表型模块,涵盖更多黄粉虫生长阶段的特征;4)开发基于时间数据的幼虫活动监测模块;5)长期观察黄粉虫的生长状态和行为模式;6)将幼虫特征与疾病或不良状态的症状关联起来;7)实现个体幼虫和成虫的重新识别。
本研究为黄粉虫养殖的自动化监测提供了重要的技术基础,并为未来的昆虫养殖研究开辟了新的方向。