基于光谱技术与深度学习模型的玉米品种识别方法研究报告
作者及机构
本研究由黑龙江八一农垦大学信息与电气工程学院的Jiao Yang、Xiaodan Ma、Haiou Guan(通讯作者)、Chen Yang,以及农业农村部东北低炭绿色农业重点实验室的Yifei Zhang、Guibin Li、Zesong Li共同完成,发表于2023年的《Infrared Physics & Technology》期刊(卷128,文章编号104533),在线发布于2022年12月31日。
学术背景
玉米是全球主要粮食作物之一,但不同品种的营养成分、价格及用途差异显著。传统识别方法依赖人工观察或化学分析,存在效率低、成本高且可能破坏种子的问题。近红外光谱(Near-Infrared Spectroscopy, NIR)技术因其快速、无损的特性,结合深度学习模型,为作物品种识别提供了新思路。本研究旨在通过NIR光谱与一维卷积神经网络(LeNet-5)的结合,构建高精度、高效率的玉米品种识别模型,以解决传统方法的局限性。
研究流程
1. 数据采集与预处理
- 样本来源:实验材料为黑龙江省绥化市安达原种场的5个玉米品种(德美亚1号、德美亚3号等),共450组样本。种子经烘干、研磨后过100目筛,制成粉末样本。
- 光谱采集:使用德国Bruker公司的傅里叶变换近红外光谱仪(Tango)采集光谱数据,波数范围3940–11542 cm⁻¹,分辨率8 cm⁻¹。
- 数据预处理:采用去趋势算法(De-trending, DT)消除基线漂移,并通过竞争性自适应重加权采样算法(Competitive Adaptive Reweighting Sampling, CARS)从1845个原始波数中筛选出114个特征波数,数据维度降低94%。
模型构建与训练
模型验证与结果分析
主要结果
- 预处理效果:DT算法使训练集决定系数(R²)提升至0.7684,均方根误差(RMSE)降至0.6771,优于SNV和MSC方法。
- 特征提取:CARS算法筛选的114个特征波数包含与玉米淀粉、蛋白质相关的关键吸收峰(如7344 cm⁻¹、5317 cm⁻¹),显著提升模型稳定性。
- 模型优势:LeNet-5通过局部卷积和池化操作,有效捕捉光谱的局部特征,其训练集准确率100%,损失函数值仅0.0077,远优于原始数据模型(准确率70%)。
结论与价值
1. 科学价值:首次将NIR光谱与1D-CNN结合,验证了深度学习在作物品种识别中的高效性,为农业光谱分析提供了新方法。
2. 应用价值:模型可实现玉米品种的快速无损检测,适用于种子质量监管、杂交品种鉴定等实际场景。
3. 技术推广:该方法可扩展至其他作物(如水稻、小麦)的品种识别,未来可通过数据增强进一步提升小样本场景下的泛化能力。
研究亮点
- 方法创新:提出DT-CARS-LeNet-5联合流程,解决了传统光谱分析中冗余信息多、建模速度慢的问题。
- 性能突破:识别准确率接近100%,且单样本检测时间不足0.4秒,满足实时检测需求。
- 跨学科应用:将计算机视觉领域的LeNet-5网络适配于光谱数据,为农业信息化提供了跨学科范例。
其他价值
研究还探讨了不同预处理算法(如MSC、SNV)的适用场景,并提出针对固体颗粒样本的DT算法优化建议,为后续研究提供了技术参考。