分享自:

基于高通量表型平台的小麦品种与生长阶段识别混合CNN-Transformer模型

期刊:Computers and Electronics in AgricultureDOI:10.1016/j.compag.2024.109882

基于高光谱成像与深度学习的冬小麦品种及生长阶段识别研究

作者与发表信息

本研究由韩国庆熙大学(Kyung Hee University)智能农业科学系的Yu-Jin Jeon、Dae-Hyun Jung团队与韩国原子能研究所(Korea Atomic Energy Research Institute)的Min Jeong Hong、Chan Seop Ko等合作完成,发表于Computers and Electronics in Agriculture期刊2025年第230卷。

学术背景

研究领域:本研究属于农业信息学与植物表型组学的交叉领域,结合高光谱成像(Hyperspectral Imaging, HSI)技术与深度学习算法,旨在解决小麦育种中的品种快速鉴定与生长监测问题。

研究动机:全球气候变化导致传统优势小麦品种的适应性下降(“交叉互作”现象),而现有育种技术依赖耗时的人工表型分析。高光谱技术可捕捉叶片生化成分的细微差异(如蛋白质、水分含量),但传统分析方法难以处理高维数据。因此,本研究提出一种混合CNN-Transformer模型,以实现高通量表型分析。

目标
1. 开发一种基于高光谱数据的深度学习模型,准确识别6个冬小麦品种及其3个关键生长阶段(分蘖期、茎伸长期、抽穗期);
2. 验证模型在真实栽培系统中的实用性,为育种决策提供自动化工具。

研究方法与流程

1. 材料准备与数据采集

研究对象:6个韩国主栽冬小麦品种(Tabdong、Jinpum、Dajung、Joa、Baeggang、Saegeumgang),其形态特征相似但遗传背景差异显著(见表1)。

实验平台
- 高通量表型平台:配备自动化传送带和暗室高光谱成像系统(MicroHSI 410Shark光谱仪,波长范围400-1000nm,151个波段)。
- 环境控制:温度15-24°C,湿度40-70%,光照周期12小时,每日定时采集图像(2021年8月至9月)。

2. 数据预处理

关键步骤
1. ROI提取:基于NDVI值(0.2-0.5)从叶片区域随机提取3×3像素块,每个样本生成1-3个ROI,数据格式为(3,3,151)。
2. 数据重塑:对每个ROI的9个像素求平均,降维至(1,151)的一维光谱向量。
3. 光谱预处理
- 异常值剔除:利用Scipy的find_peaks函数检测反射峰,剔除峰值数<10的样本;
- Savitzky-Golay平滑滤波:窗口长度30,多项式阶数3,降低噪声;
- 标准正态变换(SNV):消除散射效应,公式为$(x_i - \bar{x})/\sigma$。

3. 模型构建

混合架构设计
- 1D-CNN模块:两层卷积(64和128个滤波器,核大小10),ReLU激活,批归一化,最大池化(窗口2),全局平均池化。
- Transformer编码器:多头自注意力机制(公式5-8),残差连接与层归一化,前馈网络(128维)。
- 模型变体:通过叠加1-3个Transformer块(1D-CNN-1TF至1D-CNN-3TF)比较性能。

训练设置
- 数据集划分:训练集:验证集:测试集=6:2:2;
- 评估指标:总体准确率(OA)、Kappa系数、F1分数等。

主要结果

1. 模型性能

  • 品种识别:1D-CNN-1TF模型表现最佳,测试集OA达94.05%(Kappa 92.78%),显著优于纯CNN模型(OA 79.52%)。混淆矩阵显示,遗传背景相近的品种(如Baeggang与Saegeumgang)易被误判,但Transformer模块通过捕捉全局依赖关系改善了区分度。
  • 生长阶段识别:1D-CNN-2TF模型OA达99.24%,各阶段分类误差均%。t-SNE可视化显示,模型将生长阶段按时间顺序线性分离(图14d),反映其捕捉生理连续变化的能力。

2. 光谱特征分析

  • 敏感波段:734-773nm(最高反射率)、555-635nm(叶绿素特征)对品种鉴别贡献显著;
  • 预处理效果:SNV处理后,不同品种的光谱差异放大(图6c),表明归一化对模型学习至关重要。

3. 计算效率

  • 参数量:1D-CNN-1TF含78.6万参数,预测单样本耗时0.52秒,满足实时监测需求;
  • 过拟合控制:Dropout(20%-50%)与早停策略有效抑制了Transformer层的波动性(图8b)。

结论与价值

科学意义
1. 首次将Transformer的自注意力机制引入小麦高光谱分析,证明其能增强CNN对长程光谱依赖的建模能力;
2. 揭示了小麦叶片生化成分(如氮含量)与光谱特征的关联模式,为表型-基因型关联研究提供新工具。

应用价值
- 育种加速:模型可集成至自动化栽培系统,实现品种适应性的大规模筛选;
- 精准农业:生长阶段实时监测有助于优化水肥管理,应对气候变化导致的生育期变异。

研究亮点

  1. 方法创新:提出1D-CNN-Transformer混合架构,在保持CNN局部特征提取优势的同时,通过自注意力捕捉光谱全局上下文;
  2. 技术整合:将高光谱成像、深度学习与农业表型平台无缝结合,建立从数据采集到决策的闭环流程;
  3. 可扩展性:框架可迁移至其他作物(如水稻、玉米)的品种鉴定与胁迫响应分析。

其他发现

  • 数据量影响:即使样本量有限(每品种约300-500条光谱),通过数据增强与迁移学习仍可实现高精度;
  • 硬件兼容性:模型可部署于边缘设备(如无人机载光谱仪),推动田间实时表型分析的发展。

(注:文中图表及参考文献索引请参见原文献)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com