本研究由韩国庆熙大学(Kyung Hee University)智能农业科学系的Yu-Jin Jeon、Dae-Hyun Jung团队与韩国原子能研究所(Korea Atomic Energy Research Institute)的Min Jeong Hong、Chan Seop Ko等合作完成,发表于Computers and Electronics in Agriculture期刊2025年第230卷。
研究领域:本研究属于农业信息学与植物表型组学的交叉领域,结合高光谱成像(Hyperspectral Imaging, HSI)技术与深度学习算法,旨在解决小麦育种中的品种快速鉴定与生长监测问题。
研究动机:全球气候变化导致传统优势小麦品种的适应性下降(“交叉互作”现象),而现有育种技术依赖耗时的人工表型分析。高光谱技术可捕捉叶片生化成分的细微差异(如蛋白质、水分含量),但传统分析方法难以处理高维数据。因此,本研究提出一种混合CNN-Transformer模型,以实现高通量表型分析。
目标:
1. 开发一种基于高光谱数据的深度学习模型,准确识别6个冬小麦品种及其3个关键生长阶段(分蘖期、茎伸长期、抽穗期);
2. 验证模型在真实栽培系统中的实用性,为育种决策提供自动化工具。
研究对象:6个韩国主栽冬小麦品种(Tabdong、Jinpum、Dajung、Joa、Baeggang、Saegeumgang),其形态特征相似但遗传背景差异显著(见表1)。
实验平台:
- 高通量表型平台:配备自动化传送带和暗室高光谱成像系统(MicroHSI 410Shark光谱仪,波长范围400-1000nm,151个波段)。
- 环境控制:温度15-24°C,湿度40-70%,光照周期12小时,每日定时采集图像(2021年8月至9月)。
关键步骤:
1. ROI提取:基于NDVI值(0.2-0.5)从叶片区域随机提取3×3像素块,每个样本生成1-3个ROI,数据格式为(3,3,151)。
2. 数据重塑:对每个ROI的9个像素求平均,降维至(1,151)的一维光谱向量。
3. 光谱预处理:
- 异常值剔除:利用Scipy的find_peaks函数检测反射峰,剔除峰值数<10的样本;
- Savitzky-Golay平滑滤波:窗口长度30,多项式阶数3,降低噪声;
- 标准正态变换(SNV):消除散射效应,公式为$(x_i - \bar{x})/\sigma$。
混合架构设计:
- 1D-CNN模块:两层卷积(64和128个滤波器,核大小10),ReLU激活,批归一化,最大池化(窗口2),全局平均池化。
- Transformer编码器:多头自注意力机制(公式5-8),残差连接与层归一化,前馈网络(128维)。
- 模型变体:通过叠加1-3个Transformer块(1D-CNN-1TF至1D-CNN-3TF)比较性能。
训练设置:
- 数据集划分:训练集:验证集:测试集=6:2:2;
- 评估指标:总体准确率(OA)、Kappa系数、F1分数等。
科学意义:
1. 首次将Transformer的自注意力机制引入小麦高光谱分析,证明其能增强CNN对长程光谱依赖的建模能力;
2. 揭示了小麦叶片生化成分(如氮含量)与光谱特征的关联模式,为表型-基因型关联研究提供新工具。
应用价值:
- 育种加速:模型可集成至自动化栽培系统,实现品种适应性的大规模筛选;
- 精准农业:生长阶段实时监测有助于优化水肥管理,应对气候变化导致的生育期变异。
(注:文中图表及参考文献索引请参见原文献)