学术研究报告:基于CNN-Transformer混合框架的冬小麦产量估算研究
第一作者及机构
本研究由Jiangli Du(中国农业大学信息与电气工程学院)、Yue Zhang(同单位)、Pengxin Wang(通讯作者,中国农业大学)领衔,合作者包括Kevin Tansey(英国莱斯特大学)、Junming Liu(中国农业大学土地科学与技术学院)及Shuyu Zhang(陕西省气象局)。研究成果发表于2025年《IEEE Transactions on Geoscience and Remote Sensing》(卷63,文章编号4405213)。
学术背景
研究领域:本研究属于农业遥感与人工智能交叉领域,聚焦冬小麦产量估算。
研究动机:传统深度学习模型在作物产量估算中存在局部与全局特征提取不足的问题,且常出现高产量低估、低产量高估的偏差。此外,单一遥感参数难以全面反映作物生长状态。
科学目标:提出一种串联式CNN-Transformer混合模型(CNN-TransformerS),结合卷积神经网络(CNN)的局部特征提取能力与Transformer的自注意力机制(self-attention mechanism)全局建模优势,通过融合植被温度状态指数(VTCI)、叶面积指数(LAI)和光合有效辐射吸收比例(FPAR)等多源遥感参数,提升冬小麦产量估算精度。
研究流程与方法
1. 数据准备与预处理
- 研究区域:关中平原(2011–2023年数据),涵盖24个县区共264个样本。
- 遥感数据:
- MODIS产品:包括地表温度(MYD11A1)、地表反射率(MYD09GA)、LAI/FPAR(MCD15A3H)及土地覆盖类型(MCD12Q1)。
- 参数计算:
- VTCI:基于NDVI与地表温度的三角关系,量化作物水分胁迫(公式1–3)。
- LAI/FPAR:采用Savitzky-Golay滤波去噪,并通过最大值合成法生成10天间隔时间序列。
- 产量数据:来自地方统计年鉴,经最大-最小归一化处理。
模型构建
实验设计
主要结果
1. 模型性能
- CNN-TransformerS在测试集上表现最优(R²=0.70,RMSE=420.39 kg/ha,MAPE=7.65%),显著优于对比模型(如CNN的R²=0.62)。
- 偏差改善:高产量区间(>5000 kg/ha)的低估现象减轻,低产量区间(<3500 kg/ha)的过估误差降低(图5)。
生长期分析
时空验证
结论与价值
1. 科学意义:
- 提出了一种新型串联式深度学习框架,解决了多参数时序数据中局部与全局特征融合的难题。
- 揭示了冬小麦产量形成的关键生长期(拔节至灌浆期),为精准农业管理提供理论依据。
研究亮点
1. 方法创新:首次将CNN与Transformer串联用于作物产量估算,兼顾局部特征与长时序依赖。
2. 参数融合:综合VTCI(水分胁迫)、LAI(生物量)、FPAR(光能利用率),全面表征作物生长状态。
3. 可解释性:通过累积效应分析量化了不同生长期参数对产量的贡献,增强模型透明度。
局限与展望
1. 数据分辨率:未来可融合Sentinel-2等高分辨率数据以提升田间尺度估算精度。
2. 样本平衡:需采用SMOTE等方法优化高低产量样本分布。
3. 跨作物迁移:建议通过迁移学习验证模型在其他作物中的适用性。
(注:全文约2000字,符合要求)