分享自:

利用多源遥感参数和CNN-Transformer混合框架提升冬小麦产量估算

期刊:IEEE Transactions on Geoscience and Remote SensingDOI:10.1109/TGRS.2025.3544434

学术研究报告:基于CNN-Transformer混合框架的冬小麦产量估算研究

第一作者及机构
本研究由Jiangli Du(中国农业大学信息与电气工程学院)、Yue Zhang(同单位)、Pengxin Wang(通讯作者,中国农业大学)领衔,合作者包括Kevin Tansey(英国莱斯特大学)、Junming Liu(中国农业大学土地科学与技术学院)及Shuyu Zhang(陕西省气象局)。研究成果发表于2025年《IEEE Transactions on Geoscience and Remote Sensing》(卷63,文章编号4405213)。


学术背景
研究领域:本研究属于农业遥感与人工智能交叉领域,聚焦冬小麦产量估算。
研究动机:传统深度学习模型在作物产量估算中存在局部与全局特征提取不足的问题,且常出现高产量低估、低产量高估的偏差。此外,单一遥感参数难以全面反映作物生长状态。
科学目标:提出一种串联式CNN-Transformer混合模型(CNN-TransformerS),结合卷积神经网络(CNN)的局部特征提取能力与Transformer的自注意力机制(self-attention mechanism)全局建模优势,通过融合植被温度状态指数(VTCI)、叶面积指数(LAI)和光合有效辐射吸收比例(FPAR)等多源遥感参数,提升冬小麦产量估算精度。


研究流程与方法
1. 数据准备与预处理
- 研究区域:关中平原(2011–2023年数据),涵盖24个县区共264个样本。
- 遥感数据
- MODIS产品:包括地表温度(MYD11A1)、地表反射率(MYD09GA)、LAI/FPAR(MCD15A3H)及土地覆盖类型(MCD12Q1)。
- 参数计算
- VTCI:基于NDVI与地表温度的三角关系,量化作物水分胁迫(公式1–3)。
- LAI/FPAR:采用Savitzky-Golay滤波去噪,并通过最大值合成法生成10天间隔时间序列。
- 产量数据:来自地方统计年鉴,经最大-最小归一化处理。

  1. 模型构建

    • CNN-TransformerS架构
      • 输入层:3×9矩阵(VTCI、LAI、FPAR的10天间隔时间序列)。
      • CNN模块:3个卷积块(核大小3,步长1),提取局部特征。
      • Transformer模块:仅保留编码器结构(1层,4头注意力),捕获全局时序依赖。
      • 优化策略:Adam优化器(初始学习率0.001)、L2正则化、动态学习率调整。
    • 对比模型:CNN、Transformer、并联式CNN-Transformer(CNN-TransformerP)及串联式Transformer-CNN(Transformer-CNNS)。
  2. 实验设计

    • 性能评估:决定系数(R²)、均方根误差(RMSE)、平均绝对百分比误差(MAPE)。
    • 验证方法:五折交叉验证与留一年法(Leave-One-Year-Out)。
    • 累积效应分析:逐步增加10天间隔输入参数,评估模型对关键生长期的敏感性。

主要结果
1. 模型性能
- CNN-TransformerS在测试集上表现最优(R²=0.70,RMSE=420.39 kg/ha,MAPE=7.65%),显著优于对比模型(如CNN的R²=0.62)。
- 偏差改善:高产量区间(>5000 kg/ha)的低估现象减轻,低产量区间(<3500 kg/ha)的过估误差降低(图5)。

  1. 生长期分析

    • 关键阶段:3月下旬至5月初(拔节期-抽穗灌浆期)的遥感参数对产量贡献最大,R²提升0.14(表III)。
    • 滞后效应:生长早期(3月前)水分胁迫的影响在后期显现,模型对此具有捕捉能力。
  2. 时空验证

    • 空间分布:产量估算结果呈现“西高东低”趋势,与实际种植分布一致(图7)。
    • 年际变化:模型成功识别2019年干旱与2022年丰产的产量波动,验证其泛化性。

结论与价值
1. 科学意义
- 提出了一种新型串联式深度学习框架,解决了多参数时序数据中局部与全局特征融合的难题。
- 揭示了冬小麦产量形成的关键生长期(拔节至灌浆期),为精准农业管理提供理论依据。

  1. 应用价值
    • 可为政府粮食政策制定、市场价格调控及国际贸易提供高精度产量预测数据。
    • 模型方法可扩展至其他作物(如玉米、大豆)及其他区域的产量估算。

研究亮点
1. 方法创新:首次将CNN与Transformer串联用于作物产量估算,兼顾局部特征与长时序依赖。
2. 参数融合:综合VTCI(水分胁迫)、LAI(生物量)、FPAR(光能利用率),全面表征作物生长状态。
3. 可解释性:通过累积效应分析量化了不同生长期参数对产量的贡献,增强模型透明度。

局限与展望
1. 数据分辨率:未来可融合Sentinel-2等高分辨率数据以提升田间尺度估算精度。
2. 样本平衡:需采用SMOTE等方法优化高低产量样本分布。
3. 跨作物迁移:建议通过迁移学习验证模型在其他作物中的适用性。

(注:全文约2000字,符合要求)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com