分享自:

Deepspecn:一种结合PROSPECT-Pro与Conv-Transformer从叶片反射率估算叶片氮含量的新型混合方法

期刊:Plant PhenomicsDOI:https://doi.org/10.1016/j.plaphe.2025.100125

本文档发表于Plant Phenomics期刊,最新版本收到日期为2025年10月8日。研究团队由来自多个机构的学者组成:第一作者Shuai Yang及其他主要作者Anirudh BelwalkarDong LiYufeng GeTao ChengFei WuLongkang PengDaoliang Li和通讯作者Kang Yu。作者单位包括德国慕尼黑工业大学(TUM)精准农业实验室、中国农业大学国家数字渔业创新中心、农业农村部智慧养殖(水产畜禽)技术重点实验室、内布拉斯加大学林肯分校生物系统工程系及植物科学创新中心、南京农业大学国家信息农业工程技术中心(NETCIA)以及香港理工大学土地测量及地理资讯学系。

学术背景

本研究属于农业遥感与植物表型学交叉领域,聚焦于利用高光谱技术进行叶片氮含量(Leaf Nitrogen Content, LNC)的非破坏性精准估算。氮是植物生长发育的关键元素,传统的实验室化学分析方法耗时费力且具有破坏性。高光谱遥感提供了一种经济、高效、无损的替代方案。目前估算LNC的方法主要分为三类:经验方法(如植被指数和机器学习模型)、物理方法(基于辐射传输模型,如PROSPECT)以及结合两者优势的混合方法。

然而,现有方法均存在局限性:经验方法严重依赖大量实地数据进行模型训练,泛化能力差;物理方法(如PROSPECT模型反演)受限于“病态反演”问题(即不同叶片性状组合可能产生相似的光谱反射率);而混合方法虽然利用物理模型生成模拟数据来训练统计模型,但面临从模拟数据域(通常基于方向半球反射率DHRF)到实地测量数据域(通常基于双向反射率BRF)的“域偏移”问题。这种偏移主要由叶片表面的镜面反射以及物理模型对现实世界简化的不确定性引起,导致在模拟数据上训练出的模型应用于实地数据时性能下降。因此,开发一种无需实地训练数据、能够有效克服域偏移、实现高精度跨物种LNC估算的新型混合方法,是当前研究的关键挑战与目标。

研究目的

本研究旨在提出一种名为DeepSpecN的新型混合方法,以解决上述挑战。该方法的核心目标是:在不依赖任何实地训练数据的前提下,仅利用物理模型生成的模拟数据训练深度学习模型,实现对多种作物叶片氮含量的高精度、高泛化能力估算。具体子目标包括:1)将DeepSpecN与多种物理反演方法、基于植被指数的参数回归方法以及其他非参数回归混合方法进行性能对比;2)评估基于叶绿素和基于叶蛋白两种LNC估算经验公式的准确性;3)评估基于光谱相似性的样本选择策略对模型性能的影响;4)测试DeepSpecN在玉米、小麦、水稻和高粱四种不同作物上的泛化能力,并通过消融实验分析各组件贡献。

详细工作流程

本研究的工作流程系统而复杂,主要包括数据准备、方法构建、模型训练与验证、以及泛化测试几个核心阶段。

第一阶段:数据收集与处理。 研究使用了多种作物的叶片级高光谱双向反射率数据。主要数据集来自2018-2020年采集的1724个玉米叶片样本。光谱测量使用配备接触式探头的FieldSpec4光谱辐射计,范围350-2500 nm。每个叶片在叶尖、中部和叶基(避开中脉)各测量三次,取九次测量的平均值作为最终光谱。测量前使用白板和黑板进行标定。采样后,测量叶面积和鲜重,烘干后测量干重,并使用杜马斯法测定质量基础的氮浓度,进而计算出面积基础的LNC(g/m²)、叶片等效水厚度和比叶重。

一个关键挑战是,用于生成模拟数据的PROSPECT-PRO模型的输出不直接包含LNC。为此,研究采用了两种代理途径来从模拟数据推算LNC:一是基于叶绿素含量的氮分配模型,二是基于叶蛋白含量的蛋白-氮转换模型。这样,模拟数据集就同时包含了光谱反射率(DHRF)和通过上述两种模型计算出的LNC标签。

第二阶段:构建大规模模拟数据库与对比方法准备。 研究使用PROSPECT-PRO模型,在其输入参数(如叶结构参数、叶绿素、类胡萝卜素、水、蛋白、碳基组分含量)的合理范围内,基于均匀分布随机生成了20万组参数组合,对应产生了20万条模拟的叶片方向半球反射率光谱,构建了一个大型查找表。这构成了后续所有混合方法训练的“源域”数据。

同时,研究准备了三大类对比方法:1)基于物理的查找表反演方法:包括标准PROSPECT-PRO反演、考虑镜面反射减除的ProRef、考虑方向效应和叶倾角变化的ProCosine、结合连续小波变换的ProcWT(三个不同尺度)、以及结合光谱导数和相似性度量的ProSDM(四种变体),共五种物理反演变体。2)基于植被指数的参数回归方法:从文献中选取了30种高光谱植被指数,在模拟数据上拟合线性回归模型。3)基于非参数回归的混合方法:选取了多种机器学习模型作为对比,包括支持向量回归、Lasso、LightGBM以及长短期记忆网络。

第三阶段:DeepSpecN方法框架的构建。 这是本研究的核心创新,包含三个关键组件,旨在系统性地解决域偏移问题。 * 组件一:基于光谱相似性的样本选择策略。为了解决大模拟数据库中可能包含大量与实地数据分布差异大甚至不切实际的样本(这些样本会干扰模型训练)的问题,研究提出了一种样本筛选方法。对于每一条实地测量光谱,使用不同的成本函数(对应上述不同的物理反演方法)计算其与20万条模拟光谱的相似度,然后为每条实地光谱选取相似度最高的前100条模拟光谱。合并所有被选中的模拟光谱(去除重复项),形成一个规模更小但更具代表性的新训练集,称为T100数据集。这个过程实质上是根据目标域(实地数据)的分布,从源域(模拟数据)中主动筛选出分布更接近、对目标任务更有价值的训练样本。 * 组件二:光谱变换以减少镜面反射影响。为了缩小模拟DHRF光谱与实地BRF光谱之间的系统性差异,研究测试了多种光谱变换方法:连续小波变换、伪DHRF生成、光谱一阶导数以及基于特定波段反射率减除的方法。这些变换被同时应用于筛选出的T100模拟数据和实地数据,旨在增强吸收特征,削弱镜面反射等无关变异的影响。 * 组件三:改进的Conv-Transformer深度学习模型。针对高光谱数据波段多、相邻波段相关性高、信息冗余的特点,研究设计了一个新颖的深度学习架构。该架构融合了一维卷积神经网络和Transformer编码器。其工作流程是:首先通过嵌入层和位置编码处理输入光谱;然后,一维CNN层负责提取局部相邻波段间的特征,并通过步长卷积进行下采样以降低计算复杂度;最后,多个Transformer编码器块通过自注意力机制捕获光谱波段间的长程全局依赖关系。该模型被命名为Conv-Transformer。研究还设计了一个没有CNN层的对照模型(eTransformer)用于消融实验。

第四阶段:模型训练、比较与验证。 使用不同的训练集(完整的20万模拟数据集或各种T100数据集)和不同的光谱变换方法,分别训练DeepSpecN(Conv-Transformer)及其他对比模型。所有模型均在模拟数据上训练,最终在独立的1724个玉米叶片实地数据上进行验证,以均方根误差和决定系数作为主要评价指标。首先,在玉米数据上全面比较DeepSpecN与所有对比方法的性能。其次,进行消融实验,分别评估样本选择策略和Conv-Transformer模型结构改进的贡献。最后,将表现最佳的DeepSpecN模型框架直接应用于小麦、水稻和高粱的独立数据集,测试其跨物种泛化能力,无需针对这些物种重新训练或调整模型。

主要结果

本研究得到了系统且富有洞见的结果,有力支撑了其提出的新方法的优越性。

1. 不同方法在玉米LNC估算上的性能比较。 综合比较显示,DeepSpecN方法取得了最佳性能。当使用基于光谱相似性筛选出的T100-ProcWT-s4数据集进行训练,并结合连续小波变换时,DeepSpecN达到了所有方法中最高的估算精度。具体而言,其决定系数达到0.665,均方根误差为0.247 g/m²。这一结果显著优于:a) 所有五种物理反演方法(其中最好的ProcWT-s5为0.603);b) 所有其他非参数回归混合方法(如LightGBM、SVR、LSTM等);c) 所有30种基于植被指数的参数回归方法(其中最好的为0.494)。这充分证明了DeepSpecN集成框架的有效性。

2. 样本选择策略的关键作用。 研究结果明确显示,基于光谱相似性的样本选择策略对提升模型性能至关重要。对于大多数模型(特别是深度学习模型和SVR、Lasso等),使用经过筛选的、规模小得多的T100数据集(约1万条样本)进行训练,其性能反而优于使用完整的20万条模拟数据集进行训练。例如,SVR模型在使用T100数据集后,其从0.483提升至0.655。这表明,在混合建模中,训练样本的质量和代表性远比数量重要。该策略有效地过滤了与目标域分布差异过大的“有害”模拟样本,缓解了域偏移问题,使模型能够更专注于学习对实地数据预测有用的特征。

3. Conv-Transformer模型架构的优势。 消融实验证实了所提出的Conv-Transformer架构的优越性。在同样使用T100数据集训练的情况下,Conv-Transformer的性能显著优于其简化版eTransformer(在玉米上,从0.346提升至0.665)。这表明,一维CNN层对局部特征的提取能力与Transformer对全局依赖的捕获能力形成了有效互补,共同增强了模型从高光谱数据中学习复杂模式以预测LNC的能力。

4. LNC计算公式的影响。 研究发现,基于叶绿素的氮分配模型的估算精度 consistently且显著高于基于叶蛋白的蛋白-氮转换模型。对于后者,无论是物理反演方法还是混合方法,估算精度都很低。这可能是因为叶片蛋白的吸收特征较弱,且与水和干物质的吸收波段重叠,导致光谱信号难以有效分离;也可能是因为蛋白-氮转换系数对于某些作物(如本研究中的玉米)并不完全适用。这一发现对后续研究中选择合适的LNC代理变量具有指导意义。

5. 卓越的跨物种泛化能力。 这是本研究最突出的成果之一。将仅在玉米模拟数据上训练和优化的DeepSpecN框架(包括其最佳光谱变换方法和样本选择策略),直接应用于小麦、水稻和高粱的独立实地数据集,无需任何针对这些物种的再训练或调整,均取得了良好的预测性能。具体结果为:小麦 0.754,水稻 0.609,高粱 0.488。这强有力地证明了DeepSpecN方法具备强大的跨物种泛化能力,为解决模型迁移性差的难题提供了有效方案。

结论与价值

本研究成功开发并验证了DeepSpecN这一新型混合方法。其核心结论是:通过有机结合连续小波变换、PROSPECT-PRO物理模型、基于光谱相似性的智能样本选择策略以及改进的Conv-Transformer深度学习架构,可以在完全不依赖任何目标作物实地训练数据的情况下,实现对多种作物叶片氮含量的高精度、非破坏性估算。该方法显著优于现有的物理方法、经验方法和传统混合方法。

其科学价值在于:1)系统性地提出并验证了解决混合方法中“域偏移”问题的综合技术路线,特别是强调了训练样本选择的重要性,为后续相关研究提供了新范式。2)设计了一种融合CNN与Transformer优势的新型高光谱数据处理网络架构,提升了模型从复杂光谱中提取特征的能力。3)实证了在跨物种叶片性状反演中,仅使用模拟数据训练模型的可行性与巨大潜力,降低了模型对昂贵、难以获取的实地标注数据的依赖。

其应用价值显著:DeepSpecN为农业精准管理中的氮素监测提供了一种高效、低成本、可推广的技术工具。农民或农技人员只需获取叶片的高光谱反射数据,即可利用已训练好的模型快速估算氮含量,指导精准施肥,从而提高肥料利用率、减少环境污染、保障作物产量和品质。该框架也有潜力被扩展应用于估算其他叶片生化参数或扩展到冠层尺度。

研究亮点

  1. 方法创新性:提出了首个将PROSPECT-PRO物理模型、连续小波变换、智能样本选择与Conv-Transformer深度学习架构深度融合的混合方法框架,构思系统且新颖。
  2. 解决关键难题:明确针对并有效缓解了“域偏移”这一制约混合方法性能的核心瓶颈,通过样本选择策略实现了从模拟域到实地域的“软”对齐。
  3. “零样本”跨物种泛化:实现了在无需目标物种任何训练数据情况下的高精度跨物种LNC估算,展示了强大的泛化能力和实际应用前景,是该研究最突出的贡献。
  4. 详实的对比与消融分析:研究设计严谨,与多种基线方法进行了全面对比,并通过消融实验清晰揭示了各创新组件的独立贡献,论证充分。
  5. 对LNC估算路径的深入洞察:研究结果明确指出了基于叶绿素的估算路径在当前更具可靠性,为相关研究提供了重要参考。

其他有价值内容

研究也坦诚讨论了当前方法的局限性并指出了未来方向。例如,DeepSpecN的精度仍依赖于模拟数据与LNC之间映射关系的准确性,如果物理模型本身对某些作物(如研究中表现相对较差的高粱)的参数化存在偏差,则会影响最终效果。未来工作可着眼于:1)收集更多样化的作物和环境数据以改进物理模型参数;2)将框架扩展到冠层尺度的氮素建模;3)探索同时估算多种叶片性状的能力。这些思考使得研究结论更为客观,并为后续研究指明了路径。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com