本研究由内蒙古农业大学的Yuzhe Tang、Fei Li(通讯作者)、Haibo Yang,以及慕尼黑工业大学的Yuncai Hu和Kang Yu合作完成。该研究成果以《A transferable MMD-CWT framework for accurate cross-regional prediction of maize leaf nitrogen using hyperspectral sensing》为题,发表于《European Journal of Agronomy》期刊第177卷(2026年),文章编号128092,于2026年3月24日在线发布。
研究的学术背景: 本研究的核心科学领域是精准农业与高光谱遥感技术交叉融合下的作物氮素营养诊断。氮素是影响作物光合作用、生物量积累和最终产量的关键营养元素。叶片氮浓度(Leaf Nitrogen Concentration, LNC)是衡量作物氮营养状况的核心指标,但其动态变化受品种、生育阶段、灌溉施肥等管理措施及环境条件的显著影响。这导致基于单一数据集或特定条件构建的高光谱LNC预测模型在跨区域、跨管理实践应用时,其鲁棒性和泛化能力往往急剧下降。
传统预测方法主要分为经验方法(如光谱指数、偏最小二乘回归等)和物理方法(如辐射传输模型反演)。经验方法容易受到特定数据集的限制,且所选光谱特征不稳定;物理方法虽具有较好的物理可解释性,但面临反演不适定、模拟数据与实际测量数据存在偏差等挑战。近年来,迁移学习(Transfer Learning)在植物表型预测中展现出潜力,能够提升模型在不同生长条件和数据集间的泛化能力。然而,现有迁移学习方法通常依赖大量高维光谱数据,不利于轻量化传感器的部署;同时,它们往往需要利用目标域数据进行模型更新或重新训练,这削弱了迁移学习的核心优势——即在不依赖大量新数据的情况下进行知识迁移。
因此,本研究旨在解决一个核心矛盾:如何利用尽可能少但信息量丰富的稳定光谱特征,构建一个能够跨越不同品种、管理措施和生长环境的、高鲁棒性和可迁移的玉米LNC预测模型。具体目标有二:一是探究不同玉米品种和管理措施下的叶片光谱多样性及对LNC的影响;二是开发一个新颖的、可迁移的预测框架,该框架将基于最大平均差异(Maximum Mean Discrepancy, MMD)的域适应方法与基于连续小波变换(Continuous Wavelet Transform, CWT)的特征选择方法耦合起来,以实现稳定光谱特征的提取和跨数据集分布差异的弥合。
详细研究流程: 本研究设计严谨,流程清晰,主要包括数据采集、特征提取和迁移模型构建与评估三个核心部分,时间跨度长达五年。
第一部分:数据采集。 研究在内蒙古中西部五个实验点进行了为期五年(2020-2024年)的田间试验,构建了一个包含2865个样本的高质量数据集。该数据集覆盖了多种春玉米品种、不同的氮肥施用策略、灌溉制度(滴灌和漫灌)以及施肥模式(无基氮和基肥+追肥)。在关键生育期(V6, V9, V12, VT, R1),研究人员使用PSR-3500手持式高光谱仪(350-2500 nm)测量了叶片高光谱反射率。测量时使用内置主动光源和叶片夹,以消除环境光和天气影响,并自动进行白板校正和暗电流扣除。每次扫描取叶片上、中、下三个部位共6次测量的平均值作为该叶片的光谱反射率。光谱测量后,立即对相应叶片进行破坏性取样。叶片按冠层垂直位置(上、中、下层)进行分层,烘干、研磨后,使用元素分析仪测定其LNC(%)。这一严谨的数据采集流程确保了光谱数据与生化数据的高度时空同步性,为后续建模奠定了坚实基础。
第二部分:特征提取。 这是本研究的创新核心。研究并行采用了两种特征提取方法进行对比。 1. 基准方法:偏最小二乘回归结合变量重要性投影(PLSR-VIP)。 首先,对每个独立数据集的全光谱(350-2500 nm)建立PLSR模型,通过留一交叉验证确定最佳潜变量数。然后,计算每个波长的VIP得分,以评估其对预测LNC的贡献。研究中设定VIP > 4的波段被选为对LNC敏感的特征波段。这种方法是一种传统的、基于统计相关性的特征选择方法。 2. 本研究所提新方法:最大平均差异-连续小波变换(MMD-CWT)耦合框架。 该方法分为两个关键步骤。第一步是基于MMD的域对齐与稳定光谱区域识别。MMD是一种衡量两个数据集分布差异的非参数统计度量。研究计算了五个高光谱数据集两两之间在整个光谱范围内的MMD值(采用滑动窗口和RBF核函数)。通过计算所有数据集对的平均MMD,找到了分布差异最小的光谱区域,即最有可能在不同条件下保持稳定的区域。结果表明,红波段(600–680 nm)和红边波段(680–750 nm)的平均MMD值最低(<0.3),被选定为后续特征提取的“稳定区域”。第二步是基于CWT的精细特征提取。在第一步确定的稳定光谱区域内,应用连续小波变换对光谱进行多尺度分解。研究选用墨西哥帽小波作为母小波,在10个尺度上进行分解,生成小波能量尺度图。然后,计算每个小波特征(特定波长和尺度下的系数)与所有样本实测LNC之间的皮尔逊相关系数,保留显著性水平p < 0.05的特征。最后,根据相关系数R²的大小对所有显著特征进行排序,选取与LNC相关性最强的前5个小波特征作为最终的光谱特征输入。这一流程巧妙地结合了域适应(寻找分布一致的区域)和多尺度分析(提取对氮敏感的精细特征),旨在获得既稳定又富含信息的特征集。
第三部分:可迁移模型构建与评估。 1. 模型构建: 研究采用迁移成分分析-支持向量回归(TCA-SVR)作为基础迁移学习框架。首先,使用TCA将源域和目标域的光谱特征(来自PLSR-VIP或MMD-CWT)投影到一个共享的潜在特征空间,以最小化域间分布差异。然后,在源域的投影特征上训练一个SVR回归模型,并直接应用于目标域进行LNC预测。 2. 模型更新策略评估(可选): 为了考察在目标域数据有限的情况下模型的表现,研究设计了一个可选的微调策略:随机选择目标域中5%-20%的带标签样本,用于微调TCA-SVR模型中的SVR部分(保持TCA变换不变)。这旨在评估引入少量目标域信息是否能够提升性能。 3. 评估方案: 模型性能评估采用严格的交叉验证和跨数据集迁移测试。首先,在每个数据集内部,按生育期和氮处理分层抽样,将2/3样本作为训练集,1/3作为测试集,评估模型在单一数据集上的性能(内部验证)。然后,进行跨数据集迁移预测:将一个数据集作为源域训练模型,直接预测另一个(目标域)数据集的LNC,以此评估模型的泛化能力和可迁移性。研究系统性地评估了所有可能的源-目标数据集组合(共20种情景)。性能评价指标包括决定系数(R²)和均方根误差(RMSE)。
主要研究结果: 1. 数据变异特征: 五个数据集的LNC分布范围和光谱反射曲线均存在明显差异,证实了跨区域、跨管理条件下数据分布的不一致性。例如,数据集4的LNC平均值最高(2.53%),而数据集3的LNC分布最广、变异系数最高。光谱上,在相同氮处理下,不同数据集的反射率曲线在550-700 nm、近红外和短波红外区域存在显著差异。这直观地展示了直接迁移模型的挑战。 2. 特征提取结果对比: * PLSR-VIP方法: 从不同数据集中筛选出的特征波段高度不一致,主要集中于可见光区(特别是350-400 nm蓝紫光和641-695 nm红光区),仅数据集2在短波红外区(2104-2122 nm)也筛选出部分特征。尽管基于这些特征在各自数据集内部取得了优异的预测精度(R² = 0.75–0.91),但这些特征缺乏跨数据集的一致性,且其位置并不在公认的LNC敏感区域(如红边)。 * MMD-CWT方法: 成功地、一致地从所有五个数据集中识别出位于红边区域(波长在706-740 nm之间,具体取决于数据集)的稳定光谱特征。尽管只使用了5个小波特征,但它们在各个数据集内与LNC表现出很强的相关性。这证明了MMD-CWT框架能够有效过滤掉由环境和品种引起的干扰信息,提取出对氮素生理响应更本质、更稳定的光谱特征。 3. 模型可迁移性结果: 这是检验本研究价值的核心环节。 * PLSR-VIP模型的迁移表现很差。 在大多数跨数据集迁移情景下(例如,从数据集1预测数据集2-5,或从数据集1-4预测数据集5),预测精度极低(R²低至0.02–0.22)。在某些情况下(如预测数据集3),甚至出现了严重的系统性高估。这清晰地表明,基于传统VIP方法选择的特征对源数据集高度特化,缺乏跨域稳定性。 * MMD-CWT框架表现出卓越的可迁移性。 在绝大多数跨数据集迁移情景中,MMD-CWT框架都实现了显著更好的预测精度(R² = 0.57–0.81)。例如,从数据集2、3、4、5预测数据集1,或从数据集1、2、4、5预测数据集3,都取得了很高的准确性。即使在预测具有挑战性的数据集5时,其性能也明显优于PLSR-VIP。这强有力地证明了,通过MMD对齐分布和CWT提取稳健特征,可以极大提升模型在未见过的、管理方式和品种各异的环境中的预测能力。 4. 模型更新策略的影响: 补充分析表明,引入少量(20%)目标域数据进行模型微调,对MMD-CWT模型的性能提升有限(RMSE仅降低0.02–0.28%),且当样本比例超过20%后,性能提升达到饱和。对于数据集5,更新策略甚至未能改善预测精度。这一发现具有重要意义:它表明本研究提出的MMD-CWT框架本身已具备很强的跨域泛化能力,降低了对目标域标注数据的依赖,更贴近迁移学习的本质目标。然而,研究也谨慎指出,在极端条件下,引入少量目标域样本作为“校准参考”可能有助于提升模型的局部适应性。
研究的结论与意义: 本研究成功开发并验证了一个集成MMD域对齐和CWT特征提取的可迁移学习框架,用于实现跨区域、跨管理实践的玉米叶片氮浓度精准预测。研究得出的核心结论是:尽管传统的PLSR-VIP方法在单一场景下表现优异,但其模型严重缺乏可迁移性;而新颖的MMD-CWT框架能够仅利用有限的、来自红边区域的稳定小波特征,在不同品种、灌溉和施肥制度的数据集间实现稳健、高精度的LNC预测(R² = 0.57–0.81)。
该研究的科学价值在于提出并验证了一种“特征级”迁移学习的新范式。它不是简单地在模型层面进行迁移或微调,而是通过算法从根本上寻找和提取那些在不同域之间保持物理意义一致性和统计稳定性的光谱特征。这为高光谱遥感模型泛化研究提供了新的思路。
其应用价值巨大且直接:该框架识别出的稳定红边特征,为设计低成本、轻量化的专用多光谱传感器(例如搭载于无人机或近地平台)提供了明确的理论依据。只需监测少数几个关键波段,即可构建普适性强的氮素诊断模型,这将极大推动精准氮肥管理技术在大范围、异质性农田中的规模化、低成本落地应用,助力农业可持续发展。
研究的亮点: 1. 方法创新性强: 首创性地将MMD(用于域适应/分布对齐)与CWT(用于多尺度特征提取)耦合在一个统一的特征选择框架内,同时解决了“寻找稳定区域”和“提取敏感特征”两个关键问题。 2. 数据基础扎实: 基于为期五年、覆盖多地点、多品种、多管理措施的综合性田间试验,构建了高质量、高异质性的数据集,为评估模型可迁移性提供了罕见且可靠的实证基础。 3. 结论挑战传统认知: 研究表明,一个成功的可迁移模型并不必然需要依赖目标域数据进行更新或再训练。MMD-CWT框架本身就能实现良好的跨域预测,这更符合实际应用中目标域数据稀缺的场景需求。 4. 应用导向明确: 研究始终指向实际应用,强调使用尽可能少的光谱特征实现稳健预测,这直接服务于轻量化、低成本农业遥感设备的研发与推广,具有很高的工程化和产业化潜力。
其他有价值的内容: 研究在讨论部分深入分析了影响LNC预测模型可迁移性的多种因素,包括品种基因型、施肥水平(特别是氮饱和现象)、灌溉方式、生育阶段差异以及训练数据集样本量等。这些分析为后续研究在不同条件下应用和优化该框架提供了重要参考。同时,研究也坦诚地指出了当前工作的局限性,如地理范围限于内蒙古干旱半干旱区、数据基于叶片尺度、传感器特异性等,并为未来研究指明了方向,包括扩展到更多生态区、验证冠层尺度的适用性以及研究传感器间的可迁移性等。