本文档报道了一项关于利用高光谱遥感技术估算小麦叶片氮含量(Leaf Nitrogen Content, LNC)的原创性研究。该研究题为”Estimation of leaf nitrogen content in wheat using new hyperspectral indices and a random forest regression algorithm”,由Liang Liang、LiPing Di、Ting Huang、Jiahui Wang、Li Lin、Lijuan Wang和Minhua Yang共同完成。作者单位包括江苏师范大学、乔治梅森大学空间信息科学与系统中心以及中南大学。该研究发表于学术期刊《remote sens.》2018年第10卷,文章编号1940,于2018年12月3日在线发布。
本研究的主要学术背景在于精准农业和作物生理监测领域。氮元素是决定作物生长状况、光合作用能力和最终产量的关键营养元素。氮肥施用不足会导致减产,而过量施用则会造成资源浪费、环境污染甚至作物胁迫。因此,准确、及时、大范围地监测作物氮素状况对于科学施肥决策至关重要。传统的化学测定方法(如凯氏定氮法)耗时费力、破坏性采样且只能获得点状信息,难以满足大尺度、动态监测的需求。相比之下,高光谱遥感技术能够快速、无损地获取大面积作物的光谱信息,为估算作物生化参数提供了有力工具。已有大量研究探索了利用各种高光谱植被指数(Hyperspectral Vegetation Indices)估算作物氮含量,例如MNDVI705、MSR705、NDVI705等。然而,这些指数大多直接基于冠层反射率构建。在实际田间测量中,由于作物冠层覆盖度有限,获取的光谱信号不可避免地混合了作物和土壤背景信息,这限制了基于反射率指数的估算精度。有证据表明,导数(Derivative)处理能够有效降低土壤背景的影响、增强弱光谱特征并减少低频噪声。因此,利用导数光谱构建新的光谱指数,有望更准确地提取作物氮含量的特征信息,实现更可靠的遥感估算。基于此,本研究设定了明确的目标:1)构建对小麦叶片氮含量敏感的新型高光谱指数;2)利用随机森林回归(Random Forest Regression, RFR)等机器学习算法优化估算模型;3)通过田间实验和航空高光谱影像验证最优LNC估算模型的有效性和应用潜力。
详细的研究工作流程严谨而系统,主要包括以下几个部分:
第一,实验设计与数据采集。 研究在北京国家精准农业示范基地进行,以冬小麦为研究对象。为确保建模数据涵盖足够的氮素水平变化范围,研究在2007年小麦生长季设置了胁迫实验。实验在24个子小区(每个360平方米)中进行,设置了6个氮肥施用水平(0, 75, 150, 225, 300, 375 kg/ha)和6个水分施用水平(0, 225, 500, 725, 1000, 1125 m³/ha),每个处理设置两个重复。从小麦拔节期到孕穗期(2007年4月4日至5月13日),研究人员使用ASD FieldSpec Pro FR光谱辐射计(波长范围350-2500 nm)采集了冠层反射光谱。测量在晴朗无云、太阳高度角较高的时段(10:00-15:00)进行,传感器垂直置于冠层上方1.3米处,每个样本测量10次取平均值,并定期使用参考白板进行仪器校正。在采集光谱后20分钟内,于对应位置同步采集小麦叶片样本。最终共获得190组有效样本(光谱与对应LNC)。叶片样本带回实验室后,使用凯氏定氮法(GB 7173-87)测定其LNC。所有190个样本被随机分为两组:142个样本作为训练集用于建模,48个样本作为独立的预测集用于验证。此外,为了分析指数在实际遥感过程中的适应性,研究还获取了2007年4月26日由Y-5飞机搭载的操作性模块化成像光谱仪(Operative Modular Imaging Spectrometer, OMIS)获取的航空高光谱影像(128个通道,波长0.4-12.5 µm,空间分辨率约3米)。在获取影像的同时,在地面30个均匀分布的采样点进行了同步采样,以用于验证遥感反演制图的精度。
第二,新型高光谱指数设计与筛选。 这是本研究的核心创新环节。为了降低土壤背景噪声并增强与LNC相关的光谱特征,研究提出了基于一阶导数光谱构建新型指数的方法。具体构建了两种形式的指数:一阶导数归一化差值氮指数(first derivative normalized difference nitrogen index, FD-NDNI)和一阶导数简单比值氮指数(first derivative simple ratio nitrogen index, FD-SRNI)。其通用公式分别为FD-NDNI(x,y) = (x - y) / (x + y) 和 FD-SRNI(x,y) = x / y,其中x和y代表特定波长i和j处的一阶导数值。研究在350-1350 nm范围内(避免1350 nm以上光谱噪声较高),计算了所有可能的两两波段组合的FD-NDNI和FD-SRNI指数,并分别绘制了这些指数与LNC之间的决定系数(R²)等值线图。通过分析等值线图,可以全面评估不同波段组合对LNC的预测能力,并筛选出最优的波长组合。结果显示,与LNC相关性最高的FD-NDNI指数出现在波段组合(715, 516 nm)附近,其R²达到0.861;而最优的FD-SRNI指数出现在波段组合(716, 526 nm)附近,R²为0.862。基于此,研究确定了FD-NDNI(715,516)和FD-SRNI(716,526)作为新构建的指数。研究还进一步分析了带宽对指数估算能力的影响,发现当带宽小于30 nm时,估算精度(R²)下降缓慢;但当带宽大于30 nm时,精度会急剧下降。这表明,在构建用于估算小麦LND的高光谱指数或设计新型农业遥感传感器时,需要较高的光谱分辨率(<30 nm)来确定最佳波段位置。
第三,模型构建与算法优化。 研究首先将新构建的指数(FD-NDNI和FD-SRNI)与从文献中选取的14种常用高光谱指数(如MNDVI705、MSR705、NDVI705、NDNI等)进行了对比。以光谱指数为自变量(X),LNC为因变量(Y),利用训练集数据,为每个指数寻找最佳曲线拟合模型(线性、指数、对数等),并通过验证集的R²和均方根误差(Root Mean Square Error, RMSE)进行评估排序。结果表明,FD-SRNI和FD-NDNI的估算精度最高,验证R²分别为0.859和0.859,RMSE分别为0.336%和0.337%,显著优于其他对比指数。然而,曲线拟合方法需要预先定义函数形式,对于非线性关系处理能力有限。因此,研究进一步引入了两种机器学习算法——最小二乘支持向量回归(Least Squares Support Vector Regression, LS-SVR)和随机森林回归(RFR)——来优化模型。特别是RFR算法,它是一种基于回归树的集成学习算法,通过构建大量差异化的决策树并整合其预测结果,可以有效处理非线性问题,且对输入变量数量要求灵活。研究中,RFR模型设置了100棵树,使用平方根规则确定随机特征数。为了将地面光谱模型应用于OMIS影像,研究首先根据OMIS波段的光谱响应函数,将地面ASD光谱重采样为模拟的OMIS光谱。然后,基于OMIS波段中心波长,计算了NDVI705、MNDVI705、MSR705以及新提出的FD-NDNI和FD-SRNI(使用OMIS对应的710.9 nm、515.3 nm、527.7 nm等波段)。最后,分别使用曲线拟合、LS-SVR和RFR算法,基于模拟OMIS光谱的指数构建LNC估算模型。
第四,遥感制图与精度验证。 在获得最优指数(FD-NDNI和FD-SRNI)和最优算法(RFR)后,研究将其应用于实际的OMIS影像进行小麦LNC遥感反演制图。首先,对OMIS影像进行几何校正、大气校正、去噪等预处理,并利用独立成分分析(ICA)结合分类方法,从影像中提取出小麦种植区域,掩蔽掉裸土、水体等其他地物。接着,计算影像的一阶导数专题图。然后,将导数专题图输入到之前已建立的、基于RFR算法和FD-NDNI/FD-SRNI的LNC估算模型中,生成整个研究区小麦LNC的空间分布图。最后,利用飞行同步获取的30个地面实测LNC样本点对制图结果进行精度验证。
研究取得了一系列明确且有意义的结果。在指数筛选阶段,等值线图清晰揭示了敏感波段位于约715 nm(红边区域)和520 nm(绿峰/蓝边区域)附近,这符合植被生理学认知:氮素充足时,叶绿素吸收增强,红边更陡、绿峰更明显,导致这些位置的导数光谱值增大。新构建的FD-NDNI和FD-SRNI指数在验证集上取得了最高的估算精度(R²约0.86),证明了基于导数构建指数以降低土壤背景干扰的有效性。在模型优化阶段,对比三种建模方法(曲线拟合、LS-SVR、RFR)发现,无论使用哪种光谱指数,RFR模型都 consistently 地取得了最高的预测精度和最低的RMSE。例如,对于FD-NDNI指数,RFR模型的验证R²达到0.874,RMSE为0.317%,均优于曲线拟合(R² 0.830, RMSE 0.359%)和LS-SVR(R² 0.835, RMSE 0.354%)模型。这证实了RFR算法在处理此类回归问题上的优越性。在最终的OMIS影像遥感制图与验证中,基于FD-NDNI_RFR模型的制图结果与地面实测值比较,R²为0.721,RMSE为0.540%;基于FD-SRNI_RFR模型的结果R²为0.720,RMSE为0.495%。两者的回归线斜率接近1,截距较小,表明反演值与实测值具有较高的相似性,模型能够进行系统性较好的估算。空间分布图详细展示了田间LNC的变异情况,为定量施肥提供了科学依据。
基于以上结果,本研究得出以下主要结论:1)新构建的基于一阶导数光谱的指数FD-NDNI和FD-SRNI,是估算小麦叶片氮含量的最优高光谱指数,其精度优于常用的传统指数。2)在构建估算作物氮含量的光谱指数时,选择715 nm和520 nm附近的敏感波段是有效的,但这些敏感波段的有效范围较窄,带宽大于30 nm会显著降低估算能力,这为设计专用于农业遥感的传感器提供了重要参考。3)在建模算法方面,随机森林回归(RFR)是比曲线拟合和支持向量回归(SVR)更优的选择,能进一步提高LNC估算的准确性。4)综合应用新指数和RFR算法,能够成功实现基于航空高光谱影像的小麦LNC遥感制图,且精度可靠。
本研究的科学价值和应用价值显著。在科学上,它创新性地将导数光谱处理与植被指数构造相结合,明确了一种能够有效抑制土壤背景影响、增强氮素特征信息提取的新方法,深化了对高光谱数据用于作物氮素监测机理的理解。提出的带宽敏感性结论也对高光谱传感器设计具有理论指导意义。在应用上,研究建立了一套从数据采集、指数设计、模型优化到遥感制图的完整技术流程,为精准农业中的变量施肥管理提供了切实可行的技术方案,有助于提高氮肥利用效率、减少环境污染、保障粮食安全。
本研究的亮点突出体现在以下几个方面:首先是方法的新颖性,创造性地提出了基于一阶导数光谱构建FD-NDNI和FD-SRNI指数,这是对传统反射率指数的重要改进。其次是技术的综合性,研究并非停留在指数提出,而是完成了从田间实验、数据分析、算法比较到实际遥感影像应用验证的全链条研究,体现了完整的遥感反演研究范式。第三是结论的明确性和实用性,不仅找到了最优指数和算法,还明确了敏感波段及其带宽要求,结论对后续研究和工程应用都有直接指导作用。第四是数据的详实性,研究基于严格控制的田间胁迫实验获取了大量配套的光谱和生化数据,并使用了独立的航空遥感影像进行验证,保证了研究结论的可靠性。
此外,研究中关于不同氮肥水平下小麦LNC随时间变化规律以及冠层光谱响应特征的分析,也为理解作物氮素营养的动态过程提供了有价值的基础数据。整个研究工作逻辑清晰,步骤严谨,为利用高光谱遥感技术进行作物氮素营养诊断与精准管理提供了一个优秀的范例。