分享自:

基于分数阶导数和优化光谱指数的棉花全氮含量评估

期刊:Computers and Electronics in AgricultureDOI:10.1016/j.compag.2020.105275

基于分数阶微分和优化光谱指数估测棉花冠层全氮含量的研究

一、 主要作者、机构与发表信息

本研究由Yierxiati Abulaiti(第一作者)、Mamat Sawut(通讯作者)、Baidengsha Maimaitiaili和Ma Chunyue共同完成。所有作者均来自中国新疆大学资源与环境科学学院、新疆大学绿洲生态教育部重点实验室以及新疆大学智慧城市与环境建模新疆普通高校重点实验室(部分作者)。研究合作单位还包括新疆农业科学院核技术与生物技术研究所。该研究成果于2020年发表在学术期刊《Computers and Electronics in Agriculture》(第171卷,文章编号105275)上。

二、 学术背景与研究目的

本研究属于精准农业和农业遥感领域,具体聚焦于利用高光谱技术无损估测作物生化参数。氮是构成叶绿素、蛋白质和酶的关键生化组分,是评估作物光合能力和营养水平的关键指标。传统的全氮含量(Total Nitrogen Content, TNC)测定方法(如凯氏定氮法)虽然准确,但耗时、昂贵且具有破坏性。因此,发展快速、高效、经济的TNC估测技术对于实施精准氮肥管理、保障粮食安全和减少环境污染具有重要意义。

高光谱遥感因其快速、大范围和非侵入的特点,已成为研究作物生化特性的有力工具。在估测TNC时,常用的方法包括基于特征波段的统计建模、基于植被指数(Vegetation Index, VI)的经验模型以及基于吸收反射特征(如红边参数)的提取。其中,光谱数据变换技术(如导数分析)在增强光谱信号、降低背景噪音方面表现出强大能力。然而,传统的一阶和二阶整数阶导数(First and Second Order Derivatives)存在局限:它们可能无法挖掘原始光谱中存在的渐变趋势,并导致原始光谱中有用信息的丢失。

相比之下,分数阶微分(Fractional-Order Derivative, FOD)允许在微小间隔内进行微积分运算,能够更精细地探索光谱曲线中的敏感信息,被认为是一种潜力巨大的光谱预处理方法。同时,优化的双波段光谱指数(如归一化差值光谱指数Normalized Difference Spectral Index, NDSI和比值光谱指数Ratio Spectral Index, RSI)能够通过穷举所有波段组合来寻找与目标参数最相关的波段对,克服了传统植被指数波段选择单一、普适性差的问题。然而,将FOD光谱与优化光谱指数相结合来估测棉花TNC的研究尚未见报道。

基于以上背景,本研究设定了三个主要目标:(1)探索FOD对棉花冠层光谱的影响,并通过皮尔逊相关分析和优化光谱指数比较分析棉花TNC与FOD光谱的相关性;(2)比较不同支持向量回归(Support Vector Regression, SVR)核函数的估测性能;(3)基于FOD光谱和优化光谱指数,探究最优的棉花TNC估测模型。

三、 研究流程详述

本研究遵循了从数据获取、预处理、特征提取到建模验证的完整流程。

流程一:田间试验设计与数据采集 研究于2017年4月至9月在新疆玛纳斯县的新疆农业科学院试验站进行。试验设计了60个采样小区,包括24个不同棉花品种的对比试验和36个不同磷肥处理的试验(以‘新陆早57’为材料)。在棉花生长关键期,使用美国ASD公司制造的FieldSpec HandHeld地物光谱仪(光谱范围325–1075 nm,光谱分辨率3 nm)采集了每个小区冠层的高光谱反射率数据。测量时,光谱仪探头垂直向下距冠层30厘米,每个小区测量5条光谱并取平均值作为该小区的代表光谱。在采集光谱后,立即收割对应小区的棉花植株,分离新鲜叶片。叶片经杀青、烘干、粉碎后,采用H2SO4-HClO4消解法,并使用FOSS 1035全自动氮测定仪进行蒸馏和滴定,测定其全氮含量(TNC),从而获得60组配对的冠层光谱和TNC数据。

流程二:光谱数据预处理与分数阶微分变换 首先,采用Savitzky-Golay滤波方法(二阶多项式,窗口大小为4点)对原始光谱进行平滑处理以消除噪声。随后,使用Grunwald-Letnikov算法对平滑后的光谱进行分数阶微分计算。该算法是整数阶导数的推广,能够计算任意阶次的导数。研究中计算了从0.25阶到2阶、以0.25为步长的共9个FOD光谱(0阶代表原始反射率)。该计算在MATLAB R2016a软件中编程实现。这一步骤是本研究的方法核心,旨在通过不同阶次的FOD变换,挖掘和增强与氮含量相关的细微光谱特征。

流程三:特征波长识别与优化光谱指数构建 为了从高维光谱数据中提取最有效的特征,研究采用了优化光谱分析的方法。分别对原始反射率(0阶)和各个FOD变换后的光谱,计算了两个在所有可能波段对(325-1075 nm范围内)进行组合的光谱指数:归一化差值光谱指数(NDSI)和比值光谱指数(RSI)。计算公式分别为:NDSI(λi, λj) = (Rλi - Rλj) / (Rλi + Rλj) 和 RSI(λi, λj) = Rλi / Rλj。通过计算每个指数与TNC的皮尔逊相关系数,找出决定系数(R²)最高的指数及其对应的最佳波段组合。这个过程同样在MATLAB中通过编程实现,目的是为了找出对TNC最敏感、信息最丰富的波长组合,同时比较FOD处理是否能够提升这些指数与TNC的相关性。

流程四:支持向量回归建模与验证 将上述步骤中得到的与TNC相关性最高的优化光谱指数(NDSI或RSI)作为输入变量,建立TNC的估测模型。研究采用了支持向量回归(SVR)方法,并对比了三种不同的核函数:线性核(Linear)、径向基函数核(Radial Basis Function, RBF)和Sigmoid核。建模使用ε-SVR方法。为了评估模型性能,将60个样本随机划分为校正集(36个样本,占60%)和验证集(24个样本,占40%)。分别使用校正集建立模型,并用验证集进行独立验证。模型性能通过三个指标评价:决定系数(R²)、均方根误差(Root Mean Square Error, RMSE)和残差预测偏差(Residual Prediction Deviation, RPD)。其中,RPD > 2.0 表示模型具有优秀的定量预测能力,1.4 ≤ RPD < 2.0 表示模型可用于近似定量估测。

四、 主要研究结果详述

结果一:FOD变换对棉花冠层光谱特征的影响 原始光谱曲线表现出典型的植被光谱特征:在可见光区(350-680 nm)反射率较低,在绿光550 nm处有一个反射峰,在红光680 nm处有叶绿素吸收谷,在近红外区(700-1050 nm)反射率显著升高且平台较宽。经过FOD变换后,光谱特征发生显著变化:(1)从0.25阶开始,随着阶数增加,光谱细节逐渐显现,吸收和反射特征得到增强。(2)在0.5、0.75和1阶,光谱信号显著加强,出现了更多与植物氮素相关的特征峰(如525 nm, 575 nm, 715 nm等),光谱分辨率得到提高。(3)当阶数从1阶增加到2阶时,光谱曲线逐渐变得平滑,反射值减小,部分具体的吸收特征反而减少或消失。这表明,适中的FOD阶数(如0.5-1.25阶)能有效增强光谱信息,而过高的阶数可能导致过度平滑。

结果二:TNC与FOD光谱的相关性分析 皮尔逊相关分析显示,原始光谱与TNC在741–1050 nm近红外区呈显著正相关,最大相关系数|r| = 0.535(757 nm),但相关曲线平滑,难以提取具体特征波段。随着FOD阶数从0.25增加到1.25,相关曲线出现了更多正负交替的峰值,表明FOD成功揭示了隐藏在不同波段与TNC之间的复杂关系。通过0.01显著性检验的特征波段数量随阶数增加而减少,但相关系数的峰值却有所提高。最高相关系数出现在1.25阶(r = 0.652,对应704 nm),其次是0.75阶(r = 0.646,584 nm)和1阶(r = 0.629,711 nm)。这些值均高于常用的整数阶导数(1阶和2阶)所能达到的相关性。此结果初步证实了FOD在挖掘与TNC相关的敏感光谱信息方面优于传统整数阶导数。

结果三:基于FOD的优化光谱指数与TNC的相关性 通过构建全波段的NDSI和RSI指数并计算其与TNC的R²,研究发现:(1)对于NDSI指数,基于1.5阶FOD光谱构建的指数(NDSI₈₀₅ₙₘ,₄₂₂ₙₘ)与TNC的相关性最高(R² = 0.592)。基于0.75阶FOD的NDSI也表现出很高的相关性(R² = 0.571)。(2)对于RSI指数,基于0.75阶FOD(RSI₇₆₀ₙₘ,₅₈₅ₙₘ)和1.5阶FOD(RSI₈₈₀ₙₘ,₆₁₉ₙₘ)构建的指数相关性最高(R² = 0.566)。原始反射率构建的优化指数也表现出较强的相关性(R²最高为0.564)。高相关性的波段组合多集中在近红外区域(700-1000 nm)及红边区域,这与植被生化参数的光谱响应规律一致。这一结果进一步表明,结合FOD和优化光谱指数的方法具有提升TNC估测精度的潜力。

结果四:SVR模型估测性能 核函数比较表明,RBF核函数在大多数情况下表现最优,线性核次之,Sigmoid核最差。详细的建模结果揭示了有趣的现象: * 在校正阶段:基于0.5阶FOD-NDSI组合的SVR模型取得了最佳的校正效果(R²_cv = 0.642, RMSE_cv = 1.361, RPD_cv = 1.392)。基于1.25阶FOD-NDSI的模型效果也较好(R²_cv = 0.601)。这表明FOD光谱在校正集上能够帮助建立精度较高的模型。 * 在验证阶段:情况发生了逆转。表现最优的模型是基于原始反射率构建的RSI模型(0-RSI),其验证精度最高(R²_pre = 0.784, RMSE_pre = 1.333, RPD_pre = 1.800)。而所有基于FOD光谱构建的模型,其验证精度(R²_pre)大多低于0.5,且RMSE_pre值不稳定,预测能力普遍低于基于原始光谱的模型。基于原始反射率的NDSI模型(0-NDSI)验证精度反而很低(R²_pre = 0.222),说明指数类型(RSI vs NDSI)对模型稳健性影响也很大。

五、 研究结论与意义

本研究系统探讨了分数阶微分(FOD)结合优化光谱指数在估测棉花冠层全氮含量(TNC)中的应用,得出以下主要结论: 1. FOD能够有效增强可见光-近红外(Vis-NIR)光谱的细节特征,特别是0.5至1.25阶的FOD变换,能够提供比原始光谱和整数阶导数更丰富、与TNC相关性更高的吸收特征。 2. 基于FOD光谱构建的优化光谱指数(尤其是NDSI)与棉花TNC具有较高的相关性,最佳波段组合多位于近红外及红边区域。 3. 在支持向量回归(SVR)建模中,径向基函数(RBF)核总体表现最佳。 4. 最重要的发现是:虽然FOD处理在校准数据集上有助于构建高精度模型,但在独立验证数据集上,基于原始反射率的优化比值光谱指数(RSI) 所建立的模型展现了最优、最稳健的预测性能(RPD = 1.80,达到近似定量估测水平)。这表明,对于本研究的棉花TNC估测,复杂的光谱变换(FOD)并未在最终预测能力上超越经过优化波段选择的原始光谱信息。

本研究的科学价值在于首次系统地将分数阶微分分析方法应用于棉花氮素的高光谱估测,并与优化光谱指数、机器学习算法相结合,形成了一个完整的方法论探索流程。研究结果证实了FOD在挖掘光谱细节信息方面的潜力,同时也客观地指出,在本次具体研究中,原始光谱经过精心选择的波段组合后,其预测稳健性可能更优。这对后续研究者选择光谱预处理方法具有重要的参考价值,提示我们不应盲目追求复杂算法,而应注重方法适用性与模型稳健性的验证。在应用价值上,研究证实了利用高光谱遥感技术快速、无损估测棉花氮含量的可行性,为发展棉花精准施肥技术提供了理论依据和技术途径。

六、 研究亮点

  1. 方法新颖性:首次在棉花氮素遥感估测中引入并系统评估了分数阶微分(FOD) 这一前沿的光谱预处理方法,并将其与全波段优化的光谱指数(NDSI/RSI) 以及支持向量回归(SVR) 建模相结合,构成了一个创新的方法链条。
  2. 发现的双面性:研究不仅展示了FOD在增强光谱特征和提高相关性方面的优势,更重要的是通过严格的独立验证,发现了原始光谱优化指数模型可能具有更佳预测稳健性这一关键事实。这种客观、全面的比较分析避免了只报告正面结果的偏颇,对领域内方法选择具有重要警示和指导意义。
  3. 流程的完整性:研究从田间试验设计、高光谱与生化数据同步获取,到数据预处理、特征挖掘(FOD、优化指数)、机器学习建模(对比不同核函数),最后到模型校准与独立验证,步骤完整,论证严谨,为同类研究提供了良好的范本。

七、 其他有价值的内容

研究在讨论部分对结果进行了深入分析。作者提出,FOD在高阶(>1阶)导致光谱过度平滑而与土壤光谱研究中“高阶引入高频噪声”的结论不同,这可能源于植被与土壤光谱特性的差异,或本研究未使用全波段光谱。同时,对于验证精度高于校准精度的“过拟合”疑虑,作者根据文献指出SVR方法本身能较好避免过拟合,推测可能是本研究数据样本量有限(60个)和光谱范围不全(325-1075 nm) 所致。这些分析指明了本研究的局限性,并为未来研究方向提出了建议:未来工作应扩大样本量,使用全范围光谱,并综合考虑其他植物理化参数(如色素、水分、结构)的相互作用,以更全面地揭示FOD在估测作物氮素及其他生化参数中的机理与潜力。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com