分享自:

基于光谱指数的土壤重金属估算方法开发:结合分数阶导数预处理与吸收机制

期刊:Science of the Total EnvironmentDOI:10.1016/j.scitotenv.2021.151882

本研究由Lihan Chen(中国矿业大学自然资源部国土环境与灾害监测重点实验室)、Jian Lai(上海卫星工程研究所)、Kun Tan(华东师范大学地理信息科学教育部重点实验室、自然资源部特大城市自然资源时空大数据分析与应用重点实验室、华东师范大学地理科学学院)、Xue Wang(华东师范大学地理信息科学教育部重点实验室、自然资源部特大城市自然资源时空大数据分析与应用重点实验室、华东师范大学地理科学学院)、Yu Chen(中国矿业大学自然资源部国土环境与灾害监测重点实验室)、Jianwei Ding(河北省第二测绘院)共同完成。研究成果于2021年11月在线发表于Elsevier旗下期刊《Science of The Total Environment》第813卷(2022年出版,论文编号151882)。

土壤是陆地生态系统的重要组成部分,其重金属污染问题随着工农业快速发展和人口激增而日益凸显。重金属无法在土壤中分解,并可通过食物链在人体内富集,对人体健康构成严重威胁。传统实验室化学分析方法测定土壤重金属含量存在耗时、费力、成本高、环境不友好、难以实现大范围动态快速监测等局限性。近年来,可见光-近红外(Vis-NIR,400-2500 nm)反射光谱技术因其快速、低成本、非破坏性等优点,已成为估算土壤水分、有机碳及重金属等属性的有效工具。

然而,利用Vis-NIR光谱估算土壤重金属面临两大挑战。其一,土壤中重金属含量通常较低,其光谱特征微弱,且光谱数据易受样品湿度、粒径及仪器条件等因素干扰,产生噪声和基线漂移。传统的整数阶导数预处理(如一阶、二阶导数)虽然能消除背景信号、区分重叠峰,但对可能包含重金属有益信息的平缓倾斜或弯曲变化不敏感。分数阶导数(Fractional-Order Derivative, FOD)作为整数阶导数的扩展,在信号处理等领域显示出优势,但其在土壤重金属光谱估算中的应用潜力尚未被充分探索。其二,高光谱数据波段众多,存在严重的共线性和冗余信息。大多数研究采用统计方法选择特征波段,难以解释波段与重金属的内在关联。基于波段组合算法的光谱指数(Spectral Index)提供了一种可解释且有效的方法,能够从多维光谱空间中表达重金属的光谱响应特征,减少其他土壤组分信息的干扰,并放大波段间的弱相关性。其中,三波段光谱指数相比传统的二波段指数通常更稳健,但相关研究较少。

基于以上背景,本研究旨在:(1)分析FOD预处理对土壤光谱的影响;(2)引入一种新的三波段光谱指数,结合波段组合算法,并探究不同分数阶下最优的波段组合;(3)研究土壤重金属的光谱吸收机理及其特征波段;(4)探究使用单一光谱指数和多个光谱指数组合估算重金属的效果。

研究区域位于中国江苏省徐州市中国矿业大学南湖校区北门附近的遥感实验场。实验设计了四个地块,其中三个地块分别人工添加了Cr、Pb和Zn化合物(浓度依据中国《土壤环境质量标准》GB15618-1995二级标准),第四个地块为对照。土壤类型为褐土。研究在2013年10月添加重金属后,分别于2014年7月、2016年7月和2017年7月小麦成熟后采集土壤样本,三年共采集120个样本。采样点根据地块情况分别采用梅花形、棋盘形和S形路径布设,并使用有机玻璃柱收集约1 kg表层土。

所有土壤样本在实验室经风干、研磨、过100目尼龙筛后,分为两部分。一部分用于光谱测量,使用Analytical Spectral Devices(ASD)地物光谱仪在暗室中测量350-2500 nm范围内的Vis-NIR反射光谱,每个样本测量10次并剔除异常值后取平均。由于350 nm和2500 nm附近信噪比低,最终分析使用400-2400 nm波段,并采用Savitzky-Golay(SG)平滑算法降噪。另一部分用于重金属含量测定,采用HNO3-HCl(1:1)溶液消解土壤样本,然后使用电感耦合等离子体质谱法(ICP-MS)测定Cr、Zn和Pb的含量。统计结果显示,三种重金属的变异系数(CV)在55.42%至64.64%之间,表明数据具有一定的变异性。实验期间土壤pH值均高于7.5。

研究方法的核心包括分数阶导数预处理、光谱指数构建和多种建模算法。分数阶导数采用Grünwald-Letnikov(G-L)定义,阶数v从0到2,以0.25为间隔进行运算(即0, 0.25, 0.5, …, 2),旨在放大反射光谱特征并分离重叠峰。光谱指数方面,研究对比了传统的二波段比值指数(RSI)和提出的新三波段指数(TSI)。二波段指数公式为RSI = Rλ1 / Rλ2。三波段指数的构建基于对土壤光谱吸收机制的分析:在可见光区域(400-780 nm),吸收主要与金属离子的电子跃迁有关;在近红外区域,2200 nm波段是与有机质和粘土矿物羟基(OH、AlOH)的伸缩和弯曲振动相关的特征吸收带,已被证明可用于遥感估算重金属。因此,提出的三波段指数公式为TSI = Rλ1 / (Rλ2 + Rλ3),其中Rλ1和Rλ2为可见光区域的任意两个波段,Rλ3固定为2200 nm波段。该设计旨在同时利用重金属在可见光区的直接/间接光谱响应和其在近红外区与土壤有机质、粘土矿物的结合关系。

建模分析方面,首先为每个重金属(Cr, Zn, Pb)在每个FOD阶数下,分别计算所有可能波段组合(λ1, λ2)与重金属含量的相关系数,选取最大绝对相关系数(MACC)对应的波段组合作为该阶数下的特征波段,并分别用二波段指数和三波段指数建立简单线性回归模型。然后,为了综合利用多个有效的光谱指数信息以提高模型拟合和泛化能力,研究筛选出估算效果较好的几个FOD阶数(0, 0.25, 0.5, 0.75)对应的光谱指数(共4个阶数 * 3种重金属 * 2种指数 = 24个潜在指数变量,实际建模时会针对每种重金属选择其对应的最优指数组合),将它们作为输入特征,分别采用偏最小二乘回归(PLS)、支持向量机(SVM)、随机森林(RF)、岭回归(RR)、XGBoost和极限学习机(ELM)六种机器学习算法建立估算模型。在建模前,将120个样本按重金属含量排序后分层抽样,划分为包含80个样本的建模集和40个样本的验证集,以确保数据分布的合理性。模型性能通过建模集的决定系数(Rc²)、均方根误差(RMSEc)、平均绝对误差(MAEc)和验证集的决定系数(Rp²)、均方根误差(RMSEp)、平均绝对误差(MAEp)、残差预测偏差(RPD)以及预测性能与四分位距之比(RPIQ)进行综合评估。RPD和RPIQ值越高,RMSEp和MAEp值越低,表明模型预测能力越好。

研究首先分析了不同阶数FOD预处理后的光谱特征。随着阶数从0增加到0.5,光谱的反射峰(如~1400, ~1900, ~2200 nm处的水吸收带)变得更加尖锐,一些小的反射峰逐渐显现。阶数从0.5增加到1时,反射峰和吸收谷进一步锐化,例如在420 nm(与针铁矿相关)和560 nm(与铁氧化物相关)附近出现反射峰,在480 nm(与针铁矿、铁/锰氧化物吸收特征相关)和2200 nm(与有机质/粘土矿物的OH、AlOH振动相关)附近出现吸收谷。当阶数从1继续增加到2时,光谱差异变小,但噪声显著增加,特别是在1.5阶之后,光谱出现大量微小峰,信号趋于稳定但夹杂噪声。这表明低阶FOD(0.25, 0.5, 0.75)能有效增强特征并抑制基线,而高阶FOD(>1)会引入过多噪声。

在基于单一光谱指数的线性回归估算结果中,三波段指数(TSI)的表现普遍优于二波段指数(RSI)。对于二波段指数,Cr、Zn、Pb的最佳估算阶数和Rp²分别为:0.25阶(Rp² = 0.61)、0.25阶(Rp² = 0.65)、0.5阶(Rp² = 0.47)。对于三波段指数,三种重金属的估算精度显著提升,并均在特定阶数达到最优:Cr在0.75阶达到最佳(Rp² = 0.74, RMSEp = 13.17 mg/kg, RPD = 1.78);Zn在0.75阶达到最佳(Rp² = 0.81, RMSEp = 7.12 mg/kg, RPD = 2.15);Pb在0.5阶达到最佳(Rp² = 0.56, RMSEp = 5.41 mg/kg, RPD = 0.93)。这一结果证实了三波段指数形式能够提高对重金属的敏感性和估算能力。分析最优三波段指数中频繁出现的特征波段发现,它们大多与土壤中的铁氧化物(如针铁矿、赤铁矿、水铁矿)、有机质及粘土矿物相关,例如~400-410 nm, ~447 nm, ~525-533 nm, ~570-585 nm, ~604-607 nm, ~705-706 nm, ~725-736 nm, ~776-779 nm等波段。这支持了重金属通过吸附或结合在铁氧化物、有机质和粘土矿物表面,从而产生间接光谱响应的机理。

在利用多个光谱指数组合的机器学习模型估算中,不同模型表现各异。对于Cr,RF和ELM模型表现最佳(Rp²均为0.77),其中ELM模型的RMSEp(13.40 mg/kg)和MAEp(10.24 mg/kg)略低于RF,且RPD(1.88)和RPIQ(4.09)更高,表明ELM综合性能更优。对于Zn,ELM模型同样展现出最佳性能,Rp²高达0.86,RMSEp低至6.61 mg/kg,RPD达到2.50。对于Pb,ELM模型的估算精度也最高(Rp² = 0.63, RMSEp = 10.19 mg/kg)。相比之下,PLS和SVM模型的性能普遍不如单一指数线性回归。值得注意的是,XGBoost模型在建模集上表现出极高的拟合度(Rc² > 0.95),但在验证集上精度相对较低,存在过拟合风险。而ELM模型在验证集上表现稳定且优异,显示出更强的泛化能力。各重金属的ELM模型预测值与实测值散点图均较好地分布在1:1线附近,尤其是Cr和Zn,表明模型性能稳定。Pb的预测值在低浓度区更集中,高浓度区稍显分散,导致其RMSEp相对较高,但仍处于可接受范围。

本研究的主要结论如下:首先,分数阶导数(FOD)预处理方法能够有效放大土壤重金属的微弱光谱信息,衰减基线漂移并分离重叠谱峰。其中,0.25至0.75阶的FOD效果最佳,而更高阶数会引入过多噪声和峰形畸变。其次,提出的新型三波段光谱指数(TSI,结合了可见光区的两个波段和近红外2200 nm固定波段)比传统二波段指数能更有效地提取与重金属相关的光谱特征,显著提高了估算精度。具体而言,使用单一TSI指数时,0.75阶FOD光谱对Cr和Zn的估算效果最好(Rp²分别为0.74和0.81),0.5阶FOD光谱对Pb的估算效果最好(Rp²为0.56)。最后,通过整合多个表现优异的光谱指数,并采用极限学习机(ELM)建模,可以进一步提升模型的综合估算能力和泛化性能,对Cr、Zn、Pb的估算Rp²分别达到0.77、0.86和0.63。本研究将FOD预处理与基于吸收机理的三波段指数构建相结合,为利用Vis-NIR光谱进行大范围土壤重金属估算提供了一种精度更高、可解释性更强的有效方法。

本研究的亮点与价值体现在:方法论创新:首次系统地将分数阶导数(FOD)预处理与一种新的、基于物理吸收机理(结合可见光区电子跃迁和近红外区2200 nm有机质/粘土矿物特征)的三波段光谱指数(TSI)相结合,用于土壤重金属Vis-NIR光谱估算,提升了特征提取的精细度和模型的可解释性。性能提升:通过对比验证,证实了FOD(尤其是0.5和0.75阶)和TSI指数在提升Cr、Zn、Pb估算精度方面的显著优势,并证明ELM模型在集成多指数信息时具有优异的泛化能力。机理关联:研究不仅关注模型精度,还通过分析最优波段与已知土壤组分(铁氧化物、有机质等)特征吸收波段的对应关系,将估算结果与重金属在土壤中的存在形态和结合机理联系起来,增强了研究的科学深度。应用潜力:所发展的方法流程(FOD预处理 -> TSI指数构建 -> 多指数ELM建模)具有明确的步骤和较好的性能,为将来利用高光谱遥感影像进行区域尺度土壤重金属监测和制图提供了重要的技术参考和理论依据。研究得到了国家自然科学基金(41871337, 42171335)的资助。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com