本次介绍的学术研究由Tingxuan Zhuang, Yu Zhang, Dong Li, Urs Schmidhalter, Syed Tahir Ata‑ui‑Karim, Tao Cheng, Xiaojun Liu, Yongchao Tian, Yan Zhu, Weixing Cao, Qiang Cao等来自中国和德国的学者共同完成,其成果以《Coupling continuous wavelet transform with machine learning to improve water status prediction in winter wheat》为题,于2023年6月12日在线发表在《Precision Agriculture》期刊上。该研究属于精准农业(Precision Agriculture)与遥感监测领域,具体聚焦于利用高光谱技术监测冬小麦的水分状况。
学术背景与目标 水分是作物生长发育的关键因子,对小麦等主要粮食作物的产量和全球粮食安全具有决定性影响。中国农业用水约占全国总用水量的70%,因此,实现小麦的精准灌溉和节水生产至关重要,而前提是能够及时、准确地掌握作物的水分状况。高光谱遥感(Hyperspectral Remote Sensing)作为一项快速、非破坏性的监测技术,已被广泛应用于作物生理生化参数的估算。当作物冠层水分状况发生变化时,其反射光谱也会发生相应改变,为水分监测提供了理论基础。
在光谱数据处理方法中,小波分析(Wavelet Analysis)因其能够将信号在不同尺度(频率)上分解,从而提取原始光谱中隐藏的细节信息,近年来在作物水分、氮素等状态监测中展现出巨大潜力。然而,既往研究大多仅利用了连续小波变换(Continuous Wavelet Transform, CWT)后的单一波段小波特征,而结合了多个敏感小波特征的潜力尚不明确。同时,机器学习算法在提取复杂数据模式方面表现优异,能够处理大量输入特征并揭示其贡献度。
因此,本研究的核心目标在于:结合连续小波变换与多种机器学习算法,充分利用高光谱信息,提高冬小麦关键水分指标(冠层含水量、植株含水量和冠层等效水厚度)的监测精度。具体研究内容包括:确定不同水分指标的敏感小波特征;构建基于双波段组合的小波指数模型;利用特征选择方法筛选出多敏感小波特征,并以此为基础,使用机器学习算法建立监测模型;对比不同数量及组合的基于小波变换的光谱特征对冬小麦水分状况监测性能的影响。
详细研究流程 本研究在2020年至2022年,于中国河南省新乡市的中国农业科学院农田灌溉研究所试验站进行。试验设置了四个水分梯度和两个氮素水平处理,采用“周麦27”品种,每个处理设三次重复,共计获取了246个有效样本数据。整个研究流程可概括为数据采集、数据处理、特征选择、模型构建与验证五个主要阶段。
第一阶段:数据采集与预处理 研究人员在冬小麦的关键生育期,使用ASD FieldSpec Pro FR光谱辐射计采集了350–2500 nm范围的冠层高光谱反射率数据。采集时在每个小区内随机选取4个均匀生长点,每点重复测量5次后取平均值作为该处理的光谱数据。采集光谱后,立即在对应区域取样。在实验室内,将植株样本分为上四叶、其余叶片、茎鞘和穗等部分,分别测量其鲜重、叶面积,并烘干至恒重测量干重。基于这些测量数据,计算了三个核心水分状态指标:冠层含水量(CWC, 公式为 (上四叶鲜重-干重)/上四叶鲜重)、植株含水量(PWC, 公式为 (地上部总鲜重-总干重)/总鲜重)和冠层等效水厚度(CEWT, 公式为 (上四叶鲜重-干重)/(叶面积×水密度) × 叶面积指数)。CEWT同时包含了叶片单位面积含水量和冠层生长(叶面积指数)信息。
第二阶段:数据处理与特征生成 首先,对原始光谱数据进行了拼接校正、平均化和大气吸收波段剔除等预处理。随后,对预处理后的冠层反射光谱进行连续小波变换。本研究采用高斯函数的二阶导数作为母小波,在3(2^3)、4、5、6、7、8共六个二进尺度上对光谱进行分解,得到每个尺度、每个波段对应的小波系数(或称小波功率)。前两个尺度主要包含噪声,因此不参与后续分析。至此,每个样本的光谱数据被转换为了一个包含6个尺度、每个尺度2151个波段的小波特征数据集。
第三阶段:特征选择与模型构建 本研究构建了三种不同层次的监测模型进行对比: 1. 单波段小波特征模型:首先,通过线性回归分析每个小波特征与水分指标的决定系数(R²),绘制R²标量图,并筛选出相关性最高的前1%的敏感小波特征。对于每个水分指标,选择R²最高的单一小波特征建立简单线性回归模型。 2. 双波段小波指数模型:为了利用更多光谱信息,研究人员在每个尺度上,以5 nm为间隔,将任意两个波段的小波功率进行组合,构建了归一化差值小波指数(NDWI)、比值小波指数(RWI)和差值小波指数(DWI)。然后,寻找与各水分指标R²最高的最优小波指数,并建立线性回归模型。 3. 多敏感小波特征机器学习模型:这是本研究的重点。为了避免多重共线性,研究者采用连续投影算法(Successive Projections Algorithm, SPA)从每个水分指标的前1%敏感小波特征中,筛选出一组(5-6个)共线性最低的特征子集。以此特征子集作为输入,分别使用三种机器学习算法构建回归模型:多元线性回归(MLR)、随机森林(RF)和支持向量机(SVM)。其中,RF和SVM的参数通过网格搜索和十折交叉验证进行优化。所有模型的数据集划分策略保持一致:将总样本随机分为70%的训练集和30%的测试集,并采用分层抽样确保不同处理样本的均衡分布。模型性能通过决定系数(R²)和均方根误差(RMSE)进行评价。
主要研究结果 1. 光谱与小波功率变化:不同水氮处理显著影响了冬小麦冠层光谱反射率,尤其是在近红外和短波红外区域。经过CWT后得到的小波功率谱在不同尺度上呈现出不同的模式:尺度越小,振幅越小,波动频率越高,反映了叶片结构或物质吸收的细节变化;尺度越大,振幅越大,波动趋于平缓,反映了光谱的整体形状和趋势。 2. 传统植被指数与单波段小波特征模型对比:使用已有的水相关植被指数(如NDVI、WI、RVI等)建立线性模型的效果不佳,对CWC、PWC和CEWT的最佳建模R²分别为0.43、0.47和0.61。而基于单波段小波特征的模型性能显著提升,CWC、PWC和CEWT的最佳建模R²分别达到0.75、0.74和0.64,对应的最优小波特征分别为位于短波红外区域2264 nm(尺度4)、2255 nm(尺度3)和位于红边区域730 nm(尺度3)的特征。这表明CWT有效增强了光谱对水分变化的响应。 3. 双波段小波指数模型的提升:相较于单特征模型,双波段小波指数模型进一步提高了监测精度。最优的小波指数模型(如RWI (565, 655, s4) 用于CWC, NDWI (670, 1700, s4) 用于PWC, NDWI (695, 780, s5) 用于CEWT)在训练集上的R²分别达到0.85、0.88和0.75。这表明结合两个敏感波段的信息(通常位于不同光谱区域,如可见光与短波红外),能够从不同角度反映水分状况,模型性能更优。 4. 多特征机器学习模型的卓越性能:基于SPA筛选出的多敏感小波特征(每个指标5-6个)结合机器学习算法,取得了最佳监测效果。在测试集(验证集)上: * 对于冠层含水量(CWC),最佳模型为随机森林(RF),R² = 0.92,RMSE = 2.39%。 * 对于植株含水量(PWC),最佳模型为支持向量机(SVM),R² = 0.93,RMSE = 2.12%。 * 对于冠层等效水厚度(CEWT),最佳模型为支持向量机(SVM),R² = 0.79,RMSE = 99.31 μm。 机器学习模型的表现显著优于单特征模型和双波段指数模型。特征重要性分析(针对RF模型)显示,对于CWC和PWC,贡献最大的小波特征多位于短波红外的干物质敏感区域(~2250 nm)及水吸收区域;对于CEWT,则主要贡献来自红边区域的特征。这印证了SPA筛选结果的物理意义。
结论与意义 本研究成功地将连续小波变换与机器学习算法相结合,显著提升了基于高光谱遥感技术监测冬小麦全生育期水分状况的精度。研究证明: 1. 相比于传统植被指数和单一小波特征,综合利用多个经过特征选择的敏感小波特征,能够更充分地挖掘光谱信息,避免特征间共线性,从而构建出性能更稳健、预测能力更强的监测模型。 2. 机器学习算法(特别是RF和SVM)能够有效处理多特征输入,并揭示不同小波特征对水分状态预测的贡献,有助于明确冬小麦水分胁迫诊断的光谱敏感位置。 3. 不同水分指标(CWC, PWC, CEWT)对应的最敏感光谱区域存在差异:CWC和PWC更关联于短波红外区域的水分和干物质吸收特征;而CEWT由于包含了叶面积信息,其敏感特征也涉及反映植物生长健康的红边区域。
该研究的科学价值在于提出并验证了一个高效的高光谱数据处理与建模框架(CWT-SPA-ML),为作物生理参数遥感反演提供了方法论上的创新。其应用价值突出,所开发的新模型能够快速、无损、准确地诊断冬小麦的水分胁迫状况,为实现农田精准灌溉和水资源高效管理提供了有力的技术工具,对保障粮食安全和农业可持续发展具有重要意义。
研究亮点 1. 方法创新性:首次系统性地将连续小波变换、连续投影算法特征选择与多种机器学习算法进行耦合,用于冬小麦水分状况的监测,构建了一个层次分明、性能逐步优化的模型体系。 2. 特征利用的深度:突破了以往小波分析多局限于单一特征的窠臼,深入探索了双波段小波指数以及多敏感小波特征组合的潜力,实现了对高光谱信息更全面、更深入的利用。 3. 明确的物理可解释性:不仅追求高精度预测,还通过特征重要性分析等方法,将模型结果与作物的生理生化机理(如水分吸收、干物质积累、冠层结构)联系起来,增强了模型的可解释性和可靠性。 4. 严谨的实验设计:基于多年、多水氮处理的田间试验获取数据,使得所构建的模型具有更好的普适性和鲁棒性,更贴近实际农业生产中的复杂情况。
其他有价值的内容 研究在讨论部分对结果进行了深入的机理解释:CWC和PWC的敏感特征位于短波红外,这与该区域是水的强吸收带以及纤维素、淀粉等干物质的特征吸收有关;在仅水分变量差异的试验中,作物干物质含量与含水量常呈正相关,这解释了为何干物质敏感波段也对水分预测有重要贡献。同时,研究也指出了当前模型的局限性,即在不同地点、品种和氮素处理下的普适性尚不明确,建议未来在更多地点开展多年份、多因子的试验以进一步验证和优化模型。这为后续研究指明了方向。