分享自:

利用高光谱成像进行植物生理性状无损分析:以干旱胁迫为例

期刊:computers and electronics in agricultureDOI:10.1016/j.compag.2022.106806

本研究由Mohd Shahrimie Mohd Asaari(安特卫普大学imec-vision实验室及马来西亚理科大学电气与电子工程学院)、Stien Mertens、Lennart Verbraeken、Stijn Dhondt、Dirk Inzé(以上四位来自根特大学植物生物技术与生物信息学系及VIB植物系统生物学中心)、Koirala Bikram和Paul Scheunders(安特卫普大学imec-vision实验室)共同完成。该研究成果以“Non-destructive analysis of plant physiological traits using hyperspectral imaging: a case study on drought stress”为题,于2022年发表在学术期刊《Computers and Electronics in Agriculture》第195卷上。

学术背景 本研究隶属于农业信息学与植物表型组学交叉领域。传统的植物生理性状测量方法,如叶片水势测量需要破坏性采样,光合效率、气孔导度等气体交换参数的测量虽可无损但通量低、耗时费力,严重限制了大规模高通量植物表型分析的效率。随着高光谱成像(Hyperspectral Imaging, HSI)传感器技术的发展,快速、非侵入、非破坏性地获取植物的生理状态信息成为可能。高光谱成像能够捕获植物在可见光至近红外范围内连续、狭窄波段的光谱反射信息,这些光谱特征与叶片内部的生化组分(如色素、水分、干物质)和结构特性(如叶肉厚度、气孔结构)密切相关。因此,利用高光谱反射光谱来反演植物的生理性状已成为一个重要的研究方向。

先前的研究主要通过两种途径从光谱中提取植物性状:一是基于辐射传输模型(Radiative Transfer Models, RTMs)的物理模型反演,但其灵活性差,难以处理经预处理(如标准正态变量变换SNV)后的光谱数据,且存在“病态反演”问题;二是利用机器学习回归(Machine Learning Regression, MLR)方法建立光谱与性状之间的统计模型,这种方法更为灵活,能够适应复杂的非线性关系。其中,偏最小二乘回归(Partial Least Squares Regression, PLSR)因其能处理高维共线性数据而被广泛应用。近年来,基于核方法的非线性回归算法,如核岭回归(Kernel Ridge Regression, KRR)和高斯过程回归(Gaussian Process Regression, GPR),在植物性状反演中展现出潜力。

本研究的目标是发展一种基于高光谱成像的非破坏性方法,用于表征植物的生理状态。具体目标包括:(1)建立四种关键生理性状——叶片水势(Water Potential, ψ)、光系统II有效量子产额(Effective Quantum Yield of PSII, ΦPSII)、蒸腾速率(Transpiration Rate, TR)和气孔导度(Stomatal Conductance, gs)——的预测模型,这些性状均是植物响应干旱胁迫的重要指标;(2)探索和验证PLSR、KRR和GPR三种MLR算法在此任务上的性能;(3)将开发的最佳预测模型应用于一个小规模的玉米干旱表型分析实验中,以检测早期干旱胁迫响应。

详细工作流程 本研究的工作流程主要包括五个关键步骤:植物培育与实验设计、高光谱及地面真值数据采集、光谱数据预处理、机器学习回归模型构建与验证、以及模型在干旱胁迫检测中的应用。

第一步:植物培育与实验设计。 实验在比利时根特VIB-UGent植物系统生物学中心的Phenovision室内表型平台进行。研究对象为玉米自交系B104。种子播种于7升盆中,在温室条件下培育至V5营养生长阶段(长出5片叶子)。此后,将植物分为两组:第一组为充分浇水组(Well-Watered, WW),保持土壤水势在-10 kPa(最优含水量);第二组为渐进干旱处理组(Progressive Drought, PD),停止浇水7天直至土壤水势降至-100 kPa,之后维持此低含水量水平。整个实验共使用128株植物。其中,108株(54株WW,54株PD)用于构建和训练回归模型(训练/验证集);另外20株(10株WW,10株PD)作为一个独立的测试集,专门用于后续的干旱响应检测实验。

第二步:数据采集。 数据采集包括高光谱成像和地面真值测量两部分。高光谱图像采集使用推扫式线扫描可见光-近红外高光谱相机,光谱范围400-1000 nm,最终选取信噪比较高的500-850 nm范围(111个波段)进行分析。图像采集在10天内完成,每次采集包括植物样本、白色参考板(用于辐射定标)和黑色参考图像。地面真值数据在采集高光谱图像后立即进行。对于ΦPSII、gs和TR,使用Li-Cor 6400XT便携式光合作用测量系统进行非破坏性测量,在干旱期的第0、5、7、9天,每天测量4-5次。对于水势ψ,采用破坏性采样方法,使用压力室在干旱期的第0、3、5、7、9天进行测量,每天采样3次,选取植株顶部(第5-9片)可见叶片进行测定,以确保测量位置与高光谱图像观测区域相对应。

第三步:光谱数据预处理。 使用MATLAB R2017b软件进行数据处理。首先,从高光谱图像中分割出植物像素(基于NDVI阈值)。然后,对每个像素的光谱应用标准正态变量(Standard Normal Variate, SNV)归一化,以减少光照不均匀性的影响。接着,对SNV归一化后的光谱应用聚类算法,以滤除由叶脉和阴影区域像素引起的非线性变异。最后,将保留的聚类中所有像素的光谱进行平均,得到代表整株植物的单一SNV光谱。这个平均光谱将作为后续回归模型的输入变量。

第四步:机器学习回归模型构建与验证。 本研究探索了三种回归算法:线性模型PLSR和非线性模型KRR与GPR。模型开发独立针对四个生理性状进行。为了评估模型性能并选择最优超参数,研究采用了交叉验证策略。对于PLSR,通过10折交叉验证确定最优潜变量数量。对于KRR,其超参数(正则化参数λ和高斯核带宽σ)通过网格搜索结合交叉验证进行优化。GPR的超参数(如核函数的长度尺度lb)则通过最大化训练数据的边际似然来自动优化。在确定各算法最优超参数后,研究进行了20折交叉验证(每次随机划分60%训练集和40%验证集),以稳健地评估模型的平均性能。评估指标为归一化均方根误差(NRMSE)和皮尔逊决定系数(R²)。最终,为每个性状选择NRMSE最低的模型作为最佳预测模型。

第五步:干旱胁迫检测应用。 将第四步中得到的最佳预测模型(特别是性能最优的GPR模型)应用于独立的20株测试集植物(10 WW,10 PD)。连续10天预测这些植物的四个生理性状值。通过计算每组植物(WW vs. PD)每天预测值的均值与标准差,并利用单因素方差分析(one-way ANOVA)检验两组间差异的显著性,来评估模型检测早期干旱胁迫的能力。此外,研究还展示了在像素级别应用GPR模型预测ΦPSII,生成假彩色分布图,以可视化胁迫条件下生理性状在叶片上的空间分布异质性。

主要结果 1. 模型开发与验证结果: 三种回归算法对四个生理性状的预测性能存在差异。总体而言,两个非线性模型(KRR和GPR)在所有性状上的预测精度均优于线性模型PLSR。GPR模型取得了最佳的整体性能,其平均NRMSE最低,R²最高。具体而言,对于水势和有效量子产额,所有模型都取得了很好的预测效果(平均NRMSE < 10%,平均R² > 0.82)。对于气孔导度和蒸腾速率,预测精度稍低(平均NRMSE在10-13%之间,平均R²在0.7-0.79之间),但GPR模型仍然表现最佳。表1汇总了20折交叉验证的平均性能数据,图5展示了各算法最佳预测模型下估计值与实测值的散点图。GPR的优异性能归因于其概率框架、自动化的超参数优化能力,以及能够通过核函数的长度尺度参数(lb)来评估各光谱波段的相关性重要性。图6展示了基于GPR模型20次运行结果汇总的、对预测各性状最重要的前20个波长区域。例如,预测水势的重要波段出现在500–520 nm、600–680 nm和720–800 nm区域;预测气孔导度的重要波段位于580–660 nm和780–820 nm区域。这些发现与已知的叶片光学特性与生理结构/生化组分之间的关系相符,增强了模型的可解释性。

2. 干旱胁迫检测结果: 应用最佳GPR预测模型对测试集进行的干旱响应监测取得了显著成果(图7)。结果显示,在干旱诱导开始后(PD组停止浇水),所有四个预测的生理性状在WW组和PD组之间都表现出明显且一致的分化趋势。WW组植物的所有性状在监测期内均呈上升趋势,这与植物从幼龄向更成熟发育阶段过渡的生理变化相符。相反,PD组植物的所有性状在缺水期间均呈现下降趋势,这是植物应对水分胁迫的典型生理响应:水分吸收减少导致水势下降,引发气孔关闭(气孔导度下降),从而降低蒸腾速率和二氧化碳同化(影响光合效率)。统计学分析(单因素方差分析,表2)表明,在干旱诱导开始后仅3天,预测的水势和有效量子产额就已能在WW和PD植物之间显示出极显著差异(p < 0.001和p < 0.01)。气孔导度在第3天也显示出显著差异(p < 0.05),而蒸腾速率的分化稍晚,但在第4天也变得显著。这一结果证明,基于高光谱成像的机器学习模型能够在可见胁迫症状出现之前,非常早期地检测到植物的干旱胁迫响应。作为对比,使用PLSR线性模型进行预测时(图8),气孔导度和蒸腾速率在第3天未能达到显著差异,直到第4天才变得显著,这表明非线性GPR模型在捕捉复杂生理响应方面更具优势。此外,像素级别的预测可视化(图9)显示,PD植株中有更多像素具有较低的有效量子产额预测值,这不仅与整体平均值趋势一致,还揭示了胁迫响应在叶片空间分布上的异质性,为未来研究植物内部胁迫梯度提供了可能性。

结论 本研究成功证明,利用高光谱成像结合机器学习回归方法,可以实现对植物关键生理性状(水势、有效量子产额、气孔导度、蒸腾速率)快速、非破坏性的准确估测。在三种测试的算法中,基于高斯过程回归的非线性模型展现了最佳的预测性能。将这些预测模型应用于玉米干旱胁迫实验中,能够早在干旱诱导后3天就显著区分出干旱处理与正常浇水植株,实现了对早期干旱胁迫的高通量、非侵入式检测。这项工作为植物表型组学研究,特别是在气候变化背景下针对非生物胁迫(如干旱)的作物抗逆性筛选和遗传改良,提供了一种强有力的新工具。该方法克服了传统生理测量方法通量低、破坏性的局限,充分展现了高光谱成像技术在精准农业和植物科学研究中的应用潜力。

研究亮点 1. 早期无损检测: 核心亮点在于实现了对植物干旱胁迫的极早期(3天内)、非破坏性检测,远早于肉眼可见症状的出现,对于作物抗逆育种和精准灌溉管理具有重要应用价值。 2. 多性状同步预测: 本研究不是预测单一的生物物理参数(如叶绿素含量),而是同步预测了四个相互关联的关键生理性状,这些性状共同构成了植物响应干旱的核心生理网络,提供了更全面的植物状态诊断信息。 3. 先进的算法比较与应用: 系统性地比较了线性(PLSR)与非线性(KRR, GPR)机器学习回归算法在植物生理性状高光谱反演中的性能,并证实了高斯过程回归在此类复杂非线性问题上的优越性。GPR不仅提供预测值,还能给出预测不确定性,并且其核函数提供了波段重要性分析,增强了模型的可解释性。 4. 从整株到像素的分析潜力: 研究不仅停留在整株平均光谱的预测层面,还初步探索了像素级别的性状分布可视化,为未来研究胁迫在植物器官乃至组织水平的空间异质性奠定了基础。 5. 严谨的实验设计: 实验设计了独立的模型训练集和干旱测试集,确保了模型验证的独立性和应用于胁迫检测场景的可靠性。数据采集同时包含了高光谱图像和地面真值测量,且考虑了测量时间与部位的对应关系,保证了数据质量。

其他有价值的内容 本研究得到了包括巴斯夫、赫拉克勒斯基金会、根特大学等多方资金的资助,体现了产学研结合的特点。作者在文中也指出了未来工作的一个有趣方向:目前模型基于整株植物的平均光谱建立,而地面真值测量在叶片特定部位进行。未来可以开发基于对应测量像素光谱的模型,以更精确地揭示和图示植株内部(如叶片区域)与胁迫水平相关的生理性状变异。这将使高光谱表型分析更加精细化。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com