本研究由浙江大学等单位的研究人员完成,主要作者包括陆毅、聂林杰、郭新宇、潘甜甜、陈荣钦、刘训悦、李晓龙、李廷强和刘飞(通讯作者)。该研究论文发表在期刊 Ecotoxicology and Environmental Safety 上,于2024年7月在线发表。
学术背景 本研究属于环境科学与农业信息技术交叉领域,具体涉及植物修复(Phytoremediation)、高光谱成像(Hyperspectral Imaging, HSI)和深度学习(Deep Learning)。土壤重金属污染是全球性环境挑战,植物修复作为一种生态友好、成本效益高的技术备受关注。其核心在于利用能够超量吸收重金属的植物——超富集植物(Hyperaccumulator)。然而,传统的超富集植物筛选方法严重依赖耗时耗力的野外采样和实验室化学分析(如原子吸收光谱法AAS、电感耦合等离子体发射光谱法ICP-OES等)。X射线荧光光谱法(XRF)虽有所改进,但仍存在成本、安全性和定量准确性等问题。因此,开发快速、高通量、高效的筛选技术具有迫切需求。
高光谱成像技术能够快速、无损地获取植物的大量表型数据,其反射光谱信息与植物的生理生化状态密切相关。已有研究表明,植物在重金属胁迫下其光谱特征会发生变化,这为利用光谱技术监测重金属胁迫和积累提供了理论基础。机器学习已被用于从光谱中预测植物重金属含量,但在处理大数据和复杂任务时面临精度不足和过拟合等挑战。深度学习,特别是卷积神经网络(CNN),凭借其强大的特征提取和端到端学习能力,在复杂表型分析中展现出优势。本研究旨在将高光谱成像与多任务深度学习相结合,构建一种全新的方法,以期实现对超富集植物的快速鉴定、重金属胁迫类型的判别以及叶片中重金属积累量的定量预测,从而为植物修复过程中的材料筛选和环境监测提供创新工具。
详细研究流程 本研究流程设计严谨,主要包括植物培养与处理、数据采集与处理、模型构建与评估、以及方法验证四个主要部分,具体如下:
研究材料培养与实验设计:
高光谱图像采集与数据处理:
重金属参考浓度测定:
数据分析与模型构建:
方法综合评估:
主要研究结果 1. 生态型识别结果: 主成分分析(PCA)显示两种生态型光谱部分重叠。在分类模型比较中,自设计的ENet网络表现最优,在预测集上达到了100%的准确率、精确率、召回率和F1分数,AUC值为1,完美区分了AE和NAE。而PLS-DA和RBF-SVC模型分别出现了1个和2个误判。这证明了ENet在基于光谱识别超富集生态型方面的卓越能力,为后续分生态型预测重金属状况提供了可靠的第一步。
传统模型预测重金属胁迫与积累的结果:
HMNet模型预测重金属胁迫与积累的结果(核心发现):
综合方法验证结果: 对382个未知样本的测试表明,ENet生态型识别完全正确。随后经HMNet模型预测,重金属胁迫判别的EMR超过91%,HL低于0.036,各项分类指标大多超过95%。重金属定量预测结果与上述HMNet单独测试结果一致,Zn的预测RPD最高(AE: 3.56, NAE: 3.02),Cd和Pb的RPD也均超过2.4,进一步验证了所提方法的有效性和鲁棒性。
结论与意义 本研究成功开发并验证了一种结合高光谱成像与多任务深度学习的新方法,用于快速、无损、同时地鉴定东南景天的超富集生态型、判别其所受重金属胁迫类型、以及定量预测其叶片中Cd、Zn、Pb的积累量。该方法的核心——自设计的HMNet多任务网络——在各项指标上均显著优于传统机器学习模型,有效减少了过拟合,提高了预测精度和泛化能力。
科学价值与应用价值: * 方法论创新: 首次将多任务深度学习架构引入植物重金属胁迫与积累的光谱分析中,实现了单一模型同时完成分类和回归多个复杂任务,为植物表型组学和环境监测提供了新的高效分析范式。 * 技术流程革新: 建立了一个从快速光谱采集到自动化智能分析的完整技术流程,将传统需要数小时至数天的化学分析过程,缩短至几分钟内即可完成初步判断,极大提升了超富集植物筛选和重金属污染监测的效率和通量。 * 应用潜力巨大: 该方法为高通量筛选重金属超富集植物提供了强有力的工具。随着更多植物光谱数据的积累和模型的进一步训练与迁移,该方法有望集成到遥感平台或无人机上,实现大范围、实时、现场化的超富集植物发现和重金属污染监测,对推动植物修复技术的实际应用和环境保护具有重要价值。
研究亮点 1. 研究目标创新: 首次系统性地将高光谱成像与深度学习结合,旨在“一站式”解决超富集植物筛选中的生态型鉴定、胁迫判别和定量预测三个关键问题,目标明确且具有高度集成性。 2. 方法学显著创新: 自主设计了浅层网络ENet和特别是多任务网络HMNet。HMNet通过共享层提取共性特征,再通过特定任务分支进行精细化预测,这种结构是本研究最核心的贡献,显著提升了模型性能。 3. 卓越的实验结果: 模型在各项任务上均达到了很高的精度。生态型识别达到100%准确率;重金属胁迫判别EMR超过91%;重金属定量预测,尤其是对Zn的预测(RPD > 3.5),达到了优异的水平,超越了多数文献报道的基于传统方法的结果。 4. 完整的验证流程: 研究不仅对比了模型性能,还模拟了实际应用场景,用一批“未知”样本测试了从生态型识别到重金属预测的完整流程,证明了方法的可行性与可靠性。 5. 明确的转化前景: 论文明确指出了该技术向实地、高通量、遥感监测方向发展的潜力,将实验室研究与实际应用需求紧密衔接。
其他有价值内容 研究还讨论了模型的改进空间,例如指出由于实验设计中是将多个叶片的混合样作为一个参考值,而建模时每个叶片光谱作为一个样本,导致预测值围绕单个参考值散布。未来若能测定更多单叶片的参考值,将为模型提供更精确的监督信号,有望进一步提升模型的准确性和鲁棒性。此外,研究中对不同重金属预测性能的差异(Zn最佳,Cd、Pb次之)也为后续探究光谱响应与不同重金属生理毒害机制之间的关系提供了线索。