分享自:

基于多模态数据融合和可解释深度学习技术的自然老化玉米种子活力快速检测

期刊:Food ChemistryDOI:10.1016/j.foodchem.2025.143692

这篇文档属于类型a,即报告了一项原创研究。以下是基于文档内容的学术报告:


作者与机构
本研究的主要作者为He Li、Yilin Mao、Yanan Xu、Keling Tu、Han Zhang、Riliang Gu和Qun Sun。研究团队来自中国农业大学的农学与生物技术学院、农业农村部作物种子全程技术研究创新中心(北京)以及北京市作物遗传改良重点实验室,部分作者还来自扬州大学的江苏省作物遗传与生理重点实验室、植物功能基因组学教育部重点实验室等机构。该研究于2025年发表在《Food Chemistry》期刊上,论文标题为《Rapid detection of the viability of naturally aged maize seeds using multimodal data fusion and explainable deep learning techniques》。

学术背景
研究领域为农业科学与人工智能交叉领域,具体涉及玉米种子活力(seed viability)的无损检测技术。玉米作为全球主要粮食作物之一,其种子活力直接影响田间出苗率、生长速度、抗逆性及最终产量。传统种子活力检测方法(如标准发芽试验、电导率测定和四唑染色法)存在操作复杂、破坏性强、耗时长等问题。尽管已有研究利用机器视觉(machine vision, MV)、反射光谱(reflection spectrum, RS)等技术进行种子活力检测,但这些方法主要基于人工老化种子,且模型精度较低(低于70%)。因此,本研究旨在开发一种基于自然老化(naturally aged, NA)玉米种子的多模态数据融合与可解释深度学习技术,以提高种子活力检测的精度和实用性。

研究流程
研究流程包括以下几个主要步骤:

  1. 玉米种子采集与标准发芽试验
    研究选取了两种自然老化玉米品种“Sanbei”(SB)和“Zhongyu”(ZY),分别从2017年和2020年储存的种子中各选取500粒进行标准发芽试验。通过卷纸发芽法测定种子的发芽率,并将其分为有活力种子(viable seeds, VS)和无活力种子(non-viable seeds, NVS)。

  2. 多模态数据采集与预处理
    研究使用多种传感器采集玉米种子的多模态数据,包括机器视觉(MV)、反射光谱(RS)、透射光谱(transmission spectrum, TS)、散射光谱(scattering spectrum, SS)和自发荧光光谱(auto-fluorescence spectrum, FS)。具体方法如下:

    • MV数据:使用清华同方D6810扫描仪采集种子图像,并提取形态、颜色和纹理特征。
    • RS和TS数据:使用可见光/近红外高光谱成像系统采集反射和透射光谱数据,并进行光谱校正。
    • FS数据:使用Videometer系统采集种子胚和胚乳表面的荧光光谱信息。
    • SS数据:使用Ocean Optics USB2000系统采集种子的散射光谱数据。
  3. 特征变量选择与数据集平衡
    研究采用Spearman相关性分析和无信息变量消除-连续投影算法(uninformative variables elimination-successive projections algorithm, UVE-SPA)筛选特征变量。为了平衡数据集,研究结合合成少数类过采样技术(synthetic minority over-sampling technique, SMOTE)和Tomek链接算法处理训练集。

  4. 模型构建与优化
    研究提出了一种基于多头自注意力机制和卷积神经网络支持向量机网络(multihead self-attention and convolutional neural support vector machine networks, MSCNSVN)的种子活力检测模型,并与支持向量分类(support vector classification, SVC)、优化集成学习(optimized ensemble learning, OLE)和卷积神经网络(convolutional neural network, CNN)等基线模型进行对比。模型参数通过贝叶斯优化(Bayesian optimization, BO)进行调优。

  5. 模型性能评估与解释性分析
    研究通过准确率、精确率、召回率和F1得分等指标评估模型性能,并使用Kruskal-Wallis算法和部分依赖图(partial dependence plots, PDP)分析特征变量的贡献率和边际效应。

主要结果
1. 单模态数据集中,FS数据集的预测精度最高(71.6%),其中FS570/600变量的贡献率最大(94.4%)。
2. 多模态数据融合显著优于单模态数据,精度提升约10%。其中,MV + RS + FS数据集的检测效果最佳,准确率达到78.8%。
3. MSCNSVN模型在所有基线模型中表现最优,精度提升2%-6%。
4. 基于双品种数据集和胚乳表面数据集的建模进一步提高了模型精度,分别提升2%-3%。
5. 研究还发现,自然老化种子的光谱信息变化较人工老化种子更小,表明基于人工老化种子的模型不适用于自然老化种子的活力预测。

结论
本研究开发了一种基于多模态数据融合与可解释深度学习技术的玉米种子活力检测模型,显著提高了检测精度和实用性。研究结果表明,FS数据在种子活力检测中具有显著潜力,而多模态数据融合能够提供更丰富的信息,提升模型的泛化能力。此外,MSCNSVN模型在处理复杂数据集时表现出色,尤其在检测无活力种子方面具有优势。该研究为农业种子质量评估提供了高效、准确的技术支持,具有重要的科学价值和应用前景。

研究亮点
1. 首次将多模态数据融合与可解释深度学习技术应用于自然老化玉米种子活力检测,显著提高了模型精度。
2. 提出的MSCNSVN模型在处理复杂数据集时表现优异,尤其在检测无活力种子方面具有显著优势。
3. 研究发现FS数据在种子活力检测中具有独特优势,为未来研究提供了新方向。
4. 研究验证了多模态数据融合在农业表型研究中的广泛应用潜力,为其他作物研究提供了参考。

其他有价值内容
研究还探讨了不同品种和种子表面(胚与胚乳)对模型精度的影响,发现基于胚乳表面数据集的模型精度更高,为未来研究提供了重要启示。此外,研究团队计划将该技术集成到AISeed软件中,以实现更广泛的应用。


以上是本研究的详细报告,涵盖了研究的背景、流程、结果、结论及其科学价值与应用前景。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com