分享自:

基于可见光和近红外光谱的豌豆蛋白含量预测与分类的深度学习模型

期刊:Food ChemistryDOI:10.1016/j.foodchem.2025.143617

这篇文档属于类型a,即报告了一项原创性研究的科学论文。以下是对该研究的学术报告:

主要作者及研究机构

该研究的主要作者包括Tianpu Xiao、Chunji Xie、Li Yang、Xiantao He、Liangju Wang、Dongxing Zhang、Tao Cui、Kailiang Zhang、Hongsheng Li和Jiaqi Dong。他们来自中国农业大学工程学院以及中国农业农村部土壤-机械-植物重点实验室。该研究发表于2025年3月1日的《Food Chemistry》期刊,文章编号为143617。

学术背景

该研究的主要科学领域是食品化学和光谱分析技术,特别是利用可见光和近红外光谱(Visible and Near-Infrared Spectroscopy, Vis-NIR)技术进行豌豆蛋白质含量的快速检测和分类。随着全球人口增长和生活方式的改变,对高质量蛋白质的需求显著增加。然而,传统的动物蛋白生产面临资源消耗大、环境污染严重和成本高等问题,植物蛋白因其可持续性和环保优势成为重要的替代品。豌豆蛋白作为一种高蛋白、低胆固醇且易于消化的植物蛋白,近年来在食品科学领域受到广泛关注。传统的蛋白质检测方法(如凯氏定氮法)虽然准确,但存在操作复杂、耗时长、需要大量化学试剂等缺点,且不适合大规模实时检测。因此,开发一种快速、无损且准确的豌豆蛋白检测方法具有重要意义。

研究流程

该研究分为以下几个主要步骤:

  1. 样本准备
    研究选取了中国八个不同栽培区域的52个豌豆品种,包括10个棕色品种、16个白色品种和26个绿色品种。样本根据颜色比例随机选取,形成外部验证集(占总样本的10%),其余样本按7:3的比例分为训练集和测试集。

  2. 光谱数据采集与预处理
    使用NIRQuest系列和QE Pro系列光谱仪采集豌豆样本的光谱数据。NIRQuest光谱仪覆盖900-2500 nm范围,QE Pro光谱仪覆盖200-1100 nm范围。每个样本扫描多次,取平均值作为原始光谱数据。数据采集前使用99%漫反射标准白板进行校准。采集后,通过匹配滤波方法将光谱分辨率标准化为4 nm。为增强数据多样性,采用高斯噪声、缩放和抖动等数据增强技术。预处理方法包括Savitzky-Golay(SG)平滑和乘性散射校正(Multiplicative Scatter Correction, MSC),以消除高频噪声和样本表面散射的影响。

  3. 豌豆蛋白质含量测定
    采用凯氏定氮法(GB 5009.5-2016)测定豌豆样本的蛋白质含量。每个样本进行两次独立测定,取平均值作为最终蛋白质含量。

  4. 深度学习模型开发与评估
    研究开发了一种名为PeaNet的深度学习模型,用于预测和分类豌豆蛋白质含量。模型结构包括注意力机制模块、一维卷积模块和全连接模块。训练过程中使用Adam优化算法,并通过10折交叉验证和贝叶斯优化进行超参数调优。模型性能通过预测集相关系数(Rp2)和均方根误差(RMSEP)进行评估。

主要结果

  1. 豌豆蛋白质含量及其光谱特征
    研究分析了不同颜色豌豆的蛋白质含量和光谱特征。绿色、白色和棕色豌豆的平均蛋白质含量分别为24.73 g/100 g、24.37 g/100 g和24.34 g/100 g,差异不显著。光谱分析显示,在400-900 nm范围内,不同颜色豌豆的光谱差异显著,而在900-2500 nm范围内光谱一致性较高。

  2. 豌豆蛋白质含量预测与分类模型的开发
    PeaNet模型在训练集上实现了Rp2为0.86、RMSEP为0.75的预测性能,在测试集上Rp2为0.84、RMSEP为0.87。蛋白质分类准确率达到85.33%。在外部验证集上,模型保持了Rp2大于0.80和分类准确率83.33%的优异表现。

  3. 模型性能比较
    PeaNet模型在测试集和外部验证集上均显著优于传统机器学习模型(如PLSR和SVR)和经典深度学习模型(如MLP和AlexNet)。特别是在外部验证集上,PeaNet模型的性能下降幅度最小,显示出较强的泛化能力。

  4. 光谱特征波长分析
    研究分析了不同模型使用的特征波长。PeaNet模型主要依赖于550 nm、650 nm、950 nm、1200 nm、2000 nm和2300 nm等关键波长,这些波长与豌豆蛋白质的化学和物理特性密切相关。

结论

该研究开发了一种基于Vis-NIR光谱和深度学习技术的PeaNet模型,能够快速、准确地预测和分类豌豆蛋白质含量。模型在测试集和外部验证集上均表现出优异的预测性能和泛化能力,显著优于传统方法。研究为豌豆蛋白质含量的快速检测提供了一种绿色、高效的方法,为食品质量控制和育种研究提供了重要支持。

研究亮点

  1. 创新性模型:PeaNet模型结合了注意力机制和一维卷积神经网络,能够自动提取光谱特征,避免了传统方法中繁琐的特征工程。
  2. 高效性:模型在几秒内即可完成光谱数据的采集和分析,显著提高了检测效率。
  3. 广泛应用性:模型适用于不同品种、颜色和生长环境的豌豆样本,具有较强的通用性。
  4. 环保性:相比传统化学分析方法,Vis-NIR光谱技术无需使用化学试剂,减少了环境污染。

其他有价值的内容

研究还探讨了光谱特征波长与豌豆蛋白质含量之间的关系,为未来光谱技术在食品分析中的应用提供了理论支持。此外,研究提出的数据增强和预处理方法为光谱数据的处理提供了新的思路。

该研究不仅推动了豌豆蛋白质检测技术的发展,也为其他作物的蛋白质含量分析提供了可借鉴的方法,具有重要的科学和应用价值。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com