分享自:

基于近红外光谱的玉米籽粒蛋白质含量定量预测研究

期刊:FoodsDOI:10.3390/foods13244173

类型a

主要作者与研究机构及发表信息
该研究的主要作者包括Fan Chenlong、Liu Ying、Cui Tao、Qiao Mengmeng(通讯作者)、Yu Yang、Xie Weijun 和 Huang Yuping。研究团队来自南京林业大学机械电子工程学院、中国农业大学工学院以及江苏大学智能农机装备理论与技术重点实验室。论文于2024年12月23日发表在学术期刊《Foods》上。

研究背景
本研究属于农业科学和食品科学领域,具体聚焦于玉米籽粒蛋白质含量的快速检测方法。随着全球人口增长和对玉米等关键商品需求的增加,确保玉米质量成为粮食安全的重要组成部分。玉米作为世界重要的粮食作物之一,其营养成分尤其是蛋白质含量直接影响其在食品和饲料中的应用价值。因此,准确检测玉米籽粒的蛋白质含量对于提高玉米利用效率和保障食品安全至关重要。然而,传统蛋白质含量测定方法如凯氏定氮法和杜马斯法虽然准确性高,但操作复杂、耗时且需要大量化学试剂,难以满足生产过程中的快速检测需求。近年来,近红外光谱技术(Near-Infrared Spectroscopy, NIR)因其快速、无损和环保的特点,逐渐成为谷物及其加工产品成分分析的重要手段。然而,NIR技术在测量完整玉米籽粒蛋白质含量时受到表面效应和样品均匀性问题的限制。为解决这些问题,本研究以玉米粉为研究对象,旨在探索一种基于近红外光谱技术的快速检测方法,并优化数据预处理和建模流程,以提高预测精度。

研究工作流程
本研究的工作流程主要包括以下几个步骤:

  1. 样品制备
    研究团队从中国五大玉米主产区(东北、华北、黄淮海、西南和西北)收集了不同收获期和品种的玉米籽粒粉末样品,共计92个样本。每个样本经过清洗、干燥和研磨处理,最终通过80目筛网过滤得到细粉。干燥后的玉米粉水分含量控制在13.05%,符合中国国家标准要求,以减少水分吸收对近红外光谱检测的影响。

  2. 近红外光谱检测系统构建
    研究团队搭建了一套基于Flame-NIR-INTSMA25光谱仪(Ocean Optics公司)的近红外光谱检测平台,波长范围为940–1660 nm。该系统包括光源、光纤、样品台和光谱仪,通过避免可见光波段的干扰,有效减少了玉米粉末颜色对蛋白质含量预测的影响。

  3. 光谱数据预处理
    由于开放光谱检测系统中存在随机噪声、杂散光和电气噪声等外部干扰,研究团队采用了多种光谱预处理算法,包括标准正态变量变换(Standard Normal Variate, SNV)、一阶导数(First Derivative, 1D)、Savitzky-Golay平滑(S-G)、多重散射校正(Multiplicative Scatter Correction, MSC)及其组合方法(如1D + MSC、1D + SNV)。这些方法用于消除样品颗粒大小分布不均、表面散射和光学路径长度变化对反射光谱的影响。

  4. 特征波长筛选
    为了减少近红外光谱数据中的多共线性和冗余信息,研究团队使用连续投影算法(Successive Projections Algorithm, SPA)和无信息变量消除(Uninformative Variable Elimination, UVE)方法筛选与玉米蛋白质含量密切相关的特征波长。这些方法显著降低了建模变量的数量,同时保持了模型的预测性能。

  5. 建模与数据分析
    研究团队采用偏最小二乘回归(Partial Least Squares Regression, PLSR)、支持向量机(Support Vector Machine, SVM)和极限学习机(Extreme Learning Machine, ELM)三种算法构建预测模型。通过对比不同预处理方法和建模算法的性能,评估模型的预测能力。评价指标包括相关系数(Correlation Coefficient, R)、均方根误差(Root Mean Square Error, RMSE)和相对分析误差(Residual Predictive Deviation, RPD)。

主要结果
1. 光谱数据分析
原始光谱曲线显示,940–1600 nm范围内光谱反射率变化显著,尤其是在940–1500 nm区间。研究观察到玉米粉光谱曲线在994 nm、1212 nm和1466 nm处有显著吸收峰,分别对应于N-H键二级倍频、C-H键二级倍频和O-H键基频振动。

  1. 模型性能对比
    PLSR模型在1D + MSC和1D + SNV预处理条件下表现最佳,相关系数(Rp)达到0.92,均方根误差(RMSEP)为0.3 g/kg,RPD值为3,表明模型具有良好的预测能力。相比之下,SVM和ELM模型的整体性能稍逊,但1D + MSC和1D + SNV预处理仍显著提升了模型精度。

  2. 特征波长筛选结果
    SPA和UVE方法均有效减少了建模变量数量。UVE方法在1D + MSC预处理条件下保留了更多与蛋白质含量相关的特征波长(如1194.78 nm、1206.18 nm、1471.17 nm和1476.75 nm),进一步提高了模型的预测性能。最终,UVE筛选的特征波长结合PLSR模型实现了最佳预测效果(Rp = 0.93,RMSEP = 0.3 g/kg,RPD = 3)。

研究结论与意义
本研究成功开发了一种基于近红外光谱技术和机器学习算法的玉米粉蛋白质含量快速检测方法。研究表明,1D + MSC和1D + SNV预处理方法能够显著提升光谱数据质量和模型预测精度。通过特征波长筛选和PLSR建模,研究团队构建了一个具有高预测能力的蛋白质含量检测模型。该研究不仅为玉米质量控制和加工提供了科学依据,还展示了近红外光谱技术在农业和食品工业中的广阔应用前景。

研究亮点
1. 创新性预处理方法:1D + MSC和1D + SNV预处理方法显著提升了光谱数据质量和模型预测精度。
2. 特征波长筛选:SPA和UVE方法有效减少了建模变量数量,同时保持了模型的预测性能。
3. 高效建模策略:PLSR模型结合特征波长筛选实现了高精度的蛋白质含量预测。
4. 实际应用价值:该方法解决了完整玉米籽粒表面效应和样品均匀性问题,为玉米蛋白质含量的快速检测提供了新思路。

其他有价值内容
研究团队还探讨了未来研究方向,包括扩大样本量、引入深度学习算法(如卷积神经网络)以建立适应性更广、精度更高的蛋白质含量预测模型。此外,研究得到了江苏省自然科学基金(BK20230402)、中国博士后科学基金(2023M741723)和国家自然科学基金(52405277)的支持,体现了该研究的重要性和学术价值。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com