分享自:

近红外光谱结合支持向量机用于苦荞粉掺假的波长选择算法研究

期刊:Food ChemistryDOI:10.1016/j.foodchem.2024.141548

该文档属于类型a,即单篇原创研究的报告。以下是对该研究的学术报告:

作者及研究机构

该研究的主要作者包括Yue Yu、Yinghui Chai、Yujie Yan、Zhanming Li、Yue Huang、Lin Chen和Hao Dong。研究团队来自多个机构,包括江苏科技大学粮食科学与技术学院、中国农业大学食品科学与营养工程学院、新加坡南洋理工大学化学与生物医学工程学院,以及仲恺农业工程学院轻工食品学院。该研究于2025年发表在《Food Chemistry》期刊上。

学术背景

该研究属于食品科学与化学计量学(Chemometrics)领域,主要关注苦荞粉(Tartary Buckwheat)的掺假检测问题。苦荞因其显著的保健功效而受到消费者青睐,但市场上常出现以普通荞麦或其他谷物粉掺假的现象,严重损害了消费者利益。传统的检测方法如高效液相色谱(HPLC)和气相色谱-质谱联用(GC-MS)虽然有效,但成本高且对样品有破坏性。因此,开发一种快速、无损的检测方法成为迫切需求。近红外光谱(NIRS)因其无损、简单和便捷的特点,近年来在食品分析中得到了广泛应用。该研究旨在结合近红外光谱和化学计量学方法,建立定性模型,以识别苦荞粉中掺入的全麦粉、燕麦粉、大豆粉、大麦粉和高粱粉。

研究流程

研究流程主要包括样品制备、光谱数据采集、数据预处理、特征波长选择、模型建立与参数优化以及模型评估。

1. 样品制备
研究从云南、贵州和四川等主要产区选取了30个苦荞样品,并加入了五种常见谷物粉(全麦粉、燕麦粉、大豆粉、大麦粉和高粱粉)。样品经过清洗、去杂质、粉碎和过筛(80目)后,在60°C下干燥至恒重,密封冷藏备用。为了生成掺假样品,谷物粉以不同比例(0%、5%、10%、15%、20%和25%)与苦荞粉混合,最终获得900个样品,每个样品5克。

2. 光谱数据采集
样品(0.5克)被放入标准样品杯中,使用近红外光谱仪(NIR 1700,波长范围900-1700 nm)进行扫描。每个样品扫描三次,取平均光谱作为原始光谱。光谱数据通过MORPHO系统采集,并使用MATLAB软件(R2018b)进行分析。

3. 数据预处理
为了提高模型的鲁棒性,研究采用了九种预处理方法,包括标准正态变量变换(SNV)、多元散射校正(MSC)、最小-最大归一化(MMN)、Savitzky-Golay滤波(SG)及其一阶和二阶导数(SG-1st和SG-2nd)、SNV变换与去趋势(SNV-DT)、自动缩放(Autoscales)和均值中心化(MC)。

4. 特征波长选择
研究使用竞争性自适应重加权采样(CARS)和连续投影算法(SPA)筛选特征波长,以减少变量数量并提高模型效率。

5. 模型建立与参数优化
研究采用偏最小二乘判别分析(PLS-DA)和支持向量机(SVM)算法建立定性模型。SVM模型使用径向基函数(RBF)核,并通过交叉验证(CV)、遗传算法(GA)和粒子群优化(PSO)优化参数。

6. 模型评估
模型通过预测准确率、平均精度、F1分数和平均召回率等指标进行评估。研究还比较了全谱模型和非全谱模型的性能。

主要结果

1. 光谱数据与预处理
苦荞样品的光谱曲线在1208 nm和1460 nm处显示出显著的吸收峰,但不同样品的光谱曲线存在较大重叠。经过预处理后,光谱曲线的差异有所增强,但仍需通过模型进一步识别。

2. PLS-DA模型性能
PLS-DA模型的预测准确率在89.78%到94.22%之间,其中均值中心化(MC)-PLS-DA模型表现最佳,平均召回率和F1分数均超过98%。通过SPA和CARS算法筛选特征波长后,模型的变量数量显著减少,但预测性能未显著提升。

3. 全谱SVM模型性能
全谱SVM模型的预测准确率均超过90%,部分模型达到100%。通过CV、GA和PSO优化参数后,模型的稳定性和可靠性得到了验证。

4. 非全谱SVM模型性能
通过CARS和SPA筛选特征波长后,模型的变量数量减少,但部分模型的预测性能有所下降。然而,Autoscales-CARS-CV-SVM模型在减少变量数量的同时,仍保持了100%的预测准确率,成为最优模型。

结论

该研究证明了近红外光谱结合化学计量学方法在苦荞粉掺假检测中的潜力。通过PLS-DA和SVM算法,研究成功建立了高准确率的定性模型,能够有效识别苦荞粉中的掺假成分。特别是Autoscales-CARS-CV-SVM模型在减少变量数量的同时,仍保持了优异的预测性能,为食品掺假检测提供了新的解决方案。

研究亮点

  1. 首次将近红外光谱与化学计量学方法结合,用于苦荞粉掺假检测。
  2. 通过CARS和SPA算法筛选特征波长,显著提高了模型效率。
  3. Autoscales-CARS-CV-SVM模型在减少变量数量的同时,仍保持了100%的预测准确率,展现了优异的性能。

其他有价值的内容

研究还对比了不同预处理方法和特征波长选择算法对模型性能的影响,为未来相关研究提供了参考。此外,研究团队提出,未来研究应进一步优化数据预处理方法和模型评估指标,以提高模型的准确性和实用性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com