分享自:

基于一维卷积神经网络的玉米油中氯吡硫磷残留近红外光谱检测性能比较

期刊:infrared physics & technologyDOI:10.1016/j.infrared.2023.104734

本研究由Yingchao Xue(江苏大学电气与信息工程学院)、Chengyun Zhu(盐城师范学院物理与电子工程学院/江苏省智能光电器件与测控工程研究中心)和Hui Jiang(江苏大学电气与信息工程学院)合作完成,成果发表于2023年5月的《Infrared Physics & Technology》期刊(卷132,文章编号104734)。研究聚焦食用油脂中农药残留的快速检测问题,提出了一种基于一维卷积神经网络(1D-CNN)结合近红外光谱(Near-Infrared Spectroscopy, NIR)的数据增强分析方法,用于玉米油中毒死蜱(Chlorpyrifos)残留的定量检测。

学术背景

毒死蜱作为一种广谱有机磷农药,虽能有效防治作物害虫,但其残留可能通过食用油进入人体,对心血管、神经和内分泌系统造成损害,甚至诱发癌症。传统检测方法如色谱法(GC/LC)和质谱法(GC-MS/LC-MS)虽精度高,但耗时昂贵且需专业操作。近红外光谱技术因其快速、无损、无需前处理等优势成为潜在替代方案,但传统化学计量学方法在复杂基质(如食用油)中的分析性能有限。深度学习为光谱分析提供了新思路,然而实际应用中高质量标记数据获取困难。为此,本研究旨在开发结合数据增强技术的1D-CNN模型,提升小样本条件下毒死蜱残留的定量分析精度。

研究流程与方法

1. 样本制备与光谱采集

  • 样本制备:采购9个品牌玉米油,配制14个浓度梯度(150~0.03 mg/kg)的毒死蜱标准溶液,按1:9质量比混合,最终获得126个样本。
  • 光谱采集:使用Ocean Optics Flame-NIR+光谱仪(波长范围970-1700 nm),设置积分时间20 ms,每个样本重复测量3次取均值以降低环境误差(温度控制在25℃)。

2. 数据增强技术

针对样本量不足问题,采用两种数据增强策略:
- DCGAN(深度卷积生成对抗网络):生成器输入100维随机噪声,通过转置卷积层生成模拟光谱;判别器通过卷积层鉴别真伪光谱。训练中交替优化生成器(最小化判别器识别率)和判别器(最大化真实光谱分类准确率),最终生成45组增强光谱。
- SNR噪声添加:在原始光谱中加入信噪比(Signal-to-Noise Ratio, SNR)为55 dB、50 dB、45 dB、40 dB的高斯噪声,模拟实际测量中的信号干扰。

3. 1D-CNN模型构建与训练

  • 网络结构:包含3个卷积层(核大小分别为17×1、15×1、11×1,通道数32-64-32)、最大池化层(2:1下采样)、全连接层。使用ReLU激活函数,损失函数为平均绝对误差(MAE),优化器为Adam(学习率0.0001),批量大小20,迭代1000次。
  • 数据划分:原始数据按3:1分为训练集与预测集;增强后数据每浓度随机选取75%训练,25%验证。

4. 模型评估指标

采用校准集均方根误差(RMSEC)、预测集均方根误差(RMSEP)、决定系数(R²)、相对百分比偏差(RPD)评估性能,其中RPD=SD/RMSEP(SD为预测集标准差)。

主要结果

  1. 传统方法与1D-CNN对比

    • SVM模型的R²p仅为0.5618,RMSEP达27.2333 mg/kg;
    • 原始光谱1D-CNN模型性能提升(R²p=0.7893,RMSEP=17.8586 mg/kg),但仍有限。
  2. 数据增强效果

    • DCGAN-1D-CNN:R²p提升至0.8856,RMSEP降低至13.1583 mg/kg,RPD达2.9678;
    • SNR-1D-CNN(最优):R²p=0.9492,RMSEP=8.7621 mg/kg,RPD=4.4569,较原始模型误差降低9.1 mg/kg。
  3. 训练动态分析

    • DCGAN增强模型在150次迭代内快速收敛,SNR增强模型在850次迭代后稳定,表明噪声增强提升了模型鲁棒性。

结论与价值

本研究证实:
1. 方法学创新:数据增强技术(DCGAN与SNR噪声)有效解决了NIR深度学习中小样本问题,其中SNR噪声增强使模型预测精度接近实验室级(RPD>3)。
2. 应用价值:为食用油农药残留提供了一种低成本、高通量的现场检测方案,检测时间从传统方法的数小时缩短至分钟级。
3. 理论意义:揭示了数据多样性对深度学习模型泛化能力的关键作用,为光谱化学计量学中数据增强策略的选择提供了实证依据。

研究亮点

  • 技术融合:首次将DCGAN与SNR噪声联合应用于NIR光谱增强,突破小样本限制;
  • 性能突破:SNR-1D-CNN的RPD值达4.4569,显著优于传统方法(RPD<1.5);
  • 可扩展性:提出的框架可推广至其他农药或食品基质的光谱分析。

其他发现

研究还指出,DCGAN生成数据需平衡质量与数量,而过高SNR噪声(如<40 dB)可能导致模型过拟合。未来可探索生成对抗网络与物理噪声模型的进一步结合。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com