本研究由Yingchao Xue(江苏大学电气与信息工程学院)、Chengyun Zhu(盐城师范学院物理与电子工程学院/江苏省智能光电器件与测控工程研究中心)和Hui Jiang(江苏大学电气与信息工程学院)合作完成,成果发表于2023年5月的《Infrared Physics & Technology》期刊(卷132,文章编号104734)。研究聚焦食用油脂中农药残留的快速检测问题,提出了一种基于一维卷积神经网络(1D-CNN)结合近红外光谱(Near-Infrared Spectroscopy, NIR)的数据增强分析方法,用于玉米油中毒死蜱(Chlorpyrifos)残留的定量检测。
毒死蜱作为一种广谱有机磷农药,虽能有效防治作物害虫,但其残留可能通过食用油进入人体,对心血管、神经和内分泌系统造成损害,甚至诱发癌症。传统检测方法如色谱法(GC/LC)和质谱法(GC-MS/LC-MS)虽精度高,但耗时昂贵且需专业操作。近红外光谱技术因其快速、无损、无需前处理等优势成为潜在替代方案,但传统化学计量学方法在复杂基质(如食用油)中的分析性能有限。深度学习为光谱分析提供了新思路,然而实际应用中高质量标记数据获取困难。为此,本研究旨在开发结合数据增强技术的1D-CNN模型,提升小样本条件下毒死蜱残留的定量分析精度。
针对样本量不足问题,采用两种数据增强策略:
- DCGAN(深度卷积生成对抗网络):生成器输入100维随机噪声,通过转置卷积层生成模拟光谱;判别器通过卷积层鉴别真伪光谱。训练中交替优化生成器(最小化判别器识别率)和判别器(最大化真实光谱分类准确率),最终生成45组增强光谱。
- SNR噪声添加:在原始光谱中加入信噪比(Signal-to-Noise Ratio, SNR)为55 dB、50 dB、45 dB、40 dB的高斯噪声,模拟实际测量中的信号干扰。
采用校准集均方根误差(RMSEC)、预测集均方根误差(RMSEP)、决定系数(R²)、相对百分比偏差(RPD)评估性能,其中RPD=SD/RMSEP(SD为预测集标准差)。
传统方法与1D-CNN对比:
数据增强效果:
训练动态分析:
本研究证实:
1. 方法学创新:数据增强技术(DCGAN与SNR噪声)有效解决了NIR深度学习中小样本问题,其中SNR噪声增强使模型预测精度接近实验室级(RPD>3)。
2. 应用价值:为食用油农药残留提供了一种低成本、高通量的现场检测方案,检测时间从传统方法的数小时缩短至分钟级。
3. 理论意义:揭示了数据多样性对深度学习模型泛化能力的关键作用,为光谱化学计量学中数据增强策略的选择提供了实证依据。
研究还指出,DCGAN生成数据需平衡质量与数量,而过高SNR噪声(如<40 dB)可能导致模型过拟合。未来可探索生成对抗网络与物理噪声模型的进一步结合。