基于拉曼光谱的混合物成分识别新方法:ConInceDeep深度学习模型的开发与应用
作者及发表信息
本研究的通讯作者为江南大学物联网工程学院的Min Huang(邮箱:huangmzqb@163.com),合作作者包括Ziyan Zhao、Zhenfang Liu、Mingqiang Ji、Xin Zhao和Qibing Zhu。研究团队来自江南大学轻工先进过程控制教育部重点实验室。研究成果发表于2023年1月的期刊《Chemometrics and Intelligent Laboratory Systems》(卷234,文章编号104757)。
学术背景
拉曼光谱(Raman spectroscopy)因其“指纹特征”被广泛应用于混合物成分识别,但传统方法(如数据库匹配算法)依赖峰值检测和相似性计算,对重叠峰和弱峰的处理能力有限。深度学习因其端到端(end-to-end)和数据驱动的特性成为新兴解决方案,但现有的一维卷积神经网络(1D-CNN)模型难以充分挖掘复杂混合物中的隐藏特征。为此,本研究提出结合连续小波变换(Continuous Wavelet Transform, CWT)和Inception模块的深度学习新方法ConInceDeep,旨在提升对弱峰和重叠峰的识别能力。
研究流程与方法
1. 数据准备与增强
- 研究对象:收集100种纯物质、191种液体混合物、33种粉末混合物及2类真实样本(漱口水和泡打粉)的拉曼光谱,光谱范围200–1800 cm⁻¹。
- 数据增强:通过线性叠加纯物质光谱生成20,000个虚拟混合物样本(含正负样本),用于模型训练和验证,解决了实际样本获取成本高的问题。
ConInceDeep模型设计
模型训练与验证
性能评估
主要结果
1. 液体混合物识别
- ConInceDeep平均准确率达96.60%,较传统1D-CNN提升6.28%。其中,乙醇(ethanol)模型的识别准确率从69.11%提升至85.86%,显著改善低浓度成分的检测能力(图5)。
- Grad-CAM可视化显示,2D-CWT系数矩阵能更清晰地定位重叠峰(如720–820 cm⁻¹区域),而Inception模块扩大了感受野(图6)。
粉末混合物与真实样本
方法对比与优化
结论与价值
ConInceDeep通过融合CWT的多尺度分析和Inception模块的多尺寸卷积核,显著提升了拉曼光谱在复杂混合物成分识别中的性能。其科学价值在于:
1. 方法创新:首次将Lorentz4小波与Inception结构结合,解决了弱峰和重叠峰的特征提取难题。
2. 应用潜力:适用于液体、粉末及实际工业样本,为食品安全、药品检测等领域提供高效工具。
3. 可扩展性:框架可适配其他光谱技术(如近红外光谱)。
研究亮点
1. 数据增强策略:通过虚拟混合物生成解决了训练样本不足的问题。
2. 跨学科技术融合:将信号处理(CWT)与深度学习(Inception)结合,优化特征提取流程。
3. 实际验证:在真实样本中验证了模型的实用性和鲁棒性。
其他价值
研究开源了代码(GitHub链接),并讨论了模型重复性、稳定性及在其他光谱技术中的应用前景,为后续研究提供了重要参考。