分享自:

基于拉曼光谱的混合物成分识别新深度学习方法:ConInceDeep

期刊:chemometrics and intelligent laboratory systemsDOI:10.1016/j.chemolab.2023.104757

基于拉曼光谱的混合物成分识别新方法:ConInceDeep深度学习模型的开发与应用

作者及发表信息
本研究的通讯作者为江南大学物联网工程学院的Min Huang(邮箱:huangmzqb@163.com),合作作者包括Ziyan Zhao、Zhenfang Liu、Mingqiang Ji、Xin Zhao和Qibing Zhu。研究团队来自江南大学轻工先进过程控制教育部重点实验室。研究成果发表于2023年1月的期刊《Chemometrics and Intelligent Laboratory Systems》(卷234,文章编号104757)。

学术背景
拉曼光谱(Raman spectroscopy)因其“指纹特征”被广泛应用于混合物成分识别,但传统方法(如数据库匹配算法)依赖峰值检测和相似性计算,对重叠峰和弱峰的处理能力有限。深度学习因其端到端(end-to-end)和数据驱动的特性成为新兴解决方案,但现有的一维卷积神经网络(1D-CNN)模型难以充分挖掘复杂混合物中的隐藏特征。为此,本研究提出结合连续小波变换(Continuous Wavelet Transform, CWT)和Inception模块的深度学习新方法ConInceDeep,旨在提升对弱峰和重叠峰的识别能力。

研究流程与方法
1. 数据准备与增强
- 研究对象:收集100种纯物质、191种液体混合物、33种粉末混合物及2类真实样本(漱口水和泡打粉)的拉曼光谱,光谱范围200–1800 cm⁻¹。
- 数据增强:通过线性叠加纯物质光谱生成20,000个虚拟混合物样本(含正负样本),用于模型训练和验证,解决了实际样本获取成本高的问题。

  1. ConInceDeep模型设计

    • 连续小波变换(CWT):采用Lorentz4小波基函数将一维光谱转换为二维系数矩阵(尺度范围5–54),以多尺度分析揭示弱峰和重叠峰特征。Lorentz4因其线宽更接近拉曼峰的本征轮廓而被优选(图3)。
    • Inception模块:通过并行多尺寸卷积核(如1×3、1×5等)增强模型对不同峰宽的适应性,并引入1×1卷积核减少参数量(图4)。模型结构包括两个Inception模块、最大池化层和全连接层(图2)。
  2. 模型训练与验证

    • 训练参数:使用Adam优化器,学习率0.0001,批量大小64,Dropout率0.5,以交叉熵为损失函数。
    • 对比实验:设计四种CNN结构(1D-CNN、1D-all-Ince-CNN、2D-wav-CNN和ConInceDeep),通过消融实验验证CWT和Inception模块的贡献。
  3. 性能评估

    • 评价指标:准确率(Acc)、精确率(Pre)、召回率(Rec)、F1分数和假阳性率(FPR)。
    • 测试集:液体混合物(六种物质组合)、粉末混合物(四种氨基酸)及真实样本。

主要结果
1. 液体混合物识别
- ConInceDeep平均准确率达96.60%,较传统1D-CNN提升6.28%。其中,乙醇(ethanol)模型的识别准确率从69.11%提升至85.86%,显著改善低浓度成分的检测能力(图5)。
- Grad-CAM可视化显示,2D-CWT系数矩阵能更清晰地定位重叠峰(如720–820 cm⁻¹区域),而Inception模块扩大了感受野(图6)。

  1. 粉末混合物与真实样本

    • 粉末混合物中,谷氨酸、天冬氨酸和组氨酸模型的准确率均为100%,甘氨酸模型为96.97%。
    • 实际应用中,ConInceDeep成功区分含乙醇与无乙醇漱口水,并检测出泡打粉中的低含量碳酸氢钠。
  2. 方法对比与优化

    • 多尺寸卷积核实验表明,Inception模块对不同物质谱峰的适应性优于固定尺寸卷积核(图7)。
    • Lorentz4小波在平均F1分数上较Gaus4和Mexican Hat小波分别提高2.31%和2.32%(表7)。

结论与价值
ConInceDeep通过融合CWT的多尺度分析和Inception模块的多尺寸卷积核,显著提升了拉曼光谱在复杂混合物成分识别中的性能。其科学价值在于:
1. 方法创新:首次将Lorentz4小波与Inception结构结合,解决了弱峰和重叠峰的特征提取难题。
2. 应用潜力:适用于液体、粉末及实际工业样本,为食品安全、药品检测等领域提供高效工具。
3. 可扩展性:框架可适配其他光谱技术(如近红外光谱)。

研究亮点
1. 数据增强策略:通过虚拟混合物生成解决了训练样本不足的问题。
2. 跨学科技术融合:将信号处理(CWT)与深度学习(Inception)结合,优化特征提取流程。
3. 实际验证:在真实样本中验证了模型的实用性和鲁棒性。

其他价值
研究开源了代码(GitHub链接),并讨论了模型重复性、稳定性及在其他光谱技术中的应用前景,为后续研究提供了重要参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com