基于拉曼光谱的混合物成分识别新深度学习方法：ConInceDeep

分享自：

基于拉曼光谱的混合物成分识别新深度学习方法：ConInceDeep

分析化学

化学

人工智能

信息科学

计算机科学

期刊:chemometrics and intelligent laboratory systemsDOI:10.1016/j.chemolab.2023.104757

【点击此处】阅读全文、收藏及针对性提问

基于拉曼光谱的混合物成分识别新方法：ConInceDeep深度学习模型的开发与应用
作者及发表信息
 本研究的通讯作者为江南大学物联网工程学院的Min Huang（邮箱：huangmzqb@163.com），合作作者包括Ziyan Zhao、Zhenfang Liu、Mingqiang Ji、Xin Zhao和Qibing Zhu。研究团队来自江南大学轻工先进过程控制教育部重点实验室。研究成果发表于2023年1月的期刊《Chemometrics and Intelligent Laboratory Systems》（卷234，文章编号104757）。
学术背景
 拉曼光谱（Raman spectroscopy）因其“指纹特征”被广泛应用于混合物成分识别，但传统方法（如数据库匹配算法）依赖峰值检测和相似性计算，对重叠峰和弱峰的处理能力有限。深度学习因其端到端（end-to-end）和数据驱动的特性成为新兴解决方案，但现有的一维卷积神经网络（1D-CNN）模型难以充分挖掘复杂混合物中的隐藏特征。为此，本研究提出结合连续小波变换（Continuous Wavelet Transform, CWT）和Inception模块的深度学习新方法ConInceDeep，旨在提升对弱峰和重叠峰的识别能力。
研究流程与方法
 1. 数据准备与增强
 - 研究对象：收集100种纯物质、191种液体混合物、33种粉末混合物及2类真实样本（漱口水和泡打粉）的拉曼光谱，光谱范围200–1800 cm⁻¹。
 - 数据增强：通过线性叠加纯物质光谱生成20,000个虚拟混合物样本（含正负样本），用于模型训练和验证，解决了实际样本获取成本高的问题。
ConInceDeep模型设计
连续小波变换（CWT）：采用Lorentz4小波基函数将一维光谱转换为二维系数矩阵（尺度范围5–54），以多尺度分析揭示弱峰和重叠峰特征。Lorentz4因其线宽更接近拉曼峰的本征轮廓而被优选（图3）。
 
Inception模块：通过并行多尺寸卷积核（如1×3、1×5等）增强模型对不同峰宽的适应性，并引入1×1卷积核减少参数量（图4）。模型结构包括两个Inception模块、最大池化层和全连接层（图2）。
 
模型训练与验证
训练参数：使用Adam优化器，学习率0.0001，批量大小64，Dropout率0.5，以交叉熵为损失函数。
 
对比实验：设计四种CNN结构（1D-CNN、1D-all-Ince-CNN、2D-wav-CNN和ConInceDeep），通过消融实验验证CWT和Inception模块的贡献。
 
性能评估
评价指标：准确率（Acc）、精确率（Pre）、召回率（Rec）、F1分数和假阳性率（FPR）。
 
测试集：液体混合物（六种物质组合）、粉末混合物（四种氨基酸）及真实样本。
 
主要结果
 1. 液体混合物识别
 - ConInceDeep平均准确率达96.60%，较传统1D-CNN提升6.28%。其中，乙醇（ethanol）模型的识别准确率从69.11%提升至85.86%，显著改善低浓度成分的检测能力（图5）。
 - Grad-CAM可视化显示，2D-CWT系数矩阵能更清晰地定位重叠峰（如720–820 cm⁻¹区域），而Inception模块扩大了感受野（图6）。
粉末混合物与真实样本
粉末混合物中，谷氨酸、天冬氨酸和组氨酸模型的准确率均为100%，甘氨酸模型为96.97%。
 
实际应用中，ConInceDeep成功区分含乙醇与无乙醇漱口水，并检测出泡打粉中的低含量碳酸氢钠。
 
方法对比与优化
多尺寸卷积核实验表明，Inception模块对不同物质谱峰的适应性优于固定尺寸卷积核（图7）。
 
Lorentz4小波在平均F1分数上较Gaus4和Mexican Hat小波分别提高2.31%和2.32%（表7）。
 
结论与价值
 ConInceDeep通过融合CWT的多尺度分析和Inception模块的多尺寸卷积核，显著提升了拉曼光谱在复杂混合物成分识别中的性能。其科学价值在于：
 1. 方法创新：首次将Lorentz4小波与Inception结构结合，解决了弱峰和重叠峰的特征提取难题。
 2. 应用潜力：适用于液体、粉末及实际工业样本，为食品安全、药品检测等领域提供高效工具。
 3. 可扩展性：框架可适配其他光谱技术（如近红外光谱）。
研究亮点
 1. 数据增强策略：通过虚拟混合物生成解决了训练样本不足的问题。
 2. 跨学科技术融合：将信号处理（CWT）与深度学习（Inception）结合，优化特征提取流程。
 3. 实际验证：在真实样本中验证了模型的实用性和鲁棒性。
其他价值
 研究开源了代码（GitHub链接），并讨论了模型重复性、稳定性及在其他光谱技术中的应用前景，为后续研究提供了重要参考。

上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com

【点击此处】阅读全文、收藏及针对性提问