分享自:

基于端到端深度学习的拉曼光谱分类方法

期刊:Journal of ChemometricsDOI:10.1002/cem.3464

基于深度学习的拉曼光谱分类方法研究:DRS-VGG模型的端到端解决方案

作者与发表信息

本研究由浙江工业大学化学工程学院的Mengfei Zhou、Yinchao Hu、Ruizhen Wang、Tian Guo、Qiqing Yu、Luyue Xia和Xiaofang Sun合作完成,发表于*Journal of Chemometrics*(2023年2月,DOI: 10.1002/cem.3464)。研究得到浙江省公益技术应用研究项目(LGF20E090005)和国家自然科学基金(21676251)的资助。

研究背景与目标

拉曼光谱(Raman spectroscopy)作为一种快速、无损、无需样品前处理的分析技术,广泛应用于石化、材料、食品、生物医学等领域。然而,拉曼信号易受荧光干扰、环境噪声和基线漂移影响,传统分析方法依赖复杂的预处理(如平滑、基线校正)和特征工程,可能丢失有效信息。近年来,机器学习(ML)和深度学习(DL)在光谱识别中的应用逐渐兴起,但现有方法存在以下问题:
1. 过度依赖特征工程:传统方法需人工提取特征峰;
2. 噪声敏感:高噪声或未标准化数据导致模型性能下降;
3. 模型效率与精度难以平衡:复杂模型训练速度慢。

为此,本研究提出了一种端到端的深度学习模型——深度残差收缩VGG(Deep Residual Shrinkage-VGG, DRS-VGG),旨在通过自适应噪声抑制和特征提取,实现高精度、高效率的拉曼光谱分类。


研究方法与流程

1. 数据集与预处理

研究选用三个公开数据集:
- 矿物(P)数据集:来自RRUFF数据库的excellent_oriented/unoriented子集,包含266类4896条光谱,已进行去噪和基线校正;
- 矿物(R)数据集:来自RRUFF的unrated_oriented/unoriented子集,包含343类5618条原始光谱,未经过任何预处理;
- 细菌数据集:30种病原体的6万条光谱,信号弱、噪声高。

预处理步骤
- 分段线性插值:将光谱统一采样至50–1650 cm⁻¹范围(1601个数据点),超出范围补零;
- 归一化:仅对矿物(P)数据集进行最小-最大值归一化(Min-Max Normalization),细菌数据集因原始强度差异大需额外处理。

2. DRS-VGG模型设计

模型基于VGG19架构,创新性引入深度残差收缩块(DRS Block),核心设计如下:
- 残差连接(Identity Shortcut):解决深层网络梯度消失问题,提升训练效率;
- 软阈值化(Soft Thresholding):通过注意力机制自动学习通道阈值,抑制无关特征:
math \hat{z}_{ij} = \text{sign}(z_{ij}) \cdot \max(0, |z_{ij}| - \tau_i), \quad \tau_i = \lambda_i w_i
其中,阈值τ由全局平均池化(GAP)和全连接层动态生成。
- 网络结构:包含4个卷积块(步长3,通道数64/128)、2个DRS块和3个全连接层,采用ReLU激活函数和Dropout(比率0.5)防止过拟合。

3. 权重剪枝(Weight Pruning)

为压缩模型规模,采用多项式衰减稀疏策略
- 逐步将接近0的权重置零,稀疏度从0增至目标值(如60%);
- 微调偏置项以恢复精度,实验表明60%稀疏度下模型大小减少52.64%,分类准确率反升0.46%。

4. 模型训练与评估

  • 优化器:Adam(学习率0.0001,β₁=0.9,β₂=0.999);
  • 损失函数:分类交叉熵(Categorical Cross-Entropy);
  • 评估指标:Top-k准确率、精确度(Precision)、F1分数,对比传统ML(SVM、KNN等)和其他DL模型(如DeepSpectra、ResidualSpectra)。

主要结果

1. 分类性能

DRS-VGG在三个数据集上的表现显著优于传统方法:
- 矿物(P)数据集:Top-1准确率97.84%,较次优模型(PCA-SVM)提升1.38%;
- 矿物(R)数据集:Top-1准确率92.81%,较传统ML最高提升21.19%(KNN仅71.62%);
- 细菌数据集:Top-1准确率95.08%,F1分数0.9507。

2. 计算效率

  • 训练速度:单次迭代时间2250 ms(矿物数据集),显著低于复杂DL模型(如Sang等提出的VGG变体需4200 ms);
  • 参数量:878万,仅为同类模型的1/3–1/2。

3. 可解释性分析

通过梯度加权类激活映射(Grad-CAM)可视化模型关注的光谱区域。例如:
- 石膏(Gypsum):模型准确识别415 cm⁻¹([SO₄]²⁻弯曲振动)、1010 cm⁻¹(对称伸缩振动)等特征峰;
- 大肠杆菌(Escherichia coli):在极低信噪比下仍能区分细微差异。

4. 权重剪枝效果

  • 60%稀疏度下,模型大小压缩至16.25 MB(原30.88 MB),准确率提升至93.26%;
  • 过高稀疏度(如92.5%)会导致关键权重丢失,准确率降至75.65%。

研究价值与创新点

科学价值

  1. 端到端解决方案:首次将残差收缩机制引入光谱分析,减少对预处理和特征工程的依赖;
  2. 噪声鲁棒性:软阈值化模块自动过滤荧光和基线漂移干扰,适用于原始光谱;
  3. 模型压缩技术:权重剪枝为边缘设备部署提供可能。

应用前景

  • 快速检测:适用于医疗诊断(如病原体识别)、食品安全(如添加剂分析)等领域;
  • 工业在线监测:模型的高效性满足实时分析需求。

研究亮点

  1. 创新模型架构:DRS块结合VGG的深度特征提取能力与残差收缩的噪声抑制能力;
  2. 多场景验证:在预处理/未处理数据、矿物/生物样本中均表现优异;
  3. 开源共享:代码与数据集公开于GitHub(https://github.com/huyc1998/drs-vgg)。

总结

本研究提出的DRS-VGG模型为拉曼光谱分析提供了高效、自动化的新范式,其端到端设计、自适应噪声抑制和模型压缩技术具有广泛的学术与工业应用潜力。未来工作可探索结构化剪枝(Structured Pruning)与量化技术的结合,进一步优化计算效率。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com