分享自:

一种基于Stockwell变换和混合CNN-Transformer模型的心律失常检测新方法

期刊:Scientific ReportsDOI:10.1038/s41598-025-92582-9

这篇文档属于类型a(单篇原创研究报告),以下是详细的学术报告内容:


作者及机构

本研究由韩国多所高校及企业研究人员合作完成:
- 第一作者 Donghyeon Kim(隶属光云大学国防采购项目系)
- 通讯作者 Dae-Yeol Kim(庆南大学人工智能系)与 Chae-Bong Sohn(光云大学)
- 其他合作者来自HolmesAI公司(大邱总部及首尔AI研究中心)
- 发表于Scientific Reports期刊(2025年,卷15,文章编号7817)


学术背景

研究领域:生物医学信号处理与人工智能交叉领域,聚焦于心电图(ECG, Electrocardiogram)信号的心律失常(arrhythmia)自动分类。

研究动机
1. 临床需求:心律失常的早期诊断依赖医师经验,但ECG信号复杂且存在个体差异,人工分析耗时且主观性强。
2. 技术瓶颈:传统基于卷积神经网络(CNN, Convolutional Neural Network)的方法依赖R波峰值检测(R-peak identification),而某些心律失常(如室性融合搏动)的R波难以识别,导致分类性能受限。
3. 理论突破点:结合时频分析(Stockwell变换)与混合深度学习架构(CNN-Transformer),以同时捕捉ECG信号的局部特征和长期依赖关系。

研究目标
- 开发一种无需R波检测的高精度心律失常分类模型;
- 验证Stockwell变换在ECG特征提取中的优势;
- 在MIT-BIH和Icentia11k数据集上实现超越现有方法的分类性能。


研究流程与方法

1. 数据准备与预处理

  • 数据集
    • MIT-BIH心律失常数据库:48例患者,30分钟双导联记录(采样率360 Hz),包含5类心律失常(N/S/V/Q/F)。
    • Icentia11k数据库:11,000例患者动态心电图,含4类心律失常(N/S/V/Q)。
  • 预处理流程
    • 分段:原始信号划分为50秒窗口,进一步细分为10秒片段以降低计算复杂度。
    • 降噪:30 Hz低通滤波消除肌电噪声和工频干扰。
    • 降采样:采样率从360 Hz降至100 Hz以平衡计算效率与信息保留。
    • 基线校正:采用Tarvainen提出的去趋势法消除基线漂移。
    • 标准化:最小-最大归一化(0-1范围)和基于四分位距(IQR)的异常值剔除。
    • 时频变换:Stockwell变换(S-Transform)将信号转换为时频域,频率范围限定为0-15 Hz以抑制高频噪声。

2. 模型架构设计

混合CNN-Transformer模型(Hybrid ResNextNet-Transformer):
- 特征提取层
- 基于ResNextNet的CNN模块,通过分组卷积(grouped convolution)和SE(Squeeze-and-Excitation)注意力机制增强局部特征提取能力。
- 输出特征图经1×1卷积压缩后,转换为序列输入Transformer编码器。
- 序列建模层
- 4层Transformer编码器(8头注意力机制,前馈网络维度2048),辅以残差连接和LayerNorm稳定训练。
- 均值池化(Mean Pooling)聚合时序特征,最终通过全连接层分类。
- 创新点
- 无需R波检测:直接利用时频域特征,避免传统方法对R波的依赖。
- 混合架构:CNN捕捉局部形态特征(如QRS波群),Transformer建模长程时序依赖(如心率变异性)。

3. 实验与优化

  • 训练配置
    • 优化器:RAdam(学习率3e-4),混合精度训练加速GPU计算。
    • 损失函数:Focal Loss解决类别不平衡问题。
    • 数据增强:SMOTE(Synthetic Minority Over-sampling Technique)生成少数类样本。
  • 消融实验
    • 验证预处理步骤(去趋势、低通滤波)对时频特征质量的影响(图4)。
    • 对比不同架构(纯CNN、纯Transformer)的性能差异(表3)。

主要结果

  1. 分类性能

    • MIT-BIH数据集:准确率99.58%(5类),F1-score达0.997(S类)、1.0(F类)。
    • Icentia11k数据集:准确率97.8%(4类),N类灵敏度达99.13%。
    • 对比实验:混合模型显著优于纯CNN(MIT-BIH 99.41%)和纯Transformer(80.81%)。
  2. 时频分析优势

    • Stockwell变换的时频分辨率(图2)有效区分正常节律(N类)与室性早搏(V类)的频谱特征(图5)。
    • 去趋势步骤对基线漂移的校正效果显著(图4a),而低通滤波主要改善相位稳定性(图4b)。
  3. 模型可解释性

    • 类激活图(CAM, Class Activation Map)显示模型聚焦于频域2-10 Hz区域识别V类心律失常(图6a)。
    • t-SNE可视化证实特征空间对各类心律失常的清晰分离(图6b)。

结论与价值

科学价值
- 提出首个结合Stockwell变换与CNN-Transformer的混合模型,为ECG信号分析提供新范式。
- 证实时频域特征可替代R波检测,解决传统方法在复杂心律失常中的局限性。

应用价值
- 适用于实时心电监测系统,尤其对室性早搏(V类)等危重心律失常的敏感度达99.4%。
- 模型开源(GitHub),促进临床部署与后续研究。


研究亮点

  1. 方法创新
    • 首次将Stockwell变换引入深度学习框架,实现ECG信号的端到端时频特征学习。
    • 混合架构兼顾CNN的局部感知与Transformer的全局建模能力。
  2. 性能突破
    • 在MIT-BIH数据集上超越Fei-Yan等现有最佳模型(99.58% vs 99.6%),且覆盖全部5类心律失常(表4)。
  3. 临床意义
    • 无需R波检测的特性扩展了模型在噪声环境或特殊心律失常(如融合搏动)中的适用性。

其他有价值内容

  • 局限性:计算复杂度较高,未来需优化实时性;未涵盖房颤(atrial fibrillation)等复杂心律失常。
  • 展望:计划扩展至多导联ECG和更广泛的病理类型验证。

(全文约2000字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com