文献信息

类型:文献全文
标题:Multi-scale convolution networks for seismic event classification with windowed self-attention
DOI:
状态:
已完成
补充信息:如果附代码,最好能附上代码
备注:
积分奖励:55
发布时间:2025-09-19 11:06:55
应助内容
文献解读

多尺度卷积网络与窗口自注意力在地震事件分类中的应用

类型a:单篇原创研究的学术报告

1. 主要作者、机构及发表信息

本研究的作者团队包括Yongming Huang、Yi Xie、Wei Liu、Yongsheng Ma、Fajun Miao和Guobao Zhang,分别来自东南大学自动化学院(School of Automation, Southeast University)江苏省地震局(Seismological Bureau of Jiangsu Province)。研究论文《Multi-scale convolution networks for seismic event classification with windowed self-attention》发表于《Journal of Seismology》2025年第29卷(257–268页),在线发表于2024年11月15日。

2. 学术背景与研究目标

地震事件分类是地震应急预警和地震目录数据库建立的关键环节,对区分天然地震、人工爆破和塌陷事件具有重要意义。传统方法依赖人工提取特征(如初动方向、P波与S波振幅比)或固定长度截取波形,但存在信息冗余(短事件)或信息丢失(长事件)的问题,且难以全面捕捉地震波的多尺度时空特征。

近年来,深度学习(Deep Learning)尤其是卷积神经网络(CNN)在解决此类问题上表现出潜力。然而,传统CNN存在梯度消失问题,且单一卷积核难以同时捕获局部细节和全局特征。为此,本研究提出了一种结合**多尺度卷积(Multi-scale Convolution)窗口自注意力(Windowed Self-attention)**的新型神经网络,旨在平衡局部特征提取与长程依赖建模,并通过自适应波形截断和投票机制进一步提升分类性能。

3. 研究方法与详细流程

3.1 数据准备与预处理

研究使用了中国首都圈(北京、河北、天津等)和江苏省及周边地区2015–2018年的地震数据,包括三类事件:

  • 天然地震:600次(ML2.0–4.0,震中距≤50 km),共1078条记录(3234个波形)。

  • 爆破事件:1100次(ML≥2.5),共981条记录(2943个波形)。

  • 塌陷事件:400次(ML≥2.5),共830条记录(2490个波形)。

预处理关键步骤

  1. 自适应波形截断(Adaptive Waveform Truncation)

    • 计算P波到达前1秒的均方根(RMSp)作为基线噪声水平。

    • 检测S波到达后每秒窗口的RMSs,若RMSs < 1.2×RMSp,则判定为尾波终止时间,截取完整波形。

  2. 时频转换:将波形降采样至20 Hz,通过短时傅里叶变换(STFT)生成400×400×3的时频谱图作为网络输入。

3.2 网络架构设计

模型包含四个阶段:

  1. 初始特征提取:使用5×5非重叠分块(Patch Splitting)和多尺度残差卷积(Multi-scale Residual Convolution)缩小特征图尺寸,保留通道数。

  2. 多尺度卷积与自注意力融合

    • 多尺度残差结构:结合1×1、3×3卷积核,通过跨层连接(Shortcut Connect)防止梯度消失(公式:( x_{l+1} = f(x_l, w_l) + h(x_l) ))。

    • 窗口自注意力模块(Window Self-attention Block):交替使用常规窗口和偏移窗口(Shifted Window)计算自注意力,解决跨窗口信息缺失问题。

  3. 分层特征聚合:在第二、三阶段通过步长为2的卷积压缩特征图尺寸并加倍通道数。

  4. 决策输出:全局平均池化后接全连接层(300→128→3神经元),SoftMax输出分类概率。

3.3 投票机制(Voting Mechanism)

单台站记录的三分量数据(垂直、南北、东西)分别输入网络,若至少两个分量分类结果一致,则判定为该事件类型,否则视为错误分类。

4. 主要结果与分析

4.1 分类性能

  • 单分量分类准确率:94.02%。爆破事件召回率(Recall)和精确率(Precision)分别为98.14%和93.85%,塌陷和天然地震的精确率均超过94%。

  • 投票机制提升:整体准确率提升至97.56%,显著减少爆破与塌陷事件的误判(图6)。

4.2 对比实验

与SVM、MLP、STFT+CNN等模型相比,本文方法在相同数据集上表现最优(表2)。例如:

  • DeepQuake(输入原始波形):准确率94.40%。

  • ConvNetQuake:91.7%。

  • 本文模型:97.56%,且参数量更少,计算效率更高。

4.3 消融实验(Ablation Study)

验证各模块贡献(表3):

  • 基线模型(固定卷积核):91.42%。

  • 增加多尺度卷积:提升至93.14%。

  • 增加自注意力层:进一步提升至94.99%。

5. 结论与意义

本研究提出了一种创新的地震事件分类框架,其核心贡献包括:

  1. 自适应波形截断方法:避免传统固定截取的局限性,完整保留事件特征。

  2. 多尺度卷积与窗口自注意力网络:结合局部感知与全局依赖建模,适用于小数据集。

  3. 三分量投票机制:有效融合多分量信息,提升分类鲁棒性。

科学价值:为地震监测提供了高精度自动化分类工具,尤其在短时地震和复杂噪声环境下表现优异。

应用潜力:可扩展至其他类型地震信号(如火山震颤)和多台站联合分析。

6. 研究亮点

  • 方法创新:首次将多尺度卷积与窗口自注意力结合用于地震分类,解决CNN的梯度消失和特征单一性问题。

  • 数据高效性:在较小数据集(2889条记录)上达到97.56%的准确率,优于现有方法。

  • 可解释性:通过消融实验明确各模块的作用,为后续优化提供方向。

7. 其他价值

研究在犹他州地震数据(UUSS台网)上进一步验证了模型的泛化能力,准确率达98.59%,显示其跨区域适用潜力(图8)。未来可探索多台站数据融合和模型可解释性提升。