分享自:

CSWin-PNet:一种用于超声图像中乳腺病变分割的CNN-Swin Transformer金字塔网络

期刊:expert systems with applicationsDOI:10.1016/j.eswa.2022.119024

本文档属于类型a(单篇原创研究报告),以下是针对该研究的学术报告:


CSWin-PNet:一种结合CNN与Swin Transformer的金字塔网络用于超声图像乳腺病灶分割

一、作者与发表信息

本研究由Haonan YangDapeng Yang*(通讯作者)合作完成,两人均来自哈尔滨工业大学机器人技术与系统国家重点实验室及人工智能实验室。研究成果发表于期刊Expert Systems with Applications(2023年,卷213,文章编号119024),在线发布于2022年10月17日。

二、学术背景

研究领域:本研究属于医学图像分割领域,聚焦于乳腺癌超声(Breast Ultrasound, BUS)图像的自动病灶分割。
研究动机:乳腺癌是全球女性健康的主要威胁之一,早期诊断对提高生存率至关重要。超声成像因其无创、低成本等优势成为临床常用手段,但其图像存在低对比度、高噪声和边界模糊等问题,导致人工判读存在主观差异。现有的基于卷积神经网络(CNN)的分割方法在长程依赖性和全局上下文信息建模方面存在局限性。
研究目标:提出一种结合CNN局部特征提取能力与Swin Transformer全局建模能力的混合网络(CSWin-PNet),通过多尺度特征融合和边界优化,提升乳腺病灶分割精度。

三、研究流程与方法

1. 网络架构设计

CSWin-PNet的核心架构分为编码器(Encoder)和解码器(Decoder)两部分:
- 编码器
- CNN分支:采用残差模块(含GELU激活函数)提取浅层结构特征,通过步长卷积替代池化以减少信息丢失,生成多尺度特征图(分辨率分别为输入图像的1/1、1/2、1/4)。
- Swin Transformer分支:设计残差Swin Transformer块(Residual Swin Transformer Block, RSTB),利用其窗口自注意力(W-MSA)和移位窗口自注意力(SW-MSA)机制捕获全局上下文信息。
- 解码器:通过残差模块(含ReLU激活函数)逐步上采样,结合以下创新模块优化特征融合:
- 交互式通道注意力模块(ICA):利用解码器特征监督编码器通道权重,突出病灶相关区域。
- 补充特征融合模块(SFF):基于门控机制,通过反向注意力补充弱响应区域的特征。
- 边界检测模块(BD):通过最大池化与差值运算生成病灶边界图,增强边界分割质量。

2. 实验设计
  • 数据集
    • Dataset 1:163张超声图像(110良性/53恶性),来自西班牙Sabadell的UDIAT诊断中心。
    • Dataset 2:780张超声图像(437良性/210恶性),来自埃及开罗的Baheya医院,剔除133张正常图像。
  • 训练与评估
    • 采用5折交叉验证,80%数据训练(其中20%用于验证),20%测试。
    • 优化器为Adam,学习率0.0001,批量大小4,训练200轮次,数据增强包括随机旋转和水平翻转。
3. 损失函数

混合损失函数包含三部分:
- RSTB损失(L_S):Dice损失与二元交叉熵(BCE)损失的加权和。
- 边界损失(L_B):形状预测损失(L_shape)与边界MSE损失(L_boundary)的加权组合。
- 最终分割损失(L_O):Dice与BCE损失。

四、主要结果

1. 消融实验
  • 模块贡献:在Dataset 1上,ICA、SFF和BD模块依次提升IoU(交并比)1.47%、1.39%和0.36%,最终模型IoU达78.61%,Dice系数87.25%。
  • RSTB有效性:引入残差结构的RSTB比非残差版本IoU提高1.71%。
2. 对比实验
  • SOTA方法对比:CSWin-PNet在Dataset 1上的IoU(78.61%)和Dice(87.25%)显著优于Swin-Unet(74.63%/83.21%)和TransUNet(73.13%/82.00%)。
  • 边界质量:HD95(Hausdorff距离)和ASD(平均表面距离)分别为9.42和2.94,优于其他方法。
3. 失败案例分析

部分低对比度或异质性病灶区域存在漏分割现象,提示未来需优化全局感知能力。

五、结论与价值

科学价值
1. 提出首个结合CNN与Swin Transformer的乳腺超声分割网络,通过多尺度特征互补和边界优化,解决了传统方法在全局建模与局部细节保留上的矛盾。
2. ICA和SFF模块的创新设计为医学图像分割中的特征融合提供了新思路。

应用价值
CSWin-PNet可作为计算机辅助诊断(CAD)系统的核心组件,辅助医生提升乳腺癌早期筛查的准确性与效率。

六、研究亮点

  1. 混合架构创新:CNN与Swin Transformer的协同设计兼顾局部特征与全局依赖。
  2. 多任务优化:通过边界检测与特征补充模块,显著提升病灶边界分割精度。
  3. 轻量化设计:RSTB的残差连接与特征求和策略降低了计算复杂度。

七、其他

研究受中国国家自然科学基金(#52075114)和哈尔滨工业大学跨学科研究基金(IR2021218)资助。未来计划探索更高效的Transformer变体以进一步优化性能。


(报告总字数:约1500字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com