基于选择性核U-Net卷积神经网络的乳腺肿块超声图像分割研究
作者及发表信息
本研究由Michał Byra(波兰科学院基础技术研究所超声部门)、Piotr Jarosik(波兰科学院基础技术研究所信息与计算科学部门)、Aleksandra Szubert(波兰华沙玛丽亚·斯克沃多夫斯卡-居里纪念癌症中心与肿瘤研究所)等团队合作完成,发表于Biomedical Signal Processing and Control期刊2020年第61卷。
研究背景与目标
科学领域:本研究属于医学图像分析与人工智能交叉领域,聚焦于乳腺超声(Ultrasound, US)图像分割,旨在通过深度学习技术提升乳腺肿块的自动分割精度。
研究动机:
1. 临床需求:乳腺癌是女性最常见的恶性肿瘤,超声成像因其无创、低成本和高可及性成为重要诊断工具。然而,超声图像存在低对比度、斑点噪声和肿块形态多样性等问题,导致传统分割方法效果受限。
2. 技术挑战:现有深度学习模型(如U-Net)的固定感受野难以适应不同尺寸的乳腺肿块,需开发能动态调整感受野的算法。
研究目标:提出一种基于选择性核(Selective Kernel, SK)模块的U-Net改进模型(SK-U-Net),通过注意力机制融合不同感受野的特征图,提升分割鲁棒性。
研究方法与流程
1. 数据准备与预处理
- 数据集:
- 训练集:882张乳腺超声图像(678良性/204恶性),来自美国加州大学圣地亚哥分校,使用Siemens Acuson、GE L9和ATL HDI三种设备采集。
- 测试集:
- 内部测试集:150张图像(632/100/150划分)。
- 外部验证集:三个公开数据集(UDIAT、OASBUD、BUSI),共893张图像,来自西班牙、波兰和埃及的不同医疗中心。
- 预处理:去除设备标注、图像统一缩放至224×224像素、3×3中值滤波去噪,手动标注的感兴趣区域(ROI)通过最近邻插值调整尺寸。
2. 模型设计:SK-U-Net
- 核心改进:将U-Net的标准卷积块替换为SK模块,其结构包括:
- 双分支卷积:
- 分支1:空洞卷积(dilation=2,3×3核)以扩大感受野。
- 分支2:常规3×3卷积保留局部细节。
- 注意力机制:通过全局平均池化生成特征向量,经全连接层压缩后计算注意力系数(0~1),动态加权融合两分支特征图。
- 训练策略:
- 损失函数:基于Dice系数的损失(( J(a,m) = 1 - \frac{2|a \cap m|}{|a| + |m|} ))。
- 优化器:Adam(学习率0.001,动量0.9),批量大小12,早停机制(验证集11轮无改进终止)。
- 数据增强:水平翻转、高斯模糊。
3. 实验与评估
- 对比模型:常规U-Net(基线)。
- 评价指标:
- Dice系数:衡量分割重叠度。
- 准确率、AUC:评估像素级分类性能。
- 检出率:肿块中心点位于手动ROI内视为正确检出。
- 外部验证:对UDIAT、OASBUD、BUSI数据集进行模型微调(50%数据微调10轮,学习率0.0005)。
主要研究结果
1. 内部测试集性能
- SK-U-Net显著优于U-Net:
- 平均Dice系数:0.826(SK-U-Net) vs. 0.778(U-Net)。
- 恶性肿块分割更优(Dice=0.842 vs. 良性0.820),但良性肿块中位数Dice更高(0.914 vs. 恶性0.898)。
- 检出率:90%(SK-U-Net) vs. 81.7%(U-Net)。
2. 外部验证结果
- 跨中心泛化能力:
- 未微调时,Dice系数:UDIAT(0.780)> OASBUD(0.676)> BUSI(0.646),差异可能与设备型号相关(UDIAT与训练集同用Siemens Acuson)。
- 微调提升性能:Dice平均提高6%,BUSI数据集从0.646升至0.709。
3. SK模块的机制分析
- 感受野动态调整:
- 扩张路径(解码器)中SK模块更依赖空洞卷积(平均注意力系数70%),尤其对大肿块(Spearman相关系数0.7)。
- 收缩路径(编码器)和中层模块均衡使用两种卷积(注意力≈50%)。
研究结论与价值
科学价值
- 方法创新:首次将SK模块引入U-Net,通过注意力机制自适应融合多尺度特征,解决了乳腺肿块尺寸变异大的分割难题。
- 临床意义:模型在跨中心数据中表现稳健,为计算机辅助诊断(CAD)系统提供了高精度分割工具,可辅助医生分析肿块形态特征。
应用价值
- 开源实现:代码与预训练权重公开于GitHub(github.com/mbyr/bus_seg),便于后续研究与临床部署。
- 可扩展性:SK模块可迁移至其他医学图像分割任务(如肿瘤、器官分割)。
研究亮点
- 动态感受野设计:SK-U-Net自动调整卷积核权重,优于固定感受野的传统模型。
- 跨中心验证:首次在UDIAT、OASBUD、BUSI三个独立数据集上系统评估性能。
- 机制可解释性:通过注意力系数与肿块尺寸的相关性分析,揭示了模型决策依据。
局限性及未来方向
- 数据多样性不足:训练集仅来自单一中心,未来需整合更多设备型号的数据。
- 后处理优化:未采用条件随机场(CRF)等后处理技术,可能进一步提升边界精度。
- 扩展研究:探索SK模块在其他网络(如残差U-Net、密集U-Net)中的适用性。