分享自:

基于CNN-CBR系统的乳腺X线摄影分类新型乳腺癌检测架构

期刊:computers in biology and medicineDOI:10.1016/j.compbiomed.2023.107133

这篇文档属于类型a,是一篇关于乳腺癌检测新架构的原创研究论文。以下为详细的学术报告:


作者及机构
本研究由Lydia Bouzar-Benlabiod(阿尔及利亚国家高等信息学院LCSI实验室)、Khaled Harrar(布迈尔德斯大学LIST实验室)等团队合作完成,发表于《Computers in Biology and Medicine》期刊2023年第163卷。


学术背景

研究领域与动机
乳腺癌是女性最常见的恶性肿瘤之一,早期诊断对提高生存率至关重要。目前,乳腺X线摄影(mammogram)是主要的筛查手段,但人工阅片存在主观性强、耗时且易漏诊的问题。尽管深度学习(DL)在医学影像分析中表现出色,但其”黑箱”特性降低了临床可信度。因此,本研究提出结合卷积神经网络(CNN)与案例推理系统(CBR)的混合架构,旨在实现高精度且可解释的乳腺癌分类。

背景知识
- 案例推理(Case-Based Reasoning, CBR):通过比对历史案例解决新问题,决策过程透明,适用于需解释性的医疗场景。
- 深度学习局限性:需大量标注数据、训练成本高,且结果难以解释。
- 数据集:采用CBIS-DDSM(Curated Breast Imaging Subset of DDSM),包含2620张乳腺X线图像及病灶标注,是当前最完整的公开数据集之一。

研究目标
1. 开发端到端的计算机辅助诊断(CAD)系统,整合图像增强、病灶分割、特征提取与分类。
2. 通过CBR提升分类结果的可解释性,同时利用CNN提高分割精度。
3. 在CBIS-DDSM数据集上验证性能,超越传统机器学习(ML)和DL方法。


研究流程与方法

1. 数据预处理

  • 图像增强
    • CLAHE(对比度受限自适应直方图均衡化):分块优化对比度,参数为块大小8、对比度阈值40。
    • 中值滤波:窗口大小7,去除噪声。
  • 数据清洗
    • 使用预训练的U-Net(编码器为ResNeXt101_32x16d)筛选60%质量合格的图像-掩模对。
    • 数据扩增:水平/垂直翻转,增加样本多样性。

2. 病灶分割

  • 模型架构:SE-ResNet101作为U-Net编码器,引入SE(Squeeze-and-Excitation)模块动态调整通道权重。
  • 训练细节
    • 数据集划分:65%训练、15%验证、20%测试。
    • 优化器:Adam,学习率0.001,60个epoch。
  • 性能指标:Dice系数0.75(Dice-loss 0.25),IoU 0.64,召回率0.76。

3. 特征提取与选择

  • 特征来源
    • 图像特征:灰度共生矩阵(GLCM)提取纹理特征(如对比度、能量、同质性)。
    • 元数据:BI-RADS分级、病灶轮廓/形状描述、乳腺密度等。
  • 特征选择:基于KNN(k=7)的封装法(wrapper method),最终保留6个关键特征:病灶轮廓、形状、异常严重度、ASM(角二阶矩)、能量、相异性。

4. CBR分类系统

  • 案例表示:每个案例包含6个特征值及分类标签(良性/恶性)。
  • 相似度度量:混合数值与分类特征,加权公式为:
    [ Sim(case1, case2) = \frac{\sum (1 - diff{attribute} \times Weight{attribute})}{\sum Weights} ]
    权重通过互信息量计算,如异常严重度权重5.75。
  • 维护机制:每插入10个新案例后,根据使用频率和分类准确率淘汰冗余案例。

主要结果

  1. 分割性能:SE-ResNet101优于普通U-Net,Dice系数提升20%,验证了数据清洗和SE模块的有效性。
  2. 分类性能
    • 准确率86.71%,召回率91.34%,显著高于对比的ML方法(如KNN 84.25%、SVM 83.23%)。
    • 可解释性:CBR可追溯相似历史案例,例如某分类结果基于“病灶轮廓=毛刺状、ASM=高值”的既往案例。
  3. 对比实验:在CBIS-DDSM上,本方法超越Sun等(2019,82.02%)、Agarwal等(2019,83.69%)的纯DL模型。

结论与价值

科学价值
- 提出首个结合CNN分割与CBR分类的乳腺癌CAD框架,解决了DL模型不可解释的痛点。
- 证明了SE模块和特征选择对提升小样本数据性能的关键作用。

应用价值
- 临床部署潜力:高召回率可降低漏诊风险,透明决策流程增强医生信任。
- 开源代码(GitHub)促进社区改进。

未来方向:探索EfficientNet分割、案例库动态分区优化。


研究亮点

  1. 方法论创新:CNN-CBR混合架构兼顾精度与可解释性。
  2. 技术改进
    • SE-ResNet101分割模型在DDSM上达到SOTA性能。
    • 新型相似度度量公式支持异构特征融合。
  3. 临床意义:为AI辅助诊断的可信度问题提供解决方案。

此研究为乳腺癌AI诊断领域提供了重要的技术突破和临床实践参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com