分享自:

基于多中心超声图像的乳腺肿瘤分类:一种混合学习方法

期刊:BMC Medical ImagingDOI:10.1186/s12880-024-01307-3

学术研究报告:基于多中心超声图像的乳腺肿瘤分类混合学习方法

一、研究团队与发表信息
本研究由Jintao Ru(绍兴市中医院医学工程系)、Zili Zhu(宁波大学第一附属医院放射科)和Jialin Shi(浙江省康复医疗中心康复医学研究所)合作完成,发表于*BMC Medical Imaging*期刊2024年第24卷第133期。论文标题为《Spatial and Geometric Learning for Classification of Breast Tumors from Multi-center Ultrasound Images: A Hybrid Learning Approach》。

二、学术背景与研究目标
乳腺癌是女性发病率最高的恶性肿瘤,早期诊断对提高患者生存率至关重要。超声检查因其无创、无辐射等优势成为筛查的主要工具,但图像易受噪声干扰且依赖医生经验。近年来,人工智能(尤其是深度学习)在医学影像分析中展现出潜力,但现有研究多聚焦于单一模态(如卷积神经网络CNN处理图像)或需依赖人工标注的病灶轮廓(如分割-分类联合模型)。

本研究旨在解决以下问题:
1. 多中心数据利用与隐私保护:不同医疗中心的超声数据存在设备、图像质量的差异,且直接共享数据可能违反隐私法规。
2. 特征提取的全面性:现有方法多依赖空间特征(如CNN),而忽略了几何特征(如图像中病灶的拓扑关系)。
3. 标注成本高:传统方法需医生手动标注病灶区域,耗时耗力。

研究目标为开发一种结合联邦学习(Federated Learning)空间学习(CNN)几何学习(图神经网络GNN)的混合模型,实现多中心数据的高效利用与隐私保护,同时提升分类性能。

三、研究流程与方法
1. 数据准备与预处理
- 数据集:使用三个公开的多中心乳腺超声数据集——BUSI(埃及,780例)、BUS(西班牙,163例)、OASBUD(波兰,200例),涵盖良恶性病例。
- 预处理
- 图像统一调整为32×32像素,通过水平/垂直翻转、仿射变换、高斯噪声注入进行数据增强,训练集扩增10倍。
- 无监督图构建:采用SLIC(Simple Linear Iterative Clustering)算法将图像分割为超像素,基于超像素质心坐标构建K近邻图(KNN Graph),节点特征为超像素均值与坐标,边特征为欧氏距离。

  1. 混合学习模型设计

    • 联邦学习框架
      • 各中心本地训练模型,仅上传权重至服务器聚合(FedCL算法),避免原始数据交换。损失函数结合交叉熵损失和特征对比损失(Hinge Embedding Loss),以保留多中心数据的共有特征(Inter-feature)。
    • 双分支架构
      • 空间学习分支:采用PreResNet-110(改进版ResNet)提取图像空间特征,通过残差连接缓解梯度消失。
      • 几何学习分支:采用图同构网络(GIN, Graph Isomorphism Network)处理超像素图,利用节点关系提取几何特征。
    • 特征融合与分类:将空间与几何特征拼接,通过多层感知机(MLP)输出良恶性分类结果。
  2. 实验与评估

    • 对比方法:包括纯CNN、纯GNN,以及四种前沿模型(如Hover-Trans、SBANet)。
    • 评估指标:平衡准确率(Balanced Accuracy)、AUC-ROC、AUC-PR、灵敏度(Sensitivity)、特异性(Specificity)等。

四、主要结果
1. 混合模型性能
- 在BUSI数据集上,AUC-ROC达0.911,平衡准确率87.6%,特异性92.0%,显著优于单一模态模型(CNN AUC-ROC 0.880,GNN 0.816)。
- 在BUS数据集上,AUC-ROC为0.871,验证了模型对多中心数据的泛化能力。
- 在低质量数据集OASBUD中,几何学习分支表现优于空间分支,表明几何特征对噪声图像的鲁棒性。

  1. 联邦学习的贡献

    • 通过对比有无联邦学习的实验,证实联邦学习能提升模型对多中心数据的适应性(如BUSI数据集的AUC-ROC从0.870提升至0.911)。
  2. 效率优势

    • 模型输入尺寸仅32×32,远低于对比方法(如SBANet需224×224),显存占用更低;推理速度达0.015秒/图像,满足实时需求。

五、结论与价值
1. 科学价值
- 首次将联邦学习、空间学习与几何学习结合,为多中心医学影像分析提供了隐私保护与特征融合的新范式。
- 无监督图构建方法降低了标注成本,为小样本医学数据的高效利用提供参考。

  1. 应用价值
    • 可作为临床辅助工具,帮助医生快速筛查乳腺肿瘤,尤其适用于资源有限的地区。
    • 模型轻量化设计便于部署至移动设备,推动AI在基层医疗的应用。

六、研究亮点
1. 方法创新
- 提出“联邦预训练+本地微调”策略,平衡多中心数据共享与隐私保护。
- 双分支架构同时捕捉病灶的局部纹理(空间)与全局结构(几何)特征。
2. 技术突破
- 无监督图生成算法避免人工标注,且超像素图可解释性强。
- 轻量化模型(32×32输入)在保持性能的同时降低计算成本。

七、其他价值
研究还探讨了图像质量对模型性能的影响(如OASBUD数据质量较差导致分类性能下降),为未来优化噪声鲁棒性提供了方向。数据集与代码已公开,促进学术共同体验证与拓展。

(注:专业术语如SLIC、KNN、GIN等首次出现时保留英文,联邦学习(Federated Learning)、图同构网络(Graph Isomorphism Network)等术语在括号内标注原文。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com