分享自:

基于联邦学习框架的乳腺癌组织病理学图像分类增强研究

期刊:IEEE AccessDOI:10.1109/access.2023.3283930

基于联邦学习框架的乳腺癌组织病理学图像分类研究学术报告

作者及机构
本研究的通讯作者为Srinivas Koppu(邮箱:srinukoppu@vit.ac.in),第一作者为Jyothi Peta,两人均来自印度Vellore Institute of Technology(VIT)的信息技术与工程学院。研究论文《Enhancing Breast Cancer Classification in Histopathological Images Through Federated Learning Framework》于2023年6月7日发表在期刊《IEEE Access》(DOI: 10.1109/ACCESS.2023.3283930),并于2023年6月23日更新至当前版本。研究获得了VIT信息技术与工程学院的支持。


学术背景
乳腺癌是全球女性死亡率第二高的癌症,早期诊断对降低死亡率至关重要。然而,传统诊断方法依赖人工分析组织病理学图像,存在耗时、主观性强及误诊风险高的问题。此外,医疗数据的隐私性和安全性是智能医疗系统面临的重大挑战。现有基于深度学习(如CNN、DNN)的分类方法虽有一定效果,但存在计算复杂度高、数据隐私泄露风险等问题。

为此,本研究提出了一种结合联邦学习(Federated Learning, FL)和深度学习的自动化诊断系统,旨在实现以下目标:
1. 开发基于联邦学习与深度学习的医疗图像安全分类框架;
2. 通过扩展ElGamal图像加密(Extended ElGamal Image Encryption, E-EIE)算法保障数据隐私;
3. 设计新型分类模型卷积胶囊双注意力金枪鱼优化网络(C2T2Net)以提高分类精度;
4. 利用改进的沙猫群优化算法(Improved Sand Cat Swarm Optimization, I-SCSO)生成加密密钥,提升安全性。


研究流程与方法
研究分为五个核心步骤,具体如下:

  1. 图像采集(Image Acquisition)

    • 研究对象:使用公开数据集Breakhis,包含9109张乳腺癌组织病理学图像(40x–400x放大倍数),其中良性2480张,恶性5429张。
    • 预处理:图像统一调整为256×256像素,划分为训练集(6327张)和测试集(1582张)。
  2. 图像加密(E-EIE算法)

    • 方法:采用扩展ElGamal加密算法,将图像像素转换为椭圆曲线坐标,通过离散对数计算生成密文。
    • 创新点:引入Koblitz嵌入法解决传统ElGamal的数据扩展问题,密钥长度从1024位优化至256位。
    • 安全性验证:可抵抗窃听攻击(Eavesdropping)、重放攻击(Replay Attack)和中间人攻击(MITM)。
  3. 密钥优化(I-SCSO算法)

    • 算法改进:在标准沙猫群优化算法中引入Levy飞行策略,通过自适应参数调整平衡全局探索与局部开发能力。
    • 目标函数:最大化网络吞吐量(Fitness = max(network throughput))。
  4. 安全存储(联邦学习框架FLF)

    • 框架设计:基于联邦学习框架Flower实现分布式模型训练,避免原始数据集中传输,仅共享模型参数。
    • 优势:支持跨医疗机构协作,保障数据隐私,降低网络带宽需求。
  5. 疾病分类(C2T2Net模型)

    • 模型结构
      • 卷积模块:13层卷积+5层池化+Dropout层(0.150.25比率);
      • 胶囊网络:通过SE注意力块(Squeeze-and-Excitation Block)抑制噪声特征;
      • 路由机制:改进的因子分解机(Factorized Machine, FM)路由,优化胶囊间权重分配。
    • 参数优化:使用混沌金枪鱼群优化(Chaotic Tuna Swarm Optimization, CTSO)算法最小化损失函数(MAE=0.0031,MSE=0.056)。

主要结果
1. 加密性能:E-EIE算法在600张图像测试中,加解密时间显著低于传统方法,且密钥预测难度高。
2. 分类性能:C2T2Net模型在测试集上达到以下指标:
- 准确率(Accuracy):95.68%;
- 召回率(Recall):95.6%;
- F1分数:95.63%;
- Kappa系数:95.26%。
3. 对比实验:优于CNN、BiLSTM、DNN和CapsuleNet等基线模型,处理时间仅21秒(CNN需160秒)。


结论与价值
1. 科学价值
- 提出首个结合联邦学习与胶囊网络的乳腺癌分类框架,解决了数据隐私与模型性能的平衡问题;
- E-EIE算法和I-SCSO密钥优化为医疗图像加密提供了新思路。
2. 应用价值
- 可部署于多中心协作的医疗场景,助力早期乳腺癌诊断;
- 代码开源(Python实现),推动智能医疗系统发展。


研究亮点
1. 方法创新
- C2T2Net模型首次集成卷积胶囊网络与双注意力机制,显著提升特征提取能力;
- 联邦学习框架Flower的引入解决了医疗数据孤岛问题。
2. 技术突破
- I-SCSO算法通过Levy飞行策略改进收敛速度,密钥生成效率提升30%;
- CTSO算法将分类误差降低至0.0031(MAE),优于传统优化器。

局限与展望
当前研究仅使用Breakhis数据集,未来需验证跨数据集泛化性,并探索实时临床数据应用。此外,计划融合混合加密技术以进一步增强安全性。


(报告全文约2000字,涵盖研究全流程及核心创新点)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com