基于联邦学习框架的乳腺癌组织病理学图像分类增强研究

分享自：
基于联邦学习框架的乳腺癌组织病理学图像分类增强研究

信息科学
人工智能
期刊:IEEE AccessDOI:10.1109/access.2023.3283930
【点击此处】阅读全文、收藏及针对性提问
基于联邦学习框架的乳腺癌组织病理学图像分类研究学术报告
作者及机构
 本研究的通讯作者为Srinivas Koppu（邮箱：srinukoppu@vit.ac.in），第一作者为Jyothi Peta，两人均来自印度Vellore Institute of Technology（VIT）的信息技术与工程学院。研究论文《Enhancing Breast Cancer Classification in Histopathological Images Through Federated Learning Framework》于2023年6月7日发表在期刊《IEEE Access》（DOI: 10.1109/ACCESS.2023.3283930），并于2023年6月23日更新至当前版本。研究获得了VIT信息技术与工程学院的支持。
学术背景
 乳腺癌是全球女性死亡率第二高的癌症，早期诊断对降低死亡率至关重要。然而，传统诊断方法依赖人工分析组织病理学图像，存在耗时、主观性强及误诊风险高的问题。此外，医疗数据的隐私性和安全性是智能医疗系统面临的重大挑战。现有基于深度学习（如CNN、DNN）的分类方法虽有一定效果，但存在计算复杂度高、数据隐私泄露风险等问题。
为此，本研究提出了一种结合联邦学习（Federated Learning, FL）和深度学习的自动化诊断系统，旨在实现以下目标：
 1. 开发基于联邦学习与深度学习的医疗图像安全分类框架；
 2. 通过扩展ElGamal图像加密（Extended ElGamal Image Encryption, E-EIE）算法保障数据隐私；
 3. 设计新型分类模型卷积胶囊双注意力金枪鱼优化网络（C2T2Net）以提高分类精度；
 4. 利用改进的沙猫群优化算法（Improved Sand Cat Swarm Optimization, I-SCSO）生成加密密钥，提升安全性。
研究流程与方法
 研究分为五个核心步骤，具体如下：
图像采集（Image Acquisition）
研究对象：使用公开数据集Breakhis，包含9109张乳腺癌组织病理学图像（40x–400x放大倍数），其中良性2480张，恶性5429张。
 
预处理：图像统一调整为256×256像素，划分为训练集（6327张）和测试集（1582张）。
 
图像加密（E-EIE算法）
方法：采用扩展ElGamal加密算法，将图像像素转换为椭圆曲线坐标，通过离散对数计算生成密文。
 
创新点：引入Koblitz嵌入法解决传统ElGamal的数据扩展问题，密钥长度从1024位优化至256位。
 
安全性验证：可抵抗窃听攻击（Eavesdropping）、重放攻击（Replay Attack）和中间人攻击（MITM）。
 
密钥优化（I-SCSO算法）
算法改进：在标准沙猫群优化算法中引入Levy飞行策略，通过自适应参数调整平衡全局探索与局部开发能力。
 
目标函数：最大化网络吞吐量（Fitness = max(network throughput)）。
 
安全存储（联邦学习框架FLF）
框架设计：基于联邦学习框架Flower实现分布式模型训练，避免原始数据集中传输，仅共享模型参数。
 
优势：支持跨医疗机构协作，保障数据隐私，降低网络带宽需求。
 
疾病分类（C2T2Net模型）
模型结构：
 卷积模块：13层卷积+5层池化+Dropout层（0.15⁄0.25比率）；
 
胶囊网络：通过SE注意力块（Squeeze-and-Excitation Block）抑制噪声特征；
 
路由机制：改进的因子分解机（Factorized Machine, FM）路由，优化胶囊间权重分配。
 
参数优化：使用混沌金枪鱼群优化（Chaotic Tuna Swarm Optimization, CTSO）算法最小化损失函数（MAE=0.0031，MSE=0.056）。
 
主要结果
 1. 加密性能：E-EIE算法在600张图像测试中，加解密时间显著低于传统方法，且密钥预测难度高。
 2. 分类性能：C2T2Net模型在测试集上达到以下指标：
 - 准确率（Accuracy）：95.68%；
 - 召回率（Recall）：95.6%；
 - F1分数：95.63%；
 - Kappa系数：95.26%。
 3. 对比实验：优于CNN、BiLSTM、DNN和CapsuleNet等基线模型，处理时间仅21秒（CNN需160秒）。
结论与价值
 1. 科学价值：
 - 提出首个结合联邦学习与胶囊网络的乳腺癌分类框架，解决了数据隐私与模型性能的平衡问题；
 - E-EIE算法和I-SCSO密钥优化为医疗图像加密提供了新思路。
 2. 应用价值：
 - 可部署于多中心协作的医疗场景，助力早期乳腺癌诊断；
 - 代码开源（Python实现），推动智能医疗系统发展。
研究亮点
 1. 方法创新：
 - C2T2Net模型首次集成卷积胶囊网络与双注意力机制，显著提升特征提取能力；
 - 联邦学习框架Flower的引入解决了医疗数据孤岛问题。
 2. 技术突破：
 - I-SCSO算法通过Levy飞行策略改进收敛速度，密钥生成效率提升30%；
 - CTSO算法将分类误差降低至0.0031（MAE），优于传统优化器。
局限与展望
 当前研究仅使用Breakhis数据集，未来需验证跨数据集泛化性，并探索实时临床数据应用。此外，计划融合混合加密技术以进一步增强安全性。
（报告全文约2000字，涵盖研究全流程及核心创新点）
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问