分享自:

基于联邦神经架构搜索的医疗数据安全研究

期刊:IEEE Transactions on Industrial InformaticsDOI:10.1109/TII.2022.3144016

类型a:这篇文档报告了一项原创研究。

主要作者和机构及发表信息
该研究的主要作者包括刘欣(Xin Liu)、赵建伟(Jianwei Zhao)、李杰(Jie Li)、曹斌(Bin Cao,IEEE会员)以及吕志涵(Zhihan Lv,IEEE高级会员)。其中,刘欣和李杰隶属于河北工业大学经济与管理学院以及南方科技大学广东省脑启发智能计算重点实验室;赵建伟和曹斌隶属于河北工业大学可靠性与智能电气设备国家重点实验室、人工智能学院以及南方科技大学广东省脑启发智能计算重点实验室;吕志涵隶属于瑞典乌普萨拉大学。该研究于2022年1月19日被接收,并在2022年8月发表于《IEEE工业信息学汇刊》(*IEEE Transactions on Industrial Informatics*,第18卷,第8期)。

学术背景
本研究属于医学数据安全领域,具体涉及联邦学习(Federated Learning, FL)和神经架构搜索(Neural Architecture Search, NAS)的结合应用。医疗数据具有重要的诊断价值和治疗意义,但其隐私泄露可能导致严重问题,因此医疗数据的安全性备受关注。传统深度学习方法需要集中训练大量数据,这会带来隐私威胁,而联邦学习通过仅传输模型参数而非数据解决了这一难题。此外,NAS是一种自动搜索最优神经网络架构的方法,已被成功应用于复杂问题中,如图像分类。然而,目前鲜有研究将FL与NAS结合以同时实现隐私保护和模型架构优化。本研究旨在开发一种基于NAS的多目标卷积区间二型模糊粗糙联邦学习模型(CIT2FR-FL-NAS),以在保护医疗数据隐私的同时实现高精度分类并降低网络复杂度。

研究工作流程
本研究的工作流程分为以下几个步骤:

  1. 构建CIT2FR-FL-NAS框架
    研究首先设计了一个超网卷积神经网络(Supernet CNN),用于从组织病理学图像中提取特征。随后,结合区间二型模糊粗糙集(Interval Type-2 Fuzzy Rough Set, IT2FRS)理论,提出了卷积区间二型模糊粗糙神经网络(Convolutional Interval Type-2 Fuzzy Rough Neural Network, CIT2FRNN)模型。该模型通过模糊化层、规则层和粗糙层逐步处理输入特征图,最终生成分类结果。

  2. 联邦学习过程
    在联邦学习框架下,参与者下载全局模型并在本地数据上进行训练,然后将更新后的参数上传至中央服务器。服务器对参数进行平均后更新全局模型,并将新模型分发给所有参与者。此过程重复多次,直到模型收敛。为了减少网络复杂度,研究采用了改进的多目标进化算法(Multiobjective Evolutionary Algorithm, MOEA/D),通过同时考虑准确性和计算复杂度来搜索最优网络架构。

  3. 实验设置
    实验使用了LC25000肺和结肠组织病理学图像数据集,包含15000张肺部图像和10000张结肠图像,分别划分为训练集、验证集和测试集(比例为3:1:1)。研究设置了三个客户端,每个客户端均匀分配训练数据。超网CNN包含两个动态块,其深度、卷积核大小和扩展率均经过优化。模型训练使用随机梯度下降(SGD)优化器,初始学习率为0.05,动量因子为0.9,权重衰减参数为4×10⁻⁵。

  4. 数据分析
    研究通过比较不同网络架构的性能评估了模型效果。对于最小复杂度和最大复杂度的网络架构,分别记录了其最佳准确率和测试准确率。此外,研究还对比了所提出模型与其他先进模型的性能差异,并通过可视化展示了多目标进化算法的搜索结果。

主要结果
实验结果显示,所提出的CIT2FR-FL-NAS框架在保护隐私的同时实现了高精度分类:
1. 对于最大复杂度的网络架构,在联合学习和模糊粗糙集集成的情况下,模型达到了99.96%的测试准确率,仅比集中式学习低0.04%。尽管模糊粗糙集对准确性提升有限,但它显著提高了模型的可解释性。
2. 对于最小复杂度的网络架构,模型在联合学习下的准确率为92.98%,而在联合学习和模糊粗糙集集成的情况下为89.24%。集中式学习后加入模糊粗糙集的模型准确率可达100%。
3. 通过改进的MOEA/D算法,研究发现Moea/d-1、Moea/d-3和Moea/d-4在搜索高质量架构方面优于NSGA-II,无论是在最大复杂度还是最小复杂度架构下。

结论及意义
本研究开发了一种创新的CIT2FR-FL-NAS框架,能够有效解决医疗数据安全问题。该框架不仅保护了患者隐私,还降低了计算负担并提高了分类精度。研究的意义在于:
1. 科学价值:首次将NAS与区间二型模糊粗糙集理论结合应用于联邦学习中,为医疗图像诊断提供了一种新的解决方案。
2. 应用价值:所提出的框架可用于肺癌和结肠癌等疾病的早期诊断,有助于医生更准确地进行医疗决策,同时保护患者隐私。

研究亮点
1. 提出了CIT2FR-FL-NAS框架,结合了联邦学习、神经架构搜索和模糊粗糙集理论。
2. 开发了一种改进的多目标进化算法,显著提高了搜索效率和模型性能。
3. 实验验证表明,所提出的框架在保证高精度的同时降低了网络复杂度,且具有良好的可解释性。

其他有价值内容
研究还探讨了模糊粗糙集对模型性能的影响,发现其虽然略微降低了最小复杂度架构的准确性,但显著增强了模型的可解释性。此外,研究对比了多种多目标进化算法的性能,为未来相关研究提供了参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com