本文旨在向您介绍一项发表于2023年12月15日出版的 IEEE Internet of Things Journal(第10卷,第24期)的原创性研究工作,题为“An Automatic Malaria Disease Diagnosis Framework Integrating Blockchain-Enabled Cloud–Edge Computing and Deep Learning”。该研究由 Sirui Chen、Shengjie Zhao(IEEE高级会员)和 Chenxi Huang 共同完成,三位作者分别来自同济大学软件工程学院(隶属教育部智慧城市感知与规划关键软件技术工程研究中心、嵌入式系统与服务计算教育部重点实验室)以及厦门大学信息学院。本研究提出了一种创新的自动化疟疾诊断框架,深度融合了区块链、云边计算(Cloud-Edge Computing)与深度学习技术,旨在解决资源匮乏地区的疟疾早期精准诊断难题。
本研究的核心科学领域为医疗物联网(IoMT)与人工智能辅助诊断。疟疾作为一种由疟原虫引起、通过按蚊传播的威胁生命的疾病,在卫生条件欠佳的发展中国家和地区尤为盛行。早期、准确的诊断对于降低死亡率至关重要。传统的实验室确诊依赖于医学专家对血涂片显微图像的观察,这一过程既繁琐又易出错。尽管基于机器学习的自动诊断方法有所发展,但其通常需要基于传染病学专业知识的特征工程(Feature Engineering),存在主观性且耗时。
近年来,深度学习技术已显示出在疾病自动检测方面的巨大潜力,它无需手工特征,能够实现端到端的自动诊断。然而,疟疾高发地区往往计算资源稀缺,本地设备难以满足深度学习模型(尤其是训练阶段)的巨大计算需求。同时,在远程医疗系统中,数据(如患者血涂片图像)从本地向云端传输时存在隐私泄露风险。因此,如何在一个安全、高效且能充分利用有限本地资源的架构下,部署精准的深度学习诊断模型,成为亟待解决的问题。
本研究的目标是开发一个集成的自动化框架,将疟疾诊断任务分解为疟原虫感染细胞分割与寄生虫物种及生命周期阶段分类两个核心步骤,并利用云边协同范式与区块链安全传输技术来优化计算资源分配、提高诊断精度并保障数据安全。
本研究提出的框架(如图1所示)是一个复杂的系统工程,其详细工作流程可分为以下几个关键步骤:
1. 数据收集与本地预处理 * 研究对象:研究采用了公开数据集 MP-IDB (Malaria Parasite Image Database)。该数据集包含229张吉姆萨染色的薄血涂片显微图像,分辨率为2592×1944。图像涵盖了四种疟原虫物种:恶性疟原虫(Plasmodium falciparum, 122张)、间日疟原虫(P. vivax, 41张)、三日疟原虫(P. malariae, 37张)和卵形疟原虫(P. ovale, 29张),每种又包含四个生命阶段:环状体(Ring)、滋养体(Trophozoite)、裂殖体(Schizont)和配子体(Gametocyte)。 * 本地预处理:由于图像采集光照条件不同导致色彩差异,研究首先在边缘节点(即本地医院)对收集的血涂片图像应用自动色彩均衡(ACE, Automatic Color Enhancement) 算法进行归一化预处理,以增强对比度和色彩一致性,为后续分割任务提供标准化的输入。
2. 边缘节点初步处理与概率图生成 * 流程与方法:预处理后的图像数据在边缘节点输入一个U-Net模型。该模型以有监督学习的方式进行训练,其任务是生成粗略的疟原虫感染细胞概率图(Probability Maps)。这一步是相对轻量的分割任务,旨在利用本地计算资源进行初步的定位分析。 * 数据传输准备:生成的粗略概率图与经过归一化的原始血涂片图像将被组合,准备上传至云端服务器。
3. 基于区块链的安全数据传输 * 安全机制:为了确保数据在从边缘节点传输到云端过程中的隐私与完整性,研究提出并实施了一套基于区块链的安全数据传输方案。核心步骤如下: * 数据加密:采用 AES-256 对称加密算法对数据进行加密。通过SHA256哈希算法结合生成的密钥对(Ka, Kb)来产生用户密钥K(公式:K = SHA256(Ka ⊕ Kb)),确保了加密的强度和安全性。 * 区块链结构:加密后的数据(密文)与相关密钥、访问策略等信息被存储到区块链的智能合约中。每个区块包含区块头和区块体,确保数据的不可篡改性和可追溯性。 * 访问控制与解密:数据请求者(如云端诊断服务)需通过智能合约验证其访问权限,获取解密所需的密钥(K、pk等),并使用相应的解密算法还原得到明文数据。任何对区块数据的篡改都会导致哈希值变化,从而使区块链断裂,有效防止恶意攻击。
4. 云端精细化分割与弱监督学习 * 核心创新:这是本研究的核心分析步骤。在云端服务器,研究团队设计并训练了一个集成了堆叠扩张U-Net(SDU-Net, Stacked Dilated U-Net) 与弱监督学习(Weakly Supervised Learning) 的先进分割网络。 * SDU-Net结构:作为U-Net的变体,SDU-Net的核心改进在于将编码器/解码器模块中的第二层标准卷积替换为多路扩张卷积(Dilated Convolutions)。如图5所示,这些卷积层的滤波器数量依次递减(nout/2, nout/4, nout/8, nout/16, nout/16),但扩张率(dilation rate)递增。所有扩张卷积的输出被串联起来作为下一层的输入。这使得网络在保持U-Net多尺度上下文信息融合优点的同时,能以更少的参数获得更大、更丰富的感受野,非常适合医学图像分割。 * 弱监督学习流程:如图4和图6所示,这一过程包含两个训练阶段。第一阶段:在边缘节点训练的U-Net生成的粗略概率图被上传至云端。第二阶段:在云端训练SDU-Net时,这些概率图作为弱监督信号被引入。具体而言,概率图经过两个卷积层后,被串联到SDU-Net的某一编码器层。这为分割网络提供了像素级别的先验知识(Prior Knowledge),增强了网络的定位能力,从而在无需精细像素级标注(仅利用较粗糙的概率图)的情况下,显著提升了最终感染细胞分割的精度和收敛速度。这是一种利用低质量标注提升模型性能的高效方法。
5. 寄生虫物种与阶段分类 * 数据准备:基于云端分割网络输出的结果(即分割出的感染细胞区域),研究人员将这些区域从原图中逐一裁剪出来,形成大小不一的单个感染细胞图像。 * 分类网络:分类任务采用一个在ImageNet数据集上预训练过的 MobileNet V1 模型。为了适应不同尺寸的输入图像,在模型的全连接层之前加入了空间金字塔池化(Spatial Pyramid Pooling) 层。 * 两级分类策略:考虑到四种疟原虫在同一生命阶段具有形态相似性,且数据集规模有限,研究采用了巧妙的两级分类训练策略。第一步,使用所有裁剪出的感染细胞图像训练一个模型,专门用于识别寄生虫物种(四种类型)。第二步,将所有处于同一生命阶段(如都是环状体阶段)的不同物种感染细胞图像合并,训练另一个模型,专门用于识别寄生虫的生命周期阶段(四个阶段)。这种方法有效利用了数据,并针对分类任务的子目标进行了优化。
6. 诊断结果返回 * 云端完成感染细胞分割以及物种/阶段分类后,生成的诊断报告(包括是否感染、感染何种疟原虫、处于哪个阶段)将通过云端路径立即发送回发起请求的原始本地医院。
数据分割与实验设置:研究将MP-IDB数据集按4:1的比例划分为训练集和测试集。为应对数据量有限的问题,对训练集进行了数据增强操作,包括旋转、水平/垂直翻转、添加高斯噪声等,将训练集扩增至原规模的5倍。分割网络训练学习率为3e-5,共1000个epoch;分类网络训练学习率为1e-3,共500个epoch。
研究通过一系列对比实验和消融研究,详细验证了所提框架及各组件的有效性,结果支持了其核心结论。
1. 疟原虫感染细胞分割结果 * 整体性能:如表II所示,集成弱监督学习的SDU-Net在分割任务上取得了优异的性能,其Jaccard相似系数达到96.31%,Dice相似系数达到95.28%,均超过95%,表明分割结果与真实标注(Ground Truth)高度吻合。从图7的视觉结果也可看出,分割出的感染细胞边界清晰准确。 * 预处理(ACE)有效性验证:如表III所示,使用ACE预处理操作后,分割的准确率(Accuracy) 和特异性(Specificity) 相比未预处理时均提升了约2%,证明了色彩归一化对提升模型鲁棒性的重要作用。 * 网络结构消融研究:如表V所示,研究比较了U-Net、SDU-Net和带弱监督的SDU-Net三种结构。结果表明,SDU-Net比基础U-Net在准确率和特异性上分别提升了4.82% 和3.77%,证明了扩张卷积结构带来的性能增益。在此基础上,引入弱监督学习进一步将这两个指标提升了约2.4%,凸显了利用边缘节点生成的概率图进行云端模型精调的有效性。 * 与先进分割模型对比:如表VI所示,与包括U-Net++、SegNet、VGG16、ResNet50、Attention U-Net在内的其他先进网络骨干(Backbone)相比,本研究提出的结构在准确率和特异性上均表现最佳,比第二名U-Net++高出约0.5%。 * 与已有研究对比:如表VII所示,与在MP-IDB数据集上已有的最优方法(State-of-the-Art)相比,本研究的分割准确率达到98.47%,特异性达到94.38%,实现了双重指标的超越。
2. 寄生虫物种与阶段分类结果 * 物种分类:如表VIII所示,本研究在疟原虫物种分类任务上的准确率达到97.18%,特异性达到92.11%,敏感度(Sensitivity)为97.98%。相比已有研究,准确率和特异性分别提升了约2% 和 2.05%。 * 阶段分类:如表IX所示,在生命周期阶段分类任务上,准确率达到98.43%,特异性达到94.38%,敏感度为98.17%。同样优于对比方法,准确率和特异性分别提升了约2% 和 3.09%。
这些结果从量化指标上强有力地证明了,本研究提出的“边缘粗分割-云端细分割与分类”流程,结合创新的SDU-Net弱监督学习结构,能够高效、准确地完成从血涂片图像中定位感染细胞到识别具体病原体类型和感染阶段的全流程自动化诊断。
本研究成功构建并验证了一个集成区块链、云边计算与深度学习的自动化疟疾诊断框架。其主要结论与价值体现在以下几个方面:
研究在讨论部分明确指出,与传统机器学习方法需要手动进行特征提取和选择不同,本框架利用深度学习实现了真正的端到端自动诊断,避免了主观经验的影响。同时,作者也坦诚地指出了当前工作的局限性:尽管在MP-IDB小数据集上取得了良好效果,但在更大规模数据集上的性能有待验证;整体网络性能仍有提升空间。他们表示未来将在其他图像集上测试模型,以验证方法的普适性,并相信该框架能为其他传染病图像分割与分类的远程医疗应用设计提供有价值的参考。