使用YOLOv9检测具有缗钱状形态的红细胞中的疟疾寄生虫

分享自：
使用YOLOv9检测具有缗钱状形态的红细胞中的疟疾寄生虫

检验医学
信息科学
期刊:tissue and cellDOI:10.1016/j.tice.2024.102677
【点击此处】阅读全文、收藏及针对性提问
本文介绍了由Fatima Abdullahi Muhammad、Rubita Sudirman和Nor Aini Zakaria共同完成，发表在学术期刊 tissue and cell 2025年卷93的一项原创性研究。该研究聚焦于医学图像分析和传染病诊断领域，核心目标是开发一种能够识别特殊红细胞形态——缗钱状红细胞（Rouleaux Formation），并在其中准确检测疟原虫的自动化诊断系统。研究背景在于，疟疾在贫困地区流行，而患者常伴有其他感染性或慢性疾病（如细菌感染、结缔组织病、糖尿病等），这些疾病会导致红细胞在显微镜下呈现缗钱状排列。根据国际血液学标准化委员会（ICSH）的指导，显微镜检验师必须报告这种形态的存在。然而，现有的基于深度学习的自动化疟疾诊断系统大多忽略或未考虑这种常见异常形态，这可能导致这些系统在实际部署时，尤其是在疟疾流行区域，诊断准确性下降，产生偏差。因此，本研究旨在填补这一空白，构建一个包含缗钱状红细胞形态的薄血涂片数据集，并利用最新的YOLOv9目标检测算法，实现对疟原虫和白细胞的有效识别。
详尽的研究流程
本研究的工作流程系统且严谨，主要包含数据收集与处理、模型训练与验证、以及性能评估与分析三个主要阶段。
第一阶段是数据收集、处理与标注。首先，研究者从尼日利亚卡诺州的Asiya Bayero儿科医院获取了100名疟疾感染患者的血样，并获得了当地卫生部的伦理批准。通过薄血涂片显微镜检查，专家鉴定出其中28份样本存在红细胞缗钱状形态。使用连接到显微镜目镜的iPhone 10相机，共捕获了294张高分辨率（4032×3024像素）图像。为优化图像质量并减少计算负荷，研究者采用二值化和Otsu阈值化技术去除了不必要的黑色背景，并将图像统一调整为2500×2500像素。随后，由一位拥有超过10年经验的显微镜学家使用Superannotate工具，对图像进行了精细的矩形框标注，共定义了三个类别：白细胞（WBC）、恶性疟原虫滋养体（trophozoite of Pf）和疟疾疟原虫滋养体（trophozoite of Pm）。最终，数据集包含5229个标注实例，其中Pf滋养体最多（4250个），Pm滋养体次之（749个），白细胞最少（130个）。数据集被划分为训练集（233张图）、验证集（30张图）和测试集（29张图），并保存为Superannotate和COCO两种格式以备训练。
第二阶段是模型架构、训练与优化。研究选用了目标检测领域前沿的YOLOv9算法，特别是其轻量级版本YOLOv9s。YOLOv9的创新之处在于引入了可编程梯度信息（PGI）概念和广义高效层聚合网络（GELAN），旨在解决深度神经网络中前向传播信息丢失导致的梯度偏差问题，从而提升了训练效率和特征提取的可靠性。模型训练在Google Colab的T4 GPU上进行。为了探究预训练权重的影响，研究者进行了两次独立的训练实验：一次使用在MS COCO大型通用数据集上预训练的权重初始化模型；另一次则完全从零开始随机初始化训练。两个实验都采用了基于遗传算法的超参数调优策略，历经300代进化，最终确定的最优超参数包括：优化器为AdamW、学习率为0.001429、动量为0.9。图像输入尺寸调整为2208×2208，批量大小设为1（受计算资源限制），并在训练的最后10个epoch关闭了马赛克数据增强。每个模型的训练均持续了250个epoch。
第三阶段是结果分析与模型评估。评估采用了目标检测领域的标准指标：精确率（Precision）、召回率（Recall）、平均精度均值（mAP50）和综合平均精度均值（mAP50-95）。混淆矩阵（Confusion Matrix）被用来详细分析预测结果，包括真阳性（TP）、假阳性（FP）和假阴性（FN）。对于每个模型（预训练YOLOv9s和从零训练的YOLOv9s），研究者都计算了整体和每个类别的性能指标。
主要研究结果
研究发现，两种训练方式的模型在最终性能上各有千秋。从零开始训练的YOLOv9s取得了基线性能，整体精确率、召回率和mAP50分别为75.4%、76.6%和80.3%。而使用MS COCO数据集预训练权重的YOLOv9s则在所有关键指标上均实现了性能提升：精确率提高了0.4%至75.8%，召回率显著提高了5.4%至82.0%，mAP50提高了2.5%至82.8%，mAP50-95也略有提升至49.4%。学习曲线图（mAP50和mAP50-95随epoch的变化）清晰显示，预训练模型收敛速度更快，这表明预训练权重有效加速了模型学习过程。
深入分析混淆矩阵和各类别结果，可以得到更细致的发现： 1. 类间混淆：两个模型在白细胞（WBC）与两类疟原虫之间均未发生误判，表明白细胞的特征与其他类别差异显著，易于区分。主要混淆发生在两种疟原虫（Pf和Pm）之间。预训练模型中，有7个Pm实例被误判为Pf，1个Pf被误判为Pm。而从零训练的模型只发生了1次Pm误判为Pf的情况。这说明区分不同疟原虫物种本身存在挑战，可能源于形态相似性。 2. 性能差异：在Pf滋养体的检测上，预训练模型召回率更高（81.6% vs 61.9%），意味着它能找到更多真实的Pf目标，但代价是其精确率更低（61.0% vs 75.5%），即其预测结果中包含的误报（FP）更多。这可能是因为Pf滋养体在所有实例中数量最多、尺寸最小，且容易与血涂片中的杂质（artifact）混淆，导致其检测难度最大，因此假阳性和假阴性数量都最高。对于Pm滋养体，从零训练的模型获得了更高的精确率（83.2%）和mAP50（86.5%）。白细胞检测则表现最佳，预训练模型对其的mAP50达到89.1%。 3. 推理速度与模型复杂度：预训练模型因具有更多参数（7.29M vs 6.19M）和更高的浮点运算量（27.4G vs 22.1G），其推理速度较慢（191.7 ms vs 137.8 ms）。
研究者在文中将本工作的结果与其他相关文献进行了对比。如表5所示，以往研究大多专注于检测单一物种疟原虫或正常形态红细胞中的疟原虫，其报告的最高mAP值可达90%以上。本研究的mAP50（82.8%）虽然略低于某些顶尖研究，但其独特价值在于这是首个在极具挑战性的缗钱状红细胞背景下检测疟原虫（及白细胞）的工作。相比于厚血涂片中仅检测游离的小尺寸疟原虫（虽有挑战但背景干净），薄血涂片中缗钱状红细胞堆叠造成的复杂背景使得寄生虫检测难度更大，本研究的成果在此背景下展现了YOLOv9算法的良好潜力。
研究的结论与价值
本研究的核心结论是，在疟疾流行地区，红细胞的缗钱状形态极为常见，因此，任何旨在部署于这些地区的自动化疟疾诊断系统，都必须具备识别这种异常形态并在其中检测疟原虫的能力，否则系统的诊断准确性将大打折扣。为此，本研究成功构建了一个包含恶性疟原虫（Pf）和疟疾疟原虫（Pm）两种物种的、具有缗钱状形态的感染红细胞图像数据集，并使用YOLOv9s模型进行了基准测试。实验证明，采用预训练权重的YOLOv9s模型取得了更优的性能，整体mAP50达到82.8%。这为开发更贴近现实场景、更具鲁棒性的自动化疟疾诊断工具迈出了关键一步。
研究亮点
本研究的亮点主要体现在以下几个方面： 1. 研究对象的特殊性与现实意义：首次将红细胞缗钱状形成这一常见但被现有自动化诊断研究忽略的临床现象作为核心研究对象，解决了现实诊断场景中的一个关键难题，使研究成果具有更强的临床应用潜力和泛化能力。 2. 数据集的创新性：创建了首个公开可用的、包含两种疟原虫物种（Pf和Pm）并专注于缗钱状红细胞形态的薄血涂片图像数据集，填补了该领域数据资源的空白，为后续研究提供了重要基础。 3. 算法应用的先进性：率先将最新的YOLOv9目标检测算法应用于疟原虫检测领域，验证了其在该复杂任务上的有效性，并系统比较了预训练与从零训练策略的影响，为后续模型选择提供了参考。 4. 方法论的系统性：工作流程完整，从伦理审批、临床样本收集、专业标注、数据预处理、模型训练调优到全面的性能评估与分析，形成了一套严谨的研究范式。尤其是在探讨不同疟原虫物种检测难度差异和模型误判模式上，分析深入细致。
其他有价值的补充
研究中指出了未来工作方向，包括扩展数据集的规模和类别（如纳入更多疟原虫物种及其生活周期阶段），以及探索其他目标检测算法或混合模型以进一步提升网络性能。同时，研究者强调了当前基于深度学习的自动化疟疾诊断研究普遍面临高质量标注数据不足的瓶颈。本研究通过贡献这一独特的数据集，为解决这一瓶颈、推动诊断系统在疟疾流行地区的实地部署做出了积极贡献。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问