这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究的主要作者包括Jan Siarov、Angelica Siarov、Darshan Kumar、John Paoli、Johan Mölne和Noora Neittaanmäki。研究由瑞典哥德堡大学Sahlgrenska学院生物医学研究所、Sahlgrenska大学医院临床病理科、芬兰Aiforia Technologies plc.等机构共同完成。研究于2024年8月22日发表在Frontiers in Medicine期刊上,DOI为10.3389/fmed.2024.1418013。
本研究的主要科学领域为数字病理学(digital pathology)和人工智能(AI),特别是深度学习在皮肤病理学中的应用。研究的背景是黑色素瘤(melanoma)的预后与其诊断时的淋巴结转移(nodal metastasis, NM)密切相关。然而,淋巴结内痣(intra-nodal nevus, INN)常被误诊为NM,导致错误的病理分期和治疗决策。此外,病理学家在评估前哨淋巴结活检(sentinel node biopsy, SNB)时存在较高的不一致性,可能导致假阳性和假阴性结果。因此,本研究旨在评估AI在检测SNB中的NM和INN方面的能力,特别是通过全片数字成像(whole slide imaging, WSI)技术实现AI在数字病理学中的应用。
研究流程包括以下几个主要步骤:
数据集构建:研究回顾性收集了196例SNB的485张H&E染色WSI图像,其中包括NM和INN。这些图像被随机分为训练集(279张)、验证集(89张)和测试集(117张)。所有图像均经过匿名化处理,并使用NanoZoomer数字切片扫描仪以40倍放大率扫描。
参考标准:研究使用免疫组织化学(IHC)作为参考标准,包括SOX10和HMB45染色。所有H&E切片均由经验丰富的皮肤病理学家重新评估,以确认NM和INN的诊断。
注释与训练:训练集的279张WSI图像由皮肤病理学家手动注释,共进行了5,956次像素级注释。注释分为两个层次:组织层(tissue layer)和肿瘤层(tumor layer)。AI模型使用Aiforia Create平台进行训练,基于U-Net架构的卷积神经网络(CNN)进行语义分割。
模型验证与测试:训练完成后,AI模型在未注释的验证集上进行验证,并在独立的测试集上进行测试。测试集包括27张NM、9张INN和81张无肿瘤的淋巴结图像。三名皮肤病理学家也在相同的测试集上进行盲法评估,结果与AI模型进行比较。
统计分析:研究使用ROC曲线和AUC值评估AI模型和皮肤病理学家的性能,并计算敏感性、特异性和准确性。统计分析方法包括精确二项检验和McNemar检验。
NM检测:AI模型在检测NM方面表现出色,AUC值为0.965(95% CI: 0.94–0.98),与皮肤病理学家的AUC值(0.94–0.98)相当。AI模型的敏感性为89%,特异性为94%。
INN检测:AI模型在检测INN方面的AUC值为0.781(95% CI: 0.70–0.85),皮肤病理学家的AUC值范围为0.63–0.79。AI模型的敏感性为78%,特异性为63%。
模型性能比较:AI模型在NM检测方面与皮肤病理学家表现相当,但在INN检测方面表现略优于部分皮肤病理学家,尽管其特异性较低。
肿瘤大小分析:测试集中NM的最大直径为0.1mm至21.8mm,中位直径为0.7mm;INN的直径范围为0.1mm至2.0mm,中位直径为0.3mm。AI模型能够检测到皮肤病理学家遗漏的小肿瘤灶。
本研究开发的深度学习AI模型在检测黑色素瘤SNB中的NM方面表现出色,达到了皮肤病理学家的水平,并在区分NM和INN方面展示了潜力。该模型基于H&E染色WSI图像,无需依赖IHC,能够显著提高病理诊断的效率和准确性。研究结果支持AI在数字病理学中的应用前景,特别是在黑色素瘤分期和诊断中的潜在价值。
研究还指出,AI模型在检测小肿瘤灶(如孤立肿瘤细胞)方面表现出色,这些病灶在传统病理检查中容易被遗漏。此外,研究团队计划在未来的研究中扩大样本量,并在多中心验证该模型的性能,以进一步提高其临床应用价值。
通过本研究的详细流程和结果分析,可以看出AI技术在皮肤病理学中的广泛应用前景,特别是在提高诊断效率和准确性方面的潜力。