利用基于细胞学的深度学习预测未知原发性癌症的肿瘤起源

2024-05-22 Wed
背景介绍肿瘤未明原发癌（Cancer of Unknown Primary, CUP）是一类通过组织病理学确认为恶性转移但无法通过常规基线诊断方法明确原发部位的恶性疾病。CUP在临床中具有较大的诊断挑战和治疗难度，被认为占所有人类癌症的3-5%。其中，腺癌是最常见的病理类型，其次是鳞状细胞癌和未分化癌。尽管采用了一系列联合化疗治疗手段，患者的整体预后依然极差，仅有20%的患者可以达到10个月的中位生存期。CUP的一个显著特征是其早期扩散、侵袭性较强的临床表现和多器官受累的特点。
免疫组化试验（Immunohistochemistry, IHC）通常被用作预测CUP可能原发部位的关键手段，然而，通过大约20种不同免疫染色单元组合，仅不到30%的CUP病例能够被精确定位。因而，准确预测原发部位对于有效且个性化的治疗至关重要。
论文来源本文由Fei Tian等撰写，作者机构包括天津医科大学癌症研究所和第一附属医院、苏州大学第一附属医院、郑州大学第一附属医院以及美国Harvard大学等。该研究于2023年5月提交，2024年3月被接收并于2024年4月在《Nature Medicine》上在线发表。
研究目的本研究旨在利用深度学习方法开发一个基于细胞学图像的肿瘤原发部位预测模型。在传统的细胞学分析基础上，研究团队开发了一个名为TORCH（Tumor Origin Classification through Homeostasis）的深度学习模型，通过利用来自四家三级医院的57220例细胞学图像实现恶性肿瘤的诊断和原发部位的预测。
研究流程数据收集和处理研究在2010年6月至2023年10月间收集了来自四家大型医院的90572幅细胞涂片图像，这些图像来源于76183名患者。在排除掉无法定位原发部位的24808幅恶性图像后，最终数据集由57220幅图像和43688名患者构成。训练集中包括29883幅图像和20638名患者，涵盖12种肿瘤亚型。在训练集中，除了19406幅肿瘤图像外，还包括10477幅良性疾病图像。内部测试集分别来自天津、郑州和苏州的三家医院，共包含12799幅图像。外部测试集来自天津和烟台的两家医院，共包含14538幅图像。
模型开发和验证团队使用四种不同的深度神经网络在三种不同输入类型上进行训练，共生成十二种不同模型（Methods部分）。通过模型集成来整合这些模型的结果，从而提升了模型的泛化能力和互操作性。在三个内部测试集和两个外部测试集上，TORCH模型在总共27337例测试中取得了0.969的平均AUROC值。具体来看，在天津、郑州和苏州三个内部测试集上，该值分别为0.953、0.962和0.979；而在两个外部测试集上分别为0.958和0.978。
实验结果癌症诊断性能：TORCH模型在五个测试集中分别取得0.974的AUROC值、92.6%的准确度、92.8%的灵敏度和92.4%的特异性。
肿瘤原发部位预测性能：总体准确度分别为0.969（95%CI: 0.967–0.970），Top-1准确度为82.6%，Top-3达到98.9%。模型分别实现了0.930、0.962和0.960的最高AUROC值和0.799、0.905和0.947的次高AUROC值。
与病理学家的对比：TORCH的预测效能明显高于病理学家，尤其在提高初级病理学家的诊断分数方面有显著效果。
生存分析：接受与TORCH预测原发部位一致治疗的CUP患者相较于接受不一致治疗的患者生存时间更长（27个月 vs. 17个月，p=0.006）。
研究结论TORCH模型展示了其作为在临床实践中重要辅助工具的潜力，通过细胞图对癌症进行诊断和原发部位定位，展示出显著的应用前景。尽管在未来的随机试验中需要进一步验证，本研究显然为CUP患者的临床管理和个体化治疗提供了可靠的辅助依据。
研究亮点创新性和应用价值：该研究在CUP高效诊断的背景下，首次采用深度学习的图像分析技术，显著提升了诊断和预测的准确性。
数据量和覆盖面广：利用来自四个医学中心的大规模细胞图像数据集，提高了研究结果的可靠性和普适性。
智能辅助诊断：TORCH模型帮助初级病理学家的诊断准确度接近高级病理学家，降低了诊断的时间和成本。
延长患者生存期：在实际临床应用中，TORCH实现了对于患者生存期的实际提升，证明了其在临床实践中的价值。
进一步研究方向虽然TORCH模型显示了良好的初步效果，但未来的研究可以考虑结合更多的临床数据类型（如基因数据、放射影像等），以进一步提升模型性能。同时，也期待未来在不同种族和地域的病人中进一步验证其普适性。
总结本研究提出和验证了一个基于深度学习的肿瘤原发部位预测模型，为CUP的诊断和治疗提供了新的思路和方法，也为人工智能在医疗诊断中的应用提供了一项重要的案例。