基于深度学习多模态MRI影像组学与病理组学数据预测原发性前列腺癌骨转移

分享自：
基于深度学习多模态MRI影像组学与病理组学数据预测原发性前列腺癌骨转移

影像医学与核医学
信息科学
期刊:journal of cancer research and clinical oncologyDOI:10.1007/s00432-023-05574-5
【点击此处】阅读全文、收藏及针对性提问
本研究是一项单篇原创性研究。以下是根据要求撰写的详细学术报告：
关于深度学习算法融合多模态MRI影像组学与病理组学数据提升原发性前列腺癌骨转移预测的研究报告
一、 研究团队与发表信息
本研究由来自中国多个机构的学者合作完成。主要作者包括 Yun-Feng Zhang（第一临床医学院，甘肃中医药大学）、Chuan Zhou（第一临床医学院，兰州大学）、Sheng Guo、Chao Wang、Jin Yang、Zhi-Jun Yang、Rong Wang、Xu Zhang，以及通讯作者 Feng-Hai Zhou（第一临床医学院，甘肃中医药大学与兰州大学；泌尿外科，甘肃省人民医院）。本研究于2024年2月5日在线发表于学术期刊《journal of cancer research and clinical oncology》2024年第150卷第78期。
二、 学术背景与研究目的
本研究属于医学人工智能交叉领域，具体聚焦于利用人工智能方法，特别是深度学习（Deep Learning， DL）和机器学习（Machine Learning， ML），在肿瘤学（具体为前列腺癌）中进行预后预测。
研究背景： 前列腺癌（Prostate Cancer， PCA）是男性最常见的恶性肿瘤之一，也是导致男性癌症死亡的主要原因之一。骨转移是晚期前列腺癌常见的严重后果，显著增加了患者的发病率和死亡率。然而，骨转移早期起病隐匿，缺乏典型临床表现，其早期诊断极具挑战性。目前，全身骨扫描是检测前列腺癌骨转移的主要影像学方法，但其应用缺乏统一标准，且通常依赖临床症状及前列腺特异性抗原（Prostate Specific Antigen, PSA）、格里森评分（Gleason Score, GS）等临床指标进行预判，这些指标的敏感性和特异性均不理想。因此，迫切需要探索更有效、更精准的早期预测指标。
近年来，人工智能技术在医学研究中得到广泛应用。影像组学（Radiomics）通过从医学图像中高通量提取定量特征，能够无创地表征病变区域的异质性。病理组学（Pathomics）则通过数字化和自动化分析组织病理切片图像，提取细胞和组织微环境层面的定量信息。深度学习作为机器学习的前沿分支，能够自动从数据中学习和提取复杂的高维特征。已有研究证明，结合临床指标的影像组学模型能有效预测前列腺癌骨转移，但通过融合来自不同数据源（如不同模态影像和病理图像）的特征组合方法进行早期预测的潜力尚未被充分探索。
研究目的： 本研究旨在提出并验证一种整合多模态数据（多序列MRI影像和病理图像）的方法，通过融合影像组学特征、深度学习迁移学习（Deep Transfer Learning, DTL）特征以及病理组学特征，构建一个联合预测模型，以期提高对原发性前列腺癌患者发生骨转移风险的早期预测能力，从而为临床诊疗决策提供更精准的指导。
三、 详细研究流程与方法
本研究是一项回顾性队列研究，其工作流程系统而严谨，主要包括以下几个核心步骤：
1. 研究对象入组与数据准备： 研究纳入了2017年1月至2023年2月期间在甘肃省人民医院确诊为前列腺癌的211名患者。所有患者根据全身骨扫描结果被分为骨转移组（106例）和非骨转移组（105例）。为确保数据质量，制定了严格的纳入与排除标准：纳入标准包括初次病理确诊为前列腺癌、诊断后30天内进行盆腔MRI扫描、无原发性骨盆骨疾病、预后信息完整、骨扫描信息无缺失、拥有病理组织切片等；排除标准包括MRI图像质量差无法准确定位肿瘤、MRI前接受过化疗或放疗、病理切片染色不均或质量差、病灶边界不清以及临床信息不完整。最终，研究者将211名患者按8:2的比例随机分为训练组（169例）和验证组（42例），以用于后续模型的构建与评估。
2. 多模态数据采集与感兴趣区域分割： 研究采集了两种类型的数据：医学影像数据和病理图像数据。 * 医学影像数据： 从每位患者的三种磁共振成像序列中提取信息，包括T2加权成像、扩散加权成像和表观扩散系数图。由一位经验丰富的放射科医生和一位资深泌尿科医生在不知晓骨转移状态的情况下，使用ITK-SNAP软件独立地对每个序列图像上的前列腺肿瘤区域进行手动勾画，划定感兴趣区域。对于有分歧的病例，通过讨论达成共识。所有图像在分割前均进行了N4偏置场校正，并将DICOM格式的图像重采样至1mm×1mm×1mm的标准分辨率。 * 病理图像数据： 回顾性收集了患者的苏木精-伊红染色病理切片。从中选择典型的20×10倍放大的前列腺癌区域，使用裁剪工具去除白背景后，分割成多个小块。为确保一致性，这些JPG格式的图像块进行了像素标准化，并重采样至统一的448×448分辨率，以备特征提取。
3. 特征提取： 本研究使用了三种不同的特征提取策略，构成了多模态特征集。 * 影像组学特征提取： 使用开源的PyRadiomics软件包，从上述勾画好的三维感兴趣区域中，自动提取了大量定量影像特征，共计2553个。这些特征涵盖了肿瘤的形态、纹理、强度统计等信息。 * 深度学习迁移学习特征提取： 采用预训练的ResNet50深度卷积神经网络模型。该模型在大型图像数据集（如ImageNet）上已进行了训练，能够提取具有高度判别性的通用图像特征。研究者利用ResNet50的非任务特定层（avgpool层），从相同的MRI图像感兴趣区域中提取深度特征，初始获得6144个特征，经处理后保留3379个有效DTL特征。 * 病理组学特征提取： 同样使用预训练的深度学习模型（文中未指明具体模型，但从方法推断类似），从每个标准化的病理图像小块中提取了2048个深度特征。然后，对每位患者所有病理图像小块的特征进行平均，得到代表该患者的病理组学特征向量。
4. 特征选择与特征标签构建： 面对提取出的高维度特征（总计近8000个），必须进行降维和筛选，以避免过拟合并找到最具预测价值的特征。流程如下： * 数据标准化： 首先使用Z-score方法对所有特征进行标准化处理。 * 特征可靠性评估： 使用斯皮尔曼相关系数评估特征提取的观察者间一致性，保留相关系数高于0.9的可靠特征。 * 特征筛选： 采用最小绝对收缩和选择算子回归方法进行特征选择。该方法通过引入L1正则化惩罚项，能够将大量不相关或冗余特征的系数压缩至零，从而自动选择出对预测目标最重要的特征。研究者使用五折交叉验证在训练集上确定最优的超参数（λ值），最终分别从影像组学、DTL和病理组学特征中筛选出44个、23个和13个与骨转移密切相关的非零系数特征，并基于这些特征构建了各自的“特征标签”。
5. 预测模型构建与评估： 利用筛选出的特征，研究者使用了多种机器学习分类器来构建和比较预测模型的性能。这些分类器包括逻辑回归、支持向量机、朴素贝叶斯、极端梯度提升、多层感知器、K近邻、极端随机树、轻量梯度提升机和梯度提升机。 * 模型性能评估指标： 主要使用受试者工作特征曲线及其曲线下面积来量化模型的区分度。AUC值越接近1，说明模型区分骨转移与非骨转移患者的能力越强。 * 模型临床效用与拟合优度评估： 此外，还使用了决策曲线分析来评估模型在不同阈值概率下的净临床收益，并使用校准曲线来评估模型预测概率与实际发生概率之间的一致性（即拟合优度）。 * 联合模型与列线图开发： 为了整合所有有效信息，研究者进一步将筛选出的多模态特征与临床独立风险因素相结合，通过多因素逻辑回归分析构建了一个联合预测模型，并将其可视化呈现为列线图，便于临床医生直接使用。
6. 统计分析： 研究使用SPSS 23.0和R统计软件进行分析。计量资料根据是否符合正态分布，分别采用均值±标准差或中位数表示，组间比较采用独立样本t检验或曼-惠特尼U检验。使用多因素逻辑回归识别独立预测因子。以P值小于0.05为具有统计学意义。
四、 主要研究结果
1. 临床特征基线： 训练组与验证组患者的年龄、格里森评分、PSA、身体质量指数、碱性磷酸酶与白蛋白比值等临床特征均无统计学显著差异，表明两组人群具有可比性，分组是合理的。
2. 单一模态模型的预测性能： 在验证集上，基于不同特征构建的最佳单一模型表现出了良好的预测能力。 * 基于传统影像组学特征的模型： 最佳预测模型为支持向量机模型，其AUC值为0.86。 * 基于深度学习迁移学习特征的模型： 最佳预测模型为逻辑回归模型，其AUC值达到了0.89。 * 基于病理组学特征的模型： 最佳预测模型为朴素贝叶斯模型，其AUC值为0.85。 这些结果证实，无论是从MRI图像中提取的定量影像特征、深度学习深度特征，还是从病理切片中提取的深度特征，均能有效捕捉与前列腺癌骨转移相关的信息，并构建出具有较高区分度的预测模型。其中，基于ResNet50提取的DTL特征模型表现最佳，AUC为0.89。
3. 多模态融合模型的卓越性能： 本研究最重要的发现在于多模态融合带来的性能提升。当研究者将筛选出的影像组学特征、DTL特征和病理组学特征结合，并使用支持向量机构建联合模型时，预测性能得到了显著增强。该联合模型在验证集上的AUC值高达0.93，明显优于任何一个单一模态模型。这一结果在逻辑上清晰表明：不同来源、不同层次的特征（宏观影像纹理、深度学习抽象特征、微观病理形态）提供了互补性的信息。将它们整合在一起，能够更全面、更深刻地描绘肿瘤的生物学行为，从而实现对骨转移风险更精准的预测。
4. 模型临床实用性与稳健性验证： * 决策曲线分析： DCA曲线显示，基于DTL特征的模型以及最终的联合模型在较宽的概率阈值范围内，相比“全部治疗”或“全部不治疗”的策略，都能提供更优的净临床收益。这意味着使用这些模型来指导临床决策，能够使患者在避免不必要检查或治疗的同时，最大化获益。 * 校准曲线： 所有模型的校准曲线都显示出良好的拟合度，尤其是联合模型的预测概率与实际观察到的骨转移发生率最为接近，表明模型预测结果可靠。 * 列线图： 最终开发的整合了多组学特征的列线图，将复杂的数学模型转化为直观的评分工具，便于临床医生个体化地评估患者发生骨转移的风险概率。
五、 研究结论与意义
结论： 本研究成功开发并验证了基于深度学习算法提取的多模态影像组学与病理组学模型。研究表明，融合了MRI影像组学特征、深度学习迁移学习特征以及病理组学特征的联合模型，能够显著提高对原发性前列腺癌患者发生骨转移风险的早期预测准确性。该模型具有良好的区分度、校准度和临床净收益。
意义与价值： * 科学价值： 本研究为肿瘤预后预测研究提供了一个成功的多模态数据融合范式。它证明了整合放射学图像与病理学图像的深度特征，能够产生“1+1+1>3”的协同效应，深化了对疾病表型的理解。这推动了影像组学和病理组学从单一模态分析向多模态整合分析的发展。 * 应用价值： 研究成果具有明确的临床转化潜力。所构建的预测模型和列线图工具，有望辅助临床医生在早期、无创或微创的条件下，更准确地识别出高骨转移风险的前列腺癌患者。这有助于实现治疗方案的个性化制定，例如对高危患者进行更密切的随访或更积极的早期干预，而对低危患者则可避免过度检查与治疗，从而实现精准医疗，最终改善患者预后。
六、 研究亮点
多模态深度融合的创新性： 本研究的核心亮点在于系统性整合了多序列MRI的影像组学特征、基于深度学习的MRI迁移学习特征以及数字病理的病理组学特征，构建了一个统一的多组学预测框架。这种跨尺度、跨模态的信息融合策略具有显著的创新性。
预测性能的显著提升： 联合模型取得了AUC 0.93的优异预测性能，显著超越了仅基于单一数据源的模型。这一结果强有力地证明了多模态融合策略在提升预测准确性方面的巨大优势。
严谨的方法学设计： 研究流程完整且严谨，涵盖了从患者入组、数据预处理、多维度特征提取与筛选、多种机器学习模型构建与比较，到全面的模型评估（区分度、校准度、临床效用）以及最终可视化工具（列线图）开发的全链条，体现了较高的方法学质量。
前沿技术的应用： 研究不仅使用了传统的影像组学，还引入了基于ResNet50的深度学习迁移学习，能够自动捕捉人眼难以识别的复杂图像模式，代表了当前医学人工智能分析的前沿方向。
七、 其他有价值的内容
研究者在讨论部分也坦诚指出了本研究的局限性： 1. 样本局限性与泛化能力： 研究为单中心回顾性设计，样本量相对有限（211例），且患者主要来自同一省份，这可能限制了模型的普适性。作者计划通过收集多中心、更大样本量的数据来进一步验证和优化模型。 2. 病理数据处理的限制： 由于无法获得全切片图像的精细标注，本研究仅选取了典型的肿瘤区域进行病理特征提取，可能未能充分利用整个切片的全部信息。作者表示未来将收集全切片图像数据进行更全面的分析。
尽管存在这些局限性，但本研究构建的模型已显示出卓越的预测潜力。作者强调，随着深度学习算法的迭代更新和更多数据的纳入，他们将持续优化模型，最终目标是为临床医生提供更精准的决策支持，使患者最大程度获益。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问