分享自:

基于机器学习的糖尿病合并肝癌患者TACE术后预后预测模型

期刊:Journal of Hepatocellular Carcinoma

基于机器学习的糖尿病合并肝细胞癌患者TACE术后预后预测模型研究

第一作者及机构
本研究的通讯作者为华中科技大学同济医学院附属协和医院放射科的Chuansheng Zheng和Huangxuan Zhao教授团队,合作单位包括中国人民解放军总医院第五医学中心、Auto Valley医院等多家医疗机构。论文于2025年1月21日发表于《Journal of Hepatocellular carcinoma》(2025年第12卷,77-91页)。


学术背景
肝细胞癌(Hepatocellular Carcinoma, HCC)是全球发病率和死亡率最高的癌症之一,而2型糖尿病(Type II Diabetes Mellitus, T2DM)被证实会显著增加HCC患者的死亡风险。经动脉化疗栓塞术(Transarterial Chemoembolization, TACE)是中期HCC的一线治疗手段,但糖尿病患者的预后较差,可能与肿瘤缺氧微环境促进血管新生有关。既往研究多关注单一预后因素,缺乏整合临床、影像和生化指标的综合性预测工具。因此,本研究旨在开发一种基于机器学习(Machine Learning, ML)的可解释模型,预测糖尿病合并HCC患者TACE术后1年、2年和3年生存率,以辅助临床决策。


研究流程
1. 研究设计与队列构建
- 数据来源:回顾性纳入2014年1月至2023年6月来自4个医疗中心的636例HCC合并T2DM患者,分为训练集(n=373)、内部验证集(n=166)和外部验证集(n=97)。
- 纳入标准:符合HCC病理或影像学诊断(CT/MRI/超声)、T2DM(基于美国糖尿病协会指南)、首次接受TACE治疗、Child-Pugh分级A或B级、ECOG评分0-1分。
- 排除标准:1型糖尿病、合并其他恶性肿瘤、术前接受系统治疗或失访。

  1. 特征选择与数据预处理

    • 初始变量:收集32项术前特征,包括临床指标(如年龄、BMI、糖尿病病程)、实验室参数(如AFP、HbA1c、血小板淋巴细胞比值PLR)和影像学特征(如肿瘤大小、门静脉癌栓PVTT)。
    • 特征筛选:通过Spearman相关性分析排除高共线性变量(如AST与ALT),采用Boruta算法筛选出13项关键特征(如BCLC分期、PVTT、二甲双胍使用情况等)。
    • 缺失值处理:使用随机森林方法(missForest)填补缺失数据。
  2. 模型开发与验证

    • 算法选择:比较5种机器学习模型——随机生存森林(RSF)、极限梯度提升(XGBoost)、梯度提升机(GBM)、Cox比例风险模型(CoxPH)和递归分割回归树(Rpart)。
    • 性能评估:通过C-index、受试者工作特征曲线下面积(AUC)和Brier评分评估模型区分度与校准度。
    • 可解释性分析:采用SHAP(Shapley Additive Explanations)方法解析RSF模型的预测逻辑,量化各特征对预后的贡献权重。
  3. 临床应用开发


主要结果
1. 模型性能
- RSF模型表现最优:在内部验证集中,1年、2年、3年生存预测的AUC分别为0.824、0.853和0.810;外部验证集AUC为0.862、0.815和0.798,显著优于其他模型(如CoxPH的AUC范围为0.736-0.849)。
- 校准性良好:校准曲线显示预测生存率与实际观察值高度一致(Brier评分<0.18)。

  1. 关键预后因素

    • SHAP分析揭示:BCLC分期(贡献权重最高)、PVTT、肿瘤大小、二甲双胍使用(保护性因素)和肝外转移是影响预后的核心变量。例如,BCLC-C期患者的死亡风险较A期高3.2倍(HR=3.2, 95%CI 2.1-4.8)。
  2. 临床工具验证

    • 示例病例中,模型对7个月生存患者的1年生存概率预测为0.35(实际死亡),而对42个月生存患者的预测概率为0.959(实际存活),验证了其临床实用性。

结论与价值
1. 科学意义
- 首次整合糖尿病相关指标(如HbA1c、二甲双胍)与HCC传统预后因素,构建了针对TACE术后糖尿病患者的专属预测模型,弥补了既往研究的空白。
- 通过SHAP方法实现模型可解释性,帮助临床医生理解预测逻辑并聚焦关键干预靶点(如血糖控制)。

  1. 应用价值
    • 在线工具可辅助制定个体化治疗方案:例如,对预测生存率低的患者优先考虑联合靶向治疗或免疫治疗。
    • 为糖尿病合并HCC的预后研究提供了标准化分析框架,未来可扩展至其他治疗方式(如肝切除或消融)。

研究亮点
1. 方法学创新
- 首次将RSF算法与SHAP解释性分析结合,解决了机器学习模型“黑箱”问题。
- 多中心外部验证增强了模型的普适性,避免单中心数据偏倚。

  1. 临床发现

    • 证实二甲双胍可能改善糖尿病合并HCC患者的生存(SHAP值排名第4),支持其作为辅助治疗的潜在价值。
    • 揭示PLR和NLR(炎症指标)对预后的独立预测作用,提示炎症微环境的重要性。
  2. 局限性

    • 回顾性研究可能存在选择偏倚,未来需前瞻性验证。
    • 未纳入病理或基因数据,可能遗漏分子层面的预后标志物。

其他价值
研究团队公开了数据共享途径(联系通讯作者hqzcsxh@sina.com),并声明遵循《赫尔辛基宣言》伦理准则(批准号UHCT-IEC-SOP-016-03-03),为后续研究提供了透明化范例。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com