基于机器学习的糖尿病合并肝细胞癌患者TACE术后预后预测模型研究
第一作者及机构
本研究的通讯作者为华中科技大学同济医学院附属协和医院放射科的Chuansheng Zheng和Huangxuan Zhao教授团队,合作单位包括中国人民解放军总医院第五医学中心、Auto Valley医院等多家医疗机构。论文于2025年1月21日发表于《Journal of Hepatocellular carcinoma》(2025年第12卷,77-91页)。
学术背景
肝细胞癌(Hepatocellular Carcinoma, HCC)是全球发病率和死亡率最高的癌症之一,而2型糖尿病(Type II Diabetes Mellitus, T2DM)被证实会显著增加HCC患者的死亡风险。经动脉化疗栓塞术(Transarterial Chemoembolization, TACE)是中期HCC的一线治疗手段,但糖尿病患者的预后较差,可能与肿瘤缺氧微环境促进血管新生有关。既往研究多关注单一预后因素,缺乏整合临床、影像和生化指标的综合性预测工具。因此,本研究旨在开发一种基于机器学习(Machine Learning, ML)的可解释模型,预测糖尿病合并HCC患者TACE术后1年、2年和3年生存率,以辅助临床决策。
研究流程
1. 研究设计与队列构建
- 数据来源:回顾性纳入2014年1月至2023年6月来自4个医疗中心的636例HCC合并T2DM患者,分为训练集(n=373)、内部验证集(n=166)和外部验证集(n=97)。
- 纳入标准:符合HCC病理或影像学诊断(CT/MRI/超声)、T2DM(基于美国糖尿病协会指南)、首次接受TACE治疗、Child-Pugh分级A或B级、ECOG评分0-1分。
- 排除标准:1型糖尿病、合并其他恶性肿瘤、术前接受系统治疗或失访。
特征选择与数据预处理
模型开发与验证
临床应用开发
主要结果
1. 模型性能
- RSF模型表现最优:在内部验证集中,1年、2年、3年生存预测的AUC分别为0.824、0.853和0.810;外部验证集AUC为0.862、0.815和0.798,显著优于其他模型(如CoxPH的AUC范围为0.736-0.849)。
- 校准性良好:校准曲线显示预测生存率与实际观察值高度一致(Brier评分<0.18)。
关键预后因素
临床工具验证
结论与价值
1. 科学意义
- 首次整合糖尿病相关指标(如HbA1c、二甲双胍)与HCC传统预后因素,构建了针对TACE术后糖尿病患者的专属预测模型,弥补了既往研究的空白。
- 通过SHAP方法实现模型可解释性,帮助临床医生理解预测逻辑并聚焦关键干预靶点(如血糖控制)。
研究亮点
1. 方法学创新
- 首次将RSF算法与SHAP解释性分析结合,解决了机器学习模型“黑箱”问题。
- 多中心外部验证增强了模型的普适性,避免单中心数据偏倚。
临床发现
局限性
其他价值
研究团队公开了数据共享途径(联系通讯作者hqzcsxh@sina.com),并声明遵循《赫尔辛基宣言》伦理准则(批准号UHCT-IEC-SOP-016-03-03),为后续研究提供了透明化范例。