关于TYG-ABSI指数与卒中关联性及预测价值的学术研究报告
本研究由来自中国医学科学院北京协和医学院中日友好医院的Hanlin Liu、中日友好医院神经外科的Mingxiao Li、Jiang Liu(通讯作者),以及中日友好医院临床医学研究所的Ziyi Zhang、Yu Duan、Ke Yang共同完成。研究成果以题为《The value of triglyceride‑glucose‑body shape index (TYG‑ABSI) in evaluating stroke: a multi‑centre cross‑sectional study》的论文形式,发表于European Journal of Medical Research期刊(2026年卷31期,第515页)。该研究是一项多中心横断面研究,旨在探索一种新型复合指数——甘油三酯-葡萄糖-身体形态指数(Triglyceride-Glucose-Body Shape Index, TYG-ABSI)与卒中患病率之间的关联,并评估其在识别卒中风险中的价值。
一、 学术背景与研究目的
本研究的科学领域聚焦于心血管疾病流行病学与预防医学,特别是卒中的风险预测指标开发。卒中(中风)是全球范围内致残和致死的第二大原因,其发生发展与多种代谢性风险因素密切相关,包括胰岛素抵抗(Insulin Resistance, IR)、肥胖(尤其是中心性肥胖)和血脂异常等。传统的肥胖指标,如身体质量指数(Body Mass Index, BMI),无法有效区分脂肪分布,且存在“肥胖悖论”现象。为此,身体形态指数(A Body Shape Index, ABSI)被提出,它结合了腰围、BMI和身高,能更好地反映身体脂肪分布,且不受肥胖悖论影响。同时,胰岛素抵抗是动脉粥样硬化和卒中的重要驱动因素。高胰岛素-正葡萄糖钳夹技术是评估IR的金标准,但操作复杂、成本高昂,不适用于大规模临床筛查。甘油三酯-葡萄糖指数(Triglyceride-Glucose Index, TYG)已被证实是IR的可靠替代标志物。
近年来,越来越多的研究关注TYG指数及其与肥胖指标(如BMI、腰围)的复合指标对心脑血管疾病的预测价值。然而,截至本研究进行时,尚无研究探讨将TYG指数与ABSI相乘得到的复合指数——TYG-ABSI与卒中之间的关系。因此,本研究旨在填补这一空白,利用来自美国和中国的两个大型国家级代表性数据库,评估TYG-ABSI与卒中患病率的关联,并进一步开发机器学习模型来评估该指数在识别卒中方面的能力,从而为改善公共卫生管理策略提供证据。
二、 详细研究流程
本研究是一项严谨的横断面分析,流程清晰,包含以下几个核心步骤:
1. 研究设计与人群纳入: 研究采用了两个独立的大型数据库:美国的国家健康与营养调查(National Health and Nutrition Examination Survey, NHANES,2007-2018周期)和中国的中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS,2015-2016年)。初始纳入样本量分别为59,842人(NHANES)和21,907人(CHARLS)。研究设定了明确的排除标准:对于NHANES,排除年龄<20岁、卒中数据缺失、以及空腹血糖(FPG)、甘油三酯(TG)、BMI、腰围(WC)数据缺失的参与者;对于CHARLS,排除年龄<45岁或年龄数据缺失、卒中数据缺失、以及TYG、BMI、WC数据缺失的参与者。最终,共有14,394名美国参与者和10,869名中国参与者被纳入最终分析。卒中的判定基于参与者自我报告的医生诊断。
2. 核心指标计算与协变量收集: 本研究的主要暴露变量是TYG-ABSI指数。其计算分两步进行:首先,计算TYG指数,公式为 Ln[TG (mg/dL) × FPG (mg/dL) / 2];其次,计算ABSI指数,公式为 WC (m) / (BMI^(2⁄3) × Height^(1⁄2) [m]);最后,TYG-ABSI = TYG × ABSI。所有参与者根据TYG-ABSI的四分位数进行分层(Q1-Q4)。 研究收集了广泛的协变量以控制混杂因素,包括:人口统计学数据(年龄、性别、种族/民族、教育、婚姻状况、家庭收入贫困比PIR)、体格检查数据(BMI、WC、体重、身高)、健康状况(高血压、糖尿病、冠心病/心脏病、运动、饮酒、吸烟状况)以及实验室检测数据(总胆固醇TC、高密度脂蛋白胆固醇HDL、低密度脂蛋白胆固醇LDL、TG、FPG、糖化血红蛋白HbA1c等)。这些变量在两个数据库中尽可能保持一致地提取。
3. 统计分析方法: * 基线特征描述:按TYG-ABSI四分位数分组描述参与者特征,连续变量以均值±标准差表示,分类变量以百分比表示。所有分析均使用了复杂的抽样权重以确保对总体人群的代表性估计。 * 关联性分析:采用多变量逻辑回归评估TYG-ABSI(作为连续变量和分类变量)与卒中患病率之间的关联。构建了三个逐步调整的模型:模型1未调整;模型2调整了年龄、性别、种族/民族和BMI;模型3进一步调整了教育、婚姻状况、吸烟、饮酒、高血压、糖尿病、冠心病/心脏病和TC水平。 * 亚组分析与非线性探索:在模型3的基础上,按性别、年龄(<60岁 vs ≥60岁)、高血压状态等因素进行亚组分析,并检验交互作用。使用限制性立方样条(Restricted Cubic Spline, RCS)回归和阈值效应分析探索TYG-ABSI与卒中之间是否存在非线性关系。 * 特征选择与机器学习建模:为构建预测模型,首先通过Pearson相关分析剔除与卒中无显著相关的变量。随后,使用Boruta算法进行特征选择,以确定用于模型构建的最相关特征集。为确保TYG-ABSI的独立贡献,在最终模型中排除了其组成部分TYG和ABSI。将数据集按7:3随机分为训练集和测试集。使用十折交叉验证训练了七种常见的机器学习模型:K-最近邻(KNN)、梯度提升机(Gradient Boosting Machine, GBM)、支持向量机(SVM)、神经网络(NN)、随机森林(RF)、极限梯度提升(XGBoost)和自适应提升(AdaBoost)。通过受试者工作特征曲线下面积(Area Under the Curve, AUC)评估模型性能。 * 模型解释:对表现最佳的模型,应用SHAP(SHapley Additive exPlanations)算法来可视化和解释各个特征对模型预测结果的重要性贡献。
三、 主要研究结果
1. 基线特征: 在NHANES队列中,参与者平均年龄47.73岁,卒中患病率为2.8%。在CHARLS队列中,参与者平均年龄更高(61.76岁),卒中患病率为3.6%。在两个队列中,TYG-ABSI值较高的个体(Q4组)倾向于年龄更大、教育水平更低,并且糖尿病、高血压、冠心病等合并症患病率更高,血脂和血糖指标也更差。这初步提示TYG-ABSI可能与不良健康状况相关。
2. TYG-ABSI与卒中的关联: 在多变量逻辑回归分析中,TYG-ABSI作为连续变量与卒中患病率呈显著正相关。在完全调整的模型3中,NHANES队列的比值比(Odds Ratio, OR)为1.186(95% CI: 1.027–1.370),意味着TYG-ABSI每增加0.1个单位,卒中患病优势增加18.6%;CHARLS队列的OR为1.189(95% CI: 1.058–1.336)。当按四分位数分析时,NHANES队列中这种正相关趋势依然显著(趋势P值<0.05),最高四分位数(Q4)的参与者比最低四分位数(Q1)的卒中患病优势高出57.1%(OR=1.571)。在CHARLS队列中,按四分位数分组后,模型3中的关联未达到统计学显著性。
3. 亚组分析结果: 在NHANES队列中,亚组分析发现年龄和高血压状态与TYG-ABSI对卒中的影响存在显著的交互作用。具体而言,在年龄<60岁的非老年人群中,TYG-ABSI每增加0.1个单位,卒中患病优势增加32%(OR=1.32, 95% CI: 1.03–1.70);而在≥60岁人群中,关联不显著。同样,在非高血压人群中观察到显著的正相关(OR=1.32),而在高血压人群中未观察到显著关联。这表明TYG-ABSI作为卒中风险标志物在相对年轻、尚未发生高血压的群体中可能更具鉴别力。在CHARLS队列中,未发现显著的交互作用。
4. 非线性关系分析: RCS回归分析显示,在两个队列中,TYG-ABSI与卒中患病率之间均呈线性关系(非线性P值>0.05),阈值效应分析也未发现显著的转折点。这支持了TYG-ABSI与卒中风险之间存在稳定的剂量-反应关系。
5. 机器学习模型性能与解释: 经过特征选择,最终分别使用23个(NHANES)和24个(CHARLS)变量构建模型。在七种机器学习模型中,梯度提升机(GBM)在两个队列中均表现最佳,其在NHANES测试集上的AUC为0.784(95% CI: 0.751–0.817),在CHARLS测试集上的AUC为0.651(95% CI: 0.604–0.699)。SHAP分析显示,在两个队列的GBM模型中,TYG-ABSI都对模型预测卒中做出了正向贡献,即更高的TYG-ABSI值倾向于被模型识别为卒中风险更高。值得注意的是,在整体模型性能较弱的CHARLS队列中,TYG-ABSI的特征重要性排名反而更高,这可能是因为该队列中其他强预测变量(如某些社会经济指标)的缺失,使得模型更依赖于TYG-ABSI。
四、 研究结论与价值
本研究得出结论:升高的TYG-ABSI指数与美国和中国人群的卒中患病率呈正相关。基于此关联构建的机器学习模型(特别是GBM模型)显示出对卒中具有一定的识别能力。这确立了TYG-ABSI作为一个与卒中显著相关的、具有潜在实用价值的指标。
其科学价值在于:首次系统性地提出并验证了将反映胰岛素抵抗的TYG指数与反映中心性肥胖的ABSI指数相乘所得的复合指标(TYG-ABSI)与卒中的关联。该指标整合了代谢异常和体脂分布异常两个独立的病理生理维度,可能比单一指标提供更全面的风险评估。研究采用了两个大型、具有国家代表性的独立队列进行验证,增强了结论的可靠性和普适性。此外,研究不仅进行了传统的流行病学关联分析,还引入了机器学习方法进行模型构建和特征重要性解读,为未来开发基于多指标的风险预测工具提供了方法学参考。
应用价值体现在:TYG-ABSI的计算仅需常规体检中的腰围、身高、体重、空腹甘油三酯和空腹血糖数据,简单、经济、易于获取,非常适合在基层医疗和资源有限的环境中用于大规模卒中风险初筛,有助于早期识别高危个体,从而指导针对性的生活方式干预或进一步临床检查,对公共卫生预防策略的制定具有积极意义。
五、 研究亮点
六、 其他有价值的内容
研究也坦诚地指出了其局限性:首先,横断面设计无法确定TYG-ABSI与卒中之间的因果关系,需要前瞻性队列研究进一步验证。其次,卒中诊断基于自我报告,可能存在误报或漏报,且未区分卒中亚型(如缺血性、出血性)。第三,研究未将ABSI与传统中心性肥胖指标(如腰围、腰高比)在复合指数中的表现进行直接比较。最后,由于数据集中卒中阳性结局的患病率较低,所有机器学习模型的性能指标(AUC)均处于中等水平,SHAP分析也显示TYG-ABSI的贡献度有限,这些发现需要在更大、更多样化的队列中进行验证。
尽管如此,这项研究为利用简单、易得的临床指标进行心血管疾病风险分层提供了新的证据和思路,强调了综合管理血糖、血脂和体脂分布对于卒中预防的重要性。