本研究由来自成都中医药大学(Chengdu University of Traditional Chinese Medicine)眉山医院以及针灸推拿学院的研究者何悦祎、刘畅、曹普化、闫毕兴、赵羚、谢小龙、方蔚共同完成,并以题为《Predictive value of cholesterol, high-density lipoprotein, and glucose index-obesity-derived index for stroke: a cohort study》的论文形式,在2026年发表于学术期刊《Lipids in Health and Disease》。这是一个预印本的未编辑版本,为读者提供了早期访问研究发现的渠道。
从学术背景来看,本研究属于心血管疾病流行病学及预防医学领域,重点关注脑卒中(中风)的风险预测。脑卒中作为一种具有高死亡率和高致残率的严重脑血管事件,给全球尤其是中国带来了巨大的健康负担。因此,开发高效、便捷的风险评估工具对于实现精准预防、降低疾病负担至关重要。目前,将反映代谢异常的生化标志物与反映脂肪分布的人体测量学参数相结合,已成为优化疾病预测的主流趋势。胰岛素抵抗(Insulin Resistance, IR)是脑卒中的一个独立危险因素,除传统评估方法外,基于常规检测的替代性IR指标,如甘油三酯-葡萄糖指数(Triglyceride-glucose index, TyG)已得到广泛应用。然而,近年来由Mansoori等人提出的胆固醇-高密度脂蛋白-葡萄糖指数(Cholesterol, high-density lipoprotein, and glucose index, CHG)在预测2型糖尿病风险方面显示出优于TyG指数的潜力,并与多种心血管疾病风险独立相关。另一方面,肥胖,特别是中心性肥胖,是另一个重要的脑卒中危险因素。除了传统的体质指数(Body Mass Index, BMI)和腰围(Waist Circumference, WC),一些新型指标如中国内脏脂肪指数(Chinese Visceral Adiposity Index, CVAI)、身体形态指数(A Body Shape Index, ABSI)等,能更准确地反映内脏脂肪分布及其健康影响。尽管结合血糖/血脂标志物与肥胖指标能更有效地评估疾病风险,但尚无研究系统性地探讨CHG指数与各类经典及新型肥胖指标结合后对脑卒中风险的预测价值。因此,本研究旨在利用中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)的前瞻性队列数据,评估一系列CHG-肥胖衍生指标在中国中老年人群中预测脑卒中事件的能力,并将其与TyG指数及其衍生指标进行比较。研究假设是,将CHG与肥胖指标结合,能够协同捕捉与代谢异常和体脂分布相关的风险信息,从而提升脑卒中风险的预测效能。本研究的新颖性在于,首次在全国性前瞻性队列中系统构建并比较了CHG-肥胖衍生指标对脑卒中的预测能力,并考察了其累积暴露水平和纵向轨迹。
接下来,我将详细阐述本研究的工作流程。本研究是一项基于CHARLS数据库的全国性前瞻性队列研究。CHARLS是一项旨在追踪中国中老年人健康与社会经济状况的大型纵向研究,基线调查于2011-2012年完成,并于2013、2015、2018及2020年进行了后续随访。本研究的工作流程主要包括以下几个步骤:
第一步:研究参与者筛选与队列构建。 研究者制定了清晰的参与者筛选流程。首先,以2011年为基线,排除了年龄小于45岁、核心暴露指标数据缺失以及在基线时已确诊脑卒中的个体。随后,为了进行累积暴露分析和纵向轨迹识别,进一步排除了截至2015年随访时已发生脑卒中结局,或在2015年暴露变量数据缺失的个体。最终,本研究纳入了至少完成一次随访且暴露信息完整的参与者,共7905名。在累积暴露分析中,纳入了具有2011年和2015年两个时间点测量数据的4544名参与者。整个筛选过程确保了研究对象的代表性和数据分析的可行性。
第二步:暴露指标的定义与计算。 本研究关注的核心暴露指标是基于CHG指数与七种不同肥胖指标组合而成的复合指数。所有指标的计算均基于空腹静脉血生化参数和人体测量数据。CHG指数的计算公式为:ln[总胆固醇(TC, mg/dL) × 空腹血糖(FBG, mg/dL) / 2 × 高密度脂蛋白胆固醇(HDL-C, mg/dL)]。所涉及的肥胖指标包括:体质指数(BMI)、腰围(WC)、腰高比(Waist-to-height ratio, WHtR)、体重调整腰围指数(Weight-adjusted waist index, WWI)、身体圆度指数(Body Roundness Index, BRI)、身体形态指数(ABSI)以及中国内脏脂肪指数(CVAI)。通过将CHG指数与上述每个肥胖指标相乘,研究者构建了七个复合暴露指标:CHG-BMI、CHG-WC、CHG-WHtR、CHG-BRI、CHG-WWI、CHG-CVAI和CHG-ABSI。作为比较基准,研究也计算了TyG指数及其与相同肥胖指标组合的衍生指标。
第三步:结局与协变量的定义与收集。 研究的主要结局是新发脑卒中,定义为参与者在2013、2015、2018或2020年任何一次随访访谈中首次自我报告的、经医生确诊的脑卒中诊断。为了控制潜在混杂因素的影响,研究者从CHARLS基线数据中提取了涵盖人口统计学特征、生活方式与行为因素、病史与健康状况、人体测量指标以及实验室检查结果等五大类别的广泛协变量。此外,使用CKD-EPI 2009公式估算了肾小球滤过率(eGFR)。对于协变量中的缺失数据,采用了迭代优化预测均值匹配法进行多重填补,前提是缺失比例低于30%。
第四步:特征选择与模型构建。 为了平衡模型的预测性能与流行病学可靠性,本研究采用了结合先验知识与数据驱动方法的策略进行协变量筛选。流程包括三个步骤:首先,对所有候选协变量进行单变量逻辑回归分析,保留与脑卒中结局显著相关(p < 0.05)的变量。其次,应用Boruta算法和递归特征消除(Recursive Feature Elimination, RFE)对初始变量进行重要性排序和选择,并结合已知的脑卒中风险因素(年龄、性别、吸烟、饮酒、心脏病史)。两种方法识别出的重要性重叠的变量被保留。最后,检查最终变量集中的多重共线性,若任意两个变量间的皮尔逊相关系数绝对值大于0.6,则剔除临床意义相对较弱的变量,以确保模型稳定性。经过筛选,最终模型纳入了12个变量:年龄、性别、吸烟、饮酒、心脏病史、体重、收缩压(SBP)、C反应蛋白(CRP)、高密度脂蛋白胆固醇(HDL-C)、肌酐(Cr)、糖化血红蛋白(HbA1c)和估算肾小球滤过率(eGFR)。
第五步:统计分析与结果验证。 研究在Python环境中进行所有计算分析。主要分析内容包括:1) 预测性能评估与比较:构建仅包含最终选定协变量的“基线”逻辑回归模型,然后依次将CHG指数及其各衍生指标单独加入基线模型,生成一系列新模型。通过绘制受试者工作特征(Receiver Operating Characteristic, ROC)曲线,计算曲线下面积(Area Under the Curve, AUC)作为判别指标,并使用DeLong检验进行AUC值的两两比较。此外,计算净重分类改善(Net Reclassification Improvement, NRI)和综合判别改善(Integrated Discriminant Improvement, IDI)来评估新指标在风险重分类和整体判别能力方面的增量价值。为增强各指标的可比性,在性能预测前对CHG、TyG及其衍生指标进行了Z-score标准化。2) 关联性分析:使用多变量逻辑回归模型,以分层方式(未调整模型、部分调整模型、完全调整模型)评估表现最佳的CHG衍生指标与脑卒中发病率的关系。3) 累积暴露与纵向轨迹分析:利用2011年和2015年的测量数据,计算CHG-CVAI和CHG-WC的累积暴露值。使用k-means聚类算法(结合肘部法则和临床可解释性确定聚类数量)对这两个指标的纵向轨迹进行无监督分类,识别出具有不同动态演变特征的亚组,并比较不同轨迹亚组间的结局风险差异。研究者解释,由于本研究仅包含两个时间点的重复测量数据,k-means算法在实现分类目标上比需要至少三个时间点的基于组的轨迹建模(Group-Based Trajectory Modeling, GBTM)更合适、透明且可重复。4) 剂量-反应关系分析:使用限制性立方样条(Restricted Cubic Splines, RCS)模型探索预测指标与结局风险之间可能存在的非线性剂量-反应关系。为减少异常值影响,对连续变量进行了5%和95%分位数的缩尾处理。5) 亚组分析:按年龄、性别、高血压状态、糖尿病状态等参数进行亚组分析,并纳入交互项以评估效应异质性。6) 敏感性分析:为验证主要结果的稳定性,进行了四项敏感性检验,包括:在多重填补前对原始完整病例数据重新进行逻辑回归分析;使用Cox比例风险模型将脑卒中作为时间-事件数据重新评估关联性;排除在2020年随访期间发生结局的个体以检验关联一致性;在控制与研究指标重叠的协变量后,再次进行增量预测价值分析,确保预测价值未被不当调整或削弱。
现在,让我们详细探讨本研究的主要结果。研究发现,在7905名参与者平均随访期间,共有739人(9.3%)报告了新发脑卒中。基线特征比较显示,脑卒中组参与者年龄更大,收缩压、舒张压、空腹血糖、糖化血红蛋白、体重、BMI、腰围、总胆固醇、甘油三酯、低密度脂蛋白胆固醇、C反应蛋白水平显著更高,而高密度脂蛋白胆固醇水平和估算肾小球滤过率显著更低。高血压、糖尿病、心脏病和4期慢性肾脏病的比例也显著更高。
在预测性能评估方面,所有七个基于CHG的肥胖指标均显著增强了基线参考模型的预测能力。其中,CHG-CVAI和CHG-WC表现出最优的预测性能,两者的AUC值均为0.664(CHG-CVAI 95% CI: 0.658–0.668; CHG-WC 95% CI: 0.657–0.668)。它们的净重分类改善指数分别为0.125和0.139。更重要的是,当与TyG及其多种衍生指标进行比较时,CHG-CVAI和CHG-WC的预测价值均优于所有TyG相关指标。这表明,结合了胆固醇代谢信息(TC/HDL-C比值)的CHG指数,在与反映中心性肥胖的指标(CVAI或WC)整合后,产生了超越传统TyG组合的预测效能。
在关联性分析方面,多变量逻辑回归结果显示,CHG-CVAI和CHG-WC均与脑卒中风险呈正相关,并存在明显的剂量-反应关系。在完全调整了混杂因素后,与最低四分位数(Q1)的参与者相比,处于CHG-CVAI最高四分位数(Q4)的参与者发生脑卒中的风险增加了2.44倍(OR = 2.44, 95% CI: 1.66–3.60),连续变量的OR为1.30(95% CI: 1.13–1.49)。对于CHG-WC,Q4组的风险是Q1组的2.06倍(OR = 2.06, 95% CI: 1.43–2.95),连续变量的OR为1.21(95% CI: 1.01–1.44)。总体而言,CHG-CVAI显示出与脑卒中风险更强的关联。
在累积暴露与纵向轨迹分析方面,研究结果进一步支持了动态风险监测的价值。累积暴露回归分析表明,累积CHG-CVAI和累积CHG-WC均与脑卒中风险独立相关。通过k-means聚类,CHG-CVAI和CHG-WC的轨迹均被识别为三个具有临床意义的模式:持续低水平组、中等水平组和持续高水平组。持续高水平轨迹组的参与者具有更高的收缩压、糖化血红蛋白、C反应蛋白和体重,以及更高的心脏病患病率和吸烟饮酒比例。纵向轨迹逻辑回归结果显示,与持续低水平组相比,CHG-CVAI持续高水平组的脑卒中风险最高(OR = 1.98, 95% CI: 1.29–3.04),CHG-WC持续高水平组的风险也显著增高(OR = 1.75, 95% CI: 1.26–2.42)。这表明,指标水平的长期持续升高是未来脑卒中事件的强预测因子,强调了单一测量可能受短期波动影响,而纵向监测能更可靠地识别长期暴露于高风险代谢环境的个体。
在剂量-反应关系方面,限制性立方样条分析显示,在完全调整协变量后,无论是基线值还是累积暴露值,CHG-CVAI和CHG-WC与脑卒中风险之间均呈现线性剂量-反应关系(非线性P值 > 0.05),不存在明显的阈值效应。
在亚组分析方面,CHG-CVAI和CHG-WC与脑卒中风险的正相关关联在大多数亚组中保持一致。然而,交互作用分析揭示了显著的效应异质性:1) 年龄:CHG-CVAI的作用在<60岁人群中(OR = 1.49)比在≥60岁人群中(OR = 1.30)更显著(交互作用P=0.024)。2) 高血压状态:这是一个显著的效应修饰因素。在非高血压人群中,CHG-CVAI和CHG-WC均显示出显著的预测价值(OR分别为1.69和1.55),而在已确诊高血压的患者中,两者的关联均未达到统计学显著性。研究者解释,这可能是因为高血压本身带来的巨大风险稀释或掩盖了代谢-肥胖指标的附加风险,且高血压患者更可能接受医学管理,其代谢异常已得到部分控制。3) 糖尿病状态:在糖尿病患者中,两个指标与脑卒中风险均无显著关联。在其他亚组如性别、教育水平、吸烟/饮酒状态或不同心血管-肾脏-代谢(CKM)分期中,未观察到有意义的交互作用。
在敏感性分析方面,四项敏感性检验的结果均与主要分析高度一致,证实了研究发现的稳健性和可靠性。即使在考虑事件发生时间(Cox模型)、排除晚期事件、或避免过度调整(剔除构成指标成分的变量如HDL-C和体重)后,核心关联仍然稳定存在。
基于上述详尽的结果,本研究得出的主要结论是:在中国中老年人群中,CHG-CVAI和CHG-WC在所有基于CHG的肥胖衍生指标中,对脑卒中风险具有最优的预测能力。这两个指标与脑卒中发生呈正线性相关,其预测准确性超越了已建立的TyG相关指标。因此,在临床和社区环境中,监测并维持理想的CHG-CVAI或CHG-WC水平,有助于有效识别脑卒中高危个体,从而实现及时、有针对性的干预。这些发现支持将这两种简单、低成本的复合指标纳入常规健康评估,以加强脑卒中的一级预防。
本研究的科学价值与应用价值显著。在科学上,它首次系统验证了CHG指数与肥胖指标结合在预测脑卒中风险方面的协同效应,丰富了复合代谢指标在心血管风险评估领域的证据。研究揭示了CHG(整合了TC和HDL-C)比TyG(仅整合TG和FBG)在反映动脉粥样硬化脂质负担方面可能具有独特优势,当与中心性肥胖指标结合时能产生更强的预测力。在应用上,CHG-CVAI和CHG-WC的计算仅依赖于常规体检数据(血糖、血脂、腰围等),无需额外检测成本,具有良好的可及性和可推广性,尤其适合在资源有限的基层医疗和社区筛查场景中使用。研究强调的纵向监测价值,为从“静态快照”评估转向“动态管理”预防模式提供了新思路。
本研究的亮点突出表现在以下几个方面:第一,研究设计新颖:首次在全国性前瞻性队列(CHARLS)中,系统构建并比较了CHG与七种肥胖指标组合对脑卒中的预测价值,并与成熟的TyG衍生指标进行了直接对比。第二,方法学全面深入:采用了多维度分析框架,包括多变量调整模型、ROC/AUC/NRI/IDI增量预测评估、剂量-反应关系分析、纵向累积暴露计算以及k-means轨迹聚类分析,并对结论进行了多重敏感性验证,确保了结果的稳健可靠。第三,临床转化潜力明确:研究不仅证明了指标的有效性,更强调了其简洁性(易于计算)和动态监测价值,明确指出了在非高血压人群中进行“上游”精准筛查的适用性,为公共卫生实践提供了直接、可行的工具建议。
此外,研究者在讨论中也坦诚指出了本研究的若干局限性,包括观察性研究设计无法确证因果关系、脑卒中诊断依赖自我报告可能存在误分类、未区分卒中亚型、研究对象限于中国中老年人可能影响外推性、纵向轨迹分析仅基于两个时间点、以及未能纳入更详细的脂蛋白颗粒浓度等新型标志物进行验证和优化。这些局限性为未来更深入的研究指明了方向,例如在拥有更多随访波次和数据更丰富的队列中,应用更复杂的轨迹模型(如GBTM)进行验证,并探索将新指标整合进个性化风险分层模型的实用价值。