基于大规模人群的肠道微生物组与健康及饮食关联性研究:ZOE微生物组健康排名2025的建立与验证
一、 研究团队与发表信息
本研究由Francesco Asnicar(第一作者及通讯作者)和Nicola Segata(通讯作者)领导,联合了意大利特伦托大学、英国ZOE有限公司、伦敦国王学院、欧洲肿瘤研究所等多个机构的科研人员共同完成。研究成果以“Gut micro-organisms associated with health, nutrition and dietary interventions”为题,于2025年12月10日在线发表,并正式刊登于2026年2月12日的《Nature》期刊第650卷。
二、 学术背景与研究目标
研究领域: 本研究属于人类微生物组学、营养学与代谢性疾病(特别是心脏代谢疾病)的交叉领域。
研究背景与动因: 心脏代谢疾病(Cardiometabolic diseases, CMDs)是全球发病率和死亡率上升的主要原因,不良饮食和肠道微生物组均被证实与之相关。然而,该领域缺乏大规模、全面的研究来探索这些关联,尤其是在多样化人群中进行。现有研究常受限于样本量小、统计效力不足、以及局限于特定地区的生活方式与饮食习惯,难以区分饮食对健康的影响中哪些是通过微生物组介导的。此外,人类肠道微生物组具有高度的个体差异性,且其中大量物种尚未被培养或表征,这使得定义“健康”的微生物组图谱变得困难。
研究目标: 本研究旨在通过整合大规模、多人群队列的宏基因组、饮食、人体测量学和宿主健康数据,系统性地识别与不同饮食模式和健康风险因素显著相关的肠道微生物物种。研究目标是建立一个能够反映微生物物种与宿主健康标志物关联性的排名系统,并利用独立的干预性临床试验和公开数据集验证该排名系统的可重复性和预测价值,从而为未来探索饮食、微生物组与健康之间因果关系的机制研究提供基础。
三、 详细研究流程
本研究是一个综合性的观察性与验证性研究,主要包含以下几个关键步骤:
1. 大规模队列数据整合与处理: * 研究对象与样本量: 研究核心数据来源于五个ZOE PREDICT前瞻性队列,共包含超过34,000名来自美国和英国的参与者。这些队列提供了详细的宏基因组测序数据、饮食记录(包括食物频率问卷和手机应用日志)、人体测量数据(如体重指数BMI)以及一系列宿主健康标志物数据。 * 数据处理: 收集了37个宿主标志物,并将其分为三类:(1) 个人/人体测量相关(如年龄、性别、BMI、血压、动脉粥样硬化性心血管疾病风险ASCVD);(2) 空腹代谢标志物(如血糖、糖化血红蛋白HbA1c、甘油三酯、胆固醇、高密度脂蛋白HDL);(3) 餐后代谢标志物。饮食数据则用于计算五个经过验证的饮食质量指数,如健康饮食指数和健康植物性饮食指数。所有肠道微生物样本使用统一流程进行DNA提取和宏基因组测序,并使用MetaPhlAn 4软件进行物种水平的基因组箱(Species-level Genome Bins, SGBs)分析,共鉴定出661个非稀有(流行率>20%)的微生物物种。
2. 微生物组与宿主表型关联分析及排名系统建立: * 关联分析: 研究采用机器学习(随机森林)模型评估了肠道微生物组组成与各类健康及饮食标志物之间的预测关联强度。结果显示,微生物组能够较好地预测血糖、胆固醇、甘油三酯、炎症等标志物,其预测性能(AUC或Spearman相关系数)在多个队列中保持一致。 * 排名计算(核心方法): 为了识别出与健康最相关(无论是正向还是负向)的具体微生物物种,研究团队开发了一种新颖的排名方法。对于每个队列中的每个SGB,计算其相对丰度与每个宿主健康标志物之间的偏Spearman相关系数(校正了性别、年龄和BMI)。根据标志物对健康的正负向意义,对相关系数进行排序并转换为百分位数(0到1之间)。然后,在三个健康标志物类别(个人、空腹、餐后)内平均每个SGB的百分位数,再在五个PREDICT队列间平均这些类别平均值,最终得到一个单一的排名,即“ZOE微生物组健康排名2025”(ZOE MB Health-Rank)。排名越接近0,表示该物种与更有利的健康标志物正相关;越接近1,则表示与不利标志物正相关。类似地,仅基于饮食质量指数,建立了“ZOE微生物组饮食排名2025”(ZOE MB Diet-Rank)。
3. 排名系统的验证与应用: * 验证一:与BMI的关联(横断面验证): 首先,在PREDICT内部验证排名与BMI的关系。结果显示,健康排名靠前的物种与BMI呈负相关,而排名靠后的物种与BMI呈正相关(平均Spearman ρ = 0.72)。这种关联在按BMI分类(健康体重、超重、肥胖)的人群中,通过分析前50名有利和不利物种的累积丰度或丰富度得到证实。 * 验证二:在独立公开队列中验证与BMI和疾病的关联: 为了评估排名的普适性,研究从公共数据库(CuratedMetagenomicData 3)中收集了27个独立队列的5,348名健康个体的数据,以及25个病例对照研究的4,816个样本(涉及结直肠癌CRC、炎症性肠病IBD、2型糖尿病T2D、糖耐量受损IGT和心血管疾病CVD)。Meta分析表明,在健康体重个体中,前50名有利物种的丰富度显著高于肥胖个体(平均多5.2个物种),而不利物种则相反。在疾病组中,对照组的有利物种丰富度高于病例组,不利物种则低于病例组。通过将排名整合成一个简单的样本健康评分(将样本中存在的所有SGB的标准化排名求和),能够有效区分病例与对照组,尤其是在T2D中表现出最强的关联。 * 验证三:在饮食干预试验中验证排名的预测性(纵向验证): 研究分析了两个独立的饮食干预临床试验(ZOE METHOD和ZOE BIOME,共746人)的数据。在旨在改善饮食质量的干预组(如个性化饮食计划或特定益生元混合物)中,干预后相对丰度显著增加的物种,其ZOE MB健康排名和饮食排名显著更有利;而显著减少的物种,其排名则更不利。在对照组或仅补充益生菌的组中未观察到这种显著模式。这直接证明了,基于横断面数据建立的排名能够预测在独立干预研究中因饮食改善而变化的微生物物种方向。
四、 主要研究结果
建立了可重复的微生物物种健康与饮食排名系统: 研究成功定义了包含661个肠道微生物物种的ZOE MB健康排名和饮食排名。排名显示,与有利健康标志物最相关的物种大多属于厚壁菌门(Firmicutes),特别是梭菌纲(Clostridia)。值得注意的是,排名最有利的50个物种中,有22个是完全未知的(仅由宏基因组重建),另外24个虽有分离株但缺乏表型描述和公认的学名,这凸显了我们对非疾病状态下“有益”微生物认知的巨大空白。相反,排名最不利的物种多为已知且有培养物的物种,其中一些(如Ruminococcus gnavus, Flavonifractor plautii)已有文献支持其与不良健康结局的关联。
健康排名与饮食排名高度一致但存在差异: 两个排名总体高度一致(Spearman’s ρ = 0.72),但仍有65个物种的排名存在显著差异(绝对差值≥0.3)。例如,Harryflintia acetispora与有利的心脏代谢标志物相关,却与不健康的饮食模式相关,这可能源于其能利用多种底物(包括不健康饮食来源的)但同时产生有益的代谢物(如短链脂肪酸)。
排名系统有效区分不同健康状态人群: 在内部和外部验证中,排名系统能稳健地区分不同BMI类别(健康体重、超重、肥胖)的人群。肥胖个体携带更多排名不利的物种,而健康体重个体携带更多排名有利的物种。这种关联在不同国家和队列中具有可重复性。
排名系统与疾病状态显著相关: 在涵盖CRC、IBD、T2D等多种疾病的公开病例对照研究中,对照组的有利物种丰富度和累积丰度均显著高于病例组,而不利物种则相反。通过排名计算的样本健康评分能有效区分病例与对照,其效果优于传统的α多样性指标(如物种丰富度、香农指数)。
排名系统可预测饮食干预引起的微生物组变化: 在两个饮食干预试验中,那些在干预后显著增加的物种,其健康与饮食排名显著更有利;而显著减少的物种排名则更不利。这为“饮食可通过改变微生物组来影响健康”这一假说提供了强有力的纵向证据,并表明这种变化是可预测和可重复的。
五、 研究结论与价值
结论: 本研究通过整合超34,000人的多组学数据,首次大规模、系统地建立了肠道微生物物种与宿主健康及饮食质量的关联性排名。该排名系统(ZOE MB Health-Rank 2025)不仅能够反映个体的心脏代谢风险(如BMI),还能在独立的公开队列中区分多种疾病状态,并成功预测了饮食干预试验中微生物组的变化方向。研究揭示了大量尚未被充分研究的微生物物种可能与健康促进密切相关。
科学价值: * 提供了标准化工具: 发布的排名为研究社区提供了一个公开可用的工具,用于评估特定肠道微生物样本在饮食和健康方面的特征。 * 指明了研究方向: 突出了对大量未知或未表征的“有益”微生物进行后续培养和功能研究的重要性。 * 连接了观察与干预: 将横断面观察性研究中发现的关联,在纵向干预性研究中得到了验证,加强了饮食-微生物组-健康轴之间关联的证据链。 * 为精准营养奠定基础: 该排名系统未来可用于指导开发针对微生物组的个性化营养干预策略,以预防或管理心脏代谢疾病。
应用价值: 该研究为开发基于微生物组评估的健康风险预测工具和个性化饮食建议提供了科学依据。排名系统可以整合到健康管理平台中,帮助个体了解其肠道微生物组的“健康倾向”,并评估饮食改变对微生物组的潜在影响。
六、 研究亮点
七、 其他有价值内容
研究承认了其局限性:队列人口构成可能影响某些关联,未来需要扩展到更多样化的人群和生活方式。更重要的是,本研究设计本身无法直接区分饮食对健康的影响中有多少是通过微生物组介导的,还是饮食的直接作用。要建立确切的因果关系,仍需未来设计大规模干预研究,同时操纵特定食物摄入和微生物组组成。尽管如此,本研究为未来的因果和机制研究奠定了坚实的基础,并证实了通过饮食干预成功、可预测地调节人类肠道微生物组是可行的。