分享自:

作物根际细菌与病毒基因组揭示未探索物种与微生物组模式

期刊:CellDOI:10.1016/j.cell.2025.02.013

学术报告:作物根际微生物组细菌与病毒基因组资源库的构建及其生态学启示

一、 作者、机构与发表信息

本研究的主要通讯作者为北京大学Yang Bai研究员(通讯邮箱:ybai@pku.edu.cn)。研究团队由来自多个知名机构的科学家组成,包括中国科学院遗传与发育生物学研究所(中国北京)、北京大学、中国科学院大学、耶路撒冷希伯来大学(以色列)、瓦赫宁根大学(荷兰)、乌得勒支大学(荷兰)、巴塞尔大学(瑞士)等。该研究成果于2025年5月1日以开放获取(Open Access)形式发表于国际顶级学术期刊《Cell》(卷188,页2521-2539)。论文标题为“作物根细菌与病毒基因组揭示未知物种与微生物组模式”。

二、 学术背景与研究动机

本研究属于植物-微生物互作、微生物组学和基因组学交叉领域。植物根系是连接植物与土壤环境的关键界面,其表面和内部定殖着庞大而多样的微生物群体,统称为根系微生物组(root microbiome)。大量研究表明,根系微生物组对作物的生长、健康(如抗病、抗旱)和养分吸收具有至关重要的影响,是发展可持续农业、减少化肥农药依赖的潜在关键。然而,要深入理解其功能机制并进行有效的微生物应用(如益生菌、生物肥料开发),依赖于高质量的微生物参考基因组和可培养菌株资源。

尽管在拟南芥等模式植物中已有部分根际细菌基因组被解析,但作物根系的微生物组具有显著的宿主特异性(host specificity)。现有公开数据库中,源自作物根系的细菌基因组数量稀少(不到总量的1%),且代表性不足,主要集中于根瘤菌(Rhizobium)和芽孢杆菌(Bacillus)等少数类群。这种资源的匮乏严重制约了基于宏基因组测序的精准分类和功能分析,以及对微生物功能的机制性研究。另一方面,病毒(尤其是噬菌体)在微生物群落中扮演着重要角色,能塑造细菌的基因组与进化,但在作物根系生态系统中的多样性、分布及其与细菌的互作网络几乎未被探索。

因此,本研究旨在填补这一空白。其核心目标是:通过结合高通量细菌培养和宏基因组测序技术,为重要农作物(小麦、水稻、玉米和苜蓿)建立一个系统、全面的根系细菌与病毒基因组资源库,并利用这些资源揭示作物根系微生物组在多样宿主和土壤环境下的保守规律,以及细菌与病毒间的相互作用模式。

三、 详细研究流程

本研究是一个资源构建与系统性分析相结合的大型项目,其工作流程严谨而复杂,主要包括以下几个核心环节:

1. 样本采集与策略设计: 研究团队选择了四种重要的农作物:小麦、水稻、玉米和苜蓿。为确保样本的代表性,每种作物至少选取了两个基因型,并在三到四种不同的农业土壤背景中进行种植。采样策略专注于根系相关微生物群,即定殖于根表(rhizoplane)和根内(endosphere)的微生物。最终,研究涉及了来自14个不同数据集的332个根系样本,用于宏基因组测序。

2. 作物根系细菌基因组收集库(CRBC)的构建: 这一环节采用了“培养组学”与“宏基因组学”相结合的双轨策略。 * 高通量细菌分离培养与基因组测序: 研究人员从四种作物的根系中大规模分离可培养的细菌菌株。经过高通量筛选,选择了具有代表性的菌株进行全基因组测序。最终,从纯培养物中获得了4,618个细菌基因组(原始读长总计5.5 Tbp),其中小麦1,496个、水稻1,287个、玉米1,056个、苜蓿779个。 * 宏基因组组装基因组(MAGs)的获取: 为了捕获不可培养的细菌,对332个根系宏基因组样本进行了深度测序(中位深度30.4 Gbp)。平均而言,82.0%的测序读长来自宿主植物,这凸显了根系宏基因组测序的挑战与高成本。去除宿主序列后,研究者对微生物序列进行组装和分箱(binning),最终获得了2,081个高质量的MAGs。这些MAGs补充了可培养菌株的不足,新增了21个门和147个属。 * 基因组质量评估与整合: 结合上述两部分,研究者建立了CRBC,共包含6,699个高质量的细菌基因组,其中68.9%源自分离株,31.1%为MAGs。这些基因组覆盖了27个门、49个纲、113个目,平均完整度为98.9%,平均污染率仅为0.9%,符合基因组分类数据库(GTDB)的高质量标准。所有基因序列和菌株信息可通过网站 www.cropmicrobiome.com 获取。

3. 作物根系病毒基因组收集库(CRVC)的构建: 基于已获得的CRBC细菌基因组、公共数据库中的作物根细菌基因组,以及本研究根系宏基因组组装出的2950万条重叠群(contigs),研究者系统地挖掘了根系生态系统中的病毒序列。 * 病毒序列识别: 采用混合分析流程,结合了Genomad、VirSorter和DeepVirFinder等多种生物信息学工具,从细菌基因组和宏基因组重叠群中预测病毒序列。 * 基因组质量控制与非冗余化: 识别出的病毒序列经过严格筛选,保留了完整度超过50%的基因组,并通过去冗余处理,最终建立了包含9,736个非冗余病毒基因组的CRVC。其中95.3%被鉴定为噬菌体(bacteriophages),71.0%表现出溶原性(lysogenic)特征。

4. 数据分析流程: 研究者开发并应用了一系列生物信息学方法对CRBC和CRVC进行深入分析: * 物种鉴定与多样性评估: 使用平均核苷酸一致性(Average Nucleotide Identity, ANI)阈值对细菌和病毒基因组进行物种水平聚类。通过与GTDB、NCBI RefSeq、IMG/M等公共数据库比较,评估CRBC和CRVC的物种新颖性。 * 功能基因注释与分析: 利用京都基因与基因组百科全书(KEGG)、Pfam等数据库对细菌和病毒的基因进行功能注释。重点分析了与植物促生(Plant Growth-Promoting, PGP)相关的功能(如固氮、溶磷、植物激素合成、抗逆等)以及生物合成基因簇(Biosynthetic Gene Clusters, BGCs)。对于病毒,则分析了其生命周期类型(裂解性/温和性)。 * 宏基因组数据分析: 将332个根系宏基因组样本及其对应未种植土壤的宏基因组数据(75个样本)与CRBC及其他公共参考基因组进行比对,计算覆盖度,评估资源库的有效性。通过比较根与土壤之间微生物功能基因的丰度差异,寻找保守的根系富集功能。 * 细菌-病毒互作网络分析: 通过两种方式预测细菌与噬菌体的连接:一是基于细菌基因组中CRISPR间隔序列(spacer)与病毒基因组的匹配;二是基于细菌基因组中整合的原噬菌体(prophage)序列。结合宏基因组中的共现(co-occurrence)模式,系统绘制了作物根系中细菌-病毒的互作图谱。 * 病毒微多样性(Microdiversity)计算: 将宏基因组测序读长比对到CRVC的代表性病毒基因组上,计算每个核苷酸位置的覆盖度多样性,以此评估病毒种内群体的遗传变异水平,并分析其与病毒分布范围的关系。

四、 主要研究结果

1. CRBC极大地拓展了作物根系细菌的已知多样性。 * 物种新颖性: 与所有公共数据库相比,CRBC包含了1,817个“未定义”的细菌物种(与GTDB数据库基因组ANI < 95%),其中1,329个来自分离株,488个来自MAGs。这些新物种分布在26个门、47个纲、182个科中,显著扩展了生命之树。 * 系统发育多样性(PD)扩展: CRBC将公开可用的作物根系细菌基因组的系统发育多样性提高了290.6%。分离株基因组主要扩展了 Alphaproteobacteria、Actinobacteriota 等常见根际菌门的多样性,而MAGs则主要贡献了 Myxococcota、Patescibacteria 等难培养菌门的多样性。分析表明,MAGs所代表的细菌估计具有比可培养菌更低的生长速率。 * 宏基因组分析中的优越性: 使用未参与CRBC构建的42个作物根系宏基因组样本进行测试,CRBC对这些样本读长的平均覆盖度达到50.2%,显著高于NCBI RefSeq(18.2%)、GTDB(31.1%)、地球微生物组目录(GEM, 10.6%)以及人类肠道(UHGG, %)和海洋(OMD, %)等生态系统的参考基因组数据库。这证明了生态位特异性参考数据库的重要性。

2. CRBC细菌基因组编码丰富的有益功能与代谢潜力。 * 植物促生功能: 在6,109个高质量细菌基因组中,5,231个编码至少一种测试的PGP功能。超过43.8%的基因组编码至少两类PGP功能(营养利用、生长促进、胁迫耐受),18.7%的基因组编码全部三类功能。超过1000个细菌基因组同时具备固氮和溶磷能力。 * 生物合成基因簇: 在CRBC和公共作物根细菌基因组中,共鉴定出48,643个BGCs。通过聚类得到了12,865个基因簇家族(Gene Cluster Families, GCFs)。其中,5,199个GCFs(40.4%)与计算预测的BGC数据库(BiG-FAM)无密切相似性,12,317个GCFs(95.7%)与实验验证的BGC数据库(MIBIG)无密切相似性。这些未定义的BGCs主要来自 Proteobacteria 和 Actinobacteriota,编码核糖体合成和翻译后修饰肽(Ripps)、非核糖体肽合成酶(NRPS)等功能,是潜在新型次级代谢产物的宝库。

3. 跨作物与土壤的根系微生物组存在保守的遗传特征。 尽管不同土壤背景和宿主物种导致根系微生物组的分类学组成差异巨大,但其功能组成在14个数据集中表现出高度相似性。通过比较根与对应土壤的宏基因组,研究人员发现,在四种作物的根系中,有11个微生物功能被一致性地富集。这些功能主要与以下过程相关:ABC转运蛋白(ATP-binding cassette transporters)、双组分系统(two-component systems)、生物膜形成(biofilm formation)、细菌趋化性(bacterial chemotaxis)和鞭毛组装(flagellar assembly)。这些功能基因在根际的富集,与细菌在根际定殖、感知环境信号、运动和建立紧密互作的需求高度吻合。基因组水平的分析进一步将这些保守功能与特定的细菌类群(如 Proteobacteria,特别是 Rhizobacter、Variovorax 等属)联系起来。

4. CRVC揭示了大量未报道的病毒类群及其生态模式。 * 病毒多样性: CRVC包含9,736个病毒基因组。通过全基因组基因共享谱分析,将其划分为3,097个属水平的簇(viral genus-level clusters),其中1,572个(50.8%)未在现有公共数据库(NCBI RefSeq、人类肠道病毒目录MGV、全球海洋病毒组GOV 2.0、IMG/VR等)中报道过,凸显了作物根系病毒组的独特性和巨大未知空间。 * 病毒微多样性: 在根系宏基因组中检测到2,690个病毒物种级簇。根据其分布模式分为:稀有、单作物区域、单作物多区域、多作物多区域。分析发现,在多个作物和地理位置都有分布的病毒,其遗传微多样性显著高于分布范围狭窄的病毒,表明生态位分化驱动了病毒的选择性变异。温和性噬菌体(temperate phages)比裂解性噬菌体(lytic phages)表现出更高的微多样性。 * 根系中噬菌体更富集: 宏基因组定量显示,根系微生物组中噬菌体的相对丰度显著高于对应的土壤环境。这一模式在14个数据集中一致存在。 * 细菌的抗病毒系统在根中富集: 94.0%的根系细菌基因组拥有至少一种细菌抗病毒防御系统,每个基因组中位数有5个防御家族。在根系微生物组中,大多数细菌抗病毒系统(如限制-修饰系统R-M systems、CRISPR-Cas系统)比在土壤中更富集,这反映了根系细菌适应噬菌体丰富环境的能力。

5. 揭示了作物根系中广泛的细菌-噬菌体互作网络。 * 基因组层面的连接: 在9,772个作物根系细菌基因组中,5,885个(60.2%)与噬菌体存在连接(通过CRISPR spacer匹配或存在原噬菌体)。这些连接通常具有菌种特异性。 * 优势菌群与噬菌体关联紧密: 宏基因组数据显示,在根系中丰度高且普遍存在的细菌物种里,有27.0%与噬菌体存在连接。这种关联性在特定的、丰度较高的细菌科中尤为突出,如 Burkholderiaceae、Rhizobiaceae、Xanthomonadaceae 和 Pseudomonadaceae。这些科包含许多已知对作物生长和健康有益的菌种。

五、 研究结论与价值

本研究成功构建了迄今为止最全面、质量最高的作物根系细菌与病毒基因组资源库(CRBC和CRVC)。这项工作不仅极大地扩充了公共数据库中作物根系微生物的基因组数据,发现了数千个新的细菌物种和病毒属级类群,更重要的是,它提供了系统性的工具和视角来解码根系微生物组的生态与功能。

科学价值: 1. 资源基石: CRBC和CRVC可作为类似于人类肠道或海洋微生物组基因组资源的重要基石,将作物根系微生物组研究推进到机制性和基因组水平。 2. 生态规律发现: 研究揭示了尽管分类组成多变,但作物根系微生物组在功能上存在跨宿主和土壤的保守性,指向了微生物-宿主互作中可能存在的普遍分子原则。这为理解根系微生物组的装配与功能提供了一个新框架。 3. 病毒组认知突破: 首次系统描绘了作物根系病毒组的多样性、分布和与细菌的复杂互作网络,揭示了病毒是根系生态系统中不可忽视的驱动力。 4. 菌株-功能关联: 将大量有益功能基因和生物合成潜力锚定到具体的细菌基因组和可培养菌株上,为后续的机制研究和菌株筛选提供了明确靶标。

应用价值: 1. 促进机制研究: 大量可培养菌株及其基因组信息将极大刺激对作物根系微生物组的功能和机制研究。例如,基于CRBC中的一个金黄杆菌(Chryseobacterium)基因组,研究者已发现了一种新型的CRISPR-Cas系统促进因子。 2. 支撑微生物产品开发: 资源库中蕴含的丰富PGP功能和新型BGCs,为开发下一代农业益生菌(如生物肥料、生物防治剂、生物刺激素)提供了海量候选菌株和基因资源。 3. 推动可持续农业: 对根系微生物组保守功能和互作网络的深入理解,有助于设计更精准的微生物群落调控策略,以增强作物韧性、提高养分利用效率,支持可持续农业生产实践。

六、 研究亮点

  1. 规模与质量空前的资源库: 首次针对多种重要作物,结合培养与非培养方法,构建了包含近6700个细菌基因组和近万个病毒基因组的系统性资源。
  2. 惊人的新颖性: 发现了超过1800个新的细菌物种和超过1500个新的病毒属级类群,大幅拓展了微生物多样性认知边界。
  3. 双轨策略的效力: 高通量培养与深度宏基因组测序相结合的策略,有效覆盖了可培养与不可培养、高丰度与低丰度的微生物成员。
  4. 从分类到功能再到互作的系统性洞察: 研究不仅停留在物种描述,更深入分析了功能保守性、代谢潜力,并首次系统揭示了作物根系中广泛的细菌-噬菌体互作网络。
  5. 数据与资源的开放共享: 所有基因组、注释文件以及大部分菌株都通过专门网站和公共数据库开放获取,体现了资源研究的价值最大化。

七、 其他有价值内容

  • 国际合作与未来展望: 研究由多国团队合作完成,并计划基于此资源建立一个国际作物微生物组库(international crop microbiome repository),供全球科学界持续扩充和使用。
  • 研究局限性: 作者也客观指出了研究的局限性,例如对低丰度微生物成员的覆盖仍需加强,许多新物种仍需表型和化学分类学确认,以及未来需要纳入更多样土壤类型和大陆的样本以提升普适性。这为后续研究指明了方向。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com