本研究由郑挺阳(第一作者及通讯作者,贵州师范大学)、何法银、麦映笑、范思贤、安寅、李坤、吴凤奇、唐铭、余辉、刘建祥(通讯作者,浙江大学)、夏瑞(通讯作者,华南农业大学)等多位学者合作完成。研究论文发表于学术期刊 *Plant Communications*,发表日期为2024年10月14日,文章具体标识为 Plant Communications 5, 101075。
学术背景: 本研究属于植物功能基因组学与代谢生物学交叉领域,具体聚焦于药用植物基因组解析与次生代谢产物生物合成途径的探究。研究对象鱼腥草(*Houttuynia cordata*,中文名“鱼腥草”或“蕺菜”)为三白草科蕺菜属多年生草本植物,在亚洲尤其是中国,被广泛用于传统医药,以治疗呼吸道感染、炎症及增强免疫力而闻名。其药效主要归因于挥发油(如鱼腥草素)和黄酮类化合物(如槲皮素)等活性成分。然而,长期以来,鱼腥草缺乏高质量的基因组信息,严重阻碍了从分子和遗传层面深入理解其药用成分的生物合成调控机制、开展功能基因组学研究以及通过遗传改良提升其药用价值的努力。因此,解析鱼腥草的高质量基因组,并在此基础上阐明其关键活性成分(特别是鱼腥草素和黄酮类物质)的生物合成通路与调控网络,成为该领域的迫切需求。本研究的目标是:完成鱼腥草近乎完整的染色体级别基因组组装;基于组学数据(基因组、转录组、代谢组)解析其全基因组复制事件与进化历史;探究鱼腥草素生物合成的可能途径;并深入剖析黄酮类化合物,尤其是槲皮素代谢的生物合成与调控机制。
详细研究流程: 本研究包含一个系统性的多组学整合分析流程,主要可分为五个核心步骤: 1. 样品获取、基因组测序与组装: 研究团队于2022年6月从中国贵州凯里采集健康的鱼腥草植株样本。首先进行基因组调查,利用K-mer分析和流式细胞术预估基因组大小(约2.4 Gb)和倍性(推测为同源四倍体)。随后,采用多平台测序策略:利用PacBio HiFi(高保真)测序技术获得高精度长读长序列数据(约65 Gb),并利用Hi-C(染色体构象捕获)测序数据(约111 Gb)进行染色体挂载。组装流程结合了HiFiasm、Juicer、3D-DNA等软件,对初始组装的contig进行排序、定向和 scaffolding,最终构建了染色体级别的基因组。通过Illumina短读长数据进行抛光以提升准确性。最终组装获得大小为2.24 Gb的基因组,包含76条染色体(4n = 76),组装成78条假分子(含线粒体和叶绿体基因组), scaffold N50达29.19 Mb。完整性评估显示,BUSCO完整性达99.1%。此外,研究还通过RepeatMasker等工具注释了基因组中占比53.60%的重复序列,并成功鉴定了72条染色体上的端粒序列以及35条染色体上的着丝粒候选区域,证明了组装的高质量和完整性。 2. 基因组注释与进化分析: 结合从头预测、同源比对和RNA测序数据,预测了126,864个蛋白质编码基因,并进行了GO、KEGG、Swiss-Prot等功能注释。为探究鱼腥草的进化地位,研究者选取了包括木兰类植物、真双子叶植物、单子叶植物和基部被子植物(如无油樟、睡莲)在内的21种被子植物进行系统发育比较分析。基于150个单拷贝直系同源基因家族构建了系统发育树,估算了分化时间。通过分析基因家族的扩张与收缩,以及计算同义替换率分析全基因组复制事件。 3. 鱼腥草素生物合成途径探究: 采用超高效液相色谱-四极杆飞行时间质谱(UPLC-Q-TOF-MS)靶向代谢组学技术,在鱼腥草根茎和叶片中检测并定量了鱼腥草素的衍生物——新鱼腥草素钠(sodium houttuyfonate, SH)。基于SH的化学结构特征,研究团队提出了一个新颖的假设:SH并非典型的次级代谢产物,而是来源于脂肪酸的β-氧化途径。为验证此假说,他们进一步对根茎和叶片进行了转录组测序,通过比较分析(根茎 vs. 叶片),鉴定出49个在脂肪酸代谢通路中差异表达的基因,并将其按功能分为脂肪酸合酶、脂肪酸活化酶等七大类,以寻找与SH组织特异性积累相关的候选基因。 4. 黄酮类化合物生物合成与槲皮素代谢研究: 首先,通过代谢组学全面分析了鱼腥草根茎、叶片、苞片和花序中黄酮类化合物的组成与含量,特别聚焦于槲皮素及其糖苷形式(如异槲皮苷、芦丁、金丝桃苷等)。同时,利用DPPH等方法测定了不同组织的总抗氧化能力。其次,对上述四种组织进行转录组测序,系统鉴定了与黄酮类生物合成通路相关的76个保守的酶编码基因(如PAL, 4CL, CHS, FLS, F3H等)。通过相关性分析,将特定基因的表达模式与关键黄酮代谢物(柚皮素、槲皮素糖苷、木犀草素等)的积累量关联起来。特别针对槲皮素糖苷化过程,分析了可能催化此反应的尿苷二磷酸葡萄糖基转移酶基因的表达情况。 5. 基因共表达网络分析与调控机制挖掘: 为深入理解黄酮生物合成的调控网络,研究应用了加权基因共表达网络分析(WGCNA)。将所有基因根据表达模式聚类成32个模块,并找出与特定黄酮类化合物高度正相关的模块(如MEblue模块)。从该模块中筛选出7个核心的酶编码候选基因。进一步,通过构建共表达网络,鉴定了与这7个候选基因可能存在调控关系的25个转录因子,这些转录因子分属bZIP、MYB、ARF、AP2、GRAS等12个家族。通过预测转录因子结合位点、进行亚细胞定位实验(如MYB_2和AP2_2定位于细胞核)以及实时定量PCR验证其组织特异性表达模式,为这些转录因子在黄酮生物合成调控中的作用提供了证据。
主要研究结果: 1. 高质量四倍体基因组: 成功组装了鱼腥草染色体级别的高质量基因组(2.24 Gb, 4n=76)。基因组注释揭示其含有大量重复序列(53.60%),并以LTR反转座子为主。端粒和着丝粒区域的鉴定进一步证实了组装的完整性和染色体结构的稳定性。该基因组为后续研究提供了关键的基础资源。 2. 进化历史与全基因组复制事件: 系统发育分析表明,鱼腥草与三白草科的*Saururus chinensis*亲缘关系最近,约在33.4百万年前发生分化。Ks分布分析揭示了鱼腥草基因组经历了三次全基因组复制事件。其中,WGD1事件与胡椒(*Piper nigrum*)共享,发生在二者共同祖先中;WGD2和WGD3(一次多倍化事件)为鱼腥草特有。这些WGD事件,尤其是WGD3,直接导致了鱼腥草同源四倍体基因组的形成,并显著促进了与药用特性相关基因家族的扩张(如参与苯丙烷代谢、黄酮生物合成的基因家族),这从基因组进化角度解释了鱼腥草次生代谢产物多样性的遗传基础。 3. 鱼腥草素生物合成途径的推定: 代谢组学证实SH在根茎中含量显著高于叶片。基于化学结构和代谢物检测(本研究检测到癸酸和SH,文献报道有棕榈酸、癸醛和2-十一烷酮),研究者首次提出了SH可能源自脂肪酸β-氧化途径的完整假设通路:棕榈酸(C16)→ 棕榈酰辅酶A →(经多轮β-氧化)→ 癸酰辅酶A(C10)→ 癸酸 → 癸醛 → 鱼腥草素(癸酰乙醛)→ 新鱼腥草素钠。转录组分析发现的在根茎和叶片中差异表达的脂肪酸代谢相关基因,为这一通路在不同组织中的活性差异提供了分子层面的支持。 4. 黄酮生物合成图谱与槲皮素代谢特征: 代谢组学显示鱼腥草富含黄酮醇和黄酮,其中苞片总黄酮含量最高。槲皮素及其糖苷在叶片、花序和苞片中大量积累,与这些组织较高的总抗氧化能力相匹配。转录组分析系统鉴定了黄酮通路的关键酶基因,并发现这些基因的表达具有组织特异性。相关性分析成功地将特定基因集(如PAL_10/7/8, 4CL_4/2/7/9/6, CHS_1/2/3等)与柚皮素、槲皮素糖苷等具体代谢物的积累关联起来,绘制了鱼腥草黄酮生物合成的基因-代谢物关联网络。对于槲皮素代谢,研究发现多个UGT基因(F3RT, F3GT等)的表达模式与槲皮素糖苷的积累模式一致,提示它们可能参与了槲皮素的糖苷化修饰。 5. 黄酮合成的转录调控网络: WGCNA分析揭示了与黄酮合成密切相关的基因共表达模块(MEblue)。从该模块中鉴定出的7个核心酶基因与25个转录因子存在强烈的共表达关系。这些转录因子包含多个已知参与植物次生代谢调控的家族成员。结合结合位点预测和表达验证,研究初步构建了一个以MYB、AP2等转录因子为核心,调控下游黄酮生物合成酶基因表达的潜在网络,为理解鱼腥草黄酮合成的转录调控机制奠定了基础。
结论与意义: 本研究成功绘制了药用植物鱼腥草的高质量四倍体基因组图谱,并从进化基因组学和代谢生物学角度取得了重要突破。结论主要包括:1)鱼腥草基因组经历了三次WGD事件,最近的WGD3导致了其同源四倍体状态,这些事件塑造了其基因组结构并扩张了药用相关基因家族;2)首次基于多组学数据提出了鱼腥草特征性挥发油成分——新鱼腥草素钠可能来源于脂肪酸β-氧化途径的完整假设,为解析这一重要活性成分的生物合成奠定了基础;3)系统阐明了鱼腥草中黄酮类化合物(尤其是槲皮素)的生物合成与积累模式,并初步揭示了其潜在的转录调控网络。 本研究的科学价值在于:提供了首个高质量的鱼腥草染色体级别基因组,作为宝贵的公共资源,将极大推动该物种的功能基因组学、比较基因组学和进化生物学研究;提出的SH生物合成新假说挑战了对其作为典型次生代谢产物的传统认知,开辟了新的研究方向;对黄酮合成通路的精细解析为理解药用植物活性成分合成的调控机制提供了范例。应用价值在于:该基因组和鉴定的关键基因是进行鱼腥草分子育种(如通过基因编辑或标记辅助选择提高特定活性成分含量)和合成生物学研究(如在微生物或植物底盘中外源生产鱼腥草素或黄酮)不可或缺的基础,对于开发、改良和可持续生产这一重要中药材具有深远意义。
研究亮点: 1. 研究对象与成果的独创性: 首次完成了药用植物鱼腥草的高质量、染色体级别的基因组组装,填补了该物种乃至三白草科基因组资源的空白。 2. 进化洞察的深度: 不仅厘清了鱼腥草在木兰类植物中的进化位置,还精细解析了其独特的三次WGD历史,特别是明确了导致其形成当前四倍体状态的关键事件,将基因组进化与药用性状形成联系起来。 3. 代谢途径假说的创新性: 创造性地将鱼腥草素/新鱼腥草素钠的生物合成与初级代谢的脂肪酸β-氧化途径相关联,提出了一个全新的、逻辑完整的生物合成假说,为后续功能验证和生物工程提供了清晰的路线图。 4. 多组学整合分析的系统性: 研究完美整合了基因组、转录组、代谢组数据,从基因发现、表达调控到代谢物积累,构建了鱼腥草黄酮类化合物生物合成的多层次、全链条图谱,并初步挖掘了其转录调控网络,体现了系统生物学的研究范式。 5. 方法学的严谨与先进性: 采用了PacBio HiFi结合Hi-C的现代测序组装策略,确保了复杂四倍体基因组的组装质量;运用WGCNA等生物信息学方法深入挖掘基因共表达与调控关系,提升了研究的深度。
其他有价值内容: 研究还对鱼腥草的核型进行了分析,确认了其染色体数目(4n=76),并与基因组组装结果相互印证。此外,通过对同源单倍型基因组的比较,发现了丰富的结构变异(如倒位、易位、重复),为了解四倍体基因组的多倍化适应和等位基因分化提供了线索。这些内容共同丰富了我们对鱼腥草基因组结构复杂性的认识。