分享自:

马缨丹的首个高质量基因组组装与注释:一种重要的观赏植物和主要入侵物种

期刊:horticulture advancesDOI:10.1007/s44281-024-00043-6

学术研究报告:首个马缨丹(Lantana camara)高质量基因组组装与注释研究

作者与发表信息
本研究由美国佛罗里达大学环境园艺系的S. Brooks Parrish和Zhanao Deng(通讯作者)合作完成,发表于2024年的期刊 *Horticulture Advances*,文章标题为《The first high-quality genome assembly and annotation of Lantana camara, an important ornamental plant and a major invasive species》。

学术背景
马缨丹(*Lantana camara*)是一种原产于中美洲的观赏性灌木,因其花色艳丽被广泛引种至全球,但同时也因其极强的入侵性对当地生态系统造成威胁。其基因组复杂性高(多倍体,染色体基数x=11,存在2x至6x的倍性变异),且缺乏高质量基因组数据,阻碍了对其观赏性状(如花色)和入侵性(如抗除草剂机制)的遗传基础研究。此前仅有基于短读长测序的碎片化基因组(如Shah et al. 2022年发表的1.57 Gb组装),无法满足染色体尺度研究需求。本研究旨在通过PacBio HiFi长读长测序和Hi-C技术,首次完成马缨丹二倍体育种系UF-T48的单倍型分型、染色体级别基因组组装,并注释关键功能基因,为后续育种和入侵控制提供资源。

研究流程与方法
1. 样本准备与测序
- 材料:选用二倍体马缨丹育种系UF-T48,通过流式细胞术(flow cytometry)确认其核DNA含量为3.02 pg/2C(约2.95 Gb)。
- DNA提取:采用CTAB法从暗处理三周的黄化叶片中提取高分子量DNA。
- 测序技术
- PacBio HiFi:使用3个8M SMRT细胞生成94.86 Gb数据(平均读长16,816 bp,覆盖度60×)。
- Hi-C:通过Arima-HiC文库构建和Illumina NovaSeq 6000测序,获得30.92 Gb数据(150 bp双端读长),用于染色体支架构建。
- RNA-Seq:对叶片、根、绿色茎、未成熟果实和花进行转录组测序(总计258 Gb数据),支持基因注释。

  1. 基因组组装与质量评估

    • 组装工具:采用Hifiasm(默认参数)结合Hi-C数据进行单倍型分型组装,未依赖亲本数据。
    • 结果
      • 分型组装1(Phased 1)包含1,295个contig(N50=104.99 Mb),分型组装2(Phased 2)含426个contig(N50=85.09 Mb)。
      • Hi-C图谱显示22条伪染色体(11对),BUSCO完整性达97.7%,LTR组装指数(LAI)平均19.4,表明高质量。
      • 鉴定到29个端粒序列,其中6条染色体实现端粒到端粒(telomere-to-telomere)组装。
  2. 重复序列与基因注释

    • 重复序列:占基因组的85.82%,以长末端重复转座子(LTR-TEs,70.23%)为主。
    • 基因预测:通过BRAKER3结合RNA-Seq数据注释83,775个蛋白质编码基因(平均长度2,415 bp),其中83%获得功能注释(eggNOG-mapper)。
    • 关键基因定位
      • 花色素合成:定位42个花青素(anthocyanin)和类胡萝卜素(carotenoid)通路候选基因(如ANS、bHLH42),涉及花色调控。
      • 除草剂靶点:鉴定12个除草剂靶基因(如ACCase抑制剂靶标基因ACCA),为入侵控制提供分子靶点。

主要结果
1. 基因组特征:UF-T48基因组高度杂合(k-mer分析估计杂合度72.31%),重复序列占比高,但通过Hi-C scaffolding实现了染色体级别连续性。
2. 功能基因挖掘
- 花青素通路基因在染色体1、5、7上成簇分布,与转录组数据(PRJNA956917)中花色差异表达基因一致。
- 首次在马缨丹中完整鉴定出除草剂靶基因(如IMDH),填补了此前研究的缺失。
3. 多组织表达谱:41,729个基因(49.8%)在至少一种组织中表达,花组织特异性基因占比最高(40.45%)。

结论与价值
1. 科学意义:本研究提供了首个马缨丹染色体级别基因组,为马缨丹科(Verbenaceae)植物基因组研究树立了新标准,揭示了其多倍化与适应性进化的遗传基础。
2. 应用价值
- 育种:花色相关基因的定位可加速观赏性状改良。
- 生态防控:除草剂靶基因的鉴定为开发特异性除草剂提供依据,助力入侵物种管理。

研究亮点
1. 技术创新:结合HiFi和Hi-C数据实现无亲本参考的单倍型分型组装,攻克了高杂合、高重复基因组的难题。
2. 多组学整合:基因组与转录组联合分析,系统性解析了花色和抗性性状的遗传机制。
3. 资源开放性:数据已公开(NCBI项目PRJNA1065478等),支持后续研究。

其他价值
- 端粒到端粒组装为植物染色体结构研究提供范例;LTR-TEs的注释为基因组进化研究奠定基础。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com