学术研究报告:首个马缨丹(Lantana camara)高质量基因组组装与注释研究
作者与发表信息
本研究由美国佛罗里达大学环境园艺系的S. Brooks Parrish和Zhanao Deng(通讯作者)合作完成,发表于2024年的期刊 *Horticulture Advances*,文章标题为《The first high-quality genome assembly and annotation of Lantana camara, an important ornamental plant and a major invasive species》。
学术背景
马缨丹(*Lantana camara*)是一种原产于中美洲的观赏性灌木,因其花色艳丽被广泛引种至全球,但同时也因其极强的入侵性对当地生态系统造成威胁。其基因组复杂性高(多倍体,染色体基数x=11,存在2x至6x的倍性变异),且缺乏高质量基因组数据,阻碍了对其观赏性状(如花色)和入侵性(如抗除草剂机制)的遗传基础研究。此前仅有基于短读长测序的碎片化基因组(如Shah et al. 2022年发表的1.57 Gb组装),无法满足染色体尺度研究需求。本研究旨在通过PacBio HiFi长读长测序和Hi-C技术,首次完成马缨丹二倍体育种系UF-T48的单倍型分型、染色体级别基因组组装,并注释关键功能基因,为后续育种和入侵控制提供资源。
研究流程与方法
1. 样本准备与测序
- 材料:选用二倍体马缨丹育种系UF-T48,通过流式细胞术(flow cytometry)确认其核DNA含量为3.02 pg/2C(约2.95 Gb)。
- DNA提取:采用CTAB法从暗处理三周的黄化叶片中提取高分子量DNA。
- 测序技术:
- PacBio HiFi:使用3个8M SMRT细胞生成94.86 Gb数据(平均读长16,816 bp,覆盖度60×)。
- Hi-C:通过Arima-HiC文库构建和Illumina NovaSeq 6000测序,获得30.92 Gb数据(150 bp双端读长),用于染色体支架构建。
- RNA-Seq:对叶片、根、绿色茎、未成熟果实和花进行转录组测序(总计258 Gb数据),支持基因注释。
基因组组装与质量评估
重复序列与基因注释
主要结果
1. 基因组特征:UF-T48基因组高度杂合(k-mer分析估计杂合度72.31%),重复序列占比高,但通过Hi-C scaffolding实现了染色体级别连续性。
2. 功能基因挖掘:
- 花青素通路基因在染色体1、5、7上成簇分布,与转录组数据(PRJNA956917)中花色差异表达基因一致。
- 首次在马缨丹中完整鉴定出除草剂靶基因(如IMDH),填补了此前研究的缺失。
3. 多组织表达谱:41,729个基因(49.8%)在至少一种组织中表达,花组织特异性基因占比最高(40.45%)。
结论与价值
1. 科学意义:本研究提供了首个马缨丹染色体级别基因组,为马缨丹科(Verbenaceae)植物基因组研究树立了新标准,揭示了其多倍化与适应性进化的遗传基础。
2. 应用价值:
- 育种:花色相关基因的定位可加速观赏性状改良。
- 生态防控:除草剂靶基因的鉴定为开发特异性除草剂提供依据,助力入侵物种管理。
研究亮点
1. 技术创新:结合HiFi和Hi-C数据实现无亲本参考的单倍型分型组装,攻克了高杂合、高重复基因组的难题。
2. 多组学整合:基因组与转录组联合分析,系统性解析了花色和抗性性状的遗传机制。
3. 资源开放性:数据已公开(NCBI项目PRJNA1065478等),支持后续研究。
其他价值
- 端粒到端粒组装为植物染色体结构研究提供范例;LTR-TEs的注释为基因组进化研究奠定基础。