作者及机构
本研究由剑桥大学遗传学系的Daniel Gebert(第一作者)、Amir D. Hay、Jennifer P. Hoang、Adam E. Gibbon、植物科学系的Ian R. Henderson以及生理学、发育与神经科学系的Felipe Karam Teixeira(通讯作者)共同完成,研究成果发表于2025年的*Genome Biology*期刊。
学术背景
果蝇(*Drosophila*)作为经典的模式生物,长期以来为遗传学和基因组学研究提供了重要见解。然而,其基因组中高度重复的区域(如转座子(transposable elements, TEs)和串联重复的卫星DNA(satellite DNA))由于技术限制,一直难以完整组装和分析。这类重复序列在着丝粒(centromere)和异染色质(heterochromatin)区域富集,对染色体结构和功能至关重要,但其进化动态和功能机制尚不明确。
本研究旨在通过结合长读长测序(Oxford Nanopore Technology, ONT)和染色体构象捕获技术(Hi-C),构建30个果蝇物种的染色体水平基因组组装,系统分析着丝粒卫星DNA的进化动态,并揭示其在染色体结构重塑中的作用。
研究流程
1. 基因组组装与注释
- 样本选择:研究选取30个果蝇物种,涵盖约40-62百万年的进化历程,分为6个亚群(如melanogaster、ananassae等)。
- 测序与组装:利用ONT长读长测序生成初始contigs,再通过Hi-C数据(来自雌性果蝇)进行染色体水平 scaffolding,最终获得N50中位数为30.4 Mb的高质量基因组组装。
- Muller元素分配:通过全基因组比对,将染色体臂统一命名为Muller元素(A-F),以标准化跨物种比较。
- 基因与重复序列注释:使用MAKER进行基因预测,结合RNA-seq数据(卵巢组织)验证;通过RepeatMasker和TRASH(Tandem Repeat Annotation and Structural Hierarchy)分别注释转座子和卫星DNA。
染色体结构与进化分析
卫星DNA的进化动态
主要结果
1. 高质量基因组资源:新组装的基因组在重复区域(如着丝粒)的连续性显著优于以往参考基因组(如dm6),例如在*D. melanogaster*中首次完整组装了dodeca和prodsat卫星序列。
2. 染色体进化路径多样性:ananassae亚群的A和F元素通过新着丝粒卫星DNA的扩张形成中间着丝粒结构,而*D. littoralis*的E元素则通过异染色质区重排实现类似转变。
3. 卫星DNA的快速辐射:在ananassae亚群(除*D. ananassae*外)中,Fam1、Fam2a/b和Fam3卫星家族在约8.1-10.9百万年内爆发性扩增,形成长达2 Mb的连续阵列,占基因组的7%以上。
结论与意义
本研究提供了果蝇属迄今最完整的基因组资源,揭示了卫星DNA在着丝粒进化中的核心作用。特别地,ananassae亚群中卫星DNA的高阶重复结构为研究着丝粒功能的表观遗传调控(如CENP-A定位)提供了新模型。此外,研究提出的“卫星驱动染色体结构重塑”假说,挑战了传统认为转座子是着丝粒主要成分的观点,为理解真核生物染色体进化提供了新视角。
研究亮点
1. 技术创新:结合ONT和Hi-C的组装策略显著提升了重复区域的连续性,为复杂基因组研究树立了新标准。
2. 进化发现:首次在果蝇中报道了类似人类的着丝粒卫星结构,填补了无脊椎动物与高等真核生物着丝粒进化研究的空白。
3. 模型价值:将ananassae亚群确立为研究着丝粒可塑性和卫星DNA功能的新体系,推动了对非编码重复序列功能的研究。
其他价值
研究还鉴定了一批在进化中高度保守的基因簇(如Osiris和Tetraspanin家族),这些区域可能对果蝇的发育或适应性具有关键作用,为后续功能研究提供了靶点。