关于人类第17号染色体α卫星DNA结构与进化的研究
一、 研究团队与发表信息
本研究由加拿大多伦多大学医学遗传学系的John S. Waye和Huntington F. Willard*(通讯作者)共同完成。研究成果以《人类第17号染色体α卫星DNA的结构、组织和序列:支持不等交换进化及与X染色体共享祖先五聚体重复的证据》为题,发表于1986年9月的《分子与细胞生物学》(Molecular and Cellular Biology)期刊第6卷第9期,页码3156-3165。
二、 学术背景与研究目的
研究领域:人类分子遗传学、基因组学、重复DNA序列的进化。
背景知识:α卫星DNA(或称alphoid DNA)是灵长类基因组中一个复杂的串联重复DNA家族,其基本重复单元(单体,monomer)长度约为171个碱基对(bp)。这些长串联序列主要位于灵长类染色体的着丝粒区域。在人类基因组中,α卫星存在于所有人类染色体的着丝粒区,占总DNA的约5%。早期研究认为它是一个相对均一的340 bp EcoRI二聚体重复,但后续研究表明该家族具有显著的异质性。有证据表明,不同的人类染色体可能被其特有的、由限制性酶切周期性和一级序列定义的α卫星亚型所表征。
研究动机与目的:在本文工作之前,研究者们已对人类X染色体特异的α卫星(alphax)进行了详细表征,发现其2.0 kb的高阶重复单元(higher-order repeat unit)由12个串联但分化的单体组成,并呈现出基于五聚体(pentamer)的内部组织结构。本研究旨在利用与alphax的交叉杂交,分离和鉴定来自另一条人类染色体——第17号染色体的α卫星(alphal7)亚型。具体目标包括:1) 克隆并确定alphal7高阶重复单元的结构和序列;2) 评估其染色体特异性;3) 估算其拷贝数;4) 分析其单体排列的组织规律;5) 探究其与X染色体及其他染色体α卫星亚型的进化关系;6) 探索该重复家族内部长度变异的可能产生机制。
三、 详细研究流程
本研究是一个系统的分子克隆、测序与比较分析项目,主要流程如下:
1. 染色体17 α卫星克隆的分离与鉴定 * 研究对象与文库:从一个构建在λ噬菌体载体χgtWES.B中的人类基因组部分EcoRI酶切文库中进行筛选。 * 实验方法:在允许异源染色体α卫星域交叉杂交的条件下,使用已鉴定的X染色体2.0 kb α卫星重复探针(pbamX7)对文库进行筛选。 * 结果与后续操作:筛选得到一个阳性克隆λ3-6,该克隆含有三个串联排列的2.5 kb EcoRI片段。将其中的一个片段亚克隆到质粒pUC9中,得到质粒p3-6。Southern杂交显示,p3-6探针在人类基因组DNA的EcoRI消化产物中能检测到约2.7 kb、2.5 kb和2.4 kb的主要条带。初步的体细胞杂交DNA图谱分析提示这些片段可能位于第17号染色体上。 * 获取主要重复单元:为了获得更主要的2.7 kb重复的代表性克隆,研究者从一只仅含人类5、17和21号染色体的鼠-人体细胞杂交系中,分离并克隆了2.5-3.0 kb大小的EcoRI片段。使用p3-6探针在高严格条件下筛选该质粒文库,排除了与其他染色体(如5号、21号)α卫星的交叉杂交,最终分离出三个克隆:p17h3, p17h5和p17h8,它们含有2.7 kb的插入片段。
2. 染色体定位与拷贝数估算 * 研究对象:人类细胞、啮齿类细胞以及一组包含不同人类染色体的29个啮齿类-人体细胞杂交系DNA。 * 实验方法:用EcoRI消化DNA,分别以p3-6或p17h8为探针,在高严格洗膜条件下进行Southern印迹杂交。 * 数据分析:通过将2.7-2.4 kb EcoRI条带的出现与否与各杂交系所含的人类染色体进行关联分析,将这些条带定位到人类第17号染色体。所有其他人类染色体在测试的杂交系中均表现出高比例的不一致性(见表1),从而确认了这些克隆的染色体17特异性。 * 拷贝数估算:通过比较人类基因组DNA与已知量λ3-6或p17h8 DNA(作为标准)的杂交信号强度,估算出每个第17号染色体上大约有500-1000份拷贝的16-单体(16-mer)重复和大约100份拷贝的15-单体(15-mer)重复。
3. 限制性图谱分析与串联排列验证 * 方法:对克隆p3-6、p17h3、p17h5和p17h8进行限制性内切酶(EcoRI, PstI, PvuII, XbaI, HindIII)作图。 * 结果:比较15-mer(p3-6)和16-mer(p17h克隆)的限制图谱发现,15-mer相对于16-mer缺失了恰好一个单体的长度。克隆λ3-6含有三个串联的15-mer,直接证明了15-mer在基因组中的串联排列性质。对于16-mer,通过部分酶切实验观察到了以2.7 kb为间隔的EcoRI或PvuII片段梯带,提示其也为串联排列。 * 验证实验:为直接证实16-mer的串联排列,研究者使用p17h8探针从一个人类HindIII酶切DNA的文库中分离了一个推定的连接克隆(junction clone)pmgb430。限制性图谱和后续的DNA测序证实,该克隆具有两个串联16-mer之间连接片段所预期的结构。
4. 核苷酸序列测定 * 测序策略:本研究采用了当时先进的策略进行快速核苷酸测序。 * 新颖方法:为便于测序,研究者利用外切核酸酶III(Exonuclease III)构建了从p17h8和p3-6起始的系列缺失质粒。具体步骤包括:用BamHI线性化质粒(该酶只在载体多克隆位点切割,不切割α卫星插入片段),在控制条件下用外切核酸酶III进行单向消化,定时取样,用核酸酶S1(Nuclease S1)去除单链尾,再经EcoRI酶切后重新连接并克隆回相应载体。这一方法能高效生成一系列具有重叠末端的缺失突变体。 * 测序与确认:使用双脱氧终止法(dideoxytermination method)和双链质粒模板,对覆盖p3-6和p17h8全长的缺失衍生物(间隔150-200 bp)进行测序,尽可能在两条链上确定序列。连接克隆pmgb430也被亚克隆并测序。此外,还测定了p17h3和p17h5的部分序列(各约500 bp)以验证一致性。 * 数据分析:将所有序列排列,并根据限制性酶切位点和序列同源性确定单体的边界。
5. 序列分析与比较 * 内部同源性分析:计算p17h8中16个单体之间的序列一致性百分比,并确定一个由大多数单体在每个位置上共有碱基构成的“共识序列”。为了更精细地区分单体,还比较了各单体在“非共识”可变位点上的一致性。 * 单体分组:基于上述同源性比较,将16个单体划分为5个同源组:A组(单体1,6,13,14,15)、B组(2,7)、C组(3,8,10)、D组(4,9,11)、E组(5,12,16)。从而推导出16-mer的单体排列构型为:A-B-C-D-E-A-B-C-D-C-D-E-A-A-A-E。 * 与X染色体比较:将alphal7 (p17h8) 的完整高阶重复单元序列与已发表的X染色体α卫星 (alphax, pbamX7) 序列进行比较。通过调整阅读框使两者对齐,比较对应单体间的序列同源性。 * 与其他染色体亚型的杂交关系评估:使用p3-6探针,在低严格和高严格两种洗膜条件下,与含有不同单一人染色体的体细胞杂交系DNA进行Southern杂交,通过观察杂交信号的稳定性(热稳定性)来评估alphal7与其他染色体α卫星亚型的序列相似度。
四、 主要研究结果
1. 确定了人类第17号染色体α卫星的核心结构特征 * 高阶重复单元:第17号染色体上主要的α卫星形式是一个2.7 kb的高阶重复单元,由16个α卫星单体串联构成(16-mer)。还存在一个丰度较低的、由15个单体构成的变体(15-mer)。序列测定表明,p17h8(16-mer)与p3-6(15-mer)的序列有98%的一致性,差异仅在于15-mer相对于16-mer精确地缺失了一个单体。独立的16-mer克隆(p17h3, p17h5, p17h8)之间序列一致性大于99%,而连接克隆pmgb430的序列也高度同源,证实了16-mer在基因组中的串联排列。 * 染色体特异性与拷贝数:Southern杂交和体细胞杂交图谱分析明确地将这些序列定位到人类第17号染色体。估算显示每个单倍体基因组(每条17号染色体)约有500-1000个16-mer拷贝和约100个15-mer拷贝,占该染色体DNA的1.5-3%。
2. 揭示了重复单元长度变异的可能机制——不等交换 * 关键发现:比较16-mer和15-mer的序列和结构发现,缺失的单体位于16-mer中三个高度同源(91-94%一致)的单体(13,14,15,均属A组)区域内。这三个单体彼此间的相似性远高于它们与两侧单体(12和16,属E组和A组,一致性67-73%)的相似性。 * 机制推断:这种模式强烈提示,在串联阵列错误配对的情况下,发生在高度同源区域内的同源不等交换(homologous unequal crossing-over)是产生15-mer和16-mer(或反之)等不同长度重复单元的可能机制。研究者进一步通过序列比对,确定了推测的重组断点可能位于单体内部一个相对保守的区域(对应图3中位置2010-2030附近)。
3. 阐明了第17号与X染色体α卫星共享一个古老的进化起源 * 单体构型保守:序列比较表明,alphal7的单体可以归类为A-E五个同源组。当将alphal7的16-mer阵列与alphax的12-mer阵列以特定相位(phase)排列时,发现alphax的整个12-mer单体构型被完整地保留为alphal7的16-mer阵列的一部分(见图4)。这个共享的12-mer区块包含两个相邻的、相关的五聚体(构型为E-A-B-C-D)加上额外的两个单体。 * 序列分化:尽管单体排列构型保守,但这两个染色体亚型在共享的12-mer区块内的核苷酸序列一致性仅为85.5%,单个单体间的比较显示一致性在79%到93%之间。这表明它们在共享一个共同祖先后发生了显著的序列分化。 * 基因组杂交验证:低严格度杂交显示p3-6探针能与X、Y、3、4、21号染色体的α卫星交叉反应。但在高严格度洗膜后,与Y、3、4、21号染色体的杂交信号大幅减弱,而与X染色体的杂交信号保留相对较强。这从基因组水平证实了alphal7与alphax的亲缘关系比其他几个测试的染色体更近。
4. 提出了α卫星亚家族进化的一个模型 * 基于上述发现,研究者提出一个进化模型:一个基于五聚体(pentamer)的共同单体构型最初可能存在于包括17号和X在内的多条人类染色体上。随后,这些序列在不同染色体上独立进化,通过不等交换等过程产生了不同的高阶重复单元结构(如17号的16-mer和X的12-mer)。最后,这些高阶重复单元经过扩增并在各自染色体上固定下来,形成了现今观察到的染色体特异性α卫星亚型。17号和X染色体的α卫星可能属于一个更大的α卫星亚家族(subfamily),它们从一个共同的祖先重复序列演化而来。
五、 结论与研究价值
结论:本研究首次完整解析了人类第17号染色体着丝粒区主要α卫星DNA高阶重复单元(2.7 kb, 16-mer)的核苷酸序列和组织结构,并发现了一个长度变体(15-mer)。研究证实了α卫星的染色体特异性,提出了不等交换是产生该家族内部长度多态性的重要机制,并通过详细的序列与构型比较,提供了强有力的证据表明人类第17号染色体和X染色体的α卫星亚型起源于一个共享祖先的五聚体重复序列,随后发生了独立的分化与扩增。
科学价值: 1. 深化对重复DNA的认识:为理解复杂串联重复DNA家族(如着丝粒卫星DNA)的组成、结构多样性、染色体特异性及其在基因组中的组织方式提供了关键案例。 2. 揭示进化机制:清晰展示了不等交换在塑造卫星DNA序列变异和结构演化中的具体作用,并将推测的重组事件定位到单体内部的特定区域。 3. 建立进化关联:首次在序列和构型水平上将两个不同人类染色体(17号和X)的着丝粒卫星DNA联系起来,为研究人类染色体和基因组的进化历史提供了新的分子标记和视角。 4. 提供研究方法范例:综合运用染色体特异性文库筛选、体细胞杂交定位、精细限制性图谱、系统测序策略(包括外切酶III缺失法)和深入的比较序列分析,为后续研究其他染色体特异性重复序列树立了方法学标杆。
应用价值与潜在影响:对染色体特异性着丝粒卫星DNA的深入研究,为开发基于这些序列的染色体特异性探针奠定了基础,这类探针在细胞遗传学、产前诊断、肿瘤基因组学(用于标记特定染色体)等领域具有重要应用前景。此外,对着丝粒区域DNA结构的理解也有助于探索着丝粒功能、染色体分离机制以及与着丝粒异常相关的疾病。
六、 研究亮点
七、 其他有价值的内容