分享自:

利用CRISPR-Cas9介导的饱和诱变剖析bcl11a增强子

期刊:NatureDOI:10.1038/nature15521

本文档是一篇发表于《自然》(Nature)期刊的原创性研究论文,标题为“通过CRISPR-Cas9介导的原位饱和诱变解析BCL11A增强子”。研究于2015年11月12日在线发表,最终版本于2016年5月12日可在PMC获取。本研究的主要作者包括Matthew C. Canver、Elenoe C. Smith、Falak Sher、Luca Pinello、Neville E. Sanjana、Ophir Shalem等,通讯作者为Daniel E. Bauer、Stuart H. Orkin和Feng Zhang。作者们来自多个顶尖研究机构,包括波士顿儿童医院/丹娜-法伯癌症研究所/哈佛干细胞研究所/哈佛医学院、麻省理工学院和哈佛大学博德研究所、以及理化学研究所生物资源中心等。

本研究的科学领域属于功能基因组学、基因调控和基因编辑技术应用,特别是针对非编码基因组元件的功能解析。研究背景在于,增强子(enhancer)是决定细胞身份的关键调控元件,通常通过染色质标记和相关分析来预测,但其在原生基因组环境中的必要性通常需要通过功能缺失实验来验证。BCL11A是胎儿血红蛋白(HbF)的关键抑制因子,是治疗β-血红蛋白病(如镰状细胞病和β-地中海贫血)的重要靶点。先前研究已发现一个与HbF水平相关的常见遗传变异位点位于BCL11A的一个红细胞特异性增强子内,其小鼠同源区域被证明对红细胞BCL11A表达是必需的。然而,对于该增强子的精确功能架构、关键序列特征以及其在人类和小鼠之间的保守性,尚缺乏高分辨率的理解。因此,本研究旨在开发并应用一种基于CRISPR-Cas9的高通量、原位饱和诱变筛选策略,以在单核苷酸分辨率水平上系统性解析人类和小鼠BCL11A增强子的功能元件,揭示其最小关键特征和离散脆弱性,并为基于基因组编辑的HbF重新诱导疗法提供精确的靶点图谱。

本研究的工作流程复杂而系统,主要包含以下几个关键步骤:

首先,研究人员构建了针对人类和小鼠BCL11A增强子区域的向导RNA(sgRNA)文库。他们设计了覆盖人类增强子三个DNase I超敏位点(DHSs,即+55, +58, +62)以及小鼠同源区域的所有可能的sgRNA(仅限于具有NGG PAM序列的位点)。这些sgRNA与靶向BCL11A外显子2(作为阳性对照)和非靶向sgRNA(作为阴性对照)一起,被克隆到慢病毒载体中,构建成高通量筛选文库。文库的覆盖度经过深度测序验证,确保每个sgRNA都有足够的代表性。

其次,在人类细胞模型(HUDEP-2,一种永生化的人CD34+造血干细胞来源的红系前体细胞系)和小鼠细胞模型(MEL,小鼠红白血病细胞,并改造为携带εy-胚胎珠蛋白-mCherry报告基因)中进行了大规模的CRISPR-Cas9筛选。他们将稳定表达Cas9的细胞系以低感染复数(MOI)转导sgRNA文库慢病毒,确保大多数细胞只整合一个sgRNA。经过药物筛选和扩增后,让Cas9在细胞内切割基因组,通过非同源末端连接(NHEJ)修复产生插入或缺失突变(indels),从而实现对增强子区域的“饱和式”诱变。接着,他们将细胞诱导分化为红细胞,并通过流式细胞术根据HbF(人类细胞)或mCherry报告基因(小鼠细胞)的表达水平,分选出高表达和低表达的细胞群体。随后,从这两群细胞中提取基因组DNA,通过PCR扩增并深度测序整合的sgRNA序列,通过比较每个sgRNA在高表达池和低表达池中的丰度,计算出一个“富集分数”,用以量化该sgRNA介导的基因编辑对靶基因(BCL11A)表达和下游表型(HbF或胚胎珠蛋白表达)的影响。

第三,对筛选数据进行深入分析。他们将每个sgRNA的富集分数映射到其预测的基因组切割位点,从而在增强子区域内绘制出功能图谱。他们观察到,大多数靶向增强子的sgRNA没有显著的表型效应,而具有显著富集分数(即能有效诱导HbF/胚胎珠蛋白表达)的sgRNA集中在增强子的特定离散区域。为了更精确地识别功能区域,他们开发并应用了隐马尔可夫模型(HMM)对富集分数数据进行分割,将增强子序列划分为“激活”、“抑制”和“中性”三种功能状态。此外,他们还对筛选出的关键sgRNA(如靶向人类+58 DHS的sgRNA-1621和sgRNA-1617)进行了深入验证。他们通过深度测序分析了经这些sgRNA处理的细胞中,HbF高和低群体在靶位点产生的indel谱,计算了每个核苷酸位置的“indel富集比”,从而在单碱基水平上定位了导致功能丧失的关键突变热点。

第四,利用传统的CRISPR-Cas9介导的基因编辑技术(使用成对的sgRNA)在细胞系中生成特定的增强子区域缺失或倒位克隆,以验证筛选结果。例如,他们构建了人类HUDEP-2细胞中整个复合增强子、单个DHS(+55, +58, +62)缺失或倒位的克隆,并检测了BCL11A和γ-珠蛋白的表达变化。在小鼠MEL细胞中也进行了类似的操作。这些实验证实了筛选发现的可靠性,并证明了增强子功能的方向无关性。

第五,将关键发现从细胞系模型扩展到原代细胞和活体动物模型。他们将筛选得到的、能最有效诱导HbF的人类增强子靶向sgRNA(sgRNA-1621)导入原代人CD34+造血干细胞和祖细胞(HSPCs),并在体外红系分化培养体系中验证了其能有效下调BCL11A并上调γ-珠蛋白和HbF,且不影响细胞的分化和形态。更重要的是,他们利用CRISPR-Cas9技术构建了携带小鼠+62同源区域(m+62)生殖系缺失的小鼠模型。与传统的BCL11A全身性敲除小鼠(出生后很快死亡)不同,这些增强子特异性缺失的小鼠出生时健康,且B细胞发育和大脑中的BCL11A表达正常,但在红细胞中BCL11A表达显著降低。当将这些小鼠与携带人β-珠蛋白基因簇转基因(β-YAC)的小鼠杂交后,发现其胎儿肝脏中人γ-珠蛋白的沉默被显著延迟,而人β-珠蛋白的激活也相应推迟,呈现剂量依赖性效应,这直接证明了靶向红细胞特异性增强子可以在体内实现组织特异性的基因调控,并影响血红蛋白转换。

本研究获得的主要结果如下:

  1. 绘制了人类BCL11A增强子的高分辨率功能图谱:筛选发现,人类增强子的三个DHSs中,+58 DHS是功能最关键的“热点”区域。靶向该区域一小段42bp核心序列的多个sgRNA能最有效地诱导HbF,其效应强度与直接敲除BCL11A外显子2相当。HMM分析进一步精确定义了每个DHS内的功能亚区域。验证实验表明,删除h+58 DHS几乎能完全模拟删除整个复合增强子或敲除BCL11A基因的效果,而删除h+55效果中等,删除h+62效果最弱。倒位实验证明增强子在原位发挥功能时不依赖方向。

  2. 揭示了人类BCL11A增强子关键序列的灵长类特异性:对h+58核心区域的分析显示,虽然存在一个相对保守的GATA1转录因子结合基序,但导致功能丧失的突变富集热点和关键的sgRNA切割位点主要位于该基序侧翼的、在灵长类动物中高度保守但在非灵长类脊椎动物中高度退化的序列上。这表明驱动人类BCL11A红细胞特异性表达和HbF抑制的核心增强子元件具有灵长类特异性,可能反映了人类特有的γ-珠蛋白发育调控机制。

  3. 绘制了小鼠BCL11A增强子的功能图谱并发现其架构与人类存在分歧:在小鼠筛选中,发现关键的调控功能主要位于m+62同源区域,而m+58同源区域在小鼠中甚至不表现出DNase I超敏性,且筛选未发现任何功能效应。删除m+62几乎完全消除了BCL11A的表达,而删除m+55仅导致表达量减半。这表明尽管人类和小鼠的BCL11A红细胞增强子在整体上功能保守(都是必需的),但其内部的功能架构和关键元件的定位发生了进化上的分歧。

  4. 验证了靶向增强子进行治疗的可行性与优势:在原代人红系前体细胞中,单个sgRNA(sgRNA-1621)靶向h+58核心区域即可有效诱导HbF,证明了通过编辑非编码增强子元件治疗β-血红蛋白病的概念可行性。更重要的是,小鼠体内实验表明,删除红细胞特异性的m+62增强子可以在不影响小鼠神经系统发育和B淋巴细胞生成(BCL11A在这些过程中也至关重要)的前提下,特异性降低红系BCL11A表达并延迟胎儿血红蛋白的沉默。这提示增强子编辑策略可能具有更高的组织特异性和安全性,避免了全身性敲除BCL11A可能带来的严重副作用。

本研究的结论是,开发并成功应用了一种基于CRISPR-Cas9的、高通量的原位饱和诱变筛选方法,用于系统性地解析非编码基因组元件的功能。利用该方法,以前所未有的分辨率绘制了人类和小鼠BCL11A红细胞增强子的功能图谱,揭示了其关键的最小功能单元和物种特异性的架构差异。研究证实,靶向该增强子的特定关键序列(尤其是人类+58 DHS的核心区域)可以有效且特异性地重新诱导HbF,为开发治疗β-血红蛋白病的精准基因组编辑疗法提供了明确的靶点和理论依据。

本研究的亮点和创新之处在于:第一,方法学创新:首次将CRISPR-Cas9 sgRNA文库筛选技术系统地应用于非编码增强子元件的功能解析,实现了接近单碱基分辨率的“原位饱和诱变”,为大规模研究非编码基因组功能建立了新范式。第二,科学发现的重要性和精确性:不仅验证了增强子的必要性,还精细定位了其功能核心,并揭示了人类和小鼠之间增强子功能的进化重塑,深化了对基因调控元件保守性与物种特异性的理解。第三,明确的转化医学价值:研究直接指向了治疗β-血红蛋白病这一重大临床需求,证明了通过编辑单个增强子元件实现治疗性HbF诱导的可行性,并强调了其潜在的组织特异性优势,为开发更安全、更精准的基因治疗策略铺平了道路。第四,多层次验证体系:从高通量筛选到细胞克隆验证,从原代细胞实验到转基因动物模型,构建了完整、严谨的证据链,增强了结论的可靠性。

此外,研究还讨论了该方法的局限性(如受限于Cas9的PAM序列)和未来改进方向(如使用不同PAM偏好的Cas9变体)。作者指出,这种筛选策略可广泛应用于其他非编码基因组元件的功能研究。文末详细描述了所有实验方法,包括细胞培养、载体构建、文库制备、流式分选、深度测序分析、动物模型构建等,为其他研究者重复和应用该方法提供了完整的技术细节。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com