分享自:

用于单核苷酸分辨率DNA修饰与损伤基因组定位的Nick-seq技术

期刊:Nucleic Acids ResearchDOI:10.1093/nar/gkaa473

本研究是由来自曲阜师范大学、麻省理工学院、新加坡-麻省理工学院研究与技术联盟、上海交通大学、武汉大学、新加坡竹脚妇幼医院、安徽大学等多家机构的科研人员合作完成的一项原创性研究。主要作者包括Bo Cao, Xiaolin Wu, Jieliang Zhou, Hang Wu, Lili Liu, Qinghua Zhang, Michael S. DeMott, Chen Gu, Lianrong Wang, Delin You 和 Peter C. Dedon。该研究以题为《Nick-seq for single-nucleotide resolution genomic maps of DNA modifications and damage》的论文形式,于2020年6月2日在线发表在学术期刊《Nucleic Acids Research》2020年第48卷第12期上。

这项研究属于分子生物学和基因组学交叉领域,聚焦于DNA化学修饰与损伤的高分辨率检测技术。在细胞中,基因组DNA持续受到来自内源和外源压力的化学修饰,包括损伤、损伤修复的中间体以及酶介导的表观遗传修饰。这些修饰深刻影响着基因组的稳定性和细胞表型,其失调与许多人类疾病相关。尽管全基因组测序已很普遍,可以轻松绘制突变的后果,但能够准确定量和定位基因组中DNA修饰的技术却非常有限,且高度专门化。例如,亚硫酸氢盐测序仅适用于5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)等少数修饰;单分子实时(SMRT)和纳米孔测序等技术虽然能检测更多类型,但存在灵敏度低、特异性差或分辨率不足等问题;而基于富集的测序方法(如ChIP-seq)分辨率较低。因此,迫切需要一种通用的、高灵敏度、高特异性和单核苷酸分辨率的方法来绘制多种类型的DNA修饰和损伤图谱。本研究的目标正是开发这样一种名为Nick-seq的新方法,其核心原理是将目标DNA修饰或损伤转化为DNA链断裂,然后通过两种互补的策略捕获断裂末端,结合下一代测序(NGS),实现对任意可转化为链断裂的DNA修饰或损伤进行单核苷酸分辨率的高灵敏度、定量基因组图谱绘制。

Nick-seq方法的详细工作流程包含一系列精心设计的实验步骤和后续的数据分析流程。首先,从研究对象(如大肠杆菌、沙门氏菌)中纯化基因组DNA。研究使用了三种不同的生物样本:1) 用于方法验证的大肠杆菌DH10B菌株;2) 用于绘制天然磷硫酰化(phosphorothioate, PT)修饰图谱的沙门氏菌Cerro 87菌株;3) 用于绘制过氧化氢诱导的无碱基位点(Abasic sites, AP sites)图谱的经亚致死剂量H2O2处理的大肠杆菌DH10B。样本量方面,研究通常从培养的细菌细胞中提取微克级别的基因组DNA进行后续操作。整个流程始于DNA片段化与预断裂封闭。纯化的基因组DNA首先被限制性内切酶(如NciI, HindIII/XhoI, Sali/XbaI/NdeI组合)随机切割成适合测序的片段,以模拟真实样本中经过片段化处理的DNA。随后,一个关键步骤是封闭所有预先存在的链断裂末端:使用虾碱性磷酸酶去除3‘-磷酸,然后利用DNA聚合酶I和双脱氧核苷酸(ddNTPs)进行延伸反应,将ddNTPs掺入到这些断裂的3’-OH末端,从而永久性地“封端”,防止它们在后续步骤中被误认为是由目标修饰产生的切口。

接下来是修饰特异性转化为链断裂。针对不同的目标修饰,采用特异性的酶学或化学方法将其转化为带有3‘-OH的DNA单链断裂(即”切口“)。在本研究中展示了三种转化方案:1) 对于验证性实验,直接使用商业化的切口内切酶Nb.BsmI和Nb.BsrDI切割大肠杆菌DNA中特定的序列位点。2) 对于沙门氏菌中的PT修饰,使用碘处理,特异性氧化PT键并导致其断裂。3) 对于H2O2处理大肠杆菌产生的AP位点,使用AP核酸内切酶IV(Endonuclease IV)进行切割,该酶能识别并切割天然及氧化型的AP位点。

随后,将经过“切口转化”的DNA样本等分为两部分,分别通过两种互补的策略进行文库构建。第一部分进行缺口平移标记。在切口处,利用DNA聚合酶I的5‘→3’聚合酶活性,以切口为起点,掺入含有α-硫代磷酸键的核苷酸(α-thio-dNTPs)进行延伸,合成一段100-200个核苷酸长、骨架中含有硫代磷酸酯键的寡核苷酸。硫代磷酸酯键能抵抗某些核酸外切酶的消化。接着,使用核酸外切酶III(3‘→5’方向)和RecJf(5‘→3’方向)的组合,大规模消化未被硫代磷酸酯保护的基因组DNA模板链,从而富集出含有目标修饰位点信息(位于硫代磷酸酯片段5‘端)的受保护片段。纯化后的片段用于构建Illumina测序文库。第二部分进行末端转移酶加尾。直接利用终端脱氧核苷酸转移酶(Terminal deoxynucleotidyl transferase, TdT)在切口产生的3‘-OH末端添加一条poly(dT)尾巴。然后,通过逆转录酶模板转换技术,以poly(dT)尾为引物合成互补链,进而构建测序文库。这种方法将修饰位点定位于poly(dT)尾的5’端。两种方法构建的文库均使用Illumina NextSeq 500平台进行75 bp双末端测序。

数据分析流程体现了本研究的另一大创新点。研究团队开发了一套自定义的数据分析工作流,在Galaxy平台上运行,旨在整合两种方法的数据以提高检测的灵敏度和特异性。原始测序读数经过去除接头和修剪后,比对到参考基因组。对于缺口平移法数据,分析读数的5‘端(R1)覆盖度;对于末端转移酶法数据,分析读数的5’端(R2)覆盖度。通过对每个基因组位点的覆盖度进行归一化处理,并计算三个关键比率来识别潜在的修饰位点:1) 位点n的覆盖度 / 位点n-1的覆盖度;2) 位点n的覆盖度 / 位点n+1的覆盖度;3) 位点n在实验样本中的覆盖度 / 位点n在阴性对照样本中的覆盖度。只有当这三个比率都大于设定的阈值时,该位点才被初步认为是候选修饰位点。为了进一步提高准确性,研究采用了互补验证策略:由于缺口平移法对所有碱基类型一视同仁但假阳性较高,而末端转移酶法在修饰位点恰好为T时因poly(dT)尾在数据处理中被去除而无法精确定位(会导致一个核苷酸的偏移),因此将两种方法的结果进行交叉验证。例如,如果缺口平移法在基因组位置1000(碱基为T)检测到一个切口,那么就去末端转移酶法数据中检查位置999或1001是否有切口信号。如果缺口平移法检测到的切口发生在G、C或A,则要求末端转移酶法在相同位置有信号。通过这种策略,可以有效地剔除缺口平移法的假阳性结果,显著提升最终图谱的特异性和准确性。

本研究取得了多项重要结果。首先,在方法验证部分,使用切口内切酶Nb.BsmI处理大肠杆菌基因组DNA。Nb.BsmI在基因组中有2681个预测切割位点。Nick-seq在覆盖度比率设为2时,成功识别出2462个位点,占预测位点的97.5%,显示出极高的灵敏度。在检出的位点中,有27个(约1%)位于与共识序列相差一个核苷酸的“星号活性”位点,这些位点的平均测序覆盖度(75)远低于共识位点(1318),符合预期。另一项使用Nb.BsrDI的验证实验也表明,该方法没有明显的3‘端序列偏好性。这些结果证实Nick-seq能够以高准确度和灵敏度对DNA链断裂进行单核苷酸分辨率的基因组定位。

其次,在应用一:绘制磷硫酰化修饰图谱中,将Nick-seq应用于沙门氏菌Cerro 87菌株。PT是一种天然存在的DNA骨架修饰。研究使用碘处理将PT转化为链断裂。Nick-seq在全基因组范围内识别出12,239个PT位点。其中,11,684个(96%)位于预期的GAAC/GTTC序列基序中,占该菌株32,795个潜在GAAC/GTTC位点的37%。在修饰的位点中,73%为双链修饰,27%为单链修饰。这一结果与之前使用SMRT测序的研究趋势一致,但Nick-seq检测到的修饰密度(37%)显著高于SMRT测序报道的(10-15%),表明其灵敏度更高。此外,Nick-seq还检测到了少量位于其他序列基序(如GPSTAC, GPSATC)的PT修饰,其中一半为单链修饰,这些是之前方法未能充分揭示的。

第三,在应用二:揭示过氧化氢诱导的氧化性DNA损伤位点中,研究探索了Nick-seq对一个尚未有高分辨率基因组图谱的修饰类型的应用:氧化应激诱导的AP位点。用0.2 mM(亚致死剂量)的H2O2处理大肠杆菌,提取DNA后用AP核酸内切酶IV处理。Nick-seq在4.68 Mb的基因组中识别出1519个内切酶IV敏感位点(即AP位点),而在未经处理的对照中仅检测到11个。同时,在该菌株携带的一个内源性质粒(约3 kb)上,处理组检测到82个AP位点,对照组为8个。分析AP位点的碱基来源(即被移除的碱基)发现,其分布相对均匀:胸腺嘧啶(33%)、腺嘌呤(25%)、胞嘧啶(24%)、鸟嘌呤(18%),质粒上的分布也类似。这一结果出乎意料,因为传统认为鸟嘌呤最易被氧化,这提示在体内环境下,DNA糖基的氧化或非选择性损伤机制可能占主导。序列上下文分析显示,AP位点上游-1位置强烈偏好胞嘧啶(47%)。空间分布分析揭示了非随机性:AP位点在全基因组编码区(0.34个/kb)的密度略高于非编码区(0.20个/kb),而在复制起点(oriC)附近20 kb区域的密度(0.70个/kb)显著高于基因组平均水平(0.32个/kb)。在质粒上,AP位点显著富集于三个功能区域:F1复制起点、pUC复制起点和AmpR抗性基因编码区。这些发现表明,在氧化应激下,正在复制或转录的活跃DNA区域更容易形成AP位点,这与之前的免疫染色研究结论一致,但Nick-seq提供了前所未有的单核苷酸分辨率细节。

基于上述结果,本研究得出结论:Nick-seq是一种通用的、高灵敏度、高特异性且定量准确的单核苷酸分辨率DNA修饰与损伤基因组图谱绘制技术。其科学价值在于突破了现有技术对特定修饰类型的依赖性和在灵敏度、分辨率上的局限,为表观遗传学、DNA损伤与修复、环境毒理学等领域的研究提供了一个强大的新工具。通过将目标修饰转化为链断裂这一共同中间体,Nick-seq理论上可应用于任何能够通过已知生化反应转化为链断裂的DNA化学修饰。论文中甚至列出了一个包含超过25种不同类型DNA修饰和损伤的潜在应用策略表,涵盖了从碱基切除修复(BER)中间体、氧化损伤、烷基化损伤、紫外损伤产物到5-甲基胞嘧啶等表观遗传标记。该方法的应用价值在于能够帮助研究人员深入探究各种DNA修饰在基因组中的精确分布规律、形成机制、与基因组功能元件(如复制起点、启动子、基因体)的关联,以及它们在疾病发生发展中的作用。

本研究的亮点十分突出。第一,方法学上的重要创新:提出了“缺口平移标记”与“末端转移酶加尾”双路并行的互补策略,并巧妙地利用硫代磷酸酯的抗酶切特性进行选择性富集,以及通过交叉验证数据分析流程有效降低了假阳性,这是其高灵敏度和高特异性的关键。第二,广泛的适用性:该方法不依赖于修饰特异性抗体或单一的化学反应,其核心是“修饰转化”步骤,因此只要找到将目标修饰转化为链断裂的方法(酶学或化学),即可应用Nick-seq,使其成为一个平台型技术。第三,验证充分,应用实例有力:不仅用已知切割位点的内切酶严格验证了方法的准确性,还成功绘制了天然PT修饰和体内诱导的AP位点这两种具有生物学意义且挑战性不同的修饰图谱,证明了方法的实用性和强大功能。第四,揭示了新的生物学见解:特别是在AP位点的研究中,获得了关于其碱基来源分布和基因组定位偏好性的新发现,展示了Nick-seq在解决具体生物学问题上的潜力。

此外,研究团队已将数据处理的自定义脚本公开在GitHub上,测序数据也已存入NCBI GEO数据库,体现了研究的可重复性和开放性。同时,作者也指出了当前方法的一些局限,例如缺口平移法背景较高可能与使用的核酸外切酶组合效率有关,并探讨了使用核酸酶P1的潜在优势和挑战。Nick-seq为代表的高分辨率DNA修饰检测技术的发展,将极大推动我们对基因组化学复杂性及其在生命过程中功能的理解。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com