本研究发表于《化学科学》(*Chemical Science*)期刊2025年第16卷,文章标题为“通过工程化双加氧酶NTet辅助的ENAPS技术直接测序DNA 5-甲基胞嘧啶”。主要作者为张珊、谢能斌、曾丽、甘芳银、谷耀华、王敏、郭霞、季彤彤、熊骏和袁必锋。通讯作者单位为武汉大学,合作单位包括湖北省疾病预防控制中心与食品风险评估国家重点实验室。文章于2025年5月20日收到,2025年7月11日接受。
研究背景与动机 DNA甲基化,特指胞嘧啶第5位碳原子的甲基化(5-Methylcytosine, 5mC),是哺乳动物中最普遍的DNA表观遗传修饰,与疾病发生和癌症发展密切相关。单碱基分辨率水平的测序和定量分析5mC对于阐明其生物学功能至关重要。然而,现有的主流技术面临诸多挑战。传统的亚硫酸氢盐测序(Bisulfite Sequencing, BS-seq)虽然是金标准,但其反应条件苛刻,会导致DNA严重降解,且无法区分5mC与其氧化产物5-羟甲基胞嘧啶(5hmC)。此外,BS-seq将未修饰的C(胞嘧啶)转化为U(尿嘧啶),导致序列复杂度降低,影响了后续分析的准确性。尽管出现了多种基于脱氨酶(如APOBEC3A)或甲基转移酶保护的替代方法,但它们大多仍依赖于间接检测机制(即检测未修饰的C),或存在序列偏好性(如仅能检测CpG上下文中的5mC)。Tet辅助的吡啶硼烷测序(TAPS)技术通过Tet家族蛋白将5mC氧化为5-甲酰基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC),再由吡啶硼烷还原为二氢尿嘧啶(DHU),最终在测序中读为T(胸腺嘧啶),实现了5mC到T的直接转化,避免了背景干扰。然而,哺乳动物来源的Tet蛋白(TET1, TET2, TET3)通常需要在真核表达系统中生产,成本高昂且不稳定,并且它们对非CG序列(如CHH, CHG, H = A, T, C)的氧化活性存在偏好性,导致检测不完全和定量不准确。因此,开发一种成本低、稳定性高、序列兼容性好的重组Tet酶,以推动基于直接转化原理的5mC测序技术,是领域内的重要需求。
研究目标 本研究旨在通过蛋白质工程手段改造来源于原生动物*Naegleria*的Tet样蛋白(NTet),获得一种具有高活性、宽序列兼容性的重组工程化NTet(eNTet)。并基于此eNTet,结合吡啶硼烷还原化学,开发一种名为“工程化NTet辅助的吡啶硼烷测序”(Engineered NTet-assisted Pyridine borane Sequencing, ENAPS)的新方法,以实现对DNA中5mC的高精度、单碱基分辨率的定量检测。
详细研究流程与实验方法 本研究流程主要包括三大模块:eNTet蛋白的工程化设计与表达纯化、ENAPS方法学的建立与特性评估、以及在真实生物样本中的应用验证。
1. eNTet蛋白的工程化、表达与功能验证 首先,研究人员对野生型NTet(wtNTet)进行了工程化改造。基于蛋白质结构(PDB:5CG8)的分析,他们将第240位的亮氨酸(Leu)突变为丙氨酸(Ala),以扩大酶的活性口袋空间。同时,为了提高蛋白与DNA底物的结合能力,将一种突变型大肠杆菌素E7 DNase(Mce7)融合到eNTet的N端。改造后的eNTet基因被克隆到带有6×His和麦芽糖结合蛋白(MBP)亲和标签的载体中,并在大肠杆菌(*E. coli*)BL21(DE3)中成功实现了高效表达。蛋白通过镍柱亲和层析、肝素离子交换层析和尺寸排阻色谱多步纯化,获得了高纯度产物。
随后,通过两种方法系统评估了eNTet的氧化活性。第一种是酶切分析法:使用在特定位置含有5mC的荧光(FAM)标记的双链DNA(dsDNA)作为底物。eNTet将其氧化为5fC和5caC后,利用胸腺嘧啶DNA糖基化酶(TDG)特异性识别并切除5fC和5caC,形成脱嘌呤/脱嘧啶(AP)位点,再由APE1酶切割,最终通过变性聚丙烯酰胺凝胶电泳(PAGE)分析DNA片段长度变化。结果显示,经eNTet处理的样品产生了清晰的截短产物条带,表明5mC被高效氧化并被TDG/APE1通路成功切除。相比之下,wtNTet的处理效率较低。同时,实验证实eNTet能高效氧化5hmC,但无法氧化经过β-葡萄糖基转移酶(β-GT)糖基化保护的5hmC(5gmC)。
第二种是液相色谱-串联质谱(LC-MS/MS)定量分析法:研究人员合成了四种在不同序列上下文(CG, CC, CT, CA)中含有5mC的309 bp dsDNA底物。用eNTet处理后,将DNA酶解为核苷,并通过LC-MS/MS精确测定修饰核苷的含量。结果表明,eNTet能够将四种序列背景下的5mC几乎完全氧化,主要产物是5caC(占约90%),并伴有少量5fC(约10%)。而wtNTet的氧化不完全,产物中除5fC和5caC外,还残留了相当比例的中间产物5hmC(约17%)。这充分证明了工程化改造显著提升了NTet的催化效率和彻底性。
2. ENAPS方法的开发与定量性能评估 基于上述高效的eNTet,研究人员建立了完整的ENAPS实验流程。第一步是氧化反应:将DNA样本与eNTet、辅因子(α-酮戊二酸、Fe²⁺、抗坏血酸)在温和条件下(pH 6.9, 34°C)孵育,将5mC氧化为5fC/5caC。第二步是还原反应:在酸性条件下(pH 4.3),使用吡啶硼烷将第一步产生的5fC和5caC还原为DHU。第三步是PCR扩增与测序:在后续的PCR过程中,DHU被DNA聚合酶读作T,而未修饰的C保持不变。为了区分5mC和5hmC,可以在氧化步骤前先用β-GT处理DNA,将5hmC糖基化为eNTet无法作用的5gmC,从而实现选择性检测。
为了评估ENAPS的基本特性,研究使用了含有5mC或5hmC位点的合成DNA模板。桑格测序(Sanger sequencing)结果直观显示,经ENAPS处理后,5mC位点的测序峰完全转变为T峰,而周围的C峰保持不变。对于5hmC,如果在ENAPS前不加β-GT处理,它也会被氧化并最终读为T;若预先进行β-GT保护,则5hmC被读为C。菌落测序结果进一步证实了该方法的准确性:对50个克隆进行测序,所有5mC位点均被一致地读为T,所有C位点均被读为C,未发现错误。
接下来,研究系统评估了ENAPS的定量能力。他们将含有5mC的DNA(如DNA-5mCG)与不含5mC的对应DNA(如DNA-CG)按不同比例(0%, 33%, 50%, 66%, 100%)混合,模拟不同甲基化水平的样本。经过ENAPS处理和桑格测序后,通过计算特定位点上T峰与(T+C)总峰高的比例,可以计算出该位点的5mC水平。结果显示,在CG, CC, CT, CA四种序列背景下,测得的T/(T+C)比例与实际混合比例呈极佳的线性关系(R² > 0.99),证明了ENAPS能够在单碱基分辨率下对5mC进行准确定量,且不受序列上下文影响。
3. 在肺癌组织基因组DNA中的应用 为验证ENAPS在复杂生物样本中的实用性,研究人员将其应用于人非小细胞肺癌(NSCLC)组织及其配对癌旁正常组织的基因组DNA分析。他们选取了癌基因*EGFR*(表皮生长因子受体)基因体内的两个特定位点(chr7: 55109538和chr7: 55109595)进行研究。首先将基因组DNA超声片段化,然后进行ENAPS处理(包括氧化、还原、PCR扩增),最后通过桑格测序进行位点特异性定量。作为对照,同时使用商业化的亚硫酸氢盐转化试剂盒对同一样本进行BS-seq分析。
主要研究结果 1. 成功获得高性能eNTet蛋白:工程化改造的eNTet蛋白可以在原核系统中低成本、高产量表达。其氧化活性远超野生型NTet,能够将近100%的5mC(无论位于CG或非CG序列)高效、彻底地氧化为5fC和5caC,主要产物是5caC。 2. ENAPS方法学成功建立:基于eNTet开发的ENAPS方法,工作流程清晰可靠。实验证实,该方法能够特异性地将5mC直接转换为T,而完全不干扰未修饰的C。通过预糖基化步骤,可以有效地将5mC与5hmC区分开。 3. 高精度定量能力:使用合成DNA混合样本的验证实验表明,ENAPS对5mC的定量结果与实际掺入比例高度一致,线性关系良好,证明了该方法在单碱基水平进行准确定量的可靠性,且适用于所有CN(N = G, C, T, A)序列背景。 4. 在肺癌样本中成功检测到甲基化差异:应用ENAPS对肺癌及癌旁组织的*EGFR*基因进行检测,结果显示,在两个检测位点上,癌旁正常组织的5mC水平很高(分别为96.5%和100%),而在癌组织中,这两个位点的5mC水平显著下降(分别降至54.5%和46.4%)。这一结果与BS-seq的检测趋势一致,但ENAPS避免了BS-seq中因C到U转换导致的序列复杂度降低问题。这证明了ENAPS能够应用于真实基因组DNA,并检测出与癌症相关的特定位点甲基化动态变化。
结论与意义 本研究成功开发了一种名为ENAPS的新型、无亚硫酸氢盐的DNA甲基化测序方法。其核心创新在于通过蛋白质工程获得了具有高活性、宽序列兼容性的重组双加氧酶eNTet。ENAPS利用eNTet将5mC氧化,再经温和的吡啶硼烷化学还原,实现了5mC到T的直接、特异性转化。该方法具有以下多重优势:首先,避免了BS-seq的DNA降解和序列偏好性问题;其次,直接检测目标修饰(5mC),背景信号低;第三,eNTet成本低、稳定性好,且对CG和非CG位点的5mC均有良好氧化效果,克服了哺乳动物Tet蛋白及一些甲基转移酶方法的局限性;第四,通过糖基化保护可区分5mC和5hmC。本研究不仅证明了ENAPS在合成DNA体系中的优异性能,还成功将其应用于肺癌组织样本,定量揭示了癌与癌旁组织在特定基因位点上的甲基化差异,展示了其在表观遗传学和疾病研究中的应用潜力。
研究亮点 1. 酶工程的成功应用:通过对NTet进行理性设计(L240A突变和融合Mce7),显著提升了其对5mC的氧化活性和底物兼容性,创造了一个性能优越、易于生产的工具酶。 2. 方法学的创新与优越性:ENAPS方法整合了高效的酶促氧化和温和的化学还原,实现了对5mC高精度、直接、单碱基分辨率的检测。与现有方法(如BS-seq, EM-seq, TAPS, MLAD-seq等)相比,在DNA友好性、检测直接性、序列普适性和成本效益方面具有综合优势。 3. 解决关键痛点:直接应对了当前5mC测序领域在非CG甲基化检测、定量准确性、成本与操作复杂性方面的挑战,为表观基因组学研究提供了一个强有力的新工具。 4. 概念验证到实际应用:研究逻辑严密,从蛋白质工程、方法建立、体外验证到最终在临床相关样本(肺癌组织)中完成概念性应用,形成了一个完整的研究闭环,有力地证明了ENAPS技术的可行性和实用价值。
其他有价值内容 文章在讨论部分对比了ENAPS与多种现有技术的优劣,清晰地阐述了其技术定位。同时,作者也提及了一项近期报道的利用光激活纳米脱甲基酶选择性氧化5mC的研究,指出这可能为5mC测序提供另一种化学氧化策略,显示了作者对领域发展的关注。所有实验的详细材料、试剂、引物序列、蛋白序列等补充信息均以电子补充材料(ESI)形式提供,确保了研究的可重复性。