分享自:

Click-Code-Seq揭示人类基因组中DNA氧化和脱嘌呤的链偏向性

期刊:nature chemical biologyDOI:https://doi.org/10.1038/s41589-025-02052-6

由Vakil Takhaveev、Nikolai J. L. Püllen、Navnit K. Singh、Lucie Lefevre、Emilie A. Aghajani、Sabrina M. Huber、Stefan Schauer、Hailey L. Gahlon、Anna R. Poetsch和Shana J. Sturla等研究人员组成的国际团队,在《自然化学生物学》(Nature Chemical Biology)期刊上(在线发表日期为XXXX年X月X日)发表了一项关于在人类基因组中绘制DNA氧化与脱嘌呤修饰单核苷酸分辨率图谱的重要研究。

DNA作为遗传信息的载体,其稳定性并非绝对。除了可遗传的表观遗传修饰外,DNA还会在多种内源(如细胞代谢产生的活性氧ROS)和外源(如化疗药物、紫外辐射)因素作用下发生化学修饰,产生诸如DNA断裂、无碱基位点(Apurinic/Apyrimidinic sites, AP sites)、8-氧代鸟嘌呤(8-oxo-7,8-dihydroguanine, 8-oxoG)等损伤。这些修饰是衰老、神经退行性疾病和癌症发生的关键驱动因素,同时也是许多抗癌药物(如Irofulven)发挥作用的靶点。然而,在复杂的大型基因组(如人类基因组)中,以单核苷酸精度准确绘制这些多样化DNA修饰的分布图谱,长期以来面临巨大技术挑战。现有研究结果存在不一致性,例如,关于AP位点的形成究竟在腺嘌呤还是鸟嘌呤上更常见,以及在基因启动子区域氧化损伤是富集还是减少等问题,均存在争议。这些矛盾很可能源于方法学上的差异和局限。因此,本研究的核心目标就是开发并升级一种高精度、高特异性的DNA修饰图谱绘制技术,并将其应用于揭示人类基因组中内源性氧化损伤以及化疗药物诱导的脱嘌呤损伤的分布规律与生物学意义。

本研究的工作流程主要围绕两大互补性技术的开发与应用展开:Click-Fluoro-Quant荧光定量Click-Code-Seq测序

首先,研究者开发了Click-Fluoro-Quant,这是一种基于点击化学(Click Chemistry)的快速荧光定量检测方法。 该方法的核心原理是,利用特异性酶(如针对8-oxoG的甲酰胺嘧啶DNA糖基化酶Fpg,针对AP位点的核酸内切酶IV EndoIV)将目标DNA损伤(氧化鸟嘌呤、AP位点或预存的DNA断裂)转化为具有3‘-OH末端的缺口。随后,使用Therminator IX DNA聚合酶将带有炔基(alkyne)修饰的核苷酸(Prop-dNTPs)插入到这些3’-OH位点。最后,通过铜催化的叠氮-炔环加成反应(CuAAC),将带有荧光基团的叠氮化合物连接到炔基上,从而实现对DNA损伤的荧光标记与定量。整个流程仅需约3.5小时,相比传统的质谱(MS)方法更为快速便捷。研究团队利用合成的含特定损伤的寡核苷酸模型验证了该方法的线性定量能力。随后,他们应用该方法成功量化了人类细胞系(HAP1慢性髓系白血病细胞、U2OS骨肉瘤细胞等)中内源性的DNA断裂、AP位点和鸟嘌呤氧化水平,以及暴露于溴酸钾(KBrO3,氧化应激诱导剂)、紫外A(UVA)和化疗药物Irofulven(脱嘌呤诱导剂)后损伤的诱导水平。更重要的是,Click-Fluoro-Quant被用于优化后续测序文库制备的关键步骤:背景修饰的封闭。研究发现,与使用普通dNTP进行“修复”相比,使用双脱氧核苷酸(ddNTP)来“封闭”背景的3‘-OH末端(即内源性断裂和AP位点),能更有效地减少非特异性标记。此外,为了避免DNA样品处理(如超声破碎)过程中引入人为损伤(假阳性),研究团队优化了流程顺序,将超声破碎步骤安排在完成ddNTP封闭和目标损伤标记之后进行,从而最大程度地保留了真实的损伤信号。

其次,研究团队对先前开发的Click-Code-Seq单核苷酸分辨率测序技术进行了全面升级。 Click-Code-Seq的基本原理与Click-Fluoro-Quant类似,也是先将损伤转化为3‘-OH缺口,插入炔基化核苷酸,然后通过点击化学反应连接一个被称为“编码序列”的DNA接头。这个接头上带有一个用于后续PCR扩增和测序的序列标签,从而能够在测序后精确定位原始损伤的基因组坐标。本研究的关键升级在于设计了一种新型的接头——修饰DNA识别序列(Modified DNA Identifier Sequence, Modis)。Modis包含三个模块:1)固定序列的验证码(Validation Code, VC),用于在数据分析时过滤掉因PCR非特异性扩增产生的假阳性读段;2)随机化的索引码(Randomized Index Code, RIC),使得每个Modis接头都具有独特的分子标识符,从而能够区分来源于不同细胞或基因组拷贝的相同损伤位点,避免了常规去重复步骤可能丢失的真实信号,并能评估群体中特定位点的修饰频率;3)用于PCR引物结合的退火位点序列。将优化后的ddNTP封闭策略与Modis接头相结合,研究团队构建了高特异性的测序文库。

数据处理与分析流程严谨而系统。首先,利用Modis中的VC过滤掉约15%的非特异性读段。其次,利用RIC进行分子去重复,这不仅提高了约35%的独特损伤位点检出率,还能评估位点频率。然后,将独特的测序读段比对到人类参考基因组,精确定位损伤发生的单核苷酸位置。为了从不同层面理解损伤分布模式,研究者进行了多层次分析:在单核苷酸水平,分析损伤位点周围的序列偏好性(序列标识图、二核苷酸/三核苷酸背景);在更大基因组区域(如100 kb、10 kb、1 kb分箱),分析损伤水平与染色质状态(利用公共ChIP-seq数据,如H3K4me3、H3K36me3、DNase I超敏位点等)、DNA复制时间(Repli-seq)的相关性;在基因水平,分别分析基因的编码链(转录链)和非编码链(非转录链)的损伤水平,并将其与基因表达量关联;此外,还特别分析了线粒体DNA(mtDNA)的损伤分布。为了探寻DNA损伤模式与癌症突变特征的潜在联系,研究者计算了内源性鸟嘌呤氧化或AP位点在32种三核苷酸背景下的分布谱,并与COSMIC数据库中已知的体细胞单碱基替换(SBS)突变特征进行余弦相似性比较。

本研究取得了一系列重要且新颖的发现,其结果层层递进,揭示了DNA损伤在人类基因组中的非随机分布及其生物学意义。

结果一:内源性鸟嘌呤氧化分布与癌症氧化应激突变特征高度匹配。 在人类HAP1细胞中,Click-Code-Seq成功绘制了超过2000万个内源性氧化鸟嘌呤位点(主要为8-oxoG)。分析其分布规律发现,鸟嘌呤氧化在三核苷酸背景下的频率谱,与COSMIC数据库中注释为活性氧(ROS)相关的突变特征SBS18的余弦相似性高达0.929-0.932,远高于其他85个突变特征。这表明内源性DNA氧化损伤很可能是人类癌症中SBS18突变特征的直接前体。一个有趣的细节是,在CpG二核苷酸背景下的鸟嘌呤,其氧化水平显著低于其他二核苷酸背景(如ApG、TpG、GpG)。研究者进一步通过DNA甲基转移酶1(DNMT1)抑制剂诱导全基因组低甲基化,发现CpG位点的鸟嘌呤氧化水平并未随之发生显著变化,提示这种低氧化水平可能并非直接由胞嘧啶的甲基化状态所调控,其分子机制有待进一步研究。

结果二:化疗药物Irofulven诱导的脱嘌呤具有明确的序列偏好性和独特的突变特征关联。 应用Click-Code-Seq绘制U2OS细胞暴露于Irofulven后的AP位点图谱,发现药物诱导的AP位点主要来源于腺嘌呤(与Irofulven优先烷化腺嘌呤N3位的特性一致),并且高度富集于腺嘌呤二聚体(AAN)序列背景中。这种损伤分布模式与一个病因未知的肾癌相关突变特征SBS40b表现出高度相似性(余弦相似性0.847-0.916),提示某些肾癌可能暴露于与Irofulven生化特性相似的烷化剂。相比之下,在对照(DMSO处理)细胞中检测到的内源性AP位点则主要来源于鸟嘌呤,其分布模式与另外两个未知病因的突变特征SBS39SBS40a高度相似,暗示这些特征可能源于内源性脱嘌呤过程。

结果三:DNA氧化与脱嘌呤损伤展现出与基因转录相关的链偏向性。 这是本研究最核心的发现之一。当分析损伤水平与基因表达的关系时,研究者发现了一个普遍而清晰的规律:无论是内源性鸟嘌呤氧化、Irofulven诱导的AP位点,还是内源性AP位点,它们在基因体内的水平都随着基因表达量的增加而升高。更重要的是,这种增加在基因的非转录链上更为显著,从而导致了一个明显的转录链偏向性——即非转录链上积累的损伤多于转录链,并且这种链偏向性随着基因表达量的增加而加剧。例如,对于内源性鸟嘌呤氧化,在最高表达基因中,非转录链的损伤中位水平比不表达基因增加了14.6%,而转录链仅增加6.3%。对于Irofulven诱导的腺嘌呤AP位点,非转录链的最大增加幅度为27.3%,而转录链为13.1%。这种链偏向性在基因体内持续存在,但在转录起始位点(TSS)上游约5 kb的区域,Irofulven诱导的AP位点的链偏向性发生了“反转”,即转录链上的损伤更多,这或许与TSS上游存在的双向转录有关。线粒体DNA(mtDNA)的分析揭示了不同的模式:内源性鸟嘌呤氧化和腺嘌呤脱嘌呤在重链(多数基因的转录模板链)上更为富集,这可能反映了mtDNA独特的复制(链置换模型)和转录机制。

结果四:损伤分布与染色质状态和复制时相关联。 在100 kb的低分辨率下,鸟嘌呤氧化水平与常染色质标记(如H3K4me3、H3K36me3、DNase I超敏位点)呈正相关,与复制早期区域也呈正相关。然而,当分析分辨率提高到1 kb时,这些相关性减弱至接近零,表明局部(1 kb尺度)的损伤分布并非主要由染色质状态塑造。此外,研究还观察到内源性氧化和脱嘌呤损伤存在微弱的偏向于滞后链模板的复制链偏向性,这可能与滞后链合成过程中产生的单链DNA区域更易受损有关。

本研究通过开发和应用升级版的Click-Code-Seq技术,首次在单核苷酸分辨率上系统绘制了人类细胞中内源性DNA氧化、内源性脱嘌呤以及化疗药物Irofulven诱导脱嘌呤的全基因组图谱,获得了多项具有重要科学价值的结论。其科学价值主要体现在: 1) 技术方法学价值: 成功解决了当前DNA修饰测序领域在特异性、避免人工假象和区分克隆性方面的关键挑战,提供了一套更可靠、信息更丰富的工具(Click-Fluoro-Quant + Click-Code-Seq with Modis),为未来更广泛的DNA修饰研究奠定了方法学基础。2) 对DNA损伤生物学的新认知: 明确了内源性氧化损伤是癌症ROS突变特征SBS18的直接分子前体;将药物诱导损伤(Irofulven)与特定癌症突变特征(SBS40b)联系起来,为追溯环境或药物暴露的致癌风险提供了新思路;最核心的是,普遍且强有力地证明了基因转录活动会以链特异性的方式塑造多种DNA损伤的基因组分布格局,这为理解转录相关基因组不稳定性、DNA损伤修复(特别是转录偶联修复,TC-NER)的调控以及化疗药物的作用机制提供了关键数据。3) 潜在的转化医学价值: 对Irofulven等化疗药物基因组作用模式的精细解析,有助于优化其临床应用,理解耐药性或敏感性机制。对损伤分布与突变特征关联的发现,有助于癌症病因追溯和预防。

本研究的亮点在于: 创新性方法: 开发了快速定量的Click-Fluoro-Quant和高精度、高特异性升级的Click-Code-Seq with Modis接头。重要发现: 首次将内源性DNA氧化损伤的三核苷酸谱与特定癌症突变特征(SBS18)精准匹配;首次揭示了Irofulven诱导损伤的基因组分布特征及其与肾癌突变特征(SBS40b)的关联;系统性地、在不同类型损伤中证实了强烈的、基因表达依赖的转录链偏向性,这是对转录与基因组稳定性关系的重要补充。研究深度: 从单核苷酸序列背景,到染色质、复制、转录多维度,再到线粒体基因组,进行了全面而深入的分析,构建了一幅关于人类基因组DNA损伤景观的精细地图。这些工作极大地推进了我们对于关键DNA修饰如何影响人类细胞生理和毒理学响应的理解。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com