基于人工修饰碱基的基因组尺度尿嘧啶单碱基分辨率分析研究
作者及发表信息
本研究由武汉大学化学与分子科学学院的Yafen Wang、Xiong Zhang、Shaoqing Han等共同完成,通讯作者为Xiaocheng Weng和Xiang Zhou。研究成果发表于《ACS Central Science》,发表日期为2020年11月,DOI号为10.1021/acscentsci.0c01504。
学术背景
DNA表观遗传修饰(epigenetic modifications)在基因调控中具有重要作用,其异常状态与癌症等疾病密切相关。尿嘧啶(uracil, U)作为RNA的常规碱基,在DNA中可通过胞嘧啶(cytosine, C)脱氨基或dUMP错误掺入产生,但其生物学功能尚未完全阐明。传统检测技术(如LC/MS/MS、PCR-based方法)难以实现全基因组范围内尿嘧啶的单碱基分辨率定位,且无法区分其来源(脱氨基或错误掺入)。因此,本研究开发了名为“AI-seq”(人工修饰碱基测序技术)的新方法,旨在解决上述问题,并探索尿嘧啶在基因组中的分布规律及生物学意义。
研究流程与方法
1. N3-C探针设计与合成
- 开发了一种人工合成的胞嘧啶衍生物N3-C,其结构包含羟胺基团(用于标记尿嘧啶切除后的无碱基位点,AP site)、胞嘧啶碱基(诱导PCR中的U-to-C突变)和叠氮基团(便于后续生物素富集)。
- 通过5步化学反应从商业试剂合成N3-C(图S1),并通过凝胶电泳、HPLC-MS、MALDI-TOF质谱验证其标记效率(图2a,图S2-S7)。
模型DNA验证
全基因组尿嘧啶分析
主要结果
1. 尿嘧啶分布特征
- 在HEK293T细胞中鉴定到1064个尿嘧啶位点,其中997个源自胞嘧啶脱氨基,67个源自dUMP错误掺入(图3a)。
- 染色体偏好性:尿嘧啶在1、7、16、18号染色体富集(图4a)。
- 基因组区域分布:79.2%位于基因间区,19.3%位于内含子,且富含卫星重复序列(satellite repeats)(图4b-d)。
- 内含子特征:含尿嘧啶的内含子长度显著更长(p < 2.2×10^-16),且多位于基因的第一个内含子(图4e-f)。
结论与意义
1. 方法学创新:AI-seq首次实现全基因组尿嘧啶单碱基分辨率检测,并能区分其来源,为表观遗传研究提供新工具。
2. 生物学发现:尿嘧啶在着丝粒和第一内含子的富集暗示其可能参与染色体稳定性维持和转录调控。
3. 应用潜力:该“碱基替换”策略可拓展至其他修饰碱基(如m7G)的检测(图S27),推动核酸表观遗传学发展。
研究亮点
1. 高分辨率与特异性:AI-seq克服传统技术局限,实现尿嘧啶精准定位与来源解析。
2. 多维度验证:结合3D-PCR、切除修复酶法及生物信息学分析,确保结果可靠性。
3. 生物学新见解:揭示尿嘧啶在着丝粒和内含子的非随机分布,为后续功能研究奠定基础。
其他价值
本研究为疾病相关尿嘧啶异常修饰的机制探索(如APOBEC家族酶异常激活)提供了关键技术支撑,并有望应用于癌症基因组不稳定性的研究。