这篇文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:
脊椎动物调控序列图谱建模:uATAC-seq与深度学习的突破性研究
作者与机构
本研究由浙江大学医学院附属第一医院骨髓移植中心、干细胞与再生医学中心的Xiaoping Han、Hanyu Wu、Xueyi Wang等领衔,联合梁祝实验室(Liangzhu Laboratory)等多个团队合作完成,通讯作者为Xiaoping Han(xhan@zju.edu.cn)和Guoji Guo(ggj@zju.edu.cn)。研究成果于2025年9月18日发表于顶级期刊《Cell》(卷188,1-20页)。
学术背景
研究聚焦于基因组学与表观遗传学领域,旨在解析脊椎动物基因组中调控序列(cis-regulatory elements, CREs)的演化规律与功能机制。尽管已有研究通过DNase-seq和ATAC-seq等技术绘制了哺乳动物的染色质可及性图谱,但跨物种的系统性分析仍存在两大挑战:一是单细胞水平的高通量、高灵敏度染色质可及性检测技术的限制;二是缺乏能够从序列直接预测调控功能的计算模型。本研究通过开发超高通量单核ATAC-seq技术(uATAC-seq)和深度学习模型NVWA-CRE(NvWa Cis-Regulatory Element),填补了这一空白。
研究流程与方法
1. uATAC-seq技术开发与优化
- 技术原理:通过同源适配体转座酶(homo-adaptor transposase)和温度控制的适配体切换,实现四轮条形码标记,显著提升检测灵敏度(单日可完成一个物种的染色质图谱构建)。
- 实验验证:在人类293T和小鼠3T3细胞中验证技术性能,结果显示单核中位数唯一片段(Unique Fragments, UFs)达22,642-26,085,转录起始位点(TSS)富集分数>12。
- 创新点:相比传统方法(如10x ATAC),uATAC-seq避免了双适配体转座酶的50%产量限制,且无需流式分选(FACS)等昂贵设备。
跨物种染色质图谱构建
NVWA-CRE深度学习模型构建
主要结果
1. 调控元件的保守性
- 尽管调控元件数量随基因组大小增加,单个元件的大小(~250 bp增强子/~900 bp启动子)和功能模块(如CTCF、ETS motifs)在脊椎动物中高度保守。
- 转座元件(TEs)在成年组织中大多沉默,仅2-5%的TEs具有可及性,提示其对基因调控贡献有限。
跨物种预测能力
突变效应预测
结论与意义
本研究通过uATAC-seq和NVWA-CRE模型,首次系统性揭示了脊椎动物调控序列的演化规律:功能模块的保守性高于序列本身,且基因组扩张主要通过增加调控元件数量而非改变其结构实现。科学价值上,该研究为理解基因调控的“语法规则”提供了范式;应用价值上,NVWA-CRE可精准指导非编码疾病的基因治疗设计(如镰刀型贫血症的HBF诱导突变筛选)。
研究亮点
1. 技术突破:uATAC-seq将单核检测通量提升至百万级,成本降低50%以上。
2. 模型创新:NVWA-CRE是首个实现跨物种单细胞染色质可及性预测的深度学习框架。
3. 发现调控元件的“双峰尺寸规律”(250 bp vs. 900 bp),挑战了传统峰值分析的固定窗口假设。
其他价值
研究数据已公开于Figshare(https://figshare.com/s/0dfc0ba97f54b429af69),模型代码开源(GitHub: https://github.com/ehcilc23/uuatac),为后续研究提供资源支持。
此报告全面覆盖了研究的创新性、方法论严谨性及跨学科意义,尤其强调了技术开发与理论发现的紧密结合。