这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
脊椎动物调控序列图谱建模:uATAC-seq与深度学习的突破性研究
作者与机构
本研究由浙江大学医学院附属第一医院骨髓移植中心及再生医学中心的Xiaoping Han、Hanyu Wu、Xueyi Wang等共同完成,通讯作者为Xiaoping Han(xhan@zju.edu.cn)和Guoji Guo(ggj@zju.edu.cn)。研究成果于2025年9月18日发表于国际顶级期刊《Cell》(卷188,1-20页)。
学术背景
研究领域聚焦于基因组调控序列的解析。尽管哺乳动物调控序列的研究已取得进展(如ENCODE计划),但跨物种、高分辨率的染色质可及性(chromatin accessibility)图谱仍存在空白。传统技术如DNase-seq和ATAC-seq(Assay for Transposase-Accessible Chromatin using sequencing)在通量和灵敏度上存在局限,而单细胞技术的出现为系统解析细胞类型特异的调控序列提供了可能。本研究旨在开发一种超高通量、超高灵敏度的单核ATAC-seq技术(uATAC-seq),构建五种代表性脊椎动物的候选顺式调控元件(candidate cis-regulatory elements, cCREs)图谱,并通过深度学习模型NVWA-CRE(Nvwa cis-regulatory element)预测调控序列的功能。
研究流程与方法
1. uATAC-seq技术开发
- 实验设计:通过同源适配体转座酶(homo-adaptor transposase)和温控适配体切换技术,优化了传统ATAC-seq流程,实现四轮条形码索引,单日可完成一个物种的染色质可及性图谱构建。
- 性能验证:在人类(293T)和小鼠(3T3)细胞混合实验中,双细胞率仅为0.3%-1.2%,单个核的中位唯一片段(unique fragments, UFs)达22,642-26,085,转录起始位点(TSS)富集分数>12。
- 对比优势:uATAC-seq在通量、灵敏度、成本上优于现有单核ATAC-seq技术(如s3-ATAC、10x ATAC),且无需流式分选或昂贵平台支持。
脊椎动物染色质可及性图谱构建
cCREs的发现与特征分析
NVWA-CRE模型构建与应用
主要结果与逻辑关联
- uATAC-seq的高通量特性支持了跨物种图谱的快速构建,而高灵敏度揭示了罕见细胞类型的cCREs。
- cCREs数量与基因组大小的关联性提示调控复杂性可能由基因组扩张驱动,而元件大小的保守性反映了核心调控机制的统一性。
- NVWA-CRE模型的跨物种预测能力表明,调控语法比序列相似性更保守,且模型可解码功能模块(如神经元、免疫相关序列模块)。
结论与价值
1. 科学价值:
- 提供了首个跨脊椎动物的高分辨率cCREs资源(6,182,084个元件),揭示了调控序列的进化规律。
- 证明了深度学习可从基因组序列直接预测染色质可及性,为“序列-功能”关系的解析提供了新范式。
2. 应用价值:
- uATAC-seq的低成本、高效率特性使其适用于临床样本的大规模筛查。
- NVWA-CRE可精准预测非编码突变的功能效应,助力疾病机制研究和治疗靶点设计。
研究亮点
1. 技术革新:uATAC-seq将单核ATAC-seq的通量提升至百万级,灵敏度超越现有方法。
2. 资源广度:覆盖脊椎动物主要类群,填补了非哺乳动物调控序列的空白。
3. 模型突破:NVWA-CRE首次实现跨物种单细胞水平的染色质可及性预测,并验证了合成突变的治疗潜力。
其他价值
- 数据公开性:所有数据可通过GEO(GSE284189)和项目网站(https://bis.zju.edu.cn/uuatac)获取,模型代码开源(GitHub: ehcilc23/uuatac)。
- 临床启示:如预测的HBG基因调控位点可为镰状细胞贫血的基因治疗提供新策略。
此报告完整呈现了研究的创新性、方法论严谨性及潜在影响,符合学术传播的规范需求。