本研究由Xushen Xiong(麻省理工学院计算机科学与人工智能实验室/浙江大学良渚实验室)、Benjamin T. James和Carles A. Boix(麻省理工学院/博德研究所)等共同完成,通讯作者为Manolis Kellis(麻省理工学院/博德研究所)。研究团队还包括来自麻省理工学院皮考尔学习与记忆研究所、匹兹堡大学、芝加哥拉什大学医学中心等机构的合作者。研究成果于2023年9月28日发表于Cell期刊(卷186,期20,页码4422–4437),标题为《Epigenomic dissection of Alzheimer’s disease pinpoints causal variants and reveals epigenome erosion》。
科学领域:本研究属于神经退行性疾病的多组学整合研究领域,聚焦阿尔茨海默病(Alzheimer’s disease, AD)的表观遗传调控机制与遗传风险位点的功能解析。
研究动机:尽管全基因组关联分析(GWAS)已鉴定数十个AD风险位点,但其中90%位于非编码区,其细胞类型特异性调控机制、靶基因及因果变异仍不明确。此外,AD进展中表观基因组动态变化与细胞身份丢失的关系尚未在单细胞分辨率下阐明。
关键科学问题:
1. AD风险变异如何通过破坏细胞类型特异性增强子或转录因子结合影响基因调控?
2. AD不同阶段(早期/晚期)的表观基因组和转录组如何动态变化?
3. 晚期AD是否伴随全局性表观基因组失调(epigenome erosion)?
研究对象:92例死后人脑前额叶皮层(prefrontal cortex, PFC)样本,包括48例非AD对照、29例早期AD和15例晚期AD个体(来自ROS/MAP队列)。
实验方法:
- 单核RNA测序(snRNA-seq):414,964个高质量核转录组,覆盖7大类61种细胞亚型(如兴奋性/抑制性神经元、小胶质细胞等)。
- 单核ATAC测序(snATAC-seq):437,000个核染色质可及性图谱,鉴定367,242个开放染色质峰(peaks),其中130,193个具有细胞类型特异性。
- 多组学验证:19例内侧前额叶皮层(MFC)样本的单核多组学测序(同时检测ATAC和RNA)。
创新方法:
- 迭代整合框架:开发了snATAC-snRNA多模态迭代整合算法,通过交替优化“峰-基因链接”(peak-to-gene links)和染色质可及性推断的基因表达矩阵,提升细胞亚型注释精度(比Seurat/scGLUE提高5.9%匹配率)。
- 共可及性模块分析:基于peak-peak协同开放模式,定义219个功能模块(如小胶质细胞炎症模块、神经元突触模块),每个模块平均包含954个峰,并通过GREAT和JASPAR数据库注释调控通路及转录因子(TFs)。
AD风险位点功能注释:
- 细胞类型特异性富集:通过S-LDSC分析发现AD GWAS信号显著富集于小胶质细胞的增强子(p<1e-16),尤其是SPI1和RUNX1等TF结合位点。
- 变异-基因链接:结合peak-to-gene链接、单细胞eQTL和PLAC-seq物理互作数据,优先锁定19个AD GWAS位点的靶基因(如PICALM、JAZF1)。
表观遗传数量性状位点(ATAC-QTL):
- 鉴定9,628个细胞类型特异性ATAC-QTL(如兴奋性神经元中2,895个),发现其与AD GWAS信号正交,但通过共定位分析揭示69个共享位点(如SCIMP基因座)。
AD进展中的表观组动态:
- 早期AD:神经元中RNA代谢和磷脂酶D相关模块可及性增加。
- 晚期AD:
- 细胞身份丢失:snATAC-seq显示神经元比例显著下降(p<0.001),而snRNA-seq未检测到,提示表观遗传层面的身份丢失早于转录组变化。
- 表观基因组侵蚀:定义“侵蚀分数”(erosion score),发现晚期AD细胞中活性染色质(如增强子)可及性降低,而抑制性区域(如异染色质)开放度增加(p<2.2e-16)。
- 3D基因组破坏:A/B区室边界模糊化,伴随核纤层蛋白B1(lamin B1)表达下降(免疫荧光验证,p<0.01)。
科学意义:
1. 首次在单细胞分辨率下绘制AD全脑表观基因组图谱,建立“遗传变异-表观调控-靶基因”的因果链条。
2. 揭示表观基因组侵蚀是AD晚期神经退行的新型分子标志,为疾病分期提供理论依据。
应用价值:
- 资源平台:数据可通过http://compbio.mit.edu/ad_epigenome可视化,包含61种细胞类型的调控网络。
- 治疗靶点:SPI1/RUNX1调控网络和ZEB1介导的侵蚀通路可作为干预靶标。
局限性:
1. ATAC-seq无法区分染色质状态(如增强子/启动子),需未来整合组蛋白修饰数据(如H3K27ac ChIP-seq)。
2. 表观基因组侵蚀的时间动态仍需纵向研究(如人脑类器官模型)。
数据共享:原始数据存放于AD Knowledge Portal(Synapse ID: syn52293426),代码开源(GitHub: kellislab/ad_regulome_analysis)。