这篇文档属于类型a,即报告了一项单一原创研究的学术论文。以下是针对该研究的详细报告:
该研究由Samuel Morabito、Emily Miyoshi、Neethu Michael、Saba Shahin、Alessandra Cadete Martini、Elizabeth Head、Justine Silva、Kelsey Leavey、Mari Perez-Rosendahl和Vivek Swarup共同完成。研究团队来自加州大学欧文分校(University of California, Irvine)的多个部门,包括数学、计算与系统生物学项目(Mathematical, Computational and Systems Biology Program)、神经生物学与行为学系(Department of Neurobiology and Behavior)、记忆障碍与神经疾病研究所(Institute for Memory Impairments and Neurological Disorders, MIND)以及病理学与实验室医学系(Department of Pathology and Laboratory Medicine)。该研究于2021年8月发表在《Nature Genetics》期刊上。
该研究的主要科学领域是神经生物学和基因组学,特别是阿尔茨海默病(Alzheimer’s Disease, AD)的分子机制研究。阿尔茨海默病是一种复杂的神经退行性疾病,伴随着大量神经元丢失和胶质细胞增生。尽管已有许多单细胞和单核RNA测序(snRNA-seq)研究揭示了AD中细胞类型特异性的转录变化,但这些变化背后的调控机制仍不明确。此外,全基因组关联研究(GWAS)表明,AD的遗传风险很大程度上与远端调控元件相关,这些元件通常是疾病相关组织中的细胞类型特异性区域。因此,该研究旨在通过多组学单核分析,结合染色质可及性(chromatin accessibility)和基因表达数据,揭示AD晚期的基因调控网络,并探索细胞类型特异性的调控元件及其靶基因。
研究流程主要包括以下几个步骤:
样本获取与处理
研究使用了来自AD晚期患者和认知健康对照者的死后人类前额叶皮层(prefrontal cortex, PFC)组织样本。AD组和对照组分别包括12例和8例样本,年龄范围为74-90岁以上。样本经过Braak和斑块分期(plaque staging)进行定义。所有样本均经过单核ATAC-seq(snATAC-seq)和单核RNA-seq(snRNA-seq)处理,以生成染色质可及性和基因表达数据。
数据生成与质量控制
研究使用10x Genomics平台进行snATAC-seq和snRNA-seq实验。经过质量控制过滤后,保留了130,418个核的snATAC-seq数据和61,472个核的snRNA-seq数据。为了消除批次效应,研究使用了互近邻法(Mutual Nearest Neighbors, MNN)对snATAC-seq数据进行校正,并使用整合非负矩阵分解(Integrative Non-negative Matrix Factorization, INMF)对snRNA-seq数据进行降维和批次校正。
细胞类型注释与聚类
研究使用UMAP降维和Leiden聚类方法对校正后的表观组和转录组数据进行聚类分析,分别识别出35个snATAC-seq细胞簇和34个snRNA-seq细胞簇。通过已知标记基因的染色质可及性和基因表达信号,研究注释了主要的细胞类型,包括兴奋性神经元、抑制性神经元、星形胶质细胞、小胶质细胞、少突胶质细胞和少突胶质前体细胞。
差异染色质可及性与基因表达分析
研究在每个细胞簇中识别了AD晚期与对照组之间的差异染色质可及性区域(Differentially Accessible Regions, DARs)和差异表达基因(Differentially Expressed Genes, DEGs)。通过GO富集分析,研究发现了与AD相关的细胞亚群特异性转录组变化。
顺式调控元件与靶基因的鉴定
研究通过构建顺式共可及性网络(cis Co-accessibility Networks, CCANs),鉴定了细胞类型特异性的候选顺式调控元件(Candidate Cis-Regulatory Elements, cCREs)及其靶基因。研究还使用非负矩阵分解(Non-negative Matrix Factorization, NMF)对这些cCREs进行聚类,进一步分析了它们在AD中的调控作用。
转录因子调控网络构建
研究通过分析转录因子(Transcription Factors, TFs)的结合基序和靶基因,构建了细胞类型特异性的TF调控网络。研究特别关注了小胶质细胞中的Spi1和少突胶质细胞中的NRF1,发现它们在AD中的调控作用。
伪时间轨迹分析
研究使用Monocle3对少突胶质细胞、小胶质细胞和星形胶质细胞进行了伪时间轨迹分析,揭示了这些细胞在AD中的动态基因表达和染色质可及性变化。研究发现,少突胶质细胞的成熟轨迹与AD相关,并鉴定了SREBF1在少突胶质细胞中的调控作用。
单细胞共表达网络分析
研究开发了一种新的共表达网络分析方法,称为单核共识加权基因共表达网络分析(Single-nucleus Consensus Weighted Gene Co-expression Network Analysis, scWGCNA),用于识别AD相关的共表达网络。研究在少突胶质细胞中发现了多个与AD相关的共表达模块,并验证了SREBF1在这些模块中的调控作用。
细胞类型特异性调控元件与靶基因
研究鉴定了56,552个基因连锁的cCREs(gl-ccres)和11,440个cCRE连锁的基因,发现这些cCREs主要位于内含子区域(58.35%)。研究还发现,多个细胞类型共享的cCREs在AD中具有特异性的调控模式。
转录因子调控网络
研究发现,小胶质细胞中的Spi1和少突胶质细胞中的NRF1在AD中具有显著的调控作用。Spi1在AD中表现出转录抑制功能,而NRF1的失调可能与线粒体功能受损有关。
伪时间轨迹分析
伪时间轨迹分析揭示了少突胶质细胞在AD中的成熟轨迹,发现SREBF1在少突胶质细胞中作为转录激活因子发挥作用。研究还发现,小胶质细胞和星形胶质细胞在AD中表现出疾病相关状态的变化。
共表达网络分析
scWGCNA分析在少突胶质细胞中发现了多个与AD相关的共表达模块,并验证了SREBF1在这些模块中的调控作用。研究发现,SREBF1的靶基因在AD晚期的RNA和蛋白质水平上均显著下调。
该研究通过多组学单核分析,揭示了AD晚期的基因调控网络,特别是胶质细胞在AD病理生理学中的作用。研究鉴定了多个细胞类型特异性的调控元件和转录因子,并开发了新的分析方法(如scWGCNA)来识别AD相关的共表达网络。这些发现为理解AD的分子机制提供了新的视角,并为未来的治疗靶点研究提供了重要线索。