学术研究报告
本文旨在向中文科研工作者介绍一项发表于《Aging》期刊(2023年第15卷第24期)的研究。这项研究由中国医科大学第一医院卒中中心、神经内科、神经外科以及中国医科大学附属盛京医院神经外科等多个单位的研究人员合作完成。主要作者包括鲁达鼎、蔡恒、李雨刚等,通讯作者为李志清教授。论文于2023年8月3日接收,同年12月14日正式发表。
一、 研究背景与目的
本研究的科学领域聚焦于缺血性卒中(Ischemic Stroke, IS)的免疫学机制研究。缺血性卒中占全球临床卒中的80%以上,死亡率高,致残率高,给个人和社会带来沉重负担。早期诊断和治疗是当前医疗体系的重中之重。研究背景指出,卒中后血脑屏障的破坏会导致中枢免疫微环境紊乱,吸引更多炎症细胞浸润,加剧免疫反应和病情。已有研究表明,免疫调节能有效延缓缺血性卒中进展并促进神经功能恢复,这强调了维持免疫微环境平衡对于中枢神经系统保护的重要性。
尽管认识到免疫反应在缺血性卒中病理进程中的关键作用,但精确的免疫相关机制尚未被系统阐明。为了更好地指导治疗干预(如药物开发和再利用),有必要深化对卒中相关免疫机制的理解,以更好地揭示潜在靶点基因和通路。基因表达谱或转录组数据分析为此提供了有力工具。随着基因芯片技术的迭代,机器学习在现代生物医学中的应用日益广泛,无论是分析海量基因表达谱还是寻找相关生物学特征,机器学习都能胜任。
然而,当前利用机器学习进行卒中研究存在一定局限性:第一,部分研究仅纳入单一数据集,难免引入数据偏差;第二,机器学习算法多样,部分研究仅使用单一算法,可能导致误差;第三,部分研究仅进行预测分析而未进行相应的实验验证,难以及时评估预测准确性。
因此,本研究旨在解决上述局限性,通过整合多个公共基因表达数据集,结合多种机器学习算法,系统性地识别缺血性卒中关键的免疫相关特征基因(Immune-Related Signatures),并利用动物模型实验和单细胞测序分析进行多维度验证,最终探索这些特征基因作为卒中后治疗新靶点的潜力。
二、 详细工作流程
本研究设计了一个综合性的分析验证流程,主要包含以下几个步骤:
数据获取与预处理:研究从基因表达综合数据库(Gene Expression Omnibus, GEO)下载了六个数据集(GSE58294, GSE22255, GSE16561, GSE37587, GSE110993, GSE174574)。其中,GSE58294和GSE22255作为发现集,共包含132个样本(89名IS患者,43名对照);GSE16561和GSE37587作为验证集一,共包含131个样本(107名IS患者,24名对照);GSE110993作为验证集二(40个样本);GSE174574则用于后续单细胞水平分析(6个小鼠样本)。所有基于芯片的数据均进行了归一化、背景校正,并利用sva包的Combat函数消除了批次效应。主成分分析(PCA)图显示,校正后的样本中,卒中患者与健康对照的分布模式明显区分。
差异表达分析与ceRNA网络构建:在发现集中,使用线性模型微阵列数据(Limma)方法,以P值<0.05和|log2FC|>0.585为阈值,筛选出131个差异表达mRNA(Differentially Expressed mRNAs, DEmRNAs)。在验证集一中筛选出301个DEmRNAs。取交集后,获得24个在两组数据中均一致的DEmRNAs。同时,在发现集中识别出6个差异表达长链非编码RNA(delncRNAs),并利用DIANA数据库预测其可能结合的105个microRNA(miRNAs)。在验证集二(GSE110993,一个miRNA测序数据集)中识别出96个差异表达miRNA(demiRNAs)。通过取交集和反向预测,最终构建了一个包含3个lncRNA、12个miRNA和12个mRNA的缺血性卒中相关竞争性内源RNA(ceRNA)调控网络。这12个mRNA即作为后续分析的核心DEGs。
功能富集分析:对这12个核心DEGs进行基因集富集分析(Gene Set Enrichment Analysis, GSEA)、京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)和基因本体论(Gene Ontology, GO)富集分析。GSEA结果显示,这些基因显著富集于NF-κB信号通路、IL-17信号通路、TGF-β信号通路、TNF信号通路等免疫炎症相关通路。KEGG分析同样强调了IL-17和TNF信号通路的重要性。GO分析则揭示了它们参与神经炎症反应调控、羧酸跨膜转运等生物学过程。这些结果强烈提示所筛选的基因与免疫反应密切相关,为后续聚焦免疫相关特征基因指明了方向。
机器学习筛选关键免疫相关特征基因:为了从12个核心DEGs中筛选出更好的免疫相关特征基因(Differentially Expressed Immune-Related Signatures, DEIRS),研究采用了综合策略:结合最小绝对收缩和选择算子回归(Least Absolute Shrinkage and Selection Operator, LASSO)模型、支持向量机(Support Vector Machine, SVM)以及从GeneCards数据库获取的17,664个免疫相关基因集。首先,LASSO回归对12个基因进行降维,筛选出8个候选基因。其次,SVM模型对12个基因进行评估。最后,将LASSO结果、SVM结果、12个DEGs以及免疫相关基因集取交集,得到8个重叠的免疫相关特征基因。值得注意的是,在这8个基因中,ID3在LASSO回归中的系数负值最小(即贡献最大且表达下调),SLC22A4的正值最大(贡献最大且表达上调);同时,ID3和SLC22A4在SVM模型中的曲线下面积(Area Under Curve, AUC)值排名前二。基于此,ID3和SLC22A4被确定为关键的DEIRS用于后续深入分析。受试者工作特征曲线(ROC)分析显示,ID3和SLC22A4在发现集和验证集中均能有效区分IS患者与健康对照(AUC均>0.89),表明其具有良好的诊断潜力。
免疫浸润特征分析:使用CIBERSORT算法对发现集的样本进行免疫细胞浸润分析。结果显示,与健康对照相比,IS患者样本中幼稚B细胞、CD8+ T细胞和幼稚CD4+ T细胞的浸润水平较低,而活化的记忆CD4+ T细胞和中性粒细胞的浸润水平较高。相关性分析进一步发现,ID3的表达与幼稚B细胞、CD8+ T细胞和幼稚CD4+ T细胞呈正相关,与活化的记忆CD4+ T细胞和中性粒细胞呈负相关;SLC22A4的表达则呈现相反的相关性模式。这提示ID3和SLC22A4可能参与了卒中后特定免疫细胞亚群的募集或功能调节。
动物模型与分子生物学验证:研究建立了小鼠大脑中动脉闭塞(Middle Cerebral Artery Occlusion, MCAO)模型来模拟缺血性卒中。通过实时定量聚合酶链式反应(RT-qPCR)和蛋白质印迹法(Western Blot)检测发现,与假手术组相比,MCAO组小鼠脑组织中ID3的mRNA和蛋白表达水平均显著降低,而SLC22A4的表达水平则显著升高。免疫荧光染色结果也一致显示,MCAO组脑组织中ID3的荧光强度减弱,SLC22A4的荧光强度增强。这些结果在体内水平验证了生物信息学分析的发现。
单细胞转录组测序分析:利用单细胞RNA测序数据集GSE174574(包含3个MCAO和3个假手术小鼠脑皮质样本),研究在单细胞分辨率下探索了ID3和SLC22A4的表达模式。共鉴定出13个转录 distinct的细胞簇,包括内皮细胞亚群(Endothelial_1, Endothelial_2)、小胶质细胞亚群(Microglia_1, Microglia_2)、星形胶质细胞(Astrocyte)等。分析发现,在MCAO组中,Endothelial_1细胞比例下降而Endothelial_2比例上升;Microglia_1比例上升而Microglia_2比例下降。ID3的表达在Endothelial_1细胞中显著降低,在Endothelial_2细胞中增加;SLC22A4的表达则主要富集于星形胶质细胞中。此外,相关性分析显示,在内皮细胞中,ID3与紧密连接蛋白标志物(Claudin5, Occludin, ZO1)的表达呈显著正相关;在星形胶质细胞中,SLC22A4与星形胶质细胞标志物(GFAP, S100β, EAAT1)的表达呈显著正相关。
三、 主要研究结果
本研究通过一套环环相扣的分析与验证流程,获得了以下关键结果: * 成功筛选出24个稳定的缺血性卒中差异表达基因,并从中构建了一个ceRNA调控网络,富集分析强烈暗示这些基因参与免疫炎症通路。 * 综合运用多种机器学习方法,首次将ID3和SLC22A4共同鉴定为缺血性卒中关键的免疫相关特征基因。它们在多个独立数据集中均表现出稳定的差异表达和良好的诊断区分能力。 * 免疫浸润分析揭示了缺血性卒中患者外周免疫细胞的特定变化模式(如淋巴细胞减少、活化T细胞和中性粒细胞增加),并发现ID3和SLC22A4的表达与这些免疫细胞亚群的变化存在显著相关性,将这两个分子与系统性免疫反应联系起来。 * 动物实验在体内层面证实了ID3的下调和SLC22A4的上调,使得生物信息学的预测得到了实证支持。 * 单细胞测序分析将研究推向了细胞类型特异性层面:发现ID3的表达变化与血管内皮细胞亚群的转换相关,且与血脑屏障紧密连接蛋白表达相关;而SLC22a4则特异性地在反应性星形胶质细胞中高表达。这为理解这两个基因在卒中后血脑屏障破坏和神经炎症中的作用提供了更精细的细胞定位。
这些结果层层递进:从大数据筛选候选基因,到机器学习聚焦关键靶点,再到群体水平的免疫关联分析,最后通过体内模型和单细胞技术验证并深化其细胞和分子功能,形成了一个逻辑严密的证据链。
四、 结论与价值
本研究得出结论:ID3和SLC22A4是缺血性卒中后重要的免疫相关特征基因,它们可能成为促进卒中后功能恢复的新治疗靶点。此外,ID3和SLC22A4与免疫细胞的关联,为卒中后免疫治疗指明了新的研究方向。
本研究的科学价值在于: 1. 方法学创新:克服了以往单数据集、单算法的局限性,采用多数据集、多算法(LASSO, SVM)的综合策略,并结合独立实验验证,提高了发现的可靠性和稳健性。 2. 发现新靶点:首次系统性地将ID3和SLC22A4共同确立为缺血性卒中的关键免疫相关分子,为理解卒中免疫病理机制增添了新的内容。 3. 机制深入探索:通过单细胞分析,将ID3与血管内皮功能/血脑屏障完整性、SLC22A4与星形胶质细胞反应联系起来,为未来研究其具体作用机制(如是否通过NF-κB等已验证的通路)提供了清晰的切入点。 4. 转化应用潜力:ID3和SLC22A4作为有潜力的生物标志物,可能用于辅助早期诊断或疾病监测;作为治疗靶点,调控其表达可能通过调节免疫浸润、保护血脑屏障或减轻神经炎症来改善卒中预后。
五、 研究亮点
六、 其他有价值的内容
论文还详细讨论了ID3和SLC22A4已知的生物学功能。ID3在细胞生长、血管新生、神经发生和免疫调节中发挥作用,且有研究提示其在卒中早期表达稳定,利于早期诊断。SLC22A4是一种有机阳离子转运蛋白,其基因多态性与类风湿性关节炎、炎症性肠病等多种炎症性疾病相关,在日本的卒中人群研究中也发现与其基因多态性相关,这进一步支持了其参与炎症过程的合理性。讨论部分也将本研究发现的免疫细胞变化与既往卒中免疫学研究进行了对比和衔接,体现了研究的延续性和深度。同时,作者也坦诚指出了本研究的不足,例如对ID3和SLC22A4的内在作用机制探索深度仍有待加强,需要未来更多的功能实验来阐明。