分享自:

生物信息学与实验验证非酒精性脂肪肝病中的可成药靶点

期刊:scientific reportsDOI:10.1038/s41598-026-53503-6

关于《Bioinformatics and experimental validation of druggable targets in non-alcoholic fatty liver disease》的学术研究报告

一、 研究团队与发表信息

本研究的主要作者是Xiangqian Zhang(张向前)、Hanyang Su(苏汉阳)、Quan Zhou(周泉)和Yuling Zhou(周玉玲)。作者单位包括:中南大学湘雅医院国家老年疾病临床医学研究中心(第一作者单位)、中南大学湘雅医院呼吸内科与临床护理教研室、湖南师范大学附属岳阳医院内分泌科以及岳阳市中心医院肿瘤中心。通讯作者为Quan Zhou和Yuling Zhou。该研究于2026年5月12日被接受,发表在*Scientific Reports*期刊上。

二、 学术背景与研究目的

本研究属于生物信息学与转化医学领域,聚焦于非酒精性脂肪性肝病(Non-alcoholic Fatty Liver Disease, NAFLD,现也称MASLD)的药物靶点发现。NAFLD是全球最常见的慢性肝病之一,其病理谱涵盖从单纯性脂肪变到非酒精性脂肪性肝炎(NASH),并可进展为肝纤维化、肝硬化甚至肝细胞癌。然而,目前NAFLD缺乏获批的靶向疗法,其发病机制复杂且异质性强。因此,识别具有诊断相关性和潜在转化价值的可成药基因,对于推动NAFLD的精准医学研究至关重要。

近年来,随着转录组学和系统生物学的发展,基于大数据的生物信息学方法被广泛应用于探索慢性疾病的潜在机制。其中,加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)在识别与疾病表型显著相关的基因模块方面展现出独特优势。同时,“可成药基因”(即其编码的蛋白质可被小分子药物或生物制剂靶向调控的基因)的筛选是基础研究向药物开发转化的关键环节。药物-基因相互作用数据库(Drug-Gene Interaction Database, DGIdb)系统性地整理了数千个潜在可成药基因。

基于此背景,本研究旨在通过整合多个独立的NAFLD患者肝组织转录组数据集,结合WGCNA、差异表达分析以及已知可成药基因数据库,系统性地筛选出与NAFLD密切相关的核心可成药基因。研究目标不仅限于生物信息学筛选,还包括通过功能富集分析、免疫浸润分析、诊断效能评估以及初步的实验验证(免疫组织化学和免疫荧光),来阐明这些候选基因在NAFLD中的潜在生物学功能、诊断价值及其在组织中的表达情况,从而为NAFLD的分子发病机制提供新见解,并为未来的靶点验证和药物重定位研究奠定基础。

三、 详细研究流程

本研究采用了从生物信息学挖掘到实验验证的综合性策略,主要流程可分为以下几个关键步骤:

  1. 数据整合与预处理

    • 数据来源:研究从GEO数据库下载了三个独立的NAFLD相关微阵列数据集:GSE33814(正常13例,NAFLD 31例)、GSE63067(正常7例,NAFLD 11例)和GSE89632(正常24例,NAFLD 38例)。总计包含44例正常对照和80例NAFLD样本的转录组数据。
    • 数据处理:对原始数据进行探针注释、去重和归一化(分位数归一化,必要时进行log₂转换)。鉴于数据集来源不同,研究使用svaR包中的Combat算法对批次效应进行了校正,并通过主成分分析(PCA)和密度分布图验证了校正效果,确保了后续分析的可靠性。
    • 差异表达基因(Differentially Expressed Genes, DEGs)筛选:使用limmaR包对合并校正后的数据进行分析,以|log₂FC| > 0.6且校正后p值 < 0.05为标准,识别NAFLD组与正常对照组之间的DEGs。
  2. 可成药基因与WGCNA模块基因的交叉筛选

    • 可成药基因获取:从DGIdb数据库中获取已知的可成药基因列表,并与文献支持的药物靶向基因列表进行交集,构建一个可靠的可成药基因集。
    • WGCNA分析:为了发现与NAFLD状态高度协同变化的基因模块,研究对GSE33814和GSE63067两个数据集分别进行了WGCNA分析。首先选择合适的软阈值功率以确保网络符合无标度拓扑结构,然后构建基因共表达网络并进行模块划分。通过计算模块特征基因与NAFLD表型之间的相关性,识别出与疾病状态显著相关的关键模块(例如在GSE33814中,蓝色模块与NAFLD呈显著正相关)。
    • 候选基因筛选:将上述步骤得到的三个集合——差异表达基因(DEGs)、WGCNA分析得到的NAFLD相关模块基因、以及可成药基因——进行维恩图交集分析。最终,确定了九个共同的基因作为核心候选可成药靶点:FABP4, ADAMTS1, FOS, GPR88, IL1RL1, CD52, JUN, SERPINE1, 和THBS1。
  3. 候选基因的验证与功能分析

    • 表达验证:在合并的三个数据集中,通过小提琴图可视化这九个候选基因在NAFLD组与对照组中的表达水平,确认其差异表达模式。
    • 诊断效能评估:使用受试者工作特征曲线(Receiver Operating Characteristic, ROC)分析评估每个候选基因区分NAFLD与正常肝组织的能力,计算曲线下面积(Area Under the Curve, AUC)及其95%置信区间。
    • 表达模式与共表达网络分析:根据基因表达中位数将样本分为高、低表达组,通过热图展示基因的表达聚类模式。同时,对每个候选基因与全转录组基因进行皮尔逊相关性分析,构建共表达网络热图,以揭示其全局表达关联模式。
    • 功能富集分析:为了阐明这九个候选基因参与的生物学过程和信号通路,研究进行了系统的功能富集分析:
      • 基因本体论(Gene Ontology, GO)富集分析:使用clusterProfilerR包进行GO分析,揭示候选基因富集的生物学过程、分子功能和细胞组分。
      • 京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路富集分析:分析候选基因显著富集的信号通路。
      • 基因集富集分析(Gene Set Enrichment Analysis, GSEA):进一步验证在高表达这些基因的样本中,哪些已知的生物学通路被整体激活或抑制。
    • 免疫浸润分析:使用CIBERSORT算法,基于LM22特征矩阵,对合并数据集中每个样本的22种免疫细胞亚群比例进行估算。随后,分析九个候选基因的表达与各免疫细胞亚群比例之间的相关性,以探讨这些基因与NAFLD肝脏免疫微环境的关系。
  4. 实验验证

    • 样本与伦理:研究收集了NAFLD患者和健康对照者的肝组织样本。所有参与者均签署知情同意书,研究方案经湖南师范大学附属岳阳医院伦理委员会批准(批件号:2025016)。
    • 免疫组织化学(Immunohistochemistry, IHC)与免疫荧光(Immunofluorescence, IF):对组织样本进行石蜡包埋、切片。使用针对CD52、GPR88和IL1RL1的一抗进行染色。
      • CD52:进行了IHC(DAB显色)和IF(Alexa Fluor 594标记)染色,以评估其蛋白表达水平和组织定位。此外,还进行了多重免疫荧光染色,将CD52与CD8(细胞毒性T细胞标记)和CD138(浆细胞标记)共定位,分析其与特定免疫细胞的空間关系。
      • GPR88和IL1RL1:进行了IHC染色,观察其在NAFLD与正常组织中的表达趋势。
    • 图像与统计分析:使用ImageJ软件对染色结果进行定量分析。组间比较采用Wilcoxon秩和检验。

四、 主要研究结果

  1. 候选基因的鉴定与表达验证:通过整合生物信息学分析,成功筛选出九个与NAFLD相关的核心可成药基因。表达验证结果显示,在NAFLD肝组织中,CD52和FABP4的表达显著上调,而ADAMTS1, FOS, GPR88, IL1RL1, JUN, SERPINE1和THBS1的表达显著下调。这一结果在合并数据集中得到一致确认。

  2. 诊断潜力分析:ROC曲线分析表明,这九个基因均显示出区分NAFLD与正常组织的诊断潜力。其中,FOS(AUC = 0.804)和JUN(AUC = 0.773)的诊断准确性最高,其他基因如FABP4、ADAMTS1、CD52等也表现出中等的诊断价值(AUC > 0.68),提示它们可能作为潜在的诊断生物标志物。

  3. 功能富集分析结果

    • GO分析:候选基因主要富集于炎症反应、细胞趋化、免疫调节、细胞外基质组织、DNA结合转录激活活性等生物学过程。例如,CD52与抗原处理和呈递、MHC II类复合物结合相关;SERPINE1与趋化性和R-Smad结合有关;THBS1与细胞因子活性相关。
    • KEGG通路分析:候选基因显著富集于多条与炎症、免疫和代谢相关的通路,包括IL-17信号通路、TNF信号通路、细胞因子-细胞因子受体相互作用、AGE-RAGE信号通路(在糖尿病并发症中)、ECM-受体相互作用、PI3K-Akt信号通路等。这提示这些基因共同参与了NAFLD中炎症放大、免疫紊乱和代谢失调的核心病理过程。
    • GSEA分析:进一步支持了上述发现,高表达这些基因的样本在细胞因子-细胞因子受体相互作用、粘着斑、MAPK信号通路、JAK-STAT信号通路等通路上显著富集。GPR88的高表达组则主要富集于甘氨酸、丝氨酸和苏氨酸代谢等代谢相关通路。
  4. 免疫微环境关联:免疫浸润相关分析显示,不同的候选基因与特定的免疫细胞亚群存在不同的相关性。例如,CD52与浆细胞呈强正相关;FABP4与γδ T细胞正相关;ADAMTS1与M0型巨噬细胞和调节性T细胞(Tregs)呈正相关趋势。这些结果暗示这些候选基因可能通过调节肝脏免疫微环境在NAFLD中发挥作用。多重免疫荧光结果进一步显示,CD52信号在NAFLD肝组织中与CD8⁺ T细胞和CD138⁺浆细胞存在部分空间共定位,为转录组水平的关联提供了组织学证据。

  5. 实验验证结果

    • CD52:IHC和IF结果一致表明,CD52蛋白在NAFLD患者肝组织中的表达水平显著高于健康对照组,阳性信号(棕色或红色荧光)明显增强。定量分析证实了这种差异的统计学显著性(p < 0.0001)。
    • GPR88和IL1RL1:IHC染色显示,与对照组相比,NAFLD肝组织中GPR88和IL1RL1的蛋白表达整体呈下降趋势,这与生物信息学分析的表达下调结果相符。

五、 研究结论与价值

本研究通过整合多组学数据与生物信息学方法,系统性地筛选并初步验证了九个在NAFLD中具有潜在重要性的可成药基因(FABP4, ADAMTS1, FOS, GPR88, IL1RL1, CD52, JUN, SERPINE1, THBS1)。这些基因广泛参与脂质代谢、炎症反应、细胞外基质重塑和免疫调节等NAFLD关键病理过程。

研究的科学价值在于: 1. 提供了新的分子见解:研究不仅确认了FOS/JUN(AP-1转录因子复合体)、SERPINE1(PAI-1)等已知与肝纤维化、炎症相关的基因,还突出了CD52、GPR88等相对较新或较少在NAFLD背景下研究的基因,拓宽了对NAFLD分子机制的理解。 2. 架起了机制研究与靶点发现的桥梁:研究策略有效连接了疾病机制探索(通过WGCNA和功能分析)与治疗靶点发现(通过可成药基因库交叉筛选),为从海量组学数据中挖掘具有直接转化潜力的靶点提供了范例。 3. 指出了药物重定位的可能性:研究中涉及的多个基因已有相应的靶向药物或候选化合物(如靶向CD52的阿仑单抗、靶向FABP4/5的抑制剂Y18、靶向SERPINE1的抑制剂TM5441),这为NAFLD的“老药新用”或药物重定位策略提供了理论起点和候选靶点。 4. 强调了CD52的潜在价值:通过生物信息学预测和实验验证(IHC/IF),首次在蛋白水平证实CD52在NAFLD肝组织中表达上调,并将其与免疫细胞浸润相关联,提示CD52可能作为连接NAFLD免疫微环境改变的新潜在靶点,值得进一步功能研究。

六、 研究亮点

  1. 综合性分析流程:研究采用了从多数据集整合、批次校正、差异分析、WGCNA网络构建、可成药基因交叉筛选,到多层次功能验证(GO、KEGG、GSEA)、免疫微环境解析、诊断效能评估,再到最终湿实验验证(IHC/IF)的完整闭环流程,逻辑严谨,论证全面。
  2. 聚焦“可成药性”:不同于单纯的差异表达基因筛选,本研究将筛选标准锚定在“可成药基因”上,极大地增强了研究成果的潜在转化价值,直接服务于新药靶点发现和药物重定位。
  3. 初步的实验验证:在生物信息学预测的基础上,对关键候选基因CD52进行了免疫组化和免疫荧光验证,将计算生物学发现推进到了组织蛋白表达层面,增强了结论的可信度。同时对GPR88和IL1RL1也进行了初步的IHC验证。
  4. 深入的机制探索:不仅关注基因表达差异,还通过功能富集和免疫浸润分析,深入探讨了这些候选基因可能参与的生物学过程和细胞环境,为理解其在NAFLD中的作用机制提供了线索。

七、 其他有价值的内容

研究在讨论部分客观指出了其局限性:1)尽管进行了多数据集交叉验证和初步实验,但仍缺乏体外细胞或体内动物模型的功能性验证;2)基于合并数据集的ROC分析主要用于探索性评估,单个基因AUC值在0.7-0.8范围内在转录组筛选中常见,需谨慎解读,未来需要更大样本、前瞻性队列以及多因子组合模型进行系统验证以降低过拟合风险;3)研究基于横断面数据和二分类设计,未来需要结合明确的疾病分期或纵向队列来刻画与疾病进展相关的分子动态变化。这些思考为后续研究指明了方向。

此外,研究详细阐述了每个候选基因已知的生物学功能及其与NAFLD病理特征的潜在联系,例如FABP4与脂质代谢和胰岛素抵抗、ADAMTS1与细胞外基质重塑、SERPINE1与纤维化、THBS1与血管生成和免疫调节等,内容非常详实,为读者理解这些靶点的生物学背景提供了丰富信息。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com