关于《Bioinformatics and experimental validation of druggable targets in non-alcoholic fatty liver disease》的学术研究报告
一、 研究团队与发表信息
本研究的主要作者是Xiangqian Zhang(张向前)、Hanyang Su(苏汉阳)、Quan Zhou(周泉)和Yuling Zhou(周玉玲)。作者单位包括:中南大学湘雅医院国家老年疾病临床医学研究中心(第一作者单位)、中南大学湘雅医院呼吸内科与临床护理教研室、湖南师范大学附属岳阳医院内分泌科以及岳阳市中心医院肿瘤中心。通讯作者为Quan Zhou和Yuling Zhou。该研究于2026年5月12日被接受,发表在*Scientific Reports*期刊上。
二、 学术背景与研究目的
本研究属于生物信息学与转化医学领域,聚焦于非酒精性脂肪性肝病(Non-alcoholic Fatty Liver Disease, NAFLD,现也称MASLD)的药物靶点发现。NAFLD是全球最常见的慢性肝病之一,其病理谱涵盖从单纯性脂肪变到非酒精性脂肪性肝炎(NASH),并可进展为肝纤维化、肝硬化甚至肝细胞癌。然而,目前NAFLD缺乏获批的靶向疗法,其发病机制复杂且异质性强。因此,识别具有诊断相关性和潜在转化价值的可成药基因,对于推动NAFLD的精准医学研究至关重要。
近年来,随着转录组学和系统生物学的发展,基于大数据的生物信息学方法被广泛应用于探索慢性疾病的潜在机制。其中,加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)在识别与疾病表型显著相关的基因模块方面展现出独特优势。同时,“可成药基因”(即其编码的蛋白质可被小分子药物或生物制剂靶向调控的基因)的筛选是基础研究向药物开发转化的关键环节。药物-基因相互作用数据库(Drug-Gene Interaction Database, DGIdb)系统性地整理了数千个潜在可成药基因。
基于此背景,本研究旨在通过整合多个独立的NAFLD患者肝组织转录组数据集,结合WGCNA、差异表达分析以及已知可成药基因数据库,系统性地筛选出与NAFLD密切相关的核心可成药基因。研究目标不仅限于生物信息学筛选,还包括通过功能富集分析、免疫浸润分析、诊断效能评估以及初步的实验验证(免疫组织化学和免疫荧光),来阐明这些候选基因在NAFLD中的潜在生物学功能、诊断价值及其在组织中的表达情况,从而为NAFLD的分子发病机制提供新见解,并为未来的靶点验证和药物重定位研究奠定基础。
三、 详细研究流程
本研究采用了从生物信息学挖掘到实验验证的综合性策略,主要流程可分为以下几个关键步骤:
数据整合与预处理:
svaR包中的Combat算法对批次效应进行了校正,并通过主成分分析(PCA)和密度分布图验证了校正效果,确保了后续分析的可靠性。limmaR包对合并校正后的数据进行分析,以|log₂FC| > 0.6且校正后p值 < 0.05为标准,识别NAFLD组与正常对照组之间的DEGs。可成药基因与WGCNA模块基因的交叉筛选:
候选基因的验证与功能分析:
clusterProfilerR包进行GO分析,揭示候选基因富集的生物学过程、分子功能和细胞组分。实验验证:
四、 主要研究结果
候选基因的鉴定与表达验证:通过整合生物信息学分析,成功筛选出九个与NAFLD相关的核心可成药基因。表达验证结果显示,在NAFLD肝组织中,CD52和FABP4的表达显著上调,而ADAMTS1, FOS, GPR88, IL1RL1, JUN, SERPINE1和THBS1的表达显著下调。这一结果在合并数据集中得到一致确认。
诊断潜力分析:ROC曲线分析表明,这九个基因均显示出区分NAFLD与正常组织的诊断潜力。其中,FOS(AUC = 0.804)和JUN(AUC = 0.773)的诊断准确性最高,其他基因如FABP4、ADAMTS1、CD52等也表现出中等的诊断价值(AUC > 0.68),提示它们可能作为潜在的诊断生物标志物。
功能富集分析结果:
免疫微环境关联:免疫浸润相关分析显示,不同的候选基因与特定的免疫细胞亚群存在不同的相关性。例如,CD52与浆细胞呈强正相关;FABP4与γδ T细胞正相关;ADAMTS1与M0型巨噬细胞和调节性T细胞(Tregs)呈正相关趋势。这些结果暗示这些候选基因可能通过调节肝脏免疫微环境在NAFLD中发挥作用。多重免疫荧光结果进一步显示,CD52信号在NAFLD肝组织中与CD8⁺ T细胞和CD138⁺浆细胞存在部分空间共定位,为转录组水平的关联提供了组织学证据。
实验验证结果:
五、 研究结论与价值
本研究通过整合多组学数据与生物信息学方法,系统性地筛选并初步验证了九个在NAFLD中具有潜在重要性的可成药基因(FABP4, ADAMTS1, FOS, GPR88, IL1RL1, CD52, JUN, SERPINE1, THBS1)。这些基因广泛参与脂质代谢、炎症反应、细胞外基质重塑和免疫调节等NAFLD关键病理过程。
研究的科学价值在于: 1. 提供了新的分子见解:研究不仅确认了FOS/JUN(AP-1转录因子复合体)、SERPINE1(PAI-1)等已知与肝纤维化、炎症相关的基因,还突出了CD52、GPR88等相对较新或较少在NAFLD背景下研究的基因,拓宽了对NAFLD分子机制的理解。 2. 架起了机制研究与靶点发现的桥梁:研究策略有效连接了疾病机制探索(通过WGCNA和功能分析)与治疗靶点发现(通过可成药基因库交叉筛选),为从海量组学数据中挖掘具有直接转化潜力的靶点提供了范例。 3. 指出了药物重定位的可能性:研究中涉及的多个基因已有相应的靶向药物或候选化合物(如靶向CD52的阿仑单抗、靶向FABP4/5的抑制剂Y18、靶向SERPINE1的抑制剂TM5441),这为NAFLD的“老药新用”或药物重定位策略提供了理论起点和候选靶点。 4. 强调了CD52的潜在价值:通过生物信息学预测和实验验证(IHC/IF),首次在蛋白水平证实CD52在NAFLD肝组织中表达上调,并将其与免疫细胞浸润相关联,提示CD52可能作为连接NAFLD免疫微环境改变的新潜在靶点,值得进一步功能研究。
六、 研究亮点
七、 其他有价值的内容
研究在讨论部分客观指出了其局限性:1)尽管进行了多数据集交叉验证和初步实验,但仍缺乏体外细胞或体内动物模型的功能性验证;2)基于合并数据集的ROC分析主要用于探索性评估,单个基因AUC值在0.7-0.8范围内在转录组筛选中常见,需谨慎解读,未来需要更大样本、前瞻性队列以及多因子组合模型进行系统验证以降低过拟合风险;3)研究基于横断面数据和二分类设计,未来需要结合明确的疾病分期或纵向队列来刻画与疾病进展相关的分子动态变化。这些思考为后续研究指明了方向。
此外,研究详细阐述了每个候选基因已知的生物学功能及其与NAFLD病理特征的潜在联系,例如FABP4与脂质代谢和胰岛素抵抗、ADAMTS1与细胞外基质重塑、SERPINE1与纤维化、THBS1与血管生成和免疫调节等,内容非常详实,为读者理解这些靶点的生物学背景提供了丰富信息。