通过整合因果提示大语言模型与多组学数据驱动的因果推理识别癌症基因

癌症基因的准确识别是癌症基础研究和精准医疗领域的核心难题。近日,Jilin University与Zhejiang Sci-Tech University的研究团队在《Briefings in Bioinformatics》期刊上发表了题为《Cancer gene identification through integrating causal prompting large language model with omics data–driven causal inference》的原创性研究论文。本文完整梳理了该论文的研究背景、学术创新、方法流程、研究结论及其深远意义。 一、学术研究背景 1. 多组学癌症基因识别的需求 癌症作为全球范围内死亡率最高的疾病之一,其发生和进展本质上是一个...

模块响应分析的测试与局限性克服

研究背景:网络推断新挑战 在现代分子生物学和系统生物学领域,对生物分子网络(如基因调控网络、蛋白质互作网络、信号传导网络等)的精准解析被视为理解细胞生命活动、疾病发病机制和药物作用机理的核心。然而,这些生物网络极为复杂,普遍存在节点众多、连接关系错综、非线性动态强烈以及实验测量噪音大的难题。作者们正是在这样的大背景下,选择聚焦于“模块响应分析(Modular Response Analysis, MRA)”方法。MRA是一类基于对系统节点施加扰动,并分析扰动响应以推断模块间相互作用的经典方法,尤其适用于节点可以灵活定义为“基因、蛋白质、代谢物或蛋白复合体等多尺度结构单元(模块)”的网络解析。 尽管MRA长期以来在中小规模网络解析、稳态扰动数据分析等方面被广泛应用,并见证了算法层面的多种优化,...

AlphaFold推动蛋白结构预测评价标准革新 —— 兼论数据泄漏问题的应对策略

跨越蛋白结构预测新纪元的学术背景 蛋白质结构解析一直是分子生物学和生命科学领域的核心挑战之一。传统的实验方法如X射线晶体学、核磁共振(NMR)以及冷冻电子显微镜,虽然为蛋白质三维结构研究提供了坚实基础,但因样品制备复杂、时间成本高昂且对蛋白适用范围有限,难以广泛覆盖整个蛋白组蛋白质(proteome)。自2020年DeepMind开发的AlphaFold2(AF2)系统问世以来,蛋白质结构预测领域迎来了划时代的进展。AlphaFold2利用深度学习方法,使几乎所有已知蛋白质序列都能实现高质量结构预测,极大拓展了结构覆盖范围,对生物医学、基础生命科学甚至药物设计领域产生深远影响。 值得关注的是,AlphaFold2发布后,其预测结构数据库迅速建立并对外开放,学术界掀起了以AF2结构为基础的二次...

解密听力损失基因增强子以实现高效靶向基因治疗遗传性耳聋

学术背景 遗传性耳聋是全球范围内最常见的感官障碍之一,影响着超过4亿人,其中约60%的先天性耳聋与遗传因素有关。尽管腺相关病毒(AAV)介导的基因治疗在治疗遗传性耳聋方面显示出巨大潜力,但其特异性和安全性仍存在显著问题。耳蜗结构的复杂性进一步增加了基因递送的精确性挑战。为了解决这些问题,研究人员开发了一种新的工作流程——基于AAV报告基因的体内转录增强子重建(ARBITER),用于解析听力损失基因的增强子。这一研究旨在通过识别和工程化增强子,实现高效且特异性的基因治疗,从而恢复听力功能。 论文来源 这篇论文由Simeng Zhao、Qiuxiang Yang、Zehua Yu等作者共同撰写,来自上海科技大学iHuman研究所、生命科学与技术学院,以及中国科学院昆明动物研究所等机构。论文于20...

解码单细胞扰动响应的异质性

背景介绍 在细胞生物学中,理解细胞对扰动的不同响应至关重要。扰动(perturbation)是指通过基因编辑、化学物质、环境变化或机械力等方式改变细胞状态,从而研究其功能。然而,现有的方法在量化单细胞水平的异质性响应时存在局限性,尤其是在部分基因扰动(partial gene perturbation)和剂量效应(dosage effect)的分析上表现不佳。为了解决这一问题,研究者开发了一种新的计算方法——扰动响应评分(Perturbation-Response Score, PS),旨在更准确地量化单细胞扰动响应的异质性,并揭示细胞内在和外在因素对扰动结果的影响。 论文来源 本论文由Bicna Song、Dingyu Liu等多名研究者共同完成,作者来自多个知名机构,包括Children...

利用可扩展单细胞扰动筛选系统重建分子通路特征

在功能基因组学领域,研究人员一直致力于通过观测数据预测因果调控关系。然而,尽管现代技术能够测量多种分子模态,从观测数据中推断出因果调控关系仍然具有挑战性。特别是,信号通路调控因子的下游效应物(effectors)的识别和量化是基因组学研究的重点之一。CRISPR等基因组编辑工具的出现为大规模并行筛选提供了可能,尤其是与单细胞RNA测序(scRNA-seq)结合的Perturb-seq技术,能够通过遗传扰动实现因果推断。然而,现有的Perturb-seq应用主要集中在静止细胞中,可能无法准确描述依赖于上下文的基因功能。 为了解决这一问题,研究人员开发了一种可扩展的Perturb-seq工作流程,结合了组合索引和下一代测序技术,系统地识别了不同生物背景下信号调控因子的靶标。通过这一方法,研究人员...