大规模血浆蛋白组学揭示阿尔茨海默病的诊断生物标志物和通路

一、研究背景与学术意义 阿尔茨海默病(Alzheimer’s disease, AD)作为全球范围内老年痴呆症发病率最高的类型,约占全部痴呆症患者的60%—80%。其主要发病群体为65岁以上人群,特征性病理改变包括淀粉样蛋白β(amyloid-β)斑块的沉积、神经纤维缠结以及广泛的神经元丧失。虽然近年来神经影像、脑脊液检测及基因组学为AD的研究带来诸多进展,但AD的早期诊断与疾病进程的客观监测仍受限于侵入性检测方式(如脑脊液穿刺或脑部PET成像)以及有限的生物标志物储备。血浆由于采集简便、患者依从性高,被视为未来AD无创诊断与动态监测的理想基体。但既往基于血浆的蛋白质组学研究样本量普遍较小,且检出蛋白数有限,掣肘了血浆生物标志物的系统性发现和验证。 此前的多项学者研究(如Walker等人、S...

复杂性状因果基因集合的生成式预测方法

利用生成式深度学习预测复杂性状的致因基因集:PNAS重磅新方法解读 一、学术背景与研究动机 复杂性状的困境 基因型与表型关系一直是生物学和遗传学领域最核心的问题之一。尤其在生物体级别的复杂性状(complex traits)研究中,这一问题尤为突出。所谓复杂性状,指的是表型受多基因(或多个基因位点,loci)协同作用调控,如常见的哮喘、炎症性肠病、糖尿病、癌症转移等。这些性状通常受遗传背景、表观遗传、环境因素等多重因素影响,使得从基因型预测表型变得异常困难。 现代遗传学研究主要依赖于全基因组关联研究(GWAS, genome-wide association studies)或转录组关联研究(TWAS, transcriptome-wide association studies)等关联分析...

PlantCaduceus:利用预训练DNA语言模型实现单碱基分辨率植物基因组跨物种建模

植物基因组跨物种建模的里程碑:PlantCaduceus DNA语言模型的创建与突破性应用 一、学术背景与研究动因 在过去二十年里,伴随高通量测序技术的飞速发展,超过1000种植物基因组已经发表,预计未来这一数字还将持续激增。然而,对这些庞大基因组的功能元素进行注释、理解它们在转录和翻译层面的表达调控,以及分析不同遗传变异对于生物个体适应性和性状的影响,一直是植物基因组学乃至作物改良领域中亟需突破的“瓶颈”问题。 相较于动物和人类,植物基因组拥有更复杂的结构,表现为基因组大小巨大、重复序列比例极高、物种间多样性极强,甚至同属同种内部亦具有极大变异。因此,基于单一物种构建的深度学习(deep learning,DL)模型,往往只在特定物种内表现良好,难以跨物种泛化。这极大限制了新测序植物(尤其...

基于仿真推断的冷冻电镜分子构象模板匹配方法

利用仿真推断加速单分子结构识别 ——《amortized template matching of molecular conformations from cryoelectron microscopy images using simulation-based inference》研究新闻报告 研究背景与意义 在分子生物学和结构生物学领域,理解生物大分子如何通过不同构象(conformation)的转变来执行其功能,是揭示生命过程机制的核心目标。众所周知,蛋白质、核酸等生物大分子具有高度的柔性,它们在细胞中不断地于各种构象之间重组,而这些不同的构象往往与分子的生物学功能直接相关。因此,实验上全面刻画分子体系的“构象分布(conformational ensemble)”和结构动力学,成为...

面向偏差感知的网络生物学链路预测算法的训练与评估

揭示连边预测算法的“富节点”偏见及其应对新策略 —— 解读“Bias-aware Training and Evaluation of Link Prediction Algorithms in Network Biology” 一、学术背景与研究缘起 在过去的十年里,生物网络(network biology)在揭示生物分子关联与功能方面扮演着愈加重要的角色。随着蛋白-蛋白互作(protein–protein interaction, PPI)、疾病基因关系等大规模图谱数据不断丰富,基于图机器学习的连边预测(link prediction, 连边意指网络中节点之间的关联)成为生物信息学和计算生物学中的核心工具。连边预测算法被广泛用于发现未知的生物分子关联,有助于药物靶点发现、疾病机制研究、实...