人工智能-学科-FmRead学术前沿

医学智能诊断新突破：随机化可解释机器学习模型推动高效医学诊断一、学术背景与研究动因近年来，深度学习（Deep Learning, DL）模型在医疗健康领域中扮演着举足轻重的角色。通过处理海量医学数据，DL显著提升了疾病的诊断准确性和临床决策水平。在医学影像分析、基因组学数据处理、临床疾病预测等领域，DL模型展示了强大的自动特征提取与复杂模式识别能力。但与此同时，深度模型的“黑箱”特性（即难以解释其决策过程）、庞大的计算资源消耗和冗长的训练时间，也成为其在临床实际应用中难以跨越的重要障碍。医学领域的决策过程不仅需要高准确率，还需兼顾速度与透明性，一方面保证快速诊断以应对紧急医疗情境，另一方面满足如GDPR等对自动化决策可解释性的法律法规要求。此外，DL模型尤其是大规模神经网络所带来的能源...

从数字孪生到虚拟人类孪生体：数字健康领域的“登月计划” 一、学术背景与研究动因当前，全球医疗健康体系依然存在诸多未被满足的临床和社会需求，其表现例如治疗选择的缺乏、不足与昂贵的医疗资源、漫长的候诊时间，以及对儿童和罕见病等弱势群体关注的不足（unmet needs）。尽管医学对健康和疾病的生理机制理解不断加深，新的诊疗技术也在持续涌现，但医疗服务的普及性、效率和个性化始终有所欠缺。为此，医学界和产业界不断探索以数字化和信息化手段推动变革。类似于人类基因组计划（Human Genome Project）彻底解读人类遗传信息，IUPS生理组项目（Physiome Project）首次提出了“系统性数字化动态人类生理模型”的构想，即构建包含全部已知人类病理生理特征的虚拟“数字人类”模型。而后，...

一、研究背景与学术意义阿尔茨海默病（Alzheimer’s disease, AD）作为全球范围内老年痴呆症发病率最高的类型，约占全部痴呆症患者的60%—80%。其主要发病群体为65岁以上人群，特征性病理改变包括淀粉样蛋白β（amyloid-β）斑块的沉积、神经纤维缠结以及广泛的神经元丧失。虽然近年来神经影像、脑脊液检测及基因组学为AD的研究带来诸多进展，但AD的早期诊断与疾病进程的客观监测仍受限于侵入性检测方式（如脑脊液穿刺或脑部PET成像）以及有限的生物标志物储备。血浆由于采集简便、患者依从性高，被视为未来AD无创诊断与动态监测的理想基体。但既往基于血浆的蛋白质组学研究样本量普遍较小，且检出蛋白数有限，掣肘了血浆生物标志物的系统性发现和验证。此前的多项学者研究（如Walker等人、S...

利用生成式深度学习预测复杂性状的致因基因集：PNAS重磅新方法解读一、学术背景与研究动机复杂性状的困境基因型与表型关系一直是生物学和遗传学领域最核心的问题之一。尤其在生物体级别的复杂性状（complex traits）研究中，这一问题尤为突出。所谓复杂性状，指的是表型受多基因（或多个基因位点，loci）协同作用调控，如常见的哮喘、炎症性肠病、糖尿病、癌症转移等。这些性状通常受遗传背景、表观遗传、环境因素等多重因素影响，使得从基因型预测表型变得异常困难。现代遗传学研究主要依赖于全基因组关联研究（GWAS, genome-wide association studies）或转录组关联研究（TWAS, transcriptome-wide association studies）等关联分析...

植物基因组跨物种建模的里程碑：PlantCaduceus DNA语言模型的创建与突破性应用一、学术背景与研究动因在过去二十年里，伴随高通量测序技术的飞速发展，超过1000种植物基因组已经发表，预计未来这一数字还将持续激增。然而，对这些庞大基因组的功能元素进行注释、理解它们在转录和翻译层面的表达调控，以及分析不同遗传变异对于生物个体适应性和性状的影响，一直是植物基因组学乃至作物改良领域中亟需突破的“瓶颈”问题。相较于动物和人类，植物基因组拥有更复杂的结构，表现为基因组大小巨大、重复序列比例极高、物种间多样性极强，甚至同属同种内部亦具有极大变异。因此，基于单一物种构建的深度学习（deep learning，DL）模型，往往只在特定物种内表现良好，难以跨物种泛化。这极大限制了新测序植物（尤其...

利用仿真推断加速单分子结构识别 ——《amortized template matching of molecular conformations from cryoelectron microscopy images using simulation-based inference》研究新闻报告研究背景与意义在分子生物学和结构生物学领域，理解生物大分子如何通过不同构象（conformation）的转变来执行其功能，是揭示生命过程机制的核心目标。众所周知，蛋白质、核酸等生物大分子具有高度的柔性，它们在细胞中不断地于各种构象之间重组，而这些不同的构象往往与分子的生物学功能直接相关。因此，实验上全面刻画分子体系的“构象分布（conformational ensemble）”和结构动力学，成为...

随机化可解释机器学习模型推动高效医学诊断

从医疗数字孪生到虚拟人类孪生：数字健康研究的登月计划

大规模血浆蛋白组学揭示阿尔茨海默病的诊断生物标志物和通路

复杂性状因果基因集合的生成式预测方法

PlantCaduceus：利用预训练DNA语言模型实现单碱基分辨率植物基因组跨物种建模

基于仿真推断的冷冻电镜分子构象模板匹配方法