基于混合专家和3D模拟内存计算的大语言模型高效扩展

基于混合专家与三维模拟内存计算的大语言模型高效扩展 学术背景 近年来,大规模语言模型(Large Language Models, LLMs)在自然语言处理、文本生成等领域展现出了强大的能力。然而,随着模型规模的不断增加,训练和推理的成本也急剧上升,尤其是在内存占用、计算延迟和能耗方面。这成为阻碍LLMs广泛应用的主要瓶颈之一。传统的冯·诺依曼架构在处理大规模参数时,数据频繁在内存和计算单元之间移动,导致所谓的“冯·诺依曼瓶颈”,加剧了这些挑战。 为了解决这一问题,研究者们探索了多种技术路径,其中之一是“专家混合”(Mixture of Experts, MoE)架构。MoE通过条件计算(conditional computing)机制,动态选择输入的处理路径,只激活模型的一部分参数,从而显...

ECDformer:高效且可解释的电子圆二色光谱预测的解耦峰值属性学习

高效且可解释的电子圆二色光谱预测:Decoupled Peak Property Learning 学术背景 电子圆二色光谱(Electronic Circular Dichroism, ECD)是研究分子手性的关键工具,特别是在不对称有机合成和药物工业中,用于区分手性分子的绝对构型。然而,现有的ECD光谱预测方法存在两个主要问题:数据稀缺性和可解释性不足,导致预测结果的可信度较低。当前的ECD光谱预测依赖于耗时的量子化学计算,包括分子结构提取、构象搜索、结构优化、时间相关密度泛函理论(TD-DFT)计算和玻尔兹曼加权等步骤。这不仅需要实验化学家具备深厚的专业知识,还耗费大量的计算资源和时间。因此,如何加速ECD光谱的理论计算并提高其预测的准确性和可解释性,成为了一个亟待解决的问题。 论文来...

多模态学习用于基因型-表型动态映射

多模态学习揭示基因型-表型动态关系 背景介绍 基因型与表型之间的复杂关系一直是生物学领域的核心问题之一。基因型(genotype)指生物体的遗传信息,而表型(phenotype)则是这些遗传信息在特定环境下的表现。尽管早在1909年,Wilhelm Johannsen就提出了这两个术语,并试图量化它们之间的关系,但一个多世纪以来,我们仍然无法精确地描述基因型如何通过复杂的基因表达模式塑造表型。近年来,单细胞RNA测序(single-cell RNA sequencing, scRNA-seq)等技术的发展使得我们能够在细胞分辨率下观察基因表达的复杂动态,然而这些技术仍然无法全面映射基因型组合如何导致表型的产生。 当前的研究方法,如正向遗传学(forward genetics)和反向遗传学(r...

DysPred框架:利用药物警戒数据预测检查点抑制剂免疫疗法的群体毒性特征

免疫检查点抑制剂毒性的预测与监控:DysPred深度学习框架的突破性应用 学术背景 免疫检查点抑制剂(immune checkpoint inhibitors, ICIs)是近年来癌症免疫治疗领域的重大突破,通过抑制免疫检查点信号通路,增强机体的抗肿瘤免疫反应。然而,ICIs在治疗过程中可能引发广泛的免疫相关不良反应(immune-related adverse events, irAEs),这些不良反应不仅影响患者的生活质量,甚至可能导致器官功能受损或死亡。由于irAEs在临床环境、肿瘤类型、组织特异性及患者人口统计学特征中的高度异质性,亟需一种稳健且可扩展的方法来预测和管理这些不良反应。 尽管已有研究通过临床试验和传统的药物不良反应数据集(如SIDER和OFFSIDES)对irAEs进行...

基于内存计算的深度贝叶斯主动学习研究

随着人工智能(AI)技术的快速发展,深度学习在复杂任务中取得了显著进展。然而,深度学习的成功在很大程度上依赖于大量标注数据,而数据的标注过程不仅耗时、劳动密集,还需要专业的领域知识,成本高昂。特别是在一些专业领域中,如机器人技能学习、催化剂发现、药物发现和蛋白质生产优化等,获取标注数据的难度和成本尤其突出。为了解决这一问题,深度贝叶斯主动学习(Deep Bayesian Active Learning, DBAL)应运而生。DBAL通过主动选择最有信息量的数据进行标注,显著提高了标注效率,从而在有限标注数据的情况下实现高质量的学习。 然而,DBAL的实现面临着一个重要的技术挑战:它需要处理大量的随机变量和高带宽的数据传输,这对传统的确定性硬件提出了极高的要求。传统的互补金属氧化物半导体(Co...

形态优化与形态变换问题的可编程环境

可编程形状优化与形变问题的研究:Morpho环境的开发与应用 学术背景 软材料(soft materials)在科学和工程领域中扮演着至关重要的角色,特别是在软体机器人、结构流体、生物材料与颗粒介质等领域。这些材料在机械、电磁或化学刺激下会发生显著的形状变化。理解并预测这些材料的形状变化,对于优化设计及其背后的物理机理具有重要意义。然而,形状优化问题通常非常复杂,现有的模拟工具要么功能有限,要么不够通用,导致研究人员在处理这类问题时面临诸多挑战。 为了解决这一难题,研究人员开发了一个开源的、可编程的优化环境——Morpho,旨在为形状优化问题提供一个通用且易于使用的工具。Morpho能够处理多种软材料物理问题,如膨胀水凝胶(swelling hydrogels)、复杂流体中的非球形液滴、肥皂...

通过多任务学习接近耦合簇精度的分子电子结构

机器学习助力量子化学:逼近耦合簇精度的分子电子结构预测 学术背景 在物理学、化学和材料科学领域,计算方法是揭示各种物理现象背后机制和加速材料设计的关键工具。然而,量子化学计算(尤其是电子结构计算)通常是计算瓶颈,限制了计算速度和可扩展性。尽管近年来机器学习方法在加速分子动力学模拟和提高精度方面取得显著成功,但现有的机器学习模型大多基于密度泛函理论(DFT)数据库作为训练数据的“真实值”,其预测精度无法超越DFT本身。DFT作为一种平均场理论,其计算通常引入的系统误差比化学精度(1 kcal/mol)大几倍,这限制了基于DFT数据集训练的机器学习模型的整体精度。 相比之下,耦合簇方法(CCSD(T))被认为是量子化学的“金标准”,能够提供各种分子性质的高精度预测。然而,CCSD(T)的计算成本...

STST:动态视觉刺激生成中的时空风格转移算法

关于动态视觉刺激生成的时空风格转移算法的研究报告 学术背景 视觉信息的编码与处理一直是神经科学和视觉科学领域的重要研究方向。随着深度学习技术的快速发展,研究人工视觉系统与生物视觉系统之间的相似性成为热点。然而,视觉研究中生成适当的动态视觉刺激以测试特定假设的方法相对匮乏。现有的静态图像生成方法虽然已有较大进展,但在处理动态视觉刺激时,仍存在灵活性不足、生成结果偏离自然视觉环境统计特性等问题。为此,研究者们开发了一种名为“时空风格转移”(Spatiotemporal Style Transfer, STST)的算法,旨在生成能够匹配自然视频的低级时空特征,同时去除高级语义信息的动态视觉刺激,为研究物体识别提供了有力的工具。 此外,深度学习模型在视觉任务中的表现与生物视觉系统的比较也需要大量的可...

GSPA:基于单细胞分辨率的基因信号模式分析实现基因空间映射

单细胞分辨率下的基因空间映射:基因信号模式分析(GSPA)研究 学术背景 单细胞RNA测序(single-cell RNA sequencing, scRNA-seq)技术近年来在生物学研究中取得了重大进展,尤其是在揭示细胞状态空间(cellular state space)的组织结构方面。然而,尽管已有许多计算方法用于映射细胞状态空间,但关于基因空间(gene space)的映射或嵌入(embedding)的研究却相对较少。基因表达是高度组织的,基因之间通过复杂的生物过程和通路协同工作。然而,由于生物和技术噪声(如基因丢失“dropout”现象),准确量化基因间的相似性仍然具有挑战性。为此,本文提出了一种基于图信号处理(graph signal processing, GSP)的新方法——...

SMART:生物细胞中反应和传输的空间建模算法

细胞信号反应与运输的空间建模算法研究 背景介绍 生物细胞通过复杂的生化反应网络来实现其功能。这些反应网络具有显著的时空动态性,且在细胞的不同区域和亚细胞结构中存在显著的空间分异(spatial compartmentalization)。然而,传统的细胞信号传导模型通常将细胞视为一个均匀混合的体系,忽略了空间效应对反应和运输过程的影响。这种简化虽然在特定情况下有效,但在许多实际场景中会降低模型的预测能力。例如,信号分子的扩散速度较慢、细胞内环境拥挤、细胞结构的复杂性等都会导致空间效应的显著影响。因此,开发能够精确模拟细胞信号传导和运输过程的计算模型成为生物计算科学领域的重要挑战。 2025年1月发表在 Nature Computational Science 期刊上的一篇研究论文,提出了名为...