分享自:

基于主动学习的逆设计生成框架 InvDesFlow-AL:用于功能材料设计的主动学习流程

期刊:npj computational materialsDOI:10.1038/s41524-025-01830-z

这项研究由中国人民大学的韩晓琦(Xiao-Qi Han)、郭朋杰(Peng-Jie Guo)、高泽峰(Ze-Feng Gao)、孙浩(Hao Sun)和卢仲毅(Zhong-Yi Lu)共同完成,其研究成果以题为《InvDesFlow-AL: Active Learning-based Workflow for Inverse Design of Functional Materials》的论文形式,于2025年发表在《npj Computational Materials》期刊上,该期刊与中国科学院上海硅酸盐研究所合作出版。

本研究属于计算材料学和人工智能交叉领域。传统的材料发现方法,如实验试错或基于密度泛函理论(Density Functional Theory, DFT)的高通量筛选,往往周期长、成本高且探索方向不明确。近年来,基于生成式人工智能(Generative AI)的逆向设计方法,特别是扩散模型(Diffusion Model),为直接从性能约束出发创造新材料提供了可能。然而,现有方法在晶体结构生成的准确率、材料稳定性以及处理稀缺功能材料数据方面仍存在显著局限。具体而言,现有模型难以基于DFT计算生成稳定材料,且通常受限于狭窄的元素或性质空间,在数据稀缺(如高温超导体)的场景下表现不佳。因此,本研究旨在开发一种新颖的、基于主动学习(Active Learning)策略的逆向材料设计生成框架——InvDesFlow-AL。该框架的核心目标是:通过迭代优化生成过程,系统性地引导模型产生具有特定所需性能(如低形成能、高临界温度)的功能材料,从而克服现有生成模型的不足,加速新材料的发现与设计流程。

研究的详细工作流程复杂而系统,可概括为四个核心阶段,并贯穿了三种主动学习策略。首先,构建一个预训练的晶体生成模型。该模型采用等变图神经网络(Equivariant Graph Neural Network, EGNN)架构,以明确保持晶体结构的周期性、对称性等几何约束。模型输入是晶体材料的单位晶胞表示,包括原子类型、分数坐标和晶格矩阵。训练数据来源广泛,包括MatterGen发布的ALEX-MP-20数据集和GNOME数据集中总计近百万的无机材料晶体结构,覆盖导体、半导体、绝缘体和磁性材料等多种类型。这一阶段采用了主动学习中的多样性采样(Diversity Sampling) 策略,确保预训练数据集涵盖广泛的化学空间和结构类型,从而赋予模型无条件生成具有高稳定性和新颖性的通用晶体结构的能力。

其次,针对特定功能目标进行模型微调。研究者并非采用常见的适配器(Adapter)微调,而是采用全参数微调,以获得对下游任务更好的适应性。这一阶段运用了期望模型改变(Expected Model Change) 策略。具体流程为:首先,使用目标功能材料的已知晶体数据(例如,对于低形成能材料,使用GNOME数据集中形成能低于-0.5 eV/原子的晶体)对预训练模型进行初步微调,以建立性能导向的生成先验。然后,启动一个“生成-筛选-再训练”的迭代循环。微调后的生成器会合成大量候选晶体结构,这些新结构需经过严格筛选。

第三,对生成的候选材料进行多目标智能筛选与验证。这是InvDesFlow-AL框架的创新核心,采用了查询委员会(Query-by-Committee, QBC) 策略。根据不同任务,组建由不同模型组成的“委员会”,并设计相应的多目标评分函数来评估候选材料的“价值”。例如,在生成低形成能/低Ehull材料时,委员会由DFT精度的原子间势函数(如DPA-2)和研究者自行开发的形成能预测图神经网络(FormEGNN)构成。评分函数综合考虑了形成能(或Ehull)的负值(稳定性/可合成性)、结构弛豫后的原子间力收敛(结构稳定性)以及相对于现有数据库的新颖性三个指标。只有评分高的候选材料才会被选中,加入到下一轮的训练数据集中。对于高温超导体设计,委员会则包括研究者新开发的超导临界温度预测图神经网络(SuperConGNN)和DFT计算,评分函数额外加入了高临界温度的优先级指标。这个筛选过程确保了用于迭代微调的数据是“最有价值”的,从而高效地引导生成模型向目标性能空间进化。

第四,经过多轮迭代优化后,对最终生成的材料进行全面的DFT验证与应用展示。这是工作流程的产出与验证阶段。生成的材料会经过严格的DFT结构弛豫和性质计算,以确认其热力学稳定性(原子间力< 1e-4 eV/Å)、电子结构以及目标性能的可靠性。

研究的主要结果丰硕,在不同任务上均取得了突破性进展。在晶体结构预测任务上,InvDesFlow-AL在广泛使用的MP-20测试集上,将原子位置的均方根误差降低至0.0423 Å,比当前最佳生成模型性能提升了32.96%。在Mpts-52(最多52个原子)测试集上的RMSE为0.0725 Å,性能提升达37%。与基于进化算法的经典方法USPEX相比,InvDesFlow-AL在15种代表性化合物上的结构匹配率更高(73.33% vs 53.33%),预测结构更接近真实值,且计算速度加快了超过4000倍。

在低形成能/低Ehull材料生成方面,通过五轮迭代,模型生成晶体的平均形成能逐轮显著下降(从-1.14 eV/原子降至-3.77 eV/原子),共生成超过57万个晶体。在专门的低Ehull材料探索中,经过十轮迭代,成功发现了1,598,551个Ehull < 50 meV的热力学稳定材料,所有结构均达到DFT弛豫精度。值得注意的是,生成的材料化学空间得到了极大拓展,包含了许多现有数据库中不存在的多元素(高熵合金)晶体,展现了模型探索新颖化学组成的能力。

在高温超导体逆向设计这一极具挑战性的任务上,InvDesFlow-AL取得了里程碑式的成果。该框架成功发现了常压下具有超高临界温度(Tc)的常规BCS超导体。其中最突出的发现是Li2AuH6,其预测的Tc高达约140 K,是迄今预测的常压常规超导体中最高的。此外,还发现了K2GaCuH6和Na2GaCuH6(Tc超过麦克米兰极限40 K)、Na2LiAgH6(Tc超过液氮温度77 K)等一系列新型超导材料。对Li2AuH6的DFT分析表明,其具有动态稳定性、金属性电子结构,并计算出极强的电子-声子耦合常数λ=2.84,这解释了其高超导转变温度的物理机制。这些发现为常压高温超导体的探索开辟了新途径。

作为概念验证,研究还展示了InvDesFlow-AL在生成超高温陶瓷材料方面的能力。仅用14种已知超高温陶瓷晶体进行微调后,模型不仅100%重现了训练集材料,还生成了诸如TaB2、ZrC和HfN等已被实验或理论验证具备优异性能的新材料,证明了其强大的泛化与设计能力。

本研究提出的InvDesFlow-AL框架,通过深度融合生成式扩散模型与主动学习策略,建立了一个高效、通用且目标导向的材料逆向设计新范式。其核心结论在于:主动学习的迭代优化机制能够显著提升生成模型在数据稀缺场景下的性能,系统性地引导材料发现进程,从而快速逼近并探索目标性能的前沿。

本研究的价值体现在多个层面。在科学价值上,它为解决功能材料逆向设计中的关键瓶颈——如何利用有限数据实现高性能、稳定材料的定向生成——提供了创新的方法论。所发现的Li2AuH6等材料对凝聚态物理和超导研究具有重要理论意义。在应用价值上,该框架具有高度的通用性和可扩展性,通过更换训练数据和设计相应的QBC评分函数,可广泛应用于电极材料、储氢材料、生物启发材料等多种战略领域的材料设计,有望大幅缩短新材料从概念到发现的研发周期。此外,框架开源了所有代码、数据和模型,为计算材料学界提供了强大的新工具。

本研究的亮点突出。首先,在方法论上,创造性地将主动学习的三大策略(多样性采样、期望模型改变、查询委员会)系统性地嵌入到材料生成工作流中,形成了完整的“生成-评估-优化”闭环,这是区别于现有单纯生成模型的核心创新。其次,在性能表现上,在晶体结构预测、低形成能材料生成,尤其是常压高温超导体发现等关键任务上取得了显著优于现有方法的成果,提供了强有力的实证。第三,在框架设计上,采用了全参数微调而非适配器,并设计了灵活的多目标QBC评分函数,增强了框架的适应性和目标导向的精确性。最后,研究不仅停留在理论预测,还进行了大量的DFT计算验证,确保了发现材料的可靠性和科学性,并展望了其在实验合成和工业部署中的桥梁作用,体现了从计算设计到实际应用的完整视角。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com