分享自:

基于机器学习的单原子催化剂数据库助力高性能催化剂设计

期刊:J. Phys. Chem. CDOI:10.1021/acs.jpcc.5c00491

基于计算单原子催化剂数据库的机器学习辅助高效催化剂设计研究

作者与发表信息
本研究的通讯作者为华北电力大学动力工程系的Zhengyang Gao、日本东北大学先进材料研究所的Hao Li以及华北电力大学的Weijie Yang,合作作者包括华北电力大学与日本物质材料研究机构(NIMS)的多位研究人员。研究论文题为“Computational Single-Atom Catalyst Database Empowers the Machine Learning Assisted Design of High-Performance Catalysts”,发表于Journal of Physical Chemistry C(*J. Phys. Chem. C*)2025年第129卷,页码5043–5053。


学术背景

单原子催化剂(Single-Atom Catalysts, SACs)因其高原子利用率、均一活性位点和优异的选择性,在能源与环境催化领域(如NO和Hg⁰氧化反应)展现了巨大潜力。然而,传统“试错法”开发SACs效率低下,且缺乏全面的SACs数据库限制了数据驱动策略的应用。本研究旨在通过密度泛函理论(Density Functional Theory, DFT)高通量计算构建包含1197种SACs的公共数据库,并基于机器学习(Machine Learning, ML)模型预测催化性能,最终筛选高性能催化剂。


研究流程与方法

1. 催化剂设计与高通量计算

  • 设计对象:研究通过调控SACs的配位环境,构建了以3d过渡金属(Ti、V、Cr、Mn、Fe、Co、Ni、Cu、Zn)为中心、掺杂非金属原子(B、N、O、P、S)的1197种SACs结构。
  • 计算方法:采用VASP软件进行DFT计算,参数包括:PAW赝势、PBE泛函、DFT-D3色散校正、450 eV截断能。计算了金属原子的Bader电荷d带中心(d-band center)、系统电负性、结合能(*Ebind*)及O2、O、NO的吸附能(*Eads*)。
  • 稳定性筛选:通过比较结合能与金属块体凝聚能,从1197种结构中筛选出657种稳定SACs。

2. 数据库构建与可视化

  • 工具与平台:使用Python框架Streamlit开发了交互式在线数据库(访问链接),用户可自定义数据维度(如水平/垂直轴、散点颜色大小)并查看详细催化性能。

3. 机器学习模型开发

  • 特征工程:通过Matminer包生成132种Magpie特征,经筛选保留14个关键特征(如原子数平均偏差、电负性均值等)。
  • 模型选择与优化:对比了极端梯度提升回归(XGBR)、随机森林回归(RFR)和支持向量回归(SVR),其中XGBR预测性能最优(R2>0.87,均方误差MSE<0.35)。
  • 框架整合:将XGBR与催化火山图模型结合,构建了自动化催化活性预测框架(AML),用于快速筛选NO/Hg⁰氧化反应的高效催化剂。

主要研究结果

  1. 电子结构特性分析

    • Bader电荷:金属原子向石墨烯基底转移电子,电荷转移量随原子序数呈火山型趋势(Co/Ni/Cu转移量最小)。
    • d带中心:随金属原子序数增加,d带中心(εd)从正变负,表明催化活性受金属类型主导。
    • O吸附能:Ni/Cu/Zn中心SACs对O的吸附能力显著受配位非金属原子影响,吸附能变化范围达5.64 eV。
  2. 机器学习预测性能

    • XGBR模型对O吸附能的预测误差(MAE=0.41 eV)显著低于文献报道的其他模型(如RFR、SVR),为4d金属SACs筛选提供了可靠工具。
  3. 高效催化剂筛选

    • 通过AML框架预测1261种4d金属SACs的活性,发现Rh1B4Rh1C2S2在NO和Hg⁰氧化中性能优异,其能垒(分别为1.01/2.59 eV和1.03/2.61 eV)低于已报道SACs。

结论与价值

  1. 科学价值

    • 首次构建了覆盖多配位环境的SACs公共数据库,填补了数据驱动催化剂设计的空白。
    • 提出的XGBR-火山图联合框架为快速筛选SACs提供了新范式,可推广至其他催化反应(如ORR、OER)。
  2. 应用潜力

    • 筛选的Rh基SACs在燃煤电厂NOx和Hg⁰污染控制中具有实际应用前景。
    • 开源数据库与AML工具(GitHub链接)为后续研究提供了共享平台。

研究亮点

  1. 方法创新

    • 结合DFT高通量计算与ML,实现了从“计算设计”到“性能预测”的全流程自动化。
    • 开发的AML框架将传统催化理论(如d带中心、火山图)与数据科学深度融合。
  2. 成果新颖性

    • 发现Rh1B4和Rh1C2S2的能垒突破现有SACs性能极限,为实验合成提供了明确靶点。
  3. 技术通用性

    • 研究方法可扩展至其他单原子体系(如5d金属、双原子催化剂),推动高通量催化剂设计的发展。

其他亮点
- 研究通过Streamlit实现了数据库的动态可视化,方便用户交互式探索数据。
- 开源代码与数据库遵循CC-BY-NC-ND 4.0协议,促进了学术资源共享。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com