分享自:

基于上下文建模的材料性能预测方法:以固体胺CO2吸附剂为例

期刊:Energy and AIDOI:https://doi.org/10.1016/j.egyai.2025.100477

本文由Shuangjun Li、Zhixin Huang、Yuanming Li、Shuai Deng和Xiangkun Elvis Cao等作者共同完成,分别来自韩国大学化学与生物工程系、天津大学内燃机国家重点实验室、韩国大学电气工程学院以及麻省理工学院化学工程系。该研究于2025年发表在《Energy and AI》期刊上,题为《Methodology for Predicting Material Performance by Context-Based Modeling: A Case Study on Solid Amine CO2 Adsorbents》。研究的主要目标是提出一种基于上下文建模的新方法,利用大语言模型(LLMs)预测材料性能,并以固体胺CO2吸附剂在直接空气捕获(DAC)条件下的性能预测为例进行验证。

学术背景

材料信息学(Materials Informatics, MI)是材料科学中的一个重要领域,通过大数据和机器学习(Machine Learning, ML)加速新材料的发现与设计。传统MI方法主要依赖数值数据,忽略了文献中的大量文本信息。这些文本信息包含了丰富的实验经验和规律性知识,能够显著提高预测模型的准确性和可扩展性。本研究提出了一种基于上下文建模的方法,结合数值和文本信息,利用大语言模型(如ChatGPT 4o)进行材料性能预测。研究以固体胺CO2吸附剂在DAC条件下的吸附性能为例,展示了该方法在材料科学中的潜力。

研究流程

研究分为三个主要步骤:数据收集、提示准备和模型预测。

1. 数据收集

研究从22篇同行评审的文献中提取了170个数据点,构建了一个包含数值和文本信息的综合数据集。输入特征分为三组:固体载体的物理性质(如比表面积和孔体积)、负载胺的化学性质(如胺类型、分子量、氮原子含量、不同胺官能团的比例和负载量)以及测试条件(如温度、CO2分压和相对湿度)。输出特征为CO2吸附量。

2. 提示准备

提示设计包括三个部分:指令知识(Instruction Knowledge, IK)、输入-输出对和测试案例。指令知识详细描述了输入特征与输出特征之间的关系,输入-输出对提供了多个示例,测试案例则用于模型预测未知数据的输出。提示设计逐步增加信息量,从仅使用数值数据到包含输入特征的意义和影响条件,最终形成完整的提示。

3. 模型预测

研究使用ChatGPT 4o模型进行预测,并通过消融实验验证了不同提示配置对预测结果的影响。结果表明,包含完整文本信息的提示配置(“full prompt”)在预测精度和可靠性上表现最佳。与传统ML模型(如线性回归、随机森林、XGBoost和多层感知器)相比,ChatGPT 4o模型在减少预测误差和解释数据方差方面表现更为出色。

主要结果

研究通过消融实验和模型对比分析,验证了基于上下文建模的方法在预测固体胺CO2吸附性能上的优越性。具体结果如下:

  1. 消融实验:包含完整文本信息的提示配置(“full prompt”)在所有评估指标(MAE、MSE、R²和R)上表现最佳,表明结合数值和文本信息能够显著提高预测精度。
  2. 模型对比:ChatGPT 4o模型在MSE、MAE、R²和R等指标上均优于传统ML模型,展示了其在处理复杂数据关系上的优势。
  3. 特征重要性分析:通过Shapley Additive Explanations(SHAP)分析,研究发现固体载体的物理性质(如孔体积和比表面积)和胺负载量对CO2吸附性能的影响最大,测试条件的影响相对较小。

结论

本研究提出了一种基于大语言模型的材料性能预测方法,通过结合数值和文本信息,显著提高了预测精度和可扩展性。研究以固体胺CO2吸附剂为例,展示了该方法在材料科学中的应用潜力。与传统ML模型相比,基于上下文建模的方法能够更好地捕捉复杂的数据关系,减少对数值数据的依赖,并为材料性能预测提供了新的思路。

研究亮点

  1. 创新性方法:首次将大语言模型应用于材料性能预测,结合数值和文本信息,显著提高了预测精度。
  2. 广泛适用性:该方法不仅适用于固体胺CO2吸附剂,还可扩展到其他材料性能预测领域。
  3. 高效性与成本效益:通过减少对数值数据的依赖,该方法能够以较低的成本和较高的效率完成复杂的预测任务。

研究价值

本研究为材料科学领域提供了一种新的预测工具,能够更高效地预测材料性能,加速新材料的开发与应用。此外,该方法还为其他领域的复杂预测任务提供了参考,展示了人工智能技术在科学研究中的广泛应用前景。

其他有价值的内容

研究还提供了详细的SHAP分析结果,揭示了不同输入特征对CO2吸附性能的影响,为材料设计和优化提供了重要参考。此外,研究代码和数据集已在GitHub上开源,便于其他研究者复现和扩展研究结果。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com