分享自:

基于机器学习和多目标优化的高熵合金加速设计

期刊:Journal of Chemical Information and ModelingDOI:10.1021/acs.jcim.3c00916

这篇文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:


机器学习与多目标优化驱动的高熵合金加速设计研究

作者及机构
本研究由上海大学材料学院的Yongkun Mu、Gang Wang、Wencong Lu团队主导,合作者包括Yingying Ma和Minjie Li。研究成果发表于2023年9月的《Journal of Chemical Information and Modeling》(J. Chem. Inf. Model. 2023, 63, 6029−6042)。

学术背景
高熵合金(High-Entropy Alloys, HEAs)是一类由五种以上主元元素(原子百分比5%-35%)组成的先进材料,具有高强度、高硬度、耐腐蚀等优异性能,在耐磨、轴承、植入材料等领域潜力巨大。然而,传统试错法设计HEAs面临两大挑战:一是成分空间巨大(理论上可达10^20量级),二是硬度(H)与压缩断裂应变(D)通常存在此消彼长的关系。尽管已有研究通过机器学习(Machine Learning, ML)预测HEAs的单一性能(如硬度或相结构),但多目标协同优化仍鲜有报道。为此,本研究提出了一种结合机器学习与多目标遗传算法(NSGA-II)的框架,旨在高效设计兼具高硬度和高韧性的HEAs。

研究流程与方法
研究分为五个核心模块:

  1. 数据集构建

    • 从文献中收集487个硬度(H)数据和208个断裂应变(D)数据,经预处理(剔除异常值、重复数据平均化)后保留467个H样本和172个D样本。
    • 基于Matminer库生成161个特征,包括132种元素属性特征(如电负性、剪切模量)、6种化学计量特征和23种相形成参数。
  2. 特征选择

    • 采用四步筛选法:
      • 方差阈值剔除恒定特征(移除16个D特征、10个H特征);
      • Pearson相关系数剔除高线性相关特征(保留86个D特征、90个H特征);
      • 序列前向选择(SFS)初步优化特征数量;
      • 遗传算法(GA)最终确定12个D特征(如局部电负性错配eleclocmis)和8个H特征(如剪切模量差异shearmsm)。
    • 通过SHAP分析发现,eleclocmis<0.205时对D有正向贡献,而shearmsm绝对值越大则H越高。
  3. 模型训练与验证

    • 对比Lasso、随机森林等算法后,选择支持向量回归(SVR)预测D(R²=0.76),LightGBM预测H(R²=0.90)。
    • 通过10折交叉验证和100次重复训练验证模型鲁棒性(D模型平均R²=0.68±0.05,H模型R²=0.89±0.01)。
  4. 多目标优化

    • 使用NSGA-II算法在20维特征空间中搜索Pareto最优解,生成66组非支配解。
    • 结合虚拟样本筛选(10万次轮盘赌生成成分,优先选择含Mo、Nb、Zr等低误差元素),最终推荐105种候选成分。
  5. 实验验证

    • 合成4种候选合金(如Co26Cr14Fe31Nb13V16),其中3种性能显著优于文献数据:
      • Co26Cr19Fe24Mo4Nb5V22的硬度(838 HV)与文献相当,但D提升135.8%;
      • Co26Cr14Fe31Nb13V16的D较同类合金提高282.4%。

主要结果与逻辑关联
- 特征分析揭示了关键物理机制:电负性错配(eleclocmis)通过影响相结构(BCC/FCC)调控塑性,而剪切模量差异(shearmsm)主导固溶强化效应。
- 模型优化中,GA特征选择将D模型的RMSE从SFS的7.04降至6.47,证明组合特征优于单一元素含量特征。
- 成分设计推荐了元素占比范围:Al(2-14.8 at%)、Nb(4-25 at%)、Mo(3-9.9 at%),与实验观测的相变阈值(如Al>8 at%引发BCC相)一致。

结论与价值
1. 科学价值:首次建立H与D的协同预测模型,阐明了电负性与剪切模量在多目标优化中的竞争机制。
2. 应用价值:提出的框架将HEAs设计周期从传统试错的数年缩短至数月,其中Co32Cr21Fe31Nb16的D达35%,为耐磨材料提供了新选择。
3. 方法论创新:虚拟样本生成算法通过轮盘赌加权(式1)缓解数据不平衡问题,显著扩展了搜索空间。

研究亮点
- 数据驱动:构建迄今最大的HEAs力学性能数据集(172,467条数据)。
- 跨尺度关联:通过SHAP分析将宏观性能(H/D)与原子级特征(如eleclocmis)关联。
- 可解释性:提出临界阈值(如eleclocmis<0.205)指导成分设计,突破“黑箱”局限。

其他发现
- 实验验证中Al15Co33.5Cr11Fe30.5Mo10因数据稀疏导致预测偏差(H误差101%),凸显小数据机器学习(Small Data ML)的挑战。作者建议未来通过主动学习(Active Learning)补充稀缺成分数据。


这篇报告系统梳理了研究的创新点与技术路径,为材料信息学领域提供了可复用的方法论框架。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com