本报告介绍一项发表于《欧洲物理杂志A》(Eur. Phys. J. A)2025年的原创性研究,该研究由印度巴拉蒂亚尔大学(Bharathiar University)物理系的 S. Madhumitha Shree 和 M. Balasubramaniam 完成,旨在利用机器学习技术预测超重元素(Superheavy Elements, SHEs)的α衰变半衰期,为核物理领域提供新的理论预测工具。
这项研究源于当前核物理领域对超重核合成与稳定性研究的迫切需求。超重元素(通常指原子序数Z > 104的核素)因其极端条件下的核结构与衰变特性而备受关注。α衰变是鉴别新元素、构建衰变链及研究超重核壳效应的关键探针之一。然而,随着核素向超重区域延伸,实验合成愈发困难且数据稀少,传统理论模型(如Skyrme-Hartree-Fock、相对论平均场模型、宏观-微观模型)及基于Geiger-Nuttall定律的经验公式在预测准确性上存在局限。为提高预测精度并探索数据驱动的新方法,本研究引入机器学习中的XGBoost(极限梯度提升)算法,旨在建立核特征(如衰变能Q值、质量数A、质子数Z、中子数N)与α衰变半衰期之间更复杂、非线性的关联模型。研究目标明确:1) 利用已知实验数据训练一个高性能预测模型;2) 评估模型在已知区域的预测准确性并与现有经验公式比较;3) 将训练好的模型外推至超重核区域,预测未知核素的半衰期;4) 利用SHAP(SHapley Additive exPlanations)可解释性工具分析各物理特征对预测结果的影响程度,增强模型的可信度与物理洞察。
研究的详细工作流程主要分为数据准备、模型构建与优化、模型验证与对比、外推预测及特征重要性分析五个关键步骤。首先,研究团队收集了344个基态α发射核素的实验半衰期数据,这些数据取自Denisov和Khudenko于2009年汇编的数据库。这些核素覆盖了广泛的质量数(106 ≤ A ≤ 261)和原子序数(52 ≤ Z ≤ 107)范围,包括136个偶-偶核、84个偶-奇核、76个奇-偶核和48个奇-奇核,确保了数据集的代表性和多样性。研究设计了两个特征数据集:数据集I包含基本核特征:A、Z、N、Q;数据集II则基于对α衰变物理的认知进行了特征工程,包含A、N、1/√Q、√Z。通过使用1/√Q和√Z,模型更直接地关联到Geiger-Nuttall经验公式中的核心变量形式,旨在捕捉更深层的物理关系。
其次,在模型构建与优化阶段,研究采用XGBoost这一强大的梯度提升决策树算法。其数学核心在于顺序构建多棵决策树,每棵树学习修正前序模型预测的残差,最终通过加性集成获得强预测器。目标函数结合了预测损失(如均方误差)和正则化项(控制树的复杂度,如叶子节点数和权重),以防止过拟合。为最大化模型性能,研究采用网格搜索(GridSearchCV)配合五折交叉验证(5-fold cross-validation)对7个关键超参数进行精细调优,包括树的数量(n_estimators)、最大树深(max_depth)、学习率(learning_rate)、最小叶子节点权重(min_child_weight)等,探索了多达4032种参数组合。经过调优,数据集I和II各自获得了最佳超参数组合,例如数据集II的最佳模型参数为:n_estimators=700, max_depth=4, gamma=0, learning_rate=0.2等。数据集被随机划分为训练集(275个数据点)和测试集(69个数据点),确保模型评估的可靠性。
第三,在模型验证与对比环节,研究者将训练好的XGBoost模型的预测性能与四个广泛使用的经验公式进行了系统比较,这些公式分别是:Viola-Seaborg公式、Brown公式、Royer公式以及Denisov-Khudenko公式。评价指标为均方根误差(RMSE),它衡量了模型预测的对数半衰期(log₁₀ T₁/₂)与实验值之间的平均偏差。结果显示,XGBoost模型(尤其是基于数据集II训练的模型)在所有核素类型(总计、偶-偶、偶-奇、奇-偶、奇-奇)上的RMSE均显著低于所有经验公式。例如,对于全部344个核素,数据集II模型的RMSE仅为0.0221,远低于经验公式(通常在0.3以上)。这表明机器学习模型捕捉到了经验公式无法描述的数据中更精细的模式。研究还对比了其他机器学习模型(如支持向量回归SVR、K近邻KNN、随机森林RF)在同一任务上的表现,确认XGBoost在预测精度上具有最优越性。
第四,研究利用训练好的模型(特别是性能更优的数据集II模型)对超重核区域(Z = 105 至 118)一系列同位素的α衰变半衰期进行了预测。预测所需的关键输入——衰变能Q值,对于有实验数据的核素取自文献,对于未知核素则基于Möller等人的原子核质量模型计算得出。预测结果以图表和表格形式(论文中的Table 7, 8, 9及Figures 3, 4, 5)详细列出,并与已有实验数据及其他经验公式的预测值进行了并列对比。结果显示,XGBoboost的预测值与现有实验数据符合得非常好。特别是在外推区域,尽管存在一定偏差,但XGBoost模型展现了合理的趋势。残差分析(Figure 6)进一步表明,对于超重核的实验数据,XGBoost预测的残差(预测值-实验值)大多集中在±1个数量级的区间内,其表现与其他经验公式相当甚至更好,证明了模型具有一定的外推鲁棒性。然而,研究也指出,在Z > 112的更深区超重核区域,不同模型(包括XGBoost和经验公式)之间的预测值有时会相差一个数量级以上,这突显了该区域亟需新的实验测量数据来验证和约束理论模型。
第五,为增强模型的可解释性并理解物理特征如何影响预测,研究应用了SHAP分析。SHAP值基于合作博弈论,量化了每个输入特征对最终预测结果的贡献。SHAP摘要图(Figures 7 & 8)清晰展示了两个数据集的特征重要性排序。对于数据集I,最重要的特征是衰变能Q值,高Q值倾向于降低预测的半衰期(负SHAP值),这与物理规律(衰变能越大,半衰期越短)完全一致。对于数据集II,最重要的特征是1/√Q,其重要性排序和影响方向同样与物理直觉相符。此外,质量数A、中子数N和质子数Z(或其变换)的贡献也得以可视化,确认了模型并非“黑箱”,其决策过程与核物理基础知识相吻合。
本研究的结论是:采用XGBoost机器学习算法,成功构建了高精度的α衰变半衰期预测模型。该模型在训练数据覆盖的区域内显著超越了传统经验公式的预测精度。通过精心设计的特征集(特别是数据集II)和严格的超参数优化,模型能够有效捕捉核特征与半衰期之间的复杂关联。当应用于超重元素区域时,模型展现出良好的预测能力,其结果与现有实验数据吻合,并可用于对未知超重核半衰期提供可靠的估算。此外,利用SHAP工具进行的可解释性分析,使模型预测背后的物理驱动因素变得透明,增强了结果的可信度与科学价值。这项研究的意义在于,它为核物理,特别是超重核研究领域,提供了一种强大的、数据驱动的补充性预测工具。在实验数据稀少且获取成本极高的前沿区域,这种高精度的机器学习模型可以指导实验设计、帮助识别潜在的长寿命核素、并为检验和发展微观核理论提供参考。
本研究的亮点突出体现在以下几个方面:第一,方法新颖:首次系统地将XGBoost这一先进机器学习算法应用于超重核α衰变半衰期的全局预测,并证明了其在精度上超越传统方法的优势。第二,数据驱动与物理洞察结合:不仅追求预测精度,还通过特征工程(设计数据集II)和SHAP可解释性分析,将机器学习模型的输出与基本的核物理规律(如Geiger-Nuttall关系)联系起来,实现了“黑箱”模型的透明化。第三,严谨的模型验证:研究不仅与多种经典经验公式进行了全面对比,还对比了其他主流机器学习算法,并通过残差分析评估了模型在外推区域的表现,论证过程系统而严谨。第四,实际应用价值明确:研究直接面向超重核物理这一前沿领域的实际需求,其预测结果为该区域的实验探索和理论研究提供了具体、量化的参考数据。最后,研究强调了未来需要更多实验数据来进一步验证和优化模型,尤其是在预测存在较大分歧的超重核区域,这指明了后续研究的方向。
这项由S. Madhumitha Shree和M. Balasubramaniam完成的研究,通过巧妙融合机器学习技术与核物理先验知识,为预测超重核的α衰变半衰期开辟了一条富有前景的新途径,是计算核物理与数据科学交叉融合的一个成功范例。