机器学习高斯过程对核结合能的可靠计算

分享自：
机器学习高斯过程对核结合能的可靠计算

期刊:nuclear science and techniquesDOI:10.1007/s41365-024-01463-9
在机器学习（Machine Learning）的前沿方法与核物理研究的交叉领域，一项创新性的研究为我们提供了计算核结合能的新范式。近日，由同济大学、河海大学等机构的研究人员袁子毅（Zi-Yi Yuan）、白东（Dong Bai）、王祯（Zhen Wang）、任中洲（Zhong-Zhou Ren）共同完成的研究成果“Reliable Calculations of Nuclear Binding Energies by the Gaussian Process of Machine Learning”在期刊 Nuclear Science and Techniques 上正式发表（2024年6月在线出版）。该研究将高斯过程（Gaussian Process）这一强大的非参数机器学习模型，首次应用于直接建模原子核的结合能，取得了令人瞩目的精确度，并成功预测了未知核素的α衰变性质，为核物理基础研究及重元素合成实验提供了新的理论工具。
核结合能是原子核最基础的物理性质之一，它表征了将原子核分解成单个核子所需的最小能量。精确的结合能数据对于理解核结构、探索核天体物理中的快速中子俘获过程（r-process）、预测超重核的合成路径以及解释中子星性质等至关重要。传统的理论模型，如Bethe-Weizsäcker质量公式、Thomas-Fermi模型、Hartree-Fock-Bogoliubov平均场模型等，虽然已能较好地描述结合能，但在精度和预测未知区域的能力上仍有提升空间。近年来，机器学习凭借其从数据中学习复杂模式并外推预测的强大能力，已在核质量、电荷半径、衰变性质等预测任务中展现出巨大潜力。其中，高斯过程作为一种贝叶斯非参数方法，不仅能给出预测值，还能提供预测的不确定度分布，具有独特的优势。受此启发，本研究团队旨在探索高斯过程在核结合能计算中的可靠性与准确性，并基于精确的结合能预测进一步研究α衰变能。
一、研究的详细工作流程
本研究的工作流程清晰、严谨，主要分为模型构建、训练学习、性能测试、应用拓展及预测验证几个核心步骤。整个研究的对象是原子核，其“样本”来自国际权威原子质量评估AME2020数据库。
第一步：构建物理驱动的特征空间与高斯过程模型。 研究团队的核心创新之一在于精心设计了一个包含九个物理特征的向量来描述每个原子核（(A, Z, N)分别表示质量数、质子数和中子数）。这些特征并非任意选择，而是深深植根于核物理的基本理论： 1. A：模拟体积能，反映核力的饱和性。 2. A^(2⁄3)：模拟表面能。 3. Z² A^(-1⁄3)：模拟质子间的库仑排斥能。 4. (A/2 - Z)² / A：模拟对称能。 5. A^(-1⁄2)：与对能相关的项。 6. Δ = [(-1)^N + (-1)^Z] / 2：对能项参数，区分偶偶核（Δ=1）、奇A核（Δ=0）和奇奇核（Δ=-1）。 7. |N - Z| / A：维格纳项，描述中子-质子关联。 8. ζ 和 9. υ：这两个特征用于引入壳层效应信息，它们分别根据质子数和中子数离最近魔数的距离计算得出。
这个“物理驱动的特征空间”相较于单纯使用A, Z, N等原始信息，能更有效地将物理先验知识注入机器学习模型，引导模型学习真实的物理规律，而非单纯的数值拟合。
在高斯过程模型方面，研究团队没有使用标准的单一核函数，而是创造性地提出了一种复合核函数（Composite Kernel Function）。该函数是Matérn核函数与有理二次（Rational Quadratic）核函数的线性组合。Matérn核函数擅长于局域插值，而有理二次核函数在处理不同尺度的变化时更灵活，尤其有利于长程外推。这种组合设计旨在同时继承两种核函数的优点，以兼顾对训练集内数据的精确拟合（插值能力）和对训练集外数据的稳健预测（外推能力）。模型包含五个超参数（σ_b, l_b, α_b, d_b, σ_b），它们通过最大化边缘似然函数（Marginal Likelihood）在训练数据上自动优化确定。
第二步：评估模型的学习能力。 研究团队首先选取了AME2020数据库中Z>20且N>20的2238个核素作为训练集。每个核素以其九维特征向量和实验结合能作为输入。在训练阶段，高斯过程通过优化超参数来学习从特征到结合能的映射关系。训练完成后，计算这2238个核素结合能的预测值与实验值的偏差。结果显示，所有核素的绝对偏差均小于0.423 MeV，整体平均偏差（⟨σ_b⟩）仅为0.046 MeV，标准偏差（√σ_b²）为0.066 MeV。这一极高的精度显著超越了传统Bethe-Weizsäcker公式的水平，充分证明了高斯过程在捕捉结合能复杂变化模式方面的强大“学习能力”。
第三步：评估模型的预测能力。 为了检验模型对未知核素的预测（外推）能力，研究团队设计了两项关键测试： 1. 同中子素交叉验证： 采用“同中子素折叠交叉验证”方法，即每次预测一条同中子素链上所有核的结合能，而训练数据来自其他所有同中子素链。计算得到的总体平均偏差为0.100 MeV，标准偏差为0.144 MeV。这证明即使在不包含目标核任何信息的条件下，模型也能做出相当准确的预测，泛化能力良好。 2. 预测AME2020新增核素： 使用AME2012（旧版）与AME2020共有的核素数据作为训练集，去预测AME2020新增而AME2012未收录的108个新核素的结合能。预测结果的平均偏差为0.216 MeV，标准偏差为0.304 MeV。考虑到这些核素完全不在训练集中，且可能位于核版图相对偏远的位置，这一精度是相当出色的，有力地验证了模型可靠的“预测能力”。
第四步：模型组件分析与比较。 为了凸显所提方法的优越性，研究团队进行了细致的消融研究（Ablation Study）和对比分析： * 核函数对比： 分别使用单一的Matérn核函数和有理二次核函数进行相同计算。对于2238个核素，Matérn核函数结果稍逊于复合核函数（0.059 MeV vs 0.046 MeV），有理二次核函数则差距较大（0.121 MeV）。对于108个新核素，有理二次核函数结果（0.193 MeV）与复合核函数（0.216 MeV）相当，但Matérn核函数结果较差（0.278 MeV）。这证实了复合核函数设计成功地结合了两种核函数的优势，达到了最佳的平衡。 * 特征空间对比： 逐步增加特征的复杂度。仅使用Bethe-Weizsäcker公式对应的六个特征时，对108个新核素的预测误差较大（0.437 MeV）。加入中子-质子关联项（第七项）后，误差降至0.398 MeV。进一步加入壳层信息（ζ, υ）但不包括中子-质子关联项时，误差显著降至0.236 MeV。而当使用全部九个特征时，误差达到最小的0.216 MeV。这一系列对比清晰地表明了：中子-质子关联和壳层效应信息对精确计算结合能至关重要，且本研究所构建的九维特征空间是最优组合。
第五步：应用至α衰变能计算与预测。 结合能的一个直接应用是计算α衰变能（Q_α）。研究团队利用高斯过程计算的结合能，导出了质子数50 ≤ Z ≤ 110范围内的1169个核素的α衰变能。与实验值比较，平均偏差为0.047 MeV，标准偏差为0.070 MeV，绝大多数核素的偏差在0.3 MeV以内，即使对于闭壳附近的核素也保持了高精度。这证明了基于高斯过程结合能计算衍生的衰变能同样可靠。
尤为引人注目的是，研究准确再现了新近实验合成的两个新同位素：204Ac（实验Q_α = 8.107 MeV，理论值8.107 MeV，偏差仅0.0004 MeV）和207Th（实验Q_α = 8.328 MeV，理论值8.277 MeV，偏差0.051 MeV）。这强有力地证明了该模型对最前沿实验发现的支持和验证能力。
第六步：预测未知锕系核素的α衰变性质。 作为研究的最终应用，团队利用训练好的高斯过程模型，预测了一批尚未在实验中测定的锕系核素的α衰变能，并进一步结合新的Geiger-Nuttall定律（NGNL）计算了它们的α衰变半衰期。预测结果与广泛使用的有限程液滴模型（FRDM）的计算结果进行了比对。对于大多数核素，两者的预测值吻合较好。然而，对于锿（Es）、镄（Fm）、钔（Md）、锘（No）等超重元素的一些同位素，高斯过程的预测值普遍高于FRDM的预测值，这导致了半衰期预测上的差异。这些差异区域为未来的实验检验提供了明确的目标，也预示着高斯过程模型可能捕捉到了一些现有模型未能充分描述的物理机制。
二、研究的主要结果与结论
本研究的核心结果可概括为以下几点： 1. 成功建立了基于高斯过程的核结合能高精度计算模型。 对2238个已知核素的计算精度达到了亚0.1 MeV的水平（平均偏差0.046 MeV），这是机器学习应用于核质量/结合能领域的顶尖精度之一。 2. 证明了模型强大的预测和外推能力。 通过对108个AME2020新增核素的成功预测（平均偏差0.216 MeV），以及同中子素交叉验证的优异表现，表明该模型能够可靠地应用于核版图中数据稀疏或空白的区域。 3. 验证了复合核函数与物理驱动特征空间的有效性。 通过系统对比，证实了本研究提出的复合核函数和九维特征空间设计是达到当前最佳性能的关键，为机器学习应用于其他物理问题提供了新思路。 4. 实现了α衰变能的高精度再现与预测。 基于结合能计算的1169个核素的α衰变能与实验高度一致（平均偏差0.047 MeV），并成功复现了最新实验发现的新核素数据。 5. 提供了未知锕系核素衰变性质的理论预言。 研究给出了一系列未知锕系核素的α衰变能和半衰期预测，这些结果可作为兰州重离子研究装置（HIRFL）等国内外实验装置合成新核素、鉴别衰变链的重要理论参考。
三、研究的亮点与价值
本研究的亮点突出体现在以下几个方面： * 方法创新： 这是首次将高斯过程直接用于建模核结合能，并创造性地使用了复合核函数，巧妙地平衡了插值与外推需求。同时，构建的九维物理驱动特征空间深度融合了核物理理论知识，使得机器学习模型不再是“黑箱”，而是一个有物理洞察力的预测工具。 * 精度卓越： 在结合能和α衰变能的计算上达到的亚0.1 MeV量级的精度，满足了核物理许多精细研究的需要，例如r-process核合成计算对核质量精度的高要求。 * 预测与验证并重： 研究不仅追求在已知数据上的高精度，更通过严格的交叉验证和对全新实验数据的预测，全面评估并证实了模型的外推可靠性。对新核素204Ac和207Th的成功预测，是模型实用价值的有力证明。 * 应用导向明确： 研究最终落脚于对未知锕系核素衰变性质的预测，直接服务于超重元素合成与鉴别这一重大实验前沿，体现了理论工作对实验研究的引导和支持作用。
四、总结
袁子毅、白东、王祯、任中洲研究员团队的工作，成功地将高斯过程机器学习方法引入核结合能计算领域，发展出一套高精度、高预测可靠性、物理可解释性强的计算模型。这项工作不仅为核物理基础数据提供了新的、可靠的计算工具，也展示了机器学习与具体物理问题深度结合（通过设计物理启发的特征和模型）所能产生的强大效能。该模型所预测的未知核素衰变性质，有望在未来的重离子实验中得到检验，从而推动超重核研究的发展。这项研究是人工智能赋能基础科学研究的又一个优秀范例。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问