基于贝叶斯优化的α衰变模型描述方法研究

分享自：
基于贝叶斯优化的α衰变模型描述方法研究

期刊:physical review cDOI:10.1103/physrevc.108.014326
α衰变半衰期研究的贝叶斯优化方法：提升模型预测精度的新途径
一、 研究团队与发表信息
本研究由来自中国多所高校和研究机构的科研人员共同完成。主要作者包括 Zisheng Jin 与 Mingshuai Yan，其他作者为 Hao Zhou, An Cheng, Zhongzhou Ren 以及 Jian Liu。通讯作者为 Jian Liu。研究团队所属机构分别为：中国石油大学（华东）理学院、南京大学物理学院、同济大学物理科学与工程学院、中国科学院近代物理研究所高精度核谱学重点实验室以及广西师范大学广西核物理与核技术重点实验室。
该项研究成果以“Bayesian optimization approach to model-based description of α decay”为题，发表于物理领域权威期刊 Physical Review C，发表于 2023 年 7 月 27 日，卷期编号为 108, 014326 (2023)。
二、 研究背景与目标
本研究属于核物理领域，具体聚焦于不稳定原子核的α衰变理论描述与预测。α衰变是核物理中最基本的衰变模式之一，对理解原子核结构、验证核模型、识别新合成的超重元素等具有至关重要的意义。α衰变过程可以简化描述为一个α粒子（氦核）穿过由原子核势和库仑势共同形成的势垒的量子隧穿效应。这一过程的半衰期理论计算主要涉及两个核心要素：一是α粒子穿透势垒的概率（穿透概率），二是母核中预先形成α粒子团簇的概率（α团簇预形成因子，Preformation factor， Pα）。其中，穿透概率的计算已有较为成熟的模型（如两势方法、变形隧穿模型等），而α团簇预形成因子Pα的微观计算则极为复杂，因为它涉及到母核内四个核子（两个质子和两个中子）如何预先结合成α粒子的量子多体问题。目前，理论处理Pα时常采用简化的经验性方法，例如在某些核区域将其视为常数，或使用包含幻数、价核子数等参数的半经验公式。这些方法虽然简单，但可能无法精确描述接近壳层闭合区域的α衰变半衰期，因为壳层结构效应会对Pα产生显著影响。因此，如何更准确地估计Pα，从而提升α衰变半衰期理论预测的精度，是核物理研究中的一个重要挑战。
近年来，机器学习方法为核物理研究提供了新的工具。特别是贝叶斯神经网络（Bayesian Neural Network， BNN），因其具备估计预测误差、自动控制模型复杂度、避免过拟合等优势，已在核质量、核半径、β衰变半衰期等性质的预测中展现出强大能力。本研究旨在将先进的α衰变物理模型与贝叶斯神经网络相结合，探索利用机器学习方法来修正传统模型对Pα的估计，从而系统性地提高α衰变半衰期理论预测的全局准确性和外推能力。本研究的一个关键策略是，在计算原始半衰期时使用实验测得的衰变能（Qα），以确保穿透概率计算的准确性，从而将贝叶斯神经网络的主要修正作用锁定在对Pα的改进上。此外，研究不仅关注常见的有利α跃迁（favored transitions），还将数据范围扩展到包含不利α跃迁（unfavored transitions）的核素，旨在更全面地探索α衰变机制。
三、 研究流程详述
本研究的工作流程主要包括以下几个相互关联的步骤：
步骤一：建立基础α衰变模型与数据准备。 研究者首先选取了三种不同的α衰变理论模型作为基础模型，用于计算未经修正的“原始”α衰变半衰期 (t_th_1⁄2)： 1. 球形隧穿模型 (Spherical Tunneling Model)：假设原子核为球形，通过求解包含核势、库仑势和离心势的薛定谔方程，利用半经典WKB近似计算穿透概率。 2. 变形隧穿模型 (Deformed Tunneling Model)：考虑了原子核的形变效应，通过双折叠模型（Double-folded model）计算α粒子与形变子核之间的微观势，并对所有方向进行平均以获得衰变宽度。 3. 半经验公式 (Semiempirical Formula)：作为一种参考，使用基于经验参数的公式来预测半衰期。
在利用上述模型计算原始半衰期时，一个关键输入参数是α衰变能Qα。本研究为确保穿透概率计算的准确性，统一使用了来自NUDAT3.0数据库的实验Qα值，而非理论模型预测值。对于预形成因子Pα，则采用一个半经验公式进行计算，该公式考虑了幻数核子数、价核子形成的四重态数目以及角动量变化等因素。
研究构建了一个包含479个α衰变跃迁数据的数据集，数据同样来自NUDAT3.0数据库。数据集涵盖了420个从基态到基态的α衰变跃迁（有利跃迁），以及59个分支比最大的基态到激发态的不利跃迁。这个数据集构成了后续贝叶斯神经网络训练和验证的基础。
步骤二：定义学习目标——残差 (Residual)。 本研究的目标并非让BNN直接预测半衰期，而是让它学习并预测理论模型计算值与实验值之间的偏差。为此，定义了残差δ_n： [ \deltan(\log{10}t{1⁄2}) = \log{10}(t^{exp}{1⁄2} / t^{th}{1⁄2}) ] 其中，t_exp_1/2是实验半衰期，t_th_1/2是上述某个基础模型计算的原始理论半衰期。BNN的任务就是学习从一组核素特征到该残差δ_n的复杂映射关系。
步骤三：设计并训练贝叶斯神经网络 (BNN)。 研究者设计了一个单隐藏层的贝叶斯神经网络。网络的输入层选择了四个与α衰变物理机制密切相关的特征参数： 1. 质子数 Z 2. α衰变能 Qα 3. 不对称系数 S = (N-Z)²/A（其中N为中子数，A为质量数） 4. 角动量变化 Δl
这些参数分别编码了核的电荷、衰变驱动力、核的质子-中子不对称性以及衰变过程中涉及的角动量变化，被认为能够有效反映影响α衰变半衰期（尤其是预形成因子Pα）的物理因素。网络输出即为残差δ_n。
网络的具体形式如论文中公式(14)所示，包含一个隐藏层，其神经元数量（h）和激活函数（ReLU函数）经过优化选择。BNN的核心在于其贝叶斯框架：网络权重参数ω被视为随机变量，被赋予先验分布（通常是零均值高斯分布）；通过将实验数据（输入x与目标值t=δ_n）作为证据，利用贝叶斯定理计算参数的后验概率分布p(ω|x, t)。最终的预测输出是网络函数s(x, ω)对所有可能的权重参数ω在后验分布下的平均值。这种概率化方法能够提供预测的不确定性估计，并有效防止过拟合。
步骤四：网络训练与模型评估。 研究者利用步骤一准备的479个数据点（x: Z, Qα, S, Δl; t: δ_n）来训练BNN。训练过程旨在找到最能解释数据残差与输入特征之间关系的网络参数后验分布。为了评估模型的性能，研究者计算了预测值与实验值之间的均方根偏差（Root-Mean-Square Deviation, σ_rms）。研究分为两个主要部分： * 全局优化分析：使用全部479个数据点进行训练和评估，考察BNN修正后模型（称为“后BNN”模型）相对于原始模型（“前BNN”模型）的全局精度提升。 * 外推能力分析：为了检验模型在未知核素区域的预测能力，研究者将数据集划分为学习集（421个数据，主要为较早的数据）和验证集（58个数据，选自2019年后更新的核数据）。首先仅使用学习集的数据训练BNN，然后将训练好的网络应用于验证集（这些核素在训练时未被“见过”），评估其外推预测的准确性。
四、 主要研究结果详述
结果一：全局优化效果显著。 表I（论文中）清晰地展示了BNN方法的强大修正能力。对于三种基础模型（球形隧穿模型、变形隧穿模型、半经验公式），在应用BNN进行残差修正后，其预测半衰期与实验值之间的均方根偏差σ_rms均大幅下降。具体而言： * 球形隧穿模型的σ_rms从0.882降至0.536，相对改进幅度达到39.2%。 * 变形隧穿模型的σ_rms从0.776降至0.517，相对改进幅度为33.4%。 * 半经验公式的σ_rms从0.855降至0.545，相对改进幅度为36.3%。
这些数据表明，无论基于何种物理模型或经验公式，BNN方法都能通过修正残差，显著提升对α衰变半衰期实验数据的描述精度，平均提升幅度超过30%。图2（论文中）直观地展示了修正前后的残差分布图。修正前，残差在核素图上呈区块状分布，尤其在超重核区域存在较大偏差。经BNN修正后，残差整体上更均匀、更接近于零，说明BNN成功捕捉并修正了原始模型在不同核区域存在的系统性偏差。
结果二：外推预测能力可靠。 表III（论文中）展示了外推分析的结果。关键发现是，即使在从未“见过”的验证集核素（58个新数据）上，经过学习集训练的BNN模型依然能够显著改善预测。 * 对于球形隧穿模型，验证集的σ_rms从0.977降至0.654，改进33.0%。 * 对于变形隧穿模型，验证集的σ_rms从0.786降至0.615，改进21.7%。
尽管外推改进幅度略低于全局优化（因为学习难度更大），但依然取得了显著效果。这表明，BNN不仅学习了数据中的统计规律，还很可能提取到了与α衰变物理机制（特别是Pα的变化规律）相关的普适性特征，因此能够对未知核素做出合理的预测。这为预测尚缺实验数据的未知核素（如更重的超重元素）的α衰变半衰期提供了有力工具。
结果三：BNN修正的核心在于改进预形成因子Pα，并能反映壳层结构效应。 由于研究中使用了实验Qα值，可以认为穿透概率的计算是相对准确的。因此，BNN所修正的残差主要来源于原始模型中对预形成因子Pα估计的不准确。为了验证这一点，研究者在同位素链和同中子素链上进行了详细分析。
以图3和图4（论文中）为例，展示了Po (Z=84) 和 Ac (Z=89) 同位素链以及N=127和N=128同中子素链的衰变半衰期理论计算值与实验值的比较。结果显示： 1. 修正关键核素：原始模型对某些靠近幻数（如N=126, 128; Z=82）的核素（如210Po, 211Po, 216Ac）的半衰期预测偏差较大，这正是因为简单的Pα模型未能充分刻画壳层结构对α粒子预形成的强烈抑制作用。 2. BNN的有效修正：经BNN修正后，这些核素的预测值被拉向实验值，得到了显著改善。例如，对于211Po (N=127, Z=84)，BNN修正后给出的Pα值（0.026）与文献中更精确的计算结果相符；对于216Ac (N=127, Z=89)，修正后的Pα值（0.034）也与参考值吻合良好。 3. 揭示物理效应：BNN方法通过输入参数（如Z, N, S）隐含地学习到了壳层结构（幻数效应）和奇偶效应（奇A核与偶偶核的差异）对α衰变半衰期的影响规律。在图4的同中子素链中，BNN修正后的结果清晰地再现了半衰期随质子数变化的奇偶摆动现象，这是原始模型未能很好展现的细节。
这些分析强有力地证明，BNN方法通过其强大的非线性拟合能力，成功地从数据中提取了影响Pα的关键物理信息（特别是壳层效应和配对效应），并以一种数据驱动的方式，对基于物理模型的Pα估计进行了有效且合理的精细化修正。
五、 研究结论与价值
本研究的核心结论是：将贝叶斯神经网络（BNN）与现有的α衰变理论模型相结合，能够显著提高α衰变半衰期的理论预测精度，这种提升主要源于BNN对α团簇预形成因子（Pα）的有效修正。
该研究的科学价值和应用前景体现在以下几个方面： * 提供新方法：为处理核物理中复杂的多体问题（如α预形成）提供了一种新颖有效的“物理模型+数据驱动”混合方法。它不取代物理模型，而是作为其强大的“修正器”或“优化器”。 * 提升预测能力：显著提升了现有模型对已知核素α衰变半衰期的全局描述精度，更重要的是，展示了可靠的外推预测能力。这对于指导超重元素合成实验、预测未知核素的性质（如在滴线附近或超重核区）具有重要应用价值。 * 揭示物理关联：研究表明，通过合理选择物理意义明确的输入特征（Z, Qα, S, Δl），BNN能够自动学习并内化诸如壳层结构、奇偶效应等对α衰变至关重要的物理规律，从而以量化的方式修正理论模型。这为理解α预形成因子的微观机制提供了新的数据洞察视角。 * 方法普适性：该方法被成功应用于三种不同的基础模型（两个基于物理的隧穿模型和一个半经验公式），均取得显著效果，证明了其广泛的适用性和鲁棒性。研究者预期，该方法可进一步推广应用于核物理的其他领域。
六、 研究亮点
创新性的结合：首次系统地将贝叶斯神经网络与成熟的α衰变物理模型深度结合，用于修正模型中最具不确定性的部分——α团簇预形成因子，而不是直接替代物理模型或仅作黑箱预测。
明确的问题定位：通过采用实验Qα值，巧妙地将BNN的修正目标聚焦于Pα，使得物理图像清晰，改进的根源明确。
出色的性能提升：在全局和局部（特别是壳层附近）均实现了超过30%的预测精度提升，并在外推测试中展现了稳健的预测能力。
物理可解释性：选取的输入特征具有明确的物理意义，使得BNN的学习过程与核物理知识相关联。对同位素/同中子素链的分析直观展示了BNN如何捕捉并修正壳层效应等物理细节，增强了方法的可信度。
全面的数据覆盖：研究数据集不仅包含常见的有利α跃迁，也包含了不利α跃迁，并通过引入角动量变化Δl作为输入特征，使模型能够处理更广泛的衰变模式，拓展了研究范围。
七、 其他有价值的内容
研究中还提及，他们利用BNN方法对α衰变半衰期残差进行训练时，网络结构（如隐藏层节点数、激活函数）的选择经过了优化。此外，论文详细介绍了所采用的半经验Pα公式及其在不同核区域的拟合系数（表II），这为其他研究者提供了参考。研究者也坦诚指出，当前BNN方法虽然有效，但其“学习”到的Pα修正规则是隐含在神经网络参数中的，尚未能以一个简洁的解析公式表达出来。未来的工作可以探索如何从训练好的BNN中提取更明确的物理规律。同时，致谢部分列出了多个国家自然科学基金等项目的资助，体现了该研究得到了国内学术界的支持。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问