该文档报告了一项利用机器学习中的高斯过程(Gaussian Process)模型预测重核与超重核α衰变能的原创性研究。这是一篇典型的原创研究论文,符合类型a的标准。以下是根据要求生成的学术报告,旨在向中文研究人员全面介绍此项工作。
一、 研究作者、机构与发表信息
本研究由同济大学物理科学与工程学院的袁子懿、任中洲、王震,以及河海大学理学学院的柏栋共同完成。其中,任中洲教授为通信作者。该研究得到了多项国家自然科学基金、国家重点研发计划等项目的支持。研究成果以题为《利用机器学习预测重核和超重核的α衰变能》的论文形式,于2023年4月发表在国内核心学术期刊《原子能科学技术》(Atomic Energy Science and Technology)第57卷第4期上。
二、 学术背景与研究目标
本研究的科学领域属于核物理,具体聚焦于原子核结构、衰变性质的理论计算与预测。α衰变对于重核(Z>82)和超重核(Z≈104及以上)的研究具有至关重要的意义。它不仅是实验上鉴别新合成核素的关键“指纹”,也是探究这些核素的稳定性、壳结构等基本性质的重要窗口。近年来,实验技术的进步使得合成更多重核与超重核新同位素成为可能,例如新核素²⁰⁷Th的合成。为了解释实验现象并为未来的实验探索提供理论指导,开发能够高精度预测α衰变性质的理论模型是核物理领域的一项重要需求。
传统的理论模型,如DZ(Duflo-Zuker)模型、WS4(修正的Weizsäcker-Skyrme公式)、FRDM(有限程液滴模型)等,在预测α衰变能方面取得了成功,并一直是实验研究的重要参考。与此同时,机器学习(Machine Learning, ML)技术在近年来已广泛渗透到核物理研究的各个方面,如预测核质量、电荷半径等,显示出其强大的数据挖掘和模式识别能力。其中,高斯过程作为一种重要的机器学习算法,已成功应用于一些缺中子锕系核α衰变性质的研究。
然而,高斯过程模型在更广阔的重核与超重核区域(质子数Z从89到118)的α衰变能预测中的有效性和可靠性仍需进一步检验。因此,本研究旨在深入探索机器学习方法在核物理问题研究中的适用性,具体目标有两个:第一,将高斯过程模型拓展应用于重核和超重核区域,验证其预测α衰变能的可靠性;第二,利用已验证的模型,系统预测一批未知重核与超重核的α衰变能,为这些核素的未来实验合成与鉴别提供准确的理论参考数据。
三、 研究流程与方法详述
本研究主要包含以下几个严谨的步骤:模型构建与验证、系统性预测及结果对比分析。
1. 研究数据集的构建 研究的基础是一个包含已知α衰变能的数据集。作者从AME2016(原子质量评估2016版)及更新的实验文献中,收集了质子数Z在89至118之间的326个原子核的实验α衰变能数据,构成了高斯过程模型的训练集。值得注意的是,新近合成且具有已知实验α衰变能的新核素²⁰⁷Th被有意地从训练集中排除,以便后续将其作为独立的“考题”来检验模型的预测能力。这种设置增强了模型验证的客观性。
2. 高斯过程模型的理论框架与实现 高斯过程是一种非参数化的贝叶斯概率模型,适用于回归和分类问题。在本研究中,输入变量(x)是原子核的两个基本特征:质子数(Z)和中子数(N)。输出变量(y)则是该原子核的α衰变能(Qα)。研究采用了一个均值为零的高斯过程模型。模型的核心在于“核函数”(Kernel Function),它定义了输入空间两点之间的协方差,从而决定了函数的平滑度和特性。
为了评估模型对核函数选择的敏感性并获取系统误差估计,作者在计算中同时采用了两种常用的核函数:Mátern 3/2核函数(M3/2)和Mátern 5/2核函数(M5/2)。这两种核函数的平滑度不同,M5/2比M3/2更平滑。模型中的超参数(如长度尺度l和信号方差η²)通过极大似然估计法,基于上述326个核的完整训练数据集进行优化确定。模型的整个计算流程,包括利用训练好的高斯过程对新输入(未知核的Z, N)进行预测(得到预测的Qα及其不确定性),均遵循标准的贝叶斯推断公式。
3. 模型可靠性的验证流程 验证分两步进行。第一步是“留一法交叉验证”(Leave-One-Out Cross-Validation):对于训练集中的每一个核,将其暂时移除,用剩余的325个核重新训练模型,并预测被移除核的α衰变能。通过计算所有预测值与其实验值之间的均方根误差(RMSE),可以定量评估模型的整体预测精度和泛化能力。第二步是“新核素预测验证”:使用完整训练集训练好的模型,直接预测不在训练集中的新核素²⁰⁷Th的α衰变能,并将预测结果与其最新的实验测量值进行直接比较,计算理论偏差。
4. 未知核素的系统性预测 在确认模型可靠性之后,作者利用训练好的高斯过程模型,对原子序数Z在89至118范围内、共计152个α衰变能尚属未知的重核与超重核进行了系统性预测。对于每个预测核,模型会给出基于M3/2和M5/2两种核函数的预测值,这二者之间的差异可以作为模型系统误差的一个指标。
5. 结果分析与对比 为确保预测结果的合理性,研究者将高斯过程的预测值(Q_M3/2和Q_M5/2)与两个成熟的传统核物理模型——WS4模型和FRDM模型——的预测结果进行了详细的横向对比。这种对比不仅限于数值列表,更通过绘制α衰变能随中子数N变化的趋势图(同位素链),直观地展示了不同模型预测结果之间的异同,并尝试从核结构(如壳效应、形变)的角度解释某些预测中出现的奇特现象。
四、 主要研究结果详述
1. 模型验证结果 交叉验证结果表明,采用M3/2和M5/2核函数的高斯过程模型的均方根误差(RMSE)分别为0.103 MeV和0.114 MeV。这表明模型在已知数据上具有较高的预测精度,并且M3/2核函数的表现略优。更重要的是,对新核素²⁰⁷Th的独立预测取得了成功。使用M3/2和M5/2核函数预测得到的α衰变能分别为8.303 MeV和8.268 MeV,与其实验值8.328 MeV的偏差仅为0.025 MeV和0.060 MeV。如此小的偏差有力地证明了高斯过程模型具备良好的外推预测能力。结合交叉验证的低误差,研究得出结论:高斯过程是一个可靠的研究重核与超重核α衰变能的理论模型。
2. 模型特性分析 一个有趣的发现是,M3/2核函数在本研究中表现稍好于更平滑的M5/2核函数。作者对此给出了合理的物理解释:由于重核和超重核的α衰变能随核子数的变化相对平缓,不需要过于平滑的函数来拟合,因此相对“粗糙”一些的M3/2核函数反而更为合适。这体现了根据具体物理问题特性选择适当机器学习工具的重要性。
3. 未知核素的预测结果与对比分析 预测所得的152个核的α衰变能数据被整理成详尽的表格(即原文表1)。总体而言,高斯过程(无论采用哪种核函数)的预测结果与WS4和FRDM等传统模型的预测值高度相似,这从宏观上佐证了高斯过程预测的合理性。两种核函数预测值之间的差异普遍很小,说明模型的系统误差可控。 通过绘制各个元素同位素链的α衰变能趋势图(原文图1a, 2a-d),研究进行了更深入的微观分析。研究发现: - 对于Z从89到111的大部分核素,高斯过程的预测曲线与WS4模型的预测曲线基本重合,趋势一致。 - 在一些特定区域,预测结果揭示了可能的核结构效应。例如,对于锫(Bk)同位素链,²⁵¹Bk(N=154)的预测α衰变能出现了一个局域最大值。作者指出,这可能与N=154处存在的形变壳层(deformed shell)效应有关。 - 对于更重的元素,如𬭳(Sg, Z=106)和𬭶(Hs, Z=108)同位素链,高斯过程预测的²⁷⁰Sg和²⁷²Hs的α衰变能也呈现出局域极大值,这可能受到N=164形变子壳层(deformed subshell)的影响。这些预测结果为未来在N=154和N=164壳层附近寻找核结构变化的实验研究提供了新的理论线索和关注点。 - 对于质子数Z在112至118的超重核区,尽管实验数据极为稀少,但高斯过程预测的α衰变能趋势与WS4模型的预测趋势展现出良好的一致性,增强了在数据稀缺区域进行理论预测的信心。
五、 研究结论与意义价值
本研究成功地将机器学习中的高斯过程模型应用于重核与超重核α衰变能的预测,并得出以下核心结论: 1. 可靠性验证:通过对新核素²⁰⁷Th的成功预测和良好的交叉验证结果,证实了高斯过程是研究该领域α衰变能的一个可靠、有效的理论工具。 2. 系统性预测:研究系统预测了152个未知重核与超重核的α衰变能,提供了宝贵的理论数据。 3. 揭示核结构信息:预测结果在N=154和N=164附近表现出的异常,与传统核结构理论中关于形变壳/子壳的认知相呼应,表明机器学习模型不仅能够拟合数据,还能捕捉到潜在的物理规律。
本研究的科学价值在于,它为核物理理论计算提供了一种新的、基于数据驱动的强大工具。高斯过程模型与传统微观模型(如WS4)或宏观-微观模型(如FRDM)形成了有益的互补。前者不依赖于具体的核力模型或参数化质量公式,而是直接从实验数据中学习规律,特别适合在实验数据有一定积累但传统模型计算复杂的区域进行快速、准确的预测和探索性研究。
其应用价值十分明确:为未来在重核与超重核“地图”上探索新核素、研究奇特核结构(如壳效应、形状共存)的实验工作提供了更丰富、更准确的理论参考。实验科学家可以将高斯过程的预测值与传统模型的预测值结合使用,作为鉴别新核素、设计实验方案和理解实验结果的重要依据。
六、 研究亮点
七、 其他有价值内容
本研究在讨论部分还提及了与另一篇类似文献结果的差异。由于本研究采用了更新的、更全面的训练数据集(包含了更多新测得的实验数据),导致对某些核(如²⁰⁴Ac, ²¹³U等)的预测结果与早期文献有所不同。这强调了在机器学习研究中,高质量、更新及时的训练数据对于预测结果准确性至关重要。同时,作者也指出,高斯过程模型本身对过拟合问题具有一定的抵抗能力,这得益于其贝叶斯框架和合理的超参数设置。