利用具有平移不变性的无监督学习在原子分辨率图像中进行缺陷检测

分享自：
利用具有平移不变性的无监督学习在原子分辨率图像中进行缺陷检测

化学
纳米科学
期刊:npj computational materialsDOI:10.1038/s41524-021-00642-1
【点击此处】阅读全文、收藏及针对性提问
基于无监督学习与平移不变性的原子分辨率图像缺陷检测研究学术报告
一、 研究作者、机构与发表信息
本研究的主要作者为 Yueming Guo1✉, Sergei V. Kalinin 1, Hui Cai1, Kai Xiao 1, Sergiy Krylyuk2, Albert V. Davydov 2, Qianying Guo1 和 Andrew R. Lupini 1✉。其所属机构分别为：1. 美国橡树岭国家实验室纳米相材料科学中心；2. 美国国家标准与技术研究院材料测量实验室。该研究成果以论文形式发表，标题为“Defect detection in atomic-resolution images via unsupervised learning with translational invariance”，发表于期刊 *npj Computational Materials*，出版年份为2021年，文章ID为180，DOI为 https://doi.org/10.1038/s41524-021-00642-1。
二、 学术背景与研究目标
本研究属于材料科学、电子显微学与机器学习交叉领域，具体聚焦于利用扫描透射电子显微镜（Scanning Transmission Electron Microscopy, STEM）进行原子分辨率成像后，对晶体材料中缺陷的自动检测问题。
随着像差校正STEM技术的发展，科学家已经能够常规地以原子分辨率高速成像晶体缺陷，这导致在短时间内或通过长时间自主实验可以获取海量数据。为了高效处理这些数据，对STEM图像中的缺陷进行自动检测与分类变得至关重要。然而，与人工智能中许多目标检测与识别任务类似，从STEM图像中检测和识别缺陷极具挑战性，尤其是在处理原子数量多、对称性低的复杂晶体结构时。
此前，缺陷检测与分类的方法主要基于监督学习，这需要大量人工标注的数据集进行模型训练。无论是利用有限的实验数据进行弱监督学习，还是使用大量模拟数据进行标准监督学习，都需要对晶体结构和各类缺陷的原子排列有相当的先验知识。这使得训练出的模型通常局限于训练数据所包含的晶体结构，难以推广到其他结构。此外，对于结构复杂或缺陷种类繁多的材料，人工标注成本高昂。虽然也存在基于图论规则的非机器学习算法，但在处理大单胞晶体时效率会下降。
因此，本研究旨在开发一种无监督机器学习方法，用于原子分辨率STEM图像中的晶体学缺陷检测，以克服对标注数据的依赖，并能够适用于更广泛的材料体系。具体目标包括：1）开发一种基于单类支持向量机（One-Class Support Vector Machine, OCSVM）的无监督缺陷检测框架；2）引入能够确保输入特征具有平移不变性的图像分割与数据预处理方案；3）将该方法应用于不同类型的缺陷，如二维材料中的点缺陷、线缺陷以及三维纳米晶中的孪晶界，并验证其有效性。
三、 详细研究流程与方法
本研究包含两个主要演示案例，分别针对二维材料（MoW）Te2中的点/线缺陷和三维ZrO2纳米颗粒中的面缺陷（孪晶界）。整体工作流程涉及样品制备、STEM成像、数据预处理、模型应用与结果分析等多个步骤，并引入了两种创新的图像分割与预处理方案。
1. 样品制备与STEM实验 * 研究对象与样本： * 案例一（二维材料）：使用化学气相传输法生长的块体Mo0.91W0.09Te2晶体，通过机械剥离制备样品。STEM图像使用Nion UltraSTEM200在100 kV电压下采集，使用环形暗场探测器。 * 案例二（三维材料）：从致密ZrO2基底上通过聚焦离子束原位提取并制备透射电镜样品，并使用离子铣进行最终减薄以去除潜在损伤。原子分辨率STEM图像使用像差校正的Nion UltraSTEM 100在100 kV下采集。 * 数据处理核心：两种分割与预处理方案 为了应用OCSVM进行异常检测，必须确保大部分（或至少一大部分）子图像属于单一“正常”类别（即完美晶胞）。传统分割方法（围绕每个原子裁剪）在单胞包含多个非等效原子位点时会产生多个主要数据类别，不满足OCSVM要求。为此，研究团队开发了两种新方案，并均引入了帕特森函数作为特征提取描述符，以确保特征具有平移不变性。 * 方案一（适用于单胞中心有孔洞的晶体）： 1. 定位：使用寻峰算法定位图像中强度最大/最小的独特位点（如蜂窝状晶格的中心孔或单胞中最亮的原子柱）。 2. 裁剪：以这些位点为中心，裁剪出方形子图像并堆叠。 3. 特征提取：对每个子图像计算其帕特森函数。帕特森函数是电子密度图的自卷积，其值仅取决于原子间矢量（排除方向符号），因此能消除因分割误差导致的子图像内结构的平移，从而生成平移不变的特征。这极大地减少了分割误差的影响，并显著降低了后续主成分分析所需的显著主成分数量（在示例中从36个降至9个）。 * 方案二（适用于任何类型单胞，可处理多晶/畴）： 1. 布拉格滤波：对原子坐标图像进行快速傅里叶变换，选择一对距离最短的弗里德尔斑点（对应某一晶面间距）进行滤波，然后进行逆傅里叶变换，得到仅包含该晶面族信息的条纹图像。 2. 旋转与分割：旋转该条纹图像，使条纹平行于坐标轴。然后以该晶面间距为边长，以每个原子柱为中心裁剪方形子图像。由于同一单胞内不同原子处的子图像条纹相位不同，会形成多个类别。 3. 特征提取：对每个子图像计算帕特森函数。此操作可以消除子图像间的相位差异，从而将所有完美晶格区域的子图像归为同一主要类别。
2. 无监督缺陷检测工作流程（以案例一为例） 对于Mo0.91W0.09Te2的STEM图像，具体应用方案一，流程如下： * 步骤1：原子柱分类与坐标图像生成：首先，为了排除W掺杂原子对OCSVM单类别要求的影响，使用高斯混合模型（Gaussian Mixture Model, GMM）根据所有原子柱的积分强度将其分为三类：含Mo柱、含W柱、缺失原子柱（空位）。识别出掺杂和空位后，用标准二维高斯函数替换每个原子柱，生成一张“原子坐标图像”。 * 步骤2：数据预处理与降维：对原子坐标图像应用方案一进行分割和帕特森函数变换。然后对得到的特征数据（帕特森图堆栈）进行主成分分析，选取能代表98%方差的前9个主成分，大幅降低数据维度，形成训练集X。 * 步骤3：OCSVM模型参数优化：使用scikit-learn库中的libsvm实现OCSVM。需要优化两个关键超参数：γ（高斯核的分散参数）和υ（异常值比例的上限）。研究采用默认方法计算γ，并通过分析距离函数d(υ)曲线的“拐点”来确定最优υ。距离函数d(υ)定义为正常类与异常类决策函数中位数之差。选择最优参数时，决策函数值的直方图应显示正常类数据近似高斯分布，并在边界处有突变。 * 步骤4：异常检测与结果可视化：使用优化后的超参数运行OCSVM对训练集进行异常检测。被判定为异常值的子图像，其中心位置在原子坐标图上用红点标出。通过人眼验证，这些红点大部分对应于原子位移或缺失的缺陷位置。为了量化准确性，研究计算了混淆矩阵，并得出平衡准确度高达98.1%。此外，异常点在PCA空间中的分布也清晰可见，它们远离正常类数据簇的中心。
3. 多畴/缺陷识别工作流程（以案例二为例） 对于包含孪晶界的ZrO2纳米颗粒，应用方案二： * 步骤1-2：布拉格滤波与数据处理：对STEM图像进行FFT，选择对应某一晶面的一对斑点进行滤波和IFFT，得到该晶面的条纹图像。随后按方案二进行旋转、分割和帕特森函数处理，生成训练集。 * 步骤3-4：OCSVM聚类与畴识别：应用OCSVM（υ参数通过d(υ)曲线拐点优化）对处理后的数据进行分类。决策函数值的直方图显示出两个分离的簇。将这两个簇映射回实空间图像，可以清晰地区分出被孪晶界分隔开的两个晶畴，每个畴用不同颜色标记。该方法也可用于识别图像中的多个晶粒/畴，或将特定FFT斑点对与特定畴关联起来。文中还提到，该方法可用于检测位错，因为位错在布拉格滤波图像中表现为周期性条纹的中断。
四、 主要研究结果与逻辑关系
本研究通过两个典型案例系统验证了所提出的无监督缺陷检测方法的有效性与通用性。
在案例一（MoW)Te2点/线缺陷检测）中，研究成功实现了对原子尺度缺陷的精准定位。具体结果包括：1）通过GMM准确区分了Mo柱、W掺杂柱和Te空位柱，为后续缺陷检测排除了成分变化的干扰。2）应用方案一和帕特森函数预处理后，PCA分析显示仅需9个主成分即可保留98%的方差，证明了该方法能有效压缩数据并消除平移方差。3）OCSVM模型成功识别出了与原子位移或柱缺失相关的缺陷位点，可视化结果（图1d-f）显示红点标记与肉眼可辨的缺陷高度吻合。4）定量评估显示，该模型在测试图像上达到了98.1%的平衡准确度，并在一个四倍大的不同图像上通过参数优化重现了高准确度，证明了方法的鲁棒性。5）PCA空间的可视化（图3d-f）直观展示了异常点（缺陷）远离正常类数据簇，表明该缺陷检测任务非常适合SVM架构处理。这些结果逐步递进：首先通过GMM处理成分不均一性，为OCSVM创造单类别条件；然后通过创新的预处理保证特征有效性；最后OCSVM模型成功执行异常检测，定量与定性结果均支持其高效性。
在案例二（ZrO2纳米颗粒孪晶界识别）中，研究展示了该方法对复杂三维晶体和面缺陷的处理能力。具体结果包括：1）通过对特定晶面进行布拉格滤波，成功提取了晶格周期信息。2）应用方案二和帕特森函数处理后，OCSVM将数据点清晰地分为两个簇。3）将聚类结果映射回实空间后，自动识别出的两个区域与肉眼判定的孪晶界两侧畴完美对应（图4f）。这一案例成功地将缺陷检测问题转化为基于OCSVM的聚类问题，证明了该方法不仅能检测点/线缺陷，还能识别晶体中的不同取向畴（一种面缺陷），并具备处理单胞原子数多、对称性低的单斜结构ZrO2的能力。
两个案例的结果共同表明：1）所提出的两种分割与预处理方案，结合帕特森函数，能有效为OCSVM模型准备具有平移不变性、且满足单类别主要分布要求的输入数据。2）基于OCSVM的无监督框架无需任何标注数据，即可在原子分辨率图像中可靠地检测出各类晶体学缺陷（点、线、面缺陷）。3）该方法对材料体系（二维/三维）、晶体结构复杂度（简单六方/复杂单斜）和缺陷类型具有较好的通用性。
五、 研究结论与意义价值
本研究的核心结论是：成功开发并验证了一种基于单类支持向量机（OCSVM）的无监督机器学习方法，用于原子分辨率STEM图像中的晶体缺陷检测。该方法通过引入两种创新的图像分割方案以及采用帕特森函数作为平移不变特征描述符，克服了传统监督学习方法对标注数据的依赖以及传统分割方法对复杂晶体结构的局限性。
其科学价值与应用价值体现在多个层面： 1. 方法论创新：为电子显微图像分析提供了一种强大的无监督学习工具。它使得研究人员能够在没有先验缺陷知识或大量标注数据的情况下，自动、快速地从海量STEM数据中筛查出缺陷位置，特别适用于研究新型、复杂或缺陷动态演变的材料体系。 2. 提升实验效率：该方法可与自动扫描控制系统结合，实现对缺陷的实时检测与反馈，推动面向原子级制造的“智能电子显微镜”或“AI晶体学家”的发展。例如，在利用电子束进行原子操纵时，快速缺陷检测可指导加工过程。 3. 辅助结构解析：对于电子束敏感材料（如金属有机框架MOFs），在快速成像中难免引入损伤。利用OCSVM剔除受损晶胞或局部结构的子图像，可以“净化”用于平均的图像堆栈，从而提升从噪声图像中重建晶体结构的质量。 4. 算法通用性：研究所开发的第二种数据预处理方案（布拉格滤波+帕特森函数）生成的帕特森图，本质上也是噪声布拉格滤波图像的特征表示，因此该框架可适配其他机器学习算法，如变分自编码器，用于去噪或基于机器学习的应变分量测定等任务。
六、 研究亮点
无监督学习框架：首次将OCSVM系统地应用于原子分辨率缺陷检测，避免了监督学习对大量标注数据的依赖，显著提升了方法的普适性和实用性。
平移不变性特征工程：创造性引入帕特森函数这一晶体学经典工具作为机器学习描述符，有效消除了图像分割误差带来的平移方差，是连接传统晶体学与现代机器学习的关键桥梁。
灵活的分割策略：提出了两种互补的图像分割与预处理方案。方案一计算高效，适用于单胞内有明确唯一特征位点的晶体；方案二通用性强，不受晶体对称性限制，可处理任意单胞及多畴样品，解决了传统方法在处理大单胞或低对称性晶体时的效率瓶颈。
广泛的验证：研究不仅展示了在二维材料中点/线缺陷的检测，还成功应用于三维纳米晶中孪晶界的识别，并提及了对位错的检测能力，充分证明了该方法对不同维度、不同结构、不同类型缺陷的检测能力。
参数优化与可视化：提供了基于距离函数d(υ)曲线“拐点”的启发式超参数优化方法，并在PCA空间中可视化缺陷与正常区域的分离，增强了模型的可解释性。
七、 其他有价值内容
研究还讨论了方法的局限性与未来方向：1）当前OCSVM仅能区分缺陷与非缺陷（或不同畴），但不能对缺陷类型进行进一步分类。未来可通过聚类异常片段或结合缺陷坐标信息来实现缺陷分类。2）对于晶格高度畸变的“软”材料，缺陷与正常单元的边界可能更模糊，检测难度增加，但这与人类判断面临的模糊性一致。3）研究表明，在输入图像进行归一化后，libsvm库中γ的默认值以及基于d(υ)曲线选择υ的方法在所示例子上效果良好，为使用者提供了实用的参数设置起点。这些讨论为后续研究指明了改进和拓展的空间。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问