类型a:
基于生成模型的粉末X射线衍射晶体结构测定技术突破
作者及机构
本研究的核心作者团队由来自中国科学院物理研究所(The Beijing National Laboratory for Condensed Matter Physics, Institute of Physics, Chinese Academy of Sciences)的Qi Li、Rui Jiao、Shifeng Jin、Hongming Weng和Xiaolong Chen,清华大学计算机科学与技术系的Yang Liu,以及中国人民大学高瓴人工智能学院的Wenbing Huang等学者组成。该研究于2025年发表在《Nature Communications》期刊上,论文标题为《Powder diffraction crystal structure determination using generative models》。
学术背景
晶体结构解析是材料科学、化学、物理学和地质学等领域的基石,对理解材料性质、设计新型功能材料(如药物和电子器件)至关重要。传统的单晶X射线衍射(SCXRD)是晶体结构测定的金标准,但许多材料仅能以粉末形式获取,因此粉末X射线衍射(PXRD)成为更广泛使用的技术。然而,PXRD数据分析存在显著挑战:衍射峰重叠导致强度模糊、轻原子(如氢、锂)定位困难、相邻元素(如锰和铁)区分度低,且传统方法依赖人工经验和耗时的手动优化。
为解决这些问题,研究团队开发了PXRDGen——一种基于生成模型的端到端神经网络,旨在通过人工智能实现PXRD数据的自动化、高精度结构解析。该研究的目标是突破传统方法的局限性,实现原子级精度的晶体结构预测,并覆盖纳米材料和复杂化合物等传统技术难以处理的体系。
研究流程与方法
PXRDGen的工作流程分为三个核心模块:
预训练的XRD编码器(PXE模块)
晶体结构生成(CSG模块)
Rietveld精修(RR模块)
主要结果
1. 高精度结构预测
- 在MP-20数据集(含20原子以内的稳定无机化合物)中,PXRDGen对有效化合物的单样本和20样本匹配率分别达82%和96%,RMSE接近Rietveld精修的理论极限(<0.01)。
- 案例验证:
- 轻原子定位:在Zr₂Ni₂H₆中,氢原子位置与中子衍射结果一致(RMSE<0.02);
- 相邻元素区分:成功区分Mn₂Fe₂As₂中的锰(Z=25)和铁(Z=26),传统PXRD无法实现;
- 纳米材料应用:在晶粒尺寸低至10Å的纳米样品中,匹配率仍保持83.5%。
结论与价值
PXRDGen通过生成模型与多模态学习的结合,实现了PXRD结构解析的范式革新:
- 科学价值:解决了轻原子定位、元素区分和峰重叠三大传统难题,为材料基因组研究提供了高效工具。
- 应用价值:将传统需数天的手动解析缩短至秒级,有望推动高通量材料发现和工业化应用。
研究亮点
1. 方法创新:首次将流模型引入晶体结构生成,兼顾速度与精度;
2. 跨学科融合:结合深度学习和传统晶体学方法(如Rietveld精修),形成闭环工作流;
3. 极限挑战突破:在纳米尺度和杂质干扰下仍保持高准确性,拓展了PXRD技术的适用范围。
其他价值
研究团队开源了代码和数据集(Code Ocean),为后续研究提供了可复现的基准。未来工作将聚焦于复杂氧化物和有机材料的适配,进一步推动AI在结构解析中的普适化应用。