近日,南京大学任宇翔助理教授团队联合中国人民大学高瓴人工智能学院黄文炳教授、文继荣教授团队,及华为中央研究院等研究力量,提出了首个面向晶体结构预测的孪生基础模型框架DAO(Diffusion-based Crystal Omni)。该工作目前已被国际顶级学术期刊《Nature Communications》接收 。
该框架旨在解决材料发现领域中一项基础性且极具挑战性的任务—仅根据化学成分预测稳定的三维晶体结构。由于晶体具有极其复杂的三维几何构型,传统的基于第一性原理计算(DFT)或进化优化的预测方法往往面临计算成本高昂、难以随系统复杂度扩展等严重瓶颈。尽管深度生成模型已被引入该领域,但现有模型主要依赖小规模的特定领域数据集进行训练,导致其对未知结构的泛化能力受限。研究团队突破了现有方法的局限,创新性地构建了训练新范式 。
整体框架由两个互补的孪生基础模型(Siamese foundation models)协同构成:负责生成稳定结构的生成器(DAO-G)和专注于预测能量及辅助生成的预测器(DAO-P)。模型首先在一个包含约94万条稳定与不稳定晶体结构并附带能量标注的庞大数据集(CrysDB)上进行预训练,随后可通过微调精准应用于特定下游任务。

图一:DAO框架的预训练、微调与推理流程示意图
在具体机制设计上,DAO框架作为连接海量数据与稳定结构生成的桥梁,包含三项核心创新:
底层几何架构优化。DAO-G与DAO-P均构建于团队提出的新型几何图Crysformer之上。该架构巧妙地表征了输入晶体的几何特征,并严格保证了预测晶体晶格和坐标所需的 $O(3)$等变性与周期平移不变性。
双阶段预训练与数据集松弛。DAO-G在第一阶段使用包含大量不稳定结构的完整CrysDB进行预训练;在第二阶段,利用DAO-P作为高效的能量预测器替代昂贵的DFT计算,计算能量梯度来松弛高能不稳定结构,将其优化为更稳定的构型,消除不稳定数据带来的生成偏差 。
混合监督预训练与能量引导采样。DAO-P通过结合自监督扩散损失与指数能量损失进行预训练,精准估计扩散生成轨迹上的中间态能量。在DAO-G生成结构的采样阶段,DAO-P作为能量向导引入能量梯度引导,提升最终生成晶体的热力学稳定性与复杂结构匹配率 。

图二:DAO在三种真实超导材料上的结构预测结果及与传统DFT方法的效率对比可视化
结果表明,DAO框架在两个公认的CSP基准测试上显著提升了预测性能,针对多种骨架架构均展现出强大的赋能效果。更令人瞩目的是,在面对传统计算方法极难处理的三种真实超导材料($Cr_{6}Os_{2}$、$Zr_{16}Rh_{8}O_{4}$和 $Zr_{16}Pd_{8}O_{4}$)时,DAO展现出了压倒性的优势。以 $Cr_{6}Os_{2}$为例,DAO在20次生成测试中实现了与实验参考结构 100%的匹配率,原子位置误差(RMSE)低至 0.0012,且每次迭代的计算速度比传统的DFT结构预测器快 2000倍 以上。这一系列具有说服力的成果,不仅为复杂多晶型和超导材料的设计提供了崭新且高效的工具,也充分彰显了人工智能基础模型在推动前沿材料科学研究中的巨大潜力。
