共计 2134 个字符,预计需要花费 6 分钟才能阅读完成。
量子多体方法为计算分子和材料的电子特性提供了系统的途径,但高昂的计算成本限制了其在大规模应用中的应用。由于多电子波函数的复杂性,能够捕捉基本多体物理的机器学习模型仍然有限。
在这里,耶鲁大学(Yale University)的研究人员提出了一个针对多体 Green 函数的深度学习框架,它统一了基态和激发态电子特性的预测,同时提供了对多电子相关效应的物理洞察。
它在预测单粒子和双粒子激发以及可从单粒子密度矩阵导出的数量方面取得了有竞争力的性能。
而且,该方法具有高数据效率和跨化学种类、体系尺寸、分子构象和键断裂关联强度的良好迁移性。这为利用机器学习解决多电子问题开辟了新的可能性。
该研究以「Unified deep learning framework for many-body quantum chemistry via Green’s functions」为题,于 2025 年 6 月 4 日发布在《Nature Computational Science》。
预测分子和材料在基态和激发态的电子性质是量子化学和计算材料科学的核心任务。密度泛函理论 (DFT) 因其兼顾精度和效率而成为该任务的主要工具,但其系统误差以及源于近似交换关联泛函的不确定性,限制了其预测能力。
从头算多体电子结构方法,例如耦合团簇(CC)理论和多体微扰理论(GW),为更稳健的量子力学模拟提供了一条有希望的途径。这类方法在催化和需要明确处理电子相关性(例如键断裂和激发态现象)的材料以及过渡金属化合物的模拟中尤其有效。但是,它们高昂的计算成本限制了它们在大型体系研究或多分子筛选中的应用。
MBGF 作为核心物理量
为了应对这些挑战,耶鲁大学的研究团队提出以多体 Green 函数 (MBGF) 作为核心物理量,构建一个深度学习框架,在量子多体层面无缝连接基态和激发态的预测。Green 函数 G(ω) 是一个频率相关的物理量,用于描述多电子系统中电子/空穴的传播。
MBGF 的尺寸随系统尺寸呈二次方增长,这使得它比波函数更能紧凑地表示多体物理。Green 函数理论通过 Hedin 方程和 Bethe-Salpeter 方程 (BSE) 模拟单粒子(带电)和双粒子(中性)激发,为精确求解薛定谔方程提供了严谨的路线图。
此外,MBGF 还包含大部分重要的基态信息。其静态极限可得到单粒子密度矩阵,而沿虚频率轴对 MBGF 进行积分可得到基态能量。
新模型 MBGF-Net
近年来,基于 GW4、CC、二阶微扰理论、代数图解构造、密度矩阵重正化群和量子蒙特卡罗方法的从头算 MBGF 方法在模拟关联分子和材料方面取得了巨大成功。
MBGF 也是量子嵌入方法(包括动态平均场理论和自能嵌入理论)的核心量。因此,基于 MBGF 的 ML 方法不仅可以统一许多有趣的电子特性的预测,还能为大量分子和材料问题中的电子关联效应提供基础性的见解。
然而,开发这种机器学习方法存在一个巨大的挑战:如何将频率相关的 MBGF 矩阵以紧凑且等变的形式表示出来,同时捕捉MBGF中编码的局域和非局域电子关联。
耶鲁大学的研究人员通过开发一个图神经网络(GNN)来实现这一点。该网络在紧凑的虚频网格上直接学习多体动力学关联势(即自能),并在对称性和极化自适应的基础上使用基于轨道的平均场特征。最终,他们将模型命名为MBGF-Net。
图示:MBGF-Net 工作流程和架构概述。(来源:论文)
性能评估
在一系列分子和纳米材料基准问题上,研究人员发现 MBGF-Net 可以准确预测基态和激发态特性,包括光发射和光谱、准粒子 (QP) 能量和重正化,以及从单粒子密度矩阵中导出的量,在 GW 和 CC 单粒子和双粒子 (CCSD) 水平上。
另外,MBGF-Net 具有极高的数据效率,仅使用 2,000 个分子的训练集,就能预测 QM7 和 QM9 分子引力波前沿准粒子物理能量,平均绝对误差 (MAE) 低于 0.02 eV。
图示:MBGF-Net 对 QM7 和 QM9 分子的电子特性预测。(来源:论文)
而且,MBGF-Net 在不同化学种类、分子构象、体系尺寸和电子关联强度之间具有良好的可迁移性。具体来说,专门针对小硅纳米团簇进行训练的 MBGF-Net 模型可以预测高达四倍大的硅纳米团簇的激发光谱,同时将准确度损失降至最低。
该方法还具有数据效率,在大多数基准测试中仅需数百个训练分子,这大大降低了生成多体量子化学数据的成本。
虽然目前的研究仅限于分子系统,但 MBGF-Net 可以扩展到固体,例如,通过推导具有周期性边界条件的对称自适应基。MBGF-Net 为强大的哈密顿量 ML 工具箱引入了高级多体能力。如果与 DFT 哈密顿量的深度学习方法相结合,它可以用于研究更大规模的系统中电子关联效应。
此外,MBGF-Net 可以无缝集成到广泛使用的从头算 MBGF 框架中,例如,作为 Green 函数嵌入方法中数据驱动的杂质求解器,用于模拟关联电子材料。
总而言之,这项研究为多体量子化学建立了一个统一的机器学习框架,并展示了通过机器学习加速计算研究多电子系统以实现定量精度的可能性。
论文链接:https://www.nature.com/articles/s43588-025-00810-z