Thesis 黄理博士

分类号密级
UDC 编号
中国科学院研究生院
博士学位论文
强关联电子体系的 LDA+DMFT 第一性原理计算方法
黄理
指导教师戴希研究员
中国科学院物理研究所
申请学位级别理学博士学科专业名称理论物理
论文提交日期 2012 年 4 月论文答辩日期 2012 年 5 月
培养单位中国科学院物理研究所
学位授予单位中国科学院研究生院
答辩委员会主席
.
.Bu
ild
Ve
rsio
n:M
ay
21,
201
2
First Principles LDA+DMFT Computing Framework
for Strongly Correlated Electron Materials
Author:
Li Huang
Supervisor:
Prof. Xi Dai
May, 2012
Institute of Physics
Chinese Academy of Sciences
Submitted in total fulfilment of the requirements for the degree of Ph.D.

in Theoretical Physics
To my lovely wife X. Zhao and our parents
L. H
2
201
1,
y2
Ma
n:
rsio
Ve
ild
.Bu
Copyright 2012 by Li Huang
Typesetting by XƎLaTEX
.
摘要
强关联电子材料 (包括 Mott 绝缘体、重费米子化合物、稀土元素变价化合物、高温超导材料等等)
展示了多姿多彩的反常物理特性，近半个世纪以来一直是凝聚态物理以及理论物理领域最热门的研究方
向之一。在强关联电子系统中，电子 − 电子间的 Coulomb 相互作用可与电子的动能相比拟，主导着电
子的行为，是材料电子结构及相关物性的主要决定因素。传统的基于单电子近似的密度泛函理论对于强
关联电子体系不太适用，因此针对强关联电子系统建立起全新的第一性原理电子结构计算方法是迫在眉
睫的任务。在本学位论文中，试图将密度泛函理论与动力学平均场方法结合为有机的整体，发展出一套
完备的强关联电子材料理论计算框架，为后续的研究工作奠定坚实的基础。本学位论文的主要内容如下:
首先，动力学平均场方法是目前研究强关联电子模型最有力的工具，而量子杂质模型求解器则是动
力学平均场方法最核心的部分。本文的研究重点集中于量子蒙特卡洛杂质求解器，独立开发了多个基于
强耦合展开连续时间量子蒙特卡洛算法的杂质求解器，包括段表示算法、Holstein-Hubbard 模型算法、
动态屏蔽效应算法、广义矩阵算法、Krylov 子空间迭代算法、正交多项式表象算法等版本。除此之外，
还独立提出了全新的基于 Newton-Leja 多项式插值算法与内核多项式表象算法的杂质求解器。这些杂
质求解器基本上能处理目前所有的量子杂质模型，所涵盖的参数区间远超其余现存的量子杂质求解器。
其次，将基于密度泛函理论的电子结构计算方法与动力学平均场方法结合在一起，开发了一套功能完
备、稳定可靠、简单易用的强关联电子材料第一性原理计算软件包，可用于深入研究相关材料的电子结
构。该软件包支持多种局域轨道，可与目前主流的电子结构计算软件相结合，适用范围很广。
最后，应用自主研发的强关联电子材料第一性原理计算软件包深入研究了 SrVO3 、CoO、BaRuO3
等 3d 与 4d 系统的电子结构，获得了如下重要结论:(1)SrVO3 属于 3d1 配置的强关联金属，关联作用使
得 3d 电子的能带结构发生重整化，改变了电子的有效质量。杂质谱函数呈现关联电子系统中十分典型
的三峰结构。如果在相互作用项中考虑旋转不变性或者是动态屏蔽效应，那么 3d 电子的杂质谱函数会
发生明显的变化。(2) 过渡金属氧化物 CoO 的基态是反铁磁绝缘体。在压力的作用下，CoO 的电子结
构会发生剧烈的变化。当压力小于 60 GPa 时， 3d 电子的 t2g 轨道与 eg 轨道都是绝缘态；当外压在 60
GPa 与 170 GPa 之间时， t2g 轨道率先变为金属态而 eg 轨道仍为绝缘态；当压力大于 170 GPa 时，所
有轨道都变为绝缘态。这是典型的具有轨道选择性的金属 − 绝缘体相变。与此同时还发生了由高自旋态
到低自旋态的相变。这是首次通过理论计算完满解释了 CoO 在压力作用下的电子结构演化情况。(3) 电
子结构计算表明，BaRuO3 属于 4d4 配置的具有局域磁矩的弱关联金属，其 4d 电子杂质谱函数呈现典
型的三峰结构。与同一族的 CaRuO3 和 SrRuO3 相类似，BaRuO3 的电子结构偏离 Fermi liquid 理论的
描述，其光电导在低频处展现出 <σ(ω) ∼ ω −1 的行为。
关键词: 强关联电子材料，密度泛函理论，动力学平均场方法，量子蒙特卡洛杂质求解器，第一性原理
电子结构计算方法
Abstract
Strongly correlated materials, including Mott insulators, heavy fermion compounds, rare-earth mixed va-
lence compounds, high-temperature superconductivity materials etc., which exhibit many intriguing and novel
properties, have attracted many attentions of experimental and theoretical studies. It is clear that the strong
interactions of d, f electrons with each other and with itinerant electronic states of the materials are respon-
sible for their anomalous properties. Since traditional band theory is completely failed for them, it is urgent
to develop a new first principles computing framework for strongly correlated materials. In this thesis, I try to
merge density functional theory with dynamical mean-field theory to implement a powerful ab inito electronic
structure calculation software package for numerous strongly correlated materials, and pave the way for further
investigations. The key research results of this thesis are as follows.
Firstly, by now the most powerful tools for strongly correlated systems is dynamical mean-field theory,
and quantum impurity solver is the most important ingredients of it. Various quantum impurity solvers have
been developed and used in the last decades. I have implemented several quantum impurity solvers by myself
which are based on the fashionable hybridization expansion continuous-time quantum Monte Carlo method,
including segment representation, Holstein-Hubbard model, dynamical screening effect, general matrix, Krylov
subspace iteration and orthogonal polynomial representation algorithms etc. In addition, I have invented
Newton-Leja interpolation and kernel polynomial representation algorithms. These quantum impurity solvers
exhibit outstanding performances and most of the involved quantum impurity models can be solved efficiently
by them.
Secondly, I have developed a powerful, flexible, and robust first principles computing software package
for strongly correlated materials by combining modern density functional theory and dynamical mean-field
theory. Various local orbitals are supported by this code, thus it can be used together with many popular band
structure calculation softwares.
Thirdly, by using the software package developed by myself, I have studied the electronic properties of
several strongly correlated materials, including SrVO3 , CoO, and BaRuO3 and so on. The most important
conclusions are summarized as follows:(1) SrVO3 is a typical correlated metal with strongly renormalized band
structures. Its impurity spectral functions contain manifest quasi-particle peak, upper and lower Hubbard
bands, which are the pronounced signals of strongly correlated systems. Once the rotationally invariant
interactions or dynamical screening effects are taken into considerations, the spectral functions should be
changed significantly. (2) The ground state of CoO is an anti-ferromagnetic charge transfer insulator. My
calculations predict that the metal-insulator transition in CoO under pressure is a typical orbital selective
insulator to metal transition, where the t2g orbitals of Co 3d shell become metallic firstly around 60 GPa while
the eg orbitals still remain insulating until 170 GPa. Further studies of the spin states of Co 3d shell reveal that
the orbital selective Mott phase in the intermediate pressure regime is mainly stabilized by the high-spin state
of Co 3d shell and the transition from this phase to the fully metallic state is driven mainly by the high-spin
to low-spin transition of the Co2+ ions. My results are in good agreement with the most recent transport
and x-ray emission experiments under high pressure. (3) The cubic BaRuO3 is a weak correlated metal with
4d4 configuration. My calculations predict that there exists sharp quasi-particle peak in the impurity spectral
functions. In accordance with CaRuO3 and SrRuO3 , the electronic structure of cubic BaRuO3 can not be well
described by the Landau Fermi liquid theory, and the calculated low frequency optical conductivities of it at
different temperatures show clear <σ(ω) ∼ ω −1 behaviors.
Keywords: Strongly Correlated Systems, Density Functional Theory, Dynamical Mean-Field The-
ory, Continuous-Time Quantum Monte Carlo Impurity Solver, ab initio Electronic Structure Cal-
culations
目录
摘要 I
abstract II
1 绪论 1
1.1 强关联电子体系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 强关联电子材料 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 强关联电子体系的基本模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 传统研究方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 动力学平均场方法及其扩展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1 基本理论框架与拓展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2 量子杂质模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.3 量子杂质模型求解器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3 本文主要结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2 量子蒙特卡洛杂质求解器: 一般原理 17
2.1 蒙特卡洛方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1 蒙特卡洛抽样原理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2 Markov 过程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.3 Metropolis-Hastings 算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.4 Mersenne Twister 赝随机数产生器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 量子蒙特卡洛杂质求解器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.1 杂质问题的分立化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.2 杂质问题的微扰展开 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.3 图形量子蒙特卡洛方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
ii 目录
2.2.4 负符号问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3 本章小结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3 量子蒙特卡洛杂质求解器: 强耦合展开连续时间算法 29
3.1 配分函数的微扰展开 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2 段表示算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2.1 基本原理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2.2 求迹算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.3 行列式算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.4 物理量测量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2.5 程序测试 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3 段表示算法: 电声相互作用与动态屏蔽效应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.1 Holstein-Hubbard 模型算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.2 动态屏蔽效应算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3.3 程序测试 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.4 广义矩阵算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.4.1 图形表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.4.2 本征表象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.4.3 核心算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.4.4 程序测试 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.5 广义矩阵算法:Krylov 算法与 Newton-Leja 算法 . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.5.1 Fock 表象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.5.2 Krylov 子空间迭代算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.5.3 Newton-Leja 多项式插值算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.5.4 程序测试 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.6 正交多项式表象与内核多项式表象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.6.1 Legendre 正交多项式算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.6.2 Chebyshev 正交多项式算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.6.3 内核多项式算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.6.4 程序测试 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.7 本章小结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
目录 iii
4 LDA+DMFT 第一性原理计算方法: 基本理论框架与实现细节 87
4.1 密度泛函理论简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.1.1 Hohenberg-Kohn 定理与 Kohn-Sham 方程 . . . . . . . . . . . . . . . . . . . . . . 87
4.1.2 基于密度泛函理论的电子结构计算方法 . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.1.3 密度泛函理论的局限与修正 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.2 LDA+DMFT 计算方法: 理论框架 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.2.1 LDA+DMFT 哈密顿量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.2.2 LDA+DMFT 自洽方程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2.3 LDA+DMFT 计算方法最新进展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.3 LDA+DMFT 计算程序: 实现细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.3.1 LDA+DMFT 计算软件流程框图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.3.2 技术路线的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.3.3 局域轨道的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.3.4 双计数项的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.3.5 占据数计算算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.3.6 费米面搜索算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.3.7 Brillouin 区积分算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.3.8 物理量计算算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.3.9 并行加速技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.4 本章小结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5 LDA+DMFT 第一性原理计算方法: 应用实例 117
5.1 SrVO3 : 关联电子结构计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.1.1 研究背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.1.2 计算细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.1.3 LDA 计算结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.1.4 密度 − 密度相互作用与广义相互作用 . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.1.5 动态屏蔽效应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
5.2 CoO: 压力驱动下的相变现象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
5.2.1 研究背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.2.2 计算细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.2.3 LDA 计算结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

iv 目录
5.2.4 轨道选择性的绝缘体 − 金属相变 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.2.5 高自旋态 − 低自旋态相变 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
5.3 BaRuO3 : 弱关联非费米液体金属 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.3.1 研究背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.3.2 计算细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.3.3 LDA 计算结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.3.4 LDA+DMFT 电子结构计算结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.4 本章小结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
6 结论与展望 141
附录 145
A.1 最大熵方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
A.2 随机解析延拓方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
A.3 Leja 点序列 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
A.4 Newton 插值多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
A.5 Legendre 正交多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
A.6 Chebyshev 正交多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
A.7 Lambin-Vigneron 四面体积分方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
参考文献 156
发表文章目录 173
致谢 174
插图索引
1.1 晶格模型映射为单点参考系统的示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 动力学平均场方法自洽迭代计算流程图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1 相空间位型示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2 相空间中随机行走示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 图形量子蒙特卡洛方法流程图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1 量子蒙特卡洛杂质求解器项目分支示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2 段表示算法中图形表示的四种可能状态 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 段表示算法中典型的二阶展开图形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4 段表示算法中插入 segment 示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.5 段表示算法中插入 anti-segment 示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.6 段表示算法中删除 segment 示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.7 段表示算法中删除 anti-segment 示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.8 单带 Hubbard 模型的虚频格林函数 G(iω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.9 三带 Hubbard 模型的虚频格林函数 G(iω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.10 图形微扰展开项的阶数分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.11 段表示算法的计算效率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.12 Holstein-Hubbard 模型段表示算法图形微扰展开项的阶数分布 p(k) . . . . . . . . . . . . . 54
3.13 动态屏蔽效应影响下的杂质谱函数 A(ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.14 动态屏蔽效应影响下的杂质谱函数 A(ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.15 广义矩阵算法的图形表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.16 广义矩阵算法中" 分而治之" 策略的图形表示 . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.17 两带 Hubbard 模型的虚时格林函数 G(τ ) 与微扰展开项的阶数分布 p(k) . . . . . . . . . . . 60

vi 插图索引
3.18 两带 Hubbard 模型的准粒子权重 Zα 随 Coulomb 相互作用强度 U 的变化 . . . . . . . . . 61

3.19 三带 Hubbard 模型的 U − ∆ 相图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.20 含自旋轨道耦合作用的三带 Hubbard 模型的 U − λ 相图 . . . . . . . . . . . . . . . . . . . . 63
3.21 三带 Hubbard 模型的虚时格林函数 G(τ ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.22 三带 Hubbard 模型的虚时格林函数 G(τ ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.23 Krylov 子空间迭代算法与 Newton-Leja 多项式插值算法计算效率的比较 . . . . . . . . . . 72
3.24 Legendre 多项式展开系数 Gn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.25 Legendre 多项式展开测量虚时格林函数 G(τ ) . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.26 Chebyshev 多项式展开系数 Gn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.27 Chebyshev 多项式展开测量虚时格林函数 G(τ ) . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.28 内核多项式方法中所用的典型阻尼函数 fn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.29 Legendre 与 Chebyshev 多项式展开系数 Gn . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.30 Chebyshev 与 Legendre 正交多项式配合不同的阻尼函数对于测量精度的影响 . . . . . . . 82
3.31 Legendre 与 Chebyshev 多项式展开系数 Gn . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.32 Chebyshev 与 Legendre 正交多项式配合不同的阻尼函数对于测量精度的影响 . . . . . . . 84
4.1 LDA+DMFT 第一性原理电子结构计算软件流程框图 . . . . . . . . . . . . . . . . . . . . . . . 103
5.1 SrVO3 的 LDA 能带结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

5.2 V 的 3d 轨道的电子谱函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
5.3 具有频率依赖性的相互作用函数 U (ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.4 动态屏蔽效应影响下 V 的 3d 轨道的电子谱函数 . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.5 动态屏蔽效应影响下 V 的 3d 轨道的电子自能函数 . . . . . . . . . . . . . . . . . . . . . . . . 124
5.6 立方相 SrVO3 的角分辩谱函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.7 CoO 的 LDA 能带结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.8 不同压力作用下 Co 的 3d 轨道的电子谱函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5.9 Co 的 3d 轨道的准粒子权重 Zα 随压力的演化趋势 . . . . . . . . . . . . . . . . . . . . . . . . 129
5.10 Co 的 3d 轨道的虚时格林函数 |G(β/2)| 随压力的演化趋势 . . . . . . . . . . . . . . . . . . . 130
5.11 Co 的 3d 轨道的占据数 Nα 以及原子组态概率 PΓ 随压力的演化趋势 . . . . . . . . . . . . . 131
5.12 Co 的 3d 轨道的局域磁矩 M 以及自旋 − 自旋关联函数 χloc (τ ) 随压力的变化趋势 . . . . . 133
5.13 BaRuO3 的 LDA 能带结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.14 Ru 的 4d 轨道的电子谱函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.15 Ru 的 4d 轨道的电子自能函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
插图索引 vii
5.16 Ru 的 4d 轨道的自旋 − 自旋关联函数 χloc (τ ) . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.17 BaRuO3 在不同温度下的光电导率 <σ(ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
A.1 费米型 Kernel 函数 K(τ, ω) 示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
A.2 反对称 Leja 特殊点序列示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
A.3 Legendre 正交多项式函数示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
A.4 Chebyshev 正交多项式函数示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

表格索引
3.1 量子蒙特卡洛杂质求解器项目分支 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 内核多项式方法中所用的典型阻尼函数 fn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.1 SrVO3 投影缀加波赝势生成参数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.2 CoO 投影缀加波赝势生成参数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.3 BaRuO3 投影缀加波赝势生成参数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

第一章
绪论
本章属于绪论部分，目的是介绍本文的主要研究对象——强关联电子系统，以及本文的主要研究方
法——动力学平均场理论。本章结构如下:
第1.1节，简述强关联电子体系的基本定义，典型的强关联电子材料，强关联电子系统的基本模型哈
密顿量，以及传统的研究方法。
第1.2节，简述动力学平均场理论及其扩展。动力学平均场方法是研究强关联电子系统的有力工具。
本节简要介绍了其基本理论框架，自洽计算流程与最新研究方向，着重讨论了动力学平均场方法最核心
的部分——量子杂质模型求解器。
第1.3节，概述了本人在攻读博士学位期间的主要研究方向，所完成的主要成果，并给出了博士学位
论文的主要写作大纲。
1.1 强关联电子体系
1.1.1 强关联电子材料
在过去的半个多世纪里，过渡金属元素及其化合物，与镧系 (或锕系) 元素及其化合物受到了很多的

关注。它们共同的特征是: 具有部分填满的 3d、 4d、 4f 或者是 5f 电子壳层。这些材料展示了十分新
奇的物理现象，例如: 自上个世纪六十年代始，人们在许多过渡金属氧化物中都发现了绝缘体 − 金属
相变现象，这种相变受到外界压力、温度、以及掺杂的调控 1 。十余年后，一类称为重费米子 (heavy
fermions) 材料的稀土元素化合物被合成了，其中载流子的有效质量远大于自由载流子的质量1 。对于重
费米子材料而言，还有许多奇特而有趣的实验现象: 如磁有序态与超导态之间的相变，局域磁矩的产生
1 前者比后者大了几十倍甚至上千倍。
2 绪论
与消逝，反常的输运性质等等 2 。在许多包含 3d、 4f 电子壳层的化合物中，电子自由度与磁性自由度之

间存在着强烈的耦合，具体的表现形式就是电子与磁性质之间的相互竞争。一个典型的例子就是锰氧化
物，它们展现出巨磁阻 (colossal magnetoresistive, CMR) 效应，亦即在中等强度的磁场作用下，系统
的电子结构会戏剧性地由绝缘态转变为金属态 3 。最出人意料，影响最为深远的发现是以铜氧化物为母
体的高温超导 (high temperature superconductivity, HTSc) 材料。对于高温超导体的研究已经持续了
二十多年，极大地促进了人们对于新材料，新理论的探索 4 。
通过深入而细致的研究，人们发现重费米子化合物、巨磁阻化合物、高温超导材料等这些化合物之所
以体现出丰富多姿的物性，主要是因为它们都拥有部分填满的 d 或 f 电子壳层，以及系统中所保有的局
域磁矩。 d 与 f 局域电子之间的相互作用，以及局域电子与巡游电子之间的相互作用乃是其中最重要
的肇因。所有具有强电子 − 电子相互作用的系统都属于强关联电子体系 (strongly correlated systems,
SCS)。上述材料都属于比较典型的强关联电子体系，除此之外，Mott 绝缘体、自旋电子材料、spin
peierls 材料、准低维材料、部分锕系元素及其化合物、镧系变价化合物等材料亦都属于强关联电子体系
的一员。
材料的物性是由其电子结构决定的，因此我们若要理解强关联电子系统的种种反常特性必然要从它们
的电子结构着手。传统的能带理论应用在简单金属或者是半导体材料上均取得了很大的成功，因为在这
些材料中，电子 − 电子间相互作用比较弱。但是能带理论却不足以描述强关联电子体系，因为在强关联
电子体系中，电子之间 Coulomb 相互作用的强度已经与 3d、 4f 、 5f 电子轨道的能带宽度处于同一量
级，甚至是有而过之。在这种情况下，基于单电子近似的能带理论显然是过于粗糙了，我们需要的是一
套全新的理论。自从五十多年前 Hubbard 做出开创性的工作时开始，人们发展了许多种理论方法来试
图解决强关联体系的电子结构问题。这些理论方法基本上都基于以下几种简单的模型:Hubbard 模型、
s − d 交换模型、周期性 Anderson 模型等等。这些方法 (模型) 均能够处理一部分强关联电子体系，但
是没有一种理论方法是广泛适用的，对于更为复杂的描述真实材料的模型更是无能为力。真正的理论突
破直至上个世纪八十年代末九十年代初动力学平均场理论提出时才姗姗来迟，至此才宣告强关联电子体
系理论研究的黄金时代正式开始，这个黄金时代一直持续到二十一世纪的今天仍未结束。
1.1.2 强关联电子体系的基本模型
强关联电子体系的基本研究方法有两种:(1) 第一性原理电子结构计算；(2) 模型哈密顿量计算。前者

以真实材料的晶体结构与化学组分为输入，输出结果为材料的电子结构信息。在第4章将深入讨论此方
法。后者试图用抽象的，简单的，带可调参数的模型哈密顿量描述复杂的强关联电子体系。仅在极为特
殊的情况下这些模型哈密顿量才存在着解析解，但是在一般情况下数值求解是无法避免的。对于包含未
完全填满的 d 或者 f 电子壳层的强关联电子材料而言，下述三种模型是经常被使用的。它们就是上文所
提到的:Hubbard 模型、 s − d 交换模型与周期性 Anderson 模型。
1.1 强关联电子体系 3
Hubbard 模型
Hubbard 模型的哈密顿量如下式所示:
∑ ∑
H= tij c†iσ cjσ + U ni↑ ni↓ . (1.1)
ij,σ i
其中 i 和 j 为晶格的格点索引， σ 为电子自旋指标， c† 与 c 分别为电子的产生与湮灭算符， n 为电子占

据数算符， tij 为跃迁矩阵元， U 为 Coulomb 相互作用参数。上式右端第一项为跃迁项，又称为动能
项，主要描述在格点之间的跃迁 2 ，一般限制跃迁只能在最近邻的格点之间进行3 。上式右端第二项为局
域 Coulomb 排斥项，它描述的是同在第 i 个格点上的具有相反自旋的电子之间的相互作用。Hubbard
模型有两个可调参数:zt 和 U ，下面讨论两种极限情况。当 U zt 时被称为弱耦合极限，相当于标准的
巡游磁性模型，此时可以不考虑电子间的 Coulomb 相互作用，电子自由地在格点之间跃迁。当 U zt
时被称为强耦合极限，此时 Hubbard 模型可以约化为有效的 t − J 模型:
∑ ∑
H=t c̃†iσ c̃jσ + J Sie Sje . (1.2)
ij,σ ij
在上式右端的第一项中，算符 c̃†iσ = c†iσ (1 − niσ̄ )，这意味着电子只能往无电子占据的最近邻格点上跃迁。

上式右端第二项被称为交换项，代表近邻格点上电子之间的交换相互作用，其中交换参数 J = 4t2 /U 。
交换项的存在意味着体系有自发产生反铁磁序的趋势。上式中的自旋算符可以表示为如下的形式:
∑
Sie = c†iσ sσσ0 ciσ0 . (1.3)
σσ 0
s − d 交换模型
s − d 交换模型的哈密顿量如下所示:
∑ ∑
H= tij c†iσ cjσ − J (Si sσσ0 )c†iσ ciσ0 . (1.4)
ij,σ i,σσ 0
其中上式右端第一项仍然是传统的跃迁项，描述电子在相邻格点上的跃迁。右端第二项是交换项，描述
的是巡游电子与局域磁矩之间的相互作用。巡游电子被称为 s 电子，而局域磁矩乃是由于未填满的 d 或
者 f 电子壳层所形成的，这就是 s − d 交换模型的由来。实际上 s − d 交换模型通常被用于描述稀土元素
化合物的磁性，后者通常都具有非常局域的 4f 电子壳层。 s − d 交换模型同样具有两个可调参数:zt 与
J。当 J zt 时为弱耦合极限，此时若用微扰论处理交换项可以得到很多十分有意思的结果，例如: 铁
磁金属中的巡游电子磁化、反铁磁金属中的电子能带劈裂、Kondo 效应、超导态被顺磁杂质破坏等等。
如果 J zt，这是强耦合极限，此时 s − d 交换模型可以约化为有效的双交换模型 (double exchange
model)，主要用于描述锰氧化物中的铁磁性。
2 电子在格点 j 上湮灭，在格点 i 上产生，相当于电子从 j 格点跃迁至 i 格点。
3 最近邻格点数目通常定义为 z，有时也被称为配位数。
4 绪论
周期性 Anderson 模型
周期性 Anderson 模型中包含了两类型电子: 巡游电子 (s 电子) 与局域电子 (d 电子)。假定 Coulomb

相互作用仅仅存在于局域电子之间，与 s − d 交换模型不同的是， s 电子与 d 电子并非通过交换相互作
用耦合，而是通过杂化项耦合。一般地，周期性 Anderson 模型的哈密顿量如下所示:
∑ ∑ ∑ ∑
H= tij c†iσ cjσ + d ndiσ + U ndi↑ ndi↓ + (Vij c†iσ djσ + h.c). (1.5)
ij,σ iσ i ij,σ
其中 c† (c) 与 d† (d) 分别为 s 电子与 d 电子的产生 (湮灭) 算符， ndiσ 是自旋为 σ 的 d 电子在 i 格点上的
占据数， d 为 d 电子的能级， Vij 为杂化参数，描述 s 电子与 d 电子之间杂化相互作用的强度。周期性
Anderson 模型主要用于解释局域磁矩的形成、Kondo 绝缘体、重费米子化合物、混合价态效应等等。
Hubbard 模型 (参见公式 (1.1)) 与周期性 Anderson 模型 (参见公式 (1.5)) 是强关联电子理论的基础，
对上述模型的深入研究有助于我们对金属 − 绝缘体相变、高温超导、重费米子效应等强关联电子体系中
存在的物理现象加深理解。
1.1.3 传统研究方法
一维的 Hubbard 模型存在严格的解析解，而 d = 2 或者 d = 3 维4 的 Hubbard 模型与强关联电子材

料密切相关，因此是我们重点关注的对象。
在早期，人们通常应用平均场方法或者是微扰论的技巧研究上述模型哈密顿量，例如 U zt 时的
Hubbard 模型与 Anderson 模型或者 J zt 时的 s − d 交换模型。然而如果系统中不存在小参量，亦
即 zt ∼ U 或者是 zt ∼ J，那么传统的以 U 或者 J 为微扰项的微扰论将不再成立。解决之道是寻找新的
微扰项，例如在某些情况下我们可以利用体系中的电子数，体系中简并态数目的倒数 1/N 5 ，晶格中最近
邻格点数目的倒数 1/z 6 作为微扰项。实际上，对 d → ∞(或者 z → ∞) 等极限情形的研究推动了动力学
平均场方法的发展。除了微扰论以外，人们还尝试通过其它理论途径求解上述模型哈密顿量。Hubbard
就曾用运动方程解耦合方法来计算 Hubbard 模型的双时格林函数。与这种解耦合方法比较类似的技
巧还有复合算符方法 (composite operators method, COM) 5 。此外，基于变分原理的 Gutzwiller 方
法在强关联电子模型的研究中应用也十分广泛 6 。辅助粒子方法 (auxiliary particle approach) 是另一
大类应用广泛的方法，其中包括: 隶玻色子方法 (slave boson method) 与辅助费米子方法 (auxiliary
fermion method)。这些方法的基本思想是将模型中的算符7 替换为费米子与玻色子算符的乘积，然后
通过额外的步骤消除非物理的态。通过引入恰当的辅助粒子算符可以在平均场近似下正确地描述强关联
模型的低能物理，但是很遗憾的是至今并无一个通用的步骤来构造恰当的辅助粒子算符，并且也不清楚
哪种辅助粒子算符是最优的选择，因此目前辅助粒子方法有许多个不同的版本 7 。
4d 表示空间维度。
5 此类微扰论通常被称为 large-N 展开或者 1/N 展开。
6 此类微扰论通常被称为 1/z 展开。
7 例如 Hubbard 模型中的 X 算符。
1.2 动力学平均场方法及其扩展 5
上述各种研究方法均有其优缺点，但是通用性都比较差。将在下文介绍的动力学平均场方法是目前
适用性最广的强关联电子体系的研究方法，它并不依赖于微扰论，因而在任意 Coulomb 相互作用强度
下，使用动力学平均场方法都能计算得到强关联电子体系的能谱以及其它的物性。
1.2 动力学平均场方法及其扩展
传统的理论计算方法在研究强关联电子体系时受到很大限制，往往只能适用于某些特殊的情况或
者是只能给出定性半定量的结果。这个局面直至 1989 年 Metzner 与 Vollhardt 发表他们的研究成果
后才宣告打破。他们提出在高维的晶格上 (而非传统的二维或者三维晶格)8 研究强关联电子系统 8 。当
d → ∞(亦即 z → ∞) 时，晶格电子的运动方程可大大简化，无论 Coulomb 相互作用强度有多大，它都
是可解的。在 d → ∞ 极限下，由于空间涨落可直接忽略，仅须考虑动态的在位涨落，因此理论研究起来
比较简单。这一发现直接导致了动力学平均场方法的诞生 9 。在动力学平均场理论中，原始的晶格模型被
映射到一个有效的量子杂质模型中，后者描述的是关联电子在一个具有时间依赖性或者是能量依赖性，
但是完全忽略了空间涨落的平均场中运动。首先求解此杂质模型以得到电子自能函数，然后通过 Dyson
方程求出晶格格林函数，由后者可以定义新的动力学平均场。因此通过自洽迭代计算可以确定最终的平
均场，这就是动力学平均场理论的核心内容。早在 1992 年，Georges、Kotliar、Jarrell 等人 10,11 分别
应用动力学平均场方法求解 Hubbard 模型，从而宣告了动力学平均场理论的创立。此后该方法得到了
迅猛的发展，至今已经成为强关联电子领域最重要的理论工具与研究手段 9,12,13 。
1.2.1 基本理论框架与拓展
本小节我们将综述动力学平均场方法 (dynamical mean-field theory, DMFT) 的基本理论框架以及

相关理论发展，我们主要从基本概念出发进行讨论，至于具体的公式推导以及细节分析请参考相关的专
著或者是文献综述 9,12,13 。
平均场方法本质
对于广义的晶格模型，平均场方法的本质是将晶格模型映射为一个有效的平均背景之上的单点
(single site) 参考系统 (如图1.1所示)，同时忽略所有的非局域自由度，例如晶格格点之间的耦合等等。
那么剩下的问题便是如何确定这个平均背景以及单点参考系统。解决之道是选定某个观测量，要求它在
单点参考系统中的期望值必须等于它在原始的晶格模型中的期望值。这个映射过程是广义的，并没有引
入任何近似，它仅仅只是对原始问题的重新定义而已。事实上，当 d → ∞ 时这个映射过程是严格成立
的，这仅是中心极限定理 (central-limit theorem) 的推论。
8 等价于晶格格点的最近邻配位数 z 很大。
6 绪论
图 1.1: 晶格模型映射为单点参考系统的示意图。
d → ∞ 时的 Hubbard 模型
1989 年，Müller-Hartmann 发现: 当 d → ∞ 时，Hubbard 模型的自能函数是完全局域的，与动量

无关，亦即:
Σ(k, ω) = Σ(ω). (1.6)
同时，Metzner 和 Vollhardt 8 还发现跃迁矩阵元可重新标度为:

t
tij = √ . (1.7)
2d
这两个关系极大地简化了无穷维时的 Hubbard 模型，但是它仍然是一个 non-trivial 的模型，因为与之
对应的单点参考系统是一个相互作用量子系统 (interaction quantum system)。
动力学平均场基本方程
1992 年，Georges 与 Kotliar 发现：无穷维时的 Hubbard 模型可以被映射到一个单点参考系统，

后者实际上是一个量子杂质模型，杂质原子动态地与自由电子构成的 bath 耦合在一起，这里的动态指
的是电子可以在杂质点与 bath 之间来回跃迁，通过自洽迭代求解量子杂质模型可以最终决定 bath 11 。
对于量子杂质模型，其作用量可以表示为:
∫ β ∫ β ∑ ∫ β
0 † −1 0 0
Simp = − dτ dτ cσ (τ )G0 (τ − τ )cσ (τ ) + U dτ n↑ (τ )n↓ (τ ). (1.8)
0 0 σ 0
此处 c†σ 与 cσ 为杂质电子的产生与消灭算符， nσ = c†σ cσ 为相应的占据数算符。 G0 为代表 bath 的

Weiss 函数9 。那么杂质自能函数 Σ(iω)、杂质格林函数 G(iω) 还有 Weiss 函数可通过下面的 Dyson 方
程联系在一起:
Σ(iω) = G0−1 (iω) − G−1 (iω). (1.9)
9 实质上是无相互作用的格林函数。
其中杂质格林函数 G(iω) 可由 G(τ ) 通过 fourier 变换而来 10 ，而通过求解量子杂质模型则可获得 G(τ ):
Gσ (τ − τ 0 ) = −hT cσ (τ )c†σ (τ 0 )iSimp . (1.10)
式中 T 为编时算符。
另一方面，晶格模型的格林函数亦可定义为:
1
Glat (k, iω) = . (1.11)
iω + µ − k − Σlat (k, iω)
其中 µ 为化学势， k 为单粒子能量色散关系， Σlat (k, iω) 为晶格自能函数。在动力学平均场中，要求

晶格自能函数等价于杂质自能函数:
Σ(iω) = Σlat (k, iω). (1.12)
同时为了确保晶格模型能自洽地映射到杂质模型中去，还必须要求杂质格林函数等价于晶格格林函数，
综合利用公式 (1.11) 与公式 (1.12)，不难得到动力学平均场方法的自洽方程如下:
1
G(k, iω) = . (1.13)
iω + µ − k − Σ(iω)
显然，公式 (1.9)、公式 (1.10) 与公式 (1.13) 构成了完备的动力学平均场方程组，通过自洽迭代求解这

个方程组即可给出量子杂质模型的 G(iω)、 G0 (iω) 与 Σ(iω)，同时我们也可得到晶格模型的 Glat (k, iω)。
动力学平均场自洽迭代计算方法
动力学平均场计算方法比较简单，本质上是一个自洽迭代的过程，具体的计算步骤如下 (参见图1.2):
(1) 以任意杂质自能 Σ(iω) 与 Weiss 函数 G0 (iω) 为初始输入。
(2) 因为 Weiss 函数 G0 (iω) 定义了一个杂质模型 (见公式 (1.8))，因此调用量子杂质模型求解器求解

此杂质模型 (利用公式 (1.10))，获得杂质格林函数 G(iω)。
(3) 利用 Dyson 方程 (即公式 (1.9)) 由 Weiss 函数与杂质格林函数求出新的杂质自能函数 Σ(iω)。
(4) 利用动力学平均场自洽方程 (即公式 (1.13)) 求出新的杂质格林函数 G(iω)。
(5) 再次利用 Dyson 方程，以在第 (3) 步获得的杂质自能函数和第 (4) 步获得的杂质格林函数为输

入，计算新的 Weiss 函数 G0 (iω)
(6) 混合新旧 Weiss 函数，产生更新的 Weiss 函数。
(7) 重复执行步骤 (2)-(6) 直至杂质自能函数与 Weiss 函数收敛为止。

10 G(iω) 与 G(τ ) 之间的 fourier 变换关系如下式所示:
∫ β
G(iωn ) = dτ eiωn τ G(τ ),
0
∞
∑
1
G(τ ) = e−iωn τ G(iωn ).
β n=−∞
8 绪论
.G0 (iω) .Gσ (τ − τ 0 ) = −hT cσ (τ )c†σ (τ 0 )iSimp .Σ(iω)
.Σ(iω) + G−1 (iω) = G0−1 (iω)
.Σ(iω) = G0−1 (iω) − G−1 (iω)

∑ 1
.G(iω) = .
iω+µ−k −Σ(iω)
k
图 1.2: 动力学平均场方法自洽迭代计算流程图，具体计算流程参见正文。
在上述计算步骤中，最耗费时间的是第 (2) 步求解量子杂质模型获得杂质格林函数。在过去的二十多

年里，人们在求解量子杂质模型方面付出了巨大的努力，探寻更快、更好的量子杂质求解器是我们念兹
在兹的共同追求。
空间涨落与非局域扩展
由于动力学平均场方法并非一种微扰方法，因此只要无穷维近似成立，那么无论是在无相互作用极
限 (U → 0) 或者是原子极限 (U → ∞)，亦或者是中间区域，动力学平均场方法都是成立的。在无穷维
近似下，我们可以忽略掉空间涨落抛弃所有非局域自由度，将晶格模型映射为单杂质的量子杂质模型。
那么在有限维的情况下，虽然我们仍可沿用这个近似，但是这个近似并不总是合理可靠的。人们在这方
面做了许多有益的探索，尝试将动力学平均场方法拓展至有限维度的晶格模型中。近些年来在这方面
的成果有: 团簇动力学平均场理论 (cellar dynamical mean-field theory, CDMFT) 14 、动力学团簇近似
(dynamical cluster approximation, DCA) 14 、对偶费米子方法 (dual fermion, DF) 15 、动力学顶角近
似 (dynamical vertex approximation, DΓA) 16 等。若要进一步了解这些方法最新的进展，请读者参阅
相关的文献。
1.2.2 量子杂质模型
量子杂质模型的引入是为了描述非磁金属中磁性杂质离子的物理行为。Fe 和 Co 等磁性过渡金属原
子具有部分填满的 3d 电子壳层， d 电子间的 Coulomb 相互作用使得 3d 电子壳层趋于形成高自旋态，
并且产生局域磁矩。但是 3d 电子在磁性杂质与非磁金属介质间的来回跃迁使得体系倾向于形成非磁构
型。这两种机制是相互竞争的。在历史上是 P. W. Anderson 首先引入了量子杂质模型统一描述这两种
竞争机制，因此又称之为 Anderson 量子杂质模型 17 。Anderson 量子杂质模型的物理含义十分丰富。
除了用于描述杂质磁性以外，在其它领域也有着广泛的应用。量子杂质模型是纳米科学的基础之一，被
用于描述量子点 (quantum dot) 以及分子导体 (molecular conductor) 18 ，原子在金属表面的吸附也可
以用量子杂质模型描述 19,20 。
量子杂质模型还是动力学平均场理论的基石。动力学平均场理论的核心是将一个广义的晶格模型通过
自洽方程映射到量子杂质模型上，通过数值方法或者是解析手段求解量子杂质模型，便可间接获取初始
的晶格模型的性质 9,12,13 。因此量子杂质模型的地位十分重要。我们首先来具体了解所谓的量子杂质模
型。
广义地，量子杂质模型由三个基本项组成，它可以写成如下形式：
HQI = Hloc + Hbath + Hhyb ， (1.14)
其中 Hloc 为杂质项，描述的是具有有限自由度数目的系统。 Hbath 为环境项，描述的是无相互作用的无

限系统。 Hhyb 为杂化项，描述的是环境与杂质之间的耦合作用。
0 I
杂质项 Hloc 可以进一步分解为 Hloc 和 Hloc 两项，其中前者描述杂质电子的能级，而后者描述杂质
电子之间的相互作用。具体的表达式为:
0 I
Hloc = Hloc + Hloc , (1.15)
∑
0
Hloc = E ab d†a db , (1.16)
ab
∑
I
Hloc = I pqrs d†p d†q dr ds + ... (1.17)
pqrs
其中 a 和 b 为标记单粒子费米子态的量子数， a = 1, ......, N ， d† 和 d 分别为杂质电子的产生算符和消

灭算符。 E 描述裸的能级结构， I 描述电子 − 电子相互作用。在公式 (1.17) 中，只给出了 4 费米子相
互作用项，更高阶的项11 隐含在省略号当中。可以认为 Hbath 环境项实际上描述的是由巡游电子组成的
能带系统，每条能带可以用动量坐标 k 和能带索引 (包含自旋和轨道)α 来标记:
∑
Hbath = kα c†kα ckα , (1.18)
kα
其中 c† 和 c 表示导带电子的产生算符和消灭算符。杂化项 Hhyb 最常用的表示形式如下所示，其中 Vkαb

代表的是杂化矩阵。
∑
Hhyb = Vkαb c†kα db + h.c. (1.19)
kαb
对于 Kondo 问题 21 ，杂化项通常使用另一种形式:
∑
Hhyb = Jkabcd c† c d† d .
1 k2 k1 a k2 b c d
(1.20)
k1 k2 abcd
11 如 6 费米子相互作用项。
10 绪论
有时候为了方便起见，我们通常将杂质模型的配分函数 Z 用虚时路径积分的形式表示出来。这样做
的好处是可以将环境的自由度消去，获得有效的相互作用量 S。
∫
Z = D[c† , c]e−S , (1.21)
其中 S 代表有效相互作用量，其表达式为:
∑∫ β ∫ β [ ]
∫ β
S= dτ dτ 0 d†a (τ ) (∂τ + E ab )δ(τ − τ 0 ) + ∆ab (τ − τ 0 ) db (τ 0 ) + I
dτ Hloc (τ ). (1.22)
ab 0 0 0
∆ab (τ ) 为杂化函数，它在频率表象下的计算公式为:
∑ 1
∆ab (iωn ) = Vk†aα V αb . (1.23)
iωn − kα k
kα
下面我们简要介绍两个本文中将要涉及到的量子杂质模型。
单带单杂质 Anderson 杂质模型: 在 1961 年由 P. W. Anderson 17 引入。在这个模型中， Hloc 描述
的是单个杂质电子轨道，因此下标 a 代表自旋向上或者向下的自由度， E ab 就是杂质电子能级 ε0 (不考
I
虑磁场的存在)，相互作用项 Hloc 可以简化为 U n↑ n↓ 。该模型的哈密顿量可以写成如下的形式:
∑ ∑ ∑ †
HAIM = ε0 d†σ dσ + U n↑ n↓ + (V c†kσ dσ + h.c.) + k ckσ ckσ . (1.24)
σ kσ kσ
多带单杂质 Anderson 杂质模型: 多带杂质模型具有更多的自由度以及更复杂的相互作用形式，能够

描述实际材料中所展示的丰富多彩的物理现象，因此比单带杂质模型更为重要。例如对于具有未充满 3d
电子壳层的过渡金属氧化物和未充满 4f 电子壳层的稀土元素化合物，必须分别采用 5 带模型和 7 带模
型描述。对于多带杂质模型，相互作用项可以采用 Slater-Kanamori 形式 1,22 写出来。
∑ ∑ ∑
I
Hloc =U na↑ na↓ + (U − 2Jz ) na↑ nb↓ + (U − 3Jz ) naσ nbσ
a a6=b a>b,σ
∑ ∑ (1.25)
− Js d†a↑ d†b↓ db↑ da↓ − Jp d†a↑ d†a↓ db↑ db↓
a6=b a6=b
上式右端的前三项仅仅包含占据数算符，因此又被称为密度 − 密度 (density-density) 相互作用项; 右端

第四项被称为自旋翻转 (spin-flip) 项；右端第五项被称为对跃迁 (pair-hopping) 项。
1.2.3 量子杂质模型求解器
在动力学平均场理论框架中，量子杂质模型求解器占据着至关重要的地位。所谓的求解杂质模型，也
就是要获得算符 d 的关联函数。其中最重要的是单粒子格林函数 12 :
†
d (τ ) = −hT da (τ )db (0)i.
Gab (1.26)
12 当相互作用项为零时，单粒子格林函数可以表示为:
[ ]
1
Gab
d (iω) = .
iω − E − ∆ ab
由公式 (1.22) 可见，量子杂质模型本质上是一个空间 0 维加上时间 1 维的量子场论。尽管 (0+1) 维

的量子场论比高维的量子场论要容易求解得多，但是在通常的情形下，仅有少数量子杂质模型是可以被
严格求解的。量子杂质模型横跨了多个能标，相互作用项的能标很高，杂化项的能标处于中间位置，环
境项的能标较低。因此我们需要一个稳定可靠的，能覆盖不同能标的量子杂质求解器。
" 史前时代": 量子蒙特卡洛方法前传
长久以来，量子杂质模型一直是人们研究的热点问题之一。许多数值或解析方法都被用于求解量子杂
质模型。例如耦合常数微扰展开方法 23 ，large-N 展开方法 24,25 ，微扰重整化群方法 26,27 ，泛函重整化
群方法 28 ，"X-Operator" 技术 29--31 ，隶粒子算符方法 24,25,32--34 等等。
在解析方法当中，很重要的一类方法是部份图形的重新求和技术。其中最重要的代表为非相交近似
(non-crossing approximation, NCA) 35 及其推广 36,37 。具体的做法是对杂化项进行图形展开，环境项
收缩为一根直线。如果应用编时微扰理论，那么不同的展开图形可以用直线相交的次数分类。所有非相
交的图或者是单次相交的图都可以解析地通过一组积分方程进行求解。尽管这种方法是不受控的，但是
它可以抓住量子杂质模型的主要物理性质，并且工作在实频上，因此应用较为广泛。最近 Gull 等人 38
以非相交近似为出发点，在此基础上做图形展开，并用蒙特卡洛方法对图形进行部分求和，这种新的杂
质求解器对于研究 Mott 绝缘体相十分合适，但是并不适用于金属相。
Wilson 发明的数值重整化群 (numerical renormalization group, NRG) 方法 39 以及 White 等人发

明的密度矩阵重整化群 (density-matrix renormalization group, DMRG) 方法 40,41 是多体物理领域十
分强大的数值工具，它们都基于对 Hilbert 空间的精细截断。NRG 方法依赖于对能谱的对数分立化以及
迭代对角化技术 42 ，而 DMRG 方法的技术要点则在于孤立提取低激发态。这两种方法都是本文主要介
绍的量子蒙特卡洛方法的有益补充。量子蒙特卡洛方法一般工作在虚时间轴上，能够处理横跨多个能量
尺度的量子杂质模型，适用面广，但是需要使用解析延拓方法来获得实轴上的信息，并且难以分辨低能
区域的精细特征13 。另一方面，NRG 方法和 DMRG 方法可以工作在实轴上，并且易于获取基态以及低
激发态的信息，但是它们的适用范围较窄，无法处理横跨较宽能量尺度的量子杂质模型。
严格对角化 (exact diagonalization, ED) 方法是另一种被广泛应用的多体物理中的数值方法，它也

可以被用做量子杂质模型求解器 43 。ED 的技术要点是将杂化函数进行分立化，那么量子杂质模型将成
为有限系统，可以进行严格对角化，所获得的杂质格林函数实为一簇 δ 函数的包络线。对于零温体系，
可以应用严格对角化方法的零温版本:Lanczos 方法 44 。严格对角化方法最大的缺点是无法处理很大的体
系，根据文献的报道，作为动力学平均场方法中的量子杂质模型求解器，严格对角化方法所能处理的最
大系统为 5 带 Hubbard 模型 45--47 。
13 例如量子临界点附近的精细结构。
12 绪论
分立时间量子蒙特卡洛方法
量子蒙特卡洛方法是本文重点讨论的内容。它包含了两大类算法，第一类是分立时间量子蒙特卡洛算
法 (亦即 Hirsch-Fye 算法) 10,48,49 ，该算法在早期的动力学平均场理论中应用得最为广泛。Hirsch-Fye
量子蒙特卡洛算法的技术要点是将虚时间轴 [0, β) 均分为 M 个时间片段 ∆τ = β/M ，对于每个时间片
段 i 都应用 Hubbard-Stratonovich 变换。以单带 Anderson 杂质模型为例:
1 ∑ λsi (n↑ −n↓ )

e−∆τ U [n↑ n↓ −(n↑ +n↓ )/2] = e , (1.27)
2 s =±1
i
其中:
[ ( )]
1
λ = arccosh exp ∆τ U . (1.28)
2
式中 si 被称为附加的 Ising 场变量。这样量子杂质问题转化为随时间变化的附加 Ising 场上的无相互作
用费米子模型，可以用蒙特卡洛算法严格求解。Hirsch-Fye 量子蒙特卡洛算法既能处理强关联电子体
系，也能处理弱关联电子体系，均能获得十分精确的结果。它的主要缺点是计算速度比较慢，而且只能
获得虚时格林函数，为了获得有物理意义的结果，必须先对其进行解析延拓。主要存在着三个困难限制
了 Hirsch-Fye 算法的应用: 首先 Hirsch-Fye 算法要求对虚时间轴进行均匀分立化，这样会引入 O(τ 2 )
量级的系统误差。为了减少系统误差， ∆τ 需要尽可能的小，但是计算量的增长是 O(M 3 ) 的量级，因
此这是个两难的选择，需要在计算精度和计算时间之间做出折衷的选择14 。其次，当相互作用强度较大，
或者系统温度较低时，Hirsch-Fye 算法要达到平衡比较困难。最后，当相互作用的形式比较复杂时15 ，
附加 Ising 场变量的数目将急剧增加，这也会给蒙特卡洛抽样算法带来巨大的困难 49 。
连续时间量子蒙特卡洛方法
第二类算法是连续时间量子蒙特卡洛 (continuous-time quantum Monte Carlo, CT-QMC) 算法。

连续时间量子蒙特卡洛算法的基本思想是避免时间分立化步骤，直接对图形微扰展开项进行抽样。最
早利用这一想法的可能是 Handscomb 方法 50,51 以及它的推广——随机序列展开 (stochastic series
expansion, SSE) 算法 52 。SSE 算法将配分函数依据 βH 因子进行 Taylor 展开。这一算法成功地用于量
子磁体 (quantum magnets) 的的模拟计算。但是 SSE 算法要求哈密顿量的频谱是束缚的，因此在模拟
玻色系统时，需要对 Hilbert 空间进行截断，在模拟费米系统时，负符号问题十分严重。
当前使用的连续时间量子蒙特卡洛杂质求解器主要是受到 Prokof'ev 等人 53,54 工作的启发。他们开

创性的研究表明: 通过随机抽样配分函数的图形微扰展开项，玻色型的晶格模型可以用连续时间量子蒙特
卡洛算法求解。他们将连续时间量子蒙特卡洛算法推广至任意存在着连续变量的系统，又称之为图形量
子蒙特卡洛 (diagrammatic quantum Monte Carlo, DQMC) 方法 55,56 。在图形量子蒙特卡洛方法中，
完全消除了由于时间分立化以及 Suzuki-Trotter 分解所带来的系统误差，因此计算效率较之分立时间量
14 N. Blumer 等人曾提出一种外推方法，将普通的蒙特卡洛计算结果外推至 τ → 0 的情况 (参见arXiv:0712.1290)。
15 例如包含自旋翻转项或者是对跃迁项时。
子蒙特卡洛方法有巨大的提升。应用该方法已经完全解决了与 unfrustrated 的玻色型晶格模型有关的计

算问题。
连续时间量子蒙特卡洛算法在玻色型晶格问题上的成功促使人们将其拓展至费米型的晶格问题中去。
这方面的先导工作是由 Rombouts 等人 57 完成的。对于玻色型的体系，所有的展开图都有相同的符号，
然而对于费米型的体系，由于反对易关系的原因，不同的图形其符号并不一样，或正或负，因此每次都
抽样单个的图会导致十分严重的负符号问题。解决之道是把同类的图合并，每次抽样一系列的图，在数
值上表现为对行列式 (determinant) 的操作。不幸的是 Rombouts 及其合作者在他们所研究的晶格模
型中仍然发现了极为严重的负符号问题。实际上他们所使用的算法 57 仅能处理密度 − 密度形式的相互
作用。这样糟糕的结果使得人们对于连续时间量子蒙特卡洛算法在费米型晶格问题上的应用持悲观的态
度，很快这一算法便乏人问津了。
连续时间量子蒙特卡洛算法的转机出现于 2004 年与 2005 年之间 58 。随着动力学平均场理论的

深入发展，人们迫切需要一种适应范围广，性能优越且稳定的量子杂质模型求解器。人们很快就意识
到，量子杂质模型的负符号问题远没有量子晶格模型那么严重，在某些特殊情况下，负符号问题甚至
不再存在，因此人们开始回头重新审视连续时间量子蒙特卡洛算法。Rubtsov 等人首先提出了弱耦
合展开算法 (CT-INT) 59,60 ，这是一个突破性的进展。紧接着，Werner 与 Millis 等人提出了与之对应
的强耦合展开算法 (CT-HYB) 61--66 。Gull 等人结合了附加场技术以及弱耦合展开算法，提出了第三种
连续时间量子蒙特卡洛杂质求解器 (CT-AUX) 67 。Otsuki 与 Werner 等人还将弱耦合展开算法推广至
Coqblin-Schrieffer 模型以及 Kondo 模型中 (CT-J) 68 。
由于避免了时间轴分立化的步骤，因此连续时间量子蒙特卡洛算法中没有引入系统性的误差，比分立
时间量子蒙特卡洛算法更为精确可靠，并且其计算速度要比分立时间量子蒙特卡洛算法快很多，能够有
效处理多带体系。由于具有上述优点，虽然仍需要对连续时间量子蒙特卡洛算法的计算结果进行解析延
拓以获得真实的物理可观测量，它已经成为现代动力学平均场理论中最为主流的杂质求解器 69,70 ，在许
多领域都得到了广泛的应用 58 ，同时也取得了巨大的成功。
应用连续时间量子蒙特卡洛算法，人们能够精确地模拟 Kondo 晶格模型 71 ；首次定量研究具有旋转

不变性相互作用的多带模型 59,62,66,72--75 ；能够高效求解多格点的杂质模型，为在动力学平均场理论框
架内包含空间涨落效应奠定了坚实的基础 76--83 ；能够支持在密度泛函理论结合动力学平均场方法的框
架内快速模拟计算实际的关联电子材料的物理性质 84 。连续时间量子蒙特卡洛算法还能够高效地测量四
点 (高阶) 关联函数 (four-point correlation function)，这对于研究系统的磁化系数，相边界十分重要。
而且四点关联函数也是对偶费米子方法 15,85 与动力学顶角近似 16 等动力学平均场理论扩展的关键组成
部分，因此不难预见，连续时间量子蒙特卡洛算法在这些新领域将会大放异彩。在纳米科学领域，连续
时间量子蒙特卡洛算法被用于研究过渡金属团簇在金属表面的物理属性 86 。一些在以前由于方法上的限
制而无法研究的物理问题现在也得到了初步解决，例如重费米子材料中的准粒子动力学以及热力学交叉
点 87--90 。费米子在光学晶格中的问题也已开始理论研究 91,92 。将连续时间量子蒙特卡洛算法拓展至非平
衡体系实时系统中的研究 93--98 也在紧锣密鼓地进行当中。
14 绪论
应该特别指出的是，虽然连续时间量子蒙特卡洛算法极大地拓展了量子杂质求解器的适用范围，取得
了巨大的成功，但是它们并不能解决费米子符号问题。就目前所知，符号问题是物理的，不可避免的。
符号问题的严重性与否将最终决定连续时间量子蒙特卡洛算法的适用边界。
1.3 本文主要结构
在攻读博士学位期间，在导师的指导下，本人主要完成了以下工作:(1) 在动力学平均场方法的框架
下，改进发展了一系列基于强耦合展开连续时间量子蒙特卡洛算法的量子杂质模型求解器。(2) 结合密度
泛函理论 (local density approximation, LDA) 以及动力学平均场方法 (dynamical mean-field theory,
DMFT)，独立开发了一套比较完备的 LDA+DMFT 第一性原理电子结构计算软件包。(3) 使用此 LDA
+DMFT 软件包通过理论计算研究了 SrVO3 、CoO、FeO、BaRuO3 、BaOsO3 、CeH3 等强关联电子系
统的电子结构。本博士学位论文即是对上述研究工作的阶段性总结。本学位论文剩余部分的结构如下。
正文部分的结构:
第2章，主要介绍了蒙特卡洛方法的一般原理包括 Markov 链、重要性抽样方法、Metropolis 算法、

赝随机数产生器等，以及量子蒙特卡洛杂质求解器的理论框架与一般计算流程等内容。本章可看作是
第3章的重要铺垫。
第3章，本文的核心内容之一。主要阐述了在攻读博士学位期间本人开发的各种基于强耦合展开连续
时间量子蒙特卡洛算法的杂质求解器，包括: 段表示版本、Holstein-Hubbard 模型版本、动态屏蔽效应
版本、广义矩阵算法版本、Krylov 算法版本、Newton-Leja 算法版本、正交多项式表象版本与内核多
项式表象版本等等。本章不但深入讨论了各种版本的公式推导，还分别给出了具体的实现细节与测试应
用案例。俗语有云，工欲善其事，必先利其器，本章为第4章与第5章准备好了十分强大的计算工具。
第4章，本文的核心内容之二。首先介绍了经典的密度泛函理论，然后推导了广义的 LDA+DMFT 自
洽计算公式，最后给出了 LDA+DMFT 计算框架的种种实现细节，其中包括：局域轨道的选择、双计
数项的选择、占据数的计算、费米面的计算、Brillouin 区积分算法、物理量计算等等。本章可看作是
第5章的理论准备与工具准备。
第5章，本文的核心内容之三。我们使用 LDA+DMFT 计算方法研究了许多强关联电子材料的物性，

本章精选几个比较有代表的例子稍作介绍，希望能起到提纲挈领，抛砖引玉的作用。这些材料包括: 属于
3d 电子体系的 SrVO3 与 CoO，属于 4d 电子体系的 BaRuO3 。
第6章是全文的总结，回顾了全文的主要内容，归纳出主要的研究成果，并对后续研究工作稍作展望。
附录部分的结构:
附录A.1，介绍了用于解析延拓虚时格林函数 G(τ ) 的最大熵方法。
附录A.2，介绍了用于解析延拓虚时格林函数 G(τ ) 的随机解析延拓方法，该方法与最大熵方法是互

补的。
附录A.3，介绍了 Leja 点的定义以及 Leja 序列的递推产生公式。

1.3 本文主要结构 15
附录A.4，介绍了 Newton 多项式插值方法的一般形式。
附录A.5，介绍了 Legendre 多项式的定义，正交关系与基本的递推关系。
附录A.6，介绍了第一类与第二类 Chebyshev 多项式的定义，正交关系与基本的递推关系。
附录A.7，介绍了 Lambin-Vigneron 四面体积分方法，主要用于计算 Brillouin 区积分。

第二章
量子蒙特卡洛杂质求解器: 一般原理
在第1章的第1.2.3节，我们初步了解量子蒙特卡洛杂质求解器的前世今生，那么在本章，我们将正式
进入到量子蒙特卡洛杂质求解器的世界中去。本章的结构如下:
第2.1节，顾名思义，量子蒙特卡洛杂质求解器的核心就是蒙特卡洛方法，因此我们需要对蒙特卡洛
方法的一般原理有所了解。本节将简要介绍蒙特卡洛方法的一般原理，包括细致平衡原理，Markov 链，
重要性抽样方法，赝随机数产生器等等。
第2.2节，接下来，我们将介绍量子蒙特卡洛杂质求解器的基本原理、普遍适用的计算流程以及负符
号问题。
第2.3节是本章的小结。
2.1 蒙特卡洛方法
从数值积分出发引入蒙特卡洛抽样方法的基本概念是绝大多数计算物理方面专著的保留节目，本文并
不打算标新立异，下面让我们也从数值积分开始吧。
2.1.1 蒙特卡洛抽样原理
考虑如下形式的数值积分: ∫ 1
F = dxf (x), (2.1)
0
要计算此数值积分，通常的做法是在 [0, 1] 区间内均匀取 M 个点，第 i 个点的坐标为 xi = i/M ，那么该
积分可以近似表示为:
1 ∑
M
F ∼ f (xi ). (2.2)
M i=1
18 量子蒙特卡洛杂质求解器: 一般原理
显然，当 M → ∞ 时，计算值将逼近准确值。
我们也可以采用蒙特卡洛随机抽样的方法来解决这个问题。方法是在 [0, 1] 内随机均匀选取 M 个点

Xi ，那么该积分可以这样计算:
1 ∑
M
F ∼ f (Xi ). (2.3)
M i=1
计算误差可以用下面的公式来估计: √
var(f )
∆F = . (2.4)
M
显然，当 M → ∞ 时， ∆F → 0，计算值也将逼近准确值。蒙特卡洛随机抽样方法很容易推广到高维积
分，常用于计算形如下式的相空间积分:
∫
1
F = f (X)dX, (2.5)
Ω C
其中 C 表示相空间 (位型空间)， Ω 是 C 所占的体积。蒙特卡洛随机抽样方法在计算低维积分时并不占优

势，这是因为计算结果的收敛速度要比传统的数值方法慢。但是在计算高维积分时，由于蒙特卡洛随机
抽样方法的计算误差正比于 M −1/2 ，与积分维度无关，因此它占据着巨大的优势，有时甚至是计算某些
高维积分唯一的方法。
在传统的蒙特卡洛随机抽样方法中，随机变量 Xi 的分布是均匀的。但是如果被积函数 f (X) 在相空

间 C 中的某个小区域有很强的峰，那么在抽样过程中，方差 var(f ) 将会很大。此时这套方法并不是很
高效，因为它需要很大的抽样次数 M 才可能达到一定的计算精度，解决这个问题的技巧就是应用重要
性抽样原理。假设随机变量 Xi 不再服从均匀分布，而是服从某种概率分布 p(X):
∫
p(X)dX = 1, (2.6)
C
那么可以有:
∫
1 ∑ f (Xi )
M
1 f (X)
F = p(X)dX ∼ , (2.7)
Ω C p(X) M i=1 p(Xi )
误差公式 (2.4) 也修改为:

√
var(f /p)
∆F = . (2.8)
M
理论上 p(X) 是可以随意选取的，只要其符合归一化条件即可。但是根据误差公式 (2.8)，如果 p(X) 与
f (X) 的分布很接近，那么比值 f /p 近似保持为常数，方差将会很小，这将极大地提高蒙特卡洛算法的
抽样效率。例如假定被积函数为 f (x) = exp(−x2 )，那么可以选取 p(x) = exp(−λx) 而不是随机的均匀
分布 p(x) = constants。
在统计力学中，我们通常需要使用蒙特卡洛抽样方法来计算高维积分。例如某个物理量 A 的期望值
可以表示为如下的形式:
∫
1
hAi = hAip = dXA(X)p(X), (2.9)
Z C
2.1 蒙特卡洛方法 19
其中 ∫
Z= p(X)dX. (2.10)
C
在上面的公式中，积分遍历整个相空间， X ∈ C， p(X) 代表相空间中某点 X 的权重贡献。在相空间中

按照概率 p(X)/Z 随机取 M 个点 Xi ，那么物理量 A 的期望值可以用下式近似计算:
1 ∑
M
hAi ∼ A = A(Xi ). (2.11)
M i=1
在有些情况下，如果我们按照分布 ρ(X) 而不是 p(X) 来进行蒙特卡洛抽样能得到更好的效果，期望值

hAiρ 被重新定义为:
∫ ∫
1 dXA(X)[p(X)/ρ(X)]ρ(X) hA(p/ρ)iρ
hAi = A(X)p(X)dX = C ∫ = . (2.12)
Z C C
dX[p(X)/ρ(X)]ρ(X) hp/ρiρ
为了计算此期望值，我们必须同时抽样上式的分子与分母部分，收集记录 A(X)p(X)/ρ(X) 与
p(X)/ρ(X) 的平均值。
2.1.2 Markov 过程
根据上一小节给出的公式 (2.11)，要计算物理量 A 的期望值，我们首先必须在相空间 C 中随机选取

一系列的点 Xi ，并且同时要满足分布概率正比于 p(X)/Z。我们通常应用 Markov 过程来解决这个问
题。考虑如下形式的 Markov 链:
x → y → z → ..., (2.13)
x， y， z 都是相空间中的某个状态 (点)。首先定义由状态 x 经一步跃迁至状态 y 的概率为 Wxy ，那么

显然有:
∑
Wxy = 1, (2.14)
y
也就是说由状态 x 跃迁至其它任意状态的概率之和恒等于 1。如果从任意分布状态出发，若希望通过

Markov 过程快速演进至某个特定的分布状态 p(X)，那么只需要满足下述两个充分条件。
1. 遍历性 (ergodicity): 从任意状态 x 出发，总可以通过有限个 Markov 步骤，跃迁至任意状态 y。
2. 细致平衡条件 (detailed balance condition): 达到平衡状态时，任意两个状态 x 和 y 之间相互跃

迁的机会均等，亦即:
Wxy p(y)
= . (2.15)
Wyx p(x)
2.1.3 Metropolis-Hastings 算法
那么如何产生符合上述要求的 Markov 链呢? 通常的做法是应用 Metropolis-Hastings 算法。假设

prop
由状态 x 到状态 y 的跃迁几率 Wxy 由两部分复合而成: 由状态 x 向状态 y 可能发生跃迁的几率 Wxy
acc
乘上该跃迁被接受的几率 Wxy 。如果跃迁被接受，那么状态改变为 y，如果该跃迁不被接受，那么仍然
保持状态 x:
prop acc
Wxy = Wxy Wxy . (2.16)
应用细致平衡条件公式 (2.15)，不难得到:
acc prop
Wxy p(y)Wyx
acc
= prop = R. (2.17)
Wyx p(x)Wxy
设若 ( )
prop
acc
p(y)Wyx
Wxy =f prop = f (R), (2.18)
p(x)Wxy
那么 ( )
prop
acc
p(x)Wxy
Wyx =f prop = f (1/R). (2.19)
p(y)Wyx
因此细致平衡条件可以转化为下面的形式，只要能满足它，细致平衡条件就必然能够满足:
f (R)
= R. (2.20)
f (1/R)
如果采用 Metropolis-Hastings 提出的函数形式，那么细致平衡条件可以被满足:
f (R) = min[1, R]. (2.21)
在程序实现上实际的做法是在 [0, 1] 区间中产生一个随机数 r，如果 r < f (R)，接受跃迁，如果

r > f (R)，拒绝跃迁，这就是 Metropolis-Hastings 算法。在文献中还有 Heat-Bath 算法，唯一的差别
在于 f (R) 的定义:
R
f (R) = . (2.22)
1+R
2.1.4 Mersenne Twister 赝随机数产生器
随机数产生器是蒙特卡洛方法的核心组成部分之一，随机数产生器的好坏直接影响着蒙特卡洛模拟的
精确性。一般意义上所说的随机数产生器通常是指赝随机数产生器，亦即只要给定了随机数种子，那么
所产生的随机数序列是唯一确定的、可预测的、可重复的。那些能在 [0, 1] 区间内产生均匀分布随机数
的是最有用的随机数产生器。根据 Park 与 Miller 等人的看法，优秀的赝随机数产生器须得满足以下三
个条件:(1) 随机数的周期必须尽可能地长，必须尽可能地接近计算机中整数的范围。例如对于 32 位的计
算机，好的赝随机数产生器应该具有接近于 231 − 1 = 2147483647 的周期。(2) 赝随机数产生器必须具有
很好的随机性，换言之，随机数序列中的随机数之间的关联应尽可能的小。判别方法如下，假设 xn 与
xn+l 是任意两个随机数， n 与 n + l 是它们在随机数序列中的编号， l > 0，那么我们在 x − y 平面中绘
制 (xn , xn+l ) 并观察它们的分布。如果赝随机数产生器的随机性很好，那么应该得到均匀的分布。如果
随机性不好，随机数之间的关联比较大，那么将得不到均匀的分布，可能会得到呈条纹状或晶格状的分
布。(3) 优秀的赝随机数产生器的执行效率必须很高，因为我们需要很多很多以亿为计量单位的随机数以
达到比较好的统计结果，所以赝随机数的速度也是一个非常重要的因素。
2.2 量子蒙特卡洛杂质求解器 21
Mersenne Twister 是目前最流行的赝随机数产生器之一，它是由 Makoto Matsumoto(松本真)

和 Takuji Nishimura(西村拓士) 在 1997 年开发的，基于有限二进制字段上的矩阵线性递归场 F2 。
Mersenne Twister 赝随机数发生器可以快速产生高质量的伪随机数，它修正了古典随机数产生算
法的很多缺陷。由于该赝随机数产生器的周期长度取自 Mersenne 素数，因此得名为 Mersenne
Twister。这个算法有两个相近的变体，不同之处在于使用了不同的 Mersenne 素数。其中最常用的
一个是 MT19937-32, 32 位字长，还有一个变种是 64 位版的 MT19937-64。对于一个 k 位的长度，
Mersenne Twister 会在 [0, 2k − 1] 的区间之间生成离散型均匀分布的赝随机数。
Mersenne Twister 赝随机数产生器具有以下优点:
(1) 具有长达 219937 − 1 的周期。在许多软件包中的短周期 232 随机数产生器在一个长周期的运行中
不能保证所生成的随机数的质量；
(2) 在 1 ≤ k ≤ 623 的维度之间都可以均等分布；
(3) 除了在统计学意义上的不正确的赝随机数产生器以外，Mersenne Twister 在所有的赝随机数产
生器算法中是最快的。
在我们的量子蒙特卡洛杂质求解器中，我们编程实现了标准的 MT19937-64 型 Mersenne Twister
赝随机数产生器以及 SFMT 赝随机数产生器 (SIMD-oriented Fast Mersenne Twister)。后者其实是
Mersenne Twister 赝随机数产生器的一个新变种，它利用处理器的 SIMD 指令集来加速随机数序列的
产生过程，能达到十分惊人的执行效率。在缺省情况下，SFMT 是我们首选的赝随机数产生器。
2.2 量子蒙特卡洛杂质求解器
量子蒙特卡洛方法的定义是应用随机方法求解量子力学的问题。它大致可以分为三大类算法: (1) 变
分蒙特卡洛方法 (Variational Monte Carlo, VMC) 或者是扩散蒙特卡洛方法 (Diffusion Monte Carlo,
DMC)，它们抽样的对象是相互作用多体系统中的波函数。(2) 路径积分蒙特卡洛方法 (Path Integral
Monte Carlo, PIMC)，对多体问题的作用量进行随机抽样。著名的随机序列展开算法 (stochastic series
expansion, SSE)、loop 算法和 worm 算法都属于这一类。本文第3章重点介绍的连续时间量子蒙特卡
洛算法严格而言也属于路径积分蒙特卡洛算法的一个变种。(3) 附加场蒙特卡洛方法 (Auxiliary Field
Monte Carlo, AFMC)，将有效作用量分立化，把配分函数积分重写为高维位型空间中的求和，然后用
蒙特卡洛方法进行抽样。Hirsch-Fye 算法就是附加场蒙特卡洛算法中的一种。
2.2.1 杂质问题的分立化
利用量子蒙特卡洛方法求解杂质问题有两种思路，分别是时间分立化以及微扰展开。这里先简要介绍
时间分立化的思想，下一小节介绍微扰展开的方法，至于具体的算法将在后续的章节中逐一介绍。
首先考虑量子杂质模型的配分函数 Z:
[ ]
Z = Tr e−βH . (2.23)
将虚时间轴 [0, β) 均匀分为 M 个时间片，每个时间片的长度为:

β
∆τ = . (2.24)
M
那么系统配分函数可以近似表示为: [M ]
∏
−∆τ H
Z ∼ Tr e , (2.25)
i=1
这就是 Suzuki-Trotter 分解。通过引入 Ising 附加场，可以将上面的矩阵乘积表示为已知的附加场函数

的求和:
∑
Z∼ W [s1 , ..., sm ], (2.26)
s1 , ..., sm
其中 s1 , ..., sm 是 Ising 附加场算符，它们张开了一个相空间 C，公式中的求和可以用蒙特卡洛随机抽

样技术来完成。
2.2.2 杂质问题的微扰展开
利用量子蒙特卡洛方法求解杂质问题的另一思路是微扰展开。将哈密顿量拆分为两部分：
H = H1 + H2 , (2.27)
其中 H1 为无相互作用部分， H2 为相互作用部分。在相互作用表象下，含时算符 O(τ ) 可以表示为如下

的形式：
O(τ ) = eτ H1 Oe−τ H1 . (2.28)
引入新算符 U(β)，其定义为：
U(β) = eβH1 e−βH . (2.29)
那么系统的配分函数可以表示为如下的形式：
Z = Tr[e−βH1 U(β)]. (2.30)
算符 U(β) 有如下性质：
dU(β)
= −H2 (β)U(β), (2.31)
dβ
∫β
U(β) = T e− 0
dτ H2 (τ )
, (2.32)
其中 T 为虚时编时算符。将式 (2.32) 代入到式 (2.30) 中得到：

[ ∫β ]
Z = Tr e−βH1 T e− 0 dτ H2 (τ ) . (2.33)
将 H2 项作为微扰项，对配分函数 Z 进行级数展开，可以得到如下公式：
∑∫ β ∫ β
(−1)k [ ]
Z= dτ1 ... dτk Tr e−βH1 T H2 (τk )H2 (τk−1 )...H2 (τ1 ) , (2.34)
0 0 k!
k
或者是
∑∫ β ∫ β [ ]
Z= dτ1 ... dτk (−1)k Tr e−βH1 T H2 (τk )H2 (τk−1 )...H2 (τ1 ) . (2.35)
k 0 τk−1
接下来同样可以用量子蒙特卡洛随机抽样技术来处理上面的级数求和。
2.2.3 图形量子蒙特卡洛方法
经过微扰展开后，配分函数 (参见公式 (2.35)) 可以看做是关于无穷序列的相空间积分:

∞ ∑ ∫
∑ β ∫ β
Z= dτ1 ... dτk ω(k, γ, τ1 , ..., τk ). (2.36)
k=0 γ∈Γk 0 0
注意到上式与公式 (2.10) 十分相似。相空间 C 中的某个点 X 1 具有如下形式:
X = (k, γ, (τ1 , ..., τk )), (2.37)
其中 k 是微扰展开的阶数。 τ1 ， τ2 ，...， τk ∈ [0, β)，它们是虚时间变量。 γ ∈ Γk 则包含了其它所有独

立的自由度，包括自旋、轨道、格点位置、附加场算符等等。每一个 X 对应着展开序列中的一项，相应
的权重为:
p(X) = ω(k, γ, τ1 , ..., τk )dτ1 ...dτk . (2.38)
此刻我们假定所有的权重都是正值，关于负符号的问题稍候讨论。虽然权重是定义严谨的概率密度，但
是它们包含着无穷小量 dτ ，也许有人会担忧这在计算位型空间中随机行走的试探/接受概率时会带来一
定的困难。但是 Prokof'ev 等人的工作已经证明了 53--56 这样的担心是毫无必要的。
本博士论文第3章将要讨论的几种连续时间量子蒙特卡洛算法在表象选择、图形权重、更新方式与物
理量测量等方面存在着诸多不同，但是它们的配分函数都可以表示为形如公式 (2.36) 的形式 58 。为了能
够更好地讨论如何采用蒙特卡洛技术计算配分函数的 (连续时间) 微扰展开，同时也为了说明无穷小量
dτ 不会导致无法克服的困难，并且不失一般性，我们选取如下简单的配分函数微扰展开式为例说明:
∞ ∫ β
∑ ∫ β ∫ β
w(k)
Z= dτ1 dτ2 ... dτk . (2.39)
0 0 0 k!
k=0
如果考虑时序，那么上式可以重写为:
∞ ∫
∑ β ∫ β ∫ β
Z= dτ1 dτ2 ... dτk w(k). (2.40)
k=0 0 τ1 τk−1
对于微扰展开阶数为 k，各个顶点 (算符) 所处的时间为 {τj } 这样的一个位形，其权重 (概率密度) 可以表

示为:
∏
k
p(k, τ1 , ..., τk ) = w(k) dτi . (2.41)
i=1
1 有时也可以叫做位型 (configuration) 或者是图形 (diagram)。

.0 .β
.(a) .
.τ1
.(b)
.τ2
.(c)
.τ3
.(d)
图 2.1: 相空间位型 X = (k, γ, (τ1 , ..., τk )) 的图形表示。顶点用彩色圆点表示。(a)k = 0 阶图；(b) k = 1

阶图；(c) k = 2 阶图；(d) k = 3 阶图。
在下文，我们总是假定 τi 的排列满足时序关系 τ1 ≤ τ2 ≤ ... ≤ τk 。相空间 C 中的任意一点 X 2 都可以用

图形来描述。对于第 k 阶项，可以用 [0, β) 区间上的 k 个顶点 (•) 来表示，第 i 个顶点的坐标为 τi ，如
图2.1所示。
如果要从相空间中的 X 点变为 Y 点3 ，那么一般可以采取以下两种基本更新方式 (如图2.2所示):(1)

在虚时间轴 τ 处插入一个新的顶点，让微扰展开的阶数由 k 变为 k + 1；(2) 在现有的顶点中选定第 i
个，将其删除，让微扰展开的阶数由 k 变为 k − 1。原则上说，只要有这两种基本更新方式，即可满足蒙
特卡洛抽样中遍历性的要求，也就是说，通过有限个这样的基本操作，总能够获得特定的图形。除了这
两种能够改变顶点数目 (微扰展开的阶数) 的基本更新方式以外，还有其它一些不改变顶点数目的更新方
式，例如移动顶点的位置，改变顶点的性质等等。这些额外的更新方式并不是蒙特卡洛抽样算法所必须
的，但是适当引入这些更新方式可以加速达到平衡的过程，提高蒙特卡洛方法的抽样效率。在某些特殊
情况下，还有可能需要在一次更新中同时插入/删除多个顶点。对于这些特殊的更新方式，在下文中将不
会有详细的讨论。
下面将关注的焦点转移到插入/删除一个顶点这两种最基本的更新方式上，推导出相应的试探/接受概
率的计算公式。假定从某个阶数为 k 的位型 (k, ~τ ) = (k, τ1 , ..., τk ) 开始，我们试探性地在时间 τ 处插
入一个顶点，其中 τ 是在 [0, β) 区间内任意选择的，那么将会得到一个新的 k + 1 阶的位型 (k + 1, τ~0 ) =
(k + 1, τ1 , ..., τ, ..., τk ) ≡ (k + 1, τ10 , ..., τk+1
0
)。那么这个插入操作的试探概率为:
prop dτ
Wk,k+1 = . (2.42)
β
2 亦即展开序列中的任意一项，任意一个位型。
3 对应于位型的改变，图形的改变或者是微扰展开序列中不同项之间的跳跃。
图 2.2: 相空间中随机行走示意图。 k 表示第 k 阶项， k + 1 表示第 k + 1 阶项，然后依次类推。
再考虑删除操作，随机选取任意一个顶点，那么删除这个顶点将使得位型由 (k + 1, τ~0 ) 变为 (k, ~τ )，相

应的试探概率为:
prop 1
Wk+1,k = . (2.43)
k+1
为了计算 Metropolis 接受概率，首先需要利用公式 (2.17) 计算接受比率 R:
prop
p((k + 1, τ~0 )) Wk+1,k
Rk,k+1 = prop
p((k, τ~)) Wk,k+1
0
w(k + 1)dτ10 ...dτk+1 1/(k + 1) (2.44)
=
w(k)dτ1 ...dτk dτ /β
w(k + 1) β
= .
w(k) k + 1
很明显，所有的无穷小量都抵消掉了，它们已经不再构成问题了。根据公式 (2.44) 以及公式 (2.21)，不

难得到 Metropolis 接受概率公式如下:
acc
Wk,k+1 = min[1, Rk,k+1 ], (2.45)
acc
Wk+1,k = min[1, 1/Rk,k+1 ]. (2.46)
对于那些保持微扰展开阶数 k 不变的更新方式而言，接受概率的计算公式十分简单，因为无穷小量都完
全抵消了，因此可以得到如下公式:
wnew (k)
Rk,k = , (2.47)
wold (k)
acc
Wk,k = min[1, 1/Rk,k ]. (2.48)
广义的图形量子蒙特卡洛方法计算流程如下图2.3所示。
步骤 1: 初始化量子蒙特卡洛算法，随机构造初始的图形；
图 2.3: 图形量子蒙特卡洛方法流程图，具体计算过程参见正文中的描述。
步骤 2: 随机选择更新图形的方式。在图2.3中只给出了插入/删除一个顶点这两种基本的更新方式，
但是实际上还可以选取其它额外的不改变顶点数目的更新方式，以便提高程序的抽样效率；
步骤 3: 根据所选择的图形更新方式，产生新的图形，并且计算新图形的权重；
步骤 4: 根据公式 (2.44) 计算接受比率；
步骤 5: 根据重要性抽样原则，应用 Metropolis 算法，计算接受概率；如果图形更新被接受，那么执

行步骤 7，如果图形更新被拒绝，那么执行步骤 6；
步骤 6: 撤销对图形所做的更新，保留原始的配置，然后执行步骤 8；
步骤 7: 保存对图形所做的更新，保留相关的信息，然后执行步骤 8；
步骤 8: 依据当前的微扰展开图形，测量相关的物理量，抽样统计必要的数据；
步骤 9: 判断物理量是否已经收敛，如果是，那么退出程序；如果为否，那么跳转至步骤 2，继续执
行蒙特卡洛抽样。
2.2.4 负符号问题
在上文的讨论中，我们均假定配分函数展开式中所有的展开系数都是正值或者是 0。这样我们可以很
自然地把权重看作是位型空间的概率密度，并且通过蒙特卡洛抽样方法随机抽样访问这些位型。如果权
重 p(X) 为负值4 ，那么它不能够再被看作是概率密度。解决之道就是根据原权重的绝对值 ρ(X) = |p(X)|
进行抽样，那么根据公式 (2.12)，可以得到新的测量公式:
hA sgni|p|
hAi = , (2.49)
hsgni|p|
其中
p(X) p(X)
sgn = = , (2.50)
ρ(X) |p(X)|
相当于原权重的符号。这样，根据公式 (2.49)，即使存在着负符号，只要在分子与分母中同时根据权重
|p(X)| 进行抽样，同样可以求得物理量的期望值。
负符号问题看似解决了，其实事情远没有那么简单。根据公式 (2.49) 进行抽样有可能导致指数型增

长的计算误差。为了说明这一点，请看平均符号的测量公式:
∫ ∫
dXsgn(X)|p(X)|
C ∫
dXp(X) Z
hsgni = = ∫C = . (2.51)
C
dX|p(X)| C
dX|p(X)| Z|p|
这实际上是原系统的配分函数 Z 与另一个具有正定权重 |p(X)| 的玻色子参考系统的配分函数 Z|p| 的比

值。这个比值可以由这两个系统的能量差 ∆F 表示出来，亦即:
Z
hsgni = = exp(−β∆F ). (2.52)
Z|p|
4 由于费米子算符之间是反对易的关系，权重为负值在费米子系统中是十分常见的。
因此若温度降低，平均符号将指数下降趋于 0。符号的方差可由下式计算：
varsgn = hsgn2 i − hsgni2 = 1 − exp(−2β∆F ) ∼ 1, (2.53)
并且相对误差可以表示为: √
var sgn/M exp(β∆F )
∆sgn = ∼ √ . (2.54)
hsgni M
其中 M 为蒙特卡洛抽样测量的次数。显然如果温度很低，那么测量误差将会指数型地增长。
符号问题已经被证明是一个 NP 问题 (nondeterministic polynomial, NP)，因此无法在有限时间内

得到合适的解。符号问题的严重性与否极端依赖于所研究的模型以及所采用的量子力学表象。例如量子
杂质模型的符号问题就要比对应的晶格模型的符号问题要轻微一些。在某些特殊情况下，符号问题是不
存在的，例如 Yoo 等人 99 就严格证明了对于单带 Anderson 杂质模型的 Hirsch-Fye 算法而言是不存在
符号问题的。这个证明很容易被推广到多带模型以及连续时间量子蒙特卡洛算法中去。对于基于强耦合
展开算法的连续时间量子蒙特卡洛杂质求解器而言，如果杂化函数与杂质能级不对易 [∆ab , E ab ] 6= 0，那
么符号问题将十分严重。
2.3 本章小结
本章的主要内容可以分为两大部分。第一部分简要地介绍了蒙特卡洛方法的一般原理，包括抽样原
理、误差分析、重要性抽样、Markov 链、Metropolis-Hastings 算法、赝随机数产生器等等，为不熟
悉蒙特卡洛方法的读者提供简明的背景介绍。第二部分主要讨论了使用蒙特卡洛方法求解量子杂质模型
的两大途径。第一种途径是杂质问题的分立化，代表算法是 Hirsch-Fye 算法。第二种途径是杂质问题
的微扰展开，代表算法是图形量子蒙特卡洛算法。图形量子蒙特卡洛算法是连续时间量子蒙特卡洛算法
的一般形式。在本章的后半部分，仔细推导了图形量子蒙特卡洛算法的基本公式，描述了该算法的一般
流程，同时还粗略地介绍了在量子蒙特卡洛算法中不可避免的负符号问题。
第三章
量子蒙特卡洛杂质求解器: 强耦合展开连续时间算法
第2章已经介绍了量子蒙特卡洛杂质求解器的一般原理，本章将着重介绍量子蒙特卡洛杂质求解器最
重要的一个特例: 基于强耦合展开的连续时间量子蒙特卡洛杂质求解器 (CT-HYB)。强耦合展开连续时间
量子蒙特卡洛杂质求解器是目前应用最为广泛的杂质求解器，它具有计算速度快、无系统误差、适用范
围广等优点 58 。因此自该算法公开发表后，它迅速取代 Hirsch-Fye 算法 (HF-QMC) 48 以及弱耦合展开
连续时间量子蒙特卡洛杂质求解器 (CT-INT) 59 ，成为动力学平均场领域的首选求解器。有鉴于此，在攻
读博士学位期间，本人独立开发了一系列基于连续时间量子蒙特卡洛算法的杂质求解器以及相关的配套
工具，这些程序如图3.1 与表3.1所示。
由于强耦合展开连续时间量子蒙特卡洛算法已经被推广拓展到许多方面，因此在本章我们将对该算法
的方方面面做尽可能详细的描述。本章的主要结构如下:
第3.1节，主要介绍强耦合展开连续时间量子蒙特卡洛算法的基本原理，推导出最最基本的公式 58 。
第3.2节，主要介绍强耦合展开连续时间量子蒙特卡洛算法最简单最有效的形式: 段表示算法 61 。
第3.3节，将段表示算法推广至 Holstein-Hubbard 模型 63 以及应用于解决与动态屏蔽效应 64 相关的

问题。所谓的动态屏蔽效应指的是 Coulomb 相互作用不再是一个静态值，而是随频率变化的量 U (ω)。
第3.4节，介绍的是强耦合展开连续时间量子蒙特卡洛算法的广义形式: 广义矩阵算法 62,66 ，这是功能

最强大的算法，能够处理任意形式的复杂相互作用，包括具有旋转不变性的相互作用项以及自旋 − 轨道
耦合项，但是计算效率不是很理想。
第3.5节，介绍如何利用 Krylov 子空间迭代算法 65 以及 OpenMP 并行化加速技术，提高原始的广义

矩阵算法的效率，使其能够处理复杂的多带问题。此外我们还发展了基于 Newton-Leja 多项式插值算
法的广义矩阵算法，该算法的计算效率比 Krylov 子空间迭代算法又有数量级上的提高。本节深入比较
了 Newton-Leja 多项式插值算法以及 Krylov 子空间迭代算法孰优孰劣。
30 量子蒙特卡洛杂质求解器: 强耦合展开连续时间算法
.
manjushaka
.
daisy
.
. pansy .
hibiscus
.
.
. . . .
rosemary .
sakura . Impurity. Solver . jasmine
.
narcissus . .
.
. .
.
azalea camellia
. .
.
.
begonia
. .
gardenia epiphyllum
.
fuchsia
.
.
lavender
图 3.1: 量子蒙特卡洛杂质求解器项目分支示意图。绿色表示已完成的项目，橙色表示开发中的项目，灰
色表示计划中的项目，蓝色表示辅助项目。
31
表 3.1: 量子蒙特卡洛杂质求解器项目分支a
项目描述状态
Hirsch-Fye 量子蒙特卡洛杂质求解器算法
daisy 密度 − 密度相互作用，direct update 与 delayed update 算法程序维护
弱耦合展开量子蒙特卡洛杂质求解器算法
sakura 密度 − 密度相互作用程序维护
rosemary 广义相互作用计划开发
强耦合展开量子蒙特卡洛杂质求解器算法
azalea 密度 − 密度相互作用，段表示形式程序维护b
gardenia 密度 − 密度相互作用，段表示形式，内核多项式表象程序维护c
narcissus 密度 − 密度相互作用，段表示形式，电声耦合，内核多项式表象程序维护d
fuchsia 实时版本，密度 − 密度相互作用，段表示形式计划开发
begonia 广义相互作用，广义矩阵形式程序维护e
lavender 广义相互作用，广义矩阵形式，内核多项式表象程序维护f
camellia 广义相互作用，广义矩阵形式，Krylov 算法, 内核多项式表象程序维护g
epiphyllum 广义相互作用，广义矩阵形式，Krylov 算法，内核多项式表象h 程序维护i
pansy 广义相互作用，广义矩阵形式，Newton-Leja 算法，内核多项式表象程序维护j
manjushaka 广义相互作用，广义矩阵形式，Newton-Leja 算法，内核多项式表象k 正在开发l
辅助程序
jasmine 原子问题对角化程序m 程序维护
hibiscus 前处理与后处理程序，主要包括最大熵方法，随机解析延拓程序等等程序维护n
a 所有量子蒙特卡洛杂质求解器均支持 MPI 并行化

b 参见第3.2节
c 参见第3.6节，附录第A.5节与第A.6节
d 参见第3.2节与第3.3节
e 参见第3.4节
f 参见第3.4节
g 参见第3.5节
h 除支持 MPI 并行化外，还支持 OpenMP 并行化
i 参见第3.5节
j 参见第3.5节，附录第A.3节与第A.4节
k 除支持 MPI 并行化外，还支持 OpenMP 并行化
l 参见第3.5节，附录第A.3节与第A.4节
m 专门设计与 begonia，lavender，camellia，epiphyllum，pansy，manjushaka 等程序配套
n 参见附录第A.1节与第A.2节
第3.6节，介绍如何利用正交多项式表象 100 以及内核多项式表象 101 技术提高虚时格林函数，杂质自

能函数等物理量的测量精度。这两种表象可以应用到不同版本的强耦合展开连续时间量子蒙特卡洛杂质
求解器中去。
3.1 配分函数的微扰展开
本节将推导出强耦合展开连续时间量子蒙特卡洛算法的基本公式 58 。
首先由广义的量子杂质模型 (见公式 (1.14)) 出发，按照图形量子蒙特卡洛方法的精神，可以将哈密
顿量划分为两部分 (H = H1 + H2 )，其中:
H1 = Hloc + Hbath , (3.1)
并且
H2 = Hhyb . (3.2)
为了计算量子杂质模型的配分函数，我们将 H2 杂化项定为微扰项，对其进行微扰展开，获得型如公
式 (2.35) 的无穷阶展开序列。首先考察杂化项的定义:
∑
Hhyb = (Vαb c†α db + Vαb∗ d†b cα ) = H̃hyb + H̃hyb
†
. (3.3)
αb
它包含了两个共轭的子项，分别在杂质 (关联轨道) 上产生电子和消灭电子，在环境 (导带) 中消灭电子与

†
产生电子。因此在配分函数的展开式中，只有那些包含着相等数目的 H̃hyb 和 H̃hyb 的偶次项才会有非零
的贡献。配分函数的微扰展开式为:
∞ ∫ β
∑ ∫ β ∫ β ∫ β [ ]
† †
Z= dτ1 ... dτk dτ10 ... dτk0 Tr e−βH1 T H̃hyb (τk )H̃hyb (τk0 )...H̃hyb (τ1 )H̃hyb (τ10 ) .
k=0 0 τk−1 0 τk0 −1
(3.4)
†
我们进一步将和 H̃hyb 的表达式 (公式 (3.3)) 代入到上式，可以得到:
H̃hyb
∞ ∫ β
∑ ∫ β ∫ β ∫ β ∑ ∑ b0 ∗ b0 ∗
Z= dτ1 ... dτk dτ10 ... dτk0 Vαb11 Vα01 ...Vαbkk Vα0k
1 k
k=0 0 τk−1 0 τk0 −1 α1 ...αk b1 ...bk
α01 ...α0k b0 ...b0
1 k
(3.5)
[ ]
Tr e−βH1 T dbk (τk )c†αk (τk )cα0k (τk0 )d†b0 (τk0 )...db1 (τ1 )c†α1 (τ1 )cα01 (τ10 )d†b0 (τ10 ) .
k 1
† †
由于杂质电子算符 d 和 d 与导带电子算符 c 和 c 分别作用于不同的空间，并且 H1 没有混合杂质电子
态与环境电子态，因此可以将它们相互分离, 得到:
∞ ∫ β
∑ ∫ β ∫ β ∫ β ∑ ∑
0 b0 ∗ b0 ∗
Z= dτ1 ... dτk dτ1 ... dτk0 Vαb11 Vα01 ...Vαbkk Vα0k
1 k
k=0 0 τk−1 0 τk0 −1 α1 ...αk b1 ...bk
α01 ...α0k b0 ...b0
1 k
[ ] (3.6)
Trd e−βHloc T dbk (τk )d†b0 (τk0 )...db1 (τ1 )d†b0 (τ10 )
k 1
[ ]
−βHbath
Trc e T cαk (τk )cα0k (τk )...cα1 (τ1 )cα01 (τ10 ) .
† 0 †
3.1 配分函数的微扰展开 33
我们首先考虑与导带电子 − 环境项有关的部分:
∑ [ ]
b0 ∗ b0 ∗
Vαb11 Vα01 ...Vαbkk Vα0k Trc e−βHbath T c†αk (τk )cα0k (τk0 )...c†α1 (τ1 )cα01 (τ10 ) . (3.7)
1 k
b1 ...bk
b01 ...b0k
它包含 k 个产生算符 c† 与 k 个消灭算符 c，由于该部分是无相互作用的，时间演化算符不再将杂质项与

环境项耦合在一起，因此我们可以使用 Wick 定理，将其转化为一个 k 阶的行列式。为了证明这一点，
我们以 k = 1 阶为例进行推导。首先定义环境部分的配分函数为 1 :
∏
Zbath = Tre−βHbath = (1 + e−βα ). (3.8)
α
那么对于 k = 1 阶而言，可以有 2 :


eα1 ((τ1 −τ10 )−β) ,
1 ∑ b01 ∗ [ ] ∑ |Vαb11 |2 τ1 > τ10
Vαb11 V α01 Trc e−βHbath T c†α1 (τ1 )cα01 (τ10 ) = (3.9)
Zbath 1+e −βα1 
−eα1 (τ1 −τ10 ) ,
α1 α01 α1 τ1 < τ10 .
如果我们定义反周期的虚时杂化函数 ∆(τ ):

∑ V l∗ V m 
eα (τ −β) , τ >0
∆lm (τ ) = α α
× (3.10)
1 + e−βα −eα τ ,
α τ < 0,
1 公式 (3.8) 的证明如下:
∏ †
Zbath = Tre−βHbath = Tr e−βα cα cα
α
[ ]
∏ −βα c†α cα (−βα )2 (c†α cα )2
= Tr 1 + + + ...
α
1! 2!
∏ [ ( )]
−βα (−βα )2
= Tr 1 + c†α cα + + ...
α
1! 2!
∏ [ ]
= Tr 1 + c†α cα (e−βα − 1)
α
∏
= (1 + e−βα )
α
2 公式 (3.9) 的证明如下: 当 τ1 > τ10 时，

[ ] [ ]
Tr e−βHbath c†α1 (τ1 )cα1 (τ10 ) = Tr e−βHbath c†α1 (τ1 − τ10 )cα1
[ 0 0
]
= Tr e−βHbath e(τ1 −τ1 )Hbath c†α1 e−(τ1 −τ1 )Hbath cα1
[ 0 0
]
= Tr e(τ1 −τ1 −β)Hbath c†α1 e−(τ1 −τ1 )Hbath cα1
[ 0
]
= Tr e(τ1 −τ1 −β)Hbath c†α1 cα1
0
= e(τ1 −τ1 −β)α1
当 τ1 < τ10 时，应用同样的技巧，可以得到:

[ ] 0
Tr e−βHbath cα1 (τ10 )c†α1 (τ1 ) = e(τ1 −τ1 )α1
以及反周期的虚频杂化函数 ∆(iω):
∑ V l∗ V m
α α
∆lm (−iωn ) = . (3.11)
α
iωn − α
再回代公式 (3.9)，我们可以得到:
1 ∑ b0 ∗ [ ]
Vαb11 Vα01 Trc e−βHbath T c†α1 (τ1 )cα01 (τ10 ) = ∆b1 b01 (τ1 − τ10 ). (3.12)
Zbath 1
α1 α01
推广到第 k 阶，不难得到:
1 ∑ [ ]
b0 ∗ b0 ∗
Vαb11 Vα01 ...Vαbkk Vα0k Trc e−βHbath T c†αk (τk )cα0k (τk0 )...c†α1 (τ1 )cα01 (τ10 ) = detM−1 . (3.13)
Zbath α1 ...αk
1 k
α01 ...α0k
其中 M−1 是一个 k × k 的矩阵，

 
0 0
 ∆b1 b01 (τ1 − τ1 ) ∆b1 b02 (τ1 − τ2 ) ... ∆b1 b0k (τ1 − τk0 ) 
 
 
 ∆b2 b01 (τ2 − τ10 ) ∆b2 b02 (τ2 − τ20 ) . . . ∆b2 b0k (τ2 − τk0 ) 
(Mk×k ) = 
−1
 .. .. ..
,
 (3.14)
 . . ... . 
 
 
∆bk b01 (τk − τ10 ) ∆bk b02 (τk − τ20 ) 0
. . . ∆bk b0k (τk − τk )
它的矩阵元可以用下式计算:
(M−1 )ij = ∆bi b0j (τi − τj0 ). (3.15)
将公式 (3.13) 回代入公式 (3.6) 中，可以得到:

∞ ∫ β
∑ ∫ β ∫ β ∫ β
Z =Zbath dτ1 ... dτk dτ10 ... dτk0
k=0 0 τk−1 0 τk0 −1
∑ ∑ [ ] (3.16)
Trd e−βHloc T dbk (τk )d†b0 (τk0 )...db1 (τ1 )d†b0 (τ10 ) detM−1 .
k 1
b1 ...bk b01 ...b0k
这就是配分函数的强耦合微扰展开形式，也是强耦合展开连续时间量子蒙特卡洛杂质求解器的基本公
式 58 。按照图形量子蒙特卡洛算法的精神，上述微扰展开式的每一项都可以用图形来表示，其权重就是:
[ ]
ω = Trd e−βHloc T dbk (τk )d†b0 (τk0 )...db1 (τ1 )d†b0 (τ10 ) detM−1 . (3.17)
k 1
为了方便起见，我们将与杂质电子有关的部分单独提取出来，定义为 F(= ωloc ):

[ ]
F = ωloc = Trd e−βHloc T dbk (τk )d†b0 (τk0 )...db1 (τ1 )d†b0 (τ10 ) , (3.18)
k 1
而 detM−1 重新定义为 D(= ωdet )，那么可有:
ω = ωloc ωdet = FD. (3.19)
强耦合展开连续时间量子蒙特卡洛杂质求解器有两大类: 段表示算法 61 以及广义矩阵算法 62,66 ，它们最

大的不同就在于如何计算 ωloc 。这是下文我们将要着重讨论的内容。
3.2 段表示算法 35
3.2 段表示算法
本节主要介绍强耦合展开连续时间量子蒙特卡洛杂质求解器的段表示算法 61 ，这是强耦合展开算法一
个特例，具有特别简单的形式。当相互作用仅仅包含密度 − 密度 (density-density) 项时，段表示算法
成立。在第3.2.1小节，首先介绍段表示算法的一般原理，尤其是着重介绍段表示算法的图形规则以及
图形表示。第3.2.2小节介绍如何利用图形表示快速计算权重因子 ωloc ，而第3.2.3小节则介绍如何利用
Sherman-Morrison-Woodbury 公式快速计算权重因子 ωdet 。最后的第3.2.5小节则作为程序测试。
3.2.1 基本原理
当相互作用项仅仅包含密度 − 密度相互作用时，局域哈密顿量 Hloc 与轨道占据数算符 nα 对易:
[Hloc , nα ] = 0. (3.20)
换言之， Hloc 在占据数表象下是对角矩阵，因此我们选择在占据数表象下计算 ωloc 。在此表象下，杂质

电子的产生算符与消灭算符总是成对出现，交替排列的，它们将 [0, β) 区间划分为占据态与非占据态。
对于占据态我们称之为段 (segment)，而非占据态则称之为空段 (anti-segment)。
我们可以利用图形的语言将微扰展开式 (参见公式3.16) 完全表达出来。首先定义段表示算法的图形

规则如下:
1. 每一条轨道称为一种 flavor，用一条长度为 β(范围为 [0, β)) 的线段表示。对于单带模型而言，有

两种 flavor，分别为自旋向上和自旋向下。
2. 产生算符用•表示，消灭算符用◦表示，它们成对交替分布在 flavor 上，每一对算符称为一个 kink

或者是一个 vertex，产生算符与消灭算符之间的粗线段表示占据态 (segment)，其它部分为非占据态
(anti-segment)。
3. 任意一对产生算符 (位于 τs ) 与消灭算符 (位于 τe ) 之间的外部连线表示杂化函数 ∆(τe − τs )3 。
4. 对于公式 (3.16) 中的 k 阶项，对应的图有 k 个 kink， 2k 个算符，分布在不同的 flavor 上。拓扑

上不相同的图一共有 k! 个。
首先将微扰展开式中可能出现的图形按照占据情况分类，并用整型变量 stts 标识: (1) 空占据态，

stts = 0， [0, β) 内没有任何算符; (2) 部分占据态， stts = 1， [0, β) 内至少有一对算符，且 τ = 0 以及
τ = β 处未被占据; (3) 部分占据态， stts = 2， [0, β) 内至少有一对算符，且 τ = 0 以及 τ = β 处被占
据; (4) 全占据态， stts = 3， [0, β) 内没有任何算符。具体的分类情况如下图3.2所示。
考虑一个单带模型，有自旋朝上与朝下两种 flavor，那么 k = 2 阶的典型图形如图3.3所示，图中共

有两个产生算符与两个消灭算符。在自旋朝上的 flavor 中， [τs1 , τe1 ] 之间为占据态，其余部分为非占据
态。在自旋朝下的 flavor 中， [0, τe2 ] 之间与 [τs2 , β) 之间为占据态，其余部分为非占据态。为了显示清楚
3 在本章中，除非特别声明，否则下标 s 表示与产生算符有关的量，而下标 e 则表示与消灭算符有关的量。
.(a) .
.(b)
.(c)
.(d)
图 3.2: 段表示算法中图形表示的四种可能状态。(a) 空占据态；(b) 部分占据态 (segment 模式)；(c) 部

分占据态 (anti-segment 模式)；(d) 全占据态。
.τs1 .τe1
. .↑
.↓
.0 .τe2 .τs2 .β
图 3.3: 段表示算法中典型的二阶展开图形。图中红色粗线表示占据态，黑色细线表示非占据态，粉色区
域表示重叠部分。仅在重叠部分才需要考虑相互作用 U ，参见公式 (3.22)。
起见，图中并未绘出代表杂化函数的外部连线。利用图形的语言，经过简单的数学推导，在段表示算法
中， wloc 可以由下式计算:
∑n ∑n
Lj −
ωloc = seµ j i<j (Uij Oij ) . (3.21)
式中， n 代表 flavor(轨道) 的数目， Lj 代表第 j 个 flavor 中段 (占据态) 的总长度， Oij 代表第 i 个

flavor 与第 j 个 flavor 之间段的重叠部分的总长度， Uij 代表相应的 Coulomb 相互作用矩阵元， µ 为
化学势， s 为与编时算符有关的符号。那么对于图3.3而言，对应的权重为:
ωloc = eµ(τe −τs +τe −τs +β)−U (τe −τs +τe −τs ) .
1 1 2 2 2 1 1 2
(3.22)
段表示算法的精髓在于从某个随机产生的类似于图3.3所示的图形出发，通过一些基本的更新操作随
机产生新的拓朴不等价的图形，计算新图形的权重，按照图形量子蒙特卡洛算法的基本流程计算新图形
对于配分函数微扰展开式的贡献。图形配置的更新方式有如下几种:
(1) 插入 segment: 在当前图形中任选一条 flavor，然后随机插入一对相邻的产生算符与消灭算符。

在 segment 不跨过 τ = β 点的情况下，产生算符的时间 τs 必须小于消灭算符的时间 τe ，如果 segment
跨过了 τ = β 点，那么消灭算符在产生算符之前。如果当前 flavor 是全占据，那么放弃此更新操作。蒙
特卡洛抽样接受概率为: [ ]
Dk+1 βlmax l̃µ−δovlp U
Padd = min e ,1 . (3.23)
Dk k + 1
在上式中， Dk+1 /Dk 为行列式部分的比值， el̃µ−δovlp U 为 trace 部分的比值。 lmax 表示当产生算符的

位置 τs 确定之后，随后插入的消灭算符 τe 可以存在的时间范围， ˜l 为新插入 segment 的长度， ˜l 必定
在 [0, lmax ] 范围内， δovlp 代表新 segment 被插入之后，flavor 之间的交叠部分的变化。 β 因子来源于
在 [0, β] 区间内任意选取一点插入算符的随机性， k + 1 因子来源于微扰展开序列的阶数本身。
(2) 删除 segment: 在当前图形中任选一条 flavor，然后随机删除一对相邻的产生算符与消灭算符。

在 segment 不跨过 τ = β 点的情况下，产生算符的时间 τs 必须小于消灭算符的时间 τe ，如果 segment
跨过了 τ = β 点，那么消灭算符在产生算符之前。如果当前 flavor 是空占据，那么放弃此更新操作。蒙
特卡洛抽样接受概率为:
[ ]
Dk−1 k −l̃µ+δovlp U
Premove = min e ,1 . (3.24)
Dk βlmax
(3) 插入 anti-segment: 在当前图形中任选一条 flavor，然后任选一个 segment，往其中插入一对

相邻的产生算符与消灭算符。在 anti-segment 不跨过 τ = β 点的情况下，消灭算符在产生算符之前，
如果 anti-segment 跨过了 τ = β 点，那么产生算符在消灭算符之前。如果当前 flavor 是空占据，那么
放弃此更新操作。蒙特卡洛抽样接受概率为:
[ ]
Dk+1 βlmax −l̃µ+δovlp U
Padd = min e ,1 . (3.25)
Dk k + 1
(4) 删除 anti-segment: 在当前图形中任选一条 flavor，然后任选一个 anti-segment，将其删除。

对于空占据态或者是全占据态，都无法执行此更新操作。蒙特卡洛抽样接受概率为:
[ ]
Dk−1 k l̃µ−δovlp U
Premove = min e ,1 . (3.26)
Dk βlmax
(5) 左右移动产生算符或者是消灭算符: 上述几种更新操作都会改变微扰展开的阶数 k，从理论上说，

有这几种更新操作就足够了，就能够满足蒙特卡洛抽样遍历性的要求，移动算符的操作虽然并不是必须
的，但是却可以改善蒙特卡洛算法的抽样效率。在此更新操作中，移动边界为左右最近邻的其它算符，
移动时可以越过 τ = 0 或者 τ = β 边界。蒙特卡洛抽样的接受概率为:
[ ]
Dnew (l̃−l)µ−δovlp
Pmove = min e ,1 . (3.27)
Dold
(6) 全局翻转: 全局操作是防止在蒙特卡洛抽样过程中，系统被"trap" 到某些特定状态中。上述五种

局部操作都不能够使体系从"trap" 中跳出来，此时我们需要全局操作。最常见的全局操作就是任选两条
flavor，然后交换它们的全部信息。蒙特卡洛抽样的接受概率为:
[]
Dnew
Pswap = min ,1 . (3.28)
Dold
在典型的蒙特卡洛抽样过程中，插入/删除 segment 或者 anti-segment 的操作大概各占 22.5% 的

比例，而移动产生算符或者是消灭算符的操作大概各占 5% 的比例，全局翻转的操作视情况需要添加。
.(a) .
.0 .β
.(b)
.(c)
.(d)
.(e)
.(f)
.(g)
图 3.4: 段表示算法中插入 segment 示意图。图中绿色部分表示被插入的 segment。
3.2.2 求迹算法
下面讨论如何具体地计算 ωloc 部分对图形权重的贡献，分 (1) 插入 segment；(2) 插入 anti-

segment；(3) 删除 segment；(4) 删除 anti-segment 四种情况讨论。至于左右移动产生算符或者是消
灭算符这两种情况就不再仔细讨论了，对于感兴趣者请参阅相关的程序实现 (azalea 项目)。
插入 segment
插入 segment 的示意图如下图3.4所示，一共可以细分为以下七种情况。
(a) 初始图形为空占据态 (stts = 0)，插入 segment 后，消灭算符没有越过 τ = β 点，结果图形为部
分占据态 (stts = 1)。对于此类情况 lmax = β。
(b) 初始图形为空占据态 (stts = 0)，插入 segment 后，消灭算符越过 τ = β 点，结果图形变为部分
占据态 (stts = 2)。对于此类情况 lmax = β。
(c) 初始图形为部分占据态 (stts = 1)，在所有算符之前插入 segment，结果图形仍为部分占据态
(stts = 1)。对于此类情况 lmax 的计算方法为插入产生算符与右侧相邻的第一个产生算符之间的间距。
(d) 初始图形为部分占据态 (stts = 1)，在所有算符之后插入 segment，由于消灭算符没有越过 τ = β
点，结果图形仍为部分占据态 (stts = 1)。对于此类情况 lmax 的计算方法为插入产生算符与 τ = β 点的
.(a) .
.0 .β
.(b)
.(c)
.(d)
.(e)
.(f)
.(g)
图 3.5: 段表示算法中插入 anti-segment 示意图。图中绿色部分表示被插入的 anti-segment。
间距加上 τ = 0 点与第一个产生算符之间的间距。
(e) 初始图形为部分占据态 (stts = 1)，在所有算符之后插入 segment，由于消灭算符已经越过 τ = β

点，结果图形变为部分占据态 (stts = 2)。对于此类情况 lmax 的计算方法为插入产生算符与 τ = β 点的
间距加上 τ = 0 点与第一个产生算符之间的间距。
(f) 初始图形为部分占据态 (stts = 1)，在中间区域插入 segment，结果图形仍为部分占据态

(stts = 1)。对于此类情况， lmax 的计算方法为插入产生算符与右侧相邻的第一个产生算符之间的间距。
(g) 初始图形为部分占据态 (stts = 2)，在中间区域插入 segment，结果图形仍为部分占据态

(stts = 2)。对于此类情况， lmax 的计算方法为插入产生算符与右侧相邻的第一个产生算符之间的间距。
如果初始图形为全占据态 (stts = 3)，那么插入 segment 这种操作是禁止的
插入 anti-segment
插入 anti-segment 的示意图如下图3.5所示，一共可以细分为以下七种情况。
(a) 初始图形为部分占据态 (stts = 1), 插入 anti-segment 后，结果图形仍为部分占据态 (stts = 1)。

对于此类情况， lmax 的计算方法为插入产生算符与左侧相邻的第一个产生算符之间的间距。
(b) 初始图形为部分占据态 (stts = 2)，在第一个 segment 中插入 anti-segment，由于消灭算符没

有向左越过 τ = 0 点，结果图形仍为部分占据态 (stts = 2)。对于此类情况， lmax 的计算方法为插入产

生算符与 τ = 0 点之间的间距加上 τ = β 点与最右侧第一个产生算符之间的间距。
(c) 初始图形为部分占据态 (stts = 2)，在第一个 segment 中插入 anti-segment，由于消灭算符向
左侧越过了 τ = 0 点，结果图形变为部分占据态 (stts = 1)。对于此类情况， lmax 的计算方法为插入产
生算符与 τ = 0 点之间的间距加上 τ = β 点与最右侧第一个产生算符之间的间距。
(d) 初始图形为部分占据态 (stts = 2)，在最后一个 segment 中插入 anti-segment，结果图形仍为
部分占据态 (stts = 2)。对于此类情况， lmax 的计算方法为插入产生算符与左侧相邻第一个产生算符之
间的间距。
(e) 初始图形为部分占据态 (stts = 2)，在中间任意的 segment 中插入 anti-segment，结果图形仍
为部分占据态 (stts = 2)。对于此类情况， lmax 的计算方法为插入产生算符与左侧相邻第一个产生算符
之间的间距。
(f) 初始图形为全占据态 (stts = 3)，在中间插入 anti-segment，由于消灭算符没有向左越过 τ = 0
点，结果图形仍为部分占据态 (stts = 2)。对于此类情况 lmax = β。
(g) 初始图形为全占据态 (stts = 3)，在中间插入 anti-segment，由于消灭算符向左越过了 τ = 0
点，绝过图形变为部分占据态 (stts = 1)。对于此类情况 lmax = β。
如果初始图形为空占据态 (stts = 0)，那么插入 anti-segment 这类操作是被禁止的。
删除 segment
删除 segment 的示意图如下图3.6所示，一共可以细分为以下五种情况。
(a) 初始图形为部分占据态 (stts = 1)，仅有一个 segment，删除此 segment 后，结果图形变为空占
据态 (stts = 0)。对于此类情况 lmax = β。
(b) 初始图形为部分占据态 (stts = 1)，有多个 segment，删除中间任意一个 segment 后，结果图
形仍保持部分占据态 (stts = 1)。对于此类情况， lmax 的计算方法为将要删除的产生算符与右侧相邻的
第一个产生算符之间的间距。
(c) 初始图形为部分占据态 (stts = 2)，仅有一个 segment，删除此 segment 后，结果图形变为空占
据态 (stts = 0)。对于此类情况 lmax = β。
(d) 初始图形为部分占据态 (stts = 2)，有多个 segment，删除中间任意一个 segment 后，结果图
形仍保持部分占据态 (stts = 2)。对于此类情况， lmax 的计算方法为将要删除的产生算符与右侧相邻的
第一个产生算符之间的间距。
(e) 初始图形为部分占据态 (stts = 2)，有多个 segment，删除第一个 segment，结果图形变为部分
占据态 (stts = 1)。对于此类情况， lmax 的计算方法为将要删除的产生算符与 τ = 0 点之间的间距加上
最右侧最后一个消灭算符与 τ = β 点之间的间距。
如果初始图形为空占据态 (stts = 0) 或者全占据态 (stts = 3)，那么删除 segment 这类操作是被禁止
的。
.(a) .
.0 .β
.(b)
.(c)
.(d)
.(e)
图 3.6: 段表示算法中删除 segment 示意图。图中绿色部分表示将被删除的 segment。
删除 anti-segment
删除 segment 的示意图如下图3.7所示，一共可以细分为以下五种情况。
(a) 初始图形为部分占据态 (stts = 1)，仅有一个 anti-segment，删除此 anti-segment 后，结果图

形变为全占据态 (stts = 3)。对于此类情况 lmax = β。
(b) 初始图形为部分占据态 (stts = 1)，有多个 anti-segment，删除中间任意一个 anti-segment

后，结果图形仍保持部分占据态 (stts = 1)。对于此类情况， lmax 的计算方法为将要删除的产生算符与
左侧相邻的第一个产生算符之间的间距。
(c) 初始图形为部分占据态 (stts = 1)，有多个 anti-segment，删除第一个 anti-segment 后，结果

图形变为部分占据态 (stts = 2)。对于此类情况， lmax 的计算方法为将要删除的产生算符与 τ = 0 之间
的间距加上最右侧第一个产生算符与 τ = β 点之间的间距。
(d) 初始图形为部分占据态 (stts = 2)，仅有一个 anti-segment，删除此 anti-segment 后，结果图

形变为全占据态 (stts = 3)。对于此类情况 lmax = β。
(e) 初始图形为部分占据态 (stts = 2)，有多个 anti-segment，删除中间任意一个 anti-segment，

结果图形仍为部分占据态 (stts = 2)。对于此类情况， lmax 的计算方法为将要删除的产生算符与左侧相
邻第一个产生算符之间的间距。
如果初始图形为空占据态 (stts = 0) 或者全占据态 (stts = 3)，那么删除 anti-segment 这类操作是

被禁止的。
.(a) .
.0 .β
.(b)
.(c)
.(d)
.(e)
图 3.7: 段表示算法中删除 anti-segment 示意图。图中绿色部分表示将要被删除的 anti-segment。
3.2.3 行列式算法
在蒙特卡洛抽样的接受概率中，有一个关键的因子，那就是行列式部分的贡献:Dnew /Dold 。它的严格

计算公式如下:
Dnew det Mold
= . (3.29)
Dold det Mnew
其中矩阵 M 的定义见公式 (3.14)。
Shermann-Morrison-Woodbury 公式
下面我们首先介绍一个与逆矩阵有关的著名公式:Shermann-Morrison-Woodbury 公式，此公式常
用来快速求解矩阵的逆 58,59,67 。如果我们有一个 N × N 矩阵 A−1 ，它加上矢量 u 与 v 的直积 u ⊗ v，那
么结果矩阵的逆矩阵可通过 O(N 2 ) 量级的浮点运算得到，而传统的求逆矩阵的算法要求 O(N 3 ) 量级的
浮点运算。Shermann-Morrison-Woodbury 公式如下所示:
1
(A−1 + u ⊗ v)−1 = A − (Au) ⊗ (vA). (3.30)
1 + vAu
特别地，对于矩阵的行列式，有下述公式成立:
det(A−1 + u ⊗ v) det(A) = 1 + vAu. (3.31)
下面我们将给出插入/删除 segment 或者是 anti-segment 时的基本行列式更新公式，至于左右移动产

生算符或者是消灭算符的更新公式请参阅相关的程序实现。
插入 segment 或者 anti-segment 时的行列式算法
无论是插入 segment 还是 anti-segment，其最终效果都是往 M−1 old 增加一行一列。

 
∆1n
 
 
 M −1
∆2n 
 old 
M−1 
new = 
, (3.32)
.. 
 . 
 
 
∆n1 ∆n2 . . . ∆nn
其中 Mold 是 (n−1)×(n−1) 的矩阵。如果我们已知 Mold ，那么通过 Shermann-Morrison-Woodbury

公式可以求出 Mnew 来。具体的推导过程从略，此处仅仅给出最终的公式。
   
0 L
   1n 
   
 Mold   
 0   L2n 

Mnew =    
..  + p  ..  ⊗ (Rn1 , Rn2 , . . . | − 1), (3.33)
 .   . 
   
   
0 0 ... 0 −1
其中
∑
Lij = Mold
il ∆lj , (3.34)
l<n
∑
Rij = ∆il Mold
lj , (3.35)
l<n
det Mold 1 ∑
= = ∆nn − ∆nl Mold
ll0 ∆l0 n . (3.36)
det Mnew p 0 ll <n
在拟插入 segment 或者是 anti-segment 时，我们首先利用公式 (3.36) 计算出行列式部分对图形权重

的贡献，如果操作被接受，再利用公式 (3.33) 来更新 M 矩阵。
删除 segment 或者 anti-segment 时的行列式算法
在删除 segment 或者是 anti-segment 时，实际上相当于删除 M 矩阵中特定的行与列，行指标与

列指标分别等于产生算符与消灭算符在各自序列中的索引。假设 M 为 n × n 的矩阵，需要删除其中的
第 p 行与第 q 列，相当于在图形中删除第 p 个产生算符与第 q 个消灭算符。利用 Shermann-Morrison-
Woodbury 公式，我们可以推导出下述矩阵公式:
Mold
ip Mqj
old
Mnew = Mold
ij − , (3.37)
ij
Mpq old
其中 i 6= p 以及 j 6= q。同时还有:
det Mold
= Mold
pq . (3.38)
det Mnew
在拟删除 segment 或者是 anti-segment 时，我们同样是首先利用公式 (3.38) 计算出行列式部分对图

形权重的贡献，如果操作被接受，再利用公式 (3.37) 来更新 M 矩阵。
3.2.4 物理量测量
在段表示算法中，局域虚时格林函数的测量公式为:
G(τe − τs ) = −Mie ,is ， (3.39)
其中 τs 与 τe 分别为产生算符与消灭算符的时间，而 is ， ie 则是它们在各自算符序列中的索引。该公式
可以改写为: * +
1 ∑
k ∑
k
G(τ ) = − Mj,i ∆(τ,
˜ τie − τjs ) , (3.40)
β i=1 j=1
˜ τ 0 ) 是自定义的 δ 函数:
其中 ∆(τ,


δ(τ − τ 0 ), τ0 > 0
˜ τ 0) =
∆(τ, (3.41)

−δ(τ − τ 0 − β), τ 0 < 0.
相应的虚频格林函数的测量公式为:
1 ∑ iωτie
G(iω) = − e Mie ,is e−iωτis . (3.42)
β i ,i
e s
实际上，并不需要每次都利用上式从头计算 G(iω)。在插入 segment 或者 anti-segment 时，假设分别

在 τ 与 τ 0 处插入产生算符与消灭算符，对应在 M−1 矩阵的第 is 列处插入新的一列，在第 ie 行处插入
新的一行， is 与 ie 分别为新的产生算符与消灭算符在各自算符序列中的位置，那么可有下面的测量公
式:   
p ∑ ∑
Gnew = Gold − eiωτje Lje   Rjs e−iωτjs  , (3.43)
β je js
其中
∑
0
Lj = Mold
ji ∆(τi − τ ), (3.44)
i
∑
Ri = ∆(τ − τj )Mold
ji . (3.45)
j
在删除 segment 或者 anti-segment 时，假设分别删除索引为 is 与 ie 处的产生算符与消灭算符，那么

虚频格林函数的更新公式可以重写为:
  
1 ∑ ∑
Gnew = Gold +  eiωτje Mje is   Mie js e−iωτjs  . (3.46)
βMie is je js
以上公式对于所有的强耦合展开连续时间量子蒙特卡洛杂质求解器都是适用的。
系统动能的测量公式为:
1
Ekin = hki, (3.47)
β
其中 k 为图形展开的阶数。势能的测量公式为:
∑
Epot = Uij hni nj i. (3.48)
i>j
轨道 i 上的电子占据数测量公式为:
hli i
ni = , (3.49)
β
其中 li 为第 i 条轨道上所有 segment 的总长度， li 必定是小于等于 β 以及大于等于 0 的。那么轨道磁

化的测量公式为:
hli↑ − li↓ i
Siz = , (3.50)
β
其中 li↑ 为第 i 条能带自旋朝上的 flavor 上总的 segment 的长度， li↓ 的含义类似。最后值得一提的是

Epot 、 ni 、 Siz 的测量公式仅在段表示算法中才是成立的，而 Ekin 的测量公式对于所有的 CT-HYB 算
法都是成立的。
3.2.5 程序测试
我们在azalea项目、gardenia项目、narcissus项目中实现了段表示算法 (参见图3.1与表3.1)。本小
节将检验段表示算法的可靠性。
我们以单带 Hubbard 模型以及 3 带 Hubbard 模型为研究对象，以严格对角化杂质求解器 9,43 和

Hirsch-Fye 量子蒙特卡洛杂质求解器 9,48 的计算结果为参考对象，检验段表示算法的准确性。测试结果
如图3.8与图3.9 所示。由图可见，段表示算法的计算结果与其它杂质求解器的计算结果符合得非常好，
无论是金属态还是绝缘态，均能够得到正确的虚频格林函数。
强耦合展开连续时间量子蒙特卡洛杂质求解器的计算效率与微扰展开项的阶数 k 有关。阶数越大，
说明 M 矩阵的尺寸越大，产生算符与消灭算符的数目越多，计算速度越慢。由于算法本身的内禀性质，
Coulomb 相互作用强度越大，微扰展开阶数越小，计算速度越快。另一方面，如果温度越低， β 值越
大，微扰展开阶数越大，计算速度越慢。图3.10中关于单带 Hubbard 模型的测试结果很好地证明了这
一点。图中 U = 0 时的微扰阶数分布曲线最靠近右侧，因此其计算速度是最慢的。弱耦合展开连续时
间量子蒙特卡洛杂质求解器的性质刚好与之相反，Coulomb 相互作用强度越小，微扰展开阶数越小，
计算速度越快 59,86 。因此这两种连续时间量子蒙特卡洛杂质求解器是互补的，强耦合展开版本适合强关
联与中等关联体系，而弱耦合展开版本更适合于弱关联体系。总体而言，强耦合展开连续时间量子蒙特
卡洛杂质求解器 (尤其是段表示算法) 的计算效率要远高于弱耦合展开的版本以及传统的 Hirsch-Fye 算
法 58 ，下图3.11给出了一个十分直观的量度。
-0.2
-0.4
-0.6
-0.8
G(iω)
-1
-1.2
-1.4
-1.6
-1.8 U=1, β=200, t=0.5

ED
CTQMC
-2
0 2 4 6 8 10
iω
0
ED
CTQMC
-0.02 U=6, β=200, t=0.5
-0.04
-0.06
-0.08
G(iω)
-0.1
-0.12
-0.14
-0.16
-0.18
0 2 4 6 8 10
iω
图 3.8: 单带 Hubbard 模型的虚频格林函数 G(iω)。分别使用了严格对角化杂质求解器与基于段表示算

法的强耦合展开杂质求解器。上图为金属态，下图为绝缘态，相关计算参数均标注在图上。
-0.2
-0.4
-0.6
G(iω)
-0.8
-1
-1.2
U=1, β=8.00, t=0.5, 3 band
CTQMC
HFQMC
-1.4
0 20 40 60 80 100
iω
-0.05
-0.1
G(iω)
-0.15
-0.2
-0.25
U=4, β=10.0, t=0.5, 3 band
CTQMC
HFQMC
-0.3
0 20 40 60 80 100
iω
图 3.9: 三带 Hubbard 模型的虚频格林函数 G(iω)。分别使用了 Hirsch-Fye 量子蒙特卡洛杂质求解器与

基于段表示算法的强耦合展开杂质求解器。上图为金属态，下图为绝缘态，相关计算参数均标注在图上。
0.1
U/t=0
U/t=3
0.09 U/t=4
U/t=5
0.08 βt = 100
0.07
0.06
p(k)
0.05
0.04
0.03
0.02
0.01
0
0 10 20 30 40 50 60 70 80 90
order k
图 3.10: 图形微扰展开项的阶数分布。研究系统为单带半满 Hubbard 模型，半圆态密度。
0.8
hours
0.6
0.4
0.2 U=4.0, J=1.0, β=100, t=0.5, 20+10 cycles
2 4 6 8 10 12 14
number of orbitals
图 3.11: 段表示算法的计算效率。研究系统为多带半满 Hubbard 模型，半圆态密度，相关的计算参数

均标注在图上。
3.3 段表示算法: 电声相互作用与动态屏蔽效应 49
3.3 段表示算法: 电声相互作用与动态屏蔽效应
段表示算法被发明之后，由于它的原理相对较为简单，程序实现难度相对较小，并且性能优越，稳定
性好，因此获得了广泛的应用。P. Werner 等人随后将段表示算法推广至 Holstein-Hubbard 模型 63 以
及动力学屏蔽模型 64 中。
3.3.1 Holstein-Hubbard 模型算法
在超导材料物理中，电子 − 声子耦合起着至关重要的作用。对于传统的超导材料，其电声相互作用
可以用经典的 Migdal-Eliashberg 理论加以描述: 电子对于声子的作用是重整化声子振荡频率 ω0 ，声子
对于电子的作用是增加电子的有效质量。对于非传统超导材料，例如高温超导体材料，声子与强关联电
子的相互作用至今仍缺乏一个有效的理论来加以描述。P. Werner 及 A. J. Mills 发展了基于段表示算法
的强耦合展开量子蒙特卡洛杂质求解器 63 ，这样可以在动力学平均场的框架内考虑声子与强关联电子的
相互作用问题。
考虑如下的 Holstein-Hubbard 模型:

∑ ∑ ∑ † ∑ †
H = −t c†iσ ciσ + [U ni↑ ni↓ − µ(ni↑ + ni↓ )] + λ (bi + bi )(ni↑ + ni↓ − 1) + ω0 bi bi , (3.51)
i,σ i i i
其中 U 表示在位相互作用， i 为格点指标， µ 为化学势， c† 和 c 是电子的产生算符与消灭算符， n 为

电子占据数算符。 b† 和 b 是 Einstein 声子的产生算符与消灭算符，声子振荡频率为 ω0 ，电声耦合常数
为 λ。在动力学平均场的理论框架内，Holstein-Hubbard 模型被自洽映射为一个量子杂质模型 HQI (参
见公式 (1.14))，其中杂质项 Hloc 的表达式如下所示:
Hloc = −µ(n↑ + n↓ ) + U n↑ n↓ + λ(n↑ + n↓ − 1)(b† + b) + ω0 b† b. (3.52)
杂化项 Hhyb 与环境项 Hbath 的表达式分别如下所示:

∑
Hhyb = (Vp,σ c†σ ap,σ + Vp,σ
∗
cσ a†p,σ ), (3.53)
p,σ
∑
Hbath = p a†p,σ ap,σ . (3.54)
p,σ
参数 Vp,σ 与 p 由动力学平均场方程自洽决定。
如果我们不考虑电声相互作用，那么 Hloc 仅仅张开一个很小的 Hilbert 空间，且仅仅具有唯一的

能标 U ；如果引入电声相互作用项，那么将要增加新的能标 ω0 ，并且需要扩大 Hilbert 空间，包含
bosonic sector4 。在早期的研究中，要么采用半经验的方法处理 boson 态，要么对 bosonic Hilbert
4 其中含有无穷多个态。
空间做截断，仅仅考虑有限的态。但是半经验的处理无法正确描述电子质量重整化或者是超导性质，而
截断方法的计算量仍然过于庞大，要获得稍为可靠的计算结果，计算量的增长令人难以承受。
我们已经知道，将配分函数按照杂化项进行图形展开，然后采用蒙特卡洛方法进行随机抽样，将能够
获得高效可靠的杂质求解器 61,62 ，那么对于 Holstein-Hubbard 模型，也可以采用类似的方法进行处理。
将环境电子态 ap,σ 积分出去，那么对于第 n 阶5 的图形微扰展开项，其抽样权重可以表示为:
∫β ∏
ω({Oi (τi )}) = Trc hTτ e− 0
dτ Hint (τ )
O2n (τ2n )...O2 (τ2 )O1 (τ1 )ib dτ1 ...dτ2n (detM−1
σ )sσ . (3.55)
σ
其中 Oi (τi ) 是编时的杂质电子的产生与消灭算符。 sσ 为符号参量，对于自旋为 σ 的算符，如果第一个

算符为产生算符，那么 sσ 的值为 1，否则为 -1。矩阵元 (M−1 0
σ )i,j = ∆σ (τσ,i − τσ,j )，由杂化函数决定:
∑ |Vp,σ |2
∆σ (−iωn ) = . (3.56)
p
iωn − p
为了计算公式 (3.55) 中的 trace 因子 h...ib , 我们需要利用 Lang-Firsov 变换。首先定义新的算符 X

与P
b† + b
X = √ , (3.57)
2
b† − b
P= √ , (3.58)
i 2
那么 eiPX0 定义了一个幺正变换，其中
√
2λ
X0 = (n↑ + n↓ − 1). (3.59)
ω0
将该幺正变换作用于杂化项，将会得到
ω0 2
H̃loc = eiPX0 Hloc e−iPX0 = −µ̃(ñ↑ + ñ↓ ) + Ũ ñ↑ ñ↓ + (X + P 2 ). (3.60)
2
显而易见， H̃loc 不再显式地包含电声耦合项，它不过是 Hubbard 模型的一个变种，化学势与相互作用

强度可重新定义为:
λ2
µ̃ = µ − , (3.61)
ω0
2λ2
Ũ = U − . (3.62)
ω0
并且产生算符与消灭算符也被变换为如下形式:
†
λ
−b) †
c̃†σ = e ω0 (b cσ , (3.63)
†
c̃σ = e− ω0 (b −b)
λ
cσ . (3.64)
5 含有 n 个产生算符以及 n 个消灭算符。
声子部分对于图形权重 (参见 (3.55) 式) 的贡献可以写为如下的形式:
ωb ({Oi (τi )}) = hes2n A(τ2n ) ...es1 A(τ1 ) ib , (3.65)
其中 0 ≤ τ1 < ... < τ2n < β, si = ±16 , 并且算符 A 的定义式为:
λ ω0 τ †
A(τ ) = (e b − e−ω0 τ b). (3.66)
ω0
在自由 boson 子的热平衡态下求平均值，声子部分对微扰展开图形权重的贡献项为:

  
λ2
/ω 2 ∑ { }
ωb ({Oi (τi )}) = exp − βω0 0 n(eβω0 + 1) + si sj eω0 (β−(τi −τj )) + eω0 (τi −τj )  . (3.67)
e −1
2n≥i>j≥1
因此总的图形权重可以化简为如下形式:
ω({Oi (τi )}) = ωb ({Oi (τi )})ω̃hubbard ({Oi (τi )}). (3.68)
其中 ω̃hubbard 为变换后的 Hubbard 模型7 的权重。除了图形权重的计算公式略有不同，本算法与经

典的段表示算法完全一样。因此应用此算法，我们可以在不做任何 Hilbert 空间截断的情况下，对
Holstein-Hubbard 模型开展计算，该算法的复杂度与 Hubbard 模型基本一致。
3.3.2 动态屏蔽效应算法
在强关联电子系统中，可以用低能有效哈密顿量来描述关联电子轨道的局域化行为。Coulomb 相
互作用 U 是这些低能有效哈密顿量最重要的参数之一， U 的主要作用就是抑制局域占据数的涨落。一
般而言， U 并非一个固定的常数，关联轨道上的电子密度涨落会诱发电场，电子间相互作用受到其
余自由度的屏蔽作用，最终会导致一个具有频率依赖性的重整化。利用无规相位近似 (random phase
approximation, RPA) 可以定量研究屏蔽效应的大小 102,103 。人们发现，在许多体系中屏蔽效应的影响
十分显著。例如对于稀土元素 Gd， U (ω) 从 6.5 演化至 17 eV，相应的频率变化仅为 0 ∼ 3 eV。对于金
属 Ce，如果频率 ω 从 0 变化至 4 eV，那么 U (ω) 将从 3.5 变化至 7 eV。在动力学平均场方法框架内，
一般情况下，强关联效应被认为是由瞬时相互作用 (instantaneous interaction) 诱导的效应，很少考虑
动态屏蔽效应，也就是说完全忽略 U 的频率相关性，将其处理为一个与频率无关的参数。采取这个近似
其实是出于无奈，因为传统的量子杂质模型求解器都不能很好地处理随频率变化的相互作用项8 。最近，
P. Werner 与 A. J. Millis 等人 64 在段表示算法的基础上提出了一种新的算法，可以严格地处理动态屏蔽
效应，本小节将简要地介绍这种算法。
6 当第 i 个算符为产生算符时等于 1，否则等于 -1。
7 不包含声子，化学势与相互作用分别变为 µ̃ 与 Ũ 。
8 对于 Hirsch-Fye 量子蒙特卡洛杂质求解器而言，若要处理动态屏蔽效应，那么 Ising 附加场将变得十分复杂，数量急剧增
加；对于严格对角化，重整化群等基于哈密顿量的量子杂质求解器而言，为了描述动态屏蔽效应须得引入许多额外的 bosonic
modes，使得 Hilbert 空间变得非常的大，在数值上难于处理。
考虑动态屏蔽效应时，系统哈密顿量为 H = Hband + Hint + Hscr ，其中 Hint 为传统的相互作用项，

Hscr 表示动态屏蔽效应的贡献。采用作用量的理论形式，动态屏蔽效应对有效作用量的贡献为:
∫
1
SW = dτ dτ 0 N (τ )W (τ − τ 0 )N (τ 0 ). (3.69)
2
其中 N 为杂质电子占据数， W (τ ) 为屏蔽函数，实际上它描述了 U 的频率依赖性，

∫ ∞
dω 0
W (τ ) = =W (ω 0 )B(ω 0 , τ ), (3.70)
0 π
cosh[(τ − β2 )ω 0 ]
B(ω 0 , τ ) = 0 ， (3.71)
sinh[ ω2β ]
=W (ω 0 ) 为屏蔽谱函数 (screening spectral function)。经过冗长的数学推导，Werner 等人发现 64 ，与
作用量公式 (3.69) 等价的哈密顿量 Hscr 具有类似于公式 (3.52) 所描述的形式。因此仿照 Holstein-
Hubbard 模型的段表示算法，他们提出了针对动态屏蔽效应的段表示算法。
类似地，在动态屏蔽效应的段表示算法中，化学势与相互作用被重新定义为:
∫ ∞
dω 0 =W (ω 0 )
µscr = µ + , (3.72)
0 π ω0
∫ ∞
dω 0 =W (ω 0 )
Uscr = U + 2 . (3.73)
0 π ω0
那么对于一个 n 阶的图形，假设产生算符与消灭算符按照时序依次排列，满足 0 ≤ τ1 < τ2 < · · · < τ2n <
β 关系，那么动态屏蔽效应部分对于图形权重的贡献为:
 
∑
ωscr ({O(τi )}) = exp  si sj K(τi − τj ) , (3.74)
2n≥i>j≥1
其中 si 的定义与上一小节中的一致: 第 i 个算符是产生算符是为 1，否则为 -1。双积分推迟作用函数

K(τ ) 的定义如下: ∫ ∞
dω 0 ImW (ω 0 )
K(τ ) = [B(ω 0 , τ ) − B(ω 0 , 0)] . (3.75)
0 π ω 02
因此总的图形权重可以化简为如下形式:
ω({Oi (τi )}) = ωscr ({Oi (τi )})ω̃hubbard ({Oi (τi )}) (3.76)
其中 ω̃hubbard 为变换后的 Hubbard 模型9 的权重。显而易见，动态屏蔽效应的段表示算法最关键之处为

K(τ ) 函数。原则上说，对于实际材料，首先需要通过无规相近似方法 102,103 确定屏蔽谱函数 =W (ω 0 )，
然后再利用公式 (3.75) 计算出 K(τ )。但是对于模型研究而言，我们可以用一些特殊的模型模拟屏蔽谱
函数，常用的模型有 plasmon pole 模型以及 ohmic 模型。plasmon pole 模型抓住了 Gd、SrVO3 等
材料中屏蔽谱函数的主要特征，而 ohmic 模型则抓住了顺磁态金属 Ni 的屏蔽谱函数的主要特征。
9 不包含动态屏蔽效应部分，化学势与相互作用分别变为 µ̃scr 与 Ũscr 。
plasmon pole 模型
=W (ω) = −λ2 π[δ(ω − ω 0 ) − δ(ω + ω 0 )]. (3.77)
2λ2 ω 0
<W (ω) = . (3.78)
ω 2 − ω 02
2λ2
Ũ = U − . (3.79)
ω0
[( ) ] ( 0)
λ2 cosh
β
2 − τ ω 0 − cosh βω
2
K(τ ) = − 02 ( 0) . (3.80)
ω sinh 2βω
plasmon pole 模型的控制参数为 λ 与 ω 0 。
ohmic 模型
=W (ω) = −απω. (3.81)

ωc + ω
<W (ω) = αωln − 2αωc . (3.82)
ωc − ω
Ũ = U − 2αωc . (3.83)
 ( )
πτ
sin β
K(τ ) = αln 1 + βωc . (3.84)
π
ohmic 模型的控制参数为 α 与 ωc 。
3.3.3 程序测试
我们在narcissus项目中实现了这两种算法 (参见图3.1与表3.1)，本小节主要测试这两种算法的可靠
性。
图3.12给出了用段表示算法研究单带 Holstein-Hubbard 模型时的图形微扰展开项的阶数分布 p(k)，
由图可见增大电声耦合常数 λ 会轻微地增加计算量，该图与文献中报道的图完全一致 63 。
在动态屏蔽效应的影响下，系统的杂质谱函数会发生明显的改变，主要表现是改变了金属 − 绝
缘体相变的边界，准粒子峰的权重；一部分谱权重会向高频区域迁移。图3.14与图3.13分别给出利用
plasmon pole 模型与 ohmic 模型的研究结果，计算结果与文献中 64 报道的结果吻合得很好。
0.08
U/t = 6 λ/t = 0.0
0.07 λ/t = 0.2
λ/t = 0.4
0.06 λ/t = 0.6
0.05
U/t = 4
p(k)
0.04
0.03
0.02
0.01
0
20 40 60 80 100 120 140
perturbation order k
图 3.12: 图形微扰展开项的阶数分布 p(k)。研究对象为单带半满 Holstein-Hubbard 模型，半圆态密度。
0.25
ω0=1
ω0=2
ω0=4
0.2 ω0=8
ω0=16
Spectral function
0.15
0.1
0.05
0
0 1 2 3 4 5 6 7
Frequency (eV)
图 3.13: 动态屏蔽效应影响下的杂质谱函数 A(ω)。研究对象为单带半满 Hubbard 模型，半圆态密度，

t = 0.5。 K(τ ) 函数所用模型为 ohmic model。固定 U = 8， Uscr = 3。系统的温度参数为 β = 50。
0.3
λ=2.5
λ=3.2
0.25 λ=3.4
λ=3.5
λ=3.6
0.2
Spectral function
0.15
0.1
0.05
0
0 1 2 3 4 5 6 7
Frequency (eV)
0.25
ω0=1
ω0=2
ω0=4
0.2 ω0=8
ω0=16
Spectral function
0.15
0.1
0.05
0
0 1 2 3 4 5 6 7
Frequency (eV)
图 3.14: 动态屏蔽效应影响下的杂质谱函数 A(ω)。研究对象为单带半满 Hubbard 模型，半圆态密

度， t = 0.5。 K(τ ) 函数所用模型为 plasmon pole model。在上图中， U = 10， ω 0 = 3；在下图中，
U = 8， Uscr = 3。系统的温度参数为 β = 50。
3.4 广义矩阵算法
在第3.2节与第3.3节介绍的量子杂质求解器都是基于段表示算法的，它们仅仅适用于具有密度 − 密
度相互作用形式的系统。如果是具有广义相互作用的系统，我们需要应用广义矩阵算法，它是段表示算
法的自然推广 58,62,66 。本节将简要介绍广义矩阵算法的一般原理以及实现技巧。
3.4.1 图形表示
如果系统具有广义相互作用，也就是说，局域哈密顿量 Hloc 包含对跃迁以及自旋翻转项，具有旋转

不变性 (参见公式 (1.25))，那么此时的配分函数微扰展开项的图形表示将不再具有段表示这样简单的形
式。亦即同一轨道的产生算符/消灭算符无须成对交替出现，唯一的约束是中间态的总占据数不能小于
0，也不能大于名义总电子数。图3.15是典型的广义相互作用系统配分函数微扰展开项的图形表示。图中
展示的是一个多带系统的典型图形配置，一共有 10 个算符，微扰展开的阶数为 5 阶，用不同的颜色区
分不同的轨道 (flavor)，产生算符用实心圆圈表示，而消灭算符用空心圆圈表示。
.0 . .β
图 3.15: 广义矩阵算法中配分函数微扰展开项的图形表示。图中不同的颜色代表不同的 flavor，实心圆

圈代表产生算符，空心圆圈代表消灭算符。
那么根据图形量子蒙特卡洛算法的精神，我们需要利用 Markov 链随机行走技术动态产生许许多多

类似的图形配置，计算其对于配分函数的贡献。假设我们已经拥有如同图3.15所示的图形配置，那么产
生新的图形配置的三种基本操作如下:(1) 首先任意挑选一条 flavor，然后动态选定产生算符以及消灭算
符在虚时间轴上的位置 τs 与 τe 10 ，将算符插入到相应的位置，这个操作使得微扰展开项的阶数增加 1。
(2) 首先任意选定一条 flavor，然后在其中任意选择一个产生算符与消灭算符，记录它们在虚时间轴上的
位置 τs 与 τe ，将它们删除，这个操作使得微扰展开项的阶数减少 1。如果此 flavor 没有任何算符存在，
那么放弃此操作。(3) 首先任意选定任意一条 flavor，然后在其中任意选择一个产生算符或者消灭算符，
左右移动此算符的位置，移动的边界为左右两个最近邻算符所处的位置，这个操作并不会改变微扰展开
项的阶数。如果此 flavor 没有任何算符存在，那么放弃此操作。通过简单的推导，我们可以得到上述三
种基本更新操作的蒙特卡洛抽样接受概率。
(1) 插入一对同属于一个 flavor 的产生算符与消灭算符的蒙特卡洛抽样接受概率为:
[( )2 ]
β Fnew Dnew
Padd = min ,1 . (3.85)
(k + 1) Fold Dold
(2) 删除一对同属于一个 flavor 的产生算符与消灭算符的蒙特卡洛抽样接受概率为:

[( ) ]
2
k Fnew Dnew
Premove = min ,1 . (3.86)
β Fold Dold
10 唯一的限制是在选定的点上没有别的算符存在，不要求新插入的产生算符与消灭算符必须相邻。
3.4 广义矩阵算法 57
(3) 左右移动产生算符或者是消灭算符的蒙特卡洛抽样接受概率为:
[ ]
Fnew Dnew
Pmove = min ,1 . (3.87)
Fold Dold
在上面三式中， k 代表当前图形配置所对应的微扰展开项的阶数，简而言之，就是图形中究竟有几
对算符。 F 实际上就是 ωloc ，代表 trace 因子部分对图形权重的贡献。 D 实际上就是 ωdet ，代表行列
式部分对于图形权重的贡献。在广义矩阵算法中， ωdet 的计算方法与段表示算法毫无二至 66 ，但是 ωloc
的计算方法就大有不同了。
3.4.2 本征表象
本小节讨论在广义矩阵算法中如何具体计算 ωloc 。 ωloc 的定义式在上文已经给出 (参见公式 (3.18))，

为了方便起见，这里重新给出 ωloc 的基本定义式如下：
[ ]
ωloc = Trd e−βHloc T dbk (τk )d†b0 (τk0 )...db1 (τ1 )d†b0 (τ10 ) . (3.88)
k 1
在相互作用表象中，算符随时间变化，
O(τ ) = eHloc τ Oe−Hloc τ , (3.89)
其中 O 算符可代表任意产生算符 d† 或者消灭算符 d。将公式 (3.89) 代入到公式 (3.88) 中，经过简单的

变换可以得到:
[ ]
ωloc = Trd Kloc (β − τk )dbk Kloc (τk − τk0 )d†b0 · · · db1 Kloc (τ1 − τ10 )d†b0 Kloc (τ10 − 0) , (3.90)
k 1
其中 Kloc (τ ) 为时间演化算符，其定义为:
Kloc (τ ) = e−τ Hloc . (3.91)
我们通常在 Hloc 的本征表象中计算 ωloc 。在 Hloc 的本征表象中，时间演化算符 Kloc (τ ) 实际上是一个

对角矩阵，而算符 d† 与 d 则是非对称的实矩阵。那么根据公式 (3.90) 计算 ωloc 实际上就是将若干个矩
阵依次连续乘在一起，最后得到一个矩阵，对其求迹 (也就是将对角元加起来)，即可得到我们所需要的
结果，这就是 ωloc 的基本计算方法。
3.4.3 核心算法
在广义矩阵算法中，计算 ωloc 并不如想象中那么简单。在典型的计算中，至少有 80% ∼ 95% 的时

间是消耗在计算 ωloc 上。实际上如何快速计算 ωloc 因子是广义矩阵算法最为核心的内容，也是我们迫切
需要解决的关键问题。考虑某个随机产生的图形配置，有 5 对产生算符与消灭算符 (如图3.15所示)，那
么在公式 (3.90) 中，我们至少需要计算 20 次矩阵 − 矩阵乘法。如果这是一个二带的系统，那么矩阵的
大小为 16 × 16，如果这是三带的系统，那么矩阵的大小为 64 × 64，如果这是五带的系统，那么矩阵的
.0 . .β
.A .B .C .D
.0 .β
图 3.16: 广义矩阵算法中" 分而治之" 策略的图形表示。
大小为 1024 × 1024，如果这是七带的系统，那么矩阵的大小将达到惊人的 16384 × 16384。可见随着系

统的增大，相应的计算量以及对存储的需求将呈指数型增长。而且，如果体系的温度比较低，那么当蒙
特卡洛抽样算法达到平衡时，相应的微扰展开项的阶数会比较高，也就是说，我们需要计算更多的矩阵
乘法，计算量将进一步增长。因此我们必须另辟蹊径，寻找高效的计算 ωloc 因子的方法。
在利用公式 (3.90) 做矩阵乘法计算时，有两个技巧可以应用:(1) 首先， Kloc (τ ) 在本征表象下是对角

矩阵；(2) 其次， d 与 d† 算符在本征表象下是稀疏矩阵，稀疏度大致在 10% 左右。利用这两个技巧，
那么广义矩阵之间的乘法将转化为对角矩阵与稀疏矩阵之间的乘法，这样计算量将大大减少。除此之
外，快速计算 ωloc 因子还可以利用如下两种办法:(1) 第一种办法是利用 N 、 Sz 等好量子数将局域哈密
顿量 Hloc 划分为不同的子空间，然后对子空间进行对角化， d† 与 d 算符在此本征表象下将变为块对角
形式的稠密矩阵，那么原始的广义矩阵乘法就简化为这些矩阵 block 之间的乘法，计算量同样被大大减
少了 66 。以三带系统为例，最大的矩阵 block 是 9 × 9 的小矩阵，这比原始的 64 × 64 的矩阵小了很多，
计算效率的提高十分可观。采纳此办法之后，应用广义矩阵算法可以十分有效地处理三带以内 (含三带)
的系统。(2) 第二种办法是所谓的" 分而治之" 的策略。其核心要点是将 [0, β) 均分为 m 段 (如图3.16所
示)，每段都包含了若干个算符，分段计算矩阵乘法，将计算结果存储起来。如果图形配置发生了改变，
那么首先判断是那一段发生了变化，重新计算此段的矩阵乘积，并保存起来，其它各段可以不必理会，
最后计算各段的总乘积即可。图3.16中的图形配置被均匀分为 A、B、C、D 四段，每段包含了 2 ∼ 4 个
算符不等。那么 ωloc = Tr[MA MB MC MD ]，其中 MA 表示 A 段内所有矩阵的乘积，其余符号可以类推。
设若往 B 段新插入一个消灭算符，往 D 段新插入一个产生算符，那么我们首先需要更新 MB 与 MD 的
值，然后再计算 ωloc 的值。如果 m 的取值比较合适的话，那么此方法也可以极大地减少计算量。简单
√
的数学推导可以证明:m 的最优取值正比于 k，其中 k 表示微扰展开的平均阶数。我们的程序采用了上
述第二种算法计算 ωloc ，实践证明，对于三带及三带以下的系统，此算法若再配合稀疏矩阵与对角矩阵
等技巧将在计算效率上完胜第一种计算方法，对于三带以上的系统则是第一种方法占优，不过此时我们
又有了另一种更为强大的武器了。
3.4.4 程序测试
我们在begonia项目与lavender项目中实现了这个算法 (参见图3.1与表3.1)。应用广义矩阵算法能够
研究多带 Hubbard 模型中十分丰富的物理现象，比如说具有轨道选择性的 Mott 相变。具有轨道选择
性的 Mott 绝缘体 − 金属相变 (orbital selective Mott transition, OSMT)，是多带 Hubbard 模型所特
有的一种物理现象 45,104,105 。它的含义是：由于某些原因，系统的对称性发生破缺，能带之间不再简并。
随着 Coulomb 相互作用的增加，系统的部分能带由金属态变为 Mott 绝缘体，而其余的能带仍然保持
金属相，这样的状态被称为 OSMP 相。当 Coulomb 相互作用继续增加到某个临界值，余下的能带也将
发生金属 − 绝缘体相变，此时整个体系都将进入 Mott 绝缘体相。
图3.17给出了二带 Hubbard 模型的虚时格林函数 G(τ )。采用半圆态密度，这两条能带的带宽不一

样， t2 /t1 = 2。在模型的局域相互作用项中，除了密度 − 密度相互作用项之外，还包含了自旋翻转项与
对跃迁项，并且 Jz = Js = Jp = U /4。当 βt = 100 时，我们计算此模型的虚时格林函数。我们发现当
U /t1 = 4 时，两条能带都处于金属态，但是当 U /t2 = 6 时，窄带将变为绝缘相，而宽能带仍保持金属
相。这说明当 U /t1 自 4 增加至 6 时，体系发生了具有轨道选择性的 Mott 金属 − 绝缘体相变，窄的能
带比宽的能带更易于转变为绝缘相。图3.18给出了两带 Hubbard 模型的准粒子权重 Zα 随 U 的变化趋
势， Zα > 0 说明能带处于金属相， Zα = 0 说明能带处于绝缘项。由图显然可见，宽窄两条能带显然不
是同时发生金属 − 绝缘体相变的，在一个很大的区域内窄能带已经是绝缘体了，但是宽能带仍然是金属
态。
对于二带 Hubbard 模型而言，发生 OSMT 的机制已经被研究得十分清楚了，主要得到了以下结论:

(1) 带宽不同是诱发 OSMT 的主要原因，晶体场劈裂的因素并不重要。(2) 在 Hubbard 模型的局域哈密
顿量中，自旋翻转项的作用十分关键，如果没有自旋翻转项，那么 OSMP 相的存在区域会非常的小。有
了自旋翻转项，可以在一个相当大的区域内维持 OSMP 相 45,104 。对于三带 Hubbard 模型而言，相应的
金属 − 绝缘体相图要比两带的情形复杂得多，而且带宽差异不再是诱发 OSMT 的决定性因素了，取而
代之的是由晶体场劈裂导致的能带劈裂以及 Hund 交换作用项 J 74,105 。为了加深对三带 Hubbard 模型
中 OSMT 的驱动机制的理解。我们使用动力学平均场理论系统地研究了总占据数为 4 的三带 Hubbard
模型的相图。晶体场劈裂将这三条能带分为两组，一组是单重简并，称之为 a1g 轨道，另一组是双重简
并，称之为 e0g 轨道。系统的态密度为半圆态密度，半带宽为 1，并以之为能量单位。系统温度固定为
β = 200, 我们采用广义矩阵算法作为杂质求解器，计算了此三带 Hubbard 模型的 U − ∆ 相图。
首先考虑具有旋转不变性的局域哈密顿量， J/U = 0.25，计算所得到的 U − ∆ 相图如下图3.19所示。

首先来看右半轴， a1g 轨道在上， e0g 轨道在下。当晶体场劈裂并不大时，系统首先处于金属态，随着 U
的增加，电子自 e0g 轨道流向 a1g 轨道，最终达到 (3,1) 的配置11 ，并保持稳定不变，与此同时，由于 a1g
轨道为半满，率先进入到 Mott 相，而 e0g 轨道为 3/4 填充，仍保持金属相不变。当 U 继续增大至 9.5
11 (3,1) 配置的含义是:e0g 轨道上的占据数为 3，而 a1g 轨道上的占据数为 1，(4,0) 与 (2,2) 配置的含义可以依此类推。
1
U/t1 = 4
U/t1 = 6
0.1
-G(τ)
0.01
0.001
0 0.2 0.4 0.6 0.8 1
τ/β
0.25
U/t1 = 4
U/t1 = 6
0.2
narrow band
0.15
p(ka)
0.1 wide band
0.05
0
0 10 20 30 40 50
ka
图 3.17: 上图为两带 Hubbard 模型的虚时格林函数 G(τ )，下图为相应的微扰展开项的阶数分布 p(k)。

采用半圆态密度， t2 /t1 = 2， βt1 = 100。
1
narrow band
0.9 wide band
0.8
0.7
Quasiparticle weight Z
0.6
0.5
0.4
0.3
0.2
0.1
0
0.5 1 1.5 2 2.5 3 3.5 4
Coulomb interaction U
图 3.18: 两带 Hubbard 模型的准粒子权重 Zα 随 Coulomb 相互作用强度 U 的变化。采用半圆态密度，

t2 /t1 = 2， βt1 = 100。
时， e0g 轨道也进入绝缘体相，此时的电子配置仍为 (3,1)。如果晶体场较大，那么当 U 值较小时，电子

不易从 e0g 轨道流向 a1g 轨道，电子配置为 (4,0)， e0g 轨道为全占据， a1g 轨道为空占据。此时体系也是
绝缘体，不过不是 Mott 绝缘体，而是能带绝缘体。接下来看左半轴的情况， a1g 轨道在下， e0g 轨道在
上。当晶体场劈裂较小时， U 值也较小时，体系为金属相，无统一的电子配置，当 U 逐步增加时， a1g
与 e0g 轨道同时发生相变，变为特殊的 Mott 相 (实际上是 Mott 绝缘体与能带绝缘体的组合体)，此时电
子配置为 (2,2)。如果晶体场劈裂较大时，电子很难在 a1g 与 e0g 轨道之间流动，因此 a1g 轨道是全填满
的， U 值小时它是能带绝缘体， U 值大时它还是能带绝缘体。而 e0g 轨道是半满的， U 值小时它是金
属， U 值大时是 Mott 绝缘体。
其次考虑具有 SU(N ) 对称性的局域哈密顿量, J = 0.0, 计算所得到的 U − ∆ 相图如下图3.19所示。首

先看右半轴， a1g 轨道在上， e0g 轨道在下，只有两个相: 金属与能带绝缘体相。随着 U 值的增加，显然
不再有 OSMT 的发生，自然也不存在 OSMP，这意味着 Hund 交换作用项 J 是诱发 OSMT 的先决条
件 105 。再看左半轴， a1g 轨道在下， e0g 轨道在上。这时的相图与上一个相图的情况比较类似，不同之
处是 (2,2)Mott 相的区域被大大压缩了。
我们还深入研究了不同相的局域磁矩，发现 Mott 相与 OSMP 相总是倾向于保持高自旋态，而金属

态与能带绝缘体态总是倾向于保持低自旋态。OSMT 总是伴随着高自旋 − 低自旋相变。由图3.19可见，
在 (4,0) 能带绝缘体相，由于电子完全配对，因此磁矩趋于 0。而在纯金属相或者是金属 + 能带绝缘体
相，由于存在少量未成对电子，因此体系处于低自旋态。在 (2,2)Mott 相，(3,1)OSMP 相，(3,1)Mott
12
(3,1) Mott Insulator
10
Coulomb Interaction U
6 (2,2) Mott phase (3,1) OSMP
(2,2) (4,0)
Metal + Band Insulator Metal Metal Band Insulator
0
-3 -2 -1 0 1 2 3
Crystal Field Splitting ∆
7
6 (2,2) Mott phase
5
Coulomb Interaction U
2 (2,2) Metal + Band Insulator (4,0) Band Insulator
1
Metal Metal
0
-3 -2 -1 0 1 2 3
Crystal Field Splitting ∆
图 3.19: 三带 Hubbard 模型的 U − ∆ 相图，总电子数目固定为 4。 ∆ 的定义为 ∆ = ∆1 − ∆2 (∆1 6=

∆2 = ∆3 ，表示各能带的晶体场能级)。(上图) 局域哈密顿量具有旋转不变性， J/U = 0.25。(下图) 局域
哈密顿量具有 SU(N ) 对称性， J = 0.0。(3,1) 表示 e0g 轨道的电子占据数为 3， a1g 轨道的电子占据数
为 1，(2,2) 与 (4,0) 的含义雷同。Metal+Band Insulator 表示 e0g 轨道为金属相，而 a1g 轨道为能带绝
缘体相。Mott phase 表示 e0g 轨道为 Mott 绝缘体，而 a1g 轨道为能带绝缘体。深橙色区域代表高自旋
区域，粉红色区域代表低低自旋区域。
12
β=40
β=100
10
Coulomb interaction U (eV)
8 Insulator
2 Metal
0
0 0.2 0.4 0.6 0.8 1 1.2
λ
1.0
j=3/2
j=1/2
0.8 λ=0.5
0.6
|G(β/2)|
0.4
0.2
1 2 3 4 5 6 7 8 9 10
U (eV)
图 3.20: 含自旋轨道耦合作用的三带 Hubbard 模型的 U − λ 相图。系统的总电子数固定为 4，半圆态

密度，三条能带的带宽相同， t = 0.5， λ 为自旋轨道耦合作用常数。(上图) 当 β = 40 与 β = 100 时的
金属 − 绝缘体相图；(下图) 当 β = 40， λ = 0.5 时 |G(τ = β/2)| 随 U 的变化趋势，图中所有的量都用
U = 1.0 时的值重新标度了，箭头表示金属 − 绝缘体相变点。
相，因为都存在 2 个未成对电子，因此系统显然处于高自旋态。
利用此广义矩阵算法版本的 CT-HYB 杂质求解器还能研究包含着自旋 − 轨道相互作用项的模型。

我们利用此杂质求解器配合旋转不变性的 Gutzwiller 方法系统地研究了含自旋 − 轨道耦合项的三带
Hubbard 模型的 U − λ12 相图。与上面的测试例子一样，局域相互作用包含自旋翻转项与对跃迁项，
Jz = Js = Jp = U /4。总占据数被限定为 4，同样采用半圆态密度，半带宽为 1，但是完全忽略晶体场劈
裂的作用也就是说 ∆ = 0。在自旋轨道耦合项的作用下，这三条能带被劈裂为 4 重简并的 jeff = 3/2 态
以及两重简并的 jeff = 1/2 态。我们使用广义矩阵算法版本的 CT-HYB 杂质求解器在动力学平均场理论
的框架下计算了此模型的 U − λ 相图，结果如图 3.20所示。由图可见，自旋轨道耦合作用大大地增强了
关联作用的效果，随着 λ 的增大，发生金属 − 绝缘体相变所需要的 Uc 也大大地减小了。从图3.20中还
可以看出， jeff = 3/2 与 jeff = 1/2 这两组能带是同时发生金属 − 绝缘体相变的，并没有轨道选择性的
Mott 相变发生。
3.5 广义矩阵算法:Krylov 算法与 Newton-Leja 算法
应用第3.4节介绍的广义矩阵算法求解三带杂质模型的效率还算可以，但是若要求解五带杂质模型或
者是七带杂质模型，除非在 Hilbert 空间做截断近似 66 ，否则计算效率很低，甚至于无法进行计算。而
这截断近似是不可控的，很难预估其对于计算精度，物理结论的影响。这极大地限制了广义矩阵算法的
应用范围。因为对于真实的强关联电子材料，能够用三带杂质模型描述的毕竟是少数，大部分材料还是
需要五带杂质模型 (适用于 3d、 4d 或者是 5d 电子体系) 甚或是七带杂质模型 (适用于 4f 或者 5f 电子
体系) 进行描述。
Krylov 子空间迭代算法 65 属于广义矩阵算法的一个变种，它的计算效率很高，能够在比较合理的时

间范围内求解五带杂质模型或者是七带杂质模型。体系越大，其相对于原始广义矩阵算法的优势也就越
大。我们发明的 Newton-Leja 多项式插值算法则是在 Krylov 算法的基础上继续发展而来，它的计算效
率比 Krylov 算法更高，在某些情况下能高若干个数量级。本节主要介绍 Krylov 子空间迭代算法以及
Newton-Leja 多项式插值算法的基本原理以及应用实例。
3.5.1 Fock 表象
正如本征表象是广义矩阵算法的基础，Fock 表象是 Krylov 算法以及 Newton-Leja 算法的基础。本

小节首先介绍为什么要选用 Fock 表象。
原始广义矩阵算法在本征表象下计算微扰展开图的权重 ωloc (参见公式 (3.18))，而 Krylov 子空间迭

代算法与 Newton-Leja 多项式插值算法则是在 Fock 表象，也就是占据数表象下计算 ωloc :
∑ [ 0
]
ωloc = VmT ...O0 e−(τ −τ )Hloc Oe−τ Hloc Vm , (3.92)
m
12 λ 为自旋 − 轨道耦合强度。
3.5 广义矩阵算法:Krylov 算法与 Newton-Leja 算法 65
其中 Vm 为 Hloc 的第 m 个本征矢，而 O 则代表在占据数表象下的 d 或者是 d† 算符。算法的大致流程

如下: 首先任意选择一个本征态 Vm ，自右至左依次用时间演化算符 e−∆τ Hloc 以及产生或者湮灭算符 O
交替作用上去，直至最左端，末态与 VmT 作内积，所得结果就是这第 m 个本征态对于 ωloc 的贡献。依
次遍历所有的本征态，即可求出最终的 ωloc 。
无论是选用本征表象还是占据数表象，根据公式 (3.18) 与公式 (3.92) 计算得到的 ωloc 必须是严格相

等的。这里之所以选择占据数表象，主要是基于以下考虑:(1) 算符 O 在占据数表象中的稀疏程度远比其
在本征表象中要高，亦即非零矩阵元要少很多。以五带系统为例，一共 210 = 1024 个态，算符 O 的总
矩阵元超过 1000000 个，如果是在本征表象下，那么非零元有 100000 个左右，而若是采用占据数表
象，那么非零元仅有 500 个左右，相差近 20 倍。如果是七带系统，那么在稀疏度方面的差距还会急剧
增大。因此采用占据数表象不但能提高计算效率，还大大减轻了数据存储方面的压力。(2)Krylov 子空间
迭代算法与 Newton-Leja 多项式插值算法都有的共通部分就是: 求某个态矢量 V 在算符 O 作用之后所
得到的末态矢量 V 0 ，亦即:
V 0 = OV. (3.93)
由于算符 O 在占据数表象下非常稀疏，上式在数学上实际就是一个稀疏矩阵与矢量的乘法问题，那么我
们可以利用非常成熟的稀疏矩阵技术解决这个问题。(3) 在本征表象中 e−∆τ Hloc 是一个对角阵，在占据
数表象中，它虽然不再是对角矩阵，但是 Hloc 仍然是非常稀疏的实对称矩阵。为了利用这一点，我们并
不是直接计算 e−∆τ Hloc ，而是计算
V 0 = e−∆τ Hloc V. (3.94)
对于后者，在工程计算上已经有了非常成熟高效的解决方案，例如在本节中将要介绍的 Krylov 子空间

迭代算法与 Newton-Leja 多项式插值算法。
3.5.2 Krylov 子空间迭代算法
正如上文所述，在占据数表象下计算 ωloc 必须要解决的两个技术问题就是如何处理产生或者湮灭算

符以及时间演化算符对于任意态矢量的作用。前一个问题可用稀疏矩阵与矢量的乘法解决，后一个问题
则存在不同的解决方案。Krylov 子空间迭代算法与 Newton-Leja 多项式插值算法的主要区别就在于如
何计算 e−∆τ Hloc V 。本小节首先介绍 Krylov 子空间迭代算法，第 3.5.3小节则介绍 Newton-Leja 多项
式插值算法，而第3.5.4小节则起程序测试的作用。
Krylov 子空间迭代算法的基本原理如下 65 : 假设 A 为 N × N 的大矩阵, 且 v 为给定的单位长度的态

矢, ||v|| = 1，那么通过 Arnoldi 算法13 可以产生一组正交基 Vm = [v1 , ..., vm ]，相应的 m 维 Krylov 子空
间 Km = span(v, Av, ..., Am−1 v) 以及 m × m 的 Hessenberg 矩阵 Hm ，其中
Hm = VmT AVm . (3.95)

13 如果 A 为对称矩阵则使用 Lanczos 算法，如果为广义矩阵则使用 Arnoldi 算法。
假设 f (A) 为任意关于 A 的矩阵函数，那么在数学上可以证明:
f (A)v ' Vm f (Hm )e1 , (3.96)
此处 ei 为 Rm 中的第 i 个单元矢量。那么我们令 f (z) = exp (z)，并且 A = −∆τ Hloc ，那么不难得到:
e−∆τ Hloc v ' Vm eHm e1 . (3.97)
由于 Hloc 在占据数表象中是一个实对称稀疏矩阵，那么我们可以使用 Lanczos 算法替换 Arnoldi 算法，

这样可以节约近一半的时间。并且我们发现，在 Lanczos 或者是 Arnoldi 迭代算法中，仅需迭代很少的
几步就能达到收敛，换言之，Krylov 子空间的维度 m 很小14 ，Hessenberg 矩阵 Hm 实际上是一个很
小的矩阵。那么，我们就将一个大矩阵的指数函数计算 e−∆τ Hloc 转化为对一个小矩阵的指数函数计算
eHm ，此举极大地减少了计算量，这就是 Krylov 子空间迭代算法的精髓。
那么余下的问题就是如何快速有效地计算 Hessenberg 矩阵的指数函数 eHm 。由于 Hm 的维度很

小，因此处理起来还是比较方便的。传统的方法就是对角化 Hessenberg 矩阵 Hm ，
T
Hm = Um Em Um , (3.98)
其中 Um 与 Em 分别为相应的本征矢与本征值，那么有
eHm = Um eEm Um
T
. (3.99)
由于 eEm 为对角矩阵，因此不难最终求出 eHm 。这种计算方法虽然看起来直截了当，比较简单，但是实

际上计算效率并不是很高。实际上我们通常使用所谓的 (p, q)-Páde 近似方法计算 eHm 。在 (p, q)-Páde
近似方法中，矩阵指数函数 eA 可以表示为:
Npq (A)
eA = Rpq (A) = . (3.100)
Dpq (A)
其中
∑
p
(p + q − j)!p!
Npq (A) = Aj , (3.101)
j=0
(p + q)!j!(p − j)!
以及
∑
q
(p + q − j)!q!
Dpq (A) = (−A)j . (3.102)
j=0
(p + q)!j!(q − j)!
p 与 q 是控制参数，令 p = q 时计算效率最高。 p(或者)q 的大小控制着数值精度，在我们的程序中，如

令 p = q = 6，相应的数值精度可达到 10−15 。
至此已经解决了 Krylov 子空间迭代算法所涉及的所有技术问题，下面我们归纳一下利用 Krylov 子

空间迭代算法计算某个图形 ωloc 的主要计算流程 65 。在前处理阶段:(1) 对角化 Hloc ，获取本征态与本
征值。结果可以保存下来，如果 Hloc 没有被修改，那么无须再次对角化。对角化方法可以选择精确对
14 m 在通常情况下小于等于 2。
角化，获取完整的本征值谱，也可以使用 Lanczos 或者是 Arnoldi 算法，仅仅获取基态的信息。(2) 在

Hloc 的本征值谱中，挑选合适的态，舍弃不合适的态。所谓的" 合适" 与否并无一个通用的标准，要依
具体问题而定。比如说可以仅仅保留基态，丢弃所有的激发态等等。在核心阶段:(3) 在保留下来的本征
态中，任取一个态矢量，用第一个时间演化算符去作用它，由于这个态矢量是 Hloc 的本征态，所以在这
一步实际上就是计算一个对角矩阵。(4) 使用产生算符或者是消灭算符 O 作用在这个新产生的态矢上，
在这一步需要利用稀疏矩阵与矢量的乘法技术。(5) 使用下一个时间演化算符作用在新产生的态矢上，由
于此时的态矢量已经不再是 Hloc 的本征态了，时间演化算符将不再是一个对角阵。在这一步我们需要利
用上述的 Krylov 算法计算 e−∆τ Hloc v(参见公式 (3.97))。(6) 如果还有产生算符或者是消灭算符 O 存在，
那么回到步骤 (4)，如果没有那么进入步骤 (7)。(7) 利用最终获得的态矢量与最初的本征态做内积，内
积结果加总到 ωloc 上。(8) 回到步骤 (3)，选取下一个本征矢量继续进行计算，直至所有被保留的本征矢
量都被遍历为止。最后得到的 ωloc 就是我们所需要的值。
在上述计算流程中，有两处地方我们做了近似。首先是在步骤 (2)，我们可以完全丢弃掉所有的激发
态，这样做能够大大地削减计算量。这个截断近似在温度比较低时是成立的，但是在高温区域须慎重处
理，我们在第3.5.4小节将仔细讨论这个问题。其次是在步骤 (5)，我们利用公式 (3.97) 来近似计算时间
演化算符作用在任意态矢上。严格地说，公式 (3.97) 只是近似成立，但是这个近似值对真实值的逼近程
度完全由 Krylov 子空间的维数 m 所决定。从理论上说，我们只需增大 m，计算值总会无限逼近真实值。
在 Lanczos/Arnoldi 迭代算法的每一步，我们都会使用精细的误差控制技术以确保计算精度在 10−12 的
量级，因此在这方面也无须过多担心。
对于三带以及三带以上的广义相互作用模型，已经证明 Krylov 子空间迭代算法的计算效率远远优于

传统的广义矩阵算符。我们可以利用 Krylov 子空间迭代算法在可接受的时间内计算五带模型。但是对于
七带模型，虽然已经有了很大的提高，但是 Krylov 子空间迭代算法的计算效率仍然是比较令人失望，因
此我们需要更强有力更为高效的杂质求解器，那就是基于 Newton-Leja 多项式插值算法的 CT-HYB 杂
质求解器。
3.5.3 Newton-Leja 多项式插值算法
由我们独立提出的基于 Newton-Leja 多项式插值算法的强耦合展开连续时间量子蒙特卡洛杂质求解

器其思路与前述的 Krylov 子空间迭代算法基本一致。都是在占据数表象下将 d†α 以及 dα 算符表示出
来，充分利用它们的稀疏特性，将它们作用在态矢上，让态矢向左侧传播。但是新算法的核心部分是利
用基于 Leja 点序列的 Newton 多项式插值方法计算实对称稀疏矩阵 Hloc 的时间演化算符 (也就是说计
算 exp(−τ Hloc ))，而不是利用传统的 Krylov 子空间迭代算法。我们的新算法继承了 Krylov 子空间迭代
算法的所有优点，但是在计算效率以及内存消耗上却要明显优于 Krylov 算法，因此我们的算法很有可
能取代 Krylov 子空间迭代算法的位置。
如何快速求解局域哈密顿量 Hloc 的时间演化算符作用在任意给定的态矢上 (亦即 exp(−τ Hlov )|νi)，

是强耦合展开杂质求解器的基本组成部分之一。我们注意到高效求解如 exp(τ A)v 以及 ϕ(τ A)v 形式的
矩阵指数函数是工程数学中所谓的" 指数积分器" 的重要组成部分，由于需求的牵引，这个研究领域在最

近受到很多关注。此处 A ∈ Rn×n , v ∈ Rn , τ 为任意的时间步, 并且
exp(z) − 1
ϕ(z) = . (3.103)
z
在这个领域，大部分的研究者都以 Krylov 方法为首选的计算方法。但是除此之外，还有一大类基于多项

式插值的算法也可用于解决此问题。这类方法要么是直接利用矩阵 A 的本征值谱对矩阵指数函数进行插
值，要么是对其进行近似处理。在应用这类型多项式插值算法之前，我们必须对矩阵 A 的本征值边界有
个粗略的估计。虽然多项式插值算法的应用范围没有 Krylov 算法那么广，但是它在很多情况下可以与
Krylov 算法一较高下，例如大尺度广义稀疏非对称矩阵的指数函数就十分适合使用多项式插值算法进行
计算。
在这一大类的多项式插值算法当中，基于 Leja 点序列的 Newton 多项式插值算法最近受到很多

的关注 (关于 Newton 多项式插值算法以及 Leja 点序列的背景介绍，请分别参考附录A.4与附录A.3)。
Newton-Leja 多项式插值算法的基本原理如下: 任意给定一个广义矩阵 A 以及一个广义矢量 v, Newton
多项式插值方法将此指数传播子 (exponential propagator) 近似表为
ϕ(τ A)v ∼ pm (τ A)v, (3.104)
式中 m 是多项式展开的阶数， pm (z) 为变量 ϕ(z) 的 Newton 插值多项式，插值点为实数 Leja 点序列

{ξk }。这些 Leja 点序列被定义在包含着矩阵 A 本征值谱的复平面的一个紧集上，以保证多项式插值的
收敛性。上式右端的具体计算表达式为:
∑
m
pm (τ A)v = dj Ωj v, (3.105)
j=0
其中
∏
j−1
Ωj = (τ A − ξk I). (3.106)
k=0
此处 I 为单位阵， dj 为变量 ϕ(z) 相应的区域差分 (divided differences)。我们注意到一旦通过计算得

到了 ϕ(τ A)，那么根据
exp(τ A)v = τ Aϕ(τ A)v + v. (3.107)
即可得到 exp(τ A)v 这个我们所要求的量。因此在具体的实现中，我们都是选择对函数 ϕ(τ A) 应用

Newton-Leja 多项式插值算法，这样做更为简便一些。
将广义矩阵 A 替换为 −Hloc ，将广义矢量 v 替换为态矢 |νi，新算法的实质是利用 Newton 插值方

法在 Leja 点序列上对矩阵指数函数 exp(−τ Hloc )|νi 进行插值计算 (亦即利用公式 (3.104)-(3.107)) 106 。
这些 Leja 点定义在某个椭圆的两个焦点之间，假设为 [α, β]，此椭圆完全包含了局域哈密顿量 −Hloc 的
本征值谱。本算法之所以要在 Leja 点序列上进行插值是因为: 只要这个椭圆符合上述要求，那么利用公
式 (3.104) 进行插值计算，插值函数保证能够稳定快速地收敛至真实的函数。在数学上已经严格证明了
如下的误差公式，这是 Newton-Leja 插值方法的基石之一:

1/m
lim sup ||ϕ(A)v − pm (A)v||2 = 0. (3.108)
m→∞
在实际的计算中，极关键的一步是要评估 −Hloc 矩阵的本征值谱，确定其边界范围，在复平面中定出包

含其所有本征值的最小的椭圆来，再进一步确定椭圆的左右焦点 [α, β]，然后在此区域内产生实数 Leja
点序列。通常应用著名的 Gershgorin 定理来确定矩阵的本征值范围，这样做的计算开销是最小的。
Newton-Leja 多项式插值算法的完整计算流程与上文所述的 Krylov 子空间迭代算法基本上大同小
异，在前处理流程处，需要补充这样一步: 应用 Gershgorin 定理估计矩阵 −Hloc 的本征值谱，确定
[α, β] 区间，在此区间内利用快速 Leja 点 (fast Leja points, FLPs) 算法 107 产生一系列的实数 Leja 点
{ξk , k = 0, ..., m − 1}。根据我们的测试结果，Newton 多项式插值的平均阶数在 m ∼ 15 左右，因此产
生 64 个实数 Leja 点足以保证 Newton-Leja 多项式插值算法拥有非常优秀的收敛性能。除此之外，在
核心计算流程的第 5 步还需稍作改动，此时我们利用公式 (3.104) 计算时间演化算符作用在任意态矢上
的结果，而非使用公式 (3.97)。
Newton-Leja 多项式插值算法是非常简单并且高效的, 该算法的时间复杂度与 Krylov 子空间迭代算
法十分相似 65 ，此处不再深入分析了。根据公式 (3.105) 以及公式 (3.106), 此算法完全避免了矩阵之间
的乘法, 最重要的数值运算便是稀疏矩阵与矢量之间的乘法。而且 Newton 多项式的展开系数完全是递
归计算的，因此所需的存储空间以及计算开销都非常的小，这是 Krylov 子空间迭代算法所无法比拟的。
不难推测，Newton-Leja 多项式插值算法在处理大尺度问题时对 Krylov 子空间迭代算法具有压倒性的
优势，关于这一点在文献中已经有所证明 106 。此外，Newton-Leja 算法非常适合被并行化。传统的做
法是并行化蒙特卡洛抽样的过程，应用多个 Markov 链同时进行随机行走。那么对于 Newton-Leja 算
法，还可以进行更进一步的细粒度的平行化。那就是在第 (3)∼(7) 步应用 OpenMP 多线程技术对不同
的本征态矢量进行并行化，每个线程负责计算一个本征态矢量的演化传播，最后将所有线程的计算结果
加总起来。进一步利用 CUDA-GPU 技术加速 Newton-Leja 多项式插值算法是目前正在进行的非常有
意义的研究工作。在下一小节，我们将着重讨论 Newton-Leja 多项式插值算法的性能与可靠性。
3.5.4 程序测试
我们在camellia项目与epiphyllum项目中各自实现了 Krylov 子空间迭代算法，后者支持 OpenMP

多线程并行技术，在pansy项目与manjusaka项目中实现了 Newton-Leja 算法，后者支持 OpenMP 多
线程并行技术 (参见图3.1与表3.1)。本小节主要讨论这两种算法之间的效率差异。
同 Krylov 子空间迭代算法类似，Newton-Leja 多项式插值算法同样也可以利用截断近似以提高计算
效率 65 。也就是说在计算 ωloc 时，可以只计及部分本征态的贡献，而将剩余部分抛弃。对角化局域哈密
顿量 Hloc 所得到的全部本征态中，如果只保留基态，那么称之为 O(1) 级别的截断近似，如果除了基态
外，还保留第一激发态，那么称之为 O(2) 级别的截断近似，其余截断近似可以依次类推。
首先考察 Newton-Leja 多项式插值算法在不同截断近似下的可靠性。以三带半满 Hubbard 模型
为例，采用半圆态密度， t = 0.5，应用广义相互作用形式， U = 2.0， J = U /4， β = 10。我们使用
Exact
Leja, O(1)
Leja, O(2)
0.1
-G(τ)
0.01
0 0.05 0.1 0.15 0.2 0.25
τ/β
图 3.21: 三带半满 Hubbard 模型的虚时格林函数 G(τ )。采用半圆态密度， t = 0.5， β = 10 以及

U = 2.0。严格解是使用传统的广义矩阵算法计算得到的。在 O(1) 近似中，仅仅考虑基态的贡献，而在
O(2) 近似中，除了基态之外，还包含了第一激发态的贡献。
Newton-Leja 多项式插值算法计算了此模型的虚时格林函数 G(τ )，计算结果如图3.21所示。图中的严

格值是使用传统广义矩阵算法所得到的计算结果。由图可见， O(1) 级别的截断近似与严格值有相当的
偏差，但是 O(2) 级别的截断近似基本上与严格值一致。对于此三带模型，总的本征态数目为 64 个，
O(1) 近似考虑其中 4 个态， O(2) 近似考虑其中 12 个态。可见截断近似能大大地减少计算量，但是在
高温区域， O(1) 级别的截断近似会带来较大的误差。
在图3.22中给出了更为细致的比较结果。首先考虑了固定温度为 β = 30，改变 Coulomb 相互作用

强度 U 的情况。很明显， U 越大，采用 O(1) 近似所得到的计算结果与严格值符合得越好。这很容易
解释， U 值越大，本征值谱中的能级差也就越大，系统很难跃迁至激发态，只能更多地停留在基态，
仅仅考虑基态贡献的 O(1) 近似自然表现得很好，反之亦然。然后考虑了固定 Coulomb 相互作用强度
U = 4.0，然后改变系统温度从 β = 10 到 β = 40 的情况。由图可见，温度越低， β 越大， O(1) 近似的
效果就越好。Werner 等人提出了一个判断标准 65 ，只要系统温度小于带宽的 1%，就可以只保留基态的
贡献，本文的计算结果再次验证了这一标准。
下面证明对于多带模型 Newton-Leja 多项式插值算法的计算效率要远高于 Krylov 子空间迭代算法。

由于这两种算法的内核都是如何计算时间演化算符 exp(−∆τ Hloc )|νi，其中 ν 为任意矢量， ∆τ 为时间
演化的步长，那么我们就着重比较这两种算法在计算此指数函数时的计算效率。我们首先限定测试对象
为具有广义相互作用形式的多带 Hubbard 模型，能带数目 N = 1 ∼ 7， U = 4.0， J/U = 0.25，利用
0.5
Exact, U=2.0
Leja, O(1), U=2.0
Exact, U=4.0
0.4
Leja, O(1), U=4.0
Exact, U=6.0
Leja, O(1), U=6.0
0.3
-G(τ)
0.2
0.1
0
0 0.02 0.04 0.06 0.08 0.1
τ/β
0.5
Exact, β=10
Leja, O(1), β=10
Exact, β=20
0.4
Leja, O(1), β=20
Exact, β=30
Leja, O(1), β=30
0.3 Exact, β=40
Leja, O(1), β=40
-G(τ)
0.2
0.1
0
0 0.02 0.04 0.06 0.08 0.1
τ/β
图 3.22: 三带半满 Hubbard 模型的虚时格林函数 G(τ )。采用半圆态密度， t = 0.5，广义相互作用形

式， J = U /4。(上图) 固定温度 β = 30，改变相互作用强度 U 。(下图) 固定相互作用强度 U = 4.0，改
变温度参数 β。图中的严格解由传统的广义矩阵算法给出。
100000
Leja, ∆τ = 0.5
10000 Krylov, ∆τ = 0.5
Leja, ∆τ = 5.0
1000 Krylov, ∆τ = 5.0
100
# Seconds per operation
10
0.1
0.01
0.001
0.0001
1e-05
1e-06
1 2 3 4 5 6 7
# Orbitals
1000
Leja, m=64
Krylov, p=16
Krylov, p=32
Krylov, p=64
100
# Seconds per operation
10
0.1
0.5 1 1.5 2 2.5 3 3.5
∆t
图 3.23: Krylov 子空间迭代算法与 Newton-Leja 多项式插值算法计算效率的比较。以时间演化算符

exp(−∆τ Hloc )|νi 的平均计算时间为比较标准。初始态矢量 |νi 是随机产生的。(上图) 多带局域哈密
顿量 Hloc 具有旋转不变性，其基本参数为 U = 4.0， J/U = 0.25。时间演化步长 ∆τ = 0.5 或者是
∆τ = 5.0，分别对应于短时间步长与长时间步长这两种典型情况。在 Newton-Leja 算法中，Leja 点数
目的上限为 64，Krylov 子空间的维数上限同样被限制为 64。图中的彩色区域代表 Newton-Leja 算法占
优的区域。(下图) 考虑五带广义相互作用系统， U = 4.0, J/U = 0.25，化学势 µ 满足半满条件。当时间
演化步长 ∆τ > 3.5 时, 利用 Krylov 子空间迭代算法基本上很难得到收敛的解。
3.6 正交多项式表象与内核多项式表象 73
这些参数构造局域哈密顿量，然后假定 ∆τ = 0.5 或者 ∆τ = 5.0 这两种情况，初始态矢量 |νi 是随机产

生的。分别利用 Newton-Leja 算法与 Krylov 算法反复计算此指数函数 1000 次，然后取其平均，比较
它们的计算效率。在 Newton-Leja 算法中，Leja 点数目的上限为 64 个，Krylov 子空间的维数上限同
样被限制为 64。最终比较结果如图3.23所示。如图可见，当能带数目小于或者等于 4 时，Krylov 子空
间迭代算法稍稍占优，当能带数目大于 4 时，Newton-Leja 多项式插值算法明显占优。例如对于五带系
统， ∆τ = 5.0 时，Newton-Leja 算法要比 Krylov 算法快了将近一个数量级。对于七带系统， ∆τ = 5.0
时，Newton-Leja 算法要比 Krylov 算法快近四个数量级。对于时间演化步长比较短的情况 ∆τ = 0.5，
Newton-Leja 算法也要优于 Krylov 算法。
我们再重点关注五带模型，固定 U = 4.0， J/U = 0.25，化学势 µ 满足半满的条件， |νi 是随机产生

的，时间演化步长 ∆τ = 0.0 ∼ 3.5，再次比较 Newton-Leja 多项式插值算法与 Krylov 子空间迭代算法
的计算效率。在 Newton-Leja 多项式插值算法中，Leja 点数目的上限被设为 64。在 Krylov 子空间迭
代算法中，Krylov 子空间维数的上限设为 16、32、64 三档。比较结果如图3.23所示。由图可见，在绝
大部分区域中 Newton-Leja 算法的计算效率都是占优的。对于 Krylov 算法而言，在短时间步长区域，
Krylov 子空间维数上限小的情况占优，在长时间步长区域，Krylov 子空间维数上限高的情况占优。与
Krylov 子空间迭代算法相比较，Newton-Leja 算法的一个突出优点就是它在数值上十分稳定，Newton
多项式平均展开至 10 ∼ 15 阶左右就能达到收敛，与系统尺寸大小或者是时间演化步长关系不大，因此
Newton-Leja 算法对于五带以及五带以上的系统能展现出无与伦比的优势。而 Krylov 子空间迭代算法
则受制于自身的数值稳定性，一方面，通过 Lanczos 或者是 Arnoldi 步骤构造出来的 Hessenberg 矩阵
Hm 常常是病态的，无法用 (p, q)-Páde 近似方法计算其指数函数。另一方面，随着模型的增大以及时间
演化步长的增加，需要迅速增加 Krylov 子空间的维数才能在有限的迭代次数内收敛，如果 Krylov 子空
间维数受限，那么必定需要很多次迭代才能获得收敛解甚至是根本不收敛，无论是那种情况，都意味着
计算时间以及计算资源耗费的增加。此消彼长之下，Krylov 算法不如 Newton-Leja 算法也就在情理之
中了。
3.6 正交多项式表象与内核多项式表象
本节主要讨论如何应用正交多项式表象 100 与内核多项式表象 101 来改善连续时间量子蒙特卡洛杂质

求解器的测量部分。强耦合展开连续时间量子蒙特卡洛杂质求解器目前还存在着不少的技术问题，之所
以需要引入正交多项式与内核多项式技术，主要是基于以下的考虑:(1) 杂质求解器输出的虚时杂质格林
函数噪声较大，对后续的解析延拓操作十分不利，为了达到可接受的数值精度，必须大大增加蒙特卡洛
抽样次数，这在很大程度上抵消了连续时间量子蒙特卡洛杂质求解器在速度上的优势。(2) 杂质求解器输
出的虚频杂质格林函数以及自能函数在高频区域震荡很强噪声巨大 69,70 。这对于动力学平均场自洽计算
而言影响不大，但是对于系统总能量计算的影响却很大，这是因为系统总能的计算强烈依赖于格林函数
与自能函数的高频展开系数。在密度泛函理论结合动力学平均场方法计算中，系统总能是一个关键的计
算结果，这个问题变得尤为重要。(3) 单点动力学平均场理论需要处理的对象是单粒子物理量 (例如杂质
格林函数以及自能函数)，但是无论是在动力学平均场的各种扩展 (例如对偶费米子方法 15 ，动力学顶角

近似 16 等等) 中，还是在输运性质、磁化系数等物理量的计算中，双粒子物理量都起着十分关键的作用。
这些双粒子物理量都有多个独立的指标 (如 τ ， ω 等等)，通常是非常巨大的多维数组，无论是存储、操
作还是分析都十分耗时，因而针对这些双粒子物理量采用更为紧凑有效的表象无疑是十分必要的。
正交多项式与内核多项式方法就是解决上述问题的灵丹妙药。这两种方法的核心要点是将格林函数，
自能函数用正交多项式或者内核多项式展开，那么蒙特卡洛杂质求解器的测量对象就变为正交多项式或
者是内核多项式的展开系数。这些展开系数的个数通常小于 100 个，因而测量效率较之原始方法要高得
多。在程序的最后，使用解析的表达式可以从展开系数直接重构格林函数、自能函数等观测量。正交多
项式或者是内核多项式的作用其实就两个方面:(1) 作为噪音过滤器，过滤掉虚时格林函数、虚频格林函
数以及自能函数的噪声。(2) 作为一种紧凑的表象可以大大减少高阶关联函数的操作存储难度，提高计
算效率。Lewin Boehnke 等人 100 首先提出可以利用 Legendre 正交多项式表象来改善单粒子格林函数
以及双粒子格林函数的测量效率。Hartmut Hafermann 等人 108 接着提出利用 Legendre 正交多项式
来改进自能函数以及顶角函数的测量方法。我们推导了当正交多项式为 Chebyshev 多项式时的相关公
式，并且独立开发了相应的程序。测试结果表明，采用 Chebyshev 正交多项式的计算结果略优于采用
Legendre 正交多项式的计算结果。正交多项式虽然能大幅度地改善格林函数、自能函数的测量精度以
及测量效率，但是还存在着不小的技术障碍，例如 Gibbs 振荡问题 101 。我们经过研究发现，如果采用
内核多项式表象，那么在继承正交多项式表象优点的基础上，还能够基本消除 Gibbs 振荡问题，结论是
内核多项式表象要远优于正交多项式表象。
3.6.1 Legendre 正交多项式算法
在数学上，正交多项式序列指的是序列中任意两个多项式是彼此正交的。经典常用的正交多项式
有 Hermite 多项式、Laguerre 多项式、Jacobi 多项式等等，以及它们的特例 Gegenbauer 多项式、
Chebyshev 多项式以及 Legendre 多项式。从原理上说，这些多项式都是可用的，但是考虑到正交关系
式的复杂程度，唯有 Chebyshev 多项式以及 Legendre 多项式才是比较好的选择。本小节首先介绍采
用 Legendre 多项式时的基本测量公式，然后在第3.6.2小节介绍采用 Chebyshev 多项式时的基本测量
公式。
首先考虑定义在虚时间轴 [0, β] 上的单粒子虚时格林函数 G(τ )，其中 β 代表反温度。利用定义在

[−1, 1] 区间内的 Legendre 多项式 Pn (x) 将 G(τ ) 展开得到:
1 ∑√
G(τ ) = 2n + 1Pn [x(τ )]Gn , (3.109)
β
n≥0
n 为 Legendre 多项式的阶数， Gn 为 Legendre 多项式的展开系数， x(τ ) 为映射函数，将 [0, β] 区间

内的 τ 映射为 [−1, 1] 区间内的 x，
2τ
x(τ ) = − 1. (3.110)
β
利用 Legendre 多项式的正交关系 (参见附录A.5)，我们很容易得到 Legendre 多项式展开系数 Gn 的表

达式: ∫
√ β
Gn = 2n + 1 dτ Pn [x(τ )]G(τ ). (3.111)
0
在强耦合展开连续时间量子蒙特卡洛杂质求解器 (CT-HYB) 中，虚时格林函数 G(τ ) 的测量公式为:

* k k +
1 ∑∑
G(τ ) = − Mji ∆(τ, τi − τj ) ,
˜ e s
(3.112)
β i=1 j=1


δ(τ − τ 0 ), τ0 > 0
˜ τ 0) =
∆(τ, (3.113)

−δ(τ − τ 0 − β), τ 0 < 0.
将上述两式代入到公式 (3.111) 中，不难得到 Gn 的实际计算公式:

√ * k k +
2n + 1 ∑ ∑
Gn = − Mji P̃n (τi − τj ) ,
e s
(3.114)
β i=1 j=1


Pn [x(τ )], τ >0
P̃n (τ ) = (3.115)

−Pn [x(τ + β)], τ < 0.
下面我们来考虑虚频格林函数 G(iωm )15 ， ωm 为 matsubara 频率点。众所周知， G(iωm ) 与 G(τ )

之间通过 fourier 变换相互联系: ∫ β
G(iωm ) = dτ eiωm τ G(τ ), (3.116)
0
∞
1 ∑ −iωm τ
G(τ ) = e G(iωm ). (3.117)
β m=−∞
那么将 G(τ ) 的 Legendre 多项式展开式 (参见公式 (3.109)) 代入到公式 (3.116) 中可有:

∫ β
1 ∑√ ∑
G(iωm ) = 2n + 1Gn dτ eiωm τ Pn [x(τ )] = Tmn Gn . (3.118)
β 0
n≥0 n≥0
其中变换矩阵 T 的计算公式如下:
√ ∫ ( )
2n + 1 β iωm τ m n+1
√ (2m + 1)π
Tmn = dτ e Pn [x(τ )] = (−1) i 2n + 1jn . (3.119)
β 0 2
式中 jn (z) 为球 Bessel 函数。不难看出 Tmn 显然与 β 无关，因此可以在蒙特卡洛抽样测量之前提前算

好存储起来，这样可以大大提高程序的计算效率。
最后我们考虑 G(iωm ) 在高频区域的渐近行为。在高频区域，虚频格林函数可以用下式来表达:

∞
∑ ck
G(iωm ) = . (3.120)
(iωm )k
k=1
15 为了避免符号冲突，此处我们暂时将 ωn 代换为 ωm 。
-5
-10
-15
-20
βGn
-25
-30
-35
-40 U = 3.0, n odd

U = 3.0, n even
-45 U = 6.0, n odd
U = 6.0, n even
-50
0 5 10 15 20 25 30 35 40 45
order n
图 3.24: Legendre 多项式展开系数 Gn 。考虑半填满的单带 Hubbard 模型，半圆态密度，半带宽为

1.0，采用强耦合展开连续时间量子蒙特卡洛杂质求解器。图中显示了两种情况:(1) U = 3.0， β = 10.0；
(2) U = 6.0， β = 50.0。箭头表示 Gn 趋于 0 的位置。
ck 为展开系数。由于 Tmn 的高频展开式是已知的，因此我们可以直接给出 ck 的解析表达式。前三项的

ck 表达式如下所示:
√
∑
even
2 2n + 1
c1 = − Gn , (3.121)
β
n≥0
odd √
∑ 2 2n + 1
c2 = Gn n(n + 1), (3.122)
n>0
β2
√
∑
even
2n + 1
c3 = − Gn (n + 2)(n + 1)n(n − 1). (3.123)
β3
n≥0
综上所述，在蒙特卡洛抽样测量过程中，只需要根据公式 (3.114) 定出展开系数 Gn ，那么在后续

处理中，应用公式 (3.109)、公式 (3.118) 以及公式 (3.121 ∼ 3.123) 即可自如地计算出虚时格林函数
G(τ )、虚频格林函数 G(iωm ) 以及相应的高频渐近行为。
还剩下最后一个问题: 原则上说，用 Legendre 多项式展开格林函数可以有无穷多项，亦即 n → ∞，

但是实际上我们并不需要那么做。数值实验发现，当 n 增大时， Gn 将会快速地衰减趋向于 0，因
此我们可以设定一个截断参数 nmax ，当 n ≥ nmax 时，令 Gn = 0，仅仅只保留 n < nmax 时的 Gn 。
图3.24显示了典型的 Legendre 多项式展开系数 Gn 随 n 的演化情况。我们有如下发现:(1) 奇次项的展
开系数在数值精度内约等于 0，这是因为受到粒子 − 空穴对称性的约束。(2) 偶次项的展开系数前几项
较为可观，但是随着 n 的增大急剧衰减至 0。(3) 对于金属相16 而言， Gn 在 n > 10 处就十分接近于
16 对应于图中的 U = 3.0, β = 10.0 情形。
-0.005
normal
legendre
-0.01
-0.015
-0.02
G(τ)
-0.025
-0.03
-0.035
-0.04
-0.045
0.2 0.3 0.4 0.5 0.6 0.7 0.8
τ/β
图 3.25: Legendre 多项式展开测量虚时格林函数 G(τ )。考虑半填满的单带 Hubbard 模型，半圆态

密度，半带宽为 1.0，采用强耦合展开连续时间量子蒙特卡洛杂质求解器，抽样次数为 8 × 2 亿次。
U = 3.0， β = 10.0， nmax = 48。
0 了，因而 nmax 可大致设为 10 ∼ 15 之间。对于绝缘相17 而言， Gn 须至 n > 30 方才接近于 0，因而

nmax 可大致设为 30 ∼ 35 之间。可见，绝缘相所需要的正交多项式展开项要远高于金属相的，相应的计
算量也更大一些。 nmax 是一个可调参数，在实际计算中，必须精心选择 nmax 的值。 nmax 太小了固然
不好，会丢失掉很多信息，但是 nmax 也并不是越大越好。 nmax 很大时，一方面计算量会急剧增加，另
一方面， Gn 会体现出剧烈的振荡，将大量的噪声带入到最终的计算结果中，所谓的过犹不及即是指此。
那么应该如何确定 nmax 呢? 最简单的做法就是绘制 Gn − n 曲线图，当 Gn 趋于 0 时的 n 值即为 nmax
的合适取值。另一种做法是用所观测的物理量对 n 做图，例如 G(τ = β/2) − n 曲线图，随着 n 的增加，
此图中应该会出现一个平台区，由此平台区的位置即可定出 nmax 。蒙特卡洛抽样次数越多，抽样精度越
高，那么此平台区覆盖的范围就越大， nmax 取值的范围就越大。
Legendre 多项式展开算法的实际效果可参见图3.25。由图显而易见，如果使用传统的测量方法，即
使抽样次数足够的多，虚时格林函数的振荡还是十分厉害，而采用 Legendre 正交多项式表象的测量结
果则十分平滑，尤为适合进行后续的解析延拓操作。
3.6.2 Chebyshev 正交多项式算法
在上一小节，我们介绍了 Legendre 正交多项式表象在强耦合展开连续时间量子蒙特卡洛杂质求解器

中的应用。该方法在提出时只针对 Legendre 正交多项式做了推导 100 ，在本小节，我们将此方法推广至
Chebyshev 正交多项式。
17 对应于图中的 U = 6.0, β = 50.0 情形。
应用定义在 [−1, 1] 区间内的第二类 Chebyshev 多项式 Un (x) 将定义在 [0, β] 区间内的 G(τ ) 展开，
可以得到:
2∑
G(τ ) = Un [x(τ )]Gn . (3.124)
β
n≥0
如前所述， n 为 Chebyshev 多项式的展开阶数， Gn 为 Chebyshev 多项式的展开系数， x(τ ) 为映射

函数，其定义参见公式 (3.110)。利用 Chebyshev 多项式的正交关系 (参见附录A.6)，我们很容易得到
Chebyshev 多项式展开系数 Gn 的表达式:
∫ √
2 β
Gn = dτ Un [x(τ )] 1 − x(τ )2 G(τ ). (3.125)
π 0
将虚时格林函数 G(τ ) 的原始测量公式代入到上式中，不难得到 Gn 的实际计算公式:
* k k +
2 ∑∑ √
Gn = − Mji Ũn (τi − τj ) 1 − x̃(τi − τj ) ,
e s e s 2 (3.126)
πβ i=1 j=1


Un [x(τ )], τ >0
Ũn (τ ) = (3.127)

−Un [x(τ + β)], τ < 0,


x(τ ), τ >0
x̃(τ ) = (3.128)

x(τ + β), τ < 0.
综上所述，只要根据公式 (3.126) 求出 Chebyshev 多项式展开系数，那么根据公式 (3.124) 便可计算出

最终的虚时格林函数 G(τ )。十分遗憾的是，对于下述积分
∫ β
dτ eiωm τ Un [x(τ )]
0
目前尚无法获得解析的表达式，因而暂时无法通过 Chebyshev 正交多项式表象计算虚频格林函数

G(iωm ) 及其在高频区域的渐近行为，这无疑是 Chebyshev 正交多项式表象稍逊于 Legendre 正交多项
式表象之处。
下面我们来看 Chebyshev 多项式的展开系数 Gn ，典型的例子如图3.26所示。具体的分析与
Legendre 正交多项式表象的情况十分类似，都是奇次项没有贡献，偶次项的 Gn 随 n 的增大急剧衰减
至 0，就连 nmax 的大致位置都差不多。唯一的差别就是 Chebyshev 多项式的展开系数要比 Legendre
多项式的展开系数小很多。因此，在 Chebyshev 正交多项式表象中， nmax 的确定方法与在 Legendre
正交多项式表象中完全一致，此处就不再重复了。
Chebyshev 多项式展开算法的实际效果可参见图3.27。由图显而易见，如果使用传统的测量方法，
即使抽样次数足够的多，虚时格林函数的振荡还是十分厉害，而采用 Chebyshev 正交多项式表象的测
量结果则十分平滑，尤为适合进行后续的解析延拓操作。应用 Chebyshev 正交多项式表象的计算效
果与 Legendre 正交多项式表象的计算效果十分类似，无明显差别。换言之，若要计算虚时格林函数
G(τ )，使用这两种正交多项式均可，若是要计算虚频格林函数 G(iωm ) 及其相应的高频渐近行为，目前
只能选用 Legendre 正交多项式表象。
-1
-2
-3
βGn
-4
-5
-6
-7 U = 3.0, n odd
U = 3.0, n even
-8 U = 6.0, n odd
U = 6.0, n even
-9
0 5 10 15 20 25 30 35 40 45
order n
图 3.26: Chebyshev 多项式展开系数 Gn 。考虑半填满的单带 Hubbard 模型，半圆态密度，半带宽为

1.0，采用强耦合展开连续时间量子蒙特卡洛杂质求解器。图中显示了两种情况:(1) U = 3.0， β = 10.0；
(2) U = 6.0， β = 50.0。箭头表示 Gn 趋于 0 的位置。
-0.005
normal
chebyshev
-0.01
-0.015
-0.02
G(τ)
-0.025
-0.03
-0.035
-0.04
-0.045
0.2 0.3 0.4 0.5 0.6 0.7 0.8
τ/β
图 3.27: Chebyshev 多项式展开测量虚时格林函数 G(τ )。考虑半填满的单带 Hubbard 模型，半圆

态密度，半带宽为 1.0，采用强耦合展开连续时间量子蒙特卡洛杂质求解器，抽样次数为 8 × 2 亿次。
U = 3.0， β = 10.0， nmax = 48。
3.6.3 内核多项式算法
自从正交多项式表象算法被广泛应用于改善强耦合展开连续时间量子蒙特卡洛杂质求解器的测量精度
与测量效率以来，经过大量的数值实验，我们发现正交多项式表象算法还存在不少技术障碍。其中最严
重的问题就是所谓的 Gibbs 振荡现象 101 ，粗略地说，就是测量值围绕严格值呈现近周期性的振荡，对
于金属态，Gibbs 振荡现象尚不十分明显，而对于绝缘相，Gibbs 振荡现象十分明显，尤其是在 G(β)
与 G(0) 附近。Gibbs 振荡本质的起因是: 正交多项式展开本来是一个无穷的序列，而我们强制性地在
nmax 处进行截断，抛弃了剩余部分。其次，若是观测量函数并非连续可微，那么那些不连续的点或者是
奇点也会触发 Gibbs 振荡现象。对于绝缘相的虚时格林函数而言，典型的特征就是 τ = 0 与 τ = β 附近
十分陡峭，斜率的绝对值非常大，而底部却非常平坦，斜率非常接近于 0，这样的函数形式自然极易触
发 Gibbs 振荡。
1.2
1
integral kernel function f(x)
0.8
0.6
0.4
Dirichlet
Jackson
Lorentz
0.2 Fejer
Wang-Zunger
0
0 10 20 30 40 50 60
order
图 3.28: 内核多项式方法中所用的典型阻尼函数 fn 。内核多项式展开阶数限制为 64，对于 Lorentz 函

数， λ = 1.0，对于 Wang-Zunger 阻尼函数， α 与 β 参数分别设为 1.0 与 4.0。
Gibbs 振荡现象的解决之道就是采用内核多项式表象 101 。所谓的内核多项式表象其实非常简单，就

是在正交多项式展开系数上乘上一个阻尼项 fn 18 ，亦即 Gn → Gn fn 。在过去的 150 多年里，对于这
个问题已经有了很深入的研究，因此可以直接利用前人的研究成果。文献中报道的常用的阻尼函数如
表3.2与图3.28所示。特别地，当采用 Dirichlet 阻尼函数时，因为 fn ≡ 1，此时即退化至传统的正交多
项式表象。
18 在文献中有时亦被称为积分内核函数 (integral kernel function)。
表 3.2: 内核多项式方法中所用的典型阻尼函数 fn (N = 64)
函数名称函数形式参数范围

[ ]
Jackson 1
N (N − n + 1) cos( πn
N +1 ) + sin( πn
N +1 ) cot( π
N +1 ) 无
Lorentz sinh[λ(1 − n/N )]/ sinh(λ) λ∈R
Fejér 1 − n/N 无
[ ( ) ]
n β
Wang-Zunger exp − α N α, β ∈ R
Dirichlet 1 无
我们在上文所述的正交多项式表象的基础上，进一步考虑了不同的阻尼函数，应用这内核多项式表象
去改善强耦合展开连续时间量子蒙特卡洛杂质求解器的测量精度。测试结果表明，采用内核多项式表象
的测量精度在正交多项式表象的基础上又有了很大的改善，基本上消除了 Gibbs 振荡现象。在这几种内
核函数当中，Jackson 内核函数的效果是最好的。具体的测试结果请参考第3.6.4小节。
3.6.4 程序测试
10
Legendre, n odd
Legendre, n even
1 Chebyshev, n odd
Chebyshev, n even
0.1
β|Gn|
0.01
0.001
0.0001
1e-05
0 5 10 15 20 25 30 35 40 45
n
图 3.29: Legendre 与 Chebyshev 多项式展开系数 Gn 随 n 的变化趋势。计算参数请参考正文。粉红色

区域表示 Gn 在此区间内贡献很小。
由于正交多项式以及内核多项式算法与相互作用的形式关系不是太大，因此我们在许多项目中
-0.005
-0.006
-0.007
G(τ)
-0.008
-0.009
default
Dirichlet
Jackson
-0.01 Lorentz
Fejer Chebyshev
Wang-Zunger
-0.011
0.4 0.42 0.44 0.46 0.48 0.5 0.52 0.54 0.56 0.58 0.6
τ/β
-0.005
-0.006
-0.007
G(τ)
-0.008
-0.009
default
Dirichlet
Jackson
-0.01 Lorentz
Fejer Legendre
Wang-Zunger
-0.011
0.4 0.42 0.44 0.46 0.48 0.5 0.52 0.54 0.56 0.58 0.6
τ/β
图 3.30: Chebyshev 与 Legendre 正交多项式配合不同的阻尼函数对于虚时格林函数测量精度的影响。

上图:Chebyshev 正交多项式配合不同的阻尼函数。下图:Legendre 正交多项式配合不同的阻尼函数。
在图中虚时格林函数仅仅只显示了 τ /β ∈ [0.4 : 0.6] 的小区间，以更好地说明问题。具体计算参数请参阅
正文。
100
Legendre, n odd
Legendre, n even
10 Chebyshev, n odd
Chebyshev, n even
1
β|Gn|
0.1
0.01
0.001
0.0001
0 5 10 15 20 25 30 35 40 45
n
图 3.31: Legendre 与 Chebyshev 多项式展开系数 Gn 随 n 的变化趋势。计算参数请参考正文。粉红色

区域表示 Gn 在此区间内贡献很小。
(gardenia、narcissus、lavender、camellia、epiphyllum、pansy、manjushaka等，参见表3.1) 都实
现了正交多项式以及内核多项式算法。本小节主要提供了关于内核多项式表象算法的基本测试结
果。我们分金属相以及绝缘相两种情况进行测试，出于简单性的考虑，采用单带半满 Hubbard 模
型，半圆态密度，半带宽为 1.0。金属相时，基本参数为 U = 3.0， β = 10.0；绝缘相时，基本参数为
U = 6.0， β = 50.0。蒙特卡洛杂质求解器的抽样次数为 8 × 2 亿次，动力学平均场方法自洽迭代 20 次，
nmax = 48。下面来看主要的测试结果。
首先是金属相的计算结果。图3.29给出了 Legendre 与 Chebyshev 多项式展开系数 Gn 随 n 的演

化趋势。显而易见，当 n = 10 ∼ 15 时， |Gn | → 0。金属态时的虚时格林函数 G(τ ) 十分平滑，因而仅
需很少的展开项就能拟合得很好。在图3.30中分别比较了 Chebyshev 正交多项式以及 Legendre 正交
多项式配合不同的阻尼函数对于虚时格林函数测量精度的影响。由该图可以看出，传统的测量方法会
带来极大的数据涨落，测量精度较差；采用纯粹的 Legendre 或者 Chebyshev 正交多项式方法有轻微
的 Gibbs 振荡；Fejér 与 Lorentz 阻尼函数的结果与期望值有系统性的偏离；Wang-Zunger 阻尼函数
与 Legendre 正交多项式配合时效果不理想，振荡较大；Jackson 阻尼函数的结果最理想，无论是与
Legendre 还是 Chebyshev 正交多项式都配合得很好，无明显的 Gibbs 振荡，与期望值吻合得非常好。
其次是绝缘相的计算结果。图3.31给出了 Legendre 与 Chebyshev 多项式展开系数 Gn 随 n 的变化

趋势。当 n = 30 ∼ 40 时， |Gn | → 0。当系统为绝缘体时，虚时格林函数两端十分陡峭，底部非常平
坦且接近于 0，整个格林函数的形状接近于一个倒扣的桶，其所需要的多项式展开阶数明显要比金属态
-0.1
0.00015
0.0001
-0.2 5e-05
G(τ)
G(τ)
0
Chebyshev
-0.3 -5e-05
-0.0001 default
-0.00015 Dirichlet
-0.4 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Jackson
τ/β Lorentz
Fejer
Wang-Zunger
-0.5
0 0.2 0.4 0.6 0.8 1
τ/β
-0.1
0.0002
0.00015
0.0001
-0.2
5e-05
G(τ)
G(τ)
0
-5e-05 Legendre
-0.3
-0.0001
-0.00015 default
-0.0002 Dirichlet
-0.4 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Jackson
τ/β Lorentz
Fejer
Wang-Zunger
-0.5
0 0.2 0.4 0.6 0.8 1
τ/β
图 3.32: Chebyshev 与 Legendre 正交多项式配合不同的阻尼函数对于虚时格林函数测量精度的影响。

上图:Chebyshev 正交多项式配合不同的阻尼函数。下图:Legendre 正交多项式配合不同的阻尼函数。
在嵌入的小图中，虚时格林函数仅仅只显示了 τ /β ∈ [0.4 : 0.6] 的小区间，以更好地说明问题。具体计算
参数请参阅正文。
3.7 本章小结 85
时大的多。在图3.32中同样比较了 Chebyshev 正交多项式与 Legendre 正交多项式配合不同的阻尼函

数对于虚时格林函数测量精度的影响。由该图可以看出，从整体而言，采用正交多项式表象或者是内核
多项式表象计算出来的虚时格林函数与采用传统测量方法计算出来的结果符合得还算可以。要比较孰优
孰劣，还得从虚时格林函数的底部着手 (见嵌入的小图)。由图可见，传统测量方法给出的结果有小的振
荡；采用纯粹的 Legendre 或者 Chebyshev 正交多项式方法会导致强烈的 Gibbs 振荡，振荡幅度远远
超过传统测量方法，而且在底部部分区域 G(τ ) > 0，破坏了因果率；Fejér 与 Lorentz 阻尼函数的结果
与期望值有系统性的偏离，特别是在与 Legendre 正交多项式配合的时候；Wang-Zunger 阻尼函数的
结果与传统测量方法获得的结果基本上一致；Jackson 阻尼函数的结果最为理想，基本上消除了 Gibbs
振荡，与期望值符合得很好，并且与 Legendre 或者是 Chebyshev 正交多项式都配合得很好。
综上所述，当阻尼函数采取 Jackson 形式时，内核多项式表象要优于正交多项式表象，基本上能够

消除由于强制截断所导致的 Gibbs 振荡现象。由于只需要在输出测量结果之前才调用阻尼函数对正交多
项式展开式进行调制，因此内核多项式表象与正交多项式表象相比并未额外增加多少计算量。总之，内
核多项式表象无疑是一种比正交多项式表象更具吸引力的改善强耦合展开连续时间量子蒙特卡洛杂质求
解器测量精度的方法。
3.7 本章小结
在本章，比较系统地阐述了我们所开发的各种基于强耦合展开算法的连续时间量子蒙特卡洛杂质
求解器，它们包括: 段表示算法版本、电声相互作用版本、动态屏蔽效应版本、广义矩阵算法版本、
Krylov 子空间迭代算法版本、Newton-Leja 多项式插值算法版本、正交多项式表象版本以及内核多项
式表象版本等等。这些杂质求解器几乎完全覆盖了强耦合展开算法的各个变种，其中有部分算法还是我
们所独创的，例如特别针对极高温区域的 global update 算法、针对五带或七带广义相互作用模型的
Newton-Leja 多项式插值算法、提高格林函数测量精度的内核多项式表象算法等等。上述杂质求解器均
经过严格的测试，大量的优化，在灵活性与稳定性之间达到了较好的均衡，基本上可以涵盖目前所遇到
的各种量子杂质问题。换言之，我们已经掌握了量子蒙特卡洛杂质求解器这个有力的工具，下一步将使
用它来研究真实的强关联电子系统，下面请参阅第4章与第5章。
第四章
LDA+DMFT 第一性原理计算方法: 基本理论框架与实现细节
从本章开始将进入本学位论文的第二部分:LDA+DMFT 第一性原理电子结构计算方法。本章主要讨
论 LDA+DMFT 计算方法的基本原理以及相关软件实现的细节。在第 5章，将介绍 LDA+DMFT 计算方
法在一些典型的关联电子体系中的应用。本章结构如下:
第4.1节，简要介绍目前最流行的第一性原理电子结构计算方法 ——密度泛函理论 (density
functional theory, DFT)。除了基本原理之外，我们还介绍了本文所广泛应用的几种密度泛函理论计算
软件。
第4.2节，主要介绍 LDA+DMFT 计算方法的理论框架。我们首先定义了 LDA+DMFT 方法的哈密顿
量，然后深入讨论了 LDA 部分与 DMFT 部分相互对接的计算公式，最后展望了 LDA+DMFT 方法可能
的发展趋势以及最近的研究热点。
第4.3节是本章的主要部分。我们独立开发了一套比较完备的 LDA+DMFT 计算软件包，覆盖了 LDA
+DMFT 计算方法的全部计算流程，本节将详细介绍具体的实现细节以及若干计算技巧。
4.1 密度泛函理论简介
4.1.1 Hohenberg-Kohn 定理与 Kohn-Sham 方程
在凝聚态物理领域，求解多电子体系是最根本的问题之一。虽然目前还无法严格求解所有的多电子体
系，但是却可以应用各种近似方法获取非严格解。目前这些近似方法可以大致分为两大类：第一类方法
是仅仅考虑系统在费米面附近的有限几个电子态，用一个有若干可调参数的模型哈密顿量来描述这几个
电子态。一般而言，人们对费米面附近的信息是最感兴趣的，因此这些模型哈密顿量可以看作是对原体
88 LDA+DMFT 第一性原理计算方法: 基本理论框架与实现细节
系的一个近似的描述。求解这些模型哈密顿量就能够得到关于原体系的定性半定量的信息。第二类方法
是由第一性原理 (ab initio 或者 first principles) 出发的电子结构计算。这种方法唯一需要的输入就是原
子序数 (核电荷数) 以及体系的总电子数。有时候原子在晶格中的位置信息也是输入参数之一，但是从原
则上说，通过最小化系统的总能，我们能够唯一地确定这些可调参数。目前在固体物理领域应用最广的
电子结构计算方法是密度泛函理论 109 。在密度泛函理论的框架内，多电子问题被约化为一个等效的单电
子问题，从而后者可以得到近似的求解。
密度泛函理论的理论基础就是著名的 Hohenberg-Kohn 定理 110 。Hohenberg-Kohn 定理指出: 非
均匀相互作用电子系统的总能可以看作是电荷密度 ρ(r) 的一个泛函,
∫ ∫ ∫
ρ(r0 )
E[ρ] = T [ρ] + dr ρ(r)Vext (r) + dr ρ(r) dr0 + Exc [ρ], (4.1)
|r − r0 |
使总能达到最小的电荷密度就是系统的基态。此处 T [ρ] 表示动能， Vext (r) 表示作用在电子上的外势
场 (通常是原子核的吸引势)。上式中右侧第三项代表 Coulomb 相互作用势能 (亦被称为 Hartree 能)。
Exc [ρ] 被称为交换 − 关联能，此项不但描述了由于 Pauli 不相容原理所导致的处于同一自旋态的电子之
间的 Coulomb 相互作用的减少效应 (即交换项)，同时还描述了由于电子运动受其它电子影响所导致的
关联效应 (即关联项)。只要能够严格定义公式 (4.1) 中的交换 − 关联项 Exc [ρ]，那么密度泛函理论就是
一个严格的理论。虽然看起来问题得到了初步的解决，但是我们仍然需要严格求解多电子问题，在一般
情况下，这是不可能完成的任务。因此，为交换 − 关联项寻找近似的表达式势在必行，并且还成为密度
泛函理论最核心的内容之一。Hohenberg-Kohn 定理表明：体系的物理性质仅由它的电荷密度 ρ(r) 决
定 110 。电荷密度可由电子波函数计算得到，由于 Hohenberg-Kohn 定理并没有限定电子波函数的表象
形式，因此在实际应用中，我们通常使用单电子波函数 φi (r) 来计算电荷密度 ρ(r)，
∑
N
ρ(r) = |φi (r)|2 , (4.2)
i=1
此处 N 为体系的总电子数。
为了求得公式 (4.1) 的极小值，我们需要在满足归一化的条件下：
∫
|φi (r)|2 dr = 1, (4.3)
对单电子波函数 φi (r) 取变分，这将导出一组微分方程式1 :

[ ∫ ]
∑ 2ZI ρ(r0 ) 0
−∇ −
2
+2 dr + Vxc (r) φi (r) = i φi (r). (4.4)
|r − RI | |r − r0 |
I
这就是著名的 Kohn-Sham 方程 111,112 。此处 RI 是原子核的位置矢量，核电数为 ZI 。 i 为 Lagrange

乘子，可以看作为单电子的本征能级。交换 − 关联势 Vxc (r) 是交换 − 关联能 Exc [ρ] 对电荷密度 ρ(r) 的
偏导数，亦即:
δExc [ρ]
Vxc (r) = . (4.5)
δρ(r)
1 以下我们采用原子单位制，以 Rydberg 作为能量单位，因此在 Coulomb 势能项之前有个 2 的因子。
4.1 密度泛函理论简介 89
我们通过数值技巧求解公式 (4.4)，即可以获得体系基态的电荷密度以及总能量。显而易见，在公式
(4.4) 中，最为关键的一项就是交换 − 关联势 Vxc (r)。密度泛函理论的几个发展层次都与 Vxc (r) 的表达式
密切相关。
密度泛函理论的第一个层次为局域密度近似 (local density approximation, LDA)。在此近似下，交
换 − 关联能 Exc [ρ] 被定义为如下的实空间积分:
∫
Exc [ρ] = ρ(r)εxc (ρ)dr. (4.6)
εxc (ρ(r)) 是电荷密度为 ρ(r) 的均匀相互作用电子气的交换 − 关联能量密度。如果体系具有自旋极化，那

么同样可有局域自旋密度近似 (local spin density approximation, LSDA)。此时交换 − 关联能可以表
示为 ∫
Exc [ρ↑ , ρ↓ ] = ρ(r)εxc (ρ↑ , ρ↓ )dr. (4.7)
εxc (ρ↑ , ρ↓ ) 就是自旋极化的交换 − 关联能量密度。在此近似之下，公式 (4.5) 中的交换 − 关联势自然也

是自旋极化的了:
δExc [ρ↑ , ρ↓ ]
Vxcσ (r) = . (4.8)
δρσ (r)
局域密度近似以及局域自旋密度近似成立的基础是均匀电子气背景，因此它们对于电荷密度空间变化
比较缓慢的体系十分适用。目前最流行的基于局域 (自旋) 密度近似的交换 − 关联泛函有 PZ81 113 ，
PW92 114 等等。在过去的几十年里，研究者使用基于局域密度泛函的第一原理计算软件研究了许多固
体、原子、分子的电子结构，获得了巨大的成功 109 。1998 年的 Nobel 物理学奖也因此颁发给密度泛函
理论的开拓者们，以奖励他们在第一性原理计算方面所做出的巨大贡献。
密度泛函理论的第二个层次为广义梯度近似 (general gradient approximation, GGA)。由于局域密
度近似对于电荷密度空间变化剧烈的体系并不是十分适用，因此一些研究者又发展了广义梯度近似。在
此近似中，交换 − 关联能被表示为电荷密度 ρ(r) 以及电荷密度梯度 ∇ρ(r) 的函数:
∫
Exc [ρ, ∇ρ] = ρ(r)εxc (ρ, ∇ρ)dr. (4.9)
不难想见，广义梯度近似同样亦有自旋极化的版本:
∫
Exc [ρ↑ , ρ↓ , ∇ρ↑ , ∇ρ↓ ] = ρ(r)εxc (ρ↑ , ρ↓ , ∇ρ↑ , ∇ρ↓ )dr. (4.10)
目前，最流行的基于广义梯度近似的交换 − 关联泛函形式主要有 PBE96 115 、WC06 116 、PBEsol 117 等

等。与局域密度近似相比较，广义梯度近似在多数实际材料的基态计算中，能够明显地修正总能、平衡
晶体结构、结合能等物理量的计算值，总体上要优于局域密度近似 109 。
密度泛函理论的第三个层次为元广义梯度近似 (meta general gradient approximation, meta-
GGA)。顾名思义，它是在广义梯度近似的基础之上发展而来的。在元广义梯度近似中，交换 − 关联势
不但是电荷密度与电荷密度梯度的函数，而且还是动能密度的函数，亦即:
∫
Exc [ρ↑ , ρ↓ , ∇ρ↑ , ∇ρ↓ , τ↑ , τ↓ ] = ρ(r)εxc (ρ↑ , ρ↓ , ∇ρ↑ , ∇ρ↓ , τ↑ , τ↓ )dr. (4.11)
其中
occupy
∑ 1
τσ (r) = |∇φiσ (r)|2 , (4.12)
i
2
为占据态 φiσ (r) 的动能密度。在大部分的情况下，应用元广义梯度近似能获得比采用广义梯度近似更理

想的结果。典型的基于元广义梯度近似的交换 − 关联泛函有 PKZB 118 、TPSS 119 等，目前这些泛函应用
的广泛程度尚不如广义梯度近似，软件支持也不多。
密度泛函理论的第四个层次为杂化泛函 (hybrid functional, HYF)。杂化泛函的核心要点是将交换 −

关联能分解为交换部分以及关联部分:
Exc = Ex + Ec . (4.13)
其中关联部分 Ec 仍旧沿用广义梯度近似中的表达式，但是交换部分 Ex 则由广义梯度近似中的相关部分

与由多体理论推导出的严格交换项 (exact exchange) 混合而成，亦即:
Ex = (1 − α)Ex + αExHF . (4.14)
α 为混合因子，它是一个经验常数，取值大约在 0 ∼ 20% 之间，如果 α = 0，那么将会还原到广义梯度

近似的情况。由于杂化泛函中包含了一部分严格交换项，因此在文献中有时候会称之为严格交换杂化泛
函 (exact exchange hybrid functional, EEHF)。目前比较典型的杂化泛函形式有 PBE0 120 、HSE03 121 、
HSE06 122 等等，它们的应用范围还比较窄，文献中报道它们曾被成功用于研究过渡金属化合物以及锕
系元素氧化物的带隙。
在密度泛函理论的框架中，交换 − 关联项的发展是一个高度活跃的领域，新的泛函形式层出不穷，
计算精度不断提高，适用范围越来越广。限于本文的篇幅，此处不再赘述，对此感兴趣者可以参阅最新
的文献。
4.1.2 基于密度泛函理论的电子结构计算方法
基于密度泛函理论的电子结构计算方法实质上是迭代求解一系列的 Kohn-Sham 偏微分方程 (见公式

(4.4))，获得单电子本征波函数 φi (r)，电子本征值 i 。由单电子本征波函数 φi (r) 出发，根据公式 (4.2)
可以得到系统的电荷密度 ρ(r)。利用新的电荷密度，我们可以计算得到新的交换 − 关联势 Exc [ρ]，新的
动能 T [ρ]，新的势能，进而构成新的 Kohn-Sham 方程组。继续迭代求解此 Kohn-Sham 方程组，直至
电荷密度收敛为止，这就是密度泛函理论中的电子结构自洽计算方法 109 。自洽计算得到的收敛的电荷密
度就是基态的电荷密度，利用它可以进一步计算出基态的其它物理性质。
Kohn-Sham 方程是一组定义在三维实空间中的偏微分方程，直接从数值上求解此微分方程组是
2ZI
不太现实的。问题的来源在于公式 (4.4) 中的 Coulomb 势能项 |r−RI | ，在原子核附近，该项趋于发散
(|r − RI | → 0)，这意味着我们需要定义十分稠密的网格才能反映势能项的变化趋势，而在原子势能项变
化比较平缓的区域，空间网格又需要变得比较稀疏，解决这一问题的窍门在于利用变分技术。我们可以
将单电子波函数 φi (r) = |φi i 定义为一系列完备基函数的线性组合:

∑
|φi i = ain |ψn i, (4.15)
n
ain 为待定的展开系数。那么我们可以将 Kohn-Sham 方程重写为如下的形式:
H|φi i = i |φi i, (4.16)
其中我们引入了单电子哈密顿量 H 2 :
∑ ∫
2ZI ρ(r0 )
H = −∇ −2
+2 + Vxc (r). (4.17)
|r − RI | |r − r0 |
I
将公式 (4.15) 代入到公式 (4.16) 中，并且等式两侧左乘基函数 hψn0 |，那么我们将会得到如下的线性代

数方程组:
∑ ∑
Hn0 n ain = i On0 n ain , (4.18)
n n
其中 Hn0 n = hψn0 |H|ψn i 是单电子哈密顿量在基函数 {|ψn i} 中的矩阵元，而 On0 n = hψn0 |ψn i 为基函数
之间的交叠矩阵 (overlapping matrix)。假设这组完备基函数满足正交性，即 On0 n = δn0 n ，那么公式
(4.18) 可以重写为:
∑
Hn0 n ain = i ain0 . (4.19)
n
根据所选取的基函数 {|ψn i} 的不同，现有的基于密度泛函理论的电子结构计算方法可以划分为两

大类。第一大类方法采用类原子轨道 (atomic-like orbitals) 为基函数 123 。此类基函数通常以原子核
为中心，在远离原子核区域快速地衰减。此类方法最典型的基函数就是 Muffin-Tin 轨道 (Muffin-Tin
orbitals, MTO)，Muffin-Tin 轨道可以表示为:
ψlm (r) = φl (|r|)Ylm (r). (4.20)
它具有原子轨道对称性，可以用轨道角动量 l 与磁量子数 m 来标识。 |r| 代表电子与原子核之间的间距，

Ylm (r) 为球谐函数。 φl (|r|) 为径向波函数，它是一个分段函数:


Rl (|r|, E), |r| < S,
φl (|r|) = (4.21)

C|r|−l−1 , |r| > S,
S 为原子球半径3 。Muffin-Tin 轨道在原子球内是 Kohn-Sham 方程 (公式 (4.16)) 的严格解，在原子

球外以指数的形式快速衰减。注意到 Muffin-Tin 轨道在电子结构自洽计算中并不是固定不变的，每
次迭代计算产生新的电荷密度以及势能项后，都需要重新计算径向波函数 Rl (|r|, E)，生成新的最优的
2 在大部分的密度泛函理论计算软件中，通常应用傅立叶变换将其自实空间变换至倒空间。少部分软件是直接工作在实空间中，
例如以小波 wavelet 为基函数的 BigDFT 程序。

3 原子球半径等于晶体中原子间距的一半。
Muffin-Tin 轨道。Muffin-Tin 轨道的线性化版本 (linearized Muffin-Tin orbitals, LMTO) 在电子结构

计算中应用十分广泛，线性 Muffin-Tin 轨道的优点是对于每个 Kohn-Sham 单电子波函数，只需要很
有限的几个线性 Muffin-Tin 轨道即可将其展开，而且线性 Muffin-Tin 轨道十分便于我们分析不同原子
组态对于单电子波函数的贡献。Muffin-Tin 轨道的缺点在于如若原子偏离平衡位置，所导致的电荷密度
变化很难用 Muffin-Tin 轨道给出一个精确的描述。因此通常很少使用基于 Muffin-Tin 轨道的第一性原
理计算软件研究材料的晶格动力性质，或者是进行几何优化以确定平衡晶体结构。基于 Muffin-Tin 轨道
的电子结构计算软件主要有 LMTART、TB-LMTO-ASA 等等。当然，除了主流的 (线性)Muffin-Tin 轨道
之外，还有其它的类原子轨道以及相关的电子结构计算软件，例如 FPLO，DMol3 等等，此处不再赘述。
电子结构计算的第二大类方法采用非局域化的平面波作为基函数 123 ，如下式所示:
|k − Gi = ei(k−G)r , (4.22)
其中 k 为波矢 (wave vector)， G 为倒格矢 (reciprocal lattice vector)。选择平面波为基函数能够对电

荷密度在晶格中的分布给出十分精确的描述，但是我们亦须付出相应的代价。那就是要用巨大数目的平
面波来展开单电子波函数 |φi i，这样公式 (4.18) 中的单电子哈密顿量必将是一个维数十分巨大的矩阵。
如要严格求解该哈密顿量，获取所有的本征值与本征态，以目前的计算能力而言显然是难以做到的。幸
运的是我们并不需要知道所有的本征态，只需要知道能量最低的几十个甚至几个占据态即可，那么采用
经典的共轭梯度算法 (conjugate gradient, CG)、RMM-DIIS(Residual minimization scheme, direct
inversion in the iterative subspace) 算法或者是 Davidson 算法均可高效地求解 Kohn-Sham 方程组。
对于原子核间势能项变化比较平缓的区域，以平面波为基展开单电子波函数是一个很好的选择。但是
在原子球内，尤其是近核区域，势能项趋于发散，单电子波函数在此区间内有很多节点，需要很多平面
波才能展开波函数，此时以平面波为基函数并不是最佳的方案。目前有两条途径可以解决这个问题。第
一条途径就是所谓的线性缀加平面波方法 (linearized augmented plane waves, LAPW) 123 。线性缀加
平面波方法的要点是在原子球内采用类原子轨道为基函数，在原子球间隙区域仍旧采用平面波函数，那
么 LAPW 基函数可以表示为:

∑

|r| < S,
lm blm Rl (|r|, E)Ylm (r),
|k − GiLAPW = (4.23)

Cei(k−G)r , |r| > S.
线性缀加平面波方法是目前最严格，计算精度最高的电子结构计算方法之一，应用十分广泛。当前主流
的基于线性缀加平面波方法的电子结构计算软件有:WIEN2K、FLEUR、FLAPW、ELK 等等。第二条途径
就是赝势 (pseudopotential, PP) 方法 123 。赝势方法仍然采用简单的平面波函数为基函数，但是对于公
式 (4.17) 中的单电子哈密顿量，利用赝势来替换真实的 Coulomb 相互作用势。赝势在原子核近邻区域
的变化趋势远比真实的势要平滑，很少节点甚至没有节点，因此展开单电子波函数所须的平面波不多。
如果采用赝势方法，那么得到的本征波函数实际上是赝波函数 (pseudo wavefunction)。在构造赝势的
时候，都有一个所谓的截断半径，在截断半径之外，赝波函数须与真实的波函数一致，而且计算所得到
的本征值在数值精度范围内也应保持一致。由于材料的物理特性多半是由价电子的性质决定，而价电子
波函数通常分布在远离原子核的区域，亦即在赝势的截断半径之外，因此赝势方法不失为一个很好的近
似。依据在构造赝势时所遵循的不同标准，赝势亦可以分为三大类:(1) 模守恒赝势 (norm-conserved
pseudopotential, NCPP)；(2) 超软赝势 (ultrasoft pseudopotential, USPP) 124 ；(3) 投影缀加波方法
(projector augmented wave, PAW) 125 。赝势平面波方法是目前最为流行的基于密度泛函理论的第一
性原理计算方法。目前比较流行的计算软件有:VASP、CASTEP、ABINIT、QUANTUM ESPRESSO 等
等，其中前两种软件为商业软件，后两种软件为自由开源软件。
本文中所涉及到的电子结构计算全部是基于赝势平面波方法，所使用的软件为 ABINIT 126 或者

是 QUANTUM ESPRESSO 127 ，这主要基于以下考虑:(1)ABINIT 与 QUANTUM ESPRESSO 软件的功
能、可扩展性、代码质量、更新速度、社区活跃度远超同类型的其它软件；(2)ABINIT 与 QUANTUM
ESPRESSO 软件均提供与 WANNIER90 128 软件的接口，十分容易构造 LDA+DMFT 计算所必须的局域
轨道；(3)ABINIT 与 QUANTUM ESPRESSO 软件均为开源软件，可自由使用修改其代码。如要使用赝
势平面波方法进行电子结构计算，那么首要的任务就是针对不同的原子产生精确可靠的赝势。由于赝势
方法中的后起之秀——投影缀加波方法，无论是在计算效率，亦或者计算精度上均超越了早期的模守
恒赝势与超软赝势，因此我们选择了投影缀加波方法。本文中所使用的投影缀加波赝势全部是独立产生
的，所使用的软件为 ATOMPAW 与 LD1，它们分别为 ABINIT 与 QUANTUM ESPRESSO 的配套的赝
势生成软件。我们所产生的赝势均经过了严格的测试，在保证精确性的前提下追求尽量" 软" 的赝势。产
生与测试赝势是十分繁琐复杂的过程，也是一门艺术，限于篇幅，其中具体的细节此处不再细表。
4.1.3 密度泛函理论的局限与修正
基于密度泛函理论的电子结构计算方法在描述普通材料的物理性质方面取得了巨大的成功 109,123 。但
是也有很多失败的例子，例如半导体材料的带隙，计算值远低于实验值。密度泛函理论之所以不能取得
完全的成功，主要是因为以下两方面的问题:(1) 密度泛函理论本质上是一个单电子近似，它将多电子问
题简化为单电子在其它电子所形成的有效势场中的运动。该近似对于能带较宽，关联作用较弱的体系是
适用的，反之则不适用。(2) 局域密度近似基于均匀电子气的假设，但是这一个假设对于那些窄带系统并
不成立。在窄带系统中，电子波函数保留了明显的原子轨道的特征，所对应的电荷密度空间变化十分剧
烈，局域密度近似不能给出合理的结果，即使是应用广义梯度近似或者是更为复杂的交换 − 关联泛函形
式，对于计算结果的改善也十分有限。
Mott 绝缘体是体现密度泛函理论局限性的一个典型例子。Mott 绝缘体通常拥有部分填充的 d 电子

壳层，基于密度泛函理论的电子结构计算往往只能给出金属性的基态，然而实验结果却是宽带隙的绝缘
体，原因在于 d 电子壳层中存在着很强的 Coulomb 排斥作用。电子在不同格点之间跃迁使得动能增
加，而若是两个电子处于同一格点，Coulomb 排斥作用会减少电子的能量。如果 Coulomb 相互作用
U 大于能带的宽度 W ，那么将是后一个效应占优，电子趋于局域化而体系呈现绝缘体的性质。这种由于
关联作用所导致的绝缘体被称之为 Mott 绝缘体。特别需要指出的是，Mott 绝缘体经过掺杂或者是改变
能带宽度4 将会转变为金属态 1 ，但是这种金属态仍然会展现出许多反常的多电子关联效应，仍然不能用

密度泛函理论这种单电子近似方法给出一个很好的描述。
为了能够更好地描述真实材料中的电子关联效应，发展了很多理论对密度泛函理论进行修正，主要有
自相互作用修正方法 (self-interaction correction, SIC) 129 、准粒子近似方法 (quasiparticle method,
GW) 130 、LDA+U 方法 131 、LDA+DMFT 方法 12,13,132 等等。下面首先对前三种方法做简要的介绍，
LDA+DMFT 方法是本文的主旨所在，将在下文中专门介绍。
在自相互作用修正方法中，Kohn-Sham 方程中的势能项具有轨道依赖性，对于空占据态保持不变，
对于占据态则要扣除部分的 Coulomb 排斥势能。这将会使得空占据态与占据态之间产生能量劈裂，从
而打开能隙。该方法已经被应用于一些过渡金属氧化物的电子结构计算中，所得的磁矩以及能隙数据较
之局域密度近似的计算结果有较大的改善。自相互作用修正方法的缺点是 Coulomb 相互作用的屏蔽效
应完全没有被考虑到，这导致有效的 U 值被严重高估了 129 。
准粒子近似方法是另一种十分有效的修正关联电子效应的方法。在准粒子近似方法中，关联电子效应
对于电子结构的影响可用电子自能项 Σ 描述，而且电子自能可由电子格林函数 G 以及屏蔽 Coulomb 相
互作用势 W 决定 133 :
Σ = −iGW ， (4.24)
因而有时准粒子近似方法亦被称为 GW 方法。准粒子近似方法基于多体微扰理论，保留一阶项对于 W
的贡献。依据所采取的不同近似，准粒子近似方法又可以细分为 SEX、COHSEX、G0 W0 、G0 W、GW0 、
GW、QPscGW、GΓW 等等多种形式 130 ，此处不再一一展开叙述。准粒子近似方法对于简单的金属、
半导体、绝缘体都能给出很好的结果，但是它却不能很好地描述强关联金属。这是因为对于强关联金属
而言，在 W 的微扰展开序列中，高阶项的贡献很重要，不可忽略，而准粒子近似方法恰恰完全忽略了
高阶项的贡献。最后特别值得一提的是准粒子近似方法的计算量非常巨大，即使是计算能带结构这样一
个简单的任务都需要耗费天量的计算资源。
LDA+U 方法是一种十分简单而又有效的关联电子体系计算方法。在 LDA+U 方法中，电子被划分为

局域子空间 (包含 d、 f 轨道) 与非局域子空间 (包含 s、 p 轨道)。在局域子空间中，通过下面的公式往
势能项中引入 Coulomb 相互作用的贡献 131,132 :
1 ∑
U nmσ nm0 σ0 , (4.25)
2
mσ,m0 σ 0
mσ6=m0 σ 0
其中 nmσ 为关联轨道的电子占据数算符。LDA+U 方法本质上是一种静态的平均场方法，该方法不但能

够和自相互作用修正方法一样消除掉"self-interaction"，而且还考虑了屏蔽效应对 Coulomb 相互作用
参数 U 的影响。总体而言，LDA+U 方法要优于自相互作用修正方法，它被广泛应用于强关联电子材料
(尤其是过渡金属氧化物中的 Mott 绝缘体) 的电子结构计算。LDA+U 方法也存在着巨大的局限性，例
如它完全不能够描述 Mott 金属 − 绝缘体相变，也不能描述强关联金属的电子结构等等。若要克服 LDA
4 加压能够显著地改变体系的能带宽度。
4.2 LDA+DMFT 计算方法: 理论框架 95
+U 方法的局限性，那么我们须得在静态平均场理论的基础之上，考虑动态效应的修正，例如下文将要
介绍的 LDA+DMFT 方法 12,13,132 。
4.2 LDA+DMFT 计算方法: 理论框架
此前曾言道，研究多电子系统有两大途径。第一大途径是通过对模型哈密顿量的研究从而把握原始体
系的关键性质。动力学平均场方法无疑是这一大类方法中的佼佼者。第二大途径则是以密度泛函理论为
代表的第一性原理电子结构计算方法。这两种途径各有其优缺点，那么为何不将它们结合起来呢? 这是
自然而然就会被提出的问题。针对真实的关联电子体系，首先用传统的第一性原理电子结构计算方法研
究其基态性质，从中提取出我们感兴趣的能带结构，构造不带任何经验参数的模型哈密顿量，然后再利
用动力学平均场方法等多体理论中的技巧进行深入研究，求解此模型哈密顿量。这就是密度泛函理论结
合动力学平均场理论 (local density approximation plus dynamical mean-field theory, LDA+DMFT)
计算方法5 的主要思路之所在 12,13,132 。
自从 LDA+DMFT 方法建立发展起来之后 134--144 ，它迅速地在强关联电子材料的理论计算领域

占据了主导地位。诸如属于 3d 电子系统的 Fe、Co、Ni、VO2 、V2 O3 、NiO、MnO、FeO、Fe2 O3 、
Fe3 O4 、CoO、CaVO3 、SrVO3 、Lax Sr1−x TiO3 、LiV2 O4 、KCuF3 等材料，属于 4d 电子系统的 LiRh2 O4 、
CaRuO3 、SrRuO3 、Ca2−x Srx RuO4 、SrTcO3 等材料，属于 5d 电子系统的 Sr2 IrO4 等材料，属于 4f 电
子系统的 Ce、Nd、Pr、Yb、CeCu2 Si2 、CeIrIn5 、GdI2 等材料，属于 5f 电子系统的 Pu、Am、Cf、
Bk、URu2 Si2 、UO2 、USe、UTe、PuSe、PuSe、PuTe、PuO2 、PuCoGa5 等材料，这些都曾是 LDA
+DMFT 方法的研究对象 12,13,132 。
虽然 LDA+DMFT 方法已经取得了巨大的成功，但是目前仍然缺乏一套稳定可靠、灵活易用、功能强
大、可扩展性强的计算软件包，这极大地制约了后续研究工作的开展。有鉴于此，我们独立开发了一套
LDA+DMFT 第一性原理计算软件包，并用其相继研究了 SrVO3 、CoO、BaRuO3 等强关联电子体系的
电子结构。在本节我们着重讨论 LDA+DMFT 计算方法的理论框架。至于 LDA+DMFT 计算软件包的具
体实现细节将在第4.3 节中介绍。在第5章将深入探讨该计算软件包的典型应用实例。
4.2.1 LDA+DMFT 哈密顿量
我们首先由哈密顿量出发，介绍 LDA+DMFT 计算方法的理论框架。在 LDA+DMFT 计算方法中，

哈密顿量可以被定义为如下形式:
HLDA+DMFT = HKS − Hdc + Hint , (4.26)

5 LDA+DMFT 这一缩写词中的 LDA 并非特指密度泛函理论中的局域密度近似，而是泛指密度泛函理论本身，无关乎交换 − 关
联泛函的形式，这是约定俗成的结果，本文沿用这一提法。当然，在文献中也有人使用 GGA+DMFT 这一术语，他们这是为了强
调在第一性原理电子结构计算部分，他们采用了广义梯度近似。类似的提法还有 LSDA+DMFT(局域自旋密度近似结合动力学平均
场理论)、GW+DMFT(准粒子近似方法结合动力学平均场理论)、HYF+DMFT(杂化密度泛函结合动力学平均场理论) 等等。
在上式中， HKS 是我们所熟知的 Kohn-Sham 方程中的单电子哈密顿量 (见公式 (4.17))，有时也称之为

HLDA 。由于在密度泛函理论中，哈密顿量已经部分包含了电子关联相互作用的成份，为了避免重复计
算，须将其提前扣除，这就是双计数项 (double counting) 的由来， Hdc 就是所谓的双计数项。在传统
习惯上，双计数项通常被收缩到电子自能中一并考虑，并被重新命名为 Σdc ，因而此处暂不对双计数项
展开讨论，在第4.3.4小节将讨论双计数项的具体表达形式。 Hint 为 Coulomb 相互作用项，顾名思义，
体现多电子效应的电子 − 电子相互作用由该项描述。
Hint 的一般定义比较复杂，在实际应用中常采用如下两种表达形式 132 。
(1)Slater-Kanamori 参数化形式:
∑ ∑ ∑
Hint = U na↑ na↓ + (U − 2J) na↑ nb↓ + (U − 3J) naσ nbσ
a a6=b a>b,σ
∑ ∑ (4.27)
−J d†a↑ d†b↓ db↑ da↓ − J d†a↑ d†a↓ db↑ db↓ ,
a6=b a6=b
其中 U 为 Coulomb 相互作用参数， J 为 Hund 交换耦合参数， a 和 b 均为轨道指标6 。上式右端前三

项为密度 − 密度相互作用项，后两项分别为自旋翻转项与对跃迁项。
(2)Coulomb 矩阵形式:
1 ∑ ∑
Hint = [Umm0 nmσ nm0 σ̄ + (Umm0 − Jmm0 )nmσ nm0 σ ]
2
m,m0 σ
( ) (4.28)
1 ∑ ∑
− Jmm0 d†mσ d†m0 σ̄ dm0 σ dmσ̄ + d†mσ d†mσ̄ dm0 σ dm0 σ̄ + h.c. ,
2 0 σ
m6=m
其中 Umm0 为直接 Coulomb 矩阵的矩阵元， Jmm0 为交换 Coulomb 矩阵的矩阵元。 Umm0 与 Jmm0 可
以由下式计算:
∑ ∑
Umm0 = ak F k , Jmm0 = bk F k . (4.29)
k k
ak 与 bk 为 Klebsch-Gordan 系数，其计算表达式分别为:
4π ∑
k
ak = hlm|Ykq |lmihlm0 |Ykq
∗
|lm0 i, (4.30)
2k + 1
q=−k
4π ∑
k
bk = |hlm|Ykq |lm0 i|2 , (4.31)
2k + 1
q=−k
∫
0 ∗
hlm|Ykq |lm i = drYlm (r)Ykq (r)Ylm0 (r), (4.32)
式中 Ylm 为球谐函数。公式 (4.29) 中的 F k 被称为 Slater 积分。对于 d 电子系统，有 k = 0, 2, 4:
14
F 0 = U, F2 = J, F 4 = 0.625F 2 . (4.33)
1 + 0.625
6 出于行文简便的考虑，格点指标被略写了。
对于 f 电子系统，有 k = 0, 2, 4, 6:
6435 451 2 1001 2
F 0 = U, F2 = 195.451 250.1001 J, F4 = F , F6 = F . (4.34)
286 + 675 + 2025
675 2025
其中 U 同样为 Coulomb 相互作用参数， J 同样为 Hund 交换耦合参数。因此只要我们确定了 U 与

J 参数的值，即可以通过公式 (4.33) 与公式 (4.34) 求得 Slater 积分 F k 的值，进而由公式 (4.29) 求出
Coulomb 相互作用矩阵的矩阵元，最终确定相互作用项 Hint 。
显然，无论是采用 Slater-Kanamori 参数化形式还是采用 Coulomb 矩阵形式，若要确定相互作用
项 Hint ， U 与 J 是必不可少的参数。在实践中，获得 U 与 J 参数主要有以下三种途径:(1) 来源于对光
电子能谱实验数据的分析；(2) 通过受限密度泛函理论 (constrained density functional theory) 计算；
(3) 通过无规相近似 (random phase approximation, RPA) 计算 132 。
4.2.2 LDA+DMFT 自洽方程
在 LDA+DMFT 的哈密顿量中 (见公式 (4.26))， HKS 是定义在 Bloch 完备基函数空间里的，而 Hdc

与 Hint 是定义在局域轨道的空间里的，这两个空间一般并不重合。那么我们需要建立起一套理论框架，
将这两个空间相互匹配起来。
首先考虑由任意一套完备基函数 {|ψkα i} 所张开的空间 B，与晶格电子结构有关的量都在此空间上
定义。其中 k 为 Brillouin 区的波矢量， α 为轨道指标或者是基函数的索引指标。另考虑由局域轨道
{|χRkm i} 所张开的关联子空间 C，所有与关联轨道相关的算符都定义在此空间，电子 − 电子关联作用在
此空间中考虑，动力学平均场理论中的量子杂质模型求解器也工作在此空间中。其中 R 表示原胞中的关
联原子， m 为关联轨道的索引。
在 B 空间中，无相互作用的晶格格林函数的定义为:
∫ [ ]
1 3 1
G0,αα0 (iω) = d k . (4.35)
Ωbz (iω + µ)I − HKS (k) αα0
有相互作用的晶格格林函数的定义为:
∫ [ ]
1 3 1
G αα0 (iω) = d k . (4.36)
Ωbz (iω + µ)I − HKS (k) − ∆Σ(k, iω) αα0
那么，在关联子空间 C 中，无相互作用的电子格林函数的定义为:
∫ ∑ [ ]
R 1 3 1
G0,mm0 (iω) = d k hχRkm |ψkα i hψkα0 |χRkm0 i. (4.37)
Ωbz 0
(iω + µ)I − HKS (k) αα 0
αα
有相互作用的电子格林函数的定义为:
∫ ∑ [ ]
R 1 3 R 1
Gmm0 (iω) = d k hχkm |ψkα i hψ 0 |χR 0 i. (4.38)
Ωbz 0
(iω + µ)I − HKS (k) − ∆Σ(k, iω) αα0 kα km
αα
上式实际上就是 LDA+DMFT 计算方法的自洽方程。其中积分遍及整个 Brillouin 区， Ωbz 表示 Brillouin

区的体积。 I 为单位矩阵，其维度等于 B 空间的大小。 iω 为松原频率点7 ， µ 为化学势。在 Kohn-Sham
7 如果杂质求解器工作在实轴上，那么 iω → ω。
方程中求解单电子哈密顿量 HKS (k) 得到本征值 kν 以及 Bloch 本征波函数 |Ψkν i，那么在 B 空间中
HKS (k) 的矩阵元为:
∑
HKS,αα0 (k) = hψkα |Ψkν ikν hΨkν |ψkα0 i. (4.39)
ν
∆Σ 为扣除掉双计数项的电子自能函数，在关联轨道子空间 C 中， ∆Σ 的定义为:
∆ΣRmm0 (iω) = ΣRmm0 (iω) − ΣRdc,mm0 , (4.40)
原则上说，这是一个与 k 无关的量。但是在 B 空间中，其矩阵元可以表示为:

∑∑
∆Σαα0 (k, iω) = hψkα |χRkm i(ΣRmm0 (iω) − ΣRdc,mm0 )hχRkm0 |ψkα0 i, (4.41)
R mm0
此时显然与波矢量 k 有关。
公式 (4.38)、(4.39) 与 (4.41) 构成了 LDA+DMFT 计算方法的基本方程组，它们对于任意选定的基
函数都是成立的。任何 LDA+DMFT 计算方法的实现都需要选定特定的:(1) 局域轨道基函数 {|χRkm i} 以
张开局域子空间 C；(2) 完备基函数 {|ψkα i} 以张开全局空间 B，LDA+DMFT 基本方程组就定义在 B 空
间中。对于完备基函数 {|ψkα i} 而言，在电子结构计算中求解 Kohn-Sham 方程所获得的 Bloch 本征波
函数 {|Ψkν i} 是最简单、最自然、最合理的选择，亦即:
{|ψkα i} = {|Ψkν i}. (4.42)
Kohn-Sham 单电子哈密顿量 HKS 在此组基下是对角化的，因此公式 (4.39) 可改写为:
HKS,νν 0 (k) = δνν 0 kν . (4.43)
下面除非特别指出，我们均采用 {|Ψkν i} 为基函数张开 B 空间。下面定义局域轨道基与 Bloch 本征

波函数之间的交叠矩阵:
R
Pmν (k) = hχRkm |Ψkν i, (4.44)
以及
R∗
Pνm (k) = hΨkν |χRkm i. (4.45)
一般地有，借助交叠矩阵局域轨道 {|χRkm i} 可以表示为 Bloch 本征波函数的分解:

∑ ∑
|χRkm i = |Ψkν ihΨkν |χRkm i = R∗
|Ψkν iPνm (k). (4.46)
ν ν
如果我们采用正交化的局域轨道:
0
hχRkm |χRk0 m0 i = δRR0 δkk0 δmm0 , (4.47)
那么利用 {|Ψkν i} 的完备性不难验证 hΨkν |χRkm i 就是一个酉正矩阵。由公式 (4.46) 可见局域轨道 {|χRkm i}

实际上就是就是一组真正的 Wannier 轨道。利用这两个交叠矩阵，我们可以将公式 (4.38) 重新改写为:
∫ ∑ [ ]
R 1 3 R 1
Gmm0 (iω) = d k Pmν (k) P R∗
0 0 (k). (4.48)
Ωbz 0
(iω + µ)I − HKS (k) − ∆Σ(k, iω) νν 0 ν m
νν
且公式 (4.41) 也可被改写为:

∑∑
R∗
∆Σνν 0 (k, iω) = Pνm (k)(ΣRmm0 (iω) − ΣRdc,mm0 )Pm
R
0 ν 0 (k). (4.49)
R mm0
上述推导除了局域轨道是正交的与 Bloch 本征波函数是完备的这两个条件之外，没有基于其它任何

假设，因此是严格成立的。在具体的 LDA+DMFT 实现中，局域轨道是正交的这一条件很容易满足，但
是 Bloch 本征波函数并不一定是完备集。假如电子结构计算使用的是基于赝势平面波方法的第一性原
理计算软件，那么求解 Kohn-Sham 方程所产生的 Bloch 本征波函数的数目是非常巨大的。将所有的
Bloch 本征波函数都包括进去作为基函数既不实际，也无此必要。因此我们通常需要对 B 空间做一个截
断，仅仅考虑一部分 Bloch 本征波函数，由此所构成的子空间命名为 W，此时的基函数自然不再满足完
备性关系。我们可以得到新的一组局域轨道 {|χ̃Rkm i}:
∑
|χ̃Rkm i = |Ψkν ihΨkν |χRkm i. (4.50)
ν∈W
由于此时交叠矩阵已不再是酉正矩阵了， {|χ̃Rkm i} 也不再是真正的 Wannier 函数，但是我们可以通过额

外的正交化手续将其变换为真正的 Wannier 函数:
∑ 0 0
R RR R
|wkm i= Smm 0 (k)|χ̃
km0 i, (4.51)
R0 m0
0
上式中， Smm
RR
0 (k) 为正交化变换矩阵，它实际上等于局域轨道之间交叠矩阵的反平方根:
0 0 ∑ 0
RR R R R R∗
Omm 0 (k) = hχ̃
km |χ̃km0 i = Pmν (k)Pνm 0 (k), (4.52)
ν∈W
而且
{ }RR0
RR0
[O(k)]− 2
1
Smm 0 (k) =
0
. (4.53)
mm
自然地，Wannier 轨道 {|wkm
R
i} 在空间中的局域性是不如之前的局域轨道 {|χRkm i} 的。
针对新的 Wannier 轨道 {|wkm
R
i}，我们可以重新定义新的交叠矩阵如下:
R R
P̃mν (k) = hwkm |Ψkν i, (4.54)
以及
R∗ R
P̃νm (k) = hΨkν |wkm i. (4.55)
注意到如果 Bloch 本征波函数 {|Ψkν i} 不属于受限子空间 W，那么交叠矩阵元为零。依据 Wannier 轨

道 {|wkm
R
i} 的定义，我们可将上述交叠矩阵改写为:
∑ 0 0
R RR ∗ R
P̃mν (k) = Sm0 m (k)Pm0 ν (k), (4.56)
R0 m0
并且
∑ 0 0
R∗ RR R∗
P̃νm (k) = Smm 0 (k)Pνm0 (k). (4.57)
R0 m0
最后，我们选择的局域轨道为 Wannier 轨道 {|wkm

R
i}，并用其张开关联轨道子空间 C。LDA+DMFT 接
口定义在受限子空间 W 中，那么 LDA+DMFT 自洽方程可重新表示为:
∫ ∑ [ ]
R 1 3 R 1
Gmm0 (iω) = d k P̃mν (k) P̃ R∗
0 0 (k), (4.58)
Ωbz 0
(iω + µ)I − HKS (k) − ∆Σ(k, iω) νν 0 ν m
νν ∈W
∑∑
R∗
∆Σνν 0 (k, iω) = P̃νm (k)(ΣRmm0 (iω) − ΣRdc,mm0 )P̃m
R
0 ν 0 (k). (4.59)
R mm0
注意到 HKS 在 W 子空间中仍然是对角化的。
在实际的计算中，我们首先选定局域轨道 {|χRkm i}，根据公式 (4.44) 与 (4.45) 计算出初始的交叠矩阵

0
Pmν
R
(k) 与 Pνm
R∗
(k)。确定受限子空间 W 后，再根据公式 (4.52) 与 (4.53) 定出正交化转换矩阵 Smm
RR
0 (k)。
最终的局域轨道与 Bloch 本征波函数之间的交叠矩阵可经由公式 (4.56) 与 (4.57) 求出。有了这两个交

叠矩阵，我们就可以把格林函数，自能函数等物理量在 C 子空间与 W 子空间之间来回"downfolding"
与"upfolding" 了8 。利用公式 (4.58) 计算出电子格林函数只是 LDA+DMFT 计算流程里的关键一步，接
下来还需利用 Dyson 方程求出杂化函数 ∆(iω) 或者是 Weiss 函数 G0 (iω)，然后再调用量子杂质模型求
解器来处理相应的杂质模型，具体的计算流程请参考第 1.2.1节与第4.3.1节。
4.2.3 LDA+DMFT 计算方法最新进展
自 1997 年 LDA+DMFT 计算方法首次被提出，并被应用于研究 La1−x Srx TiO3 的电子结构以来，经

过近二十年的演进，LDA+DMFT 已经发展成为强关联电子领域首屈一指的理论严谨、应用广泛的第一
性原理电子结构计算方法。在最近这十余年里，LDA+DMFT 计算方法的发展尤为迅猛 132 。
在理论基础方面，Kotliar 等人利用多体物理领域的 Kadanoff-Baym 或者是 Luttinger-Ward 生成泛

函方法以及鞍点近似 (saddle point approximation)，严格地推导了 LDA+DMFT 计算方法的自洽方程
以及 Dyson 方程 12 。密度泛函理论的 Kohn-Sham 方程与动力学平均场理论的自洽方程均可用同样的
方法导出。这样密度泛函理论、动力学平均场理论以及 LDA+DMFT 计算方法都建立在同一理论基础之
上，达到了有机的统一。
在程序实现方面，LDA+DMFT 方法更是取得了巨大的进展。这些进展大致可以划分为三个方面: (1)

密度泛函理论部分的改进。在 LDA+DMFT 计算方法发展的早期应用的是基于密度泛函理论的局域密度
近似或者是广义梯度近似。后来人们发现，在某些情况下，LDA 计算给出的基态偏离实际情况太远，以
至于 LDA+DMFT 的计算结果也不尽如人意。因此首先考虑用准粒子近似方法 130 替换原始的密度泛函
理论，构成 GW+DMFT 145 。在 GW+DMFT 的理论框架内，相互作用参数 U 和 J 的值都可以由 GW
计算给出，这是真正的第一性原理计算方法，无任何可调参数。可惜的是 GW+DMFT 方法的计算开
销太大，因此应用并不广泛。Haule 等人 146 进而提出用杂化密度泛函替换原始的密度泛函理论，构成
HYF+DMFT。他们指出，对于 f 电子体系氧化物的能隙，HYF+DMFT 计算方法给出的结果比纯粹的
8 将物理量由 C 子空间投影到 W 子空间称为 upfolding，而从 W 子空间投影到 C 子空间则称之为 downfolding。
4.3 LDA+DMFT 计算程序: 实现细节 101
LDA+DMFT 计算方法给出的结果更接近于实验值。但是 HYF+DMFT 计算方法额外引入了一个新的经

验参数——严格交换泛函混合因子 α，并且计算量同样非常庞大，因此应用报道很少。(2) 动力学平均场
部分的改进。一方面，最新的杂质求解器不断被融入到 LDA+DMFT 软件包中。早期的 LDA+DMFT 计
算软件多半是采用 HIA、NCA、IPT、HF-QMC 等杂质求解器，这些杂质求解器的限制都比较多，难以
在计算效率以及计算精度上达到平衡 9 。目前主流的杂质求解器自然是连续时间量子蒙特卡洛杂质求解
器，特别是基于强耦合展开算法的连续时间量子蒙特卡洛杂质求解器 58 。连续时间量子蒙特卡洛杂质求
解器的发明，极大地拓展了可研究的参数范围，大大推动了 LDA+DMFT 方法的发展。另一方面，早期
的 LDA+DMFT 计算都是在单点动力学平均场理论的框架内进行的，仅仅只考虑一个杂质点，这个近似
对于那些具有非局域相互作用的材料显然是不太适合的。动力学平均场理论在非局域相互作用方面有很
多扩展，例如团簇动力学平均场理论 14 、动力学团簇近似 14 、对偶费米子方法 15 ，动力学顶角近似 16 等
等。人们自然尝试将它们与密度泛函理论结合起来，构成 LDA+CDMFT、LDA+DCA、LDA+DF、LDA
+DΓA 等计算方法。文献中报道，有研究者使用 LDA+CDMFT 方法研究了 VO2 147 、Ti2 O3 148 的电子
结构；还有研究者使用 LDA+DCA 方法研究了 SrVO3 149 的电子结构。目前这一领域仍在蓬勃发展当
中。(3)LDA+DMFT 接口部分的改进。这也包括了两个小的方面。一方面是局域轨道的选择：早期的
LDA+DMFT 实现是采用 LMTO、NMTO 等局域轨道为基张开 C 子空间 135--137,139--141 ，目前的主流选
择是各种 Wannier 轨道 (包括最局域化的 Wannier 函数或者是具有原子轨道对称性的 Wannier 函数)
或者是赝原子轨道 134,138,142--144 。后者在赝势平面波软件中更容易实现，因而推动了 LDA+DMFT 计算
方法的扩散与传播。另一方面是迭代方式的改进：早期的 LDA+DMFT 程序实现通常是单步非电荷自洽
型的，亦即 LDA 部分提供哈密顿量或者是投影矩阵，DMFT 部分求解完量子杂质模型之后不再反馈回
LDA 计算软件。这样的 LDA+DMFT 实现仅能用于研究强关联电子体系的电子结构，对于其它性质是
无能为力的。另一种迭代方式是 DMFT 部分求解完量子杂质模型后，会把修正过后的密度矩阵反馈回
LDA 部分，重新进行 LDA 计算，进而产生新的量子杂质模型，这样迭代下去，直至密度矩阵收敛。这
样的 LDA+DMFT 程序实现能够用于计算强关联电子材料的总能、状态方程、晶格动力学性质等等。目
前全电荷自洽的 LDA+DMFT 计算方法已经有了比较广泛的应用 135,136,141 ，在可预见的将来将会完全取
代非电荷自洽的 LDA+DMFT 计算方法。
4.3 LDA+DMFT 计算程序: 实现细节
由于目前 LDA+DMFT 方法仍然在飞速发展当中，该方法的成熟程度远远不能与经典的 LDA 方

法相提并论。当前还未有一个成熟可靠，简便易用的 LDA+DMFT 软件包可资使用。因此我们需要独
立开发一套稳定精确的 LDA+DMFT 软件包。经过多年的努力，在借鉴同类 LDA+DMFT 程序的基础
上 134--136,138,142--144 ，本人独立开发了一套比较完备的 LDA+DMFT 第一性原理电子结构计算软件包9 。
由于此软件包的架构比较庞大复杂，实现起来难度相当大，本节将分门别类地讨论该软件包各种比较关
键的实现细节，以期为后来者鉴。
9 该项目名称sirius。
4.3.1 LDA+DMFT 计算软件流程框图
本小节首先讨论 LDA+DMFT 计算方法的一般流程 132,135 (如图4.1所示)，明确 LDA+DMFT 计算软

件包各种模块组件的功能用途。
步骤A: 应用基于密度泛函理论的第一性原理计算软件进行自洽计算，获取体系基态的本征值 kν 与

本征波函数 {|Ψkν i}。选定合适的局域轨道 {|χRkm i} 以张开关联轨道子空间 C。关于局域轨道的选择，请
参考第4.3.3小节。
步骤B: 在体系的全部本征态中，通过截断处理保留合适的态，确定受限子空间 W 的大小，然后计算

交叠矩阵 P̃mν
R
(k) 与 P̃νR∗
0 m0 (k)。受限子空间 W 究竟包含那几个 Bloch 波函数必须经过仔细慎重的考虑，
至少应该包含关联电子轨道成份占主要部分的那几条能带。同时必须明确在受限子空间 W 中，电子占
据数 NKS 是多少。原则上说，受限子空间 W 的维数越大，那么局域轨道的局域性就越强。
步骤C: 初始化 LDA+DMFT 软件包的基本运行环境10 。包括初始化工作目录，分析读取各种配置文

件，设定控制参数等等。由于强关联电子材料中可能包含着多组不等价的关联电子轨道11 ，对于每组不
等价的关联电子轨道都须建立单独的文件夹，并且相应的量子杂质模型的求解也是各自独立进行的。
步骤D: 从不同的关联电子 (或者原子) 轨道文件夹中收集提取电子自能函数 ΣR (iω)12 并把它们按照一

定的规则组合在一起，其中 R 代表关联原子的索引13 。特别地，如果这是 LDA+DMFT 计算的第一重循
环，那么电子自能函数统一设为 0。
步骤E: 构造双计数项 ΣRdc 14 并把它们按照一定的规则组合在一起，其中 R 代表关联原子的索引。特别

地，如果这是 LDA+DMFT 计算的第一重循环，那么双计数项将强制设为 0 以避免数值不稳定性。关于
双计数项的具体选择，请参见第4.3.4小节。
步骤F: 构造完整的电子自能函数 ∆ΣR (iω) = ΣR (iω) − ΣRdc 15 ，亦即自初始的电子自能函数中扣除掉

双计数项。
步骤G: 将电子自能函数 ∆ΣR (iω) 由关联轨道子空间 C 投影至受限子空间 W 中16 。所使用的公式实

际上是 (4.59)，此时须使用在步骤B中所确定的交叠矩阵 P̃mν
R
(k) 与 P̃νR∗
0 m0 (k)。
步骤H: 混合新旧电子自能函数，产生更新的自能函数17 。特别地，如果这是 LDA+DMFT 计算的第

一重循环，不存在旧的自能函数，那么略过此步骤。
10 具体实现为 dmft_init.py 程序。

11 例如 SrRuO3 包含 4 个不等价的 Ru 原子，每个 Ru 原子的 4d 轨道都属于关联电子轨道，因此对于此材料须考虑四个互不等
价的五带杂质模型。
12 具体实现为 sigma_gather.py 程序。
13 再次以 SrRuO 为例，在正常的情况下，应该从四个不同的文件夹中收集到四个不同的 Σ(iω)，分别对应于四个不等价的 Ru
3
原子的 4d 轨道。
14 具体实现为 sigma_dcount.py 程序。
15 具体实现为 sigma_builder.py 程序。
16 具体实现为 dmft_proj1 程序。
17 具体实现为 dmft_mixer 程序。
103
图 4.1: LDA+DMFT 第一性原理电子结构计算软件流程框图，具体说明请参考正文。

dmft_init python script
sigma gather
fortran code
double couting
sigma builder
LDA+DMFT Kernel
dmft_proj1 dmft_ksum dmft_mixer
dmft_mixer dmft_mune dmft_proj2
Quantum Impurity Solvers
hybrid split hfqmc
loop over impurity

solvers atomic solver ctqmc
4.3 LDA+DMFT 计算程序: 实现细节
dmft_energy hubbard-I
loop over self-energy
conv test1
dmft_charge
loop over charge conv test2
步骤I: 根据给定的电子占据数 NKS ，确定修正后的化学势 µ18 。关于给定电子占据数，搜索化学势的

具体算法请参阅第4.3.5小节与第4.3.6小节。
步骤J: 根据给定的自能函数与化学势，在受限子空间 W 中计算 Brillouin 区积分 (参见公式 (4.36))，

求出有相互作用的格林函数 G(iω)，再根据 Dyson 方程定出有相互作用的杂化函数 ∆(iω) 与杂质能级
Eimp 19 。注意到此时习惯将双计数项与化学势都收缩到 Eimp 中去。
∫
1 3
Eimp = d k (HKS (k) − Σdc − µI) , (4.60)
Ωbz
∆(iω) = (iω)I − Eimp − G−1 (iω) − Σ(iω). (4.61)
关于 Brillouin 区积分算法的具体细节请参考第4.3.7小节。
步骤K: 在受限子空间 W 中混合新旧杂化函数 ∆(iω)，产生更新的杂化函数20 。特别地，如果这是

LDA+DMFT 计算的第一重循环，不存在旧的杂化函数，那么略过此步骤。
步骤L: 将杂化函数 ∆(iω) 由受限子空间 W 投影至关联轨道子空间 C，获得 ∆R (iω)，杂质能级矩阵

Eimp 亦须做类似的投影21 。
步骤M: 在关联轨道子空间 C 中将杂化函数 ∆R (iω) 按照关联原子索引 R 进行拆分，然后将杂化函数

拷贝至对应的文件夹中去，杂质能级亦须经过类似的处理22 。
步骤N: 调用量子杂质模型求解器，求解杂质模型23 。正如上文所说的那样，由于在真实的关联电子

材料中，可能存在着多个不等价的关联原子。对于每个关联原子，都有对应的杂质模型，因此在此步骤
中，需要对每个不等价的杂质模型都调用一次量子杂质模型求解器，输出对应的电子自能函数。关于量
子杂质模型求解器的详细说明，请参阅本文第2章与第3章。至于选择何种量子杂质模型求解器，选择权
完全交给用户。
步骤O: 计算 LDA+DMFT 总能量24 ，这一步是可跳过的25 。
步骤P: 收敛性测试，检验电子自能函数 Σ(iω) 与杂化函数 ∆(iω) 是否收敛26 。如若不收敛，那么跳

跃至步骤C继续进行迭代，如果收敛，那么执行步骤Q。
步骤Q: 计算 LDA+DMFT 电荷密度 ρLDA+DMFT 27 ，这一步是可跳过的。如果没有这一步，就是非电荷

自洽的 LDA+DMFT 计算方法，如果执行这一步，就是全电荷自洽的 LDA+DMFT 计算方法。
18 具体实现为 dmft_mune 程序。
19 具体实现为 dmft_ksum 程序。
20 具体实现为 dmft_mixer 程序。
21 具体实现为 dmft_proj2 程序。
22 具体实现为 hybrid_split.py 程序。
23 具体实现为调度脚本程序 solver_schedule.py 以及相应的量子杂质模型求解器 (参见表3.1)。
24 具体实现为 dmft_energy 程序。
25 如果不是全电荷自洽的 LDA+DMFT 计算，计算总能量并没有太大的意义。
26 具体实现为 conv_test1.py 程序。
27 具体实现为 dmft_charge 程序，与局域轨道的选取以及第一性原理计算软件的基函数密切相关。
步骤R: 收敛性测试，检验 LDA+DMFT 电荷密度 ρLDA+DMFT 是否收敛28 。如若不收敛，那么跳跃至

步骤A 继续进行迭代计算，如果收敛，那么执行步骤S。
步骤S: 计算谱函数、能带结构、光学性质、费米面等物理量29 。相关物理量的计算方法请参阅
第4.3.8小节。
以上就是完整的 LDA+DMFT 计算流程，其中步骤G∼ 步骤L被称之为 LDA+DMFT 内核，乃是 LDA
+DMFT 接口中最为关键的部分，而步骤N则是最为耗时的部分。
4.3.2 技术路线的选择
我们在开发 LDA+DMFT 计算程序时，为了使其具有 (1) 使用方便灵活；(2) 程序健壮；(3) 易于扩展

维护等特点，经过反复的权衡取舍，拟采用如下的技术路线。
(1) 将 LDA+DMFT 计算软件包划分为不同的模块，对计算速度要求高的模块采用 Fortran 90 语言编
写，对计算速度要求不高但是强调灵活性的模块采用 Python 脚本语言编写，所有的模块都采用 Python
脚本语言链接起来，所有的计算模块都要求支持 MPI 并行。
(2) 每个计算模块均被设计为即可单独执行，也可以与其它的模块配合执行。模块与模块之间完全通
过文件交换数据，通过 Python 脚本动态产生的配置文件传递模块控制参数。
(3) 开发平台瞄准 Linux 系统，Python 脚本语言的版本瞄准 3.0+，Fortran 90 语言编译器的版本瞄
准 Intel Fortran 11.0+，MPI 并行的实现瞄准 MPICH 2.0+。Python 库要求支持 numpy、scipy、与
matplotlib。线性代数库要求支持 BLAS 与 LAPACK。
(4)LDA 计算部分拟采用 ABINIT 126 与 QUANTUM ESPRESSO 127 ，但是预留与其它第一性原理计算
程序的接口。ABINIT 与 QUANTUM ESPRESSO 是两种应用十分广泛的基于赝势平面波方法的密度泛
函理论计算软件，它们本身支持多种局域轨道，十分有利于 LDA+DMFT 接口程序的开发。
(5)DMFT 计算部分拟支持 Hirsch-Fye 量子蒙特卡洛杂质求解器 (HF-QMC) 48 、弱耦合展开连续时间
量子蒙特卡洛杂质求解器 (CT-INT) 59 与强耦合展开连续时间量子蒙特卡洛杂质求解器 (CT-HYB) 58 ，但
是预留与其它杂质模型求解器的接口。HF-QMC 与 CT-INT 杂质求解器需要的输入为 Eimp 与 G0 (iω)，
而 CT-HYB 杂质求解器需要的输入为 Eimp 与 ∆(iω)，它们的输出都是 Σ(iω)、 G(iω) 与 nDMFT 。
(6) 由于量子蒙特卡洛杂质求解器通常工作在虚频上，因此我们在虚频 (即 matsubara 频率) 上实现
LDA+DMFT 接口，但是预留实频的接口。
(7) 初步暂不考虑实现全电荷自洽的 LDA+DMFT 计算方法，但是预留相关的接口。
4.3.3 局域轨道的选择
对于一个成熟的 LDA+DMFT 软件包而言，有三个方面是最重要的:(1)Bloch 基矢的选择；(2) 量子杂

质模型求解器的性能；(3) 关联轨道的选择。现代第一性原理电子结构计算软件已经基本解决了第一个问
28 具体实现为 conv_test2.py 程序。
29 具体的实现为hibiscus项目。
题。随着连续时间量子蒙特卡洛杂质求解器的迅速发展，第二个问题也得到了比较完满的解决。但是哪
种关联轨道是最佳的选择这一问题并没有得到很好的研究。K. Haule 给出了关于最优关联轨道的四条标
准 135 ，分别是:(1) 能正确给出关联电子轨道的谱权重；(2) 不破坏 DMFT 方程的因果率；(3) 能精确地
表示杂化函数；(4) 能精确地表示动能算符以及电荷密度算符。
在我们目前实现的 LDA+DMFT 计算框架中，由于采用的是通用接口的设计，因此对于关联轨道的
具体形式并没有特殊的要求。经过测试，我们的 LDA+DMFT 计算框架目前支持下述三种局域轨道，分
别是:(1) 最局域化的 Wannier 函数 (maximally localized Wannier functions, MLWFs) 128 。ABINIT 和
QUANTUM ESPRESSO 软件与 WANNIER90 程序都有比较完善的接口，可以利用 WANNIER90 程序
产生最局域化的 Wannier 函数以及相应的交叠矩阵。最局域化的 Wannier 函数其实并不太适合用作
LDA+DMFT 计算的局域轨道，这是因为 Wannier 函数的中心并没有落在相应的原子上，而是落在化学
键的重心处，几乎不具备原子轨道的对称性。但是很多第一性原理计算软件都支持与 WANNIER90 程
序的接口，都能够产生最局域化的 Wannier 函数。也就是说，除了 ABINIT 与 QUANTUM ESPRESSO
软件之外，我们的 LDA+DMFT 计算框架还能够与很多其它的第一性原理计算软件相互对接，例
如 FLEUR、WIEN2K、VASP、SIESTA 等等。(2) 原子心的 Wannier 函数 (atomic-centered Wannier
functions, ACWFs) 144 。QUANTUM ESPRESSO 通过一个插件程序30 支持此类型的局域轨道。顾名思
义，原子心的 Wannier 函数保留了原子轨道的对称性，其中心点位于相应原子处，但是它的局域性
较差，存在着比较长的"tail"。(3) 投影缀加波框架下的全电子原子分波 (all-electron atomic partial
waves, AAPWs) 134 。ABINIT 在投影缀加波计算模式下支持此局域轨道。该类型的局域轨道同样保留了
原子轨道的对称性，而且能精确地表示电荷密度算符与动能算符，比较适合于实现全电荷自洽的 LDA
+DMFT 计算方法。
4.3.4 双计数项的选择
双计数项是 LDA+DMFT 哈密顿量中十分重要的一项 (参见公式 (4.26))，主要用于扣除在密度泛函理

论中已经包含的局域相互作用部分。在 LDA+DMFT 计算框架中，我们习惯将其与电子自能函数收缩在
一起，命名为 Σdc 。对于在密度泛函理论中已经包含的局域相互作用，并不存在着一个严格的定义，因
此双计数项自然也没有一个严格的表达式 150 。目前在 LDA+DMFT 计算框架内，双计数项有很多种近似
的经验公式，本小节主要讨论 Σdc 的主流计算方法。
(1) 双计数项为 0。在 LDA+DMFT 迭代计算的第一步， Σ(iω) = 0，将双计数项同样设为 0 有助于
保持迭代计算过程的数值稳定性。
Σdc = 0. (4.62)
(2) Around Mean-Field (AMF) 形式 151 。AMF 形式的双计数项来自于 LDA+U 计算，主要适用于

强关联金属体系的计算。
2l
ΣAMF
dc,up = U Ndn + (U − J)Nup , (4.63)
2l + 1
30 参见 QUANTUM ESPRESSO 软件包中的 wann_ham.x 程序。
2l
ΣAMF
dc,dn = U Nup + (U − J)Ndn
. (4.64)
2l + 1
式中， Nup 与 Ndn 分别是自旋朝上与自旋朝下的关联电子占据数， l 为关联轨道的角量子数，对于 d 电
子壳层 l = 2，对于 f 电子壳层 l = 3。
(3) Fully Local Limit (FLL) 形式 151 。FLL 形式的双计数项同样来自于 LDA+U 计算，主要适用于
Mott 绝缘体以及能带绝缘体的计算。
ΣFLL
dc,up = U (Nup + Ndn − 0.5) − J(Nup − 0.5), (4.65)
ΣFLL
dc,dn = U (Nup + Ndn − 0.5) − J(Ndn − 0.5). (4.66)
从上面的公式可以看出，FLL 形式的双计数项是自旋相关的，但是下面这种非自旋相关 FLL 形式的双计

数项也有部分研究者在使用 13 :
ΣFLL
dc = Ū (Nup + Ndn − 0.5). (4.67)
式中 Ū 表示平均有效的 Coulomb 相互作用，其计算公式如下所示:

U + (M − 1)(U − 2J) + (M − 1)(U − 3J)
Ū = , (4.68)
2M − 1
其中 M 为关联能带的数目。K. Haule 等人提出了如下轨道相关的 FLL 形式 146 :
ΣFLL
dc,ασ = U (Nf − nα ) − J(Nf − nα ),
σ σ σ
(4.69)
其中 α 为轨道指标， σ 为自旋指标， Nf 为关联轨道的总电子数， nσα 表示关联轨道 α 上具有自旋取向

σ 的电子占据数。此双计数项形式在 HYF+DMFT 计算中使用过。
(4) Jan Kǔnes 等人 152,153 在对 NiO、MnO 等电荷转移型绝缘体的 LDA+DMFT 计算中应用了如下
形式的双计数项。
Σdc = (2M − 1)Ū nLDA (4.70)
(5) G. Kotliar 等人 154 在研究 Fe、Co、Ni 等过渡金属磁性的时候提出了如下形式的双计数项。

1
Σdc = TrΣ(0), (4.71)
2
又或者
1
Σdc = TrΣ(∞). (4.72)
2
4.3.5 占据数计算算法
给定化学势 µ，如何计算总电子占据数或者是轨道占据数并不是一个无足轻重的小问题，它能直接影
响 LDA+DMFT 自洽迭代计算的稳定性。电子占据数的一般定义式如下所示:
∑ +
N =T eiωn 0 G(iωn ). (4.73)
iωn
我们通常使用下面的公式进行计算:
∑∑ 1
Nα = T , (4.74)
iωn
iωn + µ − αk (iωn )
k
以及
∑
N= Nα . (4.75)
α
其中 N 是总电子占据数， Nα 是轨道占据数， α 为轨道指标， αk (iωn ) 是哈密顿量 HKS (k) + ∆Σ(k, iωn )
的本征值。
在利用公式 (4.74) 计算轨道占据数时，我们注意到这样一个问题: 公式的右侧表达式存在着很长
1
的"tail"∼ iωn ，如果要获得精确的轨道占据数，必须对许多 matsubara 频率点进行求和，这样做是很
不经济且十分低效的。那么解决办法是: 首先扣除掉"tail" 部分，利用公式 (4.74) 计算剩余部分的贡献，
而"tail" 部分的贡献可以解析求出，最后将这两部分的贡献加总在一起即可。实际上轨道占据数 Nα 的计
算公式如下所示 135 :
∑ ∑∑[ 1 1
]
Nα = f (∞
αk − µ) + 2T − . (4.76)
iωn
iωn + µ − αk (iωn ) iωn + µ − ∞
αk
k k
上式右侧第一项是"tail" 部份的贡献，右侧第二项是剩余部分的贡献。 f () 为 Fermi-Dirac 分布函数，

∞
αk
实际上是哈密顿量 HKS (k) + ∆Σ(k, i∞) 的本征值。K. Haule 等人还提出了另一种稍有变化的计算方
法 135 ，他们的计算公式为:
∑ ∑ ∑ [ ]
1 1
Nα = f (0αk − µ)+2T −
iωn + µ − αk (iω n ) iωn + µ − 0αk
k k 0<ωn <ωN
( ∞ ) ( 0 ) (4.77)
1 −µ 1 −µ
− arctan αk + arctan αk .
π ωN π ωN
式中 ωN 为预先选定的某个截断频率， 0αk 为哈密顿量 HKS (k) + ∆Σ(k, iω0 ) 的本征值，此时 ω0 泛指
任意 matsubara 频率点，我们通常将其固定为最低频率点或者最高频率点。在公式 (4.77) 中，如果取
ω0 = ∞，那么将回归为公式 (4.76)。公式 (4.77) 右端的第二项需要对大量 matsubara 频率点进行频率
求和，在实际的计算中，我们首先创建一个 matsubara 频率点的对数网格，在此对数网格中进行初步计
算，然后再将计算结果插值回线性 matsubara 频率网格中，最后再求和，这个算法能极大地提高电子占
据数的计算效率。
4.3.6 费米面搜索算法
确定费米面 (也就是化学势) 是 LDA+DMFT 迭代计算流程中一个十分关键的步骤，其主要思想是扫

描能量频率的网格点，应用前一小节介绍的算法计算对应的电子占据数，确定与目标电子占据数31 所对
应的那个频率点或者是频率范围32 。在 LDA+DMFT 自洽计算框架中，我们发展了两套不同的算法来确
31 此处的目标电子占据数既可以是名义占据数，也可以是来自于 LDA 计算结果的 nLDA ，还可以是来自于 LDA+DMFT 迭代计算
所得到的 nLDA+DMFT 。
32 对于金属态而言化学势是一个点。对于绝缘体而言，化学势存在于能隙之中，简而言之，它有一个频率范围，为了消除这种不
确定性，我们定义化学势存在于能隙的中点。
定化学势，它们分别是 bisection 算法以及 bracketing 算法。
bisection 算法又称为二分法，是最简单最常见的费米面搜索算法。该算法的要点是首先大致确定费
米面的左右边界，然后计算中点处的电子占据数，判断费米面位于中点的左侧还是右侧，然后再确定新
的左右边界，这样迭代下去直至费米面收敛。bisection 算法的优点是计算效率很高，大约 20 ∼ 30 个迭
代之后便可确定费米面的具体位置，缺点是仅对金属体系适用，对于绝缘体态来说不可靠。
bracketing 算法是我们新发展的一套新算法，它克服了 bisection 算法的缺点，能精确地标定费米

面的位置，而且无论是金属体系还是绝缘体系都能够很好地适用。该算法的要点是首先大致确定费米面
的左右边界，然后均分网格为 103 份或者是 210 份，分别从左右两端开始扫描这些网格点，确定每一个
网格点上的电子占据数，分别在左右两端找出电子占据数恰好等于目标电子占据数的首个网格点33 。以
这两个网格点为新的左右边界，再次均分网格，继续进行扫描。这样迭代计算 3 次左右，就可以十分精
确地确定费米面的位置了。bracketing 算法的优点是精确，适用性好，缺点是计算量很大，计算效率远
低于 bisection 算法。对于绝缘相的系统，我们强烈建议采用 bracketing 算法以确定费米面。
4.3.7 Brillouin 区积分算法
Brillouin 积分是 LDA+DMFT 自洽计算框架中一个十分重要的模块，它的主要作用是通过 Brillouin

区积分计算晶格格林函数 G(iω)，然后再通过 Dyson 方程计算杂化函数 ∆(iω) 以及杂质能级 Eimp 。所
谓的 Brillouin 区积分，实际上就是公式 (4.36)，为了讨论方便起见，此处我们重新列出此公式:
∫ [ ]
1 3 1
Gαα0 (iω) = d k . (4.78)
Ωbz (iω + µ)I − HKS (k) − ∆Σ(k, iω) αα0
在上式中，需要特别注意的是 α(α0 ) 为 Bloch 轨道的指标， HKS (k) 以及 ∆Σ(k, iω) 都是在 Bloch 空间
B 或者是受限子空间 W 中表出。如果杂质求解器是工作在虚频上，那么此积分也是工作在虚频上。如
果杂质求解器工作在实轴上34 ，那么在公式 (4.78) 中须得将 iω 置换为 ω，其余保持不变。
为了讨论方便，我们首先定义这样的一个中间矩阵 HKSUM :
HKSUM = (iω + µ)I − HKS (k) − ∆Σ(k, iω). (4.79)
那么通过公式 (4.78) 计算 Brillouin 区积分有如下三种途径:

−1
(1) 对于每一组波矢量 k 以及频率点 iω，我们直接求解矩阵 HKSUM 的逆矩阵 HKSUM ，然后通过 k 求
和把不同波矢量的贡献加总起来即可。这个办法是最简单也是最可靠的，但是效率也是最低的。求逆矩
阵时需要用到 LAPACK 线性代数库的 ZGETRI 与 ZGETRF 函数35 。
33 对于金属态，这左右两个网格点可能是重合的，对于绝缘体，这左右两个点可以看作是导带顶与价带底。不管怎么样，这两个
网格点的中点位置就是费米面的估计值。
34 例如 Hubbard-I 近似或者是 NCA/OCA 等杂质求解器都是工作在实轴上。
35 如果 H
KSUM 是厄米矩阵，那么用 ZHETRF 与 ZHETRI 函数求逆矩阵的效率更高。
−1
(2) 对于每一组波矢量 k 以及频率点 iω，我们间接求解矩阵 HKSUM 的逆矩阵 HKSUM ，然后通过 k 求
−1
和把不同波矢量的贡献加总起来。由于矩阵 HKSUM 与 HKSUM 满足如下恒等关系:
−1
HKSUM HKSUM = I, (4.80)
这一等式可以类比于线性系统:
AX = B, (4.81)
−1
因此令 A = HKSUM ， B = I，那么求解此线性系统得到的 X 矩阵就是我们所要求的逆矩阵 HKSUM 。求
解线性系统时需要用到 LAPACK 线性代数库的 ZGESV 函数36 。此方法比第一个方法在计算效率上要提
高 30% 左右，而计算结果是完全一致的。
(3) 利用解析四面体积分方法计算公式 (4.78)。将 Brillouin 区按照一定的规则划分为多个四面体，这
些四面体的每个顶点都对应着一个波矢量 k，那么 Brillouin 区积分就转化为对这一个个四面体的积分，
然后再把每个四面体对积分式的贡献加总起来。我们重新定义中间矩阵 HKSUM 如下:
HKSUM (k, iω) = HKS (k) + ∆Σ(k, iω)， (4.82)
对角化此矩阵得到:
HKSUM (k, iω) = AR (k, iω)E(k, iω)AL (k, iω), (4.83)
其中 AR 与 AL 分别为本征右矢与本征左矢， E 为相应的本征值37 。利用 AL AR = I 这一广义正交关

系，不难证得: ∫ [ ]
1 3 AR (k, iω)AL (k, iω)
Gαα0 (iω) = d k . (4.84)
Ωbz (iω + µ)I − E(k, iω) αα0
借助于四面体积分方法，那么上述积分可以表示为
ν ∑∑∑ i R i
ntet 4
i
Gαα0 (iω) = wnγ Aαγ (kn , iω)AL
γα0 (kn , iω), (4.85)
Ωbz γ n=1 i=1
i
wnγ = ri (z, 1nγ , 2nγ , 3nγ , 4nγ ). (4.86)
i
在上式中， ntet 为四面体的数目， γ 为能带指标， ν 为四面体的体积， kn 表示第 n 个四面体第 i 个顶
i
点的波矢量， wnγ 表示第 γ 条能带第 n 个四面体第 i 个顶点的积分权重， z = iω + µ， 1nγ ∼ 4nγ 代表
36 如果HKSUM 是厄米矩阵，那么用 ZHESV 函数求解线性系统的效率更高。
37 对于广义本征值问题，有:
HAR = EAR ,
AL H = EAL .
它们满足以下关系:
AL AR = I,
AL HAR = E,
AR EAL = H.
我们通常利用线性代数库 LAPACK 的 ZGEEV 函数对角化此广义本征值问题。

第 n 个四面体其四个顶点的本征值。由于此积分是在复平面中进行的，因此传统的 Blöchl 算法 155 是不

适用的，必须使用 Lambin-Vigneron 算法 156 以计算四面体积分权重 wnγ
i
。关于 Lambin-Vigneron 算
法的进一步信息请参阅本文附录A.7。此方法的计算效率在这三种方法当中是最高的，同时计算精度不逊
于上述两种计算方法。
4.3.8 物理量计算算法
在 LDA+DMFT 迭代计算完毕之后，我们需要对计算结果进行后处理，以获得所需要的物理量。我们
目前所使用杂质求解器为量子蒙特卡洛杂质求解器，这给后处理工作带来了额外的困难。这是因为量子
蒙特卡洛杂质求解器通常都是工作在虚轴上的，它们的输出结果为虚时格林函数 G(τ ) 与虚频电子自能
函数 Σ(iω)，与真实的可观测物理量之间没有直接的联系。因此如要得到有意义的物理量，须先得对虚
时格林函数与虚频电子自能函数进行解析延拓，将它们变换至实轴，然后才能进行后续的计算。下面我
们简要地介绍进行后处理计算可观测物理量的基本步骤。
(1) 虚时格林函数的解析延拓: 量子蒙特卡洛杂质求解器最主要的输出就是虚时格林函数 G(τ )，那

么首要的任务就是将 G(τ ) 解析延拓至实轴，得到 G(ω)，再由 G(ω) 可进一步求出杂质谱函数 A(ω)。
G(τ ) 与 A(ω) 之间存在着如下关系38 :
∫ ∞
e−τ ω
G(τ ) = dω A(ω), (4.87)
−∞ 1 + e−βω
并且
1
A(ω) = − =G(ω). (4.88)
π
根据公式 (4.87)，最直截了当的做法是直接对 G(τ ) 进行反 Laplace 变换，即可求得 A(ω)。但是这样做
e−τ ω
是行不通的，因为 G(τ ) 是通过蒙特卡洛算法抽样得来，数据质量比较差，而公式右侧的内核 1+e−βω
又
比较" 奇异"，只要 G(τ ) 存在着一点误差，就会导致 A(ω) 产生巨大的改变，所以这种方法求得的 A(ω)
是完全不可靠的。从理论上说，两个完全不同的 G(τ )，经过反 Laplace 变换后能得到完全相同的谱函数
A(ω)，反之也同理。实际上标准的做法是采用最大熵方法 (maximum entropy method, MEM) 157 或是
随机解析延拓方法 (stochastic analytic continuation, SAC) 158--160 来处理 G(τ )，然后直接输出 A(ω)。
关于最大熵方法以及随机解析延拓方法的相关信息，请分别参考附录A.1与A.2。
知道了 A(ω)，那么根据公式 (4.88) 就相当于知道了 G(ω) 的虚部，再利用 Kramers-Kronig 变换关

系: ∫ ∞
1 =G(ω)
<G(ω) = − dω 0 , (4.89)
π −∞ ω − ω0
就能够求出 G(ω) 的实部来。
38 对于虚频格林函数，那么还存在着这样的关系:
∫ ∞ A(ω)
G(iωn ) = dω .
−∞ iωn − ω
(2) 紫外光电子能谱的计算: 杂质谱函数 A(ω) 乘以 Fermi-Dirac 分布函数 f (ω) 即可获得理论紫外光

电子能谱，如下式所示:
A(ω)
APES (ω) = A(ω)fT (ω) = ω−µ . (4.90)
1 + e kB T
由于实验仪器的分辨率是有限的，为了能够与实验数据相比较，须得考虑对理论曲线进行 Gaussian 展
宽，具体计算公式如下所示:
∫
1 (ω−ω 0 )2
ÃPES (ω) = dω 0 √ e 2σ2 APES (ω 0 ), (4.91)
2πσ
其中 σ 为展宽因子，对于高分辨率的紫外光电子能谱实验， σ 可以取为 0.1，至于其它情况 σ 的取值范
围在 0.2 ∼ 0.36 之间，大致上与实验分辨率保持一致。
(3)X 射线吸收谱的计算: 杂质谱函数 A(ω) 乘以反 Fermi-Dirac 分布函数 f (−ω) 即可获得理论 X 射
线吸收谱，如下式所示:
A(ω)
AXAS (ω) = µ−ω . (4.92)
1 + e kB T
为了能够与实验谱线相比较，同样须得对上述理论曲线进行 Gaussian 展宽操作，具体计算公式与公式
(4.91) 完全一致，展宽参数 σ 的取值范围在 0.2 ∼ 0.4 之间。
(4) 准粒子权重 Z 的计算: 准粒子权重 Z 的定义为有效质量与名义质量的比值:
m
Z= . (4.93)
m∗
它可以通过实频自能函数的实部 <Σ(ω) 来计算 9 ，
1
Z= . (4.94)
1− ∂ω <Σ(ω)|ω=0
∂
如果难以获得实频自能函数 Σ(ω)，只有虚频自能函数 Σ(iω)，那么可以通过下述 Eliashberg 公式估算

准粒子权重:
1
Z∼ =Σ(iω1 )
. (4.95)
1− πT
该公式只有在低温区域才是近似成立的，在高温区域并不成立。可以证明，只要 Luttinger 定理成立，

亦即 =Σ(ω = 0) = 0，在 T → 0 极限时，公式 (4.94) 严格等价于公式 (4.95)。
(5) 虚频自能函数的解析延拓: 虚频自能函数 Σ(iω) 也是量子蒙特卡洛杂质求解器的主要输出，将其
解析延拓至实轴得到 Σ(ω) 同样十分重要，因为许多可观测物理量的计算都严重依赖于 Σ(ω)。关于虚频
自能函数的解析延拓目前并无一个通用的为人所广泛接受的解决方案。如果虚频自能函数的数据质量较
佳，那么可以利用 Páde 近似，如果虚频自能函数的数据质量不佳，那么 Gaussian 多项式拟合方法是
一个比较好的选择。具体的细节请参阅相关的文献 135 ，此处不再展开讨论。
(6) 晶格格林函数以及晶格谱函数的计算: 得到实频自能函数 Σ(ω) 之后，那么我们可以直接在实轴上
计算晶格格林函数
∫ [ ]
1 3 1
G αα0 (ω) = d k , (4.96)
Ωbz (ω + µ)I − HKS (k) − ∆Σ(k, ω) αα0
以及晶格谱函数:
1
Aαα0 (ω) = − =Gαα0 (ω). (4.97)
π
晶格谱函数中不但包含了关联轨道的信息，也包含了非关联轨道的信息，比杂质谱函数更接近于实验
值，因而也更有用。利用此方法获得的关联电子轨道的谱函数应与由最大熵方法或者是随机解析延拓方
法获得的谱函数基本上保持一致。
(7) 角分辩光电子能谱的计算: 角分辩的晶格谱函数 A(k, ω) 就是角分辩光电子能谱的理论值。只要有

实频自能函数的数据，其计算十分简便:
[ ]
1
Gαα0 (k, ω) = , (4.98)
(ω + µ)I − HKS (k) − ∆Σ(k, ω) αα0
以及
1
Aαα0 (k, ω) = − =Gαα0 (k, ω). (4.99)
π
特别需要注意的是公式 (4.98) 与公式 (4.99) 中的波矢量 k 须得沿着某些特定的高对称方向，例如 f cc 晶
格中的 Γ − L 高对称线等等。
(8) 光学性质的计算: 只要知道了实频自能函数，同样可以计算强关联电子体系的光学性质。光电导率

σ(ω) 计算公式如下所示 161,162 :
∫
2πe2 ~ ∑ f (ω 0 ) − f (ω 0 + ω)
<σαβ (ω) = dω 0 Tr {vα (k)A(k, ω 0 )vβ (k)A(k, ω 0 + ω)} . (4.100)
Ωbz ω
k
在上式中， f (ω) 为 Fermi-Dirac 分布函数， vα (k) 是 Fermi 群速度，

[ ]
1 ∂HKS (k)
vα (k) = , (4.101)
~ ∂k αα
A(k, ω) 为角分辩的晶格谱函数。此时波矢量 k 在整个 Brillouin 区中必须是均匀分布的。
有了实部的光电导率 σαβ (ω)，那么根据 Kramers-Kronig 变换关系就可以得到虚部的光电导率，介

电函数 (ω) 可由下式求出:
4πiσ(ω)
(ω) = 1 + , (4.102)
ω
自介电函数可以进一步求出折射率 n(ω) 与反射率 R(ω)，进而得到所有的光学性质:
√
(ω) = n(ω) + iκ(ω), (4.103)

1 − κ(ω) 2
R(ω) = . (4.104)
1 + κ(ω)
自然地，我们可以利用类似的技术求出强关联电子体系的其它输运性质，例如热电性质，热导率等
等，对此感兴趣者可参阅相关的文献 9,132,135 。
4.3.9 并行加速技术
在此 LDA+DMFT 计算框架中，所有的量子杂质模型求解器都是高度优化并且完全并行化的，对
此无须赘言。除此之外，所有的 LDA+DMFT 计算模块也都是并行化的，均支持基于消息传递接口
(message passing interface, MPI) 的并行化技术。
在所有的 LDA+DMFT 计算模块中，Brillouin 区积分模块 (dmft_ksum 程序) 与费米面搜索模块

(dmft_mune 程序) 是最为耗时的。对于 Brillouin 区积分模块而言，需要对每个 matsubara 频率点都
计算一次积分，matsubara 频率点的数目一般是 213 个，而 Brillouin 区积分所涉及到的 k 点数目一般
是 10 × 10 × 10 或者是 12 × 12 × 12，显而易见，如果采用常规方法循规蹈矩地进行计算必然要耗费大
量的计算时间。我们的解决办法是:(1) 采用对数网格，将拥有 213 个 matsubara 频率点的线性网格映射
到 512 个频率点的对数网格中39 。这样我们就可以在这大大缩小后的对数网格上计算 Brillouin 区积分，
然后再利用立方样条插值方法将计算结果由对数网格插值回原来的线性网格中。这个计算技巧至少可以
将计算量减少一个数量级以上，同时计算精度基本上没有什么损失。(2)Brillouin 区积分模块的核心部分
是一个对于 matsubara 频率点的循环，可以利用 MPI 多进程并行技术对此循环进行加速。每个进程依
次负责计算一个频率点的 Brillouin 区积分，计算完毕后，再接手计算下一个仍未被触及的频率点，这样
直至所有频率点都计算完毕。这个算法类似于分发扑克牌的做法，可以最大限度地做到进程间的负载均
衡，能极大地改善计算效率，同时适用性也很广。通过应用上述两种计算策略，我们可以将 Brillouin 区
积分模块的计算时间压缩在 1 分钟以内，这个时间对于量子蒙特卡洛杂质求解器所耗费的时间来说显然
是微不足道的。
对于费米面搜索模块而言，bracketing 算法虽然十分精确，但是其计算效率要比 bisection 算法差

的多。bracketing 算法要精确计算大量频率点 (一般在 103 量级) 上的电子占据数，而且至少要反复精
化计算 3 遍才能达到所要求的精度，这个过程无疑是十分漫长耗时的。解决之道同样是应用 MPI 多进
程并行化技术，利用上述分发调度算法将频率点均匀分配至多个进程中进行计算，计算完毕后再调用
MPI_ALLGATHER 函数将计算结果都收集起来，并行加速比主要依赖于进程的数目。
4.4 本章小结
本章的主要内容可以划分为三大部分。所谓的 LDA+DMFT 迭代计算方法，LDA 部分是基础，是必

不可少的部分。正因如此，首先我们简要叙述了密度泛函理论的基本原理——Hohenberg-Kohn 定理
与 Kohn-Sham 方程，第一性原理电子结构计算方法以及主流的电子结构计算软件，密度泛函理论的局
限之处及其修正。其次，我们定义了 LDA+DMFT 计算方法的哈密顿量，定义了 Bloch 空间 B、受限子
空间 W 以及关联轨道子空间 C，并且推导了 LDA+DMFT 计算框架的基本公式，对于 LDA+DMFT 计
算方法的最新发展趋势也有所涉及。最后，我们讨论了自主开发的 LDA+DMFT 第一性原理电子结构计
39 实际上，前 128 个 matsubara 频率点是完全保留下来，剩余的 matsubara 频率点再映射到 512 − 128 = 384 个频率点的对
数网格上。
4.4 本章小结 115
算框架的各种实现细节，包括局域轨道的选择、双计数项的选择、电子占据数算法、费米面搜索算法、
Brillouin 区积分算法、各种可观测量与物理量的计算方法等比较关键的算法都有所介绍，足可为后来者
提供参考。本章的主要目的在于介绍现代的 LDA+DMFT 第一性原理电子结构计算框架，在第5 章将介
绍这一计算框架在真实的强关联电子材料中的应用。
第五章
LDA+DMFT 第一性原理计算方法: 应用实例
在第4章，我们已经介绍了 LDA+DMFT 计算框架的基础理论与实现细节，那么在本章，我们将详细

讨论 LDA+DMFT 第一性原理计算方法在强关联电子材料中的具体应用。本章结构如下:
第5.1节，主要关注于 3d 电子壳层过渡金属氧化物 SrVO3 的关联电子结构计算。我们分别考察了
Wannier 轨道的选择、Coulomb 相互作用的形式、动态屏蔽效应对于杂质谱函数以及电子能带结构
的影响。同时，SrVO3 也作为一种典型的关联电子材料，理论研究与实验研究都比较充分，是 LDA
+DMFT 软件包很好的一个测试对象。
第5.2节，主要关注于 3d 电子壳层过渡金属氧化物 CoO 的关联电子结构计算。我们发现在压力的作
用下，CoO 的 3d 电子轨道将会发生具有轨道选择性的绝缘体 − 金属相变，同时还将伴随着高自旋态 −
低自旋态的相变。这一计算结果能完满地解释 CoO 在高压下的电子结构演化现象。
第5.3节，主要关注于 4d 电子壳层过渡金属氧化物 BaRuO3 的关联电子结构计算。我们发现立方相
的 BaRuO3 是一个具有局域磁矩的弱关联金属，它的 4d 电子自能函数以及光电导率部分偏离了 Fermi
liquid 理论所预言的行为。
第5.4节是本章的一个小结。
5.1 SrVO3 : 关联电子结构计算
5.1.1 研究背景
过渡金属氧化物 SrVO3 具有立方相的钙钛矿 (perovskite) 结构，空间群属于 Pm3̄m，实验晶格常

数为 a0 = 7.2605 a.u。其电子结构配置为 3d1 (亦即 t12g e0g )，光电子发射谱以及 X-ray 吸收谱表明: 在
Fermi 面处有强烈的准粒子共振峰，在 Fermi 面两侧，分别存在着明显的上下 Hubbard 带，这体现了
118 LDA+DMFT 第一性原理计算方法: 应用实例
表 5.1: SrVO3 投影缀加波赝势生成参数
atomic symbol valence state 　 semicore state exchange-correlation rpaw PS scheme
Sr 4p5s 4s GGA-PBE 2.10 Bloechl
V 3p4s3d 3s GGA-PBE 2.00 Bloechl
O 2s2p GGA-PBE 1.91 RRKJ
典型的关联电子金属的特征。如果使用 Ca 原子逐渐替换掉 Sr 原子，早期的光电子能谱实验显示可能会

发生 Mott-Hubbard 形式的金属 − 绝缘体相变。但是相关的输运实验数据 (如 Sommerfeld 系数，电
阻，磁化系数等等) 并不支持这一观点。最近，应用高精度的光电子能谱 163 并结合 LDA+DMFT 计算方
法 164,165 重新研究了 SrVO3 以及 CaVO3 的电子结构与谱函数，最终确认它们都属于金属态，具有十分
相似的电子结构，从而与输运实验的数据达成一致。
由于 SrVO3 的晶体结构与电子结构都比较简单，通常作为一种理想的测试体系，用于检测各种 LDA
+DMFT 计算方法的可靠性与精确性，因而相关的研究文献可谓汗牛充栋，可以说我们对于 SrVO3 的电
子结构的了解已经比较充分了。本节使用自主开发的 LDA+DMFT 软件包，重新研究 SrVO3 的精细电子
结构。我们的目的有如下几点:(1) 测试自主开发的 LDA+DMFT 计算软件包的可靠性，重复文献中所报
道的理论计算结果与实验结果。(2) 考察关联轨道子空间 C 以及截断 Bloch 空间 W 的选择对于电子谱
函数的影响。(3) 考察关联作用的形式: 密度 − 密度相互作用以及广义相互作用对于计算结果的影响，同
时测试我们最新开发的基于 Newton-Leja 多项式插值算法的强耦合连续时间量子蒙特卡洛杂质求解器。
(4) 考虑具有频率依赖性的 Coulomb 相互作用 (亦即动态屏蔽效应) 对于 SrVO3 精细电子结构的影响。
5.1.2 计算细节
具体的 LDA+DMFT 计算步骤如下所示:

首先，使用第一性原理密度泛函理论计算软件包 ABINIT 6.12.1 126 进行基态计算，获取相关的电荷
密度分布，电子能带结构以及电子投影态密度。ABINIT 属于主流的基于赝势平面波方法的开源计算软
件，功能强大，使用方法灵活。经过严格的收敛性测试，我们选定平面波截断能为 15 Ha， k 点网格密
度为 12 × 12 × 12，能带数目为 30，交换 − 关联势选取为基于广义梯度近似的 PBE96 形式 115 ，采用
Fermi-Driac smearing 方式计算电荷占据数 123 ，SrVO3 的晶体结构以及原子坐标完全选用实验数据。
由于 ABINIT 并非全势全电子的计算软件，因此我们需要为 Sr、V、O 原子构造合适的赝势。经过仔细
权衡，我们决定采用投影缀加波 (projector augmented wave, PAW) 的赝势形式 125 ，PAW 赝势兼具
了精确性以及计算效率两大优点，对于 d 电子以及 f 电子体系是比较好的选择 123 。赝势产生程序为与
ABINIT 配套的 ATOMPAW 3.1。产生 PAW 赝势的关键参数如表5.1 所示。
其次，采用最局域化的 Wannier 函数 166 作为局域轨道，针对 V 原子的 3d 轨道以及 O 原子的 2p 轨
道构造低能有效哈密顿量 HWF (k)。所使用的软件是开源程序 WANNIER90 128 ，我们修改了该程序的输
5.1 SrVO3 : 关联电子结构计算 119
入/输出接口，使其能够产生与我们的 LDA+DMFT 软件包相互匹配的输入文件。对于 C 与 W 空间的选

择，我们考虑了下述几种情况:(1) C 与 W 空间都仅仅包含 V 的 3 条 t2g 轨道，那么 HWF (k) 是一个 3 × 3
的矩阵。(2)C 空间包含 V 的 3 条 t2g 轨道，但是 W 空间除此之外，还包含了 9 条 O 原子的 2p 轨道，
因此哈密顿量的维数为 12 × 12。(3) C 空间包含了 V 原子的 5 条 3d 轨道 (3 条 t2g 轨道以及 2 条 eg 轨
道)， W 空间除了这 5 条关联轨道以外，还包含了非关联的 9 条 O 原子的 2p 轨道，这样哈密顿量的维
数将变为 14 × 14。
再次，进行非电荷自洽的 LDA+DMFT 计算。DMFT 部分的杂质求解器为基于强耦合展开算法的连

续时间量子蒙特卡洛杂质求解器 58 。依据相互作用形式的不同，又可以细分为以下三种情况:(1) 密度
− 密度相互作用，此时 CT-QMC 选用基于段表示形式的版本 (azalea项目)，求解三带或者五带的杂
质模型。(2) 具有频率依赖性的 Coulomb 相互作用，此时 CT-QMC 必须选用段表示形式版本的变种
(narcissus项目), 求解三带或五带的杂质模型。(3) 包含自旋翻转项以及对跃迁项的的广义相互作用，此
时 CT-QMC 选用用基于 Newton-Leja 多项式插值算法的版本 (pansy项目)，求解五带的杂质模型。杂
质模型的温度参数统一设为 β = 10 或者是 β = 30，分别划分为 1024 或者 2048 个时间片 (time slice)。
除非特别声明，否则描述 Coulomb 相互作用的参数固定为 U = 6.0, J = 0.65。LDA+DMFT 迭代计算
的最大迭代次数为 24 次，以电子自能函数以及杂化函数作为收敛判据。由于 SrVO3 为金属态，因此
双计数项采用 AMF 形式 151 ，其表达式中的占据数取为 nDMFT ，可从杂质求解器的输出结果中读取。每
次迭代求解量子杂质模型时，蒙特卡洛杂质求解器的抽样次数都是 200000000 次， 8 ∼ 16 个进程并
行，同时应用了正交多项式表象算法 100 提高计算结果的精度。对于最终的计算结果——虚时格林函数
G(τ )，分别采用最大熵方法 157 或者是随机解析延拓方法 158 进行解析延拓，获取杂质电子谱函数 A(ω)。
采用 Gaussian 多项式拟合算法 135 对电子自能函数 Σ(iω) 进行解析延拓，得到 Σ(ω)，然后通过进一步
的计算得到角分辩的谱函数 A(k, ω)。
5.1.3 LDA 计算结果
我们首先来看 SrVO3 电子结构的 LDA 计算结果。在图5.1中给出了 SrVO3 的 LDA 能带结构。由图

清晰可见，O 原子的 2p 轨道能带与 V 的 3d 轨道能带之间约有 1.5 eV 左右的能隙，基本上没有什么杂
化。V 的 3d 轨道被晶体场劈裂为 3 条 t2g 轨道以及 2 条 eg 轨道，费米面穿过 t2g 轨道能带的中心，而
eg 轨道能带在费米面之上约 1 eV 处。 t2g 轨道能带与 eg 轨道能带之间有约 0.2 eV 的能隙。因此，仅
仅包含 3 条 t2g 轨道的模型是描述 SrVO3 电子结构的最简单的哈密顿量，如要得到更准确的结果，可依
次将 9 条 2p 轨道和 2 条 eg 轨道包含进去，至于能级更高的轨道则无此必要了。
5.1.4 密度 − 密度相互作用与广义相互作用
此前关于 SrVO3 电子结构的 LDA+DMFT 计算中 134,138,142,164,165 ，绝大部分的理论计算在处理关联

轨道子空间 C 时仅仅考虑了 3 条 t2g 轨道，少部分工作考虑了 3 条 t2g 轨道加上 2 条 eg 轨道。至于相
互作用的形式，所有的工作都仅仅考虑了密度 − 密度形式的相互作用。在本小节，我们将尝试考虑广义
10
5
Energy (eV)
-5
-10
R Γ X M Γ
图 5.1: SrVO3 的 LDA 能带结构。图中蓝色能带归属于 O 原子的九条 2p 轨道；绿色能带归属于 V 原子

的三条 t2g 轨道；红色能带归属于 V 原子的两条 eg 轨道。红色虚线表示费米面。
相互作用对于 SrVO3 电子结构的影响。我们构造的低能有效哈密顿量包含了 5 条 d 电子轨道以及 9 条

O 原子的 2p 轨道，因此受限子空间 W 的大小为 14。相互作用项的形式采用广义相互作用，包含自旋
翻转项以及对跃迁项， U = 6.0， J = 0.65。采用基于 Newton-Leja 多项式插值算法的强耦合展开连续
时间量子蒙特卡洛杂质求解器。为了相互比照，我们使用基于段表示算法的 CT-HYB 杂质求解器做了同
样的计算，除了相互作用项的形式不同以外，其余参数与前者完全一致。
在图5.2中给出了我们的主要计算结果。为了做比较，图中还给出了取自文献的其他研究者的计算结
果 134 ，他们使用的是十分经典的基于 Hirsch-Fye 算法的量子蒙特卡洛杂质求解器。如图所示，段表示
算法与 Hirsch-Fye 算法的计算结果十分相似， t2g 轨道的谱函数在费米面附近有显著的准粒子共振峰，
下 Hubabrd 带在 -5.0 eV 附近，上 Hubbard 带并不明显，而 eg 轨道的谱函数则呈现出绝缘体的结构，
在费米面处有一个比较大的能隙。这充分说明我们的 LDA+DMFT 软件包还是十分可靠的。在考虑了广
义相互作用后， t2g 轨道的谱函数发生了明显的变化。(1) 首先，准粒子共振峰的高度减少了 20%，权
重大大减少。(2) 在费米面附近出现了若干个小的"shoulder" 结构，这在段表示算法所得到结果中并不
明显。(3) 谱函数权重向高频区域迁移，在 5 eV 附近出现了一个很明显的峰。 eg 轨道的谱函数也有显
著的变化，例如费米面右侧的峰变得更高更锐利，并且高频区域的谱函数权重大大增加了。总而言之，
广义相互作用对于强关联电子材料电子结构的影响是十分显著的，在将来的 LDA+DMFT 计算中须尽可
能地将其考虑在内。
eg
1.4
t2g
1.2 CTQMC (Newton-Leja algorithm)
1
Intensity (a.u)
0.8
CTQMC (segment algorithm)
0.6
0.4
0.2 HFQMC
0
-15 -10 -5 0 5 10 15
Frequency (eV)
图 5.2: 由 LDA+DMFT 计算得到的 V 原子的 3d 轨道的单粒子谱函数。自上而下分别是使用 Newton-

Leja 算法、段表示算法、Hirsch-Fye 算法作为杂质求解器得到的结果。在 Newton-Leja 算法中，相互
作用项具有旋转不变性，包含了自旋翻转与对跃迁项；在段表示算法与 Hirsch-Fye 算法中，仅仅考虑
了密度 − 密度相互作用。通过 LDA+DMFT 计算获得 V 的 3d 电子的虚时格林函数之后 G(τ )，再应用
最大熵方法 157 或者是随机解析延拓方法 158 对其进行处理即可获得单粒子谱函数。Hirsch-Fye 算法的
计算结果来源于文献 134 。
5.1.5 动态屏蔽效应
本小节我们主要介绍相互作用的频率依赖性，亦即动态屏蔽效应对于 SrVO3 电子结构的影响。正如

第3章第3.3节所示，如要研究动态屏蔽效应，那么首先必须获得具有频率依赖性的相互作用 U (ω)，然后
再根据公式 (3.75) 计算出双积分推迟作用函数 K(τ )。从原则上说， U (ω) 一般可以通过无规相位近似
方法求得 103 ，但是在文献中早已报道了立方相 SrVO3 的 U (ω) 数据 102 ，因此我们采取拿来主义直接采
纳此数据，然后通过进一步的积分计算得到 K(τ ) 64 ，具体的计算结果如图5.3所示。此时温度参数定为
β = 10 与 β = 30，分别对应于 T = 1160 K 与 T = 386 K 的情况。Hund 交换耦合常数 J 通常是一个常
数，与频率无关，此处将其设为 0.65。
下面来展示主要的计算结果，我们首先来看是否考虑动态屏蔽效应对于 V 的 3d 轨道电子谱函数的
影响。在图5.4中给出了对于不同模型，不同温度的计算结果。如图所示，不管关联轨道有几条，受限
Bloch 子空间 W 的维数有多大，温度有多高，在考虑了动态屏蔽效应之后，电子谱函数都将发生明显的
变化。电子谱函数变化的共同趋势是: 费米面附近的准粒子权重峰变窄，肩峰结构消失或者减弱，大量谱
20 1.4
15
Coulomb Interaction U(ω)
1.2
10
1
5
0 0.8
K(τ)
-5 0.6
-10
0.4
-15
real part β=10
-20 0.2
(a) imag part (b) β=30
-25 0
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30
Frequency (eV) τt
图 5.3: 通过无规相位近似方法计算得到的具有频率依赖性的相互作用。(a) U (ω) 函数的实部与虚部，数

据取自文献 102 。(b) 双积分推迟相互作用函数 K(τ )，这是一个与温度有关的函数， β = 10 或者 β = 30。
函数权重向高频区域迁移，这与模型计算的结果是完全一致的 64 。我们注意到相互作用的频率依赖性最
近受到许多研究者的关注。除了 P. Werner 等人提出的动态屏蔽效应算法之外，A. Rubtsov 等人提出的
动态原子极限近似方法 (dynamic atomic limit approximation, DALA) 167 也能用于处理相互作用随频
率变化的模型。在 DALA 算法中，杂质虚时格林函数被分为两部分，第一部分来自于有效静态相互作
用模型的贡献，这部分可用普通的杂质求解器求出；第二部分则用一个 Bose 因子描述，这部分可利用
各种近似直接给出解析的表达式。A. Rubtsov 等人利用 DALA 方法研究了具有频率依赖性的相互作用
U (ω) 对于 SrVO3 中 V 的 3d 轨道电子谱函数的影响。在图5.4中比较了这两种算法的计算结果。由图可
见，总体上这两个谱函数符合得比较好，但仍然存在着一些细微的差别，比如说由动态屏蔽效应算法得
到的准粒子权重峰比较锐利瘦削，上下 Hubbard 带的位置也略有不同。
图5.5中分别给出了 V 的 3d 轨道的虚频与实频电子自能函数。我们首先来看虚频自能函数的虚部
=Σ(iω)。在考虑了动态屏蔽效应之后， =Σ(iω → 0) 的绝对值增大了将近两倍。根据公式 (4.95)，不难
得到准粒子权重 Z 将减小，电子有效质量 m∗ 将增大的结论。考虑静态相互作用时， m∗ ∼ 1.8，考虑动
态屏蔽效应时， m∗ ∼ 2.20 − 2.43。因此动态屏蔽效应具有增强电子关联效应，改变金属 − 绝缘体相界
的效果。再看实频自能函数的实部 <Σ(ω)。由图可见，在费米面附近正负 0.2 eV 范围内，电子自能函
数展现出线性行为 <Σ(ω) ∼ −ω，与文献中的报道完全一致 164 。根据 Fermi liquid 液体理论，由此处的
斜率同样可以求出准粒子权重 Z 以及电子有效质量 m∗ 。我们发现在考虑了动态屏蔽效应之后，斜率的

绝对值 ∂<Σ(ω)
∂ω | ω=0 要大于静态相互作用时的情况，由此经过进一步计算得到的准粒子权重和电子有效
质量与由虚频自能函数求得的数值符合得很好。我们注意到在费米面正负 0.2 eV 处都有"kink" 状的结
构，如果考虑了动态屏蔽效应的话这一结构将更为明显。这种"kink" 状结构是强关联电子系统的特征之
2
static U
dynamic U
1.5
-20 -15 -10 -5 15 20 25 30
(a)
Spectral function (a.u)
-20 -15 -10 -5 15 20 25 30

(b)
0.5
(c) -20 -15 -10 -5 15 20 25 30

0
-5 0 5 10 15
Frequency (eV)
0.45
DALA
0.4 CTQMC
0.35
0.3
Intensity (a.u)
0.25
0.2
0.15
0.1
0.05
0
-4 -2 0 2 4 6
Frequency (eV)
图 5.4: 由 LDA+DMFT 计算得到的动态屏蔽效应影响下 V 的 3d 轨道的电子谱函数。(上图) 分别考虑

动态屏蔽效应与静态相互作用计算结果的比较。考虑了以下三种情况:(a)Nwann =3, β=10; (b)Nwann =3,
β=30; (c) Nwann =12, β=10。 Nwann 为受限 Bloch 子空间 W 的维数，小插图展示了电子谱函数在高
频区域的行为。(下图) 动态屏蔽效应算法与 DALA 算法计算结果的比较。计算参数为 Nwann =3, β=10，
DALA 算法的计算结果来源于文献 167 。
1 1.5
Nwann=12, β=10 (a) (b)
0.9 1
0.5 N
wann=12, β=10
0.8
0
0.7 static U
-ImΣ(iω)
ReΣ(ω)
dynamic U -0.5 static U
0.6 static U dynamic U
-1
0.5 dynamic U
-1.5
0.4 -2 N
wann=3, β=10
0.3 Nwann=3, β=10 -2.5
0.2 -3
1 2 3 4 5 6 7 8 9 10 -3 -2 -1 0 1 2 3
iω ω
图 5.5: 由 LDA+DMFT 计算得到的 V 的 3d 轨道的电子自能函数。(a) 虚频自能函数的虚部 =Σ(iω)。(b)

实频自能函数的实部 <Σ(ω)，箭头标示费米面附近的"kink" 结构。主要的计算参数在图中有标示。
一，在相应的电子能带色散关系中也存在着类似的结构 168 。
在获得实频自能函数 Σ(ω) 之后，可以利用公式 (4.98) 进一步计算角分辩的谱函数，与相应的角分辩

光电子能谱实验数据相互比较 163,169 。图5.6给出了 LDA+DMFT 计算结果，在计算中，局域哈密顿量仅
仅包括了 3 条 V 原子的 t2g 轨道，同时温度参数固定为 β = 10。上图显示的是仅考虑静态相互作用 U
时的计算结果，图中的彩色虚线代表 LDA 能带计算的结果。由图可见 LDA+DMFT 计算得到的能带结
构相对于 LDA 计算得到的能带被重整化了，重整化因子 Z ∼ 0.5。下图显示的是考虑了动态屏蔽效应
U (ω) 后的计算结果，由图可见，此时能带结构的重整化程度更高，重整化因子 Z ∼ 0.4，带宽比仅考
虑静态相互作用时还要小 0.2∼0.3 eV，同时有大量的谱函数权重向高频区域迁移。如图中绿色箭头所
示，沿着 R − Γ 线以及 M − Γ 线，在 ±0.2 eV 处有明显的"kink" 结构，Vollhardt 等人曾预言 168 ，对
于任意强关联金属，只要其谱函数展现出典型的三峰结构，那么在能带色散关系中必会出现"kink" 状的
结构，这是关联电子体系的特征，"kink" 状结构出现的能量点决定着 Fermi liquid 理论的适用范围。显
然，在 V 的 3d 轨道的电子自能函数 (参见图5.5) 以及角分辩谱函数上出现的"kink" 状结构验证了他们
的预言。特别值得一提的是在考虑了动态屏蔽效应之后，"kink" 状结构出现的位置并没有改变，只是效
果变得更为明显罢了。
5.2 CoO: 压力驱动下的相变现象
我们的 LDA+DMFT 软件包不但能处理强关联金属体系，也能计算强关联绝缘体系统，CoO 就是一

个比较成功的测试案例。
5.2 CoO: 压力驱动下的相变现象 125
high
1.5
(a)
1
Energy (eV)
0.5
-0.5
-1 low
R Γ X M Γ
high
1.5
(b)
1
Energy (eV)
0.5
-0.5
-1 low
R Γ X M Γ
图 5.6: 由 LDA+DMFT 计算得到的立方相 SrVO3 的角分辩谱函数 A(k, ω)。(上图) 考虑静态相互作用时

的计算结果。(下图) 考虑动态屏蔽效应时的计算结果。图中彩色虚线表示 LDA 能带计算的结果，绿色箭
头标示费米面附近的"kink" 状结构。计算参数为 Nwann =3, β=10。
5.2.1 研究背景
CoO 属于 3d 壳层的过渡金属氧化物，NaCl 结构，它的基态是反铁磁电荷转移绝缘体，Néel 温度为

289 K 1 。高压输运实验发现，在 60 GPa 与 130 GPa 时，电阻数据出现了两个下降的陡坡，这意味着两
次绝缘体 − 金属相变，如果压力继续升高，电阻数据趋于 0，意味着 CoO 变为金属态 170 。同时，X 射
线发射谱实验表明 171,172 ，在 140 GPa 处，CoO 的磁性态将由高自旋态转变为低自旋态。CoO 在压力
作用下的相变现象受到了很多研究者的关注，可惜的是传统的计算方法根本无法全面地解释实验中观测
到的现象。Cohen 等人 173 利用首次利用 LSDA 以及 GGA 方法计算了 CoO 在高压下的电子结构，他
们采用 Stoner 理论来解释 CoO 的磁性相变。他们预言，由高自旋态向非磁态相变可能发生在 88 GPa
附近，这与实验事实明显不符，同时，由于他们没有考虑 Co 的 3d 电子间的关联作用，因此他们得到的
CoO 的基态为金属态，而光学实验数据表明，CoO 在室温下具有高达 1.8 ∼ 2.6 eV 的能隙 171 。随后，
Zhang 等人利用 LDA+U 方法同样研究了 CoO 中由于压力导致的磁结构相变 174 。他们认为，CoO 的
高自旋 − 低自旋相变具有 t52g e2g → t62g e1g 的特征。他们的计算结果虽然能解释高自旋 − 低自旋相变，也
能得到正确的能隙，但是却不能解释高压输运性质实验所反映的两次绝缘体 − 金属相变过程 170 。
有鉴于此，我们使用 LDA+DMFT 方法系统地研究了 CoO 在压力下的电子结构变化。指出在压力的

作用下，Co 的 3d 轨道将会发生典型的具有轨道选择性的绝缘体 − 金属相变，其中 t2g 轨道将首先发
生绝缘体 − 金属相变，变为金属态，随后 eg 轨道才发生类似的相变。同时 LDA+DMFT 计算还证明了
CoO 在压力作用下确实会发生高自旋态 − 低自旋态的相变。
5.2.2 计算细节
CoO 的 LDA+DMFT 计算细节与第5.1.2小节中的描述大同小异。
首先，我们使用 QUANTUM ESPRESSO 4.1.3 软件 127 对 CoO 做基态电子结构计算。通过调制

晶格常数来模拟外界的压力变化，从 0 ∼ 280 GPa 区间选取了十六个压力点进行计算。QUANTUM
ESPRESSO 与 ABINIT 软件类似，同属于主流的基于赝势平面波方法的开源计算软件 123 。经过严格的收
敛性测试，我们选定平面波截断能为 80 Ry， k 点网格密度为 12 × 12 × 12，能带数目为 15，交换 − 关
联势选取为基于广义梯度近似的 PBE96 形式 115 ，采用 Fermi-Driac smearing 方式计算电荷占据数，
在计算中假定系统为顺磁态。我们同样需要为 Co、O 原子构造合适的赝势。经过仔细权衡，我们决定
采用投影缀加波 (projector augmented wave, PAW) 123,125 的赝势形式。赝势产生程序为 QUANTUM
ESPRESSO 软件包中自带的 LD1 程序。产生 PAW 赝势的关键参数如表5.2所示。
其次，利用具有原子轨道对称性的 Wannier 函数构造有效哈密顿量 144 ，该哈密顿量不但包括了

Co 的五条 3d 轨道，同时也包括了 O 的三条 2p 轨道，构成了一个 8 × 8 的矩阵。所使用的软件是
QUANTUM ESPRESSO 软件包自带的 WANN_HAM 程序，我们修改了该程序的输入/输出接口，使其
能够产生与我们的 LDA+DMFT 软件包相互匹配的输入文件。
再次，在动力学平均场的框架内求解该哈密顿量，进行非电荷自洽的 LDA+DMFT 计算。体系温度设

表 5.2: CoO 投影缀加波赝势生成参数
atomic symbol valence state 　 exchange-correlation rcloc rcore PS scheme
Co 4s2 3d7 4p0 GGA-PBE 2.2 1.2 Troullier-Martins
O 2s2 2p4 3d−2 GGA-PBE 0.7 Troullier-Martins
定为 T = 290 K(相应地 β = 40)。电子间的 Coulomb 相互作用采用密度 − 密度相互作用形式， U = 8.0

eV, J = 0.9 eV, 关联作用仅仅加载在 Co 的 3d 轨道上。双计数项采用形如公式 (4.67) 所示的形式 13 ，
其表达式中的占据数取为 nDMFT ，可从杂质求解器的输出结果中读取。所用的杂质求解器为段表示形
式的强耦合展开连续时间量子蒙特卡洛杂质求解器 61 (azalea项目)。每次迭代求解量子杂质模型时，蒙
特卡洛杂质求解器的抽样次数都是 200000000 次， 8 ∼ 16 个进程并行。LDA+DMFT 计算的最大迭
代次数为 24 次，以电子自能函数以及杂化函数作为收敛判据。对于最终的计算结果——虚时格林函数
G(τ )，分别采用最大熵方法 157 或者是随机解析延拓方法 158 进行解析延拓，获取杂质谱函数 A(ω)。采
用 Gaussian 多项式拟合算法对电子自能函数 Σ(iω) 进行解析延拓 135 ，得到 Σ(ω)。电子的自旋 − 自旋
关联函数以及原子组态占据概率在蒙特卡洛抽样过程中可以直接得到 66 ，无须进行额外的处理。
我们首先来看 CoO 电子结构的 LDA 计算结果。在图5.7中给出了 CoO 沿 L − Γ − X 高对称线的 LDA

能带结构以及通过 Wannier 函数插值得到的能带结构。从此能带结构图中，我们可以获得如下信息:(1)
使用 Wannier 函数所构造的低能有效哈密顿量能很好地反映费米面附近的电子结构，通过 Wannier 函
数插值得到的能带结构与通过 LDA 计算得到的能带结构符合得非常好。(2) 费米面穿过 Co 的 3d 电子轨
道，能隙为 0，这意味着 LDA 计算给出 CoO 的基态为金属相，这与实验事实 1,171 完全不符，须得考虑
关联效应才能得到正确的基态。
5.2.4 轨道选择性的绝缘体 − 金属相变
本小节主要讨论在压力作用下，CoO 所展现出来的具有轨道选择性的绝缘体 − 金属相变现象。

图5.8给出的是 Co 的 3d 轨道的单粒子谱函数在不同压力下的演化情况，自上而下压力逐渐增加。显
而易见，在 0 GPa 时，无论是 eg 还是 t2g 轨道都是绝缘体，能隙大小为 2.0 eV 左右，与相应的实验
值 171 保持一致。在 66 GPa 时与 108 GPa 时， t2g 轨道的谱函数在费米面处的权重不为 0，这意味着
t2g 轨道已经发生了绝缘体 − 金属相变，成为金属态，而此时 eg 轨道仍为绝缘体态，不过能隙也是显著
减小，此即典型的具有轨道选择性的绝缘体 − 金属相变。然后压力继续增大，在 187 GPa 时， t2g 与
eg 轨道均呈现出典型的金属性质，显然在此前某个压力处， eg 轨道也由绝缘相转化为金属相。注意到
MnO 175 、FeO 176 、Fe3 O3 177 等过渡金属氧化物在压力的作用下也会发生类似的具有轨道选择性的绝缘
体 − 金属相变现象，其内在的物理机制应该是类似的。
16
LDA
Wannier
14 Fermi level
12
Energy (eV)
10
L Γ X
图 5.7: CoO 的 LDA 能带结构，由 QUANTUM ESPRESSO 软件计算得到。红色空心圆圈为通过 LDA

计算得到的能带结构，绿线为通过 Wannier 函数插值得到的能带结构，水平虚线为费米面。
图5.9给出的是 Co 的 3d 轨道的准粒子权重 Zα 随压力的变化趋势。准粒子权重是区分金属态与

Mott 绝缘体态最直观的标识之一，准粒子权重趋于 0 即为 Mott 绝缘体，如果是有限值即为金属。由
图可见:(1) 当 0 GPa < P < 60 GPa 时， t2g 与 eg 轨道的准粒子权重都很小，基本上可以忽略，此时系
统为绝缘体相。(2) 当 60 GPa < P < 170 GPa 时, t2g 轨道的准粒子权重大于 0.05 并逐渐增加, 而 eg 轨
道的准粒子权重基本保持不变，此时系统为具有轨道选择性的 Mott 相:t2g 轨道呈现金属的性质，而 eg
轨道呈现绝缘体的性质。(3) 当 P > 170 GPa 时， t2g 与 eg 轨道的准粒子权重急剧增加，趋向 1.0，此
刻系统为金属相。通过准粒子权重可以较为准确地判定绝缘体 − 金属相变的相变点，对于 CoO，我们
判断相变点大致位于 60 GPa 和 170 GPa，一共发生了两次绝缘体 − 金属相变。图5.9中的插图给出的
是 t2g 轨道的虚频电子自能函数在 0 GPa < P < 100 GPa 区域的变化情况。在 P = 50 ∼ 66 GPa 区间内
t2g 轨道的低频 =Σ(iω) 函数的斜率改变了符号，这也从侧面佐证了相变的发生。
τ = β/2 时的虚时杂质格林函数 G(β/2) 也是判断绝缘体 − 金属相变是否发生的标准之一，它内在的

物理意义是费米面附近几个 kB T 处的谱函数的积分权重 104 。图5.10中给出了 G(β/2) 随压力的演化趋
势，图中所显示的数据均取其绝对值，并且利用 t2g 轨道的 G(β/2) 在 P = 267 GPa 时的值对它们进行
了重新标度。由图可见，60 GPa 与 170 GPa 附近是两处可能的绝缘体 − 金属相变点，这与根据准粒子
权重的变化趋势 Zα (P )(参见图5.9) 推断出来的相变点完全一致。
随着压力的增加， t2g 轨道以及 eg 轨道上的占据数，相应原子组态的概率都会发生戏剧性的变化。

图5.11(a) 反映了 t2g 与 eg 轨道的电子占据数随压力的演化趋势。当压力小于 170 GPa 时，三条 t2g 轨
2 eg
t2g
XPS and BIS
1.5 000 GPa

Spectral function (a.u)
066 GPa
1
109 GPa
0.5
187 GPa
0
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
Energy (eV)
图 5.8: 不同压力作用下 Co 的 3d 轨道的电子谱函数，通过对虚时格林函数进行解析延拓得到。0 GPa

时的实验数据取自文献 171 。
(a) -5.0
0.8 t2g orbitals
-15.0 23 GPa
ImΣ
Quasiparticle weight Z
34 GPa
0.6 50 GPa
eg 66 GPa
t2g -25.0
86 GPa
0.4 0 0.5 1 1.5 2
iω
0.2
Insulator OSMP Metal
0
0 50 100 150 200 250
Pressure (GPa)
图 5.9: Co 的 3d 轨道的准粒子权重 Zα 随压力的变化趋势，由电子的虚频自能函数根据 Eliashberg 公

式求得。图中的彩色区域表示可能的相变区间。其中的插图给出了 t2g 轨道的虚频自能函数 =Σ(iω) 随
压力的变化趋势。
1.0
(b)
0.8
0.6
|G(β/2)|
eg
t2g
0.4
0.2
0.1
0.0
0 50 100 150 200 250
Pressure (GPa)
图 5.10: Co 的 3d 轨道的虚时格林函数 |G(β/2)| 随压力的演化趋势。图中的箭头表述可能的相变点，所

有的数据均利用 t2g 轨道在 P = 267 GPa 时的数据重新标度了。
道的占据数趋近于 5，两条 eg 轨道的占据数趋近于 2，总电子数略大于 7，这是由于部分 O 的 2p 轨道

上的电子转移到 Co 的 3d 轨道上的缘故。当压力大于 170 GPa 时，电子开始由 eg 轨道流向 t2g 轨道。
由 t2g 轨道与 eg 轨道的填充情况能解释为何 t2g 轨道首先发生相变:t2g 轨道是 5/6 填充， eg 轨道是 1/2
填充，而半满的系统总是趋向于绝缘体相。模型计算表明，两带半满系统的 Uc 大致为 1.7W ，而三带
5/6 填充系统的 Uc 是 3.0W ，其中 W 表示带宽 105 。由此可见， t2g 轨道较 eg 轨道确实更易发生绝缘体
− 金属相变。图5.11(b) 反映了几个关键的原子组态的出现概率随压力的变化趋势。由图可见，在低压
区域，是代表高自旋状态的原子组态占优，在高压区域，则是代表低自旋状态或者是中等自旋状态的原
子组态占优。CoO 的高自旋 − 低自旋态相变的特征主要是:t52g e2g → t62g e1g ，前者的总自旋为 S = 3/2，后
者的总自旋为 S = 1/2，这与 Zhang 等人 LDA+U 计算的结果相符 174 。此外，由高自旋态向中间自旋
态相变 (t52g e2g → t62g e2g ) 的概率也不能被忽视。
5.2.5 高自旋态 − 低自旋态相变
高压 X 射线发射谱实验表明 171,172 ，在 140 GPa 处，CoO 将会发生由高自旋态到低自旋态的相变，

我们的 LDA+DMFT 计算能够解释这一点。图 5.12(a) 绘制了 CoO 的局域磁矩随压力的变化情况。对于
局域磁矩我们采用如下的计算方法:
√
Me = T χloc , (5.1)
(a)
0.9
0.8
Orbital occupancy
eg
0.7
t2g
0.6
0.5
0.4
0 50 100 150 200 250
Pressure (GPa)
0.8
(b)
0.7
0.6
Atomic state probability
0.5
t42ge3g, S=3/2
t52ge2g, S=3/2
0.4
t62ge1g, S=1/2
t62ge2g, S=2/2
0.3
0.2
0.1
0
0 50 100 150 200 250
Pressure (GPa)
图 5.11: (a)Co 的 3d 轨道的占据数 Nα 随压力的变化趋势。(b) 原子组态概率 PΓ 随压力的演化趋势，图

中只显示了贡献最大的 N = 7 以及 N = 8 的原子组态。
其中磁化系数 χloc 的定义式为:

∫ β ∫ β
χloc = dτ χloc (τ ) = dτ hSz (0)Sz (τ )i, (5.2)
0 0
其中 χloc (τ ) = hSz (0)Sz (τ )i 就是自旋 − 自旋关联函数的表达式。图5.12(a) 中清楚地显示出，当

P < 170 GPa 区域时，系统处于高自旋态，局域磁矩的计算值 Me 与文献中报道的结果 Mt 178 吻合得比
较好。当 P > 170 GPa 时，局域磁矩急剧减小，此时系统发生了所谓的高自旋 − 低自旋相变。这个变
化趋势与图5.11(b) 中的原子组态概率的演化趋势完全保持一致。图5.12(b) 还给出了 CoO 在典型压力
区间内的自旋 − 自旋关联函数 χloc (τ )。显而易见，在低压区域，自旋 − 自旋关联函数的底部是一个平
台，这意味着体系具有"frozen" 的局域磁矩。在高压区域，自旋 − 自旋关联函数在远离 τ = 0 与 τ = β
两端展现出 Fermi liquid 所特有的渐近行为。这说明，随着压力的增加，CoO 将由具有固定磁矩的高自
旋态绝缘体相变至低自旋态的 Fermi liquid 金属。
5.3 BaRuO3 : 弱关联非费米液体金属
5.3.1 研究背景
BaRuO3 属于 4d 电子壳层 Ru 基过渡金属氧化物中的一员，与 CaRuO3 、Ca2 RuO4 、SrRuO3 、

Sr2 RuO4 等化合物同属一族。Ca 与 Sr 的 Ru 基化合物有很多十分有趣的物理性质，曾受到很多研
究者的关注，目前已经研究得比较清楚了，例如 SrRuO3 为巡游性的铁磁金属，CaRuO3 则是顺磁性
的"bad" 金属，Sr2 RuO4 为非常规超导体，Ca2 RuO4 为反铁磁 Mott 绝缘体等等。但是人们对 BaRuO3
的物性仍然知之甚少。BaRuO3 的结构比较复杂 179 ，有四种不同的结构:9R、4H、6H、3C。其中 9R 为
9 层斜方结构，4H 为 4 层六方结构，6H 为 6 层六方结构，3C 为 3 层立方结构1 。自然存在的 BaRuO3
为 9R 结构，而 4H、6H、3C 结构则须通过高温高压实验才能合成。对 BaRuO3 的研究主要集中于 9R
与 4H 结构 180 ，光学实验表明，BaRuO3 中可能存在着赝能隙 (pseudogap)，如果此发现属实，那么
这将是 4d 电子系统中首次观测到的赝能隙 181 。3C 结构的 BaRuO3 最近才被合成出来 179,182 ，它在 4 K
以上呈现金属态，具有铁磁性，居里温度为 Tc = 60 K，远小于 SrRuO3 的 160 K。CaRuO3 、SrRuO3
与 BaRuO3 属于等电子结构，Ru 的 4d 电子轨道的构型均为 4d4 。实验与理论研究表明，在钙钛矿结构
的 SrRuO3 与 CaRuO3 中，电子 − 电子关联作用是不可忽略的 183--185 ，它们的电子结构不能用 Fermi
liquid 理论描述 186,187 。但是，BaRuO3 是否具有类似的性质仍有待研究，因此我们使用 LDA+DMFT
方法系统地计算了 BaRuO3 在不同温度下的电子结构，试图彻底厘清这个问题。我们研究的对象是 3C
结构的 BaRuO3 ，在下文中如非特别声明，否则所提到的 BaRuO3 均为理想的钙钛矿结构。
5.3.2 计算细节
BaRuO3 的 LDA+DMFT 计算细节与第5.1.2小节中的描述大同小异。

1 实际上就是理想的钙钛矿 (perovskite) 结构，空间群为 Pm3̄m。而 CaRuO3 与 SrRuO3 的晶体结构是有畸变的钙钛矿结构。
5.3 BaRuO3 : 弱关联非费米液体金属 133
2.8
2.6
LS
2.4
Magnetic moment (µB)
HS
2.2
1.8
Mt
Me
1.6
1.4
(a)
1.2
0 50 100 150 200
Pressure (GPa)
1.6
000 GPa
1.4
109 GPa
Spin-spin correlation function χloc(τ)
1.2
157 GPa
187 GPa
0.8
195 GPa
0.6
0.4
(b)
218 GPa
0.2
0 2 4 6 8 10
τt
图 5.12: (a)Co 的 3d 轨道的局域磁矩随压力的变化趋势， Mt 表示文献数据 178 ，而 Me 则是本文的计算

值，彩色区域代表低自旋区。(b) 典型压力区间内的自旋 − 自旋关联函数 χloc (τ )。
表 5.3: BaRuO3 投影缀加波赝势生成参数
atomic symbol valence state 　 exchange-correlation rcloc rcore PS scheme
Ba 5d0 6s2 6p0 GGA-PBE 2.6 1.5 Troullier-Martins
Ru 4d6 5s2 5p0 GGA-PBE 2.4 0.9 Troullier-Martins
O 2s2 2p4 3d−2 GGA-PBE 0.7 Troullier-Martins
首先，我们使用 QUANTUM ESPRESSO 4.1.3 软件 127 对 BaRuO3 做基态电子结构计算。经过严格

的收敛性测试，我们选定平面波截断能为 80 Ry， k 点网格密度为 12 × 12 × 12，能带数目为 40，交换
− 关联势选取为基于广义梯度近似的 PBE96 形式 115 ，采用 Fermi-Driac smearing 方式计算电荷占据
数，BaRuO3 的晶体结构与原子内部坐标选用实验数据， a0 = 4.006 Å，并且假定体系处于顺磁态。我
们同样需要为 Ba、Ru、O 原子构造合适的赝势。经过仔细权衡，我们决定采用投影缀加波 (projector
augmented wave, PAW) 的赝势形式 123,125 。赝势产生程序为 QUANTUM ESPRESSO 软件包中自带的
LD1 程序。产生 PAW 赝势的关键参数如表5.3所示。
其次，利用最局域化的 Wannier 函数 166 构造有效哈密顿量，该哈密顿量不但包括了 Ru 的五条

4d 轨道，同时也包括了 O 的九条 2p 轨道，构成了一个 14 × 14 的矩阵。所使用的软件是最流行的
WANNIER90 程序 128 ，我们修改了该程序的输入/输出接口，使其能够产生与我们的 LDA+DMFT 软件
包相互匹配的输入文件。
再次，在动力学平均场的框架内求解该哈密顿量，进行非电荷自洽的 LDA+DMFT 计算。为了研究在

不同温度下 BaRuO3 的电子结构演化情况，分别将体系温度设定为 β = 10 ∼ 60，所对应的最低温度为
190 K，最高温度为 1160 K。电子间 Coulomb 相互作用采用密度 − 密度相互作用形式， U = 4.0 eV,
J = 0.45 eV, 关联作用仅仅加载在 Ru 的 4d 轨道上。双计数项采用形如公式 (4.67) 所示的形式 13 ，其表
达式中的占据数取为 nDMFT ，可从杂质求解器的输出结果中读取。所用的量子杂质模型求解器为段表示
形式的强耦合展开连续时间量子蒙特卡洛杂质求解器 61 (azalea项目)。每次迭代求解量子杂质模型时，
蒙特卡洛杂质求解器的抽样次数都是 200000000 次， 8 ∼ 16 个进程并行。LDA+DMFT 计算的最大迭
代次数为 24 次，以电子自能函数以及杂化函数作为收敛判据。对于最终的计算结果——虚时格林函数
G(τ )，分别采用最大熵方法 157 或者是随机解析延拓方法 158 进行解析延拓，获取杂质谱函数 A(ω)。采
用 Gaussian 多项式拟合算法对电子自能函数 Σ(iω) 进行解析延拓 135 ，得到 Σ(ω)。电子的自旋 − 自旋
关联函数 χloc (τ ) 在蒙特卡洛抽样过程中可以直接得到，无须进行额外的处理。
我们首先来看 BaRuO3 电子结构的 LDA 计算结果。在图5.13中给出了 BaRuO3 沿 L − Γ − X − W −

K − Γ 高对称线的 LDA 能带结构以及通过最局域化 Wannier 函数插值得到的能带结构。从此能带结构
图中，我们可以获得如下信息:(1) 使用最局域化 Wannier 函数所构造的低能有效哈密顿量能很好地反映
费米面附近的电子结构，通过 Wannier 函数插值得到的能带结构与通过 LDA 计算得到的能带结构符合

得非常好。(2) 费米面穿过 Ru 的 4d 电子轨道，能隙为 0，这意味着 LDA 计算给出 BaRuO3 的基态为
金属相。这与实验事实相符。(3)Ru 的 4d 轨道的带宽很大，约为 6 eV，与 O 的 2p 轨道强烈杂化在一
起，我们推测 BaRuO3 的电子关联作用可能比较弱。
20
18
16
14
Energy (eV)
12
10
4 LDA
Wannier
2
L Γ X W K Γ
图 5.13: BaRuO3 的 LDA 能带结构。由 QUANTUM ESPRESSO 软件计算得到。红色实线为通过 LDA

计算得到的能带结构，绿线 + 空心圆圈为通过最局域化 Wannier 函数插值得到的能带结构。
5.3.4 LDA+DMFT 电子结构计算结果
本小节将给出 BaRuO3 的 LDA+DMFT 计算的主要结果。
我们首先来看 Ru 原子的 4d 轨道的电子谱函数随温度的演化规律。LDA+DMFT 计算完成后，得到

虚时格林函数 G(τ )，利用最大熵方法 157 或者是随机解析延拓方法 158 对其进行解析延拓，即可得到积
分电子谱函数 A(ω)，具体的计算结果如图5.14所示。由图可见，电子谱函数随温度的变化趋势并不十分
明显。对于 t2g 轨道而言，在费米面附近有高且尖锐的准粒子共振峰，温度越低，准粒子峰就越" 瘦" 越
尖锐。在 -0.2 eV 处有一小肩峰，下 Hubbard 带大致在 -3 eV 处，而上 Hubbard 带并没有分离出来，
无法确定其位置。对于 eg 轨道而言，在费米面处同样有一个小峰，不过随着温度的升高，此峰将逐渐减
弱，与费米面右侧的主峰融合在一起了。 t2g 轨道与 eg 轨道的谱函数在 −2 ∼ −8 eV 处都有很大的权
重，因此与 O 的 2p 轨道的杂化必然十分可观，这与 LDA 投影态密度的计算结果是完全一致的。
图5.14中还给出了 BaRuO3 的角分辩谱函数 A(k, ω)，图中还一并给出了 LDA 的能带结构以便于相

1.2 eg band
t2g band
1 T=580 K
Spectral Function (a.u)
0.8
0.6 T=290 K
0.4
0.2 T=190 K
0
-15 -10 -5 0 5 10 15
Frequency (eV)
6 low
2
Energy (eV)
-2
-4
-6
-8 high
L Γ X W K Γ
图 5.14: (a)Ru 的 4d 轨道的积分电子谱函数 A(ω)，通过对虚时格林函数 G(τ ) 进行解析延拓得到。

(b)BaRuO3 的角分辩谱函数 A(k, ω)，图中的黑色虚线为 LDA 能带结构。
1
eg band
2
t2g band
*
Quasiparticle mass m
0.8 1.8
1.6
0.6 1.4
γm
1.2
0.4
1
200 400 600 800 1000
Temperature (K)
0.2
0
100 200 300 400 500 600 700 800 900 1000 1100 1200
Temperature (K)
0.45
eg band
0.4 t2g band
α=0.60
0.35 α=0.95
0.3
-ImΣ(iω)
0.25
0.2
0.15
0.1
0.05
0
0 0.5 1 1.5 2
Frequency ω
图 5.15: (a)Ru 的 4d 轨道的低频散射速率 γm 随温度的变化趋势，插图为电子有效质量 m∗ 随温度的变

化趋势。(b)T = 290 K 时 Ru 的 4d 轨道的 −=Σ(iω)，图中虚线为利用函数 −=Σ(iω) = A(iω)α + B 拟
合的结果。
互比较。对 LDA+DMFT 计算得到的虚频自能函数 Σ(iω) 进行解析延拓，得到实频自能函数 Σ(ω) 135 ，

再利用公式 (4.98) 即可求得角分辩谱函数。由图可见，电子关联效应对于 LDA 能带结构的重整化十分
微弱，几乎可以忽略不计。因此我们认为电子关联作用在 BaRuO3 中并不起主要作用，它应该是一个弱
关联的金属，这与 SrRuO3 和 CaRuO3 的情况明显有所不同 183--185 。在 BaRuO3 中， 4d 轨道的带宽很
大，与 2p 轨道的杂化非常强， U /W 显然小于 1。
通过理论计算以及输运实验已经确定 SrRuO3 与 CaRuO3 完全偏离 Fermi liquid 理论的预言 186,187 ，

那么下面我们来探讨 BaRuO3 的电子结构是否能用 Fermi liquid 理论描述。A. Liebsch 等人 188 用低频
散射速率 γm 作为区分 Fermi liquid 与 non Fermi liquid 的标准:
γm = −=Σm (iω → 0), (5.3)
其中 m 是轨道指标， γm → 0 的区域可用 Fermi liquid 理论描述，反之亦然。我们也采用同样的标准。

图5.15(a) 中给出了 Ru 原子 4d 轨道的 γm (T )。由图可见 eg 轨道在低温区域符合 γm → 0 的标准，属
于 Fermi liquid 理论适用的区域，而 t2g 轨道的低频散射速率比较大，属于明显背离 Fermi liquid 理论
的区域。图5.15(a) 中的插图为电子的有效质量 m∗ 随温度的演化趋势， eg 轨道上的电子有效质量基本
上保持 1.15m 不变，而 t2g 轨道上的电子有效质量则随温度的增加而逐步降低，在 200 K 时为 1.82m，
在 1160 K 时为 1.6m。根据 Fermi liquid 理论，在低频区域 iω → 0，虚频自能函数的虚部应该呈线性
行为，亦即 =Σ(iω) ∝ iω。根据此理论，我们在图5.15(b) 中绘制了 T = 290 K 时 Ru 的 4d 轨道的低频
=Σ(iω)，并利用下述方程式进行拟合:
−=Σ(iω) = A(iω)α + B. (5.4)
由图可见， eg 轨道的低频 =Σ(iω) 呈现线性的特征，拟合参数 α = 0.95，非常接近于 1，可以看作是符

合 Fermi liquid 理论的行为，而 t2g 轨道的低频 =Σ(iω) 呈现抛物线的特征，拟合参数为 α = 0.60，与
Fermi liquid 理论的描述有所偏离。
我们再来看 Ru 的 4d 轨道的自旋 − 自旋关联函数 χloc (τ )，测量公式参见公式 (5.2)。图5.16中给

出了不同温度下 Ru 的 4d 轨道的自旋 − 自旋关联函数 χloc (τ )。由图可见，和低压区域的 CoO 一样，
BaRuO3 同样具有"frozen" 的局域磁矩，特征就是自旋 − 自旋关联函数的底部近似于一个平台，无法利
用函数 (T / sin(T τ π))2 来拟合 73 ，这也是背离 Fermi liquid 理论的标志之一。
最后，我们还利用公式 (4.100) 计算了 BaRuO3 在不同温度下的光电导率 <σ(ω)，计算结果如

图5.17所示。由图可见，随着温度的增加，光电导率的变化并不十分明显，它们共同的特征是: 在 ω → 0
处有显著的 Drude 峰，在 ω = 2 ∼ 3 eV 处的峰归属于上下 Hubbard 带到准粒子权重峰之间的跃迁，
而在 4 eV 附近比较平坦的结构则归属于上下 Hubbard 带之间的跃迁。我们利用函数 <σ(ω) ∼ Cω −α
来拟合光电导率，如果是 Fermi liquid 金属或者是简单 Drude 金属，那么应该有 α = 2，但是由图5.17
中的插图可见，对于 T = 290 K 时的光电导率而言， α ∼ 1.0，显然已经偏离了 Fermi liquid 理论的预
言值。特别值得一提的是对于 SrRuO3 ， α ∼ 0.5 186,187 ，对于高温超导材料的母体铜氧化物， α ∼ 0.7。
0.7
T=1160 K
T=580 K
0.6 T=386 K
T=290 K
T=232 K
0.5
T=193 K
0.4
χloc(τ)
0.3
0.2
0.1
0
0 0.1 0.2 0.3 0.4 0.5
τ/β
图 5.16: 不同温度下 Ru 的 4d 轨道的自旋 − 自旋关联函数 χloc (τ ) = hSz (0)Sz (τ )i。图中只给出了

τ /β ∈ [0, 0.5] 中的部分。
80
T= 580 K
100 T= 290 K
70
T= 290 K T= 193 K
Optical conductivity σ1(ω)
80 α=1.0
60
Optical conductivity σ1(ω)
60
50
40
40
20
30
0
0 0.2 0.4 0.6 0.8 1
20 Frequency ω
10
0
0 1 2 3 4 5 6 7 8
Frequency ω
图 5.17: 不同温度下 BaRuO3 的光电导率 <σ(ω)。图中仅仅给出了光电导率的实部 <σ(ω) = σ1 (ω)。在

插图中用函数 σ1 (ω) ∼ Cω −α 拟合 T = 290 K 时的光电导率， α ∼ 1.0。
5.4 本章小结
本章我们利用自主开发的 LDA+DMFT 软件包，比较系统地研究了属于 3d 系统的 SrVO3 和 CoO，

属于 4d 系统的 BaRuO3 的电子结构，获得了如下主要结论:(1) 广义相互作用以及动态屏蔽效应会导致
SrVO3 电子谱函数发生显著的变化，准粒子权重 Z，电子有效质量 m∗ ，金属 − 绝缘体相界都会受到影
响；(2) 在压力的作用下，CoO 将发生具有轨道选择性的绝缘体 − 金属相变，同时还将发生由高自旋态
到低自旋态的相变；(3) 立方相的 BaRuO3 属于具有局域磁矩的弱关联金属，关联作用不占主导地位，
eg 轨道的电子自能函数可用 Fermi liquid 理论描述，而 t2g 轨道的电子自能函数则不可以，BaRuO3 低
频光电导率呈现 <σ(ω) ∼ ω −1 的行为，偏离了 Fermi liquid 理论的预测。
第六章
结论与展望
本章总结回顾攻读博士学位期间所完成的主要工作，并对下一步计划进行的研究工作预作规划。
在导师的指导下，本人博士研究生期间的研究工作主要集中于以下三个方面。
(1)动力学平均场框架下量子杂质求解器的研发。量子杂质求解器是动力学平均场计算方法的核心组
成部分，其中量子蒙特卡洛方法是目前最主流的算法，因此本人主要研究基于量子蒙特卡洛方法的量子
杂质求解器。独立开发了基于 Hirsch-Fye 算法的量子蒙特卡洛杂质求解器 (包括 delayed update 版
本、CUDA-GPU 加速版本)、基于弱耦合展开算法的连续时间量子蒙特卡洛杂质求解器、基于强耦合展
开算法的连续时间量子蒙特卡洛杂质求解器 (包括段表示版本、广义矩阵算法版本1 、自旋 − 轨道耦合
作用版本 2 、电声相互作用版本、动态屏蔽效应版本、Krylov 子空间迭代算法版本、正交多项式表象版
本3 等等)。为了改善提高强耦合展开连续时间量子蒙特卡洛杂质求解器在求解多带模型时的计算效率，
本人独立提出了基于 Newton-Leja 多项式插值的新算法，该算法的计算效率要比此前最优的 Krylov 子
空间迭代算法高出 1 个数量级。同时，为了改善强耦合展开连续时间量子蒙特卡洛杂质求解器在测量虚
时格林函数等物理量时的精度，我在正交多项式表象算法的基础上，独立开发了基于内核多项式表象的
新算法4 。该新算法能有效地消除 Gibbs 震荡现象，极大地改善了物理量的测量精度，为后续处理奠定
了良好的基础。为了能够妥善处理量子蒙特卡洛杂质求解器的输出数据，特别是虚时格林函数的解析延
拓，本人还独立开发了基于最大熵方法以及随机解析延拓方法5 的后处理程序，还有其它一系列的小工具
程序。
(2)LDA+DMFT 第一性原理计算框架的研发。动力学平均场理论必须与第一性原理电子结构计算方
1 本工作受益于王磊博士提供的严格对角化程序，用于检测杂质求解器在单带或多带体系中的可靠性。
2 本工作受益于与杜亮同学的合作。
3 本工作受益于与王磊博士的讨论。
4 本工作受益于与吴泉生同学的讨论。
5 本工作受益于吴泉生同学提供的原型程序。
142 结论与展望
法结合起来，组成 LDA+DMFT 计算方法，才能用于研究真实的强关联电子体系的电子结构。因此，我

在借鉴 K. Haule 135 、M. Aichhorn 136 、B. Amadon 134 等人工作的基础上，独立开发了一套比较完备
的 LDA+DMFT 第一性原理计算软件包6 。该软件包具有以下独特的优点:(1) 为了与不同的密度泛函理
论计算软件相互对接，我开发的 LDA+DMFT 软件包支持最局域化 Wannier 函数、具有原子对称性的
Wannier 函数、赝原子轨道这三种类型的局域轨道。其中赝原子轨道作为局域轨道仅在 ABINIT 软件
中支持，具有原子对称性的 Wannier 函数作为局域轨道仅在 QUANTUM ESPRESSO 软件中支持。最
局域化 Wannier 函数作为局域轨道则有很多的第一性原理计算软件支持，包括 ABINIT、QUANTUM
ESPRESSO、VASP、WIEN2K、FLEUR、FPLO、OpenMX、SIESTA 等等。换言之，我的 LDA+DMFT
软件包可以与目前世界上绝大部分最主流的第一性原理计算软件相互对接，适用性非常广泛。(2) 在
DMFT 部分，我的 LDA+DMFT 软件包支持绝大部分自行研发的基于量子蒙特卡洛算法的量子杂质模
型求解器。无论量子杂质模型如何变化，从单带模型到七带模型，从密度 − 密度相互作用到广义相互
作用，从电声相互作用到自旋 − 轨道耦合，从静态相互作用到动态屏蔽效应、从极高温度 (β = 0.5) 到
低低温度 (β = 400)，在此 LDA+DMFT 软件包中，总能找到合适的量子杂质模型求解器。(3) 此 LDA
+DMFT 软件包是一个十分庞大的软件框架，根据功能的不同被划分为十余个子模块，模块之间采用
Python 或者 Shell 脚本有机链接在一起，使用起来非常灵活。这些子模块既能单独使用，也能几个模块
之间相互配合使用。所有的子模块均经过严格的测试与优化，均支持 MPI 并行计算。
(3)使用 LDA+DMFT 计算框架研究真实的强关联电子材料。我使用自主开发的 LDA+DMFT 软件包

先后计算研究了 3d 体系的 VO、FeO、CoO、NiO、SrVO3 ， 4d 体系的 CaRuO3 、BaRuO3 、SrTcO3 ，
5d 体系的 BaOsO3 、 4f 体系的 α-Ce、 γ-Ce、CeH2 、CeH3 等材料。其中研究得比较深入的有 SrVO3 、
CoO 与 BaRuO3 。主要的研究结果归纳如下。
A) SrVO3 是一种典型的 3d1 电子体系，属于弱关联金属，是十分理想的 LDA+DMFT 计算方法的测

试对象。其 3d 电子的 eg 能带为绝缘相，而 t2g 能带则穿过费米面，呈现出金属性。在电子 − 电子关联
作用下， t2g 轨道的能带宽度大幅收窄了，对应的电子有效质量 m∗ ∼ 1.8m，这是仅仅考虑密度 − 密度
相互作用项所得到的 LDA+DMFT 计算的结果。如果在相互作用项中考虑广义相互作用，那么 V 的 3d
轨道的电子谱函数将会有十分显著的变化。首先 t2g 轨道的谱函数呈现出十分明显的上下 Hubbard 带的
结构；其次 t2g 轨道准粒子权重峰的峰型变宽，而且左右两侧都出现了明显的肩峰结构；再次， eg 轨道
在费米面之上的谱峰的权重有向高频区域迁移的迹象。如果相互作用项不是静态的，而是具有频率依赖
关系—— U (ω)，材料的电子结构将会有什么样的变化，我们以 SrVO3 为例尝试研究了这个问题7 。LDA
+DMFT 计算结果表明: 费米面附近的准粒子权重峰被强烈地重整化了，谱权重往高频方向迁移，准粒子
权重 Z 显著增加， t2g 能带被进一步压缩，在 -0.2 eV 处出现了更为明显的"kink" 结构。此计算结果与
最新的角分辩光电子能谱实验数据符合得更好 169 。
B) CoO 属于 3d 电子壳层的过渡金属氧化物，它的基态为电荷转移型的反铁磁绝缘体，Néel 温度
6 本工作受益于与庄嘉宁博士、赵建洲同学的讨论。
7 本工作受益于与王义林同学的合作。
143
为 289 K。我们使用 LDA+DMFT 方法首次系统地研究了 CoO 在高压下的电子结构变化8 。计算结果

表明，在 60 GPa 左右， t2g 轨道将会发生 Mott 绝缘体 − 金属相变，而 eg 轨道仍然保有绝缘相的特
性，因而这是一个典型的具有轨道选择性的绝缘体 − 金属相变过程。当压力继续增大至 170 GPa 时，
eg 轨道也转变为金属态，此时 CoO 将整体展现出金属的性质，这与高压电阻实验的结果完全符合 170 。
在压力增加的过程中，CoO 的自旋状态也会发生巨大的改变。在低压区域 (P < 170 GPa)，CoO 处于
高自旋态，具有"frozen" 的局域磁矩，而在高压区域 (P > 170 GPa)，CoO 处于低自旋态，属于 Fermi
liquid 金属。这之间有一个高自旋态 − 低自旋态的相变过程，这个相变的主要特征是:t52g e2g → t62g e1g 与
t52g e2g → t62g e2g 171,172 。
C) 最近通过高温高压实验合成的立方相钙钛矿结构的 BaRuO3 是属于 4d 电子壳层的过渡金属氧化

179
物，关于它的基态性质仍缺乏相应的实验与理论研究，但是与其同一系列的钙钛矿结构的 CaRuO3
与 SrRuO3 都是呈现出 non Fermi liquid 行为的强关联金属。我们使用 LDA+DMFT 计算方法系统地研
究了立方相 BaRuO3 在不同温度下的电子结构与光学性质，发现它的基态应该是具有局域磁矩的弱关联
金属，同时它的电子自能函数以及光电导率对于 Fermi liquid 理论也表现出明显的背离行为。
以上就是我本人在攻读博士学位期间所完成的主要研究工作9 。阶段性的学习虽然即将结束，但是研
究工作还将继续进行，将来拟进行的研究工作初步计划如下:
(1) 继续完善抛光现有的 LDA+DMFT 计算框架，进一步改进优化量子杂质模型求解器，提高计算效

率，尽量扩大可研究的参数范围。
(2) 继续研究更为复杂的强关联电子体系。除了 3d 系统以外，在 4d、 5d、 4f 、 5f 等系统中，有很

多很有意思的强关联电子体系从未被研究过。这些材料一般对称性比较低，结构比较复杂，同时具有晶
体场劈裂与自旋 − 轨道耦合作用，物理内涵十分丰富。若能使用 LDA+DMFT 计算方法系统地研究这些
材料的电子结构，必能获得不少成果。
(3) 将 LDA+DMFT 的理论框架拓展至实时领域，解释具有时间分辨特性的实验数据。使用 LDA

+DMFT 计算方法研究真实材料的晶格动力学性质，进行几何优化计算，进行量子分子动力学计算等等
都是前景十分广阔的研究方向，也是我们努力的目标。
8 本工作受益于与王义林同学的合作。
9 除了上述主要研究工作以外，我还额外完成了下述研究工作。与杜亮同学合作，分别使用动力学平均场方法结合强耦合展开
连续时间量子蒙特卡洛杂质求解器与变分 Gutzwiller 方法系统地研究了广义相互作用三带 Hubbard 模型的 U − ∆ 与 U − λ 相

图 (电子总占据数固定为 4，在第一个工作中考虑了晶体场劈裂没有考虑自旋 − 轨道耦合项，第二个工作没有考虑晶体场劈裂但
是考虑了自旋 − 轨道耦合项)。与邱环环同学、庄嘉宁博士、赵建洲同学合作开发了 HUBI-CTQMC 杂质求解器 (本人负责提供
CT-HYB 杂质求解器)，该杂质求解器结合了 Hubbard-I 近似以及 CT-HYB 杂质求解器各自的优点，在研究磁有序态方面存在一
定的优势。与邱环环同学合作分别研究了广义相互作用两带 Hubbard 模型与过渡金属氧化物 NiO 的反铁磁相变以及 Néel 温度
(本人负责提供 CT-HYB 杂质求解器，进行密度泛函理论计算，构造局域轨道)。协助赵建洲同学平行开发了另一套 LDA+DMFT
计算程序 (本人负责提供 CT-HYB 杂质求解器)。协助王义林同学研究了两带 Hubbard 模型中由电子掺杂驱动的具有轨道选择性
的金属 − 绝缘体相变 (本人负责提供 CT-HYB 杂质求解器)。由于这些研究工作明显与本博士学位论文的主旨不符，因此只好忍痛
割爱，略过不提，对此感兴趣者请详询相关同学。
附录
附录部份的主要功能是介绍一些在正文中由于篇幅限制无法面面俱到，但是却又十分重要的内容。本
附录结构如下:
附录A.1，介绍传统的解析延拓方法——最大熵方法。
附录A.2，介绍最新的解析延拓方法——随机解析延拓方法，最大熵方法可以看作是它的一个近似。
附录A.3，介绍 Leja 点序列。
附录A.4，介绍 Newton 插值多项式的基本形式。
附录A.5，介绍 Legendre 正交多项式的定义与基本关系式。
附录A.6，介绍第一类与第二类 Chebyshev 正交多项式的定义与基本关系式。
附录A.7，介绍用于晶格格林函数计算的 Lambin-Vigneron 解析四面体积分算法。
A.1 最大熵方法
量子蒙特卡洛杂质求解器输出的杂质格林函数通常是定义在虚时间轴上的 G(τ )，为了获得有物理意

义的可观测量，我们需要对其进行解析延拓 (analytic continuation)，以得到定义在实轴上的杂质格林
函数 G(ω)。注意到格林函数的实部 <G(ω) 与虚部 =G(ω) 之间可通过 Kramers-Kronig 关系相互转化，
因此只消求得杂质谱函数 A(ω)，就相当于知道了格林函数的虚部，进而可以求出完整的实频格林函数。
G(τ ) 与 A(ω) 通过如下的积分方程相互联系:
∫ ∞
G(τ ) = dωK(τ, ω)A(ω), (A.1)
−∞
其中 K(τ, ω) 被称为 Kernel 函数10 ，其定义如下:
e−τ ω
K(τ, ω) = . (A.2)
1 + e−βτ
10 对于玻色系统，Kernel 函数的定义式变为:
e−τ ω
K(τ, ω) = .
1 − e−βτ
1
τ/β=0.0
τ/β=0.1
τ/β=0.2
0.8
τ/β=0.3
τ/β=0.4
τ/β=0.5
0.6 τ/β=0.6
K(τ, ω)
τ/β=0.7
τ/β=0.8
0.4 τ/β=0.9
0.2
0
-6 -4 -2 0 2 4 6
Frequency (ω)
图 A.1: 费米型 Kernel 函数 K(τ, ω) 的示意图。图中取 β = 10.0。
直接数值求解此积分方程并不是一个很好的主意，这是因为当 ω 较大时，Kernel 函数 K(τ, ω) 将变得

很小很小 (参见图A.1)。这样的特性意味着有可能 A(ω) 变化剧烈，但是相应的 G(τ ) 却几乎没有变化。
换言之，可能存在着很多个不同的 A(ω)，它们与同一套 G(τ ) 数据都能满足公式 (A.1)，可是真实的
谱函数却只有一个。处理这一问题的经典解决方案就是利用最大熵方法 (maximum entropy method,
MEM) 157 。
根据最大熵理论，最优的谱函数 A(ω) 必须使下面的 likelihood 函数最大化:
P (A|G) = eQ[A] ， (A.3)
亦即需要最大化泛函 Q[A]。 Q[A] 是新定义的关于谱函数 A(ω) 的泛函:
1
Q[A] = αS[A] − χ2 [A]. (A.4)
2
其中 α 为可调参数， S[A] 为广义的 Shannon-Jaynes 熵，其定义如下:

∫ [ ( )]
A(ω)
S[A] = dω A(ω) − m(ω) − A(ω) log . (A.5)
m(ω)
m(ω) 为缺省的模型，可以取为常数，或者是高斯型的函数，或者是其它任意的与频率 ω 有关的函数，

唯一的要求是 m(ω) 必须是归一化的。泛函 Q[A] 的第二项 χ2 [A] 的定义如下:
∑
L
χ2 [A] = (G(τi ) − G(τj ))[C −1 ]ij (G(τj ) − G(τj )). (A.6)
ij=1
χ2 [A] 项量度的是由谱函数 A(ω) 反演出来的 G(τ ) 与蒙特卡洛抽样平均值 G(τ ) 之间的距离。 C 为协变
矩阵，它包含了蒙特卡洛抽样过程中的误差信息。至此泛函 Q[A] 已经定义完毕，剩余的问题就是如何
求其极大值，最陡下降法 (steepest descent, SD) 或者是共轭梯度法 (conjugate gradient, CG) 都是比
较好的选择。
对于给定的参数 α，那么最大化泛函 Q[A] 就能够唯一确定一个谱函数 A(ω)。参数 α 的选择是一个
很复杂的问题，如果 α 参数取值太大，那么 A(ω) 将趋同于缺省模型 m(ω)，如果 α 参数取值太小，那
么蒙特卡洛抽样数据中的噪声将使得 A(ω) 出现非物理的振荡 157 。在所谓的 historic 最大熵方法中，通
过如下关系可确定 α 参数:
χ2 = N, (A.7)
其中 N 为实轴频率点的数目。在一般情况下，利用 historic 最大熵方法能给出比较合理的谱函数，但是

一般而言，historic 最大熵方法趋于过渡拟合数据，所得的杂质谱函数比较平滑，可能会损失一些精细
的物理信息。另一种确定 α 参数的途径是 classic 最大熵方法。在 classic 最大熵方法中，通过求解下述
线性方程以确定 α:
−2αS = Λ(α)[αI + Λ(α)], (A.8)
其中 Λ 矩阵的定义如下:
√ √
T −1
Λ(α)ij = Aα
i [K C K]ij Aα
j. (A.9)
K 代表分立化的内核函数 Kij = K(τi , ωj )， C 为上文提到的协变矩阵。我们在hibiscus项目中实现了最

大熵方法。
A.2 随机解析延拓方法
随机解析延拓方法 (stochastic analytic continuation, SAC) 是最近发展起来的一套解析延拓方法，

上文所介绍的最大熵方法可以看作是随机延拓方法的一个特例 158 。目前随机解析延拓方法的应用越来越
多，大有取代最大熵方法之势。
我们首先从平滑映射 φ 谈起。映射 φ 可以将任意实数映射至 [0,1] 区间内 φ : R 7→ [0, 1]，它最重要的
作用就在于将谱函数存在的频率区间 [−∞, +∞] 映射至 [0, 1] 区间。映射 φ 可能具有如下的函数形式:
∫
1 ω
φ(ω) = dνD(ν). (A.10)
N −∞
其中 D(ν) 代表缺省模型，而 N 为缺省模型的归一化因子。 D(ν) 与 φ(ω) 的微分之间显然存在着以下关

系:
N φ0 (ω) = D(ω). (A.11)
根据谱函数的归一化关系可有:
∫ ∞ ∫ 1 ∫ 1
1 A(ω)
1= dωA(ω) = dφ(ω) = dx n(x). (A.12)
N −∞ 0 D(ω) 0
在上述等式中，我们利用了变量代换:
x = φ(ω). (A.13)
显而易见， x ∈ [0, 1]。同时我们还引入了无量纲的场 n(x):

A(ω) A(φ−1 (x))
= = n(x). (A.14)
D(ω) D(φ−1 (x))
然后我们来考虑拟合优度 (goodness-of-fit) 泛函 χ2 [A]。在一般的情况下， χ2 [A] 可由公式 (A.6) 计

算，但是如果协变矩阵为对角阵，那么 χ2 [A] 可以变换为如下的形式:
∫ β ∫ 2
dτ ∞
.
χ2 [A] = 2 dωK(τ, ω)A(ω) − G(τ ) (A.15)
0 σ(τ ) −∞
其中 σ(τ ) 为蒙特卡洛抽样虚时格林函数的方差。利用上述变量代换，并且假定 χ2 [A] 就是某个人造系统

的哈密顿量，那么上式可以被改写为:
∫ ∫ 2
β
dτ 1
H[n(x)] = 2 dxK(τ, x)n(x) − G(τ ) . (A.16)
0 σ(τ ) 0
假设该系统具有反温度 α，那么系统的配分函数可以表示为:
∫
Z = Dn(x) e−αH[n(x)] . (A.17)
在上式中， ( ) (∫
∫ ∫ ∞ ∏ 1 )
Dn(x) = dn(x) δ dxn(x) − 1 . (A.18)
0 x 0
根据统计学的基本原理， n(x) 的热平均值可由下式计算:

∫
1
hn(x)i = Dn(x) e−αH[n(x)] n(x). (A.19)
Z
那么利用 n(x) 的定义式公式 (A.14)，热力学平均的杂质谱函数可由下式计算:
hA(ω)i = hn(φ(ω))iD(ω). (A.20)
以上就是随机解析延拓方法的基本原理，至于深入的理论分析请参阅原始的文献 158 。在具体的实现

中，我们采用大量 δ 函数的叠加来刻画无量纲场 n(x):
∑
nC (x) = rγ δ(x − aγ ). (A.21)
γ
∑
rγ 为 δ 函数的权重，满足 rγ > 0，而且 γ rγ = 1。 aγ 为 δ 函数的位置，满足 0 ≤ aγ ≤ 1。 γ 为 δ 函
数的索引，一般 210 个 δ 函数即可取得令人满意的结果。 C = {rγ , aγ } 表示某时刻无量纲场的构型，一
旦 C 确定下来，那么 n(x) 也就确定了。我们使用经典蒙特卡洛方法来计算 hn(x)i，应用 Metropolis 算
法，随机选择 C 中任意一个 δ 函数，尝试修改其位置与权重:aγ 7→ a0γ 以及 rγ 7→ rγ0 ，场构型也会发生相
应的变化:C 7→ C 0 ，此操作的接受概率为 exp(−α∆H)，并且
∆H = HC 0 − HC . (A.22)
L2 L7 L5 L8 L3 L9 L4 L6 L1
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
图 A.2: 反对称 Leja 特殊点序列示意图。图中仅仅显示了前 9 个点，范围为 [−2, 2]，利用 Fast Leja

Points 算法 107 产生，图中的数字用于标示 Leja 点的先后次序。
那么利用公式 (A.16) 可以很容易地算出 ∆H，从而确定此操作是否会被拒绝。测量可按照公式 (A.21)

进行，一旦求出 hn(x)i，那么依照公式 (A.20) 即可求出最终的杂质谱函数 A(ω)。
最后还剩下一个问题，就是这个人造系统的反温度参数 α 应该如何确定，这个问题在最大熵方法中
也同样存在，只不过是 α 参数所对应的物理意义不同罢了。在实际的计算中，我们通常使用许多不同
的 α 参数进行计算，每一个 α 都对应着一个 hn(x)i 或者是 hA(ω)i。最粗糙的做法是将 hA(ω)i 对所有
的 α 参数取平均，Sandvik 提出根据 S − α 曲线上的陡崖来确定 α 159 ，Beach 提出根据 χ2 − α 曲线上
的"kink" 来确定最佳的 α 158 ，Syljuåsen 干脆就使用 α = 1 160 。目前这些做法都是权宜之计，相关的研
究工作仍旧在不断取得进展。最后特别值得一提的是，由于随机解析延拓方法需要对场构型 C 进行抽
样，因此计算效率很低，为了获得比较理想的结果需要耗费大量的计算时间，对程序进行并行化加速是
必不可少的。我们在hibiscus项目中实现了随机解析延拓方法。
A.3 Leja 点序列
为了帮助读者理解 Newton-Leja 插值算法，本小节将介绍在文献中很少涉及的 Leja 点序列。在紧

集 (compact set)K 中的无限 Leja 点序列 {ξj }∞
j=0 的定义如下: 如果 ξ0 是 K 中的任意一个固定点，那么
ξj 可以通过下式递归生成:
∏
j−1 ∏
j−1
|ξj − ξk | = max |ξ − ξk |, j = 1, 2, · · · . (A.23)
ξ∈K
k=0 k=0
利用文献 107 中提出的快速 Leja 点算法 (Fast Leja Points, FLPs) 可以高效地生成一系列的实数 Leja 点。
图A.2展示了在 [−2, 2] 区间内的前九个 Leja 点。
Leja 点序列在科学计算领域有很多重要的应用，例如迭代求解大规模的线性方程组，求解本征值问
题，多项式插值计算等方面。Leja 点序列特别适合用于高阶多项式插值，鉴于 Newton 插值算法具有很
好的数值稳定性，因此它们经常相互配合，构成 Newton-Leja 多项式插值算法 106 。
A.4 Newton 插值多项式
Newton 多项式插值方法就是利用 Newton 多项式进行插值的方法，Newton 插值多项式的基本形

式如下: 给定 m + 1 个数据点的集合
(x0 , y0 ), . . . , (xm , ym ) (A.24)
其中没有任意两个 xj 是相同的。那么所谓的 Newton 插值多项式有如下的形式:

∑
m
pm (x) = dj Ωj (x), (A.25)
j=0
其中 m 为多项式插值的阶数， dj 为插值系数。Newton 基准多项式 Ωj (x) 的定义如下:
∏
j−1
Ωj (x) = (x − xk ). (A.26)
k=0
显而易见，公式 (3.105) 与公式 (3.106) 就是公式 (A.25) 与公式 (A.26) 的矩阵形式。

Newton 插值多项式之所以受到关注主要是因为可以快速计算高阶的多项式，假设已经求出 pm ，那
么根据公式 (A.25) 可以很快地求出更高阶的多项式 pm+1 。由于 Leja 点序列也是用递归的方式定义的，
因此 Leja 点序列与 Newton 插值多项式联用常常可以达到很高的计算效率。
A.5 Legendre 正交多项式
Legendre 多项式是 Legendre 方程的解，通常用 Pn (x) 表示，其中 n 为 Legendre 多项式的阶数。

可以用 Rodrigues 公式将任意阶的 Legendre 多项式表达出来:
n
1 d
Pn (x) = [(x2 − 1)n ]. (A.27)
2 n! dxn
n
Legendre 多项式存在着如下的递推的关系:
P0 (x) = 1, (A.28)
P1 (x) = x, (A.29)
(n + 1)Pn+1 (x) = (2n + 1)xPn (x) − nPn−1 (x). (A.30)
利用这些递推关系我们可以求出任意阶的 Legendre 多项式。在图A.3 中给出了前五阶 Legendre 多项

式的示意图。Legendre 多项式之间还存在着如下的正交关系:
∫ 1
2
Pm (x)Pn (x)dx = δmn . (A.31)
−1 2n +1
1.5
0.5
Pn (x)
-0.5
n=0
n=1
-1 n=2
Legendre n=3
n=4
-1.5
-1 -0.5 0 0.5 1
x
图 A.3: Legendre 正交多项式函数示意图。在图中仅仅只显示了前五阶的 Legendre 多项式 Pn (x)。
因此 Legendre 多项式属于正交多项式的一种。Legendre 多项式还具有对称性或者是反对称性:
Pn (−x) = (−1)n Pn (x). (A.32)
A.6 Chebyshev 正交多项式
Chebyshev 多项式是 Chebyshev 微分方程的解，根据递归关系的不同，可以划分为两类，第一类

Chebyshev 多项式用 Tn (x) 表示，第二类 Chebyshev 多项式用 Un (x) 表示。本文主要使用的是第二类
Chebyshev 多项式 Un (x)。Chebyshev 多项式的定义式如下:
√ √
(x − x2 − 1)n + (x + x2 − 1)n
Tn (x) = , (A.33)
2
√ √
(x + x2 − 1)n+1 − (x − x2 − 1)n+1
Un (x) = √ . (A.34)
2 x2 − 1
通常还可以利用三角函数来定义 Chebyshev 多项式:
Tn (cos(ϑ)) = cos(nϑ), (A.35)

sin((n + 1)ϑ)
Un (cos(ϑ)) = . (A.36)
sin ϑ
第一类与第二类 Chebyshev 多项式之间存在着如下关系:
d
Tn (x) = nUn−1 (x), n ≤ 1, (A.37)
dx
Tn (x) = Un (x) − xUn−1 (x). (A.38)
当 n 为奇数时，有
∑
n
Un (x) = 2 Tj (x). (A.39)
j odd
当 n 为偶数时，有
∑
n
Un (x) = 2 Tj (x) − 1. (A.40)
j even
第一类 Chebyshev 多项式 Tn (x) 的递推公式如下:
T0 (x) = 1, (A.41)
T1 (x) = x, (A.42)
Tn+1 (x) = 2xTn (x) − Tn−1 (x). (A.43)
第二类 Chebyshev 多项式 Un (x) 的递推公式如下:
U0 (x) = 1, (A.44)
U1 (x) = 2x, (A.45)
Un+1 (x) = 2xUn (x) − Un−1 (x). (A.46)
特别地，通过下述交替递推公式还可以同时求出 Tn (x) 与 Un (x):
T0 (x) = 1, (A.47)
U−1 (x) = 0, (A.48)
Tn+1 (x) = xTn (x) − (1 − x2 )Un−1 (x), (A.49)

1.5
0.5
Un (x)
-0.5
n=0
n=1
-1 n=2
Chebyshev n=3
n=4
-1.5
-1 -0.5 0 0.5 1
x
图 A.4: Chebyshev 正交多项式函数示意图。在图中仅仅只显示了前五阶的第二类 Chebyshev 多项式

Un (x)，第一类 Chebyshev 多项式 Tn (x) 与此类似。
Un (x) = xUn−1 (x) + Tn (x). (A.50)
显而易见，利用上述递推关系，我们可以求出任意阶的 Chebyshev 多项式函数。在图 A.4中给出了前五

阶的第二类 Chebyshev 多项式的示意图。Chebyshev 多项式还存在着如下的正交关系:


 n 6= m
∫ 1 

0:
dx 
Tn (x)Tm (x) √ = π: n=m=0 (A.51)
−1 1 − x2 



π/2 : n = m 6= 0

∫ √ 
0 :
1 n 6= m
Un (x)Um (x) 1 − x dx =
2 (A.52)
−1 
π/2 : n=m
因此，与 Legendre 多项式类似，Chebyshev 多项式也属于正交多项式的一种。

A.7 Lambin-Vigneron 四面体积分方法
Lambin-Vigneron 解析四面体积分算法 156 主要用于在复平面内计算晶格格林函数，它与实平面内

的 P. E. Blöchl 算法 155 是比较类似的。
符号定义
首先定义如下的基本符号：
i : 四面体顶角处的单电子能量 (亦即 LDA 或者 LDA+DMFT 本征值)，它们必须按照能量大小的升序

排列，也就是:1 < 2 < 3 < 4 。
ij : 表示 i − j 。
ri : 表示四面体某个顶角 i 对于积分权重的贡献， ri 是、 1 、 2 、 3 与 4 的函数，请参考公式

(4.86)。
Lambin-Vigneron 函数
为了简化积分权重的表达式，我们定义 Lambin-Vigneron 函数 lv(x) 如下：

( [ ])
1
lv(x) = x 1 − x log 1 + . (A.53)
x
积分权重
分为以下四种情况进行讨论:
(1) 四面体四个顶角的能量各不相同。
( ) ( ) ( )
− 2 − 2 − 3 − 3 − 4 − 4
r1 = lv + lv + lv , (A.54)
32 42 21 23 43 31 24 34 41
( ) ( ) ( )
− 1 − 1 − 3 − 3 − 4 − 4
r2 = lv + lv + lv , (A.55)
31 41 12 13 43 32 14 34 42
( ) ( ) ( )
− 1 − 1 − 2 − 2 − 4 − 4
r3 = lv + lv + lv , (A.56)
21 41 13 12 42 23 14 24 43
( ) ( ) ( )
− 1 − 1 − 2 − 2 − 3 − 3
r4 = lv + lv + lv . (A.57)
21 31 14 12 32 24 13 23 34
(2) 四面体四个顶角的能量其中前两个是相同的, 即 1 = 2 。
r1 = r2 , (A.58)
( ) ( )
1 − 2 − 3 − 3 − 4 − 4
r2 = + lv + lv , (A.59)
2 32 42 23 43 32 24 34 42
[ ] ( ) ( )
− 2 − 3 − 4 − 2 − 4 − 4
r3 = − 2 + 2 lv + 2 lv , (A.60)
23 24 23 24 24 23 24 43
[ ] ( ) ( )
− 2 − 4 − 3 − 2 − 3 − 3
r4 = − 2 + 2 lv + 2 lv . (A.61)
23 24 23 24 23 24 23 34
(3) 四面体四个顶角的能量其中前两个是相同的，后两个也是相同的，即 1 = 2 以及 3 = 4 。
r1 = r2 , (A.62)
( )
− 3 1 − 2 − 2 − 3
r2 = 2 + − 3 2 lv , (A.63)
32 2 232 32 32
( )
− 2 1 − 3 − 3 − 2
r3 = 2 + 2 − 3 2 lv , (A.64)
23 2 23 23 23
r4 = r3 . (A.65)
(4) 四面体四个顶角的能量其中前三个是相同的，即 1 = 2 = 3 。
r1 = r3 , (A.66)
r2 = r3 , (A.67)
( )
1 − 3 5 − 4 − 4 − 4
r3 = 2 − 2 + 2 lv , (A.68)
3 34 6 34 34 43
( )
− 4 1 − 3 − 3 − 4
r4 = + − 3 2 lv . (A.69)
243 2 243 43 43
(5) 四面体四个顶角的能量都是相同的。
1 1
ri = . (A.70)
4 − i
参考文献
[1] M. Imada, A. Fujimori, and Y. Tokura. Metal-insulator transitions. Rev. Mod. Phys., 70:1039,
1998.
[2] G. R. Stewart. Heavy-fermion systems. Rev. Mod. Phys., 56:755--787, 1984.
[3] A P Ramirez. Colossal magnetoresistance. J. Phys.: Condens. Matter, 9:8171, 1997.
[4] Patrick A. Lee, Naoto Nagaosa, and Xiao-Gang Wen. Doping a Mott insulator: Physics of
high-temperature superconductivity. Rev. Mod. Phys., 78:17--85, 2006.
[5] F. Mancini and A. Avella. The Hubbard model within the equations of motion approach.
Adv. Phys., 53:537--768, 2004.
[6] Martin C. Gutzwiller. Effect of Correlation on the Ferromagnetism of Transition Metals.

Phys. Rev. Lett., 10:159--162, 1963.
[7] Raymond Frésard, Johann Kroha, and Peter Wölfle. Strongly Correlated Systems Theoretical
Methods, volume 171 of Springer Series in Solid-State Sciences, chapter 3, pages 65--101.
Springer-Verlag Berlin Heidelberg, 2012.
[8] Walter Metzner and Dieter Vollhardt. Correlated Lattice Fermions in d = ∞ Dimensions.
Phys. Rev. Lett., 62:324--327, 1989.
[9] Antoine Georges, Gabriel Kotliar, Werner Krauth, and Marcelo J. Rozenberg. Dynamical
mean-field theory of strongly correlated fermion systems and the limit of infinite dimen-
sions. Rev. Mod. Phys., 68:13, 1996.
[10] M. Jarrell. Hubbard model in infinite dimensions: A quantum Monte Carlo study. Phys.
Rev. Lett., 69:168--171, 1992.
[11] Antoine Georges and Gabriel Kotliar. Hubbard model in infinite dimensions. Phys. Rev. B,
45:6479--6483, 1992.
[12] G. Kotliar, S. Y. Savrasov, K. Haule, V. S. Oudovenko, O. Parcollet, and C. A. Marianetti. Elec-
tronic structure calculations with dynamical mean-field theory. Rev. Mod. Phys., 78:865,
2006.
[13] K. Held. Electronic structure calculations using dynamical mean field theory. Adv. Phys.,
56:829--926, 2007.
[14] Thomas Maier, Mark Jarrell, Thomas Pruschke, and Matthias H. Hettler. Quantum cluster
theories. Rev. Mod. Phys., 77:1027--1080, 2005.
[15] A. N. Rubtsov, M. I. Katsnelson, and A. I. Lichtenstein. Dual fermion approach to nonlocal

correlations in the Hubbard model. Phys. Rev. B, 77:033101, 2008.
[16] A. Toschi, A. A. Katanin, and K. Held. Dynamical vertex approximation: A step beyond
dynamical mean-field theory. Phys. Rev. B, 75:045118, 2007.
[17] P. W. Anderson. Localized Magnetic States in Metals. Phys. Rev., 124:41, 1961.
[18] R. Hanson, L. P. Kouwenhoven, J. R. Petta, S. Tarucha, and L. M. K. Vandersypen. Spins in

few-electron quantum dots. Rev. Mod. Phys., 79:1217, 2007.
[19] R. Brako and D. M. Newns. Slowly varying time-dependent local perturbations in metals:
a new approach. J. Phys. C, 14:3065, 1981.
[20] D. C. Langreth and P. Nordlander. Derivation of a master equation for charge-transfer

processes in atom-surface collisions. Phys. Rev. B, 43:2541, 1991.
[21] J. Kondo. Resistance Minimum in Dilute Magnetic Alloys. Prog. Theor. Phys., 32:37, 1964.
[22] T. Mizokawa and A. Fujimori. Unrestricted Hartree-Fock study of transition-metal oxides:

Spin and orbital ordering in perovskite-type lattice. Phys. Rev. B, 51:12880, 1995.
[23] K. Yosida and K. Yamada. Perturbation Expansion for the Anderson Hamiltonian. III. Prog.
Theor. Phys., 53:1286, 1975.
[24] N. Read and D. M. Newns. On the solution of the Coqblin-Schreiffer Hamiltonian by the
large-N expansion technique. J. Phys. C, 16:3273, 1983.
[25] P. Coleman. New approach to the mixed-valence problem. Phys. Rev. B, 29:3035, 1984.
[26] P. W. Anderson, G. Yuval, and D. R. Hamann. Exact Results in the Kondo Problem. II. Scal-
ing Theory, Qualitatively Correct Solution, and Some New Results on One-Dimensional
Classical Statistical Models. Phys. Rev. B, 1:4464, 1970.
[27] J. Solyom and A. Zawadoswki. Are the scaling laws for the Kondo problem exact? J. Phys.
F, 4:80, 1974.
[28] R. Hedden, V. Meden, T. Pruschke, and K. Schonhammer. A functional renormalization

group approach to zero-dimensional interacting systems. J. Phys.: Condens. Matter,
16:5279, 2004.
[29] J. Hubbard. Electron Correlations in Narrow Energy Bands. II. The Degenerate Band Case.
Proc. R. Soc. A, 277:237, 1964.
[30] H. Keiter and J. C. Kimball. Perturbation Technique for the Anderson Hamiltonian. Phys.
Rev. Lett., 25:672, 1970.
[31] O. Gunnarsson and K. Schonhammer. Photoemission from Ce Compounds: Exact Model

Calculation in the Limit of Large Degeneracy. Phys. Rev. Lett., 50:604, 1983.
[32] A. A. Abrikosov. . Physics, 2:5, 1965.
[33] S. E. Barnes. New method for the Anderson model. J. Phys. F, 6:1375, 1976.
[34] Serge Florens and Antoine Georges. Quantum impurity solvers using a slave rotor repre-
sentation. Phys. Rev. B, 66:165111, 2002.
[35] N. E. Bickers. Review of techniques in the large-N expansion for dilute magnetic alloys.
Rev. Mod. Phys., 59:845, 1987.
[36] T. Pruschke and N. Grewe. The Anderson model with finite Coulomb repulsion. Z. Phys. B,
74:439, 1989.
[37] K. Haule, S. Kirchner, J. Kroha, and P. Wolfle. Anderson impurity model at finite Coulomb
interaction U : Generalized noncrossing approximation. Phys. Rev. B, 64:155111, 2001.
[38] Emanuel Gull, David R. Reichman, and Andrew J. Millis. Bold-line diagrammatic Monte
Carlo method: General formulation and application to expansion around the noncrossing
approximation. Phys. Rev. B, 82:075109, 2010.
[39] K. G. Wilson. The renormalization group: Critical phenomena and the Kondo problem. Rev.
Mod. Phys., 47:773, 1975.
[40] S. R. White. Density matrix formulation for quantum renormalization groups. Phys. Rev.
Lett., 69:2863, 1992.
[41] U. Schollwock. The density-matrix renormalization group. Rev. Mod. Phys., 77:259, 2005.
[42] R. Bulla, T. A. Costi, and T. Pruschke. Numerical renormalization group method for quantum
impurity systems. Rev. Mod. Phys., 80:395, 2008.
[43] M. Caffarel and W. Krauth. Exact diagonalization approach to correlated fermions in infinite
dimensions: Mott transition and superconductivity. Phys. Rev. Lett., 72:1545, 1994.
[44] Massimo Capone, Luca de' Medici, and Antoine Georges. Solving the dynamical mean-
field theory at very low temperatures using the Lanczos exact diagonalization. Phys. Rev.
B, 76:245116, 2007.
[45] A. Liebsch. Novel Mott Transitions in a Nonisotropic Two-Band Hubbard Model. Phys. Rev.
Lett., 95:116402, 2005.
[46] A. Liebsch, H. Ishida, and J. Merino. Multisite versus multiorbital Coulomb correla-
tions studied within finite-temperature exact diagonalization dynamical mean-field theory.
Phys. Rev. B, 78:165123, 2008.
[47] C. A. Perroni, H. Ishida, and A. Liebsch. Exact diagonalization dynamical mean-field theory
for multiband materials: Effect of Coulomb correlations on the Fermi surface of Na0.3 CoO2 .
Phys. Rev. B, 75:045125, 2007.
[48] J. E. Hirsch and R. M. Fye. Monte Carlo Method for Magnetic Impurities in Metals. Phys.
Rev. Lett., 56:2521, 1986.
[49] Shiro Sakai, Ryotaro Arita, Karsten Held, and Hideo Aoki. Quantum Monte Carlo study for
multiorbital systems with preserved spin and orbital rotational symmetries. Phys. Rev. B,
74:155102, 2006.
[50] D. Handscomb. The Monte Carlo method in quantum statistical mechanics. Proc. Cam-
bridge Philos. Soc., 58:594, 1962.
[51] D. Handscomb. A Monte Carlo method applied to the Heisenberg ferromagnet. Proc.
Cambridge Philos. Soc., 60:115, 1964.
[52] A. W. Sandvik and J. Kurkijarvi. Quantum Monte Carlo simulation method for spin systems.
Phys. Rev. B, 43:5950, 1991.
[53] N. V. Prokof'ev, B. V. Svistunov, and I. S. Tupitsyn. Exact quantum Monte Carlo process for
the statistics of discrete systems. JETP Lett., 64:911, 1996.
[54] B. B. Beard and U. J. Wiese. Simulations of Discrete Quantum Systems in Continuous Eu-
clidean Time. Phys. Rev. Lett., 77:5130, 1996.
[55] N. V. Prokof'ev and B. V. Svistunov. Polaron Problem by Diagrammatic Quantum Monte
Carlo. Phys. Rev. Lett., 81:2514, 1998.
[56] N. V. Prokof'ev, B. V. Svistunov, and I. S. Tupitsyn. Exact, Complete, and Universal

Continuous-Time Worldline Monte Carlo Approach to the Statistics of Discrete Quantum
Systems. Sov. Phys. JETP, 87:310, 1998.
[57] S. M. A. Rombouts, K. Heyde, and N. Jachowicz. Quantum Monte Carlo Method for
Fermions, Free of Discretization Errors. Phys. Rev. Lett., 82:4155--4159, 1999.
[58] Emanuel Gull, Andrew J. Millis, Alexander I. Lichtenstein, Alexey N. Rubtsov, Matthias Troyer,
and Philipp Werner. Continuous-time Monte Carlo methods for quantum impurity models.
Rev. Mod. Phys., 83:349--404, 2011.
[59] A. N. Rubtsov, V. V. Savkin, and A. I. Lichtenstein. Continuous-time quantum Monte Carlo

method for fermions. Phys. Rev. B, 72:035122, 2005.
[60] F. F. Assaad and T. C. Lang. Diagrammatic determinantal quantum Monte Carlo meth-
ods: Projective schemes and applications to the Hubbard-Holstein model. Phys. Rev. B,
76:035116, 2007.
[61] Philipp Werner, Armin Comanac, Luca de' Medici, Matthias Troyer, and Andrew J. Millis.
Continuous-Time Solver for Quantum Impurity Models. Phys. Rev. Lett., 97:076405, 2006.
[62] Philipp Werner and Andrew J. Millis. Hybridization expansion impurity solver: General for-
mulation and application to Kondo lattice and two-orbital models. Phys. Rev. B, 74:155107,
2006.
[63] Philipp Werner and Andrew J. Millis. Efficient Dynamical Mean Field Simulation of the
Holstein-Hubbard Model. Phys. Rev. Lett., 99:146404, 2007.
[64] Philipp Werner and Andrew J. Millis. Dynamical Screening in Correlated Electron Materials.
Phys. Rev. Lett., 104:146401, 2010.
[65] Andreas M. Lauchli and Philipp Werner. Krylov implementation of the hybridization expan-
sion impurity solver and application to 5-orbital models. Phys. Rev. B, 80:235117, 2009.
[66] Kristjan Haule. Quantum Monte Carlo impurity solver for cluster dynamical mean-field
theory and electronic structure calculations with adjustable cluster base. Phys. Rev. B,
75:155113, 2007.
[67] E. Gull, P. Werner, O. Parcollet, and M. Troyer. Continuous-time auxiliary-field Monte Carlo
for quantum impurity models. Europhys. Lett., 82:57003, 2008.
[68] Junya Otsuki, Hiroaki Kusunose, Philipp Werner, and Yoshio Kuramoto. Continuous-time
quantum monte carlo method for the coqblin--schrieffer model. J. Phys. Soc. Japan,
76:114707, 2007.
[69] Emanuel Gull, Philipp Werner, Andrew Millis, and Matthias Troyer. Performance analysis of
continuous-time solvers for quantum impurity models. Phys. Rev. B, 76:235123, 2007.
[70] N. Blumer. Efficiency of quantum Monte Carlo impurity solvers for the dynamical mean-
field theory. Phys. Rev. B, 76:205120, 2007.
[71] Munehisa Matsumoto, Myung Joon Han, Junya Otsuki, and Sergey Y. Savrasov. First-
Principles Simulations of Heavy Fermion Cerium Compounds Based on the Kondo Lattice.
Phys. Rev. Lett., 103:096403, 2009.
[72] Philipp Werner and Andrew J. Millis. High-Spin to Low-Spin and Orbital Polarization Tran-
sitions in Multiorbital Mott Systems. Phys. Rev. Lett., 99:126405, 2007.
[73] Philipp Werner, Emanuel Gull, Matthias Troyer, and Andrew J. Millis. Spin Freezing Transition
and Non-Fermi-Liquid Self-Energy in a Three-Orbital Model. Phys. Rev. Lett., 101:166405,
2008.
[74] Philipp Werner, Emanuel Gull, and Andrew J. Millis. Metal-insulator phase diagram and
orbital selectivity in three-orbital models with rotationally invariant Hund coupling. Phys.
Rev. B, 79:115119, 2009.
[75] Ching-Kit Chan, Philipp Werner, and Andrew J. Millis. Magnetism and orbital ordering in
an interacting three-band model: A dynamical mean-field study. Phys. Rev. B, 80:235114,
2009.
[76] Kristjan Haule and Gabriel Kotliar. Strongly correlated superconductivity: A plaquette dy-
namical mean-field theory study. Phys. Rev. B, 76:104509, 2007.
[77] E. Gull, P. Werner, X. Wang, M. Troyer, and A. J. Millis. Local order and the gapped phase
of the Hubbard model: A plaquette dynamical mean-field investigation. Europhys. Lett.,
84:37009, 2008.
[78] H. Park, K. Haule, and G. Kotliar. Cluster Dynamical Mean Field Theory of the Mott Transi-
tion. Phys. Rev. Lett., 101:186403, 2008.
[79] Michel Ferrero, Pablo S. Cornaglia, Lorenzo De Leo, Olivier Parcollet, Gabriel Kotliar, and
Antoine Georges. Pseudogap opening and formation of Fermi arcs as an orbital-selective
Mott transition in momentum space. Phys. Rev. B, 80:064501, 2009.
[80] E. Gull, O. Parcollet, P. Werner, and A. J. Millis. Momentum-sector-selective metal-insulator

transition in the eight-site dynamical mean-field approximation to the Hubbard model in
two dimensions. Phys. Rev. B, 80:245102, 2009.
[81] K. Mikelsons, E. Khatami, D. Galanakis, A. Macridin, J. Moreno, and M. Jarrell. Thermo-

dynamics of the quantum critical point at finite doping in the two-dimensional Hubbard
model studied via the dynamical cluster approximation. Phys. Rev. B, 80:140505, 2009.
[82] Philipp Werner, Emanuel Gull, Olivier Parcollet, and Andrew J. Millis. Momentum-selective
metal-insulator transition in the two-dimensional Hubbard model: An 8-site dynamical
cluster approximation study. Phys. Rev. B, 80:045120, 2009.
[83] G. Sordi, K. Haule, and A.-M. S. Tremblay. Finite Doping Signatures of the Mott Transition
in the Two-Dimensional Hubbard Model. Phys. Rev. Lett., 104:226402, 2010.
[84] C. A. Marianetti, K. Haule, and O. Parcollet. Quasiparticle Dispersion and Heat Capacity of
Na0.3 CoO2 : A Dynamical Mean-Field Theory Study. Phys. Rev. Lett., 99:246404, 2007.
[85] C. Slezak, M. Jarrell, T. Maier, and J. Deisz. Multi-scale extensions to quantum cluster meth-
ods for strongly correlated electron systems. J. Phys.: Condens. Matter, 21:435604, 2009.
[86] V. V. Savkin, A. N. Rubtsov, M. I. Katsnelson, and A. I. Lichtenstein. Correlated Adatom

Trimer on a Metal Surface: A Continuous-Time Quantum Monte Carlo Study. Phys. Rev.
Lett., 94:026402, 2005.
[87] Kristjan Haule and Gabriel Kotliar. Avoided criticality in near-optimally doped high-
temperature superconductors. Phys. Rev. B, 76:092503, 2007.
[88] J. H. Shim, K. Haule, and G. Kotliar. Modeling the Localized-to-Itinerant Electronic Transition
in the Heavy Fermion System CeIrIn5 . Science, 318:1615--1617, 2007.
[89] J. H. Shim, K. Haule, and G. Kotliar. Fluctuating valence in a correlated solid and the anoma-
lous properties of δ-plutonium. Nature, 446:513--516, 2007.
[90] Hyowon Park, K. Haule, C. A. Marianetti, and G. Kotliar. Dynamical mean-field theory study
of Nagaoka ferromagnetism. Phys. Rev. B, 77:035107, 2008.
[91] L. De Leo, C. Kollath, A. Georges, M. Ferrero, and O. Parcollet. Trapping and Cooling
Fermionic Atoms into Mott and Néel States. Phys. Rev. Lett., 101:210403, 2008.
[92] T. L. Dao, M. Ferrero, A. Georges, M. Capone, and O. Parcollet. Polarized Superfluidity in the
Attractive Hubbard Model with Population Imbalance. Phys. Rev. Lett., 101:236405, 2008.
[93] Philipp Werner, Takashi Oka, Martin Eckstein, and Andrew J. Millis. Weak-coupling quantum
Monte Carlo calculations on the Keldysh contour: Theory and application to the current-
voltage characteristics of the Anderson model. Phys. Rev. B, 81:035108, 2010.
[94] Philipp Werner, Takashi Oka, and Andrew J. Millis. Diagrammatic Monte Carlo simulation
of nonequilibrium systems. Phys. Rev. B, 79:035320, 2009.
[95] Lothar Muhlbacher and Eran Rabani. Real-Time Path Integral Approach to Nonequilibrium
Many-Body Quantum Systems. Phys. Rev. Lett., 100:176403, 2008.
[96] Marco Schiró. Real-time dynamics in quantum impurity models with diagrammatic Monte
Carlo. Phys. Rev. B, 81:085126, 2010.
[97] Marco Schiro and Michele Fabrizio. Real-time diagrammatic Monte Carlo for nonequilib-
rium quantum transport. Phys. Rev. B, 79:153302, 2009.
[98] T. L. Schmidt, P. Werner, L. Muhlbacher, and A. Komnik. Transient dynamics of the Anderson
impurity model out of equilibrium. Phys. Rev. B, 78:235110, 2008.
[99] Jaebeom Yoo, Shailesh Chandrasekharan, Ribhu K Kaul, Denis Ullmo, and Harold U
Baranger. On the sign problem in the hirsch – fye algorithm for impurity problems. J.
Phys. A: Math. Gene., 38:10307, 2005.
[100] Lewin Boehnke, Hartmut Hafermann, Michel Ferrero, Frank Lechermann, and Olivier Par-
collet. Orthogonal polynomial representation of imaginary-time Green's functions. Phys.
Rev. B, 84:075145, 2011.
[101] Alexander Weiße, Gerhard Wellein, Andreas Alvermann, and Holger Fehske. The kernel
polynomial method. Rev. Mod. Phys., 78:275--306, 2006.
[102] F. Aryasetiawan, K. Karlsson, O. Jepsen, and U. Schönberger. Calculations of Hubbard U

from first-principles. Phys. Rev. B, 74:125106, 2006.
[103] F. Aryasetiawan, M. Imada, A. Georges, G. Kotliar, S. Biermann, and A. I. Lichtenstein.

Frequency-dependent local interactions and low-energy effective models from electronic
structure calculations. Phys. Rev. B, 70:195104, 2004.
[104] A. Liebsch. Mott Transitions in Multiorbital Systems. Phys. Rev. Lett., 91:226401, 2003.
[105] Luca de' Medici. Hund's coupling and its key role in tuning multiorbital correlations. Phys.
Rev. B, 83(20):205112, 2011.
[106] Lothar Reichel. Newton interpolation at Leja points. BIT Numerical Mathematics, 30:332--
346, 1990.
[107] J. Baglama, D. Calvetti, and L. Reichel. Fast Leja points. Electron. Trans. Numer. Anal., 7:124-
-140, 1998.
[108] Hartmut Hafermann, Kelly R. Patton, and Philipp Werner. Improved Estimators for the Self-
Energy and Vertex Function in Hybridization Expansion Continuous-Time Quantum Monte
Carlo Simulations. 2011.
[109] R. O. Jones and O. Gunnarsson. The density functional formalism, its applications and
prospects. Rev. Mod. Phys., 61:689--746, 1989.
[110] P. Hohenberg and W. Kohn. Inhomogeneous Electron Gas. Phys. Rev., 136:B864--B871,
1964.
[111] L. J. Sham and W. Kohn. One-Particle Properties of an Inhomogeneous Interacting Electron

Gas. Phys. Rev., 145:561--567, 1966.
[112] W. Kohn and L. J. Sham. Self-Consistent Equations Including Exchange and Correlation
Effects. Phys. Rev., 140:A1133--A1138, 1965.
[113] J. P. Perdew and Alex Zunger. Self-interaction correction to density-functional approxima-

tions for many-electron systems. Phys. Rev. B, 23:5048--5079, 1981.
[114] John P. Perdew and Yue Wang. Accurate and simple analytic representation of the electron-
gas correlation energy. Phys. Rev. B, 45:13244--13249, 1992.
[115] John P. Perdew, Kieron Burke, and Matthias Ernzerhof. Generalized Gradient Approximation
Made Simple. Phys. Rev. Lett., 77:3865--3868, 1996.
[116] Zhigang Wu and R. E. Cohen. More accurate generalized gradient approximation for solids.
Phys. Rev. B, 73:235116, 2006.
[117] John P. Perdew, Adrienn Ruzsinszky, Gabor I. Csonka, Oleg A. Vydrov, Gustavo E. Scuseria,
Lucian A. Constantin, Xiaolan Zhou, and Kieron Burke. Restoring the Density-Gradient
Expansion for Exchange in Solids and Surfaces. Phys. Rev. Lett., 100:136406, 2008.
[118] John P. Perdew, Stefan Kurth, Ale š Zupan, and Peter Blaha. Accurate Density Functional
with Correct Formal Properties: A Step Beyond the Generalized Gradient Approximation.
Phys. Rev. Lett., 82:2544--2547, 1999.
[119] Jianmin Tao, John P. Perdew, Viktor N. Staroverov, and Gustavo E. Scuseria. Climbing the
Density Functional Ladder: Nonempirical Meta Generalized Gradient Approximation De-
signed for Molecules and Solids. Phys. Rev. Lett., 91:146401, 2003.
[120] Carlo Adamo and Vincenzo Barone. Toward reliable density functional methods without
adjustable parameters: The PBE0 model. J. Chem. Phys., 110:6158--6170, 1999.
[121] Jochen Heyd, Gustavo E. Scuseria, and Matthias Ernzerhof. Hybrid functionals based on a
screened Coulomb potential. J. Chem. Phys., 118:8207--8215, 2003.
[122] Edward N. Brothers, Artur F. Izmaylov, Jacques O. Normand, Verónica Barone, and Gus-
tavo E. Scuseria. Accurate solid-state band gaps via screened hybrid electronic structure
calculations. J. Chem. Phys., 129:011102, 2008.
[123] Richard M. Martin. Electronic Structure: Basic Theory and Practical Methods. Cambridge
University Press, College Station, Texas, 2004.
[124] David Vanderbilt. Soft self-consistent pseudopotentials in a generalized eigenvalue for-

malism. Phys. Rev. B, 41:7892--7895, 1990.
[125] P. E. Blöchl. Projector augmented-wave method. Phys. Rev. B, 50:17953--17979, 1994.
[126] X. Gonze, B. Amadon, P.-M. Anglade, J.-M. Beuken, F. Bottin, P. Boulanger, F. Bruneval,
D. Caliste, R. Caracas, M. Côté, T. Deutsch, L. Genovese, Ph. Ghosez, M. Giantomassi,
S. Goedecker, D.R. Hamann, P. Hermet, F. Jollet, G. Jomard, S. Leroux, M. Mancini,
S. Mazevet, M.J.T. Oliveira, G. Onida, Y. Pouillon, T. Rangel, G.-M. Rignanese, D. Sangalli,
R. Shaltaf, M. Torrent, M.J. Verstraete, G. Zerah, and J.W. Zwanziger. ABINIT: First-principles
approach to material and nanosystem properties. Comput. Phys. Comm., 180:2582--2615,
2009.
[127] Paolo Giannozzi, Stefano Baroni, Nicola Bonini, Matteo Calandra, Roberto Car, Carlo
Cavazzoni, Davide Ceresoli, Guido L Chiarotti, Matteo Cococcioni, Ismaila Dabo, An-
drea Dal Corso, Stefano de Gironcoli, Stefano Fabris, Guido Fratesi, Ralph Gebauer, Uwe
Gerstmann, Christos Gougoussis, Anton Kokalj, Michele Lazzeri, Layla Martin-Samos,
Nicola Marzari, Francesco Mauri, Riccardo Mazzarello, Stefano Paolini, Alfredo Pasquarello,
Lorenzo Paulatto, Carlo Sbraccia, Sandro Scandolo, Gabriele Sclauzero, Ari P Seitsonen,
Alexander Smogunov, Paolo Umari, and Renata M Wentzcovitch. QUANTUM ESPRESSO: a
modular and open-source software project for quantum simulations of materials. J. Phys:
Condens. Matter, 21:395502, 2009.
[128] Arash A. Mostofi, Jonathan R. Yates, Young-Su Lee, Ivo Souza, David Vanderbilt, and Nicola
Marzari. wannier90: A tool for obtaining maximally-localised Wannier functions. Comput.
Phys. Comm., 178:685 -- 699, 2008.
[129] A. Svane and O. Gunnarsson. Transition-metal oxides in the self-interaction-corrected

density-functional formalism. Phys. Rev. Lett., 65:1148--1151, 1990.
[130] F Aryasetiawan and O Gunnarsson. The GW method. Rep. Prog. Phys., 61:237, 1998.
[131] Vladimir I. Anisimov, Jan Zaanen, and Ole K. Andersen. Band theory and Mott insulators:
Hubbard U instead of Stoner I. Phys. Rev. B, 44:943--954, 1991.
[132] Vladimir Anisimov and Yuri Izyumov. Electronic Structure of Strongly Correlated Materials,
volume 163 of Springer Series in Solid-State Sciences. Cambridge University Press, College
Station, Texas, 2012.
[133] Lars Hedin. New Method for Calculating the One-Particle Green's Function with Application
to the Electron-Gas Problem. Phys. Rev., 139:A796--A823, 1965.
[134] B. Amadon, F. Lechermann, A. Georges, F. Jollet, T. O. Wehling, and A. I. Lichtenstein.

Plane-wave based electronic structure calculations for correlated materials using dynami-
cal mean-field theory and projected local orbitals. Phys. Rev. B, 77:205112, 2008.
[135] Kristjan Haule, Chuck-Hou Yee, and Kyoo Kim. Dynamical mean-field theory within the
full-potential methods: Electronic structure of CeIrIn5 , CeCoIn5 , and CeRhIn5 . Phys. Rev. B,
81:195107, 2010.
[136] Markus Aichhorn, Leonid Pourovskii, Veronica Vildosola, Michel Ferrero, Olivier Parcollet,
Takashi Miyake, Antoine Georges, and Silke Biermann. Dynamical mean-field theory within
an augmented plane-wave framework: Assessing electronic correlations in the iron pnic-
tide LaFeAsO. Phys. Rev. B, 80:085101, 2009.
[137] V. I. Anisimov, D. E. Kondakov, A. V. Kozhevnikov, I. A. Nekrasov, Z. V. Pchelkina, J. W. Allen,

S.-K. Mo, H.-D. Kim, P. Metcalf, S. Suga, A. Sekiyama, G. Keller, I. Leonov, X. Ren, and D. Voll-
hardt. Full orbital calculation scheme for materials with strongly correlated electrons. Phys.
Rev. B, 71:125119, 2005.
[138] F. Lechermann, A. Georges, A. Poteryaev, S. Biermann, M. Posternak, A. Yamasaki, and O. K.
Andersen. Dynamical mean-field theory using Wannier functions: A flexible route to elec-
tronic structure calculations of strongly correlated materials. Phys. Rev. B, 74:125120, 2006.
[139] J. Minár, L. Chioncel, A. Perlov, H. Ebert, M. I. Katsnelson, and A. I. Lichtenstein. Multiple-

scattering formalism for correlated systems: A KKR-DMFT approach. Phys. Rev. B,
72:045125, 2005.
[140] Alexei Grechnev, I. Di Marco, M. I. Katsnelson, A. I. Lichtenstein, John Wills, and Olle Eriks-
son. Theory of bulk and surface quasiparticle spectra for Fe, Co, and Ni. Phys. Rev. B,
76:035107, 2007.
[141] L. V. Pourovskii, B. Amadon, S. Biermann, and A. Georges. Self-consistency over the charge
density in dynamical mean-field theory: A linear muffin-tin implementation and some
physical implications. Phys. Rev. B, 76:235101, 2007.
[142] G Trimarchi, I Leonov, N Binggeli, Dm Korotin, and V I Anisimov. LDA+DMFT implemented

with the pseudopotential plane-wave approach. J. Phys.: Condens. Matter, 20:135227,
2008.
[143] K Held, O K Andersen, M Feldbacher, A Yamasaki, and Y-F Yang. Bandstructure meets
many-body theory: the LDA+DMFT method. J. Phys.: Condens. Matter, 20:064202, 2008.
[144] Dm. Korotin, A. Kozhevnikov, S. Skornyakov, I. Leonov, N. Binggeli, V. Anisimov, and G. Tri-
marchi. Construction and solution of a Wannier-functions based Hamiltonian in the pseu-
dopotential plane-wave framework for strongly correlated materials. Eur. Phys. J. B, 65:91-
-98, 2008.
[145] S. Biermann, F. Aryasetiawan, and A. Georges. First-Principles Approach to the Electronic

Structure of Strongly Correlated Systems: Combining the GW Approximation and Dynam-
ical Mean-Field Theory. Phys. Rev. Lett., 90:086402, 2003.
[146] D. Jacob, K. Haule, and G. Kotliar. Combining the hybrid functional method with dynamical
mean-field theory. Europhys. Lett., 84:57009, 2008.
[147] S. Biermann, A. Poteryaev, A. I. Lichtenstein, and A. Georges. Dynamical singlets and

correlation-assisted peierls transition in vo2 . Phys. Rev. Lett., 94:026404, 2005.
[148] A. I. Poteryaev, A. I. Lichtenstein, and G. Kotliar. Nonlocal Coulomb Interactions and Metal-
Insulator Transition in Ti2 O3 : A Cluster LDA + DMFT Approach. Phys. Rev. Lett., 93:086401,
2004.
[149] Hunpyo Lee, Kateryna Foyevtsova, Johannes Ferber, Markus Aichhorn, Harald O. Jeschke,
and Roser Valentí. Dynamical cluster approximation within an augmented plane wave
framework: Spectral properties of SrVO3 . Phys. Rev. B, 85:165103, 2012.
[150] I. A. Nekrasov, N. S. Pavlov, and M. V. Sadovskii. Consistent LDA'+DMFT -- an unambiguous

way to avoid double counting problem: NiO test. 2012.
[151] B. Amadon, F. Jollet, and M. Torrent. γ and β cerium: LDA + U calculations of ground-state
parameters. Phys. Rev. B, 77:155104, 2008.
[152] J. Kunes, V. I. Anisimov, S. L. Skornyakov, A. V. Lukoyanov, and D. Vollhardt. NiO: Correlated

Band Structure of a Charge-Transfer Insulator. Phys. Rev. Lett., 99:156404, 2007.
[153] J. Kunes, V. I. Anisimov, A. V. Lukoyanov, and D. Vollhardt. Local correlations and hole
doping in NiO: A dynamical mean-field study. Phys. Rev. B, 75:165115, 2007.
[154] A. I. Lichtenstein, M. I. Katsnelson, and G. Kotliar. Finite-Temperature Magnetism of Transi-

tion Metals: An ab initio Dynamical Mean-Field Theory. Phys. Rev. Lett., 87:067205, 2001.
[155] Peter E. Blöchl, O. Jepsen, and O. K. Andersen. Improved tetrahedron method for Brillouin-
zone integrations. Phys. Rev. B, 49:16223--16233, 1994.
[156] Ph. Lambin and J. P. Vigneron. Computation of crystal Green's functions in the complex-
energy plane with the use of the analytical tetrahedron method. Phys. Rev. B, 29:3430--
3437, 1984.
[157] Mark Jarrell and J.E. Gubernatis. Bayesian inference and the analytic continuation of
imaginary-time quantum Monte Carlo data. Phys. Rep., 269:133--195, 1996.
[158] K. S. D. Beach. Identifying the maximum entropy method as a special limit of stochastic
analytic continuation. 2004.
[159] Anders W. Sandvik. Stochastic method for analytic continuation of quantum Monte Carlo
data. Phys. Rev. B, 57:10287--10290, 1998.
[160] Olav F. Syljuåsen. Using the average spectrum method to extract dynamics from quantum
Monte Carlo simulations. Phys. Rev. B, 78:174429, 2008.
[161] V. S. Oudovenko, G. Palsson, S. Y. Savrasov, K. Haule, and G. Kotliar. Calculations of optical

properties in strongly correlated materials. Phys. Rev. B, 70:125112, 2004.
[162] Jan M Tomczak and Silke Biermann. Multi-orbital effects in optical properties of vanadium
sesquioxide. J. Phys.: Condens. Matter, 21:064209, 2009.
[163] R. Eguchi, T. Kiss, S. Tsuda, T. Shimojima, T. Mizokami, T. Yokoya, A. Chainani, S. Shin, I. H.
Inoue, T. Togashi, S. Watanabe, C. Q. Zhang, C. T. Chen, M. Arita, K. Shimada, H. Namatame,
and M. Taniguchi. Bulk- and Surface-Sensitive High-Resolution Photoemission Study of
Two Mott-Hubbard Systems: SrVO3 and CaVO3 . Phys. Rev. Lett., 96:076402, 2006.
[164] I. A. Nekrasov, K. Held, G. Keller, D. E. Kondakov, Th. Pruschke, M. Kollar, O. K. Andersen, V. I.

Anisimov, and D. Vollhardt. Momentum-resolved spectral functions of SrVO3 calculated by
LDA + DMFT. Phys. Rev. B, 73:155112, 2006.
[165] I. A. Nekrasov, G. Keller, D. E. Kondakov, A. V. Kozhevnikov, Th. Pruschke, K. Held, D. Voll-

hardt, and V. I. Anisimov. Comparative study of correlation effects in CaVO3 and SrVO3 .
Phys. Rev. B, 72:155106, 2005.
[166] Nicola Marzari and David Vanderbilt. Maximally localized generalized Wannier functions
for composite energy bands. Phys. Rev. B, 56:12847--12865, 1997.
[167] Michele Casula, Alexey Rubtsov, and Silke Biermann. Dynamical screening effects in cor-
related materials: plasmon satellites and spectral weight transfers from a Green's function
ansatz to extended dynamical mean field theory. 2011.
[168] K. Byczuk, M. Kollar, K. Held, Y. F. Yang, I. A. Nekrasov, Th. Pruschke, and D. Vollhardt. Kinks
in the dispersion of strongly correlated electrons. Nat. Phys., 3:168--171, 2007.
[169] T. Yoshida, M. Hashimoto, T. Takizawa, A. Fujimori, M. Kubota, K. Ono, and H. Eisaki. Mass
renormalization in the bandwidth-controlled Mott-Hubbard systems SrVO3 and CaVO3
studied by angle-resolved photoemission spectroscopy. Phys. Rev. B, 82:085119, 2010.
[170] Toshiyuki Atou, Masashi Kawasaki, and Satoru Nakajima. Electronic Transition of Cobalt
Monoxide under High-Pressure. Jpn. J. Appl. Phys., 43:L1281--L1283, 2004.
[171] E. Z. Kurmaev, R. G. Wilks, A. Moewes, L. D. Finkelstein, S. N. Shamin, and J. Kuneš. Oxygen

x-ray emission and absorption spectra as a probe of the electronic structure of strongly
correlated oxides. Phys. Rev. B, 77:165127, 2008.
[172] J-P Rueff, A Mattila, J Badro, G Vankó, and A Shukla. Electronic properties of transition-
metal oxides under high pressure revealed by x-ray emission spectroscopy. J. Phys.: Con-
dens. Matter, 17:S717, 2005.
[173] Ronald E. Cohen, I. I. Mazin, and Donald G. Isaak. Magnetic Collapse in Transition Metal
Oxides at High Pressure: Implications for the Earth. Science, 275:654--657, 1997.
[174] Wenxu Zhang, Klaus Koepernik, Manuel Richter, and Helmut Eschrig. Magnetic phase
transition in CoO under high pressure: A challenge for LSDA + U . Phys. Rev. B, 79:155123,
2009.
[175] Jan Kuneš, Alexey V. Lukoyanov, Vladimir I. Anisimov, Richard T. Scalettar, and Warren E.
Pickett. Collapse of magnetic moment drives the Mott transition in MnO. Nat Mater,
7:198--202, 2008.
[176] A. O. Shorikov, Z. V. Pchelkina, V. I. Anisimov, S. L. Skornyakov, and M. A. Korotin. Orbital-

selective pressure-driven metal to insulator transition in FeO from dynamical mean-field
theory. Phys. Rev. B, 82:195101, 2010.
[177] J. Kuneš, Dm. M. Korotin, M. A. Korotin, V. I. Anisimov, and P. Werner. Pressure-Driven

Metal-Insulator Transition in Hematite from Dynamical Mean-Field Theory. Phys. Rev. Lett.,
102:146402, 2009.
[178] U.D. Wdowik and D. Legut. CoO under pressure from first principles. J. Phys. Chem. Sol.,
69:1698--1703, 2008.
[179] C.-Q. Jin, J.-S. Zhou, J. B. Goodenough, Q. Q. Liu, J. G. Zhao, L. X. Yang, Y. Yu, R. C. Yu,
T. Katsura, A. Shatskiy, and E. Ito. High-pressure synthesis of the cubic perovskite BaRuO3
and evolution of ferromagnetism in ARuO3 (A = Ca, Sr, Ba) ruthenates. Proc. Natl. Acad.
Sci., 105:7115--7119, 2008.
[180] C. Felser and R. J. Cava. Electronic structure of two crystallographic forms of BaRuO3 . Phys.
Rev. B, 61:10005--10009, 2000.
[181] T.W. Noh, Y.S. Lee, J.S. Lee, K.W. Kim, J. Yu, G. Cao, J.E. Crow, M.K. Lee, and C.B. Eom. BaRuO3 :
a new type of pseudogap systems. Physica C, 364 – 365:480 -- 483, 2001.
[182] J.-S. Zhou, K. Matsubayashi, Y. Uwatoko, C.-Q. Jin, J.-G. Cheng, J. B. Goodenough, Q. Q. Liu,
T. Katsura, A. Shatskiy, and E. Ito. Critical Behavior of the Ferromagnetic Perovskite BaRuO3 .
Phys. Rev. Lett., 101:077206, 2008.
[183] M. Takizawa, D. Toyota, H. Wadati, A. Chikamatsu, H. Kumigashira, A. Fujimori, M. Oshima,

Z. Fang, M. Lippmaa, M. Kawasaki, and H. Koinuma. Manifestation of correlation effects in
the photoemission spectra of Ca1−x Srx RuO3 . Phys. Rev. B, 72:060404, 2005.
[184] E. Jakobi, S. Kanungo, S. Sarkar, S. Schmitt, and T. Saha-Dasgupta. LDA+DMFT study of

Ru-based perovskite SrRuO3 and CaRuO3 . Phys. Rev. B, 83:041103, 2011.
[185] J. S. Ahn, J. Bak, H. S. Choi, T. W. Noh, J. E. Han, Yunkyu Bang, J. H. Cho, and Q. X. Jia. Spectral
Evolution in (Ca,Sr)RuO3 near the Mott-Hubbard Transition. Phys. Rev. Lett., 82:5321--5324,
1999.
[186] J. S. Dodge, C. P. Weber, J. Corson, J. Orenstein, Z. Schlesinger, J. W. Reiner, and M. R. Beasley.

Low-Frequency Crossover of the Fractional Power-Law Conductivity in SrRuO3 . Phys. Rev.
Lett., 85:4932--4935, 2000.
[187] M. S. Laad, I. Bradarić, and F. V. Kusmartsev. Orbital Non-Fermi-Liquid Behavior in Cubic

Ruthenates. Phys. Rev. Lett., 100:096402, 2008.
[188] Hiroshi Ishida and Ansgar Liebsch. Fermi-liquid, non-Fermi-liquid, and Mott phases in iron
pnictides and cuprates. Phys. Rev. B, 81:054513, 2010.
发表文章目录
[1] Li Huang, Yilin Wang, Xi Dai, Pressure-Driven Orbital Selective Insulator to Metal Transition and Spin
State Crossover in Cubic CoO, submitted to Phys. Rev. B, arXiv:1112.2790
[2] Li Huang, Liang Du, Xi Dai, Complete phase diagram for three-band Hubbard model with orbital degeneracy
lifted by crystal field splitting, submitted to Phys. Rev. B, arXiv:1203.5159
[3] Li Huang, Xi Dai, New implementation of hybridization expansion quantum impurity solver based on
Newton-Leja interpolation polynomial, submitted to Phys. Rev. E, arXiv:1205.1708
[4] Li Huang, Liang Du, Kernel polynomial representation of imaginary-time Green’s functions, submitted
to Phys. Rev. E, arXiv:1205.2791
致谢
首先，我衷心地感谢我的博士研究生导师戴希研究员。在我攻读博士学位的四年期间，戴老师给我
以直接的指导，带领我跨过理论物理研究的门槛，进入到实际的科研工作中。戴老师在强关联物理、计
算物理等领域都有十分深厚的造诣，物理直觉非常优秀，在研究工作中给了我很多指导与启发。戴老师
勤奋刻苦，对科研工作永远充满热情，是我学习的榜样。戴老师治学严谨，做研究时一丝不苟，精益求
精，对学生严格要求，使我获益良多。如果说我在攻读博士学位期间，但凡有一点点成绩，都应该首先
归功于戴老师的言传身教。
其次，我还想感谢组里面的其他几位老师: 方忠研究员、姚裕贵研究员、徐立方研究员、杨义峰研究
员、翁红明研究员。他们都是和蔼可亲的好老师，在不同的场合都曾给予我许多指导与帮助，贯穿我的
博士生涯。还需要感谢的是四川材料与工艺研究所的有关领导与同事，他们为我能有机会攻读博士学位
破除障碍，创造条件，提供了巨大的支持。感谢在物理所期间朝夕相处的同学与朋友，我从他们身上所
学甚多，如果没有他们的帮助，我的工作基本上不可能完成。
最后，感谢我的父母在三十年前把我带到这个世界上，父母的养育之恩永世难忘。感谢我的岳父母在
我攻读博士学位期间对我的宽容和理解，在生活上对我的关怀与照顾。感谢我的妻子赵欣一直以来对我
毫无保留、无怨无悔的付出与爱Œ。

Thesis 黄理博士

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Thesis 黄理博士

Uploaded by

Copyright:

Available Formats

分类号 密级

强关联电子体系的 LDA+DMFT 第一性原理计算方法

申请学位级别 理学博士 学科专业名称 理论物理

论文提交日期 2012 年 4 月 论文答辩日期 2012 年 5 月

Submitted in total fulfilment of the requirements for the degree of Ph.D.

Copyright 2012 by Li Huang

3.3 段表示算法: 电声相互作用与动态屏蔽效应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.3.1 Holstein-Hubbard 模型算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.5 广义矩阵算法:Krylov 算法与 Newton-Leja 算法 . . . . . . . . . . . . . . . . . . . . . . . . . 64

3.5.2 Krylov 子空间迭代算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

3.5.3 Newton-Leja 多项式插值算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

3.6.1 Legendre 正交多项式算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

3.6.2 Chebyshev 正交多项式算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4 LDA+DMFT 第一性原理计算方法: 基本理论框架与实现细节 87

4.1.1 Hohenberg-Kohn 定理与 Kohn-Sham 方程 . . . . . . . . . . . . . . . . . . . . . . 87

4.2 LDA+DMFT 计算方法: 理论框架 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

4.2.1 LDA+DMFT 哈密顿量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

4.2.2 LDA+DMFT 自洽方程 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.2.3 LDA+DMFT 计算方法最新进展 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

4.3 LDA+DMFT 计算程序: 实现细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

4.3.1 LDA+DMFT 计算软件流程框图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

4.3.2 技术路线的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

4.3.3 局域轨道的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

4.3.4 双计数项的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

4.3.5 占据数计算算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

4.3.6 费米面搜索算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

4.3.7 Brillouin 区积分算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

4.3.8 物理量计算算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

4.3.9 并行加速技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

4.4 本章小结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5 LDA+DMFT 第一性原理计算方法: 应用实例 117

5.1 SrVO3 : 关联电子结构计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

5.1.1 研究背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

5.1.2 计算细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

5.1.3 LDA 计算结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

5.1.4 密度 − 密度相互作用与广义相互作用 . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

5.1.5 动态屏蔽效应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

5.2 CoO: 压力驱动下的相变现象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

5.2.1 研究背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

5.2.2 计算细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

5.2.3 LDA 计算结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

5.2.4 轨道选择性的绝缘体 − 金属相变 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

5.2.5 高自旋态 − 低自旋态相变 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

5.3 BaRuO3 : 弱关联非费米液体金属 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

5.3.1 研究背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

5.3.2 计算细节 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

5.3.3 LDA 计算结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

5.3.4 LDA+DMFT 电子结构计算结果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

5.4 本章小结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

A.1 最大熵方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

A.2 随机解析延拓方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

A.3 Leja 点序列 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

A.4 Newton 插值多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

A.5 Legendre 正交多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

A.6 Chebyshev 正交多项式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

A.7 Lambin-Vigneron 四面体积分方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

3.4 段表示算法中插入 segment 示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.5 段表示算法中插入 anti-segment 示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.6 段表示算法中删除 segment 示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.7 段表示算法中删除 anti-segment 示意图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.8 单带 Hubbard 模型的虚频格林函数 G(iω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.9 三带 Hubbard 模型的虚频格林函数 G(iω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.12 Holstein-Hubbard 模型段表示算法图形微扰展开项的阶数分布 p(k) . . . . . . . . . . . . . 54

3.13 动态屏蔽效应影响下的杂质谱函数 A(ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

分类号密级

申请学位级别理学博士学科专业名称理论物理

论文提交日期 2012 年 4 月论文答辩日期 2012 年 5 月

其中 µ 为化学势， k 为单粒子能量色散关系， Σlat (k, iω) 为晶格自能函数。在动力学平均场中，要求