You are on page 1of 1128

Mécanique Quantique

Tome I. Histoires, bases et anciennes théories


I. Introduction
II. Histoire
III. Bases physiques
IV. La théorie de Bohr
V. L'expérience de Young
VI. Principes de base
Tome II. L'équation de Schrödinger
I. Hamiltonien
II. Equation de Schrödinger
III. Applications
IV. Etats liés
V. Théorie des collisions
VI. Formulation matricielle
Annexes
Tome III. Symétries et spin
I. Théorie des groupes
II. Symétries
III. Spin
IV. Particules identiques et spin
V. Physique statistique
VI. Formulation matricielle
Annexes
Tome IV. L'atome d'hydrogène, les atomes et la matière
I. Atomes et molécules
II. Rayonnement
III. Structure hyperfine
IV. Maser et Laser
V. Matière
VI. Le magnétisme
VII. Supraconductivité
Tome V. Mécanique quantique relativiste
I. Vers une équation d'onde relativiste
II. Equation de Dirac
III. Solutions
IV. Hydrogénoïdes
V. Théorie des trous
VI. Propagation et diffusion
Tome VI. Théories à variables cachées, théorèmes et décohérence
I. L'intrication quantique
II. Contextualité
III. Autres théorèmes
IV. Logique quantique
V. Applications
VI. Décohérence
VII. Théorie de Bohm
Tome VII. Interprétation de la mécanique quantique et classicalité
I. Introduction
II. Position du problème
III. Interprétations
IV. Expériences
V. Du quantique au classique
VI. Références
Tome IV. L'atome d'hydrogène, les atomes et la matière
I. Atomes et molécules
I.1. L'atome d'hydrogène
I.3. Approximations
I.3.1. L'approximation des particules indépendantes
I.3.1.1. Les fonctions d'onde de spin
I.3.1.2. Les fonctions d'onde à deux spins
I.3.1.3. Les particules indépendantes
I.3.1.4. La molécule de benzène
I.3.1.5. D'autres exemples de chimie organique
I.3.1.6. Autres utilisation de l'approximation
I.3.2. Méthodes d'approximation pour les états liés
I.3.2.1. Théorie des perturbations stationnaires
I.3.2.2. La méthode des variations
I.3.2.3. Traitement alternatif des séries perturbatives
I.3.2.4. L'approximation WKB
I.3.2.5. Méthodes pour les problèmes dépendant du temps
I.3.3. Méthodes d'approximation en théorie des collisions
I.3.3.1. La matrice de diffusion
I.3.3.2. Théorie des collisions stationnaires
I.3.3.3. Calculs approchés
I.3.3.4. Propriétés analytiques et relations de dispersion
I.3.3.5. Collisions avec réarrangement
I.3.4. Statistique de Maxwell-Boltzmann corrigée. Gaz moléculaires parfaits
I.3.4.1. Loi de répartition et fonctions thermodynamiques
I.3.4.2. Gaz monoatomiques parfaits
I.3.4.3. Gaz parfaits diatomiques asymétriques
I.3.4.4. Gaz parfaits diatomiques symétriques
I.3.4.5. Gaz polyatomiques parfaits
I.3.4.6. Mélange parfait de gaz parfaits
I.3.4.7. Equilibre chimique dans un mélange parfait de gaz parfaits
I.4. Atomes, molécules et noyau atomique
I.4.1. Approximations dans la structure atomique
I.4.2. Les atomes
I.4.3. Molécules
I.4.4. Le noyau atomique
I.4.4.1. L'interaction nucléaire
I.4.4.2. Les modèles de noyau
I.4.4.3. La radioactivité
II. Rayonnement
II.1. L'hamiltonien d'une particule de spin un demi dans un champ magnétique
II.2. L'électron avec spin dans un champ magnétique
II.3. Absorption et émission induite
II.4. Emission spontanée
II.5. Quelques applications de la théorie du rayonnement
III. Structure hyperfine
III.1. Les états de base d'un système fait de deux particules de spin un demi
III.2. L'hamiltonien pour l'état d'énergie le plus bas de l'hydrogène
III.3. Les niveaux d'énergie
III.4. L'effet Zeeman
III.5. Les états en présence d'un champ magnétique
III.6. La matrice de projection pour un spin un
IV. Maser et Laser
IV.1. Les états de la molécule d'ammoniac
IV.2. La molécule dans un champ électrique statique
IV.3. Transitions dans un champ dépendant du temps
IV.4. Transitions à la résonance
IV.5. Le laser
V. Matière
V.1. Structure de la matière
V.1.1. Les assemblages d'atomes
V.1.2. Liaisons interatomiques et structures cristallines
V.1.3. Eléments de cristallographie
V.1.4. Diffraction d'ondes par les cristaux
V.1.5. Vibrations dans les cristaux. Phonons
V.1.6. Propriétés thermodynamiques expérimentales des solides
V.1.7. Interprétation statistique des propriétés des solides
V.1.8. Anharmonicité
V.2. Propriétés électroniques
V.2.1. Introduction
V.2.2. Etats électroniques dans un potentiel périodique
V.2.3. Surface de Fermi
V.2.4. Semi-conducteurs
V.2.5. Jonctions de semi-conducteurs
V.2.6. Redressement du courant à une jonction de semi-conducteurs
V.2.7. Le transistor
VI. Le magnétisme
VI.1. Théorie des ensembles de Gibbs
VI.1.1. Description microscopique d'un système de particules en interaction
VI.1.2. Mesure d'une grandeur
VI.1.3. Postulat de la thermodynamique statistique
VI.1.4. Ensemble microcanonique
VI.1.5. Ensemble canonique
VI.1.6. Ensemble grand canonique
VI.2. Paramagnétisme parfait
VI.2.1. Introduction
VI.2.2. Etude expérimentale des substances magnétiques
VI.2.3. Modèle vectoriel de l'atome
VI.2.4. Modèle de Brillouin du paramagnétisme
VI.2.5. Propriétés des substances paramagnétiques solides
VI.2.6. Désaimantation adiabatique électronique
VI.2.7. Désaimantation adiabatique nucléaire
VI.2.8. Mesure de températures inférieures à 1 K
VI.2.9. Historique des basses températures
V.3. Substances magnétiques
VI.3.1. Introduction
VI.3.2. Propriétés des substances ferromagnétiques
VI.3.3. Interaction entre ions magnétiques
VI.3.4. Modèles du ferromagnétisme
VI.3.5. Théories des phénomènes critiques
VI.3.6. Anisotropie et domaines ferromagnétiques
VI.3.7. Antiferromagnétisme
VI.3.8. Ferrimagnétisme
VI.3.9. Verres de spin
VI.3.10. Ordre magnétique nucléaire
VII. Supraconductivité
VII.1. L'équation de Schrödinger en présence d'un champ magnétique
VII.2. L'équation de continuité pour les probabilités
VII.3. Deux sortes d'impulsion
VII.4. La signification de la fonction d'onde
VII.5. La supraconductivité
VII.6. Propriétés expérimentales
VII.7. Théorie BCS de la supraconductivité
VII.8. Quantification du flux
VII.9. La dynamique de la supraconductivité
VII.10. Supraconducteurs de type II
VII.11. La jonction Josephson
Tome IV L'atome d'hydrogène, les atomes et la matière
En étudiant les statistiques quantiques dérivant des propriétés du spin des particules, nous avons
déjà pu aborder certaines propriétés de la matière. Cela peut avoir mis l'eau à la bouche.

Le moment est donc venu de repartir sur des bases plus simples : l'atome et de voir comment on en
détermine les propriétés. A partir de là, on peut passer aux assemblages d'atomes : molécules et
cristaux, et aller plus profondément dans les propriétés de la matière.

Nous allons commencer par un grand classique de l'équation de Schrödinger et des livres sur la
mécanique quantique : l'atome d'hydrogène. On pourra alors passer aux atomes plus complexes et
aux assemblages d'atomes.

Après avoir étudié plus en profondeurs différentes techniques d'approximations pour des systèmes
complexes, nous étudierons le rayonnement électromagnétique et ses interactions avec les atomes
ce qui nous donnera la clef de détails supplémentaires dans la structure des atomes et certains effets
liés aux champs électromagnétiques.

Un aspect particulièrement intéressant du rayonnement est celui émis par les masers et les lasers.

Enfin, nous attaquerons la matière proprement dite dont certaines des propriétés comme ceux des
semi-conducteurs ou des matériaux magnétiques.

Nous terminerons par l'étude de la supraconductivité.


I. Atomes et molécules

I.1. L'atome d'hydrogène


L'énergie potentielle V (r ) = − Ze 2 / r , qui représente l'interaction coulombienne attractive entre un
noyau atomique de charge + Ze et un électron de charge − e , fournit une autre instance de
l'équation de Schrödinger qui peut être résolue analytiquement. Ce problème est d'un intérêt
physique direct puisque, en dehors des effets relativistes, les niveaux d'énergie calculés sont en
accord avec les niveaux d'énergie observés de l'atome d'hydrogène (Z=1), de l'ion hélium
simplement chargé (Z=2), etc. C'est-à-dire des hydrogénoïdes ou ions possédant un seul électron.

Rappelons que nous travaillons en masse réduite


m1 m2
(1) µ =
m1 + m2
Où m1 et m2 sont les masses de l'électron et du noyau.

Ce qui permet de travailler dans le système de coordonnées du centre de masse avec les
mouvements relatifs
h2 2
(2) − ∇ u + Vµ = Eµ

Comportement asymptotique
Nous avons déjà étudié la séparation de l'équation de Schrödinger en partie radiale et angulaire
dans le cas d'un potentiel à symétrie sphérique. L'équation radiale qui correspond au nombre
quantique l de moment angulaire est alors
h 2 1 d  2 dR  Ze 2 l (l + 1)h 2
(3) −  r  − R + R = ER
2 µ r 2 dr  dr  r 2µ r 2
où E < 0 pour un état lié. Nous suivons la méthode polynomiale utilisée dans le traitement de
l'équation de l'oscillateur harmonique et nous tentons d'abord de récrire (3) sous forme sans
dimension en introduisant la variable indépendante sans dimension ρ = α r . Contrairement à
l'oscillateur harmonique, cependant, où le terme dominant pour x grand était le terme d'énergie
potentielle 12 Kx 2 , le terme dominant dans (3) pour r grand est le terme de valeur propre E. Nous
choisissons donc α tel que le terme E devienne un nombre fixé. Cela rend le comportement
asymptotique de la solution indépendant de la valeur propre. Nous récrivons (3) comme
1 d  2 dR   λ 1 l (l + 1) 
(4) 2 ρ + − − R = 0
ρ dρ  dρ   ρ 4 ρ2 
où le choix particulier du nombre 1/4 pour le terme de valeur propre est arbitraire mais utile pour
les développements qui suivent. La comparaison des équations (3) et (4) montre que
1/ 2
8µ E 2 µ Ze 2 Ze 2  µ 
(5) α =
2
λ= = 
h2 α h2 h  2 E 

Comme pour l'équation de l'oscillateur harmonique, nous trouvons d'abord le comportement


dominant de R( ρ ) dans la région asymptotique ρ → ∞ . Pour ρ suffisament grand, il est évident
1
± ρ
que R ( ρ ) = ρ n e 2 satisfait (4) tant que l'on se limite aux termes dominant (qui sont de l'ordre de
R), quand n a toute valeur finie. Cela suggère que nous cherchions une solution exacte de (4) sous
la forme
1
− ρ
(6) R ( ρ ) = F ( ρ )e
2

où F ( ρ ) est un polynôme d'ordre fini en ρ . La substitution de (6) dans (4) donne une équation
pour F ( ρ )
2   λ − 1 l (l + 1) 
(7) F ′′ +  − 1 F ′ +  − F = 0
ρ   ρ ρ2 
où l'apostrophe indique la dérivée par rapport à ρ .

Niveaux d'énergie
Nous trouvons maintenant une solution pour F sous la forme
(8) F ( ρ ) = ρ s (a 0 + a1 ρ + a 2 ρ 2 + L) ≡ ρ s L( ρ ) a 0 ≠ 0 s ≥ 0

Elle est nécessairement finie pour ρ = 0 . La substitution de (8) dans (7) donne une équation pour L
(9) ρ 2 L ′′ + ρ [2(s + 1) − ρ ]L ′ + [ρ (λ − s − 1) + s (s + 1) − l (l + 1)]L = 0

Si ρ est posé égal à zéro dans cette équation, il suit de la forme de L impliquée par (8) que
s (s + 1) − l (l + 1) = 0 . Cette équation quadratique en s a deux racines : s = l et s = −(l + 1) . La
condition aux limites que R( ρ ) soit fini en ρ = 0 nécessite que nous choisissions s = l . L'équation
pour L devient alors
(10) ρ L ′′ + [2(l + 1) − ρ ]L ′ + (λ − l − 1)L = 0

L'équation (10) peut être résolue en substituant le développement en série donné par la forme (8).
La relation récursive entre les coefficients des termes successifs est facilement trouvée
ν + l +1− λ
(11) aν +1 = a
(ν + 1)(ν + 2l + 2) ν
Si la série ne se termine pas, son comportement asymptotique dominant peut être obtenu par les
coefficients de ses termes les plus élevés :
a 1
(12) ν +1 →
aν ν → ∞ ν

Ce rapport est le même que celui du développement en série de ρ n e ρ avec toute valeur finie n. Les
équations (6) et (8) montrent que ce comportement de L viole la condition aux limites pour R avec
ρ grand.

Donc la série pour L doit se terminer. Si la puissance la plus grande de ρ dans L est ρ n ( n ′ ≥ 0 ),
nous devons choisir λ égal à un nombre n entier positif tel que
(13) λ = n = n ′ + l + 1
Le résultat qui autorise pour λ des valeurs entières plutôt que des multiples d'entiers vient du choix
de 1/4 pour le terme de valeur propre dans l'équation d'onde sans dimension (4).

n ′ est appelé le nombre quantique radial et n le nombre quantique total. Puisque n ′ et l peuvent
prendre seulement des valeurs entières positives ou nulles, n peut avoir les valeurs 1, 2, … Les
valeurs propres de l'énergie sont données par (5)
µ Z 2e4
(14) E n = − E n = − 2 2
2h n
en accord avec la vieille théorie quantique et avec l'expérience. Contrairement au cas du puits de
potentiel carré, le problème du champ coulombien conduit à un nombre infini de niveaux d'énergie
discrets s'étendant de − µ Z 2 e 4 / 2h 2 jusque zéro, pour toute valeur finie de Z. Cela est dû à la
diminution lente de la grandeur du potentiel coulombien pour r grand.

Polynômes de Laguerre
Les solutions physiquement acceptables de (10) avec λ = n peuvent être exprimées en fonction des
polynômes de Laguerre Lq ( ρ ) , qui peuvent être définis à l'aide d'une fonction génératrice.
∞ L (ρ )
e − ρs / (1− s )
(15) U ( ρ , s ) = =∑ s <1
q
sq
1− s q =0 q!

En différentiant la fonction génératrice par rapport à ρ et s on obtient des relations analogues à


celles des polynômes de Hermite et de Legendre :
Lq′ − qLq′ −1 = −qLq −1
(16)
Lq +1 = (2q + 1 − ρ )Lq − q 2 Lq −1

L'équation différentielle à l'ordre le plus bas impliquant seulement Lq qui peut être construite à
partir de (17) est facilement obtenue
(17) ρLq′′ + (1 − ρ )Lq′ + qLq = 0
L'équation (17) ressemble à l'équation (10) mais n'est pas tout à fait la même. Nous définissons le
polynôme de Laguerre associé
dp
(18) Lqp ( ρ ) = Lq ( ρ )
dρ p

En différentiant (17) p fois, on voit que Lqp ( ρ ) satisfait


″ ′
(19) ρLqp + ( p + 1 − ρ )Lqp + (q − p )Lqp = 0

La comparaison de (10) avec λ = n avec (19) montre que les solutions polynomiales désirées sont
les polynômes de Laguerre associés L2nl++l1 ( ρ ) qui sont d'ordre (n + l ) − (2l + 1) = n − l − 1 , en accord
avec (13).

La différentiation de (15) par rapport à ρ donne la fonction génératrice des polynômes de Laguerre
associés :
∞ Lp (ρ )
(20) U p ( ρ , s ) =
(− s ) e − ρ s / (1− s )
p
=∑
q
sq
(1 − s ) p +1
q= p q!

L'expression explicite suivante peut être vérifiée en la substituant dans (20), avec n + l = q et
2l + 1 = p et en échangeant l'ordre des deux sommations

(21) L 2 l +1
n −l −1
(ρ ) = ∑ (− 1) k + 2 l +1 [(n + l )!]2 ρ k
n+l
k =0 (n − l − 1 − k )!(2l + 1 + k )!k!
Fonctions d'onde des hydrogénoïdes
1
− ρ
La fonction d'onde radiale est de la forme e ρ l L2nl++l1 ( ρ ) . La constante de normalisation peut être
2

trouvée en utilisant la fonction génératrice pour évaluer l'intégrale


2n[(n + l )!]
[L (ρ )]
3

e ρ
−ρ
ρ dρ =
2

2l 2 l +1 2
(22)
0
n +l
(n − l − 1)!
Donc, les fonctions d'ondes normalisées de l'énergie pour l'atome d'hydrogène sont
u nlm (r ,θ , φ ) = Rnl (r )Ylm (θ , φ )
1/ 2
 2 Z  3 (n − l − 1)!  1
− ρ
Rnl (r ) = −   3
e 2 L2nl++l1 ( ρ )
 na 0  2n[(n + l )!] 
(23)
h2
a0 =
µ e2
2Z
ρ= r
na 0
où Ylm (θ , φ ) sont les harmoniques sphériques normalisées, a 0 est le rayon de la première orbite
(circulaire) de Bohr pour l'hydrogène (Z = 1) dans la vieille théorie quantique. Les niveaux
d'énergie (14) peuvent être écris
Z 2e 2
(24) E n = −
2a 0 n 2

Les trois premières fonctions radiales obtenues avec (21) et (23) sont
3/ 2
Z
R10 (r ) =  
− Z r / a0
2e
 a0 
3/ 2
 Z   Zr 
(25) R20 (r ) =    2 − e − Z r / 2 a0
2
 0a  a0 
3/ 2
 Z 
R21 (r ) = 
Zr − Z r / 2 a0
 e
 2a 0  a0 3
Il est intéressant de noter que chacune des fonctions propres pour laquelle l = 0 a un gradient
discontinu en r = 0, puisque dRn 0 / dr ≠ 0 , r = 0 et Y00 est indépendant de θ et de φ . C'est une
conséquence de l'énergie potentielle infinie en ce point, comme on peut le montrer au moyen d'un
processus limite similaire à celui utilisé pour dériver les conditions aux limites sur un mur
parfaitement rigide.

Dégénérescence
Les valeurs propres de l'énergie (14) dépendent seulement de n et sont ainsi dégénérées par rapport
à l et m. Donc, pour chaque valeur de n, l peut varier de 0 à n - 1 et pour chacune de ces valeurs de
l, m peut varier de -l à +l. La dégénérescence totale du niveau d'énergie E n est alors
n −1
n(n − 1)
(26) ∑ 2l + 1 = 2
l =0 2
+ n = n2

La dégénérescence par rapport à m est caractéristique de tout champ de force central pour lequel V
dépend seulement de la distance radiale r à un certain point. La dégénérescence l, par contre, est
caractéristique du champ coulombien, contrairement à la plus part des autres champs de force
centrale (voir la discussion sur les symétries dynamiques). Dans certains problèmes, tel que le
mouvement de l'électron de valence d'un atome alcalin, l'énergie potentielle de l'électron est
centrale mais seulement approximativement de forme coulombienne. Cela empêche les n niveaux
d'énergie qui ont le même nombre quantique total n et des l différents d'être identiques, ainsi le
nième niveau d'énergie de l'hydrogénoïde se sépare en n niveaux distincts. De même, si un certain
champ externe (tel qu'un champ magnétique) qui détruit la symétrie sphérique est imposé, la
dégénérescence 2l+1 de m disparaît et le nième niveau de l'hydrogénoïde se sépare en n 2 niveaux
distincts.

L'existence des valeurs propres de l'énergie dégénérées signifie que des combinaisons linéaires des
fonctions propres sont solutions de l'équation de Schrödinger avec la même énergie. Dans le cas de
la dégénérescence m, de telles combinaisons linéaires des harmoniques sphériques Ylm (θ , φ )
correspondent à un nouveau choix de l'axe polaire. Il est raisonnable de s'attendre à ce que ces
combinaisons linéaires des fonctions propres dégénérées des hydrogénoïdes qui ont le même n et
des l différents correspondent aussi à un nouveau choix des coordonnés. C'est bien le cas puisqu'il
s'avère que l'équation de Schrödinger des hydrogénoïdes peut être séparée en coordonnés
paraboliques. En général, la dégénérescence se produira quand l'équation de Schrödinger peut être
résolue de plus d'une manière (dans différents systèmes de coordonnées ou dans un seul système de
coordonnées orienté de plusieurs manières) car s'il n'y avait pas dégénérescence, les fonctions
d'onde différentes obtenues dans des systèmes de coordonnées différents seraient identiques à une
constante multiplicative près et ce n'est habituellement pas possible. Pour un champ central général,
une exception se produit quand l = 0 puisque alors la fonction d'onde est à symétrie sphérique et a
la même forme pour toute orientation de l'axe polaire et ainsi il n'y a pas dégénérescence. Une
exception similaire se produit dans le problème des hydrogénoïdes quand n = 2 puisqu'il s'avère
dans ce cas que les solutions obtenues dans la séparation sphérique ou parabolique des coordonnées
sont identiques.

Coordonnées paraboliques
Rappelons que les coordonnées paraboliques sont définies comme
ξ = r − z = r (1 − cosθ )
(27) η = r + z = r (1 + cosθ )
φ =φ

L'équation pour φ se sépare comme d'habitude avec un nombre quantique m. Et les deux autres
coordonnées donnent :
d  df   m 2 µ E ξ µ Ze 2 
 ξ  −  + − + ν f =0

dξ  dξ   4ξ 2h 2 h2 
(28)
d  dg   m 2 µ E η 
η  −  + − ν  g = 0
dη  dη   4η 2h 2

où ν est une constante.

Niveaux d'énergie
La première équation (28) peut être résolue par la méthode utilisée pour résoudre (3). La
substitution ζ = αξ la met sous forme sans dimension
1 d  df   λ1 1 m 2 
(29)  ζ  +  − − f =0
2 
ζ dζ  dζ   ζ 4 4ζ 
si nous choisissons les paramètres α et λ1 comme
2µ E 1  µ Ze 2 
(30) α 2 = λ =  − ν 
α  h 2
1
h2 

La deuxième équation (28) est aussi de la forme (29) si nous posons ζ = αη avec α donné par
(30) et λ1 remplacé par
ν
(31) λ 2 =
α

Nous traitons maintenant (29) comme nous l'avions fait de (4). Le comportement asymptotique est
1
± ζ
donné par le facteur e 2 , où nous devons prendre le signe moins dans l'exposant. La série qui le
multiplie commence avec un terme ζ s , où on montre facilement que s = ± 12 m . Nous substituons
donc
1 1
− ζ
(32) f (ζ ) = e ζ L(ζ )
m
2 2

dans (29) et nous obtenons comme équation pour L


(33) ζL ′′ + ( m + 1 − ζ )L ′ + λ1 − ( m + 1) L = 0
 1 
 2 

Comme avec (10), les solutions qui ne se terminent pas pour L font que la fonction d'onde (32)
devient infinie pour les grands ζ . Les solutions qui se terminent sont les polynômes de Laguerre
associés. La comparaison des équations (19) et (33) montre qu'ils sont Ln + m (ζ ) où
m
1

(34) n1 = λ1 − ( m + 1)
1
2

est un entier positif ou zéro.


De même, la solution de l'équation en η montre que le nombre
(35) n2 = λ 2 − 12 ( m + 1)
est un entier positif ou zéro. A partir de (34) et (35), on obtient
(36) λ1 + λ 2 = n1 + n2 + m + 1 ≡ n
où n est un entier positif non nul. Les niveaux d'énergie sont alors donnés en combinant (30), (31)
et (36) :
h 2α 2 µ Z 2e2
(37) E n = − E n = − =−
2µ 2h 2 n
en accord avec (14). Le niveau d'énergie E n est dégénéré puisque selon (36) il y a plusieurs
manières pour que les trois nombres quantiques n1 , n2 et m peuvent être combinés pour donner n.
Pour m = 0, il y a n manières de choisir n1 et n2 . Pour m > 0 , il y a deux manières de choisir m
( = ± m ) et n − m manières de choisir n1 et n2 . Donc, la dégénérescence totale du niveau d'énergie
E n est
n −1
 n(n − 1) 
(38) n + 2 ∑ n − m = n + 2 n(n − 1) −  = n2
m =1  2 
en accord avec le résultat précédent.

Fonctions d'onde
Il est clair de la discussion qui précède que les fonctions d'onde non normalisées en coordonnées
paraboliques sont
1
− α (ξ +η )
u n1n2m (ξ ,η , φ ) = e (ξη ) 2 m Lnm1+ m (αξ )Lnm2 + m (αη )e imφ
1
2

(39)
µ Ze 2
α=
h 2 (n1 + n 2 + m + 1)

Pour un niveau d'énergie particulier E n et un nombre quantique magnétique donné m ( n > m ), les
nombres quantiques paraboliques n1 et n2 peuvent être choisis tels que n1 + n2 = n − m − 1 , c'est-à-
dire, de n − m manières différentes. De même, pour n et m donnés, le nombre quantique azimutal l
dans la solution sphérique peut être choisi tel que m ≤ l ≤ n − 1 et donc également de n − m
manières différentes. Donc les n − m produits des fonctions de ξ et η sont des combinaisons
linéaires des n − m produits des fonctions de r et θ .

Le niveau d'énergie de base fournit une illustration particulièrement simple de la relation entre les
solutions paraboliques et sphériques. Dans ce cas, n1 = n2 = m = 0 et la solution parabolique est
simplement e − µ Z e (ξ +η ) / 2 h . De même, n = 1, l = m = 0 et la solution sphérique st e − µ Z e
2 2 2r / h 2
. Il est
évident avec (27) que ces deux solutions sont identiques.

Notations spectroscopiques
Il est intéressant de tracer un graphique avec les valeurs propres de l'énergie selon les nombres
quantiques n et l. Nous indiquons sur ce graphique les notations données aux niveaux d'énergie et
issues de la spectroscopie.
Visualiser les fonctions d'onde n'est pas facile car elles prennent leur valeur dans l'espace à trois
dimensions et ont une amplitude et une phase en chaque point.
On peut donner un aperçu visuel approximatif.

La fonction d'onde radiale, pour l = m = 0, a pour valeur :

Et on peut visualiser grossièrement la densité de probabilité de présence de l'électron dans l'espace


pour m = 0.
Exercices
1. Montrez que la valeur moyenne de l'énergie potentielle d'un électron dans le nième état
quantique d'un atome d'hydrogène est − Z 2 e 2 / a 0 n 2 . A partir de ce résultat, trouvez la valeur
moyenne de l'énergie cinétique.
2. Trouvez les fonctions d'onde normalisées de l'atome d'hydrogène en coordonnées paraboliques
pour n = 2 et m = 0. Exprimez les comme des combinaisons linéaires des fonctions d'onde
correspondantes en coordonnées sphériques.
3. Discutez les parités, s'il y a lieu, des fonctions d'onde de l'hydrogène en coordonnées
paraboliques.
I.3. Approximations

I.3.1. L'approximation des particules indépendantes

I.3.1.1. Les fonctions d'onde de spin


Lors de l'étude des statistiques quantiques, nous avons considéré les particules comme
indépendantes, en ignorant leurs interactions réciproques. Il s'agit là bien sûr d'une approximation.
Ici, nous allons mener plus loin la discussion sur cette idée que les interactions entre électrons
peuvent être négligées. Nous en profiterons pour vous montrer quelques applications de la théorie
de la propagation des particules que nous avons esquissée précédemment. Etant donné que, pour
l'essentiel, nous continuerons à ignorer les interactions entre particules, il y aura très peu de choses
vraiment nouvelles à part quelques applications nouvelles. Cependant, le premier exemple que nous
allons traiter constitue un cas où il est possible d'écrire exactement les équations correctes bien qu'il
y ait plus d'une "particule" présente. Sur ces équations nous pourrons voir ce qu'implique
l'approximation consistant à ignorer les interactions. Mais nous n'analyserons pas ce problème très
à fond.

Comme premier exemple, nous allons considérer une "onde de spin" dans un cristal
ferromagnétique. Nous étudierons plus intensivement le ferromagnétisme plus tard. A température
nulle, tous les spins des électrons qui contribuent au magnétisme au sein du cristal ferromagnétique
sont parallèles. Il y a une énergie d'interaction entre les spins, laquelle est minimum lorsque tous les
spins sont orientés vers le bas. Cependant, à toute température non nulle, il y a une certaine chance
pour que certains des spins soient retournés par l'agitation thermique. Nous allons idéaliser la
situation en supposant que les électrons sont localisés à l'endroit des atomes et que les spins
n'interagissent qu'avec les spins voisins.

Nous considérerons un modèle dans lequel tous les électrons à l'endroit d'un atome sont associés
par paires à l'exception d'un seul, de sorte que tous les effets magnétiques proviennent d'un unique
électron de spin 1/2 par atome. Nous supposons de plus que ces électrons sont localisés aux
emplacements des atomes dans le réseau. Ce modèle correspond à peu près au cas du nickel
métallique.
Nous supposerons aussi qu'il y a une interaction entre chaque électron et ses voisins immédiats, ce
qui donne une contribution à l'énergie du système
(1) E = −∑ Kσ i ⋅ σ j
i, j

où les σ représentent les spins et la sommation s'étend sur toutes les paires d'électrons
immédiatement voisines. L'énergie est écrite avec le facteur -K de manière à ce que K positif
corresponde au ferromagnétisme où l'énergie minimum correspond à la situation de spins voisins
parallèles. Dans un cristal réel, il peut y avoir d'autres termes dus aux interactions avec des
électrons justes au-delà des voisins immédiats, et puis au-delà encore et ainsi de suite, mais il n'est
pas nécessaire que nous considérions ces complications pour le moment.

Avec l'hamiltonien de l'équation (1) nous avons une description complète du ferromagnétisme, dans
les limites de notre approximation, et les propriétés de la magnétisation devraient en découler. Nous
devrions pouvoir également calculer les propriétés thermodynamiques liées à la magnétisation. Si
nous pouvons trouver tous les niveaux d'énergie, les propriétés du cristal à la température T peuvent
se déduire du principe suivant lequel la probabilité de trouver un système dans un état d'énergie E
est proportionnelle à e − E / kT . Nous y reviendrons.

Nous allons montrer certains de ces problèmes en prenant un exemple simple, pour lequel tous les
atomes sont sur une ligne, un réseau à une dimension. Vous pourrez aisément généraliser à trois
dimensions. A chaque emplacement atomique, il y a un électron qui a deux états possibles, son spin
étant soit vers le haut, soit vers le bas, et la totalité du système est décrite une fois spécifiés tous les
arrangements de spins. Nous considérons comme le hamiltonien du système, l'opérateur de
l'énergie d'interaction. En interprétant les vecteurs de spins de (1) comme des opérateurs, nous
écrivons pour le réseau linéaire
A
(2) Hˆ = ∑ − σˆ n ⋅ σˆ n +1
n 2

Pour des raisons pratiques, nous avons dans cette équation écrit la constante sous la forme A/2.
Maintenant, quel est l'état le plus bas de ce système ? L'état d'énergie minimum est celui pour
lequel tous les spins sont parallèles, disons tous vers le haut (l'état minimum est en fait dégénéré, il
y a d'autres états ayant la même énergie, par exemple tous les spins vers le bas ou bien tous dans
une autre direction quelconque. Le plus faible champ extérieur dans la direction z donnera une
énergie différente à tous ces états et celui que nous avons choisi sera le véritable état minimum).
Nous pouvons représenter cet état par L + + + + L ou fond pour "état fondamental". Il est
facile d'établir l'énergie correspondant à cet état. Une façon consiste à écrire tous les vecteurs de
spins en termes de σˆ x , σˆ y et σˆ z et de regarder avec soin l'action de chaque terme du hamiltonien
sur l'état fondamental et puis de faire la somme des termes. On peut aussi emprunter un raccourci.
On peut écrire σˆ i ⋅ σˆ j en termes d'échanges de spin de la manière suivante :

i j ( ij )
(3) σˆ ⋅ σˆ = 2 Pˆ spin ex − 1
où l'opérateur Pijspin ex échange le spin des électrons i et j. Avec cette substitution, l'hamiltonien
devient
(
(4) Hˆ = − A∑ Pˆnspin
, n +1 − 2
ex 1
)
n

A partir de là, on peut facilement établir ce qui arrive aux différents états. Par exemple, si i et j ont
tous deux spins en haut, l'échange des spins laisse l'ensemble inchangé. Ainsi l'action de P̂ij sur cet
état redonne simplement le même état, elle est équivalente à une multiplication par +1. L'expression
( )
Pˆij − 1 / 2 est simplement égale à un demi (à partir de maintenant, nous omettrons l'indice
supérieur de P).

Pour l'état fondamental tous les spins sont vers le haut et par conséquent, si vous faites l'échange de
deux spins quelconques, vous être ramenés à l'état initial. L'état minimum est un état stationnaire.
Si vous faites porter sur lui l'action de l'hamiltonien, vous obtenez à nouveau le même état multiplié
par une somme de termes, − ( A / 2 ) pour chaque paire de spins. Autrement dit l'énergie du système
d'énergie minimum est de - A/2 par atome.
Etudions maintenant les énergies de certains états excités. Il sera pratique de mesurer ces énergies à
partir de l'énergie minimum, celle-ci sera donc notre zéro d'énergie. Il nous suffit pour cela
d'ajouter A/2 à chaque terme dans l'hamiltonien. Le seul effet est de changer en "1" le "1/2" de (4).
Notre nouveau hamiltonien s'écrira
( )
(5) Hˆ = − A∑ Pˆn ,n +1 − 1
n

Avec cet hamiltonien, l'énergie de l'état le plus bas est zéro. L'opérateur d'échange de spin équivaut
à une multiplication par l'unité (pour l'état fondamental) ce qui, avec le "1" de chaque terme, donne
zéro.

Pour décrire les états autres que l'état fondamental, nous aurons besoin d'un ensemble de base
adéquat. Une méthode commode consiste à grouper les états ayant un seul électron de spin en bas,
ceux qui en ont deux et ainsi de suite. Il existe bien sûr beaucoup d'états ayant un seul spin en bas.
Ce spin vers le bas peut se trouver à l'atome "4" ou bien à l'atome "5" ou encore à l'atome "6"… De
fait nous pouvons choisir tout simplement ces états pour états de base. Nous pourrions les désigner
par 4 , 5 , 6 ,… Mais dans la suite, il s'avérera plus pratique de spécifier par sa coordonnée x
"l'atome anormal", celui qui a son électron avec un spin en bas. Ainsi, l'état x5 sera celui dont
tous les électrons ont leur spin en haut à l'exception de celui qui se trouve à l'atome en x5 , lequel a
un électron spin en bas (voir la figure ci-dessous). De façon générale x n sera l'état ayant un seul
spin en bas situé à l'atome n de coordonnée x n .
Quelle est l'action de l'hamiltonien (5) sur l'état x5 ? Prenons un terme de l'hamiltonien, disons
( 7 ,8 )
− A Pˆ − 1 . L'opérateur P̂ échange les spins des atomes 7 et 8. Mais, dans l'état x , ils sont
7 ,8 5

tous les deux vers le haut et rien ne se passe. P̂7 ,8 équivaut à une multiplication par 1 :
(6) Pˆ x = x
7 ,8 5 5

Il s'ensuit que
(
(7) Pˆ7,8 − 1 x5 = 0)
Ainsi tous les termes de l'hamiltonien donnent zéro, à l'exception, bien sûr, de ceux qui concernent
l'atome 5. Sur l'état 5 l'opération P̂4,5 échange le spin de l'atome 4 (en haut) avec celui de l'atome
5 (en bas). Le résultat est l'état ayant tous les spins n haut, sauf en l'atome 4. Autrement dit
(8) Pˆ4,5 x5 = x 4

Et de même
(9) Pˆ5, 6 x5 = x6

( ) ( )
Ainsi, les seuls termes de l'hamiltonien qui survivent sont − A Pˆ4,5 − 1 et − A Pˆ5, 6 − 1 . Agissant sur
x5 , ils produisent respectivement − A x 4 + A x5 et − A x6 + A x5 . Le résultat est
( )
(10) Hˆ x5 = − A∑ Pˆn,n +1 − 1 x5 = − A{ x6 + x 4 − 2 x5 }
n

Quand l'hamiltonien agit sur l'état x5 , il donne lieu à une certaine amplitude pour que le système
soit dans les états x 4 et x6 . Cela signifie simplement qu'il y a une certaine amplitude pour que
le spin en bas saute à l'atome voisin. Ainsi, du fait de l'interaction entre les spins, si nous avons au
départ un seul spin en bas, il y a une certaine probabilité pour qu'à un instant ultérieur ce soit un
autre électron qui ait son spin en bas. En agissant sur un état quelconque x n , l'hamiltonien donne
(11) Hˆ x n = − A{ x n +1 + x n −1 − 2 x n }
Notez en particulier que, si nous prenons un ensemble complet d'états ayant un seul spin en bas, ils
ne feront que se mélanger. L'hamiltonien ne mélangera jamais ces états avec d'autres qui auraient
plus d'un spin en bas. Tant que vous ne faites que des échanges de spins, vous ne changez jamais le
nombre de spins vers le bas.

On aura intérêt à utiliser la notation de matrice pour l'hamiltonien, soit H n,m = x n Hˆ x m .


L'équation (11) peut s'écrire
H n,n = A
(12) H n,n +1 = H n,n −1 = − A
H n,m = 0 n − m >1

Et quels sont les niveaux d'énergie pour les états ayant un spin en bas ? Comme d'habitude, nous
désignons par C n l'amplitude pour qu'un certain état ψ soit dans l'état x n . Pour que ψ soit un
état d'énergie défini, tous les C n doivent varier avec le temps de la même manière, soit
(13) C n = a n e − iEt / h

Nous pouvons insérer cette solution d'essai dans notre équation habituelle de l'hamiltonien
dC
(14) ih n = ∑ H n ,m C m
dt m
en utilisant (12) pour les éléments de matrice. Nous obtenons bien sûr un nombre infini d'équations,
mais elles peuvent s'écrire
(15) Ea n = 2 Aa n − Aa n −1 − Aa n+1

Nous retrouvons exactement le problème que nous avons déjà étudié sur la propagation dans un
cristal, à cela près que là où nous avions E 0 nous avons maintenant 2A. Les solutions
correspondant à la propagation des amplitudes C n (amplitude de spin en bas) le long du réseau,
avec une constante de propagation k et une énergie
(16) E = 2 A(1 − cos kb )
où b est la constante du réseau.

Les solutions d'énergie définie correspondent à des "ondes" de spin en bas, appelées "ondes de
spin". A chaque longueur d'onde correspond une énergie. Pour les grandes longueurs d'onde (petits
k) cette énergie varie comme
(17) E = Ab 2 k 2

Tout à fait comme précédemment, nous pouvons considérer un paquet d'ondes localisé (ne
contenant cependant que de grandes longueurs d'onde) qui correspondent à un électron de spin en
bas dans une région donnée du réseau. Ce spin en bas se comportera comme une "particule". Son
énergie étant reliée à k par (17) la "particule" aura pour masse effective :
h2
(18) meff =
2Ab 2

Ces "particules" sont parfois appelées des "magnons".


I.3.1.2. Les fonctions d'onde à deux spins
Nous voudrions maintenant savoir ce qui se passe lorsqu'il y a deux spins en bas. A nouveau, nous
choisissons des états d base. Nous prendrons des états pour lesquels des spins en bas sont en deux
emplacements atomiques, comme l'état indiqué sur la figure ci-dessous.

On peut désigner un état de ce type par les coordonnées x des deux emplacements où le spin est en
bas. L'état indiqué sur la figure sera donc représenté par x 2 , x5 . De façon générale, les états sont
x n , x m , un ensemble doublement infini ! Dans cette désignation des états, l'état x 4, x0 et l'état
x0 , x 4 sont un seul et même état car, chaque fois, il est dit simplement que le spin en 4 et celui en
9 sont en bas, l'ordre n'a pas d'importance. D'autre part, l'état x 4 , x 4 n'a pas de sens, il n'y a rien
qui lui corresponde. Nous pouvons décrire tout état ψ en donnant les amplitudes pour qu'il soit
dans chacun des états de base. Ainsi C m,n = x m , x n ψ représente maintenant l'amplitude pour
qu'un système dans l'état ψ soit dans l'état où les atomes m et n sont spin en bas. Les
complications qui apparaissent ne sont pas dues à la complexité des idées, ce sont des
complications de répertoire (l'une des complexités de la mécanique quantique est précisément celle
du répertoire. Quand s'accroît le nombre de spins en bas, la notation devient de plus en plus
complexe avec des tas d'indices et les équations deviennent vraiment effrayantes. Mais les idées
n'en sont pas pour autant plus complexes que dans le cas le plus simple).

Les équations de mouvement du système de spin sont les équations différentielles des C m, n . Ce sont

= ∑ (H m, n,ij )C ij
dC m,n
(1) ih
dt i, j
Supposez que nous voulions trouver les états stationnaires. Comme d'habitude, la dérivation par
rapport au temps redonne les amplitudes multipliées par E et l'on peut remplacer les C m, n par les
coefficients a m ,n . Il nous faut regarder ensuite avec soin quel est l'effet de H sur un état avec les
spins m et n vers le bas. Ce n'est pas difficile à voir. Supposez d'abord que m et n sont loin l'un de
l'autre et qu'ainsi nous n'ayons pas à nous occuper d'une éventuelle difficulté. L'opération d'échange
à l'emplacement x n amènera le spin en bas ou bien à l'atome n+1 ou bien à l'atome n-1. Il y a donc
une amplitude pour que l'état considéré soit issu de l'état x m , x n +1 et une autre amplitude pour qu'il
soit issu de l'état x m , x n +1 . Il se peut aussi que ce soit l'autre spin qui ait bougé. Il y a donc une
certaine amplitude pour que C m, n ait une contribution due à C m+1, n et aussi à C m−1, n . Tous ces effets
doivent être égaux. Le résultat final pour l'équation du hamiltonien concernant C m, n est
(2) Ea m,n = − A(a m +1,n + a m −1,n + a m, n+1 + a m, n−1 ) + 4 Aa m,n

Cette équation est correcte à l'exception de deux cas. Si m = n, il n'y a pas d'équation du tout et si
m = n ± 1 , deux termes de (2) doivent disparaître. Nous allons simplement ignorer ces deux
exceptions. Nous ne tiendrons pas compte du fait que quelques rares équations sont légèrement
différentes. Après tout, le cristal est supposé infini et nous avons un nombre infini de termes. En
négliger quelques-uns n'aura sans doute guère d'importance. Oublions donc, pour une première
approximation grossière, ces équations particulières. En d'autres termes, nous admettons que (2) est
vraie pour tout m et tout n même si m et n sont voisins. C'est là l'élément essentiel de notre
approximation.

Il n'y a plus de difficulté pour trouver la solution. Nous obtenons immédiatement


(3) C m,n = a m,n e − iEt / h
avec
(4) a m,n = (const.)e 1 m e 2 n
ik x ik x


(5) E = 4 A − 2 A cos k1b − 2 A cos k 2 b
Imaginez un moment ce qui se passerait si nous avions deux ondes de spin à un seul spin et
indépendantes avec k = k1 et k = k 2 . D'après la section précédente, elles auraient pour énergie
(6) ε 1 = (2 A − 2 A cos k1b )
et
(7) ε 2 = (2 A − 2 A cos k 2 b )

Notez que l'énergie E dans (5) est précisément leur somme,


(8) E = ε (k1 ) + ε (k 2 )

En d'autres termes, nous pouvons considérer notre solution de la manière suivante. Il y a deux
particules, nous voulons dire deux ondes de spin. L'une d'elle a une impulsion donnée par k1 et
l'autre par k 2 et l'énergie du système est la somme des énergies de ces deux objets. Les deux
particules sont indépendantes. Et tout y est.

Nous avons fait bien sûr certaines approximations, mais nous n'avons pas envie pour l'instant de
disserter sur la précision de notre réponse. Cependant il vous paraîtra très concevable que, pour un
cristal de taille raisonnable avec des milliards d'atomes, et donc avec des milliards de termes dans
l'hamiltonien, l'on puisse laisser de coté quelques termes sans introduire beaucoup d'erreur. Si nous
avions un très grand nombre de spins en bas, au point que leur densité soit appréciable, il faudrait
alors certainement se préoccuper des corrections.

Il est assez remarquable qu'une solution exacte puisse s'écrire lorsqu'il y a juste deux spins vers le
bas. Le résultat n'est pas particulièrement important. Il est cependant intéressant que les équations
puissent se résoudre exactement pour ce cas. La solution est :
(9) a m,n = exp[ik c (x m + x n )]sin k x m − x n
avec l'énergie
(10) E = 4 A − 2 A cos k1b − 2 A cos k 2 b
et avec les nombres k c et k reliés à k1 et k 2 par
(11) k1 = k c − k k2 = kc + k
Cette solution comprend "l'interaction" des deux spins. Elle décrit le fait que, lorsque les spins
s'approchent l'un de l'autre, il y a une certaine chance qu'ils diffusent l'un sur l'autre. Les spins se
comportent tout à fait comme des particules avec une interaction. Mais la théorie détaillée de cette
diffusion va au-delà de ce dont nous voulons parler ici.
I.3.1.3. Les particules indépendantes
Dans la section précédente, nous avons écrit un hamiltonien pour un système à deux particules.
Faisant alors une approximation qui équivaut à négliger toute interaction entre ces particules, nous
avons trouvé les états stationnaires. Cet état est simplement le produit de deux états à une seule
particule. Cependant la solution que nous avons donnée pour a m ,n n'est pas vraiment satisfaisante.
Nous avons beaucoup insisté plus haut sur le fait que l'état x9 , x 4 n'est pas différent de x 4 , x9 ,
l'ordre de x m et x n ne joue aucun rôle. L'expression algébrique de C m, n doit donc rester inchangée
si nous intervertissons x m et x n , puisque l'état ne change pas. Avant ou après l'échange, il doit
représenter l'amplitude pour trouver un spin n bas en x m et un spin en bas en x n . Mais vous noterez
que l'expression que nous avons donnée n'est pas symétrique en x m et x n , puisque k1 et k 2
peuvent en général être différents.

L'ennui est que nous n'avons pas imposé cette condition supplémentaire à notre solution. Mais, par
chance, il est facile d'arranger les choses. Notez d'abord que nous avons une autre solution de
l'équation hamiltonienne tout aussi bonne que la précédente :
(1) a m,n = Ke 2 m e 1 n
ik x ik x

Elle a d'ailleurs la même énergie que celle que nous avons obtenue précédemment. Toute
combinaison linaire entre ces deux solutions est également une bonne solution et son énergie reste
identique. La solution que nous aurions dû choisir, étant donné notre condition de symétrie, est
simplement la somme :
[ ik x ik x ik x
]
(2) a mn = K e 1 m e 2 n + e 2 m e 1 n
ik x

Quels que soient k1 et k 2 , l'amplitude C m, n est maintenant indépendante de la manière dont on y


met x m et x n . S'il arrivait que nous inversions x m et x n , nous aurions la même amplitude. Notre
interprétation de (2) en termes de "magnons" doit aussi être modifié. Nous ne pouvons plus dire que
l'équation représente une particule de nombre d'ondes k1 et une seconde particule de nombre
d'ondes k 2 . L'amplitude (2) représente un état avec deux particules (magnons). L'état est
caractérisé par les deux nombres d'ondes k1 et k 2 . Notre solution apparaît comme un état composé
d'une particule d'impulsion p1 = h / k1 et d'une autre d'impulsion p 2 = h / k 2 , mais dans notre état
nous ne pouvons pas dire de laquelle des deux particules il s'agit.

Cette discussion devrait maintenant vous rappeler quand nous avons parlé des particules identiques.
Ce que nous venons de montrer, c'est que les particules des ondes de spin, les magnons, se
comportent comme des particules de Bose identiques. Toutes les amplitudes doivent être
symétriques par rapport aux coordonnées des deux particules, ce qui revient à dire que si nous
"échangeons les deux particules" nous retrouvons la même amplitude avec le même signe. Mais,
objecterez-vous peut-être, pourquoi avons-nous choisi d'ajouter les deux termes pour construire (2)
? Pourquoi pas soustraire ? Avec un signe moins, l'échange de x m et x n ne ferait que changer le
signe de a m ,n ce qui est sans inconvénient. Mais l'échange de x m et x n ne change absolument rien,
il s'agit exactement du même état, tous les électrons du cristal sont exactement là où ils étaient
avant, il n'y a donc aucune raison pour que l'amplitude change ne serait-ce que de signe. Les
magnons se comportent comme des particules de Bose.

De façon générale, les quasi-particules de ce genre peuvent se comporter ou bien comme des
particules de Bose ou bien comme des particules de Fermi. De même que pour les particules libres,
les particules de spin entier sont des bosons et les particules de spin demi-entier sont des fermions.
Le "magnon" correspond au retournement d'un électron de spin initialement vers le haut. Le
changement de spin est un. Le magnon a un spin entier et c'est un boson.

Cette discussion avait essentiellement deux buts : le premier était de vous dire un peu ce que sont
les ondes de spin et le second était de montrer l'existence d'un état dont l'amplitude est un produit
de deux amplitudes et dont l'énergie est la somme des énergies correspondant à ces deux
amplitudes. Pour des particules indépendantes, l'amplitude est le produit et l'énergie est la somme.
Il est facile de voir pourquoi l'énergie est la somme. L'énergie est le coefficient t dans une
exponentielle imaginaire, elle est proportionnelle à la fréquence. Si deux objets sont en train de
− iE t / h − iE t / h
faire quelque chose, l'un avec l'amplitude e 1 et l'autre avec l'amplitude e 2 , et si l'amplitude
pour que les deux choses aient lieu en même temps est le produit des deux amplitudes, il y a alors
une fréquence unique dans le produit, à savoir la somme des deux fréquences. L'énergie
correspondant au produit des deux amplitudes est la somme des énergies.

Nous avons pris un chemin assez détourné pour vous dire un chose simple. Lorsque vous ne tenez
compte d'aucune interaction entre les particules, vous pouvez considérer chaque particule
indépendamment. Chacune d'elles, prise séparément, peut se trouver dans les divers états qui lui
seraient accessibles si elle était seule et elle aura la même contribution à l'énergie, que si elle était
seule. Cependant, vous devez vous souvenir que si ce sont des particules identiques, elles peuvent
ou bien se comporter comme des particules de Bose ou bien comme des particules de Fermi. Quand
les positions des deux électrons sont interchangées, l'amplitude doit changer de signe. Dans
l'équation qui correspond à l'équation (2), il devra y avoir un signe moins entre les deux termes de
droite. En conséquence, deux particules de Fermi ne peuvent pas se trouver exactement dans la
même situation, avec des spins égaux et des k égaux. L'amplitude pour cet état est nulle.
I.3.1.4. La molécule de benzène
Bien que la mécanique quantique fournisse les lois fondamentales qui régissent les structures des
molécules, on ne peut appliquer ces lois de manière exacte qu'aux composés les plus simples. Les
chimistes ont donc mis au point diverses méthodes approchées pour calculer certaines des
propriétés des molécules compliquées. Nous voudrions vous montrer ici comment les chimistes
organiques utilisent l'approximation des particules indépendantes. Nous commençons par la
molécule de benzène.

Nous verrons bientôt la molécule de benzène d'un peu plus près dans l'étude des molécules. Cette
molécule peut être considérée comme un système à deux états, dont les états de base sont ceux
montré dans la figure ci-dessous.

Il y a un anneau de six carbones et un hydrogène lié à chacun d'eux. Du point de vue conventionnel
des liaisons de valence, il est nécessaire de supposer des doubles liaisons entre la moitié des atomes
de carbone et, pour la situation d'énergie minimum, il y a les deux possibilités montrées dans la
figure. Il existe par ailleurs d'autres états d'énergies plus élevées. Comme dans les systèmes à deux
états habituels avec une amplitude pour passer d'un état à l'autre, l'état d'énergie minimum est un
peut plus faible que celle des états indiqués et résulte d'une combinaison de ces deux états de base.

Nous allons maintenant considérer cette même molécule d'un point de vue complètement différent,
en utilisant une approximation d'un autre type. Les deux points de vue nous donneront des réponses
différentes, mais si nous améliorons l'une ou l'autre approximation, nous devrions atteindre la
réalité, c'est-à-dire une description exacte du benzène. Cependant, si on ne se soucie pas de les
améliorer, ce qui est bien sûr le cas habituel, il n'y a pas lieu de s'étonner que les deux descriptions
ne soient pas en accord parfait. Nous allons au moins montrer qu'avec le nouveau point de vue
aussi, l'énergie minimum de la molécule de benzène est plus faible que pour l'une ou l'autre des
structures à trois liaisons ci-dessus.

Le schéma que nous voulons utiliser maintenant est le suivant. Imaginez que les six atomes de
carbone soient réunis par une seule liaison, comme dans la figure ci-dessous.

Nous avons retiré six électrons, puisqu'une liaison correspond à une paire d'électrons, nous avons
donc une molécule de benzène six fois ionisée. Nous allons considérer ce qui se passe quand nous
remettons un par un les six électrons. Nous supposons aussi que toutes les liaisons montrées ci-
dessus sont satisfaites et qu'il n'y a plus lieu de s'en occuper.

Que se passe-t-il quand nous remettons un électron dans l'ion moléculaire ? Il peut se placer dans
l'une quelconque des six positions autour de l'anneau, ce qui correspond à six états de base. Il aura
une certaine amplitude, mettons A, pour aller d'une position à une position voisine. Si nous
analysons les états stationnaires, nous trouverons certains niveaux d'énergie possibles. Voilà en ce
qui concerne un seul électron.

Introduisons ensuite un second électron. Faisons maintenant l'approximation la plus ridicule que
vous puissiez imaginer : ce que fait un électron n'est pas affecté par ce que l'autre est en train de
faire. En fait, ils vont bien sûr interagir. Ils se repoussent l'un l'autre par la force coulombienne. De
plus, quand ils sont l'un et l'autre en un même site, ils doivent avoir une énergie considérablement
différente de deux fois l'énergie correspondant à la présence de l'un des deux. Il est certain que
l'approximation des particules indépendantes n'est pas justifiée lorsqu'il n'y a que six emplacements
et surtout lorsque nous voulons y mettre six électrons. Et pourtant les chimistes organiques ont pu
apprendre un tas de choses en faisant ce genre d'approximation.

Avant d'étudier en détail la molécule de benzène, considérons un exemple plus simple : la molécule
d'éthylène qui ne contient que deux atomes d'hydrogène comme indiqué dans la figure ci-dessous.

Cette molécule a une liaison supplémentaire, portant sur deux électrons entre les deux carbones.
Retirons l'un des deux électrons : qu'avons-nous alors ? Nous pouvons y voir un système à deux
états, l'électron restant peut-être avec l'un quelconque des deux carbones. Les énergies possibles
pour cet unique électron sont ou bien E 0 − A ou bien E 0 + A , comme indiqué sur la figure ci-
dessous.
Réintroduisons le second électron. Bon, si nous avons deux électrons, nous pouvons mettre le
premier dans l'état le plus bas et le second dans l'état le plus haut. Ce n'est pas tout à fait vrai. Nous
oublions quelque chose. En fait, chacun des états est double. Quand nous disons qu'il y a un état
possible avec l'énergie E 0 − A , il y en a en fait deux. Deux électrons peuvent aller dans le même
état si l'un a son spin en haut et l'autre en bas (on ne peut pas en mettre plus à cause du principe
d'exclusion). Il y a donc en fait deux états possibles d'énergie E 0 − A . Nous pouvons dessiner un
schéma qui indique les deux niveaux d'énergie et leur peuplement.
Pour l'énergie minimum, les deux électrons seront dans l'état le plus bas, leurs spins étant opposés.
L'énergie de la liaison supplémentaire dans la molécule d'éthylène est donc 2(E 0 − A) , si du moins
nous négligeons l'interaction entre les deux électrons.

Revenons à la molécule de benzène. Chacun des deux états a trois liaisons doubles. Chacune
d'elles, tout comme la liaison éthylène, contribue par 2(E 0 − A) à l'énergie, si E 0 est maintenant
l'énergie pour mettre un électron dans l'un des emplacements du benzène. L'énergie devrait donc
être à peu près 6(E 0 − A) . Mais l'énergie de la molécule est en fait plus basse que l'énergie de la
structure avec trois liaisons supplémentaires. Voyons ce qu'il en est dans ce point de vue.

Nous partons de l'anneau de benzène six fois ionisé et nous ajoutons un électron. Nous avons
maintenant un système à six états. Nous pouvons écrire six équations entre ces six amplitudes .
Mais épargnons-nous un peu de travail en remarquant que nous avons déjà résolu ce problème
lorsque nous avons étudié le cas d'un électron sur une ligne infinie d'atomes. Le benzène n'est bien
sûr pas une ligne infinie, il y a six emplacements atomiques sur un cercle. Mais imaginez que nous
ouvrions le cercle et disposions en ligne, en numérotant les atomes de 1 à 6. Sur une ligne infinie
l'emplacement suivant serait 7, imposons qu'il soit identique à celui en 1, et ainsi de suite. En
d'autres termes, nous pouvons prendre la solution pour une ligne infinie avec une condition
supplémentaire : la solution doit être périodique, avec un cycle portant sur six atomes. L'électron
sur une ligne a des états d'énergie définie lorsque l'amplitude en chaque site est e ikxn = e ikbn . Pour
chaque k, l'énergie est
(1) E = E 0 − 2 A cos kb

Nous ne voulons utiliser maintenant que les solutions qui se répètent tous les six atomes. Traitons
d'abord le cas général pour un anneau de N atomes. Si la solution doit avoir une période de N
espacements atomiques, il faut que e ikbN soit égal à l'unité et donc que kbN soit un multiple de
2π . Si s représente un entier quelconque, notre condition s'écrit
(2) kbN = 2πs

Nous avons vu antérieurement qu'il n'y a pas lieu de prendre des k en dehors du domaine ± π / b .
On obtient donc tous les états possibles en prenant la valeur de s dans le domaine ± N / 2 .

Nous trouvons alors que pour un anneau de N atomes, il y a N états d'énergie définie (vous pourriez
penser que lorsque N est pair, il y a N+1 états. Ce n'est pas le cas, puisque s = ± N / 2 donnent le
même état) dont les nombres d'ondes k s sont donnés par

(3) k s = s
Nb

Chaque état a l'énergie (1). Les niveaux d'énergie possibles constituent un spectre de lignes. Le
spectre pour le benzène (N = 6) est montré dans la figure (b) ci-dessous (les nombres entre
parenthèse indiquent combien il y a d'états différents pour une même énergie).
Il existe une façon astucieuse de situer les six niveaux d'énergie. C'est ce que nous montrons dans la
partie (a) de la figure ci-dessus. Considérez un cercle de centre E 0 et de rayon 2A. Si à partir du
bas nous établissons six arcs égaux (sous-tendus par les angles k s b = 2πs / N soit 2π / 6 dans le cas
du benzène) les hauteurs des points sont alors les solutions de l'équation (1). Les six points
représentent dix états possibles. L'énergie la plus basse est E 0 − 2 A et ainsi de suite. Ce sont les
états possibles pour un électron seul. Si nous avons plus d'un électron, il peut y en avoir deux, de
spin opposé, dans chaque état. Notons que certains énergies sont dégénérées et ainsi il peut y avoir
quatre électrons d'énergie E 0 − A .

Pour la molécule de benzène, nous devons introduire dix électrons. Pour constituer l'état d'énergie
minimum, ils devront remplir les états les plus bas possibles, deux en s = 0, deux en s = +1 et deux
en s = -1. Selon l'approximation des particules indépendantes, l'énergie de l'état minimum est
E fond = 2(E 0 − 2 A) + 4(E 0 − A)
(4)
= 6 E0 − 8 A

L'énergie est en effet plus faible, de la quantité 2A, que celle des trois liaisons doubles séparées.

En comparant l'énergie du benzène et celle de l'éthylène, il est possible de déterminer A. On obtient


ainsi 0.8 électron-volt ou bien, en unités de chimistes, 18 kilocalories par mole.

Nous pouvons utiliser cette description pour calculer ou comprendre d'autres propriétés du benzène.
Par exemple, en utilisant la figure ci-dessus, nous pouvons discuter de l'excitation du benzène par la
lumière. Que se passerait-il si nous cherchions à exciter l'un des électrons ? Il pourrait monter vers
l'un des états supérieurs non occupés. La plus faible énergie d'excitation correspondrait à une
transition depuis le plus haut niveau rempli jusqu'au plus bas niveau non occupé. Cela demande
l'énergie 2A. Le benzène absorbera donc un lumière de fréquence ν tel que hν = 2 A . Il y aura
aussi une absorption de photons d'énergie 3A et 4A. Il va sans dire que le spectre d'absorption du
benzène a été mesuré et la disposition générale des lignes spectrales est à peu près correcte, à part
le fait que la transition la plus basse se situe dans l'ultraviolet. Pour avoir un bon accord, il faudrait
prendre une valeur A située entre 1.4 et 2.4 électrons-volts. La valeur numérique de A est donc
deux ou trois fois plus grande que la valeur déduite des énergies de liaisons chimiques.

Ce que fait le chimiste dans des cas semblables est d'analyser beaucoup de molécules similaires et
d'en déduire des règles empiriques. Il apprend par exemple ceci : pour calculer l'énergie de liaison,
il faut utiliser telle ou telle valeur de A, mais, pour obtenir un spectre à peu près correct de
l'absorption, il faut utiliser une autre valeur de A. Vous pouvez avoir l'impression que c'est un peu
absurde. Ce n'est pas très satisfaisant du point de vue du physicien, qui essaie de comprendre la
nature à partir de ses principes premiers. Mais le problème du chimiste est différent. Il doit deviner
à l'avance ce qui va se passer avec des molécules qui n'ont jamais été faites ou que l'on ne
comprend pas tout à fait. Ce dont il a besoin, c'est d'une série de règles empiriques, savoir d'où elles
viennent n'importe guère. Il n'emploie donc pas la théorie de la même façon que le physicien. Il
prend des équations qui reflètent plus ou moins la réalité, mais il doit en modifier les constantes,
réalisant ainsi des corrections empiriques.
Dans le cas du benzène, la cause principale de désaccord provient de notre hypothèse que les
électrons sont indépendants. La théorie dont nous sommes partis n'est pas vraiment justifiée.
Néanmoins, elle reflète un peu la réalité : les résultats semblent en effet aller dans la bonne
direction. Avec des équations de ce genre, plus quelques règles empiriques, lesquelles comportent
diverses exceptions, le chimiste organique trouve son chemin à travers le marécage des choses
compliquées qu'il a choisi d'étudier (n'oubliez pas que si le physicien est capable de vraiment
calculer à partir des principes premiers, c'est qu'il ne choisit que des problèmes simples. Il ne résout
jamais un problème avec 42 ou même 6 électrons dedans. Jusqu'à présent, il n'a su calculer de
manière raisonnablement précise que l'atome d'hydrogène et l'atome d'hélium).
I.3.1.5. D'autres exemples de chimie organique
Voyons comment on peut utiliser les mêmes idées pour l'étude d'autres molécules. Considérez une
molécule telle que le butadiène (1,3) représenté dans la figure ci-dessous avec l'habituelle
distribution des liaisons de valence.

Nous pouvons reprendre le même jeu avec les quatre électrons en excès correspondant aux deux
liaisons doubles. Si nous retirons quatre électrons, nous avons quatre carbones en ligne. Vous savez
déjà comment résoudre le cas des atomes en ligne. Vous dites : "mais non, je ne sais résoudre
qu'une ligne infinie". Mais les solutions pour la ligne infinie comprennent celles pour une ligne
finie. Regardez. Soit N le nombre d'atomes sur la ligne, et nous les numérotons 2 à N comme
indiqué sur la figure ci-dessous.

En écrivant les équations pour l'amplitude à la position 1, nous n'aurez pas de terme fourni par la
position 0. De même, l'équation pour la position N sera différente de celle que nous avions pour
une ligne infinie, car il n'y a rien en provenance de la position N + 1. Mais supposez que nous
puissions obtenir pour la ligne infinie une solution qui ait la propriété suivante : l'amplitude pour
être à l'atome 0 est nulle et l'amplitude pour être à l'atome N + 1 est nulle aussi. L'ensemble des
équations pour tous les emplacements de 1 à N sur la ligne finie sont alors satisfaites elles aussi.
Vous pourriez penser qu'il n'existe pas de solution de ce genre pour la ligne infinie, étant donné que
toutes nos solutions étaient de la forme e ikxn , qui donne la valeur absolue de l'amplitude égale à un
partout. Mais vous vous souviendrez que l'énergie ne dépend que de la valeur absolue de k, de sorte
qu'il existe une autre solution tout aussi justifiée pour la même énergie, à savoir e −ikxn . Et il en est
de même pour toute superposition de ces deux solutions. En les soustrayant, on peut obtenir la
solution sin kx n , qui satisfait la condition que l'amplitude soit nulle à x = 0. Il lui correspond
toujours l'énergie E 0 − 2 A cos kb . C'est en fait une solution analogue aux ondes stationnaires en
physique ondulatoire. Par ailleurs, un choix judicieux de k nous permettra de rendre aussi
l'amplitude nulle à x N +1 . Il faut pour cela que ( N + 1)kb soit un multiple de π , c'est-à-dire
π
(1) kb = s
N +1
où s est un entier allant de 1 à N (nous ne prenons que des k positifs car chaque solution contient +k
et -k, un changement de signe de k redonnerait exactement le même état). Pour la molécule de
butadiène, N = 4, il y a donc quatre états avec
(2) kb = π / 5 , 2π / 5 , 3π / 5 et 4π / 5

Nous pouvons représenter les niveaux d'énergie en utilisant un diagramme circulaire similaire au
diagramme du benzène. Cette fois, nous utilisons un demi-cercle divisé en cinq parties égales
comme indiqué sur la figure ci-dessous.

Le point tout en bas correspond à s = 0, ce qui ne donne aucun état. Il en est de même pour le point
tout en haut qui correspond à s = N + 1. Les quatre autres points nous donnent quatre énergies
permises. Il y a quatre états stationnaires et c'est bien ce que nous prévoyions puisque nous avions
au départ quatre états de base. Dans le diagramme circulaire, les intervalles sont π / 5 ou 36 degrés.
. On obtient ainsi comme énergie minimale E 0 − 1.618 A (Ah ! Que de merveilles dans les
mathématiques ! Le nombre d'or des Grecs nous donne l'état d'énergie minimum de la molécule de
butadiène dans le cadre cette théorie ! Le nombre d'or ou divine proportion est le rapport considéré
par les anciens Grecs comme harmonieux entre les côtés d'un rectangle que l'on peut diviser en un
carré et un rectangle semblable).

Nous pouvons maintenant calculer l'énergie de la molécule de butadiène, lorsque nous y mettons
les quatre électrons. Avec quatre électrons, nous remplissons les deux niveaux les plus bas avec
chacun deux électrons de spins opposés. L'énergie totale est
(3) E = 2(E 0 − 1.618 A) + 2(E 0 − 0.618 A) = 4(E 0 − A) − 0.477 A

Ce résultat semble raisonnable. L'énergie est un peu plus faible que pour les deux liaisons doubles
isolées, mais la liaison n'est cependant pas aussi grande que pour le benzène. En bref, c'est comme
cela que les chimistes analysent certaines molécules organiques.

Le chimiste peut utiliser non seulement les énergies, mais aussi les amplitudes de probabilité.
Connaissant les amplitudes pour chaque état et sachant aussi quels états sont occupés, il peut dire la
probabilité de trouver un électron en un point quelconque de la molécule. Les emplacements où les
électrons sont le plus souvent propices à des réactions chimiques qui exigent qu'un électron soit mis
en commun avec un certain autre groupe d'atomes. Les autres emplacements sont plus propices à
des substitutions chimiques qui tendent à céder un électron supplémentaire au système.

Par cette même ligne d'idées, nous pouvons atteindre une certaine compréhension d'une molécule
aussi complexe que la chlorophylle dont l'un des modes est montré dans la figure ci-dessous.
Notes que les liaisons simples et doubles qui font le tour forment un anneau fermé avec vingt
intervalles. Les électrons supplémentaires des liaisons doubles peuvent circuler autour de l'anneau.
En utilisant la méthode des particules indépendantes, nous pouvons obtenir tout un ensemble de
nivaux d'énergie. Il y a de fortes lignes d'absorption qui proviennent des transitions entre ces
niveaux et qui se situent dans la partie visible du spectre, ce qui donne à cette molécule sa couleur
intense. Des molécules complexes similaires, telle que la xanthophylle, qui donne aux feuilles la
couleur rouge, peuvent s'étudier de la même manière.

Il y a encore une autre idée qui se dégage de l'application de ce genre de théorie à la chimie
organique. C'est probablement la plus riche ou, tout au moins dans un certain sens, la plus précise.
Cette idée est en relation avec la question suivante : dans quels cas obtient-on une énergie de
liaison chimique particulièrement grande ? La réponse est très intéressante. Prenez d'abord
l'exemple du benzène et imaginez la succession d'événements qui se produit si l'on part de la
molécule six fois ionisée et que l'on ajoute de plus en plus d'électrons. Nous aurions alors divers
ions de benzène négatifs ou positifs. Supposez que nous portions sur un graphique l'énergie de l'ion
(ou de la molécule neutre) en fonction du nombre des électrons. En prenant E 0 = 0 (puisque nous
ne savons pas sa valeur), nous obtenons la figure ci-dessous.

Pour les deux premiers électrons, la fonction est une ligne droite. Pour chaque groupe successif, la
pente augmente et il y a donc discontinuité de la pente entre chaque groupe d'électrons. La pente
change lorsque l'on a juste fini de remplir un ensemble de niveaux à même énergie et qu'il faut
qu'on passe à l'ensemble des niveaux immédiatement supérieurs pour y mettre l'électron suivant.

L'énergie de l'ion benzène est en fait très différente de ce que montre cette figure à cause des
interactions entre électrons et des énergies électrostatiques que nous avons négligées. Cependant,
ces corrections doivent varier avec n de manière assez régulière. Même si nous faisions toutes ces
corrections, la courbe d'énergie conserverait des points anguleux pour les valeurs de n qui
complètent juste un certain niveau d'énergie.

Considérez une courbe très régulière qui suive en moyenne les points comme dans la figure ci-
dessous.
Nous pouvons dire que les points au-dessus de cette courbe ont des énergies "plus grandes que la
normale" et que les points en dessous de la courbe ont des énergies "plus faibles que la normale",
comme ici les molécules avec n égal à 2, 6 et 10. De façon générale, nous nous attendons à ce que
les configurations avec une énergie plus faible que la normale aient une stabilité plus grande que la
moyenne, chimiquement parlant. Notez que les configurations les plus loin en dessous de la courbe
se trouvent toujours à la fin des segments de droite, c'est-à-dire là où il y a juste assez d'électrons
pour remplir ce qu'on appelle une "couche d'énergie". C'est en cela que consiste la prédiction très
précise de la théorie. Les molécules, ou ions, sont particulièrement stables (en comparaison avec les
autres configurations similaires) lorsque les électrons disponibles remplissent juste une couche
d'énergie.

Cette théorie a permis d'expliquer et de prédire certains faits chimiques assez étranges. Pour
prendre un exemple très simple, considérez un anneau de trois. Il est presque incroyable que le
chimiste puisse faire un anneau de trois et que cet anneau soit stable, mais cela a été fait. Le cercle
d'énergie pour trois électrons est montré dans la figure ci-dessous.
Si maintenant vous mettez deux électrons dans l'état le plus bas, vous n'avez que deux des trois
électrons qu'il vous faut. Il faut mettre le troisième électron dans un niveau beaucoup plus haut.
Selon notre raisonnement, cette molécule ne devrait pas être particulièrement stable, tandis que la
structure à deux électrons devrait être stable. Et, de fait, la molécule neutre de triphényl-
cyclopropenyl est très difficile à réaliser, tandis que l'ion positif montré ci-dessous est relativement
facile à faire.
L'anneau de trois n'est jamais facile à faire car il y a toujours une forte tension lorsque dans une
molécule organique les liaisons forment un triangle équilatéral. Pour réaliser un composé stable, il
faut stabiliser la structure d'une manière ou d'une autre. Il se trouve que si vous ajoutez un anneau
de benzène à chaque sommet du triangle, l'ion positif peut se faire (on ne sait pas vraiment
pourquoi il faut ajouter des anneaux de benzène).

On put analyser de façon semblable l'anneau à cinq cotés. Si vous dessinez le diagramme d'énergie,
vous pouvez voir de façon qualitative que la structure à six électrons doit être tout particulièrement
stable. C'est donc en tant qu'ion négatif que cette molécule sera la plus stable. Et de fait l'anneau de
cinq est facile à faire et bien connu et il se comporte toujours comme un ion négatif. De même
façon, vous pouvez vérifier facilement qu'un anneau de 4 ou de 8 n'est pas intéressant, mais qu'un
anneau de 10 ou de 14, comme celui de 6, devrait être particulièrement stable en tant qu'objet
neutre.
I.3.1.6. Autres utilisation de l'approximation
Il existe deux autres situations similaires que nous allons décrire brièvement. Pour analyser la
structure d'un atome, nous pouvons considérer que les électrons remplissent des couches
successives. La théorie de Schrödinger sur le mouvement des électrons ne peut être aisément mise
en œuvre que s'il s'agit d'un seul électron se déplaçant dans un champ "central", un champ ne
variant qu'en fonction de la distance par rapport à un point. Alors, comment peut-on analyser ce qui
se passe dans un atome avec 22 électrons ?! Une manière consiste à utiliser une sorte
d'approximation de particules indépendantes. Vous calculez d'abord ce qui se passe avec un
électron. Vous obtenez un certain nombre de niveaux d'énergie. Vous placez un électron dans l'état
d'énergie le plus bas. Pour un modèle grossier, vous pouvez continuer d'ignorer les interactions
entre électrons et vous pouvez continuer à remplir les couches successives, mais il existe un moyen
d'obtenir de meilleures réponses en tenant compte, au moins d'une manière approchée, de l'effet de
la charge électrique portée par l'électron. Chaque fois que vous ajoutez un électron, vous calculez
l'amplitude pour qu'il se trouve aux divers emplacements et vous utilisez ensuite cette amplitude
pour faire une certaine estimation d'une espèce de distribution de charge à symétrie sphérique.
C'est-à-dire que l'on calcule la probabilité que l'électron se trouve à une distance donnée et on fait
l'hypothèse approximative que le résultat équivaut à une fraction de la charge de l'électron,
proportionnelle à cette probabilité, se trouve répartie de manière sphérique autour de l'atome. C'est
une approximation non négligeable car, outre que le résultat n'est pas vraiment analogue à une
"charge étalée", la fonction d'onde n'est à symétrie sphérique que pour les orbitales de type s. Vous
utilisez le champ de cette distribution en même temps que le champ du noyau positif et de tous les
électrons antérieurs pour calculer les états disponibles pour l'électron suivant. De cette manière
vous pouvez obtenir des corrections raisonnables pour l'énergie de l'atome neutre et des états
ionisés. Ce que vous trouvez ainsi, c'est qu'il existe des couches d'énergie, tout à fait comme ce que
nous avons vu pour les électrons dans une molécule en anneau. Avec une couche partiellement
remplie, l'atome montrera une tendance à se saisir d'un ou plusieurs électrons supplémentaires ou
bien à perdre quelques électrons, de manière à passer à l'état plus stable d'une couche remplie.

Cette théorie explique le mécanisme qui gouverne les propriétés chimiques fondamentales tout au
long de la table périodique des éléments. Les gaz inertes sont les éléments pour lesquels une couche
vient juste d'être complétée et il est particulièrement difficile de les faire réagir (quelques-uns
réagissent, bien sûr, avec l'oxygène et le fluor, par exemple, mais les composés obtenus sont
faiblement liés. Les gaz appelés inertes sont presque inertes). Un atome ayant un électron de plus
ou de moins qu'un gaz inerte perdra ou prendra facilement un électron pour passer à la situation
particulièrement stable (état de basse énergie) associée au fait d'avoir une couche complètement
remplie, ce sont ces éléments chimiques très actifs dont la valence est +1 ou -1.

L'autre situation se rencontre en physique nucléaire. Dans les noyaux atomiques, les protons et les
neutrons interagissent très fortement entre eux. Et pourtant on peut, là aussi, utiliser le modèle des
particules indépendantes, pour analyser la structure nucléaire. C'est d'abord expérimentalement que
l'on s'est aperçu que les noyaux particulièrement stables contenaient des neutrons en nombre bien
défini, à savoir, 2, 8, 20, 28, 50, 82. Les noyaux contenant ces mêmes nombres de protons sont eux
aussi particulièrement stables. Comme, au début, on n'avait pas d'explication pour ces nombres, on
les a appelés les "nombres magiques" de la physique nucléaire. Il est bien connu que les neutrons et
les protons interagissent fortement les uns avec les autres. Les gens ont donc été très surpris quand
ils se sont aperçus qu'un modèle de particules indépendantes prévoyait une structure de couche
faisant intervenir les premiers nombres magiques. Le modèle supposait que chaque nucléon (proton
ou neutron) se déplaçait dans un potentiel central créé par les effets moyens de tous les autres
nucléons. Ce modèle ne réussit cependant pas à fournir des valeurs correctes pour les nombres
magiques plus élevés. Maria Mayer et, indépendamment Jensen et ses collaborateurs, ont alors
découvert qu'en prenant le modèle des particules indépendantes et en y ajoutant seulement une
correction "d'interaction spin - orbite", on pouvait tirer de ce modèle amélioré tous les nombres
(l'interaction spin - orbite rend l'énergie du nucléon plus basse si son spin est dans la même
direction que son moment angulaire orbital dans son mouvement au sein du noyau). La théorie nous
apprend d'autres choses encore, sa description de ce qu'on appelle la "structure en couche" nous
permet de prédire certaines caractéristiques des noyaux nucléaires.

L'approximation des particules indépendantes s'est révélée très utile pour un vaste domaine de
sujets divers, depuis la physique de l'état solide jusqu'à la chimie, la biologie, la physique nucléaire.
Nous avons déjà vu que la physique statistique faisait abondamment usage avec succès de cette
approximation des particules indépendantes. Ce n'est souvent qu'une approximation grossière, mais
elle permet de comprendre pourquoi il y a des conditions particulièrement stables, en couches. Du
fait qu'elle laisse de coté toute la complexité des interactions entre particules individuelles, il n'y a
pas lieu de s'étonner qu'elle soit souvent tout à fait incapable de fournir de manière correcte de
nombreux détails importants.
I.3.2. Méthodes d'approximation pour les états liés
En mécanique quantique, tout comme en physique classique, il y a relativement peu de systèmes
physiquement intéressants pour lesquels les équations du mouvement peuvent être résolues
exactement. Les méthodes d'approximation jouent donc un rôle important dans virtuellement toutes
les applications de la théorie. Cela augmente plutôt que ne diminue l'importance des problèmes
pour lesquels des solutions exactes peuvent être trouvés puisque ces solutions exactes sont souvent
utiles comme point de départ de calculs approchés. Elles peuvent aussi aider à établir des limites de
validité pour différentes méthodes d'approximation.

Nous venons d'analyser en détail la méthode particulièrement simple des particules indépendantes.
Nous allons maintenant développer plusieurs méthodes d'approximation, plus fines, et nous allons
les appliquer à des exemples parlants. Il est utile de diviser les méthodes en deux groupes selon
qu'elles traitent des états liés ou des états avec diffusion.
I.3.2.1. Théorie des perturbations stationnaires
La théorie des perturbations stationnaires est concernée par les changements dans les niveaux
d'énergie discrets et les fonctions propres d'un système quand une petite perturbation est appliquée.
On suppose initialement que l'hamiltonien H de l'équation de Schrödinger peut être écrit comme la
somme de deux parties. Une de ces parties, H 0 , a une structure suffisament simple pour que
l'équation de Schrödinger puisse être résolue et l'autre partie, H ′ , est suffisament petite pour être
vue comme une perturbation de H 0 . Il est utile de retenir nos vieux symboles u k et E k pour les
fonctions propres orthogonales et les valeurs propres supposées connues de l'hamiltonien H 0 non
perturbé et d'utiliser ψ et W pour la fonction d'onde stationnaire perturbée et le niveau d'énergie :
(1) Hψ = Wψ H = H0 + H ′ H 0uk = Ek uk

Cas non dégénéré


L'hypothèse que H ′ est petit suggère que nous développions la fonction propre perturbée et la
valeur propre en série de H ′ . On réalise cela plus facilement en fonction d'un paramètre λ , tel que
les puissances zéro, un, etc. de λ correspondent au calcul de perturbation à l'ordre zéro, un, etc.
Nous remplaçons H ′ par λH ′ et nous exprimons ψ et W comme des développements en série de
λ . Nous supposons que ces deux séries sont des fonctions analytiques continues de λ pour λ
entre zéro et un, bien que les résultats obtenus aient souvent l'utilité d'une série asymptotique même
lorsque cette condition n'est pas respectée. Les différents ordres de l'approximation de la
perturbation sont alors donnés par les coefficients des puissances correspondantes de λ . Dans le
résultat final, λ est posé égal à 1.

La fonction d'onde perturbée et le niveau d'énergie sont écrits


ψ = ψ 0 + λψ 1 + λ2ψ 2 + λ3ψ 3 + L
(2)
W = W0 + λW1 + λ2W2 + λ3W3 + L
et sont substitués dans l'équation de Schrödinger pour donner
(3) (H 0 + λH ′)(ψ 0 + λψ 1 + L) = (W0 + λW1 + L)(ψ 0 + λψ 1 + L)
Puisque l'équation (3) est supposée valide pour un domaine continu de λ , nous pouvons égaliser
les coefficients de puissances identiques de λ des deux cotés pour obtenir une série d'équations qui
représentent successivement des ordres de plus en plus élevés de la perturbation
(H 0 − W0 )ψ 0 = 0
(H 0 − W0 )ψ 1 = (W1 − H ′)ψ 0
(4) (H 0 − W0 )ψ 2 = (W1 − H ′)ψ 1 + W2ψ 0
(H 0 − W0 )ψ 3 = (W1 − H ′)ψ 2 + W2ψ 1 + W3ψ 0
L

La première des équations (4) signifie que ψ 0 est une des fonctions d'onde non perturbée, comme
attendu. Nous posons donc
(5) ψ 0 = u m W0 = E m

Cet état u m est discret, puisque nous travaillons avec la perturbation d'un état lié. Il est également
supposé être non dégénéré bien que d'autres fonctions propres non perturbées puissent être
dégénérées ou distribuées continûment en énergie. Le cas où l'état non perturbé ψ 0 est dégénéré
sera considéré plus loin.

Deux commentaires généraux peuvent être faits à propos de (4). Tout d'abord, toutes les fonctions
ψ s peuvent avoir un multiplie arbitraire de ψ 0 ajouté sans affecter la valeur du coté gauche des
équations et donc sans affecter la détermination de ψ s en terme des fonctions d'ordre inférieur.
Nous choisissons le multiple arbitraire tel que
(6) (ψ 0 ,ψ s ) = 0 s > 0

Ensuite, le produit scalaire de ψ 0 et du coté gauche de chacune des équations de (4) est égal à zéro
quand on utilise les propriétés des fonctions d'onde. Donc, le produit scalaire de ψ 0 et le coté droit
est zéro dans chaque cas et en utilisant (5) et (6) on a
(ψ 0 , H ′ψ s −1 ) (
(7) Ws = = u m , H ′ψ s −1 )
(ψ 0 ,ψ 0 )
Nous voyons que le calcul de W à un ordre donné en H ′ nécessite seulement la connaissance de ψ
à l'ordre immédiatement inférieur.

Perturbation au premier ordre


L'équation (7) avec s = 1 montre que
(8) W1 = (u m , H ′u m ) = m H ′ m
qui est la valeur moyenne de H ′ pour l'état non perturbé m.

Il est pratique de calculer ψ 1 en le développant en fonction de u n :


(9) ψ 1 = S n a n(1)u n

La substitution de (9) dans la deuxième équation (4) donne


(10) S n a n(1) (H 0 − E m )u n = (W1 − H ′)u m
où a m(1) = 0 à cause de (6). Nous remplaçons H 0 u n par E n u n , nous multiplions par u k∗ et nous
intégrons sur tout l'espace en utilisant l'orthonormalité des fonctions u :
k H′m
(11) a k(1) = k≠m
Em − Ek

Perturbation au second ordre


L'équation (7) avec s = 2 et en utilisant (9) et (11) donne
2
m H′n n H′m m H′n
(12) W2 = S n′a n(1) m H ′ n = S n′ = S n′
Em − En Em − En
où l'apostrophe sur S n′ indique l'omission du terme m = n de la sommation et l'intégration sur n. La
dernière étape dans (12) vient du fait que H ′ est hermitique.
Nous calculons ψ 2 en développant à nouveau en fonction de u n :
(13) ψ 2 = S n′a n(2 )u n a m(2 ) = 0
et en substituant dans la troisième équation (4) pour obtenir
(14) S ′a ( ) (H
n n
2
0 − E m )u n = S n′a n(1) (W1 − H ′)u n + W2 u m

Comme avant, nous remplaçons H 0 u n par E n u n , nous multiplions par u k∗ et nous intégrons :
(15) a k(2 ) (E k − E m ) = a k(1)W1 − S n′a n(1) k H ′ n k≠m

Cela donne, avec l'aide de (8) et (11),


k H′n n H′m k H′m m H′n
(16) a k(2 ) = S n′ −
(E m − E k )(E m − E n ) ( E m − E k )2
Les équations (2), (8) et (16) avec λ = 1 donnent l'énergie et la fonction d'onde au second ordre en
H′ :
2
m H′n
W = E m + m H ′ m + S n′
Em − En
(17)
 k H′m  m H′m  k H′n n H′m 
ψ = u m + S k′u k  1 −  + S′ 
 E m − E k  Em − Ek 

n
(E m − E k )(E m − E n )

L'apostrophe indique l'omission de k = m ou n = m, selon.

Il est important de noter que ψ n'est pas normalisé puisque


2
k H′m
(18) (ψ ,ψ ) = 1 + S k′
( E m − E k )2
au second ordre en H ′ . Cela se produite à cause de la condition arbitraire (6). D'autre choix pour
(ψ 0 ,ψ s ) conduiraient à des expressions de ψ qui diffèrent de (17) seulement par un nombre
complexe multiplicatif. Ils n'affecteraient pas l'expression de W.

Perturbation d'un oscillateur


Comme exemple simple de l'application de la théorie des perturbations au premier et second ordre à
un état non dégénéré, considérons la perturbation du niveau d'énergie m de l'oscillateur harmonique
par une énergie supplémentaire H ′ = 12 bx 2 . L'hamiltonien non perturbé est H 0 = p 2 / 2 µ + 12 Kx 2
(la masse est notée µ pour éviter la confusion avec le nombre quantique m). Les fonctions d'ondes
non perturbées u m ( x ) correspondent aux valeurs propres E m = (m + 12 )h(K / µ ) où m = 0, 1, 2,…
1/ 2

Cet exemple est évidemment trivial puisque les fonctions d'onde et valeurs propres perturbées sont
données simplement en remplaçant K par K + b dans u m ( x ) et E m . Il est néanmoins instructif.

Nous avons besoin des éléments de matrice de x 2 entre différentes paires de fonctions d'onde de
l'oscillateur harmonique. Ils peuvent être obtenus avec l'aide de la fonction génératrice pour les
polynômes de Hermite ou plus simplement par multiplication matricielle en utilisant les
expressions de n x m donné précédemment pour l'oscillateur harmonique. Nous obtenons
facilement
( )
 2α 2 −1 [(m + 1)(m + 2 )]1 / 2 n = m + 2

(19) n x m = 
2 ( )
 2α 2 (2m + 1)
−1
n=m
 2α
2 −1
( )
[m(m − 1)]1/ 2
n = m−2
0 autrement

(
où α = µK / h 2 )
1/ 4
. La substitution dans la première équation (17) donne alors pour l'énergie au
second ordre
1/ 2
K  b2 
(20) W = (m + )h 
b
1
1 + − 
2 
µ
2
 2 K 8 K 
en accord avec le développement de (m + 12 )h[(K + b ) / µ ] au second ordre en b.
1/ 2
Cas dégénéré
La discussion a supposé jusqu'ici que l'état initial ψ 0 = u m est non dégénéré bien que les autres
fonctions propres non perturbées peuvent être dégénérées. Supposons maintenant qu'il y a deux
états, u m et u l , qui ont la même énergie non perturbée. Alors l'équation (11) pose des difficultés
quand k = l sauf si l H ′ m = 0 . Considérons d'abord le cas où l H ′ m ≠ 0 , tel que les résultats
obtenus ci-dessus ne peuvent pas être valides.

L'état initial n'est pas spécifié par son énergie non perturbée. L'état peut être u m ou u l ou toute
combinaison linéaire de ces deux états. Supposons que la perturbation H ′ élimine la
dégénérescence à un certain ordre, tel que pour λ fini il y a deux états qui ont des énergies
différentes. Nous avons supposé précédemment que ψ et W sont des fonctions analytiques
continues de λ lorsque λ → 0 . Donc chacun des deux états approche une combinaison linéaire
définie de u m et u l quand λ = 0 . Si nous arrivons à choisir une de ces deux combinaisons linéaires
comme état initial, le développement en perturbation peut être effectué sans difficulté. Si,
cependant, nous partons d'une autre combinaison linéaire, il y a un changement discontinu en
λ = 0 et les développements (2) ne sont plus valides et la méthode développée ci-dessus échoue.
Parmi le nombre infini de paires orthonormales de combinaisons linéaires de u m et u l , la paire
particulière que nous recherchons dépendra de H ′ . Par exemple, si H ′ est la perturbation produite
par un champ électrique ou magnétique externe, la paire que nous recherchons dépendra non
seulement du type de champ présent mais aussi de sa direction.

Afin de trouver cette paire, nous écrivons à la place de (5)


(21) ψ 0 = a m u m + a l u l W0 = E m = El

Nous substituions alors ce ψ 0 dans le coté droit de la deuxième équation (4) et nous prenons le
produit scalaire de cette équation successivement avec u m et u l :
( m H′m )
− W1 a m + m H ′ l al = 0
( )
(22)
l H ′ m a m + l H ′ l − W1 al = 0
Cette équation algébrique homogène peut être résolue pour a m et a l si et seulement si le
déterminant de leurs coefficients s'annule. Nous obtenons donc une équation quadratique pour W1 .
Les deux solutions pour cette équation sont
(23) W1 = 1
2 ( m H′m ) (
+ l H ′ l ± 12  m H ′ m − l H ′ l

)
2
+ 4 m H ′l
2 1/ 2



Puisque les éléments diagonaux de l'opérateur hermitique H ′ sont réels, les deux valeurs de W1
sont réelles. Elles sont égales si et seulement si
(24) m H ′ m = l H ′ l mH l =0

Dans ce cas nous disons que la dégénérescence n'est pas éliminée au premier ordre. Alors, a m et a l
ne peuvent évidemment pas être déterminés par un calcul au premier ordre.

D'autre part, si une des équations (24) n'est pas satisfaite, les deux valeurs de W1 calculées avec
(23) sont distinctes et chacune peut être utilisée pour calculer a m et a l à partir de (22). Nous
obtenons donc la paire désirée de combinaisons linéaires des états non perturbés u m et u l . Ensuite
nous prenons le produit scalaire de u k avec la deuxième équation (4), où k ≠ m, l , et nous utilisons
(9) pour obtenir
(25) a k(1) (E k − E m ) = − k H ′ m a m − k H ′ l a l

Cela donne a k(1) pour k ≠ m, l et l'équation (6) avec s = 1 est satisfaite si nous supposons que
a m(1) = al(1) = 0 . Le calcul peut être effectué à des ordres plus élevés comme dans la situation non
dégénérée considérée précédemment.
Elimination de la dégénérescence au second ordre
Si les deux valeurs de W1 obtenues ci-dessus sont les mêmes, nous devons aller au second ordre
pour éliminer la dégénérescence. Le produit scalaire de la troisième équation (4) avec u m et u l
conduit à
(26) S′ m H ′ n a( ) −W a
n n
1
2 m =0 S′ l H ′ n a( ) −W a
n n
1
2 l =0

L'apostrophe de S n′ indique maintenant l'omission à la fois des termes n = m et n = l de la


sommation et de l'intégration sur n, puisque nous supposons à nouveau sur la base de (6) que
a m(1) = al(1) = 0 . La substitution de a n(1) de (25) dans (26) donne une paire d'équations algébriques
homogènes pour a m et a l :
 m H′n
2
 m H ′ n n H ′l
 S n E − E − W2 a m + S n′

 
al = 0
 m n  Em − En
 
(27)
l H′n n H′m  l H′n
2

S′ a m +  S n′
 
− W2  a l = 0
Em − En Em − En
n
 
 

L'équation séculaire associée aux équations (27) conduit à des solutions pour W2 qui sont de la
même forme générale que (23). L'analogue des équations (24) est
2 2
m H′n l H′n m H ′n n H ′l
(28) S′ = S n′ S′ =0
Em − En Em − En Em − En
n n

A moins que ces deux équations ne soient satisfaites, la dégénérescence est éliminée au second
ordre.

La forte analogie entre les sommes qui apparaissent dans (27) et (28) et les éléments de matrice qui
apparaissent dans (22) et (24) conduisent souvent à les appeler éléments de matrice au second
ordre. Une condition nécessaire et suffisante pour que la dégénérescence soit éliminée à un ordre
donné est que ou les éléments de matrice diagonaux de H ′ pour les deux états dégénérés non
perturbés soient inégaux (ainsi la première des équations (24) ou (28) n'est pas valide) ou que les
éléments de matrices non diagonaux de H ′ entre ces états ne s'annulent pas (ainsi la deuxième
équation (24) ou (28) n'est pas valide).

En ce qui concerne la dernière condition, une condition suffisante pour que la dégénérescence soit
éliminée au premier ordre est que la perturbation H ′ relie les états dégénérés initiaux u m et u l au
premier ordre, ainsi m H ′ l ne s'annule pas. De même, la dégénérescence est éliminée au second
ordre si la perturbation reliée les états initiaux au second ordre, ainsi il y a un ou plusieurs états u n
tels que m H ′ n et l H ′ n ne s'annulent pas.

Il n'est pas difficile de montrer que tout le travail précédent peut être généralisé pour éliminer la
dégénérescence à un ordre plus élevé et aussi au cas où l'état initial est plus que doublement
dégénéré.

Effet Zeeman sans le spin de l'électron


Le changement dans les niveaux d'énergie d'un atome causé par un champ magnétique uniforme
externe est appelé effet Zeeman. Nous considérons maintenant le changement au premier ordre dans
le champ magnétique H pour un atome d'hydrogène. Par simplicité, l'interaction entre le moment
magnétique associé au spin de l'électron et le champ magnétique sera négligé, bien qu'en réalité il
soit du même ordre de grandeur que le terme que nous allons calculer. L'effet du spin de l'électron
sera analysé plus tard.

Un champ magnétique constant peut être représenté par le potentiel vecteur


1
(29) A = H × R
2
puisque H = ∇ × A . La divergence de (29) est zéro, ainsi les termes impliquant A qui apparaissent
dans l'hamiltonien pour un électron de charge -e et de masse réduite µ sont
ieh e2 e2
− A ⋅∇ + A 2
=
e
(H × r ) ⋅ p + (H × r ) ⋅ (H × r )
µc 2µ c 2 2µ c 8µ c 2
(30)
e e2
= H ⋅L + H 2 r 2 sin 2 θ
2µ c 8µ c 2

où L = r × p , θ est l'angle entre r et H et e est une quantité positive. Puisque nous voulons
travailler seulement au premier ordre en H, nous pouvons poser
e
(31) H ′ = H ⋅L
2µ c

Les fonctions propres de l'énergie de l'atome d'hydrogène non perturbé sont habituellement choisies
comme étant les états propres de L z avec les valeurs propres mh où m est le nombre quantique
magnétique. Cependant, c'est un choix sensible seulement si le champ magnétique est dans la
direction z, puisque alors l'équation (8) devient
e
(32) W1 = m H ′ m = H mh
2µ c
et la dégénérescence des 2 l + 1 états de n et l donnés est éliminée au premier ordre. D'un autre
coté, si le champ magnétique n'est pas dans la direction z, les états indicés m ne sont pas un point
de départ approprié pour le calcul de perturbation dégénéré. Cela fournit un exemple de la
remarque au-dessus de (22) que les états initiaux non perturbés doivent être choisi avec la direction
du champ perturbateur à l'esprit.

Effet Stark au premier ordre dans l'hydrogène


Le changement dans les niveaux d'énergie d'un atome provoqué par un champ électrique uniforme
externe E est appelé effet Stark. Le calcul du changement au premier ordre en E dans le cas de
l'atome d'hydrogène est un peu plus compliqué que pour un champ magnétique. Il est encore
désirable de choisir les états non perturbés initiaux avec la direction du champ perturbateur à
l'esprit. Comme avant, nous prenons l'axe z le long du champ et nous utilisons les états propres de
L z . Cependant, il y a maintenant une complication supplémentaire venant du fait que H ′ , donné
par (33) ci-dessous, est impair par rapport au renversement de l'espace, tel que la valeur moyenne
de H ′ est zéro pour tout état qui a une parité définie.

La perturbation H ′ est maintenant l'énergie supplémentaire du noyau et de l'électron dans le champ


externe et on voit facilement qu'il est donné par
(33) H ′ = e E z = e E r cosθ
où l'axe polaire et E sont dans la direction de z positif et e est à nouveau une quantité positive. Les
fonctions d'onde pour tout potentiel à symétrie sphérique, lorsqu'elles sont exprimées en
harmoniques sphériques, ont une parité paire ou impaire selon que le nombre quantique azimutal l
est pair ou impair. Puisque la perturbation (33) est impaire par rapport à l'inversion spatiale, les
seuls éléments de H ′ qui ne s'annulent pas sont ceux pour des états non perturbés qui ont des
parités opposées. Cela montre qu'un état non dégénéré tel que l'état de base (n = 1) de l'hydrogène
qui a une parité paire, n'a pas d'effet Stark au premier ordre.

Le premier état excité (n = 2) de l'hydrogène est quatre fois dégénéré. Les nombres quantiques l et
m ont les valeurs (0,0), (1,0), (1,1) et (1,-1). Nous allons maintenant montrer assez généralement
que les éléments de matrice non diagonaux non nuls de H ′ existent seulement pour les états qui ont
le même nombre quantique m. z commute avec la composante z du moment angulaire orbital
L z = xp y − yp x , et donc [L z , H ] = 0 . L'élément de matrice de cette équation entre les états j et k
dans une représentation où L z est diagonal est (m j − mk )h j H ′ k = 0 , ainsi j H ′ k = 0 sauf si
m j = mk . Donc les 16 éléments de matrice de H ′ entre les quatre états non perturbés dégénérés
donnés ci-dessus sont zéro sauf pour les éléments non diagonaux entre les deux premiers états (de
parité opposée).

Niveaux d'énergie perturbés


Un prolongement de la discussion qui a conduit à l'équation (22) montre que l'équation séculaire de
l'effet Stark au premier ordre de l'état n = 2 de l'hydrogène est
− W1 0,0 H ′ 1,0 0 0
1,0 H ′ 0,0 − W1 0 0
(33) =0
0 0 − W1 0
0 0 0 − W1

Les éléments de matrice non nuls de H ′ sont


(r )r cosθ u 200 (r )d 3 r

1,0 H ′ 0,0 = 0,0 H ′ 1,0 ∗
= e E ∫ u 210
eE ∞ 1  r  −r / a
(34) =
16a 04 ∫ ∫
0 −1
r 4  2 − e 0 w 2 dwdr
 a0 
= −3e E a 0

Les quatre racines de (33) sont 0, 0, 3e E a 0 et − 3e E a 0 ainsi la moitié de la quadruple


dégénérescence est levée au premier ordre. On voit facilement que les deux premières valeurs de
W1 correspondent à toute combinaison linéaire indépendante de u 211 et u 2;1;−1 et que la troisième et
quatrième valeur correspondent à 2 −1 / 2 (u 200 − u 210 ) et 2 −1 / 2 (u 200 + u 210 ) , respectivement. Cela
signifie qu'un atome d'hydrogène dans son premier état excité se comporte comme s'il avait un
moment dipolaire électrique permanent de grandeur 3ea0 qui peut être orienté de trois manières
différentes : un état parallèle au champ externe, un état antiparallèle au champ externe et deux états
avec une composante zéro le long de ce champ.

Occurrence des moments électriques dipolaires permanents


Il suit de la discussion précédente qu'un atome peut avoir un moment dipolaire électrique
permanent (changement d'énergie proportionnel à E) seulement quand son état non perturbé est non
dégénéré et n'a pas de parité bien définie ou est dégénéré et contient des composantes de parités
opposées. D'autre part, tout atome peut avoir un moment électrique dipolaire induit. Cela signifie
que le moment dipolaire est proportionnel à E ou que l'énergie de l'atome dans le champ électrique
externe est proportionnelle à E 2 . En accord avec (12), une énergie de perturbation du second ordre
de ce type est attendue pour tout système.

La discussion sur les symétries montre que si l'opérateur unitaire d'inversion spatiale U I commute
avec l'hamiltonien pour tout système, les états propres de l'énergie peuvent être choisis avec des
parités bien définies. Avec l'exception des interactions faibles, qui sont entre autre responsable de la
radioactivité bêta, tous les hamiltoniens connus commutent avec U I . Alors on s'attend à ce qu'un
atome ou un noyau dans son état de base possède au plus un moment dipolaire électrique
extrêmement petit. Jusqu'ici, aucun n'a été trouvé expérimentalement.

Il est aussi possible, comme dans le cas de l'atome d'hydrogène, que des états dégénérés non
perturbés de parités opposées puissent faire apparaître un moment électrique dipolaire permanent.
Cependant, cela se produit seulement dans l'hydrogène à cause d'une symétrie dynamique spéciale
et même là il ne se produit pas pour l'état de base. Une telle dégénérescence pourrait aussi se
produire accidentellement mais c'est alors statistiquement très improbable. Dans quelques
molécules, cependant, il y a un groupe d'états de rotation presque dégénérés des deux parités. Si ces
niveaux d'énergie sont très peu espacés par rapport à l'énergie thermique de la molécule ou par
rapport à l'énergie associée au champ électrique appliqué, cela peut conduire à un moment
électrique dipolaire permanent. Dans ce cas, la direction du dipôle est reliée à l'axe de la molécule.
Le dipôle serait, par exemple, le long de la ligne joignant les deux atomes dans une molécule non
symétrique telle que le chlorure d'hydrogène.

Dans les systèmes considérés jusqu'ici, le moment dipolaire électrique est ou le long du champ
électrique appliqué (atome d'hydrogène dans un état excité) ou le long d'un axe moléculaire
(chlorure d'hydrogène). Pour une particule élémentaire ou un noyau, il est raisonnable de supposer
que l'état de base est non dégénéré et que le seul axe est celui défini par l'opérateur de spin S. Alors
le moment dipolaire électrique doit être proportionnel à S. Cela signifie que, pour une telle
particule se déplaçant dans un potentiel électrostatique statique à symétrie sphérique φ (r ) ,
l'hamiltonien contient un terme de la forme µ S ⋅ ∇φ , où µ est une constante numérique. Donc,
même dans cet environnement ni l'inversion spatiale ni le renversement du temps n'est une
opération de symétrie. Un prolongement de cet argument montre que même si une particule ou un
noyau possède une charge électrique, un moment magnétique dipolaire, un moment électrique
quadrupolaire, etc., elle ne peut pas posséder de monopole magnétique, de moment dipolaire
électrique, de moment magnétique quadrupolaire, etc. si l'inversion spatiale ou le renversement du
temps sont l'un ou l'autre des opérations de symétrie. Cela complète la remarque que nous avions
faite précédemment reliant les moments multipolaires autorisés au nombre quantique de moment
angulaire total.
I.3.2.2. La méthode des variations
La méthode des variations peut être utilisée pour la détermination approchée des niveaux d'énergie
les plus bas ou de l'état de base d'un système quand il n'y a pas de problème proche qui admet une
solution exacte afin d'appliquer la méthode des perturbations. Elle peut aussi être appliquée aux
systèmes qui sont décrit par une équation de Schrödinger non séparable pour laquelle des solutions
numériques sont extrêmement ardues et la méthode WKB (voir plus loin) ne peut pas être
appliquée.

Valeur moyenne de l'énergie


On a vu que, si une fonction normalisée arbitraire ψ est développée en fonctions propres de
l'énergie
(1) ψ = ∑ AE u E où Hu E = Eu E
E

et que les u E forment un ensemble orthonormal complet, la valeur moyenne de H pour la fonction
ψ est donnée par
(2) H = ∫ψ ∗ Hψdτ = ∑ E AE
2

E
où l'intégration s'étend sur le domaine complet de toutes les coordonnées du système. On suppose
par facilité que dans (1) et (2) les valeurs propres de l'énergie sont toutes discrètes. Cela peut être
réalisé en enfermant le système dans une boite ou la sommation peut être remplacée par une somme
généralisée.

Une inégalité utile peut être dérivée de (2) en remplaçant chaque valeur propre E dans la
sommation sur le coté droit par la plus petite valeur E 0 :
(3) H ≥ ∑ E 0 AE = E0 ∑ AE
2 2

R E

∑A = 1 pour une fonction d'onde normalisée ψ , (3) conduit à l'inégalité


2
Puisque E
E
(4) E 0 ≤ ∫ψ ∗ Hψdτ

Dans le cas où ψ n'est pas normalisé, (4) peut évidemment être récrit comme
∫ψ Hψdτ

(5) E 0 ≤
∫ ψ dτ
2

La méthode des variations consiste à évaluer l'intégrale sur le coté droit de (4) ou (5) avec une
fonction test ψ qui dépend de plusieurs paramètres et en faisant varier ces paramètres jusqu'à ce
que la valeur moyenne de l'énergie soit minimale. Le résultat est une borne supérieure à l'énergie de
l'état de base du système qui sera assez proche si la forme de la fonction test ressemble à celle de la
fonction propre. Il est donc important d'utiliser toute information disponible ou l'intuition physique
en choisissant la fonction test.

Cette méthode fut d'abord appliqué par Lord Rayleigh en 1873 pour le calcul des fréquences de
vibration des systèmes mécaniques.

Application aux états excités


La méthode des variations peut aussi être utilisée pour obtenir une borne supérieure pour un des
niveaux d'énergie supérieur si la fonction test est orthogonale aux fonctions propres des états
inférieurs. Supposons que les niveaux d'énergie soient arrangés en une série croissante : E 0 , E1 ,
E 2 ,… Alors, si ψ est orthogonal à u E pour i = 0, 1, …, n, on vérifie facilement à partir de (1) que
les coefficients correspondant du développement AE sont tous zéro. Une inégalité peut être dérivée
de (2) en remplaçant chaque valeur propre E dans la somme sur le coté droit par E n +1 avec le
résultat que la valeur moyenne de l'énergie est une borne supérieure de cette valeur propre.

La fonction test ψ − u E0 ∫ u E∗ 0ψdτ est évidemment orthogonale à u E0 , ainsi, si la fonction propre la


plus basse est connue d'une solution exacte à par une approximation suffisament bonne par un
calcul de variation, une borne supérieure pour l'énergie du premier état excité peut être calculée.
Les fonctions tests qui sont orthogonales à un nombre quelconque de fonctions propres connues
sont facilement trouvées de cette manière.

Il est quelque fois possible de diviser les fonctions propres de l'énergie en groupe tel que tout
membre d'un groupe est orthogonal à tout membre d'un autre groupe. Supposons qu'il y a un
opérateur hermitique F qui commute avec H (FH - HF = 0). Alors, F et H peuvent être diagonalisés
simultanément et ont des fonctions propres communes. Deux fonctions propres de F qui
correspondent à des valeurs propres différentes sont orthogonales. Donc, une fonction test qui est
construite entièrement à partir des fonctions propres de F qui correspondent à une valeur propre
donnée sont orthogonales à toutes les autres fonctions propres qui correspondent à des valeurs
propres différentes de F et elles fourniront une borne supérieure pour la valeur propre de l'énergie la
plus basse qui est associée avec cette valeur propre de F. Ces résultats sont utiles quand l'opérateur
F a des fonctions propres facilement reconnaissables par une propriété simple tel que, par exemple,
la symétrie dans le cas où F est le moment angulaire ou la parité. Alors une fonction test avec une
dépendance angulaire correspondant à un moment angulaire donné ou avec une parité donnée peut
facilement être écrite et donner une borne supérieure à l'énergie la plus basse qui a ce moment
angulaire ou cette parité.

Etat de base de l'hélium


Comme premier exemple, nous allons utiliser la méthode des variations avec une simple fonction
test pour obtenir une borne supérieure pour l'énergie de l'état de base de l'atome d'hélium. L'atome
d'hélium consiste en un noyau de charge +2e entouré par deux électrons. Son hamiltonien (en
négligeant le mouvement du noyau) est donné par

(6) H = − (
h2 2
2m
)  1 1  e2
∇1 + ∇ 22 − 2e 2  +  +
 r1 r2  r12
où r1 et r2 sont les vecteurs position des deux électrons par rapport au noyau comme origine et
r12 = r1 − r2 est la distance entre les deux électrons.
Si l'énergie d'interaction e 2 / r12 entre les deux électrons n'était pas présente, la fonction propre de
l'état de base de H serait le produit des deux fonctions d'onde normalisées de l'hydrogène
u100 (r1 )u100 (r2 ) :
Z 3 −(Z / a0 )(r1 + r2 )
(7) ψ (r1 , r2 ) = e
πa 03
avec Z = 2. Nous utiliserons (7) comme fonction test et nous permettrons à Z d'être le paramètre de
variation tel qu'il ne sera pas nécessairement égal à 2.

Les valeurs moyennes des énergies cinétique et potentielle pour l'état de base d'un atome
d'hydrogène sont e 2 / 2a 0 et − e 2 / a 0 , respectivement. La fonction d'onde correspondante de
l'hydrogène est πa 03( ) −1 / 2 −r / a
e 0 . La valeur moyenne pour les opérateurs énergie cinétique dans (6)
pour la fonction (7) est obtenue plus facilement en notant que l'opération avec le laplacien donne un
résultat qui est inversement proportionnel au carré de l'échelle de longueur de la fonction d'onde.
Puisque l'échelle de (7) est plus petite que celle de la fonction d'onde de l'hydrogène d'un facteur Z,
la valeur moyenne de chaque opérateur énergie cinétique est e 2 Z 2 / 2a 0 . De même, les facteurs 1/r
rendent les valeurs moyennes des opérateurs énergie potentielle nucléaire inversement
proportionnelles à l'échelle de longueur. Il y a aussi un facteur 2 supplémentaire venant de la charge
du noyau, tel que chacun est − 2e 2 Z / a 0 .

Energie d'interaction de l'électron


La valeur moyenne de l'énergie d'interaction entre les électrons est
2
e2  Z3  1 −(2 Z / a0 )(r1 + r2 ) 3 3
(8) ∫∫ψ (r1 , r2 ) ψ (r1 , r2 )d 3 r1 d 3 r2 =  3  e 2 ∫∫ e

d r1 d r2
r12 π a
 0 r12

L'intégrale est plus facilement évaluée en la regardant comme l'énergie électrostatique mutuelle de
deux distributions de charge à symétrie sphérique qui se superposent, auquel cas des simplifications
venant de la théorie électrostatique peuvent être introduites.
Une manière plus générale d'effectuer l'intégration, qui peut aussi être utilisée pour des fonctions
d'onde qui ne sont pas à symétrie sphérique, consiste à développer 1 / r12 en harmoniques
sphériques.
l
1 ∞  r2 
= ∑   Pl (cosθ )
1
r1 > r2
r12 r1 l =0  r1 
(9) l

 r1 
  Pl (cosθ )
1 1
=
r12 r2

l = 0  r2 
r1 < r2

où θ est l'angle entre r1 et r2 , cosθ = cosθ 1 cosθ 2 + sin θ 1 sin θ 2 cos(φ1 − φ 2 ) , et θ 1 , φ1 et θ 2 , φ 2


sont les angles sphériques des vecteurs r1 et r2 , respectivement. Les équations (9) suivent
immédiatement de la fonction génératrice des polynômes de Legendre. L'expression pour cosθ est
obtenue simplement à partir du produit scalaire des vecteurs r1 et r2 en coordonnées
rectangulaires. On peut montrer que
(10) Pl (cosθ ) = Pl (cosθ 1 )Pl (cosθ 2 ) + 2∑
l
(l − m )! P m (cosθ )P m (cosθ ) cos m(φ − φ )
m =1 (l + m )!
l 1 l 2 1 2

Quand (9) et (10) sont substitués dans (8) et qu'on utilise l'orthogonalité des harmoniques
sphériques, l'intégration sur les angles sphériques de r1 provoque l'annulation de tous les termes
exceptés ceux pour lesquels l et m sont zéro. L'intégrale sur le coté droit de (8) devient
2 ∞  r1 1 − (2 Z / a0 )(r1 + r2 ) 2 ∞ 1 − (2 Z / a )(r + r ) 
(11) (4π ) ∫  ∫ e r2 dr2 + ∫ e 0 1 2 2
r2 dr2 r12 dr1
0
 0 r1 r1 r
2 
qui peut être évalué comme 5π 2 a 05 / 8Z 5 . Donc, l'énergie d'interaction a la valeur moyenne
5e 2 Z / 8a 0 .

Variation du paramètre Z
Nous avons maintenant le résultat que la valeur moyenne de l'hamiltonien (6) pour la fonction test
(7) est
(12) H =
a0

a0
+
8a 0
=
a0
(
e 2 Z 2 4e 2 Z 5e 2 Z e 2 2 27
Z − 8 Z )

La dérivée par rapport à Z montre que cette valeur est minimale quand Z = 16 27
= 1.69 . Donc la plus
petite borne supérieure pour l'énergie de l'état de base de l'atome d'hélium que l'on peut obtenir
avec cette fonction test est
2 2
(13) − ( 16 ) = −2.85 e
27 2 e
a0 a0

La valeur expérimentale pour l'énergie minimale nécessaire pour enlever les deux électrons de
l'atome d'hélium est 2.904e 2 / a 0 , ainsi notre limite est environ 1.9% plus grande. Le calcul de
variation le plus précis de l'énergie de l'état de base de l'hélium donne un résultat en excellent
accord avec l'expérience et fournit une vérification importante de la théorie de la mécanique
quantique.

Le résultat que les fonctions d'onde de l'hydrogène donnent la meilleure énergie quand Z = 16 27

plutôt que 2 indique que chaque électron fait écran au noyau pour l'autre électron, la charge
nucléaire effective étant réduite de 165 d'une charge électronique.

Si le terme d'interaction e 2 / r12 est vu comme une perturbation, l'énergie au premier ordre est
donnée par H avec Z = 2 et est − 2.75e 2 / a 0 qui est 5.3% au-dessus de la valeur expérimentale.
Il est évident que, en général, le calcul de perturbation au premier ordre est équivalent à un calcul
de variation non optimal.

Interaction de van der Waals


Comme deuxième exemple de l'application de la méthode des variations, nous calculons
l'interaction (longue portée) de van der Waals entre deux atomes d'hydrogène dans leur état de
base. Il est pratique de considérer ce problème d'abord dans le cadre de la théorie des perturbations
car il est alors plus facile de voir que le terme dominant dans l'énergie à grande distance de
séparation varie comme l'inverse de la sixième puissance de la distance. Il s'avère également que la
théorie des perturbations et la méthode des variations fournissent des limites opposées pour le
coefficient de ce terme.

Nous supposons que les noyaux des deux atomes d'hydrogène sont fixés dans l'espace à la distance
R et que l'axe z est choisi parallèle à la ligne joignant A et B. Alors si r1 est le vecteur déplacement
de l'électron 1 du noyau A et r2 le vecteur déplacement de l'électron 2 du noyau B (voir la figure
ci-dessous), l'hamiltonien pour les deux électrons peut être écrit
H = H0 + H ′

(14) H 0 = −
2m
(
h2 2
) e2 e2
∇1 + ∇ 22 − −
r1 r2
e2 e2 e2 e2
H′ = + − −
R r12 r1B r2 A

L'hamiltonien non perturbé H 0 a la solution


(15) u 0 (r1 , r2 ) = u100 (r1 )u100 (r2 )
pour deux atomes d'hydrogène sans interaction dans leur état de base. Nous regardons le terme H ′
comme une perturbation. Cela est équivalent à supposer que R >> a 0 .

Puisque nous sommes intéressés par le terme dominant dans l'énergie d'interaction quand R est
grand, nous développons H ′ en puissances de 1/R et nous gardons les termes les plus bas.
e2   2( z − z ) ( x − x )2 + ( y − y )2 + ( z − z )2  −1 / 2
H′ = 1 + 1 +
2 1
+ 2 1 2
2
1 2 1
 −
R   R R 
−1 / 2 −1 / 2
 2z r2   2z r2  
(16) 1 − 1 + 1 2  − 1 − 2 + 22  
 R R   R R  
e2
≈ (x1 x2 + y1 y 2 − 2 z1 z 2 )
R3

Le dernier terme est l'énergie d'interaction de deux dipôles électriques qui correspondent aux
configurations instantanées des deux atomes. Les termes négligés dans le développement (16) qui
varient comme 1 / R 4 sont l'interaction dipôle - quadripôle, les termes 1 / R 5 sont l'interaction
quadripôle - quadripôle, etc.

Il est immédiatement évident que la valeur moyenne du terme dominant dans H ′ pour l'état
u 0 (r1 , r2 ) est zéro puisque u 0 est une fonction paire de r1 et r2 et H ′ est une fonction impaire de
r1 et r2 séparément. On peut aussi montrer que tous les termes négligés d'ordre plus élevé dans H ′
ont une valeur moyenne zéro pour u 0 car ces termes peuvent être exprimés comme des
harmoniques sphériques d'ordre différent de zéro. Donc le terme dominant dans l'énergie
d'interaction est la perturbation au second ordre du terme dipôle - dipôle qui est proportionnel à
H ′2 et varie donc comme 1 / R 6 .

Calcul perturbatif
A partir de (14), le changement au second ordre dans l'énergie des deux atomes d'hydrogène est
2
0 H′n
(17) W (R ) = S n′
E0 − E n
où l'indice n se réfère à tous les états de la paire d'atomes d'hydrogène non perturbés (incluant les
états dissociés) et l'état de base u 0 est exclut de la sommation généralisée. Il est visible que W (R )
est négatif puisque E 0 < E n et que le numérateur de chaque terme dans (17) est positif. Nous en
concluons donc que l'interaction est attractive et proportionnelle à 1 / R 6 quand R est grand. On
peut montrer que ces deux conclusions sont valides pour toute paire d'atomes qui sont dans des
états de base non dégénérés et à symétrie sphérique.

Nous pouvons obtenir une borne supérieure pour la quantité positive − W (R ) en remplaçant chaque
E n dans (17) par l'énergie E n∗ de l'état excité le plus bas des deux atomes d'hydrogène pour
lesquels 0 H ′ n ∗ est différent de zéro. Alors le dénominateur peut être enlevé de la sommation
qui peut être évaluée comme un produit matriciel :
S′
n 0 H′n
2
(
= Sn 0 H ′ n n H ′ 0 − 0 H ′ 0 )
2

(18)
(
= 0 H ′2 0 − 0 H ′ 0 )
2

Puisque nous avons vu que 0 H ′ 0 = 0 , nous avons que


0 H ′2 0
(19) − W (R ) ≤
E n∗ − E 0

L'état n ∗ est celui dans lequel les deux atomes sont excités vers les états de nombre quantique
( )
principal 2, ainsi E 0 = −2(e 2 / 2a 0 ) , E n∗ = −2 e 2 / 8a 0 et E n∗ − E0 = 3e 2 / 4a 0 . A partir de (16),
nous avons
e4
( )
(20) H ′ 2 = 6 x12 x 22 + y12 y 22 + 4 z12 z 22 + 2 x1 x 2 y1 y 2 − L
R

La valeur moyenne des termes croisés comme x1 x 2 y1 y 2 est zéro puisque ces termes sont des
fonctions impaires d'une des composantes cartésiennes de r1 ou r2 . Les trois premiers termes entre
parenthèses dans (20) conduisent chacun à un produit de deux facteurs identiques qui sont égaux à
∫x u100 (r ) d 3 r = ∫r u100 (r ) d 3 r
2 2 1 2 2
3
(21) 1 ∞ − 2 r / a0
= ∫ r 2e 4πr 2 dr = a02
3πa03 0

et donc 0 H ′ 2 0 = 6e 4 a 04 / R 6 . La substitution dans (19) donne


8e 2 a 05
(22) W (R ) ≥ −
R6

Calcul de variation
Une borne supérieure sur W (R ) peut toujours être obtenue par la méthode des variations. Il est
cependant visible qu'un certain jugement doit être utilisé dans le choix de la fonction test ψ . Donc,
si ψ ne dépend pas de R, la dépendance de la valeur moyenne de l'énergie en R sera comme celle
de H ′ , c'est-à-dire 1 / R 3 . Une borne supérieure avec cette dépendance en R est sans intérêt pour
nous puisque ce que nous désirons déterminer est une limite sur le coefficient de l'interaction en
1 / R 6 . Un choix utile pour ψ sera celui dans lequel il y a un terme proportionnel à H ′ puisqu'il y
aura alors des termes dont la valeur moyenne sera proportionnelle à H ′2 et donc variera comme
1/ R 6 .

Nous choisissons pour la fonction test


(23) ψ (r1 , r2 ) = u100 (r1 )u100 (r2 )(1 + AH ′)
où A est le paramètre de variation. Puisque ψ n'est pas normalisée, nous utilisons (5) plutôt que (4)
et nous obtenons
∫∫ u 0 (1 + AH ′)(H 0 + H ′)u 0 (1 + AH ′)d 3 r1d 3 r2
(24) E 0 + W (R ) ≤
∫∫ u 0 (1 + AH ′) d r1d r2
2 2 3 3

où à nouveau u 0 est le produit des fonctions d'onde de l'état de base de l'hydrogène et A est
supposé être réel. Le coté droit de (24) peut être écrit
E0 + 2 A 0 H ′ 2 0 + A 2 0 H ′H 0 H ′ 0
(25)
1 + A2 0 H ′2 0
puisque u 0 est une fonction propre normalisée de H 0 avec la valeur propre
(26) E 0 = −e 2 / a 0
et 0 H ′ 0 = 0 H ′ 3 0 = 0 . On voit facilement que 0 H ′H 0 H ′ 0 est une somme de carrés de
facteurs de la forme ∫ u100 (r )xH 0 xu100 (r )d 3 r dont on peut montrer par un calcul direct qu'il est égal
à zéro.

Puisque nous sommes intéressés seulement par les termes d'ordre H ′2 , nous développons le
dénominateur de (25) pour obtenir
( )(
(27) E 0 + 2 A 0 H ′ 2 0 1 + A 2 0 H ′ 2 0 )
−1
( )
≈ E 0 + 2 A − E0 A 2 0 H ′ 2 0

Si nous nous souvenons que E 0 est négatif, nous trouvons que (27) a un minimum par rapport à la
variation de A quand A = 1 / E0 , auquel cas (24) devient
0 H ′2 0 6e 2 a 05
(28) E 0 + W (R ) ≤ E 0 + = E0 −
E0 R6

Donc, dans (22) et (28) nous avons des bornes supérieures et inférieures sur l'énergie d'interaction :
8e 2 a 05 6e 2 a 05
(29) − ≤ W ( R ) ≤ −
R6 R6

Un calcul de variation plus précis a montré que le coefficient numérique dans W (R ) est très proche
de 6.5.

Le résultat (29) n'est pas strictement correct puisque H ′ contient seulement l'interaction statique
dipôle - dipôle entre les deux atomes. En réalité, il y a aussi un effet de retard qui vient de la vitesse
finie de propagation de l'interaction électromagnétique entre les deux dipôles. Cela provoque une
chute de W (R ) en − 1 / R 7 quand R est grand comparé à la longueur d'onde électromagnétique
associée avec une fréquence de transition atomique : R >> hca0 / e 2 = 137 a 0 . A de telles distances
l'interaction est trop petite pour être intéressante et (29) fournit donc des limites utiles sur W (R ) .

Moment angulaire de spin et atome d'hélium


L'état de base de l'atome d'hélium a été considéré plus haut du point de vue de la méthode des
variations. Nous allons considérer maintenant l'état de base et les premiers états excités de l'hélium
en utilisant une théorie des perturbations un peu plus simple. Les effets de symétrie du spin des
deux électrons sont pris en compte bien que les forces dépendant du spin sont négligées. Nous
utilisons des produits de fonctions d'onde de l'hydrogène u nlm (avec Z = 2) comme fonctions
propres non perturbées du problème et nous sommes intéressés par la classification des états selon
les propriétés de symétrie et du spin plutôt que d'obtenir des niveaux d'énergie précis.

En notation spectroscopique, l'état de base de l'hélium est l'état 1s 2 : les deux électrons sans l'état
de l'hydrogène u100 . Puisque cet état spatial est symétrique, l'état de spin qui le multiplie doit être le
singulet antisymétrique comme celle que nous avons vue ( 2 −1 / 2 [(+ − ) − (− + )] ) pour lequel le spin
total est zéro.

La partie spatiale du premier état excité de l'hélium est huit fois dégénéré à l'approximation d'ordre
zéro. Les configurations spectroscopiques sont 1s2s et 1s2p. En dehors d'un échange d'électron, le
premier état est non dégénéré et le second est triplement dégénéré (à cause des trois états 2p). La
dégénérescence d'échange double le nombre d'état puisque l'un ou l'autre des électrons peut occuper
l'état 1s et l'autre l'état 2s ou 2p. Afin de simplifier la question, nous considérons ici seulement l'état
1s2s doublement (échange) dégénéré. Il n'est pas difficile de montrer que les états 2s2p peuvent être
traités séparément.

L'énergie de perturbation est la répulsion électrostatique entre les électrons e 2 / r12 et les états non
perturbés sont u100 (r1 )u 200 (r2 ) et u100 (r2 )u 200 (r1 ) . Le spin n'a pas besoin d'être considéré
explicitement à ce stade puisque les forces dépendant du spin sont négligées. Les fonctions de spin
appropriées seront multipliées plus tard pour rendre la fonction d'onde complète antisymétrique. La
matrice de la perturbation pour ces deux états a la structure obtenue dans la section sur le calcul des
perturbations pour le cas dégénéré et peut être écrite
J K
(30)  
K J 

2

J = ∫∫ u100 (r1 )u 200

(r2 ) e u100 (r1 )u 200 (r2 )d 3 r1d 3 r2
r12
(31) 2

K = ∫∫ u100 (r1 )u 200

(r2 ) e u100 (r2 )u 200 (r1 )d 3 r1d 3 r2
r12
J est souvent appelé énergie de Coulomb ou directe et K énergie d'échange.

L'application de la technique de diagonalisation (voir le traitement de l'effet Stark au premier ordre)


montre que les valeurs propres de la perturbation (30) sont J+K et J-K. Ils correspondent aux
fonctions propres normalisées 2 −1 / 2 [u100 (r1 )u 200 (r2 ) + u100 (r2 )u 200 (r1 )] et
2 −1 / 2 [u100 (r1 )u 200 (r2 ) − u100 (r2 )u 200 (r1 )] , respectivement. Puisque la première est une fonction
symétrique de l'espace elle doit être multipliée par la fonction de spin singulet antisymétrique. De
même, la seconde est une fonction de l'espace antisymétrique et doit être multipliée par une des
fonctions de spin symérique formant un triplet. Puisque K s'avère être positif, l'état singulet de spin
a une énergie nettement supérieure à celle de l'état de spin triplet. Cela n'est pas dû à une interaction
dépendant du spin mais à un couplage entre les spins et l'interaction électrostatique qui est
introduite par le principe d'exclusion (utilisation de fonctions d'onde antisymétrique). D'un point de
vue physique, le principe d'exclusion force les électrons à être dans des états spatiaux différents s'ils
ont des spins parallèles. Ils tendent donc à rester éloignés l'un de l'autre et cela réduit la répulsion
électrostatique entre eux et donc abaisse l'énergie.

Fonctions de spin pour trois électrons


Nous pouvons voir trois électrons comme 1 + 2 électrons dans le sens que nous pouvons combiner
un électron (s = 1/2) avec le triplet de fonction à deux électrons (s = 1) et avec la fonction singulet
(s = 0). Dans le premier cas, les résultats sur l'addition des moments angulaires montre que nous
devrions avoir deux groupes de fonctions de spin à trois électrons qui correspondent à s = 1/2 et s =
3/2. Dans le second cas nous devrions avoir un seul groupe qui correspond à s = 1/2. Nous nous
attendons donc à un groupe quartet d'états de spin (s = 3/2) et deux groupes doublets distincts
d'états de spin (s = 1/2) ou un total de 4 + 2 + 2 = 8 états de spin individuels à trois électrons. Ils
doivent être exprimés comme des combinaisons linéaires des 2 3 = 8 produits de fonctions de spin à
deux électrons.

A nouveau, ces combinaisons sont obtenues à partir de la relation (1) de la section sur la
combinaison des moments angulaires, avec les coefficients de Clebsh-Gordan appropriés. Les
fonctions à deux électrons requises sont celles que nous avons vues pour la combinaison de deux
électrons. Nous obtenons ainsi
(32)
(S1 + S 2 + S 3 )2 S1z + S 2 z + S 3 z
(+ + + ) 15
4 h2 3
2 h
3 −1 / 2 [(+ + − ) + (+ − + ) + (− + + )] 15
4 h 2 1
2 h
3 −1 / 2 [(− + − ) + (− − + ) + (+ − − )] 15
4 h2 − 12 h
(− − − ) 15
4 h2 − 32 h
6 −1 / 2 [2(− + + ) − (+ + − ) − (+ − + )] 3
4 h2 1
2 h
6 −1 / 2 [(− + − ) + (− − + ) − 2(+ − − )] 3
4 h 2
− 12 h
2 −1 / 2 [(+ + − ) − (+ − + )] 3
4 h2 1
2 h
2 −1 / 2 [(− + − ) − (− − + )] 3
4 h2 − 12 h

L'orthonormalité et les valeurs propres indiquées peuvent être vérifiées directement. Les quatre
premiers états (quartet) sont symétriques dans l'échange de toute paire de particules. La division des
quatre états doublets en deux paires est telle que la première paire est symétrique dans l'échange des
particules 2 et 3 et la deuxième paire est antisymétrique en 2 et 3. La symétrie par rapport à
l'échange des deux autres paires est caractérisé par les matrices 2x2 que nous avons mentionnées
dans le groupe symétrique. Ces matrices opèrent sur la paire des états de doublet de spin qui ont les
mêmes valeurs m.
I.3.2.3. Traitement alternatif des séries perturbatives
Nous avons vu dans la section précédente comme l'expression pour l'énergie perturbée au second
ordre peut donner une limite utile même quand la somme généralisée ne peut pas être effectuée.
Dans certaines situations, cependant, des expressions complètes pour W2 et ψ 1 , qui autrement
impliquent des sommations infinies, peuvent être obtenues. Nous illustrerons cela d'abord avec le
problème de l'effet Stark au second ordre d'un atome d'hydrogène dans son état de base puis nous
généraliserons la procédure à une classe plus large de situations.

Effet Stark au second ordre dans l'hydrogène


L'état de base d'un atome d'hydrogène est non dégénéré et l'énergie perturbée au premier ordre dans
un champ électrique externe uniforme est zéro. Notre problème est alors de calculer :
2
0 H′0
(1) W2 = S n′
E0 − En

Le ket 0 de l'état de base dans la représentation coordonnées est


( )
(2) r 0 = u100 (r ) = πa 03
−1 / 2
e
− r / a0

et E 0 = −e 2 / 2a 0 . L'équation (1) et la méthode des variations peuvent être utilisés pour obtenir des
bornes respectivement inférieures et supérieures pour W2 .

Au lieu de travailler directement avec l'équation (1), nous allons d'abord trouver ψ 1 en résolvant la
deuxième équation (4) présentée dans la théorie des perturbations avec la condition (6) et en
utilisant ensuite (7). Avec H ′ donné précédemment dans l'effet Stark, W1 = 0 on obtient :
 h 2 2 e2 
(3)  − ∇ − − E0 ψ 1 = −e E r cosθ u100
 2µ r 
Nous allons d'abord montrer que la seule dépendance de ψ 1 avec l'angle se fait à travers un
multiple de cosθ . Une manière de le voir est de développer ψ 1 comme une série de fonctions de r
fois les harmoniques sphériques en θ , φ et de noter que chaque terme est une fonction propre de la
partie angulaire de ∇ 2 . Alors le coté gauche de (3) est une série similaire d'harmoniques sphériques
et le seul terme que nous voulons retenir est celui qui a la même dépendance angulaire que le coté
droite Y10 (θ , φ ) ou cosθ . Une manière alternative de voir la même chose est de noter que ψ 1 est
donné par une somme sur les états non perturbés u n dont a n(1) ne s'annule pas et cela signifie que
u n est proportionnel à cosθ puisque l'état non perturbé est à symétrie sphérique. Donc chaque
terme dans la série ψ 1 est proportionnel à cosθ et donc ψ 1 aussi.

Nous pouvons donc écrire


(4) ψ 1 (r ) = f (r ) cosθ
et l'équation de contrainte (6) de la section sur la théorie des perturbations est automatiquement
satisfaite. La substitution de (4) dans (3) donne
d 2 f 2 df 2 2 1 2E −r / a
(5) + − 2 f + f − 2 f = re 0
dr 2
r dr r a0 r a0 ( )
ea0 πa 0
3 1/ 2

−r / a
On s'attend à ce que la solution de (5) ait la forme d'une série en r multipliée par e 0 . De plus, on
s'attend à ce que la série commence avec la première ou la plus grande puissance de r, puisque
autrement (4) serait singulière à l'origine. Il s'avère que les séries se terminent après deux termes
ainsi la solution de (5) est
( )
(6) f (r ) = − πa 03 (−1 / 2 E

e
) −r / a
a 0 r + 12 r 2 e 0
comme on peut vérifier par substitution. Donc la fonction d'onde qui est correct au premier ordre en
E est
( )
(7) πa 03
−1 / 2 − r / a 
( E
)
e 0 1 − a 0 r + 12 r 2 cosθ 

 e 
La substitution de l'expression pour ψ 1 obtenue en (4) et (6) dans la relation (7) de la section sur la
théorie des perturbations donne pour l'énergie perturbée au second ordre
W2 = e E πa 03 ( ) ∫ r cos θ f (r )e
−1 / 2 2 − r / a0
d 3r

∫ (a r + r )e dr
4E2 ∞ − 2 r / a0
(8) = − 0
4 1
2
5

3a 03 0

9
= − E 2 a 03
4

Polarisabilité de l'hydrogène
On a fait remarquer précédemment que l'effet Stark au second ordre pouvait être interprété comme
un moment dipolaire électrique induit. Ce moment induit est proportionnel au champ électrique
appliqué et dans la même direction et le rapport α du moment dipolaire à l'intensité du champ est
appelé polarisabilité. Il est facile de voir que ces conditions sont valides exactement pour un
oscillateur harmonique isotrope chargé et que le changement d'énergie est dans ce cas − 12 α E 2 .
Pour un système général, dans lequel le changement d'énergie n'est pas exactement proportionnel à
E 2 , il est encore vrai que
(9) W2 = − 12 α E 2

La comparaison de (8) et (9) montre que


(10) α = 92 a 03
pour un atome d'hydrogène dans son état de base.

Méthode de Dalgarno et Lewis


La procédure précédente peut être généralisée de la manière suivante. Nous partons de l'équation
(12) de la section sur la théorie des perturbations qui est applicable à l'état de base de tout système
puisque dans tous les cas connus cet état est non dégénéré :
0 H′n n H′0
(11) W2 = S n′
E0 − E n
Supposons maintenant qu'on puisse trouver un opérateur F tel que
n H′0
(12) = nF0
E0 − E n
pour tous les états n autre que l'état de base. La substitution dans (11) donne alors
(13) W2 = S n′ 0 H ′ n n F 0 = 0 H ′F 0 − 0 H ′ 0 0 F 0
où le terme n = 0 a d'abord été ajouté pour rendre la sommation complète, puis soustrait. Donc, si F
peut être trouvé, l'évaluation de W2 est grandement simplifiée puisque seules des intégrales sur la
fonction d'onde de l'état de base non perturbé ont besoin d'être évaluées.

L'équation (12) peut être écrite comme


(14) n H ′ 0 = (E 0 − E n ) n F 0 = n [F , H 0 ] 0
qui est évidemment valide si F satisfait l'équation opérateurs
(15) [F , H 0 ] = H ′ + C
où C est une constante. Cependant, cette dernière équation est trop générale. Il est suffisant que F
satisfasse l'équation beaucoup plus simple
(16) [F , H 0 ] 0 = H ′ 0 + C 0
d'où il suit que C = − 0 H ′ 0 .

Nous définissons maintenant un nouveau ket 1 qui est le résultat de l'opération sur 0 avec F.
Alors, l'équation (16) peut être écrite
(17) (E0 − H 0 ) 1 = H ′ 0 − 0 H ′ 0 0 où 1 ≡ F 0

On peut évidemment ajouter un multiple arbitraire de 0 à 1 . Nous choisissons ce multiple tel


que 0 1 = 0 . Si maintenant (17), qui est une équation différentielle non homogène, peut être
résolue pour 1 , l'énergie perturbée au second ordre (13) peut être écrite comme
(18) W2 = 0[H ′[1

De même, les séries pour ψ 1 peuvent être écrites sous la forme :


n n H′0
ψ 1 = S n′ = S n′ n n F 0
(19) E0 − E n
= F 0 − 0 0F 0 = 1

La méthode Dalgarno-Lewis remplace donc l'évaluation d'une sommation infinie par la solution de
l'équation différentielle non homogène (17). Cette dernière procédure peut être beaucoup plus
simple même quand on ne peut l'obtenir sous une forme compacte comme (4).

Energie perturbée au troisième ordre


Le ket 1 = F 0 est tout ce que l'on a besoin pour trouver l'énergie perturbée au troisième ordre.
Nous utilisons les équations (7), (13) et (16) de la section sur la théorie des perturbations et le
complexe conjugué de (12) pour écrire
W3 = (u 0 , H ′ψ 2 )
0 H′k  k H′n n H′0 k H′0 0 H′0 
= S k′  S′ − 
E0 − E k  E0 − En E0 − E k 
n

′ +
(20) = S k 0 F k (S ′ k H ′ n
n n F 0 − k F 0 0 H′0 )
= 0 F + H ′F 0 − 0 F + 0 0 H ′F 0 − 0 F + H ′ 0 0 F 0

− 0 F +F 0 0 H′0 + 2 0 F + 0 0 H′0 0 F 0
= 1 H ′1 − 1 1 0 H ′ 0
puisque 0 1 = 0 . Nous obtenons donc une forme compacte pour W3 également.
Interaction d'un atome d'hydrogène et d'une charge ponctuelle
Comme exemple de cette méthode, calculons maintenant le changement dans l'énergie d'un atome
d'hydrogène dans son état de base quand une charge ponctuelle Ze est placée à la distance fixe R.
La perturbation est
Ze 2 Ze 2
H′ = −
(21)
R (
R 2 + r 2 − 2 Rr cosθ
1/ 2
)
l
Ze 2 ∞  r 
=− ∑   Pl (cosθ )
R l =1  R 

A partir de la structure de (17), on s'attend à ce que la représentation coordonnées du ket 1 puisse


s'écrire sous la forme

(22) r 1 = ∑ f l (r )Pl (cosθ )
l =1

La substitution de (22) dans (17) conduit à l'équation différentielle suivante pour f l (r ) :


d 2 f l 2 df l l (l + 1) 2 1 2Z − r / a0
(23) + − fl + fl − 2 fl = − rle
dr 2
r dr r 2
a0 r a0 ( )
a 0 R l +1 πa 03
1/ 2

Comme attendu, elle est en accord avec (17) quand on pose l = 1 et E = − Ze / R 2 .

Une solution de (23) est facilement trouvée en analogie avec (5) et elle contient seulement deux
termes. La substitution dans (22) donne
∞  a 0 r l r l +1  − r / a0
Pl (cosθ )
Z
(24) r 1 = ∑  + e
l =1 R
l +1
( )
πa03
1/ 2 
 l l + 1 
qui, en accord avec (19), est égal à ψ 1 (r ) . De même, l'équation (21) montre que W2 est donné par

(25) W2 = 0 H ′ 1 = − Z 2 e 2 ∑

(l + 2)(2l + 1)! a02l +1
l =1 l 2 2l +1 R 2l + 2
A nouveau, le terme dominant (l = 1) est en accord avec (7) quand E = − Ze / R 2 .

On notera que, bien que (25) donne correctement les deux premiers termes d'une série
asymptotique en 1/R, le troisième terme, qui est proportionnel à 1 / R 8 , est dominé par le terme
dominant de W3 . L'équation (20) montre que W3 = 1 H ′ 1 dans ce cas et le terme dominant pour R
grand est proportionnel à 1 / R 7 .
I.3.2.4. L'approximation WKB
Dans le développement de la mécanique quantique, les règles de quantification de Bohr-
Sommerfeld de la vieille théorie quantique occupent une position intermédiaire entre la mécanique
classique et la mécanique quantique. Il est intéressant de voir qu'il existe une méthode pour le
traitement approché de l'équation de Schrödinger qui montre sa relation avec les règles de
quantification. Elle est basée sur un développement de la fonction d'onde en puissances de h qui,
bien qu'ayant un caractère semi-convergent ou asymptotique, est néanmoins utile pour la solution
approchée de la mécanique quantique dans des cas appropriés. Cette méthode est appelée
approximation WKB ou Wentzel-Kramers-Brillouin, bien que la technique mathématique générale
ait été utilisée plus tôt par Liouville, Rayleigh et Jeffreys. Elle est quelque fois appelée méthode
BWK ou méthode d'intégrale de phase. Elle est applicable aux situations où l'équation de
Schrödinger peut être séparée en une ou plusieurs équations différentielles totales dont chacune
implique une seule variable indépendante.

Limite classique
Une solution ψ (r, t ) de l'équation de Schrödinger
∂ψ h2 2
(1) ih =− ∇ ψ + V (r )ψ
∂t 2µ
peut être écrite sous la forme
iW (r, t )
(2) ψ (r, t ) = A exp
h
auquel cas W satisfait l'équation
∂W
(3) +
1
(∇W )2 + V − ih ∇ 2W = 0
∂t 2µ 2µ

A la limite classique ( h → 0 ), (3) est identique à l'équation différentielle de Hamilton pour la


fonction principale W :
∂W
(4) + H (r, p ) = 0 p = ∇W
∂t
Puisque l'impulsion de la particule est le gradient de W, les trajectoires possibles sont orthogonales
aux surfaces de W constant et donc, à la limite classique, aux surfaces de phase constante de la
fonction d'onde ψ . Donc, dans cette limite, les rayons associés à ψ (trajectoires orthogonales aux
surfaces de phase constante) sont les chemins possibles de la particule classique.

Si ψ est une fonction propre de l'énergie u (r )e − iHt / h , W peut être écrit


(5) W (r, t ) = S (r ) − Et

Dans ce cas, nous avons


iS (r )
u (r ) = A exp
h
(6)
1
(∇S )2 − [E − V (r )] − ih ∇ 2 S = 0
2µ 2µ

La méthode WKB obtient les deux premiers termes (un terme au-delà de l'expression classique)
d'un développement de S en puissances de h , dans le cas à une dimension.

Solutions approchées
L'équation de base que nous considérons est écrite sous une des formes
d 2u
(7) + k 2 ( x )u = 0 k 2 > 0
dx 2
d 2u
(8) 2
− κ 2 ( x )u = 0 κ 2 < 0
dx
tel que k et κ sont toujours réels. Ce sont des équivalents de l'équation de Schrödinger à une
dimension si nous posons
k (x ) = +
1
{2µ [E − V (x )]}1 / 2 V (x ) < E
(9) h
κ ( x ) = + {2µ [V ( x ) − E ]}1 / 2 V (x ) > E
1
h

Les équations (7) et (8) sont aussi à l'équation d'onde radiale si x est remplacé par r, V (r ) est
remplacé par
h 2 l (l + 1)
(10) V (r ) +
2 µr 2
et u est égal à r fois la fonction d'onde radiale.

Nous nous concentrons pour le moment sur (7). Nous serons capables de généraliser l'expression
résultante de u ( x ) pour obtenir les solutions de (8). Nous posons
(11) u ( x ) = Ae iS ( x ) / h
qui donne avec (7) la forme une dimension de (6)
(12) ihS ′′ − S ′ 2 + h 2 k 2 = 0
où les apostrophes dénotent la différentiation par rapport à x.

Nous substituons un développement de S en puissance de h dans (12) et nous égalons les


puissances égales de h
S = S 0 + hS 1 + L

(13) − S 0 + 2 µ (E − V ) = 0
′2
iS 0′′ − 2 S 0′ S1′ = 0
L

L'intégration de ces équations donne


S 0 ( x ) = ±h ∫ k ( x ′)dx ′
x

(14)
S1 ( x ) = 12 i ln k ( x )
où des constantes d'intégration arbitraires, qui peuvent être absorbées dans le coefficient A, ont été
omises. Nous obtenons donc à cet ordre d'approximation
(15) u ( x ) = Ak −1 / 2 exp ± i ∫ kdx 
x
V<E
 

De même, la solution approchée de (8) est


(16) u ( x ) = Bκ −1 / 2 exp ± ∫ κ dx 
x
V >E
 

Nature asymptotique des solutions


La précision de ces solutions WKB peut être estimée en comparant les grandeurs des termes
successifs S 0 et hS1 dans les séries de S. Puisque S 0 est une fonction croissante monotone de x
aussi longtemps que k ne s'annule pas, le rapport hS1 / S 0 doit être petit si hS1′ / S 0′ est petit. Nous
nous attendons donc à ce que (15) soit utile dans la partie du domaine de x où
hS1′ k′
(17) = << 1
S 0′ 2k 2

La longueur d'onde de Broglie locale λ est 2π / k , tel que (17) peut être écrit
λ dk
(18) << k
4π dx
ce qui signifie que le changement fractionnaire de k (ou de la longueur d'onde) sur la distance
λ / 4π est petit par rapport à un. Donc les solutions WKB sont utiles quand l'énergie potentielle
change si lentement que l'impulsion de la particule est sensiblement constante sur plusieurs
longueurs d'onde.

Le même critère est obtenu pour (16) si nous voulons dire maintenant par "longueur d'onde" la
distance sur laquelle la grandeur de u change par un facteur e 2π .

Il est visible que la condition (17) est violée près du mouvement d'inflexion du mouvement
classique où V ( x ) = E , k et κ sont zéro et la "longueur d'onde" est infinie. Donc les solutions (15)
et (16) sont asymptotiquement valides dans le sens qu'elles peuvent être utilisées à plusieurs
longueurs d'onde du point d'inflexion le plus proche si, comme cela est habituellement le cas, la
longueur d'onde y varie lentement.

Les solutions asymptotiques sont surtout utiles si nous savons comment connecter une solution
oscillante comme (15) à une solution exponentielle comme (16) autour du point d'inflexion. C'est
de cette manière, par exemple, que nous appliquons les conditions aux limites pour obtenir les
valeurs propres de l'énergie. La dérivation de telles formules de connexion, que nous verrons plus
loin, est intéressante pour cette raison. Cependant, on notera que plusieurs applications de
l'approximation WKB ne dépendent pas de manière critique de la manière précise avec laquelle la
connexion est faite.

Solution près du point d'inflexion


Les équations (7) et (8) sont régulières au point d'inflexion, ainsi il y a une solution analytique en
ce point et qui a les formes asymptotiques (15) et (16). Une telle solution ne peut habituellement
pas être écrite sous forme compacte. L'équation peut, cependant, être légèrement modifiée pour
qu'une solution exacte avec les formes asymptotiques désirées puisse être obtenue.

Nous pouvons sans perte de généralité, prendre l'origine de x en un point d'inflexion particulier.
Nous supposons pour le moment que V ( x ) < E à droite du point d'inflexion (x positif) et nous
posons ξ (x ) ≡ ∫ kdx . Maintenant si k 2 (x ) = Cx n où C est une constante positive, on sait que
x

l'équation (7) a les solutions


(19) u ( x ) = Aξ 1 / 2 k −1 / 2 J ± m (ξ ) m =
1
n+2
où J est une fonction de Bessel. On peut le vérifier par substitution directe. La forme asymptotique
de J est telle que (voir ci-dessous) (19) est en accord asymptotique avec (15).

Nous essayons donc de retenir cette forme en récrivant (7) avec un terme supplémentaire θ ( x )
même quand k 2 (x ) n'est pas une puissance de x :
(20)
d 2u
dx 2
( )
+ k 2 −θ u = 0

La substitution de (19) dans (20) montre que la nouvelle équation est satisfaite si nous définissons
θ comme
3k ′ 2 k ′′
( )
2
(21) θ ( x ) ≡ − + m 2
− 1 k
4 k 2 2k
4
ξ2

Nous développons k 2 comme une série en x :


( )
(22) k 2 ( x ) = Cx n 1 + ax + bx 2 + L
auquel cas θ peut aussi être développé en série. Les termes en 1 / x 2 et en 1 / x s'annulent et le
terme dominant est indépendant de x.
3(n + 5)a 2
(23) θ ( x ) →
3b

x →0 2(n + 4 )(n + 6 ) n+6

Nous pouvons maintenant voir que (20) est une bonne approximation de l'équation réelle (7). La
similarité dans la structure entre chacun des trois termes dans (21) et le critère de précision
asymptotique (17) indiquent que θ << k 2 dans la région asymptotique si la méthode WKB peut
être utilisée. Au voisinage du point d'inflexion, θ n'est pas négligeable par rapport à k 2 puisque θ
est constant et k 2 s'annule en x = 0. Cependant (23) montre que θ (0) est assez petit, du second
ordre de la déviation de k 2 par rapport à la forme simple Cx n . Donc pour des fonctions
potentielles V ( x ) qui sont lentement variable, on s'attend à ce que (19) soit une bonne
approximation de la solution réelle à l'équation (7).

Point d'inflexion linéaire


Nous allons maintenant nous concentrer sur une situation du plus grand intérêt physique dans
laquelle n = 1. Un point d'inflexion linéaire typique est montré dans la figure ci-dessous.
L'équation (7) est utilisée dans la région x > 0 et l'équation (8) dans la région x < 0. Nous posons
x 0
ξ1 ≡ ∫ kdx , ξ 2 ≡ ∫ κdx et ξ1 et ξ 2 croissent lorsque x s'écarte du point d'inflexion. Cela rend
0 x
facile la généralisation des résultats à des situations où les régions 1 et 2 sont échangées. Les deux
solutions indépendantes dans chacune des deux régions sont
u1± ( x ) = A± ξ11 / 2 k −1 / 2 J ±1 / 2 (ξ1 )
(24) ±
u 2 ( x ) = B± ξ 21 / 2κ −1 / 2 I ±1 / 2 (ξ 2 )

Il est évident que nous devons remplacer J par I, la fonction de Bessel d'argument imaginaire, dans
la région 2.

Nous avons besoin des termes dominant des développements en série et des développements
asymptotiques de ces fonctions :
( 12 ξ1 )± 2
1

J 1 (ξ1 ) →
± x →0 Γ (1 ± 1 )
2 3

 π π
→ ( 12 πξ 1 )
−1 / 2
cos ξ1 m − 
x →∞  6 4
(25)
( 12 ξ 2 )± 2
1

I 1 (ξ 2 ) →
± x →0 Γ (1 ± 1 )
2 3

 ξ − ± πi 
1 1

→ (2πξ 2 )  e 2 + e −ξ 2 ⋅ e  2 2  
−1 / 2

x →∞  
 

−ξ
Il est important de noter que le terme e 2 dans le développement asymptotique de I peut être
ξ
retenu seulement quand une combinaison de solutions I 1 est choisie tel que le coefficient de e 2
±
2
ξ
est zéro car les autres termes du développement asymptotique, tel que e 2 / ξ 2 ont été négligés et
−ξ
qu'ils sont de l'ordre de grandeur de e 2 . La nature asymptotique de l'approximation WKB est telle
que, si le terme qui croît exponentiellement loin du point d'inflexion est présent, il est impossible de
dire si oui ou non l'exponentielle décroissante est aussi présente.

Connexion au point d'inflexion


Le terme dominant en k 2 en x = 0 est Cx , ainsi k ≈ cx1 / 2 , κ ≈ c x , ξ1 ≈ (2c / 3)x 3 / 2 ,
1/ 2

ξ 2 ≈ (2c / 3) x
3/ 2
, où c = +C 1 / 2 . Alors, à partir de (24) et (25), nous obtenons le comportement des
u près de x = 0 :
+ ( 23 )1 / 2 (13 c )1 / 2 − ( 23 )1 / 2 (13 c )−1 / 2
u ≈ A+ x u ≈ A−
Γ( 43 ) Γ( 23 )
1 1

(26)
+ ( 23 )1 / 2 (13 c )1 / 2 − ( 23 )1 / 2 (13 c )−1 / 2
u 2 ≈ B+ x u 2 ≈ B−
Γ( 43 ) Γ( 23 )

Il est visible alors que u1+ rejoint doucement u 2+ si B+ = − A+ et que u1− rejoint doucement u 2− si
B− = A− .

Ces relations entre les coefficients peuvent être utilisées pour obtenir les formes asymptotiques
comme (15) et (16) pour les deux solutions indépendantes u + et u − dans les deux régions (les
constantes multiplicatives arbitraires A± sont omises).
 5π 
u + → ( 12 πk ) cos ξ1 −
−1 / 2

x → +∞
 12 
→ − (2πκ )
x → −∞
−1 / 2
(e ξ2
+e
−ξ 2 − 5πi / 6
)
(27)
 π 
u− → ( 2 πk )
1 −1 / 2
cos ξ1 − 
x → +∞
 12 
→ (2πκ )
x → −∞
−1 / 2
(e ξ2
+e
−ξ 2 −πi / 6
)
Les formes asymptotiques de toute combinaison linéaire de u + et u − peuvent être trouvées à partir
de (27).

Formules de connexion asymptotiques


Les formules de connexion appropriées entre les solutions asymptotiques WKB dans les deux
régions peuvent être obtenues en choisissant des combinaisons linéaires appropriées de u + et u − .
Donc la combinaison u + + u − contient seulement l'exponentielle décroissante et conduit à la
première formule de connexion
→ k −1 / 2 cos(ξ1 − 14 π )
−ξ 2
(28) 12 κ −1 / 2 e

La flèche dans (28) implique que la solution asymptotique dans la région 2 qui apparaît à gauche
tend vers la solution asymptotique dans la région 1 qui apparaît sur la droite mais que l'inverse n'est
pas nécessairement vrai. Cela est dû à une petite erreur dans la phase du cosinus qui introduit
l'accroissement dominant de l'exponentielle dans la région 2.

L'inverse peut être utilisé dans le sens suivant. Si un certain paramètre de la solution (tel que
l'énergie E) est modifié de manière continue tel que la phase du cosinus dans la région 1 passe par
la valeur − 14 π , l'exponentielle croissant dans la région 2 disparaît pour une certaine valeur
indéterminée de la phase proche de − 14 π et laisse seulement l'exponentielle décroissante. Ce
résultat est utile, par exemple, pour traiter la diffusion raisonnante des particules alpha par un
noyau lourd.

Une autre combinaison linéaire de u + et u − peut être trouvée qui donne la deuxième formule de
connexion
(29) sin ηκ −1 / 2 e 2 ← k −1 / 2 cos(ξ1 − 14 π + η )
ξ

où η est notablement différent de zéro ou d'un entier multiple de π . La flèche dans (29) indique
que l'exponentielle décroissante négligée dans la région 2 altère la phase du cosinus dans la région
1 d'une quantité indéterminée si la connexion est renversée.

Niveaux d'énergie d'un puits de potentiel


Nous donnons maintenant un exemple simple d'application de l'approximation WKB qui sert
comme une dérivation d'une des règles de quantification de Bohr-Sommerfeld. Nous voulons
trouver les niveaux d'énergie d'une particule se déplaçant dans le puits de potentiel à une dimension
montré dans la figure ci-dessous.
Pour tout niveau d'énergie supposé E, il y a exactement deux points d'inflexion du mouvement
classique tel que
(30) V ( x1 ) = V ( x 2 ) = E

Les régions x < x1 et x > x 2 sont des régions de type 2 où nous savons que u décroît en s'éloignant
des points d'inflexion afin de satisfaire les conditions aux limites en ± ∞ . Donc nous avons
seulement la solution d'exponentielle décroissante WKB dans ces régions.

La formule de connexion (28) peut être appliquée au point d'inflexion x1 qui sépare une région de
type 2 d'une région de type 1 x1 < x < x 2 . Le seul changement est que la limite inférieure sur
l'intégral de ξ1 passe de 0 à x1 , ainsi la solution à droite du point d'inflexion est

(31) k −1 / 2 cos ∫ kdx − 14 π 


x

 x1 
à une constante multiplicative arbitraire près. La même formule de connexion peut aussi être
appliquée en x 2 en renversant la direction de l'axe des x et en changeant la limite fixée sur les
intégrales ξ de 0 à x 2 . La flèche dans (28) subsiste lorsque nous passons de la solution de la région
2 à la région 1 mais maintenant cette dernière est à gauche du point d'inflexion et la précédente à
x2 x
droite. Nous redéfinissons ξ1 = ∫ kdx , ξ 2 = ∫ κdx de façon à ce qu'ils s'accroissent encore en
x x2

s'éloignant du point d'inflexion, auquel cas (28) peut être utilisé sans modification. La solution à
gauche de ce point d'inflexion est alors k −1 / 2 cos ∫ kdx − 14 π  , qui peut être écrit
x2

 x 
(32) k −1 / 2 cos ∫ kdx − 14 π − η  η ≡ ∫ kdx − 12 π
x x2

 x1  x1

Comme nous avons fait lors de la discussion qualitative des niveaux d'énergie discrets, nous
obtenons les niveaux d'énergie de ce système en exigeant que les solutions (31) et (32) se rejoignent
doucement dans la région intérieure 1. Cela nécessite évidemment que η soit zéro ou un multiple
x2
entier de π , puisque ∫ kdx est nécessairement positif. Nous pouvons écrire l'équation
x1

déterminante pour les valeurs propres comme


kdx = (n + 12 )π
x2
(33) ∫
x1
n = 0,1,2,K

L'équation (33) doit être utilisée pour des valeurs de n jusqu'à ce que E devienne assez grand pour
que un ou les deux points d'inflexion disparaissent.

Une règle de quantification


L'expression (9) pour k peut être substituée dans (33) pour donner une des règles de quantification
de Bohr-Sommerfeld de la vieille théorie quantique :
{2µ [E − V (x )]}1 / 2 dx = (n + 12 )h
x2
(34) 2∫
x1

Le coté gauche de (34) est l'intégrale autour d'un cycle complet du mouvement (de x1 à x 2 et retour
en x1 ) de l'impulsion [2 µ (E − V )] . Le coté droit est la valeur quantique de l'intégrale de phase,
1/ 2

avec un des nombres quantiques demi-entiers plutôt qu'entiers.


Il est facile de voir à partir de la forme de la solution (32) que n est le nombre de nœuds de la
fonction d'onde WKB entre les points d'inflexion. Puisque c'est la base de la méthode WKB de
pouvoir développer des solutions asymptotiques comme (15) à seulement plusieurs longueurs
d'onde des points d'inflexion, l'approximation sera bonne seulement si les points d'inflexion sont
écartés de plusieurs longueurs d'onde ou si n est grand par rapport à un. Cela confirme la vue
précédente que la méthode WKB est une approximation semi-classique puisque l'on s'attend à ce
qu'elle soit le plus utile près de la limite classique des grands nombres quantiques.

En réalité, l'approximation WKB donne aussi d'assez bons résultats pour les états quantiques
inférieurs de plusieurs systèmes. Par exemple, si nous appliquons (34) à l'oscillateur harmonique
V ( x ) = 12 Kx 2 , on sait que la vieille théorie quantique donne les bons niveaux d'énergie pour tous les
nombres quantiques.

Conditions aux limites spéciales


La condition aux limites appliquée à la solution WKB pour un mur parfaitement rigide (V change
de manière discontinue vers + ∞ en x = x0 ) est que la fonction d'onde s'y annule. Donc, si k (pour
une région de type 1) varie lentement en x0 et que les autres points d'inflexion sont loin, la solution
asymptotique peut être utilisée et a la forme
(35) k −1 / 2 sin  ∫ kdx 
x

 0 
x

De même, pour un échelon de potentiel fini qui est loin des autres points d'inflexion, les solutions
WKB asymptotiques peuvent être utilisées jusqu'au point de discontinuité de V si k ou κ est
lentement variable. Alors les grandeurs et pentes des solutions des deux cotés peuvent être ajustées
en ce point.

Comme signalé après (9), la méthode WKB peut être appliquée aux équations radiales pour un
potentiel à symétrie sphérique. Quand l = 0, la fonction d'onde radiale doit être finie en r = 0 et
ainsi u doit s'y annuler. Si k ou κ y est lentement variable, les solutions asymptotiques peuvent être
utilisées. Par exemple, si E − V (r ) est positif, fini et lentement variable au voisinage de r = 0, la
solution est k −1 / 2 sin  ∫ kdr  . Quand l'énergie potentielle effective est infinie en r = 0, ou bien
r

 0 
parce que V est lui-même infini ou bien à cause de la contribution de la force centrifuge pour l ≠ 0 ,
la situation est plus compliquée et nécessite plus d'investigation.

Effet tunnel à travers une barrière


La figure ci-dessous montre une barrière de potentiel typique, tracée comme une fonction de la
coordonnée radiale. Comme indiqué sous l'équation (9), le terme centrifuge est inclut.

Dans la région de type 2, la fonction d'onde est une exponentielle réelle de la forme (16). Donc, si
r2
∫ κ dr est nettement plus grand que l'unité, le comportement de la solution est dominé par le grand
r1
rapport de la fonction d'onde aux deux points d'inflexion. Nous appelons le rapport de probabilité
correspondant, qui est le carré du rapport de la fonction d'onde, le facteur de pénétration de la
barrière :
h 2 l (l + 1)
1/ 2
1  
(36) P = exp − 2 ∫ κ (r )dr  κ (r ) = + 2 µ V (r ) +
r2
− E 
  h  2µ r 2
r1


L'effet tunnel à travers une barrière de potentiel carrée, que nous avons vu, en est un cas particulier.
Il est facile de voir que le facteur exponentiel dominant dans cette solution est exactement le P
donné par (36).

Dans une désintégration radioactive α , V (r ) = + ZZ ′e 2 / r où Z est le nombre atomique du noyau


final et Z ′ = 2 . Nous supposons que cette expression pour le potentiel est applicable seulement
pour r > R . Dans le rayon nucléaire R, les interactions fortes attractives font plus qu'annuler la
répulsion coulombienne, ainsi r1 = R . Pour l = 0, r2 = ZZ ′e 2 / E , ainsi
(2µ )1 / 2 ZZ ′e2 / E  ZZ ′e 2
1/ 2

( )
r
∫r1 κ
h ∫R
2
r dr =  r − E  dr
(37)  
πZZ ′e 2  1  µ vR
=
2
1 − sin −1 1 / 2  − (γ − 1)1 / 2
hv  π γ  h
où E = 12 µ v 2 et γ ≡ ZZ ′e 2 / ER est le rapport de la hauteur de la barrière de Coulomb à l'énergie
cinétique de la particule α émergente. On s'attend à ce que la durée de vie pour la désintégration
α soit de l'ordre d'un certain temps caractéristique τ , divisé par le P obtenu avec (36) et (37).
Dans ce cas, la fonction d'onde est beaucoup plus grande en r1 qu'en r2 et τ est
approximativement la période d'oscillation d'une particule α dans le potentiel nucléaire attractif de
rayon R. Avec τ ~ 10 −21 sec et R inférieur à 10 −12 cm , un bon accord avec la dépendance en Z et E
observée est obtenue sur un domaine de durée de vie de l'ordre d'un facteur 10 24 .
Le facteur de pénétration de la barrière entre aussi dans le taux de réactions nucléaires. Dans ce cas
la fonction d'onde est beaucoup plus grande en r2 qu'en r1 et il est évident que P est en accord avec
le facteur de Gammow quand R = 0.

Un autre exemple que nous pouvons considérer est celui ou aucune particule d'énergie non nulle ne
peut être liée. Quand E = 0,
(2µ ) h 2 l (l + 1) 
1/ 2
r 
1/ 2

∫r1 κ (r )dr = h ∫r1 V (r ) + 2µ r 2 


r
2 2
(38) dr
 

Si l = 0 et que V (r ) a un domaine fini, cette intégrale est finie et P ≠ 0 . De même si V (r ) s'étend à


l'infini et chute plus vite que 1 / r 2 pour r grand, l'intégrale est finie quand r2 = ∞ . D'autre part, si l
> 0, (38) est infini et P = 0. Donc, la résonance à l'énergie zéro conduit à un vrai état lié si l n'est
pas zéro.

Comme signalé plus tôt, les applications de l'approximation WKB faites ici ne dépendent pas de
manière critique de la manière précise avec laquelle les connexions à travers les points d'inflexion
sont faites. Dans la dérivation de la règle de quantification (34), seul le nombre 1/2 du coté droit
vient de l'utilisation des formules de connexion. La discussion sur la pénétration de la barrière n'en
dépend pas du tout.
I.3.2.5. Méthodes pour les problèmes dépendant du temps
Quand l'hamiltonien dépend du temps, il n'y a pas de solution stationnaire à l'équation de
Schrödinger. Donc notre identification d'un état lié avec les niveaux d'énergie discrets et une
fonction propre stationnaire doit être modifiée. Nous considérons dans cette section trois manières
avec lesquelles cette modification peut être faite, chacune correspondant à un type particulier
d'approximation. La théorie des perturbations dépendant du temps, qui est quelque fois appelée la
méthode de variation des constantes suppose que
(1) H = H 0 + H ′ H 0uk = Ek uk
où H 0 est simple et H ′ est petit. Cependant, H ′ dépend maintenant du temps et a l'effet de causer
des transitions entre états propres de H 0 qui seraient stationnaires en l'absence de H ′ . De manière
alternative, plutôt que de décomposer l'hamiltonien selon (1), l'approximation adiabatique suppose
que H contient des paramètres qui changent très lentement au cours du temps. On s'attend donc à ce
que le système soit décrit approximativement au moyen de fonctions propres de l'hamiltonien
instantané. Finalement, nous considérerons l'approximation soudaine où H est constant dans le
temps excepté pendant un court intervalle de temps où il change d'une forme à une autre.

Théorie des perturbations dépendant du temps


Nous devons maintenant travailler avec l'équation de Schrödinger dépendant du temps
∂ψ
(2) ih = Hψ
∂t

Notre procédure consiste à exprimer ψ comme un développement en les fonctions propres


u n e − iEnt / h de l'équation de Schrödinger dépendant du temps non perturbée, où les coefficients du
développement dépendent évidemment du temps :
(3) ψ = S n a n (t )u n e − iEnt / h

La substitution de (3) dans (2) donne


(4) S n iha& n u n e − iEnt / h + S n a n E n u n e − iEnt / h = S n a n (H 0 + H ′)u n e − iEnt / h
où le point indique la dérivée par rapport au temps.

Nous remplaçons H 0 u n par E n u n sur le coté droit, nous multiplions à gauche par u k∗ et nous
intégrons sur tout l'espace en utilisant l'orthonormalité des u :
− iE t / h
(5) iha& k e k = S n a n e − iEnt / h k H ′ n

Nous définissons la fréquence (angulaire) de Bohr


E − En
(6) ω kn ≡ k
h
et nous obtenons
(7) a& k = (ih ) S n k H ′ n a n e kn
−1 iω t

Le groupe des équations (7) pour tout k est exactement équivalent à l'équation de Schrödinger (2).

Point de vue interaction


Deux sortes de changements ont été faits en passant de (2) à (7). Premièrement, nous avons changé
de représentation comme étant spécifiée en fonction des coordonnés à celle spécifiée en fonction
des valeurs propres non perturbées de l'énergie. Deuxièmement, nous sommes passés du point de
vue de Schrödinger à celui d'interaction. Il est intéressant de regarder ces deux changements plus en
détail. Le ket α S (t ) du point de vue de Schrödinger correspond à la fonction d'onde ψ et la
représentation en fonction des valeurs propres de l'hamiltonien non perturbé H 0 ,
(8) k α S (t ) = (u k ,ψ ) = a k (t )e
− iE k t / h

où nous avons utilisé (3). Le ket α I (t ) du point de vue interaction est dans la même
représentation
(9) k α I (t ) = k e α S (t ) = k e n n α S (t )
iH 0 S t / h iH 0 S t / h
où S n est implicite sur le coté droit. L'expression du premier crochet sur le coté droit est
iE t / h
simplement e k k n , puisque H 0 S est diagonal dans cette représentation. Donc, avec l'aide de
(8), nous trouvons que
(10) k α I (t ) = a k (t )

La perturbation qui apparaît dans (1) ou (7) est donnée dans le point de vue de Schrödinger et
devrait donc être désignée par H S′ . On peut le trouver dans le point de vue interaction comme
− iH 0 S t / h
k H I′ n = k e j H S′ l l e
iH 0 S t / h
j n

(11) = e k H S′ n e −iEnt / h
iE k t / h

iω kn t
= k H S′ n e

Donc, l'équation du mouvement pour le ket dans le point de vue interaction exprimée dans la
représentation H 0 est identique à (7). Comme cette équation fut d'abord obtenue par Dirac en
relation avec la théorie des perturbations dépendant du temps, le point de vue interaction est
quelque fois appelé point de vue de Dirac.

Perturbation au premier ordre


Nous revenons maintenant à l'équation (7) et nous remplaçons H ′ par λH ′ et nous exprimons les a
comme des développements en série de λ :
(12) a n = a n(0 ) + λa n(1) + λ2 a n(2 ) + L

Comme avant, nous supposons que cette série est une fonction continue analytique de λ pour λ
entre zéro et un. Nous substituons donc (12) dans (7), nous égalisons les coefficients de puissances
correspondantes de λ et nous posons λ = 1 dans les résultats finaux. La substitution conduit à
l'ensemble d'équations
a& k(0 ) = 0
(13)
a& k(s +1) = (ih ) S n k H ′ n a n(s ) a
−1 iω kn t

Elles peuvent, en principe, être intégrées successivement pour obtenir les solutions approchées à
tout ordre de perturbation désiré.

La première des équations (13) montre que les coefficients d'ordre zéro a k(0 ) sont constants dans le
temps. Leurs valeurs sont les conditions initiales du problème et spécifient l'état du système avant
que la perturbation soit appliquée. Nous supposerons que tous les a k(0 ) sont zéro excepté un, tel que
le système est initialement dans un état non perturbé d'énergie définie. Cela n'est pas en conflit avec
les relations d'incertitude puisque le temps infini de temps avant l'application de la perturbation
rend possible la détermination de l'énergie originale du système avec une précision arbitrairement
grande. Les résultats que nous obtiendrons peuvent facilement être généralisés à des situations où
plus d'un coefficient d'ordre zéro sont différents de zéro.

Nous posons donc a k(0 ) = k m = δ km (ou δ (k − m ) selon que l'état initial m fait partie d'un
ensemble discret ou continu). L'intégration sur l'équation du premier ordre donne
(14) a k(1) (t ) = (ih ) k H ′(t ′) m e
−1 t iω km t ′
∫ dt ′
−∞

où la constante d'intégration est posée égale à zéro afin que a k(1) soit zéro en t = −∞ (avant que la
perturbation soit appliquée). Si H ′ est de durée finie, l'amplitude d'un état u k ( k ≠ m ) après que la
perturbation a disparu est proportionnelle à la composante temporelle de Fourrier de l'élément
matriciel de la perturbation entre cet état et l'état initial qui correspond à la fréquence angulaire ω km
donnée dans (6).

Perturbation harmonique
L'équation (14) prend une forme particulièrement simple si la perturbation H ′ dépend de manière
harmonique du temps excepté son déclenchement à un moment donné et sa coupure plus tard. Nous
appellerons ces temps 0 et t 0 , respectivement, et nous supposons que nous pouvons écrire
(15) k H ′(t ′) m = 2 k H ′ m sin ω t ′
où k H ′ m est indépendant du temps et ω est positif. La substitution dans (14) donne pour
l'amplitude au premier ordre à tout moment t égal ou après t 0
k H ′ m  exp[i (ω km + ω )t 0 ] − 1 exp[i (ω km − ω )t 0 ] − 1 
(16) a k(1) (t ≥ t 0 ) = −  − 
ih  ω km + ω ω km − ω 

La structure de (16) suggère que l'amplitude est appréciable seulement quand le dénominateur d'un
des deux termes est pratiquement zéro. Le premier terme est important quand ω km ≈ −ω ou
E k ≈ E m − hω et le second terme est important quand ω km ≈ ω ou E k ≈ E m + hω . Donc l'effet au
premier ordre d'une perturbation qui varie de manière sinusoïdale avec la fréquence angulaire ω est
de transférer ou du recevoir du système sur lequel elle agit le quantum d'énergie de Planck hω .

Cela est relié à la raison pour l'insertion du facteur 2 sur le coté droit de (5) pour définir l'élément
de matrice indépendant du temps k H ′ m . Une perturbation qui est proportionnelle à sin ω t ou
cos ω t contient à la fois des facteurs e iω t et e −iω t avec des amplitudes égales. Puisque seul le
facteur e −iω t conduit au transfert d'énergie de la perturbation au système non perturbé, l'insertion du
facteur 2 assure que l'élément de matrice physiquement important de la perturbation est k H ′ m et
pas la moitié de cette quantité.

Ce concept sera utilisé pour traiter le processus de rayonnement.

Pour le moment, concentrons-nous sur une situation dans laquelle l'état initial m est un état lié
discret et l'état final k fait partie d'un ensemble continu d'états dissociés. Alors E k > E m et seul le
second terme dans (16) doit être considéré. La probabilité au premier ordre de trouver le système
dans l'état k après que la perturbation a cessé est
(ω km − ω )t 0
2
4 k H′m sin 2 1

(17) a k (t ≥ t 0 ) =
(1) 2 2

h 2 (ω km − ω )
2

Probabilité de transition
Le facteur sin 2 1
2
(ω km − ω )t 0 / (ω km − ω )2 est tracé dans la figure ci-dessous comme une fonction de
ω km − ω .

La hauteur du pic principal s'accroît en proportion de t 02 et sa largeur décroît inversement comme


t 0 , tel que la surface sous la courbe est proportionnelle à t 0 . Donc, s'il y a un groupe d'états k qui
ont des énergies proches de E m + hω et pour lesquels k H ′ m est grossièrement indépendant de
k, la probabilité de trouver le système dans l'un de ces états est proportionnelle à t 0 . C'est une
situation physiquement intéressante puisque ce que nous voulons finalement calculer est une
probabilité de transition par unité de temps, w, et cela implique que la probabilité qu'une transition
ait lieu après que la perturbation a été appliquée pendant la durée t 0 est proportionnelle à t 0 .

Nous supposons que la probabilité de transition totale de tous les états k est suffisament petite par
rapport à l'unité pour que l'état initial m ne soit pas dépeuplé de manière significative. Cela est
équivalent à l'hypothèse originale que la perturbation est petite, ce qui signifie que pour les durées
t 0 physiquement intéressantes il y a peu de changement dans l'état initial. Il peut encore y avoir un
effet de grandeur observable si un grand nombre de systèmes indépendants reçoivent des
traitements identiques.

La dispersion de l'énergie des états finaux vers lesquels les transitions se produisent est relié aux
relations d'indétermination de la manière suivante. Nous pouvons voir la perturbation H ′ comme
un dispositif (ou la modification de l'hamiltonien original suite à l'interaction avec le dispositif) qui
mesure l'énergie finale du système en le transférant dans des états k. Le temps disponible pour la
mesure est t 0 tel que l'incertitude dans l'énergie est de l'ordre de h / t 0 . Cela est en accord avec la
largeur du pic principal sur la figure ci-dessus. Il est intéressant de noter que la conservation de
l'énergie, exprimée par la relation E k ≈ E m + hω et modifiée de manière appropriée par le principe
d'indétermination, est une conséquence automatique du calcul et n'a pas été inséré comme
hypothèse séparée.

La probabilité de transition par unité de temps est donnée en intégrant (17) sur k et en divisant par
t0 :

(18) w = ∫ a k(1) (t ≥ t 0 ) ρ (k )dE k


1 2

t0
où ρ (k )dE k est le nombre d'états finaux avec des énergies entre E k et E k + dE k . Le concept de
densité d'énergie ρ (k ) des états finaux est pertinent puisque nous considérons le cas où la
transition se fait vers l'un ou l'autre des d'états dissociés d'un ensemble continu. Nous profitons du
fait que la largeur du pic principal dans la figure ci-dessus devient petite lorsque t 0 devient grand et
nous regardons k H ′ m et ρ (k ) comme des quantités suffisament indépendantes de E k pour
qu'elles puissent être extraites de l'intégrale dans (18). Nous simplifions de plus l'intégrale en
changeant la variable d'intégration de E k à x ≡ 12 (ω lm − ω )t 0 et en étendant les limites de x à ± ∞ .
La substitution de (17) dans (18) donne

ρ (k ) k H ′ m
2
(19) w =
h

où nous avons utilisé ∫ x −2 sin 2 xdx = π . Comme on s'y attendait, cette expression est
−∞

indépendante de t 0 .

L'équation (19) ainsi que son analogue pour ω = 0 est si utile qu'elle fut appelée "règle d'or n° 2"
par E. Fermi.

Il peut y avoir différents groupes d'états finaux k1 , k 2 , …, tous avec environ la même énergie
E m + hω mais pour lesquels les éléments de matrice de perturbation k i H ′ m et les densités
d'états ρ (k i ) , pratiquement constants dans chaque groupe, diffèrent d'un groupe à l'autre. Alors
l'équation (19) avec k remplacé par k i donne la probabilité de transition par unité de temps vers le
groupe i.

Il est visible que le traitement précédent échoue à donner une probabilité de transition qui est
proportionnelle au temps si l'état final est discret tout comme l'état initial. Dans ce cas, (17) montre
que a k(1) (t ≥ t 0 ) dépend d'une manière particulière de t 0 et de ω km − ω . Nous reviendrons sur cette
2

situation dans l'étude du processus de rayonnement.


Ionisation d'un atome d'hydrogène
Comme exemple de la théorie des perturbations dépendant du temps au premier ordre, calculons la
probabilité d'ionisation d'un atome d'hydrogène initialement dans son état de base quand il est placé
dans un champ électrique variant de manière harmonique. Nous pouvons, par exemple, imaginer
l'atome placé entre les plateaux d'une capacité à laquelle un voltage alternatif est appliqué. Ce n'est,
bien sûr, pas une situation réaliste puisque la fréquence ω / 2π doit excéder µ e 4 / 4πh 3 = 3.6 × 1015
Hertz afin que l'ionisation se produise. Cependant, le champ électrique produit par la capacité peut
être vu comme un modèle du champ associé à une onde électromagnétique située dans la partie
ultraviolette du spectre.

La perturbation est donnée (en suivant (15)) par


(20) E (t ) = 2 E 0 sin ω t

L'état initial de l'atome d'hydrogène est donné (avec Z = 1) par


(21) u m = u100 (r ) = πa 03( ) −1 / 2
e
− r / a0

Les états finaux correspondent au mouvement d'un électron d'énergie positive dans le champ
coulombien du proton (états de diffusion). Cependant, comme nous l'avions suggéré plus tôt, les
fonctions d'onde de ces états sont assez compliquées et il est instructif de considérer seulement la
situation approximative plus simple où l'interaction coulombienne est négligée après que
l'ionisation s'est produite (ce qui est admissible si l'électron s'éloigne notablement du proton).
Alors, les états finaux sont les fonctions propres de l'impulsion d'une particule libre (ondes planes).
Il est pratique d'utiliser une normalisation dans une boîte, ainsi
(22) u k = L−3 / 2 exp(ik ⋅ r )
où hk est l'impulsion de l'électron éjecté.

Densité des états finaux


La densité des états finaux peut être trouvée à partir des valeurs permises de k dans une boîte :
k x = 2πn x / L , etc., où les n sont des entiers positifs ou négatifs ou zéro. Donc, il y a
(L / 2π )3 dk x dk y dk z états dans le domaine dk x dk y dk z du vecteur de propagation. La conservation
de l'énergie donne E k = E m + hω ou h 2 k 2 / 2 µ = − µ e 4 / 2h 2 + hω , ainsi la grandeur de k est fixée.
L'élément de matrice qui apparaît dans (19) dépend, cependant, de la direction de k et ainsi il est
raisonnable de définir des groupes d'états finaux k i dont chacun correspond à un domaine
infinitésimal de directions pour le mouvement de l'électron éjecté. Nous exprimons donc le
domaine du vecteur de propagation, donné ci-dessus en coordonnées rectangulaires, en fonction des
coordonnées sphériques comme k 2 dk sin θ dθ dφ , où θ , φ sont les angles sphériques de k par
rapport à une certaine direction que nous prenons par facilité comme étant celle du champ
électrique. Alors ρ (k )dE k est égal à (L / 2π ) k 2 dk sin θ dθ dφ , où dE k et dk sont reliés en prenant
3

la dérivée de l'équation E k = h 2 k 2 / 2 µ . Nous obtenons donc


µL3
(23) ρ (k ) = k sin θ dθ dφ
8π 3 h 2

Probabilité d'ionisation
L'élément de matrice qui doit être inséré dans (19) est obtenu en utilisant H ′ = e E r cos θ , (15) et
(20) et les fonctions d'onde des états initiaux et finaux (21) et (22). Le résultat est
(
(24) k H ′ m = e E 0 πa 03 L3 ) ∫e
−1 / 2 −ikr cos θ ′
r cos θ ′′e
− r / a0
d 3r
où θ ′ est l'angle entre k et r et θ ′′ est l'angle entre r et le champ électrique. Comme remarqué plus
haut, nous utilisons θ pour indiquer l'angle entre k et le champ électrique. L'intégration sur la
direction du vecteur r peut être effectuée ou bien en utilisant k comme axe polaire (auquel cas θ ′′
doit être exprimé en fonction de θ ′ et θ ) ou en utilisant la direction du champ électrique comme
axe polaire (auquel cas θ ′ doit être exprimé en fonction de θ ′′ et θ ). Il est plus simple d'adopter la
première procédure et de poser
(25) cosθ ′′ = cosθ ′ cosθ + sin θ ′ sin θ cos(φ ′ − χ )

Ici θ ′ , φ ′ sont les angles sphériques de r par rapport à k comme axe polaire et θ , χ sont les
angles sphériques de la direction du champ électrique par rapport à k, comme indiqué dans la figure
ci-dessous.
Nous pouvons maintenant remplacer d 3 r par r 2 d (cos θ ′)dφ ′ dans (24). L'intégration sur φ ′
provoque l'annulation du second terme dans l'expression (25) pour cosθ ′′ . Le reste de l'évaluation
de l'élément de matrice est immédiate et conduit à
32πie E 0 ka05 cos θ
(26) k H ′ m = −
(πa L ) (1 + k a )
3
0
3 1/ 2 2 2 3
0

La substitution de cet élément de matrice ainsi que l'expression (23) de ρ (k ) dans (19) donne la
probabilité par unité de temps que l'électron de l'atome d'hydrogène soit éjecté dans l'angle solide
sin θ dθ dφ
256 µ k 3 e 2 E 02 a 07
(27) w = cos 2 θ sin θ dθ dφ
(
πh 1 + k a 0
3 2 2
)
La probabilité d'ionisation différentielle par unité d'angle solide w / (sin θ dθ dφ ) est proportionnelle
à cos 2 θ . Ce n'est pas surprenant puisque l'on s'attend à ce que l'amplitude de probabilité soit
proportionnelle à la composante de la force appliquée dans la direction d'éjection, qui est
e E 0 cosθ . La dépendance de w avec ω est plus fiable quand ω est grand car dans ce cas k est
également grand et on s'attend à ce que la modification de l'état final d'onde plane par le champ
coulombien du proton soit moins importante. On peut le voir sur la formule (14) de la section sur la
diffusion coulombienne qui montre que pour k grand ou n petit, u c (0 ) approche de 1 / v qui est la
2

densité de probabilité en r = 0 pour une onde plane normalisée au flux unité.

Perturbation au second ordre


Il est immédiat de substituer une expression comme (16) dans le coté droit de la deuxième
équation (13) et d'intégrer le résultat pour a& k(2 ) . Sans aller plus loin dans les détails de ce calcul, il
n'est pas difficile de voir que l'amplitude au second ordre contient des termes qui sont appréciables
quand ω km est proche de 2ω , − 2ω et 0. Des termes de ce type sont physiquement plausibles
puisqu'ils correspondent respectivement à l'absorption de deux quanta de Planck hω par le
système, l'émission de deux quanta et l'absorption et l'émission d'un quantum. De tels processus à
deux quanta sont attendus dans un calcul au second ordre dans lequel la perturbation agit deux fois,
en analogie avec le processus à un quantum obtenu comme résultat du calcul au premier ordre.
Cependant, malheureusement l'amplitude au second ordre contient aussi des termes qui sont
appréciables pour d'autres valeurs de ω km . Une analyse attentive montre que ces termes non
physiques viennent de l'hypothèse initiale que la perturbation (15) est enclenchée soudainement en t
= 0. La discontinuité résultante dans la dérivée de la perturbation par rapport au temps introduit des
composantes de Fourier qui sont responsables des pics secondaires dans la figure ci-dessus de la
probabilité de transition. En réalité, la perturbation sera habituellement enclenchée graduellement
durant un intervalle de temps beaucoup plus long que 1 / ω et ainsi la largeur de la transformée de
Fourier de la perturbation, qui a un maximum en ω , sera petite comparée à ω . De même, cet
intervalle de temps sera beaucoup plus court que le temps total t 0 où la perturbation est présente,
afin que t 0 puisse être spécifié avec une précision raisonnable. L'enclenchement soudain de la
perturbation ne cause pas de difficultés sérieuses au premier puisque nous pouvons ignorer les pics
secondaires même si leur hauteur chute seulement comme 1 / (ω lm − ω ) . Au second ordre,
2

cependant, les effets sont plus marqués et ne peuvent pas être ignorés. Il est alors nécessaire
d'enclencher la perturbation doucement et cela complique le calcul.

Nous ne poursuivrons pas cela plus loin ici mais le problème resurgira bientôt avec la théorie des
collisions. Le cas où un changement soudain dans l'hamiltonien du système est une partie
essentielle de la situation physique, plutôt qu'un simple artifice mathématique comme dans la
dérivation de (16), sera discuté plus loin.

Approximation adiabatique
On a fait remarquer au début de cette section que des méthodes peuvent être développées pour
traiter les systèmes dans lesquels la dépendance en le temps de l'hamiltonien est petite, variant
lentement ou rapidement. Cela correspond respectivement à l'approximation adiabatique et
soudaine. Dans le cas adiabatique, on s'attend sur des bases physiques à ce que les solutions de
l'équation de Schrödinger puissent être approchées au moyen de fonctions propres stationnaires de
l'hamiltonien instantané, tel qu'une fonction propre particulière à un moment évolue de manière
continue vers la fonction propre correspondante un instant plus tard. En d'autres mots, si l'équation
(28) H (t )u n (t ) = E n (t )u n (t )
peut être résolue à chaque instant, on s'attend à ce qu'un système qui est dans un état discret non
dégénéré u m (0 ) avec l'énergie E m (0 ) en t = 0 sera pratiquement dans l'état u m (t ) avec l'énergie
Em (t ) au temps t, pourvu que H (t ) change très lentement dans le temps. Notre objectif est
d'estimer l'étendue sur laquelle cette hypothèse n'est plus satisfaite, tel que d'autres termes
apparaissent dans le développement de ψ en fonction des u.

La fonction d'onde ψ satisfait l'équation de Schrödinger dépendant du temps


∂ψ
(29) ih = H (t )ψ
∂t

Nous continuons en développant ψ en fonction des u de la manière suivant :


(30) ψ = ∑ a n (t )u n (t ) exp (ih ) ∫ E n (t ′)dt ′
−1 t

n
 0 
où nous supposons que les u n sont orthonormaux, discrets et non dégénérés. La substitution dans
(29) donne
 ∂u 
(31) ∑ a& n u n + a n n  exp (ih ) ∫ E n (t ′)dt ′ = 0
−1 t

n  ∂t   0 
où nous avons utilisé (28). Nous multiplions à gauche par u k∗ et nous intégrons sur tout l'espace
pour obtenir
a& k = −∑ a n k n& exp (ih ) ∫ (E n − El )dt ′
−1 t

n
 0 
(32)
∂u
k n& ≡ ∫ u k∗ n d 3 r
∂t

Une expression pour k n& peut être trouvée en dérivant (28) par rapport au temps :
∂H ∂u ∂E ∂u
(33) u n + H n = n u n + En n
∂t ∂t ∂t ∂t
Nous multiplions à gauche par u k∗ , où k ≠ n , nous intégrons sur tout l'espace et nous utilisons (28)
pour obtenir
∂H
(34) k n = (E n − E k ) k n& k≠n
∂t

Choix des phases


Nous avons besoin aussi d'une expression pour n n& . En dérivant l'équation n n = 1 par rapport
au temps, on a
(35) n& n + n n& = 0

Puisque ces deux termes sont complexes conjugués l'un de l'autre, chacun est purement imaginaire
et nous pouvons écrire n n& = iα (t ) où α (t ) est réel. Nous allons maintenant changer la phase de
u n d'une quantité γ (t ) , ce qui est autorisé puisque les phases des fonctions propres sont arbitraires
à chaque instant. Pour la nouvelle fonction propre u n′ ≡ u n e iγ (t ) ,
(36) n ′ n& ′ = n n& + iγ& = i (α + γ& )

Donc, le choix γ (t ) = − ∫ α (t ′)dt ′ pour les phases donne n ′ n& ′ = 0 . Dans ce qui suit, nous
t

0
supposerons que toutes les phases ont été choisies de cette manière et nous omettrons les
apostrophes.

La substitution de (34) dans (32) donne alors


' a ∂H
(37) a& k = ∑ n exp i ∫ ω kn (t ′)dt ′
t
n
k
n hω kn ∂t  0 
où l'apostrophe sur la sommation indique que le terme n = k est omit. Le groupe d'équations (37)
pour tout k est exactement équivalent à l'équation de Schrödinger (29).
Nous pouvons maintenant estimer a& k en supposant que toutes les quantités ( a n , ω kn , u n , ∂H / ∂t ),
qui apparaissent à droite de (26) et donc on s'attend à ce qu'elles varient lentement, sont en réalité
constantes dans le temps. Si, de plus, nous supposons que le système est dans l'état m en t = 0, nous
pouvons poser a n = δ nm . Nous obtenons donc
∂H
(38) a& k ≈ (hω km ) k
−1 iω t
n e km k ≠ m
∂t
que l'on intègre facilement pour obtenir

( )
(39) a k (t ) ≈ ihω km
2 −1
k
∂H
∂t
( iω t
)
n e km − 1 k ≠ m

Avec les approximations précédentes, (39) montre que l'amplitude de probabilité pour un état autre
que l'état initial oscille dans le temps et ne montre pas d'accroissement stationnaire le long de cette
période de temps même si H change d'une quantité finie. La grandeur de cette amplitude après un
long moment est de l'ordre du rapport du changement de H durant la période de Bohr 2π / ω km à la
différence d'énergie E k − E m entre les états.

Relation avec la théorie des perturbations


Une situation exceptionnelle se produit quand l'hamiltonien oscille dans le temps avec une
fréquence presque égale à une des fréquences de transition, disons ω km . C'est un cas de résonance
et on s'attend à partir de la discussion de la théorie des perturbations dépendant du temps que même
un très petit changement dans H puisse produire une amplitude appréciable a k sur une longue
période de temps, tel que (39) n'est plus valide. La raison de cet échec est qu'il n'est plus admissible
de supposer que la dépendance en le temps de ∂H / ∂t puisse être négligée et ainsi le passage de
(37) à (39) n'est plus justifié.

Afin de considérer ce cas d'une manière qui permet la comparaison avec les résultats de la théorie
des perturbations, supposons que seule une petite partie de H oscille dans le temps avec une
fréquence angulaire ω qui est proche de ω km :
∂H
(40) H = H 0 + 2 H ′ sin ω t = 2ω H ′ cos ω t
∂t
où H ′ est petit comparé à H 0 et les deux sont constants dans le temps. Si la dépendance de a n ,
ω kn et un avec le temps est négligée, nous posons a n = δ nm comme avant, l'équation (37) devient
(41) a& k ≈
ω
hω km
i (ω +ω )t
k H ′ m e km (
i (ω −ω )t
+ e km )
que l'on intègre facilement pour avoir
ω k H ′ m  e i (ω km +ω )t − 1 e i (ω km −ω )t − 1 
(42) a k (t ) ≈  + 
ihω km  ω km + ω ω km − ω 

L'équation (42) montre d'abord que l'approximation adiabatique échoue pour ω km ≈ ±ω car alors
(42) croît constamment avec le temps. Elle montre aussi que le résultat perturbatif (16) est
reproduit. Si ω km est proche de + ω , le premier terme entre parenthèses peut être négligé et nous
pouvons remplacer ω / ω km en dehors des parenthèses par +1. Si ω km est proche de − ω , le second
terme dans les parenthèses peut être négligé et nous pouvons remplacer ω / ω km par -1.

Changement discontinu dans H


Comme introduction à l'approximation soudaine, considérons d'abord une situation dans laquelle
l'hamiltonien change de manière discontinue d'une forme constante dans le temps à une autre.
Supposons que H = H 0 pour t < 0 et H = H 1 pour t > 0 où
(43) H 0 u n = E n u n H 1v µ = E µ v µ
et les u et les v sont des ensembles orthonormaux complets de fonctions qui ne sont pas
nécessairement discrètes. Les solutions générales peuvent être écrites
ψ = S n a n u n e −iEnt / h t<0
(44) − iE µ t / h
ψ = S µ bµ v µ e t>0
où les a et les b sont indépendants du temps.
Puisque l'équation de Schrödinger (29) est du premier ordre en le temps, la fonction d'onde en
chaque point de l'espace doit être une fonction continue du temps en t = 0, bien que sa dérivée par
rapport au temps ne le soit pas. Les b sont alors facilement exprimés en fonction des a en égalant
les deux solutions (44) en t = 0, en multipliant par un v ∗ particulier et en intégrant sur les
coordonnées :
(45) bµ = S n a n µ n

Si le système est initialement dans l'état m, tel que a n = n m , l'équation (45) nous dit que
bµ = µ m et les états finaux ne semblent pas avoir la même énergie que l'état initial. C'est une
conséquence des composantes de Fourier de fréquence non nulle avec lesquelles le changement
soudain de l'hamiltonien peut être obtenu.

Approximation soudaine
L'approximation soudaine consiste à utiliser (45) quand le changement de l'hamiltonien se produit
en très peu de temps mais sur un intervalle de temps fini t 0 . Afin de faire une estimation de l'erreur
introduite de cette manière, considérons un problème qui, bien que quelque peu artificiel, peut
facilement être résolu formellement. Supposons que H = H 0 pour t < 0, H = H 1 pour t > t 0 et
H = H i pour 0 < t < t 0 . L'hamiltonien intermédiaire supposé constant dans le temps a un ensemble
complet de fonctions propres de l'énergie :
(46) H i wk = E k wk

La vraie solution peut être développée en fonction des w avec des coefficients constants :
(47) ψ = Sκ cκ wκ e − iEκ t / h 0 < t < t0

La condition de continuité en t = 0 donne cκ = S n a n κ n et la condition de continuité en t = t 0


donne alors
( )
− i Eκ − E µ t 0 / h
bµ = Sκ cκ µ κ e
(48) ( )
− i Eκ − E µ t 0 / h
= S n a n Sκ µ κ e κ n

Quand t 0 = 0 , l'exponentielle est égale à l'unité et bµ est donnée par (45), comme il se doit.

L'approximation soudaine est évidemment meilleure quand t 0 est petit. L'exponentielle dans (48)
peut être développée pour donner

(49) bµ ≈ S n a n Sκ µ κ 1 − 0 (Eκ − E µ ) κ n
 it 
 h 
qui peut être récrit comme
 it 
(50) bµ ≈ S n a n µ 1 − 0 (H i − H 1 ) n
 h 

Donc, l'erreur dans l'approximation soudaine est proportionnelle à t 0 pour t 0 petit et peut être
estimée dans les cas simples avec (50). Cette équation peut être généralisée à une situation où H i
dépend du temps. Dans ce cas, un résultat qui est aussi correct au premier ordre en t 0 est obtenu en
t0
remplaçant H i t 0 par ∫
0
H i dt .

Un cas particulier intéressant de (50) est celui dans lequel les hamiltoniens initiaux et finaux sont
les mêmes ( H 1 = H 0 ) et le système est dans un état m particulier. Nous obtenons alors
it 0
(51) bk = δ km − k Hi − H0 m
h

Cela peut être utilisé même quand H i − H 0 n'est pas petit comparé à H 0 , pourvu que t 0 soit
suffisament petit. D'autre part, la théorie des perturbations est utile quand H i − H 0 << H 0 et t 0
grand.
Perturbation d'un oscillateur
Comme exemple simple d'application des approximations adiabatiques et soudaines, considérons
un oscillateur linéaire harmonique dans lequel la position du point d'équilibre a(t ) dépend du
temps. L'hamiltonien pour ce système est
h2 ∂2 1
(52) H (t ) = − + 2 K [x − a (t )]
2

2m ∂x 2

Les fonctions propres instantanées de l'énergie sont les fonctions d'onde de l'oscillateur harmonique
centrées au point a(t ) et les niveaux d'énergie sont inchangés :
1
− α 2 ( x − a )2
(53) u n ( x ) = N n H n [α ( x − a )]e 2
E n = (n + 12 )hω c

Nous supposons d'abord que le point d'équilibre se déplace lentement et nous analysons les
circonstances sous lesquelles l'approximation adiabatique est applicable. Si l'oscillateur est
initialement dans son état de base (n = 0), la dérivée par rapport au temps de l'hamiltonien
∂H / ∂t = − K ( x − a )a& a des éléments de matrice non nuls seulement avec le premier état excité. En
utilisant les résultats vus dans l'étude de l'oscillateur harmonique, on trouve
1/ 2
∂H Ka& h
= − Ka&   (Km )
−1 / 4
(54) 1 0 =−
∂t α 2  2

La substitution dans (39) montre que le coefficient du facteur dépendant du temps dans l'amplitude
du premier état excité a la grandeur
Ka& (h / 2)
1/ 2
a&
(55) =
hω c (Km ) 1/ 4
(2hω c / m )1 / 2
L'équation (55) peut être interprétée en notant que le dénominateur est de l'ordre de la vitesse
maximale d'un oscillateur classique hypothétique qui a l'énergie de point zéro. Donc
l'approximation adiabatique est bonne si le point d'équilibre se déplace lentement par rapport à la
vitesse de l'oscillateur classique. Il n'est pas difficile de voir que pour le nième état excité, la
condition correspondante est que la vitesse du point d'équilibre soit petite par rapport à 1 / n fois la
vitesse de l'oscillateur classique correspondant.

L'application de l'approximation soudaine à un oscillateur dans son état de base donne l'amplitude
pour le nième état après le déplacement du point d'équilibre de x = 0 à x = a
α 1/ 2 α 1/ 2
1 1
∞ − α 2x2 ∞ − α 2 ( x + a )2
(56) ∫ u n∗ ( x − a )e 2
dx = ∫ u n∗ (x )e 2
dx
π 1/ 4 −∞ π 1/ 4 −∞

Cette intégrale est identique à l'expression des An pour l'oscillation d'un paquet d'ondes excepté
pour le signe de a et a déjà été évaluée avec l'aide des fonctions génératrices des polynômes de
Hermite. La discussion avait montré que les états qui ont le plus de chance d'être excité sont ceux
qui ont une amplitude classique d'oscillation qui est de l'ordre du déplacement a. C'est en accord
avec le résultat classique correspondant. L'équation (50) peut alors être utilisée pour montrer que
l'approximation soudaine est valide dans le cas où le temps requis pour déplacer le point d'équilibre
est petit par rapport à 1 / n0 fois la période de l'oscillateur classique, où n0 est le nombre quantique
de l'état excité le plus probable.
Exercices
1. Un oscillateur harmonique de charge e est perturbé par un champ électrique de force E dans la
direction des x positifs. Calculez le changement de chaque niveau d'énergie au second ordre de
la perturbation et calculez le moment dipolaire électrique induit. Montrez que ce problème peut
être résolu exactement et comparez le résultat avec l'approximation de perturbation. Répétez le
calcul pour l'oscillateur isotrope à trois dimensions. Montrez que, si la polarisabilité α de
l'oscillateur est définie comme le rapport du moment électrique dipolaire induit à E, le
changement dans l'énergie est exactement − 12 α E 2 .
2. Un oscillateur harmonique à une dimension est perturbé par une énergie potentielle
supplémentaire bx 3 . Calculez le changement de chaque niveau d'énergie au second ordre de la
perturbation.
3. Trouvez l'effet Stark au premier ordre pour un atome d'hydrogène dans l'état n = 3. Décrivez
brièvement l'arrangement des niveaux et états associés à chaques nombres quantiques.
4. Un système qui a trois états non perturbés peut être représenté par la matrice hamiltonienne
perturbée
 E1 0 a 
(1)  0 E1 b 
a ∗ b ∗ E 2 
où E 2 > E1 . Les quantités a et b sont vues comme des perturbations du même ordre et petites
comparées à E 2 − E1 . Utilisez la théorie des perturbations non dégénérée au second ordre pour
calculer les valeurs propres (cette procédure est-elle correcte ?) Diagonalisez alors la matrice
pour trouver les valeurs propres exactes. Comparez les trois résultats obtenus.
5. Une fonction test ψ diffère d'une fonction propre u E par une petite quantité, tel que
ψ = u E + εψ 1 où u E et ψ 1 sont normalisés et ε << 1 . Montrez que H diffère de E seulement
par un terme de l'ordre de ε 2 et trouvez ce terme.
6. Si les n - 1 premières fonctions propres d'un hamiltonien particulier sont connues, écrivez une
expression formelle pour une fonction test pour la méthode des variations qui pourrait être
utilisée pour avoir une limite supérieure au nième niveau d'énergie.
7. Trouvez les prochains termes (d'ordre R −4 ) dans le développement (16) de la section I.3.2.2.
Montrez que leurs éléments de matrice diagonaux pour les états de base non perturbés
s'annulent et donc qu'il n'y a pas de contribution inverse au quatrième ordre pour l'interaction de
van der Waals.
8. Utilisez le premier terme non nul dans les séries (17) de la section I.3.3.2 pour avoir une limite
inférieure pour − W (R ) . Comparez avec le résultat obtenu à partir du calcul des variations.
9. Utilisez la combinaison des méthodes des perturbations et des variations de la section I.3.2.2 en
relation avec l'interaction de van der Waals pour obtenir des limites sur la polarisabilité
électrique d'un atome d'hydrogène dans son état de base.
10. Une particule de masse m est liée par le potentiel V (r ) = −V0 e − r / a où h 2 / mV0 a 2 = 34 . Utilisez
la méthode des variations avec la fonction test e −α r pour avoir une bonne limite sur la valeur
propre de l'énergie la plus basse.
11. Un atome d'hydrogène est placé dans un champ électrique uniforme d'intensité E. Utilisez
l'équation (7) de la section I.3.2.3 pour calculer le champ électrique total au noyau. Donnez une
discussion qualitative de votre réponse en termes physiques.
12. Utilisez l'équation (7) de la section I.3.2.3 pour calculer le moment dipolaire électrique induit
dans un atome d'hydrogène par un champ électrique uniforme et trouvez la polarisabilité.
Montrez que les changements de la polarisabilité, de l'intensité du champ électrique et de
l'énergie sont reliés par l'équation (9) de la section I.3.2.3.
13. Un atome d'hydrogène est placé dans un potentiel électrostatique qui a une symétrie
quadrupolaire. Utilisez l'équation (24) de la section I.3.2.3 pour calculer le rapport des
intensités du potentiel quadrupolaire total dans le voisinage infinitésimal du noyau et du
potentiel quadrupolaire externe appliqué.
14. Dénotez ψ s dans l'équation (2) de la section I.3.2.1 par s . Montrez à partir des équations (4)
et (6) que
s r
(2) s H ′ r = ∑∑ Wq + p +1 s − q r − p
q =0 p =0

Utilisez cette formule pour dériver l'équation (20) de la section I.3.2.3.


15. Calculez le terme dominant dans l'énergie perturbée au troisième ordre d'un atome d'hydrogène
et une charge ponctuelle Ze à une distance fixée R pour R grand.
16. Montrez que l'approximation WKB donne les valeurs propres correctes de l'énergie pour tous
les états de l'oscillateur harmonique.
17. Appliquez la méthode WKB au mouvement à une dimension d'une particule de masse m dans
un potentiel qui est égal à − V0 en x = 0, qui change linéairement avec x jusqu'à ce qu'il
s'annule en x = ± a et qui vaut zéro pour x > a . Trouvez tous les niveaux d'énergie liés
obtenus à cette approximation si mV0=40 a 2 / h 2 .
18. Utilisez l'approximation WKB pour montrer qu'un potentiel attractif à trois dimensions qui
diminue comme r − n pour r grand a un nombre d'états liés infini si n ≤ 2 .
19. Un atome d'hydrogène dans son état de base est placé entre les plateaux d'une capacité. Une
impulsion de voltage est appliquée à la capacité afin qu'elle produise un champ électrique
uniforme qui a la dépendance avec le temps E = 0 pour t < 0, E = E 0 e −t / r pour t > 0. Trouvez
la probabilité au premier ordre pour que l'atome soit dans l'état 2s (200) après un long moment.
Quelle est la probabilité correspondante pour qu'il soit dans chacun des états 2p ?
20. Utilisez l'équation (27) de la section I.3.2.5 pour calculer la section efficace totale pour la
photo-ionisation d'un atome d'hydrogène par un photon d'énergie hω . Montrez que la longueur
d'onde du photon est grande par rapport à la taille de l'atome si l'énergie du photon est juste au-
dessus du seuil et qu'ainsi l'hypothèse du champ électrique uniforme faite en dérivant (27) est
appropriée pour le problème de la photo-ionisation. Montrez aussi que l'effet du champ
magnétique de l'onde lumineuse peut être négligé par rapport à celui du champ électrique.
21. Expliquez pourquoi l'équation (50) de la section I.3.2.5 ne contient pas H 0 et H 1 de manière
H i (t )dt si H i dépend de t mais
t0
symétrique. Montrez aussi que H i t 0 peut être remplacé par ∫0
seulement au premier ordre.
22. Montrez que la remarque sous l'équation (55) de la section I.3.2.5 sur l'excitation du nième état
dans l'approximation adiabatique est correcte.
23. Montrez que la remarque sous l'équation (56) de la section I.3.2.5 sur la validité de
l'approximation soudaine est correcte.
24. Un noyau d'hydrogène de masse 3 est radioactif et se change en un noyau d'hélium de masse 3
avec l'émission d'un électron qui a environ une énergie maximale de 17000 eV. Montrez que
l'approximation soudaine peut être appliquée à l'électron extérieur initialement présent dans
l'atome d'hydrogène et qu'elle est supérieure aux autres méthodes d'approximation qui peuvent
être utilisées. Calculez les valeurs numériques des probabilités que l'ion d'hélium trouvé soir
dans les états 1s, 2s et 2p si l'atome d'hydrogène est initialement dans l'état 1s. Donnez une
discussion qualitative du bilan d'énergie dans ce processus.
I.3.3. Méthodes d'approximation en théorie des collisions
Comme remarqué au début de l'étude des approximations pour états liés, il y a si peu de systèmes
physiquement intéressants pour lesquels des solutions exactes peuvent être trouvées que les
méthodes d'approximation jouent une part importante dans les applications de la théorie.
Différentes méthodes qui sont utiles dans les problèmes de diffusion sont considérées ici. Nous
commençons avec le développement de la matrice de diffusion. Elle fournit un cadre plus général
que celui que nous avions déjà vu, en fonction duquel des problèmes de collisions de toutes sortes
peuvent être discutés. Bien que ce ne soit pas une méthode d'approximation en soit, elle est un point
de départ pratique pour les perturbations et autres approximations, dont certaines seront considérées
ici.

Collisions d'échange avec l'hélium


Avant d'attaquer ces méthodes et comme mise en bouche, maintenant que nous connaissons la
description de l'hélium, considérons la diffusion élastique d'un électron par un atome d'hélium dans
son état de base en supposant que l'interaction ne dépend pas du spin. Cela permettra aussi de vous
remettre dans le bain de ce que nous avions déjà étudié sur les collisions. Selon ce que nous avons
vu, les deux électrons dans l'atome d'hélium sont dans un état spatial symétrique et un état de spin
antisymétrique (singulet). Nous écrivons donc la fonction d'onde partielle symétrisée qui
correspond à l'électron incident 1 et les électrons atomiques 2 et 3 comme le produit d'une fonction
spatiale χ i+ (r1 , r2 , r3 ) symétrique en r2 et r3 et d'une fonction de spin ν (1,2,3) qui est
antisymétrique en 2 et 3. Les huit fonctions de spin pour trois électrons ont été précédemment
regroupées selon les symétries en 2 et 3. Il est évident que ν (1,2,3) doit être une des dernières
paires de doublets.

Un prolongement immédiat de ce travail conduit aux formes asymptotiques


[ ]
χ i+ (r1 , r2 , r3 ) → C exp(ik α ⋅ r1 ) + r1−1 exp(ikα r1 ) f D (θ ) wa (r1 , r2 )
r1 →∞

(1) → Cr2−1 exp(ikα r2 ) f E (θ )wa (r3 , r1 )


r2 →∞

→ Cr3−1 exp(ikα r3 ) f E (θ )wa (r1 , r2 )


r3 →∞
où wa st la fonction spatiale d'état de base de l'hélium et les états excités sont ignorés. θ est l'angle
entre la coordonnée asymptotique et k α . L'amplitude directe f D à TD par la relation que nous
avons vue dans les collisions d'atomes d'hydrogène avec échange, où maintenant
 1 1 2 +
(2) TD = C e 2 ∫∫∫ exp(− ik β ⋅ r1 )wa∗ (r2 , r3 ) + −  χ 1 (r1 , r2 , r3 )d 3 r1d 3 r2 d 3 r3
2

 r12 r13 r1 

L'amplitude d'échange f E est évidemment la même pour les deux dernières formes asymptotiques
dans (1). Elle est reliée à TE par la relation que nous avons vue dans les collisions d'atomes
d'hydrogène avec échange, où maintenant
 1 1 
(3) TE = C e 2 ∫∫∫ wa∗ (r1 , r2 )χ β−∗ (r3 ) +  χ i+ (r1 , r2 , r3 )d 3 r1 d 3 r2 d 3 r3
2

 r13 r23 

La fonction d'onde complètement antisymétrique pour les trois électrons est facile à voir.
(4) χ i+ (r1 , r2 , r3 )v(1,2,3) + χ i+ (r2 , r3 , r1 )v(2,3,1) + χ i+ (r3 , r1 , r2 )v(3,1,2 )

Nous voulons maintenant calculer (4) quand les coordonnées d'un des électrons, disons r1 , sont
grandes et que les deux autres électrons sont dans l'état de base d'un atome d'hélium. Cela signifie
que nous prenons la forme asymptotique en r1 et aussi que nous projetons les fonctions de spin sur
v(1,2,3) . Avec l'aide de (1), on a

(5)
{ [ ]}
C exp(ik α ⋅ r1 ) + r1−1 exp(ikα r1 ) f D (θ ) + f E v + (1,2,3)v(2,3,1) + f E (θ )v + (1,2,3)v(3,1,2)
wa (r2 , r3 )v(1,2,3)

Nous prenons pour v(1,2,3) la dernière fonction de spin que nous avons vue pour trois électrons.
Alors
[ ]
(6) v + (1,2,3)v(2,3,1) = 12 (+ + − ) − (+ − + ) [(− + + ) − (+ + − )] = − 12
+ +

et de même v (1,2,3)v(3,1,2 ) = − . La section efficace différentielle obtenue à partir de (5) est alors
+ 1
2
(7) σ (θ ) = f D (θ ) − f E (θ )
2

Comme la section efficace différentielle de deux particules identiques, l'équation (7) peut être
dérivée sans référence explicite aux fonctions de spin. Puisque les deux électrons atomiques
doivent avoir des spins antiparallèles (état singulet) afin que l'atome d'hélium soit dans l'état de
base, la composante de spin de l'électron incident est le même que celle d'un des électrons
atomiques et différent de celle de l'autre. Il ne peut pas s'échanger avec ce dernier dans une
collision élastique car alors les deux électrons atomiques résultants seraient dans le même état de
spin et le principe d'exclusion forcerait l'atome dans un état excité. Donc il peut s'échanger
seulement avec l'électron avec lequel il est indiscernable, ainsi la combinaison antisymétrique des
amplitudes directe et d'échange doit être utilisée. Cela donne l'équation (7).

En l'absence d'interactions dépendantes du spin, l'excitation d'un état triplet de l'hélium par un
impact d'électron peut être réalisée seulement par l'échange entre l'électron incident et un des
électrons atomiques. Dans ce cas, il n'y a pas d'amplitude directe et donc par d'interférence entre
amplitudes directe et d'échange.
I.3.3.1. La matrice de diffusion
La théorie des collisions que nous avons développée jusqu'ici supposait que l'énergie potentielle de
diffusion était indépendante du temps et nous permettait ainsi l'utilisation des fonctions propres de
l'énergie. L'équation sur le comportement asymptotique lors de la diffusion, vue au début, décrit
une situation où le flux incident est représenté par une onde plane de section efficace infinie.
Comme nous l'avions déjà signalé, ce n'est pas réaliste puisque le flux incident passe toujours dans
un collimateur. Cependant, on peut en tenir compte par une superposition d'ondes planes infinies
qui voyagent dans des directions légèrement différentes. Leur dispersion angulaire en direction,
mesurée en radians, est de l'ordre du rapport de la longueur d'onde de la particule au diamètre du
collimateur. Cet angle est si petit dans les cas pratiques que cela n'affecte pas le calcul de
l'amplitude de diffusion. Une autre manière de décrire cette situation est de dire que le vecteur de
propagation k a une grandeur définie k donnée en fonction de l'énergie par E = hk 2 / 2 µ mais que
ses composantes transverses k x et k y sont très petites par rapport à k. Alors k z est pratiquement
égal à k et le "paquet d'ondes" est bien défini seulement dans les deux directions transversales.
Puisqu'une seule énergie E apparaît, l'équation de Schrödinger indépendante du temps peut être
utilisée.

Il arrive aussi que le modèle indépendant du temps d'un flux incident constant et d'une onde
diffusée stationnaire ne soit pas approprié dans certaines circonstances. Il ne peut certainement pas
être correct quand l'énergie potentielle V de diffusion dépend du temps ou bien intrinsèquement ou
bien parce qu'il peut être pratique de voir V comme étant "enclenché" à un moment et "débranché"
un moment plus tard. Même quand V est constant dans le temps, il peut être souhaitable de
remplacer l'onde plane incidente par un paquet d'ondes en mouvement qui est plutôt bien défini
dans les trois directions spatiales et conduit à des impulsions sphériques sortantes lorsqu'il passe
dans le potentiel de diffusion. Un tel paquet d'ondes peut être construit en superposant des ondes
planes indépendantes du temps d'une manière similaire à celle que nous avons discuté dans le cas à
une dimension. Il s'ensuit alors que la dispersion dans chacune des trois composantes de k est de
l'ordre de 1 / R où R est la taille du paquet. La dispersion correspondante dans l'énergie est de
l'ordre de E / kR . Bien qu'elle soit très petite par rapport à E dans les cas pratiques, l'équation de
Schrödinger dépendant du temps doit encore être utilisé.
Nous allons commencer par dériver les équations intégrales pour la fonction d'onde et pour les
fonctions de Green associées et nous définirons alors la matrice de diffusion. Cette matrice décrit le
comportement asymptotique du système dans le sens que la séparation spatiale des parties en
interaction est si grande que l'interaction peut être négligée ou les temps sont tels que l'interaction
n'est s'est pas encore produite ou ne se produit plus. Puisqu'elle est obtenue en intégrant la fonction
d'onde sur le domaine spatio-temporel d'interaction, elle contient toute l'information qui réside dans
l'interaction et qui est pertinente pour la diffusion. En même temps, on montrera quelles limites
sont placées sur les processus de diffusion possibles par le fait que l'hamiltonien est physiquement
significatif ou a certaines propriétés de symétrie. Lorsqu'elle est dérivée de l'équation de
Schrödinger, la matrice de diffusion ne contient pas plus d'informations que l'hamiltonien. Elle
peut, cependant, aussi donner des résultats utiles quand l'interaction qui apparaît dans l'hamiltonien
n'est pas bien connue, comme c'est le cas en physique nucléaire.

Fonctions de Green et propagateur


Même si nous n'allons pas explicitement travailler avec des paquets d'ondes, il est souhaitable de
retenir aussi longtemps que possible la généralité inhérente à la situation dépendant du temps. Nous
partons donc avec l'équation de Schrödinger complète
∂ h2 2
(1) ih ψ (r, t ) = Hψ (r, t ) = [H 0 + V (r, t )]ψ (r, t ) H0 = − ∇
∂t 2µ
qui décrit le mouvement relatif de deux particules de masse réduite µ . Puisque (1) donne la
dérivée première de ψ en fonction de ψ elle-même et puisque des dérivées supérieures par rapport
au temps n'apparaissent pas dans l'équation, la valeur de ψ pour tout r en un moment particulier t
suffit pour déterminer ψ pour tout r et tout t (à la fois plus tôt et plus tard). De même, puisque
l'équation de Schrödinger est linéaire en ψ , les solutions peuvent être superposées et la relation
entre ψ à des moments différents doit être linéaire. Cela signifie que ψ doit satisfaire une équation
intégrale homogène de la forme
(2) ψ (r ′, t ′) = i ∫ G (r ′, t ′, r, t )ψ (r, t )d 3 r
où l'intégration se fait sur tout l'espace. Cette équation sert aussi à définir G qui est appelé la
fonction de Green qui correspond à l'hamiltonien H.
L'équation (2) ne fait pas de distinction entre la propagation de ψ en avant dans le temps ( t ′ > t ) et
la propagation en arrière ( t ′ < t ). Il est quelque fois utile d'avoir une séparation claire entre ces
deux cas. Pour la propagation en avant nous définissons la fonction de Green retardée ou
propagateur :
G + (r ′, t ′, r, t ) = G (r ′, t ′, r, t ) t′ > t
(3)
=0 t′ < t

Nous introduisons aussi la fonction échelon θ (τ ) définie par


θ (τ ) = 1 τ > 0
(4)
θ (τ ) = 0 τ < 0

Alors, l'équation
(5) θ (t ′ − t )ψ (r ′, t ′) = i ∫ G + (r ′, t ′, r, t )ψ (r, t )d 3 r
est l'identité triviale 0 = 0 pour t ′ < t et est la même que (2) pour t ′ > t .

Pour la propagation en arrière dans le temps, nous pouvons de même définir la fonction de Green
avancée :
G − (r ′, t ′, r, t ) = −(r ′, t ′, r, t ) t′ < t
(6)
=0 t′ > t

L'équation
(7) θ (t − t ′)ψ (r ′, t ′) = −i ∫ G − (r ′, t ′, r, t )ψ (r, t )d 3 r
est à nouveau une identité pour t ′ > t et la même que (2) pour t ′ < t . Donc, les équations (5) et (7)
ensembles sont équivalentes à (2).

Les quatre relations intégrales suivantes impliquant G ± peuvent être obtenues à partir des
équations (5) et (7) en utilisant le fait que ψ peut être choisi arbitrairement à tout instant du temps.
G + (r ′, t ′, r, t ) = i ∫ G + (r ′, t ′, r1 , t1 )G + (r1 , t1 , r, t )d 3 r1 t ′ > t1 > t

G − (r ′, t ′, r, t ) = −i ∫ G − (r ′, t ′, r1 , t1 )G − (r1 , t1 , r, t )d 3 r1 t ′ < t1 < t


(8)
δ 3 (r − r ′) = ∫ G + (r ′, t , r1 , t1 )G − (r1 , t1 , r, t )d 3 r1 t > t1

δ 3 (r − r ′) = ∫ G − (r ′, t , r1 , t1 )G + (r1 , t1 , r, t )d 3 r1 t < t1

Fonctions de Green d'une particule libre


Une expression explicite pour la fonction de Green définie par (2) est facile à trouver dans le cas où
V = 0. Nous la notons G0 . Le résultat est
iµ r ′ − r
3/ 2 2
 µ 
(9) G0 (r ′, t ′, r, t ) = −i   exp
 2πih (t ′ − t )  2h (t ′ − t )

La fonction de Green retardée ou propagateur de la particule libre est obtenue à partir de (3) :
(10) G0+ (r ′, t ′, r, t ) = θ (t ′ − t )G0 (r ′, t ′, r, t )

La fonction de Green avancée est de même obtenue à partir de (6) :


(11) G0− (r ′, t ′, r, t ) = −θ (t − t ′)G0 (r ′, t ′, r, t )

La validité des équations (8) dans le cas de la particule libre peut alors être vérifiée par substitution
directe.

On peut aussi voir à partir de (9) à (11) qu'il y a une relation de conjugaison complexe entre G0+ et
G0− :
(12) G0+ (r ′, t ′, r, t ) = G0−∗ (r, t , r ′, t ′)

Nous verrons ci-dessous que cette relation est aussi valable pour G ± pourvu que V soit réel.
Equation intégrale pour ψ
Nous allons maintenant obtenir une forme itérée de l'équation intégrale (5) pour ψ . Nous
imaginons que V est coupé excepté pour de très courts intervalles de temps entre t et t ′ : de t1 à
t1 + ∆t1 , de t 2 à t 2 + ∆t 2 , etc. et finalement de t n à t n + ∆t n , où t ′ > t n > L > t1 > t . Alors G0+ peut
être utilisé comme le propagateur de chaque t i + ∆t i à t i +1 :
(13) θ (t i +1 − t i − ∆t i )ψ (ri +1 , t i +1 ) = i ∫ G0+ (ri +1 , t i +1 , ri , t i + ∆t i )ψ (ri , t i + ∆t i )d 3 ri

La propagation de t i à t i + ∆t i implique à la fois H 0 et V. Puisque ∆t i sera plus tard considéré


comme infinitésimal, les deux changements dans ψ peuvent être ajoutés. La partie H 0 implique
G0+ et est semblable à (13). La partie V du changement dans ψ est facilement obtenue à partir de
(1) et est − (i / h )V (ri , t i )ψ (ri , t i )∆t i . Cela devrait être suivi du propagateur de particule libre de
t i + ∆t i à t i +1 , en accord avec (13), mais le ∆t i dans l'argument de G0+ peut être omis puisque nous
sommes seulement intéressés par les quantités du premier ordre en ∆t i . Nous obtenons donc
 i 
(14) θ (t i +1 − t i )ψ (ri +1 , t i +1 ) = i ∫ G0+ (ri +1 , t i +1 , ri , t i )1 − V (ri , t i )∆t i ψ (ri , t i )d 3 ri
 h 

La propagation résultant de t à t ′ donne alors


 i 
θ (t ′ − t )ψ (r ′, t ′) = ∫ L ∫ iG0+ (r ′, t ′, rn , t n )1 − V (rn , t n )∆t n 
 h 
 i 
(15) iG0+ (rn , t n , rn −1 , t n −1 )L iG0+ (r2 , t 2 , r1 , t1 )1 − V (r1 , t1 )∆t1 
 h 
iG0+ (r1 , t1 , r, t )ψ (r, t )d 2 rn L d 3 r1 d 3 r

On peut le développer et le simplifier avec l'aide de (8) :


θ (t ′ − t )ψ (r ′, t ′) = i ∫ G0+ (r ′, t ′, r, t )ψ (r, t )d 3 r

∑i ∫∫ G0+ (r ′, t ′, ri , ti )V (ri , ti )∆ti G0+ (ri , ti , r, t )ψ (r, t )d 3 ri d 3 r


i
+
(16) h

+ 2 ∑ ∫∫∫ G0+ (r ′, t ′, ri , t i )V (ri , t i )∆t i G0+ (ri , t i , r j , t j )V (r j , t j )G0+ (r j , t j , r, t )ψ (r, t )d 3 ri d 3 r j d 3 r


i
h ij
+L
où t i > t j dans le troisième terme, etc. Si maintenant l'intervalle de temps ∆t i durant lequel V est
enclenché devient de plus en plus fréquent et de durée de plus en plus courte, jusqu'à ce que V soit
continu, les sommations peuvent être remplacées par des intégrales :
(17)
θ (t ′ − t )ψ (r ′, t ′) = i ∫ G0+ (r ′, t ′, r, t )ψ (r, t )d 3 r

dt i G0+ (r ′, t ′, ri , t i )V (ri , t i )G0+ (ri , t i , r, t )ψ (r, t )d 3 ri d 3 r


i
h ∫ ∫∫
+

+ 2 ∫ dt i ∫ dt j ∫∫∫ G0+ (r ′, t ′, ri , t i )V (ri , t i )∆t i G0+ (ri , t i , r j , t j )V (r j , t j )G0+ (r j , t j , r, t )ψ (r, t )d 3 ri d 3 r j d 3 r


i
h
+L

Notez que toutes les intégrales sur le temps peuvent être prises de t à t ′ . Il n'est pas nécessaire
d'exiger que t i > t j dans le troisième terme, par exemple, puisque G0+ (ri , t i , r j , t j ) s'annule si ce
n'est pas le cas.

Il est naturel d'interpréter (17) comme une série de perturbations, dont les deux premiers termes
sont indiqués schématiquement dans la figure ci-dessous.
Le premier terme sur le coté droite représente l'amplitude correspondant à la propagation libre de t
à t ′ (figure (a)). Le deuxième terme est la somme de toutes les interactions uniques en t i avec
propagation libre de t à t i puis de t i à t ′ (figure (b)). Etc. Nous récrivons (17) par facilité comme
θ (t ′ − t )ψ (r ′, t ′) = i ∫ G0+ (r ′, t ′, r, t )ψ (r, t ) + d 3 r

dt i ∫ G0+ (r ′, t ′, ri , t i )V (ri , t i )i ∫ G0+ (ri , t i , r, t )ψ (r, t )d 3 r
1
(18) +
h ∫ 

dt j ∫∫ G0+ (ri , t i , r j , t j )V (r j , t j )G0+ (r j , t j , r, t )ψ (r, t )d 3 r j d 3 r + L d 3 ri


i 
+
h ∫ 

Si la série entre crochet est supposée converger, alors, selon (17), elle est égale à θ (t i − t )ψ (ri , t i )
ou simplement ψ (ri , t i ) puisque t i > t . Nous obtenons donc une équation intégrale pour ψ qui,
contrairement à (5), implique seulement G0+ et non G + :
θ (t ′ − t )ψ (r ′, t ′) = i ∫ G0+ (r ′, t ′, r, t )ψ (r, t )d 3 r
(19)
dt i ∫ G0+ (r ′, t ′, ri , t i )V (ri , t i )ψ (ri , t i )d 3 ri
1
+
h ∫
L'intégration sur t i va de t à t ′ .

Equation intégrale pour le propagateur


La comparaison de (5) et (17) montre que
G + (r ′, t , r, t ) = G0+ (r ′, t , r, t )

G0+ (r ′, t ′, ri , t i )V (ri , t i )G0+ (ri , t i , r, t )dt i d 3 ri


1
(20) h
∫∫
+

+ 2 ∫∫∫∫ G0+ (r ′, t ′, ri , t i )V (ri , t i )G0+ (ri , t i , r j , t j )V (r j , t j )G0+ (r j , t j , r, t )dt i d 3 ri dt j d 3 r j


1
h
+L

A nouveau, si cette série est supposée converger, elle peut être sommée pour donner l'équation
G + (r ′, t ′, r, t ) = G0+ (r ′, t ′, r, t )
(21) 1
+ ∫∫ G0+ (r ′, t ′, ri , t i )V (ri , t i )G + (ri , t i , r, t )dt i d 3 ri
h

Utilisation des fonctions de Green avancées


Les résultats précédents peuvent être reformulés en utilisant les fonctions de Green avancées plutôt
que les retardées et elles sont données ici pour être complet même si elles ne sont pas aussi utiles
que les équations du propagateur obtenues ci-dessus.

Nous avons donc maintenant t ′ < t et nous démarrons donc en imaginant que V est coupé excepté
pendant les intervalles t n − ∆t n à t n , de t n −1 − ∆t n −1 à t n −1 , etc. et finalement de t1 − ∆t1 à t1 , où
t ′ < t n < L < t1 < t ? Alors l'équation de base(14) pour la propagation en avant est remplacée par
l'équation suivante pour la propagation en arrière dans le temps :
 i 
(22) θ (t i − t i +1 )ψ (ri +1 , t i +1 ) = −i ∫ G0− (ri +1 , t i +1 , ri , t i )1 + V (ri , t i )∆t i ψ (ri , t i )d 3 ri
 h 

Comparé à (14), le signe moins en face du coté droit de (22) vient du signe moins dans (6) ou (7) et
le signe plus dans les crochets vient du fait que le changement dans ψ est calculé de t i à t i − ∆t i
plutôt que de t i à t i + ∆t i .

Il est maintenant évident que les équations (17) et (19) peuvent être récrites correctement en faisant
les substitutions suivantes :
(23) θ (t ′ − t ) → θ (t − t ′) G0+ (r ′, t ′, r, t ) → G0− (r ′, t ′, r, t ) i → −i

De même, les équations (20) et (21) peuvent être récrites correctement en faisant les substitutions :
(24) G0+ (r ′, t ′, r, t ) → G0− (r ′, t ′, r, t ) G + (r ′, t ′, r, t ) → G − (r ′, t ′, r, t )

Dans toutes les équations récrites, toutes les intégrations sur le temps vont de t ′ à t.

L'équation (20), qui exprime G + en fonction de G0+ et l'équation récrite correspondante qui
exprime G − en fonction de G0− , peut maintenant être utilisée, avec l'aide de (12), pour montrer que
(25) G + (r ′, t ′, r, t ) = G −∗ (r ′, t ′, r, t )
pourvu que V soit réel.

Equation différentielle pour les fonctions de Green


Jusqu'ici nous avons utilisé l'équation différentielle (1) pour ψ pour construire les équations
intégrales (2), (17) et (19) pour ψ et les équations intégrales correspondantes (20) et (21) pour G ± .
Les fonctions de Green satisfont aussi une équation différentielle analogue à (1). On s'attend à ce
que cette équation soit non homogène puisque G ± (r ′, t ′, r, t ) est, en effet, la fonction d'onde en r ′ ,
t ′ qui est générée par une source ponctuelle momentanée en r, t.

Nous pouvons trouver cette équation pour G + en opérant sur (5) avec i (∂ / ∂t ′) − (1 / h )H ′ où H ′ est
H exprimé en fonction des variables r ′ , t ′ . Il est nécessaire d'utiliser la relation
θ (τ ) = δ (τ )
d
(26)

qui suit de (4). Le résultat est
 ∂ 1  +
(27) iδ (t ′ − t )ψ (r ′, t ′) = i ∫  i − H ′ G (r ′, t ′, r, t )ψ (r, t )d 3 r
 ∂t ′ h 
où nous avons utilisé (1). Cette équation montre que le coté droit doit être proportionnel à δ (t ′ − t )
de façon à ce que seul ψ (r, t ′) puisse apparaître dans l'intégrand sur le coté droit. Mais puisque
ψ (r, t ′) peut être une fonction arbitraire de r à tout instant particulier t ′ , le reste de l'intégrand du
coté droit doit être proportionnel à δ 3 (r ′ − r ) . Nous en concluons que
 ∂ 1  +
(28)  i − H ′ G (r ′, t ′, r, t ) = δ 3 (r ′ − r )δ (t ′ − t )
 ∂t ′ h 

Il est facile de voir que si nous étions partis de (7), nous aurions trouvé que G − satisfait aussi (28).
Donc G + et G − satisfont la même équation différentielle non homogène mais elles diffèrent bien
sûr par leurs conditions aux limites. G + (r ′, t ′, r, t ) est la solution de (28) qui vaut zéro pour t ′ < t et
G − (r ′, t ′, r, t ) est la solution qui vaut zéro pour t ′ > t .

Relations symboliques
Les équations intégrales et différentielles pour les fonctions de Green obtenues dans ce qui précède
peuvent être écrites sous une forme symbolique qui est instructive. L'équation (19) et l'équation
correspondante pour G − peuvent être écrites
(29) G ± = G0± + h −1G0±VG0± + h −2 G0±VG0±VG0± + L
De même, nous pouvons écrire (20) sous la forme
(30) G ± = G0± + h −1G0±VG ±

Ensuite, l'équation différentielle (28) et l'équation correspondante pour G − peuvent être écrites
 ∂ 1 
(31)  i − H G ± = 1
 ∂t h 
où les apostrophes ont été enlevées. En omettant le terme V dans H, on obtient à la place de (31)
 ∂ 1 
(32)  i − H 0 G0± = 1
 ∂t h 

Différents contrôles peuvent être faits pour la consistance des quatre dernières équations. Si nous
multiplions de manière symbolique les deux cotés de (30) avec i (∂ / ∂t ) − (1 / h )H 0 , on obtient
 ∂ 1   ∂ 1   1  1
(33)  i − H 0 G ± =  i − H 0 G0± 1 + VG ±  = 1 + VG ±
 ∂t h   ∂t h   h  h
où nous avons utilisé (32). Le résultat est en accord avec (31). Un autre test de consistance consiste
à écrire (30) comme
(34) (1 − h −1G0±V )G ± = G0±
ou comme
(35) G ± = (1 − h −1G0±V ) G0±
−1

Un développement formel de l'opérateur inverse en série donne


(36) G ± = (1 + h −1G0±V + h −2 G0±VG0±V + K)G0±
qui est le même que (29). Cette utilisation réussie de l'opérateur inverse suggère que les équations
(31) et (32) peuvent s'écrire de manière symbolique comme
−1 −1
±  ∂ 1  ±  ∂ 1 
(37) G =  i − H  et G =  i − H 0 
 ∂t h   ∂t h
0

respectivement.
Bien que de telles manipulations symboliques aient souvent une valeur heuristique pour suggérer
de nouvelles relations, elles ne peuvent pas toujours être vues comme des dérivations ou des
démonstrations de telles relations. En particulier, les opérateurs inverses du type (35) ou (37) sont
souvent singuliers et on doit faire particulièrement attention à l'interprétation de la singularité. Par
exemple, notons que les fonctions de Green retardées et avancées sont toutes les deux données par
la même expression symbolique (37). Nous verrons plus loin qu'un traitement approprié de la
singularité de l'opérateur inverse fournit la condition aux limites qui permet de distinguer entre la
propagation en avant et en arrière dans le temps.

Application à la diffusion
Le formalisme développé jusqu'ici peut maintenant être appliqué à la diffusion. Nous imaginons
que V n'est pas effectif dans le lointain passé ou le lointain futur et ainsi H peut être remplacé par
H 0 pour t < −T1 et t > T2 , où T1 et T2 sont des temps grands mais finis. Cela peut être dû au fait
que V fut enclenché à un moment donné et coupé plus tard ou parce que les états initiaux et finaux
consistent en paquets d'ondes qui sont en dehors du potentiel de diffusion. Nous appelons les
fonctions d'onde de la particule libre φα (r, t ) . Elles satisfont (1) avec V posé égal à zéro. Les φα
constituent un ensemble complet de fonctions à chaque instant du temps qui sont, par facilité,
choisies orthonormales. L'orthogonalité est préservée au cours du temps. A chaque φα on associe
une fonction d'onde ψ α+ (r, t ) qui part de φα à partir d'un temps dans le lointain passé ( t < −T1 )
avant que V soit effectif. Puisque ψ α+ satisfait (1), on peut l'écrire, en accord avec (5), sous la forme
(38) ψ α+ (r ′, t ′) = i ∫ G + (r ′, t ′, r, t )φα (r, t )d 3 r t < −T1
où θ (t ′ − t ) peut maintenant être mois. Ce ψ α+ est indépendant de la valeur précise choisie pour t
tant qu'elle est inférieure à − T1 .

A un certain moment dans le lointain futur ( t > T2 ), quand V est à nouveau désactivé, ψ α+ est une
solution de l'équation de Schrödinger pour la particule libre et donc doit pouvoir s'exprimer comme
une somme généralisée sur les φ β avec des coefficients constants. Alors la quantité
(39) β S α ≡ (φ β ,ψ α+ ) t ′ > T2
est l'amplitude de l'état β de la particule libre qui est contenue, après que la diffusion a eut lieu,
dans l'état qui se développe à partir de ce qui est état l'état α de particule libre avant que la
diffusion ait lieu. A nouveau, elle est indépendante de la valeur précise choisie pour t ′ aussi
longtemps qu'elle est supérieure à T2 . L'équation (39) est l'amplitude pour la transition de α à β
et qui définit un élément de la matrice de diffusion ou matrice S (le S vient de "scattering", qui
signifie diffusion en anglais).

La substitution de (38) dans (39) donne une forme plus symétrique à l'élément de matrice S :
(40) β S α = i ∫∫ φ β∗ (r ′, t ′)G + (r ′, t ′, r, t )φα (r, t )d 3 rd 3 r t < −T1 t ′ > T2

D'autres formes peuvent être obtenues en utilisant l'équation suivante, qui peut être obtenue en
prenant le complexe conjugué de la version particule libre (7) et en utilisant (12) :
θ (t − t ′)φ β∗ (r ′, t ′) = i ∫ G0−∗ (r ′, t ′, r, t )φ β∗ (r, t )d 3 r
(41)
= i ∫ φ β∗ (r, t )G0+ (r, t , r ′, t ′)d 3 r

La substitution de G + de (20) dans (4) et en utilisant (5) et (41) conduit à


β S α = β α − ∫∫ φ β∗ (r, t )V (r, t )φα (r, t )dtd 3 r
i
h
(42) − 2 ∫∫∫∫ φ β∗ (r ′, t ′)V (r ′, t ′)G0+ (r ′, t ′, r, t )V (r, t )φα (r, t )dt ′d 3 r ′dtd 3 r
i
h
−L
où β α ≡ ∫ φ β∗ (r, t )φα (r, t )d 3 r et est indépendant de t. Une substitution similaire de G + de (21)
donne
φ β∗ (r, t )V (r, t )ψ α+ (r, t )dtd 3 r
i
(43) β S α = β α −
h ∫∫

L'intégration sur le temps dans (42) et (43) s'étend au moins de − T1 à T2 et inclut donc l'intervalle
complet durant lequel V est effectif.
Des expressions pour les éléments de la matrice S similaires à ceux ci-dessus peuvent être obtenues
en utilisant les fonctions de Green avancées G0− et G − . Par exemple, à chaque φ β il y a une
fonction d'onde associée ψ β− (r, t ) qui part de φ β à un moment donné dans le lointain futur t > T2
après que V a cessé d'être effectif. Elle peut être écrite, en utilisant (7) en échangeant les variables
avec et sans apostrophes, sous la forme
(44) ψ β− (r, t ) = −i ∫ G − (r, t , r ′, t ′)φ β (r ′, t ′)d 3 r ′ t ′ > T2

On peut s'attendre à ce que l'élément de la matrice S pour la transition de α à β soit donné par le
produit scalaire de ψ β− et φα évalué à un moment dans le lointain passé ( t < −T1 ) :
(45) (ψ β− , φα ) = i ∫∫ G −∗ (r, t , r ′, t ′)φ β∗ (r ′, t ′)φα (r, t )d 3 r ′d 3 r t < −T1 t ′ > T2

L'équation (25) montre que (45) est en effet le même que β S α donné par (40) pourvu que H soit
hermitique ou V réel. La différence quand V est complexe est physiquement plausible puisque nous
avons vu qu'un potentiel absorbant (partie imaginaire de V négative) fait que la probabilité totale
associée à un état diminue avec le temps. Cela signifie que ψ α+ (r ′, t ′) est généralement plus petit
pour t ′ > T2 que le φα à partir duquel il se développe, tandis que ψ β− (r, t ) est généralement plus
grand pour t < −T1 que le φ β vers lequel il se développe. Donc, on s'attend à ce que (45) soit plus
grand que (40) si V est absorbant.

Unitarité de la matrice S
Une propriété importance de S est qu'elle est unitaire si l'hamiltonien est hermitique. Afin de le
démontrer, nous devons montrer que SS + = 1 et que S + S = 1 . N'importe qu'elle forme de β S α
obtenue ci-dessus ou les expressions correspondantes contenant les fonctions d'onde ou fonctions
de Green avancées peut être utilisée dans ce but. Avec la forme (40), un élément de matrice typique
de SS + est

β SS + α = Sγ β S γ γ S + α = Sγ β S γ α S γ
(46) = Sγ ∫∫ φ β∗ (r ′, t ′)G + (r ′, t ′, r, t )φγ (r, t )d 3 r ′d 3 r

∫∫φα (r ′′, t ′)G (r ′′, t ′, r ′′′, t )φγ (r ′′′, t )d r ′′d 3 r ′′′ t < −T1 t ′ > T2
+∗ ∗ 3

Il est pratique d'utiliser les mêmes temps t et t ′ dans les éléments de matrice de S et S + et c'est
permit puisque (40) est indépendant de ces temps aussi longtemps que V n'est pas effectif. Alors,
puisque les φ sont complets et orthonormaux, la somme sur γ introduit δ 3 (r − r ′′′) à la place de
φγ φγ∗ et nous avons
(47) β SS + α = ∫∫∫φ β∗ (r ′, t ′)G + (r ′, t ′, r, t )G − (r, t , r ′′, t ′)φα (r ′′, t ′)d 3 r ′d 3 rd 3 r ′′
où nous avons utilisé (25). La troisième équation (8) montre alors que l'intégrale du produit des
deux fonctions de Green sur d 3 r donne δ 3 (r ′ − r ′′) , ainsi le coté droit est simplement β α .
S + S = 1 se démontre de manière analogue.

La démonstration donnée pour l'unitarité de S est satisfaisante puisque V est enclenché et coupé en
des temps finis dans le passé et le futur. La situation est plus compliquée si V est strictement
constant dans le temps et s'il devient ineffectif dans le lointain passé et futur parce que les états
initiaux et finaux consistent en paquets d'ondes qui sont en dehors du domaine de V. Un facteur de
complication est que H peut posséder des états liés et on peut alors montrer que les états paquets
d'ondes sont orthogonaux à ces états liés et ne forment donc pas un ensemble complet. Néanmoins,
S et encore unitaire si V est réel car la conservation de l'énergie empêche l'occupation des états liés.

Propriétés de symétrie de la matrice S


On s'attend à ce que la matrice S possède des symétries qui reflètent les symétries de l'hamiltonien
sous-jacent. Afin de le voir, considérons d'abord une des opérations de symétrie discutées
précédemment et qui peut être représentée par un opérateur unitaire (translations spatiales ou
temporelles, rotations ou inversion spatiale). Un tel opérateur U transformera un état de particule
libre φ β en un autre état φ β ′ = Uφ β qui représente un mouvement libre possible du système
puisque U commute avec H 0 . Si en plus U commute avec H, il transformera ψ α+ en un état
ψ α+′ = Uψ α+ qui représente aussi un mouvement possible du système en présence de l'interaction V.
Donc l'élément de matrice S entre les états transformés, donné par (39), est
( ) (
β ′ S α ′ = φ β ′ ,ψ α+′ = Uφ β ,Uψ α+ )
(48)
( ) (
= φ β ,U +Uψ α+ = φ β ,ψ α+ = β S α )
tous évalués pour t ′ > T2 . Par exemple, l'amplitude pour la diffusion entre toute paire d'états causée
par un potentiel à symétrie sphérique est numériquement égale à l'amplitude entre les états obtenus
par rotation identique des deux membres de la paire originale.

Le coté gauche de (48) peut aussi être écrit β U + SU α . Alors, puisque les kets α et β sont
arbitraires, nous en concluons que
(49) US +U = S ou [U , S ] = 0

Donc, si U commute avec H, il commute aussi avec l'opérateur S.

Pour l'opération antiunitaire de renversement du temps, la situation est un peu plus compliquée.
L'opérateur de renversement du temps T transforme un état de particule libre φ β en un autre état
qui correspond à des moments linéaires et angulaires renversés. Nous le notons donc
schématiquement comme φ − β . Cependant, l'opération T renverse aussi le sens de progression du
temps, et donc
(50) Tφ β (t ) = φ − β (− t )

Par exemple, si φ β (t ) = C exp i (k β ⋅ r − ω β t ) pour une particule sans spin, alors (50) nous dit que
φ− β (t ) = C ∗ exp i (− k β ⋅ r − ω β t ) .

Supposons maintenant que T commute avec H, tel que le système en interaction est invariant par
renversement du temps. La solution la plus simple est celle dans laquelle V est constant dans le
temps excepté son enclenchement et son déclenchement d'une manière symétrique en t = ±T0 .
Alors T transformera ψ α+ en un état qui représente aussi un mouvement possible du système. Cet
état n'aura pas seulement des moments linéaires et angulaires renversés mais se développera aussi
vers φ −α dans le lointain futur plutôt que de se développer à partir de φ −α dans le lointain passé.
Nous le notons donc ψ −−α . A nouveau, l'opération avec T renverse le sens de progression du temps,
de sorte que l'analogue de (50) est
(51) Tψ α+ (t ) = ψ −−α (− t )

Pour un système invariant par renversement du temps, H est hermitique et V réel, un élément de
matrice S peut alors s'écrire sous la forme
( ) 0
( )
(52) − α S − β = ψ −−α (t ), φ − β (t ) t < −T = ψ −−α (− t ), φ − β (− t ) t >T
0

Nous substituons maintenant (50) et (51) dans (52) :


( ) ( )
− α S − β = Tψ α+ (t ), Tφ β (t ) = UKψ α+ (t ),UKφ β (t )
(
(53) = Kψ α+ (t ), Kφ β (t )) = (φ (t ),ψ (t ))
β
+
α

= β Sα
tous évalués pour t > T0 . L'équation (53) montre que l'amplitude pour la diffusion d'un état initial
α vers un état final β est numériquement égale à l'amplitude pour la diffusion de l'état final avec
les moments renversés − β vers l'état initial avec les moments renversés − α , si le système est
invariant par renversement du temps. C'est le théorème de réciprocité que nous avions vu être
valide même quand V est complexe.
I.3.3.2. Théorie des collisions stationnaires
La théorie de la matrice S développée dans la section précédente inclut la possibilité d'une variation
arbitraire de H au cours du temps, avec la seule restriction que les états de particule libre peuvent
être définis pour des temps finis dans le lointain passé et le lointain futur. Bien qu'il soit intéressant
d'avoir un formalisme capable de traiter tout problème de diffusion qui puisse en principe être
formulé, les résultats utiles sont généralement obtenus seulement dans des cas particuliers. La
situation physiquement la plus intéressante est celle où V est indépendant du temps, en dehors de
son enclenchement à un moment donné et son débranchement plus tard.

Nous considérons d'abord cette situation stationnaire en imaginant que V est effectif pendant un
temps très long mais fini t 0 . Un élément de matrice S particulier peut alors être relié à une
probabilité de transition par unité de temps, tout comme cela fut traité dans le cas de la théorie des
perturbations dépendant du temps, bien qu'ici sans la restriction au cas où V est une petite
perturbation. Nous irons ensuite un pas plus loin et nous relierons cette probabilité de transition à
une section efficace. En suivant cela, nous développerons une procédure alternative pour la limite
où t 0 est infini afin que la situation soit strictement stationnaire. Dans ce cas, il n'est pas intéressant
de penser en termes d'une probabilité de transition, nous obtiendrons directement l'amplitude de
transition et la section efficace.

Matrice de transition
Les états initiaux et finaux de particule libre φα et φ β , en fonction desquels l'élément de matrice S
β S α est spécifié, peuvent être choisis avec des énergies bien définies. Nous supposerons que la
durée prise pour enclencher ou déclencher V est de l'ordre de ∆t et qu'entre les deux V est constant
pendant une durée t 0 qui est beaucoup plus grande que ∆t . Cela signifie que V (r, t ) est remplacé
par V (r )g (t ) , où g (t ) a la forme générale montrée dans la figure ci-dessous.
Alors la transformée de Fourier de Vg contient des fréquences qui sont de l'ordre de 1 / ∆t autour de
zéro. Il suit alors des relations sur la matrice S que β (S − 1)α est très petit sauf si l'énergie
associée à ψ α+ est dans un domaine de l'ordre de h / ∆t autour de l'énergie associée à φ β . Nous
supposerons que ∆t peut être choisi assez grand pour que la largeur de ce domaine d'énergie soit
expérimentalement inobservable. Nous supposerons aussi que t 0 peut être fait si grand par rapport
à ∆t que l'incertitude sur la durée où V est effectif est sans importance. Cela signifie que V est actif
pendant un temps bien défini et que l'énergie est essentiellement conservée durant le processus de
diffusion.

Avec cette situation physique à l'esprit, posons


φα (r, t ) = uα (r )e −iωα t (H 0 − Eα )uα (r ) = 0
(1) +
ψ α (r, t ) = χ α+ (r )e −iωα t (H − Eα )χ α+ (r ) = 0
où Eα = hω α et V (r, t ) peut être remplacé par V (r )g (t ) . Nous utilisons alors les expressions des
éléments de la matrice S pour définir un élément de la matrice de transition ou matrice T comme

β S − 1α = − β T α ∫ g (t )e βα dt
i iω t

h − ∞
(2)
β T α ≡ ∫ u β∗ (r )V (r )χ α+ (r )d 3 r ω αβ ≡ ω β − ω α
Probabilité de transition
2
La définition de la matrice de diffusion montre que β S α est la probabilité qu'un système
initialement dans l'état α soit finalement trouvé dans l'état β . Aussi longtemps que α et β sont
des états différents, elle est égale à β (S − 1)α
2
et nous pouvons utiliser (2) pour calculer la
probabilité de transition. Si maintenant nous supposions que ∆t = 0 dans la figure ci-dessus, la
situation serait similaire à celle que nous avons vue dans la perturbation harmonique dans la théorie
des perturbations dépendant du temps. Afin d'éviter cela, nous ne supposerons pas une telle forme
carrée pour g (t ) .

Les états initiaux et finaux dans un problème de diffusion sont distribués de manière continue ou
presque si une normalisation dans une boîte est utilisée. Donc, il y a toujours un groupe d'états
finaux β qui ont presque la même énergie et pour lesquels β T α est approximativement
indépendant de β . Un tel groupe d'états aura aussi presque les mêmes valeurs pour tous les autres
paramètres, excepté l'énergie, qui spécifient les états. Par exemple, si les états finaux sont des
fonctions propres de l'impulsion, les états β seront caractérisés par un domaine étroit de directions
de l'impulsion ainsi que de sa grandeur. Nous écrivons le nombre de ces états comme ρ (β )dE β où
dE β est le domaine d'énergie et ρ (β ) est évidemment une différentielle en les autres paramètres.
Alors la probabilité totale de trouver le système dans un des états finaux de ce groupe est une
sommation de β (S − 1)α
2
:
∞ 2
β (S − 1)α ρ (β )dE β = h −2 ∫ β T α g (t )e ρ (β )hdω βα
2 2 iω βα t
(3) ∫ ∫
−∞

où nous avons remplacé dE β par hdω βα puisque ω α est constant. Maintenant, la transformée de
Fourier de g (t ) est fortement concentrée autour de ω βα = 0 et ainsi nous pouvons enlever

ρ (β ) β T α
2
de l'intérieur de l'intégrale sur ω βα et étendre la limite à ± ∞ . Alors
∞ ∞ 2 ∞
g (t )e dt dω βα = 2π ∫ g (t ) dt
iω βα t
∫ ∫
2
(4)
−∞ −∞ −∞

et c'est essentiellement égal à 2πt 0 si g (t ) a la forme montrée dans la figure ci-dessus. La


probabilité de transition par unité de temps est alors donnée par

(5) w ≡ ∫ β (S − 1)α ρ (β )dE β = ρ (β ) β T α
1 2 2

t0 h

L'équation (5) est exacte. La comparaison du deuxième terme de (42) de la section précédente avec
le second terme de (43) montre qu'une approximation perturbation à (5) est obtenue en remplaçant
χ α+ par uα dans (2). Ce remplacement donne la "règle d'or n° 2" de Fermi.

Section efficace de diffusion


Une expression pour la section efficace différentielle est obtenue à partir de (3) plus facilement en
utilisant la normalisation dans une boîte. Nous choisissons les u β comme les fonctions propres de
l'impulsion
(6) u β (r ) = L−3 / 2 exp(ik β ⋅ r )
auquel cas ρ (β ) est donné, comme nous l'avions déjà vu, par :
µL3
(7) ρ (β ) = k β dΩ β
8π 3 h 2
où dΩ β est l'élément infinitésimal d'angle solide associé à la direction de k β .

La valeur de w obtenue par substitution de (7) dans (5) est le nombre de diffusions dans dΩ β par
unité de temps quant il y a initialement un système dans le volume L3 . C'est un flux incident de
vα / L3 par unité de surface et de temps, où vα est la vitesse relative initiale. Puisque la section
efficace différentielle est définie comme la diffusion par unité de flux incident, nous avons
(8) σ (k β , k α )dΩ β =
w
vα / L3
et ainsi
2
v β  µL3 
(9) σ (k β , k α ) =
2
  βTα
vα  2πh 2 
où nous avons remplacé k β par µv β / h . Dans le cas de la diffusion élastique que nous considérons,
l'énergie est conservée et v β = vα .

Les fonctions d'onde u β et χ α+ qui apparaissent dans l'élément de matrice T (2) sont chacun
normalisés à un système dans le volume L3 et ainsi β T α est proportionnel à 1 / L3 . Donc, la
section efficace différentielle est indépendante de L, comme on devait bien sûr s'y attendre. Il est
aussi intéressant de noter que la probabilité de transition totale wt 0 où w est donné par (5) est
proportionnelle à t 0 / L3 . Puisque l'utilisation de la normalisation dans une boîte implique que la
limite L → ∞ soit finalement prise, la difficulté apparente, associée au fait que la probabilité wt 0
peut être plus grande que l'unité si t 0 est choisi suffisamment grand, ne se produit en fait pas. Cette
probabilité devient en réalité infiniment petite pour toute valeur de t 0 lorsque L → ∞ .

Fonctions de Green dans le cas stationnaire


Nous allons maintenant développer une procédure alternative qui est applicable dans la limite où t 0
est infini, ainsi la situation est strictement stationnaire et l'énergie est strictement conservée. Il est
nécessaire de supposer que le formalisme de la matrice S développé précédemment reste valide
dans cette limite. Nous ne pouvons plus maintenant penser en termes de probabilité de transition
par unité de temps mais nous pouvons à la place obtenir directement l'amplitude de diffusion et la
section efficace. Cette situation strictement stationnaire est plus facilement et plus directement
approchée en partant de l'équation de Schrödinger dépendant du temps. Bien que nous suivrons
cette procédure un peu plus tard, nous allons d'abord regarder un traitement qui part des fonctions
de Green dépendant du temps dont nous avons déjà discuté.
Une expression explicite pour la fonction de Green G (r ′, t ′, r, t ) est facilement obtenue dans le cas
stationnaire en utilisant le développement en fonctions propres de l'énergie. Avec nos notations
actuelles, on a
(10) G (r ′, t ′, r, t ) = −iSα χ α (r ′)χ α∗ (r ) α
− iω (t −t )

où les χ α constituent un ensemble orthonormal complet de solutions de l'équation de Schrödinger


indépendante du temps (H − Eα )χ α = 0 . Le fait que G soit seulement fonction de t ′ − t et non de
t ′ et t séparément est une conséquence de l'invariance de H par rapport aux translations spatiales
dans le cas stationnaire. Le propagateur est obtenu en multipliant G par θ (t ′ − t ) . Puisque la forme
(10) pour G ressemble à un développement de Fourier en la différence de temps t ′ − t , cela suggère
la possibilité de sortir la dépendance par rapport au temps en exprimant θ (t ′ − t ) comme un
développement de Fourier. Nous allons maintenant montrer qu'il a la forme
1 ∞ −iωτ dω
(11) θ (τ ) = lim+ −
2πi ∫−∞
e
ε →0 ω + iε

Nous notons d'abord que la dérivée de (11) par rapport à τ est


1 ∞ −iωτ
e dω
2π ∫−∞
(12)

qui est bien égal à δ (τ ) . Ce résultat est indépendant du fait que le dénominateur de l'intégrand dans
(11) soit choisi comme ω + iε ou ω − iε , c'est-à-dire si le pôle de l'intégrand est en dessous ou au-
dessus du contour d'intégration qui est le long de l'axe réel. Cependant, les deux choix donnent
différentes valeurs à l'intégrale. Le premier choix correspond à un pôle en − iε comme montré dans
la figure (a) ci-dessous.
Pour τ < 0 , ce contour peut être complété avec un demi-cercle infini dans le demi-plan imaginaire
positif, comme dans la figure (b) ci-dessus, puisque l'exponentielle y devient infiniment petite et ne
contribue pas à l'intégrale. Alors θ (τ ) = 0 . Pour τ > 0 , le contour peut être complété comme dans
la figure (c) ci-dessus et l'intégrale est égale à − 2πi fois le résidu de l'intégrand au seul pôle
(ω = −iε ) qui est dans le contour. Alors, à la limite ε → 0 + , θ (τ ) = 1 . On vérifie facilement que le
second choix pour le dénominateur, ω − iε , conduit à θ (τ ) − 1 .

Nous combinons maintenant (10) et (11) pour obtenir une expression pour G + (r ′, t ′, r, t ) . Il est utile
de changer la variable d'intégration de ω à ω + ω α et d'écrire G + sous la forme d'une analyse de
Fourier :

G + (r ′, t ′, r, t ) = Gω+ (r ′, r )e −iω (t ′−t ) dω
1
(13) 2π ∫
−∞

Gω+ (r ′, r ) ≡ Sα (ω − ω α + iε ) χ α (r ′)χ α∗ (r )
−1

où la limite ε → 0 + est toujours sous-entendue. On établit facilement que les fonctions de Green
avancées G − (r ′, t ′, r, t ) et Gω− (r ′, r ) sont reliées l'une à l'autre par la première fonction (13) et celle
de Gω− (r ′, r ) est donnée par la deuxième équation avec + iε remplacé par − iε dans le
dénominateur de l'expression sommée. On peut aussi montrer que la complétude et l'orthonormalité
des χ α implique que Gω± satisfait l'équation
 1 
(14)  ω − H ′ Gω± (r, r ) = δ 3 (r ′ − r )
 h 
où H ′ est H exprimé en fonction de r ′ .

Fonctions de Green comme opérateurs inverses


Nous sommes maintenant en position de voir comment les opérateurs inverses peuvent être écrits
explicitement. Les opérateurs inverses peuvent s'écrire, selon ce que nous avions vu, comme
−1
 ∂ 1 ′ 3 ′
G (r , t , r, t ) =  i
±
′ ′ − H  δ (r − r )δ (t ′ − t )
 ∂t ′ h 
(15) −1
 ∂ 1 ′ 1 ∞ −iω (t ′ − t )
− H  Sα χ α (r ′)χ α∗ (r ) dω
2π ∫−∞
= i e
 ∂t ′ h 

Ici la relation de complétude des χ α a été utilisée pour les substituer à δ 3 (r ′ − r ) et on a utilisé une
des formes de la fonction Delta pour δ (t ′ − t ) . Un terme typique de l'intégrand (et de la somme
généralisé), χ α (r ′)e −iω t ′ est une fonction propre de l'opérateur i (∂ / ∂t ′) − (1 / h )H ′ avec la valeur
propre ω − ω α . Nous essayons donc de remplacer toute fonction de cet opérateur, quand on opère
sur ce terme typique, par la même fonction de la valeur propre. Si cela est fait, nous obtenons
1 ∞
(16) G ± (r ′, t ′, r, t ) = ∫ Sα (ω − ω α )−1 χ α (r ′)χ α∗ (r )e −iω (t′−t )dω
2π − ∞
Cela fournit un exemple de la singularité mentionnée plus tôt. L'intégrale sur ω n'est pas bien
définie à moins que le pôle en ω α soit enlevé de l'axe réel. Cela peut être réalisé en remplaçant
ω − ω α par ω − ω α ± iε dans le dénominateur de l'intégrand et cela conduit au G ± correct comme
obtenu dans (13). L'insertion de ± iε enlève la singularité et en même temps spécifie si la fonction
de Green se propage en avant ou en arrière dans le temps.

Propagateur stationnaire
Les fonctions de Green stationnaires Gω± (r ′, r ) définies dans (13), qui sont les transformées de
Fourier des fonctions de Green dépendant du temps, G ± (r ′, t ′, r, t ) , peuvent aussi être obtenues
directement à partir de l'équation de Schrödinger indépendante du temps. Pour un problème de
diffusion stationnaire, nous sommes intéressés par une solution de cette équation qui a la forme
d'une onde plane plus une onde diffusée sortante. On s'attend à ce que cela soit associé au
propagateur Gω+ plutôt qu'a Gω− puisque ψ α+ (r, t ) fut défini en partant d'un temps dans le lointain
passé avant que V ne soit effectif. En accord avec (1), nous appelons cette solution stationnaire
χ α+ (r ) et nous l'écrivons comme
(17) χ α+ (r ) = C [exp(ik α ⋅ r ) + v(r )] = uα (r ) + Cv (r )
où uα (r ) est l'onde plane normalisée de manière appropriée définie dans (1). Le coefficient C est
égal à L−3 / 2 pour une normalisation dans une boîte et à (2π )
−3 / 2
pour la normalisation continue ou
par fonction de Dirac. Puisque l'onde diffusée associée à χ α est sortante, la forme asymptotique de
+

v(r ) peut être écrite comme


(18) v(r ) → f (k r , k α )e α
1 ik r

r →∞ r

où le vecteur k r qui apparaît dans l'amplitude de diffusion f a pour grandeur kα et la direction de


r. Il est important de noter que le coefficient C est le même pour χ α+ et uα , puisque v(r ) contribue
par une quantité négligeable à l'intégrale de normalisation. De plus, cette procédure est valide
également pour V complexe puisque des solutions de diffusion stationnaires ( Eα réel) peuvent
toujours être trouvées.

La substitution de (17) dans l'équation de Schrödinger


(19) [H 0 + V (r ) − Eα ]χ a+ (r ) = 0
montre que v(r ) satisfait l'équation différentielle non homogène

(20) (H 0 − Eα )v(r ) = − V (r )χ α+ (r )
1
C

Cette équation est facilement résolue avec l'aide de la version particule libre de l'équation (14),
pour donner
(21) v(r ′) = (hC ) ∫ G0+ωα (r ′, r )V (r )χ α+ (r )d 3 r
−1

La combinaison de (17) et (21) montre que χ α+ satisfait une équation non homogène appelée
équation de Lippmann-Schwinger :
(22) χ α+ (r ′) = uα (r ′) + h −1 ∫ G0+ωα (r ′, r )V (r )χ α+ (r )d 3 r

En utilisant la version particule libre de (14), nous pouvons écrire cela symboliquement comme
(23) χ α+ = uα + (Eα − H 0 + iε ) Vχ α+
−1

Puisque H 0 est hermitique, ses valeurs propres sont réelles et l'opérateur inverse est non singulier
aussi longtemps que ε est fini.

L'équation (22) peut être itérée pour donner des séries infinies pour χ α+ :
χ α+ (r ′) = uα (r ′) + h −1 ∫ G0+ωα (r ′, r )V (r )uα (r )d 3 r
(24) + h − 2 ∫∫ G0+ωα (r ′, ri )V (ri )G0+ωα (ri , r )V (r )uα (r )d 3 ri d 3 r
+L
De même, l'équation (23) peut être manipulée symboliquement pour donner
(25) χ α+ = uα + (Eα − H + iε ) Vuα
−1

qui peut être écrit sous la forme


(26) χ α+ (r ′) = uα (r ′) + h −1 ∫ Gω+α (r ′, r )V (r )uα (r )d 3 r

L'équation (26) peut aussi être dérivée sans les relations symboliques.

Propagateur de particule libre


Afin d'utiliser des équations comme (22), nous avons besoin d'une expression explicite pour le
propagateur de particule libre G0+ω (r ′, r ) . Pour ω positif, la deuxième équation (13) devient
G0+ω (r ′, r ) = Sα (ω − ω α + iε ) uα (r ′)uα∗ (r )
−1

(27) µ
= 3 ∫
4π h
(k 2 − kα2 + iε ) exp[ik α ⋅ (r ′ − r )]d 3 kα
−1

où k ≡ 2 µω / h . A cause de l'invariance par translation spatiale de H 0 , G0+ω est une fonction


2

seulement de r ′ − r et non de r ′ et r séparément. L'intégration sur les angles de k α avec r ′ − r


comme axe polaire donne
µ
(28) G0+ω (r ′, r ) =

(k − kα2 + iε )
−1
kα sin kα ρ dkα
hρ ∫
2

π 2 0

où ρ ≡ r ′ − r . L'intégrale sur kα est plus facile à évaluer en étendant la limite inférieure à − ∞ , en


écrivant sin kα ρ sous forme exponentielle et en utilisant la méthode des résidus comme dans
l'évaluation de (11). Le résultat est
µ  2 µω 
1/ 2

(29) G0+ω (r ′, r ) = − r ′ − r exp(ik r ′ − r ) ω > 0 k = +


−1

2πh  h 
Pour ω négatif, le seul changement est dans le signe de i dans l'exponentielle et k = +(2 µ ω / h ) .
1/ 2

Donc pour ω à la fois positif et négatif, la substitution dans la première des équations (13) montre
que G0+ est une superposition d'ondes qui voyagent radialement vers l'extérieur de r à r ′ .

Amplitude de diffusion
L'amplitude de diffusion f (k r , k α ) peut maintenant être trouvée en comparant les formes
asymptotiques (21) avec (18). Nous notons que r est essentiellement restreint à des valeurs finies
puisque V (r ) apparaît dans l'intégrand de (21). Dons, dans l'exponentielle de G0+ωα nous avons
 r2 
(30) r ′ − r = r ′ − r cosθ ′ + O 
 r′ 
et dans le dénominateur
 r 
(31) r ′ − r = r ′ −1 + O 2 
 r′ 
où θ ′ est l'angle entre r ′ et r. L'équation (29) donne alors
µ
(32) G0+ωα (r ′, r ) → − exp[ikα (r ′ − r cosθ ′)]
r ′→ ∞ 2πhr ′
et la substitution dans (21) donne le comportement asymptotique
µ
(33) v(r ′) → − e ikα r ∫ e ikα r cos θ V (r )χ α+ (r )d 3 r
′ ′
r ′→∞ 2πh Cr ′ 2

Nous définissons maintenant un vecteur k β qui, comme le vecteur k r dans (18), a la grandeur kα
et la direction de r ′ , tel que kα r cosθ ′ = k β ⋅ r . La comparaison de (18) et (33) donne alors
µ
f (k β , k α ) = − exp(− ik β ⋅ r )V (r )χ α+ (r )d 3 r
2πh 2 C ∫
µ
∫ u β (r )V (r )χ α (r )d
∗ +
(34) = − 3
r
2πh C
2 2

µ
=− βTα
2πh 2 C
2

où l'élément de matrice T est défini dans l'équation (2). Puisque, en accord avec (17), u β et χ α+ ont
tous les deux une grandeur asymptotique C , l'amplitude de diffusion est indépendante du choix de
C, comme on s'y attend.

Comme nous l'avons déjà vu, la section efficace différentielle de diffusion du vecteur de
propagation initial k α au vecteur de propagation final k β est égal à f (k β , k α ) . Donc (34) est en
2

accord avec (9) quand la normalisation dans une boîte est utilisée.

Ondes entrantes
Il est facile de voir que les équations (19) à (29) peuvent être récrites correctement en faisant les
substitutions suivantes :
(35) χ α+ → χ α− G0+ωα (r ′, r ) → G0−ωα (r ′, r ) i → −i

En analogie avec (18), χ α− a la forme asymptotique d'une onde plane plus une onde entrante :

(36) χ α− (r ) → C exp(ik α ⋅ r ) + f
1 −
(k r , k α )e −ikα r 
r →∞
 r 

La comparaison des équations originales et récrites montre alors que si V est réel
(37) χ α+ (r ) = χ −−α∗ (r ) f (k r , k α ) = f −∗ (k r ,−k α )
où χ −−α est l'état renversé dans le temps de χ α+ et qui a le moment opposé − k α .
En considérant encore le cas où V est réel, nous pouvons récrire l'élément de matrice T en fonction
de χ β− . A partir des équations (2) et (25), nous avons
[
β T α = (u β ,Vχ α+ ) = (u β ,Vuα ) + u β ,V (E − H + iε )−1Vuα ]
[ ]
(38)
= (u β , Vuα ) + (E − H − iε ) Vu β ,Vuα
−1

où E = Eα = E β . La version récrite de (25) est


(39) χ β− = u β + (E − H − iε ) Vu β
−1

et ainsi (38) devient


(40) β T α = (χ β− , Vuα ) (avec V réel)

Il est quelque fois utile d'avoir disponible une expression similaire à (40) quand V est complexe.
Nous définissons donc des fonctions d'onde χ αT ± qui sont des solutions stationnaires de l'équation
de Schrödinger avec V remplacé par V ∗ :
χ αT ± = uα + (E − H 0 ± iε )−1V ∗ χ αT ±
(41)
( )
−1
= uα + E − H + ± iε V ∗ uα

χ −Tα− est l'état renversé dans le temps de χ α+ mais ne représente par un comportement physiquement
possible du système puisque H n'est pas invariant par renversement du temps. L'équation (40)
devient alors
(42) β T α = (χ βT − , Vuα ) (avec V complexe)

Matrice S dans le cas stationnaire


Une expression explicite pour l'élément de la matrice S peut être obtenue en autorisant que les
coupures de g (t ) dans (2) s'étendent à ± ∞ :
2πi
β (S − 1)α = − δ (ω β − ω α ) β T α
h
(43)
2πµ i
=− δ (k β − kα ) β T α
h 2 kα

Nous avons aussi besoin d'une expression pour β α qui, avec la normalisation continue, est
δ (k β − kα ) δ (θ β − θ α )
(44) β α = δ 3 (k β − k α ) = δ (φ β − φα )
kα2 sin θ α
où les fonctions de poids appropriés pour les coordonnées sphériques ont été inclues. Nous pouvons
maintenant combiner les équations (34), (43) et (44) avec C = (2π )
−3 / 2
pour obtenir l'élément de
matrice S :
δ (k β − kα )  δ (θ β − θ α ) 
δ (φ β − φα ) + α f (k β , k α )
ik
(45) β S α = 
 sin θ α 2π
2
kα 

L'équation (45), avec l'hypothèse que S est unitaire, peut être utilisée pour dériver le théorème
optique et le théorème optique généralisé.

Représentation moment angulaire


L'élément de matrice S (45) est exprimé en fonction des coordonnées polaires des vecteurs de
propagation initial et final :
(46) β S α = k β θ β φ β S kα θ α φα

Il peut être transformé en une représentation spécifiée par l'énergie (ou la grandeur du vecteur de
propagation) et le moment angulaire en utilisant la matrice de transformation unitaire :
(47) θφ lm = Ylm (θ , φ )

Nous avons alors


(48) k β l β m β S kα lα mα = Sθ β φ β Sθα φα l β m β θ β φ β k β θ β φ β S kα θ α φα θ α φα lα mα

Les symboles sommation généralisée sont dans cas des intégrations sur les angles qui incluent les
fonctions de poids sin θ β et sin θ α .

L'équation (48) prend une forme particulièrement simple si V est à symétrie sphérique car dans ce
cas S commute avec l'opérateur moment angulaire. L'amplitude de diffusion dépend seulement de
l'angle θ entre k α et k β et peut être écrite comme nous l'avions déjà vu

(49) f (k β , k α ) = ∑ (2l + 1)(e )


− 1 Pl (cosθ )
1 2 iδ l

2ikα l

Ici cosθ = cosθ β cosθ α + sin θ β sin θ α cos(φ β − φα ) et


4π l
(50) Pl (cosθ ) = ∑ Ylm (θ β , φ β )Ylm∗ (θ α ,φα )
2l + 1 m = − l

La substitution des équations (45), (47), (49) et (50) dans (48) donne
k β l β m β S kα lα mα
δ (k β − kα )
=
kα2 ∫∫∫∫ sin θ β dθ β dφ β sin θ α dθ α dφα Y β β (θ β , φ β )
l m

 δ (θ β − θ α )
( ) 
δ (φ β − φα ) + ∑ ∑ e l − 1 Ylm (θ β , φ β )Ylm∗ (θ α , φα )
l
2 iδ
(51) 
 sin θ α l m =−l 
Ylα mα (θ α , φα )
2 iδ l δ (k β − kα )
=e βα β α
δl l δm m
kα2
où nous avons utilisé l'orthonormalité des harmoniques sphériques.
Donc S est diagonal dans la représentation spécifiée par le nombre d'onde k (ou l'énergie) et les
nombres quantiques de moment angulaire l et m. On devait s'y attendre puisqu'un potentiel statique
à symétrie sphérique ne change ni l'énergie ni le moment angulaire durant le processus de diffusion.
On vérifie facilement que cette représentation de la matrice S est unitaire pourvu que les décalages
de phase soient réels, comme cela est le cas quand H est hermitique ou V réel. On notera aussi que
l'onde radiale entrante r −1e −ikr n'est pas modifiée dans l'analyse des ondes partielles tandis que
2 iδ
l'onde sortante pour un l particulier est multipliée par e l . Donc chaque élément diagonal de la
matrice de diffusion a une interprétation naturelle comme la modification d'une onde partielle
particulière sortante ou diffusée comparée à l'onde partielle incidente correspondante.
I.3.3.3. Calculs approchés
Dans la section précédente, une relation exacte entre les amplitudes de diffusion et les éléments de
la matrice T a été dérivée (relation (34)). L'élément de matrice T est en retour exprimé en fonction
de la solution sortante stationnaire χ α+ (r ) (relation (2)) et une série de perturbations infinie (relation
(24)) est disponible pour le calcul de χ α+ . Le premier ordre de cette série conduit à l'approximation
de Born qui consiste à remplacer χ α+ par uα . Nous allons d'abord montrer comment cette méthode
peut être appliquée dans des cas intéressants de diffusion par un potentiel puis nous montrerons
comment elle peut être généralisée pour traiter la diffusion par un système possédant des degrés de
liberté internes (diffusion électron - atome). Finalement, nous discuterons de l'approximation
eikonal qui est très proche de l'approximation WKB.

Approximation de Born
La procédure que nous venons de souligner conduit immédiatement à l'expression de Born pour
l'amplitude de diffusion :
µ
f B (k β , k α ) = − ∫ u β (r )V (r )uα (r )d
∗ 3
r
2πh C
2 2

(1)
µ
=− 2 ∫
V (r ) exp(iq ⋅ r )d 3 r q = kα − k β
2πh

Donc, l'amplitude de diffusion de Born est proportionnelle à la transformée spatiale de Fourier du


potentiel de diffusion par rapport à q, où hq est le transfert d'impulsion de la particule incidente au
potentiel de diffusion durant la collision. Cela rappelle la transformée de Fourier temporelle qui
apparaissait dans l'expression de perturbation pour les amplitudes de transition. Si le potentiel V est
à symétrie sphérique, (1) peut être simplifié en intégrant sur les angles de r par rapport à q comme
axe polaire. Dans ce cas, f B dépend seulement de l'angle θ entre k α et k β :
2µ ∞
(2) f B (θ ) = − r sin qr V (r )dr q = 2k sin 12 θ
h 2 q ∫0
où k est la grandeur de k α et k β .

Un exemple intéressant d'application de (2) est la diffusion élastique d'un électron par un atome
neutre qui est représenté par une forme simple de potentiel coulombien avec écran :
( )
V (r ) = − Ze 2 / r e − r / a . Il se comporte comme le potentiel coulombien nucléaire pour le nombre
atomique Z quand r est petit et diminue rapidement quand r est grand par rapport au "rayon" a du
nuage électronique de l'atome qui fait écran au noyau. La théorie statistique de Thomas-Fermi de
l'atome que nous verrons plus loin montre que pour des atomes modérément lourds, a est
approximativement égal à h 2 / me 2 Z 1 / 3 , où m est la masse de l'électron. La substitution de ce
potentiel dans (2) donne
2µ Z 2 ∞ 2 µ Ze 2
(3) f B (θ ) = 2 ∫ sin qr e − r / a dr = 2 2
h q 0 ( )
h q + a −2

La section efficace f B (θ ) est en accord avec le résultat de Rutherford que nous avions vu quand
2

le transfert d'impulsion est assez grand pour que 1 / a 2 puisse être négligé par rapport à q 2 dans le
dénominateur. Dans la situation classique analogue, l'électron incident passe suffisament près du
noyau pour que les électrons atomiques soient relativement inefficaces comme écran du potentiel
nucléaire.

La section efficace totale est plus facile à évaluer en changeant la variable d'intégration de θ à
q = 2k sin 12 θ , auquel cas sin θ dθ est remplacé par qdq / k 2 :
π 2π 2 k
σ = 2π ∫ f B (θ ) sin θ dθ = 2 ∫ f B (q ) qdq
2 2
0 k 0
(4)
16πµ Z e a
2 2 4 4
= 4
h (4k 2 a 2 + 1)

Avec l'expression de Thomas-Fermi ci-dessus pour a et en négligeant la différence entre m et µ , la


section efficace totale devient 4πZ 4 / 3 / k 2 à grande énergie (ka >> 1). L'ordre de grandeur est en
accord avec le résultat d'une intégration numérique de la diffusion produite par le potentiel de
Thomas-Fermi.

Validité de l'approximation de Born


Puisque la seule approximation utilisée ci-dessus est le remplacement de χ α+ par uα dans l'élément
de matrice T, un critère pratique pour la validité de l'approximation de Born peut être obtenu en
exigeant que v(r ) dans l'équation (17) de la section précédente soit petit par rapport à
exp(ik α ⋅ r ) = 1 .

Nous devons utiliser la théorie des perturbations pour estimer v(r ) , en utilisant la relation (21) de la
section précédente et en remplaçant χ α+ par uα dans l'intégrand. Il est alors plus facile de faire cette
estimation en r = 0 et c'est satisfaisant puisque v(r ) est le plus grand au centre du potentiel de
diffusion. Le critère de validité résultant est probablement suffisant mais on risque d'être plus
exigeant que ce qui est réellement requit. Par exemple, la diffusion à petit angle (faible transfert
d'impulsion) peut être donnée correctement par l'approximation de Born même quand la diffusion a
grand angle ne l'est pas.

Nous obtenons de cette manière


v(0 ) ≈ (hC ) ∫ G0+ωα (0, r )V (r )uα (r )d 3 r
−1

µ ∞ 1
(5) = − 2 ∫ ∫ e ikr V (r )e ikrw rdrdw
h 0 −1

µ
(e∞
− 1 V (r )dr )
k∫
=− 2
2 ikr

h 0

où w est le cosinus de l'angle entre k α et r. Avec le potentiel utilisé ci-dessus substitué dans (5), la
condition v(0) << 1 devient
2 µZe 2 ∞ dx
(6) ∫ sin xe ix − x / ka << 1
h2k 0 x
où x = kr remplace r comme variable d'intégration. Pour ka << 1, cela devient 2 µ Ze 2 a / h 2 << 1 ce
qui, avec l'expression approchée de a précédente, est équivalent à Z 2 / 3 << 1 . Donc l'approximation
de Born ne peut pas être utilisée pour la diffusion d'électrons lents par des atomes. Pour ka >> 1, le
( )
critère devient Ze 2 / hv ln ka << 1 et l'approximation est utile pour des électrons rapides aussi
longtemps que Z n'est pas trop grand. Il s'avère que ce résultat est essentiellement inaffecté par la
théorie de la relativité. Donc l'approximation de Born devient médiocre pour les éléments lourds
car v ne peut pas excéder c et e 2 / hc = 1 / 137 .

Diffusion par deux potentiels


Il est quelque fois utile d'écrire le potentiel comme la somme de deux parties, V = V1 + V2 , et
d'exprimer alors les éléments de la matrice T comme la somme de deux parties venant de V1 seul et
un terme de correction. Une telle procédure est utile si l'équation de Schrödinger pour V1 est en soit
exactement soluble et si V2 est suffisament petit pour être regardé comme une perturbation. Par
exemple, V1 peut être l'interaction coulombienne entre un électron et un noyau ponctuel de
grandeur Z et V2 est l'interaction électrostatique supplémentaire venant du fait que le noyau a une
taille finie. Un autre exemple est celui où V1 peut être l'interaction nucléaire forte à courte portée
entre deux protons pour laquelle seul un petit nombre d'ondes partielles a besoin d'être calculé et
V2 l'interaction coulombienne beaucoup plus faible.

Rappelons d'abord les relations (2), (42), (23) et (41) de la section précédente
( ) (
β T α = u β ,Vχ α+ = χ βT − ,Vuα )
(7) χ α+ = uα + (E − H 0 + iε ) Vχ α+
−1

χ βT − = u β + (E − H 0 − iε )−1V ∗ χ βT −
où E = Eα = E β . Nous pouvons alors substituer u β dans la première des expressions (7) pour
β T α en utilisant l'équation
(8) χ 1Tβ− = u β + (E − H 0 − iε ) V1∗ χ 1Tβ−
−1
qui décrit la diffusion par V1 seul. Le résultat est
β T α = [u β , (V1 + V2 )χ α+ ]
[ ] [
(9) = χ 1Tβ− , (V1 + V2 )χ α+ − (E − H 0 − iε ) V1∗ χ 1Tβ− , (V1 + V2 )χ α+
−1
]
= [χ T−
1β , (V1 + V2 )χ α+ ] − [χ T−
1β ,V1 (E − H 0 − iε ) (V1 + V2 )χ α+
−1
]
( )
Nous notons maintenant que (E − H 0 + iε ) (V1 + V2 )χ α+ est égal à χ α+ − uα et que χ 1Tβ− , V1uα est
−1

égal à β T1 α , l'élément de matrice T qui décrit la diffusion par V1 seul. Nous obtenons donc
(10) β T α = β T1 α + (χ 1Tβ− ,V2 χ α+ )
qui est exact.

Approximation de Born de l'onde déformée


L'équation (10) est surtout utile quand V2 est petit, auquel cas le second terme est donné au premier
ordre en V2 en remplaçant χ α+ par χ 1+α . Cela donne l'élément de matrice T dans l'approximation de
Born de l'onde déformée (DWBA avec l'expression en anglais) :
(11) β T α ≈ β T1 α + (χ 1Tβ− ,V2 χ 1+α )

La forme de (11) est raisonnable et donne le terme de correction β (T − T1 )α comme un élément


de matrice du second potentiel entre des états qui sont déformés par le premier potentiel.
Cependant, il peut sembler étrange au premier abord que l'élément de matrice doive être calculé
entre un état initial qui est asymptotiquement une onde plane plus une onde sphérique sortante et un
état final qui est asymptotiquement une onde plane plus une onde sphérique entrante, plutôt
qu'entre deux états de type sortant. Ce résultat peut être rendu physiquement plausible de la manière
suivante.

Le calcul a pour but de donner l'amplitude de probabilité pour une transition dans laquelle V2 cause
une diffusion dans la direction k β . Cependant, si la fonction d'onde de l'état final doit être du type
sortant, on devrait s'attendre à ce qu'une portion de cette amplitude soit associée à des diffusions
dans d'autres directions que k β puisque toutes les directions sont inclues dans l'onde sphérique
sortante. De la même manière une portion de l'amplitude de probabilité dans la direction k β
devrait être incluse dans le calcul des états finaux des autres directions, puisque leurs ondes
sortantes devraient inclure des contributions à la diffusion dans la direction k β . La seule manière
d'éviter cette situation est de choisir une fonction d'onde de l'état final de telle manière qu'elle ne
contienne pas d'onde sphérique sortante. C'est possible seulement si la fonction d'onde est
asymptotiquement une onde plane plus une onde sphérique entrante.

Analyse en ondes partielles de la DWBA


Si V1 et V2 sont à symétrie sphérique, l'approximation de Born d'onde déformée peut être exprimée
en fonction des décalages de phase δ l qui sont associés à V1 seul. Un prolongement simple des
résultats déjà obtenus montre que nous pouvons exprimer χ 1+α (r ) et χ 1Tβ− (r ) comme suit :

χ 1+α (r ) = C ∑ (2l + 1)i l Rl (r )Pl (cosθ α )
l =0

 
→ C exp(ik α ⋅ r ) + f (k r , k α )e ikr 
1
r →∞
 r 

χ 1Tβ− (r ) = C ∑ (2l + 1)i l Rl∗ (r )Pl (cosθ β )
l =0

(12) → C exp(ik β ⋅ r ) + f T − (k r , k β )e −ikr 


 1 
r →∞
 r 

∑ (2l + 1)(e )

f (k r , k α ) = (2ik ) − 1 Pl (cosθ α )
−1 2 iδ l

l =0

f T − (k r , k β ) = (2ik )
−1
∑ (2l + 1)(− 1) (1 − e

l =0
l 2 iδ l∗
)P (cosθ
l β )

sin (kr − 12 lπ + δ l )
e l
Rl (r ) →
r →∞ kr

Ici, k = kα = k β , θ α est l'angle entre r et k α et θ β est l'angle entre r et k β . Notons que, pour tout
angle θ , f (θ ) = f T −∗ (π − θ ) .

La substitution de (12) dans le deuxième terme de (11) donne


( )
∞ ∞
(13) χ 1Tβ− , V2 χ 1+α = 4π C ∑ (2l + 1)P (cosθ )∫ V2 (r )Rl2 (r )r 2 dr
2
l
0
l =0

où θ est l'angle entre k β et k α et nous avons utilisé le théorème d'addition pour les polynômes de
Legendre. L'équation (13) n'est pas très pratique pour les calculs car c'est une série infinie sur l
même quand V1 est de courte portée tel que seuls quelques δ l sont différents de zéro. Cela suggère
de soustraire V2 (r ) j l2 (kr ) de chaque intégrand et de les ajouter dans une série de compensation.
[ ]
Puisque Rl (r ) est égal à jl (kr ) si δ l = 0 , cela signifie que ∫ V2 (r ) Rl2 (r ) − jl2 (r ) r 2 dr est zéro sauf
si δ l est différent de zéro. De plus, la série de compensation qui a été ajoutée peut être sommée en
utilisant la formule

(14) ∑ (2l + 1) jl2 (kr )Pl (cosθ ) =
sin qr
q = 2k sin 12 θ
l =0 qr
et cela conduit à l'approximation de Born pour l'amplitude pour V2 seul.

La combinaison de l'équation (34) de la section précédente et des équations (2), (11), (13) et (14)
conduit à l'approximation de Born de l'onde déformée pour la diffusion à symétrie sphérique :
f DWBA (θ ) = f1 (θ ) + f 2 B (θ )
(15) 2 µ ∞ ∞
[ ]
− 2 ∑ (2l + 1)Pl (cosθ )∫ V2 (r ) Rl2 (r ) − jl2 (kr ) r 2 dr
h l =0 0

Ici, f1 est l'amplitude de diffusion exacte pour V1 seul et f 2 B est l'approximation de Born de
l'amplitude pour V2 seul. La série représente l'effet de déformation de l'onde plane produite par V1
sur la diffusion au premier ordre causée par V2 . Les seules valeurs de l qui apparaissent dans la
série sont celles pour lesquelles δ l ≠ 0 . On notera que les intégrales dans (13) et (15) convergent
seulement si V2 diminue plus vite que 1/r pour r grand et on doit donc faire particulièrement
attention lorsque V2 est un potentiel coulombien non écranté.

Expression approchée pour les décalages de phase


Nous revenons maintenant au cas où le potentiel n'est pas divisé en deux parties. Si V est à symétrie
sphérique, nous pouvons substituer les développements

χ α+ (r ) = C ∑ (2l + 1)i l e l Rl (r )Pl (cosθ α )

l =0
(16) ∞
u β (r ) = C ∑ (2l + 1)i l jl (kr )Pl (cosθ β )
l =0
dans l'équation (34) de la section précédente, où θ α est l'angle entre r et k α et θ β est l'angle entre
r et k β . Nous obtenons donc l'expression exacte suivante pour l'amplitude de diffusion :
2µ ∞ ∞
(17) f (θ ) = − 2 ∑ (2l + 1)Pl (cos θ )∫ V (r )Rl (r ) j l (kr )r 2 dr
h l =0 0

La comparaison avec l'amplitude de diffusion que nous avions vue en fonction des décalages de
phase montre que ceux-ci sont donnés par
2 µk ∞
(18) e l sin δ l = − 2 ∫ V (r )Rl (r ) jl (kr )r 2 dr

h 0

Une expression approchée pour δ l valide au premier ordre en V, peut être obtenue en remplaçant le
coté complet à gauche de (18) par δ l et Rl (r ) par jl (kr ) dans l'intégrand sur le coté droit. C'est
l'approximation de Born pour les décalages de phase :
2 µk ∞
(19) δ Bl = − 2 ∫ V (r ) jl2 (kr )r 2 dr
h 0

Il peut arriver que les premiers décalages de phase soient suffisamment grands pour que (19) ne soit
pas une bonne approximation et les δ l restants sont petits mais non négligeables. Dans ce cas on
peut récrire l'amplitude comme
(20) f (θ ) ≈ f B (θ ) +
1 ∞

2ik l =0
( )
(2l + 1) e 2iδ l − 1 − 2iδ Bl Pl (cosθ )
où nous avons utilisé (2), (14) et (19). Chaque terme dans la somme sur le coté droit de (20) est
zéro au premier ordre en V ou δ l et ainsi seuls quelques termes ne s'annulent pas dans le cas
présent.

Diffuseur avec des degrés de liberté internes


Nous allons maintenant étendre le formalisme de la matrice T au cas où le diffuseur a des degrés de
liberté internes. Il peut donc être excité durant le processus de diffusion. Par exemple, un électron
peut être diffusé par un atome qui est initialement dans son état de base et qui, après la diffusion,
peut rester dans son état de base (diffusion élastique) ou être dans un état excité (diffusion
inélastique). Cependant, dans tous les cas, l'énergie totale de l'électron et de l'atome est conservée et
nous allons donc travailler avec une situation stationnaire. Nous écartons ici la possibilité que
l'électron incident change de place avec l'électron atomique. Nous reviendrons sur cette situation un
peu plus tard.

Nous divisons l'hamiltonien total en une partie H 0 qui décrit le mouvement interne du diffuseur
ainsi que l'énergie cinétique du mouvement relatif de la particule incidence et du diffuseur, et une
partie H ′ qui représente l'interaction entre les deux. Par exemple, dans la diffusion d'un électron
(coordonnées r1 ) par un atome d'hydrogène (électron atomique de coordonnée r2 ), nous avons
H = H0 + H ′
h2 2 h2 2 e2
(21) H 0 = − ∇1 − ∇2 −
2µ 2m r2
e2 e2
H′ = −
r12 r1

La distinction entre la masse réduite µ du système électron - atome et la masse de l'électron m est
peu importante mais pourrait être significative dans une collision nucléaire.

Les fonctions propres de H 0 sont spécifiées par deux paramètres :


H 0 uαa = Eαa uαa
(22) uαa (r1 , r2 ) = C exp(ik α ⋅ r1 )wα (r2 )
h 2 kα2
Eαa ≡ hω αa = + εa

où wa et ε a sont une fonction propre et une valeur propre typiques de l'hamiltonien du diffuseur.
La fonction propre correspondant de H qui correspond aux ondes sortantes a la forme asymptotique
 
(23) χ α+a (r1 , r2 ) → C exp(ik α ⋅ r1 )wa (r2 ) + ∑ r1−1e r 1 f (k r , b, k α , a )wb (r2 )
ik r
r →∞
 b 
Ici k r est un vecteur dont la direction est celle de r1 et dont la grandeur est donnée par la relation
de conservation de l'énergie (h 2 k r2 / 2 µ ) + ε b = Eαa . L'amplitude f avec b = a décrit la diffusion
élastique et celles avec b ≠ a décrivent la diffusion inélastique.

Sections efficaces élastiques et inélastiques


La fonction d'onde χ α+a satisfait une équation de Lippmann-Schwinger qui est une généralisation
évidente de celle liée à la diffusion élastique :
(24) χ α+a (r1′, r2′ ) = uαa (r1′, r2′ ) + h −1 ∫∫ G0+ωαa (r1′, r2′ , r1 , r2 )H ′(r1 , r2 )χ α+a (r1 , r2 )d 3 r1 d 3 r2

Le propagateur associé à H 0 peut être obtenu en généralisant l'équation (13) de la section


précédente et en utilisant l'analyse qui a conduit à la relation (29) de la section précédente :
G0+ωαa (r1′, r2′ , r1 , r2 ) = S β S b (ω αa − ω β b + iε ) u β b (r1′, r2′ )uω∗ b (r1 , r2 )
−1

µ
= S b wb (r2′ )wb∗ (r2 ) (k b2 − k β2 + iε ) exp[ik β ⋅ (r1′ − r1 )]d 2 k β
−1
3 ∫
4π h
µ
exp(ik b r1′ − r1 )
(25)
=− Sb wb (r2′ )wb∗ (r2 ) r1′ − r1 −1

2πh
 2 2µ
1/ 2

k b = + kα + 2 (ε a − ε b )
 h 
où k b a été tiré de la conservation de l'énergie.

Il n'y a plus maintenant qu'à prolonger la dérivation de l'équation (34) de la section précédente à la
situation actuelle. La substitution de (25) dans (24) et la comparaison de sa forme asymptotique
avec (23) conduit à
µ
(26) f (k r , b, k α , a ) = − wb∗ (r2 )H ′(r1 , r2 )χ α+a (r1 , r2 )d 3 r1d 3 r2
− ikb r1 cos θ ′

2πh C ∫∫
2
e
où θ ′ est l'angle entre k r ou r1′ et r1 . Nous définissons maintenant un vecteur k β qui a la
grandeur de k b et la direction de r1′ , ce qui donne
µ
f (k β , b, k α , a ) = − β b T αa
2πh 2 C
2
(27)
β b T αa = ∫∫ u β∗ b (r1 , r2 )H ′(r1 , r2 )χ α+a (r1 , r2 )d 3 r1 d 3 r2

Les équations (27) sont une généralisation évidente de l'équation (34) de la section précédente. De
plus, une généralisation à des diffuseurs avec plusieurs coordonnées internes peut facilement être
faite.

La section efficace différentielle élastique est obtenue de la forme asymptotique de χ α+a et est égale
au carré de la grandeur de l'amplitude f pour laquelle b = a :
(28) σ (k β , a, k α , a ) = f (k β , a, k α , a )
2

En calculant la section efficace inélastique, cependant, on doit tenir compte du fait que le flux
incident est proportionnel à la vitesse relative initiale vα = hkα / µ tandis que le flux diffusé est
proportionnel à v β . Nous obtenons donc le même facteur multiplicatif v β / vα qui est apparu dans
la dérivation de l'équation (9) de la section précédente. Donc, la section efficace différentielle
inélastique est

(29) σ (k β , b, k α , a ) = f (k β , b, k α , a )
vβ 2

Diffusion d'électrons par l'hydrogène


Les équations (28) et (29) fournissent une description exacte de la diffusion électron - atome,
excepté que l'on a négligé l'échange entre l'électron incident et les électrons atomiques. Comme
avant, l'approximation de Born est obtenue en remplaçant χ α+a dans l'élément de matrice T (27) par
uαa . Les intégrales résultantes ne sont pas difficiles à évaluer dans le cas de l'hydrogène.
Les équations (21) et (22) donnent pour l'élément de matrice de Born
∫∫ u β b (r1 , r2 )H ′(r1 , r2 )uαa (r1 , r2 )d r1d r2
∗ 3 3

(30)  1 1
= C e 2 ∫∫ exp(iq ⋅ r1 ) −  wb∗ (r2 )wa (r2 )d 3 r1 d 3 r2
2

 r12 r1 

Il est pratique d'évaluer d'abord l'intégration sur r1 et, de plus, d'intégrer séparément les parties
1 / r12 et 1 / r1 . Cependant, on doit reconnaître que ces parties séparées ne sont pas absolument
convergentes puisque pour r1 grand (c'est-à-dire pour r1 >> r2 ), le comportement du premier
intégrand est comme celui du second, ce qui donne
exp(iq ⋅ r1 ) 3 4π ∞
(31) ∫
q ∫0
d r1 = sin qr1 dr1
r1

A cause de ce comportement similaire pour r1 grand, la différence entre les deux parties diminue
comme 1 / r12 plutôt que comme 1 / r1 et donc quand les deux sont pris ensembles, il y a en effet une
puissance supplémentaire de r1 dans le dénominateur de l'intégrand de (31) et l'intégrale converge.
−αr1
La facilité d'intégrer les deux parties séparément peut être retenue en introduisant un facteur e
dans l'intégrand de (30) et en prenant la limite α → 0 :
exp(iq ⋅ r1 ) 3 4π ∞ −αr 4π
(32) ∫ d r1 = lim ∫ sin qr1e 1 dr1 = 2
r1 α →0 q 0 q

Avec ce préambule, nous écrivons maintenant la partie 1 / r12 de l'intégration sur r1 dans (30)
comme
exp(iq ⋅ r1 ) 3 exp(iq ⋅ ρ ) 3 4π
(33) ∫ d r1 = exp(iq ⋅ r2 )∫ d ρ = 2 exp(iq ⋅ r2 )
r12 ρ q
où nous avons posé ρ = r1 − r2 et nous avons utilisé (32). L'élément de matrice de Born (30)
devient alors
4π C e 2
2

∫ [exp(iq ⋅ r ) − 1]w (r )w (r )d
∗ 3
(34) 2 2 b 2 a 2 r2
q

Les w sont les fonctions d'onde de l'atome d'hydrogène et elles ont une structure assez simple pour
que l'intégration sur r2 soit élémentaire.

Pour la diffusion élastique à partir de l'état de base, l'amplitude de Born est

(35)
2µ e 2
[(
f B (θ ) = − 2 2 1 + 14 q 2 a02 − 1
h q
−2
) ]
q = 2kα sin 12 θ k β = kα

La comparaison des équations (3) et (35) montre que le potentiel coulombien avec effet d'écran
utilisé au début de cette section ne fournit pas un très bon modèle pour l'hydrogène, bien qu'il soit
meilleur pour les atomes plus lourds.

Des résultats similaires peuvent être obtenus pour la diffusion inélastique. Pour la transition de
l'état de base 1s (n = 1, l = m = 0) au premier état excité 2s (n = 2, l = m = 0), le deuxième terme
dans l'intégrand de (35) est zéro à cause de l'orthogonalité des fonctions d'onde atomiques initiale et
finale, et l'amplitude est
8 2 µ a 02 e 2 2 2 9 −3
f B (θ ) = −
h2
(
q a0 + 4 )
(36)
3
q 2 = kα2 + k β2 − 2kα k β cosθ k β2 = kα2 − 2
4a 0

Dans le cas haute énergie, pour lequel l'approximation de Born est meilleure, kα a 0 est grand
comparé à l'unité, k β est pratiquement égal à kα et q est approximativement égal à 2kα sin 12 θ .
Alors (36) montre que l'essentiel de la diffusion se produit pour qa 0 ≤ 1 , ce qui est équivalent à
θ ≤ 1 / kα a0 . Au-delà, la section efficace différentielle diminue lorsque l'angle croît
approximativement comme cosec12 12 θ . C'est une décroissance beaucoup plus rapide avec l'angle
que la dépendance cosec 4 12 θ obtenue de la diffusion élastique (35). La différence vient du fait que
le noyau contribue à la diffusion élastique et de l'orthogonalité des fonctions d'onde initiale et finale
et que seul le nuage électronique beaucoup plus diffus est effectif dans le cas inélastique.

Les sections efficaces totales sont plus facilement obtenues en intégrant sur q plutôt que sur θ .
Cela peut être réalisé en utilisant la deuxième équation (36) pour remplacer sin θ dθ par
qdq / kα k β . Le résultat pour la diffusion élastique à haute énergie est 7π / 3kα2 , ce qui est environ
( )
cinq fois plus grand que la section efficace totale 1s  2s ( 23 ) 128π / 5kα2 . L'excitation des états
10

qui ont n = 2, l = 1 (transitions 1s  2p) est plus facilement calculée en choisissant les trois états
finaux ( m = 0,±1 ) avec leur axe polaire le long du vecteur de transfert d'impulsion q. Alors les
facteurs e ± iφ qui apparaissent dans les fonctions d'onde pour m = ±1 annulent ces éléments de
matrice et seul l'état avec m = 0 est excité. Cela correspond physiquement à l'incapacité pour
l'électron incident, dont la perte d'impulsion est le long de q, d'exercer un couple sur l'électron
atomique par rapport à cet axe.

La section efficace totale à haute énergie pour ce processus s'avère être ( 23 )12 (576π / kα2 )ln 4kα a0 .
L'apparition du logarithme vient d'un facteur supplémentaire 1 / q 2 dans la section efficace
différentielle. Donc, en comparaison de la diffusion 1s  2s, la diffusion 1s  2p est plus
prononcée aux petits angles et la diffusion totale diminue moins rapidement avec l'énergie aux
hautes énergies.

Production d'une trace dans une chambre à brouillard


Il semble surprenant au premier abord qu'un électron rapide, que nous pouvons supposer posséder
une impulsion définie (grandeur et direction) et qui donc ne peut pas être localisé dans l'espace,
puisse produire une trace étroite dans une chambre à brouillard. Ce phénomène peut être considéré
de différents points de vue. En accord avec le théorème d'Ehrenfest, nous pouvons représenter
l'électron par un paquet d'ondes dont le centre de gravité se déplace comme une particule classique.
Si la longueur d'onde est assez courte, le paquet peut être assez petit sans se disperser rapidement et
il interagira alors seulement avec les atomes qui sont disposés sur le chemin de son centre. Cela
implique que l'électron est représenté par une superposition d'ondes planes et donc a une incertitude
dans son impulsion qui permet à sa position d'être suffisamment bien définie.

Une autre approche consiste à décrire l'électron par une seule onde plane et de voir son interaction
avec le premier atome qu'il excite ou ionise comme une mesure de la position qui porte en elle une
certaine incertitude de l'ordre de la taille de l'atome. Juste après, l'électron est représenté par un
paquet, comme décrit ci-dessus, qui est bien localisé si le premier atome est assez grand par rapport
avec la longueur d'onde (ka >> 1).

Nous considérons ici en détail une troisième description dans laquelle l'électron et les atomes du
gaz de la chambre à brouillard sont traités comme des parties d'un seul système, ainsi nous ne
devons pas regarder une interaction atomique comme une détermination de la position qui change
la structure de la fonction d'onde de l'électron. Pour simplifier, nous supposerons qu'il y a
seulement deux atomes présents dans leur état de base et que leurs noyaux sont loin l'un de l'autre
et sont fixes dans l'espace. Nous calculons alors la section efficace pour un processus dans lequel
les deux atomes sont excités et l'électron diffusé de manière inélastique. Pour un électron incident
rapide, la théorie des perturbations peut être utilisée. Cependant, puisque les interactions d'un
électron avec les deux atomes sont distinctes, le processus ne se déroule pas au premier ordre et il
est nécessairement au second ordre. Le calcul est intéressant à la fois à cause de la réponse obtenue
et aussi parce qu'elle fournit un exemple instructif de la théorie des perturbations au second ordre.

Le résultat du calcul est que la section efficace est très petite sauf si l'impulsion de l'électron
incident est presque parallèle à la ligne qui joint les deux atomes et aussi si les impulsions initiales
et finales de l'électron sont presque parallèles. Ces trois directions peuvent avoir une dispersion
angulaire en radian qui est de l'ordre du rapport de la longueur d'onde de l'électron à la taille de
l'atome. C'est analogue au résultat obtenu plus haut pour les collisions inélastiques d'un électron
rapide avec un atome d'hydrogène : la dispersion angulaire de l'électron diffusé était grossièrement
de l'ordre de 1 / kα a 0 . C'est aussi en accord avec le processus de description en paquets d'ondes
puisqu'une localisation de l'électron par un atome de taille a dans la direction transverse à son
mouvement produit une incertitude dans la composante transverse de l'impulsion de grandeur h / a
et une dispersion angulaire de l'ordre de h / ap ≈ 1 / ka .
Théorie des perturbations au second ordre
La perturbation au premier ordre ou approximation de Born pour l'élément de matrice T (27) fut
obtenue en remplaçant χ α+a par uαa . De même, l'approximation au second ordre est obtenue en
remplaçant χ α+a par le second terme de la série perturbative analogue à l'équation (24) de la section
précédente, pour obtenir
(37) ∫∫∫∫ u β∗ b (r1′, r2′ )H ′(r1′, r2′ )G0+ωαa (r1′, r2′ , r1 , r2 )H ′(r1 , r2 )uαa (r1 , r2 )d 2 r1′d 3 r2′d 3 r1 d 3 r2
1
h

La substitution du propagateur peut être faite comme dans la première ligne de l'équation (25) où
maintenant les sommations sont sur γ et c plutôt que sur β et b. Nous obtenons donc pour la
contribution au second ordre de l'élément de matrice T (règle d'or n°1 de Fermi)
(38) Sγ S c (Eαa − Eγc + iε ) β b H ′ γ c γ c H ′ αa
−1

Cette expression peut être vue comme décrivant un processus en deux étapes dans lequel le système
fait une transition d'un état initial αa à tous les états intermédiaires possibles γ c sous l'influence
de la perturbation H ′ puis une transition similaire de γ c à l'état final β b . L'énergie est conservée
entre les états initiaux et finaux mais ne l'est pas nécessairement pour les états intermédiaires. Ils
ont seulement une existence transitoire et selon le principe d'indétermination il est impossible de
déterminer l'énergie de tels états de courte durée de vie avec précision. Donc, il n'est pas surprenant
que leur contribution à l'élément de matrice T au second ordre soit inversement proportionnelle à
cet écart en énergie. Des éléments similaires au second ordre étaient apparus dans l'étude de la
théorie des perturbations en relation avec la perturbation de niveaux d'énergie discrets.

La notation de (38) doit être généralisée avant de pouvoir l'appliquer à la situation actuelle.
L'hamiltonien pour l'électron et les deux atomes bien séparés est
H = H0 + H ′
h2 2
(39) H 0 = − ∇ + H 1 (1) + H 2 (2 )
2m
H ′(r,1,2 ) = H 1′ (r,1) + H 2′ (r,2 )
Ici r est la coordonnée de l'électron, H 1 est l'hamiltonien du premier atome, 1 indique toutes les
coordonnés internes de cet atome, et H 1′ est l'interaction entre l'électron et le premier atome. Le
second atome est décrit d'une manière similaire. L'expression (38) peut alors être écrite
1 2
(
(40) Sγ S c S c Eαa a − Eγc c + iε
1 2
−1
)
β b1b2 H ′ γ c1c 2 γ c1c 2 H ′ αa1a 2
1 2

Il est visible qu'il y a deux groupes possibles d'états intermédiaires γ c1c 2 : ceux pour lesquels le
premier atome a fait une transition de l'état a1 à l'état b1 sous l'influence de H 1′ ( c1 = b1 ) tandis que
le second atome n'a pas changé son état ( c 2 = a 2 ) et ceux pour lesquels c1 = a1 tandis que le
second atome a changé son état de a 2 à b2 sous l'influence de H 2′ ( c 2 = b2 ). Donc, l'élément de
matrice au second ordre peut être écrit
( )
Sγ Eαa1 − Eγ b1 + iε −1 β b2 H 2′ γ a 2 γ b1 H 1′ αa1 +
( )
(41)
Sγ Eαa2 − Eγ b2 + iε −1 β b1 H 1′ γ a1 γ b2 H 2′ αa 2
Evaluation des éléments de matrice au second ordre
Nous allons maintenant évaluer la première sommation de (41) explicitement et ensuite nous
indiquerons les changements à faire dans le résultat pour obtenir la deuxième sommation. Les
facteurs qui apparaissent peuvent être écrits en analogie avec (30) et (25)
γ b1 H 1′ αa1 = C ∫∫ exp(− ik γ ⋅ r + ik α ⋅ r )H 1′ (r,1)wb∗1 (1)wa1 (1)d 3 rdτ 1
2

β b2 H 2′ γ a 2 = C ∫∫ exp(− ik β ⋅ r ′ + ik γ ⋅ r ′)H ′ (r ′,2)w (2)w (2)d r ′dτ 2


2 ∗ 3
2 b2 a2

( )
(42) h2 2
Eαa1 − Eγ b1 + iε = κ − k γ2 + iε
2m
κ 2 ≡ kα2 −
2m
(
ε b − ε a1
h2 1
)
Alors, en analogie avec la dérivation de l'équation (27) de la section précédente, la sommation sur
γ peut être effectuée pour donner
2

exp(iκ r ′ − r − ik β ⋅ r ′ + ik α ⋅ r )d 3 r ′d 3 r
mC −1

(43)

2πh 2 ∫∫ r ′ − r
× ∫ wb∗2 (2 )H 2′ (r ′,2 )wa2 (2 )dτ 2 ∫ wb∗1 (1)H 1′ (r,1)wa1 (1)dτ 1

Le noyau du premier atome peut, sans perte de généralité, être placé à l'origine, et celui du second
atome au point R. Alors l'intégrale sur les coordonnées internes du premier atome sera très petite
sauf si r est proche de zéro et l'intégrale correspondante pour le second atome sera très petite sauf si
r ′ est proche de R. Nous écrivons donc
F1 (r ) ≡ ∫ wb∗1 (1)H 1′ (r,1)wa1 (1)dr1
(44)
F2 (r ′ − R ) ≡ ∫ wb∗2 (2 )H 2′ (r ′,2 )wa2 (2 )dr2

Les F sont très petits sauf quand leurs arguments diffèrent de zéro par des distances de l'ordre de la
taille des atomes. Nous posons r ′′ ≡ r − R de façon à ce que pratiquement toute la contribution de
(43) vienne des très petites valeurs de r et r ′′ . Nous pouvons alors obtenir le terme dominant de
(42) pour R grand par l'approximation
R ⋅ r ′′ R ⋅ r −1
(45) r ′ − r = R + r ′′ − r ≈ R + − r ′ − r ≈ R −1
R R

Il est utile de définir un vecteur κ qui a la grandeur κ définie ci-dessus et la direction de R. Alors
la substitution dans (43) donne
2

(46) −
mC 1
2πh R 2
[ ] [ ]
exp i (κ − k β ) ⋅ R ∫ F2 (r ′′) exp i (κ − k β ) ⋅ r ′′ d 3 r ′′∫ F1 (r ) exp[i(k α − κ ) ⋅ r ]d 3 r

De même, la deuxième sommation dans (41) devient


2

(47) −
mC 1
2πh R 2
[ ]
exp[i (κ ′ + k α ) ⋅ R ]∫ F2 (r ′′) exp − i (κ ′ + k β ) ⋅ r ′′ d 3 r ′′∫ F1 (r ) exp[i (k α + κ ′) ⋅ r ]d 3 r
où κ ′ est un vecteur dans la direction de R dont la grandeur est donnée par la dernière équation
(42) avec ε b1 − ε a1 remplacé par ε b2 − ε a2 .

La section efficace différentielle est obtenue en substituant la somme dans (46) et (47) à la place de
l'élément de matrice T dans l'amplitude de diffusion (27) puis dans (29). La conservation de
( )( )
l'énergie nécessite que k β2 = kα2 − 2m / h 2 ε b1 + ε b2 − ε a1 − ε a2 .

Discussion de la section efficace


Les intégrales qui apparaissent dans (46) et (47) ont la structure caractéristique associé au
traitement perturbatif des problèmes de collisions. Elles sont très petites sauf si le vecteur de
propagation qui apparaît dans l'exponentielle de l'intégrand a une grandeur de l'ordre de 1/a ou
moins, où a est une dimension linéaire typique de l'atome (F significativement différent de zéro). Il
s'ensuit que (46) est appréciable seulement quand les vecteurs k α , κ et k β sont presque égaux en
grandeur et direction. A cause de l'hypothèse que l'électron incident est rapide, les grandeurs sont
presque égales dans tout événement et de plus la direction de κ est la même que celle de R. Donc
la section efficace qui vient de (46) est appréciable seulement quand les vecteurs R et k β sont
presque parallèles à k α . On vérifie facilement que la déviation permise au parallélisme est de
l'ordre de 1 / kα a .

De même, il s'ensuit que (47) est appréciable seulement quand κ ′ , et donc R, est presque
antiparallèle à la fois à k α et k β , auquel cas ces deux vecteurs sont presque parallèles.

Les deux termes ensembles montrent que l'excitation des deux atomes se produit avec une
probabilité appréciable seulement quand la ligne joignant les deux atomes est presque parallèle à la
direction de l'électron incident. Il n'y a cependant pas de restriction supplémentaire à la localisation
des atomes puisque le choix de l'origine du système de coordonnés est arbitraire. Donc, bien que la
trace dans la chambre à brouillard ait une orientation bien définie dans l'espace, elle peut apparaître
n'importe où si l'électron incident est décrit par une onde plane. Il est visible aussi que la section
efficace diminue inversement comme le carré de la distance R entre les deux atomes, comme on
devait s'y attendre.
Approximation eikonal
La méthode des perturbations développées plus tôt dans cette section remplace χ α+ l'élément de
matrice T (équation (2) de la section précédente) par le premier ou les deux termes sur le coté droit
de l'équation (24) de la section précédente. Une approximation assez différente pour χ α+ peut aussi
être trouvée dans l'approximation WKB : la substitution dans l'élément de matrice T conduit alors à
l'approximation eikonal.

L'approximation WKB commence avec les solutions exactes (équation (6) dans la section sur
l'approximation WKB) et développe S (r ) , le logarithme de la fonction d'onde, en puissances de h
dans le cas à une dimension. Le terme dominant S 0 est une approximation de la phase de la
fonction d'onde et le terme suivant S1 est une approximation de sa grandeur. Un critère de validité
fut obtenu. A trois dimensions il correspond à l'exigence que
∇k
(48) 2 << 1 k (r ) ≡ + {2 µ [Eα − V (r )]}
1 1/ 2

k h

Physiquement, cela signifie que l'énergie potentielle change si lentement que l'impulsion locale
hk (r ) est sensiblement constante sur plusieurs longueurs d'onde.

Pour l'application ici, nous supposerons en plus que S1 peut être négligé par rapport à S 0 et que
V (r ) est partout petit par rapport à Eα . Nous avons donc une approximation haute énergie dans
laquelle V (r ) ne varie pas rapidement. On peut donc penser au premier abord que le résultat final
est équivalent à l'approximation de Born. Cependant, l'équation (5) montre qu'à haute énergie,

(hvα )−1 ∫0 V (r )dr doit être petit par rapport à l'unité pour que l'approximation de Born soit valide.
Ce paramètre peut être plus grand que l'unité pour un potentiel faible de longue portée même quand
V << Eα . L'approximation eikonal ne limite pas sa valeur et est ainsi supérieure à l'approximation
de Born.

Nous posons donc


iS 0 (r )
(49) χ α+ (r ) ≈ C exp (∇S 0 )2 = 2 µ [Eα − V (r )] = h 2 k 2 (r )
h

La solution de cette équation différentielle pour S 0 quand V peut être négligé est S 0 (r ) = hk α ⋅ r
où k α est tout vecteur de grandeur kα = (2 µ Eα / h 2 ) . Dans ce cas, χ α+ est simplement uα ,
1/ 2

comme on pouvait s'y attendre, et l'approximation de Born est obtenue. Il est utile de choisir l'axe
des z positifs le long de la direction de k α et donc S 0 (r ) = hkα z quand V peut être négligé.

Quand V est fini mais petit par rapport à Eα , nous pouvons essayer la solution approchée de (49)
suivante :
(50) S 0 (r ) ≈ hkα z − V ( x, y, z ′)dz ′
1 z
vα ∫z0
où la vitesse relative est vα = hkα / µ et z 0 est une constante à déterminer. L'intégrale est supposée
converger pour tout r et z 0 . La substitution de (50) dans la deuxième équation (49) montre que
cette dernière est satisfaite en dehors de termes d'ordre µV 2 / Eα . Ils peuvent être négligés par
rapport à 2 µV puisque V << Eα . Nous obtenons donc
 
(51) χ α+ (r ) ≈ C expi kα z − ( )
1 z
∫z0 V x , y , z ′ d z ′ 
 hvα 

Dans les limites des approximations introduites ci-dessus, (51) est une solution de l'équation de
Schrödinger mais elle n'est pas nécessairement de type sortant. Nous allons montrer maintenant que
χ α± est obtenu selon que z 0 est choisi comme m ∞ . Pour le voir, écrivons (51) sous la forme d'une
onde plane plus une onde diffusée :
  i z  
(52) uα (r ) + Ce ikα z  xp − ∫ V ( x, y, z ′)dz ′ − 1
  hvα 0  
z
Cette onde diffusée s'annule en dehors d'un tube dont le diamètre est celui du potentiel et qui est
centré sur l'axe z. Si nous choisissons z 0 = −∞ , l'onde diffusée asymptotique s'annule aussi dans la
moitié z négative du tube et elle est un multiple constant de e ikα z dans la moitié z positif et ainsi
elle représente une onde sortante. De même, si nous choisissons z 0 = +∞ , l'onde diffusée
asymptotique s'annule dans la moitié positive du tube et est une onde entrante dans la moitié
négative.

Comme remarqué ci-dessus, l'approximation eikonal va au-delà de l'approximation de Born en ce


que la différence de phase entre χ α+ et uα est prise en compte à l'ordre le plus bas aux hautes
énergies. Cela montre que l'approximation de Born est valide aux hautes énergies aussi longtemps
que cette différence de phase est petite comparée à l'unité :
(53) (hvα ) ∫ V ( x, y, z ′)dz ′ << 1 pour tout r
−1 z
 −∞ 

Ce critère est plus général que celui inféré de (5) puisqu'il est applicable quand V (r ) n'est pas à
symétrie sphérique. L'utilisation de χ α+ à la place de uα correspond à négliger le changement de
direction de la vitesse de la particule lorsqu'elle se déplace dans le potentiel et à l'inclusion de l'effet
du changement dans la grandeur de la vitesse pour autant qu'elle affecte la phase mais pas la
grandeur de la fonction d'onde.

Amplitude de diffusion et section efficace


La substitution de (52) dans l'équation (34) de la section précédente donne pour l'amplitude de
diffusion
µ  
(54) f (k β , k α ) ≈ − V (r ) expi q ⋅ r − V ( x, y, z ′)dz ′ d 3 r
1 z
2 ∫ ∫
2πh  hvα − ∞ 

On peut montrer que cette expression est valide seulement aussi longtemps que l'angle de diffusion
θ est petit comparé à (kα a )−1 / 2 , où a est le domaine du potentiel (on peut obtenir de meilleures
approximations que celle-ci). Dans ce domaine de θ , q ⋅ r peut être remplacé par q x x + q y y car
q x x et q y y sont ≤ kα aθ , qui peut être beaucoup plus grand que l'unité, tandis que q z z ≤ kα aθ 2 ,
est beaucoup plus petit que l'unité. L'intégration sur z peut alors être effectuée et conduit à
ik ∞ ∞ i (q x + q y )   i ∞ 
(55) f (k β , k α ) ≈ α ∫ ∫ e x y 1 − exp − ∫ V ( x, y, z )dz  dxdy
2π − ∞ −∞   hvα
−∞


La section efficace totale peut être obtenue de (56) à l'aide du théorème optique :

σ tot = Im[ f (k α , k α )] ≈

(56)
∞ ∞   1 ∞   1 ∞ 
2 ∫ ∫ 1 − exp − ∫ VI ( x, y, z )dz  cos  ∫ VR ( x, y, z )dz  dxdy
−∞ − ∞ −∞ −∞
  hvα   hvα 

Nous avons posé V = VR − iV I où VR est réel et VI est réel et positif.

Il est intéressant de voir si cette expression de la section efficace totale est consistante avec des
estimations plausibles de la section efficace élastique totale σ el et de la somme de la section
efficace d'absorption totale et de section efficace inélastique σ abs . Il est raisonnable de supposer
que, même si (55) n'est pas valide aux grands angles, l'amplitude y est très petite et presque toute la
contribution de σ el vient des petits angles. Nous pouvons poser q x ≈ k aθ cos φ , q y ≈ kα θ sin φ et
remplacer l'élément d'angle solide comme suit : sin θ dθ dφ ≈ θ dθ dφ ≈ dq x dq y / kα2 . Dans l'intérêt
de la simplicité, nous poussons l'approximation en étendant la limite sur q x et q y à ± ∞ . Nous
obtenons donc
f (k β , k α ) dq x dq y
1 ∞ ∞ 2
σ el ≈ ∫ ∫
kα2 − ∞ −∞

∞ ∞  1 ∞ 
(57) ≈ ∫ VI ( x, y, z )dz 
− ∞ ∫− ∞ ∫
1 − 2 exp − −∞
  hvα 
 1 ∞   2 ∞ 
× cos  ∫ VR ( x, y, z )dz  + exp − ∫ VI ( x, y, z )dz  dxdy
−∞ −∞
 hvα   hvα 

De même, on peut utiliser l'expression de σ abs que nous avons vue en substituant à ψ l'expression
(51) avec C = 1 et z 0 = −∞ :
∞ ∞ ∞  2 
VI ( x, y, z ) exp − VI ( x, y, z ′)dz ′ dxdydz
2 z
σ abs ≈ ∫ ∫ ∫ ∫
hvα −∞ −∞ −∞ −∞
 hvα 
(58)
∞ ∞  2 ∞ 
=∫ ∫ 1 − exp − ∫ VI ( x, y, z )dz  dxdy
−∞ −∞ −∞
  hvα 

Il est évident que (56), (57) et (58) sont en effet consistants.

Toutes les équations de (55) à (58) ont la forme d'intégrales sur les coordonnées transverses x et y.
Chaque paire x, y peut être vue comme définissant une trajectoire classique. A notre niveau
d'approximation c'est une ligne droite parallèle à l'axe z avec le paramètre d'impact b = x 2 + y 2 ( )
1/ 2

puisque, comme remarqué plus haut, le changement dans la direction de la vitesse de la particule
lorsqu'elle se déplace dans le potentiel a été négligée. L'amplitude de diffusion et les sections
efficaces sont alors des sommes de contributions pour tous les paramètres d'impacts possibles. Dans
∞ ∞ ∞
le cas où V est symétrique par rapport à l'axe z, ∫ ∫ dxdy peut être remplacé par 2π ∫ bdb . Par
− ∞ −∞ 0
exemple, (55) devient
∞   i ∞ 
(59) f (θ ) ≈ ikα ∫ J 0 (qb )1 − exp − ∫ V (b, z )dz  db
−∞
 hvα 
0

où J 0 est la fonction de Bessel ordinaire d'ordre zéro.

Absorbeur parfait
Un exemple simple des résultats précédents est fournit par un absorbeur parfait : un objet pour
−1 ∞
lequel même si VI << Eα , (hvα ) ∫ VI ( x, y, z )dz est si grand que l'exponentielle est négligeable
−∞
par rapport à l'unité pour toute trajectoire x, y passant par l'objet. Dans ce cas, il suit des équations
(56) à (58) que
(60) σ el ≈ σ tot ≈ A σ tot ≈ 2 A
où A est l'aire de la section de l'objet. Ce résultat est relié à ce que nous avions noté dans le cas de
la sphère rigide. Dans ce cas il n'y avait pas d'absorption, mais la diffusion élastique pouvait être
divisée en contributions égales πa 2 venant de la diffusion à symétrie sphérique par la sphère rigide
de rayon a et par un pic de diffraction dans la direction avant. Dans le cas présent il n'y a pas de
diffusion à grand angle mais la partie diffraction de la diffusion élastique est égale à l'absorption.

La dépendance angulaire de la diffusion par diffraction est facile à obtenir sur l'absorbeur qui est
une sphère de rayon a. L'équation (59) devient
(61) f (θ ) ≈ ikα ∫ J 0 (kα bθ )bdb = J 1 (kα aθ )
a ia
0 θ

La section efficace différentielle de diffusion élastique f (θ ) a un pic en θ = 0 de hauteur


2 1
4 kα2 a 4
et une largeur angulaire de l'ordre de 1 / kα a . La section efficace totale élastique peut à nouveau
être estimée en poussant la limite θ à ∞ , ce qui donne
∞ ∞
(62) σ el ≅ 2π ∫ f (θ ) θ dθ = 2πa 2 ∫ J 12 ( z ) = πa 2
2 dz
0 0 z
en accord avec (60).
I.3.3.4. Propriétés analytiques et relations de dispersion
La théorie des collisions stationnaire, développée et appliquée dans les deux sections précédentes,
travaille avec des éléments des matrices de diffusion et de transition pour des valeurs particulières
de l'énergie. Bien que l'essentiel de la discussion était concerné par des situations particulières, on a
signalé que des résultats généraux utiles pouvaient être obtenus de la symétrie supposée et de
l'unitarité de la matrice S. Des résultats généraux d'un type différent peuvent être obtenus de
l'hypothèse que les éléments des matrices S et T sont des fonctions analytiques de l'énergie et
d'autres paramètres physiques comme l'angle de diffusion et le moment angulaire, quand ces
paramètres sont vus comme des variables complexes. Ces résultats sont exprimés sous la forme des
relations de dispersion. Une relation de dispersion typique relie les éléments de la matrice T à
différentes valeurs physiques de l'énergie, c'est-à-dire, des énergies réelles plutôt que complexes.
La dépendance analytique supposée de l'élément de la matrice T en l'énergie même quand l'énergie
est complexe (et donc non physique) fournit un pont entre les valeurs physiques en utilisant le plan
complexe de l'énergie.

Donc une relation de dispersion peut être dérivée seulement après que le comportement analytique
de l'élément de matrice T a été établit ou conjecturé et donc que la position des pôles et des
branches de coupure et la dépendance asymptotique sont supposés être connus. Cela fut
initialement dérivé en optique par Kronig et Kramers. Le comportement analytique à la base des
relations de dispersion fut inféré de la causalité : l'affirmation qu'un signal lumineux a une vitesse
limite c et donc que le rayonnement électromagnétique diffusé ne peut pas dépasser l'onde
incidente. La causalité relie des événements qui se produisent à des moments différents et donc
relient les composantes de Fourier du champ électromagnétique qui correspondent à différentes
fréquences. Mais en mécanique quantique non relativiste, il n'y a pas de vitesse limite et donc pas
de causalité de ce type, ainsi on pourrait penser au premier abord qu'il n'y a pas de relations de
dispersion. Cependant, les solutions de l'équation de Schrödinger qui correspondent à différentes
valeurs de l'énergie ou du moment angulaire sont en fait reliées par l'hypothèse que l'énergie
potentielle est indépendante de ces paramètres (ou dans des situations plus compliquées, qu'elle a
une dépendance spécifiée à l'avance).
Dans cette section, nous allons d'abord considérer les propriétés analytiques d'un élément diagonal
de la matrice S dans la représentation moment angulaire. La dernière relation vue dans la section
sur la théorie des collisions stationnaire montre qu'il est égal à exp(2iδ l (k )) , ou le décalage de
phase l dépend de l'énergie ou de k. Quelques résultats utiles, incluant les relations de dispersion,
peuvent être dérivés immédiatement du comportement analytique établit. Nous obtiendrons alors
une relation de dispersion pour l'amplitude de diffusion en avant, qui est aussi valide quand le
potentiel est à symétrie sphérique. A l'aide du théorème optique, on peut relier la section efficace
différentielle pour la diffusion en avant (qui nécessite la connaissance des parties réelles et
imaginaires de l'amplitude) à une intégrale sur l'énergie de la section efficace totale.

Aucune tentative de rigueur mathématique ne sera faite et certains résultats nécessaires seront
affirmés sans preuve. Des dérivations plus détaillées et étayées peuvent être trouvées dans la
littérature.

Solutions radiales
La solution régulière de l'équation de Schrödinger radiale peut être spécifiée par ses conditions aux
limites près de l'origine :
r l +1
(1) φ l (l , r ) →
r →0 (2l + 1)!!

φ l (k , r ) est une fonction paire de k puisqu'elle dépend de k seulement à travers k 2 et elle est réelle
quand k est réel puisque V (r ) est supposé être réel. Nous travaillons avec φ l (k , r ) plutôt qu'avec la
solution proportionnelle rRl (r ) que nous avions introduite car les conditions aux limites de (1) sont
indépendantes de k. Cela signifie que l'on peut utiliser un théorème de Poincaré qui s'applique à la
solution d'une équation différentielle ordinaire comme l'équation de Schrödinger radiale avec la
propriété que la dépendance de l'équation en un certain paramètre k se manifeste à travers une
fonction complète de k, ici k 2 (une fonction complète d'une fonction intégrale de k est une fonction
analytique de k qui est régulière pour toute valeur finie de k). Selon ce théorème, une solution
spécifiée par une condition aux limites qui est indépendante de k est elle-même une fonction
complète de k. Donc, pour r fixé, φ l (k , r ) est une fonction complète de k tandis que rRl (r ) ne l'est
pas nécessairement.

φ l (k , r ) est une onde stationnaire et elle a la forme asymptotique d'une fonction sinusoïdale de kr.
Puisqu'il est utile d'avoir aussi des solutions en ondes progressives, nous définissons une autre
solution à travers une condition aux limites asymptotique :
(2) f l (k , r ) → i l e −ikr
r →∞

Elle est évidemment régulière à l'origine où elle est proportionnelle à rnl (kr ) et donc se comporte
comme r −l (pour l = 0, nous suivons la procédure utilisée lors de l'étude du puits de potentiel carré
et nous regardons la solution qui se comporte comme rj 0 (kr ) ∝ r à l'origine comme étant régulière
et nous regardons la solution qui se comporte comme rn0 (kr ) → constante comme étant
r →0
irrégulière).

Comme nous l'avions déjà remarqué, la forme asymptotique (2) nécessite que V (r ) diminue plus
vite que 1/r pour r grand. Il est aussi facile de voir que la dépendance en puissance de (1) nécessite
que V (r ) devienne infini moins rapidement que 1 / r 2 lorsque r → 0 . Nous supposerons les
conditions plus restrictives
∞ ∞
(3) ∫ r V (r ) dr < ∞ et ∫ r 2 V (r ) dr < ∞
0 0

et occasionnellement nous limiterons même le comportement asymptotique de V (r ) encore plus


sévèrement.

Excepté en k = 0, une troisième solution f l (− k , r ) est linéairement indépendante de f l (k , r ) et a la


forme asymptotique
(4) f l (− k , r ) → i l e ikr
r →∞
Donc, φ l (k , r ) peut être exprimée comme une combinaison linéaire de f l (± k , r ) . Cela correspond
à la procédure que nous avions suivie d'écrire rRl (r ) dans la région asymptotique comme une
combinaison linéaire de e ± ikr . Le rapport entre les coefficients de ces deux termes est
essentiellement l'élément de matrice S :
(5) S l (k ) ≡ e
2 iδ l ( k )

Donc, nous pouvons étudier les propriétés analytiques de S l (k ) en étudiant celles de f l (k , r ) et en


utilisant le fait que φ l (k , r ) est une fonction complète de k.

Les propriétés analytiques de f l (k , r ) peuvent être établies en travaillant avec une équation
intégrale qu'elle satisfait. La conclusion est que, pour r > 0 fixé, f l (k , r ) est une fonction analytique
de k qui est régulière dans la moitié inférieure du plan k complexe. Elle est aussi continue sur l'axe
réel excepté en k = 0. Si le potentiel satisfait non seulement (3) mais aussi la condition

(6) ∫ r V (r ) e µ r dr < ∞
0
la région de régularité inclut aussi la bande dans la moitié supérieure du plan k pour laquelle
Im k < 12 µ excepté un pôle d'ordre l en k = 0. De plus, si V (r ) s'annule asymptotiquement plus vite
que tout exponentielle, donc (6) est satisfait pour µ arbitrairement grand, alors k l f l (k , r ) est une
fonction complète de k pour tout r > 0 fixé. Cela se produit, par exemple, si V (r ) diminue comme
une fonction gaussienne pour r grand ou s'annule totalement pour r plus grand qu'une certaine
valeur finie de r.

Il suit de (2) et (4) et de la réalité de l'équation de Schrödinger que


(7) f l (− k , r ) = (− 1) f l (k , r )
∗ l

pour k réel. Si maintenant nous quittons l'axe réel mais que nous restons dans une région où
f l (k , r ) est analytique, nous notons que f l ∗ satisfait la même équation avec k ∗ que f l satisfait
avec k. Les conditions aux limites (2) et (4) sont alors consistantes pour k complexe si nous
remplaçons (7) avec
[ ]
(8) f l (− k ∗ , r ) = (− 1) f l (k , r )
∗ l

De même, le fait que φ l (k , r ) est une fonction complète de k qui est réelle pour k réel implique,
suivant le principe de réflexion de Schwarz, que
[ ]
(9) φ l (k ∗ , r ) = φ l (k , r )

pour tout k complexe fini.

Fonction de Jost
Comme remarqué juste après (4), φ l (k , r ) peut être exprimé comme une combinaison linéaire de
f l (± k , r ) . Nous écrivons cette combinaison sous la forme
[ ]
(10) φ l (k , r ) = 12 ik −l −1 f l (− k ) f l (k , r ) − (− 1) f l (k ) f l (− k , r )
l

qui est consistante avec l'exigence que φ l (k , r ) soit une fonction paire de k. Le coefficient f l (k ) est
appelé la fonction de Jost et elle est reliée à S l (k ) . Cette relation est obtenue en comparant la forme
asymptotique de (10)

[ ]
l +1
1 i 
(11) φ l (k , r ) →   f l (− k )e − (− 1) f l (k )e
−ikr l ikr

 
r →∞ 2 k

avec la forme asymptotique de rRl (r ) que nous avons vue :

(12) rRl (r ) → [
1 l +1 iδ l −ikr −iδ l
r → ∞ 2k
i e e − (− 1) e
l ikr + iδ l
]
Il suit de cette comparaison et de la définition (5) que
f (k )
(13) S l (k ) = e l = l
2 iδ ( k )

f l (− k )

Comme on peut s'y attendre en voyant (13), les propriétés analytiques de l'élément de matrice S
sont quelque peu plus compliquées que celles de la fonction de Jost. Par exemple, S l (k ) a
généralement des pôles à la fois aux pôles de f l (k ) et aux zéros de f l (− k ) .
Le conjugué complexe de (10) est
(14) [φ l (k , r )] = − 12 i (k ∗ )
∗ − l −1
[ f (− k ) f (k , r ) − (− 1) f (k ) f (− k , r )]
l l
l
l l

En substituant k ∗ à k dans cette équation et en utilisant les équations (8) et (9), nous trouvons que
[ ]
(15) f l (− k ∗ ) = f l (k )

Pour k réel, les équations (13) et (15) montrent que S l (k ) = 1 , ainsi la matrice S est unitaire et
δ l (k ) est réel, comme attendu d'un potentiel réel. Il s'ensuit aussi que
(16) f l (k ) = f l (k ) e
iδ l ( k )

pour k réel.

Nous voulons maintenant utiliser notre connaissance des propriétés analytiques de φ l (k , r ) et


f l (k , r ) pour déterminer les propriétés analytiques de f l (k ) . Pour réaliser cela, nous allons utiliser
(10), qui définit f l (k ) , pour obtenir une expression explicite de f l (k ) en fonction de φ l (k , r ) et
f l (k , r ) . Notons que pour équation de la forme de l'équation de Schrödinger radiale, le wronskien
∂ ∂
(17) W [ f l (k , r ), φ l (k , r )] ≡ f l (k , r ) φ l (k , r ) − φ l (k , r ) f l (k , r )
∂r ∂r
de toute paire de solutions de l'équation avec le même k est indépendant de r. La substitution de
(10) donne
(18) W [ f l (k , r ), φ l (k , r )] = 12 i (− k ) f l (k )W [ f l (k , r ), f l (− k , r )]
− l −1

Le wronskien sur le coté droit peut être évalué pour r grand en utilisant les formes asymptotiques
(2) et (4). Cela conduit à
(19) f l (k ) = k lW [ f l (k , r ), φ l (k , r )]
Les dérivées radiales de f l (k , r ) et φ l (k , r ) ont les mêmes propriétés analytiques par rapport à k
que les fonctions elles-mêmes. Donc, puisque φ l (k , r ) est une fonction complète de k, l'équation
(19) montre que f l (k ) a les mêmes propriétés analytiques que k l f l (k , r ) . Par exemple, si V (r ) a
une portée finie, f l (k ) est une fonction complète de k.

Facteur d'amplification
L'équation (16) montre que l'argument de la fonction de Jost complexe est le décalage de phase de
diffusion. Il est intéressant de noter que la grandeur f l (k ) a aussi une interprétation physique
simple. La comparaison de (11) et (12) montre que
kl
(20) rRl (r ) = φ l (k , r )
f l (− k )

Donc, lorsque r approche zéro, (1) montre que rRl (r ) approche r (kr ) / f l (− k )(2l + 1)!! tandis que
l

la solution libre rjl (kr ) approche r (kr ) / (2l + 1)!! . Donc, la grandeur de la fonction d'onde dans le
l

voisinage de l'unité est multipliée par le facteur 1 / f l (k ) pour prendre en compte le potentiel de
diffusion. Ce facteur d'amplification est important pour calculer l'effet de l'interaction entre les
particules dans l'état final de diffusion ou le processus de production de particules.

Fonction de Jost pour k grand


Les propriétés asymptotiques de f l (k ) ne seront pas établies ici et nous renvoyons le lecteur à la
littérature pour une analyse détaillée. Sur l'axe réel et dans la moitié inférieure du plan complexe k,
µ ∞
(21) f l (k ) → 1 + 2 ∫ V (r )dr
Im k ≤ 0
k →∞ kh 0
où on suppose que l'intégrale est finie.

Puisque V (r ) est réel, les équations (16) et (21) montrent que pour k réel
µ ∞
(22) δ l (k ) → − 2 ∫ V (r )dr
k →∞ kh 0

On peut le comparer à l'approximation de Born pour les décalages de phase. Pour l fixé dans la
limite des grands k, jl2 (kr ) peut être approché par 1 / 2k 2 r 2 excepté pour les valeurs les plus petites
de r. Il s'ensuit alors que l'approximation de Born est en accord avec (22).

Etats liés
Un état lié, s'il existe, est décrit par une solution régulière φ l (k , r ) pour laquelle k 2 est réel et
négatif et la dépendance en r pour r grand décroît exponentiellement. Cela signifie qu'un des deux
termes dans l'expression asymptotique (11) doit être zéro. On voit facilement que le même résultat
est obtenu dans les deux cas. Avec k = ±iκ , nous trouvons qu'un état lié est donné par
(23) φ (± iκ , r ) → 12 (− κ ) f l (iκ )e −κ r f l (− iκ ) = 0
− l −1
κ >0
r →∞

pourvu que k = iκ dans une région où f l (k ) est analytique reliée à l'axe réel. L'énergie d'un tel état
est − h 2κ 2 / 2 µ .

Nous en concluons dans ce cas qu'un zéro de la fonction de Jost sur l'axe k imaginaire négatif
correspond à un état lié. De plus, f l (iκ ) ne peut pas s'annuler puisque, selon (23), cela rendrait
φ l (iκ , r ) identiquement zéro. Donc l'élément de matrice S (13) a un zéro en k = −iκ et un pôle en
k = iκ . On peut montrer qu'un tel zéro et un tel pôle sont simples. Bien que tous les zéros
imaginaires négatifs de la fonction de Jost donnent des états liés, ce n'est pas vrai de tous les zéros
imaginaires négatifs ou des pôles imaginaires positifs de S l (k ) . Un exemple sera donné ci-dessous
en relation avec la théorie de la porté effective.

Relations de dispersion pour la fonction de Jost


La fonction f l (k ) − 1 est analytique pour Im k ≤ 0 si le potentiel satisfait la condition (3). De plus,
en accord avec (21), elle est d'ordre 1 / k lorsque k → ∞ . Nous pouvons donc utiliser le théorème
de Cauchy pour écrire
f l (k ′) − 1
(24) f l (k ) − 1 = −
1
∫ dk ′
2πi C k ′ − k
où le contour C est montré dans la figure (a) ci-dessous.

Puisque l'intégrale sur le demi-cercle s'annule à la limite où le rayon approche l'infini, l'intégrale de
contour peut être remplacé par une intégrale sur l'axe réel entier. On peut alors prendre la limite
lorsque k approche l'axe réel par dessous, en accord avec la figure (b) ci-dessus. Pour un rayon
infiniment petit du demi-cercle, l'intégrale sur l'axe réel est la valeur principale et l'intégrale sur le
demi-cercle est − πi[ f l (k ) − 1] . Donc (24) devient
∞ f (k ′ ) − 1
(25) f l (k ) − 1 = P ∫ l
i
dk ′ , k réel
π −∞ k ′ − k

Les équations qui relient les parties réelles et imaginaires de f l (k ) − 1 peuvent être trouvées en
prenant les parties réelles et imaginaires de (25) :
Im[ f l (k ′) − 1]
Re[ f l (k ) − 1] = −
1 ∞
P∫ dk ′
π −∞ k′ − k
(26)
1 ∞ Re[ f l (k ′) − 1]
Im[ f l (k ) − 1] = P ∫ dk ′
π −∞ k′ − k

Puisqu'elles obéissent aux relations (26), les parties réelles et imaginaires de f l (k ) − 1 sont dites
transformées de Hilbert l'une de l'autre. Les relations de dispersions (26) peuvent être utilisées
comme base d'un calcul approché, en partant de l'expression de Born pour les décalages de phase.
En accord avec la discussion suivant (20), f l (k ) = 1 en l'absence de potentiel de diffusion, et ainsi
Im[ f l (k ) − 1] = δ Bl (k ) + O(V 2 ). On peut substituer cette expression dans la première relation (26)
pour obtenir une expression approchée de Re[ f l (k ) − 1] . Alors, selon (16), le rapport de la partie
imaginaire à la partie réelle de f l (k ) donne une expression améliorée pour tan δ l (k ) .

Relation de dispersion pour ln f l (k )


Une autre relation de dispersion peut être obtenue en partant de ln f l (k ) au lieu de f l (k ) − 1 dans
(24). Si nous supposons pour le moment qu'il n'y a pas d'état lié, alors ln f l (k ) est aussi analytique
dans la moitié inférieure du plan et est d'ordre 1 / k lorsque k → ∞ . De (16), nous avons que
ln f l (k ) = ln f l (k ) + iδ l (k ) , où δ l (k ) est supposé être défini tel qu'il s'annule en k = ±∞ , en accord
avec (22). Alors, la première relation (26) devient
1 ∞ δ (k ′)
(27) ln f l (k ) = − P ∫ l dk ′
π −∞ k ′ − k

Nous ajoutons iδ l (k ) des deux cotés de cette équation, alors le coté gauche est ln f l (k ) et iδ l (k )
peut être remplacé sur le coté droit par
1 δ (k ′)
(28) − ∫ l dk ′
π C′ k ′ − k
où le contour C ′ est le petit demi-cercle dans la figure (b) ci-dessus. Nous obtenons donc
δ l (k ′)
(29) ln f l (k ) = −
1
dk ′
π∫k′ − k
C ′′

où le contour C ′′ est le contour complet montré dans la figure (b) ci-dessus. On peut aussi l'écrire
comme un intégrale sur l'axe réel entier :
1 ∞ δ l (k ′)
(30) ln f l (k ) = − ∫ dk ′
π − ∞ k ′ − k + iε
où la limite ε → 0 + est sous-entendue.

Effet des états liés


Jusqu'ici nous avons supposé qu'il n'y avait pas d'état lié. S'il y a des états liés avec les énergies
E n < 0 , ils produisent des zéros de f l (k ) en k = −iκ n avec κ n = + (− 2 µ E n / h 2 ) . Ces zéros de
1/ 2

f l (k ) conduisent à des points de branchements de ln f l (k ) et l'analyse précédente échoue. Nous


pouvons cependant définir une fonction de Jost réduite
k − iκ n
(31) f l (k ) ≡ f l (k )∏
n k + iκ n

telle que ln f l (k ) a le même comportement analytique et asymptotique que ln f l (k ) en l'absence


d'état lié. A la place de (16), nous avons maintenant f l (k ) = f l (k ) e iδ (k ) où f l (k ) = f l (k ) et
  iκ   iκ  
(32) δ l (k ) = δ l (k ) + i ∑ ln1 + n  − ln1 − n 
n   k   k 

Donc, la relation de dispersion (30) est valide quand des barres sont placées sur f l et δ l .

Nous substituons donc (32) dans l'intégrand de (30). Chacun des premiers groupes de logarithmes
introduit un point de branchement en k ′ = −iκ n et en k ′ = 0 , qui peuvent être reliés par une
coupure. Donc l'intégrale le long de l'axe réel peut être fermée par un demi-cercle infini dans le
demi-plan supérieur, qui ne donne aucune contribution. Le point de branchement en k ′ = 0 ne
cause pas de difficulté pour l'intégration le long de l'axe réel puisque cette intégration peut être vue
comme une valeur principale en k ′ = 0 dès le départ et le logarithme ne donne pas de contribution
dans le voisinage infinitésimal de l'origine. Il s'ensuit que chacun des premiers groupes de
logarithmes donne une intégrale zéro puisque le pôle en k ′ = k − iε est en dehors du contour. Les
points de branchement pour les seconds groupes de logarithmes sont en iκ n et 0, ainsi le contour
est fermé par un demi-cercle infini dans le demi-plan inférieur et contient le pôle en k − iε .

Nous en concluons alors que (30) avec des barres placées sur f l et δ l s'écrit comme suit :
∞ δ l (k ′)  iκ 
(33) ln f l (k ) = −
1
dk ′ + 2∑ ln1 − n 
π∫ −∞ k ′ − k + iε n  k 

La substitution de f l en fonction de f l avec (31) donne


∞ δ l (k ′)  κ n2 
(34) ln f l (k ) = −
1
π ∫−∞ k ′ − k + iε
dk ′ + ∑n 1 + k 2 
ln
 

L'équation correspondante analogue à (27) est


1 ∞ δ (k ′)  κ2
(35) ln f l (k ) = − P ∫ l dk ′ + ∑ ln1 + n2 
π −∞ k ′ − k n  k 

L'équation (34) rend possible le calcul de f l (k ) et donc aussi de S l (k ) en fonction des décalages de
phase et des énergies des états liés − h 2κ n2 / 2 µ . De même, le facteur d'amplification 1 / f l (k ) peut
être calculé à partir de (35).

En utilisant ces équations, nous notons de (15) et (16) que pour k réel,
si f l (k ) ≠ 0
iδ l ( − k ) − iδ l ( k )
(36) e =e

Maintenant, il est pratique de continuer notre convention précédente que δ l (k ) s'annule en k = ±∞ .


C'est en accord avec (22). Il suit alors de (36) que δ l (− k ) = −δ l (k ) pour k réel. Cependant, cela
n'implique pas nécessairement que δ l (0 ) = 0 car les valeurs limites de δ l (k ) lorsque k approche
zéro des deux cotés n'ont pas besoin d'être les mêmes. Nous étendons donc notre convention
comme suit :
(37) δ l (− k ) = −δ l (k ) pour k ≠ 0 réel, δ l (k ) → 0
k →∞

Théorème de Levinson
Il y a une relation intéressante entre le nombre nl d'états liés pour l donné et le décalage de phase
correspondant δ l (0 ) à énergie zéro, défini comme la limite avec k positif. Nous supposons pour le
moment que f l (k ) ≠ 0 et nous formons l'intégrale de contour
f l′(k )
d [ln f l (k )]
1 1
(38) − ∫
2πi C f l (k )
dk = −
2πi ∫C
où le contour C est celui montré dans la figure (a) plus haut. L'intégrand a des pôles simples de
force unité aux zéros de f l (k ) , dont chacun correspond à un état lié. Donc l'intégrale sur le coté
gauche est égale à nl . Comme avant, nous pouvons poser ln f l (k ) = ln f l (k ) + iδ l (k ) . f l (k ) change
de manière continue et l'intégrale de contour de ce terme sur le coté droit est zéro. En accord avec
(37), δ l (k ) change de manière continue de δ l (0 ) à une extrémité du contour juste à droite de
l'origine à − δ l (0 ) à l'autre extrémité juste à gauche de l'origine, ainsi l'intégrale est égale à
− 2iδ l (0 ) . Nous obtenons donc une partie du théorème de Levinson :
(39) δ l (0 ) = πnl f l (0 ) ≠ 0

Pour la situation exceptionnelle où f l (0 ) = 0 , le contour doit être complété par un demi-cercle de


rayon infinitésimal ε dans le demi-plan inférieur. Il est encore vrai que la partie réelle de
l'intégrand, ln f l (k ) , ne contribue pas à l'intégrale. Il y a, cependant, une contribution
supplémentaire de l'intégrale de la partie imaginaire autour du demi-cercle infinitésimal. Afin de la
calculer, nous devons savoir comment f l (k ) approche de zéro lorsque k → 0 . On peut montrer
que si f l (0 ) = 0 , alors f l (k ) ≈ ak q , où q = 1 pour l = 0 et q = 2 pour l > 0 . Si nous posons
k = ε e iφ sur le demi-cercle, où φ va de π à 2π , la partie imaginaire de ln f l (k ) est qφ et
l'intégrale sur le demi-cercle est ιπq . Donc l'intégrale complète (38) avec le contour supplémentaire
est égale à
(40) δ l (0 ) − 12 q
1
π

Avec l = 0 , le zéro de f 0 (k ) en k = 0 ne correspond pas à un état lié. La situation est ici similaire
au cas de la diffusion résonante dont nous avions déjà discuté. En l'absence d'une barrière
centrifuge ( l = 0 ) et avec un potentiel qui obéit à (3) (tel que V diminue plus vite que 1 / r 3 ), la
fonction d'onde "fuit". Alors n0 est égal à (40) avec q = 1 , et ainsi
(41) δ 0 (0 ) = π (n0 + 12 ) f 0 (0 ) = 0

Avec l > 0 , le zéro de f l (k ) en k = 0 correspond à un état lié puisque la barrière centrifuge


empêche une fonction d'onde d'énergie zéro de fuir. Alors, puisque cet état a été exclut par le
contour supplémentaire, nl est plus grand d'une unité que (40) avec q = 2 , c'est-à-dire que nl est
égal à δ l (0 ) / π . C'est le même que (39) et ainsi nous pouvons rassembler les différents cas comme
δ l (0) = π (nl + 12 ) l = 0, f l (0 ) = 0
(42)
δ l (0) = πnl autrement

Les équations (42) sont la formulation complète du théorème de Levinson.

Portée effective
Comme exemple explicite simple de fonction de Jost, considérons
k + iκ
(43) f 0 (k ) =
k − iα
où κ et α sont réels et positifs (nous négligeons toute déviation de f l (k ) de l'unité pour l > 0).
Notons que ce f 0 (k ) a le comportement asymptotique (21) correct, qu'elle a un zéro simple en
k = −iκ qui correspond à un état lié d'énergie − h 2κ 2 / 2 µ et qu'elle est analytique excepté pour un
pôle simple en k = iα . L'équation (47) peut aussi être écrite
1/ 2
 k2 +κ 2 
f 0 (k ) =  2
iδ 0 ( k )

2 
e
(44)  k + α 
κ α k (κ + α )
δ 0 (k ) = tan −1 + tan −1 = tan −1
k k k 2 − κα

L'information de diffusion à basse énergie, particulièrement en physique nucléaire, est souvent


présentée comme un développement en série de k cot δ 0 (k ) en puissances de k 2 .

(45) k cot δ 0 (k ) = − + 12 r0 k 2 + L
1
a
où a est appelé la longueur de diffusion et r0 la portée effective. Il suit de la deuxième équation (44)
que
κα k2
(46) k cot δ 0 (k ) = − +
κ +α κ +α
et la formule de portée effective décrit exactement la diffusion dans ce cas. La comparaison de (45)
et (46) donne
2 1 1
(47) r0 = a= +
κ +α κ α

Afin que (43) décrive la situation expérimentale, il est nécessaire que les trois paramètres pouvant
être déterminés expérimentalement a, r0 et κ , satisfassent l'équation obtenue de (47) par
élimination de α :
1
(48) = κ − 12 r0κ 2
a

L'équation (48) est en fait bien satisfait pour la diffusion neutron - proton dans l'état triplet de spin,
auquel cas κ correspond à l'état lié du deutéron.

L'élément de matrice S qui correspond à (43) est, selon (13)


(49) S 0 (k ) =
(k + iκ )(k + iα )
(k − iκ )(k − iα )
Elle contient évidemment moins d'information que la fonction de Jost puisqu'il n'y a aucun moyen
de dire à partir de S 0 (k ) seul si l'état lié correspond à κ ou α . Cela fournit un exemple explicite
des remarques qui suivaient (23).

La théorie de la portée effective peut être utilisée aussi bien quand il n'y a pas d'état lié.
Considérons la situation où α reste fixe tandis que κ décroît vers zéro puis devient négatif. Quand
κ = 0 , (43) montre que f 0 (0) = 0 , ainsi il y a une résonance à l'énergie zéro. (47) montre que la
longueur de diffusion devient infinie. Pour κ petit et négatif, la longueur de diffusion devient
négative et les paramètres peuvent être choisis pour décrire la diffusion neutron - proton à basse
énergie dans l'état singulet de spin.

Dans les trois cas, δ 0 (k ) croit initialement à partir de zéro lorsque k décroît de l'infini. Avec un état
lié, il décroît de manière monotone vers π en k = 0 et avec une résonance à énergie zéro, il croît
vers 12 π . Quand κ est négatif, le décalage de phase passe par un maximum puis décroît vers zéro
en k = 0. Tous ces comportements sont en accord avec le théorème de Levinson (42).

Amplitude de diffusion en avant


Nous allons maintenant dériver une relation de dispersion pour l'amplitude de diffusion en avant en
supposant encore que le potentiel est à symétrie sphérique. Il est utile de travailler avec l'élément de
matrice T relié à l'amplitude. Nous définissons
2πh 2
(50) T (Eα ) ≡ C α T α = C ∫ uα∗ (r )V (r )χ α+ (r )d 3 r = − f (k α , k α )
−2 −2

La substitution l'expression de χ α+ vue dans l'étude des collisions stationnaires donne


(51) T (Eα ) = C
−2
[∫ u
α

(r )V (r )uα (r )d 3 r + h −1 ∫∫ uα∗ (r ′)V (r ′)Gω+α (r ′, r )V (r )uα (r )d 3 r ′d 3 r ]
Nous obtenons donc
T (E ) = TB + h −1 ∫∫ exp(− ik ⋅ r ′)V (r ′)Gω+ (r ′, r )V (r ) exp(ik ⋅ r )d 3 r ′d 3 r
(52)
TB = ∫ V (r )d 3 r
où l'élément de matrice de Born TB est indépendant de l'énergie et l'indice α a été supprimé.

La fonction de Green qui apparaît dans (52) a été définie précédemment. Nous adoptons la
normalisation par fonction delta pour le continuum et nous séparons la somme généralisée Sα en
une somme sur les n états liés et une intégrale sur les états continus α :
χ (r ′)χ n∗ (r ) χ (r ′)χ α∗ (r )
(53) h −1Gω+ (r ′, r ) = ∑ n + ∫ dα α
n E − En E − Eα + iε

Les χ n sont normalisés à l'unité et iε peut être enlevé dans cette somme puisque les E n sont
négatifs. La normalisation du continuum d'états est telle que si χ α (r ) a la forme asymptotique
exp(ik ⋅ r ) , la différentielle dα devient d 3 k / (2π ) .
3

L'équation (53) montre que Gω+ , vu comme une fonction de E comme une variable complexe, est
analytique partout excepté pour des pôles discrets aux énergies réelles négatives E n des états liés et
en une coupure parallèle et juste sous l'axe des réels positifs. Nous définissons
(54) T (r ′, r, E ) ≡ h −1Gω+ (r ′, r )V (r ′)V (r ) exp[ik ⋅ (r − r ′)]
tel que
(55) T (E ) = TB + ∫∫ T (r ′, r, E )d 3 r ′d 3 r

Les propriétés analytiques de T (r ′, r, E ) sont les mêmes que celles de Gω+ , et ainsi une relation de
dispersion peut être obtenue en partant du théorème de Cauchy comme dans (24). Nous
considérons donc l'intégrale
1 T (r ′, r, E ′)
(56) ∫ dE ′
2πi C E ′ − E
où le contour C, montré dans la figure ci-dessous, ne traverse pas la coupure.

Cette intégrale est égale à la somme des résidus aux pôles des états liés ainsi qu'un résidu du pôle
en E :
T (r ′, r, E ′) Γ (r ′, r )
+ T (r ′, r, E )
1
(57) ∫ dE ′ = ∑ n
2πi C E ′ − E n En −

Ici Γn (r ′, r ) est le résidu de T (r ′, r, E ) au pôle en E = E n . C'est-à-dire que T (r ′, r, E ) se comporte


comme Γn (r ′,r ) / (E − E n ) dans le voisinage de E = E n .
Relation de dispersion pour T(E)
Le contour consiste en trois parties : le cercle infinitésimal autour de l'origine, les lignes droites
juste au-dessus et au-dessous de l'axe des réels positifs des deux cotés de la coupure et le grand
cercle auquel nous assignons le rayon E 0 . Par rapport au cercle infinitésimal, nous notons de (53)
que les contributions des états liés à Gω+ sont finies lorsque E → 0 puisque ces états sont supposés
avec des énergies négatives finies. De même, la contribution du continuum à Gω+ est finie puisque
le k 2 dans Eα dans le dénominateur est composé par le k 2 dans la différentielle d 3 k . Donc, avec
l'aide de (54), nous voyons que T (r ′, r, E ) reste fini lorsque E ′ → 0 dans le plan de coupure et il
n'y a pas de contribution du cercle infinitésimal.

La contribution au coté gauche de (57) des deux cotés de l'axe réel positif est
( ) ( )
1 E0 T r ′, r, E ′ + − T r ′, r, E ′ −
2πi ∫0
(58) dE
E′ − E
où E ′ ± sont juste au-dessus et au-dessous de la coupure. Il est pratique de remplacer cette intégrale
par
( ) ( )
1 E0 T r ′, r, E ′ + − T r ′, r, E ′ −
dE ′
2πi ∫0
(59)
E′ − E
qui conduit au même résultat quand elle est intégrée sur r et r ′ comme cela est fait dans (55). Nous
( ) ( )
voulons maintenant montrer que T ∗ r ′, r, E + = T r ′, r, E _ . Nous sommes intéressés par les
situations qui possèdent une invariance par renversement du temps, donc V est réel. De plus,
{exp[ik ⋅ (r − r ′)]}
+
[ ]
= exp ik − ⋅ (r ′ − r ) , ainsi en accord avec (54), nous avons seulement besoin de

montrer que Gω+∗+ (r ′, r ) = Gω−− (r, r ′) quand on a le reversement du temps. Cependant, puisque nous
sommes hors de l'axe réel, la limite ε → 0 peut être prise et la distinction entre G + et G −
disparaît. Donc, nous avons établit que le second terme dans le numérateur de l'intégrale est le
complexe conjugué du premier et ainsi la contribution au coté gauche de (57) pour les intégrations
sur l'axe réel est

(60) ∫
( )
1 E0 Im T r ′, r, E ′ +
dE ′
π 0 E′ − E
Finalement, nous voulons montrer que la contribution du grand cercle s'annule à la limite E 0 → ∞ .
L'analyse précise peut être trouvée dans la littérature et nous en donnerons seulement une indication
ici. La principale hypothèse dont nous avons besoins est celle plausible que Gω+ approche de la
fonction de Green libre G0+ω lorsque E → ∞ avec
µ
(61) G0+ω (r ′, r ) = − r ′ − r exp(ik r ′ − r )
−1

2πh

Il est évidemment important que k approche l'infini avec une partie imaginaire positive. C'est
actuellement ce qui se passe en suivant l'identification des états liés avec les pôles de l'élément de
matrice S ou l'amplitude de diffusion sur l'axe k imaginaire positif et l'identification des états liés
avec les pôles sur l'axe E réel négatif. Donc le feuillet de Riemann complet du plan E coupé avec
lequel nous travaillons doit être appliqué sur la moitié supérieure du plan k, en accord avec
E = h 2 k 2 / 2 µ . On l'appelle le feuillet physique de E. Le feuillet non physique s'applique sur la
moitié inférieure du plan k. On peut alors montrer que l'exponentielle dans la fonction de Green
domine les ondes planes dans (54), et ainsi ∫∫ T (r ′, r, E )d 3 r ′d 3 r s'annule lorsque E → ∞ . Un
argument similaire montre que l'intégral (60) converge lorsque la limite supérieure approche
l'infini.

Nous substituons maintenant (60) avec E 0 = ∞ dans le coté gauche de (57) et on intègre sur r ′ et
r. Avec l'aide de (55), nous obtenons
Γn 1 ∞ Im T (E ′)
(62) T (E ) = TB + ∑ + ∫ dE ′
n E − En π 0 E ′ − E − iε
où nous avons remplacé la variable d'intégration E ′ + = E ′ + iε par E ′ dans la dernière intégrale et
posé Γn ≡ ∫∫ Γl (r ′, r )d 3 r ′d 3 r . L'équation (62) est la relation de dispersion pour l'amplitude de
( )
diffusion en avant. Nous rappelons que T (E ) = − 2πh 2 / µ f (k, k ) selon (50), que TB = ∫ V (r )dr
selon (52) et que Im T (E ) = −(h 2 k / 2 µ )σ tot (E ) . La seule quantité qui reste à évaluer est Γn qui est
le résidu de T (E ) au pôle d'état lié E = E n .

Comme exemple simple, nous notons que, s'il y a un état lié qui est décrit par la théorie de la porté
effective, l'élément de matrice S (49) est donné approximativement par
2iκ (κ + α )
(63)
(κ − α )(k − iκ )
près du pôle en k = iκ . On peut montrer que le pôle en k = iα , qui apparaît dans l'onde partielle l
= 0 mais ne correspond pas à un état lié, n'est pas présent dans l'amplitude complète T (E ) . Alors,
( )
près du pôle correspondant en k 2 = −κ 2 , T (E ) est dominé par − 2πh 2 / 2 µ (1 / 2ik ) fois cet
élément de matrice, et donc
4πh 2 κ (κ + α )
(64) T (E ) ≈ −
(
µ (κ − α ) k 2 + κ 2 )
Nous obtenons donc
2πh 4 κ (κ + α ) 2πh 4 κ
(65) Γ = − 2 =
µ κ −α µ 2 1 − κr0
où la portée effective r0 peut être déterminée expérimentalement à partir de (45).

Relation de dispersion soustraite


La relation de dispersion (62) relie un certain nombre de quantités mesurables et peut donc, au
moins en principe, être testée expérimentalement. Donc T (E ) est proportionnel à la section
2

2
efficace différentielle dans la diffusion en avant à l'énergie E, TB est la même quantité à énergie
infinie, Im T (E ) est proportionnel à la section efficace totale et, dans l'approximation de la portée
effective, Γ est donné par (65).

Il peut cependant arriver que la région haute énergie ne soit pas facilement accessible ou que
l'intégrale (62) ne converge pas assez rapidement pour être évaluée avec les données
expérimentales disponibles. Dans ce cas, une relation de dispersion soustraite peut être obtenue de
(62) en soustrayant de T (E ) l'expression similaire de T (E 0 ) où E 0 est une énergie choisie
arbitrairement. Le résultat est
 Γn 1 ∞ Im T (E ′) 
(66) T (E ) = T (E 0 ) + (E − E 0 )∑ − ∫ dE ′
 n (E − E n )(E 0 − E n ) π 0 (E ′ − E − iε )(E ′ − E 0 − iε ) 

Il est visible que cette expression devient identique à (62) quand E 0 = ∞ . Un avantage de (66) est
que l'intégrale converge plus rapidement que dans (62) car son intégrand a une plus grande
puissance de E ′ au dénominateur. D'un autre coté, elle ne peut être utilisée que si T (E 0 ) est connu.
Exercices
1. Dérivez les quatre équations (8) de la section I.3.3.1 en utilisant l'arbitraire de ψ à tout instant
du temps.
2. Utilisez l'expression (9) de la section I.3.3.1 pour G0 pour montrer explicitement que la
première des équations (8) est valide pour G0+ .
3. Montrez que le produit scalaire de deux solutions quelconques de l'équation de Schrödinger
dépendant du temps est constant dans le temps si l'hamiltonien est hermitique. Utilisez ce
résultat tout d'abord pour montrer que l'orthogonalité de deux solutions est préservée dans le
temps et ensuite pour obtenir une expression pour β S α sous la forme d'un produit scalaire
qui peut être évalué à tout instant et pas seulement en t ′ > T2 comme dans l'équation (39) de la
section I.3.3.1 ou en t < −T1 comme dans l'équation (45).
4. Montrez que la relation entre l'équation (14) de la section I.3.2.5 et l'équation (42) de la section
I.3.3.1 concerne le second terme sur le coté droit de (42).
5. Evaluez le coté droit de l'équation (11) de la section I.3.3.2 avec + iε remplacé par − iε et
montrez que le résultat est égal à θ (τ ) − 1 .
6. Dérivez l'équation (25) de la section I.3.3.2 par la manipulation symbolique de l'équation (23).
Dérivez ensuite l'équation (26) sans utiliser les relations symboliques.
7. Evaluez G0−ω (r ′, r ) défini par l'équation (13) de la section I.3.3.2 avec + iε remplacé par − iε et
obtenez là sous une forme similaire à (29). Montrez aussi que les substitutions (35) sont
justifiées.
8. Utilisez le caractère unitaire de la matrice S, telle que donnée dans l'équation (45) de la section
I.3.3.2 pour dériver le théorème optique généralisé et ensuite le théorème optique comme un cas
particulier.
9. Montrez que la section efficace de diffusion totale par un potentiel réel qui diminue à grande
distance comme r − n est finie si et seulement si n > 2, d'abord au moyen de l'amplitude
approchée de Born (2) de la section I.3.3.3 et ensuite au moyen de l'approximation de Born des
décalages de phase (19).
10. Trouvez la section efficace différentielle de diffusion pour un potentiel réel V (r ) = V0 e − r / a en
utilisant l'approximation de Born. Quel est le critère de validité dans ce cas et sous quelles
circonstances est-il satisfait ?
11. Utilisez l'approximation de Born pour discuter qualitativement de la diffusion par un réseau
cristallin d'atomes identiques.
12. Utilisez le théorème optique et l'amplitude approchée de Born (1) de la section I.3.3.3 pour
calculer la section efficace totale pour un potentiel réel. Discutez de votre résultat. Répétez pour
un potentiel complexe.
13. Un proton est diffusé par un atome qui peut être représenté par un champ coulombien masqué
( )
− Ze 2 / r e − r / a combiné à un puits de potentiel carré réel attractif à courte distance de
profondeur − V0 et de rayon R qui vient du noyau. Utilisez l'approximation de l'onde déformée
de Born pour calculer l'amplitude de diffusion. Supposez que seule l'onde partielle l = 0 est
affectée par le potentiel nucléaire. Traitez cela de manière exacte et traitez le champ
coulombien au premier ordre.
14. Utilisez la théorie des perturbations pour calculer la section efficace différentielle de collision
pour l'excitation 1s  2p d'un atome d'hydrogène. Montrez que la section efficace totale
devient l'expression donnée sous l'équation (36) de la section I.3.3.3 aux énergies de
bombardement élevées.
15. Utilisez l'approximation eikonal pour calculer la section efficace totale pour la diffusion par le
potentiel V (r ) = −V0 (1 + iξ ) pour r < a, V (r ) = 0 pour r > a, où V0 et ξ sont positifs. Trouvez
une situation où vous pensez que votre résultat devrait être en accord avec celui obtenu dans le
problème 11 de la section V.2 du tome II puis comparez pour voir si c'est effectivement le cas.
16. Calculez la fonction de Jost pour l = 0, f 0 (k ) , pour un puits de potentiel carré réel attractif de
profondeur − V0 et de rayon a. Utilisez la pour donner une discussion aussi complète que vous
pouvez des états liés dans ce potentiel et des décalages de phase de diffusion.
I.3.3.5 Collisions avec réarrangement
Le calcul de la diffusion élastique et inélastique d'un électron par un atome d'hydrogène a été
discuté en négligeant l'échange entre les électrons incidents et atomiques. L'échange des électrons
est un cas particulier de collision avec réarrangement dans laquelle les parties composant les
systèmes en collision sont redistribuées durant le processus de diffusion. Nous poserons d'abord le
formalisme pour le cas général et nous l'appliquerons alors à la diffusion électron - atome.
L'identité et le spin des électrons incidents et atomiques introduit des effets supplémentaires qui
doivent être pris en compte. Comme exemples, nous discuterons des collisions avec échange des
électrons avec des atomes d'hydrogène et d'hélium au moyen de l'approximation de Born.

Notations pour les collisions avec réarrangement


La collision de deux systèmes a et b peut se terminer dans les mêmes systèmes finaux que les états
originaux (diffusion élastique). Ou elle peut se terminer dans des systèmes finaux différents qui
sont formés par le réarrangement des parties composant a et b. Nous considérerons la réaction
a + b → c + d et nous reportons à plus tard la prise en compte de l'identité et des spins des parties.
L'hamiltonien complet peut être écrit de deux manières :
′ = H cd + H cd
(1) H = H ab + H ab ′

′ leur interaction. H cd et H cd
Ici H ab décrit les énergies cinétiques et internes de a et b et H ab ′ sont
définis de manière similaire. Nous supposerons que tous les H qui apparaissent dans (1) sont
hermitiques, autrement c'est comme si H ab ou H cd avaient des parties absorbantes et il n'y aurait
pas d'état stationnaire pour certains des systèmes a, b, c, d.

Nous serons particulièrement intéressés par les solutions exactes χ ab+


et χ cd− de l'hamiltonien
complet qui correspondent à l'énergie totale E et qui satisfont les équations de Lippmann-
Schwinger :
χ ab+ = u ab + (E − H ab + iε )−1 H ab
′ χ ab+

(2)
χ cd− = u cd + (E − H cd − iε )−1 H cd′ χ cd−

(3) (H ab − E )u ab = 0 (H cd − E )u cd =0

Expression alternative pour l'élément de matrice T


L'élément de matrice T qui décrit cette collision ne peut pas être écrit en analogie avec le travail qui
précède car dans le cas présent il n'y a pas une interaction unique V. Nous revenons donc à la
définition originale de l'élément de matrice S et nous l'écrivons dans le cas stationnaire avec l'aide
de la relation (1) de la théorie des collisions stationnaires :
( ( ))
β S − 1α = φ β , ψ α+ − φα t ′=T
2
(4) ( )
( ( ))
= u β , χ α+ − uα e
(i / h ) E β − Eα T2

De même, la première des équations (2) de la théorie des collisions stationnaires est :
(i / h )(E β − Eα )t
(5) β (S − 1)α = − β T α ∫ g (t )e
i T2
dt
h −∞

puisque l'interaction de l'état initial est coupée en T2 . Nous suivons maintenant la procédure
générale illustrée par le propagateur et nous remplaçons Eα par Eα + iε sur le coté droit de (4) et
(5) où la limite ε → 0 + est sous-entendue. Cela permet à l'intégrale dans (5) de converger à sa
limite inférieure et ainsi g (t ) peut être remplacé par l'unité. Alors, avec E β = Eα , nous obtenons
(6) β T α = iε (u β , (χ α+ − uα ))

Bien que cette dérivation soit quelque peu heuristique, on vérifie facilement que (6) est en accord
avec la deuxième équation (2) de la théorie des collisions stationnaires dans le cas plus simple
considéré ci-dessus. Pour nos besoins actuels, (6) a l'avantage de ne pas faire intervenir l'interaction
explicitement et est donc applicable quand l'interaction est différente dans les états initiaux et
finaux.

Elément de matrice T pour les réarrangements


Nous partons maintenant de l'expression (6) appropriée aux collisions avec réarrangements et nous
la dérivons sous une forme similaire à la forme (2) de la théorie des collisions stationnaires. Nous
introduisons d'abord E − H cd + ε en opérant sur le membre de droite du produit scalaire et son
adjoint hermitique sur le membre de gauche :
( (
cd T ab = iε u cd , χ ab
+
− u ab ))
( ))
(7)
= iε (E − H cd − iε ) u cd , (E − H ⊂ d + iε ) χ ab
−1 −1 +
(− u ab

La deuxième équation (3) montre que le membre de gauche du produit scalaire est maintenant
(− iε )−1 u cd . Puisque le conjugué complexe du membre de gauche doit être pris, le facteur (− iε )−1
annule le facteur ιε précédant le terme entre crochets. L'équation (1) peut alors être utilisée pour
remplacer H cd par H ab + H ab ′ − H cd
′ dans le membre de droite du produit scalaire :
(
cd T ab = u cd , (E − H ab + iε + H cd ′ ) χ ab
′ − H ab +
(
− u ab ))
(8)
(
= (u cd , (E − H ab + iε )) χ ab
+
) (
− u ab + u cd , (H cd
′ − H ab
′ )χ ) − (u , (H ′
+
ab cd cd
′ )u ab )
− H ab

La substitution de χ ab
+
− u ab à partir de la première équation (2) montre que le premier terme sur le
coté droit de (8) est égal à (u cd , H ab ′ χ ab
+
). Il annule donc une partie du second terme. De plus, le
dernier terme sur le coté droit s'annule car
(u cd , (H cd′ − H ab′ )u ab ) = (u cd , (H ab − H cd )u ab )
(9)
= (u cd , H ab u av ) − (H cd u cd , u ab ) = 0
avec l'aide de (3).

Nous obtenons donc


(10) cd T ab = (u cd , H cd
′ χ ab
+
)
qui est similaire en structure à l'expression (2) de la théorie des collisions stationnaires. Une
expression équivalente dans laquelle les rôles des états initiaux et finaux sont échangés peut être
obtenue ou bien en partant d'une forme analogue à (6) ou en manipulant (10) :
(11) cd T ab = (χ cd− , H ab
′ u ab )
Les équations (10) et (11) sont habituellement appelées post et pré formes de l'élément de matrice
T, respectivement, puisque la première implique l'interaction de l'état final et la seconde celle de
l'état initial. Ces deux équations montrent incidemment que la réaction ne se produit pas s'il n'y a
pas d'interaction dans l'état initial ni dans l'état final, comme on devait s'y attendre.

Comme avant, l'approximation de Born consiste à utiliser (2) pour remplacer χ ab


+
par u ab dans (10)
ou χ cd− par u cd dans (11). Les deux expressions obtenues de cette manière sont identiques en
tenant compte de (9) :
(12) cd T ab B = (u cd , H cd
′ u ab ) = (u cd , H ab
′ u ab )

Présence d'une interaction de cœur


Une situation particulièrement intéressante se produit quand une partie de H ab ′ et H cd
′ vient de
l'interaction d'un des systèmes en collision avec un cœur infiniment massif de l'autre. Un exemple
est fournit par la diffusion d'échange d'un électron par un atome, dans laquelle le noyau atomique
est si massif qu'il peut être vu comme un cœur de masse infinie. Nous avons déjà vu que dans la
diffusion sans échange, l'interaction entre l'électron et le noyau ne peut pas conduire à une
excitation de l'atome (diffusion inélastique) à cause de l'orthogonalité des fonctions d'onde initiales
et finales de l'électron atomique. De manière similaire, on peut s'attendre à ce que la diffusion avec
échange puisse être causée seulement par l'interaction entre les électrons incidents et atomiques qui
échangent leurs places et pas par l'interaction d'un des électrons avec le noyau. Mais les équations
(10) et (11) ne suggèrent pas de manière évidente que la contribution de cette interaction de cœur à
l'élément de matrice T soit zéro. Nous allons maintenant montrer de manière assez générale
comment cette interaction de cœur peut être éliminée.

La réaction que nous considérons peut être représentée schématiquement comme


(13) 1 + (2, coeur )a → 2 + (1, coeur )b
où, par exemple, la première parenthèse indique que 2 est lié au cœur dans l'état a. L'hamiltonien
complet est
(14) H = K 1 + K 2 + U 1 + U 2 + V12
où K 1 et K 2 sont les opérateurs énergie cinétique pour 1 et 2, U 1 et U 2 sont les interactions de 1 et
2 avec le cœur et V12 est l'interaction de 1 et 2. Les quantités définies en relation avec (1) sont alors
H ab = K 1 + K 2 + U 2 H ab′ = U 1 + V12
(14)
H cd = K 1 + K 2 + U 1 H cd′ = U 2 + V12

Nous allons maintenant appeler les solutions initiales et finales exactes χ ab


+
= χ i+ et χ cd− = χ −f et les
solutions initiales et finales non perturbées u ab = uα (1)wa (2 ) et u cd = wb (1)u β (2 ) . Ici, wa et wb
sont les fonctions d'onde d'état lié au cœur initiales et finales qui satisfont les équations
(K 2 + U 2 − ε a )wa (2) = 0 (K1 + U 1 − ε b )wb (1) = 0
(15)
ε a ,ε b < 0
et uα et u β sont les fonctions d'onde libres correspondantes qui satisfont
(16) (K 1 − E + ε a )uα (1) = 0 (K 2 − E + ε b )u β (2) = 0

La "post" forme de l'élément exact de matrice T (10) est alors


[
(17) cd T ab = wb u β , (U 2 + V12 )χ i+ ]
Elimination du terme de cœur
Notre objectif est l'élimination du terme U 2 dans (17). La seule manière générale pour accomplir
cela est de récrire l'élément de matrice de manière à ce que U 2 apparaisse seulement entre les états
exacts de 1 qui correspondent à des énergies différentes. Alors l'orthogonalité de ces états, avec le
fait que U 2 ne dépend pas des coordonnées de 1 provoquera l'annulation de ce terme. Nous
demanderons donc, en plus de l'état lié de cœur exact wb (1) qui correspond à l'énergie ε b , l'état de
cœur diffusé exact χ α+ (1) qui est l'analogue de uα (1) et qui correspond à l'énergie E − ε a . Nous
introduisons donc les équations
(K1 + U 1 − E + ε a )χ α+ (1) = 0
(18)
(K 2 + U 2 − E + ε b )χ β− (2) = 0
Les équations de Lippmann-Schwinger que nous avons vues sont les seules nécessaires si nous
partons de la "post" expression (17) :
(19) χ i+ = χ α+ (1)wa (2) + (E − K 1 − K 2 − U 1 − U 2 + iε ) V12 χ i+
−1

(20) χ β− = u β (2 ) + (E − ε b − K 2 − U 2 − iε ) U 2 u β (2 )
−1

L'équation (20) peut être multipliée par wb (1) , qui commute avec (E − ε b − K 2 − U 2 − iε ) U 2
−1

puisque cet opérateur n'implique pas les coordonnées de 1 :


(21) wb (1)χ β− (2 ) = wb (1)u β (2 ) + (E − ε b − K 2 − U 2 − iε ) U 2 wb (1)u β (2 )
−1

A ce point nous devons faire l'hypothèse que le cœur est infiniment massif car nous devrons bientôt
utiliser le fait que l'opérateur inverse dans (21) peut être adjoint de celui dans (19). Les deux sont
adjoints si nous pouvons utiliser la deuxième équation (15) pour remplacer ε b wb (1) par
(K1 + U 1 )wb (1) dans (21) et ce remplacement est valide seulement si K 1 + U 1 commute avec U 2 .
Supposons maintenant que le cœur a une masse infinie. Alors nous devons travailler dans le
système de coordonnées du centre de masse et l'opérateur énergie cinétique total ne peut pas être
séparé en parts K 1 et K 2 qui commutent avec U 2 et U 1 , respectivement. Cela correspond
physiquement au fait que le recul du cœur de masse finie sous l'impact de 1 peut ébranler 2, et ainsi
l'interaction avec le cœur contribue en fait à la diffusion d'échange.

Avec un cœur de masse infinie, nous pouvons remplacer (21) par


(22) wb (1)χ β− (2 ) = wb (1)u β (2 ) + (E − K 1 − K 2 − U 1 − U 2 − iε ) U 2 wb (1)u β (2 )
−1

L'équation (17) peut être récrite en une série d'étapes qui utilisent certaines des relations
précédentes :
( ) ( ) [
cd T ab = wb u β , U 2 χ i+ + wb χ β− , V12 χ i+ + (E − K 1 − K 2 − U 1 − U 2 − iε ) U 2 wb u β , V12 χ i+
−1
]
(23)
( ) ( ) [
= wb u β , U 2 χ i+ + wb χ β− , V12 χ i+ − wb u β , U 2 (E − K 1 − K 2 − U 1 − U 2 + iε ) V12 χ i+
−1
]
= (w ub β , U 2 χ i+ ) + (w χ
b

β , V12 χ i+ ) − [w u
b β (
, U 2 χ i+ − χ α+ wa )]
= (w χb

β , V12 χ i+ ) + (w u
b β , U 2 χ α+ w )
a

Le second terme sur le coté droit de (23) s'annule à cause de l'orthogonalité de wb (1) et χ α+ (1)
comme remarqué plus haut. Nous obtenons donc pour la "post" forme exacte de l'élément de
matrice T
[
(24) cd T ab = wb (1)χ β− (2 ), V12 χ i− ]
De même, la "pré" forme peut être écrite
[
(25) cd T ab = χ −f , V12 χ α+ (1)wa (2 ) ]
Ces expressions montrent immédiatement que le processus ne se déroule pas s'il n'y a pas
d'interaction entre 1 et 2.

Les équations (24) et (25) peuvent être utilisées pour une expression approchée d'onde déformée de
Born pour l'élément de matrice T qui est au premier ordre en V12 mais exacte en U 1 et U 2 . Cela est
obtenu en remplaçant χ i+ par χ α+ (1)wa (2 ) à partir de (19) ou χ −f par wb (1)χ β− (2) :
(26) cd T ab DWBA
[
= wb (1)χ β− (2 ), V12 χ α− (1)wa (2 ) ]
L'approximation de Born est obtenue en remplaçant χ β− (2) par u β (2 ) à partir de (20) et χ α+ (1) par
uα (1) :
(27) cd T ab B
[
= wb (1)u β (2 ), V12 uα (1)wa (2 ) ]
Collisions d'échange des électrons avec l'hydrogène
Comme premier exemple de collision avec réarrangement dans lequel les effets d'identité et de spin
apparaissent, nous considérons la diffusion élastique d'un électron par un atome d'hydrogène. Dans
un problème de ce type, nous devons connaître les formes asymptotiques des fonctions d'onde non
symétrisées pour toutes les permutations des particules identiques. Une fonction d'onde qui a la
symétrie appropriée peut alors être construite par les méthodes que nous avons vues.

Puisqu'il y a deux électrons, nous avons besoin des formes asymptotiques pour la fonction d'onde
non symétrisée exacte χ i+ (r1 , r2 ) quand r1 est grand et aussi quand r2 est grand. Dans le premier
cas, le comportement asymptotique est de la forme générale :
[ ]
(28) χ i+ (r1 , r2 ) → C exp(ik α ⋅ r1 ) + r1−1e α 1 f D (k r , k α ) wa (r2 ) + L
r1 →∞
ik r

Ici f D est l'amplitude de diffusion élastique directe ou sans échange, pour laquelle l'électron
incident est diffusé et l'électron atomique est laissé dans son état original. Les points représentent
d'autres termes dans la série et correspondent aux excitations de l'électron atomique. k r est dans la
direction de r1 . Le comportement asymptotique quand r2 est grand a la forme
(29) χ i+ (r1 , r2 ) → Cr2−1e f E (k r , k α )wa (r1 ) + L
ikα r2
r2 → ∞

Ici f E est l'amplitude de diffusion élastique avec échange, les points représentent à nouveau
l'excitation atomique et k r est maintenant dans la direction de r2 . Il n'y a pas d'état d'onde plane
dans (29) puisque wa (r2 ) s'annule quand r2 est grand.

Nous désirons travailler avec les combinaisons symétriques et antisymétriques


χ i+ (r1 , r2 ) ± χ i+ (r2 , r1 ) et trouver leurs formes asymptotiques lorsque r1 ou r2 deviennent infinis (à
cause de la symétrisation, l'un des deux le fera). Notre problème immédiat, alors, est d'exprimer les
amplitudes directes et d'échanges f D et f E en fonction des éléments de matrice T correspondant,
que nous connaissons. L'élément de matrice T direct est
 1 1
(30) TD = C e 2 ∫∫ exp(− ik β ⋅ r1 )wa∗ (r2 ) −  χ i+ (r1 , r2 )d 3 r1 d 3 r2
2

 r12 r1 

De même, la "post" forme de l'élément de matrice T d'échange exact est obtenue de (24) :
(31) TE = C e 2 ∫∫ wa∗ (r1 )χ β−∗ (r2 ) χ i+ (r1 , r2 )d 3 r1 d 3 r2
2 1
r12

Nous connaissons déjà la relation entre f D et TD :


m
(32) f D = − T
2 D
2πh 2 C

Bien qu'il semble probable que la relation (32) soit aussi valable entre f E et TE , il n'est pas évident
que ce soit bien le cas et nous donnerons une preuve plus loin. Avant d'embarquer là-dedans,
cependant, il est intéressant de comparer les structures de (30) et (31), les deux étant exactes.
L'expression pour TD est un élément de matrice de l'interaction complète, incluant le terme de cœur
− e 2 / r1 et avec l'état final libre exp(ik β ⋅ r1 ) pour l'électron sortant. Nous aurions pu écrire TE sous
une forme analogue en utilisant (17). Cependant, il est préférable pour les approximations de
perturbations subséquentes d'exprimer TE comme un élément de matrice de seulement l'interaction
entre électrons e 2 / r12 . L'interaction électron - noyau est alors prise en compte à travers l'utilisation
de la fonction d'onde de diffusion de cœur exacte χ β− (r2 ) pour l'électron sortant.

Relation entre amplitude et élément de matrice


Nous allons maintenant montrer que l'amplitude de diffusion d'échange et l'élément de matrice T,
f E et TE , sont reliés par (32). L'interaction est différente dans les états initiaux et finaux d'une
collision de réarrangement. Donc, il est avantageux de partir de l'expression (6) pour l'élément de
matrice T puisqu'elle n'implique pas l'interaction explicitement. Comme contrôle du calcul, nous
allons d'abord redériver (32) puis montrer comment la dérivation peut être prolongée au cas
d'échange.
Nous voulons alors évaluer l'intégrale
[ ]
(33) TD = iε ∫∫ C ∗ exp(− ik β ⋅ r1 )wα∗ (r2 ) χ i+ (r1 , r2 ) − C exp(ik α ⋅ r1 )wa (r2 ) d 3 r1d 3 r2
où la limite ε → 0 + est sous-entendue. Puisque ε multiplie l'intégrale, seuls les termes
proportionnels à ε −1 sont intéressants. La contribution de l'intégrale venant des valeurs finies de r1
est finie, donc cette part de TD s'annule à la limite ε → 0 . Donc, nous pouvons utiliser la forme
asymptotique (28) pour χ i+ (r1 , r2 ) . Les termes d'excitation qui sont représentés par des points
peuvent être omis car les w qui correspondent à différents états sont orthogonaux et s'annulent dans
l'intégration sur r2 .

Le terme entre crochets dans (33) est alors proportionnel à wa (r2 ) dont l'intégration sur r2 donne
l'unité. Nous enlevons l'indice de r1 et nous écrivons
(34) TD = iε C ∫r
−1
exp(− ik β ⋅ r + ikα r ) f D (k r , k α )d 3 r
2

Comme dans la dérivation de (6), nous remplaçons Eα par Eα + iε ou, de manière équivalente, kα
par kα + iεm / h 2 kα . Il est utile de choisir la direction de k β comme axe polaire pour l'intégration et
de noter les angles polaires de r ou k r par rapport à cet axe θ , φ . Avec w = cosθ , f D est une
certaine fonction de w et φ et nous pouvons écrire
 εm 
(35) TD = iε C ∫
2
r −1
exp  − 2
r + ik α r (1 − w ) f D (w, φ )d r
3

 h kα 
puisque k β = kα .

Il est plus pratique d'effectuer l'intégration sur w d'abord en utilisant l'intégration par partie ou la
méthode des phases stationnaires que nous avions déjà présentée :
(36) ∫ f D (w, φ )e ikα r (1− w ) dw =
1

−1
i
kα r
[
f D (1, φ ) − f D (− 1, φ )e 2ikα r − ]i 1 ∂f D ikα r (1− w )
kα r ∫−1 ∂w
e dw
Dans la substitution dans (35), les deux premiers termes du coté droit de (36) donnent des
[ ]
contributions à l'intégration sur r qui sont proportionnelles à ε −1 et ε − (2ih 2 kα2 / m ) ,
−1

respectivement. L'intégrale sur le coté droit de (35) acquiert des puissances plus grandes de r dans
le dénominateur à chaque intégration partielle et ainsi sa contribution dominante à l'intégration sur r
est de l'ordre de ln ε . De plus, f D (1, φ ) est évidemment indépendant de φ et est égal à f D (k β , k α ).
Nous obtenons donc, en prenant la limite ε → 0 +
2πh 2 C
2

(37) TD = − f D (k β , k α )
m

C'est le même que (32).

L'élément de matrice d'échange T peut être calculé de manière similaire, en partant de (6). Au lieu
de (33), nous voulons maintenant évaluer l'intégrale
[ ]
(38) TE = iε ∫∫ wα∗ (r1 )C ∗ exp(− ik β ⋅ r2 ) χ i+ (r1 , r2 ) − C exp(ik α ⋅ r1 )wa (r2 ) d 3 r1 d 3 r2
où à nouveau la limite ε → 0 + est sous-entendue. La contribution à l'intégrale des valeurs finies de
r2 est finie, donc cette partie de T s'annule à la limite ε → 0 . Nous pouvons donc négliger le
second terme entre crochets et utiliser la forme asymptotique (29) pour χ i+ (r1 , r2 ) . Les termes
d'excitation représentés par des points peuvent à nouveau être omis. L'intégration sur r1 donne
l'unité et nous enlevons l'indice de r2 pour écrire
(39) TE = iε C ∫ r (− ik β ⋅ r + ikα r ) f (k , k α )d 3 r
2 −1
E r

Cela est évalué exactement de la même manière que (34) et conduit à


2πh 2 C
2

(40) TE = − f E (k β , k α )
m
Effets de l'identité et du spin
Nous supposerons, comme dans la discussion sur les collisions de particules identiques, que
l'interaction ne dépend pas du spin. Alors, tout ce que nous avons à faire afin de prendre en compte
l'identité et le spin des deux électrons est de former une fonction d'onde antisymétrique à partir des
produits de χ i+ (r1 , r2 ) et des fonctions de spin appropriées. Les fonctions de spin peuvent être
choisies dans l'ensemble des quatre fonctions de spin (10) de la section sur les collisions de
particules identiques. Cependant, il est plus simple d'utiliser les quatre combinaisons symétrisées
(relations (11) de la section sur les collisions de particules identiques). Le spin de l'électron incident
n'est pas supposé avoir de relation définie avec le spin de l'électron atomique. Dans ce cas, nous
pouvons utiliser l'un ou l'autre de ces ensembles de fonctions de spin, calculer la diffusion avec
chacun des quatre états de spin d'un ensemble et ensuite prendre la moyenne des résultats avec des
poids égaux pour chaque état. Les trois premières fonctions de spin sont symétriques et doivent être
multipliées par la fonction d'espace antisymétrique χ i+ (r1 , r2 ) − χ i+ (r2 , r1 ) . La quatrième fonction de
spin est antisymétrique et doit être multipliée par χ i+ (r1 , r2 ) + χ i+ (r2 , r1 ) .

Les formes asymptotiques des fonctions d'espace symétrisées pour des grandes valeurs d'une des
coordonnés de l'électron, disons r1 , sont obtenues de (28) et (29) :
{
(41) χ i+ (r1 , r2 ) ± χ i+ (r2 , r1 ) → C exp(ik α ⋅ r1 ) + r1−1e
r1 →∞
ikα r1
[ f D (θ ) ± f E (θ )]}wa (r2 ) + L

Les points représentent les excitations atomiques et θ est l'angle entre r1 et k α . La section efficace
différentielle doit être calculée avec le signe supérieur dans un quart des collisions et avec le signe
inférieur dans trois quarts des cas. Nous obtenons donc
(42) σ (θ ) = f D (θ ) + f E (θ ) + f D (θ ) − f E (θ )
1 2 3 2
4 4

L'équation (42) peut aussi être dérivée sans référence explicite aux fonctions d'onde de spin en
utilisant l'observation antérieure que les particules qui ont des composantes de spin différentes sont
discernables. Pour la moitié des collisions les électrons ont des composantes de spin différentes et
la section efficace est juste la somme f D (θ ) + f E (θ ) des sections efficaces directes et
2 2
d'échange. Pour l'autre moitié, les électrons sont indiscernables et la fonction d'espace
antisymétrique doit être utilisée. Nous obtenons donc
( 2 2
)
(43) σ (θ ) = 12 f D (θ ) + f E (θ ) + 12 f D (θ ) − f E (θ )
2

dont on vérifie facilement qu'elle est la même que (42).

Collisions d'échange avec l'hélium


Nous allons maintenant considérer la diffusion élastique d'un électron par un atome d'hélium dans
son état de base et nous supposons à nouveau que l'interaction ne dépend pas du spin. Selon ce que
nous avons déjà vu, les deux électrons dans l'atome d'hélium sont dans un état d'espace symétrique
et un état de spin antisymétrique (singulet). Nous écrivons donc la fonction d'onde partielle
symétrisée qui correspond à l'électron incident 1 et les électrons atomiques 3 comme le produit
d'une fonction d'espace χ i+ (r1 , r2 , r3 ) qui est symétrique en r2 et r3 et une fonction de spin v(1,2,3)
qui est antisymétrique en 2 et 3. Les huit fonctions de spins pour trois électrons ont été présentées
précédemment en fonction de leur symétrie en 2 et 3. Il est visible que v(1,2,3) doit être une des
dernières paires doublets.

Un prolongement immédiat du travail qui précède conduit aux formes asymptotiques


[ ]
χ i+ (r1 , r2 , r3 ) → C exp(ik α ⋅ r1 ) + r1−1e α 1 f D (θ ) wa (r2 , r3 )
r →∞
ik r

(44) → Cr2−1e f E (θ )wa (r3 , r1 )


ikα r2
r →∞

→ Cr3−1e f E (θ )wa (r1 , r2 )


ikα r3
r →∞

où wa est la fonction d'espace de l'état de base de l'hélium et les états excités sont ignorés. θ est
l'angle entre la coordonnée asymptotique et k α . L'amplitude directe est reliée à TD par (32) où
maintenant
 1 1 2 +
(45) TD = C e 2 ∫∫∫ exp(− ik β ⋅ r1 )wa∗ (r2 , r3 ) + −  χ i (r1 , r2 , r3 )d 3 r1d 3 r2 d 3 r3
2

 r12 r13 r1 
L'amplitude d'échange f E est évidemment la même pour les deux dernières formes asymptotiques
(44). Elle est reliée à TE par (40) où maintenant
 1 1 
(46) TE = C e 2 ∫∫∫ wa∗ (r1 , r2 )χ β−∗ (r3 ) +  χ i+ (r1 , r2 , r3 )d 3 r1 d 3 r2 d 3 r3
2

 r13 r23 

On voit facilement que la fonction d'onde complètement antisymétrique pour les trois électrons doit
être
(47) χ i+ (r1 , r2 , r3 )v(1,2,3) + χ i+ (r2 , r3 , r1 )v(2,3,1) + χ i+ (r3 , r1 , r2 )v(3,1,2 )

Nous voulons maintenant calculer (47) quand une des coordonnées électron, disons r1 , est grande et
les deux autres électrons sont dans l'état de base d'un atome d'hélium. Cela signifie que nous
prenons la forme asymptotique en r1 et aussi que l'on projette les fonctions de spin sur v(1,2,3) .
Avec l'aide de (44), on a

(48)
{ [ ]}
C exp(ik α ⋅ r1 ) + r1−1e α 1 f D (θ ) + f E (θ )v + (1,2,3)v + (2,3,1) + f E (θ )v + (1,2,3)v + (3,1,2)
ik r

wa (r2 , r3 )v(1,2,3)

Nous prenons pour v(1,2,3) l'avant-dernière des fonctions de spin que nous avions vues. Alors
(49) v + (1,2,3)v(2,3,1) = 1
2
[(+ + −) +
− (+ − + )
+
][(− + + ) − (+ + −)] = − 1
2

et de même v + (1,2,3)v(3,1,2 ) = − 12 . La section efficace différentielle obtenue de (48) est alors


(50) σ (θ ) = f D (θ ) − f E (θ )
2

Comme (42), (50) peut être dérivé sans référence explicite aux fonctions de spin. Puisque les deux
électrons atomiques doivent avoir des spins antiparallèles (état singulet) afin que l'hélium puisse
être dans l'état de base, la composante de spin de l'électron incident est la même que celle d'un des
électrons atomiques et est différente de celle de l'autre. Il ne peut pas s'échanger avec ce dernier
dans une collision élastique puisque les deux électrons atomiques résultant seraient dans le même
état de spin et le principe d'exclusion forcerait l'atome dans un état excité. Donc il peut s'échanger
seulement avec l'électron avec lequel il est indiscernable, ainsi la contribution antisymétrique des
amplitudes directes et d'échange doivent être utilisé, donnant (50).

En l'absence d'interactions dépendant du spin, l'excitation d'un état triplet de l'hélium par un
électron d'impact peut être obtenue seulement par l'échange entre l'électron incident et un des
électrons atomiques. Dans ce cas, il n'y a pas d'amplitude directe et donc aucune interférence entre
amplitudes directes et d'échange.
Exercices
1. Montrez explicitement que l'expression (6) de la section I.3.3.5 pour β T α est la même que
celle donnée dans la deuxième équation (2) de la section I.3.3.2.
2. Dérivez l'équation (11) de la section I.3.3.5 en manipulant l'équation (10).
3. Montrez par un calcul direct que l'équation (42) de la section I.3.3.5 est obtenue si les électrons
incidents et atomiques sont supposés être décrits par les quatre fonctions de spin (++), (+-), (-+)
et (--), plutôt que par les combinaisons triplet et singulet.
4. Utilisez les équations (31) et (40) de la section I.3.3.5 pour obtenir l'approximation de Born
pour l'amplitude de diffusion d'échange d'un électron par un atome d'hydrogène. Evaluez ce
résultat dans la direction avant et comparez le résultat avec l'amplitude de diffusion directe
correspondante obtenue à partir de l'équation (35).
I.3.4. Statistique de Maxwell-Boltzmann corrigée. Gaz moléculaires
parfaits
Terminons cette longue excursion sur les méthodes approchées en revenant sur les statistiques
quantiques et en analysant en détail la troisième statistique quantique que nous avions présenté, la
statistique de Maxwell-Boltzmann corrigée.
I.3.4.1. Loi de répartition et fonctions thermodynamiques
La statistique de Maxwell-Boltzmann corrigée (MBc) que nous avions introduite s'applique aux
systèmes formés de particules indiscernables et indépendantes dans le cas limite de niveaux
d'énergie peu peuplés ( N i << g i ). Cette statistique est la limite commune des statistiques
quantiques de Bose-Einstein et de Fermi-Dirac. Son formalisme est très voisin de celui de la
statistique classique de Maxwell-Boltzmann (MB). En effet, ces deux statistiques sont caractérisées
par les probabilités thermodynamiques
N N
g i g i
(1) WMBc = ∏ i et WMB = N !∏ i
i Ni! i Ni!
qui ne diffèrent que par le facteur N!. Ce facteur, égal au nombre de permutations de N particules
discernables entre elles, intervient en statistique de Maxwell-Boltzmann et non en statistique de
Maxwell-Boltzmann corrigée en raison du postulat d'indiscernabilité.

Loi de répartition
La loi de répartition que nous avions obtenue est :
N −β ε
(2) N i = g i e i ( β = 1 / kT )
Z
où la fonction de partition (ou somme d'états) relative à une particule, définie par
−β ε
(3) Z = ∑ g i e i = ∑ e j
−β ε

i j

est un somme sur les niveaux d'énergie (indice i) ou sur les états quantiques (indice j) d'une
particule. Cette loi de répartition est identique à celle que l'on trouve en statistique de Maxwell-
Boltzmann (supposée connue). Elle possède donc les mêmes propriétés :
 Le rapport des densités de populations ni = N i / g i de deux niveaux d'énergie pour une
température donnée ne dépend que de leur différence d'énergie.
 Un changement d'origine des énergies ne modifie pas la loi de répartition.
 Les diverses formes d'énergie, si elles sont additives, contribuent à la fonction de partition de
façon multiplicative.
 Le théorème d'équipartition de l'énergie s'applique dans les mêmes conditions.
Fonctions thermodynamiques
Nous avons vu que l'expression de l'énergie libre en fonction de Z est :
 Z 
(4) F = − NkT  ln + 1
 N 

L'expression de la différentielle de F,
(5) dF = − SdT − PdV + µ dN
permet d'obtenir les diverses grandeurs thermodynamiques :
 ∂F   Z  ∂ ln Z  
(6) S = −  = Nk ln + 1 + T   
 ∂T V , N  N  ∂T V 
 ∂F   ∂ ln Z 
(7) P = −  = NkT  
 ∂V  T , N  ∂V  T
 ∂F  Z
(8) µ =   = −kT ln
 ∂N  T ,V N
 ∂ ln Z   ∂ ln Z 
(9) U = F + TS = NkT 2   = − N  
 ∂T V  ∂ β V
 ∂U  ∂  2 ∂ ln Z  2  ∂ ln Z 
2
(10) CV =   = Nk T = Nkβ 
 ∂β 2 
 ∂T V , N ∂T  ∂T  V  V

Remarquons que, lorsqu'on ne peut pas obtenir une expression analytique simple de la fonction de
partition, on peut déterminer la capacité calorifique en explicitant (10) sous la forme :
 Z ′′ Z ′ 2 
(11) CV = Nkβ 2  − 2 
Z Z 

∂Z ∂2Z
= −∑ g i ε i e = ∑ g i ε i2 e i
− β εi −β ε
(12) Z =′ ′′
et Z =
∂β i ∂β 2
i
On effectue alors le calcul de façon numérique en tronquant les séries selon la précision désirée.

Lorsqu'il existe un champ électrique E ou un champ magnétique d'induction B, l'expression de dF


contient des termes dW = −PdE ou dW = − MdB , de sorte que les moments dipolaires électrique
P et magnétique M s'obtiennent par :
 ∂F   ∂ ln Z 
(13) P = −  = NkT  
 ∂E  T ,V , N  ∂E  T ,V
 ∂F   ∂ ln Z 
(14) M = −  = NkT  
 ∂B  T ,V , N  ∂B  T ,V

Exercices

Conséquences de l'indiscernabilité
Comparez les expressions des fonctions thermodynamiques de la section I.3.4.1 à celles de la
statistique de Maxwell-Boltzmann et commentez.

Solution
On voit que, pour l'entropie :
(1) S MBc = S MB − Nk ln N + Nk = S MB − k ln N !

Le terme supplémentaire − k ln N ! provient directement de la relation de Boltzmann S = k ln W


appliqué aux expressions (1) de la section I.3.4.1. Par contre, il n'existe aucune différence de forme
pour l'énergie interne U, la capacité calorifique CV , la pression P, le moment magnétique M . Pour
l'énergie libre et le potentiel chimique, on a :
FMBc = FMB + kT ln N !
(2)
µ MBc = µ MB + kT ln N !

Le terme supplémentaire provient directement du terme supplémentaire de S.


I.3.4.2. Gaz monoatomiques parfaits
Dans un gaz monoatomique parfait (gaz rares, vapeurs métalliques, etc.), l'énergie de chaque atome
est la somme des termes d'énergie de translation, d'énergie électronique et nucléaire :
(1) ε i = ε k(t ) + ε l(e ) + ε m(n )
la dégénérescence du niveau i ≡ (k ; l , m ) de l'atome étant :
(2) g i = g k(t ) × g l(e ) × g m(n )

Il en résulte que la fonction de partition est un produit de trois facteurs :


(3) Z = Z (t ) × Z (e ) × Z (n )
appelés respectivement fonctions de partition de translation, électronique et nucléaire. L'énergie
libre est alors la somme de trois termes :
F = F (t ) + F (e ) + F ( n )
(4)  Z (t ) 
= − NkT  ln + 1 − NkT ln Z (e ) − NkT ln Z (n )
 N 
Le terme kT ln N ! a été rattaché au terme de translation responsable de l'indiscernabilité des
particules.

Fonctions de partition électronique et nucléaire


Dans la grande majorité des cas, le premier niveau électronique excité des atomes est situé à
plusieurs électron-volts du niveau fondamental : 11.5 eV pour l'argon, 1.85 eV pour le lithium, 4.67
eV pour le mercure,… Avec le choix ε 0(e ) = 0 , l'expression de la fonction de partition électronique
se réduit à son premier terme, soit :
− β ε1( )
1
(5) Z (e ) = g 0(e ) + g1(e )e + L ≅ g 0(e )
car le terme β ε 1(e ) = ε 1(e ) / kT = Θ e / T est très grand devant 1 aux températures usuelles. En effet,
pour ε 1(e ) ~ 1 eV , on a Θ e ~ 10 4 K . En général, donc, la fonction de partition électronique se réduit
à son premier terme g 0(e ) = 2 J + 1 , J étant le nombre quantique correspondant au moment cinétique
électronique de l'atome dans son état électronique fondamental. La fonction de partition
électronique est donc
(6) Z (e ) = g 0(e ) = 2 J + 1
soit Z (e ) = 1, 2 et 1 respectivement pour l'argon (J = 0), le lithium (J = 1/2) et le mercure (J = 0).

La fonction de partition nucléaire se réduit de même à une constante


(7) Z (n ) = g 0(n ) = 2 I + 1
car le premier niveau excité nucléaire est toujours distant d'environ 1 MeV ( 10 6 eV ) du niveau
fondamental : cet écart vaut par exemple 0.5 MeV pour le lithium Li 7 , la dégénérescence de son
niveau fondamental nucléaire étant g 0(n ) = 4 (spin nucléaire I = 3/2). L'état nucléaire n'étant pas
altéré par des transformations thermodynamiques ou chimiques, on a l'habitude d'omettre Z (n ) .

On écrit donc pour un gaz monoatomique parfait :


(7) Z = (2 J + 1)Z (t )

Fonction de partition de translation


La fonction de partition Z (t ) peut être calculée de deux façons. Dans la première, on considère les
états quantiques d'une particule de masse m dans une boîte cubique de volume V. Les niveaux
d'énergie sont

(8) ε nx ,n y ,n z = ε 0 (n x + n y + n z ) avec ε 0 =
2 2 2 h2
8mV 2 / 3
où n x , n y , n z sont des entiers positifs. La fonction de partition Z (t ) vaut alors :
( )

Z (t ) = ∑ exp − βε nx , n y , nz
n x , n y , n z =1

∑ exp(− βε )∑ exp(− βε n )∑ exp(− βε n )


∞ ∞ ∞
(9) = 0 n x2 0
2
y 0
2
z
n x =1 n y =1 n z =1

3
∞
(

= ∑ exp − βε 0 n 2  )
 n =1 

La sommation ne peut pas être effectuée en termes analytiques simples. Cependant, comme
ε 0 / k ~ 10 −16 K , les termes varient peut avec n et l'on peut remplacer la somme par l'intégrale
gaussienne :
1/ 2
1 π 
∑ exp(− βε )→ ∫ ( )
∞ ∞
(10) n 2
exp − βε 0 n dn =  2

2  βε 0 
0 0
n =1

En remplaçant ε 0 par son expression (8), la fonction de partition de translation vaut donc

(11) Z (t ) = 3 (2πmkT )
V 3/ 2

La deuxième façon de calculer Z (t ) utilise la limite classique :


p2 d 3 rd 3 p
(12) ε i → et g i →
2m h3

On obtient alors :
 β
1
Z (t ) = 3 ∫ d 3r ∫ d 3p exp −

p x2 + p y2 + p z2  ( )
h  2m 
(13) 3
V  +∞  β 2 
= 3  ∫ dp x exp − p x 
h  −∞  2m  
L'intégrale gaussienne valant (2πm / β )
1/ 2
, on retrouve l'expression (11) de la fonction de partition
de transition Z (t ) .

Nous constatons que Z (t ) est une grandeur extensive de sorte que Z / N est intensif, d'où
l'extensivité de la fonction F (4). Notons que l'on peut écrire :
V h
(14) Z (t ) = 3 avec Λ =
Λ (2πmkT )1 / 2
où Λ est appelée longueur d'onde thermique de de Broglie. Cette longueur d'onde est celle d'une
particule d'impulsion p = (2πmkT ) et d'énergie ε = p 2 / 2m = πkT , énergie proche de l'énergie
1/ 2

cinétique moyenne (20) d'un atome.

Fonctions thermodynamiques en variables T et V


En introduisant les expressions (6), (7) et (11) dans l'expression (4) de l'énergie libre, on obtient :
  V (2πmkT )3 / 2  
(15) F = − NkT ln  + 1 + ln (2 J + 1)
3 
  N h  

L'équation d'état obtenue à partir de cette fonction est


 ∂F  NkT NkT
(16) P = −  = =
 ∂V  T , N V v
v étant le volume molaire et N le nombre d'Avogadro. Cette équation ne dépend pas de la nature
des gaz et s'identifie à l'équation d'état expérimentale des gaz parfaits :
RT
(17) P =
v

Elle montre que la constante de Boltzmann k est reliée à la grandeur macroscopique R (constante
des gaz parfaits) par :
(18) Nk = R
L'énergie interne peut se calculer avec l'expression vue ci-dessus :
 ∂ ln Z  3
(19) U = NkT 2   = NkT
 ∂T V 2

Cette énergie est indépendante de la nature du gaz et de son volume. Notons que le théorème
d'équipartition de l'énergie s'applique pour les trois degrés de liberté de translation des atomes, de
sorte que l'on retrouve U = 3 × ( NkT / 2) . L'énergie cinétique moyenne d'un atome vaut :

(20) ε =
∑ N i ε i = U = 3 kT
∑ Ni N 2
La capacité calorifique molaire à volume constant a alors pour expression :
 ∂U  3 3
(21) cV =   = Nk = R
 ∂T V 2 2
en accord complet avec les résultats expérimentaux pour les gaz monoatomiques à pression
atmosphérique. Enfin, l'entropie et le potentiel chimique ont pour expression :
 ∂F    V (2πmkT )3 / 2  5 
(22) S = −  = Nk ln  + + ln (2 J + 1)
 ∂T V , N
3 
  N h  2 
et
  V (2πmkT )3 / 2  
Z
(23) µ = − kT ln = −kT ln 
 + ln (2 J + 1)
N   N h3  

Domaine de validité du modèle


Le modèle des gaz parfaits est limité, d'une part, par la possibilité d'appliquer la statistique de
Maxwell-Boltzmann corrigée et, d'autre part, par celle de pouvoir négliger les interactions entre
atomes.

La statistique de Maxwell-Boltzmann corrigée peut s'appliquer lorsque la condition N o / g i << 1 ,


qui se ramène à la condition α = N / Z << 1 , est vérifiée. Nous allons expliciter cette dernière
condition en variables T et P caractérisant les contraintes expérimentales. Pour cela, nous
substituons dans l'expression de Z (7) et (11) la variable P à la variable V à l'aide de l'équation
d'état (16), soit :
NkT (2πmkT )
3/ 2 5/ 2
(24) Z = (2 J + 1) = ( + ) 3 / 2 NT i
3
2 J 1 M e0
P h P
où M est la masse molaire du gaz et i0 est une constante universelle définie par

(25) i0 = ln
(2π )3 / 2 k 5 / 2 = 18.223 SI
N3 / 2 h 3

La condition d'applicabilité de la statistique de Maxwell-Boltzmann corrigée s'écrit alors :


−3 / 2
N −i M
(26) α = =e 0 PT −5 / 2 << 1
Z 2J + 1

Dans le cas de l'argon ( M = 39.95 × 10 −3 kg mole −1 ) dans les conditions normales de température (T
= 273 K) et de pression (P = 1 atm = 1.013 × 10 5 Pa), on a α = 1.26 × 10 −7 , c'est-à-dire que la
condition (26) est largement satisfaite. Remarquons que α est le produit de trois facteurs : un
facteur constant, un deuxième dépendant de la nature du gaz et un dernier dépendant des
contraintes imposées au gaz. On voit que α est d'autant plus grand que le gaz est léger et se trouve
à haute pression et basse température. Toutefois, les gaz se liquéfient avant que le rapport
α n'approche la valeur 1. La seule exception est l'hélium, cas le plus défavorable, pour lequel on a
:
( )
(27) α He 4 = 0.13 et α He 3 = 0.41 ( )
à leur température d'ébullition normale. Pour plus de rigueur, il faut dans ce cas appliquer la
statistique quantique appropriée soit, respectivement, celle de Bose-Einstein et celle de Fermi-
Dirac.

En ce qui concerne les interactions, elles sont négligeables dans la mesure où l'énergie cinétique
moyenne ε = 3kT / 2 est grande devant l'énergie d'interaction moyenne dont la valeur peut être
estimée pour une distance égale à la distance moyenne entre atomes r ~ (V / N ) . Comme, à
1/ 3
distance suffisament grande, l'interaction suit la loi de van der Waals en Ar −6 , la condition
permettant de négliger les interactions s'écrit :
2
N 3
(28) A  << kT
V  2

Pour les gaz rares la constante A est de l'ordre de 10 −77 SI, ce qui donne, dans les conditions
normales, une énergie moyenne d'interaction de l'ordre de 10 −8 eV comparée à une énergie
cinétique moyenne de l'ordre de 10 −2 eV. L'énergie d'interaction commence à ne plus être
négligeable devant l'énergie cinétique quand on se rapproche du point critique. Dans les autres cas,
le modèle du gaz parfait constitue une bonne approximation, même au voisinage de la température
de liquéfaction du gaz. Soulignons le fait que la liquéfaction se produit quand la phase liquide
devient plus stable que la phase gazeuse dans laquelle les interactions peuvent encore être
négligées.

En résumé, le modèle de gaz parfait est valable pour des pressions suffisament inférieures à la
pression critique et ceci jusqu'aux températures de liquéfaction, sauf pour l'hélium.

Fonctions thermodynamiques en variables T et P


Les expressions de l'entropie et du potentiel chimique relatif à une particule en variables T et P sont
obtenues à partir de (22) et (23) par le remplacement de V / N par kT / P d'après l'équation d'état
(16). En introduisant de plus la masse molaire M = Nm , on obtient :
 5
(29) S = Nk − ln P + ln T + ln (2 J + 1) + ln M + i0 + 
5 3
 2 2 2
 
(30) µ = kT ln P − ln T − ln (2 J + 1) − ln M − i0 
5 3
 2 2 

La relation donnant l'entropie porte le nom de Sackur-Tetrode. Elle fait intervenir la constante
universelle i0 (25). On a comparé la valeur de l'entropie fournie par la formule de Sackur-Tetrode
(29) à la valeur expérimentale pour de nombreux gaz. L'accord excellent obtenu constitue une
vérification à la fois de la relation de Boltzmann S = k ln W et du troisième principe. Rappelons
que, pour obtenir la valeur expérimentale de l'entropie d'un gaz à une pression P0 , on doit évaluer
successivement les variations d'entropie de la substance lors d'une élévation de température par des
intégrales de la forme :
T2 C p (T , P0 )
(31) S (T2 , P0 ) − S (T1 , P0 ) = ∫ dT
T1 T
et, lors d'un changement de phase, par :
L(T0 )
(32) ∆S =
T0
ces évaluations devant être faites depuis le zéro absolu jusqu'à la température considérée.

En variables T et P, on utilise aussi les fonctions enthalpie libre G et enthalpie H, ainsi que la
capacité calorifique à pression constante C P . Elles ont pour expressions :
 
(33) G = F + PV = NkT ln P − ln T − ln (2 J + 1) − ln M − i0 
5 3
 2 2 
5
(34) H = U + PV = NkT
2
et
 ∂H  5 5
(35) C P =   = Nk ou c P = R
 ∂T  P 2 2

On peut remarquer que l'on a ici G = Nµ (car la substance est pure), que l'enthalpie et l'énergie
interne ne dépendent que de la température, et que la capacité calorifique est constante. Pour un gaz
monoatomique γ = C P / CV = 5 / 3 , en bon accord avec l'expérience. Notons enfin que P, T et M
doivent être exprimés dans le système international si l'on utilise la valeur (25) de i0 .

Paradoxe de la fonction de partition électronique


Plus haut, nous avons montré qu'en général le second terme de la fonction de partition électronique
est négligeable. Cependant le nombre de niveaux électroniques étant infini, la question mérite une
discussion plus approfondie.
Considérons pour cela le cas hypothétique d'un gaz composé d'atomes d'hydrogène. Pour ces
atomes, les niveaux d'énergie électronique et la dégénérescence associée sont :
 1 
(36) ε n = RH 1 − 2  et g n = 2n 2
 n 
où RH = 13.6 eV est l'énergie de Rydberg et le niveau n = 1 est pris pour origine des énergies. La
fonction de partition électronique est alors
∞ ∞
(37) Z (e ) = 2∑ n 2 e − β ε n = 2 + 2∑ n 2 e − β ε n
n =1 n=2

A la limite n → ∞ , le terme général de la série se comporte comme n 2 et la série diverge, ce qui


constitue un échec pour la théorie. Ce résultat se transpose à tous les gaz car ils possèdent une
infinité de niveaux du type précédent (états de Rydberg avec n très grand, l'électron placé très loin
se comporte presque classiquement comme un corpuscule en orbite).

La réplique à ce paradoxe vient du fait que, dans les états de Rydberg, le rayon de l'atome varie
comme r0 n 2 avec r0 ~ 1Å . De ce fait, pour un volume V de récipient donné, la valeur de n est
forcément limitée à une valeur n max . Ainsi pour V = 1 mètre cube, n ne peut dépasser n max ~ 10 5 .
On a alors
nmax

Z (e ) = 2 + 2 ∑ n 2 e − β ε n
n= 2
(38)
 n max (n max + 1)(2n max + 1) 
nmax

∑n
− β RH − β RH
< 2 + 2e 2
= 2 + 2e  − 1
n=2  6 

Le calcul numérique donne, pour T ~ 300 K et n max = 10 5 :


(
(39) Z (e ) < 2 1 + 2 × 10 −214 )
On voit donc que la coupure de la somme à n max = 10 5 entraîne que la valeur de Z (e ) , calculée en
considérant seulement le premier niveau ( Z (e ) = 2 ), n'est pas sensiblement modifiée.

Vérification expérimentale de la formule de Sackur-Tetrode


L'entropie molaire de l'argon à T = 300 K et P = 1 atm, déterminée expérimentalement de façon
calorimétrique, a pour valeur s = 154.85 J K −1 mole −1 . Comparez cette valeur à la valeur théorique
de l'entropie donnée par la formule de Sackur-Tetrode. On donne la masse molaire de l'argon
M = 39.95 g mole −1 .

Solution
On se place dans un système d'unités international ( P = 1.013 × 10 5 Pa ,
M = 39.95 × 10 −3 kg mole −1 ) dans lequel i0 = 18.223 SI . Les gaz rares ayant des couches
électroniques complètes, le moment cinétique total J du niveau de base est nul. Avec
R = 8.3145 J K −1 mole −1 , on obtient s = 154.87 J K −1 mole −1 . L'accord est tout à fait excellent.
I.3.4.3. Gaz parfaits diatomiques asymétriques

Niveaux d'énergie de rotation et de vibration


Considérons une molécule diatomique asymétrique comportant deux atomes A et B. Dans un
référentiel d'inertie lié à son centre de masse, son hamiltonien s'écrit :
p2 p2 L2
(1) H = + V (r ) = r + + V (r )
2µ 2µ 2µ r 2
où µ = m A m B / (m A + m B ) est la masse réduite, p r est la composante radiale de la quantité de
mouvement et L le moment cinétique. L'énergie potentielle d'interaction V (r ) des deux atomes à la
distance r possède un minimum pour une valeur re correspondant à la distance d'équilibre.
L'interaction est attractive pour r > re et répulsive pour r < re .

Lorsque l'amplitude de vibration de la molécule est faible ( r ≅ re ), on peut approcher V (r ) par une
parabole et écrire l'hamiltonien sous la forme :
L2 p r2 1
(2) H ≅ + + µω 2 (r − re ) + V (re )
2

2 µ re 2 µ 2
2

avec ω = [V ′′(re ) / µ ]
1/ 2
. Sous cette forme l'énergie de la molécule peut être considérée comme la
somme de l'énergie d'un rotateur rigide de moment d'inertie I e = µ re2 , de l'énergie d'un oscillateur
harmonique de pulsation ω et d'un terme constant. A cette approximation les niveaux d'énergies
donnés par la mécanique quantique ont pour expression :
h2  1
(3) ε K , n = K (K + 1) +  n + hω + V (re )
2I e  2
où K et n sont deux nombres entiers positifs ou nuls appelés respectivement nombres quantiques de
rotation et de vibration. La dégénérescence d'un niveau (K, n) est égale à 2K + 1, correspondant aux
2K + 1 valeurs différentes du nombre quantique m (m = -K, …, K), c'est-à-dire aux 2K + 1
projections du moment cinétique L sur un axe de quantification. Le niveau le plus bas a pour
énergie ε 0, 0 = hω / 2 + V (re ) , représentant l'énergie de liaison de la molécule. En adoptant cette
énergie pour origine, la molécule a pour niveaux d'énergie :
h2
(4) ε K , n = K (K + 1) + nhω = hc[Be K (K + 1) + ω e n ]
2I e
où sont introduites les notations spectroscopiques
h ω
(5) Be = et ω e =
4πcI e 2πc

La figure ci-dessous représente schématiquement les nivaux d'énergie (4).


Le schéma (a) représente les niveaux de rotation pure (n = 0) et la dégénérescence associée
g = 2 K + 1 . Le schéma (b) représente les niveaux de rotation - vibration pour n = 0, 1, limités à K
= 3. Les flèches représentent les transitions permises lors de l'absorption de photons. Les spectres
de raies d'absorption sont représentés schématiquement au-dessous des transitions correspondantes,
sur une échelle en nombre d'ondes σ = ∆ε / hc .

Comme ω e est toujours grand devant Be (pour l'oxyde de carbone CO, par exemple,
ω e = 2170 cm −1 et Be = 1.931 cm −1 ), les niveaux se présentent comme un empilement d'ensembles
de niveaux de rotation
h2
(r )
(6) ε K = K (K + 1) = hcBe K (K + 1) avec g K(r ) = 2 K + 1
2I e
sur chaque niveau de vibration
(7) ε n(v ) = nhω = hcω e n avec g n(v ) = 1

Remarquons qu'en spectroscopie, les énergies sont écrites ε = gcσ , où σ = 1 / λ est le nombre
d'ondes par unité de longueur habituellement mesurée en cm −1 .

A une approximation supérieure il est nécessaire d'introduire des termes correctifs pour tenir
compte de :
 L'anharmonicité du potentiel, soit : − xeω e n(n + 1) .
 La déformation de la molécule sous l'effet de la force centrifuge, soit − De K 2 (K + 1) , avec
2

De = 4 Be3 / ω e2 .
 La variation du terme d'inertie pendant la vibration, soit le remplacement de Be par
Bn = Be − α e (n + 12 ) .

L'expression de l'énergie devient alors :


ε K ,n
(8) = Bn K (K + 1) + ω e n − De K 2 (K + 1) − x eω e n(n + 1)
hc
Les valeurs des coefficients correctifs sont, pour l'oxyde de carbone CO : α e = 1.75 × 10 −2 cm −1 ,
De = 6.10 × 10 −6 cm −1 , xe = 6.13 × 10 −3 .

Etude spectroscopique
Les paramètres moléculaires sont déterminés avec précision en spectroscopie par l'étude des
transitions entre niveaux.

Les spectres de rotation pure, correspondant aux règles de sélection ∆n = 0 , ∆K = ±1 , sont


généralement obtenus par absorption ( ∆K = +1 ) d'une onde électromagnétique (figure (a) ci-
dessus). Ils se situent dans le domaine des ondes radio millimétriques pour la plupart des molécules
et dans l'infrarouge lointain pour les molécules contenant un atome d'hydrogène.

Les spectres de vibration - rotation obéissent aux règles de sélection ∆n = 1 , ∆K = ±1 (figure (b)
ci-dessus) et sont obtenus par absorption dans le domaine infrarouge proche. Pour chaque transition
de vibration (n  n + 1), on observe deux séries de raies, constituant la branche R ( ∆K = +1 ) et la
branche P ( ∆K = −1 ) disposées de part et d'autre de la fréquence de vibration pure (correspondant à
la transition interdite ∆n = 1 , ∆K = 0 ). Ces raies sont équidistantes à l'approximation (4), mais le
couplage vibration - rotation resserre les raies de la branche R et écarte celles de la branche P
lorsque K croît. L'intensité de ces raies est proportionnelle à la population du niveau initial (voir
plus loin). Notons que ces transitions accompagnent aussi les transitions électroniques dans le
domaine visible et ultraviolet.

Les spectres de Raman, obtenus par diffusion sur le gaz d'un faisceau de lumière monochromatique,
permettent d'observer les transitions obéissant aux règles de sélection ∆K = 0,±2 . On distingue les
branches O et S situées de part et d'autre, soit de la raie Rayleigh (diffusion pure ∆n = 0 , ∆K = 0 ),
soit de la raie Raman de vibration pure Q ( ∆n = 1 , ∆K = 0 ).

Notons que les spectres d'absorption de rotation et de vibration - rotation n'existent que pour des
molécules diatomiques portant un moment dipolaire électrique permanent et ne peuvent donc pas
s'observer pour des molécules symétriques. Cette règle ne s'applique pas à la diffusion Raman qui
permet d'étudier des molécules diatomiques symétriques ou non.
Additivité des fonctions thermodynamiques
L'énergie ε d'une molécule diatomique se compose de son énergie de translation et de son énergie
dans son référentiel de centre d'inertie. L'énergie de translation ε (t ) a la même expression que pour
un gaz monoatomique. L'énergie de la molécule dans son référentiel peut, avec une bonne
approximation, être considérée comme la somme de son énergie de rotation ε (r ) (6), de son énergie
de vibration ε (v ) (7) et de son énergie électronique ε (e ) . On a donc :
(9) ε = ε (t ) + ε (r ) + ε (v ) + ε (e )

Il en résulte que la fonction de partition Z est le produit de fonctions partielles :


(10) Z = Z (t ) Z (r ) Z (v ) Z (e )

La fonction Z (t ) est donnée par la même expression que pour un gaz monoatomique, m = m A + m B
étant alors la masse totale de la molécule. Les trois fonctions Z (r ) , Z (v ) , Z (e ) , qui sont étudiées
dans ce qui suit, ne dépendent que de la température et sont indépendantes du volume.

Notons que nous n'avons pas considéré ici l'énergie nucléaire, car seul le niveau nucléaire
fondamental est peuplé et la fonction de partition nucléaire Z (n ) se réduit à une constante égale à la
dégénérescence de ce niveau : g (n ) = (2 I 1 + 1)(2 I 2 + 1) , I 1 et I 2 étant les spins des deux noyaux.
Comme pour les molécules monoatomiques, on convient d'omettre Z (n ) = g (n ) dans la fonction de
partition.

Il résulte de la factorisation de la fonction de partition Z que l'énergie libre est la somme de quatre
termes :
(11) F = F (t ) + F (r ) + F (v ) + F (e )

Par conséquent, l'énergie interne, l'entropie, la capacité calorifique et le potentiel chimique seront
composés aussi de 4 termes. Pour la capacité calorifique, on a :
(12) CV = CV(t ) + CV(r ) + CV(v ) + CV(e )
La pression obtenue par dérivation de F par rapport à V, ne contient en revanche qu'un seul terme
dû à la translation. L'expression de l'énergie libre de translation étant comme avant :
 Z (t ) 
F (t ) = − NkT  ln + 1
 N 
(13)
  V (2πmkT )3 / 2  
= − NkT ln 3
 + 1

  N h  
on a :
 ∂F   ∂F (t )  NkT
(14) P = −  = −  =
 ∂V  T , N  ∂V  T , N V
c'est-à-dire que les gaz diatomiques obéissent aussi à l'équation d'état des gaz parfaits.

De même que pour les gaz monoatomiques, on obtient :


3 3
(15) U (t ) = NkT et cV(t ) = R
2 2

On voit que les contributions de la translation aux grandeurs thermodynamiques sont les mêmes
que pour un gaz monoatomique.

Etant donné que les fonctions de partition autre que Z (t ) ne dépendent pas de V, la fonction de
partition totale Z et l'énergie libre F sont de la forme :
(16) Z (V , T ) = Vf (T )
et
(17) F (T , V , N ) = − NkT ln + Nkφ (T )
V
N

Ces expressions sont valables pour les gaz moléculaires parfaits.


Fonction de partition de rotation

Etude à température élevée


A partir de l'expression (6) des niveaux d'énergie de rotation, la fonction de partition de rotation
Z (r ) s'écrit :

(18) Z (r ) (T ) = ∑ (2 K + 1)e − K ( K +1)Θ r / T

K =0

où la température caractéristique de rotation Θ r est définie par :


h2 hc
(19) Θ r = = Be
2I e k k

Les températures Θ r de plusieurs gaz sont données dans le tableau ci-dessous.


Molécule M g mole −1 ( )
TE (K ) Θ r (K ) Θ v (K ) g 0(e ) Θ e (K )
HD 3.02 22.1 65.7 5492 1 132000
CO 28.01 81.7 2.78 3122 1 93600
NO 30.01 121 2.45 2740 2 174
HCl 36.47 188 15.2 4302 1 63300
HBr 80.91 206 12.2 3812 1 50400
Constantes physiques de quelques gaz diatomiques asymétriques. Masse
molaire M, température d'ébullition normale TE , températures
caractéristiques de rotation Θ r , de vibration Θ v et électronique Θ e ,
dégénérescence du niveau électronique fondamental g 0(e ) . Le premier
niveau excité de NO a une dégénérescence g1(e ) = 2 et le niveau excité
suivant se trouve à 63300 K. Sauf pour HD et NO; on a
Θ r ~ 10 K << Θ v ~ 10 3 K << Θ e ~ 10 5 K . Ainsi que Θ r << TE << Θ v .
Les températures caractéristiques ont été obtenues à partir des données
spectroscopiques.
On voit qu'en général elles sont bien inférieures aux températures d'ébullition à pression
atmosphérique TE . On sera donc pour ces gaz dans le cas T >> Θ r et l'on pourra remplacer la
somme (18) définissant Z (r ) par l'intégrale :

(20) Z (r ) = ∫ (2 K + 1)e − K ( K +1)Θ r / T dK
0

En faisant le changement de variable u = K (K + 1) , on obtient :


∞ T
(21) Z (r ) = ∫ e −uΘ r / T du =
0 Θr

L'énergie libre, l'énergie interne et la capacité calorifique molaire de rotation sont alors :
 T 
(22) F (r ) = − NkT ln Z (r ) = − NkT ln 
 Θr 
d ln Z (r )
(23) U (r ) = NkT 2 = NkT
dT
(24) cV(r ) = Nk = R

Cette dernière valeur est en accord avec l'expérience.

Ces résultats correspondent à la limite pour laquelle on peut prendre l'expression classique de
l'énergie de rotation
1  2 pφ2 
(r ) 1
2
2
(
(25) ε = I e θ + sin θφ =
& & 2
)
2 I e 
pθ + 
sin 2 θ 
où θ& et φ& sont les vitesses angulaires de rotation de la molécule et pθ et pφ les impulsions
associées. La fonction de partition à la limite classique s'écrit alors :
dθ dpθ dφ dpφ
Z (r ) = ∫
h h
(
exp − βε (r ) )
1 2π +∞  − βpθ2  π +∞  − βpφ2 
dφ ∫ dpθ exp  
= 2 ∫  × ∫0 dθ ∫− ∞ dpφ exp 2 I sin 2 θ 
 
h −∞ 2 I
 e 
0
(26)  e 
=
h
1
2
1/ 2 π

0
(
2π × (2πI e kT ) × ∫ dθ 2πI e kT sin 2 θ )1/ 2

8π I e kT
2
T
= =
h 2
Θr

Notons qu'une molécule diatomique admet deux degrés de liberté de rotation (angles θ et φ ) et que
l'expression (23) de l'énergie interne correspond à l'application d'un théorème généralisé
d'équipartition de l'énergie.

Cas de la molécule HD
Le cas de la molécule HD se singularise par le fait qu'à pression atmosphérique le gaz existe pour
des températures T ≤ Θ r . Le remplacement de la somme par une intégrale dans l'expression (18) de
Z (r ) , satisfaisant pour T ≥ 2Θ r , n'est plus valable pour T < 2Θ r . On calcule alors numériquement
la capacité calorifique en tronquant la série (18) donnant Z (r ) . En s'arrêtant à K = 4 , on obtient une
approximation suffisante de cV(r ) représentée sur la figure ci-dessous.
La capacité calorifique de rotation présente un maximum pour T = 0.81Θ r et tend vers zéro au zéro
absolu conformément au troisième principe. La théorie est en bon accord avec les données
expérimentales relatives au gaz HD.

Répartition sur les niveaux de rotation


A l'approximation choisie, l'énergie de rotation d'une molécule intervient de façon additive dans
son énergie totale. La répartition sur les niveaux de rotation suit alors la loi
(27) N K = (r ) (2 K + 1)e − K ( K +1)Θr / T
N
Z
La figure ci-dessous représente cette répartition en fonction du nombre quantique de rotation K.

Le nombre N K est le produit de la dégénérescence, croissant avec K, et du facteur de Boltzmann


décroissant. Il en résulte que N K passe par un maximum. N considérant K comme une variable
continue, on trouve que ce maximum est atteint pour la valeur K M = (T / 2Θ r ) − 1 / 2 . Par
1/ 2

exemple pour HBr ( Θ r = 12.2 K ) à T = 300 K, le maximum est obtenu pour K M = 3 .


L'intensité des raies d'absorption dans les spectres de vibration - rotation étant proportionnelle aux
populations des niveaux de départ des transitions, ces spectres permettent de visualiser la
répartition. La position du maximum qui dépend de la valeur T / Θ r a permis de déterminer la
température d'atmosphère des planètes ou de nuages interstellaires.

Fonction de partition de vibration


A partir de l'expression (7) des niveaux d'énergie de vibration, la fonction de partition Z (v ) s'écrit :

(28) Z (v ) (T ) = ∑ e − nΘv / T
n =0

où la température caractéristique de vibration Θ v est définie par


hω hc
(29) Θ v = = ωe
k k

Les températures Θ v de plusieurs gaz sont donnés dans le tableau précédent. On voit qu'elles sont
en général de l'ordre de plusieurs milliers de degrés. A température ordinaire on se trouve donc
dans le domaine T << Θ v .

La fonction de partition (28), somme d'une série géométrique, a pour expression :


1
(30) Z (v ) =
1 − e −Θv / T

L'énergie libre, l'énergie interne et la capacité calorifique molaire de vibration sont alors données
par :
(31) F (v ) = − NkT ln Z (v ) = NkT ln 1 − e − Θv / T ( )
(v )
d ln Z NkΘ v
(32) U (v ) = NkT 2 = Θv / T
dT e −1
Θ  e Θv / T
2
(v )
(33) cV = R v 
(
 T  e Θv / T − 1
2
)
Ces résultats sont semblables à ceux obtenus en physique statistique classique avec le modèle
d'Einstein des solides. En particulier la capacité calorifique vaut RE (Θ v / T ) où E ( x ) est la
fonction d'Einstein :

(34) E ( x ) =
( x / 2)
2
=
x 2e x
( )
(sinh x / 2)2 e x − 1 2
Pour T → ∞ , la capacité calorifique de vibration tend vers R, résultat en accord avec le théorème
d'équipartition de l'énergie pour un ensemble d'oscillateurs harmoniques à une dimension. Lorsque
T ≤ 0.1Θ v , c'est-à-dire aux environs de la température ambiante, cette capacité calorifique est
négligeable et la capacité calorifique molaire du gaz, cV = 5R / 2 , est la somme des capacités
calorifiques de translation et de rotation. La courbe représentant 5 R / 2 + cV(v ) est donnée sur la
figure ci-dessous.
Elle reproduit de façon satisfaisante les mesures expérimentales pour divers gaz dans le domaine de
500 à 2000 K.

La population relative du niveau de vibration de nombre quantique n est :


N
( )
(35) n = 1 − e −Θv / T e − nΘv / T
N

A température ambiante, on se trouve dans le domaine T << Θ v et la plupart des molécules se


trouvent sur le niveau de vibration fondamental.
Fonction de partition électronique
Comme pour les gaz monoatomiques, le premier niveau électronique excité est en général très
élevé et Z (e ) se réduit à
(36) Z (e ) = g 0(e )

Les niveaux électroniques excité n'apportent donc en général aucune contribution à la capacité
calorifique.

Une exception notable est la molécule de monoxyde d'azote dont le premier niveau excité est tel
que Θ e = 174 K , les autres niveaux excités étant beaucoup plus élevés. Les niveaux fondamental et
excité ayant chacun une dégénérescence égale à 2, la fonction de partition électronique s'écrit :
( )
(37) Z (e ) = 2 1 + e − Θe / T

On en tire les fonctions thermodynamiques et, en particulier, on a pour la capacité calorifique


électronique molaire :
Θ  e Θe / T
2

(38) cV(e ) = R e 
(
 T  e Θe / T + 1)2

Au-dessus du point d'ébullition normal de NO ( TE = 121K ) et jusqu'à environ 300 K, la capacité


calorifique molaire totale du gaz est cV = 5 R / 2 + cV(e ) . Cette relation est en bon accord avec les
résultats expérimentaux.
Au-dessus de 500 K, cV(e ) devient négligeable mais on doit tenir compte de la vibration et l'on a :
cV = 5 R / 2 + cV(v ) . Entre 300 et 500 K, les deux contributions cV(v ) et cV(e ) s'ajoutent à 5R/2.

Notons que, lorsque l'état électronique fondamental possède un moment cinétique, ce dernier se
couple avec le moment cinétique de rotation. Toutefois, pour T >> Θ r , il n'en résulte pas de
modification pour la valeur de la fonction de partition.
Exercices

Etude d'un spectre de vibration - rotation


La figure ci-dessous représente un spectre de vibration - rotation de la molécule HBr pour lequel
sont données les constantes moléculaires.

Spectre d'absorption infrarouge de vibration - rotation de HBr gazeux pour la transition n = 0  n =


1. Les raies d'absorption repérées par le nombre m ont pour nombres d'ondes :
σ m (cm −1 ) = 2559.25 + 16.72m − 0.026m(m + 1) . Ces nombres correspondent aux constantes :
ω e = 2649.67 cm −1 , Be = 8.473 cm −1 , xe = 1.706 × 10 −2 , α e = 0.226 cm −1 .

En utilisant l'expression (8) de la section I.3.4.3, calculez la position des raies correspondant aux
transitions K = 2  K' = 3 et K = 4  K' = 3. Identifiez ces raies sur la figure et trouvez la
correspondance entre les nombres K et les nombres m.

Solution
Avec les valeurs B0 = Be − α e / 2 = 8.360 cm −1 et B1 = Be − 3α e / 2 = 8.134 cm −1 , on trouve :
ε 3,1 − ε 2,0
= 2656.66 − 50.16 = 2606.5 cm −1
hc
(1)
ε 3,1 − ε 4,0
= 2656.66 − 167.20 = 2489.5 cm −1
hc

Ces deux nombres d'ondes sont ceux des raies notées m = 3 et m = -4. Dans la branche R, m est
égal au nombre K' du niveau final de la transition et, dans la branche P, m est égal à l'opposé du
nombre K du niveau final.

Susceptibilité diélectrique du gaz chlorhydrique HCl


La molécule HCl possède un moment dipolaire permanent de module p = 1.11 D (1 D = 1 debye =
3.336 × 10 −30 C m 10 −18 ues cgs ). Lorsque le gaz se trouve dans un champ électrique E , il intervient
un terme − p ⋅ E dans l'expression d l'énergie d'une molécule.

1. Déterminez la fonction de partition partielle Z (rp ) relative à la rotation et à la polarisation du


gaz, à la limite classique T >> Θ r .
2. Déterminez la contribution F ( p ) à l'énergie libre, due à l'existence d'un moment dipolaire. En
déduire que le gaz prend dans le champ électrique un moment dipolaire P dont on donnera
l'expression (loi de Langevin, 1905).
3. Montrez qu'en champ faible, on a P = ε 0VχE (diélectrique linéaire), où
ε 0 = (µ 0 c 2 ) = 8.854 × 10 −12 SI est la permitivité du vide et χ la susceptibilité diélectrique de
−1

la substance. Les mesures expérimentales de la susceptibilité relative à une mole χ M = χv , v


étant le volume molaire, sont représentées dans la figure ci-dessous pour le gaz HCl.

( )
La loi suivie est χ M m 3 mole −1 = 2.33 × 10 −5 + 2.01 × 10 −2 / T (K ) .

La théorie de Langevin permet-elle d'interpréter ces résultats ?


Solution
1. A la limite classique, l'énergie de rotation et d'orientation dans champ électrique est (voir (25)
de la section I.3.4.3) :
1  2 pφ2 
(2) ε (rp ) = pθ +  − pE cosθ
2 I e  sin 2 θ 

La fonction de partition s'écrit alors :


dθ dpθ dφ dpφ
(3) Z (rp ) = ∫
h ∫ h
exp − βε (rp ) ( )

En intégrant sur pθ , φ et pφ comme dans (26) de I.3.4.3 pour Z (r ) , il vient :


4π 2 I e kT π
(4) Z (rp )
= ∫ dθ sin θ exp(βpE cosθ )
h2 0

Après le changement de variable u = βpE cosθ , l'intégration donne :


8π 2 I e kT sinh β pE sinh β pE
(5) Z (rp ) = = Z (r ) Z ( p ) avec Z ( p ) =
h 2
β pE β pE

Notons que la fonction de partition partielle Z ( p ) tend vers 1 lorsque E tend vers zéro.
2. La contribution à l'énergie libre s'écrit F ( p ) = − NkT ln Z ( p ) . Le moment dipolaire du gaz est
alors :
 ∂F  pE
(6) P = −  = NpL( x ) avec x =
 ∂E  T , N ,V kT

La fonction L( x ) étant la fonction de Langevin

(7) L( x ) = coth x −
1
x
3. En champ faible (x << 1), la fonction de Langevin a pour forme limite L( x ) = x / 3 et le moment
dipolaire du gaz devient :
N p2
(8) P = ε 0VχE avec χ =
V 3ε 0 kT

La susceptibilité est proportionnelle à la densité de particules du gaz et, comme pour la loi de
Curie, varie en 1/T. Pour des champs élevés ( E ≅ 10 6 V/m ) et pour des températures de l'ordre
de 100 K, x est de l'ordre de 10 −3 et on se trouve toujours dans la zone linéaire de la loi de
Langevin. La susceptibilité relative à une mole a pour expression dans le modèle de Langevin :
Np 2
(9) χ M = χv =
2ε 0 kT
pour le gaz chlorhydrique (p = 1.11 D), on a numériquement χ M = 2.26 × 10 −2 / T en unités SI.
Ce terme rend bien compte de la variation en 1/T de la susceptibilité mesurée. Il s'y ajoute un
terme constant dû à la déformation de la molécule dans un champ électrique. La polarisabilité
α d'une molécule, rapport du moment dipolaire induit au produit ε 0 E , vaut
α = χ M (T = ∞ ) / N , soit α = 3.87 × 10 −29 m 3 pour HCl d'après la figure précédente. Notons que
le terme en 1/T de la susceptibilité χ M permet inversement d'obtenir la valeur du moment
dipolaire des molécules. Pour HCl, on trouverait 1.05 D en bon accord avec la valeur p = 1.11
D obtenue par résonance dipolaire électrique de faisceaux moléculaires.
I.3.4.4. Gaz parfaits diatomiques symétriques

Symétrie de la fonction d'onde de la molécule


Lorsqu'une molécule est constituée de deux atomes identiques (molécule homonucléaire), sa
fonction d'onde doit obéir au postulat de symétrisation relativement à l'échange des deux noyaux
des atomes : la fonction d'onde de la molécule doit être symétrique ou antisymétrique relativement
à l'échange simultané des coordonnées ri et des projections des spins mi des noyaux, selon que
ceux-ci sont des bosons ou des fermions. Cela correspond exactement à ce que nous avions vu pour
des électrons et des atomes et qui s'étend évidemment aux noyaux. Soit, en ne considérant pas les
coordonnées des électrons :
(1) ψ (r2 , m2 , r1 , m1 ) = ±ψ (r1 , m1 , r2 , m2 )

Lorsque l'on néglige les couplages tels que le couplage rotation - vibration, la fonction d'onde ψ se
factorise sous la forme :
(2) ψ (r2 , m2 , r1 , m1 ) = ψ (t ) (R )ψ (r ) (θ , φ )ψ (v ) (r )ψ (n ) (m1 , m2 )
où R = (r1 + r2 ) / 2 repère le centre de gravité et r , θ , φ sont les coordonnées sphériques du
vecteur relatif r = r2 − r1 . Les fonctions d'onde ψ (t ) , ψ (r ) , ψ (v ) et ψ (n ) décrivent l'état de
translation, rotation, vibration et de spin nucléaire de la molécule. L'échange des deux noyaux
laisse invariant le centre de gravité R de la molécule, donc ψ (t ) , et la distance r des deux noyaux,
donc ψ (v ) . Par ailleurs, il change θ en π − θ , φ en φ + π et échange m1 et m2 . On voit donc que
seul le produit ψ (r )ψ (n ) est concerné par le postulat de symétrisation.

Lorsque la molécule se trouve dans un état quantique de rotation caractérisé par les deux nombres
quantiques K et m (m = -K,…, K), la fonction d'onde ψ (r ) est l'harmonique sphérique YKm (θ , φ )
vérifiant l'identité :
(3) YKm (π − θ , φ + π ) = (− 1) YKm (θ , φ )
K
La fonction d'onde de rotation est donc symétrique (s) ou antisymétrique (a) selon que le nombre
quantique de rotation K est pair ou impair.

La fonction d'onde nucléaire ψ (n ) doit, elle aussi, être symétrique (s) ou antisymétrique (a)
relativement à l'échange des deux noyaux. La fonction d'onde ψ (n ) est construite, pour la valeur I
du spin d'un noyau, à partir des ρ = 2 I + 1 fonctions d'onde σ p (p = -I,… , I) de chacun des deux
noyaux sous la forme de produits σ p (1)σ q (2 ) . Parmi ces ρ 2 produits, il en existe ρ qui sont
symétriques, ceux avec p = q. Avec les ρ ( ρ − 1) autres produits, on peut former les combinaisons
(4) ψ (n ) =
1
[ ]
σ p (1)σ q (2) ± σ q (1)σ p (2)
2
symétriques et antisymétriques en nombres respectifs ρ ( ρ − 1) / 2 .

Il existe donc ρ ( ρ − 1) / 2 = (2 I + 1)I fonctions d'onde ψ (n ) antisymétriques et


ρ ( ρ + 1) / 2 = (2 I + 1)(I + 1) fonctions d'onde symétriques. Ces différentes fonctions d'onde
représentent des états nucléaires que l'on peut considérer comme étant dégénérés en énergie car les
spins du noyau ont un couplage très faible entre eux ou avec les électrons (couplage hyperfin de
température caractéristique Θ n ~ 10 −6 K ). Toutefois, le couplage entre le spin des noyaux et les
électrons étant faible, il induit peu de transitions entre les différents états nucléaires. Il en résulte
qu'une molécule dans un certain état nucléaire y reste très longtemps. On désigne sous le nom
d'ortho et de para les molécules dans des états nucléaires respectivement symétriques et
antisymétriques.

Le produit ψ (r )ψ (n ) devant être symétrique pour des bosons et antisymétrique pour des fermions,
les molécules ortho et para ne peuvent se trouver que dans des états de rotation pairs ou impairs
selon le cas.
ψ (n ) ↓ ψ (r ) → K pair s K impair a Dégénérescence nucléaire
Ortho s Boson ss Fermion aa (2 I + 1)(I + 1)
Para a Fermion as Boson aa (2 I + 1)I
On voit donc que, dans le cas de l'oxygène O2 de spin nucléaire I = 0 (boson), il n'existe qu'un seul
état nucléaire (orthooxygène) et les molécules ne peuvent occuper que des niveaux de rotation
pairs. Dans le cas de l'hydrogène H 2 (I = 1/2, fermion), il existe 3 états nucléaires symétriques
(orthohydrogène) et un seul antisymétrique (parahydrogène) qui ne peuvent être que dans des états
de rotation respectivement impairs et pairs. Dans le cas du deutérium D2 (I = 1, boson), il existe 6
états nucléaires pour l'orthodeutérium et 3 pour le paradeutérium, respectivement dans des états de
rotation pairs et impairs.

Fonction de partition
De même que pour les molécules diatomiques asymétriques, l'énergie des molécules diatomiques
symétriques peut s'écrire
(5) ε = ε (t ) + ε (r ) + ε (v ) + ε (e )
les diverses formes d'énergie conservant les mêmes expressions. Le tableau ci-dessous donne les
températures caractéristiques de quelques gaz.
Molécule M ( g mole −1 ) TE (K ) Θ r (K ) I Θ v (K ) g 0(e ) Θ e (K )
H 21 2.02 20.4 87.5 1/2 6324 1 132000
D22 4.03 ~20 43.8 1 4487 1 132000
N 14
2
28.01 77.3 2.89 1 3395 1 99700
O 16
2
31.99 90.1 2.08 0 2274 3 11400
Cl 2
35 69.94 239 0.351 3/2 813 1 26300

En raison de la symétrie de la molécule, le schéma des niveaux de rotation se décompose en deux


séries comprenant, l'une les niveaux de nombre quantique K pair, l'autre ceux de K impair.
Nous écrirons donc la fonction de partition sous la forme
(6) Z = Z (t ) Z (v ) Z (e ) Z (rn )
où les fonctions de partition Z (t ) , Z (v ) et Z (e ) sont les mêmes que pour les molécules asymétriques
et où la fonction de partition Z (rn ) , qui tient compte de l'état nucléaire et de l'état de rotation, s'écrit
pour les bosons :
(7) Z (rn ) = (2 I + 1)(I + 1)Z pair + (2 I + 1)IZ impair
et pour les fermions
(8) Z (rn ) = (2 I + 1)IZ pair + (2 I + 1)(I + 1)Z impair
avec
(9) Z pair (impair ) = ∑ (2 K + 1)e − K (K +1)Θr / T
(
K pair impair
)

A température élevée ( T >> Θ r ), le remplacement de la somme par une intégrale conduit à :

(10) Z pair ≅ Z impair ≅ ∑ (2 K + 1)


1 − K ( K +1)Θ r / T 1 T

2 K 2 Θr

Dans les deux cas (bosons ou fermions), on obtient :


(11) Z (rn ) = (2 I + 1)
2 1 T

2 Θr
que l'on peut comparer au cas des molécules asymétriques où
Z (rn ) = Z (r ) Z (n ) = (2 I 1 + 1)(2 I 2 + 1)T / Θ r . On voit qu'une molécule symétrique peut se traiter
comme un cas particulier d'une molécule asymétrique à condition d'introduire dans la fonction de
partition un facteur 1 / σ , avec σ = 2 pour les molécules diatomiques. D'un point de vue classique,
le facteur de symétrie σ est lié au fait que, deux directions opposées de la molécule étant
équivalentes en raison de l'identité des noyaux, le domaine d'intégration des variables angulaires est
réduit à un demi-espace ( 0 ≤ θ ≤ π / 2 , 0 ≤ φ < 2π ).

L'expression générale de la fonction de partition pour les molécules symétriques peut alors s'écrire :
1
(12) Z = Z (t ) Z (r ) Z (v ) Z (e )
σ
où Z (r ) est calculé comme pour une molécule asymétrique et où l'on a de nouveau omis le facteur
de dégénérescence nucléaire Z (n ) . L'énergie libre d'un gaz diatomique symétrique a donc la même
expression que celle d'un gaz diatomique asymétrique, à un terme additif Nkt ln σ près. Il en
résulte dans l'expression de l'entropie un terme supplémentaire − Nk ln σ = − Nk ln 2 . Par contre les
expressions de l'énergie interne et de la capacité calorifique ne sont pas modifiées.

Répartition sur les niveaux d'énergie de rotation


La loi de Boltzmann permet de déterminer la population des divers niveaux de rotation à l'équilibre.
Considérons tout d'abord le cas où les noyaux sont des fermions. Le nombre de molécules sur un
niveau de rotation avec K pair est
(13) N K = (rn ) (2 I + 1)I × (2 K + 1)e − K ( K +1)Θr / T
N
Z
et, avec K impair :
(14) N K = (rn ) (2 I + 1)(I + 1) × (2 K + 1)e − K ( K +1)Θ r / T
N
Z

Les nombres totaux de molécules para et ortho sont alors :


(15) N para = (rn ) (2 I + 1)IZ pair et N ortho = (rn ) (2 I + 1)(I + 1)Z impair
N N
Z Z

A haute température, les expressions (10) et (11) permettent d'écrire :


N para I N I +1
(16) = et ortho =
N 2I + 1 N 2I + 1

Ces expressions sont également valables dans le cas des bosons. On en déduit que, dans le cas des
spins nucléaires nuls, il n'existe de molécules que dans l'état ortho, dans le cas de spins I = 1/2 on a
N ortho : N para = 3 : 1 , dans le cas I = 1 on a N ortho : N para = 2 : 1 , etc.
Cas de l'hydrogène
Lorsqu'on considère un gaz diatomique homonucléaire se trouvant depuis longtemps à température
ambiante ( T >> Θ r ), il est en équilibre thermodynamique et les molécules para et ortho sont dans
les proportions (16). Si l'on diminue sa température, les proportions en ortho et para restent fixes,
car la transition entre ces deux états (retournement d'un spin nucléaire) s'effectue rarement. Le gaz
se trouve alors dans un état d'équilibre métastable dans lequel il se comporte comme un mélange de
deux espèces chimiques différentes dans les proportions (16). On doit alors écrire pour ce mélange :
I I +1
(17) F = F para + Fortho
2I + 1 2I + 1
et non F = − NkT ln Z avec Z donné par (6), expression qui ne serait valable que si le gaz avait
atteint, pour la température considérée, l'équilibre thermodynamique.

Ces considérations entraînent un comportement particulier seulement dans le cas de l'hydrogène et


du deutérium H 2 et D2 , car ce sont les seuls gaz diatomiques que l'on peut étudier dans le domaine
de température tel que T ≤ Θ r . Dans ce domaine, seuls les nivaux fondamentaux de vibration et
électronique sont occupés. Pour H 2 (fermions, I = 1/2) et D2 (bosons, I = 1), on a :
H 2 : F para = F pair et Fortho = Fimpair
(18)
D2 : F para = Fimpair et Fortho = F pair
avec les définitions :
 Z (t ) 
(19) F pair (impair ) = − NkT  ln + 1 − NkT ln Z pair (impair )
 N 
où Z (t ) est la fonction de partition diatomique et Z pair et Z impair les sommes (9) sur les états de
rotation pairs et impairs. Les énergies libres de l'hydrogène et du deutérium métastables s'écrivent
alors :
1 3
H 2 : F = F pair + Fimpair
4 4
(20)
2 1
D2 : F = F pair + Fimpair
3 3
et les capacités calorifiques molaires correspondantes :
3 1 3
H 2 : cV = R + cVpair + cVimpair
2 4 4
(21)
3 2 1
D2 : cV = R + cVpair + cVimpair
2 3 3
avec :
d 2 ln Z pair d 2 ln Z impair
(22) cVpair = Rβ 2
et cVimpair = Rβ 2

dβ 2 dβ 2

Comme il n'est pas possible d'obtenir des expressions analytiques générales pour les fonctions de
partition de rotation, on emploie la méthode numérique appliquée précédemment au cas de la
molécule HD. Les courbes ainsi obtenues pour les capacités calorifiques (21) de l'hydrogène et du
deutérium, représentées sur la figure ci-dessous, sont en très bon accord avec les données
expérimentales et confirment la validité du modèle d'un mélange métastable d'un gaz ortho et d'un
gaz para.
Lorsque de l'hydrogène gazeux, pris à température ambiante, est refroidi jusqu'à T ≅ TE = 20 K ,
toutes les molécules de parahydrogène (25 ) se trouvent sur le niveau de rotation K = 0 et celles
d'orthohydrogène (75 ) sur le niveau K = 1. Dans le liquide obtenu, les interactions entre molécules,
plus importantes que dans le gaz, induisent le retournement des spins nucléaires et favorisent
l'évolution du gaz vers son état thermodynamique stable, composé à cette température de
parahydrogène pur dans le niveau K = 0. L'énergie libérée dans la transition K = 1  K = 0
entraîne une vaporisation de l'hydrogène qui peut être totale au bout d'une semaine environ. Pour
éviter une vaporisation trop rapide, on prépare de l'hydrogène gazeux dans un état d'équilibre stable
à basse température (parahydrogène) en faisant agir un catalyseur chimique (dissociation et
recombinaison des molécules) ou une substance paramagnétique (interaction spin électronique -
spin nucléaire) à l'intérieur même du liquéfacteur.
La capacité calorifique de l'hydrogène métastable entre sa température d'ébullition et 3000 K est
représentée dans la figure ci-dessous qui met en évidence les paliers correspondant aux valeurs
classiques cV = 3R / 2 (translation seule), cV = 5 R / 2 (translation et rotation), ainsi que les
domaines de variation dans lesquels les niveaux de rotation et de vibration se peuplent
progressivement.

La courbe tracée, donnée par


3 1 3
(23) cV = R + cVpair + cVimpair + cV(v )
2 4 4
(v )
où cV est la capacité calorifique de vibration, s'écarte des valeurs expérimentales dans la région T
> 1000 K. L'écart est dû à l'anharmonicité de la vibration et à son couplage avec la rotation. Cet
effet est particulièrement sensible dans le cas de l'hydrogène à cause de la faible masse des atomes.
En utilisant l'expression plus complète de l'énergie moléculaire vue précédemment, la théorie
statistique donne un meilleur accord avec l'expérience. Dans la pratique, c'est à partir de données
spectroscopiques que l'on détermine les capacités calorifiques des gaz à haute température, avec
une précision bien meilleure que par des mesures calorimétriques.
I.3.4.5. Gaz polyatomiques parfaits

Molécules linéaires
Une molécule linéaire comprenant p atomes possède 3p degrés de liberté, 3 étant relatifs à la
translation et 2 à la rotation. Sur les 3p - 5 degrés de liberté de vibration restants, p - 1 sont relatifs
aux modes normaux de vibration s'effectuant le long de l'axe de la molécule et les 2(p - 2) autres
aux modes de vibration perpendiculaires à cet axe, qui, en raison de la symétrie axiale de la
molécule sont dégénérés 2 à 2. Pour la molécule CO2 par exemple (p = 3), il y a 4 modes de
vibration, deux longitudinaux et deux transversaux dégénérés entre eux (voir la figure ci-dessous).
Ces modes normaux ont respectivement pour nombres d'ondes σ 1 = 1388 cm −1 , σ 3 = 2349 cm −1 et
pour les deux derniers, dégénérés, σ 2 = 667 cm −1 . Notons que les fréquences des modes
transversaux, correspondant à des flexions de la molécule, sont plus faibles que celles des modes
longitudinaux.

En première approximation, l'énergie d'une molécule est la somme


(1) ε = ε (t ) + ε (r ) + ε (v )
de ses énergies de translation, de rotation et de vibration, expression dans laquelle on néglige les
interactions entre rotation et vibration et on omet les énergies électronique et nucléaire. L'énergie
de translation a la forme générale ε (t ) = p 2 / 2m , l'énergie de rotation a la même forme que celle
des molécules diatomiques et l'énergie de vibration est la somme des énergies des 3p - 5
oscillateurs harmoniques relatifs aux modes normaux de vibration.

La fonction de partition relative à une molécule s'écrit alors :


1
(2) Z = Z (t ) Z (r ) ∏ Z i(v )
σ i

La fonction de partition de translation Z (t ) est la même que celle d'un gaz monoatomique. La
fonction de partition Z (r ) = T / Θ r a la même expression que pour un gaz diatomique et le nombre
de symétrie σ s'introduit de la même façon ( σ vaut 2 si la molécule a un centre de symétrie et 1 si
elle n'en a pas). La fonction de partition de vibration est un produit de 3p - 5 fonctions de partition
d'oscillateurs harmoniques relatives, chacune, à un mode normal de vibration.

A partir de la fonction de partition Z, on retrouve toutes les fonctions thermodynamiques. En


particulier, ces gaz suivent l'équation d'état des gaz parfaits Pv = RT et ont pour capacité
calorifique molaire :
Θ
Θ 
2 /T
5 e vi
(3) cV = R + R ∑  vi 
2 i  T 
Θ /T
(
e vi − 1
2
)
expression dans laquelle 5 R / 2 est la somme des capacités calorifiques classiques de translation
( 3R / 2 ) et de rotation (R) et les Θ vi sont les températures caractéristiques de vibration relatives aux
3p - 5 modes de vibration.

Le tableau ci-dessous donne les constantes physiques de quelques gaz polyatomiques linéaires. Les
températures sont obtenues à partir des données spectroscopiques et la dégénérescence d'un mode
de vibration est indiquée entre parenthèses.
Molécule M ( g mole −1 ) σ Θ r (K ) Θ vi (K )
HCN 27 1 2.13 1020 (2) ; 3010 ; 4770
DCN 28 1 1.74 820 (2) ; 2740 ; 3780
N 2O 44 1 0.602 850 (2) ; 1850 ; 3200
CO2 44 2 0.560 960 (2) ; 2000 ; 3380
CS 2 76 2 0.157 570 (2) ; 950 ; 2190
C 2 HD 27 1 1.43 750 (2) ; 980 (2) ; 2660 ; 3720 ; 4800
C2 H 2 26 2 1.63 880 (2) ; 1050 (2) ; 2840 ; 4730 ; 4850

La figure ci-dessous montre la courbe théorique de la capacité calorifique du gaz carbonique CO2 .
Elle est en excellent accord avec les données expérimentales.
Molécules non linéaires
De même qu'une molécule linéaire, une molécule non linéaire de p atomes possèdes 3p degrés de
liberté dont trois sont relatifs à la translation. Son orientation dans l'espace étant caractérisée par
trois angles d'Euler θ , φ et ψ , elle possède, cette fois, 3 degrés de liberté de rotation. Il reste donc
3p - 6 degrés de liberté de vibration certains modes de vibration pouvant être dégénérés selon la
symétrie de la molécule. Par exemple, l'eau H 2 O possède 3 modes de vibration non dégénérés et
l'ammoniac NH 3 6 modes dont deux ne sont pas dégénérés et 4 sont dégénérés 2 à 2.

L'expression de l'énergie d'une molécule polyatomique à la forme (1) et les énergies ε (t ) de


translation et ε (v ) de vibration ont les expressions déjà rencontrées, mais l'énergie ε (r ) de rotation
est différente. Dans le domaine d'existence des gaz, c'est-à-dire au-dessus de leur température
d'ébullition, cette énergie peut être écrite sous la forme classique relative à un corps rigide :
ε (r ) =
1
2 I 1 sin θ
2
[
( pφ − pψ cosθ )cosψ − pθ sin θ sinψ 2 ]
(4)
+
1
2 I 2 sin θ2
[
( pφ − pψ cosθ )sinψ − pθ sin θ cosψ 2 + 1 pψ2
2I 3
]
où pθ , pφ , pψ sont les impulsions associées aux angles θ , φ et ψ et I 1 , I 2 , I 3 sont les moments
d'inertie principaux de la molécule (on se ramène au cas d'une molécule linéaire en faisant ψ = 0 ,
pψ = 0 et I 1 = I 2 ).

La fonction de partition à la même expression (2) que pour une molécule linéaire avec, pour
fonction de partition de rotation :
dθ dpθ dφ dpφ dψ dpψ
(5) Z (r ) = ∫
h h h
exp − β ε (r ) ( )
L'intégration sur pθ , pφ , pψ (dans l'ordre) est laborieuse et conduit à :
(r ) (2πkT )3 / 2 (I 1 I 2 I 3 )1 / 2 π 2π 2π
Z = ∫ dθ sin θ ∫ dφ ∫ dψ
h3 0 0 0
h2
(6) avec Θ ri =
8π 2 I i k
1/ 2
 T3 
=π 1/ 2
 
 Θ r1 Θ r 2 Θ r 3 

Remarquons que cette fonction, pour trois degrés de liberté de rotation, varie en T 3 / 2 alors que
pour une molécule linéaire, à deux degrés de liberté de rotation, elle varie en T.

Le facteur de symétrie σ , égal à 1 pour une molécule asymétrique, est, pour une molécule
symétrique, égal au nombre de façons différentes mais équivalentes d'orienter cette molécule dans
l'espace. Ce facteur, d'origine quantique, provient de l'identité d'atomes pouvant se déduire les uns
des autres par une opération de symétrie directe (rotation). On a par exemple σ = 2 pour l'eau
H 2 O , σ = 3 pour l'ammoniac NH 3 et σ = 12 pour le benzène C 6 H 6 .

La connaissance de la fonction de partition à partir des températures caractéristiques permet de


déterminer les fonctions thermodynamiques.
Molécule M ( g mole −1 ) g Θ r1 (K ) Θ r 2 (K ) Θ r 3 (K ) Θ vi (K )
HDO 19 1 2020 ; 3910 ; ~5200
H 2O 18 2 39.3 21.0 13.7 2290 ; 5250 ; 5400
NH 3 17 3 14.3 9.1 9.1 1370;2340(2);4800;4910(2)
CH 4 16 12 7.56 7.56 7.56 1880(2);2200(2);4190;4350(3)
En particulier, la capacité calorifique molaire, qui se compare directement à l'expérience, a pour
expression :
(7) cV = cV(t ) + cV(r ) + ∑ i cVi(v )

La capacité calorifique de translation a sa valeur classique 3R/2 et les capacités calorifiques de


vibration ont l'expression vue plus haut. La capacité calorifique de rotation obtenue à partir de la
fonction de partition a pour valeur
3
(8) cV(r ) = R
2

On obtient ainsi pour la capacité calorifique molaire d'un gaz de molécules polyatomiques non
linéaires :
Θ
Θ 
2 /T
e vi
(9) cV = 3R + R ∑  vi 
i  T 
Θ /T
e vi − 1(2
)
Rotation gênée
Dans certaines molécules, en particulier des molécules organiques, certains degrés de liberté
définissent l'orientation d'un groupement d'atomes autour d'une liaison, comme pour les groupes
CH 3 dans l'éthane C 2 H 6 (configuration H 3C − CH 3 ). Les interactions d'un groupement avec
l'autre donnent lieu à une énergie potentielle de rotation interne de période 2π / 3 . A basse
température, le groupement oscille autour d'une de ses positions d'équilibre (oscillation de torsion
ou de libration) et la discussion qui précède reste valable. Par contre à plus haute température, le
groupement tourne autour de la liaison en effectuant une rotation gênée. A très haute température,
la rotation peut être considérée comme libre. Dans la fonction de partition, le facteur correspondant
à ce degré de liberté se transforme d'un terme du type Z (v ) en un terme de la forme :
dφ dpφ pφ2
(r )
(10) Z int =∫
h
( )
exp − βε (r ) avec ε (r ) =
2I
soit
1/ 2
(r )  T  h2
(11) Z int =  π  avec Θ r =
 Θr  2 Ik
(éventuellement divisé par le facteur de symétrie σ int relatif au groupement).

La contribution de la rotation gênée à la capacité calorifique (figure ci-dessus) intervient à basse


température sous la forme relative à un oscillateur harmonique et à haute température sous la forme
:
R
(12) cV(rint
)
=
2
correspondant à la forme limite (11) de la fonction de partition de rotation interne. Dans le domaine
de température intermédiaire, un calcul précis doit être effectué tenant compte des caractéristiques
de chaque molécule. Pour l'éthane, l'oscillation de torsion a la température caractéristique
Θ v ≅ 400 K et la rotation correspond à la température Θ r = 7.6 K avec σ int = 3 .
I.3.4.6. Mélange parfait de gaz parfaits

Fonctions thermodynamiques en variables T, V, N i


Le mélange parfait de gaz parfaits est un modèle dans lequel on néglige l'énergie d'interaction entre
molécules d'un même gaz et entre molécules de gaz différents. Ce modèle, comme celui d'un gaz
parfait, n'est valable que pour un mélange dont la pression totale n'est pas trop grande.

Considérons un récipient contenant un mélange de p gaz comprenant N i molécules pour le gaz i (i


= 1, 2, …, p). L'énergie du mélange s'écrit :

(1) F (T , V , N 1 , N 2 , K N p ) = ∑ Fi (T , V , N i )
p

i =1

où Fi s'exprime à partir de la fonction de partition Z i par :


 Z 
(2) Fi (T , V , N i ) = − N i kT ln i + 1
 Ni 
en effet, les énergies d'interaction des différentes molécules sont négligeables et chaque gaz se
comporte d'un point de vue microscopique comme s'il était seul dans le récipient. Les grandeurs
thermodynamiques extensives du mélange s'obtiennent alors en additionnant les grandeurs
correspondantes de chaque gaz considéré comme s'il occupait seul le volume V à la température T.

A partir de l'expression de F, ou indirectement, on peut écrire pour les grandeurs extensives


suivantes
 Z  ∂ ln Z i  
(3) S = ∑ S i avec S i = N i k ln i + 1 + T   
i  Ni  ∂T V 
 ∂ ln Z i 
(4) U = F + TS = ∑ U i avec U i = N i kT 2  
i  ∂T V
 ∂U   ∂ 2 ln Z i 
(5) CV = ∑ CVi avec CVi =  i  = N i kβ 2  

 ∂T V , Ni  ∂β
2
i V
Notons que, comme pour un gaz parfait, l'énergie interne et la capacité calorifique du mélange ne
dépendent que de T. L'expression de la pression s'obtient par dérivation :
 ∂F    ∂ ln Z i  
(6) P = −  = ∑  N i kT   
 ∂V  T , N i i   ∂V  T 

Nous avons vu que, pour chacun des gaz, on a :


(7) Z i = Vf i (T )
d'où
N kT NkT
(8) P = ∑ i =
i V V
on obtient ainsi, en introduisant le nombre total N = ∑ N i de molécules, la même équation d'état
que pour un gaz parfait pur. Il est intéressant d'introduire la pression partielle Pi du gaz i définie
comme étant la pression qu'aurait ce gaz s'il occupait seul le volume V, soit :
N kT
(9) Pi = i
V

L'expression (8) montre que la pression d'un mélange parfait de gaz parfaits est la somme des
pressions partielles des constituants (loi de Dalton) :
(10) P = ∑ Pi
i

Le potentiel chimique µ i relatif à une molécule de gaz i a pour expression :


 ∂F   ∂F  Z
(11) µ i =   =  i  = − kT ln i
 ∂N  T ,V , N j ≠ i  ∂N i  Ni
c'est le potentiel chimique qu'aurait le gaz i s'il occupait seul le volume V.
Fonctions thermodynamiques en variables T, P, N i
Dans la plupart des applications, il est préférable de considérer la variable de pression P et la
fonction enthalpie libre G = F + PV plutôt que le volume et l'énergie libre. En utilisant les
expressions (1) et (8) de F et P, on obtient
Z
(12) G = −∑ N i kT ln i = ∑ N i µ i
i Ni i

Explicitons alors Z i et µ i en variables T, P, N, à partir des expressions (7) et (8). On a :


N kT
f i (T ) = i f i (T )
NkT
(13) Z i =
P Pi
et
 N kT   kT 
(14) µ i = − kT ln  f i (T ) = −kT ln  f i (T )
 Ni P   Pi 

En définissant la fraction molaire du gaz i dans le mélange par :


N P
(15) X i = i = i
N P
∑i X i = 1
on obtient :
 kT 
µ i = −kT ln  f i (T ) + kT ln X i
(16) P 
= g i (T , P ) + kT ln X i
où g i (T , P ) est l'enthalpie libre par molécule (ou potentiel chimique) du gaz i pur pris à la
température T et à la pression P du mélange. On en déduit l'expression de G :
 kT 
(17) G = −∑ N i kT ln  f i (T ) + ∑ N i kT ln X i
i P  i

En utilisant l'expression :
(18) dG = − SdT + VdP + ∑ µ i dN i
i

on peut déterminer les diverses grandeurs thermodynamiques en variables T, P, N i .

On peut obtenir directement la fonction enthalpie H = U + PV du mélange à partir des expressions


(4) et (8) de U et P :
 ∂ ln Z i 
(19) H = ∑ N i kT 2   + NkT
i  ∂T V

L'expression (7) de Z i permet alors d'écrire :


d 1
(20) H = ∑ N i hi avec hi = kT 2  ln f i (T ) + 
 dT T
hi étant l'enthalpie moléculaire partielle du gaz i dans le mélange.

Entropie de mélange. Paradoxe de Gibbs


On considère un système formé de deux gaz parfaits, pris à mêmes température et pression, situés
dans deux compartiments séparés par une cloison (figure (a) ci-dessous).

On supprime la cloison et les deux gaz se mélangent par diffusion à température et pression
constantes (figure (b) ci-dessus). Les variations ∆V et ∆U du volume total et de l'énergie interne
entre l'état final et l'état initial sont nulles. En effet, le volume initial
= (N1 + N 2 )
kT kT kT
(21) V1 + V2 = N 1 + N2
P P P
est égal au volume final d'après (8) et, la température ne changeant pas, l'énergie interne (4) du
système ne change pas. Ceci a pour conséquence que le système ne reçoit pas de travail de la part
des forces de pression ni de chaleur de la part du thermostat maintenant la température constante.

Pour calculer la variation d'entropie ∆S , remarquons que ∆G = ∆u + P∆V − T∆S = −T∆S . Comme,
à partir de (12) et (16), on a
(22) ∆G = ∑ N i kT ln X i
i
il s'ensuit que la variation d'entropie vaut
(23) ∆S = −( N 1k ln X 1 + N 2 k ln X 2 )

Cette variation, appelée entropie de mélange, est positive car les fractions molaires X 1 et X 2 sont
inférieures à 1. Dans le cas particulier où N 1 = N 2 = N / 2 , on a X 1 = X 2 = 1 / 2 et l'entropie de
mélange vaut :
(24) ∆S = Nk ln 2

Cet accroissement positif de l'entropie correspond au fait que la transformation est adiabatique et
irréversible.

Un paradoxe, dit paradoxe de Gibbs, semble apparaître lorsque les deux gaz sont de même nature.
En effet, une telle transformation n'est plus irréversible : le rétablissement de la cloison redonne
l'état initial. En d'autres termes, la variation d'entropie est nulle pour des raisons d'extensivité et non
positive comme celle donnée par (23). La solution de ce paradoxe provient du fait que les
molécules de gaz occupant les deux compartiments sont identiques, donc ne sont plus discernables
les unes des autres. On ne peut plus alors écrire S = S1 + S 2 après enlèvement de la cloison car on
ne peut pas calculer la probabilité thermodynamique W d'une fraction du gaz sans tenir compte de
l'autre fraction : on a dans ce cas W ≠ W1 ⋅ W2 . Notons que, dans le cas d'un mélange d'isotopes
( H 2 et HD par exemple), les molécules sont discernables et il existe bien une entropie de
mélange. Toutefois, les proportions d'isotopes restant constants dans toute transformation chimique,
cette entropie de mélange est en général omise.
I.3.4.7. Equilibre chimique dans un mélange parfait de gaz parfaits

Loi d'action de masse


Considérons par exemple la réaction chimique qui se produit spontanément à haute température :
(1) 2 H 2 + O2 → 2 H 2 O

Par généralisation nous écrivons une réaction chimique sous la forme :


(2) ∑ν i Ai → ∑ν ′j A′j
i j

où Ai , A′j représentent les formules chimiques des substances écrites à gauche (réactifs) et à droite
(produits) de la flèche et ν i , ν ′j leurs coefficients stœchiométriques.

Dans le cas de réactions entre gaz seuls, les substances forment un mélange gazeux que l'on peut
supposer parfait en première approximation. A partir d'un mélange initial hors d'équilibre en
proportions quelconques définies par N i0 et N ′j 0 , la réaction fait évoluer le système vers un état
d'équilibre, les variations élémentaires des nombres de molécules étant liées par :
dN i dN ′j
(3) − = = dλ
νi ν ′j
le paramètre λ caractérise l'état d'avancement de la réaction. Par intégration, cette relation devient :
(4) N i = N i0 − ν i λ et N ′j = N ′j 0 + ν ′j λ
où λ = 0 correspond à l'état initial de la réaction.

La condition d'équilibre d'un système chimique maintenu à température T et pression P constantes


est la condition du minimum de son enthalpie libre G (T , P, N i ) . D'après la relation
dG = − SdT + VdP − ∑ µ i dN i , cette condition s'écrit :
(5) ∑ µ dN + ∑ µ ′ dN ′ = 0
i
i i
j
j j

ou, en utilisant (3) :


(6) ∑ν µ = ∑ν ′ µ ′
i
i i
j
j j

Cette relation est appelée loi d'action de masse.

Détermination de la constante d'équilibre K p


En explicitant, dans la loi d'action de masse, les potentiels chimiques, on obtient :
 kT   kT 
(7) ∑ν i ln  f i (T ) = ∑ν ′j ln  f j′ (T )
i  Pi  j  Pj′ 
ou
 kTf j′ (T )  j
ν′
 kTf i (T )  i
ν

(8) ∏   = ∏ 
i  Pi   P′ 
j  j 
Pi et Pj′ représentant les pressions partielles des constituants à l'équilibre, ou encore :
 ∏ Pj′ν ′j  ∏ [kTf ′(T )]
ν ′j

 j  j

 = ≡ K p (T )
j
(9) 
 ∏ Pi ∏ [kTf (T )]
νi νi
 i
 i  éq. i

Ce résultat remarquable montre que, quelles que soient les proportions initiales des réactifs et des
produits, à l'équilibre le rapport des pressions partielles élevées à la puissance stœchiométrique est
une fonction de la température seule K p (T ) appelée constante d'équilibre. De plus, il montre que
K p peut être déterminé par la connaissance des fonctions de partition et donc des fonctions f i (T )
relatives aux différentes molécules en présence et déterminées à partir des niveaux d'énergie des
molécules.

Dans cette relation il faut prendre garde au fait que les fonctions de partition doivent être évaluées,
non pas en prenant pour origine des énergies pour chaque type de molécule, comme on le fait
habituellement, son propre niveau de base, mais en considérant une origine commune des énergies.
( )
Il faut alors remplacer Z i par Z i exp − βε i0 , c'est-à-dire aussi f i (T ) par f i (T ) exp(− βε i0 ) , où ε i0
est l'énergie du niveau de base de la molécule i évalué relativement à l'origine commune. On a alors
:
[
∏ f j′(T ) j
ν′
]
(10) K p (T ) = (kT )∆ν e −∆ε
j 0 / kT

∏ [ f (T )]
νi
i
i
avec
(11) ∆ν = ∑ν ′j − ∑ν i et ∆ε 0 = ∑ν ′j ε ′j 0 − ∑ν i ε i0
j i j i

Dans la pratique, on tabule pour chaque sorte de molécule la quantité :


(12) D0 = −∆ε 0
∆ε 0 correspondant à la réaction de synthèse à partir d'atomes libres ( ∆ε 0 < 0 pour une molécule
stable). Ces tables permettent de calculer la quantité ∆ε 0 relative à toute réaction.

Déplacement de l'équilibre en fonction de la température


Il est intéressant de savoir dans quel sens se déplace l'équilibre lors d'une variation de température,
de façon à choisir la température à laquelle il est avantageux d'effectuer une réaction. Lorsque K p
est une fonction croissante de T, la réaction avance par élévation de température, c'est-à-dire que
les réactifs notés à gauche de la formule (2) se transforment en produits notés à droite. Pour étudier
la variation de K p avec la température, on considère la fonction ln K p (T ) :
(13) ln K p = ∑ν ′j ln f j′ (T ) − ∑ν i ln f i (T ) + ∆ν ln (kT ) − ∆ε 0 / kT
j i

La dérivation de ln K p par rapport à T donne :


∆ν ∆ε 0
ln f j′ (T ) − ∑ν j ln f i (T ) +
d d d
ln K p = ∑ν ′j +
dT j dT i dT T kT 2
(14)
d 1 ε ′j  1 ε i0 
0
d
= ∑ν ′j  ln f j′ (T ) + +  ∑ i
− ν ln f i (T ) + + 
j  dT T kT 2  i  dT T kT 2 
expression qui peut s'écrire simplement :

d
∑j ν ′j h′j − ∑i ν i hi
(15) ln K p =
dT kT 2
en utilisant l'expression des enthalpies moléculaires partielles compte tenu de l'origine commune
des énergies : hi → hi + ε i0 . En multipliant le numérateur et le dénominateur du second membre par
le nombre d'Avogadro N on obtient :
d ∆H
(16) ln K p = avec ∆H = ∑ν ′j h j′ − ∑ν i hi
dT RT 2 j i

où hi , h j′ sont les enthalpies molaires partielles des substances i et j. Ce résultat constitue la loi de
van't Hoff, qui montre que, lors d'une élévation de température :
 L'équilibre se déplace vers la droite si ∆H est positif (cas d'une réaction endothermique).
 L'équilibre se déplace vers la gauche si ∆H est négatif (cas d'une réaction exothermique).

La quantité ∆H (mesurée en J mole −1 ) est numériquement égale à la variation d'enthalpie


(mesurée en J) lors d'une réaction supposée totale transformant un mélange initial constitué des
seuls réactifs en nombre de moles respectifs égaux à ν i en un mélange final constitué des seuls
produits en nombre de moles respectifs égaux à ν ′j . Il est usuel de désigner par chaleur de réaction
( Q = − ∆H ) l'opposé de ∆H , de sorte que Q soit positif pour une réaction exothermique.

Dans la pratique, pour obtenir les produits de la réaction il est donc favorable d'opérer à haute
température lorsque la réaction est endothermique et à basse température si la réaction est
exothermique. Dans ce dernier cas, la vitesse de réaction décroissant quand la température croît, on
est alors conduit à utiliser des catalyseurs en travaillant à une température optimale. Ajoutons qu'un
accroissement de pression totale déplace l'équilibre vers la droite si ∆ν est négatif et vers la
gauche si ∆ν est positif (loi de Le Chatelier).
Exercices de compréhension
1. On considère un litre d'argon ( M = 39.9 g mole −1 ) à 300 K et une atmosphère. Evaluez le
nombre d'atomes, leur distance moyenne D comparée à la longueur d'onde de de Broglie Λ et à
leur diamètre d = 3.76 Å .

Réponse : N = 2.45 × 10 22 , D = 34.4 Å ~ 10d, Λ = 4.7 × 10 −3 D .


2. Trouvez l'énergie cinétique moyenne ε d'un atome d'argon dans le gaz à 300 K. En déduire la
vitesse quadratique moyenne u d'un atome.

Réponse : ε = 3.9 × 10 −2 eV , u = 430 m s −1


3. Calculez le rapport de la population du premier niveau électronique excité (11.55 eV, J = 2) à
celle du niveau fondamental de l'argon (J = 0) à T = 300 K.

Réponse : N 1 / N 0 = 5 × 10 −194
4. Faire l'étude d'un gaz monoatomique parfait à deux dimensions d'aire A (section I.3.4.2).
Déterminez en particulier la fonction de partition, l'équation d'état, l'énergie interne, la capacité
calorifique à surface constante et l'entropie.

Réponse : Z (t ) = ( A2πmkT ) / h 2 .
5. Montrez que le moment d'inertie d'une molécule diatomique a la forme I e = µre2 . Calculez re
pour l'oxyde de carbone CO ( Be = 1.931 cm −1 ).

Réponse : re = 1.13 Å .
6. En partant de l'expression (8) de la section I.3.4.3 des niveaux d'énergie de vibration - rotation
et en utilisant les constantes moléculaires de HBr données dans les exercices à la fin de la
section I.3.4.3, retrouvez la formule donnant la position des raies.
7. Le spectre de vibration - rotation de HBr gazeux obtenu à plus grande résolution présente un
79 81
doublement de chaque raie correspondant aux deux isotopes Br et Br . L'analyse des
spectres a fourni les valeurs des constantes moléculaires suivantes : pour HBr 79 ,
ω e = 2649.855 cm −1 et Be = 8.4678 cm −1 , pour HBr 81 , ω e = 2649.450 cm −1 et
Be = 8.4652 cm −1 . Expliquez pourquoi l'écartement des deux composantes de chaque raie est
de l'ordre de 0.4 cm −1 quel que soit m. Interprétez, en utilisant la masse réduite µ , l'écart entre
les valeurs de ω e et de Be pour les deux molécules (on réfléchira à la raison pour laquelle re a
la même valeur).

Réponse : δBe / Be = 2δω e / ω e = −δµ / µ = 3.1 × 10 −4 .


8. Montrez que, dans le spectre Raman d'une molécule diatomique, la bande de rotation pure
présente de raies de diffusion dont la différence de nombre d'ondes avec la raie excitatrice obéit
à la loi : ∆σ = ± Be (2m + 6 ) . Faire un schéma semblable à la première figure de la section
I.3.4.3.
9. En utilisant la figure avec le spectre de vibration - rotation de HBr gazeux dans les exercices à
la fin de la section I.3.4.3, déterminez de façon approximative les températures caractéristiques
de vibration Θ v et de rotation Θ r du gaz bromhydrique ainsi que la température T du gaz lors
de l'expérience.

Réponse : T ~ 300 K.
10. Quel est, à température ordinaire, le niveau de rotation le plus peuplé pour CO ( Θ 2 = 2.8 K ) t
pour HD ( Θ r = 66 K ).

Réponse : K = 7, K = 1.
11. Calculez la fraction de molécules d'un gaz HD sur les niveaux de rotation K ≤ 2 à T = 300 K et
à T = 40 K ( Θ r = 65.7 K ). On prendra, selon la valeur de T, l'expression convenable de Z (r ) .

Réponse : K = 0 : 0.22 et 0.90, K = 1 : 0.42 et 0.10, K = 2 : 0.29 et 2 × 10 −4 .


12. Calculez la fraction du nombre de molécules du gaz HBr se trouvant sur le premier niveau
excité à T = 300 K et T = 1000 K ( Θ v = 3800 K ).
Réponse : 3.2 × 10 −6 et 2.3 × 10 −2 .
13. Construisez de façon explicite les trois fonctions d'onde de spin nucléaire correspondant à
l'orthohydrogène, ainsi que celle correspondant au parahydrogène.
14. A partir de l'expression donnant l'interaction entre deux dipôles magnétiques, retrouvez l'ordre
de grandeur de la différence d'énergie nucléaire entre les états ortho et para de la molécule H 2
(distance des noyaux à l'équilibre re ≅ 1 Å ).

Réponse : environ 10 −6 K .
15. Interprétez à l'aide de la relation de Boltzmann liant l'entropie à la probabilité thermodynamique
W, le fait que l'entropie d'un gaz symétrique diatomique contient un terme supplémentaire égal
à − Nk ln 2 .
16. Quelle serait la composition en para et ortho du gaz hydrogène thermodynamiquement stable à
la température T = Θ r .

Réponse : 71% et 29%.


17. Une mole d'hydrogène prise à température ordinaire est liquéfiée ( TE = 20.4 K ). Evaluez
l'énergie libérée lors de la transformation de l'état métastable (para : 25%, ortho : 75%) à l'état
stable. Comparez à la chaleur latente de vaporisation (on donne Θ r = 87.5 K et
L = 900 J mole −1 ).

Réponse : 1100 J mole −1 .


18. Montrez que les raies de diffusion Raman d'une bande présentent, dans le cas d'une molécule
diatomique symétrique, une alternance d'intensité due à l'existence des espèces moléculaires
para et ortho.
19. Vérifiez que le nombre de symétrie σ est respectivement égal à 2, 3, 2, 2 et 4 pour les
molécules suivantes : N2, CH3Cl, CH2Cl2, C6H5Cl, C2H4.
20. Calculez la capacité calorifique molaire cV du méthane CH4 à 873 K et comparez à la valeur
expérimentale c P = 16.8 calories K −1mole −1 . Interprétez la différence.
Réponse : c P = cV + R = 15.9 cal K −1 mole −1 .
21. Donnez les valeurs approximatives de la capacité calorifique molaire cV vers 300 K, ainsi que
le rapport γ = c P / cV pour les gaz suivants : He, HCl, N2, CO2, H2O, C2H2, CH3Cl.

Réponse : cV / R = 3 / 2,5 / 2,5 / 2,5 / 2,3,3,3 , γ = 5 / 3,7 / 5,7 / 5,7 / 5,4 / 3,4 / 3,4 / 3 .
22. Montrez, par des considérations d'extensivité, que la fonction de partition Z(T, V) relative à une
particule d'un gaz parfait est de la forme Z = V f(T) et en déduire que l'équation d'état de ce gaz
est Pv = RT.
23. A 400 K, la réaction chimique de synthèse de l'ammoniac, N2 + 3H2  2NH3 a pour chaleur
de réaction Q = 25.5 kcal mole −1 . Précisez le sens des variations de température et de pression
favorisant la réaction.

Réponse : T décroissant, P croissant.


Problème 1

Courbe de sublimation d'un solide


On se propose d'établir l'équation de la courbe de sublimation P(T) d'un solide à partir des données
atomiques et de la confronter aux données expérimentales relatives au zinc. On rappelle que les
conditions d'équilibre entre deux phases (1) et (2) sont T1 = T2 et µ1 = µ 2 , où µ i représente le
potentiel chimique relatif à une particule de la phase i.

Potentiel chimique d'un gaz parfait monoatomique


On prend, pour la phase vapeur du zinc, le modèle d'un gaz parfait monoatomique obéissant à la
statistique de Maxwell-Boltzmann corrigée. L'énergie libre du gaz a, dans ce cas, l'expression
 Z 
(1) F = − NkT  ln + 1
 N 
où Z est la fonction de partition relative à une particule et N le nombre de particules.

1. Rappelez la définition générale de la fonction de partition Z.


2. L'énergie d'un atome du gaz étant relative à la translation seulement ( ε = p 2 / 2m ), déterminez
l'expression de la fonction de partition Z ≡ Z (t ) .
3. Ecrivez l'expression générale de la différentielle de l'énergie libre en variables T, V, N et
déduisez-en la pression P et le potentiel chimique µ du gaz en fonction de Z.
4. Explicitez P et µ en variables T, V, N.
5. Déduisez-en l'expression de µ en variables T et P. On introduira dans cette expression la
constante universelle

(2) i0 = ln
(2π ) k 5 / 2
3/ 2
= 18.22 SI
N3 / 2 h 3
ainsi que la masse molaire M du gaz.
Potentiel chimique d'un solide dans le modèle d'Einstein
On prend pour la phase solide le modèle d'Einstein dans lequel le solide est assimilé à un ensemble
de N' atomes localisés vibrant, autour de leur position d'équilibre, comme des oscillateurs
harmoniques à trois dimensions, indépendants et de même fréquence constante ν . L'énergie de
vibration d'un atome s'écrit alors :
(3) ε n1 , n2 ,n3 = (n1 + n2 + n3 )hν
avec ni entier, positif ou nul. Dans ce modèle, où l'on utilise la statistique de Maxwell-Boltzmann,
l'énergie libre du solide a la forme :
(4) F ′ = − N ′l 0 − N ′kT ln Z ′
où Z' est la fonction de partition relative à un atome et le terme N ′l 0 représente l'énergie de
cohésion du solide (énergie de liaison et énergie de vibration au zéro absolu, 3hν / 2 par
oscillateur).

1. Montrez que la fonction Z' se factorise en un produit de trois fonctions identiques Z (v ) et


déterminez Z'.
2. Déduisez-en l'expression de la fonction F'(T, N') et celle du potentiel chimique µ ′(T ) . On
introduira la température caractéristique Θ = hν / k .

Courbe de sublimation du zinc


1. En écrivant les conditions d'équilibre entre la phase gazeuse et la phase solide, trouvez
l'équation de la courbe de sublimation sous la forme ln P = f(T).
2. En se plaçant dans le cas limite T >> Θ , montrez que cette équation se met sous la forme :
C  1 
(5) ln P = A + B ln T + + O 2 
T T 
3. Calculez les valeurs des paramètres A, B, C pour le zinc, pour lequel on a :
M = 65.38 g mole− 1 , Nl 0 = 1.30 × 10 5 J mole −1 et Θ ≅ 240 K . Comparez à la formule
représentant les résultats expérimentaux dans le domaine 500 à 600 K :
1.64 × 10 4
(6) ln P(Pa ) = 30.09 − 0.5 ln T (K ) −
T (K )
On donne la constante des gaz parfaits R = 8.315 J K −1 mole −1 .

Solution

Potentiel chimique d'un gaz parfait monoatomique


Le cas d'un gaz monoatomique parfait est traité en détail dans la section I.3.4.2. Rappelons
l'expression du potentiel chimique en variables T et P :
 kT (2πmkT )3 / 2 
= − kT ln  
 P h3 
(7)
5 3 
− − kT  ln T − ln P + i0 + ln M 
2 2 

Potentiel chimique d'un solide dans le modèle d'Einstein


1. L'énergie d'un atome étant la somme de trois termes indépendants, la fonction de partition se
factorise en un produit de trois termes identiques. On a :
3

[ ]
3
(v ) ∞   1 
(8) Z ′ = Z = ∑ e − β nhν  = 
3
− β hν 
 n =0  1 − e 
2. On en déduit, avec βhν = Θ / T :
(
F ′ = − N ′l 0 + 3 N ′kT ln 1 − e − Θ / T)
 ∂F ′ 
(9)
µ′ =   = −l 0 + 3kT ln 1 − e( −Θ / T
)
 ∂N ′  T

Courbe de sublimation du zinc


1. L'égalité des températures et des potentiels chimiques des deux phases entraîne la relation
µ (T , P ) = µ ′(T ) qui, explicitée, donne :
(10) ln P = i0 + ln M + ln T − 0 + 3 ln (1 − e − Θ / T )
3 5 l
2 2 kT
2. Dans le cas limite T >> Θ , un développement en série donne :
Θ  Θ Θ
( )
(11) ln 1 − e Θ / T = ln  1 −

+ L = ln Θ − ln T − +L
 T  2T  2T

La courbe de sublimation (10) a donc pour équation :


3 1 l + 3kΘ / 2  1 
(12) ln P = i0 + ln M + 2 ln Θ − ln T − 0 + O 2 
2 2 kT T 

Cette équation a bien la forme recherchée.


3. Les paramètres A, B et C ont les valeurs numériques suivantes :
3
A = i0 + ln M + 3 ln Θ = 30.6 SI
2
(13) B = −0.5
l + 3kΘ / 2 Nl 3Θ
C=− 0 =− 0 − = −1.60 × 10 4 K
k R 2

Les coefficients ainsi obtenus sont très proches (à 2% près) de ceux qui ont été obtenus par
l'expérience. Remarquons cependant que la formule théorique prédit, pour T = 550 K par
exemple, une pression de valeur P = 1.9 × 10 −1 Pa , alors que la formule expérimentale donne
P = 5.6 × 10 −2 Pa , soit environ trois fois moins. Ceci provient d'une part du fait que la formule
donnant ln P se présente sous la forme d'une différence dans laquelle A et C/T se compensent
presque, d'où une perte de précision, et d'autre part du fait que P s'obtient à partir de ln P en
effectuant une exponentielle.
Problème 2

Etude thermodynamique de l'azote N2 gazeux

Comparaison des entropies spectroscopiques et calorimétriques


On se propose de comparer la valeur de l'entropie de l'azote gazeux à son point d'ébullition normale
T = 77.3 K , obtenue par des mesures calorimétriques, à celle qui est prévue théoriquement dans le
modèle des gaz parfaits à partir des grandeurs moléculaires déterminées par spectroscopie. La
molécule d'azote N2 est une molécule symétrique constituée de deux atomes identiques. On ne
tiendra pas compte de son spin nucléaire I.

1. Ecrivez la différentielle de l'énergie libre F du gaz en variables T, V, N et montrez que,


connaissant l'expression de F, on peut déterminer l'entropie S et la pression P du gaz.
2. En statistique de Maxwell-Boltzmann corrigée, l'énergie libre a pour expression
 Z 
(1) F = − NkT  ln + 1
 N 
où Z est la fonction de partition relative à une particule. En déduire l'expression de l'entropie et
la pression en fonction de Z.
3. Sous certaines approximations, on peut considérer que l'énergie de chaque niveau d'une
molécule d'azote est la somme d'énergies de translation, de rotation et de vibration et que la
dégénérescence associée est le produit des dégénérescences correspondantes. Montrez alors que
la fonction de partition Z se factorise en un produit de trois fonctions de partition Z (t ) , Z (r ) et
Z (v ) .
4. Pourquoi la pression se déduit-elle de l'expression de Z (t ) seule ?
5. Montrez que l'entropie est la somme de trois termes S (t ) , S (r ) et S (v ) . Justifiez la forme de S (t )
différente de celles de S (r ) et de S (v ) .
6. Déterminez la fonction de partition de translation Z (t ) .
7. Explicitez les expressions de la pression P et de l'entropie S (t ) en variables T, V, N.
8. En déduire l'expression de S (t ) en variables T, P, N. On introduira la constante universelle

(2) i0 = ln
(2π ) k 5 / 2
3/ 2
= 18.22 SI
N3 / 2 h 3
ainsi que la masse molaire M du gaz.
9. Calculez la valeur numérique de l'entropie molaire de translation s (t ) de l'azote à sa température
d'ébullition à pression atmosphérique TE , sachant que la masse molaire de ce gaz est
M = 28.01 g mole −1 .
10. L'énergie du niveau de rotation K d'une molécule d'azote peut s'écrire :
(3) ε K(r ) = K (K + 1)kΘ r
où Θ r = 2.89 K est la température caractéristique de rotation, la dégénérescence associée étant
2K+1.

Déterminez la fonction de partition de rotation Z (r ) en introduisant le facteur de symétrie σ de


la molécule.
11. Déduisez-en l'expression de l'entropie de rotation S (r ) .
12. Calculez numériquement l'entropie molaire s (r ) de l'azote à 77.3 K.
13. Le nombre d'ondes de la vibration de l'azote est ω e = 2360 cm −1 . Expliquez pourquoi l'entropie
de vibration peut être considérée comme nulle à 77.3 K.
14. Pour comparer cette valeur, dite spectroscopique, de l'entropie à sa valeur expérimentale, dite
calorimétrique, on dispos des données suivantes à pression atmosphérique :
i. Variations d'entropie molaire obtenues par intégration numérique de c P / T pour les deux
phases solides β et α et la phase liquide :
s (35.61 K ) − s (0 K ) = 27.16 J K -1mole -1
s (63.14 K ) − s (35.61 K ) = 23.38 J K -1 mole -1
s (77.3 K ) − s (63.14 K ) = 11.41 J K -1 mole -1
ii. Chaleurs latentes molaires de changement de phase :
(β → α )L(35.61 K ) = 229.0 J mole −1
(α → liq .)L(63.14 K ) = 721.1 J mole −1
(liq . → vap .)L(77.3 K ) = 5577 J mole −1
Calculez les variations d'entropie molaire lors des trois changements de phase.
15. Déduisez-en la valeur de la différence s (77.3 K ) − s (0 K ) .
16. Faites la comparaison des valeurs spectroscopique et expérimentale de l'entropie et discutez.

Ortho et paraazote
Nous étudions dans cette partie les conséquences, pour l'entropie, du fait que la molécule d'azote est
constituée de deux atomes identiques dont le spin nucléaire est I = 1.

1. Calculez la dégénérescence nucléaire de chacun des deux atomes, puis celle de la molécule.
Déduisez-en le terme de l'entropie molaire du gaz, habituellement omis, relatif à cette
dégénérescence.
2. Compte tenu de la valeur du spin nucléaire des atomes d'azote, indiquez la symétrie de la
fonction d'onde totale de la molécule relativement à l'échange des noyaux.
3. La fonction d'onde totale étant le produit des fonctions d'onde de translation ψ (t ) , de rotation
ψ (r ) , de vibration ψ (v ) , électronique ψ (e ) et nucléaire ψ (n ) , déduisez-en la symétrie du produit
ψ (r )ψ (n ) .
4. La fonction d'onde ψ (r ) ayant la parité (− 1) , où K est le nombre quantique de rotation,
K

déduisez-en la symétrie de la fonction d'onde nucléaire selon la valeur de K.


5. Les fonctions d'onde nucléaires d'un atome d'azote étant notées m (m = 1, 0, -1), écrivez et
dénombrez les combinaisons indépendantes symétriques (orthoazote) et antisymétriques
(paraazote) des fonctions d'ondes nucléaires m1 m2 de la molécule.
6. Déduisez-en les proportions de molécules ortho et para dans le domaine de température
T >> Θ r .
7. Représentez graphiquement les niveaux d'énergie de rotation pour les types ortho et para de
molécules et indiquez leurs dégénérescences (de rotation et nucléaire). Précisez, en particulier,
la dégénérescence du niveau le plus bas de chaque espèce.
8. On se propose de déduire de l'accord entre les entropies spectroscopique et calorimétrique l'état
du solide à basse température en tenant compte de la dégénérescence de spin nucléaire.

Déterminez la probabilité thermodynamique W puis l'entropie du solide au zéro absolu dans


l'hypothèse où, la transition para  ortho s'étant effectuée, toutes les molécules d'azote se
trouvent dans le niveau de rotation le plus bas.
9. Quelle serait l'entropie du solide au zéro absolu si, la transition para  ortho n'ayant pas lieu,
toutes les molécules d'orthoazote et de paraazote se trouvaient dans leur niveau d'énergie de
rotation respectif de plus basse énergie ? Le solide étant alors le mélange de deux espèces, en
nombre N O (ortho ) et N P (para ) , on devra tenir compte d'une entropie de mélange de la forme
S = k ln ( N ! / N O ! N P !) .
10. Quelle serait l'entropie au zéro absolu si, la transition para  ortho n'ayant pas lieu, la
rotation des molécules para était cependant bloquée dans le solide ?
11. Laquelle des hypothèses précédentes doit être retenue au vu des résultats expérimentaux ?

Données numériques : constante des gaz parfaits R = 8.314 J K −1 mole −1 , rapport


hc / k = 1.44 cm K , pression atmosphérique 1 atm = 1.013 × 10 5 Pa .

Solution

Comparaison des entropies spectroscopiques et calorimétriques


1. Voir les équations (6) et (7) de la section I.3.4.1.
2. Id.
3. L'additivité des énergies ε (t ) , ε (v ) et ε (r ) entraîne la factorisation de la fonction de partition
(section I.3.4.2).
4. Des trois fonctions de partition, seule Z (t ) dépend du volume, d'où :
 ∂ ln Z   ∂ ln Z (t ) 
(4) P = NkT   = NkT  
 ∂V  T  ∂V  T
5. La fonction de partition n'intervenant que par son logarithme dans l'expression de l'entropie, on
peut écrire S = S (t ) + S (r ) + S (v ) , avec :
S (t ) Z (t )  ∂ ln Z (t ) 
= ln + 1 + T  
Nk N  ∂T V
S (r ) d ln Z (r )
(6) = ln Z (r ) + T
Nk dT
(v )
S (v ) d ln Z (v )
= ln Z + T
Nk dT

On a rattaché le terme d'indiscernabilité − k ln N ! à l'entropie de translation S (t ) .


6. La fonction de partition de translation a été calculée en (11) de la section I.3.4.2.
7. En explicitant Z (t ) , on obtient les relations (16) et (22) de la section I.3.4.2 au terme en
ln(2 J + 1) près.
8. En passant en variables T, P, N, on obtient
S (t ) 5 5 3
(7) = ln T − ln P + + i0 + ln M
Nk 2 2 2
9. Avec T = 77.3 K, P = 1.013 × 10 Pa et M = 28.01 × 10 −3 kg mole −1 , on obtient :
5

s (t ) = 122.23 J K −1 mole −1 .
10. La température d'ébullition de l'azote étant grande devant la température de rotation Θ r , on
peut considérer K comme un variable continue. Si la molécule était asymétrique on aurait
Z (r ) = T / Θ r (section I.3.4.3). La molécule d'azote étant symétrique, on sait que l'on doit
diviser cette expression par le facteur de symétrie σ = 2 , soit : Z (r ) = T / 2Θ r (section I.3.4.4).
11. L'entropie de rotation est donc :
 T 
(8) S (r ) = Nk ln + 1
 2Θ r 
12. Numériquement on obtient pour l'entropie molaire de rotation s (r ) = 29.88 J K −1mole −1 .
13. Le nombre d'ondes de vibration étant ω e = 2360 cm −1 , la température caractéristique de
vibration Θ v = hcω e / k vaut 3395 K. L'azote à 77.3 K se trouve dans un état tel que T << Θ v .
Seul le niveau fondamental de vibration est peuplé et l'entropie de vibration est nulle. Le calcul
montre que sa valeur est de l'ordre de 10 −17 J K −1 mole −1 .
14. L'entropie molaire de l'azote vaut donc s = s (t ) + s (r ) = 152.11 J K −1 mole −1 .
15. Lors d'un changement de phase on a ∆s = L / T , soit pour les trois transitions respectivement :
∆s = 6.43, 11.42 et 72.15 J K −1mole −1 .
16. La comparaison des deux valeurs montre que la méthode statistique employée est valable ainsi
que le troisième principe. Un calcul théorique plus précis tenant compte des interactions et de la
déformation de la molécule lors de sa rotation ne modifie pas ces conclusions. Notons que nous
n'avons pas tenu compte explicitement de la dégénérescence de spin nucléaire. Nous discutons
de cet aspect plus loin.

Ortho et paraazote
1. La dégénérescence nucléaire d'un atome étant égale à 2I + 1 = 3, celle de la molécule vaut
3 2 = 9 et l'entropie molaire du gaz, d'après la relation de Boltzmann, contient un terme
supplémentaire R ln 9 = 18.27 J K −1 mole −1 . Etant donné que nous avons omis ce terme plus
haut selon l'usage, il en résulte qu'un terme égal doit être considéré dans la phase solide à basse
température. On a donc s (0 K ) = R ln 9 . Remarquons que ce résultat n'est pas en désaccord avec
le troisième principe car les spins nucléaires s'ordonnent dans un domaine de température de
l'ordre de 1 µ K . Ce phénomène n'est pas pris en compte dans le modèle ni dans l'extrapolation
calorimétrique en dessous de 1 K.
2. Le noyau ayant un spin I = 1 sont des bosons et la fonction d'onde totale doit être symétrique
relativement à l'échange des noyaux.
3. Le produit ψ (r )ψ (n ) doit alors être symétrique (section I.3.4.4).
4. Comme indiqué dans le premier tableau de la section I.3.4.4, ψ (n ) est symétrique pour K pair et
antisymétrique pour K impair.
5. Il existe 9 fonctions d'onde nucléaires du type m1 , m2 . Trois d'entre elles sont symétriques :
1,1 , 0,0 , − 1,−1 , les 6 autres n'ayant pas de caractère de symétrie. En considérant les 6
combinaisons linéaires indépendantes
1
[ 1,0 ± 0,1 ]
2
(9)
1
[ 1,−1 ± − 1,1 ]
2
1
[ 0,−1 ± − 1,0 ]
2
dont 3 sont symétriques (signe +) et 3 sont antisymétriques (signe -), on obtient au total 6
fonctions d'onde symétriques (molécules ortho) et 3 fonctions d'onde antisymétriques
(molécules para).
6. On a donc 2/3 de molécules ortho pour 1/3 de molécules para (section I.3.4.4).
7. Le schéma des niveaux de rotation de l'azote est le même que celui du deutérium montré plus
haut. Les niveaux de base ortho et para ont respectivement les dégénérescences 6 et 9.
8. Si toutes les molécules étaient du type ortho, à basse température, la probabilité
thermodynamique du solide serait W = 6 N , en raison des 6 états de spin possibles. L'entropie
molaire du solide serait alors s a = R ln 6 = 14.90 J K −1 mole −1 .
9. Dans ce cas, il existe dans le solide N O = 2 N / 3 molécules ortho de dégénérescence 6 et
N P = N / 3 molécules para de dégénérescence 9. L'entropie molaire au zéro absolu du solide
considéré comme le mélange des espèces ortho et para est :
2 1 N!
(10) sb = R ln 6 + R ln 9 + k ln 2
3 3 ( 3 N)!(13 N)!
soit, en utilisant la formule de Stirling réduite, sb = (7 R / 3) ln 3 = 21.31 J K −1 mole −1 .
10. Si la rotation des molécules para est bloquée, la dégénérescence des molécules para, due
seulement aux spins, est égale à 3 (au lieu de 9). Le même calcul que précédemment donne
alors s c = 2 R ln 3 = R ln 9 = 18.27 J K −1 mole −1 .
11. Nous voyons que la troisième hypothèse est en accord avec le résultat 1. Notons que les deux
premières hypothèses donneraient un désaccord avec l'expérience de l'ordre de 3 J K −1 mole −1 et
doivent donc être rejetées. L'azote dans le cristal à basse température est donc un mélange
désordonné de 2/3 de molécules ortho et 1/3 de molécules para dont la rotation est bloquée (au
contraire de l'hydrogène solide dont la rotation des molécules ortho persiste). En revanche, les
molécules du solide effectuent des oscillations de rotation (appelées librations).
Problème 3

Association moléculaire dans la vapeur de sodium


Des écarts à l'équation d'état des gaz parfaits pour les vapeurs de métaux alcalins ont permis de
mettre en évidence un phénomène de polymérisation. Nous nous intéressons à la production du
dimère de sodium Na2 selon la réaction :
(1) 2 Na  Na2
en faisant, pour la vapeur, l'approximation d'un mélange de gaz parfaits.

1. Montrez que le potentiel chimique d'un gaz parfait est de la forme


(2) µ = − kT ln[kTf (T ) / P ] + ε 0
où ε 0 est l'énergie du niveau fondamental, sachant qu'en statistique de Maxwell-Boltzmann
corrigée on a : µ = − kT ln Z / N .
2. Ecrire la loi d'action de masse relative à la réaction ci-dessus. On affectera des indices 1 et 2
aux fonctions relatives à Na et à Na2.
3. Définissez la constante d'équilibre K p pour la réaction étudiée. En quelle unité se mesure-t-elle
dans le système international ?
4. Exprimez la constante K p (T ) à partir de la loi d'action de masse. On désignera par
D0 = 2ε 10 − ε 20 l'énergie de liaison de la molécule Na2.
5. Donner l'expression de la fonction f 1 (T ) en calculant la fonction de partition du gaz
monoatomique Na. On tiendra compte de la dégénérescence g e = 2 du niveau de base
électronique de l'atome et on négligera les niveaux électroniques excités.
6. Explicitez f 2 (T ) pour la molécule diatomique symétrique Na2 dont le niveau électronique de
base n'est pas dégénéré. On notera Θ r et Θ v les températures caractéristiques de rotation et de
vibration du Na2 et on négligera les niveaux électroniques excités. Donnez l'expression
simplifiée de f 2 (T ) obtenue en faisant l'approximation T >> Θ v .
7. Déduisez-en l'expression de ln K p (T ) en fonction de la masse atomique M du sodium, de Θ r ,
Θ v et D0 . On introduira dans cette expression la constante universelle

(3) i0 = ln
(2π )3 / 2 k 5 / 2
= 18.22 SI
N3 / 2 h 3
8. Utilisez la loi de van't Hoff
(4)
d
(ln K p ) = − Q 2
dT RT
pour trouver l'expression de la chaleur de réaction Q en fonction de la température. Retrouvez
directement ce résultat en remarquant que la chaleur de réaction étudiée est égale à la différence
entre 2 fois l'enthalpie molaire du sodium Na et l'enthalpie molaire du dimère Na2 et en
appliquant le théorème d'équipartition de l'énergie.
9. La masse atomique du sodium est M = 23.0 g mole −1 . Les constantes de la molécule Na2,
déterminées par spectroscopie, ont pour valeur Θ r = 0.223 K , Θ v = 229 K et D0 / k = 8551 K .
Calculez les valeurs numériques de K p et de Q pour T = 1400 et T = 1700 K.
10. Des mesures expérimentales ont donné, entre 1400 K et 1700 K :
(5) log K p (atm −1 ) = −4.3249 +
4002.3
T

Comparez les valeurs théoriques calculées précédemment aux valeurs que l'on obtient à partir
de cette loi expérimentale.
11. Ecrivez l'expression des pressions partielles P1 et P2 en fonction de la pression totale et de la
fraction molaire X ≡ X 2 du dimère Na2.
12. Déterminez la loi donnant X(T,P) à l'équilibre en fonction du produit PK p = K X .
13. Calculez numériquement X dans les trois états définis par :
( α ) T = 1400 K et P = 6.50 atm.
( β ) T = 1700 K et P = 31.2 atm.
( γ ) T = 1700 K et P = 6.50 atm.
Les points α et β sont sur la courbe de vaporisation du sodium.
14. En utilisant les lois de déplacement de l'équilibre en fonction de la température et de la
pression, interprétez qualitativement les résultats précédents.

Données numériques : constante des gaz parfaits R = 8.3145 J K −1 mole −1 . 1 atm =


1.01325 × 10 5 Pa .

Solution
1. Pour un gaz parfait, on a Z = Vf (T ) et, en utilisant l'équation d'état PV = NkT, on obtient
l'expression demandée.
2. La loi d'action de masse (6) de la section I.3.4.7 s'écrit ici : 2µ 1 = µ 2 .
3. La constante d'équilibre a pour définition K p = P2 / P12 , où P1 et P2 sont les pressions partielles
à l'équilibre. Elle se mesure en Pa −1 .
4. En explicitant µ1 et µ 2 en fonction de P1 , P2 et T dans la loi d'action de masse, on obtient :
P f (T )
(6) K p = 22 = 2 2 (kT ) e 0
−1 D / kT

P1 [ f1 (T )]
5. Pour un atome de dégénérescence g (e ) = 2 , on a (section I.3.4.2) :

(7) Z 1 = 2 3 (2πmkT )
V 3/ 2

h
d'où l'expression de f 1 (T ) = Z 1 / V .
6. La fonction de partition Z 2 est un produit de fonctions de partition de translation, de rotation et
de vibration. En tenant compte du facteur de symétrie σ = 2 de la molécule, on a :
(8) Z 2 = 3 (4πmkT ) ×
V T 1
×
3/ 2

h 2Θ r 1 − exp(− Θ v / T )
la masse de la molécule étant égale à 2m. Dans le domaine T >> Θ v , la fonction de partition de
vibration se réduit à T / Θ v (limite classique), d'où :
1/ 2
(9) Z 2 =
V
(2πmkT ) 3/ 2 2
T2
h 3
Θr Θv
et l'expression de f 2 (T ) = Z 2/ V .
7. En reportant f1 et f 2 dans l'expression de K p on obtient :
h 3 N3 / 2 1 exp(D0 / kT )
(10) K p = × ×
8π 3 / 2 k 5 / 2 M 3 / 2 Θ r Θ v T 1/ 2
avec M = Nm , d'où :
 3  D 1
(11) ln K p = − i0 + ln 2 M + ln Θ r Θ v  + 0 − ln T
 2  kT 2
8. Par dérivation de ln K p , on obtient :
 D 1  D T
(12) Q = − RT 2 − 02 −  = R 0 + 
 kT 2T   k 2

On peut retrouver ce résultat en évaluant les enthalpies molaires des gaz Na et Na2. Pour les
gaz Na, la seule forme d'énergie étant l'énergie cinétique de translation (3RT/2) on a :
3 5
(13) h1 = u1 + RT = Nε 10 + RT + RT = Nε 10 + RT
2 2
tandis que pour le gaz moléculaire Na2, on doit tenir compte aussi de l'énergie de rotation (RT)
et de vibration (RT), d'où :
7 9
(14) h2 = u 2 + RT = Nε 20 + RT + RT = Nε 20 + RT
2 2

On a donc
( )
1
(15) Q = 2h1 − h2 = N 2ε 10 − ε 20 +
2
1
RT = ND0 + RT
2
9. Avec les valeurs numériques de M, Θ r , Θ v et D0 , on obtient

( )
(16) ln K p Pa −1 = −17.53 +
8551 1
− ln T (K )
T (K ) 2
et
( )
(17) Q J mole −1 = 71100 + 4.157T (K )

On obtient alors respectivement


(18) K p = 2.93 × 10 −7 Pa −1 et Q = 76.9 kJ mole −1 pour T = 1400 K
et
(19) K p = 9.04 × 10 −8 Pa −1 et Q = 78.2 kJ mole −1 pour T = 1700 K
( ) ( )
10. Sachant que K p atm −1 = K p Pa −1 × 1.01325 × 10 5 et que ln x = 2.3026 log x , la loi
expérimentale s'écrit :
( )
(20) ln K p Pa −1 = −21.485 +
9215.7
T (K )

Pour les deux températures considérées, on a :


(21) K p (1400 K ) = 3.37 × 10 −7 Pa −1 , K p (1700 K ) = 10.6 × 10 −8 Pa −1

Les valeurs théoriques sont inférieures d'environ 15% à ces valeurs expérimentales.
L'approximation T >> Θ v est responsable de la moitié de cette erreur.

La chaleur de réaction expérimentale, obtenue à partir de la loi de van't Hoff, vaut :


d ln K p
(22) Q = − RT 2 = 9215.7 R = 76.6 kJ mole −1
dT

Dans le domaine considéré, cette chaleur de réaction est constante et a une valeur numérique
proche des valeurs théoriques calculées. Nous voyons que le modèle théorique donne des
résultats en accord satisfaisant avec l'expérience.
11. On a P2 = PX 2 = PX et P1 = PX 1 = P(1 − X ) .
12. La fraction molaire X à l'équilibre est alors déterminée par :
P X
(23) K p = 22 =
P(1 − X )
2
P1

L'équation du second degré précédente a pour solution


1/ 2
1  1 1 
(24) X = 1 + −  +  avec K X = PK p
2 K X  K X 4 K X2 
13. En utilisant les valeurs expérimentales de K p calculées en 10, on trouve respectivement :
(15) X α = 0.16 , X β = 0.21 , X γ = 0.06
14. En allant de α à β sur la courbe de vaporisation (figure ci-dessous), la fraction molaire varie
peu malgré la grande variation de pression.

En effet, en allant de α à γ , cette fraction diminue en accord avec la loi de van't Hoff pour une
réaction exothermique (Q > 0), mais elle augmente en allant de γ à β , le dimère étant favorisé
par un accroissement de pression (loi de Le Chatelier). Les deux variations se compensent
partiellement. Notons que l'existence d'un tétramère Na4 a pour conséquence la diminution des
valeurs de X calculées précédemment.
I.4. Atomes, molécules et noyau atomique
Le but ici n'est pas de donner une analyse complète des systèmes atomiques. C'est avant tout une
présentation des quelques problèmes qui se posent en relation avec la structure de la matière,
choisis car ils fournissent des applications intéressantes et instructives de la mécanique quantique.
Ces problèmes sont regroupés suivant le sujet. Suffisament d'explications sont inclues pour que le
traitement soit cohérent bien que fortement limité.
I.4.1. Approximations dans la structure atomique
Les états de base des deux atomes les plus légers, l'hydrogène et l'hélium, ont été considérés
précédemment. Des calculs de variations similaires à ceux décrits pour l'hélium ont été réalisés
pour d'autres atomes légers. Nous allons décrire ici certaines des approximations qui ont été
utilisées pour les atomes plus lourds. Nous reviendrons sur les atomes légers plus loin.

Approximation de champ central


Le point de départ du calcul dans tous les cas exceptés pour les atomes les plus légers est
l'approximation de champ central. Elle suppose que chacun des électrons se déplace dans un
potentiel à symétrie sphérique V (r ) qui est produit par le noyau et tous les autres électrons.
L'approximation est bonne si la déviation de V (r ) pour un électron produit par le passage près des
autres électrons est relativement petite. C'est en fait bien le cas car le potentiel nucléaire constant
est de l'ordre de Z fois la grandeur des fluctuations du potentiel dues aux électrons voisins et ces
dernières varient assez lentement (inversement) avec la distance de séparation. Les deux principaux
problèmes sont alors le calcul du champ central et les corrections aux résultats approchés que l'on
en tire. Avant de considérer ces problèmes, discutons de quelques propriétés générales du champ
central.

L'énergie potentielle V (r ) pour un atome neutre a la forme de Coulomb − e 2 / r a une grande


distance r du noyau puisque la suppression de l'électron dont le potentiel doit être mesuré laisse un
ion avec une seule charge positive. L'électron dans l'atome d'hydrogène, pour lequel l'énergie
potentielle est − e 2 / r pour tout r, a un nombre infini de niveaux d'énergie liés caractérisés par les
nombres quantiques n, l et m. Un nombre infini de niveaux d'énergie est aussi attendu pour V (r )
puisque pour n grand la fonction d'onde est petite près du noyau et seule la forme de V (r ) pour r
grand est significative. Une différence importante entre les deux situations est que la
dégénérescence entre états de même n et l différents qui existe dans l'hydrogène peut être éliminée
dans un champ central non coulombien. Cela est dû au fait que les électrons qui ont un plus petit
moment angulaire pénètrent plus près du noyau et V (r ) y est plus fort (plus négatif) que − e 2 / r
puisque le noyau est moins masqué par les autres électrons. Donc, pour n donné, les états de l plus
petit ont moins d'énergie. La dégénérescence par rapport à m n'est pas affectée car cela se produit
quand le potentiel est à symétrie sphérique.

A cause du spin, quatre nombres quantiques n, l, ml et m s sont requis pour spécifier l'état d'un
électron dans un champ central. Les nombres quantiques orbitaux l et ml sont les mêmes que l et m
dans l'atome d'hydrogène, m s = ± 12 spécifie l'orientation du spin et n est une généralisation
naturelle du nombre quantique total qui apparaît dans l'hydrogène. La résolution de l'atome
d'hydrogène a montré que n - l -1 est le nombre de nœuds de la partie radiale de la fonction d'onde
de l'hydrogène. Cette définition est étendue au champ central, ainsi l n'excède pas n - 1.

Classification périodique des éléments


Selon le principe d'exclusion de Pauli, un seul électron dans l'atome peut avoir un ensemble
particulier des quatre nombres quantiques donnés ci-dessus. Lorsque Z augmente, les électrons
remplissent successivement les états à un électron de plus basse énergie. L'état de base d'un atome
dans l'approximation du champ central est celui dans lequel il n'y a pas d'état électronique vide
d'énergie plus basse que ceux qui sont occupés. A cause de la dégénérescence par rapport à ml et
m s , il peut y avoir 2(2l + 1) électrons avec la même énergie dans une couche qui est spécifiée par n
et par l. Il est alors visible que la configuration de l'état de base des électrons d'un atome peut être
décrit en spécifiant le nombre d'électrons dans chaque couche. Dans l'approximation du champ
central, toutes les couches qui contiennent des électrons sont pleines excepté peut-être celle qui a la
plus grande énergie.

Les propriétés chimiques des atomes sont déterminées pour l'essentiel par les électrons les plus
faiblement liés ou électrons de valence qui sont dans la couche de plus haute énergie. Les facteurs
les plus importants sont le nombre d'états électroniques occupés et inoccupés dans cette couche et
l'intervalle d'énergie entre cette couche et la couche (vide) plus grande suivante. Par exemple, un
atome tend à être chimiquement inerte si sa couche la plus haute est pleine et s'il y a un écart
d'énergie appréciable avec la couche suivante puisque alors les électrons ne sont pas facilement
partagés avec d'autres atomes pour former une molécule. La répétition quasi périodique de
structures similaires pour la couche la plus haute lorsque Z augmente est responsable de la
classification périodique des éléments chimiques.
Avec les notations spectroscopiques habituelles, la valeur de n d'une couche est donnée comme un
nombre, la valeur de l comme une lettre et le nombre d'électrons dans la couche comme un
exposant numérique. La lettre qui code l et le nombre maximum 2(2l + 1) d'électrons dans la
couche sont comme suit :
l = 0 1 2 3 4 5 L
s p d f g h L
2(2l + 1) = 2 6 10 14 18 22 L

Par exemple, les configurations d'état de base du sodium (Z = 11) et du mercure (Z = 80) sont
Na : 1s 2 2 s 2 2 p 6 3s
Hg : 1s 2 2 s 2 2 p 6 3s 2 3 p 6 4 s 2 3d 10 4 p 6 5s 2 4d 10 5 p 6 6 s 2 4 f 14 5d 10

Les configurations d'état de base des éléments peuvent être écrites simplement à partir de la
connaissance de l'ordre dans lequel les énergies des couches croissent. Cet ordre peut être déduit
des données expérimentales comme suit :
1s, 2s, 2p, 3s, 3p, [4s, 3d], 4p, [5s, 4d], 5p, [6s, 4f, 5d], 6p, [7s, 5f, 6d]

Les crochets entourent des couches qui ont des énergies si proches qu'elles ne sont pas toujours
remplies dans cette séquence. Ces énergies de couche sont proches car l'accroissement de n et la
diminution de l tendent à se compenser. Donc, l'état 4s, qui a une énergie plus grande que l'état 3d
dans l'hydrogène, est abaissé par la pénétration causée par son faible moment angulaire. La couche
s dans chaques crochets est toujours remplie première bien qu'elle puisse perdre un ou deux de ses
électrons au profit de l'autre couche. En dehors de ces crochets, il n'y a pas d'écart dans l'ordre de
remplissage indiqué.

La table ci-dessous donne les configurations de chacun des éléments. Un atome contient toutes les
couches pleines qui sont situées au-dessus et à gauche de sa position dans la table. Puisque le
nombre d'électrons varie lorsque chaque couche d se remplit, les colonnes d sont subdivisées pour
montrer le nombre d'électrons s. Les deux groupes d'atomes qui ont une couche f partiellement
remplie dans leur configuration de base sont les terres rares (*) et les éléments les plus lourds (+).
La distribution des électrons dans les couches d et f pour chaque groupe est montrée sous la table
principale.

s s2 p p2 p3 p4 p5 p6 d d2 d3 d4 d5 d6 d7 d8 d9 d 10
H1 He 2
1s
Li 3 Be 4
2s
B5 C6 N7 O8 F9 Ne 10
2p
Na 11 Mg
3s 12
Al 13 Si 14 P 15 S 16 Cl 17 Ar 18
3p
4s K 19 Ca 20 4s 0
3d Cr 24 Cu 29
4s
Sc 21 Ti 22 V 23 Mn Fe 26 Co 27 Ni 28 Zn 30
4s 2 25

Ga 31 Ge 32 As 33 Se 34 Br 35 Kr 36
4p
Pd 46
5s 5s 0
4d Nb 41 Mo Ru 44 Rh 45 Ag 47
Rb 37 Sr 38
5s 42
Y 39 Zr 40 Tc 43 Cd 48
5s 2
In 49 Sn 50 Sb 51 T 52 I 53 Xe 54
5p
6s 6s 0
4f Cs 55 Ba 56
Pt 78 Au 79
5d 6s
La 57 Hf 72 Ta 73 W 74 Re 75 Os 76 Ir 77 Hg 80
6s 2 (*)

Tl 81 Pb 82 Bi 83 Po 84 At 85 Rn 86
6p
7s 7s 0
5f Fa 87 Ra 88

6d 7s
Ac 89 Th 90
7s 2 (+)
Ce 58 Pr 59 Nd 60 Pm 61 Sm 62 Eu 63 Tb 65 Dy 66 Ho 67 Er 68 Tm 69 Yb 70
(*) 5d 0
4f 5d Gd 64 Lu 71

f f 2
f3 f 4
f5 f 6
f 7
f8 f9 f 10 f 11 f 12 f 13 f 14
(+) 6d 0
5f 6d Pa 91 U 92 Np 93 Pu 94

Il est intéressant de mentionner explicitement quelques périodicités. Le premier électron à se placer


dans chaque couche s formant 1s donne un alcalin et les éléments justes avant (couche 1s ou p
pleine) sont les gaz rares. Les éléments avec le même nombre d'électrons dans une couche p ont des
propriétés chimiques similaires. C'est le cas particulièrement frappant des halogènes (un électron en
moins dans une couche p pleine). Les éléments avec les couches 2s et 3s pleines (Be et Mg) qui
sont suivi par les couches p ont des propriétés assez différentes des alcalins qui ont une couche s
pleine suivie par les couches d ou f. Le remplissage des couches 4s et 3d donne des éléments assez
similaires à ceux venant du remplissage des couches 5s et 4d. Les éléments qui correspondent aux
couches entre crochets pleines (Zn, Cd et Hg) sont assez similaires, tout comme les métaux nobles
(Cu, Ag et Au) dans lesquels un électron s est manquant dans les couches entre crochets pleines.

Modèle statistique de Thomas-Fermi


Nous revenons maintenant au premier problème associé à l'approximation du champ central. Deux
méthodes ont été utilisées pour la détermination de l'énergie potentielle V (r ) . La première, due à
Thomas et Fermi, est discutée ici et la deuxième, due à Hartree, sera présentée un peu plus loin. Le
modèle statistique de Thomas-Fermi suppose que V (r ) varie assez lentement sur la longueur d'onde
d'un électron de telle manière que plusieurs électrons peuvent être localisés dans un volume sur
lequel le potentiel change seulement d'une petite fraction. Les électrons peuvent être traités par la
physique statistique et ils obéissent à la statistique de Fermi-Dirac que nous avons étudié. A
température normale, l'énergie thermique kT est très petite par rapport à V (r ) (attention de ne pas
confondre la constante de Boltzmann k avec le nombre d'onde k) excepté au bord de l'atome, où la
chance de trouver un électron est petite. Dans ce cas, la statistique de Fermi-Dirac nécessite que les
états électroniques soient remplis dans l'ordre de l'énergie croissante, comme supposé ci-dessus. La
différence entre le traitement actuel et la discussion plus générale vue ci-dessus repose sur
l'hypothèse supplémentaire que V (r ) est sensiblement constant sur une région où plusieurs
électrons peuvent être localisés.

Le nombre d'états électroniques dans un cube de largeur L sur les murs duquel la fonction d'onde
obéit à des conditions périodiques est (L / 2π ) dk x dk y dk z . On doit le multiplier par 2 pour prendre
3

en compte les deux états de spin possibles. Alors, le nombre d'états pour lesquels la grandeur de
l'impulsion p = hk est inférieure ou égal à p 0 est
3
 L  p0 / h π 2π p 03 L3
(1) 2  ∫ ∫∫ k dk sin θ dθ dφ =
2

 2π  0 0 0 3π 2 h 3

Si tous ces états sont occupés, le nombre d'électrons par unité de volume dont l'énergie cinétique
n'excède pas p 02 / 2m est p 03 / 3π 2 h 3 . Maintenant, l'énergie cinétique maximale à la distance r du
noyau est − V (r ) car autrement les électrons s'échapperaient de l'atome. Nous obtenons donc une
relation entre la densité volumique n(r ) des électrons et l'énergie potentielle :

(2) n(r ) =
[− 2mV (r )]
1/ 2

2 3
3π h

Le potentiel électrostatique − V (r ) / e est aussi déterminé par l'équation de Poisson en fonction de la


densité de charge − en(r ) :
1 d  2 dV 
 = 4πen(r )
1
(3) − ∇ 2V = − 2 r
e er dr  dr 

Les équations (2) et (3) sont deux équations simultanées pour n et V. Les conditions aux limites sur
les solutions peuvent être exprimées en fonction de V seul pour un atome neutre de nombre
atomique Z. Lorsque r → 0 , le terme dominant dans l'énergie potentielle doit être dû au noyau,
donc V (r ) → − Ze 2 / r . Lorsque r → ∞ , il ne doit pas y avoir de charge nette dans la sphère de
rayon r, ainsi V diminue plus rapidement que 1/r et rV (r ) → 0 . La condition aux limites à l'infini
est différente de celle discutée au début où V fut considéré avoir une forme asymptotique − e 2 / r .
Le V discuté plus tôt est le potentiel subit par un des électrons atomiques tandis que le potentiel de
Thomas-Fermi est celui subit par une charge test infinitésimale. La différence entre les deux
potentiels met l'accent sur la nature statistique de l'approximation faites par Thomas et Fermi.

La solution pour V est exacte à la limite où m devient infini et e devient zéro de telle manière que
m 3 e 4 reste constant. Alors la longueur d'onde des électrons tend vers zéro et la densité des
particules devient infinie. A cette limite, le potentiel est constant sur plusieurs longueurs d'ondes et
suffisament de particules sont présentes pour que la physique statistique puisse être appliquée.

Evaluation du potentiel
L'élimination de n(r ) de (2) et (3) conduit à une équation pour − V (r )
1 d  2 d (− V )  4e 2 [− 2mV (r )]
3/ 2
(4) r =
r 2 dr  dr  3πh 3

L'équation (4) et les conditions aux limites données ci-dessus sont habituellement exprimées sous
une forme sans dimensions dans laquelle Z, E, m et h apparaissent seulement dans des facteurs
d'échelles. Nous posons
Ze 2
V (r ) = − χ
r
(5) r = bx
1  3π 
2/3
h2 0.885a 0
b=   2 1/ 3
=
2  4  me Z Z 1/ 3
où a 0 = h 2 / me 2 . Avec ces substitutions, (4) devient
d 2χ
(6) x 1/ 2
2
= χ 3/ 2
dx
avec χ = 1 en x = 0 et χ = 0 en x = ∞ .

La solution la plus précise de (6) a été calculée par Bush et Caldwell avec l'aide d'un calculateur
différentiel et est exprimée sous forme d'une table numérique.
L'équation (5) montre que le "rayon" d'un atome est inversement proportionnel à la racine cubique
du nombre atomique, si ce rayon est interprété comme celui d'une sphère enfermant une fraction
donnée de tous les électrons. Ces équations peuvent aussi être utilisées pour montrer que
l'approximation de Thomas-Fermi s'améliore avec Z croissant. Le potentiel au rayon atomique est
proportionnel à Z 4 / 3 tel qu'une longueur d'onde typique d'électron est proportionnelle à Z −2 / 3 . La
distance sur laquelle le potentiel varie d'une faction définie est proportionnelle au rayon atomique
ou Z −1 / 3 . Donc le changement fractionnaire du potentiel sur une longueur d'onde d'électron est
proportionnel à Z −1 / 3 et décroît avec Z croissant. De plus, puisque le nombre d'électrons est égal à
Z, l'utilisation de la méthode statistique est mieux justifiée lorsque Z croît.

Champs auto consistants de Hartree


La deuxième méthode pour obtenir un champ central est due à Hartree. Ce modèle suppose que
chaque électron se déplace dans un champ central qui peut être calculé à partir du potentiel
nucléaire et des fonctions d'onde de tous les autres électrons, en supposant que la densité de charge
associée a un électron est -e fois sa densité de probabilité de position. L'équation de Schrödinger est
résolue pour chaque électron dans son propre champ central et les fonctions d'ondes résultantes sont
rendues consistantes avec les champs à partir desquels elles sont calculées. Donc, le kième électron
est décrit par une fonction d'onde normalisée u k (rk ) qui est solution de l'équation
 h 2 2 Ze 2 
+ ∑ ∫ u j (r j )
2
d 3 r j u k (rk ) = ε k u k (rk )
2 e
(7) − ∇k −
 2m rk j ≠k r jk 
où r jk = r j − rk . S'il y a Z électrons dans l'atome, (7) constitue un ensemble de Z équations
intégrodifférentielles non linéaires pour les Z fonctions u k (rk ) . Il n'est donc pas possible de
résoudre ces équations directement et Hartree a utilisé une méthode d'approximations successives.

Une énergie potentielle qui représente approximativement le deuxième et troisième terme de (7) est
supposée, les fonctions d'onde des électrons calculées et les nouveaux potentiels pour chaque
électron trouvés à partir de ces équations. Ce processus est prolongé jusqu'à ce que les potentiels
soient auto consistants à un ordre élevé de précision. L'approximation principale faite ici est la
moyenne de l'énergie potentielle donnée comme troisième terme dans (7) sur les angles de rk pour
avoir la symétrie sphérique. Les solutions de (7) peuvent alors être exprimées comme des produits
de fonctions radiales et d'harmoniques sphériques. Une simplification supplémentaire est faite afin
que les 2(2l + 1) électrons (ou moins) dans une couche se déplacent dans le même potentiel et aient
la même fonction d'onde radiale.

Il est évident que l'approximation de Hartree néglige les corrélations entre les positions des
électrons puisque la fonction d'onde entière pour tous les électrons est supposée être un simple
produit de fonctions à un électron
(8) ψ (r1 , r2 ,K, rZ ) = u1 (r1 )u 2 (r2 )Lu Z (rZ )

Il est également clair de (8) que les fonctions d'onde antisymétriques ne sont pas employées. Cette
antisymétrie est considérée seulement lorsque les nombres quantiques des états à un électron u k
sont choisis en accord avec le principe d'exclusion. Il est possible d'inclure l'antisymétrie
directement dans la méthode (méthode de Hartree-Fock).

Relation avec la méthode des variations


Nous allons maintenant montrer que l'approximation de Hartree résulte d'un calcul de variation
optimal avec la fonction test (8). L'équation avec inclusion des interactions entre électrons mais
négligeant les termes spin - orbite (voir ci-dessous) est
Hψ = Eψ
(9)  h 2 2 Ze 2  e2
H = ∑  − ∇k −  + ∑∑
k  2m rk  j k < j r jk
où j > k implique une double sommation sur toutes les paires différentes d'indices j et k. Nous
voulons minimiser la valeur moyenne de H.

A partir de (8) et (9), nous obtenons


∫ L ∫ψ Hψd 3 r1 L d 3 rZ

 h 2 2 Ze 2 
(10) = ∑ ∫ u (rk ) −

k ∇k − u k (rk )d 3 rk +
k  2m rk 

∑∑ ∫∫ u ∗
j (r j )u ∗
k (rk ) e2
u j (r j )u k (rk )d 3 r j d 3 rk
j k< j r jk
puisque les u k sont normalisés. Le ψ optimal est obtenu en faisant varier chaque u k séparément
pour minimiser (10). La seule dépendance de (10) à une fonction à un électron particulière u k est à
travers les termes
 h 2 2 Ze 2 
u (r )
∫ k k  2m k rk  k k k ∑

 − ∇ − u (r )d 3
r + ∫∫ u ∗
j (r j )u ∗
k (rk ) e2
u j (r j )u k (rk )d 3 r j d 3 rk
j≠k r jk
(11) = ∫ u k∗ (rk )H k u k (rk )d 3 rk

+ ∑ ∫ u j (r j )
h 2 2 Ze 2 2 e
2
Hk ≡ − ∇k − d 3rj
2m rk j ≠k r jk

L'intégrale dans (11) est la valeur moyenne de l'opérateur H k pour la fonction u k . Il s'ensuit que
c'est un minimum quand u k est une fonction propre de H k qui correspond à la plus petite valeur
propre ε k .
(12) H k u k = ε k u k

Puisque (12) et (7) sont identiques, nous voyons que les fonctions d'onde de Hartree sont les
meilleures du point de vue de la méthode des variations qui peuvent être écrite sous la forme (8).

L'énergie associée à cette fonction d'onde est l'intégrale (10) qui peut être écrite avec l'aide de (7)

(13) ∫ L ∫ψ ∗ Hψd 3 r1 L d 3 rZ = ∑ ε k − ∑∑ ∫∫ u j (r j ) u k (rk )


2
2 2 e
d 3 r j d 3 rk
k j k< j r jk
Les termes d'interaction électrostatique entre électrons sont comptés deux fois dans la sommation
sur ε k et doivent ainsi être soustrait dans (13). Donc, l'énergie de l'atome n'est pas seulement la
somme des ε k bien que chaque ε k soit approximativement l'énergie pour enlever le kième
électron. Ceci n'est pas strictement correct car l'enlèvement d'un électron altère les champs auto
consistants et donc les fonctions d'onde et les ε pour les électrons restant. Cependant, on constate
expérimentalement que ε k est une approximation particulièrement bonne pour l'énergie
d'enlèvement dans le cas d'un électron interne (niveau rayon X).

Corrections à l'approximation de champ central


Nous revenons maintenant au second problème mentionné au début, la correction des résultats
approchés obtenu avec le champ central. Deux termes sont omis dans l'approximation du champ
central : la différence entre l'interaction électrostatique réelle entre électrons et l'interaction
moyenne qui est inclus dans le champ central, et l'énergie spin - orbite. Cette dernière est l'énergie
d'interaction entre le spin et le mouvement orbital de chaque électron et a la forme
(14) ∑ ξ (rk )L k ⋅ S k
k

Ici, L k est l'opérateur moment angulaire orbital rk × p k de l'électron k et il a les propriétés de


l'opérateur J. Les valeurs propres de L2k et Lkz sont données en fonction des nombres quantiques l
et ml du kième électron comme l (l + 1)h 2 et ml h respectivement. S k est le moment angulaire de
spin hσ k du kième électron. La fonction ξ (r ) est donnée par
1
2

(15) ξ (r ) =
1 1 dV
2m 2 c 2 r dr
en fonction de l'énergie potentielle du champ central V (r ) .

Cette énergie est une conséquence de la relativité. Elle fut d'abord obtenue à partir de la précession
de l'axe du spin de l'électron qui est en partie d'origine électromagnétique (précession de Larmor) et
en partie due à la cinématique relativiste (précession de Thomas).
En considérant les effets de ces termes, nous supposerons que les fonctions propres perturbées, qui
sont des combinaisons linéaires des différentes configurations de fonctions d'onde, ont seulement
de petites quantités de chaque mélangées sauf une. La théorie des perturbations montre que cela est
évidemment le cas si les éléments de matrice entre configurations sont petits par rapport aux
intervalles d'énergie entre énergies des configurations non perturbées.

On peut montrer que la partie de la sommation dans (14) qui inclut les électrons sur les couches
pleines est zéro puisque la fonction ξ est la même pour tous les électrons dans une couche et les
contributions des électrons avec ml et ms opposées s'annulent. Donc les électrons sur les couches
pleines peuvent être ignorés et la sommation s'étend seulement aux électrons restant. Le cas où il y
a seulement un électron en dehors des couches pleines est intéressant en relation avec l'état de base
et les états excités les plus faibles des atomes alcalins. On en discutera plus en détail plus loin. A ce
stade, considérons très brièvement la situation plus générale, en supposant toujours que chaque état
atomique est basé sur une seule configuration des électrons.

Schéma de couplage LS
Il y a, en général, un certain nombre d'états qui appartienne à la même configuration et qui sont
dégénérés dans l'approximation du champ central. Ces états diffèrent par les nombres quantiques
ml et ms des électrons individuels. La théorie du spectre complexe consiste à déterminer les
combinaisons linéaires de telles fonctions d'onde rendues asymétriques de manière appropriée qui
diagonalisent la perturbation au premier ordre par rapport aux niveaux d'énergie perturbés
correspondant.

La situation la plus fréquente est celle où les termes électrostatiques négligés sont plus grands que
l'énergie spin - orbite. On les appelle les situations de Russel-Saunders. Les états de même
configuration peuvent être classés comme fonctions propres de toute variable dynamique qui
commute avec l'hamiltonien et qui sont donc des constantes du mouvement. Quand toutes les
perturbations sont inclues, les seules vraies constantes du mouvement sont la parité totale et le
moment angulaire total J des électrons
(16) J = L + S = ∑ (L k + S k )
k
J est une constante du mouvement car les angles qui spécifient l'orientation de l'atome comme un
tout, qui sont les variables canoniquement conjuguées aux composantes de J, n'apparaissent pas
dans l'hamiltonien d'un atome isolé. Quand la perturbation électrostatique est incluse mais que
l'énergie spin - orbite est négligée, le même argument peut être appliqué pour montrer que le
moment angulaire orbital total L et le moment angulaire de spin total S sont séparément des
constantes du mouvement. Les S k individuels ne sont pas nécessairement des constantes même si
aucune force dépendant du spin n'agit à ce niveau d'approximation car l'utilisation de fonctions
d'onde antisymétrique couple les spins à l'énergie électrostatique (voir la discussion sur les états
excités de l'hélium).

Un état peut être spécifié par les nombres quantiques J, L, S, M, M L et M S , qui sont reliés aux
valeurs propres des opérateurs moments angulaires par
J 2 = J ( J + 1)h 2 J z = Mh
(17) L2 = L(L + 1)h 2 Lz = M L h
S 2 = S (S + 1)h 2 Sz = M Sh

Quand l'énergie spin - orbite est négligée, l'énergie électrostatique sépare les états de L différent.
Dans certains cas, seules des valeurs particulières de S sont permises à cause du principe
d'exclusion. Seuls deux des quatre autres nombres quantiques sont indépendants et ainsi nous
pouvons utiliser LSM L M S ou LSJM pour spécifier un état. A cause de la symétrie sphérique de
l'hamiltonien par rapport à ses parties spatiales et de spin séparées, l'énergie est indépendante des
nombres quantiques de direction M L et M S et il y a (2 L + 1)(2 S + 1) états dégénérés. Pour L et S
donnés, les états spécifiés par J et M sont des combinaisons linéaires de celles spécifiées par M L et
M S , ainsi la même quantité de dégénérescence apparaît dans la représentation LSJM . Ces
combinaisons linéaires peuvent être exprimées en fonction des coefficients de Clebsch-Gordan. On
l'appelle le schéma de couplage LS puisque les Lk individuels sont couplés ensembles pour former
le L total et les S k individuels forment le S total.
Si maintenant l'énergie spin - orbite est incluse, L et S ne sont plus des constantes du mouvement
tandis que J et M le sont encore. Cependant, nous supposons que les états avec L et S différents
sont suffisament bien séparés par leur énergie électrostatique pour que leur mélange dû à l'énergie
spin - orbite puisse être négligé. C'est analogue à l'hypothèse précédente que les différentes
configurations sont suffisament bien séparées par le champ central pour que leur mélange dû à
l'énergie électrostatique puisse être négligé. Les états de J différents dans la représentation LSJM
sont maintenant séparés par l'énergie spin - orbite. L'énergie est encore indépendante de M ainsi il y
a 2J + 1 états dégénérés. Un état de Russel-Saunders est habituellement écrit sous la forme 4 D1 / 2
où l'exposant à gauche est la multiplicité 2S + 1, la lettre (maintenant en majuscule) est la valeur de
L selon le code donné plus haut et l'indice est la valeur de J. Dans ce cas S = 32 , L = 2 et J = 12 .
Puisque J = L + S , la règle du triangle discuté précédemment montre que J peut seulement être un
des nombres, L + S, L + S - 1, …, L − S .

Schéma de couplage jj
L'approximation opposée qui est impliquée par le couplage LS suppose que l'énergie spin - orbite
est grande comparée à l'énergie électrostatique. Si cette dernière est négligée, chaque électron peut
être caractérisé par les nombres quantiques nljm plutôt que nlml m s , où (L k + S k ) = j ( j + 1)h 2 et
2

Lkz + S kz = mh . L'énergie électrostatique sépare alors les états de J différents.

On l'appelle le schéma de couplage jj puisque les moments angulaires orbitaux et de spin des
électrons individuels sont couplés ensembles pour former les j à partir desquels les états sont
construits. Ce schéma est particulièrement intéressant dans les atomes lourds où la valeur élevée de
V (r ) fait de l'énergie spin - orbite (14) la perturbation dominante.
I.4.2. Les atomes
Comme signalé plus haut, nous allons maintenant nous concentrer plus en détail sur les atomes
alcalins et nous repasserons en vue les propriétés des différents atomes à la fin.

La configuration de base d'un atome alcalin consiste en une série de couches complètes suivies par
un seul électron s et est ainsi 2 S1 / 2 . Les configurations intérieures analogues aux gaz rares sont si
stables que tous les états excités sauf les plus importants impliquent seulement l'électron de
valence. Donc les alcalins peuvent être traités avec une assez bonne approximation en fonction d'un
modèle où un seul électron se déplace dans l'énergie potentielle V (r ) non coulombienne à symétrie
sphérique. Ici, nous allons calculer les niveaux d'énergie et les intensités des transitions permises en
l'absence et en présence d'un champ magnétique externe.

Séparation en doublet
La configuration d'un atome alcalin peut être spécifiée par une seule paire de nombres quantiques
nl . Puisqu'il y a seulement un électron, le terme électrostatique perturbateur mentionné
précédemment n'apparaît pas. En l'absence de champs externes, l'hamiltonien, incluant l'énergie
spin - orbite, est
h2 2
(1) H = − ∇ + V (r ) + ξ (r )L ⋅ S
2m

Comme avant, nous négligeons le mélange des différentes configurations produites par l'énergie
spin - orbite et nous regardons ce terme comme une perturbation qui enlève la dégénérescence
ml ms dans chaque configuration. Le moment angulaire total J = L + S de l'électron de valence est
une constante du mouvement, donc cet état peut être désigné par jm au lieu de ml ms , où
J 2 = j ( j + 1)h 2 et J z = mh . Les états avec des j différents ont des énergies différentes mais il y a
encore une dégénérescence (2j + 1) à cause de m. L'élimination de la dégénérescence m par un
champ magnétique sera discuté plus loin.
La différence en énergie entre les états de j différents est due au terme L ⋅ S dans (1) et peut être
trouvée par sa valeur moyenne ou l'élément diagonal. Nous avons la relation entre opérateurs
(2) J 2 = (L + S ) = L2 + S 2 + 2L ⋅ S
2

Puisque l, j et s sont de bons nombres quantiques ( s = 1


2 pour un électron), (2) peut être résolue
pour l'élément diagonal de L ⋅ S :
(3) lj L ⋅ S lj = 12 [ j ( j + 1) − l (l + 1) − 34 ]h 2

Maintenant, si l est différent de 0, j peut être égal à l + 1


2 ou l − 12 . Donc la perturbation au premier
ordre de ξ (r )L ⋅ S est
2 lζ nl j = l + 12
1

(4) − 12 (l + 1)ζ nl j = l − 12

ζ nl ≡ h 2 ∫ Rnl (r ) ξ (r )r 2 dr l>0
2
0

où Rnl (r ) est la partie radiale normalisée de la fonction propre non perturbée associée à la
configuration nl. Puisque V (r ) représente une énergie potentielle attractive, ξ (r ) est positif et ζ nl
est positif. Donc, (4) montre que l'état avec le j le plus élevé a la plus grande énergie. La paire
d'états est appelée un doublet. La structure en doublet caractérise tous les niveaux modérément
excités des atomes alcalins exceptés ceux pour lesquels l = 0, auquel cas j peut seulement être 12 .

La séparation du doublet peut être calculée à partir de (4) si la fonction radiale est connue. Nous
pouvons avoir une estimation grossière de la dépendance avec n en utilisant les fonctions d'onde de
l'hydrogène et en supposant que V (r ) a la forme coulombienne − Ze 2 / r . La substitution dans ξ (r )
et dans (4) donne, avec l'aide des fonctions génératrices pour les polynômes de Laguerre associés,
h 2 Ze 2 ∞ 1 2
ζ nl = Rnl (r )dr
2m 2 c 2 ∫0 r
(5)
e 2h 2 Z 4
=
2m 2 c 2 a 03 n 3 l (l + 12 )(l + 1)
Elle est valide seulement pour l > 0. La singularité de ξ (r ) en r = 0 y fait diverger l'intégrale pour
ζ n 0 , ainsi l'approximation de perturbation n'est pas valide. Il suit de (4) et (5) que la séparation du
doublet est proportionnelle à n −3 et c'est en assez bon accord avec les observations. La valeur
absolue de la séparation du doublet et sa dépendance avec l ne sont pas du tout donnés par cette
théorie simple car le Z effectif est difficile à estimer et dépend fortement de l à cause de la
pénétration.

Intensité du doublet
Nous allons maintenant calculer les intensités relatives des deux lignes du doublet 2 P3 / 2 → 2 S1 / 2 et
2
P1 / 2 → 2 S1 / 2 sous l'hypothèse que les fonctions d'onde radiales sont les mêmes pour les deux états
excités 2 P . Les transitions de ce type conduisent aux séries principales des spectres alcalins. Les
probabilités de transition spontanées et donc les intensités observées, où les deux états P son
occupés de manière équivalente, sont proportionnelles aux carrés des éléments de matrice
dipolaires (nous reviendrons plus en détail plus tard sur l'émission de rayonnement par les atomes).

La dépendance des deux états excités 2 P et de l'état de base 2 S avec les coordonnées angulaires et
de spin de l'électron est obtenue en trouvant les combinaisons linéaires des quatre harmoniques
sphériques Y1,1 (θ , φ ) , Y1, 0 (θ , φ ) , Y1, −1 (θ , φ ) , Y0, 0 (θ , φ ) et des deux fonctions d'onde de spin (+) et (-)
qui sont fonctions propres de J 2 et J z . Ces combinaisons peuvent être obtenues à partir des
coefficients de Clebsch-Gordan :
2
P3 / 2 m = 3
(+ )Y1,1
3 [2 (+ )Y1,0 + (− )Y1,1 ]
2
1 −1 / 2 1/ 2

3 −1 / 2 [21 / 2 (− )Y1, 0 + (+ )Y1, −1 ]


2

− 12
− 32 (− )Y1, −1
3 [− (+ )Y1, 0 + 21 / 2 (− )Y1,1 ]
(6) −1 / 2
2
P1 / 2 m = 1

3 −1 / 2 [(− )Y1, 0 − 21 / 2 (+ )Y1, −1 ]


2

− 12
2
S1 / 2 m = 1
2
(+ )Y0,0
− 12 (− )Y0,0
Les fonctions d'onde (6) peuvent être utilisées pour calculer les éléments de matrice de
x = r sin θ cos φ , y = r sin θ sin φ et z = r cosθ . Nous supposons que les fonctions radiales
associées à (6) sont toutes les mêmes, ainsi la partie radiale de l'intégrale de l'élément de matrice est
un facteur commun. La partie angulaire des intégrales est facilement calculée en utilisant les
expressions explicites des harmoniques sphériques en fonction de θ et φ que nous avons vues
(dans le cas général où les Ylm avec l > 1 sont impliqués, il est souvent plus facile d'utiliser une
formule pour l'intégrale du produit des trois harmoniques sphériques données par J.A. Gaunt. La
formule de Gaunt peut être dérivée en utilisant les coefficients de Clebsch-Gordan). Le produit des
fonctions de spin suit des règles simples (+ ) (+ ) = 1 , (− ) (+ ) = 0 , etc. De cette manière, nous
+ +

obtenons les valeurs suivantes pour les carrés des grandeurs des éléments de matrice indiqués,
exprimés en unités de 181 du facteur radial commun :
2 2 2
2
P3 / 2 → 2 S1 / 2 m= 3
2 → 1
2 x = y =3 z =0
→ − 12 x = y =0 z =0
3 2 2 2
2
2 2 2
1
2 → 1
2 x = y =0 z =4
(7)
→ − 12 x = y =1 z =0
1 2 2 2
2
2 2 2
2
P3 / 2 → 2 S1 / 2 m= 1
2 → 1
2 x = y =0 z =2
→ − 12 x = y =2 z =0
1 2 2 2
2
Des résultats similaires sont obtenus pour les transitions qui partent de m = − 12 et − 32 . Elles sont
en accord avec les règles de sélection que nous verrons plus tard.

Il suit de (7) que la somme des intensités (proportionnelles aux moments dipolaires) qui ont pour
origine chacun des quatre états 2 P3 / 2 est égal à 6 dans les unités précédentes. On s'attend à ce que
ces sommes soient égales puisque les quatre valeurs de m diffèrent seulement par l'orientation du
moment angulaire et cela n'affecte pas l'intensité. Cependant, l'intensité totale de chacun des deux
états 2 P1 / 2 est aussi égale à 6. L'égalité des intensités totales de chaque état formé par un L et un S
donné est une propriété générale du couplage LS. Cela donne une intensité observée, égale à celle
de tous les états dégénérés par rapport à m, proportionnelle à 2J + 1. Dans l'exemple considéré ici,
les deux lignes du doublet ont des intensités dans le rapport 2:1. Cela est observé pour les doubles
les plus faibles des alcalins, bien que pour les doublets les plus élevés, le rapport d'intensité excède
2. Cela est dû au fait que l'énergie spin - orbite mélange en réalité différentes configurations (des
états 2 P avec le même j mais différents n). La quantité de mélange est différente pour les deux
valeurs de j et donc les deux fonctions radiales ne sont pas les mêmes. Un petit mélange des états
supérieurs de faible intensité aux états 2 P inférieurs de faible intensité a peu d'effet tandis que dans
le cas opposé il y a un grand effet sur le rapport d'intensité du doublet.

Effet d'un champ magnétique


Nous allons maintenant considérer l'effet d'un champ magnétique sur les niveaux d'énergie et les
intensités de transition d'un atome alcalin. Un champ magnétique constant peut être représenté par
le potentiel vecteur
(8) A = 12 H × r
et l'énergie supplémentaire associée au mouvement orbital d'un électron de charge -e est
e e2
(9) H⋅L + 2
H 2 r 2 sin 2 θ
2mc 8mc
où L = r × p et θ est l'angle entre r et H.
L'électron a aussi un moment magnétique intrinsèque dans la direction de son axe de spin. La
grandeur de ce moment peut être déterminée par comparaison entre l'expérience et la théorie de
l'effet Zeeman présenté ci-dessous et son accord avec la valeur de la théorie relativiste de Dirac de
l'électron. Elle est − eh / 2mc ou − e / mc fois le moment angulaire de spin de l'électron. La quantité
eh / 2mc est appelée le magnéton de Bohr. C'est deux fois le rapport du moment magnétique au
moment angulaire d'une distribution de charge classique pour laquelle le rapport de charge à la
densité de masse est constant. L'opérateur moment magnétique est − (e / mc )S et l'énergie
supplémentaire dans un champ magnétique est
e
(10) H ⋅S
mc

Le rapport (9) à l'énergie cinétique est assez petit pour l'intensité des champs magnétique
habituellement obtenu en laboratoire. Il est donc admissible d'utiliser la théorie des perturbations
pour trouver l'effet de ces termes sur les fonctions d'onde et les niveaux d'énergie. Dans la plus part
des cas, seuls les termes linéaires doivent être considérés. Cependant, pour des champs très forts et
des grandes orbites, les termes quadratiques peuvent devenir intéressants. De même, la
susceptibilité diamagnétique peut être obtenue à partir des termes dans l'énergie qui sont
proportionnels à H 2 .

Cas des champs faibles


Pour le moment considérons seulement les effets au premier ordre en H. L'hamiltonien (1) devient
alors avec (8) et (9),
h2 2
H =− ∇ + V (r ) + ξ (r )L ⋅ S + ε (L z + 2 S z )
(11) 2 m
eH
ε≡
2 mc
où le champ est le long de l'axe z. Le champ magnétique peut maintenant être classé comme faible
ou fort selon que le dernier terme de (11) est petit ou grand par comparaison avec l'énergie spin -
orbite. L'effet Zeeman se rapporte habituellement au cas du champ faible et l'effet Paschen-Back au
cas du champ fort, bien que le terme d'effet Zeeman soit quelque fois utilisé pour inclure tous les
effets magnétiques.
Dans le cas du champ faible, nous pouvons utiliser les fonctions d'onde (6) qui sont fonctions
propres de J 2 et J z . On vérifie facilement que l'énergie magnétique ε (L z + 2S z ) = ε ( J z + S z ) a
des éléments de matrice entre états de j différents mais pas entre états de même j et différents m.
Nous négligeons les premiers à cause de la séparation en énergie relativement grande entre états de
j différents. Donc, l'énergie magnétique est diagonale par rapport à m de chaque j et décale l'énergie
de chaque état (6) par sa valeur moyenne pour cet état. Dans chaque cas, J z est diagonal et ainsi sa
valeur moyenne est mh . La valeur moyenne de S z pour l'état 2 P3 / 2 , avec m = 12 , par exemple, est

∫∫ 3[2 −1 / 2 1/ 2
(+ )+ Y1∗,0 + (− )+ Y1∗,1 ] 12 hσ z 3 −1 / 2 [21 / 2 (+ )Y1,0 + (− )Y1,1 ]sin θ dθ dφ
(12) = ∫∫ [2 (+ )+ Y1∗,0 + (− )+ Y1∗,1 ][21 / 2 (+ )Y1,0 − (− )Y1,1 ]sin θ dθ dφ
h 1/ 2

6
h
= (2 − 1) = h
6 6
où on a utilisé l'effet de σ z sur les fonctions d'onde de spin et l'orthonormalité des fonctions de
spin et des Y. Donc l'énergie magnétique de cet état est εh ( 12 + 16 ) = 23 εh . Avec les autres résultats
similaires, (6) peut être exprimé en fonction du facteur g de Landé. L'énergie magnétique est
εmhg
2
P3 / 2 g= 4
3
(13) 2
P1 / 2 g= 2
3
2
S1 / 2 g=2

Les intensités des transitions en champ faible sont données directement par (7). Nous verrons dans
l'étude du rayonnement que les transitions dans lesquelles m change d'une unité, le rayonnement est
polarisé circulairement le long du champ et linéairement polarisé perpendiculairement au champ
dans le plan xy. On les appelle composantes σ . Quand m ne change pas dans une transition, le
rayonnement n'apparaît pas le long du champ et est polarisé parallèlement au champ (composantes
π ) dans le plan xy. Pour l'observation dans le plan xy, l'intensité π est proportionnelle à z dans
2

(7) et l'intensité σ est proportionnelle à x ou y


2 2
(mais pas à leur somme).

Cas des champs forts


Si le champ magnétique est grand comparé à l'énergie spin - orbite dans (11), le champ est dit fort.
Dans ce cas, les états dans une configuration nl donnée sont mieux spécifiés par ml et ms que par j
et m comme dans (6). L'énergie magnétique est alors diagonale et a la valeur
(14) εh (ml + 2m s )

Si l'énergie spin - orbite est négligée pour le moment, les huit fonctions d'onde qui correspondent à
(6) et leurs décalages en énergie (14) sont
2
P (+ )Y1,1 2εh
(+ )Y1,0 εh
(+ )Y1,−1 0
(− )Y1,1 0
(15)
(− )Y1,0 − εh
(− )Y1, −1 − 2εh
2
S (+ )Y0,0 εh
(− )Y0,0 − εh

Dans l'éventualité où le champ magnétique est très fort, l'énergie spin - orbite est plus facilement
traitée comme une perturbation des fonctions d'onde (15). Nous considérons plutôt le cas général,
qui inclut toutes les intensités relatives des énergies magnétiques et de spin - orbite. Cela se fait en
travaillant avec la matrice des deux derniers termes dans (11) dans une des représentations (6) ou
(15). Les valeurs propres des matrices sont les niveaux d'énergie et la transformation qui
diagonalise la matrice donne les fonctions d'ondes. Nous partons de (15) et nous notons directement
que les deux fonctions d'onde 2 S sont les mêmes que les fonctions 2 S1 / 2 de (6). Nous ignorons
l'effet de l'énergie spin - orbite sur ces deux états puisqu'ils ne se déplacent pas l'un par rapport à
l'autre. Les décalages d'énergie dus au champ magnétique sont ± εh . De même, la première et la
dernière des six fonctions d'onde 2 P sont les mêmes que les fonctions 2 P3 / 2 de (6) avec m = ± 32 .
Leurs énergies sont 12 ζ ± 2εh , où ζ est donné par (4).

Les quatre fonctions d'onde 2 P restantes se combinent par paires, selon que m = ml + ms est égal à
1
2 ou − 12 . Il est suffisant de considérer seulement une des paires, disons celle où m = 1
2 : (+ )Y1,0 et
(− )Y1,1 . La matrice des énergies magnétiques et spin - orbite dans la représentation spécifiée par ces
deux états peut être trouvée avec l'aide des matrices de moment angulaire :
 εh 2 −1 / 2 ζ 
(16)  −1 / 2 
2 ζ − 2 ζ 
1

Les valeurs propres de la matrice (16) sont trouvées en résolvant l'équation séculaire
εh − λ 2 −1 / 2 ζ
(17) −1 / 2 = λ2 + ( 12 ζ − εh )λ − 12 ζ (εh + ζ ) = 0
2 ζ − 2ζ −λ1

De cette manière, nous obtenons pour les déplacements en énergie de ces deux états
(18) λ ± = 1
2
[εh − 1
2 ζ ± (ε 2 h 2 + εhζ + 94 ζ 2 )
1/ 2
]
A la limite des champs faibles et forts, les signes supérieurs et inférieurs dans (18) conduisent à
εh
λ+ → 12 ζ + 23 εh λ− − ζ + 13 εh →0
ζ
(19)
ζ
λ+ → εh λ− → − 12 ζ →0
εh

Les relations (19) montrent que l'état qui correspond au signe supérieur dans (18) est l'état de
champ faible j = 32 , m = 12 et l'état de champ fort ml = 0 , m s = 12 . De même, le signe inférieur
dans (19) correspond à l'état de champ faible j = 12 , m = 1
2 et l'état de champ fort ml = 1 , m s = − 12 .
Les intensités de transition peuvent être trouvées dans le cas général en calculant les éléments de
matrice de x, y, et z et avec l'aide des fonctions propres de ζ (r )L ⋅ S + ε (Lz + 2S z ) . Ces fonctions
propres sont la première, la sixième, la septième et la huitième de (15) et les combinaisons linéaires
des quatre autres fonctions obtenues à partir de la matrice qui diagonalise (16).

Effet Zeeman quadratique


Pour des champs magnétiques très forts et des orbites très grandes ou des valeurs de n très grandes;
les effets au second ordre en H deviennent appréciables. A partir de (5), il est évident que l'effet de
l'énergie spin - orbite devient très petit pour n grand et une approximation utile est obtenue en
négligeant entièrement cette partie de l'énergie. Dans ce cas, le spin de l'électron commute avec
l'hamiltonien, ainsi ms est une constante du mouvement et le spin peut être ignoré. L'hamiltonien
(11) est alors remplacé par
h2 2
(20) H = − ∇ + V (r ) + εLz + 12 mε 2 r 2 sin 2 θ
2m

Puisque L z = −ih∂ / ∂φ commute avec (20), ml est un bon nombre quantique et le seul effet du
terme εL z est de déplacer chaque niveau d'énergie d'une quantité ε hml . Donc, pour n grand, nous
sommes seulement concernés par l'effet du dernier terme H ′ ≡ 12 mε 2 r 2 sin 2 θ dans (20), pour des
valeurs particulières de ml et ms .

Le rayon d'un atome d'hydrogène est approximativement proportionnel à n 2 . Pour les états
d'atomes alcalins de grand n, V (r ) a pratiquement la forme coulombienne et les fonctions d'onde
sont très proches des fonctions de l'hydrogène. Donc H ′ s'accroît environ comme n 4 . Cela signifie
que l n'est plus un bon nombre quantique pour n suffisamment grand. Pour n plus petit, l peut ne
pas être un bon nombre quantique puisque H ′ a des éléments de matrice non diagonaux entre états
de l différents et les énergies non perturbées de ces états sont proches (ils ne sont pas dégénérés
seulement parce que les fonctions d'onde pour les plus petites valeurs de l pénètrent à l'intérieur des
couches pleines). Dans cette région, les niveaux d'énergie perturbés peuvent être trouvés en
diagonalisant la matrice de H ′ pour des valeurs données de n, ml et ms alors les n − ml lignes et
colonnes sont indicées par l. La structure de la matrice H ′ peut être déduite de la formule de
Gaunt. Puisque sin 2 θ peut être exprimé en fonction des harmoniques sphériques d'ordre 0 et 2, les
seuls éléments de matrice non nuls l H ′ l ′ = H l′l ′ sont ceux pour lesquels l − l ′ = 0,±2 . Donc, la
matrice H ′ a la forme (si, par exemple, ml = 0 )

 H 00 0 ′
H 02 0 0 L
 0 H 11′ 0 H 13′ 0 L

H ′ 0 ′
H 22 0 ′ L
H 24
(21)  20 
 0 ′
H 31 0 ′
H 33 0 L
 0 0 ′
H 42 0 ′ L
H 44
 
 L L L L L L

La matrice (21) est équivalente à deux matrices indépendantes, une pour l pair et l'autre pour l
impair, chacune avec environ 12 n lignes et colonnes. La diagonalisation directe de ces matrices
serait assez ardue pour n grand. Cependant, les niveaux d'énergie résultants sont si proches qu'ils ne
peuvent pas être résolus de manière spectroscopique, ainsi il n'y a pas vraiment de raison pour
déterminer les niveaux individuels. Ce qui peut être observé est l'agrégat de transitions entre l'état
de base 2 S (l = 0) et le groupe d'états qui sont obtenus par diagonalisation de (21). Elles
apparaissent comme une seule "ligne" élargie. Les transitions autorisées apparaissent seulement
grâce à l'état l = 1 qui est mélangé avec chacune des fonctions propres de (21), ainsi ml peut
seulement être 0 ou ± 1 . Cela rend possible de trouver le centre de gravité de cette ligne et sa
largeur moyenne sans diagonaliser H ′ comme nous allons maintenant le montrer.

Les fonctions d'onde non perturbées peuvent être choisies telles que H ′ est une matrice réelle.
Alors la matrice S unitaire qui diagonalise H ′ peut être réelle,
(22) SH ′S + = E
où maintenant S + est maintenant la transposée de S et E est diagonal. En termes d'éléments de
matrice, cette équation est
(23) ∑S
k ,l
ik H kl′ S jl = Ei δ ij

Les nouvelles fonctions propres u i qui correspondent aux valeurs propres de l'énergie Ei sont
données en fonction des fonctions d'onde non perturbées vl par :
(24) u i = ∑ S il vl
l

Si maintenant nous négligeons la dépendance de la probabilité de transition radiative avec l'énergie


sur de petits domaines d'énergie impliqués dans ce groupe d'états, la probabilité de transition est
proportionnelle au carré du nombre de v1 dans chaque u i ou à S i21 . Donc, les niveaux d'énergie Ei
devraient être pondérés en proportion de S i21 . Le centre de gravité du groupe de niveaux d'énergie
perturbés est donné par
(25) E moy = ∑ Ei S il2 = H 11′
i

puisque (22) peut être inversé pour donner H ′ = S + ES . De même la largeur moyenne (l'écart type)
de la ligne est
∑i (Ei − Emoy )2 S i21 = ∑ Ei2 S i21 − E moy
2

(26)
= ∑ H 1′l2 − E moy
2
= H 13′ 2
l

Donc, seuls deux des éléments de matrice de H ′ ont besoin d'être calculés. Il est évident que les
deux déplacements (de part et d'autre du facteur ε hml ) et la largeur de la ligne sont proportionnels
à H2 .

Le tableau périodique
Récapitulons ce que nous avons vu dans une description des atomes du tableau périodique.
Hydrogène H
L'état fondamental de l'hydrogène a l = m = 0 et n = 1 . Nous disons que la configuration de
l'électron est 1s. L'énergie est -13.6 eV. Cela signifie qu'il faut 13.6 électronvolts pour arracher
l'électron à l'atome. C'est l'énergie d'ionisation. Si l'énergie d'ionisation est grande, il en résulte qu'il
est plus difficile d'arracher l'électron et, de manière générale, que le matériau est chimiquement
moins actif.

Hélium He
Les électrons peuvent être tous les deux dans l'état le plus bas (l'un avec le spin vers le haut et
l'autre vers le bas). Lorsqu'un électron se trouve près du noyau, il subit un potentiel électrique
équivalent à Z = 2 (deux protons) mais lorsqu'il est plus éloigné du noyau, il se déplace dans le
potentiel électrique des deux protons et de l'autre électron, la charge n'est plus que 1 ( Z = 1 ). Le
résultat est un état 1s de "type hydrogène" mais avec une énergie un peu plus basse. Les deux
électrons occupent des états 1s identiques l = m = 0 . L'énergie d'ionisation observée (pour enlever
un électron) est 24.6 eV. La "couche" 1s étant maintenant remplie - nous n'y admettons que deux
électrons - le système n'a pratiquement pas tendance à attirer un électron d'un autre atome.

Cela nous donne une des clefs de la chimie. Les atomes ont tendance à essayer de "compléter leurs
couches" en échangeant des électrons avec d'autres atomes. S'il reste de la place sur la couche, un
électron supplémentaire peut s'y placer avec éventuellement un gain d'énergie (tout dépend de
l'énergie d'un électron sur ce niveau). Par contre, s'il n'y a plus de place, l'électron ne peut se placer
que sur un niveau supplémentaire de plus haute énergie et le gain est beaucoup plus faible et même
en général il n'y a aucun gain possible par rapport à l'énergie à fournir pour enlever cet électron
d'un autre atome. Un atome dont les couches sont complètes a très peu d'activité chimique.

L'hélium est donc quasiment inerte.

Lithium Li
Le noyau de Lithium a une charge de 3. Les états des électrons seront à nouveau de type hydrogène
et les trois électrons occuperont les trois niveaux d'énergie les plus bas. Deux iront dans des états 2s
et le troisième dans un état n = 2 . Mais avec l = 0 ou l = 1 . Dans l'hydrogène, ces états ont la
même énergie, mais ce n'est pas le cas pour d'autres atomes et pour la raison suivante. Souvenez-
vous que l'état 2s a une amplitude non nulle pour être auprès du noyau tandis qu'elle est quasiment
nulle pour l'état 2p (à cause de la forme en sablier de l'orbitale). Cela implique qu'un électron sera
relativement sensible à la triple charge électrique du noyau de lithium tandis qu'un électron 2p
restera à l'extérieur, là où le champ est semblable à un champ pour une charge simple (à cause des
deux autres électrons proches du noyau, dans l'état 1s). L'attraction supplémentaire diminue
l'énergie de l'état 2s par rapport à l'état 2p. Les niveaux d'énergie seront à peu près comme indiqué
dans la figure suivante, à comparer au cas de l'hydrogène ou les lignes des différentes colonnes sont
parfaitement alignées.
Ainsi, l'atome de lithium aura deux électrons dans des états 1s et un dans un état 2s. L'électron 2s
ayant une énergie plus grande qu'un électron 1s, il est plus facile à arracher (il y a moins d'énergie à
fournir pour atteindre l'énergie maximale des niveaux). L'énergie d'ionisation du lithium n'est que
de 5.4 eV et cet élément est chimiquement très actif.

Vous voyez donc comment les choses se présentent. Nous donnons dans le tableau à la fin de cette
section une liste des 36 premiers éléments en montrant pour chaque atome les états occupés par les
électrons dans l'état le plus bas. Le tableau donne aussi l'énergie d'ionisation pour l'électron le plus
faiblement lié et le nombre d'électrons qui occupent chaque "couche", une couche étant l'ensemble
des états de même n . Comme les états de divers l ont des énergies différentes, à chaque l
correspondra une "sous-couche" de 2(2l + 1) états possibles (qui diffèrent entre eux par la valeur de
m et l'orientation du spin). Ils ont tous la même énergie, compte non tenu de très petits effets que
nous négligeons ici.

Le béryllium Be
Le béryllium est comme le lithium, sauf qu'il a deux électrons dans l'état 2s (les deux autres
remplissant la couche 1s).

Du bore au néon B - Ne
Le bore a cinq électrons. Le cinquième doit aller dans l'état 2p. Il y a 6 différents états 2p, nous
pouvons donc continuer d'y ajouter des électrons jusqu'à ce qu'on atteigne 6. Cela nous mène
jusqu'au néon. Au fur et à mesure que nous ajoutons ces électrons, nous augmentons Z .
L'ensemble de la distribution des électrons est attiré de plus en plus près du noyau et l'énergie des
états 2p descend de plus en plus bas. Quand on arrive au néon, l'énergie d'ionisation a atteint 26.1
eV. Le néon n'abandonne pas facilement un électron. N'ayant pas non plus de place à faible énergie
à remplir, il ne cherchera pas à saisir un électron supplémentaire. Le néon est chimiquement inerte.
Par contre, le fluor possède, lui, une case vide et donc un état de faible énergie dans lequel peut
tomber un électron. Le fluor est par conséquent extrêmement actif dans les réactions chimiques.

Du sodium à l'argon Na - Ar
Avec le sodium, le onzième électron peut commencer une nouvelle couche, celle de l'état 3s. Le
niveau d'énergie de cet état est beaucoup plus élevé. L'énergie d'ionisation dégringole et le sodium
est un constituant chimique actif. Depuis le sodium jusqu'à l'argon, les états s et p de n = 3 se
remplissent comme pour les états de n = 2 depuis le lithium jusqu'au néon. Les configurations
angulaires des électrons sur la couche externe non remplie se correspondent et les énergies
d'ionisation sont très similaires. Vous voyez pourquoi les propriétés chimiques se répètent lorsque
l'on parcourt la liste des éléments par numéros atomiques croissant. Le magnésium se comporte
chimiquement tout à fait comme le béryllium, le silicium comme le carbone et le chlore comme le
fluor. L'argon est inerte tout comme le néon.

Vous avez peut-être remarqué dans le tableau une petite irrégularité dans la séquence des énergies
d'ionisation quand on va du lithium au néon, irrégularité que l'on retrouve dans la séquence allant
du sodium à l'argon. Le dernier électron est un peu moins lié à l'atome d'oxygène que ce qu'on
aurait pu penser. Et de même pour le soufre. Pourquoi en est-il ainsi ? Pour le comprendre, il nous
faut introduire une toute petite partie des effets des interactions entre électrons individuels.
Imaginez ce qui se passe quand nous introduisons le premier électron 2p dans l'atome de bore. Il y a
six possibilités : trois états p avec chacun deux spins. Supposez que l'électron aille dans l'état m = 0
avec son spin en haut. L'état m = 0 est celui tel que le sablier est dirigé vers le haut, appelé "état z".
Que va-t-il se passer pour le carbone ? Nous allons avoir deux électrons 2p. Si l'un des deux occupe
l'état z, où ira le second ? Son énergie sera plus faible s'il se tient éloigné du premier, ce qui le
conduit à occuper l'état, disons avec le sablier de gauche à droite, appelons le "x", de la couche 2p.
Quand nous en arrivons à l'azote, les trois électrons 2p se situent de façon à minimiser l'énergie de
répulsion mutuelle. Ils se répartissent donc suivant les trois configurations "z", "x" et 'y" (cette
dernière allant d'avant en arrière pour le sablier). Mais pour l'oxygène, c'est la bagarre. Le
quatrième électron doit aller dans l'un des états déjà occupés en orientant son spin en sens opposé.
Il est fortement repoussé par le premier occupant et son énergie ne sera pas aussi faible qu'elle
pourrait l'être autrement. Il est donc plus facile de l'arracher. Ceci explique la rupture de séquence
dans les énergies de liaisons, une première fois entre l'azote et l'oxygène et, plus tard, entre le
phosphore et le silicium.

Du potassium au zinc K - Zn
Au-delà de l'argon, vous pourriez penser que les électrons devraient commencer à remplir les états
3d. Ce n'est pas le cas. Comme nous l'avons expliqué plus haut et illustré dans la figure avec les
niveaux d'énergie, les états de plus fort moment cinétique ont des énergies rehaussées. Quand on
arrive à l'état 3d, l'énergie est un peu au-dessus de celle de l'état 4s. Pour le potassium, l'électron va
donc dans l'état 4s. Vient ensuite le calcium, pour lequel cette couche est remplie (avec deux
électrons). Puis l'état 3d commence à se remplir avec le scandium, le titane et le vanadium.

Les énergies des états 3d et 4s sont si voisines qu'il faut peu de choses pour faire pencher la balance
d'un coté ou de l'autre. Quand il nous faut mettre quatre électrons dans les états 3d, leur répulsion
rehausse l'énergie des états 4s juste assez pour qu'elle dépasse un peu celle du 3d. L'un des
électrons change alors de camp. Pour le chrome, nous n'obtenons pas la combinaison 4,3 à laquelle
on aurait pu s'attendre mais bien une combinaison 5,1. Un nouvel électron ajouté pour former le
manganèse complète à nouveau la couche 4s, ensuite les états de la couche 3d sont occupés les uns
après les autres jusqu'à ce que l'on atteigne le cuivre.

Comme les couches externes du manganèse, du fer, du cobalt et du nickel ont les mêmes
configurations, leurs propriétés chimiques seront assez semblables. Cet effet est beaucoup plus
prononcé pour les éléments appelés "terres rares" (du cérium Ce au lutécium Lu) qui ont tous la
mêmes couche externe, la couche interne qui se remplit progressivement a beaucoup moins
d'influence sur leurs propriétés chimiques.

Pour le cuivre, un électron est dérobé à la couche 4s, ce qui permet de compléter la couche 3d.
L'énergie de la combinaison 10,1 est cependant si voisine de l'énergie pour 9,2 qu'il suffit parfois de
la proximité d'un autre atome pour faire pencher la balance en faveur de 9,2. Pour cette raison, les
deux électrons du cuivre sont presque équivalents et le cuivre cède dans une liaison chimique aussi
facilement un électron que deux. Il se comporte parfois comme si les électrons étaient dans la
combinaison 9,2. Des choses similaires se produisent en d'autres endroits ce qui explique que
d'autres métaux tel que le fer se combinent chimiquement de plusieurs manières. Au niveau du
zinc, les couches 3s et 4d sont l'une et l'autre définitivement remplies.

Du gallium au krypton Ga - Kr
Du gallium au krypton, la séquence se poursuit normalement par le remplissage de la couche 4p.
Les couches externes, les énergies et les propriétés chimiques reproduisent les situations que l'on a
du bore au néon et de l'aluminium à l'argon.
Le krypton, de même que l'argon et le néon est un gaz rare que l'on appelle parfois aussi "gaz
noble". Tous les trois sont chimiquement inertes. La raison en est simplement que, ayant des
couches remplies, d'énergie relativement faible, ils ont rarement avantage d'un point de vue
énergétique à s'adjoindre d'autres éléments. Le fait d'avoir une couche remplie n'est pas déterminant
: le béryllium et le magnésium ont des couches s remplies mais l'énergie de ces couches est trop
haute pour qu'ils soient stables. De même, on aurait pu s'attendre à un autre élément "noble" au
niveau du nickel, si du moins l'énergie de la couche 3d avait été plus basse (ou celle de 4s plus
élevée). Par ailleurs, le krypton n'est pas tout à fait inerte, il peut former avec le chlore un composé
faiblement lié.

Pensant que notre échantillon a montré les caractéristiques essentielles de la table périodique, nous
ne continuerons pas au-delà de l'élément 36, il en reste près de septante !

Bohr est connu non seulement pour le modèle d'atome qui porte son nom et pour l'interprétation de
Copenhague mais aussi pour sa contribution importante dans l'explication des propriétés des atomes
tel que nous venons de la décrire mais également pour les autres éléments et en particulier pour les
éléments de transition (ceux du scandium au zinc) et leurs anomalies.

Z Elément W Configuration des électrons


1s 2s 2p 3s 3p 3d 4s 4p 4d 4f
1 H hydrogène 13.6 1
2 He hélium 24.6 2
3 Li lithium 5.4 1
4 Be béryllium 9.3 2
5 B bore 8.3 2 1
6 C carbone 11.3 REMPLIE 2 2
7 N azote 14.5 (2) 2 3
8 O oxygène 13.6 2 4
9 F fluor 17.4 2 5
10 Ne néon 21.6 2 6
11 Na sodium 5.1 1
12 Mg magnésium 7.6 2
13 Al aluminium 6.0 2 1
14 Si silicium 8.1 REMPLIES 2 2
15 P phosphore 10.5 (10) 2 3
16 S soufre 10.4 2 4
17 Cl chlore 13.0 2 5
18 Ar argon 15.8 2 6
19 K potassium 4.3 1
20 Ca calcium 6.1 2
21 Sc scandium 6.5 1 2
22 Ti titane 6.8 2 2
23 V vanadium 6.7 3 2
24 Cr chrome 6.8 REMPLIES 5 1
25 Mn manganèse 7.4 (18) 5 2
26 Fe fer 7.9 6 2
27 Co cobalt 7.9 7 2
28 Ni nickel 7.6 8 2
29 Cu cuivre 7.7 10 1
30 Zn zinc 9.4 10 2
31 Ga gallium 6.0 2 1
32 Ge germanium 7.9 2 2
33 As arsenic 9.8 REMPLIES 2 3
34 Se sélénium 9.7 (28) 2 4
35 Br brome 11.8 2 5
36 Kr krypton 14.0 2 6
I.4.3. Molécules
Les molécules sont considérablement plus complexes dans leur structure que les atomes et par
conséquent beaucoup moins a été accomplit dans l'application quantitative de la mécanique
quantique aux problèmes moléculaires. La puissance de calcul des ordinateurs a permis d'aborder
des calculs beaucoup plus complexes dans ce que l'on appelle la chimie quantique mais les calculs
analytiques sont infiniment plus limités.

Nous commencerons donc par voir des cas simples en appliquant les bases de la mécanique
quantique et en particulier la description très simple des systèmes à deux états. Beaucoup de choses
peuvent déjà en être tirées.

Nous reviendrons ensuite sur le calcul plus détaillé de la molécule d'hydrogène et un traitement
plus général des molécules diatomiques.

Nous discuterons enfin, de manière qualitative, des liaisons chimiques à la base de molécules plus
complexes.

L'ion d'hydrogène moléculaire


Beaucoup de systèmes peuvent être décrit à un certain degré d'approximation par des systèmes à
deux états. Beaucoup de chose ne sont alors qu'approchées car il y a toujours beaucoup d'états et il
faudrait les prendre en compte dans une analyse plus précise. Mais en choisissant judicieusement
deux états principaux, on peut déjà comprendre beaucoup de choses.

Comme nous considérons des systèmes à deux états, l'hamiltonien sera identique à celui utilisé dans
l'étude de ces systèmes. Lorsque l'hamiltonien est indépendant du temps, nous savons qu'il y a deux
états d'énergie stationnaires avec des énergies définies et d'habitude différentes. Cependant, en
général, nous commencerons notre analyse avec un ensemble d'états de base qui ne seront pas des
états stationnaires mais des états qui pourront peut-être avoir une autre signification physique
simple, le choix judicieux dont nous parlions. Les états stationnaires du système seront alors
représentés par une combinaison linéaire de ces états de base.
Par commodité, nous allons résumer les équations importantes des systèmes à deux états. Soient 1
et 2 les états de base originaux. Alors tout état ψ est représenté par la combinaison linéaire
(1) ψ = 1 1 ψ + 2 2 ψ = 1 C1 + 2 C 2

Les amplitudes C i satisfont aux deux équations linéaires différentielles


dC i
(2) ih = ∑ H ij C j
dt i
où i et j prennent les valeurs 1 et 2.

Quand les termes de l'hamiltonien H ij ne dépendent pas de t, les deux états d'énergie définie (les
états stationnaires), que nous appelons
− (i / h ) E I t − (i / h ) E II t
(3) ψ I = I e et ψ II = II e
ont les énergies
2
H + H 22  H − H 22 
E I = 11 +  11  + H 12 H 21
2  2 
(4)
2
H 11 + H 22  H − H 22 
E II = −  11  + H 12 H 21
2  2 

Ce sont les valeurs propres de la matrice hamiltonienne H.

Les deux C de chacun des états ont la même dépendance dans le temps. Les vecteurs d'états I et
II qui correspondent aux états stationnaires sont reliés à nos états de base originels 1 et 2 par
I = 1 a1 + 2 a 2
(5)
II = 1 a1′ + 2 a 2′
Les a sont des constantes complexes qui satisfont à
a1 + a 2 =1
2 2

(6) a1 H 12
=
a 2 E I − H 11
a1′ + a 2′ =1
2 2

(7) a1′ H 12
=
a 2′ E II − H 11

Si H 11 et H 12 sont égaux, à E 0 par exemple, et si H 12 = H 21 = − A , alors E I = E0 + A ,


E II = E0 − A , et les états I et II sont particulièrement simples :

(8) I =
1
(1 − 2 ) II =
1
(1 + 2 )
2 2

Nous allons utiliser maintenant ces résultats pour discuter quelques exemples intéressants. Le
premier exemple est l'ion d'hydrogène moléculaire. Une molécule d'hydrogène ionisée positivement
consiste en deux protons avec un électron tournant tout autour d'eux. Si les deux protons sont très
loin l'un de l'autre, quels états pouvons-nous prévoir pour ce système ? La réponse est
particulièrement claire. L'électron restera près d'un proton et formera un atome d'hydrogène dans
son état de base, l'autre proton restera seul, comme un ion positif. Ainsi, si les deux protons sont
loin l'un de l'autre, nous pouvons visualiser un état physique de celui-ci dans lequel l'électron est
attaché au proton. Il y a clairement un autre état, symétrique de celui-ci, pour lequel l'électron est
proche de l'autre proton et le premier proton est alors un ion. Nous prendrons ces deux comme bas
et nous les appellerons 1 et 2 . Ils sont schématisés sur la figure ci-dessous.
Evidemment, il y a en fait beaucoup d'états d'un électron près d'un proton, puisque la combinaison
peut exister dans l'un quelconque des états excités de l'atome d'hydrogène. Mais nous ne nous
intéressons pas à cette variété d'états pour l'instant. Nous considérerons seulement la situation dans
laquelle l'atome d'hydrogène est dans son état de base et nous négligerons pour l'instant le spin de
l'électron. Nous pouvons simplement supposer que pour tous nos états l'électron a son spin "en
haut" le long de l'axe z. Ceci est satisfaisant tant qu'il n'y a pas de champ magnétique important.

Maintenant, il faut 13.6 électrons-volts d'énergie pour arracher l'électron d'un atome d'hydrogène.
Tant que les deux protons de l'ion d'hydrogène moléculaire sont loin l'un de l'autre, il faut encore à
peu près la même énergie, ce qui est une énergie importante, dans le cadre de nos présentes
considérations, pour placer l'électron quelque part au milieu entre les deux protons. Il est donc
impossible, classiquement, que l'électron saute d'un proton à l'autre. Cependant, c'est possible en
mécanique quantique, quoique pas très probable. Il y a une petite amplitude pour que l'électron
passe d'un proton à l'autre. En première approximation, chacun de nos états de base aura l'énergie
E 0 , qui est l'énergie d'un atome d'hydrogène plus un proton. Nous pouvons admettre que les
éléments de matrice de l'hamiltonien H 11 et H 12 sont tous deux approximativement égaux à E 0 .
Les autres éléments de matrice H 12 et H 21 , qui représentent les amplitudes pour que l'électron
passe d'un proton à l'autre, seront encore pris égaux à -A.

Vous voyez que c'est encore le même jeu que dans les autres exemples de systèmes à deux états. Si
nous oublions le fait que l'électron peut passer d'un proton à l'autre, nous avons deux états qui ont
exactement la même énergie. Cette énergie sera cependant séparée en deux niveaux d'énergie du
fait de la possibilité qu'a l'électron d'aller d'un proton à l'autre et, plus grande sera la probabilité de
transition plus grande sera la séparation. Les deux niveaux d'énergie du système sont donc E 0 + A
et E 0 − A et les états qui ont ces énergies définies sont donnés par les équations (8).

D'après notre solution nous voyons que si un proton et un ion d'hydrogène sont placés près l'un de
l'autre, l'électron ne restera pas avec un des protons mais oscillera de l'un à l'autre. S'il part près de
l'un des protons il oscillera entre les états 1 et 2 , ce qui correspond à une solution dépendant du
temps. Pour obtenir la solution d'énergie la plus basse (ne dépendant pas du temps) il est nécessaire
de faire démarrer le système avec des amplitudes égales pour que l'électron soit au voisinage de
chaque proton. Rappelez-vous qu'il n'y a pas deux électrons, nous ne disons pas qu'il y a un électron
autour de chaque proton. Il y a seulement un électron et il a la même amplitude, 1 / 2 à une phase
près, d'être dans l'une ou l'autre position.

Maintenant, l'amplitude A pour qu'un électron qui est près d'un proton aille près de l'autre dépend
de la séparation entre les protons. Plus proches sont les protons et plus grande est l'amplitude. C'est
le même phénomène que la pénétration d'une barrière par l'électron par effet tunnel. L'amplitude
pour qu'un électron passe de l'un à l'autre décroît exponentiellement avec la distance, pour les
grandes distances. Comme la probabilité de transition, et par conséquent, A augmente lorsque les
protons sont plus proches, la séparation des niveaux d'énergie deviendra aussi plus grande. Si le
système est dans l'état I , l'énergie E 0 + A croît avec lorsque la distance diminue, si bien que ces
effets quantiques donnent une force répulsive qui tend à écarter les protons. D'autre part, si le
système est dans l'état II , l'énergie total décroît si on approche les protons, il y a une force
attractive qui attire les protons l'un vers l'autre. Les variations des deux énergies avec la distance
entre les deux protons doivent être à peu près comme nous le montrons sur la figure ci-dessous.
Nous avons donc une explication quantique de la force de liaison qui maintient l'ion H 2+ lié.

Nous avons cependant oublié une chose. En plus de la force que nous venons de décrire, il y a aussi
une répulsion électrostatique entre les deux protons. Lorsque les deux protons sont loin l'un de
l'autre, le proton "nu" voit seulement un atome neutre, si bien que la force électrostatique est
négligeable. Cependant, à de très courtes distances, le proton "nu" commence à entrer à l'intérieur
de la distribution électronique, c'est-à-dire qu'il est en moyenne plus proche de l'autre proton que de
l'électron. Il commence alors à y avoir une certaine énergie électrostatique supplémentaire qui est,
bien entendu, positive. Cette énergie qui varie aussi avec la séparation devrait être incluse dans E 0 .
Nous devrions donc prendre pour E 0 quelque chose comme la ligne en traits interrompus ci-
dessus, qui croît rapidement pour les distances plus courtes que le rayon d'un atome d'hydrogène.
Nous devrions ajouter et soustraire l'énergie de basculement A de cet E 0 . Lorsque nous faisons
cela, les énergies E I et E II varient avec la distance D entre protons comme le montre la figure ci-
dessous (sur cette figure nous avons indiqué le résultat d'un calcul plus détaillé. La distance entre
les protons est donnée en unités de 1 Angström et l'excès d'énergie par rapport à un proton plus un
atome d'hydrogène est donné en unités d'énergie de liaison de l'atome d'hydrogène, ce qu'on appelle
le "Rydberg", c'est-à-dire 13.6 eV).
Nous voyons que l'état II passe par un point d'énergie minimum. Ce sera une position d'équilibre,
la position de plus basse énergie, pour l'ion H 2+ . L'énergie en ce point est plus basse que l'énergie
d'un proton et d'un atome d'hydrogène séparé, si bien que le système est lié. Un simple électron
maintient les deux protons liés ensemble. Un chimiste dirait que c'est une "liaison à un seul
électron".

Ce genre de liaison chimique est souvent appelé "résonance quantique". Mais cela semble vraiment
beaucoup plus mystérieux qu'il n'y est, ce n'est qu'une "résonance" que si vous faites au départ un
"mauvais" choix d'états de base, comme nous l'avons fait ! Mais si vous preniez l'état II vous
auriez seulement l'état de plus basse énergie, c'est tout.

Nous pouvons voir d'une autre façon pourquoi un tel état doit avoir une énergie plus basse que celle
d'un proton et d'un atome d'hydrogène. Considérons un électron proche des deux protons séparés
d'une certaine distance, pas trop grande. Vous vous rappelez que, lorsqu'il n'y a qu'un proton,
l'électron est "étalé" à cause du principe d'indétermination. Il essaye de trouver un équilibre entre
avoir une énergie potentielle coulombienne basse et n'être pas confiné dans un trop petit espace, ce
qui lui donnerait une énergie cinétique élevée (à cause de la relation d'indétermination ∆p∆x ≈ h ).
Maintenant, s'il y a deux protons, il y a plus d'espace ou l'électron peut avoir une énergie potentielle
basse. Il peut s'étaler, en abaissant son énergie cinétique, sans augmenter son énergie potentielle. Le
résultat brut est une énergie plus basse que celle d'un atome d'hydrogène. Mais alors, pourquoi
l'autre état, I , a-t-il une énergie plus élevée ? Notez que cet état est la différence des états 1 et
2 . Du fait de la symétrie de 1 et de 2 , la différence doit donner une amplitude nulle pour
trouver l'électron à mi-chemin entre les deux protons. Cela signifie que l'électron est un peu plus
confiné en volume ce qui lui donne une plus grande énergie.

Nous devons dire que notre traitement approché de l'ion H 2+ en tant que système à deux états
s'effondre complètement dès que les protons sont aussi proches l'un de l'autre qu'ils le sont au
minimum de la courbe de la figure ci-dessus et, par conséquent, nous n'obtenons pas une bonne
valeur de l'énergie de liaison. Pour de petites séparations, l'énergie des deux "états", tels que nous
les avons définis initialement, n'est pas vraiment égale à E 0 . Il faut alors un traitement quantique
plus raffiné.

Supposons que nous demandions maintenant ce qui se passerait si, au lieu de deux protons, nous
avions deux objets différents, comme par exemple, un proton et un lithium positif (les deux
particules ayant encore une seule charge positive). Dans un tel cas, les deux termes H 11 et H 22 de
l'hamiltonien ne seraient plus égaux. Ils seraient en fait complètement différents. S'il se trouvait que
la différence (H 11 − H 22 ) devienne beaucoup plus grande, en valeur absolue, que A = − H 12 , la
force attractive deviendrait très faible comme nous pouvons le voir de la façon suivante.

Si nous substituons H 12 H 21 = A 2 dans l'équation (4), nous obtenons


H 11 + H 22 H 11 − H 22 4 A2
(9) E = ± 1+
2 2 (H 11 − H 22 )2

Lorsque H 11 − H 22 est beaucoup plus grand que A 2 , la racine carrée est très proche de
2 A2
(10) 1 +
(H 11 − H 22 )2
Les deux énergies sont alors
A2
E I = H 11 +
(H 11 − H 22 )
(11)
A2
E II = H 22 −
(H 11 − H 22 )
Elles sont maintenant très proches des énergies H 11 et H 22 des atomes isolés, elles sont seulement
légèrement déplacées par l'amplitude de basculement A.

La différence d'énergie E I − E II est


2 A2
(12) (H 11 − H 22 ) +
H 11 − H 22

La séparation additionnelle, due au va-et-vient de l'électron, n'est plus égale à 2A. Elle est plus
petite d'un facteur A / (H 11 − H 22 ) qui est maintenant beaucoup plus petit que un. De même, la
dépendance de E I − E II en fonction de la séparation des deux ions est beaucoup plus petite que
pour l'ion H 2+ . Elle aussi est réduire par le facteur A / (H 11 − H 22 ) . Nous pouvons voir maintenant
pourquoi l'énergie de liaison des molécules diatomiques asymétriques est généralement très faible.

Avec notre théorie de l'ion H 2+ , nous avons découvert une explication du mécanisme par lequel un
électron partagé entre deux protons fournit l'effet d'une force attractive entre les deux protons,
même lorsque ceux-ci sont très éloignés. La force attractive vient de ce que l'énergie du système est
réduite par la possibilité que l'électron saute d'un proton à l'autre. Au cours d'un tel saut, le système
change de configuration, passant de (atome d'hydrogène, proton) à (proton, atome d'hydrogène) ou
vice versa. Nous pouvons écrire cela symboliquement comme
(13) (H , p ) ⇔ ( p, H )

Le déplacement d'énergie dû à ce processus est proportionnel à l'amplitude A pour qu'un électron


d'énergie − WH (son énergie de liaison dans l'atome d'hydrogène) puisse aller d'un proton à l'autre.

Pour de grandes distances R entre les deux protons, l'énergie potentielle électrostatique de l'électron
est presque nulle dans tout l'espace que l'électron doit parcourir en faisant son saut. Dans cet
espace, l'électron se déplace donc presque comme une particule libre dans le vide, mais avec une
énergie négative ! L'amplitude pour qu'une particule d'énergie définie aille d'un endroit à un autre
éloigné de r est proportionnelle à
e (i / h ) pr
(14)
r
où p st l'impulsion correspondant à cette énergie définie. Dans le cas présent, et en utilisant la
formule non relativiste, p est donné par
p2
(15) = −WH
2m

Ceci signifie que p est un nombre imaginaire


(16) p = i 2mWH
(l'autre signe pour le radical n'a pas de sens ici).

Nous nous attendons alors à ce que l'amplitude A pour l'ion H 2+ varie comme
− ( 2 mWH / h )R
e
(17) A ~
R
pour de grandes distances R entre les deux protons. Le déplacement d'énergie dû à la liaison par
l'électron est proportionnel à A, et il y a donc une force attirant les deux protons l'un vers l'autre,
qui est proportionnelle, pour les grands R, à la dérivée de (17) par rapport à R.

Finalement, pour être complet, nous pouvons remarquer que, dans le système à deux protons et à un
électron, il y a un autre effet qui donne une dépendance en R de l'énergie. Nous l'avons négligé
jusqu'ici parce qu'il est peu important, sauf pour les très grandes distances où l'énergie du terme
d'échange A a décru exponentiellement et a atteint de très petites valeurs. Le nouvel effet auquel
nous pensons est l'attraction électrostatique exercée par le proton sur l'atome d'hydrogène, de même
que tout objet chargé attire un objet neutre. Le proton nu crée un champ électrique E (variant en
1 / R 2 ) qui s'exerce sur l'atome d'hydrogène. L'atome devient polarisé et acquiert un moment
dipolaire induit proportionnel à E . L'énergie du dipôle est µ E , qui est proportionnelle à E 2 , ou à
1 / R 4 . Il y a donc un terme dans l'énergie du système qui décroît comme la quatrième puissance de
la distance (c'est une correction à E 0 ). L'énergie tombe avec la distance plus doucement que le
déplacement A donné par (17). Pour une distance suffisament grande R, elle devient le seul terme
qui soit encore important pour donner une variation d'énergie avec R, et c'est par conséquent la
seule force qui subsiste. Notez que le terme électrostatique a le même signe pour les deux états de
base (la force est attractive et l'énergie est donc négative). De même pour les deux états
stationnaires. Par contre le terme d'échange A a des signes opposés pour les deux états
stationnaires.
La molécule d'hydrogène
Le système à deux états que nous allons examiner maintenant est la molécule d'hydrogène neutre
H 2 . Elle est évidemment plus compliquée à comprendre puisqu'elle a deux électrons. De nouveau,
nous commençons en nous demandant ce qui se passe si les deux protons sont biens séparés. Mais
maintenant nous avons deux électrons à ajouter. Pour ne pas les confondre, nous appellerons un des
électrons "l'électron a" et l'autre "l'électron b". Nous pouvons encore imaginer deux états possibles.
Une des possibilités est que "l'électron a" soit près du premier proton et que "l'électron b" soit près
du second comme sur la figure ci-dessous.

Nous avons tout simplement deux atomes d'hydrogène. Nous appellerons cet état, l'état 1 . Il y a
encore une autre possibilité : que "l'électron b" soit près du premier proton et que "l'électron a" soit
près du second. Nous appelons cet état 2 . A cause de la symétrie de la situation, ces deux
possibilités doivent être équivalentes du point de vue de l'énergie, mais, comme nous le verrons,
l'énergie du système n'est pas simplement la somme des énergies des deux atomes d'hydrogène.
Nous devons aussi dire qu'il y a de nombreuses autres possibilités. Par exemple, "l'électron a"
pourrait être près du premier proton et "l'électron b" pourrait être dans un autre état autour du même
proton. Nous oublierons un tel cas, car il conduirait certainement à une énergie plus élevée due à la
forte répulsion coulombienne entre les deux électrons. Pour un traitement plus précis, il faudrait
inclure ces états, mais nous pouvons obtenir l'essentiel de la liaison moléculaire en considérant
seulement les deux états de la figure ci-dessus. A ce niveau d'approximation, nous pouvons décrire
tout état en donnant l'amplitude 1 φ pour être dans l'état 1 et l'amplitude 2 φ pour être dans
l'état 2 . En d'autres termes, le vecteur d'état φ peut être écrit comme une combinaison linéaire
(18) φ = ∑ i i φ
i

Pour continuer, nous supposons, comme d'habitude, qu'il y a une certaine amplitude A pour que les
électrons se déplacent dans l'espace entre les protons et pour qu'ils échangent leurs positions. Cette
possibilité d'échange signifie que l'énergie du système à deux valeurs possibles séparées, comme
nous l'avons vu pour les autres systèmes à deux états. De même que pour l'ion d'hydrogène
moléculaire, la séparation est très petite lorsque la distance entre les protons est grande. Lorsque les
protons se rapprochent l'un de l'autre, l'amplitude pour que les électrons aillent d'avant en arrière
augmente et la séparation augmente aussi. L'abaissement de l'état d'énergie inférieure signifie qu'il
y a une force attractive qui tire les atomes l'un vers l'autre. De nouveau, les niveaux d'énergie
s'élèvent lorsque les protons sont très proches l'un de l'autre, à cause de la répulsion coulombienne.
Le résultat final brut est que les deux états stationnaires ont des énergies qui varient avec la
distance comme le montre la figure ci-dessous.
Pour une distance d'environ 0.74 angström, le niveau d'énergie inférieur passe par un minimum.
C'est la distance proton - proton de la vraie molécule d'hydrogène.

Vous avez probablement trouvé une objection. Qu'avons-nous fait pour tenir compte de ce que les
deux électrons sont des particules identiques ? Nous les avons appelés "électron a" et "électron b"
mais il n'y a en réalité aucune façon de dire lequel est a et lequel est b. Or nous savons que pour
deux électrons, qui sont des particules de Fermi, si l'on obtient deux façons pour que quelque chose
se passe en échangeant les électrons, alors les deux amplitudes interfèrent avec un signe négatif.
Ceci signifie que si nous échangeons les électrons, le signe de l'amplitude doit changer aussi. Nous
venons juste de conclure cependant, que l'état lié de la molécule d'hydrogène devait être (à t = 0)
(19) II =
1
(1 + 2 )
2

Cependant, cet état n'est pas permis. Les fonctions d'onde avec deux électrons doivent être
antisymétriques. Si nous échangeons les noms des électrons, nous obtenons le résultat
(20)
1
(2 + 1 )
2
et nous avons le même signe au lieu du signe opposé.

Ces arguments ne sont corrects que si les deux électrons ont le même spin. Il est exact que si les
électrons ont tous les deux leur spin en haut (ou en bas), le seul état autorisé est
(21) I =
1
(1 − 2 )
2

Avec cet état, l'échange des électrons donne


(22) ( 2 − 1 )
ce qui est − I comme il se doit. Donc, si nous approchons l'un de l'autre deux atomes d'hydrogène
ayant les directions des spins des électrons parallèles, ils peuvent passer dans l'état I , mais non
dans l'état II . Mais remarquez que cet état I est l'état d'énergie supérieur. Sa courbe d'énergie
en fonction de la distance n'a pas de minimum. Les deux atomes d'hydrogène se repousseront
toujours et ne formeront pas de molécule. Nous concluons donc que la molécule d'hydrogène ne
peut pas exister avec ses électrons ayant leurs spins parallèles. Et ceci est exact.

Par ailleurs, notre état II est parfaitement symétrique pour les deux électrons. En fait, si nous
échangeons l'électron que nous appelons a avec celui que nous appelons b, nous obtenons encore
exactement le même état. Si deux particules de Fermi sont dans le même état, elles doivent avoir
des spins opposés. La molécule d'hydrogène liée doit donc avoir un électron avec son spin en haut
et l'autre avec son spin en bas.

Toute cette histoire de molécule d'hydrogène devient vraiment quelque peu compliquée si nous
voulons inclure les spins des protons. Il n'est plus possible, alors, de considérer la molécule comme
un système à deux états. Il faudrait vraiment la considérer comme un système à huit états. Il y a
quatre arrangements de spins possibles pour chacun de nos états 1 et 2 , si bien que nous étions
vraiment en train de simplifier un peu trop en négligeant les spins. Nos conclusions finales sont
cependant correctes.

Nous avons trouvé que l'état d'énergie la plus basse, le seul état lié, de la molécule H 2 a les deux
électrons avec des spins opposés. Le moment angulaire total dû au spin des électrons est nul. Par
ailleurs, deux atomes d'hydrogène voisins avec leurs spins parallèles, et donc avec un moment
angulaire total h , doivent être dans un état d'énergie plus élevé (non lié), les deux atomes se
repoussent. Il y a une corrélation intéressant entre les spins et les énergies qui constituent une autre
illustration de quelque chose que nous avons déjà mentionné : il semble y a voir une énergie
"d'interaction" entre les deux spins puisque l'énergie est plus élevée dans le cas où les spins sont
parallèles que lorsqu'ils sont opposés. Vous pourriez dire, en un certain sens, que les spins essayent
de se mettre antiparallèles et, en faisant ainsi, ils ont la possibilité de libérer de l'énergie, non pas à
cause de l'énergie magnétique, mais à cause du principe d'exclusion.

Nous avons vu plus haut que la liaison de deux ions différents au moyen d'un seul électron est
probablement faible. Ceci n'est pas vrai pour la liaison par deux électrons. Supposez que les deux
protons soient remplacés par deux ions quelconques (ayant des couches électroniques complètes et
une seule charge ionique) et que les énergies de liaison de chaque électron soient différentes. Les
énergies des états 1 et 2 seraient encore égales puisque dans chacun de ces états nous avons un
électron lié avec chaque ion. Nous avons donc la séparation habituelle proportionnelle à A. La
liaison à deux électrons est des plus répandues. C'est la plus commune des liaisons de valence. Les
liaisons chimiques mettent habituellement en jeu ce basculement des électrons entre deux atomes.
Quoique deux atomes puissent être liés par un seul électron, c'est relativement rare, car il faut que
certaines conditions soient exactement remplies.
Finalement, il nous faut ajouter que si l'énergie due à l'attraction d'un électron par l'un des noyaux
est beaucoup plus grande que celle due à l'autre, ce que nous avons dit sur la possibilité d'ignorer
les autres états possibles n'est plus vrai. Supposez que le noyau a (ou l'ion positif) attire l'électron
beaucoup plus fortement que le noyau b. Il peut alors arriver que l'énergie totale soit encore très
basse, même lorsque les électrons sont tous les deux près du noyau a, aucun n'étant près de b. La
forte attraction par l'un des ions peut faire plus que compenser la répulsion mutuelle des deux
électrons. Si elle la compense, on peut avoir une grande amplitude pour trouver les deux électrons
en a (qui est alors un ion négatif) et une petite amplitude pour trouver un électron en b, et ceci pour
l'état d'énergie la plus basse. Cet état ressemble à un ion négatif près d'un ion positif. C'est en fait ce
qui se passe pour une molécule "ionique" comme le chlorure de sodium NaCl (le sel de cuisine).
Vous pouvez voir que tous les intermédiaires entre la liaison covalente et la liaison ionique sont
possibles.

Vous pouvez commencer à voir maintenant comment on peut comprendre beaucoup de


phénomènes chimiques à l'aide de la description quantique.

La molécule de benzène
Les chimistes ont inventé de jolis diagrammes pour représenter les molécules organiques
compliquées. Nous allons discuter maintenant l'une des plus intéressantes d'entre elles, la molécule
de benzène, qui est représentée ci-dessous. Nous l'avions déjà rencontrée dans l'étude des particules
indépendantes.
Elle contient six atomes de carbones et six atomes d'hydrogène disposés de façon symétrique.
Chaque trait du diagramme représente une paire d'électrons, de spins opposés, en train de danser la
danse de la liaison covalente. Chaque atome d'hydrogène apporte un électron et chaque atome de
carbone apport quatre électrons, ce qui fait un total de trente électrons (il y a deux électrons de plus
près du noyau de carbone qui forment la première couche ou couche K. Ils ne sont pas représentés
car ils sont si fortement liés qu'ils ne contribuent pas sensiblement à la liaison covalente). Chaque
trait de la figure représente donc une liaison ou paire d'électrons et les doubles liaisons signifient
qu'il y a deux paires d'électrons reliant un paire d'atomes de carbone sur deux.

Il y a un mystère concernant cette molécule de benzène. Nous pouvons calculer l'énergie qu'il
faudrait, en principe, pour former ce composé chimique, car les chimistes ont mesuré les énergies
des différents composés qui mettent en jeu différents morceaux de l'anneau. Par exemple, ils
connaissent l'énergie d'un des doubles liaisons en étudiant l'éthylène, et ainsi de suite. Nous
pouvons donc calculer l'énergie totale que nous attendons pour la molécule de benzène. L'énergie
réelle de l'anneau est portant beaucoup plus basse que ce que nous obtenons par un tel calcul.
L'anneau est beaucoup plus fortement lié que ce qu'on attendrait d'un "système à double liaison non
saturée". D'habitude, un système à double liaison qui ne forme pas un tel anneau est facilement
attaqué chimiquement du fait de son énergie relativement haute. Les doubles liaisons peuvent être
facilement cassées par addition d'autres hydrogènes. Mais l'anneau du benzène est très durable et il
est difficile à casser. En d'autres termes, le benzène a une énergie beaucoup plus basse que ce que
vous calculeriez d'après ses liaisons.

Il y a encore un autre mystère. Supposons que nous remplacions deux atomes d'hydrogène
adjacents par des atomes de brome pour former de l'ortho-dibromobenzène. On peut faire cela de
deux façons, comme le montre la figure ci-dessous.

Les bromes peuvent être, soit aux extrémités d'une double liaison comme dans la partie (a) de la
figure, soit aux extrémités d'une simple liaison comme en (b). On penserait donc que l'ortho-
dibromobenzène doit avoir deux différents formes, mais non. Il n'y a qu'un seul composé.

Nous simplifions un peu trop. Initialement, les chimistes pensaient qu'il devrait y avoir quatre
formes de dibromobenzène : deux formes avec les bromes sur des atomes de carbone adjacents
(ortho-dibromobenzène), une troisième forme avec les bromes sur les carbones non adjacents les
plus proches (méta-dibromobenzène) et une quatrième forme avec les bromes opposés l'un à l'autre
(para-dibromobenzène). Ils n'ont cependant trouvé que trois formes. Il n'y a qu'une forme pour la
molécule ortho.
Nous voudrions maintenant résoudre ces mystères et peut-être avez-vous déjà deviné comment : en
remarquant, bien entendu, que "l'état fondamental" de l'anneau de benzène est en fait un système à
deux états. Nous pouvons imaginer que les liaisons du benzène peuvent être disposées selon l'un ou
l'autre des arrangements de la figure ci-dessous.

Vous allez dire, "mais ils sont identiques, ils doivent avoir la même énergie". Evidemment. Et c'est
pour cette raison qu'on doit les analyser comme un système à deux états. Chaque état représente un
configuration différente de l'ensemble des électrons et il y a un certaine amplitude A pour que tout
le paquet passe d'un arrangement à l'autre. Il y a une certaine chance pour que les électrons puissent
passer d'un façon de danser à l'autre.

Comme nous l'avons vu, cette probabilité de basculement fait qu'une superposition des deux états a
une énergie plus basse que celle que vous calculeriez en regardant séparément l'une ou l'autre des
énergies des états de la figure ci-dessus. Si bien qu'en fait, l'état normal réel (de plus basse énergie)
du benzène n'est aucune des possibilités de la figure précédente, mais il a une amplitude 1 / 2
pour être dans chacun des états indiqués. C'est le seul état qui intervient dans la chimie du benzène
aux températures normales. Incidemment, l'état supérieur existe aussi. Nous pouvons l'affirmer
parce que le benzène absorbe facilement la lumière ultraviolette de fréquence ω = (E I − E II ) / h . La
différence d'énergie est de l'ordre de 1.5 eV, énergie d'un photon ultraviolet.
Ce que nous venons de dire prête un peu à confusion. L'absorption de lumière ultraviolette serait
très faible pour le système à deux états que nous avons pris pour le benzène, car l'élément de
matrice du moment dipolaire entre les deux états est nul (les deux états sont électriquement
symétriques si bien que le moment dipolaire est nul). S'il n'y avait que ces deux états, l'existence du
niveau supérieur aurait dû être démontrée d'une autre façon. Une théorie plus complète du benzène,
commençant avec un plus grand nombre d'états de base (tels que ceux ayant des doubles liaisons
adjacentes) montre cependant que les vrais états stationnaires du benzène sont légèrement distordus
par rapport à ceux que nous avons trouvés. Le moment dipolaire résultant autorise la transition
mentionnée, par absorption de lumière ultraviolette.

Que se passe-t-il si nous substituons des bromes ? De nouveau, les deux "possibilités" représentent
deux configurations électroniques différentes. La seule différence est que les deux états de base ont
des énergies légèrement différentes. L'état stationnaire de plus basse énergie sera encore une
combinaison linéaire des deux états mais avec des amplitudes inégales. L'amplitude pour l'état 1
pourrait avoir une valeur comme 2 / 3 par exemple, alors que pour l'état 2 elle serait 1 / 3 .
Nous ne pouvons pas l'affirmer sans information supplémentaire, mais dès que les deux énergies
H 11 et H 22 ne sont plus égales, les deux amplitudes C1 et C 2 n'ont plus des modules égaux. Cela
signifie, bien entendu, qu'une des possibilités indiquées sur la figure est plus probable que l'autre,
mais les électrons sont suffisament mobiles pour qu'il y ait une amplitude pour chacune des deux.
L'autre état a des amplitudes différentes (par exemple 1 / 3 et − 2 / 3 ) mais il a une énergie
supérieure. Il n'y a qu'un état pour l'énergie la plus basse et non deux comme la théorie naïve avec
des liaisons chimiques fixes le suggérait.

Les colorants
Nous allons vous donner encore un exemple chimique de phénomène à deux états, cette fois-ci pour
des molécules de plus grande taille. Il s'agit de la théorie des colorants. Beaucoup de colorants, en
fait, la plus part des colorants artificiels, ont une caractéristique intéressante. Ils ont une sorte de
symétrie. La figure ci-dessous représente un ion d'un colorant particulier appelé le magenta, qui a
une couleur rouge pourpre.
Sa molécule a trois structures en anneaux dont deux sont des anneaux de benzène. Le troisième
n'est pas exactement comme un anneau de benzène car elle n'a que deux doubles liaisons. La figure
montre deux dispositions également satisfaisantes et nous pouvons deviner qu'elles doivent avoir
des énergies égales. Mais il y a une certaine amplitude pour que tous les électrons basculent d'un
arrangement à l'autre, ce qui revient à déplacer la double liaison manquante d'une extrémité à
l'autre. Comme l'amplitude de basculement met en jeu un très grand nombre d'électrons, sa valeur
est quelque peu plus basse que dans le cas du benzène et la différence en énergie entre les deux
états stationnaires est plus petite. On a néanmoins encore les deux états stationnaires habituels I
et II qui sont la somme et la différence des deux états de base indiqués sur la figure. La
séparation en énergie entre I et II se trouve être égal à l'énergie d'un photon dans la région
optique. Si l'on envoie de la lumière sur la molécule, elle absorbe très fortement un fréquence et
elle apparaît brillamment colorée. C'est pourquoi c'est un colorant !

Une autre caractéristique intéressante d'une telle molécule de colorant est que, dans les deux états
de base indiqués, le centre de gravité de la charge électrique se situe à des positions différentes.
D'où il résulte que la molécule devrait être fortement affectée par un champ électrique. On peut
analyser toutes ces propriétés à condition de connaître les nombres E 0 et A. On les obtient
généralement à partir de l'expérience. Si on fait des mesures avec beaucoup de colorants, il est
souvent possible de deviner ce qui va se passer avec une molécule de colorant légèrement
différente. Du fait du grand déplacement de la position du centre de charge électrique, la substance
a un grande probabilité d'absorber de la lumière ayant la fréquence caractéristique 2A / h . Par
conséquent ces substances sont non seulement colorées, mais elles le sont très fortement, une petite
quantité de matière peut absorber beaucoup de lumière.
Le taux de basculement, et par conséquent A, est très sensible à la structure complète de la
molécule. En changeant A, on change la séparation en énergie et avec elle la couleur du colorant.
Egalement, les molécules n'ont pas besoin d'être parfaitement symétriques. Nous avons vu que le
même phénomène fondamental subsiste avec de légères modifications, même s'il y a quelques
petits asymétries. On peut modifier les couleurs en introduisant de légères asymétries dans les
molécules. Ainsi, un autre colorant important, le vert malachite, est très semblable au magenta,
mais deux des hydrogènes sont remplacés par CH 3 . La couleur est différente parce que A est
modifié et que le taux de basculement est différent.

Classification des niveaux d'énergie


Revenons aux molécules diatomiques en essayant d'être un peu plus précis.

La propriété de simplification qui est à la base de toutes les approximations moléculaires est le
grand rapport de la masse du noyau à la masse de l'électron. Comme nous le verrons, cela implique
que l'énergie associée au mouvement du noyau est beaucoup plus petite que celle associée au
mouvement des électrons autour du noyau. Puisque la période du mouvement est de l'ordre de h
divisé par son énergie, les périodes nucléaires sont beaucoup plus longues que les périodes
électroniques. C'est alors une bonne approximation de voir le noyau comme fixe dans le calcul du
mouvement électronique. De plus, le mouvement nucléaire put être calculé sous l'hypothèse que les
électrons ont un mouvement stationnaire pour chaque arrangement instantané du noyau
(approximation adiabatique).

On s'attend à ce que les noyaux aient un arrangement d'équilibre stable quelque part entre une
structure complètement effondrée (qui est instable car les noyaux sont positivement chargés et se
repoussent à courte distance) et une structure complètement dispersée (qui n'est pas la plus stable si
la molécule existe). Les mouvements nucléaires peuvent être classés en translations et rotations de
l'arrangement en équilibre quasi rigide et des vibrations des noyaux autour de cet équilibre. Comme
avec les atomes, le mouvement de translation est le même que celui d'un particule libre et ne
conduit pas à des propriétés non classiques.
Nous arrivons donc à une classification des niveaux d'énergie moléculaires en types électroniques,
de vibrations et de rotations et nous allons estimer leurs ordres de grandeurs relatifs. Supposons
que la molécule a des dimensions linéaires de l'ordre de a. Alors, l'énergie E e associée au
mouvement d'un électron de valence (un qui occupe grossièrement la totalité du volume
moléculaire, plutôt qu'un qui serait lié dans un couche interne proche du noyau) est de l'ordre de
h 2 / ma 2 , où m est la masse d'un électron. On peut le déduire en notant que l'incertitude sur
l'impulsion de l'électron est au moins de l'ordre de h / a , et le minimum de son énergie cinétique est
donc h 2 / ma 2 . Nous obtenons donc
h2
(23) E e ~
ma 2

Pour des valeurs de a de l'ordre de quelques angströms, cela correspond à des fréquences de
transition dans les régions visibles et ultraviolettes du spectre.

Pour estimer l'énergie de vibration, nous pouvons regarder chaque mode normal comme un
oscillateur harmonique auquel est associé une masse M et une constante de raideur K 0 . M sera de
l'ordre d'une masse nucléaire typique. K 0 peut être estimé en notant qu'un déplacement le long d'un
mode normal de l'ordre d'une taille moléculaire a doit produire un changement dans l'énergie de
l'ordre de l'énergie électronique E e puisqu'un déplacement aussi grand produirait un déformation
substantielle de la fonction d'onde électronique. Nous posons donc K 0 ~ E e / a 2 . Alors l'énergie E v
associée à un mode de vibration relativement bas est donné par (voir la théorie de l'oscillateur
harmonique)
1/ 2 1/ 2
K  h2 m
(24) E v ~ h 0  ~ ~   Eé
M  (mM ) a  M 
1/ 2 2

où nous avons utilisé (23). E v est grossièrement un centaine de fois plus petit que E e et correspond
à des transitions dans le proche infrarouge.
L'énergie de rotation E r peut être estimée à partir du moment d'inertie de la molécule qui est de
l'ordre de Ma 2 . Comme on s'y attendrait, le moment angulaire d'un mode de rotation relativement
bas s'avère être de l'ordre de h , donc
h2 m
(25) E r ~ 2
~ Ee
Ma M
C'est environ une certaine de fois plus petit que E v et correspond à des transitions dans l'infrarouge
lointain.

On peut s'attendre en voyant les relations (24) et (25) à ce que les niveaux d'énergie électroniques,
de vibrations et de rotations puissent être obtenus comme des ordres de plus en plus grands d'une
approximation basée d'une certaine manière sur le rapport m / M (qui est habituellement de l'ordre
de 10 −3 à 10 −4 ). Born et Oppenheimer ont effectivement montré que c'était bien le cas. Ils ont
utilisé comme paramètre de développement le rapport d'un déplacement de vibration nucléaire
typique à la distance entre noyaux (qui est de l'ordre de a). Un oscillateur d'énergie E v et de
constante de raideur K 0 a un déplacement de l'ordre de
1/ 2 1/ 2
E  E 
(26)  v  ~ a v 
 K0   Ee 
ainsi son paramètre d'extension est
1/ 2 1/ 4
E  m
(27)  v  ~ 
 Ee  M 

En ces termes, l'énergie électronique est d'ordre zéro, l'énergie de vibration du second ordre et
l'énergie de rotation du quatrième ordre. Les énergies au premier et troisième ordre s'annulent.

Equation de Schrödinger
L'équation de Schrödinger indépendante du temps pour une molécule est facile à écrire :
 h2 n 2 N h2 
(28)  − ∑
 2m i =1
∇i − ∑
j =1 2 M j
∇ 2j + V ψ = Eψ

 
Il y a n électrons et N noyaux et V est la somme des interactions électrostatiques entre toutes les
paires d'électrons et noyaux. Il est clair que les termes d'énergie cinétique nucléaire sont du
quatrième ordre en le paramètre de développement (27). S'ils sont négligés, la fonction d'onde ψ
implique les coordonnées nucléaires R j seulement de manière paramétrique et (28) est une
équation en les ri pour le mouvement des électrons par rapport aux noyaux fixés dans l'espace.
Dans ce cas, ψ est approximativement u R j (ri ) et correspond à la valeur propre U (R j ) . Le
mouvement nucléaire peut être trouvé en regardant U (R j ) comme une fonction potentiel et en
l'utilisant pour obtenir une fonction d'onde nucléaire w(R j ) .

Nous écrivons donc ψ sous la forme


(29) ψ (ri , R j ) = u R j (ri )w(R j )
où u satisfait l'équation
 h2 n 2 
(30)  − ∑ ∇ i + V u R j (ri ) = U (R j )u R j (ri )
 2m i =1 

Pour chaque arrangement des noyaux, U (R j ) est obtenu comme une valeur propre de (30). Il y
aura, en général, plusieurs solutions qui correspondent à différents états électroniques de la
molécule. On doit faire attention à s'assurer que u et U changent de manière continue avec R j ,
particulièrement si le système est dégénéré. La substitution de (29) dans (28) donne, avec l'aide de
(30),
 N h2 
(31) − ∑ ∇ 2j + U (R j )ψ = Eψ
 j =1 2 M j 
qui peut être récrit
 N h2 
u R j (ri )− ∑ ∇ 2j + U (R j ) − E  w(R j )
(32)  j =1 2 M j 

=∑
N
h2
j =1 2 M j
[ ]
w(R j )∇ 2j u R j (ri ) + 2∇ j w(R j ) ⋅ ∇ j u R j (ri )

Si maintenant la dépendance de u avec R j est négligée, le coté droit de (32) s'élimine et une
équation approchée pour le mouvement nucléaire est obtenue :
 N h2 
(33) − ∑ ∇ 2j + U (R j ) w(R j ) = Ew(R j )
 j =1 2 M j 

La négligence des termes ∇ j u vient physiquement de la faiblesse des amplitudes du mouvement


nucléaire par rapport à la distance internucléaire d'équilibre (faiblesse du paramètre de
développement (27)). Cela implique que la partie électronique u de la fonction d'onde ne change
pas beaucoup lorsque le noyau se déplace. Born et Oppenheimer ont montré formellement que cette
approximation est justifiée aussi longtemps que des modes de vibrations et de rotations trop élevés
ne sont pas excités.

La molécule d'hydrogène
Il est clair de ce qui précède que deux problèmes distincts sont reliés à la structure moléculaire. Le
premier est la solution de (30) pour obtenir les fonctions d'onde électroniques et une fonction
énergie potentielle U (R j ) des coordonnées nucléaires. Le second est la solution de (33) pour le
mouvement nucléaire. Le premier problème peut être résolu seulement dans les cas les plus
simples. Comme exemple, nous allons maintenant considérer dans les grandes lignes une solution
approchée de la molécule d'hydrogène due à Heitler et London. Ensuite, nous discuterons de la
solution de (33) en faisant des hypothèses simples concernant l'énergie potentielle U.

La seule coordonnée nucléaire R j qui apparaît dans (30) dans le cas de la molécule d'hydrogène
est la grandeur R de la distance entre les deux noyaux d'hydrogène. L'hamiltonien est celui que
nous avons vu dans l'étude des forces de van der Waals. Cependant R n'est plus grand comparé à
a 0 = h 2 / me 2 et les approximations utilisées alors ne sont plus utiles. Néanmoins, une fonction
d'onde approché basée sur un simple produit de deux fonctions d'état de base de l'atome
d'hydrogène donne des résultats remarquablement bons. La raison en est que la dégénérescence
d'échange est prise en compte. Les fonctions d'onde dégénérées pour lesquelles l'électron 1 est
autour du noyau A et l'électron 2 autour du noyau B et celles pour lesquelles l'électron 2 est autour
du noyau B et l'électron 2 autour du noyau A sont utilisées ensembles. La nouvelle propriété du
travail de Heitler et London fut de reconnaître qu'une combinaison linéaire appropriée des fonctions
d'onde dégénérées non perturbées donne une énergie significativement plus basse que les fonctions
d'onde séparées. C'est exactement ce que nous avons vu plus haut avec l'approche à deux états.
C'est la base de la théorie actuelle de la liaison homopolaire des molécules. Cette propriété de
dégénérescence est quelque fois appelée résonance. Une situation analogue est celle où une
interaction entre deux oscillateurs classiques qui sont en résonance (même fréquence non
perturbée) conduit à un mode normal qui a une fréquence plus basse (et aussi un qui a une
fréquence plus grande). De manière similaire, une interaction entre deux états résonants (dégénérés)
en mécanique quantique donne un valeur propre de l'énergie plus basse (ainsi qu'une plus grande).
Il peut bien sûr y avoir plus de deux états dégénérés non perturbés et la dégénérescence ne doit pas
nécessairement être de type échange.

Fonction énergie potentielle


L'équation (30) pour la molécule d'hydrogène est
[H − U (R )]u R (r1 , r2 ) = 0
(34)
H =−
2m
(
h2 2
) 1 1
∇1 + ∇ 22 + e 2  + −
1

1

1

1 

 R r12 r1 A r2 B r1B r2 A 

Nous voulons baser notre calcul approché de U (R ) sur les fonctions d'ondes approchées
u1 (r1 , r2 ) = u A (r1 )u B (r2 )
(35)
u 2 (r1 , r2 ) = u A (r2 )u B (r1 )
où u A et u B sont les fonctions d'onde d'état de base de l'atome d'hydrogène pour les noyaux A et B
respectivement. On doit d'abord noter que u1 et u 2 sont fonctions propres d'hamiltoniens non
perturbés différents, et donc la théorie des perturbations dégénérée n'est pas applicable. C'est le
contraire de la situation avec l'atome d'hélium où les deux fonctions d'onde dégénérées sous
l'échange sont solutions du même hamiltonien non perturbé.

Nous pouvons cependant utiliser la méthode des variations, auquel cas il est naturel d'adopter
comme fonction test un combinaison linéaire arbitraire de u1 et u 2
(36) ψ (r1 , r2 ) = u1 (r1 , r2 ) + Au 2 (r1 , r2 )
où A est le paramètre de variation. La substitution de (36) dans les relations de la théorie des
variations donne

U (R ) ≤
( )
1 + A 2 H 11 + 2 AH 12
1 + A 2 + 2 Aγ

(37) γ ≡ ∫∫ u1u 2 d r1 d r2
2 3

H 11 = H 22 ≡ ∫∫ u1 Hu1 d 3 r1 d 3 r2

H 12 = H 21 ≡ ∫∫ u1 Hu 2 d 3 r1 d 3 r2

Ces égalités entre éléments matriciels sont facile à établir quand on se souvient que les u sont réels
et que H est hermitique et symétrique en les deux électrons.

L'élément de matrice γ dépend de R. Pour toute valeur particulière de R, la dérivée du coté droit de
(37) par rapport à A est

(38)
( )
2 1 − A 2 (H 12 − γH 11 )
(
1 + A 2 + 2 Aγ
2
)
qui vaut zéro pour A = ±1 . Puisque le coté droit de (37) est égal à H 11 quand A est − ∞ , 0 et + ∞ ,
un des points A = ±1 doit être un minimum et l'autre un maximum. Les intégrales dans (37)
peuvent être exprimées à l'aide de fonctions tabulées et la valeur moyenne minimale de H est
obtenue avec A = +1 :
ψ = u1 + u 2
(39) H 11 + H 12
U (R ) ≤
1+ γ

La limite supérieure sur U (R ) donnée dans (39) a la forme générale caractéristique de l'énergie
potentielle internucléaire d'une molécule diatomique (voir le potentiel de Morse ci-dessous) et est
en bon accord avec l'expérience. Puisque ψ dans (39) est symétrique dans l'échange des
coordonnées spatiales des deux électrons, elle doit être multipliée par la fonction de spin singulet
antisymétrique.

Tout cela rejoint la méthode plus intuitive étudiée au début avec la représentation à deux états.

Il est intéressant de comparer le caractère de symétrie de l'état de base de la molécule d'hydrogène


et les états excités de l'hélium d'un point de vue physique. A cause du principe d'exclusion, les
électrons doivent être dans différents états spatiaux s'ils ont des spins parallèles et ils tendent donc à
s'éloigner l'un de l'autre. Dans l'état excité 1s2s d l'hélium, par exemple, cela réduit la répulsion
électrostatique et abaisse l'énergie. Donc, les états triplets de l'hélium sont plus bas que l'état
singulet de la même configuration (la situation est différente de l'état de base puisque seul l'état
singulet peut exister pour la configuration 1s 2 ). Dans l'état de base de la molécule d'hydrogène,
d'autre part, l'énergie la plus basse (la plus fortement liée) est obtenue quand les électrons tendent à
se concentrer entre les deux noyaux car alors la répulsion entre les électrons est plus que
compensée par l'attraction par les deux noyaux pour chaque électron. Cela se produit quand les
électrons peuvent occuper le même état spatial et donc quand ils ont des spins antiparallèles. Donc,
c'est l'état singulet qui conduit à une molécule stable.

Le potentiel de Morse
Nous passons maintenant aux molécules diatomiques en général et nous considérons la nature des
solutions de (33) pour le mouvement nucléaire. Si les noyaux ont des masses M 1 et M 2 et leur
vecteur position relative R a les coordonnées relatives R, θ , φ , l'équation pour le mouvement
relatif devient
 h2 2 
(40) − ∇ + U (R ) w(R,θ , φ ) = Ew(R,θ , φ )
 2M 
où M = M 1 M 2 / (M 1 + M 2 ) est la masse réduite.

On a trouvé par l'expérience que la fonction énergie potentielle pour les états électroniques les plus
bas des molécules diatomiques peut être représenté assez précisément par une fonction analytique
simple qui contient trois paramètres ajustables.
(
(41) U (R ) = U 0 e
− 2 (R − R0 ) / a
)
− 2e
− (R − R0 ) / a

L'équation représente le potentiel de Morse et sa courbe, proche des courbes tracées plus haut dans
l'étude des systèmes à deux états, est tracée dans la figure ci-dessous.
U approche de zéro exponentiellement pour R grand., il a la valeur minimale − U 0 en R = R0 et
devient grand et positif lorsque R tend vers zéro si la "largeur" a de la région attractive est plus
petite que la distance d'équilibre R0 .

La figure ci-dessus a l'apparence générale que l'on attend pour une molécule diatomique. Le zéro de
l'énergie est arbitrairement choisi pour avoir zéro lorsque les atomes neutres sont très éloignés.
Alors U devient négatif au début à cause de l'attraction de van der Waals. Une des imprécisions du
potentiel de Morse est le remplacement du terme en 1 / R 6 par une exponentielle. Cependant, le
comportement de U pour R grand a peu d'influence sur les niveaux d'énergie. Pour R plus petit, ce
comportement est remplacé par l'attraction résonante beaucoup plus forte de Heitler-London.
Lorsque R continue à décroître, le rapprochement des noyaux (ou des cœurs ioniques) conduit à
une répulsion qui provoque l'augmentation de U qui devient grand et positif. Contrairement à la
vraie interaction électrostatique, le potentiel de Morse est fini en R = 0.

Rotation et vibration des molécules diatomiques


L'équation (40) peut être séparée en coordonnées sphériques pour donner
χ (R )
(42) w(R,θ , φ ) = YKM K (θ , φ )
R

K et M K sont les nombres quantiques de moment angulaire qui sont analogues à l et m,


respectivement, pour une seule particule dans un champ central. L'équation radiale est
h2 d 2χ
− + W (R )χ = Eχ
2 M dR 2
(43)
h 2 K (K + 1)
W (R ) = U (R ) + K = 0,1,2, K
2 MR 2

L'équation (43) est l'équation pour le mouvement à une dimension d'une particule de masse M dans
un potentiel W(R) avec la condition aux limites que χ s'annule en R = 0. Si K n'est pas trop large,
la forme générale de W(R) ressemble à celle de U montré dans la figure ci-dessus. Dans ce cas,
nous sommes principalement intéressés par les vibrations de petites amplitudes autour du
minimum. Nous pouvons alors développer W autour de son minimum en R1 qui est identique à R0
seulement si K = 0, pour avoir
(44) W (R ) = W0 + 12 K 0 (R − R1 ) + b(R − R1 ) + c(R − R1 )
2 3 4

où les termes d'ordre plus élevés sont négligés. Si les termes b et c sont aussi négligés et que le
domaine de R est étendu à − ∞ , les valeurs propres de (43) sont celles d'un oscillateur harmonique
avec un terme additif W0 . C'est une bonne approximation pour des valeurs modérées du nombre
quantique de rotation K et du nombre quantique de vibration v. Une approximation un peu
meilleure peut être obtenue en voyant les termes b et c dans (43) comme des perturbations d'un
oscillateur. Puisque le terme b produit seulement un effet du second ordre, tandis que le terme c
apparaît au premier ordre (sa valeur moyenne peut être calculée par des méthodes matricielles), les
deux donnent des contributions à E du même ordre de grandeur.

Niveaux d'énergie
Les valeurs propres de (42) à l'ordre le plus bas en b et c sont alors
1  h 2 b 2 15  7
1/ 2 2
 K0   1
E = W0 + h   v +  −   v +  + 
M   2  MK 02  4  2  16 
(45)
3h 2 c  1
2
1
+  v +  +  v = 0,1,2, K
2 MK 0  2 4 

W0 , K 0 , b et c peuvent tous être développés en puissances de K (K + 1) , où les coefficients


dépendent des paramètres de la fonction U(R). Si U a la forme (41), les expressions suivantes
peuvent être obtenues :
h 2 K (K + 1)a 2
R1 = R0 +
2 MR03U 0
h 2 K (K + 1) h 4 K 2 (K + 1) a 2
2
W0 = −U 0 + −
2 MR02 4 M 2 R06U 0
2U 0 3h 2 K (K + 1) a  a 
(46) K 0 = − 1 − 
a2 MR02 a 2 R0  R0 
U0
b=−
a3
7U 0
c=
12a 4

Seuls les termes suffisant pour donner E correctement au second ordre en v + 1


2 et K (K + 1) ont été
donnés.
La première des équations (46) montre que la molécule s'étire sous la rotation. La deuxième
équation est l'énergie d'équilibre − U 0 plus l'énergie de rotation au second ordre. L'énergie de
rotation au premier ordre est h 2 K (K + 1) / 2 I 0 , où I 0 = MR02 est le moment d'inertie de la molécule
autour d'un axe perpendiculaire à la ligne joignant les noyaux. Cette énergie est la même que pour
un rotateur rigide. La troisième équation inclut le changement de la raideur à cause de l'étirement.
Les corrections à l'étirement en les termes anharmoniques b et c peuvent être négligés à cet ordre.
Le second terme sur le coté droit de (45) peut être développé avec l'aide de l'expression de K 0 pour
donner
1   3h 2 K (K + 1) a  a 
1/ 2
 2U 0  
(47) h   v +  1 − 1 − 
2
 Ma   2  4 MR0 U 0 R0  R0 
2

Les deux derniers termes de (45) donnent l'énergie de vibration au second ordre
2 2
 15 7  h 
2
1 h2  1
(48)  − +  2  v +  = − 2 
v+ 
 16 16  Ma  2 2 Ma  2
puisque les facteurs constants s'annulent.

Il est visible que les niveaux d'énergie de rotation et de vibration sont en accord avec les ordres de
grandeur qui ont été estimé plus haut. Lorsque v ou K s'accroissent, l'espace entre les niveaux
devient plus petit que celui prédit par le simple rotateur rigide et l'oscillateur harmonique.

Effet de l'identité nucléaire


Dans le cas où les deux noyaux de la molécule diatomique sont identiques, la fonction d'onde doit
être symétrique par rapport à l'échange de leurs coordonnées spatiales et de spin si les noyaux ont
un spin zéro ou entier, ou antisymétrique s'ils ont un spin demi entier. La parité de la fonction
d'onde nucléaire est déterminée par la fonction angulaire YKM K (θ , φ ) et est paire ou impaire selon
que K est pair ou impair. Un échange des coordonnées spatiales des deux noyaux est équivalent au
changement de signe de leur vecteur position relative R, ainsi la parité détermine la symétrie
spatiale de la fonction d'onde. Nous voyons donc que pour les noyaux de spin zéro ou entier, la
fonction de spin doit être symétrique pour K pair et antisymétrique pour K impair. Pour les noyaux
de spin demi entier, la fonction de spin doit être antisymétrique pour K pair et symétrique pour K
impair.

Pour deux noyaux de spin Ih , le total des (2 I + 1) états de spin peut être divisé en (I + 1)(2 I + 1)
2

états symétriques et I (2 I + 1) états antisymétriques. Donc, dans un gaz qui est à l'équilibre
statistique, le rapport du nombre de molécules avec K pair au nombre de molécules avec K impair
sera (I + 1) / I si I est zéro ou un entier et I / (I + 1) si I est un demi entier. Ce rapport est, bien
entendu, modifié par le facteur de Boltzmann si l'espacement entre les niveaux de rotation n'est pas
petit par rapport ) l'énergie thermique kT . Cet effet conduit à des séries d'intensité alternée dans la
bande du spectre de rotation des molécules diatomiques homonucléaires. Le spin et les propriétés
statistiques des noyaux peuvent être déterminés de cette manière et les résultats sont en accord avec
le traitement général du spin d'un noyau.

Nous avons rejoint ici l'étude statistique des gaz que nous avions étudiée.

Tous ces résultats valident les expressions que nous avions utilisées dans l'étude d'un gaz
diatomique.

Les liaisons chimiques


Nous pouvons maintenant résumer ou compléter ce que l'on peut déduire de tout cela sur les
liaisons chimiques. L'analyse ici entre dans un cours de chimie et nous n'en donnerons qu'un bref
aperçu qualitatif.

Nous avons vu que dans les liaisons diatomiques, lorsque les deux atomes sont différents, la liaison
n'est pas parfaitement symétrique et les électrons mis en commun se répartissent de manière
asymétrique autour des deux noyaux. Cela conduit à une polarisation qui donne à un atome une
charge négative et à l'autre une charge positive. Cette propension pour les atomes à s'accaparer plus
ou moins les électrons est qualifiée d'électronégativité par les chimistes. Un atome ayant une
électronégativité positive attire les électrons et ceux ayant une électronégativité négative repoussent
les électrons. La valeur est d'autant plus grande que l'effet est important.
Liaison ionique
Lorsque l'écart des électronégativités est très grand, le gain d'énergie est tel qu'il est très avantageux
pour le premier atome de perdre carrément son électron et de le donner à l'autre. Ainsi chaque
atome devient un ion.

L'atome ayant perdu un électron devient chargé positivement tandis que celui qui l'a gagné, avec un
électron surnuméraire, devient chargé négativement. Les deux ions vont alors s'attirer par simple
"force électrostatique", car les charges électriques opposées s'attirent.

C'est le cas de la réaction entre le sodium et le chlore.

Le composé ainsi formé s'écrit NaCl et est simplement le sel de cuisine que nous avons tous chez
nous. Son nom scientifique (c'est-à-dire suivant une nomenclature précise établie par les chimistes)
est chlorure de sodium.

Notons que le sel est très facilement soluble dans l'eau. Ce qui se passe c'est que l'eau modifie les
propriétés électriques. Plus exactement, la permitivité électrique de l'eau est fort élevée. La force
d'attraction entre les deux ions devient beaucoup plus faible et la simple agitation thermique, les
chocs des molécules d'eau, va suffire à les séparer. Ils vont se balader librement dans la solution.
On note symboliquement une liaison chimique par un trait entre les atomes.
Na - Cl

Liaison covalente
Dans la liaison covalente, les deux atomes mettent en commun l'électron. La différence
d'électronégativité est moins importante et le gain obtenu par ionisation est assez faible. Les deux
atomes ont plus à gagner en partageant l'électron.

En fait, il y a mise en commun d'une paire d'électrons, comme nous l'avons vu, mais tout comme
dans le cas de la liaison ionique ou un des électrons est accaparé par l'autre atome, cela revient au
même de parler de l'échange d'un électron dit de valence. C'est un abus de langage fréquemment
rencontré.
Un exemple est l'hydrogène. Son énergie d'ionisation est assez élevée (énergie de la couche 1s) et il
gagnerait à capturer un électron. Il peut donc convoiter l'électron d'un autre atome d'hydrogène.
Mais, bien entendu, enlever cet électron coûterait de l'énergie et le gain serait nul. Ils mettent donc
ainsi en commun leurs électrons. Chaque électron étant maintenant lié à deux protons voit son
énergie s'abaisser et la liaison est stable, comme nous l'avons vu. L'électron de l'hydrogène étant
dans l'état 1s, on a la situation suivante :

Les deux atomes forment une molécule d'hydrogène H 2 , que l'on peut écrire aussi comme H-H. La
première notation fait simplement le bilan des atomes dans la molécule, l'autre montre les liaisons
(on l'appelle aussi "forme développée").

Selon l'électronégativité, un atome peut être plus ou moins "friand" d'électrons. Les électrons mis
en commun peuvent avoir tendance à aller plus souvent d'un coté que de l'autre car le gain d'énergie
est ainsi plus élevé.
La molécule, globalement neutre, acquiert ainsi une légère charge négative d'un coté et légèrement
positive de l'autre. On dit que la molécule est "polarisée".

Il faut, bien entendu, deux atomes différents. La molécule d'hydrogène n'est donc pas polarisée.

On a représenté ci-dessus deux cas de liaisons possibles : deux orbitales s ensembles ou deux
orbitales p.

Selon les orbitales impliquées, on peut avoir diverses situations. Etudions le cas des orbitales s et p
ensembles. On parle de "liaisons hybrides".

Dans le cas du carbone, 4 places sont libres dans la couche externe. On a une orbitale s et trois
orbitales p (selon les valeurs de l et m ) avec trois orientations possibles.

Par exemple, la liaison notée "sp3" implique une orbitale s et une des trois orbitales p.
On notera cette liaison "simple" comme d'habitude C-C.

Mais l'orbitale s peut aussi se lier à deux orbitales p, on note cela "sp2".
On parle de "liaison double" car elle établit deux liaisons en même temps. On notera cette liaison
C=C.

Enfin, la liaison "sp" met en commun 3 orbitales p et une orbitale s. C'est une "triple liaison" notée
C≡C.

Il existe encore d'autres manières simplifiées de représenter les liaisons. Celle basée sur le modèle
de Bohr :

Ou une représentation de la forme développée, "en relief", avec des boules permettant de mieux
représenter la taille des atomes et leur disposition dans l'espace.

Liaison hydrogène
Considérons une liaison oxygène - hydrogène.
Etant donné la différence d'électronégativité, la molécule est légèrement polarisée. L'oxygène porte
une petite charge négative et l'hydrogène une petite charge positive. De ce fait, l'atome d'oxygène
d'une molécule attire légèrement l'atome d'hydrogène d'une autre molécule. Il se forme ainsi une
liaison faible appelée "liaison hydrogène".

Cette liaison n'est pas considérée comme une liaison moléculaire car aucun électron n'est échangé.
C'est un simple attraction électrostatique entre deux molécules. Elle est en outre très fragile. Elle est
environ cinquante fois plus faible que les liaisons covalentes. L'agitation thermique à température
ambiante suffit à briser cette liaison qui à tôt fait de se reformer avec d'autres molécules.

Cette liaison joue un rôle important dans les propriétés de l'eau en tant que solvant (les molécules
d'eau vont entourer les molécules hydratées) en particulier dans les fonctions biologiques. Ce type
de liaison est particulièrement important en biochimie.

De plus, cette légère liaison suffit à stabiliser l'eau et lui permet de rester liquide à une température
exceptionnellement élevée pour une aussi petite molécule. A température ambiante, en fonction de
sa masse moléculaire, on calcule qu'elle aurait normalement dû exister sous forme de vapeur et non
liquide. La molécule de disulfure d'hydrogène H2S, très proche du point de vue des masses et des
liaisons, est gazeuse à température ambiante car elle n'est pas suffisament polarisée pour avoir des
liaisons hydrogènes notables.

Enfin, la polarisation de cette liaison dans la molécule d'eau explique ses propriétés électriques.
Sous un champ électrique externe, ces charges vont se déplacer et la molécule d'eau va s'orienter.
Les charges de la molécule d'eau produisent alors un champ électrique qui va contrecarrer et
affaiblir le champ électrique externe. Cela explique son comportement dans le cas de la dissolution
du sel de cuisine.

Le comportement des liaisons


Sous les chocs, la distance entre les deux atomes peut varier.
sous le choc les deux atomes vont se rapprocher. Ce faisant, la charge négative des électrons var
provoquer une répulsion mutuelle et les atomes vont s'écarter. Puis, la liaison va les attirer et ils
vont à nouveau se rapprocher… Bref, la molécule vibre.

La molécule peut aussi être le siège de diverses rotations.


La deuxième rotation sera importante seulement si l'atome est lié à d'autres atomes. Dans ce cas
c'est tout le bloc qui tourne. Ce type de modification de la molécule peut lui permettre de prendre
diverses formes ce qui a un rôle important en biochimie où la forme des molécules est cruciale pour
leur permettre de réagir entre elles.

Notons que cette rotation n'est pas toujours possible. Par exemple, dans les liaisons sp2 et sp, la
double ou triple liaison "bloque" la liaison et l'empêche de tourner.

Ainsi, il n'existe qu'une seule forme de dichlorure d'éthane (avec un atome de chlore sur chaque
carbone, il y a aussi la forme avec deux chlores sur le même atome de carbone).
On passe facilement de l'une à l'autre par simple rotation autour de l'axe joignant les deux carbones.

Il y a par contre deux formes de ce type de dichlorure d'éthylène.

On ne peut passer aisément d'une forme à l'autre car la double liaison bloque la rotation. La
première forme s'appelle cis et l'autre trans.

Ces vibrations et rotations participent à l'énergie totale de la molécule et il faut en tenir compte
dans les calculs de physique statistique, comme nous l'avons vu.

Notons que, comme l'énergie d'un électron dans un atome, les vibrations des molécules et des
rotations sont quantifiées. Seules certaines vitesse de vibration ou de rotation sont possibles. La
différence d'énergie entre deux "niveaux de vibration ou de rotation" est de l'ordre d'un photon
infrarouge. C'est principalement sous cette forme que le rayonnement thermique est stocké et
réémit à température ambiante par la matière.

Liaisons multiples
Les liaisons multiples se produisent lorsque la valence est supérieure à 1 et que plus de deux
atomes se lient ensemble.
Un exemple typique est la molécule d'eau H2O avec deux hydrogènes (valence 1) et un oxygène
(valence 2).

Un autre exemple de ce type est le gaz carbonique CO2. Notons que le carbone peut aussi former
une liaison sp2 avec l'oxygène C=O ou CO, formant le monoxyde de carbone, très toxique (car plus
réactifs, deux liaisons restant pendantes et se liant fortement à l'hémoglobine la rendant inapte au
transfert de l'oxygène par le sang).

Comme on le voit, les atomes ne sont pas forcément alignés, les trois atomes dans l'eau forment un
angle. Pourquoi ? La raison en est que l'électron qui est partagé est 1s dans l'hydrogène mais 2p
dans l'oxygène. Les deux liaisons doivent donc être à angle droit.
Mais les deux atomes d'hydrogène portant tous deux une charge positive se repoussent et l'angle est
un peu plus écarté : 105°.

Le même phénomène se produit dans le sulfure d'hydrogène H2S ou H-S-H. Ici l'angle est presque
droit (93°) car l'atome de soufre est beaucoup plus gros que l'atome d'oxygène, les deux hydrogènes
sont donc plus loin l'un de l'autre et se repoussent donc moins.

Ce genre de raisonnement permet de déterminer les angles formés par les liaisons dans bien d'autres
cas.

D'autres exemples de molécules sont l'ammoniac NH3 ou les trois hydrogènes sont reliés à l'azote
avec la forme d'un tabouret à trois pieds.
Le carbone permet une chimie particulièrement riche du fait de sa valence 4 qui autorise toutes
sortes de liaisons. L'exemple le plus simple est le méthane CH4 où les quatre atomes d'hydrogène
se disposent en forme de tétraèdre autour du carbone.

Plusieurs carbones peuvent se lier entre eux et avec diverses molécules.


Les doubles liaisons sont dites "insaturées" et les liaisons simples "saturées". C'est la même
terminologie que vous avez peut-être déjà entendue lorsque l'on parle de "graisses saturées et
insaturées".

Les atomes de carbones peuvent même se lier en cercle, plus exactement sous forme d'hexagone.
Que se passe-t-il si on attache deux atomes de chlore au lieu de deux atomes d'hydrogène adjacents
?

On pourrait croire qu'il y a deux possibilités selon la position de la double liaison :

En fait, ce n'est pas le cas car les électrons des doubles liaisons bougent sans arrêt. On dit qu'ils sont
"délocalisés".
Enfin, à cause des quatre liaisons, les molécules peuvent être "chirales", c'est-à-dire différentes de
leur image dans un miroir. Un phénomène qui se produit avec presque toutes les molécules
organiques.

Dans les réactions biologiques, la forme des molécules joue souvent un rôle important par la mise
en contact des différentes zones appropriées des molécules. Par conséquent, l'activité biologique est
généralement très différentes entre les deux formes.

Les assemblages d'atomes de carbone peuvent être vraiment complexes et impliquer des dizaines,
des centaines, des milliers et même des millions d'atomes.

Le glucose a par exemple pour formule C6H12O6 et contient donc six carbones et en tout 24
atomes.
Les lipides (molécules formant les graisses) peuvent contenir des dizaines ou des centaines
d'atomes et les protéines peuvent contenir des milliers d'atomes.

L'exemple le plus frappant est la molécule d'ADN (acide désoxyribonucléique), siège du code
génétique, composée de millions d'atomes voir de l'ordre du milliard (une molécule d'ADN purifiée
et isolée est visible à l'œil nu comme un long filament blanchâtre) !

Comme on le voit, entre la physique quantique et la chimie il n'y a qu'un pas et la chimie, bien que
discipline à part entière de part la complexité des molécules et des procédés de synthèse et
d'analyse, fait énormément appel à la physique aussi bien au niveau de ses outils (spectrographie,
appareils de mesure,…) qu'au niveau fondamental (propriétés chimiques et physiques des
molécules). La frontière entre les deux disciplines est floue et c'est un succès considérable de la
physique quantique d'avoir réussit à expliquer les fondements théoriques de la chimie.
I.4.4. Le noyau atomique
L'application de la mécanique quantique à l'analyse de la structure des noyaux atomiques implique
de grandes complexités mathématiques même dans les cas les plus simples. Des modèles très
sophistiqués ont été élaborés (tel que le modèle en couche). Sans compter l'origine des forces
nucléaires qui proviennent de "l'interaction forte", une interaction complexe et déroutante étudiée
dans le cadre de la théorie quantique des champs.

Nous aborderons ici très brièvement quelques propriétés générales des noyaux, nous verrons un
modèle de la force nucléaire puis nous nous concentrerons sur le problème nucléaire à deux corps
et enfin nous verrons d'un peu plus près les différents modèles du noyau puis la radioactivité.

Nous ne prolongerons pas plus loin l'étude des forces nucléaires et nous renvoyons à la littérature
pour plus de détail ou l'étude de la fission ou de la fusion nucléaire qui sortent largement d'un cours
sur la mécanique quantique pour entrer dans celui de physique nucléaire.
I.4.4.1 Interaction nucléaire

Propriétés générales des noyaux


Le noyau atomique consiste en protons et neutrons appelés nucléons. D'autres particules tel que le
méson qui ont une existence éphémère dans le noyau sont habituellement ignorés dans les théories
de structure. Les protons sont les noyaux des atomes d'hydrogène et les neutrons sont des particules
qui ont à peu près la même masse, aucune charge électrique et le même spin et statistiques que les
protons (spin 12 h , statistique de Fermi-Dirac). Un noyau peut être caractérisé par sa charge Ze où Z
est un entier et e est la charge positive du proton et sa masse M qui est mesurée en unités de 161 de
la masse de O 16 (isotope de l'oxygène de nombre de masse 16). M est toujours trouvé proche d'un
entier A, appelé nombre de masse. Le nombre de neutrons dans un noyau est égal à A - Z. Donc le
deutéron (noyau du deutérium ou hydrogène lourd) H 2 consiste en un proton et un neutron. La
particule alpha (noyau d'hélium) He 4 de deux protons et deux neutrons. Et le noyau d'or Au 197 de
79 protons et 118 neutrons.

Selon la théorie de la relativité, la différence entre la somme des masses des Z protons et des A - Z
neutrons dans un noyau et la masse M de ce noyau, multiplié par le carré de la vitesse de la lumière
est l'énergie dégagée quand les nucléons séparés sont mis ensembles pour former un noyau. Cette
énergie est appelée l'énergie de liaison du noyau et elle est habituellement mesurée en unités d'un
million d'électron-volt (MeV). Le rayon nucléaire R est une quantité assez bien définie. Il peut être
mesuré de plusieurs manières, par exemple, par la diffusion de neutrons, protons et électrons à
haute énergie. On a trouvé expérimentalement que l'énergie de liaison par nucléon et le volume par
nucléon sont approximativement constants sur tout le tableau périodique. L'énergie est d'environ 8
MeV et le rayon est habituellement exprimé sous la forme R = r0 A1 / 3 où r0 ≈ 1.2 ~ 1.4 × 10 −15 m . La
constance approximative de l'énergie et du volume par nucléon est une conséquence de la propriété
de saturation des forces nucléaires.

Les forces nucléaires


Nous avons vu que le système formé d'un atome d'hydrogène et d'un proton a une énergie
d'interaction, due à l'échange d'un électron, qui varie aux grandes distances R comme
e −αR
(1)
R
où α = 2mWH / h (on a l'habitude de dire qu'il y a échange d'un électron "virtuel" lorsque,
comme c'est le cas ici, l'électron doit sauter à travers une région de l'espace où il a une énergie
négative. Plus précisément, un "échange virtuel" signifie que le phénomène implique une
interférence quantique entre un état avec échange et un état sans échange).

Nous pouvons maintenant nous poser la question suivante : pourrait-il se faire que les forces entre
d'autres espèces de particules aient une origine analogue ? Par exemple, que peut-on dire de la force
nucléaire entre un neutron et un proton ou entre deux protons ? Pour essayer d'expliquer la nature
des forces nucléaires, Yukawa a posé en hypothèse que la force entre deux nucléons est due à un
effet d'échange similaire, mais, dans ce cas, à l'échange virtuel, non pas d'un électron, mais d'une
nouvelle particule, qu'il a appelé "méson". Aujourd'hui nous identifions le méson de Yukawa avec
le méson pi (ou "pion") qui est produit dans les collisions à haute énergie de protons et d'autres
particules.

Voyons, à titre d'exemple, quel est le genre de force que nous attendons de l'échange d'un pion
positif ( π + ) de masse mπ , entre un proton et un neutron. De même qu'un atome d'hydrogène H 0
peut devenir un proton p + en donnant un électron e − ,
(2) H 0 → p + + e −
un proton p + peut devenir un neutron n 0 en émettant un méson π + .
(3) p + → n 0 + π +

Ainsi si nous avons un proton en a et un neutron en b séparés par une distance R, le proton peut
devenir un neutron en émettant un π + qui est ensuite absorbé par le neutron en b, lequel devient un
proton. Il y a une énergie d'interaction des deux nucléons (plus pion) qui dépend de l'amplitude A
pour l'échange du pion, exactement comme ce que nous avons trouvé pour l'échange de l'électron
dans l'ion hydrogène.
Dans le processus (2), l'énergie de l'atome H 0 est plus petite que celle du proton d'une quantité
WH (en faisant un calcul non relativiste et en omettant l'énergie au repos mc 2 de l'électron), si bien
que l'électron a une énergie cinétique négative ou une impulsion imaginaire. Dans le processus
nucléaire (3), le proton et le neutron ont presque les mêmes masses, si bien que le π + a une énergie
totale nulle. La relation entre l'énergie totale E et l'impulsion p pour un pion de masse mπ est
(4) E 2 = p 2 c 2 + mπ2 c 4

Comme E est nul (ou du moins négligeable en comparaison de mπ ), l'impulsion est encore
imaginaire :
(5) p = imπ c

En utilisant les mêmes arguments que nous avons donnés pour l'amplitude pour qu'un électron lié
pénètre la barrière entre les deux protons, nous obtenons dans le cas nucléaire une amplitude
d'échange qui devrait, pour les grands R, aller comme
e − (mπ c / h )R
(6)
R

L'énergie d'interaction est proportionnelle à A et elle varie donc de la même façon. Nous obtenons
une forme de variation d'énergie que l'on appelle potentiel de Yukawa entre deux nucléons.

En utilisant les mêmes arguments que nous avons donnés pour l'amplitude pour deux protons (ou
entre deux neutrons) qui résulte de l'échange d'un pion neutre ( π 0 ). Le processus de base est
maintenant
(7) p + → p + + π 0

Un proton peut émettre un π 0 virtuel, tout en restant un proton. Si nous avons deux protons, le
proton n° 1 peut émettre un π 0 virtuel qui est absorbé par le proton n° 2. A la fin, nous avons
encore deux protons. C'est quelque peu différent du cas de l'ion hydrogène. Dans ce dernier cas, le
H 0 passait dans un état différent, le proton, après avoir émis l'électron. Nous supposons
maintenant qu'un proton peut émettre un π 0 sans changer ses caractéristiques. En fait, de tels
processus sont observés dans les collisions à haute énergie. Le processus est analogue à celui où un
électron émet un photon et est encore un électron à la fin :
(8) e → e + photon

Nous ne "voyons" pas les photons à l'intérieur des électrons avant qu'ils soient émis ou après qu'ils
soient absorbés et leur émission ne change pas la "nature" de l'électron.

Pour en revenir aux deux protons, il y a une énergie d'interaction qui vient de l'amplitude A pour
qu'un proton émette un pion neutre qui voyage (avec une impulsion imaginaire) jusqu'à l'autre
proton et y est absorbé. Cette amplitude est encore proportionnelle à (6), m étant la masse du pion
neutre. Des arguments identiques donnent une énergie d'interaction égale pour deux neutrons.
Comme les forces nucléaires (en oubliant les effets électriques) entre neutron et proton, entre
proton et proton et entre neutron et neutron sont les mêmes, nous en concluons que les masses des
pions chargés et neutres doivent être les mêmes. Expérimentalement, les masses sont en fait très
proches et la petite différence est à peu près ce qu'on peut attendre des corrections dues à l'énergie
électrique.

Il y a d'autres sortes de particules, comme les mésons K, qui peuvent être échangées entre les deux
nucléons. Il est aussi possible d'échanger deux pions en même temps. Mais tous ces autres "objets"
échangés ont une masse au repos m x plus grande que la masse du pion mπ et conduisent à un
terme dans l'amplitude d'échange qui varie comme
e − ( m xc / h ) R
(9)
R

Ces termes disparaissent plus vite que le terme avec un pion avec les R croissants. Personne ne sait
aujourd'hui comment calculer ces termes à masses élevées, la théorie de l'interaction forte à la base
des interactions nucléaires étant extrêmement compliquée et les particules comme les nucléons
étant eux-mêmes des particules complexes (composées de quarks et de gluons), mais pour des
valeurs de R suffisament grandes seul le terme à un pion survit. Et, de fait, les expériences qui ne
dépendent que des interactions nucléaires à grande distance montrent que l'énergie d'interaction est
telle que la prédit la théorie de l'échange d'un pion.

Interaction à deux nucléons


Le problème le plus fondamental à résoudre en relation avec le noyau est la détermination des
paramètres de l'interaction entre paires de nucléons, y compris à courte distance, la relation
précédente n'étant valable que pour R grand. Il est possible qu'une fois connus, le problème de la
structure d'un noyau plus lourd que le deutéron deviennent simplement un exercice excessivement
compliqué d'application de la mécanique quantique. La situation est analogue à celle obtenue dans
les structures atomiques et moléculaires où l'interaction principale est connue et est décrit par la loi
de Coulomb. D'autre part, il est possible que la connaissance des interactions à deux corps ne soit
pas suffisante pour déterminer la structure des noyaux lourds, même en principe. Cela serait le cas
s'il y avait des interactions additionnelles qui se produisent seulement quand trois, quatre ou plus de
nucléons sont proches l'un de l'autre de manière telle que leur existence et propriétés ne puissent
pas être inférée de l'étude du système à deux nucléons.

Nous allons analyser le système à deux nucléons en supposant que l'interaction principale est à
courte distance. Il est raisonnable de s'attendre à ce que cette portée soit nettement inférieure à la
taille d'un noyau lourd et les calculs du type décrit ci-dessous montre qu'elle est de l'ordre de
2 × 10 −15 m . Nous mettons de coté pour le moment toute dépendance éventuelle de l'énergie
potentielle d'interaction V(r) avec des quantités autre que la grandeur de la distance de séparation r
entre les deux nucléons. Notre premier problème est alors de résoudre l'équation de Schrödinger
pour le mouvement relatif de deux particules de masse réduite µ dans le potentiel V(r). Puisque les
neutrons et les protons ont environ la même masse, µ est pratiquement égal à la moitié de la masse
de l'un des deux.

Système neutron - proton


Une hypothèse simple pour la forme de V(r) est la forme d'un puits carré : V (r ) = −V0 pour r < a et
V (r ) = 0 pour r > a. On a déjà montré qu'il n'y a pas d'état lié pour une particule de masse µ dans
ce potentiel sauf si V0 a 2 > π 2 h 2 / 8µ qui est égal à 10 −24 MeV − cm 2 pour le système neutron -
proton. Si nous supposons que a ≈ 2 × 10 −13 cm , V0 doit dépasser 25 MeV afin que le deutéron
existe. Puisque le deutéron a seulement un état lié, il est raisonnable de supposer qu'il correspond à
l = 0. L'énergie de liaison d'environ 2.23 MeV est obtenue avec V0 ≈ 36 MeV .

La section efficace de diffusion pour des neutrons à très basse énergie peut être obtenue à partir de
la relation que nous avons vue pour la diffusion par un puits de potentiel carré. Si nous négligeons
E par rapport à V0 , nous trouvons σ ≈ 3.6 × 10 −24 cm 2 . La section efficace mesurée pour des
neutrons de quelques électrons-volts sur de l'hydrogène est environ 20.4 × 10 −24 cm 2 . Cette énergie
est assez petite pour être négligée par rapport à V0 et suffisamment grande pour que la liaison du
proton dans la molécule d'hydrogène n'affecte pas le résultat. Une explication de cet écart en
fonction de la dépendance de l'interaction neutron - proton avec les états de spin fut suggérée en
1935 par E. Wigner. Le deutéron est connu avoir un spin h et est ainsi un état triplet de spin.
Cependant, les neutrons et protons en collision seront dans un état triplet de spin trois fois sur
quatre et un état singulet de spin un fois sur quatre. Donc l'écart est éliminé si la section efficace
singulet est prise comme environ 70 × 10 −24 cm 2 .

Si nous supposons que a est aussi égal à 2 × 10 −13 cm pour l'interaction singulet, cela montre que
cette section efficace est obtenue pour une profondeur du potentiel de 24 ou 27 MeV. Il est visible
que c'est un cas de diffusion résonante et que ces deux potentiels correspondent aux états singulet
virtuels et liés, respectivement. La décision pour laquelle on peut décider que cela est correct ne
peut pas se baser seulement sur la dépendance de la section efficace avec l'énergie du neutron
incident. Avec l = 0, σ est une fonction décroissante monotone de E dans les deux cas et il n'y a
pas assez de différence dans le comportement des deux fonctions. On a trouvé à partir d'autres
considérations (la diffusion de neutrons très lents par l'ortho et le parahydrogène) que l'état singulet
est virtuel, ainsi la profondeur correspondant à ce domaine est environ de 24 MeV.

Forme arbitraire du potentiel


L'énergie potentielle d'interaction entre une paire de nucléons est caractérisée par une courte portée
a et une grande amplitude V0 . Ici a et V0 ne s'appliquent pas seulement au puits de potentiel carré
mais se rapporte plutôt à la distance où V(r) est nettement différent de zéro et à la grandeur
approximative de V(r) dans cette région. Pour des collisions d'énergie modérée, jusqu'à quelques
MeV, ka est assez petit par rapport à l'unité où k = (2 µ E ) / h et E est l'énergie cinétique dans le
1/ 2

système de coordonnées du centre de masse. Par exemple, avec a = 2 × 10 −13 cm , ka est égal à
l'unité quand l'énergie des nucléons incidents dans le système du laboratoire est environ de 20
MeV. Donc, pour des énergies modérées, seule l'onde partielle l = 0 doit être considérée. Il s'ensuit
que la forme de la fonction d'onde radiale l = 0 dépend seulement légèrement de l'énergie dans le
domaine du potentiel et a une forme asymptotique simple en dehors de ce domaine. Cela suggère
que la liaison et la diffusion à basse énergie produit par un tel potentiel dépend essentiellement de
la "force" du potentiel, mesurée approximativement par V0 a 2 et de la distance où la fonction d'onde
atteint une forme asymptotique, mesurée approximativement comme a.

Il en résulte que tout potentiel fort, à courte portée et prédominance attractive peut réellement être
représenté par deux paramètres que l'on peut choisir comme une force et une portée et qui
spécifient l'énergie de l'état lié − ε et la dépendance du décalage de phase de diffusion sur l'énergie
pour des valeurs modérées de E. Donc, on s'attend à ce que les expériences à basse énergie
déterminent seulement ces deux paramètres et pas la forme du potentiel V(r). Cela est confirmé par
les résultats expérimentaux.

Relations pour les décalages de phase


Nous travaillons entièrement avec l'onde partielle l = 0 et nous posons u (r ) comme le produit de r
et de la fonction d'onde radiale. La normalisation de u est choisie telle que la forme asymptotique
est
(10) u (r ) → ψ (r )
en dehors du domaine du potentiel, où
sin (kr + δ )
(11) ψ (r ) ≡
sin δ
pour tout r. La section efficace totale est

(12) σ = 2 sin 2 δ
k
Les équations pour des énergies particulières E1 et E 2 sont
d 2 u1
2
+ k12 u1 − Uu1 = 0
dr
(13) 2
d u2
2
+ k 22 u 2 − Uu 2 = 0
dr
où U (r ) = 2 µV (r ) / h 2 . Nous multiplions la première équation (13) par u 2 , la seconde par u1 et
nous intégrons la différence sur r de r = 0 à la distance R plus grande que le domaine du potentiel :
R
 du du 
(
(14)  u 2 1 − u1 2  = k 22 − k12 )∫ R
u1u 2 dr
 dr dr  0 0

La fonction ψ satisfait la même équation (13) excepté que le terme en U est absent. Donc, (14) est
valide pour ψ également :
R
 dψ 1 dψ 2 
(15) ψ 2 −ψ 1  = k 2 − k1
2 2
( )∫ ψ ψ
R
1 2 dr
 dr dr 0 0

Si maintenant (14) est soustrait de (15), les contributions des cotés gauches pour la limite
supérieure R s'annulent puisque u (R ) = ψ (R ) . Alors la limite R → ∞ peut être prise, ce qui donne
 dψ 2 dψ 1 
(16) ψ 1 −ψ 2
 du du 
 −  u1 2 − u 2 1  = k 2 − k1
2 2
( )∫ (ψ ψ

1 2 − u1u 2 )dr
 dr dr  r = 0  dr dr  r =0 0

En utilisant (11), la première expression entre parenthèses sur le coté gauche est égale à
k 2 cot δ 2 − k1 cot δ 1 . De plus, puisque u (0) = 0 , la seconde expression entre parenthèses sur le coté
gauche est zéro. Donc, (16) peut s'écrire
( )
k 2 cot δ 2 − k1 cot δ 1 = 12 k 22 − k12 ρ (E1 , E 2 )
(17) ∞
ρ (E1 , E 2 ) ≡ 2∫ (ψ 1ψ 2 − u1u 2 )dr
0
Une modification intéressante de (17) est obtenue en remplaçant E1 par − ε , ψ 1 (t ) par
ψ g (r ) ≡ e − β r où β 2 = 2µε / h 2 et u1 (r ) par la fonction d'onde d'état de base u g (r ) normalisée en
analogie avec (10). Le résultat est
( )
k 2 cot δ 2 + β = 12 k 22 + β 2 ρ (− ε , E 2 )
(18)
ρ (− ε , E 2 ) ≡ 2∫ (ψ gψ 2 − u g u 2 )dr

Une autre modification consiste à permettre E1 d'être égal à zéro :

= k 2 ρ (0, E 2 )
1 1 2
k 2 cot δ 2 +
at 2

(19) ρ (0, E 2 ) ≡ 2 ∫ (ψ 0ψ 2 − u 0 u 2 )dr
0

= − lim(k cot δ )
r 1
ψ 0 ≡ 1−
at at E →0

où les indices de u 0 et ψ 0 indiquent l'énergie zéro. La quantité a t est la longueur de diffusion. En


utilisant (12), la section efficace à énergie zéro est égale à 4πat2 . L'indice de a t implique qu'elle se
rapporte à l'interaction triplet et non singulet.

Portée effective
Les équations (17) à (19) sont exactes. Nous allons maintenant faire une approximation par rapport
à ρ qui est suggérée par la forme générale du potentiel. Il est clair que (10) fait que l'intégrand de
ρ s'annule en dehors du potentiel. Dans le potentiel, tous les ψ sont presque égaux à un puisque kr
et βr sont petits comparés à l'unité. De même, les u sont presque égaux entre eux puisque U est
beaucoup plus grand que k 2 ou β 2 . Donc, ρ dépend seulement légèrement de ses arguments et
peut être calculé pour toute énergie pratique. Notre approximation est alors de remplacer ρ dans
les équations ci-dessus par

(
(20) rt ≡ ρ (0,0) = 2∫ ψ 02 − u 02 dr
0
)
qui est la portée effective. A nouveau, l'indice de rt fait référence à l'interaction triplet. De même,
la portée effective pourrait être définie comme, par exemple,

( )
(21) ρ (− ε ,−ε ) = 2∫ ψ g2 − u g2 dr
0

Avec cette approximation, le décalage de phase de diffusion est donné par (18) comme (en enlevant
l'indice 2)
(
(22) k cot δ + β ≈ 12 rt k 2 + β 2)
et par (19) comme
1 1 2
(23) k cot δ + ≈ rt k
at 2

La comparaison de (22) et (23) donne la relation suivante entre a t , β et rt :


1
(24) ≈ β − 12 rt β 2
at

Une des quantités β ou a t peut être vue comme un paramètre de force pour le potentiel et rt
comme un paramètre de portée. Cependant, 1 / β et a t diffèrent suffisament pour que la
spécification de deux des trois fixe le troisième. Donc, selon cette théorie de la portée effective
indépendante de la forme, toutes les propriétés de lien et de diffusion à basse énergie sont
déterminées par seulement deux paramètres pour chaque état de spin. Les résultats expérimentaux
montre que c'est bien le cas et cela confirme l'hypothèse d'une interaction forte à courte portée sur
laquelle la théorie est basée.

Les valeurs expérimentales sont 1 / β = 4.32 × 10 −13 cm pour l'état triplet de spin ( ε = 2.225 MeV ),
a t = 5.40 × 10 −13 cm et rt = 1.72 × 10 −13 cm , consistants avec (24). L'interaction par un puits de
potentiel carré correspondant a une profondeur de 35.5 MeV et un rayon de 2.03 × 10 −13 cm . Pour
l'état singulet de spin, a s = −23.7 × 10 −13 cm , où le signe négatif signifie qu'il n'y a pas d'état lié. La
portée effective n'est pas très bien déterminée expérimentalement mais est probablement entre 2.5
et 2.7 × 10 −13 cm . Un puits de potentiel de profondeur 16.8 MeV et un rayon 2.37 × 10 −13 cm
correspond au a s ci-dessus et rs = 2.47 × 10 −13 cm . La profondeur de 14.2 MeV et le rayon de
2.57 × 10 −13 cm correspond à rs = 2.68 × 10 −13 cm .

Opérateurs d'échange
La dépendance avec le spin de l'interaction neutron - proton notée ci-dessus dessus peut être
exprimée en fonction de l'opérateur d'échange de spin 12 (1 + σ N ⋅ σ P ) , où σ N et σ P sont les
matrices de spin de Pauli pour le neutron et le proton. Une fonction triplet de spin est une fonction
propre de cet opérateur avec la valeur propre +1. De même, une fonction singulet de spin est une
fonction propre avec la valeur propre -1. Une fonction triplet de deux particules de spin 1/2 est
symétrique sous l'échange des spins et donc a la valeur propre +1 pour un opérateur d'échange. De
même, une fonction singulet est antisymétrique et donc a la valeur propre -1 pour un opérateur
d'échange. Donc, l'opérateur ci-dessus a réellement l'effet d'échanger les spins du neutron et du
proton.

Un opérateur d'échange spatial multiplie les fonctions d'onde de l pair par +1 et les fonctions
d'onde de l impair par -1. Elle n'a pas d'effet sur les résultats obtenus jusqu'ici, qui sont tous pour l
= 0. Pour la diffusion à plus haute énergie, l'onde partielle avec l = 1 peut être significative. Si le
décalage de phase δ 1 pour l = 1 est petit en grandeur et que les décalages de phase plus élevés sont
négligés, on a
( )
(25) σ (θ ) ≈ 2 sin 2 δ 0 + 3δ 1 sin 2δ 0 cosθ
1
k

Pour des énergies suffisament grandes pour que δ 1 soit appréciable, le décalage de phase δ 0 est le
même entre 0 et 90°, ainsi le signe de l'asymétrie angulaire est déterminé par le signe de δ 1 .

Si l'interaction était de manière prédominante de type sans échange spatial, le potentiel serait
négatif (attractif) pour l = 1 et δ 1 serait positif. Alors les neutrons incidents sur des protons seraient
de préférence diffusés en avant à la fois dans les systèmes de coordonnées du centre de masse et du
laboratoire. Si, d'autre part, l'opérateur d'échange spatial dominait l'interaction, l'énergie potentielle
serait répulsive pour l = 1 et δ 1 serait négatif. Alors les neutrons seraient de préférence diffusés en
arrière dans le système du centre de masse et à angle droit dans le système du laboratoire et les
protons subiraient un recul vers l'avant dans les deux systèmes. Cet effet peut être vu physiquement
comme une diffusion de type sans échange spatial accompagnée d'un échange d'identité entre le
neutron et le proton.

Les expériences de diffusion à énergie modérée montrent que la section efficace différentielle est
pratiquement symétrique autour de 90° dans le système du centre de masse. Si elle était
parfaitement symétrique, la situation la plus simple serait que ou bien tous les décalages de phase
de l pair sont zéro ou que tous les décalages de phase de l impairs sont zéro. Le premier cas est
impossible puisqu'on sait que δ 0 ≠ 0 . Nous sommes donc conduit à l'interaction de Serber comme
une approximation du caractère d'échange spatial du potentiel neutron - proton à énergie modérée :
les coefficients des parties avec échange spatial et sans échange spatial du potentiel neutron -
proton sont égaux et de même signe, ainsi il n'y a pas d'interaction des états avec l impair.

Diffusion proton - proton


La diffusion de protons rapides sur l'hydrogène peut être traitée par les méthodes que nous avons
vues dans la diffusion par un potentiel coulombien en tenant compte de manière appropriée de
l'identité et du spin des deux protons. Quand l'interaction est purement coulombienne, on trouve la
formule de diffusion de Mott
2
 e2   
(26) σ (θ ) =  
2  
cosec 4 1
θ + sec 4 1
θ − cosec 2 1
θ sec 2 1
θ (
cos
e2
)
 hv ln tan 2 θ  
2 1

 2µ v  
2 2 2 2
 
qui est exprimée dans le système de coordonnées du centre de masse. Cette formule représente
seulement les expériences pour des protons de moins de 0.2 MeV car pour des énergies plus
élevées, les protons approchent suffisament pour que l'interaction nucléaire devienne appréciable.
Jusqu'à des énergies de plusieurs MeV, seul le terme δ 0 doit être inclus. On doit se souvenir qu'à
cause du principe d'exclusion, l'onde partielle avec l = 0 est associée à un état singulet de spin.
Donc les expériences avec des protons rapides sont requises si de l'information concernant
l'interaction triplet proton - proton doit être obtenue. Une théorie de portée effective peut être
réalisée pour l'interaction singulet proton - proton et conduit à approximativement aux même
paramètres que pour l'interaction singulet neutron - proton.

Si l'on se rappelle qu'il n'y a pas d'état lié neutron - proton pour l'état singulet, on comprend
pourquoi il n'existe pas de noyau constitué de deux protons (ou deux neutrons). Un phénomène que
nous avions déjà suggéré. Sans compter la répulsion électrostatique qui rend la liaison plus faible.
I.4.4.2. Modèles des noyaux
Depuis les expériences de Rutherford, on sait que les atomes doivent leur structure à l'existence
d'un noyau de charge positive Ze en présence duquel Z électrons forment un système lié de charge
globale nulle. La preuve de l'existence du noyau remonte à 1911. Ce sont les travaux de H. Geiger
et E. Marsden sur la diffusion des particules alpha par une mince feuille métallique (or ou platine)
qui conduisirent Rutherford à l'hypothèse d'un centre chargé à l'intérieur de l'atome, où serait
concentrée la quasi-totalité de la masse. La théorie de Rutherford ne prévoyait pas le signe de la
charge, mais l'hypothèse d'une charge positive était la plus plausible, compte tenu de l'existence des
électrons. En supposant une interaction coulombienne, la probabilité qu'une particule soit déviée
d'un angle supérieur à θ est donnée par :
πb 2 θ
(1) δ ≥ θ = cot 2
4 2
formule de Rutherford où b est la quantité 4 Z e 2 / MV 2 , M étant la masse de la particule alpha, V
sa vitesse et Ze la charge du noyau cible.

Ce type d'expériences s'est révélé d'une extrême richesse, puisqu'il a permis de montrer que le
domaine nucléaire avait des dimensions inférieures à 10 −12 cm et d'établir par une mesure directe la
valeur absolue de la charge des noyaux (J. Chadwick, 1920). On a pu enfin mettre en évidence dans
le cas des noyaux légers (Al) une diffusion anormale qui était la première manifestation des forces
nucléaires (Rutherford, 1919). Ainsi, si l'on peut donner à l'atome des dimensions d'environ
10 −8 cm , celles du noyau sont de l'ordre de 10 −13 à 10 −12 cm , et la quasi-totalité de sa masse est due
aux A nucléons présents dans le noyau sous deux aspects voisins, Z protons et (A-Z) neutrons,
formant ainsi un système de A fermions en interaction.

Sous ce dernier aspect, le noyau est comparable à de nombreux systèmes physiques. Son originalité
réside dans la nature de l'interaction qui doit rendre compte de la structure nucléaire. Les nucléons
interagissent, en effet, par l'intermédiaire de "forces" de 100 à 1000 fois plus intenses que les forces
électromagnétiques, mais d'une portée inférieure à 1.5 × 10 −13 cm . Ces deux propriétés caractérisent
en partie l'interaction nucléaire. On a cependant toutes raisons de penser que les lois de la
mécanique quantique non relativiste sont valables pour un tel système. En particulier, un noyau
possède toute une série d'états quantiques ou niveaux d'énergie différents (propriété que possède
tout système lié en mécanique quantique). L'état d'énergie la plus basse est appelé état fondamental
ou état de base, comme pour les atomes. Si un noyau se trouve dans un état ou niveau excité, il
retourne à l'état fondamental par émission de rayonnement qui emporte l'énergie excédentaire.

Une des chances de la physique nucléaire, dans son expression quantique, est de pouvoir ignorer en
première approximation, la structure interne des nucléons. Cela provient du fait que les énergies
rencontrées sont beaucoup plus basses que les énergies nécessaires à l'excitation des nucléons. Le
premier état excité du nucléon est en effet à 300 MeV au-dessus de l'état fondamental. Les
particules comme le méson qui véhiculent en dernière analyse l'interaction nucléaire relèvent de la
physique des hautes énergies. Un tel argument est applicable à n'importe quel système quantique
dont les constituants jouissent de ces propriétés. Par exemple, on peut ignorer la structure des
atomes dans la théorie cinétique des gaz à basse température ou encore celle des noyaux dans la
plupart des phénomènes atomiques comme les liaisons chimiques. Dans ces conditions, ne
cherchant pas à prendre rigoureusement en compte le rôle des mésons dans la matière nucléaire, il
est possible d'aborder l'étude du noyau à l'aide de potentiels phénoménologiques dans lesquels se
meuvent et interagissent les nucléons, comme nous l'avons fait dans l'étude de l'interaction de deux
nucléons. Il en découle, en particulier, une représentation de la "forme" de la masse et des états
excités des noyaux.

La découverte du neutron, en 1932, par Chadwick, marque l'origine de la physique nucléaire


moderne. C'est depuis cette époque qu'on admet que le noyau est constitué de A nucléons : Z
protons + N neutrons caractérisent ainsi parfaitement une espèce nucléaire déterminée (nucléide).

Cependant, dès 1924, W. Pauli avait introduit la notion de "spin nucléaire" (qu'on doit appeler
aujourd'hui moment angulaire total) pour expliquer la structure hyperfine des spectres atomiques. A
ce moment angulaire est associé un moment magnétique. Ces grandeurs peuvent naturellement être
définies pour tous les états quantiques du noyau. Ajoutons que si la distribution de charge du noyau
n'a pas la symétrie sphérique, celui-ci possède un moment quadrupolaire électrique.

Enfin, notons ici qu'un ensemble de nucléons ne peut former un système lié que si le nombre de
nucléons d'un type n'est pas très différent du nombre de nucléons de l'autre type. On peut même
dire que parmi les combinaisons de neutrons et protons qui forment des systèmes liés, relativement
peu son stables : sur environs 1300 nucléides connus, 274 sont stables, les autres sont radioactifs et
se transforment spontanément (voir plus loin).

Forme moyenne des noyaux


Une première façon d'accéder à la forme moyenne (dans le temps et l'espace) des noyaux consiste à
effectuer une "radioscopie" des atomes. Encore faut-il que le projectile utilisé ait une longueur
d'onde suffisament faible (il faut éviter un trop grand étalement de la diffraction associée à un
disque de 10 −12 cm ) sans être trop pénétrant (le noyau doit rester suffisament opaque). Les
particules de prédilection sont alors les électrons d'énergie supérieure à 100 MeV
( λ ≤ 2 × 10 −13 cm ). Outre les qualités requises, ils offrent l'avantage de permettre une analyse non
ambiguë des phénomènes dans la mesure où, à ces énergies, l'interaction électromagnétique est
relativement bien connue. Historiquement, cependant, les premières expériences de ce type furent
effectuées avec des particules alpha. Elles eurent deux mérites principaux : tout d'abord, l'analyse
révéla qu'en dessous d'une certaine distance d'approche l'interaction coulombienne de la particule
alpha avec le noyau s'efface brutalement devant une interaction d'une autre nature.

On obtenait ainsi les premières indications sur l'intensité et la portée des interactions nucléaires.
Après l'étude de nombreux noyaux, l'analyse indiqua que l'on pouvait représenter grossièrement le
noyau comme une sphère homogène de rayon R = r0 A1 / 3 , avec r0 ≅ 1.3 fm (1 fm = 1 fermi =
10 −13 cm , l'unité de prédilection en physique nucléaire). Le mérite de la diffusion des électrons est
de localiser avec moins d'ambiguïté et plus de précision la matière nucléaire. L'un des mérites de
l'électron étant son insensibilité aux interactions nucléaires permettant une étude fine de la densité
de charge du noyau. Par exemple, la figure ci-dessous donne la densité du Ca 40 obtenue après
analyse de son interaction électromagnétique avec des électrons de 700 MeV.
On notera qu'à cette énergie on commence à localiser certains nucléons au centre du noyau
(nucléons s 1 / 2 en terme de modèle des couches, voir ci-dessous). En outre, et ceci est aussi observé
à des énergies plus basses, les queues des fonctions d'onde des nucléons donnent lieu à une surface
diffuse. Une expression qui reproduit assez bien l'état de la situation pour l'ensemble des noyaux est
:
(2) ρ (r ) = ρ 0
1
1 + exp[(r − R ) / 0.228a ]
où R = r0 A avec r0 = 1.17 fm , ρ la densité et a = 2.2 fm (voir la courbe en traits interrompus
1/ 3

ci-dessus). Littéralement, le noyau n'est pas homogène et possède en première approximation une
épaisseur de surface constante (figure ci-dessous).
Les forces nucléaires étant à courte portée, on peut raisonnablement penser que l'allure du potentiel
dans lequel sont enfermés les nucléons est assez bien reproduite par celle de la distribution de
charge ainsi obtenue. C'est une telle hypothèse qui est généralement faite pour construire un modèle
nucléaire.

Masses nucléaires
On peut obtenir d'autres renseignements précieux à partir de la mesure systématique des masses
nucléaires. L'ensemble des nucléons contribue à la masse du noyau de deux façons. Ce sont les
nucléons qui dans leurs interactions deux à deux, font en sorte que le noyau soit un système lié.
Cela se traduira, dans la formule donnant la masse, par la présence d'une énergie de liaison B(A,Z)
due à ces interactions. La masse du noyau M(A,Z), de charge Z et de nombre de masse A, s'écrira
donc :
(3) M ( A, Z )c 2 = Zm p c 2 + ( A − Z )mn c 2 − B( A, Z )

Les masses nucléaires ainsi que celles des protons, m p , ainsi que celles des neutrons, mn , ont été
évaluées en énergie suivant la relation relativiste E = mc 2 .

La figure ci-dessous donne, en fonction de A, la variation de l'énergie de liaison par nucléon B/A.
L'ordre de grandeur de B/A, environ 8 MeV par nucléon, indique une fois de plus le rôle essentiel
de l'interaction nucléaire dans la matière nucléaire. Cependant, s'il est souhaitable d'interpréter les
résultats expérimentaux à l'aide de l'interaction nucléon - nucléon que nous avons vue, il convient
de dégager de la figure ci-dessus des propriétés d'ensemble de la matière nucléaire. Ces propriétés
peuvent être traduites à l'aide de deux modèles complémentaires : celui de la goutte liquide et celui
du gaz de Fermi à basse température.

Modèle de la goutte liquide


Le fait que le rayon nucléaire varie comme r0 A1 / 3 suggère que les nucléons ne s'interpénètrent pas.
Le potentiel nucléon - nucléon doit être, et est, répulsif à courte distance. Une analogie s'impose
avec le potentiel de Morse. De plus, la croissance linéaire en A du volume nucléaire indique que les
nucléons forment une assemblée "compacte" dans la mesure où r0 est de l'ordre du fermi. Ces deux
points sont en faveur d'un modèle de goutte liquide dans lequel les nucléons jouent le rôle des
molécules. L'énergie de liaison, en première approximation proportionnelle à A, implique une
saturation des forces nucléaires. En d'autres termes, on peut supposer que, dans le noyau, les
liaisons inter-nucléons ne se font que deux à deux. Dans le cas contraire, l'énergie de liaison serait
proportionnelle à A 2 , c'est-à-dire au nombre de liaisons possibles. Le modèle de la goutte liquide
peut alors se développer en ces termes :
 Si la matière nucléaire était infinie, l'énergie de liaison du "liquide" nucléaire serait
proportionnelle au nombre de nucléons présents et donc de la forme aV A , où aV est le
coefficient numérique de volume.
 La matière nucléaire n'est cependant pas infinie. Aussi y a-t-il lieu de tenir compte des effets de
surface. La surface de la goutte nucléaire étant proportionnelle à A 2 / 3 , on introduira un terme
− a S A 2 / 3 dans l'énergie de liaison. La contribution est naturellement négative, puisque les effets
de surface sont caractérisés par un nombre moins important de liaisons possibles.
 On a négligé pour l'instant le rôle de l'interaction électromagnétique. En plus de leurs propriétés
d'interaction nucléaire, les protons sont susceptibles de répulsions "électrostatiques". Une telle
contribution n'est pas liante. Elle doit être tenue pour responsable de la décroissance lente de
B/A observée pour les noyaux lourds quand A croît. Dans le modèle de la goutte liquide, son
rôle peut être chiffré en calculant l'énergie électrostatique d'une distribution homogène de
( )
charge de rayon R, soit 3 / 5 Z 2 e 2 / R donnant lieu à un terme − a c Z 2 / a .

L'allure des variations de chacun de ces termes est indiquée numériquement sur la figure ci-
dessous.
On constatera que d'autres contributions, ne pouvant découler d'un modèle de liquide classique,
sont à prendre en considération. C'est le cas de l'énergie d'asymétrie, qui apparaît sur la figure, et de
l'énergie de "pairing", plus délicate à mettre en évidence. Ces deux dernières contributions sont plus
aisément interprétables dans le cadre d'un modèle de gaz de Fermi. Il convient de remarquer,
cependant, que ce deuxième aspect de la matière nucléaire n'est pas en contradiction avec l'aspect
goutte liquide, si l'on veut bien reconnaître que la goutte nucléaire ne saurait être une goutte
classique. En effet, les N nucléons qui la composent sont soumis au principe de Pauli et occupent
nécessairement des états quantiques. De plus, ils interagissent par l'intermédiaire de "forces"
spécifiques qui leur confèrent des propriétés assez comparables à celles de l'hélium liquide à basse
température.

Modèle du gaz de Fermi


L'influence de l'énergie d'asymétrie apparaît de façon frappante dans la zone des noyaux légers,
mais n'y est pas limitée. On constate en effet que, pour N = Z et A = 4, 8, 12, 16, 20, l'énergie de
liaison est particulièrement élevée, ce qui indique une nette préférence de la matière nucléaire à se
construire de façon à assurer une symétrie parfaite proton - neutron. La netteté du phénomène pour
les noyaux A = 4 N, c'est-à-dire multiples de particules alpha, révèle plus d'information au sujet de
la symétrie et de la façon dont s'effectue la saturation des forces nucléaires. On notera en passant
que la symétrie semble d'autant plus parfaite que les nucléons identiques sont associés par paires.
Le fait que cette caractéristique devienne moins observable pour des A plus élevés est lié à
plusieurs causes. La principale tient au terme coulombien précédent, qui favorise un excès de
neutrons et entrave une construction symétrique de la matière nucléaire. Ensuite, la nature du terme
d'asymétrie fournit elle-même une explication en ce domaine. Il convient, en effet de prendre en
considération le caractère quantique des fermions dans la matière nucléaire. Puisque les noyaux
existent sous forme liée, on peut supposer, dans un premier temps, que dans leurs interactions deux
à deux les nucléons engendrent une "boîte de potentiel" dans laquelle ils occupent les états permis.
Le modèle le plus simple pour évaluer ce qu'une telle hypothèse entraîne est celui d'un gaz de
Fermi. Dans ce modèle, on empile les nucléons en respectant le principe de Pauli : la plus grande
valeur que peut prendre la quantité de mouvement est donnée en supposant que tous les états
d'énergie inférieure sont occupés. On obtient :
1/ 3

(4) k N ou Z
( )
= 3π 2 1/ 3 N ou Z 
 
 Ω 
F

où k FN ou Z est la plus grande valeur de k pour les neutrons (protons) et où Ω est le volume de
normalisation (4 / 3)πr02 A² . Numériquement, on obtient k F ≅ 1.36 fm −1 , soit E F = 37 MeV , et, de
là, une profondeur du puits nucléaire de l'ordre de E F + B / A = 45 MeV . La valeur du terme
d'asymétrie associé est obtenue en développant l'énergie totale en puissances de (N - Z), soit :

(5) a a
( N − Z )2
A

Un autre type d'effet qui échappe au modèle de la goutte liquide a reçu le nom de "pairing". Il
caractérise le fait que les noyaux ayant un nombre pair de protons et de neutrons (pair-pairs) sont
plus stables que ceux ayant un nombre impair de nucléons (impairs), eux-mêmes plus stables que
les noyaux impair-impairs. Si un tel effet est prévisible, dans le cadre du modèle du gaz de Fermi,
comme on le constatera en se reportant à la figure ci-dessous, la valeur numérique que l'on obtient
ainsi est environ dix fois trop faible.

L'interprétation repose essentiellement sur le fait que les nucléons identiques se couplent par paires.
La plus grande stabilité des paires est celle d'un couplage de moment angulaire total nul (J = 0).
Cette propriété joue un grand rôle en spectroscopie nucléaire, comme on va le constater. Elle est à
comparer à l'influence des paires de Cooper dans la théorie de la supraconductivité que nous
étudierons plus tard. Une autre analogie est le remplissage d'une couche s par deux électrons de
spin opposé dans un atome.

Rapprochant l'ensemble des termes précédents, on peut écrire l'énergie de liaison sous la forme :

(6) B( A, Z ) = aV A − a S A 2 / 3 − a a
(N − Z )2 − 3 Z 2 e 2 + ∆( A, Z )
A 5 Rc

Le meilleur accord global est représenté dans la figure ci-dessous.


Il est obtenu pour les valeurs suivantes des paramètres : aV = 15.56 MeV , a S = 17.23 MeV ,
a a = 23.3 MeV et pour le rayon coulombien : Rc = 1.24 A1 / 3 fm . Quant au terme de pairing, ∆ , il
est pris nul pour les noyaux impairs. Il est donc négatif pour les impair-impairs et positif pour les
pair-pairs. Dans ce dernier cas, il prend la forme approximative : ∆ ≅ 12 A −1 / 2 MeV .

Les nombres magiques


On constatera que si l'accord est globalement acceptable pour A > 20, on observe certaines régions
plus stables que la moyenne pour N ou Z voisins de 20, 28, 50, 82 et 126. Cette plus grande
stabilité peut être aussi constatée sur la figure ci-dessous, appelée ligne de stabilité.
Les isotopes stables sont plus nombreux pour ces nombres. Quant aux noyaux radioactifs, ils
possèdent dans le voisinage de ceux-ci des périodes relativement longues aussi bien en émission
bêta qu'en émission alpha. Il existe bien d'autres indications d'une structure plus stable au voisinage
des nombres N ou Z égaux à 2, 8, 20, 28, 50, 82, 126, appelés "nombres magiques" : nous citerons
le trait le plus frappant portant sur l'énergie de séparation du dernier neutron S n ou du dernier
proton S p . La figure ci-dessous définit et représente S p en fonction de Z.

Une figure comparable existe pour S n en fonction de N. On notera le saut de stabilité pour les
nombres magiques que l'on comparera au saut du potentiel d'ionisation pour les atomes de gaz
rares. Il est donc normal que l'on ait vu très tôt dans cet ensemble de manifestations l'indication
d'une structure en couches des noyaux. Ce n'est cependant que depuis 1950 que le modèle en
couches a réussi à s'imposer progressivement comme modèle de noyaux sphériques.

Modèle des noyaux sphériques


Le noyau étant un ensemble A de fermions en interaction, on se trouve a priori en présence de 3A
degrés de liberté. Si Ti est l'énergie cinétique du ième nucléon et Wij le potentiel d'interaction entre
les nucléons i et j, l'hamiltonien du système s'écrit :
A
(7) H = ∑ Ti + ∑W ij
i =1 ij (i < j )

Trouver les états stationnaires du noyau consiste à résoudre l'équation de Schrödinger Hψ = Eψ .


On rencontre cependant deux difficultés principales : le potentiel Wij n'est pas connu de façon
univoque, et le problème à A corps est très complexe du point de vue mathématique.

Un des buts actuels des études théoriques portant sur le noyau est de maîtriser ces deux difficultés.
Néanmoins, il existe un procédé simple pour résoudre de façon détournée l'hamiltonien nucléaire.
Dans la ligne du modèle du gaz de Fermi, en effet, on peut se contenter de remarquer que, dans
leurs interactions deux à deux, les nucléons font en sorte que le noyau existe. On introduira, pour
représenter celui-ci, un potentiel moyen nucléaire, et l'on supposera que chaque nucléon ressent
l'action des (A - 1) autres nucléons par l'intermédiaire de ce potentiel moyen. C'est une méthode
d'approximation que nous avons déjà utilisée dans l'étude des atomes. On écrira H = H 0 + H résiduels ,
soit :
A  A 
(8) H = ∑ (Ti + Vi ) + ∑ Wij − ∑ Vi 
i =1  i< j i =1 
où Vi est le potentiel moyen ressenti par le ième nucléon. On espère alors que le terme entre
crochets, Vrésiduel , ne sera qu'une perturbation. Ce procédé est développé actuellement en parfaite
analogie avec la méthode de Hartree-Fock introduite en physique atomique pour construire le
champ moyen.
La première étape que l'on doit franchir est donc de construire les fonctions d'onde et les énergies
propres d'une particule enfermée dans un potentiel moyen nucléaire. Comme on l'a signalé, le fait
que les forces nucléaires soient à courte portée suggère que le potentiel moyen doit avoir une forme
voisine de la densité nucléaire. Le potentiel correspondant porte le nom de potentiel de Saxon-
Woods. Il s'écrit avec les notations précédemment introduites :
− V0
(9) Vi =
 r−R 
1 + exp 
 0.228a 
où V0 ≅ 50 MeV (valeur proche de celle obtenue à l'aide du gaz de Fermi : 45 MeV).

Modèle en couche
Si l'on suppose que les noyaux ont une forme sphérique, on pourra, après séparation du mouvement
du centre de masse, rechercher une solution de l'hamiltonien sous la forme :
R (r )
(10) ψ (r ,θ , φ ) = nl Yl m (θ , φ )
r
suivant le procédé habituel. Dans cette expression, Yl m (θ , φ ) est une harmonique sphérique et
Rnl (r ) satisfait à l'équation radiale :
 d 2 2 d l (l + 1) 2m 
(11)  2 + − 2
+ 2 [E − V (r )] Rnl (r ) = 0
 dr r dr r h 
où m est la masse réduite (sensiblement égale à la masse du nucléon) et où V (r ) est le potentiel (9).
La forme de V (r ) ne se prête pas à des solutions analytiques de l'équation radiale. Aussi a-t-on
recours le plus généralement à des calculateurs.

On peut aussi, si l'on veut obtenir des ordres de grandeur, prendre comme approximation du
potentiel nucléaire celui d'un oscillateur harmonique auquel on ajoute une perturbation simulant les
effets de bord diffus du potentiel et levant de ce fait les dégénérescences de l'oscillateur
harmonique. On aboutit dans ce cas à la séquence indiquée sur la gauche de la figure ci-dessous.
L'effet de bord fini abaisse les états de l élevé. C'est ce que l'on retrouve en utilisant un ordinateur.
Cependant en remplissant les états permis jusqu'au Aième nucléon, en commençant par les plus
bas, on ne reproduit pas l'ensemble des nombres magiques. C'est en 1948 que l'on constata qu'en
introduisant dans le potentiel un terme spin-orbite, VSO = −a l ⋅ s , on reproduisait les nombres
magiques, en particulier 50, 82 et 126. Alors qu'en l'absence de ce terme les états j = l + 1/2 er j = l
-1/2 sont dégénérés, la présence de VSO abaisse les états j = l + 1/2 par rapport aux états j = l - 1/2.
La partie droite de la figure ci-dessus donne la séquence des états ainsi obtenus. Les nombres situés
à l'extrême droite correspondent aux nucléons identiques que l'on peut mettre jusqu'à la dernière
sous-couche sans violer le principe de Pauli. On voit que l'on assiste pour chaque nombre magique
à un saut d'énergie. Les deux sous-couches voisines sont en effet distantes à ce niveau, alors
qu'entre deux nombres magiques les sous-couches sont resserrées.

En plus du fait qu'on retrouve les nombres magiques, le modèle permet de prévoir que :
1. Le niveau fondamental d'un noyau à couches complètes aura un moment cinétique total nul.
Toutes les valeurs de j z des nucléons sur cette couche sont occupées, ce qui entraîne J = 0.
2. Ce niveau a une parité +1. Il y a, en effet, 2j + 1 particules sur une couche caractérisée par un
moment cinétique J. La parité de la couche complète sera donc (− 1)
2 j +1
= +1 puisque j est un
demi-entier.
3. Si l'on ajoute à un noyau doublement magique un nucléon, celui-ci devra occuper un état
permis. L'état le plus bas correspond à une occupation de l'orbitale immédiatement supérieure
aux orbitales déjà occupées. C'est l'état fondamental de ce noyau. En supposant que le cœur
magique est suffisament stable pour ne pas être affecté par la présence de ce nucléon
supplémentaire (dit nucléon de valence par analogie avec les électrons d'un atome), on aura
J = J coeur + ji et π = π coeur π i = π o où ji et π i sont respectivement le moment angulaire et la
parité de l'orbitale occupée par le nucléon de valence.
4. Des prévisions identiques sont faites si le noyau étudié peut être décrit comme un cœur
magique moins un nucléon (trou de valence).
5. Si l'on suppose maintenant que le cœur n'est pas modifié de façon appréciable même si un
nucléon est sur une orbitale moins stable, c'est-à-dire plus élevée (ou un trou sur une orbitale
plus profonde dans le cœur), on pourra décrire en ces mêmes termes les nombres quantiques des
états excités. Pour les états de particules célibataires, on montera successivement sur les
orbitales de plus en plus élevées décrivant ainsi les états de plus en plus excités. Pour les états
de trou célibataire, on descendra sur les orbitales de plus en plus basses.
6. La différence en énergie entre l'état fondamental et les divers états excités correspond, cela en
première approximation, à la différence des énergies des différentes couches par rapport aux
couches magiques.

Toutes ces prévisions sont bien vérifiées. L'exemple du voisinage de Pb 208 en témoigne. La figure
(a) ci-dessous donne les états du modèle en couches au voisinage de Pb 208 .
Les figures (b) et (c) représentent les spectres des noyaux décrits comme un cœur Pb 208 avec un
nucléon en plus ou en moins. La parité est indiquée par un + ou un -. On notera que le noyau Pb 208
est doublement magique puisqu'il comporte 82 protons et 126 neutrons.

Ce genre de considérations n'est à priori applicable qu'aux noyaux différant de plus ou moins un
nucléon des noyaux doublement magiques. En fait, en raison de l'interaction de pairing, on peut,
moyennant quelques précautions, étendre les prévisions 1 à 5 à d'autres noyaux impairs un peu
éloignés des nombres magiques.

L'interaction de pairing
Supposons que l'on veuille décrire à l'aide du modèle en couches les états des noyaux différant de
deux nucléons identiques en plus ou en moins des noyaux doublement magiques. Un procédé
simple consisterait à étendre la méthode précédente, c'est-à-dire considérer un cœur doublement
magique qui fournirait le potentiel moyen et coupler les deux nucléons ou les deux trous dans ce
potentiel. En fait, l'expérience montre que ce procédé échoue si l'on ne prend pas en compte
l'interaction résiduelle Vrésiduel que l'on a négligée pour l'instant. Par exemple, si l'on décrit les états
du Po 210 en négligeant les interactions résiduelles des deux protons de valence h9/2, on prédira que
l'état fondamental est fortement dégénéré. En effet, les deux nucléons h9/2 peuvent se coupler pour
donner des états de spin 9 / 2 − 9 / 2 ≤ J ≤ 9 / 2 + 9 / 2 et de parité +1. Comme il s'agit de nucléons
identiques, seules les valeurs paires du moment cinétique sont permises et les états
Jπ = 0 + ,2 + ,4 + ,6 + ,8 + sont dégénérés. En fait, il n'en est rien et le niveau fondamental du Po 210 est
un état 0 + . Quant aux états 2 + ,4 + , K ils se trouvent situés à des énergies supérieures à 1 MeV
(figure ci-dessous).
On doit en conclure que les interactions des nucléons en dehors des couches complètes sont loin
d'être faibles. D'une façon générale, en effet, tous les états fondamentaux des noyaux pair-pairs ont
Jπ = 0 + , ce qui est un guide précieux quant au fonctionnement de cette interaction résiduelle. On
peut énoncer la règle : deux nucléons identiques sur une même orbitale se couplent à J = 0
préférentiellement. L'abaissement du niveau 0 + traduit en ordre de grandeur les effets de la
perturbation agissant ici. Les forces nucléaires étant attractives, on doit en conclure que la
perturbation est liante pour une interaction dans l'état J = 0. La valeur du terme de pairing, ∆ , que
l'on a introduit dans l'énergie de liaison de la matière nucléaire et qui reflète l'effet ci-dessus, est
donc particulièrement intéressante.

Voyons deux situations extrêmes :


a) ∆ = 0 . Dans ce cas, on n'aurait pas Jπ = 0 + pour les états fondamentaux des noyaux pair-pairs,
et les règles du modèle en couches ne seraient applicables que pour les noyaux doublement
magiques. Le fait que ∆ ≠ 0 a un effet stabilisateur sur les couches et permet d'étendre les
prévisions du modèle aux spectres des noyaux impairs de part et d'autre des nombres magiques
dans les limites à définir. Le caractère stabilisateur de l'interaction de pairing résulte du fait
qu'en toute généralité cette interaction résiduelle n'est pas la seule à prendre en compte dans un
traitement complet de l'hamiltonien nucléaire H = H 0 + VR . Il existe d'autres composantes de
l'interaction résiduelle dont certaines peuvent contribuer à déformer le cœur. C'est en ce sens
que le pairing est stabilisateur, puisqu'en son absence H 0 serait livré à des interactions
résiduelles susceptibles de déformer le noyau.
b) ∆ > hω 0 correspondrait au contraire à une énergie de pairing supérieure à l'espacement entre
deux couches magiques représenté par hω 0 . Dans ce cas, les prévisions seraient délicates et les
nombres magiques inopérants. En effet, l'énergie de pairing étant alors plus élevée que celle
nécessaire pour faire passer les nucléons d'une couche à l'autre, le noyau comporterait un grand
nombre de couches partiellement remplies par des paires de nucléons couplés à J = 0. En
d'autres termes, le modèle ne serait plus à particules indépendantes et l'on ne pourrait plus
remplir les états aussi simplement. Il conviendrait de ne déposer des paires qu'après s'être assuré
que l'énergie est aussi minimale.
Ces deux remarques doivent faire constater que, si la valeur intermédiaire de ∆ évite les deux
situations extrêmes, elle pourra néanmoins être suffisante pour diffuser les paires sur les dernières
sous-couches situées au voisinage du niveau de Fermi. C'est en ces termes qu'il faut modifier les
hypothèses du modèle en couches pour rendre compte des résultats expérimentaux. Si les états très
au-dessous de la mer de Fermi peuvent être considérés comme entièrement remplis, et ceux situés
très au-dessus comme entièrement vides, il convient d'effectuer un mélange de configurations en ce
qui concerne les états des couches (appelées couches ouvertes) situées au voisinage du niveau de
Fermi. En ce sens, la matière nucléaire n'est pas un gaz parfait de Fermi. Les états du modèle en
couches fournissent une base mathématique, et les états physiques sont des superpositions linéaires
de ces états avec des poids statistiques d'autant plus faibles que les configurations ainsi prises en
compte sont situées loin de la mer de Fermi. Le nombre de couches ouvertes à considérer dépend
du noyau envisagé. Une hypothèse d'économie présidant aux calculs de ce type, on néglige l'effet
des configurations éloignées lorsque le calcul reproduit les résultats expérimentaux. Il existe
cependant des régions pour lesquelles de tels calculs sont pratiquement inabordables. Ce sont les
régions situées entre deux nombres magiques pour lesquelles le nombre de configurations
intervenant est extrêmement élevé en raison du faible espacement des couches. La base du modèle
en couches est alors d'un faible intérêt et il est préférable de recourir à un modèle complémentaire.
Plus fondamentalement encore, dans ces régions, la forme d'équilibre du noyau n'est pas sphérique
et les hypothèses doivent être modifiées en conséquence.

Potentiel moyen non sphérique


La mesure des moments de la distribution de charge et de courant des noyaux est un test très fin des
modèles nucléaires. L'expression théorique de ces moments est obtenue, en effet, en évaluant la
valeur moyenne des opérateurs associés, et l'influence de la nature de la fonction d'onde nucléaire
est très nettement ressentie que ce soit au niveau des moments magnétiques ou électriques. Par
exemple, le moment quadrupolaire de la distribution de charge nucléaire dans l'état de moment
angulaire J et de projection M = J s'écrit :
(12) Q = J , M = J Q0 p J , M = J
où l'opérateur moment quadrupolaire est, en vertu du principe de correspondance,
( )
Q0 p = (1 / e )ρ (r ) 3 cos 2 θ − 1 . Dans cette expression, ρ (r ) est la densité de charge nucléaire. On
sait qu'un moment quadrupolaire non nul traduit une non-sphéricité de la distribution de charge
associée. Dans l'hypothèse d'un schéma en couches, on ne s'attend pas à des moments
quadrupolaires élevés puisque, par définition, les cœurs magiques sont sphériques. Il convient donc
de ne prendre en compte que la contribution des nucléons de valence. La figure ci-dessous montre
que, s'il en est ainsi près des nombres magiques, on constate, dans des régions comme celles des
terres rares et des actinides de très grandes valeurs positives de Q, associées à une forme
ellipsoïdale allongée ("cigare").
On donne à ces régions le nom de régions de grandes déformations pour insister sur le fait qu'on y
rencontre des noyaux ayant une forme d'équilibre non sphérique. Tout aussi troublante est
l'observation de moment quadrupolaires pour les noyaux formés d'un cœur magique plus quelques
neutrons. On pouvait en effet supposer que les neutrons supplémentaires de charge nulle ne
contribueraient pas, en première approximation, au moment quadrupolaire électrique. Par exemple,
le noyau O 17 , bien que formé d'un cœur magique 0 + et d'un neutron supplémentaire d5/2, possède
un moment quadrupolaire aussi élevé que si le neutron supplémentaire "déformait" le cœur, de telle
sorte que la distribution de charge s'en trouve affectée. Dans ce contexte de "polarisation du cœur",
les ordres de grandeur sont retrouvés, et l'on peut voir dans ces manifestations l'origine des grandes
déformations lorsqu'on ajoute un grand nombre de nucléons supplémentaires. Il s'agit alors d'un
type d'interaction résiduelle différente du pairing et ne possédant pas, bien au contraire, des
propriétés stabilisatrices de la forme sphérique. Plus fondamentalement, il suffit de constater que le
fait d'ajouter un nucléon dans la couche hors d'un cœur magique fait perdre à l'ensemble la symétrie
sphérique : le potentiel moyen recherché ne possède donc plus d'emblée cette symétrie.

On a constaté que le succès du modèle en couches repose sur le fait que dans leurs interactions
deux à deux les nucléons font en sorte que le noyau existe comme si, pour les noyaux magiques,
l'hypothèse d'un potentiel moyen sphérique dans lequel se déplacent de façon indépendante les
nucléons était réaliste. Le caractère spectaculaire du succès du modèle en couches influence
fortement les hypothèses du modèle de Nilsson. Dans ce modèle, en effet, on suppose que, dans
leurs interactions deux à deux, les nucléons font en sorte que le noyau existe, comme si, pour les
noyaux déformés, l'hypothèse d'un potentiel moyen ellipsoïdal était réaliste. Les prescriptions du
modèle en couches sont alors transposées dans ce cadre. En particulier, la faible portée des forces
nucléaires sert à "justifier" la supposition que la déformation du potentiel suit la distribution non
sphérique de charge. Dans ces conditions, une différence essentielle avec un calcul de modèle
sphérique réside dans l'emploi d'un oscillateur harmonique anisotrope pour lequel ω x = ω y , mais
ω z est différent des deux précédents (symétrie axiale). Les trois directions n'étant plus
équivalentes, on assiste à une levée de dégénérescence de l'oscillateur harmonique d'autant plus
importante que la déformation est grande. L'introduction d'un terme de bord diffus en l 2 et d'un
terme spin - orbite l ⋅ s , bien que posant quelques problèmes techniques, se fait "à la manière" du
modèle en couches. Chaque orbitale reste néanmoins doublement dégénérée par le jeu du théorème
de Kramers (classiquement, deux orbitales associées à des nucléons tournant en sens inverse l'un de
l'autre correspondent à des énergies dégénérées). La figure ci-dessous montre comment évolue la
levée de dégénérescence en fonction d'un paramètre δ , lié à l'excentricité de l'ellipsoïde, c'est-à-
dire à la déformation.
Pour δ = 0 , on retrouve le modèle en couches sphériques. Le spectre de Lu 177 s'interprète en ces
termes (figure ci-dessous), pourvu que l'on donne à δ une valeur de l'ordre de 0.3, compatible avec
la déformation obtenue par la mesure des moments quadrupolaires dans la région.
L'état fondamental 7/2+ et l'état 9/2- à 0.105 MeV correspondent, en effet, aux deux premiers états
de Nilsson, appelés états intrinsèques.

Cependant, d'autres états apparaissent. Par exemple, les états 9/2+,… , 11/2+,… , 17/2+ sont
interprétés comme des états rotationnels construits sur l'état intrinsèque 7/2+. Il en est de même des
états 11/2-, 13/2-,… , 23/2- par rapport à l'état intrinsèque 9/2-. La présence de ces états "parasites"
ne doit pas être considérée comme une surprise. Pour l'instant, nous avons décrit les états excités du
système nucléaire en termes d'excitations élémentaires de particules. Si l'on reproduit de la sorte un
certain nombre de niveaux de basse énergie, un tel traitement n'exclut pas l'existence d'autres
modes d'excitation du système nucléaire, en particulier d'états collectifs. Ce phénomène est bien
connu en physique des solides où les états de phonons cohabitent avec les états élémentaires du gaz
d'électron. De même, dans le cas des molécules, comme nous l'avons vu, des états rotationnels et
vibrationnels sont construits sur les états électroniques.

Dans le cas des noyaux déformés, les états de Nilsson sont l'équivalent des états électroniques des
molécules et les états collectifs, l'équivalent des états rotationnels. Une différence supplémentaire
entre le modèle en couches sphériques et le modèle de Nilsson réside dans le fait que j 2 n'est pas
une constante du mouvement pour un potentiel moyen non sphérique. Seul, dans le cas ellipsoïdal,
j z commute avec l'hamiltonien intrinsèque. Le moment angulaire total du noyau I étant conservé
au cours du temps, on doit définir un moment angulaire collectif R tel que I = R + j. En d'autres
termes, les composantes j x et j y sont cédées à l'ensemble des nucléons créant le potentiel moyen,
de telle sorte que la collectivité acquiert le moment angulaire R, responsable de la structure
rotationnelle des états collectifs.

Modèle rotationnel
En effet, lorsqu'un système quantique n'est pas infini et ne possède pas une forme d'équilibre
sphérique, on assiste d'ordinaire à des manifestations de type rotationnel. Intuitivement, on
comprendra qu'il n'existe pas de telles manifestations pour les systèmes à symétrie sphérique,
puisqu'il n'existe alors pas d'axe privilégié de quantification de ce mouvement. En revanche, dans le
cas d'une forme ellipsoïdale, par exemple, un axe perpendiculaire à l'axe de symétrie intrinsèque
peut jouer ce rôle. C'est en ce sens que l'on peut observer des états rotationnels d'objets quantiques
tels que les molécules ou les noyaux déformés. Dans un premier temps, assimilons un noyau
déformé à un objet ellipsoïdal indéformable au cours du temps. En supposant que la rotation est
suffisamment lente pour ne pas affecter les mouvements intrinsèques des nucléons, on associera à
la collectivité des nucléons un moment d'inertie J par rapport à son axe de rotation. Dans ce cas,
l'énergie d'un système classique et rigide équivalent est donnée par E R = I 2 / 2 J où I est son
moment angulaire. La résolution de l'équation de Schrödinger associée fournit les énergies propres
sous la forme :
h 2 I (I + 1)
(13) E RI =
2J

Le cas nucléaire se prêtant à une telle résolution est celui des noyaux pair-pairs dans leurs états de
faible excitation collective. Pour eux, on peut en effet ignorer les effets angulaires des nucléons
individuels en les couplants deux à deux à j1, 2 = 0 sur leurs orbitales de Nilsson. L'énergie associée
à l'hamiltonien intrinsèque étant "gelée", on s'attend à la relation :
E RI − E R0 I (I + 1)
(14) I ′ =
E R − E R I ′(I ′ + 1)
0

en supposant que le moment d'inertie est une constante du noyau. C'est effectivement ce que l'on
observe pour les noyaux franchement déformés des régions des terres rares et des actinides, comme
en témoigne la figure ci-dessous.
Un spectre typique est représenté sur la figure ci-dessous.
Les niveaux 0 + , 2 + , 4 + obéissent à une séquence rotationnelle et vérifient cette loi de façon
remarquable. Le fait que l'on n'observe pas de niveaux 1− , 3 − ,… tient à ce qu'un tel noyau est
parfaitement symétrique par rapport à un plan x'oy' liés aux axes d'inertie. Cela n'est pas le cas des
molécules polaires pour lesquelles le centre de charge n'est pas confondu avec le centre de masse.

Un tel traitement des variables collectives de la "goutte" nucléaire permet d'obtenir par
l'intermédiaire du moment d'inertie des renseignements complémentaires sur la structure nucléaire.
Les valeurs expérimentales se situent entre deux courbes théoriques. La première donne la valeur
du moment d'inertie dans le cas où la matière nucléaire suit le mouvement de rotation de façon
"rigide". L'appellation "rigide" ne doit pas laisser supposer que les nucléons sont immobiles et la
matière nucléaire gelée. L'autre courbe correspond à un moment d'inertie dû à un mouvement
"tourbillonnaire" du fluide nucléaire, mouvement comparable à une goutte superfluide. Les valeurs
expérimentales intermédiaires impliquent qu'éventuellement un nombre limité de nucléons
participent à la rotation au sens "rigide". Par exemple, les nucléons qui se trouvent en dehors d'un
cœur superfluide.

Modèle vibrationnel
La nature collective des états rotationnels est encore ressentie par un ensemble de caractéristiques
supplémentaires. Par exemple, les transitions quadrupolaires électriques rencontrées dans les
régions de déformation ont des probabilités de transition beaucoup plus élevées que ne le prévoit un
modèle à particules indépendantes. La figure ci-dessous en témoigne : les transitions connectant le
premier niveau 2 + des noyaux pair-pairs à l'état fondamental 0 + sont nettement plus rapides que
ne le prévoit un tel modèle.
Bien entendu cela est lié à l'existence de grands moments quadrupolaires dans ces régions.
Néanmoins, ces transitions sont nettement collectives pour l'ensemble des noyaux étudiés. Aussi les
transitions quadrupolaires électriques révèlent-elles une nature systématiquement collective du
premier état 2 + des noyaux pair-pairs.

Dans le cas des noyaux déformés, ce fait s'interprète aisément en termes rotationnels. Cependant,
au voisinage des nombres magiques, parler d'états rotationnels de noyaux sphériques est un non-
sens quantique. Il convient donc de rechercher une autre description de ces états. Dans la ligne de
l'approche "macroscopique" qui précède, on peut développer à leur propos un modèle vibrationnel
de la "goutte nucléaire" au voisinage de sa position d'équilibre. Un processus d'entretien de ces
vibrations peut être trouvé dans les tendances antagonistes du terme de surface (tension
superficielle), favorable à la forme sphérique, et du terme coulombien (pression électrostatique). Si
donc la matière nucléaire est susceptible de vibration autour d'une position d'équilibre, on peut
escompter trouver des bandes de vibrations non compliquées au voisinage des formes d'équilibre
62
sphérique. Le noyau Ni28 au nombre de protons magique, et dont le spectre est représenté sur la
figure ci-dessous, en est une illustration.
Si l'on suppose dans ce cas que le noyau vibre de façon harmonique en gardant la symétrie par
rapport au plan médian, le premier état excité sera un état 2 + (arguments de symétrie). Le
deuxième état excité correspondra à deux quanta de l'oscillateur harmonique (appelés phonons par
analogie au cas des vibrations des solides). On doit donc s'attendre à le trouver à une énergie double
du premier état excité ( 2hω 0 ) et trois fois dégénérés ( 2 − 2 ≤ J ≤ 2 + 2 et parité +1 si l'on garde la
symétrie sphérique, soit 0 + , 2 + , 4 + ). On constatera sur la figure que la dégénérescence est levée.
Un calcul plus raffiné et moins restrictif (vibrations anharmoniques) peut en rendre compte. Bien
plus frappant est le fait que le centre de gravité du triplet 0 + , 2 + , 4 + est à une énergie double
comme attendu.

Il importe donc d'obtenir un critère objectif signant la nature vibrationnelle ou rotationnelle des
états collectifs. Ce critère est fourni par la position du premier état excité des noyaux pair-pairs. Le
premier état excité des noyaux pair-pairs est de façon quasi générale un état 2 + . Lorsque l'on trace
en fonction de A l'énergie d'excitation de ce niveau (figure ci-dessous), on constate que, près des
nombres magiques, celle-ci est élevée, alors qu'au contraire, le premier niveau 2 + est très proche
du niveau fondamental 0 + .
La position des états excités est au reste un critère auquel on doit se référer avant d'entreprendre un
calcul de modèle en couches. Traduisant, en effet, la plus grande stabilité des structures magiques,
il permet de "mesurer" en quels termes un cœur donné peut être considéré comme inerte. La figure
sur laquelle nous avons comparé les spectres de Hf 178 et Pb 208 illustre ce dernier point. On conçoit
en particulier qu'il serait hasardeux de vouloir décrire le spectre de Lu 177 comme celui d'un trou
neutron couplé à un cœur inerte Hf 178 . L'interaction du neutron supplémentaire avec le cœur risque
en effet de faire apparaître ce cœur dans bon nombre d'états excités, et il convient alors de tenir
compte des 3A degrés de liberté de la matière nucléaire d'une façon plus judicieuse. C'est au reste
ce que nous avons fait en décrivant de façon collective les états de Lu 177 . Inversement, on conçoit
qu'il soit tentant de décrire les états collectifs vibrationnels apparaissant au voisinage des nombres
magiques en termes de mélanges de configurations du modèle en couches sphériques. Cette
approche microscopique donne actuellement des résultats encourageants, sinon satisfaisants. A cet
égard, il est plus judicieux de donner aux "phonons" de la matière nucléaire le nom de "plasmons",
tant les analogies mathématiques avec le traitement des oscillations des plasmas ou des électrons
des structures métalliques sont frappantes.

Zones de transition
La présentation schématique des modes collectifs rotationnels et vibrationnels ne doit pas laisser
supposer que la situation est toujours aussi claire. Il existe, bien entendu, dans la terminologie
collective, des états de rotation ou de vibration plus complexes et, de plus, des couplages éventuels
entre les trois modes intrinsèques, vibrationnels et rotationnels.

On conçoit, en outre, l'existence de zones de transition dans l'évolution de la zone rotationnelle à la


zone vibrationnelle. On y rencontre des noyaux qui, dans leurs états faiblement excités, sont du
type sphérique et vibrationnel et qui, pour des énergies d'excitation plus élevées, apparaissent
comme déformés. Bien entendu, plus on s'approche des nombres magiques, plus les états déformés
sont élevés. Alors que le noyau O 16 , par exemple, présente ces états pour des énergies supérieures
à 10 MeV, un noyau comme Os 190 manifeste de tels états à basse énergie. On donne, en général, à
ce dernier type de noyaux le nom ambigu de noyaux "mous" pour insister sur le fait qu'en termes
phénoménologiques on est amené, pour reproduire les états sphériques ou déformés, à utiliser des
potentiels moyens respectivement sphériques ou déformés.

L'étude des régions de transition confirme que l'on passe de façon continue de la zone
vibrationnelle à la zone rotationnelle. On constatera sur la figure ci-dessous que l'évolution peut en
effet être suivie de façon régulière.
Dans la mesure où la structure vibrationnelle est actuellement assez bien comprise en termes
microscopiques, une telle continuité encourage à tenter de décrire en ces mêmes termes les
structures rotationnelles. Ce dernier point fait partie des travaux modernes.
Interactions avec le noyau
Il serait incomplet de ne pas citer en terminant ce qu'apporte l'étude de l'interaction des particules
avec le noyau. Les deux aspects de la matière nucléaire, l'un collectif et l'autre à caractère
individuel, se manifestent là encore. A des énergies d'interaction peu élevées, l'aspect collectif s'est
tout d'abord révélé. Si l'on envoie des neutrons de basse énergie ( < 1 MeV) sur des noyaux, on
observe des résonances très fines (figure ci-dessous).

Ces résonances sont aussi bien observées en diffusion élastique que dans des processus au cours
desquels le neutron est absorbé et une autre particule émise (réactions nucléaires). Elles
apparaissent comme une section efficace (c'est-à-dire une probabilité de diffusion) élevée dans une
faible zone d'énergie, caractérisée par la largeur de résonance Γ . Le fait que les largeurs de
résonance soient très fines indique qu'il s'agit d'un processus lent par rapport à ce que l'on attendrait
dans une description en termes de particules indépendantes. Pour fixer les idées, les largeurs
observées ont des valeurs allant de l'électron-volt à quelques kiloélectrons-volts, ce qui correspond
à des temps de vie du système neutron-noyau donnés par la relation d'indétermination τ = h / Γ ,
soit de 10 −15 à 10 −18 s . Cela est à comparer au temps naturel des processus d'interaction forte, à
savoir 10 −23 s . A l'époque des observations des premières résonances, le modèle en couches n'avait
fait qu'une timide apparition peu convaincante. L'interprétation des phénomènes observés fut
donnée par l'hypothèse du noyau composé de N. Bohr. Dans cette hypothèse, une particule de basse
énergie, après pénétration dans un noyau cible A, subit un grand nombre de collisions avec les
nucléons de A, collisions au cours desquelles elle répartit son énergie au hasard. Pour qu'une
particule émerge de ce noyau composé, il faut attendre que, par le jeu des fluctuations statistiques,
l'énergie ainsi "diluée" se reconcentre sur un nucléon, par exemple. On conçoit que cela prenne un
certain temps, perceptible dans les largeurs de résonances en particulier. Dans une telle hypothèse,
après formation du noyau composé, le noyau perd la mémoire de sa formation, et sa désexcitation
se fait indépendamment du processus initial. C'est effectivement ce que l'expérience indique.

Une telle description semble a priori en contradiction avec une description en couches de la matière
nucléaire. Elle repose, en effet, sur le fait que les particules ont des libres parcours moyens faibles.

Or, l'observation d'une structure en couches réclame, en fait, un libre parcours moyen relativement
élevé, de façon à permettre aux nucléons dans le puits moyen d'avoir une structure de particules
indépendantes. Un tel libre parcours moyen peut être justifié dans la logique du modèle en couches.
En effet, dans une structure en couches, les nucléons "indépendants" occupent les états permis par
le principe de Pauli, de telle sorte qu'un neutron incident, par exemple, n'est pas capable d'interagir
à plein avec la structure : tous les états permis sont relativement bien remplis et l'intrus à bien de la
peine à trouver un processus d'interaction l'amenant dans un état inoccupé. Ainsi le libre parcours
moyen serait-il relativement faible dans une matière nucléaire non soumise au principe de Pauli. Il
serait considérablement accru par le jeu des processus interdits dès que ce principe est pris en
compte. Il convient de rappeler, cependant, que la surface de Fermi est diffuse et que, de ce fait, le
principe de Pauli joue moins pour les nucléons qui l'occupent. L'entrée dans une structure de noyau
composé pouvant se faire par leur intermédiaire, il est significatif à cet égard que les sections
efficaces de capture de neutrons à basse énergie varient fortement au voisinage des noyaux
magiques (figure ci-dessous).
Il n'en reste pas moins que l'hypothèse de Bohr est une façon économique de traiter les interactions
sous leurs aspects statistiques. Cependant, si elle reproduit dans cette zone d'énergie un nombre
impressionnant de résultats, elle s'avère irréaliste à plus haute énergie, où les remarques
précédentes sont mises en relief. En décrivant les processus à des énergies élevées, l'accent est mis
sur le caractère individuel des nucléons dans le noyau. On parle alors de processus d'interaction
directe. La figure ci-dessous illustre le résultat de telles interactions à l'aide d'une réaction
O 16 ( p,2 p )N 15 au cours de laquelle un proton de 460 MeV interagit avec les nucléons du noyau
O 16 .

Après l'interaction, deux protons sont détectés simultanément dans deux détecteurs distincts. Le
15
noyau N résiduel est identifié comme indiqué sur la figure. L'énergie de liaison du proton éjecté de
O 16 est en effet donnée par :
(15) E L = E0 − (E1 + E 2 ) − E R
où E 0 , E1 , E 2 , E R sont respectivement l'énergie incidente, l'énergie du proton 1 après interaction,
l'énergie du proton 2 après interaction et, enfin, l'énergie de recul de N 15 . L'analyse est très proche
de celle qu'on pouvait faire en supposant les protons libres, puisque cette énergie de liaison est très
faible devant l'énergie incidente. La distribution angulaire des deux protons après la réaction
renseigne sur la nature du proton arraché. En particulier, sur la figure précédente, le premier pic
peut être identifié comme correspondant au proton p 1 / 2 , le moins lié dans une structure en couches
de O 16 . Le second pic correspond au proton plus lié p 3 / 2 . On notera que c'est là une vérification
supplémentaire du modèle en couches. D'autres réactions relèvent d'une analyse comparable. C'est
le cas des réactions de transfert, notamment, au cours desquelles un ou plusieurs nucléons sont
( )
arrachés ou déposés dans la matière nucléaire. Par exemple, une réaction O16 d , He 3 N 15 donnerait
des renseignements analogues à ceux de la réaction (p, 2p) précédente. Dans ce cas, il s'agit d'une
réaction de transfert d'un proton, le deutérium incident arrachant un proton au noyau O 16 et
émergeant ainsi sous forme de particule He 3 .

Dans les analyses des réactions directes de ce type, il convient néanmoins de prendre en compte
qu'un certain nombre de degrés de liberté du système nucléaire peuvent être excités en même temps
que ceux aboutissant à la réaction étudiée. Tout d'abord, un grand nombre de réactions diverses
sont possibles à ces énergies (on dit que plusieurs voies sont ouvertes). L'onde incidente ne servant
pas exclusivement à exciter une réaction donnée, il y a lieu de tenir compte de son absorption dans
le milieu. D'autre part, une réaction d'un type donné peut avoir lieu à divers stades de l'interaction
du projectile avec le noyau. On utilise, pour tenir compte de l'ensemble de ces possibilités, un
modèle d'interaction calqué sur celui utilisé en optique pour décrire la diffusion de la lumière par un
milieu absorbant, caractérisé par un indice complexe, un procédé que nous avons déjà étudié. Dans
cette approche, les effets du potentiel nucléaire sont chiffrés en utilisant dans l'équation de
Schrödinger du système (particule incidente - noyau) le potentiel réel de Saxon-Woods, auquel on
ajoute une partie imaginaire de façon à rendre compte des phénomènes d'absorption liés aux
diverses voies ouvertes durant toute la durée de l'interaction. Par l'intermédiaire de ce modèle
optique, la liaison entre l'interaction directe et le noyau composé peut être entreprise.

Applications de la physique du noyau


La physique nucléaire mettant en jeu des énergies de l'ordre du mégaélectron-volt, nombreux sont
ceux qui croient que ses applications intéressent principalement les étoiles très chaudes. En fait, il
n'en est rien.

Bien entendu, ses applications les plus immédiates pour le théoricien portent sur l'astrophysique.
Ainsi, les réactions nucléaires et la fusion jouent un rôle primordial dans la nucléosynthèse des
éléments des galaxies. En outre, dans la théorie cosmologique la plus couramment admise du "big
bang", l'évolution initiale de la matière vers l'équilibre est régie par des processus nucléaires. Plus
récemment encore, la découverte des pulsars a redonné de la vigueur à la conception selon laquelle
il pouvait exister des étoiles formées essentiellement de neutrons possédant une densité comparable
à la densité nucléon ( ≅ 1014 g/cm 2 ). Bien plus, pour des densités plus élevées encore, précédant un
collapse gravitationnel, l'énergie de Fermi des neutrons formant ces étoiles de très faible rayon est
telle que, d'un point de vue thermodynamique, la matière d'une telle étoile a intérêt à se peupler de
nucléons dans leurs états excités. Cependant, si l'évolution des "étoiles" est une des applications
immédiates de la physique nucléaire, il ne faudrait pas en conclure que c'est la seule. Toujours dans
le domaine théorique, les méthodes de calcul développées pour les approches des théories
nucléaires se sont avérées applicables à de nombreux domaines de la physique. Mais il existe bien
d'autres applications dans le domaine technique. On a coutume d'insister sur les progrès que les
nécessités expérimentales, liées à la physique du noyau, ont fait accomplir à l'électronique rapide.
Plus généralement encore, on connaît les possibilités offertes par les centrales nucléaires et les
méfaits de la bombe atomique. Se limiter à cela serait bien naïf. Par exemple, l'existence des
moments magnétiques et quadrupolaires nucléaires est une sonde très sensible des propriétés
magnétiques et électroniques des solides. Dans la même ligne, les possibilités offertes par l'effet
Mössbauer ont été exploitées dans des domaines aussi variés que la relativité, la structure des
solides, l'étude des liaisons chimiques et la métallurgie. Dans le domaine biologique, on connaît
l'apport dû à l'emploi des éléments marqués. Une des applications récentes porte sur l'étude de la
perméabilité sélective des membranes. De façon générale, on utilise la radioactivité induite pour
mesurer les impuretés contenues dans des échantillons métallurgiques. Plus récemment,
l'identification des rayons X émis par les atomes au moment où ils sont traversés par des particules
lourdes a permis de détecter la présence d'éléments impondérables ( 10 −13 g ) dans des échantillons
pollués par les gaz d'échappement. Cette liste est naturellement non exhaustive, mais suffit à
montrer la variété des applications.

Ainsi, le noyau atomique n'a pas livré tous ses secrets. Certains physiciens considèrent qu'il est
possible de tenter de calculer l'interaction nucléaire à partir de ce que l'on sait dans le domaine des
particules fondamentales. Aura-t-on ainsi une solution aux problèmes spécifiques de la physique du
noyau ? Nul ne peut le dire. En tout cas, de longues étapes inconnues sont encore à parcourir et
elles apporteront, à n'en pas douter, leurs moissons de résultats nouveaux et imprévisibles.
I.4.4.3. Radioactivité
On appelle radioactivité la transformation spontanée d'un noyau atomique au cours de laquelle ce
dernier émet un rayonnement. L'observation des effets de ce rayonnement a conduit à la découverte
de la radioactivité et des radioéléments. On classe ainsi les éléments présents dans la nature en deux
catégories : ceux dont les noyaux ne subissent au cours du temps aucune transformation et ceux
dont les noyaux émettent un rayonnement à un moment de leur existence. Les premiers sont dits
éléments stables et les seconds éléments radioactifs ou radioéléments. Parmi les 92 éléments
naturels dénombrés, une douzaine sont radioactifs (on les appelle quelquefois radioéléments
naturels). Certains ont tous leurs isotopes radioactifs, par exemple le technétium (Z = 43) et le
prométhéum (Z = 61). D'autres n'en ont qu'un seul : c'est le cas du potassium (Z = 19), dont seul
l'isotope de nombre de masse A = 40 se transforme spontanément, les isotopes A = 39 et A = 41
sont stables. En fait, depuis 1934, on sait fabriquer des isotopes radioactifs de chaque élément
(appelés fréquemment radioéléments artificiels).

Il existe six modes de transformation spontanée (si l'on tient compte de l'émission gamma)
auxquels on peut ajouter la radioactivité par émission de protons observée plus récemment. Ces six
modes sont :
 L'émission α , transformation par laquelle un noyau émet une particule alpha, c'est-à-dire un
noyau d'hélium He24 constitué de deux protons et de deux neutrons (exemple :
226
Ra88 → Rn86222 + He24 ). Par émission alpha, l'élément Z se transforme en élément Z - 2. Le
nombre de nucléons passe de A à A - 4. L'émission alpha s'observe pour les éléments lourds (Z
147
> 82), mais on l'a aussi mise en évidence pour Sm62 et quelques isotopes dans cette même
région du tableau de Mendeleïev.
 L'émission β − , β + et la capture électronique. Ces trois modes de transformation sont
caractérisés par le fait que le numéro atomique Z du noyau radioactif change d'une unité sans
variation du nombre de masse A. Dans l'émission β − , (exemple : P1532 → S1632 + e − ), la
transformation s'accompagne de l'émission d'un électron négatif appelé β − en général aisément
détectable et d'un antineutrino ν dont la détection est très difficile. Le numéro atomique Z de
l'élément initial devient Z + 1 pour l'élément final. Dans l'émission β + , c'est un électron positif
β + ou positron et un neutrino ν qui sont émis, et Z devient Z - 1 (exemple :
Na1122 → Ne1022 + e + ). La capture électronique est un processus par lequel le noyau radioactif se
saisit d'un électron de son cortège en émettant un neutrino et par suite Z diminue d'une unité
(exemple : Ar1837 + e − → Cl1737 ). L'observation de cette transformation est plus délicate, puisque
le rayonnement d'origine nucléaire est très difficile à mettre en évidence. Elle peut être décelée
par l'examen du rayonnement X de réarrangement du cortège de l'atome final, puisqu'un
électron du cortège (en général, un électron K ou L déjà proche du noyau) a été absorbé et qu'il
existe une place vacante dans la couche correspondante.
 La fission spontanée. Pour les éléments très lourds (Z > 90), les noyaux ont une probabilité
mesurable de subir spontanément la fission, phénomène par lequel le noyau (Z, A) se scinde en
deux fragments sensiblement égaux (Z, A)  2(Z/2, A/2).
 L'émission γ . Elle correspond dans un noyau à la transition d'un état quantique à un autre avec
émission d'un photon.

L'habitude veut que l'on désigne par "nuclide" (ou nucléide) une espèce nucléaire déterminée,
caractérisée par un nombre Z de protons et par un nombre total de A nucléons.

Découvertes et lois générales

Historique
La radioactivité a été découverte en 1896 par H. Becquerel qui effectuait des recherches sur le
rayonnement X récemment mis en évidence par W.C. Röntgen. Becquerel, suivant une suggestion
de H. Poincaré, cherchait si les corps fluorescents émettaient un rayonnement susceptible
d'impressionner la plaque photographique à travers un papier noir. Divers auteurs avaient signalé
des résultats positifs avec le sulfure de zinc et le sulfure de calcium : malgré de nombreux travaux,
on ne put renouveler ces résultats. Becquerel fit ses expériences avec des sels d'uranium qu'il
exposait au soleil pour les rendre fluorescents. Les résultats furent positifs : mais, lorsque, par
manque de soleil, il laissa au voisinage d'une plaque photographique un sel d'uranium, il constat
que la plaque était tout de même impressionnée. Il admit que l'uranium émet des rayonnements
particuliers qu'on appela "rayons uraniques". Les expériences de Becquerel étaient surtout
qualitatives. Marie Curie, sur les conseils de Pierre Curie, entreprit des mesures quantitatives en se
référant à l'ionisation produite dans l'air par ces rayonnements (Pierre Curie utilisait la piézo-
électricité du quartz qu'il venait de découvrir avec son frère Jacques pour mesurer les très faibles
courants d'ionisation). Marie Curie put ainsi montrer, en même temps que G. Schmidt en
Allemagne, que le thorium émettait aussi des rayonnements. Dès juillet 1898, avec Pierre Curie,
elle annonçait la présence d'un nouvel élément, le polonium (Z = 84); puis en décembre 1898, avec
P. Curie et G. Bémont, l'existence du radium (Z = 88). Elle proposa le nom de "radioactivité" pour
désigner le phénomène. De très nombreuses expériences furent entreprises pour déterminer les lois
de la radioactivité et découvrir de nouveaux éléments. On put caractériser très vites les
rayonnements α , β − et γ (notamment, travaux de E. Rutherford en 1899). Mais il fallut attendre
1934 pour que Irène et Frédéric Joliot-Curie mettent en évidence la radioactivité artificielle en
montrant que certains éléments légers, par exemple l'aluminium, après transmutation par des
particules alpha, sont radioactifs et émettent des positrons. Leurs expériences conduisirent
simultanément à la découverte de la radioactivité artificielle et à celle d'un nouveau mode de
désintégration : l'émission β + . Ils produisaient du P1530 par la réaction :
(1) Al1327 + He24 → P1530 + n
suivie de :
(2) P1530 → Si1430 + β +

En 1937, Luis Alvarez caractérise la capture électronique sur le V2348 en observant les rayons K α du
titane (Z = 22), et ce n'est qu'après 1940 qu'on a pu mettre en évidence la fission spontanée. Un
même nuclide peut se désintégrer suivant plusieurs modes. Ainsi, le Cu 29 64
est émetteur β + , β − et
64 64 64
donne soit Ni28 , soit Zn30 . Il peut aussi se transformer par capture électronique pour donner Ni28 .
Bi83212 est émetteur α et β − et se transforme soit en Tl81208 , soit en Po84212 .

Le noyau radioactif, après sa transformation, conduit soit à un noyau stable, soit à un autre noyau
radioactif qui se transformera à son tour. La substance produite est souvent appelée "substance
fille" et l'élément initial "substance mère". On observe ainsi plusieurs éléments radioactifs
successifs qui constituent une famille radioactive. Les années qui suivirent la découverte de la
radioactivité permirent de mettre en évidence que les radioéléments naturels étaient pour l'essentiel
répartis en trois familles dont le nom correspondait au premier élément de chacune d'elles : U 92238 ,
Th90232 et U 92235 ou actino-uranium. Les figures ci-dessous en montre des filiations successives.
Le nombre de masse A des isotopes des divers éléments d'une même famille ne varie que par quatre
unités chaque fois qu'il y a un nuclide émetteur alpha, les transformations bêta étant isobariques.
Ainsi, tous les membres de la famille du thorium dont le premier élément est Th90232 (A = 232 est un
multiple de 4) ont des nombres de masse multiples de 4 et cette famille est caractérisée quelquefois
par cette propriété et dénommée A = 4n.

A la suite de la radioactivité artificielle et surtout de la fission, des filiations successives peuvent


être observées fréquemment conduisant aussi à de véritables familles. Par exemple :
(stable)
β − β − β β− −
140
(3) Xe54 → 40
Cs 55 → 40
Ba56 → 40
La 57 → 140
Ce58

Lois de la radioactivité
La loi de la décroissance radioactive a été explicitée pour la première fois par Rutherford et Soddy
en 1902. On peut l'énoncer ainsi : la probabilité pour qu'un atome radioactif se transforme durant un
intervalle de temps dt est λ dt , la quantité λ , appelée constante radioactive, étant caractéristique du
nuclide considéré et pouvant donc servir à l'identifier. λ ne dépend pas de "l'âge" de l'atome, c'est-
à-dire du temps qui le sépare de l'instant de sa formation ("les atomes ne vieillissent pas").
Caractéristique nucléaire, elle ne dépend pas des combinaisons chimiques ou des conditions
physiques de l'élément (en fait, il ne s'agit là que d'une première approximation, car, d'une part, les
interactions noyau - cortège électronique modifient légèrement λ , dans certains cas, et d'autre part,
les conditions physiques réalisables en laboratoire ne correspondent qu'à un très petit éventail de
températures et de pressions).

Si l'on dispose de N atomes d'un nuclide à l'instant t, le nombre dN d'atomes qui se désintègrent
entre l'instant t et t + dt est donc :
(4) dN = −λ Ndt

L'intégration donne N = N 0 e − λ t , où N 0 est le nombre d'atomes à l'instant t = 0. La loi de


décroissance radioactive est une pure loi statistique. Lorsqu'un nuclide peut se transformer suivant
plusieurs modes, la constante λ est la somme des probabilités des divers modes :
(5) λ = λ1 + λ 2 + λ3 + L
où les λi sont appelées constantes partielles de désintégration.

A partir de λ , on définit la période et la vie moyenne du nuclide. La période est le temps T au bout
duquel, sur un ensemble initial de N 0 atomes, la moitié de ce nombre est transformée ( N 0 étant
très grand devant l'unité). On a donc :
N0 −λ t
= N0
(6) 2
ln 2 0.693
T= =
λ λ

La vie moyenne est la durée de vie moyenne des atomes radioactifs :


1 ∞ 1
(7) τ = ∫ tNλ dt =
N0 0 λ

Entre période et vie moyenne existe donc la relation :


(8) T = τ ln 2 = 0.693τ

Dans la pratique, c'est la notion de période qui est la plus utilisée. Les périodes varient d'un nuclide
à l'autre dans de larges limites, d'une très faible fraction de seconde ( 10 −6 s ou même 10 −12 s dans
le cas de l'émission gamma) à plus de 1010 ans. Ces périodes ont été indiquées dans les familles ci-
dessus.

On appelle "activité" d'une substance à l'instant t la quantité λ N , où N est le nombre d'atomes


présents à cet instant. Pour des substances ayant des poids atomiques peu différents, c'est donc
surtout λ qui détermine cette activité pour un poids de substance donné. D'après dN = −λ Ndt ,
l'activité est le nombre de désintégrations par unité de temps. On a défini l'unité de radioactivité
qu'on appelle le becquerel (Bq) qui correspond à une quantité de radioélément donnant une
désintégration par seconde. Cette unité remplace le curie (Ci) qui était utilisé jusqu'en février 1982
et qui correspondait à une quantité de radioélément produisant 3.7 × 1010 désintégrations par
seconde (1 curie de radium 226 étant très sensiblement équivalent à 1 gramme). Le curie est encore
souvent utilisé.

Accumulation des produits en filiation. Equilibre radioactif


Lorsqu'une substance mère A donne naissance à une substance fille B, on a :
(9) A → B → C (stable)

Si λ A et λ B sont les constantes radioactives des nuclides A et B, supposons que, à l'instant initial,
on ait A = A0 atomes du nuclide A et aucun atome de B, soit B0 = 0 . A l'instant t, appelons A et B
le nombre d'atomes des nuclides A et B. A cet instant, la variation du nombre d'atomes B est
donnée par :
dB
(10) = Aλ A − Bλ B
dt
où Aλ A est le nombre d'atomes A qui se transforment en B et où − Bλ B est le nombre d'atomes B
qui disparaissent. L'intégration de cette équation conduit à :
(11) B = A0
λA
λB − λ A
(e − λ At
−e
−λ Bt
)
qui fixe l'évolution en fonction du temps du produit B. La quantité B passe par un maximum au
temps t m lorsqu'on a :
dB
(12) =0
dt

On trouve :
λ 
ln B 
λ
(13) t m =  A 
λB − λ A

Au temps t m , les activités de A et B sont égales : à cet instant il y a équilibre radioactif. Si λ A < λ B
et si t est suffisament grand, le rapport d'activité de A et de B :
Bλ B − TA
(14) =
Aλ A TB − T A
devient constant : c'est l'équilibre de régime ( T A et TB sont les périodes relatives aux deux
substances). Il est possible de généraliser ces considérations à n corps en filiations (équations de
Bateman).

Emission alpha
Energétiquement, un noyau est émetteur alpha par transformation spontanée si sa masse est
supérieure à la somme des masses du noyau final et de la particule alpha. Pour effectuer ce bilan
énergétique, on considère que l'on extrait simultanément deux protons et deux neutrons du noyau
qui se condensent en un noyau d'hélium. Lorsque l'énergie de condensation de ces quatre particules
est supérieure à l'énergie nécessaire à leur extraction, l'émission alpha est énergétiquement possible.
Cette condition est remplie pour un nombre de masse supérieur ou égal à 140. En fait, sauf pour
147 152
quelque très rares exceptions (par exemple, Sm62 , Gd 64 , Hf 72174 ), on n'observe l'émission alpha
que pour A > 208 : ce fait est dû à ce que l'énergie disponible pour A < 208 est trop faible et
conduit à une constante radioactive trop longue pour être observable. Vers A = 208, une
discontinuité se produit dans l'énergie des alpha. Cette brusque augmentation provient de la
formation de l'ensemble saturé : 82 protons et 126 neutrons. En toute rigueur, l'énergie disponible E
n'est pas strictement l'énergie Eα emportée par la particule alpha. L'émission alpha provoque un
recul du noyau (conservation de la quantité de mouvement) et E = Eα + E R avec
Eα = EM / (M + m ) et E R = Em / (M + m ) où M représente la masse du noyau final et m la masse
de la particule alpha. L'énergie des particules alpha émises se situe pour les divers nuclides entre 5
et 9 MeV approximativement.

Structure fine et long parcours


Le noyau initial étant supposé dans son état fondamental, si l'émission alpha conduit au noyau final
dans son état fondamental, les particules émises doivent toutes avoir la même énergie. L'expérience
a confirmé cette manière de voir (c'est le cas du Po84210 à une très bonne approximation). L'énergie
des particules alpha est mesurable avec une précision supérieure au dix-millième à l'aide d'un
spectrographe magnétique. Les spectrographes les plus utilisés sont les spectrographes semi-
circulaires où les particules de même énergie sont focalisées après avoir parcouru une demi-
circonférence, et l'image d'une source apparaît comme une raie sur le plan focal. S. Rosenblum a
découvert en 1929, que certains nuclides, au lieu d'une seule raie, donnaient une série de raies
d'énergies voisines. Ce phénomène, appelé "structure fine", s'interprète par le fait que le noyau final
peut se trouve dans divers états excités (figure ci-dessous).

L'étude de la structure fine est une excellente méthode de détermination directe des états excités.
Dans le phénomène de long parcours, le noyau initial se trouve lui-même dans un état excité et peut
se transformer par émission alpha avant d'avoir atteint le niveau fondamental. L'énergie des
particules alpha émises est alors plus grande que l'énergie des particules alpha entre états
fondamentaux. Ce phénomène est beaucoup plus rare que celui de structure fine, puisque la vie
moyenne d'un noyau dans un état excité est en général faible et que la probabilité d'émission de
photons est beaucoup plus grande que la probabilité d'émission de particule alpha.
Théorie de l'émission alpha
Un noyau émetteur possède une certaine stabilité (vie moyenne >> 10 −20 s ) en raison de l'existence
d'une barrière de potentiel. Un mécanisme que nous avons déjà vu. La figure ci-dessous représente
la variation de l'énergie potentielle entre une particule alpha et un noyau de charge Z en fonction de
la distance qui les sépare.

A grande distance (r >> R, rayon du noyau), la particule alpha est soumise au potentiel coulombien
répulsif. A la distance R, elle est en contact avec le noyau et l'attraction des forces nucléaires
devient plus importante que la répulsion coulombienne. A l'intérieur du noyau, la particule alpha a
l'énergie E. La hauteur de la barrière de potentiel (valeur de l'énergie coulombienne répulsive entre
le noyau et la particule alpha lorsque cette dernière est à la surface du noyau) est évaluée par
l'expression B = 2 Ze 2 / 4πε 0 R , où Z est le numéro atomique du noyau final. Si l'on suppose que le
moment angulaire de la particule alpha par rapport au noyau est nul, B est de l'ordre de 30 MeV
pour les noyaux lourds. La mécanique quantique fournit l'explication du fait que la particule alpha
possède une certaine probabilité par unité de temps de traverser cette barrière.
Si l'on suppose que la particule alpha est préformée dans le noyau et qu'elle a une vitesse vα , le
temps moyen qui sépare deux impacts successifs est de l'ordre de τ α = 2 R / vα et la probabilité par
l'unité de temps d'émission de la particule alpha est λ = (1 / τ α )T0 où T0 est le coefficient de
transmission de la barrière. Le calcul de T0 , assez complexe, ne présente pas de difficulté de
principe :
B − E − 2γ
T0 = 4 e
U+E
(15) −1
4πZe 2  E  E 
γ = cos 1 −  
hvα  B  B  
où B est la hauteur de la barrière, U la valeur du puits de potentiel dans le noyau et Z le numéro
atomique du noyau.

Si la barrière n'intervenait pas ( T0 = 1 ), la vie moyenne des émetteurs alpha serait de l'ordre de
τ α = 10 −19 s . On constate que T0 dépend essentiellement du rapport E / B. Pour les noyaux lourds,
une variation de 1 MeV de l'énergie E produit une variation de la vie moyenne égale à 10 5 fois
environ sa valeur. De même, une augmentation de 10% du rayon du noyau, qui conduit à une
valeur plus faible de B, multiplie λ par un facteur d'environ 150. La "transparence" de la barrière
de potentiel est l'élément fondamental qui détermine les énormes variations de période d'un nuclide
à un autre.
Eα (MeV) Période (s) 1 / τ α (1019 s −1 )
144
Nd 60 1.90 1.58 × 10 23 0.202
Hf 72174 2.50 9.5 × 10 22 1.34
Po84212 8.78 3.04 × 10 −7 1.73
Ra 224
88
5.68 3.15 × 10 5 3.52
254
Fm100 7.20 1.15 × 10 4 1.23
Alors que les énergies des particules alpha émises varient d'un facteur 4, le facteur 1 / τ α varie d'un
facteur 40 et les périodes d'un facteur 10 30 . Les expressions ci-dessus permettent d'obtenir les
relations correctes entre les divers paramètres : énergie, période, rayon du noyau, etc., et
remplacent une relation empirique établie en 1911 par Geiger et Nuttal.

Lorsque le moment angulaire de la particule alpha par rapport au noyau n'est pas nul ( l ≠ 0 ),
l'expression donnant la hauteur de la barrière de potentiel contient un terme de la forme :
h 2 l (l + 1)
(16)
2mr 2
où r est la distance de la particule alpha au noyau et il faut en tenir compte dans les calculs précis
qui interviennent lorsqu'on cherche à comparer l'intensité mesurée des raies de structure fine avec
la théorie. Cette théorie est d'autre part fondée sur l'hypothèse que la particule alpha est préformée à
l'intérieur du noyau, ce qui est probablement inexact. L'expérience montre en effet que les
probabilités sont souvent plus faibles que celles qu'on peut calculer. On rend compte de cela en
introduisant un facteur d'interdiction, dont l'explication n'est pas encore bien comprise et qui fait
l'objet de recherche.

Fission spontanée
On appelle fission spontanée le processus par lequel un noyau de nombre de masse A et de charge
Z se scinde en deux fragments approximativement égaux. Energétiquement, le processus est
possible, le bilan énergétique étant de l'ordre de 200 MeV. Pour un noyau de nombre de masse A
égal à 240 par exemple, l'énergie moyenne de liaison par nucléon est de 7.6 MeV. S'il se transforme
en deux noyaux de masse A1 = 100 et A2 = 140 , pour lesquelles les énergies moyennes de liaison
sont 8.6 et 8.4 MeV respectivement, l'énergie libérée est :
(17) (100 × 8.6 + 140 × 8.4) − 240 × 7.6 ≅ 210 MeV

On obtient plus d'informations en utilisant une formule donnant la masse exacte des noyaux. Dans
le cas où le noyau (A, Z) se partage en deux noyaux identiques (A/2, Z/2), l'énergie libérée est
donnée par :
(18) Q = M ( A, Z ) − 2 M ( A / 2, Z / 2 )
où M ( A, Z ) est la masse du noyau (A, Z), d'où

( ) Z2  1  Z2
(19) Q = a s A 1 − 2 + ac 1 / 3 1 − 2 / 3  = −0.26a s A + 0.37 a c 1 / 3
2/3 1/ 3

A  2 
2/3

A
pour A ≅ 240 et Q ≅ 170 Me V (pour les paramètres a s et a c , voir la section sur le noyau
atomique). Cette énergie provient de la variation de deux termes : augmentation de l'énergie de
surface ( ≅ 130 MeV ) et diminution de l'énergie coulombienne ( ≅ 300 MeV ). Comme pour
l'émission alpha, qui est aussi un mode de partition du noyau en deux fragments très inégaux, c'est
un effet de barrière de potentiel qui maintient le noyau (A, Z) en équilibre. La figure ci-dessous
représente les variations de l'énergie mutuelle de deux fragments identiques en fonction de leur
distance, R ′ étant le rayon d'un fragment.

On calcule aisément la hauteur de la barrière coulombienne B à la distance 2R' lorsque les deux
fragments sont en contacts. En réalité, la barrière effective est moins haute en raison de
l'intervention des forces nucléaires et a une valeur E H . On peut connaître la différence (E H − Q )
en apportant au noyau l'énergie nécessaire pour provoquer la fission : cette énergie est de l'ordre de
quelques méga-électrons-volts pour les noyaux lourds.

Les périodes partielles de fission spontanée sont de l'ordre de 1016 ans pour les nuclides tels que
l'uranium et le thorium (figure ci-dessous).
Elles décroissent rapidement en fonction de la valeur de Z 2 / A , rapport appelé souvent paramètre
de fission.

L'extrapolation de la droite de cette figure conduit à un ordre de grandeur de la limite de stabilité


des noyaux. En effet, pour les noyaux de plus en plus lourds que l'on cherche à produire
artificiellement, le paramètre de fission croît et la différence (Q - B) décroît. Diverses estimations
conduisent à penser que, pour Z 2 / A ≥ 44 , un noyau est instable vis-à-vis de la fission spontanée
(période ≅ 10 −20 s ). En fait, dans cette théorie, on n'a pas tenu compte des effets de structure
nucléaire qui peuvent conduire à modifier cette limite. En particulier, on s'attend à avoir une légère
amélioration de la stabilité pour les nombres magiques des nucléons. Les noyaux les plus lourds
récemment créés semblent aller dans ce sens mais les mesures sont délicates car seuls quelques
noyaux sont produits lors d'expériences longues et délicates. Au-delà d'une certaine limite, quelle
que soit l'amélioration de la stabilité, on se situe dans une zone où les noyaux sont tous fortement
instables et les rêves quelque peu illusoires de trouver des atomes hyper lourds stables se sont
évaporés depuis longtemps.

Emission bêta
Les noyaux sont capables d'émettre des particules chargées négativement qui ont été identifiées
comme des électrons, par leur rapport e/m en particulier. Deux autres types de radioactivité bêta
sont connus : l'émission de positrons et la capture d'un électron orbital. Les transformations sont
isobariques et seul le numéro atomique du noyau change d'une unité. L'énergie de l'électron émis
n'ayant pas une seule valeur possible, mais un spectre continu de valeurs jusqu'à une valeur
maximale, la question d'une non-conservation de l'énergie dans le processus d'émission bêta s'est
posée initialement. L'hypothèse, puis la découverte d'une particule neutre appelée neutrino ("petit
neutre"), émise en même temps que l'électron, ont montré que l'énergie est effectivement conservée
lors de la désintégration bêta. On peut donc représenter le processus d'émission bêta par le schéma
suivant :
Z A → (Z + 1) + e − + ν émission d' un électron
A

(20) Z A → (Z − 1) + e + + ν
A
émission d' un positron
Z A + e − → (Z − 1) + ν
A
capture électronique
où les symboles ν et ν représentent respectivement le neutrino et l'antineutrino. Il y a émission β
lorsque la somme des masses des éléments du premier membre est supérieure à celle qui est relative
au second membre. Les noyaux sont composés uniquement de protons et de neutrons et les
particules β et les neutrinos ne sont créés qu'au moment de l'émission. Cela indique que l'émission
β doit être traitée comme un processus radiatif. Fermi a formulé une théorie analogue à celle de
l'interaction électromagnétique. Les périodes de radioactivité β sont longues par rapport aux
périodes correspondant à l'émission γ , ce qui signifie que l'interaction β est relativement faible.

Lois de conservation dans l'émission bêta


Le neutrino émis en même temps que l'électron a des caractéristiques telles que les lois de
conservation de la charge, de l'énergie et du moment cinétique sont vérifiées dans l'émission β . En
effet, le neutrino n'est pas chargé et emporte l'énergie et le moment angulaire complémentaire de
ceux de l'électron. Enfin, particule de spin 1/2, il obéit à la statistique de Fermi-Dirac, en accord
avec le principe de conservation de statistique : les deux isobares contenant le même nombre de
nucléons (fermions) obéissent à la même sorte de statistique et, puisque la particule β est un
fermion, le neutrino doit en être un aussi.

Yang et Lee ont suggéré que la parité peut ne pas être conservée dans les interactions faibles, c'est-
à-dire que l'image dans un miroir de la situation expérimentale ne correspond pas à une situation
expérimentale identique. Cette hypothèse a été vérifiée par plusieurs expériences : en particulier,
Wu et ses collaborateurs, en mesurant la distribution angulaire d'électrons provenant de
désintégrations β de noyaux de Co 60 polarisés, ont trouvé une dissymétrie pour les angles θ et
π − θ . De plus, on a mis en évidence le fait que les électrons issus d'une source non polarisée
possèdent une polarisation longitudinale : les électrons sont en prédominance dans un état de spin
antiparallèle à la direction du mouvement, et les positrons sont en prédominance dans un état de
spin parallèle à cette direction. Ces résultats montrent que l'invariance demeure, à condition que
l'image dans un miroir d'une particule soit son antiparticule (combinaison CP).
Divers types de transition bêta
La paire électron - neutrino possède un moment angulaire de la forme L+S, où L = l e + lν est le
moment orbital total et où S = S e + Sν est le moment intrinsèque total. Chaque fois que l e ou lν >
0 est nécessaire pour assurer la conservation du moment angulaire, le processus est retardé par les
effets centrifuges.

Une particule de moment angulaire l doit être créée à une distance moyenne r du noyau de l'ordre
de lh / p = lD , relation où p représente la quantité de mouvement et D = λ / 2π la longueur d'onde
associée à la particule.

Il est difficile pour une source confinée dans une sphère de rayon R, d'exciter une onde avec
l > R/D .

L'intensité excitée doit ainsi diminuer d'un facteur de l'ordre de (R / D ) pour chaque unité de
2

moment angulaire. Expérimentalement, les transitions les plus rapides correspondent en effet à une
variation ∆I du moment angulaire du noyau inférieure ou égale à 1 ( ∆I ≤ 1 ), et les transitions avec
∆I > 1 sont retardées par rapport aux premières. En effet, ∆I > 1 nécessite l e ou lν ≠ 0 , mais
∆I = 1 peut correspondre à L = 0 et S = 1. Les transitions sont classées en "permises" et
"interdites". Les dernières transitions sont retardées soit par une valeur L > 0, soit par un
changement de parité des états nucléaires initial et final.

Les règles de sélection pour les transitions permises sont :


0
∆I = I i − I f = 
(21) 1
π i /π f = 1

Les transitions permises sont enfin classées en composantes singulet et triplet pour lesquelles les
spins des leptons sont respectivement antiparallèles (S = 0) et parallèles (S = 1).
L'état singulet permis n'est donc seulement formé que lorsque ∆I = 0 , avec I f = I i (règle de
sélection de Fermi). L'état triplet correspond à ∆I = 0 ou 1, c'est-à-dire I f = I i ou I f = I i ± 1
(règle de sélection de Gamov-Teller).

Dans le cas des transitions permises, le spectre de l'énergie de l'électron émis est dit "à forme
statistique". En effet, à part la distorsion coulombienne introduite par un facteur F(Z), la
dépendance en énergie provient de la proportionnalité à l'espace des phases disponible :
(22) p 2 dpq 2 dq
où p et q représentent les quantités de mouvement de l'électron et du neutrino émis. Pour vérifier
cette dépendance, on construit des diagrammes de Kurie qui représentent la quantité
[N ±
(W ) / pWF ]1 / 2
en fonction de l'énergie W. Dans cette expression, N ± est le nombre d'électrons
ou de positrons dont l'énergie se situe dans une bande centrée sur W. La théorie prévoit que c'est
une droite coupant l'axe des abscisses à l'énergie maximale W0 . Expérimentalement, on constate
toujours un excès d'électrons pour les basses énergies à cause de la diffusion et de l'absorption des
β dans les matériaux entourant la source et dans la source elle-même. En corrigeant le spectre de
l'ensemble de détection par des électrons mono-énergétiques de diverses énergies, on obtient
effectivement des droites jusqu'à une très basse énergie (figure ci-dessous).
Capture électronique
Au cours du processus de capture électronique, un électron atomique interagit avec un proton pour
former un neutron et un neutrino. Le neutrino reçoit toute l'énergie libérée dans la transition, mis à
part la petite énergie de recul du noyau. Il est pratiquement impossible de détecter le neutrino, et la
capture électronique n'est mise généralement en évidence que par les effets atomiques (émission de
rayons X, d'électrons Auger, c'est-à-dire l'éjection d'électrons périphériques peu liés suite à un
cascade d'électrons changeant de niveaux pour occuper la place laissée libre, l'électron éjecté
emportant l'excès d'énergie) qui suivent la création d'un trou dans la couche K ou L.

La théorie de capture électronique est semblable à celle de l'émission bêta.


Emission gamma et conversion interne

Description de l'émission gamma


Les noyaux possèdent des états excités caractérisés en particulier par leur énergie, leur moment
angulaire et leur parité. Les noyaux dans un état d'excitation élevée perdent leur énergie
généralement par l'émission d'une particule lourde (neutron, proton, particule alpha, etc.). Au-
dessous de l'énergie de séparation de la particule la moins liée, la désexcitation est de type
électromagnétique : émission de rayonnement gamma ou conversion interne.

Dans un processus de désexcitation électromagnétique Kurie, le noyau retombe dans un état moins
excité ou dans son états fondamental. Le phénomène est analogue à l'émission de lumière par des
atomes excités que nous étudierons en profondeur plus loin, mais les énergies des quanta
électromagnétiques émis par les noyaux sont dix mille à un million de fois plus grandes que celles
d'un photon dans le visible.

Une description complète de l'émission d'un rayonnement électromagnétique par un système


quantique fait nécessairement appel à la théorie quantique du rayonnement. Prenons un peu
d'avance pour décrire le cas du noyau. Les rayonnements sont classés d'après le moment angulaire l
transporté par chaque quantum. Pour un l donné, il y a deux types possibles de rayonnement :
électrique 2 l polaire ( El ), et magnétique 2 l polaire ( M l ), suivant que la parité du vecteur champ
magnétique est (− 1) ou (− 1) . Classiquement, les rayonnements El et M l sont émis par un
l l +1

multipôle d'ordre l électrique ou magnétique.

La conservation du moment angulaire et de la parité pour le système du noyau et des rayonnements


impose des règles de sélection pour les transitions possibles entre deux états ( J i , π i ) et (J f , π f ) :
Ji − J f ≤ l ≤ Ji + J f
(23)  (− 1)l
π i /π f = 
[− 1]
l −1

respectivement pour un rayonnement El et pour un rayonnement M l .


La détermination des énergies et des multipolarités des rayonnements émis par un noyau dans un
état excité permet d'établir le schéma de niveaux du noyau. De plus, les probabilités de transition
gamma dépendent de façon très sensible des fonctions d'onde des états et peuvent ainsi servir à
vérifier la validité des modèles nucléaires.

Conversion interne
La probabilité de transition pour un proton entre un état initial i et un état final f se calcule, en
mécanique quantique, par la théorie des perturbations. On obtient la relation :
2π 2
dN
(24) Ti → f = f Hˆ i
h dE
où Ĥ représente l'interaction de perturbation, où f Hˆ i est l'élément de matrice de cette
interaction pris entre les fonctions d'onde des états initial et final et où la densité d'états finaux par
unité d'énergie s'exprime par dN/dE.

Au premier ordre, l'hamiltonien d'interaction est :


e pˆ ⋅ A + A ⋅ pˆ eh
(25) Hˆ (A ) = − −µp σ ⋅H
mc 2 2mc
où σ est le vecteur de spin, p̂ l'opérateur de quantité de mouvement de valeur ih∇ , A le potentiel
vecteur et H le champ magnétique.

Les règles de sélection proviennent des conditions nécessaires pour que les éléments de matrice ne
s'annulent pas. Outre (23), il faut ajouter
(26) m =m i − m f

Une transition entre deux états de moments angulaires donnés peut se faire en principe par émission
de tous les rayonnements de multipolarités permises. En réalité, elle se fait essentiellement par le
multipôle le plus bas, qui est aussi le plus probable. Des modèles nucléaires plus élaborés prédisent
un mélange des multipôles les plus bas.
Changement Changement de moment angulaire
de parité 0 ou 1 2 3 4 5
Non M1 (E2) E2 (M3) M3 (E4) E4 (M5) M5 (E6)
Oui E1 (M2) M2 (E3) E3 (M4) M4 (E5) E5 (M6)

La probabilité de transition totale est obtenue en faisant la somme des probabilités pour tous les
sous-états m de l'état final f et en prenant la moyenne correspondant à tous les sous-états m de l'état
initial i.

Si l'on considère que les protons se déplacent dans un potentiel central, chacune de leurs fonctions
d'onde peut s'écrire comme le produit d'une fonction d'onde radiale qui dépend du potentiel et d'une
fonction d'onde qui dépend des angles et des spins. En supposant que la fonction d'onde radiale est
constante dans le noyau et nulle à l'extérieur du noyau, on obtient les estimations indiquées dans la
figure ci-dessous, pour les périodes de désexcitation par transition d'un proton.
Les résultats pour les transitions d'un seul neutron sont différents de ceux qui apparaissent sur la
figure ci-dessus, et en particulier la probabilité de transition électrique est très réduite, puisque le
neutron n'est pas chargé. Elle n'est cependant pas nulle à cause du mouvement orbital du reste du
noyau autour du centre de gravité de tout le noyau.

Expérimentalement, on ne trouve pas de différence systématique entre transitions de neutron et de


proton. D'autre part, les écarts avec la théorie atteignent plusieurs ordres de grandeur. Cela indique
que les états excités des noyaux ne peuvent être bien décrits en termes de pures excitations de
particules indépendantes. Les théoriciens ont encore du travail devant eux.

Conversion interne
La conversion interne est le processus par lequel l'énergie d'excitation du noyau, au lieu d'être
émise sous forme de photons, est transférée directement à un électron du cortège K, L, M, etc. Elle
est toujours en compétition avec l'émission gamma. L'énergie et le moment angulaire disponibles
sont transférés à l'électron qui est émis avec une énergie cinétique E c = Eγ − B , si l'on désigne par
B l'énergie de liaison dans la couche K, L, M, etc.

Le rapport de la probabilité de transition par conversion interne à la probabilité de transition par


émission gamma s'appelle coefficient de conversion interne α , avec α = α K + α L + α M + L , étant
donné que α K , α L , α M , etc. sont les coefficients de conversion dans les couches K, L, M, etc. Les
électrons émis sont mono-énergétiques et apparaissent sous forme de raies dans un spectrographe
(figure ci-dessous).
Ces raies permettent une mesure précise de l'énergie des transitions et constituent l'un des outils
essentiels de la spectroscopie nucléaire.

Dans le processus de conversion interne, l'état initial consiste en un noyau ayant une certaine
énergie d'excitation et en un électron dans son état fondamental. L'état final comporte un noyau
ayant perdu son énergie d'excitation et un électron dans le continuum. Le mécanisme met en jeu
deux états intermédiaires pour lequel une seulement des deux particules a fait sa transition vers
l'état final. Des calculs de coefficient de conversion ont été fait par plusieurs auteurs (figure ci-
dessous).
Les fonctions d'onde nucléaires qui interviennent dans la conversion interne sont les mêmes que
dans l'émission gamma, et les coefficients de conversion ne dépendent que de l'énergie de la
transition, du numéro atomique de l'émetteur, de la couche ou sous-couche d'où est éjecté l'électron,
de la multipolarité du rayonnement gamma en compétition et du caractère électrique ou magnétique
de la transition nucléaires.

Le fait qu'à une très bonne approximation près les coefficients de conversion ne dépendent pas de la
structure nucléaire permet souvent de déterminer la nature et la multipolarité de la transition par
une mesure du coefficient de conversion.

Une autre méthode consiste à mesurer la distribution angulaire pour les noyaux alignés ou les
corrélations angulaires entre rayonnements successifs.

Emission d'un nucléon


Les émissions de particules lourdes (particules alpha, protons, neutrons) se produisent lorsque les
noyaux sont très lourds, lorsqu'ils sont très riches ou très pauvres en neutrons ou lorsqu'ils sont très
excités. L'énergie de liaison du dernier nucléon devient négative au-delà d'un certain nombre de
neutrons et les noyaux correspondants ne peuvent exister. En revanche, il arrive que l'émission bêta
d'un noyau instable conduise à un état excité du noyau fils tel que l'énergie d'excitation soit
supérieure à l'énergie de liaison du dernier neutron qui est alors émis immédiatement. La
désintégration a la période de l'émission bêta et le phénomène apparaît comme l'émission d'un
neutron retardé, d'où l'expression de radioactivité par neutron différé.

L'émission d'un proton par un noyau pauvre en neutrons est possible si l'énergie de liaison du
dernier proton est négative. Elle présente une certaine analogie avec l'émission alpha. En
particulier, elle est retardée par la barrière centrifuge et la barrière coulombienne. L'émission d'un
proton peut aussi avoir lieu à partir d'un état excité atteint par désintégration bêta, et, si les
conditions énergétiques sont satisfaites, elle suit alors la période de l'émission bêta.

Les études sur la radioactivité ont, pour une très grand part, contribué à la connaissance de la
structure des noyaux atomiques. Elles servent en particulier à préciser l'organisation et l'interaction
des nucléons dans la matière nucléaire. De plus, on sait qu'il existe quatre cent cinquante nuclides
stables, auxquels il faut ajoute plus de mille huit cent nuclides radioactifs connus en 1982. Les
prévisions sur la stabilité permettent d'envisager l'existence de deux mille nuclides encore inconnus.
Radioactivité dans la nature
La radioactivité naturelle est essentiellement due à des radionuclides de très longue période, de
l'ordre de l'âge de la Terre (4.6 milliards d'années), sinon ils auraient déjà disparu, ainsi qu'à leurs
descendants radioactifs, qui peuvent exister avec des périodes plus courtes puisqu'ils sont
constamment renouvelés.

Il faut citer essentiellement les trois familles de l'uranium 238 (4.5 milliards d'années), de l'uranium
235 (710 millions d'années) et du thorium 232 (14 milliards d'années), ainsi que l'isotope 40 du
potassium (1.3 milliard d'années, 0.012 % du potassium naturel), émetteur bêta moins, sans
descendant radioactif. Incidemment, la faiblesse relative de l'uranium 235 explique sa faible
concentration (0.7 %) dans l'uranium naturel, qui, pour la majorité des réacteurs actuellement en
service, nécessite un enrichissement en isotope 235. Cette concentration était de 3 % il y a près de
deux milliards d'années, analogue à celle de l'uranium enrichi utilisé dans nos centrales
électronucléaires, et elle a permis à cette époque le fonctionnement de réacteurs naturels découverts
à l'état fossile au Gabon dans la mine d'uranium d'Oklo en 1972.

La concentration massique moyenne de ces radionuclides dans la croûte terrestre est faible et se
chiffre en parties par million. Néanmoins, ce sont des sources permanentes d'énergie, et l'énergie
qu'ils dégagent est un des facteurs du bilan géothermique du globe terrestre.

En dehors de ces nuclides naturels de périodes de l'âge de la Terre, il en existe de périodes encore
plus longues et de ce fait très faiblement actifs. On peut citer parmi d'autres le rubidium 87 (47
milliards d'années), le lanthane 138 (130 milliards d'années), émetteurs bêta moins, la samarium
147 (110 milliards d'années), le platine 190 (610 milliards d'années), émetteurs alpha.

D'autres nuclides sont formés en permanence par l'interaction du rayonnement cosmique (des
particules très énergétiques émises par le Soleil et d'autres étoiles) avec l'atmosphère et même avec
le sol. Ils peuvent donc aussi exister à l'état naturel avec des périodes courtes vis-à-vis de l'âge de la
Terre. Le principal est le carbone 14, de période 5700 ans, dont la décroissance est utilisée pour
dater les matériaux carbonés anciens. Le carbone 14 a une concentration relativement constante
dans l'atmosphère suite à sa formation et sa désintégration permanente (avec des variations
dépendant de l'activité solaire), durant leur vie, les animaux et les plantes échangent constamment
du carbone avec l'atmosphère à travers la photosynthèse et la respiration. Après leur mort, ces
échanges cessent et la quantité de carbone 14 diminue au cours du temps. La mesure des
concentrations en carbone 14 donne donc un indicateur précis de leur âge (après calibration par
d'autres méthodes comme la dendrochronologie, l'étude de l'âge des arbres par l'observation des
cernes de croissance).

La présence des radionuclides dans le sol, les matériaux de construction, l'atmosphère (tel que le
radon 222, de période 3.8 jours, descendant gazeux de l'uranium 238) créent à la surface de la Terre
un environnement de rayonnement auquel vient s'ajouter le rayonnement cosmique. Cet
environnement varie selon les régions. La variation porte très couramment sur un facteur de
quelques unités entre régions voisines. Elle atteint un facteur dix ou plus entre les régions les plus
et les moins radioactives. Le corps humain contient organiquement du potassium 40 et du carbone
14 qui contribuent environ au quart des doses de rayonnements qu'il reçoit de son environnement
dans les régions les moins radioactives.

Il faut, bien sûr, ajouter à ces sources naturelles, les sources d'origine humaine provenant, pour
l'essentiel de l'activité nucléaire civile (déchets) ou militaires (essais nucléaires). On n'oubliera pas
la triste région de Tchernobyl dont une partie est encore inhabitable.
Exercices
1. Trouvez une expression pour la densité d'électrons n(r ) dans le modèle de Thomas-Fermi en
terme de la fonction sans dimension χ et montrez que le rayon d'une sphère qui enferme une
fraction donnée de tous les électrons est proportionnel à Z −1 / 2 .
2. Utilisez la méthode des multiplicateurs de Lagrange pour montrer que la condition pour que
l'intégrale dans l'équation (10) de la section I.4.1 soit stationnaire, où les u varient mais sont
gardés normalisés, est donnée par (12).
3. Deux électrons p (l = 1) peuvent avoir L = 0, 1 ou 2 et S = 0 ou 1 dans le cas de Russell-
Saunders. Toutes les combinaisons de L et S sont-elles permises si les valeurs de n des deux
électrons sont différents ? Sont-elles permises si les valeurs de n sont les mêmes ?
4. Montrez que les fonctions d'onde de spin dans le cas de Russell-Saunders, qui sont fonctions
propres de S 2 avec différentes valeurs du nombre quantique S de spin total, sont orthogonales.
5. Montrez par un calcul direct que J = L + S commute avec L.S et donc avec l'hamiltonien (1) de
la section I.4.2.
6. Estimez le rapport du terme dans (9) de la section I.4.2 qui est linéaire en H au terme d'énergie
cinétique pour un atome d'hydrogène dans un champ magnétique de 10 5 gauss .
7. Montrez que le facteur de Landé g pour un état à un électron, analogue à (13) de la section I.4.2
mais applicable à j = l ± 12 , est
2l + 1 ± 1
(1) g =
2l + 1

Utilisez le prolongement des coefficients de Clebsh-Gordan au cas j1 = l , j 2 = 12 .


8. Estimez la grandeur du champ de force magnétique pour lequel les deux termes de perturbation
dans (11) de la section I.4.2 sont égaux pour un atome alcalin.
9. Construisez un diagramme qui montre les déplacements relatifs et les intensités des
composantes de Zeeman π et σ des transitions 2 P→ 2 S dans un atome alcalin quand le champ
magnétique est faible. Construisez un diagramme similaire quand le champ est fort.
10. Montrez que le rapport de la distance parcourue par le noyau d'une molécule durant une période
de mouvement électronique aux dimensions de la molécule est de l'ordre de (m / M ) dans le
3/ 4
cas du mouvement vibratoire et (m/M) dans le cas du mouvement de rotation. Est-ce que ces
résultats justifient une approximation du type adiabatique ?
11. Est-ce que le potentiel inter-nucléaire (39) de la section I.4.3 obtenu pour la molécule
d'hydrogène s'approche de la forme − 1 / R 6 obtenue pour l'interaction de van der Waals pour R
grand ? Sinon, pourquoi ?
12. Posez et résolvez l'équation de Schrödinger pour un rotateur rigide qui n'a pas d'énergie
cinétique de rotation autour d'un axe particulier et qui a des moments d'inertie égaux autour des
deux axes perpendiculaires.
13. Dérivez les règles de sélection pour les transitions entre les niveaux de rotation dans une
molécule diatomique.
14. Discutez des règles de sélection des transitions de vibration quand les deux noyaux d'une
molécule diatomique sont les mêmes et quand ils sont différents.
15. Calculez les contributions à l'énergie de vibration d'une molécule diatomique des termes de
cinquième et sixième puissance négligés dans le développement (44) de la section I.4.3 et
montrer que les négliger est justifié en arrivant à l'énergie (v + 12 ) donnée dans (48). Utilisez
2

les méthodes matricielles pour avoir les éléments de matrice nécessaires de x 5 et x 6 pour un
oscillateur harmonique.
16. Supposez que l'interaction entre un neutron et un proton est la même dans l'état singulet et
triplet et qu'elle est représentée par un puits de potentiel carré. Y a-t-il des valeurs de a qui
satisfont à la fois l'énergie de liaison du deutéron (l = 0) et la section efficace de neutrons lents ?
Si oui, quelle est-elle ?
17. Utilisez la valeur de l'énergie de liaison du deutéron pour calculer la portée effective triplet du
puits de potentiel carré à partir de l'équation (20) de la section I.4.4.1 et de l'équation (21) et
comparez-les. Supposez que a = 2 × 10 −13 cm .
18. Montrez que l'opérateur d'échange de spin 12 (1 + σ N ⋅ σ P ) a les propriétés demandées dans la
section I.4.4.1. Construisez alors les opérateurs projection singulet et triplet. Finalement, si
l'énergie potentielle triplet est Vt (r ) et celle singulet Vs (r ) , construisez une énergie potentielle
dépendant d'un seul spin qui décrit l'interaction neutron - proton.
19. Utilisez l'étude de la diffusion par un potentiel coulombien pour obtenir une expression du
rapport de la diffusion proton - proton avec un décalage de phase δ 0 (et aucun autre) à la
section de Mott donnée par l'équation (26) de la section I.4.4.1.
II. Rayonnement
A part quelques éléments de ci de là, en particulier dans l'étude de la radioactivité, nous n'avons pas
encore abordé l'interaction entre des particules matérielles et le rayonnement électromagnétique.
Comme on s'y attendrait, un traitement consistant avec la théorie de la mécanique quantique
nécessiterait que l'on trouve les équations quantiques du mouvement du champ électromagnétique
analogues aux équations de Maxwell. En effet, c'est seulement de cette manière que les hypothèses
quantiques originales de Planck peuvent s'ajuster à un cadre théorique général. Le développement
des éléments d'une théorie quantique du rayonnement nécessite des outils théoriques particuliers.
Ici, nous traiterons le champ électromagnétique de manière classique et les particules avec
lesquelles le champ interagit seront traitées par la mécanique quantique. Un tel traitement semi-
classique est condamné à être incomplet et en partie insatisfaisant, bien qu'il soit plus simple en
principe que la théorie quantique des champs. Nous trouverons qu'il est possible dans cette
approximation de donner une explication plausible et correcte de l'influence d'un champ
électromagnétique externe sur un système de particules (absorption et émission induite) mais pas de
l'influence des particules sur le champ (émission spontanée). Néanmoins, les résultats du traitement
classique de ce dernier phénomène peuvent être convertit en une théorie quantique d'une manière
correcte même si elle ne semble pas très convaincante. Un avantage pédagogique important de cette
approche est qu'elle est plus simple et permet de mieux comprendre les interactions entre matière et
champ électromagnétique avant d'aborder des théories plus élaborées mais aussi parfois plus
abstraites. Nous donnerons aussi quelques applications de la théorie.
II.1. L'hamiltonien d'une particule de spin un demi dans un champ
magnétique
Nous allons maintenant discuter d'une situation assez simple avec un système à deux états constitué
par un objet de spin un demi. Une partie de ce que nous allons voir est déjà bien connu mais il
permettra d'introduire l'interaction avec un champ magnétique.

Nous pouvons considérer un électron au repos comme un système à deux états. Quoique nous
n'allions discuter ici que "d'un électron", ce que nous trouverons sera vrai de toute particule de spin
un demi. Supposez que nous choisissions comme états de base 1 et 2 les états pour lesquels la
composante de z du spin de l'électron est + h / 2 et − h / 2 . Nous nommerons ces deux états, l'état
de spin "plus" et l'état de spin "moins".

Tout état possible ψ d'un électron peut être décrit en donnant l'amplitude C1 pour que l'électron
soit dans l'état 1 et l'amplitude C 2 pour qu'il soit dans l'état 2 . Pour traiter ce problème, il nous
faut connaître l'hamiltonien pour ce système à deux états, c'est-à-dire pour un électron dans un
champ magnétique. Nous commençons par le cas particulier d'un champ magnétique dans la
direction z.

Supposons que le vecteur B n'ait qu'une composante B z . D'après la définition des deux états de
base (c'est-à-dire spins parallèles ou antiparallèles à B) nous savons qu'il y a déjà deux états
stationnaires d'énergie définie dans le champ magnétique. L'état 1 correspond à une énergie égale
à − µB z et l'état 2 à + µB z (nous prenons l'énergie au repos mc 2 pour notre "zéro" d'énergie et
nous traitons le moment magnétique de l'électron comme un nombre négatif, puisqu'il est opposé au
spin). L'hamiltonien doit être très simple dans ce cas puisque C1 , l'amplitude pour être dans l'état
1 , n'est pas affectée par C 2 et vice versa :
dC1
ih = E1C1 = − µB z C1
dt
(1)
dC
ih 2 = E 2 C 2 = + µ B z C 2
dt

Dans ce cas particulier, l'hamiltonien est


H = − µB z H 12 = 0
(2) 11
H 21 = 0 H 22 = + µB z

Nous savons donc ce qu'est l'hamiltonien pour un champ magnétique dans la direction z et nous
connaissons les énergies des états stationnaires.

Supposons maintenant que le champ ne soit pas dans la direction z. Quel est alors l'hamiltonien ?
Comment les éléments de matrice sont-ils modifiés si le champ n'est pas dans la direction z ? Nous
allons faire l'hypothèse qu'il y a une sorte de principe de superposition pour les termes de
l'hamiltonien. Plus précisément, nous allons supposer que, si deux champs magnétiques sont
superposés, les termes de l'hamiltonien s'ajoutent simplement. Si nous connaissons les H ij pour un
pur B z et si nous connaissons les H ij pour un pur B x , alors les H ij pour B z et B x ensemble en
sont simplement la somme. Ceci est certainement vrai si nous considérons que des champs dans la
direction z. Si nous doublons B z , alors tous les H ij sont doublés. Nous supposons donc que H est
linéaire par rapport au champ B. C'est tout ce dont nous avons besoin pour trouver H ij pour
n'importe quel champ magnétique.

Supposons que nous ayons un champ constant B. Nous pourrions avoir choisi notre axe z dans la
direction du champ et nous aurions trouvé deux états stationnaires d'énergie m µB . Le fait de
choisir nos axes dans des directions différentes ne change pas la physique. Notre description des
états stationnaires sera différente mais leurs énergies seront encore m µB , c'est-à-dire
(3) E I = − µ B x2 + B y2 + B z2
et
(4) E II = + µ B x2 + B y2 + B z2

La suite du jeu est facile. Nous avons ici les formules des énergies. Nous voulons un hamiltonien
linéaire en B x , B y et B z qui donne ces énergies. Le problème : trouver l'hamiltonien. Remarquez
d'abord que la séparation des énergies est symétrique, avec une valeur moyenne de zéro. Nous
voyons ainsi directement qu'il faut
(5) H 22 = − H 11

Remarquez que ceci vérifie ce que nous savions déjà lorsque B x et B y étaient tous les deux nuls.
Dans ce cas H 22 = − H 11 = µB z . En utilisant maintenant l'hamiltonien pour obtenir les énergies des
états stationnaires et en égalant à (3) et (4), nous obtenons
 H − H 22 
2

(6)  11  + H 12
2
(
= µ 2 B x2 + B y2 + B z2 )
 2 

Nous avons utilisé le fait que H 21 = H 12∗ et donc H 12 H 21 = H 12 . Toujours dans le cas particulier
2

d'un champ dans la direction z, ceci donne


(7) µ 2 B z2 + H 12 = µ 2 B z2
2

Clairement, H 12 doit être nul dans ce cas particulier ce qui veut dire que H 12 ne peut contenir
aucun terme en B z (rappelez-vous que nous avons dit que tous les termes devaient être linéaires en
B x , B y et B z ).

Jusqu'ici nous avons découvert que H 11 et H 22 ont des termes en B z tandis que H 12 et H 21 n'en
ont pas. Nous pouvons facilement deviner une solution de (6) telle que
H 11 = − µB z
(8) H 22 = µB z
H 12
2
(
= µ 2 B x2 + B y2 )
Et il se trouve que c'est la seule façon dont on peut le faire !

Vous pouvez aussi retrouver ce résultat en choisissant un axe z' le long de B et en effectuant une
rotation. Ce qui valide l'hypothèse de linéarité.

"Attendez", allez vous dire, "H n'est pas linéaire en B. L'équation (8) donne H 12 = µ B x2 + B y2 ".
Par nécessairement. Il y a une autre possibilité qui donne une expression linéaire, à savoir,
(9) H 12 = µ (B x + iB y )

Il y a en fait plusieurs possibilités semblables. Plus généralement, nous pourrions écrire


(10) H 12 = µ (B x ± iB y )e iδ
où δ est une phase arbitraire. Quel signe et quelle phase devons-nous utiliser ? Il se trouve que
vous pouvez choisir n'importe quel signe et n'importe quelle phase et que les résultats physiques
seront toujours les mêmes. Le choix est donc manière à convention. Des gens, avant nous, ont
décidé d'utiliser le signe moins et de prendre e iδ = −1 . Nous pouvons tout aussi bien les suivre et
écrire
(11) H 12 = − µ (B x − iB y ) H 21 = − µ (B x + iB y )

L'hamiltonien complet pour un électron dans un champ magnétique quelconque est donc
H 11 = − µB z H 12 = − µ (B x − iB y )
H 21 = − µ (B x + iB y )
(12)
H 22 = + µB z

Et les équations pour les amplitudes C1 et C 2 sont


ih
dC1
dt
[
= − µ B z C1 + (B x − iB y )C 2 ]
(13)
[
ih 2 = − µ (B x + iB y )C1 − B z C 2
dC
dt
]
Nous avons donc découvert les "équations du mouvement pour les états de spin" d'un électron dans
un champ magnétique. Nous les avons devinées en employant quelques arguments physiques, mais
le seul test réel d'un hamiltonien consiste à vérifier l'accord entre ces prédictions et l'expérience.
D'après toutes les vérifications qui ont été faites, ces équations sont correctes. En fait, quoique nos
arguments n'aient été donnés que pour des champs constants, l'hamiltonien que nous avons écrit est
également correct pour des champs magnétiques qui varient avec le temps. Nous pouvons donc
utiliser l'équation (13) pour étudier toutes sortes de problèmes intéressants.
II.2. L'électron avec spin dans un champ magnétique
Nous partons avec un champ constant dans la direction z. Il n'y a que deux états stationnaires
d'énergies m µB z . Supposez que nous ajoutions un champ faible, dans la direction x. Les équations
ressemblent alors à celles de notre vieux problème à deux états. Nous avons une fois de plus toute
l'histoire de basculement et les niveaux d'énergie sont un petit peu séparés l'un de l'autre. Faisons
maintenant varier la composante x du champ avec le temps, comme cos ω t par exemple. Le calcul
montre alors qu'un champ oscillant cause des transitions de l'état +z à l'état -z, et vice versa, lorsque
le champ horizontal oscille près de la fréquence de résonance ω 0 = 2 µB z / h . Nous reviendrons sur
une application simple de ce phénomène avec le maser.

Examinons maintenant la question suivante. Supposons que nous ayons un champ magnétique B
qui pointe dans une direction définie par les angles polaires θ et azimutal φ , comme sur la figure
ci-dessous.
Supposons de plus qu'il y ait un électron, préparé avec son spin pointant le long du champ. Quelle
sont les amplitudes C1 et C 2 pour un tel électron ? Autrement dit, en appelant ψ l'état de
l'électron, nous voulons écrire
(1) ψ = 1 C1 + 2 C 2
où C1 et C 2 sont définis par :
(2) C1 = 1 ψ C2 = 2 ψ
et où les états 1 et 2 sont définis par rapport à l'axe z.
La réponse à cette question est contenue dans les équations générales pour les systèmes à deux
états. Tout d'abord, nous savons que, puisque le spin de l'électron est parallèle à B, l'électron est
dans un état stationnaire, d'énergie E I = − µB . Par conséquent, C1 et C 2 doivent tous les deux
− iE t / h
varier comme e I et leurs coefficients a1 et a 2 sont donnés par
a H 12
(3) 1 =
a 2 E I − H 11

2 2
De plus, a1 et a 2 doivent être normalisés de façon que a1 + a 2 = 1 . Nous pouvons obtenir H 11
et H 12 par les relations de la section précédente en utilisant
(4) B z = B cosθ B x = B sin θ cos φ B y = B sin θ sin φ

Si bien que nous avons


H 11 = − µB cosθ
(5)
H 12 = − µB sin θ (cos φ − i sin φ )

Incidemment, le dernier facteur de la seconde équation est e −iφ , si bien qu'il est plus simple d'écrire
(6) H 12 = − µB sin θ e − iφ

En utilisant ces éléments de matrice dans (3), et en simplifiant par − µB au dénominateur et au


numérateur, nous trouvons
a sin θ e − iφ
(7) 1 =
a 2 1 − cosθ

Avec ce rapport et les conditions de normalisation, nous pouvons trouver a1 et a 2 . Ce n'est pas
difficile, mais nous pouvons prendre un raccourci grâce à "l'astuce" suivante. Remarquez que
1 − cosθ = 2 sin 2 (θ / 2 ) et que sin θ = 2 sin (θ / 2) cos(θ / 2 ) . L'équation (7) est alors équivalente à
θ
cos e −iφ
a1 2
(8) =
a2 θ
sin
2

Une réponse possible est donc


θ θ
(9) a1 = cos e −iφ a 2 = sin
2 2
puisqu'elle satisfait (8) et donne
2 2
(10) a1 + a 2 =1

Comme vous le savez, on peut multiplier à la fois a1 et a 2 par un facteur de phase arbitraire, sans
que cela change quoi que ce soit. Les gens préfèrent en général rendre les relations (9) plus
symétriques, en multipliant les deux par e iφ / 2 . On utilise donc généralement la forme
θ θ
(11) a1 = cos e −iφ / 2 a 2 = sin e +iφ / 2
2 2
et ceci constitue la réponse à notre question. Les nombres a1 et a 2 sont les amplitudes pour trouver
un électron avec son spin en haut ou en bas le long de l'axe z, lorsque nous savons que son spin est
le long de l'axe défini par θ et φ (les amplitudes C1 et C 2 sont tout simplement a1 et a 2 multiplié
− iE I t / h
par e ).

Nous remarquons maintenant un chose intéressante. La force B du champ magnétique n'apparaît


nulle part dans (11). Il est clair que le résultat est le même à la limite où B tend vers zéro. Ceci
signifie que nous avons répondu, par d'autres voies, à la question générale : comment représenter
une particule dont le spin est le long d'un axe arbitraire ? Les amplitudes (11) sont les amplitudes de
projection pour une particule de spin un demi, qui correspondent aux amplitudes de projection que
nous avons déjà vues.

Comme dernier exemple, examinons la situation suivante. Nous partons avec un électron dont le
spin est dans une direction donnée, puis nous créons un champ magnétique dans la direction z
pendant 25 minutes, puis nous supprimons le champ. Quel est l'état final ? Représentons encore
l'état par une combinaison linéaire ψ = 1 C1 + 2 C 2 . Pour ce problème, cependant, les états
d'énergie définie sont aussi les états de base 1 et 2 . C1 et C 2 ne varient donc qu'en phase. Vous
savez que
C1 (t ) = C1 (0 )e I = C1 (0 )e + iµ B t / h
− iE t / h

(12)
C 2 (t ) = C 2 (0 )e II = C 2 (0 )e −iµ B t / h
− iE t / h

Mais nous avons dit que le spin de l'électron était initialement dans une direction donnée. Cela
signifie qu'initialement C1 et C 2 étaient deux nombres donnés par (11). Après que nous ayons
attendu pendant un intervalle de temps T, les nouveaux C1 et C 2 sont les mêmes nombres
multipliés par e i µ BzT / h et e −i µ BzT / h . Quel état cela représente-t-il ? C'est facile. C'est exactement le
même que si l'angle φ avait été diminué de 2 µB z T / h et que si l'angle θ était resté fixe. Ceci
signifie qu'après l'intervalle de temps T, l'état ψ représente un électron aligné dans une direction
qui diffère de la direction originale seulement par une rotation autour de z, d'angle ∆φ = 2 µB z T / h .
Comme cet angle est proportionnel à T, nous pouvons dire aussi que la direction du spin précesse
autour de l'axe z avec la vitesse angulaire 2 µB z / h .

Il est intéressant de noter que les idées mathématiques que nous venons d'employer pour l'électron à
spin dans un champ magnétique peuvent être appliquées à tout système à deux états. Cela signifie
qu'en faisant une analogie mathématique avec l'électron à spin, on peut résoudre par de la pure
géométrie tout problème concernant un système à deux états. Cela se fait de la façon suivante. Tout
d'abord, vous déplacez le zéro d'énergie de façon que (H 11 + H 22 ) soit égal à zéro, soit
H 11 = − H 22 . Alors tout problème à deux états est formellement identique au problème d'un
électron dans un champ magnétique. Tout ce que vous avez à faire est d'identifier − µB z avec H 11
et − µ (B x − iB y ) avec H 12 . Quelle que soit la physique initiale vous pouvez la traduire sous forme
d'un problème à un électron. Donc, si nous savons résoudre le problème d'un électron en général,
nous savons résoudre tous les problèmes à deux états.
Or nous avons la solution générale pour l'électron ! Supposez que vous ayez un certain état de
départ avec son spin "en haut" dans une certaine direction et que vous ayez un champ magnétique B
qui pointe dans une autre direction. Vous n'avez qu'à faire tourner la direction de spin autour de
l'axe de B avec la vitesse angulaire vectorielle ω (t ) , égale à une constante que multiplie le vecteur
B (plus précisément ω = 2 µB / h ). Lorsque B varie dans le temps, vous déplacez continuellement
l'axe de rotation pour le garder parallèle à B et vous changez en même temps la vitesse de rotation
pour qu'elle soit toujours proportionnelle à l'intensité de B (voir la figure ci-dessous).

Si vous faites ceci, vous finirez avec une certaine orientation de l'axe de spin et les amplitudes C1
et C 2 seront données par les projections (11) dans votre système de coordonnées. Vous voyez, c'est
simplement un problème de géométrie. Il vous faut trouver l'endroit où vous aboutirez après toutes
ces rotations. Quoiqu'il soit facile de voir ce qui entre en compte, ce problème de géométrie
(trouver le résultat d'une rotation de vitesse angulaire variable) n'est pas facile à résoudre
explicitement dans le cas généal. Quoi qu'il en soit, vous voyez ce qu'est, en principe, la solution
générale du problème à deux états.

Après cette mise en bouche, nous allons aborder de manière plus générale l'interaction d'un atome
avec le champ électromagnétique afin de résoudre le problème de rayonnement.
II.3. Absorption et émission induite
L'équation de Schrödinger pour le mouvement d'une particule de masse m et de charge e dans un
champ électromagnétique décrit par les potentiels A, φ avec une énergie potentielle additionnelle
V, est obtenue en ajoutant un terme Vψ sur le coté droit de l'équation de Schrödinger :
∂ψ  h 2 2 ieh ieh 2

(1) ih = − ∇ + A ⋅∇ + (∇ ⋅ A ) + e 2 A 2 + eφ + V ψ
∂t  2m mc 2mc 2mc 

Nous regardons V comme l'énergie potentielle qui lie la particule (d'origine électrostatique si la
particule est un électron). A, φ représente un champ électromagnétique qui suffisament faible pour
que ces termes puissent être vus comme une perturbation. Notre objet est de calculer les
probabilités de transition entre états stationnaires de la particule dans l'énergie potentielle V,
produites par le champ. Nous discuterons d'abord quelques propriétés du champ et de ses solutions
en ondes planes.

Equations de Maxwell
Les équations de Maxwell du mouvement pour le champ électromagnétique sont, en unités
gaussiennes,
1 ∂H 1 ∂E 4π
∇×E + = 0 ∇×H − = J
(2) c ∂t c ∂t c
∇ ⋅ E = 4πρ ∇⋅H = 0

Si la divergence de la deuxième équation est combinée à la dérivée par rapport au temps de la


troisième, nous obtenons l'équation de continuité pour les densités de charge et de courant ρ et J :
∂ρ
(3) ∇ ⋅ J + =0
∂t

Les champs électriques et magnétiques peuvent être exprimés en fonction des potentiels par :
1 ∂A
E=− − ∇φ
(4) c ∂t
H = ∇×A
qui permettent de satisfaire identiquement la première et la quatrième équation dans (2). Les
potentiels ne sont pas définis de manière unique par (4) puisque tout A, φ qui donnent les E et H
corrects peuvent évidemment être remplacés par les nouveaux potentiels A', φ ′ sans altérer les
champs, où
A ′ = A + ∇χ
(5) 1 ∂χ
φ′ = φ −
c ∂t
et χ est une fonction arbitraire de r et de t. Ce changement dans les potentiels sans changer les
champs est appelé une transformation de jauge. On montre facilement que ψ doit aussi être
remplacé par
(6) ψ ′ = ψe ieχ / hc
si la forme de l'équation (1) doit être préservée. Un changement global de la fonction d'onde est
bien sûr sans conséquence sur la physique. Les équations (6) et (5) sont souvent appelées
transformations de jauge du premier et du second type, respectivement.

La substitution de (4) dans la deuxième et la troisième équation (2) donne


1 ∂ 2 A 1 ∂φ 4π
∇×∇×A + 2 + ∇ = J
(7) c ∂t 2
c ∂t c
1 ∂
∇ ⋅ A + ∇ 2φ = −4πρ
c ∂t

Si le vecteur A est écrit en coordonnées rectangulaires, nous pouvons poser


(8) ∇ × ∇ × A = ∇(∇ ⋅ A ) − ∇ 2 A
où le dernier terme est le vecteur dont les composantes sont les laplaciens des composantes de A.
Nous pouvons donc simplifier (7) en faisant une transformation de jauge (5) de A, φ à A', φ ′ tel
que le nouveau potentiel satisfait la condition de Lorentz :
1 ∂φ ′
(9) ∇ ⋅ A ′ + =0
c ∂t

On parle aussi de la jauge de Lorentz. D'autres transformations de jauge sont possibles, utiles dans
différentes circonstances. Par exemple la jauge de Coulomb où l'on pose simplement A = 0 et qui
est utile en présence de charges statiques. Un autre avantage de la jauge de Lorentz est qu'elle est
invariante sous les transformations relativistes de Lorentz.

La fonction de jauge χ satisfait alors l'équation


1 ∂2χ  1 ∂φ 
(10) ∇ 2 χ − = − ∇ ⋅ A + 
c ∂t
2 2
 c ∂t 

Les équations (7) deviennent alors


1 ∂ 2 A′ 4π
∇ A′ − 2
2
=− J
c ∂t 2
c
(11)
1 ∂ 2φ ′
∇ 2φ ′ − 2 = −4πρ
c ∂t 2

Ondes électromagnétiques planes


Si J = 0 et ρ = 0 (espace entièrement vide), on peut montrer qu'il est possible de choisir la fonction
de jauge tel que ∇ ⋅ A ′ = 0 et φ ′ = 0 pour tout r et t, sans perte de généralité. Alors des solutions
sous forme d'ondes planes transverses peuvent être trouvées pour A' et donc aussi pour E et H.
Nous enlevons les apostrophes et nous avons dans ce cas
1 ∂2A
∇ A− 2
2
=0
(12) c ∂t 2
∇⋅A = 0

Une solution en onde plane typique de (12) est celle qui représente un potentiel réel avec le vecteur
de propagation k et le vecteur polarisation réel A 0 :
A(r, t ) = 2 A 0 cos(k ⋅ r − ω t + α )
(13)
= A 0 exp[i (k ⋅ r − ω t )] + c.c.

Ici "c.c." indique le complexe conjugué du terme qui le précède et le vecteur complexe constant A 0
est définit comme A 0 e iα . La première des équations (12) est satisfaite si ω = kc , où k est la
grandeur de k et la deuxième est satisfaite si A 0 est perpendiculaire à k.

Les champs électriques et magnétiques associés au potentiel vecteur (13) sont


E = −2k A 0 sin (k ⋅ r − ω t + α )
(14)
H = −2k × A 0 sin (k ⋅ r − ω t + α )

Le vecteur de Poynting (c / 4π )E × H est évidemment dans la direction de k. Sa grandeur


moyennée sur un période 2π / ω d'oscillation est
ω2 2
(15) A0
2πc
2
où A 0 est égal au produit scalaire de A 0 avec lui-même ( A 0 ⋅ A 0 ) ou au produit scalaire de
A 0 et de son complexe conjugué ( A 0 ⋅ A ∗0 ). La quantité (15) est l'intensité associée à l'onde plane
(13).

Utilisation de la théorie des perturbations


Nous revenons maintenant à l'équation (1) et nous l'utilisons pour calculer la probabilité d'une
transition entre états stationnaires qui est produite par le potentiel vecteur (13), qui est vu comme
une petite perturbation. Le troisième terme ( ∇ ⋅ A ) et le cinquième terme ( φ ) sur le coté droit de
(1) sont maintenant zéro. Les rapports du deuxième au premier terme et du quatrième au second sur
le coté droit de (1) sont de l'ordre de eA / cp où p est l'impulsion de la particule. La grandeur de
cette quantité est si petite que l'approximation des perturbations est justifiée. Donc, au premier
ordre de la théorie des perturbations, nous pouvons négliger le terme e 2 A 2 / 2mc 2 et nous récrivons
(1) :
∂ψ
ih = (H 0 + H ′)ψ
∂t
h2 2
(16) H 0 = − ∇ + V (r )
2m
ieh
H′ = A⋅∇
mc

Nous allons procéder comme dans l'étude de la théorie des perturbations. Nous développons ψ en
fonctions propres stationnaires u k (r ) de l'hamiltonien non perturbé H 0 avec des coefficients
dépendant du temps a k (t ) . Si le système est initialement dans l'état n et que la perturbation est
enclenchée en t = 0, les amplitudes au premier ordre au temps t sont données par :
k H ′ 0 n e i (ω kn −ω )t − 1 k H ′′ 0 n e i (ω kn +ω )t + 1
a k (t ) = −
(1)

h ω kn − ω h ω kn + ω
ieh ∗
(17) k H ′ 0 n = ∫ u k exp(ik ⋅ r )A 0 ⋅ ∇u n d 3 r
mc
ieh ∗
k H ′′ 0 n = ∫ u k exp(− ik ⋅ r )A ∗0 ⋅ ∇u n d 3 r
mc

Comme nous l'avons vu, la probabilité de trouver le système dans l'état k est appréciable seulement
quant le dénominateur de l'un ou l'autre des deux termes de (17) est pratiquement zéro. Il n'y a pas
d'interférence entre les deux termes. Le premier est important quand E k ≈ E n + hω et le second est
important quand E k ≈ E n − hω . Donc la probabilité de trouver le système dans l'état k qui a une
2
énergie plus grande que l'état initial d'environ hω est proportionnelle à k H ′ 0 n et la
probabilité de trouver le système dans un état k' qui a une énergie plus basse équivalente est
2
proportionnelle à k H ′′ 0 n .

Probabilité de transition
La théorie des perturbations a montré que la probabilité de transition par unité de temps est
indépendante du temps seulement si l'état final fait partie d'un groupe d'états peu séparés ou
distribués de manière continue. La nécessité d'un groupe d'états finaux vient de la dépendance de la
probabilité a k(1) (t ) avec l'énergie. C'est l'aire sous la courbe de cette quantité, pas l'ordonnée en
2

une abscisse particulière, qui est proportionnelle à t.

De la même manière, une probabilité de transition constante par unité de temps est obtenue dans la
situation actuelle si le rayonnement incident est monochromatique (valeur définie de ω ) et la
transition peut se produire seulement vers un groupe d'états finaux proches ou distribués de manière
continue. Cependant, le calcul d'une probabilité de transition entre deux états discrets est souvent
intéressant. Dans ce cas la probabilité de transition par unité de temps n'est pas constante dans le
temps si le rayonnement incident est strictement monochromatique et elle dépend de manière nette
de la différence entre ω et
Ek − En
(18) ω kn =
h

Ce que nous faisons dans ce cas est de supposer que le rayonnement couvre une gamme de
fréquences sans relations de phase entre les différentes composantes, ainsi le rayonnement peut être
caractérisé par une intensité par unité de domaine de fréquence qui est constante dans le voisinage
de ω kn .
2
La probabilité de trouver le système dans l'état final est alors proportionnelle à k H ′ 0 n ou
2
k H ′′ 0 n
2
, qui en retour est proportionnel à A 0 et donc à l'intensité. Si l'intensité dans le petit
domaine de pulsation ∆ω est I (ω )∆ω , l'équation (15) nous dit que nous pouvons poser
2πc
(19) A 0 = 2 I (ω )∆ω
2

ω
où A 0 est l'amplitude du potentiel vecteur qui caractérise le domaine de fréquence ∆ω . La
probabilité pour avoir une transition pour passer d'un état à une plus haute énergie E k ≈ E n + hω
au temps t est alors
(ω kn − ω )t
2
4 l H ′0 n sin 2 1

a k (t ) = ∑
(1) 2 2

h 2 (ω kn − ω )
2
(20) ω

2 sin 1 (ω
8πe kn − ω )t
2 2
= ∑ 2 2 I (ω )∆ω ∫ u k exp(ik ⋅ r )∇ A u n d r
∗ 3 2

ω m cω (ω kn − ω )2
où ∇ A est la composante de l'opérateur gradient le long du vecteur polarisation A 0 . Les
contributions à la probabilité des différents domaines de fréquence sont additives puisqu'il n'y a pas
de relation de phase entre les composantes du rayonnement de différentes fréquences.

Chaque domaine de fréquence ∆ω dans (20) peut être rendu infinitésimal et la sommation
remplacée par une intégration. Puisque le facteur temps a un maximum étroit en ω = ω kn , les autres
facteurs qui impliquent ω peuvent être sortis de l'intégrale et les limites sur ω étendues à ± ∞ .
Donc, la probabilité de transition par unité de temps pour une transition vers le haut devient
2 ∞ sin 1 (ω
8πe 2 kn − ω )t
2
a k (t ) = 2 2 I (ω kn ) ∫ u k exp(ik ⋅ r )∇ A u n d r ∫
1 (1) 2 ∗ 3 2

m cω kn t (ω kn − ω )
−∞ 2
t
(21)
4π 2 e 2
= 2 2 I (ω kn ) ∫ u k∗ exp(ik ⋅ r )∇ A u n d 3 r
2

m cω kn
où la grandeur de k est maintenant ω kn / c . Une expression très similaire à (21) est obtenue pour la
probabilité par unité de temps d'une transition vers le bas E k ′ ≈ E n − hω :
4π 2 e 2
( ) ( )
2
(22) I ω ′ ∫ u ∗
′ exp − i k ⋅ r ∇ u d 3
r
m 2 cω n2k ′
nk k A n

Dans ce cas, la grandeur de k est ω nk ′ / c .

Interprétation en termes d'absorption et d'émission


Les équations (21) et (22) donnent les probabilités par unité de temps pour les transitions de la
particule entre états stationnaires sous l'influence d'un champ de rayonnement classique. Ces
expressions peuvent maintenant être interprétées en termes d'absorption et d'émission de quanta de
rayonnement électromagnétique. Il est nécessaire de supposer que de tels quanta existent et
fournissent l'unité d'énergie du champ de rayonnement et que l'énergie est conservée entre le champ
et la particule. La particule gagne la quantité d'énergie E k − E n dans une transition vers le haut
sous l'influence du rayonnement de pulsation ω kn . Le quantum d'énergie de ce rayonnement est
hω kn = E k − E n , ainsi il est raisonnable d'associer avec la transition vers le haut de la particule
l'absorption d'un quantum du champ de rayonnement.

De la même manière, la transition vers le bas est associée à l'émission d'un quantum dont l'énergie
correspond à la fréquence du champ de rayonnement. En accord avec (22), la probabilité d'émission
est proportionnelle à l'intensité du rayonnement présent. Ce processus est donc appelé émission
induite.

Il est quelque fois utile de récrire (22) en fonction de la transition inverse telle qu'elle apparaît dans
(21). L'équation (21) décrit la transition d'un état bas initial n vers un état haut final k. (22) peut
décrire la transition d'un état haut initial k vers un état bas final n si n est remplacé par k et k' par n.
Alors (22) devient
4π 2 e 2
(23) 2 2 I (ω kn ) ∫ u n∗ exp(− ik ⋅ r )∇ A u k d 3 r
2

m cω kn
Nous pouvons maintenant montrer que l'intégrale dans (23) est juste le négatif du complexe
conjugué de l'intégrale dans (21). Au moyen d'une intégration par partie, l'intégrale dans (24) est
alors égale à
[ ]
(24) − ∫ u k ∇ A u n∗ exp(− ik ⋅ r ) d 3 r

Puisque seule la composante du gradient le long du vecteur de polarisation A 0 apparaît et que cette
direction est perpendiculaire au vecteur de propagation k, l'opérateur ∇ A n'affecte pas
exp(− ik ⋅ r ) . Donc l'intégrale dans (23) est égale à
(25) − ∫ u k exp(− ik ⋅ r )∇ A u n∗ d 3 r
et le carré de sa grandeur est égal au carré de la grandeur de l'intégrale qui apparaît dans (21).

Puisque (21) et (23) sont les mêmes, les probabilités de transitions dans un sens ou dans l'autre pour
toute paire d'états sous l'influence du même rayonnement sont égales.

Transitions électriques dipolaires


Dans la plus part des cas intéressants en pratique, la longueur d'onde du rayonnement est plusieurs
fois plus grande que les dimensions linéaires de la fonction d'onde qui décrit le mouvement de la
particule. Cela signifie que la quantité k ⋅ r qui apparaît dans l'exponentielle dans l'intégrale dans
(21) est petite comparée à l'unité lorsque que u n et u k sont assez grand pour donner une
contribution appréciable à l'intégrale. Une bonne approximation est alors obtenue en remplaçant
exp(ik ⋅ r ) par 1.

L'intégrale résultante peut être simplifiée en l'exprimant comme un élément de matrice de


l'impulsion de la particule
i i
(26) ∫ u k∗ ∇ A u n d 3 r = ∫ u k∗ p A u n d 3 r = k p A n
h h
où p A est la composante de la particule d'impulsion p le long de la direction de polarisation du
rayonnement incident. La théorie matricielle montre que la matrice impulsion de la particule non
perturbée est donnée par p = m(dr / dt ) . Donc
1 d
(27) kpn = k r n = iω kn k r n
m dt

L'intégrale (21) devient à cette approximation


m
(28) ∫ u k∗ ∇ A u n d 3 r = − ω kn ∫ u k∗ rA u n d 3 r
h
où rA est la composante de r le long de la direction de polarisation. L'équation (28) peut, bien sûr,
aussi être dérivée sans recours à la méthode matricielle.

Les transitions pour lesquelles la probabilité peut être calculée en substituant (28) dans (21) sont
dites transitions électriques dipolaires puisque seuls les éléments de matrice du moment électrique
dipolaire re de la particule sont impliqués.

La quantité er est le moment électrique dipolaire de la particule de charge e par rapport à une
origine placée arbitrairement. L'ajout d'un vecteur constant (correspondant à un déplacement de
l'origine) à r n'affecte pas l'élément de matrice (28) puisque u k et u n sont orthogonaux.

Les probabilités de transition par unité de temps pour l'absorption et l'émission induit deviennent
alors, dans l'approximation dipolaire,
4π 2 e 2
( )
2
(29) I ω kn k rA n
h 2c

Il est pratique de noter k r n le vecteur dont les composantes sont les éléments de matrice kn de
x, y et z et de poser
2 ∗
(30) k r n = krn ⋅ krn
qui est le produit scalaire de k r n et de son complexe conjugué. La raison pour faire cela est qu'il
2
y a habituellement des paires d'états k et n pour lesquels k r n est le même mais pour lesquels le
vecteur k r n a différentes orientations dans l'espace. Par exemple, si la particule se déplace dans
un potentiel à symétrie sphérique V (r ) , l'état k peut avoir l = 0 et l'état n peut avoir l = 1 et trois
valeurs (0,-1,+1) pour le nombre quantique magnétique m. Alors, si Θ est l'angle entre k r n et la
2 2
direction de polarisation du rayonnement incident, k r n cos 2 Θ peut être substitué à k rA n
dans (29) et une moyenne effectuée sur Θ . La moyenne de (29) pour de telles paires d'états est
alors
4π 2 e 2
I (ω kn ) k r n
2
(31) 2
3h c

Transitions interdites
Il peut arriver que l'élément électrique dipolaire k r n soit zéro pour des états particuliers k et n.
Dans ce cas, l'approximation de remplacement de exp(ik ⋅ r ) par 1 dans l'intégrale de (21) n'est pas
justifiée. L'exponentielle peut être développée en série
(32) exp(ik ⋅ r ) = 1 + ik ⋅ r + (ik ⋅ r ) + L
1 2

2!
ou en une série d'harmoniques sphériques
(33) exp(ik ⋅ r ) = j 0 (kr ) + 3ij1 (kr )P1 (cosθ ) − 5 j 2 (kr )P2 (cosθ ) + L
où θ est l'angle entre k et r. La deuxième série est plus pratique si, comme c'est habituellement le
cas, les fonctions d'onde u k et u n peuvent être exprimées en fonction des harmoniques sphériques.

Avec l'une ou l'autre série, le facteur dominant dans le nième terme est proportionnel à (kr ) si kr
n

<< 1. Donc, si l'élément de matrice dipolaire s'annule mais pas le terme suivant de chaque série,
l'élément de la matrice de transition est réduit d'un facteur qui est de l'ordre de grandeur de ka, où
les dimensions linéaires des fonctions d'onde de la particule sont de l'ordre de a. Une transition de
ce type est appelée une transition interdite car sa probabilité est réduite d'un facteur (ka ) par
2

rapport aux transitions dipolaires ou autorisées et habituellement ka << 1. Les termes successifs
dans les séries peuvent être interprétés en terme de transitions électriques dipolaires,
quadrupolaires, etc. et qui impliquent les puissances successives de ka.

Si les deux états u k et u n sont à symétrie sphérique, l'intégrale ∫ u k∗ exp(ik ⋅ r )∇ A u n d 3 r est


identiquement zéro. Cela peut être vu en choisissant des coordonnées cartésiennes pour effectuer
l'intégration tel que l'axe des x est le long de la direction de polarisation. Alors ∇ A u n est une
fonction impaire de x, tandis que u k est une fonction paire de x et exp(ik ⋅ r ) = exp i (k y y + k z z ) est
aussi pair en x, puisque le vecteur k est perpendiculaire à la direction de polarisation et est donc
dans le plan yz. Donc, l'intégrand est une fonction impaire de x et l'intégrale dans (21) s'annule. La
transition entre ces états est dite strictement interdite puisque la probabilité au premier ordre
donnée par (21) est zéro. Il est encore possible pour des transitions de se produire avec les ordres
plus élevés de la perturbation H ′ donnée dans (16). Dans un tel calcul, le terme précédemment
négligé e 2 A 2 / 2mc 2 doit être inclus dans H ′ . Cependant, on peut montrer avec l'aide de
l'électrodynamique quantique que de telles transitions d'ordre élevé impliquent plus d'un quantum
et ne sont donc pas de simples processus d'émission ou d'absorption entre les états non perturbés k
et n de la particule.
II.4. Emission spontanée
Un oscillateur chargé classique peut absorber de l'énergie à partir d'un champ de rayonnement ou
lui donner de l'énergie, selon la relation de phase entre le champ et l'oscillateur. Ces effets sont
analogues à l'absorption et à l'émission induite de la section précédente. Un oscillateur classique
émet aussi du rayonnement spontanément, qu'un champ de rayonnement externe soit ou non
présent. Dans cette section, nous allons calculer le rayonnement électromagnétique d'une
distribution de courant oscillante classique en l'absence de champ externe et de manière quelque
peu arbitraire, intuitive, nous récrirons ces formules en fonction des éléments de matrice pour
obtenir une probabilité d'émission spontanée. Les résultats seront vérifiés par comparaison avec
l'expression de Planck pour le rayonnement thermique dans une cavité.

Champ de rayonnement classique


Une distribution de courant peut être complètement spécifiée par la densité de courant J puisque J
détermine la densité de charge ρ à travers l'équation de continuité. De même, le champ
électromagnétique dans l'espace vide, loin des charges et courants, peut être complètement spécifié
par E ou bien H à cause des relations entre eux. Une équation d'onde pour H est facilement obtenue
en prenant le rotationnel de la première équation de Maxwell.
1 ∂2 4π
(1) ∇ 2 H − 2 2 H = − ∇×J
c ∂t c

Donc H peut être obtenu en fonction de J seul, tandis que l'équation similaire pour E implique à la
fois J et ρ (bien que ρ puisse, bien sûr, être éliminé). Nous continuons en résolvant (1) pour H
quand les trois composantes cartésiennes de J varient de manière harmonique dans le temps avec la
même pulsation ω mais pas nécessairement avec la même phase :
J x (r, t ) = 2 J x (r ) cos(ω t − η x ) = J x (r )e − iω t + c.c.
(2)
J x (r ) = J x (r ) e iη x
avec des expressions similaires pour les composantes y et z. Nous sommes seulement intéressés par
les solutions stationnaires pour E et H qui ont la même fréquence ω
E x (r, t ) = 2 E x (r ) cos(ω t − ξ x ) = E x (r )e iω t + c.c.
(3) H x (r, t ) = 2 H x (r ) cos(ω t − ζ x ) = H x (r )e −iω t + c.c.
E x (r ) = E x (r ) e iξ x H x (r ) = H x (r ) e iζ x
à nouveau avec des expressions similaires pour les composantes y et z. E est donné en fonction de
H dans l'espace vide par
(4) E(r ) = ∇ × H (r )
ic
ω

Avec la substitution de (2) et (3), l'équation (1) devient


4π ω
( )
(5) ∇ 2 + k 2 H (r ) = −
c
∇ × J (r ) k =
c

C'est une équation non homogène dont la solution peut être exprimée en fonction d'un propagateur
1 ∇ × J (r ′)
(6) H (r ) = ∫ exp(ik r − r ′ )d 3 r ′
c r − r′

L'équation (6) est la solution retardée de (5). Pour r grand, cette solution est une onde sortante qui
varie avec r et t comme r −1e i (kr −ω t ) + c.c. tel que le champ produit par un élément de courant se
produit à des temps ultérieurs et donc est retardé par rapport à l'élément de courant.

Forme asymptotique
Nous sommes intéressés par l'énergie et le moment angulaire emportés par le champ. Comme
montré ci-dessous, l'énergie peut être trouvée à partir des termes dominants dans l'expression
asymptotique du champ pour r très grand, qui varie comme 1/r. Le moment angulaire nécessite en
plus quelques termes qui varient en 1 / r 2 . La partie dépendant de r de l'intégrand (6) peut être
développée en puissances de 1/r :
exp(ik r − r ′ ) 1  r ′ cosθ + 12 ikr ′ sin θ  ik (r −r ′ cos θ )
2 2
(7) r 
→ 1 + e
r − r′ →∞
r r 

où θ est l'angle entre r' et r. La substitution de (7) dans (6) donne, avec (4), une spécification
complète du champ électromagnétique asymptotique jusqu'à des termes d'ordre 1 / r 2 .

Energie rayonnée
Le vecteur de Poynting, qui est le vecteur flux d'énergie, est égal à
(8)
c
[E(r, t ) × H(r, t )]

A partir de (3), nous voyons que sa moyenne dans le temps P(r ) sur une période d'oscillation a la
composante typique
(9)
Pz (r ) =
c
π
{ [ ] [ ] }
E x (r ) H y (r ) cos(ω t − ξ x ) cos(ω t − ζ y ) moy − E y (r ) H x (r ) cos(ω t − ξ y )cos(ω t − ζ x ) moy

=
c

[ ]
E x (r ) H y (r ) cos(ξ x − ζ y ) − E y (r ) H x (r ) cos(ξ y − ζ x )

Cette relation et les deux autres composantes peuvent être mises sous la forme
(10) P(r ) =
c

[
Re E(r ) × H ∗ (r ) ]
où Re est la partie réelle de l'expression qui suit. Maintenant, nous sommes intéressés seulement
par les termes dans le flux d'énergie qui diminuent comme 1 / r 2 , puisqu'ils correspondent à
l'énergie irradiée. Nous exigeons donc seulement les termes d'ordre 1/r dans E et H.

Il est pratique en écrivant les expressions explicitées pour les champs de choisir les axes des
coordonnées cartésiennes telles que z est le long du vecteur r, qui va du centre de la distribution de
courant vers le point où le champ est mesuré. Les équations (4), (6) et (7) donnent alors, à l'ordre
1/r (où maintenant r = z),
e ∫ J y (r ′)e −ikz′ d 3 r ′
ik ikr
Hx → −
rc
H y → − e ikr ∫ J x (r ′)e −ikz′ d 3 r ′
ik
rc
Hz → 0
(11)
e ∫ J x (r ′)e −ikz′ d 3 r ′
ik ikr
Ex →
rc
E y → e ikr ∫ J y (r ′)e −ikz ′ d 3 r ′
ik
rc
Ez → 0

Une intégration par partie a été utilisée pour éliminer les dérivées de J dans l'intégrand de H. Les
relations (11) montrent que les champs asymptotiques sont transverses à la direction de
propagation. Ils relient aussi la polarisation du rayonnement émis à la distribution de courant et
montrent que seule la composante du courant perpendiculaire à la direction de propagation
contribue à l'énergie rayonnée. La substitution dans (10) donne
k2 
J e −ikz ′ d 3 r ′ + ∫ J y e −ikz′ d 3 r ′ 
2 2

2  ∫ x
(12) Pz =
2πr c  

L'équation (12) peut être généralisée pour donner le flux d'énergie moyen dans la direction du
vecteur k :
k2
J ⊥k (r ′) exp(− ik ⋅ r ′)d 3 r ′
2
(13)
2πr c
2 ∫
où J ⊥k est la composante de J perpendiculaire à k.

Rayonnement dipolaire
L'équation (13) est une expression exacte pour l'énergie rayonnée par la distribution de courant
classique (2). L'approximation dipolaire est obtenue à la limite des grandes longueurs d'onde en
supposant que kr ′ << 1 et en remplaçant exp(− ik ⋅ r ′) par 1 dans l'intégrand. Le flux d'énergie est
alors
k2
J ⊥k (r ′)d 3 r ′
2
(14)
2πr c
2 ∫
A partir des relations (11) avec la même approximation, il est clair que la polarisation (direction du
champ électrique) du rayonnement est déterminée par le vecteur courant total J 0 ≡ ∫ J (r ′)d 3 r ′ . Le
rayonnement est polarisé linéairement si J 0 a seulement une composante dans le plan
perpendiculaire à la direction de propagation, polarisé circulairement si J 0 à deux composants
égales dans ce plan qui sont perpendiculaires et avec un décalage de phase de 90° (ainsi une
composante est i fois l'autre), etc.

Si J 0 a seulement une composante, la distribution angulaire du rayonnement peut être trouvée en

∫ J ⊥k (r ′)d r ′ dans (14) par


2
3
remplaçant

( )
(15) J 0 ⋅ J ∗0 sin 2 θ = J 0 sin 2 θ
2

où θ est l'angle entre J 0 et k, et J 0 est une abréviation pour le produit scalaire de J 0 et de son
2

complexe conjugué. La puissance totale irradiée est alors l'intégrale de (14) sur la surface d'une
sphère de rayon r :
4k 2 2
(16) J0
3c

L'équation (16) est aussi valide si J 0 a plus d'une composante et qu'elles n'ont pas nécessairement
la même phase.

Moment angulaire
Le moment angulaire rayonné par unité de temps est égal au couple exercé sur une grande sphère
parfaitement absorbante centrée sur la distribution de courant qui constitue la source de
rayonnement. Le flux d'énergie moyen est P, ainsi la densité d'énergie (dirigée) est (1 / c )P et la
( )
densité d'impulsion est 1 / c 2 P . Puisque le rayonnement voyage vers l'extérieur avec la vitesse c,
la couple exercé sur un élément différentiel de surface parfaitement absorbant, dA, qui est
perpendiculaire à r est dA/c fois le produit vectoriel de r et de la densité de moment :
(dA / c )(r × P ) . L'intégration de cette quantité sur la sphère de rayon r donne le moment angulaire
rayonné par la source par unité de temps. Donc, seules les composants de P tangentes à la sphère
sont impliquées. Avec les notations de (11) ce sont Px et Py puisque l'axe z est le long de r.

Si E z et H z étaient zéro, les composantes tangentielles Px et Py seraient aussi zéro, et aucun


moment angulaire ne serait rayonné. La troisième et la sixième relation (11) impliquent seulement
que les composantes z (radiales) des champs sont d'un ordre plus petit que 1/r. En réalité elles sont
de l'ordre de 1 / r 2 . Cela signifie que Px et Py diminuent comme 1 / r 3 pour r grand. Donc, puisque
r × P apparaît dans l'expression du moment angulaire et que l'aire de la sphère absorbante est
proportionnelle à r 2 , le moment angulaire total absorbé par une grande sphère est indépendant de r.

Nous avons besoin des termes en 1 / r 2 dans E z et H z mais pas les autres composants du champ

[ ]
H z → 2 e ikr ∫ y ′J x (r ′) − x ′J y (r ′) e −ikz′ d 3 r ′
ik
r c
(17)
[ ]
E z → 2 e ikr ∫ 2 J z (r ′) + ikx ′J x (r ′) + iky ′J y (r ′) e −ikz′ d 3 r ′
1
r c

Les relations (11) et (17) sont suffisantes pour un calcul exact du moment angulaire rayonné.

Cas dipolaire
Les expressions de Px et Py sont simplifiées par l'approximation dipolaire puisque seuls les termes
d'ordre le plus bas en kr ′ on besoin d'être retenus dans (11) et (17). Il est facile de voir que le terme
( ) ( )
dominant dans Px , par exemple, est − (c / 2π ) Re E z H ∗y et non (c / 2π ) Re E y H ∗z . Nous obtenons à
l'ordre le plus bas en kr ′
Px =
π
k
r 3c
( )
Re i ∫ J z d 3 r ′∫ J x∗ d 3 r ′
(18)
k
(
Py = 3 Re i ∫ J z d 3 r ′∫ J ∗y d 3 r ′
πr c
)
Les équations (18) se rapportent à des axes fixés par rapport à l'élément dA de l'aire absorbante en
r. Elles doivent maintenant être réécrites en fonction de coordonnées cartésiennes générales afin
que la composante du moment angulaire par rapport à un axe particulier fixé dans l'espace puisse
être trouvée. C'est analogue à réécrire l'expression du flux de l'énergie (12) sous la forme générale
(13) mais c'est quelque peu plus compliqué. Pour accomplir cela, nous choisissons de nouvelles
coordonnées cartésiennes x', y', z' qui sont fixées dans l'espace. Par rapport à ces coordonnées,
l'orientation des anciens axes dépend de r de la manière suivante (voir la figure ci-dessous) : l'axe z
est dans la direction de r et a les angles polaires θ , φ par rapport aux nouveaux axes, l'axe y est
perpendiculaire à r et dans le plan de r et z', et l'axe x est perpendiculaire au plan de r et z'.
Si maintenant nous voulons calculer la contribution de la composante z' du moment angulaire à
partir de l'absorption par l'élément de surface
(19) dA = r 2 sin θ dθ dφ
en r, nous avons seulement besoin de Px donné dans (18). Cela peut être écrit en fonction des
composantes du vecteur courant total J 0 le long des nouveaux axes comme

[ (
(20) Px = 3 Re i (J 0 x′ sin θ cos φ + J 0 y ′ sin θ sin φ + J 0 z′ cosθ ) J 0∗y′ cos φ − J 0∗x′ sin φ
k
πr c
)]
Le distance par rapport à l'axe z' associé à Px est r sin θ et ainsi l'élément différentiel de la
composante du moment angulaire est
1
(21) dL z′ = r sin θPx r 2 sin θ dθ dφ
c

La substitution de (20) dans (21) et l'intégration sur les angles polaires donne
4ik
(
(22) L z′ = 2 J 0 x′ J 0∗y ′ − J 0 y′ J 0∗x′ )
3c

Il est clair de (22) que le rayonnement d'une composante du moment angulaire dépend seulement
des composantes particulières de J 0 . De plus, ce doit être deux composantes perpendiculaires qui
sont en décalage de phase l'une par rapport à l'autre, car si J 0 x′ et J 0 y′ sont tous les deux réels ou
ont la même phase, l'expression entre parenthèses dans (22) est zéro. Donc un dipôle linéaire ( J 0
entièrement dans une direction) ne rayonne pas de moment angulaire. Le moment angulaire
2
maximum pour une valeur donnée de J 0 est rayonné quand J 0 a deux composantes
perpendiculaires égales qui sont à 90° de décalage de phase et la troisième composante
perpendiculaire est zéro. Si les composantes non nulles sont le long de x' et y' nous pouvons poser
J 0 y′= iJ 0 x′ . (22) devient alors
8k 4k
(23) L z′ = =
2 2
J 0 x′ J0
3c 2 3c 2

La comparaison des équations (16) et (23) montre que le moment angulaire rayonné maximum par
unité de temps par un dipôle électrique oscillant est 1 / kc = 1 / ω fois l'énergie rayonnée par unité de
temps. Si cette relation est portée en mécanique quantique, elle montre qu'un quantum d'énergie,
hω , rayonné par un dipôle électrique emporte avec lui une quantité de moment angulaire qui
n'excède pas h .
Conversion de la théorie classique en théorie quantique
Nous allons maintenant convertir à la mécanique quantique l'expression classique (16) pour la
puissance irradiée par un dipôle électrique. Cela nécessite que nous trouvions un analogue
quantique du vecteur courant total J 0 et que nous associons la puissance rayonnée à une
probabilité de transition entre états de la particule qui rayonne.

Nous désirons remplacer J par une densité de courant qui est associée à un état supérieur initial u k
et un état inférieur final u n , puisque l'énergie est rayonnée durant la transition de k à n. Il est
naturel de représenter la densité de courant comme le produit de la densité de charge et d'une
vitesse et de prendre pour la vitesse l'opérateur impulsion divisé par la masse : − (ih / m )∇ . On
s'attend à ce que la densité de charge pour un état stationnaire soit la charge de la particule fois la
densité de probabilité de position : eψ . Cependant, nous sommes concernés ici par une transition
2

entre états et ainsi nous remplaçons cela par eu n∗u k . La manière dont ∇ qui apparaît dans la vitesse
opère sur les fonctions d'onde qui apparaissent dans le changement de densité est déterminé par des
arguments analogues à ceux utilisés dans la définition du vecteur densité courant de charge. Nous
arrivons donc à une quantité à substituer à la densité de courant classique :
ieh ∗
(24) J (r ) → − u n (r )∇u k (r )
m

Nous supposons que (24) peut être substitué dans toutes les expressions classiques précédentes
pour donner les résultats quantiques. L'exponentielle exp(ik ⋅ r ) , par exemple, peut être placée ou
avant ou après l'opérateur ∇ , puisque seule la composante de ∇ qui est perpendiculaire à k entre
dedans.

L'intégration de (24) sur les coordonnées donne le vecteur courant total


ieh ∗ ∗
(25) J 0 = − ∫ u n ∇u k d 3 r = −ieω nk ∫ u n∗ru k d 3 r = ieω kn k r n
m
avec l'aide des résultats de la section précédente. La substitution de (25) dans (16) donne alors la
puissance rayonnée. Nous interprétons cette puissance comme le produit du taux d'émission
spontanée de la transition de k à n et de l'énergie quantique hω kn = E k − E n donnée par chaque
transition. La probabilité de transition par unité de temps pour l'émission spontanée devient alors
4e 2 k 2ω kn 2 4e 2ω kn3 2
(26) krn = 3
krn
3hc 3hc
où nous avons utilisé la relation ω kn = kc .

Formule de distribution de Planck


La transition de l'expression classique (16) à l'expression quantique (26) est seulement plausible.
L'exactitude de ce résultat peut, cependant être vérifiée en montrant que la formule de Planck pour
la distribution spectrale du rayonnement thermique dans une cavité suit de (26). C'est de cette
manière que la relation entre les probabilités pour l'absorption, l'émission induite et l'émission
spontanée fut d'abord obtenue par Einstein en 1917.

Nous supposons que les murs de la cavité contiennent des particules de charge e et de masse m,
chacune étant liée par un potentiel V analogue à celui de la section précédente. Quand ces
particules sont en équilibres avec le rayonnement thermique à la température absolue T, il doit y
avoir autant de quanta de chaque fréquence émis et absorbés par unité de temps. Le taux d'émission
de quanta de fréquence ω kn est la somme du taux d'émission induite et de (26), multiplié par le
nombre de particules qui sont dans l'état supérieur k. Le taux d'absorption de ces quanta est le
produit du taux d'absorption induite et du nombre de particules dans l'état inférieur n. A partir de la
physique statistique, le rapport d'équilibre du nombre de particules dans l'état supérieur au nombre
− (E − E ) / κT
dans l'état inférieur est donné par e k n , où κ est la constante de Boltzmann. Nous obtenons
donc, en enlevant les indices de ω kn ,
 4π 2 e 2 4e 2ω 3  4π 2 e 2
(27) e −hω / κT  2 I (ω ) k r n I (ω ) k r n
2 2 2
+ krn = 2
 3h c 3hc  3h c

On résout facilement cette expression pour I (ω ) ou, de manière équivalente,


I (ω )∆ω hω 3 ∆ω
= 2 3 hω / κT
(28) Densité d'énergie =
c π c e ( −1 )
Il est intéressant de noter que les paramètres e, m et k r n de la particule qui émet et absorbe le
rayonnement s'éliminent de l'expression pour I (ω ) . L'accord entre (28) et la formule de distribution
de Planck fournit une vérification des rapports de l'émission induite à l'émission spontanée et donc
montre que cette dernière expression est correcte si la précédente l'est.

Largeur de ligne
Un oscillateur classique qui rayonne des ondes électromagnétiques perd de l'énergie, ainsi
l'amplitude de l'oscillation diminue avec le temps. Donc les champs électromagnétiques qu'il donne
1
− γt
doivent être une sinusoïde amortie dans le temps : e cos(ω 0 t + α ) . L'analyse de Fourier de ces
2

champs donnent le spectre de fréquences du rayonnement de l'oscillateur. L'intensité rayonnée par


unité de domaine de fréquence à la pulsation ω est proportionnelle à
1
(29)
(ω − ω 0 )2 + 14 γ 2
Selon (29), l'intensité de la ligne spectrale émise a la moitié de sa valeur maximale quand
ω = ω 0 ± 12 γ . La quantité γ est appelée la largeur de ligne naturelle et dans les cas intéressant en
pratique elle est petite par rapport à ω 0 .

La largeur de ligne est évidemment deux fois le taux fractionnaire initial de décroissance de
l'amplitude de l'oscillateur classique ou est égale au taux fractionnaire initial de décroissance de
l'énergie de l'oscillateur. Il est plausible d'associer le taux de décroissance de l'énergie de
l'oscillateur classique au taux de décroissance de la probabilité de trouver le système quantique
correspondant dans son état supérieur initial. Si cela est fait, l'analogue quantique de la largeur de
ligne naturelle classique γ est la probabilité de transition initiale par unité de temps pour l'émission
spontanée donnée par (26). Bien que ce résultat soit correct si l'état final est l'état de base, il y a un
élargissement supplémentaire de la ligne si l'état final a une largeur finie.
La relation précédente entre probabilité de transition et largeur de ligne peut être obtenue d'une
manière qualitative mais plus générale au moyen de la relation d'indétermination. La réciproque de
la probabilité de transition par unité de temps est de l'ordre de grandeur du temps que le système
quantique reste dans l'état supérieur. Donc une détermination de l'énergie de l'état supérieur ne peut
pas prendre un temps qui est plus grand que de l'ordre de la durée de vie 1 / γ de cet état. Selon la
relation d'indétermination, cela signifie que l'énergie ne peut pas être déterminée avec une précision
plus grande que h divisé par la durée de vie, ou hγ . Si l'énergie de l'état supérieur est incertaine
par cette quantité, la fréquence de la ligne émise sera incertaine (ou élargie) de γ . En général, un
niveau d'énergie quantique est élargit par tout processus qui raccourcit sa durée de vie. Le niveau
est parfaitement net seulement si la durée de vie de l'état est infinie (vraie fonction propre
stationnaire de l'énergie).

Une idée qualitative de la largeur de ligne des lignes électriques dipolaires émises par un système
quantique peut être obtenue en récrivant l'expression (26) de γ sous la forme
γ 4 e2 2 2
(30) = k krn
ω kn 3 hc

Le facteur e 2 / hc est une constante sans dimension qui est presque égale à 1 / 137 si e est la charge
2
électronique (constante de structure fine) et le facteur k 2 k r n a déjà été supposé petit par
rapport à l'unité en passant à l'approximation dipolaire. Donc, on s'attend à ce que le rapport du
largeur de ligne à la pulsation soit assez petit (il est de l'ordre de 10 −6 pour des lignes dipolaires
atomiques typiques).
II.5. Quelques applications de la théorie du rayonnement
La théorie du rayonnement semi-classique développée précédemment sera appliquée d'abord à la
détermination des conditions pour les transitions autorisées puis à la théorie de l'effet
photoélectrique.

Règles de sélection pour une seule particule


La discussion des transitions interdites a montré que les probabilités pour l'absorption et l'émission
induite sont réduites par un facteur au moins (ka ) par rapport aux transitions autorisées si
2

l'élément de matrice dipolaire k r n s'annule. La même remarque s'applique à la probabilité


d'émission spontanée puisque l'intégrale est la même quand on substitue à J l'expression que nous
avons déduite en mécanique quantique.

Les conditions sur u k et u n pour lesquelles l'élément de matrice dipolaire est différent de zéro
constitue les règles de sélection que nous avons déjà utilisées dans les modèles de noyaux. Elles
sont facilement formulées si le potentiel V qui apparaît dans l'hamiltonien non perturbé est à
symétrie sphérique. On a déjà montré que les fonctions propres de l'énergie peuvent être écrites
comme des produits de fonctions de la distance radiale r et d'harmoniques sphériques Ylm (θ , φ ) .
L'élément de matrice k r n est le vecteur dont les composantes cartésiennes sont les éléments de
matrice correspondant de x, y et z. L'élément de matrice de z est ∫ u k∗ r cosθ u n d 3 r , qui peut être
écrit comme un produit d'intégrales sur r et l'intégrale angulaire
π 2π
(1) ∫∫ Ylm∗ (θ , φ ) cosθ Yl′m′ (θ , φ ) sin θ dθ dφ
0 0
où les indices avec et sans apostrophes sont les nombres quantiques de moment angulaire pour l'état
le plus bas u n et l'état le plus haut u k , respectivement.


L'intégration sur φ dans (1) est ∫ e i (m′− m )φ dφ qui est zéro sauf si m′ = m . L'intégration peut alors
0
être écrite, en dehors des facteurs numériques,
wPl m (w)Pl ′m (w)dw
1
(2) ∫ w = cosθ
−1

Maintenant, on peut montrer avec l'aide de la fonction génératrice pour les fonctions de Legendre
associées que
l+ m m l − m +1 m
(3) wPl m (w) = Pl −1 (w) + Pl +1 (w)
2l + 1 2l + 1

La substitution dans (2) et l'utilisation de l'orthonormalité des fonctions de Legendre associées


montre que l'élément de matrice de z s'annule sauf si m′ = m et l ′ = l ± 1 . Un traitement similaire
montre que l'élément de matrice de x + iy s'annule sauf si m′ = m − 1 et l ′ = l ± 1 et l'élément de
matrice de x − iy s'annule sauf si m′ = m + 1 et l ′ = l ± 1 . Ces règles de sélection peuvent aussi être
déduites dès règles de combinaison des moments angulaires et déterminent les transitions
(électriques dipolaires) autorisées possibles pour une seule particule chargée qui se déplace dans un
champ de force central.

Polarisation du rayonnement émis


La discussion sur le rayonnement dipolaire a montré que la polarisation du rayonnement émis est
déterminée par le vecteur courant total J 0 et donc par l'élément de matrice dipolaire. Quand les
états initiaux et finaux ont des valeurs de l qui diffèrent d'une unité et le même nombre quantique
magnétique m par rapport à l'axe z, seul l'élément de matrice de z ne s'annule pas. Le rayonnement
est alors polarisé linéairement le long de l'axe z s'il se propage dans le plan xy et il n'y a pas de
rayonnement le long de l'axe z. Quand les nombres quantiques magnétiques des états initiaux et
finaux diffèrent d'une unité, les composantes x et y sont déphasées de 90° et la composante z
s'annule. Le rayonnement est alors polarisé circulairement s'il se propage le long de l'axe z et
polarisé linéairement perpendiculairement à l'axe z s'il se propage dans le plan xy. Ces résultats
sont intéressants en relation avec la polarisation du rayonnement d'atomes placés dans un champ
magnétique.
Conservation du moment angulaire
Comme nous l'avons vu, le moment angulaire transporté par un quantum émis a sa valeur maximale
∗ ∗
h et est dirigé le long de l'axe z, quand J 0 y = iJ 0 x . Cela est le cas lorsque k y n = i k xn ou
(
k y n = −i k x n . Maintenant, x = r sin θ cos φ = 12 r sin θ e iφ + e −iφ et )
y = r sin θ sin φ = − 12 ir sin θ (e iφ − e −iφ ) . Il est clair à partir des intégrations sur φ dans (1) que, afin
que l'élément de matrice de y soit égal à -i fois l'élément de matrice de x, le nombre quantique
magnétique de l'état initial u k doit être plus grand que le nombre quantique magnétique de l'état
final u n d'une unité. Connaissant le moment angulaire associé aux harmoniques sphériques, il est
clair que la composante z du moment angulaire a diminué de h durant la transition. Donc le
moment angulaire est conservé entre la particule rayonnante et le quantum émis.

Le résultat précédent est basé sur la relation entre les densités de courant classiques et quantiques
que nous avons supposée. La dérivation réussie de la loi de distribution de Planck montre que cette
relation est correcte au moins tant que la grandeur est concernée. La démonstration ci-dessus du
moment angulaire montre en plus que les phases des états initiaux et finaux sont insérées
correctement dans cette relation. Si, par exemple, J avait été supposé proportionnel à u k∗ ∇u n , un
résultat inconsistant aurait été obtenu.

Si le nombre quantique magnétique ne change pas dans une transition, seul l'élément de matrice de
z ne s'annule pas et la discussion sur le rayonnement montre que le quantum ne transporte aucun
moment angulaire. Cela peut sembler au premier abord en contradiction avec le changement d'une
unité du nombre quantique l de moment angulaire orbital. Les composantes x et y du moment
angulaire de la particule ne commutent pas avec la composante z (qui dans ce cas est connue
comme étant mh et ne change pas), ainsi elles ne peuvent pas être spécifiées avec précision. Leur
valeur moyenne pour des états qui sont décrit par les nombres quantiques l et m sont zéro, puisque
les éléments diagonaux des matrices pour les composantes x et y du moment angulaire sont tous
zéro. Donc il n'y a pas de changement observable dans les composantes du moment angulaire de la
particule et ainsi la valeur moyenne du moment angulaire emporté par le quantum devrait être zéro.
Les composantes x et y du moment angulaire pour une particule dans un état stationnaire peuvent
être vues comme fluctuant autour de zéro de telle manière que leurs valeurs moyennes sont zéro
bien que le carré de leur moyenne ne le soit pas (ce qui est en accord avec les valeurs propres
l (l + 1)h 2 du carré moment angulaire total et avec les valeurs propres mh de la composante z du
moment angulaire). Le changement de l correspond au changement des moyennes de ces carrés.

Règles de sélection pour des systèmes à plusieurs particules


Quand un système quantique consiste en plusieurs particules qui n'interagissent pas entre elles,
l'hamiltonien total est simplement une somme de termes comme H 0 + H ′ . Les fonctions propres de
l'énergie non perturbées sont des produits de fonctions propres à une particule telles que celles que
nous avons étudiées (ou une somme de produits selon que les particules sont des fermions, des
bosons ou non identiques). Il est clair que l'élément de matrice qui apparaît dans la théorie des
perturbations au premier ordre (émission et absorption induite) implique une intégrale multiple de
la forme
(4) ∫ L ∫ u a∗′ (1)u b∗′ (2 )L[H ′(1) + H ′(2 ) + L]u a (1)u b (2 )L d 3 r1 d 3 r2 L

A cause de l'orthogonalité des différents u pour la même particule, cette intégrale s'annule sauf si
toutes les fonctions à une particule u a′ ,… sont égales aux fonctions correspondantes u a ,… excepté
une. Donc, seule une particule peut changer d'état pendant une transition et les règles de sélection
pour un champ de force central sont précisément celles données ci-dessus. Puisque la probabilité de
transition spontanée peut être reliée à la même intégrale à travers la formule de distribution de
Planck, ces règles de sélection sont valides pour l'émission spontanée aussi bien que pour
l'absorption et l'émission induite.

Si le système consiste en plusieurs particules chargées dont les interactions mutuelles ne peuvent
pas être négligées, nous devons baser les règles de sélection sur les lois de conservation générales
pour le moment angulaire et la parité. Il n'est pas difficile de généraliser le travail des sections
précédentes pour montrer que le terme dominant, quand la longueur d'onde du rayonnement est
grande par rapport aux dimensions du système, est l'élément de matrice du moment électrique
dipolaire total e1r1 + e2 r2 + L . Le moment angulaire rayonné par un dipôle oscillant ne peut pas,
selon ce que nous avons vu, excéder h par quantum. Cet argument classique est basé sur une
distribution de courants arbitraires, ainsi il n'est pas invalidé si plusieurs particules contribuent au
dipôle. L'interprétation de la conservation du moment angulaire entre le quantum émit et le système
rayonnant est compliquée par la structure semi-classique du traitement complet. Un traitement
complet basé sur l'électrodynamique quantique montre que la règle de sélection correcte basée sur
cette loi de conservation est que le nombre quantique de moment angulaire total du système peut
rester inchangé ou peut s'accroître ou décroître d'une unité. Un cas exceptionnel est celui dans
lequel le nombre quantique est zéro à la fois pour les états initiaux et finaux. Les fonctions d'onde
initiales et finales sont alors à symétrie sphérique et une extension de l'argument donné à la fin de la
section sur l'absorption et l'émission induite montre qu'une transition radiative entre ces états n'est
pas seulement interdite (pas de transition dipolaire autorisée) mais strictement interdite (pas de
transition du premier ordre).

La discussion de la parité est facilement étendue pour montrer que la parité de chaque fonction
propre de l'énergie peut être bien définie si l'hamiltonien total est inchangé par renversement des
coordonnées de toutes les particules. L'opérateur moment dipolaire électrique donné ci-dessus est
évidemment impair par rapport au renversement de toutes les coordonnées donc ses éléments de
matrice s'annulent dans ce cas sauf si les états initiaux et finaux ont des parités opposées. Cette
règle de sélection est connue comme la règle de Laporte.

Règles de sélection pour les atomes


En ce qui concerne les atomes à plusieurs électrons de la table périodique des éléments. Seul un
électron est impliqué dans une transition, tel que dans une transition autorisée la configuration
change à travers le changement d'un des l d'une unité, cela change aussi la parité. Puisque le
moment dipolaire électrique n'implique pas les spins et que les fonctions de spin pour différents S
sont orthogonales, S ne change pas dans une transition autorisée. La conservation du moment
angulaire entre atome et rayonnement nécessite de plus que J et L changent chacun par 1 ou 0. Les
transitions entre états ayant tous les deux J = 0 sont strictement interdites.

Les lignes qui joignent les états de multiplicité différente (changement dans S) se produisent
quelque fois et indiquent une rupture partielle du couplage LS. La ligne de résonance du mercure
très intense à 2537 Å est une telle ligne : 3 P1 →1S 0 . Cette transition est autorisée en ce qui concerne
les changements dans la configuration J, L et la parité mais pas en ce qui concerne le changement
dans S. L'état 3 P1 est partiellement mélangé par l'énergie spin - orbite avec un état singulet plus
élevé (S = 0) de même J et parité et cela rend la transition électrique dipolaire possible.

Effet photoélectrique
Quand un système lié qui contient des particules chargées est irradié par des quanta d'énergie
suffisante, il y a une probabilité finie que le système se brise. Ce processus est habituellement
appelé effet photoélectrique dans le cas des atomes et photodésintégration dans le cas des noyaux.
Par exemple, considérons le cas de l'éjection d'un électron d'un atome d'énergie hω > ε , où − ε est
l'énergie d'état de base de l'électron. La fonction d'onde initiale de l'électron est u 0 (r ) et dans son
état final, il a l'énergie cinétique
h2k 2
(5) = hω − ε
2m

Nous supposons que le rayonnement est incident le long de l'axe des z positifs et est polarisé avec
son vecteur électrique le long de l'axe x. Alors l'élément de matrice pour la transition est donné par
ieh ∗ iω z / c  ∂u 0  3
(6) k H ′ 0 0 =
mc ∫
uk e A0  d r
 ∂x 

Nous supposons que l'état final peut être représenté avec suffisament de précision par l'onde plane
3

u k (r ) = L 2 exp(ik ⋅ r ) . C'est équivalent à l'hypothèse que l'approximation de Born est valide pour
la diffusion de l'électron par l'ion restant.

Avec l'aide d'une intégration partielle, (6) devient


ehA0 k x  w 
(7) k H ′ 0 0 = − 3 ∫ 0
u exp i z − k ⋅ r  d 3 r
 c 
mcL2

La probabilité de transition par unité de temps à partir de l'état lié vers l'état ionisé (voir le calcul
des probabilités de transition dans l'étude des méthodes d'approximation des états liés) est
mkL3 2
(8) w = k H ′0 0 sin θ dθ dφ
4π h
2 3

Il est pratique dans ce qui suit d'introduire le moment hK qui est transféré à l'atome :
ω
(9) K = 1z − k
c
où 1 z est un vecteur unité dans la direction z. La section efficace différentielle pour l'effet
photoélectrique est égale à w divisée par le flux incident de photons. Ce flux est obtenu en divisant
l'intensité incidente par hω , et donc
e 2 kk x2
(10) σ (θ , φ ) sin θ dθ dφ = ( )
2
sin θ dθ dφ
2πmcω ∫
u 0 exp i K ⋅ r

Distribution angulaire
Il y a deux facteurs dans (10) qui déterminent la distribution angulaire des photoélectrons éjectés.
L'un d'eux est le facteur k x2 qui montre que les électrons tendent à avoir une distribution en carré de
cosinus par rapport au vecteur de polarisation du rayonnement incident. Si le rayonnement est non
( )
polarisé, k x2 doit être remplacé par 12 k x2 + k y2 ainsi il y a une distribution en carré de sinus par
rapport à la direction incidente. Dans tous les cas, les électrons sont éjectés de préférence à angle
droit du faisceau incident de photons.

L'apparition du vecteur transfert de moment K dans l'intégrand de (10) affecte aussi la distribution
angulaire. Nous avons déjà rencontré cela lors de la diffusion d'électrons par l'hydrogène. Les
intégrales de ce type qui apparaissent dans (10) décroissent généralement lorsque K croît.
Maintenant, K est le plus petit quand k est dans la direction z, ainsi la dépendance avec K de (10)
tend à décaler le maximum de la section efficace différentielle vers la direction en avant.
Cependant, cet effet est seulement appréciable quand k et ω / c sont comparables en grandeur. Si
nous supposons pour le moment que ε peut être négligé dans (5), la quantité
ω / ck ≈ hk / 2mc = v / 2c , où v est la vitesse de l'électron éjecté. Donc le décalage vers l'avant du
maximum de la section efficace se produit pour des photons et des électrons éjectés de haute
énergie, auquel cas ε peut en effet être négligé comme supposé plus haut.
Les quantités k et ω / c peuvent aussi être comparables très près du seuil photoélectrique, quand
hω est seulement légèrement plus grand que ε . Cependant, l'approximation de Born n'est pas
valide dans ce cas.

Section efficace pour l'effet photoélectrique atomique


Nous allons maintenant nous concentrer sur la situation où le photoélectron est éjecté de l'état le
plus bas (couche K ou 1s) d'un atome. La fonction d'onde initiale u 0 (r ) est alors la fonction d'onde
u100 (r ,θ , φ ) et est donnée par

( )
(11) u 0 (r ) = πa 3
−1 / 2
e −r / a a=
a0
Z
a0 =
h2
me 2

Aussi longtemps que u 0 est à symétrie sphérique, l'intégration sur l'angle dans (10) est facilement
effectuée et donne
8πe 2 kk x2 ∞ 2
(12) σ (θ , φ ) = ( )
mcω K 2 ∫0
u 0 r sin Kr rdr

La substitution de (11) dans (12) conduit à


32e 2 a 3 kk x2
(13) σ (θ , φ ) =
(
mcω 1 + K 2 a 2
4
)
Nous avons vu que l'approximation de Born est la meilleure à haute énergie et pour Ze 2 / hv << 1 .
( )
Mais, ε = Z 2 e 2 / 2a 0 , donc h 2 k 2 / 2mε = hv / Ze 2 . Donc, ε peut être négligé dans (5). Puisque,
2

comme montré ci-dessus, ω / ck ≈ v / 2c dans ce cas, la grandeur de K donnée par (9) est
approximativement k (1 − v cosθ / 2c ) . De plus, ka = hv / Ze 2 >> 1 . Donc le facteur 1 + K 2 a 2 au
dénominateur de (13) peut être remplacé approximativement par k 2 a 2 (1 − v cosθ / c ) . Nous
obtenons donc pour la section efficace différentielle de l'effet photoélectrique haute énergie
32e 2  4v 
(14) σ (θ , φ ) ≈ sin 2 θ cos 2 φ 1 + cosθ 
mcω (ka )
5
 c 

Puisque l'électron a été traité de manière non relativiste, v/c doit être assez petit devant l'unité et
donc les termes d'ordre v 2 / c 2 ont été négligés dans (14). L'intégration sur les angles conduit à la
section efficace totale
128π e2
(15) σ ≈
3 mcω (ka )5

Il suit de (5) et (11) que σ est proportionnel à Z 5 / (hω ) . En utilisant (15), on doit se souvenir
7/2

que σ est la section efficace totale pour chacun des électrons K et doit donc être doublée pour
obtenir la section efficace atomique totale pour l'effet photoélectrique de la couche K.

Il est intéressant de noter que le terme dominant dans (14), pour lequel v/c est négligé par rapport à
l'unité, et (15) résulte de l'approximation électrique dipolaire dont nous avons discuté. Dans cette
approximation, e iω z / c est remplacé par l'unité.

Amélioration de l'approximation de Born


Il y a deux aspects sur lesquels le calcul précédent est basé au premier ordre de la théorie des
perturbations. Tout d'abord, l'élément de matrice (6) est considéré comme petit, ainsi l'interaction
entre l'électron et le champ électromagnétique est traitée au premier ordre. Deuxièmement, la
fonction d'onde de l'électron est considérée comme une onde plane dans l'état final, ainsi l'effet du
potentiel de l'ion sur cet état est négligé. Il est très difficile d'améliorer le calcul du premier point et
une telle amélioration est peu justifiée étant donné la faiblesse de l'interaction électron -
rayonnement. D'un autre coté, une amélioration du deuxième point est réalisable et l'intérêt de cette
amélioration est justifiée puisque les résultats seraient alors applicables aux basses énergies et pour
les grandes valeurs de Z. C'est-à-dire que Ze 2 / hv ne devrait plus être petit par rapport à l'unité. On
peut réaliser cette amélioration en utilisant l'approximation de fonction d'onde de Born déformée
que nous avons étudiée plus tôt.
Exercices
1. Montrez que, si ∇ ⋅ J = ρ = 0 , la solution la plus générale des équations de Maxwell peut être
exprimée en fonction de potentiels tels que ∇ ⋅ A = φ = 0 .
2. Montrez que la densité de probabilité associée avec l'équation (1) de la section II.3 est donnée
par ψ ∗ (r, t )ψ (r, t ) et que la densité de courant de probabilité
h
2im
(
ψ ∗∇ψ − (∇ψ ∗ )ψ ) doit être
modifiée.
3. Montrez que, si la transformation de jauge (5) de la section II.3 est accompagnée de la
transformation ψ ′ = ψe ieχ / hc , la forme de l'équation de Schrödinger (1) n'est pas affectée.
4. Estimez l'ordre de grandeur de eA / cp , quand e est une charge électronique, A la grandeur du
potentiel vecteur pour la partie visible du spectre qui correspond au rayonnement dans une
cavité à plusieurs millier de degrés centigrades et p le moment d'un électron dans le premier état
excité de l'hydrogène.
5. Vérifiez l'équation (28) de la section II.3 au moyen de l'équation de Schrödinger sans recourir à
la méthode matricielle.
6. Montrez que la probabilité de transition pour l'émission spontanée est égale à la probabilité de
transition qui résulterait d'un champ isotrope d'une intensité telle qu'il y a un quantum par état
du champ dans le voisinage de la fréquence de transition.
7. Un atome d'hydrogène dans son premier état excité (2p) est placé dans une cavité. A quelle
température de la cavité les probabilités de transition spontanées et induites sont-elles égales ?
8. Quelle est la probabilité de transition spontanée par unité de temps, exprimée en sec −1 , d'un
atome d'hydrogène dans son premier état excité ?
9. Quelle est la règle de sélection pour les transitions permises d'un oscillateur harmonique
linéaire ? Quelle est la probabilité de transition spontanée par unité de temps, exprimée en
sec −1 , d'un oscillateur dans son premier état excité, quand e, m et ω sont les mêmes que dans
l'exercice 8 ?
10. Montrez qu'un facteur logarithmique comme celui obtenu dans l'exercice 14 à la fin de la
section I.3.3.4 apparaît toujours dans la section efficace pour l'excitation d'un atome avec un
électron par l'impact d'un électron, si la transition radiative correspondante est autorisée.
Dérivez la relation la plus simple que vous pouvez entre la section efficace différentielle pour
l'excitation d'un électron par impact et la probabilité de transition correspondante pour
l'émission spontanée, en supposant que la transition est autorisée.
11. Utilisez l'expression dipolaire (14) de la section II.4 pour l'intensité rayonnée pour trouver la
distribution angulaire du rayonnement quand J 0 y = iJ 0 x , J 0 z = 0 . Montrez aussi que la
puissance rayonnée totale est encore donnée par l'équation (16).
12. Montrez que k ⋅ r dans l'équation (23) de la section II.3 est de l'ordre de e 2 / hc ≈ 1 / 137 pour
une transition de l'atome d'hydrogène.
13. Supposez que l'interaction entre le neutron et le proton qui forment un deutéron puisse être
représentée par un puits de potentiel carré pour lequel a = 0 (porté zéro ou interaction en
fonction delta de Dirac) et que le seul niveau d'énergie lié du système a l = 0 et ε = 2.23 MeV .
Montrez qu'aucune erreur n'est introduite dans le calcul de la section efficace de
photodésintégration si la fonction d'onde de l'état final est choisie comme une onde plane.
Trouvez les sections efficaces différentielle et totale pour des photons non polarisés.
III. Structure hyperfine

III.1. Les états de base d'un système fait de deux particules de spin un
demi
Nous allons maintenant attaquer une situation relativement facile mais intéressante : la structure
"hyperfine" de l'hydrogène. Comme vous le savez, l'atome d'hydrogène consiste en un électron
installé au voisinage du proton. Cet électron occupe un des états d'une suite discrète d'états
d'énergies différentes et dans chacun de ces états, son mouvement est d'un type différent. Le
premier état excité, par exemple, est situé à 0.75 Rydberg, soit à peu près 10 électronvolts, au-
dessus de l'état d'énergie minimum. Mais même l'état appelé état d'énergie minimum n'est pas un
état unique d'énergie définie, à cause des spins de l'électron et du proton. Ces spins sont
responsables de la structure "hyperfine" des niveaux d'énergie : tous les niveaux d'énergie se
subdivisent en plusieurs niveaux presque égaux.

Par rapport à une direction de référence, l'électron peut avoir son spin ou bien "en haut" ou bien "en
bas" et il en va de même pour le proton. Il existe donc quatre états possibles de spin pour chaque
situation dynamique de l'atome. Autrement dit, quand on parle de l'état d'énergie minimum de
l'hydrogène, on sous-entend en fait les quatre états d'énergie minimum et non pas l'état tout à fait le
plus bas. Les quatre états de spin n'ont pas tous exactement la même énergie. Il y a de petits
décalages par rapport à l'énergie que nous aurions en l'absence de spins. Cependant ces décalages
sont beaucoup plus petits que les 10 électronvolts qui séparent l'état d'énergie minimum de l'état
situé juste au-dessus. En conséquence, chaque état dynamique à son énergie subdivisée en une série
de niveaux d'énergie très voisins. C'est ce que l'on appelle la structure hyperfine.

Ce sont les différences d'énergie entre les quatre états de spin que nous voulons calculer ici. La
structure hyperfine est due à l'interaction entre les moments magnétiques de l'électron et du proton,
laquelle donne une énergie magnétique légèrement différente pour chaque état de spin. Ces
décalages d'énergie ne sont que d'environ un dix millionième d'électronvolt, ce qui est vraiment très
petit par rapport à 10 électronvolts ! C'est à cause de cette grande différence qu'il nous est possible
de considérer l'état d'énergie minimum de l'hydrogène comme un système "à quatre états", sans
nous préoccuper des nombreux autres états d'énergie plus élevée. Nous nous limiterons ici à une
étude de la structure hyperfine de l'état d'énergie minimum de l'atome d'hydrogène.

Pour ce que nous voulons faire, les détails sur les positions de l'électron et du proton ne nous
importent pas. Tout cela a été, en quelque sorte, arrangé par l'atome lui-même, il s'est installé dans
l'état d'énergie minimum. Il nous suffit de savoir que nous avons un électron et un proton au
voisinage l'un de l'autre, ayant entre eux des relations spatiales définies. Par ailleurs, leurs spins
peuvent avoir diverses orientations relatives. Et c'est seulement l'effet des spins que nous voulons
considérer.

La première question qu'il nous faut aborder est celle-ci : quels sont les états de base du système ?
Mais la question est mal posée : il n'existe pas un ensemble "unique" d'états de base, parce que,
bien sûr, l'ensemble d'états de base que vous pouvez choisir n'est pas unique. Il est toujours possible
de construire d'autres ensembles d'états définissant une base, par combinaisons linéaires des
premiers. Ainsi la question n'est pas : quels sont les états de base, mais bien quel ensemble d'états
pourrait constituer une base ? C'est à nous de choisir celui qui nous convient le mieux. En général,
il vaut mieux choisir au départ l'ensemble d'états dont la signification physique est la plus claire. Ce
choix peut fort bien ne pas correspondre à la solution, ou encore n'avoir aucune importance directe,
mais il rendra en général plus facile la compréhension de ce qui se passe.

Nous choisissons les quatre états de base suivants :


 Etat 1. L'électron et le proton ont l'un et l'autre le spin "en haut".
 Etat 2. L'électron a spin "en haut" et le proton "en bas".
 Etat 3. L'électron a spin "en bas" et le proton "en haut".
 Etat 4. L'électron et le proton ont l'un et l'autre spin "en bas".

Nous avons besoin d'une notation pratique et nous représenterons donc ces quatre états comme suit
:
 Etat 1. + + . Electron haut, proton haut.
 Etat 2. + − . Electron haut, proton bas.
 Etat 3. − + . Electron bas, proton haut.
 Etat 4. − − . Electron bas, proton bas.

Nous devrons nous souvenir que le premier signe plus ou moins se réfère à l'électron et le second
au proton. Pour pouvoir nous y référer, nous avons groupé ces notations dans la figure ci-dessous.
Il sera parfois pratique de désigner ces états par 1 , 2 , 3 , 4 .

Vous objecterez peut-être "ces particules interagissent, il se peut donc que ce ne soient pas là des
états de base corrects. Il semblerait que vous considérez les deux particules comme indépendantes".
Eh oui ! L'interaction pose le problème : quel est l'hamiltonien du système ? Mais l'interaction n'est
pas concernée s'il s'agit de la question : comment décrire le système ? Ce que nous choisissons
comme états de base, n'a rien à voir avec ce qui va se passer. Il est possible que l'atome ne puisse
pas du tout rester dans l'un des états de base, même s'il y était au départ. Mais là n'est pas la
question. Voici la question : comment changent avec le temps les amplitudes dans une base
particulière (et fixe) ? En choisissant les états de base, nous ne faisons que choisir les "vecteurs
unités" pour notre description.

Puisque nous sommes sur ce sujet, considérons le problème général de la recherche d'un ensemble
d'états de base, lorsqu'il y a plus d'une particule. Un électron, par exemple, est entièrement décrit
dans la vie réelle, pas dans nos cas simples, mais dans la vie réelle, en donnant les amplitudes pour
qu'il soit dans chacun des états suivants :
(1) électron spin " en haut" avec l' impulsion p
ou
(2) électron spin " en bas" avec l' impulsion p

Il y a en fait deux séries d'états, un état pour chaque valeur de p. Autrement dit un état ψ de
l'électron est complètement décrit si vous connaissez toutes les amplitudes
(3) +, p ψ et −, p ψ
où les + et les - représentent les composantes du moment angulaire le long d'un certain axe,
généralement l'axe z, et où p est le vecteur impulsion. Il doit donc y avoir deux amplitudes pour
chaque impulsion possible (une infinité d'états de base). Il n'en faut pas plus pour décrire une
particule unique.

Quand il y a plus d'une particule, les états de base peuvent s'écrire d'une manière similaire. Si l'on
avait, par exemple, un électron et un proton dans une situation plus compliquée que celle que nous
considérons ici, les états de base pourraient être du type suivant :
(3) | un électron avec spin "en haut", se déplaçant avec l'impulsion p1 et un proton avec spin "en
bas" se déplaçant avec l'impulsion p 2 >
Et ainsi de suite pour les autres combinaisons de spins. S'il y a plus de deux particules, même
principe. Vous voyez qu'il est vraiment très facile d'écrire les états de base possibles. Le seul
problème est : quel est l'hamiltonien ?

Pour notre étude sur l'état d'énergie minimum de l'hydrogène, nous n'avons pas besoin de la série
complète des états de base correspondant aux diverses impulsions. Du seul fait que nous disons
"état d'énergie minimum", nous spécifions des états particuliers d'impulsion pour le proton et
l'électron. Les points de détails de la configuration, les amplitudes pour tous les états de base
d'impulsion, peuvent se calculer, ce que nous avons d'ailleurs déjà fait, mais c'est un tout autre
problème. Nous ne nous occupons ici que des effets de spin, aussi nous pouvons nous contenter des
quatre états de base ci-dessus; Notre problème est maintenant : quel est l'hamiltonien pour cet
ensemble d'états ?
III.2. L'hamiltonien pour l'état d'énergie le plus bas de l'hydrogène
Nous vous dirons dans un moment ce qu'il en est. Tout d'abord il nous faudrait vous rappeler une
chose : tout état peut toujours s'écrire comme une combinaison linéaire des états de base. Pour tout
état nous pouvons écrire
(1) ψ = + + + + ψ + + − + − ψ + − + − + ψ + − − − − ψ

Souvenez-vous que les crochets sont simplement des nombres complexes et que l'on peut donc les
écrire sous la forme habituelle des C i (i = 1, 2, 3, 4) et (1) s'écrit :
(2) ψ = + + C1 + + − C 2 + − + C 3 + − − C 4

En donnant les amplitudes C i nous décrivons complètement l'état de spin ψ . Si ces quatre
amplitudes changent avec le temps, et elles changeront, le taux de changement est donné par
l'opérateur Ĥ . Le problème est de trouver ce Ĥ .

Il n'existe pas de règle générale pour écrire l'hamiltonien d'un système atomique. La découverte de
la formule exacte est tout autre chose que la recherche des états de base, c'est un art. Nous étions
capables de vous donner une règle générale pour écrire un ensemble d'états de base pour tout
problème concernant un proton et un électron. Décrire par contre l'hamiltonien général pour une
telle association est trop difficile. Au lieu de cela, nous vous conduirons vers un hamiltonien par
une certaine approche heuristique, et vous devrez le supposer correct car les résultats seront en
accord avec l'observation expérimentale.

Nous avons déjà pu décrire l'hamiltonien d'une particule unique de spin un demi en utilisant les
opérateurs de Pauli. Réunissons les propriétés de ces opérateurs dans le tableau suivant.
σz + =+ +
σz − = − −
σx + = + −
σx − =+ +
σ y + = +i −
σ y − = −i +

Ces opérateurs, qui ne sont qu'une manière pratique et concise pour parler des éléments de matrice
du type + σ z + , ont été utiles pour décrire le comportement d'une particule unique de spin un
demi. Nous nous demandons : pouvons-nous trouver un procédé analogue pour décrire un système
avec deux spins ? La réponse est oui, et très simplement, comme il suit. Nous inventons une chose
que nous désignerons par "l'opérateur électron" et que nous représenterons par le vecteur opérateur
σ e , et qui a σ xe , σ ye , σ ze pour composantes x, y, z. Nous décidons par convention que, si l'une de
ces choses agit sur l'un de nos quatre états de base de l'atome d'hydrogène, son action ne concerne
que le spin de l'électron et qu'elle est exactement ce qu'elle serait sur l'électron isolé. Exemple : que
vaut σ ye − + ? Puisque σ y agissant sur un électron spin "en bas" donne l'état correspondant avec
spin "en haut" multiplié par -i,
(3) σ ye − + = −i + +

Quand σ ye agit sur l'état combiné, il retourne le spin de l'électron, mais ne fait rien au proton, et il
multiplie l'état par -i. L'action de σ ye sur les autres états donnerait
σ ye + + = i − +
(4) σ ye + − = i − −
σ ye − − = −i + −

Souvenez-vous simplement que les σ e n'agissent que sur le premier symbole de spin, c'est-à-dire
sur le spin de l'électron.
Nous définissons ensuite l'opérateur correspondant pour le spin du proton : "l'opérateur proton". Ses
trois composantes σ xp , σ yp , σ zp agissent de la même manière que σ e , mais cette fois sur le spin du
proton uniquement, en utilisant encore le tableau précédent,
σ xp + + = + −
σ xp + − = + +
(5)
σ xp − + = − −
σ xp − − = − +

Comme vous voyez, ce n'est pas très difficile.

Dans le cas le plus général, nous pourrions avoir des choses beaucoup plus compliquées. Par
exemple, nous pourrions avoir des produits de deux opérateurs tels que σ yeσ zp . Quand nous avons
un produit de ce genre, nous faisons d'abord ce que nous dit de faire l'opérateur de droite et ensuite
ce que nous dit l'autre. Pour ces opérateurs particuliers, vous noterez que l'ordre des opérations se
révèle être sans importance, ils commutent. Ainsi, nous aurions :
( )
(6) σ xeσ zp + − = σ xe σ zp + − = σ xe (− + − ) = −σ xe + − = − − −

Notez que ces opérateurs n'ont aucune action sur les nombres purs, nous avons utilisé ce fait quand
nous avons écrit σ xe (− 1) = (− 1)σ xe . Nous disons que les opérateurs commutent avec les nombres
purs, ou aussi bien, qu'un nombre peut passer d'un coté à l'autre de l'opérateur. Vous pouvez vous
entraîner en montrant que le produit σ xeσ zp donne les résultats suivants pour les quatre états :
σ xeσ zp + + = + − +
σ xeσ zp + − = − − −
(7)
σ xeσ zp − + = + + +
σ xeσ zp − − = − + −
Si nous prenons tous ces opérateurs, en ne les faisant intervenir qu'une fois chacun, nous avons
seize possibilités. Oui, seize, à condition d'inclure aussi l'opérateur unité I. Il y a d'abord les trois :
σ xe , σ ye , σ ze . Puis les trois σ xp , σ yp , σ zp , cela fait six. Il y a en plus les neuf produits possibles de
la forme σ xeσ yp , ce qui fait un total de 15. Il y a enfin l'opérateur unité qui laisse tout état inchangé.
Seize en tout.

Pour un système à quatre états, la matrice de l'hamiltonien doit être une matrice quatre par quatre,
elle aura seize coefficients. Il est facile de montrer que toute matrice quatre par quatre, et donc entre
autres la matrice de l'hamiltonien, peut s'écrire comme une combinaison linéaire de seize matrices à
deux spins correspondant à l'ensemble des opérateurs que nous venons de construire. Par
conséquent pour l'interaction qui ne concerne que les spins du proton et de l'électron, on peut
s'attendre à ce que l'opérateur hamiltonien puisse s'écrire comme une combinaison linéaire de ces
mêmes seize opérateurs. La seule question est : comment ?

Eh bien, nous savons d'abord que l'interaction ne dépend pas de notre choix d'axes pour le système
de coordonnées. S'il n'y a pas de perturbation extérieure, telle qu'un champ magnétique, qui pourrait
déterminer une direction privilégiée dans l'espace, l'hamiltonien ne dépend pas de notre choix des
directions des axes x, y, z. Cela signifie que l'hamiltonien ne peut pas avoir un terme tel que σ xe ,
tout seul. Ce serait ridicule, en effet, quelqu'un ayant un système de coordonnées différent,
obtiendrait des résultats différents.

Les seules possibilités sont, d'une part, un terme avec la matrice unité, disons une constante a (que
multiplie I) et, d'autre part, une certaine combinaison des opérateurs qui ne dépend pas des
coordonnées, une combinaison invariante. La seule combinaison de deux vecteurs, comme un
certaine somme des produits des composantes et qui soit un invariant scalaire, est leur produit
scalaire. Pour nos opérateurs, c'est
(8) σ e ⋅ σ p = σ xeσ xp + σ yeσ yp + σ zeσ zp

Cet opérateur est invariant par rapport à toute rotation du système de coordonnées. La seule
possibilité pour un hamiltonien qui a la symétrie d'espace adéquate, est donc une constante que
multiplie la matrice unité, plus une constante que multiplie ce produit scalaire. D'où
(9) Hˆ = E0 + Aσ e ⋅ σ p

C'est notre hamiltonien. Il ne peut pas être autre chose, du fait de la symétrie d'espace, du moins
pour autant qu'il n'y a pas de champ extérieur. Le terme constant ne nous apprend pas grand-chose.
Sa valeur ne dépend que du niveau à partir duquel on choisit de mesurer les énergies. On peut tout
aussi bien prendre E 0 = 0 . Le second terme nous dit tout ce que nous devons savoir pour trouver la
séparation des niveaux de l'hydrogène.

Si vous le voulez, vous pouvez concevoir l'hamiltonien de façon différente. S'il y a deux aimants
voisins l'un de l'autre, et de moment magnétique µ e et µ p , l'énergie mutuelle dépendra de µ e ⋅ µ p ,
entre autres choses. D'autre part, nous avons trouvé, vous vous en souvenez, que l'objet classique
que nous appelons µ e apparaît en mécanique quantique en tant que µ eσ e . De même, ce qui
apparaît comme µ p en physique classique, se retrouvera habituellement en tant que µ pσ p en
mécanique quantique (où µ p est le moment magnétique du proton, lequel est environ 1000 fois
plus faible que µ e et de signe opposé). Ainsi, (9) nous dit que l'énergie d'interaction est semblable
à celle de l'interaction entre deux aimants, pas tout à fait cependant, car l'interaction entre deux
aimants dépend de la distance qui les sépare. Mais l'équation (9) pourrait être, et en fait elle l'est,
une sorte d'interaction moyenne. L'électron va partout à l'intérieur de l'atome et notre hamiltonien
ne donne que l'énergie moyenne d'interaction. Tout ce qu'il dit c'est que pour des dispositions
prescrites de l'électron et du proton dans l'espace, il y a une énergie proportionnelle au cosinus de
l'angle entre les deux moments magnétiques, pour parler de manière classique. Cette image
classique peut vous aider à mieux comprendre, qualitativement, d'où provient (9), mais l'important
c'est que ce soit la formule de mécanique quantique correcte.

L'ordre de grandeur de l'interaction classique entre deux aimants serait le produit des deux
moments magnétiques, divisé par le cube de la distance qui les sépare. La distance entre l'électron
et le proton dans l'atome d'hydrogène est, en gros, un demi rayon atomique, soit 0.5 angström. Il est
donc possible de dire qu'en première approximation la constante A devrait être à peu près égale au
produit des deux moments magnétiques µ e et µ p divisé par le cube de un demi angström.
L'estimation ainsi obtenue est du juste acabit. Il se trouve que l'on peut calculer A de manière
précise, une fois que l'on connaît la théorie complète de l'atome d'hydrogène, en utilisant la fonction
d'onde pour calculer l'interaction moyenne entre l'électron et le proton. De fait, il a été calculé avec
une précision d'environ 30 pour un million. Ainsi, contrairement à d'autres situations plus
compliquées, la constante A pour l'hydrogène peut se calculer. Mais peu importe, pour notre
propos, nous considérerons A comme un nombre que l'on pourrait déterminer par l'expérience, et
analyser la physique de la situation.

Nous pouvons utiliser l'hamiltonien (9) en même temps que l'équation


(10) ihC& i = ∑ H ij C j
i
pour déterminer l'effet des interactions de spin sur les niveaux d'énergie. Pour cela, nous devons
établir les seize éléments de matrice H = i Hˆ j correspondant à chaque association des quatre
ij

états de base.

Nous commençons par établir ce qu'est Ĥ j pour chacun des quatre états de base. Par exemple,
{
(11) Hˆ + + = Aσ e ⋅ σ p + + = A σ eσ p + σ eσ p + σ eσ p + +
x x y y z z }
En utilisant la méthode décrite un peu plus haut, c'est facile, si vous vous souvenez du tableau
précédent, vous trouvez ce que fait chaque paire de σ agissant sur + + . La réponse est :
σ xeσ xp + + = + − −
(12) σ yeσ yp + + = − − −
σ zeσ zp + + = + + +

Ainsi (11) devient :


(13) Ĥ + + = A{ − − − − − + + + } = A + +

Comme nos quatre états de base sont tous orthogonaux, nous en déduisons immédiatement que
+ + Hˆ + + = A + + + + = A

+ − Hˆ + + = A + − + + = 0
(14)
− + Hˆ + + = A − + + + = 0

− − Hˆ + + = A − − + + = 0


En se souvenant que j Hˆ i = i Hˆ j , nous pouvons déjà écrire l'équation différentielle pour les
amplitudes C1 :
ihC&1 = H 11C1 + H 12 C 2 + H 13 C 3 + H 14 C 4
(15)
ihC&1 = AC1

C'est tout ! Nous ne gardons que le premier terme.

Quant aux autres équations de l'hamiltonien, il nous faut tourner la même manivelle pour les
obtenir, en faisant agir Ĥ sur les autres états. Nous vous laissons le soin de vérifier, à titre
d'entraînement, tous les produits que nous avons écrits dans le tableau ci-dessous.
σ xeσ xp + + = + − −
σ xeσ xp + − = + − +
σ xeσ xp − + = + + −
σ xeσ xp − − = + + +
σ yeσ yp + + = − − −
σ yeσ yp + − = + − +
σ yeσ yp − + = + + −
σ xeσ xp + + = + − −
σ zeσ zp + + = + + +
σ zeσ zp + − = − + −
σ zeσ zp − + = − − +
σ xeσ xp + + = + − −

En les utilisant, nous obtenons :


Hˆ + − = A{2 − + − + − }
(16) Hˆ − + = A{2 + − − − + }
)
H −− = A−−

En multipliant ensuite chaque terme sur la gauche par tous les vecteurs d'état à tour de rôle, nous
obtenons la matrice de l'hamiltonien suivante :
A 0 0 0
 
 0 − A 2A 0 
(17) H ij = 
0 2A − A 0 
 
0 0 0 A 

Ceci signifie simplement, et rien d'autre, que les équations différentielles pour nos quatre
amplitudes C i sont :
ihC& = AC
1 1

ihC& 2 = − AC 2 + 2 AC 3
(18)
ihC& 3 = 2 AC 2 − AC 3
ihC& = AC
4 4
Avant de résoudre ces équations et bien que nous n'en ayons pas besoin pour travail, nous ne
pouvons nous empêcher de vous parler d'un procédé astucieux inventé par Dirac, ce qui vous
donnera le sentiment d'en savoir beaucoup ! D'après les équations (13) et (16), on a
σ e ⋅σ p + + = + +
σ e ⋅σ p + − = 2 − + − + −
(19)
σ e ⋅σ p − + = 2 + − − − +
σ e ⋅σ p − − = − −

Voyez, dit Dirac, si je récris la première et la dernière équation comme suit


σ e ⋅σ p + + = 2 + + − + +
(20) e
σ ⋅σ p − − = 2 − − − − −
alors les quatre équations deviennent très similaires. J'invente maintenant un nouvel opérateur que
j'appellerai Pspin exch et que je définis comme ayant les propriétés suivantes (cet opérateur est
maintenant appelé "opérateur d'échange de spin de Pauli") :
Pspin exch + + = + +
Pspin exch + − = − +
(21)
Pspin exch − + = + −
Pspin exch − − = − −

Tout ce que fait cet opérateur consiste à échanger les orientations des spins des deux particules. Je
peux ensuite écrire toutes les équations de (19) sous la forme d'une identité entre opérateurs :
(22) σ e ⋅ σ p = 2 Pspin exch − 1

C'est la formule de Dirac. Son "opérateur d'échange de spin" fournit un procédé pratique pour
calculer σ e ⋅ σ p (vous voyez, vous pouvez tout faire maintenant. Les portes sont ouvertes).
III.3. Les niveaux d'énergie
Nous sommes maintenant en mesure d'établir les niveaux d'énergie de l'état le plus bas de
l'hydrogène en résolvant les équations de l'hamiltonien. Nous voulons trouver les énergies des états
stationnaires. Autrement dit, nous voulons trouver ces états particuliers ψ pour lesquels les quatre
amplitudes associées à ψ , C i = i ψ varient de la même manière avec le temps, à savoir e −iω t .
L'état aura alors l'énergie E = hω . Ce que nous voulons, c'est donc un ensemble d'amplitudes de la
forme
(1) C i = a i e (−i / h )Et
où les quatre coefficients a i sont indépendants du temps. Afin de voir si nous pouvons obtenir des
amplitudes de ce type, nous substituons (1) dans les équations hamiltoniennes et nous regardons ce
qui se passe. Chaque ihdC / dt se transforme en EC et, après suppression du facteur exponentiel
commun, chaque C devient un a. Nous obtenons :
Ea1 = Aa1
Ea 2 = − Aa 2 + 2 Aa 3
(2)
Ea 3 = 2 Aa 2 − Aa 3
Ea 4 = Aa 4
que nous devons résoudre pour a1 , a 2 , a3 , a 4 (correctement normalisés, la somme de leurs carrés
étant égal à 1). Or voilà que la première équation est indépendante des autres, d'où une solution
évidente. En effet, en prenant E = A,
(3) a1 = 1 , a 2 = a 3 = a 4 = 0
constitue une solution (il est vrai que tous les a i pris égaux à zéro constitueraient aussi une
solution, mais la condition de normalisation ne serait pas respectée et ce ne serait en fait même pas
− (i / h ) E I t
un état). Désignons notre première solution comme l'état I (l'état est en fait I e , mais
suivant la pratique habituelle, nous identifierons les états par les vecteurs constants égaux aux
vecteurs complets en t = 0) :
(4) I = 1 = + +
Son énergie est
(5) E I = A

Cette solution vous donne immédiatement la clef d'une autre solution concernant la dernière
équation de (2) :
a = a 2 = a 3 = 0, a 4 = 1
(6) 1
E=A

Nous désignerons par II l'état correspondant :


II = 4 = − −
(7)
E II = A

La suite est un peu plus difficile. Les deux équations restantes dans (2) se mélangent. Mais nous
avons déjà traité ce cas. En les additionnant, nous obtenons
(8) E (a 2 + a3 ) = A(a 2 + a 3 )
et en les soustrayant
(9) E (a 2 − a 3 ) = −3 A(a 2 − a 3 )

En y regardant de près, nous voyons qu'il y a deux solutions :


a = a3
(10) 2
E=A
et
a = −a3
(11) 2
E = −3 A

Ce sont des combinaisons de 2 et de 3 . En désignant ces états par III et IV , et en


adjoignant un facteur 1 / 2 pour normaliser correctement ces états, nous avons
III =
1
(2 + 3 )=
1
(+− + −+ )
(12) 2 2
E III = A
et
IV =
1
(2 − 3 )=
1
(+− − −+ )
(13) 2 2
E IV = −3 A

Nous avons trouvé quatre états stationnaires et leurs énergies. Notez, au passage, que nos quatre
états sont orthogonaux et que l'on peut donc les utiliser si l'on veut comme états de base. Notre
problème est complètement résolu.

On remarquera aussi que les états I à III forment exactement les états triplet et l'état IV l'état
singulet que nous avions déjà obtenu dans l'étude des combinaisons des spins par une autre voie
(les symétries).

Trois de ces états ont l'énergie A et le dernier l'énergie -3A. La moyenne est zéro, ainsi, en optant
pour E 0 = 0 , nous avions choisi de mesurer toutes les énergies à partir de l'énergie moyenne. On
peut dessiner le diagramme des niveaux d'énergie pour l'état fondamental de l'hydrogène comme
dans la figure ci-dessous.
La différence d'énergie entre l'état IV et n'importe lequel des autres est 4A. Un atome qui aurait
trouvé le moyen d'aboutir dans l'état I pourrait descendre vers l'état IV et émettre de la lumière.
Non pas une lumière visible, car l'énergie est minuscule, mais des quantum de radiofréquences. De
même, si nous irradions un gaz d'hydrogène par des ondes RF, nous aurons une absorption
d'énergie, puisque les atomes dans l'état IV captent l'énergie pour atteindre l'un des états supérieurs,
mais seulement à la fréquence ω = 4A / h . Cette fréquence a été mesurée expérimentalement et le
résultat est
(14) f = ω / 2π = 1420405751.800 ± 0.028 cycles par seconde

L'erreur est seulement de deux pour 100 milliards ! C'est l'une des mesures les plus
remarquablement précises de la physique. Les théoriciens s'étaient montrés très satisfaits de
pouvoir calculer l'énergie avec une précision de 3 pour 100000, mais entre temps la mesure a atteint
2 pour 1011 , un million de fois plus précise que la théorie. Ainsi les expérimentateurs ont une
grande avance sur les théoriciens. Sur la théorie de l'état minimum de l'atome d'hydrogène, vous en
savez autant que quiconque. Vous aussi vous pouvez simplement emprunter votre valeur de A à
l'expérience. C'est ce que tout le monde doit faire en fin de compte.
Vous avez probablement entendu parler de la "ligne à 21 centimètres" de l'hydrogène. C'est la
longueur d'onde de la ligne spectrale de 1420 mégacycles entre les états hyperfins. Un rayonnement
de cette longueur d'onde est émis et absorbé par le gaz d'hydrogène atomique dans les galaxies. On
peut ainsi observer, à l'aide de radiotélescopes ajustés à la longueur d'onde de 21 cm (ou 1420
mégacycles environ), les emplacements et les vitesses des concentrations du gaz d'hydrogène
atomique. En mesurant l'intensité, on peut mesurer la quantité d'hydrogène. en mesurant le
déplacement en fréquence dû à l'effet Doppler, on peut connaître le mouvement du gaz dans la
galaxie. C'est l'un des grands programmes de la radioastronomie. Ce dont nous parlons ici est donc
très concret, ce n'est pas un problème artificiel.
III.4. L'effet Zeeman
Bien que nous en ayons fini avec les niveaux d'énergie de l'état fondamental de l'hydrogène, nous
aimerions en dire un peu plus sur ce système intéressant. Si nous voulons aller plus loin, par
exemple si nous voulons calculer le taux d'absorption et d'émission des ondes de 21 cm, il nous faut
savoir ce qui se passe quand l'atome est perturbé. Pour l'atome d'hydrogène, le champ électrique n'a
pas d'autre action sur les niveaux que de les déplacer tous d'une même quantité proportionnelle au
carré du champ, ce qui n'est d'aucun intérêt car cela n'affecte pas les différences d'énergie. Ce qui
est intéressant ici est de voir l'effet d'un champ magnétique. L'étape suivante sera donc d'écrire
l'hamiltonien pour cette situation plus compliquée, où l'atome est installé dans un champ
magnétique extérieur.

Quel est alors l'hamiltonien ? Nous vous donnerons directement la réponse, car nous ne pouvons
pas vous donner de "preuve" autre que de dire que c'est ainsi que l'atome fonctionne. Il est d'ailleurs
dans la même ligne que les autres hamiltoniens que nous avons vu faisant intervenir un champ
magnétique.

L'hamiltonien est
( )
(1) Hˆ = A σ e ⋅ σ p − µ eσ e ⋅ B − µ pσ p ⋅ B

Il est fait de trois parties. Le premier terme Aσ e ⋅ σ p représente l'interaction magnétique entre
l'électron et le proton, ce même terme serait là s'il n'y avait pas de champ magnétique. C'est le
terme que nous avions déjà et l'influence du champ magnétique sur la constante A est négligeable.
L'effet du champ magnétique extérieur apparaît dans les deux derniers termes. Le second terme,
− µ eσ e ⋅ B , est l'énergie que l'électron aurait dans le champ magnétique s'il y était seul. De même,
le dernier terme, − µ pσ p ⋅ B , serait l'énergie d'un proton seul. De manière classique U = − µ ⋅ B ,
ainsi l'énergie est la plus faible lorsque le moment est le long du champ. Dans le cas de particules
positives, le moment est parallèle au spin et dans le cas de particules négatives, il est opposé. Dans
(1), µ p est donc un nombre positif mais µ e est négatif. En théorie classique, l'énergie des deux
réunis serait la somme des énergies et il en est de même en mécanique quantique. Dans un champ
magnétique, l'énergie d'interaction due au champ magnétique est simplement la somme de l'énergie
d'interaction de l'électron avec le champ extérieur et de l'énergie correspondante pour le proton,
l'une et l'autre exprimées en termes des opérateurs de Pauli. En mécanique quantique, ces termes ne
sont pas réellement les énergies, mais il est pratique d'avoir à l'esprit les formules classiques pour
l'énergie : c'est un moyen de se rappeler comment s'écrit l'hamiltonien. Le lien est d'ailleurs évident
puisque l'opérateur hamiltonien appliqué à une fonction d'onde donne celle-ci multipliée par
l'énergie (ou une somme de termes de ce type si la fonction d'onde n'est pas une fonction d'onde) et
si l'hamiltonien est une somme de termes on a alors une somme d'énergies.

Il nous maintenant tout reprendre au début et résoudre à nouveau tout le problème. Cependant une
grande partie du travail a déjà été fait. Il nous suffit d'ajouter les effets des nouveaux termes.
Prenons un champ magnétique constant B dans la direction z. Il nous faut ajouter à notre opérateur
hamiltonien Ĥ les deux nouveaux morceaux, que nous appellerons Hˆ ′ :
( )
(2) Hˆ ′ = − µ eσ ze + µ pσ zp B

En utilisant les tableaux précédents, nous obtenons immédiatement que


Hˆ ′ + + = −(µ e + µ p )B + +
Hˆ ′ + − = −(µ e − µ p )B + −
(3)
Hˆ ′ − + = −(− µ e + µ p )B − +
Hˆ ′ − − = (µ e + µ p )B − −

Comme c'est pratique ! Le Hˆ ′ opérant sur chaque état donne ce même état multiplié par un
nombre. La matrice i Hˆ ′ j n'a donc que des éléments diagonaux. Nous pouvons tout simplement
ajouter les coefficients de (3) aux termes diagonaux correspondants de H et les équations
hamiltoniennes deviennent
ihdC1 / dt = {A − (µ e + µ p )B}C1
ihdC 2 / dt = −{A + (µ e − µ p )B}C 2 + 2 AC 3
ihdC 3 / dt = 2 AC 2 − {A − (µ e − µ p )B}C 3
(4)

ihdC 4 / dt = {A + (µ e + µ p )B}C 4

ihdC1 / dt = {A − (µ e + µ p )B}C1
La forme des équations n'est pas différente, seuls les coefficients le sont. Pour autant que B ne varie
pas avec le temps, nous pouvons continuer comme précédemment. En substituant C i = a i e −(i / h )Et ,
nous obtenons
a1 = {A − (µ e + µ p )B}a1
a 2 = −{A + (µ e − µ p )B}a 2 + 2 Aa3
a 3 = 2 Aa 2 − {A − (µ e − µ p )B}a 3
(5)

a 4 = {A + (µ e + µ p )B}a 4

Heureusement, la première et la dernière équation sont restées indépendantes des autres. La même
technique peut donc encore s'appliquer.

Une solution est l'état I pour lequel a1 = 1 , a 2 = a 3 = a 4 = 0 , ce qui s'écrit aussi


(6) I = 1 = + +
avec
(7) E I = A − (µ e + µ p )B

Une autre solution est


(8) II = 4 = − −
avec
(9) E II = A + (µ e + µ p )B
Il y a un peu plus de travail pour les deux équations restantes car les coefficients de a 2 et de a3 ne
sont plus égaux. La résolution de ce système de deux équations à deux inconnues donne les
énergies
{
E III = A − 1 + 2 1 + (µ e + µ p ) B 2 / 4 A 2
2
}
{ / 4A }
(10)
E IV = − A 1 + 2 1 + (µ e + µ p ) B 2
2 2

Nous avons donc trouvé les énergies des quatre états stationnaires de l'atome d'hydrogène dans un
champ magnétique constant. Vérifions nos résultats en faisant tendre B vers zéro et en regardant si
nous obtenons les mêmes énergies que dans la section précédente. Pour B = 0, les énergies E I ,
E II , E III tendent vers A et E IV tend vers -3A. Même notre nomenclature des états est restée la
même. Cependant quand nous établissons le champ magnétique, toutes les énergies changent de
façon différente. Voyons ce qu'elles font.

Nous devons d'abord nous rappeler que pour l'électron µ e est négatif et environ 1000 fois plus
grand en valeur absolue que µ p , lequel est positif. Ainsi µ e + µ p et µ e − µ p sont l'un et l'autre des
nombres négatifs et à peu près égaux. Désignons-les par − µ et − µ ′ :
(11) µ = −(µ e + µ p ) µ ′ = −(µ e − µ p )
µ et µ ′ sont l'un et l'autre des nombres positifs et presque égaux à µ e en valeur absolue, ce
dernier est environ un magnéton de Bohr. Nos quatre énergies sont alors
E I = A + µB
E II = A − µB
(12)
{ }
E III = A − 1 + 2 1 + µ ′ 2 B 2 / 4 A 2
{
E IV = − A 1 + 2 1 + µ ′ 2 B 2 / 4A } 2
L'énergie E I commence à A et croît linéairement avec B, suivant une pente µ . L'énergie E II
commence aussi à A, mais décroît linéairement lorsque B croît, la pente est − µ . Les variations de
ces deux niveaux en fonction de B sont montrées dans la figure ci-dessous. Les énergies E III et
E IV y figurent aussi. Leurs variations en fonction de B sont différentes. Lorsque B est petit, elles en
dépendent quadratiquement. Elles commencent donc avec des pentes horizontales. Elles
commencent ensuite à s'incurver et lorsque B est grand elles tendent vers des lignes droites de
pentes ± µ ′ . Pentes à peu près identiques à celles de E I et E II .
Le déplacement des niveaux d'énergie d'un atome causé par un champ magnétique est appelé effet
Zeeman. Ainsi nous disons que les courbes de la figure ci-dessus montrent le clivage par effet
Zeeman de l'état fondamental de l'hydrogène. Les transitions entre l'état IV et l'un quelconque des
autres états s'accompagnent de l'émission ou de l'absorption d'un photon, dont la fréquence de 1420
mégacycles correspond à la différence d'énergie 4A divisée par la constante de Planck. Par contre,
lorsque l'atome est dans un champ magnétique B, il y a beaucoup plus de lignes. Il peut y avoir des
transitions entre deux quelconques des quatre états. Si nous avons des atomes dans chacun de ces
quatre états, l'énergie peut être absorbée ou émise dans l'une quelconque des six transitions
indiquées par les flèches verticales dans la figure ci-dessous.

On peut observer de nombreuses transitions de ce type par la technique du faisceau moléculaire de


Rabi.
Qu'est-ce qui provoque les transitions. Etant donné la conservation du moment angulaire, les
transitions ne sont pas spontanées. Les transitions auront lieu si vous appliquez un faible champ de
perturbation qui varie avec le temps (en plus de l'intense champ constant B). Si vous prenez un
champ magnétique de perturbation qui tourne dans le plan xy, l'analyse sera plus simple, cependant
tout champ oscillant horizontal fera l'affaire. Quand vous introduisez ce champ de perturbation
comme un terme additionnel dans l'hamiltonien, vous obtenez des solutions pour lesquelles les
amplitudes varient avec le temps. Vous pouvez ainsi calculer facilement et avec précision la
probabilité d'une transition d'un état à l'autre. Et vous vous apercevez que tout cela est en accord
avec l'expérience.
III.5. Les états en présence d'un champ magnétique
Nous aimerions maintenant discuter de la forme des courbes dans les figures précédentes. En
premier lieu, les énergies pour les champs élevés sont faciles à comprendre et assez intéressantes.
Pour B suffisament grand (à savoir µB / A >> 1 ) nous pouvons négliger le 1 dans les racines carrées
des formules de l'énergie. Les quatre énergies deviennent
E I = A + µB
E II = A − µB
(1)
E III = − A + µ ′B
E IV = − A − µ ′B

Ce sont les équations pour les quatre lignes droites de la figure précédente. Nous pouvons
comprendre physiquement ces énergies de la manière suivante. La nature des états stationnaires
dans un champ nul est complètement déterminée par l'interaction des deux moments magnétiques.
Les mélanges des états de base + − et − + dans les états stationnaires III et IV sont dus à
cette interaction. Dans des champs extérieurs élevés, par contre, l'électron ne sera pratiquement plus
influencé par le champ du proton et réciproquement. Chacun agira comme s'il était seul dans le
champ extérieur. Alors, comme nous l'avons vu souvent, le spin de l'électron sera, ou bien parallèle,
ou bien de direction opposé à la direction du champ magnétique extérieur.

Supposez que le spin de l'électron soit "en haut", c'est-à-dire le long du champ. Son énergie sera
− µ e B . Le proton peut encore avoir l'une ou l'autre orientation. Si le spin du proton est aussi "en
haut", son énergie est − µ p B . La somme des deux est − (µ e + µ p )B = µB . C'est exactement ce que
nous avons trouvé pour E, ce qui est bien, puisque nous sommes en train de décrire l'état
+ + = I . Il y a encore le petit terme additionnel A (ici µB >> A ), qui représente l'énergie
d'interaction du proton et de l'électron, quand leurs spins sont parallèles (nous avons pris au départ
A positif parce que la théorie dont nous parlions disait qu'il devait l'être et, expérimentalement, il
l'est en effet). D'autre part, le proton peut avoir son spin "en bas". Son énergie dans le champ
extérieur passe alors à − µ p B , ainsi l'électron et le proton ensemble ont l'énergie
− (µ e − µ p )B = µ ′B . Et l'énergie d'interaction devient -A. La somme correspond juste à l'énergie
E III de (1). Ainsi l'état III doit, pour des champs élevés, devenir l'état + − .

Supposez maintenant que le spin de l'électron soit "en bas". Son énergie dans le champ extérieur est
µ e B . Si le proton a aussi "spin en bas", les deux ensembles ont l'énergie (µ e + µ p )B = µB , plus
l'énergie d'interaction A, puisque leurs spins sont parallèles. Cela fait juste l'énergie E II de (1) et
correspond à l'état − − = II , ce qui tombe bien. Enfin, si l'électron a "spin en bas" et le proton
"spin en haut", nous obtenons l'énergie (µ e − µ p )B − A (moins A pour l'interaction, puisque les
spins sont opposés) ce qui est juste E IV . Et l'état correspond à − + .

"Mais, attendez un instant" objecterez-vous probablement, "les états III et IV ne sont pas les
états + − et − + , ce sont des mélanges des deux". Eh bien ce n'est que partiellement vrai. Ce
sont en effet des mélanges pour B = 0. Voyons le rapport des amplitudes
C 2 E + A − (µ e − µ p )B
=
C3 2A
(2)
E + A + µ ′B
=
2A
où E représente l'énergie appropriée, soit E III , soit E IV . Ainsi, pour l'état III nous avons
C  µ ′B
(3)  2  ≈
 C 3  III A

Donc, lorsque B est grand, l'état III est tel que C 2 >> C 3 . L'état devient presque complètement
l'état 2 = + − . De même, si nous portons E IV dans (2), nous obtenons (C 2 / C 3 )IV << 1 . Pour des
champs élevés, l'état IV devient précisément l'état 3 = − + . Vous voyez que les coefficients
des combinaisons linéaires de nos états de bas, qui définissent les états stationnaires dépendent de
B. L'état que nous appelons III est un mélange à 50% de + − et de − + pour des champs très
faibles, mais passe complètement à + − pour des champs élevés. De même l'état IV qui pour
des champs faibles est aussi un mélange à 50% (avec des signes opposés) de + − et de − +
passe à l'état − + quand les spins sont découplés par un champ extérieur fort.

Nous voudrions aussi attirer particulièrement votre attention sur ce qui se passe aux valeurs très
faibles du champ magnétique. Il y a une énergie, à -3A, qui ne change pas quand vous faites
apparaître un faible champ magnétique. Et il y a une autre énergie, à +A, qui se clive en trois
niveaux d'énergie différents, quand vous faites apparaître un faible champ magnétique. Pour des
champs faibles les énergies varient avec B comme indiqué sur la figure ci-dessous.
Supposez que nous ayons sélectionné d'une manière ou d'une autre un ensemble d'atomes
d'hydrogène ayant tous l'énergie -3A. Si nous les envoyons dans un dispositif de Stern et Gerlach,
avec des champs qui ne soient pas trop élevés, nous observerions tout simplement qu'ils traversent
sans être déviés (leur énergie ne dépend pas de B, il n'y a pas, selon le principe du travail virtuel, de
force qui s'exerce sur eux dans un gradient de champ magnétique). Supposez d'autre part que nous
ayons sélectionné un ensemble d'atomes d'énergie +A et que nous les envoyions dans un appareil
de Stern et Gerlach, disons un appareil S (cette fois encore, les champs ne doivent pas être trop
élevés, pour éviter de rompre l'intérieur de l'atome. Par là nous voulons dire un champ
suffisamment faible pour que les énergies varient linéairement avec B). Nous trouverions alors trois
faisceaux. Les états I et II subissent des forces opposées, leurs énergies varient linéairement
avec B, suivant les pentes ± µ donc les forces sont égales à celles qui s'exercent sur des dipôles de
moment µ z = ± µ . Mais l'état III par contre traverse directement. Un atome d'hydrogène d'énergie
+A est une particule de spin un. Cet état d'énergie est une "particule" pour laquelle j = 1 et il peut
se décrire, par rapport à un système d'axes dans l'espace, en termes des états de base + S , 0 S et
− S . D'autre part, quand un atome d'hydrogène a l'énergie -3A, c'est une particule de spin zéro (ce
que nous disons n'est strictement vrai, souvenez-vous en, que pour des champs magnétiques
infinitésimaux). Nous voilà revenu à l'état triplet et l'état singulet. Nous pouvons donc grouper de
cette manière les états de l'hydrogène dans un champ magnétique nul :
I = ++   +S
+− + −+   
III =  spin 1  0S
2  
(4) II = − −   − S
+− − −+
IV = spin 0
2

Rappelons que, pour toute particule, la composante de son moment cinétique le long de n'importe
quel axe, ne peut avoir que certaines valeurs toujours distantes de h . La composante z du moment
cinétique J z peut valoir jh , ( j − 1)h , ( j − 2 )h , …, (− j )h où j est le spin de la particule (lequel
peut ou bien être un entier ou bien un demi-entier). On note
(5) J z = mh
où m représente l'un des nombres j, j - 1, j - 2, …, -j. Vous rencontrerez donc dans les livres des
gens qui désignent les quatre états de base de l'hydrogène par les nombres quantiques j, m (nombre
quantique de moment cinétique et nombre quantique magnétique pour des raisons maintenant
évidentes). Ainsi, au lieu de symboles d'états I , II , etc., ils écriront un état sous la forme jm .
Comme nous l'avons d'ailleurs fait nous même plus tôt. Cette notation est tellement courante que ce
rappel était utile. Le lien entre toutes ces notations peut être résumé dans un tableau.
Etat j, m j m Notation dans ce chapitre et notation "Stern - Gerlach"
1,+1 1 +1 I = +S
1,0 1 0 III = 0S
1,−1 1 -1 II = − S
0,0 0 0 IV
III.6. La matrice de projection pour un spin un
Nous aimerions maintenant mettre à profit nos connaissances sur l'atome d'hydrogène pour établir
un point particulier. Ceci ne diffère pas beaucoup de ce que nous avons déjà vu mais constituera un
bon exercice. Une particule de spin un située dans l'un des états de base (+, 0 ou -) par rapport à un
appareil de Stern et Gerlach d'orientation donnée, disons un appareil S, a une certaine amplitude
pour être dans chacun des trois même états par rapport à un appareil T d'orientation différente dans
l'espace. Il y a neuf amplitudes de ce type, jT iS , qui constituent la matrice de projection. Nous
avions déjà donné les termes de cette matrice pour diverses orientations de T par rapport à S. Nous
allons vous montrer ici une manière assez simple de les établir.

Dans l'atome d'hydrogène, nous avons trouvé un système de spin un constitué de deux particules de
spin un demi; Nous avons déjà vu comment transformer les amplitudes de spin un demi. Nous
pouvons utiliser cette information pour calculer la transformation dans le cas du spin un. Voilà
comment on procède : vous avez un système, un atome d'hydrogène d'énergie +A, dont le spin est
un. Supposez que nous l'envoyions au travers d'un filtre de Stern et Gerlach, S, de sorte que nous
sachions qu'il se trouve dans l'un des états de base par rapport à S, disons + S . Quelle est
l'amplitude pour qu'il se trouve être dans l'un des états de base, disons + T , par rapport à l'appareil
T ? Si nous appelons le système x, y, z, le système de coordonnées liées à l'appareil S, l'état S est
alors celui que nous appelons habituellement l'état + + . Mais supposez qu'un autre gars ait pris
son axe z le long de l'axe de T. Il rapportera ses états à un référentiel que nous pouvons désigner
par x', y', z'. Ses états "spin en haut" et "spin en bas" pour l'électron et le proton seront différents
des nôtres. Son état "plus - plus", que nous pouvons écrire + ′ + ′ , en nous référant au système
"prime", est l'état + T de la particule de spin un. Ce que nous cherchions, c'est + T + S . Mais ce
n'est rien d'autre qu'une manière différente d'écrire l'amplitude + ′ + ′ + + .

Nous pouvons trouver l'amplitude + ′ + ′ + + de la manière suivante. Dans notre référentiel,


l'électron dans l'état + + a son "spin en haut". Cela veut dire qu'il a une certaine amplitude
+′ + e
pour avoir "spin en haut" dans le référentiel de l'autre gars, et une certaine amplitude
−′ + e
pour avoir "spin en bas" dans ce référentiel. De même, le proton qui dans l'état + + a son
"spin en haut" pour notre référentiel, a les amplitudes + ′ + p
et − ′ + p
pour avoir son spin "en
haut" et "en bas", respectivement, pour le référentiel "prime". Ayant affaire à deux particules
distinctes, l'amplitude pour que l'une et l'autre particule soient simultanément "en haut" dans son
propre référentiel est le produit des deux amplitudes.
(1) + ′ + ′ + + = + ′ + e + ′ + p

Nous avons mis les indices e et p aux amplitudes + ′ + pour bien préciser ce que nous faisons.
Mais l'une et l'autre sont simplement les amplitudes de transformation pour une particule de spin un
demi, ce sont donc des nombres réels identiques. En fait, ce sont exactement les amplitudes que
nous avons appelées + T + S lors de l'étude de ces transformations.

Cependant, nous allons avoir des ennuis avec la notation. Il nous faut pouvoir distinguer l'amplitude
+ T + S pour une particule de spin un demi de ce que nous avons aussi désigné par + T + S
pour une particule de spin un, elles sont en effet complètement différentes ! Nous espérons ne pas
introduire trop de confusion mais, du moins pour le moment, il nous faudra utiliser d'autres
symboles pour les amplitudes de spin un demi. Pour vous aider à vous y retrouver, nous
rassemblons les nouvelles notations dans le tableau ci-dessous.
a = +′ + +T + S
b = −′ + −T + S
c = +′ − +T − S
d = −′ − −T − S

Nous continuerons d'utiliser les notations + S , 0 S et − S pour les états d'une particule de spin
un.
Dans notre nouvelle notation, (1) devient simplement
(2) + ′ + ′ + + = a 2
et c'est précisément l'amplitude de spin un + T + S . Supposons pour l'instant que le référentiel de
l'autre gars, c'est-à-dire le T ou l'appareil "prime", soit simplement tourné d'un angle φ par rapport
à notre axe z. On a alors comme nous l'avons vu
(3) a = + ′ + = e iφ / 2

Et de (2) nous déduisons donc l'amplitude de spin un


(
(4) + T + S = + ′ + ′ + + = e iφ / 2 )2
= e iφ

Vous voyez comment cela se passe.

Nous allons maintenant traiter du cas général pour tous les états. Si le proton et l'électron ont l'un et
l'autre spin "en haut" dans notre référentiel, le référentiel S, les amplitudes pour que l'ensemble
proton - électron soit dans l'un quelconque des quatre états possibles du référentiel de l'autre gars, le
référentiel T, sont
+′ +′ + + = +′ + e +′ + p = a 2
+ ′ −′ + + = + ′ + e
−′ + p
= ab
(5)
−′ + ′ + + = −′ + e
+′ + p
= ba
−′ −′ + + = −′ + e
−′ + p
= b2

Nous pouvons alors écrire l'état + + comme la combinaison linéaire suivante :


(6) + + = a 2 + ′ + ′ + ab{ + ′ −′ + − ′ + ′ }+ b 2 − ′ − ′

Nous notons que + ′ + ′ est l'état + T , que { + ′ − ′ + − ′ + ′ } est tout simplement l'état 0T
multiplié par 2 et enfin que − ′ − ′ = − T . En d'autres termes, (5) peut se mettre sous la forme
(7) + S = a 2 + T + 2ab 0T + b 2 − T

De manière similaire, vous pouvez aisément montrer que


(8) − S = c 2 + T + 2cd 0T + d 2 − T

Pour 0 S c'est un peu plus compliqué car

(9) 0S =
1
{+ − + −+ }
2

Mais nous pouvons exprimer chacun des états + − et − + en termes des états "primes" et en
prendre la somme. Ceci donne
(10) + − = ac + ′ + ′ + ad + ′ − ′ + bc − ′ + ′ + bd − ′ − ′
et
(11) − + = ac + ′ + ′ + bc + ′ − ′ + ad − ′ + ′ + bd − ′ − ′

En faisant la somme et en divisant par 2 , nous obtenons :


ad + bc
(12) 0 S =
2
ac + ′ + ′ + { +′ −′ + −′ +′ }+ 2 bd −′ −′
2 2 2

Il en résulte que
(13) 0 S = 2ac + T + (ad + bc ) 0T + 2bd − T

Nous avons maintenant toutes les amplitudes que nous voulions. Les coefficients des équations (7),
(8) et (13) sont les éléments de matrice jT iS . Mettons les ensembles.
 a2 2ac c2 
 
(14) jT iS =  2ab ad + bc 2cd 
 2 
 b 2bd d 2 

Nous avons exprimé la transformation des amplitudes de spin un en termes des amplitudes de spin
un demi a, b, c et d.

Par exemple, si le référentiel T est tourné par rapport à S d'un angle α autour de l'axe y, les
amplitudes sont précisément les éléments de matrice de R y (α ) que nous avions vu.
α α
a = cos b = − sin
(15) 2 2
α α
c = sin d = cos
2 2

En les portant dans (14), nous obtenons les formules que nous avions données sans preuve.

Mais qu'est-ce qui a bien pu arriver à l'état IV ? Et bien, c'est un système de spin zéro, il n'a donc
qu'un seul état. Il reste le même dans tous les systèmes de coordonnées. On peut vérifier qu'il en est
bien ainsi en prenant la différence entre les équations (10) et (11). On obtient
(16) + − − − + = (ad − bc ){ + ′ − ′ − − ′ + ′ }

Mais (ad - bc) est le déterminant de la matrice de spin un demi, sa valeur est donc 1 (transformation
unitaire). Nous en déduisons que
(17) IV ′ = IV
quelle que soit l'orientation relative des deux systèmes de coordonnées.
IV. Maser et Laser

IV.1. Les états de la molécule d'ammoniac


Dans ce chapitre, nous allons discuter de l'application de la mécanique quantique à un dispositif
pratique, le maser à ammoniac. Le maser à ammoniac est un appareil pour engendrer des ondes
électromagnétiques et dont le fonctionnement est basé sur les propriétés de la molécule
d'ammoniac. Nous commençons en résumant ce que nous savons.

La molécule d'ammoniac a de nombreux états, mais nous la considérons comme un système à deux
états, en ne discutant que ce qui se passe lorsque la molécule est dans un état de rotation et de
translation quelconque. Un modèle physique pour ces deux états peut être visualisé de la façon
suivante. Si l'on considère la molécule d'ammoniac comme tournant autour d'un axe passant à
travers l'atome d'azote et perpendiculaire au plan des atomes d'hydrogène, comme le montre la
figure ci-dessous, il y a deux états possibles. L'azote peut être d'un coté ou de l'autre du plan des
atomes d'hydrogène. Nous appelons ces deux états 1 et 2 . Nous les prenons comme états de
base pour notre analyse du comportement de la molécule d'ammoniac.
Dans un système à deux états de base, tout état ψ du système peut toujours être décrit comme une
combinaison linéaire des deux états de base. C'est-à-dire qu'il y a une certaine amplitude C1 pour
qu'il soit dans l'un des états de base et une amplitude C 2 pour qu'il soit dans l'autre. Nous pouvons
écrire son vecteur d'état
(1) ψ = 1 C1 + 2 C 2

(2) C1 = 1 ψ et C 2 = 2 ψ
Ces deux amplitudes changent au cours du temps suivant l'équation de l'hamiltonien. En utilisant la
symétrie des deux états de la molécule d'ammoniac, nous posons H 11 = H 22 = E 0 et
H 12 = H 21 = − A et nous obtenons les solutions
a −(i / h )(E0 − A )t b −(i / h )(E0 + A )t
(3) C1 = e + e
2 2
a −(i / h )(E0 − A )t b −(i / h )(E0 + A )t
(4) C 2 = e − e
2 2

Nous allons maintenant examiner de près ces solutions générales. Supposons que la molécule était
initialement dans un état ψ II pour lequel le coefficient b valait zéro. Alors, à t = 0, les amplitudes
pour être dans les états 1 et 2 sont identiques et elles le restent au cours du temps. Leurs phases
varient toutes les deux de la même façon, avec la fréquence (E0 − A) / h . De même, si nous
placions la molécule dans un état ψ I pour lequel a vaut zéro, l'amplitude C 2 serait moins C1 et
cette relation serait vraie tout le temps. Les deux amplitudes varieraient au cours du temps avec la
fréquence (E0 + A) / h . Ce sont là les deux seules possibilités d'états pour lesquelles la relation entre
C1 et C 2 est indépendante du temps.

Nous avons trouvé deux solutions particulières dans lesquelles les deux amplitudes ne changent pas
en module et, de plus, ont des phases qui varient à la même fréquence. Ce sont des états
stationnaires, c'est-à-dire que ce sont des états d'énergie définie. L'état ψ II a l'énergie
EII = E0 − A et l'état ψ I a l'énergie E I = E0 + A . Ce sont les deux seuls états stationnaires qui
existent et nous avons donc trouvé que la molécule a deux niveaux d'énergie, avec une différence
d'énergie 2A (nous voulons dire, évidemment, deux niveaux d'énergie pour chacun des états de
rotation ou de vibration que nous avons définis dans nos hypothèses initiales).

Si nous n'avions pas tenu compte de la possibilité que l'azote bascule d'un coté et de l'autre, nous
aurions pris A égal à zéro et les deux niveaux d'énergie auraient été confondus à l'énergie E 0 . Les
niveaux réels ne sont pas ainsi, leur énergie moyenne est E 0 , mais ils sont séparés de ± A de
chaque coté, ce qui donne une séparation de 2A entre les énergies des deux états. Comme A est en
fait très petit, la différence en énergie est aussi très petite.

Pour exciter un électron à l'intérieur d'un atome, il faut des énergies relativement très élevées,
correspondant à des photons des domaines optique ou ultraviolet. Pour exciter les vibrations des
molécules, il faut des rayonnements dans l'infrarouge. Si vous considérez l'excitation des rotations,
la différence d'énergie entre les états correspond à des photons dans l'infrarouge lointain. Mais la
différence d'énergie 2A est encore plus petite que toutes celles-ci et est en fait en dessous de
l'infrarouge et en plein dans la région des ondes centimétriques. Expérimentalement, on a trouvé
qu'il y a une paire de niveaux séparés de 10 −4 électrons volts, correspondant à une fréquence de
24000 mégacyles. Cela signifie évidemment que 2 A = hf , avec f = 24000 mégacycles (ce qui
correspond à une longueur d'onde de 1.25 cm). Nous avons donc ici une molécule qui a une
transition qui n'émet pas de lumière au sens ordinaire, mais qui émet des ondes centimétriques.

Pour ce qui suit, nous avons besoin de récrire un peu mieux ces deux états d'énergie définie.
Supposons que nous construisions une amplitude C II en prenant la somme des deux nombres C1 et
C2 :
(5) C II = C1 + C 2 = 1 φ + 2 φ

Qu'est-ce que cela voulait dire ? Eh bien, ceci n'est autre que l'amplitude pour trouver l'état φ
dans un nouvel état II dans lequel les amplitudes des états de base originels sont égales.
Autrement dit, en écrivant C II = II φ , nous pouvons supprimer le φ de l'équation (5), puisque
celle-ci est vraie pour tout φ , et nous obtenons
(6) II = 1 + 2
ce qui signifie la même chose que
(7) II = 1 + 2

L'amplitude pour que l'état II soit dans l'état 1 est


(8) 1 II = 1 1 + 1 2
ce qui vaut 1, évidemment, puisque 1 et 2 sont des états de base. L'amplitude pour que l'état
II soit dans l'état 2 est aussi 1, si bien que l'état II a des amplitudes égales pour être dans les
deux états de base 1 et 2 .

Nous avons cependant un petit ennui. La probabilité totale qu'a l'état II d'être dans l'un ou l'autre
des états de base est supérieure à un. Cependant, cela signifie simplement que le vecteur d'état n'est
pas normalisé. Nous pouvons arranger cela en nous rappelant que nous devrions avoir II II = 1
pour tout état. En utilisant la relation générale
(9) χ φ = ∑ χ i i φ
i

en prenant l'état II pour χ et φ , et en prenant la somme sur les états de base 1 et 2 , nous
obtenons
(10) II II = II 1 1 II + II 2 2 II

Ceci sera égal à un, comme il se doit, si nous remplaçons notre définition de C II , dans (5), par

(11) C II =
1
(C1 + C 2 )
2

De la même façon, nous pouvons construire l'amplitude


(12) C I =
1
(C1 − C 2 )
2
ou
(13) C I =
1
(1φ − 2 φ )
2
Cette amplitude est la projection de l'état φ sur un nouvel état I qui a des amplitudes opposées
pour être dans les états 1 et 2 . Précisément, l'équation (13) signifie la même chose que

(14) I =
1
(1 − 2 )
2
ou
(15) I =
1
(1 − 2 )
2
d'où il découle que
1
(16) 1 I = =− 2 I
2

Maintenant, la raison pour laquelle nous avons fait tout cela est que les états I et II peuvent
être pris comme un nouvel ensemble d'états de base, ce qui est particulièrement commode pour
décrire les états stationnaires de la molécule d'ammoniac. Vous vous rappelez que la condition
nécessaire pour un ensemble d'états de base est
(17) i j = δ ij

Nous avons déjà tout défini de façon que


(18) I I = II II = 1

Vous pouvez montrer facilement, à partir des équations (7) et (15), que
(19) I II = II I = 0

Les amplitudes C I = I φ et C II = II φ , pour qu'un état φ quelconque soit dans l'un de nos
nouveaux états de base I et II , doivent aussi satisfaire une équation hamiltonienne. En fait, si
nous soustrayons simplement les deux équations (3) et (4) et si nous différentions par rapport à t,
nous voyons que
dC I
(20) ih = (E 0 + A)C I = E I C I
dt

Et, en prenant la somme de ces équations, nous voyons que


dC
(21) ih II = (E0 − A)C II = E II C II
dt

En utilisant I et II comme états de bas, la matrice hamiltonienne a la forme simple


H I ,I = E I H I , II = 0
(22)
H II , I = 0 H II , II = E II

Notez que chacune des équations (20) et (21) a exactement la même allure que l'équation pour un
système à un seul état. Leur dépendance dans le temps est donnée par une simple exponentielle
correspondant à une seule énergie. Les amplitudes pour être dans chaque état évoluent
indépendamment au cours du temps.

Les deux états stationnaires ψ I et ψ II que nous avons trouvés ci-dessus sont évidemment des
solutions de (20) et (21). L'état ψ I (pour lequel C1 = −C 2 ) a
( )
− (i / h ) E0 + A t
(23) C I = e C II = 0

Et l'état ψ II (pour lequel C1 = C 2 ) a


( )
− ( i / h ) E0 − A t
(24) C I = 0 C II = e

Rappelez-vous que les amplitudes dans (23) sont


(25) C I = I ψ I et C II = II ψ I
si bien que (23) signifie la même chose que
− (i / h )( E0 + A )t
(26) ψ I = I e
Ce qui veut dire que le vecteur d'état stationnaire ψ I est le même que le vecteur d'état de l'état de
base I , à un facteur exponentiel près, correspondant à l'énergie de l'état. En fait, en t = 0
(27) ψ I = I

L'état I a la même configuration physique que l'état stationnaire d'énergie E 0 + A . De la même


façon, pour le deuxième état stationnaire, nous avons
− (i / h )(E0 − A )t
(28) ψ II = II e

L'état II n'est autre que l'état stationnaire d'énergie E 0 − A en t = 0. Par conséquent, nos
nouveaux états de base I et II ont physiquement la forme d'états d'énergie définie, lorsqu'on
supprime l'exponentielle en t de façon à ce qu'ils soient des états de base ne dépendant pas du
temps. Dans ce qui suit, il sera commode de n'avoir pas à distinguer entre les états stationnaires
ψ I et ψ II et leurs états de base I et II , puisqu'ils ne diffèrent que par ces facteurs de temps
triviaux.

En résumé, les vecteurs d'états I et II forment une paire de vecteurs de base qui sont
appropriés pour décrire les états d'énergie définie de la molécule d'ammoniac. Ils sont reliés à nos
vecteurs de base originaux par
(29) I =
1
( 1 − 2 ) II = 1 ( 1 + 2 )
2 2

Les amplitudes pour être en I et II sont reliées à C1 et C 2 par

(30) C I =
1
(C1 − C 2 ) C II =
1
(C1 + C 2 )
2 2
Tout état peut être représenté par une combinaison linéaire de 1 et 2 , avec des coefficients C1
et C 2 , ou par une combinaison linéaire des états de base d'énergie définie I et II , avec des
coefficients C I et C II . Donc,
(31) φ = 1 C1 + 2 C 2
ou
(32) φ = I C I + II C II

La deuxième expression nous donne l'amplitude pour trouver l'état φ dans un état d'énergie
E I = E0 + A ou dans un état d'énergie E II = E0 − A .
IV.2. La molécule dans un champ électrique statique
Si la molécule d'ammoniac est dans l'un des deux états d'énergie définie et si nous la perturbons
avec une fréquence ω telle que hω = E I − E II = 2 A , le système peut effectuer une transition d'un
état à l'autre. Ou bien, s'il est dans l'état supérieur, il peut passer dans l'état inférieur et émettre un
photon. Mais, pour induire une telle transition, il faut qu'il y ait une connexion physique entre les
deux états, une certaine façon de perturber le système. Il faut qu'il y ait un mécanisme extérieur qui
affecte les états, tel qu'un champ magnétique ou un champ électrique, sinon ces états d'énergie
définie parfaitement constant dans le temps n'ont aucune raison d'effectuer une transition. Dans ce
cas particulier, les états sont sensibles à un champ électrique. Nous allons donc étudier maintenant
le comportement de la molécule d'ammoniac dans un champ électrique.

Pour discuter le comportement dans un champ électrique, nous allons revenir au système de base
original 1 et 2 plutôt que d'utiliser I et II . Supposons qu'il y ait un champ électrique dans
une direction perpendiculaire au plan des atomes d'hydrogène. En oubliant pour le moment la
possibilité de basculement de l'azote, serait-il vrai que l'énergie de la molécule soit la même pour
les deux positions de l'atome d'azote ? En général non. Les électrons ont tendance à venir plus près
de l'azote que des noyaux d'hydrogène, si bien que les hydrogènes sont légèrement positifs, d'une
quantité qui dépend des détails de la distribution des électrons. C'est un problème compliqué que de
calculer exactement ce qu'est cette distribution, nous l'avons vu, mais, quoi qu'il en soit, le résultat
brut est que la molécule d'ammoniac a un moment dipolaire électrique, comme l'indique la figure
précédente. Nous pouvons continuer notre analyse sans connaître en détail la direction et la valeur
de ce déplacement de charges. Cependant, pour être cohérent avec les notations des autres auteurs,
supposons que le moment dipolaire soit µ , perpendiculaire au plan des atomes d'hydrogène et
orienté vers eux.

Maintenant, si l'azote bascule d'un coté à l'autre, le centre de masse ne change pas mais le moment
dipolaire électrique bascule. A cause de ce moment, l'énergie dans un champ électrique E
dépendra de l'orientation moléculaire. Avec l'hypothèse faite ci-dessus, l'énergie potentielle sera
plus grande si l'atome d'azote pointe dans la direction du champ et plus basse si l'azote est dans la
direction opposée. La différence entre les deux énergies sera 2 µ E .
Jusqu'à ce point de la discussion, nous avons supposé que E 0 et A avaient certaines valeurs sans
que nous soyons capables de les calculer. D'après la théorie correcte, il devrait être possible de
calculer ces constantes en fonction des positions et des mouvements de tous les noyaux et de tous
les électrons. Mais personne ne l'a jamais fait. Un tel système contient dix électrons et quatre
noyaux et c'est vraiment un problème trop compliqué. En fait, personne n'en connaît plus sur cette
molécule que ce que nous avons dit. Tout ce qu'on peut dire est que, lorsqu'il y a un champ
électrique, les énergies des deux états sont différentes, la différence étant proportionnelle au champ
électrique. Nous avons appelé le coefficient de proportionnalité 2 µ , mais sa valeur doit être
déterminée expérimentalement. Nous pouvons dire aussi que la molécule a une amplitude A pour
basculer mais ceci doit également être mesuré expérimentalement. Personne ne peut nous donner
les valeurs théoriques précises pour µ et A, car les calculs détaillés sont beaucoup trop
compliqués.

Lorsque la molécule d'ammoniac est dans un champ électrique, il faut changer notre description. Si
nous ignorions l'amplitude pour que la molécule bascule d'une configuration à l'autre, nous
attendrions des énergies E 0 ± µ E pour les deux états 1 et 2 . Nous prenons donc
(1) H 11 = E0 + µ E H 22 = E0 − µ E

Nous allons également supposer que, pour les champs électriques qui nous intéresse, le champ ne
change pas notablement la géométrie de la molécule et, par conséquent, qu'il n'affecte pas
l'amplitude pour que l'azote saute d'une position à l'autre. Nous pouvons donc supposer que H 12 et
H 21 ne sont pas modifiés. Si bien que
(2) H 12 = H 21 = − A

Nous devons maintenant résoudre les équations hamiltoniennes avec les nouvelles valeurs H ij .

Nous voulons la solution générale d'une paire d'équations hamiltoniennes


dC
(3) ih 1 = H 11C1 + H 12 C 2
dt
dC 2
(4) ih = H 21C1 + H 22 C 2
dt

Comme ce sont des équations différentielles linéaires à coefficients constants, nous pouvons
toujours trouver des solutions qui sont des fonctions exponentielles de la variable t. Nous cherchons
d'abord une solution où C1 et C 2 ont tous les deux la même dépendance dans le temps. Nous
pouvons utiliser les fonctions d'essai
(5) C1 = a1e −iω t C 2 = a 2 e −iωt

Comme une telle solution correspond à un état d'énergie E = hω , nous pouvons tout aussi bien
l'écrire tout de suite
(6) C1 = a1e − (i / h )Et
(7) C 2 = a 2 e − (i / h )Et
où E est jusqu'ici inconnu et doit être déterminé de telle façon que les équations différentielles (3)
et (4) soient satisfaites.

Lorsque nous portons C1 et C 2 de (6) et (7) dans les équations différentielles (3) et (4), les dérivées
nous donnent juste − iE / h fois C1 ou C 2 , si bien que les cotés gauche se réduisent à EC1 et EC 2 .
En supprimant les facteurs exponentiels communs, nous obtenons
(8) Ea1 = H 11 a1 + H 12 a 2 Ea 2 = H 21 a1 + H 22 a 2

Ou, en réarrangeant les termes,


(9) (E − H 11 )a1 − H 12 a 2 = 0
(10) − H 21 a1 + (E − H 22 )a 2 = 0

Avec un tel ensemble d'équations homogènes algébriques, il n'y a de solution non nulle pour a1 et
a 2 que si le déterminant des coefficients de a1 et a 2 est nul, c'est-à-dire si
 E − H 11 − H 12 
(11) det =0
 − H 21 E − H 22 
Cependant, lorsqu'il n'y a que deux équations à deux inconnues, nous n'avons pas besoin d'une telle
sophistication. Les deux équations (9) et (10) donnent chacune le rapport de deux coefficients a1 et
a 2 et ces deux rapports doivent être égaux. D'après (9), nous avons
a H 12
(12) 1 =
a 2 E − H 11
et d'après (10)
a E − H 22
(13) 1 =
a2 H 21

En égalant ces deux rapports, nous trouvons que E doit satisfaire


(14) (E − H 11 )(E − H 22 ) − H 12 H 21 = 0
ce qui n'est d'ailleurs rien d'autre que le déterminant (11). De l'une ou l'autre façon, nous avons une
équation quadratique en E qui a deux solutions :
H + H 22 (H 11 − H 22 )2
(15) E = 11 ± + H 12 H 21
2 4

Ce sont les deux valeurs possibles pour l'énergie E. Remarquez que les deux solutions donnent des
nombres réels pour l'énergie, car, la matrice hamiltonienne étant hermitique, H 11 et H 22 sont réels
et H 12 H 21 est égal à H 12 H 12∗ = H 12 , qui est à la fois réel et positif.
2

En utilisant la même convention que précédemment, nous appellerons l'énergie supérieure E I et


l'énergie inférieure E II . Nous avons
H 11 + H 22 (H 11 − H 22 )2
(16) E I = ± + H 12 H 21
2 4
H + H 22 (H 11 − H 22 )2
(17) E II = 11 − + H 12 H 21
2 4
En employant chacune de ces deux énergies séparément dans les équations (6) et (7), nous obtenons
les amplitudes pour les deux états stationnaires (les états d'énergie définie). S'il n'y a pas de
perturbation, un système placé initialement dans l'un de ces états y restera pour toujours, seule sa
phase change.

Nous pouvons vérifier nos résultats sur deux cas particuliers. Si H 12 = H 21 = 0 , nous avons
E I = H 11 et E II = H 22 . Ceci est certainement correct, car alors les équations (3) et (4) ne sont plus
couplées et chacune représente un état d'énergie, H 11 pour l'une et H 22 pour l'autre. De plus, si
nous posons H 11 = H 22 = E 0 et H 21 = H 12 = − A , nous obtenons la solution que nous avons trouvée
plus haut :
(18) E I = E0 + A et E II = E0 − A

Dans le cas général, les deux solutions E I et E II correspondent à deux états, que nous pouvons
encore appeler les états
− (i / h ) R I t − (i / h ) RII t
(19) ψ I = I e et ψ II = II e

Pour ces états, C1 et C 2 sont donnés par les équations (6) et (7), où a1 et a 2 ne sont pas encore
déterminés. Leur rapport est donné soit par (12), soit par (13). Ils doivent également satisfaire une
autre condition. Si on sait que le système est dans l'un des états stationnaires, la somme des
probabilités de le trouver en 1 ou en 2 doit être égale à un. Il faut que
2 2
(20) C1 + C 2 = 1
ou, de façon équivalente,
2
(21) a1 + a 2 2 = 1

Ces conditions ne déterminent pas a1 et a 2 de façon unique, ils ne sont encore déterminés qu'à une
phase arbitraire près, c'est-à-dire à un facteur du genre e iδ près. Quoi qu'on puisse écrire une
solution générale pour les a, il est en général plus commode de les calculer dans chaque cas
particulier.

Par exemple, l'ensemble suivant constitue une solution acceptable, comme vous pouvez facilement
le vérifier,
H 12 E − H 11
(22) a1 = a2 =
[ ]
(E − H 11 ) + H 12 H 21
2 1/ 2
[ ]
(E − H 11 )2 + H 12 H 21
1/ 2

Revenons maintenant à notre exemple de la molécule d'ammoniac dans un champ électrique. En


utilisant les valeurs de H 11 , H 22 et H 12 données par (1) et (2) nous trouvons, pour les énergies des
deux états stationnaires
(23) E I = E0 + A 2 + µ 2 E 2 E II = E0 − A 2 + µ 2 E 2

Sur la figure ci-dessous sont tracées les courbes de l'énergie en fonction de l'intensité du champ
électrique E , pour chacune des énergies.
Lorsque le champ électrique est nul, les deux énergies sont évidemment E 0 ± A . Lorsqu'on
applique un champ électrique, la séparation entre les deux niveaux augmente. Cette séparation
augmente tout d'abord lentement avec E , mais ensuite, elle arrive à devenir proportionnelle à E
(la courbe est une hyperbole). Pour des champs extrêmement intenses, les énergies sont simplement
(24) E I = E0 + µ E = H 11 E II = E 0 − µ E = H 22

Le fait qu'il y ait une amplitude pour que l'azote bascule d'un coté ou de l'autre a peu d'effet lorsque
les deux positions ont des énergies très différentes. C'est là un point intéressant sur lequel nous
reviendrons plus tard.
Nous sommes enfin prêts à comprendre le fonctionnement du maser à ammoniac. Le principe est le
suivant. Tout d'abord, nous trouvons un moyen de séparer les molécules dans l'état I de celles
dans l'état II (plus exactement ψ I et ψ II mais comme signalé plus haut, le facteur
exponentiel n'a pas besoin d'être pris en compte simplement pour identifier les états). On envoie
alors les molécules qui sont dans l'état d'énergie le plus élevé, I , dans une cavité dont la
fréquence de résonance est de 24000 mégacycles. Les molécules peuvent libérer leur énergie dans
la cavité, d'une façon que nous discuterons plus tard, et quitter la cavité dans l'état II . Chaque
molécule qui effectue une transition libère l'énergie E = E I − E II dans la cavité. L'énergie venant
des molécules apparaîtra sous forme d'énergie électrique dans la cavité.

Comment pouvons-nous séparer les deux états moléculaires ? Une des méthodes est la suivante. On
envoie un petit jet d'ammoniac gazeux à travers une paire de fentes pour obtenir un faisceau étroit,
comme le montre la figure ci-dessous.

Le faisceau est alors envoyé dans une région dans laquelle il y a un grand champ électrique
transversal. Les électrodes qui produisent le champ ont une forme telle que le champ électrique
varie rapidement en traversant le faisceau. Le carré du champ électrique E ⋅ E aura alors un fort
gradient perpendiculaire au faisceau. Maintenant, une molécule dans l'état I a une énergie qui
croît avec E 2 et par conséquent, une partie du faisceau sera défléchie vers la région de petit E 2 .
Par ailleurs, une molécule dans l'état II sera défléchie vers la région de grand E 2 , puisque son
énergie décroît lorsque E 2 croît.

Incidemment, avec les champs électriques que l'on peut produire dans le laboratoire, l'énergie µ E
est toujours beaucoup plus petite que A. Dans ce cas-là, la racine carré de l'équation (23) peut être
approchée par
 1 µ 2E 2 
(25) A1 + 
2 
 2 A 

Si bien que, pratiquement, les niveaux d'énergie sont


µ 2E 2
(26) E I = E0 + A +
2A
et
µ 2E 2
(27) E II = E0 − A −
2A

Et les énergies varient alors approximativement linéairement avec E 2 . La force sur les molécules
est alors
µ2
(28) F = ∇E 2
2A

Beaucoup de molécules ont une énergie dans un champ électrique qui est proportionnelle à E 2 . Le
coefficient est la polarisabilité de la molécule. L'ammoniac a une polarisabilité anormalement
élevée du fait de la petite valeur de A au dénominateur. Et ainsi, les molécules d'ammoniac sont
anormalement sensibles à un champ électrique (que prédisez-vous pour le coefficient diélectrique
du gaz d'ammoniac ?)
IV.3. Transitions dans un champ dépendant du temps
Dans le maser à ammoniac, le faisceau constitué de molécules dans l'état I , d'énergie E I , est
envoyé dans une cavité résonnante, comme le montre la figure ci-dessous.

L'autre faisceau est éliminé. A l'intérieur de la cavité, il y a un champ électrique variant dans le
temps et le problème que nous devons discuter maintenant a trait au comportement d'une molécule
dans un champ électrique qui varie avec le temps. C'est un genre de problème complètement
différent, avec un hamiltonien variant dans le temps. Comme H ij dépend de E , les H ij varient
avec le temps, et nous avons à déterminer le comportement du système dans de telles circonstances.

Pour commencer, nous écrivons les équations du système qu'il faut résoudre :
dC1
ih = (E0 + µ E )C1 − AC 2
dt
(1)
dC
ih 2 = − AC1 + (E 0 − µ E )C 2
dt

Pour être précis, supposons que le champ électrique varie sinusoïdalement. Nous pouvons alors
écrire
( )
(2) E = 2E0 cos ω t = E0 e iω t + e − iω t

Dans le fonctionnement réel, la fréquence ω sera très proche de la fréquence de résonance de la


transition moléculaire ω 0 = 2 A / h , mais, pour l'instant, nous voulons conserver la généralité et
nous supposerons qu'elle peut avoir n'importe quelle valeur. La meilleure façon de résoudre nos
équations est de former une combinaison linéaire de C1 et de C 2 comme nous l'avons fait
auparavant. Nous ajoutons donc les deux équations, nous les divisions par la racine carrée de 2 et
nous employons la définition de C I et C II . Nous obtenons
dC
(3) ih II = (E0 − A)C II + µ EC I
dt

Vous noterez que cette équation est la même que précédemment, avec un terme supplémentaire dû
au champ électrique. De même, si nous soustrayant les deux équations (1), nous obtenons
dC
(4) ih I = (E0 + A)C I + µ EC II
dt

Maintenant la question qui se pose est : comment résoudre ces équations ? Elles sont plus difficiles
que l'ensemble précédent, car E dépend de t. Et, en fait, pour un E (t ) quelconque, la solution ne
peut pas s'exprimer avec des fonctions élémentaires. Cependant, nous pouvons obtenir une bonne
approximation tant que le champ électrique est petit. Nous écrirons d'abord
−i (E + A )t / h −iE t / h
CI = γ I e 0 = γ Ie I
(5) −i (E − A )t / h −iE t / h
C II = γ II e 0 = γ II e II
S'il n'y avait pas de champ électrique, ces solutions seraient correctes avec γ I et γ II égaux à deux
constantes complexes. En fait, comme la probabilité d'être dans l'état I est le carré du module de
C I et la probabilité d'être dans l'état II le carré du module de C II , la probabilité d'être dans l'état
I ou dans l'état II est juste γ I ou γ II . Par exemple, si le système part dans l'état initial
2 2

II , si bien que γ I est nul et γ II


2
vaut un, il reste dans cet état pour toujours. Il n'y aurait aucune
chance, si la molécule état initialement dans l'état II , pour qu'elle passe dans l'état I .

Maintenant, notre idée pour avoir écrit nos équations sous la forme (5) est que si µ E est petit en
comparaison de A, les solutions peuvent encore être écrites de cette façon, mais alors γ I et γ II
deviennent des fonctions dépendant lentement du temps, où "dépendant lentement" veut dire
lentement par rapport aux fonctions exponentielles. C'est là le truc. L'hypothèse est plausible
puisque avec un champ électrique faible, la perturbation est faible, les états stationnaires presque
identiques et si en plus le champ varie lentement, l'écart doit varier lentement aussi. Nous utilisons
le fait que γ I et γ II varient lentement pour obtenir une solution approchée.

Nous voulons porter C I de (5) dans l'équation différentielle (3) mais nous devons nous rappeler
que γ I est aussi une fonction de t. Nous avons
dC − iE t / h dγ −iE t / h
(6) ih I = E I γ I e I + ih I e I
dt dt

L'équation différentielle devient


 dγ  −(i / h )E I t − (i / h ) E I t − (i / h ) E II t
(7)  E I γ I + ih I e = EI γ I e + µ Eγ II e
 dt 

De même, l'équation en dC II / dt devient


 dγ  −(i / h )EII t − (i / h ) E II t − (i / h ) E I t
(8)  E II γ II + ih II e = E II γ II e + µ Eγ I e
 dt 

Vous noterez maintenant que nous avons des termes égaux de chaque côté de l'équation. Nous
+ iE t / h
supprimons ces termes et nous multiplions la première équation par e I et la deuxième par
+ iE t / h
e II . En vous rappelant que E I − E II = 2 A = hω 0 , nous avons finalement

ih I = µ E (t )e 0 γ II
iω t

dt
(9)
dγ II
= µ E (t )e 0 γ I
−iω t
ih
dt

Nous avons maintenant une paire d'équations apparemment simples et encore exactes, bien
entendu. La dérivée d'une des variables est une fonction du temps µ E (t )e 0 , multiplié par la
iω t

seconde variable. La dérivée de la seconde est une fonction similaire du temps multipliée par la
première. Quoique ces équations simples ne puissent pas être résolues en général, nous allons
maintenant les résoudre dans quelques cas particuliers.

Nous ne nous intéressons, pour le moment du moins, qu'au cas d'un champ électrique oscillant. En
prenant un E (t ) de la forme (2), nous trouvons que les équations pour γ I et γ II deviennent

ih I = µ E 0 e
dt
[i (ω +ω 0 )t
+e
−i (ω −ω 0 )t
]
γ II
(10)

ih II = µE0 e
dt
[i (ω −ω 0 )t
+e
−i (ω +ω 0 )t
γI ]
Maintenant, si E0 est suffisamment petit, dγ I / dt et dγ II / dt varient eux aussi lentement. Les
deux γ ne varieront pas beaucoup avec t, surtout par rapport aux variations rapides dues aux
termes exponentiels. Les termes exponentiels ont leurs parties réelles et imaginaires qui oscillent à
la fréquence ω + ω 0 ou ω − ω 0 . Les termes avec ω + ω 0 oscillent très rapidement autour de leur
valeur moyenne qui est zéro et, par conséquent ils ne contribuent pas beaucoup en moyenne au
changement des γ . Nous pouvons donc obtenir une approximation raisonnablement bonne en
remplaçant ces termes par leur valeur moyenne, c'est-à-dire par zéro. Nous les abandonnons tout
simplement et nous prenons comme approximation :
dγ − i (ω −ω 0 )t
ih I = µ E 0 e γ II
dt
(11)
dγ i (ω −ω 0 )t
ih II = µE0 e γI
dt

Même les termes restants, avec des exponentielles à (ω − ω 0 ) varieront rapidement aussi, sauf si ω
est proche de ω 0 . C'est seulement dans ce cas que le terme de droite varie suffisamment lentement
pour qu'une quantité suffisante s'accumule lorsque nous intégrons par rapport à t. Autrement dit,
avec un champ électrique faible les seules fréquences qui contribuent sont celles proches de ω 0 .

Avec l'approximation faite pour obtenir (11), les équations peuvent être résolues exactement, mais
c'est un travail un peu compliqué. Pour l'instant, nous allons seulement le résoudre
approximativement ou, plutôt, nous trouverons une solution exacte dans le cas de la résonance
parfaite, ω = ω 0 .
IV.4. Transitions à la résonance
Prenons tout d'abord le cas de la résonance parfaite. Si nous prenons ω = ω 0 , les exponentielles
sont égales à un et nous avons seulement
dγ I iµ E 0
=− γ II
dt h
(1)
dγ II iµ E 0
=− γI
dt h

Si nous éliminons d'abord γ I et ensuite γ II de ces équations, nous trouvons que chacun satisfait
l'équation différentielle d'un simple mouvement harmonique :
d 2γ  µ E0 
2

(2) 2
= −  γ
dt  h 

Les solutions générales de ces équations peuvent être construites avec des sinus et des cosinus.
Comme vous pouvez facilement le vérifier, les équations suivantes constituent une solution :
 µE   µE 
γ I = a cos 0 t + b sin  0 t
 h   h 
(3)
 µE   µE 
γ II = ib cos 0 t − ia sin  0 t
 h   h 
où a et b sont des constantes à déterminer pour chaque situation physique particulière.

Supposez par exemple que, pour t = 0, notre système moléculaire soit dans l'état d'énergie supérieur
I , ce qui exige que γ I = 1 et γ II = 0 en t = 0. Dans cette situation, il nous faut a = 1 et b = 0. La
probabilité pour que la molécule soit dans l'état I à un instant ultérieur t est le carré du module de
γ I ou
 µ E0 
(4) PI = γ I = cos 2 
2
t
 h 

De même, la probabilité pour que la molécule soit dans l'état II est donnée par le carré du module
de γ II ,
 µ E0 
(5) PII = γ II = sin 2 
2
t
 h 

Tant que E est petit et que nous sommes à la résonance, les probabilités sont données par de
simples fonctions oscillantes. La probabilité pour être dans l'état I tombe de un à zéro et remonte
ensuite, tandis que la probabilité pour être dans l'état II monte de zéro à un et ainsi de suite. La
variation dans le temps de ces deux probabilités est indiquée dans la figure ci-dessous.

Il est inutile de dire que la somme des deux probabilités est toujours égale à un. La molécule est
toujours dans un état !
Supposons que la molécule mette un temps T pour passer à travers la cavité. Si nous prenons une
cavité juste assez longue pour que µ E0T / h = π / 2 , alors une molécule qui entre dans l'état I sort
certainement dans l'état II . Si elle entre dans la cavité dans l'état supérieur, elle quitte la cavité
dans l'état inférieur. En d'autres termes, son énergie est diminuée et l'énergie perdue ne peut aller
nulle part ailleurs que dans la machinerie qui produit le champ. Il n'est pas facile de voir de façon
détaillée comment l'énergie de la molécule alimente les oscillations de la cavité. Mais nous n'avons
pas besoin d'étudier ces détails car nous pouvons appliquer le principe de la conservation de
l'énergie (nous pourrions les étudier si nous avions à le faire, mais nous aurions à traiter la
mécanique quantique du champ dans la cavité en plus de la mécanique quantique de la molécule).

En résumé : la molécule entre dans la cavité, le champ de la cavité, oscillant exactement à la bonne
fréquence, induit des transitions de l'état supérieur à l'état inférieur et l'énergie libérée alimente le
champ oscillant. Dans un maser en fonctionnement, les molécules libèrent suffisament d'énergie
pour maintenir les oscillations dans la cavité et, non seulement elles fournissent assez de puissance
pour compenser les pertes de la cavité, mais encore elles libèrent un peu de puissance en excès qui
peut être extraite de la cavité. Par conséquent, l'énergie moléculaire est convertie en énergie d'un
champ électromagnétique extérieur.

Rappelez-vous qu'avant que le faisceau pénètre dans la cavité, nous devons utiliser un filtre pour
séparer le faisceau de façon que seul l'état supérieur entre. Il est facile de démontrer que si vous
partiez avec des molécules dans l'état inférieur, le processus irait dans l'autre sens et prendrait de
l'énergie à la cavité. Si vous envoyez le faisceau non filtré dans la cavité, il y a autant de molécules
qui prennent de l'énergie que molécules qui en libèrent, si bien que rien ne se passe. Dans le
fonctionnement réel, il n'est pas nécessaire, bien entendu, de prendre (µ E0T / h ) exactement égal à
π / 2 . Pour toute autre valeur (sauf pour un multiple entier exact de π ), il y a une certaine
probabilité de transition de l'état I vers l'état II . Pour d'autres valeurs, cependant, le système
n'est pas 100% efficace. Un grand nombre de molécules qui quittent la cavité auraient pu délivrer
de l'énergie dans la cavité mais ne l'ont pas fait.

Dans le fonctionnement réel, les vitesses de toutes les molécules ne sont pas les mêmes. Elles ont
une sorte de distribution de Maxwell. Ceci veut dire que les périodes idéales sont différentes pour
différentes molécules et il est impossible d'obtenir 100% d'efficacité pour toutes les molécules à la
fois. De plus, il y a une autre complication dont il est facile de tenir compte, mais nous ne voulons
pas nous en soucier à ce niveau. Vous vous rappelez que d'habitude le champ électrique dans une
cavité varie de place en place à l'intérieur de la cavité. Par conséquent, lorsque la molécule traverse
la cavité, le champ électrique appliqué à la molécule varie de façon plus compliquée que la simple
oscillation sinusoïdale dans le temps que nous avons supposée. Il est clair qu'il faudrait utiliser une
intégration plus compliquée pour résoudre le problème exactement, mais l'idée générale serait
encore la même.
IV.5. Le laser
Le laser est un dispositif devenu maintenant d'un usage courant dans maintes applications comme
les lecteurs DVD ou les lecteurs de code à barres dans les supermarchés.

Sa principale fonction est d'émettre un rayon lumineux appelé "rayon laser". Le "L" de laser vient
de "Ligth", lumière, par opposition au "M" de Maser pour "Micro-ondes".

Son fonctionnement est une bonne illustration du comportement grégaire des photons.

Nous n'en donnerons ici qu'une description qualitative, tous les phénomènes physiques qui
interviennent ayant été étudié dans ce qui précède.

Propriétés des lasers


La lumière laser est un rayonnement lumineux tout à fait remarquable. Voici ces principales
propriétés (pour certains lasers, toutes les propriétés ne sont pas présentes).

 La lumière est extrêmement directionnelle. Le faisceau laser est droit et ne se disperse que sur
une très longue distance. Cela permet, par exemple, son emploi pour envoyer des impulsions
lumineuses vers la Lune où le reflet sur des catadioptres déposés lors des missions Apolo
permet de mesurer la distance Terre - Lune avec une grande précision (de l'ordre du
centimètre). Le rayon laser envoyé au Pic du Midi ne présente une dispersion que de l'ordre de
la centaine de mètres sur la surface lunaire. Au retour, on a la même dispersion et le faisceau
s'est élargi de plusieurs dizaines de kilomètres, il faut donc des détecteurs très sensibles pour
capter les quelques photons captés dans les détecteurs.
 La lumière est extrêmement intense. Plus le faisceau laser est étroit et plus les impulsions
lumineuses sont courtes, plus la puissance d'une telle impulsion peut être élevée. Cela permet le
découpage de métaux ou d'autres applications de puissance comme la fusion thermonucléaire
inertielle (implosion de billes de combustible deutérium - tritium par impact de lasers). Certains
lasers peuvent envoyer des impulsions de l'ordre du mégajoule, ce qui correspond à des
puissances se chiffrant en pétawatt !
 La lumière est monochromatique. Elle est composée d'une seule longueur d'onde (ou de
quelques longueurs d'ondes précises).
 La lumière est cohérente. Une impulsion lumineuse est composée d'une onde unique avec une
phase bien définie. Le fait qu'elle soit monochromatique est évidemment important pour cela
(s'il y a plusieurs fréquences, c'est qu'il y a plusieurs ondes ou, ce qui revient au même, une
seule onde non sinusoïdale et donc de fréquence et de phase moins bien définie puisqu'une telle
onde se décompose en plusieurs ondes sinusoïdales de fréquences et de phases variées).

La cohérence permet d'exploiter les phénomènes d'interférence dans des procédés tel que
l'holographie (photos en reliefs) ou d'effectuer aisément, plus prosaïquement en ce qui nous
concerne, une expérience de Young.

La cohérence est vraiment caractéristique de l'effet laser.

Notons que certains lasers émettent des impulsions courtes, d'autres un faisceau continu. L'usage de
l'un ou de l'autre dépend des applications. Les impulsions ultra courtes que l'on sait maintenant
fabriquer (inférieure à un millième de milliardième de seconde) permettent de littéralement
"photographier" le déroulement des réactions chimiques afin d'élucider leurs processus. On arrive
même maintenant à observer le déplacement des électrons lors d'une réaction chimique. Les
impulsions longues sont plus appréciées lorsqu'il s'agit d'exploiter leur cohérence.

La longueur d'onde des lasers est très variable selon les lasers. Ainsi, on trouve des lasers dans le
domaine des ondes radios (appelés masers), jusqu'au rayons X. Ces derniers sont difficiles à
fabriquer et ils avaient encore récemment de très mauvais rendement (peu d'énergie émise pour leur
consommation). La plus part des lasers se situent dans la lumière visible et l'infrarouge.

Le tout premier laser fabriqué fut en réalité un maser à ammoniac, que nous avons décrit en détail.
Le premier véritable laser (dans le rayonnement visible) fut un laser à rubis.

La fabrication de diodes lasers grâce aux semi-conducteurs permet de fabriquer des lasers d'une
taille infime. Cela a conduit à la miniaturisation et à l'explosion du marché des lecteurs CD et
DVD. Récemment on ne savait encore fabriquer que des diodes lasers rouges ou infrarouges. Il est
intéressant de disposer d'une courte longueur d'onde car les phénomènes de diffraction empêchent
de graver ou lire des détails plus fins que la longueur d'onde. On a ainsi mit au point de diodes
lasers bleues qui autorisent une grande capacité de stockage sur les DVD (HD-DVD et Blue Ray
Disk). La course est actuellement lancée pour la mise au point de telles diodes lasers dans
l'ultraviolet ce qui permettrait la fabrication de DVD avec une capacité de stockage inégalée (de
telles diodes lasers existent mais leur condition d'utilisation à très basse température ou leur
dégradation rapide ne les rend pas commercialement exploitables).

Edito : l'actualité va vraiment très vite dans ce domaine et à la relecture de cet article on en est déjà
au stade des applications des lasers ultraviolets à semi-conducteurs et on a conçu les premiers lasers
à rayons X à semi-conducteurs.

Les applications des lasers sont presque sans fin. Depuis la chirurgie (ophtalmologie, par
découpage au laser de la cornée) jusqu'à la physique en passant par l'industrie, la télémétrie (mesure
précise des distances), la bureautique (les imprimantes lasers), les lecteurs de code à barres, la
métrologie, et nous en passons et des meilleurs. Et ce, grâce à l'emploi judicieux de ses multiples
propriétés remarquables.

Laser à trois états


"L'effet laser" peut prendre naissance dans différents matériaux et via divers phénomènes
physiques. Un des plus simples à comprendre est le laser "à trois états". Regardons cela d'un peu
plus près.

On part d'un matériau composé d'atomes (ou de molécules) possédant trois états bien précis.
Plus exactement il s'agit de l'état d'un électron particulier, par exemple l'électron le plus externe
d'un atome.

L'état 2 doit être très instable. Un électron (ou la molécule dans cet état) doit rester très peu de
temps dans cet état et retomber dans l'état 1.

L'état 1 doit être "métastable", c'est à dire avoir une durée de vie relativement longue par rapport à
l'état 2. L'électron retombe dans l'état de base après un temps relativement long (on parle quand
même de millionièmes de seconde, pas des heures ou des jours ! On ne parle pas ici de
phosphorescence). Typiquement il s'agit d'une raie "interdite" dont nous avons vu que la probabilité
de transition est beaucoup plus faible.
Malgré ces deux restrictions, le nombre de corps présentant une configuration adaptée est
considérable. Il existe de plus des mécanismes de lasers à deux ou plus de trois états ou avec
d'autres phénomènes physiques. Le choix est donc extrêmement large. Il existe des lasers à gaz
(ammoniac, hydrogène, gaz carbonique,…), liquides, solides (comme le laser a rubis).

Dans le maser à ammoniac, par exemple, ce n'est pas l'état d'un électron qui sert de mécanisme
mais la disposition des atomes d'hydrogène autour de l'atome d'azote. Les trois atomes d'hydrogène
forment un triangle avec l'atome d'azote disposé au centre et au-dessus du triangle. Il peut
"basculer" et passer sous le triangle. Cette transition possède aussi une quantification sous forme de
niveaux (dont les énergies faibles se situent dans le domaine des ondes radios). C'est le système que
nous venons d'étudier dans les sections précédentes.

Expliquons maintenant le principe de l'effet laser étape par étape.

Pompage
Au départ, les atomes sont au repos. Tous dans l'état de base. On provoque alors le passage massif
des atomes dans l'état 2. Ce procédé s'appelle le pompage. On peut obtenir ce pompage de plusieurs
manières (il faut juste fournir une énergie suffisante aux atomes), mais un des plus courant est le
pompage optique.

Pour passer dans l'état 2, il faut fournir une énergie égale à E 2 . Cela peut donc se faire avec des
photons ayant une énergie égale à E 2 = hν 2 avec la fréquence ν 2 .

Pour envoyer ces photons, nul besoin d'un autre laser ! Pas besoin non plus d'avoir exactement cette
fréquence. L'état 2 étant extrêmement instable, son énergie est légèrement imprécise (principe
d'indétermination énergie - temps). Il suffit donc de disposer de suffisament de photons ayant une
fréquence voisine de ν 2 . On emploiera donc une lampe très puissante ayant une couleur centrée
autour de la fréquence souhaitée.

Pas besoin non plus que ce passage dans l'état 2 soit instantané, il peut être progressif, nous allons
voir pourquoi.
Inversion de population
Une fois dans l'état 2, les atomes passent très vite (presque instantanément au vu des échelles de
temps considérées) dans l'état 1 où ils y restent… un certain temps.

Les atomes peuvent repasser progressivement, mais lentement, dans l'état de base mais le pompage
les renvoie aussi vite fait dans l'état 2 (et donc dans l'état 1).

Après quelques instants de pompage on assiste ainsi à une "inversion de population".


Une question se pose immédiatement. Pourquoi passer par l'état 2 ? Pourquoi ne pas "pomper"
directement les atomes dans l'état 1 avec des photons E1 = hν 1 ? Il existe d'ailleurs de tels lasers "à
deux états" (mais ils ont un très mauvais rendement et sont donc peu puissants, c'est le cas, en
particulier, des lasers à rayons X, sauf dans le cas de systèmes comme le maser à ammoniac où on
peut induire la transition par un processus externe comme un champ électrique oscillant). Il y a
deux raisons :
 L'état 1 étant fort stable, son énergie est très précise (à nouveau ce bon vieux principe
d'indétermination). Pour qu'un photon soit absorbé, il faut cette fois une énergie fort précise ce
qui rend l'emploi de lampe de pompage ordinaire peu efficace (leur fréquence est imprécise, ce
ne sont pas des lasers). Les lasers à rayons X emploient d'ailleurs d'autres lasers (en fait c'est
surtout pour des raisons de puissance). Inversement, si on utilisait un état 1 très instable, son
énergie serait imprécise mais cela donnerait un rayonnement laser (produit par cet état, comme
on le verra) de fréquence imprécise.
 La stabilité d'un état est réversible. C'est à dire que si l'atome a tendance à y rester longtemps il
a aussi tendance à mettre du temps pour y rentrer ! Ainsi, même avec un bon pompage les
atomes ne passeraient que lentement dans cet état et y resteraient un temps équivalent. A
l'équilibre, autant d'atomes y rentreraient que d'atomes en sortiraient. On aurait donc une
mauvaise inversion de population : la moitié des atomes dans l'état de base, la moitié dans l'état
1. Bien que, lorsque l'on n'a pas le choix, comme avec les premiers lasers à rayons X, on s'en
contente.

Emission stimulée
C'est ici que le comportement grégaire des photons va entrer en jeu.

L'électron quitte l'état excité pour se retrouver dans un autre état (ici l'état de base) de deux
manières :
 par émission spontanée. L'atome change d'état spontanément et au hasard.
 Par émission stimulée.

L'émission stimulée est produite par la présence d'un autre photon identique à celui qui va être émit
(même fréquence).
En présence de ce photon, l'atome à tendance à changer d'état beaucoup plus facilement en présence
de ce photon qui "stimule" l'émission. Nous avons vu ce processus en détail.

Ce phénomène est en fait le comportement grégaire des photons. Supposons un état donné avec un
photon, alors un état avec deux photons identiques est deux fois plus probable que pour des photons
d'états différents (par exemple avec une polarisation différente). Et plus le nombre de photons
identiques est élevé, et plus l'état est probable. La présence d'un photon identique rend donc l'état à
deux photons (et donc l'émission) beaucoup plus probable.

Bref, en présence d'un photon identique, l'atome a tendance à changer facilement d'état et en
présence d'un grand nombre de photons identiques l'atome va quasiment changer immédiatement
d'état. L'émission devient très rapide et non plus lente comme précédemment.

Notons que les deux photons sont vraiment identiques, ils ont donc aussi même phase et même
direction.

Notons que le phénomène d'émission stimulée fut découvert théoriquement par Einstein bien avant
la fabrication du premier laser.
Effet laser
Tout est prêt pour expliquer l'effet laser.

Une fois l'inversion de population obtenue, quelques atomes vont changer d'état spontanément et
émettre quelques photons d'énergie E1 = hν 1 . Ces photons circulant dans le milieu (appelé pour des
raisons évidentes "milieu amplificateur") vont provoquer des émissions stimulées augmentant le
nombre de photons de fréquence ν 1 . Et plus il y a de photons, plus l'émission stimulée est efficace.
En très peu de temps, par ce phénomène de cascade, tous les atomes vont repasser presque
instantanément dans l'état de base et on va avoir un puissant rayonnement laser de fréquence ν 1 .

Comme nous l'avons vu, même dans une faible impulsion lumineuse, le nombre de photons est tel
que la probabilité que d'autres photons rejoignent le "cortège" est considérable.
Fonctionnement général

Les différents éléments sont :


 Le milieu amplificateur contenant les atomes ou molécules à trois états.
 La lampe et son alimentation servant au pompage optique.
 Deux miroirs à chaques extrémités. Le miroir de gauche est un miroir normal (mais de très
bonne qualité), celui de droite est un miroir semi-transparent, c'est à dire qu'il laisse passer
un peu de lumière (environ 1 à 10%).

Le rôle du miroir semi-transparent est de permettre à la lumière de faire plusieurs aller-retour dans
le milieu amplificateur pour que l'émission stimulée ait le temps de se produire avec suffisament
d'intensité. Avec un miroir semi-transparent qui laisse passer environ 10% de la lumière, un photon
fait, en moyenne, dix aller-retour avant de sortir. Ainsi, le nombre de photons dans le milieu
amplificateur est dix fois plus important que si on laissait les photons s'échapper tout de suite et
nous avons vu que l'émission stimulée est d'autant meilleure (plus rapide) que le nombre de photons
est élevé. Comme la vitesse de la lumière est très élevée, les photons traversent vite, trop vite, la
cavité, et ces aller-retour sont donc indispensables pour obtenir un rendement suffisant.

Voyons maintenant les différentes propriétés de ce laser.

 Le faisceau laser étant très étroit, il concentre ainsi une grande énergie. Si de plus on
travaille avec des impulsions très courtes, l'énergie est d'autant concentrée. On parle de
brillance de la source lumineuse. La brillance d'un laser est beaucoup plus grande que
n'importe quelle source de lumière y compris la lumière solaire !
 L'état 1 étant très stable, la fréquence d'émission ν 1 est très précise. Le laser est
monochromatique.

En réalité, la fréquence du laser est surtout liée à sa géométrie ! Le rayonnement faisant des
aller-retour entre les deux miroirs, on a une onde stationnaire dans le milieu amplificateur.
La longueur d'onde est donc fixée par la longueur de la cavité, celle-ci ne pouvant contenir
qu'un nombre entier de demi longueurs d'onde (suite aux interférences entre les
rayonnements dans les deux sens). Les longueurs d'onde possibles sont donc données par
λ = L / 2n où L est la longueur de la cavité et n un nombre entier quelconque. L'émission se
produira si une de ces longueurs d'onde est proche de la longueur d'onde d'émission laser. Et
le rayonnement émis aura cette longueur d'onde. Si la cavité est courte, une seule longueur
d'onde peut être assez proche et l'émission est monochromatique. A contrario, si la cavité
est longue, la différence entre deux longueurs d'onde possibles est faible et il peut y avoir
plusieurs longueurs d'onde susceptibles de déclencher l'émission stimulée, dans ce cas on
observe une émission laser avec plusieurs raies proches. On parle respectivement de laser
monomode et multimode.
 Grâce à l'émission stimulée, tous les photons sont en phases, le laser est une source de
lumière cohérente. A l'opposé des sources thermiques (lampes à incandescence, chaleur
corporelle, rayonnement solaire) qui est le type même de source incohérente (comme nous
l'avons vu, le rayonnement du corps noir a un spectre très large). Des lampes de type
fluorescentes (exploitant simplement l'émission spontanée du matériau) sont
monochromatiques mais peu cohérentes, les émissions de chaques atomes étant
indépendantes.
 Comme le faisceau fait une dizaine d'aller-retour dans la cavité amplificatrice, sa direction
est particulièrement rectiligne (et d'autant mieux que le laser est long et la fenêtre de sortie
étroite). Un photon qui partirait "de travers" toucherait les parois. En fait, comme les
photons stimulés ont tous même direction, peu de photons se perdent et on se trouve dans
une situation analogue à la réflexion miroir ou à la réfraction : seul les photons avec un état
dans la longueur du laser subissent une émission stimulée notable (seul les photons dans cet
état ont une probabilité non négligeable d'exister). Un petit calcul simple permet de voir
combien le faisceau est rectiligne. Avec un laser de 1 mètre, le rayonnement parcourt
environ 10 mètres (dix aller-retour). Si la sortie est large de deux millimètres, alors le
faisceau ne peut s'écarter de la ligne droite que d'une partie pour cinq mille (0.002 / 10)
(c'est de la géométrie élémentaire). Sur une distance de un kilomètre, l'écart (l'élargissement
du faisceau) ne sera que de dix centimètres. On peut encore faire mieux en allongeant le
laser, en augmentant le nombre d'aller-retour et en utilisant des dispositifs optiques (miroirs,
lentilles) pour focaliser encore mieux le faisceau. Ainsi, les lasers utilisés pour mesurer la
distance Terre - Lune s'évasent d'environ cent mètres sur la distance Terre - Lune, soit (0.1 /
380000) une part sur environ quatre millions !
 En choisissant différents milieux amplificateurs on peut obtenir des lasers de fréquences
variées : infrarouge, visible, ultraviolet,… Les lasers à rayons X sont difficiles à produire
pour deux raisons :
 Les rayons X sont très énergétiques. Une émission comme celle étudiée ici ne produit
pas de rayons X. Il faut utiliser un électron libre très énergétique qui retombe dans l'état
de base. Comme cet électron est libre, il n'existe pas d'états quantifiés (ils peuvent avoir
n'importe quelle énergie) et donc pas d'état intermédiaire possible. Ces lasers sont donc
à deux états avec une inversion de population médiocre. Pour obtenir des électrons
libres, il faut utiliser une source d'énergie puissante capable d'arracher ces électrons, par
exemple un laser à ultraviolets.
 Il n'existe pas de miroir à rayons X efficaces (presque tous les éléments sont
transparents ou absorbants). On arrive à obtenir deux, voire trois passages des photons,
sans plus. L'amplification par émission stimulée est donc relativement médiocre.

Récemment, on a pu réaliser un laser à atomes. C'est à dire que le faisceau est composé
d'atomes au lieu de photons ! L'intérêt est surtout conceptuel car aucune application ne
semble se dessiner, sauf peut-être dans certaines expériences de physique fondamentale ou
peut-être dans l'amélioration des horloges atomiques à atomes froids. On exploite dans ces
lasers le fait que certains atomes ont des spins entiers (ce sont des bosons avec un
comportement "grégaire" et pouvant subir une "émission" stimulée) et on met en évidence
leurs propriétés ondulatoires en réduisant au maximum l'agitation thermique (on travaille
avec des gaz ultra froids de l'ordre du milliardième de degré au-dessus du zéro absolu). Ils
sont dans état analogue à un condensat de Bose-Einstein mais sous forme d'un faisceau
plutôt que d'un ensemble d'atomes immobiles.

 Suivant le milieu utilisé, les états 1 et 2 et le dispositif de pompage, on peut avoir :


 Des lasers à impulsions. Ils fonctionnent par cycle : pompage - émission stimulée -
pompage - etc. La population est inversée, une bouffée est émise par émission stimulée,
on inverse à nouveau la population, etc.
 Des lasers continus en pompant en permanence et en effectuant l'inversion de population
de manière continue au fur et à mesure que l'émission stimulée se produit.

Un autre procédé pour les lasers continus consiste à utiliser des lasers à quatre états. Un
état intermédiaire permet de dissocier le pompage de l'inversion de population et ainsi
de nourrir le niveau supérieur au fur et à mesure de l'émission laser.

Un laser est rarement employé "tout nu" comme ci-dessus. Il est souvent agrémenté de dispositifs
divers. Sans être exhaustif :
 Optique adéquate (lentilles et miroirs) afin d'obtenir les caractéristiques souhaitées pour le
faisceau. Par exemple, les lasers de discothèque sont équipés de miroirs tournant afin de
dessiner des figures dans les fumigènes avec le laser. De même les lecteurs de code à barres
sont équipés d'un miroir tournant pour balayer la surface du code à barres. Dans la
photographie en relief (holographie ou "vrai relief", par opposition à la stéréographie
comme le cinéma 3D), on a besoin d'un faisceau large qui est obtenu grâce à des miroirs ou
des lentilles divergentes (qui dispersent la lumière au lieu de la concentrer comme ici). Pour
les très gros lasers (lasers de puissance) on a souvent besoin (pour des raisons
d'encombrement) de miroirs pour amener le faisceau à son endroit d'utilisation.
 On emploie parfois des milieux dit "multiplicateurs de fréquence". Ce sont des molécules
ou des atomes qui absorbent une lumière de fréquence donnée et la réémettent avec une
fréquence double ou triple (ils absorbent par exemple deux photons et en émettent un seul
de fréquence double, c'est analogue au système a trois états). Il est plus facile de fabriquer
des lasers dans l'infrarouge ou la lumière visible, en particulier des lasers de puissance, mais
il est parfois intéressant d'avoir un faisceau ultraviolet qui peut être obtenu de cette manière.
 Les lasers à colorants utilisent un milieu coloré pour obtenir un laser de fréquence
accordable. C'est à dire un laser dont la fréquence peut être réglée à volonté.
 Certains dispositifs permettent de "comprimer" les impulsions, c'est à dire de diminuer leur
durée, afin d'obtenir des impulsions ultra courtes.
V. Matière

V.1. Structure de la matière

V.1.1. Les assemblages d'atomes


Les atomes peuvent se lier entres eux pour former des structures complexes. Nous en avons déjà vu
des exemples avec les molécules.

Les atomes peuvent aussi se lier en réseaux. Par exemple, un atome de valence 4 peut se lier à 4
autres atomes identiques pour former un tel réseau :

Toutes sortes de structures plus ou moins complexes peuvent donc être formées.

Fibres
Lorsque l'on a de longues chaînes d'atomes, elles forment des molécules qui forment des fibres. Un
exemple en est le polyéthylène.

(nous n'avons pas représenté les atomes d'hydrogène, c'est une convention habituelle qui simplifie
l'écriture car on complète facilement les liaisons manquantes des carbones avec des hydrogènes).
La molécule ainsi formée peut être longue de millier d'atomes de carbone.
Beaucoup de matériaux organiques (à base de carbone) ont ce genre de structure. Parfois les fibres
sont alignées comme dans le bois. Parfois les fibres sont complètement enchevêtrées et mélangées
avec d'autres petites molécules appelées "charge" comme dans les plastiques et les caoutchoucs.
Cela offre une plus grande flexibilité dans les compositions et les structures, permet d'ajuster les
propriétés physiques du plastique, en particulier améliore ses propriétés mécaniques.

Souvent les molécules contiennent autre chose que du carbone et de l'hydrogène, par exemple de
l'oxygène et de l'azote. Dans ce cas, les longues molécules peuvent être stabilisées par l'existence
d'un grand nombre de liaisons hydrogènes.

Il peut aussi y avoir des liaisons plus solides entre molécules comme les "ponts disulfures".
On profite de l'existence des liaisons doubles pour y "brancher" d'autres atomes ou groupes
d'atomes (la liaison est remplacée par une liaison simple et les liaisons restantes sur le carbone se
lient à d'autres atomes) tel que du souffre. Ce procédé appliqué au caoutchouc avec du souffre
s'appelle "vulcanisation" et permet d'avoir un matériau plus résistant permettant de confectionner,
par exemple, les pneumatiques des automobiles.
Cristaux
Lorsque les atomes ou les molécules s'assemblent en réseau, comme indiqué plus haut, ils forment
des cristaux. C'est-à-dire des assemblages répétitifs d'un même motif.

La cristallographie est la science qui étudie ces assemblages. De nombreux motifs sont possibles
suivant les orientations des liaisons des atomes ou molécules. Un motif élémentaire est appelé
"maille".

Bien d'autres possibilités existent.


Les molécules de sel s'assemblent ainsi en réseau cubique. Les molécules d'eau, la glace,
s'assemblent en structures hexagonales. Le carbone peut s'assembler sous deux formes. La forme du
graphite est composée de feuilles empilées, chaque feuille ayant une structure hexagonale, en nid
d'abeille. Le diamant est la forme la plus compacte, elle est formée d'un emboîtement de tétraèdres
formant une structure dite à "faces centrées" (c'est la structure cubique mais avec un atome au
centre de chaque face du cube).

Les cristaux de glace hexagonaux se forment par "excroissances", la glace se déposant sur les
structures déjà existantes. Cela donne des formes variées et très jolies.
Les cristaux possèdent de nombreux défauts. Ne dit-on pas que deux flocons de neige ne sont
jamais identiques ? (nous n'avons pas vérifié !)
Un exemple typique est la présence de "lacunes" :

Ces lacunes peuvent aussi être remplies par diverses impuretés, c'est-à-dire des atomes étrangers au
réseau initial. Le fer peut ainsi contenir des inclusions de carbone produisant, suivant la quantité de
carbone et l'état cristallin, de la fonte ou de l'acier.

Un autre exemple sont les "dislocations" :

C'est-à-dire des irrégularités dans l'arrangement régulier des atomes.

L'étude des propriétés mécaniques nécessite de prendre en compte ces défauts. Lors d'une
déformation, par exemple, on a apparition de dislocations qui se propagent de proche en proche.
Les défauts peuvent aussi s'enchevêtrer et se bloquer mutuellement rendant le matériau beaucoup
plus résistant. La technique du "rouissage" de l'acier consiste à obtenir cet état en exerçant diverses
contraintes mécaniques tel que le martelage dans une forge.
L'utilisation des propriétés des liaisons moléculaires et l'étude des propagations des défauts permet
de comprendre ou de prédire beaucoup de propriétés mécaniques des matériaux. C'est un domaine
de recherche à part entière : la physique des matériaux;

Matériaux amorphes
Dans un matériau amorphe, les atomes ou les molécules sont reliés de manière totalement
désordonnée, sans aucune régularité.

Un matériau de ce type est le verre. Il est constitué de molécules de silice (SiO2) agencées sans
aucune structure régulière. Des techniques statistiques sont nécessaires pour les étudier au niveau
moléculaire.

Matériaux polycristallins
La situation la plus courante sont les polycristaux.

Un seul cristal, bien régulier et de grande taille, appelé un monocristal est plutôt rare. Tellement
rare qu'il est en général assez coûteux : diamant, émeraude, rubis,… Sauf exceptions comme le
quartz ou le sel gemme (il est assez facile de fabriquer de gros cristaux de sel). A noter que le verre
appelé cristal n'est pas un… cristal ! C'est aussi un matériau amorphe. C'est un verre de grande
pureté et qualité appelé ainsi pour sa ressemblance extérieure avec les cristaux.

Le cas le plus fréquent est celui où les cristaux sont de très petites tailles.
Le matériau est constitué d'une multitude de petits cristaux orientés de manière aléatoire et accolés
les uns aux autres. Aux interfaces entre deux cristaux, on trouve des défauts et fréquemment des
dépôts d'impuretés.

Cette structure est due à la manière dont le matériau se forme. Que ce soit à partir d'une solution
(par exemple du sel dissous) ou par solidification (par exemple du métal fondu en métallurgie), de
petits "centres ou noyaux de nucléation" apparaissent. Ce sont de petites impuretés ou de petits
grains de cristaux apparus spontanément. Autour de chaque noyau, par dépôt de nouveaux atomes
ou molécules, le cristal va croître. Si les centres de nucléation sont nombreux, on aura beaucoup de
petits cristaux.
Cette structure rend le matériau beaucoup plus résistant car les interfaces entre cristaux, appelées
"joints de grains", de par l'orientation différente des réseaux cristallins, bloquent aisément le
déplacement des dislocations et autres défauts du cristal, empêchant sa déformation. Les
métallurgistes cherchent donc des méthodes de refroidissement du métal favorisant la présence de
nombreux centres de nucléation. La fabrication d'un monocristal ne les intéresse pas, sauf dans la
synthèse de bijoux artificiels, bien sûr.

Beaucoup de matériaux non organiques ont cette structure : les métaux, les roches,…

Souvent, les cristaux sont visibles à l'œil nu mais il est parfois difficile de les distinguer que ce soit
à cause de leur taille trop petite ou de leur aspect identique. Prenez un morceau de fer bien plat,
polissez-le avec une extrême méticulosité, avec des abrasifs très doux pour ne pas abîmer la
surface, puis observez-le en lumière rasante et vous aurez peut-être la chance d'observer cette
structure en facettes donnée par les petits cristaux de fer, s'ils ne sont pas trop petits.
V.1.2. Liaisons interatomiques et structures cristallines
Les forces d'interaction entre atomes sont d'origine principalement électrostatique et peuvent être
considérées comme la somme d'un terme attractif et d'un terme répulsif. Ce dernier, qui apparaît
lorsque les nuages électroniques commencent à se recouvrir, est une manifestation du principe
d'exclusion de Pauli. Il varie très rapidement avec la distance r entre atomes et est souvent
représenté par une loi en r − n avec n ≅ 12 . Le terme attractif dépend de la structure électronique et
détermine le mode de liaison.

Dans les molécules, les atomes sont liés par deux modes :
 La liaison covalente ( H 2 , CH 4 ,… ) résulte de la mise en commun d'électrons de valence, de
façon à compléter les couches électroniques de chacun des atomes et fait intervenir l'interaction
d'échange. Cette liaison a un caractère directionnel.
 La liaison ionique (NaCl, LiF,…) résulte de l'attraction coulombienne entre ions de charges
opposées résultant de la cession d'électrons par certains atomes (Na, Li) au profit d'autres (Cl,
F).

Dans ces deux modes et dans les modes intermédiaires, l'énergie de liaison est de plusieurs
électronvolts.

Dans les solides, on retrouve ces deux modes de liaison ainsi que d'autres. On distingue ainsi :
 Les cristaux covalents. Chaque atome est entouré d'un petit nombre d'autres, les angles entre les
liaisons étant déterminés par la structure électronique. Ainsi, dans le diamant, chaque atome de
carbone est entouré de quatre voisins situés au sommet d'un tétraèdre régulier dont il est le
centre (figure ci-dessous).
Arête a = 3.56 Å, le rayon des atomes de carbone (r = 0.70 Å) a été réduit sur le schéma.

Ces édifices cristallins, particulièrement stables, ont un faible densité, une grande dureté et un
point de fusion élevé. De plus, ce sont des isolants électriques.
 Les cristaux ioniques. Ils sont constitués d'ions empilés de façon aussi compacte que possible.
Par exemple, pour le chlorure de sodium NaCl, les ions Cl − sont répartis au sommet de cubes
et aux centres de leurs faces (réseau "cubique à faces centrées"), les ions Na + , de plus faible
rayon venant se loger entre eux (figure ci-dessous).
a = 5.63 Å, les ions Cl − ont un rayon r = 1.81 Å et les ions Na + (gris) r = 0.98 Å.

Les cristaux ioniques ont une assez grande densité, une dureté moyenne et un point de fusion
pas très élevé. Ils ne sont conducteurs qu'à température élevée (ou en solution, à cause de la
dissociation des ions, mais ce ne sont alors plus des cristaux !)
 Les cristaux métalliques. Ils sont formés d'ions positifs localisés aux sommets de réseaux
cubiques ou hexagonaux. Le sodium à une structure cubique centrée (figure ci-dessous).
a = 4.28 Å.

Les ions sont maintenus éloignés les uns des autres par répulsion coulombienne et n'occupent
qu'une faible partie du volume (10 pour le sodium). La cohésion est assurée par les électrons
libérés par les ions. Les cristaux métalliques sont d'autant plus denses que le numéro atomique
de l'ion est élevé. Ils sont très malléables. Ce sont de bons conducteurs.
 Les cristaux moléculaires. Ils font intervenir les forces de van der Waals entre molécules ou
atomes de gaz rares. Ces forces électrostatiques entre dipôles instantanés dérivent d'un potentiel
en 1 / r 6 et provoquent des empilements compacts de molécules. Par exemple, l'hélium
cristallise dans la structure hexagonale compacte (figure ci-dessous) et les autres gaz rares dans
la structure cubique à faces centrées.
L'arête des triangles équilatéraux est a = 3.57 Å et la distance verticale entre deux couches est
c/2 = 2.91 Å.

Dans ces cristaux, chaque atome a douze proches voisins arrangés de façon très symétrique.
Dans les autres cristaux, l'empilement des molécules dépend de leur forme. Ces cristaux sont
très compressibles et ont des points de fusion assez bas. Ce sont des isolants.
 Les cristaux à liaison hydrogène. Dans un cristal moléculaire, il peut exister des "liaisons
hydrogène" entre des atomes d'hydrogène et des atomes très électronégatifs (F, O, N) des
molécules voisines. Ces liaisons augmentent fortement la cohésion des cristaux moléculaires.
L'exemple le plus classique est celui de l'eau. Les liaisons hydrogène ont une grande importance
structurelle pour les cristaux de composés organiques.

Le tableau ci-dessous résume quelques propriétés des divers types de cristaux. Notons qu'il existe
un grand nombre de cas où différents types de liaison coexistent : le graphite possède à la fois des
liaisons covalentes et des liaisons métalliques. Cela en fait un bon conducteur mais il se clive
facilement lui donnant son caractère gras et lubrifiant.

Type de cristal Substance Densité Energie de liaison (eV) Température de fusion (K)
Covalent Diamant 3.51 7.3 >3500
Ionique NaCl 2.17 7.81 1074
Métallique Na 0.97 1.13 1165
Moléculaire He ~0.2 ~0.03 ~1
Liais. Hydrog. H 2O 1 0.52 273
V.1.3. Eléments de cristallographie
Nous donnons ici les éléments de cristallographie qui sont nécessaires à la compréhension des
propriétés physiques des cristaux. Pour une lecture plus détaillée, nous renvoyons le lecteur aux
ouvrages spécialisés.

Réseau et maille élémentaire


Les cristaux présentent un arrangement régulier d'atomes admettant des opérations de recouvrement
par translation à l'échelle atomique. Ces translations transforment un point quelconque du cristal en
un autre point ayant le même entourage avec la même orientation (invariance par translation).
Toutes ces transformations forment un groupe infini dont les éléments peuvent être représentés par
(1) n = n1a + n 2 b + n3c
où n1 , n 2 et n3 sont des nombres entiers et a, b et c représentent trois translations indépendantes
appelées vecteurs de base ou vecteurs de translation primitifs. La figure ci-dessous visualise ces
considérations pour un réseau à deux dimensions ( n3 et c n'existent pas).
Plusieurs triplets (a, b, c) peuvent servir de vecteurs de base, toutefois le volume du parallélépipède
("maille élémentaire") construit sur ces vecteurs de base est toujours le même. En pratique, le choix
de la maille est effectué selon des critères conventionnels souvent fondés sur la symétrie.

Pour décrire un cristal, on choisit tout d'abord une origine dans l'espace et on construit un réseau
dont les "nœuds", caractérisés par trois nombres entiers ( n1 , n 2 et n3 ) se déduisent de l'origine par
les translations (1). L'ensemble du cristal est connu si, en plus du réseau, on connaît le contenu
d'une maille élémentaire appelé motif cristallin (figure (b) ci-dessus). On utilise également la maille
de Wigner-Seitz contenant tous les points de l'espace plus proches d'un nœud donné que de tous les
autres. Elle est obtenue en traçant les plans médiateurs des segments liant un nœud à tous ses
voisins. Notons que dans certains cas, on utilise un réseau dont la maille, multiple d'une maille
élémentaire, représente mieux les propriétés de symétrie du cristal.

Lorsqu'une base et le motif associé ont été choisis, le centre d'un atome quelconque du cristal est
alors repéré par le vecteur
(2) r = n1a + n2 b + n3c + rα
où n1 , n 2 et n3 sont trois nombres entiers repérant la maille la maille contenant l'atome et rα un
vecteur repérant la position de l'atome dans la maille.

Symétrie des cristaux


En plus des translations, les cristaux peuvent présenter d'autres opérations les laissant invariants. Il
s'agit :
 Des rotations autour d'un axe (rotations "directes"). Les seules rotations compatibles avec la
structure périodique des réseaux ont pour angle α = 2π / n , (ainsi que leurs multiples) avec n =
2, 3, 4 ou 6. On constate en effet qu'on peut paver un plan avec des triangles équilatéraux (n =
3), des carrés (n = 4), des hexagones réguliers (n = 6), mais pas avec des pentagones (n = 5) ou
des octogones (n = 8) réguliers.
 Des rotations inverses : rotations directes (n = 1, 2, 3, 4, 6) suivies d'une symétrie par rapport à
un point de l'axe ("inversion"), avec les cas particuliers de l'inversion pure (n = 1), du mirage ou
symétrie par rapport à un plan perpendiculaire à l'axe (n = 2).
 D'opérations comprenant une translation : rotation directe suivie d'une translation le long de
l'axe de rotation (rotations "hélicoïdales"), mirage suivi d'une translation parallèle au plan.

Les opérations de recouvrement d'un cristal forment un groupe. E.S. Fedorov et A.M. Schoenflies
(1891) ont dénombré en tout 230 groupes de symétrie cristalline possibles, appelés groupes
spatiaux.
Dans les opérations de recouvrement considérées ici, les translations sont à l'échelle atomique
( ~ 1Å = 10 -1 nm ). Toutefois, pour la plus part des propriétés macroscopiques étudiées, ces
translations ne peuvent être distinguées alors que les opérations de rotation et de symétrie peuvent
l'être (orientation des plans de clivage, biréfringence optique,…). Cela signifie que, pour les
propriétés macroscopiques, les cristaux peuvent être ramenés à des substances homogènes
anisotropes. Si alors, pour les 230 groupes spatiaux, on supprime les opérations de translation, on
est ramené à 32 groupes, appelés groupes ponctuels. Parmi ceux-ci, citons :
 Les groupes n (n = 1, 2, 3, 4, 7) engendrés par la rotation d'angle α = 2π / n contenant les n
rotations d'angles mα (m = 1, …, n) (axe de symétrie d'ordre n).
 Les groupes n engendrés par la rotation inverse de 2π / n . En particulier le groupe 1
comprenant l'inversion et l'identité (centre de symétrie) et le groupe 2 , noté m, comprenant un
mirage et l'identité (plan de symétrie).

Les autres groupes sont engendrés par plusieurs opérations de symétrie.

Les 32 groupes ponctuels des cristaux ont été classés en sept familles, appelées systèmes cristallins,
suivant la nature et le nombre des axes de symétrie. Tous les cristaux dont le groupe ponctuel
appartient à un système cristallin donné ont la même symétrie du réseau. On distingue les systèmes
:
 Triclinique ne présentant aucun axe de symétrie.
 Monoclinique possédant un seul axe binaire (2 ou 2 ).
 Orthorhombique possédant trois axes binaires (2 ou 2 ) orthogonaux.
 Rhomboédrique (trigonal en anglais) possédant un seul axe ternaire (3 ou 3 ).
 Quadratique (tetragonal en anglais) ne possédant qu'un axe quaternaire (4 ou 4 ).
 Hexagonal possédant un seul axe sénaire (6 ou 6 ).
 Cubique possédant quatre axes ternaires (3 ou 3 ).

Bravais a démontré qu'à sept systèmes cristallins correspondent 14 types de réseaux (tableau et
figure ci-dessous). On choisit pour certains des mailles multiples mettant en lumière les propriétés
de symétrie du réseau.
Système cristallin Symbole Multiplicité Propriétés
Triclinique P 1 a≠b≠c α ≠ β ≠γ
Monoclinique P 1 a≠b≠c α = γ = 90° ≠ β
C 2
Orthorhombique P 1 a≠b≠c α = β = γ = 90°
C 2
I 2
F 4
Rhomboédrique R 1 a=b=c α = β = γ ≠ 90°
Quadratique P 1 a=b≠c α = β = γ = 90°
I 2
Hexagonal P 1 a=b≠c α = β = 90° γ = 120°
Cubique P 1 a=b=c α = β = γ = 90°
I 2
F 4
Grandeurs tensorielles
Lorsque l'on considère une propriété macroscopique d'un système homogène et isotrope, celle-ci est
indépendante de l'orientation des axes de référence. Ceci est le cas de la masse volumique,
propriété scalaire, ainsi que de la susceptibilité magnétique, de la conductivité électrique, de l'indice
de réfraction, … Il en va différemment pour les propriétés d'un cristal qui peuvent avoir un
caractère tensoriel, c'est-à-dire que les valeurs qui les caractérisent peuvent dépendre de
l'orientation du cristal.

Par exemple, le tenseur de conductivité électrique d'un cristal est un tenseur symétrique d'ordre 2,
noté [σ ] ou σ ij , caractérisé par 3x3 nombres dont 6 seulement sont indépendants ( σ ji = σ ij ). Il
relie la densité de courant j au champ électrique E par la loi d'Ohm
(3) j = [σ ]E ou ji = ∑ σ ij E j
j

et peut être diagonalisé. Ce tenseur d'ordre 2 est alors caractérisé par ses trois valeurs propres σ 11 ,
σ 22 et σ 33 (conductivités principales) et par les trois angles d'Euler définissant, par rapport aux
vecteurs de base du réseau, les directions propres du tenseur (axes principaux de l'ellipsoïde associé
à [σ ] ).

Lorsque le cristal possède des axes de symétrie, le nombre de paramètres indépendants se réduit.
Suivant le système cristallin, il en reste :
 6 pour le système triclinique qui n'a aucun axe de symétrie.
 4 pour le système monoclinique : σ 11 , σ 22 et σ 33 et l'angle orienté du premier axe propre avec
l'axe a dans le plan (a, c), le deuxième coïncidant avec b.
 3 pour le système orthorhombique : σ 11 , σ 22 et σ 33 , les trois axes propres coïncidant avec a, b,
c.
 2 pour les systèmes rhomboédrique, quadratique et hexagonal : σ 11 = σ 22 et σ 33 , le troisième
axe étant le long de l'axe de symétrie (d'ordre 3, 4 ou 6 suivant le système) et les deux autres,
dans le plan perpendiculaire, étant arbitraires.
 1 pour le système cubique : σ 11 = σ 22 = σ 33 = σ . Dans ce cas, et pour les grandeurs tensorielles
de rang 2 seulement, le cristal paraît isotrope : les propriétés correspondantes ne varient pas
avec la direction, de même que pour une propriété scalaire.

Notons ici que lorsque l'on ne considère pas un monocristal, mais un échantillon formé d'un
conglomérat de microcristaux (ou une poudre), celui-ci a des propriétés isotropes et l'on mesure
pour une grandeur tensorielle d'ordre 2 la moyenne des éléments diagonaux, soit pour la
conductivité :
σ + σ 22 + σ 33
(4) σ = 11
3
et ce, quel que soit le système cristallin.

Une autre propriété tensorielle d'ordre 2 est l'indice de réfraction du milieu. Il possède les mêmes
propriétés de symétrie que la conductivité électrique. Rappelons que l'on appelle :
 Biaxe : les cristaux à 3 indices différents (systèmes triclinique, monoclinique et
orthorhombique).
 Uniaxe : les cristaux à 2 indices différents (rhomboédrique, quadratique et hexagonal).
 Isotrope : les cristaux à 3 indices égaux (cubique).

Les autres propriétés des cristaux sont toutes caractérisées par un ordre tensoriel allant de 0 à 4.
Citons :
 0 (propriété scalaire) : capacités calorifiques, masse volumique.
 1 (propriété vectorielle) : moment dipolaire électrique ou magnétique.
 2 : conductivités thermique et électrique, permittivité, susceptibilité magnétique, indice de
réfraction, dilatation thermique, vitesse du son.
 3 : tenseur de piézoélectricité.
 4 : tenseur d'élasticité.

Notons que, selon le groupe ponctuel, le nombre de paramètres indépendants d'un tenseur donné
peut être réduit. En particulier, les propriétés tensorielles d'ordre 1 et 3 peuvent disparaître pour
certains groupes : un cristal présentant un centre de symétrie ne peut être piézoélectrique.
V.1.4. Diffraction d'ondes par les cristaux
La structure des solides cristallins peut être déduite d'observations des figures de diffraction de
rayons X, de faisceaux d'électrons ou de neutrons dont la longueur d'onde ( λ = h / p pour les
particules matérielles) est de l'ordre des distances interatomiques, soit λ ~ 1Å .

Théorie de von Laue (1912)


Lorsqu'une onde plane de fréquence ω , de vecteur d'onde k ( k = 2π / λ ) et d'amplitude
(1) E (r ) = E 0 exp[i (ω t − k ⋅ r )]
tombe sur un atome isolé en r, celui-ci diffuse une onde de même fréquence qui, loin de l'atome,
peut être assimilée à une onde sphérique d'amplitude au point R (voir la figure ci-dessous) :

ik R −r
e(R ) = E (r ) f (k ′)
e
R −r
(2)
E0 i (ω t −kR )
= e f (k ′)e i (k ′−k )⋅r
R
Dans cette expression, k' est un vecteur de même module que k orienté dans la direction
d'observation et f (k ′) est le facteur de diffusion dépendant de la direction d'observation et de la
nature de l'atome.

Lorsque l'onde plane tombe sur un cristal, l'amplitude totale diffractée par l'ensemble des atomes du
cristal est la somme des amplitudes diffusées par chaque atome et a pour expression
E
(3) e(R ) = 0 e i (ω t − kR ) F (k , k ′)
R
avec
(4) F (k , k ′) = ∑ f r (k ′)e i∆k ⋅r (∆k = k ′ − k )
r

Le facteur F, obtenu par sommation sur toutes les positions r de chaque atome s'appelle facteur de
structure du cristal et détermine l'intensité diffractée par le cristal dans une direction donnée. En
utilisant la formule du réseau, il se sépare en deux facteurs
i∆k ⋅(n1a + n2b + n3c )
× ∑ f α (k ′)e α = Fr × Fm
i∆k ⋅r
(5) F = ∑ e
n1 , n2 , n3 α

le premier Fr dépendant seulement du réseau, le second Fm relatif au contenu de la maille. Faisons


l'étude séparée de ces deux termes.

Réseau réciproque
Le terme Fr caractéristique du réseau peut se factoriser en trois facteurs du type
(6) ∑ exp(in1∆k ⋅ a )
n1

contenant chacun un grand nombre de termes. Si alors ∆k ⋅ a vaut 2πh1 où h1 est un entier, ce
facteur sera non nul. Dans le cas contraire, chaque terme de la somme correspondra à un déphasage
différent des autres, avec un décalage régulier proportionnel à n1 et, en définitive, Fr sera nul.

En conséquence, le cristal ne pourra diffracter que dans les directions k ′ = k + ∆k telles que :
(7) ∆k ⋅ a = 2πh1 ∆k ⋅ b = 2πh2 ∆k ⋅ b = 2πh3
où h1 , h2 et h3 sont trois entiers. On peut résoudre en ∆k ces trois conditions et on vérifie que
(8) ∆k = h1 A + h2 B + h3C
avec
2π 2π 2π
(9) A = b×c B = c×a C = a×b
τ τ τ
où τ = (a × b ) ⋅ c représente le volume de la maille considérée du réseau. La diffraction n'aura donc
lieu que si le vecteur ∆k joint deux nœuds d'un réseau engendré par les vecteurs A, B, C et appelé
réseau réciproque du réseau cristallin.

Facteur de structure de la maille


Le facteur Fr discuté ci-dessus permet de déterminer toutes les directions de diffraction permises.
Le facteur de structure Fm définit, quant à lui, l'intensité de l'onde diffractée dans ces directions, les
facteurs f α (k ′) étant relatifs aux atomes de la maille. L'existence d'éléments de symétrie dans la
maille peut conduire à une intensité nulle dans certaines directions permises par le réseau.

Propriétés du réseau réciproque


Considérons un réseau réel et son réseau réciproque. Soit un vecteur N définissant un nœud de ce
dernier :
(10) N = h1 A + h2 B + h3 C
tel que les entiers h1 , h2 et h3 soient premiers entre eux et considérons le produit scalaire de ce
vecteur avec l'ensemble des vecteurs n définissant tous les nœuds du réseau direct, soit
N ⋅ n = (h1 A + h2 B + h3 C)(n1a + n 2 b + n3c )
(11)
= 2π (h1 n1 + h2 n2 + h3 n3 )

Comme h1 , h2 et h3 sont premiers entre eux, un théorème d'arithmétique montre que l'expression
entre parenthèses prend toutes les valeurs entières lorsque n1 , n 2 et n3 varient. Il s'ensuit que tous
les nœuds du réseau réel se projettent sur N en des points équidistants (figure ci-dessous) : ils sont
contenus dans des plans perpendiculaires à N distants de
(12) d = 2π / N

Ces plans forment la famille des plans réticulaires notée (h1 h2 h3 ) , d'indices de Miller h1 , h2 et h3
et d'équation
(13) h1 x1 + h2 x 2 + h3 x3 = n n = 0,±1,±2, K
dans le système d'axes a, b, c. Ils coupent les axes du cristal en des points d'abscisses respectives
n / h1 , n / h2 et n / h3 et sont perpendiculaires à la direction notée [h1 h2 h3 ] du réseau réciproque.

La notion de réseau réciproque est très importante en physique du solide. En effet les vecteurs A, B
et C, ayant les dimensions d'un vecteur d'onde, interviendront dans l'étude de la propagation
d'ondes dans les cristaux. Ainsi la maille de Wigner-Seitz du réseau réciproque, appelée première
zone de Brillouin, joue un rôle essentiel, par exemple dans la théorie des bandes d'énergie des
électrons.
Condition de Bragg
W.L. Bragg (1912) a donné une interprétation simple de la condition de diffraction (8).
Considérons une famille de plans réticulaires (h1 h2 h3 ) et supposons qu'une onde incidente se
réfléchit sur chaque plan comme sur un miroir (figure ci-dessous).

L'onde réfléchie n'aura une intensité non nulle que si les contributions de deux plans consécutifs
sont en phase, c'est-à-dire si l'on a la condition de Bragg :
(14) 2d sin θ = nλ

Cette condition, qui peut encore s'écrire


4π 2π
(15) ∆k = 2k sin θ = sin θ = n
λ d
montre que ∆k , orthogonal au plan réticulaire, est égal à nN avec N = h1 A + h2 B + h3 C et donc est
un vecteur du réseau réciproque.

Il apparaît sur la formule de Bragg que, pour une famille de plans réticulaires donnée, une onde
n'est diffractée que pour un petit nombre d'orientations du cristal. Il s'ensuit que lorsque le cristal
est orienté arbitrairement, il n'y a pas de diffraction, d'où des méthodes telles que celle du cristal
tournant ou celle des poudres pour obtenir les figures de diffraction des cristaux.
V.1.5. Vibrations dans les cristaux. Phonons

Cristal monoatomique à une dimension


Nous étudierons tout d'abord un modèle de cristal à une dimension qui nous permettra de dégager
les propriétés essentielles des mouvements vibratoires des substances cristallines réelles.

Modèle de la file d'atomes


Considérons un cristal linéaire (file d'atomes) constitué de N atomes identiques de masse m en
interaction. On appellera ε (r ) leur énergie potentielle d'interaction binaire. A l'équilibre, les N
atomes sont équidistants de a = L / ( N − 1) ≅ L / N où L est la longueur de la file, et se trouvent
donc en des points d'abscisse x0 + na (figure ci-dessous).
Lorsqu'il existe des vibrations, l'abscisse de chaque atome s'écrit
(1) x n = x0 + na + u n
où u n représente l'écart de l'atome à sa position d'équilibre et x& n = u& n sa vitesse. Les énergies
cinétique et potentielle de la file valent
(2) T = m∑ u& n2 et E = ∑ ε ( x n′ − x n )
1 1
2 n 2 n , n′ ≠ n
où n et n' sont deux entiers variant de 1 à N. Le facteur 1/2 permet d'éviter le double comptage des
interactions. L'énergie potentielle peut encore s'écrire :
(3) E = ∑ ε ( x n′ − x n )
n , n′ > n
ou
(4) E = ∑ ε (x
n , p >0
n+ p − xn ) = ∑ ε ( pa + u
n , p >0
n+ p − un )

Dans cette expression, p est un entier positif que l'on fera varier de 1 à l'infini compte tenu du fait
que ε (r ) tend rapidement vers zéro quand r croît. Cette approximation est valable à la limite
thermodynamique N → ∞ où les effets de bord sont négligeables.

Approximation harmonique
Lorsque les atomes s'écartent peu de leurs positions d'équilibre, c'est-à-dire lorsque u n << a , on
peut effectuer un développement limité de la fonction ε au voisinage de x = pa dans (4). L'énergie
potentielle s'écrit alors
(5) E = E (0 ) + E (1) + E (2 ) + L
avec
E (0 ) = ∑ ε ( pa ) = N ∑ ε ( pa )
n, p p

(6) E (1)
= ∑ ε ′( pa )(u n + p − u n )
n, p

ε ′′( pa )(u n + p − u n )2
1
E (2 ) = ∑
2 n, p

Le terme E (0 ) représente l'énergie de la file d'atomes à l'équilibre. Le terme E (1) est nul, car, pour p
fixé, chaque déplacement u intervient deux fois dans la somme sur n avec des signes opposés. Ceci
correspond au fait que l'énergie est minimale à l'équilibre ( u n = 0 ). Le terme E (2 ) est quadratique
en u n de sorte que, à cet ordre (approximation harmonique), les atomes vibrent comme des
oscillateurs harmoniques couplés.

Coordonnées normales
Afin de diagonaliser la forme quadratique (6) de E (2 ) pour faire apparaître des oscillateurs
harmoniques indépendants, on introduit les grandeurs
1
(7) Qk =
N
∑u e n
n
inka

où k, nombre réel, a les dimensions d'un nombre d'ondes. Ces grandeurs vérifient les relations
(8) Qk∗ = Q−k et Qk + 2π / a = Qk

Faisons le changement de variables (7) faisant passer des N déplacements u n à N grandeurs Qk


choisies de façon que l'on ait
2π N N
(9) k = p − < p≤
Na 2 2
ce qui correspond à N valeurs de k régulièrement espacées entre − π / a et π / a (conditions aux
limites de Born-von Karman). Ces N grandeurs Qk , appelées coordonnées normales, sont
complexes mais, compte tenu de (8), correspondent à N grandeurs réelles indépendantes. En
utilisant les relations mathématiques pour N → ∞
(10) ∑ e in (k − k ′ )a = Nδ kk ′ et ∑ e i (n − n′ )a = Nδ nn′
n k
on a
1
(11) u n =
N
∑Q e k
k
− inka

Par suite, les énergies cinétique et potentielle s'écrivent


m m
(12) T = ∑ u& n2 = ∑ Q& k Q& k∗
2 n 2 k
et
(13) E − E (0 ) = ∑ ε ′′( pa )(u n + p − u n ) = ∑ ω k2 Qk Qk∗
1 2 m
2 np 2 k
où l'on a posé
(14) mω k2 = ∑ ε ′′( pa )1 − e ipka = 2∑ ε ′′( pa )(1 − cos pka )
2

p p
L'énergie totale du cristal en vibration est alors
1 1 
(15) Et = T + E = E (0 ) + ∑  mQ& k Q& k∗ + mω k2 Qk Qk∗ 
k 2 2 
expression dans laquelle on reconnaît l'énergie d'un ensemble de N oscillateurs harmoniques
indépendants de pulsations respectives égales à ω k . On en déduit que chaque Qk varie
sinusoïdalement dans le temps, soit
(16) Qk (t ) = Ak e iω k t + Bk e −iω k t
où Ak et Bk sont des constantes complexes.

Ondes élastiques
Les relations (11) et (16) montrent que le déplacement de l'atome n est de la forme
(17) u n =
1
∑[ ]
Ak e i (ω k t −nka ) + Bk e −i (ω k t + nka )
N k

Les déplacements de l'ensemble des atomes résultent donc de la superposition d'ondes progressives
longitudinales appelées ondes élastiques (figure ci-dessous), telles que
(18) u n = k exp[i(ω k t − nka )]
A
N
où k est le vecteur d'onde et ω k la pulsation.
La fonction ω k = ω (k ) (14), appelée relation de dispersion, est représentée schématiquement dans
la figure ci-dessous.
Lorsque k → 0 , soit ka << 1 , elle devient
a2
(19) ω (k ) = ck avec c =
2
∑ ε ′′( pa ) p 2
m p

Ce domaine de basse fréquence est celui des ondes sonores. La vitesse de phase cφ et la vitesse de
groupe c g d'une onde étant définies par
ω dω
(20) cφ = et c g =
k dk
on voit que les ondes sonores se propagent avec des vitesses de phase et de groupe indépendantes
de la fréquence et égales à c, appelée vitesse du son (19). La longueur de ces ondes, λ = 2π / k , est
alors beaucoup plus grande que a. Notons qu'à la limite k = 0, les atomes se déplacent en phase, ce
qui correspond à une translation d'ensemble du cristal.

Lorsque k → ±π / a , la fréquence ω tend vers une limite non nulle, et les atomes voisins vibrent
en opposition de phase à une fréquence comparable aux fréquences optiques ( ω ~ 1014 Hz ). Pour
cette valeur de k, la vitesse de groupe s'annule et il n'y a plus de propagation.

Les N valeurs de k forment une suite discrète (9) entre − π / a et + π / a . Toutefois, le nombre N
étant très grand, on considère k comme un variable continue. Les sommes sur k se transforment en
intégrales selon la règle
+π / a
(21) ∑ → ∫ g (k )dk avec g (k ) =
Na L
=
k
−π / a 2π 2π
la fonction g (k ) , qui est ici constante, représentant la densité des valeurs de k entre − π / a et
+ π / a . Les valeurs de k qui contribuent aux sommes correspondent à des ondes de longueur
variant entre λ = 2a ( k = π / a ) et λ = ∞ (k = 0). Notons que les ondes de longueur λ < 2a n'ont
pas de réalité car elles peuvent toujours être interprétées comme des ondes de longueur supérieure à
2a (figure ci-dessous).
Ainsi le remplacement de k par k + 2π / a dans (18) redonne les mêmes déplacements physiques
un .

Phonons
A l'échelle atomique, les systèmes doivent être traités en mécanique quantique ce qui a pour effet
de quantifier l'énergie. Pour un oscillateur harmonique de pulsation propre ω , nous avons vu que
l'énergie s'écrit
 1
(22) ε =  n + hω , n = 0, 1, 2,…
 2

De ce fait, l'énergie d'un cristal (15) doit s'écrire


 1
(23) Et = E (0 ) + ∑  n k + hω k
k  2
où les N nombres quantiques n k , pouvant prendre une valeur entière positive ou nulle, définissent
l'état vibratoire du cristal à une dimension. Cette énergie, qui ne peut alors varier que par la création
ou l'annihilation de quanta d'énergie ε k = hω k , peut encore s'écrire
1
(24) Et = U 0 + ∑ n k ε k avec U 0 = E (0 ) + ∑ hω k
k 2 k

Sous cette forme, l'énergie s'interprète comme la somme :


 D'un terme U 0 , appelé énergie de cohésion, égal à l'énergie du cristal non excité ( n k = 0 )
(cristal au zéro absolu).
 Et d'un terme ∑ nk ω k qui peut s'interpréter comme étant l'énergie d'un gaz de quanta d'énergie
ε k en nombre nk .

Par analogie avec les photons, quanta des ondes électromagnétiques, on appelle phonons ces quanta
d'énergie associés aux ondes élastiques. La réalité physique des phonons a été démontrée par
l'observation de la diffusion inélastique de neutrons par un cristal avec des changements d'énergie
correspondant à la création ou à l'annihilation de phonons. Il a même été montré, par l'utilisation
d'un microscope à effet tunnel, que les phonons pouvaient passer par effet tunnel la barrière de vide
entre le cristal et la pointe du microscope.

Les propriétés générales des phonons sont les suivantes :


 A l'approximation harmonique, ils n'interagissent pas. Ce n'est qu'aux ordres suivants que les
interactions apparaissent.
 Leur nombre total
(25) N ph = ∑ n k
k
n'est pas déterminé car ils peuvent être créés et annihilés comme les photons.
 Ils obéissent à la statistique de Bose-Einstein car, lors de la quantification, s'introduisent, pour
chaque valeur de k, deux opérateurs adjoints l'un de l'autre : a k (opérateur d'annihilation) et a k+
(opérateur de création) vérifiant la relation de commutation pour des bosons
[ ]
(26) a k , a k+′ = δ kk ′

Ces opérateurs ont la propriété de transformer un état de cristal à n k phonons respectivement en


états à n k − 1 et n k + 1 phonons et sont tels que l'opérateur N k = a k+ a k a pour valeurs propres
les nombres n k . L'hamiltonien quantique s'écrit alors
(27) H = U 0 + ∑ N k = U 0 + ∑ a k+ a k
k k
 Leur densité d'états dans l'espace des phases (x, p = hk ) est

(28) g ( x, p )dxdp =
dxdp
h
En effet, si l'on intègre sur x ( dx → L ) et si l'on fait p = hk , on obtient

(29) g (k )dk =
L
dk

en accord avec (21). Notons que p n'est pas un quantité de mouvement au sens habituel, en
particulier elle n'est pas conservée.
L'introduction de la notion de phonon a été très fructueuse car elle permet de remplacer la
discussion en terme d'ondes par une discussion en termes de particules mettant mieux en évidence
la quantification de l'énergie. D'autres particules, quasiparticules ou encore excitations ont été
également introduites en physique de la matière condensée : magnons, excitons, plasmons, rotons.

Cristaux monoatomiques à trois dimensions


La discussion de ce qui précède se généralise aux cristaux monoatomiques réels. Les atomes du
cristal sont maintenant animés de vibrations tridimensionnelles de sorte que l'on a
(30) u n → u n1n2n3 ≡ u n

L'approximation harmonique fait apparaître dans l'expression de l'énergie totale N oscillateurs


couplés à trois dimensions. De même que précédemment, on introduit N vecteurs Q k ,
combinaisons linéaires des u n , associés aux N vecteurs k régulièrement répartis dans la maille de
Wigner-Seitz du réseau réciproque (première zone de Brillouin). Les N vecteurs Q k représentent N
oscillateurs tridimensionnels indépendants. Toutefois, pour chaque valeur de k, les trois
composantes de Q k sont couplées. Il existe cependant trois combinaisons linéaires des
composantes, soit Q ks (s = 1, 2, 3), réalisant trois oscillateurs harmoniques à une dimension,
indépendants et de pulsation ω s (k ) . Les directions de vibration des atomes dans ces modes sont
presque parallèles à k (vibrations longitudinales L) ou presque perpendiculaires à k (vibrations
transversales T1 et T2 ).

La figure (a) ci-dessous représente les trois fonctions ω L (k ) , ω T1 (k ) et ω T2 (k ) relatives au cuivre


pour 3 directions de k.
Pour certaines directions, les branches transversales T1 et T2 sont dégénérées (T) par raison de
symétrie. Pour les faibles valeurs de k (grandes longueurs d'onde), la pulsation ω s (k ) est
proportionnelle à k (lignes droites sur la figure (a) ci-dessus)
(31) ω s (k ) = c s (k )k
la constante de proportionnalité c s (k ) s'identifiant, en bon accord expérimental, à la vitesse du son
dans la direction k et pour la branche s (L, T1 ou T2 ).
La quantification des modes normaux Q k donne lieu à des phonons d'impulsion hk et d'énergie
hω s (k ) . Ces phonons obéissent à la statistique de Bose-Einstein et sont en nombre indéterminé. Ils
ont une densité d'états
d 3rd 3p
(32) g (r, p )d rd p = 3
3
3 3
= d 3rd 3k
h 3
(2π )3

où le facteur 3 correspond aux trois directions de polarisation. Les valeurs de k à utiliser sont à
l'intérieur de la zone de Brillouin (figure (b) ci-dessus) et le nombre total d'états est
(33) ∫ g (r, p )d 3rd 3p = 3 N

En variable ω , on peut montrer que la densité d'états s'écrit


(34) g (ω ) = d 3kδ (ω − ω s (k ))
V
3 ∑∫
(2π ) s
avec
(35) ∫ g (ω )dω = 3 N

La figure (c) ci-dessus représente la densité g (ω ) typique obtenue expérimentalement pour le


cuivre. Elle montre une répartition continue en fréquence présentant des discontinuités de van Hove
jusqu'à une fréquence maximum et un comportement en ω 2 pour ω petit. En effet, on démontre à
partir de (34) que l'on peut écrire
V 3ω 2 dΩ
(36) g (ω ) =
3 1
avec 3 = ∑ ∫
2π c
2 3
c s 4π [c s (k )]3
La vitesse moyenne c ainsi définie a été déterminée pour le cuivre. Elle vaut c = 2535 m s −1 .
Notons que l'expression (34) de g (ω ) ne contient pas h car elle est de nature classique.
Cristaux polyatomiques à trois dimensions
Soit p le nombre d'atomes contenus dans la maille élémentaire d'un cristal polyatomique. Pour N
mailles élémentaires, un tel cristal admet 3pN degrés de liberté donc 3pN modes de vibrations
répartis en 3p branches (figure ci-dessous).

Parmi ces branches, 3 sont de type acoustique, c'est-à-dire qu'elles ont les mêmes propriétés que les
3 branches acoustiques du cristal monoatomique. En particulier, pour k → 0 , on a ω = ck et les
différents atomes de la maille élémentaire vibrent en phase comme s'il s'agissait d'un milieu
continu.

Les 3(p - 1) autres branches sont telles que, pour k → 0 , on a ω (k ) → cte , les atomes d'une même
maille ayant des mouvements les uns par rapport aux autres. Lorsque ces atomes sont chargés, ces
modes de vibration créent un moment dipolaire électrique oscillant et peuvent être excités par des
ondes électromagnétiques, d'où leur nom de branches optiques.

La densité de modes normaux g (ω ) est toujours donnée par (34) où la somme sur s contient
maintenant 3p termes. Pour ω → 0 , seules les trois banches acoustiques contribuent et la forme
limite (36) reste valable. Notons que pour les branches optiques, ω s (k ) ≅ ω s varie relativement peu
et que la formule (34) permet de montrer que la contribution de ces branches à g (ω ) est voisine de
(37) g s (ω ) = Nδ (ω − ω s )

Ceci conduit à appliquer, à chaque branche optique constituée de N oscillateurs de fréquence ω s , le


modèle d'Einstein de la statistique de Maxwell-Boltzmann.
Exercices

Densité d'états dans le modèle de Debye


En considérant un solide isotrope, P. Debye suppose que les atomes oscillent selon des ondes dont
la vitesse de phase cφ = ω / k est constante et égale à la vitesse des ondes acoustiques, notées c L
pour les ondes longitudinales et cT pour les ondes transversales. Par ailleurs, le nombre de modes
devant être limité à 3N, Debye introduit pour les deux types d'onde une seule pulsation de coupure
ω D telle que
ωD
(1) ∫ g (ω )dω = 3N
0

1. Déterminez, à partir de la densité d'états (32) de la section V.1.5, la fonction g (ω ) .


2. Calculez la pulsation de coupure ω D .
3. On a mesuré pour le cuivre c L = 4760 m s −1 et cT = 2325 m s −1 . Calculez la vitesse moyenne
c (36) de la section V.1.5 et la pulsation de coupure ω D . On donne la masse molaire du cuivre
M = 63.54 g mole −1 et sa masse volumique à 0 K ρ = 9.018 g cm −3 .

Solution
1. Pour obtenir g (ω ) , il faut intégrer (32) de la section V.1.5 sur r et sur les directions de k, puis
effectuer le changement de variable k → ω . Ce changement dépend de la nature de l'onde. Pour
les ondes longitudinales et transversales, on a respectivement
(2) ω = c L k et ω = cT k

On obtient alors
ω 2 dω ω 2 dω 
(3) g (r, p )d rd p →
3 V
3 3
V 4πk dk =
2
 3 +2 3 
(2π )3
2π 2  cL cY 
d'où la densité de modes
(4) g (ω ) =
V 3 2 3 1 2
ω avec 3 = 3 + 3
2π c
2 3
c c L cT

Cette densité peut être obtenue directement à partir de (34) de la section V.1.5 en faisant
ω s (k ) = c s k . Elle extrapole dans tout le domaine de fréquences la forme analytique limite (36)
de la section V.1.5 valable aux faibles fréquences.
2. En intégrant g (ω ) entre 0 et ω D , la condition de normalisation (1) devient :
V 3 ωD 2 V ω D3
ω dω = 2 3
2π 2 c 3 ∫0
(5) 3 N =
2π c
d'où la pulsation de coupure
1/ 3
 N
(6) ω D = c  6π 2 
 V
3. Numériquement on a c = 2612 m s −1 . Cette valeur est assez voisine de la valeur
c = 2535 m s −1 obtenue à partir des mesures de diffraction de neutrons. En remarquant que
N / V = Nρ / M , on obtient ω D = 4.49 × 1013 rad s −1 . La pulsation de coupure est voisine de la
pulsation maximum du spectre montré dans la section V.1.5. On peut remarquer qu'à la
fréquence ω D correspondent des ondes de longueur λ = 2πc s / ω D égales respectivement à 3.24
Å (L) et 6.60 Å (T) et voisines de λ = 2d , d = a / 2 = 2.55 Å étant la distance entre proches
voisins.
V.1.6. Propriétés thermodynamiques expérimentales des solides
Les mesures expérimentales sur les propriétés thermodynamiques des solides sont relatives à :
 La compressibilité adiabatique χ S (T , P ) = −(∂V / ∂P )S / V .
 Le coefficient de dilatation α (T , P0 ) = (∂V / ∂T )P = P0 / V = 3(∂L / ∂T )P = P0 / L .
 La capacité calorifique molaire à pression constante c P (T , P0 ) , où P0 est en général la pression
atmosphérique.

Ces trois grandeurs permettent de déterminer toutes les fonctions thermodynamiques. Notons que la
capacité calorifique molaire à volume constant cV est donnée par
α2
(1) c P − cV = Tv
χT
et la compressibilité isotherme χ T = −(∂V / ∂P )T / V = χ S cV / c P par
α2
(2) χ T − χ S = Tv
cP
(v est le volume molaire).

Pour les différents solides, les comportements de χ ≡ χ T , α et cV sont semblables (figure ci-
dessous).
 La compressibilité isotherme varie peu avec la pression : ( (∂χ / ∂P ) / χ ~ 10 −3 atm −1 ) et avec la
température.
 Le coefficient de dilatation α et la capacité calorifique cV augmentent rapidement à partir de
zéro mais varient peu à température ambiante. Les allures de α (T ) et cV (T ) sont semblables.

Les résultats expérimentaux ont permis d'établir les comportements généraux suivants :
 Le rapport de Grüneisen
vα vα
(3) γ = =
χ T cV χ S c P
varie peu avec la température et a des valeurs voisines de 2 pour les différentes substances (loi
de Grüneisen, 1908).
 La capacité calorifique molaire cV est, à température assez élevée, voisine de 3R × n , n étant le
nombre d'atomes par molécule (loi de Dugong et Petit).
 A basse température, la capacité cV varie en T 3 pour les solides non métalliques (ou
diélectriques). Un terme linéaire en T s'y ajoute dans le cas des métaux (figure ci-dessous). Il
est dû à l'existence d'électrons libres dans le métal.
V.1.7. Interprétation statistique des propriétés des solides

Fonctions thermodynamiques
Nous avons vu que l'énergie d'un cristal est la somme de son énergie au zéro absolu U 0 (énergie de
cohésion) et de l'énergie d'un gaz de phonons, particules en nombre indéterminé obéissant à la
statistique de Bose-Einstein. L'énergie libre est également la somme de deux termes
(1) F = F0 (V ) + F ph (T , V )
où l'énergie de cohésion F0 ≡ U 0 ne dépend que du volume et où l'énergie libre relative aux
phonons s'écrit d'après la statistique de Bose-Einstein :
  hω  
(2) F ph ≡ Ω = kT ∫ g (ω )dω ln 1 − exp − 
  kT 

Notons que la dépendance en V de F ph intervient par l'intermédiaire de la densité d'états g (ω ) . En


effet g (ω )dω s'obtient à partir des relations de dispersion ω (k ) vues dans la section précédente et
elles dépendent implicitement de la distance interatomique.

Les autres fonctions thermodynamiques se déduisent de F par dérivation par rapport à T et V. En


particulier, l'énergie interne vaut
 ∂F  2 ∂ F 
U = F + TS = F − T   = −T  
 ∂T V ∂T  T V
(3)
g (ω )dω
= U 0 (V ) + ∫ hω
exp( hkTω ) − 1
la contribution des phonons s'identifiant à ∑N ε
i i pour un gaz de bosons et la capacité calorifique
à volume constant vaut :
 hω  e β hω
2

(4) CV = k ∫   g (ω )dω
(
 kT  e β hω − 1)2
Modèle de Debye
Le modèle de Debye a été introduit en 1912 pour améliorer le modèle d'Einstein bien avant que l'on
ait déterminé expérimentalement les densités d'état g (ω ) . En considérant des solides isotropes (par
exemple un métal polycristallin), P. Debye prolonge à toutes les valeurs de k la loi de dispersion
ω = ck valable pour les ondes acoustiques (faibles valeurs de k) et introduit une fréquence de
coupure ω D pour limiter le nombre de modes à 3N. Dans ce modèle, la densité d'états est
3Vω 2 / 2π 2 c 3 = 3 N × 3ω 2 / ω D3 (ω < ω D )
(5) g (ω ) = 
 0 (ω > ω D )
avec
1/ 3
 N 3 1 2
(6) ω D = c  6π 2  et 3 = 3 + 3
 V c c L cT
où c L et cT représentent les vitesses des ondes acoustiques longitudinales et transversales. Cette
densité, vérifiant le nombre total d'états 3N, est représentée sur la figure ci-dessous.

L'énergie libre des phonons (2) s'écrit alors dans ce modèle


3 NkT ωD   hω  
(7) F ph = ∫ 3ω 2 ln 1 − exp −   dω
ω 3
D
0
  kT 
3
 T  xD 2
(8) = 3 NkT × 3 (
 ∫ x ln 1 − e − x dx )
 ΘD  0
où l'on a fait le changement de variable x = hω / kT et où l'on a introduit la température de Debye
hω D h  2 N 
1/ 3

(9) Θ D = = c  6π 
k k  V
avec x D = Θ D / T . Les autres fonctions thermodynamiques s'obtiennent à partir de F. On a par
dérivation de (8) par rapport à T :
 ∂F 
(10) S = −  =
9 Nk  xD x 3 dx
3  ∫0
xD 
− ∫ x 2 ln 1 − e − x dx  ( )
 ∂T V xD  e − 1 0
x

∂ F x 3 dx
  = U 0 (V ) + 3
9 NkT xD
(11) U = −T 2
∂T  T V xD ∫
0 ex −1
 ∂U 
4 x
9 Nk xD x e dx
(12) CV =   = 3 ∫0
 ∂T V xD ex −1
2
( )
La capacité calorifique molaire cV s'écrit alors
 T 
(13) cV = 3RD 
 ΘD 
où la fonction de Debye
4 x
(14) D( y ) = 3 y 3 ∫
1 / y x e dx

0
(ex −1
2
)
est donnée dans le tableau ci-dessous et représentée dans la figure ci-dessous.

y D(y) y D(y) y D(y)


0 0 0.15 0.213 0.5 0.825
0.025 0.00122 0.175 0.293 0.6 0.874
0.05 0.00974 0.2 0.369 0.8 0.926
0.075 0.0328 0.25 0.503 1 0.952
0.1 0.0758 0.3 0.610 1.5 0.980
0.125 0.138 0.4 0.746 2 0.988

Les expressions limites de D( y ) sont


4π 4 3
(15) D( y ) = ( y → 0) et D( y ) = 1 − ( y → ∞)
1
y
5 20 y 2

Le modèle de Debye rend assez bien compte à l'aide du seul paramètre Θ D des caractéristiques
principales des capacités calorifiques des solides. En particulier, il redonne la loi de Dulong et Petit
à température élevée ( T > Θ D ) et la loi en T 3
12π 4 T 3
(16) cV = R 3
5 ΘD
à basse température ( T << Θ D ). Le tableau ci-dessous rassemble des valeurs de Θ D obtenues à
partir de la loi en T 3 pour diverses substances non métalliques.

He 26 Te 153 MgO 946


Ne 67 As 282 SiO2 470
Ar 93 Diamant 2230 TiO2 760
Kr 72 Graphite 420 Fe2O3 660
Xe 55 Si 640 CaF2 510
Se 90 Ge 370 ZnS 315

Discussion du modèle de Debye


Le modèle rend compte des données expérimentales bien que la densité d'états utilisée soit assez
grossière. On comprend la raison de l'accord à basse température puisque seules les plus basses
fréquences sont excitées et qu'alors la densité d'états de Debye (5) a la forme limite de la densité
d'états réelle. De même, à température suffisament haute, l'énergie interne (3) a pour forme limite
(17) U = U 0 (V ) + kT ∫ g (ω )dω = U 0 (V ) + 3 NkT
et l'on retrouve la loi de Dulong et Petit, cV = 3R , indépendamment de la densité d'états. Le modèle
de Debye donne une interpolation simple entre ces deux régions. C'est la raison pour laquelle il
permet de représenter de façon satisfaisante les capacités calorifiques à l'aide d'un seul paramètre
Θ D caractéristique de la substance.
On utilise beaucoup le modèle de Debye pour représenter les données expérimentales sur les
capacités calorifiques de la façon suivante (voir la figure ci-dessous) : à chaque température T, la
mesure de cV permet de déterminer une température Θ D par résolution numérique de (13). La
courbe Θ D (T ) ainsi obtenue contient la même information que cV (T ) . Si le modèle de Debye était
vérifié, on aurait Θ D (T ) = cte . Ceci n'est jamais le cas, car la densité d'états (5) du modèle de
Debye est trop grossière. En utilisant la densité d'états réelle obtenue expérimentalement, le modèle
des phonons reproduit bien les variations de Θ D (T ) , donc de cV (T ) .
Lorsque la maille d'un cristal contient plusieurs atomes, il existe, en plus des branches acoustiques,
des branches optiques pour lesquelles la fréquence varie relativement peu avec le vecteur d'onde k.
La densité d'états pour chacune de ces branches optiques peut alors s'écrire
(18) g s (ω ) = Nδ (ω − ω s )
où ω s est la fréquence moyenne de la branche. La contribution d'une branche optique à l'énergie
libre des phonons est :
  hω s 
(19) Fs = NkT ln 1 − exp − 
  kT 

On reconnaît dans cette expression l'énergie libre du modèle d'Einstein pour N oscillateurs de
fréquence ω s . La capacité calorifique d'un tel cristal peut être interprétée comme la somme d'un
terme de Debye relatif aux branches acoustiques et d'autant de termes d'Einstein qu'il existe de
branches optiques.

Equation d'état
L'équation d'état obtenue à partir de l'énergie libre (1). On a
 ∂F 
(20) P(T , V ) = −  = P0 (V ) + Pph (T ,V )
 ∂V  T
où P0 = − dF0 / dV est la pression au zéro absolu liée aux interactions entre atomes et
Pph = −(∂F ph / ∂V )T est un terme lié à l'agitation thermique qui est en général faible devant P0 .

La compressibilité isotherme χ ≡ χ T du solide contient donc deux termes :


1  ∂V 
(21) χ (T , V ) = −   = χ 0 (V ) + χ ph (T , V )
V  ∂P 
le second étant plus faible que le premier. Ceci explique que χ varie relativement peu avec la
température. Par ailleurs, χ ayant de faibles valeurs, une augmentation de pression fera peu varier
V et par suite χ . En résumé, il existe un faible variation de χ avec T et P.
Pour obtenir le coefficient de dilatation thermique α à partir de l'équation d'état (20), nous
utilisons la relation cyclique
 ∂V   ∂V   ∂P 
(22)   = −   
 ∂T  P  ∂P  T  ∂T V
d'où nous obtenons :
1  ∂V   ∂P   ∂Pph 
(23) α =   = χ T   χ T  
V  ∂T  P  ∂T V  ∂T V

Nous précisons cette relation dans le cas du modèle de Debye où l'énergie libre F ph donnée par (8),
varie avec le volume par l'intermédiaire de Θ D seul. Par dérivation de F par rapport à V, on obtient
 ∂F ph  9 Nk dΘ D xD x 3 dx
x D dV ∫0 e x − 1
(24) Pph = −  = − 4
 ∂V  T
La combinaison de cette équation avec l'expression (11) de l'énergie interne permet d'écrire
(U − U 0 )
(25) Pph = γ
V
avec
d ln Θ D
(26) γ = −
d ln V

En reportant dans l'expression (23) de α , on obtient


γ  ∂U  c χ
(27) α = χ T   =γ V T
V  ∂T V v
ce qui montre que γ est le rapport de Grüneisen. L'expression (26) de γ permet de comprendre que
ce paramètre varie peu avec T ainsi qu'avec la nature du cristal. On peut montrer en particulier que
si l'énergie d'interaction entre atomes varie comme r − n , le rapport de Grüneisen vaut
n+2
(28) γ =
6
ce qui, pour γ ~ 2 , correspond à la valeur n~10 utilisée pour la partie répulsive du potentiel, la
partie attractive étant négligeable.

En conclusion, la relation (27) explique le fait que γ , χ T et v variant peu, α et cV présentent des
variations avec T très semblables. En particulier
cV ou α ∝ T 3 T << Θ D
(29)
cV ou α ~ cte T > Θ D
Exercices

Capacité calorifique du cuivre


Les vitesses du son dans le cuivre ont respectivement pour valeur c L = 4760 m s −1 et
cT = 2325 m s −1 . Calculez Θ D et déterminez la capacité calorifique du cuivre à basse température.
( )
Comparez au résultat expérimental cV J K −1 mole −1 = 6.86 × 10 −4 T + 4.76 × 10 −5 T 3 . On donne pour
le cuivre M = 63.54 g mole −1
et ρ = 9.018 g cm .
−3

Solution
Les formules (9) et (6) de la section V.1.7 donnent Θ D = 343 K . La formule (16) donne alors
cV = 4.82 × 10 −5 T 3 . L'accord avec l'expérience est satisfaisant, le terme linéaire en T étant relatif
aux électrons libres du cuivre.
V.1.8. Anharmonicité
Le modèle des phonons à l'approximation harmonique permet de rendre compte d'un grand nombre
de propriétés des solides. Cependant il n'explique pas :
 La croissance à peu près linéaire de c V à haute température.
 Le fait que la conductivité thermique ne soit pas infinie.
 L'établissement de l'équilibre thermique des phonons.

Pour pouvoir interpréter ces effets, il est nécessaire de considérer les termes au-delà de
l'approximation harmonique dans le développement de l'énergie d'interaction entre atomes. Ces
termes anharmoniques représentent, après quantification, l'interaction entre phonons accompagnée
de créations et d'annihilations. Le couplage le plus simple (figure ci-dessous) correspond à
l'annihilation de deux phonons incidents de vecteurs d'onde k' et k" et à la création d'un phonon k
tel que
ε (k ) = ε (k ′) + ε (k ′′)
(1)
k = k ′ + k ′′ + K
où K est un vecteur du réseau réciproque du cristal.

On montre que ces interactions rendent compte des trois propriétés énoncées plus haut.
Exercices de compréhension
1. Montrez que le réseau du diamant est cubique à faces centrées et que la maille élémentaire
contient deux atomes et la maille cubique 8 (première figure, (a) de la section V.1.3).
2. Comparez la distance de deux atomes de sodium voisins au diamètre de l'ion Na + dans le
sodium métallique (première figure, (c) de la section V.1.3).
3. Vérifiez que le réseau d'hélium (première figure, (d) de la section V.1.3) est hexagonal.
Interprétez la valeur du rapport c / a = 8 / 3 .
4. Déterminez pour chacun des trois réseaux cubiques de Bavais : le nombre de nœuds par maille
cubique, le nombre de nœuds plus proches voisins d'un nœud donné et leur distance en fonction
de l'arête a de la maille.

Réponse : 1, 2 et 4, 6 à a, 8 à a 3 / 2 , 12 à a / 2
5. Montrez que le taux maximum de remplissage par des sphères dures est π / 3 2 , 3π / 8 , π / 6
et 3π / 16 pour les structures cubiques à faces centrées, cubique centrée, cubique simple et
diamant.
6. Montrez que le réseau réciproque d'un réseau cubique simple est cubique simple et que celui
d'un réseau cubique à faces centrées et cubique centré (et réciproquement).
7. Calculez le volume d'une maille du réseau réciproque en fonction de celui τ du réseau direct.

Réponse : 8π 3 / τ .
8. Que représentent dans un réseau cubique les directions [100], [110], [111] ?

Réponse : arête, diagonale d'une face, diagonale du cube.


9. Le silicium Si a pour masse volumique ρ = 2.34 g cm −3 . La diffusion des rayons X indique une
maille cubique d'arête a = 5.43 Å. Combien y a-t-il d'atomes Si par maille cubique
( M = 28.09 g mole −1 ) ? De quelle structure peut-il s'agir ?

Réponse : 8, diamant.
10. Montrez que la quantité de mouvement de l'ensemble des atomes d'un cristal est nulle pour des
déplacements tels que (17) de la section V.1.5. La quantité de mouvement d'un phonon est donc
nulle.
11. On considère un cristal cubique d'arête a ~ 3 Å et dans lequel le son se propage à ~ 3000 m s −1 .
Estimez les domaines de variation du vecteur d'onde k et de l'énergie ε des phonons de la
branche acoustique.

Réponse : k < 1010 m −1 , ε < 0.02 eV .


12. Dans le cristal précédent, les ondes sonores ont une fréquence ν < 20000 s −1 . Quels sont les
domaines correspondants de k et de ε ?

Réponse : k < 40 m −1 et ε < 10 −10 eV .


13. Calculez le nombre de phonons dans le modèle de Debye pour T << Θ D et T >> Θ D .
14. Montrez que l'énergie la plus probable des phonons à la température T est, dans le modèle de
Debye, ε ≅ 1.6 kT .
15. Calculez l'énergie de vibration du cristal au zéro absolu dans le modèle de Debye et vérifiez que
cette énergie est égale à U ph pour T = 0.67Θ D .
16. Etudiez un cristal monoatomique unidimensionnel à l'approximation de Debye.
Problème 1 Capacité calorifique de files d'atomes

File monoatomique
On considère un réseau à une dimension constitué de N atomes identiques de masse m dont les
positions d'équilibre sont régulièrement espacées de a. On suppose que les atomes interagissent
avec leurs proches voisins seulement, l'énergie d'interaction binaire étant notée φ (r ) .

1. Montrez que l'énergie potentielle de la file est


N −1
(1) E = ∑ φ (a + u p +1 − u p )
p =1

où u p est l'écart du pième atome par rapport à sa position d'équilibre.


2. Effectuez un développement limité de φ au voisinage de a et montrez que E est de la forme

(2) E = E0 (a ) + ω 02 (a )∑ (u p +1 − u p )
m 2

2 p

Donnez les expressions de E 0 et de ω 0 en fonction de N, φ et m.


3. Déduisez-en que l'équation du mouvement du pième atome est, à la même précision :
(3) u&&p = ω 02 (u p +1 + u p −1 − 2u p )
4. On cherche les solutions de ces équations sous la forme ondulatoire u p = u 0 cos(kpa − ω t ) .

Quelle relation de dispersion ω = ω (k ) est vérifiée pour ces solutions ? On rappelle que
cos 2α + cos 2 β = 2 cos(α + β ) cos(α − β ) .
5. Précisez la signification physique de ω et k. Pourquoi peut-on se limiter aux solutions telles
que k < π / a ?
6. Tracez ω (k ) en précisant son comportement au voisinage de k = 0 et de k = ±π / a . Donnez les
expressions de la vitesse du son c et de la fréquence de coupure ω m dans ce modèle.
7. On impose à la chaîne d'avoir une longueur fixe L = (N - 1) a.

Quelles valeurs de k permettent de satisfaire cette condition ? Calculez la densité g (k ) des


valeurs possibles de k.
8. Déduisez-en la densité g (ω ) des pulsations. Représentez la fonction g (ω ) .
9. On sait que l'énergie d'une onde de pulsation ω est, en mécanique quantique :
 1
(4) ε n =  n + hω n ≥ 0
 2

En appliquant la statistique de Maxwell-Boltzmann aux états d'énergie d'une onde, quelle est, à
la température T, la probabilité Pn que l'onde ait l'énergie ε n ? En déduire l'expression de
l'énergie moyenne d'une onde ε (ω , T ) , à cette température. On notera k B la constante de
Boltzmann.
10. Montrez que l'énergie interne totale U du cristal peut s'écrire sous la forme
(5) U = U 0 (a ) + U ph (a, T )
et interprétez U ph en termes de phonons, particules en nombre indéterminé obéissant à la
statistique de Bose-Einstein.
11. Calculez U ph dans la limite des hautes températures. On indiquera l'expression d'une
température caractéristique Θ m en fonction de ω m puis en fonction des paramètres
expérimentaux c et a.
12. Déterminez la dépendance en T de U ph à basse température ainsi que celle de la capacité
calorifique molaire cV de la file.

File diatomique
On considère maintenant un réseau unidimensionnel constitué de N atomes A alternant avec N - 1
atomes B (ABAB…BA). On appelle φ (r ) l'énergie d'interaction AB et on se limite aux interactions
entre proches voisins. On notera m1 ( m2 ) la masse des atomes A (B) et u 2 p −1 ( v 2 p ) l'écart des
atomes à leur position d'équilibre, ces positions étant distantes de a/2. L'indice p varie de 1 à N (N -
1) pour les atomes A (B).

1. Généralisez les résultats ci-dessus pour montrer que les équations du mouvement des atomes 2p
- 1 et 1p sont respectivement :
u&&2 p −1 = ω12 (v 2 p −2 + v 2 p − 2u 2 p −1 )
v&&2 p = ω 22 (u 2 p −1 + u 2 p +1 − 2v 2 p )
(5)

Donnez les expressions de ω1 et de ω 2 .


2. On cherche les solutions des expressions précédentes ayant la forme
  1 
u 2 p −1 = u 0 cos k  p − a − ω t 
(6)   2 
v 2 p = v0 cos(kpa − ω t )

Montrez que pour chaque valeur de k, les valeurs possibles de ω 2 annulent un déterminant 2x2
et écrire l'expression du rapport v0 / u 0 .
3. Déterminez explicitement les valeurs de ω 2 (k ) , notées ω A2 (k ) et ω 02 (k ) ( ω A < ω O ).
4. Etudiez les limites de ω A (k ) pour k  0 et k = ±π / a (on supposera m1 < m2 ).

Tracez la branche ω = ω A (k ) et commentez. Donnez en particulier la vitesse du son c.


5. Calculez le rapport v0 / u 0 pour cette branche à la limite k  0. Justifiez le nom de branche
acoustique.
6. Reprendre les questions 4 et 5 pour la branche ω = ω O (k ) . Donnez une justification du nom de
branche optique.
7. Etudiez les cas limites m1 = m2 et m1 << m2 .
8. Dans le cas de cristaux réels tels que les halogénures alcalins (A = Li + , Na + , K + , Rb + et B =
F − , Cl − , Br − , I − ), la température caractéristique de Debye Θ D généralisant Θ m a pour
expression
( )
(7) Θ D = 2 3π 2
1/ 3hc
kBa
où a est l'arête de la maille cubique. En prenant comme expression de la vitesse du son c celle
c obtenue plus haut pour le modèle à une dimension, montrez que le produit Θ D m1 + m2 n'est
fonction que de a. Tracez cette fonction à l'aide des données expérimentales relatives à la
famille des halogénures alcalins.

Li (6.9) Na (23.0) K (39.1) Rb (85.5)


F 730 492 336
(19.0) 4.03 4.63 5.34 5.63
Cl 422 321 231 165
(35.5) 5.14 5.64 6.28 6.55
Br 224 173 131
(79.9) 5.97 6.58 6.86
I 164 131 103
(126.9) 6.46 7.07 7.34

Ce tableau reprend les températures de Debye en kelvins obtenues à partir de la loi en T 3 (nombres
supérieurs) et les paramètres de la maille en angströms (nombres inférieurs) pour des halogénures
alcalins. Les masses atomiques (en grammes par mole) sont données entre parenthèses.

Solution

File monoatomique
1. La distance entre les atomes p et p + 1 est a + u p +1 − u p et l'énergie potentielle totale est la
somme des (N - 1) énergies d'interaction entre voisins, d'où la forme donnée pour E.
2. En développant φ , on a
φ ′′(a )
(8) φ (a + u p +1 − u p ) = φ (a ) + φ ′(a )(u p +1 − u p ) + (u p+1 − u p )2 + L
2
Les termes linéaires en u p s'éliminant lors de la sommation sur p (il reste seulement la
différence u n − u1 qui s'annule aussi lorsque la longueur de la chaîne est fixée). On a finalement
φ ′′(a )
(9) E = ( N − 1)φ (a ) + ∑ (u p+1 − u p )2
2 p
d'où
φ ′′(a )
(10) E 0 (a ) = [N − 1]φ (a ) ≅ Nφ (a ) et ω 02 (a ) =
m
3. La force agissant sur le pième atome est
(11) F p = −
∂E
∂u p
[ ]
= −mω 02 − (u p +1 − u p ) + (u p − u p −1 )

de sorte que l'équation du mouvement de ce dernier, mu&&p = F p est l'équation proposée.


4. En reportant l'expression des déplacements dans l'équation du mouvement et en remarquant que
u p +1 + u p −1 = u 0 [cos(k ( p + 1)a − ω t ) + cos(k ( p − 1)a − ω t )]
(12)
= 2u 0 cos(kpa − ω t ) cos ka
on trouve
(13) − u 0ω 2 cos(kpa − ω t ) = 2ω 02 u 0 cos(kpa − ω t )(cos ka − 1)
d'où la relation de dispersion
(14) ω (k ) = ω 0 2(1 − cos ka ) = 2ω 0 sin
ka
2
5. Au cours du mouvement étudié, chaque atome oscille autour de sa position d'équilibre avec la
même pulsation ω et la même amplitude u 0 , la différence de phase entre deux voisins étant ka.
Le mouvement correspondant est ondulatoire, k représentant le vecteur d'onde. Le même
mouvement des atomes étant décrit par des valeurs de k différent de 2π / a , on peut se limiter à
l'intervalle ]− π / a, π / a ] .
6. La relation de dispersion est représentée dans la figure ci-dessous.

A l'origine, on a ω ≅ ω 0 a k et aux limites de l'intervalle


(15) ω = ω m ≡ 2ω 0
la pente étant nulle. La vitesse du son, égale aux vitesses de phase et de groupe pour k  0
(grandes longueurs d'onde), est
(16) c = ω 0 a
7. La longueur L étant fixe, on a u N = u1 , soit avec l'expression générale de u p :
cos(kNa − ω t ) = cos(ka − ω t ) . On a donc kNa = ka + 2nπ (n entier), d'où
2 nπ 2 nπ
(17) k = =
(N − 1)a L
Les valeurs de k sont régulièrement espacées de 2π / L entre − π / a et + π / a . La densité g (k )
est donc
(18) g (k ) =
1 L
=
2π / L 2π
8. Par changement de variable, on a
(19) g (ω ) = g (k )
dk

Comme k = ±(2 / a ) arcsin (ω / ω m ) , il vient

(20) g (ω ) =
L 2
× 2×
2π a ω m2 − ω 2
où le facteur 2 tient compte des valeurs de k positives et négatives; Comme L = ( N − 1)a ≅ Na ,
la densité est donc (figure ci-dessus) :
2 N / π ω 2 − ω 2 ω < ω
(21) g (ω ) =  m m

 0 ω > ωm
9. En statistique de Maxwell-Boltzmann, la probabilité d'occupation du niveau d'énergie ε n est
e −β εn
(22) Pn = avec Z = ∑ e − β ε n
Z n

Avec l'expression donnée de ε n , la fonction de partition Z vaut


e − β hω / 2
(23) Z =
1 − e − β hω
d'où
(24) Pn = e − nβ hω (1 − e − β hω )

On peut vérifier que ∑P n = 1 . L'énergie moyenne d'une onde est donc


 1 hω
(25) ε (ω , T ) = ∑  n + hω Pn = hω ∑ nPn +
 2 2

Comme

d
(26) ∑ ne
n =0
− nβ hω
=−
d (βhω )
∑ e −nβ hω

on a

ε (ω , T ) = −hω
d
d (βhω )
( )
ln 1 − e − β hω +
2
(27)
 1 1
= hω  β hω + 
e −1 2
10. L'énergie interne totale s'écrit donc :
ωm
(28) U = E 0 (a ) + ∫ g (ω )dω × ε (ω , T )
0

En reportant l'expression (27) de ε (, T ) , on obtient U = U 0 (a ) + U ph (a, T ) avec


ωm hω
(29) U 0 (a ) = E 0 (a ) + ∫ g (ω )dω
0 2
et
ωm hω
(30) U ph (a, T ) = ∫ β hω
g (ω )dω
0 e −1

L'expression de U ph s'identifie à l'expression U = ∑ N i ε i de l'énergie interne en statistique de


Bose-Einstein avec un nombre indéterminé de particules ( µ = 0 ) pour laquelle
gi
(31) N i = β εi
e −1
avec ε i → ε = hω . Ces particules sont appelées phonons.
11. Lorsque βhω << 1 pour ω < ω m , c'est-à-dire pour
(32) T >> Θ m = hω m / k B
on a
hω ωm
(33) U ph ≅ ∫ g (ω )dω = k B T ∫ g (ω )dω
βhω 0

L'intégrale est égale au nombre total de modes, donc U ph ≅ Nk B T . Dans le domaine considéré,
la capacité calorifique molaire cV vaut alors Nk B = R . Ceci constitue la loi de Dulong et Petit
pour un solide à une dimension. La température caractéristique Θ m peut également s'écrire à
l'aide de (15), (16) :
2h c
(34) Θ m =
kB a
( )
12. Pour T  0, le facteur 1 / e β hω − 1 est très petit pour ω >> k B T / h . On peut donc dans (30)
pousser la borne supérieure de l'intégrale à l'infini et remplacer g (ω ) par g (0 ) = 2 N / πω m , soit
∞ hω 2N
(35) U ph = ∫ β hω × dω
0 e − 1 πω m

En effectuant le changement de variable x = βhω , il vient



(36) U ph =
2N
(k B T )2 ∫0 x x dx
πhω m e −1
où l'intégrale est purement numérique et vaut π 2 / 6 . L'énergie interne varie comme T 2 et, par
conséquent, cV varie comme T :

(37) cV = R
T
(T << Θ m )
3 Θm
Ceci correspond à la loi en T 3 des solides à trois dimensions.

File diatomique
1. L'énergie potentielle de la file s'écrit maintenant
N −1
a  N −1  a 
(38) U = ∑ φ  + v 2 p − u 2 p −1  + ∑ φ  + u 2 p +1 − v 2 p 
p =1  2  p =1  2 

A l'approximation harmonique, cette énergie devient :


 a  1  a  N −1
(39) U = 2( N − 1)φ   + φ ′′ ∑ (v 2 p − u 2 p −1 ) + (u 2 p +1 − v 2 p )
2 2

 2  2  2  p =1

En écrivant l'équation du mouvement pour u 2 p −1 et v 2 p , on trouve les équations proposées avec


φ ′′(a / 2) φ ′′(a / 2)
(40) ω12 = et ω 22 =
m1 m2
2. En reportant les déplacements donnés dans les équations du mouvement, on trouve, comme ci-
dessus :
 ka   ka 
(41) − ω 2 u 0 = 2ω12  v0 cos − u 0  et − ω 2 v0 = 2ω 22  u 0 cos − v 0 
 2   2 

Ce système de deux équations linéaires et homogènes n'a de solutions u 0 et v0 non nulles que
si son déterminant est nul, soit
ω 2 − 2ω12 2ω12 cos ka2
(42) =0
2ω 22 cos ka2 ω − 2ω 22

On a alors pour chaque solution en ω :


v 2ω12 − ω 2
(43) 0 =
u 0 2ω 12 cos(ka / 2 )
3. Les valeurs de ω 2 annulant le déterminant sont solutions de
(44) ω 4 − 2ω 2 (ω12 + ω 22 ) + 4ω 12ω 22 sin 2
ka
=0
2
d'où
1/ 2

(
(45) ω = ω + ω
2 2
1
2
2 ) (

±  ω12 + ω 22 )
2
− 4ω ω sin
2
1
2
2
ka 
2

2 

La solution ω A ( ω O ) correspond au signe - (+).


4. Lorsque k tend vers zéro, la racine dans l'expression de ω 2 équivaut à
2ω 2ω 2
( )
(46) ω12 + ω 22 − 2 1 22 sin 2
ω1 + ω 2
ka
2
d'où
2ω 2ω 2  ka 
2

(47) ω ≅ 2 1 2 2  
2

ω1 + ω 2  2 
A

Pour k  0, on a donc
ω12ω 22
(48) ω A = c k avec c = 2
a2
2(ω1 + ω 2 )
2 2

et la pulsation est linéaire en k comme c'est le cas des ondes sonores. Pour k → ±π / a , la
( )
racine vaut ω12 − ω 22 , car m1 est plus petit que m2 et par suite ω1 est plus grand que ω 2 . La
courbe ω A (k ) est représentée dans la figure ci-dessous.
(
On a pris ω1 = 2ω 2 , m1 = m2 / 2 et on a ω 3 = ω12 + ω 22 )
1/ 2
.
5. Le rapport v0 / u 0 , donné par (43), tend vers 1 lorsque k tend vers zéro. Les atomes A et B
vibrent donc avec la même amplitude et la nature des atomes n'intervient pas dans la
propagation des ondes (figure (a) ci-dessous).
Ce résultat et la relation limite (48) montrent l'analogie avec les ondes sonores des milieux
continus, d'où le nom de branche acoustique.
6. Lorsque k tend vers zéro, on a, comme ci-dessus :
( )
(49) ω O2 ≅ 2 ω12 + ω 22 − c 2 k 2
et lorsque k tend vers ± π / a , on a ω O ≅ 2ω1 , avec dω / dk = 0 en ce point. La courbe ω O (k )
a été représentée ci-dessus.

Notons que lorsque k  0, on a


v0 ω 22 m
(50) →− 2 =− 1
u0 ω1 m2
et les atomes A et B vibrent en opposition de phase (figure (b) ci-dessus) de façon à ce que leur
centre de gravité reste immobile. Dans le cas où les atomes A et B sont des ions (de signes
opposés), les déplacements peuvent être excités par le champ électrique d'une onde optique de
fréquence ω = ω O , d'où le nom de branche optique. Cette propriété est étudiée par la
spectroscopie d'absorption infrarouge.
7. Lorsque m1 = m2 = m , on a ω1 = ω 2 ≡ ω 0 et la relation (45) donnant les fréquences devient
 ka 
(51) ω 2 = 2ω 02 1 ± cos 
 2
d'où, pour les branches acoustique et optique :
ka ka
(52) ω A = 2ω 0 sin et ω O = 2ω 0 cos
4 4

Ces branches, représentées dans la figure ci-dessous, peuvent se déduire de la banche unique
d'une file monoatomique de base a/2.

Lorsque m1 << m2 , la racine carrée de (45) a pour expression approchée


 ka 
(53) ω12 + ω 22 1 − 2 sin 2  = ω12 + ω 22 cos ka
 2
d'où ω A = ω 2 (1 − cos ka ) et ω O2 = 2ω12 + ω 22 (1 + cos ka ) ≅ 2ω 12
2 2
La branche acoustique a la forme d'une file monoatomique et la branche optique a une
fréquence constante 2ω1 , correspondant à des atomes A oscillant presque seuls, les atomes B
ayant une amplitude beaucoup plus petite.
8. En prenant pour c l'expression (48) de c, la température de Debye s'écrit
ω1ω 2
( )
(54) Θ D = 2 3π 2
1/ 3 h

( )
k B ω12 + ω 22 1 / 2

Avec les expressions (40) de ω1 et de ω 2 , elle devient

( )
(55) Θ D = 2 3π 2
1/ 3 h a
φ ′′  × (m1 + m2 )−1 / 2
kB 2
ce qui montre que le produit y = Θ D m1 + m2 ne dépend que de a par l'intermédiaire de φ ′′ . Si
l'on considère une famille de substances, comme les halogénures alcalins, on s'attend à ce que
les valeurs de y varient régulièrement avec a. C'est bien ce que l'on observe (figure ci-dessous).
Problème 2

Améliorations du modèle de Debye


Dans le modèle des phonons, on détermine les propriétés thermodynamiques des solides à partir
des propriétés d'un gaz de phonons, particules en nombre indéterminé obéissant à la statistique de
Bose-Einstein. On se propose dans ce problème d'étudier un modèle particulier de solide
monoatomique du à P. Debye ainsi que des améliorations de ce modèle.

1. En statistique de Bose-Einstein, le grand potentiel Ω(T , V , µ ) = U − TS − Nµ est donné par


[
(1) Ω = k B T ∑ g i ln 1 − e
β (µ −ε i )
] β = 1 / k BT
i

où les ε i sont les niveaux d'énergie et les g i leur dégénérescence (on a noté k B la constante de
Boltzmann).

Déduisez-en l'expression générale de l'énergie libre F d'un gaz de phonons, puis celle de
l'énergie interne U et de la capacité calorifique à volume constant CV . Commentez l'expression
de U.
2. Sachant que la quantité de mouvement et l'énergie d'un phonon sont données par p = hk et
ε = hω avec ω = ω (k ) , déterminez la densité d'états g (k ) et écrivez CV sous la forme d'une
intégrale sur k.
3. On rappelle que les N valeurs de k possibles sont restreintes à la première zone de Brillouin de
l'espace réciproque, N désignant le nombre d'atomes du cristal. Montrez que le volume de cette
zone est τ = (2π ) N / V où V est le volume du cristal.
3

4. Déterminez l'expression limite de la capacité calorifique molaire cV d'un solide monoatomique


lorsque T → ∞ . On tiendra compte du fait qu'il existe trois sortes de phonons (une
longitudinale L et deux transversales T1 et T2 ). Notez cV (∞ ) la limite de cV et commentez sa
valeur.
5. Lorsque k = k → 0 , la relation de dispersion pour chaque polarisation prend la forme
ω = c s (Ω )k , c s représentant la vitesse de propagation du son dans la direction Ω = (θ , φ ) pour
la polarisation s (s = L, T1 , T2 ). En introduisant la vitesse moyenne c définie par
3 dΩ 1
(2) 3 = ∑ ∫ ×
c s 4π [c s (Ω )]3
donnez l'expression limite de CV lorsque T  0. Mettez en évidence la dépendance en T.
L'intégrale ∫
0

( )
x 4 e x dx / e x − 1
2
vaut 4π 4 / 15 .
6. Modèle de Debye.

Ce modèle équivaut à un modèle de phonons pour lequel on aurait les trois hypothèses
suivantes.
(i) Il n'y a qu'une seule relation de dispersion pour les trois polarisations des phonons.
(ii) La relation de dispersion a la forme ω = ck .
(iii) La première zone de Brillouin est remplacée par une sphère de rayon k m et de volume τ .

Calculez le rayon k m de la sphère en fonction de V et de N. Déduisez-en l'existence d'une


pulsation de coupure ω D .
7. Déterminez la densité de pulsation g (ω ) à partir de la densité g (k ) du point 2. Représentez
graphiquement cette densité.
8. Montrez que, dans ce modèle, cV est égal à cV (∞ ) × D( x ) où la fonction
u 4eu u 4 e xu
(3) D( x ) = 3
3 x 1
∫ (e du = 3 x ∫ 2
du
x −10 2 u
) 0
e xu − 1
2
( )
est représentée dans la figure ci-dessous.
Précisez l'expression de x en fonction de Tm = hck m / k B .
9. En se référant à la question 5, précisez la valeur de c en fonction de c et donnez l'expression, à
basse température, de la capacité calorifique molaire cV en fonction de T / Tm .
10. On se propose de déterminer dans ce modèle le paramètre c du cuivre à partir des données
expérimentales suivantes : masse molaire M = 63.54 g mole −1 , masse volumique à 0 K
ρ = 9.02 g cm −3 , capacité calorifique pour T ≤ 10 K cV = 4.76 × 10 −5 T 3 J K −1 mole −1 . Calculez
les valeurs de k m et de Tm et e, déduire celle de c.
11. Modèle I.

On considère un modèle où l'on conserve les hypothèses (ii) et (iii) du modèle de Debye, mais
où l'on suppose que la relation de dispersion longitudinale ω = c L k est différente des deux
relations transversales ω = cT k ( c L > cT ).

Montrez qu'il y a deux pulsations de coupure ω L et ω T suivant le type d'onde. Déterminez et


représentez la densité totale g (ω ) . Comparez à la densité du modèle de Debye. Quelle est
l'expression de c dans ce modèle ?
12. Donnez les contributions de chacune des contributions des trois types de phonons à la capacité
calorifique cV en utilisant la fonction de Debye D. On introduira deux températures
caractéristiques TL et TT dont on donnera les expressions. Ecrivez alors l'expression de cV .
13. Quelles sont les expressions limites de cV pour T → ∞ et T  0. Comparez au modèle de
Debye.
14. On a pour le cuivre c L = 4760 m s −1 et cT = 2325 m s −1 . Calculez c , TL et TT . Déduisez-en la
loi donnant cV pour T  0 et comparez à la loi expérimentale du point 10.
15. Calculez à l'aide de la figure ci-dessus le rapport cV / 3R dans ce modèle pour T = 100, 200 et
300 K. Déduisez-en pour chacune de ces températures, la valeur de 1/x donnant le même
rapport cV / 3R dans le modèle de Debye. Calculez les températures Θ D = xT correspondantes
et tracez l'allure de la courbe Θ D = Θ D (T ) .
16. Modèle II.

On considère maintenant un modèle où l'on conserve les hypothèses (i) et (iii) du modèle de
Debye, mais où l'on suppose que la relation de dispersion a la forme plus réaliste
ω = ω m sin (πk / 2k m ) avec ω m = 2ck m / π .

Représentez la relation de dispersion précédente et comparez-la à celle du modèle de Debye.


Déterminez et représentez graphiquement la densité de pulsation g (ω ) .
17. Montrez que, dans ce modèle, cV est égal à cV (∞ )F ( x ) où x est la variable définie au point 8 et
F ( x ) est une intégrale que l'on déterminera. La fonction F ( x ) est représentée dans la figure ci-
dessus.
18. Reprenez dans ce modèle et pour les températures de 25 K, 100 K et 300 K, l'ensemble de la
question 15. Cherchez à interpréter la courbe expérimentale représentant Θ D (T ) (dernière
figure de la section V.1.7) pour le cuivre, en considérant à la fois les modèles I et II.

Données numériques : nombre d'Avogadro N = 6.02 × 10 23 mole −1 , constante de Boltzmann


k B = 1.38 × 10 −23 J K −1 , constante de Planck réduite h = 1.05 × 10 −34 J s .

Solution
1. Les phonons étant en nombre indéterminé ont un potentiel chimique µ nul. Il en résulte que
[
(4) F ≡ Ω = k B T ∑ g i ln 1 − e
− β εi
]
i

D'après la relation de Helmholtz, l'énergie interne vaut


∂ F g iε i
(5) U = −T 2   = ∑ β εi
∂T  T  i e − 1
et la capacité calorifique est donnée par
2
βε
∂U  εi  e i
(6) CV = = kB ∑ gi 
 
∂T i

 k BT  e β εi − 1(2
)
On retrouve pour l'énergie interne la forme U = ∑ N i ε i pour la loi de répartition de Bose-
Einstein.
2. La densité d'états dans l'espace des phases ayant pour expression d 3 rd 3 p / h 3 , l'intégration sur r
( d 3 r → V ) et le changement de variable p  k donne
(7) g (k )d 3k =
V
d 3k
(2π )3
On passe alors en variables continues dans l'expression (6) de CV
(8) ∑ →∫ g i → g (k )d 3k ε i → ε = hω (k )
i
on obtient
e β hω
∫ d k (βhω )
V
(9) CV = k B 3 2

(2π )3 (e β hω
−1 )
2

3. Il faut écrire que ∑g i = N , c'est-à-dire

∫ g (k )d
V
(2π )3 ∫
(10) 3
k= d 3k = N

Le volume de la première zone de Brillouin est donc


(11) τ = ∫ d 3k = (2π )
3 N

V
4. Lorsque T tend vers l'infini, βhω tend vers zéro et l'expression (9) de CV a pour forme limite
V V
(11) CV = k B 3 ∫
d 3k = k B τ = Nk B
(2π ) (2π )3
En tenant compte des trois polarisations, la capacité calorifique molaire cV (∞ ) vaut 3R
conformément à la loi de Dulong et Petit.
5. Lorsque T tend vers zéro, seuls les niveaux les plus bas sont peuplés et on peut appliquer la
relation ω = c s (Ω )k dans l'expression de CV . En posant x = βhc s k , cette expression devient
k BV x 2 dxdΩ 2 e x
CV = ∑ ∫ (βhc )3 x e x − 1 2
s (2π )3 s ( )
(12)
k BV  dΩ ex 
= (k T )3
∑ ∫  × ∫ x 4
dx 
h 3 B
s
 c (Ω )
 s
3
ex −1
2 
 ( )
En poussant à l'infini la borne supérieure de la deuxième intégrale et en introduisant la vitesse
moyenne c , on obtient
12π 4π 4 16 5
3
k T 
(13) CV = k B 3 (k B T ) × 3 ×
V
= π k BV  B 
3

h c 15 5  hc 
6. On a
(14) πk m3 = τ = (2π )
4 3 N

3 V

Le rayon k m vaut donc


1/ 3
 N
(15) k m =  6π 2 
 V
7. La densité g (ω ) est donnée d'après (7) par
ω 2 dω
(16) g (ω )dω =
V V
4πk dk =
2

(2π )3 (2π )3
c3
d'où, en tenant compte des trois polarisations :
3V ω 2
(17) g (ω ) = (ω < ω D )
2π 2 c 3
Cette densité est représentée dans la figure ci-dessous.

8. En faisant ω = ck dans l'expression (9) et en tenant compte des trois polarisations, la capacité
calorifique CV s'écrit
e β hck
4πk 2 dk (βhck )
V km

(2π )3 ∫0
(18) CV = 3k B
2

(e β hck
−1 ) 2

En posant u = βhck et x = βhxk m , cette expression devient :


Vk m3
(19) CV = k B D(x )
2π 2

Si l'on remplace maintenant k m par son expression (15), la capacité calorifique molaire cV
prend la forme
 hck m  T 
(20) cV = 3R × D  = 3RD m 
 kT  T 
9. Dans ce modèle, les vitesses c s (Ω ) définies au point 5 sont égales à c, de sorte que c = c . Par
suite, la capacité calorifique CV à basse température, donnée par (13), s'écrit
3
16π 5
3
k   T 
(21) CV = k BV  m   
5  2π   Tm 

Après avoir remplacé k m par son expression (15), il vient


3
12π 4  T 
(22) cV = R 
5  Tm 
10. La valeur de k m déduite de (15) est 1.7 × 1010 m −1 , la longueur d'onde associée, λ m = 2π / k m ,
est de l'ordre de grandeur des distances interatomiques. On obtient la valeur de Tm en
comparant les expressions théorique et expérimentale de cV à basse température, ce qui donne
Tm = 344 K . La relation Tm = hck m / k B donne alors c = 2650 m s −1 .
11. Comme la valeur maximum de k est k m , les valeurs maximums de ω sont respectivement
ω L = c L k m et ω Y = cT k m avec ω T < ω L . La densité relative à chaque polarisation s est donnée
comme au point 7 par
V ω2
(23) g s (ω ) = (s = L, T1 , T2 ).
2π 2 c s3

Pour ω < ω T , la densité totale est g L (ω ) + 2 g T (ω ) et pour ω T < ω < ω L , elle vaut g L (ω ) , soit
(
 ω 2 × c L−3 + 2cT−3 ) ω < ωT

(24) g (ω ) =
V
× ω 2 / c L3 ωT < ω < ω L
2π 2
0
 ωL < ω
Cette densité, représentée dans la figure ci-dessus, présente deux maximums alors que celle de
Debye n'en a qu'un.

Dans ce modèle amélioré, la vitesse c définie au point 5 est telle que


3 1 2
(25) 3 = 3 + 3
c c L cT

Si l'on choisit pour c la même valeur que dans le modèle de Debye, les deux densités
coïncident pour ω < ω T .
12. Pour chaque polarisation, la densité d'état a la même forme que dans le modèle de Debye. La
contribution correspondante à cV est alors RD(Ts / T ) avec Ts = hc s k m / k B . Nous obtenons
donc
 T   T 
(26) cV = R  D L  + 2 D T 
 T   T 
avec
hc k hc k
(27) TL = L m et TT = T m
kB kB
13. Pour T → ∞ , la fonction de Debye tend vers 1 et cV a pour limite la valeur 3R de Dulong et
Petit, comme dans le modèle de Debye. Pour T  0, chaque contribution intervient par une loi
en T 3 du type (22), soit
4π 4  T   T   4π 4
3 3
1 2
(28) cV = R   + 2   = RT 3  3 + 3 
5  TL   TT   5  TL TT 

Compte tenu de (25) et (27), cette loi en T 3 coïncide avec la loi (22) du modèle de Debye.
14. Avec les valeurs expérimentales de c L et cT , on obtient c = 2612 m s −1 , TL = 620 K et
TT = 302 K . La loi en T 3 s'écrit alors cV = 4.97 × 10 −5 T 3 en accord satisfaisant avec la loi
expérimentale.
15. Nous calculons cV à partir de la relation (26). Pour T = 100 K, on a T / TL = 0.161 et
T / TT = 0.331 . Les valeurs correspondantes de la fonction de Debye lue sur la figure sont : 0.23
et 0.67. On a donc
(29) cV = R × [0.23 + 2 × 0.67 ] = 1.56 R
d'où cV / 3R = 0.52 . De même, ce rapport vaut 0.81 à T = 200 K et 0.90 à T = 300 K. Dans le
modèle de Debye simple, ces rapports sont égaux à D( x ) . Les valeurs numériques de 1/x sont
lues sur la figure de D et sont respectivement 0.26, 0.48 et 0.69. On a donc Θ D (100) = 385 K ,
Θ D (200 ) = 420 K et Θ D (300) = 435 K .

La courbe Θ D (T ) est représentée dans la figure ci-dessous.


Notons que lorsque T  0, on obtient Θ D en égalant les expressions (28) et (22) ( Tm → Θ D ).
On a ainsi
3 1 2
(30) = 3+ 3
[Θ D (0)] TL TT
3

soit Θ D (0 ) = 339 K . De même, en utilisant la forme limite D( x ) = 1 − x 2 / 20 pour x  0, on a


(31) 3[Θ D (∞ )] = TL2 + 2TT2
2

soit Θ D (∞ ) = 434 K .
16. La relation de dispersion, représentée dans la figure (a) ci-dessous, est isotrope et, pour k  0,
coïncide avec la relation de dispersion de Debye : ω = ck .

Cependant, la pente s'annule pour k = k m en meilleur accord avec la réalité.

La densité de pulsation est donnée, d'après (7), par


(32) g (ω )dω = 3 ×
V dk
× 4πk 2 dω
(2π )3

En inversant la relation de dispersion, on a k = (2k m / π ) arcsin (ω / ω m ) , d'où

(33) g (ω ) =
12
Vk m3
[arcsin(ω / ω m )]2
π 5
(ω 2
m −ω 2 )1/ 2

Cette densité, représentée dans la figure (b) ci-dessus, admet la densité de Debye (17) comme
forme limite pour ω → 0 , mais présente une divergence pour ω = ω m .
17. L'expression générale (9) de CV relative à une seule polarisation devient ici
4πV e β hω
dk (βhω )
km

(2π )3 ∫0
(34) CV = 3k B
2

− 1) (e β hω 2

où ω = ω (k ) est la relation de dispersion du modèle II. En effectuant le changement de variable


k → u = k / k m et en utilisant la relation (15) donnant k m , il vient
e β hω
(35) CV = 3R3∫ u 2 du (βhω )
1 2
0
(e β hω
− 1)
2

Comme βhω s'écrit aussi 2 / π x sin (πu / 2 ) avec x = Tm / T , on a finalement 3RF ( x ) avec
πu exp(π2 u sin π2 x )
(36) F ( x ) = 2 x 2 ∫ u 2 du sin 2
12 1

π 0 2 [exp(π2 u sin π2 x ) − 1]2

On peut montrer que cette fonction a pour formes limites F ( x ) ≅ D( x ) pour x → ∞ (T  0) et


F ( x ) ≅ 1 − 2.72 × 10 −2 x 2 pour x  0 ( T → ∞ ) alors que l'on a D( x ) ≅ 1 − 5 × 10 −2 x 2 .
18. Avec la valeur de Tm = 344 K obtenue au point 10, les valeurs de 1 / x = T / Tm sont 0.073, 0.29
et 0.87. En ces trois points cV / 3R = F ( x ) vaut 0.04, 0.74 et 0.97. Ces rapports cV / 3R
s'obtiendraient dans le modèle de Debye pour des valeurs de 1 / x = 0.08, 0.39 et 1.2. Les
températures Θ D correspondantes sont donc Θ D (25) = 310 K , Θ D (100) = 255 K et
Θ D (300) = 250 K . Notons que lorsque T tend vers zéro, F ( x ) ≅ D( x ) et donc
Θ D (0 ) = Tm = 344 K . Par ailleurs, pour T → ∞ en comparant les expressions limites de F ( x )
et D( x ) , il vient Θ D (∞ ) = Tm × (2.72 / 5) = 254 K . La fonction Θ D (T ) est représentée plus
1/ 2

haut.

On peut considérer un modèle "I + II" dans lequel on admet l'existence de relations de
dispersion longitudinale et transversale (modèle I) ayant la même forme que celle du modèle II.
Dans ce modèle, la capacité calorifique molaire est donnée par
 T   T 
(37) cV = R  F  L  + 2 F  T 
 T   T 

Cette expression conduit à des températures de Debye Θ D (T ) représentées plus haut. L'allure
de cette courbe est semblable à la courbe Θ D (T ) expérimentale du cuivre. On interprète la
décroissance de Θ D (T ) à basse température par un écart aux relations de dispersion linéaires et
la remontée à plus haute température par l'existence de plusieurs relations de dispersion.
V.2. Propriétés électroniques

V.2.1. Introduction
Les succès du modèle des électrons libres dans les métaux ont conduit à une étude plus détaillée
des niveaux électroniques dans les solides et à la mise en évidence du regroupement des niveaux en
bandes d'énergie permettant en particulier d'interpréter les différences physiques entre les métaux et
les isolants.

Prenons tout d'abord l'exemple d'un métal, le sodium, dont l'atome libre possède 11 électrons de
configuration 1s 2 2 s 2 2 p 6 3s . Les 10 premiers électrons, formant des couches pleines, occupent
dans l'espace un domaine allant jusqu'environ 2 Å (figure ci-dessous), le onzième électron ayant
une orbitale 3s qui s'étend au-delà de 5 Å.
Lorsque deux atomes de sodium se rapprochent, leurs orbitales 3s se recouvrent dès que leur
distance est voisine de 10 Å et il se produit une levée de la dégénérescence entre les niveaux 3s de
chacun des deux atomes. Dans le cristal, les atomes sont distants de 3.7 Å et leurs nivaux 3s, en
nombre égal au nombre N d'atomes, sont répartis de façon continue dans une bande d'énergie
appelée bande 3s (figure ci-dessous).
En tenant compte du spin des électrons, la bande 3s comprend en fait 2N états électroniques alors
qu'elle contient N électrons. Elle est donc à moitié pleine, les électrons occupant préférentiellement
les niveaux les plus bas (figure (a) ci-dessous). Par ailleurs, les électrons 3s sont libérés, car le
potentiel électrostatique auquel ils sont soumis, somme des potentiels créés par chaque atome, est
abaissé par rapport au cas de l'atome libre (figure ci-dessus). Il s'ensuit que le sodium est un métal.
Considérons maintenant le cas d'un isolant, le silicium, pour lequel l'atome libre, de configuration
électronique 1s 2 2 s 2 2 p 6 3s 2 3 p 2 , possède 4 électrons externes, la sous-couche 3p étant incomplète.
Dans le solide, il se produit une hybridation des états électroniques conduisant à la formation de
deux bandes d'énergie séparées : la bande 3s - 3p et la bande 3p contenant chacune 4 états
électroniques par atome (figure (b) ci-dessus). Les électrons externes (4 par atomes) remplissent
alors complètement la bande 3s - 3p (la plus basse), la bande 3p restant vide. La conduction
électrique ne peut plus avoir lieu et le silicium est isolant.

Prenons enfin le cas de magnésium de configuration électronique 1s 2 2 s 2 2 p 6 3s 2 . Dans le solide,


les N atomes libèrent 2N électrons 3s qui rempliraient complètement la bande 3s s'il ne se
produisait un recouvrement (figure (c) ci-dessus) des bandes 3s et 3p. Certains électrons occupent
alors la base de la bande 3p laissant des états vacants dans le haut de la bande 3s : il s'ensuit que le
magnésium est métallique. En règle générale, les éléments dont les atomes libres ont leurs électrons
périphériques dans les sous-couches s, d et f sont métalliques (alcalins, alcalino-terreux, éléments
de transition,…). Ceux dont les électrons sont dans la sous-couche p sont plutôt isolants lorsqu'ils
sont légers et plutôt métalliques lorsqu'ils sont lourds.
V.2.2. Etats électroniques dans un potentiel périodique
Nous allons maintenant étudier les états électroniques d'un cristal en nous appuyant sur un modèle
unidimensionnel et en généralisant les résultats au cas tridimensionnel.

Théorème de Bloch
La structure périodique d'un cristal entraîne la périodicité spatiale du potentiel électrostatique φ (x )
auquel est soumis un électron de la part des noyaux et des autres électrons. Ainsi, pour un modèle
unidimensionnel d'arête a, on a φ ( x + a ) = φ ( x ) .

Soit ψ ( x ) la fonction d'onde d'un électron, solution de l'équation de Schrödinger


h 2 d 2ψ
(1) − + φ ( x )ψ = εψ ( x )
2m dx 2
associée à l'énergie ε . On constate alors que la fonction ψ ( x + a ) est également solution de
l'équation de Schrödinger pour la même énergie et que, par conséquent, les deux fonctions ψ ( x ) et
ψ ( x + a ) ne diffèrent que par un facteur de phase, soit
(2) ψ ( x + a ) = e iϕψ ( x )
où ϕ est une phase que l'on peut restreindre à l'intervalle [− π ,+π [ . Introduisant alors la quantité
k = ϕ / a comprise entre − π / a et + π / a , on peut écrire ψ ( x ) sous la forme
(3) ψ ( x ) = u ( x )e ikx
et on peut vérifier que u ( x ) est une fonction admettant la périodicité du réseau et dépendant de k.
Ce résultat, constituant le théorème de Bloch, montre que les fonctions d'onde électroniques
présentent l'aspect d'une onde sinusoïdale perturbée au voisinage des ions (figure ci-dessous).
On interprète alors k comme le vecteur d'onde associé à l'électron et dont les valeurs sont
restreintes dans l'intervalle
π π
(4) − ≤a<
a a

Le théorème de Bloch se généralise à 3 dimensions sous la forme


(5) ψ (x ) = u (x ) exp(ik ⋅ x )
où u (x ) est une fonction de x ayant la périodicité du réseau cristallin et dépendant de k, vecteur
d'onde restreint à une maille de l'espace réciproque, la première zone de Brillouin en général.
Notons que, de même que pour les phonons, le vecteur p = hk ne représente pas la quantité de
mouvement de l'électron. Toutefois, ce vecteur p joue le rôle d'une quantité de mouvement
effective.

Classification des états électroniques


Le théorème de Bloch permet de classer les états électroniques comme nous allons le montrer dans
le cas unidimensionnel simple d'un potentiel constant que l'on traite comme ayant la période a. Ce
cas est celui d'électrons libres. Nous supposerons le potentiel nul en changeant l'origine des
énergies.
Chaque état électronique est une onde plane caractérisée par le paramètre quelconque k' et dont la
fonction d'onde et l'énergie associée sont de la forme
h 2 k ′2
(6) ψ ( x ) = exp(ik ′x ) et ε :
2m

En introduisant le vecteur d'onde k restreint à l'intervalle [− π / a, π / a[ et le nombre entier n' défini


par
2n ′π
(7) k ′ = +k
a
on peut récrire les expressions (6) sous la forme
 2n ′πx  h 2  2n ′π
2

(8) ψ n′k ( x ) = exp i  exp (ikx ) et ε n′ (k ) =  + k 
 a  2m  a 
où l'on a fait apparaître pour ψ ( x ) la forme (3) résultant du théorème de Bloch. Nous voyons alors
que chaque état électronique est caractérisé par un vecteur d'onde k situé dans la première zone de
Brillouin (4) et par un nombre entier quelconque n'. Les relations de dispersion ε n′ (k ) sont alors
représentées sur la figure ci-dessous.
Comme nous le verrons par la suite, l'apparition des bandes d'énergie conduit à préférer au nombre
n' défini en (7) le nombre n tel que
π nπ
(9) (n −1) ≤ k ′ ≤
a a

Le nombre n s'appelle numéro de la zone de Brillouin, la première zone (4) correspondant à n = 1.


Ces résultats se généralisent au cas d'électrons libres dans l'espace à 3 dimensions : le vecteur k' est
décomposé en la somme d'un vecteur d'onde k appartenant à la première zone de Brillouin et d'un
vecteur K du réseau réciproque. La détermination du numéro n de la zone de Brillouin à laquelle k'
appartient s'effectue de la façon suivante (figure ci-dessous) :

 On trace les plans médiateurs de tous les vecteurs du réseau réciproque (plans de Bragg).
 Le numéro n de la zone est le nombre, augmenté de 1, de plans de Bragg croisés par le vecteur
k'.

A titre d'illustration, la figure ci-dessous représente, pour un réseau cubique à faces centrées, la
première zone de Brillouin et les relations de dispersion d'un électron libre.
Modèle de Kronig-Penney
Le modèle de Kronig-Penney (1930) est un modèle unidimensionnel pour lequel des calculs
simples permettent de déterminer les relations de dispersion présentant les caractéristiques
générales communes aux substances réelles : existence de bandes d'énergie séparées par des bandes
interdites, forme générale des courbes de dispersion.
Dans ce modèle, la forme périodique du potentiel φ (x ) est

α
(10) φ ( x ) = α ∑ δ (x − pa ) − a
p = −∞

et simule (figure ci-dessous), par les fonctions de Dirac δ , les zones fortement répulsives au
voisinage immédiat des ions, et par le terme constant − α / a , les zones attractives entre les ions (la
valeur du terme constant a été choisie de façon que la valeur moyenne de φ soit nulle sur une
période du réseau).

Les solutions de l'équation de Schrödinger sont définies par morceaux entre deux pics de Dirac
consécutifs et ont pour expression
(11) ψ ( x ) = A p e ik ′x + B p e −ik ′x
dans l'intervalle pa ≤ x < ( p + 1)a . Le paramètre k' caractérisant une solution peut avoir une valeur
quelconque reliée à l'énergie par
α h 2k ′2
(12) ε = − +
a 2m
Si, d'une part, on explicite alors les conditions de raccordement de la fonction d'onde et de sa
dérivée pour k' donné en un point x = pa où se produit une discontinuité de φ et si, d'autre part, on
introduit le vecteur d'onde k à partir du théorème de Bloch (2, 3) sous la forme
(13) ψ (( p + 1)a ) = e ikaψ ( pa )
on obtient l'équation implicite suivante déterminant k', et par suite ε , en fonction de k :
sin k ′a maα
(14) cos k ′a + P = cos ka avec P = 2
k ′a h

La résolution graphique de cette équation (figure ci-dessous) montre que :


 Pour chaque valeur de k, il existe une infinité discrète de valeurs de k', et donc d'énergies. Les
relations de dispersions ε n (k ) correspondantes sont représentées dans la figure ci-dessous.

 Comme cos ka est compris entre -1 et +1, toutes les valeurs de k' et donc toutes les énergies ne
peuvent pas être réalisées. On voit ainsi que les niveaux d'énergie sont répartis en bandes
permises séparées par des bandes interdites.
 Au bas de chaque bande permise, alternativement en k1 = 0 et en k1 = ±π / a , l'énergie a la
forme quadratique
h2
(15) ε n (k ) ≅ ε 1n + ∗
(k − k1 )2
2m1n
où m1∗n est appelé masse effective de l'électron dans le bas de la bande n.
 En haut de chaque bande permise, alternativement en k 2 = ±π / a et en k 2 = 0 , l'énergie a la
forme quadratique
h2
(16) ε n (k ) ≅ ε 2 n − ∗
(k − k 2 )2
2m 2 n
où m2∗n est appelée masse effective du "trou" dans le haut de la bande n.

Résultats généraux
Dans le cas des solides tridimensionnels, le potentiel est représenté par des fonctions approchées de
formes très complexes et la résolution de l'équation de Schrödinger par des méthodes faisant appel
à des calculs numériques permet de déterminer les relations de dispersion ε n (k ) des électrons. Le
schéma des bandes d'énergie que l'on obtient est intermédiaire entre celui dérivé par élargissement
des niveaux électroniques de l'atome libre et celui correspondant à un électron libre. La figure ci-
dessous représente le schéma obtenu à l'aide d'une de ces méthodes pour le cuivre dont la
configuration électronique de l'atome libre est 3d 10 4 s , les électrons internes ayant la configuration
extrêmement stable de l'argon.
On constate que, pour presque chaque valeur de k, il y a 5 états d'énergie voisine de -8 eV formant
la "bande 3d" et un état d'énergie variant entre -15 et 0 eV formant la "bande 4s". Ces
dénominations ne sont qu'une convention, car, pour certaines valeurs de k, les 6 niveaux sont très
voisins, et la distinction 3d - 4s est arbitraire. Notons toutefois que la forme de la relation de
dispersion de la bande 4s est très voisine de celle de la plus basse relation associée à un électron
libre (7).
Remarquons que les relations de dispersion du cuivre possèdent la caractéristique générale suivante
: elles présentent toutes un extremum au centre de la première zone de Brillouin (k = 0, point Γ )
ainsi qu'au centre des faces de cette zone (points X et L), c'est-à-dire aux points tels que k = K / 2
où K est un vecteur du réseau réciproque. Cette propriété découle de ce que l'invariance par
translation du réseau et sa symétrie entraînent
(17) ε (− k ) = ε (k ) et ε (k + K ) = ε (k )

Signalons enfin que l'on peut avoir des informations expérimentales sur la structure des bandes par
l'étude de l'absorption de rayons X mous et de la photoémission d'électrons.
V.2.3. Surface de Fermi

Densité d'états électroniques


Lors de la résolution de l'équation de Schrödinger, il faut tenir compte des conditions aux limites du
cristal. Une formulation bien adaptée est la condition aux limites périodique de Born-von Karman.
Dans le cas à une dimension, elle est telle que la fonction d'onde vérifie :
(1) ψ ( x + L ) = ψ (x )
L = Na étant la longueur du cristal. Le théorème de Bloch entraîne alors que exp(ikL ) = 1 . Le
vecteur d'onde, compris entre − π / a et + π / a , est tel que :
N N
(2) k = 2nπ / L avec n = − , K ,
2 2

Les N valeurs de k sont alors régulièrement espacées de 2π / L avec une densité g (k ) donnée par
π /a
(3) g (k )dk = 2 × dk avec ∫ g (k )dk = 2 N
L
2π −π /a

le facteur 2 ayant été introduit pour tenir compte du fait que l'électron possède 2 orientations de
spin pour chaque valeur de k.

A trois dimensions, la condition aux limites périodique conduit à la densité g (k ) telle que :

(4) g (k )d 3k = 2 × d 3k avec ∫ g (k )d 3k = 2 N
V
(2π )3 ZB

où ZB représente le domaine de la première zone de Brillouin. On peut retrouver cette densité à


partir de la densité dans l'espace des phases (x, p) telle que
d 3 xd 3p
(5) g (x, p )d 3 xd 3p = 2 ×
h3
en posant p = hk . C'est, entre autres, pour cette raison que le vecteur p joue le rôle de quantité de
mouvement de l'électron.

La densité d'états d'énergie dans la bande n est alors donnée par


(6) g n (ε ) = 2 × kδ (ε − ε n (k ))
V
(2π ) ∫
3
3
d

avec
ε 2n
(7) ∫ε g n (ε )dε = 2 N
1n

où ε 1n et ε 2 n sont les énergies minimum et maximum dans la bande n. Dans le cas d'électrons
libres, la densité totale d'états a la forme :
4πV
(8) g (ε ) = ∑ g n (ε ) = 3 (2m ) ε 1 / 2
3/ 2

n h

La densité d'états réelle pour le cuivre est représentée dans la figure ci-dessous. On note
l'accumulation d'états vers -8 eV correspondant à la bande d.
Elle présente des discontinuités de van Hove pour les valeurs de ε correspondant à un vecteur k
nul ou pointant au centre d'une face de la première zone de Brillouin ( k = K / 2 ). De plus, au
voisinage du bas ou du haut de la bande n, cette densité a respectivement les formes
4πV
(
(9) g n (ε ) = 3 2m1∗n) 3/ 2
(ε − ε 1n )1 / 2
h
et
4πV
(10) g n (ε ) = (
2m2∗n ) (ε
3/ 2
2n −ε)
1/ 2

h3

Ces formes sont du même type que celle des électrons libres, les paramètres m1∗n et m2∗n étant les
masses effectives.

Surface de Fermi
Au zéro absolu, les électrons occupent tous les états d'énergie inférieure à une valeur ε F0 appelée
énergie de Fermi. La surface de l'espace réciproque telle que ε (k ) = ε F0 s'appelle surface de Fermi
et joue un rôle fondamental dans la compréhension détaillée des propriétés électroniques des
solides. Dans le cas d'électrons libres, cette surface est une sphère, appelée sphère de Fermi. Pour
les métaux alcalins, la surface de Fermi est presque sphérique, ce qui explique que le modèle
d'électrons libres est satisfaisant pour ces métaux. Pour les autres métaux, cette surface est
complexe et peut même délimiter des domaines séparés comprenant les états quantiques occupés
(figure ci-dessous).
Métal monovalent : cuivre.

Métal trivalent : aluminium. Pour ce métal, la surface de Fermi présente 4 nappes : la première est
identique à la première zone de Brillouin, la deuxième limite avec cette zone les états occupés, le
domaine intérieur étant vide, les troisième et quatrième nappes contiennent les autres états occupés.
Il existe diverses méthodes permettant de déterminer la forme de la surface de Fermi, la plus
puissante étant, de loin, celle reposant sur l'effet de Haas-van Alphen. En effet, L. Onsager (1952) a
établi que les oscillations du moment magnétique d'une substance en fonction de l'inverse du
champ magnétique ont dans le cas général l'expression particulière obtenue pour un gaz d'électrons
libres, soit :
 1  eh
(11) ∆  =
 B  AF
où AF est l'aire de la section droite maximum de la surface de Fermi par un plan normal à la
direction du champ magnétique.

En mesurant la période des oscillations pour diverses orientations du champ magnétique dans le
cristal, on peut retrouver la forme et les dimensions de la surface de Fermi.

Conductivité électrique
Hormis les supraconducteurs, les substances ne sont pas le siège de courant électrique en champ
nul. En champ non nul, certaines substances conduisent le courant et d'autres non. Ces dernières,
appelées isolants, sont celles dont les bandes d'énergie sont, au zéro absolu, soit entièrement
occupées par des électrons (bande pleine) soit entièrement inoccupées (bande vide). En effet, dans
une bande pleine, les états occupés par les électrons (indiscernables) restent les mêmes en présence
et en absence de champ appliqué. Il s'ensuit que les électrons des bandes pleines ne participent pas
au courant électrique.

Dans le cas d'électrons situés dans une bande partiellement pleine, le modèle de conduction
appliqué à un gaz d'électrons libres peut encore s'appliquer, les résultats généralisant ceux obtenus
précédemment. Ainsi, on montre que sous l'influence d'un champ électrique E, la valeur moyenne
au cours du temps de la quantité de mouvement d'un électron, n'est plus nulle mais a la valeur

(12) p = h k avec k = − E
h
où τ est le temps moyen entre deux collisions. Les états électroniques occupés de la bande sont
alors modifiés comme l'indique la figure ci-dessous et il apparaît un courant de densité
d 3 xd 3p d 3k
1
( )
V∫ ∫ 4π 3 v
(13) j = 2 − e v = − e
h3
où v est la vitesse de dérive d'un électron de vecteur d'onde k.

Notons que la valeur de k est très petite devant les dimensions de la première zone de Brillouin
et qu'en conséquence le domaine d'intégration peut être confondu avec le domaine des états
occupés en champ nul.

Pour relier v à k , nous remarquons que la vitesse v d'un électron de quantité de mouvement
p = hk s'obtient à partir de la relation de dispersion par
∂ε 1 ∂ε
(14) v (k ) = =
∂p h ∂k
relation qui est celle donnant la vitesse de groupe du paquet d'ondes décrivant un électron. On
obtient la vitesse de dérive d'un électron en écrivant (pour un solide supposé isotrope)
1 ∂ 2ε
v = v (k + k ) − v (k ) ≅ k
h ∂k 2
(15)
1 ∂ 2ε
= −eτ 2 E
h ∂k 2

e
Dans le cas d'un électron libre, soit ε = h 2 k 2 / 2m , on retrouve l'expression v = − τE . En
m
introduisant alors la notation
1 1 ∂ 2ε ∂ 2 ε
(16) ∗ = 2 =
m (k ) h ∂k 2 ∂p 2
la densité de courant prend la forme
d 3k 1
(17) j = e τ ∫ 3 ∗
2
E
4π m (k )

La quantité m ∗ (k ) qui caractérise la courbure de la relation de dispersion dans la bande n, a les


dimensions d'une masse et est appelée masse effective de l'électron de vecteur d'onde k. Dans le cas
d'électrons libres, la masse effective s'identifie à la masse de l'électron m. Au bas de la bande n,
cette masse effective est telle que
(18) m ∗ (k 1 ) = m1∗n
et, en haut de la bande, cette masse effective est négative et telle que
(19) m ∗ (k 2 ) = − m2∗n < 0

La conductivité σ n des électrons de la bande n est alors


j d 3k 1
(20) σ n = = e 2τ ∫ 3 ∗
E 4π m (k )
Pour une bande pleine, l'intégrale est nulle. Notons que la conductivité de la substance est la somme
des conductivités des bandes partiellement pleines et que, pour un gaz d'électrons libres ( m ∗ = m ),
ne 2
on retrouve l'expression σ = τ.
m

Les solides étant anisotropes, la masse effective et la conductivité sont en fait des tenseurs mij∗ et
σ ij d'ordre 2 tels que
∂ 2ε 1 ∂ 2ε
(
(21) m ∗−1 )
ij = = 2
∂p i ∂p j h ∂k i ∂k j
et

(22) σ ij = e 2τ ∫
4π 3
(
d 3 k ∗−1
m )
ij

Ces tenseurs prennent une forme proportionnelle à l'unité dans le cas d'une substance isotrope.

Trous
Supposons qu'une substance ait une bande d'énergie pleine à l'exception d'un état situé dans le haut
de cette bande. Nous allons voir que ses propriétés s'interprètent plus aisément en considérant une
particule fictive appelée trou.

En présence d'un champ électrique, la substance est le siège d'un courant de densité donnée par
(13), l'intégrale étant étendue à tous les états de la bande sauf celui qui est vide. L'intégral relative à
une bande pleine étant nulle, on a
j = 0(bande pleine) − j(état vacant )
(23)
= +e v
ce qui peut être interprété par l'existence d'un trou de charge +e remplaçant l'ensemble des électrons
de la bande (figure ci-dessous).
Un raisonnement analogue sur l'expression (17) de la densité conduit à
e 2τ
(24) j = − ∗ E
m (k )
ce qui peut être interprété par le fait que le trou a une masse mt = −m ∗ (k ) > 0 . Ce résultat justifie
l'expression de masse effective du trou employée plus haut.

Par ailleurs, l'énergie des électrons de la bande peut s'écrire


(25) U = ∑ N i ε i = U 0 − ε (état vacant )
où U 0 est l'énergie interne relative à la bande pleine. En terme de trou, cette égalité devient
(26) U = U 0 + ε (trou ) avec ε (trou ) = −ε (état vacant )

On voit que l'énergie des trous varie en sens inverse de celle des électrons (figure ci-dessous).
Lorsque dans les cas réels, le nombre d'états vacants d'une bande est relativement faible, il est
avantageux de décrire les propriétés de cette bande en considérant les trous au lieu des électrons.
Insistons sur le fait que les deux représentations s'excluent mutuellement pour une même bande.
Dans le cas où plusieurs bandes interviennent, on peut prendre la représentation en trous pour une
bande et en électrons pour l'autre. C'est le cas respectivement des bandes 3s et 3p du magnésium et
des bandes de valence et de conduction des semi-conducteurs. La conductivité totale du métal est
alors la somme des deux conductivités, celle des trous d'une bande et celle des électrons de l'autre
bande.

En présence de champ magnétique, les trous créent un champ de Hall opposé à celui des électrons
(figure ci-dessous).
Il en résulte que de nombreux métaux ont une constante de Hall positive alors que le modèle des
électrons libres prédit une constante négative. Seule la théorie des bandes et la notion de trous ont
permis de comprendre ce phénomène appelé effet Hall anormal.

Dans la représentation en termes de trous, on doit considérer la loi de répartition des trous dans les
différents niveaux d'énergie à une température T. La loi de répartition des électrons est donnée par
la fonction de Fermi n(ε ) . La loi de répartition des trous est donc

(27) nt (ε ) = 1 − n(ε ) =
1
exp β (ε t − µ t ) + 1
où µ t = − µ est le potentiel chimique des trous et ε t = −ε leur énergie. La loi de répartition des
trous est encore une loi de Fermi.
Exercices

Conductivité d'un métal à une dimension


On considère un cristal à une dimension d'arête a dont la seule bande qui puisse participer à la
conduction a la relation de dispersion ε = ε 0 sin 2 (ka / 2 ) .

1. Montrez que, au bas et en haut de la bande, la relation de dispersion est de la forme (15), (16)
de la section V.2.2 et déterminez les paramètres m1∗ et m2∗ .
2. Déterminez la masse effective m ∗ (k ) et déduisez-en l'expression de la conductivité σ en
fonction de k F , vecteur d'onde de Fermi;
3. Calculez k F puis σ pour un cristal libérant z électrons par atome. Discutez les cas z = 1 et z =
2.

Solution
1. En effectuant deux développements limités au voisinage de k1 = 0 (base de la bande) et de
k 2 = +π / a (haut de la bande), on obtient
a2 2
ε (k ) ≅ ε 0 k (k ≅ k1 = 0 )
4
(1)
  ka π   a2   π
ε (k ) = ε 0 1 − sin 2  −  ≅ ε 0 1 − (k − k 2 )2   k ≅ k 2 = 
  2 2   4   a

Les masses effectives de l'électron et du trou sont alors :


∗ ∗ 2h 2
(2) m1 = m2 =
ε 0a2
2. La masse effective m ∗ (k ) , donnée par (16) de la section V.2.3, vaut ici :
2h 2 m1∗
(3) m ∗ (k ) =
1
× =
ε 0 a 2 cos ka cos ka

On vérifie que m ∗ (0 ) = m1∗ et m ∗ (π / a ) = − m2∗ . Pour un modèle à une dimension, la


conductivité électrique s'écrit d'après (20) de la section V.2.3 :
dk 1 e 2τ
(4) σ = e 2τ ∫ × ∗
π m (k ) πm1∗ ∫
= dk cos ka

En intégrant entre − k F et + k F , on trouve


e 2τ 2 sin k F a
(5) σ =
m1∗ πa
3. La densité d'états électroniques du métal à une dimension est
(6) g (k )dk = 2 ×
Ldp L
= dk
h π

Tous les états tels que k < k F étant peuplés, on a :


L N π π
(7) zN = × 2k F , soit k F = z =z ×
π 2 L 2a
zN étant le nombre total d'électrons libérés.

Pour z = 1, on a k F = π / 2a et la bande est à moitié remplie. Le cristal est métallique et sa


conductivité est :
2e 2τ
(8) σ =
πam1∗

En notant que le nombre linéique d'électrons est n = N/L = 1/a, cette expression a la forme (11)
de la section V.6.3 du tome III où le changement m → πm1∗ / 2 a été effectué.
Pour z = 2, on a k F = π / a et la bande est pleine. Le cristal est isolant, sa conductivité étant
nulle. Les métaux divalents réels sont conducteurs à cause du recouvrement des bandes s et p.
V.2.4. Semi-conducteurs

Introduction
Les substances qui, au zéro absolu, ne présentent que des bandes d'énergie entièrement pleines ou
vides sont isolantes. Toutefois, à température non nulle, certains électrons quittent le haut de la
première bande pleine (bande de valence) pour le bas de la première bande vide (bande de
conduction) et la substance présente une faible conductivité dont la valeur varie avec ε g / kT où ε g
est la largeur de la bande interdite entre les bandes de valence et de conduction (figure ci-dessous).

Pour certaines substances, la valeur de ε g est assez grande et la conductivité est négligeable : c'est
le cas du diamant ( ε g = 5.5 eV ).

D'autres substances, pour lesquelles ε g est plus faible, ont une conductivité mesurable variant
rapidement avec la température : elles sont appelées semi-conducteurs intrinsèques comme, par
exemple, le silicium ( ε g = 1.1 eV ) et le germanium ( ε g = 0.7 eV ) situés au-dessous du diamant
dans le tableau périodique des éléments. Leurs atomes possèdent 4 électrons de valence ns 2 np 2 et
forment des cristaux covalents par mise en commun d'électrons en paires entre un atome central et
les quatre atomes qui l'entourent (figure (a) ci-dessous).

Lorsqu'un électron de valence passe dans la bande de conduction, il se crée un trou qui peut se
déplacer : la conductivité est alors la somme des deux contributions, l'une relative aux électrons de
la bande de conduction et l'autre aux trous de la bande de valence. Il existe aussi des corps
composés covalents semi-conducteurs : citons GaAs ( ε g = 1.4 eV ), InSb ( ε g = 0.16 eV ), constitués
d'atomes trivalents (Ga, In) et pentavalents (As, Sb).
Lorsque, dans un semi-conducteur intrinsèque, tétravalent par exemple, on substitue des atomes de
valence 3 ou 5 en faible proportion (un atome pour mille à un milliard), on obtient des semi-
conducteurs dopés ou extrinsèques. Lorsque l'on dope le semi-conducteur avec des atomes
pentavalents (par exemple du germanium dopé à l'arsenic), il apparaît un niveau d'énergie (niveau
donneur) au voisinage de la bande de conduction (figure (b) ci-dessus). Au zéro absolu, les quatre
premiers électrons de chaque atome dopant, engagés dans des liaisons de valence, peuplent la
bande de valence, le cinquième se trouvant sur le niveau donneur. Une faible excitation thermique
est suffisante pour libérer ce dernier et le faire passer dans la bande de conduction. Il apparaît alors
une conduction due essentiellement à ces électrons et peu sensible à la température. Ce type de
dopage est appelé dopage négatif ou dopage n.

Lorsqu'on dope le semi-conducteur intrinsèque tétravalent avec des atomes trivalents (par exemple
dopé au gallium), un niveau d'énergie (niveau accepteur) quitte la bande de valence (figure (c) ci-
dessus). Au zéro absolu, les trois électrons de valence de chaque atome dopant peuplent la bande de
valence et il existe une liaison incomplète correspondant à un trou dans le niveau accepteur. Une
faible excitation thermique suffit à faire passer un électron de valence sur ce niveau et à créer ainsi
un trou dans la bande de valence. Il apparaît alors une conduction due essentiellement à ces trous
(positifs) et peu sensible à la température. Ce type de dopage est appelé dopage positif ou dopage p.

Il est clair que ce mécanisme ne fonctionne que si les atomes dopant peuvent s'insérer dans le
réseau cristallin sans y provoquer de changement de structure majeur. Cela ne peut se produire que
si ces atomes dont d'une taille comparable à celui du semi-conducteur afin de pouvoir s'insérer dans
le réseau comme ci-dessus. On choisit donc des atomes dopant proches de l'atome semi-conducteur
dans le tableau périodique. Ainsi, on dope de préférence le silicium avec du phosphore
(pentavalent) ou de l'azote (trivalent).

En voyant les proportions de dopant, il est également clair que cela n'a de sens que si le matériau
semi-conducteur est lui-même initialement d'une très grande pureté. Ce genre de technologie n'a
donc pu se développer qu'après avoir mis au point des techniques de purification extrême. Une
méthode simple utilisée est par exemple la fusion partielle d'un barreau de silicium et le
déplacement de cette zone de fusion par simple déplacement du dispositif de chauffage, les
solubilités relatives des impuretés permettent alors d'entraîner celles-ci à une extrémité du barreau.
La simple répétition permet d'atteindre une pureté exceptionnelle.

Etude statistique des semi-conducteurs intrinsèques


Calculons tout d'abord les nombres volumiques nc d'électrons dans la bande de conduction et p v
de trous dans la bande de valence en fonction de l'énergie de Fermi ε F . Ces nombres sont donnés
par
1 ∞ 1 εv
(1) nc = ∫ g (ε )n(ε )dε et p v = ∫ g (ε )nt (ε )dε
V εc V −∞
où n(ε ) et nt (ε ) sont respectivement les fonctions de Fermi des électrons et des trous. La
contribution à ces intégrales provenant principalement des bords des bandes, la forme générale de
ces bandes importe peu et l'on peut prendre les expressions valables au bord des bandes. On a ainsi
pour le nombre volumique d'électrons
4π 3/ 2 ∞ (ε − ε c )1 / 2 dε
(2) nc = 3 (2mc ) ∫
h ε c exp[β (ε − ε )] + 1
F

Lorsque ε c − ε F est grand devant kT, la loi de Fermi peut être remplacée par sa limite de
Boltzmann et, après le changement de variable x 2 = β (ε − ε c ) , il vient
4π ∞
(3) nc = 3 (2mc kT ) exp β (ε F − ε c )∫ 2 x 2 e − x dx
3/ 2 2

h 0

L'intégral valant π 1 / 2 / 2 , on a finalement


(2πmc kT )3 / 2
(4) nc = g c (T ) exp β (ε F − ε c ) avec g c (T ) = 2
h3

La quantité g c (T ) est appelée densité d'états effective de conduction par unité de volume, la loi (4)
ayant la forme de la loi de Maxwell-Boltzmann pour un niveau de conduction unique d'énergie ε c .
De même, pour le nombre volumique de trous, on a
4π 3 / 2 εv (ε v − ε )1 / 2 dε
(5) p v = 3 (2mv kT ) ∫
− ∞ exp[β (ε
h F − ε )] + 1

Lorsque ε F − ε v est grand devant kT, un calcul analogue donne

(6) p v = g v (T ) exp β (ε v − ε F ) avec g c (T ) = 2


(2πmc kT )3 / 2
h3
g v (T ) étant appelé densité d'états effective de valence par unité de volume.

Remarquons que le produit nc p v est indépendant de ε F et a l'expression


(7) nc p v = g c (T )g v (T ) exp(− βε g )
où nous avons introduit la largeur de la bande interdite ε g = ε c − ε v . Notons que les résultats (4, 6,
7) sont également valables pour des semi-conducteurs extrinsèques pourvu que ε F soit éloignés de
plusieurs kT du bord des bandes.

La condition N = ∑ N i qui permet de déterminer le niveau de Fermi s'écrit, dans le cas d'un
conducteur intrinsèque
(8) p v = nc ≡ ni
car les trous de la bande de valence ont étés créés par le départ des électrons peuplant la bande de
conduction. En égalant (4) et (6), on trouve
(9) g x exp β (ε F − ε c ) = g v exp β (ε c − ε F )
d'où l'on tire
ε + ε v kT g v ε c + ε v 3kT mv
(10) ε F = c + ln = + ln
2 2 gc 2 4 mc

Nous voyons que le niveau de Fermi est voisin du milieu de la bande interdite (ε c + ε v ) / 2 car kT
est toujours petit devant la largeur ε g de cette bande.
Enfin, en reportant ε F dans (4, 6) ou en utilisant (7, 8), on obtient les nombres volumiques
d'électrons et de trous :

(11) ni ≡ nc = p v = 2
( 2πkT )
3/ 2
 ε 
(mc mv )3 / 4 exp − g 
3
h  2kT 

Ces nombres varient très rapidement avec T en raison du terme exponentiel. Pour le germanium, on
a trouvé expérimentalement (figure (a) ci-dessous) :
( )
(12) ni m −3 = 1.76 × 10 22 [T (K )] exp[− 4550 / T (K )]
3/ 2

en accord avec la forme (11) pour ε g / 2k = 4550 K , soit ε g = 0.784 eV .


Cependant, le germanium est tel que mc = mv = 0.6m et le facteur numérique expérimental est
alors 7.9 fois plus grand que la valeur théorique. On interprète ce désaccord en tenant compte de la
variation de la largeur de la bande interdite en fonction de la température. En effet, s'il y a une
variation linéaire de la forme
(13) ε g (T ) = ε g (0 ) − αT
il s'introduit dans la formule théorique (11) un facteur supplémentaire exp(α / 2k ) . L'accord est
trouvé en prenant α = 3.6 × 10 −4 eV K −1 , c'est-à-dire
(14) ε g (T )(eV ) = 0.784 − 3.6 × 10 −4 T (K )

La conductivité électrique des semi-conducteurs étant la somme des conductivités des électrons et
des trous, on a dans le cas intrinsèque
(15) σ = nc eµ c + p v eµ v = ni e(µ c + µ v )
où µ c et µ v sont les mobilités des électrons dans la bande de conduction et des trous dans la bande
de valence. Les mobilités, liées aux collisions des porteurs de charge (électrons ou trous) sur les
phonons, décroissent avec la température. Le nombre de porteurs présentant un facteur exponentiel,
c'est ce facteur qui reste prépondérant dans l'expression de σ et, de ce fait, la conductivité croît
avec la température (figure (b) ci-dessus).

Etude statistique des semi-conducteurs extrinsèques


Considérons pour la discussion un semi-conducteur dopé n possédant un seul niveau donneur et
déterminons son niveau de Fermi ainsi que le nombre volumique d'électrons dans la bande de
conduction en fonction de T. Pour cela, notons qu'au zéro absolu, le niveau donneur et la bande de
valence sont pleins, la bande de conduction étant vide. Aux autres températures, le nombre nc
d'électrons dans la bande de conduction est égal aux nombres de trous dans le niveau donneur et
dans la bande de valence, soit
gd
(16) nc ≡ g c (T ) exp β (ε F − ε c ) = + g v (T ) exp β (ε v − ε F )
exp β (ε F − ε d ) + 1

Pour résoudre en ε F cette équation, nous considérons successivement trois domaines de


température (figure ci-dessous).
a) pour kT << ε c − ε d , on peut négliger la contribution de la bande de valence et utiliser
l'approximation de Boltzmann pour le niveau donneur, soit
(17) g c (T ) exp β (ε F − ε c ) = g d (T ) exp β (ε d − ε F )
d'où l'on déduit :
ε + ε d kT g c β (ε d − ε c )
(18) ε F = c − et nc = ( g d g c ) exp
1/ 2
ln
2 2 gd 2

Au zéro absolu, nous retrouvons le fait que la bande de conduction est vide et nous voyons que
le niveau de Fermi est à mi-hauteur entre le niveau donneur et la bande de conduction.
b) Pour ε c − ε d < kT << ε c − ε v , on peut encore négliger la contribution de la bande de valence et
le terme exp β (ε F − ε d ) est négligeable. Il vient alors g c exp β (ε F − ε c ) = g d qui conduit à
gc
(19) ε F = ε c − kT ln et nc = g d
gd

Nous voyons que tous les électrons ont quitté le niveau donneur pour la bande de conduction.
Le semi-conducteur est dit être dans son domaine extrinsèque.
c) Lorsque la contribution de la bande de valence devient supérieure à celle du niveau donneur, on
peut négliger cette dernière et l'on se trouve dans le domaine intrinsèque du semi-conducteur
pour lequel ε F et nc sont donnés par (10, 11).

Le nombre volumique d'électrons de conduction nc est représenté dans la figure ci-dessous pour un
cas théorique proche de celui du germanium dopé à l'arsenic.

Le nombre volumique de trous de valence p v , donné par la loi d'action de masse (7), n'est
important que dans la zone intrinsèque où il est égal à nc . Le niveau de Fermi, qui reste voisin du
niveau donneur dans le domaine extrinsèque, se déplace rapidement vers le milieu de la bande
interdite lors du passage de la zone extrinsèque à la zone intrinsèque.
Dans le cas d'un dopage p, on trouve des résultats semblables, en permutant les rôles des électrons
et des trous et ceux des bandes de conduction et de valence. En pratique, un semi-conducteur n'est
jamais pur et contient toujours des impuretés diverses des deux types p et n. Il y a cependant
compensation partielle, des électrons des niveaux donneurs remplissant les niveaux accepteurs.
Dans son domaine extrinsèque, le semi-conducteur se comporte comme s'il était dopé n ou p
seulement s'il y a excès d'atomes donneurs ou accepteurs. Par ailleurs son comportement
intrinsèque se manifeste à température d'autant plus basse que sa pureté est grande.

Dans le domaine extrinsèque d'un semi-conducteur (cas b), la conduction est assurée par les
porteurs majoritaires (électrons pour un dopage n et trous pour un dopage p) et la conductivité
électrique
(20) σ = nc eµ c ou σ = p v eµ v
reste pratiquement constante (figure ci-dessous), sa variation n'étant due qu'à celle de la mobilité
µ c ou µ v des porteurs majoritaires en fonction de la température.
Cette propriété permet la mesure de µ c ou µ v en fonction de T si les taux de dopage ont été
mesurés par analyse chimique.

D'autres informations sur les semi-conducteurs peuvent être obtenues par la mesure de la constante
de Hall RH (figure ci-dessous).
En effet, celle-ci est donnée lorsqu'il y a deux types de porteurs de charge par
1 p v µ v2 − nc µ c2
(21) RH =
e ( p v µ v + n c µ c )2
formule que l'on peut trouver en généralisant les relations que nous avons vues. En particulier, les
points où la constante de Hall change de signe sont tels que pv / nc = (µ c / µ v ) . Dans le domaine
2

extrinsèque ( p v = 0 ou nc = 0 ), la constante de Hall se simplifie en


1 1
(22) RH = − ou RH =
nc e pv e
et le produit
(23) µ H ≡ RH σ = µ c ou µ v
permet, en principe, la détermination des mobilités. En fait, l'expression (21) de RH , obtenue dans
le modèle de Drude, est approchée et la quantité µ H , appelée mobilité de Hall, diffère des
mobilités des porteurs par un facteur de l'ordre de 1. Notons que la mobilité µ c des électrons est
généralement plus grande que celle des trous, µ v . Elles décroissent toutes deux avec la température
et sont, pour le germanium à 300 K par exemple, µ c ≅ 0.4 m 2 V −1s −1 et µ v ≅ 0.2 m 2 V −1s −1 .
Exercices

Semi-conducteur compensé
On considère un semi-conducteur possédant un niveau donneur et un niveau accepteur de
dégénérescences respectives tells que g d >> g a , dans le domaine de température où la bande de
valence n'intervient pas;

1. Décrivez le système au zéro absolu.


2. Ecrivez la relation déterminant ε F . Déduisez-en la relation permettant de déterminer nc ,
nombre d'électrons de conduction, en fonction de la température.
3. Calculez nc dans le domaine de température le plus bas. Précisez les limites de ce domaine
pour un échantillon tel que ε c − ε d = 0.0127 eV , mc = 0.6m , g d = 10 22 m −3 et g a = 10 20 m −3 .
4. Que vaut nc à température plus haute ?

Solution
1. Au zéro absolu, les bandes de valence et de conduction sont respectivement pleine et vide. Des
électrons excédentaires des atomes donneurs sont "piégés" dans les trous des atomes accepteurs
: il y a donc g d − g a électrons ou g a trous sur le niveau donneur, le niveau accepteur étant
saturé;
2. A toute température, le nombre d'électrons de la bande de conduction est égal au nombre de
trous du niveau donneur excédant g a . De même qu'en (16) de la section V.2.4, on obtient
gd
(1) nc = − ga
exp β (ε F − ε d ) + 1

En remplaçant exp βε F par nc exp βε c / g c (T ) d'après (18) de la section V.2.4, l'équation


déterminant nc est :
nc ( g a + n c )
(2) = g c exp β (ε d − ε c )
g d − g a − nc
3. Lorsque T  0, le second membre de (2), donc aussi nc , sont très petits et l'on a
g − ga
(3) nc = d g c exp β (ε d − ε c )
ga

Cette égalité est en fait valable tant que nc << g a , soit


g a2
(4) g c (T ) exp β (ε d − ε c ) <<
gd

Il s'ensuit que, numériquement, le domaine de validité est T < 20 K.


4. Au-dessus de 20 K, nc devient très grand devant g a . L'effet du niveau accepteur se trouve alors
négligeable ( g a << nc , g d ) et l'effet de compensation cesse. On retrouve alors les lois (18) et
(19) de la section V.2.4.
V.2.5. Jonctions de semi-conducteurs
Nous voudrions maintenant aborder la question suivante : que se passe-t-il lorsque l'on prend deux
morceaux de germanium ou de silicium dont les caractéristiques internes sont différentes, dont les
dopages diffèrent en nature ou en quantité, et qu'on les réunit de manière à former une "jonction" ?
Considérons d'abord ce qu'on appelle une jonction p-n dans laquelle nous avons d'un côté un semi-
conducteur de type p et de l'autre un semi-conducteur de type n, comme indiqué ci-dessous.

A vrai dire, il n'est guère possible de réunir des morceaux de cristaux disjoints de manière à obtenir
un contact uniforme au niveau atomique. En réalité, les jonctions sont faites d'un seul cristal que
l'on modifie différemment dans deux régions. Une méthode consiste à "ajouter" au liquide quelque
impureté de dopage adéquate, mais seulement après qu'une moitié du cristal soit déjà formée. Une
autre méthode consiste à enduire la surface du cristal d'une couche d'éléments d'impureté et à
chauffer ensuite le cristal, de sorte que certains atomes d'impureté diffusent à l'intérieur. La zone
transition entre les deux régions pour les jonctions réalisées par l'une ou l'autre de ces méthodes est
relativement floue, bien qu'on puisse arriver à des épaisseurs de l'ordre de 10 −4 centimètres.

Il existe des méthodes plus sophistiquées, notamment celles utilisées dans l'industrie micro-
électronique pour la conception de "puces" à semi-conducteurs pouvant contenir plusieurs centaine
de millier de jonctions de ce type sur une superficie de l'ordre du centimètre carré. Le principe,
dans les grandes lignes, consiste à recouvrir le cristal (pur ou préalablement dopé) d'une couche de
résine isolante. Puis, à l'aide d'un masque adéquat, on irradie cette couche de résine photosensible
avec un rayonnement ultraviolet afin de modifier la composition chimique de la résine dans les
zones que l'on désire modifier. Un acide permet alors d'enlever la résine ainsi altérée dégageant des
"fenêtres" très précises sur le cristal. Un gaz chaud contenant des atomes dopant est alors appliqué
pour que les impuretés puissent diffuser de manière contrôlée aux endroits appropriés. Une dernière
opération enlève la résine résiduelle. Cette opération peut être appliquée plusieurs fois pour
juxtaposer des zones de différents dopages et éventuellement des contacts métalliques aboutissant
ainsi à des circuits d'une extrême complexité. Les jonctions ainsi obtenues descendent au
micromètre voire au nanomètre.

Pour nos considérations ultérieures, nous imaginerons la situation idéale, dans laquelle les deux
régions du cristal se rejoignent le long d'une frontière nettement définie. Nous considérerons aussi
le fonctionnement dans le domaine extrinsèque. Il va de soit que si la température est trop élevée et
si l'ensemble du matériau passe en mode intrinsèque, il n'y a alors plus de différence de
comportement entre les zones p et n et la jonction cesse de jouer un rôle.

Du coté n de cette jonction, il y a des électrons libres qui peuvent se déplacer à leur guise et il y a
aussi des sites donneurs fixes qui équilibrent la charge électrique totale. Du coté p, il y a des trous
libres qui se déplacent à leur guise et un nombre égal de sites accepteurs négatifs qui assurent
l'équilibre des charges. C'est du moins l'état des choses avant que nous mettions les deux matériaux
en contact. Dès que nous les aurons réunis, la situation sera modifiée au voisinage de la frontière.
Lorsque les électrons du matériau de type n arrivent à la frontière, ils ne seront pas réfléchis vers
l'intérieur comme ils le seraient s'il s'agissait d'une surface libre. Ils peuvent pénétrer dans la région
de type p. Il y aura donc une certaine tendance à la diffusion de certains électrons du matériau de
type n vers le matériau de type p, dans lequel les électrons libres sont moins nombreux. Ceci ne
peut pas continuer indéfiniment, car au fur et à mesure que l'on perd des électrons du coté n, la
charge, positive, s'y accroît créant en fin de compte un potentiel électrique qui retarde la diffusion
des électrons vers le coté p. Parallèlement, les porteurs positifs, les trous, du matériau de type p
peuvent diffuser à travers la jonction vers le matériau de type n. Ce faisant, ils laissent derrière eux
un excès de charges négatives. Pour les conditions d'équilibre, le courant total de diffusion doit être
nul. Ceci est réalisé par les champs électriques qui s'établissent de manière à ramener les trous vers
le matériau de type p.

Les deux processus de diffusion que nous avons décrits ont cours simultanément et vous
remarquerez qu'ils agissent l'un et l'autre dans une direction qui amène le matériau de type n à se
charger positivement et celui de type p négativement. Du fait de la conduction finie du matériau
semi-conducteur, la zone de transition entre les potentiels de la région p et de la région n sera
relativement étroit de part et d'autre de la frontière. Chacun des blocs aura dans son ensemble un
potentiel relativement uniforme. Imaginons un axe x dans une direction perpendiculaire à la surface
de séparation. La charge électrique produite par la diffusion aura l'allure approximative indiquée
dans la figure (a) ci-dessous.
Par conséquent, le potentiel électrique variera le long de x comme indiqué dans la figure (b) ci-
dessus. Nous avons aussi montré dans la partie (c) de la figure, la variation attendue pour la densité
nc des électrons et la densité nv des trous. Typiquement, la hauteur de la marche de potentiel est à
peu près la hauteur de la bande interdite ε g , soit de 0.5 à 1 V, et la largeur de la zone de transition
est de l'ordre de 1 à 0.01 micron pour des dopages allant de 10 20 à 10 24 m −3 . Loin de la jonction, les
densités nc et nv doivent être simplement les densités que l'on attendrait pour les blocs de
matériaux pris individuellement aux conditions d'équilibre pour la même température. Notons que
sur la figure on a pris l'exemple d'une région de type p avec un dopage plus important que celui de
la région de type n. Du fait du gradient de potentiel à la jonction, les trous doivent escalader une
colline de potentiel pour atteindre le coté de type n. Ceci implique que pour les conditions
d'équilibre, il ne peut y avoir autant de porteurs positifs dans le matériau de type n qu'il y en a dans
le matériau de type p. Nous souvenant des lois de la mécanique quantique, nous nous attendons à ce
que le rapport entre les densités de trous, d'un coté et de l'autre, soit donné par l'équation suivante :
n (n )
(1) v = e −eV / kT
nv ( p )

Le produit eV au numérateur de l'exponentielle est simplement l'énergie nécessaire pour faire


franchir à la charge une différence de potentiel V.

Nous avons une équation tout à fait semblable pour les densités d'électrons :
n ( p)
(2) c = e −eV / kT
nc (n )

Si nous connaissons les densités dans chacun des deux matériaux pour les conditions d'équilibre,
nous pouvons utiliser l'une ou l'autre des équations ci-dessus pour déterminer la différence de
potentiel à travers la jonction.

Notez que les équations (1) et (2) ne donneront une même valeur pour la différence de potentiel V
qu'à la condition que le produit nc nv soit le même pour le coté p et pour le coté n. Mais nous avons
vu que ce produit ne dépend que de la température et de l'énergie du gap (la bande interdite) du
cristal (produit égal à ni2 ). Les deux équations sont donc compatibles, donnant une même valeur
pour la différence de potentiel pourvu que les deux cotés du cristal soient à la même température.

Du fait de la différence de potentiel entre les deux côtés de la jonction, la chose ressemble à une
batterie. Si nous branchons un fil, une extrémité sur le coté n et l'autre sur le côté p, peut-être
obtiendrons-nous un courant électrique. Ce serait assez bien, car le courant s'écoulerait
indéfiniment sans rien consommer et nous aurions une source infinie d'énergie, en violation des lois
de la physique ! Cependant, si vous branchez un fil, entre le coté p et le coté n, il n'y a pas de
courant. Et la raison est facile à voir. Imaginons d'abord un fil fait d'un matériau non dopé. Quand
nous branchons ce fil à la région de type p, nous constituons une jonction. Il y aura une différence
de potentiel au travers de cette jonction. C'est, mettons, juste la moitié de la différence potentiel
entre le matériau de type p et celui de type n. Quand nous branchons notre fil non dopé à la région
de type n, il y a aussi une différence de potentiel à cette jonction, à nouveau la moitié de la chute de
potentiel à travers la jonction p-n. Les différences de potentiel aux diverses jonctions s'ajustent de
manière à ce qu'il n'y ait pas de flux de courant dans le circuit. Quelle que soit la nature du fil que
vous utilisez pour réunir les deux côtés de la jonction p-n, vous constituez deux nouvelles jonctions
et, pour autant que toutes ces jonctions soient à la même température, les sauts de potentiels aux
jonctions se compensent les uns les autres et aucun courant ne s'établira dans le circuit. Cela se voit
clairement sur les équations (1) et (2), elles ont un caractère cyclique, on vérifie aisément qu'avec
plusieurs jonctions en boucles le potentiel total doit être zéro, il suffit pour cela de multiplier, par
exemple les équations de type (1), pour chaque jonction. La multiplication doit donner 1 (les
densités de trous s'éliminant dans le produit) et donc V (total) = 0. Si l'on note les régions 1, 2, …n
(pour un nombre n quelconque de jonctions et de régions de type p, n ou non dopées), le produit
aura la forme
n(1) n(2 ) n(n ) − eV / kT − eV / kT
L = e 1 e 2 L e −eVn / kT
n(2 ) n(3) n(1)
− e (V1 +V2 +LVn ) / kT
(3) = e = e −eVt / kT = 1
⇒ Vt = 0

Il apparaît cependant que les courants s'établiront si certaines des jonctions sont à des températures
différentes des autres, ce que la relation (3) permet de calculer. Certains jonctions seront chauffées
par ce courant, d'autres seront refroidies et l'énergie thermique sera transformée en énergie
électrique. Cet effet est responsable du fonctionnement des thermocouples que l'on utilise pour
mesurer les températures et du fonctionnement des générateurs thermoélectriques. Il est à noter que
des semi-conducteurs ne sont pas nécessaires. L'effet se produit aussi avec des métaux pourvu que
les densités d'électrons libres soient différentes dans les différents métaux. Cet effet est aussi utilisé
pour la fabrication de petits réfrigérateurs ou pour alimenter certaines sondes spatiales à très longue
durée de vie (et devant s'éloigner trop fortement du soleil pour en exploiter l'énergie lumineuse), la
source de chaleur étant alors fournie par un simple matériau radioactif.

Si nous ne pouvons pas mesurer la différence de potentiel entre les deux côtés d'une jonction p-n,
comment pouvons-nous être vraiment sûrs que le gradient de potentiel indiqué sur la figure ci-
dessus existe ? Une méthode consiste à exposer la jonction à la lumière. Quand les photons de
lumière sont absorbés, ils peuvent produire une paire électron-trou. Dans le champ électrique
intense qui existe à la jonction (égal à la pente importante de la courbe de potentiel), le trou sera
attiré vers la région de type p et l'électron vers la région de type n. Si les deux côtés de la jonction
sont maintenant réunit à un circuit extérieur, ces charges supplémentaires alimenteront un courant.
L'énergie de la lumière sera transformée dans la jonction en énergie électrique. C'est le principe des
panneaux photovoltaïques qui alimentent certaines centrales, habitations ou satellites.

Dans notre discussion sur le fonctionnement d'une jonction de semi-conducteur, nous avons
supposé que les électrons et les trous agissent plus ou moins indépendamment, à cela près qu'ils
s'arrangent pour établir l'état d'équilibre. Quand nous décrivions le courant produit par exposition
de la jonction à la lumière, nous supposions qu'un électron ou un trou produit dans la région de la
jonction arriveraient dans le sein du cristal avant d'être annihilé par le porteur de polarité opposée.
Dans le voisinage immédiat de la jonction, où la densité des porteurs et à peu près égale, l'effet
d'annihilation électron-trou (que l'on désigne souvent par "recombinaison") est un effet important
qu'il faut considérer avec soin dans une analyse détaillée des jonctions semi-conducteurs. Nous
avons supposé qu'un trou ou un électron produits au voisinage d'une jonction ont une bonne chance
d'arriver dans le sein du cristal avant d'être recombinés. Le temps nécessaire pour qu'un électron ou
un trou trouvent un partenaire et s'annihilent, se situe typiquement dans le domaine allant de 10 −3 à
10 −7 seconde. Ce temps, incidemment, est beaucoup plus long que le temps moyen entre deux
collisions avec des sites de diffusion, pour le type de cristal que nous avons utilisé dans l'analyse de
la conductivité. Dans une jonction p-n typique, le temps pour qu'un électron ou un trou formé dans
la région de la jonction soit expédié au sein du cristal est en général beaucoup plus court que le
temps de recombinaison. La plupart des paires contribueront donc au courant extérieur. Un moyen
d'améliorer le rendement est de créer des jonctions très fines, comme expliqué plus haut, ainsi la
variation du potentiel est plus abrupte et donc le champ électrique plus intense. Les porteurs sont
donc plus rapidement repoussés vers les zones sans porteurs de charge opposée et ils ont, en outre,
une région de transition plus fine à traverser.
V.2.6. Redressement du courant à une jonction de semi-conducteurs
Nous voudrions maintenant montrer comment une jonction p-n peut agir comme redresseur. Si
nous mettons un voltage à travers une jonction, un courant très intense s'établira si la polarité est
dans une direction et il y aura par contre un courant très faible si le même voltage est appliqué dans
la direction opposée. Si un voltage alternatif est appliqué à travers la jonction, le courant s'établira
principalement dans une direction, le courant est "redressé". Regardons à nouveau ce qui se passe
pour les conditions d'équilibre décrites par le graphique de la figure précédente. Dans le matériau
de type p, il y a une forte concentration nv de trous. Ces porteurs se déplacent ça et là, et, à chaque
seconde, certains d'entre eux s'approchent de la jonction. Ce courant de trous qui s'approchent de la
fonction est proportionnel à nv . Cependant, la plus part d'entre eux sont rejetés en arrière par la
forte colline de potentiel à la jonction. Seule la fraction e − eV / kT réussit à traverser. Il y a aussi un
courant de trous s'approchant de la jonction depuis l'autre coté. Ce courant est, lui aussi,
proportionnel à la densité de trous dans la région de type n, mais cette densité est ici beaucoup plus
faible que la densité du coté de type p. Quand les trous s'approchent de la jonction à partir du coté
de type n, ils y trouvent une colline de pente négative et ils descendent immédiatement cette pente
en direction du coté de type p. Désignons ce courant par I 0 . A l'équilibre, les courants pour les
deux directions sont égaux. Nous devons donc avoir la relation suivante :
(1) I 0 ~ nv (n ) = nv ( p )e − eV / kT

Vous noterez que cette équation est en fait exactement la même que l'équation (1) de la section
précédente. Nous l'avions simplement établie d'une manière différente.

Supposez maintenant que nous diminuions le voltage du coté n de la jonction d'une quantité ∆V ,
ce que nous pouvons réaliser en appliquant à la jonction un potentiel extérieur. La différence de
potentiel à travers la colline de potentiel n'est plus V mais V − ∆V . Le courant de trous passant du
coté p au coté n, aura cette nouvelle différence de potentiel dans son facteur exponentiel. Désignant
ce courant par I 1 , nous avons
(2) I 1 ~ nv ( p )e − e (V −∆V ) / kT
Ce courant est plus grand que I 0 par un facteur qui est exactement e e∆V / kT . Nous avons entre I 0 et
I 1 la relation suivante :
(3) I 1 = I 0 e + e∆V / kT

Le courant en provenance du coté p s'accroît exponentiellement en fonction du voltage extérieur.


Par contre, le courant des trous en provenance du coté n reste constant, tant que ∆V n'est pas trop
élevé. Quand ces trous s'approchent de la barrière, ils continuent d'y trouver une pente de potentiel
descendante et ils tombent tous du coté p. Si ∆V était plus grand que la différence naturelle de
potentiel V, la situation deviendrait autre, mais nous n'analysons pas ce qui se passe pour ces
potentiels élevés. Le courant total I des porteurs positifs qui passent au travers de la jonction est
alors la différence entre les courants provenant de l'un et de l'autre coté :
( )
(4) I = I 0 e e∆V / kT − 1

Le courant total I des trous va vers la région de type n. Un fois là, les trous diffusent au sein de la
région n où ils sont finalement annihilés par les porteurs majoritaires de type n, les électrons. Les
électrons perdus du fait de cette annihilation seront compensés par un courant d'électrons provenant
de la borne électrique branchée sur le matériau de type n.

Quand ∆V est nul, le courant total donné par (4) est nul. Pour ∆V positif, le courant s'accroît
rapidement en fonction du voltage appliqué. Pour ∆V négatif, le courant change de signe, mais le
terme exponentiel devient rapidement négligeable et le courant négatif ne dépasse jamais I 0 , ce
qui, dans le cadre de nos hypothèses, est assez faible. Ce courant inverse I 0 est limité par la faible
densité des trous du coté n de la jonction.

Si vous refaites exactement la même analyse pour le courant d'électrons qui traversent la jonction
d'abord sans potentiel extérieur et ensuite avec une faible différence de potentiel appliquée ∆V ,
vous obtiendrez à nouveau une équation tout à fait semblable à (4) pour le courant total d'électrons.
Le courant total étant la somme des contributions dues à chacun des deux types de porteurs,
l'équation (4) restera vraie pour le courant total, si du moins l'on identifie I 0 au courant maximum
qui peur circuler lorsque le voltage est inversé.
La courbe caractéristique courant - voltage de l'équation (4) est donnée dans la figure ci-dessous.

Elle montre le comportement typique des diodes à l'état solide, telles que celles qui sont utilisées
dans les circuits imprimés. Il nous faut remarquer que l'équation (4) n'est vraie que pour des faibles
voltages. Lorsque les voltages sont du même ordre ou plus grands que la différence de voltage
interne naturelle V, d'autres effets interviennent et le courant n'obéit plus à cette simple équation.

En particulier, lorsque la tension inverse devient trop grande, la diode laisse à nouveau passer le
courant en raison d'un phénomène d'avalanche (l'accumulation des porteurs finit par modifier le
potentiel naturel et ces porteurs franchissent la jonction). Le courant se met alors à croître très
violemment, ce qui peut détruire la diode. On peut toutefois adapter la structure et les paramètres de
la diode pour qu'elle supporte ce fort courant inverse. Ce phénomène est utilisé dans la diode Zener
comme régulateur de tension.

Un autre phénomène peut intervenir. Nous avons dit qu'en mode inverse, les trous et les électrons
pouvaient franchir la barrière s'ils avaient une énergie suffisante, ce qui se traduit par le facteur
e − eV / kT . Toutefois, les porteurs d'énergie plus faibles peuvent aussi traverser toute la zone n ou la
zone p par effet tunnel. Cet effet peut devenir prépondérant si la diode est conçue pour avoir une
des deux zones particulièrement fine. Ce mécanisme peut jouer le même rôle que dans la diode
Zener. On les appelle parfois "diodes tunnels".

Plus haut nous avons signalé qu'en mode direct les porteurs traversaient la barrière et se
recombinaient avec les porteurs majoritaires dans l'autre région. Ce mécanisme d'annihilation
dissipe de l'énergie (à peu près la largeur de la bande interdite) qui peut se retrouver sous forme de
phonons et échauffent le matériau. Mais cette énergie peut être aussi libérée sous forme de photons,
du moins si le matériau est transparent ou assez fin. C'est le mécanisme inverse de celui décrit plus
haut pour les cellules photoélectriques ou photovoltaiques. Ce phénomène peut être utilisé pour
réaliser des diodes luminescentes (LED) pour des afficheurs numériques ou, plus récemment, pour
des écrans plats.

Avec une conception appropriée la diode peut même émettre un rayonnement laser ce qui en fait
des sources lasers extrêmement compactes utilisées, par exemple, dans les lecteurs DVD.
V.2.7. Le transistor
L'application la plus importante des semi-conducteurs est sans doute le transistor. Le transistor
consiste en deux jonctions de semi-conducteurs très voisines l'un de l'autre. Son fonctionnement
repose en partie sur les mêmes principes que ceux que nous venons de décrire au sujet de la diode à
semi-conducteurs. Imaginez que nous construisions une petite barre de germanium avec trois
régions distinctes, une région de type p, une région de type n et une autre région de type p, comme
indiqué dans la figure (a) ci-dessous.

Cette combinaison s'appelle un transistor pnp. Chacune des deux jonctions dans le transistor aura
un comportement très semblable à celui que nous avons décrit dans la section précédente. En
particulier, il y aura un gradient de potentiel à chaque jonction, avec une chute de potentiel de la
région de type n vers chaque région de type p. Si les deux régions de type p ont les mêmes
propriétés internes, la variation du potentiel le long du cristal se présentera comme indiqué par le
schéma de la figure (b) ci-dessus.

Imaginons maintenant que nous connections chacune des trois régions à des sources de potentiel
extérieures comme indiqué dans la partie (a) de la figure ci-dessous.
Nous mesurerons tous les voltages à partir de l'électrode reliée à la région p de gauche, laquelle sera
donc par définition au potentiel zéro. Nous appellerons cette électrode l'émetteur. La région de type
n, appelée la base, est reliée à un potentiel légèrement négatif. La région de type p à droite, appelée
collecteur, est connectée à un potentiel un peu plus fortement négatif. Dans ces conditions, la
variation du potentiel le long du cristal se présente comme indiqué par le graphique de la figure (b)
ci-dessus.

Voyons d'abord ce qui arrive aux trous dont le comportement décidera, pour l'essentiel, du
fonctionnement du transistor pnp. Puisque l'émetteur est à un potentiel légèrement plus positif que
la base, il s'établira un courant de trous allant de la région de l'émetteur à celle de la base. Ce
courant sera relativement grand car nous avons une jonction soumise à un "voltage dans le bon
sens". Dans ces conditions, les trous seront "émis" par la région de type p vers la région de type n.
Vous pourriez penser que ce courant va s'écouler hors de la région n par l'électrode de la base.
Cependant, c'est là qu'intervient le secret du transistor. Le transistor est construit de manière à ce
que la région de type n soit extrêmement mince, typiquement de l'ordre de 10 −3 à 10 −5 cm ou
moins, beaucoup plus étroite que ses dimensions transversales. Il en résulte que les trous qui
pénètrent dans la région n ont une très bonne chance d'atteindre l'autre jonction avant d'être
annihilés par les électrons de la région de type n. Lorsqu'ils atteignent la frontière de droite de la
région n, ils y trouvent un potentiel à forte pente descendante et ils tombent donc immédiatement
dans la région de type p sur la droite. Ce coté du cristal est appelé collecteur car il "collecte" les
trous après leur diffusion à travers la région n. Dans un transistor typique, la quasi-totalité du
courant de trous qui provient de l'émetteur et entre dans la base est collectée dans la région du
collecteur. Seule une fraction de l'ordre du pour-cent contribue au courant total de la base. La
somme des courants de la base et du collecteur est, bien sûr, égale au courant de l'émetteur.

Essayez maintenant d'imaginer ce qui se passe si nous varions légèrement le potentiel Vb de


l'électrode reliée à la base. Comme nous sommes sur une partie à forte pente de la courbe, une
petite variation du potentiel Vb provoquera un assez grand changement dans le courant de
l'émetteur I e . Comme le voltage du collecteur Vc est beaucoup plus négatif que le voltage de la
base, ces faibles variations du potentiel n'affecteront pas sensiblement la falaise abrupte de potentiel
entre la base et le collecteur. Ainsi, quand nous faisons varier le potentiel de l'électrode de la base,
une variation correspondante affecte le courant du collecteur I c . Cependant le point essentiel
consiste en ce que le courant de base I b reste toujours une faible fraction du courant du collecteur.
Le transistor est un amplificateur. Un faible courant I b introduit dans l'électrode de la base donne
un fort courant, quelque chose comme 100 fois plus grand à l'électrode du collecteur.

Et les électrons que nous avons négligés jusqu'à présent ? Notez d'abord que nous ne nous
attendons à aucun courant notable d'électrons entre la base et le collecteur. Avec un voltage négatif
élevé sur le collecteur, les électrons de la base auraient à escalader une très haute falaise d'énergie
potentielle et la probabilité qu'ils y arrivent est très faible. On a là une diode en mode inverse et il y
a un très faible courant d'électrons vers le collecteur.

Par contre, les électrons dans la base peuvent passer dans la région de l'émetteur. De fait, vous
pourriez vous attendre à un courant d'électrons dans cette direction qui soit comparable au courant
de trous qui va de l'émetteur vers la base. Un tel courant d'électrons n'est pas utile, il est même au
contraire nuisible car il accroît le courant total de la base nécessaire pour une valeur donnée du
courant de trous vers le collecteur. Le transistor est donc conçu de manière à minimiser le courant
d'électrons vers l'émetteur. Le courant d'électrons est proportionnel à nc (base ) , c'est-à-dire à la
densité d'électrons libres dans le matériau de la base. Par contre, le courant de trous vers l'émetteur
dépend de nv (émetteur ) , densité de trous dans la région de l'émetteur. En utilisant un dopage
relativement faible dans le matériau de type n, on peut rendre nc (base ) beaucoup plus faible que
nv (émetteur ) . Le fait que la région de la base soit très fine aide aussi beaucoup car le déplacement
rapide des trous de cette région vers le collecteur accroît de façon sensible le courant moyen de
trous de l'émetteur vers la base, tandis que le courant d'électrons n'est pas affecté par cela. Le
résultat global est que l'on peut faire en sorte que le courant d'électrons à travers la jonction
émetteur - base soit beaucoup plus faible que le courant de trous et qu'ainsi les électrons ne jouent
pas de rôle notable dans le fonctionnement du transistor pnp. C'est essentiellement le mouvement
des trous qui détermine les courants et le transistor agit comme un amplificateur selon le
mécanisme décrit plus haut.

Il est possible également de faire un transistor où les matériaux de type p et de type n soient
intervertis. On a alors ce qu'on appelle un transistor de type npn. Dans un transistor de type npn les
principaux courants sont portés par les électrons qui s'écoulent de l'émetteur vers la base et de là
vers le collecteur. De toute évidence, tous les raisonnements que nous avons fait à propos du
transistor pnp s'appliquent aussi au transistor npn avec une inversion des rôles électrons - trous, si
les potentiels sur les électrodes sont choisis avec des signes opposés.

Les transistors ont l'avantage d'être très petits et avec une durée de vie plus grande que les anciens
tubes à vides. Cet avantage a permis un véritable boum de l'électronique.
Les tubes à vides restent toutefois utiles dans des circonstances extrêmes (courant élevés,
températures élevées,…). Même si de grands progrès ont été réalisés avec la fabrication de
composants capables de subir des courants élevés tel que les transistors de puissance ou les
thyristors.

Le transistor que nous avons décrit s'appelle "transistor bipolaire". On a également développé
d'autres types de composants tel que le MOS. C'est une bande de matériau de type n ou p avec un
étranglement et une "grille" isolée du matériau (figure ci-dessous).

Le potentiel appliqué à la grille modifie le potentiel dans le canal entre l'émetteur et le collecteur
pouvant ainsi moduler ou bloquer le courant.

Les avantages du MOS sont la simplicité de fabrication et l'isolement de la base donnant ainsi des
courants de fuite extrêmement faibles. Ils ont aussi un facteur d'amplification (tension - courant)
pouvant être très grand.

Il est souvent intéressant de pouvoir connecter la sortie d'un transistor (collecteur) à l'entrée (base)
de nombreux transistors. Si le courant dans la base est trop élevé, cela limite le nombre de
composants qui peuvent être alimentés par la sortie du transistor (cela s'appelle le fan out). Avec les
MOS on peut ainsi brancher un nombre considérable de transistors en sortie d'un autre transistor.

Il est très facile de construire des circuits effectuants des opérations logiques (par exemple un
circuit ne débitant en sortie que si deux entrées sont alimentées, effectuant ainsi une opération
"ET"). Les MOS s'y prêtent particulièrement (notamment avec le CMOS constitué d'un MOS de
type p et d'un de type n associés ensembles ce qui peut se construire de manière très compacte. Si
l'on ajoute les possibilités de placer de très nombreux composants sur une petite puce comme
expliqué précédemment, voilà l'acte de naissance des circuits intégrés dont des mémoires pouvant
contenir dans un seul minuscule boîtier des capacités se chiffrant en gigaoctets (huit milliards de
bits, c'est-à-dire d'unités d'information stockée dans des transistors) et des microprocesseurs
capables d'effectuer des informations extrêmement complexes en des temps se chiffrant en
quelques milliardièmes de seconde. Ces capacités et rapidités extrêmes dans des circuits
minuscules ont entraîné un boum considérable de l'informatique professionnelle, domestique et
ludique. L'apparition de microprocesseurs dans des appareils variés (jouets, automobiles, machines
à laver et même de simples diffuseurs de parfum). Et une expansion considérable des techniques de
communication avec le téléphone portable et ses successeurs.
Exercices de compréhension
1. Soit un réseau réciproque bidimensionnel carré d'arête b = 2π / a . Un électron libre a un
vecteur d'onde k' de composantes 0.6b et -0.8b. A quelle zone de Brillouin appartient-il et quel
est le vecteur k correspondant de la première zone de Brillouin ?

Réponse : n = 4 et k = -0.4b , 0.2b.


2. On considère un cristal bidimensionnel carré d'arête a dans lequel chaque atome libère z
électrons supposés libres. Montrez que k F = (z / 2π ) b où b = 2π / a est l'arête du réseau
1/ 2

réciproque. Combien de zones de Brillouin différentes sont coupées par le cercle de Fermi pour
z = 1, 2 et 4.

Représentez la courbe ε = ε F0 dans la première zone de Brillouin dans les trois cas et indiquez
les zones ε < ε F0 .

Réponse : n = 1, 2, 4.
3. Tracez les quatre premières zones de Brillouin d'un réseau réciproque rectangulaire de côtés b
et 2b.
4. Montrez que le rayon de la sphère de Fermi d'un gaz d'électrons libres pour un réseau cubique à
faces centrées (4 atomes par maille d'arête a) est k F = b(3 z / 2π ) avec b = 2π / a . Pour
1/ 3

quelles valeurs de z la sphère de Fermi a) contient complètement et b) est contenue


complètement dans la première zone de Brillouin. On donne ΓL = (3 / 16 ) b et
1/ 2

ΓN = (5 / 16 ) b .
1/ 2

Réponse : a) z ≥ 3 et b) z ≤ 2 .
5. Calculez la densité d'états g (ε ) pour le modèle à une dimension de l'exercice 1 avec z = 1.
Déduisez-en à l'aide de (59) de la section V.6.2 du tome III la capacité calorifique électronique
cV .
Réponse : cV / R = 2πkT / 3ε 0 .
6. Déterminez le vecteur d'onde et la vitesse d'un trou résultant de l'absence d'un électron de
vecteur d'onde k et de vitesse v.

Réponse : -k et -v.
7. Comparez le nombre volumique d'électrons de conduction et la conductivité du germanium aux
même grandeurs relatives aux métaux.
8. Montrez que l'énergie interne volumique d'un semi-conducteur intrinsèque a pour expression
U = U (T = 0 ) + ε g ni (T ) où ni est donné par (11) de la section V.2.4. Déduisez-en l'expression
de la capacité calorifique volumique cV de l'échantillon. Envisagez ce même problème pour un
semi-conducteur extrinsèque.
9. Résolvez, dans le cas d'un semi-conducteur extrinsèque dopé n, l'équation (16) de la section
V.2.4 déterminant l'énergie de Fermi ε F dans le domaine de température où la contribution de
la bande de valence est négligeable. Déduisez-en l'expression de nc , nombre volumique
d'électrons de conduction. Retrouvez les cas limites (18) et (19).
10. On considère une jonction p-n. Montrez que la différence de potentiel au niveau de la jonction
est
ε g kT g c g v
(1) V ≡ Vn − V p = − ln
e e gd ga

Calculez cette valeur à 300 K pour g a = g d = 10 22 m −3 , g c = g v = 2 × 10 21 T 3 / 2 m −3 et


ε g = 0.68 eV .

Réponse : V = 0.3 V.
VI. Le magnétisme

VI.1. Théorie des ensembles de Gibbs

VI.1.1. Description microscopique d'un système de particules en


interaction
La méthode statistique que nous avons utilisée jusqu'ici permet d'interpréter avec succès un certain
nombre de phénomènes physiques. Toutefois nous n'avons considéré que des problèmes pouvant se
ramener à des modèles traitant de particules sans interaction pour lesquels l'opérateur hamiltonien
Ĥ est la somme de termes ĥi relatifs chacun à une particule, soit
N
(1) Hˆ = ∑ hˆi
i =1

c'est-à-dire pour lesquels U = ∑ N i ε i . Lorsque les interactions doivent être prises en compte, on
doit étendre la méthode élémentaire. C'est indispensable dans toute une série de systèmes physiques
où ces interactions jouent un rôle non négligeable voire majeur comme dans le magnétisme que
nous allons bientôt aborder. En particulier, il faut rediscuter la façon selon laquelle l'état
microscopique (ou quantique) des systèmes doit être décrit. Nous allons ainsi repasser en revue
quelques aspects importants de la mécanique quantique que nous avons déjà vus avant de revenir à
la physique statistique.

Cas d'un gaz de particules


Considérons le cas d'un gaz de N particules n'ayant que des degrés de liberté de translation. Dans le
cadre de la mécanique classique, l'état de ce gaz peut être décrit à chaque instant par les 6N
variables r1 , p1 , …, rN , p N représentant les positions et impulsions des particules. L'énergie
correspondante est
N
p2
(2) E = ∑ i + V (r1 , K, rN )
i =1 2 m
le terme V représentant l'énergie d'interaction. Au cours du temps, les coordonnées et les
impulsions des particules varient et le point caractéristique de l'état du système se déplace dans un
espace des phases à 6N dimensions où la densité d'états quantiques g est donnée par
N
1 N d 3ri d 3p i
(3) g (r1 , p1 , K, rN , p N )∏ d 3 ri d 3 p i = ∏ h3
i =1 N ! i =1

Dans cette densité g, on reconnaît un facteur en 1 / h 3 pour chaque particule ainsi que le facteur
d'indiscernabilité correspondant aux N! états physiques identiques obtenus en permutant les
coordonnées et impulsions des N particules entre elles.

Cette description "semi-classique" est utilisée lorsque les effets liés à la nature quantique des
particules (fermions ou bosons) n'interviennent pas. Dans le cas contraire, on doit appliquer la
méthode générale de description des systèmes quantiques ci-dessous.

Cas d'un système de moments magnétiques localisés


Considérons le cas d'un système de N ions magnétiques de spin S placés aux nœuds d'un réseau.
L'ensemble des N nombres quantiques mi (i = 1, …, N et − S ≤ mi ≤ S ) caractérisant la projection
du spin de chaque atome sur un axe de quantification définit un état du système
(4) r ≡ m1 , K, mi , K, m N

Les (2 S + 1) états de ce type forment une base de l'espace d'états quantiques du système. A chaque
N

instant, le système se trouve dans un état ψ , superposition des états de base


(5) ψ = ∑ c r r avec c r = r ψ et ∑c =1
2
r
r r

Il évolue au cours du temps conformément à l'équation de Schrödinger



(6) ih ψ = Hˆ ψ
∂t
où l'opérateur hamiltonien Ĥ a la forme
( )
N
(7) Hˆ = gµ B ∑ Sˆ i ⋅ B + Vˆ Sˆ 1 , K , Sˆ i , K , Sˆ N
i =1

Dans cet hamiltonien, le premier terme représente l'interaction des moments magnétiques avec le
champ magnétique B et le second représente leurs interactions mutuelles. Les opérateurs vectoriels
Ŝ i sont définis à partir de leurs composantes par
(8) Sˆ m , K , m , K , m = m m , K , m , K , m
zi 1 i N i 1 i N

(9) Sˆ ±i m1 , K , mi , K , m N = J (J + 1) − mi (mi ± 1) m1 , K , mi ± 1, K , m N
avec
(10) Sˆ ±i = Sˆ xi ± iSˆ yi

Rappelons que dans le cas d'un spin S = 1/2, les matrices de Pauli
 0 1 0 − i 1 0 
(11) σˆ x =   σˆ y =   σˆ z =  
 1 0 i 0   0 − 1
permettent de représenter les opérateurs Ŝ par
1
(12) Sˆ = σˆ
2

Cas d'un système quantique quelconque


Dans le cas général, l'état quantique ψ d'un système quelconque peut être décomposé sur une
base d'états r (r = 1, 2, …) et son évolution au cours du temps est régie par l'équation de
Schrödinger (6). Le choix de la base d'états, effectué selon le cas, se porte généralement sur la base
propre d'un opérateur  (ou de plusieurs). Dans le cas du système de moments magnétiques, la
base choisie est la base propre commune aux N opérateurs Sˆ z1 , …, Ŝ zi , …, Ŝ zN . On envisage
souvent la base des états propres de l'hamiltonien Ĥ définis par
(13) Hˆ r = E r r
C'est la base des états stationnaires dont l'énergie est E r .

Dans le formalisme de la mécanique quantique, on montre que toute l'information relative à un


système est contenue dans un opérateur hermitique ρ̂ appelé opérateur (ou matrice) densité et
vérifiant la condition de normalisation
(14) Tr ρˆ ≡ ∑ r ρˆ r = 1
r

Dans les problèmes où une fonction d'onde peut être définie (systèmes isolés par exemple),
l'opérateur densité est le projecteur sur l'état ψ caractérisant le système et a pour expression
(15) ρˆ = ψ ψ

Dans ce cas, et dans ce cas seulement, l'opérateur densité vérifie ρˆ 2 = ρˆ et l'on a


(16) ρ rs ≡ s ρˆ r = c s∗ c r

L'opérateur densité joue un grand rôle en thermodynamique statistique et dans la décohérence


quantique.
VI.1.2. Mesure d'une grandeur
Lorsque l'on mesure une grandeur A relative à un système quantique se trouvant à un instant donné
dans l'état ψ , on obtient un quelconque des valeurs propres Ar de l'opérateur  associé à A avec
2
= rψ
2
la probabilité c r , r étant l'état propre de  correspondant à la valeur propre Ar :
(1) Aˆ r = Ar r

La mesure d'une grandeur revêt donc un caractère probabiliste de nature quantique. La valeur
moyenne A du résultat de la mesure est
A =∑ rψ Ar = ∑ r ψ ψ r Ar
2

r r

(2) = ∑ r ρˆAr = ∑ r ρˆAˆ r


r r

( )
= Tr ρˆAˆ
et son écart type est donné par
[
(3) ∆A = A 2 − A ]
2 1/ 2
avec A 2 = Tr ρˆAˆ 2 ( )
Rappelons que nous avons aussi
(4) A = ψ Aˆ ψ

Par ailleurs, lorsque l'on considère un système à l'équilibre contenant un grand nombre de
particules, celui-ci change continuellement d'état quantique du fait des interactions avec les parois
du récipient, avec le thermostat,… Le résultat de la mesure d'une grandeur A, déjà de nature
probabiliste pour des raisons quantiques, est également distribué selon une loi de probabilité liée à
l'évolution du système au cours du temps (figure ci-dessous).
Un processus de mesure, même qualifié d'instantané, dure en fait un temps τ extrêmement long à
l'échelle moléculaire. La valeur moyenne du résultat de la mesure est donnée par
1 t +τ
(5) A ≡ ∫ A dt
τ t

et don écart type par


[
(6) σ A = A 2 − A 2 ]
1/ 2

Nous montrerons toutefois par la suite que le rapport σ A / A varie en 1 / N . A la limite


thermodynamique ( N → ∞ ), les fluctuations sur les grandeurs mesurées sont donc négligeables, en
accord avec l'observation.
Le résultat de la mesure d'une grandeur A découle donc de deux processus de moyenne, l'un
d'origine quantique, l'autre lié à l'évolution temporelle. Ceci justifie l'utilisation des méthodes
statistiques pour l'étude de systèmes composés d'un grand nombre de particules. De tels systèmes
ne peuvent alors être décrits que par la donnée des probabilités statistiques Pr de trouver le système
dans l'état r . Le résultat de la mesure d'une grandeur A a alors la forme
(7) A = ∑ Pr Ar
r

Ainsi, l'énergie interne U d'un système est donnée par


(8) U ≡ E = ∑ Pr E r
r
et l'entropie est définie par
(9) S = − k ∑ Pr ln Pr
r
expression que nous justifierons plus loin.

Il n'existe pas de méthode permettant de déterminer la loi de probabilité Pr à partir de l'équation de


Schrödinger étant donné que les systèmes considérés possèdent un très grand nombre de degrés de
liberté. On a donc été amené à la suite de J.W. Gibbs à postuler la forme de la loi de probabilité Pr .

Notons que plus généralement, les systèmes sont décrits par un opérateur (ou matrice) densité
statistique ρ̂ généralisant l'opérateur densité quantique et tel que
( )
(10) A = Tr ρˆAˆ avec ρˆ + = ρˆ et Tr ρˆ = 1

La relation (7) n'est valable que si l'opérateur densité statistique est diagonal sur une base propre de
l'opérateur  , auquel cas on a ρ rr = Pr et ρ rs = 0 ( r ≠ s ).
Exercices

Matrice densité quantique d'une particule de spin 1/2 prise parmi deux
On considère un système isolé de deux particules de spin 1/2 (identiques ou non) dans un des états
triplets + + , ( + − + − + ) / 2 , − − ou singulet ( + − − − + ) / 2 et on s'intéresse plus
particulièrement à l'état de la première de ces particules.

1. Calculez pour chacun des 4 états la valeur moyenne quantique et l'écart-type quantique des trois
opérateurs de spin Sˆ ≡ σˆ / 2 relatifs à la première particule.
2. Vérifiez sur la valeur moyenne du résultat de la mesure des composantes du spin de la première
particule que la matrice densité quantique de cette dernière vaut respectivement (1 + σˆ z ) / 2 ,
1/2, (1 − σˆ z ) / 2 et 1/2 pour les 4 états considérés. 1 représente ici la matrice unité 2x2.
3. Montrez que, dans le cas où ρˆ 2 = ρˆ , l'état de la première particule peut être décrit par une
fonction d'onde que l'on écrira.

Solution
1. La propriété (9) de la section VI.1.1 des opérateurs S ± = S x ± iS y montre que les valeurs
moyennes S ± et S ±2 calculées à l'aide de la relation (4) de la section V.1.2 sont nulles. La
propriété (8) de la section VI.1.1 permet de calculer S x et S x2 . On obtient finalement le
tableau suivant

Etat ++ + − + −+
−− + − − −+
2
2

Sx = Sy 0 0 0 0
∆S x = ∆S y 0 0 0 0
{S z } 1/2 0 -1/2 0
S z2 1/4 1/4 1/4 1/4
∆S z 0 1/2 0 1/2

2. En notant que
(1) Tr σˆ i = 0 et Tr σˆ iσˆ j = 2δ ij
( )
on vérifie que S i = Tr ρˆSˆ i ≡ Tr ( ρˆσˆ i ) / 2 pour les quatre états. Montrons comment l'on obtient
l'expression les matrices densité ρ̂ proposées. Les conditions d'hermiticité et de normalisation
(10) de la section VI.1.2 restreignent la forme de l'opérateur densité à
(2) ρˆ = (1 + a xσˆ x + a yσˆ y + a z σˆ z ) / 2 ≡ (1 + a ⋅ σˆ ) / 2 (a réel)

La propriété S x = S y = 0 entraîne a x = a y = 0 pour chacun des quatre états en vertu de (2)


de la section VI.1.2 et des propriétés de trace des matrices de Pauli. La valeur de S z entraîne
que l'on a respectivement a z = 1, 0, -1, 0, d'où les 4 formes de la matrice densité.
3. On vérifie que l'on a ρˆ 2 = ρˆ dans les deux états + + et − − pour lesquels la première
particule est dans l'état déterminé + et − respectivement ( ∆S = 0 ). Dans les deux autres cas
pour lesquels ρˆ 2 ≠ ρˆ , la particule 1 se trouve dans chacun des deux états + et − avec la
probabilité 1/2. Toutefois, aucune fonction d'onde du type ψ = α + + β − ne peut rendre
compte des valeurs de S et de ∆S . L'utilisation de la matrice densité est alors nécessaire.
VI.1.3. Postulat de la thermodynamique statistique
Pour étudier la forme des lois de probabilité, J.W. Gibbs a introduit la notion d'ensembles
statistiques. Il s'agit d'ensembles dont les éléments, en nombre immense, sont des systèmes
identiques au système étudié et soumis aux mêmes contraintes et paramètres externes. Dans ces
ensembles statistiques, on fait l'hypothèse que tous les états quantiques du système étudié sont
réalisés à chaque instant par un nombre d'éléments proportionnel à Pr . Le résultat de la mesure
d'une grandeur relative au système s'identifie alors à la valeur moyenne de la grandeur sur les
éléments d'un ensemble de Gibbs.

L'étude de ces ensembles a permis de déterminer certaines propriétés de la loi de probabilité Pr et


d'énoncer le postulat fondamental de la thermodynamique statistique : tous les états accessibles à
un système caractérisés par le même nombre de particules, la même énergie, les mêmes paramètres
externes et satisfaisant aux mêmes contraintes sont réalisés avec la même probabilité.

Ce postulat généralise, pour un système quelconque, le premier postulat de la théorie élémentaire


qui dit : tous les états microscopiques accessibles à un système isolé sont également probables. Il
dit en particulier que la probabilité Pr n'est fonction que du nombre de particules N du système, de
son énergie E r des paramètres externes (volume, champ magnétique, …) et de la nature des
contraintes (système isolé ou non, système fermé ou non, …).

Il est à noter que ce postulat est à rapprocher de l'hypothèse ergodique qui dit qu'un système de ce
type évolue au cours du temps en passant aléatoirement par tous les états microscopiques et, par
conséquent, une moyenne temporelle ( A ) est identique à une moyenne sur tous les états pondérés
par une probabilité d'occurrence. Dans le cas de systèmes très particuliers, "pathologiques", cette
hypothèse peut souffrir d'exceptions. Il convient alors de déterminer dans la mesure du possible les
sous-ensembles regroupant les états que le système peut atteindre au cours de son évolution.

Nous allons par la suite déterminer à partir de ce postulat les lois de probabilité Pr dans le cas de
trois ensembles :
 L'ensemble microcanonique, associé à un système fermé et isolé (N et U fixés).
 L'ensemble canonique, associé à un système fermé placé au contact d'un thermostat de
température T (N et T fixés).
 L'ensemble grand canonique, associé à un système ouvert pouvant échanger des particules avec
un réservoir de particules de potentiel chimique µ et placé au contact d'un thermostat de
température T ( µ et T fixés).

Les propriétés thermodynamiques des systèmes étudiés ne dépendent pas du type des contraintes (T
ou U fixé, N ou µ ) et donc de l'ensemble utilisé. Le choix de l'ensemble se fait donc selon le
problème physique étudié pour des raisons de simplicité.
VI.1.4. Ensemble microcanonique
Dans l'ensemble microcanonique, on considère un système isolé et fermé, c'est-à-dire tel que
l'énergie E et le nombre N de particules sont constants, et dont les paramètres externes V, B, etc.,
sont fixés. D'après le postulat énoncé ci-dessus, tous les états quantiques (microscopiques) sont
aussi probables les uns que les autres.

Soit alors W (E , N , V , B, K) , en bref W (E ) , le nombre total d'états quantiques accessibles au


système dans les conditions qui lui sont imposées. La probabilité de réalisation de chacun des états
est alors
(1) Pr = 1 / W (E ) avec ∑ Pr = 1
r
et la valeur mesurée d'une grandeur A est donnée par
(2) A = ∑ Ar / W (E )
r

En particulier, l'énergie interne et l'entropie valent


(3) U = ∑ Pr E r = E × ∑ Pr = E
r r
et
(4) S = − k ∑ Pr ln Pr = k ∑ Pr ln W (E ) = k ln W (E )
r r

Cette dernière expression est semblable à la relation de Boltzmann. Elle en diffère cependant par le
fait que la relation (4) donne l'entropie d'un système dans son état d'équilibre en fonction du
nombre total d'états d'énergie E accessibles au système, soit W (E ) , alors que la relation de
Boltzmann fait intervenir la probabilité thermodynamique W d'un état microscopique quelconque
(y compris hors équilibre). Le nombre W (E ) est en fait la somme de toutes les probabilités
thermodynamiques W. Cependant, à la limite thermodynamique le nombre W (E ) diffère peu de
Wmax , probabilité thermodynamique à l'équilibre. Cette similitude donne une justification a
posteriori de la définition ci-dessus de l'entropie.
La relation (4) permet donc d'obtenir à partir de W (E ) ≡ W (E , N , V , B, K) l'entropie d'un système à
l'équilibre en fonction de l'énergie E, identique à l'énergie interne U pour un système isolé, et en
fonction du nombre de particules N et des paramètres externes V, B, …, soit S (U , N , V , B, K) .
Cette fonction exprimée dans ses variables naturelles suffit à déterminer les propriétés de la
substance. Toutefois, l'expression de W (E ) , et donc celle de l'entropie, est extrêmement difficile à
obtenir dès que les particules ont des interactions non négligeables. C'est pour cette raison que l'on
n'utilise l'ensemble microcanonique que pour les systèmes de particules sans interaction. Les
résultats obtenus sont identiques à ceux obtenus par les méthodes que nous avons employées
jusqu'ici. Lorsque l'on ne peut pas négliger les interactions entre particules, on utilise d'autres
ensembles pour lesquels de nombreuses méthodes de calcul ont été développées.

Notons pour finir que, l'énergie des systèmes étant quantifiée, on est amené à considérer pour
W (E ) le nombre d'états d'énergie comprise entre E et E + δE où δE est une énergie de l'ordre d'un
quantum d'énergie. Les résultats physiques ne sont pas, à la limite thermodynamique, affectés par la
valeur de δE .
Exercices

Gaz parfait dans l'ensemble microcanonique


1. Calculez l'extension τ du domaine de l'espace des phases à 6N dimensions délimitant les états
accessibles à un gaz parfait de N particules identiques contenu dans un récipient de volume V et
d'énergie inférieure à E. Le volume d'une sphère de rayon r à d dimensions est égal à
π d / 2 r d / Γ(d / 2 + 1) où la fonction gamma, définie par

(1) Γ( x ) = ∫ t x −1e −t dt
0

est telle que Γ( x + 1) = x! lorsque x est entier et telle que


1
(2) ln Γ( x + 1) = x ln x − x + ln 2πx + O 
1
2  x
2. Ecrivez le nombre Φ(E ) d'états quantiques différents du gaz contenus dans ce domaine et en
déduire le nombre W (E ) d'états quantiques du gaz dont l'énergie est comprise entre E et
E + δE , où δE est une énergie très inférieure à E, voisine du quantum d'énergie cinétique
h 2 / 8mV 2 / 3 .
3. Calculez numériquement Φ(E ) et W (E ) pour un gaz monoatomique de masse molaire
M = 4 g mole −1 , contenant N = 2.5 × 10 22 atomes, ayant l'énergie E = 150 J et occupant le
volume V = 1 l (approximativement un litre d'hélium dans les conditions normales).
4. Exprimez l'entropie S du système à la limite thermodynamique N → ∞ , V → ∞ , E → ∞ avec
V/N et E/N constants.
5. Déduisez-en l'expression des fonctions U et S en variables T, V et N.

Solution
1. Les 6N dimensions de l'espace des phases étant notées r1 , p1 , …, rN , p N , le domaine cherché
est défini par :
(3) ri = ( xi , y i , z i ) ∈ V pour i =1, …, N
et
p 12 p2 1
(4)
2m
+L+ N =
2m 2m i
∑ p i2 ≤ E

Son extension est donc


N
(7) τ = ∫ ∏ d 3ri d 3p i = ∏ ∫ d 3 ri × ∫ ∏ d 3p i
i =1 i i

Dans cette expression, la première intégrale vaut V et la seconde est le volume d'une sphère à N
dimensions de rayon (2mE ) . On a donc
1/ 2

π 3 N / 2V N (2mE )3 N / 2
(8) τ =
Γ( 32N + 1)
2. Dans l'espace des phases relatif à N particules, la densité d'états est égale à 1 / h 3 N N ! d'après (3)
de la section VI.1.1, le terme N! tenant compte de l'indiscernabilité des particules. Le nombre
d'états Φ(E ) est donc
τ V N (2πmE )
3N / 2
(9) Φ(E ) = =
h 3 N N! h 3 N N !Γ( 32N + 1)
et le nombre W (E ) est alors
∂Φ
(10) W (E ) = Φ (E + δE ) − Φ(E ) = δEΦ (E )
3N
δE =
∂E 2E

Notons que W (E ) varie très rapidement avec E : W (E ) ~ E 3 N / 2 .


3. Les valeurs numériques de Φ(E ) et W (E ) sont extrêmement grandes. Aussi nous calculons
leur logarithme. En utilisant la formule de Stirling, nous avons
ln Φ(E ) = N ln 3 (2πmE ) − N ln + N − ln 2πN −
V 1 3 N 3N 3N 1
+ − ln 3πN
3/ 2
ln
h 2 2 2 2 2
(11)
V  4πmE 
3/ 2
5N 1
= N ln 3   + − ln 6π 2 N 2
Nh  3 N  2 2
Numériquement, nous avons terme à terme :
(12) ln Φ(E ) = 3.15 × 10 23 + 6.25 × 10 22 − 53.6

Nous voyons que le dernier terme, facteur égal à 5.2 × 10 −24 dans la valeur de Φ(E ) , est
négligeable dans cette expression. De même, nous avons
 3N 
ln W (E ) = ln Φ(E ) + ln δE 
(13)  2E 
= 3.78 × 10 23 + 219

Le second terme est négligeable devant le premier, ce qui justifie le fait que l'on emploie
indifféremment W (E ) ou Φ(E ) .
4. D'après la relation (4) de la section V.1.4, on a
1  3N  1
δE  + ln Φ (E ) ≅ ln Φ(E )
S 1
(14) = ln
Nk N  2 E  N N
d'où, d'après le résultat du point 3 :
 4πmE 
3/ 2
S V 5N
(15) = N ln   +
k Nh 3  3N  2

Notons que S/Nk a une forme intensive, tous les termes négligés étant au plus en (ln V ) / N ou
(ln N ) / N .
5. Le système étant isolé, on a U = E et l'expression (15) donne S en variables U, N et V. On
introduit la température par la relation de thermodynamique classique
1  ∂S 
(16) =  
T  ∂U  N ,V
soit ici
1 ∂S
(17) = (E = U ) = 3 Nk × 1
T ∂E 2 U
Nous en déduisons l'expression de l'énergie interne d'un gaz parfait (monoatomique)
U = 3NkT / 2 déjà obtenu en (19) de la section I.3.4.2. En reportant dans (15), on retrouve
l'expression de l'entropie S(T,V,N) déduite en (22) de la section I.3.4.2 à l'aide de la méthode
élémentaire. Ces deux fonctions thermodynamiques permettent aussi d'exprimer l'énergie libre
F(T,N,V) du gaz.
VI.1.5. Ensemble canonique

Distribution canonique
Lorsque l'on étudie des systèmes fermés n'échangeant pas de travail avec l'extérieur (paramètres V,
B, … constants) mais pouvant échanger de la chaleur avec un thermostat de température T, on se
place dans le cadre de l'ensemble canonique. Au sens de Gibbs, les éléments de cet ensemble sont
des systèmes tous identiques soumis aux mêmes contraintes de température T, de nombre de
particules N, de volume V,…, mais pour lesquels l'énergie E, le potentiel chimique, la pression,…
varient au cours du temps.

Nous nous proposons de déterminer la loi de probabilité Pr de réalisation d'un état quantique r.
Cette loi est appelée distribution canonique. Pour cela, utilisons les résultats de l'ensemble
microcanonique en considérant le système isolé et fermé constitué du système étudié et du
thermostat que l'on supposera suffisament grand pour que son énergie soit toujours bien supérieure
à celle du système (figure ci-dessous).

Le système total est isolé et a donc une énergie constante E 0 égale à la somme des énergies du
système étudié et du thermostat ainsi que de l'énergie d'interaction des particules de l'un avec les
particules de l'autre. Pour des systèmes suffisamment grands, ces interactions, localisées à la
surface de contact avec le thermostat, sont négligeables en comparaison des énergies propres au
thermostat et au système étudié. En conséquence, lorsque ce dernier se trouve dans l'état r d'énergie
E r , le thermostat a l'énergie E ′ = E0 − E r et peut se trouver dans l'un des W ′(E ′) = W ′(E 0 − E r )
états accessibles pour cette énergie. Le système total a donc un nombre total d'états accessibles égal
à W0 (E0 ) = ∑r W ′(E 0 − E r ) . Comme le système total est isolé, tous ses états sont équiprobables et
la probabilité que le système étudié soit dans l'état r est
W ′(E0 − E r ) W ′(E 0 − E r )
(1) Pr = =
W0 ( E 0 ) ∑r W ′(E0 − E r )
Pour expliciter cette probabilité, on effectue un développement limité en utilisant le fait que E r est
très inférieur à E 0 . Toutefois, la fonction W ′(E ′) variant très rapidement avec E ′ , c'est son
logarithme que nous développons au premier ordre, soit
 ∂ ln W ′ 
(2) ln W ′(E 0 − E r ) = ln W ′(E0 ) − E r   +L
 ∂E ′  E ′= E0

D'après l'entropie du système microcanonique, ln W ′(E 0 ) est l'entropie S ′(E 0 ) du thermostat


d'énergie E 0 divisée par k. Il s'agit donc d'une constante indépendante de E r . De même, nous
avons
 ∂ ln W ′  1  ∂S ′  1
(3)   =   = ≡β
 ∂E ′  E ′= E
0
k  ∂E ′  E ′= E
0
kT
où T est la température du thermostat. Il vient finalement
(4) ln W ′(E0 − E r ) = ln W ′(E 0 ) − βE r
soit
(5) W ′(E 0 − E r ) = W ′(E 0 )e − β Er

En reportant dans l'expression (1), nous obtenons la distribution canonique donnant la probabilité
Pr de réalisation d'un état r d'énergie E r :
e − β Er
(6) Pr = avec Q N = ∑ e − β Er
QN r
La quantité Q N , appelée fonction de partition canonique, assure que la distribution canonique est
normalisée. Elle dépend des paramètres caractérisant l'état du système : nombre de particules N,
température T, paramètres externes (V, B, …).

La distribution canonique a la même forme que la loi de distribution de Maxwell-Boltzmann.


L'argument suivant en donne la raison. L'ensemble canonique contient un grand nombre de
systèmes identiques, tous en contact avec un thermostat de température T (figure (a) ci-dessous).

On peut cependant remarquer que pour chacun des systèmes, le rôle de thermostat peut être joué
par l'ensemble de tous les autres systèmes (figure (b) ci-dessus). On peut alors considérer
l'ensemble canonique comme un système thermodynamique isolé et fermé, constitué des systèmes
précédents considérés à leur tour comme des "particules" macroscopiques localisées sans
interaction. La statistique de Maxwell-Boltzmann, appliquée à ce "gaz de particules", permet de
retrouver la distribution canonique, les états d'énergie des "particules" considérées ici étant les états
d'énergie des systèmes : ε i → E r .

Notons enfin que la matrice densité statistique s'écrit


e−β H
ˆ

(7) ρˆ = avec Q N = Tr e − β H
ˆ

QN
cette expression généralisant la loi de probabilité (6).

Fonctions thermodynamiques
L'énergie interne U et l'entropie S d'un système peuvent maintenant être explicitées à partir de leurs
expressions fondamentales. On a respectivement
1 ∂ ln Q N
(8) U ≡ E = ∑ Pr E r = ∑E e β − Er
=−
∂β
r
r QN r

et
(9) S = − k ∑ Pr ln Pr = k ∑ Pr (β E r + ln Q N ) =
U
+ k ln Q N
r r T

A l'aide de ces deux fonctions, on peut écrire l'énergie libre F du système dans ses variables
naturelles T, N, V, … sous la forme
(10) F = U − TS = −kT ln Q N

On sait alors que toutes les propriétés thermodynamiques du système peuvent être obtenues à l'aide
de la relation différentielle
(11) dF = − SdT + µdN − PdV − MdB + L

On a ainsi
∂F ∂
(12) P = − = kT (ln Q N ) et M = − ∂F = kT ∂ (ln QN )
∂V ∂V ∂B ∂B

En explicitant la fonction de partition canonique à l'aide de (6), il vient pour la pression


∂E ∂E ∂E
− β r exp(− β E r ) = −∑ r = − r
kT
(13) P =
QN r
∑ ∂V r ∂V ∂V
et de même pour le moment magnétique
∂E
(14) M = − r
∂B

Ces deux formes mettent en évidence la nature de valeur moyenne de la pression et du moment
magnétique. Notons enfin que la capacité calorifique à volume constant est donnée par :
 ∂U  2 ∂ ln Q N
2
(15) CV =   = kβ
 ∂T V ∂β 2
Fluctuations
La mesure des grandeurs thermodynamiques est le résultat d'un processus de moyenne. Nous
pouvons maintenant calculer la fluctuation sur certaines de ces grandeurs, en particulier sur
l'énergie interne. Pour cela, nous calculons E r2 . Nous avons
1 1 ∂ 2 QN
(16) E r =
2

QN r
∑ Er e = Q ∂β 2
2 − β Er

N
et nous en déduisons l'écart type δU sur la mesure de l'énergie :
2
1 ∂ 2QN 1  ∂Q  ∂ 2 ln Q N
(17) (δU ) =E −E = − 2  N  =
2 2 2

Q N ∂β Q N  ∂β ∂β 2
r r 2

En utilisant l'expression (8) de l'énergie interne, cet écart type devient


∂U ∂U
(18) (δU ) = − = kT 2 = kT 2 CV
2

∂β ∂T
où CV est la capacité calorifique du système. La fluctuation relative sur l'énergie interne vaut donc
δU

δU
=
(kT 2
CV
=N
)
1/ 2
 NkT 2 CV 
−1 / 2
1/ 2 1/ 2
−1 / 2  RT cV 
2
(19)
U U  U2  = N
  
 u 2 
Er    
où u et cV sont l'énergie interne et la capacité calorifique molaire du système. Le rapport intensif
RT 2 cV / u 2 est généralement de l'ordre de l'unité (pour un gaz parfait monoatomique avec
cV = 3R / 2 , ce rapport vaut 2/3) ce qui montre que la fluctuation relative est de l'ordre de 1 / N et
est extrêmement faible pour des systèmes macroscopiques contenant N ~ 10 23 particules.
Exercices

La statistique de Maxwell-Boltzmann à partir de la distribution canonique


On considère un système de N particules identiques et discernables ne présentant pas d'interaction
entre elles. Calculez la fonction de partition canonique Q N en fonction de la fonction de partition
relative à une particule Z et retrouvez l'expression de l'énergie libre en statistique de Maxwell-
Boltzmann.

Solution
Un état r du système est caractérisé par la donnée des états i1 , i2 , K , i N de chacune des particules.
En notant ε (i ) ≡ ε i l'énergie d'une particule dans l'état i, l'énergie E r de l'état r du système a pour
expression :
(1) E r = ε (i1 ) + ε (i 2 ) + L + ε (i N )

La fonction de partition canonique s'écrit alors


(2) Q N = ∑∑ L ∑ exp(− β E r )
i1 i2 iN

L'énergie E r étant additive, on a


(3) Q N = ∑ exp[− βε (i1 )]× L × ∑ exp[− βε (i N )]
i1 iN

Les N sommes intervenant dans Q N sont égales entre elles et représentent la fonction de partition
relative à une particule Z, d'où
(4) Q N = Z N

L'énergie libre s'écrit alors


(5) F = − kT ln Q N = − NkT ln Z
en accord avec l'expression obtenue par la théorie élémentaire en statistique de Maxwell-
Boltzmann.

Energie libre d'un gaz parfait monoatomique


Calculez la fonction de partition canonique Q N d'un gaz parfait monoatomique. On négligera les
états électroniques excités. En déduire l'expression de l'énergie libre du gaz.

Solution
La fonction de partition a pour expression
− β E (r1 ,p1 ,K )
N
(6) Q N = Tr e − β H = ∫ g (r1 , p 1 , K)∏ d 3ri d 3 p i e
ˆ

i =1
où l'énergie E et la dégénérescence g sont donnés par (2), (3) de la section VI.1.1 avec
V (r1 , K , rN ) = 0 (gaz parfait). L'expression de E étant une somme, on a :
VN N
(7) Q N =
N !h 3 N
∏∫d
i =1
3
pie
− β pi2 / 2 m

Les intégrales étant toutes identiques et égales à (2πmkT )


3/ 2
, on obtient
N
avec Z = 3 (2πmkT )
Z V
(8) Q N =
3/ 2

N! h

L'expression de Z est la fonction de partition de translation à une particule. L'expression de Q N


s'applique à un gaz parfait quelconque.

L'énergie libre F s'obtient à l'aide de la relation (10) de la section VI.1.5. On obtient ainsi
 V (2πmkT )3 / 2 
(9) F = − NkT ln + 1
 N h3 
expression identique à celle obtenue par la méthode élémentaire.
Moment magnétique et susceptibilité
En utilisant l'expression (7) de la section VI.1.1 de l'hamiltonien, montrer que le moment
magnétique et la susceptibilité molaire d'un système de N spins sont donnés par
1
(10) M M = − Ngµ B ∑ S i et χ M = Nµ 0
N i
g 2 µ B2 1
kT
(
× ∑ Si S j − Si S j
N i, j
)
Solution
En utilisant l'expression (14) de la section VI.1.5 de M et celle de l'hamiltonien, il vient :
N ∂ Er 1
(11) M M = − = − Ngµ B ∑ S i
N ∂B N i
où l'on a d'après (7) de la section VI.1.5 :
1
(12) S i = Tr S i ρˆ = Tr S i e − β H
ˆ

QN

La susceptibilité est donnée par


∂M M N ∂S
(13) χ M = µ 0 = − µ 0 gµ B ∑ i
∂B N i ∂B
avec
∂Si β ∂Hˆ − β Hˆ 1 ∂Q N
=− − 2 Tr S i e − β H
ˆ
Tr S i e
∂B QN ∂B Q N ∂B
gµ B ∂ ln Q N
(14) = −
kT
∑ Tr S S
j
i j ρˆ −
∂B
Si

gµ B gµ B
=−
kT
Si S j +
kT
∑S
j
j Si

On obtient ainsi le résultat (10). Notons que l'on a S i = S j et que la quantité S i S j − S i S j est la
fonction de corrélation des spins i et j qui ne dépend que de leur position relative. Dans le cas où la
substance n'est pas isotrope, les relations (10) s'appliquent à chaque composante et χ est alors de
nature tensorielle.

Fluctuation de la pression d'un gaz monoatomique parfait


Dans un gaz monoatomique parfait, les niveaux d'énergie de translation des atomes varient avec le
volume V comme V −2 / 3 . Retrouvez à l'aide de (13) de la section VI.1.5 l'équation d'état des gaz
parfaits et déterminez la fluctuation sur la pression du gaz. Les résultats sont-ils valables pour un
gaz parfait di ou polyatomique ?

Solution
L'énergie du gaz étant la somme des énergies de translation des atomes, les énergies E r varient
aussi comme V −2 / 3 , d'où ∂E r / ∂V = −2 E r / 3V . Il vient alors
∂E r 2 2 NkT
(15) P ≡ P = − = Er = U=
∂V 3V 3V V
car l'énergie interne d'un gaz monoatomique parfait est U = 3NkT / 2 . Pour calculer la fluctuation
de la pression δP , calculons P 2 . Nous avons
2
 ∂E  4 2
(16) P =  r  =
2
Er
 ∂V  9V
et, par suite, d'après (18) de la section VI.1.5 :
(17) (δP ) = P 2 − P 2 =
2 4
9V
( )
2
E r2 − E r =
4
9V 2
(δU )2 = 4 2 kT 2 CV
9V

La fluctuation relative sur la pression a donc pour valeur


δP
1/ 2

(18) =
2T
(kCV )1 / 2 × V =  2 
P 3V NkT  3 N 
Nous voyons que la fluctuation relative sur la pression est aussi de l'ordre de 1 / N . Le résultat
obtenu se généralise aux gaz di et polyatomiques car les contributions des énergies de rotation et de
vibration sont indépendantes de V et disparaissent de ∂E r / ∂V .

Fluctuation du moment magnétique


Déterminez la fluctuation du moment magnétique d'un système de spins.

Solution
Comme M est égal, au facteur − gµ B près, à la valeur moyenne de ∑S
i i , on a par définition

(δ M )2 
2
  
2

=  ∑ Si  −  ∑ Si  = ∑ Si S j − ∑ Si ∑ S j
(19) g µ B
2 2
 i   i  i, j i j

(
= ∑ Si S j − Si S j )
i, j

En utilisant (10), il vient :


kTχ
(20) (δ M ) =
2

µ0
ou, pour le moment magnétique molaire ( M M = M N / N )
RTχ M
(21) (δM M ) =
2

Nµ 0

Pour une substance paramagnétique parfaite, χ M est donné par


µ0 J ( J + 1)g 2 µ B2
(22) χ M = M M = µ0 N
B 3k
et l'on a :
1 N2 µ 2 δM M J +1 1
(23) (δM M ) = J ( J + 1) ou =
2

N 3 M Ms 3J N
(nous verrons comment obtenir cette relation plus loin)

Cela montre que la fluctuation est encore en 1 / N . Pour une substance quelconque, les
fluctuations sont toujours négligeables sauf lorsque χ M devient infini, c'est-à-dire lorsque ∂M / ∂B
devient infini, ce qui est le cas au point de Curie des substances ferromagnétiques.
VI.1.6. Ensemble grand canonique

Distribution grand canonique


On rencontre fréquemment des systèmes dont le nombre de particules n'est pas constant. C'est par
exemple le cas d'une phase gazeuse surmontant un liquide ou encore celui du corps noir dans lequel
des photons apparaissent ou disparaissent incessamment. Pour étudier de tels systèmes,
généralement constitués de particules indiscernables, on se place dans le cadre de l'ensemble grand
canonique où l'on considère des systèmes dont les paramètres externes (V, B, …) sont constants et
qui sont placés au contact d'un thermostat de température T et d'un réservoir de particules ayant un
potentiel chimique relatif à une particule µ . L'état du système est alors caractérisé par la donnée du
nombre de particules N puis d'un nombre quantique r du même type que celui utilisé dans le cadre
de l'ensemble canonique où N était fixé une fois pour toutes.

Pour obtenir la distribution grand canonique donnant la probabilité PN r de trouver le système


étudié dans l'état N, r, d'énergie E N r , nous considérons le système fermé et isolé constitué du
système étudié ainsi que du thermostat et du réservoir supposés grands devant le système (figure ci-
dessous).
Ce système total a donc une énergie E 0 et un nombre N 0 de particules du type de celles contenues
dans le réservoir. De ce fait, lorsque le système étudié contient N particules et est dans l'état r,
l'ensemble thermostat plus réservoir a l'énergie E ′ = E0 − E N r et le nombre de particules
N ′ = N 0 − N . Il se trouve alors dans l'un des W ′(E ′, N ′) états qui lui sont accessibles. Le système
total étant isolé, celui-ci peut donc se trouver avec la même probabilité dans des états dont le
nombre est :
(
(1) W0 (E0 ) = ∑∑ W ′ E 0 − E N r , N 0 − N )
N r
et le système étudié se trouve dans l'état N, r avec la probabilité

(2) PN r =
( )
W ′ E0 − E N r , N 0 − N
W0 ( E 0 )

En effectuant, comme dans le cas de l'ensemble canonique, un développement limité de ln W ′ , il


vient
 ∂ ln W ′   ∂ ln W ′ 
( )
(3) ln W ′ E0 − E N r , N 0 − N = ln W ′(E 0 , N 0 ) − E N r   − N 
 ∂E ′  0  ∂N ′  0
l'indice 0 signifiant E ′ = E0 et N ′ = N 0 . Comme ln W ′(E 0 , N 0 ) représente l'entropie rapportée à k
de l'ensemble thermostat plus réservoir, la relation thermodynamique
dU µ P
(4) dU = TdS + µdN − PdV L ou dS = − dN + dV + L
T T T
donne
∂ ln W ′ 1 ∂S ′ 1 ∂ ln W ′ 1 ∂S ′ µ
(5) = = et = =−
∂E ′ k ∂E ′ kT ∂N ′ k ∂N ′ kT
où T et µ sont la température du thermostat et le potentiel chimique relatif à une particule du
réservoir. Nous avons donc
( )
(6) W ′ E 0 − E N r , N 0 − N = W ′(E 0 , N 0 )e Nr
− β E + β Nµ

et l'on obtient pour la distribution grand canonique


β Nµ − β E Nr
e β Nµ − β E Nr
(7) PN r = avec Ξ = ∑ e
Ξ N ,r

où Ξ , appelé fonction de partition grand canonique, est une fonction de T, de µ et des paramètres
externes (V, B, …). La fonction de partition grand canonique est reliée aux fonctions de partition
canoniques du système par

(8) Ξ(T , µ , V , K) = ∑ e β Nµ ∑ e Q N (T , V , K)
− β E Nr

N r
= ∑eβ
N =0

Fonctions thermodynamiques
Calculons maintenant l'énergie interne U, l'entropie S du système en explicitant leur valeur, ainsi
que le nombre moyen de particules N dans le système. Pour cela, remarquons que les dérivées
logarithmiques de la fonction de partition Ξ par rapport à β et µ ont pour expressions
∂ ln Ξ 1
(9)
∂β Ξ N ,r
(
= ∑ Nµ − E N r e )
β Nµ − β E Nr
= µ ∑ PN r N − ∑ PN r E N r
N ,r N ,r

et
∂ ln Ξ 1 β Nµ − β E Nr 1
(10) = ∑ βNe = ∑P N
∂µ Ξ N ,r
Nr
kT N ,r

La relation (10) permet d'exprimer le nombre moyen de particules, soit


∂ ln Ξ
(11) N = ∑ PN r N = kT
N ,r ∂µ
et (9) donne
∂ ln Ξ
(12) U = ∑ PN r E N r = N µ −
N ,r ∂β

Enfin, l'entropie a ici pour expression


[
S = − k ∑ PN r ln PN r = − k ∑ PN r βNµ − βE N r − ln Ξ ]
N ,r N ,r
(13)
Nµ U
=− + + k ln Ξ
T T

Ces trois grandeurs sont exprimées en variables T, µ , V, … pour lesquelles le potentiel


thermodynamique approprié est
(14) Ω(T , µ , V , K) = U − TS − N µ
sa différentielle étant
(15) dΩ = − SdT − N dµ − PdV + L

En ordonnant les termes dans (13), nous obtenons l'expression statistique du grand potentiel Ω :
(16) Ω(T , µ , V , K) = −kT ln Ξ(T , µ , V , K)

Cette expression de Ω montre que la connaissance de la fonction de partition grand canonique Ξ


permet de déterminer toutes les propriétés thermodynamiques du système. On a ainsi
∂Ω ∂ ln Ξ ∂Ω ∂ ln Ξ
(17) N = − = kT et P = − = kT
∂µ ∂µ ∂V ∂V
En explicitant Ξ à l'aide de (7), ces relations deviennent
1 β Nµ − β E Nr
(18) N = ∑ Ne = ∑ NPN r
Ξ N ,r N ,r

1 ∂E N r β Nµ − β RNr  ∂E N r 
(19) P = ∑ −
Ξ N ,r ∂V
e = ∑  −
N ,r 
 PN
∂V  r
et mettent en évidence la nature de valeur moyenne de ces grandeurs physiques.

Systèmes de particules identiques

Espace de Fock
Lorsque le système étudié est un système de particules identiques, il est incorrect de dire que son
état est spécifié, outre le nombre N, par la donnée de l'état de chacune de ses particules, car il est
impossible de discerner une particule d'une autre. La façon correcte est de donner le nombre
particules se trouvant dans chaque état quantique relatif à une particule. Si on choisit alors une base
des états à une particule, indicés par i, on peut prendre pour base des états du système
(20) n1 , K, ni , K ≡ N , r
où les nombres ni sont des entiers positifs ou nuls tels que leur somme soit égale à N. Cette base
est donc particulièrement bien adaptée aux systèmes ouverts si l'on considère les nombres ni
comme étant des variables indépendantes. Ainsi, l'état 0,0, K correspond à un système vide de
particules, l'état 0, K,0,1,0, K à un système contenant 1 particule, celle-ci se trouvant dans l'état i,
… L'espace engendré par les états (20) est appelé espace de Fock (c'est aussi un espace de Hilbert).

Dans cet espace, on introduit un jeu d'opérateurs n̂i définis par


(21) nˆ i n1 ,K, ni , K = ni n1 , K, ni , K
et mesurant le nombre de particules dans l'état i lorsque le système est dans un état N, r . Ces
opérateurs, qui commutent entre eux, permettent à leur tour de définir l'opérateur nombre de
particules total par
(22) Nˆ = ∑ nˆ i
i

Nous pouvons alors récrire la fonction de partition grand canonique (7) sous la forme
   
(23) Ξ = ∑ exp  β  ∑ ni  µ − β E  ≡ Tr e β Nµ − β H
ˆ ˆ

n1 ,K, ni ,K   i  
et donner l'expression de l'opérateur densité statistique
1 ˆ ˆ
(24) ρˆ = e β Nµ − β H
Ξ

Opérateurs de création et d'annihilation


Dans le formalisme de la seconde quantification, on introduit pour chaque état à une particule un
opérateur non hermitique â i , appelé opérateur annihilation pour l'état i, qui fait passer d'un état à ni
particules dans l'état i à un état à ni − 1 particules :
(25) aˆ i K , ni , K = ni K , ni − 1, K

L'opérateur adjoint â i+ , appelé opérateur de création pour l'état i, fait alors passer d'un état à ni
particules dans l'état i à un état à ni + 1 , soit
(26) aˆ i+ K , ni , K = ni + 1 K , ni + 1, K

Ces opérateurs permettent, à partir d'un état de l'espace de Fock, de construire tous les autres états
par application répétée et sont reliés aux opérateurs n̂i par la relation fondamentale
(27) nˆ i = aˆ i+ aˆ i

On montre de plus que tout opérateur sur l'espace de Fock peut toujours être explicité comme
superposition de produits d'opérateurs d'annihilation et de création.
Les propriétés de ces opérateurs sont toutefois différentes selon la nature quantique (fermion ou
boson) des particules. En effet, en raison du principe d'exclusion de Pauli, les systèmes de fermions
ne peuvent se trouver que dans les états de l'espace de Fock tels que ni = 0 ou 1 pour tout i, alors
que les systèmes de bosons peuvent se trouver dans n'importe quel état ( ni = 0 , 1, 2,…). On montre
que les opérateurs d'annihilation et de création sont complètement spécifiés en imposant les règles
suivantes
(28) aˆ i aˆ j + aˆ j aˆ i = 0 et aˆ i aˆ +j + aˆ +j aˆ i = δ ij (fermions)
(29) aˆ i aˆ j − aˆ j aˆ i = 0 et aˆ i aˆ +j − aˆ +j aˆ i = δ ij (bosons)

L'utilisation de ces opérateurs est nécessaire pour l'étude des systèmes quantiques de particules en
interaction.

Notons que ce terme de "seconde quantification", quelque peu impropre, vient de la quantification
des champs. Pour avoir un système à plusieurs particules, on quantifie directement le champ
représentant un système physique classique, par exemple le champ électromagnétique. Pour des
particules telles que les électrons, on part de leur fonction d'onde obéissant à l'équation de
Schrödinger ou de Dirac (la version relativiste) et on la considère comme un champ classique, au
même titre que le champ électromagnétique, et on la quantifie. C'est de là que vient le terme
seconde quantification puisque l'on "quantifie la fonction d'onde". Mais en réalité on passe toujours
d'un système classique à un système quantique. Il n'y a qu'une seule quantification.

Cas d'un gaz parfait


Lorsque l'énergie d'interaction des particules est négligeable, le grand potentiel prend une forme
plus compacte. En effet, l'énergie du système peut s'écrire E = ∑i ε i nˆ i correspondant à
l'hamiltonien
(30) Hˆ = ∑ ε i nˆ i
i
et la fonction de partition (23) se factorise selon
β n (µ −ε ) β n ( µ −ε )
(31) Ξ = ∑ e 1 1 × L ∑ e i i × L
n1 ni
de sorte que le grand potentiel (14) devient :
 β n ( µ −ε ) 
(32) Ω = − kT ∑ ln ∑ e i i 
i  ni 

Considérons alors le cas d'un gaz de fermions : la somme sur ni ne comporte que deux termes 0 et
1 (principe d'exclusion de Pauli) et le grand potentiel prend la forme
[
(33) Ω ≡Ω FD = − kT ∑ ln 1 + e
β ( µ −ε i )
]
i
identique à l'expression obtenue par la méthode élémentaire en statistique de Fermi-Dirac. Quant
aux bosons, la somme sur ni , portant sur toutes les valeurs entières, est une série géométrique
infinie de raison exp β (ε i − µ ) et l'on a
[
(34) Ω ≡ Ω BE = kT ∑ ln 1 − e
β (µ −ε i )
]
i
identique à l'expression obtenue en statistique de Bose-Einstein.

Nous voyons donc que les méthodes de l'ensemble grand canonique permettent de retrouver les
résultats obtenus par la méthode élémentaire.

Fluctuations
Dans l'ensemble grand canonique, comme dans l'ensemble canonique, une grandeur relative au
système peut varier du fait des échanges d'énergie avec le thermostat. Elle peut également varier du
fait des échanges de matière avec le réservoir. La fluctuation du résultat d'une mesure est donc
différente de celle obtenue dans l'ensemble canonique.

Calculons tout d'abord la fluctuation δN sur le nombre de particules du système, fluctuation qui
n'existe pas dans l'ensemble canonique. Nous avons
1 Nβ µ − β E Nr k 2T 2 ∂ 2 Ξ
(35) N 2 = ∑ N 2 PN r = ∑ N 2 e =
N ,r Ξ N ,r Ξ ∂µ 2
soit, pour le carré de la fluctuation
2
k 2T 2 ∂ 2 Ξ k 2T 2  ∂Ξ  ∂ 2 ln Ξ ∂N
(36) (δN ) =N −N = − 2   = k 2T 2 = kT
2 2 2

Ξ ∂µ 2 Ξ  ∂µ  ∂µ ∂µ
2

où nous avons utilisé la relation (17). Pour expliciter (δN ) , nous allons calculer (∂µ / ∂N )T ,V à
2

l'aide de la relation thermodynamique classique de Gibbs-Duhem :


(37) N dµ = VdP − SdT

En utilisant l'équation d'état P = P(v, T ) = P( NV / N , T ) , nous passons en variables T, V, N. On


obtient
 ∂P  N ∂P NV 2 ∂P
(38) Ndµ = V − S dT + V dV − 2 dN
 ∂T  N ∂v N ∂v
d'où l'on tire
 ∂µ  NV 2  ∂P  V  ∂P  V
(39)   = − 3   = − 2 v  = 2
 ∂N  T ,V N  ∂v  T N  ∂v  T N χ T
où χ T est la compressibilité isotherme. On a donc :

(40) (δN ) =
kT
2
χT N 2
V
et pour la fluctuation relative du nombre de particules, égale à celle du nombre volumique de
particules n = N / V
δN δn
1/ 2
 kT 
(41) = = χT 
N n V 

Dans le cas d'un gaz parfait, pour lequel χ T = 1 / P , cette fluctuation vaut 1 / N et est donc
négligeable. Toutefois, pour un gaz réel au voisinage de son point critique, la compressibilité
isotherme devient infinie et il apparaît des fluctuations de densité extrêmement grandes donnant
lieu au phénomène d'opalescence critique.
Calculons maintenant la fluctuation sur l'énergie interne de façon semblable à la fluctuation
canonique. Nous avons, en posant ν = βµ :
1 Nν − β E Nr
U ≡ E N r = ∑ PN r E N r = ∑ E N r e
N ,r Ξ N ,r
(42)
1  ∂Ξ   ∂ ln Ξ 
= −   = − 
Ξ  ∂β ν  ∂β ν
et
1 Nν − β E Nr 1  ∂ 2Ξ 
(43) E N2 r = ∑ PN r E N2 r = ∑ E N2 r e =  2 
N ,r Ξ N ,r Ξ  ∂β ν
qui donne
2
1 ∂ 2 Ξ 1  ∂Ξ   ∂ 2 ln Ξ 
(44) (δU ) = E −E = −   =  
2 2 2

Ξ ∂β 2 Ξ 2  ∂β  ∂ β 2 
Nr Nr
 ν

En utilisant l'expression (42) de l'énergie interne, nous obtenons finalement


 ∂U   ∂U 
(45) (δU ) = −  = kT 2 
2

 ∂β ν  ∂T ν

Cette expression de la fluctuation en énergie est semblable à celle de la fluctuation canonique, mais
où l'on dérive cette fois à ν = βµ constant au lieu de N constant. A l'aide des relations
thermodynamiques, un calcul fastidieux permet d'écrire (δU ) sous la forme
2

2
 ∂U 
(46) (δU ) = kT 2 CV +   (δN )
2 2

 ∂N  T ,V
qui montre que la fluctuation canonique (kT 2 CV ) et la fluctuation d'énergie (∂U / ∂N )δN due à
1/ 2

la variation du nombre de particules s'ajoutent quadratiquement pour former la fluctuation grand


canonique.
Exercices

Grand potentiel d'un gaz parfait


Déterminez l'expression de la fonction de partition grand canonique d'un gaz parfait en fonction de
Z, fonction de partition relative à une particule. En déduire l'expression du grand potentiel
Ω(T , µ ,V ) .

Solution
D'après les relations (8) de la section VI.1.6 et (8) des exercices à la fin de la section VI.1.5, on a

( )
∞ N
β Nµ Z
(1) Ξ = ∑ e = exp Ze β µ
N =0 N!
d'où il vient
(2) Ω(T , µ , V ) = − kT ln Ξ = − kTZ (T , V )e β µ

Cette expression est identique à celle obtenue par la méthode élémentaire.

Fluctuation d'énergie grand canonique pour un gaz parfait monoatomique


Le grand potentiel d'un gaz parfait monoatomique est donné par la relation (2) Ω(T ,ν , V ) = − kTZeν
où Z (T , V ) est la fonction de partition à une particule. Explicitez à partir de (42), (44) de la section
VI.1.6 l'énergie interne U et le carré de sa fluctuation (δU ) en fonction de ν et de Z. En déduire
2

l'expression de la fluctuation relative δU / U et comparez à son expression canonique.

Solution
L'expression de Ω montre que l'on a ln Ξ = Zeν . Puisque Z varie comme T 3 / 2 , les expressions de
U et de (δU ) sont
2

 ∂ ln Ξ   ∂ ln Ξ  3 ν
(3) U = −  = kT 2   = kTZe
 ∂β ν  ∂T ν 2
et
 ∂ 2 ln Ξ   ∂U   ∂U 
(4) (δU ) = 
15 2 2 ν
2
2 
 = −  = kT 2   = k T Ze
 ∂β ν  ∂β ν  ∂T ν 4

On a donc

(5)
(δU )2 = 5 1 = − 5 kT = 5 kT = 5
U2 3 Zeν 3 Ω 3 PV 3 N

Le carré de la fluctuation canonique relative n'est que 2 / 3 N , la différence venant de la fluctuation


relative du nombre de particules égale à 1/N.
Exercices de compréhension
1. On considère un système de N spins 1/2 sans interaction, placé dans un champ magnétique
d'induction B constant. Ce système isolé a l'énergie E. Calculez l'entropie de ce système
S(N,E,B).
2. On considère un thermostat dont le nombre d'états est de la forme W ′ = AE ′αN ′ où α est un
facteur numérique voisin de 1. Développez W ′(E 0 − E r ) ainsi que son logarithme au voisinage
de E 0 et vérifiez que l'on peut limiter le développement à l'ordre 1 seulement pour le
logarithme.
Problème. Modèles d'adsorption d'un gaz par un solide
Les molécules d'un gaz peuvent être piégées à la surface d'un solide : c'est le phénomène
d'adsorption. On peut distinguer deux types d'adsorption : la chimi-adsorption dans laquelle les
molécules adsorbées forment une liaison chimique avec les atomes de la surface, l'adsorption
"physique" dans laquelle les molécules du gaz sont liées à la surface par des forces de van der
Waals. Dans le premier type, les molécules sont adsorbées en un nombre fini de sites et forment
alors une couche monomoléculaire. Dans le second type, les molécules peuvent se déposer en
plusieurs couches sur la surface. Nous nous proposons d'étudier un modèle simple de chacun des
types d'adsorption. Les phénomènes d'adsorption sont particulièrement important dans un grand
nombre de processus industriels où des gaz sont en contacts avec un solide.

Etude de la phase gazeuse


On considère tout d'abord la phase gazeuse que l'on assimile pour simplifier à un gaz parfait
monoatomique de masse molaire M.

1. Donnez les expressions générales de la fonction de partition grand canonique Ξ et de


l'opérateur densité ρ̂ en fonction des opérateurs Ĥ (hamiltonien) et N̂ (nombre de particules).
2. Calculez la fonction Ξ(T ,V , µ ) du gaz, T, V, µ étant respectivement la température, le volume
et le potentiel chimique relatif à une particule du gaz. On négligera les degrés de liberté autres
que ceux de translation et on admettra que les molécules sont indiscernables. Déduisez-en
l'expression du grand potentiel Ω(T ,V , µ ) .
3. Déterminez l'expression du potentiel chimique µ en fonction de T, V et N , N étant le nombre
moyen de molécules à l'équilibre.
4. Montrez que µ put s'écrire, en variables T et P, sous la forme :

avec P0 (T ) ∝ T 5 / 2
P
(1) µ = kT ln
P0 (T )
Modèle de Langmuir
Dans le modèle de Langmuir, on suppose que le solide adsorbant possède N 0 sites où les
molécules du gaz peuvent être piégées avec l'énergie − ε . A chaque site, on attache un nombre
quantique ni ( i = 1, K , N 0 ) valant 0 si le site est inoccupé ou 1 si le site contient une molécule.
Dans ce modèle, le site ne peut être occupé que par une molécule au plus. Le nombre de molécules
de la phase adsorbée fluctuant, on appliquera les méthodes de l'ensemble grand canonique à cette
phase.

1. Donnez l'expression du nombre N de molécules de la phase adsorbée en fonction de ni .


2. Ecrivez l'hamiltonien H de la phase adsorbée en fonction des ni et de ε .
3. Déduisez-en l'expression de l'hamiltonien H ′ = H − Nµ .
4. Explicitez la définition de la fonction de partition grand canonique Ξ pour la phase adsorbée.
Montrez que Ξ peut s'écrire sous la forme Z 0 , où Z peut s'interpréter comme une fonction de
N
5.
partition relative à un site. Donnez l'expression de Z (T , µ ) .
6. Calculez le nombre moyen N A de molécules de la phase adsorbé en fonction de T et µ .
7. Quelle est la condition d'équilibre entre la phase adsorbée et la phase gazeuse ? Utilisez cette
condition pour exprimer N A en fonction de la température T et de la pression P du gaz (loi de
Langmuir). Représentez graphiquement une isotherme N A (P ) .
8. Des études d'adsorption d'azote sur du charbon de bois ont montré que les isothermes ont une
équation de la forme :
(2) = a (T ) + b(T )P
P
x
où x est le rapport de la masse de gaz adsorbée à la masse d'adsorbant. Montrez que ces
résultats sont compatibles avec la loi de Langmuir.
9. On a mesuré dans cette étude :
a(20°C) = 85 atm et b(20°C) = 6.6
a(-77°C) = 15 atm et b(-77°C) = 4.4

En déduire la valeur de l'énergie de piégeage rapportée à une mole Nε .


Modèle B.E.T.
Dans le modèle B.E.T. (Brunauer, Emmett, Teller) on suppose que chacun des N 0 sites de la
surface peut piéger des molécules en nombre illimité, la première ayant une énergie − ε 1 et les
autres l'énergie − ε 2 ( ε 1 > ε 2 > 0 ).

1. Calculez la fonction de partition grand canonique Z (T , µ ) relatif à un site et déduisez-en


comme ci-dessus la grande fonction de partition Ξ relative à une phase adsorbée. On pourra
poser z = exp(βµ ) , z1 = exp(βε 1 ) et z 2 = exp(βε 2 ) .
2. Calculez le nombre moyen N A de molécules de la phase adsorbée en fonction de z.
3. Utilisez la condition d'équilibre avec la phase gazeuse pour exprimer N A en fonction de
/ P0 (T ) . On posera c = exp β (ε 1 − ε 2 ) = z1 / z 2 .
β ε2
ξ = Pe
4. Représentez graphiquement l'allure de la fonction N A (ξ ) . Donnez l'interprétation physique de
la divergence de la fonction. Que représente l'expression Pe = P0 (T )e 2 ?
−β ε

5. L'étude de l'adsorption de divers gaz sur divers catalyseurs a montré que les isothermes
obéissent, dans un assez grand domaine de pression, à une loi de la forme
= A(T ) + B(T )
P P
(3)
(Pe − P )V Pe
où V est le volume du gaz adsorbé ramené dans les conditions normales de température et de
pression. Ces résultats sont-ils compatibles avec le modèle B.E.T. ?
6. On a mesuré pour l'adsorption de l'azote sur 50.4 g d'un catalyseur à base de fer à 77.3 K
( Pe = 1 atm ) : A = 0.25 × 10 −4 cm −3 et B = 7.7 × 10 −3 cm −3 . Calculez numériquement c. La
thermodynamique statistique donne pour l'azote, traité comme un gaz parfait diatomique
symétrique, P0 (77.3 K ) = 2.7 × 10 6 atm . Déduisez-en les valeurs de ε 2 et ε 1 rapportées à une
mole. Discutez et comparez à la chaleur latente molaire de vaporisation de l'azote à pression
atmosphérique ∆H = 5.6 kJ mole −1 .

Donnés numériques : constante des gaz parfaits R = 8.315 kJ mole −1 .


Solution

Etude de la phase gazeuse


1. Les expressions de Ξ et ρ̂ sont données en (23) et (24) de la section VI.1.6.
2. Les expressions de Ξ et de Ω sont données dans (1) et (2) de l'exercice à la fin de la section
VI.1.6 avec
(4) Z = 3 (2πmkT )
V 3/ 2

h
3. Nous avons
∂Ω
(5) N ≡ N = − = Z (T , V )e β µ
∂µ
d'où nous tirons
Z  V (2πmkT )3.2 
(6) µ = − kT ln = −lT ln 

N N h3 
4. En passant à la variable P = NkT / V , on obtient :
avec P0 (T ) = e 0 M 3 / 2T 5 / 2
P
(7) µ = kT ln
i

P0 (T )

Modèle de Langmuir
1. Il est clair que l'on a
N0 N0

(8) N = ∑ ni et H = − Nε = −ε ∑ ni
i =1 i =1
d'où
N0

(9) H ′ = −(µ + ε )∑ ni
i =1
2. L'expression (23) de la section VI.1.6 de Ξ s'écrit ici :
1 1
(10) Ξ = ∑L
n1 = 0
∑e β
n N =0
− H′

0
N0
car tous les états de la phase adsorbée (au nombre de 2 ) s'obtiennent en faisant varier les ni
indépendamment.
3. H ′ étant une somme sur i, on peut écrire
1
β ( +ε )n1
1 β ( +ε )n N
(11) Ξ = ∑e
n1 = 0
L ∑e
n N =0
0
= Z N0
0
avec
1
(12) Z (T , µ ) = ∑ e β ( µ +ε )n = 1 + e β (µ +ε )
n =0
4. On a
N0
(13) N A =
1 + e − β (ε + µ )
5. L'égalité, à l'équilibre, des potentiels chimiques des deux phases permet d'écrire
e − β µ = P0 (T ) / P , d'où
N0
(14) N A =
1 + e − β ε P0 (T ) / P

Une isotherme est représentée dans la figure ci-dessous.


Les points expérimentaux représentent la masse d'azote adsorbée sur 96.4 mg de charbon de
bois à 20°C.. L'isotherme de Langmuir est tracé avec a = 85 atm et b = 6.6.
6. Le nombre N A est proportionnel à la variable sans dimension x, soit N A = Kx . La loi de
Langmuir ci-dessus peut alors être mise sous la forme
(15) =
P
x N0
K
( )
P + e β ε P0

Cette expression correspond à l'expérience avec a = Ke β ε P0 / N 0 et b = K / N 0 .


7. On a a / b = e − β ε P0 , P0 étant proportionnel à T 5 / 2 :
a / b(20 ° C ) P0 (20 ° C ) e 1
−β ε 5/ 2
T   ε  1 1 
(16) = =  1  exp   −  = 3.8
a / b(− 77 ° C ) P0 (− 77 ° C ) e − β 2ε
 T2   k  T2 T1 
avec T1 = 293 K et T2 = 196 K . Il en découle ε / k = 192 K , d'où
Nε = R × ε / k ≅ 1600 J mole −1 .

Modèle B.E.T.
1. La fonction de partition grand canonique relative à un site s'écrit
∞ ∞
β ( Nµ − ε N ) −β ε N
(17) Z = ∑e
N =0
= ∑z
N =0
N
e

où ε N est l'énergie de N molécules adsorbées sur le site. On a ainsi


β ε1 β (ε1 + ε 2 ) β (ε1 + 2 ε 2 )
Z = 1 + ze + z 2e + z 3e +L
(18) = 1 + ze
β ε1
[1 + ze β ε2
+ z 2e
2β ε2
+L ]
1 + z ( z1 − z 2 )
β ε1
ze
= 1+ β ε2
=
1 − ze 1 − zz 2

Comme ci-dessus, la fonction de partition grand canonique de la phase adsorbée Ξ est égale à
N
Z 0 car les particules sur deux sites différents n'interagissent pas, les N 0 sites sont
indépendants.
2. On a, comme ci-dessus :
N ∂ ln Z ∂ ln Z
(19) A = kT =z
N0 ∂µ ∂z

En explicitant Z, on obtient
N zz1
(20) A =
N 0 [1 + z ( z1 − z 2 )][1 − zz 2 ]
3. La condition d'équilibre donne z = P / P0 (T ) , soit
NA cξ
(21) =
N 0 [1 + (c − 1)ξ ][1 − ξ ]

Cette expression constitue la loi B.E.T.


4. La courbe N A (ξ ) est représentée ci-dessous. On a porté sur les axes P ∝ ξ et V ∝ N A .

Les points expérimentaux représentent le volume (dans les conditions normales) d'azote
adsorbé sur 50.4 g d'un catalyseur à bas de fer à 77.3 K/ La courbe a été tracée pour
A = 0.5 × 10 −4 cm −3 et B = 7.7 × 10 −3 cm −3 .

Le nombre d'atomes adsorbés diverge pour ξ = 1 , c'est-à-dire pour P = Pe (T ) ≡ P0 (T )e


− β ε2
. On
peut interpréter Pe (T ) comme la pression de vapeur saturante à la température T (pression à
laquelle le gaz se liquéfie).
5. Le nombre N A étant proportionnel à V et ξ étant égal à P / Pe , la loi B.E.T. peut être écrite
sous la forme
ξ N 0 1 + (c − 1)ξ P P
(22) = , soit = A+ B
(1 − ξ ) N A c (Pe − P )V Pe

Sous cette forme, la loi B.E.T. est semblable à la loi expérimentale avec B/A = c - 1.
6. Des valeurs numériques de A et B, on tire c = 310, soit
(23) N(ε 1 − ε 2 ) = 3.7 kJ mole −1
et des valeurs de Pe et P0 , on déduit :
(24) Nε 2 = 9.5 kJ mole −1
d'où
(25) Nε 1 = 13.2 kJ mole −1

On vérifie que la première "couche" adsorbée est plus liée que les suivantes ( ε 1 > ε 2 ).

L'isotherme B.E.T. représente bien les données relatives à l'azote jusqu'à environ 40 cm de
mercure, ce qui correspond à l'adsorption des premières couches. Pour des pressions
supérieures, la courbe B.E.T. se situe au-dessus des points expérimentaux, ce qu'on peut
attribuer au fait que les couches suivantes sont encore moins liées. L'énergie Nε i tend alors vers
la valeur relative au liquide Nε L = ∆H valant 5.6 kJ mole −1 .
VI.2. Paramagnétisme parfait

VI.2.1. Introduction
Les propriétés magnétiques des substances ont été très étudiées à cause de leur intérêt théorique
mais aussi en raison de leurs nombreuses applications, en particulier dans le domaine des basses
températures.

Les substances se classent en deux catégories selon que leurs atomes (atomes, ions ou molécules
constitutifs possèdent ou non un moment magnétique. Elles se nomment respectivement substances
magnétiques et diamagnétiques.

Les substances diamagnétiques ne présentent jamais de moment magnétique en champ nul.


Lorsqu'elles sont placées dans un champ magnétique, celui-ci perturbe le mouvement des électrons
atomiques qui, en réaction, acquièrent un très faible moment magnétique orbital proportionnel au
champ et de sens opposé. Nous n'étudierons pas les propriétés de ces substances.

Les substances magnétiques doivent leurs propriétés à l'existence d'un moment magnétique de
certains de leurs atomes. Elles peuvent présenter diverses phases :
 Une phase paramagnétique dans laquelle la substance ne présente pas d'aimantation en champ
nul, les dipôles ayant des orientations désordonnées. Ces dipôles, subissant l'action d'un champ
magnétique, confèrent à la substance une aimantation qui, en champ faible, est proportionnelle
à l'induction et de même sens.
 Des phases "ordonnées" dans lesquelles les dipôles atomiques ont, en champ nul, des
orientations ordonnées à l'échelle moléculaire. On distingue, suivant le type d'ordre réalisé, des
phases ferromagnétiques, antiferromagnétiques, ferrimagnétiques, etc.

L'arrangement ordonné des dipôles provient de leurs interactions et cesse lorsque la température
atteint une température telle que kT soit de l'ordre de leur énergie d'interaction. Une substance
magnétique présente donc en général une phase paramagnétique à plus haute température et une ou
plusieurs phases ordonnées à plus basse température. Dans cette partie, nous étudions les
substances magnétiques dans leur phase paramagnétique et dans un domaine de température tel que
l'énergie d'interaction entre dipôles est très inférieure à kT et peut être négligée. Le modèle
correspondant est celui des substances paramagnétiques parfaites. Les divers cas dans lesquels les
interactions ne sont plus négligeables sont étudiés un peu plus loin.
VI.2.2. Etude expérimental des substances magnétiques

Equation d'état magnétique


Pour pouvoir déterminer toutes les propriétés thermodynamiques d'une substance magnétique, il
suffit de connaître, en plus de son équation d'état et d'une capacité calorifique en champ nul, son
équation d'état magnétique M = M ( N , T , P, H ) ou M = M (N , T , P, B ) . Le moment magnétique
M de la substance est relié à l'aimantation M par
M
(1) M =
V
l'aimantation intervenant en magnétostatique dans la relation
(2) B = µ 0 (H + M )
entre l'induction B et l'excitation H du champ magnétique. Les cas traités ici sont tels que
l'aimantation M de la substance est faible devant H. De ce fait, les vecteurs B et H sont supposés
reliés par la relation
(3) B = µ 0 H

Mesure du moment magnétique


La mesure des moments magnétiques se fait par deux types principaux de méthodes. Le premier
type repose sur la formule :
(4) F = ( M ⋅ ∇ )B
donnant la force F exercée sur une substance de petite dimension placée dans un champ
inhomogène. Dans la méthode de Gouy et Faraday (figure (a) ci-dessous), un échantillon E
suspendu par un fil à une balance de précision D est situé au centre d'un aimant supraconducteur S
produisant un champ d'induction B0 vertical et uniforme aimantant la substance.
Deux enroulements C1 et C 2 , placés symétriquement et parcourus en sens inverse par un même
courant, créent un champ supplémentaire nul en E et présentant un gradient vertical. La mesure de
la force F verticale résultat de ce gradient permet de déterminer le moment magnétique de la
substance. Des valeurs typiques du gradient et de la sensibilité de la balance sont respectivement
10 T m −1 et 10 −8 N (poids d'un microgramme), ce qui permet de mesurer des moments
magnétiques de l'ordre de 10 −6 A m 2 .

Le deuxième type de méthode utilise la variation de flux magnétique produite à travers un


enroulement sonde par un déplacement de la substance aimantée. La figure (b) ci-dessus présente
un magnétomètre de ce type (méthode de l'échantillon vibrant). L'échantillon E, dans le champ
uniforme d'un électro-aimant A, est mis en vibration par un transducteur T. Il se produit une
variation de flux sinusoïdale dans deux enroulements de sens inverse C1 et C 2 placés
symétriquement par rapport à l'échantillon. La force électromotrice induite est proportionnelle au
moment magnétique de la substance. Sa mesure permet de le déterminer. On peut ainsi mesurer des
moments magnétiques avec une précision de 10 −7 A m 2 (S. Foner, 1959).
Susceptibilités magnétiques

Définition
Les résultats expérimentaux montrent que le moment magnétique d'une substance est une fonction
décroissante de la température et une fonction croissante du champ magnétique. En champ
magnétique faible, l'aimantation est proportionnelle au champ magnétique,
M B
(5) M = = χH = χ
V µ0
où le paramètre χ est la susceptibilité magnétique de la substance de la substance supposée
isotrope. La plupart des expériences étant faites dans le domaine de validité de cette loi, cette
grandeur est une propriété caractéristique importante de la substance. Elle est sans dimension.

On introduit, en plus de χ , les susceptibilités χ m et χ M relatives aux moments massiques ou


molaires définis à partir du moment magnétique total par les relations
(6) M = χVH = χ m mH = χ M nH
où V, m et n sont respectivement le volume, la masse et le nombre de moles de la substance
considérée. Il en résulte que :
χ
(7) χ m = et χ M = vχ = Mχ m
ρ
où ρ , v et M sont la masse volumique, le volume molaire et la masse molaire de la substance. Ces
susceptibilités se mesurent respectivement en m 3 kg −1 et m 3 mole −1 .

Un grand nombre de données expérimentales sont exprimées dans le système uem cgs. La
correspondance avec le système international est la suivant :
Pour χ : 1uem cgs = 4π SI (sans dimension)
(8) Pour χ m : 1 uem cgs (ou cm 3 g −1 ) = 4π × 10 −3 SI (ou m 3 kg −1 )
Pour χ M : 1 uem cgs (ou cm 3 mole −1 ) = 4π × 10 −6 SI (ou m 3 mole −1 )
Notons qu'en champ magnétique fort et à température suffisament basse, la loi linéaire (5) cesse
d'être valable et l'aimantation tend vers une valeur limite, dite de saturation, pour laquelle les
dipôles atomiques sont orientés au maximum dans le sens du champ.

Mesure des susceptibilités


La mesure relative des susceptibilités magnétiques peut être effectuée à l'aide de méthodes
électromagnétiques simples utilisant le phénomène d'induction. Décrivons l'une de ces méthodes
(figure ci-dessous).

Une première bobine A parcourue par un courant alternatif de basse fréquence crée un champ
magnétique alternatif. Deux bobines identiques B1 et B2 sont mises en série de façon à ce que leurs
enroulements soient en sens inverse : la force électromotrice induite dans le circuit B1 et B2 par la
bobine A est alors nulle. Si l'on place un échantillon E de substance paramagnétique à l'intérieur
d'une des bobines, B1 , il prend un moment magnétique contribuant au flux traversant B1 . La force
électromotrice d'induction e = − dφ / dt , proportionnelle à
dM / dt = (dM / dB ) × (dB / dt ) = (Vχ / µ 0 ) × (dB / dt ) , a une amplitude proportionnelle à Vχ . La
constante de proportionnalité est déterminée à partir d'un échantillon étalon. Dans les méthodes
modernes, la bobine est supraconductrice et la force électromotrice est mesurée à l'aide d'un
SQUID.

Il est à noter que l'induction B qui intervient dans la formule (5) est l'induction régnant à l'intérieur
de la substance. Elle est différente de l'induction B0 qui existerait en l'absence de la substance.
Lorsque la substance a la forme d'un ellipsoïde (ou en particulier d'une sphère), l'induction B à
l'intérieur de la substance est homogène et le champ démagnétisant Bd = B0 − B est proportionnel
à M, le coefficient de proportionnalité ne dépendant que de la forme de l'ellipsoïde ( Bd = µ 0 M / 3
pour une sphère). Si χ << 1 , le champ démagnétisant est négligeable et l'on confond B avec B0 .
Dans le cas contraire, en particulier à basse température, il faut tenir compte de ce champ pour
déterminer χ .

Loi de Curie
La variation de la susceptibilité magnétique avec la température a été étudiée par Pierre Curie
(1895) qui, pour un certain nombre de substances, a établi la loi qui porte son nom :
C
(9) χ =
T

C étant une constante dite constante de Curie. Cette loi est illustrée pour le sulfate de manganèse
sur la figure ci-dessous.
La constante de Curie C M définie par χ M = C M / T a la valeur de C M = 5.50 × 10 −5 K m 3 mole −1
( C M = 4.38 uem cgs ) et, par exemple, pour le sulfate de cuivre, elle vaut
C M = 5.99 × 10 −6 K m 3 mole −1 ( C M = 0.476 uem cgs ). L'ordre de grandeur C M ~ 10 −5 K m 3 mole −1
( C M ~ 1 uem cgs ) est typique.

La loi de Curie est en fait la limite de la loi plus générale de Curie-Weiss :


C
(10) χ =
T −Θ
lorsque T >> Θ . La constante Θ , positive ou négative, est appelée constante de Weiss, et est telle
que k Θ est de l'ordre de l'énergie d'interaction entre les ions magnétiques. Ici, nous étudierons les
substances pour lesquelles cette énergie d'interaction est très inférieure à kT et qui suivent donc la
loi de Curie.
A cette susceptibilité magnétique s'ajoutent des termes relatifs au diamagnétisme
( χ M ~ −10 −10 m 3 mole −1 ) et au paramagnétisme de Van Vleck ( χ M ~ 10 −11 m 3 mole -1 ). Ces termes
sont très petits devant le terme relatif au paramagnétisme et seront négligés par la suit.

Dans les cristaux, les phénomènes magnétiques sont anisotropes. La relation linéaire entre les deux
grandeurs vectorielles M et H s'écrit alors sous forme tensorielle :
(11) M = [χ ]H ou M i = χ ij H j
où nous avons omis la sommation sur j selon la convention d'Einstein. La susceptibilité magnétique
est alors une grandeur tensorielle [χ ] ou χ ij , tenseur symétrique d'ordre 2. En les rapportant à ses
axes principaux, il est caractérisé par ses trois valeurs principales χ 1 , χ 2 , χ 3 . Pour un cristal
possédant un axe de symétrie d'ordre supérieur à 2 (cristal uniaxe), on a χ 1 = χ 2 ≡ χ ⊥ , χ 3 ≡ χ || , et
pour un cristal cubique χ 1 = χ 2 = χ 3 ≡ χ . Dans ce dernier cas, les propriétés magnétiques sont
isotropes et l'on retrouve la simple relation de proportionnalité (5). Lorsque la substance cristalline
est sous forme de poudre, les propriétés magnétiques sont également isotropes et on mesure
χ + χ2 + χ3
(12) χ = 1
3
VI.2.3. Modèle vectoriel de l'atome
L'interprétation des propriétés magnétiques des substances nécessite la connaissance des états
électroniques des atomes, molécules et ions. Nous allons donc résumer ici les principaux résultats
de la théorie quantique des atomes que nous avons vue et utiles pour la suite. L'état électronique
d'un atome à Z électrons s'obtient en prenant Z états monoélectroniques, puis en effectuant les
couplages appropriés.

Etats quantiques d'un électron dans l'atome


L'état d'un électron dans un atome est défini par cinq nombres quantiques n, l, ml , s et ms . Le
nombre quantique principal n caractérise la couche à laquelle appartient l'électron. C'est un nombre
entier positif auquel est associée une lettre majuscule selon la convention
(1) n 1 2 3 4 …
Couche K L M N …

Le nombre quantique orbital l caractérise le module du moment cinétique σ l de l'électron dans son
mouvement orbital autour du noyau par la relation :
(2) σ l = [l (l + 1)] h
1/ 2

Le nombre l a des valeurs entières positives ou nulles et détermine la sous-couche à laquelle


appartient l'électron, avec la correspondance :
(3) l 0 1 2 3 4 …
Sous-couche s p d f g …

Dans une couche n donnée, le nombre quantique orbital est limité par la condition l ≤ n .

Le nombre quantique ml définit la projection du moment cinétique σ l sur un axe de quantification


Oz de façon telle que :
(4) (σ l ) z = ml h
expression dans laquelle ml peut prendre les 2l + 1 valeurs ml = −l ,−l + 1;K , l − 1, l (figure ci-
dessous).

Enfin, les nombres quantiques s et ms caractérisent le moment cinétique propre (spin) de l'électron
σ s de façon telle que :
(5) σ s = [s (s + 1)] h et (σ s ) z = m s h
1/ 2

Pour un électron, le nombre quantique de spin s a pour valeur 1/2 et le nombre ms peut prendre les
valeurs m s = ±1 / 2 . D'où

h et (σ s ) z = ± h
3 1
(6) σ s =
2 2

En mécanique quantique, un état électronique est représenté par le ket n l ml m s . En


spectroscopie, on utilise une notation, telle que 3p, caractérisant une sous-couche, le chiffre étant le
nombre quantique principal relatif à la couche et la lettre représentant la sous-couche selon la
notation (3). Les nombres ml et ms ne sont pas notés. Il existe donc (2l + 1)(2 s + 1) = 2(2l + 1) états
différents dans une même sous-couche. La multiplicité (ou nombre d'états) des couches et des sous-
couches est indiquée dans le tableau ci-dessous.

Couche K L M N
Sous-couche 1s 2s 2p 3s 3p 3d 4s 4p 4d 4f
Multiplicités 2 2 6 2 6 10 2 6 10 14
2 8 18 32

Dans le cas d'atomes à un seul électron (atome d'hydrogène ou ion hydrogénoïde), l'énergie de
l'électron dans un état quantique ne dépend que du nombre quantique principal n selon la formule
de Rydberg
Z2
(7) ε n = − R∞ 2
n
où R∞ = 13.6 eV est la constante de Rydberg et Z le numéro atomique de l'ion.

Dans le cas d'atomes à plusieurs électrons, on ne peut pas considérer indépendamment l'énergie de
chaque électron en raison de leurs interactions. Toutefois, en première approximation (dite du
champ central), chaque électron est soumis à un champ central effectif créé par le noyau et l'action
moyenne des autres électrons. On peut à cette approximation décrire l'état de l'atome par l'ensemble
des états occupés par les électrons supposés indépendants. L'énergie d'un électron dans un état
quantique dépend alors des valeurs des deux nombres n et l de cet état. La théorie est complexe
mais on peut retenir que ε n,l croit avec l pour n fixé.

L'état fondamental d'un atome correspond à une répartition de ses électrons dans les états
monoélectroniques de plus basse énergie compte tenu du principe d'exclusion de Pauli. La
configuration de l'atome est caractérisée par l'ensemble des nombres ni et l i relatifs à chaque
électron et on la représente par une notation spectroscopique. Pour l'atome de sodium (Z = 11) par
exemple, on note :
(8) 1s 2 2 s 2 2 p 6 3s
signifiant qu'il existe 2 électrons dans les sous-couches 1s et 2s, 6 dans la sous-couche 2p et un seul
dans la sous-couche 3s. Dans une sous-couche complète, toutes les orientations du moment orbital
et du spin sont réalisées et le moment cinétique total est nul : ceci confère aux sous-couches
complètes un caractère inerte et on a l'habitude de les omettre dans les notations. Ainsi la
configuration électronique du sodium est notée 3s.

Un atome ou un ion peut, sous l'influence d'une excitation (par exemple absorption d'un photon), se
trouver dans une configuration excitée. L'énergie d'excitation de ces configurations est élevée et
nous n'aurons pas à les considérer dans l'étude des propriétés magnétiques des substances.

Etats quantiques des atomes


A l'approximation du champ central, l'état de l'atome est caractérisé par les états monoélectroniques
occupés et tous les états d'une même configuration sont dégénérés entre eux, c'est-à-dire qu'ils
présentent la même énergie. Cependant on doit tenir compte des interactions non centrales qui sont
de deux natures. Les premières correspondent à la répulsion coulombienne entre les électrons. Elles
sont plus fortes que les secondes relatives au couplage spin - orbite de nature magnétique.

Couplage électrostatique
Le couplage électrostatique provenant de la répulsion coulombienne entre les électrons, traité
comme une perturbation du potentiel central, produit une levée partielle de la dégénérescence entre
tous les états d'une même configuration. Ces états se recombinent alors en états caractérisés par les
valeurs des moments cinétiques orbitaux totaux et de spin total de l'atome :
(9) σ L = ∑ σ i (i ) σ S = ∑ σ s (i )
i i
(l'indice i est relatif aux électrons) tels que :
σ L = [L(L + 1)]1 / 2 h (σ L )z = M L h
(10)
σ S = [S (S + 1)] h (σ S )z = M S h
1/ 2

On représente les nouveaux états quantiques par des kets LM L SM S . L'énergie de ces états
dépend seulement du moment cinétique orbital de l'atome, caractérisé par L, et du moment
cinétique de spin, caractérisé par S. Elle est indépendante de M L et M S . De ce fait, les états
quantiques de même L et S sont dégénérés en énergie et forment un terme dont la dégénérescence
est (2 L + 1)(2 S + 1) . En spectroscopie, un terme est désigné par la lettre majuscule correspondant à
la valeur de L :
(11) L 0 1 2 3 4 5 …
[L] S P D F G H …
Et un indice supérieur à gauche égal à (2S + 1). Par exemple 3 H comprend les états de l'atome tels
que L = 5 et S = 1. La dégénérescence de ce terme est égale à (2 L + 1)(2 S + 1) = 33 .

Pour trouver tous les termes appartenant à une même configuration, on doit réaliser toutes les
sommes vectorielles des vecteurs σ l (i ) et des vecteurs σ s (i ) des électrons, compte tenu du
principe d'exclusion de Pauli. Le problème est complexe en général. Par exemple, dans le cas de
l'ion Pr 3+ possédant deux électrons 4f (l = 3 et s = 1/2), on a :
(12) 0 ≤ L ≤ 6 et 0 ≤ S ≤ 1
et, compte tenu du principe d'exclusion de Pauli, les seuls termes existant sont :
(13) 1 S 3P 1D 3F 1G 3H 1I

Couplage spin - orbite


Lorsque l'on tient compte des effets relativistes, on doit ajouter à l'hamiltonien de l'atome un terme
de la forme :
(14) H SO = ∑ ζ (ri )σ s (i ) ⋅ σ l (i )
i
désigné par couplage spin - orbite. Traité comme une perturbation ajoutée au potentiel central et au
couplage électrostatique, il lève partiellement la dégénérescence entre états d'un même terme. Les
nouveaux états quantiques sont représentés par des kets LSJM J , J et M J étant les nombres
quantiques associés au moment cinétique total
(15) σ J = σ L + σ S
et tels que
(16) σ J = [J ( J + 1)] h et (σ J )z = M J h
1/ 2
L'énergie de ces nouveaux états est indépendante de M J et, de ce fait, ils forment des niveaux de
dégénérescence 2J + 1. Un niveau caractérisé par les trois nombres L, S et J est désigné en
spectroscopie par la notation relative au terme affecté d'un indice inférieur à droite égal à la valeur
de J. Par exemple, un niveau 3 H 4 comprend les états de l'atome tels que L = 5, S = et J = 4. La
dégénérescence de ce niveau est égale à 2J + 1 = 9.

Pour trouver tous les niveaux appartenant à un même terme, on réalise la somme des deux vecteurs
σ L et σ S et l'on a :
(17) L − S ≤ J ≤ L + S

Le nombre de niveaux dans le terme est égal à 2S + 1 si S ≤ L et 2L + 1 si S ≥ L . Ce nombre est


appelé multiplicité du terme.

Niveau fondamental. Règle de Hund


Les états du niveau fondamental d'un atome sont particulièrement importants parce que, dans le
domaine de température inférieur à quelques centaines de kelvins, les atomes (ou ions) se trouvent
généralement sur ce niveau. Nous indiquerons ici la règle de Hund permettant, en conjonction avec
le principe d'exclusion de Pauli, de déterminer le niveau fondamental :
i) Le nombre quantique de spin S est égal à la valeur maximum de M S = ∑i ms (i ) .
ii) Pour cet état de spin, le nombre quantique orbital L est égal à la valeur maximum de
M L = ∑i ml (i )
iii) Pour ces états de spin et de moment orbital, le nombre quantique J a pour valeur L − S (J
minimum) si la couche moins d'à demi pleine et L + S (J maximum) dans le cas contraire.

Moment magnétique de l'atome


Lorsqu'un atome libre se trouve dans un champ magnétique d'induction B, l'interaction des
électrons avec celui-ci peut être décrite par l'hamiltonien :
(18) Hˆ = − µ B (L + 2S ) ⋅ B
où l'on a introduit les grandeurs sans dimension
σL σS
(19) L = et S =
h h
et où µ B désigne le magnéton de Bohr
eh
(20) µ B = = 0.927 × 10 −23 A m 2 = 5.79 × 10 −5 eV T −1
2me
me étant la masse de l'électron. Le premier terme de la somme correspond à l'interaction du
mouvement orbital des électrons avec le champ magnétique et le deuxième à l'interaction des spins
et de ce champ. On remarquera le facteur 2 multipliant S.

L'interaction de l'atome avec le champ magnétique selon (18) produit une levée de dégénérescence
complète de l'atome (effet Zeeman). Pour un niveau de nombres quantiques L, S, J, les 2J + 1 états
acquièrent une énergie supplémentaire
(21) ε (M J ) = M J gµ B B ( M J = − J ,− J + 1, K , J )
où g désigne le facteur de Landé du niveau :
3 S (S + 1) − L(L + 1)
(22) g = +
2 2 J ( J + 1)
Les sous-niveaux de Zeeman sont schématisés dans la figure ci-dessous sur laquelle nous voyons
qu'ils sont régulièrement espacés de ∆ε = gµ B B .
Dans un champ magnétique de 1 tesla et pour g = 2, cet espacement vaut
∆ε = 1.85 × 10 −23 J = 1.16 × 10 −4 eV , correspondant à δ = ∆ε / hc = 0.934 cm −1 ou
Θ = ∆ε / k = 1.34 K .

On peut interpréter les résultats précédents en attribuant à l'atome un moment magnétique


σJ
(23) µ = − gµ B J avec J =
h
tel que :
(24) µ = µ = [J ( J + 1)] gµ B et µ z = (µ ) z = − M J gµ B
1/ 2

L'expression (21) donnant l'énergie des niveaux traduit l'interaction du moment magnétique avec le
champ :
(25) ε = − µ ⋅ B
Lorsque l'on traite la théorie d'un atome dans un champ magnétique de façon plus complète, il
apparaît, en plus de l'hamiltonien Ĥ linéaire en B, un hamiltonien quadratique en B donnant lieu
au diamagnétisme de Larmor. D'autre part, l'application de la théorie des perturbations donne un
terme supplémentaire relatif au paramagnétisme de Van Vleck. Ces deux termes sont de l'ordre de
10 −10 eV pour B = 1 T et peuvent être négligés dans le cas d'atomes ou d'ions avec J ≠ 0 . Ces
derniers sont dit magnétiques tandis que ceux avec J = 0 sont dit diamagnétiques.
Exercices

Dégénérescence des configurations


L'ion praséodyme Pr 3+ de la série des terres rares possède 56 électrons et sa configuration
électronique fondamentale s'écrit :
(1) 4 s 2 4 p 6 4d 10 4 f 2 5s 2 5 p 6
en omettant les couches complètes K, L, M ou 4 f 2 en omettant également les sous-couches
complètes. Trouvez le nombre d'états différents de Pr 3+ appartenant à cette configuration.

Solution
Les deux électrons équivalents de la sous-couche incomplète 4f (n = 4, l = 3) peuvent occuper 2 (2l
+ 1) = 14 états de cette sous-couche. Compte tenu du principe d'exclusion de Pauli et de
l'indiscernabilité des électrons, le nombre d'états différents de Pr 3+ est égal à C142 = 14 × 13 / 2 = 91 .
A l'approximation du champ central ces états ont la même énergie et sont dégénérés entre eux.
L'écart typique entre l'énergie de deux configurations des terres rares est 10 eV ou 10 5 cm −1 .

Dégénérescence des termes


Déterminez la dégénérescence des sept termes de la configuration 4 f 2
de l'ion Pr 3+

Solution
La dégénérescence d'un terme étant (2L + 1)(2S + 1), les sept termes de (13) de la section VI.2.3
contiennent respectivement 1, 9, 5, 21, 9, 33 et 13 états quantiques. On vérifie que le nombre total
d'états est égal à 91, multiplicité de la configuration 4 f 2 . L'écart typique entre deux termes de l'ion
Pr 3+ est 1 eV ou 10 4 cm −1 .

Décomposition des termes en niveaux


Déterminez les notations de tous les niveaux appartenant à la configuration 4 f 2
de l'ion Pr 3+ .
Solution
Les termes de la configuration 4 f 2 , donnés en (13) de la section VI.2.3, correspondent à des
valeurs S = 0 ou S = 1. La multiplicité des termes est donc 1 ou 3. Les notations des différents
niveaux obtenus pour les valeurs de J obéissant à (17) de la section VI.2.3 sont indiqués sur la
figure des niveaux de l'ion Pr 3+ de cette section. L'écart typique entre deux niveaux d'un même
terme est de l'ordre de 0.1 eV ou 10 3 cm −1 .

Niveaux fondamentaux des ions Pr 3+ et Tm 3+


Déterminez les niveaux fondamentaux des ions praséodyme Pr 3+ et thulium Tm 3+ dont la
configuration fondamentale est respectivement 4 f 2 et 4 f 12 .

Solution
Le schéma ci-dessus résume la discussion :
ml 3 2 1 0 −1 − 2 − 3
(2) Pr 3+ ↑ ↑
3+
Tm ↑↓ ↑↓ ↑↓ ↑↓ ↑↓ ↑ ↑

La sous-couche électronique 4f (l = 3) comprend (2l + 1)(2s + 1) = 14 états monoélectroniques. En


appliquant la règle de Hund pour l'ion Pr 3+ , on doit tout d'abord prendre tous les ms égaux à +1/2
( ↑ ) soit S = 1, puis les valeurs de ml 3 et 2, soit L = 5. La sous-couche étant moins d'à demi
pleine, on a J = L - S = 4. L'état fondamental de l'ion Pr 3+ est donc 3 H 4 .

Pour l'ion Tm 3+ , on prend 7 électrons avec ms = +1/2 ( ↑ ) et 5 avec ms = -1/2 ( ↓ ), soit S = 1. La


plus grande valeur de M L = ∑i ml (i ) s'obtient comme il est indiqué sur le schéma et est égale à 5,
soit L = 5. La sous-couche étant plus d'à demi pleine, il faut prendre J = L + S = 6. L'état
fondamental de l'ion Tm 3+ est donc 3 H 6 .
Moment magnétique de l'ion Pr 3+
Déterminez, en unité µ B , la grandeur du moment magnétique de l'ion Pr 3+ dans son niveau
fondamental 3 H 4 .

Solution
Dans ce cas, on a L = 5, S = 1 et J = 4. Le facteur de Landé (22) de la section VI.2.3 vaut donc g =
4/5 et d'après (24) de la section VI.2.3, on a
µ 4
(3) = 20 = 3.58
µB 5
VI.2.4. Modèle de Brillouin du paramagnétisme

Description du modèle
Nous employons comme modèle de substance paramagnétique parfaite un système contenant N
ions magnétiques identiques localisés dans un solide. Nous supposons que les interactions de ces
ions entre eux ou avec les autres ions du solide sont négligeables. Nous considérons donc un
ensemble de N ions paramagnétiques caractérisés par le nombre quantique J et le facteur Landé g
de leur niveau fondamental. Sous l'action d'un champ magnétique d'induction B ce niveau se
décompose en 2J + 1 sous-niveaux Zeeman non dégénérés d'énergie :
(1) ε m = mgµ B B ( m = − J , K ,+ J )
(nous écrivons dorénavant m à la place de M J ).

Loi de répartition
Les ions étant localisés donc discernables, nous appliquons la statistique de Maxwell-Boltzmann.
Le nombre N m d'ions dans l'état m est donné par la loi de Boltzmann :
N m e −β εm
(2) =
N Z
Z étant la fonction de partition. En introduisant la variable sans dimension
µ B
(3) x = Jg B
kT
la fonction de partition du modèle de Brillouin s'écrit :
J J
(4) Z = ∑ e −β εm = ∑e − mx / J
= e x + e ( J −1)x / J + L + e − x
m= − J m= − J

Les divers termes de Z forment une suite géométrique dont la somme est :
1 − e −(2 J +1)x / J e (2 J +1)x / 2 J − e −(2 J +1)x / 2 J
(5) Z = e x =
1 − e−x / J e x / 2J − e −x / 2J
soit :
2J + 1
sinh x
(6) Z = 2 J
1
sinh x
2J

La figure ci-dessous représente les populations relatives N m / N (2) des niveaux pour deux
températures.

On voit qu'un abaissement de température dépeuple les niveaux supérieurs en faveur des niveaux
inférieurs et oriente les moments magnétiques dans le sens du champ. A la limite T = 0, seul le
niveau fondamental est peuplé, le moment magnétique est maximum et l'entropie est nulle. La
température Θ = gµ B B / k , température caractéristique de l'écartement des niveaux, sépare le
domaine des hautes températures ( T >> Θ ) et des basses températures ( T << Θ ).

Fonctions thermodynamiques
Les grandeurs thermodynamiques : entropie, énergie interne, moment magnétique, etc., peuvent
être obtenues à partir de l'énergie libre
(7) F = − NkT ln Z
par utilisation de la relation différentielle
(8) dF = − SdT − M dB

Notons que, du point de vue de la thermodynamique classique, cette forme correspond à l'énergie
libre de la substance, exclusion faite de l'énergie propre au champ. Les expressions des grandeurs
thermodynamiques sont données en fonction de Z. En utilisant l'expression (6) de Z, on trouve pour
le modèle de Brillouin :
 2J + 1   1 
(9) S / Nk = ln sinh  x  − ln sinh  x  − xB J (x )
 2J   2J 
(10) U = F + TS = − NJgµ B BB J ( x )
et
(11) M = NJgµ B B J ( x )
où :
d ln Z 2 J + 1  2J + 1  1  1 
(12) B J ( x ) = = coth  x − coth  x
dx 2J  2J  2J  2J 
est appelée fonction de Brillouin relative au nombre J. Nous étudierons successivement dans ce qui
suit le moment magnétique et l'entropie, l'énergie interne étant liée à M par U = − M B .

Etude du moment magnétique


Le moment magnétique total d'une substance comprenant N ions magnétiques est donné par la loi
de Brillouin (11)
µ B
(13) M = NJgµ B B J ( x ) avec x = Jg B
kT
et sa valeur relative à une mole d'ions magnétiques (et pas nécessairement une mole de substance) a
pour expression
(14) M M = N Jgµ B B J ( x )

Le moment magnétique molaire M M (B, T ) , proportionnel à la fonction de Brillouin, ne dépend que


du rapport B / T = µ 0 H / T . Une telle propriété caractérise une substance paramagnétique parfaite.
Fonction de Brillouin
Les fonctions de Brillouin B J ( x ) définies en (12) sont représentées dans la figure ci-dessous pour
plusieurs valeurs de J.

Les fonctions B J ( x ) sont croissantes en x et, pour x donné, B J ( x ) > B J ′ ( x ) si J < J ′ . Connaissant
les relations :
1 u u3
(15) coth u = 1 + 2e −2u + L (u >> 1) et coth u = + − + L (u << 1)
u 3 45
on en déduit :
(16) B J ( x ) = 1 − exp(− x / J ) + L (x >> 1)
1
J
et

(17) B J ( x ) =
J +1
x−
(2 J + 1) − 1 x 3 + L
4
(x << 1)
45(2 J )
4
3J

Les fonctions B J présentent donc une asymptote horizontale d'ordonnée y = 1 et une région
linéaire étendue au voisinage de x = 0.

Notons que P. Langevin (1905) avait étudié, dans le cadre de la mécanique classique, un modèle
semblable à celui de L. Brillouin (1927). La fonction de Langevin
(18) L( x ) = lim B J ( x ) = coth x −
1
J →∞ x
remplaçait alors les fonctions de Brillouin. Cette fonction, obtenue par intégration sur des
orientations non quantifiées, ne sert plus en magnétisme, mais constitue une bonne approximation
dans l'étude des propriétés diélectriques.

Moment de saturation
Lorsque µ B B >> kT ( x >> 1) , le moment magnétique molaire tend vers la valeur limite
(19) M Ms = NJJgµ B

Ce phénomène de saturation s'interprète à l'échelle atomique par "l'alignement" des moments


magnétiques des ions dans le sens du champ. Plus précisément, tous les ions se trouvent dans l'état
où la valeur de la projection du moment sur le champ est aussi grande que possible m = − J et
(µ z )max = Jgµ B . On a alors M Ms = N(µ z )max . Cette situation est atteinte à basse température
T ≤ 1 K et en champ intense d'induction B ≥ 1 T . Notons que la saturation correspond à une valeur
minimum de l'énergie molaire u s = − M Ms B .
Loi de Curie
Lorsque µ B B << kT ( x << 1) , le moment magnétique molaire prend, compte tenu de (17), la
forme :
J ( J + 1)g 2 µ B2 B
(20) M M = N
3k T

La susceptibilité magnétique χ M de la substance vaut donc :


µ0 J ( J + 1)g 2 µ B2
(21) χ M = M M = µ0 N
B 3kT

Elle suit la loi de Curie χ M = C M / T avec :


J ( J + 1)g 2 µ B2
(22) C M = µ 0 N
3k

La grandeur µ du moment magnétique d'un ion étant connue, on peut écrire la constante de Curie
sous la forme
µ2
(23) C M = µ 0 N
3k

Dans les expériences usuelles utilisant des substances paramagnétiques, on se trouve généralement
dans le domaine où la loi de Curie est valable. Les transformations d'unités pour les constantes pour
les constantes de Curie suivent celles de la susceptibilité.

Discussion expérimentale
La loi de Brillouin a pu être vérifiée sur un certain nombre de substances dans lesquelles les
moments magnétiques se comportent comme s'ils étaient libres jusqu'à des températures d'environ
1K. Les résultats expérimentaux relatifs au sulfate de Gadolinium suivent très bien les courbes de la
figure précédente. Le moment magnétique relatif à une mole d'ions Gd 3+ a pour valeur de
saturation M Ms = 39.1 A m 2 mole −1 . Cette valeur permet de déterminer le produit Jg
M Ms
(24) Jg = = 7.0
Nµ B

La valeur de x s'écrit alors numériquement


µ B
(25) x = Jg B = 0.59 × 10 −5
(
H A m −1 )
kT T (K )

Les points expérimentaux donnant M M / M Ms en fonction de x se placent sur la courbe B J ( x ) pour


J = 7/2, ce qui entraîne g = 2.0 d'après (24). Ces résultats sont en accord avec les données
spectroscopiques : l'état fondamental de l'ion Gd 3+ de configuration 4 f 7 est 8 S 7 / 2 (L = 0, S = 7/2,
J = 7/2) et a donc pour facteur de Landé g = 2.

Dans les cas où le moment magnétique peut être mesuré jusqu'à la saturation la méthode précédente
permet de déterminer des valeurs effectives de J et g, que nous noterons J eff et g eff . Les
expériences de saturation magnétique étant difficiles à réaliser, les données expérimentales
obtenues sont en général relatives au domaine de la loi de Curie. La mesure de la constante de
Curie ne permet alors de déterminer que le produit
(26) p eff = [J eff ( J eff + 1)] g eff
1/ 2

appelé nombre effectif paramagnétique de magnétons de Bohr. Comme nous le verrons dans la
section suivante, les valeurs de p eff diffèrent souvent des valeurs théoriques pour l'ion libre, en
raison de la présence du champ cristallin.

Entropie
L'entropie d'une substance comprenant N ions magnétiques est donnée dans le modèle de Brillouin
par (9) :
 2J + 1   1 
(27) S / Nk = ln sinh  x  − ln sinh  x  − xB J (x )
 2J   2J 

C'est une fonction décroissante de x = Jgµ B B / kT .


La valeur limite de l'entropie en champ nul ( B → 0 ) ou à haute température est
(28) lim S = Nk ln (2 J + 1)
x →0

Elle correspond au fait que, en champ nul, les 2J + 1 niveaux sont dégénérés entre eux et que la
probabilité thermodynamique W vaut (2 J + 1) . La relation de Boltzmann S = k ln W donne alors
N

l'expression (28).

Lorsque la température tend vers zéro en champ magnétique non nul, l'entropie (9) tend vers zéro,
ce qui correspond au fait que le niveau le plus bas, non dégénéré, est seul peuplé. Nous utiliserons
la fonction entropie lors de la discussion relative à la désaimantation adiabatique.

Le modèle de Brillouin s'applique à des atomes localisés. La loi de Brillouin donnant le moment
magnétique est cependant valable pour les gaz, peu nombreux, dont les molécules possèdent un
moment magnétique permanent, tel que O2 , NO et NO2 .
Exercices

Fonction de Brillouin pour J = 1/2


Trouvez à partir des expressions générales (6) et (12) de section VI.2.4 de Z et B J , les formes
particulières obtenues pour J = 1/2.

Solution
Les expressions générales donnent pour J = 1/2 :
et B1 / 2 ( x ) = 2 coth 2 x − coth x
sinh 2 x
(1) Z =
sinh x

En utilisant les relations :


(2) sinh 2 x = 2 sinh x cosh x et cosh 2 x = cosh 2 x + sinh 2 x
on obtient en reportant :
(3) Z = 2 cosh x et B1 / 2 ( x ) = tanh x
VI.2.5. Propriétés des substances paramagnétiques solides

Ions des éléments de transition


Dans les solides ioniques, la plupart des ions ont des couches électroniques complètes ( Na + , Cl − ,
O 2− , etc.) et n'ont donc pas de moment permanent : la plupart des substances solides sont
diamagnétiques. Les seuls ions donnant lieu à des phénomènes de paramagnétisme appartiennent
aux séries de transition, pour lesquelles une sous-couche d ou f est incomplète. Il existe trois séries
correspondant au remplissage de sous-couches d : série du fer (3d), du palladium (4s) et du platine
(5d), et deux séries correspondant aux sous-couches f : série des terres rares (4f) et des actinides
(5f). Les sels les plus utilisés pour leurs propriétés magnétiques sont ceux comprenant des ions de
la série du fer ou des terres rares. Nous les étudierons plus particulièrement en tenant compte de
leur interaction avec le cristal.

Champ cristallin
Lorsque dans un cristal les ions sont assez éloignés les uns des autres, leurs interactions
magnétiques peuvent être négligées jusqu'à des températures assez basses. Mais on ne peut pas
négliger leurs interactions avec les ions diamagnétiques de leur entourage immédiat dans le cristal.

L'ion magnétique se trouve en effet dans un champ cristallin de nature électrostatique. Les 2J + 1
différents états d'un même niveau atomique correspondent à des distributions de charges
électroniques différentes et sont perturbés différemment par le champ cristallin. Il en résulte une
levée de dégénérescence, la décomposition étant d'autant plus poussée que la symétrie du champ
cristallin est plus basse. Cependant, H.A. Kramers (1930) a montré qu'un ion possédant un nombre
impair d'électrons (nombre quantique de spin demi-entier) a des niveaux qui restent au moins
doublement dégénérés, les états de moments magnétiques opposés étant associés deux à deux. Cette
dégénérescence, liée à la symétrie par renversement du temps (t  -t), ne peut être levée que par
l'action sur l'ion d'un champ magnétique. Des niveaux simples (non dégénérés) ne peuvent donc
exister que pour des ions possédant un nombre pair d'électrons.
~
On introduit alors, pour chaque niveau de l'ion dans le cristal, la notion de spin effectif S choisi de
~
façon que 2 S + 1 soit égal à la dégénérescence du niveau en champ nul. On introduit
simultanément un facteur de décomposition spectroscopique g~ tel que, en présence d'un champ,
l'énergie des sous-niveaux Zeeman soit, par analogie avec le paramagnétisme parfait :
~
(1) ε m = − µ ⋅ B = g~µ B S ⋅ B = m
~ g~µ B
B

avec m ~ = − S , K , S . Par exemple, pour un doublet de Kramers, on pose S~ = 1 / 2 et m


~ ~ ~ = ±1 / 2 . Il
~
est important de noter que le spin effectif S et le facteur g~ ne représentent pas en général le
moment cinétique et le facteur de Landé de l'état fondamental de l'ion libre.

L'étude des niveaux d'énergie des ions magnétiques dans les cristaux, et en particulier la mesure de
~
S et g~ , donne lieu à de nombreuses recherches en spectroscopie. En général, un champ
magnétique d'induction B est appliqué au cristal et provoque l'écartement des niveaux d'énergie en
~
2S + 1 sous-niveaux espacés de ∆ε = g~µ B B . Lorsqu'une onde électromagnétique traverse la
substance, il se produit des absorptions résonnantes pour des fréquences telles que hν = ∆ε .
~
L'énergie des photons absorbés ou émis permet alors la détermination de S et g~ . En spectroscopie
optique, le domaine exploré s'étend depuis l'infrarouge lointain ( ≅ 10 cm −1 ) jusqu'à l'ultraviolet
( ≅ 50000 cm −1 ). En résonance paramagnétique électronique (RPE), le domaine couvert ne s'étend
qu'entre zéro et quelques cm −1 , mais avec une précision plus grande.

Remarquons que l'effet Zeeman n'est généralement pas isotrope, c'est-à-dire que ε m varie avec
l'orientation de B. On doit alors considérer g~ comme un tenseur symétrique d'ordre 2, tel que :
(2) ε = µ S [g~ ]B ou ε = µ g~ S B
~ ~
m B m B ij i j

Ce tenseur, rapporté à ses axes principaux, a trois valeurs principales g~ xx , g~ yy et g~ zz . Si


l'entourage de l'ion présente un axe de symétrie d'ordre supérieur à 2 on a g~ xx = g~ yy = g~⊥ et
g~ = g~ . Si cet entourage a la symétrie cubique g~ = g~ = g~ = g~ .
zz || xx yy zz
Ions des terres rares
Le cas des ions des terres rares est relativement simple car la couche incomplète 4f est "protégée"
de l'influence du champ cristallin par des sous-couches complètes plus externes 5s et 5p.
L'influence du champ cristallin, plus faible que l'interaction spin - orbite, s'introduit comme une
perturbation des niveaux L, S, J de l'ion libre. Il en résulte, pour un niveau J, une levée de la
dégénérescence de degré 2J + 1, en sous-niveaux dont la séparation totale est de l'ordre de
100 cm −1 , c'est-à-dire de l'ordre de 100 K.

( )
Par exemple, l'ion terbium libre Tb 3+ 4 f 8 a, d'après la règle de Hund, pour niveau fondamental
7
F6 , le premier niveau excité 7 F5 se trouvant à environ 2000 cm −1 . Dans le cristal d'éthylsulfate
Tb(C 2 H 5 SO4 )3 ⋅ 9 H 2 O , l'ion Tb 3+ a un axe de symétrie ternaire et le champ cristallin décompose
son niveau fondamental en 9 sous-niveaux simples ou doubles d'énergie 0 cm −1 , 88 cm −1 ,…
131 cm −1 . Le sous-niveau fondamental est un doublet, présentant une très légère décomposition de
0.387 cm −1 (due à des ordres plus élevés de la perturbation). En attribuant à ce doublet un spin
~
effectif S = 1 / 2 , la résonance paramagnétique fournit la valeur du facteur de séparation
spectroscopique g~ = 17.82 . Pour déterminer l'origine de ce doublet, on identifie l'écart ∆ε = g~µ B B
entre ses deux niveaux Zeeman à l'écart théorique ∆ε = ∆mgµ B B entre deux niveaux Zeeman de
l'ion libre, g = 1.5 étant le facteur de Landé du niveau 7 F6 de l'ion libre. On obtient ainsi
∆m = g~ / g = 11.88 . Le résultat, voisin de 12, montre que le doublet fondamental comprend les
deux états ± m = ± 6 . La théorie du champ cristallin montre bien que ces deux états doivent
former un doublet. Notons que, dans ce cristal uniaxe, g~ est anisotrope avec g~ = 17.82 et
||

g~⊥ ≅ 0 .

A température ordinaire, les mesures de susceptibilité des sels de terres rares permettent de
déterminer la constante de Curie et d'en déduire le nombre effectif paramagnétique de magnétons
de Bohr correspondant. Ceux-ci sont donnés dans le tableau ci-dessous.
Ion n S L J Etat fond. g pth = p exp
(4f)
[J (J + 1)]1 / 2 g
Ce 3+ 1 1/2 3 5/2 2
F5 / 2 6/7 2.54 2.4
Pr 3+ 2 1 5 4 3
H4 4/5 3.58 3.5
3+ 3 3/2 6 9/2 4 8/11 3.62 3.5
Nd I9/ 2
Pm 3+ 4 2 6 4 5
I4 3/5 2.68 instable
Sm 3+ 5 5/2 5 5/2 6
H5/ 2 2/7 0.84 1.5
Eu 3+ 6 3 3 0 7
F0 - 0 3.4
Gd 3+ 7 7/2 0 7/2 8
S7 / 2 2 7.94 8.0
Tb 3+ 8 3 3 6 7
F6 3/2 9.72 9.5
Dy 3+ 9 5/2 5 15/2 6
H 15 / 2 4/3 10.63 10.6
Ho 3+ 10 2 6 8 5
I8 5/4 10.60 10.4
Er 3+ 11 3/2 6 15/2 4
I 15 / 2 6/5 9.59 9.5
Tm 3+ 12 1 5 6 3
H6 7/6 7.57 7.3
3+ 13 1/2 3 7/2 2 8/7 4.54 4.5
Yb F7 / 2

A 300 K, l'écartement dans le champ cristallin des sous-niveaux provenant du niveau fondamental
de l'ion libre devant kT, l'ion se comporte comme s'il était libre et :
(3) pth = [J (J + 1)] g
1/ 2

Le tableau permet la comparaison des valeurs expérimentales et théoriques de p. L'accord est


satisfaisant sauf pour les ions Sm 3+ et Eu 3+ dont les ions libres possèdent des niveaux
électroniques excités proches du niveau fondamental.

Lorsque kT est de l'ordre de l'écartement des sous-niveaux résultant de l'action du champ cristallin,
l'interprétation est complexe car il faut considérer l'action du champ magnétique sur plusieurs sous-
niveaux. La loi de Curie n'est plus valable. Lorsque kT est inférieur à l'écartement des sous-niveaux
les plus bas, seul le sous-niveau fondamental doit être pris en compte et la valeur obtenue alors
[(~ ~
)]1/ 2
pour p est égale à S S + 1 g~ .

Ions de la série du fer


Pour les ions de la série de transition, la couche électronique incomplète 3d, 4d ou 5d est la plus
externe et le champ cristallin produit une perturbation plus importante que celle du couplage spin -
orbite. On doit donc considérer l'action de ce champ sur les termes de l'ion avant celle du couplage
spin - orbite.

Le champ cristallin lève la dégénérescence liée au moment orbital du terme avec des séparations
d'environ 10 4 cm −1 . Pour les niveaux qui en résultent, la projection du moment cinétique sur un axe
n'a plus une valeur constante et, dans le cas d'un singulet, sa valeur moyenne est nulle. Il en est de
même du moment magnétique associé au mouvement orbital. On dit que le moment cinétique
orbital est "bloqué" (en anglais quenched, c'est-à-dire éteint). Le spin, libre de s'orienter, contribue
alors seul au moment magnétique de l'ion. La dégénérescence de spin, égale à 2S + 1, est levée par
l'action du couplage spin - orbite qui, dans ce cas, ne provoque que de très faibles écarts de niveaux
( ≅ 0.1 cm −1 ). Si le niveau n'est pas un singulet, le moment cinétique orbital n'est plus complètement
bloqué et le couplage spin - orbite est plus important.

( )
Prenons comme exemple celui de l'ion chrome Cr 3+ 3d 3 . A l'état libre, d'après la règle de Hund,
4
le niveau fondamental est F3 / 2 et provient du terme 4 F . Dans l'alun de chrome et de césium, l'ion
Cr 3+ a une symétrie ternaire et le champ cristallin lève la dégénérescence orbitale, le niveau
fondamental étant un singulet orbital. Le moment cinétique orbital est bloqué et le niveau
fondamental possède une dégénérescence de spin 2S + 1 = 4. L'étude en résonance paramagnétique
~
montre que le niveau de base est bien un quadruplet ( S = 3 / 2 ) et que le facteur de décomposition
spectroscopique g~ = 1.98 est très proche de 2, valeur attendue pour un spin seul. La différence
faible entre ces valeurs provient de l'action résiduelle du couplage spin - orbite qui est également
responsable de séparation du quadruplet de base en deux doublets de Kramers ± 3 / 2 et ± 1 / 2
distants de δ = 0.133 cm −1 .
A température ordinaire les mesures de susceptibilités des sels de la série du fer donnent la valeur
de la constante de Curie et le nombre effectif paramagnétique de magnétons de Bohr. Le tableau ci-
dessous permet la comparaison entre la valeur expérimentale p exp de ce nombre et sa valeur
théorique due au spin seul.
(4) pth = [S (S + 1)] g = 2[S (S + 1)]
1/ 2 1/ 2

Ion n (3d) S L J Etat fond. pth p exp


Ti 3+ 1 1/2 2 3/2 2
D3 / 2 1.73
V 4+ 1 1/2 2 3/2 2
D3 / 2 1.73 1.8
V 3+ 2 1 3 2 3
F2 2.83 2.8
2+ 3 3/2 3 3/2 4 3.87 3.8
V F3 / 2
Cr 3+ 3 3/2 3 3/2 4
F3 / 2 3.87 3.7
Mn 4+ 3 3/2 3 3/2 4
F3 / 2 3.87 4.0
2+ 4 2 2 0 5 4.9 4.8
Cr D0
Mn 3+ 4 2 2 0 5
D0 1.9 5.0
Mn 2+ 5 5/2 0 5/2 6
S5 / 2 5.92 5.9
Fe 3+ 5 5/2 0 5/2 6
S5 / 2 5.92 5.9
Fe 2+ 6 2 2 4 5
D4 4.9 5.4
Co 2+ 7 3/2 3 9/2 4
F9 / 2 3.87 4.8
Ni 2+ 8 1 3 4 3
F4 2.83 3.2
2+ 9 1/2 2 5/2 2 1.73 1.9
Cu D5 / 2

L'accord est satisfaisant sauf pour l'ion Co 2+ dont le niveau de base n'est pas un singulet orbital.
Pour des ions dont le niveau fondamental ne présente pas de dégénérescence orbitale (L = 0) ou
dont le moment cinétique orbital est bloqué dans le cristal, la loi de Curie reste valable jusqu'à des
températures très basses (~1 K). C'est le cas des ions Cr 3+ , Mn 2+ et Fe 3+ .
VI.2.6. Désaimantation adiabatique électronique

Introduction
La méthode de désaimantation adiabatique électronique a été proposée indépendamment par P.
Debye (1926) et W.F. Giauque (1927). Etant donné les difficultés techniques, les premiers résultats
expérimentaux ne furent obtenus qu'à partir de 1933. Cette méthode, qui utilise de l'hélium liquide
aux environ de 1 K comme premier étage de refroidissement, permet d'obtenir de façon courante
des températures de l'ordre de 10 −2 K et jusqu'à 10 −3 K .

Exposé de la méthode
Considérons le cas schématique d'une substance comprenant des ions magnétiques sans interaction
dont le niveau fondamental dans le cristal, bien séparé du premier niveau excité, est un doublet
~
( S = 1 / 2 ) (figure (a) ci-dessous).

On suppose que les deux composantes de ce doublet sont séparées par une différence d'énergie
ε = hcδ = kΘ avec Θ << 1 K ( δ << 1cm −1 ). Dans le domaine de température considéré, l'énergie,
l'entropie et la capacité calorifique de la substance sont celles du système d'ions magnétiques, la
contribution du réseau cristallin étant négligeable.

Dans l'état initial, la substance est mise, en champ nul, au contact d'un bain d'hélium liquide, sous
pression réduite, de température Ti ≅ 1 K . Dans cet état, les deux composantes du doublet, dont le
rapport des populations est
N  ε   Θ
(1) 2 = exp −  = exp − 
N1  kTi   Ti 
sont presque également peuplées car Ti >> Θ et l'aimantation est négligeable. L'entropie molaire
des ions est s = R ln 2

Dans une première transformation (ab), on crée un champ magnétique d'induction B de l'ordre de 1
T, en maintenant la substance au contact du bain (transformation isotherme). Le champ magnétique
écarte les deux composantes de ∆ε = gµ B B ~ 10 −23 J ~ 10 −4 eV , ce qui correspond à une
température caractéristique ∆ε / k ~ 1 K très supérieure à Θ (figure (b) ci-dessus). Les populations
des niveaux se réajustent de façon que :
N  ∆ε   gµ B B 
(2) 2 ≅ exp −  = exp − 
N1  kTi   kTi 

Le niveau de base est alors le plus peuplé et la substance acquiert une aimantation dans le sens du
champ. Au cours de cette transformation isotherme, l'énergie et l'entropie décroissent. Il se produit
un dégagement de chaleur.

La deuxième transformation (bc) est une réduction du champ jusqu'à B = 0, la substance étant
préalablement isolée du bain d'hélium. On retrouve alors les mêmes niveaux d'énergie que dans
l'état initial (a) (figure (c) ci-dessus) mais avec les populations de l'état (b), car dans la
transformation adiabatique (bc), les populations ne changent pas (pas d'échange d'énergie avec
l'extérieur et donc pas de changement de niveau). La température finale T f du système de spins
peut alors être déterminée par la loi de Boltzmann :
 ε   
(3)
N2
= exp −  = exp − Θ 
N1  kT   T 
 f   f 
elle vaut, par comparaison à (2)

(4) T f = Ti
gµ B B

Avec les valeurs typiques B = 1 T, g = 2, Θ = 0.01 K et T1 = 1 K on trouve T f = 7.4 × 10 −3 K .

La méthode de désaimantation adiabatique a des applications très importantes car, outre le fait
qu'elle permet d'abaisser la température d'une substance paramagnétique jusqu'à T ≅ Θ ≅ 10 −2 K ,
cette dernière peut jouer le rôle de thermostat pour refroidir d'autres substances. En effet, une
substance telle que celle que nous venons de décrire possède aux environs de T = Θ une capacité
calorifique présentant une anomalie de Schottky et dont la valeur molaire, de l'ordre de R, est bien
supérieure à celle des autres substances aux mêmes températures (dans un système à deux niveaux
tel que celui-ci, lorsque l'énergie thermique est environ celle séparant les niveaux, le transfert
d'énergie thermique vers le matériau est facilité et sert à repeupler le niveau supérieur). La
désaimantation adiabatique a donc permis d'accéder à un nouveau domaine de température.

Notons que, dans la transformation adiabatique, les populations des niveaux, et par suite
l'aimantation de la substance, restent constantes. Le terme de désaimantation, consacré par l'usage à
cette transformation, n'est donc pas adéquat.

Diagramme entropique
On peut illustrer l'exposé précédent en considérant le diagramme entropique représentant l'entropie
molaire s en fonction de la température T pour différentes valeurs du champ magnétique
d'induction B. Nous conserverons le modèle à deux niveaux envisagé ci-dessus pour lequel
l'entropie molaire s'écrit (en statistique de Maxwell-Boltzmann) :
ε + gµ B B
(5) = ln (1 + e − y ) +
s y
avec y =
R 1+ e y
kT
La figure ci-dessous est un diagramme entropique où deux courbes ont été tracées pour B = 0 et
B ≠ 0 selon (5).

L'aimantation isotherme (ab) est représentée sur cette figure par une verticale, l'entropie décroît à
température constante. La désaimantation adiabatique (bc), représentée par une horizontale, met en
évidence le refroidissement de la substance à entropie constante.

La discussion précédente portant sur un modèle simple se généralise aux cas des substances réelles,
pour lesquelles les courbes donnant l'entropie gardent la même allure. En particulier, dans le
domaine de température parcouru, l'expression approchée de l'entropie molaire (5) en champ nul :
s y2 Θ2
(6) ≅ ln 2 − = ln 2 − 2
R 8 8T
( ~
)
se conserve avec ln 2 remplacé par ln 2 S + 1 . Le paramètre Θ est déterminé expérimentalement
par des mesures de capacité calorifique, donnant :
ds R Θ 2 A
(7) cV = T = 2
= 2
dT 4 T T

Le paramètre effectif Θ résultant des mesures englobe les contributions dues à l'écartement des
niveaux sous l'influence du champ cristallin ainsi que celles qui sont dues aux interactions
magnétiques entre les ions et à la structure hyperfine.

De même, en champ non nul, l'expression de l'entropie molaire (5)


s g 2 µ B2 B 2
(8) ≅ ln 2 −
R 8k 2 T 2
se généralise en :
s
(
~
)
(9) = ln 2 S + 1 − M
R
C B2
2µ 0 R T 2
où C M est la constante de Curie relative à une mole d'ions.

Choix des substances paramagnétique


Le choix de la substance utilisée pour réaliser une expérience de désaimantation adiabatique est très
important. En effet, le diagramme entropique de la figure ci-dessus permet de voir que
l'abaissement de la température initiale Ti ou l'augmentation du champ d'induction initiale B ne
conduisent qu'à de faibles variations de la température finale T f , car l'entropie de la substance en
champ nul varie très rapidement au voisinage de la température Θ , ce qui entraîne T f ~ Θ . Pour
atteindre de très basses températures, il convient donc d'utiliser une substance dont la valeur de Θ
ou celle de A = RΘ 2 / 4 soit la plus basse possible. De plus, une constante de Curie C M élevée est
avantageuse car elle permet d'abaisser la valeur de l'entropie au point b (figure ci-dessus).

Les substances utilisées sont en général des sels doubles hydratés, tels que les aluns, dans lesquels
les ions magnétiques sont très espacés et n'ont qu'une faible interaction. On utilise aussi des
cristaux magnétiques dilués constitués d'une substance diamagnétique dopée avec des ions
paramagnétiques. Les ions magnétiques choisis sont principalement le manganèse Mn 2+ , le fer
Fe3+ et le gadolinium Gd 3+ car, ayant une couche électronique à demi complète, ils ont un
moment orbital nul. On utilise aussi le chrome Cr 3+ dont le moment orbital est bloqué, ainsi que le
cuivre Cu 2+ et le cérium Ce 3+ dont le niveau fondamental est un doublet de Kramers séparé
seulement par les interactions magnétiques. Le tableau ci-dessous donne les principales propriétés
des sels les plus utilisés en désaimantation adiabatique.

Ion Substance ρ (10 3 (


M 10 −3
kg m −3
) kg mole −1 )
Mn 2+
Mn( NH 4 )2 (SO4 )2 ⋅ 6 H 2 O 1.83 391
Fe 3+ Fe( NH 4 )(SO4 )2 ⋅ 12 H 2 O 1.70 482
Gd 3+
Gd 2 (SO4 )3 ⋅ 8 H 2 O 3.01 2 x 373
Cr 3+ Cr ( NH 3CH 3 )(SO4 )2 ⋅ 12 H 2 O 1.66 492
Cu 2+
CuK 2 (SO4 )2 ⋅ 6 H 2 O 2.22 442
Ce 3+ Ce 2 Mg 3 ( NO3 )12 ⋅ 24 H 2 O 2.0 2 x 765

Ion ~
S g~ (
C M 4π ⋅ 10 −6 (
A / R 10 −2 ) (
T f / Ti 10 −2 )
K m mole 3 −1
) (Bi = 1T )
Mn 2+ 5/2 2.00 4.38 3.4 8.0
Fe 3+ 5/2 2.00 4.37 1.3 5.0
Gd 3+ 7/2 1.99 7.82 37 19
Cr 3+ 3/2 1.98 1.87 1.9 9.2
Cu 2+ 1/2 2.45 (||) 0.445 (poudre) 0.06 3.3
2.14 ( ⊥ )
Ce 3+ 1/2 0.25 (||) 0.318 ( ⊥ ) 0.00075 0.44
1.84 ( ⊥ )
Expériences de désaimantation adiabatique
La figure ci-dessous représente un type de cryostat.

Un vase de Dewar D rempli d'hydrogène sert d'écran thermique à un récipient métallique V


contenant l'hélium. La pression de vapeur de l'hélium est réduite à l'aide d'une puissante pompe
maintenant la température aux environs de 1 K. La substance paramagnétique P est suspendue par
des fils à l'intérieur de la cellule C qui contient de l'hélium gazeux permettant les échanges
thermiques. Un électro-aimant A (ou une bobine supraconductrice) crée un champ aimantant la
substance. Cette aimantation est effectuée de façon isotherme, le contact thermique entre la
substance et l'hélium liquide étant assuré par un gaz d'échange contenu dans l'espace libre G.

Afin d'effectuer la désaimantation adiabatique, la cellule C est isolée de l'hélium liquide par
pompage du gaz d'échange de G, puis le cryostat est sorti du champ de l'électro-aimant. La
température finale atteinte est déterminée à partir de mesures de susceptibilité utilisant les bobines à
induction mutuelle B et B'. La substance P se refroidit ainsi jusqu'à une température de l'ordre de 10
mK. Sa capacité calorifique molaire à ces températures étant très grande (~0.1 R), la substance peut
être utilisée pour refroidir et étudier d'autres substances dans ce domaine de température.
VI.2.7. Désaimantation adiabatique nucléaire

Principe
Le principe de la désaimantation adiabatique nucléaire ou refroidissement nucléaire a été proposé
indépendamment par C.J. Gorter (1934) et par N. Kurti et F.E. Simon (1935). Ces auteurs
suggéraient d'appliquer la méthode de désaimantation adiabatique non plus aux moments
magnétiques électroniques des atomes mais aux moments magnétiques des noyaux, afin d'atteindre
le domaine des températures inférieures au millikelvin.

Qualitativement, les deux désaimantations adiabatiques électronique et nucléaire sont semblables et


le formalisme introduit précédemment est valable. Cependant, il existe une différence quantitative
notable par le fait que les moments magnétiques des noyaux sont de l'ordre de grandeur du
magnéton nucléaire :
eh
(1) µ N = = 5.051 × 10 − 27 J T −1
2m p
dont la valeur est m p / me = 1836 fois plus faible que celle du magnéton de Bohr µ B ( m p
représente la masse du proton). En particulier, des valeurs identiques de l'entropie sont obtenues
pour des valeurs de B/T environ 1000 fois plus grandes. Les conditions initiales d'un
refroidissement nucléaire sont donc plus difficiles à mettre en œuvre : température initiale plus
faible ( Ti ~ 10 mK ) et champ magnétique plus intense ( Bi ~ 5 T ).

Comme nous l'avons vu précédemment, la température finale dépend de l'entropie du système de


spins nucléaires en champ nul. La variation de l'entropie résulte d'anomalies de Schottky provenant
d'interactions dipolaires magnétiques entre les noyaux s'interprétant par un champ magnétique
interne d'induction
µ0 µ
(2) b ~
4π r 3
dont la valeur est d'environ 10 −3 T . Les températures finales qui peuvent être atteintes par cette
méthode sont donc, par analogie avec la désaimantation adiabatique électronique
b
(3) T f = Ti ~ 10 −6 K
Bi
on peut donc pénétrer ainsi dans le domaine des microkelvins. La première expérience de
refroidissement magnétique nucléaire, réalisée par N. Kurti et al. (1956) a permis d'obtenir pour un
système de spins nucléaires une température de 20 µ K .

Exemple du cuivre
Le cuivre est une substance qui a été très utilisée pour le refroidissement nucléaire. Ses deux
isotopes stables ont un spin nucléaire J = 3/2 et un facteur de séparation spectroscopique moyen g =
1.5. La distance entre les noyaux des atomes plus proches voisins dans le cristal étant r = 1.63Å , le
champ magnétique interne b, calculé à partir de (2), vaut 3.4 × 10 −4 T , valeur proche de la valeur
expérimentale b = 3 × 10 −4 T .

La figure ci-dessous représente l'entropie pour le système de spins en fonction de la température


dans un champ extérieur d'induction Bi = 6 T et pour un champ B = b (champ extérieur nul).
Une aimantation isotherme à la température Ti = 10 mK jusqu'au champ magnétique Bi est
représentée par le segment ab. On voit que dans ces conditions, la diminution relative d'entropie est
très faible. Cependant la désaimantation adiabatique représentée par le segment bc produit, pour le
système de spins, une température T f = 0.5µ K .

Le résultat précédent suppose le système de spins découplé des électrons de conduction et du


réseau. En fait, il se produit des échanges entre noyaux et électrons avec une constante de temps τ 1 ,
appelée temps de relaxation "spin - réseau" définie par :
d  1  1 1 1
(4)   = −  − 
dt  TN
 τ 1  TN T 
où Te est la température du système d'électrons et du réseau et TN la température instantanée du
système de spins. Ce temps de relaxation est proportionnel à 1 / Te
(5) τ 1Te = κ = 0.4 s K
car les électrons participant aux échanges sont voisins du niveau de Fermi et leur nombre est
proportionnel à Te . κ s'appelle constante de Korringa.

Sous l'effet de ces échanges seuls, la température d'équilibre finale serait très voisine de T f car le
réseau et les électrons ont une très faible capacité calorifique. Cependant on doit tenir compte des
fuites thermiques Q& qui se produisent inévitablement. On atteint alors un régime dans lequel les
noyaux ont une température TN ≅ T f et les électrons et le réseau ont une température supérieure Te
que l'on obtient en écrivant que le flux de chaleur provenant des fuites est égal à celui allant vers les
noyaux :
(6) Q& = C N T&N
C N étant la capacité calorifique du système de spins nucléaires. En utilisant (4) et (5), cette égalité
conduit à :
 Q& κ 
(7) Te = TN 1 + 2 
 C N TN 

Avec la valeur numérique C N / R = 0.14 et pour une fuite thermique Q& = 10 −9 W mole −1 , on trouve
(avec TN ≅ T f ) Te = 700 µ K . C'est cette température qui devra être prise en compte si l'on désire
refroidir une autre substance. Notons qu'elle ne peut être maintenue que quelques minutes.

La température Te la plus basse possible ne s'obtient pas avec la température TN la plus faible mais
avec la température :
 Q& κ 
(8) TN =   = 30µ K
 CN 
minimisant l'expression (7) de Te (nous avons pris ici la valeur de κ pour une induction
B > 10 −2 T , κ = 1.1 s K ). On a alors Te = 60 µ K . Pour réaliser cette température TN , il suffit
d'arrêter la désaimantation lorsque l'induction atteint la valeur
T
(9) B = Bi N = 1.8 × 10 −2 T
Ti

La valeur minimum de Te résulte d'un compromis entre l'obtention d'une valeur de TN assez basse
et le maintien d'une grande énergie (négative) du système de spins. Il en résulte aussi que la
température Te ainsi obtenue peut être conservée longtemps (plusieurs heures).

Réalisations expérimentales
La discussion précédente montre que, pour obtenir les températures les plus basses, il faut utiliser
une substance de grande capacité calorifique, donc de grande constante de Curie nucléaire, et de
faible constante de Korringa κ (5). De plus, cette substance doit avoir une grande conductivité
thermique pour servir à refroidir d'autres substances. Elle doit par ailleurs présenter de bonnes
qualités mécaniques. Ces conditions ne peuvent exister que pour un métal ou un alliage ne
présentant pas de supraconductivité. Le cuivre, représentant un optimum, est la substance la plus
utilisée. Il est courant actuellement d'employer deux étages de refroidissement nucléaire utilisant
par exemple l'alliage Pr Ni5 pour le premier étage et le cuivre pour le second.

La figure ci-dessous présente le schéma d'une cellule expérimentale utilisant des copeaux de cuivre
comme réfrigérant pour l'étude des mélanges He 3 − He 4 .
La cellule est mise en contact thermique avec la chambre de mélange D d'un réfrigérateur à dilution
par l'intermédiaire d'un interrupteur thermique supraconducteur. Ce dispositif permet d'amener la
cellule à une température initiale de l'ordre de 15 mK. L'aimant supraconducteur A crée un champ
extérieur d'induction B = 7 T, le contact thermique avec le réfrigérateur à dilution étant assuré.
Après avoir coupé le contact thermique, on interrompt le champ créé par l'aimant A, ne conservant
que le faible champ final d'induction B = 0.35 T produit par le solénoïde auxiliaire S. On atteint
ainsi une température de 0.85 mK dans la cellule contenant les copeaux de cuivre immergés dans
l'hélium He 3 . Avec une fuite thermique de 5 nW, la cellule peut rester au-dessous de 3 mK durant
6 jours.
VI.2.8. Mesure des températures inférieures à 1 K
Aux températures inférieures à 1 K, l'établissement d'une échelle de température absolue ne peut
plus s'effectuer à partir des propriétés des gaz. On se sert alors d'échelles intermédiaires de
"températures magnétiques" T ∗ . Ces températures sont définies à partir de la mesure de la
susceptibilité par la relation
C
(1) χ = ∗
T
extrapolant la loi de Curie pour une substance donnée dans un domaine de température où celle-ci
n'est plus nécessairement valable. Dans le domaine où la substance suit la loi de Curie, les
températures magnétique T ∗ et absolue T sont égales. En dehors de ce domaine, à plus basse
température, seule une méthode thermodynamique, basée sur la relation T = (∂U / ∂S )B permet
d'établir la correspondance entre T et T ∗ .

( )
Pour cela, on détermine la relation S T ∗ , B = 0 par une série de désaimantations adiabatiques pour
diverses valeurs du champ initial B à partir d'une même température initiale Ti (figure ci-dessous).
A la température initiale, l'échelle absolue est connue et on détermine de façon calorimétrique la
fonction S (Ti , B ) . Notons que, si la substance suit la loi de Curie, on peut alors utiliser l'expression
pour l'entropie que nous avons vue. Lors d'une désaimantation adiabatique, l'entropie reste
constante, soit S ( A1′ ) = S ( A1 ) et la température magnétique finale T ∗ étant repérée, on a la relation
( )
S T ∗ , B = 0 = S (Ti , B ) .

( )
On détermine ensuite la fonction U T ∗ , B = 0 de la façon suivante. En partant de la plus basse des
températures atteintes, on réchauffe progressivement la substance en mesurant les apports
successifs d'énergie (par exemple avec une résistance chauffante dont il est facile de déterminer la
quantité d'énergie fournie) et en repérant les températures magnétiques correspondantes. On en
déduit, en tout point :
 ∂U  dU / dT ∗
(2) T =   = ∗
 ∂S  B dS / dT
( )
La figure ci-dessous donne la correspondance T T ∗ pour l'alun de chrome et de
méthylalammonium dans le domaine de 0.025 K à 0.5 K.

( )
La détermination de la fonction T T ∗ est très lourde et n'est valable que pour une substance
donnée. Toutefois, cette substance utilisée comme thermomètre, permet de déterminer la
température absolue. Notons qu'il n'est pas facile, à très basse température, d'assurer un chauffage
uniforme de la substance, à cause des faibles conductivités thermiques et de la faible efficacité des
contacts thermiques. Cette difficulté a été surmontée en irradiant la substance de façon homogène à
l'aide de faisceaux de rayons gamma.

Ce type de thermomètre peut être utilisé jusqu'à des températures de l'ordre de 1 mK. Au-dessous,
on doit faire appel à d'autres phénomènes : émission gamma anisotrope des noyaux orientés,
résonance magnétique nucléaire, aimantation des noyaux, relaxation spin - réseau, …
VI.2.9. Historique des basses températures
L'exploration du domaine des basses températures a commencé d'abord avec la liquéfaction des gaz
dits permanents, l'oxygène O2 ( TE = 90.2 K ), l'azote N 2 ( TE = 77.3 K ), l'hydrogène H 2
( TE = 20.4 K ) et l'hélium He 4 ( TE = 4.2 K ). Puis, aussitôt après la liquéfaction de l'hélium, H.
Kamerlingh Onnes (1908) obtient, par réduction de la pression de vapeur, une température de 1.5 K
(figure ci-dessous).
Actuellement, avec des pompes très puissantes, on peut atteindre 0.8 K avec l'hélium He 4 , ainsi
que 0.3 K avec l'isotope He 3 . Ces valeurs, considérées longtemps comme la limite extrême
pouvant être obtenue à l'aide de substances chimiques, ont cependant été dépassées par la technique
du réfrigérateur à dilution qui permit d'atteindre en 1965 la valeur de 60 mK. Aujourd'hui, on
obtient jusqu'à 2 mK avec ce type de réfrigérateur.

Précédemment, des températures entre 1 K et 1 mK avaient pu être obtenues à l'aide de la


désaimantation adiabatique électronique. Après le premier refroidissement à 0.25 K effectué par
W.F. Giauque et D.P. Mac Dougall en 1933, une température de 18 mK fut rapidement atteinte. En
1956, on parvenait à une température d'environ 1 mK, limite inférieure du domaine pouvant être
atteinte par cette méthode.

La gamme de température 10 −3 − 10 −6 K a ensuite été explorée à l'aide de la désaimantation


adiabatique nucléaire. Après le travail de pionniers de F. Simon, N. Kurti et leurs collaborateurs en
1956 ( 20 µ K pour le système de spins), cette méthode s'est révélée comme pouvant être
opérationnelle et détient actuellement les records de basses températures : 20 nK pour le système de
spins du cuivre et 13µ K pour le cuivre dans son ensemble. Ces auteurs ont également refroidi, par
l'intermédiaire du cuivre, de l'hélium He 3 pur jusqu'à 125µ K . Des résultats équivalents ( 215µ K
pour des mélanges He 3 − He 4 ) ont également été obtenus.

Cette quête continuelle pour les basses températures a été jalonnée par la découverte de
phénomènes très importants pour la physique fondamentale et la technologie : supraconductivité,
superfluidité de He 4 , puis de He 3 , magnétisme et anisotropie de He 3 liquide, effet Kondo
(minimum de résistance dans les alliages magnétiques), ordre magnétique nucléaire, distribution
angulaire des émissions alpha, bêta et gamma des noyaux orientés, violation de la parité (asymétrie
de l'émission bêta).

Une autre technique utilisée récemment est applicable à des gaz à pression extrêmement faibles
(quelques centaines à milliers d'atomes dans une enceinte sous vide) pour lesquels les méthodes
précédentes sont inapplicables. C'est la méthode de refroidissement par laser. Les atomes sont
maintenus en suspension dans l'enceinte par la pression de radiation de plusieurs lasers croisés.
L'évaporation de ce piège laser des atomes les plus rapides refroidi rapidement la suspension. Un
autre laser accordé sur une fréquence de transition des atomes utilise le très léger décalage Doppler
suivant le mouvement et la direction des atomes et permet ainsi de leur communiquer une faible
impulsion dans une direction privilégiée afin de les ralentir. Cette méthode permettant d'atteindre
des températures extrêmement basses a permis d'observer la formation de condensats de Bose -
Einstein, très importants en recherche fondamentale, mais aussi en technologie pour la métrologie
ou l'amélioration de la précision des horloges atomiques.
Exercices de compréhension
1. Une substance de masse molaire M = 392 g mole −1 a une susceptibilité magnétique relative au
moment massique χ m = 1.12 × 10 −2 uem cgs . En déduire la susceptibilité magnétique relative au
moment molaire χ M dans le système international.

Réponse : χ M = 5.50 × 10 −5 m 3 mole −1 .


2. Le sulfate de fer et d'ammonium a une constante de Curie C M = 5.49 × 10 −5 K m 3 mole −1 et une
masse molaire M = 482 g mole −1 . Calculez le moment magnétique de 3 grammes de
substances placés dans un champ d'induction B = 0.5 T à T = 77 K.

Réponse : M = 1.76 × 10 −3 A m 2 .
3. Calculez l'angle θ du moment cinétique σ J avec l'axe des z dans l'état M J = J . Donnez la
valeur numérique pour J = 1/2 et J = ∞ .

Réponse : θ = 55° et 0°.


4. La constante de Curie C M relative à une mole d'ions Gd 3+ dans le sulfate de gadolinium vaut
9.83 × 10 −5 K m 3 mole −1 . Déduisez-en le nombre effectif paramagnétique de magnétons de Bohr
de l'ion Gd 3+ . Le moment magnétique de saturation relatif à une mole d'ions Gd 3+ étant
M M S = 3.91 A m 2 mole −1 , calculez les valeurs de J eff et g eff . Comparez au tableau sur les ions
des terres rares dans la section VI.2.5.

Réponse : p eff = 7.91 , J eff = 3.6 , g eff = 1.94 .


5. Même exercice pour l'ion Fe 3+ dans le sulfate de fer et d'ammonium dont la constante de Curie
est C M = 5.49 × 10 −5 K m 3 mole −1 . Comparez au tableau sur les éléments de transition dans la
section VI.2.5.
Réponse : p eff = 5.91 , J eff = 2.5 , g eff = 2 .
Problème 1. Désaimantation adiabatique électronique
On se propose l'étude de la désaimantation adiabatique de l'alun de chrome et de méthylammonium
Cr (CH 3 NH 3 )(SO4 )2 ⋅ 12 H 2 O .

Substance en champ nul


Dans ce cristal, seuls les ions chrome Cr 3+ sont magnétiques. Leur niveau électronique
fondamental correspond à un moment cinétique de spin J = 3/2, le moment orbital étant bloqué. Le
champ cristallin sépare ce niveau en deux doublets de Kramers dont la distance en énergie ε
correspond à une température caractéristique Θ = ε / k = 0.275 K .

1. Rappelez l'expression des populations des niveaux en statistique de Maxwell-Boltzmann et


définissez la fonction de partition Z. Calculez le rapport des populations des deux niveaux
doublement dégénérés de l'ion Cr 3+ à T = 2.4 K.
2. Explicitez la fonction de partition relative à l'ion Cr 3+ . Choisissez le niveau le plus bas comme
origine des énergies.
3. On rappelle que l'énergie libre F d'un système de N particules a pour expression
F = − NkT ln Z . Déduisez-en les expressions de l'entropie S, de l'énergie interne U et de la
capacité calorifique molaire cV du système d'ions Cr 3+ .
4. Etudiez la fonction S(T) et donnez sa forme limite pour T >> Θ . Interprétez la valeur limite de
S pour T → ∞ .
5. Montrez que dans ce domaine, cV a la forme A / T 2 . Calculez la valeur numérique de A/R.
Ecrivez l'expression de S en remplaçant Θ par A.
6. Trouvez la limite de la fonction S pour T  0. Ce résultat est-il en accord avec le troisième
principe ?
7. L'énergie d'interaction dipolaire magnétique entre ions chrome a comme ordre de grandeur
µ0µ 2
(1) ε d ≅
4πr 3
où µ = 15µ B est le moment magnétique de l'ion et r = 8.7 Å la distance de deux ions Cr 3+
proches voisins. Estimez la température au voisinage de laquelle cette interaction n'est plus
négligeable. Dites quel effet cette interaction peut avoir sur l'entropie et discutez les résultats
expérimentaux de la figure ci-dessous.

Substance en présence de champ


Lorsqu'on applique au cristal un champ magnétique uniforme d'induction B, on peut admettre que
le niveau électronique des ions Cr 3+ se décompose en quatre niveaux d'énergie ε m = ε m0 + mgµ B B ,
où le nombre quantique magnétique m prend les valeurs -3/2, -1/2, 1/2, 3/2 et où ε m0 = 0 pour
m = ±3 / 2 et ε m0 = ε pour m = ±1 / 2 . Le facteur de séparation spectroscopique g peut être pris égal
à 2.
1. Donnez l'expression de la fonction de partition Z. Vérifiez que, pour B = 0, l'expression se
ramène à celle de la question 2 en champ nul. On posera x = Jgµ B B / kT . La courbe
représentant D, provenant de cette expression de Z, est portée dans la figure ci-dessus pour B =
1.5 T.
2. Donnez la forme limite présentée par Z pour T  0. Déduisez-en les formes limites de l'énergie
libre F puis d S. L'entropie s'annule-t-elle au zéro absolu ?
3. Faites un développement limité de Z pour T → ∞ , au terme en 1 / T 3 près, et déterminez
l'expression correspondant de F.
4. Déduisez de l'expression approchée de F, celle du moment magnétique molaire M M de la
substance. Montrez que la substance suit la loi de Curie M M = C M B / µ 0T et donnez
l'expression de la constante de Curie C M . Calculez numériquement cette constante et comparez
à la valeur expérimentale 2.35 × 10 −5 m 3 K mole −1 .
5. Déterminez de même l'expression approchée de l'entropie molaire s et écrivez la en fonction des
constantes A (définie plus haut) et C M .

Désaimantation adiabatique
On refroidit un échantillon de n = 0.22 mole d'alun par contact thermique avec un bain d'hélium
liquide sous pression réduite à la température Ti = 1.2 K .

1. On applique alors un champ magnétique d'induction B en maintenant le contact thermique. La


transformation peut être considérée comme isotherme et réversible. Utilisez l'expression
approchée de l'entropie molaire trouvée ci-dessus pour exprimer la chaleur dégagée par
l'échantillon. Déduisez-en la masse d'hélium vaporisée pour une induction finale B = 0.2 T,
ainsi que le volume correspondant de gaz dans les conditions normales. On prendra pour valeur
de la chaleur latente massique de l'hélium à 1.2 K L = 22 J g −1 . Quelle est l'origine physique à
l'échelle moléculaire de la chaleur dégagée ?
2. On réalise ensuite l'isolement thermique de l'échantillon, puis on annule le champ extérieur.
Déterminez la température finale T f en fonction de Ti et de B et calculez sa valeur pour B =
0.2 T. La figure ci-dessous donne les valeurs expérimentales de (Ti / T f )
2
en fonction de B 2 .
Dans quel domaine ces valeurs sont-elles en accord avec les résultats obtenus dans cette
question ? Donnez l'interprétation physique du refroidissement.
3. La première figure représente le diagramme entropique de l'alun. La courbe pour B = 0 a été
obtenue expérimentalement par mesure calorimétrique. La courbe pour B = 1.5 T est la courbe
théorique obtenue à partir de la fonction de partition. Utilisez ce diagramme pour déterminer la
température finale obtenue dans une désaimantation adiabatique en partant de la température
Ti = 1.2 K et du champ B = 1.5 T.

Données numériques : perméabilité magnétique du vide µ 0 = 4π × 10 −7 SI , magnéton de Bohr


µ B = 0.927 × 10 −23 J T −1 , nombre d'Avogadro N = 6.02 × 10 23 mole −1 , constante des gaz parfaits
R = 8.31 J K −1mole −1 .

Solution

Substance en champ nul


1. La population du niveau i est :
N
(2) N i = g i e i avec Z = ∑ g i e i
−β ε −β ε

Le rapport des populations des niveaux est :


−β ε
N 2 g 2e 2 − β (ε −ε )
(3) = − β ε1
= e 2 1 = e −ε / kT = e −Θ / T
N1 g 1e
car la dégénérescence des niveaux est g1 = g 2 = 2 . A T = 2.4 K, on a N 2 / N 1 = 0.89 et les
deux niveaux sont presque également peuplés.
2. Voir la statistique de Maxwell-Boltzmann pour un système à deux niveaux d'énergie. On a :
(4) Z = g 1 + g 2 e − β ε
3. On obtient en particulier ( g1 = g 2 = 2 )
βε
(5)
S
Nk
[( )]
= ln 2 1 + e − β ε +
1+ eβε
et
2
c  βε / 2 
(6) V = 
R  cosh βε / 2 
4. La fonction S(T) reproduit bien les donnés expérimentales au-dessus d'environ 0.1 K. Pour
T >> Θ , c'est-à-dire βε << 1 , on a
S   βε β 2 ε 2  βε β 2ε 2 Θ2
(7) ≅ ln 41 − +  + ≅ ln 4 − = ln 4 − 2
Nk   2 4  2 + βε 8 8T

Ce développement est exact à 1% près jusqu'à T = Θ , c'est-à-dire, ici, T ≅ 0.3 K .

A haute température T >> Θ , l'entropie a pour valeur limite S = Nk ln 4 , valeur qui s'interprète
par la relation de Boltzmann S = k ln W avec, pour quatre niveaux également peuplés, W = 4 N .
5. La forme limite de cV (T ) à haute température est
cV T dS β 2 ε 2 Θ2
(8) = = =
R R dT 4 4T 2

Cette capacité calorifique s'écrit cV = A / T 2 avec


A Θ2
(9) =
R 4

Numériquement, on a A / R = 1.89 × 10 −2 K 2 . On peut alors récrire l'entropie molaire sous la


forme
(10) s (B = 0, T ) = R ln 4 − 2
A
2T
6. La limite de S pour T = 0 est d'après (5) S = Nk ln 2 . Ce résultat est en désaccord avec le
troisième principe qui affirme que l'entropie est nulle au zéro absolu.
7. L'énergie d'interaction entre ions a pour ordre de grandeur ε d ≅ 1.96 × 10 −25 J et la température
caractéristique correspondante Θ d = ε d / k ≅ 1.4 × 10 −2 K . Lorsque la température T devient de
l'ordre de Θ d , on ne peut plus négliger les interactions entre ions. Celles-ci lèvent la
dégénérescence du niveau de base et, pour T << Θ d , l'entropie est nulle. La première figure
montre bien la chute brutale de l'entropie au voisinage de 1.6 × 10 −2 K , température voisine de
Θd .

Substance en présence de champ


1. La fonction de partition est :
(
Z = ∑ e − β ε m = 2 cosh 3βµ B B + e − β ε cosh βµ B B )
(11) m avec x = 3µ B B / kT
( −β ε
2 cosh x + e cosh x / 3 )
Pour B = 0, on retrouve (4). L'expression de l'entropie dérivant de (11) par application de la
relation générale est assez complexe. Nous ne l'expliciterons pas. Cependant en vue des
applications, nous avons représenté la courbe S(T) pour B = 1.5 T dans la première figure.
2. Lorsque T  0, on a x → ∞ et βε → ∞ , soit
[
(12) Z ≅ e x + e x / 3− β ε = e x 1 + e −(2 x / 3+ β ε ) ]
L'énergie libre s'écrit alors
(13) F = − NkT ln Z ≅ −3 Nµ B B − NkTe −(2 x / 3+ β ε )
et l'entropie
 ∂F 
 ≅ Nk (1 + 2 x / 3 + βε )e
− ( 2 x / 3+ β ε )
(14) S = −
 ∂T B

Cette entropie s'annule pour T = 0 conformément au troisième principe, car seul le niveau le
plus bas (m = -3/2) est peuplé.
3. Lorsque T → ∞ , on a x → 0 et βε → 0 . En se limitant aux termes en x 2 et en (βε ) , on
2

obtient pour Z :
 x2  β 2 ε 2  x 2 
Z ≅ 2 1 + + 1 − βε + 1 + 
 2  2  18 
(15)
 βε β 2ε 2 5 2   Θ Θ 2 5 µ B2 B 2 
≅ 4 1 − + + x  = 4 1 − + 2
+ 
 2 4 18   2T 4T 2 k 2T 2 

Sachant que ln (1 + u ) ≅ u − u 2 / 2 , on en déduit la forme limite de l'énergie libre


N Nk  Θ 2 5 µ B2 B 2 
(16) F = − NkT ln Z ≅ − NkT ln 4 + kΘ −  + 
2 T  8 2 k 2 
4. Le moment magnétique total de la substance est
 ∂F  Nk µ2
(17) M = −  ≅ × 5 2B B
 ∂B  T T k
le moment magnétique molaire vaut donc ( N → N )
Nµ B2 B
(18) M M = 5
k T

La substance suit donc la loi de Curie avec


µ 0 µ B2
(19) C M = 5 N
k
cette expression coïncide avec (23) de la section VI.2.4 pour µ = [J ( J + 1)] gµ B = 15µ B .
1/ 2

Numériquement, on a C M = 2.36 × 10 −5 SI en bon accord avec la valeur expérimentale.


5. L'entropie de la substance à haute température se déduit de l'expression approchée de F. On a :
 ∂F   1  Θ 2 5 µ B2 B 2 
(20) S = −  = Nk ln 4 − 2  + 
 ∂T  B  T  8 2 k 2 

En utilisant la constante A (9) et la constante de Curie C M (19), on a finalement pour l'entropie


molaire
CM B 2
(21) s (B, T ) = R ln 4 −
A

2T 2 2 µ 0 T 2

Lorsque B = 0, cette expression approchée se réduit à l'expression (10). Elle est valable tant que
s/R st supérieur à 1.25. En particulier, pour T = 1.2 K, elle est valable pour environ B < 0.4 T.

Remarque : dans le cas général où l'on a ε m = ε m0 − (µ z )m B , un calcul semblable donne, au lieu


de la loi de Curie (18) et de l'expression (21) :
C B D A B CM B 2
(22) M M = M − et s = R ln Z 0 − + D −
µ 0T T 2T 2 T 2 2µ 0 T 2
où Z 0 est le nombre d'états qui interviennent et

N  ∑ ε m  ∑ ε m  
2
Nµ 0
2

(23) A =  −  , D = N ∑ (µ z )m ε m et C M = ∑ (µ )2

k  Z0  Z   Z0k Z0k
z m

  0  

La substance ne suit alors plus la loi de Curie si D ≠ 0 . Toutefois, lorsque les niveaux de l'ion
sont, comme ici, des doublets de Kramers, D est nul et la loi de Curie (18) et l'entropie donnée
par (21) restent valables.

Désaimantation adiabatique
1. La transformation isotherme fait passer la substance de l'état a (B = 0, T = Ti ) à l'état b (B, Ti )
et produit donc d'après (21) la variation d'entropie molaire :
C B2
(24) ∆s = s b − s a = − M 2
2 µ 0 Ti

La transformation étant isotherme et la variation d'entropie étant négative, l'échantillon dégage


la quantité de chaleur :
CM B 2
(25) Q = nTi ∆s = n
2 µ 0 Ti

Pour B = 0.2 T, on a Q = 6.9 × 10 −2 J . Cette quantité de chaleur vaporise Q / L = 3.1 × 10 −3 g


d'hélium, ce qui correspond à environ 20 cm 3 d'hélium gazeux à température et pression
ordinaires.

Au cours de cette aimantation isotherme, les niveaux d'énergie s'écartent sous l'influence du
champ magnétique. Les particules descendent alors sur les niveaux les plus bas, ce qui
correspond à un dégagement de chaleur.
2. La désaimantation adiabatique fait passer du point b (B, Ti ) au point c (B = 0, T f ). L'entropie
restant constante : sb = s c . En utilisant l'expression (21) de s, on déduit :
−1 / 2
A CM B 2 A  C 
(26) + = , d'où T f = Ti 1 + M B 2 
2Ti 2
2µ 0 Ti 2
2T f2
 µ0 A 

Pour B = 0.2 T, on obtient T f = 0.50 K . La formule (26) peut être écrite :


2
T 
(27)  i  = 1 + λB 2 , avec λ = C M = 119 T −2
T  µ0 A
 f 

Ce résultat est représenté par la droite de la figure précédente. Les points expérimentaux
s'écartent de cette droite pour B 2 ≅ 0.15 T 2 , soit B ≅ 0.4 T , en accord avec le point 5
précédent.

Au cours de cette transformation isentropique, les populations des nivaux sont invariables et,
comme les niveaux se rapprochent, la température correspondant à cette répartition diminue.
3. A partir du point a (B = 0, Ti = 1.2 K ) de la première figure, on trace une parallèle à l'axe des
ordonnés pour représenter la transformation isotherme. Elle coupe la courbe B = 1.5 T au point
b tel que s/R = 0.52. La transformation isentropique correspond à une parallèle à l'axe des
abscisses passant par b et coupant la courbe B = 0 au point c de même entropie que b et de
température T f ≅ 1.6 × 10 −2 K .
Problème 2.

Ferromagnétisme de l'oxyde d'europium EuO par la méthode du champ moléculaire


de Weiss
Dans l'oxyde d'europium EuO, les ions magnétiques Eu 2+ ont un moment cinétique total J = 7/2 dû
aux spins des électrons seuls et un facteur de décomposition spectroscopique g = 2. Cet oxyde
devient ferromagnétique au-dessous de Tc = 77 K avec un moment magnétique de saturation relatif
à une mole M M S = 38.5 A m 2 mole −1 . Au-dessus de cette température, il suit la loi de Curie-Weiss :
CM B
(1) M M =
T − Tc µ 0
avec un constant de Curie C M égale à 9.90 × 10 −5 K m 3 mole −1 .

Pour interpréter ces données expérimentales, on peut utiliser le modèle de Weiss qui tient compte
des interactions entre les ions magnétiques par l'introduction d'un champ magnétique fictif
d'induction Bi , appelé champ moléculaire et proportionnel au moment magnétique M M ,
Bi = qM M , q étant une constante.

On rappelle que la projection du moment magnétique d'un ion sur la direction du champ
magnétique peut prendre les valeurs : (µ z )m = − mgµ B , où µ B est le magnéton de Bohr et m le
nombre quantique magnétique (m = -J, -J + 1, …, J).

1. Donnez l'expression des niveaux d'énergie magnétique ε m des ions. On suppose ces ions sans
interaction et subissant un champ magnétique d'induction B ′ .
2. Ecrivez l'expression des populations N m de ces niveaux en fonction du nombre total d'ions N et
de la fonction de partition Z.
3. Montrez que les divers termes de Z forment une suite géométrique et trouvez son expression en
fonction de fonctions hyperboliques. On posera x = Jgµ B B ′ / kT .
4. Ecrivez l'expression du moment magnétique M de la substance en fonction des populations
N m des niveaux et montrez que l'on a :

= NJgµ B B J (x )
d ln Z
(2) M = NJgµ B
dx
5. Explicitez la fonction de Brillouin B J ( x ) = d ln Z / dx et trouvez sa valeur limite pour x = ∞ .
6. Développez B J ( x ) à l'ordre 3, au voisinage de x = 0, en utilisant la relation
coth u = 1 / u + u + 3 − u 3 / 45 + L .
7. Représentez schématiquement la fonction de Brillouin dans le cas d'ions europium Eu 2+ (J =
7/2).
8. Ecrivez l'expression du moment magnétique molaire M M et calculez sa valeur de saturation
M M S pour l'oxyde d'europium EuO. Comparez à la valeur expérimentale.
9. Pour tenir compte des interactions entre ions, on suppose que chaque ion subit un champ
magnétique d'induction B ′ = B + qM M , B étant l'induction magnétique dans la substance et
qM M le champ moléculaire de Weiss.

Utilisez les résultats de la question précédente pour montrer que l'équation d'état magnétique
M M (B, T ) est déterminée sous forme implicite.
10. Montrez que l'aimantation réduire R = M M / M M S est égale à l'ordonnée de l'intersection de la
courbe B J ( x ) avec une droite dont on précisera les paramètres en fonction de B et T.
11. Utilisez le développement de B J ( x ) à l'ordre 1 en x pour obtenir explicitement l'équation d'état
approchée M M (B, T ) de la substance en champ faible et à température élevée.
12. Déduisez-en que la substance suit, dans ce domaine x << 1, la loi de Curie-Weiss, et déterminez
les expressions de la constante de Curie C M et de la température Tc . Représentez
schématiquement la courbe 1 / χ M (T ) (la susceptibilité magnétique χ M est définie par
χ M = µ 0 M M / B ).
13. Calculez numériquement la constante de Curie C M pour l'oxyde d'europium et comparez à la
valeur expérimentale. Montrez que la mesure de C M et de Tc permet de déterminer le
coefficient du champ moléculaire q. Calculez sa valeur et déduisez-en la valeur du champ
moléculaire à la saturation. Commentez.
14. Montrez qu'en champ nul (B = 0), la substance présente une aimantation spontanée si la
température T est inférieure à Tc .
15. Représentez schématiquement la courbe donnant l'aimantation réduite R en fonction de T / Tc .
Déterminez une expression analytique approchée de R au voisinage de T = Tc .
16. Des données expérimentales du moment magnétique M M de l'oxyde EuO en fonction de T son
rassemblées dans le tableau ci-dessous. Portez ces points expérimentaux sur le graphique
précédent et commentez.

T (K) 5 10 20 30 40 50 68.6 72.3


(
M M A m 2 mole −1 ) 38.5 38.5 37.1 35.5 33.3 30.2 15.0 10.1

Données numériques : perméabilité magnétique du vide µ 0 = 4π × 10 −7 SI , magnéton de Bohr


µ B = 0.927 × 10 −23 J T −1 , nombre d'Avogadro N = 6.02 × 10 23 mole −1 , constante de Boltzmann
k = 1.38 × 10 −23 J K −1 .

Solution
1. On a ε m = −(µ z )m B ′ = mgµ B B ′ .
2. Les populations sont données par la loi de répartition de Maxwell-Boltzmann :
J
N
(3) N m = e − β ε m avec Z = ∑ e − β ε m
Z m= − J

On vérifie que l'on a bien ∑N m =N.


3. Le calcul de Z a été fait dans le calcul de la fonction de répartition de la section VI.2.4. On
trouve (6) de la section VI.2.4
2J + 1
sinh x
(4) Z = 2 J
1
sinh x
2J
4. Le moment magnétique de la substance vaut
(5) M = ∑ N m × (µ z )m = gµ B ∑ − me −mx / J
N
m Z m

La somme est, à un facteur J près, la dérivée de la fonction de partition (4). D'où la relation
demandée.
5. La fonction B J ( x ) est explicitée en (12) de la section VI.2.4. On trouve
2J + 1  2J + 1  1  x 
(6) B J ( x ) = coth  x − coth  
2J  2J  2J  2J 

Lorsque u → ∞ , coth u → 1 et l'on a lim B J ( x ) = 1 .


x→∞
6. Le développement (17) de la section VI.2.4 de la fonction de Brillouin pour x voisin de 0 est
 1 (2 J + 1)2 x (2 J + 1)4 x 3   1 1 x3 
B J ( x ) ≅  +
1 x
−  −  + − 
 x (2 J )2 3 (2 J )4 45   x (2 J )2 3 (2 J )4 45 
(7)
J + 1 x (2 J + 1) − 1 x 3
4
= −
J 3 (2 J )4 45
7. La fonction de Brillouin B7 / 2 ( x ) est représentée dans la figure ci-dessous.

8. On a
(8) M M = NJgµ B B J ( x )

Le moment de saturation, obtenu pour x → ∞ , vaut M M S = NJgµ B . Numériquement, on a


M M S = 39.1 A m 2 mole −1 . Cette valeur est très proche de la valeur expérimentale.
9. En remplaçant x par son expression en fonction de B ′ et de T, on obtient
 B + qM M 
(9) M M = M M S B J  Jgµ B 
 kT 
expression déterminant M M sous forme implicite en fonction de B et de T.
10. En éliminant M M au profit de la variable x = βJgµ B (B + qM M ) , la relation précédente devient
MM
= B J (x )
kT B
(10) R = = x−
M M S qM M S Jgµ B qM M S

Cette équation se résout graphiquement en cherchant les intersections d'un droite de pente
kT / qM M S Jgµ B et d'ordonnée à l'origine − B / qM M S avec la courbe B J ( x ) (figure ci-dessus).
L'ordonnée de l'intersection est égale à l'aimantation réduite R = M M / M M S .
11. En se limitant aux termes linéaires en x, on obtient
J + 1 x J + 1 Jgµ B B + qM M B
(11) R = = , soit M M =
J 3 J 3 kT 3kT
−q
(J + 1)gµ B M M S
12. Par identification avec la loi de Curie-Weiss, on obtient
(J + 1)gµ B M M S µ 0 J ( J + 1)g 2 µ B2 qC M
(12) C M = µ 0 =N et Tc =
3k 3k µ0

La susceptibilité magnétique χ M vaut :


µ M CM
(13) χ M = 0 M =
B T − Tc

La courbe 1 / χ M (T ) est une droite coupant l'axe des températures en T = Tc . En ce point, la


susceptibilité devient infinie, ce qui correspond à la transition entre la phase paramagnétique et
la phase ferromagnétique.

On a porté dans la figure ci-dessous les résultats de mesures expérimentales. Ils sont en accord
avec la loi de Curie-Weiss.
Pour la droite sur le graphique, on a utilisé les valeurs expérimentales Tc = 77 K et
C M = 9.90 × 10 −5 K m 3 mole −1 .
13. Pour l'oxyde d'europium, la constante de Curie C M , calculée à partir de (12) vaut
9.89 × 10 −5 K m 3 mole −1 , valeur proche de la valeur expérimentale. La constante du champ
moléculaire q s'obtient à partir de (12) par
µT
(14) q = 0 c = 0.98 SI
CM

A la saturation ( M M = M M S ), le champ moléculaire vaut


(15) Bis = q × M M S = 37.6 T

Ce résultat montre que le champ moléculaire à la saturation est très intense. Tant que le moment
M M reste supérieur à environ 0.1M M S , le champ extérieur ( B < 1 T ) est négligeable devant le
champ moléculaire.
14. Lorsque le champ magnétique est nul, la droite intervenant dans la résolution graphique (10)
passe par l'origine des axes et a pour pente
kT J +1 T
(16) = ×
qM M S Jgµ B 3 J Tc

Le nombre de solutions de l'équation (10) dépend de la valeur de cette pente relativement à


celle de B J ( x ) à l'origine, qui est égale à ( J + 1) / 3 J d'après la question 6. Dans tous les cas, il
existe la solution (x = 0, R = 0). Il existe une deuxième solution lorsque la pente de la droite est
inférieure à celle de B J à l'origine, soit lorsque T < Tc (voir la première figure). Cette solution
correspond à une aimantation spontanée de la substance dans sa phase ferromagnétique stable
en dessous de Tc .
15. En traçant des droites de pentes diverses sur la première figure, on obtient la courbe ci-dessous,
tracée pour J = 7/2.
Pour T  0, la pente de la droite tend vers zéro et l'on a R  1. Les moments magnétiques des
ions Eu 2+ sont alors totalement ordonnés sous l'effet de leurs interactions. Pour T → Tc , on a R
 0. Plus précisément, en utilisant le développement de la question 6, la résolution de (10)
donne (pour J = 7/2)
3 13 3T
(17) x − 3 x 3 = x
7 7 7 Tc
dont la solution, en plus de x = 0, est
1/ 2
147  T 
(18) x =  1 − 
 13  Tc 

Finalement, l'aimantation réduite pour T ≅ Tc vaut


1/ 2 1/ 2
3T 27 T  T  27  T 
(19) R = x= 1 −  ≅ 1 − 
7 Tc 13 Tc  Tc  13  Tc 

Cette expression fait apparaître un facteur (1 − T / Tc ) où l'exposant critique a la valeur 1/2


β

caractéristique de l'approximation d'un champ moléculaire.


16. En utilisant la valeur expérimentale de M M S , on obtient les points expérimentaux de la figure
ci-dessus. La théorie du champ moléculaire fournit donc pour l'oxyde d'europium une bonne
représentation des données expérimentales.
VI.3. Substances magnétiques

VI.3.1. Introduction
Dans le chapitre précédent, nous avons considéré les propriétés de substances magnétiques dans le
domaine de température où les interactions entre les ions magnétiques peuvent être négligées
(paramagnétisme parfait). Nous considérons maintenant les interactions entre ces ions pour
interpréter l'ensemble des propriétés magnétiques des solides. L'existence, à température
suffisamment basse, de phases ordonnées de différents types est due au fait que ces interactions
tendent à rendre les spins de deux ions voisins parallèles ou antiparallèles. Citons les phases
principales :
 Phases ferromagnétiques, dans lesquelles les spins de tous les ions magnétiques sont parallèles
et qui présentent une aimantation spontanée (figure ci-dessous).
 Phases antiferromagnétiques, dans lesquelles deux ions proches voisins ont des spins
antiparallèles et qui ne présentent pas d'aimantation spontanée (figure ci-dessous).

 Phases hélimagnétiques, dans lesquelles les spins de deux ions voisins font un angle donné
(figure ci-dessous).
 Phases ferrimagnétiques dans lesquelles existent plusieurs ions magnétiques différents avec
divers arrangements et qui possèdent une aimantation spontanée (figure ci-dessous).

Dans la suite, nous étudierons principalement les substances présentant des phases
ferromagnétiques : nous les désignerons simplement sous le nom de substances ferromagnétiques.

Nous allons d'abord faire quelques rappels de magnétostatique. Lorsqu'un courant traverse un
solénoïde suffisamment long constitué de n spires par unité de longueur, il crée dans le vide un
champ magnétique uniforme H 0 , d'induction B 0 (figure (a) ci-dessous) tels que :
(1) B 0 = µ 0 H 0 avec H 0 = nI

Lorsqu'un échantillon de substance magnétique se trouve dans le solénoïde, il s'aimante et le champ


et l'excitation magnétiques ne sont plus uniformes (figure (b) ci-dessus). Toutefois, lorsque
l'échantillon, constitué de matière homogène et isotrope (polycristal par exemple) a la forme d'un
ellipsoïde dont un axe est parallèle à l'axe du solénoïde, l'aimantation M, le champ H et l'induction
B sont parallèles et uniformes à l'intérieur de la substance et suivent la relation algébrique
(2) B = µ 0 (H + M )

Le champ H dans la substance est relié à celui dans le vide H 0 par


(3) H = H 0 − H d avec H d = DM
où H d est le champ démagnétisant créé par l'aimantation de la matière et D est le facteur
démagnétisant, compris entre 0 et 1 (D = 0 pour un cylindre infini, D = 1/3 pour une sphère et D =
1 pour une plaque perpendiculaire au champ).

Lors de la mesure d'une aimantation, on détermine la relation M = M (H 0 , T ) . Les relations (3) et


(2) permettent d'en déduire l'équation d'état magnétique M = M (B, T ) . Remarquons qu'une
équation d'état est insuffisante pour rendre compte des phénomènes d'hystérésis existant en champ
faible dans les phases ordonnées.
VI.3.2. Propriétés des substances ferromagnétiques

Equation d'état magnétique


L'équation d'état magnétique expérimentale d'une substance ferromagnétique est représentée dans
la figure ci-dessous.
Elle est caractérisée par l'existence d'une température critique TC , appelée température de Curie,
séparant la phase paramagnétique ( T > TC ) où l'aimantation est nulle en champ nul, de la phase
ferromagnétique ( T < TC ) dans laquelle peut exister une aimantation spontanée en champ nul. Les
températures de Curie de quelques substances ferromagnétiques sont données dans le tableau ci-
dessous.

Substance Fe Ni Gd CrBr3 UO GdCl3 CuK2Cl4.


2H2O
Masse 55.85 58.71 157.26 291.76 167.96 263.27 319.57
molaire
(
10 −3 kg mole
Masse 7.86 8.90 7.95 7.20 8.21 4.52 1.16
volumique
(10 3 kg m −3

Temp. de 1041.5 631.4 293 37 69.4 2.2 0.88


Curie Tc
(K)
Temp. de 1093 650 302.5
Weiss θ
(K)
Const. de 1.26 0.32 7.8 7.9
Curie C M
(4π 10 −6 m 3 K

Nb. eff. 2.23 0.606 7.02 1.96 6.9 5.74 1


ferrom. de
magnéton
s neff
Exposant -0.140 -0.091 -0.20 -0.045 -0.1
critique
α
β 0.34 0.390 0.399 0.368 0.368
γ 1.33 1.315 1.3 1.22 1.31 1.36
δ 4.22 4.0 4.3 4.46

Dans la phase paramagnétique l'aimantation en champ faible est proportionnelle au champ H :


(1) M = [χ ]H ou M i = χ ij H j
la susceptibilité magnétique étant tensorielle pour un monocristal et scalaire pour un solide
polycristallin. Les variations de la susceptibilité avec la température, représentées dans la figure ci-
dessous sont typiques.
A haute température ( T >> TC ), la susceptibilité suit la loi de Curie-Weiss :
C 1 T −θ
(2) χ = ou =
T −θ χ C
C et θ étant des constantes positives appelées constante de Curie et température de Weiss. Au
voisinage de TC , elle suit une loi de puissance :
−γ
 T − TC 
(3) χ ∝  
T
 C 
où γ , appelé exposant critique, a une valeur voisine de 1.3 (tableau précédent).
Dans la phase ferromagnétique à température T << TC , le moment magnétique molaire M M de la
substance dépend peu de l'intensité du champ. Il tend vers une valeur de saturation M Ms au zéro
absolu correspondant à l'orientation maximum des moments élémentaires µ et permet la
détermination de la valeur maximum de µ z (tableau précédent) par la relation :
(4) M Ms = N(µ z )max = Nµ B neff
où neff est le nombre effectif ferromagnétique de magnétons de Bohr que l'on ne doit pas confondre
avec le nombre effectif paramagnétique de magnétons p. Au voisinage absolu (figure ci-dessous),
l'aimantation réduite a la forme :
M
(5) R ≡ M = 1 − A1T 3 / 2 − A2T 5 / 2
M Ms
Enfin, au voisinage de la température de Curie, l'aimantation réduite spontanée décroît très
rapidement (figure ci-dessous) selon la loi de puissance
β
T −T 
(6) R ∝  C 
 TC 
où l'exposant critique β a une valeur voisine de 0.35 (tableau précédent).

A la température critique, l'aimantation réduite de la substance varie en fonction du champ


magnétique (figure ci-dessous) selon la loi :
(7) R ∝ H 1 / δ
où l'exposant critique δ a une valeur voisine de 4 (tableau précédent).
Capacité calorifique
La capacité calorifique à volume constant CV d'une substance s'obtient à partir des mesures de
capacité calorifique à pression constante C P en champ nul. Elle est la somme, selon la substance,
de plusieurs contributions :
 La capacité calorifique du réseau variant en T 3 à basse température.
 Une capacité calorifique électronique, linéaire en T, intervenant pour les substances
métalliques.
 Une capacité calorifique de Schottky provenant de la décomposition du niveau électronique
fondamental de l'ion magnétique, se manifestant par un terme en A / T 2 .
 La capacité calorifique magnétique CV(m ) due aux interactions entre ions magnétiques.

La capacité calorifique magnétique (figure ci-dessous), obtenue par différence, est caractérisée par
un maximum au point critique.
Au voisinage de ce point, elle est représentée par l'expression restant finie et continue
−α
(m ) T − TC
(8) CV = K − A
TC
où l'exposant critique α a une valeur négative de l'ordre de -0.1 (tableau précédent). A basse
température (figure ci-dessous) la capacité est de la forme
cV(m )
(9) = B1T 3 / 2 + B2T 5 / 2
R
VI.3.3. Interaction entre ions magnétiques
Les interactions entre ions magnétiques sont de deux sortes : interactions magnétiques entre dipôles
et interactions d'échange électrostatiques entre électrons de deux ions voisins en relation avec la
règle de symétrisation, appelées interactions d'échange.

L'énergie d'interaction magnétique entre deux dipôles µ i et µ j portés par les ions magnétiques i et
j du cristal a pour expression :
µ  µ i ⋅ µ j 3(µ i ⋅ rij )(µ j ⋅ rij ) µ 0 µ i µ j
(1) ε ij = 0  3 − ~
4π  rij rij5  4π rij
3

On peut évaluer cette énergie en prenant rij de l'ordre de grandeur de la distance entre ions
magnétiques proches voisins, par exemple 2Å, ainsi que µ i et µ j de l'ordre de µ B . On trouve
alors ε ij = 1.1 × 10 −24 J = 6.7 × 10 −6 eV . L'interaction magnétique ne donne lieu à des effets notables
que pour des températures de l'ordre de ε ij / k ≅ 0.1 K . Elle est très faible devant l'interaction
d'échange pour les substances présentant du ferromagnétisme dans le domaine de température
supérieure à 1 K. Par contre, comme elle décroît en 1 / r 3 alors que l'interaction d'échange décroît
exponentiellement, elle est responsable de l'apparition de ferromagnétisme à très basse température
dans les substances magnétiquement très diluées, telles que l'alun de chrome et de potassium
CrK (SO4 )2 ⋅ 12 H 2 O ( TC = 0.004 K ).

L'interaction d'échange entre électrons d'ions voisins est de nature coulombienne et dépend de l'état
de spin des électrons par l'intermédiaire de la règle de symétrisation (W. Heisenberg, 1926). En
effet, considérons deux électrons appartenant à deux ions voisins et ayant pour fonctions d'onde
orbitales respectives φ1 (r ) et φ 2 (r ) . La fonction d'onde totale ψ devant être antisymétrique par
échange des électrons, les fonctions d'onde de spin χ et orbitale φ doivent être l'une symétrique,
l'autre antisymétrique. La fonction d'onde totale de spin symétrique correspond à l'un des trois états
:
(2) + +
1
(+− + −+ ) −−
2
et a un spin total S = 1 (état triplet). La fonction d'onde antisymétrique
(3)
1
(+− − −+ )
2
a un spin total S = 0 (état singulet). La fonction d'onde totale orbitale est l'une des deux fonctions :
(4) φ =
1
[φ1 (r1 )φ 2 (r2 ) m φ1 (r2 )φ 2 (r1 )]
2
le signe - étant associé aux états triplets (S = 1) et le signe + à l'état singulet (S = 0).

Le potentiel d'interaction coulombienne entre les électrons V = e 2 / r12 introduit une énergie
d'interaction
e2
(5) ε = φ V φ = φ φ
r12
qui dépend des spins uniquement par la symétrie de φ . En développant, on trouve :
(6) ε = K m J = K [1 − S (S + 1)]J
K et J représentant les intégrales :
e2
K=∫ φ1 (r1 ) φ 2 (r2 ) d 3r1d 3r2
2 2

r12
(7)
e2
J = ∫ φ1 (r1 )φ1∗ (r2 )φ 2 (r2 )φ 2∗ (r1 )d 3r1 d 3r2
r12

Comme on a Sˆ 2 = S (S + 1) ainsi que :

(8) Sˆ 2 = (sˆ 1 + sˆ 2 ) = sˆ 12 + sˆ 22 + 2sˆ 1 ⋅ sˆ 2 = + 2sˆ 1 ⋅ sˆ 2


2 3
2
l'énergie d'interaction (6) entre les deux électrons s'écrit :
J
(9) ε = K − − 2 Js1 ⋅ s 2
2

Cette énergie, dont on omet généralement le terme K - J/2, est appelée énergie d'échange et J e
appelée intégrale d'échange car son expression (7) présente l'échange des coordonnées des deux
électrons. Insistons sur le fait que l'interaction est purement coulombienne bien que le spin des
électrons s'introduise dans l'expression de l'énergie par l'intermédiaire de la règle de symétrisation :
l'énergie d'échange est une notion quantique et n'a aucun équivalent classique.

Les ions magnétiques contenant généralement plusieurs électrons dans des sous-couches
incomplètes, on généralise la relation (9) sous la forme :
(10) ε = −2 JS1 ⋅ S 2

L'intégrale d'échange J a les dimensions d'une énergie et varie rapidement en fonction de la distance
des ions : à petite distance elle est négative puis devient positive et tend alors vers zéro
exponentiellement à plus grande distance. Ainsi les ions du manganèse métallique, distants de d =
2.2 Å, présentent une intégrale d'échange négative alors que les ions du cobalt et du nickel
métallique (d = 2.5 Å) ont une intégrale d'échange positive. Notons qu'une valeur de J positive
favorise un arrangement parallèle des spins des ions et conduit, ainsi que nous le montrerons, au
ferromagnétisme. Une valeur négative de J favorise un arrangement antiparallèle et conduit au
phénomène d'antiferromagnétisme.

Les calculs théoriques a priori montrent cependant que le modèle à électrons localisés dans les ions
(figure (a) ci-dessous) ne suffit pas pour interpréter l'ordre de grandeur de J.
Dans les métaux, l'interaction d'échange prépondérante s'effectue par l'intermédiaire des électrons
de conduction (théorie RKKY) (figure (b) ci-dessus). De même, dans les composés ioniques, les
ions magnétique ont une interaction, dite de superéchange, transmise par les électrons d'ions non
magnétiques (tels que O −− , Cl − , F − ) qui les séparent (figure (c) ci-dessus). Cependant la relation
(10) constitue encore une bonne expression phénoménologique qui se révèle très fructueuse dans
l'interprétation des propriétés magnétiques des substances.
VI.3.4. Modèles du ferromagnétisme

Modèles d'Heisenberg
En partant de l'expression de l'énergie d'échange entre deux ions, W. Heisenberg (1928) a proposé
pour l'hamiltonien d'un système de spins en interaction l'expression
Hˆ = gµ B B ⋅ ∑ Sˆ i − 2∑ J ij Sˆ i ⋅ Sˆ j
i ij
(1)
= gµ B B ⋅ ∑ Sˆ i − 2 ∑ J ij Sˆ i ⋅ Sˆ j
i i , j ≠i

Le premier terme de cet hamiltonien représente l'action du champ magnétique sur les ions de la
forme :
(2) − M ⋅ B avec M = − gµ B ∑ S i
i

Le second terme représente l'interaction d'échange entre les ions, l'intégrale d'échange J ij = J ji ne
dépendant que de la distance des ions i et j. Il est la somme sur toutes les paires d'ions <ij> du
terme d'interaction d'échange, c'est-à-dire aussi la moitié de la somme sur tous les couples i et j (l
facteur 1/2 corrige le double comptage d'une même paire d'ions, ij et ji).

Notons que l'hamiltonien Ĥ est un opérateur s'exprimant en fonction des N opérateurs vectoriels
Ŝ i .

Dans le cadre de l'ensemble canonique, la fonction de partition canonique Q N du système de spins


s'exprime à partir de l'hamiltonien sous la forme :
(3) Q N = Tr e − β H = ∑ r e − β H r
ˆ ˆ

où r ≡ m1 , K, m N est un des (2 S + 1) états possibles des spins, la somme sur r signifiant :


N
S S
(4) ∑
r
→ ∑
m1 = − S
L ∑
mN =− S

La connaissance de cette fonction de partition permet ensuite d'obtenir les propriétés magnétiques
de la substance ainsi que nous l'avons vu. Cependant, la détermination exacte de la fonction de
partition correspondant à l'hamiltonien (1) n'a pu encore être effectuée. Seuls des méthodes
approchées et des modèles simplifiés ont pu être utilisés : la comparaison à l'expérience de leurs
résultats confirme la validité de l'hamiltonien d'Heisenberg.

Introduisons ici des notations qui se révéleront utiles par la suite. Ainsi, le moment magnétique de
saturation est défini par
(5) M S = NSgµ B
et la valeur molaire par
(6) M MS = NSgµ B = 5.585Sg SI

D'autre part, nous noterons w la somme des intégrales d'échange d'un ion i avec l'ensemble des
autres :
(7) w = ∑ J ij
j ≠i

cette grandeur ne dépendant pas de la position de l'ion i. Dans le cas où l'on ne considère que
l'interaction d'un ion avec z plus proches voisins équidistants, on a :
(8) w = zJ

Enfin, nous définissons une température θ telle que :


(9) kθ = S (S + 1)w
2
3

Nous verrons sur quelques exemples que cette température est la température de Weiss dans le
modèle de Heisenberg.
Méthode du champ moléculaire

Champ moléculaire
Une des difficultés d'utilisation de l'hamiltonien (1) réside dans le fait qu'il n'est pas linéaire en S i .
Une façon de le linéariser est d'effectuer le remplacement
(10) S i ⋅ S j → S i ⋅ S + S ⋅ S j − S ⋅ S
où S représente la valeur moyenne canonique de S i (et de S j ) et est telle que l'on a d'après (2) :
M M
(11) S = =S = SR
Ngµ B MS

On a montré que la linéarisation est d'autant plus valable que le nombre z de voisins d'un ion est
grand. Notons que la transformation plus simple S i ⋅ S j → S i ⋅ S est souvent utilisée. Elle contient
la même signification physique mais conduit dans certains cas à des doubles comptages.

La transformation (1) permet d'écrire l'hamiltonien d'Heisenberg sous la forme :


(12) Hˆ = gµ B ⋅ Sˆ − 2 S ⋅ J Sˆ + (S )
∑ ∑ ∑
2
B i ij J
i ij
i i , j≠ i i, j ≠i

les indices muets i et j pouvant être intervertis. En utilisant la relation (7), l'hamiltonien s'écrit :
 2w  ˆ
(13) Hˆ = gµ B  B − S ∑ S i + Nw(S )
2

 gµ B  i

En dehors d'un terme constant, cet hamiltonien est celui d'un système de spins sans interaction
placé dans un champ effectif B eff = B + B W , somme de l'induction magnétique B et d'un champ
fictif s'écrivant, d'après (11) :
2w 2 wS
(14) BW = S = R
gµ B gµ B
Un tel champ fictif, proportionnel à l'aimantation réduite R, a été introduit dès 1907 par P. Weiss
sous le nom de champ moléculaire pour interpréter de nombreuses propriétés des substances
magnétiques. Nous introduirons la grandeur
2 wS
(15) q =
gµ B
caractéristique de la substance et homogène à une induction magnétique.

L'hamiltonien auquel nous aboutissons a pour expression :


(16) Hˆ = gµ B Beff ∑ Sˆ zi + NS 2 wR 2 avec Beff = B + qR
i
où nous avons choisi l'axe des z parallèle à B.

Moment magnétique
En omettant le terme indépendant des Ŝ zi , la fonction de partition canonique correspondante est :
  x  µ B Beff M S Beff
(17) Q N = Tr exp − ∑ Sˆ zi  avec x = Sg =
  S i  kT NkT

Comme l'hamiltonien est diagonal sur la base d'état r , la fonction de partition s'écrit :
S S
QN = ∑
m1 = − S
L ∑ exp(− xm
mN =− S
1 / S )L exp(− xm N / S )
(18) N
 S 
=  ∑ exp(− xm / S ) = Z N
m =− S 
Z étant la fonction de partition à une particule rencontrée dans le modèle de Brillouin du
paramagnétisme. L'énergie libre a alors pour expression :
(19) F = − kT ln Q N = − NkT ln Z
soit, en réintroduisant le terme constant de Ĥ et en explicitant Z :
sinh 2 SS+1 x
(19) F = − NkT ln 1
+ NS 2 wR 2
sinh 2 S x
avec
M S (B + qR )
(20) x =
NkT

Dans cette expression, en plus des variables N, T et B, figure l'aimantation réduite R = M / M S que
l'on détermine à l'aide de la relation M = −(∂F / ∂B ) . On obtient ainsi :
∂ ln Z d ln Z
(21) M = NkT = MS
∂B dx
soit, en introduisant la fonction de Brillouin :
M  M (B + qR ) 
(22) R = = B S (x ) = BS  S 
MS  NkT 

Cette relation définit R, donc M , de façon implicite, en fonction de B et de T. Comme on ne peut


obtenir une expression analytique de M , on est amené à effectuer une résolution graphique ou à
employer des méthodes approchées ou numériques.

Pour résoudre graphiquement l'équation (22), il suffit de remarquer que R s'exprime en fonction de
x, d'une part par (22) et, de l'autre, par la relation :
NkT B
(23) R = x−
qM S q
tirée de (20). L'ordonnée de l'intersection de la courbe R = BS ( x ) avec la droite (23) fournit la
valeur de R = M / M S à B et T fixé (figure ci-dessous).
Les isothermes M (B, Ti ) et les courbes isochamps M (T , Bi ) qui s'en déduisent sont représentées
dans la figure ci-dessous.
L'accord qualitatif avec les courbes expérimentales est évident.

La résolution en champ nul (B = 0) mérite une discussion particulière. La droite (23) passe alors par
l'origine. A température suffisamment grande, la pente de la droite, proportionnelle à la
température, est supérieure à la pente à l'origine de la fonction de Brillouin : la solution de
l'équation (22) est M = 0 . A température suffisamment basse, la pente devient inférieure à celle de
la fonction de Brillouin à l'origine et il apparaît une nouvelle solution M ≠ 0 , correspondant à une
aimantation spontanée (l'état M = 0 est instable). La transition de la phase paramagnétique à la
phase ferromagnétique a lieu pour une température TC telle que la droite et la fonction de Brillouin
aient la même pente à l'origine, soit :
NkTC S + 1
(24) =
qM S 3S

Le modèle du champ moléculaire conduit donc à une température de Curie qui, d'après (5) et (14),
vaut :
S + 1 qM S 2 S (S + 1)w
(25) TC = = ≡θ
3S Nk 3 k

Dans la phase paramagnétique en champ faible, le moment magnétique M est faible devant le
moment de saturation M S (R << 1) et l'on peut remplacer dans (22) la fonction de Brillouin par sa
tangente à l'origine (S + 1)x / 3S . On a alors :
M S +1 MS B θ M
(26) = +
MS 3S NkT T M S
d'où
S + 1 M S2 B S (S + 1)g 2 µ B2 B
(27) M = =N
3S Nk T − θ 3k T −θ

Cette loi représente une loi de Curie-Weiss avec une température de Weiss égale à θ , définie en (9)
et une constante de Curie de forme identique à celle vue dans le paramagnétisme. Elle est en accord
avec les résultats expérimentaux pour T >> TC . Cependant, elle fait coïncider les températures de
Weiss θ et de Curie TC , ce qui est expérimentalement faux ( TC < θ ). Par ailleurs, la loi (27)
étendue à tout le domaine de température conduit à un exposant critique γ égal à 1 en désaccord
avec les données expérimentales.

Dans la phase ferromagnétique, la résolution graphique pour diverses valeurs de S conduit à des
variations de l'aimantation spontanée avec la température représentées dans la figure ci-dessous.
L'accord avec l'expérience est satisfaisant, mais seulement de façon qualitative. En particulier pour
M / M S < 0.5 , on peut obtenir l'aimantation à partir de (22) en remplaçant la fonction de Brillouin
par son développement limité. L'équation (22) s'écrit alors :
θ M (2S + 1)4 − 1  2S 2 w M 
3
M
(28) = −  
45(2 S )  kT M S 
4
MS T MS
équation qui, après simplification, montre que M ∝ T (θ − T ) . Au voisinage du point de Curie
1/ 2

TC = θ , le moment magnétique varie donc comme :


(29) M ∝ (θ − T ) avec β = 1 / 2
β

La valeur de l'exposant critique β ainsi trouvée est en désaccord avec les valeurs expérimentales
β ≅ 0.35 .
De même, pour M / M S > 0.8 , on peut remplacer la fonction de Brillouin par sa limite quand x
tend vers l'infini. Il vient alors :
 w M 
 ≅ 1 − exp − 2S
M 1 1 w
(30) = 1 − exp − 2 S 
MS S  kT M S  S  kT 
expression dans laquelle le moment magnétique tend au zéro absolu vers sa valeur de saturation
M S beaucoup plus vite que par la loi de puissance expérimentale.

Enfin, pour T = TC , un calcul élémentaire mais fastidieux montre que le moment magnétique varie
comme :
(31) M ∝ B1 / δ avec δ = 3

Ce résultat est en accord moyen avec l'expérience ( δ ≅ 4 ).

Capacité calorifique
L'énergie interne peut s'obtenir soit par la relation U = −∂ ln Q N / ∂β , soit en effectuant la valeur
moyenne de l'hamiltonien. Cette dernière méthode plus directe donne :
 2w 
U = gµ B  B − S  N S + Nw(S )
2

 gµ B 
(31) 2
2  M 
= − M ⋅ B − NS w 
 MS 

Le premier terme de U est l'énergie de la substance dans le champ extérieur et le second terme
l'énergie d'échange des ions.

La capacité calorifique magnétique de la substance en champ nul est alors :


(m ) ∂U 2 NS 2 w dM
(32) CV = =− M
∂T M S2 dT
Dans la phase paramagnétique, le moment magnétique étant nul, cette capacité est nulle. Dans la
phase ferromagnétique, le moment magnétique est une fonction décroissante de la température et la
capacité calorifique est positive. Elle est représentée dans la figure ci-dessous.

L'accord avec l'expérience est qualitatif. Le modèle prévoit, contrairement aux mesures, une
discontinuité à la température de Curie égale à :
5S (S + 1)
(33) ∆cV(m ) = − R
2 S (S + 1) + 1
correspondant à un exposant critique α = 0 par définition. De même, à basse température, le
modèle prévoit une décroissance exponentielle au lieu de la variation expérimentale selon une loi
de puissance.

Discussion et améliorations
La méthode du champ moléculaire permet d'interpréter les phénomènes du ferromagnétisme. En
particulier, elle est exacte à haute température et elle prévoit l'existence d'une aimantation
spontanée correspondant à l'établissement d'un ordre à grande distance au-dessous d'une
température critique. Toutefois, elle ne permet pas de reproduire le comportement au voisinage du
point critique et à basse température.

L'étude de cette méthode dans des espaces physiques de diverses dimensionnalités d montre qu'elle
donne les mêmes résultats au point critique que le modèle d'Heisenberg pour d > 4. Ceci est lié au
fait que plus le nombre de proches voisins est grand, meilleure est l'approximation (10). Le défaut
de la méthode du champ moléculaire est de négliger les corrélations entre les spins qui ont d'autant
plus d'importance que le nombre de voisins est faible. Ces corrélations se manifestent par
l'existence d'un ordre à courte portée, même au-dessus du point critique, alors que l'ordre à longue
portée a disparu. Dans la méthode de Bethe-Peierls-Weiss, on traite l'interaction entre les ions
voisins de façon exacte et l'interaction avec les ions plus distants par la méthode du champ
moléculaire. Les résultats s'améliorent alors. En particulier, ils donnent TC ≠ θ et une capacité
calorifique non nulle au-dessus du point de Curie. Cette méthode peut se généraliser en considérant
les couches successives de voisins.

Au voisinage du zéro absolu, le désaccord provient du fait que la méthode du champ moléculaire
revient à considérer les spins comme indépendants. L'introduction des ondes de spins et des
magnons rétablit l'accord, de même que l'introduction des ondes élastiques et des phonons l'a fait
vis-à-vis du modèle d'Einstein.
Modèles simplifiés

Introduction
La méthode du champ moléculaire est une méthode approchée à partir d'un hamiltonien exact. Il est
possible en simplifiant l'hamiltonien d'appliquer des méthodes exactes. On peut, par exemple, se
limiter aux interactions entre proches voisins. On peut aussi réduire (ou augmenter) la dimension d
de l'espace. On peut enfin considérer des spins dont le nombre de composantes D est différent de 3
: lorsque le spin n'a qu'une composante (D = 1) on a le modèle d'Ising. Pour deux composantes (D =
2) on a le modèle XY, et pour une infinité de composantes ( D = ∞ ) le modèle sphérique. Ces
modèles ont permis d'avoir une compréhension plus large du ferromagnétisme et ont pu être
appliquées à certains exemples physiques.

Parmi les modèles utilisés, le plus élémentaire est le modèle d'Ising (D = 1) avec des spins S = 1/2
et des interactions entre plus proches voisins seulement. L'hamiltonien (1) devient pour ce système
:
(34) Hˆ = gµ B B ∑ Sˆ zi − 2 J ∑ Sˆ zi Sˆ zj
i ij

il est alors diagonal sur la base des états r et a pour valeurs propres :
E r = gµ B B ∑ m i − 2 J ∑ m i m j
i ij
(35) gµ B B J
=
2

i
α i − ∑ α iα j
2 ij
où les α i = 2mi sont des nombres quantiques prenant les valeurs +1 ou -1. Notons que la somme
sur ij de (35) est restreinte aux paires d'ions voisins et compte donc zN/2 termes.

Modèle d'Ising à une dimension


Un modèle dont le spin S = 1/2 n'a qu'une composante (D = 1) a été considéré pour la première fois
par V. Lenz (1920) et a été résolu dans un espace à une dimension (d = 1) et pour des interactions
limitées aux ions voisins par E. Ising (1925). Dans ce modèle où chaque ion a deux voisins (z = 2),
l'énergie de l'état r est :
gµ B B N J N
(36) E r = ∑
2 i =1
α i − ∑ α iα i +1
2 i =1

Notons que nous avons ajouté le terme α N α N +1 . En identifiant α N +1 à α 1 , cela revient à éliminer
les effets de bord en considérant que la chaîne des spins est fermée.

La fonction de partition canonique a alors pour expression :


(37) Q N = ∑ e − β Er = ∑ L ∑ K (α 1 , α 2 )K (α 2 , α 3 )L K (α N , α 1 )
r α1 = ±1 α N = ±1

où K (α , α ′) est le tableau de quatre nombres défini par :


 βgµ B B α + α ′ βJ 
(38) K (α , α ′) = exp − + αα ′ 
 2 2 2 

En considérant K comme une matrice 2x2, l'expression (37) ci-dessus de Q N représente la trace de
la matrice K N . La trace d'une matrice étant la somme de ses valeurs propres, en appelant λ1 et
λ2 < λ1 les valeurs propres de la matrice K, on a :
  λ N 
(39) Q N = Tr K N
= λ + λ = λ 1 +  2  
N N N

  λ1  
1 2 1

A la limite thermodynamique N → ∞ , (λ 2 / λ1 ) tend vers zéro et l'on a :


N

(40) Q N = λ1N

D'après (38) la matrice K a pour expression :


exp(− x + a ) exp(− a ) 
(41) K = 
 exp(− a ) exp( x + a )
avec
gµ B B J
(42) x = et a =
kT 2kT

L'équation caractéristique étant λ2 − 2λe a cosh x + 2 sinh 2a = 0 , les valeurs propres de K, solutions
de cette équation sont :
λ1, 2 = e a cosh x ± [e 2 a cosh 2 x − 2 sinh 2a ]
1/ 2

[ ]
(43)
(
= e a cosh x ± sinh 2 x + e −4 a )
1/ 2

L'énergie libre a alors pour expression :


(44) F = − kT ln Q N = − NkT ln λ1
et le moment magnétique de la substance s'écrit :
∂F NkT dλ1 Ngµ B B dλ1
M =− = =
∂B λ1 dB 2λ1 dx
(45)
Ngµ B sinh ( gµ B B / 2kT )
=
[
2 sinh 2 ( gµ B B / 2kT ) + exp(− 2 J / kT ) 1 / 2 ]
On constate qu'en champ magnétique nul le moment magnétique est nul : ce modèle à une
dimension ne présente pas de phase ferromagnétique. Ceci est lié au fait que le nombre de proches
voisins est faible (z = 2). En champ faible, l'aimantation a la forme :
g 2 µ B2 e J / kT
(46) M = N B
4k T
correspondant à la susceptibilité représentée dans la figure ci-dessous.
Remarquons que la susceptibilité est telle que :
1  J  J
(47) ∝ Te − J / kT = T 1 − + L = T − + L
χ  kT  k
expression montrant qu'à haute température la substance suit une loi de Curie-Weiss avec θ = J / k ,
en accord avec l'expression (9) pour z = 2 et S = 1/2.

L'énergie interne de la substance en champ nul a pour expression


d ln Q N d  βJ  J J
(48) U = − = −N ln 2 cosh  = − N tanh
dβ dβ  2  2 2kT
Cette expression montre qu'au zéro absolu l'énergie de la substance est U 0 = − NJ / 2 . Tous les
spins sont donc parallèles ce qui signifie que la substance devient ferromagnétique au zéro absolu.
Notons enfin que la capacité calorifique molaire a pour expression :
2
c  J  1
(49) V =  
R  2kT  cosh ( J / 2kT )
2

correspondant à une capacité calorifique de Schottky où ε = J représente l'énergie nécessaire au


retournement d'un spin.

Autres modèles
D'autres modèles ont pu être résolus de façon exacte. Citons le modèle d'Ising pour un réseau carré
(deux dimensions) résolu par L. Onsager (1944) avec des interactions entre plus proches voisins et
un spin 1/2. Il présente un changement de phase pour TC tel que sinh θ / 2TC = 1 , soit TC = 0.567θ .
Les exposants critiques obtenus sont :
1 7
(50) α = 0 , β = , γ = et δ = 15
8 4

L'exposant critique α = 0 correspond à une capacité calorifique se comportant en ln T − TC . Pour


d'autres types de réseaux (triangles ou hexagones) on obtient les mêmes exposants critiques. Seule
la valeur de TC / θ change.

Dans le modèle sphérique ( D = ∞ ) à trois dimensions (d = 3) les exposants critiques sont :


1
(51) α = −1 , β = , γ = 2 et δ = 5
2
La valeur de α correspond à une capacité calorifique continue à la température critique mais
présentant un point anguleux.

Développement à haute température


Considérons le modèle d'Ising dont l'énergie a l'expression (35). Sa fonction de partition est de la
forme
(52) Q N = ∑ Lα ∑ ∏ exp xα ∏ exp(− aα α )
α1 = ±1
k i j
N = ±1 k ij

x et a étant donnés en (42). Les termes α k et α iα j ayant pour valeur +1 ou -1, l'identité
(53) exp(± u ) = cosh u ± sinh u = cosh u (1 ± tanh u )
permet de transcrire Q N sous la forme :
(54) Q N = (cosh x ) (cosh a ) ∑ ∏ (1 + α tanh x )∏ (1 + α iα j tanh a )
N zN / 2
k
α1 ,K,α N k ij

Lorsque T tend vers l'infini, x et a tendent vers zéro et la somme figurant dans (54) permet d'obtenir
un développement de Q N en fonction de 1/T par l'intermédiaire de tanh x et tanh a. Le terme de
cette somme en (tanh x ) (tanh a ) contient p facteurs du type α k et q facteurs du type α iα j . Il
p q

peut être symbolisé par un graphe (figure ci-dessous) contenant p croix représentant les sites k et q
segments entre deux sites voisins ij .

Du fait que l'on a les relations :


(55)
α
∑α
= ±1
2 r +1
= 0 et
α
∑α = ±1
2r
=2

tous les graphes comprenant un des α i élevés à une puissance impaire sont nuls, les autres
contribuent pour 2 N . Le coefficient du terme en (tanh x ) (tanh a ) est donc égal à 2 N fois le
p q

nombre de graphes non nuls contenant p croix et q segments. Les deux termes de plus bas ordre
restants correspondent aux graphes :
(56) p = 2, q = 1 : et p =3, q = 2 =
ils sont en nombre respectifs zN / 2 et s ( z − 1)N / 2 . Les termes suivants dépendent du type de
réseau.

Les premiers termes du développement de Q N sont donc :


 Nz Nz ( z − 1) 
(57) Q N = (2 cosh x ) (cosh a ) 1 + 2 tanh c tanh a + tanh 2 x tanh 2 a + L
N zN / 2 2

2 
et le moment magnétique de la substance a pour expression :
∂ ln Q N ∂ ln Q N
M = kT = gµ B
∂B ∂x
(58)
Ngµ B  tanh 2 a 
= tanh x 1 + z
tanh a
2
+ z ( z − 1) 2
+ L
2  cosh x cosh x 

Pour des champs faibles (x  0) on voit que M est proportionnel à B et la susceptibilité


magnétique a pour développement :
C 
+ z ( z − 1) tanh 2
J J
χ = 1 + z tanh + L
T 2kT 2kT 
(59)
C  θ z −1 θ 2 
= 1 + + 2
+ L
T T z T 
où C est la constante de Curie et où θ = Jz / 2k est la température de Weiss (9). Remarquons que
les deux premiers termes de ce développement (ainsi que le troisième pour z → ∞ ) coïncident avec
ceux du développement de la loi de Curie-Weiss.
En identifiant terme à terme le développement à haute température de grandeurs telles que χ (59)
avec celui de fonctions contenant des facteurs singuliers tels que (1 − TC / T ) , il est possible de
−γ

déterminer la température critique TC et les divers exposants critiques. Ainsi, l'expression (59)
correspond au développement à l'ordre deux en θ / T de la fonction :
γ
C T  T z−2 z
(60) χ =   avec C = et γ =
T  T − TC  θ Z z−2

Ce résultat approché est en accord raisonnable avec les valeurs expérimentales pour z = 12 (réseau
cubique à faces centrées).

Le choix de la fonction à identifier n'est pas unique mais lorsque le nombre de termes du
développement augmente, les valeurs de TC et des exposants critiques deviennent indépendantes du
choix.

Il existe d'autres types de développement, par exemple les développements à partir des basses
températures. La méthode la plus puissante est une méthode basée sur le groupe de renormalisation
de la théorie quantique des champs où le développement s'effectue sur la dimension d de l'espace
physique, par exemple en fonction de ε = 4 − d . Cette méthode montre que les exposants critiques
ne dépendent pas du type de réseau. Pour un modèle d'Ising à 3 dimensions (D = 1, d = 3), on
trouve :
(61) α = 0.107 , β = 0.327 , γ = 1.239 , δ = 4.789
l'erreur portant sur la dernière décimale, et, pour un modèle d'Heisenberg à trois dimensions (D = 3,
d = 3) :
(62) α = −0.115 , β = 0.365 , γ = 1.386 , δ = 4.795 .

Ces résultats sont en bon accord avec les valeurs expérimentales.


Ondes de spin et magnons

Modèle à une dimension


Au zéro absolu, une substance ferromagnétique se trouve dans son état fondamental pour lequel
tous les spins présentent l'alignement maximum. Pour l'étude de cette substance au voisinage du
zéro absolu, on doit rechercher les premiers états excités. Pour dégager les propriétés de ces états,
nous considérons un modèle simple à une dimension constitué d'une file de N ions de spin S = 1/2
distants de a et interagissant seulement entre proches voisins. En champ nul, l'hamiltonien de ce
système a pour expression
N
Hˆ = −2 J ∑ Sˆ i ⋅ Sˆ i +1
i =1

( )
N
(63) = −2 J ∑ Sˆ x ,i Sˆ x ,i +1 + Sˆ y ,i Sˆ y ,i +1 + Sˆ z ,i Sˆ z ,i +1
i =1

( )
N
= − J ∑ Sˆ + ,i Sˆ −,i +1 + Sˆ −,i Sˆ + y ,i +1 + 2 Sˆ z ,i Sˆ z ,i +1
i =1

Dans l'état fondamental 0 ≡ + + L + de ce système, tous les spins ont pour projection +1/2.
L'énergie E 0 de cet état, obtenue en appliquant Ĥ au ket 0 , est
J
(64) E 0 = − N
2
car les opérateurs S + donnent un résultat nul et seuls les opérateurs S z interviennent chacun pour
un facteur 1/2. Ce résultat s'interprète en attribuant à deux spins voisins parallèles une énergie
d'interaction -J/2.

Considérons maintenant un état excité de la file, noté n , dans lequel le nième spin est retourné,
soit
(65) n ≡ + + L + − + L +
Les N états de ce type ne sont pas des états propres de l'hamiltonien car on a :
(66) Hˆ n = (E0 + 2 J ) n − J n + 1 − J n − 1

Ce résultat est obtenu en utilisant les relations :


Sˆ + ,i n = δ in 0 Sˆ −,i 0 = i
(66) 1 1
Sˆ z ,i n = n n ≠ i Sˆ z , n n = − n
2 2

Un état n n'est donc pas stationnaire et la position du spin retourné va se propager. Les équations
du type (66) ont déjà été rencontrées lors de la propagation d'un électron dans un cristal. Les états
du type
1 N ikna
(67) k = ∑e n
N n =1
sont stationnaires car on a :
1
Hˆ k =
N
∑ e ikna Hˆ n
(68)
=
1
[ ]
(E0 + 2 J )∑ e ikna n − J ∑ e ikna n + 1 − J ∑ e ikna n − 1
N
soit, en posant respectivement n' = n + 1 et n' = n - 1 dans les deux dernières sommes :
(
(69) Hˆ k = E0 + 2 J − Je −ika − Je ika k )
L'état k a donc comme énergie, en prenant E 0 comme origine :
ε k = J (2 − e − ika − e ika )
(70)
= 2 J (1 − cos ka ) = 4 J sin 2
ka
2

Cette relation de dispersion est représentée dans la figure ci-dessous.


Il est possible de visualiser un état k de la façon suivante. Comme nous avons
N −2
(71) k Sˆ z ,n k = et k Sˆ ± ,n k = 0
2N
nous voyons que le spin n a une projection pratiquement égale à 1/2 sur l'axe des z, la valeur
moyenne des autres projections étant nulle. De plus, le produit scalaire des projections sur le plan
xy des spins n et n' étant
(72) k S x ,n S x , n′ + S y ,n S y ,n′ k = k S + ,n S − ,n′ + S − ,n S + ,n′ k = cos(n − n ′)ka
1
N
on peut considérer que chaque spin a une projection transverse de module 1 / N et décalée d'un
angle ka relativement à celle de ses voisins (figure ci-dessous).

Notons que, comme pour les ondes élastiques dans les solides, on peut restreindre les valeurs de k à
l'intervalle − π / a , + π / a , car le ket k + 2π / a est identique au ket k . De plus, il n'existe que N
états k indépendants, fonctions linéaires des N états n . En prenant les valeurs régulièrement
espacées
2π N N
(73) k = p avec − ≤ p ≤
Na 2 2
on satisfait à la condition exp iNka = 1 correspondant à la condition aux limites périodiques de
Born-von Karman (ou à celle d'une chaîne fermée).

Généralisation à trois dimensions


La discussion précédente se généralise à trois dimensions. Les ondes de spin sont alors
caractérisées par un vecteur d'onde k pouvant prendre N valeurs uniformément réparties dans la
première zone de Brillouin. La relation de dispersion ε (k ) de ces ondes est anisotrope. Pour les
petites valeurs de k, elle est quadratique et, pour les cristaux cubiques, elle a la forme isotrope :
(74) ε (k ) = Dk 2
D étant une constante.

D'autres états excités peuvent être construits en retournant deux ou plusieurs spins. Ils peuvent être
considérés, en première approximation, comme la superposition d'ondes de spin sans interaction.
On montre alors que la quantification de ces ondes introduit des particules appelées magnons
obéissant à la statistique de Bose-Einstein et ayant pour relation de dispersion ε = ε (k ) . L'état
magnétique d'une substance peut être considéré comme la superposition de l'état fondamental et
d'un gaz de magnons en nombre indéterminé N mag à la température T. En particulier le moment
magnétique de la substance est
(75) M = M S − N mag gµ B
car la présence de chaque magnon correspond au retournement d'un spin (cas S = 1/2) et son
énergie magnétique est égale à l'énergie magnétique au zéro absolu augmentée de celle du gaz de
magnons. On a ainsi :
d 3rd 3p 1 (m ) d 3rd 3 p ε
(76) N mag = ∫ et U − E = ∫ h3 e β ε −1
h3 e β ε − 1
0

A basse température, seuls les magnons de faible valeur de k = p / h sont créés et l'on peut calculer
les intégrales ci-dessus en remplaçant ε par :
(77) ε = Dk 2 = Dp 2 / h 2
et en intégrant sur toutes les valeurs de p. En faisant le changement de variable x = βDp 2 / h 2 , le
nombre de magnons et l'énergie s'écrivent :
3/ 2
V  kT  ∞ x
1/ 2
dx
N mag = 2   ∫0 x
4π  D  e −1
(78) 3/ 2
V  kT  ∞ x
3/ 2
dx
U (m ) − E0 =   kT ∫
4π  D 
2 0 e −1
x

Les intégrales ayant pour valeur respective 2.315 et 1.784, nous avons finalement :
3/ 2 3/ 2
N T  (m ) N T 
(79) N mag = 2.315 2   et U − E 0 = 1.784 2   kT
4π Θ 4π  Θ 
où Θ = ( N / V ) D / k est une température caractéristique. L'aimantation réduite de la substance est
2/3

alors :
gµ B 5.86 × 10 −2
3/ 2
M T 
(80) R = = 1 − N mag = 1−  
MS MS S Θ
résultat en accord avec les premiers termes de la loi expérimentale avec
5.86 × 10 −2 1
(81) A1 =
S Θ3 / 2

La capacité calorifique magnétique molaire, autre grandeur mesurable, a pour expression :


du (m ) 5 1.784  T 
3/ 2 3/ 2
(m ) T 
(82) cV = = 2   Nk = 0.113R 
dT 2 4π  Θ  Θ
résultat en accord avec le premier terme de la loi expérimentale avec
0.113
(83) B1 = 3 / 2
Θ

Pour une comparaison quantitative, considérons l'oxyde d'europium pour lequel la constante D de
la relation de dispersion (74) vaut D = 10.8 × 10 −3 eV Å (figure ci-dessous).
En prenant les masses volumique et molaire expérimentales, on trouve Θ = 11.9 K ,
A1 = 4.1 × 10 −4 K −3 / 2 et B1 = 2.7 × 10 −3 K −3 / 2 . La valeur de B1 est en assez bon accord avec la
valeur expérimentale 1.92 × 10 −3 K −3 / 2 alors que la valeur de A1 en diffère d'un ordre de grandeur
( A1 = 0.45 × 10 −4 K −3 / 2 ). On obtient un meilleur accord en tenant compte des interactions dipolaires
magnétiques. Notons que le modèle prévoit, pour le rapport B1 / A1 , la valeur 1.93S indépendante
de Θ et de D, soit 6.76 pour les sels d'europium Eu 2+ (S = 7/2). Pour l'oxyde EuO la valeur
expérimentale non corrigée des interactions dipolaires est 6.5 fois trop grande. Pour le sulfure
d'europium la valeur corrigée n'est qu'environ deux fois trop grande.
Lorsque l'on tient compte de l'écart entre la courbe de dispersion expérimentale et l'approximation
parabolique (70), il apparaît des termes en T 5 / 2 , T 7 / 2 ,… observés expérimentalement. Enfin, les
interactions entre magnons, négligées jusqu'ici, contribuent par un terme supplémentaire en T 4 ,
n'intervenant pas à basse température.

Notons enfin que les magnons n'existent que dans le modèle d'Heisenberg. Dans le modèle d'Ising,
en effet, les états n sont des états propres dégénérés de l'hamiltonien d'énergie E 0 + 2 J . A basse
température, un modèle d'Ising se ramène à un modèle à deux niveaux et les grandeurs observables
varient alors en exp(− A / T ) .
VI.3.5. Théories des phénomènes critiques

Théorie de Landau
En 1937, L. Landau proposa une description phénoménologique générale des changements de
phase et des phénomènes critiques. Elle consiste à développer un potentiel thermodynamique de la
substance hors équilibre selon les puissances d'un paramètre d'ordre R. En magnétisme, lorsque l'on
néglige les variations de volume, ce potentiel est la fonction
F ∗ (T , B, M ) = U (T , B, M ) − TS (T , B, M ) qui, lorsque M a sa valeur d'équilibre minimisant F ∗ , se
ramène à l'énergie libre F (T , B ) de la substance. L'aimantation réduite R = M / M S tient ici lieu de
paramètre d'ordre.

Considérons tout d'abord la substance en champ magnétique nul. Dans l'hypothèse d'une substance
isotrope, le potentiel F ∗ est une fonction paire de M = M = RM S . Pour les petites valeurs de R,
on peut alors développer F ∗ :
a (T ) 2 b(T ) 4
(1) F ∗ (T , R ) = F0 (T ) + R + R +L
2 4

La forme de cette fonction est représentée dans la figure (a) ci-dessous pour b > 0.
Nous voyons que deux cas se présentent suivant le signe de a : lorsque a est positif, la fonction a
son minimum en R = 0, lorsque a est négatif, son minimum est en R = (− a / b ) . Soit TC , la
1/ 2

température annulant a (T ) . Au voisinage de cette température, la fonction a (T ) a la forme


(2) a (T ) = A(T − TC ) + L

Une aimantation réduit spontanée


1/ 2
A 
(3) R =  (TC − T ) T < TC
b 
apparaît alors en dessous de la température TC si A (de même que b) est positif, l'aimantation étant
nulle pour T > TC . Ce résultat, identique à celui trouvé par la méthode du champ moléculaire,
prévoit un exposant critique β = 1 / 2 .

L'énergie libre F de la substance à l'équilibre est alors donnée par :


 F (T ) − A 2 (TC − T )2 / 4b T < TC
(4) F (T ) =  0
 F0 (T ) T > TC

Nous voyons que la fonction F (T ) est continue au point critique de même que sa dérivée − S (T ) .
Par contre, la capacité calorifique subit une discontinuité :
dS CV0 (T ) + A 2T / 2b T < TC
(5) CV (T ) = T =
dT  CV0 (T ) T > TC

Le saut de capacité calorifique ainsi obtenu est semblable à celui prévu par la théorie du champ
moléculaire.

En présence d'un champ magnétique, le potentiel F ∗ contient un terme supplémentaire


− MB = − M S BR de sorte que, dans la phase paramagnétique (a > 0), on a :
a (T ) 2
(6) F ∗ = F0 (T ) − M S BR + R +L
2

Cette fonction admet un minimum pour


M B MSB
(7) R = S =
a(T ) A(T − TC )

On retrouve ainsi la loi de Curie-Weiss. La théorie de Landau, appliquée au magnétisme, prédit un


changement de phase para-ferromagnétique du second ordre (dérivées premières de F continues :
M et S, dérivées secondes discontinues : CV ). Bien que ce résultat soit inexact, la théorie de
Landau donne une interprétation phénoménologique générale des changements de phase au
voisinage du point critique.

La théorie de Landau permet également d'interpréter les changements de phase du premier ordre.
En effet, lorsque le coefficient b est négatif, on doit tenir compte du terme en R 6 dans le
développement de F ∗ :
(8) F ∗ (T , R ) = F0 (T ) + R 2 + R 4 + R 6 + L
a b c
2 4 6

Cette fonction est représentée dans la figure (a) ci-dessous pour c > 0.
Tant que l'équation F ∗ (T , R ) = F0 (T ) n'admet qu'une solution, le paramètre d'ordre à l'équilibre est
nul. Lorsque d'autres solutions apparaissent, le paramètre d'ordre minimisant F ∗ devient
subitement positif (figure (b) ci-dessus). A la température de transition T0 , il existe deux minimums
correspondant à la coexistence de deux phases, l'une désordonnée R = 0, l'autre ordonnée R ≠ 0 .
Ceci est caractéristique d'un changement de phase du premier ordre tel qu'un changement de phase
liquide - vapeur. L'existence de minimums secondaires correspond à la possibilité d'obtenir des
phases métastables.

La théorie de Landau a introduit l'idée d'une description universelle possible des phénomènes de
changement de phase.

Invariance d'échelle
La théorie de Landau prévoit pour les phénomènes magnétiques des changements de phase du
second ordre. Ceci est en désaccord avec les résultats expérimentaux montrant qu'au voisinage du
point critique le potentiel F ∗ ne peut pas être développé selon l'expression (1), car il n'a pas une
forme analytique.
Dans l'hypothèse d'invariance d'échelle, on admet que l'énergie libre F est, au voisinage de la
température critique, une fonction homogène généralisée, c'est-à-dire qu'il existe deux exposants a
et b tels que l'on ait pour tout nombre λ positif :
( )
(9) F λa t , λb B = λF (t , B )
où t est la variable réduite :
T − TC
(10) t =
TC

Par dérivation, les autres grandeurs sont également homogènes. Ainsi, en dérivant (9) par rapport à
B on obtient :
( )
(11) λb M λa t , λb B = λM (t , B )
ou, en remplaçant λ par λ1 / (1−b ) :
( )
(12) M λa / (1−b )t , λb / (1−b ) B = λM (t , B )

(b −1) / a
Cette expression montre qu'en champ nul, si l'on choisit pour λ la valeur particulière λ = t ,
on a :
(1−b ) / a
(13) M (t ,0 ) = t M (± 1,0 )

Pour retrouver l'aimantation nulle en champ nul au-dessus de la température critique ( t / t = +1 ), on


doit prendre M (+ 1,0) = 0 . Au-dessous de TC ( t / t = −1 ), la relation (13) montre que l'aimantation
spontanée suit une loi de puissance avec pour exposant critique
1− b
(14) β =
a

De même, en prenant λ = B (b −1) / b , l'expression (12) montre qu'à la température critique, on a :


(15) M (0, B ) = B (1−b ) / b M (0,1)
en accord avec la loi de puissance avec pour exposant critique
b
(16) δ =
1− b

Plus généralement, la relation (12) s'écrit sous la forme


(1−b ) / a
(17) M (t , B ) = t (
M ± 1, t
−b / a
B )
généralisant (13) au cas de champs non nuls. En éliminant b et a au profit des exposants critiques
β et δ , cette relation prend la forme réduite :
M  B 
(18) = m  
±
t
β  βδ 
t 
remarquablement vérifiée par l'expérience (figure ci-dessous).
La susceptibilité magnétique s'obtient en dérivant l'expression (18) de M par rapport à B puis en
faisant tendre B vers zéro. On obtient ainsi :
β (1−δ )
(19) χ (t ) = t m′± (0 )
Dans la phase paramagnétique cette expression est une loi de puissance avec l'exposant critique
(20) γ = β (δ − 1)

Cette relation entre exposants critiques est bien vérifiée expérimentalement et par tous les modèles
théoriques.

En dérivant l'énergie libre par rapport à la température on obtient successivement l'entropie et la


capacité calorifique, telles que :
( )
S λa / (1−a )t , λb / (1−a ) B = λS (t , B )
( )
(21)
CV , B λa / (1−2 a )t , λb / (1− 2 a ) B = λCV , B (t , B )

En particulier, en champ nul cette dernière relation montre que la capacité calorifique a la forme :
(1− 2 a ) / a
(22) CV (t ) = t CV , B (± 1,0 )
et suit donc la loi de puissance avec :
1
(23) α = 2 −
a

En éliminant b entre (14) et (16), nous voyons que :


(24) = β (δ + 1) = γ + 2 β
1
a
et les exposants α , β et γ sont tels que :
(25) α + 2 β + γ = 2

Cette relation entre exposants critiques est bien vérifiée expérimentalement ainsi que par les divers
modèles.

L'hypothèse de l'invariance d'échelle est donc confirmée par l'expérience. Elle montre en particulier
qu'il n'existe que deux exposants critiques indépendants. Cette hypothèse, introduite de façon
heuristique, a été justifiée par L.P. Kadanoff (1966) et démontrée ensuite par les méthodes du
groupe de renormalisation de la théorie quantique des champs par K.G. Wilson (1972). Il a ainsi été
montré qu'il existe des classes de systèmes ayant les mêmes exposants critiques (classes
d'universalité) et caractérisés uniquement par les dimensionalités de l'espace (d) et du paramètre
d'ordre (D). Il est remarquable que les exposants ne dépendent ni des valeurs des intégrales
d'échange, ni de la grandeur des spins, ni du type de réseau,…
VI.3.6. Anisotropie et domaines ferromagnétiques

Anisotropie magnétocristalline
Dans un cristal ferromagnétique, les ions magnétiques se trouvent dans un champ cristallin. De ce
fait, l'aimantation spontanée prend une direction parallèle à des directions privilégiées dites
d'aimantation facile (figure ci-dessous).

Pour le nickel et le fer cubique ce sont respectivement les directions d'une diagonale [111] et d'une
arête [100] du cube.

On peut tenir compte de l'anisotropie dans le cadre de la théorie de Landau en considérant que le
potentiel F ∗ dépend de la direction du moment magnétique M de cosinus directeurs α 1 , α 2 , α 3 .
Pour des réseaux cubiques et en se limitant aux termes en M 4 dans le développement, il faut alors
ajouter à l'expression de F ∗ un terme d'anisotropie
b′ b′
2
( ) 4
( )
(1) Fa∗ = M 4 α 12α 22 + α 22α 32 + α 32α 12 = M 4 1 − α 14 − α 24 − α 34

seul terme jusqu'à l'ordre 4 en α i permis par la symétrie.


Pour une valeur de M fixée, le terme d'anisotropie du potentiel possède des extremums dans des
directions qui, par raison de symétrie, sont parallèles aux axes de symétrie du cube. Ils ont pour
valeurs respectives :
[000] α 1 = 1,α 2 = α 3 = 0 Fa∗ = 0
(2) [110] α 1 = α 2 =
1 K
, α 3 = 0 Fa∗ = 1
2 4
[111] α 1 = α 2 = α 3 = 1 K
Fa∗ = 1
3 3
avec K 1 = b ′M 4 / 2 .

Nous voyons que si K 1 est positif, l'aimantation à l'équilibre est parallèle à une arrête du cube et, si
K 1 est négatif, elle est parallèle à une diagonale : le signe de K 1 détermine donc les directions
d'aimantation facile. Pour le nickel on a K 1 ≅ −5 × 10 3 J m −3 et pour le fer K 1 ≅ 5 × 10 4 J m −3 , les
signes étant en accord avec les directions d'aimantation facile observées (figure ci-dessus). En
général, on tient compte aussi des termes en M 6 et l'énergie d'anisotropie, pour un cristal cubique,
est écrite sous la forme :
( )
(3) Fa∗ = K 1 α 12α 22 + α 22α 32 + α 32α 12 + K 2α 12α 22α 32
où K 1 et K 2 sont des constantes d'anisotropie dépendant de la température.

Les mesures de K 1 en fonction de la température montrent que l'anisotropie, phénomène très


important à basse température, devient faible au voisinage du point critique et disparaît à TC .

Domaines de Weiss
Un échantillon de substance ferromagnétique en champ nul, même monocristallin, présente en
général un moment magnétique plus faible que sa valeur spontanée. P. Weiss (1907) a interprété
cette observation en supposant que l'échantillon comporte des domaines (domaines de Weiss) à
l'intérieur desquels l'aimantation a sa valeur spontanée, mais dont la direction varie d'un domaine à
l'autre. Cette structure en domaine a été confirmée et visualisée par la méthode des poudres
magnétiques développée par F. Bitter.
L. Landau et E.M. Lifschitz (1935) ont montré que la structure en domaines est une conséquence
du fait qu'à l'équilibre, il faut considérer le potentiel de l'ensemble substance et champ. Considérons
par exemple un échantillon monocristallin de structure cubique taillé selon les faces du cube (figure
ci-dessous) et dont la direction d'aimantation facile est parallèle aux arêtes.

Il existe six directions équivalentes (deux sens sur chacune des trois directions d'arêtes) selon
lesquelles l'aimantation peut se trouver. On peut montrer, qu'à cause de l'énergie magnétostatique
du champ présent à l'extérieur de la substance, la configuration (a) de la figure ci-dessus a une
énergie plus grande que celle de la configuration (b). Les configurations telles que (c) et (d) sont les
plus favorables car elles possèdent des domaines de fermeture tels qu'aucune ligne de champ ne
s'échappe de la substance. En général, la structure en domaine est plus complexe et dépend de la
forme et de l'orientation du cristal, de la nature polycristalline, etc.

Les domaines sont séparés par des zones de transition, appelées parois de Bloch, où la direction des
spins tourne progressivement. L'épaisseur de ces parois résulte d'un compromis entre l'énergie
d'anisotropie (les spins ne sont plus orientés selon les directions d'aimantation facile), minimum
pour une paroi d'épaisseur nulle, et l'augmentation d'énergie d'échange qui est minimum pour une
épaisseur infinie. En effet, l'accroissement d'énergie d'échange entre deux spins faisant un angle φ
étant :
(4) ∆ε = 2 JS 2 (1 − cos φ ) ≅ JS 2φ 2
l'énergie d'échange d'une paroi contenant n plans réticulaires est proportionnelle à nφ 2 = φ 02 / n où
φ 0 = nφ est l'angle entre les spins des deux domaines. On trouve ainsi que l'épaisseur des parois est
de l'ordre de plusieurs centaines d'Angströms (n ~ 100), et que l'accroissement d'énergie dû à la
paroi est de l'ordre de 10 −3 J m −2 . Cette énergie empêche la division en domaines de plus en plus
petits. Ainsi, des particules de poudre de l'ordre de 0.1 µm ne sont formées que d'un seul domaine.
Notons que lorsqu'une paroi affleure à la surface d'un cristal, le gradient de l'aimantation entraîne
un gradient de champ magnétique visualisé, dans la méthode de Bitter, par la concentration des
grains de poudre magnétiques le long de la paroi.

Hystérésis
Considérons un échantillon ferromagnétique de moment magnétique total nul : il est composé de
domaines dont les moments magnétiques diversement orientés ont une résultante nulle (figure (a)
ci-dessous).

Etudions l'évolution de cet échantillon placé dans un champ magnétique H croissant à partir de zéro
(première aimantation). Pour de faibles champs, les domaines dont les moments magnétiques sont
orientés dans le sens du champ s'accroissent réversiblement au détriment des autres par
déplacement de leurs parois (figure (b) ci-dessus). Pour des valeurs supérieures du champ, il se
produit un retournement irréversible du moment magnétique de domaines entiers qui les oriente
dans le sens du champ (figure (c) ci-dessus). Ces retournements donnent lieu à des phénomènes
sonores (effet Barkhausen). Enfin, pour des champs intenses, l'orientation des moments, jusque là
dirigée selon les axes d'aimantation facile du cristal, est modifiée réversiblement à l'intérieur de
chaque domaine (figure (d) ci-dessus). La courbe de première aimantation est représentée sur le
plan H, M dans la figure ci-dessous. Faisons maintenant décroître le champ jusqu'à l'annuler : a
substance revient dans l'état (c) de la figure ci-dessus. La substance présente alors une aimantation
rémanente M R et est dans un état différent de son état initial (phénomène d'hystérésis).
Pour annuler l'aimantation, il est nécessaire d'appliquer un champ − H C , H C étant appelé champ
coercitif. En continuant à faire décroître le champ H, on parcourt la courbe CS' de la figure ci-
dessus. En augmentant de nouveau le champ magnétique, on obtient la courbe S'R'C'S symétrique
de la courbe SRCS' par rapport à l'origine. Le cycle ainsi décrit est appelé cycle d'hystérésis. Pour
retrouver une aimantation nulle en champ nul, on doit effectuer un grand nombre de cycles
d'amplitude progressivement décroissante.

La forme du cycle d'hystérésis dépend de la grandeur d'énergie d'anisotropie. Pour une anisotropie
faible, le retournement des domaines est plus aisé et l'hystérésis et faible : le cycle d'hystérésis est
étroit. Lorsque l'anisotropie est grande, le retournement des domaines se produit à champ plus fort
et le cycle d'hystérésis est large. Ces phénomènes conditionnent les méthodes de mesure de
l'aimantation spontanée des substances. Près du point critique, où l'anisotropie est faible, on
extrapole les mesures de M (B ) , vers B = 0. Aux basses températures où l'anisotropie est forte, on
extrapole les mesures M (B ) vers B → ∞ .
VI.3.7. Antiferromagnétisme

Mise en évidence
A partir de 1932, L. Néel a montré qu'une substance possédant un seul type d'ions magnétiques
dont l'intégrale d'échange est négative, présente, en dessous d'une certaine température TN appelée
par la suite température de Néel, une phase ordonnée antiferromagnétique. Dans cette phase, au
zéro absolu, on peut distinguer deux ou plusieurs sous-réseaux sur chacun desquels les ions ont des
moments magnétiques parallèles, le moment total étant nul. Dans les cas les plus simples, par
exemple réseau cubique simple, il n'existe que deux sous-réseaux sur lesquels les ions ont des
moments opposés selon une direction privilégiée du cristal (figure ci-dessous).

Au-dessus de la température de Néel, la substance est paramagnétique. Dans les deux phases,
l'aimantation en présence de champ magnétique est faible, et, de ce fait, une étude systématique des
propriétés de ces substances a été suscitée par la théorie.

La mise en évidence la plus claire du phénomène se fait par diffraction de neutrons monocinétiques
( λ ~ 1Å ). En effet, outre leur interaction nucléaire avec les noyaux, les neutrons interagissent avec
les spins électroniques par l'intermédiaire de leur moment magnétique, l'amplitude de diffusion
dépendant de l'orientation relative des spins. Dans la phase paramagnétique, les moments des ions
ont une direction désordonnée et la diffusion, incohérente, n'apparaît pas : les pics de diffraction de
Bragg correspondent à la maille élémentaire du réseau. Dans la phase antiferromagnétique, la
diffusion est cohérente et il apparaît de nouveaux pics de diffraction, l'ensemble correspondant à la
maille double. L'intensité de ces pics supplémentaires étant proportionnelle au carré des moments
magnétiques des sous-réseaux, cette méthode donne une mesure indirecte de ces moments qui
n'apparaissent pas macroscopiquement.

Théorie de l'antiferromagnétisme

Modèle du champ moléculaire


L'hamiltonien d'Heisenberg permet d'interpréter les propriétés des substances antiferromagnétiques.
Nous nous limiterons ici à la discussion dans le cadre de l'approximation du champ moléculaire qui,
nous l'avons vu, rend compte des propriétés générales des substances ferromagnétiques.

Nous supposons que les N ions magnétiques sont situés sur deux sous-réseaux identiques A et B, de
moments respectifs M A et M B et de moments réduits R A = 2 M A / M S et RB = 2 M B / M S ,
M S = NSgµ B étant le moment de saturation total du cristal. Chaque ion magnétique du réseau A
est soumis à un champ magnétique effectif d'induction
(1) B A = B − q1 RB − q 2 R A
égal à la somme du champ extérieur B, du champ moléculaire − q1 RB provenant des ions du réseau
B et du champ moléculaire − q 2 R A provenant des autres ions du réseau A. Symétriquement, les
ions du sous-réseau B subissent un champ effectif :
(2) BB = B − q1 R A − q 2 RB

Les constantes q1 et q 2 peuvent être reliées aux intégrales d'échange J 1 (plus proches voisins) et
J 2 (seconds voisins) par
J
(3) qi = −4 z i i
gµ B
z1 étant le nombre de plus proches voisins et z 2 le nombre de seconds voisins. La constante q1
doit être positive pour rendre compte de l'antiferromagnétisme. La constante q 2 est en général plus
faible, en valeur absolue, que q1 .

Propriétés magnétiques
L'aimantation réduite de chaque réseau est alors donnée comme dans le ferromagnétisme à partir de
la fonction de Brillouin BS par :
 Sgµ B
R A = BS  (B − q1 RB − q 2 R A )
 kT 
(4)
 Sgµ B
RB = BS  (B − q1 R A − q 2 RB )
 kT 

Ces deux équations couplées permettent en principe de déterminer les moments M A = M S R A / 2 et


M B = M S RB / 2 des deux sous-réseaux en fonction de B et de T, et, par suite le moment total
M = MA + MB .

En champ extérieur nul (B = 0), les équations (4) entraînent RB = − R A = − R 0 , avec


 Sgµ B
(5) R 0 = BS  (q1 − q 2 )R 0 
 kT 

La résolution de cette équation se fait comme pour le ferromagnétisme. Pour une température T
supérieure à la température de Néel
(S + 1)gµ B
(6) TN = (q1 − q 2 )
3k
on a R 0 = 0 et les deux sous-réseaux ne présentent pas d'aimantation spontanée. Pour une
température T < TN , les deux sous-réseaux ont une aimantation réduite égale et opposée et
l'aimantation totale est encore nulle.
En champ faible, dans la phase paramagnétique, nous pouvons remplacer la fonction de Brillouin
BS par son expression approchée. Les équations (4) s'écrivent alors :
(S + 1)gµ B (
RA = B − q1 RB − q 2 R A )
3kT
(7)
(S + 1)gµ B (
RB = B − q1 R A − q 2 RB )
3kT
et ont pour solution :
(S + 1)gµ B B (S + 1)gµ B
(8) R A = RB = avec θ = − (q1 + q 2 )
k (T − θ ) 3k

Le moment magnétique total a alors pour expression :


M NS (S + 1)g 2 µ B2 B
(9) M = S (R A + RB ) =
2 3k T −θ

Ceci représente une loi de Curie-Weiss, semblable aux lois du paramagnétisme et du


ferromagnétisme, mais avec une température de Weiss θ négative.

Dans la phase antiferromagnétique en champ faible, on est amené à considérer deux cas selon que
le champ magnétique est appliqué parallèlement ou perpendiculairement à la direction privilégiée
de l'aimantation spontanée des sous-réseaux. Lorsque le champ est appliqué parallèlement,
l'aimantation réduite de chaque sous-réseau augmente de la même quantité, soit :
(10) R A = R 0 + δR et RB = − R 0 + δR
la substance ayant pour moment total M || = M S δR . En remplaçant R A et R B par ces expressions
dans les équations (4) et en développant ces dernières au voisinage de B = 0, on trouve que le
moment magnétique est proportionnel au champ B selon l'expression :
S (S + 1)g 2 µ B2 B
(11) M || = M S δR = N
3k (S + 1) / (3S ) × T / BS′ (x0 ) − θ
où BS′ est la dérivée de la fonction de Brillouin BS et
Sgµ B
(12) x0 = (q1 − q 2 )R 0
kT

La susceptibilité correspondante χ || , représentée dans la figure ci-dessous, est nulle au zéro absolu,
croît avec la température et est continue à la température de Néel TN .

En effet, comme on a BS′ (0 ) = (S + 1) / 3S , les deux expressions (9) et (11) prennent la même valeur
pour T = TN
(13) M (TN , B ) = M S
B
2q1

Lorsque le champ magnétique est appliqué perpendiculairement à la direction d'aimantation


spontanée des sous-réseaux, il se produit une rotation des moments M A et M B , leur module
restant égal à M 0 = M S R 0 / 2 (figure ci-dessous).

La contribution de l'énergie magnétique à l'énergie libre est alors :


E (m ) = − M A ⋅ B A − M B ⋅ B B
(14) 1 M ⋅ MB M 2 + M B2 
= −( M A + M B ) ⋅ B +  4q1 A + 2q 2 A 
2 MS MS 
où B A et B B sont les champs effectifs (1) et (2) et où le facteur 1/2 a été introduit pour éviter le
double comptage des énergies d'interaction. Lorsque les moments tournent d'un angle α petit,
l'énergie magnétique varie de :
(m ) M 02
∆E = −2 M B sin α − 2q1
0
cos 2α
MS
(15)
1
= − M S BR 0 sin α − M S q1 R 02 cos 2α
2

Pour une induction donnée B, l'angle d'équilibre α , minimisant ∆E (m ) , est :


B
(16) sin α =
2q1 R 0
et le moment résultant est :
B
(17) M ⊥ = 2 M 0 sin α = M S
2q1

On trouve ainsi que la susceptibilité χ ⊥ de la substance est indépendante de T et continue à la


température de Néel. Lorsque l'on tient compte explicitement de l'énergie d'anisotropie, il
s'introduit dans ∆E (m ) un terme de la forme Kα 2 . Ce terme étant en général faible devant celui
relatif à l'énergie d'échange et s'annulant à la température de Néel, il a peu d'effet sur la valeur de la
susceptibilité. Signalons que lorsque la substance est sous forme de poudre, la susceptibilité
mesurée est :
χ || + 2 χ ⊥
(18) χ P =
3

En particulier, au zéro absolu, χ P (0 ) = 2 χ P (TN ) / 3 .

Substance Structure TN (K ) θ (K ) χ P (0) / χ P (TN )


MnO c.f.c. (NaCl) 122 -610 0.69
MnF2 Quadratique (rutile) 74 -113 0.75
RbMnF3 c.s. (pérovskite) 83 -119 ~0.7
FeO c.f.c. (NaCl) 185 -570 0.77
α Fe2O3 Rhomboédrique (Al2O3) 950 -2000
CoCl2 Hexagonal (couches) 25 38 ~0.6
GdAlO3 Orthorhombique (~pérovskite) 3.89 -4.6 0.63

Capacité calorifique magnétique


En champ nul, l'énergie magnétique de la substance est, d'après (14) :
M 02
(19) E (m ) = −2(q1 − q 2 ) = − (q1 − q 2 )M S R 02
1
MS 2
car M A = − M B = M 0 = M S R 0 / 2 . La capacité calorifique magnétique en champ nul est alors

(20) CV(m ) = − (q1 − q 2 )M S


1
2
d
dT
( )
R 02

Dans la phase paramagnétique, les sous-réseaux ne présentent pas d'aimantation spontanée


( R 0 = 0 ) et la capacité calorifique est nulle. Dans la phase antiferromagnétique, R 0 est non nul et il
en est de même de la capacité calorifique. On montre, comme pour le ferromagnétisme, que la
théorie du champ moléculaire prévoit une discontinuité à la température de Néel. L'énergie E (m )
restant continue à cette température, la théorie du champ moléculaire prévoit donc un changement
de phase du deuxième ordre.

Etude expérimentale
La grande majorité des substances comportant un seul type d'ions magnétiques, présentent, à basse
température, une phase ordonnée antiferromagnétique. Ce sont en général des cristaux ioniques
(oxydes, chlorures, fluorures, etc.) dans lesquels les ions magnétiques sont entourés d'anions et
interagissent par un mécanisme de superéchange. Nous choisissons pour la discussion la substance
typique GdAlO3.

L'ortho-aluminate de gadolinium a une structure orthorhombique presque cubique, dans laquelle les
ions magnétiques Gd 3+ forment approximativement un réseau cubique simple d'arête a = 3.73Å .
Dans la phase antiferromagnétique, les ions se trouvent sur deux sous-réseaux cubiques à faces
centrées d'arête 2a chaque ion étant entouré de z1 = 6 plus proches voisins appartenant à l'autre
sous-réseau et formant un octaèdre régulier et de z 2 = 12 voisins suivants du même sous-réseau.
L'aimantation de ces deux sous-réseaux est égale et opposée et dirigée selon la diagonale d'une face
du cube d'ions Gd 3+ coïncidant avec l'axe b du cristal orthorombique. Cette configuration est
analogue à celle de la substance bidimensionnelle présentée au début. Rappelons que l'ion Gd 3+ a
un moment orbital nul et un spin S = 7/2, donc un facteur de Landé isotrope g = 2.

Les mesures de la susceptibilité de cette substance sont représentées dans la figure ci-dessous.
Lorsque le champ magnétique est appliqué le long de l'axe b (direction de l'aimantation spontanée
des sous-réseaux), on retrouve le comportement de la susceptibilité χ || du modèle. Lorsqu'il est
appliqué perpendiculairement à b, selon a ou c, la susceptibilité est constante comme la
susceptibilité χ ⊥ du modèle. Dans la phase paramagnétique, pour une température suffisamment
au-dessus de la température de Néel TN = 3.89 K , la substance suit une loi de Curie-Weiss avec
θ = −4.6 K et C M = 1.00 × 10 −4 m 3 K mole −1 . Cette valeur de C M est en bon accord avec la valeur
théorique C M = 0.99 × 10 −4 m 3 K mole −1 . Les valeurs expérimentales de TN et θ permettent à l'aide
des relations (6) et (8) de la théorie du champ moléculaire, d'évaluer q1 et q 2 et d'en déduire, à
l'aide de (3) les valeurs de J 1 / k = −0.068 K et J 2 / k = −0.003 K . Nous voyons que la valeur de J 1
est prépondérante.

La capacité calorifique de l'aluminate de gadolinium GdAlO3 est représentée dans la figure ci-
dessous.

Elle présente une montée suivie d'une brusque décroissance à la température de Néel.

Comme dans le cas du ferromagnétisme, la théorie du champ moléculaire permet une description
satisfaisante des données expérimentales. Toutefois, elle prédit des valeurs incorrectes ( α = 0 ,
β = 1 / 2 , γ = 1 ) pour les exposants critiques. On mesure en effet pour les exposants critiques des
valeurs voisines de celles des substances ferromagnétiques. Par exemple pour le fluorure de
rubidium et de manganèse RbMnF3, α = −0.14 ± 0.01 , β = 0.32 ± 0.01 et γ = 1.40 ± 0.04 . Le
coefficient β correspond, dans le cas des substances antiferromagnétiques, au comportement
critique de l'aimantation réduite de chaque sous-réseau ( R 0 ), mesurée à partir de l'intensité des pics
de diffraction de neutrons.

De même, à basse température, la variation expérimentale en T 2 de la susceptibilité magnétique


χ || et celle en T 3 de la capacité calorifique sont en désaccord avec la théorie du champ
moléculaire. L'introduction de magnons antiferromagnétiques rétablit l'accord. La relation de
dispersion de ces magnons ε k ∝ k diffère de celle ε k ∝ k 2 des magnons ferromagnétiques. En
effet, l'état fondamental d'une substance antiferromagnétique n'est pas un état propre de
l'hamiltonien d'Heisenberg et la démonstration de la loi ε k ∝ k est beaucoup plus complexe. La loi
en T 3 découle directement de la relation de dispersion linéaire par une démonstration semblable à
celle effectuée pour les phonons. Signalons enfin que les substances antiferromagnétiques peuvent
aussi présenter des domaines.

Comportement en champ fort

Champ perpendiculaire
L'existence d'une énergie d'anisotropie confère aux substances antiferromagnétiques un
comportement particulier avec changement de phase prédit par Néel (1936). Considérons le cas
d'une substance uniaxe dans laquelle l'énergie d'anisotropie, représentée par le terme :
(21) E A = K sin 2 α
possède un minimum pour un angle de l'aimantation des sous-réseaux avec la direction privilégiée
( α = 0 ) et un maximum pour une direction perpendiculaire ( α = π / 2 ). Lorsqu'on applique un
champ magnétique perpendiculaire à la direction privilégiée, il apparaît un moment magnétique
M ⊥ que l'on obtient comme en (17) après avoir ajouté l'énergie d'anisotropie à l'expression de
l'énergie (15). Il a pour expression :
B B
(22) M ⊥ = M S = 2M 0
2q1 + 2 K / M S R 02
2 BW + Ban
où BW = q1 R 0 est le champ moléculaire dû aux plus proches voisins et Ban = K / M 0 est appelé
champ d'anisotropie. L'aimantation croit donc linéairement en fonction du champ (figure ci-
dessous) jusqu'au champ critique :
(23) BC⊥ = 2 BW + Ban

A cette valeur critique les moments magnétiques des deux sous-réseaux sont parallèles (figure (d)
ci-dessous).
Champ parallèle
Lorsque le champ magnétique est appliqué parallèlement à la direction privilégiée, il se produit un
phénomène particulier. Pour des champs faibles, le moment magnétique de la substance croît
linéairement selon la loi (11) et son énergie magnétique est
M 02
(24) E (m ) ≅ −2q1 − M 0 BW
MS
expression déduite de (14) dans laquelle on a négligé le terme en B et omis le terme constant en q 2 .
Pour un champ égal à une certaine valeur de BSF , les aimantations des deux sous-réseaux tournent
brutalement d'un angle voisin de 90° (figure (b) ci-dessus). L'angle α des moments des sous-
réseaux avec la direction privilégiée qui minimise alors l'énergie magnétique d'expression :
M 02
E (m ) = −2 M 0 B cos α + 2q1 cos 2α + K sin 2 α
(25) MS
= −2 M 0 B cos α + M 0 BW cos 2α + M 0 Ban sin 2 α
est donné par cos α = B / (2 BW − Ban ) . L'énergie a alors pour valeur :
B2
(26) E (m ) = M 0 (Ban − BW ) − M 0
2 BW − Ban

Le changement d'orientation des moments ("spin flop") se produit lorsque l'énergie (26) devient
inférieure à l'énergie (24), c'est-à-dire pour un champ
(27) BSF = [Ban (2 BW − Ban )]
1/ 2

Ce changement s'accompagne d'un saut dans la valeur de l'aimantation de la substance.


L'augmentation du champ à partir de cette valeur provoque l'alignement progressif des moments
des sous-réseaux, le moment magnétique de la substance étant donné par
B
(28) M = 2 M 0 cos α = 2 M 0
2 BW − Ban

Enfin, lorsque le champ atteint la valeur critique


(29) BC|| = 2 BW − Ban
les moments des deux sous-réseaux deviennent parallèles. Cette interprétation est en bon accord
avec les résultats expérimentaux. Ainsi, les mesures effectuées sur l'aluminate de gadolinium
GdAlO3 à T = 0.5 K sont compatibles avec les valeurs BW = 2.1 T et Ban = 0.3 T . Notons que le
saut du moment entre la valeur (22) et la valeur (28) est donné par
3/ 2
4 M 0 Ban BSF  B 
(30) ∆M = ≅ 4 M 0  an 
4 BW − Ban
2 2
 2 BW 
Lorsqu'une substance a une anisotropie très faible, comme par exemple le fluorure double de
rubidium et de manganèse RbMnF3, le spin flop, qui se produit à champ très faible et n'entraîne
qu'un faible variation du moment, ne peut être détecté. On ne peut pas non plus mesurer χ || .

Diagrammes des phases


Les phénomènes précédents mettent en évidence l'existence de phases distinctes et de changements
de phase. Ainsi, lorsque le champ appliqué perpendiculairement à l'axe privilégié et que la
température est inférieure à la température de Néel TN , le moment de chaque sous-réseau possède
une composante perpendiculaire au champ, utilisée comme paramètre d'ordre et donc la valeur est
non nulle lorsque B ⊥ < BC⊥ (T ) et nulle lorsque B ⊥ ≥ BC⊥ (T ) . La courbe BC⊥ (T ) partage le plan
(T , B ) en deux domaines correspondant à deux phases appelées respectivement

antiferromagnétique (AF) et paramagnétique (P) (figure (a) ci-dessous).


Le paramètre d'ordre s'annule en restant continu pour B ⊥ = BC⊥ (T ) : le changement de phase est
donc une transition critique et la courbe B ⊥ = BC⊥ (T ) est une ligne critique. Sur cette courbe,
l'aimantation totale reste continue mais sa dérivée ∂M / ∂B ⊥ est discontinue. Cette propriété
permet la détermination expérimentale de la ligne critique. Notons que, dans la phase
paramagnétique, les deux sous-réseaux ont des moments identiques et la notion de sous-réseaux
disparaît.

Lorsque le champ est appliqué parallèlement à l'axe privilégié, la composante de chaque sous-
réseau perpendiculaire au champ, utilisée comme paramètre d'ordre, a une valeur nulle pour
B || < BSF (T ) (figure (b) ci-dessus). Lorsque le champ dépasse cette valeur, ce paramètre d'ordre,
ainsi que l'aimantation totale, deviennent non nuls, ce qui correspond à un changement de phase du
premier ordre entre la phase antiferromagnétique (AF) et la phase (SF) produite lors du spin-flop.
Lorsque le champ atteint la valeur BC|| (T ) , ce paramètre d'ordre s'annule en restant continu : il se
produit une transition critique vers la phase paramagnétique (P). Notons que lors de la transition du
premier ordre AF - SF, il peut y avoir coexistence des deux phases ainsi que des phénomènes de
retard au changement de phase. Lorsque la température, inférieur à TN , est supérieure à une
température TM pour laquelle les champs BC|| (T ) et BSF (T ) sont égaux, on passe directement par
une transition critique de la phase AF à la phase P.

Lorsque le champ est appliqué dans une direction quelconque, on doit considérer le diagramme des
phases dans l'espace à trois dimensions T, B || , B ⊥ (figure ci-dessous).
Les lignes critiques BC|| (T ) et BC⊥ (T ) sont les intersections d'une surface critique NMUWV avec les
plans T, B || et T, B ⊥ . A l'extérieur de cette surface se trouve la phase paramagnétique dans
laquelle les deux sous-réseaux ne peuvent être distingués. A l'intérieur de cette surface se trouve
une nappe MXY coupant le plan T, B || suivant la ligne XM de coexistence entre les phases AF et
SF. Cette nappe séparant la phase AF de la phase SF est limitée par la ligne critique MY. En
contournant cette surface, on peut passer de façon continue de la phase AF à la phase SF. Ceci est
l'analogue du passage continu de la phase liquide à la phase vapeur par contournement du point
critique dans un fluide. La surface critique externe est en fait constituée de deux nappes critiques
NMWV et MUW se coupant selon une ligne bicritique MW et se raccordant parfaitement au point
W. Le point M est un ombilic se trouvant à l'intersection de plusieurs lignes critiques : il est dit
multicritique. Dans le plan T, B || , ce point se trouve à l'intersection des deux lignes critiques NM et
MU : il est alors dit bicritique. Dans le plan tangent en M à la nappe MXY (figure ci-dessous), il est
à l'intersection de quatre lignes critiques : il est alors dit tétracritique.

Les propriétés de la substance au voisinage du point multicritique M sont caractérisées par des
exposants critiques.

Hélimagnétisme
Dans les phases ordonnées que nous avons considérées jusqu'alors, tous les spins des ions
magnétiques étaient colinéaires. Il existe d'autres dispositions, très variées, l'une des plus
importantes étant l'hélimagnétisme. La première substance dans laquelle l'hélimagnétisme a été
découvert est le composé métallique MnAu2. La diffraction des neutrons a montré que, dans ce
composé quadratique, les ions manganèse situés dans un plan perpendiculaire à l'axe principal ont
des spins parallèles contenus dans le plan. La direction des spins de deux plans consécutifs se
déduit par une rotation de 51°. Cette substance ne présente donc pas d'aimantation spontanée.
Certains métaux de terre rare (Tb, Dy, Ho) présentent entre autres une phase hélimagnétique. Par
exemple, le dysprosium est hélimagnétique de 85 à 179 K, ferromagnétique au-dessous de 85 K et
paramagnétique au-dessus de 179 K.

Dans les métaux des terres rares, l'interaction d'échange n'est pas directe mais a lieu par
l'intermédiaire des électrons de conduction. Il en résulte que la constante d'échange J (r ) est à
longue portée et présente un caractère oscillatoire (théorie RKKY). Montrons comment le
comportement de J peut faire apparaître l'hélimagnétisme dans le cas du modèle simple d'une file
d'ions dans lequel l'interaction est ferromagnétique (J > 0) entre premiers voisins et a la valeur λJ
entre seconds voisins. L'hamiltonien d'interaction est alors :
(31) Hˆ = −2 J ∑ Sˆ i ⋅ Sˆ i +1 − 2λJ ∑ Sˆ i ⋅ Sˆ i + 2
i i

Désignant par θ l'angle entre deux spins voisins, l'énergie d'interaction a alors la forme
(32) E = −2 JNS 2 (cosθ + λ cos 2θ )

Pour λ > −1 / 4 , l'énergie E est minimum pour θ = 0 (ferromagnétisme). Pour λ < −1 / 4 , le


minimum se produit pour cosθ = −1 / 4λ , c'est-à-dire que l'ordre est hélicoïdal avec un angle
θ < π / 2 . On voit qu'une interaction antiferromagnétique suffisamment intense entre seconds
voisins conduit à un ordre hélimagnétique.

L'interaction RKKY permet l'interprétation d'une grande variété de phases ordonnées : phase
conique où les moments tournent sur un cône, phases où l'orientation du spin est modulée
périodiquement. Signalons enfin qu'un couplage anisotrope de la forme D ⋅ (S i × S j ) rend compte
de l'existence d'une phase ferromagnétique faible ( αFe2 O3 ⋅ NiF2 ) dans laquelle les spins ont, en
champ nul, un arrangement presque antiferromagnétique avec une légère inclinaison des spins.
VI.3.8. Ferrimagnétisme

Introduction
Les substances ferrimagnétiques présentent des propriétés semblables à celle des ferromagnétiques.
En 1948, L. Néel a proposé pour ces substances un modèle dans lequel des ions magnétiques de
deux types différents sont répartis antiparallèlement sur deux sous réseaux (figure (a) ci-dessous).

Il existe de nombreux autres types d'arrangements dont les plus importants sont les ferrites et les
grenats.

Ferrites
Les ferrites (figure (b) ci-dessus) sont des oxydes de formule MO ⋅ Fe2 O3 (M 2+ Fe23+ O42− ) où M est
un métal divalent (M = Fe, Co, Ni, Cu, Mg, Zn, Cd). La magnétite ou pierre d'aimant, de formule
Fe3O4 , est la ferrite la plus connue (M = Fe). Leur structure cristalline, de symétrie cubique est
celle de la spinelle MgO ⋅ Al 2 O3 . Dans cette structure, les ions oxygène (r = 1.32 Å) forment à peu
près un empilement compact cubique à faces centrées, les ions métalliques, de plus faible rayon (r =
0.6 - 0.8 Å) se logeant dans les interstices tétraédriques (sites A) et octaédriques (sites B). La maille
cubique (multiple) contient 8 fois la formule chimique, c'est-à-dire 32 ions O 2− , 8 ions M 2+ et 16
ions Fe 3+ . La répartition de ces cations entre les sites A et B varie, les deux cas limites étant :
Structure normale 8 M 2+ en A 16 Fe 3+ en B
Structure inverse 8 Fe 3+ en A 8 Fe 3+ , 8 M 2+ en B

L'interaction d'échange la plus importante qui a lieu entre les ions de sites différents
( J AB >> J AA , J BB ) est antiferromagnétique ( J AB < 0 ). Le moment magnétique de saturation M S
relatif à une formule chimique est :

Structure normale m S = − mM + 2m Fe
Structure inverse m S = − m Fe + (m Fe + m M ) = mM

Où m M = Sgµ B est la projection maximum du moment magnétique de l'ion M 2+ . Les mesures


expérimentales sont en accord avec une structure inverse pour les substances considérées et avec
g ≅ 2.

Ion M 2+ Spin S mS / µ B TN (K )
Mn 2+ 5/2 ~5 573
Fe 2+ 2 4.1 858
Co 2+ 3/2 3.7 793
Ni 2+ 1 2.3 858
Cu 2+ 1/2 1.3 728

Notons que la ferrite de zinc a une structure normale, les ions non magnétiques Zn 2+ étant dans les
sites A, les ions Fe 3+ , placés en sites B, ayant un arrangement antiferromagnétique ( J BB < 0 ). Les
propriétés magnétiques des ferrites peuvent varier de façon continue en considérant des composés
non stœchiométriques où M 2+ est un mélange du type X 12−+x Yx2+ .
Les grenats ferrimagnétiques
Les substances ferrimagnétiques de formule M 3 Fe5 O12 (ou 3M 2 O3 ⋅ 5 Fe2 O3 ), M étant l'yttrium ou
certaines terres rares, ont leurs ions métalliques M et Fe trivalents. Leur structure est celle du grenat
naturel, la maille cubique contenant 96 ions oxygène, les cations occupant les sites interstitiels. Il
existe trois sortes de sites : octaédriques [a], tétraédriques (d) et dodécaédriques {c}. Les ions M 3+
( r ≅ 1 Å ) occupent les sites c et les ions Fe 3+ , de rayon plus faible, les sites a et d, d'où la notation
{M 3 }[Fe2 ](Fe3 )O12 .

Le plus étudié de ces grenats est le grenat de fer et d'yttrium Y3 Fe5 O12 (appelé YIG, yttrium iron
garnet) où les seuls ions magnétiques Fe 3+ appartiennent à deux sous-réseaux A = [a] et B = (d).
L'intégrale d'échange la plus importante est J AB . Etant négative, elle favorise un arrangement
[ ]
antiparallèle des ions Fe23+ et (Fe33+ ) selon le schéma de la figure (c) ci-dessus. Le moment
magnétique de saturation m S relatif à une formule chimique est alors
(1) m S = −2m Fe + 3m Fe = m Fe = 5µ B
en bon accord avec la valeur expérimentale 4.96µ B .

Modèle de Néel
Nous considérons un modèle de Néel comportant deux sortes d'ions formant deux sous-réseaux A
et B. A l'approximation du champ moléculaire et en ne tenant compte, pour simplifier, que des
interactions AB, les aimantations réduites R A = M A / N A S A g A µ B et RB = M B / N B S B g B µ B sont
liées par les deux relations du type :
S g µ  S g µ 
(2) R A = BS A  A A B (B − q A R B ) et RB = BS B  B B B (B − q B R A )
 kT   kT 
où q A et q B sont reliés par q A N A S A g A = q B N B S B g B pour assurer que l'énergie d'interaction AB
est égale à l'énergie d'interaction BA.

Dans le domaine paramagnétique, on linéarise ces relations à l'aide du développement de BS et on


obtient
B TNA (T − TNB )
(3) R A =
q B T 2 − TNATNB
et une formule symétrique pour R B . Dans cette formule, TNA et TNB sont des températures
analogues à celle du modèle antiferromagnétique :
(S + 1)gµ B
(4) TN = (q1 − q 2 )
3k
avec q 2 = 0 et q1 = q A ou q B respectivement. Le moment magnétique total M = M A + M B est
donc proportionnel à B, la susceptibilité relative à une mole χ M étant donnée par :
1 T −θ C′
(5) = −
χM CM T −θ ′
avec
T T
θ = −2 NA NB θ ′ = −θ
TNA + TNB
(6) 2
N A C MA + N B C MB TNATNB  TNA − TNB 
CM = C′ =  
NA + NB C M  TNA + TNB 
où C MA et C MB sont les constantes de Curie.

Dans le cas où l'on tient compte des interactions AA et BB, la susceptibilité est toujours donnée par
(5), avec θ < 0 , mais où θ , θ ′ ≠ −θ et C ′ ont des expressions différentes. La figure ci-dessous
montre que le modèle de Néel donne un accord satisfaisant avec l'expérience.
La susceptibilité (5) devient infinie pour une température de Néel TN en dessous de laquelle les
sous-réseaux présentent une aimantation spontanée (phase ferrimagnétique). L'aimantation
spontanée totale du grenat YIG, représentée dans la figure ci-dessous, est une fonction décroissante
de T.
Dans les cas plus complexes, l'aimantation totale peut varier de diverses façons, en particulier
s'annuler pour certaines températures appelées points de compensation : le cas du grenat de fer et de
gadolinium (GdIG) est représenté dans la figure ci-dessus.

Le modèle de Néel est confirmé expérimentalement de manière remarquable. A basse température,


il conduit à des magnons ferrimagnétiques semblables aux magnons ferromagnétiques. Ces
magnons permettent d'interpréter le comportement de la capacité calorifique et de l'aimantation
(lois en T 3 / 2 ) au voisinage du zéro absolu. Notons enfin l'existence de domaines liés à l'anisotropie.
Applications des substances ferrimagnétiques
Les applications technologiques des matériaux ferrimagnétiques sont dues au fait qu'elles peuvent
présenter des aimantations spontanées importantes tout en étant isolantes. Pour faire des noyaux de
transformateurs; on utilise les ferrites douces (champ coercitif et hystérésis peu important). Pour
obtenir des aimants permanents, on choisit au contraire des ferrites "dures" présentant un champ
coercitif important et une grande anisotropie. Citons la ferrite hexagonale BaFe12 O19
( BaO ⋅ 6 Fe2 O3 ) très anisotrope et présentant un moment de saturation par formule m S = 20 µ B .
VI.3.9. Verres de spin
On désigne par verre de spin la phase magnétique à basse température d'alliages de métaux nobles
et de métaux magnétiques (Fe, Mn). Dans ces alliages, les ions magnétiques, répartis au hasard sur
le réseau cristallin, interagissent par un mécanisme (RKKY). Les distances entre ions étant
aléatoires, l'interaction d'un ion donné avec une partie des autres favorise une orientation alors que
l'interaction avec l'autre partie favorise l'orientation opposée. Un ordre à longue distance de type
ferro ou antiferromagnétique ne peut donc exister. Cependant, au-dessous d'une température de
transition T f , il s'établit dans la substance un nouveau type d'ordre dans lequel les spins sont gelés
dans des directions variées.

Le problème de l'ordre dans les verres de spin relève de la physique des structures désordonnées et
soulève des questions fondamentales : définition d'un paramètre d'ordre, méthodes statistiques
lorsque les variables sont bloquées ou lorsque le système, hors équilibre, évolue très lentement.
VI.3.10. Ordre magnétique nucléaire

Interactions
Les forts couplages d'échange d'origine électrostatique qui produisent les phénomènes d'ordre
magnétique électronique n'existent pas en magnétisme nucléaire. Les forces d'interaction sont :
 Les forces magnétostatiques d'interaction dipôle - dipôle.
 Les interactions de Ruderman-Kittel (RKKY) par l'intermédiaire des électrons.

Dans le cas de He 3 , interviennent en plus des interactions d'échange à 3 ou 4 noyaux. Pour les
isolants de faible numéro atomique (LiF, CaF2 ), seules interviennent les forces magnétiques bien
connues permettant d'effectuer des prédictions sans paramètre ajustable.

Les moments magnétiques nucléaires étant 2000 fois plus faibles que les moments électroniques, la
transition vers un état ordonné se produira à des températures 10 6 à 10 7 fois plus faibles que pour
les transitions étudiées précédemment c'est-à-dire dans le domaine inférieur au microkelvin. Ce
domaine est atteint par désaimantation adiabatique nucléaire mais seulement par le système de
spins nucléaires, le réseau restant à une température de l'ordre de 10 mK. Selon le couplage spin -
réseau, la durée de vie de l'état obtenu varie de quelques minutes (métaux) à plusieurs heures
(isolants), ce qui permet l'observation.

L'étude des structures est faite par diffraction de Bragg de neutrons monocinétiques, car
l'interaction nucléaire neutron - noyau dépend des orientations relatives des spins. Elle peut
également être faite par résonance magnétique nucléaire.

Résultats expérimentaux
Pour un même cristal, les structures magnétiques ordonnées sont ferromagnétiques ou
antiferromagnétiques selon la direction d'application du champ et selon le signe de la température
de Weiss, l'ordre antiferromagnétique étant le plus fréquent.
Dans le cas de la fluorine CaF2 , les noyaux de calcium ont un spin nul et les noyaux de fluor,
formant un réseau cubique simple correspondant à l'isotope F 19 de spin 1/2. Le calcul montre que
lorsque le champ magnétique appliqué avant la désaimantation adiabatique est dirigé selon une
arête du cube [100] ou selon la diagonale d'une face [110], on obtient des phases
antiferromagnétiques différentes. Lorsqu'il est dirigé suivant une diagonale du cube [111], la phase
est ferromagnétique. Les mesures expérimentales de susceptibilité magnétique sont en bon accord
avec ces prédictions.
Exercices de compréhension
1. La valeur limite de l'aimantation spontanée au zéro absolu (aimantation de saturation) du nickel
est M S = 5.10 × 10 5 A m −1 . Calculez le nombre effectif ferromagnétique de magnétons de Bohr
neff . La masse volumique et la masse molaire du nickel sont respectivement : 8.90 g cm −3 et
58.71 g mole −1 .

Réponse : neff = 0.603 .


2. La constante de Curie relative à la masse du nickel dans sa phase paramagnétique a pour valeur
C m = 6.8 × 10 −5 m 3 K kg −1 . Calculez le nombre effectif paramagnétique de magnétons de Bohr
p eff . La masse molaire du nickel est 58.71 g mole −1 .

Réponse : p eff : 1.59 .


3. Reprendre les deux exercices précédents dans le cas de l'oxyde d'europium EuO pour lequel
M S = 1.88 × 10 6 A m −1 et C m = 5.84 × 10 −4 m 3 K kg −1 . Calculez les nombres effectifs de
magnétons de Bohr neff et p eff . Vérifiez que ces nombres sont en accord avec un spin S = 7/2
et un facteur de séparation spectroscopique g = 2. La masse volumique et la masse molaire de
l'oxyde d'europium sont respectivement 8.21 g cm −3 et 168 g mole −1 .

Réponse : neff = 6.9 , p eff = 7.9 .


4. Les températures de Curie du nickel et de l'oxyde d'europium sont respectivement 631 et 69 K.
Dans le modèle du champ moléculaire et en ne considérant que les z proches voisins, estimez
l'intégrale d'échange J. On prendra z = 12 et les spins respectivement égaux à S = 1/2 et S = 7/2.

Réponse : J = 9.0 × 10 −3 eV et J = 4.7 × 10 −5 eV .


5. Estimez la valeur du champ moléculaire BW régnant au zéro absolu, soit q, dans le nickel à
partir des valeurs J = 10 −2 eV , S = 1/2, g = 2, le nombre de proches voisins étant 12.
Réponse : q ≅ 1000 T .
6. Montrez que l'énergie et l'entropie hors équilibre d'un système de spins 1/2 sont données par :
(1) E = − MB − NwR 2 / 4
(2) S = k ln W = Nk [(1 + R ) ln (1 + R ) + (1 − R ) ln (1 − R )]
avec R = M / M S . Montrez qu'en minimisant le potentiel thermodynamique F ∗ = E − TS on
retrouve les résultats donnés par la méthode du champ moléculaire (méthode de Bragg-
Williams).
7. Développez le potentiel thermodynamique F ∗ de l'exercice précédent à l'ordre quatre en R et
considérez ce résultat dans le cadre de la théorie de Landau.
8. Montrez qu'au voisinage du point de Curie, la méthode du champ moléculaire conduit à :
10 (S + 1)
2 2
 M  2
 T  TC − T
(3)   =  
 MS  3 2 S (S + 1) + 1  TC  TC
c (m ) 5S (S + 1)  T 
(4) V =  4 − 3 
R 2S (S + 1) + 1  TC 
9. Montrez, dans le cadre du modèle d'Ising à une dimension, que la fonction de corrélation
Γ1 ≡ α i ,α i +1 a pour valeur 2kT (∂ ln Q N / ∂J ) . Calculez Γ1 en champ nul. Montrez que l'on a
l'expression générale en champ nul
(5) Γ p ≡ α i , α i + p = tanh p (J / 2kT )
10. Les constantes d'anisotropie du nickel à température ambiante sont K 1 = −4.5 × 10 3 J m −3 et
K 2 = 2.3 × 10 3 J m −3 . Montrez que les directions d'aimantation facile sont la direction [111] et
les sept autres qui s'en déduisent par symétrie.
11. L'énergie du champ magnétique créé par une particule sphérique d'aimantation uniforme M à
l'extérieur de cette sphère est E = 4πµ 0 r 3 M 2 / 27 (r est le rayon de la sphère). Lorsque la
particule est composée de deux domaines, cette énergie est négligeable. Sachant que l'énergie
surfacique d'un mur de Bloch est, pour le nickel, de l'ordre de 10 −3 J m −2 , montrez que la
division en domaines est énergétiquement défavorable pour un rayon de particules inférieur à
une valeur r0 que l'on estimera. On prendra M = 5 × 10 5 A m −1 .

Réponse : r0 ≅ 2 × 10 −8 m .
12. Le grenat GdIG (Gd3Fe5O12) a un moment de saturation relatif à une mole égal à 16µ B .
Interprétez cette valeur sachant que les spins respectifs de Gd 3+ et Fe 3+ sont 7/2 et 5/2 avec g
= 2 dans les deux cas.

Réponse : 16 = 3 x 7 - (3 - 2) x 5.
VII. Supraconductivité

VII.1. L'équation de Schrödinger en présence d'un champ magnétique


Habituellement, la fonction d'onde qui apparaît dans l'équation de Schrödinger concerne une ou
deux particules seulement. Et la fonction d'onde n'a pas de signification classique, contrairement au
champ électrique, au potentiel vecteur ou autres. La fonction d'onde pour une seule particule est un
champ, en ce sens que c'est une fonction de la position, mais elle n'a généralement pas une
signification classique. Néanmoins, il existe des situations dans lesquelles la fonction d'onde de la
mécanique quantique possède un sens classique. C'est de celle-ci que nous allons nous occuper. Le
comportement spécifiquement quantique de la matière à petite échelle ne se manifeste
habituellement pas à grande échelle, sauf pour donner, très normalement, les lois de Newton de la
mécanique dite classique. Mais il est certaines situations où les particularités de la mécanique
quantique peuvent apparaître de façon spéciale dans les phénomènes de grande échelle. Nous avons
déjà vu un exemple caractéristique de ce type avec la superfluidité. L'effet laser entre aussi dans
cette catégorie.

Aux basses températures, lorsque l'énergie d'un système a été réduite à un niveau très, très bas, on a
affaire non pas à un grand nombre d'états mais seulement à un nombre très, très petits d'états
proches de l'état de base. Dans ces circonstances, le caractère quantique de cet état de base peut se
manifester à une échelle macroscopique.

Nous allons commencer par rappeler quelques propriétés de l'équation de Schrödinger. En utilisant
l'équation de Schrödinger, on veut décrire le comportement d'une particule dans un champ
magnétique car les phénomènes de supraconductivité sont reliés aux champs magnétiques. Un
champ magnétique est décrit par un potentiel vecteur et le problème est le suivant : quelles sont les
lois de la mécanique quantique dans un potentiel vecteur ? Le principe qui décrit le comportement
quantique dans un potentiel vecteur est très simple. L'amplitude pour qu'une particule aille d'un
endroit à un autre suivant un certain parcours, en présence d'un champ, est la même que l'amplitude
pour le même parcours en l'absence du champ, multipliée par l'exponentielle de l'intégrale du
potentiel le long de ce parcours, multipliée encore par la charge électrique et divisée par la
constante de Planck (figure ci-dessous) :
 iq b 
(1) b a = ba A=0
exp ∫ A ⋅ ds 
h 
A a

C'est là une règle fondamentale de la mécanique quantique.

D'autre part, en l'absence d'un potentiel vecteur, l'équation de Schrödinger pour une particule
chargée (non relativiste et sans spin) s'écrit :
h ∂ψ 1 h  h 
(2) − = Hˆ ψ =  ∇  ⋅  ∇ ψ + qφψ
i ∂t 2m  i   i 
où φ est le potentiel électrique et donc qφ l'énergie potentielle. L'équation (1) est conforme à la
règle selon laquelle, en présence d'un champ magnétique, les gradients dans l'hamiltonien sont
chaque fois remplacés par le gradient moins qA . Ainsi, l'équation (2) devient
h ∂ψ 1 h  h 
(3) − = Hˆ ψ =  ∇ − qA  ⋅  ∇ − qA ψ + qφψ
i ∂t 2m  i  i 

C'est l'équation de Schrödinger pour une particule de charge q (non relativiste et sans spin) se
déplaçant dans un champ électromagnétique A, φ .
Pour montrer que cette équation est correcte, illustrons là par un exemple simple dans lequel, au
lieu d'une trajectoire continue, nous avons une ligne d'atomes le long de l'axe x, espacés de b, et une
amplitude -K pour qu'un atome saute d'un atome à l'autre en l'absence de champ. Maintenant,
d'après l'équation (1), s'il y a un potentiel vecteur dans la direction x, Ax ( x, t ) , l'amplitude pour que
l'électron saute sera modifiée, par rapport à ce qu'elle était avant, par un facteur exp(iq / hAx b ) .
L'exposant est égal à iq / h , que multiplie le potentiel vecteur intégré d'un atome à l'atome suivant.
Pour simplifier, nous écrirons (q / h )Ax = f (x ) puisque Ax dépendra en général de x. Si l'amplitude
pour trouver l'électron à l'atome "n" situé en x est désignée par C ( x ) = C n , le taux de variation de
cette amplitude est donné par l'équation suivante :
h ∂
(4) − C ( x ) = E0 C ( x ) − Ke −ibf ( x +b / 2 )C ( x + b ) − Ke +ibf ( x −b / 2 )C ( x − b )
i ∂t

Elle comporte trois parties. Il y a tout d'abord une certaine énergie E 0 , si l'électron est situé en x.
Cela donne, comme l'on sait, le terme E 0 C ( x ) . Vient ensuite le terme − KC ( x + b ) qui est
l'amplitude pour que l'électron ait sauté d'un pas en arrière depuis l'atome "n+1" situé en x + b.
Toutefois, lorsque ce saut a lieu en présence d'un potentiel vecteur, la phase de l'amplitude doit être
modifiée selon la règle (1). Si Ax ne change pas de façon notable entre deux atomes voisins,
l'intégrale peut être simplement remplacée par la valeur de Ax au point milieu, que multiplie le pas
b. Ainsi le produit de (iq / h ) par l'intégrale devient simplement bf ( x + b / 2 ) . Pour montrer que
l'électron a sauté vers l'arrière, on a donné un signe négatif à la variation de phase. Voilà donc pour
la seconde partie. De même, il existe une certaine amplitude pour que l'électron ait sauté depuis
l'atome de l'autre coté, mais cette fois nous avons besoin du potentiel vecteur à une distance b/2 de
l'autre côté de x, multipliée par la distance b. Et voilà pour la troisième partie. La somme de ces
trois parties donne l'équation de l'amplitude pour que l'électron soit en x, en présence d'un potentiel
vecteur.

Par ailleurs, nous savons que, si la fonction C ( x ) est suffisamment régulière (nous nous plaçons à
la limite des grandes longueurs d'onde) et si nous amenons les atomes tout près les un des autres,
l'équation (4) tendra vers la relation décrivant le comportement d'un électron dans l'espace libre.
L'étape suivante consiste donc à développer en série, suivant les puissances de b, les deux côtés de
(4), en supposant que b est très petit. Par exemple, si b est nul, le côté droit se réduit à
(E0 − 2 K )C (x ) , donc, à l'approximation d'ordre zéro, l'énergie est E 0 − 2 K . Viennent ensuite les
termes en b. Mais, les deux exponentielles ayant des signes opposés, seules restent les puissances
paires de b. Si vous faites un développement en série de Taylor de C ( x ) , de f ( x ) et des
exponentielles et si vous rassemblez les termes en b 2 , vous obtenez
h ∂C ( x )
(5) − = E0 C ( x ) − 2 KC ( x ) − Kb 2 {C ′′( x ) − 2if ( x )C ′( x ) − if ′( x )C ( x ) − f 2 ( x )C ( x )}
i ∂t
(les apostrophes désignent la dérivée par rapport à x).

Cet horrible mélange paraît bien compliqué, mais mathématiquement, c'est tout à fait identique à :
h ∂C ( x ) ∂  ∂ 
(6) − = (E 0 − 2 K )C ( x ) − Kb 2  − if ( x )  − if ( x )C ( x )
i ∂t  ∂x   ∂x 

La seconde parenthèse opérant sur C ( x ) donne C ′( x ) plus if ( x )C ( x ) . La première parenthèse,


opérant sur ces deux termes, donne le terme C ′′ et des termes contenant la dérivée première de
f ( x ) et de C ( x ) . Rappelez-vous maintenant qu'en l'absence d'un champ magnétique, les solutions
représentent une particule de masse effective meff donnée par :
h
(7) Kb 2 =
meff

Si ensuite, vous posez E 0 = −2 K et si vous remplacez f ( x ) par (q / h )Ax , vous vérifierez


facilement que l'équation (6) est la même que la première partie de l'équation (3) (comme l'origine
du terme de l'énergie potentielle est bien connue, nous avons évité d'encombrer cette discussion
avec). La proposition contenue dans l'équation (1) et selon laquelle le potentiel vecteur change
toutes les amplitudes par le facteur exponentiel est identique à la règle selon laquelle l'opérateur de
l'impulsion (h / i )∇ est remplacé par
h
(8) ∇ − qA
i
comme vous le voyez dans l'équation de Schrödinger (3).
VII.2. L'équation de continuité pour les probabilités
Revenons maintenant sur une caractéristique importante des fonctions d'onde, en présence d'un
champ magnétique.

Un élément important de l'équation de Schrödinger pour une seule particule consiste en l'idée que la
probabilité pour que la particule se trouve en une certaine position est donnée par la valeur absolue
du carré de la fonction d'onde. La conservation de la probabilité, au sens local, constitue aussi une
caractéristique de la mécanique quantique. Lorsque la probabilité de trouver l'électron quelque part
décroît, pendant que la probabilité que l'électron soit ailleurs croît (sans que la probabilité totale soit
modifiée), il doit bien se passer quelque chose entre les deux. En d'autres termes, l'électron a une
continuité en ce sens que, si la probabilité décroît en un endroit et croit en un autre, il doit exister
une sorte de flux entre les deux. Si, par exemple, vous placez un mur sur le trajet, il aura une
influence et les probabilités ne seront pas les mêmes. Donc la conservation de la probabilité ne
constitue pas, à elle seule, un énoncé complet de la loi de conservation, de même que la
conservation de l'énergie toute seule n'est pas une loi aussi profonde et importante que la
conservation locale de l'énergie. Si l'énergie disparaît, il doit y correspondre un flux d'énergie. De
même, nous voudrions trouver un courant de probabilité tel que, s'il y a quelque changement dans
la densité de probabilité (la probabilité de trouver l'électron dans un volume unité), cela puisse être
considéré comme provenant du flux ou du reflux d'un certain courant. Un tel courant serait un
vecteur qui pourrait être interprété de la façon suivante : la composante x serait la probabilité totale
par seconde et par unité de surface pour qu'une particule traverse, suivant x, un plan parallèle au
plan yz. La traversée vers +x est considérée comme un flux positif et la traversée dans la direction
opposée comme un flux négatif.

Existe-t-il un tel courant ? Et bien, vous savez que la densité de probabilité P(r, t ) est donnée en
termes de la fonction d'onde par :
(1) P(r, t ) = ψ ∗ (r, t )ψ (r, t )

On demande alors : y a-t-il un courant J tel que :


∂P
(2) = −∇ ⋅ J
∂t

Si l'on prend la dérivée par rapport au temps de l'équation (1), on obtient deux termes :
∂P ∂ψ ∂ψ ∗
(3) =ψ ∗ +ψ
∂t ∂t ∂t

Utilisons maintenant l'équation de Schrödinger pour ∂ψ / ∂t et prenons son complexe conjugué


pour avoir ∂ψ ∗ / ∂t , chaque i ayant son signe inversé. On obtient :
∂P i 1 h  h 
=− ψ∗  ∇ − qA  ∇ − qA ψ + eφψ ψ

∂t h 2m  i  i 
(4)
i 1 h  h  ∗
−ψ  ∇ + qA  ∇ + qA ψ − eφψ ψ

h 2m  i  i 

Les termes de potentiel et un tas d'autres choses disparaissent. Et il se trouve, en effet, que tout ce
qui reste peut se mettre sous la forme d'une divergence parfaite. L'ensemble de l'équation est
équivalent à :
∂P  1 h  1  h  
(5) = −∇  ψ ∗  ∇ − qA ψ + ψ  − ∇ − qA ψ ∗ 
∂t  2m  i  2m  i  

En réalité, ce n'est pas aussi compliqué que cela paraît. C'est une combinaison symétrique de ψ ∗ ,
multipliée par une certaine opération sur ψ , plus ψ par l'opération complexe conjuguée sur ψ ∗ .
C'est une certaine quantité plus son propre complexe conjugué, l'ensemble est donc réel, comme il
se doit pour une variation de probabilité. On peut se souvenir de l'opération, sachant qu'elle est
constituée simplement de l'opérateur impulsion p̂ moins qA . On peut écrire le courant de (2)
comme suit :

1  pˆ − qA   pˆ − qA  
(6) J =  ψ  ψ +ψ ∗  ψ 
2  m   m  
Il existe alors un courant J qui complète l'équation (2).

L'équation (4) montre que la probabilité est conservée localement. Si une particule disparaît d'une
région, elle ne peut apparaître dans une autre sans qu'il se passe quelque chose entre les deux.
Imaginez que la première région est entourée d'une surface fermée, assez éloignée pour que la
probabilité d'y trouver l'électron soit nulle. La probabilité totale de trouver l'électron quelque part à
l'intérieur de cette surface est donnée par l'intégrale de volume de P. Mais, selon le théorème de
Gauss, l'intégrale de volume de la divergence de J est égale à l'intégrale de surface de J. Si ψ est
nul sur la surface, l'équation (4) dit que J est nul sur la surface. Ainsi la probabilité totale de trouver
la particule à l'intérieur ne peut donc pas changer. Ce n'est que si une partie de la probabilité
s'approche de la frontière qu'une partie pourra s'en échapper. Nous pouvons dire que la probabilité
ne peut sortir du volume qu'en traversant la surface et c'est cela la conservation locale.
VII.3. Deux sortes d'impulsion
L'équation du courant est assez intéressante mais elle peut parfois sembler troublante. Il serait
satisfaisant de concevoir le courant comme le produit de la densité de particule par la vitesse. La
densité devrait être quelque chose du genre ψψ ∗ , ce qui colle bien. D'autre part, chacun des deux
termes du courant a la forme typique d'une valeur moyenne, celle de l'opérateur
pˆ − qA
(1)
m
aussi, peut-être faudrait-il le considérer comme l'opérateur de vitesse d'écoulement. Nous aurions
donc deux suggestions quant à la relation entre la vitesse et l'impulsion car on peut aussi envisager
que l'impulsion divisée par la masse, pˆ / m , constitue une vitesse. Les deux possibilités diffèrent
par le potentiel vecteur.

Il se trouve que ces deux possibilités étaient déjà apparues en physique classique : l'impulsion
pouvait se définir de deux manières. L'une d'elle s'appelle "l'impulsion cinématique" mais pour plus
de clarté nous l'appellerons "l'impulsion mv". C'est l'impulsion obtenue en multipliant la masse par
la vitesse. L'autre est une impulsion plus mathématique, plus abstraite, quelque fois appelée
"impulsion dynamique" et que nous appellerons "l'impulsion p". Les deux possibilités sont
(2) Impulsion mv = mv
(3) Impulsion p = mv + qA

En mécanique quantique, lorsqu'il y a des champs magnétiques, c'est l'impulsion p qui se trouve
reliée à l'opérateur de gradient p̂ . Il en résulte que (1) est l'opérateur d'une vitesse.

Nous allons faire une rapide digression pour montrer de quoi il s'agit et pourquoi il doit y avoir en
mécanique quantique l'équivalent de (3). La fonction d'onde varie avec le temps selon les
prescriptions de l'équation de Schrödinger. Si on change brutalement le potentiel vecteur, la
fonction d'onde, au tout début, ne change pas. Seul son taux de variation est modifié. Imaginez
maintenant ce qui se passerait dans les circonstances suivantes. Supposez un long solénoïde dans
lequel on puisse produire un flux de champ magnétique (champ B), comme indiqué dans la figure
ci-dessous.
Et il y a une particule chargée au voisinage. Supposez que ce flux soit établi de façon presque
instantanée depuis la valeur zéro jusqu'à une certaine valeur. Au début, on a un potentiel vecteur
nul et on établit ensuite un potentiel vecteur non nul. Autrement dit, on produit brusquement un
potentiel vecteur circulaire A. Vous vous souvenez que l'intégrale de la ligne A le long d'une boucle
est égale au flux de B à travers cette boucle. Que va-t-il se passer si on établit brusquement un
potentiel vecteur ? D'après l'équation quantique, le brusque changement de A ne provoque pas un
brusque changement de ψ . La fonction d'onde reste la même. Le gradient reste donc lui aussi
inchangé.

Mais rappelez-vous ce qui se passe quand on établit brusquement un flux. Pendant le temps bref où
le flux s'accroît, un champ électrique est produit dont l'intégrale de ligne est égale au taux de
variation du flux :
∂A
(4) E = −
∂t

Si la variation de flux est très brusque, le champ électrique est énorme et il agit sur la particule. La
force qui s'exerce est le produit de la charge et du champ électrique et, en même temps que le flux
s'établit, la particule reçoit une impulsion totale (c'est-à-dire la variation de mv) égale à − qA . En
d'autres termes, si vous établissez brusquement un potentiel vecteur au voisinage d'une charge, cette
charge se saisit immédiatement d'une impulsion "mv" égale à − qA . Mais il y a une certaine chose
qui ne varie pas immédiatement et c'est la différence entre mv et − qA . La somme p = mv + qA
reste donc inchangée quand vous faites un changement brusque du potentiel vecteur. Cette quantité
p est celle que nous avons appelée impulsion p. Elle a une grande importance en dynamique dans la
mécanique classique, elle a aussi un sens très précis en mécanique quantique. Elle dépend du type
de la fonction d'onde et c'est à elle que l'on doit identifier l'opérateur
h
(5) pˆ = ∇
i
VII.4. La signification de la fonction d'onde
En même temps qu'il découvrait son équation, Schrödinger découvrait la loi de conservation qui en
résulte. Mais il imaginait à tort que P était la densité de charge de l'électron et que J était la densité
de courant électrique. Il pensait donc que les électrons interagissent avec le champ
électromagnétique par l'intermédiaire de ces charges et courants. Quand il résolvait ses équations
pour l'atome d'hydrogène et calculait ψ , il ne cherchait pas la probabilité de quoi que ce soit, les
amplitudes n'existaient pas à ce moment là, son interprétation était tout à fait différente. Le noyau
de l'atome était stationnaire, mais il y avait tout autour des courants en mouvement. Les charges P
et les courants J devaient créer des champs électromagnétiques et l'objet devait ainsi rayonner de la
lumière. Mais, en traitant un certain nombre de problèmes, il s'aperçut bientôt que cela n'allait pas
tout à fait. C'est à ce stade que Born a apporté une contribution essentielle à nos idées sur la
mécanique quantique. C'est Born (du moins à notre connaissance) qui a su interpréter correctement
le ψ de l'équation de Schrödinger en termes d'une amplitude de probabilité. Cette idée difficile
selon laquelle le carré de l'amplitude n'est pas la densité de charge, mais seulement la probabilité
par unité de volume pour trouver un électron en ce point, toute sa charge étant en ce point lorsqu'on
l'y trouve. Toute cette idée est due à Born.

Pour un électron dans un atome, la fonction d'onde ψ (r ) ne représente donc pas un électron étalé
avec une densité de charge étalée. L'électron est soit ici, soit là, soit quelque part ailleurs, mais où
qu'il soit c'est une charge ponctuelle. D'un autre côté, imaginez une situation telle qu'il y ait un
nombre énorme de particules, toutes exactement dans le même état, avec la même fonction d'onde.
Qu'importe ? L'une d'elle est ici, une autre là, et la probabilité de trouver n'importe laquelle en un
point donné est proportionnelle à ψψ ∗ . Mais, puisqu'il y a tant de particules, dans un volume
quelconque dxdydz, on en trouvera en général un nombre voisin de ψψ ∗ dxdydz . Dans une
situation où ψ est la fonction d'onde pour chacune des particules d'un lot considérable de particules
se trouvant toutes dans le même état, ψψ ∗ peut s'interpréter comme la densité de particules. Si, de
plus, chacune des particules porte la même charge q, on peut aller jusqu'à interpréter ψψ ∗ comme
la densité d'électricité. Normalement, on donne à ψψ ∗ les dimensions d'une densité de probabilité.
Il faut alors multiplier ψψ ∗ par q pour lui donner les dimensions d'une densité de charge. Pour
notre propos actuel, on peut introduire un facteur constant dans ψ et prendre ψψ ∗ lui-même
comme densité de charge électrique. Dans la ligne de cette interprétation, J (le courant de
probabilité que nous avons calculé) devient directement la densité de courant électrique.

Ainsi, dans une situation où nous avons un très grand nombre de particules toutes exactement dans
le même état, une nouvelle interprétation physique des fonctions d'onde est alors possible. La
densité de charge et le courant électrique peuvent se calculer directement à partir des fonctions
d'onde et les fonctions d'onde prennent alors une signification qui s'étend à des situations
classiques, macroscopiques.

Un état de choses similaire peut concerner les particules neutres. Quand nous avons la fonction
d'onde pour un photon unique, il s'agit de l'amplitude pour trouver un photon quelque part. Bien
que nous ne l'ayons jamais écrite, il existe pour la fonction d'onde du photon une équation analogue
à l'équation de Schrödinger pour l'électron. L'équation est exactement identique aux équations de
Maxwell pour le champ électromagnétique et la fonction d'onde est la même que pour le potentiel
vecteur A. Il se trouve d'ailleurs que la fonction d'onde est identiquement le potentiel vecteur.
Physique classique et physique quantique sont ici une seule et même chose, du fait que les photons
sont des particules de Bose sans interaction et qu'ils peuvent être nombreux dans un même état,
comme vous le savez, ils "aiment" à être dans un même état. A partir du moment où vous en avez
des milliards dans un même état (c'est-à-dire dans la même onde électromagnétique), vous pouvez
mesurer directement la fonction d'onde puisque c'est le potentiel vecteur. Bien sûr, c'est,
historiquement, l'inverse qui s'est fait. Les premières observations ont porté sur des situations
comportant beaucoup de photons dans un même état et l'on a pu ainsi découvrir l'équation correcte
pour un photon unique en observant directement, à l'œil nu, à une échelle macroscopique, la nature
de la fonction d'onde.

La difficulté avec l'électron est que vous ne pouvez pas en mettre plus d'un dans un même état. On
a donc longtemps cru que la fonction d'onde de l'équation de Schrödinger n'aurait jamais de
représentation macroscopique analogue à la représentation macroscopique de l'amplitude pour les
photons. Pourtant, on se rend compte maintenant que le phénomène de supraconductivité nous
fournit précisément cette situation.
VII.5 La supraconductivité
En cherchant la valeur limite de la résistivité des métaux très purs au zéro absolu, H. Kamerlingh
Onnes (1911) a découvert le fait que, en dessous d'une certaine température critique TC = 4.2 K , la
résistivité du mercure s'annule brusquement. Ce phénomène, appelé supraconductivité, existe pour
de nombreuses substances. Il découvrit ensuite (1914) que la supraconductivité est détruite lorsque
l'on applique à la substance un champ magnétique d'induction supérieur à une valeur critique
BC (T ) suivant, de façon approchée, la loi empirique dite de Tuyn (figure ci-dessous).
B (T )
2
T 
(1) C = 1 −  
BC (0 )  TC 
En 1933, W. Meissner et R. Ochsenfeld découvrirent une nouvelle propriété des supraconducteurs :
l'induction magnétique est toujours nulle à l'intérieur d'une substance supraconductrice (figure ci-
dessous).
A la suite de ces découvertes, F. et H. London (1935) donnèrent une interprétation quantique des
propriétés magnétiques de ces substances en supposant que la fonction d'onde des électrons
supraconducteurs était suffisamment "rigide" pour n'être pas influencée par ces champs
magnétiques modérés. Ils suggérèrent que l'état fondamental des électrons supraconducteurs est
séparé des états excités par un "gap". Ce gap, de l'ordre de kTC , a été mis en évidence dans les
années 1950 par absorption d'ondes centimétriques, ainsi que par d'autres méthodes.

En 1950, E. Maxwell d'une part et C.A. Reynolds et al. d'autre part découvrirent l'effet isotopique
dans lequel la température critique TC varie comme M −1 / 2 , M étant la masse molaire des isotopes
d'un élément supraconducteur donné. Ceci indiqua que la supraconductivité est liée aux interactions
électrons - phonons. Indépendamment, H. Frölich prédit en 1950 l'existence d'un effet isotopique en
considérant de telles interactions et montra en 1954 que, dans un modèle à une dimension, apparaît
un gap. L'idée des paires d'électrons se comportant comme des bosons prit alors naissance et fut
démontrée par L.N. Cooper (1956), lorsqu'il existe une force totale d'attraction, aussi faible soit-elle
entre les électrons. Cette série de travaux abouti à la théorie BCS (J. Bardeen, L.N. Cooper et J.R.
Schrieffer) (1957), qui permet d'interpréter l'ensemble des propriétés des supraconducteurs, en
particulier les propriétés électromagnétiques traitées de façon purement phénoménologique par F.
et H. London et par A.B. Pippard (1953).

Le phénomène de supraconductivité revêt une importance particulière. Il permet par exemple de


mettre en évidence des fonctions d'onde cohérentes sur des distances macroscopiques. Par ailleurs,
ses applications sont très nombreuses : transport de courant électrique sans perte, électro-aimants
puissants, jonctions Josephson.

Jusqu'au milieu des années 80, les substances supraconductrices utilisées étaient des métaux, des
composés et alliages métalliques, la température critique la plus élevée ( TC = 23.2 K ) étant celle du
composé Nb3Ge . En 1986, une classe nouvelle de matériaux de température critique plus élevée,
dépassant même 77 K, la température d'ébullition de l'azote, a été découverte. Il s'agit de
céramiques comprenant de l'oxyde de cuivre, qui permettent d'envisager un développement
nouveau des applications de la supraconductivité.
VII.6. Propriétés expérimentales

Température critique
On connaît actuellement un grand nombre de substances métalliques présentant à basse température
le phénomène de supraconductivité. Il s'agit aussi bien d'éléments que de composés ou d'alliages.

Elément TC (K ) α Type BC (0 ) Eg (0 ) / kTC (C s − C n ) / γTC Θ D (K )


Al 1.196 I 99 3.4 1.4 394
Zn 0.875 0.45 I 53 3.2 1.3 234
Ga 1.091 I 51 1.4 240
Cd 0.56 0.32 I 30 3.2 1.4 120
In 3.40 I 293 3.6 1.7 129
Sn 3.72 0.47 I 305 3.5 1.6 170
Hg (α ) 4.15 0.50 I 411 4.6 2.4 100
Hg (β ) 3.95 I 339
Tl 2.39 0.61 I 171 3.6 1.5 96
Pb 7.19 0.49 I 803 4.3 2.7 88
V 5.30 II 1020 3.4 1.5 390
Nb 9.26 II 1980 3.8 1.9 275
Ta 4.48 I 830 3.6 1.6 225

Substance Nb3Ge Nb3Ga Nb3Sn NbN NiBi


TC (K ) 23.2 20.3 18.05 16.0 4.25

Les éléments supraconducteurs se divisent en deux groupes. Le premier groupe comprend neuf
métaux cités en premier dans le tableau ci-dessus, appartenant à la famille des métaux simples de la
droite du tableau périodique des éléments. Le second groupe comprend dix-sept métaux de
transition suivants :

3d Ti, V
4d Zr, Nb, Mo, Tc, Ru 4f La ( α et β )
5d Hf, Ta, W, Os, Ir 5f Th, Pa, U ( α et β )

On n'a découvert aucun métal alcalin ou alcalino-terreux, ni aucun métal noble devenant
supraconducteur : pour devenir supraconductrice, une substance doit en effet présenter un couplage
électron - phonon important entraînant dans la phase normale une faible conductivité. De même
aucun élément ferromagnétique n'est supraconducteur. Enfin, on connaît des milliers de composés
ou alliages supraconducteurs qui peuvent l'être même si l'un ou plusieurs (ou la totalité) des
constituants ne le sont pas.

Les températures critiques TC des substances métalliques sont toutes inférieures à 25 K. Ces
températures pour un élément pur, varient avec la masse M de l'isotope (effet isotopique) selon la
loi :
(1) TC ∝ M −α
α étant une constante voisine de 0.5.

Champ critique
L'application d'un champ magnétique d'induction BC suffisamment élevée détruit la
supraconductivité d'une substance. L'induction magnétique appliquée limite BC (T ) décroît avec la
température depuis une valeur maximum BC (0 ) au zéro jusqu'à la température critique TC .

Les valeurs de BC (0 ) , relativement faibles, sont inférieures à 0.2 T. La fonction BC (T ) suit


approximativement la loi empirique de Tuyn, les écarts à cette loi, définis par :
BC (T )   T  
2

(2) D(T ) = − 1 −   
BC (0)   TC  
 
étant assez faibles (figure ci-dessous).
Dans le plan T, B0 , la courbe BC (T ) limite les domaines d'existence des deux phases, l'une
supraconductrice, l'autre normale. Elle possède une tangente de pente nulle au zéro absolu,
conformément au troisième principe, et finie au point critique.
Effet Meissner
Considérons un barreau cylindrique long et mince (figure ci-dessous) ayant son axe parallèle à la
direction du champ magnétique appliqué (d'autres géométries seront discutées plus loin), en champ
nul et à une température supérieure à TC (état a).

En abaissant sa température au-dessous de TC , le barreau devient supraconducteur (état b). Si l'on


installe un faible champ extérieur d'induction B0 = µ 0 H 0 , il se produit des courants de Foucault
superficiels qui s'opposent à la pénétration du champ et qui persistent en raison de l'absence de
résistance électrique (état c). Ces courants dont la densité cinétique vaut j = H 0 pour compenser le
champ extérieur confèrent à la substance un moment magnétique total M = Sjl , S et l étant la
section et la longueur du cylindre. On obtient ainsi le résultat, valable pour toutes les géométries :
B
(3) M = −VH 0 = −V 0
µ0
Si, partant de nouveau de l'état normal a, on accroît le champ jusqu'à la valeur B0 (état d), le champ
pénètre dans le métal avec la valeur B = B0 , car les supraconducteurs ne sont pas magnétiques. En
abaissant ensuite la température, on pourrait penser que l'on atteint un état supraconducteur c ′ ≠ c
dans lequel le champ magnétique à l'intérieur est encore B = B0 . Il n'en est rien : à la transition, la
substance expulse le champ magnétique par la création des mêmes courants superficiels que
précédemment. On retrouve ainsi l'état c. Cette propriété des supraconducteurs d'avoir une
induction magnétique nulle (B = 0) dans leur volume, est appelé effet Meissner. Elle n'est pas une
conséquence du fait que la résistivité est nulle, mais une autre manifestation du phénomène se
produisant à l'échelle moléculaire.

Notons que de nombreux auteurs transcrivent la relation (3) sous la forme


M
(4) M = = − H 0 , soit χ = −1
V
et assimilent un supraconducteur à une substance diamagnétique parfaite. Cette analogie rend
commodes certaines discussions relatives à la substance dans son ensemble mais est inexacte
localement, car en tout point on a M = 0, le moment magnétique étant dû aux courants superficiels.

Capacité calorifique
En champ nul, la capacité calorifique des substances supraconductrices présente à la température
critique une discontinuité tout en restant finie (figure ci-dessous).
Comme de plus, on n'observe pas de chaleur latente à la transition, celle-ci est du deuxième ordre.
En présence d'un champ d'induction B0 inférieur au champ critique BC (0 ) , la capacité calorifique
présente également une discontinuité à la température de transition définie par BC (T ) = B0 .
Cependant, il existe une chaleur latente et le changement de phase est du premier ordre. Les deux
phases peuvent alors coexister. Pour un champ supérieur au champ critique BC (0 ) il n'y a pas de
transition et la capacité calorifique reste continue.

La substance dans son état normal étant non magnétique, ses propriétés sont indépendantes de B0 .
Son énergie libre est alors une fonction Fn (T ) de la température seule (le volume n'intervient pas à
basse température), de même que sa capacité calorifique C n (T ) . Dans la phase supraconductrice la
substance possède le moment magnétique (3) et son énergie libre, dont la différentielle est :
V
(5) dF = − SdT − MdB0 = − SdT + B0 dB0
µ0
a pour expression
(6) F (T , B0 ) = Fs (T ) +
V
B02
2µ 0

Il s'ensuit que, dans la phase supraconductrice également, l'entropie et la capacité calorifique sont
indépendantes de B0 . Nous noterons cette dernière C s (T ) .

A la transition entre l'état normal et l'état supraconducteur, l'énergie libre F (T , B0 ) est continue,
soit
(7) Fn (T ) = Fs (T ) + BC2 (T )
V
2µ 0

Cette équation permet de déterminer BC (T ) . Par dérivation on obtient successivement

(8) S n (T ) − S s (T ) = −
V d
2 µ 0 dT
[BC2 (T )]
et

(9) C n (T ) − C s (T ) = −
VT d 2
2 µ 0 dT 2
[
BC2 (T ) ]
Cette dernière équation relie les capacités calorifiques au champ critique, ce qui permet de limiter
le nombre de mesures.

La capacité calorifique comprend, pour chacune des phases, un terme C (r ) provenant des vibrations
du réseau et un terme C (e ) d'origine électronique. Comme il ne se produit pas de modification du
réseau à la transition on admet que C (r ) est la même fonction dans les deux phases. On a donc :
C n = C (r ) + C n(e )
(10)
C s = C (r ) + C s(e )

La capacité calorifique électronique de la phase normale étant de la forme γT , on peut obtenir la


capacité calorifique électronique de la phase supraconductice par la relation :
(11) C s(e ) = C s − C (r ) = C s − (C n − γT )
γ étant obtenu par extrapolation au zéro absolu de C n . La capacité calorifique ainsi obtenue
(figure ci-dessous) présente, pour T << TC , une variation exponentielle en 1/T de la forme :
C s(e )  T 
(12) = a exp − b C 
γTC  T 
Les valeurs de a et b sont en général voisines de 8 et de 1.4 respectivement. A la température
critique, la capacité calorifique électronique présente une discontinuité dont la valeur relative est
C (e ) − C ( e ) Cs − Cn T
(13) s (e ) n = C
≅ 1 .4
Cn T
γTC
C

Bande interdite (gap)


Le comportement de la capacité calorifique C s(e ) , caractéristique d'un système à deux niveaux,
suggère l'existence d'un gap dans le spectre énergétique électronique. Plusieurs méthodes
permettent de mettre ce gap directement en évidence et de le mesurer. Lorsque l'on envoie une onde
électromagnétique d'infrarouge lointain ( σ = 1 / λ ~ 10 cm −1 ) sur un film supraconducteur,
l'absorption ne se produit qu'au-dessus d'une certaine fréquence de coupure, L'énergie des photons
ayant la fréquence de coupure donne la valeur du gap E g . Il existe d'autres méthodes de mesure :
effet tunnel, atténuation des ondes acoustiques.

Au zéro absolu, le gap a une valeur E g (0 ) de l'ordre de 10 −3 eV et est tel que le rapport E g (0 ) / kTC
est voisin de 3.5. Il varie peu à basse température puis décroît (figure ci-dessous) et, au voisinage
de TC , a un comportement en :
1/ 2
 
(14) E g (T ) ∝ 1 −
T

 TC 
Nous voyons que E g (T ) s'annule à la température critique. Ceci montre que la supraconduction est
liée à l'existence du gap. Le comportement (14) de ce dernier permet de le proposer comme
paramètre d'ordre de la transition normal  supraconducteur. L'exposant critique 1/2 et le saut de
capacité calorifique montrent un comportement critique semblable à celui qui est donné dans la
théorie du champ moléculaire.
Conduction thermique
Les métaux normaux sont à la fois bons conducteurs électriques et thermiques. Par contre, les
supraconducteurs, conducteurs parfaits, ont une conductivité thermique K s inférieure, dans leur
phase supraconductrice, à celle K n du métal normal (figure ci-dessous).
Cela est lié au fait que, à mesure que la température décroît, le nombre d'électrons "normaux", qui
seuls assurent la conduction thermique, diminue, alors que le nombre d'électrons
"supraconducteurs" (liés dans une paire de Cooper) étant différent de zéro, la conductivité
électrique est infinie.

Cette propriété est utilisée à très basse température pour réaliser des interrupteurs thermiques. Le
corps étudié est relié à la source de chaleur par un barreau supraconducteur. Le corps et la source
sont isolés en l'absence de champ et sont en contact thermique lorsqu'un courant circulant dans une
bobine crée un champ magnétique qui ramène le barreau à son état normal.
VII.7. Théorie BCS de la supraconductivité

Interaction électron - phonon


La principale cause de la résistivité électrique des métaux est l'interaction électron - phonon. Au
cours de cette interaction, un électron heurtant un ion provoque ou supprime une oscillation se
propageant dans tout le réseau. En d'autres termes, l'électron a créé ou détruit un phonon. Cette
interaction se traduit par la présence de termes de la forme
(1) v(k , q )c −+q a k++q ak ou v(k , q )cq ak++q ak
dans l'hamiltonien du gaz d'électrons. Ces termes signifient qu'un électron dans l'état k a été détruit
(opérateur a k ) et qu'un électron dans l'état k+q a été créé (opérateur a k++q ). Simultanément, un
phonon a été créé dans l'état -q (opérateur c −+q ) ou annihilé dans l'état q (opérateur cq ). L'énergie
v(k , q ) caractérise l'amplitude de probabilité de l'interaction et dépend peu de k. On peut
représenter ces termes par les graphes :

L'énergie des phonons étant inférieure à, ou de l'ordre de, kΘ D ~ 10 −2 eV ( Θ D étant la température


de Debye), et celle des électrons étant de l'ordre de l'énergie de Fermi ε F ~ 5 eV , ces collisions
sont, pour les électrons, quasiment élastiques. En raison du principe d'exclusion de Pauli les
électrons à l'intérieur de la sphère de Fermi ne peuvent être diffusés car les états d'énergie voisine
sont déjà tous occupés. Seuls les électrons au voisinage de la surface de Fermi peuvent donc subir
des collisions.
Interaction électron - électron
La diffusion de deux électrons initialement dans les états k 1 et k 2 vers des états k 1 − q et k 2 + q
se traduit par la présence, dans l'hamiltonien, d'un terme :
(2) V (k 1 , k 2 , q )a k+1 −q ak+2 +q a k 2 a k1
et se représente par le graphe :

En raison du principe d'exclusion de Pauli, les seuls électrons concernés sont ceux voisins de la
surface de Fermi. L'interaction la plus importante est l'interaction coulombienne répulsive (V > 0).
Elle est cependant écrantée à grande distance, c'est-à-dire pour de faibles valeurs de q, par les ions
du réseau : l'énergie V reste ainsi inférieure à une valeur maximum.

Un autre type d'interaction entre électrons se trouve à la base de la théorie microscopique de la


supraconductivité. Lorsqu'un électron se déplace dans le réseau il attire les ions positifs perturbant
ainsi leur mouvement. Cette perturbation du réseau peut agir à son tour sur un second électron. En
termes de phonons, le premier électron émet un phonon de vecteur d'onde q qui est absorbé par le
second électron. Ce phonon est virtuel (il n'existe que le temps de l'interaction) et son énergie
(3) ε k1 − ε k1 −q = ε k 2 +q − ε k 2
peut avoir une valeur différente de hω q (à cause du principe d'indétermination), énergie qui serait
celle d'un phonon réel (c'est-à-dire n'intervenant pas dans une interaction, non absorbé, et de durée
de vie idéalement infinie) de vecteur d'onde q. Le calcul montre que, pour ce type d'interaction,
l'énergie V a pour expression
hω q v(q )
2

(4) V =
(ε − ε k −q ) − (hω q )
k
2 2

où v est l'énergie introduite en (1). Cette énergie V peut être soit positive (répulsion), soit négative
(attraction). Ainsi une diffusion élastique ( ε k = ε k −q ) correspond à une attraction. Il peut alors se
produire, dans certaines conditions, que l'interaction totale, obtenue en ajoutant l'interaction
coulombienne, soit attractive. Ceci est le cas pour des électrons situés dans une écorce d'épaisseur
de l'ordre de kΘ D sur la surface de Fermi, car pour ceux-ci la condition :
(5) ε k − ε k −q < hω q ≅ kΘ D
est vérifiée.

Paires de Cooper
Lorsque deux électrons de quantité de mouvement k 1 et k 2 quelconques diffusent, les contraintes
de conservation de l'énergie et de quantité de mouvement, ainsi que le principe d'exclusion de
Pauli, entraînent que q ne peut prendre que de petites valeurs (figure ci-dessous à gauche).
La probabilité qu'ils interagissent est donc faible. Par contre, lorsque k 1 et k 2 ont des valeurs
égales et opposées (figure ci-dessus à droite), de nombreuses configurations après diffusion sont
possibles. La probabilité d'interaction d'électrons de quantités de mouvement k et -k est donc très
grande et ces électrons seront particulièrement corrélés (paires de Cooper).

Nous n'avons pas considéré jusqu'ici le spin des électrons. Pour chaque paire d'électrons, il existe
quatre configurations de spin formant un singulet et un triplet. On montre que l'état singulet
favorise les corrélations entre paires. En conséquence, seules les paires d'états k ↑,−k ↓
interviendront par la suite.

Hamiltonien BCS
L'hamiltonien du système d'électrons se compose du terme cinétique
(6) ∑ ε k nkλ
k ,λ

où n = a + a est l'opérateur de nombre d'électrons dans l'état k avec le spin λ = ±1 / 2 , et du terme


d'interaction, somme de termes de la forme (2). Dans la théorie BCS, on tient compte du fait que les
paires k ↑,−k ↓ jouent un rôle primordial en introduisant les opérateurs
(7) bk = ak ↑ a −k ↓ et bk+ = a −+k ↓ ak+↑
annihilant ou créant une paire, et en ne considérant que les termes (2) avec k 2 = −k 1 .
L'hamiltonien d'interaction s'écrit donc :
(8) ∑ V (k , k ′)bk+′ bk
k ,k ′

où V (k , k ′) est une énergie symétrisée en k et k' et qui est négative lorsque k et k' sont proches de
la surface de Fermi.

Comme nous l'avons vu, l'emploi d'opérateurs annihilation et création nécessite le formalisme
grand canonique. Nous écrirons donc pour l'hamiltonien BCS
(9) Hˆ ′ = Hˆ − µNˆ = ∑ (ε k − µ )nk ,λ + ∑ V (k , k ′)bk+′ bk
k ,λ k ,k ′
où µ est l'énergie de Fermi ε F . L'utilisation de cet hamiltonien est difficile à cause du terme
quadratique relativement aux opérateurs b. Pour pallier cette difficulté, on effectue la linéarisation :
(10) bk+′ bk → bk+′ bk + bk+′ bk − bk+′ bk
dans laquelle bk est la moyenne statistique de l'opérateur bk qui sera calculée plus loin. Cette
linéarisation est exacte à la limite N → ∞ . En effet, elle est semblable à l'approximation du champ
moléculaire qui est d'autant meilleure que le nombre de plus proches voisins z est grand, N jouant
ici le même rôle. L'hamiltonien (9) devient alors
(
(11) Hˆ ′ = ∑ ε k′ nk ,λ + ∑ ∆ k bk+ + ∆∗k bk − C )
k ,λ k

avec
ε k′ = ε k − µ = ε k − ε F
(12) ∆ = V (k , k ′)b
k ∑ k′
k′

et
(13) C = ∑ V (k , k ′)bk+′ bk = ∑ ∆∗k bk
k ,k ′ k

En regroupant les termes relatifs à une paire d'états k ↑,−k ↓ , on a finalement :


(14) Hˆ ′ = ∑ hˆk′ − C
k
avec
(15) hˆk′ = ε k′ (nk ↑ + n −k ↓ ) + ∆ k bk+ + ∆∗k bk

Sous cette forme, l'hamiltonien Hˆ ′ se décompose, à l'énergie -C près, en une somme


d'hamiltoniens hˆk′ relatifs à des paires d'états indépendantes.
Etats propres de l'hamiltonien BCS
Les états propres de l'hamiltonien Hˆ ′ s'obtiennent à partir des états propres de chacun des
hamiltoniens hˆk′ . Il existe, pour les électrons, quatre façons d'occuper la paire d'états k ↑,−k ↓ :
la paire d'états peut être vide (état noté 00 ), occupée par un électron (deux états notés 01 et
10 ) ou occupée par deux électrons (état noté 11 ). Ces quatre états forment une base de l'espace
dans lequel agit hˆ′ . Ecrivons l'action des opérateurs n, b et b + sur les états de cette base :
k

nk ↑ 00 = 0 n −k ↓ 00 = 0
nk ↑ 01 = 0 n −k ↓ 01 = 01
nk ↑ 10 = 10 n −k ↓ 10 = 0
nk ↑ 11 = 11 n −k ↓ 11 = 11
(16)
bk 00 = 0 bk+ 00 = 11
bk 01 = 0 bk+ 01 = 0
bk 10 = 0 bk+ 10 = 0
bk 11 = 00 bk+ 11 = 0

L'opérateur hˆk′ peut alors être représenté par la matrice 4x4 suivante :
 0 0 0 ∆∗k 
 
 0 ε k′ 0 0 
(17) 
 0 0 ε k′ 0 
∆ 0 0 2ε k′ 
 k
Nous voyons que les états 01 et 10 , dans lesquels l'électron est unique et n'interagit pas, sont
des états propres de l'opérateur hˆk′ avec la valeur propre ε k′ . Dans le sous-espace engendré par les
deux autres états 00 et 11 , l'opérateur hˆ′ est représenté par la matrice 2x2
k

 0 ∆ 
(18)  k



 k 2ε ′
k 
dont les énergies propres
(19) λk ± = ε k′ ± Ek avec Ek = ε k′ 2 + ∆ k
2

sont associés aux vecteurs propres


− (m ε k′ + Ek ) 00 m ∆ k 11
(20) ψ k ± =
[2 Ek (ε k′ + Ek )]1 / 2

Discutons ces résultats. Lorsque ∆ k , défini en (12), est nul, les énergies propres de hˆk′ sont 0, ε k′
(2 fois) et 2ε k′ et sont respectivement associées aux états 00 , 01 , 10 et 11 des paires d'états.
L'énergie minimum, valant zéro, est alors celle de l'état 11 si ε k′ < 0 ( ε k < ε F ) et celle de l'état
00 si ε k′ > 0 ( ε k > ε F ). Si ∆ k est nul pour toutes les valeurs de k, ce qui serait le cas si V était
nul (électrons libres), on retrouve la propriété bien connue d'un métal normal au zéro absolu : tous
les états électroniques en dessous du niveau de Fermi sont occupés, les autres étant vides.

Lorsque ∆ k est non nul, l'énergie minimum est λk − quel que soit k. Sa valeur étant négative, l'état
fondamental ψ k − est donc plus stable que dans le cas d'un métal normal. C'est à cet état que l'on
se réfère quand on parle de paires de Cooper. Insistons sur le fait qu'il s'agit d'une superposition
d'états 00 et 11 et qu'il est occupé par une paire d'électrons k ↑ , k ↓ seulement avec la
probabilité :
∆k
2
1  ε′ 
(21) Pk = = 1 − k 
2 Ek (ε k′ + Ek ) 2  Ek 
Les états 01 et 10 sont des états excités situés à une énergie Ek au-dessus de l'état ψ k − .
Cependant, ces états excités n'ayant pas le même nombre d'électrons que l'état fondamental, on doit
seulement considérer l'excitation menant à ψ k + et nécessitant l'apport d'énergie λk + − λk − = 2 Ek .
Comme on a Ek > ∆ k , il faut fournir une énergie minimum de 2 ∆ k pour réaliser cet état excité.
On voit ainsi apparaître l'interprétation microscopique du gap observé expérimentalement.

Apparition d'un changement de phase


La fonction de partition grand canonique Ξ dans la théorie BCS est obtenue à partir de
l'hamiltonien (14) sous la forme
(22) Ξ = Tr e − β H ′ = e β C ∏ ξ k avec ξ k = Tr e
ˆ − β hˆk′

Cette dernière trace se calcule directement à l'aide des énergies propres de hˆk′ . On a
ξ k = 2 exp(− βε k′ ) + exp(− βλk − ) + exp(− βλk + )
(23) = 2 exp(− βε k′ )(1 + cosh βEk )
βE k
= 4 exp(− βε k′ ) cosh 2
2

La détermination de ξ k et par suite de Ξ nécessite la détermination de ∆ k défini en (12) qui


intervient dans l'expression (19) de Ek . Il faut donc calculer les valeurs moyennes bk . On a
1 ∂ ln Ξ
(24) bk = Tr bk e − β H ′ = − kT
ˆ

Ξ ∂∆∗k

En remplaçant ξ k par son expression (23), on obtient


∂ βE ∆ βE
(25) bk = −2kT ∗ ln cosh k = − k tanh k
∂∆ k 2 2 Ek 2
équation qui détermine implicitement bk . Le report de cette équation dans (12) fournit à son tour
l'équation implicite déterminant ∆ k
∆ βE
(26) ∆ k = −∑ V (k , k ′) k ′ tanh k ′
k 2 Ek′ 2

La résolution de cette équation n'est possible qu'une fois connue l'expression exacte de V (k , k ′) .
Cependant, toutes les caractéristiques principales du résultat que l'on obtiendrait ainsi se retrouvent
en supposant que V (k , k ′) est nul lorsque k ou k' sont à l'extérieur d'une couche d'épaisseur kΘ D
de part et d'autre de la surface de Fermi et constant à l'intérieur. On écrit ainsi
(27) V (k , k ′) = −V0θ (kΘ D − ε k′ )θ (kΘ D − ε k′ ′ )
la constante V 0 étant positive pour représenter l'interaction attractive entre électrons due à
l'échange de phonons virtuels. La fonction de Heaviside θ vaut 0 pour un argument négatif et 1
pour un argument positif. En reportant dans (26), on voit que ∆ k est nul si k est à l'extérieur de la
couche d'épaisseur kΘ D et a une valeur constante notée ∆ à l'intérieur de cette couche, soit

(28) ∆ k = ∆ × θ (kΘ D − ε k′ ) avec ∆ = V0 ∑ tanh (βEk ′ / 2 )
k ′ 2 Ek′

On voit que cette équation, et plus généralement (26), n'a de solution non nulle en ∆ que si
V (k , k ′) est négatif ( V0 > 0 ). En remplaçant la somme sur k' par une intégrale et en explicitant
Ek ′ , nous voyons que ∆ est donné par l'équation implicite

(29) 1 =
V0 ε F + kΘ D
∫ε F −kΘ D 2 dε
(
g (ε ) tanh β ε ′ 2 + ∆2 / 2 )
2 ε ′ 2 + ∆2
où g (ε ) est la densité d'états électroniques compte tenu de la dégénérescence de spin. En
négligeant les variations de g (ε ) au voisinage de la surface de Fermi, on voit que ∆ est défini par

(30) ∫
+ kΘ D (
tanh β ε ′ 2 + ∆2 / 2 ) dε ′ = 4
=
2
− kΘ D
ε ′ 2 + ∆2 V0 g (ε F ) g
et que sa valeur dépend de la température. Le paramètre
V g (ε F )
(31) g = 0
2
rassemble en une seule grandeur sans dimension les deux paramètres électroniques de la théorie V 0
et g (ε F ) . En utilisant une identité sur la fonction tanh et compte tenu de ce que

(32) ∫
kΘ D

− kΘ D
dε ′
ε′ + ∆
2 2
( )
= 2 ln kΘ D + ∆2 + kΘ 2D ≅ 2 ln (2kΘ D / ∆ )

la relation (30) peut également s'écrire


2kΘ D dε ′ 1 1
(33) ln =∫ βE
+
∆ E e +1 g

La fonction ∆(T ) , obtenue par résolution numérique, est en excellent accord avec la courbe du gap
de l'étain montrée précédemment. Sa valeur ∆ 0 au zéro absolu s'obtient en remarquant que
l'intégrale dans (33) est nulle. On a donc
(34) ∆(0 ) ≡ ∆ 0 = 2kΘ D e −1 / g

Au voisinage du zéro absolu, on peut montrer que ∆ prend la forme


∆(T ) 2πkT −∆ 0 / kT
(35) = 1− e ( kT << ∆ )
∆0 ∆0
et décroît, en s'annulant pour une température TC donnée par
kΘ D tanh (β ε ′ / 2 ) 2
(36) ∫ C
dε ′ =
− kΘ D ε′ g

Un calcul analytique donne


exp γ E
(37) TC = 2 Θ D exp(− 1 / g ) = 1.13Θ D exp(− 1 / g )
π
où γ E = 0.577 est la constante d'Euler. Au voisinage de TC ( T < TC ), un développement limité
montre que
1/ 2 1/ 2
 8π 2  T   T 
(38) ∆(T ) = kTC  1 −  = 3.06kTC 1 − 
 7ζ (3)  TC   TC 
où ζ (3) = 1.202 est la valeur pour z = 3 de la fonction ζ ( z ) de Riemann. Pour T > TC , l'équation
(30) n'a plus de solution et la seule solution de l'équation complète (28) définissant ∆ est nulle. Ces
variations de ∆ k (T ) sont peu modifiées pour des formes différentes de V (k , k ′) pourvu que ce
dernier soit négatif au voisinage de la surface de Fermi.

Nous venons de voir que pour T > TC , on a ∆ k = 0 pour toutes les valeurs de k : le métal a alors
un comportement normal. Par contre, pour T < TC , ∆ k est différent de zéro pour certaines valeurs
de k et le métal a un comportement supraconducteur comme nous le montrerons par la suite.

La température de changement de phase TC donnée en (37) permet l'évaluation du paramètre g


(31). Dans le cas de l'étain pour lequel on a Θ D ≅ 200 K et TC ≅ 3.7 K , ce paramètre vaut g =
0.24. Notons que si l'on avait choisi une épaisseur de la couche différente de ± kΘ D , on n'aurait
obtenu qu'une faible variation de la valeur de g (g = 0.21 pour une épaisseur ± kΘ D / 2 ). Ceci est dû
au fait que g intervient par le facteur exp(− 1 / g ) . Par ailleurs, lorsque l'on change d'isotope, les
propriétés électroniques restent inchangées alors que la température de Debye varie. En effet, les
fréquences des vibrations du réseau dépendent de la masse des atomes. Par exemple, pour la
branche acoustique ces fréquences varient comme M −1 / 2 . La théorie BCS permet donc d'interpréter
l'effet isotopique.

Modèle des deux fluides


Le grand potentiel Ω(T ,V , µ ) se calcule à partir de la fonction de partition grand canonique (22)
selon
Ω = − kT ln Ξ = −C − kT ∑ ln ξ k

[ )]
k

(
(39)
= −C + ∑ ε k′ − 2kT ln e
β Ek / 2 − β Ek / 2
+e
k

La constante C, définie en (13), se réduit à − ∆2 /V0 lorsque l'on explicite bk à l'aide de (25) et que
l'on utilise l'équation (26) définissant ∆ . Passant à la sommation continue, on obtient ainsi
g (ε )
(40) Ω =
∆2
V0
+∫
2
[
dε ε ′ − E − 2kT ln 1 − e − β E ( )]

Notons que le grand potentiel dépend explicitement de T, mais aussi implicitement par
l'intermédiaire de ∆ et de E = ε ′ 2 + ∆2 ( ) 1/ 2
.

Calculons ce grand potentiel au zéro absolu. On a :


∆2 g (ε )
(41) Ω 0 = 0 + ∫ [ε ′ − E ]dε
V0 2

Le domaine d'intégration peut être coupé en 3. Pour ε ′ ≡ ε − ε F supérieur à kΘ D , on a ∆ k = 0 et


donc E = ε ′ : la contribution correspondante est nulle. Pour ε ′ inférieur à − kΘ D , on a encore
∆ k = 0 et E = ε ′ = −ε ′ . On a ainsi
∆20 ε F − kΘ D g (ε F ) ε F + kΘ D
+∫ g (ε )ε ′dε + (ε ′ − E )dε
2 ∫ε F −kΘ D
Ω0 =
V0 0
(42)
∆20 ε F − kΘ D kΘ D
= +∫ g (ε )ε ′dε − g (ε F )∫ Edε ′
V0 0 0

En faisant apparaître le grand potentiel au zéro absolu d'un gaz d'électrons libres
εF
(43) Ω e 0 = U e 0 − Nµ = ∫ g (ε )ε ′dε
0
on peut écrire
∆20 kΘ D
(44) Ω 0 = Ω e 0 + − g (ε F )∫ (E − ε ′)dε ′
V0 0

En notant que l'on a


( )
(45) 2 ∫ x 2 + 1dx = x x 2 + 1 + ln x + x 2 + 1 ≅ x 2 + ln 2 x +
1
2
( x >> 1 )
et en faisant usage de l'expression (34), on a finalement
∆2 g (ε F )  2kΘ D 1 
Ω 0 = Ω e 0 + 0 − ∆20  ln + 
V0 2  ∆0 2
(46)
∆ 2
= Ω e 0 − 0 g (ε F )
4

Ce résultat montre que l'état supraconducteur est plus stable que l'état normal au zéro absolu.
Toutefois, en prenant ∆ 0 ~ kTC ~ 10 −3 eV et ε F ~ 5 eV et en calculant la différence Ω 0 − Ω e 0
ramenée à un électron, on obtient
∆2 g (ε F )
(47) 0 ~ 10 −7 eV
4 N

Nous voyons que cette différence est très petite devant Ω 0 / N ~ ε F , ce qui explique que la
supraconduction disparaisse lorsque les perturbations appliquées au système excèdent un certain
seuil.

Pour une température quelconque, un calcul identique au précédent permet d'écrire le grand
potentiel sous la forme Ω = Ω e 0 + Ω s + Ω n avec
g (ε F )  2 2kΘ D 1 
Ω s = − ∆2  − ln − 
2  V0 g (ε F ) ∆ 2
(48)
g (ε F )  ∆ 0 1 
= − ∆2  ln + 
2  ∆ 2
et

(
Ω n = −kT ∫ g (ε ) ln 1 + e − β E dε
0
)
(49) ∞
(
= −2kT ∫ g (ε ) ln 1 + e − β E

) EdE
E 2 − ∆2

Le terme Ω n correspondant au troisième terme de l'intégrale dans (40) peut s'interpréter comme
étant le grand potentiel d'un gaz d'excitations en nombre indéterminé obéissant à la statistique de
Fermi-Dirac, d'énergie E et dont la densité d'états, représenté dans la figure ci-dessous, a pour
expression
(50) G (E ) = 2 g (ε ) ≅ 2 g (ε F )
E E
E −∆
2 2
E − ∆2
2
Ces excitations, contribuant essentiellement pour E ≅ ∆ , correspondent en fait aux électrons des
paires de Cooper excitées vers l'état ψ +k .

On peut alors considérer le gaz d'électrons, par analogie au modèle des deux fluides de l'hélium
liquide, comme comprenant une composante "supraconductrice" de grand potentiel Ω s et une
composante "normale" de grand potentiel Ω n . Au zéro absolu, le grand potentiel Ω n (49) s'annule
et Ω n (48) a pour valeur − ∆20 g (ε F ) / 4
Soit
∆2
(51) Ω = Ω e 0 + Ω s + Ω n = Ω e 0 − 0 g (ε F )
4
résultat déjà trouvé en (46). Aux températures supérieures ou égales à TC , c'est le grand potentiel
Ω s qui s'annule et, comme on a alors = ε ′ , le grand potentiel total Ω = Ω e 0 + Ω n s'identifie au
grand potentiel d'un gaz d'électrons libres.

A une température donnée, l'énergie minimale nécessaire pour créer une excitation supplémentaire
est ∆(T ) . Comme ces excitations sont de type fermion, la conservation du moment cinétique total
entraîne qu'elles soient créées par paires. Il s'ensuit que l'énergie minimale nécessaire à l'excitation
du métal est égale à 2∆(T ) . Cette énergie correspond à la largeur E g (T ) de la bande interdite ou
gap. La courbe du gap pour l'étain montre que la théorie BCS reproduit de façon satisfaisante les
données expérimentales malgré la forme simplifiée (27) utilisée pour l'énergie d'interaction
V (k , k ′) . On voit enfin, d'après (34) et (37) que :
E g (0 ) ∆
(52) = 2 0 = 2π exp(− γ E ) = 3.53
kTC kTC
en très bon accord avec les résultats expérimentaux.

Fonctions thermodynamiques
Pour obtenir l'énergie libre du gaz d'électrons à partir du grand potentiel Ω , on doit tout d'abord
déterminer ε F en fonction de N et des autres variables, puis calculer F = Ω + Nε F . En fait, nous
avons vu que l'interaction attractive des électrons affecte peu la valeur du grand potentiel. Il s'ensuit
que ε F diffère très peu de l'énergie de Fermi au zéro absolu d'un gaz d'électrons libres. Par
conséquent, on peut écrire directement d'après (48)
g (ε F ) 2  ∆ 0 1 
(53) F (T , V , N ) = Fe 0 (V , N ) − ∆  ln

( )
+  − kT ∫ G (E ) ln 1 + e − β E dE
2  ∆ 2 ∆

Fe 0 étant l'énergie libre d'un gaz d'électrons libres au zéro absolu.

On en déduit alors, par exemple, l'énergie interne


∂ F
U = −T 2  
∂T T 
(54)
g (ε F ) 2  ∆ 0 1  ∞ G (E )dE
= Feo − ∆  ln + + ∫ E βE
2  ∆ 2  ∆ e +1
dans ce résultat, la dérivée ∆ ′(T ) disparaît car elle est multipliée par le facteur
∆ dε ′ 1
(55) ln 0 − ∫ =0
∆ E eβ E +1
nul en vertu des relations (33), (34). On voit ainsi apparaître la décomposition de l'énergie en trois
termes : le terme constant Fe 0 , l'énergie interne de la composante supraconductrice et l'énergie
interne de la composante normale. Notons que la composante supraconductrice a son énergie
interne identique à son énergie libre ce qui montre que son entropie est nulle et qu'elle est
parfaitement ordonnée. Ce fait est à rapprocher d'une propriété semblable de la composante
superfluide de l'hélium.

En utilisant la relation (54), on obtient pour la capacité calorifique :


CV =
∂U ∞
= ∫ G (E )dE
eβ E (
E 2 − ∆∆ ′T )
∂T ∆
(
eβ E +1
2
) kT 2
( )
(56)
∞ eβ E E 2 − ∆∆ ′T
= ∫ g (ε )dε
0
(
eβ E +1
2
) kT 2

Notons que la capacité calorifique d'un gaz d'électrons libres serait donnée par la même expression
avec ∆ = 0 et donc E → ε ′ = ε − µ .

Au voisinage du zéro absolu, ∆ ′ s'annule exponentiellement et le terme correspondant disparaît. De


plus, la contribution principale à l'intégrale (56) provenant de la région E ≅ ∆ 0 ou ε = ε F , on a
g (ε F ) ∞ −β E g (ε F )∆20 ∞
ε dε e − β E
kT 2 ∫0 ∫
(57) CV = d e E 2

kT 2 0
En remplaçant E par son expression approchée
ε ′2
(58) E = ∆20 + ε ′ 2 ≅ ∆ 0 +
2∆ 0
on obtient finalement
∆ 
3/ 2

(59) CV = 2π g (ε F )∆ 0 k  0  e −β ∆0
 kT 

Cette expression démontre le comportement exponentiel de la capacité calorifique observé au


voisinage du zéro absolu. Avec l'expression de la constante de capacité calorifique γ et la relation
(52) entre ∆ 0 et kTC on obtient
3/ 2
C T   T 
(60) V = 3.15 C  exp − 1.76 C 
γTC T   T 

Au voisinage de T / TC de l'ordre de 0.2, on peut remplacer (TC / T )


3/ 2
par l'expression
numériquement approchée 2.50 exp(− TC / T ) , d'où
CV  T 
(61) = 7.9 exp − 1.46 C  (TC / T ≅ 5)
γTC  T 
en bon accord avec les résultats de l'observation.

( )
Au passage de la température critique, le produit ∆∆ ′ = d ∆2 / 2 / dT subit une discontinuité qui,
d'après (38) présente pour T = TC un saut
β ε′
4π 2 ∞ e C
(62) ∆CV = k ∫ g (ε )dε
7ζ (3) 0 β ε′
(
e C +1
2
)
L'intégrand étant sensiblement non nul seulement au voisinage de ε F , on obtient
4π 2 2
(63) ∆CV = k TC g (ε F )
7ζ (3)
soit également
∆CV 12
(64) = = 1.43
γTC 7ζ (3)
valeur voisine de la valeur expérimentale pour la plupart des supraconducteurs.

Nous avons vu que le champ critique BC (T ) est relié aux énergies libres des phases normale et
supraconductrice en champ nul. L'énergie libre supraconductrice étant donnée par (53) et l'énergie
normale par la même expression dans laquelle on fait ∆ = 0 , on peut obtenir par un calcul
numérique la valeur de BC à toute température. Le calcul peut s'effectuer analytiquement au zéro
absolu et l'on a :
g (ε F )∆20
BC (0 ) =
V 2
(65)
2µ 0 4
soit
µ 0 g (ε F )
(66) BC (0 ) = ∆0
2 V

Cette relation est en général bien vérifiée : pour l'étain, avec BC (0 ) = 0.03 T et
g (ε F ) / V = 1.7 × 10 47 J −1 m −3 (valeur obtenue à partir de la constante γ de la capacité calorifique),
on obtient ∆ 0 / k = 5.7 K , valeur en accord avec l'autre prédiction (52) de la théorie BCS donnant
∆0 / k = 1.76TC = 6.6 . La variation du champ critique est très proche de la loi de Tuyn. L'accord est
satisfaisant pour la plupart des supraconducteurs. Notons qu'ici, comme pour la plupart de leurs
autres propriétés, le plomb et le mercure s'écartent légèrement des résultats de la théorie BCS : ceci
est lié au fait que g est voisin de 0.35 alors qu'il est de l'ordre de 0.2 pour les autres
supraconducteurs.
Propriétés électromagnétiques

Equation de London
Nous avons vu qu'en mécanique quantique, on associe à chaque particule, de charge e et de
fonction d'onde ψ 0 , une densité de courant

(67) j0 (r ) = − (
ψ 0 ∇ψ 0 − ψ 0 ∇ψ 0∗ )
ieh ∗
2m

En présence d'un champ électromagnétique de potentiel vecteur A(r ) , nous avons également vu
que l'expression du courant s'obtient par remplacement de − ih∇ par − ih∇ − eA dans (67), soit

(68) j(r ) = −
2m
(
ieh ∗
) e2
ψ ∇ψ − ψ∇ψ ∗ − ψ ∗ψA
m
ψ étant la fonction d'onde en présence de ce champ. Ces formulent se généralisent pour un gaz
d'électrons, ψ représentant la fonction d'onde des N électrons.

Dans le cas d'un métal normal, j0 est nul et, en présence d'un champ magnétique, les deux termes
de j, bien qu'importants, se compensent, ne laissant subsister que le courant associé au
diamagnétisme électronique. Dans le cas d'un métal supraconducteur, j0 est également nul en
l'absence de champ. Cependant, en présence d'un champ, l'existence d'un gap dans le spectre
énergétique entraîne que l'état des électrons est peu perturbé et que la fonction d'onde ψ reste très
voisine de ψ 0 . Il s'ensuit que la densité de courant prend la forme
e2 ∗ e2
(69) j(r ) = − ψ 0ψ 0 A = − n(r )A(r )
m m
où n(r ) est la densité locale d'électrons. Cette équation appelée équation de London, a été postulée
par F. et H. London (1935) avant sa démonstration dans le cadre de la théorie BCS.

Considérons maintenant le cas d'un champ magnétique statique pour lequel les équations de
Maxwell donnent
(70) rot B = µ 0 j et B = rot A

En éliminant j et A entre ces relations et l'équation de London, on obtient successivement en


éliminant j puis A :
µ e2n
(71) rot B = − 0 A
m
puis
1 m
(72) ∆B = 2 B avec λ L =
λL µ 0e 2 n

La solution de cette équation au voisinage d'une surface de séparation plane est de la forme :
−z / λ
(73) B = B 0 e L
où z est la coordonnée perpendiculaire à la surface et B 0 l'induction du champ appliqué. On en
déduit que le champ magnétique s'annule à l'intérieur du supraconducteur avec une longueur
caractéristique λ L appelée profondeur de pénétration de London. Cette profondeur de pénétration
est très faible (140 Å pour l'étain), on explique ainsi l'effet Meissner qui constate que le champ
magnétique est nul à l'intérieur des supraconducteurs.

Les résultats précédents sont valables au zéro absolu où les N électrons se trouvent dans l'état
fondamental. Aux autres températures, la contribution au courant j ne provient que de la
composante supraconductrice et on doit remplacer n par n s densité d'électrons supraconducteurs.
En particulier à la température critique pour laquelle on a n s = 0 , la profondeur de pénétration (72)
devient infinie et le champ pénètre dans toute la substance.

Longueur de cohérence
Le fait que le champ magnétique pénètre à la surface des supraconducteurs a été mis en évidence
par exemple sur des couches minces et la profondeur de pénétration λ en a été déduite. La
variation expérimentale de λ en fonction de la température peut être représentée par la loi
λ (0)
(74) λ =
[1 − (T / T ) ]
C
4 1/ 2

Toutefois λ (0 ) prend des valeurs généralement supérieures à la valeur théorique λ L (72) obtenue à
partir de l'équation de London. Ces valeurs sont d'autant plus grandes que la pureté du matériau est
grande.

On interprète ces faits en remarquant que l'équation de London (69) a été obtenue en supposant que
ψ a une expression ψ 0 indépendante du champ. En fait, si l'on tient compte de la faible variation
de ψ , l'équation de London (69) devient :
(75) j(r ) = − ∫ K (r − r ′)A(r ′)dr ′
où K (r − r ′) est une fonction déterminée par la théorie BCS, piquée en zéro et de largeur
hv
(76) ξ 0 = F
π∆ 0
appelée longueur de cohérence ( v F est la vitesse des électrons sur la surface de Fermi). Cette
équation non locale avait été introduite phénoménologiquement par A.B. Pippard.

Dans le cas où A varie lentement sur la distance ξ 0 , l'équation (75) se réduit à


d (β∆ )
(77) j(r ) = − A(r ) avec λ2 = λ2L
1
µ0λ 2
∆dβ

Cette équation est semblable à l'équation de London (69) mais conduit à une profondeur de
pénétration λ et non λ L . Les formes limites (35) et (38) de ∆ montrent que λ → λ L au zéro
absolu et que λ → ∞ au point critique, ce qui correspond à une pénétration complète du champ
magnétique.

Les expressions précédentes ne sont valables que si la profondeur de pénétration λ caractérisant la


variation du champ magnétique est grande devant la longueur de cohérence ξ 0 . Cependant, dans les
métaux, cette dernière est de l'ordre de 5 × 10 −7 m et est très supérieur à λ L : l'approximation (76)
n'est plus utilisable. En prenant la limite de l'équation (75) dans le cas où les variations de K sont
négligées ( ξ 0 >> λ ), la profondeur de pénétration est donnée par
λ (T )  ∆(T )  β∆(T )  
−1 / 3

(78) = tanh  
λ (0)  ∆ 0  2 
avec
λ (0)  3 ξ 0 
1/ 3

(79) = 
λL  2π λ L 

La loi précédente est numériquement très voisine de la loi empirique (74) et la valeur de λ (0 ) est
nettement supérieure à λ L en accord avec l'expérience.

Lorsque les métaux contiennent des impuretés ou des défauts, Pippard a proposé de remplacer la
longueur de cohérence ξ 0 par une longueur de cohérence ξ définie par
1 1 1
(80) = +
ξ ξ0 l
où l est le libre parcours moyen des électrons dans la phase normale. Ainsi, dans un métal
contenant beaucoup d'impuretés ou de défauts, on a ξ ≈ l << ξ 0 . Pour ces métaux impurs on se
trouve alors dans la condition ξ << λ et Pippard a proposé de conserver les équations (77) avec le
remplacement
1/ 2
ξ 
(81) λ → λ  0 
ξ 

Notons que la longueur de cohérence s'interprète dans la théorie BCS comme étant l'extension
spatiale d'une paire de Cooper. Cette extension étant de l'ordre de 10 3 Å , les différentes paires de
Cooper se recouvrent et sont cohérentes. Elles se comportent comme des bosons tous dans le même
état (la paire a un spin 0).
Courants persistants
De la même façon que l'on a obtenu la relation (72) pour un champ magnétique statique, en
éliminant B et A des relations (69), (70), on obtient
1
(82) ∆j = 2 j
λL

Cette relation montre qu'il peut exister un courant persistant en absence de champ électrique.
Notons que ce courant pénètre le supraconducteur de la même façon que le champ magnétique.

La démonstration générale de l'absence de résistance électrique dans la théorie BCS est complexe.
Nous nous contenterons de dire que, à partir des équations de Maxwell et de celle de London, on
peut obtenir pour un champ électrique statique la relation
dj ne 2
(83) = E
dt m
qui correspond au fait que chaque électron est accéléré sans résistance selon la loi
dv e
(84) =− E
dt m

On peut donner l'interprétation qualitative suivante de l'absence de résistance. Lorsque l'on


supprime la différence de potentiel dans un conducteur normal, le courant cesse car les électrons
subissent des chocs successifs qui les freinent. Dans un supraconducteur, par contre, les électrons
se déplacent sous la forme de paires de Cooper cohérentes. De ce fait, on ne pourrait diminuer le
courant que par le choc simultané de toutes les paires de Cooper, ce qui est hautement improbable.

Notons qu'aux températures autres que le zéro absolu, il faut tenir compte des deux composantes
électroniques supraconductrice et normale. La première ayant une conductivité électrique infinie, il
s'ensuit que l'ensemble du gaz électronique a une conductivité infinie. En ce qui concerne la
conductivité thermique, elle est proportionnelle, pour chacune des deux composantes, à la capacité
calorifique correspondante. Comme la capacité calorifique relative à la composante
supraconductrice tend exponentiellement vers zéro, cette composante ne conduit pas la chaleur ce
qui explique le comportement de la conductivité thermique.
VII.8. Quantification du flux
Lorsqu'une particule se trouve dans un certain état quantique, le module carré de sa fonction d'onde,
soit ψ (r ) , représente la densité de probabilité de la trouver au point r. Lorsqu'un grand nombre de
2

particules (bosons) se trouvent dans le même état quantique, nous avons vu que l'on peut considérer
ρ (r ) = N ψ (r ) comme la densité de particules au point r. La fonction Ψ = Nψ est alors une
2

fonction d'onde macroscopique obéissant à la même équation de Schrödinger que ψ . Une telle
fonction, introduite par Ginzburg et Landau (1950), peut décrire l'état supraconducteur, les bosons
étant les paires de Cooper. Elle est caractérisée par son module ρ et par sa phase θ dont la
cohérence s'étend sur des distances macroscopiques.

La densité de courant électrique associée à la fonction d'onde Ψ est donnée par l'équation de
continuité des probabilités, avec e  2e et m  2m (paires d'électrons). Elle a pour expression
eh  2e 
(1) j(r ) =  ∇θ − A  ρ
m h 

Dans la masse du supraconducteur où il n'y a pas de courant, on a alors


2e
(2) ∇θ = A
h
et, en calculant la circulation de chaque membre sur un circuit fermé, il vient
2e 2e
(3) ∫ ∇θ ⋅ dr = ∫ A ⋅ dr = Φ
h h
où Φ est le flux de l'induction magnétique à travers le circuit. Lorsque l'échantillon est simplement
connexe (pièce sans trou), la circulation de ∇θ est nulle pour tout circuit au sein du
supraconducteur et l'on retrouve le fait que le champ est nul en tout point de la masse.

Dans le cas d'échantillons de forme multiplement connexe (cylindre creux ou anneau, par exemple),
pour un circuit entourant le trou, la circulation de la phase doit être égale à 2nπ (n entier) pour que
Ψ soit monovaluée (on retrouve sa valeur après un tour complet autour du trou à un multiple entier
de 2pi près pour la phase). On en déduit donc que le flux Φ est quantifié selon la loi :
h h
(4) Φ = ∫ B ⋅ dS = n = nΦ 0 (avec Φ 0 = ).
2e 2e

Cette quantification avait été suggérée par F. London dès 1950 mais sans le facteur 2 lié à
l'existence des paires de Cooper. Le quantum de flux h / 2e a la valeur très faible
Φ 0 = 2.07 × 10 −15 Wb , correspondant par exemple à une induction de 2.5 × 10 −5 T (0.25 gauss)
traversant un cercle de 10 microns de diamètre. La mise en évidence de cette quantification
extrêmement délicate, n'a été réalisée qu'en 1961 (figure ci-dessous).

Dans cette expérience, le tout petit cylindre de supraconducteur a été réalisé par dépôt
électrolytique d'une mince couche d'étain sur un fil de cuivre d'un centimètre de longueur et de
1.3 × 10 −3 cm de diamètre. L'étain devient supraconducteur au-dessous de 3.8 K, tandis que le
cuivre reste normal. Le fil était placé dans un faible champ magnétique contrôlé et la température
était abaissée jusqu'à ce que l'étain soit devenu supraconducteur. La source externe de champ était
alors supprimée, le cylindre gardant un moment magnétique (voir ci-dessous). Le moment
magnétique du petit cylindre a été mesuré en faisant osciller le fil verticalement (comme l'aiguille
sur une machine à coudre mais à un rythme de 100 cycles par seconde) à l'intérieur de deux petites
bobines situées vers les extrémités du cylindre d'étain. Le voltage induit sur les bobines est alors
une mesure du moment magnétique.

Lorsqu'ils ont fait cette expérience, Deaver et Fairbank ont trouvé que le flux était quantifié mais
que l'unité de base n'était que la moitié de ce qu'avait prédit London. Doll et Nabauer ont obtenu le
même résultat. Ce résultat a d'abord paru très mystérieux avant la théorie BCS et ses paires de
Cooper.

Pour de telles topologies, l'effet Meissner se manifeste de façon particulière. Considérons pour cela
un cylindre creux (figure ci-dessous) et faisons le passer dans les états successifs a, d, c, b
mentionnés sur le diagramme des phases.
Dans l'état d, le cylindre n'est pas supraconducteur et le champ à l'intérieur du cylindre est égal au
champ appliqué d'induction B0 . Dans l'état c obtenu par refroidissement existent des courants
superficiels permanents : les courants sur la surface extérieure du cylindre créent à l'intérieur de
cette surface un champ compensant exactement le champ extérieur. La création de ce champ
nécessite cependant une dépense d'énergie proportionnelle au volume. Cette énergie est minimisée
par la création de courants sur la surface intérieure du cylindre qui permettent au champ appliqué
de se maintenir dans le creux. Toutefois ce champ a une valeur légèrement différente du champ
appliqué, en raison de la quantification (4).

Lorsque l'on annule le champ appliqué (état b) les courants extérieurs disparaissent mais les
courants intérieurs persistent. Le cylindre est alors dans un état métastable, l'état stable
correspondant à un champ intérieur nul. En effet, le champ intérieur étant quantifié par
l'intermédiaire de son flux, il ne peut pas être diminué de façon continue. Les fluctuations ne sont
pas suffisantes pour provoquer les sauts nécessaires.

Si on considère un circuit trop proche de la surface (en particulier dans un ruban mince où j peut
être différent de zéro), ce n'est pas le flux magnétique Φ qui est quantifié mais une grandeur
appelée "fluxoïde" qui se ramène à Φ pour j = 0.

Si l'on effectue la suite inverse des transformations (parcours a, b, c, d) les états a et d sont
identiques. Par contre, en b, le cylindre est dans son état stable (champ intérieur et courants nuls). Il
s'ensuit qu'en c (champ appliqué B0 ), le champ à l'intérieur du cylindre reste nul en raison de la
quantification de son flux. Cet état est alors métastable, l'état stable correspondant à la présence du
champ à l'intérieur du cylindre.
VII.9. La dynamique de la supraconductivité
Jusqu'à présent, nous avons introduit l'expression de ψ que dans des équations concernant la
densité de charge et le courant. Si nous l'introduisons dans l'équation de Schrödinger complète,
nous obtenons des équations pour ρ et θ . Regardons ce qui en ressort : cela en vaut sûrement la
peine car nous avons un "fluide" de paires d'électrons ayant une densité de charge ρ et une phase
θ assez mystérieuse d'un point de vue macroscopique. Essayons donc de voir quelle genre
d'équation on obtient pour un tel "fluide". Nous portons donc la fonction d'onde dans l'équation de
Schrödinger en nous souvenant que ρ et θ sont des fonctions réelles de x, y et z. Si nous séparons
les parties réelles et imaginaires, nous obtenons alors deux équations. Nous pouvons les écrire sous
une forme concise en utilisant
h e
(1) ∇θ − A = v
m m

L'une des équations que l'on obtient ainsi est


∂ρ
(2) = ∇ ⋅ ρv
∂t

Comme ρv est en premier lieu j, nous retrouvons une fois de plus l'équation de continuité. On
obtient une autre équation qui dit comment varie θ . C'est

(3) h
∂θ
∂t
m
= − v 2 + eφ −
h 2  1 2

2m  ρ
∇ ( )
ρ


2 

On reconnaît là, en hydrodynamique, les équations du mouvement d'un fluide chargé


électriquement si l'on identifie hθ au "potentiel de vitesse". Néanmoins, le dernier terme, qui serait
l'énergie de compression du fluide, dépend d'une étrange manière de la densité ρ . De toute façon,
l'équation nous dit que le taux de changement de la quantité hθ est donné par le terme d'énergie
cinétique, 1 / 2mv 2 , plus un terme d'énergie potentielle, eφ , et encore un terme supplémentaire, qui
contient le facteur h 2 et que nous pourrions appeler une "énergie quantique". Nous avons vu qu'à
l'intérieur d'un supraconducteur, les forces électrostatiques imposent à ρ de rester très uniforme.
Ce terme quantique peut donc très certainement être négligé dans toute application pratique, pourvu
que l'on ait une seule région de supraconduction. Si nous avons deux supraconducteurs jointifs (ou
toute autre situation telle que la valeur de ρ puisse changer rapidement), ce terme peut devenir
important.

En prenant le gradient de toute l'équation (3) et en exprimant ∇θ en termes de A et v à l'aide de


(1), on obtient

(4)
∂v e 
=  − ∇φ −
∂t m 
∂A 
 − v × (∇ × v ) − (v × ∇ )v − ∇
∂t  2m  ρ
( )
h 2  1 2
∇ ρ 


Que signifie cette équation ? D'abord, souvenez-vous que


∂A
(5) − ∇φ − =E
∂t

Notez ensuite que si l'on prend le rotationnel de (1), on obtient


e
(6) ∇ × v = − ∇ × A
m
car le rotationnel d'un gradient est toujours zéro. Mais, ∇ × A est le champ magnétique B, ainsi le
premier des deux termes peut s'écrire
(7) (E + v × B )
e
m

Enfin, vous devez comprendre que ∂v / ∂t représente le taux de changement de la vitesse du fluide
en un point. Si vous fixez votre attention sur une particule donnée, son accélération est la dérivée
totale de v (c'est que qu'on appelle par parfois en dynamique des fluides "l'accélération en
comouvement") qui est reliée à ∂v / ∂t par
∂v
+ (v ⋅ ∇ )v
dv
(8) =
dt com. ∂t
Ce terme supplémentaire se retrouve aussi comme troisième et quatrième terme de droite dans (4).
En le faisant passer sur la gauche, on peut écrire (4) de la manière suivante :
h2  1 2 
= e(E + v × B ) − ∇ 
dv
(9) m ∇ ρ
dt com. 2  ρ 

D'après l'équation (6), nous avons aussi que


e
(10) ∇ × v = − B
m

Ces deux équations sont les deux équations du mouvement d'un fluide d'électrons. La première
équation est simplement la loi de Newton pour un fluide chargé, placé dans un champ magnétique.
Elle dit que l'accélération de chaque particule du fluide provient de la force de Lorentz ordinaire
(E + v × B ) , plus une force supplémentaire qui est le gradient d'un certain potentiel quantique de
nature quasi mystique : c'est une force qui n'est pas très grande, sauf à la jonction entre deux
supraconducteurs. La seconde équation dit que le fluide est "idéal", puisque le rotationnel de v a
une divergence nulle (la divergence de B est toujours nulle). Il en résulte que la vitesse peut
s'exprimer en terme d'un potentiel de vitesse. On écrit d'ordinaire ∇ × v = 0 pour un fluide idéal,
mais pour un fluide idéal chargé et placé dans un champ magnétique cette relation est remplacée
par (10).

Ainsi, l'équation de Schrödinger pour les paires d'électrons dans un supraconducteur nous donne les
équations du mouvement d'un fluide idéal chargé. Pour résoudre n'importe quel problème
concernant les supraconducteurs, vous prenez ces équations sur les fluides (ou les deux équations
équivalentes (2) et (3)) et vous les combinez avec les équations de Maxwell pour obtenir les
champs (les charges et les courants que vous utilisez pour obtenir les champs doivent bien entendu
inclure les contributions du supraconducteur ainsi que des sources externes).

Incidemment, l'équation (9) n'est pas tout à fait correcte. Elle devrait avoir un terme de plus faisant
intervenir la densité. Ce nouveau terme ne dépend pas de la mécanique quantique, il provient de
l'énergie ordinaire qui est associée aux variations de densité. Tout comme dans un fluide ordinaire,
il doit y avoir une densité d'énergie potentielle proportionnelle au carré de la déviation de ρ par
rapport à ρ 0 , la densité au repos (laquelle est égale, dans notre cas, à la densité de charge dans le
réseau cristallin). Puisqu'il doit y avoir des forces proportionnelles au gradient de cette énergie, il
faut qu'il y ait dans l'équation (9) un terme de la forme : (const )∇( ρ − ρ 0 ) . Ce terme n'est pas
2

apparu au cours du calcul parce qu'il vient des interactions entre particules que nous avons
négligées en utilisant une approximation de particules indépendantes. C'est pourtant précisément à
cette force que nous nous sommes référés en disant que les forces électrostatiques tendent à
maintenir la densité presque constante à l'intérieur du supraconducteur.
VII.10. Supraconducteurs de type II

Etude expérimentale
Le comportement décrit précédemment est suivi seulement par certains supraconducteurs (étain,
plomb, etc.) appelés supraconducteurs de type I ou supraconducteurs doux (en raison de leurs
propriétés plastiques). D'autres substances (éléments de transition, composés et alliages) ont un
comportement plus complexe : ce sont des supraconducteurs de type II ou supraconducteurs durs.
Elles se caractérisent par le fait que l'effet Meissner se produit parfaitement pour une induction
appliquée inférieure à une valeur critique BC1 (T ) et de façon imparfaite entre cette valeur et
l'induction critique BC 2 (T ) pour laquelle la substance redevient normale. Cette propriété se
manifeste par le fait que le moment magnétique M est donné par la relation des supraconducteurs
de type I pour B0 < BC1 et diminue progressivement à partir de BC1 pour s'annuler en BC 2 (figure
ci-dessous).
Au-dessous de BC1 (T ) la substance se comporte comme un supraconducteur de type I. Au-dessus
de BC 2 la substance est normale. Entre BC1 et BC 2 le supraconducteur est dans un état appelé
mixte (figure ci-dessous).

L'intérêt des supraconducteurs de type II provient du fait que, BC 2 pouvant atteindre des valeurs
très importantes (plusieurs teslas), ils présentent une résistance nulle en champ magnétique élevé.
Ce sont des matériaux de choix pour la réalisation des aimants supraconducteurs.

Etude de l'état mixte


Lorsqu'un cylindre de substance supraconductrice de type II passe dans l'état mixte par élévation du
champ appliqué B0 , il se crée progressivement des filaments de phase normale dans lesquels le
champ magnétique n'est pas nul. Ces filaments sont dus au fait que la profondeur de pénétration λ
du champ magnétique est supérieure à la longueur de cohérence. Comme nous allons le voir, il en
résulte l'existence d'une énergie superficielle négative à la séparation des deux phases qui favorise
la création des filaments.

Considérons la variation spatiale des énergies libres volumiques électroniques f e et magnétique


f m au voisinage de la surface de séparation entre les phases normales n et supraconductrice s
(figure ci-dessous).

Par suite de la création des paires, l'énergie libre électronique de la phase supraconductrice est
inférieure à celle de la phase normale, la variation s'effectuant à partir de la surface de séparation,
sur une distance de l'ordre de ξ caractérisant la taille des paires de Cooper. L'énergie libre
magnétique propre à la substance est nulle dans la phase normale et a pour valeur B02 / 2 µ 0 dans la
phase supraconductrice car les courants superficiels créent l'induction − B 0 dans le
supraconducteur. Cette énergie s'établit sur une distance de l'ordre de λ caractérisant l'épaisseur de
la couche des courants. Deux cas se présentent selon les valeurs relatives de λ et ξ .

Lorsque l'on a λ << ξ (figure (a) ci-dessus), l'énergie libre volumique présente un excès au
voisinage de la surface. Ceci n'est pas favorable à la coexistence des deux phases. Cette situation
correspond aux supraconducteurs de type I. Au contraire, lorsque l'on a λ >> ξ (figure (b) ci-
dessus), l'énergie libre présente un défaut au voisinage de la surface et les deux phases peuvent
coexister : c'est le cas des supraconducteurs de type II. Il se forme alors des filaments d'axe
parallèle à l'induction B0 dans lesquels la densité des paires de Cooper, nulle sur l'axe, retourne à la
valeur d'équilibre à une distance de l'ordre de ξ . Le champ magnétique, créé par tourbillon (vortex)
de courants supraconducteurs de densité j (figure (a) ci-dessous), a pour induction B0 sur l'axe et
s'annule à une distance de l'ordre de λ .
Ces filaments et leur arrangement (figure (b) ci-dessus) ont pu être observés expérimentalement
(saupoudrage magnétique, diffraction de neutrons) et la mesure de leur densité a permis de vérifier
que chaque vortex correspond à un quantum de flux h / 2e . La répartition des vortex est
hexagonale. Lorsque l'échantillon présente des défauts, les vortex s'ancrent sur les impuretés ou les
imperfections. A mesure que le champ extérieur croît à partir de BC1 , il se crée de nouveaux vortex
et, lorsque pour un champ BC 2 , le réseau de vortex a une densité telle que les interstices
supraconducteurs se réduisent à des dimensions de l'ordre de ξ , la phase supraconductrice disparaît
et tout le cylindre est dans l'état normal.

Notons que ces phénomènes présentent une analogie étroite avec ceux qui se produisent dans
l'hélium liquide et ont permis des progrès simultanés dans ces deux domaines.

Aimants supraconducteurs
L'intérêt des champs magnétiques intenses en physique est très grand. Jusqu'à 1 T on utilise les
électroaimants conventionnels constitués d'enroulements de fils de cuivre autour de noyaux de fer.
Pour des champs plus élevés, on utilise des solénoïdes constitués d'empilements de disques de
cuivre évidés au centre (bobines de Bitter). On arrive ainsi jusqu'à des champs de 30 T dans des
volumes de quelques dizaines de centimètres cubes. Pour produire de tels champs, il est nécessaire
de faire circuler des courants de plusieurs milliers d'ampères produisant de l'ordre d'un mégawatt
par effet Joule. C'est ce dégagement de chaleur, éliminée par des courants d'eau, qui limite le
champ maximum atteint. Notons cependant que ces techniques permettent d'obtenir plus de 50 T,
pendant des durées de 10 ms (champs pulsés).

La description précédente montre l'intérêt d'utiliser des corps supraconducteurs pour fabriquer des
électroaimants sans effet Joule. Cependant les champs atteints (~20 T) sont limités par l'existence
du champ critique. Dans la pratique on utilise des alliages supraconducteurs (type II) sous forme de
fils composés de brins très fins (d ~ 30 microns) d'alliages de niobium noyés dans une matrice de
cuivre ou d'aluminium. Cette configuration est dictée par le fait qu'un courant supraconducteur
créant une induction de l'ordre de 10 T correspond à une énergie magnétique volumique stockée de
40 J par centimètre cube : un passage local et temporaire à l'état normal libérerait de l'énergie par
effet Joule ce qui, par une réaction en chaîne, endommagerait gravement le dispositif. La masse de
cuivre plus conductrice que le supraconducteur dans l'état normal modère les conséquences de
l'effet Joule et l'emploi de fils fins réduit considérablement l'apparition locale de résistance. Cette
résistance apparaît dans des fils plus gros lorsque les vortex, soumis à une force magnétique,
sautent d'une position d'ancrage à une autre.

Les champs magnétiques continus les plus intenses (~40 T) sont réalisés par des électroaimants
hybrides constitués par un solénoïde supraconducteur (~10 T) à l'intérieur duquel est placé une
bobine de Bitter (~30 T).

Supraconductivité à haute température


L'intérêt technologique des supraconducteurs est évident. L'utilisation de ces substances est
toutefois limité par le fait qu'elles demandent des moyens cryogéniques importants. On cherche
donc constamment des substances de température critique aussi élevée que possible. Depuis la
découverte de Kamerlingh Onnes ( TC = 4.15 K pour le mercure), la plus haute température critique
observée a constamment progressé jusqu'en 1973 ( TC = 23.2 K pour l'alliage Nb3Ge). Les
recherches portaient alors sur des composés métalliques et la température atteinte était voisine d'un
maximum théorique estimé à 25-30 K.

A partir des années 70 on a recherché la supraconductivité dans des composés organiques


conducteurs. Dans des composés moléculaires, les électrons délocalisés de molécules organiques
planes se propagent le long de leur axe d'empilement. La température critique atteinte avec de tels
composés n'a pas dépassé 10 K ( TC = 8.1 K en 1985).

Parallèlement, la supraconductivité d'oxydes doubles de type pérovskite était étudiée (par exemple
SrTiO3− x avec TC = 0.3 K en 1967). En 1986, on obtenait avec l'oxyde double La2CuO4 dopé aux
ions Ba 2+ remplaçant des ions La 3+ , un température critique record supérieure à 30K, et pour la
première fois en 1987, avec le composé YBa2 Cu 3O7− x désigné par Y-Ba-Cu-O, une température
critique, TC = 92 K , supérieure à la température d'ébullition de l'azote. Dans ces composés les
électrons de conduction circulent dans les réseaux plans d'ion Cu et O occasionnant des
changements de Valence Cu 2+ − Cu 3+ . On a vérifié que ces composés présentent les mêmes
propriétés que les supraconducteurs classiques : effet Meissner, quantification du flux, gap. Ces
supraconducteurs de type II présentent l'avantage supplémentaire d'avoir des champs critiques BC 2
de l'ordre de plusieurs dizaines de teslas. Par contre, ce sont des céramiques dont le travail
mécanique est difficile en particulier pour l'obtention de fils ou de rubans.

Des recherches intenses ont lieu sur ces supraconducteurs actuellement. Autant pour battre les
records de température critique, qui tombent régulièrement, que pour améliorer leurs propriétés
mécaniques ou pour comprendre les mécanismes de supraconductivité dans ces substances qui
restent encore mal compris. Non seulement la température théorique maximale est largement
dépassée mais on a même découvert des composés céramiques de ce type, supraconducteurs,
contenant du fer alors que cet atome, magnétique, était considéré comme un véritable poison pour
les supraconducteurs. Nul doute que les recherches nous réservent encore bien des surprises avec
un espoir secret d'atteindre un jour des températures critiques de l'ordre de la température ambiante.
VII.11. La jonction Josephson

Effet tunnel électronique


Lorsque deux conducteurs sont séparés par une couche très fine de substance non conductrice
(oxyde d'un des métaux) (figure ci-dessous), les électrons peuvent traverser la couche isolante par
effet tunnel et les niveaux de Fermi des deux métaux s'égalisent.

L'application d'une différence de potentiel augmente le potentiel chimique d'un métal par rapport à
l'autre et provoque l'apparition d'un courant obéissant à la loi d'Ohm (figure ci-dessous).
Lorsque l'un des métaux est supraconducteur et la température très inférieure à TC , aucun courant
ne passe tant que la différence de potentiel V est inférieure à une valeur telle que eV = ∆(T ) ≅ ∆ 0 ,
où 2∆ est le gap du supraconducteur. Aux températures plus élevées, l'apparition du courant se fait
plus progressivement (figure ci-dessus). Ce s'explique par le fait que les niveaux électroniques des
deux métaux ont la configuration de la figure ci-dessous.

Cet effet tunnel dit normal - supraconducteur permet la détermination expérimentale du gap.
Lorsque les deux métaux sont supraconducteurs et la température très inférieure aux températures
critiques aucun courant ne passe tant que la différence de potentiel V est inférieure à une valeur
telle que eV = ∆ 1 + ∆ 2 (figure ci-dessous).

Aux températures plus élevées, les phénomènes sont plus complexes et il se produit une
discontinuité à eV = ∆ 1 − ∆ 2 avec inversion de pente dans la courbe caractéristique I(V)
(résistance négative) (figure ci-dessous).
L'allure de la caractéristique est due à la superposition de plusieurs mécanismes : effet tunnel des
électrons et des trous, grandes densités d'états pour certaines valeurs de l'énergie. Elle s'interprète
bien par la théorie BCS.
Effets Josephson

Effet Josephson continu


B.D. Josephson (1962) a montré que, lorsqu'un circuit supraconducteur est interrompu par une très
fine tranche isolante (~10 Å), un courant persistant de paires de Cooper peut se propager, par effet
tunnel, à travers la jonction sans qu'il existe de différence de potentiel de part et d'autre de cette
jonction. Ce courant ne peut cependant excéder une valeur limite I 0 inférieure au milliampère,
donnée au zéro absolu par I 0 = π∆ 0 / 2eR , R étant la résistance de la jonction pour un courant
normal. En utilisant la théorie de Ginzburg - Landau, on montre que le courant et sa densité sont
liés à la différence de phase φ ≡ ∆θ de l'onde Ψ des paires de Cooper aux bornes de la jonction
par les relations :
(1) I = I 0 sin φ et j = j 0 sin φ
la phase φ s'ajuste à la valeur du courant imposé.

Pour faire l'analyse de ces jonctions, nous appellerons ψ 1 , l'amplitude pour trouver une paire de
Cooper d'un coté et ψ 2 celle pour le trouver de l'autre coté. Dans l'état de supraconduction, la
fonction d'onde ψ 1 est la fonction d'onde commune à toutes les paires du coté 1 et ψ 2 est la
fonction d'onde correspondante pour l'autre coté.

Prenons une situation très simple dans laquelle il y a le même matériau des deux côtés, de sorte que
la jonction est symétrique et simple. Nous considérons une température proche de 0 K. Les deux
amplitudes doivent être reliées de la manière suivante :
∂ψ 1
ih = U 1ψ 1 + Kψ 2
∂t
(2)
∂ψ 2
ih = U 2ψ 2 + Kψ 1
∂t

La constante K est une caractéristique de la jonction. Si K était nul, ces deux équations décriraient
simplement l'état d'énergie le plus bas, d'énergie U, de chaque supraconducteur. Mais il y a un
couplage entre les deux côtés, du fait de l'amplitude K de transfert vers l'une ou l'autre région (K
n'est autre que l'amplitude de "flip-flop" qu'a un système à deux états pour basculer d'un état à
l'autre). Si les deux côtés sont identiques, U 1 doit être égal à U 2 et nous pouvons les éliminer (en
fixant le zéro d'énergie à leur valeur commune). Mais supposez que nous réunissions maintenant les
deux régions supraconductrices aux deux électrodes d'une batterie, créant ainsi une différence de
potentiel V à travers la jonction. Nous avons alors U 1 − U 2 = 2eV (le chiffre 2 vient de la paire de
Cooper). Pour faciliter les calculs, on peut définir le zéro d'énergie à mi-chemin entre U 1 et U 2 .
Les deux équations sont alors
∂ψ 1
ih = eVψ 1 + Kψ 2
∂t
(3)
∂ψ 2
ih = −eVψ 2 + Kψ 1
∂t

Ce sont les équations standards pour deux états quantiques couplés. Cette fois nous allons analyser
ces équations d'une autre manière. Faisons les substitutions

ψ 1 = ρ1 e 1
(4) iθ
ψ 2 = ρ2 e 2
où θ 1 et θ 2 sont les phases pour chacun des côtés de la jonction et ρ1 et ρ 2 sont les densités
d'électrons. Souvenez-vous qu'en pratique, ρ1 et ρ 2 sont presque identiques, ils sont l'un et l'autre
voisins de ρ 0 la densité normale d'électrons dans le matériau supraconducteur. Si maintenant vous
portez ces expressions de ψ 1 et ψ 2 dans (3), vous obtenez, en séparant parties réelles et
imaginaires, quatre équations. En posant pour simplifier φ = θ 2 − θ 1 , nous obtenons
2 2
ρ& 1 = + K ρ 2 ρ1 sin φ ρ& 2 = − K ρ 2 ρ1 sin φ
h h
(5)
K ρ eV K ρ1 eV
θ&1 = + 2
cos φ − θ&2 = + cos φ +
h ρ1 h h ρ2 h
Les deux premières équations nous disent que ρ& 1 = − ρ& 2 . Mais comme ρ1 et ρ 2 sont constants, on
pourrait penser que ces deux dérivées doivent être nulles. Pas tout à fait. Ces équations ne racontent
pas toute l'histoire. Elles nous disent ce que seraient ρ& 1 et ρ& 2 s'il n'y avait pas des forces
électriques supplémentaires, dues à ce que le fluide d'électrons ne compense pas exactement les
ions positifs du voisinage. Ces équations nous disent comment les densités se mettraient à changer.
Elles décrivent donc le type de courant qui s'amorcerait. Ce courant, disons celui qui va du coté 1
au coté 2, serait simplement ρ& 1 (ou - ρ& 2 ), soit
2K
(6) I = ρ1 ρ 2 sin φ
h

Un tel courant aurait vite fait de charger le coté 2 si nous n'avions pas oublié que les deux côtés
sont reliés par des fils à une batterie. Ce courant qui s'établit ne va pas charger la région 2 (ou
décharger la région 1), car des courants vont circuler de manière à maintenir un potentiel constant.
Ces courants provenant de la batterie n'ont pas été inclus dans nos équations En fait, quand on en
tient compte, ρ1 et ρ 2 ne changent pas et c'est encore (6) qui détermine le courant au travers de la
jonction.

Puisque ρ1 et ρ 2 restent constant et voisins de ρ 0 , posons I 0 = 2 Kρ 0 / h et écrivons


(7) I = I 0 sin φ

Nous avons obtenu la relation (1).

Les deux autres équations (5) nous renseignent sur θ 1 et θ 2 . En faisant la différence, nous obtenons
2eV
(8) φ& = θ&2 − θ&1 =
h

Nous pouvons écrire


(9) φ (t ) = φ 0 + ∫ V (t )dt
2e
h
où φ 0 est la valeur de φ en t = 0.
Si l'on met un voltage continu aux bornes de la jonction, V0 , l'argument du sinus devient
φ 0 + (2e / h )V0 t . Comme h est un nombre très petit (dans l'échelle usuelle des temps et voltage), le
sinus aurait une oscillation assez rapide et le courant global se réduira à zéro (en fait, comme la
température n'est pas nulle, vous aurez un faible courant dû à la conduction des électrons
"normaux"). Par contre, si vous avez un voltage nul à travers la jonction vous pouvez obtenir un
courant. En l'absence de voltage, le courant peut prendre n'importe quelle valeur entre + I 0 et − I 0
(c'est φ 0 qui décidera de la valeur du courant).

Nous retrouvons ainsi les comportements observés.

Lorsqu'un champ magnétique est appliqué dans la région de la jonction, la différence de phase φ
entre deux points 1 et 2 de part et d'autre de la jonction dépend de la position selon l'expression
2e 2
(10) φ = φ 0 − ∫ A ⋅ dl
h 1
où A = B 0 × r / 2 est le potentiel vecteur. Il en résulte que la densité de courant donnée dans (1)
varie d'un point à l'autre de la jonction, pouvant même changer de signe. Dans le cas d'une jonction
à section rectangulaire (figure ci-dessous) de cotés L (Ox) et L' (Oy) et d'épaisseur d (Oz) (compte
tenu de la profondeur de pénétration de part et d'autre de la jonction) et d'une induction B0 dirigée
selon Oy, la densité de courant ne dépend que de l'abscisse x et vaut
I  
(11) j ( x ) = 0 sin φ −
2ed
B0 x 
LL ′  h 
Le courant total, obtenu par intégration de j ( x ) , a pour valeur limite :
sin (πΦ / Φ 0 )
(12) I 0 (B0 ) = I 0
πΦ / Φ 0
où Φ 0 est le quantum de flux et Φ = LdB0 . Cet effet, semblable à celui de la diffraction par une
fente, est représenté sur la figure ci-dessus.
Dans le cas où le circuit supraconducteur présente deux jonctions identiques en parallèle, l'intensité
totale résulte de l'interférence des deux courants dérivés. La différence de phase entre les deux
courants est immédiatement donnée par Φ T , le flux magnétique traversant la zone entre les deux
jonctions (figure ci-dessous).
On obtient donc
sin (πΦ / Φ 0 )
(13) I 0 (B0 ) = I 0 cos(πΦ T / Φ 0 )
πΦ / Φ 0

Cette intensité maximum présente une double périodicité en B0 , la période relative à Φ T pouvant
être rendue nettement inférieure à celle relative à Φ . Un tel dispositif peut être rendu sensible à des
variations d'induction de l'ordre de 10 −10 T , ce qui en fait un instrument idéal de mesure des
champs magnétiques faibles.

Effet Josephson alternatif


Josephson a prédit également que l'application d'une différence de potentiel continue aux bornes
d'une jonction entraîne l'apparition d'un courant alternatif de paires. Comme nous l'avons vu plus
haut avec la variation de la phase, sa fréquence vaut
2e
(14) ν = V
h
et d'amplitude I 0 .

Appliquons un léger voltage alternatif en plus du voltage continu. Soit


(15) V = V0 + v cos ωt
où v << V. φ est alors
2e 2e v
(16) φ 0 + V0 t + sin ωt
h h ω

D'autre part, pour ∆x petit,


(17) sin (x + ∆x ) ≈ sin x + ∆x cos x

En utilisant cette approximation pour sin φ , on obtient


  2e  2e v  2e  
(18) I = I 0 sin  φ 0 + V0 t  + sin ωt cos φ 0 + V0 t 
  h  h ω  h 
Le premier terme est nul en moyenne, mais le second ne l'est pas si
2e
(19) ω = V0
h

Plus généralement, sans l'approximation sur le sinus, il apparaît de nombreuses harmoniques de


fréquences ν ± nω / 2π . Il s'ensuit que, lorsque V prend les valeurs Vn = nhω / 4πe , il apparaît un
courant continu. La courbe caractéristique I (V ) présente alors une série de marches (ou paliers) de
largeur ∆V = hω / 4πe (figure ci-dessous).
La tension alternative est obtenue en général par irradiation de micro-ondes (fréquence ~ 10 GHz)
correspondant à un quantum d'environ 20 µ V .

Applications
Les effets Josephson sont à la base d'un grand nombre de dispositifs métrologiques permettant une
précision considérable. Ils sont utilisés en métrologie et dans les laboratoires.

Un SQUID (superconducting quantum interference device) utilise la très grande sensibilité à


l'induction magnétique B0 du courant I 0 (B0 ) (13) dans l'effet Josephson continu à deux jonctions
pour mesurer des variations de flux extrêmement faibles ( δΦ T ~ 10 −18 Wb correspondant à
δB ~ 10 −11 T pour une surface entre jonctions de 0.1 centimètre carré). Une précision encore plus
grande ( δΦ T ~ 10 −21 Wb ) peut être obtenue avec une seule jonction, par couplage à des circuits
résonnants (SQUID alternatif). Ces dispositifs sont, par exemple, utilisé en
magnétoencéphalographie pour mesurer les champs magnétiques très faibles produits par les
impulsions nerveuses.

Le phénomène des marches de courant dans la caractéristique I(V) d'une jonction en présence
d'ondes électromagnétique de fréquence ν 0 est utilisé pour des mesures extrêmement précises de
différence de potentiel par la relation Vn = nhν 0 / 2e . La limitation provient de la précision sur le
rapport e / h ( ~ 6 × 10 −6 ). L'utilisation de piles normalisées permet inversement de mesurer le
rapport e / h .

Les effets Josephson sont également utilisés pour la mesure de faibles tensions ( 10 −15 V ), pour la
détection des micro-ondes (jusqu'à 10 −10 W dans la gamme de 5 à 1000 GHz), pour les mémoires
d'ordinateurs (commutations en ~ 10 −10 s , consommant ~ 10 −18 J ).
Exercices
1. Nous avons vu qu'un courant continu peut circuler à travers une jonction Josephson si l'on
n'applique aucune tension aux bornes de la jonction, alors que si l'on applique une tension, se
courant s'annule.

Ce comportement quelque peu paradoxal est de facto celui d'un inverseur (circuit logique).

Pouvez-vous imaginer un circuit inverseur de tension utilisant une jonction Josephson ? C'est-à-
dire un circuit admettant une tension 0 ou V à l'entrée et donnant en sortie, respectivement V ou
0.

Pouvez-vous imaginer une porte NAND ? Un circuit donnant une tension sortie si aucune
tension n'est appliquée à deux entrées.

De tels circuits furent imaginés très tôt, dans l'espoir de trouver une alternative aux circuits
électroniques à base de semi-conducteurs. Mais des difficultés technologiques liées à ce type de
technologie (miniaturisation, températures basses, temps de commutation des circuits, énergie
consommée) n'ont pas permis à cette technologie d'aboutir. Les supraconducteurs restent
toutefois d'un usage incontournable dans la mesure des champs magnétiques très faibles ou a
contrario dans la génération de champs magnétiques intenses. L'espoir réside maintenant dans
la création de supraconducteurs "haute température" avec des propriétés mécaniques plus
faciles permettant ainsi à cette technologie de se démocratiser.

You might also like