You are on page 1of 372

Mécanique Quantique

Tome I. Histoires, bases et anciennes théories


I. Introduction
II. Histoire
III. Bases physiques
IV. La théorie de Bohr
V. L'expérience de Young
VI. Principes de base
Tome II. L'équation de Schrödinger
I. Hamiltonien
II. Equation de Schrödinger
III. Applications
IV. Etats liés
V. Théorie des collisions
VI. Formulation matricielle
Annexes
Tome III. Symétries et spin
I. Théorie des groupes
II. Symétries
III. Spin
IV. Particules identiques et spin
V. Physique statistique
VI. Formulation matricielle
Annexes
Tome IV. L'atome d'hydrogène, les atomes et la matière
I. Atomes et molécules
II. Rayonnement
III. Structure hyperfine
IV. Maser et Laser
V. Matière
VI. Le magnétisme
VII. Supraconductivité
Tome V. Mécanique quantique relativiste
I. Vers une équation d'onde relativiste
II. Equation de Dirac
III. Solutions
IV. Hydrogénoïdes
V. Théorie des trous
VI. Propagation et diffusion
Tome VI. Théories à variables cachées, théorèmes et décohérence
I. L'intrication quantique
II. Contextualité
III. Autres théorèmes
IV. Logique quantique
V. Applications
VI. Décohérence
VII. Théorie de Bohm
Tome VII. Interprétation de la mécanique quantique et classicalité
I. Introduction
II. Position du problème
III. Interprétations
IV. Expériences
V. Du quantique au classique
VI. Références
Tome II. L'équation de Schrödinger
I. Hamiltonien
I.1. Dépendances des amplitudes en fonction du temps
I.1.1. Atomes au repos, états stationnaires
I.1.2. Mouvement uniforme
I.1.3. Energie potentielle, conservation de l'énergie
I.1.4. Forces, la limite classique
I.2. Matrice hamiltonienne
I.2.1. Amplitudes et vecteurs
I.2.2. Décomposition des vecteurs d'états
I.2.3. Quels sont les états de base du monde ?
I.2.4. Comment les états évoluent dans le temps
I.2.5. La matrice hamiltonienne
I.2.6. La molécule d'ammoniac
I.3. Le méson K de charge nulle
I.4. Généralisation aux systèmes à N états
II. Equation de Schrödinger
II.1. Développement de l'équation
II.1.1. Propagation dans un réseau cristallin
II.1.1.1. Etats d'un électron dans un réseau à une dimension
II.1.1.2. Etats d'énergie définie
II.1.1.3. Etats qui varient dans le temps
II.1.1.4 Un électron dans un réseau à trois dimensions
II.1.1.5. Autres états dans un réseau
II.1.1.6. Diffusion par les imperfections dans un cristal
II.1.1.7. Capture par une imperfection d'un réseau
II.1.1.8. Amplitudes de diffusion et états liés
II.1.2. Variation des amplitudes avec la position
II.1.2.1. Les amplitudes le long d'une droite
II.1.2.2. La fonction d'onde
II.1.2.3. Les états de moment défini
II.1.2.4. Normalisation des états en x
II.1.3. L'équation de Schrödinger
II.2. Interprétation de la fonction d'onde
II.3. Les niveaux d'énergie quantifiés
II.4. Fonctions propres et valeurs propres
II.5. Postulats d'interprétation et fonctions propres de l'énergie
II.6. Fonctions propres de l'impulsion
III. Applications
III.1. Puits de potentiel carré à une dimension
III.2. Mouvement d'un paquet d'ondes libre à une dimension
IV. Etats liés
IV.1. Oscillateur harmonique linéaire
IV.2. Potentiels à symétrie sphérique à trois dimensions
IV.3. Puits de potentiel carré à trois dimensions
V. Théorie des collisions
V.1. Barrière de potentiel carrée à une dimension
V.2. Collisions à trois dimensions
V.3. Diffusion par des potentiels à symétrie sphérique
V.4. Diffusion par des potentiels complexes
V.5. Diffusion par un champ coulombien
VI. Formulation matricielle
VI.1. Algèbre matricielle
VI.2. Théorie des transformations
VI.3. Equations du mouvement
VI.4. Théorie matricielle de l'oscillateur harmonique
Annexes
A.1. Tableau des particules élémentaires
Tome II L'équation de Schrödinger
Ce Tome II s'attaque à l'équation de Schrödinger si emblématique de la mécanique quantique. Non
contente d'être au cœur de la théorie et des cours sur la mécanique quantique, elle a aussi une
importance historique considérable puisque ce fut la première équation formulée dans ce nouveau
cadre théorique. Lorsque Schrödinger la présenta la première fois, il fallut d'ailleurs un certain
temps pour qu'il explique le cheminement qui l'avait conduit à cette équation qui semblait tomber
du ciel. Depuis, bien entendu, elle est nettement mieux maîtrisée et sa déduction peut se faire de
diverses manières.

Ici nous effectuerons une approche de son élaboration en utilisant ce que nous avons vu, les
amplitudes et leurs propriétés.

Nous commencerons par revenir un peu sur le formalisme et par introduire la matrice
hamiltonienne qui permet de décrire l'évolution des états au cours du temps.

Puis, nous en viendrons à la déduction de l'équation de Schrödinger et quelques applications


simples.

Nous serons alors bien armés pour décrire les deux grands volets des systèmes quantiques : les états
liés, comme l'atome, et les états non liés plus communément appelés collisions.

Enfin, nous ferons le lien entre le formalisme de la fonction d'onde et un formalisme général, plus
proche de celui des amplitudes que nous avons utilisé jusqu'ici et appelé formulation matricielle.
I. Hamiltonien
La matrice hamiltonienne est la matrice qui permet d'étudier l'évolution des états quantiques au
cours du temps.

Le lien avec la formulation hamiltonienne de la mécanique analytique est d'ailleurs immédiat.

Nous commencerons par étudier comment les amplitudes varient dans le temps.

Puis, après être revenu quelque peu sur le formalisme, nous introduirons la matrice hamiltonienne.

Enfin, armé de ce nouvel outil, nous pourrons étudier quelques systèmes simples à deux états.
I.1. Dépendances des amplitudes en fonction du temps

I.1.1. Atomes au repos, états stationnaires


Nous voudrions maintenant discuter un peu le comportement des amplitudes de probabilité en
fonction du temps. Nous disons "un peu" parce que le comportement réel dans le temps implique
nécessairement le comportement dans l'espace. On se trouve alors immédiatement entraîné dans la
situation la plus compliquée qui soit, dès qu'on veut la décrire correctement et en détail. Nous
retrouvons toujours cette difficulté : nous pouvons traiter quelconque chose soit de façon
logiquement rigoureuse mais tout à fait abstraite, soit de façon pas rigoureuse du tout mais qui nous
donne quelque idée de la situation réelle et en remettant à plus tard un traitement plus soigneux. En
ce qui concerne la dépendance en énergie, nous prendrons la deuxième méthode. Nous ferons un
grand nombre de pures affirmations. Nous n'essayerons pas d'être rigoureux, nous vous dirons juste
les choses telles qu'on a trouvé qu'elles étaient, pour vous donner quelque idée du comportement
des amplitudes en fonction du temps. Au cours de l'exposé, la description deviendra de plus en plus
précise. Ne vous énervez donc pas si nous avons l'air de sortir les choses d'un chapeau. Bien sûr, ce
chapeau contient tout : l'expérience et l'imagination des gens. Mais comme cela nous prendrait trop
de temps de suivre le développement historique, nous devons faire un plongeon quelque part. Nous
pourrions plonger dans l'abstrait et en déduire tout, ce que vous ne comprendriez pas, ou bien, nous
pourrions discuter un grand nombre d'expériences pour justifier chaque affirmation. Nous avons
choisi de faire quelque chose qui soit entre les deux.

Un électron tout seul dans le vide peut, dans certaines circonstances, avoir une énergie bien définie.
Par exemple, s'il est au repos (c'est-à-dire s'il n'a pas de mouvement de translation, pas d'impulsion
ni d'énergie cinétique), il a son "énergie de repos". Un objet plus compliqué comme un atome peut
aussi avoir une énergie définie quand il est arrêté, mais il peut aussi être excité et être dans l'un de
ses niveaux d'énergie (nous décrirons plus tard la machinerie qui est derrière tout cela, il suffit juste
de savoir pour le moment que les expériences de spectroscopie confirment cela). Nous
considérerons souvent un atome dans un état excité comme ayant une énergie définie mais, en
réalité, cela n'est qu'approximatif. Un atome ne reste pas excité éternellement car il peut se
décharger de son énergie grâce à son interaction avec le champ électromagnétique. Il y a donc une
certaine amplitude pour qu'un nouvel état soit créé, l'atome étant dans un état d'excitation plus bas
et le champ électromagnétique dans un état supérieur (émission d'un photon). L'énergie totale du
système est la même avant et après mais l'énergie totale de l'atome est réduite. Si bien qu'il est
inexact de dire qu'un atome excité a une énergie bien définie. Mais c'est souvent commode et ce
n'est pas trop faux.

Incidemment, pourquoi cela se passe-t-il toujours dans le même sens ? Pourquoi un atome rayonne-
t-il de la lumière ? La réponse a quelque chose à voir avec l'entropie. Lorsque l'énergie est dans le
champ électromagnétique, elle peut y être de tant de façons différentes, elle a tellement de places
où elle peut aller, que si nous cherchons les conditions d'équilibre, nous trouvons que, dans la
situation la plus probable; le champ est excité, c'est un photon, et l'atome est désexcité. Il faut au
photon beaucoup de temps pour revenir à la même place et trouver qu'il peut cogner l'atome à
nouveau. C'est tout à fait analogue au problème classique : pourquoi une charge accélérée rayonne-
t-elle (elle pourrait très bien changer de direction sous l'impact d'un photon) ? Ce n'est pas parce
qu'elle "veut" perdre de l'énergie, car, en fait, lorsqu'elle rayonne, l'énergie du monde est la même
qu'avant. Radiation ou absorption vont toujours dans le sens de l'entropie croissante. La situation
est d'ailleurs différente lorsque l'atome est placé dans un bain de photons. Le champ
électromagnétique est alors hautement excité et l'atome a nettement plus de chance d'absorber un
photon. Nous reviendrons plus tard sur ce problème dit de la "flèche du temps" d'une manière
beaucoup plus générale.

Les noyaux peuvent aussi exister dans différents niveaux d'énergie et, à l'approximation où l'on
néglige tous les effets électromagnétiques, nous pouvons dire qu'un noyau dans un état excité y
reste. Bien que nous sachions qu'il n'y reste pas toujours, il est souvent utile de commencer avec
une approximation quelque peu idéalisée et plus facile à résoudre. De plus, c'est aussi une
approximation légitime dans certaines circonstances. Un exemple typique est l'introduction de la loi
de la chute des corps où l'on néglige d'abord la friction et pourtant il n'y a presque aucun cas où il
n'y ait une certaine friction.

Il y a ensuite les "particules étranges", subnucléaires, et qui ont des masses variées. Mais les plus
lourdes se désintègrent spontanément en donnant les plus légères, si bien qu'à nouveau il n'est pas
correct de dire qu'elles ont une énergie définie avec précision. Ceci ne serait vrai que si elles
vivaient éternellement. Si bien que lorsque nous faisons l'approximation qu'elles ont une énergie
définie, nous oublions le fait qu'elles doivent exploser. Pour le moment, nous oublierons donc,
intentionnellement de tels processus et nous apprendrons plus tard comment les prendre en compte.

Supposons que nous ayons un atome ou un électron ou n'importe quelle particule qui a au repos une
énergie bien définie E 0 . Ce que nous voulons dire par l'énergie E 0 est la masse de l'objet tout
entier multipliée par c 2 . Cette masse comprend toute énergie interne, si bien qu'un atome excité a
une masse différente de la masse du même atome dans son état fondamental (l'état fondamental est
l'état de plus basse énergie). Nous appellerons E 0 "l'énergie au repos".

Pour un atome au repos, l'amplitude quantique pour trouver l'atome en un certain endroit est la
même partout. Elle ne dépend pas de la position. Cela signifie, bien entendu, que la probabilité de
trouver l'atome est partout la même. Mais cela veut dire plus. La probabilité pourrait être
indépendante de la position, la phase de l'amplitude, elle, changeant de point en point. Mais, pour
une particule au repos, l'amplitude complète est partout la même. Elle dépend cependant du temps.
Pour une particule dans état d'énergie défini E 0 , l'amplitude pour trouver la particule en (x, y, z) au
temps t est
(1) ae − i ( E0 / h )t
où a est une certaine constante. L'amplitude pour être en un point quelconque de l'espace est la
même pour tous les points, mais elle dépend du temps suivant (1). Nous supposerons simplement
que cette règle est vraie. Notons toutefois que cela correspond à une onde stationnaire de longueur
d'onde nulle, ce qui est évident si l'on se souvient de la règle de de Broglie liant vitesse et longueur
d'onde et sa fréquence est simplement donnée par la règle liant énergie et fréquence.

Bien entendu, nous pourrions aussi écrire (1) comme


(2) ae − iωt
avec
(3) hω = hν = E 0 = mc 2
où m est la masse au repos de l'état atomique ou de la particule. Il a trois façons différentes de
spécifier l'énergie : par la fréquence d'une amplitude, par l'énergie au sens classique ou par l'inertie.
Elles sont toutes équivalentes. Ce sont seulement des façons différentes de dire la même chose.
Vous pensez peut-être qu'il est étrange de penser d'une "particule" qu'elle a la même amplitude pour
être trouvée partout dans l'espace. Après tout, nous imaginons d'habitude comme un petit objet
situé "quelque part". Mais n'oubliez pas le principe d'indétermination. Si une particule a une énergie
définie, elle a aussi une impulsion définie. Si l'incertitude sur l'impulsion est zéro, la relation
d'indétermination, ∆p∆x ≥ h , nous dit que l'incertitude sur la position doit être infinie et c'est
exactement ce que nous disons quand nous disons qu'il y a la même amplitude pour trouver la
particule en tout point de l'espace. Ce caractère ubiquiste est également lié au fait que la particule a
aussi des caractéristiques ondulatoires, bien sûr.

Si les différentes parties d'un atome sont dans des états différents avec différentes énergies totales,
alors, la variation de l'amplitude dans le temps est différente. Si vous ne savez pas dans quel état se
trouve l'atome, il y aura une certaine amplitude pour qu'il soit dans un état et une certaine amplitude
pour qu'il soit dans un autre et chacune de ces amplitudes aura une fréquence différente. Il y aura
une interférence, comme dans un battement, entre ces différentes composantes et elle pourra
apparaître comme une probabilité variant dans le temps. Quelque chose "se passera" dans l'atome,
même si celui-ci est "au repos", c'est-à-dire si son centre de gravité ne se déplace pas. Par contre, si
l'atome a une énergie bien définie et si vous cherchez n'importe quelle probabilité le concernant, la
réponse est indépendante du temps. Quoique les amplitudes dépendent du temps, si l'énergie est
définie, elles changent comme l'exponentielle d'un nombre imaginaire pur et leur module ne change
pas.

C'est pourquoi nous disons souvent qu'un atome dans un état d'énergie définie est dans un état
stationnaire. Quelles que soient les mesures que vous faites de ce qui est à l'intérieur, vous
trouverez que rien ne change avec le temps (pour les probabilités). Pour que les probabilités
changent dans le temps, il faut avoir une interférence de deux amplitudes ayant des fréquences
différentes et cela veut dire que nous ne pouvons pas savoir quelle est l'énergie. L'objet considéré
aura une amplitude pour être dans un des états d'énergie et une autre amplitude pour être dans
l'autre état d'énergie. C'est là la description quantique des choses dont le comportement dépend du
temps.
Si nous avons des conditions telles qu'il y ait un mélange de deux états différents avec des énergies
différentes, alors l'amplitude de chacun des deux états change avec le temps suivant l'équation (2),
comme, par exemple
− i ( E / h )t −i (R / h )t
(4) e 1 et e 2

Et si nous avons une certaine combinaison des deux, nous aurons une interférence. Mais remarquez
que rien ne changerait si nous ajoutions une constante aux deux énergies. Si quelqu'un d'autre
utilisait une échelle d'énergie différente, dans laquelle toutes les énergies seraient augmentées (ou
diminuées) d'une quantité donnée, disons A, les amplitudes des deux états seraient alors, du point
de vue de ce quelqu'un
−i (E + A )t / h −i (E + A )t / h
(5) e 1 et e 2

Toutes ces amplitudes seraient multipliées par le même facteur e −i ( A / h )t et toutes les combinaisons
linéaires ou les interférences auraient le même facteur. Lorsque nous prenons le carré du module
pour trouver les probabilités, tous les résultats sont identiques. Le choix d'une origine pour notre
échelle d'énergie ne change rien. Nous pouvons mesurer l'énergie à partir de n'importe quel zéro.
Des considérations relativistes montrent qu'il est plus élégant de mesurer les énergies de telle façon
que la masse au repos y soit comprise, mais, pour beaucoup de discussions non relativistes, il est
souvent agréable de soustraire une certaine quantité standard de toutes les énergies considérées. Par
exemple, dans le cas d'un atome, il est commode, d'habitude, de soustraire l'énergie m s c 2 où ms est
la masse de l'ensemble des morceaux, le noyau et les électrons, lorsqu'ils sont séparés, ce qui, bien
entendu, est différent de la masse de l'atome tout entier dans son état fondamental. L'énergie qui
apparaît alors est juste l'énergie d'excitation de l'atome. Par conséquent, nous déplacerons parfois
notre zéro d'énergie d'une constante très grande mais cela ne changera rien à condition que nous
déplacions d'une même constante toutes les énergies apparaissant dans un calcul donné. Voilà pour
ce qui concerne une particule au repos.
I.1.2. Mouvement uniforme
Si nous admettons que la théorie de la relativité est juste, une particule au repos dans un système
d'inertie peut être en mouvement uniforme dans un autre système d'inertie. Dans le système de la
particule au repos, l'amplitude de probabilité est la même pour tous les x, y, z mais elle change avec
t. La grandeur de l'amplitude est la même pour tout t mais la phase dépend de t. Nous pouvons
faire une image du comportement de l'amplitude en traçant les lignes d'égales phases, disons les
lignes de phase zéro, en fonction de x et de t. Pour une particule au repos, ces lignes d'égale phase
sont parallèles à l'axe x et sont également espacées le long de la coordonnée t, comme le montrent
les lignes en pointillés de la figure ci-dessous.

Dans un autre système de coordonnées ( x ′, y ′, z ′, t ′) , en mouvement par rapport à la particule,


disons dans la direction x, les coordonnées x ′ et t ′ de tout point de l'espace sont reliées à x et à t
par les transformations de Lorentz. Cette transformation peut être représentée graphiquement en
traçant les axes x ′ et t ′ comme on l'a fait ci-dessus. Vous pouvez voir que dans le système x ′ , t ′
les points d'égale phase ont un espacement différent le long de l'axe t ′ si bien que la fréquence de
la variation dans le temps est différente (nous supposerons que la phase doit avoir la même valeur
pour des points correspondant des deux systèmes). C'est là un point subtil puisque la phase d'une
amplitude quantique est pour une grande part arbitraire puisque l'on mesure uniquement des
probabilités. Une justification complète de cette hypothèse demande une discussion plus détaillée
qui tienne compte des interférences de deux ou d'un plus grand nombre d'amplitudes. Mais on en
devine aisément le contenu puisque deux phases s'annulant par interférence donnent une amplitude
nulle et donc une probabilité et la non survenance d'un événement doit être indépendante du
référentiel choisi. Seule une phase constante arbitraire pourrait être ajoutée aux amplitudes et on
peut la choisir nulle. Il y a aussi une variation de la phase avec x ′ si bien que l'amplitude de
probabilité doit être une fonction de x ′ .

Dans une transformation de Lorentz de vélocité v, dans la direction des x négatifs par exemple, le
temps t est relié au temps t ′ par
t ′ − x ′v / c 2
(1) t =
1− v2 / c2
si bien que notre amplitude varie maintenant comme
 
− (i / h ) E0t ′ / 1− v 2 / c 2 − E0 vx ′ / c 2 1− v 2 / c 2 
− ( i / h ) E0 t
(2) e =e  

Dans le système primé, elle varie dans l'espace aussi bien que dans le temps. Si nous écrivons
l'amplitude comme
− (i / h ) E ′p t ′ − p ′x′ 
 
(3) e
nous voyons que E ′p = E0 / 1 − v 2 / c 2 est l'énergie calculée classiquement pour une particule
d'énergie au repos E 0 voyageant avec la vitesse v et p ′ = E ′p v / c 2 est l'impulsion correspondante.

Vous savez que x µ = (t , x, y, z ) et p µ = (E , p x , p y , p s ) sont des quadrivecteurs et que


p µ x µ = Et − p ⋅ x est un scalaire invariant. Dans le système de la particule au repos, p µ x µ est
exactement Et. Donc, si nous passons dans un autre système, Et sera remplacé par
(4) E ′t ′ − p ′ ⋅ x ′
L'amplitude de probabilité d'une particule d'impulsion p sera alors proportionnelle à
− (i / h ) E t − p⋅x 
 p 
(5) e
où E p est l'énergie d'une particule d'impulsion p, c'est-à-dire

(6) E p = ( pc )2 + E 02
où, comme auparavant, E 0 est l'énergie au repos. Pour les problèmes non relativistes, nous
pouvons écrire
(7) E p = m s c 2 + W p
où W p est l'énergie que l'atome a, en plus de l'énergie au repos m s c 2 de ses constituants. En
général, W p inclut à la fois l'énergie cinétique de l'atome et son énergie de liaison ou son énergie
d'excitation, que nous pouvons appeler "l'énergie interne". Nous écrirons alors
p2
(8) W p = Wint +
2m
et l'amplitude serait
− (i / h ) W p t −p⋅x 
 
(9) e

Comme nous ferons en général des calculs non relativistes, nous utiliserons cette expression pour
les amplitudes de probabilité.

Remarquons que notre transformation relativiste nous a donné la variation de l'amplitude d'un
atome qui se déplace dans l'espace, sans aucune hypothèse supplémentaire. Le nombre d'ondes,
pour la variation dans l'espace est, d'après (9),
p
(10) k =
h
si bien que la longueur d'onde est
2π h
(11) λ = =
k p
C'est la même longueur d'onde que nous avons employée auparavant pour des particules
d'impulsion p. Cette formule fut tout d'abord obtenue par de Broglie, exactement de cette façon.
Pour une particule en mouvement, la fréquence des variations d'amplitude est encore donnée par
(12) hω = W p

Le carré du module de (9) est exactement 1 et, par conséquent, pour une particule en mouvement,
ayant une énergie bien définie, la probabilité de la trouver est la même partout et ne change pas
avec le temps (il est important de remarquer que l'amplitude est une onde complexe. Si nous
utilisions une onde sinusoïdale réelle, son carré changerait de point en point, ce qui ne peut être
correct).

Nous savons, bien entendu, qu'il y a des situations où les particules vont d'une place à une autre si
bien que leur probabilité dépend de la position et change avec le temps. Comment décrivons-nous
de telles situations ? Nous pouvons le faire en considérant des amplitudes qui sont des
superpositions de deux amplitudes (ou plus), chacune correspondant à un état d'énergie définie. Le
calcul est semblable à celui de l'optique et la somme de deux amplitudes ayant des nombres d'onde
k (c'est-à-dire des impulsions) et des fréquences ω (c'est-à-dire des énergies) différentes donnent
des bosses d'interférence, ou des battements, si bien que le carré de l'amplitude varie dans l'espace
et dans le temps. Ces battements se déplacent avec une "vitesse de groupe" donnée par
∆ω
(13) v g =
∆k
où ∆k et ∆ω sont les différences entre les nombres d'ondes et les fréquences des deux ondes. Pour
des ondes plus compliquées, constituées de la somme de plusieurs amplitudes, toutes proche d'une
même fréquence, la vitesse de groupe est

(14) v g =
dk

En prenant ω = E p / h et k = p / h , nous voyons que


dE p
(15) v g =
dp
En utilisant l'équation (6), nous avons
dE p p
(16) = c2
dp Ep

Mais E p = mc 2 , si bien que


dE p p
(17) =
dp m
ce qui est précisément la vitesse classique. De même, si nous utilisons l'expression non relativiste,
nous avons
Wp p
(18) ω = et k =
h h
et
dω dW d  p2  p
(19) = =  =
dk dp dp  2m  m
qui est à nouveau la vitesse classique.

Notre résultat est alors le suivant : si nous avons plusieurs amplitudes pour des états purs d'énergie
ayant presque la même énergie, leur interférence donne des "bosses" dont la probabilité et celles-ci
se déplacent dans l'espace avec la vitesse d'une particule classique ayant cette énergie. Nous devons
remarquer, cependant, que lorsque nous disons que nous pouvons ajouter deux amplitudes ayant
des nombres d'ondes différents, pour obtenir un battement correspondant à une particule en
mouvement, nous avons introduit quelque chose de nouveau, quelque chose que nous ne pouvons
pas déduire de la théorie de la relativité. Nous avons décrit ce qu'était l'amplitude d'une particule à
l'arrêt et nous avons déduit ensuite ce qu'elle deviendrait si la particule était en mouvement. Mais
nous ne pouvons pas déduire de ces arguments ce qui se passerait s'il y avait deux ondes se
déplaçant avec des vitesses différentes. Si nous arrêtons l'une, nous ne pouvons pas arrêter l'autre.
Nous avons donc ajouté tacitement l'hypothèse supplémentaire que non seulement (9) est une
solution possible mais encore qu'il peut y avoir de telles solutions avec différentes valeurs de p pour
ce même référentiel et que les différents termes interfèrent.
I.1.3. Energie potentielle, conservation de l'énergie
Nous voudrions discuter maintenant ce qui se passe lorsque l'énergie de la particule peut changer.
Nous commençons en imaginant une particule qui se déplace dans un champ de forces décrit par un
potentiel. Nous discutons tout d'abord l'effet d'un potentiel constant. Supposons que nous ayons une
grande boite en métal, que nous avons chargée à un potentiel électrostatique φ comme ci-dessous.

S'il y a des objets chargés à l'intérieur de la boite, leur énergie potentielle est qφ , ce que nous
appellerons V, et elle est absolument indépendante de la position. La physique ne peut donc pas
changer à l'intérieur car un potentiel constant n'introduit aucune différence en ce qui concerne ce
qui se passe à l'intérieur de la boite. Nous n'avons maintenant aucun moyen de déduire la réponse si
bien que nous devons la deviner. La façon de deviner qui marche est plus ou moins ce que vous
attendiez : pour l'énergie, nous devons employer la somme de l'énergie potentielle V et de l'énergie
E p qui est elle-même la somme des énergies internes et cinétiques. L'amplitude est proportionnelle
à
− (i / h )  E p +V  t −p⋅x 
  
(1) e
Le principe général est que le coefficient de t, que nous pouvons appeler ω , est toujours donné par
l'énergie totale du système : énergie interne (ou "masse"), plus énergie cinétique, plus énergie
potentielle :
(2) hω = E p + V

Ou, dans les situations non relativistes,


p2
(3) hω = Wint + +V
2m

Que peut-on dire maintenant des phénomènes physiques à l'intérieur de la boite ? Qu'obtiendrons-
nous s'il y a différents états d'énergie ? L'amplitude de chaque état a le même facteur
supplémentaire
(4) e − (i / h )Vt
par rapport à ce qu'elle serait pour V = 0. C'est exactement comme un changement du zéro de
l'échelle d'énergie. Cela produit un même changement de phase pour toutes les amplitudes mais,
comme nous l'avons vu auparavant, cela ne change aucune des probabilités. Tous les phénomènes
physiques sont les mêmes (nous avons supposé que nous parlions de différents états d'un même
objet chargé, si bien que qφ est le même pour tous les états. Si un objet pouvait modifier sa charge
en passant d'un état dans un autre nous obtiendrions un résultat tout à fait différent. La conservation
de la charge évite cela).

Jusqu'ici, notre hypothèse est en accord avec ce que nous attendions d'un changement de niveau de
référence pour l'énergie. Mais, si elle est vraiment exacte elle devrait également être vraie pour une
énergie potentielle qui n'est pas une simple constante. En général, V peut changer de façon
arbitraire, à la fois dans le temps et dans l'espace, et le résultat complet pour l'amplitude doit être
exprimé par une équation différentielle. Nous n'avons pas l'intention de nous occuper du cas
général dès maintenant et nous voulons seulement avoir quelque idée de la façon dont les choses se
passent, si bien que nous ne considérerons qu'un potentiel constant dans le temps et variant
lentement dans l'espace. Nous pourrons alors faire la comparaison entre les idées classiques et
quantiques.
Supposez que nous considérions la situation ci-dessus où l'on a deux boites maintenues à des
potentiels constants φ1 et φ 2 et une région intermédiaire où nous supposerons que le potentiel varie
doucement d'une boite à l'autre. Nous imaginons qu'une certaine particule a une amplitude pour être
trouvée dans l'une de ces régions. Nous supposons aussi que l'impulsion est suffisament grande
pour que le potentiel soit presque constant dans n'importe quelle petite région contenant plusieurs
longueurs d'onde. On peut alors penser que l'amplitude doit avoir la forme (1) dans toute région de
l'espace avec le V correspondant à cette région.
Considérons le cas spécial dans lequel φ1 = 0 , si bien que l'énergie potentielle est zéro à gauche et
où de plus qφ 2 est négatif, si bien que, classiquement, la particule aurait plus d'énergie dans la
deuxième boite. Classiquement, elle irait plus vite dans la deuxième boite, elle aurait plus d'énergie
et, par conséquent, plus d'impulsion. Voyons maintenant comment tout cela peut sortir de la
mécanique quantique.

Avec notre hypothèse, l'amplitude dans la première boite serait proportionnelle à


− (i / h )  Wint + p12 / 2 m +V1  t − p1⋅x 
  
(5) e
et l'amplitude dans la seconde boite serait proportionnelle à
(6) e − (i / h )[(Wint + p2 / 2 m +V2 )t −p 2 ⋅x ]
2

(nous admettons que l'énergie interne ne change pas et reste la même dans les deux régions). La
question est alors : comment les deux amplitudes se raccordent-elles dans la région entre les deux
boites ?

Nous allons supposer que les potentiels sont tous constants dans le temps, si bien que rien ne
change dans les conditions du problème. Nous supposerons alors que les variations de l'amplitude
(c'est-à-dire de la phase) ont la même fréquence partout, car, pour ainsi dire, il n'y a rien dans le
"milieu" qui change avec le temps. Si rien ne change dans l'espace, nous pouvons considérer que
l'onde d'une région "engendre" des ondes secondaires dans tout l'espace, oscillant toutes à la même
fréquence, exactement comme des ondes lumineuses passant à travers des objets au repos sans
changer de fréquence. Si les fréquences de (5) et (6) sont les mêmes, il faut que nous ayons
p2 p2
(7) Wint + 1 + V1 = Wint + 2 + V2
2m 2m

Les deux membres de cette équation ne sont rien d'autre que des énergies totales classiques, si bien
que (7) est un énoncé de la conservation de l'énergie. En d'autres termes, l'énoncé classique de la
conservation de l'énergie est équivalent à l'énoncé quantique, selon lequel la fréquence d'une
particule est la même partout si les conditions ne changent pas avec le temps. Tout cela est en
accord avec l'idée que hω = E . C'est aussi une justification d cette règle quantique.
Dans le cas particulier où V1 = 0 et V2 est négatif, l'équation (7) montre que p 2 est plus grand que
p1 et, par conséquent, que la longueur d'onde des ondes est plus petite dans la région 2. Les
surfaces d'égale phase sont indiquées par les lignes en tirets dans la figure. Nous avons fait aussi un
dessin de la partie réelle de l'amplitude qui montre à nouveau comment la longueur d'onde décroît
en passant de la région 1 à la région 2. La vitesse de groupe des ondes, qui est p / m , augmente
également de la façon prévue d'après la conservation classique de l'énergie puisque celle-ci n'est
rien d'autre que l'équation (7).

Il y a un cas particulier intéressant où V2 devient si grand que V2 − V1 devient plus grand que
p12 / 2m . Alors p 22 , qui est donné par
 p2 
(10) p 22 = 2m  1 − V2 + V1 
 2m 
est négatif. Cela veut dire que p 2 est un nombre imaginaire, disons ip ′ . Classiquement, nous
dirions que la particule n'entre jamais dans la région 2, elle n'a pas assez d'énergie pour escalader la
barrière de potentiel. Cependant, quantiquement, l'amplitude est encore donnée par (6). Sa variation
dans l'espace est encore comme
(11) e(i / h )p 2 ⋅x

Mais si p 2 est imaginaire, la variation dans l'espace devient celle d'une exponentielle réelle.
Admettons que la particule va initialement dans la direction +x. L'amplitude varie alors comme
(12) e − p′x / h

L'amplitude décroît rapidement avec les x croissants


Imaginez que les deux régions avec des potentiels différents soient très proches l'une de l'autre, si
bien que l'énergie potentielle change brusquement de V1 à V2 comme le montre la figure (a) ci-
dessus. Si nous dessinons la partie réelle de l'amplitude de probabilité, nous obtenons la
dépendance indiquée sur la partie (b) de la figure. L'onde de la première région correspond à une
particule essayant d'aller dans la seconde région, mais là, l'amplitude décroît très vite. Il y a une
certaine chance pour qu'elle soit observée dans la seconde région, là où elle ne pourrait jamais aller
classiquement, mais l'amplitude est très petite sauf au voisinage de la frontière. La situation est très
semblable avec la réflexion interne de la lumière. Normalement la lumière ne sort pas, mais nous
pouvons l'observer si nous plaçons quelque chose à moins d'une ou deux longueurs d'onde de la
surface (ondes évanescentes).

De même, si l'on place une seconde surface près de celle où la lumière se réfléchit complètement,
on peut obtenir un peu de lumière transmise dans le deuxième milieu. Il se passe quelque chose de
semblable pour les particules en mécanique quantique.

S'il y a, dans une petite région, un potentiel V, assez grand pour que l'énergie cinétique classique
soit négative, une particule classique ne peut jamais passer au travers. Mais quantiquement,
l'amplitude, qui décroît exponentiellement, peut passer à travers cette région et donner une petite
probabilité pour que la particule soit trouvée de l'autre coté, là où l'énergie cinétique est à nouveau
positive. La situation est illustrée ci-dessus. Cet effet est appelé "pénétration d'une barrière de
potentiel" ou "effet tunnel".
La pénétration d'une barrière par une amplitude quantique donne l'explication, ou la description, de
la désintégration α du noyau d'uranium. L'énergie potentielle d'une particule α, comme fonction de
la distance au centre est indiquée dans la figure (a) ci-dessus. Si on essayait de tirer une particule α
d'énergie E dans le noyau, elle subirait une répulsion électrostatique de la part de la charge
nucléaire Z et, classiquement, elle ne viendrait pas à une distance du noyau plus petite que r1 , là où
son énergie totale est égale à l'énergie potentielle V. Pourtant, plus près, l'énergie potentielle est
beaucoup plus basse à cause de la forte attraction due aux forces nucléaires à courte portée.
Comment se fait-il alors que, dans une désintégration radioactive, nous trouvions des particules α
qui sont parties de l'intérieur du noyau et en sortent avec l'énergie E ? C'est parce qu'elles partent de
l'intérieur du noyau avec l'énergie E et "s'infiltrent" à travers la barrière de potentiel. L'amplitude de
probabilité est à peu près comme on l'a esquissée dans la partie (b) ci-dessus, quoique la
décroissance exponentielle soit en fait beaucoup plus rapide que celle qui est indiquée. Il est en fait
tout à fait remarquable que la vie moyenne d'une particule α dans le noyau d'uranium soit aussi
grande que 4 milliards et demi d'années, alors que les oscillations naturelles à l'intérieur du noyau
sont aussi rapides, de l'ordre de 10 22 par secondes ! Comment peut-on obtenir un nombre comme
10 9 années à partir de 10 −22 seconde ? La solution vient de ce que l'exponentielle donne un facteur
terriblement petit de l'ordre de e −45 , ce qui donne une probabilité de fuite très petite, quoique
définie. Une fois qu'une particule α est dans le noyau, il n'y a presque pas d'amplitude pour la
trouver au dehors. Cependant, si vous prenez assez de noyaux et si vous attendez assez longtemps,
vous pouvez avoir de la chance et en trouver une qui est sortie.
I.1.4. Forces, la limite classique
Supposez que nous ayons une particule en mouvement, passant à travers une région où il y a un
potentiel qui varie à angle droit avec le mouvement. Classiquement nous décririons la situation
comme on l'a esquissée ci-dessous.

Si la particule se déplace le long de x et entre dans une région où il y a un potentiel qui varie avec
y, la particule subit une accélération transverse due à la force F = −∂V / ∂y . Si la force n'est
présente que dans une région bien limitée de largeur w, la force n'agit que le temps w/v. La
particule reçoit une impulsion transverse
w
(1) p y = F
v

L'angle de déflexion δθ est alors


p y Fw
(2) δθ = =
p pv
où p est l'impulsion initiale. En employant − ∂V / ∂y pour F, nous obtenons
w ∂V
(3) δθ = −
pv ∂y

A nous maintenant de voir si notre idée que les ondes se comportent comme dans la section
précédente permet d'expliquer ce même résultat. Nous considérons le même problème
quantiquement, en admettant que tout est très grand en comparaison de la longueur d'onde de nos
amplitudes de probabilité. Dans n'importe quelle petite région, nous pouvons dire que l'amplitude
varie comme
(4) e − (i / h )[(W + p )
/ 2 m +V t − p⋅x ]
2

Pouvons-nous montrer que ceci donne une déflexion de la particule lorsque V a un gradient
transversal ? Sur la figure ci-dessus nous avons esquissé ce à quoi ressembleront les ondes
d'amplitudes de probabilité. Nous avons dessiné un ensemble de "nœuds" de ces ondes, que vous
imaginez comme des surfaces où la phase de l'amplitude est zéro. Dans n'importe quelle petite
région, la longueur d'onde, la distance entre deux nœuds successifs, est
h
(5) λ =
p
où p est relié à V par
p2
(6) W + + V = const.
2m

Dans la région où V est grand, p est plus petit et la longueur d'onde est plus grande. Si bien que
l'angle des plans nodaux change comme le montre la figure.

Pour trouver la façon dont l'angle entre les plans nodaux change, nous remarquons qu'il y a une
différence de potentiel ∆V = (∂V / ∂y )D entre les deux chemins a et b de la figure, si bien qu'il y a
une différence ∆p entre les impulsions des deux chemins qui peut être obtenue à partir de (6) :
 p2  p
(7) ∆  = ∆p = −∆V
 2m  m

Le nombre d'ondes p / h est par conséquent différent le long des deux chemins, ce qui signifie que
les phases évoluent de façons différentes. La différence entre les accroissements de phase est
∆k = ∆p / h , si bien que la différence de phase accumulée sur la distance totale w est
∆p
(8) ∆( phase ) = ∆k ⋅ w =
m
⋅w = − ∆V ⋅ w
h ph

Ceci donne la quantité dont la phase du chemin b est "en avance" sur la phase du chemin a, lorsque
les ondes sortent du potentiel. En dehors du potentiel une telle avance de phase correspond à une
avance du plan nodal de
λ h
(9) ∆x = ∆( phase ) = ∆( phase )
2π p
ou
m
(10) ∆x = − 2 ∆V ⋅ w
p
En nous rapportant à la figure, nous voyons que les nouveaux fronts d'onde font un angle δθ donné
par
(11) ∆x = Dδθ
si bien que nous avons
m
(12) Dδθ = − 2 ∆V ⋅ w
p

Ceci est identique à l'équation (3) si nous remplaçons p / m par v et ∆V / D par ∂V / ∂y .

Le résultat que nous venons d'obtenir n'est correct que si les variations du potentiel sont lentes et
sans discontinuités, ce que nous appelons la limite classique. Nous avons montré que dans ces
conditions nous obtenons, pour une particule, le même mouvement que celui que nous avions
obtenu à partir de F = ma , à la condition que nous supposions que le potentiel change la phase de
l'amplitude de probabilité d'une quantité égale à Vt / h . A la limite classique, la mécanique
quantique est en accord avec la mécanique newtonienne.
I.2. Matrice hamiltonienne

I.2.1. Amplitudes et vecteurs


Avant d'introduire la notion de matrice hamiltonienne, revenons sur le formalisme mathématique de
la mécanique quantique que nous avons déjà présenté et que nous allons approfondir un peu au
risque de quelques répétitions.

La première idée est la grande ressemblance mathématique entre les équations de la mécanique
quantique et le produit scalaire de deux vecteurs. Vous vous rappelez que si χ et φ sont deux
états, l'amplitude pour partir de φ et finir en χ peut être écrite comme la somme, su un ensemble
complet d'états de base, des amplitudes pour aller de φ jusqu'à l'un des états de base et ensuite de
cet état de base jusqu'en χ :
(1) χ φ = ∑
tout i
χ i iφ

Nous voulons comparer l'équation (1) avec la formule du produit scalaire de deux vecteurs B et A.
Si B et A sont des vecteurs ordinaires à trois dimensions, nous pouvons écrire le produit scalaire de
cette façon :
(2) ∑ (B ⋅ e i )(e i ⋅ A )
tout i

avec la convention que le symbole e i indique les trois vecteurs unité selon les directions x, y et z.
B ⋅ e1 est alors ce que nous appelons d'habitude B x , B ⋅ e 2 est ce que nous appelons d'habitude B y
et ainsi de suite. L'équation (2) est donc équivalente à
(3) B x Ax + B y Ay + B z Az
qui est le produit scalaire B ⋅ A .

En comparant les équations (1) et (2), nous pouvons voir l'analogie suivante : les états φ et χ
correspondent aux deux vecteurs A et B. Les états de base i correspondent aux vecteurs particuliers
e i , par rapport auxquels nous rapportons tous les autres vecteurs. Tout vecteur peut être représenté
comme une combinaison linéaire de trois "vecteurs de base" e i . De plus, si vous connaissez les
coefficients de chaque vecteur de base dans cette combinaison, c'est-à-dire les trois composantes,
vous connaissez tout sur ce vecteur. De façon semblable, tout état quantique peut être écrit
complètement par les amplitudes i φ pour aller dans les états de base et si vous connaissez ces
coefficients, vous savez tout ce qu'il y a à savoir sur cet état. Du fait de cette grande analogie, on
appelle souvent "vecteur d'état" ce que nous avons appelé un "état".

Comme les vecteurs de base sont tous à angles droits, nous avons la relation
(4) e i ⋅ e j = δ ij

Cela correspond au caractère exclusif des états de base (états intermédiaires) entre les états de base
i,
(5) i j = δ ij
qui justifie l'affirmation que les états de base i sont tous "orthogonaux".

Il y a une différence mineure entre l'équation (1) et le produit scalaire. Nous savons que

(6) φ χ = χ φ

Mais en algèbre vectorielle,


(7) A ⋅ B = B ⋅ A

Avec les nombres complexes de la mécanique, il nous faut conserver l'ordre des termes alors que
pour le produit scalaire habituel, cela n'a pas d'importance.

Considérons maintenant l'équation vectorielle suivante :


(8) A = ∑ e i ⋅ (e i ⋅ A )
i

Elle est un peu inhabituelle, mais correcte. Elle signifie la même chose que
(9) A = ∑ Ai e i = Ax e x + Ay e y + Az e z
i

Remarquez cependant que l'équation (8) contient une quantité qui est différente d'un produit
scalaire. Un produit scalaire est seulement un nombre alors que l'équation (8) est une équation
vectorielle. L'une des grandes astuces de l'analyse vectorielle fut d'abstraire de ces équations l'idée
de "vecteur". On pourrait, de façon semblable, être tenté d'abstraire de la formule quantique (1)
quelque chose d'analogue à un "vecteur" et, bien entendu, on peut le faire. Nous ôtons les χ des
deux côtés de l'équation (1) et nous écrivons l'équation suivante :
(10) φ = ∑ i i φ
i

On considère le crochet χ φ comme fait de deux morceaux. Le deuxième morceau φ est


souvent appelé un ket, comme nous l'avions déjà signalé, et le premier morceau χ est souvent
appelé un bra. Les demi-symboles χ et φ sont souvent aussi appelés vecteurs d'état. De toute
façon, ce ne sont pas des nombres, or, en général, nous voulons que les résultats de nos calculs
soient des nombres. Si bien que ces quantités "brutes" ne sont que des étapes dans nos calculs.

Il se trouve que nous avons écrit la plus part de nos résultats avec des nombres (les amplitudes).
Comment nous sommes-nous arrangés pour éviter les vecteurs ? Il est amusant de remarquer que
même en algèbre vectorielle ordinaire, nous pourrions faire que toutes les équations ne contiennent
que des nombres. Par exemple, au lieu d'une équation vectorielle comme
(11) F = ma
nous pourrions toujours écrire
(12) C ⋅ F = C ⋅ (ma )

Nous avons alors une équation entre produits scalaires qui est vraie pour tout vecteur C. Mais si
elle est vraie pour tout C, cela ne fait guère de sens de continuer à écrire le C ! Et si nous
choisissons pour C un vecteur de base, l'équation (12) devient une relation entre composantes,
c'est-à-dire aussi une équation (ou plutôt des équations, pour chaques composantes) entre nombre.
C'est exactement ce que nous avons fait avec les amplitudes d'être dans tel ou tel état de base i.

Regardez maintenant l'équation (1). C'est une équation qui est vraie pour tout χ . Pour alléger
l'écriture nous aurions pu laisser le χ de côté et écrire à la place l'équation (10). Elle contient la
même information; à condition que nous admettions qu'elle doive toujours être "achevée" en la
"multipliant à gauche par", ce qui veut simplement dire en remettant à leur place, un certain χ
des deux côtés. L'équation (10) signifie donc exactement la même chose que l'équation (1), ni plus,
ni moins. Lorsque vous voulez des nombres, vous y mettez le χ que vous voulez.

Vous vous êtes peut-être déjà posé des questions sur le φ de l'équation (10). Comme l'équation est
vraie pour tout φ , pourquoi gardons-nous ce φ ? Et de fait, Dirac suggéra que le φ pouvait tout
aussi bien être supprimé, si bien que nous n'avons plus que
(13) | = ∑ i i
i

Et ceci est la grande loi de la mécanique quantique (il n'y a pas d'analogue en analyse vectorielle) !
Cette équation dit que si vous mettez n'importe quelle paire d'états χ et φ à gauche et à droite,
vous revenez à l'équation (1). Ce n'est pas vraiment utile, mais c'est une façon commode de se
rappeler que l'équation (1) est vraie pour toute paire d'états.
I.2.2. Décomposition des vecteurs d'états
Continuons notre approfondissement du formalisme avec la décomposition des vecteurs d'états ce
qui va nous permettre d'introduire les opérateurs.

Revenons à l'équation (10) de la section précédente. Nous pouvons la considérer de la façon


suivante. Tout vecteur d'état peut être représenté comme une combinaison linéaire, avec des
coefficients appropriés, d'un ensemble de "vecteurs" de base ou, si vous préférez, comme une
superposition de "vecteurs unités" en proportions convenables. Pour bien montrer que les
coefficients i φ ne sont que des nombres ordinaires (complexes), supposez que nous écrivions
(1) i φ = C i

L'équation de la section précédente est alors identique à


(2) φ = ∑ i C i
i

Nous pouvons écrire une équation semblable pour tout autre vecteur d'état, disons χ , avec bien
entendu des coefficients différents, disons Di , nous avons alors
(3) χ = ∑ i Di
i

Les Di ne sont rien d'autre que les amplitudes i χ .

Supposez que nous ayons commencé en ôtant le φ dans l'équation (1) de la section précédente.
Nous aurions eut
(4) χ = ∑ χ i i
i


En vous rappelant que χ i = i χ , nous pouvons écrire ceci comme
(5) χ = ∑ Di∗ i
i

Maintenant, le fait intéressant est qu'il nous suffit de multiplier l'une part l'autre les équations (5) et
(2) pour obtenir χ φ . Lorsque nous faisons cela, nous devons faire attention à la sommation des
indices car ils sont tout à fait différents dans les deux équations. Commençons par récrire l'équation
(5) comme
(6) χ = ∑ D ∗j j
j

ce qui ne change rien puisque nous avons juste renommé un indice muet. En la combinant avec
l'équation (2), nous avons
(7) χ φ = ∑ D ∗j j i C i
ij

Mais rappelez-vous que j i = δ ij , si bien que seuls nous restent les termes de la somme tels que j
= i. Nous obtenons
(8) χ φ = ∑ Di• C i
i

où, bien entendu, Di∗ = i χ = χ i et C i = i φ . Nous voyons à nouveau la grande analogie
avec le produit scalaire
(9) A ⋅ B = ∑ Ai Bi
i

La seule différence est dans la conjugaison complexe de Di . L'équation (8) dit donc que si les
vecteurs d'états χ et φ sont exprimés en fonction des vecteurs de base i ou i , l'amplitude
pour aller de φ à χ est donnée par un genre de produit scalaire comme dans l'équation (8). Cette
équation n'est autre, bien sûr, que la première équation de la section précédente écrite avec des
symboles différents. Nous n'avons donc fait que tourner en rond, pour nous habituer aux nouveaux
symboles.
Nous devrions peut-être insister à nouveau sur le fait que les vecteurs de l'espace à trois dimensions
sont écrits à partir de trois vecteurs orthogonaux, par contre, les vecteurs de base i de la
mécanique quantique doivent former l'ensemble complet correspondant à un problème particulier.
Selon la situation, deux, trois, cinq ou un nombre infini de vecteurs de base peuvent être
nécessaires.

Considérons maintenant le cas où des particules passent à travers un certain appareil, modifiant les
amplitudes. Si nous partons avec ces particules dans un certain état φ et si nous les envoyons
ensuite à travers un appareil, si enfin nous faisons une mesure pour voir si elles sont dans un état
χ , le résultat est donné par une amplitude qui peut être écrite comme
(10) χ A φ
où A exprime la modification apportée à l'amplitude par l'appareil.

Un tel symbole n'a pas d'analogue direct en algèbre vectorielle (il est en fait plus proche de l'algèbre
tensorielle, mais l'analogie n'est pas particulièrement utile, nous aurons des outils plus appropriés
avec les opérateurs et les matrices). En considérant les états intermédiaires possibles (les états de
base) à l'entrée et à la sortie de l'appareil, on peut automatiquement écrire (10) comme
(11) χ A φ = ∑ χ i i A j j φ
ij

Ceci est un exemple de la règle fondamentale | = ∑ i i appliquée deux fois.

De même, si nous mettons un autre appareil B en série avec A, on peut écrire l'ensemble comme
BA (vu comme une simple concaténation des deux symboles ou comme un produit qui reste à
définir). On peut alors écrire
(12) χ BA φ = ∑ χ i i B j j A k k φ
ijk

De nouveau, ceci provient directement de la méthode de Dirac avec la règle fondamentale.


Rappelez-vous que nous pouvons toujours mette une barre | à la place du facteur i entre B et A.
Incidemment, nous pouvons considérer l'équation (11) d'une autre façon. Supposez que nous
considérions une particule entrant dans l'appareil A dans l'état φ et sortant dans l'appareil A dans
l'état ψ . En d'autres termes, nous pourrions nous demander : "pouvons-nous trouver un ψ tel que
l'amplitude pour aller de ψ à χ soit toujours et partout identique à l'amplitude χ A φ ?" La
réponse est oui. Nous voulons que l'équation (11) soit remplacée par
(13) χ ψ = ∑ χ i i ψ
j

Clairement, nous pouvons le faire si


(14) i ψ = ∑ i A j j φ = i A φ
j

ce qui détermine ψ . "Mais non, cela ne détermine pas ψ ", direz-vous, "cela ne détermine que
i ψ ". Et pourtant i ψ détermine bien ψ , car si vous avez tous les coefficients qui relient ψ
aux états de base i, ψ est alors défini de manière unique. En fait, nous pouvons jouer avec notre
notation et écrire le dernier terme de (14) comme
(15) i ψ = ∑ i j j A φ
j

Alors, comme cette équation est vraie pour tout i, nous pouvons écrire simplement
(16) ψ = ∑ j j A φ
j

Nous pouvons dire alors : "l'état ψ est ce que nous obtenons si nous partons avec φ et passons à
travers l'appareil A".

Un dernier exemple des trucs du métier. Nous partons encore avec l'équation (11). Comme elle est
vraie pour tout χ et pour tout φ , nous pouvons les laisser tous les deux de coté ! Nous obtenions
alors
(17) A = ∑ i i A j j
ij

En toute rigueur on devrait écrire |A| au lieu de A mais cela ressemblerait au symbole pour "valeur
absolue de A", si bien qu'on supprime généralement les barres. De façon générale, la barre | se
comporte comme le facteur un. Parfois, pour distinguer A d'un nombre ou d'une matrice, on l'écrit
comme Â, nous le ferons parfois, mais le contexte permet toujours de savoir la nature de l'objet
mathématique présent.

Qu'est-ce que cela signifie ? Cela ne signifie ni plus, ni moins que ce que vous obtenez si vous
remettez le φ et le χ à leurs places. Telle qu'elle est, c'est une équation "ouverte" et incomplète. Si
nous la multiplions "à gauche" par φ , elle devient
(18) A φ = ∑ i i A j j φ
ij

ce qui est exactement (16), une fois de plus. En fait, nous pourrions simplement laisser les j de coté
et écrire cette équation
(19) ψ = A φ

Le symbole A n'est ni une amplitude, ni un vecteur. C'est une nouvelle sorte d'objet mathématique
appelé un "opérateur". C'est quelque chose qui "agit" (opère) sur un état pour produire un nouvel
état. L'équation (19) dit que ψ est ce qui résulte de l'action de A sur φ . A nouveau, c'est une
équation ouverte jusqu'à ce qu'elle soit complétée par un bra donné comme χ pour donner
(20) χ ψ = χ A φ

Bien entendu, l'opérateur A est complètement déterminé si nous donnons la matrice des amplitudes
i A j , que l'on écrit aussi Aij , en fonction d'un ensemble quelconque de vecteurs de base.

Notez aussi que les facteurs intervenant dans (12) ne sont rien d'autre qu'un produit matriciel de A
et de B.
Nous n'avons réellement rien ajouté de nouveau avec cette nouvelle notation mathématique. Une
des raisons pour l'introduire est de vous montrer comment on écrit des morceaux d'équations car
vous trouverez dans de nombreux livres les équations écrites sous leur forme incomplète et il n'y a
aucune raison que vous soyez paralysés lorsque vous les rencontrerez. Si vous le préférez, nous
pouvons toujours ajouter les morceaux qui manquent pour avoir une équation entre des nombres
qui ressemble à quelque chose de plus familier.

Par ailleurs, comme vous le verrez, la notation avec les bra et les ket est très commode. D'une part
nous pouvons dès maintenant identifier un état en donnant son vecteur d'état. Quand nous voulons
désigner un état d'impulsion définie p, nous pouvons dire "l'état p ". Nous pouvons aussi parler
d'un état arbitraire ψ . Pour être cohérent nous utiliserons toujours le ket et nous écririons ψ
pour désigner un état (c'est évidemment un choix arbitraire et nous aurions tout aussi bien pu
choisir d'employer le bra ψ ).
I.2.3. Quels sont les états de base du monde ?
Nous avons découvert que n'importe quel état du monde peut être représenté comme une
superposition, une combinaison linéaire avec des coefficients convenables, d'états de base. Vous
pouvez vous demander tout d'abord, quels états de base ? Et bien, il y a de nombreuses possibilités
différentes. Vous pouvez, par exemple, projeter un spin sur la direction z ou sur une autre direction.
Il y a beaucoup, beaucoup de représentations différentes, qui sont les analogues des différents
systèmes de coordonnées que l'on peut employer pour représenter des vecteurs ordinaires. Comme
nous l'avions déjà signalé, un espace vectoriel a une infinité de bases. Ensuite, quels coefficients ?
Et bien, ceci dépend des conditions physiques. Des ensembles de coefficients différents
correspondent à des conditions physiques différentes. La chose importante à connaître est
"l'espace" dans lequel vous travaillez. En d'autres termes, quelle est la signification physique des
états de base ? La première chose qu'il faut donc savoir est, en général, à quoi ressemblent les états
de base ? Vous pouvez alors comprendre comment décrire une situation donnée en fonction de ces
états de base.

Nous voudrions anticiper un peu et parler un petit peu de ce que va être la description quantique
générale de la nature, en termes d'idées courantes dans la physique d'aujourd'hui. Tout d'abord, on
choisit une représentation particulière pour les états de base, différentes représentations sont
toujours possibles. Par exemple, pour une particule de spin un demi, nous pouvons utiliser les états
"plus" ou "moins" par rapport à l'axe z. Mais l'axe z n'a rien de spécial, vous pouvez toujours
prendre n'importe quel autre axe si vous le préférez. Cependant, par souci de cohérence, nous
prendrons toujours l'axe z. Supposons que nous commencions avec une situation à un électron. En
plus des deux possibilités pour le spin ("en haut" et "en bas" le long de l'axe z), il y a aussi
différentes possibilités pour l'impulsion de l'électron. Nous choisissons un ensemble d'états de base,
chacun correspondant à une valeur de l'impulsion. Mais que faire si l'électron n'a pas d'impulsion
définie ? Cela va encore. Nous ne faisons que dire ce que sont les états de base. Si l'électron n'a pas
une impulsion définie il a une certaine amplitude pour avoir une impulsion donnée et une autre
amplitude pour avoir une autre impulsion, et ainsi de suite. Et s'il n'est pas nécessairement en train
de tourner spin en haut, il a une certaine amplitude pour être spin en haut avec une impulsion
donnée et une autre amplitude pour être spin en bas avec la même impulsion, etc. La description
complète d'un électron, pour autant que nous le sachions, ne requiert que l'impulsion et le spin pour
décrire les états de base. Un ensemble d'états de base i acceptable pour un seul électron est donc
décrit par les différentes valeurs de l'impulsion et les positions en haut ou en bas du spin. Différents
mélanges d'amplitudes, c'est-à-dire des combinaisons des C décrivent différentes situations. On
décrit ce que fait un électron particulier en disant ce qu'est son amplitude pour être spin en haut ou
spin en bas et pour avoir une impulsion ou une autre, et ceci pour toutes les impulsions possibles.
Vous voyez ainsi ce qui intervient dans une description quantique complète d'un seul électron.

Que dire des systèmes à plus d'un électron ? Les états de base deviennent alors plus compliqués.
Supposons que nous ayons deux électrons. Tout d'abord, nous avons quatre états de spin possibles :
les deux électrons spin en haut, le premier en bas et le deuxième en haut, le premier en haut et le
deuxième en bas, les deux en bas. Nous avons aussi à préciser que le premier électron a l'impulsion
p1 et le deuxième électron l'impulsion p 2 . Les états de base pour les deux électrons requièrent que
l'on spécifie deux électrons et deux spins. Avec sept électrons, nous avons à spécifier sept de
chaque.

Si nous avons un proton et un électron, il nous faut spécifier la direction du spin du proton et son
impulsion, la direction du spin de l'électron et son impulsion. Du moins, ceci est
approximativement vrai. Nous ne savons pas réellement ce qu'est la représentation correcte du
monde. C'est très bien de commencer en supposant que si vous spécifiez le spin d'un électron et son
impulsion et de même pour un proton, vous avez tous les états de base. Mais alors, et les
"entrailles" du proton ? Prenons la chose de la façon suivante. Dans un atome d'hydrogène qui a un
proton et un électron, nous avons beaucoup d'états de base différents à décrire, les spins du proton
et de l'électron en haut ou en bas et les différentes valeurs possibles des impulsions du proton et de
l'électron. Il y a donc différentes combinaisons des amplitudes C i qui, toutes ensembles, décrivent
les caractéristiques de l'atome d'hydrogène tout entier comme une "particule". Si nous ne savions
pas que l'atome d'hydrogène est fait d'un proton et d'un électron, nous aurions pu commencer en
disant "oh !, mais je sais quels sont les états de base, ils correspondent à des impulsions
particulières de l'atome d'hydrogène". Non, car l'atome d'hydrogène a des constituants internes. Il
peut, par conséquent, avoir différents états d'énergie interne et il faut plus de détails pour décrire sa
vraie nature.
La question se pose alors : le proton a-t-il des constituants internes ? La réponse est oui. Devons-
nous décrire un proton en donnant tous les états possibles des quarks, gluons, mésons et autres
particules étranges ? En principe oui. Et quoique nous supposions que l'électron soit simple, si bien
que nous n'ayons à donner que son impulsion et son spin, peut-être allons nous découvrir demain
que l'électron a aussi toute une mécanique interne. Cela voudrait dire que notre représentation est
incomplète ou fausse ou approximative, de la même façon qu'une représentation de l'atome
d'hydrogène qui le décrit seulement par son impulsion est incomplète puisqu'elle ne tient pas
compte du fait que l'atome d'hydrogène peut avoir été excité. Si l'électron pouvait être excité et être
changé en quelque chose d'autre, en muon par exemple (une espèce d'électron lourd observé en
particulier dans les accélérateurs de particules), il serait alors décrit non seulement en donnant les
états de la nouvelle particule, mais probablement aussi l'état de quelque mécanique interne
compliquée. Aujourd'hui, le problème essentiel dans l'étude des particules fondamentales est de
découvrir quelles sont les représentations correctes pour la description de la nature. Actuellement,
nous nous contentons de deviner que pour l'électron il suffit de spécifier l'impulsion et le spin. Nous
pensons aussi qu'il y a un proton idéal avec une structure interne et entouré de mésons pi, de
mésons k, etc., qui doivent tous être décrits. Plusieurs douzaines de particules, c'est de la folie ! La
question de savoir ce qui est une particule fondamentale et ce qui n'est pas une particule
fondamentale, un sujet dont on entend souvent parler, revient à se demander à quoi ressemblera la
représentation finale dans l'ultime description quantique du monde. Les impulsions des électrons
seront-elles encore les bonnes quantités pour décrire la nature ? La question elle-même a-t-elle un
sens ? On doit toujours se poser cette question dans toute investigation scientifique. Quoi qu'il en
soit, il y a là un problème. Comment trouver une représentation ? Nous ne savons pas la réponse !
Nous ne savons même pas si c'est là le "bon" problème. Mais, si c'est le bon, nous devons d'abord
essayer de trouver si une particule donnée est fondamentale ou non.

En mécanique quantique non relativiste, si les énergies ne sont pas trop élevées de façon que nous
ne dérangiez pas le jeu interne des particules, étranges et autres, vous pouvez faire du très bon
travail sans vous soucier de ces détails. Vous pouvez décider de ne spécifier que les impulsions et
les spins des électrons et des noyaux. Tout se passera très bien. Dans la plupart des réactions
chimiques et dans les autres phénomènes à basse énergie, rien ne se passe dans les noyaux. Ils ne
sont pas excités. De plus, si un atome d'hydrogène se déplace lentement et qu'il se cogne
doucement contre d'autres atomes d'hydrogène, sans jamais passer dans un état excité et sans
rayonner, ni rien faire de compliqué comme cela, mais en restant toujours dans l'état fondamental
de son énergie interne, vous pouvez utiliser l'approximation selon laquelle vous parlez de l'atome
d'hydrogène comme d'un objet, une particule, et vous pouvez ne pas vous soucier du fait qu'il peut
se passer quelque chose à l'intérieur. Cela sera une bonne approximation tant que l'énergie
cinétique, dans n'importe quelle collision est bien au-dessous de 10 électrons volts, l'énergie requise
pour exciter l'atome d'hydrogène dans un état interne différent. Bien sûr, la mécanique quantique
étant probabiliste on pourrait dire qu'il y a toujours une certaine probabilité pour que l'atome se
retrouve dans un état excité. Cela est vrai mais on peut alors dire que l'approximation est acceptable
si les amplitudes impliquant des changements de l'état interne sont extrêmement petites,
négligeables en pratique, devant les amplitudes utilisées pour décrire l'objet comme une particule
sans structure interne. Nous ferons souvent l'approximation selon laquelle nous ne tenons pas
compte de la possibilité d'un mouvement interne, diminuant ainsi le nombre de détails que nous
devons inclure dans nos états de base. Bien entendu, nous oublions alors certains phénomènes qui
apparaîtraient (en général) à des énergies plus élevées, mais, en faisant de telles approximations
nous pouvons simplifier énormément l'analyse des problèmes. Par exemple, nous pouvons discuter
la collision de deux atomes d'hydrogène à basse énergie, ou n'importe quelle réaction chimique,
sans nous inquiéter du fait que les noyaux atomiques pourraient être excités. En résumé, quand
nous pouvons négliger les effets des états excités d'une particule, nous pouvons choisir un ensemble
d'états de base constitué des états dont l'impulsion et la composante z du moment angulaire sont
définis.

Une telle attitude pourrait être critiquée. Mais elle se justifie parfaitement pour deux raisons et se
modère pour une troisième raison :
 Nous n'avons pas la connaissance infuse de tout ce qui permet de décrire le monde. Nous
sommes bien obliger d'admettre notre méconnaissance de certains détails, de certaines lois
physiques, des états de base complets du monde. Mais cela ne doit pas nous paralyser. Nous
n'avons aucune chance de découvrir dans un éclair de génie l'infinie complexité du monde.
Nous décrivons donc ce que nous connaissons et nous progressons en le confrontant à
l'expérience et en améliorant nos théories. C'est d'ailleurs dans l'esprit de la méthode
scientifique : c'est l'expérience qui nous guide, qui fixe les limites et qui tranche.
 La physique a aussi des buts pratiques. Elle n'est pas conçue uniquement comme une élégante
description du monde devant laquelle on serait en extase en soupirant du bonheur du travail
accomplit. La physique est aussi construite pour comprendre les phénomènes physiques les plus
divers, prédire leurs comportements, les maîtriser et les utiliser dans toutes sortes d'applications
: lasers, transistors, télévisions, etc. Si l'on veut arriver à un tel résultat, il faut pouvoir mener les
calculs et obtenir des résultats quantitatifs, des résultats numériques (des tensions, des positions,
des intensités, des durées, etc.) Inutile de s'extasier devant des équations si elles ne servent pas
ou si l'on est incapable de les résoudre. Or les équations peuvent vite devenir inextricables et
impossibles à résoudre. Surtout si le système est un tant soit peut complexe et réaliste. Même
des calculs numériques menés sur ordinateur trouvent vite leurs limites. Il faut donc bien, à un
moment donné, faire des choix, des approximations. Dans ce cas, pourquoi s'encombrer de
détails qui n'ont aucun impact sur les résultats (de préférence, quand même, après l'avoir
vérifié) à cause de leur faiblesse (énergie infime par rapport à l'énergie totale, probabilité
tellement faible qu'on n'a aucune chance de voir un résultat donné dans la vie d'un homme
même pour un très grands nombres de systèmes) ? C'est certainement les premières
approximations à effectuer !
 Renoncer, dans une situation donnée, pour des raisons pratiques, pédagogiques ou autres, à
décrire certains détails n'est pas un aveu d'échec. On sait que certains détails ont été négligés
(en tout cas, maintenant, vous le savez). Et ces détails peuvent être étudiés plus tard,
séparément ou dans une étude plus complète. Lorsque nous décrivons le fonctionnement d'une
horloge en décrivant tous ses engrenages, il n'y a pas de honte à ignorer les cours de la bourse
au Japon ou les couleurs du drapeau argentin dans la description de cette horloge. Il en est de
même ici. Décrivons chaque chose posément, en fonction des besoins, des possibilités, des
désirs,… Complétons progressivement nos descriptions, améliorons petit à petit notre
connaissance du monde, c'est inévitable… et c'est aussi plus digeste pour le lecteur ! Rome ne
s'est pas construite en un jour.

Notre problème, alors, pour décrire la nature est de trouver une représentation adéquate des états de
base. Cela n'est que le commencement. Nous voulons de plus être capable de dire ce qui "arrive". Si
nous connaissons l'état du monde à un moment donné, nous voulons connaître son état un peu plus
tard. Nous avons donc aussi à trouver les lois qui déterminent comment les choses changent dans le
temps. Nous abordons maintenant cette deuxième partie de la mécanique quantique, comment les
états changent dans le temps.
I.2.4. Comment les états évoluent dans le temps
Nous avons déjà discuté la façon de représenter une situation dans laquelle nous plaçons quelque
chose dans un appareil. Maintenant, un "appareil" commode, d'un emploi délectable, consiste à
attendre simplement quelques minutes, autrement dit : vous préparez un état φ et, avant de
l'analyser, vous le laissez tel qu'il est. Peut-être l'abandonnez-vous dans un champ électrique ou
magnétique particulier, cela dépend des circonstances. De toute façon, quelles que soient les
conditions, vous laissez l'objet tranquille du temps t1 au temps t 2 . Supposez que vous le laissiez
sortir du premier appareil à t1 et dans l'état φ et qu'il aille ensuite dans un "appareil", "l'appareil"
consistant simplement à attendre jusqu'à t 2 . Pendant ce temps là, il peut se passer diverses choses,
on peut appliquer des forces extérieures ou pratiquer d'autres manœuvres de ce genre, si bien que
quelque chose se passe. Après avoir attendu, l'amplitude pour trouver l'objet dans un état χ donné
n'est pas exactement la même que si on n'avait pas attendu. Comme "attendre" n'est qu'un cas
spécial "d'appareil", nous pouvons décrire ce qui se passe en donnant l'amplitude sous la même
forme. Comme l'opération "d'attendre" est particulièrement importante, nous l'appellerons U au lieu
de A et nous écririons U (t 2 , t1 ) pour spécifier le temps de départ et d'arrivée t1 et t 2 . L'amplitude
que nous voulons est
(1) χ U (t 2 , t1 )φ

Comme toute autre amplitude, elle peut être représentée dans un système de base quelconque en
écrivant
(2) ∑ χ i i U (t 2 , t1 ) j j φ
ij

U est alors complètement décrit en donnant l'ensemble complet des amplitudes, la matrice
(3) i U (t 2 , t1 ) j

Incidemment, nous pouvons remarquer que la matrice i U (t 2 , t1 ) j donne beaucoup plus de détails
que ce dont nous avons besoin. Le physicien théoricien de grande classe, qui travaille en physique
des hautes énergies, considère des problèmes du type général suivant (c'est de cette façon que les
expériences sont généralement faites). Il part avec une paire de particules, comme deux protons,
venant l'un vers l'autre de l'infini (dans le laboratoire, en général, une des particules est à l'arrêt et
l'autre vient d'un accélérateur qui est pratiquement à l'infini à l'échelle atomique). La collision se
produit et il en sort, disons, deux mésons k, six mésons pi et deux neutrons, chacun dans une
certaine direction et avec une certaine impulsion. Quelle est l'amplitude pour que cela se produise ?
La mathématique ressemble à ceci : l'état φ spécifie les spins et les impulsions des particules
incidentes. χ correspond à la question sur ce qui sort. Comme, par exemple, avec quelle amplitude
obtenez-vous six mésons sortant dans telle et telle direction et les neutrons dans telles directions
avec leurs spins de telle façon ? Autrement dit, χ serait défini en donnant toutes les impulsions et
les spins, etc. pour toutes les particules finales. Le travail du théoricien est alors de calculer
l'amplitude (1). Cependant, il ne s'intéresse réellement qu'au cas particulier où t1 vaut − ∞ et t 2
vaut + ∞ (il n'y a pas d'information expérimentale sur les détails de la réaction mais seulement sur
ce qui entre et sur ce qui sort). La limite de U (t 2 ,t1 ) lorsque t1 → −∞ et t 2 → +∞ est appelé S et
ce que le théoricien veut est
(4) χ S φ

Il pourrait encore, en utilisant la formule (2), calculer la matrice


(5) i S j
qui est appelée la matrice S. Ainsi, si vous voyez un théoricien faisant les cent pas et disant "tout ce
que j'ai à faire est de calculer la matrice S", vous saurez de quoi il s'agit.

Comment analyser, comment définir les lois de la matrice S est une intéressante question. En
mécanique quantique relativiste, aux hautes énergies, on fait cela d'une certaine façon et, dans la
mécanique quantique non relativiste, on le fait d'une autre façon qui est très commode (cette autre
façon peut aussi être employée dans le cas relativiste, mais elle n'est plus alors aussi commode). Il
s'agit de calculer la matrice U pour un petit intervalle de temps, c'est-à-dire pour t 2 et t1 proches
l'un de l'autre. Si nous pouvons trouver une suite de tels U pour des intervalles de temps successifs,
nous pouvons étudier comment les choses évoluent en fonction du temps. Vous pouvez vous rendre
compte immédiatement que cette façon de faire n'est pas tellement bonne en relativité parce que
nous n'avons pas envie de décrire l'aspect des choses, partout, "simultanément". Mais nous n'allons
pas nous inquiéter de cela pour le moment, nous allons seulement nous occuper de mécanique
quantique non relativiste.

Supposez que nous considérions la matrice U pour un intervalle de temps de t1 à t 3 qui est plus
grand que t 2 . Autrement dit, nous prenons trois temps consécutifs : t1 plus petit que t 2 plus petit
que t 3 . Nous prétendons alors que la matrice qui fait passer de t1 à c est le produit de ce qui se
passe lorsque vous attendez de t1 à t 2 et ensuite de t 2 à t 3 . C'est exactement comme dans la
situation où nous avions deux appareils A et B en série. Nous pouvons alors écrire
(6) U (t 3 , t1 ) = U (t 3 , t 2 )U (t 2 , t1 )

Autrement dit, nous pouvons analyser tout intervalle de temps si nous pouvons analyser une
séquence de petits intervalles de temps. Nous n'avons qu'à faire le produit de tous les morceaux.
C'est de cette façon que l'on analyse la mécanique quantique dans le cas non relativiste.

Notre problème est alors de comprendre la matrice U (t 2 ,t1 ) pour un intervalle de temps
infinitésimal, c'est-à-dire pour t 2 = t1 + ∆t . Nous nous posons la question suivante : si nous avons
un état, à quoi ressemble-t-il après un intervalle de temps infinitésimal ∆t ? Voyons comment nous
pouvons écrire cela. Appelons l'état au temps t, ψ (t ) (nous étudions la dépendance dans le temps
de ψ pour ce que nous entendons par état au temps t soit parfaitement clair). Nous demandons
maintenant : quel état avons-nous après le petit intervalle de temps ∆t ? La réponse est
(7) ψ (t + ∆t = U (t + ∆t , t ) ψ (t )

Ceci signifie la même chose que l'équation avec opérateur, c'est-à-dire que l'amplitude pour trouver
χ au temps t + ∆t est
(8) χ ψ (t + ∆t ) = χ U (t + ∆t , t )ψ (t )
Comme nous ne sommes pas encore très forts dans ces raisonnements abstraits, projetons nos
amplitudes dans une représentation bien définie. Si nous multiplions les deux cotés de l'équation (7)
par i , nous obtenons
(9) i ψ (t + ∆t ) = i U (t + ∆t , t )ψ (t )

Nous pouvons aussi décomposer ψ (t ) sur les états de base et écrire


(10) i ψ (t + ∆t ) = ∑ i U (t + ∆t , t ) j j ψ (t )
j

Nous pouvons comprendre l'équation (10) de la façon suivante. Si nous appelons C i (t ) = i ψ (t )


l'amplitude pour être dans l'état de base i au temps t, nous pouvons étudier la variation de cette
amplitude (qui, souvenez-vous en, n'est qu'un nombre !) au cours du temps. Chaque C i devient une
fonction de t. Nous avons aussi de l'information sur la façon dont les amplitudes C i varient avec le
temps. A t + ∆t , chaque amplitude est proportionnelle à toutes les autres amplitudes en t,
multipliées par un ensemble de coefficients. Appelons U ij la matrice U, ce par quoi nous entendons
(11) U ij = i U j

Nous pouvons alors écrire l'équation (10) comme


(12) C i (t + ∆t ) = ∑ U ij (t + ∆t , t )C j (t )
j

Ceci nous donne une idée de ce que va être la dynamique de la mécanique quantique.

Jusqu'ici nous ne savons pas grand chose sur les U ij sauf ceci : nous savons que si ∆t tend vers 0,
il ne se passe rien, nous devons obtenir exactement l'état original. Donc U ii tend vers 1 et U ij → 0
si i ≠ j . En d'autres termes, U ij → δ ij pour ∆t → 0 . Nous pouvons aussi supposer que, pour de
petits ∆t , chacun des coefficients U ij doit différer de δ ij par une quantité proportionnelle à ∆t
(développement au premier ordre pour des quantités infinitésimales). Nous écrivons donc
(13) U ij = δ ij + K ij ∆t

Cependant, on a l'habitude de sortir des coefficients K ij un facteur (− i / h ) , pour des raisons


historiques entre autres. Nous avons un petit ennui ici avec nos notations. Dans le facteur (− i / h ) ,
le i signifie l'unité imaginaire et non pas l'indice i qui désigne le ième état de base ! Nous espérons
que vous ne trouverez pas cela trop déroutant. Il n'y a que 26 lettres de l'alphabet, rajoutez les
lettres grecques, les majuscules et divers ornements (comme un accent circonflexe) et vous avez
pas mal de possibilités mais encore bien limitées face à l'infinie variété des grandeurs physiques.
Des symboles utilisés avec plusieurs significations sont malheureusement inévitables. Le problème
est amplifié par des usages historiques provenant de communautés de physiciens parfois fort
différentes. Ainsi R est utilisé pour désigner la constante des gaz parfaits ou pour l'aimantation
réduite ou la matrice de rotation ou parfois pour bien d'autres choses. Le contexte permet toujours
de savoir de quoi on parle. Mais un minimum d'attention est requit.

On préfère donc écrire


(14) U ij (t + ∆t , t ) = δ ij − H ij (t )∆t
i
h

C'est bien entendu la même équation que (13) et, si vous voulez, elle ne fait que définir les
coefficients H ij (t ) . Les termes H ij sont simplement les dérivées par rapport à t 2 des coefficients
U ij (t 2 , t1 ) évalués à t 2 = t1 = t .

En employant cette forme pour U dans l'équation (12), nous avons


 
(15) C i (t + ∆t ) = ∑ δ ij − H ij (t )∆t C j (t )
i
j  h 
En prenant la somme sur le terme δ ij , nous obtenons juste C i (t ) que nous pouvons faire passer
dans l'autre membre de l'équation. En divisant alors par ∆t nous reconnaissons une dérivée
C (t + ∆t ) − C i (t )
= − ∑ H ji (t )C j (t )
i
(16) i
∆t h j
ou
dC (t )
(17) ih i = ∑ H ij (t )C j (t )
dt j

Vous vous rappelez que C i (t ) est l'amplitude i ψ pour trouver l'état ψ dans l'un des états de
base i (au temps t). L'équation (17) nous dit donc comment chacun des coefficients i ψ varie
dans le temps. Mais c'est la même chose que de dire que l'équation (17) nous donne la façon dont
l'état ψ varie dans le temps puisque nous décrivons ψ en fonction des amplitudes i ψ . La
variation de ψ dans le temps est décrite en fonction de la matrice H ij , qui doit évidemment inclure
tout ce que nous faisons au système pour le faire changer. Si nous connaissons les H ij , qui
contiennent la physique du problème et peuvent, en général, dépendre du temps, nous avons une
description complète du comportement du système dans le temps. L'équation (17) est alors la loi
quantique de la dynamique du monde.

Nous devons ajouter que nous prendrons toujours un ensemble d'états de base qui sont fixes et qui
ne varient pas dans le temps. Il y a des gens qui utilisent des états de base qui varient aussi. Mais
c'est la même chose que d'utiliser un système de coordonnées tournant et nous ne voulons pas
entrer dans de telles complications.
I.2.5. La matrice hamiltonienne
L'idée, alors, est que pour décrire le monde quantique, il nous faut choisir un ensemble d'états de
base i et écrire les lois de la physique en donnant les coefficients de la matrice H ij . Nous avons
alors tout ce qu'il nous faut, nous pouvons répondre à n'importe quelle question sur ce qui va se
passer. Nous devons donc apprendre quelles sont les règles pour trouver les H ij qui correspondent
à une situation physique donnée, à un champ magnétique, ou à un champ électrique, etc. Et c'est là
le plus difficile. Par exemple, pour les nouvelles particules étranges, nous n'avons aucune idée du
H ij qu'il faut employer. Autrement dit, personne ne connaît le H ij complet pour le monde entier.
Une partie de la difficulté vient de ce que l'on peut difficilement espérer découvrir le H ij quand on
ne sait même pas quels sont les états de base. Nous avons d'excellentes approximations pour les
phénomènes non relativistes et pour quelques autres cas spéciaux. En particulier, nous connaissons
les formes dont on a besoin pour décrire les mouvements des électrons dans les atomes, c'est-à-dire
pour décrire la chimie. Mais nous ne connaissons pas le vrai H ij complet pour l'univers tout entier.

Les coefficients H ij sont appelés "la matrice hamiltonienne" ou, en bref, l'hamiltonien (comment
Hamilton, qui travaillait en l'année 1830, a pu donner son nom à une matrice de la mécanique
quantique est toute une histoire. Mais on devine le lien, ne fut ce que par l'équation décrivant
l'évolution des états dans le temps en fonction de l'hamiltonien, le lien avec l'hamiltonien de la
mécanique analytique). Il serait mieux de l'appeler la matrice d'énergie, pour des raisons qui
deviendront apparentes au fut et à mesure que nous l'emploierons. Le problème est donc : trouvez
votre hamiltonien !

Le hamiltonien a une propriété qui peut être déduite immédiatement, à savoir


(1) H ij∗ = H ji
(matrice hermitique)

Ceci vient de la condition que la probabilité totale pour qu'un système soit dans un état quelconque
ne change pas. Si vous commencez avec une particule, un objet ou le monde entier, vous l'avez
encore après tout intervalle de temps. Et même dans le cas de particules instables, pouvant se
désintégrer, les états de base doivent en tenir compte (on doit avoir un état sans la particule), on a
encore une situation ou l'on a toujours ou bien la particule ou pas. On ne peut mieux comme
lapalissade. La probabilité totale de trouver le système dans un état quelconque est
∑ C (t )
2
(2) i
i
qui ne doit pas changer au cours du temps. Pour que ceci soit vrai, en l'appliquant à l'équation
décrivant l'évolution dans le temps de ces coefficients, quel que soit l'état de départ φ , il faut que
l'équation (1) soit vraie.

Comme premier exemple, considérons la situation dans laquelle les conditions physiques ne
changent pas avec le temps. Nous voulons dire les conditions physiques extérieures, de sorte que H
est indépendant du temps. Il n'y a personne qui branche ou débranche des électro-aimants. Nous
choisissons aussi un système qui peut être décrit avec un seul état de base. C'est une approximation
que nous pourrions faire pour un atome d'hydrogène au repos ou pour quelque chose de semblable.
L'équation d'évolution dans le temps dit alors que
dC
(3) ih 1 = H 11C1
dt

Une seule équation et c'est tout ! Et si H est constant, cette équation différentielle se résout
facilement pour donner
− (i / h ) H11t
(4) C1 = (const )e

Ceci donne la dépendance dans le temps d'un état d'énergie définie E = H 11 . Vous voyez pourquoi
H ij devrait être appelé la matrice d'énergie. C'est une généralisation de l'énergie pour des situations
complexes.

Ensuite, pour comprendre un peu mieux ce que signifie l'équation, nous considérons un système qui
a deux états de base. L'équation d'évolution se lit alors
dC1
ih = H 11 C1 + H 12 C 2
dt
(5)
dC
ih 2 = H 21 C1 + H 22 C 2
dt

De nouveau, si les H sont indépendants du temps, vous pouvez facilement résoudre ces équations.
Nous vous laissons essayer de le faire pour vous amuser, nous y reviendrons et nous le résoudrons
plus tard. Oui, vous pouvez résoudre les problèmes de mécanique quantique sans connaître les H,
tant qu'ils sont indépendants du temps.
I.2.6. La molécule d'ammoniac
Nous voulons vous montrer maintenant comment on peut utiliser l'équation dynamique de la
mécanique quantique pour décrire des conditions physiques particulières. Nous avons choisi un
exemple simple et intéressant dans lequel, en essayant de deviner raisonnablement l'hamiltonien,
nous pouvons calculer quelques résultats importants et ayant même une valeur pratique. Nous
allons prendre une situation que l'on peut décrire par deux états : la molécule d'ammoniac.
La molécule d'ammoniac a un atome d'azote et trois atomes d'hydrogène disposés dans un plan sous
l'azote, si bien que la molécule a la forme d'une pyramide, comme ci-dessus. Cette molécule,
comme tout autre, a un nombre infini d'états. Elle peut tourner autour de n'importe quel axe, elle
peut se déplacer dans n'importe quelle direction, elle peut vibrer, etc. etc. Par conséquente, ce n'est
pas du tout un système à deux états. Mais nous allons faire l'approximation que tous les autres états
restent fixes, car ils n'interviennent pas dans ce qui nous intéresse pour l'instant. Nous considérons
que la molécule est juste en train de tourner autour de son axe de symétrie (comme le montre la
figure), qu'elle a une impulsion nulle et qu'elle vibre aussi peu que possible (par exemple à très
basse température et dans le référentiel de la molécule). Cela définit toutes ses caractéristiques sauf
une : il y a encore les deux positions possibles de l'atome d'azote, l'azote peut être d'un coté ou de
l'autre du plan des atomes d'hydrogène, comme le montrent les figures (a) et (b). Nous allons donc
discuter cette molécule comme si c'était un système à deux états. Cela signifie qu'il n'y a que deux
états dont nous allons nous soucier, tout le reste sera supposé ne pas changer. Vous voyez, même si
nous savons que la molécule tourne avec un certain moment cinétique autour de l'axe et si nous
savons qu'elle se déplace avec une certaine impulsion et qu'elle vibre d'une certaine façon, il y a
encore deux états possibles. Nous dirons que la molécule est dans l'état 1 lorsque l'azote est en
haut, comme dans la figure (a), et qu'elle est dans l'état 2 quand l'azote est en bas comme dans
(b). Les états 1 et 2 seront pris comme états de base pour notre analyse du comportement de la
molécule d'ammoniac. A tout instant, l'état réel ψ de la molécule peut être représenté en donnant
C1 = 1 ψ , l'amplitude pour être dans l'état 1 et C 2 = 2 ψ , l'amplitude pour être dans l'état 2 .
Alors, nous pouvons écrire le vecteur d'état ψ comme
(1) ψ = 1 1 ψ + 2 2 ψ
ou
(2) ψ = 1 C1 + 2 C 2

Maintenant, le fait intéressant est que si la molécule est dans un certain état à un certain moment
donné, elle n'est pas dans le même état un instant plus tard. Les deux coefficients C changeront
avec le temps suivant l'équation d'évolution que nous venons de voir, valable pour tout système à
deux états. Supposez par exemple, que vous ayez fait une observation ou que vous ayez fait une
certaine sélection des molécules et que vous sachiez que la molécule était initialement dans l'état
1 . Un instant plus tard, il y a une certaine chance pour qu'on la trouve dans l'état 2 . Pour trouver
ce qu'est cette chance nous devons résoudre l'équation différentielle qui nous dit comment les
amplitudes changent avec le temps.
Le seul ennui est que nous ne savons pas quoi prendre pour les coefficients H dans l'équation. Il y a
cependant certaines choses que nous pouvons affirmer. Supposez qu'il n'y ait aucune chance pour
que la molécule puisse jamais aller dans l'état 2 , une fois qu'elle est dans l'état 1 , et
réciproquement. Alors H 12 et H 21 seraient tous les deux zéro et l'équation serait
dC dC
(3) ih 1 = H 11C1 , ih 2 = H 22 C 2
dt dt

Nous pouvons résoudre ces deux équations facilement. Nous obtenons


− (i / h ) H11t − (i / h ) H 22t
(4) C1 = (const )e , C 2 = (const )e

Ce sont là les amplitudes pour les états stationnaires d'énergie E1 = H 11 et E 2 = H 22 . Nous


remarquons cependant que pour la molécule d'ammoniac, les deux états 1 et 2 ont une certaine
symétrie. Si la nature est un tant soit peu raisonnable, les deux éléments de matrice H 11 et H 22
doivent être égaux. Nous les appellerons tous les deux E 0 car ils correspondent à l'énergie
qu'auraient les états si H 12 et H 21 étaient zéro. Mais les équations (4) ne nous disent pas ce que fait
en réalité l'atome ammoniac. Il se trouve que l'azote peut passer à travers les trois hydrogènes et
basculer de l'autre coté. C'est très difficile. Il faut beaucoup d'énergie pour franchir la première
moitié du chemin. Comment l'azote peut-il faire s'il n'a pas assez d'énergie ? Il y a une certaine
amplitude pour qu'il pénètre la barrière de potentiel. Il est possible, en mécanique quantique, de se
faufiler rapidement à travers une région illégale du point de vue de l'énergie. C'est l'effet tunnel
dont nous avons déjà parlé. Par conséquent, il y a une certaine amplitude, petite, pour qu'une
molécule qui part en 1 passe dans l'état 2 . Les coefficients H 12 et H 21 ne sont pas vraiment
zéro. A nouveau, par symétrie, ils doivent être tous les deux égaux, au moins en module. En fait,
nous savons déjà que de façon générale H ji doit être égal au complexe conjugué de H ij , si bien
qu'ils ne peuvent différer que d'une phase. Il se trouve, comme vous le verrez, que nous pouvons les
prendre égaux sans perdre de généralité. Il sera commode, plus tard, de les avoir prix égaux à un
nombre négatif. Nous prenons H 12 = H 21 = − A , sans perte de généralité. Nous avons alors la paire
d'équations suivante :
dC
(5) ih 1 = E0 C1 − AC 2
dt
dC
(6) ih 2 = E 0 C 2 − AC1
dt

Ces équations sont très simples et peuvent être résolues de plusieurs façons différentes. Une façon
commode est la suivante. En prenant la somme des deux, nous obtenons
(7) ih (C1 + C 2 ) = (E 0 − A)(C1 + C 2 )
d
dt
dont la solution est
− (i / h )(E0 − A )t
(8) C1 + C 2 = ae

Ensuite, en prenant la différente de (5) et (6), nous trouvons que


(9) ih (C1 − C 2 ) = (E0 + A)(C1 − C 2 )
d
dt
ce qui donne
− (i / h )(E0 + A )t
(10) C1 − C 2 = be

Nous avons appelé a et b les deux constantes d'intégration. Bien entendu, il faut les choisir de façon
à obtenir les conditions initiales de chaque problème particulier. Maintenant, en ajoutant et en
soustrayant (8) et (10), nous obtenons C1 et C 2 :

(11) C1 (t ) = e − (i / h )( E0 − A )t + e − (i / h )( E0 + A )t
a b
2 2
(12) C2 (t ) = e −(i / h )( E0 − A )t − e −(i / h )( E0 + A )t
a b
2 2
Ce sont des équations similaires sauf pour le signe du second terme.
Nous avons les solutions. Mais que veulent-elles dire ? La difficulté avec la mécanique quantique
n'est pas seulement de résoudre les équations mais de comprendre ce que leurs solutions signifient !
D'abord, remarquez que si b = 0, les deux termes ont la même fréquence ω = (E 0 − A) / h . Si tout
varie avec la même fréquence, cela veut dire que le système est dans un état d'énergie bien définie,
ici l'énergie est E 0 − A . Il y a donc un état stationnaire d'énergie pour lequel les deux amplitudes
C1 et C 2 sont égales. Nous trouvons que la molécule d'ammoniac a une énergie définie E 0 − A si
les amplitudes pour que l'atome d'azote soit "en haut" ou "en bas" sont égales.

Il y a un autre état stationnaire possible si a = 0. Les deux amplitudes ont alors la fréquence
(E0 + A) / h . Il y a donc un autre état d'énergie définie E 0 + A si les deux amplitudes sont égales
mais de signes opposés : C 2 = −C1 . Ce sont les seuls états d'énergie définie.

Nous concluons que, du fait qu'il y a une certaine chance pour que l'atome d'azote passe d'une
position à l'autre, l'énergie de la molécule n'est pas exactement E 0 , comme nous aurions pu
l'attendre, mais il y a deux niveaux d'énergie E 0 + A et E 0 − A . Chacun des états possibles de la
molécule, quelle que soit son énergie, est divisé en deux niveaux. Nous disons chacun des états car,
vous vous souvenez, nous avons choisi un état particulier de rotation, d'énergie interne, etc. Pour
chaque état possible de ce genre il y a un doublet de niveaux d'énergie dû au "flip-flop" de la
molécule.

Posons-nous maintenant la question suivante sur la molécule d'ammoniac. Supposez qu'à t = 0,


nous sachions que la molécule se trouve dans l'état 1 ou, en d'autres termes, que C1 (0) = 1 et
C 2 (0) = 0 . Quelle est la probabilité pour que l'on trouve la molécule dans l'état 2 au temps t ?
Notre état initial nous donne ce que valent a et b dans les équations (11) et (12). En faisant t = 0,
nous avons
a+b a−b
(13) C1 (0 ) = = 1 , C 2 (0 ) = =0
2 2
Clairement, a = b = 1. En mettant ces valeurs dans les formules pour C1 (t ) et C 2 (t ) et en
réarrangeant les termes, nous avons
 e (i / h ) At + e −(i / h ) At 
(14) C1 (t ) = e −(i / h )E0t  
 2 
 e (i / h ) At − e −(i / h ) At 
(15) C2 (t ) = e −(i / h )E0t  
 2 

Nous pouvons les récrire comme


(16) C1 (t ) = e −(i / h )E0t cos
At
h
(17) C2 (t ) = ie −(i / h )E0t sin
At
h

Les deux amplitudes ont une grandeur qui varie harmoniquement dans le temps.

La probabilité pour que la molécule soit trouvée dans l'état 2 au temps t est le carré du module de
C 2 (t ) :
(18) C 2 (t ) = sin 2
2 At
h

La probabilité part de zéro (comme il se doit), monte jusqu'à un et oscille ensuite entre zéro et un,
comme le montre la courbe P2 de la figure ci-dessous. La probabilité pour être dans l'état 1 ne
reste évidemment pas l'unité. Elle "se vide" dans le deuxième état jusqu'à ce que la probabilité de
trouver la molécule dans le premier état soit zéro, comme le montre la courbe P1 . La probabilité va
et vient entre les deux.
Lorsque vous avez étudié le pendule, vous avez probablement vu ce qui se passe lorsque l'on a deux
pendules identiques faiblement couplés. Si nous déplaçons l'un d'eux et si nous le laissons partir, il
se balance et progressivement l'autre commence à se balancer. Très vite, le deuxième pendule prend
toute l'énergie. Alors le processus se renverse et le pendule numéro un prend toute l'énergie. C'est
exactement le même genre de chose. La vitesse à laquelle l'énergie est échangée de l'un à l'autre
dépend du couplage entre les deux pendules, c'est-à-dire du taux de fuite "d'oscillations" de l'un
vers l'autre. Egalement, il y a deux types de mouvements particuliers de deux pendules, chacun
ayant une fréquence définie, que l'on appelle les modes fondamentaux. Si nous déplaçons les deux
pendules à la fois, ils se balancent ensemble à la même fréquence. Par ailleurs, si nous déplaçons
l'un d'une façon et l'autre d'une autre façon, il y a un autre mode stationnaire également avec une
fréquence définie.

Eh bien, nous avons ici une situation similaire. L'ammoniac est mathématiquement semblable à une
paire de pendules. Les deux fréquences, quand ils oscillent ensemble ou quand ils oscillent en
opposition sont (E0 + A) / h et (E0 − A) / h .

L'analogie avec des pendules n'est pas beaucoup plus profonde que le fait que deux équations
identiques ont des solutions identiques. Les équations linéaires donnant les amplitudes sont tout à
fait semblables aux équations linéaires d'oscillateurs harmoniques (en fait, c'est là la raison qui
explique le succès de la théorie classique de l'indice de réfraction dans laquelle on remplace l'atome
quantique par un oscillateur harmonique alors que, classiquement, ce n'est pas une vue raisonnable
du mouvement des électrons autour du noyau). Si vous tirez l'azote d'un coté, vous obtenez une
superposition de ces deux fréquences et vous obtenez une sorte de battement parce que le système
n'est pas dans l'un des états de fréquence définie. La séparation des niveaux d'énergie de la
molécule d'ammoniac est cependant un effet strictement quantique.

La séparation des niveaux d'énergie de la molécule d'ammoniac a d'importantes applications


pratiques que nous décrirons plus tard. Enfin, nous avons un exemple de problème de physique
pratique que vous pouvez comprendre avec la mécanique quantique !
I.3. Le méson K de charge nulle
Nous allons maintenant décrire un système à deux états qui appartient au monde des particules
étranges, un système pour lequel la mécanique quantique donne une prédiction des plus
remarquables. Le décrire complètement nous entraînerait dans tout un tas de considérations sur les
particules étranges, nous serons donc obligés malheureusement de prendre quelques raccourcis.
Nous ne pouvons que vous décrire dans les grandes lignes la façon dont certaines découvertes ont
été faites, afin de vous montrer le type de raisonnement qui a été utilisé. Cela commence par la
découverte par Gell-Mann et Nishijima du concept d'étrangeté et d'une nouvelle loi, la
conservation de l'étrangeté. C'est en analysant les conséquences de ces nouvelles idées que Gell-
Mann et Pais en arrivèrent à la prédiction d'un phénomène extrêmement remarquable que nous
allons décrire. Néanmoins, nous allons d'abord vous parler un peu de "l'étrangeté".

Il nous faut commencer par ce qu'on appelle les interactions fortes des particules nucléaires. Ce
sont les interactions responsables des forces nucléaires fortes. Elles se distinguent en particulier des
interactions électromagnétiques, relativement plus faibles. Ces interactions sont "fortes" en ce sens
que si deux particules s'approchent suffisament pour enfin interagir, elles interagissent de façon
intense et produisent facilement d'autres particules. Les particules nucléaires ont aussi ce qu'on
appelle une "interaction faible" par laquelle certaines choses peuvent se produire, telle que la
désintégration bêta, mais toujours très lentement du moins à l'échelle du temps nucléaire. Les
interactions faibles sont de beaucoup, beaucoup d'ordres de grandeur plus faibles que les
interactions fortes et même beaucoup plus faibles que les interactions électromagnétiques. C'est
d'ailleurs une des raisons pour laquelle ces interactions faibles sont souvent associées au neutrino,
particule légère, non chargée électriquement et insensible aux interactions fortes.

Lorsque l'on s'est mis à étudier les interactions fortes à l'aide des grands accélérateurs, ont fut
surpris de trouver que certaines choses qui "auraient dû" se produire, et auxquelles ont s'attendait,
ne se réalisaient pas. Par exemple, dans certaines interactions, une particule d'un certain type ne se
manifestait pas quand on l'attendait. Gell-Mann et Nishijima se sont aperçus que beaucoup de ces
observations surprenantes pouvaient s'expliquer immédiatement par l'invention d'une nouvelle loi
de conservation : la conservation de l'étrangeté. Ils suggérèrent l'existence d'un attribut d'une
nouvelle sorte associé à chaque particule, dénommé par eux nombre "d'étrangeté", tout comme peut
l'être, par exemple, la charge électrique, et la conservation de la "quantité d'étrangeté" dans toute
interaction forte.

Supposez, par exemple, qu'un méson négatif de grande énergie, disons une énergie de plusieurs
milliards d'eV, percute un proton. De l'interaction, peuvent provenir beaucoup d'autres particules :
mésons pi, mésons K, particules lambda, particules sigma, n'importe lequel des mésons et baryons
répertoriés dans les expériences de physique des particules (voir en annexe). On observe cependant
que certaines combinaisons seulement apparaissent et d'autres jamais. On connaissait déjà certaines
lois de conservation. Tout d'abord, l'énergie et l'impulsion sont toujours conservées. L'énergie et
l'impulsion totales après l'événement doivent être les mêmes qu'avant. Il y a en second lieu la
conservation de la charge électrique qui exige que la charge totale des particules sortantes soit égale
à la charge totale apportée par les particules initiales. Dans notre exemple d'un méson K et d'un
proton qui se rencontrent ont réellement lieu :
(1) K − + p → p + K − + π + + π − + π 0 ou K − + p → Σ − + π +

Et nous n'obtiendrons jamais


(2) K − + p → p + K − + π + ou K − + p → Λ 0 + π +
à cause de la conservation de la charge. On savait aussi que le nombre de baryons est conservé. Le
nombre de baryons sortants doit être égal au nombre de baryons entants. D'après cette loi,
l'antiparticule d'un baryon est comptée moins un baryon. Cela signifie que nous pouvons observer
et de fait nous l'observons
(3) K − + p → Λ0 + π 0 ou K − + p → p + K − + p + p
(ou p est l'antiproton, lequel transporte une charge négative). Mais nous ne voyons jamais
(4) K − + p → K − + π + + π 0 ou K − + p → p + K − + n
(même lorsqu'il y a beaucoup d'énergie disponible), parce que les baryons ne seraient pas
conservés.

Néanmoins, ces lois n'expliquent pas l'étrange absence des réactions suivantes, qui ne semblent pas
à première vue particulièrement différentes de certaines autres dans (1) et (3) :
(5) K − + p → p + K − + K 0 ou K − + p → p + π − ou K − + p → Λ0 + K 0
De toute évidence cela est lié au méson K auquel on peut attribuer une quantité appelée étrangeté et
qui serait conservée. On a donc un nombre associé à chaque particule, son étrangeté S, et une loi
qui existe selon laquelle l'étrangeté totale sortante, pour toute interaction forte, doit être égale à
l'étrangeté totale entrante. Le proton et l'antiproton (p, p ), le neutron et l'antineutron (n, n ) et les
mésons ( π + , π 0 , π − ) ont tous zéro pour nombre d'étrangeté, les mésons K + et K 0 ont l'étrangeté
+1, le K − et le K 0 (l'anti K 0 ou K zéro bar) ont l'étrangeté -1. On a aussi découvert une particule
d'étrangeté -2, la particule Ξ ("ksi" majuscule) et d'autres peut-être non encore connues. Mettons
ces étrangetés dans un tableau
S
-2 -1 0 +1
+
Σ p
Baryons Ξ 0
Λ , Σ0
0 n
− −
Ξ Σ
π+ K+
Mésons K0 π0 K0
K− π−

Voyons comment fonctionne la conservation de l'étrangeté pour certaines des réactions que nous
avons écrites. Si nous avons au départ un K − et un proton, l'étrangeté totale est de -1 + 0 = -1. La
conservation de l'étrangeté nous dit que l'étrangeté des produits après réaction doit aussi avoir -1
comme somme. Vous voyez qu'il en est ainsi pour les réactions (1) et (3). Mais dans les réactions
(5), l'étrangeté du terme de droite est zéro dans chaque cas. De telles réactions ne conservent pas
l'étrangeté et ne se produisent pas. Pourquoi ? Cela est lié à la composition en quarks de ces
particules, la charge étrange étant portée par le quark étrange, et par les propriétés de l'interaction
forte qui remanie les quarks mais ne les transforme pas. Mais nous n'aurons pas besoin de nous
plonger dans la structure en quarks de ces particules pour comprendre la suite. Donc, à ce stade on
peut juste considérer que la conservation de l'étrangeté est un constat.

Voyons maintenant la réaction suivante : un π − heurte un proton. Vous pourriez obtenir, par
exemple, une particule Λ0 plus un méson K neutre, deux particules neutres. Mais quel K neutre
obtenez-vous ? Du fait que la particule Λ a l'étrangeté -1 et le π et le p + une étrangeté zéro et
puisqu'il s'agit d'une réaction de production rapide, l'étrangeté ne doit pas changer. La particule K
doit avoir l'étrangeté +1. Il faut donc que ce soit le K 0 . La réaction est
(6) π − + p → Λ0 + K 0
avec S = 0 + 0 = -1 + +1 (conservé)

Si c'était le K 0 au lieu du K 0 , l'étrangeté sur la droite serait -1, ce que la nature ne permet pas
puisque l'étrangeté sur la gauche est zéro. Par contre, on peut produire un K 0 dans d'autres
réactions telles que
(7) n + n → n + p + K 0 + K +
S = 0 + 0 = 0 + 0 + +1 + -1
Ou
(8) K − + p → n + K 0
S = -1 + 0 = 0 + -1

Peut-être vous dites-vous : "tout cela, c'est du vent, car comme savez-vous s'il s'agit d'un K 0 ou
d'un K 0 ? Ils se ressemblent tout à fait. Ils sont antiparticules l'un de l'autre, ils ont donc
exactement la même masse et tous deux ont une charge électrique zéro. Le K pourrait être sa propre
antiparticule comme le photon. Comment les distinguez-vous ?" Par les réactions qu'ils produisent.
Par exemple, un K 0 peut interagir avec la matière pour produire une particule Λ , comme ceci :
(9) K 0 + p → Λ0 + π +
un K 0 ne le peut pas. Par aucun moyen un K 0 ne pourra produire une particule Λ lorsqu'il
interagit avec la matière ordinaire (des protons et des neutrons). Sauf, bien sûr, s'il produit aussi
deux K + ou d'autres particules d'étrangeté totale +1. Il suffit d'imaginer qu'il s'agit ici de réactions
où l'énergie est insuffisante pour produire ces particules supplémentaires étranges. Et, quoi qu'il en
soit, ces différents cas sont expérimentalement faciles à distinguer en regardant les particules
produites. Les K 0 produits par certaines réactions produisent eux-mêmes certaines réactions et les
K 0 produits par d'autres réactions produisent certaines réactions différentes. Il y a clairement deux
particules différentes. Ainsi, une distinction expérimentale possible entre le K 0 et le K 0 serait que
l'un d'eux produise ensuite des Λ et l'autre pas.

L'une des prédictions de la théorie de l'étrangeté consiste donc en ceci : si, au cours d'une
expérience avec des pions de haute énergie, une particule Λ est produite en même temps qu'un
méson K neutre, ce méson K neutre rencontrant à nouveau la matière ne produira jamais un Λ .
L'expérience pourrait se faire à peu près de cette façon : vous envoyez un faisceau de méson π −
dans une grande chambre à bulles à hydrogène (qui ne laisse la trace que des particules chargées
électriquement). La trace d'un π − disparaît, mais quelque part ailleurs une paire de trace apparaît
(un proton et un π − ) montrant qu'une particule Λ s'est désintégrée. Vous savez alors qu'il existe
quelque part un K 0 que vous ne pouvez pas voir.

Vous pouvez quand même savoir par où il est parti en utilisant la conservation de l'impulsion et de
l'énergie (il pourrait se manifester plus tard en se désintégrant en deux particules chargées, comme
indiqué dans la figure (a)). Tandis qu'il continue son chemin, le K 0 peut rencontrer l'un des noyaux
d'hydrogène (un proton) et produire peut-être d'autres particules. La théorie de l'étrangeté prédit
qu'il ne produira jamais une particule Λ , du moins au moyen d'une réaction simple telle que
(9) K 0 + p → Λ0 + π +
alors qu'un K 0 peut très bien le faire. Autrement dit, dans une chambre à bulles, un K 0 pourrait
produire l'événement schématisé dans la figure (b), dans lequel un Λ0 est vu grâce à sa
désintégration, un K 0 par contre ne peut pas le produire. C'est la première partie de notre histoire :
la conservation de l'étrangeté.

Notons que les trajectoires dans les chambres à bulles représentées droites sont en réalité courbées
par la présence d'un champ magnétique qui permet ainsi, par la mesure du rayon de courbure, de
mesurer l'impulsion de chaque particule chargée laissant une trace.

La conservation de l'étrangeté n'est pas absolument stricte. Il existe des désintégrations très lentes
de particules étranges, elles prennent beaucoup de temps, typiquement de l'ordre de 10 −10 sec , dans
lesquelles l'étrangeté n'est pas conservée (un temps caractéristique, pour les interactions fortes, est
plutôt de l'ordre de 10 −23 sec ). Ainsi la particule Λ à l'état libre se désintègre lentement, par le biais
d'une interaction faible. Les produits de désintégration sont ou bien un p et un π − ou bien un n et
un π 0 . Le temps de vie est de 2,2 × 10 −10 sec . De même, le K 0 se désintègre en deux mésons pi (+
et -) avec une durée de vide de 10 −10 sec . C'est d'ailleurs grâce à ces désintégrations que les
particules K furent d'abord observées. Notez que la réaction de désintégration
(10) K 0 → π + + π −
ne conserve pas l'étrangeté et ne peut donc pas avoir lieu "rapidement" par interaction forte. Elle ne
peut procéder que d'une interaction faible.

Le K 0 se désintègre lui aussi de cette manière, en deux mésons pi, et aussi avec la même durée de
vie
(11) K 0 → π + + π −

A nouveau, nous avons une désintégration faible puisque l'étrangeté n'est pas conservée. Il existe
un principe selon lequel à toute réaction correspond une autre réaction, où "matière" est remplacé
par "antimatière" et vice versa. L'antimatière étant ce qui est obtenu après renversement du signe de
toutes les charges, y compris les charges des particules internes dans le cas où la particule possède
une structure interne (ce qui est le cas des mésons qui contiennent deux quarks). C'est une simple
opération de symétrie. Le K 0 étant l'antiparticule du K 0 , il devrait se désintégrer en donnant les
antiparticules du π + et su π − , mais l'antiparticule d'un π + c'est le π − (ou vice versa, si vous
préférez. Dans le cas des mésons pi, il se trouve que peu importe lequel on appelle "matière"). Du
fait des désintégrations faibles, le K 0 et le K 0 peuvent transiter vers les mêmes produits finaux.
Quand ils sont "vus" par leur désintégration, comme dans une chambre à bulles, ils semblent être la
même particule. Seules les interactions fortes sont différentes.

Enfin, nous voilà prêts à décrire le travail de Gell-Mann et de Pais. Ils ont d'abord noté que le K 0
et le K 0 peuvent l'un et l'autre se transformer en des états formés de deux mésons pi, il doit exister
une certaine amplitude pour que le K 0 puisse devenir un K 0 et aussi pour que le K 0 puisse
devenir un K 0 . En écrivant les réactions comme on le fait en chimie, nous aurions
(12) K 0 ↔ π − + π + ↔ K 0

Ces réactions impliquent qu'il existe une certaine amplitude par unité de temps, disons − i / h que
multiplie K 0 W K 0 , pour qu'un K 0 se transforme en K 0 par le biais de l'interaction faible
responsable de la désintégration en deux mésons pi. Il existe aussi l'amplitude correspondante
K 0 W K 0 pour le processus inverse. Du fait que matière et antimatière se comportent exactement
de la même manière, ces deux amplitudes sont égales numériquement. Nous les désignons l'une et
l'autre par A :
(13) K 0 W K 0 = K 0 W K 0 = A

C'est là, on dit Gell-Mann et Pais, une situation très intéressante. Là où les gens ont vu jusqu'à
présent deux états distincts du monde, le K 0 et le K 0 , il n'y aurait lieu de voir en fait qu'un seul
système à deux états puisqu'il existe une amplitude pour passer de l'un à l'autre état. Pour une
analyse complète, il faudrait bien sûr s'occuper de beaucoup plus que deux états, car il y a aussi les
états de pi et autres. Mais étant surtout intéressés par la relation entre le K 0 et le K 0 , ils n'ont pas
eut à trop compliquer les choses et ils ont pu faire l'approximation d'un système à deux états. Il fut
tenu compte des autres états dans la mesure où leur effet contribuait implicitement aux amplitudes
de l'équation (13).

En conséquence, Gell-Mann et Pais ont analysé la particule neutre comme un système à deux états.
Ils commencèrent par choisir, pour les deux états de base, les états K 0 et K 0 (à partir de là,
l'histoire se déroule de manière très similaire à celle de la molécule d'ammoniac). Tout état ψ de
la particule K neutre pouvait alors être défini en précisant les amplitudes pour qu'il soit dans l'un et
l'autre des états de base. Nous désignerons ainsi ces amplitudes
(14) C + = K 0 ψ , C − = K 0 ψ

L'étape suivante fut d'écrire les équations hamiltoniennes pour ce système à deux états. S'il n'y avait
pas de couplage entre le K 0 et le K 0 , les équations seraient simplement
dC
ih + = E 0 C +
dt
(15)
dC −
ih = E0 C −
dt

Mais puisqu'il existe une amplitude K 0 W K 0 pour que le K 0 se transforme en K 0 , om faut


inclure le terme additionnel
(16) K 0 W K 0 C − = AC −
ajouté à droite de la première équation. Il faut de même insérer le terme AC + dans l'équation
concernant le taux de variation de C − .

Mais ce n'est pas tout. Lorsqu'on tient compte de l'effet des deux pions, il faut additionner
l'amplitude pour que le K 0 se transforme en lui-même par le processus
(17) K 0 → π − + π + → K 0

L'amplitude additionnelle que nous pourrions écrire K 0 W K 0 est égale exactement à


K 0 W K 0 puisque les amplitudes pour passer du système de deux pions ou pour en revenir sont
les mêmes, qu'il s'agisse d'un K 0 ou d'un K 0 . Si vous le désirez, la démonstration détaillée peut se
faire ainsi :
(18) K 0 W K 0 = K 0 W 2π 2π W K 0
et
(19) K 0 W K 0 = K 0 W 2π 2π W K 0

Nous faisons ici une simplification car le système de deux pions peut avoir beaucoup d'états
correspondant aux diverses impulsions des mésons pi. Nous devrions écrire le coté droit de cette
équation sous la forme d'une somme portant sur les divers états de base des pi. Mais le traitement
complet conduirait aux même conclusions avec juste des notations beaucoup plus lourdes.

Du fait de la symétrie entre matière et antimatière, on a


(20) 2π W K 0 = 2π W K 0
et aussi
(21) K 0 W 2π = K 0 W 2π

Il s'ensuit que K 0 W K 0 = K 0 W K 0 et aussi que K 0 W K 0 = K 0 W K 0 , ainsi que nous


l'avions dit plus haut. De toute manière, il y a les deux amplitudes K 0 W K 0 et K 0 W K 0 , l'une
et l'autre égale à A, qu'il faut insérer dans les équations hamiltoniennes. La première donne un
terme AC + dans le coté droit de l'équation concernant dC + / dt et la seconde un terme AC − dans
l'équation concernant dC − / dt . En raisonnant de cette façon, Gell-Mann et Pais conclurent que les
équations hamiltoniennes pour le système de mésons K neutres devaient être
dC
ih + = E 0 C + + AC − + AC +
dt
(22)
dC
ih − = E 0 C − + AC + + AC −
dt

Il nous faut rectifier quelque chose que nous avons dit au cours des sections précédentes : à savoir
que deux amplitudes concernant deux processus inverses, comme K 0 W K 0 et K 0 W K 0 sont
toujours des complexes conjugués. C'était vrai tant qu'il s'agissait de particules qui ne se
désintégraient pas. Mais si les particules peuvent se désintégrer, et donc "se perdre", les deux
amplitudes ne sont plus nécessairement des complexes conjugués. Le raisonnement permettant de
montrer que les amplitudes étaient conjuguées utilisait le fait que le passage d'un état A vers B, si
on le renversait dans le temps, donnait le passage de l'état B vers A. Mais ici il existe un autre état :
un état avec deux pions s'échappant, définitivement. Il existe donc une "perte" et il n'est pas
toujours possible de revenir à la situation initiale. Ainsi le méson K 0 peut se transformer en K 0
mais le retour n'est pas toujours possible si, avant, les deux mésons pi s'échappent. La description
en deux états n'est qu'approximative, comme nous l'avions signalé plus haut, et le détail est caché
dans l'amplitude A. L'égalité (13) ne signifie donc pas que les amplitudes sont des nombres réels.
Elles sont en fait complexes. Par conséquent le coefficient A est complexe et nous ne pouvons pas
simplement l'incorporer dans l'énergie E 0 .

Ayant souvent été confronté à des systèmes à deux états comme celui de l'ammoniac ou le spin de
l'électron, nos héros savaient que les équations hamiltoniennes signifiaient qu'il existait une autre
paire d'états de base que l'on pourrait utiliser aussi pour représenter le système de la particule K et
qui auraient des comportements particulièrement simples. Tout comme nous avons vu dans le cas
de l'ammoniac que des combinaisons des états de base donnaient des états stationnaires. Ils se
dirent "prenons la somme et la différence de ces deux équations. D'autre part, mesurons toutes nos
énergies en prenant E 0 pour origine et prenons des unités d'énergie et de temps pour lesquelles
h = 1 " (c'est ce que font toujours les théoriciens modernes de la physique. Cela ne change rien à la
physique mais les équations prennent une forme plus simple et réintroduire la ou les constantes
manquantes à la fin peut se faire par simple analyse dimensionnelle, ce qui revient à revenir à des
unités plus conventionnelles). Voici leur résultat :
(23) i (C + + C − ) = 2 A(C + + C − ) , i (C + − C − ) = 0
d d
dt dt

On voit immédiatement que les combinaisons d'amplitudes (C + + C − ) et (C + − C − ) agissent


indépendamment l'une de l'autre (elles correspondent bien sûr aux états stationnaires que nous
avons étudiés antérieurement). Ils pensèrent donc que l'utilisation d'une représentation différente
pour la particule K serait plus pratique. Ils définirent les deux états
(24) K 1 =
1
2
( )
K 0 + K 0 , K2 =
1
2
( K0 − K0 )
Les facteurs racine carrée de deux sont là pour normaliser les amplitudes. C'est-à-dire pour veiller à
ce que la probabilité de trouver la particule dans l'état K 0 ou K 0 est la même que la probabilité
de trouver la particule dans l'état K 1 ou K 2 ce que vous pouvez facilement vérifier.

Ils dirent qu'au lieu de penser aux mésons K 0 et K 0 , on peut tout aussi bien penser en termes de
deux particules (ou "états") K 1 et K 2 . Cela n'a rien d'extraordinaire puisque nous avons vu que ces
deux mésons sont en fait deux états d'un même système, d'une même particule pouvant prendre
plusieurs états.

Mais Gell-Mann et Pais ne firent pas tout cela dans le seul but de donner de nouveaux noms aux
particules. Il y a aussi dans tout cela une certaine physique étrange et nouvelle. Supposez que C1 et
C 2 sont les amplitudes pour qu'un certain état ψ soit un méson K 1 ou K 2 :
(25) C1 = K 1 ψ , C 2 = K 2 ψ

Des équations (24), on peut tirer


(26) C1 =
1
(C + + C − ) , C 2 = 1 (C + − C − )
2 2

L'équation (23) devient alors


dC dC
(27) i 1 = 2AC1 , i 2 = 0
dt dt

Les solutions en sont


(28) C1 (t ) = C1 (0 )e − i 2 At , C 2 (t ) = C 2 (0 )
où, bien sûr, C1 (0) et C 2 (0) sont les amplitudes à t = 0.
Ces équations nous disent que si une particule K neutre commence, à t = 0, dans l'état K 1
( C1 (0) = 1 et C 2 (0) = 0 ), les amplitudes au temps t seront
(29) C1 (t ) = e − i 2 At , C 2 (t ) = 0

Si l'on se souvient que A est un nombre complexe, il est commode de poser A = α − iβ (nous
écrivons moins iβ parce que la partie imaginaire de 2A se trouve être négative). Après cette
substitution, C1 (t ) devient
(30) C1 (t ) = C1 (0 )e − β t e − iα r

La probabilité de trouver une particule K 1 à l'instant t est le carré du module de cette amplitude,
soit e −2 β t . Et, du fait des équations (28), la probabilité de trouver l'état K 2 est nulle à tout moment.
Cela signifie que si vous mettez une particule K dans un état K 1 , la probabilité de la retrouver
dans le même état décroît exponentiellement avec le temps, mais vous ne la retrouverez jamais dans
l'état K 2 . Où va-t-elle ? Elle se désintègre en deux mésons pi avec la vie moyenne τ = 1 / 2 β
laquelle est, expérimentalement, 10 −10 sec . Nous tenions compte de cela lorsque nous disions que A
était complexe.

D'autre part, les équations (28) nous disent que si nous mettons une particule K entièrement dans
l'état K 2 , elle y restera pour toujours. Eh bien, ce n'est pas tout à fait vrai. Expérimentalement, on
observe qu'il se désintègre en trois mésons pi, mais 600 fois plus lentement que la désintégration en
deux pions que nous avons décrite. Mais, tant que l'on considère seulement la désintégration en
deux pions, le K 2 a une durée "éternelle".

Maintenant, terminons l'histoire de Gell-Mann et Pais. Ils en vinrent à considérer ce qui se passe
lorsque la particule K est produite en même temps qu'une particule Λ0 dans une interaction forte.
Puisqu'elle doit dans ce cas avoir l'étrangeté +1, elle doit être produite dans l'état K 0 . Ainsi, à t = 0,
ce n'est ni un K 1 ni un K 2 mais un mélange. Les conditions initiales sont
(31) C + (0) = 1 , C − (0) = 0
Mais, d'après (25), cela signifie que
(32) C1 (0 ) = , C 2 (0 ) =
1 1
2 2
et encore, d'après (27),
(33) C1 (t ) = e e , C 2 (t ) =
1 − β t −iα t 1
2 2

Maintenant, souvenez-vous que K 1 et K 2 sont l'un et l'autre des combinaisons linéaires de K 0 et


K 0 . Dans les équations (33), les amplitudes ont été choisies de sorte qu'à t = 0, les contributions de
K 0 s'annulent l'une l'autre par interférence, laissant seul l'état K 0 . Mais l'état K 1 varie avec le
temps alors que l'état K 2 ne varie pas. Au-delà de t = 0, l'interférence entre C1 et C 2 donnera des
amplitudes finies pour K 0 et K 0 .

Que signifie tout cela ? Revenons-en à l'expérience que nous avions schématisée dans la figure plus
haut. Un méson π − produit une particule Λ0 et un méson K 0 qui se ballade à travers l'hydrogène
de la chambre. Tandis qu'il progresse, il a une certaine chance, faible mais constante, de percuter un
noyau d'hydrogène. Au début, nous pensions que la conservation de l'étrangeté empêcherait la
particule K de fabriquer un Λ0 dans une telle interaction. Nous voyons maintenant que ceci n'est
pas vrai. Car, bien que notre particule K soit, lors de sa création, un K 0 , lequel ne peut pas
fabriquer de Λ0 , elle ne reste pas dans cet état. Bientôt, il y aura une certaine amplitude pour qu'elle
ait basculé dans l'état K 0 . On doit donc s'attendre à observer parfois un Λ0 produit sur le parcours
de la particule K. Les chances que cela arrive sont données par l'amplitude C − que nous pouvons
relier à C1 et C 2 (en utilisant à rebours les équations (26)). Cette relation s'écrit

(34) C − =
1
(
2
)
(C1 − C 2 ) = 1 e − β t e −iα t − 1
2
Tandis que notre particule K continue son chemin, la probabilité pour qu'elle "agisse comme" un
2
K 0 est égale à C − , c'est-à-dire

(35) C −
2
=
1
4
(
1 + e − 2 β t − 2e − β t cos αt )
Un résultat étrange et compliqué !

Voilà donc la remarquable prédiction de Gell-Mann et Pais. Quand un K 0 est produit, les chances
pour qu'il se transforme en K 0 , fait que pourra mettre en évidence la production d'un Λ0 , varient
avec le temps selon l'équation (35). Cette prédiction provient seulement de la logique pure et des
principes de base de la mécanique quantique, sans qu'il soit nécessaire de rien savoir du
fonctionnement interne de la particule K. Etant donné que personne ne savait rien à l'époque sur les
rouages internes, Gell-Mann et Pais ne pouvaient pas aller au-delà. Ils ne pouvaient pas donner des
valeurs théoriques à α et β . Et personne n'a su le faire depuis même si les rouages internes ont été
décryptés (la structure en quark et l'interaction faible dont la violation de la symétrie dite CP, que
nous verrons plus tard. Mais l'importance de cette violation reste un paramètre libre, non calculé).
Ils ont pu donner pour β une valeur déduite du taux expérimental de désintégration en deux pi
( 2 β = 1010 sec ), mais, quant à α , ils ne purent rien en dire.
Nous avons fait le graphique des fonctions (35) ci-dessus pour deux valeurs de α . Vous voyez que
la forme dépend très fortement du rapport entre α et β . Au départ, la probabilité K 0 est nulle.
Elle croît ensuite. Si α est grand, la probabilité aura de fortes oscillations. Si α est petit, il y aura
peu ou pas d'oscillations, la probabilité aura simplement une croissance régulière jusqu'à 1/4.

Dans une situation expérimentale typique, la particule K, dotée d'une très grande énergie, se
déplace à une vitesse constante proche de la vitesse de la lumière. Les courbes ci-dessus
représentent donc aussi la probabilité d'observer un K 0 en fonction de la longueur parcourue, avec
des distances qui sont typiquement de quelques centimètre. Vous pouvez voir ce que cette
prédiction a d'étonnant. Vous produisez une seule particule et au lieu de se désintégrer simplement,
elle fait quelque chose d'autre. Parfois elle se désintègre et parfois, elle se transforme en une
particule d'un type différent. Sa probabilité caractéristique de produire un effet varie d'étrange
manière le long de son parcours. Il n'y a rien de tout à fait semblable dans la nature. Et cette
prédiction des plus remarquables a été déduite de spéculations portant seulement sur les
interférences entre amplitudes.

S'il existe un endroit où l'on a des chances de vérifier de la manière la plus pure les principes
essentiels de la mécanique quantique, la superposition des amplitudes se produit-elle ou pas ?, c'est
bien là. Depuis, de nombreuses expériences conçues dans le but d'étudier finement ce mécanisme
ont été menées confirmant les prédictions de Gell-Mann et Pais.

Notons que cet effet manifeste aussi quelque chose d'extraordinaire. En effet, on part d'une
particule de matière, le K 0 , et on aboutit à une particule d'antimatière, le K 0 . Il y a donc une
légère asymétrie dans la matière - antimatière. C'est la seule manifestation connue de cette
asymétrie car cette symétrie, fortement reliée à la symétrie CP, est parfaitement respectée par les
interactions électromagnétiques et fortes. Il est possible que cette petite différence puisse être à
l'origine de l'abondance de matière dans l'univers et de la rareté de l'antimatière.

L'analyse que nous venons de décrire est très caractéristique de la façon dont on utilise aujourd'hui
la mécanique quantique pour la recherche d'une compréhension des particules étranges. Toutes les
théories compliquées dont vous pouvez entendre parler à ce sujet ne sont ni plus ni moins que de
simples tours de passe-passe de ce genre là, utilisant le principe de superposition et autres principes
de mécanique quantique de cet acabit. Certains prétendent avoir des théories qui leur permettent de
calculer α et β , ou au moins α , connaissant β , mais ces théories n'ont aucun intérêt. Par
exemple, la théorie qui prédit la valeur de α connaissant β , nous dit que cette valeur de α devrait
être infinie. L'ensemble des équations dont ils partent concerne deux mésons pi qui transitent vers
un K 0 et ainsi de suite. Après manipulation, on aboutit en effet à deux équations similaires à celles
que nous avons ici. Mais comme il y a un nombre infini d'états à deux pions, selon leurs
impulsions, l'intégration sur toutes les possibilités donne un α infini. Pourtant l' α de la nature
n'est pas infini. Les théories dynamiques sont donc fausses. Il est vraiment remarquable que les
seules prédictions que l'on puisse faire dans le monde des particules étranges aient pour origine les
principes de mécanique quantique du niveau de ce cours.
I.4. Généralisation aux systèmes à N états
Nous en avons terminé avec les systèmes à deux états dont nous voulions parler. Nous reviendrons
à des systèmes de ce genre lorsque nous aborderons le spin. Dans la suite, nous en viendrons à
l'étude des systèmes à d'avantages d'états. L'extension aux systèmes à N états des idées que nous
avons développées pour les systèmes à deux états est assez directe. Cela se fait ainsi.

Si un système à N états distincts, nous pouvons représenter chaque état ψ (t ) comme une
combinaison linéaire d'un ensemble quelconque d'états de base i , où i = 1, 2, 3,… N.
(1) ψ (t ) = ∑ i C (t )i
tout i

Les coefficients C i (t ) sont les amplitudes i ψ (t ) . Le comportement des amplitudes C i en


fonction du temps est déterminé par les équations
dC
(2) ih i = ∑ H ij C j
dt j

où la matrice H ij décrit la physique du phénomène. Cela ressemble au cas de deux états.


Seulement, cette fois, i et j doivent chacun avoir pour domaine l'ensemble des N états de base et la
matrice énergie H ij , ou si vous préférez, l'hamiltonien, est une matrice N par N avec N 2 éléments.
Comme avant, H ij∗ = H ji , pour autant que les particules soient conservées (contrairement au cas
des mésons K, par exemple) et les éléments diagonaux de H ij sont des nombres réels.

Nous avons déjà trouvé les solutions pour les C d'un système à deux états lorsque la matrice énergie
est constante (indépendante de t). Il n'est pas non plus difficile de résoudre l'équation (2) pour un
système à N états quand H ne dépend pas du temps. A nouveau, commençons par chercher une
solution possible pour laquelle les amplitudes ont toutes la même dépendance en temps. Nous
essayons
(3) C i = a i e − (i / h )Et
Quand on substitue ces C i dans (2), les dérivées dC i / dt deviennent simplement (− i / h )EC i . En
supprimant le facteur commun à tous les termes, on obtient :
(4) Ea i = ∑ H ij a j
j

C'est un ensemble de N équations algébriques linéaires pour N inconnues a1 , a 2 , …, a N et il n'y a


de solution que si vous avez de la chance, uniquement si le déterminant des coefficients de tous les
a est nul. Mais il n'y a pas lieu d'être aussi compliqué. Vous pouvez simplement commencer à
résoudre les équations de la manière que vous voudrez et vous trouverez qu'on ne peut les résoudre
que pour certaines valeurs de E (rappelez-vous que E est la seule chose ajustable que nous ayons
dans ces équations).

Si néanmoins vous voulez être formalistes, vous pouvez écrire (4) sous la forme
(5) ∑ (H ij − δ ij E )a j = 0
j

Vous pouvez ensuite utiliser la règle, si vous la connaissez, selon laquelle ces équations n'ont une
solution que pour les valeurs de E qui satisfont à
(6) det (H ij − δ ij E ) = 0

Chaque terme du déterminant est simplement H ij sauf que E est soustrait de chaque élément
diagonal. Ainsi, l'équation (6) signifie simplement
 H 11 − E H 12 H 13 L
 
 H 21 H 22 − E H 23 L
(7) det  =0
H 31 H 32 H 33 − E L
 
 L L L L 
 
Ce n'est là, bien sûr, qu'une forme particulière d'équation algébrique pour la variable E. C'est la
somme d'un tas de produits portant sur tous les termes pris dans un certain ordre. Ces produits
donneront toutes les puissances de E jusqu'à E N .

Nous avons donc un polynôme du Nième ordre égal à zéro. Il y a en général N racines (nous
devons nous souvenir que certaines d'entre elles peuvent être des racines multiples, autrement dit,
plusieurs racines peuvent être égales). Désignons ces N racines par
(8) E I , E II , E III , …, En , …, E N
(nous utiliserons n pour représenter le nième chiffre romain. n prend donc toutes les valeurs I, II,
…, N). Il se peut que certaines de ces énergies soient égales, disons E II = E III , mais nous préférons
leur conserver des noms différents.

Les équations (4) ou (5) ont une seule solution pour chaque valeur de E. Si nous portons l'une
quelconque des valeurs de E, disons En , dans (4) et si nous cherchons les solutions pour les a i ,
nous obtenons un ensemble de valeurs associées à l'énergie En . Nous désignons ces solutions par
a i (n ) .

En portant ces a i (n ) dans (3), nous obtenons les amplitudes C i (n ) , amplitudes pour qu'un état
d'énergie définie soit dans l'état de base i . En désignant par n le vecteur d'état représentant à t =
0 l'état d'énergie définie, nous pouvons écrire
(i / h )En t
(9) C i (n ) = i n e
avec
(10) i n = ai (n )

L'état d'énergie définie complet ψ n (t ) peut alors s'écrire


− (i / h ) Ent
(11) ψ n (t ) = ∑ i ai (n )e
i
ou
(i / h )En t
(12) ψ n (t ) = n e

Les vecteurs d'état n décrivent la configuration des états d'énergie définie, mais le facteur de
dépendance au temps est omis. Ils constituent ainsi des vecteurs constants que l'on peut utiliser
comme nouvelle base si on le désire. Chacun des états n a la propriété suivante, que vous pouvez
facilement établir, sous l'action de l'opérateur hamiltonien Ĥ , il redonne simplement le même état
que multiplie En .
(13) Hˆ n = E nn

L'énergie En apparaît ainsi comme un nombre caractéristique de l'opérateur hamiltonien Ĥ .


Comme nous l'avons vu, un hamiltonien aura en général plusieurs énergies caractéristiques. Dans le
monde des mathématiciens, on les appelle "valeurs propres" de la matrice H ij . Les physiciens leur
donnent habituellement également ce nom ou celui de "eigen" de H ("eigen" est le mot allemand
pour "caractéristique" ou "propre"). A chaque valeur de "eigen" de H, autrement dit, à chaque
énergie, correspond un état d'énergie définie, état que nous avons désigné par "stationnaire". On
désigne le plus souvent ces états n comme "états propres" ou "eigen" ou "vecteurs propres" de
Ĥ . A chaque état propre correspond une valeur propre particulière En .

De manière générale, les états n , qui sont au nombre de N, peuvent définir une base. Pour que ce
soit vrai, il faut que tous les états soient orthogonaux, ce qui signifie que pour deux quelconques
d'entre eux, disons n et m ,
(14) n m = 0

Ceci sera automatiquement vrai si toutes les énergies sont différentes. On peut d'autre part
multiplier tous les a i (n ) par un facteur approprié pour que tous états soient normalisés, par là nous
entendons que,
(15) n n = 1
pour tout n .

Quand il arrive par accident que l'équation (7) a deux racines (ou plus) à la même énergie, il y a
encore quelques complications mineures. Tout d'abord, il y a bien encore deux séries différentes de
coefficients a i même pour des valeurs égales de l'énergie, mais les états qu'ils définissent peuvent
ne pas être orthogonaux. Supposez qu'ayant procédé de façon normale, vous trouviez deux états
stationnaires avec des énergies égales, désignons les par µ et ν . Il se peut qu'ils ne soient pas
orthogonaux, si vous êtes malchanceux, vous aurez
(16) µ ν ≠ 0

Mais il vous sera chaque fois possible de mijoter deux nouveaux états que nous désignerons par
µ ′ et ν ′ qui, tout en ayant la même énergie, sont aussi orthogonaux. On aura donc
(17) µ ′ ν ′ = 0

Vous pouvez aboutir à cela en construisant µ ′ et ν ′ comme des combinaisons linéaires de µ


et ν dont les coefficients sont choisis de manière à satisfaire (17). Nous supposerons en général
que ceci a été fait et, par conséquent, que tous nos états d'énergie propre sont orthogonaux.

Nous aimerions, pour le plaisir, prouver que deux états stationnaires d'énergies différentes sont
toujours orthogonaux. Pour l'état n d'énergie En , on a
(18) Hˆ n = E n n

Cette équation d'opérateur implique en fait une équation entre nombres. D'ailleurs, après que nous
ayons remis les parties manquantes, elle s'écrit
(19) ∑ i Hˆ j j n = E i nn
j
Si nous prenons le complexe conjugué de cette équation, nous obtenons
∗ ∗ ∗
(20) ∑
j
i Hˆ j jn = En∗ i n

Souvenez-vous maintenant que le complexe conjugué d'une amplitude est l'amplitude du processus
inverse. Ainsi, (20) peut se récrire sous la forme
(21) ∑ n j j Hˆ i = E ∗ n i n
j

Cette équation étant vraie quel que soit i, elle a pour "forme condensée"
(22) n Ĥ = En∗ n

C'est ce qu'on appelle la relation "adjointe" de (18).

On peut maintenant prouver sans difficulté que En est un nombre réel. Nous multiplions (18) par
n pour obtenir
(23) n Hˆ n = En
puisque n n = 1 . Nous multiplions ensuite (22) sur la gauche par n et nous obtenons
(24) n Ĥ n = En∗

En comparant (23) et (24), on voit immédiatement que


(25) E n = E n∗
ce qui signifie que En est réel. Nous pouvons effacer l'étoile de En dans l'équation (22).
Nous voilà enfin en mesure de prouver que les états d'énergies différentes sont orthogonaux.
Prenons n et m , deux quelconques des états de base d'énergie définie. En appliquant à l'état m
l'équation (22) et en multipliant ensuite par n , nous obtenons
(26) m Hˆ n = Em m n

Si, d'autre part, nous multiplions (18) par m , nous obtenons


(27) m Hˆ n = En m n

Les termes de gauche de ces deux équations étant égaux, les termes de droite le sont aussi, d'où :
(28) Em m n = En m n

Si Em = En , l'équation ne nous apprend rien. Mais si les énergies des deux états m et n sont
différentes ( Em ≠ En ), l'équation (28) nous dit que m n doit être nul. C'est ce que nous voulions
montrer. Les deux états sont nécessairement orthogonaux, pour autant que En et Em sont
numériquement différents.
II. Equation de Schrödinger

II.1. Développement de l'équation


Nous en arrivons maintenant au développement de l'équation de Schrödinger.

En nous servant de ce que nous avons vu avec les solutions des équations quantiques dans le cas à
N états, nous allons étudier comment peut se comporter un électron lorsqu'il se propage dans un
cristal.

A partir de là, par analogie et un passage à la limite, nous pourrons en déduire l'équation de
Schrödinger pour une particule libre ou plongée dans un potentiel.
II.1.1. Propagation dans un réseau cristallin

II.1.1.1. Etats d'un électron dans un réseau à une dimension


Nous pourrions penser, à première vue, qu'un électron de basse énergie aurait beaucoup de
difficultés à passer au travers d'un bloc de cristal. Les atomes sont tassés, leurs centres n'étant
distants que de quelques angströms et le diamètre effectif de l'atome pour diffuser un électron est
lui aussi de l'ordre de l'angström. Autrement dit, les atomes sont grands par rapport à leur
espacement et vous vous attendriez à ce que le parcours moyen entre collisions soit de l'ordre de
quelques angströms, ce qui n'est pratiquement rien. Vous vous attendriez à ce que l'électron se
heurte presque immédiatement à quelqu'atome. Néanmoins, si le réseau est parfait, les électrons
peuvent voyager avec aisance au travers du cristal, pratiquement comme s'ils étaient dans le vide.
C'est un phénomène d'ubiquité de la nature. C'est ce fait étrange qui permet aux métaux de conduite
l'électricité si facilement. Il a aussi permis le développement de nombreux systèmes d'intérêt
pratiques. C'est lui, par exemple, qui permet à un transistor d'imiter la lampe radio. Dans une lampe
radio, les électrons se déplacent librement à travers le vide, tandis que dans le transistor ils se
déplacent librement à travers un réseau cristallin. Les mécanismes qui expliquent le comportement
des transistors seront décrits dans ce qui suit mais nous verrons plus tard les applications de ces
principes dans divers dispositifs d'intérêt pratique.

La conduction des électrons dans un cristal est un exemple parmi d'autres d'un phénomène très
général. Il n'y a pas que les électrons à pouvoir voyager à travers des cristaux, d'autres "choses"
aussi, telles que les excitations atomiques peuvent se comporter de manière semblable. Ainsi, le
phénomène dont nous voulons discuter apparaît de multiples façons dans l'étude de la physique à
l'état solide.

Nous avons déjà discuté d'exemples de systèmes à deux états. Imaginons maintenant un électron
qui puisse se trouver dans l'une des deux positions, l'environnement restant du même type dans l'un
et l'autre cas. Supposons aussi qu'il existe une certaine amplitude pour qu'il passe d'une position à
l'autre et bien sûr la même amplitude pour le passage inverse. Les lois de la mécanique quantique
donnent alors les résultats suivants. Il existe deux états d'énergie définie possible pour l'électron.
Tout état peut être décrit en donnant les amplitudes pour que l'électron soit dans chacune des deux
positions de base. Pour l'un et l'autre état d'énergie définie, les grandeurs de ces amplitudes sont
constantes dans le temps et les phases varient en fonction du temps avec une même fréquence. Par
ailleurs, si l'électron est au départ dans une position, il passera plus tard à l'autre et plus tard encore
il sera de retour à la première position. L'amplitude est analogue au mouvement de deux pendules
couplés.

Considérez maintenant un réseau cristallin parfait et imaginez qu'un électron puisse y être situé
dans une sorte de "trou", près d'un certain atome et qu'il ait une certaine énergie. Supposez en outre
que cet électron a une certaine amplitude de se déplacer dans un trou différent, près de l'un des
atomes voisins. C'est un peu comme le système à deux états, mais avec une complication
supplémentaire. Une fois l'électron arrivé à l'atome voisin, il peut repartir vers une nouvelle
destination ou bien revenir au point de départ. Nous avons maintenant une situation analogue non
pas à deux pendules couplés mais à une infinité de pendules tous couplés les uns avec les autres.
Cela peut vous rappeler l'une de ces machines, faite d'une longue série de barres montées sur un fil
de torsion, et que l'on utilise en première année de physique pour démontrer la propagation des
ondes.

Si vous avez un oscillateur harmonique couplé à un autre oscillateur harmonique, celui-ci étant
couplé à un autre et ainsi de suite… et si vous provoquez une irrégularité en un endroit, cette
irrégularité se propagera comme une onde le long de la ligne. La même situation existe si vous
placez un électron près de l'un des atomes d'une longue chaîne d'atomes.

Habituellement, la manière la plus simple d'analyser le problème mécanique n'est pas de penser à
ce qui se passe si une impulsion est donnée en un point précis mais plutôt de considérer les
solutions d'ondes stationnaires. Il existe certains modes de perturbation qui se propagent au travers
du cristal comme une onde de fréquence constante et unique. La même chose se produit avec
l'électron et pour les mêmes raisons car il est décrit, en mécanique quantique, par le même type
d'équations.

Cependant vous devez bien comprendre ceci : l'amplitude pour que l'électron soit en un lieu est une
amplitude et non une probabilité. Si l'électron ne faisait que s'écouler d'un endroit vers l'autre,
comme l'eau à travers un trou, le comportement serait complètement différent. Par exemple, si nous
avions deux réservoirs réunis par un tuyau permettant un certain écoulement de l'un vers l'autre, les
niveaux tendraient exponentiellement à s'égaliser. Mais ce qui se passe pour l'électron, c'est un
écoulement d'amplitude et non pas un banal écoulement de probabilité. Et c'est une caractéristique
du terme imaginaire, le i dans les équations différentielles de mécanique quantique, qui change la
solution exponentielle en une solution oscillatoire. Ce qui se passe alors est tout à fait différent de
l'écoulement entre deux réservoirs reliés entre eux.

Nous voulons maintenant analyser de façon quantitative la situation quantique. Imaginez un


système à une dimension, constitué d'une longue ligne d'atomes comme indiqué sur la figure ci-
dessus (un cristal, bien sûr, a trois dimensions, mais la physique est pratiquement la même. Une
fois que vous aurez compris le cas à une dimension, vous pouvez comprendre ce qui se passe à trois
dimensions). Nous voulons voir ensuite ce qui se passe si nous mettons un électron et un seul sur
cette ligne d'atomes. Bien sûr, dans un cristal réel, il y a déjà des milliers d'électrons. Mais la plus
part (presque tous dans un cristal isolant) prennent place dans un mouvement d'un certain type,
chacun autour de son atome, et tout est pratiquement stationnaire. Mais ce que nous voulons savoir
c'est ce qui se passe si nous introduisons un électron supplémentaire. Nous ne nous occuperons pas
de ce que font les autres car nous supposons qu'il faudrait, pour changer leur mouvement,
énormément d'énergie d'excitation. Nous allons ajouter un électron comme s'il s'agissait de produire
un ion négatif faiblement lié. En observant ce que fait cet unique électron supplémentaire, nous
faisons une approximation, nous négligeons le mécanisme interne des atomes. L'expérience montre
que cette approximation est généralement bien justifiée.

Bien sûr, l'électron peut ensuite passer à un autre atome, transférant ailleurs l'ion négatif. Nous
supposerons que cet électron peut sauter d'un atome à l'atome voisin de droite ou de gauche avec
une certaine amplitude.

Comment décririons-nous un tel système ? Quels seront les états de base raisonnables ? Vous
pouvez aisément deviner comment cela va se passer. Supposez que, dans notre rangée d'atomes,
tous les espaces sont égaux (c'est un cristal) et nous donnons à chaque atome un numéro d'ordre,
comme indiqué sur la figure (a). L'un des états de base correspond à l'électron situé sur l'atome
numéro 6, pour un autre état de base, l'électron est à l'atome numéro 7, ou à l'atome numéro 8 et
ainsi de suite. Nous pouvons décrire le nième état de base en disant que l'électron est à l'atome
numéro n. Disons que c'est l'état de base n . La figure ci-dessus montre ce que nous entendons par
les trois états n − 1 , n et n + 1 .

A partir de ces états de base, nous pouvons décrire tout état φ de notre cristal à une dimension en
donnant l'amplitude n φ pour que l'état φ soit dans l'un des états de base, autrement dit
l'amplitude pour que l'électron soit localisé à un atome particulier. Nous pouvons ensuite écrire
l'état φ comme une superposition des états de base
(1) φ = ∑ n n φ
n
Puis, nous supposerons que l'électron, situé à l'un des atomes, a une certaine amplitude pour passer
à l'atome voisin de droite ou de gauche. Et pour prendre le cas le plus simple, nous supposerons
qu'il ne peut passer qu'aux atomes immédiatement voisins pour atteindre le plus proche parmi les
autres, il lui faut donc procéder en deux étapes. Nous poserons que les amplitudes pour le saut d'un
atome au suivant sont iA / h (par unité de temps).

Pour le moment nous représenterons par C n l'amplitude n φ pour que l'électron soit au nième
atome. Alors l'équation (1) devient
(2) φ = ∑ n C n
n

Si nous connaissions chacune des amplitudes C n à un instant donné, nous pourrions prendre le
carré de leurs modules et obtenir la probabilité que vous trouviez l'électron, si vous le cherchiez à
l'atome n à cet instant.

Quelle sera la situation un peu plus tard ? Par analogie avec les systèmes à deux états que nous
avons étudiés, nous pouvons supposer que les équations hamiltoniennes pour ce système doivent
être de ce type :
dC (t )
(3) ih n = E 0 − AC n+1 (t ) − AC n −1 (t )
dt

Le premier coefficient sur la droite, E 0 , est, physiquement, l'énergie qu'aurait l'électron s'il ne
pouvait pas passer d'un atome à l'autre (ce que nous représentons par E 0 importe peu. E 0 ne
représente en effet, comme nous l'avons déjà vu, rien d'autre que notre convention de niveau zéro
d'énergie). Le terme suivant représente l'amplitude par unité de temps pour que l'électron passe
dans le nième trou venant du (n+1)ième et le dernier terme est l'amplitude pour qu'il y vienne à
partir du (n-1)ième. Comme d'habitude nous supposerons que A est une constante (indépendante du
temps).
La description intégrale du comportement de tout état φ demanderait que nous ayons une équation
telle que (3) pour chacune des amplitudes C n . Comme le cristal que nous considérons a un très
grand nombre d'atomes, nous supposerons qu'il y a un nombre infiniment grand d'états et que la
chaîne d'atomes s'étend à l'infini dans les deux directions (pour traiter le cas fini, il nous faudra
faire particulièrement attention à ce qui se passe aux extrémités). Si le nombre N de nos états de
base est infiniment grand, nos équations hamiltoniennes sont aussi en nombre infini ! Nous n'en
écrirons qu'un échantillon :
M M
dC n −1
ih = E0 C n −1 − AC n − 2 − AC n
dt
dC
(4) ih n = E 0 C n − AC n −1 − AC n +1
dt
dC
ih n +1 = E0 C n +1 − AC n − AC n + 2
dt
M M
II.1.1.2. Etats d'énergie définie
Il y a beaucoup de choses que l'on pourrait étudier concernant un électron dans un réseau, mais
essayons d'abord de trouver les états d'énergie définie. Autrement dit, comme nous l'avons vu
précédemment, il nous faut trouver une situation telle que les amplitudes varient toutes avec la
même fréquence, si, du moins elles varient avec le temps. Nous cherchons des solutions de la forme
(1) C n = a n e − iEt / h

Le nombre complexe a n nous renseigne sur la partie, invariante avec le temps, de l'amplitude pour
que l'on trouve l'électron au nième atome. Si nous essayons cette solution dans notre système
d'équations pour voir ce qui en résulte, nous obtenons ceci :
(2) Ea n = E0 a n − Aa n +1 − Aa n −1

Nous avons un nombre infini d'équations de ce type, concernant un nombre infini d'inconnues a n ,
ce qui est assez effrayant.

Tout ce que nous avons à faire, c'est de prendre le déterminant… mais attendez ! Des déterminants
pour 2, 3 ou 4 équations, cela va bien. Mais s'il y a un grand nombre d'équations ou un nombre
infini, les déterminants ne sont plus très pratiques. Nous ferions mieux d'essayer de résoudre les
équations directement. Désignons d'abord les atomes par leurs positions. Nous dirons que l'atome n
est à x n et l'atome (n+1) à x n +1 . Si l'espacement des atomes est b, nous aurons x n +1 = x n + b . En
choisissant notre origine à l'atome 0, nous avons simplement x n = nb . Nous pouvons récrire ainsi
l'équation (1)
(3) C n = a ( x n )e − iEt / h
et l'équation (2) devient alors
(4) Ea ( x n ) = E 0 a ( x n ) − Aa ( x n +1 ) − Aa ( x n −1 )

Ou encore, en utilisant le fait que x n +1 = x n + b


(5) Ea ( x n ) = E 0 a ( x n ) − Aa ( x n + b ) − Aa ( x n − b )
Cette équation est un peu semblable à une équation différentielle. Elle nous dit qu'une certaine
quantité a( x ) en un point x n est reliée à la même quantité en certains points voisins, x n ± b (une
équation différentielle relie la valeur d'une fonction en un point à ses valeurs en des points
infiniment proches). Les méthodes que nous utilisons habituellement pour résoudre les équations
différentielles pourraient peut-être marcher ici, essayons.

Les équations différentielles linéaires avec coefficients constants peuvent toujours se résoudre en
termes de fonctions exponentielles. Nous pouvons essayer la même chose ici. Essayons la solution
(6) a ( x n ) = e
ikxn

L'équation (4) devient alors


(7) Ee ikxn = E0e ikxn − Aeik ( xn + b ) − Aeik ( xn −b )

Nous pouvons diviser par le facteur commun e ikxn . On obtient


(8) E = E 0 − Ae ikb − A − ikb

Les deux derniers termes sont simplement 2 A cos kb , ainsi


(9) E = E0 − 2 A cos kb

Nous avons trouvé que, pour n'importe quelle constante k, il y a une solution dont l'énergie est
donnée par cette équation. Il y a différentes énergies possibles qui dépendent de k et à chaque
valeur de k correspond une solution différente. Il y a un nombre infini de solutions, ce qui n'est pas
surprenant puisque nous sommes partis d'un nombre infini d'états de base.

Voyons ce que signifient ces solutions. Pour chaque k, les a sont donnés par (6). Les amplitudes C n
sont alors données par
(10) C n = e e − (i / h )Et
ikxn
où l'énergie E, il ne vous faut pas l'oublier, dépend aussi de k selon l'équation (9). La dépendance
d'espace de ces amplitudes est eikxn . Les amplitudes oscillent quand nous nous déplaçons d'atome
en atome.

Ce que nous disons, c'est que, dans l'espace, l'amplitude se comporte comme une oscillation
complexe, la grandeur est la même en chaque atome, mais la phase à un instant donné augmente
(ikb) d'un atome à l'autre. Nous pouvons nous représenter ce qui se passe en dessinant une ligne
verticale qui, à chaque atome, représente uniquement la partie réelle. Ce que nous avons fait dans la
figure ci-dessus. L'enveloppe de ces lignes verticales (indiquée par le trait discontinu) est, bien
entendu, une sinusoïde. La partie imaginaire de C n est aussi une fonction oscillante mais dont la
phase est décalée de 90°, de sorte que le carré du module (qui est la somme des carrés des parties
réelles et imaginaires) est le même pour tous les C.

Ainsi, ayant choisi un k, nous avons un état stationnaire d'énergie particulière E. Et pour tout état de
ce type, on a une chance égale de trouver l'électron à chacun des atomes, il n'y a pas de préférence
pour un atome ou pour un autre. La phase seule est différente pour différents atomes. De plus,
lorsque le temps passe, les phrases varient. D'après l'équation (10), les parties réelles et imaginaires
de propagent le long du cristal comme des ondes, précisément comme les parties réelles et
imaginaires de
[
i kxn − ( E / h )t ]
(11) e
L'onde peut voyager vers les x positifs ou négatifs selon le signe que nous avons choisi pour k.

Notez que nous avons supposé réel le nombre k placé dans notre solution d'essai (6). Nous pouvons
voir maintenant pourquoi il doit en être ainsi, lorsque nous avons une ligne infinie d'atomes.
k ′x
Supposez que nous ayons k imaginaire, disons ik ′ . Les amplitudes a n varieraient comme e n ,
l'amplitude deviendrait donc de plus en plus grande lorsque nous irions vers les grand x, vers les x
négatifs si k ′ est négatif. Ce type de solution pourrait marcher si nous avions affaire à une ligne
d'atomes qui ait une fin, mais ne peut pas être une solution physique pour une chaîne infinie
d'atomes. Il en résulterait des amplitudes non bornées et donc des probabilités non bornées, quel
que soit le facteur de normalisation qui serait choisi, ce qui ne peut représenter une situation réelle.
Plus loin nous verrons un exemple dans lequel un k imaginaire aurait un sens.

La relation entre l'énergie E et le nombre d'ondes k donnée par l'équation (9) est représentée ci-
dessus. Comme vous pouvez le voir sur la figure, l'énergie peut aller de E 0 − 2 A pour k = 0 à
E 0 + 2 A pour k = ±π / b . Le dessin est fait pour A positif. Si A était négatif, la courbe serait
simplement renversée, mais le "domaine" serait le même. Le résultat significatif est que toute
énergie est possible à l'intérieur d'un certain domaine, d'une certaine "bande" d'énergies, mais pas à
l'extérieur. Dans le cadre de nos hypothèses, si un électron dans un cristal est dans un état
stationnaire, il ne peut avoir d'énergie dont la valeur ne soit dans cette bande.

Selon (6), les plus petits k correspondent aux états de basse énergie, E ≈ E0 − 2 A . Si k augmente
en valeur absolue (vers des valeurs positives ou négatives) l'énergie commence par croître, mais
elle atteint un maximum à k = ±π / b , comme indiqué sur la figure. Pour des k plus grand que
π / b , l'énergie recommencerait à décroître. Mais il n'y a pas lieu de considérer de telles valeurs de
k car elles ne donnent pas de nouveaux états, elles ne font que répéter les états que nous avons déjà
pour k plus petit. Nous pouvons voir cela de la manière suivante. Considérez l'état d'énergie
minimum, pour lequel k = 0. Le coefficient a ( x n ) est le même pour tout x n . Nous aurions la même
énergie pour k = 2π / b . Mais alors (6) nous donne
i ( 2π / b ) xn
(12) a ( x n ) = e

Si nous prenons x0 comme origine, nous pouvons poser x n = nb et a ( x n ) devient


(13) a ( x n ) = e i 2π n = 1

L'état décrit par ces a ( x n ) est physiquement le même que celui que nous avons obtenu pour k = 0.
Il ne représente pas une autre solution.
Pour prendre un autre exemple, supposez que k soit égal à π / 4b . La partie réelle de a ( x n )
varierait comme indiqué par la courbe 1 ci-dessus. Si k était sept fois plus grand ( k = 7π / 4 ), la
partie réelle de a ( x n ) varierait comme indiqué par la courbe 2 (les sinusoïdes complètes n'ont bien
entendu aucune signification en soit. Tout ce qui importe ce sont les valeurs aux points x n . Les
courbes ne sont là que pour vous aider à voir ce qui se passe). Vous voyez que les deux valeurs de k
donnent les mêmes amplitudes pour tous les x n .

En conséquence, pour avoir toutes les solutions possibles de notre problème, il nous suffit de
prendre les k dans un certain domaine fini. Nous choisirons le domaine allant de − π / b à + π / b ,
celui de la figure plus haut. Dans ce domaine, l'énergie des états stationnaires croît uniformément
lorsque k croît en valeur absolue.

Une remarque en passant à propos d'une liberté que vous avez. Supposez que l'électron puisse non
seulement sauter d'un atome à son voisin le plus proche avec l'amplitude iA / h , mais qu'il ait aussi
la possibilité de passer d'un seul bon jusqu'à l'atome suivant avec quelqu'autre amplitude iB / h .
Vous verrez que la solution peut à nouveau s'écrire sous la forme a n = e n , ce type de solution est
ikx

universel. Vous trouverez également que les états stationnaires de nombre d'onde k ont une énergie
égale à E 0 − 2 A cos kb − 2 B cos 2kb . Ceci montre que la forme de la courbe de E en fonction de k
n'est pas universelle mais dépend des hypothèses particulières au problème. Ce n'est pas toujours
une forme sinusoïdale et, même, il n'y a pas toujours une symétrie par rapport à une quelconque
ligne horizontale. Ce qui reste vrai, c'est que la courbe se répète à l'extérieur de l'intervalle allant de
− π / b à + π / b . Il n'y a donc jamais lieu de s'occuper des autres valeurs de k.

Regardons d'un peu plus près ce qui se passe pour les petites valeurs de k, c'est-à-dire lorsque les
variations des amplitudes d'un x n au suivant sont très lentes. Choisissons le zéro d'énergie de sorte
que E 0 = 2 A . Le minimum de la courbe est alors à l'énergie zéro. Pour k suffisament petit, nous
pouvons écrire
(14) cos kb ≈ 1 − k 2 b 2 / 2
et l'énergie de l'équation (9) devient
(15) E = Ak 2 b 2

Nous obtenons pour ces états une énergie proportionnelle au carré du nombre d'ondes qui décrit les
variations spatiales des amplitudes C n .
II.1.1.3. Etats qui varient dans le temps
A présent, nous voudrions discuter, de façon plus détaillée, le comportement des états dans un
réseau à une dimension. Si l'amplitude pour qu'un électron soit en x n est C n , la probabilité de le
2
trouver là est C n . Pour les états stationnaires décrits plus haut, cette probabilité est la même pour
tous les x n et ne change pas avec le temps. Comment représenter une situation que nous pourrions
décrire grossièrement en disant qu'un électron d'une certaine énergie est localisé en une certaine
région, de sorte que l'on a plus de chance de le trouver en un endroit plutôt qu'un autre ? Cela peut
se faire par la superposition de plusieurs solutions stationnaires dont les valeurs de k diffèrent
légèrement, et donc aussi les énergies. Alors, au moins à t = 0, l'amplitude variera avec la position
du fait de l'interférence entre les divers termes, tout comme l'on obtient des battements lorsqu'on a
un mélange d'ondes de différentes longueurs d'onde. Nous pouvons ainsi fabriquer un "paquet
d'ondes" ayant un nombre d'ondes dominant k 0 mais contenant d'autres nombres d'ondes voisins de
k 0 (à condition de ne pas chercher à faire un paquet trop étroit).

Dans notre superposition d'états stationnaires, les amplitudes avec différents k représenteront des
états d'énergie un peu différente et donc de fréquences un peu différentes. Par suite, pour le C n
total, la figure d'interférence variera aussi avec le temps, elle présentera des battements. Les
2
maximums des battements (les maximums de C n ) se déplacent le long de x lorsque le temps
passe. Ils se déplacent avec une vitesse appelée "vitesse de groupe". Cette vitesse de groupe est
reliée à la variation de k en fonction de la fréquence

(1) v groupe =
dk
Un électron dont l'état serait un "bouquet" d'états de base, le C n variant dans l'espace comme le
paquet d'ondes ci-dessus, se déplacerait le long du "cristal" à une dimension à une vitesse v égale à
dω / dk où ω = E / h . En utilisant pour E l'équation obtenue précédemment, nous obtenons
2 Ab 2
(2) v = k
h

Autrement dit, l'électron se déplace avec une vitesse proportionnelle à la valeur centrale de k.
L'équation vue précédemment nous dit alors que son énergie est proportionnelle au carré de sa
vitesse, il se comporte comme une particule classique. Tant que nous regardons les choses d'assez
loin pour ne pas voir la structure fine, notre description quantique commence à donner des résultats
semblables à ceux que donne la physique classique. De fait, en substituant dans la dernière équation
de la section précédente le k déduit de (2), on obtient
(3) E = 12 meff v 2
où meff est une constante. Le complément "d'énergie de mouvement" dans un paquet d'ondes a la
même dépendance en vitesse qu'une particule classique. La constante meff , appelée "masse
effective", est donnée par
h2
(4) meff =
2 Ab 2

Notez que nous pouvons aussi écrire


(5) meff v = hk

Si nous désignons par convention meff v comme "impulsion", celle-ci est alors reliée au nombre
d'ondes k de la même façon que pour une particule libre.

N'oubliez pas que meff n'a rien à voir avec la masse réelle d'un électron. Il peut y avoir une très
grande différence, mais en général dans les cristaux, l'ordre de grandeur reste voisin, environ deux à
vingt fois la masse de l'électron libre.

Nous avons pu expliquer ce grand mystère, comment un électron dans un cristal (comme par
exemple un électron ajouté à un cristal de germanium) peut-il le traverser et s'y déplacer librement,
bien qu'il doive se heurter à tous les atomes ? Il peut le faire parce que ses amplitudes font bip-bip-
bip d'un atome à l'autre, lui frayant ainsi son trajet. C'est pour cette raison qu'un solide peut
conduire l'électricité.
II.1.1.4. Un électron dans un réseau à trois dimensions
Voyons un peu comment on pourrait appliquer les mêmes idées pour voir ce qui arrive à un
électron dans l'espace à trois dimensions. On aboutit à des résultats très similaires. Supposez que
nous ayons un réseau rectangulaire d'atomes d'espacements a, b, c, suivant les trois directions (si
vous voulez un réseau cubique, prenez a, b, et c tous égaux). Supposez que les amplitudes pour un
bond jusqu'à l'atome voisin dans l'alignement x, y ou z soient respectivement iAx / h , iAy / h ,
iAz / h . Et maintenant, comment devons nous décrire les états de base ? Comme dans le cas à une
dimension, un état de base est constitué pat l'électron situé près de l'atome de coordonnées x, y, z,
où (x, y, z) est un des points du réseau. Si nous prenons l'un des atomes pour origine, les positions
des points sont toutes données par
(1) x = n x a , y = n y b et z = n z c
où n x , n y et n z sont trois entiers quelconques. Mais il nous suffira de dire x, y et z en sous-
entendant qu'il s'agit de l'un des points du réseau. On peut alors représenter l'état de base par le
symbole électron en x, y, z et l'amplitude pour qu'un électron dans un état ψ soit dans cet état
de base est donnée par C ( x, y, z ) = électron en x, y, z ψ .

Comme précédemment, les amplitudes C ( x, y, z ) peuvent varier avec le temps. Avec nos
hypothèses, les équations hamiltoniennes devraient être comme ceci :
dC ( x, y, z )
ih = E 0 C ( x, y, z ) ) − Ax C ( x + a, y, z ) − Ax C ( x − a, y, z )
dt
(2) − Ay C (x, y + b, z ) − Ay C (x, y − b, z )
− Az C ( x, y, z + c ) − Az C ( x, y, z − c )

C'est un peu long, mais on voit bien l'origine de chaque terme.

Nous allons essayer de trouver un état stationnaire pour lequel tous les C varient de la même
manière avec le temps. A nouveau, la solution est une exponentielle :
i  k x x + k y y + k z z 
(3) C ( x, y, z ) = e −iEt / h e  

Si vous portez ceci dans (2), vous voyez que ça marche, pourvu que l'énergie E soit reliée à k x , k y
et k z de la manière suivante
(4) E = E0 − 2 Ax cos k x a − 2 Ay cos k y b − 2 Az cos k z c

L'énergie dépend maintenant de trois nombres d'ondes k x , k y et k z , lesquels sont, incidemment,


les composantes d'un vecteur à trois dimensions k. De fait, nous pouvons écrire (3) en notation
vectorielle
(5) C ( x, y, z ) = e − iEt / h e − ik ⋅r

L'amplitude varie comme une onde plane complexe à trois dimensions, se déplaçant dans la
(
direction de k et dont le nombre d'ondes est k = k x2 + k y2 + k z2 )
1/ 2
.

L'énergie associée à ces états stationnaires dépend des trois composantes de k de la manière
compliquée donnée par l'équation (4). Le mode de variation de E en fonction de k dépend des
signes et grandeurs relatifs de Ax , Ay et Az . Si ces trois nombres sont tous positifs et si nous nous
intéressons aux petites valeurs de k, la dépendance est relativement simple.

En développant les cosinus comme nous l'avions fait plus haut, nous obtenons cette fois
(6) E = E min + Ax a 2 k x2 + Ay b 2 k y2 + Az c 2 k z2

Pour un simple réseau cubique d'espace a, nous attendons que Ax , Ay et Az soient tous égaux,
mettons à A, et l'on doit avoir simplement
(
(7) E = E min + Aa 2 k x2 + k y2 + k z2 )
ou
(8) E = E min + Aa 2 k 2
Ce que nous avions déjà pour le cristal à une dimension. Si nous suivons les raisonnements utilisés,
nous devons en conclure que le paquet d'ondes à trois dimensions représentant un électron (formé
de la superposition de nombreux états d'énergies très voisines) se déplace lui aussi comme une
particule classique avec une certaine masse effective.

Dans un cristal de moindre symétrie qu'un cube (ou même dans un cristal cubique dans le cas où
l'état de l'électron à chaque atome n'est pas symétrique, les trois coefficients Ax , Ay et Az sont
différents. Alors la "masse effective" d'un électron localisé dans une petite région dépend de la
direction de son mouvement. Par exemple, il pourrait avoir une inertie différente selon x et selon y
(pour décrire avec exactitude cet état de chose, on fait parfois appel au "tenseur de masse
effective").
II.1.1.5. Autres états dans un réseau
Selon l'équation de l'énergie dans un réseau, les états d'électron dont il a été question ont leurs
énergies confinées dans une certaine "bande" qui s'étend depuis le niveau minimum
(1) E 0 − 2(Ax + Ay + Az )
jusqu'au niveau maximum
(2) E 0 + 2(Ax + Ay + Az )

D'autres énergies sont possibles, mais elles concernent des états d'électron d'un type différent.
Jusqu'à présent, nous avons imaginé des états de base constitués d'un électron situé à l'un des
atomes d'un cristal où il occupe un certain état, mettons l'état d'énergie minimum.

Si, à un atome libre dans l'espace, vous ajoutez un électron pour former un ion, l'ion peut se former
de diverses façons. L'électron peut s'arranger pour former l'état d'énergie minimum, il peut aussi
former l'un ou l'autre des nombreux "états excités" de cet ion dont chacun a une énergie définie au-
dessus de l'énergie minimum.

La même chose peut se passer dans un cristal. Supposons que l'énergie E 0 que nous avons choisie
ci-dessus corresponde aux états de base pour lesquels les ions ont l'énergie la plus faible possible.
Nous pourrions aussi imaginer un nouvel ensemble d'états de base pour lesquels l'électron est
agencé de manière différente avec son atome, dans l'un des états excités de l'ion, de sorte que
l'énergie E 0 se trouve alors notablement plus grande. Comme précédemment, il y a une certaine
amplitude A (pas la même) pour que l'électron saute de son état excité vers un même état excité
dans un atome voisin. Toute l'analyse se déroule comme précédemment et nous trouvons une bande
d'énergies possibles centrées à un niveau plus élevé. En général, il y aura de nombreuses bandes,
chacune correspondant à un niveau d'excitation différent.

Il y a encore d'autres possibilités. Il peut y avoir une certaine amplitude pour que l'électron passe
d'un état excité dans un atome vers un état non excité dans un autre atome voisin (cela s'appelle une
interaction entre bandes). La théorie mathématique devient de plus en plus compliquée, lorsque
vous considérez un nombre de bandes de plus en plus grand et que vous ajoutez de plus en plus de
coefficients de fuite entre les états possibles. Mais il n'y a là aucune idée nouvelle. Les équations se
posent comme nous l'avons fait dans notre exemple simple.

Il nous faudrait aussi noter qu'il n'y a pas grand chose à ajouter sur les divers coefficients qui, telle
l'amplitude A, apparaissent dans la théorie. Ils sont en général très difficiles à calculer. Par suite,
dans les cas d'intérêt pratique, la théorie ne nous apprend pas grand chose sur ces paramètres et tout
ce que nous pouvons faire, c'est utiliser les valeurs déterminées expérimentalement.

Il y a d'autres situations dont la physique et la mathématique sont presque exactement les mêmes
que ce que nous avons trouvé dans le cas d'un électron qui se déplace dans un cristal mais dans
lesquelles "l'objet" en mouvement est tout autre. Par exemple, supposez que notre cristal de départ,
ou plutôt notre réseau linéaire, soit constitué d'une rangée d'atomes neutres, ayant chacun un
électron extérieur faiblement lié. Puis imaginez que nous retirons un électron. Lequel des atomes a
perdu son électron ? Désignons par C n l'amplitude pour que l'électron manquant provienne de
l'atome n. Il y aura en général une certaine amplitude iA / h pour que l'électron d'un atome voisin,
mettons le (n-1)ième atome, saute au nième, laissant le (n-1)ième sans son électron. Il revient au
même de dire qu'il y a une amplitude A pour que l'électron manquant saute du nième atome au (n-
1)ième. Comme vous pouvez le voir, les équations sont exactement les même mais, bien sûr, la
valeur de A peut ne pas être la même. Nous aurons à nouveau les mêmes formules pour les niveaux
d'énergies, pour les "ondes" de probabilités qui se déplacent à travers le cristal avec une vitesse de
groupe, une certaine masse effective, etc. Mais, cette fois, les ondes décrivent le comportement d'un
électron manquant, d'un "trou" comme on l'appelle. Un "trou" agit donc tout à fait comme une
particule ayant une certaine masse effective meff . Cette particule vous paraîtra avoir une charge
positive. Nous reparlerons de ces trous en étudiant les semi-conducteurs.

Un autre exemple encore : imaginez une rangée d'atomes neutre tous identiques, mais dont l'un a
été mis dans un état excité, il a donc une énergie supérieure au niveau minimum. Soit C n
l'amplitude pour que le nième atome ait cette excitation. Il peut interagir avec l'atome voisin en lui
passant son excès d'énergie et en retournant lui-même à l'état minimum. Soit iA / h l'amplitude
correspondante. Vous voyez que c'est encore et toujours la même mathématique. L'objet en
mouvement s'appelle maintenant un exciton. Il se comporte comme une "particule" neutre qui, se
déplaçant à travers le cristal, transporte l'énergie d'excitation. Un mouvement de ce type est
impliqué dans certains processus biologiques, tels que la vision ou les photosynthèses. On a
supposé que l'absorption de la lumière dans la rétine produit un "exciton" qui se déplace à travers
une certaine structure périodique et que ces excitons s'accumulent en un point particulier où
l'énergie est utilisée pour induire une réaction chimique. Ces excitons se propage à travers des
molécules telles que la rhodopsine ou la chlorophylle.
II.1.1.6. Diffusion par les imperfections dans un cristal
Considérons maintenant le cas d'un électron unique dans un cristal qui ne soit pas parfait. Notre
étude précédente nous a montré que les cristaux parfaits ont une conductivité parfaite, les électrons
peuvent glisser sans frottement à travers le cristal, comme dans le vide. Parmi les choses
susceptibles d'arrêter ce mouvement perpétuel de l'électron, l'une des plus importantes consiste en
une imperfection ou irrégularité dans le cristal. A titre d'exemple, supposez qu'il y ait un atome
manquant quelque part dans le cristal ou bien supposez que quelqu'un ait mis un mauvais atome en
l'un des emplacements de sorte que la situation n'y soit pas la même qu'aux autres emplacements.
Admettons que l'énergie E 0 ou bien l'amplitude A y diffèrent. Comment pourrions-nous décrire ce
qui se passe dans ce cas ?

Pour préciser les choses, revenons au cas à une dimension et supposons que l'atome "zéro" est un
atome "d'impureté" pour lequel E 0 n'a pas la même valeur que pour les autres atomes. Désignons
cette énergie par E 0 + F . Que va-t-il se passer ? Quand l'électron arrive à l'atome "zéro", il y a une
certaine probabilité pour que l'électron soit diffusé vers l'arrière. Si un paquet d'ondes se propage et
s'il atteint un endroit où les choses sont un peu différentes, une partie du paquet va continuer sa
route et l'autre partie va rebondir vers l'arrière. Il est très difficile d'analyser une situation de ce
genre à l'aide des paquets d'ondes parce qu'alors tout change avec le temps. Il est bien plus facile de
travailler sur les solutions stationnaires. C'est ce que nous ferons donc et nous verrons que ces états
stationnaires peuvent se représenter en termes d'ondes continues ayant des parties transmises et des
parties réfléchies. En trois dimensions, nous aurions une onde diffusée au lieu d'une onde réfléchie
car elle serait alors éparpillée dans diverses directions.

Nous partons d'une série d'équations qui sont exactement les mêmes que celles que nous avions
vues à l'exception de l'équation pour n = 0 qui diffère des autres .Les cinq équations pour n = -2, -1,
0, +1 et +1 sont comme ceci :
M M
Ea − 2 = E0 a − 2 − Aa −1 − Aa −3
Ea −1 = E 0 a −1 − Aa 0 − Aa − 2
(1) Ea 0 = (E0 + F )a 0 − Aa1 − Aa −1
Ea1 = E0 a1 − Aa 2 − Aa 0
Ea 2 = E 0 a 2 − Aa3 − Aa1
M M

Bien sûr, il y a en plus toutes les autres équations pour n plus grand que 2. Elles seront exactement
semblables aux équations que nous avions vues.

Pour nous placer dans le cas le plus général, il nous faudrait prendre une valeur de A différente,
suivant qu'il s'agit de l'amplitude pour que l'électron saute de ou vers l'atome "zéro". Mais l'exemple
simplifié pour lequel tous les A sont égaux suffit à dégager les grandes lignes.

ikx
La solution exponentielle complexe e n que nous avions vue continuerait à être une solution pour
toutes les équations à l'exception de l'équation à l'atome "zéro", cela ne marche pas à cause de cette
seule équation. Il nous faut une solution différente que nous pouvons mijoter de la manière
suivante. Cette solution représente une onde se déplaçant dans la direction des x positifs. Une onde
se déplaçant dans la direction des x négatifs aurait été une solution tout aussi bonne. Elle s'écrirait
(2) a ( x n ) = e
− ikxn

La solution la plus générale serait une combinaison linéaire d'une onde vers l'avant et d'une onde
vers l'arrière, à savoir
− ikxn
(3) a n = αe + βe
ikxn

Cette solution représente une onde complexe d'amplitude α se déplaçant dans la direction +x et
une onde d'amplitude β se déplaçant dans la direction -x.
Regardez maintenant les équations de notre nouveau problème, l'équation (1) et les équations pour
tous les autres atomes. Les équations concernant les a n tels que n ≤ 1 sont toutes satisfaites par
l'équation (3) à la condition que k soit relié à E et au pas du réseau b par
(4) E = E0 − 2 A cos kb

Cela représente physiquement une onde "incidente" d'amplitude α s'approchant de l'atome "zéro"
(le "diffuseur") en venant de la gauche et une onde "diffusée" ou "réfléchie" d'amplitude β
repartant vers la gauche. Nous ne perdons rien de la généralité si nous imposons à l'amplitude α de
l'onde incidente la valeur 1. En général l'amplitude β est alors un nombre complexe.

Nous pouvons dire exactement la même chose à propos des solutions de a n pour n ≥ 1 . Comme les
coefficients peuvent être différents, nous écrivons
− ikxn
(5) a n = γe + δe
ikxn

Ici γ est l'amplitude d'une onde allant vers la droite et δ celle d'une onde venant de la droite.
Considérons la situation physique dans laquelle, initialement, il n'y a qu'une onde venant de la
gauche et, au-delà du diffuseur, ou atome d'impureté, il n'y a qu'une onde "transmise". Nous allons
essayer une solution pour laquelle δ = 0 . Nous pouvons certainement satisfaire toutes les équations
pour les a n à l'exception des trois du milieu de l'équation (1), par les solutions d'essai suivantes
a n (pour n < 0 ) = e
− ikxn
+ βe
ikxn

(6)
a n (pour n > 0 ) = γe
ikxn

La situation dont nous parlons est illustrée ci-dessous


Si nous utilisons les formules de l'équation (6) pour a −1 et a +1 , les trois équations centrales de (1)
nous permettront de calculer a 0 et les coefficients β et γ . Nous aurons ainsi trouvé une solution
complète. Si nous posons x n = nb , les trois équations qu'il faut résoudre sont
(E − E0 ){e ik (−b ) + βe −ik (−b ) } = − A{a0 + e ik (−2b ) + βe −ik (−2b ) }
(7) (E − E0 − F )a 0 = − A{γe ikb + e ik (−b ) + βe −ik (−b ) }
(E − E0 )γe ikb = − A{γe ik (2b ) + a 0 }
Rappelez-vous que E est donné en fonction de k par (4). En portant cette valeur de E dans les
( )
équations et en vous souvenant que cos x = 12 e ix + e − ix , vous tirez de la première équation
(8) a 0 = A + β
et de la troisième
(9) a 0 = γ

Ces deux équations sont compatibles à condition que


(10) γ = 1 + β

Cette équation nous dit que l'onde transmise ( γ ) est exactement l'onde initiale incidente (1) avec
une onde supplémentaire égale à l'onde réfléchie. Ce n'est pas toujours vrai mais c'est ainsi pour
une diffusion par un atome seulement. S'il y avait un amas d'atomes d'impureté, la quantité ajoutée
à l'onde se propageant vers l'avant ne serait pas nécessairement égale à l'onde réfléchie.
Nous pouvons obtenir l'amplitude β de l'onde réfléchie à l'aide de l'équation centrale de (7). Nous
trouvons
−F
(11) β =
F − 2iA sin kb

Nous avons la solution complète pour le réseau avec un unique atome anormal.

Vous vous demandez peut-être comment l'onde transmise peut-être "plus" que l'onde incidente,
comme il apparaît dans l'équation (10). Mais souvenez-vous que β et γ sont des nombres
complexes et que le nombre de particules dans une onde (ou plutôt la probabilité d'y trouver une
particule) est proportionnel au carré du module de l'amplitude.

De fait, il n'y aura "conservation des électrons" que si


(12) β + γ
2 2
=1

Vous pouvez montrer que ceci est vrai pour notre solution.
II.1.1.7. Capture par une imperfection d'un réseau
Il existe un cas d'un intérêt particulier, qui peut se produire si F est un nombre négatif. Si l'énergie
de l'électron à l'endroit de l'atome d'impureté (à n = 0) est plus faible qu'ailleurs, il peut y être
capturé. En d'autres termes, si E 0 + F est en-dessous de la limite inférieure E 0 − 2 A de la bande
d'énergie permise, l'électron peut alors se trouver "piégé" dans un état tel que E < E 0 − 2 A . Une
telle solution ne peut ressortir de ce que nous avons fait jusqu'à présent. Nous l'obtiendrons, par
contre, en accordant au nombre k la possibilité d'être imaginaire dans la solution d'essai précédente.
Posons k = iκ . Cette fois encore, nous pourrons avoir des solutions différentes pour n < 0 et pour n
> 0. Une solution possible pour n < 0 serait
(1) a n (pour n < 0 ) = ce
+ κx n

Nous devons prendre le signe plus pour l'exposant, autrement l'amplitude augmenterait
indéfiniment pour les valeurs négatives élevées de n. De même, une solution possible pour n > 0
serait
(2) a n (pour n > 0 ) = c ′e −κxn

Si nous portons ces solutions d'essai dans les équations, toutes, à part les trois du milieu, sont
satisfaites à condition que
(
(3) E = E0 − A e κb + e −κb )
La somme des deux termes exponentiels étant toujours plus grande que deux, cette énergie est en
dessous de la bande régulière et c'est ce que nous cherchons. Les trois équations restantes sont
satisfaites si c = c ′ et si κ est choisi de telle sorte que
( )
(4) A e κb − e −κb = − F

En combinant cette équation avec (3), nous obtenons l'énergie de l'électron piégé :
(5) E = E0 − 4 A 2 + F 2
L'électron piégé a une énergie unique, quelque peu en-dessous de la bande de conduction.

Notez que nos amplitudes (1) et (2) ne disent pas que l'électron piégé se trouve exactement là où se
trouve l'atome d'impureté. La probabilité de trouver l'électron au niveau des atomes voisins est
donnée par le carré de ces amplitudes. Pour un choix particulier des paramètres, elle pourrait varier
comme indiqué par les barres verticales ci-dessus. C'est à l'endroit de l'atome d'impureté que la
probabilité de trouver l'électron est la plus grande. Pour les atomes voisins, la probabilité tombe
exponentiellement avec la distance depuis l'atome d'impureté. C'est un autre exemple de "barrière
de pénétration". D'un point de vue de la physique classique, l'électron n'a pas assez d'énergie pour
s'échapper du "puits" d'énergie, mais, en mécanique quantique, il peut prendre un peu de large.
II.1.1.8. Amplitudes de diffusion et états liés
Enfin, notre exemple peut servir à illustrer un point très utile actuellement en physique des
particules de hautes énergies. Ce point concerne la relation entre les amplitudes de diffusion et les
états liés. Supposez que nous ayons découvert, par l'expérience ou par l'analyse théorique, comment
les pions diffusent sur les protons. Puis une nouvelle particule est découverte et quelqu'un se
demande si ce ne pourrait pas être tout simplement une combinaison d'un pion et d'un proton
maintenus ensemble dans un certain état lié (tout comme un électron est lié à un proton pour faire
un atome d'hydrogène). Par état lié, nous entendons une association ayant une énergie inférieure à
celle des deux particules libres.

Il y a une théorie générale qui affirme ceci : il existera un état lié à l'énergie pour laquelle
l'amplitude de diffusion, que l'on obtient par extrapolation algébrique (en mathématique on parle de
"prolongement analytique") dans les domaines d'énergie en dehors de la bande permise, deviendra
infinie.

La signification physique est la suivante. Un état lié constitue une situation où il n'y a que des
ondes attachées à un point, sans qu'aucune onde vienne de l'extérieur pour mettre en route ce
système qui fonctionne tout seul. Le rapport entre ce que l'on appelle l'onde "diffusée" ou l'onde
créée, d'une part, et l'onde "incidente" d'autre part, est infinie. Nous pouvons essayer cette idée dans
notre exemple. Ecrivons notre expression pour l'amplitude diffusée, directement en termes de
l'énergie E de la particule diffusée (au lieu que ce soit en termes de k). Nous pouvons récrire ainsi
l'équation
(1) 2 A sin kb = 4 A 2 − (E − E0 )
2

et l'amplitude diffusée devient


−F
(2) β =
F − i 4 A 2 − (E − E 0 )
2

De la façon dont nous avons établi dette équation, nous ne devions l'utiliser que pour des états réels,
ceux dont l'énergie est dans la bande permise, E = E0 ± 2 A . Mais supposez qu'ayant oublié ce fait,
nous étendions la formule dans le domaine 'non physique" où E − E 0 > 2 A . Pour ce domaine non
physique, nous pouvons écrire
(3) 4 A 2 − (E − E 0 ) = i (E − E 0 ) − 4 A 2
2 2

(la question du signe à choisir est un détail technique. Il dépend du signe permis pour κ . Nous
laissons de coté cette discussion).

"L'amplitude de diffusion", quoi qu'elle signifie, peut s'écrire


−F
(4) β =
F + (E − E 0 ) − 4 A 2
2

La question est maintenant : y a-t-il une énergie E pour laquelle β devienne infini (c'est-à-dire
pour laquelle l'expression pour β a un "pôle") ? Oui, si du moins F est négatif, le dénominateur de
(4) deviendra nul lorsque
(5) (E − E0 ) − 4 A 2 = F 2
2

ou lorsque
(6) E = E0 ± 4 A 2 + F 2

Le signe moins nous donne exactement la valeur que nous avions trouvée plus haut pour l'énergie
de capture.

Et le signe plus ? Il donne une énergie au-dessus de la bande permise. Et de fait, il y a là un autre
état lié et nous sommes passés à coté lorsque nous avons résolu les équations. A vous de trouver
l'énergie et les amplitudes a n pour cet état lié.

La relation entre la diffusion et les états liés est l'un des fils directeurs les plus utiles dans les
recherches actuelles pour une compréhension des observations expérimentales sur les nouvelles
particules étranges.
II.1.2. Variation des amplitudes avec la position
Nous allons maintenant regarder comment varient dans l'espace les amplitudes de probabilité de la
mécanique quantique. Dans ce qui a précédé, vous avez pu avoir cette impression désagréable que
certaines choses étaient laissées de coté. Par exemple, quand nous avons parlé de la molécule
d'ammoniac, nous avons pris l'option de la décrire en termes de deux états de base. Pour l'un de ces
états de base, nous avons pris la situation pour laquelle l'atome d'azote se trouve "au-dessus" du
plan des trois atomes d'hydrogène et, pour l'autre, celle où il est "en-dessous". Pourquoi avons-nous
pris uniquement ces deux états ? Pourquoi ne serait-il pas possible que l'atome d'azote soit à 2
angströms au-dessus du plan des trois atomes d'hydrogène, ou bien à 3 angströms ou à 4 ? Très
certainement, l'atome d'azote pourrait occuper beaucoup de positions diverses. Il est évident que
nous avons laissé beaucoup de détails de coté.

Nous avons sciemment éludé ces détails. Nous avons dit que seuls certains aspects du problème
nous intéressaient et, par suite, nous avons supposé que l'atome d'azote placé au-dessus du plan des
atomes d'hydrogènes se mettrait dans une certaine condition assez bien définie. Alors, la probabilité
de trouver l'azote aurait eut une certaine distribution assez bien définie au-dessus du plan des
atomes d'hydrogènes, mais les détails ne nous importaient pas.

On peut aussi voir les choses d'une autre manière. Dans notre discussion sur la molécule
d'ammoniac, nous avions choisi une description approchée, lorsque nous parlions en termes de
deux états de base. En réalité, il y a une foule d'états. Par exemple, pour l'électron se propageant
dans un cristal, l'électron peut se mettre dans la situation de l'état le plus bas, mais il y a aussi de
nombreux états excités. Nous l'avions déjà suggéré. Pour chaque état excité, la distribution de
l'électron au voisinage de l'atome est différente. Nous avons ignoré ces détails en déclarant que seul
nous importait la présence de l'électron au voisinage de l'atome. Nous avons ignoré le détail des
états excités. Mais ce sont justement ces états excités qui donnent lieu à des distributions diverses
de l'électron autour de l'atome. Si nous voulons décrire en détail les atomes, nous devons prendre
aussi en considération ces autres états de base possibles. Nous pourrions le faire de diverses
manières dont l'une consisterait à considérer de plus près des états pour lesquels la position de
l'électron dans l'espace est plus explicitement décrite.
Nous sommes maintenant en mesure d'envisager une procédure plus élaborée qui nous permettra de
parler de manière précise de la position de l'électron, ceci en donnant une amplitude probabilité
pour trouver l'électron en quelque endroit que ce soit. Cette théorie plus complète fournira les
soubassements des approximations que nous avons faites dans nos discussions antérieures. Les
équations que nous avions alors peuvent apparaître comme une sorte d'approximation d'une théorie
plus complète.

Mais pourquoi n'avons nous pas commencé par la théorie plus complète, en faisant des
approximations au fur et à mesure ? Nous avons pensé qu'il vous serait plus facile de saisir les
rouages de la mécanique quantique en commençant par les approximations à deux états pour tendre
progressivement vers la théorie plus complète, plutôt qu'en abordant le sujet en sens inverse. Notre
façon d'aborder le sujet se trouve ainsi être l'ordre inverse de celui que vous trouverez dans
beaucoup de livres.

Quand nous entrerons dans le vif du sujet, vous remarquerez l'abandon d'une règle que nous avons
toujours suivie jusqu'à présent. Chaque fois que nous avons abordé un sujet, nous avons essayé de
donner une description plus ou moins complète de la physique, cherchant, si possible, à vous
montrer où conduisaient les idées énoncées. Tout en décrivant certains détails particuliers, nous
nous sommes efforcés de vous montrer les conséquences générales d'une théorie, de sorte que vous
puissiez voir où elle pouvait conduire. Nous allons abandonner cette règle. Nous allons voir
comment on peut parler des amplitudes de probabilité dans l'espace et vous montrer les équations
différentielles qui les gouvernent. Nous n'aurons pas la possibilité de traiter toutes les implications
qui découlent directement de cette théorie. De fait, nous ne pourrons pas même aller jusqu'à relier
cette théorie à certaines des formules approchées que nous avons utilisées précédemment, en ce qui
concerne par exemple la molécule d'ammoniac. Nous pourrons toutefois montrer de nombreux
prolongements et développements de la théorie et il sera toujours possible au lecteur d'approfondir
certains domaines ou applications à travers la littérature spécialisée. Après tout, il nous faut bien
laisser quelque chose pour l'avenir.
II.1.2.1. Les amplitudes le long d'une droite
Comment un électron peut-il se déplacer le long d'une ligne d'atomes ? Revoyons une fois encore
ce que nous avons appris à ce sujet. Quand un électron a une certaine amplitude pour sauter d'un
atome à l'atome voisin, il existe alors des états d'énergie définie, pour lesquels l'amplitude de
probabilité pour trouver l'électron est distribuée le long du réseau sous la forme d'une onde
progressive. Pour de grandes longueurs d'onde, c'est-à-dire pour les faibles valeurs du nombre
d'ondes k, l'énergie de l'état est proportionnelle au nombre d'ondes. Pour un réseau cristallin de pas
b, dans lequel l'amplitude par unité de temps pour le saut de l'électron d'un atome à l'autre est
iA / h , l'énergie de l'état est reliée à k (pour kb petit) par
(1) E = Ak 2 b 2

Nous avons vu aussi qu'un groupe d'ondes de ce type avec des énergies voisines pouvait constituer
un paquet d'ondes ayant le comportement d'une particule classique de masse effective meff donnée
par :
h2
(2) meff =
2 Ab 2

Du fait que les ondes d'amplitude de probabilité se comportent dans un cristal comme une particule,
on pourrait bien s'attendre à ce que la description quantique d'une particule présente le même type
de comportement ondulatoire. Imaginez un réseau linéaire et supposez que nous rendions le pas b
de plus en plus petit. A la limite, nous pourrions trouver l'électron n'importe où le long de la ligne.
Ce serait une manière de décrire le mouvement d'un électron dans le vide. En d'autres termes, si
nous imaginons l'espace comme une infinité de points tous très proches les uns des autres et si nous
savons établir les équations qui relient les amplitudes en un point aux amplitudes aux points
voisins, nous aurons les lois quantiques du mouvement d'un électron dans l'espace.

Il peut sembler quelque peu audacieux de remplacer une ligne d'atomes par une simple ligne de
points. Après tout, les atomes sont pour le moins différents des points de l'espace ! Mais ce qui a
servi à élaborer les équations (1) et (2) n'est pas tant le fait que ces atomes soient particuliers avec
une certaine structure plus ou moins complexe que le fait que l'électron était localisé au voisinage
de l'atome. En outre, si un électron est localisé autour d'une petite zone de l'espace, qu'elle soit
occupée par un atome ou pas, l'électron a une certaine amplitude pour se déplacer autour d'une
autre petite zone de l'espace. La comparaison est donc plus qu'une analogie et les équations
utilisées peuvent s'appliquer telles qu'elles. En outre, les équations (1) et (2) ont été obtenues avec
l'approximation de kb petit et pour l'espace, où b tend vers zéro (les points sont contigus), cette
approximation est évidemment valide. Nous ne rencontrerons évidemment pas ici des situations
telles qu'un atome dans un état excité étant entendu qu'un point de l'espace est immatériel et
pourrait difficilement être dans un état excité.

Commençons par rappeler certains des principes généraux de la mécanique quantique. Supposez
que nous ayons dans un système quantique une particule qui peut se trouver dans diverses
conditions. Nous appelons "état" toute condition particulière dans laquelle un électron peut se
trouver et nous la représentons par un vecteur d'état, disons φ . Une autre condition peut être
représentée par un autre vecteur d'état, disons ψ . Nous introduisons ensuite l'idée d'états de base.
Nous disons qu'il y a un ensemble d'états de base 1 , 2 , 3 , 4 , etc. ayant les propriétés
suivantes. D'abord, tous ces états sont tout à fait distincts, nous disons qu'ils sont orthogonaux. Par
là, nous voulons dire que pour deux états de base quelconques i et j , l'amplitude i j pour
qu'un électron que l'on sait être dans l'état j soit aussi dans l'état i est égale à zéro, à moins bien sûr
que i et j représentent le même état. Symboliquement, nous écrivons
(3) i j = δ ij

Vous vous souviendrez que le symbole de Kronecker δ ij = 0 si i et j sont différents et que δ ij = 1 si


i et j sont un même nombre.

Ensuite, les états de base i doivent constituer un ensemble complet, de sorte que n'importe quel
état puisse être représenté en termes de ces états de base. C'est-à-dire que n'importe quel état φ
doit pouvoir être décrit complètement par la donnée des amplitudes i φ pour qu'une particule
dans l'état φ se trouve aussi dans l'état i . En fait, le vecteur d'état φ est égal à la somme de
tous les états de base, chacun étant multiplié par un coefficient qui est l'amplitude pour que l'état
φ soit aussi dans l'état i :
(4) φ = ∑ i i φ
i

Finalement, si nous considérons deux états quelconques φ et ψ , l'amplitude pour que l'état ψ
soit aussi dans l'état φ sera déterminée en faisant d'abord la projection de l'état ψ sur les états
de base et en projetant à nouveau à partir de ces états de base sur l'état φ . Nous écrivons cela de la
manière suivante :
(5) φ ψ = ∑ φ i i ψ
i

La somme s'étend bien sûr à tout l'ensemble des états de base i .

Quand nous considérions un électron sur une ligne d'atomes, nous avions pris pour états de base
l'ensemble des états pour lesquels l'électron est localisé en l'un des atomes. L'état de base n
représentait la condition pour laquelle l'électron est localisé à l'atome numéro "n" (que nous
appelions nos états de base n au lieu de i n'a bien sûr aucune signification particulière). Un peu
plus tard, nous avons préféré désigner les états de base par la coordonnée x n de l'atome plutôt que
par son numéro d'ordre. L'état x n est le même que l'état n , seule l'écriture a changé. Ensuite,
selon les règles générales, n'importe quel état, disons ψ , est déterminé une fois les amplitudes
données pour qu'un électron dans l'état ψ soit aussi dans les divers états x n . Pour des raisons
pratiques, nous avons utilisé le symbole C n pour ces amplitudes
(6) C n = x n ψ
Du fait que les états de base sont associés à des positions sur la ligne, nous pouvons concevoir
l'amplitude C n comme une fonction de la coordonnée x et écrire C ( x n ) . De façon générale, les
amplitudes C ( x n ) vont varier avec le temps et sont donc aussi des fonctions de t. Mais, sauf
exception, nous ne nous soucierons pas d'écrire explicitement cette dépendance.

Nous avons ensuite conjecturé que la variation des amplitudes C ( x n ) avec le temps devait être
dictée par l'équation hamiltonienne. Dans notre nouvelle notation, cette équation s'écrit
∂C ( x n )
(7) ih = E0 C (x n ) − AC ( x n + b ) − AC ( x n − b )
∂t

Les deux derniers termes sur la droite représentent le processus par lequel un électron venant de
l'atome n + 1 ou de l'atome n - 1 vient se placer en n.

Nous avons trouvé que l'équation (7) a des solutions qui correspondent à des états d'énergie définie,
que nous avons écrit ainsi
(8) C ( x n ) = e iEt / h e
ikxn

Pour les états de faible énergie, les longueurs d'onde sont grandes (k est faible) et l'énergie est reliée
à k par
(9) E = (E 0 − 2 A) + Ak 2 b 2
elle est aussi donnée par l'équation (1) si nous choisissons notre zéro d'énergie de façon à ce que
E0 − 2 A = 0 .

Voyons ce qui se passerait si nous faisions tendre le pas b vers zéro, tout en conservant le nombre
d'ondes k inchangé. Si seul b changeait, le dernier terme de (9) tendrait tout simplement vers zéro et
il n'y aurait plus de physique. Mais supposez que A et b varient ensemble de sorte que le produit
Ab 2 reste constant quand b tend vers zéro. Cela se justifie intuitivement puisque si le point voisin
est beaucoup plus proche, on imagine facilement que l'électron a plus facile pour s'y rendre et donc
que l'amplitude augmente. En faisant appel à l'équation (2), nous remplaçons Ab 2 par la constante
h 2 / 2meff . Dans ces conditions, l'équation (9) resterait la même, mais que deviendrait alors
l'équation différentielle (7) ?

Nous allons d'abord écrire (7) sous la forme


∂C ( x n )
(10) ih = (E 0 − 2 A)C ( x n ) + A[2C ( x n ) − C ( x n + b ) − C ( x n − b )]
∂t

Avec notre choix pour E 0 , le premier terme disparaît. Nous pouvons ensuite penser à une fonction
continue C ( x ) qui passe par les valeurs propres C ( x n ) en chaque x n . Quand le pas b tend vers
zéro, les points x n se rapprochent de plus en plus et la quantité entre crochets (si nous maintenons
une variation de C ( x ) suffisament régulière) devient tout simplement proportionnelle à la dérivée
seconde de C ( x ) . Nous pouvons écrire, comme vous pourrez vous en convaincre en faisant le
développement de Taylor de chaque terme ou en passant directement par la définition de la dérivée,
l'égalité
∂ 2 C (x )
(11) 2C ( x ) − C (x + b ) − C ( x − b ) ≈ −b 2
∂x 2

A la limite de b nul, en maintenant Ab 2 égal à K, l'équation (7) devient


∂C ( x ) h 2 ∂ 2 C (x )
(12) ih =−
∂t 2meff ∂x 2

Nous avons une équation qui nous dit que le taux de variation de C ( x ) , l'amplitude pour trouver
l'électron en x, en fonction du temps, dépend de l'amplitude pour trouver l'électron en des points
voisins et ceci de manière proportionnelle à la seconde dérivée de l'amplitude par rapport à la
position.

L'équation quantique correcte pour le mouvement d'un électron dans l'espace libre fut découverte
en premier par Schrödinger. Pour un mouvement le long d'une droite, elle a exactement la forme de
l'équation (12) après que l'on ait remplacé la masse effective meff par la masse m de l'électron dans
l'espace libre. Pour un mouvement le long d'une droite dans l'espace libre, l'équation s'écrit
∂C ( x ) h 2 ∂ 2 C (x )
(13) ih =−
∂t 2m ∂x 2

Nous ne voulons pas vous faire croire que nous avons établi l'équation de Schrödinger, mais
seulement vous montrer une manière de voir les choses. Quand Schrödinger a écrit cette équation
pour la première fois, il en a donné une sorte de démonstration fondée sur des raisonnements
heuristiques et sur quelques brillantes suppositions intuitives. Certains des raisonnements qu'il a
utilisés étaient même faux, mais cela n'a pas d'importance. Ce qui importe c'est qu'en fin de compte
l'équation donne une description correcte de la nature. Le but de notre discussion était simplement
de vous montrer que l'équation fondamentale de la mécanique quantique (13) a la même forme que
celle que vous obtenez pour le cas limite d'un électron se déplaçant sur une ligne d'atomes. On peut
donc penser à l'équation différentielle (13) comme la description de la diffusion d'une amplitude de
probabilité d'un point à l'autre le long d'une ligne. Autrement dit, si l'électron a une certaine
amplitude pour être en un point, il aura, un instant plus tard, une certaine amplitude pour être en des
points voisins. De fait, l'équation ressemble un peu aux équations de diffusion. Mais il y a une
différence essentielle : le coefficient imaginaire devant la dérivée par rapport au temps donne un
comportement complètement différent de celui que vous obtiendriez pour la diffusion ordinaire, par
exemple pour un gaz se répandant autour d'un tube fin. La diffusion ordinaire donne lieu à des
solutions exponentielles réelles, tandis que les solutions de (13) sont des ondes complexes.
II.1.2.2. La fonction d'onde
Maintenant que vous avez une certaine idée sur la façon dont les choses vont se présenter, nous
voulons revenir au point de départ et étudier la description du mouvement d'un électron le long
d'une droite sans avoir à considérer des états associés à des atomes dans un réseau. Nous voulons
retourner au point de départ et voir quelles idées nous devons utiliser si nous voulons décrire le
mouvement d'une particule libre dans l'espace. Etant donné que nous nous intéressons au
comportement d'une particule libre dans un milieu continu, nous aurons affaire à un nombre infini
d'états possibles et, comme vous le verrez, les idées que nous avons élaborées pour traiter d'un
nombre fini d'états devront subir quelques modifications techniques.

Tout d'abord, nous maintenons le vecteur d'état x comme représentation d'un état pour lequel une
particule est exactement localisée à la coordonnée x. A toute valeur de x le long de la ligne, par
exemple 1.73, 9.67 ou 10, correspond un état. Nous prendrons ces états x comme états de base et, si
nous incluons tous les points de la droite, nous aurons un ensemble complet pour un mouvement à
une dimension. Supposez que nous ayons maintenant un type différent d'état, disons ψ , pour
lequel un électron est distribué d'une certaine manière le long de la droite. Une façon de décrire cet
état est de donner toutes les amplitudes pour que l'électron se trouve aussi dans chacun des états de
base x . Nous devons donner un ensemble infini d'amplitudes, une pour chaque x. Nous écrirons
ces amplitudes sous la forme x ψ . Chacune de ces amplitudes est un nombre complexe et
puisqu'il y a un nombre complexe de ce type pour chaque valeur de x, l'amplitude x est tout
simplement une fonction de x. Nous pouvons aussi l'écrire sous la forme C ( x ) ,
(1) C ( x ) ≡ x ψ

Nous avons déjà eut affaire à des amplitudes qui varient d'une manière continue en fonction des
coordonnées lorsque nous avons parlé des variations de l'amplitude avec le temps. Nous avons
montré par exemple que l'amplitude pour une particule d'impulsion définie doit avoir une variation
particulière dans l'espace. Si une particule a une impulsion définie p et une énergie correspondante
E, l'amplitude pour qu'elle se trouve en une position x quelconque doit avoir l'aspect suivant
(2) x ψ = C ( x ) ∝ e + ipx / h

Cette équation exprime un principe général important de la mécanique quantique qui relie les états
de base correspondant aux diverses positions dans l'espace à un autre système d'états de base, à
savoir : tous les états d'impulsion définie. Les états d'impulsion définie sont souvent plus pratique
que les états en x pour certains types de problèmes. L'un et l'autre ensemble d'états de base sont
bien sur tout aussi acceptables pour la description d'une situation de mécanique quantique. Nous
reviendrons plus tard sur la question de leur relation réciproque. Pour le moment, nous voulons
nous en tenir à notre discussion sur une description en termes des états x .

Avant de continuer, nous voulons faire un petit changement de notation qui, nous l'espérons,
n'introduira pas trop de confusion. La fonction C ( x ) définie dans (1) aura une forme qui dépendra
bien entendu de l'état ψ considéré. Il nous faudrait l'indiquer d'une manière ou d'une autre. Par
exemple, nous pourrions spécifier de quelle fonction C ( x ) il s'agit par un indice, disons Cψ (x ) .
Ceci serait une notation parfaitement satisfaisante, mais elle est un peu compliquée et ce n'est pas
celle que vous trouverez dans la plupart des livres. Presque tout le monde laisse tomber la lettre C
et utilise le symbole ψ pour définir la fonction
(3) ψ ( x ) ≡ Cψ ( x ) = x ψ

Cette notation étant la plus utilisée dans le monde entier, il vaut mieux vous y habituer pour ne pas
être déroutés quand vous la rencontrerez quelque part. C'est d'ailleurs avec cette notation que nous
avons présentée brièvement la fonction d'onde au début. Gardez cependant à l'esprit que nous allons
maintenant utiliser ψ de deux manières différentes. Dans l'équation (1), ψ est une désignation que
nous avons donnée à un état physique particulier de l'électron. Par contre, dans (3), le symbole ψ
est utilisé pour définir une fonction mathématique de x laquelle est égale à l'amplitude pour être
localisé en chaque point x de la ligne. Nous espérons que ce ne sera pas trop déroutant une fois que
vous vous serez fait à cette idée. Rappelons à ce propos que la fonction ψ ( x ) est habituellement
appelée la "fonction d'onde" car c'est le plus souvent une fonction complexe des variables, qui
représente une onde.
Ayant défini ψ ( x ) comme l'amplitude pour qu'un électron dans l'état ψ se trouve à la position x,
nous serions tenté d'interpréter le module carré de ψ comme probabilité de trouver un électron à la
position x. Malheureusement, la probabilité de trouver une particule exactement en un point est
généralement nulle. En général, l'électron sera étalé sur une certaine région de la droite et comme il
y a sur tout un segment même petit un nombre infini de points, la probabilité que l'électron soit en
l'un de ces points ne peut pas être un nombre non nul (la somme sur l'infinité de points donnerait
forcément une probabilité supérieure à un, ce qui est une absurdité). On ne peut décrire la
probabilité de trouver un électron qu'au moyen d'une distribution de probabilité (ou densité de
probabilité) qui fixe la probabilité relative de trouver l'électron en diverses positions
approximatives le long de la droite. Soit prob( x, ∆x ) la chance de trouver l'électron dans un petit
intervalle ∆x au voisinage de x. Pour toute situation physique, si nous nous plaçons à une échelle
suffisament petite, la probabilité variera d'une manière régulière d'un endroit à l'autre et, pour tout
segment ∆x , petit mais non nul, elle sera proportionnelle à ∆x . Nous pouvons modifier nos
définitions de manière à tenir compte de cela.

On peut concevoir l'amplitude x ψ comme représentant une sorte de "densité d'amplitude" pour
tous les états de base x dans une petite région. Puisque la probabilité de trouver un électron dans
un petit intervalle ∆x doit être proportionnelle à cet intervalle, nous modifions notre définition de
x ψ de façon qu'elle réponde à la relation suivante :
(4) prob( x, ∆x ) = x ψ
2
∆x

L'amplitude x ψ est donc proportionnelle à l'amplitude pour qu'un électron dans l'état ψ se
trouve dans l'état de base x et la constante de proportionnalité est choisie de manière à ce que le
module carré de l'amplitude x ψ donne la densité de probabilité pour trouver l'électron dans une
petite région quelconque. On peut récrire l'équation ci-dessus sous la forme
(5) prob( x, ∆x ) = ψ ( x ) ∆x
2
Notons que toutes ces modifications ne sont pas arbitraires. Elles sont conformes au passage à la
limite que nous avons fait en passant d'un nombre fini d'états à un nombre infini, ainsi qu'au
passage à la limite en théorie des probabilités lorsque l'on passe de probabilités discrètes à une
densité de probabilités.

Il nous faut maintenant modifier certaines de nos équations précédentes pour les rendre compatibles
avec cette nouvelle définition d'une amplitude de probabilité. Supposez que nous ayons un électron
dans l'état ψ et que nous voulions connaître l'amplitude pour le trouver dans un état différent φ ,
lequel peut correspondre à un autre type d'étalement de l'électron. S'il s'agissait d'un ensemble fini
d'états discrets, nous aurions utilisé la relation habituelle. Avant la modification de notre définition
des amplitudes, nous aurions écrit
(6) φ ψ = ∑ φ x x ψ
tout x

Si l'une et l'autre de ces amplitudes sont normalisées de façon que nous avons décrite ci-dessus, une
somme sur tous les états d'une petite région x donnerait la même chose qu'une multiplication par x
et la somme sur toutes les valeurs de x devient alors tout simplement une intégrale. Avec nos
définitions modifiées, la forme correcte devient
(7) φ ψ = ∫ φ x x ψ dx
tout x

L'amplitude x ψ est ce que nous appelons maintenant ψ ( x ) et de façon similaire, nous décidons
que l'amplitude sera représentée par φ (x ) . Nous souvenant que φ x est le conjugué complexe de
ψ ( x ) , nous pouvons récrire (6)
(8) φ ψ = ∫ φ ∗ ( x )ψ ( x )dx

Avec nos nouvelles définitions, toutes les formules que nous avions précédemment s'appliquent à
condition de remplacer tout signe de sommation par une intégrale sur x.
Il nous faut ajouter une précision à ce que nous venons de dire. Tout ensemble satisfaisant d'états de
base doit être complet pour que son utilisation donne une description correcte de ce qui se passe.
Pour un électron dans une dimension, ne spécifier que les états de base x ne suffit pas car, pour
chacun de ces états, l'électron peut avoir son spin ou bien en haut, ou bien en bas. Une façon
d'obtenir un ensemble complet consiste à prendre deux ensembles d'états suivant x, l'un pour le spin
vers le haut et l'autre pour le spin vers le bas. Mais nous ne nous soucierons pas de ces
complications pour l'instant.
II.1.2.3. Les états de moment défini
Supposez que nous ayons un électron dans un état ψ décrit par l'amplitude de probabilité
x ψ = ψ ( x ) . Nous savons que ceci représente un état pour lequel l'électron est étalé le long de la
ligne suivant une certaine distribution, de sorte que la probabilité de trouver l'électron dans un petit
intervalle dx à l'emplacement x est simplement
(1) prob( x, dx ) = ψ ( x ) dx
2

Que pouvons-nous dire sur l'impulsion de l'électron ? Nous pourrions nous demander quelle est la
probabilité pour que cet électron ait l'impulsion p ? Calculons d'abord l'amplitude pour que l'état
ψ soit dans un autre état mom p , que nous définissons comme un état d'impulsion définie p.
Nous pouvons trouver cette amplitude en utilisant la dernière équation de la section précédente, qui
est la clef pour le calcul des amplitudes. En termes de l'état mom p
+∞
(2) mom p ψ = ∫ mom p x x ψ dx
x = −∞

Et la probabilité pour que l'on trouve l'électron avec l'impulsion p devrait être donnée par le module
carré de cette amplitude. Nous avons cependant, cette fois encore, une petite difficulté au sujet des
normalisations. De manière générale, nous pouvons nous interroger seulement sur la probabilité de
trouver un électron avec une impulsion à l'intérieur d'un petit domaine dp au voisinage de p. La
probabilité pour que l'impulsion ait exactement une certaine valeur p doit être nulle (à moins que
l'état se trouve être un état d'impulsion définie). Si nous demandons la probabilité de trouver
l'impulsion à l'intérieur d'un petit domaine dp alors nous obtiendrons une probabilité finie. Il y a
diverses manières d'ajuster les normalisations. Nous choisirons celle que nous considérons être la
plus pratique, bien que cet aspect puisse vous échapper pour l'instant.

Nous définissons les normalisations de manière à ce que la probabilité soit reliée à l'amplitude par
(3) prob( p, dp ) = mom p ψ
2 dp

2πh
Avec cette définition, la normalisation de l'amplitude mom p ψ est déterminée. L'amplitude
mom p ψ est bien sûr le conjugué complexe de l'amplitude x mom p , cette dernière étant celle
que nous avons donné au début de la section précédente. Avec la normalisation que nous avons
choisie, il se trouve que la constante de proportionnalité placée devant l'exponentielle est tout
simplement égale à 1. Plus précisément

(4) mom p x = x mom p = e −ipx / h

L'équation (3) devient alors


+∞
(5) mom p ψ = ∫ e −ipx / h x ψ dx
−∞

L'ensemble de cette équation et de l'équation (3) nous permet de déterminer la distribution


d'impulsion pour tout état ψ .

Prenons un cas particulier, par exemple celui d'un électron localisé dans une certaine région au
voisinage de x = 0. Prenons une fonction d'onde ayant la forme suivante :
(6) ψ ( x ) = Ke − x
2 / 4σ 2

La distribution de probabilité en x pour cette fonction d'onde en est le module carré, c'est-à-dire
(7) prob( x, dx ) = P( x )dx = K 2 e − x
2 / 2σ 2
dx
La fonction densité de probabilité est une courbe gaussienne représentée ci-dessus. La plus grande
partie de la probabilité est concentrée entre x = +σ et x = −σ . Nous disons que la "demi-largeur"
de la courbe est σ (plus précisément, pour quelque chose de réparti suivant cette distribution, σ
est égal à la racine carrée de la moyenne des carrés de la coordonnée x, c'est l'écart type). Il nous
faudrait choisir la constante K de façon à ce que la densité de probabilité P( x ) ne soit pas
simplement proportionnelle à la probabilité par unité de longueur de trouver l'électron mais une
échelle telle que P( x )∆x soit égal à la probabilité de trouver l'électron dans l'intervalle ∆x au
voisinage de x. Nous obtenons la constante K qui correspond à cela, en imposant que
+∞
∫ P(x )dx = 1 , puisqu'il doit y avoir une probabilité unité pour que l'électron soit trouvé quelque
−∞
part, c'est-à-dire sur un intervalle couvrant toute la droite. Dans le cas présent, après le calcul de
(
l'intégrale, nous obtenons K = 2πσ 2 )−1 / 4
.

+∞ 2
Pour calculer cette intégrale il suffit d'utiliser le résultat mathématique classique ∫ e −t dt = π .
−∞
Cherchons maintenant la distribution en impulsion. Soit φ ( p ) l'amplitude pour trouver l'électron
avec l'impulsion p,
(8) φ ( p ) ≡ mom p ψ

En portant (6) dans (5) nous obtenons


+∞
(9) φ ( p ) = ∫ e −ipx / h ⋅ Ke − x
2 / 4σ 2
dx
−∞

L'intégrale peut être récrite sous la forme


2
+∞ −  1 / 4σ 2   x + 2 ipσ 2 / h 
− p 2σ 2 / h 2
(10) Ke ∫
−∞
e   
dx

Nous pouvons maintenant faire la substitution u = x + 2ipσ 2 / h et l'intégrale devient


+∞
/ 4σ 2
∫ e −u du = 2σ π
2
(11)
−∞

Les mathématiciens ne seraient sans doute pas tout à fait d'accord avec notre manière de procéder,
néanmoins le résultat est correct.

(12) φ ( p ) = 8πσ 2 ( )
1/ 4
e− p σ
2 2
/ h2

D'où le résultat intéressant que la fonction d'amplitude en p a précisément la même forme


mathématique que la fonction d'amplitude en x. Seule la largeur de la gaussienne est différente.
Nous pouvons aussi écrire
(13) φ ( p ) = 2πη 2 (
e − p / 4η )
−1 / 4 2 2

où la demi-largeur η de la distribution de p est reliée à la demi-largeur de la distribution de x par


h
(14) η =

Notre résultat dit ceci : si nous donnons à x une distribution très étroite, en faisant σ très petit, η
devient très grand et la distribution en p est très étalée. Ou, à l'inverse, si nous avons une
distribution étroite en p, il doit y correspondre une distribution étalée en x. Nous pouvons
considérer σ et η comme une certaine mesure de l'incertitude sur la détermination de l'impulsion
et de la position de l'électron dans l'état que nous étudions. Si nous les appelons respectivement ∆p
et ∆x , l'équation (14) devient
h
(15) ∆p∆x =
2

On peut prouver, c'est assez étonnant, que pour aucune autre forme de distribution en x ou en p, le
produit ∆p∆x ne peut être plus petit que celui que nous avons trouvé ici. La distribution gaussienne
donne la plus petite valeur possible pour le produit des moyennes quadratiques. De manière
générale, nous pouvons dire que
h
(16) ∆p∆x ≥
2

C'est là une expression quantitative du principe d'indétermination de Heisenberg dont nous avons
déjà discuté de façon qualitative. Généralement, nous disions, de façon approximative, que la
valeur minimum du produit ∆p∆x est du même ordre que h .
II.1.2.4. Normalisation des états en x
Revenons à la discussion sur les modifications qu'il nous faut introduire dans les équations
générales lorsque nous avons affaire à un continuum d'états de base. Lorsque nous avons un
nombre fini d'états discrets, une condition fondamentale à laquelle doit répondre l'ensemble des
états de base est
(1) i j = δ ij

Si une particule est dans un état de base, l'amplitude pour qu'elle soit dans un autre état de base est
nulle. En choisissant une normalisation appropriée, nous avons fait en sorte que i i soit 1. Ces
deux choses sont inclues dans (1). Nous voulons voir maintenant comment on peut modifier cette
relation lorsque l'on utilise les états de base x d'une particule sur une droite. Si l'on sait que la
particule est dans l'un des états de base x , quelle est l'amplitude pour qu'elle soit dans un autre
état de base x ′ ? Si x et x' sont deux emplacements différents le long de la droite, l'amplitude
x x ′ est certainement nulle, ce qui est en accord avec l'équation (1). Mais si x et x' sont égaux,
l'amplitude x x ′ ne sera pas 1, à cause de ce bon vieux problème de normalisation. Pour voir
comment nous pouvons arranger les choses, retournons à l'équation donnant les amplitudes entre
états en fonction des états de base que nous appliquons au cas particulier où l'état φ est
précisément l'état de base x ′ . Nous obtenons ainsi
(2) x ′ ψ = ∫ x ′ x x ψ dx

L'amplitude x ψ est tout simplement ce que nous avons appelé la fonction ψ ( x ) . De même,
l'amplitude x ′ ψ , qui se réfère au même état ψ , est la même fonction de la variable x', à savoir
ψ ( x ′) . Nous pouvons donc écrire l'équation (2) sous la forme
(3) ψ ( x ′) = ∫ x ′ x ψ ( x )dx
Cette équation doit être vraie pour tout état ψ et donc pour toute fonction arbitraire ψ ( x ) . Cette
exigence devrait déterminer complètement la nature de l'amplitude x x ′ , c'est bien sûr une
fonction qui dépend de x et x'.

Nous sommes ramenés au problème qui consiste à trouver une fonction f ( x, x ′) qui multipliée par
ψ ( x ) et intégrée sur tous les x donne simplement la quantité ψ ( x ′) . Or, il n'existe pas de fonction
mathématique qui puisse faire cela ! Du moins, rien qui ressemble à ce que nous appelons
normalement une "fonction".

Prenons pour x' le nombre particulier 0 et définissons l'amplitude 0 x comme une certaine
fonction de x, disons f ( x ) . L'équation (1) devient alors ceci :
(4) ψ (0 ) = ∫ f ( x )ψ ( x )dx

Quelle sorte de fonction f ( x ) pourrait bien satisfaire à cette équation ? Puisque l'intégrale ne peut
pas dépendre des valeurs que prend ψ ( x ) sauf pour x nulle, il faut que f ( x ) soit 0 pour tout x autre
que 0. Mais si f ( x ) est 0 partout, l'intégrale sera zéro elle aussi et l'équation (4) ne sera pas
satisfaire. Nous avons donc une situation impossible : nous voulons une fonction qui soit nulle
partout, sauf en un point, et qui cependant donne une intégrale finie. Comme nous ne pouvons pas
trouver de fonction qui remplisse ces conditions, une échappatoire consiste à dire que la fonction
f ( x ) est définie par l'équation (2). C'est-à-dire que f ( x ) est la fonction qui rend (4) correcte. Cette
fonction, inventée par Dirac, porte son nom. On l'écrit δ ( x ) . Plus exactement, c'est ce qu'on appelle
une distribution ou une fonction généralisée et les mathématiciens ont donné un support
mathématique rigoureux à cette approche intuitive à travers la théorie des distributions.

Ainsi, en remplaçant f ( x ) par cette fonction dans (4), l'intégrale sélectionne la valeur de ψ ( x )
pour x = 0. Tout ce que nous avons à dire de la fonction δ ( x ) est qu'elle possède cette étrange
propriété. Et puisque l'intégrale ne doit pas dépendre des valeurs de ψ ( x ) pour tout x différent de
zéro, la fonction δ ( x ) doit être nulle partout sauf en x = 0. En résumé, nous pouvons écrire
(5) 0 x = δ (x )
où δ ( x ) est définie par
(6) ψ (0 ) = ∫ δ ( x )ψ ( x )dx

Remarquez ce qui se passe lorsque l'on prend pour ψ la fonction particulière "1". L'équation (6)
devient alors
(7) 1 = ∫ δ ( x )dx

Autrement dit, la fonction δ ( x ) qui a la propriété d'être nulle partout sauf en x = 0 a cependant une
intégrale finie de valeur 1. Il nous faut donc imaginer un infini fantastique en un point pour que la
surface totale sous δ ( x ) soit égale à 1.
Une façon de concevoir ce qu'est la fonction δ de Dirac, consiste à imaginer une série de
rectangles ou, à votre choix, toute autre fonction qui ait la forme d'un pic (voir plus bas), qui soient
de plus en plus étroits et de plus en plus hauts en gardant toujours une surface unité, comme dans la
figure ci-dessus. L'intégrale de cette fonction de − ∞ à + ∞ est toujours 1. Si vous la multipliez par
une fonction ψ ( x ) quelconque et si vous intégrez le produit, vous obtenez quelque chose qui est
approximativement la valeur de la fonction en x = 0 (moyennée sur la largeur du rectangle),
l'approximation devenant meilleure au fur et à mesure que le rectangle devient plus étroit. Vous
pouvez donc imaginer la fonction δ ( x ) comme la limite de ce processus. Mais la seule chose
importante est que la fonction est définie de sorte que l'équation (6) soit vraie pour toute fonction
ψ ( x ) . Cela définit de manière unique la fonction δ . Ses propriétés sont alors telles que nous les
avons décrites.

Si nous changeons l'argument x de la fonction δ en x - x', les relations correspondantes sont


δ ( x − x ′) = 0 x ′ ≠ x
(8)
∫ δ (x − x′)ψ (x )dx = ψ (x′)
Si nous prenons pour l'amplitude x x ′ l'expression δ ( x − x ′) , l'équation (3) est alors satisfaite.
Ainsi, la condition correspondant à (1) pour nos états de base en x est
(9) x ′ x = δ ( x − x ′)

Nous en avons ainsi terminé avec les modifications des équations fondamentales, modifications
qu'il nous fallait faire pour traiter du continuum des états de base qui correspondent aux points le
long d'une droite. L'extension à trois dimensions est assez immédiate. Nous remplaçons d'abord la
coordonnée x par le vecteur r. Les intégrales sur x sont alors remplacées par des intégrales sur x, y
et z. Elles deviennent des intégrales de volumes. Et enfin, Il faut remplacer la fonction δ à une
dimension tout simplement par le produit de trois fonctions δ , l'une en x, une autre en y et la
troisième en z, δ ( x − x ′)δ ( y − y ′)δ ( z − z ′) . En rassemblant toutes ces choses, nous obtenons
l'ensemble suivant d'équations sur les amplitudes pour une particule à trois dimensions :
(10) φ ψ = ∫ φ r r ψ dV
(11) r ψ = ψ (r )
(12) r φ = φ (r )
(13) φ ψ = ∫ φ ∗ (r )ψ (r )dV
(14) r r ′ = δ ( x − x ′)δ ( y − y ′)δ ( z − z ′)

Que se passe-t-il lorsqu'il y a plus d'une particule ? Nous allons vous dire comment l'on traite le cas
de deux particules et vous verrez aisément ce qu'il faut faire si vous voulez vous occuper d'un
nombre plus grand. Supposez que deux particules que nous appelons particule N° 1 et particule N°
2. Qu'allons nous prendre pour états de base ? Si nous décrivons un état en disant que la particule 1
est en x1 et la particule 2 est en x 2 , nous aurons un ensemble tout à fait correct, que nous écrirons
x1 , x 2 . Notez que la donnée de la position de l'une des deux particules ne définit pas un état de
base. Chaque état de base doit décrire le système entier. Vous ne devez pas penser que chaque
particule se déplace indépendamment comme une onde à trois dimensions. Tout état physique peut
se définir en donnant toutes les amplitudes x1 , x 2 pour trouver les deux particules en x1 et x 2 .
L'amplitude généralisée est donc une fonction de deux ensembles de coordonnées x1 et x 2 . Vous
voyez qu'une telle fonction n'est pas une onde, au sens d'une oscillation qui se déplace dans les trois
dimensions. De façon générale, ce n'est pas non plus le simple produit de deux ondes individuelles,
une pour chaque particule, mais une sorte d'onde selon les six dimensions définies par x1 et x 2 . S'il
y a dans la nature deux particules qui interagissent entre elles, il n'y a pas moyen de décrire ce qui
arrive à l'une des deux particules en cherchant à écrire une fonction d'onde pour elle uniquement.
Ce caractère non séparable des particules est une des particularités les plus étonnantes (mais qui
complique aussi singulièrement les calculs). Elle conduit à des situations parfois difficiles à saisir et
que nous aurons l'occasion d'examiner. Certaines de ces situations semblent paradoxales et ont
donné beaucoup de difficultés aux gens qui, à tort, essayaient de penser à la fonction d'onde pour
une particule toute seule et non à la fonction d'onde correcte qui dépend des coordonnées des deux
particules. La description complète ne peut se faire de façon correcte qu'en utilisant des fonctions
des coordonnées des deux particules.

Une représentation de la fonction de Dirac


Donnons une autre représentation de la fonction de Dirac qui a parfois son utilité dans les calculs
lorsque l'on utilise un processus de passage à la limite comme avec les rectangles ci-dessus.

Une représentation particulière qui est assez utile implique sin ( gx ) / πx comme une fonction de x
où g est un nombre positif. Son avantage par rapport aux rectangles est d'être une fonction
infiniment dérivable. Elle a la valeur g / π en x = 0 et oscille avec une amplitude décroissante et
avec la période 2π / g lorsque x croit. Elle a également une intégrale unité pour x variant de − ∞
à + ∞ , indépendamment de la valeur de g. Donc, la limite de ces fonctions lorsque g → ∞ a toutes
les propriétés de la fonction δ . Elle devient infiniment grande en x = 0, elle a une intégrale unité et
les oscillations infiniment rapides lorsque x croît signifie que la contribution entière de l'intégrale
contenant cette fonction vient du voisinage infinitésimal de x = 0. Nous pouvons donc poser
(15) δ ( x ) = lim
sin gx
g →∞ πx

Quelques propriétés de la fonction de Dirac


Il est important de noter que, à cause de son caractère singulier, la fonction δ ne peut pas être le
résultat final d'un calcul et n'a de signification que si une intégration subséquente sur son argument
est effectuée. Avec cela en tête, nous pouvons écrire quelques relations entre fonctions δ .
δ ( x ) = δ (− x )
δ ′( x ) = −δ ′(− x )
xδ ( x ) = 0
xδ ′( x ) = −δ ( x )
(16) δ (ax ) = a −1δ ( x ) a > 0

δ (x 2 − a 2 ) = (2a )−1 [δ ( x − a ) + δ ( x + a )] a > 0


∫ δ (a − x )δ (x − b )dx = δ (a − b )
f ( x )δ ( x − a ) = f (a )δ ( x − a )

Ici l'apostrophe indique la dérivée par rapport à l'argument.

Chacune des six premières équations peut être établie en multipliant les deux cotés par une fonction
différentiable continue f ( x ) et en intégrant sur x. Par exemple, la quatrième équation donne
(17) ∫ f ( x )xδ ′( x )dx = − ∫ δ ( x ) [xf ( x )]dx = − ∫ δ ( x )[ f ( x ) + xf ′( x )]dx = − ∫ f (x )δ ( x )dx
d
dx
où le terme de conditions aux limites résultant de l'intégration par partie s'annule. Donc, xδ ′( x ) a le
même effet lorsqu'il est un facteur dans l'intégrand que − δ ( x ) . De même, la septième équation
signifie que les deux cotés donnent le même résultat quand ils sont multipliés par f (a ) ou f (b ) et
intégrés sur a et b. La dernière équation est vérifiée en intégrant les deux cotés sur x ou a.
II.1.3. L'équation de Schrödinger
Jusqu'à présent, nous nous sommes uniquement souciés de décrire des états susceptibles de
représenter un électron situé en n'importe quel point de l'espace. Il nous faut maintenant voir
comment insérer dans notre description la physique de ce qui peut se produire dans diverses
circonstances. Comme précédemment, il nous faut voir comment les états peuvent varier dans le
temps. Si nous avons un état ψ qui se transforme un peu plus tard dans un autre état ψ ′ , nous
pouvons décrire la situation à tout instant en faisant de la fonction d'onde, qui n'est rien d'autre que
l'amplitude r ψ , une fonction du temps aussi bien que des coordonnées. On peut alors décrire
une particule dans une situation donnée par une fonction d'onde dépendant du temps
ψ (r, t ) = ψ ( x, y, z , t ) . Cette fonction d'onde, qui varie avec le temps, décrit l'évolution des états
successifs qui se produisent au cours du temps. Cette "représentation d'espace", qui donne des
projections de l'état ψ sur les états de base r peut ne pas être toujours la plus pratique, mais
c'est elle que nous allons considérer d'abord.

Plus tôt, nous avons décrit la variation des états en fonction du temps en terme de l'hamiltonien
H ij . La variation des diverses amplitudes en fonction du temps était donnée par l'équation
matricielle
dC
(1) ih i = ∑ H ij C j
dt j

Cette équation nous dit que la variation de chaque amplitude C i en fonction du temps est
proportionnelle à toutes les autres amplitudes C j , avec les coefficients de proportionnalité H ij .

Quel aspect peut bien prendre l'équation (1) lorsqu'on utilise un continuum d'états de base x ?
Souvenons-nous d'abord que l'équation (1) peut aussi s'écrire
d
(2) ih i ψ = ∑ i Hˆ j j ψ
dt j
Ce que nous avons à faire est maintenant très clair. Pour la représentation x nous pouvons écrire
d
(3) ih x ψ = ∫ x Hˆ x ′ x ′ ψ dx ′
dt

La somme sur tous les états de base j se trouve remplacée par une intégrale sur x'. Puisque x Hˆ x ′
doit être une certaine fonction de x et de x', nous pouvons l'écrire sous la forme H ( x, x ′) , ce qui
correspond au H ij de l'équation (1). L'équation (3) est donc identique à

ψ ( x ) = ∫ H ( x, x ′)ψ ( x ′)dx ′
d
(4) ih
dt
avec
(5) H ( x, x ′) ≡ x Hˆ x ′

D'après l'équation (4), le taux de changement de ψ au point x doit dépendre de la valeur de ψ en


tous les autres points x'. Le facteur H ( x, x ′) est l'amplitude par unité de temps pour que l'électron
saute de x' à x. Cependant, il se trouve que dans la nature cette amplitude est nulle sauf pour des
points x' très proches de x. C'est une manifestation de la localité que l'on retrouve explicitement en
relativité : les phénomènes physiques se propagent de proche en proche. Cela implique, comme
nous l'avons vu dans l'exemple de la chaîne d'atomes, que le terme de droite de (4) peut être
exprimé en terme de ψ et des dérivées de ψ par rapport à x, toutes évaluées au point x.

Pour une particule se déplaçant librement dans l'espace, sans qu'il y ait de force ni de perturbation,
la loi correcte de la physique est
h2 d 2
(6) ∫ H (x, x ′)ψ ( x ′)dx ′ = − ψ (x )
2m dx 2

Où avons-nous trouvé cette forme ? Nulle part. Il n'est pas possible de la déduire de quoi que ce soit
que vous connaissiez. Elle est sortie de l'esprit de Schrödinger, lorsqu'il luttait pour trouver une
compréhension des observations expérimentales du monde réel. Pourquoi doit-elle être ainsi, vous
pouvez en avoir une certaine intuition en pensant à la façon dont nous avons établi la version pour
une particule libre à partir de la considération de la propagation d'un électron dans un cristal. La
naissance originale de cette équation est d'ailleurs représentative. Au départ, Schrödinger présenta
son équation sans explication sur la manière de l'obtenir. Mais les physiciens n'aiment pas trop voir
quelque chose tiré comme d'un chapeau de magicien sans avoir ne fut ce qu'une idée de la manière
dont on a pu l'obtenir, même si cette équation marche admirablement bien ce qui, a posteriori, en
constitue la seule validation expérimentale valable. Ce n'est que sur l'insistance de ses pairs que
Schrödinger donna le cheminent de sa pensée ayant abouti à ce résultat. Nous donnerons ci-dessous
une autre "déduction" intuitive plus proche de cette approche traditionnelle.

Les particules libres ne sont pas, à vrai dire, très excitantes. Que se passe-t-il si nous faisons agir
des forces sur la particule . Eh bien, si la force sur la particule peut être dérivée d'un potentiel
scalaire, nous pensons à des forces électriques, non magnétiques, et si nous nous en tenons à des
énergies faibles, de sorte que nous pouvons ignorer les complications dues aux mouvements
relativistes, l'hamiltonien qui s'adapte au monde réel donne alors ceci
h2 d 2
(7) ∫ H (x, x ′)ψ ( x ′)dx ′ = − ψ ( x ) + V ( x )ψ ( x )
2m dx 2

A nouveau, vous pouvez vous faire une certaine idée de l'origine de cette équation si vous revenez
au mouvement de l'électron dans un cristal et si vous regardez comment il faudrait modifier les
équations pour tenir compte d'une lente variation de l'énergie de l'électron d'un emplacement
atomique à l'autre, ce serait le cas s'il y avait un champ électrique à travers le cristal. Le terme E 0
varierait alors lentement avec la position et correspondrait au nouveau terme que nous avons ajouté
dans (7).

Vous vous demandez sans doute pourquoi nous sommes allés directement de l'équation (6) à
l'équation (7) au lieu de vous donner tout simplement l'expression correcte pour l'amplitude
H ( x, x ′) = x Hˆ x ′ . La raison en est que H ( x, x ′) ne peut s'exprimer qu'au moyen de fonctions
algébriques étranges, bien que toute l'intégrale à droite de l'équation (6) puisse s'écrire avec des
choses qui vous sont maintenant familières. Si vous êtes vraiment curieux, H ( x, x ′) peut s'écrire de
la manière suivante :
h2
(8) H ( x, x ′) = − δ ′′( x − x ′) + V ( x )δ (x − x ′)
2m
où δ ′′ représente la dérivée seconde de la fonction de Dirac. Cette fonction assez étrange peut être
remplacée par un opérateur algébrique différentiel qui lui est totalement équivalent
 h2 d 2 
(9) H ( x, x ′) = − 2
+ V ( x )δ ( x − x ′)
 2m dx 

Nous n'utiliserons pas ces expressions et nous travaillerons directement avec la forme (7).

Si nous portons l'expression (7) dans l'intégrale en (3), nous obtenons pour ψ ( x ) = x ψ l'équation
différentielle suivante :
∂ψ h2 ∂2
(10) ih =− ψ ( x ) + V ( x )ψ ( x )
∂t 2m ∂x 2

Si nous nous intéressons à un mouvement à trois dimensions, nous voyons clairement comment
modifier l'équation (10). Il suffit de remplacer d 2 / dx 2 par
∂2 ∂2 ∂2
(11) ∇ 2 = 2 + 2 + 2
∂x ∂y ∂z
et V ( x ) par V ( x, y, z ) . L'amplitude ψ ( x, y, z ) pour un électron qui se place dans un potentiel
V ( x, y, z ) obéit à l'équation différentielle
∂ψ h2 2
(12) ih =− ∇ ψ + Vψ
∂t 2m

C'est ce qu'on appelle l'équation de Schrödinger et ce fut la première équation de mécanique


quantique jamais écrite. Elle a été écrite par Schrödinger avant qu'aucune des équations quantiques
décrites jusqu'ici n'ait été découverte.

Bien que nous ayons abordé le sujet selon une voie complètement différente, le grand moment
historique de la naissance de la description quantique de la matière s'est produit lorsque
Schrödinger en 1926 a écrit pour la première fois son équation. Pendant de longues années, la
structure atomique interne de la matière était restée un grand mystère. Personne n'avait été capable
de comprendre ce qui maintient la matière ensemble, pourquoi il y a des forces de liaisons
chimiques et surtout comment il peut se faire que des atomes puissent être stables. Si Bohr avait su
donner une description du mouvement interne d'un électron dans un atome d'hydrogène, description
qui paraissait expliquer le spectre de la lumière émise par cet atome, la raison pour laquelle les
électrons se déplacent de cette manière restait un mystère. La découverte par Schrödinger des
équations propres du mouvement des électrons à l'échelle atomique a fourni une théorie à partir de
laquelle on peut calculer des phénomènes atomiques de façon quantitative, précise et détaillée. En
principe, l'équation de Schrödinger permet d'expliquer tous les phénomènes atomiques sauf ceux
qui font intervenir le magnétisme et la relativité. Elle permet d'expliquer les niveaux d'énergie d'un
atome ainsi que tous les faits qui concernent les liaisons chimiques. Cependant, ceci n'est vrai qu'en
principe, pour résoudre exactement n'importe quel problème sauf les plus simples, les calculs
deviennent rapidement trop compliqués. Seuls les atomes d'hydrogène et d'hélium ont pu être
calculés avec une grande précision. Cependant, à l'aide de diverses approximations, dont certaines
sont assez vaseuses, de nombreux faits concernant des atomes plus compliqués et concernant les
liaisons chimiques de molécules ont pu être compris. Nous vous avons montré certaines de ces
approximations dans ce qui a précédé. Depuis, avec l'usage de calculateurs de plus en plus puissant
et le développement du calcul numérique massif, des calculs précis de situations un peu plus
compliquées que l'atome d'hélium ont pu être abordés avec succès. Mais les méthodes
d'approximations restent indispensables pour des situations plus complexes.

Cette limite à la capacité du calcul peut sembler un défaut de la théorie. Le fait que l'équation soit
difficile à résoudre dans les cas compliqués n'enlève rien au fait que l'équation est correcte et on ne
peut évidemment simplifier cette équation, dans le simple but d'avoir des calculs plus simples, sans
obtenir un résultat qui ne correspond en rien à la réalité. La nature n'existe pas telle qu'elle est dans
le but de nous rendre la vie facile. En outre, ce genre de situation ne devrait pas tellement
surprendre. Déjà, avec la théorie de la gravitation de Newton, dont les équations sont
particulièrement simples, les équations générales pour trois corps ne peuvent être résolues
exactement et, pire encore, les solutions manifestent un comportement chaotique dans de nombreux
régimes, ce qui rend l'analyse des solutions, même numériques, très difficile. Enfin, il va de soit
qu'il est plus facile de décrire le plan d'une maison en donnant les dimensions des murs qu'en
donnant la position de chaque brique. Plus on rentre dans le détail et plus le travail devient
considérable. L'équation de Schrödinger permet de descendre dans l'infiniment petit et de
comprendre les comportements des atomes mais reconstruire le monde qui nous entoure avec toute
sa complexité et ses milliards de milliards d'atomes ne peut évidemment se faire sans difficulté.

L'équation de Schrödinger, telle que nous l'avons écrite, ne tient compte d'aucun effet magnétique.
Il est possible de tenir compte de ces effets d'une manière approchée en ajoutant quelques termes de
plus à l'équation. Cependant, le magnétisme est essentiellement un effet relativiste. Une description
correcte du mouvement d'un électron dans un champ électromagnétique arbitraire ne peut donc se
faire que par une équation relativiste. L'équation relativiste correcte pour le mouvement d'un
électron a été découverte par Dirac une année après que Schrödinger ait proposé son équation. Elle
se présente sous une forme très différente.

Avant de regarder certaines conséquences de l'équation de Schrödinger, nous voudrions vous


montrer comment elle se présente pour un système avec un grand nombre de particules. Nous
voulons vous la montrer pour que vous puissiez bien voir que la fonction d'onde n'est pas
simplement une onde ordinaire dans l'espace mais qu'elle est une fonction de beaucoup de
variables. S'il y a beaucoup de particules, l'équation devient
∂ψ (r1 , r2 , r3 , K) h 2  ∂ 2ψ ∂ 2ψ ∂ 2ψ 
(13) − ih =∑  2 + 2 + 2  + V (r1 , r2 , r3 ,K)ψ
∂t i 2mi  ∂xi ∂y i ∂z i 

La fonction de potentiel V est l'équivalent classique de l'énergie potentielle totale de toutes les
particules. Si aucune force extérieure n'agit sur les particules, la fonction V est simplement l'énergie
électrostatique d'interaction de toutes les particules. Autrement dit, si la ième particule porte la
charge Z i q e , la fonction V est alors simplement (avec la convention selon laquelle e 2 = q e2 / 4πε 0 )
Zi Z j 2
(14) V (r1 , r2 , r3 , K) = ∑ e
rij
Développement de l'équation
Nous allons maintenant présenter une autre approche pour déduire l'équation de Schrödinger par la
recherche d'une équation d'onde généralisant les propriétés ondulatoires des particules quantiques.

Cette déduction a l'avantage de la rapidité mais elle n'offre pas la profondeur de compréhension
physique qui a été apportée par la déduction précédente. Toutefois, cette déduction à l'avantage de
bien mettre en avant le coté ondulatoire des particules quantiques en même temps que le fait que ce
ne sont pas tout à fait des ondes classiques.

Ondes harmoniques progressives


La première tâche est de développer d'une manière plus quantitative les propriétés de la fonction
d'onde à une dimension ψ ( x, t ) dont les propriétés ondulatoires ont été discutées qualitativement au
début de ce cours. Nous avons vu que pour une onde harmonique progressive continue, la longueur
d'onde et le moment sont reliés ainsi que l'énergie et la fréquence. Récrivons ces relations :
(15) p = hk
(16) E = hω

Une fonction d'onde ψ ( x, t ) qui représente une particule de position totalement indéterminée
voyageant dans la direction de x positif avec un moment connu avec précision p et une énergie
cinétique E devrait avoir une des formes
cos(kx − ω t )
sin (kx − ω t )
(17)
e i (kx −ω t )
e −i ((kx −ω t ))
ou une combinaison linéaire de ces solutions. Cela suit directement des expériences de diffractions
et d'interférences et de l'exigence qu'un paquet d'ondes d'approximativement le nombre d'ondes k et
la pulsation ω a une vitesse de groupe égale à celle d'une particule libre classique de moment p et
d'énergie E.
A la recherche d'une équation d'ondes
Afin d'aller au-delà du problème très simple d'une onde harmonique continue, il est désirable
d'avoir une équation dont les ondes harmoniques et les ondes plus compliquées sont solution. Un
exemple d'un domaine plus familier de la physique devrait aider à clarifier ce point. Dans le cas des
ondes sonores à trois dimensions dans un gaz, il est possible d'obtenir une solution du problème de
la diffusion du son par une sphère rigide en superposant des ondes harmoniques progressives
voyageant dans différentes directions. Mais il est beaucoup plus simple de résoudre l'équation
différentielle pour les ondes sonores directement en coordonnées sphériques. Si la température du
gaz change de point en point, aucun progrès ne peut être fait dans le cas général sans une telle
équation différentielle. L'équation correcte pour les ondes sonores peut être trouvée directement à
partir de considérations sur les propriétés mécaniques du gaz. Bien que ce ne soit pas le cas avec
l'équation dont les fonctions d'onde sont solutions, il n'est pas moins impératif de trouver la forme
de l'équation. La nécessité devient encore plus évidente quand la fonction d'onde d'écrit le
mouvement d'une particule sous l'influence de forces externes. Cette situation s'avère être
l'analogue de la propagation des ondes sonores dans un gaz non homogène. Nous allons donc
trouver une telle équation pour ψ puis nous la regarderons comme un attribut plus fondamental de
la fonction d'onde que les formes harmoniques (17).

L'équation doit avoir deux propriétés de base. Tout d'abord elle doit être linéaire, afin que les
solutions puissent obéir au principe de superposition, produire des effets d'interférences (dans le cas
à trois dimensions).et permettre la construction de paquets d'ondes. Et, ensuite, les coefficients de
l'équation doivent seulement impliquer des constantes telles que h et la masse et la charge de la
particule, et non les paramètres d'un type particulier de mouvement de la particule (impulsion,
énergie, nombre d'ondes et fréquence). La raison de cette exigence est que nous désirons laisser
ouvert la possibilité de superposer des solutions qui possèdent différentes valeurs de ces
paramètres. Cela signifie qu'une telle fonction d'onde plus générale ne peut pas être solution d'une
équation qui implique ces paramètres dans sa structure. Puisque les équations différentielles sont
les plus faciles à manipuler, il est intéressant d'essayer de type d'équation d'abord et il s'avère que
les exigences peuvent être satisfaites par une équation différentielle.
Avec toutes ces considérations à l'esprit, nous regardons d'abord l'équation d'onde à une dimension
la plus familière qui décrit le mouvement d'une onde transverse sur une corde ou une onde sonore
plane dans un gaz :
∂ 2ψ ∂ 2ψ
(18) = γ
∂t 2 ∂x 2
où γ est le carré de la vitesse de l'onde. La substitution des formes (17) dans l'équation (18) montre
que chacune des quatre solutions harmoniques et donc leurs combinaisons linéaires satisfont
l'équation différentielle si et seulement si nous posons
ω2 E2 p2
(19) γ = 2 = 2 =
k p 4m 2
où m est la masse de la particule décrite par l'équation (18). A cause de la structure (19), il est
évident que le coefficient γ qui apparaît dans (18) implique les paramètres du mouvement (E ou
p). Nous écartons donc cette équation différentielle.

L'équation d'onde à une dimension


Pour trouver une équation appropriée, il est utile de noter que la différentiation par rapport à x des
fonctions d'onde comme celles (17) a l'effet général de multiplier la fonction par k (et quelque fois
aussi d'échanger sinus et cosinus) tandis que la différentiation par rapport à t a l'effet général de
multiplier par ω . Alors, la relation E = p 2 / 2m , qui est équivalente à la relation ω = hk 2 / 2m ,
suggère que l'équation différentielle que nous recherchons contient une dérivée première par
rapport à t et une dérivée seconde par rapport à x.
∂ψ ∂ 2ψ
(20) =γ
∂t ∂x 2

La substitution montre que les deux premières fonctions d'onde (17) ne sont pas solutions de (20)
mais que les deux dernières le sont (mais pas les deux en une fois) si la constante γ est choisir de
manière appropriée. En particulier, si nous choisissons
i ω i hE i h
(21) γ = 2 = 2 =
k p 2m
alors la troisième fonction d'onde (17) satisfait (20). De plus, la valeur de γ donnée dans (21)
implique seulement les constantes h et m.

Nous sommes donc conduit à la forme à une dimension de l'équation d'onde de Schrödinger pour
une particule libre de masse qui, à partir de (20) et (21), peut être écrite
∂ψ h 2 ∂ 2ψ
(22) ih =−
∂t 2m x 2

La forme particulière sous laquelle (22) est écrite est significative pour la solution harmonique, la
troisième fonction d'onde (17), car elle transforme le coté gauche en Eψ et le coté droit en
(p 2
)
/ 2m ψ .

Equation à trois dimensions


Le traitement à une dimension précédent est facilement étendu à trois dimensions. Il est naturel de
récrire (16) comme
(23) p = hk k = k
où k est appelé le vecteur d'onde. De même, la troisième des fonctions d'onde (17) devient
(24) exp i (k ⋅ t − ω t )
où r est le vecteur position de la particule. Alors, par une extension évidente de l'argument qui nous
a conduit à (22), on voit que l'équation de Schrödinger à trois dimensions pour une particule qui est
représentée par la fonction d'onde ψ (r, t ) est
∂ψ h2 2
(25) ih =− ∇ψ
∂t 2m

Une comparaison des équations (23) et (25) et l'équation classique de l'énergie


p2
(26) E =
2m
suggère que, au moins pour une particule libre, l'énergie et le moment peuvent être représentés par
des opérateurs différentiels qui agissent sur la fonction d'onde ψ .

(27) E → ih p → i h∇
∂t

Les développements ultérieurs montreront que ce sont aussi des représentations valides quand la
particule n'est pas libre.

Inclusion des forces


Le prochain problème est d'étendre l'équation de la particule libre (25) pour inclure les effets de
forces extérieures qui peuvent agir sur la particule. Nous supposerons pour le moment que ces
forces sont d'une nature (électrostatique, gravitationnelle, peut-être nucléaire) telle qu'elles peuvent
être combinées en une seule force F qui est dérivable d'une énergie potentielle réelle V.
(28) F(r, t ) = −∇V (r, t )

Tout comme la relation classique entre l'énergie et le moment est utilisée ci-dessus pour en déduire
la structure de l'équation (25), il est maintenant désirable de partir de la relation classique
correspondante qui inclut les forces extérieures. Cela est simplement exprimé en terme de l'énergie
potentielle
p2
(29) E = + V (r, t )
2m
où E est maintenant l'énergie totale et le premier et le second termes sur la droite sont
respectivement les énergies cinétiques et potentielles de la particule.

Puisque V ne dépend pas de p ni de E, les équations (29) et (27) suggèrent que l'équation (25) se
généralise en
∂ψ h2 2
(30) ih =− ∇ ψ + V (r, t )ψ
∂t 2m

C'est l'équation d'onde que nous recherchions.

Cette déduction comme la précédente ne donnent qu'un caractère plausible à l'équation de


Schrödinger. Cela ne peut en aucun cas constituer une démonstration de cette équation. Mais c'est
bien sûr l'accord des solutions de (30) avec l'expérience dans des cas particuliers qui démontrer la
validité et l'utilité de cette équation.
II.2. Interprétation de la fonction d'onde
Nous allons maintenant approfondir l'interprétation de la fonction d'onde que nous avions effleurée
dans la section II.1.2.2.

La fonction d'onde ψ (r, t ) qui est solution de l'équation de Schrödinger est maintenant supposée
fournir une description complète en mécanique quantique du comportement d'une particule de
masse m avec l'énergie potentielle V (r, t ) et est donc l'analogue de la trajectoire classique r (t ) . La
signification de la fonction d'onde doit toutefois être agrémentée de détails concernant son
interprétation qui nous permet d'extraire de ψ le maximum d'information permis par la nature.
Tout comme la validité de l'équation de Schrödinger, l'interprétation de la fonction d'onde doit être
jugée par sa consistance logique et sont adéquation aux résultats expérimentaux.

Interprétation statistique
Revenons sur le fait que la fonction d'onde est en fait une amplitude et fournit donc les probabilités
de trouver la particule à un endroit déterminé. Cela signifie qu'en pratique, on doit interpréter ψ en
termes statistiques.

Nous pouvons imaginer un nombre très grand de régions de l'espace identiques, indépendantes et
sans parties communes, suffisament grandes pour contenir toutes les propriétés intéressantes du
mouvement et dans chacune le comportement d'une particule avec l'énergie potentielle V (r, t ) est
décrit par la même fonction d'onde ψ (r, t ) . Dans chaque cas, r se rapporte à une origine dans la
région concernée. Ou bien, nous pouvons imaginer un très grand nombre de répétitions du même
mouvement dans la même région de l'espace avec, à chaque fois, t se rapportant à une origine
particulière du temps. Le lien entre amplitude et probabilité découle d'une hypothèse, due à Born,
que le résultat numérique de la mesure à un moment particulier t (pour autant que le moment où la
mesure est faite puisse être spécifié) de toute quantité physique significative, tel que position
moment ou énergie, ne sera en général pas le même dans chaque région mais sera plutôt une
distribution de valeurs qui peut être décrit par une fonction de probabilité.
Il est naturel de relier cette probabilité à la fonction ψ mais celle-ci est en général un nombre
complexe. L'hypothèse de Born est de supposer que le produite de ψ avec son complexe conjugué
ψ ∗ donne la densité de probabilité de la position. Comme nous l'avions vu.
(1) P(r, t ) = ψ ∗ (r, t )ψ (r, t ) = ψ (r, t )
2

Cela signifie que P(r, t )dxdydz est la probabilité de trouver une particule dans son élément de
volume dx dy dz autour du point r à l'instant t, quand un grand nombre de mesures précises de la
position sont effectuées sur des particules indépendantes, chacune décrite par la fonction d'onde à
une particule ψ (r, t ) .

Normalisation de ψ
La probabilité de trouver la particule quelque part dans la région doit être l'unité. L'équation (1)
implique donc que la fonction d'onde est normalisée :
(2) ∫ ψ (r, t ) d 3 r = 1
2

où l'intégrale s'étend sur la région entière. Ici d 3 r est l'élément de volume à trois dimensions dx dy
dz. Si ψ est un paquet d'onde, l'intégrale (2) converge et le coefficient numérique de ψ peut être
ajusté pour que l'intégrale soit égale à l'unité. Une telle normalisation ne change pas le fait que ψ
est une solution de l'équation de Schrödinger car celle-ci est homogène en ψ . Il y a cependant des
solutions, comme une onde plane, telles que l'intégrale (2) ne converge pas sur un volume infini.
De telles fonctions nécessitent des considérations particulières sur lesquelles nous reviendrons.
Pour le moment, nous pouvons imaginer que la fonction d'onde est définie dans une région de
l'espace éventuellement très grande mais finie. Dans ce cas, l'intégrale (2) est faites sur un volume
fini et elle converge, permettant la normalisation.

Le coefficient de ψ qui normalise doit être indépendant du temps afin que ψ satisfasse l'équation
de Schrödinger. Donc, si (2) est satisfait, l'interprétation de ψ comme densité de probabilité
2

nécessite que l'intégrale de normalisation soit indépendante du temps. C'est en fait le cas et cela
peut être vérifié en calculant la dérivée par rapport au temps de l'intégrale de P sur tout volume fixé
Ω :
∂  ∗ ∂ψ ∂ψ ∗  3
P(r, t )d r = ∫ ψ ψ d r
∂t ∫Ω
3
+

 ∂t ∂t 
=
ih
∫Ω
[ (
ψ ∗ ∇ 2ψ − ∇ 2ψ ∗ ψ d 3 r ) ]
(3) 2m
=
ih
2m ∫Ω
[ (
∇ ⋅ ψ ∗ ∇ψ − ∇ψ ∗ ∇ψ d 2 r ) ]
=
ih
2m ∫A
[ (
ψ ∗∇ψ − ∇ψ ∗ ∇ψ n dA ) ]
où on a remplacé ∂ψ / ∂t en utilisant l'équation de Schrödinger et son conjugué complexe. La
dernière intégrale est obtenue par intégration partielle (théorème de Green) où A est la surface
frontière de la région d'intégration et l'indice n indique la composante du vecteur entre crochet dans
la direction normale vers l'extérieure à l'élément de surface dA.

Nous définissons le vecteur S(r, t ) ,

(4) S(r, t ) =
h
2im
[
ψ ∗∇ψ − (∇ψ ∗ )ψ ]
Ce qui nous donne

(5) ∫ P(r, t )d 3 r = − ∫ ∇ ⋅ Sd 3 r = − ∫ S n dA
∂t Ω Ω A

Dans le cas d'un paquet d'ondes pour lequel ψ s'annule à grande distance et l'intégrale de
normalisation converge, l'intégrale de surface est évidemment zéro quand Ω est l'espace entier.
Pour une fonction d'onde de type onde plane, ψ peut être définie dans une région finie Ω telle
qu'elle s'annule ou a une structure périodique le long de la frontière, comme nous verrons. Dans
tous ces cas, on vérifie sans difficulté que l'intégrale de surface dans (6) est nulle, tel que l'intégrale
de normalisation dans (1) est constante dans le temps.

Densité de courant de probabilité


La dérivation de (5) montre aussi que la relation différentielle
∂P (r, t )
(6) + ∇ ⋅ S(r, t ) = 0
∂t
est valide. Elle a la forme familière associée à la conservation du flux d'un fluide de densité P et de
densité de courant S dans laquelle il n'y a ni source ni fuite. Il est donc raisonnable d'interpréter
S(r, t ) donnée par l'équation (4) comme une densité de courant de probabilité. Cette interprétation
rend plus plausible l'identification de − ih∇ avec l'impulsion même quand une force est présente.
Alors (h / im )∇ est l'opérateur vitesse et il est évident que
 h 
(7) S(r, t ) = Reψ ∗ ∇ψ 
 im 

Bien que cette interprétation de S soit suggestive, on doit bien comprendre que S n'est pas
susceptible d'une mesure directe dans le sens où P l'est. Il serait trompeur, par exemple, de dire que
S(r, t ) est la moyenne du flux de particule mesuré au point r et au moment t car une mesure du flux
local moyen implique des mesures simultanées de haute précision de la position et de la vitesse (qui
est équivalente à l'impulsion) et est donc inconsistante avec la relation d'indétermination.
Néanmoins, il est quelque fois utile de voir S comme un vecteur de flux, en particulier quand il
dépend seulement légèrement ou pas du tout de r tel qu'une détermination précise de la vitesse peut
être faite sans altérer l'utilité du concept de flux.

Valeur moyenne
L'existence de la densité de probabilité de position P(r, t ) rend possible le calcul de ce que nous
appelons la valeur moyenne du vecteur position d'une particule, qui est définie comme le vecteur
dont les composantes sont les moyennes pondérées des composantes correspondantes de la position
de la particule. La valeur moyenne est la moyenne mathématique (dans le sens de la théorie des
probabilités) pour le résultat d'une seule mesure ou est la moyenne des résultats d'un grand nombre
de mesures sur des systèmes indépendant du type discuté au début de cette section. Nous écrivons
la valeur moyenne de r comme
(8) r = ∫ rP (r, t )d 3 r = ∫ψ ∗ (r, t )rψ (r, t )d 3 r
qui est équivalente aux trois équations
(9) x = ∫ψ ∗ xψd 3 r y = ∫ψ ∗ yψd 3 r z = ∫ ψ ∗ zψ d 3 r
où ψ est normalisé.

Attention de ne pas confondre la notation < > pour une moyenne avec la notation des crochets de
Dirac pour les amplitudes. Il arrive parfois que certaines notations se trouvent avoir plusieurs
usages, ce dont nous sommes désolés, mais il est préférable de suivre les notations conventionnelles
pour ne pas que vous soyez déroutés en lisant des articles spécialisés dans le domaine.

La valeur moyenne est une fonction de seulement le temps puisque ψ et P dépendent de t et que les
coordonnées spatiales ont été intégrées.

Les valeurs moyennes de toute autre quantité physiquement significative peut être obtenue d'une
manière similaire si elles sont uniquement fonctions de la coordonnée de la particule r. Donc, la
valeur moyenne de l'énergie potentielle est
(10) V = ∫ V (r, t )P(r, t )d 3 r = ∫ψ ∗ (r, t )V (r, t )ψ (r, t )d 3 r

Une quantité telle que l'impulsion ou l'énergie doivent, cependant, être exprimées en fonction de r
et de t avant qu'un calcul de ce type puisse être fait. Nous supposons qu'il est possible d'utiliser les
représentations sous forme d'opérateurs différentiels que nous avons vues. Nous reviendrons sur ce
point. La question qui est cependant immédiatement soulevée est comment de tels opérateurs
différentiels doivent être combinés avec la densité de probabilité P.

On peut répondre à la question en imposante l'exigence raisonnable suivante aux valeurs moyennes
:
p2
(11) E = + V
2m
en analogie avec l'équation classique de l'énergie. Cette exigence est raisonnable car on s'attend à
ce qu'en moyenne, les particules quantiques obéissent aux équations classiques. En termes
d'opérateurs différentiels, (11) peut être écrit
∂ h2 2
(12) ih = − ∇ + V
∂t 2m

Il est visible que l'équation (12) est consistante avec l'équation de Schrödinger seulement si la
valeur moyenne est définie dans le cas général avec l'opérateur agissant sur ψ et multiplié à gauche
par ψ ∗ . Nous obtenons donc, par exemple,
∂ψ 3
(13) E = ∫ψ ∗ih d r p = ∫ψ ∗ (− ih )∇ψd 3 r
∂t

Comme dans l'équation (8), la deuxième équation (13) est équivalente aux équations sur les
composantes
∂ψ 3
p x = −i h ∫ ψ ∗ d r
∂x
∂ψ 3
(14) p y = −ih ∫ψ ∗ d r
∂y
∂ψ 3
p z = −i h ∫ ψ ∗ d r
∂z

Théorème d'Ehrenfest
Il est assez raisonnable de s'attendre à ce que le mouvement d'un paquet d'ondes soit en accord avec
le mouvement d'une particule classique quant l'énergie potentielle change de manière négligeable
sur les dimensions du paquet. Ce que nous avons déjà constaté pour la propagation d'un électron
dans un cristal ou la limite classique des forces. Si nous entendons par vecteurs "position" et
"impulsion" du paquet les moyennes pondérées ou valeurs moyennes de ces quantités, nous
pouvons montrer que les équations classiques et quantiques sont toujours en accord. Une
composante de la "vitesse" du paquet sera le taux de changement dans le temps de la valeur
moyenne de cette composante de la position car x dépend seulement du temps et la variable x
dans l'intégrand de (9) est une variable d'intégration, c'est-à-dire
d d ∂ψ 3 ∂ψ ∗
(15) x = ∫ψ ∗ xψd 3 r = ∫ψ ∗ x d r+∫ xψd 3 r
dt dt ∂t ∂t

On peut simplifier cette expression en substituant, aux dérivées du temps de la fonction d'onde et de
son complexe conjugué, la partie droite de l'équation de Schrödinger et en annulant les termes V où
nous continuons à supposer pour le moment que V est réel :
d i  h2 2   h2 2 ∗  
x = −  ∫ψ ∗ x − ∇ ψ + Vψ d 3 r − ∫  − ∇ ψ + Vψ ∗  xψd 3 r 
dt h  2m   2m  
(16)
=
ih
2m ∫ [ ( ) ( ) ]
ψ ∗ x ∇ 2ψ − ∇ 2ψ ∗ xψ d 3 r

La deuxième intégrale peut être intégrée par partie :


( ) ( ) ( )
(17) ∫ ∇ 2ψ ∗ xψd 3 r = − ∫ ∇ψ ∗ ⋅ (∇ψ )d 3 r + ∫ xψ∇ψ ∗ n dA
A

où l'intégrale de la composante normale de xψ∇ψ ∗ sur la frontière A à l'infini s'annule car un


paquet d'ondes ψ s'annule à grande distance. Une deuxième intégration par partie, dans laquelle
l'intégrale de surface s'annule à nouveau, donne
( )
(18) ∫ ∇ 2ψ ∗ xψd 3 r = ∫ψ ∗ ∇ 2 ( xψ )d 3 r
Donc
d
dt
x =
ih
2m ∫
[ ]
ψ ∗ x∇ 2ψ − ∇ 2 ( xψ ) d 3 r
(19)
ih ∂ψ 3 1
= − ∫ψ ∗ d r= px
m ∂x m
Puisque x est toujours un nombre réel à cause de la forme de (10), l'équation (19) montre que l'on
a également p x réel. On peut aussi le montrer sur la deuxième équation (13) lorsque ψ
représente un paquet d'ondes en utilisant une intégration par partie.

De même, nous pouvons calculer le taux de changement dans le temps d'une composante de
"l'impulsion" de la particule comme
d d ∂ψ 3
p x = −i h ∫ ψ ∗ d r
dt dt ∂x
 ∗ ∂ ∂ψ 3 ∂ψ ∗ ∂ψ 3 
= −i h  ∫ ψ
 d r+∫ d r 
 ∂x ∂ t ∂t ∂x 
∂  h2 2   h2 2 ∗  ∂ψ 3
= − ∫ψ ∗  − ∇ ψ + Vψ d 3 r + ∫  − ∇ ψ + Vψ ∗  d r
∂x  2m   2m  ∂x
(20)
∂ ∂ψ  3
= − ∫ψ ∗  (Vx ) − V d r
 ∂x ∂x 
∂V
= − ∫ψ ∗ ψd 3 r
∂x
∂V
= −
∂x
à nouveau en utilisant l'équation de Schrödinger et en intégrant deux fois par parties.

Les équations (19) et (20) ainsi que pour les autres composantes constituent le théorème
d'Ehrenfest. Elles sont les analogues des équations classiques du mouvement :
dr p dp
(21) = = −∇V
dt m dt

Le théorème d'Ehrenfest fournit un exemple du principe de correspondance introduit par Bohr et


qui affirme que les équations quantiques et classiques correspondent lorsque l'on peut négliger les
"fluctuations" statistiques quantiques ou lorsque l'on pose h = 0 . En effet, ce théorème montre
qu'un paquet d'ondes se comporte comme une particule classique lorsque les valeurs moyennes
donnent une bonne représentation de la variable classique correspondante. C'est habituellement la
limite macroscopique où la taille finie et la structure interne du paquet peut être ignorée.
II.3. Les niveaux d'énergie quantifiés
La fonction d'onde de Schrödinger admet une simplification considérable lorsque l'énergie
potentielle V (r ) ne dépend pas du temps. Il est alors possible d'exprimer sa solution générale
comme une somme de produits de fonctions de r et de t séparément.

Séparation de la fonction d'onde


Considérons une solution particulière de l'équation de Schrödinger qui peut être écrite comme un
produit : ψ (r, t ) = u (r ) f (t ) . Une solution générale peut alors être écrite comme une somme de telles
solutions séparées. Si nous introduisons cette expression dans l'équation de Schrödinger et que nous
divisons par ce produit, nous obtenons
ih df 1  h 2 2 
(1) = − ∇ u + V (r )u 
f dt u  2m 

Puisque le coté gauche de (1) ne dépend que de t et le coté droit que de r, les deux cotés doivent
être égaux à la même constante de séparation que nous appellerons E (le lecteur ne doit pas
s'inquiéter d'un risque de confusion avec l'énergie car ce choix n'est pas innocent comme nous
allons le voir). Alors, l'équation pour f est facilement intégrée pour donner
(2) f (t ) = Ce − iEt / h
où C est une constante arbitraire et l'équation pour u devient
 h2 2 
(3) − ∇ + V (r )u (r ) = Eu (r )
 2m 

Puisque l'équation (3) est homogène en u, la constante C peut être choisie pour normaliser u. Alors
une solution particulière de l'équation de Schrödinger est
(4) ψ (r, t ) = u (r )e − iEt / h
Signification de la constante de séparation E
L'opérateur dérivée du temps donnée comme une représentation de l'énergie peut être appliqué à ψ
de l'équation (4) pour donner
∂ψ
(5) ih = Eψ
∂t

Une équation de ce type est appelée une équation aux valeurs propres. Une fonction ψ solution de
cette équation est appelée une fonction propre ou un état propre de l'opérateur qui apparaît à
gauche et la constante multiplicative E qui apparaît à droite est appelée valeur propre.

Une fonction propre, comme la fonction ψ donnée par (4), est appelée un état stationnaire de la
particule puisque ψ est constant dans le temps. Nous avions déjà vu auparavant de telles
2

solutions stationnaires d'énergie bien définie dans certains cas particuliers, comme les particules
libres.

L'équation (3) est aussi une équation aux valeurs propres. Elle dit que u (et donc aussi ψ ) est une
( )
fonction propre de l'opérateur − h 2 / 2m ∇ 2 + V (r ) avec la même valeur propre E. On s'attend bien
sûr à ce que ψ soit une fonction propre de cet opérateur si c'est une fonction propre de l'opérateur
dérivée dans le temps puisque selon l'équation de Schrödinger les deux opérateurs sont équivalents
non seulement pour des fonctions séparées de la forme (4) mais aussi pour des solutions plus
générales.

Nous allons anticiper un peu sur la discussion de la signification physique des fonctions propres et
des valeurs propres que nous verrons bientôt et nous allons supposer que les valeurs propres E sont
les seuls résultats possibles de mesures précises de l'énergie totale d'une particule. Il est alors
intéressant de se demander si oui ou non des solutions physiques intéressantes u (r ) de l'équation
(3) existent pour toute valeur réelle de E. Une réponse ne peut pas être obtenue sans avoir précisé la
signification de "physiquement intéressantes" en fonction des conditions aux limites imposées à
u (r ) . Cette spécification et le caractère général des valeurs propres de l'énergie qui sont associées
avec différents types de fonctions d'énergies potentielles V (r ) seront alors considérées.

Conditions aux limites à grande distance


Nous avons jusqu'ici rencontré essentiellement deux types de fonctions d'onde : les paquets d'ondes
qui sont bien localisés et pour lesquels l'intégrale de normalisation ∫ ψ d 3 r converge et les ondes
2

harmoniques qui se propagent qui ont une grandeur constante à grande distance tel que l'intégrale
de normalisation prise sur un volume infini diverge. La première classe peut être interprétée comme
représentant des particules qui sont initialement bien localisées ou qui sont restreintes à une région
particulière de l'espace par des forces extérieures dérivées d'une énergie potentielle V (r ) . La
deuxième classe représente des particules qui ne sont ni localisées ni restreintes mais qui se
propagent à travers la région considérée sur de grandes distances. De telles fonctions d'onde seront
utiles pour décrire la diffusion de particules par un champ de force. Dans les deux cas, les fonctions
d'onde sont bornées à grande distance dans toutes les directions.

Une autre classe possible consiste en fonctions d'onde qui deviennent infinies à grande distance.
Cependant, elles ne sont pas physiquement intéressantes puisque nous n'avons aucune raison d'être
concerné par des particules dont la densité de probabilité de position devient arbitrairement grande
dans les régions éloignées de l'espace. Normaliser une telle fonction nécessiterait de diviser la
densité de probabilité par une grandeur infinie, puisque même pour une région de taille finie la
fonction d'onde n'est pas bornée à grande distance, ce qui conduirait au résultat absurde que dans
toute région on a une probabilité nulle de trouver la particule !

Conditions de continuité
L'équation de Schrödinger indépendante du temps (3) est une équation différentielle linéaire du
second ordre en r. Donc, tant que V (r ) est fini, qu'il soit ou non continu, une connaissance de la
fonction d'onde et de son gradient le long d'une surface rend possible l'intégration de l'équation
pour obtenir la fonction d'onde en tout point. Il est donc raisonnable d'exiger que la fonction d'onde
et son gradient soit continu, fini et avec une seule valeur en tout point de l'espace afin qu'une
situation physique définie puisse être représentée de manière unique par une fonction d'onde. Ces
exigences ont aussi la conséquence que la densité de probabilité de position P(r ) et la densité de
courant de probabilité S(r ) soient finis et continus partout.

Conditions aux limites pour une énergie potentielle infinie


Si V (r ) est infini quelque part, la condition aux limites appropriée peut être établie par un
processus limite qui par de V fini et des conditions de continuité précédentes.

Supposons, par exemple, qu'il y a une discontinuité infinie dans V à travers une surface continue,
tel que l'énergie potentielle est finie d'un coté et + ∞ de l'autre, et nous voulons déterminer la
condition aux limites sur u (r ) et ∇u à cette surface. Les propriétés essentielles du problème sont
gardées si nous remplaçons la surface continue par le plan qui est tangent au point considéré et
l'énergie potentielle changeant de manière continue d'un coté de la surface par un potentiel constant
qui peut, sans perte de généralité, est choisi égal à zéro puisque tout changement constant dans V
est équivalent à un changement identique dans E. Nous choisissons l'origine des coordonnées au
point considéré et l'axe des x perpendiculaires au plan tangent.

L'équation (3) se sépare alors dans les coordonnées spatiales et la dépendance de u en y et z n'est
pas affectée par la discontinuité de V au plan x = 0. Nous voulons donc résoudre l'équation à une
dimension
h 2 d 2u
(6) − + V ( x )u = Eu
2m dx 2
où V ( x ) = 0 pour x < 0, V ( x ) = V0 pour x > 0 et nous passerons ensuite à la limite V0 → +∞ . Si
nous supposons que 0 ≤ E < V0 , les solutions générales de (6) sont
1
 2mE  2
u ( x ) = A sin αx + B cos αx x<0 α = + 2 
 h 
(7) 1
 2m(V0 − E )  2
u ( x ) = Ce − β x + De β x x>0 β = + 
 h2 
La condition aux limites que u est borné à grande distance nécessite que nous posions D = 0.
Ensuite, la continuité de u en x = 0 donne la relation B = C et la continuité de du / dx donne la
relation αA = − βC . Puisque β devient infini quand V0 devient infini et que la solution pour x < 0
doit être finie, la deuxième relation montre que C tend vers zéro lorsque V0 → +∞ donnant donc
aussi une valeur zéro pour B. A n'est pas déterminée à partir de ces relations mais peut être fixé par
normalisation.

Donc, la condition aux limites sur une surface où il y a un saut infini de potentiel est que la fonction
d'onde y vaut zéro et la composante du gradient de la fonction d'onde normale à la surface n'est pas
déterminée. L'hypothèse ci-dessus que E < V0 n'est évidemment pas une restriction puisque V0
tend vers l'infini. Pour E < 0, le sinus et le cosinus dans la solution pour x < 0 sont remplacés par
des sinus et cosinus hyperboliques (ce qui est autorisé puisque la solution a seulement besoin d'être
valide près de x = 0) sans changement sur le résultat final. On notera qu'à la fois P et S x s'annulent
lorsque x → 0 pour les valeurs négatives de x et sont donc continues en x = 0 même si du / dx ne
l'est pas.

Une frontière de ce type représente un mur impénétrable et parfaitement rigide puisque dans la
situation classique analogue, une particule de toute énergie fini aurait sa composante x de
l'impulsion instantanément renversée au contact de la surface.

Valeurs propres de l'énergie à une dimension


Les fonctions propres de l'énergie qui représentent des particules qui sont restreintes à une région
particulière de l'espace par l'énergie potentielle (première classe) sont toujours caractérisées par des
valeurs propres discrètes tandis que les fonctions propres qui ne s'annulent pas à grande distance
(deuxième classe) possèdent un domaine continu de valeurs propres.

Il peut sembler très surprenant qu'une équation différentielle n'impliquant que des fonctions
continues aboutisse au final à des solutions discrètes. Cela peut être constaté qualitativement en
considérant la nature des solutions de l'équation à une dimension (6).
Nous supposerons d'abord que V ( x ) devient égal à une certaine valeur constante qui peut être posée
égale à zéro pour des valeurs négatives et positives de x suffisament grandes et que E < 0. Une
particule classique avec cette énergie totale E ne peut pas s'évader à l'infini et ne peut en effet
exister dans la région que si E est plus grand ou égal à la plus petite valeur Vmin de V ( x ) . La forme
−β x
permise de la fonction d'onde pour x suffisament grand pour que V = 0 est évidemment e où

β = +(− 2mE / h 2 )2 . Ces deux solutions pour de grand x positifs et négatifs peuvent être prolongées
1

jusqu'à un certain point intermédiaire, disons x = 0, en utilisant l'équation de Schrödinger et les


conditions de continuité. A ce point, u peut toujours être rendu continu en choisissant les constantes
multiplicatives arbitraires pour les solutions approchées de x positif et négatif. Alors un peu de
réflexion montre que, pour une valeur arbitraire de E, elles ne se rencontreront pas avec la même
valeur de du / dx . Il peut, cependant, y avoir des valeurs particulières de E pour lesquelles à la fois
u et du / dx sont continues en x = 0. Les conditions pour cela peuvent être vues de la manière
suivante.
( )
Dans les régions où E < V ( x ) , d 2 u / dx 2 / u est positif et ainsi u est convexe vers l'axe des x.
Donc, les deux solutions qui sont prolongées depuis ± ∞ ont des signes opposés pour leur rapport
de pente à la valeur, (du / dx ) / u , aussi longtemps qu'elles sont dans les régions où E est inférieur à
V. Cela est illustré dans la figure (b) ci-dessus pour le potentiel (a). Les deux choix de signe pour u
sont montrés pour x < 0. Les points où E = V ( x ) sont des points d'inflexion (PE) ou "points de
demi-tour" pour le mouvement classique puisqu'ils sont les limites du mouvement d'une particule
classique d'énergie E où la particule fait demi-tour et renverse son mouvement. En ces points
d 2 u / dx 2 = 0 et u a une courbure nulle.

Clairement, ce qui est nécessaire pour que les deux solutions se rejoignent doucement est une
( )
région dans laquelle E > V ( x ) , afin que d 2 u / dx 2 / u soit négatif et que u soit concave vers l'axe
des x. Cela permet au rapport des pentes aux valeurs de devenir égales. La figure (c) montre les
deux solutions prolongées jusqu'à ce qu'elles se rencontrent, mais pour une valeur assez petite de E
et lorsque les u sont identiques au même endroit x = 0, les pentes ne sont pas égales (courbes
pleines) ou quand les pentes sont identiques en x = 0 les u ne sont pas égaux (courbe en tiret à
gauche et pleine à droite). La figure (d) montre une valeur de E un peu plus grande et la figure E
une valeur encore plus grande. Les valeurs de E et de Vmin sont indiquées sur l'axe des u et les
points d'inflexion sont indiqués sur l'axe des x, dans les trois derniers cas.

Niveaux d'énergie discrets


Nous voyons qu'une fonction propre qui satisfait les conditions aux limites et les conditions de
continuité et qui représente une particule liée par l'énergie potentielle V ( x ) peut exister pour la
valeur particulière de E illustrée dans la figure (d). En analogie avec la situation classique, une
condition nécessaire pour qu'une telle fonction propre existe est que Vmin < 0 , auquel cas E est entre
Vmin et 0. Comme dans le cas classique, cette condition est aussi suffisante à une dimension bien
que ce ne soit pas le cas à trois dimensions.
Si le puits de potentiel illustré dans la figure (a) précédente est suffisament large ou profond, il peut
exister une autre fonction propre correspondant à une valeur propre de l'énergie encore négative.
Les figures (a), (b) et (c) ci-dessus montrent une série de fonctions d'onde analogues à celles
montrées dans les figures (c), (d) et (e) précédentes pour des valeurs de E successivement
croissantes (successivement moins négatives). Les deux signes de u sont montrés pour x < 0. Donc
la figure (d) précédente et (b) ci-dessus montrent les fonctions propres pour les deux valeurs
propres de l'énergie les plus basses ou niveaux d'énergie d'une particule liée par le potentiel V ( x ) . Il
est facile de voir par un prolongement des arguments qualitatifs précédents que s'il y a des niveaux
d'énergie discrets plus élevés, chaque fonction d'onde a un nœud de plus que celle correspondant à
la valeur propre plus basse suivante.

Donc, pour une énergie potentielle qui approche une valeur constante finie lorsque x → ±∞ , il peut
y avoir un nombre fini de niveaux d'énergie discrets ou, dans certains cas, un nombre infini (si
V ( x ) diminue suffisament lentement pour de grands x ), selon V ( x ) et la masse de la particule.
Cependant, si V ( x ) → +∞ lorsque x → ±∞ , un argument comme celui donné ci-dessus montre
qu'il y aura toujours un nombre infini de niveaux d'énergie discrets. En dehors de constantes
multiplicatives arbitraires, il y aura une seule fonction propre u ( x ) pour chaque niveau.

Valeurs propres continues de l'énergie


Il est possible de trouver des fonctions propres qui obéissent aux conditions aux limites et de
continuité pour toutes les valeurs propres de l'énergie qui excède le plus petit des deux nombres
V (+ ∞ ) et V (− ∞ ) . Si, par exemple, l'énergie potentielle a la forme illustrée plus haut, alors des
solutions de l'équation de Schrödinger peuvent être trouvées pour toute valeur positive de E. Cela
est dû aux solutions pour de grands x qui ont la forme
1
 2mE  2
(8) A sin α x + B cos α x α = + 2 
 h 
et il n'y a aucune raison pour ne pas garder les deux termes. Donc il est toujours possible d'ajuster
la phase de chacune des fonctions d'onde pour de grands x (ce qui est équivalent à ajuster le
rapport A / B pour les solutions pour les grands x positifs et négatifs) de manière à ce qu'elles se
rejoignent doucement quand elles sont prolongées en x = 0.

Un exemple de ce type que nous avons déjà vu est l'électron diffusé par une impureté dans un
cristal.

Les termes classiques périodiques (ou avec périodicité multiple) et apériodique sont parfois utilisés
pour désigner les mouvements des particules associés avec respectivement les valeurs propres
discrètes et continues de l'énergie.
Valeurs propres discrètes et continues à trois dimensions
Nous supposerons sans plus approfondir que tous les résultats précédents peuvent se généraliser
naturellement à l'équation de Schrödinger à trois dimensions. Nous pouvons nous attendre à ce que,
si V (r ) → +∞ lorsque r → ∞ dans toutes les directions, alors il y aura un ensemble infini de
niveaux d'énergie discrets s'étendant jusqu'à + ∞ . Si V (r ) est borné lorsque r → ∞ dans une
certaine direction, il y aura un nombre fini ou infini de niveaux d'énergie, selon la forme de V.
Dans ce cas, les niveaux d'énergie ne peuvent pas excéder la plus petite valeur de V (∞ ) dans toute
direction. Pour des valeurs de E plus grandes que ce plus petit V (∞ ) , les valeurs propres de
l'énergie couvrent un domaine continu s'étendant jusque + ∞ .
II.4. Fonctions propres et valeurs propres
L'interprétation physique de la fonction d'onde a été discutée précédemment. Elle se rattache
essentiellement au calcul de valeurs moyennes des opérateurs qui représentent différentes quantités
physiques. En plus, une densité de probabilité de position a été introduite. Nous sommes donc dans
la position de calculer à partir de la fonction d'onde toute propriété qui dépend de la distribution
spatiale d'une particule (par exemple, l'écart type de sa position par rapport à la moyenne) mais
nous ne pouvons calculer que des valeurs moyennes pour les opérateurs autres que la position.
Clairement, ce dont nous avons besoin pour boucler notre interprétation de la fonction d'onde est
une méthode de calcul des fonctions de probabilité pour les opérateurs en général. Cela nous
permettrait en plus d'obtenir des expressions pour les valeurs moyennes sans hypothèse séparée.

Nous allons maintenant poser trois postulats physiques à partir desquels l'interprétation complète de
la fonction d'onde peut être dérivée. L'interprétation présentée précédemment peut être vue comme
un cas particulier du traitement plus général que nous allons voir.
II.5. Postulats d'interprétation et fonctions propres de l'énergie
Nous partons de la fonction d'onde ψ (r, t ) solution de l'équation de Schrödinger qui décrit le
mouvement d'une particule de masse m avec une énergie potentielle V (r ) . A partir de cette fonction
d'onde, nous voulons obtenir une description aussi complète que possible des propriétés du
mouvement de la particule qui soit consistante avec la relation d'indétermination dont nous avons
discuté.

Variables dynamiques comme opérateurs


Nous postulons d'abord que chaque variable dynamique qui se rapporte au mouvement de la
particule peut être représentée par un opérateur linéaire.

Un opérateur Ω est linéaire s'il satisfait l'équation Ω(a1ψ 1 + a 2ψ 2 ) = a1Ωψ 1 + a 2 Ωψ 2 pour des
nombres complexes a i et des fonctions ψ i arbitraires.

L'opérateur peut être simplement un opérateur multiplication tel que r pour la position ou il peut
être un opérateur différentiel tel que − ih∇ pour l'impulsion.

A chaque opérateur peut être associé une équation linéaire aux valeurs propres. Donc, à l'opérateur
Ω on peut associer l'équation
(1) Ωv µ = ω µ v µ
où v µ est la fonction propre de Ω correspondant à la valeur propre ω µ .

Notre deuxième postulat est que les valeurs propres ω µ sont les seuls résultats possibles d'une
mesure précise de la variable dynamique représentée par Ω . Cela implique que les valeurs propres
de tout opérateur qui représente une quantité physique mesurable sont des nombres réels.

L'ensemble des valeurs propres est aussi appelé le spectre de l'opérateur.


Développement en fonctions propres
Nous supposons que toutes les fonctions propres de toute variable dynamique constitue un
ensemble complet de fonctions dans le sens qu'une fonction continue arbitraire peut être
développée en fonction de ces fonctions propres. C'est une hypothèse mathématique et non
physique que nous analyserons plus loin en relation avec les fonctions propres de l'énergie et de
l'impulsion.

Supposons maintenant qu'une fonction d'onde particulière ψ est développée en terme des fonctions
propres v µ de l'opérateur Ω . Nous adoptons l'interprétation statistique de ψ que nous avons vue
selon laquelle il y a un grand nombre de régions identiques indépendantes de l'espace ou des
intervalles de temps dans lesquels une particule est décrite par ψ . Nous faisons alors des mesures
de la variable dynamique représentée par Ω sur chacune de ces particules. Notre troisième postulat
physique est que le nombre de mesures qui donnent la valeur propre ω µ est proportionnel au carré
de la grandeur du coefficient de v µ dans le développement de ψ . Ce postulat dû à Born nous
permet d'associer une fonction de probabilité à chaque variable dynamique. Un corollaire est que
nous sommes certains de mesurer une valeur propre particulière ω µ seulement quand la fonction
d'onde qui décrit la particule est la fonction propre correspondante v µ .

Plutôt que de développer les conséquences de ces postulats pour un opérateur arbitraire Ω , nous
allons considérer ici l'énergie totale de la particule et l'impulsion. La plus part des résultats obtenus
sont facilement généralisables aux autres opérateurs physiques.

Liens entre postulats et amplitudes


Mais avant, revenons à notre approche à travers les amplitudes pour faire le lien avec les postulats
qui viennent d'être posés. Il est facile de voir que ces postulats sont une conséquence des résultats
que nous avions obtenus.

Soit une particule passant à travers un processus physique déterminé Ω . L'amplitude pour passer
d'un état à un autre en passant par ce processus est φ Ω ψ . Nous avions alors identifié un
ensemble d'états de base qui sont associés à ce processus (éventuellement un processus de mesure).
Par exemple, le passage de la particule à travers des fentes ou la position de la particule autour d'un
atome dans un cristal.

Cet ensemble d'états de base peut être développé sur la base position et cela nous fournit
immédiatement un ensemble complet de fonctions d'ondes associées aux états du processus. Par
construction, les seuls états propres qui peuvent être mesurés sont ceux associés à ces états ou
fonctions propres particulières.

De plus, en développant un état ψ arbitraire sur cet ensemble d'états de base et avec l'interprétation
probabiliste nous avons immédiatement le troisième postulat.

Le lien entre valeurs propres et valeurs mesurées est moins immédiat. Nous avions déjà vu ce lien
avec l'énergie et l'opérateur hamiltonien. Le premier postulat est simplement une généralisation à
tout opérateur. C'est aussi une manière de définir les opérateurs associés aux quantités physiques.

L'opérateur énergie totale


Selon la relation d'indétermination, une mesure précise de l'énergie totale ne peut pas être faite en
une durée finie. Donc, si l'énergie totale a une valeur définie, il est essentiel que l'énergie
( )
potentielle V (r ) soit indépendante du temps. Alors l'opérateur − h 2 / 2m ∇ 2 + V (r ) est équivalent a
l'opérateur énergie totale ih(∂ / ∂t ) . Il a les fonctions propres u (r ) qui n'ont pas besoin d'impliquer
le temps. L'équation aux valeurs propre de l'énergie est
 h2 2 
(2) − ∇ + V (r )u E (r ) = Eu E (r )
 2m 
où la fonction propre u E (r ) correspond à la valeur propre E et obéit aux conditions aux limites et
de continuité.

Comme nous l'avons vu, les fonctions propres de l'énergie peuvent être divisées en deux classes :
celles qui sont bien localisées et qui sont associées avec des valeurs propres discrètes et celles qui
restent finies à grande distance et qui possèdent un domaine continu de valeurs propres.
Normalisation dans une boite
Il est souvent souhaitable de traiter ces deux classes sur la même base. Cela peut être obtenu en
enfermant la particule analysée dans une boite de volume arbitrairement grand mais fini. La
situation physique la plus simple à laquelle cette approche est applicable est une où les murs de la
boîte sont parfaitement rigides tel que la fonction d'onde s'y annule. Les discussions précédentes
montrent alors que toutes les valeurs propres sont discrètes. Si la boite est grande par rapport aux
dimensions physiques caractéristiques du problème, les valeurs propres qui étaient discrètes en
l'absence de la boite sont pratiquement inaffectées puisque avant que les murs ne soient introduits,
la fonction d'onde était extrêmement petite à cet endroit. De même, les valeurs propres qui étaient
continues en l'absence de la boîte sont très peu espacées. Nous le verrons explicitement pour une
particule libre.

Il est plus pratique de supposer que la fonction d'onde obéit à des conditions aux limites
périodiques sur les murs de la boite plutôt que de les annuler puisqu'il est alors possible d'avoir une
description plus simple des fonctions propres du moment, comme nous le verrons. Nous
choisissons la région finie comme un cube avec des cotés de longueur L centré sur l'origine et nous
demandons que chaque fonction d'onde ait la même valeur pour les points correspondants sur les
faces opposées du cube et la même dérivée normale au mur. Ces conditions aux limites rendent
discrètes les valeurs propres continues puisque la phase de la fonction propre à grande distance
n'est plus arbitraire. Comme avec la boite rigide, la présence des murs a un effet négligeable en
dehors de légèrement discrétiser les valeurs propres continues et de fournir un volume fini dans
lequel ces fonctions d'onde peuvent être normalisées. Nous continuerons à utiliser le mot "continu"
pour décrire ces fonctions même quand la boite de normalisation est utilisée.

Orthonormalité des fonctions propres de l'énergie

∫ u (r )
2
L'intégrale E d 3 r qui converge dans tous les cas pour les fonctions propres de l'ensemble
discret convergent pour toutes les fonctions propres quand elles sont normalisées dans la boite de
volume fini L3 . Le coefficient de u E peut être choisi pour que cette intégrale soit égale à l'unité et
les u E (r ) sont normalisés.
Nous allons maintenant montrer que les fonctions propres de deux valeurs propres différentes E et
E' sont orthogonales, c'est-à-dire que l'intégrale du produit de l'une par le complexe conjugué de
l'autre sur le domaine commun est zéro. Nous avions déjà eut l'occasion de voir cela sous la forme
des amplitudes pour les états de l'hamiltonien. A partir de (2) nous avons que u E∗ ′ (r ) satisfait
l'équation (où V est à nouveau supposé réel)
 h2 2 
(3) − ∇ + V (r )u E∗ ′ (r ) = E ′u E∗ ′ (r )
 2m 

En accord avec notre interprétation physique, nous avons supposé que E' est réel. Cela sera vérifié
ci-dessous. Nous multiplions (2) par u E∗ ′ et (3) par u E et nous intégrons sur le volume L3 puis nous
prenons la différence entre les deux équations résultantes. Les termes en V s'annulent et il reste

(4) −
h2
2m ∫
( )
u E∗ ′ ∇ 2 u E − u E ∇ 2 u E∗ ′ d 3 r = (E − E ′)∫ u E∗ ′ u E d 3 r

L'intégrale du coté gauche de (4) peut être transformée par le théorème de Green en une intégrale
de surface sur la surface A du cube :
∫( ) ( )
u E∗ ′ ∇ 2 u E − u E ∇ 2 u E∗ ′ d 3 r = ∫ ∇ ⋅ u E∗ ′ ∇u E − u E ∇u E∗ ′ d 3 r
(5)
( )
= ∫ u E∗ ′ ∇u E − u E ∇u E∗ ′ n dA
A
où l'indice n désigne la composante du vecteur dans la direction sortante normale à l'élément de
surface dA. Puisque l'imposition des conditions aux limites périodiques donne à chaque fonction
d'onde et sa dérivée normale les mêmes valeurs aux points correspondants des faces opposées du
cube, la dérivée normale sortante a des signes opposés sur des faces opposées et l'intégrale de
surface (5) s'annule. Alors, l'équation (4) nous dit que, si E ≠ E ′ , u E et u E ′ sont orthogonaux.

Il est évident que cette démonstration d'orthogonalité peut être appliquée à un ensemble discret de
fonctions propres même si la boite n'est pas introduite puisque les u s'annulent rapidement à grande
distance et l'intégrale de surface, qui est alors une sphère de rayon infini, est zéro. L'ensemble
continu de fonctions propres de l'énergie peut aussi être traité sans utiliser la normalisation dans
une boite.
Une valeur propre de l'énergie E est dite dégénérée quand deux ou plusieurs fonctions propres
linéairement indépendantes u1 , u 2 , … lui correspondent. Des combinaisons linéaires orthogonales
de fonctions propres dégénérées peuvent être trouvées de plusieurs manières, comme nous l'avions
déjà vu avec les états. Par exemple, u a = a1u1 + a 2 u 2 peut être rendu orthogonale à u1 en
choisissant les coefficients constants a1 et a 2 tels que
a1 ∫ u1∗ u 2 d 3 r
(6) =−

2
a2 u1 d 3 r

Ce choix n'interfère pas avec la normalisation de u a et u a est encore une fonction propre de
l'énergie avec la valeur propre E. Evidemment, le choix des combinaisons linéaires orthogonales
n'est pas unique. En continuant cette procédure, toutes les fonctions propres de l'énergie peuvent
être rendues orthogonales les unes aux autres même si certaines valeurs propres sont dégénérées.

Un tel ensemble de fonctions propres, toutes normalisées et orthogonales les unes aux autres, est
appelé un ensemble orthonormal de fonctions. Nous spécifions un ensemble orthonormal de
fonctions propres de l'énergie non dégénérées par la relation
(7) ∫ u E∗ ′ (r )u E (r )d 3 r = δ EE ′
où δ EE ′ est le symbole δ symétrique de Kronecker qui est égal à l'unité si E = E ′ et zéro
autrement. S'il y a dégénérescence, (7) doit être remplacé par
(8) ∫ u E∗ ′s′ (r )u Es (r )d 3 r = δ EE ′δ ss′
où l'indice s distingue les fonctions propres dégénérées orthogonales. Il est souvent pratique
d'omettre explicitement la mention de s et d'utiliser (7) également pour les situations dégénérées,
auquel cas l'indice s est implicite.
Réalité des valeurs propres de l'énergie
Nous pouvons maintenant voir directement que E est un nombre réel, comme cela a été supposé.
Multiplions (2) par u E∗ ′ (r ) et intégrons sur le volume L3 de la boite. Si u E est normalisé, le résultat
est
h2
(9) E = − ∫ u E∗ ∇ 2 u E d 3 r + ∫ V (r ) u E d 3 r
2

2m
qui peut être exprimé en fonction des valeurs moyennes comme (1 / 2m ) p 2 + V .

Le deuxième terme V est réel puisque son intégrand est réel. Le premier terme peut être montré
explicitement comme étant réel en utilisant une intégration par partie :
( )
(10) − ∫ u E∗ ∇ 2 u E d 3 r = ∫ ∇u E∗ ⋅ (∇u E )d 3 r − ∫ u E∗ (∇u E )n dA
A

L'intégrale de volume à droite est manifestement réelle et l'intégrale de surface, comme dans (5),
s'annule à cause des conditions aux limites périodiques sur les murs de la boite. Il est intéressant de
noter que p 2 ne peut pas être négatif.

Développement en fonctions propres de l'énergie


Comme mentionné au début de cette section, nous faisons l'hypothèse mathématique que
l'ensemble des fonctions propres u E (r ) de l'opérateur énergie totale constitue un ensemble complet
de fonctions dans le sens qu'une fonction continue arbitraire peut être développée en terme de ces
fonctions. Alors, si nous avons une fonction d'onde quelconque ψ (r ) à un instant particulier du
temps, normalisée dans la boite L3 et qui obéit aux conditions aux limites périodiques sur les
mures, l'existence supposée du développement
(11) ψ (r ) = ∑ AE u E (r )
E

rend possible de trouver des coefficients uniques AE qui ne dépendent pas de r.


Les coefficients dans le développement (11) peuvent être déterminés en multipliant les deux cotés
par u E∗ ′ et en intégrant sur la boite. Nous supposons que l'ordre de la sommation et de l'intégrale
peut être renversé.

La propriété de permutation de l'ordre des sommations et des intégrales doit être en principe
analysé séparément dans chaque cas. Les considérations mathématiques impliquées vont au-delà du
but cherché ici et nous supposerons toujours qu'une telle permutation est autorisée dans les
situations physiquement intéressantes.

Nous obtenons alors


(12) ∫ u E∗ ′ (r )ψ (r )d 3 r = ∑ AE ∫ u E∗ ′ (r )u E (r )d 3 r = ∑ AE δ EE ′ = AE ′
E E
où l'on a utilisé (7) ou (8).

La propriété de fermeture
La substitution de l'expression (12) pour AE dans (11) donne
[ ]
(13) ψ (r ) = ∑ ∫ u E∗ (r ′)ψ (r ′)d 3 r ′ u E (r )
E
que nous réarrangeons pour donner
 
(14) ψ (r ) = ∫ψ (r ′)∑ u E∗ (r ′)u E (r ) d 3 r ′
E 

Puisque ψ (r ) est une fonction continue arbitraire de r, l'équation (14) implique que la partie entre
crochet de l'intégrand s'annule sauf si r' = r puisque autrement la valeur de ψ au point r donnée
par (14) changerait quand les valeurs de ψ en d'autres points r ′ ≠ r seraient modifiées et cela
serait contraire à l'hypothèse que ψ peut avoir une forme arbitraire. De plus, l'intégrale du terme
entre crochet doit être l'unité quand le volume d'intégration inclut le point r' = r. Nous en
concluons donc que
∑ u (r ′)u (r ) = 0
E

E E r′ ≠ r
(15)
∫ ∑ u (r )u (r )d

E E
3
r =1
E
si le volume d'intégration inclut le point r' = r.

L'équation (15) décrit la propriété de fermeture de l'ensemble orthonormal de fonctions u E (r ) et


dérivent directement de leur complétude exprimée par (11), que ce soit des fonctions propres de
l'énergie ou pas.

Fonction de probabilité et valeur moyenne


Les deuxièmes et troisièmes postulats présentés au début de cette section disent que les valeurs
propres de l'énergie sont les seuls résultats possibles de mesures précises de l'énergie totale et que
la probabilité de trouver une valeur E particulière quand la particule est décrite par la fonction
d'onde ψ (r ) est proportionnelle à AE . Il est facile de voir que le facteur de proportionnalité est
2

l'unité car si nous posons la fonction de probabilité de l'énergie


(16) p (E ) = AE
2

nous voyons que la somme des P(E ) donne l'unité


∑ P(E ) = ∑ ∫ u (r )ψ (r )d r ∫ u (r ′)ψ (r ′)d
E E

E
3
E
∗ 3
r′

 
(17) = ∫∫ψ ′(r ′)ψ (r )∑ u E∗ (r )u E (r ′) d 3 rd 3 r ′
E 
= ∫ ψ (r ) d 3 r = 1
2

puisque ψ est normalisé. Nous avons utilisé ici les équations (15).

Nous pouvons aussi calculer la valeur moyenne de l'énergie à partir de la fonction de probabilité :
(18) E = ∑ EP(E ) = ∑ ∫ Eu E∗ (r )ψ (r )d 3 r ∫ u E (r ′)ψ ∗ (r ′)d 3 r ′
E E
Si nous remplaçons Eu E∗ (r ) par (2), la première intégrale de (18) peut être intégrée deux fois par
partie comme suit :
 h2 2  ∗
∫ Eu E (r )ψ (r )d r = ∫ψ (r )− 2m ∇ + V (r )u E (r )d r
∗ 3 3

(19)
 h2 2 
= ∫ u E∗ (r )− ∇ + V (r )ψ (r )d 3 r
 2m 

Les deux intégrales de surface qui résultent des intégrations par partie s'annulent à cause des
conditions aux limites périodiques sur u E et ψ . Donc, avec l'aide de (15), l'équation (18) devient
 h2 2 
E = ∑ ∫ u (r )−∗
E ∇ + V (r )ψ (r )d 3 r ∫ u E (r ′)ψ ∗ (r ′)d 3 r
E  2m 
 h 2
  
(20) = ∫∫ψ ∗ (r ′)− ∇ 2 + V (r )ψ (r )∑ u E∗ (r )u E (r ′) d 3 rd 3 r ′
  2m   E 
 h2 2 
= ∫ψ ∗ (r )− ∇ + V (r )ψ (r )d 3 r
 2m 

Le résultat obtenu dans (20) confirme l'hypothèse faites plus tôt que la valeur moyenne d'un
opérateur doit être calculée en insérant l'opérateur entre ψ ∗ (r ) et ψ (r ) pour qu'il opère seulement
sur ce dernier et ensuite en intégrant sur r.

Solution générale de l'équation de Schrödinger


Si l'énergie potentielle V (r ) est indépendante de t et que nous connaissons la solution de l'équation
de Schrödinger à un instant particulier, nous pouvons écrire une expression formelle pour la
solution à tout instant. Nous développons ψ (r, t ) en fonctions propres de l'énergie au temps t,
auquel cas les coefficients de développement dépendent du temps
(21) ψ (r, t ) = ∑ AE (t )u E (r ) AE (t ) = ∫ u E∗ (r )ψ (r, t )d 3 r
E
En substituant l'équation (21) dans l'équation de Schrödinger, on a
(22) ih ∑ u E (r ) AE (t ) = ∑ AE (t )Eu E (r )
d
E dt E

A cause de l'orthonormalité des u E , l'équation (22) est équivalente à


(23) ih AE (t ) = EAE (t )
d
dt
qui peut directement être intégré pour donner
− iE (t −t 0 ) / h
(24) AE (t ) = AE (t 0 )e

Notons que P(E ) = AE (t ) : AE (t 0 ) est constant dans le temps.


2 2

Donc, si ψ (r, t ) est connu au temps t = t 0 , la solution à tout instant t est donnée par (21) et (24) :
− iE (t −t 0 ) / h
ψ (r, t ) = ∑ AE (t 0 )e u E (r )
(25) E

AE (t 0 ) = ∫ u E∗ (r ′)ψ (r ′, t 0 )d 3 r ′
ou
 − iE (t −t 0 ) / h 
(26) ψ (r, t ) = ∫ ∑ u E∗ (r ′)u E (r )e ψ (r ′, t 0 )d r ′
3

E 

La solution (25) est une combinaison linéaire des fonctions propres de l'énergie.
II.6. Fonctions propres de l'impulsion
Les fonctions propres de l'opérateur impulsion linéaire − ih∇ fournissent un deuxième exemple
instructif de l'application des idées générales développées au début de la section précédente. Elles
sont aussi d'une utilité considérable pour résoudre des problèmes physiquement intéressant. Ce sera
aussi un approfondissement de l'analyse des fonctions propres de l'impulsion que nous avions déjà
vue dans la section II.1.2.3.

Forme des fonctions propres


Les fonctions propres de l'impulsion sont solutions des trois équations aux valeurs propres
(1) − ih∇u p (r ) = pu p (r )
ou

− ih u p (r ) = p x u p (r )
∂x

(2) − ih u p (r ) = p y u p (r )
∂y

− ih u p (r ) = p z u p (r )
∂z

Elles ont la forme


i (p ⋅ r )
(3) u p (r ) = C exp
h
où C est une constante de normalisation.

Il est utile de passer du vecteur impulsion p au vecteur de propagation k = p / h et de réécrire les


fonctions propres de l'impulsion
(4) u k (r ) = C exp(ik ⋅ r )

Ce sont des fonctions propres de l'opérateur impulsion avec les valeurs propres hk .
Normalisation dans une boîte
Comme avec les fonctions propres de l'énergie, nous pouvons restreindre le domaine des u k (r ) à
une boîte cubique arbitrairement grande mais finie de volume L3 centrée à l'origine et sur les murs
de laquelle les fonctions obéissent à des conditions aux limites périodiques. Alors u k est normalisé
3

si C = L 2 . De plus, k n'est plus un vecteur réel arbitraire. Ses composantes sont restreintes aux
valeurs
2πn x 2πn y 2πn z
(5) k x = ky = kz =
L L L
où n x , n y et n z sont des entiers positifs, négatifs ou nuls. L'espacement des vecteurs k voisins et
de leurs valeurs propres h 2 k 2 / 2m peut être rendu aussi petit que souhaité en prenant L
suffisament grand. Il est toujours supposé que la limite L → ∞ est prise à la fin des calculs.

Il est intéressant de noter que les fonctions propres de l'impulsion (4) ne peuvent pas exister dans
une boîte qui a des murs parfaitement rigides car ces fonctions propres ne s'annulent nul part. C'est
analogue à la situation classique où l'impulsion d'une particule qui est reflété par un mur rigide n'est
pas conservée. D'un autre coté, la boîte cubique avec des conditions aux limites périodiques est
équivalente à une situation dans laquelle l'espace entier est divisé en cubes adjacents et toutes les
fonctions d'onde sont périodiques à travers tout l'espace avec la période L le long des trois axes. Si
la périodicité de l'espace est transposée à la situation classique analogue, une particule passant à
travers un mur serait équivalente à une qui frappe ce mur et apparaît au point correspondant du mur
opposé avec son vecteur impulsion inchangé.

L'orthonormalité des fonctions propres de l'impulsion


3

(6) u k (r ) = L exp(ik ⋅ r )
2

est facilement établie. En intégrant sur le volume L3


∫ u (r )u (r )d

l k
3
r=
1 1 1
1 ( )
e i (k x −l x )x dx ∫ 21 e dy ∫ 21 e i (k z −lz )z dz
L L i k y −l y y L
(7)
L3 ∫ 2
1
− L
2
− L
2
− L
2

= δ k xlx δ k y l y δ k z l z ≡ δ kl
où nous avons utilisé (5). L'orthogonalité pourrait aussi être montrée par la méthode plus générale
utilisé pour les fonctions propres de l'énergie.

Normalisation avec la fonction de Dirac


On a dit dans la section précédente que les ensembles continus de fonctions propres peuvent être
manipulés sans introduire la boîte avec les conditions aux limites périodiques (ce qui a l'effet de
rendre l'ensemble discret avec un espacement des valeurs propres arbitrairement petit).

En utilisant la fonction de Dirac, on a par exemple pour la fermeture des fonctions propres de
l'énergie :
(8) ∑ u E∗ (r ′)u E (r ) = δ ( x − x ′)δ ( y − y ′)δ ( z − z ′) ≡ δ 3 (r − r ′)
E

La comparaison avec l'orthonormalité montre que la propriété de fermeture est une sorte
d'orthonormalité des fonctions propres par rapport à la sommation sur les valeurs propres.

On peut aussi l'appliquer à la normalisation (7) où nous n'imposons maintenant pas de boîte de
normalisation et nous permettons aux fonctions propres de l'impulsion d'avoir la forme (4) sur tout
l'espace avec tout vecteur réel k. L'intégrale ∫ u l∗ (r )u k (r )d 3 r est le produit de trois intégrales qui
peuvent être exprimées avec l'aide de la fonction de Dirac. En utilisant la représentation de cette
fonction à l'aide d'un sinus, on a :
∞ ( )
i k x −l x x g ( )
i k x −l x x
∫ −∞
e dx = lim ∫ e
g →∞ − g
dx
2 sin g (k x − l x )
(9) = lim
g →∞ k x − lx
= 2πδ (k x − l x )

Donc, les fonctions propres du moment dans un espace infini peuvent être écrites
(10) u k (r ) = (8π 3 ) 2 exp(ik ⋅ r )
1

et la relation d'orthonormalité devient


(11) ∫ u ∗j (r )u k (r )d 3 r = δ (k x − l x )δ (k y − l y )δ (k z − l z ) ≡ δ 3 (k − l )

Nous aurons l'occasion de voir que dans un problème typique, la normalisation des fonctions
propres de l'impulsion par une boîte ou par fonction Delta donne le même résultat final.

Fermeture
La propriété de fermeture des fonctions propres de l'impulsion, avec la normalisation dans une
boîte ou avec les fonctions Delta, peut être établie sans l'aide de l'hypothèse de complétude qui a
été faites dans la section précédente pour les fonctions propre de l'énergie. Avec la normalisation
dans une boîte, l'expression analogue, l'expression analogue au coté gauche de (8) est
∞ ∞ ∞ 2πu  n x ( x − x′ )+ n y ( y − y ′ )+ n z ( z − z ′ ) / L
(12) ∑ uk∗ (r ′)u k (r ) = L−3
k
∑ ∑ ∑e
n x = −∞ n y = −∞ n z = −∞
 

On l'évalue facilement à la limite des grands L auquel cas le contenu de la sommation change d'une
quantité négligeable lorsque chaque n change d'une unité. Nous pouvons alors voir n x comme une
∞ ∞ ∞
variable continue et remplacer ∑ par ∫ dn x = (L / 2π )∫ dk x . Nous obtenons alors
−∞ −∞
n x = −∞
∑ u (r′)u (r ) → (8π ) ∫ ∫ ∫
∗ 3 −1
∞ ∞ ∞ [ ]
i k x ( x − x′ )+ k y ( y − y ′ )+ k z ( z − z ′ )
k k e dk x dk y dk z
L →∞ −∞ − ∞ − ∞
(13) k

= δ ( x − x′)δ ( y − y′)δ ( z − z ′) = δ 3 (r − r′)


où nous avons utilisé (9).

Un calcul similaire peut être effectué, en utilisant la normalisation par la fonction de Dirac, auquel
cas nous obtenons de (10) et (9)
(14) ∫ u k∗ (r ′)u k (r )d 3 k = ∫∫∫ u k∗ (r ′)u k (r )dk x dk y dk z = δ 3 (r − r ′)

La relation de fermeture (13) ou (14) montre que les fonctions propres de l'impulsion sont
orthonormales par rapport à la sommation ou l'intégration sur les valeurs propres k aussi bien que
par rapport à l'intégration sur le vecteur position r.

Développement en fonctions propres de l'impulsion


Une fonction continue arbitraire ψ (r ) peut être écrite en utilisant la fonction Delta comme
(15) ψ (r ) = ∫ψ (r ′)δ 3 (r − r ′)d 3 r ′

Si nous substituons le coté gauche de (13) à la place de la fonction Delta dans (16), nous obtenons
ψ (r ) = ∫ψ (r ′)∑ u k∗ (r ′)u k (r )d 3 r ′ = ∑ Ak u k (r )
(16) k k

Ak = ∫ u k (r ′)ψ (r ′)d r ′
∗ 3

De même, si nous substituons à la fonction Delta l'expression (14), nous obtenons


(17) ψ (r ) = ∫ψ (r ′)∫ u k∗ (r ′)u k (r )d 3 kd 3 r = ∫ Ak u k (r )d 3 k
avec la même expression pour Ak . Les équations (16) et (17) montrent qu'il est possible de
développer une fonction arbitraire en fonctions propres du moment qu'elles soient normalisées dans
une boîte ou au moyen de la fonction de Dirac.
Notons que ces résultats, bien qu'établis ici avec assez peu de rigueur, sont équivalents aux
théorèmes mathématiques de développement des fonctions en séries de Fourier et en intégrales de
Fourier.

Fonction de probabilité et valeur moyenne


La fonction de probabilité impulsion associée avec une fonction d'onde normalisée ψ (r ) est
2
proportionnelle à Ak . Le facteur de proportionnalité est l'unité car si nous posons
(18) P(k ) = Ak
2

il est facile de montrer en analogie avec le cas de l'énergie que


(19) ∑ P(k ) = 1 et ∫ P(k )d 3 k = 1
k
pour, respectivement, la normalisation dans une boîte et avec la fonction de Dirac.

La valeur moyenne de l'impulsion quand une normalisation dans une boîte est utilisée est
(20) p = h ∑ kP(k ) = h ∑ ∫ ku k∗ (r )ψ (r )d 3 r ∫ u k (r ′)ψ ∗ (r ′)d 3 r ′
k k

A partir du conjugué complexe de (4), nous pouvons remplacer ku k∗ (r ) par i∇u k∗ (r ) . Alors, la
première intégrale dans (20) peut être intégrée par partie et l'intégrale de surface s'annule à cause
des conditions aux limites périodiques sur ψ et u k∗ . Donc, avec l'aide de (13), l'équation (20)
devient
p = −ih ∑ ∫ u k∗ (r )∇ψ (r )d 3 r ∫ u k (r ′)ψ ∗ (r ′)d 3 r ′
k

(21) = −ih ∫∫ψ (r ′)[∇ψ (r )]δ 3 (r − r ′)d 3 rd 3 r ′


= −ih ∫ψ ∗ (r )∇ψ (r )d 3 r

Ceci est en accord avec ce que nous avions déjà postulé.


Quand la normalisation par fonction Delta est utilisée, les détails du calcul sont très similaires à
ceux donnés ci-dessus excepté que l'intégrale de surface qui résulte de l'intégration partielle est sur
une sphère de rayon infini. Elle est nulle car ψ devient infiniment petit à grand distance. Ceci est
consistant avec l'hypothèse que ψ est normalisé, autrement, ni ∫ P(k )d
3
k ni p n'auraient de
signification physique. Le résultat du calcul dans ce cas est le même que l'équation (21).
III. Applications

III.1. Puits de potentiel carré à une dimension


Après toute cette théorie, passons maintenant à quelques exemples.

Comme exemple explicite simple du calcul des niveaux d'énergie discret d'une particule en
mécanique quantique, considérons le mouvement à une dimension d'une particule qui est restreinte
par des murs réflecteurs qui terminent une région d'énergie potentielle constante. Deux types
simples d'énergie potentielle sont considérés.

La figure (a) ci-dessus montre une situation où V ( x ) = 0 pour − a < x < a et V ( x ) = +∞ pour
x > a , correspondant à des murs parfaitement rigides, impénétrables aux points x = ± a . Dans la
figure (b) l'accroissement de l'énergie potentiel aux murs est abrupt mais fini, tel que V ( x ) = V0
pour x > a . A cause de son apparence, il est souvent appelé un puits carré de potentiel. Le
mouvement d'une particule classique avec une énergie totale E inférieure à V0 est le même pour ces
deux potentiels mais, comme nous le verrons, le comportement quantique est différent. En général,
un accroissement abrupt mais fini d'énergie potentielle aux limites d'une région force une particule
vers l'intérieur de la région. Un tel potentiel peut être vu comme un cas limite d'un potentiel plus
réaliste comme celui étudié dans la discrétisation des niveaux d'énergie et où la force − dV / dx est
toujours dirigée vers x = 0. La force associée à un puits de potentiel carré est nulle excepté aux
frontières, ainsi la particule ne subit aucune force excepté une soudaine impulsion dirigée vers
l'origine lorsqu'elle passe les points x = ± a .

Murs parfaitement rigides


Nous avons vu que la fonction d'onde doit s'annuler aux points x = ± a , quand l'énergie potentielle
a la forme montrée dans (a). L'équation de Schrödinger pour x < a est simplement
h 2 d 2u
(1) − = Eu
2m dx 2
qui a les solutions générales
1
 2mE  2
(2) u ( x ) = A sin αx + B cos αx α = + 2 
 h 

L'application des conditions aux limites en x = ± a donne


A sin αa + B cos αa = 0
(3)
− A sin αa + B cos αa = 0
d'où nous obtenons
(4) A sin αa = 0 B cos αa = 0

Nous ne voulons pas que A et B soient tous les deux zéros car cela donnerait la solution
physiquement sans intérêt u = 0 partout. De même, nous ne pouvons pas avoir à la fois sin αa et
cos αa égaux à zéro pour une valeur donnée de α ou E. Il y a donc deux classes possibles de
solutions. Pour la première classe
(5) A = 0 et cos αa = 0
et pour la deuxième classe
(6) B = 0 et sin αa = 0

Donc, αa = nπ / 2 , où n est un entier impair pour la première classe et un entier pair pour la
deuxième classe. Les deux classes de solutions et leurs valeurs propres de l'énergie sont alors
nπ x
(7) u ( x ) = B cos n impair
2a
nπx
(8) u ( x ) = A sin n pair
2a
π 2h 2n 2
(9) E = dans les deux cas
8ma 2

Il est évident que n = 0 donne le résultat physiquement sans intérêt u = 0 et que les solutions pour
des valeurs négatives de n ne sont pas linéairement indépendantes de celles pour n positif. Les
constantes A et B peuvent être facilement choisies dans chaque cas pour que les fonctions propres
u ( x ) soient normalisées.

Il y a donc une séquence infinie d'énergies discrètes qui correspondent à toutes les valeurs entières
positives du nombre quantique n. Il y a juste une fonction propre pour chaque niveau et le nombre
de nœuds de la nième fonction qui est dans le puits de potentiel est n - 1. Ces résultats sont en
accord avec la discussion que nous avons eut sur les solutions générales. Il est intéressant de noter
que l'ordre de grandeur du niveau d'énergie le plus bas ou état de base est en accord avec le principe
d'indétermination. L'incertitude de la position de l'ordre de a implique une incertitude sur le
moment au moins de l'ordre de h / a qui, en retour, implique une énergie cinétique minimale de
l'ordre de h 2 / ma 2 .
Echelon de potentiel fini
Quand l'énergie potentielle a la forme (b), il est nécessaire de compléter la solution générale (2), qui
est encore valide pour x < a puisque l'équation (1) est inchangée, par une solution pour x > a .
L'équation de Schrödinger dans cette région est
h 2 d 2u
(10) − + V0 u = Eu
2m dx 2
qui a la solution générale pour E < V0 (états liés)
1
 2m(V0 − E )  2
(11) u ( x ) = Ce − β x + De β x β = + 
 h2 

Les conditions aux limites en x = ±∞ nécessitent que nous posions D = 0 si (11) représente la
solution pour x > a et C = 0 si c'est la solution pour x < -a.

Nous imposons maintenant sur les solutions (2) et (11) les exigences que u et du / dx soient
continus en x = ± a .
A sin α a + B cos α a = Ce − β a
α A cos α a − α B sin α a = − βCe − β a
(12)
− A sin α a + B cos α a = De − β a
α A cos α a + α B sin α a = βDe − β a
d'où nous tirons
(13) 2 A sin α a = (C − D )e − β a 2α A cos α a = − β (C − D )e − β a
(14) 2 B cos α a = (C + D )e − β a 2α B sin α a = β (C + D )e − β a

A moins que A = 0 et C = D, les équations (13) ont comme conséquence


(15) α cot α a = − β

De même, à moins que B = 0 et C = -D, les équations (14) donnent


(16) α tan α a = β

Il est impossible pour les équations (15) et (16) d'être valides en même temps puisqu'en éliminant
β il faudrait que tan 2 α a = −1 ce qui donnerait un α imaginaire et un β négatif, contrairement à
(11). De même, nous ne souhaitons pas que A, B, C et D s'annulent tous. Donc, les solutions
peuvent nouveau être divisées en deux classes. Pour la première classe
(17) A = 0 C=D α tan α a = β
et pour la deuxième classe
(18) B = 0 C = −D α cot α a = − β

Niveaux d'énergie
Les niveaux d'énergie sont trouvés par une solution numérique ou graphique des équations (15) et
(16) avec les définitions de α et β donnés par (2) et (11). Une simple méthode graphique pour
trouver ces solutions est décrite ici, puisqu'elle montre assez clairement la manière avec laquelle le
nombre de niveaux discrets dépend de V0 et a. Nous posons ξ = α a et η = β a . Donc, l'équation
(16) devient ξ tan ξ = η avec
2mV0 a 2
(19) ξ 2 + η 2 =
h2
Puisque ξ et η sont restreint à des valeurs positives, les niveaux d'énergie peuvent être trouvés
dans ce cas à partir des intersections dans le premier quadrant de la courbe ξ tan ξ avec le cercle de

( )
1
rayon connu 2mV0 a 2 / h 2 2 . La construction est tracée ci-dessus pour trois valeurs de V0 a 2 . Pour
chacune des deux plus petites de ces valeurs il y a une solution à l'équation (16) et pour la plus
grande, il y en a deux.
La figure ci-dessus est une construction similaire pour la solution de (15) dans laquelle les niveaux
d'énergie sont obtenus à partir des intersections des même cercles avec la courbe − ξ cot ξ dans le
premier quadrant. La plus petite valeur de V0 a 2 ne donne aucune solution et les deux plus grandes
en donnent une. Donc les trois valeurs croissantes de V0 a 2 donnent respectivement une, deux et
trois niveaux d'énergie.

Il est clair à partir de ces figures que pour une particule de masse donnée, les niveaux d'énergie
dépendent du paramètre de l'énergie potentielle à travers la combinaison V0 a 2 . Pour V0 a 2 entre
zéro et π 2 h 2 / 8m , il y a seulement un niveau d'énergie de la première classe. Pour V0 a 2 entre
π 2 h 2 / 8m et quatre fois cette valeur, il y a un niveau d'énergie de chaque classe. Lorsque V0 a 2
croit, des niveaux d'énergie apparaissent successivement dans les premières et deuxièmes classes. Il
n'est pas difficile de voir à partir de (11) que lorsqu'elles sont ordonnées avec des valeurs propres
croissantes, la nième fonction propre a n - 1 nœuds.

Parité
Il suit de la discussion précédente que les fonctions propres de la première classe sont paires par
rapport au changement de signe de x ( u (− x ) = u ( x ) ) tandis que les fonctions propres de la
deuxième classe sont impaires ( u (− x ) = −u ( x ) ). Cette division des fonctions propres en types pairs
et impairs n'est pas accidentelle et nous allons montrer maintenant que c'est une conséquence
directe du fait que la fonction énergie potentielle V ( x ) est symétrique par rapport à x = 0. Si nous
changeons le signe de x dans l'équation de Schrödinger :
h 2 d 2u
(20) − + V ( x )u ( x ) = Eu ( x )
2m dx 2
et si V (− x ) = V ( x ) , nous obtenons
h 2 d 2 u (− x )
(21) − + V ( x )u (− x ) = Eu (− x )
2m dx 2

Donc, u ( x ) et u (− x ) sont solutions de la même équation avec la même valeur propre R. Supposons
d'abord qu'il y a seulement une fonction propre linéairement indépendante qui correspond à ce
niveau d'énergie. Alors u ( x ) et u (− x ) peuvent différer seulement par une constante multiplicative :
(22) u (− x ) = εu ( x )

Changer le signe de x dans (22) donne u ( x ) = εu (− x ) . A partir de ces deux équations, il s'ensuit
que
(23) ε 2 = 1 ou ε = ±1

Donc, de telles fonctions propres d'un potentiel symétrique sont ou paires ou impaires par rapport
au changement de signe de x. De telles fonctions sont dites avoir une parité paire ou impaire.
Si une valeur propre a plus d'une fonction propre linéairement indépendante, l'argument précédent
échoue et ces fonctions propres n'ont pas nécessairement une parité définie. Elles n'ont pas besoin
d'être paires ou impaires. Cependant, nous pouvons facilement voir que des combinaisons linéaires
de telles fonctions propres peuvent être trouvées de telles manières que chacune a une parité paire
ou impaire. Supposons qu'une fonction propre u ( x ) n'a pas de parité définie. On peut toujours
écrire
(24) u ( x ) = u p ( x ) + u i ( x )
où u p ( x ) = 12 [u ( x ) + u (− x )] est pair, u i ( x ) = 12 [u ( x ) − u (− x )] est impair et u p et u i sont linéairement
dépendant. Alors, si l'équation (20) est symétrique, nous pouvons l'écrire comme
2
h2 d u p h 2 d 2ui
(25) − + (V − E )u p − + (V − E )u i = 0
2m dx 2 2m dx 2

En changeant le signe de x dans (25), on obtient


2
h2 d u p h 2 d 2ui
(26) − + (V − E )u p + − (V − E )u i = 0
2m dx 2 2m dx 2

L'addition et la soustraction de (25) et (26) montre que u p et u i sont séparément des solutions de
l'équation de Schrödinger avec la même valeur propre E.

Une solution simplifiée


Savoir que les solutions possèdent une parité définie simplifie quelque fois la détermination des
niveaux d'énergie puisque nous avons alors seulement besoin de trouver la solution pour x positif.
Les solutions paires ont une pente nulle et les solutions impaires ont une valeur zéro en x = 0. Si,
par exemple, nous voulons trouver les solutions paires, les équations (2) et (11) peuvent être
remplacées par
u ( x ) = B cos αx 0< x<a
(27)
u ( x ) = Ce − β x x>a
Au lieu de rendre u et du / dx continus en x = a, il est suffisant de rendre le rapport (1 / u )(du / dx )
continu en x = a puisque les constantes de normalisation B et C sont ainsi éliminées. Cela donne
directement l'équation (16). De même, les solutions impaires sont
u ( x ) = A sin αx 0<x<a
(28)
u ( x ) = Ce − β x x>a

Alors, la continuité (1 / u )(du / dx ) en x = a donne immédiatement (15).


III.2. Mouvement d'un paquet d'ondes libre à une dimension
Le mouvement d'une particule libre (sans force externe) à une dimension est décrit par l'équation de
Schrödinger sans potentiel. L'étude de ce mouvement fournit une application intéressante des
techniques de développement développées précédemment. En premier lieu, nous allons trouver la
valeur minimale du produit des incertitudes et les formes possibles du paquet d'ondes à une
dimension qui lui correspond à un moment définit du temps. La structure de ce paquet minimal est
le même que la particule soit libre ou pas puisque sa forme peut être vue simplement comme une
condition initiale à la solution de l'équation de Schrödinger pour tout potentiel. Cependant, le
travail analytique nécessaire pour trouver ψ à d'autres instants est particulièrement simple dans le
cas libre.

Le produit d'incertitude minimale


Afin de trouver la valeur minimale de produit des incertitudes ∆x ⋅ ∆p , nous devons d'abord définir
la signification de ∆x et ∆p . Bien que plusieurs expressions soient possibles, la plus simple à
manipuler analytiquement est l'écart type à la moyenne.
(∆x )2 = (x − x )
2
= x 2 − 2x x + x
2
= x2 − x
2

(1)
(∆p )2 = ( p − p )
2
= p2 − p
2

Ces égalités suivent directement de la définition générale des valeurs moyennes que nous avons
vues. Notez que ∆x et ∆p sont chacune calculées séparément à partir de ψ . Nous ne considérons
pas l'existence possible d'une "distribution de probabilité conjointe" pour x et p. Si nous posons
maintenant
d d 
(2) α ≡ x − x β ≡ p − p = −ih − 
 dx dx 
alors
∞ ∞
(∆x )2 (∆p )2 = ∫−∞ψ ∗α 2ψdx ∫−∞ψ ∗ β 2ψdx
(3)
= ∫ (α ∗ψ ∗ )(αψ )dx ∫ (β ∗ψ ∗ )(βψ )dx
∞ ∞

−∞ −∞

La transformation de l'intégrale α dans (3) est évidente. La transformation similaire de l'intégrale


β suit d'une intégration par partie en se souvenant que ψ est un paquet d'onde normalisé qui
s'annule en x = ±∞ .

L'inégalité
2

(4) ∫ f − g
∫ fg dx
dx ≥ 0
∫g
2
dx
où toutes les intégrales sont prises de x = −∞ à + ∞ , est évidemment vraie et l'égalité est
applicable seulement si f = γg où γ est une constante. A partir de cette inégalité, nous obtenons
directement
2

∫ f dx ∫ g dx ≥ ∫ f ∗ gdx
2 2
(5)

Si nous remplaçons maintenant f par αψ et g par βψ , avec l'aide de (5), l'équation (3) devient
(6) (∆x ) (∆p ) ≥ ∫ (α ψ )(βψ )dx
2 2
∗ ∗
= ∫ψ ∗αβψdx
2 2

Le dernier terme dans (6) peut être écrit


(7) ∫ψ ∗ [12 (αβ − βα ) + 12 (αβ + βα )]ψdx = ∫ψ (αβ − βα )ψdx + 14 ∫ψ (αβ + βα )ψdx
2 2 2
1 ∗ ∗
4

Le terme croisé dans le produit est omit sur le coté droit de (7) car il s'annule. On peut le voir en
utilisant la relation
(8) (∫ψ αβψdx ) = ∫ψα β ψ


∗ ∗ ∗
( )
dx = ∫ β ∗ψ ∗ (αψ )dx = ∫ψ ∗ βαψdx
qui est obtenue en utilisant une intégration par partie et en se souvenant que α est réel.
Maintenant, à partir de (2)
 dψ d 
(9) (αβ − βα )ψ = −ih  x − ( xψ ) = ihψ
 dx dx 

Nous obtenons donc à partir des équations (6) à (9)


(10) (∆x ) (∆p ) ≥ 14 h 2 ou ∆x ⋅ ∆p ≥ 12 h
2 2

où l'égalité est seulement obtenue si le deuxième terme sur le coté droit de (7) est zéro. C'est
l'expression précise de la relation d'indétermination de Heisenberg quand les incertitudes ∆x et ∆p
sont définies comme dans (1).

Forme du paquet minimum


Il suit de la dérivation précédente que le produit d'incertitude minimum est obtenu seulement quand
deux conditions sont satisfaites :
(11) αψ = γβψ
(12) ∫ψ ∗ (αβ + βα )ψdx = 0

Les équations (11) et (2) nous donnent une équation différentielle pour ψ
dψ  i i p 
(13) =  (x − x ) + ψ
dx  γh h 
qui est facilement intégrée pour donner
 i 
(14) ψ ( x ) = N exp  (x − x )2 + i p x 
 2γh h 
où N est une constante arbitraire.

L'équation (12) avec l'aide de (11) devient


1 1 
(15)  + ∗  ∫ψ ∗α 2ψdx = 0
γ γ 
qui nécessite évidemment que γ soit purement imaginaire. Alors, puisque nous désirons que (14)
représente un paquet d'ondes pour lequel l'intégrale de ψ converge, γ doit être un imaginaire
2

négatif. La grandeur de la constante N peut maintenant être fixée en normalisant ψ .


(16) ∫ ψ dx = 1
2

De même, γ peut être déterminé en exigeant que

∫ (x − x ) ψ dx = (∆x )
2 2 2
(17)

Les intégrales sont facilement évaluées et cela conduit au paquet d'ondes minimal normalisé
 (x − x )2 i p x 
[ ]
1
(18) ψ ( x ) = 2π (∆x )
2 −4
exp − + 
 4(∆x )
2
h 

Coefficients du développement en impulsion


Les fonctions propres de l'impulsion à une dimension sont
1

(19) u k ( x ) = L e ikx2

pour la normalisation dans une "boîte" à une dimension de longueur L et


(20) u k ( x ) = (2π ) 2 e ikx
1

pour la normalisation par fonction de Dirac. Puisque pour une particule libre, l'équation de
Schrödinger a la forme simple
∂ψ h 2 ∂ 2ψ
(21) ih =−
∂t 2m ∂x 2
les fonctions propres de l'impulsion sont aussi des fonctions propres de l'énergie. L'inverse n'est pas
nécessairement vrai puisqu'il y a deux solutions à (23) ci-dessous pour k (positif et négatif) pour
chaque valeur de E k . Donc, toute solution de l'équation d'onde peut être écrite comme
 
(22) ψ ( x, t ) =  ∑ ou ∫ dk  Ak e −iEk t / h u k ( x )
 k 
où mes Ak sont indépendant de x et de t. La dépendance au temps est contenue entièrement dans le
facteur exponentiel. On vérifie facilement que (22) est une solution de (21) par substitution, pourvu
que
h 2k 2
(23) E k =
2m

Le problème de trouver le mouvement d'un paquet d'ondes est donc résolu en trouvant les
coefficients de développement Ak à un certain moment particulier, disons t = 0, et en utilisant (22)
et (23) pour trouver ψ ( x, t ) à d'autres moments. En t = 0, les facteurs exponentiels dans (22) sont
l'unité et nous pouvons utiliser l'expression que nous connaissons pour trouver les Ak .
(24) Ak = ∫ u k∗ ( x )ψ ( x,0 )dx

Les limites de l'intégrale sont x = ± 12 L ou x = ±∞ selon qu'on a utilisé la normalisation dans une
boîte ou par fonction de Dirac. La fonction de probabilité de l'impulsion P(k ) = Ak e −iEk t / h
2
= Ak
2

est indépendante du temps et ainsi p et ∆p , par exemple, sont des constantes.

Changement dans le temps d'un paquet minimum


Comme exemple, prenons l'équation (18) pour ψ ( x,0) avec x = p = 0 . Ainsi, le paquet d'onde
est initialement centré à l'origine et a une impulsion moyenne nulle. Alors, en utilisant la
normalisation dans une boite, (24) donne

[ ]  
1 1
x2
Ak = 2πL2 (∆x ) 4 ∫ 21 exp −
2 − L
− ikx  dx
 4(∆x )
− L 2
2 
(25) 1
 8π (∆x )2  4 −k 2 (∆x )2
= 2  e
 L 
où L est supposé être suffisament grand pour que la contribution de l'intégrale pour x > 12 L puisse
être négligée. La substitution dans (22) donne la fonction d'onde pour des valeurs quelconques de t
:
(26) ψ ( x, t ) = ∑ Ak e −ihk u k (x )
2
t / 2m

k
où k = 2πn / L et n prennent toutes les valeurs entières positives, négatives ou zéro. L peut être pris
arbitrairement grand pour que n puisse être vu comme une variable continue et la sommation est
remplacée par ∫ dn qui en retour est le même que (L / 2π )∫ dk . Donc
1
 (∆x )2  4 ∞  2 i hk 2 t 
ψ ( x, t ) =  3  ∫− ∞
exp  − k (∆x ) 2
− + ikx  dk
(27)  2π   2m 
1

 i ht  x2
= (2π )
1 2

 ∆x +  exp−
4(∆x ) + 2iht / m
4
 2m∆x  2

La densité de probabilité de position est alors


1

  h 2 t 2   2
x2
(28) ψ ( x, t ) = 2π (∆x ) + exp−
2

[ ]
2
2 
4m 2 (∆x )   2 (∆x ) + h 2 t 2 / 4m 2 (∆x )
2 2
 

L'équation (28) est de la même forme que ψ ( x,0 ) , excepté que (∆x ) est remplacé par
2 2

(∆x )2 + h 2 t 2 / 4m 2 (∆x )2 , qui est égal à (∆x )2 + (∆p )2 t 2 / m 2 . Donc, le centre du paquet reste en x =
0 tandis que la largeur du paquet s'accroît lorsque t s'écarte de 0 dans les directions passées et
futures. Plus petites est l'incertitude initiale sur la position, plus grande est l'incertitude sur
l'impulsion et plus rapidement le paquet se disperse. La partie dépendant du temps de l'expression
ci-dessus, t∆p / m est simplement la distance parcourue par une particule classique d'impulsion ∆p
pendant le temps t.
L'utilisation de la normalisation par fonction de Dirac ne modifie pas les résultats du calcul
précédent. L'expression de Ak donnée par (25) doit être multipliée par (L / 2π ) 2 . Dans l'équation
1

(26) la sommation doit être replacée directement par ∫ dk éliminant un facteur L / 2π . Enfin, u k

dans (26) doit être multiplié par (L / 2π ) 2 . Ces trois facteurs s'annulent et ainsi (27) et (28) sont
1

inaffectés par le choix de la normalisation des fonctions propres de l'impulsion.

Limite classique
Nous avons vu qu'un paquet d'ondes se déplace toujours comme une particule classique tant que
cela concerne les valeurs moyennes de sa position et de l'impulsion. Cependant, la dynamique
classique est utile comme une description du mouvement seulement si la dispersion du paquet
d'ondes peut être négligée pendant la durée d'un problème particulier.

Comme exemple simple du type de paramètre qui indique quand la limite classique est atteinte,
considérons un paquet d'ondes qui correspond à une particule classique se déplaçant sur une orbite
circulaire de rayons a et une période T. Nous supposerons que ce paquet est suffisament bien
localisé de manière à ce que l'énergie potentielle ne varie pas de manière appréciable sur ses
dimensions. Alors, la théorie classique peut fournir une description utile du mouvement seulement
si un paquet d'onde tel que celui discuté ci-dessus se disperse d'une quantité qui est petite en
comparaison de a durant un temps qui est grand en comparaison de T. La plus petite dispersion du
paquet durant un intervalle de temps de grandeur t est atteinte quand ∆x est choisi de l'ordre de
(ht / m) 2 . Nous exigeons que (ht / m) 2
1 1
<< a quand t >> T . Cette condition peut être exprimée en
disant que le moment angulaire 2πma / T de la particule doit être très grand par rapport à h .
2

Donc, pour la plus part des systèmes atomiques, où le moment angulaire est de l'ordre de h , un
paquet d'ondes correspondant à une particule bien localisée se disperse tellement en une seule
période que ce type de description du mouvement n'est pas physiquement intéressant.
IV. Etats liés
Le formalisme qui a été développé et formalisé précédemment va maintenant être appliqué au
calcul explicite de niveaux d'énergie discrets et les fonctions propres correspondantes. Nous
sommes donc concernés ici par les états liés dans lesquels la particule est restreinte par des forces
externes (énergie potentielle) à une région particulière de l'espace.

Le nombre relativement faible de fonctions énergie potentielle V (r ) pour lesquelles une solution
analytique de la fonction d'onde est possible sont important au-delà de leur intérêt pour ces
problèmes puisqu'elles servent souvent de base pour des calculs approchés sur des systèmes plus
complexes.
IV.1. Oscillateur harmonique linéaire
Le mouvement à une dimension d'une masse ponctuelle attirée par un centre fixe par une force qui
est proportionnelle au déplacement par rapport à ce centre fournit un des problèmes fondamentaux
de la dynamique classique. Son étude est importante non seulement en elle-même mais aussi parce
que des systèmes plus compliqués peuvent toujours être analysés en termes de modes normaux du
mouvement quand les forces inter-particules sont des fonctions linéaires des déplacements relatifs
et ces modes normaux sont formellement équivalents aux oscillateurs harmoniques. Cette linéarité
des équations newtoniennes du mouvement signifie que l'énergie potentielle du système est une
fonction bilinéaire des coordonnées. Puisque cet aspect se transpose en mécanique quantique, les
modes normaux harmoniques peuvent également y être trouvés. Donc, l'oscillateur harmonique à
une dimension est très important pour le traitement en mécanique quantique de problèmes tels que
les vibrations d'atomes individuels dans des molécules et des cristaux. Il fournit aussi la clef de la
théorie quantique du champ électromagnétique. Les vibrations du champ électromagnétique dans
une cavité peuvent être analysées en modes normaux harmoniques, chacun ayant les niveaux
d'énergie de l'oscillateur type. L'excitation d'un mode particulier de fréquence angulaire ω au
nième état excité signifie que l'énergie du système est augmentée de nhω et correspond
physiquement à l'addition de n photons de cette fréquence au système.

Nous n'aborderons pas ici la théorie quantique des champs mais cette étude des oscillateurs
harmoniques est donc un passage obligé avant d'attaquer un cours sur la quantification des champs.

Nous allons maintenant résoudre le problème de l'oscillateur en partant de l'équation de


Schrödinger. Cependant, il peut aussi être résolu par des méthodes algébriques en partant de la
théorie matricielle que nous aborderons plus tard. L'importance de l'oscillateur harmonique est si
grand que nous donnerons aussi la solution matricielle.

Comportement asymptotique
La force F = − Kx peut être représentée par l'énergie potentielle V ( x ) = 12 Kx 2 et l'équation de
Schrödinger devient
h 2 d 2u 1 2
(1) − + Kx u = Eu
2m dx 2 2

Il est utile pour travailler avec une équation de ce type de la récrire sous forme sans dimension. A
cette fin, nous introduisons une variable indépendante sans dimension ξ = αx et une valeur propre
sans dimension λ et nous tentons de mettre (1) sous la forme

(2)
d 2u
dξ 2
( )
+ λ −ξ 2 u = 0

La comparaison des équations (1) et (2) montre que cela est possible si et seulement si
1
mK 2E  m  2 2E
(3) α = 2
4
λ=   =
h h K hω c

La solution de (2) est facilitée en examinant d'abord le comportement dominant de u dans la région
1
± ξ2
asymptotique ξ → ±∞ . Pour ξ suffisament grand, il est évident que u (ξ ) = ξ en 2
satisfait (2) si
on ne considère que les termes dominant (qui sont de l'ordre de ξ u ), quand n a toute valeur finie.
2

Les conditions aux limites nous permettent de garder seulement le signe moins de l'exponentielle.
Cela suggère qu'il est peut-être possible de trouver une solution exacte à (2) de la forme
1
− ξ2
(4) u (ξ ) = H (ξ )e
2

où H (ξ ) est un polynôme d'ordre fini en ξ . La substitution de (4) dans (2) donne l'équation pour
H (ξ )
(5) H ′′ − 2ξH ′ + (λ − 1)H = 0
où l'apostrophe indique la dérivée par rapport à ξ .

Niveaux d'énergie
Nous allons trouver une solution pour H de la forme
(6) H (ξ ) = ξ s (a 0 + a1ξ + a 2ξ 2 + L) a 0 ≠ 0 s ≥ 0
Elle est nécessairement finie pour ξ = 0 . L'équation (5) est valide pour toute valeur de ξ et donc,
quand (6) est substitué dedans, le coefficient de chaque puissance de ξ peut être égalisé à zéro.
s (s − 1)a 0 = 0
(s + 1)sa1 = 0
(s + 2)(s + 1)a 2 − (2s + 1 − λ )a0 = 0
(7)
(s + 3)(s + 2)a3 − (2s + 3 − λ )a1 = 0
L
(s + ν + 2)(s + ν + 1)aν +2 − (2s + 2ν + 1 − λ )aν
=0
où ν est un entier. Puisque a 0 ne peut pas être nul, la première équation de (7) nous dit que s = 0
ou s = 1. La deuxième équation nous dit que s = 0 ou a1 = 0 ou les deux. La troisième équation
nous donne alors a 2 en fonction de a 0 . La quatrième nous donne a3 en fonction de a1 . Et
l'équation générale nous donne aν + 2 en fonction de aν .

La discussion sur la parité a montré que u (ξ ) et donc aussi H (ξ ) peuvent être choisi ou pair ou
impair en ξ . Il suit alors de (6) que a1 et tous les autres coefficients d'indice impair sont zéros. La
fonction d'onde est alors paire ou impaire selon que s = 0 ou s = 1.

Il suit de (7) que la présence dans la série (6) d'un nombre fini ou infini de termes dépend du choix
de s et de la valeur propre λ . Si la série ne se termine pas, son comportement asymptotique
dominant peut être inféré des coefficients de ses termes les plus grands :
a 2
(8) ν + 2 →
aν ν →∞ ν

Ce rapport est le même que celui des séries pour ξ n eξ pour toute valeur finie de n. L'équation (4)
2

montre que ce comportement de H viole les conditions aux limites sur u pour ξ grand.
Donc, la série (6) doit se terminer. Cela signifie que
(9) λ = 2 s + 2ν + 1

ν doit être un entier pair puisque a0 ≠ 0 et autrement les termes d'indice pair formeraient une série
infinie. L'indice s peut encore être 0 ou 1 et, correspondant à ces deux valeurs, λ est égal à 2ν + 1
ou 2ν + 3 où ν est un entier pair. Nous pouvons exprimer les deux cas en fonction d'un nombre
quantique n :
 1
(10) λ = 2n + 1 E n =  n + hω c n = 0,1,2, K
 2

Il suit des équations (10) et (7) que n est la plus grande valeur de s + ν dans la série (6) pour H. Si
nous notons le polynôme correspondant H n (ξ ) , nous voyons que H n est de degré n en ξ et est
1
− ξ2
entièrement pair ou impair selon que n est pair ou impair. Puisque e 2 est pair et n'a pas de
nœuds, la fonction propre correspondante u n (ξ ) a la parité de n et a n nœuds.

Energie de point zéro


La séquence infinie de niveaux d'énergie (10) a l'espacement régulier postulé en 1900 par Planck et
est en accord avec les règles de quantification de la vieille théorie quantique. Cependant, la valeur
finie du niveau d'énergie de l'état de base 12 hω c , appelée énergie de point zéro, est caractéristique
de la mécanique quantique et est relié au principe d'indétermination de la même manière que le
niveau d'énergie le plus bas du puits de potentiel carré avec des murs rigides est fini. L'énergie
totale est de l'ordre de (∆p ) / m + K (∆x ) , où ∆p et ∆x sont des mesures de la dispersion en
2 2

impulsion et en position. Si on minimise cette valeur en prenant en compte la relation


d'indétermination, il est facile de voir que le ∆p minimum est de l'ordre de (Kmh 2 )4 et ainsi
1

l'énergie totale minimale est de l'ordre de h(K / m ) 2 ou hω c .


1

Polynômes de Hermite
Le polynôme d'ordre n qui a la parité de n et est une solution de (5) avec λ = 2n + 1
(11) H n′′ − 2ξH n′ + 2nH n = 0
est appelé le nième polynôme de Hermite H n (ξ ) . Il est clair de la discussion précédente de
l'équation (5) que ces conditions définissent H n de manière unique excepté pour une constante
multiplicative arbitraire. Il n'est pas nécessaire, alors, d'utiliser la relation de récursion (7) pour
étudier les propriétés détaillées de H n si une autre formulation peut être trouvée qui est consistante
avec ces conditions. Une formulation beaucoup plus utile est effectivement disponible. Elle
exprime les H n en fonction d'une fonction génératrice S (ξ , s ) .
S (ξ , s ) = e ξ
2 − ( s −ξ )2 2 + 2 sξ
= e −s
(12) ∞
H n (ξ ) n
=∑ s
n =0 n!

Si l'exponentielle dans (12) est développée en puissances de s et de ξ , on voit qu'une puissance de


s est associée seulement avec les puissances de ξ qui sont égales à cette puissance ou inférieure par
un nombre entier. Donc, H n (ξ ) définit de cette manière est un polynôme d'ordre n qui a la parité de
n.

Pour montrer que H n satisfait l'équation différentielle (11), nous différentions les deux cotés de
(12) par rapport à ξ et ensuite par rapport à s.
∂S 2 s n +1 sn
= 2 se − s + 2 sξ = ∑ H n (ξ ) = ∑ H n′ (ξ )
2

∂ξ n n! n n!
(13)
∂S
= (− 2 s + 2ξ )e − s + 2 sξ = ∑
(− 2s + 2ξ )s n H (ξ ) = s n −1
∑n (n − 1)! H n (ξ )
2

∂s
n
n n!

En égalant les puissances de s dans les sommes de ces deux équations, on a, respectivement,
H n′ = 2nH n−1
(14)
H n+1 = 2ξH n − 2nH n −1
L'équation différentielle à l'ordre le plus bas impliquant seulement H n qui peut être construite à
partir des équations (14) est facilement vue comme étant (11). Donc, le H n (ξ ) donné par (12) sont
les polynômes de Hermite.

Les relations (14) peuvent être utilisées pour le calcul de H n et leurs dérivées ou une expression
explicite obtenue directement de la fonction génératrice peut être utilisée. Si S (ξ , s ) est différentiée
n fois par rapport à s puis que s est posé égal à 0, (12) montre que le résultat est simplement H n (ξ ) .
Maintenant, pour toute fonction de la forme f (s − ξ ) , il est évident que
∂f ∂f
(15) =−
∂s ∂ξ

Donc
∂nS ξ2 ∂
n
n ξ2 ∂
n
− ( s −ξ )2
( ) e −( s −ξ )
2
(16) = e e = − 1 e
∂s n
∂s n
∂ξ n

Cela donne une expression pour le nième polynôme de Hermite :


2 ∂
n
(17) H n (ξ ) = (− 1) eξ
2
e −ξ
n

∂ξ n

Les trois premiers polynômes calculés à partir de (17) sont


(18) H 0 (ξ ) = 1 H 1 (ξ ) = 2ξ H 2 (ξ ) = 4ξ 2 − 2

Fonctions d'onde de l'oscillateur harmonique


La fonction génératrice est aussi utile pour le calcul des intégrales impliquant les fonctions d'ondes
de l'oscillateur harmonique (4) :
1
− α 2x2
(19) u n ( x ) = N n H n (αx )e 2
Supposons, par exemple, que nous souhaitions normaliser u n ( x ) . C'est équivalent à choisir la
constante N n tel que
2
∞ Nn ∞
u n ( x ) dx = H n2 (ξ )e −ξ dξ = 1
2
∫ ∫
2
(20)
−∞ α −∞

L'intégrale sur le coté droit peut être exprimée comme une série de coefficients dans le
développement d'une intégrale contenant de produit de deux fonctions génératrices.
∞ ∞
∞ s nt m ∞
(21) ∫ e − s + 2 sξ e −t + 2tξ e −ξ dξ = ∑ ∑ ∫ H n (ξ )H m (ξ )e −ξ dgx
2 2 2 2

−∞ − ∞
n = 0 m = 0 n! m!

L'intégrale sur la gauche de (21) est facilement évaluée directement pour donner
1
(22) π e = π ∑
2 2 st
1 ∞
2
(2 st )
n

n =0 n!

Si les puissances égales de s et t sont égalisées dans les séries sur le coté droit de (21) et (22), nous
obtenons les résultats
1

∫ H n2 (ξ )e −ξ dξ = π 2 2 n n!
2

−∞
(23)

∫ H n (ξ )H m (ξ )e −ξ dξ = 0 n ≠ m
2

−∞

La première équation dans (23) nous dit que la constante de normalisation peut être choisie comme
1
 2
 α 
(24) N n =  1
 2 n 
 π 2 n! 
où un facteur multiplicatif de phase complexe constante de grandeur unité est encore arbitraire. La
deuxième de ces équations nous dit que u n ( x ) et u m ( x ) sont orthogonaux si n ≠ m . C'est en accord
avec le résultat général pour les fonctions propres de l'énergie non dégénérées puisque, en accord
avec (10), E n ≠ E m si n ≠ m et ainsi il n'y a pas dégénérescence.

L'intégrale
∞ N n∗ N m ∞
∫ u n∗ ( x )xum ( x )dx = ∫ ξH n (ξ )H m (ξ )e −ξ dξ
2
(25)
−∞ α 2 −∞

est typique de celles qui peuvent être évaluées avec l'aide de la fonction génératrice. Les deux
expressions en séries pour l'intégrale
∞ ∞
∞ s nt m ∞
(26) ∫ e − s + 2 sξ e −t + 2tξ ξe −ξ dξ = ∑ ∑ ( ) ( )
2 2 2 −ξ 2
∫−∞ ξ H n ξ H m ξ e dξ
−∞
n = 0 m = 0 n! m!
et
1
(27) π (s + t )e = π 2 ∑
2 2 st
1 ∞
(
2 n s n +1t n + s n t n +1 )
n =0 n!
peuvent être égalisées terme à terme. Avec l'aide de (24), nous avons
 1

 1  n + 1  2
 m = n +1
α  2 
 1
∞  1  n 2
(28) ∫ u n ( x )xu m ( x )dx =   

m = n −1
α  2
−∞


0 autrement


Correspondance avec la théorie classique

Le tracé des six premières fonctions d'onde de l'oscillateur harmonique est donné ci-dessus. Il est
2
évident que les densités de probabilité de position u n associées à ces fonctions d'onde
stationnaires ont peu de ressemblance avec les densités correspondantes pour l'oscillateur
( )
1

harmonique classique. Ces dernières sont proportionnelles à ξ 02 − ξ 2 2 où ξ 0 est l'amplitude de
l'oscillateur classique dont l'énergie est égale à la valeur propre de la mécanique quantique.
L'accord entre les densités de probabilité classiques et quantiques s'améliore rapidement avec n
croissant.
2
La figure ci-dessus contient un tracé de u n pour n = 10 (ligne en trait plein) et la densité de
l'oscillateur classique d'énergie totale 21
2 hω c (courbe en tirets). L'accord est relativement bon en
2
moyenne, le principal écart étant les oscillations rapides de u n .

La valeur moyenne de l'énergie potentielle vaut :



V n = ∫ u n∗ ( x ) Kx 2 u n ( x )dx
1
−∞ 2
(29)
1 2n + 1 1  1 1
= K =  n +  hω c = E n
2 2α 2
2 2 2
∫x
2 2
où u n dx peut être calculé avec l'aide de la fonction génératrice en analogie avec l'évaluation
de (28). Donc, pour toute valeur de n, les énergies potentielles et cinétiques moyennes sont chacune
la moitié de l'énergie totale, tout comme dans le cas de l'oscillateur classique.

D'une manière similaire, on peut montrer que x = p = 0 pour toute fonction d'onde de
l'oscillateur harmonique et donc (∆x ) = x 2 et (∆p ) = p 2 . Il est facile de voir que le produit
2 2

des incertitudes est


 1
(30) ∆x ⋅ ∆p =  n + h
 2

Il a la valeur minimale possible 12 h pour la fonction d'onde de l'état de base


1
α2 1
− α 2 x2
(31) u0 ( x ) = 1
e 2

π4
qui, comme on s'y attendrait, a la forme d'un paquet minimal. Donc le paquet minimal est une
fonction propre de l'équation de Schrödinger de l'oscillateur harmonique si son ∆x est relié de
manière appropriée à K et m.

Paquet d'ondes oscillant


La solution générale de l'équation de Schrödinger dépendant du temps pour l'oscillateur
harmonique
∂  h2 ∂2 1 2 
(32) ih ψ ( x, t ) =  − + Kx ψ ( x, t )
∂t  2m ∂x
2
2 
peut être développée en terme des fonctions d'onde stationnaires
∞ − iω c t ∞
1
(33) ψ ( x, t ) = ∑ Anun ( x )e − iEn t / h
=e 2
∑ A u (x )e
n n
− inω c t

n=0 n =0
1
− ω ct
où les An sont des constantes arbitraires. Donc, en dehors du facteur de phase e 2
, ψ ( x, t ) est
une fonction périodique de t avec la période de l'oscillateur classique 2π / ω c . Cela suggère qu'il est
peut-être possible de trouver une solution sous la forme d'un paquet d'ondes dont le centre de
gravité oscille avec la période du mouvement classique.

Pour étudier cette possibilité, nous supposons qu'à t = 0, le ψ de (33) a la forme d'un paquet d'onde
normalisé (31) excepté que le centre de gravité est déplacé dans la direction des x positifs d'une
quantité a.
1

α2
1
− α 2 ( x − a )2
(34) ψ ( x,0 ) = ∑ An u n ( x ) = 1
e 2

n =0
π 4

Nous pouvons utiliser l'orthonormalité des u n pour calculer un coefficient particulier Am en


multipliant (34) par u m∗ ( x ) et en intégrant sur x.
∞ N m∗ ∞
1
− ξ2 −
1
(ξ −ξ 0 )2
(35) Am = ∫ um∗ ( x )ψ ( x,0)dx = 1 1 ∫ H m (ξ )e 2
e 2
dξ ξ 0 ≡ αa
−∞ −∞
π α2 2

L'intégrale sur le coté droit peut être évaluée avec l'aide des fonctions génératrices en égalant terme
à terme les deux expressions en séries pour l'intégrale :
 1  ∞  1 
∞ −  ξ 2 −ξξ 0 + ξ 02  sn ∞ − ξ 2
−ξξ 0 + ξ 02 
(36) ∫ e − s 2 + 2 sξ
e  2 
dξ = ∑ ∫ H n (ξ )e  2 

−∞ −∞
n = 0 n!
et
1 1
− ξ 02 + sξ 0
1
− ξ 02 ∞
1
(sξ 0 )n
(37) π 2 e 4
= π 2e 4

n=0 n!

En utilisant (24), on obtient


1
− ξ 02
ξ e
n 4
(38) An = 0

(2 n!)
1
n 2

La substitution de ces An dans (33) donne


1
α2 H n (ξ )  1 −iω ct 
n
− ξ 2 − ξ 02 − iω c t ∞
1 1 1
ψ ( x, t ) = 1
e 2 4 2
∑  ξ 0e 
n =0 n!  2 
π 4

1
α 2
 1 1 1 1 
(39) = 1
exp − ξ 2 − ξ 02 − iω c t − ξ 02e − 2iωct + ξξ 0e −iωct 
 2 4 2 4 
π 4

1
α2  1 1 
exp − (ξ − ξ 0 cos ω c t ) − i ω c t + ξξ 0 sin ω c t − ξ 02 sin 2ω c t 
1
=
2
1
 2 2 4 
π 4

où la somme est évaluée avec l'aide de la fonction génératrice. Le carré de la grandeur de cette
fonction d'onde donne une densité de probabilité de position
α
(40) ψ ( x, t ) = e −α ( x − a cos ω c t )2
2 2

1
π2

Cela montre que ψ représente un paquet d'ondes qui oscille sans changer de forme autour de x = 0
avec l'amplitude a et la fréquence classique.

1
− ω ct
Lorsque a → 0 , ψ tend vers la fonction propre d'énergie la plus basse u0 ( x )e 2 . Plus a devient
grand, plus le nombre d'états stationnaires qui contribuent de manière significative au paquet
augmente et plus le nombre n0 pour lequel An de (389) présente un maximum augmente. Pour n
>> 1, nous pouvons utiliser la formule de Stirling pour maximiser ln An . En négligeant les termes
d'ordre ln n et inférieurs
  1
ln An ≈ n ln ξ 0 − ln 2  − n(ln n − 1)
1
 2  2
(41) 2
1 Ka
n0 ≈ ξ 02 =
2 2hω c

 1
Donc le niveau d'énergie E n0 =  n0 + hω c dont l'essentiel du voisinage contribue à ψ est
 2
approximativement égal à l'énergie 2 Ka 2 de l'oscillateur classique qui a la même amplitude.
1
IV.2. Potentiels à symétrie sphérique à trois dimensions
Il est généralement impossible d'obtenir des solutions analytiques à l'équation de Schrödinger à
trois dimensions à moins qu'elle puisse être séparée en équations différentielles pour chacune des
trois coordonnées spatiales. On a pu montrer qu'il y a onze systèmes de coordonnées dans lesquels
l'équation de Schrödinger pour la particule libre (avec V = 0) peut être séparée. Un des plus
importants est le système de coordonnées sphériques en fonction duquel les coordonnées
rectangulaires sont données par
x = r sin θ cos φ
(1) y = r sin θ sin φ
z = r cosθ

Si l'énergie potentielle est à symétrie sphérique, tel que V (r ) = V (r ) est seulement fonction de la
grandeur r de r mesurée à partir d'une certaine origine, l'équation de Schrödinger peut toujours être
séparée en coordonnées sphériques. Plusieurs problèmes physiquement intéressant peuvent être
représentés exactement ou approximativement en fonction de potentiels à symétrie sphérique de
différentes formes. Dans cette section, nous allons effectuer la séparation et résoudre les équations
différentielles en θ et φ . Nous traiterons de la solution radiale pour des formes particulière de
V (r ) dans la section suivante ainsi que lorsque nous résoudrons le cas de l'atome d'hydrogène.

Séparation de l'équation de Schrödinger


L'équation de Schrödinger avec une énergie potentielle à symétrie sphérique peut être écrite en
coordonnées sphériques :
h2  1 ∂  2 ∂  ∂  ∂  ∂2 
u + V (r )u = Eu
1 1
(2) −   r  +  sin θ  +
2m  r 2 ∂r  ∂r  r 2 sin θ ∂θ  ∂θ  r 2 sin 2 θ ∂φ 2 

Nous séparons d'abord les parties radiales et les parties angulaires en substituant
(3) u (r ,θ , φ ) = R(r )Y (θ , φ )
dans (2) et en divisant par u
1 d  2 dR  2mr 2 1 1 ∂  ∂Y  1 ∂ 2Y 
(4) r  + 2 [E − V (r )] = −   sin θ + 
R dr  dr  h Y  sin θ ∂θ  ∂θ  sin 2 θ ∂φ 2 

Puisque le coté gauche de l'équation (4) dépend seulement de r et le coté droit dépend seulement de
θ et φ , les deux cotés doivent être égaux à une constante que nous appelons λ . Donc, (5) nous
donne une équation radiale
1 d  2 dR   2m λ
(5) 2 r  +  2 [E − V (r )] − 2  R = 0
r dr  dr   h r 
et une équation angulaire
1 ∂  ∂Y  1 ∂ 2Y
(6)  sin θ + + λY = 0
sin θ ∂θ  ∂θ  sin 2 θ ∂φ 2

L'équation angulaire (6) peut être encore séparée en substituant Y (θ , φ ) = Θ(θ )Φ(φ ) dedans et en
suivant la même procédure pour obtenir
d 2Φ
(7) + νΦ = 0
dφ 2
1 d  dΘ   ν 
(8)  sin θ  + λ − Θ = 0
sin θ dθ  dθ   sin 2 θ 

L'équation en φ (7) peut être résolue directement. Sa solution générale peut être écrite
1 1
iν φ − iν φ
(9) Φ(φ ) = Ae + Be ν ≠0
2 2

Φ(φ ) = A + Bφ ν =0

L'exigence que Φ(φ ) et dΦ (φ ) / dφ soient continus dans tout le domaine 0 à 2π de φ implique


que ν soit choisi égal au carré d'un entier. Nous remplaçons donc (9) par
(10) Φ(φ ) = (2π ) 2 e imφ
1

où maintenant toutes les solutions physiquement significatives sont inclues si m peut être un entier
positif, négatif ou nul. La constante multiplicative est choisie égale à (2π )
1

2 afin que Φ soit
normalisé à l'unité sur le domaine de φ .

Notons que la constante m ne doit pas être confondue avec la masse de la particule. Il y a un léger
risque de confusion que nous regrettons mais l'usage veut que le nombre quantique associé à la
composante φ soit noté m (qui est l'abréviation de "magnétique" pour des raisons qui apparaîtront
plus tard).

Polynômes de Legendre
A moins que V (r ) soit spécifié, le plus loin où nous pouvons aller dans notre traitement est de
résoudre l'équation θ (8) où maintenant ν = m 2 . Il est pratique de substituer w = cosθ à θ et de
poser
(11) Θ(θ ) = P(ω )
Alors (8) devient

(12)
d 
1 − w (
2 dP 
+


dw  
λ )

m2 
P = 0
dw  1 − w 2 

Puisque le domaine de θ est de 0 à π , le domaine de w est de 1 à -1. La procédure pour résoudre


l'équation (12) est en plusieurs points similaires à la solution de l'équation de Schrödinger de
l'oscillateur harmonique que nous avons présenté dans la section précédente et nous ne donnerons
donc pas tous les détails. Puisque (12) est une équation différentielle du second ordre, elle a deux
solutions linéairement indépendantes. Excepté pour des valeurs particulières de λ , les deux sont
infinies en w = ±1 et ne sont pas physiquement acceptables. Si, cependant, λ = l (l + 1) , où l est un
entier positif ou nul, une des solutions est finie en w = ±1 (l'autre ne l'est pas). Cette solution finie a
( )
1
m
la forme 1 − w 2 2 fois un polynôme d'ordre l − m en w et a la parité de l − m .

Les solutions physiquement acceptables de (12) quand m = 0 sont appelées polynômes de Legendre
Pl (w) . Tout comme dans le cas des polynômes de Hermite, leurs propriétés peuvent être discutées
en terme d'une fonction génératrice
( )
1
T (w, s ) = 1 − 2 sw + s 2

2

(13) ∞
= ∑ Pl (w)s l s <1
l =0

En différentiant la fonction génératrice par rapport à w et s, on trouve des relations analogues à


celles des polynômes de Hermite.

(14)
( )
1 − w 2 Pl′ = −lwPl + lPl −1
(l + 1)Pl +1 = (2l + 1)wPl − lPl −1
où l'apostrophe indique la dérivée par rapport à w. On vérifie facilement que l'équation
différentielle à l'ordre le plus bas impliquant seulement les Pl qui peuvent être construits à partir
des équations (14) est l'équation (12) avec λ = l (l + 1) et m = 0.
Pour m non nécessairement égal à zéro, (12) a des solutions physiquement acceptables si
λ = l (l + 1) et m ≤ l . Ces solutions, qui sont appelées fonctions de Legendre associées, peuvent
être exprimées en fonction des polynômes de Legendre :

( )
1 m
(15) Pl m (w) = 1 − w 2 2 Pl (w)
m d
m
dw

On peut le montrer en remplaçant (15) dans l'équation qui est obtenue en différentiant m fois
l'équation pour Pl (w) . La fonction génératrice pour les fonctions de Legendre associées est obtenue

( )
1
2 2m
en différentiant (13) m fois par rapport à w et en multipliant par 1 − w .

(2 m )!(1 − w ) s
1
2 2m m

Tm (w, s ) =
( m )!(1 − 2sw + s )
1
m 2 m+
(16) 2 2


= ∑ P (w)s
l= m
l
m l

Harmoniques sphériques
La partie angulaire Ylm (θ , φ ) de la fonction d'onde complète, qui est solution de (6) quand
λ = l (l + 1) , est appelée une harmonique sphérique. Il est évident que
(17) Ylm (θ , φ ) = N lm Pl m (cosθ )Φ m (φ )
où c est donné par (10) et N lm est la constante de normalisation pour la fonction de Legendre
associée.

La même démonstration que fut donnée pour l'orthogonalité des fonctions propres de l'énergie peut
être utilisée pour montrer que les solutions de (4) correspondant à différentes valeurs propres λ ou
l sont orthogonales. La valeur propre l est, cependant, (2l + 1) fois dégénérée puisqu'il existe des
solutions linéairement indépendantes Ylm (θ , φ ) pour cette valeur de l et toutes les valeurs entières
de m entre +l et -l. Le choix de (10) pour Ylm (θ , φ ) rend ces fonctions propres dégénérées
orthogonales. Il s'ensuit que l'intégrale
π 2π 2π
Ylm∗ (θ , φ )Yl ′m′ (θ , φ )sin θdθdφ = ∫
1
(18) ∫∫ ∫ Ylm∗ Yl ′m′ dwdθ
0 0 −1 0
s'annule sauf si l = l ′ et m = m′ . Il est intéressant de noter qu'il n'y a pas plus d'orthogonalité que
nécessaire pour que cette intégrale s'annule quand elle le doit. Donc, la partie φ de l'intégrale
s'annule quand m ≠ m′ quelle que soit la valeur de l. La partie θ ou w de l'intégrale s'annule
seulement quand l ≠ l ′ et m = m′ puisque pour m ≠ m′ , l'orthogonalité est prise en compte par
l'intégration sur φ .

L'intégrale
Pl m (w)Pl ′m (w)dw
1
(19) ∫
−1
peut être évaluée de plusieurs manières, par exemple, en utilisant la fonction génératrice (16) d'une
manière similaire à celle décrite dans la section précédente. Comme attendu, l'intégrale (19)
s'annule sauf si l = l ′ . Elle a alors la valeur [2 / (2l + 1)][(l + m )! / (l − m )!] . Donc, N lm est l'inverse de
la racine carrée de cette quantité, excepté pour un facteur de phase complexe arbitraire de grandeur
unité. Pour des raisons pratiques, nous choisissons l'harmonique sphérique comme
 2l + 1 (l − m )! 2 m
1

(20) Ylm (θ , φ ) = ε   Pl (cosθ )e


imφ

 4 π (l + m )!
où ε = (− 1) pour m > 0 et ε = 1 pour m ≤ 0 . Les premières harmoniques sphériques sont
m
1
1  3 2
Y0, 0 = Y1,0 =   cosθ
(4π )  4π 
1
2

1 1

(21) Y1, ±1
 3 2
= m   sin θ e ± iφ Y2, 0
 5 2
= (
 3 cos θ − 1
2
)
 8π   16π 
1 1
 15  2  15  2
Y2, ±1 = m   sin θ cosθ e ± iφ Y2, ±2 =  sin θ e
2 ± 2 iφ

 8π   32π 

Parité
Le concept de parité peut maintenant être étendu aux problèmes à trois dimensions du type discuté
dans cette section. Supposons que la coordonnée position r est renversée par rapport à l'origine tel
que r est remplacé par -r. Cela correspond à remplacer x par -x, y par -y et z par -z ou à remplacer
θ par π − θ , φ par φ + π et à laisser r inchangé. Il est clair que le seul changement dans l'équation
de Schrödinger est que u (t ,θ , φ ) est remplacé par u (r , π − θ , φ + π ) , le reste de l'équation étant
inaffecté. Alors la discussion que nous avons eut sur la parité montre que des combinaisons
linéaires des fonctions propres dégénérées peuvent être trouvées qui ont des parités définies et
qu'une fonction propre non dégénérée doit avoir une parité définie.

Les niveaux d'énergie pour un potentiel à symétrie sphérique sont dégénérés au moins par rapport
au nombre quantique m, pour l > 0. Dans ce cas, les fonctions propres dégénérées ont toutes la
même parité que nous allons montrer être la parité de l. Quand r est renversé par rapport à l'origine,
la partie radiale R(r ) de la solution est inchangée, la partie Φ(φ ) donnée par (10) a la parité de m

( )
1
et la partie Pl m (cosθ ) a la parité de l − m puisque Pl m (w) est égal à une partie paire 1 − w 2
m
2

fois un polynôme en w qui a la parité l − m par rapport au changement de signe de w ou de cosθ .


Donc, Ylm (θ , φ ) et donc u (r ) a la parité de l.
Moment angulaire
L'équation de Schrödinger radiale (5) peut être récrite sous une forme qui ressemble à l'équation de
Schrödinger à une dimension. Si nous posons R(r ) = χ (r ) / r , l'équation pour la fonction d'onde
radiale modifiée χ peut être écrite
h2 d 2χ  l (l + 1)h 2 
(22) − + V (r ) +  χ = Eχ
2m dr 2  2mr 2 

Donc, le mouvement radial est similaire au mouvement à une dimension d'une particule dans un
potentiel
l (l + 1)h 2
(23) V (r ) +
2mr 2

"L'énergie potentielle" supplémentaire peut être vue physiquement comme étant reliée au moment
angulaire de la manière suivante. Une particule classique qui a un moment angulaire L autour de
l'axe passant par l'origine et perpendiculaire au plan de son orbite a la vitesse angulaire ω = L / r 2
quand sa distance radiale à l'origine est r. Une force centripète
L2
(24) mω 2 r =
mr 3
est requise pour maintenir la particule sur son orbite. Cette force centripète est fournie par l'énergie
potentielle et donc ajoute au V (r ) qui apparaît dans le mouvement une "énergie potentielle
centrifuge" supplémentaire L2 / 2mr 2 . Elle a exactement la forme du terme supplémentaire dans
(23) si nous posons
(25) L = [l (l + 1)]2 h
1

L'argument physique précédent pour identifier le nombre quantique l avec le moment angulaire de
la particule peut être mis sous forme quantitative en trouvant les opérateurs qui correspondent aux
trois composantes du vecteur moment angulaire. Classiquement, nous avons L = r × p et donc, en
mécanique quantique, nous prenons
 ∂ ∂ 
L x = yp z − zp y = −ih y − z 
 ∂z ∂y 
 ∂ ∂
(26) L y = zp x − xp z = −ih z − x 
 ∂x ∂z 
 ∂ ∂
L z = xp y − yp x = −ih x − y 
 ∂y ∂x 

L'équation (26) peut être transformée en coordonnées sphériques pour donner


 ∂ ∂ 
L x = ih sin φ + cot θ cos φ 
 ∂θ ∂φ 
 ∂ ∂ 
(27) L y = ih − cos φ + cot θ sin φ 
 ∂θ ∂φ 

L z = −i h
∂φ

L'opérateur qui représente le carré du moment angulaire total est alors obtenu à partir de (27)
comme
L2 = L2x + L2y + L2z
(28)  1 ∂  ∂  1 ∂2 
= −h 2   sin θ + 
 sin θ ∂θ  ∂θ  sin 2 θ ∂φ 2 

La comparaison de (28) et (6) montre que Ylm (θ , φ ) est une fonction propre de L2 avec la valeur
propre l (l + 1)h 2 :
(29) L2Ylm (θ , φ ) = l (l + 1)h 2Ylm (θ , φ )
De manière similaire, il suit de la structure de (10) et de la dernière relation (27) que Φ m (φ ) et
donc aussi Ylm (θ , φ ) sont fonction propre de L z avec la valeur propre mh :
(30) L z Ylm (θ , φ ) = mhYlm (θ , φ )

Donc, la séparation de l'équation de Schrödinger en coordonnées sphériques conduit à des fonctions


d'onde qui sont fonctions propres à la fois du moment angulaire total et de la composante du
moment angulaire le long de l'axe polaire. Le nombre quantique l qui apparaît est appelé nombre
quantique azimutal ou de moment angulaire total. Le nombre quantique m qui apparaît dans (30)
est appelé, comme nous l'avions déjà signalé, nombre quantique magnétique à cause de son
importance dans la théorie de l'effet Zeeman lequel implique la composante du moment angulaire le
long du champ magnétique (axe z). On notera qu'en général l'équation de Schrödinger ne peut pas
être séparée de cette manière et les fonctions propres du moment angulaire obtenues si l'énergie
potentielle V (r ) n'est pas à symétrie sphérique. Cela correspond au résultat classique que le
moment angulaire est une constante du mouvement seulement pour un champ de force central (qui
peut être décrit par un potentiel à symétrie sphérique). Il y a, cependant, la différence
caractéristique entre la théorie classique et quantique que les trois composantes de L peuvent être
spécifiées avec précision simultanément en la théorie classique tandis que seuls L z et L2 peuvent,
en général, être spécifiés avec précision simultanément en théorie quantique puisque Ylm (θ , φ ) n'est
pas une fonction propre de L x et L y (excepté pour le cas l = 0). Le choix de la direction de l'axe
polaire qui distingue L z de L x et L y est, bien sûr, totalement arbitraire. On peut construire des
fonctions d'onde qui sont fonctions propres de, par exemple, L x et L2 mais pas de L z et L y . Il
suffit pour cela de choisir un autre axe polaire pour construire les harmoniques sphériques.
IV.3. Puits de potentiel carré à trois dimensions
Nous sommes maintenant en position de trouver les niveaux d'énergie d'un état lié qui correspond à
des choix particuliers de l'énergie potentielle V (r ) et du nombre quantique de moment angulaire l
en résolvant l'équation de Schrödinger radiale.

Comme exemple, considérons le puits de potentiel de profondeur finie pour lequel V (r ) = −V0 , r <
a, V (r ) = 0 , r > a, où V0 est positif. Une région sphérique de ce type dans laquelle le potentiel est
inférieur à l'environnement sert à attirer une particule tout comme dans le cas à une dimension que
nous avons vu.

Moment angulaire zéro


Quand l = 0, il est plus facile de résoudre l'équation de Schrödinger sous la forme modifiée avec
R(r ) = χ (r ) / r . L'équation est
h2 d 2χ
− − V0 χ = Eχ r<a
2m dr 2
(1)
h2 d 2χ
− = Eχ r>a
2m dr 2

La solution de l'équation (1) est la même que celle obtenue pour l'échelon de potentiel fini excepté
sur trois points. Tout d'abord, l'échelle d'énergie est abaissée partout dans ce problème de la
quantité V0 . Deuxièmement, le domaine de r est 0 à + ∞ au lieu du domaine − ∞ à + ∞ . Et
troisièmement, la condition aux limites que la fonction d'onde ne devienne pas infinie en x = −∞
est maintenant remplacée par la même condition en r = 0.

A partir des résultats déjà trouvés, on voit que les solutions de (1) sont
 2m(V0 − E ) 2
1

χ (r ) = A sin αr + B cos αr α =   r<a


 h2 
(2) 1
 2m E  2
χ (r ) = Ce − β r β =  2  r>a
 h 
où nous sommes intéressés par les niveaux d'énergie pour les états liés pour lesquels E < 0.
L'exigence que R(r ) soit fini en r = 0 implique que nous posions B = 0 dans la première équation
de (2). Donc, la solution a la forme de la solution a parité impaire du problème a une dimension.
Les niveaux d'énergie sont obtenus en égalisant les deux valeurs de (1 / χ )(dχ / dr ) en r = a (ce qui
est équivalent à rendre (1 / R )(dR / dr ) continu en ce point) et sont données en résolvant
(3) α cot αa = − β
qui est le même que la relation obtenue à une dimension. On en déduit qu'il n'y a pas de niveau
d'énergie sauf si V0 a 2 > π 2 h 2 / 8m , qu'il y a un état lié si π 2 h 2 / 8m < V0 a 2 < 9π 2 h 2 / 8m , etc.
Solutions intérieures pour l arbitraire
Pour des valeurs non nulles de l, il est plus pratique de travailler avec l'équation radiale originale
qu'avec l'équation pour χ . Si nous posons ρ = αr où α est défini comme dans (2), l'équation de
Schrödinger pour r < a devient
d 2 R 2 dR  l (l + 1) 
(4) + + 1 − R = 0
dρ 2 ρ dρ  ρ2 

La forte ressemblance entre (4) et l'équation de Bessel suggère que R(r ) puisse être exprimé en
terme des fonctions de Bessel. C'est en fait le cas. Si nous définissons la "fonction de Bessel
sphérique" jl ( ρ ) qui est régulière en ρ = 0 par
1
π 
(5) jl ( ρ ) =   J 1 ( ρ )
2

 2 ρ  l+ 2
où J est une fonction de Bessel ordinaire d'ordre demi entier, on vérifie facilement que jl ( ρ )
satisfait (4). De même, la "fonction de Neumann sphérique" est
1

l +1  π 
(6) nl ( ρ ) = (− 1)   J 1 ( ρ )
2

 2 ρ  −l − 2

On peut montrer que J


l+
1 (ρ ) , où l est un entier positif, négatif ou zéro, peut s'exprimer comme une
2
1
somme de produits de sin ρ et cos ρ avec des polynômes d'ordre impair en ρ 2 . En particulier, des
expressions explicites pour les trois premières fonctions j et n sont
sin ρ cos ρ
j0 (ρ ) = n0 ( ρ ) = −
ρ ρ
sin ρ cos ρ cos ρ sin ρ
(7) j1 ( ρ ) = − n1 (ρ ) = − −
ρ 2
ρ ρ 2
ρ
 3 1  3 1
j 2 ( ρ ) =  2 −  sin ρ − 2 cos ρ n 2 ( ρ ) = − 2 −  cos ρ − 2 sin ρ
3 3
ρ ρ ρ ρ ρ ρ

Les termes dominant pour ρ petit sont

jl ( ρ ) →
ρl
nl ( ρ ) → −
(2l − 1)!!
(8) ρ →0 (2l + 1)!! ρ →0 ρ l +1
(2l + 1)!!≡ 1 ⋅ 3 ⋅ 5L (2l + 1)

Ces équations sont des approximations utiles pour ρ 2 un peu plus petit que 4l+6 et 2
respectivement.

Et les termes dans le développement asymptotique sont


 
jl ( ρ ) → cos  ρ − (l + 1)π 
1 1
ρ →∞ ρ
 2 
(9)
 
nl ( ρ ) → sin  ρ − (l + 1)π 
1 1
ρ →∞ ρ  2 

Ces équations sont des approximations utiles pour ρ un peu plus grand que 12 l (l + 1) . Cependant
les grandeurs (mais pas les phases) de jl et nl sont données à une bonne approximation par (9) si
ρ est un peu plus grand que l, ce qui est approximativement la valeur de ρ pour laquelle la
grandeur de jl est la plus grande.

Quelques propriétés des j et des n sont


∫ j (ρ )ρ
2
0
2
dρ =
2
[
ρ j 0 ( ρ ) + n0 ( ρ ) j1 ( ρ )
1 3 2
]
2 2 1 3 2
[
∫ n0 (ρ )ρ dρ = 2 ρ n0 (ρ ) − j0 (ρ )n1 (ρ ) ]
(10)
nl −1 ( ρ ) jl ( ρ ) − nl (ρ ) jl −1 ( ρ ) = 2
1
l>0
ρ

jl ( ρ ) nl ( ρ ) − nl ( ρ ) jl ( ρ ) = 2
d d 1
dρ dρ ρ

Les propriétés suivantes sont valables à la fois pour les j et les n :


2l + 1
jl −1 ( ρ ) + jl +1 ( ρ ) = jl ( ρ ) l>0
ρ
d
jl ( ρ ) =
1
[ljl −1 (ρ ) − (l + 1) jl +1 (ρ )]
dρ 2l + 1
l +1
= jl −1 ( ρ ) − jl (ρ )
ρ
d
[
(11) dρ ρ j l ρ = ρ jl −1 ρ
l +1
]
( ) l +1 ( ) l >0

d

[ ]
ρ −l j l ( ρ ) = − ρ −l jl +1 ( ρ )

∫ j (ρ )dρ = − j (ρ )
1 0

∫ j (ρ )ρ dρ = ρ j (ρ )
2 2
0 1

∫ j (ρ )ρ
l
2 2
dρ =
2
[
ρ jl ( ρ ) − jl −1 ( ρ ) j l +1 ( ρ )
1 3 2
] l>0

Puisque R(r ) doit être fini pour r = 0, la solution désirée pour r < a est
(12) R(r ) = Ajl (αr )

Solutions extérieures pour l arbitraire


L'équation de Schrödinger pour r > a peut être mise sous la forme (4) si nous redéfinissons ρ
comme iβr , où β est donné dans (2). Puisque le domaine de ρ ne s'étend maintenant pas à zéro,
il n'y a pas de raison pour que nl ne puisse pas apparaître dans la solution. La combinaison linéaire
de jl et nl à sélectionner sera déterminée par la forme asymptotique qui doit diminuer
exponentiellement pour r grand. Cela suggère que nous définissions les fonctions de Hankel
sphériques
hl(1) = jl ( ρ ) + inl ( ρ )
(13) (2 )
hl = jl ( ρ ) − inl ( ρ )
qui, à l'aide de (9), ont les formes asymptotiques
 1 
1 i  ρ − (l +1)π 
(1)
hl → e  2 
ρ →∞ ρ
(14)
 1 
1 −i  ρ − (l +1)π 
(2 )
hl → e  2 
ρ →∞ ρ

On peut montrer que le développement asymptotique, dont (14) donne le terme dominant, ne
contient pas de terme pour lequel l'exposant a le signe opposé à celui donné.

La solution désirée pour r > a est alors


(15) R(r ) = Bhl(1) (iβr ) = B[ j l (iβr ) + inl (iβr )]

Les trois premières fonctions sont


h0(1) (iβr ) = −
1 − βr
e
βr
 1 1 
(16) h1(1) (iβr ) = i + 2 2 e − βr
 βr β r 
 1 3 
h2(1) (iβr ) = 
3
+ 2 2 + 3 3 e − βr
 βr β r β r 

Niveaux d'énergie
Les niveaux d'énergie sont obtenus en exigeant que (1 / R )(dR / dr ) soit continu en r = a. Quand
cette condition est appliquée à la solution intérieure (12) et la solution extérieure (15) avec l = 0,
nous obtenons l'équation (3). On peut l'écrire comme
2mV0 a 2
(17) ξ cot ξ = −η ξ 2 +η2 =
h2
où nous avons posé ξ = αa et η = βa . La même condition appliquée aux solutions l = 1 se réduit,
avec l'aide de (7) et (16), à
cot ξ 1 1 1 2mV0 a 2
(18) − 2 = + 2 ξ 2 +η2 =
ξ ξ η η h2

Les équations (18) peuvent être résolues numériquement ou graphiquement comme nous l'avions
déjà vu dans le cas des équations (17). En général, il n'y a pas de dégénérescence entrer les valeurs
obtenues pour la solution des équations comme (17) et (18) pour différentes valeurs de l.

Il est facile de voir combien on a de niveaux d'énergie (17) pour différentes valeurs de V0 a 2 sans
plonger dans le travail numérique. Un nouveau niveau apparaît quand η est zéro ou cot ξ est
infini. Cela se produit en ξ = π ,2π , K . Donc, il n'y a pas de niveau d'énergie avec l = 1 quand
π 2h 2
(19) V0 a 2 ≤
2m
Il y a un état lié avec l = 1 si π 2 h 2 / 2m < V0 a 2 ≤ 2π 2 h 2 / m , etc.

La plus petite valeur de V0 a 2 pour laquelle il existe un état lié avec l = 1 est plus grande que la
valeur correspondante de V0 a 2 pour l = 0. C'est raisonnable d'un point de vue physique.
L'interprétation du terme l dans l'équation de Schrödinger radiale comme une énergie potentielle
supplémentaire qui correspond à une "force centrifuge" répulsive suggère qu'une particule
possédant un moment angulaire nécessite un potentiel attractif plus fort pour la lier qu'une particule
sans moment angulaire. En effet, il s'avère que la "force" minimale du puits de potentiel carré V0 a 2
nécessaire pour lier une particule de nombre quantique de moment orbital l croît de manière
monotone avec l croissant.

On peut montrer que les états liés apparaissent avec une énergie zéro pour une valeur particulière l
quand [(1 / R )(dR / dr )]r = a = −(l + 1) / a . Pour l > 0, c'est équivalent à la condition jl −1 (ξ ) = 0 où

( )
1
maintenant ξ = 2mV0 a 2 / h 2 2 .
Exercices
1. La règle de quantification de Bohr peut s'exprimer sous une forme beaucoup plus générale. Elle
dit que l'intégrale de l'impulsion par rapport à la coordonnée sur un cycle est égal à un nombre
entier fois la constante de Planck.

Appliquez cette règle au cas de l'atome d'hydrogène à titre de vérification puis appliquez cette
règle à l'oscillateur harmonique linéaire et comparez aux résultats obtenus dans la section IV.1.
2. Quelle est l'ordre de grandeur de la dispersion des nombres quantiques et des énergies des états
qui contribuent de manière significative à la solution du paquet d'onde oscillant pour
l'oscillateur harmonique ?
3. Utilisez la fonction génératrice des polynômes de Hermite pour évaluer

∫ u n∗ ( x )x 2 u m ( x )dx
−∞
où les fonctions u sont les fonctions d'onde normalisées de l'oscillateur harmonique.
4. Utilisez la fonction génératrice des polynômes de Legendre pour évaluer

∫ P (w)P (w)dw
1
l l′
−1
5. Obtenez une expression analytique approchée pour le niveau d'énergie dans un puits de
potentiel carré (l = 0) quand V0 a 2 est nettement plus grand que π 2 h 2 / 8m .
6. Montrez que pour un puits de potentiel carré, les valeurs limites de V0 a 2 qui correspondent à de
nouveaux niveaux d'énergie avec une valeur de l plus grande que zéro sont données par
h 2 z 2 / 2m , où les nombres z sont les solutions non nulles de l'équation jl −1 ( z ) = 0 .
7. Supposez que l'interaction entre le neutron et le proton qui constituent un deutéron puisse être
représentée par un puits de potentiel carré avec a = 2.00 × 10 −13 cm . Si le niveau d'énergie le
plus bas (l = 0) du système est -2.23 MeV, calculez V0 en MeV pour les trois figures
significatives. Comparez cette réponse avec celle obtenue à partir de la formule approximative
dérivée dans le problème 5.
8. Considérez l'équation (22) de la section de la section IV.2 avec l = 0 et V (r ) = −V0 e − r / a . Faites
un changement de variable de r à z = e − r / 2 a et montrez que le résultat est l'équation de Bessel.
Quelles conditions aux limites doivent être imposées sur χ comme fonction de z et comment
l'utiliser pour déterminer les niveaux d'énergie ? Quelle est la limite inférieure de V0 pour
laquelle un état lié existe ?
9. Trouvez les expressions pour les fonctions propres et les niveaux d'énergie d'une particule dans
une boîte circulaire à deux dimensions qui a des murs parfaitement rigides.
10. On a montré dans la section III.1 qu'un puits de potentiel carré a une dimension a des états liés
pour toute valeur positive de V0 a 2 et dans la section IV.3 qu'un puits de potentiel carré à trois
dimensions à symétrie sphérique a un état lié seulement pour V0 a 2 > π 2 h 2 / 8m . Quelle est la
situation analogue pour un puits de potentiel carré à deux dimensions à symétrie circulaire ?
Quelle est la signification physique de ces résultats ?
11. L'équation de Schrödinger pour un corps rigide qui est contraint à tourner autour d'un axe fixe
et qui a un moment d'inertie I par rapport à cet axe est
∂ψ h 2 ∂ 2ψ
ih =−
∂t 2 I ∂φ 2
où ψ (φ , t ) est une fonction du temps t et de l'angle φ de rotation autour de l'axe. Quelles
conditions aux limites doivent être appliquées aux solutions de cette équation ? Trouvez les
fonctions propres normalisées et les valeurs propres de l'énergie. Y a-t-il dégénérescence ?
12. Trouvez les niveaux d'énergie de l'oscillateur harmonique isotrope à trois dimensions
( V (r ) = 12 Kr 2 ) en résolvant l'équation de Schrödinger en coordonnées cartésiennes. Quelle est
la dégénérescence de chaque niveau ? Montrez que cette équation peut aussi être séparée en
coordonnées sphériques et cylindriques.
V. Théorie des collisions
Les problèmes pour lesquels les valeurs propres de l'énergie sont distribuées de manière continue
apparaissent habituellement en relation avec les collisions d'une particule avec un champ de force.
La méthode d'approche est différente de celle employée pour les états liés. Dans ce denier cas, les
conditions aux limites à grande distance étaient utilisées pour déterminer les niveaux d'énergie
discrets de la particule. Dans un problème de collision, l'énergie est spécifiée à l'avance et le
comportement de la fonction d'onde à grande distance en est déduit. Ce comportement
asymptotique peut alors être relié à des quantités de diffusion de la particule par le champ de force.

Le nombre relativement faible de solutions exactes qui sont obtenues ici sont d'un usage plus large
qu'il pourrait sembler au premier abord puisqu'elles peuvent servir de fondations à des calculs
approchés pour des systèmes plus compliqués. Il est intéressant de noter que l'étude des collisions
est particulièrement important en relation avec le noyau atomique et les particules élémentaires où
très peu d'information peut être obtenue par d'autres moyens.
V.1. Barrière de potentiel carrée à une dimension

Nous considérons d'abord la collision à une dimension d'une particule avec la barrière de potentiel
carrée V ( x ) montrée ci-dessus. Dans ce problème, nous sommes intéressés par une particule qui
approche de la région avec x négatif et qui est réfléchie ou transmise par la barrière. Dans le
problème classique correspondant, la particule est toujours réfléchie si son énergie est inférieure à
celle du sommet de la barrière et est toujours transmise si son énergie est plus grande. Nous verrons
que, dans le problème quantique, la réflexion et la transmission se produisent tous les deux avec
une probabilité finie pour la plus part des énergies de la particule. A cause du manque de symétrie
entre x positif et négatif qui est introduit dès le départ, il est désavantageux de travailler avec des
solutions qui ont des parités définies et ainsi il n'y a aucune raison pour rendre V ( x ) symétrique par
rapport à x = 0. Nous supposons donc que V ( x ) = 0 pour x < 0 et x > a et V ( x ) = V0 pour 0 < x < a,
où V0 est positif.

Comportement asymptotique
Nous sommes intéressés par représenter une particule qui approche de la gauche avec une énergie E
> 0 et qui peut être renvoyée par la barrière ou y pénétrer. Donc, le comportement asymptotique
(dans les régions où V ( x ) = 0 ) est le suivant : pour x < 0, nous désirons que la fonction d'onde
représente une particule se déplaçant vers le gauche (particule réfléchie) aussi bien que vers la
droite (particule incidente). Pour x > a, nous désirons que la fonction d'onde représente seulement
une particule se déplaçant vers la droite (particule transmise).

Une particule dans une région sans potentiel qui se déplace dans une direction définie avec une
énergie définie a une impulsion définie et donc peut être représentée par une fonction propre de
l'impulsion à une dimension u ( x )e ipx / h si la particule se déplace dans la direction des x positifs avec
l'impulsion p et u ( x ) ∝ e − ipx / h si la particule se déplace dans la direction des x négatifs avec la
même énergie. Donc, puisque l'équation de Schrödinger dans la région où V ( x ) = 0 est
h 2 d 2u
(1) − = Eu
2m dx 2
nos solutions asymptotiques sont
u ( x ) = Ae ikx + Be − ikx x≤0
(2)
u ( x ) = Ce ikx x≥a

où k = p / h = + (2mE / h 2 )2 est la grandeur du nombre d'ondes. Les solutions (2) sont appropriées
1

pour les régions sans potentiel qui sont externes au potentiel diffuseur qu'il ait ou pas la forme
simple montrée plus haut.

Normalisation
La signification physique des coefficients A, B et C peut être inférée en substituant (2) dans la
forme à une dimension de la densité de courant de probabilité.

(3)
(
S (x ) = v A − B
2 2
) x<0
S (x ) = v C
2
x>a
où v = hk / m est la vitesse de la particule avec le nombre d'odes k. Puisque ces expressions sont
indépendantes de x, elles peuvent être interprétées comme le flux net (positif vers la droite) dans les
deux régions. Cette interprétation est consistante avec l'affirmation ci-dessus que A, B et C sont les
amplitudes des fonctions d'onde incidentes, réfléchies et transmises, respectivement.
La normalisation absolue des fonctions d'ondes (2) est peu important pour ce problème car nous
2 2 2
sommes seulement intéressés par les rapports B et C à A qui sont, respectivement, les
coefficients de réflexion et de transmission de la barrière. Il est quelque fois utile, cependant, de
1
normaliser la fonction d'onde incidente à un flux unité. Cela correspond à prendre A = 1 / v . Une
2

telle normalisation ne doit pas être interprétée comme indiquant que u ( x ) représente plus d'une
particule. Cela signifie plutôt que nous choisissons un nombre assez grand de systèmes (chacun
décrit par u ( x ) ) qui sont identiques et indépendant de manière telle que le flux incident total pour
tous est l'unité. Une normalisation plus précise mais quelque fois moins pratique supposerait une
"boîte" à une dimension de longueur L avec des conditions aux limites périodiques et en exigeant
que
∫( ) u (x ) dx = 1
2
(4)
L

Coefficients de diffusion
Le caractère de la solution à l'intérieur de la barrière de potentiel dépend du fait que E est plus
grand ou plus petit que V0 . Supposons d'abord que E > V0 , de manière à ce que nous puissions

[ ]
1
définir un nombre d'onde à l'intérieur de la barrière : α = 2m(E − V0 ) / h 2 2 . Alors la solution à
l'intérieur est
(5) u ( x ) = Fe iαx + Ge − iαx 0≤ x≤a

La continuité de u et du / dx en x = 0 et x = a nécessité par les conditions aux limites fourni quatre


relations entre les cinq coefficients. Nous pouvons éliminer F et G et résoudre pour les rapports
B/A et C/A.
B
=
(
k 2 − α 2 1 − e 2iαa)( )
A (k + α )2 − (k − α )2 e 2iαa
(6)
C 4kαe i (α −k )a
=
A (k + α )2 − (k − α )2 e 2iαa
Le carré absolu des rapports (6) sont les coefficients de diffusion (réflexion et transmission)
−1
 4 E ( E − V0 ) 
−1
B
2
 4k 2α 2 
= 1 +  = 1 + 2 
A  ( 2
)
k 2 − α 2 sin 2 αa   V0 sin αa 
2

(7)
 (k )
−1 −1
− α 2 sin 2 αa   V 2 sin 2 αa 
2 2 2
C
= 1 +  = 1 + 0 
A  4k 2α 2   4 E (E − V0 ) 

2 2
On vérifie facilement à partir de (7) que B / A + C / A = 1 comme on s'y attendait.

Les équations (7) montrent que le coefficient de transmission tend vers


−1
 mV0 a 2 
(8) 1 + 2

 2h 
lorsque l'énergie de la particule approche l'énergie du sommet de la barrière ( E → V0 ). Pour E
croissant ( E > V0 ), le coefficient de transmission oscille entre une enveloppe croissante et l'unité
(voir ci-dessus). Il y a une transmission parfaite lorsque αa = π ,2π , K , c'est-à-dire quand la
barrière contient un nombre entier de demi longueurs d'onde. Ce effet se produit aussi lorsque
V0 < 0 auquel cas la barrière carrée devient un puits carré. Les coefficients de transmission sont
donnés par (7) si le signe de V0 est changé ainsi que dans l'expression de α . Des phénomènes
d'interférence de ce type sont bien connus dans la transmission de la lumière à travers de fines
lames transparentes.

Les coefficients de réflexion et de transmission pour 0 < E < V0 sont plus facilement obtenus en
remplaçant α par iβ dans (6) où
1
 2m(V0 − E )  2
(9) β =  
 h2 

Le résultat pour le coefficient de transmission est


−1
 V02 sinh 2 βa 
2
C
(10) = 1 + 
A  4 E (V0 − E ) 
qui décroît de manière monotone de la valeur (8) lorsque E décroît sous V0 . Ce comportement est
souvent appelé effet tunnel à travers la barrière. Quand βa >> 1 , le coefficient de transmission (10)
devient très petit et est donné approximativement par
16 E (V0 − E ) − 2 βα
(11) e
V02
La figure ci-dessus est un tracé du coefficient de transmission calculé avec (7) et (10) pour une
barrière plutôt "opaque" : mV0 a 2 / h 2 = 8 .

Diffusion d'un paquet d'ondes


Le traitement précédent de la diffusion utilise des solutions stationnaires de l'équation de
Schrödinger indépendante du temps qui correspondent à des valeurs particulières de l'impulsion
incidente. Il est aussi possible de travailler avec l'équation dépendant du temps bien que cela soit
plus difficile puisque même dans le cas à une dimension nous devons travailler avec une équation
aux dérivées partielles de deux variables indépendantes, x et t. Il y a, cependant, l'avantage que
nous pouvons alors étudier le mouvement d'un paquet d'ondes de la forme générale que nous avons
vue et voir de quelle manière il est réfléchi ou transmis par le potentiel.

Il y a deux manières d'approcher le problème. La solution peut être développée en fonctions propres
de l'énergie et la sommation effectuée explicitement. Bien que cela puisse être fait de manière
analytique dans le cas d'une particule libre, cela est généralement impossible quand un potentiel est
présent. L'autre approche consiste à effectuer une intégration numérique en choisissant des
intervalles de temps petits mais finis et d'approcher l'équation différentielle dans le temps par une
équation aux différences. Même dans le cas à une dimension, cela est réalisable seulement avec un
calculateur rapide et des techniques de calculs spéciales doivent être imaginées pour rendre le
problème abordable.

I.
II.
III.
IV.
Dans ces calculs, les unités sont choisies telles que h = 1 et m = 12 . L'unité de longueur peut encore
être choisie arbitrairement et est légèrement plus longue que l'abscisse totale montrée dans chaque
graphique. Alors le temps et l'inverse de l'énergie sont exprimés en termes d'une unité qui est le
carré de l'unité de longueur. Le paquet d'onde incident est de forme gaussienne avec ∆x = 0.035 et
p = 50π , 70.7π et 100π . Le potentiel a la largeur a = 0.064 et l'intensité V0 = ±(70.7π ) , ainsi
2

l'énergie moyenne du paquet d'ondes incident est 12 V0 , V0 et 2V0 . Les images successives sont
montrées dans la figure I lorsque l'énergie moyenne du paquet d'ondes est la moitié de la hauteur de
la barrière et dans la figure II quand l'énergie moyenne est égale à V0 . Les figures III et IV
montrent le cas attractif dans lesquels l'énergie moyenne est la moitié de la profondeur du puits et
égale à la profondeur du puits, respectivement. Dans tous les cas, ψ est tracé comme ordonnée et
2

x comme abscisse et la hauteur et la largeur du potentiel sont également tracés. Le nombre dans
chaque image indique le temps en unités arbitraires. La figure II est particulièrement intéressante
car elle montre comme la probabilité décroît lentement puis rebondi et passe à travers la barrière
quand l'énergie cinétique moyenne de la particule dans la barrière est zéro.
V.2. Collisions à trois dimensions
Ce qui nous intéresse particulièrement est la situation des collisions à trois dimensions où une
particule heurte un champ de force fixe ou lorsque deux particules se heurtent. Dans le cas du
mouvement relativiste de deux particules, lorsque les seules forces présentent dépendent seulement
de leurs mouvements relatifs, on peut séparer le problème en deux problèmes à une seule particule.
L'un décrit le mouvement des particules relativement l'une à l'autre ou par rapport au centre de
masse et l'autre décrit le mouvement libre du centre de masse. Ce résultat valide en mécanique
classique s'étend à la mécanique quantique (cela peut paraître évident pour des raisons de lois de
conservation de l'impulsion, mais nous allons le vérifier ci-dessous). Bien que le centre de masse
puisse être pris au repos dans le calcul des niveaux d'énergie des mouvements internes, il a un
mouvement définit dans une collision qui ne peut pas être ignoré dans le calcul des résultats d'une
telle expérience. La raison en est que la procédure habituelle en laboratoire consiste à bombarder
une particule qui est initialement au repos avec une autre particule qui porte l'énergie totale
E 0 = E + E ′ . Donc, l'énergie E du mouvement relatif des deux particules est différent de l'énergie
de bombardement E 0 et la diffusion observée dépend du fait que la particule est initialement au
repos ou du fait que le centre de masse est initialement au repos.

Nous appelons le système de coordonnées dans lequel la particule bombardée est initialement au
repos le système de coordonnées du laboratoire et le système de coordonnées dans lequel le centre
de masse des deux particules est (initialement et toujours) au repos le système de coordonnées du
centre de masse. Il est évidemment plus facile de calculer le résultat d'une expérience de collision
dans le système du centre de masse que dans le système du laboratoire puisque seuls trois degrés de
liberté apparaissent dans le premier à comparer aux six du second. Le processus de collision dans le
système du centre de masse peut être vu comme celui d'une particule qui a la masse réduite
µ = m1 m2 / (m1 + m2 ) et une vitesse initiale v qui entre en collision avec un centre de diffusion fixe.
La distribution en angles de la particule diffusée sera affectée par la transformation entre le système
de coordonnées du centre de masse, dans lequel les calculs sont faits, et le système de coordonnées
du laboratoire, dans lequel les observations sont faites.
Masse réduite
L'équation de Schrödinger décrit le mouvement d'une seule particule dans un champ de force
externe. Nous sommes maintenant intéressés par le mouvement de deux particules qui sont attirées
l'une par l'autre ou qui se repoussent par une force qui dépend seulement de la distance entre elles.
La forme de l'équation de Schrödinger a utiliser pour deux particules est suggérée par l'extension de
l'équation de Schrödinger de une à trois dimensions. Cette extension utilisait le fait la fonction
d'onde dépend des trois coordonnées rectangulaires x, y et z au lieu de juste x et en introduisant
l'impulsion correspondant aux nouvelles coordonnées telle qu'elles apparaissent dans l'expression
classique de l'énergie.

Une extension similaire de trois à six coordonnées rectangulaires conduit directement à l'équation
de Schrödinger, que nous avions déjà suggérée, pour deux particules de masse m1 et m2 :

ih ψ ( x1 , y1 , z1 , x 2 , y 2 , z 2 , t ) =
∂t
 h2  ∂2 ∂2 ∂2  h2  ∂2 ∂2 ∂2  
(1)  − 
 2 + + 
2 
− 
 2 + + 
2 
+ V ( x , y , z , x , y , z , t )
 2m1  ∂x1 ∂y1 ∂z1  2m2  ∂x 2 ∂y 2 ∂z 2 
2 2 1 1 1 2 2 2

ψ ( x1 , y1 , z1 , x 2 , y 2 , z 2 , t )
où l'énergie potentielle est supposée dépendre d'une manière arbitraire des six coordonnées et du
temps. Si maintenant l'énergie potentielle dépend seulement des coordonnées relatives, c'est-à-dire
V = V ( x1 − x 2 , y1 − y 2 , z1 − z 2 ) , une simplification importante peut être faite. Nous définissons les
coordonnées relatives x, y, z et les coordonnées du centre de masse X, Y, Z par
x = x1 − x 2 y = y1 − y 2 z = z1 − z 2
(2)
MX = m1 x1 + m2 x 2 MY = m1 y1 + m2 y 2 MZ = m1 z1 + m2 z 2

Ici, M = m1 + m2 est la masse totale du système. L'équation (1) peut être récrite en fonction des
nouvelles coordonnées
∂ψ  h 2  ∂ 2 ∂2 ∂2  h2  ∂2 ∂2 ∂2  
(3) ih = −  + + 
2 
− 
 + +  + V ( x, y, z )ψ
2 
∂t  2 M  ∂X 2
∂Y 2
∂Z  2 µ  ∂x 2
∂y 2
∂z  

m1 m2
(4) µ =
m1 + m2
est appelée masse réduite.

Deux séparations de l'équation (3) peuvent maintenant être faites. Tout d'abord, la dépendance en
temps peut être séparée, comme nous l'avons déjà vu, et, deuxièmement, une séparation peut être
faite en un produit de fonctions des coordonnées relatives et des coordonnées du centre de masse.
Le processus est immédiat et simple et le résultat est
ψ ( x, y, z, X , Y , Z , t ) = u ( x, y, z )U ( X , Y , Z )e −i ( E + E ′ )t / h
h2 2
(5) − ∇ u + Vu = Eu

h2 2
− ∇ U = E ′U
2M
où les opérateurs ∇ 2 dans la deuxième et troisième équation impliquent la différentiation par
rapport aux coordonnées relatives et du centre de masse, respectivement. La deuxième équation (5)
décrit le mouvement relatif des deux particules et est la même que l'équation du mouvement d'une
particule qui a la masse réduite µ dans une énergie potentielle externe V . La troisième équation
(5) nous dit que le centre de masse du système de deux particules se déplace comme une particule
libre de masse M, comme on s'y attendait.

Section efficace de diffusion


La distribution angulaire des particules diffusées par un centre de force fixe ou par d'autres
particules est décrit en pratique en terme d'une section efficace de diffusion, omniprésent dans les
études expérimentales. Supposons que nous bombardions un groupe de n particules ou centres
diffusion avec un flux parallèle de N particules par unité de surface et par unité de temps et que
nous comptions le nombre de particules incidentes qui émergent par unité de temps dans un petit
angle solide ∆ω 0 centré autour d'une direction qui a les angles sphériques θ 0 et φ 0 par rapport à la
direction de bombardement prise comme axe polaire. Ce nombre sera proportionnel à N, n et ∆ω 0
pourvu que le flux soit assez faible pour qu'il n'y ait pas d'interférence entre les particules envoyées
et pas de diminution appréciable des particules par leur éjection hors de la zone cible et pourvu
aussi que les particules bombardées soient suffisament écartées pour que chaque processus de
collision implique seulement une d'entre elles.

Alors le nombre de particules incidentes qui émerge par unité de temps dans ∆ω 0 peut s'écrire
(6) nNσ 0 (θ 0 , φ 0 )∆ω 0
où le facteur de proportionnalité σ 0 (θ 0 , φ 0 ) et appelé section efficace différentielle de diffusion.
Puisque (6) a la dimension de l'inverse d'un temps, σ 0 (θ 0 , φ 0 ) a la dimension d'une surface.
σ 0 (θ 0 , φ 0 )∆ω 0 est égale à la section efficace du flux parallèle incident qui contient le nombre de
particules diffusées dans ∆ω 0 par une seule particule cible ou centre de diffusion. L'intégrale de
σ 0 (θ 0 , φ 0 ) sur la sphère est appelée section efficace totale de diffusion
(7) σ 0 = ∫ σ 0 (θ 0 , φ 0 )dω 0

Pour la collision d'une particule avec un centre de diffusion fixe, la définition (6) de la section
efficace différentielle de diffusion est également valide dans les systèmes de coordonnées du
laboratoire et du centre de masse puisqu'un centre de diffusion qui est fixé à une masse effective
infinie et ainsi le centre de masse du système ne se déplace pas. Pour une collision entre deux
particules de masse finie, cependant, la section efficace différentielle (6) s'applique en général
seulement au système de coordonnées du laboratoire et à l'observation de la particule incidente
diffusée. Elle ne décrit pas l'observation des particules bombardées éjectées dans le système du
laboratoire bien qu'il soit bien sûr possible d'obtenir une section efficace différentielle pour
l'éjection des particules à partir de σ 0 (θ 0 , φ 0 ) . Dans le système du centre de masse, la section
efficace différentielle σ (θ , φ ) peut être définie en analogie avec (6) où, à nouveau, la particule
incidente diffusée est celle qui est observée et le flux N de particules incidentes est calculé par
rapport aux particules bombardées, par le centre de masse. Puisque dans ce système de coordonnées
les deux particules se déplacent dans des directions opposées l'une de l'autre après la collision, il est
clair que la section efficace différentielle pour l'observation des particules bombardées éjectées
dans la direction θ , φ est juste σ (π − θ , φ + π ) .
Relation entre les angles dans le laboratoire et le centre de masse
La relation entre les sections efficaces différentielles et les angles dans le système du laboratoire et
dans le système du centre de masse peuvent être trouvées en déplaçant le système du laboratoire
dans la direction de la particule incidente avec une vitesse suffisante pour mettre le centre de masse
au repos. La figure (a) ci-dessus montre une particule de masse m1 et une vitesse initiale va frapper
une particule de masse m2 initialement au repos. Le centre de masse se déplace vers la droite avec
la vitesse v ′ = m1v / (m1 + m2 ) , comme on peut le voir de la conservation de l'impulsion. Donc, dans
le système du centre de masse, les particules de masse m1 et m2 approchent du centre de masse
avec les vitesses
m2 v
(8) v ′′ = v − v ′ =
m1 + m2
et v ′ , respectivement. Si la collision est élastique, elles s'écartent évidemment du centre de masse
après la collision avec les mêmes vitesses (figure (b)). Il suit de la géométrie de la situation que θ
et φ sont reliés à θ 0 et φ 0 par
v ′′ cosθ + v ′ = v1 cosθ 0
(9) v ′′ sin θ = v1 sin θ 0
φ = φ0

A partir des deux premières équations de (9), nous obtenons, en éliminant v1 ,


sin θ v′ m
(10) tan θ 0 = γ = = 1
γ + cosθ v ′′ m2

Les équations (9) et (10) peuvent être valides pour des collisions non élastiques aussi. Considérons
une collision binaire générale (par exemple, une réaction nucléaire) dans laquelle une particule de
masse m1 frappe une particule de masse m2 initialement au repos et, après la collision, les
particules de masse m3 et m4 émergent, où m1 + m2 = m3 + m4 . Si en plus une quantité d'énergie Q
est convertie de l'énergie interne en énergie cinétique des particules émergentes (Q est positif pour
des collisions exothermiques et négatif pour des collisions endothermiques) et la particule de masse
m3 est observée, la première équation de (10) est encore valide. Dans ce cas, γ est encore égal au
rapport de la vitesse du centre de masse dans le système du laboratoire à la vitesse de la particule
observée dans le système du centre de masse puisque tout cela est déduit de simples considérations
géométriques. Cependant, γ n'est plus m1 / m2 mais on peut montrer qu'il est donné par
1
mm E  2
(11) γ = + 1 3 
m m
 2 4 E + Q 
où E = m1 m2 v / 2(m1 + m2 ) est l'énergie initialement associée au mouvement relatif dans le
2

système du centre de masse.

Relation entre sections efficaces


La relation entre les sections efficaces dans les systèmes de coordonnées du laboratoire et du centre
de masse peut être obtenue à partir de leurs définitions, qui impliquent que le même nombre de
particules sont diffusées dans l'angle solide différentiel dω 0 autour de θ 0 , φ 0 que dans dω autour
de θ , φ .
(12) σ 0 (θ 0 , φ 0 ) sin θ 0 dθ 0 dφ 0 = σ (θ , φ ) sin θ dθ dφ

Avec l'aide de la dernière équation (9) et la première équation (10), l'équation (12) donne

) = (1 + γ )
1
+ 2γ cosθ 2
2
(13) σ 0 (θ 0 , φ 0 σ (θ , φ )
1 + γ cosθ
où en général γ est donné par (6). On notera que la section efficace totale est la même dans les
deux systèmes du laboratoire et du centre de masse puisque le nombre total de collisions qui se
produisent est indépendant du mode de description du processus.

Dépendance en γ
Pour γ < 1 , l'équation (10) montre que θ 0 croît de manière monotone de 0 à π lorsque θ croît de 0
à π . Pour γ = 1 , θ 0 = 12 θ et varie de 0 à 12 π lorsque θ varie de 0 à π . Dans ce cas
(14) σ 0 (θ 0 , φ 0 ) = 4 cosθ 0σ (2θ 0 , φ 0 )
et aucune particule n'apparaît dans l'hémisphère arrière dans le système du laboratoire. Pour γ > 1 ,
θ 0 croît d'abord de 0 à une valeur maximale sin −1 (1 / γ ) , puis décroît jusqu'à 0 pendant que θ varie
jusque π . Dans ce cas, σ 0 (θ 0 , φ 0 ) est habituellement infini a la valeur maximale de θ 0 bien que
cette singularité donne une contribution finie à la section efficace totale. Aucune particule
n'apparaît au-delà du maximum de θ 0 dans le système du laboratoire. Les deux valeurs de θ qui
conduisent à une valeur particulière de θ 0 entre 0 et sin −1 (1 / γ ) peuvent être distinguées par
l'énergie de la particule observée qui est d'autant plus grande que θ est petit.

Ce dernier cas ( γ > 1 ) est illustré schématiquement dans la figure (c). La résultante de la vitesse v ′′
de la particule observée dans le centre de masse et la vitesse v ′ du centre de masse dans le système
du laboratoire donne la vitesse v1 de la particule observée dans le système du laboratoire. Le lieu
des points terminaux de v1 quand son origine est au point O est le cercle de rayon v ′′ . Donc, quand
v ′′ < v ′ , l'angle θ 0 de la résultante v1 avec la direction de bombardement ne peut pas excéder
l'angle
v ′′ 1
(15) sin −1 = sin −1
v′ γ

Lorsque le rapport γ = v ′ / v ′′ décroît, le cercle devient relativement plus large et le domaine


angulaire de v1 s'accroît.

L'utilisation des relations géométriques dans la discussion précédente est valide aussi bien en
mécanique quantique qu'en mécanique classique car ce sont essentiellement des relations entres
vecteurs impulsions qui sont appliquées dans la région asymptotique où les particules n'ont pas
besoin d'être localisées avec précision dans l'espace et donc peuvent avoir des impulsions définies.

Il est intéressant de noter que la différence entre les systèmes du laboratoire et du centre de masse
est négligeable dans les collisions d'électrons avec des atomes à cause du grand rapport de masse
des particules en jeu. Dans les collisions nucléaires, cependant, la différence entre les deux
systèmes de coordonnées est habituellement significative.
Comportement asymptotique
La section efficace différentielle de diffusion σ (θ , φ ) dans le système de coordonnées du centre de
masse peut être trouvée à partir de la forme asymptotique de la solution à la deuxième équation (5),
h2 2
(16) − ∇ u + Vu = Eu

qui est l'équation de Schrödinger pour le mouvement relatif. La fonction d'onde u peut être écrite
comme une fonction des angles θ , φ et de la distance radiale entre les deux particules. L'énergie E
associée au mouvement relatif se lit sur la figure ci-dessus comme
m2
(17) E = E0
m1 + m2
où E 0 est l'énergie initiale de la particule incidente. Il est intéressant de noter que E est égal à
l'énergie cinétique de la particule dont la masse est la masse réduite µ et dont la vitesse est la
vitesse relative v. Donc, nous pouvons voir (16) comme représentant la collision élastique d'une
particule de masse µ , de vitesse initiale v et d'énergie cinétique E = 12 µv 2 avec un centre de
diffusion fixe qui est décrit par l'énergie potentielle V (r ) où r est la distance entre la particule
fictive µ et l'origine du potentiel de diffusion.

Comme dans la section précédente, la diffusion est déterminée par la forme asymptotique de
u (r ,θ , φ ) dans la région où V = 0. Quand les particules qui se heurtent sont très éloignées, nous
désirons que u contiennent une partie qui représente une particule incidente de masse µ se
déplaçant dans une direction particulière avec la vitesse v et une partie qui représente une particule
sortante radiale :
µv
[
r →∞
]
(18) u (r ,θ , φ ) → A e ikz + r −1 f (θ , φ )e ikr k=
h

Le premier terme dans (18) représente une particule se déplaçant dans la direction des z positifs ou
le long de l'axe polaire θ = 0 puisque z = r cosθ . C'est une onde plane infinie de la forme d'une
fonction propre de l'impulsion où le vecteur de propagation k a la grandeur k et est dirigé le long de
l'axe polaire. Le deuxième terme dans (18) représente une particule qui se déplace radialement vers
l'extérieur. Son amplitude dépend de θ et de φ et inversement proportionnelle à r puisque le flux
radial doit diminuer comme l'inverse du carré de la distance. On vérifie facilement que (18) satisfait
l'équation (16) asymptotiquement à travers des termes d'ordre 1 / r dans la région où V = 0 pour
toute forme de la fonction f (θ , φ ) .

Normalisation
La signification physique du coefficient A et de la fonction angulaire f peut être obtenue par un
calcul du flux de particule, comme dans la section précédente. Une substitution directe de (18) dans
l'équation de la densité de courant de probabilité conduit cependant à des termes d'interférence
entre les ondes incidentes et diffusées qui n'apparaissent pas dans la plus part des arrangements
expérimentaux. Le fait qu'ils ne peuvent pas apparaître peut être vu de la manière suivante.

En pratique, les particules incidentes et diffusées sont séparées l'une de l'autre en les collimatant
l'une sur l'autre. Supposons, par exemple, que l'arrangement expérimental est comme indiqué
schématiquement ci-dessus, tel que les particules incidentes venant de la source S sont collimatées
par les diaphragmes DD en un faisceau plus ou moins bien défini. Un tel faisceau collimaté n'est
pas une onde plane infinie de la forme e ikx mais peut être obtenue en superposant une infinité
d'ondes planes qui sont des vecteurs de propagation de grandeurs et directions légèrement
différentes. La dispersion angulaire totale en radians sera de l'ordre du rapport de la longueur
d'onde de la particule au diamètre du collimateur (diffraction) et ainsi peut être extrêmement petit
en pratique. Maintenant, f ne varie habituellement pas très rapidement avec l'angle, tel que la petite
dispersion en directions des vecteurs de propagation incidents n'affecte pas f de manière
significative. Donc, au point d'observation P, seul le terme f est présent et est essentiellement le
même que celui qui apparaît dans (18). Le flux incident peut être calculé à partir du terme d'onde
plane seul puisque si nous allons suffisament loin de la zone de diffusion, le terme f peut être rendu
négligeable. Donc, dans la région observée, les termes d'interférences sont une conséquence de
l'idéalisation implicite en supposant une onde plane infinie dans (18) et ils n'ont habituellement pas
de signification physique sauf dans quelques cas exceptionnels.

La substitution des deux termes de (18) séparément dans l'équation de la densité de flux de
2
probabilité montre que le flux incident est de grandeur v A le long de l'axe polaire et que le terme
dominant dans le flux diffusé est de grandeur
v A f (θ , φ )
2 2

(19)
r2
le long d'un rayon vers l'extérieur. A partir de la définition de la section efficace, il s'ensuit que
(20) σ (θ , φ ) = f (θ , φ )
2

Comme discuté dans la section précédente, le choix du coefficient A n'est pas important tant que le
calcul de la diffusion est considéré. La fonction d'onde peut être normalisée à un flux incident unité
1
en choisissant A = 1 / v ou elle peut être normalisée en posant ∫u d 3 r = 1 dans une grande boîte
2 2

qui a des conditions aux limites périodiques. Nous poserons souvent simplement A égal à l'unité.
V.3. Diffusion par des potentiels à symétrie sphérique
Le comportement asymptotique de la fonction d'onde détermine la section efficace différentielle
mais ne peut pas en elle-même être trouvée sans résoudre l'équation de Schrödinger dans tout
l'espace. Comme cela est le cas dans le calcul des niveaux d'énergie, cela peut être fait seulement
quand l'équation de Schrödinger est séparable et un cas particulier de grand intérêt physique est
celui dans lequel l'énergie potentielle est à symétrie sphérique. Nous allons supposer ici que V est
seulement fonction de r et nous allons trouver la relation entre les solutions séparées en
coordonnées sphériques et la forme asymptotique. Cette procédure est appelée la méthode des
ondes partielles.

Dans la suite nous ne distinguerons généralement pas les collisions d'une particule avec un centre
fixe de diffusion et les collisions entre deux particules traitées dans le système de coordonnées du
centre de masse.

La diffusion élastique, pour laquelle V est réel, est considérée ici. La situation où V est complexe
sera discutée plus loin et est intéressante puisque certains processus inélastiques peuvent être
décrits approximativement de cette manière.

Comportement asymptotique
Il est évident que le problème possède maintenant une symétrie autour de l'axe polaire tel que u, f et
σ sont indépendants de l'angle φ . La solution générale de l'équation de Schrödinger peut être
écrite comme une somme de produits de fonctions radiales et de polynômes de Legendre. Pour des
raisons pratiques, nous l'écrivons sous la forme

u (r ,θ ) = ∑ (2l + 1)i l Rl (r )Pl (cosθ )
l =0
(1) ∞
= ∑ (2l + 1)i l r −1 χ l (r )Pl (cosθ )
l =0

où Pl est le polynôme de Legendre d'ordre l et χ l satisfait l'équation


d 2χl  2 l (l + 1) 
+ k − U (r ) − χl = 0
dr 2
 r 2 
(2) 1
 2 µE  2 2 µV (r )
k = 2  U (r ) = →0
 h  h 2 r →∞

La condition aux limites en r = 0 que Rl soit fini ou que χ l s'annule détermine la forme
asymptotique de la solution à (2) excepté pour une constante multiplicative arbitraire.

Afin de trouver la nature générale de ce comportement asymptotique, nous considérons r si grand


que les termes U et l dans (2) peuvent être négligés. Alors la solution à (2) est de la forme e ± ikr .
Pour avoir une meilleure approximation, nous posons
(3) χ l (r ) = A exp  ∫ f (r ′)dr ′ e ±ikr
r

 a 
où a et A sont des constantes. La première exponentielle est supposée être une fonction de r variant
lentement pour de grands r, ce qui implique que f (r ) diminue plus rapidement que t −1 lorsque
r → ∞ . La substitution de (3) dans (2) donne l'équation suivante pour f :
l (l + 1)
(4) f ′ + f 2 ± 2ikf = U (r ) + ≡ W (r )
r2
où l'apostrophe indique la dérivée par rapport à r. Si maintenant W (r ) diminue comme r − s pour de
grands r (s > 0), le dernier terme sur le coté gauche est le terme dominant et f diminue aussi comme
r − s . Dans ce cas, χ l varie comme e ± ikr pour de grands r si s > 1 puisque alors l'intégrale dans
l'exponentielle de (3) converge pour de grands r. Si, d'autre part, W diminue comme une
exponentielle ou une fonction d'erreur de r (ce qui implique que l = 0), le premier et le troisième
terme sur le coté gauche de (4) doivent être considérés tous les deux. On peut alors montrer sans
difficulté que χ l varie encore comme e ± ikr pour de grands r. Le champ coulombien, pour lequel U
et W varie comme r −1 pour de grands r indépendamment de la valeur de l est le seul cas
physiquement intéressant qui nécessite une attention particulière et qui sera discuté plus loin.
La forme asymptotique de χ l peut être écrite assez généralement
(5) χ l (r ) → Al′ sin (kr + δ l′ )
r →∞

où jusqu'à preuve du contraire Al′ et δ l′ peuvent être complexe. La solution de (2) qui s'annule en r
= 0 est unique à une constante multiplicative près. On peut montrer que cette solution est réelle
partout si elle est réelle en r = 0, puisque k, U et l sont tous réels. Donc, δ l′ doit être réel bien que
Al′ n'a pas besoin de l'être. Cela étant dit, on vérifie facilement que le flux radial total de particules
à travers une grande sphère s'annule :
π
(6) lim 2πr 2 ∫ S r sin θdθ = 0
r →∞ 0

où S r est la composante radiale du vecteur densité de flux de probabilité calculé en y substituant


u (r ,θ ) de (1). Cela signifie qu'aucune source ou puits de particules ne sont présent et les particules
qui sont diffusées radialement vers l'extérieur sont fournies par l'onde plane incidente.

Section efficace différentielle


Il est utile de redéfinir l'amplitude Al′ et l'angle de phase δ l′ qui apparaissent dans (5) en fonction
d'un problème un peu plus spécifique. On supposera que U (r ) peut être négligé pour r plus grand
qu'une certaine distance a. Dans les cas pratiques intéressant, a peut être suffisament petit pour que
le terme l dans (2) soit négligeable. Nous pouvons alors diviser le domaine de r en trois régions.
Dans la première, U (r ) ne peut pas être négligé et la forme de Rl (r ) dépend de U. Dans la
seconde, U (r ) peut être négligé mais le terme l dans (2) n'est pas négligeable. Alors, la forme la
plus générale pour Rl (r ) qui soit réelle (excepté pour une constante multiplicative complexe
éventuelle) est, comme nous l'avons vu dans l'étude du puits de potentiel
(7) Rl (r ) = Al [cos δ l j l (kr ) + sin δ l nl (kr )]
où δ l est réel. Dans la troisième région, le terme l est négligeable tout comme U et Rl (r ) est
obtenu à partir des formules asymptotiques
(8) Rl (r ) → (kr ) Al sin (kr − 12 lπ + δ l )
−1
r →∞
Les équations (5) et (8) sont en accord si Al = kAl′ et δ l = δ l′ + 12 lπ .

Nous voulons maintenant identifier la forme asymptotique de (1) avec la forme asymptotique vue
dans la section précédente. Pour faire cela, nous avons besoin d'un développement de e ikz = e ikr cosθ
en polynômes de Legendre :

(9) e ikr cos θ = ∑ (2l + 1)i l jl (kr )Pl (cosθ )
l =0

En substituant (9) dans la forme asymptotique de la section précédente avec A = 1 et en égalant à la


forme asymptotique (1), nous obtenons

∑ (2l + 1)i (kr ) sin (kr − 12 lπ )Pl (cosθ ) + r −1 f (θ )e ikr


l −1

l =0
(10) ∞
= ∑ (2l + 1)i l Al (kr ) sin (kr − 12 lπ + δ l )Pl (cosθ )
−1

l =0

Lorsque les fonctions sinus sont écrites sous forme d'exponentielles complexes, les coefficients de
e ikr et e −ikr des deux cotés de cette équation doivent être égaux :
∞ 1 ∞  1 
− ilπ i  δ l − lπ 
2ikf (θ ) + ∑ (2l + 1)i e l 2
Pl (cosθ ) = ∑ (2l + 1)i Al e l  2 
Pl (cosθ )
l =0 l =0
(11)
∞ 1 ∞  1 
ilπ −i  δ l − lπ 
∑ (2l + 1)i e
l =0
l 2
Pl (cosθ ) = ∑ (2l + 1)i Al e
l =0
l  2 
Pl (cosθ )

Puisque ces relations sont vraies pour toute valeur de θ et que les polynômes de Legendre sont
orthogonaux, la deuxième équation (11) devient
iδ l
(12) Al = e

La substitution de cette valeur dans la première équation (11) donne pour l'amplitude de diffusion
∑ (2l + 1)(e )

(13) f (θ ) = (2ik ) − 1 Pl (cosθ )
−1 2 iδ l

l =0

Donc, la section efficace différentielle est


∞ 2

(14) σ (θ ) = f (θ ) ∑ (2l + 1)e sin δ l Pl (cosθ )


2 1 iδ l
= 2
k l =0

Il est utile de noter que la relation asymptotique de la section précédente, (13) et (14), qui se
rapportent toutes au comportement asymptotique de la fonction d'onde, sont aussi valides quand la
relativité restreinte est prise en compte. Aussi longtemps que nous travaillons avec le mouvement
dans le système de coordonnées du centre de masse, qui peut être décrit par une fonction u des
coordonnées relatives, nous pouvons spécifier la diffusion de cette manière en fonction de δ l où
hk est l'impulsion relative. Cela est vrai même quand l'interaction ne peut pas être décrite par un
potentiel.

Section efficace élastique totale


La section efficace élastique totale est l'intégrale de (14) sur la sphère. A cause de l'orthogonalité
des polynômes de Legendre, elle ne contient pas de produits de facteurs impliquant des valeurs
différentes de l.
π 4π ∞
(15) σ = 2π ∫ σ (θ )sin θdθ = 2 ∑ (2l + 1)sin 2 δ l
0 k l =0

La section efficace totale peut aussi être reliée à f (0) . Il suit de la fonction génératrice des
polynômes de Legendre que Pl (1) = 1 pour tout l, tel que (13) donne pour θ = 0

∑ (2l + 1)(e )

(16) f (0 ) = (2ik )
−1 2 iδ l
−1
l =0

La comparaison avec (13) montre alors que


2π 4π
(17) σ =
ik
[ ]
f (0 ) − f ∗ (0 ) =
k
Im f (0 )

L'interprétation physique de (17) est la suivante : afin que la diffusion prenne place, les particules
doivent être éliminées dans quantité proportionnelle à σ du flux incident, tel que son intensité est
plus petite derrière la région de diffusion ( θ ≈ 0 ) qu'en face d'elle. Cela peut se produire seulement
par interférence entre les deux termes dans l'expression asymptotique de la section précédente.
Puisqu'un tel terme d'interférence doit être une fonction linéaire de l'amplitude de diffusion vers
l'avant, on s'attend à une relation générale de la forme de (17). Un calcul réel de ce terme
d'interférence montre que (17) doit être valable plus généralement : quand f dépend aussi bien de φ
que de θ et quand σ inclut une diffusion inélastique et de l'absorption en plus de la diffusion
élastique.

Décalages de phase
L'angle δ l est appelé décalage de phase de la lième onde partielle puisque selon (8) c'est la
différence de phase entre les formes asymptotiques de la fonction radiale Rl (r ) et la fonction
radiale jl (kr ) en l'absence de potentiel de diffusion (U = 0). Le décalage de phase détermine
complètement la diffusion et la section efficace de diffusion s'annule quand chacun des δ l est 0° ou
180°.

On notera que la dérivation de (13) est valide qu'il existe ou pas le rayon supposé a au-delà duquel
U (r ) est négligeable pourvu que U (r ) diminue plus rapidement que 1 / r . Cependant, la méthode
des ondes partielles est la plus utile pour le calcul des sections efficaces de diffusion si un tel rayon
a existe, particulièrement si ka est de l'ordre de l'unité ou moins. La raison en est que le premier et
plus grand maximum de jl (kr ) est approximativement en r = l / k . Pour r beaucoup plus petit, jl
est petit et croît comme r l . Donc, si a << l / k , jl sera très petit où U est appréciable. Alors la
lième onde partielle sera peu affectée par le potentiel, le décalage de phase δ l sera très petit et la
contribution à la diffusion pour ce l sera négligeable. Il s'ensuit que la section efficace de diffusion
consiste en une série de termes s'étendant de l = 0 à un l maximum qui est de l'ordre de ka . Puisque
le calcul des décalages de phase est habituellement un travail fastidieux, plus petite est la grandeur
de ka , plus la méthode est facile à appliquer. Donc ces méthodes des ondes partielles sont surtout
utiles aux bombardements à faible énergie.

Il est intéressant de noter que la distance classique d'approche la plus proche d'une particule de
masse µ , de vitesse v et de moment angulaire lh de l'origine est lh / µv = l / k . Donc, les
remarques précédentes sont analogues à l'affirmation qu'une particule classique n'est pas diffusée si
elle a un moment angulaire suffisant pour ne pas entrer dans la région du potentiel r < a .

Calcul de δ l
Le décalage de phase δ l est calculé en comparant la fonction d'onde radiale Rl (r ) pour r < a , qui
peut avoir une forme analytique et peut toujours être trouvé numériquement si nécessaire, à la
solution (7). La condition aux limites en r = a est que (1 / Rl )(dRl / dr ) doit être continu. Donc, si γ l
est le rapport de la pente à la valeur de la fonction d'onde intérieure, nous avons que
k [ jl′ (ka ) cos δ l − nl′ (ka )sin δ l ]
(18) =γl
jl (ka ) cos δ l − nl (ka )sin δ l

En calculant les dérivées jl′ et nl′ avec l'aide des expressions que nous avons vues, δ l est donné
par
kj ′ (ka ) − γ l jl (ka )
(19) tan δ l = l
knl′ (ka ) − γ l nl (ka )

L'équation (19) peut être utilisée directement pour obtenir une expression approchée de δ l quand l
est grand et δ l supposé petit. Dans ce cas, γ l diffère peu du rapport de la pente à la valeur de la
solution en l'absence d'un potentiel de diffusion, et nous posons
 j ′ (ka )  j ′ (ka )
(20) γ l = k  l + εl  ε l << l
 jl (ka )  jl (ka )
L'équation (19) peut-être écrite avec les expressions que nous avons vues sur les jl et les nl
comme
ε l (ka )2 j l2 (ka )
(21) tan δ l =
ε l (ka )2 j l (ka )nl (ka ) − 1
qui est encore exact. Si nous utilisons maintenant le développement en série de jl quand l >> (ka )
2

et pour estimer l'ordre de grandeur de nl , l'inégalité dans (20) devient


l
(22) ε l <<
ka
et (21) peut être approché comme
ε l (ka )2l + 2 ε l 2 2l (l!)2 (ka )2l + 2
(23) δ l ≈ − =−
[(2l + 1)!!]2 [(2l + 1)!]2
L'équation (23) peut être utilisée pour vérifier la convergence des sommes sur les ondes partielles
qui apparaît dans (13). Nous utilisons la formule de Stirling pour trouver les termes dominant dans
ln δ l quand l est grand et nous négligeons les termes d'ordre ln l et plus bas.
(24) ln δ l ≈ ln ε l + 2l [ln (ka ) + 1 − ln 2] − 2l ln l

Donc, même si ε l a la valeur maximale indiquée par (22), δ l diminue comme l'inverse de la
factorielle de l (plus vite qu'une exponentielle) et les séries qui apparaissent dans les expressions de
la diffusion convergent assez rapidement pour l grand.

Relation entre les signes de δ l et V (r )


Il est visible dans (23) que quand l >> (ka ) , δ l a le signe opposé de ε l . Si maintenant le terme
2

d'énergie potentielle V ou U est positif, correspondant à des forces qui sont principalement
répulsives, l'équation (2) montre que le rapport de la courbure à la valeur de la fonction d'onde
radiale est plus positive que dans le cas libre. Cela signifie que le rapport de la pente à la valeur est
plus positif en r = a que dans le cas où U = 0. Donc, un potentiel répulsif rend ε l positif et δ l
négatif. Un décalage de phase négatif signifie que la fonction d'onde radiale est "poussée vers
l'extérieur" en comparaison de la fonction d'onde libre.

De même, nous voyons qu'un potentiel négatif rend ε l négatif et δ l positif. Cela signifie que la
fonction d'onde est "tirée vers l'intérieur" par le potentiel attractif.

Cela peut être vu graphiquement en comparant rj 0 (kr ) et χ 0 (kr ) quand ont les fait démarrer
arbitrairement avec la même pente en r = 0. Les figures (a) et (b) montrent le résultat de calculs
numériques effectués pour des potentiels carrés répulsifs et attractifs, respectivement. Les unités
sont choisies tel que h = 1 , m = 12 et la longueur unité est un cinquième de la longueur totale de
l'abscisse montrée dans le graphique. Le potentiel a le rayon a = 1 et l'intensité V0 = ±2 , l'énergie
est E = 4 tel que ka = 2 . Dans chaque cas la courbe en tiret est rj 0 (kr ) et la courbe pleine est
χ 0 (kr ) .

Effet Ramsauer-Townsend
La figure (b) suggère qu'un potentiel attractif peut être assez fort pour que l'onde partielle l = 0 soit
tirée de juste un demi cycle et son décalage de phase est 180°. Si c'était le cas, le terme
correspondant dans l'expression (13) pour f (θ ) s'annulerait et il n'y aurait pas de contribution à la
diffusion.
La situation est montrée ci-dessus, à nouveau calculée numériquement. Ici a = 2, V0 = −5 et E = 1
tel que ka = 2 . La courbe en tiret est rj 0 (kr ) et la largeur du potentiel est également indiquée.

Dans une telle situation, il peut arriver que ka soit assez petit et le potentiel attractif assez fort pour
tous les autres décalages de phase soient négligeables quand δ 0 = 180° . L'amplitude de diffusion
f (θ ) s'annule alors pour tout θ et il n'y a pas de diffusion. C'est l'explication de l'effet Ramsauer-
Townsend, le minimum extrêmement bas observé dans la section efficace de diffusion des électrons
par les atomes de gaz rares à une énergie de bombardement d'environ 0.7 eV. Cette explication fut
suggérée par Bohr puis montrée raisonnable quantitativement par Faxén et Holtsmark. Un atome de
gaz rare, qui consiste entièrement en une coquille fermée, est relativement petit et la force
combinée du noyau et des électrons atomiques exercée sur les électrons incidents est forte et d'une
portée bien définie. Il est clair que cette section efficace minimale se produit à une énergie définie
puisque la forme de la fonction d'onde à l'intérieur du potentiel est insensible à l'énergie de
bombardement relativement faible tandis que la phase de la fonction d'onde libre en dépend
rapidement.
Physiquement, l'effet Ramsauer-Townsend peut être vu comme une diffraction de l'électron autour
de l'atome de gaz rare dans laquelle la fonction d'onde à l'intérieur de l'atome est déformée juste ce
qu'il faut pour s'ajuster à la fonction d'onde régulière et non déformée à l'extérieur. Cet effet est
analogue à la transmission parfaite trouvée à des énergies particulière dans le problème à une
dimension que nous avons examiné. Contrairement à la situation à une dimension, cependant, l'effet
Ramsauer-Townsend ne peut pas se produire avec un potentiel répulsif car ka devrait être au moins
de l'ordre de l'unité pour avoir δ 0 = −180° et un potentiel de ce large domaine produirait des
décalages de phase à des l plus grands.

Diffusion par une sphère parfaitement rigide


Comme premier exemple de la méthode des ondes partielles, calculons la diffusion par une sphère
parfaitement rigide qui est représentée par le potentiel V (r ) = +∞ pour r < a et V (r ) = 0 pour r > a.
La solution pour r > a est juste (7). La condition aux limites que u (a,θ ) = 0 est équivalente à
l'exigence que toutes les fonctions d'ondes radiales s'annulent en r = a. Les décalages de phase
peuvent alors être obtenus en posant Rl (a ) donné dans (7) égal à 0 ou γ l dans (19) égal à l'infini :
jl (ka )
(25) tan δ l =
nl (ka )

Le calcul de la diffusion est particulièrement simple à la limite des faibles énergies :


ka = 2πa / λ << 1 . En utilisant les limites des fonctions jl et nl pour de petites valeurs, on a une
approximation pour les décalages de phase

(26) tan δ l ≈ −
(ka )2l +1
(2l + 1)[(2l − 1)!!]2
Donc, δ l diminue très rapidement lorsque l croît, en accord avec (23). Tous les décalages de phase
s'annulent lorsque k → 0 . Cependant, l'onde partielle l = 0 donne une contribution finie à la
diffusion à cause du facteur 1 / k 2 qui apparaît dans (14) et (15). Nous obtenons donc
(27) σ (α ) ≈ a 2 σ ≈ 4πa 2
La diffusion est à symétrie sphérique et la section efficace totale est quatre fois la valeur classique.

A la limite des hautes énergies ( ka >> 1 ), on peut s'attendre à retrouver le résultat classique
puisqu'il est alors possible d'avoir des paquets d'ondes qui sont petit par rapport à la taille de la
région diffusante et ils peuvent suivre des trajectoires classiques sans se disperser de manière
appréciable. Cela correspond à la limite de l'optique géométrique en théorie ondulatoire de la
lumière ou du son. La section efficace différentielle de diffusion est assez difficile à trouver et nous
voulons seulement indiquer le calcul du terme dominant dans la section efficace totale. La
substitution de (25) dans (15) donne
4π ∞ (2l + 1) jl2 (ka )
(28) σ = 2 ∑ 2
k l =0 jl (ka ) + nl2 (ka )

Nous pouvons utiliser les développements asymptotiques des fonctions de Bessel qui sont valides
quand l'argument est grand. Le calcul montre que la plus part des contributions de la somme dans
(28) viennent de
(29) l < (ka ) − C (ka ) 2
1

où C est un nombre de l'ordre de l'unité. Le terme dominant ici est 1


2
(ka )2 . Les deux autres parties
de la somme, pour (ka ) − C (ka ) 2 < l < (ka ) + C (ka ) 2 et pour l > (ka ) + C (ka ) 2 contribuent chacune
1 1 1

à des termes de l'ordre de (ka ) 3 et peuvent donc être négligés à limite des hautes énergies. Donc
4

(30) σ ≈ 2πa 2
qui est deux fois la limite classique.

Le terme suivant a été calculé par Rubinox et Wu. Le résultat est


 0.99615 
(31) σ = 2πa 2 1 + + L 
 (ka ) 3
2

 
La raison du résultat anormal apparent (30) est que la forme asymptotique de la fonction d'onde
ainsi posée dans la section précédente tel qu'à la limite classique la diffusion est comptée deux fois
: une fois est la vraie diffusion (qui s'avère être à symétrie sphérique comme dans le problème
classique) et à nouveau dans l'ombre de la sphère diffusante qui apparaît dans la diffusion en avant
puisque cette ombre est produite par interférence entre l'onde plane incidente e ikx et l'onde diffusée
f (θ )e ikr / r . Cependant, aussi longtemps que ka est fini, la diffraction autour de la sphère dans la
direction en avant se produit réellement et la section efficace totale mesurée (si la mesure peut être
faite pour inclure le fort pic de diffusion en avant) est approximativement 2πa 2 .

Diffusion par un puits de potentiel carré


Comme deuxième exemple de la méthode des ondes partielles, considérons le problème un peu
compliqué de la diffusion par un puits de potentiel carré à symétrie sphérique. La fonction d'onde
intérieure (r < a) qui est finie en r = 0 est donnée par analogie avec celle que nous avions vue
comme
1
 2 µ (E + V0 )  2
(32) Rl (r ) = Bl jl (αr ) α = 
 h2 

Donc, les décalages de phase sont donnés par (19) où le rapport de la pente à la valeur de la lième
onde partielle en r = a est
αj ′ (αa )
(33) γ l = l
j l (αa )

A la limite basse énergie ( ka << 1 ) on trouve les deux premiers décalages de phase
γ ka 2
tan δ 0 ≈ − 0
1 + γ 0a
(34)
tan δ 1 ≈
(ka ) 1 − γ 1 a
3

3 2 + γ 1a
A moins que γ 0 a = −1 ou γ 1 a = −2 , les deux s'annulent lorsque k → 0 . Comme avec la sphère
rigide, cependant, l'onde partielle l = 0 donne une contribution finie à la diffusion à cause du facteur
1 / k 2 qui apparaît dans (14) et (15). A partir de (33), nous voyons que γ 0 a = αa cot αa − 1 et ainsi
 tan αa 
2

(35) σ ≈ 4πa 1 −
2

 αa 

La diffusion est à symétrie sphérique.

La conclusion à laquelle on arrive ici en relation avec la sphère rigide que la diffusion à basse
énergie est essentiellement indépendante de l'énergie de bombardement et de l'angle d'observation
est presque toujours valide pour tout potentiel qui a un domaine fini. Des exceptions peuvent se
produire, comme signalé après l'équation (34), si un des γ l est tel que le dénominateur de
l'expression pour tan δ l est très petit. Dans une telle situation, la lième onde partielle est dite être
en résonance avec le potentiel diffusant. Alors, elle domine habituellement la diffusion.

Diffusion résonante
Une expression approchée pour la section efficace résonante peut être obtenue en utilisant le fait
( )
1
que γ l décroît linéairement avec α croissant quand α est suffisament près de α 0 ≡ 2µV0 / h 2 2 .
Un α croissant conduit la fonction d'onde intérieure à se courber plus rapidement et ainsi diminue
le rapport de la pente à la valeur en r = a. Maintenant

( ) k2
1
(36) α = α 0 + k
2 2 2
≈ α0 +
2α 0
quand k est petit et ainsi nous pouvons écrire à l'ordre le plus bas en k
(37) γ l a ≈ γ l0 a − bl (ka )
2

où γ l0 est la valeur de γ l quand α = α 0 et bl est un nombre positif de l'ordre de l'unité.

On peut montrer que la lième onde partielle est exactement en résonance à un bombardement
d'énergie zéro quand γ l0 a = −(l + 1) . Dans ce cas bl = 12 pour tout l.
La substitution dans (34) puis dans (14) donne pour le terme dominant dans la section efficace
différentielle, dans les deux cas pour lesquels la valeur de l pour l'onde partielle qui est en
résonance est 0 et 1,
a2
(38) σ (θ ) ≈ l =0
( )
ζ 0 − b0 k 2 a 2 + (ka )2
9a 2 cos 2 θ (ka )
4
(39) σ (θ ) ≈ l =1
(ζ 1 − b1 k a
2 2
) + (ka )
2 6

Nous avons posé ζ 0 = γ 00 a + A et ζ 1 = γ 10 a + 2 . Pour la résonance, ζ 0 est ζ 1 sont petits


comparés à l'unité. Il est alors facile de montrer que (38) est une fonction décroissante monotone de
ka . Cependant (39) a un maximum aigu en ka ≈ (ζ 1 / b1 ) 2 si ζ 1 est positif et un maximum
1

beaucoup plus bas en ka ≈ (2 ζ 1 b1 )4 si ζ 1 est négatif.


1

Si nous utilisons la relation ζ 0 = α 0 a cot α 0 a , nous voyons de (38) qu'une approximation


appropriée pour la section efficace totale quand l'onde partielle l = 0 est en résonance est

(40) σ ≈ 2
k + α 0 cot 2 α 0 a
2

On voit que l'onde partielle l = 0 est en résonance pour les bombardements à basse énergie quand
α 0 a est approximativement un multiple impair de π / 2 tel que V0 a 2 ≈ π 2 h 2 / 8µ , 9π 2 h 2 / 8µ , etc.
La discussion dans l'analyse du puits de potentiel montre que ce sont juste les valeurs de V0 a 2 pour
lesquels de nouveaux niveaux d'énergie avec l = 0 apparaissent. Il est vrai assez généralement qu'un
puits de potentiel (pas nécessairement carré) qui a un niveau d'énergie proche de zéro exhibe une
résonance dans la diffusion basse énergie des particules avec la même valeur de l (pas
nécessairement zéro) que le niveau d'énergie. D'un point de vue physique, nous pouvons dire
qu'une particule incidente qui a presque la bonne énergie pour être liée par le potentiel tend à s'y
concentrer et produit une forte distorsion dans la fonction d'onde et donc une grande quantité de
diffusion.

Le maxima aigu de résonance dans la diffusion à basse énergie comme celui trouvé ci-dessus pour l
= 1 avec ζ 1 positif peut apparaître pour toute valeur de l excepté l = 0, pourvu que le puits de
potentiel ne soit pas assez large ou profond pour contenir un nouveau niveau d'énergie de ce
moment angulaire (cela correspond dans le cas du puis de potentiel à avoir ζ 1 petit et positif). Nous
pouvons voir physiquement un tel potentiel comme contenant un niveau d'énergie virtuel
légèrement au-dessus de zéro. Bien qu'un niveau d'énergie discret ne puisse pas exister avec une
énergie positive, le "potentiel centrifuge" positif l (l + 1)h 2 / 2 µr 2 pour l > 0 agit comme une
barrière de potentiel qui empêche l'évasion de la particule qui est dans ce niveau d'énergie virtuel.
La figure ci-dessus illustre cette barrière qui est caractérisée par une petite transmission à basse
énergie de la même manière que la barrière de potentiel qui nous avions étudiée. Donc, le niveau
virtuel a une sorte d'existence transitoire et produit une plus grande distorsion de la fonction d'onde
incidente à son énergie qu'aux énergies voisines. A la limite de l'énergie zéro, on peut montrer que
la transmission de la barrière centrifuge est zéro et ainsi la particule ne peut pas fuir si l > 0. La
résonance à énergie zéro conduit à un véritable état lié si l n'est pas zéro.
Distribution angulaire à basse énergie
Quand l'énergie de bombardement est petite mais non nulle, l'onde partielle l = 2 peut avoir un effet
observable sur la diffusion. Si seuls δ 0 et δ 1 sont différents de zéro de manière appréciable, les
équations (14) et (15) deviennent
[ ]
σ (θ ) = 2 sin 2 δ 0 + 6 sin δ 0 sin δ 1 cos(δ 1 − δ 0 ) cosθ + 9 sin 2 δ 1 cos 2 θ
k
1
(41)

(
σ = 2 sin 2 δ 0 + 3 sin 2 δ 1
k
)
En l'absence de résonance, nous voyons avec les équations (34) et (41) que le rapport des
contributions à la section efficace totale des ondes partielles l = 1 et l = 0 est de l'ordre de (ka ) .
4

Cependant, le rapport du terme le plus grand dépendant de l'angle dans la section efficace
différentielle (qui est proportionnel à cosθ ) au terme constant est de l'ordre de (ka ) .
2

Donc, l'onde partielle l =1 se manifeste dans la distribution angulaire à basse énergie avant de
devenir significative dans la section efficace totale. Cela est dû aux interférences avec l'onde
partielle plus forte l = 0. Par exemple, si δ 0 = 20° et δ 1 = 2° à une énergie de bombardement
donnée, l'onde partielle l = 1 contribue seulement à 3 pour-cent de la section efficace totale mais
elle rend la diffusion en avant ( θ = 0° ) 3.5 fois plus grande que la diffusion en arrière ( θ = 180° ).
V.4. Diffusion par des potentiels complexes
On a supposé jusqu'ici que l'énergie potentielle V (r ) était réelle. C'est une hypothèse naturelle
puisque V est issu de la mécanique classique. Cependant, il y a des situations dans lesquelles il est
utile d'utiliser un potentiel complexe comme une description fortement abrégée d'un système
physique beaucoup plus compliqué. Par exemple, les neutrons peuvent être diffusés de manière
élastique ou inélastique par des noyaux d'atomes. Dans le premier cas, le noyau est laissé dans son
état original et la somme des énergies cinétiques du neutron et du noyau est la même avant et après
la collision. Dans une collision inélastique, le noyau est laissé dans un état excité et la quantité Q,
définie en relation avec la valeur de γ dans le cas inélastique, est négative. La diffusion inélastique
et l'absorption de neutrons pour former un noyau différent sont des processus dans lesquels les
neutrons sont enlevés du flux incident et ne réapparaissent pas comme une partie de l'amplitude de
diffusion f (φ ,θ ) .

Tant que l'on considère seulement l'effet de ces autres processus sur la diffusion élastique, une
approximation utile consiste à voir l'interaction entre le neutron et le noyau comme étant représenté
par un potentiel complexe. Cela fut utilisé la première fois dans ce but par Feshbach, Porter et
Weisskopf en 1954.

Cela est habituellement appelé le modèle optique du potentiel en analogie avec l'utilisation de
longue date d'un indice de réfraction complexe pour discuter des propriétés optiques de médiums
partiellement absorbants. Cette section décrit les modifications de la théorie développée jusqu'ici
qui sont nécessaires dans l'hypothèse dans potentiel V complexe.

Conservation de la probabilité
On a montré que la densité de probabilité de position P(r, t ) et la densité de courant de probabilité
S(r, t ) obéissent à une relation différentielle de conservation. La dérivation de cette relation fait un
usage essentiel de l'hypothèse que V est réel. Si nous supposons maintenant que V est complexe et
que nous l'écrivons pour des raisons pratiques sous la forme
(1) V = VR − iV I
où VR et VI sont réels, une répétition de la dérivation montre que la relation de conservation est
remplacée par
∂P(r, t ) 2V
(2) + ∇ ⋅ S(r, t ) = − I P(r, t )
∂t h

Puis que P est non négatif, le coté droit de cette équation agit comme une source si VI est négatif et
comme une perte si VI est positif. Pour les raisons physiques discutées ci-dessus, nous supposerons
toujours que VI ≥ 0 . S'il y a une région où ∇ ⋅ S = 0 , l'équation (2) montre que P diminue
exponentiellement dans le temps, P ∝ e −2VI t / h et on s'attend à ce que la fonction d'onde ait une
dépendance en le temps ψ ∝ e (−iE −VI )t / h .

L'intégration de (2) sur un volume fixé Ω borné par la surface A conduit à



P(r, t )d 3 r = − ∫ S n dA − ∫ V I Pd 3 r
2
(3) ∫
∂t Ω A h Ω

Si ψ est suffisament borné à grande distance pour que l'intégrale de surface s'annule quand Ω est
l'espace entier, nous voyons que l'intégrale de normalisation décroît au cours du temps. C'est ce à
quoi on s'attendait puisque les particules sont absorbées.

Il est plus intéressant d'appliquer (3) à une situation de diffusion. Dans ce cas, nous demandons que
ψ soit stationnaire, avec la dépendance en le temps ψ ∝ e −iEt / h . La discussion de (2) montre alors
qu'il n'y a pas de région où VI ≠ 0 et ∇ ⋅ S = 0 . Le coté gauche de (3) est maintenant zéro et
lorsque Ω devient grand, le premier terme sur le coté droit, − ∫ S n dA devient le flux entrant total
A
de particules entrant dans Ω en venant de très grandes distances. Dans la discussion sur le
comportement asymptotique dans la section précédente, il fut signalé que l'annulation de cette
intégrale impliquait que les particules diffusées vers l'extérieur sont fournies par l'onde plane
incidente. Dans la situation actuelle, nous voyons que cette intégrale est le flux de particules
éliminées de l'onde incidence plus l'onde diffusée élastiquement par le potentiel complexe pourvu
que ψ soit normalisé à une onde plane d'amplitude unité à l'infini. Elle peut donc être posée égale à
vσ abs où v est la vitesse relative et σ abs est la somme de l'absorption totale et de la section efficace
inélastique. Nous obtenons donc la relation
2
(4) σ abs = ∫ VI ψ d 3 r
2

hv

Bien que cette équation soit valide quand ψ est normalisé de manière appropriée, elle est utile
seulement si ψ est connu dans la région où VI ≠ 0 .

Décalages de phase complexes


Si le potentiel est à symétrie sphérique, la méthode des ondes partielles peut être employée que V
soit complexe ou non. La discussion sur le comportement asymptotique de la section précédente a
montré que les décalages de phase sont réels si le potentiel l'est. Le même argument montre que δ l
est généralement complexe si V est complexe et ainsi nous posons
(5) δ l = α l + iβ l
où α l et β l sont réel et nous définissions aussi
2 iδ l 2 iα l − 2 β l
(6) S l ≡ e =e

La dérivation de l'expression pour l'amplitude de diffusion est inchangée, ainsi l'équation devient

(7) f (θ ) = (2ik ) ∑ (2l + 1)(S − 1)Pl (cosθ )
−1
l
l =0

La section efficace différentielle élastique est f (θ ) et la section efficace totale élastique est
2

π
σ el = 2π ∫ f (θ ) sin θdθ
2
0

∑ (2l + 1)(1 − 2e )
π ∞
− βl −4 βl
(8) = 2
cos 2α l + e
k l =0

π ∞
= ∑ (2l + 1)1 − S
2
2 l
k l =0
Elle se réduit à l'expression que nous avons vue quand β l = 0 comme attendu.

La section efficace d'absorption peut aussi être exprimée en fonction des décalages de phase.
Comme signalé ci-dessus, elle est égale à − v −1 ∫ S n dA où il est maintenant pratique de choisir la
A
surface A comme une grande sphère de rayon r :
1 2π π
σ abs = − lim r 2 ∫ ∫ S r sin θdθdφ
v r →∞ 0 0
(9)
1 π
= − lim 2πr 2 ∫ S r sin θdθ
v r →∞ 0

Le flux radial est


h  ∗ ∂u ∂u ∗ 
(10) S r = u − u 
2iµ  ∂r ∂r 

La dérivée de u (r ,θ ) donné au début de la section précédente donne


∂u ∞
1 ∂χ l  1
(11) =∑ Pl (cosθ ) + O 2 
∂r l =0 r ∂r r 
tel que (9) devient
2πi ∞ 1  ∗ ∂χ l ∂χ l∗ 
(12) σ abs = ∑  χl
k l =0 2l + 1  ∂r

∂r
χ l 

évalué en r = ∞ .

La forme asymptotique de Rl (r ) vue dans la section précédente montre que


2
 ∗ ∂χ l ∂χ l∗  A
 χl
 − χ l  → l [sin (kr − 12 lπ + α l − iβ l ) cos(kr − 12 lπ + α l + iβ l )
 ∂r ∂r  r →∞ k
(13) − cos(kr − 12 lπ + α l − iβ l )sin (kr − 12 lπ + α l + iβ l )]
2 2
Al i Al
= sin (− 2iβ l ) = − sinh 2 β l
k k

= (2l + 1) e
2 2 −2 β l
La substitution dans (12) et l'expression Al conduit à

∑ (2l + 1)(1 − e )
π ∞
−4 β l
σ abs = 2
k l =0
(14)
∑ (2l + 1)(1 − S )
π ∞
2
= 2 l
k l =0

Nous nous attendons donc à ce que β l ≥ 0 .

La section efficace totale est définie comme la somme des sections efficaces élastiques et
d'absorption. Avec (8) et (14), on a
2π ∞
(
σ tot = 2 ∑ (2l + 1) 1 − e l cos 2α l
k l =0
−2 β
)
(15)
2π ∞
= 2 ∑ (2l + 1)[1 − Re(S l )]
k l =0

Relations asymptotiques
Trois relations utiles et intéressantes, le théorème de réciprocité, le théorème optique généralisé et
le théorème optique, peuvent être dérivées à partir de considérations sur le comportement
asymptotique de la fonction d'onde diffusée. Nous allons les obtenir dans l'ordre indiqué bien que
ce ne soit pas la séquence historique. Le théorème optique fut d'abord dérivé de cette manière par
Feenberg en 1932. Cette approche fut ensuite généralisée, pour conduite aux deux autres
théorèmes, par Glauber et Schomaker en 1953.

Il est utile de récrire la forme asymptotique de la section précédente, avec A = 1, sous une forme
qui n'insiste pas sur le rôle particulier joué par l'axe z :
(16) u k (r ) → exp(ik ⋅ r ) + r −1 f (k r , k )e ikr
r →∞

Ici l'onde plane est incidente le long de la direction k et l'amplitude f (k r , k ) correspond à la


diffusion de k vers k r qui est un vecteur qui a la grandeur k et la direction de r. Pour une autre
solution qui correspond à la direction initiale − k ′ ,
(17) u −k ′ (r ) → exp(− ik ′ ⋅ r ) + r −1 f (k r ,−k ′)e ikr
r →∞

Puisque u k (r ) et u −k ′ (r ) satisfont tous les deux l'équation de Schrödinger avec la même valeur de
E, il s'ensuit que
(18) u −k ′ ∇ 2 u k − u k ∇ 2 u −k ′ = 0
que V soit réel ou complexe.

L'équation (18) peut être intégrée sur un grand volume sphérique Ω de rayon r et cette intégrale
peut être transformée en une intégrale sur la surface de la sphère :
∂u ∂u 
( ) 2π π 
(19) ∫ u −k ′ ∇ 2 u k − u k ∇ 2 u −k ′ d 3 r = r 2 ∫ ∫  u −k ′ k − u k −k ′  sin θ r dθ r dφ r = 0
Ω ∂r ∂r 
0 0

où θ r , φ r sont les angles polaires de r par rapport à un axe polaire choisi arbitrairement. La
substitution des formes asymptotiques (16) et (17) donne à la limite des grands r
2π π   ik 1
r 2 ∫ ∫ ik (cosθ + coθ ′)e ikr (cosθ −cosθ ′ ) +  (1 + cosθ ′) − 2  f (k r , k )e ikr (1−cos θ ′ )
0 0
 r r 
(20)
 ik 1 
−  (1 − cosθ ) − 2  f (k r ,−k ′)e ikr (1+cos θ )  sin θ r dθ r dφ r = 0
r r  
où θ est l'angle entre k et r et θ ′ est l'angle entre k ′ et r. Le premier terme dans l'intégrand
s'annule sur l'intégration sur les directions de r puisque pour toute paire d'angles θ , θ ′ il y a une
paire qui s'annule avec π − θ ′ , π − θ . Les termes en 1 / r 2 dans l'intégrand ainsi que les autres
termes en 1 / r 2 qui ont été ignorés dans le développement de (16) peuvent être négligés pour une
raison qui deviendra claire dans la discussion de (22) ci-dessous.

Il nous reste donc l'équation

∫ [(1 + cosθ ′) f (k ]
2π π
(21) ikr ∫ r , k )e ) ik (1−cos θ ′ ) − (1 − cosθ ) f (k r ,−k ′)e ikr (1+cos θ ) sin θ r dθ r dφ r = 0
0 0
qui doit être évaluée à la limite r → ∞ . Dans le premier terme, nous pouvons décaler l'axe polaire
de son choix initial arbitraire vers la direction k ′ et donc remplacer les variables d'intégration θ r ,
φ r par θ ′ , φ ′ . Alors, avec w ≡ cosθ ′ , nous considérons l'intégrale
(22) r ∫ F (w, φ ′)e ikr (1− w ) dw
1

−1

à la limite des grands r, où F (w, φ ′) ≡ ik (1 + w) f (k r , k ) . L'intégration par partie donne


1
∂F ikr (1− w )
(23) F (w, φ ′)e ikr (1− w )
i i 1

k −1

k ∫ −1 ∂w
e dw

On voit que des intégrations par partie supplémentaires conduiraient successivement à des
puissances de plus en plus grandes de r au dénominateur et ainsi seuls les premiers termes doivent
être gardés à la limite r → ∞ . C'est la raison pour laquelle les termes mentionnés ci-dessus en 1 / r 2
pouvaient être négligés. Nous trouvons donc que la limite de (22) est
[
(24) F (1, φ ′) − F (− 1, φ ′)e 2ikr
i
k
]
Avec la forme ci-dessus de F (w, φ ′) , nous voyons que F (− 1, φ ′) = 0 . Cependant le second terme de
(24) pourrait avoir été éliminé avant puisque le facteur e 2ikr oscille autour de zéro lorsque r → ∞ .
C'est une application de la méthode des phases stationnaires qui est quelque fois utile pour obtenir
des expressions asymptotiques des intégrales. Dans ce cas, le point w = 1 est appelé point de phase
stationnaire, puisque la phase de l'intégrand de (22) est stationnaire lorsque w approche l'unité.
Théorème de réciprocité
Le point de phase stationnaire du premier terme de (22) est cosθ ′ = 1 ou θ ′ = 0 . Cela correspond à
r le long de k ′ ou la substitution de k ′ à k r dans l'amplitude de diffusion f (k r , k ) . De plus,
l'intégrand ne dépend pas de φ ′ et ainsi l'intégration sur φ ′ introduit seulement un facteur
multiplicatif 2π . De même, le deuxième terme dans (22) a son point de phase stationnaire en
cos α = −1 ou θ = π , tel que k r est remplacé par -k dans f (k r ,−k ′) .

Nous obtenons donc le théorème de réciprocité


(25) f (k ′, k ) = f (− k ,−k ′)
qui dit que l'amplitude de diffusion de k à k ′ est égale à l'amplitude de diffusion pour la direction
finale renversée − k ′ à la direction initiale renversée -k. Il est important de noter que ce théorème
est valide que V soit réel ou complexe.

Il arrive souvent que V (r ) = V (− r ) tel que V possède une symétrie par inversion de l'espace. Alors,
tous les vecteurs dans le problème de diffusion peuvent être inversés sans altérer la situation
physique et nous avons que
(26) f (− k ,−k ′) = f (k , k ′)

La combinaison de (25) et (26) conduit à un théorème de réciprocité spécialisé :


(27) f (k ′, k ) = f (k , k ′)

Théorème optique généralisé


La procédure suivie dans les deux sous sections précédentes peut maintenant être répétée avec u k∗′
au lieu de u −k ′ . Alors l'équation (18) est remplacée par
4iµ
(28) u k∗′ ∇ 2 u k − u k ∇ 2 u k∗′ + 2 V I u k∗′ u k = 0
h

L'intégration sur un grand volume sphérique Ω de rayon r conduit à


2π π  ∗ ∂u k ∂u k∗′  4iµ
(29) r 2
∫ ∫  u k ′ − uk  sin θ r dθ r dφ r + 2 ∫Vu

k′ uk d 3 r = 0
∂r ∂r  Ω I
0 0
 h

La substitution des formes asymptotiques comme (16) dans le premier terme donne alors à la limite
de r grand
2π π   ik 1
r 2 ∫ ∫ ik (cosθ + cosθ ′)e ikr (cos θ −cos θ ′ ) +  (1 + cosθ ′) − 2  f (k r , k )e ikr (1−cosθ ′ )
0 0
 r r 
 ik 1 
(30) +  (1 + cosθ ) + 2  f ∗ (k r , k ′)e −ikr (1−cos θ ) + 2 f ∗ (k r , k ′) f (k r , k ) sin θ r dθ r dφ r
2ik
r r  r 
4iµ
+ 2 ∫ VI u k∗′ u k d 3 r = 0
h
où l'intégrale de volume est maintenant sur tout l'espace.

Comme avant, le premier terme donne zéro et les termes qui sont produits de 1 / r 2 et
d'exponentielles peuvent être négligés. Les deux termes exponentiels restant peuvent être évalués
par la méthode des phases stationnaires. Le premier terme a son point de phase stationnaire au
même endroit : cosθ ′ = 1 ou k r = k ′ . Cependant, le second terme a maintenant son point de phase
stationnaire en cosθ = 1 ou k r = k plutôt qu'en k r = −k comme avant. Il y a aussi un changement
de signe qui vient du signe altéré dans l'exponentielle. L'équation (30) devient donc
2π π 4iµ
(31) − 4πf (k ′, k ) + 4πf ∗ (k , k ′) + 2ik ∫ ∫ f ∗ (k r , k ′) f (k r , k ) sin θ r dθ r dφ r + 2 ∫ V I u k∗′ u k d 3 r = 0
0 0 h

Comme telle, cette relation n'est pas utile car le dernier terme est difficile à évaluer et n'a en général
pas d'interprétation physique simple. Nous considérons donc d'abord le cas où V est réel et donc
VI = 0 . L'équation (31) est alors appelée théorème optique généralisé :
2πi ∗
0
2π π
(32) ∫ ∫ f ∗ (k r , k ′) f (k r , k )sin θ r dθ r dφ r =
0 k
[
f (k , k ′) − f (k ′, k ) ]
Si V possède une inversion par symétrie, la relation (27) peut être utilisée pour simplifier cette
relation :

Im[ f (k ′, k )]
2π π
(33) ∫ ∫ f ∗ (k ′, k r ) f (k r , k )sin θ r dθ r dφ r =
0 0 k

Il est important de noter que les équations (31) et (32) sont valides seulement si V est réel.

L'équation (33) peut être utilisée en conjonction avec l'approximation de Born, que nous verrons
plus tard, de la manière suivante. L'approximation de Born donne une expression approchée
extrêmement simple pour l'amplitude de diffusion f qui est du premier ordre en V et ce f est réel
quand V est réel. L'équation (33) nous permet donc de calculer la partie imaginaire de f qui est à
l'ordre le plus bas en V et de montrer qu'elle est en réalité du second ordre.

Théorème optique
Il y a une situation dans laquelle l'intégrale de volume dans (31) a une interprétation physique
simple, c'est-à-dire quand k ′ = k . Alors, en accord avec (4),
1
(34) ∫ V I u k∗ u k d 3 r = hvσ abs
2
puisque la normalisation de u k est en accord avec celle utilisée plus tôt pour ψ . Alors l'équation
(31) devient

Im[ f (k , k )]
2π π
(35) ∫ ∫ f (k r , k ) sin θ r dθ r dφ r + σ abs =
2
0 0 k

Le premier terme sur le coté gauche est la section efficace totale élastique σ el tel que le coté
gauche est égal à σ tot .

Nous obtenons donc le théorème optique :



(36) σ tot = σ el + σ abs = Im[ f (k , k )]
k
C'est une généralisation de la section efficace totale vue dans la section précédente en ce qu'elle
s'applique même quand V n'est ni à symétrie sphérique ni réel. En réalité, le théorème optique est
même valide plus généralement que ce qu'indique la phrase précédente car il peut être dérivé dans
référence à un potentiel. Tout ce qui est nécessaire est la forme asymptotique de la densité de
courant de probabilité S (r, t ) obtenue avec (16). Alors, l'intégrale de sa composante radiale sur une
sphère infinie est proportionnelle au taux de disparition des particules de l'onde plane plus l'onde
diffusée et donc est proportionnelle à σ abs . L'équation (36) suit alors immédiatement de
l'application de la méthode des phases stationnaires. Le théorème optique est également valide
quand la relativité restreinte est prise en compte.

On voit que f (k , k ) entre dans le théorème optique à travers une interférence entre les ondes
planes et diffusées dans (16). Cette interférence est caractérisée par le facteur de phase e ikr (1−cos θ )
qui, comme fonction de θ , oscille rapidement autour de zéro pour de grands r excepté dans le
voisinage de θ = 0 . Donc, la densité de courant de probabilité asymptotique consiste en une partie
de l'onde plane seule qui est partout dans la direction k, une partie de l'onde diffusée seule qui est
toujours radialement sortante et qui s'intègre en σ el et une partie qui vient de l'interférence. Cette
dernière est appréciable seulement quand kr (1 − cosθ ) ≤ 1 et proche de 1. Pour de grands kr et de

petits θ , c'est équivalent à θ ≤ (kr ) 2 . Dans cette région angulaire, l'onde diffusée interfère de
1

manière destructive avec l'onde plane enlevant donc de l'onde plane juste assez du flux incident
pour prendre en compte l'absorption et la diffusion inélastique et toute la diffusion élastique sauf
pour les angles infinitésimaux.

Dans la région asymptotique, ce domaine angulaire d'interférence peut être vu comme un résidu de
l'ombre qui ne peut pas s'étendre au-delà d'une distance rs telle que la partie qui interfère ou la
partie imaginaire de l'amplitude diffusée en avant, Im[ f (k , k )] / rs est de l'ordre de l'amplitude de
l'onde plane, qui est l'unité, et donc rs ~ Im[ f (k , k )] ~ kσ tot . A cette distance limite, le diamètre de

l'ombre est d ~ (rs / k ) 2 ~ (σ tot ) 2 . Maintenant, σ tot est de l'ordre du carré du diamètre du diffuseur
1 1
à la limite classique ou des courtes longueurs d'ondes. Donc le diffuseur et l'ombre sont à peu près
de la même taille à la distance limite où l'ombre existe, comme on s'y attendrait.
V.5. Diffusion par un champ coulombien
On avait noté plus tôt que le champ coulombien est un diffuseur exceptionnel en ce qui concerne
l'application de la méthode des ondes partielles. Si V (r ) = ZZ ′e 2 / r pour une collision entre des
particules de charge Ze et Z ′e , il est facile de voir que la relation (3) de la section sur la diffusion
par un potentiel sphérique devient
(1) χ l (r ) ∝ e ± i (kr −n ln r )

Ici n = µZZ ′e 2 / h 2 l = ZZ ′e 2 / hv où v est la vitesse relative et µ la masse réduite. Donc, les


solutions radiales n'approchent jamais les solutions sinusoïdales des particules libres puisqu'il y a
toujours une contribution logarithmique à la phase à grande distance qui ne peut pas être négligée.
Bien qu'il soit encore possible d'obtenir une solution de ce problème de diffusion en coordonnées
sphériques (nous verrons cela plus loin), les décalages de phase δ l que nous avions introduit sont
altérés de manière significative. Cette section présente le travail analytique dans les grandes lignes
et indique les principaux résultats d'un traitement plus approfondi.

Coordonnées paraboliques
Aussi longtemps que σ (θ ) pour un champ coulombien pur est tout ce qui souhaité, il est plus
simple de travailler avec la séparation de l'équation de Schrödinger en coordonnées paraboliques
qu'en coordonnées sphériques. La raison en est que la solution désirée dépend presque entièrement
de la variable ξ définie ci-dessous et pas des deux autres variables η et φ .

Les coordonnées paraboliques ξ , η et φ sont données en fonction des coordonnées sphériques par
les relations
ξ = r − z = r (1 − cosθ )
(2) η = r + z = r (1 + cosθ )
φ =φ
Les surfaces de ξ constant sont un ensemble de paraboloïdes confocaux de révolution autour de
l'axe z ou axe polaire avec le foyer à l'origine qui sont ouvert dans la direction des z positifs ou
θ = 0 . Les surfaces de η constant sont des ensembles similaires de paraboloïdes confocaux qui
s'ouvrent dans la direction des z négatifs ou θ = π . Les surfaces de φ constant sont les mêmes
qu'en coordonnées sphériques : des plans autour de l'axe polaire.

L'équation de Schrödinger pour un potentiel coulombien en coordonnées paraboliques est


h 2  4  ∂  ∂u  ∂  ∂u  1 ∂ 2 u  2 Ze 2
(3) −   ξ + η  + − u = Eu
2 µ ξ + η  ∂ξ  ∂ξ  ∂η  ∂η  ξη ∂φ 2  ξ + η

La séparation est obtenue en substituant


(4) u (ξ ,η , φ ) = f (ξ )g (η )Φ (φ )
dans(3) et en divisant par u. La partie φ de l'équation se sépare immédiatement :
4ξη  1 d  df  1 d  dg  4µZe 2ξη 2µ E ξη 1 d 2Φ
(5)   ξ  +  η   + − = −
ξ + η  f dξ  dξ  g dη  dη  h 2 (ξ + η ) h2 Φ dφ 2

Puisque le coté gauche de (5) dépend seulement de ξ et η et le coté droit seulement de φ , les deux
cotés doivent être égaux à une constante que nous appelons m 2 . Cela donne la solution en φ
normalisée :
(6) Φ m (φ ) = (2π ) 2 e imφ
1

Le reste de l'équation (5) peut être séparé en parties ξ et η :


1 d  df  m 2 µ E µZe 2  1 d  dg  m 2 µ E 
(7)  ξ  − − 2 ξ + 2 = − η  − − 2 η = ν
f dξ  dξ  4ξ 2h h  g dη  dη  4η 2h 
où la constante de séparation ν est déterminée par les conditions aux limites. Donc les équations
pour f et g sont
d df   m 2 µ E ξ µZe 2 
 ξ  −  + − 2 + ν  f = 0
dξ  dξ   4ξ 2h 2
h 
(8)
d  dg   m 2 µ E η 
η  −  + − ν  g = 0
dη  dη   4η 2h 2

Puisque ces deux équations sont de la même forme et diffèrent seulement dans leurs termes
constants, il est suffisant d'en résoudre une.

Il est apparent que la solution n'impliquera pas φ à cause de la symétrie axiale du problème. Si
maintenant le terme e ikz de l'onde plane incidente est sorti comme facteur, il est plausible que le
reste de la solution n'implique pas η . Nous posons
(9) u c = e ikz f
où u c représente la fonction d'onde coulombienne complète (onde incidente plus diffusée).
Maintenant u c doit contenir une partie dont le comportement asymptotique dominant est de la
forme r −1e ikr mais aucune partie qui se comporte comme r −1e −ikr . Puisqu'une expression
e ikz f (r − z ) peut être de cette forme tandis qu'une expression e ikz f (r + z ) ne le peut pas, nous
anticipons que la fonction f apparaissant dans (9) dépendra seulement de ξ = r − z . Nous
substituons (2) dans (3) après avoir remplacé Z par − ZZ ′ et en nous souvenant que E > 0 .
L'équation différentielle pour f est alors
d2 f
+ (1 − ikξ )
df
(10) ξ − nkf = 0
dξ 2

L'équation hypergéométrique confluente


d 2F
(11) z 2 + (b − z )
dF
− aF = 0
dz dz
qui a la solution F (a, b, z ) est équivalente à (10) si nous posons
(12) f (ξ ) = CF (− in,1, ikξ )
où C est une constante.

Fonction hypergéométrique confluente


La solution de (11) qui est régulière en z = 0 peut être écrite comme un développement en série :

Γ(a + s )Γ(b )z s
F (a, b, z ) = ∑
s = 0 Γ (a )Γ (b + s )Γ (1 + s )
(13)
az a (a + 1)z 2
= 1+ + +L
b1! b(b + 1)2!

Il est utile de poser F (a, b, z ) = W1 (a, b, z ) + W2 (a, b, z où W1 et W2 sont séparément solutions de


(11). Un développement asymptotique pour F peut alors être obtenu à partir des relations suivantes
:
Γ(b )
W1 (a, b, z ) = (− z )−& g (a, a − b + 1,− z )
Γ(b − a )
Γ(b ) z a −b
(14) W2 (a, b, z ) = e z g (1 − a, b − a, z )
Γ(a )
αβ α (α + 1)β (β + 1)
g (α , β , z ) → 1 + + +L
z →∞ z1! z 2 2!

La solution de (11) qui est régulière à l'origine peut être prise comme
(15) G (a, b, z ) = iW1 (a, b, z ) − iW2 (a, b, z )

Nous prendrons la solution non régulière pour les problèmes dans lesquels le champ coulombien ne
s'étend pas en r = 0.

La forme asymptotique de la fonction d'onde coulombienne peut être obtenue à partir des équations
(1), (12) et (14). Le résultat à des termes de l'ordre r −1 est
1

2  i [kz + n ln k (r − z )]  n2  
+ r −1 f c (θ )e i (kr − n ln 2 kr ) 
Ce
(16) u c → e 1 + 
r →∞ Γ (1 + in )
  ik (r − z )  

 1 
−in ln  sin 2 θ 
Γ(1 + in ) e  2 
f c (θ ) =
iΓ(− in ) 1
2k sin 2 θ
2
 1 
n −in ln  sin 2 θ  + iπ + 2 iη 0
(17) = e  2 
1
2k sin θ 2

2
η 0 = arg Γ(1 + in )

Rappelons que la fonction arg pour un nombre complexe est définie comme φ = arg z avec
z = z e iφ .

Section efficace de diffusion et renormalisation


Le terme f c sur le coté droit de (16) représente l'onde diffusée sortante puisque c'est le seul terme
dans lequel le facteur r −1e ikr apparaît. Le premier terme dans (16) correspond de même à l'onde
incidente "plane". Le facteur multiplicatif − n 2 / ik (r − z ) peut être ignoré dans la région
asymptotique. Les ondes incidentes et diffusées sont déformées à des distances infinies par des
facteurs de phase logarithmiques. La section efficace différentielle de diffusion est
2
 
σ c (θ ) = f c (θ )
n
=  
2

 2k sin 2 θ 
2 1

(18)
2
 ZZ ′e 2 
=  2 
 cosec 4 12 θ
 2 µv 
C'est exactement la formule obtenue par Rutherford à partir de la dynamique classique et qui a été
vérifiée expérimentalement par les collisions de particules alpha (noyaux d'hélium) avec des
noyaux lourds. On notera, cependant, que la partie dépendant de l'angle du facteur de phase dans
l'amplitude diffusée f c (θ ) donnée dans l'équation (17) peut se manifester de manière non classique
quand les particules qui se heurtent sont identiques (on verra cela plus tard).

Si le flux incident est normalisé au flux unité, la constante C doit être choisie comme
1 1
− − nπ
(19) C = v Γ(1 + in )e 2 2

et la fonction d'onde coulombienne est ainsi


1 1
− − nπ
u c = v 2 Γ(1 + in )e 2
e ikr F (− in,1, ikξ )
(20)
( )
1 1
− − nπ
= v 2 Γ(1 + in )e 2
e ikr cos θ F − in,1,2ikr sin 2 12 θ

Alors la densité de particules en r = 0 est trouvée à partir du développement en série (13) comme
u c (0) = C = v −1 Γ(1 + in ) e − nπ
2 2 2

(21) 2nπ
=
(
v e 2πn − 1 )
Pour de petites vitesses de collision ( n >> 1 ), l'équation (21) nous dit que
2π n
u c (0 ) ≈ cas attractif, n < 0
2

v
(22)
2π n
u c (0 ) ≈ e −2 nπ cas répulsif, n > 0
2

La deuxième équation (22) a un certain intérêt pratique. L'exponentielle est le facteur dominant
dans le taux de réactions entre des noyaux positivement chargés pour des énergies de
bombardement faibles, quand le rayon nucléaire peut être supposé suffisament petit pour que les
noyaux qui se heurtent passent à travers la barrière de potentiel par effet tunnel jusqu'à la distance
2
zéro afin d'initier une réaction. Dans ce cas, E −2πZZ ′e / hv est appelé le facteur de Gamow et c'est le
terme dominant dans le taux de plusieurs réactions nucléaires pour de faibles énergies de
bombardement.

Solution en coordonnées sphériques


Dans les problèmes de collisions nucléaires, tel que celui de la diffusion de protons de plusieurs
millions d'électrons volts dans l'hydrogène, l'écart à la loi de Coulomb de l'interaction à courte
distance entre les particules en collision peut affecter la section efficace de diffusion. De tels
problèmes peuvent être traités par une modification de la méthode des ondes partielles développée
précédemment dans laquelle un développement en harmoniques sphériques est fait pour le pur
champ coulombien et des modifications introduites pour les premières valeurs de l. Afin d'appliquer
une telle technique, nous souhaitons d'abord une solution pour la diffusion purement coulombienne
en ondes partielles sphériques.

Nous posons

(23) u c = ∑ Rl (r )Pl (cosθ )
l =0
où l'équation de Schrödinger radiale est
1 d  2 dRl   2 2nk l (l + 1) 
(24) 2 r + k − − Rl = 0
r dr  dr   r r 2 

Si nous substituons Rl (r ) = r l e ikr f l (r ) , l'équation pour f l devient


d 2 fl
+ [2ikr + 2(l + 1)] l + [2ik (l + 1) − 2nk ] f l = 0
df
(25) r 2
dr dr

C'est l'équivalent de l'équation hypergéométrique confluente (11) et elle a comme solution régulière
en r = 0
(26) f l (r ) = C l F (l + 1 + in,2l + 2,−2ikr )
La forme asymptotique de (26) peut être trouvée de (14) et donne pour la fonction d'onde radiale à
grande distance
1
nπ + iηl
Γ(2l + 2 )
sin (kr − 12 lπ − n ln 2kr + η l )
2
Cl e
(27) Rl (r ) →
r →∞(2k ) Γ(l + 1 + in )kr
l

où η l = arg Γ(l + 1 + in ) .

Les coefficients C l doivent être déterminés tel que le développement en ondes partielles (23) soit
identique avec la solution (20) en coordonnées paraboliques. A cause de l'orthogonalité des
polynômes de Legendre, nous avons la relation
2l + 1 π
(28) Rl (r ) = Pl (cosθ )u c (r ,θ )sin θdθ
2 ∫0
où u c (r ,θ ) est donné par la deuxième équation (20). L'évaluation complète de cette intégrale peut
être évitée en utilisant le fait que nous savons tout de la fonction Rl (r ) excepté le facteur
multiplicatif C l . C l peut être trouvé en faisant correspondre la forme connue de Rl (r ) de (12) près
de r = 0. C'est-à-dire
1
− nπ

(29) C l =
(2ik ) el 2
Γ(l + 1 + in )
1
v (2l )!
2

Nous obtenons donc comme expression alternative à (20)


− nπ ∞ Γ (l + 1 + in )
1 1

(30) u c = v e 2 ∑
2
(2ikr )l e ikr F (l + 1 + in,2l + 2,−2ikr )Pl (cosθ )
l =0 (2l )!
Il est aussi possible de développer f c (θ ) donné par (17) en une série de polynômes de Legendre.
Le résultat est
1 ∞
(31) f c (θ ) = ∑ (2l + 1)e 2iηl Pl (cosθ )
2ik l =0
Cela semble surprenant au premier abord puisque f c (θ ) ne semble pas s'annuler à la limite n → 0 ,
ce qui correspond à aucune interaction. Nous obtenons à la place
1 ∞
(32) lim f c (θ ) = ∑ (2l + 1)Pl (cosθ )
n →0 2ik l =0

La série sur la droite peut être sommée pour donner



(33) ∑ (2l + 1)P (cosθ ) = 4δ (1 − cosθ )
l =0
l

L'équation (33) peut être vérifiée en multipliant des deux cotés par Pl ′ (cosθ ) et en intégrant
sin θdθ de 0 à π et en se souvenant que l'intégrale sur la droite est effectuée sans passer par le
point θ = 0 . Nous trouvons donc que f c (θ ) s'annule effectivement à la limite n → 0 pour θ ≠ 0
mais qu'elle a une singularité de Dirac en θ = 0 telle que
θ
(34) lim ∫ 0 f c (θ ) sin θdθ = −
i
n →0 0 k
pour toute valeur finie θ 0 . L'équation (34) est facilement vérifiée par intégration directe de (17)
pourvu que la valeur de l'intégrale à la limite inférieure soit interprétée comme la moyenne de sa
valeur en ε lorsque ε → 0 . Ce comportement particulier vient du caractère longue portée du
champ coulombien. Peut importe la faiblesse de l'interaction elle force toujours les particules qui
passent à grande distance à être déviée d'un très petit angle.

Champ coulombien modifié


Si le potentiel réel dévie de la forme coulombienne pour seulement de petites valeurs de r, nous
nous attendons, en analogie avec le traitement des ondes partielles, que seules les premiers termes
de (30) soient altérés. Puisque chaque fonction d'onde radiale partielle doit être une solution de (24)
en dehors de l'anomalie de potentiel, le seul changement que nous pouvons faire dans la fonction
f l et être encore une solution de (25) est d'ajouter une certaine fonction irrégulière
G (l + 1 + in,2l + 2,−2ikr ) défini par (15). La manière avec laquelle G est ajoutée est déterminée par
l'exigence que la fonction d'onde complète doit représenter asymptotiquement une onde
coulombienne incidente plus diffusée plus une onde diffusée supplémentaire sortante.

Nous devons donc substituer à chaque terme F dans (30) une combinaison linéaire de F et G dans
laquelle la quantité du terme entrant W2 est inchangée. Une telle combinaison est
(35) eiδ l (F cos δ l + G sin δ l ) = W1e 2iδ l + W2

La fonction d'onde modifiée, qui est une solution de l'équation de Schrödinger sortante de
l'anomalie de potentiel, peut alors être écrite
− nπ ∞ Γ(l + 1 + in )
( )
1 1

(36) um = uc + v e 2 ∑
2
(2ikr )l eikr e 2iδ l − 1 W1 (l + 1 + in,2l + 2,−2ikr )Pl (cosθ )
l =0 (2l )!
La forme asymptotique de u m est
1 ∞
sin (kr − 12 lπ − n ln 2kr + ηl + δ l )Pl (cosθ )

(37) um → v
r →∞
2
∑ (2l + 1)i e (η δ ) (kr )
l =0
l i l+ l −1

Comme montré en relation avec la forme asymptotique de χ l dans l'analyse des potentiels
sphériques, si V est réel, chaque terme sur le coté droit de (37) doit être une fonction réelle de r
excepté pour des facteurs multiplicatifs complexes, tel que δ l soit être réel.

Les décalages de phase supplémentaires δ l peuvent être trouvés en faisant correspondre chaque
onde radiale partielle dans (36) avec la solution intérieure au bord de l'anomalie de potentiel,
exactement de la même manière que les décalages de phase furent trouvés dans l'analyse des
potentiels sphériques. Bien que les décalages de phase δ l représentaient l'écart de la fonction
d'onde à celle d'une particule libre, elles représentent ici l'écart de la fonction d'onde à celle d'une
particule diffusée par un champ coulombien pur. Le calcul de δ l dans (36) nécessite la
connaissance de G pour de petits r. Les formules ont été données par Yost, Wheeler et Breit en
1936. On peut montrer à partir de (36) que la forme asymptotique de u m peut être écrite sous la
forme (16) où f c (θ ) est remplacée par

( )
(38) f m (θ ) = f c (θ ) + ∑ k −1 (2l + 1)e sin δ l Pl (cosθ )
i 2ηl +δ l

l =0

La section efficace différentielle de diffusion est juste f m (θ ) et contient en général des termes
2

d'interférence entre l'amplitude de diffusion coulombienne f c (θ ) et les termes supplémentaires qui


sont déterminés par les δ l .

Il est important de noter que ces δ l ne sont pas égaux à ceux qui seraient obtenus de l'anomalie de
potentiel en l'absence du champ coulombien.

Limite classique pour un champ coulombien pur


Comme cela a déjà été discuté, nous nous attendons à ce que les résultats des théories quantiques et
classiques coïncident quand il est possible de construire des paquets d'ondes qui suivent la
trajectoire classique sans se disperser de manière appréciable et qui sont assez petits pour que les
forces soient sensiblement constantes sur leurs dimensions. La plus petite dispersion d'un paquet
d'ondes durant un intervalle de temps t fut trouvée être de l'ordre de (ht / µ ) 2 ou (hd / µv ) 2 = (Dd ) 2
1 1 1

où d = vt est la distance parcourue par le paquet d'ondes durant le temps t et D ≡ λ / 2π = h / µv est


la longueur d'onde réduite du mouvement relatif. Donc, la théorie classique peut être utilisée quand
(Dd ) 2<< d ou (d / D ) 2 >> 1 où d est la distance sur laquelle la force varie d'une fraction
1 1

appréciable. Pour un champ coulombien répulsif, d est de l'ordre de la distance classique


d'approche ZZ ′e 2 / 12 µv 2 . Cela fournit aussi une estimation utile pour un champ coulombien
attractif puisque dans toutes les collisions, excepté le nombre relativement faible où les particules
sont diffusées sur de grands angles, elles ne vont jamais plus proche que cette distance.

La condition pour la validité de la théorie classique est alors


1
ZZ ′e 2
(39) n 2 = >> 1
hv
De grands n impliquent que la partie dépendant de l'angle de la phase de f c (θ ) donnée par (17)
varie rapidement avec θ afin que ces oscillations rapides dans l'amplitude de diffusion aient peu
d'effet sur la diffusion quand les particules sont identiques.

Il est intéressant de noter que pour le champ coulombien, la limite classique est approchée pour de
petits v tandis que pour des potentiels qui ont un domaine fini a tels que ceux discutés
précédemment, la limite classique est approchée quand (a / D ) 2 >> 1 , c'est-à-dire pour de grands v.
1

Cela est dû à la "taille" ZZ ′e 2 / µv 2 du champ coulombien qui s'accroît plus rapidement que
D = h / µv lorsque v décroît.
Exercices
1. Montrez que les coefficients de diffusion par un puits de potentiel carré à une dimension sont
donnés par l'équation (7) de la section V.1 si le signe de V0 y est changé ainsi que dans
l'expression de α . Discutez de la dépendance du coefficient de transmission avec E dans ce
cas.
2. Montrez que les équations (10) et (13) de la section V.2 sont valides pour une collision binaire
générale si γ est donné par (11). Utilisez la conservation de l'énergie et de la masse.
3. Montrez que quand une particule de masse m1 entre en collision élastique avec une particule de
masse m2 qui est initialement au repos, toutes les particules éjectées (de masse m2 ) sont
diffusées dans l'hémisphère avant dans le système de coordonnées du laboratoire. Si la
distribution angulaire est à symétrie sphérique dans le système du centre de masse, quelle est-
elle pour m2 dans le système du laboratoire ?
4. Exprimez la fonction d'onde diffusée (1) de la section V.3 hors du potentiel de diffusion (mais
pas nécessairement dans la région asymptotique) comme la somme d'une onde plane et d'une
série infinie de fonctions de Hankel sphériques du premier type (voir les équations (13) de la
section IV.3). A partir de cette expression et de la discussion des équations (14) de la section
IV.3, montrez que l'onde diffusée est purement sortante même dans la région asymptotique.
5. Deux objets A et B, ont des formes irrégulières et sont identiques en taille et forme. L'objet A
est remplit avec un potentiel positif infini (impénétrable) et diffuse des particules de masse m.
L'objet B est fait de métal et a une certaine capacité électrostatique C quand il est isolé des
autres objets. Dérivez des expressions pour les sections différentielles et totales pour la
diffusion élastique de particules de masse m par l'objet A à la limite k  0 et en fonction de la
capacité C de l'objet B.
6. Trouvez une expression générale pour le décalage de phase produit par un potentiel de diffusion
V (r ) = A / r 2 , où A > 0. La section efficace totale est-elle finie ? Si non, est-ce que la
divergence se produit pour de petits angles de diffusion ou de grands angles et pourquoi ?
Quelles modifications du calcul sont nécessaires si A < 0 ? Y a-t-il des difficultés rencontrées
dans ce dernier cas ?
7. Que doit valoir V0 a 2 pour un puits de potentiel carré à trois dimensions afin que la section de
diffusion totale soit zéro à une énergie de bombardement égale à zéro (effet Ramsauer-
Townsend) ? Trouvez le terme dominant dans les expressions des sections efficaces
différentielles et totales pour de faibles énergies de bombardement. Montrez que les ondes
partielles avec l > 2 peuvent être négligées.
8. Enoncez clairement les hypothèses qui mènent à la dérivation de l'équation (40) de la section
V.3 et vérifiez que c'est une approximation appropriée pour la section efficace totale pour de
faibles énergies de bombardement quand l'onde l = 0 est en résonance.
9. Utilisez l'équation (40) de la section V.3 et le résultat du problème 5 à la fin de la section IV.3
pour obtenir une expression approchée de la section efficace totale de diffusion par un potentiel
particulier en fonction de l'énergie de bombardement E et de l'énergie de liaison ε d'une
particule dans ce potentiel, quand E et ε sont petit par rapport à V0 .
10. Calculez et tracez en, coordonnées polaire la section efficace différentielle d'une sphère
parfaitement rigide lorsque ka = 1 / 2 en utilisant les trois premières ondes partielles (l = 0, 1,
2). Quelle est la section efficace totale dans ce cas et quelle est la précision approchée de ce
résultat quand les trois termes sont utilisés ?
11. Calculez les sections efficaces élastiques de diffusion et d'absorption pour un potentiel de la
forme V (r ) = −V0 (1 + iξ ) si r < a et V (r ) = 0 si r > a. V0 et ξ sont positifs. Supposez que k et
ξ sont très petits et qu'il n'y a ni résonance ni effet de Ramsauer-Townsend. Gardez seulement
le terme dominant en k et ξ dans chaque section efficace.
12. Montrez que l'inégalité suivante est valide pour tout potentiel :
 kσ 
2

σ el (0) ≥  tot 
 4π 
La quantité à gauche est la section efficace différentielle de diffusion élastique dans la direction
en avant.
13. Des protons de 200000 eV sont diffusés par de l'aluminium. L'intensité diffusée directement
vers l'arrière ( θ = 180° ) est trouvée égale à 96% de celle calculée avec la formule de
Rutherford. Supposez que cela est dû à une modification du potentiel coulombien à suffisament
courte portée pour que seule le décalage de phase l = 0 soit affecté. Cette modification est-elle
attractive ou répulsive ? Trouvez le signe et la grandeur du changement du décalage de phase
pour l = 0 produit par la modification.
VI. Formulation matricielle
Dans les chapitres précédents, l'équation d'onde de Schrödinger a été développée et ses solutions
obtenues dans un certain nombre de cas physiquement intéressants. Nous allons maintenant revenir
à la formulation de la mécanique quantique que nous avons partiellement utilisée au début avec la
forme matricielle, par exemple de l'hamiltonien, mais que nous allons développer de manière plus
formelle et plus systématique.

Dans cette formulation, les variables telles que les coordonnées, les composantes de l'impulsion et
l'énergie d'une particule apparaissent explicitement dans les équations du mouvement du système
sans devoir les multiplier ou différentier une fonction d'onde. Les équations classiques ont
exactement cette structure et ainsi on peut s'attendre à ce qu'il y ait une plus grande ressemblance
entre le formalisme classique et quantique ici que dans la théorie de Schrödinger.

C'est réellement le cas. La principale différence formelle est que les variables dynamiques
quantiques n'obéissent pas à la loi commutative de la multiplication. Il est pratique de représenter
de telles variables dynamiques non commutatives, qui sont souvent simplement appelées
opérateurs, comme des matrices. La théorie matricielle fournit un schéma de représentation
particulièrement flexible puisqu'il y a un nombre arbitrairement grand de manières de choisir les
lignes et les colonnes d'une matrice, toutes étant également valides.

C'est suite à cette ressemblance formelle entre la mécanique quantique matricielle et la dynamique
classique que la mécanique quantique matricielle fut historiquement la première formulation de la
théorie quantique à être découverte, par Heisenberg en 1925.

La relation entre la mécanique quantique matricielle et l'équation de Schrödinger fut établie par
Schrödinger et Eckart en 1926.

Dans ce chapitre, nous allons d'abord rappeler brièvement les plus importantes propriétés des
matrices puis montrer leur relation avec la théorie quantique et leur utilité dans des problèmes
particuliers.
VI.1. Algèbre matricielle
Nous allons restreindre notre discussion d'abord aux matrices qui ont un nombre fini de lignes et de
colonnes puis nous indiquerons comment les résultats obtenus peuvent être étendus aux matrices
qui ont un nombre infini de lignes et de colonnes.

Addition et multiplication matricielle


Une matrice est un tableau carré ou rectangulaire de nombres qui peut être ajoutée ou multipliée à
une autre matrice selon certaines règles. Nous indiquerons une matrice par une lettre majuscule,
telle que A, et les nombres ou éléments qui la composent par la même lettre avec des indices, tel
que Akl . Ici, k désigne la ligne et l la colonne où l'élément de matrice Akl apparaît. Deux matrices
peuvent être additionnées quand elles ont le même rang, c'est-à-dire le même nombre lignes et le
même nombre de colonnes. L'addition est commutative :
(1) A + B = B + A

Si la matrice somme est appelée C, alors


(2) C kl = Akl + Bkl

Une matrice peut multiplier à gauche une matrice B si le nombre de colonnes de A est égal au
nombre de lignes de B. Alors, la matrice produit C a le nombre de lignes de A et le nombre de
colonnes de B.
(3) C = AB C kl = ∑ Akm Bml
m
où la sommation se fait sur l'indice m qui indique les colonnes de A et les lignes de B. Il suit
directement de (2) et (3) que la loi de distributivité de la multiplication est valide
(4) A(B + C ) = AB + AC

De même, la loi d'associativité de la multiplication (et de l'addition) est valide :


(5) A(BC ) = ( AB )C
où le coté gauche signifie que A multiplié à gauche le produit de B et de C tandis que le coté droit
signifie que le produit de A et de B multiplie à gauche C. Le produit (5) s'écrit simplement comme
ABC et, à l'aide de (3), a la forme explicite
(6) D = ABC Dkl = ∑ Akm Bmn C nl
m,n

Il est clair, en voyant (3) que AB n'est, en général, pas égal à BA . Donc la loi de commutativité de
la multiplication n'est généralement pas valide.

Matrices nulles, unités et constantes


Pour une matrice carrée arbitraire A, la matrice nulle O est définie par les équations
(7) OA = O AO = O
d'où il suit que tous les éléments de O sont zéro. Si A n'est pas carré, les éléments de O sont encore
zéro mais les O qui apparaissent aux différents endroits dans (7) n'ont pas le même nombre de
lignes et de colonnes.

La matrice unité 1 est définie par


(8) 1 A = A B1 = B
pour des matrices arbitraires A et B. A partir de (8), il s'ensuit que 1 est une matrice carrée dont le
rang (le nombre de lignes ou de colonnes) est égal au nombre de lignes de A ou au nombre de
colonnes de B. De plus, 1 doit avoir des éléments unité le long de sa diagonale principale (k = l) et
zéro autre part tel que les éléments de 1 sont égaux au symbole de Kronecker δ kl .

Le produit d'un nombre c et d'une matrice A est la matrice cA qui est obtenue en multipliant
chaque élément de A par c. Donc, si nous définissons une matrice constante C comme un multiple
de la matrice unité tel que chaque élément non nul est c au lieu de l'unité, alors
(9) cA = CA C kl = cδ kl

Trace, déterminant et inverse d'une matrice


La trace d'une matrice, parfois appelée somme diagonale, est la somme des éléments diagonaux de
la matrice :
(10) tr ( A) = ∑ Akk
k

Il est facile de montrer, avec l'aide de (3), que la trace possède la propriété cyclique
(11) tr ( ABC L EF ) = tr (BC L EFA)

La déterminant d'une matrice carrée, noté det ( A) , est trouvé par la méthode habituelle de calcul de
déterminant d'un tableau carré de nombre. Nous ne le détaillerons pas ici. Si A et B sont carrés et
de même rang, alors
(12) det ( AB ) = det ( A) ⋅ det (B )

Une matrice peut ou non posséder une inverse A −1 qui est définie par les relations
(13) AA −1 = 1 A −1 A = 1

A est dite non singulière si elle possède une inverse et singulière sinon. Si A est non singulière et
de rang fini, on peut montrer qu'elle est carrée et qu'une des deux équations (13) implique l'autre.
L'élément kl de A −1 est juste le cofacteur de Akl divisé par det ( A) . Donc, A est singulière si son
déterminant s'annule. On vérifie facilement que pour des matrices non singulières A, B, C
(14) ( ABC ) = C −1 B −1 A −1
−1

Matrices hermitiques et unitaires


L'adjoint hermitique A + d'une matrice A est la matrice obtenue en échangeant les lignes et les
colonnes (transposée) et en prenant le complexe conjugué de chaque élément. Donc, si
(15) B = A + , alors Bkl = Alk∗

On vérifie facilement que l'adjoint hermitique du produit d'une série de matrices est le produit de
leurs adjoints dans l'ordre inverse :
(16) ( ABC ) = C + B + A +
+
Une matrice est hermitique ou auto adjointe si elle est égale à son adjoint hermitique. Donc, H est
hermitique si
(17) H = H +

Evidemment, seules les matrices carrées peuvent être hermitiques.

Une matrice est unitaire si son adjoint hermitique est égal à son inverse. Donc, U est une matrice
unitaire si
(18) U + = U −1 ou si UU + = 1 et U +U = 1

Les matrices unitaires de rang fini doivent être carrées et l'une des deux dernières relations dans
(18) entraîne l'autre.

Transformation et diagonalisation des matrices


Nous définissons la transformation d'une matrice carrée A en une matrice carrée A′ par une
matrice non singulière S par l'équation suivante :
(19) SAS −1 = A′

Il est alors évident que S −1 retransforme A′ en A.

La forme d'une équation matricielle est inaffectée par une transformation. Donc, l'équation
(20) AB + CDE = F
peut être transformée en
(21) SABS −1 + SCDES −1 = SFS −1
ce qui est équivalent à
(22) SAS −1 SBS −1 + SCS −1 SDS −1 SES −1 = SFS −1
ou
(23) A′B ′ + C ′D ′E ′ = F ′
où l'apostrophe désigne les matrices transformées. Cette invariance des équations matricielles par
rapport aux transformations rend possible de travailler avec toute transformation pratique d'un
ensemble de matrices sans affecter la validité de tout résultat obtenu. On notera aussi que tr ( A) et
det ( A) sont inchangés par une transformation.

Une matrice carrée est diagonale si elle a des éléments non nuls seulement le long de sa diagonale
principale (k = l). Les éléments diagonaux sont alors appelés les valeurs propres de la matrice. Il
est facile de voir que la puissance nième d'une matrice diagonale est aussi diagonale et a comme
valeurs propres les puissances nième des valeurs propres de la matrice originale. La matrice A dans
(19) est dite diagonalisée par la matrice S si la matrice A′ qui résulte de la transformation est
diagonale, tel que Akl′ = Ak′ δ kl . Pour trouver A′ explicitement, multiplions (19) à droite par S, où
nous supposons qu'un tel S existe.
(24) SA = A′S

L'ensemble des équations algébriques qui sont obtenues en écrivant les éléments de (24) pour une
ligne particulière k et toute colonne l est
(25) ∑ S km Aml = Ak′ S kl ou ∑ S km ( Aml − Ak′ δ ml ) = 0
m m

où Ak′ est une valeur propre particulière de A′ et l'indice m est supposé aller de un jusqu'au rang N
de la matrice A.

(25) peut être vu comme un ensemble de N équations algébriques homogènes pour les éléments de
matrice S km où k est fixé. La condition nécessaire et suffisante pour que ces équations aient une
solution est que le déterminant de leurs coefficients s'annule ou que le déterminant de la matrice
carrée ( Aml − Ak′ δ ml ) soit zéro. Cela fournit une équation algébrique simple appelée équation
séculaire, qui est d'ordre N et a N racines Ak′ . Donc, les valeurs propres de la matrice diagonale A′
résultant de A par transformation sont les mêmes quelle que soit la manière dont A est
diagonalisée, excepté peut-être pour l'ordre dans lequel elles sont arrangées. Pour cette raison elles
sont aussi appelées les valeurs propres de la matrice originale A non diagonale. On parle aussi, pour
l'ensemble des valeurs propres, du spectre. A′ et A sont dits dégénérées quand deux ou plusieurs
valeurs propres sont égales.
Il n'est pas difficile de voir qu'en général les équations qui impliquent à la fois A et A + ne sont pas
invariantes par rapport à une transformation sauf si la matrice S de transformation est unitaire.

Fonctions de matrices
Une fonction d'une matrice peut souvent être définie avec un développement en série. Donc, si
f ( z ) est un polynôme en le nombre z, alors f ( A) est le même polynôme en la matrice A. Avec des
séries infinies, on doit faire attention à la convergence. Il est évident que, si A peut être diagonalisé
et est mis sous sa forme diagonale A′ = SAS −1 , alors S transforme aussi f ( A) en la forme
diagonale f ( A′) et la kième valeur propre de f ( A′) est simplement f ( Ak′ ) . Donc, si le
développement en série f ( z ) converge quand z est égal à chaque valeur propre de A, le
développement en série S −1 f ( A′)S = f ( A) est bien défini. Cette dernière forme peut fournir une
définition utile de f ( A) même quand f ( z ) ne peut pas être représenté par un développement en
série.

Les fonctions exponentielles et trigonométriques des matrices peuvent être représentées par des
développements en séries qui convergent pour toute valeur finie de leurs arguments et donc son
( )
bien définie. Il est facile de voir, par exemple, que e A
+ +
= e A et ainsi e iH est unitaire si H est
hermitique.

Un autre résultat utile est la relation


( )
(26) det e A = e tr ( A )

Matrices de rang infini


Les règles (2) et (3) pour l'addition et la multiplication des matrices peuvent être étendues d'une
manière évidente aux matrices qui ont un nombre infini de lignes et de colonnes pourvu que la
somme infinie dans (3) converge. Nous aurons quelque fois à faire à des matrices qui ont un
nombre infini non dénombrable de lignes ou de colonnes ou les deux. Dans ce cas, un ou deux des
indices de la matrice deviennent une variable continue et la sommation habituelle sur l'indice est
remplacée par une intégration sur cette variable. Nous ne considérons pas ces possibilités en détail
ici mais nous supposons simplement que tout résultat raisonnable peut être prolongé des matrices
de rang fini à infini sans difficulté. L'affirmation qu'une matrice de rang infini est carrée signifie
que ses lignes et colonnes sont indicées de la même manière. Une matrice unitaire de rang infini n'a
pas besoin d'être carrée. Ses lignes et colonnes peuvent être indicées différemment. Par exemple, le
nombre de lignes peut être infini dénombrable et le nombre de colonnes infini non dénombrable.

En mécanique quantique, nous sommes concernés principalement par les matrices hermitiques et
unitaires, surtout de rang infini. Un théorème fondamental que nous supposerons sans preuve est
que toute matrice hermitique peut être diagonalisée par une transformation unitaire. Un corollaire
de ce théorème est que les valeurs propres résultantes de la matrice hermitique sont uniques,
excepté peut-être pour l'ordre dans lequel elles sont arrangées. En partant de ce théorème, il n'est
pas difficile de montrer que la condition nécessaire et suffisante pour que deux matrices
hermitiques puissent être diagonalisées par la même transformation unitaire est qu'elles commutent
(les matrices A et B commutent si AB = BA ).

Il suit aussi de ce théorème que les valeurs propres d'une matrice hermitique sont réelles. Si le S et
le A dans (19) sont unitaires et hermitiques, respectivement, cette équation peut être récrite
(27) SAS + = A′

L'adjoint hermitique de (27) est, en utilisant (16),


(28) SAS + = A′ +

Puisque A′ + = A′ , cela montre que la propriété d'hermiticité est maintenue durant les
transformations par une matrice unitaire. Si A′ est diagonale et hermitique, il suit de (15) que ses
valeurs propres sont réelles. Il est facile de voir que l'inverse est aussi vrai : une matrice qui peut
être diagonalisée par une transformation unitaire et qui a des valeurs propres réelles est hermitique.

Il est important de noter avec les matrices de rang infini que les deux équations (13) doivent être
valides pour que A −1 soit l'inverse de A. De même, les deux équations (18) doivent être valides
pour que U soit unitaire.
VI.2. Théorie des transformations
L'apparition des matrices en mécanique quantique peut être reliée d'une manière simple avec la
solution de l'équation de Schrödinger. Dans cette section, nous adoptons la notation hamiltonienne
et nous la justifierons en détail dans la section suivante. Nous récrivons la fonction de Schrödinger
comme
(1) Hu k (r ) = E k u k (r )
où l'indice k indique les différents membres de l'ensemble complet orthonormal de fonctions
propres de l'énergie u k (r ) et leurs valeurs propres correspondantes E k . k spécifie l'énergie et
distingue aussi les fonctions propres dégénérées. Elle inclut donc à la fois E et s, comme nous
l'avions vu. Par exemple, k représente k x , k y et k z , dans le cas des ondes planes et n x , n y et n z
dans le cas des fonctions propres de l'oscillateur harmonique à trois dimensions.

L'opérateur hamiltonien ou énergie H est donné par


p2 h2 2
(2) H = + V (r ) = − ∇ + V (r )
2m 2m
où nous supposerons dans ce chapitre que V est réel afin que les E k soient aussi réels. K peut être
un ensemble discret ou continu de variables, discret sur une partie de son domaine et continu sur le
reste. Nous utiliserons le symbole de sommation généralisée S ou S k pour indiquer à la fois une
sommation ∑k
sur les valeurs discrètes de l'indice k et une intégration ∫ dk sur la partie continue

de son domaine. Nous utiliserons aussi l'accent circonflexe quand il semblera désirable de
distinguer entre un opérateur comme (2) et sa matrice équivalente.

Matrice unitaire W
Supposons que nous ayons un deuxième ensemble orthonormal complet de fonctions v µ (r ) qui
sont fonctions propres d'un certain opérateur Ω avec les valeurs propres réelles ω µ :
(3) Ωv µ (r ) = ω µ v µ (r )
Ω peut, par exemple, être l'opérateur impulsion ou l'hamiltonien pour un certain potentiel différent
de celui dans (2). Les v µ peuvent être développés en fonction des u k avec les coefficients de
développement wkµ :
(4) v µ (r ) = Sw k kµ u k (r )

Les deux cotés de cette équation peuvent être multipliés par u k∗ (r ) et intégrés pour obtenir
(5) wkµ = ∫ u k∗ (r )v µ (r )d 3 r

La complétude de l'ensemble u k a été utilisée pour obtenir (4) et son orthonormalité pour obtenir
(5). De même, u k peut être développé en fonction des v µ :
(6) u k (r ) = S µ wk∗µ v µ (r )

Nous pouvons montrer que la matrice W, dont les wkµ sont les éléments, est unitaire en calculant
un élément de matrice typique de WW + :
(WW ) +
kl = S µ wkµ wl∗µ = S ∫u
µ

k (r )v µ (r )d 3 r ∫ v µ∗ (r ′)u l (r ′)d 3 r ′
(7)
= ∫∫ u k∗ (r )δ 3 (r − r ′)u l (r ′)d 3 rd 3 r ′ = ∫ u k∗ (r )u l (r )d 3 r

Nous avons utilisé ici la propriété de fermeture de tout ensemble orthonormal complet de fonctions
qui a la forme ici
(8) S v (r )v µ∗ (r ′) = δ 3 (r − r ′)
µ µ

La dernière intégrale sur le coté droit de (7) est ou un symbole de Kronecker ou une fonction de
Dirac selon que k est un ensemble discret ou continu d'indices. Dans tous les cas, cette intégrale est
équivalente à un élément de la matrice unité et ainsi WW + = 1 . De même, on peut établir que
(
(9) W +W )
µν = Sw k

kµ wkν = (1)µν
Transformation de l'hamiltonien avec W
Nous avons montré que W est une matrice unitaire qui relie deux ensembles de fonctions u k et v µ .
Elle peut aussi être utilisée pour transformer la matrice hamiltonienne H ′ que nous définissons par
ses éléments de matrice
(10) H kl′ = ∫ u k∗ (r )Hˆ u l (r )d 3 r = E k δ kl ou E k δ (k − l )
où Ĥ est l'opérateur différentiel (2). Nous avons utilisé ici (1) pour montrer que H ′ est sous forme
diagonale avec les éléments diagonaux qui sont les valeurs propres de l'énergie E k . Une autre
matrice hamiltonienne H ′′ peut être construire en utilisant les fonctions v µ :
′′ = ∫ v µ∗ (r )Hˆ vν (r )d 3 r
(11) H µν

Elle n'a pas la forme diagonale.

Nous suivons maintenant la définition des transformations et nous transformons H ′′ avec W :


(WH ′′W ) = S S w H ′′ w
+
kl µ ν kµ µν

(12) = S S ∫ u (r ′)v (r ′)d r ′∫ v (r )Hˆ v (r )d r ∫ v (r ′′)u (r ′′)d


µ ν

k µ
3 ∗
µ ν
3 ∗
ν l
3
r ′′
= ∫∫∫ u k∗ (r ′)δ 3 (r ′ − r )Hˆ δ 3 (r − r ′′)u l (r ′′)d 3 r ′d 3 rd 3 r ′′
où Ĥ opère seulement sur la variable r à sa droite. L'intégration sur r ′′ peut être effectuée en
sortant Ĥ de l'intégrale sur r ′′ :
(13) ∫ Hˆ δ 3 (r − r ′′)u l (r ′′)d 3 r ′′ = Hˆ ∫ δ 3 (r − r ′′)u l (r ′′)d 3 r ′′ = Hˆ u l (r )

Nous obtenons donc


(14) (WH ′′W + )kl = ∫ ul∗ (r )H op ul (r )d 3r = H kl′

Cela peut être écrit dans l'utilisation explicite des indices sous forme d'équation matricielle
(15) WH ′′W + = H ′
Donc, nous voyons que W est la matrice unitaire qui transforme la matrice non diagonale H ′′ en la
forme diagonale H ′ . W + transforme aussi H ′ en H ′′ .

Une autre manière de décrire ce qui a été fait jusqu'ici est de dire que le processus de résolution de
l'équation de Schrödinger (1) est complètement équivalent au processus de diagonalisation d'une
matrice particulière. La matrice H ′′ peut être calculée à partir de l'opérateur Ĥ (2) en utilisant un
ensemble orthonormal complet quelconque de fonctions v µ (r ) qui s'avère pratique. Si sa
diagonalisation peut être effectuée, à la fois la forme diagonale H ′ , qui consiste en les valeurs
propres E k , et la matrice de transformation W sont obtenus dans le processus. Une fois W connu,
les fonctions propres u k (r ) peuvent être obtenues en utilisant (6).

Il est intéressant de noter que W n'est pas nécessairement une matrice carrée. C'est-à-dire que ces
lignes et colonnes peuvent être indicées différemment. Par exemple, les fonctions u k peuvent être
les fonctions propres d'un oscillateur harmonique à trois dimensions qui forment un ensemble
discret complet et les fonctions v µ peuvent être les fonctions propres de l'impulsion, qui forment un
ensemble entièrement continu. Cependant, les matrices hamiltoniennes H ′ et H ′′ sont toutes les
deux carrées.

Il est évident que H ′ et H ′′ sont hermitiques puisque leurs valeurs propres sont réelles. La
discussion que nous avons eue sur les valeurs propres de tout opérateur disaient qu'elles
représentent une quantité physiquement mesurable. Elles sont donc réelles puisque ce sont les seuls
résultats de mesures précises de ces quantités. Donc une variable dynamique qui est physiquement
mesurable est représentée par une matrice hermitique quand elle est sous forme diagonale. Il suit
alors de la discussion de la section précédente que toute transformation unitaire de cette matrice est
aussi hermitique.

Transformation de l'hamiltonien avec U


Il n'y a pas besoin de voir l'opérateur H donné dans (2) comme ayant un statut fondamentalement
différent des matrices H ′ et H ′′ définit par (10) et (11). La forme matricielle naturelle pour Ĥ est
celle où les lignes et colonnes sont indicées par les coordonnées r et r ′ . La matrice unité
correspondante est
(16) (1)rr′ = δ 3 (r − r ′)
en analogie avec le coté droit de (7) quand k est un ensemble continu d'indices. Une matrice
diagonale peut alors être écrite comme f (r )δ 3 (r − r ′) où f est une fonction multiplicative de r mais
pas un opérateur différentiel. Cela peut être, par exemple, l'énergie potentielle. Nous nous attendons
alors à ce que la forme matricielle de l'opérateur hamiltonien soit
(17) H rr ′ = Hˆ δ 3 (r − r ′)
où sur le coté droit Ĥ opère seulement sur la variable r. Nous nous rapportons à cette matrice H
quand les indices ne sont pas écrits explicitement. Il est important de noter que H rr′ n'est pas
diagonal puisque Ĥ n'est pas une fonction multiplicative mais contient des opérateurs différentiels
dans sa partie énergie cinétique. L'équation (17) a des éléments de matrice non nuls qui sont à une
distance infinitésimale de la diagonale r = r ′ .

L'équation (15) montre que W transforme H ′′ en H ′ . Il est intéressant de se demander qu'elle


matrice unitaire U transforme H, défini par (17), en H ′ :
(18) UHU + = H ′

Cette équation peut être écrite HU + = U + H ′ qui devient, lorsqu'elle est exprimée en éléments de
matrice, (HU + )rk = (U + H ′)rk ou
(19) S r′ H rr′ (U + )r′k = S (U ) l
+
rl H lk′

Ici S r′ est identique à ∫ d 3 r ′ . En substituant (17), le coté gauche de (19) devient

∫ Hˆ δ (r − r ′)(U ) d 3 r ′ = Hˆ ∫ δ 3 (r − r ′)(U + )r′k d 3 r ′ = Hˆ (U + )rk


3 +
(20) r ′k

où Ĥ opère sur la dépendance en r de (U + )rk . Le coté droit de (19) peut être récrit en utilisant (10),
il devient (U + )rk E k . Donc (19) est équivalent à
( )
(21) Hˆ U + = E U + rk k ( ) rk
La comparaison avec l'équation de Schrödinger (1) montre que (U + )rk doit être identifié avec la
fonction propre de l'énergie u k (r ) .

Nous sommes donc conduit naturellement à un prolongement du formalisme selon lequel un


ensemble complet de fonctions orthonormales u k (r ) peut être vu comme une matrice unitaire :
(22) U kr = u k∗ (r )

Dans ce cas particulier, U transforme H en H ′ en accord avec (18). Il est facilement vérifié que U
est, en fait, unitaire. Par exemple,
(
(23) UU + )kl = S U (U ) = ∫ u
r kr
+
rl

k (r )u l (r )d 3 r = (1)kl
par orthonormalité et
(24) (U +U )rr′ = S (U )
k
+
rk U kr ′ = Su k k (r )u k∗ (r ′) = (1)rr′
par fermeture.

Transformation de l'hamiltonien avec V


L'ensemble de fonctions v µ (r ) peut aussi, selon (22), être vu comme une matrice unitaire V :
(25) Vµ r = v µ∗ (r )
où à nouveau V est unitaire car l'ensemble de fonctions v µ (r ) est orthonormal et grâce à la
fermeture. Comme on s'y attend, la transformation de H avec V donne H ′′ :
(26) VHV + = H ′′

Les éléments de matrice µν des deux cotés de cette équation sont précisément les deux cotés de
(11).

La matrice H peut être éliminée entre les équations (18) et (26) comme suit :
H = V + H ′′V
(27)
H ′ = UHU + = UV + H ′′VU +

C'est en accord avec l'équation (15) si nous posons


(28) V = UV +

Sous forme d'éléments de matrice, on a


(29) (W )kµ = rU kr V + rµ
S ( )
ou
(30) wkµ = ∫ u k∗ (r )v µ (r )d 3 r
qui est le même que l'équation (5). L'équation (28) peut aussi être écrite sous les formes
V + = U +W et U + = V +W + qui sont le même que les équations (4) et (6), respectivement.

Représentations des opérateurs


Les trois matrices hamiltoniennes H, H ′ , H ′′ sont différentes représentations du même opérateur
Ĥ . Chaque représentation est caractérisée par la quantité dont les valeurs propres sont utilisées
pour indicer les lignes et les colonnes de la matrice (r, E k , ω µ , ou de manière plus concise, r, k,
µ ). Donc, H, H ′ et H ′′ sont les hamiltoniens en les coordonnées, l'énergie et Ω , respectivement.
Une matrice unitaire dont les lignes et colonnes sont indicées par les valeurs propres de A et B,
respectivement, transforme un opérateur de la représentation B à la représentation A. Par exemple,
U transforme tout opérateur de la représentation coordonnées à la représentation énergie et U + de
la représentation énergie à la représentation coordonnées. De la même façon, V transforme de la
représentation coordonnées à la représentation Ω et W de la représentation Ω à la représentation
énergie. Donc, l'application de V suivi de W transforme de la représentation coordonnées à la
représentation Ω puis à la représentation énergie. L'effet global est représenté par le produit WV
puisque la représentation la plus à droite agit la première. L'équation (28) montre que WV = U
comme attendu puisque U transforme la représentation coordonnées en la représentation énergie.
Un opérateur est diagonal dans la représentation dont les lignes et les colonnes sont indicées par les
valeurs propres de cet opérateur. Donc H ′ est diagonal puisque c'est l'hamiltonien exprimé dans la
représentation énergie.

Les remarques du paragraphe précédent peuvent être illustrées en l'appliquant à l'opérateur Ω .


Dans la représentation coordonnées, il doit avoir la forme
ˆ δ 3 (r − r ′)
(31) Ω rr′ = Ω
où sir le coté droit Ω̂ opère seulement sur la variable r. Nous appelons cette matrice Ω et nous
trouvons sa transformation dans la représentation énergie, qui doit être UΩU + :
(UΩU ) = S S U
+
kl r r′ kr ( )
Ω rr ′ U + r ′l
(32)
= ∫ u (r )Ω op ul (r )d r

k
3

comme attendu. De même, la transformation à la représentation Ω donne


( )
(33) VΩV + µν = ω µ (1)µν
qui est sous forme diagonale.

Une identité utile


L'équation (31) peut être utilisée pour écrire
(34) Ω opψ β (r ) = ∫ Ω rr′ψ β (r′)d 3 r ′
où ψ β (r ) est une fonction arbitraire. Alors
[ ]
(35) ∫ψ α∗ (r ) Ω opψ β (r ) d 3r = ∫∫ψ α∗ (r )Ω rr′ψ β (r′)d 3rd 3r ′
où ψ α (r ) est une autre fonction arbitraire. Nous ne supposons pas nécessairement que les ψ α (r )
sont des membres d'un ensemble orthonormal complet de fonctions. Puisque Ω rr′ est une matrice
avec les lignes et les colonnes indicées par r et r ′ et donc n'est pas le même que l'opérateur Ω̂ ,
nous pouvons réarranger les termes sur le coté droit de (35) pour donner

∫ [∫ (Ω ) ]

(36) +
r ′r ψ α (r )d 3 r ψ β (r ′)d 3 r ′
où (Ω + )r′r = Ω ∗r ′r sont les éléments r ′ , r de la matrice Ω + qui est l'adjoint hermitique de Ω .
L'équation (31) peut aussi être utilisée pour définit l'opérateur adjoint hermitique Ω̂ + en accord
avec
ˆ +ψ (r ) = (Ω + ) ′ψ (r ′)d 3 r ′
(37) Ω α ∫ rr α
Donc, (35) peut être récrit
[ ] [
(38) ∫ψ α∗ (r ) Ω opψ β (r ) d 3 r = ∫ Ω op
+
]
ψ α (r ) ψ β (r )d 3r

L'équation (38) est quelque fois utile puisqu'une intégrale de ce type peut être plus facilement
évaluée quand Ω̂ opère sur une des fonctions ψ α , ψ β plutôt que sur l'autre. Les intégrations par
parties que nous avons utilisées sont des exemples de l'application de (38). Dans ces exemples, Ω̂
est un opérateur différentiel et sa représentation coordonnées implique des dérivées de δ 3 (r − r ′) .
Cependant, Ω̂ n'a pas besoin d'être de ce type spécialisé mais peut avoir des éléments de matrice
non nuls pour r − r ′ fini. En tout cas, si Ω̂ représente une variable dynamique physiquement
mesurable, il doit être hermitique, auquel cas Ω̂ + peut être remplace par Ω̂ sur le coté droit de
(38).

Matrices lignes et colonnes


Nous avons travaillé jusqu'ici avec des matrices carrées telles que H et Ω qui représentent des
variables dynamiques et qui sont hermitiques, et des matrices rectangulaires comme U, V et W qui
transforment une représentation en une autre et qui sont unitaires. Un état α particulier d'un
système peut être représenté par une fonction ψ α (r ) qui peut être vue comme une matrice avec une
colonne et dont les lignes sont indicées par la coordonnée r. Comme remarqué ci-dessus, α n'a pas
besoin d'indicer un ensemble complet de fonctions mais peut être considéré en lui-même. Puisque
les u k (r ) sont un ensemble complet, ψ α peut être développé en terme de ces fonctions :
(39) ψ α (r ) = Sa
k αk u k (r )
où les coefficients aαk sont donnés par
(40) aαk = ∫ u k∗ (r )ψ α (r )d 3 r

Ces équations peuvent être écrites sous forme matricielle comme


(41) ψ α = U + aα et aα = Uψ α
respectivement, où aα est une matrice colonne dont les lignes sont indicées par k. Donc, tout
comme U transforme un opérateur comme H de la représentation coordonnées à la représentation
énergie avec (18), elle transforme aussi une fonction d'état de la représentation coordonnées à la
représentation énergie avec la deuxième équation (41).

De même, nous pouvons écrire


(42) ψ α (r ) = Sbµ αµ µv (r ) et bαµ = ∫ v µ∗ (r )ψ α (r )d 3 r
sous forme matricielle comme
(43) ψ α = V + bα et bα = Vψ α

La combinaison des équations (39), (40) et (28) donne


(44) aα = Uψ α = UV + bα = Wbα

Donc, W transforme la fonction d'état de représentation Ω bα à la représentation énergie aα


comme attendu.

Une propriété importante des transformations unitaires est qu'elles laissent la norme d'une fonction
d'état inchangée. Dans la représentation coordonnées, la norme est juste l'intégrale de normalisation
qui peut être écrite comme
(45) ∫ψ α∗ (r )ψ α (r )d 3 r = Sψ
r

α (r )ψ α (r ) = ψ α+ψ α

Le coté droit est le produit matriciel d'une matrice ligne ψ α+ , qui est l'adjoint hermitique de ψ α et a
ses colonnes indicées par la coordonnée r, et la matrice colonne ψ α . Le résultat est une matrice
avec une ligne et une colonne, qui est simplement un nombre. Il est évident que la norme est réelle
et non négative. Avec l'aide de (41), la norme peut être écrite
(46) ψ α+ψ α = aα+UU + aα = aα+ aα
S
qui est égal à k aαk . De même, ψ α+ψ α = bα+ bα , ainsi les trois représentations de la fonction d'état
2

ont la même norme. Une fonction d'état pour laquelle la norme existe (c'est-à-dire, n'est pas infinie)
( )
1
peut être normalisée en la divisant par ψ α+ψ α 2 , auquel cas sa norme devient égale à l'unité.

Il est intéressant de noter que l'identité (38) devient trivialement valide quand elle est récrite dans la
représentation matricielle coordonnées des fonctions d'états ψ α et ψ β :
(
(46) ψ α+ Ωψ β = Ω +ψ α ψ β)
+

L'équation (22) montre que les deux cotés sont identiques. La structure du produit matriciel est tel
que chaque coté est une matrice avec une ligne et une colonne et donc un nombre.

Espace de Hilbert
Une image géométrique qui est souvent utilisé considère une fonction d'état telle que ψ α , aα ou
bα comme un vecteur d'état dans un espace de Hilbert avec une infinité de dimensions. Chaque
dimension correspond à une des lignes de la matrice colonne qui décrit l'état et la composante du
vecteur d'état le long de cet axe de l'espace de Hilbert est numériquement égale à l'élément de
matrice correspondant. Différents choix pour l'orientation des axes dans l'espace de Hilbert
correspondent à différents choix pour la représentation. Par exemple, la représentation énergie
correspond à choisir les axes de telle manière qu'un vecteur d'état orienté le long d'un de ces axes
est un état propre de l'hamiltonien. Plus généralement, le vecteur aα a la composante aαk le long de
l'axe qui est rattaché à la valeur propre de l'énergie E k .

La norme d'une fonction d'état est juste le carré de la longueur du vecteur d'état correspondant dans
l'espace de Hilbert, où "longueur" est généralisé de manière appropriée pour prendre en compte les
composantes qui peuvent être des nombres complexes. La norme est un cas particulier du produit
scalaire de deux vecteurs d'état ψ α et ψ β défini comme
(47) (ψ α ,ψ β ) = ψ α+ψ β = ∫ψ α∗ (r )ψ β (r )d 3 r
et est aussi un nombre. Quand α et β sont le même état, il est égal à la norme. Quand le produit
scalaire s'annule, les vecteurs d'état sont dits orthogonaux. Les produits scalaires de ces vecteurs
d'états, exprimés dans les représentations énergie et Ω , sont
(48) (aα , a β ) = aα+ a β et (bα , bβ ) = bα+ bβ
respectivement. On voit sur (41) et (43) que le produit scalaire est indépendant de la représentation,
tout comme la norme. Il s'ensuit qu'une transformation d'une représentation à l'autre correspond à
une rotation des axes dans l'espace de Hilbert sans changer les vecteurs d'états. Un vecteur d'état
particulier a différentes composantes quand on le rapporte à des axes différents et ils constituent les
représentations différentes de l'état.

Il s'ensuit que l'opération sur ψ β avec Ω̂ effectue une transformation du vecteur d'état ψ β tel qu'il
devient un autre vecteur d'état Ωψ β . Nous nous référons à cette transformation comme une
rotation généralisée du vecteur d'état dans l'espace de Hilbert, le mot "généralisé" indiquant que la
rotation peut impliquer une dilatation ou une contraction des composantes aussi bien qu'une
rotation "pure". En particulier, la rotation généralisée ne conserve habituellement pas la norme du
vecteur d'état. L'élément de matrice ψ α+ Ωψ β = (ψ α , Ωψ β ) est alors le produit scalaire des vecteurs
d'état ψ α et Ωψ β . Il est facile de voir qu'il est indépendant de la représentation.

Lien avec la notation bra et ket


On est maintenant armé pour faire le lien entre la représentation matricielle et la représentation
compacte de Dirac, ainsi la boucle sera bouclée.

Nous décrivons une fonction d'état ou vecteur d'état, qu'il soit représenté par ψ α , aα ou bα , par le
ket α et l'état adjoint hermitique ψ α+ , aα+ ou bα+ par le bra α . Le produit scalaire de deux
vecteurs d'états est écrit
(49) ψ α+ψ β = α β
qui est un nombre.

Opération sur un vecteur ket à gauche avec Ω produit un autre vecteur ket
(50) Ω β = β ′
et l'opération sur un vecteur bra à droite avec Ω produit un autre vecteur bra
(51) α Ω = α ′′

L'élément de matrice de Ω entre les états α et β est un nombre et être écrit sous plusieurs formes
équivalentes
[ ]
Ωαβ = ∫ψ α∗ (r )Ωψ β (r )d 3 r = ∫ Ω +ψ α (r ) ψ β (r )d 3 r

(
(52) = (ψ α , Ωψ β ) = Ω +ψ α ,ψ β )
= α β ′ = α ′′ β = α Ω β

La première et la dernière sont les notations utilisées le plus fréquemment. Les éléments de matrice
de l'opérateur adjoint hermitique Ω + sont donnés par
(53) (Ω + )βα = Ωαβ


= β Ω+ α = α Ω β

Un exemple particulier des équations (50) et (52) est celui où Ω est l'opérateur unité :
(54) α 1 β = α β

Ces équations peuvent être utilisées pour obtenir une expression pour la matrice unitaire W de (5)
en identifiant ψ α avec u k et ψ β avec v µ :

(55) wkµ = k µ = µ k
Nous sommes maintenant en position de récrire les principales équations de cette section dans les
notations de Dirac et ainsi de clôturer définitivement la relation entre toutes les notations que nous
avons utilisées. Nos trois représentations seront spécifiées par les trois ensembles complets de kets
k , µ et r . Tout comme k est un état propre de l'énergie avec la valeur propre E k et µ un
état propre de Ω avec la valeur propre ω µ , r est un état propre des coordonnées avec la valeur
propre r. Alors, en analogie avec (52), (22) peut être écrit sous les formes
(56) k r = u k∗ (r ) et r k = u k (r )

De même, nous pouvons écrire


(57) µ r = v µ∗ (r ) et r µ = v µ (r )

A nouveau, en identifiant ψ α avec u k , nous obtenons


(58) ψ α (r ) = r α aαk = k α bαµ = µ α

Une convention de sommation sera employée tel que tout symbole d'état qui apparaît deux fois
dans une expression données (une fois dans le ket et une fois dans le bra) est supposé être sommé
sur un ensemble complet orthonormal d'états. Donc, le symbole S µ sera omis des expressions de
la forme
(59) S µ Lµ µL

C'est une convention semblable à la convention de sommation d'Einstein sur la sommation sur les
indices muets dans les expressions vectorielles et tensorielles.

Les équations récrites ci-dessous sont numérotées avec des apostrophes sur leur numérotation
originale.
(3') Ω µ = ω µ µ ou r Ω r ′ r ′ µ = ω µ r µ
(4') µ = k k µ ou r µ = r k = k µ
(5') k µ = k r r µ
(6') k = µ µ k ou r k = r µ µ k
(7') k µ µ l = k r r l = k l
(8') r µ µ r ′ = r r ′
(9') µ k k ν = µ ν
(10') h H l = E k k l
(15') k µ µ H ν ν l = k H l
(19') r H r ′ r ′ k = r l l H k
(26') µ r r H r ′ r ′ ν = µ H ν
(28') k µ = k r r µ
(39') r α = r k k α
(40') k α = k r r α
(43') r α = r µ µ α et µ α = µ r r α
(47') α β = α r r β

A l'exception des équations (3') et (10') qui sont des équations aux valeurs propres pour Ω et H,
respectivement, toutes ces équations ont une propriété en commun. Si nous supposons qu'un
symbole répété (k, µ ou r), qui est sous-entendu sommé sur un ensemble orthonormal complet
d'états comme dans (59), est équivalent à l'opérateur unité, ces équations deviennent des identités
triviales. Par exemple, chacun des deux cotés de (15') devient égal à r H k puisque r ′ r ′ et
l l peut être remplacé par des opérateurs unités sur les cotés gauches et droits, respectivement.
Nous avions déjà vu cette propriété. Ce replacement est évidemment équivalent à l'utilisation de la
propriété de fermeture de tout ensemble complet orthonormal de fonctions. Inversement, des
opérateurs unités peuvent toujours être insérés, comme lorsque l'on passe du coté gauche au coté
droit de (4'). La preuve la plus simple de l'exactitude de ces hypothèses est l'observation que la
suppression ou l'insertion de tels symboles d'états répétés conduit toujours à des équations valides.

Notons qu'une insertion peut aussi être faite entre deux opérateurs. Par exemple,
(60) ΩΓ = Ω k k Γ

Opérateurs projection
Considérons l'équation
(61) α = S µ µ µ α = S µ Pµ α
où l'opérateur Pµ est définit par
(62) Pµ ≡ µ µ
pour un état unique µ , c'est-à-dire sans effectuer la sommation généralisée. Il est clair en voyant
(3') que Pµ α est un état propre de Ω avec la valeur propre ω µ . Donc, un ket arbitraire α peut
être écrit comme une somme généralisée des états propres de tout opérateur Ω avec (61).
L'opérateur Pµ est appelé opérateur de projection puisqu'il projette α sur la partie qui est un état
propre particulier de Ω .

Supposons maintenant que Ω a seulement deux valeurs propres distinctes ω1 et ω 2 avec une très
grande dégénérescence. En exemple peut être l'opérateur parité avec les valeurs propres ± 1 ou la
composante du moment angulaire de spin d'une particule de spin 1/2 avec les valeurs propres ± 12 h
(voir le tome suivant). Dans une telle situation, il est quelquefois souhaitable d'écrire tout état α
comme une somme de deux parties, chacune étant un état propre de Ω avec les valeurs propres ω1
et ω 2 . Cela peut être obtenu en définissant les opérateurs projection par les équations
(63) Pi ≡ S µ = µi Pµ
avec i = 1, 2, au lieu de (62). Alors Pi α est un état propre de Ω avec la valeur propre ω i . On
vérifie facilement que
Ω −ω2 Ω − ω1
(64) P1 = et P2 =
ω1 − ω 2 ω 2 − ω1
et que
(65) ∑ Pi = 1 Pi Pj = δ ij Pi
i

Les équations (63) peuvent être généralisées à des situations où Ω a plus de deux valeurs propres
distinctes. Avec la définition (63), nous avons maintenant
Ω −ω j
(66) Pi = ∏
j ≠1 ω i − ω j

et les équations (65) sont encore valides.

Puisque Ω est hermitique, ses valeurs propres ω µ sont réelles et les Pµ et Pi sont évidemment
hermitiques. Finalement, il est facile de voir que tr (Pµ ) = 1 si µ est un état propre normalisé qui
correspond à une valeur propre discrète. Dans ce cas tr (Pi ) est égal au nombre d'états propres
linéairement indépendant qui ont la valeur propre ω i . Donc, il est égal aux nombres de dimensions
du sous-espace de Hilbert qui correspond à ω i .

Signification physique des éléments de matrice


Nous avons vu que les éléments de matrice diagonaux d'un opérateur qui est sous forme diagonale
sont juste les valeurs propres de cet opérateur. La comparaison avec ce que nous avons vu montre
que si l'opérateur n'est pas sous forme diagonale, les éléments de matrice diagonaux sont les valeurs
moyennes de l'opérateur pour des états qui sont normalisés. Plus généralement, α Ω α / α α est
la valeur moyenne de l'opérateur pour l'état représenté par le ket normalisable α .

Jusqu'ici, nous n'avons pas d'interprétation simple des éléments non diagonaux tels que α Ω β .
Nous verrons plus tard qu'ils sont, entre autres choses, reliés aux probabilités de transition entre
états.
VI.3. Equations du mouvement
La théorie des transformations développée dans la section précédente ne fait pas référence à la
dynamique. Elle traite de la description d'un système physique à un instant du temps. Cette
description implique trois sortes d'objets. Tout d'abord, il y a ceux qui spécifient l'état du système à
un moment particulier. Ils peuvent être écrits comme des fonctions d'état ψ α (r ) , comme des
matrices colonnes ψ α , aα ou bα , comme des vecteurs de l'espace de Hilbert ou comme des kets
α . A chacun correspond une quantité adjointe hermitique tel que ψ α+ ou α . Ensuite, il y a les
transformations unitaires qui peuvent être écrites comme des matrices rectangulaires tel que U et
dont les éléments sont les expressions k r . Leur effet est de changer une représentation en une
autre. Du point de vue de l'espace de Hilbert, elles tournent les axes sans changer les vecteurs
d'états de manière à ce qu'un vecteur d'état particulier se rapporte à un ensemble différent d'axes.
Les troisièmes, ce sont les variables dynamiques, tel que Ω , qui peuvent être écrites comme des
opérateurs ou des matrices carrées. Les éléments de ces matrices peuvent être calculés par rapport à
un ensemble d'axes particuliers dans l'espace de Hilbert et une matrice unitaire transforme leurs
valeurs d'un ensemble d'axes ou représentation à un autre. Donc, U transforme Ω de la
représentation coordonnées r Ω r ′ à la représentation énergie k Ω l , tout comme elle transforme
α de la représentation coordonnées r α à la représentation énergie k α .

De manière alternative, les éléments de matrice de Ω peuvent être calculés par rapport à des
vecteurs d'état particuliers ψ α , qui n'ont pas besoin d'être les membres d'un ensemble complet. Ces
éléments de matrice sont le produit scalaire (ψ α , Ωψ β ) = α Ω β et ils sont invariants par rapport
aux transformations unitaires (choix des axes dans l'espace de Hilbert). Le résultat de l'opération
avec Ω sur un ket β est un nouveau ket Ω β qui est relié à β par une rotation généralisée du
vecteur d'état dans l'espace de Hilbert. Si β est un état propre µ de Ω , alors la "rotation"
consiste simplement à multiplier le vecteur d'état par ω µ sans changer sa direction.
Une distinction doit être faite entre les rotations des axes dans l'espace de Hilbert sans changer les
vecteurs d'états, qui sont produit par les transformations unitaires, et les rotations généralisées des
vecteurs d'états sans changer les axes, qui sont produites par les variables dynamiques.

Nous allons considérer dans cette section la manière avec laquelle un système physique change d'un
instant à l'autre. Comme nous le verrons, cette dépendance au temps peut être vue de différentes
manières comme un changement dans les vecteurs d'états, dans les variables dynamiques ou les
deux. Il s'avère qu'il y a un point de vue qui met les équations du mouvement sous une forme très
similaire à celle des équations classiques du mouvement dans leur formulation hamiltonienne. Cette
similarité suggère une méthode assez générale pour trouver les équations quantiques qui sont en
accord sous une limite appropriée avec les équations classiques du même système.

Point de vue de Schrödinger


Nous prenons comme point de départ l'équation de Schrödinger dépendant du temps et nous
l'écrivons en fonction d'un ket dépendant du temps α S (t ) et de l'hamiltonien H :

α S (t ) = H α S (t )
d
(1) ih
dt

La dérivée totale par rapport au temps est utilisée ici puisque la dépendance du ket par rapport aux
coordonnées ou d'autres variables n'apparaît pas explicitement. L'indice S se rapporte au ket vu
dans le point de vue de Schrödinger, selon lequel il varie dans le temps conformément à l'équation
différentielle ordinaire (1). L'équation adjointe hermitique du mouvement est
α S (t ) = α S (t ) H + = α S (t ) H
d
(2) − ih
dr
puisque H est hermitique.

Les solutions des équations différentielles (1) et (2) sont faciles à trouver si H est indépendant du
temps, ce que nous supposerons être le cas :
(3) α S (t ) = e − iHt / h α S (0) α S (t ) = α S (0) e iHt / h
Le fait que les équations différentielles dérivent de (3) peut être vérifié en développant les
exponentielles en séries et en différentiant terme à terme.

L'opérateur e − iHt / h est une somme infinie de puissances de H, chacune étant une variable
dynamique qui peut être écrite comme un opérateur ou une matrice carrée. Donc, la série entière est
aussi une variable dynamique. Dans ce cas particulier, on voit facilement qu'elle est unitaire
puisque H est hermitique. Cependant, il est essentiel de se souvenir que e − iHt / h n'est pas une
transformation unitaire dans le même sens que U, V ou W. Elle ne passe pas d'une représentation à
une autre (rotation des axes dans l'espace de Hilbert) mais change plutôt le ket α S (0) en le ket
α S (t ) et effectue ainsi une rotation généralisée du vecteur d'état dans l'espace de Hilbert.
Cependant, puisque e − iHt / h est unitaire, la norme du ket est inchangée et la rotation généralisée est
dans cas une rotation pure.

Le taux de changement dans le temps d'un élément de matrice d'une variable dynamique Ω S dans
le point de vue de Schrödinger est facile à trouver avec l'aide de (1) et (2) :
α S (t ) Ω S β S (t )
d
dt
d  ∂Ω d 
(4) =  α S (t )  Ω S β S (t ) + α S (t ) β S (t ) + α S (t ) Ω S  β S (t ) 
 dt  ∂t  dt 
∂Ω
= α S (t ) β S (t ) + α S (t )(Ω S H − HΩ S ) β S (t )
1
∂t ih

Le premier terme sur le coté droit est la partie du changement dans l'élément de matrice qui vient de
la dépendance explicite de Ω S avec le temps et le second terme est celui causé par le changement
dans le temps des vecteurs d'états. L'opérateur qui apparaît dans le second terme est appelé un
commutateur et est défini par
(5) [ A, B ] ≡ AB − BA
Notons qu'en accord avec les définitions de la formulation matricielle, le commutateur n'a pas de
signification à moins que les deux matrices ne soient carrées et avec les lignes et colonnes indicées
de la même manière.

Un cas particulier intéressant de (4) est celui où Ω S commute avec H et n'a pas de dépendance
explicite avec le temps. Alors, le coté droit est zéro et tous les éléments de matrice de Ω S sont
constants dans le temps. Une telle variable dynamique est dite être une constante du mouvement.

Point de vue de Heisenberg


La substitution de (3) dans (4) donne
α S (0) e iHt / h Ω S e −iHt / h β S (0 ) =
d
dt
(6)
α S (0) e iHt / h
∂Ω S −iHt / h
∂t
e [ ]
β S (0) + α S (0) e iHt / h Ω S e −iHt / h , H β S (0)
1
ih
où nous avons utilisé le fait que H commute avec e ± iHt / h . Il est utile de définir les vecteurs d'états
indépendants du temps avec
(7) α H (t ) ≡ α S (0) = e iHt / h α S (t )
et les variables dynamiques dépendant du temps avec
(8) Ω H ≡ e iHt / h Ω S e − iHt / h

A moins que Ω S ne commute avec H, Ω H dépend de t même si Ω S n'a pas de dépendance


explicite au temps. L'indice H indique le point de vue de Heisenberg. Le temps t = 0 où les kets et
opérateurs dans le point de vue de Schrödinger sont les mêmes que ceux dans le point de vue de
Heisenberg est, bien sûr, arbitraire et choisi par facilité. Si ce temps était t = t 0 , alors e ± iHt / h serait
± iH (t −t 0 ) / h
remplacé par e .

Puisque α H (t ) ne dépend pas du temps, la mention explicite de t peut être omise. De plus, la
dérivée par rapport au temps sur le coté gauche de (6) peut être mise dans l'élément de matrice et
l'équation devient ainsi
∂Ω H
β H + α H [Ω H , H ] β H
d 1
(9) α H ΩH β H = α H
dt ∂t ih
où selon (8) nous avons défini
∂Ω H  ∂Ω  iHt / h ∂Ω S
(10) ≡  =e e −iHt / h
∂t  ∂t  H ∂t

Puisque (9) est valide pour des bras et des kets arbitraires, elle doit être valide pour les opérateurs
eux-mêmes. Nous sommes donc conduit à l'équation du mouvement vue dans le point de vue de
Heisenberg :
dΩ H ∂Ω H 1
(11) = + [Ω H , H ]
dt ∂t ih

Cette équation qui suit aussi directement de la différentiation de (8) est celle qui est la plus proche
de l'équation correspondante du mouvement, comme nous le verrons ci-dessous. On notera que
selon (8) H est le même dans les points de vue de Schrödinger et de Heisenberg.

Nous voyons donc que la description du changement dans le temps d'un système physique peut être
vue de deux manières opposées. Dans le point de vue de Schrödinger, les variables dynamiques
sont constantes dans le temps (sauf éventuelle dépendance explicite avec le temps) et les vecteurs
d'états varient selon (1). Dans le point de vue de Heisenberg les vecteurs d'états sont constants dans
le temps et les variables dynamiques varient selon (11). La transformation d'un point de vue à
l'autre se fait avec l'aide de la variable dynamique e ± iHt / h selon (7) et (8).

Nous avons délibérément évité d'appeler ces "points de vue" des "représentations" comme cela se
fait parfois puisque nous voulons réserver le terme "représentation" pour désigner le choix des axes
dans l'espace de Hilbert ou, de manière équivalente, le choix d'un ensemble orthonormal complet
de fonctions par rapport auxquelles les états et variables dynamiques sont spécifiés. Il est important
de noter que les équations (1), (7), (8) et (11) ont la même forme dans toutes les représentations,
comme on le montre facilement. D'autre part, nous utilisons le terme "transformation" en relation
avec le changement d'un point de vue à l'autre puisqu'il est accomplit au moyen d'un opérateur
unitaire. A cause de cela, toutes les normes et produits scalaires des vecteurs d'états sont
indépendants du point de vue et constants dans le temps aussi bien qu'indépendants de la
représentation.

Point de vue interaction


La discussion qui précède montre que ni les vecteurs d'états seuls ni les variables dynamiques
seules ne sont centraux pour la description du développement d'un système dans le temps. Les deux
peuvent être altérés au moyen de la transformation unitaire e − iHt / h et les deux points de vue obtenus
sont également valides. Les quantités qui ne sont pas altérées sont les éléments de matrice des
variables dynamiques calculées sur des paires d'états tel que α Ω β . Ils fournissent le contenu
physique essentiel de la théorie puisque les valeurs propres, les valeurs moyennes et les probabilités
de transition peuvent en être tirés. Il est évident que toute transformation unitaire; qu'elle dépende
ou non du temps, peut être appliquée aux états et variables dynamiques sans affecter les valeurs des
éléments de matrice. On peut donc trouver un nombre arbitrairement grand de points de vue
différents tout autant que de représentations différentes.

Un troisième point de vue particulièrement utile peut être spécifié en divisant l'hamiltonien en deux
parties,
(12) H = H 0 + H ′
tel que H 0 ne dépend pas explicitement du temps et a aussi une structure simple. Par exemple, H 0
peut être l'énergie cinétique et H ′ l'énergie potentielle. Ou H 0 peut être l'hamiltonien pour un
potentiel relativement simple tel que le champ coulombien et H ′ une certaine interaction
supplémentaire tel qu'un champ électromagnétique externe. Dans ce dernier cas, il est souvent
intéressant d'autoriser H ′ à dépendre explicitement du temps et ainsi nous admettrons cette
possibilité dans ce qui suit. Puisque H, H 0 et H ′ ne commutent en général pas l'un avec l'autre, un
indice doit être utilisé pour distinguer les différents points de vue.

Nous définissons le point de vue interaction par les équations


α I (t ) ≡ e iH 0 S t / h α S (t )
(13)
Ω I (t ) ≡ e iH 0 S t / h Ω S e −iH 0 S t / h
Les points de vue interaction et de Heisenberg sont les mêmes quand H ′ = 0 . Nous savons que
H H = H S et la deuxième équation (13) montre que H 0 I = H 0 S . En général, H I ≠ H S ,
H 0 H ≠ H 0 S et H S′ , H H′ et H I′ sont tous différents. La différentiation de la première équation (13)
donne pour l'équation du mouvement de α I (t )

α I (t ) = − H 0 S e iH 0 S t / h α S (t ) + ihe iH 0 S t / h α S (t )
d d
ih
dt dt
(14) = − H 0 S α I (t ) + e α I (t )
iH 0 S t / h − iH 0 S t / h
HSe
= e iH 0 S t / h H S′ e −iH 0 S t / h α I (t )
= H I′ α I (t )
où nous avons utilisé (1) et (12) et la deuxième équation de (13). De même, la différentiation de la
deuxième équation (13) donne pour l'équation du mouvement de Ω I (t )
dΩ I ∂Ω I 1 ∂Ω I 1
(15) = + [Ω I , H 0 S ] = + [Ω I , H 0 I ]
dt ∂t ih ∂t ih

Ce que le point de vue interaction réalise est d'assigner une partie de la dépendance avec le temps
aux vecteurs d'états et une partie aux variables dynamiques au lieu d'avoir l'un constant et l'autre
avec une dépendance dans le temps due à l'hamiltonien complet. Dans ce point de vue, les vecteurs
d'états changent en accord avec H ′ et les variables dynamiques en accord avec H 0 . Notez la
ressemblance des équations (1) et (14) d'un coté et des équations (11) et (15) de l'autre. Cela est
utile si H ′ est une petite perturbation puisque alors les variables dynamiques ont la forme non
perturbée et les fonctions d'états sont presque constantes dans le temps.

Représentation énergie
La représentation énergie est spécifiée par les kets k qui sont valeurs propres de l'hamiltonien
complet H avec les valeurs propres E k . L'équation (1) montre alors que dans le point de vue de
Schrödinger, le ket dépendant du temps k S (t ) satisfait l'équation
k S (t ) = H k S (t ) = E k k S (t )
d
(16) ih
dt
qui s'intègre en
(17) k S (t ) = k S (0) e − iEk t / h

L'équation (17) et son adjointe peuvent être utilisées pour trouver la dépendance dans le temps des
éléments de matrice dans le point de vue de Schrödinger d'un opérateur qui n'a pas de dépendance
explicite avec le temps :
(18) k S (t ) Ω S l S (t ) = k S (0 ) Ω S l S (0 ) e i ( Ek − Et )t / h

On vérifie facilement explicitement que cela est égal à l'élément de matrice k H Ω H l H , comme
on s'y attend.

L'équation (18) montre que les éléments non diagonaux dans la représentation énergie oscillent
dans le temps avec des fréquences qui sont proportionnelles à la différence d'énergie entre les états
stationnaires, en accord avec la règle de Bohr. Cela est consistant avec la remarque à la fin de la
section précédente que les éléments de matrice sont reliés aux probabilités de transition entre états.
Il suit aussi de (18) que les éléments de matrice diagonaux ou les valeurs moyennes dans la
représentation énergie sont constants dans le temps pour des opérateurs qui n'ont pas de dépendance
explicite avec le temps.

Equations lagrangiennes et hamiltoniennes classiques du mouvement


Afin de mettre en évidence la similarité entre (11) et l'équation classique correspondante, repassons
brièvement en vue la structure de la théorie hamiltonienne classique. Les équations du mouvement
d'un système dynamique conservatif qui a f degrés de liberté peuvent être dérivées d'un lagrangien
L(q1 , K , q f , q&1 , K , q& f , t ) des coordonnées q i , des vitesses q& i ≡ dqi / dt et du temps au moyen d'un
principe variationnel :
(19) δ ∫ Ldt = 0 δq i (t1 ) = δq i (t 2 ) = 0
t2

t1
Les équations lagrangiennes résultantes sont
d  ∂L  ∂L
(20)  − = 0 i = 1,… f
dt  ∂qi  ∂qi

Si maintenant nous définissons un moment canoniquement conjugué à q i comme pi ≡ ∂L / ∂q& i et


une fonction hamiltonienne des coordonnées et des moments comme

(21) H (q1 ,K, q f , p1 ,K, p f , t ) = ∑ pi q& i − L


f

i =1

La variation de H conduit aux équations hamiltoniennes du mouvement


∂H ∂H
(22) q& i = p& i = − i = 1,… f
∂p i ∂q i

La dépendance avec le temps de toute fonction des coordonnées, des moments et du temps,
calculée le long d'un point de phase en mouvement (trajectoire physique dans l'espace des variables
ou espace des phases ou espace de configuration) est
∂F  ∂F ∂F 
F (q1 , K , q f , p1 , K , p f , t ) =
f
d
+ ∑  q& i + p& i 
dt ∂t i =1  ∂q i ∂pi 
(23)
∂F f
 ∂F ∂H ∂H ∂F 
+ ∑  − 
∂t i =1  ∂q i ∂p i ∂q i ∂pi 
en utilisant les équations hamiltoniennes (22). Le crochet de Poisson {A, B} de deux fonctions des
coordonnées et des moments est définit comme
f
 ∂A ∂B ∂B ∂A 
(24) {A, B} ≡ ∑  − 
i =1  ∂q i ∂p i ∂qi ∂pi 

En terme des crochets de Poisson, l'équation du mouvement pour la fonction F des variables
dynamiques devient
dF ∂F
(25) = + {F , H }
dt ∂t

Le coté gauche de (25) est la dérivée totale par rapport au temps de F le long d'un point de phase en
mouvement. Le premier terme sur le coté droit prend en compte la dérivée explicite par rapport au
temps de F et le dernier terme est le changement de F venant du mouvement du point de phase où F
est évalué.

Crochets de Poisson et commutateurs


La forte ressemblance entre (11) et (25) suggère que l'analogue quantique des équations du
mouvement peut être trouvé en général en substituant le commutateur divisé par ih au crochet
Poisson,
(26) {A, B} → [ A, B ]
1
ih
et à travailler avec le point de vue de Heisenberg.

Il y a deux observations qui tendent à supporter cette suggestion. La première concerne les
conditions classiques pour une transformation d'un ensemble de variables canoniques q i , p i à un
autre Qi , Pi :
(27) {Qi , Pj } = δ ij {Q , Q } = 0 {P , P } = 0
i j i j

où les crochets de Poisson sont calculés par rapport aux variables originales q i , p i . Nous avons vu
qu'un passage correct de la théorie classique à la théorie quantique pouvait être obtenu en
substituant l'opérateur différentiel − ih(∂ / ∂x ) à p x , etc. Le commutateur de x et p x peut alors être
trouvé en opérant sur une fonction arbitraire g (r ) des coordonnées.
∂g ∂
(28) ( xp x − p x x )g (r ) = −ihx + ih ( xg ) = ihg (r )
∂x ∂x

Puisque g (r ) est arbitraire, cette relation et les autres commutateurs peuvent être écrits comme des
équations d'opérateurs :
 ∂ ∂ 
xp x − p x x = −ih x − x  = ih
 ∂x ∂x 
 ∂ ∂ 
(29) xp y − p y x = −ih x − x  = 0
 ∂y ∂y 
xy − yx = 0
px py − p y px = 0
etc.

Elles sont en accord avec les équations classiques (27) quand la substitution (26) est faite.

La deuxième observation est que les propriétés algébriques des commutateurs sont identiques à
celles des crochets de Poisson. On vérifie facilement à partir de la définition (24) que
{A, B} = −{B, A}
{A, c} = 0
(30) {( A1 + A2 ), B} = {A1 , B} + {A2 , B}
{A1 A2 , B} = {A1 , B}A2 + A1 {A2 , B}
{A, {B, C}} + {B, {C , A}} + {C , {A, B}} = 0
où c est un nombre.

L'ordre des facteurs éventuellement non commutant n'a pas été altéré. Dirac a montré que la forme
de l'analogue quantique des crochets de Poisson est déterminée par les équations (30) remplacé par
le coté droit de (26). La constante h est, bien sûr, arbitraire tant que l'on se cantonne à cette
discussion.

Quantification d'un système classique


Nous avons maintenant une procédure plausible pour trouver un système quantique qui se réduit à
tout système classique spécifié selon le principe de correspondance ou la limite classique. Nous
écrivons simplement les équations hamiltoniennes classiques en fonction des crochets de Poisson et
nous remplaçons les crochets de Poisson par les commutateurs en accord avec (26). L'équation
classique du mouvement devient alors l'équation quantique (11) qui dit comment les variables
dynamiques changent dans le temps dans le point de vue de Heisenberg. De même, les relations
classiques (27) deviennent
[ ] [ ]
(31) [qi , p i ] = ihδ ij q i , q j = 0 p i , p j = 0

Notons que l'on peut alors montrer, comme nous l'avons fait pour la position et l'impulsion, que
pour toute paire de variables canoniques : ∆q i ⋅ ∆p i ≥ 12 h .

Ces conditions quantiques sont une généralisation de (29) et on vérifie facilement qu'elles sont
valides dans tous les points de vue discutés au début de cette section. Donc, le point de vue de
Heisenberg doit seulement être précisé pour les équations du mouvement. Nous supposerons
toujours que c'est le cas dans le reste de cette section et l'indice H sera omis.

Deux précautions sont nécessaires pour appliquer cette procédure de quantification. Tout d'abord,
les coordonnées et moments doivent être exprimés en coordonnées cartésiennes. Deuxièmement,
les ambiguïtés sur l'ordre des facteurs non commutant sont habituellement résolues en prenant une
moyenne symétrique des différents ordres possibles. Ces précautions sont illustrées dans l'exemple
suivant.

Il est important de réaliser qu'il n'y a pas de manière unique d'effectuer la transition de la
mécanique classique à la mécanique quantique. Des termes peuvent toujours être ajoutés aux
équations quantiques du mouvement s'ils s'annulent à la limite classique ou de correspondance.
D'autre part, si le comportement classique d'un système est connu, certaines restrictions sont
placées sur ses équations quantiques. La procédure actuelle conduit généralement au système
quantique le plus simple qui a la limite classique correcte. Ce système le plus simple peut omettre
certains aspects intéressants de la vraie situation. Ainsi, le spin intrinsèque et le moment
magnétique que possèdent certaines particules chargées n'apparaissent pas dans l'exemple traité ci-
dessous.

Mouvement d'une particule dans un champ électromagnétique


Comme exemple de la procédure de quantification précédente, considérons le problème du
mouvement d'un point de masse chargé dans un champ électromagnétique général externe.
L'hamiltonien classique, exprimé en fonction des variables canoniques r, p et les potentiels
électromagnétiques A(r, t ) , φ (r, t ) est (les unités de Gauss sont utilisées dans ce qui suit)
2
1  e 
(32) H =  p − A  + eφ
2m  c 
où e est la charge de la particule et c est la vitesse de la lumière. Les champs électriques et
magnétiques sont donnés en fonction des potentiels par
1 ∂A
(33) E = − − ∇φ H = ∇ × A
c ∂t

Les conditions quantiques (31) en coordonnées cartésiennes sont


[ ]
(34) [x, p x ] = y, p y = [z , p z ] = ih
les autres paires de coordonnées et de composantes de l'impulsion commutants. Nous allons
maintenant utiliser l'équation (11) avec l'expression (32) de H et les relations (34) pour calculer les
expressions pour la vitesse de la particule dr / dt et l'accélération d 2 r / dt 2 pour les comparer aux
expressions classiques correspondantes.

Evaluation des commutateurs


Afin de faciliter l'évaluation de certains des commutateurs qui apparaissent dans la substitution
dans (11), nous allons dériver quelques résultats élémentaires. Toutes les fonctions de r commutent
puisque toutes les composantes de r commutent. Il suit de (34) que
x 2 p x − p x x 2 = x ( p x x + ih ) − p x x 2
(35)
= ( p x x + ih )x + ihx − p x x 2 = 2ihx

On montre facilement par induction que


(36) x n p x − p x x n = nihx n−1

Il suit de (36) que pour toute fonction f (r ) qui peut être exprimée comme un développement en
série en x, y, z, la relation

(37) [ f (r ), p x ] = f (r ) p x − p x f (r ) = ih
f (r )
∂x
est valide. Cela correspond à la relation classique { f (r ), p x } = ∂f (r ) / ∂x . L'équation (37) peut aussi
être établie pour des fonctions plus générales que les développements en série en utilisant la
représentation de p x comme − ih(∂ / ∂x ) comme dans (28). Si nous opérons avec la gauche de (37)
sur une fonction arbitraire g (r ) , nous obtenons
 ∂ ∂   ∂ 
(38) [ f (r ), p x ]g (r ) = −ih  f (r ) − f (r ) g (r ) = g (r )ih f (r )
 ∂x ∂x   ∂x 
qui est équivalent à l'égalité d'opérateurs (37) puisque g (r ) est arbitraire. Par application répétée de
(37), on montre facilement que
 ∂f ∂f  ∂f ∂2 f
(39) f (r ) p x2 − p x2 f (r ) = ih p x + p x  = 2ih px + h 2 2
 ∂x ∂x  ∂x ∂x

Vitesse et accélération d'une particule chargée


L'hamiltonien (32) peut maintenant être écrit, avec l'aide de (37),
p2 e2
H= −
e
(p ⋅ A + A ⋅ p ) + 2
A 2 + eφ
2m 2mc 2mc
(40) 2
p e ieh e2
= − A⋅p + ∇⋅A + A 2 + eφ
2m mc 2mc 2mc 2

La dérivée par rapport au temps d'une composante de r est facilement trouvée à partir de (11)
dx 1  e 
(41) =  p x − Ax 
dt m  c 
en accord avec la relation classique entre la vitesse et l'impulsion d'une particule en présence d'un
champ électromagnétique.

Le calcul d'une composante de l'accélération de la particule


d 2 x 1  dp x e dAx 
=  − 
dt 2 m  dt c dt 
(42)
=
1
[ p x , H ] − e ∂Ax − e [Ax , H ]
i hm mc ∂t ihmc
est immédiat mais assez ennuyeux. Le résultat peut être écrit
dx 2 e  1 ∂Ax ∂φ 
=−  + +
dt 2
m  c ∂t ∂x 
e  e  ∂Ay ∂Ax   ∂Ay ∂Ax  e 
(43)  p − A  −  +  −  p − Ay  
c  ∂x ∂y   ∂x ∂y 
y y y
2m 2 c  c 
e  e  ∂A ∂A   ∂A ∂A  e 
− 2  z
p − Az  x − z  +  x − z  p z − Az 
2m c  c  ∂z ∂x   ∂z ∂x  c 

La force de Lorentz
L'équation (43), avec des équations similaires pour les composantes y et z, peut être écrite comme
une seule équation vectorielle pour la "force" :
d 2r  1 ∂A 
m 2 = e − − ∇φ 
dt  c ∂t 
1 e1  e  1 e 
(44) +   p − A  × (∇ × A ) − (∇ × A ) ×  p − A 
2 c m  c  m c 
1 e  dr dr 
= eE +  ×H −H× 
2 c  dt dt 
où nous avons utilisé (33) et (41). L'équation (44) avec l'équation classique correspondante
(45) eE + (v × H )
e
c
où v = dr / dt est la vitesse de la particule, si nous prenons une moyenne symétrique des deux
termes v × H et − H × v . Elles sont identiques en mécanique classique mais diffèrent en mécanique
quantique car le v donné par (41) ne commute pas avec H. De même, bien que leur comme soit
hermitique, les termes séparés ne le sont pas.

L'équation (44) inclut une généralisation du théorème d'Ehrenfest. Si nous considérons un élément
diagonal, le coté gauche est le produit de la masse et de la dérivée seconde par rapport au temps de
la valeur moyenne du vecteur position de la particule puisque les kets du point de vue de
Heisenberg sont indépendant du temps. Le coté droit est la valeur moyenne de la force de Lorentz
agissant sur la charge de la particule. Donc, (44) dit qu'un paquet d'ondes se déplace comme une
particule classique si elle est suffisament bien localisée pour que le champ électromagnétique
change d'une quantité négligeable sur ses dimensions. Ce résultat peut aussi être obtenu par la
méthode que nous avons vu avec le théorème d'Ehrenfest si, en accord avec (1) et (40), l'équation
de Schrödinger dans le point de vue de Schrödinger est prise comme
∂ψ  h 2 2 ieh ieh e2 
(46) ih =  − ∇ + A⋅∇ + ∇⋅A + A 2 + eφ ψ
∂t  2m mc 2mc 2mc 2

Théorème du viriel
Une preuve du théorème du viriel en mécanique quantique peut être donnée en analogie avec la
démonstration correspondante en mécanique classique. Dans cette dernière, le point de départ est la
moyenne dans le temps de la dérivée par rapport au temps de la quantité r ⋅ p qui est zéro pour un
système périodique. La quantité analogue en mécanique quantique est la dérivée par rapport au
temps de la valeur moyenne de r ⋅ p ou l'élément de matrice diagonal du commutateur de r ⋅ p et H
dans la représentation énergie, qui est aussi zéro.
d
r ⋅p =
1
[(r ⋅ p ), H ] = 0
dt ih
 p2 + p2 + p2 
[(r ⋅ p ), H ] = (xp x + yp y + zp z ), x y z + V (x, y, z )
(47)  2m 
 ∂V ∂V ∂V 
= (
ih 2
)
p x + p y2 + p z2 − ih x +y +z 
∂z 
m  ∂x ∂y
= 2ihT − ih(r ⋅ ∇V )
où T est l'énergie cinétique. Nous en concluons que
(48) 2 T = r ⋅ ∇V

Notez que cela n'a pas d'importance de commencer avec r ⋅ p ou p ⋅ r puisque la différence entre
les deux est une constante et donc commute avec H.

Si V est à symétrie sphérique et proportionnel à r n et si la valeur moyenne existe, (48) montre que
2T =nV .
VI.4. Théorie matricielle de l'oscillateur harmonique
L'oscillateur harmonique a été discuté du point de vue de l'équation de Schrödinger. Ce système
peut aussi être traité en manipulant directement les équations matricielles. L'hamiltonien est de la
forme à une dimension avec V ( x ) = 12 Kx 2 :
p2 1 2
(1) H = + Kx
2m 2
où x et p sont hermitiques puisque ce sont des variables dynamiques physiquement mesurables. La
condition quantique est
(2) xp − px = ih

Aucune autre information n'est nécessaire pour obtenir les valeurs propres de l'énergie et les
fonctions propres.

Représentation énergie
Nous travaillons d'abord dans la représentation énergie où H est diagonal. L'équation (1) peut être
écrite en notation de Dirac comme
1
(3) k H l = E k k l = k p j j p l + 12 K k x j j x l
2m
où le symbole de sommation S j a été omit. Maintenant
∗ ∗
(4) j p l = l p + j = lpj
puisque p est hermitique et une expression semblable existe pour les éléments de matrice de x.
Donc, pour les éléments diagonaux de (3), le coté droit est une somme de carrés des valeurs
absolues des éléments matriciels et donc est non négatif. Une valeur propre de l'énergie E k peut
être zéro seulement si les éléments de matrice k p j et k x j sont zéro pour tout j. Cependant,
cela serait inconsistant avec l'élément de matrice diagonal k de (2). Nous en concluons donc que
toutes les valeurs propres de l'énergie sont positives.
Comme prochaine étape, nous calculons le commutateur de x et p avec H :
ih
(5) xH − Hx = p pH − Hp = −ihKx
m

Des équations de ce type sont généralement utiles si la représentation est choisie telle qu'un des
facteurs dans le commutateur est diagonal puisque alors une différente entre deux valeurs propres
apparaît quand un élément de matrice est pris. Donc, la première équation (5) devient
ih
(6) k x j j H l − k H j j x l = (El − E k ) k x l = k pl
m

De même, la deuxième équation (5) devient


(7) (El − E k ) k p l = −ihK k x l

Il suit de l'élimination de k x l des équations (6) et (7) que ou bien k x l = k p l = 0 ou


1
 K 2
(8) El − E k = ± h  = ± hω c
m
où ω c est la fréquence angulaire de l'oscillateur harmonique classique correspondant. Si nous
écartions la première possibilité, les valeurs propres de l'énergie différeraient les unes des autres par
un entier multiple de hω c . Il est alors possible de montrer, comme cela sera fait ci-dessous, que ces
valeurs propres sont égales à (n + 12 )hω c où n est un entier positif ou zéro. Si nous essayons
d'exploiter la première possibilité afin d'avoir des états avec différentes valeurs propres de l'énergie,
nous voyons que les matrices qui représentent x et p sont identiquement zéro pour les nouveaux
états et cela est à nouveau inconsistant avec (2). Donc, les seuls états possibles sont ceux dont les
valeurs propres de l'énergie diffèrent d'un multiple entier de hω c .

Opérateurs de création et de destruction


Les équations (6) et (7) peuvent aussi être combinées d'une manière différente en multipliant la
première par − imω c et en l'ajoutant à la seconde. Le résultat est
(9) (El − E k − hω c ) k ( p − imω c x ) l = 0

Donc, k ( p − imω c x ) l est non nul seulement quand E k = El − hω c . Cela signifie que le résultat
de l'opération avec p − imω c x sur le ket l est un certain multiple du ket k qui a une énergie
diminuée de hω c . De même, il est facile de voir que l'opérateur adjoint hermitique p + imω c x
augmenter l'énergie de tout état de hω c . L'application répétée de l'opérateur d'abaissement sur tout
ket conduira finalement à une difficulté puisque l'énergie doit être positive, sauf s'il y a un état
d'énergie la plus basse 0 tel que
(10) ( p − imω c x ) 0 = 0

L'état d'énergie la plus basse peut être trouvé avec (10) en opérant sur lui à gauche avec p + imω c x .
Le résultat est
[ ]
( p + imω c x )( p − imω c x ) 0 = p 2 + m 2ω c2 x 2 + imω c (xp − px ) 0
( )
(11)
= p 2 + m 2ω c2 x 2 − mhω c 0 = 2m(H − 12 hω c ) 0 = 0

Donc, 0 est un état propre de H avec la valeur propre 12 hω c . L'application de l'opérateur


d'augmentation p + imω c x sur 0 donne un multiple du ket 1 qui a l'énergie 3
2 hω c . Des
applications supplémentaires génèrent une séquence infinie d'états propres qui sont indicés n
avec les valeurs propres de l'énergie
(12) E n = (n + 12 )hω c n = 0, 1, 2,…

Il est souvent pratique de mettre les opérateurs d'augmentation et d'abaissement sous forme sans
dimension en les multipliant par − i (2mhω c ) et i (2mhω c ) 2 , respectivement. Nous appelons
1 1
− −
2

opérateurs de destruction et de création obtenus de cette manière a + et a, respectivement. Il est


facile de voir que
H 1 H 1
(13) aa + = + a+a = −
hω c 2 hω c 2

Donc, a et a + satisfont la relation de commutation


(14) aa + − a + a = 1
et H peut être écrit en fonction de ces opérateurs comme
(15) H = (a + a + 12 )hω c

Il suit des équations (12) et (15) que les valeurs propres de a + a sont les entiers positifs et zéro.
Pour cette raison, a + a est souvent appelé l'opérateur de nombre. Ce résultat est une conséquence
directe de la relation de commutation (14) et ne nécessite aucune autre information. Le fait que les
valeurs propres de a + a , quand a est tout opérateur qui satisfait (14), soient les entiers positifs ou
zéro est utile en relation avec la quantification des champs. Les opérateurs a + et a y apparaissent
ab initio plutôt que comme des combinaisons de x et p et ont la signification physique de
respectivement augmenter de diminuer le nombre de particules représentées par le champ. D'où leur
nom d'opérateurs de création et de destruction. Dans le même contexte, l'opérateur de nombre a + a
spécifie le nombre de particules présentes dans l'état propre du champ.

Matrices pour a, x et p
Les seuls éléments de matrice non nuls de a sont n − 1 a n , que nous appellerons λ n . De même,
les seuls éléments non nuls de a + sont n a + n − 1 , ils sont égaux à λ∗n . Alors, un élément de
matrice diagonal de a + a est
(16) n a + a n = n a + n ′ n ′ a n = λ n
2

où une sommation sur l'ensemble complet n ′ est sous-entendue. Puisque cet élément diagonal est
1
égal à n, λ n est égal à n 2 à un facteur de phase multiplicatif de grandeur unité près, que nous
pouvons choisir égal à un. Donc, les matrices pour a et a + sont
0 1 0 0 
 1 
0 0 2 2
0 
 1 
0 0 0 32 
a= 
0 0 0 0 
 ⋅ 
 
 ⋅ 
 ⋅ 

0 0 0 0 
1 0 0 0 
 1

 2 
0 2 0
1
0 
a =
+
2

0 0 3 0 
 ⋅ 
 
 ⋅ 
(17)  ⋅ 

Le produit a + a peut être effectué à partir de ces matrices. Il est diagonal avec les valeurs propres 0,
1, 2,… comme attendu.

Les expressions pour a et a + en fonction de x et p sont facilement résolues pour donner


1 1
 mhω c  2 +
 h
(18) x = 
2 +
 a + a( ) p = i (
 a −a )
 2mω c   2 

Des matrices explicites pour x et p sont faciles à trouver à partir de (17) et (18). Chacune a des
éléments non nuls qui bordent la diagonale principale sur les deux cotés.
Représentation coordonnées
Le ket 0 peut être trouvé en représentation coordonnées x 0 en résolvant (10) dans cette
représentation. Nous avons
(19) x ( p − imω c x ) 0 = x ( p − imω c x ) x ′ x ′ 0 = 0

δ ( x − x ′) et x x x ′ = xδ ( x − x ′)
d
(20) x p x ′ = −ih
dx
et donc
 d 
(21)  − ih − imω c x  x 0 = 0
 dx 

La solution est
(22) x 0 = A0 e − (mω c / 2 h ) x
2

où A0 est une constante arbitraire. La normalisation


∞ 2
(23) 0 x x 0 ≡ ∫ x 0 dx = 1
−∞
1 1
montre que A0 = (mω c / πh ) 2 = α 2 / π 4 où α a été définit dans l'étude précédente de l'oscillateur
1

harmonique.

Comme remarqué ci-dessus, l'application répétée de l'opérateur de création p + imω c x sur x 0


génère tous les états propres (non normalisés) x n . On vérifie facilement que pour une fonction
arbitraire g ( x )
mω c 
( p + imω c x )g (x ) = −ih d − x  g (x )
(24)  dx h 
d  − mω c x 2 / 2 h
g (x )
mω c x 2 / 2 h
= −i he e
dx  
Une deuxième application de p + imω c x donne
mω x 2 / 2 h d  − mω c x 2 / 2 h
(25) ( p + imω c x ) g ( x ) = −ihe c
2
e [( p + imω c x )g (x )]
dx  
et la substitution dans (24) donne
2
(26) (− ih ) e c
2 mω x / 2 h d
2
e −mω c x 2 / 2h g (x )
2  
dx 

L'induction à ( p + imω c x ) g ( x ) est évidente. Donc, quand g ( x ) est choisi comme (22), nous
n

obtenons
n
mω x 2 / 2 h d − mω c x 2 / 2 h
(27) x n = An e c e
dx n
où An est une constante de normalisation.

Tous ces résultats sont en accord avec ceux obtenus lors de notre étude précédente de l'oscillateur
harmonique.
Exercices
1. Supposez qu'une matrice hermitique donnée puisse être diagonalisée par une matrice unitaire.
Montrez alors que la condition nécessaire et suffisante pour que deux matrices hermitiques
puissent être diagonalisées par la même transformation unitaire est qu'elles commutent.
2. Montrez qu'une matrice non singulière de rang fini doit être carrée. Montrez aussi que dans ce
cas, l'équation AA −1 = 1 implique l'équation A −1 A = 1 .
( )
3. Montrez que det e A = e tr ( A ) . Donnez les conditions sur A qui doivent être supposées dans votre
démonstration.
4. Trouvez deux matrices A et B qui satisfont les équations suivantes :
A2 = O
AA + + A + A = 1
B = A+ A
où O est la matrice nulle et 1 la matrice unité. Montrez que B 2 = B . Obtenez des expressions
explicites pour A et B dans une représentation où B est diagonale, en supposant qu'elle est non
dégénérée. Est-ce que A peut être diagonalisée dans une certaine représentation ?
5. Trouvez trois matrices A, B et C qui satisfont les équations suivantes :
A2 = B 2 = C 2 = 1
AB + BA = BC + CB = CA + AC = O
où O est la matrice nulle et 1 la matrice unité. Obtenez des expressions explicites pour les trois
matrices dans une représentation où A est diagonal, en supposant qu'elle est non dégénérée.
6. Trouvez trois matrices A, B et C qui satisfont les équations suivantes :
A2 = B 2 = C 2 = 1
BC − CB = iA
où 1 est la matrice unité. Montrez que AB + BA = AC + CA = O , où O est la matrice nulle.
Obtenez des expressions explicites des trois matrices dans une représentation où A est diagonal,
en supposant qu'elle est non dégénérée.
7. Si A et B sont deux matrices carrées de même rang et C ≡= [B, A] , montrez que
1
C
A+ B
e =e e e
A B 2

pourvu que [C , A] = [C , B ] = 0 .
8. Si H = p 2 / 2 µ + V (x ) pour le mouvement à une dimension d'une particule et si V ( x ) peut être
exprimé comme un développement en série de x, montrez par des méthodes purement
matricielles que
dx p
=
dt µ
dp dV
=−
dt dx
où x et p sont considérés dans le point de vue de Heisenberg.
9. A( x, p ) et B( x; p ) peuvent être exprimés comme des développements en série de x et p et
[x, p] = ih . Montrez par des méthodes purement matricielles que
lim [A, B ] = {A, B}
1
h → 0 ih

où le coté droit est le crochet de Poisson calculé comme si x et p étaient des variables
classiques.
10. L'hamiltonien H = p 2 / 2 µ + V (r ) a un ensemble de vecteurs propres k avec les valeurs
propres E k . Montrez que, si l est un vecteur donné qui a une valeur propre discrète,
h2
S k (E k − E l ) k x l =
2


où x st une composante cartésienne de r. Comme sous-produit de votre solution, donnez une
démonstration matricielle du problème 9 à la fin de la section III.2.
11. L'hamiltonien de l'oscillateur harmonique peut être écrit en représentation coordonnées comme
h2 d 2
δ ( x − x ′) + Kx 2δ ( x − x ′)
1
x H x′ = − 2
2m dx 2
Transformez H dans la représentation impulsion et trouvez les fonctions d'onde dans cette
représentation qui correspondent aux fonctions d'onde dans la représentation x données dans
l'équation (19) de la section IV.1 ou l'équation (27) de la section VI.4.
12. Montrez que la matrice pour x obtenue à partir des équations (17) et (18) de la section VI.4 est
en accord avec l'équation (28) de la section IV.1 et que l'équation (27) de la section VI.4 est en
accord avec les équations (17) et (19) de la section IV.1.
Annexes

A.1. Tableau des particules élémentaires


L'ensemble des particules élémentaires et résonances (particules dans un état excité et de très courte
durée de vie) est considérable. Nous n'avons repris ici que les principales particules ainsi que les
quelques propriétés qui nous intéressent. Nous ne donnons que les valeurs approximatives. Ce
tableau ne constitue donc qu'un tout petit aperçu des particules élémentaires.

Nous n'avons pas indiqué les particules d'antimatière. Elles se déduisent des particules existantes
par le changement de signe des charges.

L'ensemble de ces particules et leurs propriétés est le résultat de décennies d'étude à l'aide des
accélérateurs de particules élémentaires.

Les particules composites ont une structure interne composée de quarks. On peut avoir plusieurs
structures possibles suivant la charge. Lorsque l'on donne une addition, il s'agit en fait d'une
superposition quantique. La barre sur un symbole indique l'antiparticule.

Particule Nature Charge Masse Durée de vie Etrangeté Spin Structure


(MeV) (s)
e Electron -1 0.511 Stable 0 1/2 Elémentaire
p Proton +1 938.28 Stable 0 1/2 uud
n Neutron 0 939.57 898 0 1/2 ddu
µ Muon -1 105.66 2.19 ⋅ 10 −6 0 1/2 Elémentaire
τ Tau -1 1784.2 3.4 ⋅ 10 −13 0 1/2 Elémentaire
ν Neutrino 0 ~0 Stable 0 1/2 Elémentaire
u Quark 2/3 336 0 1/2 Elémentaire
d Quark -1/3 336 0 1/2 Elémentaire
s Quark -1/3 540 1 1/2 Elémentaire
Photon Interaction 0 0 Stable 0 1 Elémentaire
électromag
nétique
Gluon Interaction 0 0 Stable 0 1 Elémentaire
forte
W Interaction +1 0 1 Elémentaire
faible
Z Interaction 0 0 1 Elémentaire
faible
Λ Baryon 0 1115.6 2.6 ⋅ 10 −10 -1 1/2 uds
Σ Baryon 0, +1, -1 1190 Σ 5.8 ⋅ 10
0 −20 -1 1/2 uus
autre 10 −10 uds
dds
Ξ Baryon 0, -1 1320 2 ⋅ 10 −10 -2 1/2 uus
dss
π Méson 0, +1, -1 135 π + 2.6 ⋅ 10 −8 0 0 ud
π 0 0.8 ⋅ 10 −16 uu + dd
ud
η Méson 0 548.8 Proche de 0 0 0 us
ds d s
us
K Méson 0, +1, -1 497 K+ +1, -1 0 us
1.23 ⋅ 10 −8 ds
autre ds
0.9 ⋅ 10 −10 us

You might also like