Professional Documents
Culture Documents
Ici nous effectuerons une approche de son élaboration en utilisant ce que nous avons vu, les
amplitudes et leurs propriétés.
Nous commencerons par revenir un peu sur le formalisme et par introduire la matrice
hamiltonienne qui permet de décrire l'évolution des états au cours du temps.
Nous serons alors bien armés pour décrire les deux grands volets des systèmes quantiques : les états
liés, comme l'atome, et les états non liés plus communément appelés collisions.
Enfin, nous ferons le lien entre le formalisme de la fonction d'onde et un formalisme général, plus
proche de celui des amplitudes que nous avons utilisé jusqu'ici et appelé formulation matricielle.
I. Hamiltonien
La matrice hamiltonienne est la matrice qui permet d'étudier l'évolution des états quantiques au
cours du temps.
Nous commencerons par étudier comment les amplitudes varient dans le temps.
Puis, après être revenu quelque peu sur le formalisme, nous introduirons la matrice hamiltonienne.
Enfin, armé de ce nouvel outil, nous pourrons étudier quelques systèmes simples à deux états.
I.1. Dépendances des amplitudes en fonction du temps
Un électron tout seul dans le vide peut, dans certaines circonstances, avoir une énergie bien définie.
Par exemple, s'il est au repos (c'est-à-dire s'il n'a pas de mouvement de translation, pas d'impulsion
ni d'énergie cinétique), il a son "énergie de repos". Un objet plus compliqué comme un atome peut
aussi avoir une énergie définie quand il est arrêté, mais il peut aussi être excité et être dans l'un de
ses niveaux d'énergie (nous décrirons plus tard la machinerie qui est derrière tout cela, il suffit juste
de savoir pour le moment que les expériences de spectroscopie confirment cela). Nous
considérerons souvent un atome dans un état excité comme ayant une énergie définie mais, en
réalité, cela n'est qu'approximatif. Un atome ne reste pas excité éternellement car il peut se
décharger de son énergie grâce à son interaction avec le champ électromagnétique. Il y a donc une
certaine amplitude pour qu'un nouvel état soit créé, l'atome étant dans un état d'excitation plus bas
et le champ électromagnétique dans un état supérieur (émission d'un photon). L'énergie totale du
système est la même avant et après mais l'énergie totale de l'atome est réduite. Si bien qu'il est
inexact de dire qu'un atome excité a une énergie bien définie. Mais c'est souvent commode et ce
n'est pas trop faux.
Incidemment, pourquoi cela se passe-t-il toujours dans le même sens ? Pourquoi un atome rayonne-
t-il de la lumière ? La réponse a quelque chose à voir avec l'entropie. Lorsque l'énergie est dans le
champ électromagnétique, elle peut y être de tant de façons différentes, elle a tellement de places
où elle peut aller, que si nous cherchons les conditions d'équilibre, nous trouvons que, dans la
situation la plus probable; le champ est excité, c'est un photon, et l'atome est désexcité. Il faut au
photon beaucoup de temps pour revenir à la même place et trouver qu'il peut cogner l'atome à
nouveau. C'est tout à fait analogue au problème classique : pourquoi une charge accélérée rayonne-
t-elle (elle pourrait très bien changer de direction sous l'impact d'un photon) ? Ce n'est pas parce
qu'elle "veut" perdre de l'énergie, car, en fait, lorsqu'elle rayonne, l'énergie du monde est la même
qu'avant. Radiation ou absorption vont toujours dans le sens de l'entropie croissante. La situation
est d'ailleurs différente lorsque l'atome est placé dans un bain de photons. Le champ
électromagnétique est alors hautement excité et l'atome a nettement plus de chance d'absorber un
photon. Nous reviendrons plus tard sur ce problème dit de la "flèche du temps" d'une manière
beaucoup plus générale.
Les noyaux peuvent aussi exister dans différents niveaux d'énergie et, à l'approximation où l'on
néglige tous les effets électromagnétiques, nous pouvons dire qu'un noyau dans un état excité y
reste. Bien que nous sachions qu'il n'y reste pas toujours, il est souvent utile de commencer avec
une approximation quelque peu idéalisée et plus facile à résoudre. De plus, c'est aussi une
approximation légitime dans certaines circonstances. Un exemple typique est l'introduction de la loi
de la chute des corps où l'on néglige d'abord la friction et pourtant il n'y a presque aucun cas où il
n'y ait une certaine friction.
Il y a ensuite les "particules étranges", subnucléaires, et qui ont des masses variées. Mais les plus
lourdes se désintègrent spontanément en donnant les plus légères, si bien qu'à nouveau il n'est pas
correct de dire qu'elles ont une énergie définie avec précision. Ceci ne serait vrai que si elles
vivaient éternellement. Si bien que lorsque nous faisons l'approximation qu'elles ont une énergie
définie, nous oublions le fait qu'elles doivent exploser. Pour le moment, nous oublierons donc,
intentionnellement de tels processus et nous apprendrons plus tard comment les prendre en compte.
Supposons que nous ayons un atome ou un électron ou n'importe quelle particule qui a au repos une
énergie bien définie E 0 . Ce que nous voulons dire par l'énergie E 0 est la masse de l'objet tout
entier multipliée par c 2 . Cette masse comprend toute énergie interne, si bien qu'un atome excité a
une masse différente de la masse du même atome dans son état fondamental (l'état fondamental est
l'état de plus basse énergie). Nous appellerons E 0 "l'énergie au repos".
Pour un atome au repos, l'amplitude quantique pour trouver l'atome en un certain endroit est la
même partout. Elle ne dépend pas de la position. Cela signifie, bien entendu, que la probabilité de
trouver l'atome est partout la même. Mais cela veut dire plus. La probabilité pourrait être
indépendante de la position, la phase de l'amplitude, elle, changeant de point en point. Mais, pour
une particule au repos, l'amplitude complète est partout la même. Elle dépend cependant du temps.
Pour une particule dans état d'énergie défini E 0 , l'amplitude pour trouver la particule en (x, y, z) au
temps t est
(1) ae − i ( E0 / h )t
où a est une certaine constante. L'amplitude pour être en un point quelconque de l'espace est la
même pour tous les points, mais elle dépend du temps suivant (1). Nous supposerons simplement
que cette règle est vraie. Notons toutefois que cela correspond à une onde stationnaire de longueur
d'onde nulle, ce qui est évident si l'on se souvient de la règle de de Broglie liant vitesse et longueur
d'onde et sa fréquence est simplement donnée par la règle liant énergie et fréquence.
Si les différentes parties d'un atome sont dans des états différents avec différentes énergies totales,
alors, la variation de l'amplitude dans le temps est différente. Si vous ne savez pas dans quel état se
trouve l'atome, il y aura une certaine amplitude pour qu'il soit dans un état et une certaine amplitude
pour qu'il soit dans un autre et chacune de ces amplitudes aura une fréquence différente. Il y aura
une interférence, comme dans un battement, entre ces différentes composantes et elle pourra
apparaître comme une probabilité variant dans le temps. Quelque chose "se passera" dans l'atome,
même si celui-ci est "au repos", c'est-à-dire si son centre de gravité ne se déplace pas. Par contre, si
l'atome a une énergie bien définie et si vous cherchez n'importe quelle probabilité le concernant, la
réponse est indépendante du temps. Quoique les amplitudes dépendent du temps, si l'énergie est
définie, elles changent comme l'exponentielle d'un nombre imaginaire pur et leur module ne change
pas.
C'est pourquoi nous disons souvent qu'un atome dans un état d'énergie définie est dans un état
stationnaire. Quelles que soient les mesures que vous faites de ce qui est à l'intérieur, vous
trouverez que rien ne change avec le temps (pour les probabilités). Pour que les probabilités
changent dans le temps, il faut avoir une interférence de deux amplitudes ayant des fréquences
différentes et cela veut dire que nous ne pouvons pas savoir quelle est l'énergie. L'objet considéré
aura une amplitude pour être dans un des états d'énergie et une autre amplitude pour être dans
l'autre état d'énergie. C'est là la description quantique des choses dont le comportement dépend du
temps.
Si nous avons des conditions telles qu'il y ait un mélange de deux états différents avec des énergies
différentes, alors l'amplitude de chacun des deux états change avec le temps suivant l'équation (2),
comme, par exemple
− i ( E / h )t −i (R / h )t
(4) e 1 et e 2
Et si nous avons une certaine combinaison des deux, nous aurons une interférence. Mais remarquez
que rien ne changerait si nous ajoutions une constante aux deux énergies. Si quelqu'un d'autre
utilisait une échelle d'énergie différente, dans laquelle toutes les énergies seraient augmentées (ou
diminuées) d'une quantité donnée, disons A, les amplitudes des deux états seraient alors, du point
de vue de ce quelqu'un
−i (E + A )t / h −i (E + A )t / h
(5) e 1 et e 2
Toutes ces amplitudes seraient multipliées par le même facteur e −i ( A / h )t et toutes les combinaisons
linéaires ou les interférences auraient le même facteur. Lorsque nous prenons le carré du module
pour trouver les probabilités, tous les résultats sont identiques. Le choix d'une origine pour notre
échelle d'énergie ne change rien. Nous pouvons mesurer l'énergie à partir de n'importe quel zéro.
Des considérations relativistes montrent qu'il est plus élégant de mesurer les énergies de telle façon
que la masse au repos y soit comprise, mais, pour beaucoup de discussions non relativistes, il est
souvent agréable de soustraire une certaine quantité standard de toutes les énergies considérées. Par
exemple, dans le cas d'un atome, il est commode, d'habitude, de soustraire l'énergie m s c 2 où ms est
la masse de l'ensemble des morceaux, le noyau et les électrons, lorsqu'ils sont séparés, ce qui, bien
entendu, est différent de la masse de l'atome tout entier dans son état fondamental. L'énergie qui
apparaît alors est juste l'énergie d'excitation de l'atome. Par conséquent, nous déplacerons parfois
notre zéro d'énergie d'une constante très grande mais cela ne changera rien à condition que nous
déplacions d'une même constante toutes les énergies apparaissant dans un calcul donné. Voilà pour
ce qui concerne une particule au repos.
I.1.2. Mouvement uniforme
Si nous admettons que la théorie de la relativité est juste, une particule au repos dans un système
d'inertie peut être en mouvement uniforme dans un autre système d'inertie. Dans le système de la
particule au repos, l'amplitude de probabilité est la même pour tous les x, y, z mais elle change avec
t. La grandeur de l'amplitude est la même pour tout t mais la phase dépend de t. Nous pouvons
faire une image du comportement de l'amplitude en traçant les lignes d'égales phases, disons les
lignes de phase zéro, en fonction de x et de t. Pour une particule au repos, ces lignes d'égale phase
sont parallèles à l'axe x et sont également espacées le long de la coordonnée t, comme le montrent
les lignes en pointillés de la figure ci-dessous.
Dans une transformation de Lorentz de vélocité v, dans la direction des x négatifs par exemple, le
temps t est relié au temps t ′ par
t ′ − x ′v / c 2
(1) t =
1− v2 / c2
si bien que notre amplitude varie maintenant comme
− (i / h ) E0t ′ / 1− v 2 / c 2 − E0 vx ′ / c 2 1− v 2 / c 2
− ( i / h ) E0 t
(2) e =e
Dans le système primé, elle varie dans l'espace aussi bien que dans le temps. Si nous écrivons
l'amplitude comme
− (i / h ) E ′p t ′ − p ′x′
(3) e
nous voyons que E ′p = E0 / 1 − v 2 / c 2 est l'énergie calculée classiquement pour une particule
d'énergie au repos E 0 voyageant avec la vitesse v et p ′ = E ′p v / c 2 est l'impulsion correspondante.
(6) E p = ( pc )2 + E 02
où, comme auparavant, E 0 est l'énergie au repos. Pour les problèmes non relativistes, nous
pouvons écrire
(7) E p = m s c 2 + W p
où W p est l'énergie que l'atome a, en plus de l'énergie au repos m s c 2 de ses constituants. En
général, W p inclut à la fois l'énergie cinétique de l'atome et son énergie de liaison ou son énergie
d'excitation, que nous pouvons appeler "l'énergie interne". Nous écrirons alors
p2
(8) W p = Wint +
2m
et l'amplitude serait
− (i / h ) W p t −p⋅x
(9) e
Comme nous ferons en général des calculs non relativistes, nous utiliserons cette expression pour
les amplitudes de probabilité.
Remarquons que notre transformation relativiste nous a donné la variation de l'amplitude d'un
atome qui se déplace dans l'espace, sans aucune hypothèse supplémentaire. Le nombre d'ondes,
pour la variation dans l'espace est, d'après (9),
p
(10) k =
h
si bien que la longueur d'onde est
2π h
(11) λ = =
k p
C'est la même longueur d'onde que nous avons employée auparavant pour des particules
d'impulsion p. Cette formule fut tout d'abord obtenue par de Broglie, exactement de cette façon.
Pour une particule en mouvement, la fréquence des variations d'amplitude est encore donnée par
(12) hω = W p
Le carré du module de (9) est exactement 1 et, par conséquent, pour une particule en mouvement,
ayant une énergie bien définie, la probabilité de la trouver est la même partout et ne change pas
avec le temps (il est important de remarquer que l'amplitude est une onde complexe. Si nous
utilisions une onde sinusoïdale réelle, son carré changerait de point en point, ce qui ne peut être
correct).
Nous savons, bien entendu, qu'il y a des situations où les particules vont d'une place à une autre si
bien que leur probabilité dépend de la position et change avec le temps. Comment décrivons-nous
de telles situations ? Nous pouvons le faire en considérant des amplitudes qui sont des
superpositions de deux amplitudes (ou plus), chacune correspondant à un état d'énergie définie. Le
calcul est semblable à celui de l'optique et la somme de deux amplitudes ayant des nombres d'onde
k (c'est-à-dire des impulsions) et des fréquences ω (c'est-à-dire des énergies) différentes donnent
des bosses d'interférence, ou des battements, si bien que le carré de l'amplitude varie dans l'espace
et dans le temps. Ces battements se déplacent avec une "vitesse de groupe" donnée par
∆ω
(13) v g =
∆k
où ∆k et ∆ω sont les différences entre les nombres d'ondes et les fréquences des deux ondes. Pour
des ondes plus compliquées, constituées de la somme de plusieurs amplitudes, toutes proche d'une
même fréquence, la vitesse de groupe est
dω
(14) v g =
dk
Notre résultat est alors le suivant : si nous avons plusieurs amplitudes pour des états purs d'énergie
ayant presque la même énergie, leur interférence donne des "bosses" dont la probabilité et celles-ci
se déplacent dans l'espace avec la vitesse d'une particule classique ayant cette énergie. Nous devons
remarquer, cependant, que lorsque nous disons que nous pouvons ajouter deux amplitudes ayant
des nombres d'ondes différents, pour obtenir un battement correspondant à une particule en
mouvement, nous avons introduit quelque chose de nouveau, quelque chose que nous ne pouvons
pas déduire de la théorie de la relativité. Nous avons décrit ce qu'était l'amplitude d'une particule à
l'arrêt et nous avons déduit ensuite ce qu'elle deviendrait si la particule était en mouvement. Mais
nous ne pouvons pas déduire de ces arguments ce qui se passerait s'il y avait deux ondes se
déplaçant avec des vitesses différentes. Si nous arrêtons l'une, nous ne pouvons pas arrêter l'autre.
Nous avons donc ajouté tacitement l'hypothèse supplémentaire que non seulement (9) est une
solution possible mais encore qu'il peut y avoir de telles solutions avec différentes valeurs de p pour
ce même référentiel et que les différents termes interfèrent.
I.1.3. Energie potentielle, conservation de l'énergie
Nous voudrions discuter maintenant ce qui se passe lorsque l'énergie de la particule peut changer.
Nous commençons en imaginant une particule qui se déplace dans un champ de forces décrit par un
potentiel. Nous discutons tout d'abord l'effet d'un potentiel constant. Supposons que nous ayons une
grande boite en métal, que nous avons chargée à un potentiel électrostatique φ comme ci-dessous.
S'il y a des objets chargés à l'intérieur de la boite, leur énergie potentielle est qφ , ce que nous
appellerons V, et elle est absolument indépendante de la position. La physique ne peut donc pas
changer à l'intérieur car un potentiel constant n'introduit aucune différence en ce qui concerne ce
qui se passe à l'intérieur de la boite. Nous n'avons maintenant aucun moyen de déduire la réponse si
bien que nous devons la deviner. La façon de deviner qui marche est plus ou moins ce que vous
attendiez : pour l'énergie, nous devons employer la somme de l'énergie potentielle V et de l'énergie
E p qui est elle-même la somme des énergies internes et cinétiques. L'amplitude est proportionnelle
à
− (i / h ) E p +V t −p⋅x
(1) e
Le principe général est que le coefficient de t, que nous pouvons appeler ω , est toujours donné par
l'énergie totale du système : énergie interne (ou "masse"), plus énergie cinétique, plus énergie
potentielle :
(2) hω = E p + V
Que peut-on dire maintenant des phénomènes physiques à l'intérieur de la boite ? Qu'obtiendrons-
nous s'il y a différents états d'énergie ? L'amplitude de chaque état a le même facteur
supplémentaire
(4) e − (i / h )Vt
par rapport à ce qu'elle serait pour V = 0. C'est exactement comme un changement du zéro de
l'échelle d'énergie. Cela produit un même changement de phase pour toutes les amplitudes mais,
comme nous l'avons vu auparavant, cela ne change aucune des probabilités. Tous les phénomènes
physiques sont les mêmes (nous avons supposé que nous parlions de différents états d'un même
objet chargé, si bien que qφ est le même pour tous les états. Si un objet pouvait modifier sa charge
en passant d'un état dans un autre nous obtiendrions un résultat tout à fait différent. La conservation
de la charge évite cela).
Jusqu'ici, notre hypothèse est en accord avec ce que nous attendions d'un changement de niveau de
référence pour l'énergie. Mais, si elle est vraiment exacte elle devrait également être vraie pour une
énergie potentielle qui n'est pas une simple constante. En général, V peut changer de façon
arbitraire, à la fois dans le temps et dans l'espace, et le résultat complet pour l'amplitude doit être
exprimé par une équation différentielle. Nous n'avons pas l'intention de nous occuper du cas
général dès maintenant et nous voulons seulement avoir quelque idée de la façon dont les choses se
passent, si bien que nous ne considérerons qu'un potentiel constant dans le temps et variant
lentement dans l'espace. Nous pourrons alors faire la comparaison entre les idées classiques et
quantiques.
Supposez que nous considérions la situation ci-dessus où l'on a deux boites maintenues à des
potentiels constants φ1 et φ 2 et une région intermédiaire où nous supposerons que le potentiel varie
doucement d'une boite à l'autre. Nous imaginons qu'une certaine particule a une amplitude pour être
trouvée dans l'une de ces régions. Nous supposons aussi que l'impulsion est suffisament grande
pour que le potentiel soit presque constant dans n'importe quelle petite région contenant plusieurs
longueurs d'onde. On peut alors penser que l'amplitude doit avoir la forme (1) dans toute région de
l'espace avec le V correspondant à cette région.
Considérons le cas spécial dans lequel φ1 = 0 , si bien que l'énergie potentielle est zéro à gauche et
où de plus qφ 2 est négatif, si bien que, classiquement, la particule aurait plus d'énergie dans la
deuxième boite. Classiquement, elle irait plus vite dans la deuxième boite, elle aurait plus d'énergie
et, par conséquent, plus d'impulsion. Voyons maintenant comment tout cela peut sortir de la
mécanique quantique.
(nous admettons que l'énergie interne ne change pas et reste la même dans les deux régions). La
question est alors : comment les deux amplitudes se raccordent-elles dans la région entre les deux
boites ?
Nous allons supposer que les potentiels sont tous constants dans le temps, si bien que rien ne
change dans les conditions du problème. Nous supposerons alors que les variations de l'amplitude
(c'est-à-dire de la phase) ont la même fréquence partout, car, pour ainsi dire, il n'y a rien dans le
"milieu" qui change avec le temps. Si rien ne change dans l'espace, nous pouvons considérer que
l'onde d'une région "engendre" des ondes secondaires dans tout l'espace, oscillant toutes à la même
fréquence, exactement comme des ondes lumineuses passant à travers des objets au repos sans
changer de fréquence. Si les fréquences de (5) et (6) sont les mêmes, il faut que nous ayons
p2 p2
(7) Wint + 1 + V1 = Wint + 2 + V2
2m 2m
Les deux membres de cette équation ne sont rien d'autre que des énergies totales classiques, si bien
que (7) est un énoncé de la conservation de l'énergie. En d'autres termes, l'énoncé classique de la
conservation de l'énergie est équivalent à l'énoncé quantique, selon lequel la fréquence d'une
particule est la même partout si les conditions ne changent pas avec le temps. Tout cela est en
accord avec l'idée que hω = E . C'est aussi une justification d cette règle quantique.
Dans le cas particulier où V1 = 0 et V2 est négatif, l'équation (7) montre que p 2 est plus grand que
p1 et, par conséquent, que la longueur d'onde des ondes est plus petite dans la région 2. Les
surfaces d'égale phase sont indiquées par les lignes en tirets dans la figure. Nous avons fait aussi un
dessin de la partie réelle de l'amplitude qui montre à nouveau comment la longueur d'onde décroît
en passant de la région 1 à la région 2. La vitesse de groupe des ondes, qui est p / m , augmente
également de la façon prévue d'après la conservation classique de l'énergie puisque celle-ci n'est
rien d'autre que l'équation (7).
Il y a un cas particulier intéressant où V2 devient si grand que V2 − V1 devient plus grand que
p12 / 2m . Alors p 22 , qui est donné par
p2
(10) p 22 = 2m 1 − V2 + V1
2m
est négatif. Cela veut dire que p 2 est un nombre imaginaire, disons ip ′ . Classiquement, nous
dirions que la particule n'entre jamais dans la région 2, elle n'a pas assez d'énergie pour escalader la
barrière de potentiel. Cependant, quantiquement, l'amplitude est encore donnée par (6). Sa variation
dans l'espace est encore comme
(11) e(i / h )p 2 ⋅x
Mais si p 2 est imaginaire, la variation dans l'espace devient celle d'une exponentielle réelle.
Admettons que la particule va initialement dans la direction +x. L'amplitude varie alors comme
(12) e − p′x / h
De même, si l'on place une seconde surface près de celle où la lumière se réfléchit complètement,
on peut obtenir un peu de lumière transmise dans le deuxième milieu. Il se passe quelque chose de
semblable pour les particules en mécanique quantique.
S'il y a, dans une petite région, un potentiel V, assez grand pour que l'énergie cinétique classique
soit négative, une particule classique ne peut jamais passer au travers. Mais quantiquement,
l'amplitude, qui décroît exponentiellement, peut passer à travers cette région et donner une petite
probabilité pour que la particule soit trouvée de l'autre coté, là où l'énergie cinétique est à nouveau
positive. La situation est illustrée ci-dessus. Cet effet est appelé "pénétration d'une barrière de
potentiel" ou "effet tunnel".
La pénétration d'une barrière par une amplitude quantique donne l'explication, ou la description, de
la désintégration α du noyau d'uranium. L'énergie potentielle d'une particule α, comme fonction de
la distance au centre est indiquée dans la figure (a) ci-dessus. Si on essayait de tirer une particule α
d'énergie E dans le noyau, elle subirait une répulsion électrostatique de la part de la charge
nucléaire Z et, classiquement, elle ne viendrait pas à une distance du noyau plus petite que r1 , là où
son énergie totale est égale à l'énergie potentielle V. Pourtant, plus près, l'énergie potentielle est
beaucoup plus basse à cause de la forte attraction due aux forces nucléaires à courte portée.
Comment se fait-il alors que, dans une désintégration radioactive, nous trouvions des particules α
qui sont parties de l'intérieur du noyau et en sortent avec l'énergie E ? C'est parce qu'elles partent de
l'intérieur du noyau avec l'énergie E et "s'infiltrent" à travers la barrière de potentiel. L'amplitude de
probabilité est à peu près comme on l'a esquissée dans la partie (b) ci-dessus, quoique la
décroissance exponentielle soit en fait beaucoup plus rapide que celle qui est indiquée. Il est en fait
tout à fait remarquable que la vie moyenne d'une particule α dans le noyau d'uranium soit aussi
grande que 4 milliards et demi d'années, alors que les oscillations naturelles à l'intérieur du noyau
sont aussi rapides, de l'ordre de 10 22 par secondes ! Comment peut-on obtenir un nombre comme
10 9 années à partir de 10 −22 seconde ? La solution vient de ce que l'exponentielle donne un facteur
terriblement petit de l'ordre de e −45 , ce qui donne une probabilité de fuite très petite, quoique
définie. Une fois qu'une particule α est dans le noyau, il n'y a presque pas d'amplitude pour la
trouver au dehors. Cependant, si vous prenez assez de noyaux et si vous attendez assez longtemps,
vous pouvez avoir de la chance et en trouver une qui est sortie.
I.1.4. Forces, la limite classique
Supposez que nous ayons une particule en mouvement, passant à travers une région où il y a un
potentiel qui varie à angle droit avec le mouvement. Classiquement nous décririons la situation
comme on l'a esquissée ci-dessous.
Si la particule se déplace le long de x et entre dans une région où il y a un potentiel qui varie avec
y, la particule subit une accélération transverse due à la force F = −∂V / ∂y . Si la force n'est
présente que dans une région bien limitée de largeur w, la force n'agit que le temps w/v. La
particule reçoit une impulsion transverse
w
(1) p y = F
v
A nous maintenant de voir si notre idée que les ondes se comportent comme dans la section
précédente permet d'expliquer ce même résultat. Nous considérons le même problème
quantiquement, en admettant que tout est très grand en comparaison de la longueur d'onde de nos
amplitudes de probabilité. Dans n'importe quelle petite région, nous pouvons dire que l'amplitude
varie comme
(4) e − (i / h )[(W + p )
/ 2 m +V t − p⋅x ]
2
Pouvons-nous montrer que ceci donne une déflexion de la particule lorsque V a un gradient
transversal ? Sur la figure ci-dessus nous avons esquissé ce à quoi ressembleront les ondes
d'amplitudes de probabilité. Nous avons dessiné un ensemble de "nœuds" de ces ondes, que vous
imaginez comme des surfaces où la phase de l'amplitude est zéro. Dans n'importe quelle petite
région, la longueur d'onde, la distance entre deux nœuds successifs, est
h
(5) λ =
p
où p est relié à V par
p2
(6) W + + V = const.
2m
Dans la région où V est grand, p est plus petit et la longueur d'onde est plus grande. Si bien que
l'angle des plans nodaux change comme le montre la figure.
Pour trouver la façon dont l'angle entre les plans nodaux change, nous remarquons qu'il y a une
différence de potentiel ∆V = (∂V / ∂y )D entre les deux chemins a et b de la figure, si bien qu'il y a
une différence ∆p entre les impulsions des deux chemins qui peut être obtenue à partir de (6) :
p2 p
(7) ∆ = ∆p = −∆V
2m m
Le nombre d'ondes p / h est par conséquent différent le long des deux chemins, ce qui signifie que
les phases évoluent de façons différentes. La différence entre les accroissements de phase est
∆k = ∆p / h , si bien que la différence de phase accumulée sur la distance totale w est
∆p
(8) ∆( phase ) = ∆k ⋅ w =
m
⋅w = − ∆V ⋅ w
h ph
Ceci donne la quantité dont la phase du chemin b est "en avance" sur la phase du chemin a, lorsque
les ondes sortent du potentiel. En dehors du potentiel une telle avance de phase correspond à une
avance du plan nodal de
λ h
(9) ∆x = ∆( phase ) = ∆( phase )
2π p
ou
m
(10) ∆x = − 2 ∆V ⋅ w
p
En nous rapportant à la figure, nous voyons que les nouveaux fronts d'onde font un angle δθ donné
par
(11) ∆x = Dδθ
si bien que nous avons
m
(12) Dδθ = − 2 ∆V ⋅ w
p
Le résultat que nous venons d'obtenir n'est correct que si les variations du potentiel sont lentes et
sans discontinuités, ce que nous appelons la limite classique. Nous avons montré que dans ces
conditions nous obtenons, pour une particule, le même mouvement que celui que nous avions
obtenu à partir de F = ma , à la condition que nous supposions que le potentiel change la phase de
l'amplitude de probabilité d'une quantité égale à Vt / h . A la limite classique, la mécanique
quantique est en accord avec la mécanique newtonienne.
I.2. Matrice hamiltonienne
La première idée est la grande ressemblance mathématique entre les équations de la mécanique
quantique et le produit scalaire de deux vecteurs. Vous vous rappelez que si χ et φ sont deux
états, l'amplitude pour partir de φ et finir en χ peut être écrite comme la somme, su un ensemble
complet d'états de base, des amplitudes pour aller de φ jusqu'à l'un des états de base et ensuite de
cet état de base jusqu'en χ :
(1) χ φ = ∑
tout i
χ i iφ
Nous voulons comparer l'équation (1) avec la formule du produit scalaire de deux vecteurs B et A.
Si B et A sont des vecteurs ordinaires à trois dimensions, nous pouvons écrire le produit scalaire de
cette façon :
(2) ∑ (B ⋅ e i )(e i ⋅ A )
tout i
avec la convention que le symbole e i indique les trois vecteurs unité selon les directions x, y et z.
B ⋅ e1 est alors ce que nous appelons d'habitude B x , B ⋅ e 2 est ce que nous appelons d'habitude B y
et ainsi de suite. L'équation (2) est donc équivalente à
(3) B x Ax + B y Ay + B z Az
qui est le produit scalaire B ⋅ A .
En comparant les équations (1) et (2), nous pouvons voir l'analogie suivante : les états φ et χ
correspondent aux deux vecteurs A et B. Les états de base i correspondent aux vecteurs particuliers
e i , par rapport auxquels nous rapportons tous les autres vecteurs. Tout vecteur peut être représenté
comme une combinaison linéaire de trois "vecteurs de base" e i . De plus, si vous connaissez les
coefficients de chaque vecteur de base dans cette combinaison, c'est-à-dire les trois composantes,
vous connaissez tout sur ce vecteur. De façon semblable, tout état quantique peut être écrit
complètement par les amplitudes i φ pour aller dans les états de base et si vous connaissez ces
coefficients, vous savez tout ce qu'il y a à savoir sur cet état. Du fait de cette grande analogie, on
appelle souvent "vecteur d'état" ce que nous avons appelé un "état".
Comme les vecteurs de base sont tous à angles droits, nous avons la relation
(4) e i ⋅ e j = δ ij
Cela correspond au caractère exclusif des états de base (états intermédiaires) entre les états de base
i,
(5) i j = δ ij
qui justifie l'affirmation que les états de base i sont tous "orthogonaux".
Il y a une différence mineure entre l'équation (1) et le produit scalaire. Nous savons que
∗
(6) φ χ = χ φ
Avec les nombres complexes de la mécanique, il nous faut conserver l'ordre des termes alors que
pour le produit scalaire habituel, cela n'a pas d'importance.
Elle est un peu inhabituelle, mais correcte. Elle signifie la même chose que
(9) A = ∑ Ai e i = Ax e x + Ay e y + Az e z
i
Remarquez cependant que l'équation (8) contient une quantité qui est différente d'un produit
scalaire. Un produit scalaire est seulement un nombre alors que l'équation (8) est une équation
vectorielle. L'une des grandes astuces de l'analyse vectorielle fut d'abstraire de ces équations l'idée
de "vecteur". On pourrait, de façon semblable, être tenté d'abstraire de la formule quantique (1)
quelque chose d'analogue à un "vecteur" et, bien entendu, on peut le faire. Nous ôtons les χ des
deux côtés de l'équation (1) et nous écrivons l'équation suivante :
(10) φ = ∑ i i φ
i
Il se trouve que nous avons écrit la plus part de nos résultats avec des nombres (les amplitudes).
Comment nous sommes-nous arrangés pour éviter les vecteurs ? Il est amusant de remarquer que
même en algèbre vectorielle ordinaire, nous pourrions faire que toutes les équations ne contiennent
que des nombres. Par exemple, au lieu d'une équation vectorielle comme
(11) F = ma
nous pourrions toujours écrire
(12) C ⋅ F = C ⋅ (ma )
Nous avons alors une équation entre produits scalaires qui est vraie pour tout vecteur C. Mais si
elle est vraie pour tout C, cela ne fait guère de sens de continuer à écrire le C ! Et si nous
choisissons pour C un vecteur de base, l'équation (12) devient une relation entre composantes,
c'est-à-dire aussi une équation (ou plutôt des équations, pour chaques composantes) entre nombre.
C'est exactement ce que nous avons fait avec les amplitudes d'être dans tel ou tel état de base i.
Regardez maintenant l'équation (1). C'est une équation qui est vraie pour tout χ . Pour alléger
l'écriture nous aurions pu laisser le χ de côté et écrire à la place l'équation (10). Elle contient la
même information; à condition que nous admettions qu'elle doive toujours être "achevée" en la
"multipliant à gauche par", ce qui veut simplement dire en remettant à leur place, un certain χ
des deux côtés. L'équation (10) signifie donc exactement la même chose que l'équation (1), ni plus,
ni moins. Lorsque vous voulez des nombres, vous y mettez le χ que vous voulez.
Vous vous êtes peut-être déjà posé des questions sur le φ de l'équation (10). Comme l'équation est
vraie pour tout φ , pourquoi gardons-nous ce φ ? Et de fait, Dirac suggéra que le φ pouvait tout
aussi bien être supprimé, si bien que nous n'avons plus que
(13) | = ∑ i i
i
Et ceci est la grande loi de la mécanique quantique (il n'y a pas d'analogue en analyse vectorielle) !
Cette équation dit que si vous mettez n'importe quelle paire d'états χ et φ à gauche et à droite,
vous revenez à l'équation (1). Ce n'est pas vraiment utile, mais c'est une façon commode de se
rappeler que l'équation (1) est vraie pour toute paire d'états.
I.2.2. Décomposition des vecteurs d'états
Continuons notre approfondissement du formalisme avec la décomposition des vecteurs d'états ce
qui va nous permettre d'introduire les opérateurs.
Nous pouvons écrire une équation semblable pour tout autre vecteur d'état, disons χ , avec bien
entendu des coefficients différents, disons Di , nous avons alors
(3) χ = ∑ i Di
i
Supposez que nous ayons commencé en ôtant le φ dans l'équation (1) de la section précédente.
Nous aurions eut
(4) χ = ∑ χ i i
i
∗
En vous rappelant que χ i = i χ , nous pouvons écrire ceci comme
(5) χ = ∑ Di∗ i
i
Maintenant, le fait intéressant est qu'il nous suffit de multiplier l'une part l'autre les équations (5) et
(2) pour obtenir χ φ . Lorsque nous faisons cela, nous devons faire attention à la sommation des
indices car ils sont tout à fait différents dans les deux équations. Commençons par récrire l'équation
(5) comme
(6) χ = ∑ D ∗j j
j
ce qui ne change rien puisque nous avons juste renommé un indice muet. En la combinant avec
l'équation (2), nous avons
(7) χ φ = ∑ D ∗j j i C i
ij
Mais rappelez-vous que j i = δ ij , si bien que seuls nous restent les termes de la somme tels que j
= i. Nous obtenons
(8) χ φ = ∑ Di• C i
i
∗
où, bien entendu, Di∗ = i χ = χ i et C i = i φ . Nous voyons à nouveau la grande analogie
avec le produit scalaire
(9) A ⋅ B = ∑ Ai Bi
i
La seule différence est dans la conjugaison complexe de Di . L'équation (8) dit donc que si les
vecteurs d'états χ et φ sont exprimés en fonction des vecteurs de base i ou i , l'amplitude
pour aller de φ à χ est donnée par un genre de produit scalaire comme dans l'équation (8). Cette
équation n'est autre, bien sûr, que la première équation de la section précédente écrite avec des
symboles différents. Nous n'avons donc fait que tourner en rond, pour nous habituer aux nouveaux
symboles.
Nous devrions peut-être insister à nouveau sur le fait que les vecteurs de l'espace à trois dimensions
sont écrits à partir de trois vecteurs orthogonaux, par contre, les vecteurs de base i de la
mécanique quantique doivent former l'ensemble complet correspondant à un problème particulier.
Selon la situation, deux, trois, cinq ou un nombre infini de vecteurs de base peuvent être
nécessaires.
Considérons maintenant le cas où des particules passent à travers un certain appareil, modifiant les
amplitudes. Si nous partons avec ces particules dans un certain état φ et si nous les envoyons
ensuite à travers un appareil, si enfin nous faisons une mesure pour voir si elles sont dans un état
χ , le résultat est donné par une amplitude qui peut être écrite comme
(10) χ A φ
où A exprime la modification apportée à l'amplitude par l'appareil.
Un tel symbole n'a pas d'analogue direct en algèbre vectorielle (il est en fait plus proche de l'algèbre
tensorielle, mais l'analogie n'est pas particulièrement utile, nous aurons des outils plus appropriés
avec les opérateurs et les matrices). En considérant les états intermédiaires possibles (les états de
base) à l'entrée et à la sortie de l'appareil, on peut automatiquement écrire (10) comme
(11) χ A φ = ∑ χ i i A j j φ
ij
De même, si nous mettons un autre appareil B en série avec A, on peut écrire l'ensemble comme
BA (vu comme une simple concaténation des deux symboles ou comme un produit qui reste à
définir). On peut alors écrire
(12) χ BA φ = ∑ χ i i B j j A k k φ
ijk
ce qui détermine ψ . "Mais non, cela ne détermine pas ψ ", direz-vous, "cela ne détermine que
i ψ ". Et pourtant i ψ détermine bien ψ , car si vous avez tous les coefficients qui relient ψ
aux états de base i, ψ est alors défini de manière unique. En fait, nous pouvons jouer avec notre
notation et écrire le dernier terme de (14) comme
(15) i ψ = ∑ i j j A φ
j
Alors, comme cette équation est vraie pour tout i, nous pouvons écrire simplement
(16) ψ = ∑ j j A φ
j
Nous pouvons dire alors : "l'état ψ est ce que nous obtenons si nous partons avec φ et passons à
travers l'appareil A".
Un dernier exemple des trucs du métier. Nous partons encore avec l'équation (11). Comme elle est
vraie pour tout χ et pour tout φ , nous pouvons les laisser tous les deux de coté ! Nous obtenions
alors
(17) A = ∑ i i A j j
ij
En toute rigueur on devrait écrire |A| au lieu de A mais cela ressemblerait au symbole pour "valeur
absolue de A", si bien qu'on supprime généralement les barres. De façon générale, la barre | se
comporte comme le facteur un. Parfois, pour distinguer A d'un nombre ou d'une matrice, on l'écrit
comme Â, nous le ferons parfois, mais le contexte permet toujours de savoir la nature de l'objet
mathématique présent.
Qu'est-ce que cela signifie ? Cela ne signifie ni plus, ni moins que ce que vous obtenez si vous
remettez le φ et le χ à leurs places. Telle qu'elle est, c'est une équation "ouverte" et incomplète. Si
nous la multiplions "à gauche" par φ , elle devient
(18) A φ = ∑ i i A j j φ
ij
ce qui est exactement (16), une fois de plus. En fait, nous pourrions simplement laisser les j de coté
et écrire cette équation
(19) ψ = A φ
Le symbole A n'est ni une amplitude, ni un vecteur. C'est une nouvelle sorte d'objet mathématique
appelé un "opérateur". C'est quelque chose qui "agit" (opère) sur un état pour produire un nouvel
état. L'équation (19) dit que ψ est ce qui résulte de l'action de A sur φ . A nouveau, c'est une
équation ouverte jusqu'à ce qu'elle soit complétée par un bra donné comme χ pour donner
(20) χ ψ = χ A φ
Bien entendu, l'opérateur A est complètement déterminé si nous donnons la matrice des amplitudes
i A j , que l'on écrit aussi Aij , en fonction d'un ensemble quelconque de vecteurs de base.
Notez aussi que les facteurs intervenant dans (12) ne sont rien d'autre qu'un produit matriciel de A
et de B.
Nous n'avons réellement rien ajouté de nouveau avec cette nouvelle notation mathématique. Une
des raisons pour l'introduire est de vous montrer comment on écrit des morceaux d'équations car
vous trouverez dans de nombreux livres les équations écrites sous leur forme incomplète et il n'y a
aucune raison que vous soyez paralysés lorsque vous les rencontrerez. Si vous le préférez, nous
pouvons toujours ajouter les morceaux qui manquent pour avoir une équation entre des nombres
qui ressemble à quelque chose de plus familier.
Par ailleurs, comme vous le verrez, la notation avec les bra et les ket est très commode. D'une part
nous pouvons dès maintenant identifier un état en donnant son vecteur d'état. Quand nous voulons
désigner un état d'impulsion définie p, nous pouvons dire "l'état p ". Nous pouvons aussi parler
d'un état arbitraire ψ . Pour être cohérent nous utiliserons toujours le ket et nous écririons ψ
pour désigner un état (c'est évidemment un choix arbitraire et nous aurions tout aussi bien pu
choisir d'employer le bra ψ ).
I.2.3. Quels sont les états de base du monde ?
Nous avons découvert que n'importe quel état du monde peut être représenté comme une
superposition, une combinaison linéaire avec des coefficients convenables, d'états de base. Vous
pouvez vous demander tout d'abord, quels états de base ? Et bien, il y a de nombreuses possibilités
différentes. Vous pouvez, par exemple, projeter un spin sur la direction z ou sur une autre direction.
Il y a beaucoup, beaucoup de représentations différentes, qui sont les analogues des différents
systèmes de coordonnées que l'on peut employer pour représenter des vecteurs ordinaires. Comme
nous l'avions déjà signalé, un espace vectoriel a une infinité de bases. Ensuite, quels coefficients ?
Et bien, ceci dépend des conditions physiques. Des ensembles de coefficients différents
correspondent à des conditions physiques différentes. La chose importante à connaître est
"l'espace" dans lequel vous travaillez. En d'autres termes, quelle est la signification physique des
états de base ? La première chose qu'il faut donc savoir est, en général, à quoi ressemblent les états
de base ? Vous pouvez alors comprendre comment décrire une situation donnée en fonction de ces
états de base.
Nous voudrions anticiper un peu et parler un petit peu de ce que va être la description quantique
générale de la nature, en termes d'idées courantes dans la physique d'aujourd'hui. Tout d'abord, on
choisit une représentation particulière pour les états de base, différentes représentations sont
toujours possibles. Par exemple, pour une particule de spin un demi, nous pouvons utiliser les états
"plus" ou "moins" par rapport à l'axe z. Mais l'axe z n'a rien de spécial, vous pouvez toujours
prendre n'importe quel autre axe si vous le préférez. Cependant, par souci de cohérence, nous
prendrons toujours l'axe z. Supposons que nous commencions avec une situation à un électron. En
plus des deux possibilités pour le spin ("en haut" et "en bas" le long de l'axe z), il y a aussi
différentes possibilités pour l'impulsion de l'électron. Nous choisissons un ensemble d'états de base,
chacun correspondant à une valeur de l'impulsion. Mais que faire si l'électron n'a pas d'impulsion
définie ? Cela va encore. Nous ne faisons que dire ce que sont les états de base. Si l'électron n'a pas
une impulsion définie il a une certaine amplitude pour avoir une impulsion donnée et une autre
amplitude pour avoir une autre impulsion, et ainsi de suite. Et s'il n'est pas nécessairement en train
de tourner spin en haut, il a une certaine amplitude pour être spin en haut avec une impulsion
donnée et une autre amplitude pour être spin en bas avec la même impulsion, etc. La description
complète d'un électron, pour autant que nous le sachions, ne requiert que l'impulsion et le spin pour
décrire les états de base. Un ensemble d'états de base i acceptable pour un seul électron est donc
décrit par les différentes valeurs de l'impulsion et les positions en haut ou en bas du spin. Différents
mélanges d'amplitudes, c'est-à-dire des combinaisons des C décrivent différentes situations. On
décrit ce que fait un électron particulier en disant ce qu'est son amplitude pour être spin en haut ou
spin en bas et pour avoir une impulsion ou une autre, et ceci pour toutes les impulsions possibles.
Vous voyez ainsi ce qui intervient dans une description quantique complète d'un seul électron.
Que dire des systèmes à plus d'un électron ? Les états de base deviennent alors plus compliqués.
Supposons que nous ayons deux électrons. Tout d'abord, nous avons quatre états de spin possibles :
les deux électrons spin en haut, le premier en bas et le deuxième en haut, le premier en haut et le
deuxième en bas, les deux en bas. Nous avons aussi à préciser que le premier électron a l'impulsion
p1 et le deuxième électron l'impulsion p 2 . Les états de base pour les deux électrons requièrent que
l'on spécifie deux électrons et deux spins. Avec sept électrons, nous avons à spécifier sept de
chaque.
Si nous avons un proton et un électron, il nous faut spécifier la direction du spin du proton et son
impulsion, la direction du spin de l'électron et son impulsion. Du moins, ceci est
approximativement vrai. Nous ne savons pas réellement ce qu'est la représentation correcte du
monde. C'est très bien de commencer en supposant que si vous spécifiez le spin d'un électron et son
impulsion et de même pour un proton, vous avez tous les états de base. Mais alors, et les
"entrailles" du proton ? Prenons la chose de la façon suivante. Dans un atome d'hydrogène qui a un
proton et un électron, nous avons beaucoup d'états de base différents à décrire, les spins du proton
et de l'électron en haut ou en bas et les différentes valeurs possibles des impulsions du proton et de
l'électron. Il y a donc différentes combinaisons des amplitudes C i qui, toutes ensembles, décrivent
les caractéristiques de l'atome d'hydrogène tout entier comme une "particule". Si nous ne savions
pas que l'atome d'hydrogène est fait d'un proton et d'un électron, nous aurions pu commencer en
disant "oh !, mais je sais quels sont les états de base, ils correspondent à des impulsions
particulières de l'atome d'hydrogène". Non, car l'atome d'hydrogène a des constituants internes. Il
peut, par conséquent, avoir différents états d'énergie interne et il faut plus de détails pour décrire sa
vraie nature.
La question se pose alors : le proton a-t-il des constituants internes ? La réponse est oui. Devons-
nous décrire un proton en donnant tous les états possibles des quarks, gluons, mésons et autres
particules étranges ? En principe oui. Et quoique nous supposions que l'électron soit simple, si bien
que nous n'ayons à donner que son impulsion et son spin, peut-être allons nous découvrir demain
que l'électron a aussi toute une mécanique interne. Cela voudrait dire que notre représentation est
incomplète ou fausse ou approximative, de la même façon qu'une représentation de l'atome
d'hydrogène qui le décrit seulement par son impulsion est incomplète puisqu'elle ne tient pas
compte du fait que l'atome d'hydrogène peut avoir été excité. Si l'électron pouvait être excité et être
changé en quelque chose d'autre, en muon par exemple (une espèce d'électron lourd observé en
particulier dans les accélérateurs de particules), il serait alors décrit non seulement en donnant les
états de la nouvelle particule, mais probablement aussi l'état de quelque mécanique interne
compliquée. Aujourd'hui, le problème essentiel dans l'étude des particules fondamentales est de
découvrir quelles sont les représentations correctes pour la description de la nature. Actuellement,
nous nous contentons de deviner que pour l'électron il suffit de spécifier l'impulsion et le spin. Nous
pensons aussi qu'il y a un proton idéal avec une structure interne et entouré de mésons pi, de
mésons k, etc., qui doivent tous être décrits. Plusieurs douzaines de particules, c'est de la folie ! La
question de savoir ce qui est une particule fondamentale et ce qui n'est pas une particule
fondamentale, un sujet dont on entend souvent parler, revient à se demander à quoi ressemblera la
représentation finale dans l'ultime description quantique du monde. Les impulsions des électrons
seront-elles encore les bonnes quantités pour décrire la nature ? La question elle-même a-t-elle un
sens ? On doit toujours se poser cette question dans toute investigation scientifique. Quoi qu'il en
soit, il y a là un problème. Comment trouver une représentation ? Nous ne savons pas la réponse !
Nous ne savons même pas si c'est là le "bon" problème. Mais, si c'est le bon, nous devons d'abord
essayer de trouver si une particule donnée est fondamentale ou non.
En mécanique quantique non relativiste, si les énergies ne sont pas trop élevées de façon que nous
ne dérangiez pas le jeu interne des particules, étranges et autres, vous pouvez faire du très bon
travail sans vous soucier de ces détails. Vous pouvez décider de ne spécifier que les impulsions et
les spins des électrons et des noyaux. Tout se passera très bien. Dans la plupart des réactions
chimiques et dans les autres phénomènes à basse énergie, rien ne se passe dans les noyaux. Ils ne
sont pas excités. De plus, si un atome d'hydrogène se déplace lentement et qu'il se cogne
doucement contre d'autres atomes d'hydrogène, sans jamais passer dans un état excité et sans
rayonner, ni rien faire de compliqué comme cela, mais en restant toujours dans l'état fondamental
de son énergie interne, vous pouvez utiliser l'approximation selon laquelle vous parlez de l'atome
d'hydrogène comme d'un objet, une particule, et vous pouvez ne pas vous soucier du fait qu'il peut
se passer quelque chose à l'intérieur. Cela sera une bonne approximation tant que l'énergie
cinétique, dans n'importe quelle collision est bien au-dessous de 10 électrons volts, l'énergie requise
pour exciter l'atome d'hydrogène dans un état interne différent. Bien sûr, la mécanique quantique
étant probabiliste on pourrait dire qu'il y a toujours une certaine probabilité pour que l'atome se
retrouve dans un état excité. Cela est vrai mais on peut alors dire que l'approximation est acceptable
si les amplitudes impliquant des changements de l'état interne sont extrêmement petites,
négligeables en pratique, devant les amplitudes utilisées pour décrire l'objet comme une particule
sans structure interne. Nous ferons souvent l'approximation selon laquelle nous ne tenons pas
compte de la possibilité d'un mouvement interne, diminuant ainsi le nombre de détails que nous
devons inclure dans nos états de base. Bien entendu, nous oublions alors certains phénomènes qui
apparaîtraient (en général) à des énergies plus élevées, mais, en faisant de telles approximations
nous pouvons simplifier énormément l'analyse des problèmes. Par exemple, nous pouvons discuter
la collision de deux atomes d'hydrogène à basse énergie, ou n'importe quelle réaction chimique,
sans nous inquiéter du fait que les noyaux atomiques pourraient être excités. En résumé, quand
nous pouvons négliger les effets des états excités d'une particule, nous pouvons choisir un ensemble
d'états de base constitué des états dont l'impulsion et la composante z du moment angulaire sont
définis.
Une telle attitude pourrait être critiquée. Mais elle se justifie parfaitement pour deux raisons et se
modère pour une troisième raison :
Nous n'avons pas la connaissance infuse de tout ce qui permet de décrire le monde. Nous
sommes bien obliger d'admettre notre méconnaissance de certains détails, de certaines lois
physiques, des états de base complets du monde. Mais cela ne doit pas nous paralyser. Nous
n'avons aucune chance de découvrir dans un éclair de génie l'infinie complexité du monde.
Nous décrivons donc ce que nous connaissons et nous progressons en le confrontant à
l'expérience et en améliorant nos théories. C'est d'ailleurs dans l'esprit de la méthode
scientifique : c'est l'expérience qui nous guide, qui fixe les limites et qui tranche.
La physique a aussi des buts pratiques. Elle n'est pas conçue uniquement comme une élégante
description du monde devant laquelle on serait en extase en soupirant du bonheur du travail
accomplit. La physique est aussi construite pour comprendre les phénomènes physiques les plus
divers, prédire leurs comportements, les maîtriser et les utiliser dans toutes sortes d'applications
: lasers, transistors, télévisions, etc. Si l'on veut arriver à un tel résultat, il faut pouvoir mener les
calculs et obtenir des résultats quantitatifs, des résultats numériques (des tensions, des positions,
des intensités, des durées, etc.) Inutile de s'extasier devant des équations si elles ne servent pas
ou si l'on est incapable de les résoudre. Or les équations peuvent vite devenir inextricables et
impossibles à résoudre. Surtout si le système est un tant soit peut complexe et réaliste. Même
des calculs numériques menés sur ordinateur trouvent vite leurs limites. Il faut donc bien, à un
moment donné, faire des choix, des approximations. Dans ce cas, pourquoi s'encombrer de
détails qui n'ont aucun impact sur les résultats (de préférence, quand même, après l'avoir
vérifié) à cause de leur faiblesse (énergie infime par rapport à l'énergie totale, probabilité
tellement faible qu'on n'a aucune chance de voir un résultat donné dans la vie d'un homme
même pour un très grands nombres de systèmes) ? C'est certainement les premières
approximations à effectuer !
Renoncer, dans une situation donnée, pour des raisons pratiques, pédagogiques ou autres, à
décrire certains détails n'est pas un aveu d'échec. On sait que certains détails ont été négligés
(en tout cas, maintenant, vous le savez). Et ces détails peuvent être étudiés plus tard,
séparément ou dans une étude plus complète. Lorsque nous décrivons le fonctionnement d'une
horloge en décrivant tous ses engrenages, il n'y a pas de honte à ignorer les cours de la bourse
au Japon ou les couleurs du drapeau argentin dans la description de cette horloge. Il en est de
même ici. Décrivons chaque chose posément, en fonction des besoins, des possibilités, des
désirs,… Complétons progressivement nos descriptions, améliorons petit à petit notre
connaissance du monde, c'est inévitable… et c'est aussi plus digeste pour le lecteur ! Rome ne
s'est pas construite en un jour.
Notre problème, alors, pour décrire la nature est de trouver une représentation adéquate des états de
base. Cela n'est que le commencement. Nous voulons de plus être capable de dire ce qui "arrive". Si
nous connaissons l'état du monde à un moment donné, nous voulons connaître son état un peu plus
tard. Nous avons donc aussi à trouver les lois qui déterminent comment les choses changent dans le
temps. Nous abordons maintenant cette deuxième partie de la mécanique quantique, comment les
états changent dans le temps.
I.2.4. Comment les états évoluent dans le temps
Nous avons déjà discuté la façon de représenter une situation dans laquelle nous plaçons quelque
chose dans un appareil. Maintenant, un "appareil" commode, d'un emploi délectable, consiste à
attendre simplement quelques minutes, autrement dit : vous préparez un état φ et, avant de
l'analyser, vous le laissez tel qu'il est. Peut-être l'abandonnez-vous dans un champ électrique ou
magnétique particulier, cela dépend des circonstances. De toute façon, quelles que soient les
conditions, vous laissez l'objet tranquille du temps t1 au temps t 2 . Supposez que vous le laissiez
sortir du premier appareil à t1 et dans l'état φ et qu'il aille ensuite dans un "appareil", "l'appareil"
consistant simplement à attendre jusqu'à t 2 . Pendant ce temps là, il peut se passer diverses choses,
on peut appliquer des forces extérieures ou pratiquer d'autres manœuvres de ce genre, si bien que
quelque chose se passe. Après avoir attendu, l'amplitude pour trouver l'objet dans un état χ donné
n'est pas exactement la même que si on n'avait pas attendu. Comme "attendre" n'est qu'un cas
spécial "d'appareil", nous pouvons décrire ce qui se passe en donnant l'amplitude sous la même
forme. Comme l'opération "d'attendre" est particulièrement importante, nous l'appellerons U au lieu
de A et nous écririons U (t 2 , t1 ) pour spécifier le temps de départ et d'arrivée t1 et t 2 . L'amplitude
que nous voulons est
(1) χ U (t 2 , t1 )φ
Comme toute autre amplitude, elle peut être représentée dans un système de base quelconque en
écrivant
(2) ∑ χ i i U (t 2 , t1 ) j j φ
ij
U est alors complètement décrit en donnant l'ensemble complet des amplitudes, la matrice
(3) i U (t 2 , t1 ) j
Incidemment, nous pouvons remarquer que la matrice i U (t 2 , t1 ) j donne beaucoup plus de détails
que ce dont nous avons besoin. Le physicien théoricien de grande classe, qui travaille en physique
des hautes énergies, considère des problèmes du type général suivant (c'est de cette façon que les
expériences sont généralement faites). Il part avec une paire de particules, comme deux protons,
venant l'un vers l'autre de l'infini (dans le laboratoire, en général, une des particules est à l'arrêt et
l'autre vient d'un accélérateur qui est pratiquement à l'infini à l'échelle atomique). La collision se
produit et il en sort, disons, deux mésons k, six mésons pi et deux neutrons, chacun dans une
certaine direction et avec une certaine impulsion. Quelle est l'amplitude pour que cela se produise ?
La mathématique ressemble à ceci : l'état φ spécifie les spins et les impulsions des particules
incidentes. χ correspond à la question sur ce qui sort. Comme, par exemple, avec quelle amplitude
obtenez-vous six mésons sortant dans telle et telle direction et les neutrons dans telles directions
avec leurs spins de telle façon ? Autrement dit, χ serait défini en donnant toutes les impulsions et
les spins, etc. pour toutes les particules finales. Le travail du théoricien est alors de calculer
l'amplitude (1). Cependant, il ne s'intéresse réellement qu'au cas particulier où t1 vaut − ∞ et t 2
vaut + ∞ (il n'y a pas d'information expérimentale sur les détails de la réaction mais seulement sur
ce qui entre et sur ce qui sort). La limite de U (t 2 ,t1 ) lorsque t1 → −∞ et t 2 → +∞ est appelé S et
ce que le théoricien veut est
(4) χ S φ
Comment analyser, comment définir les lois de la matrice S est une intéressante question. En
mécanique quantique relativiste, aux hautes énergies, on fait cela d'une certaine façon et, dans la
mécanique quantique non relativiste, on le fait d'une autre façon qui est très commode (cette autre
façon peut aussi être employée dans le cas relativiste, mais elle n'est plus alors aussi commode). Il
s'agit de calculer la matrice U pour un petit intervalle de temps, c'est-à-dire pour t 2 et t1 proches
l'un de l'autre. Si nous pouvons trouver une suite de tels U pour des intervalles de temps successifs,
nous pouvons étudier comment les choses évoluent en fonction du temps. Vous pouvez vous rendre
compte immédiatement que cette façon de faire n'est pas tellement bonne en relativité parce que
nous n'avons pas envie de décrire l'aspect des choses, partout, "simultanément". Mais nous n'allons
pas nous inquiéter de cela pour le moment, nous allons seulement nous occuper de mécanique
quantique non relativiste.
Supposez que nous considérions la matrice U pour un intervalle de temps de t1 à t 3 qui est plus
grand que t 2 . Autrement dit, nous prenons trois temps consécutifs : t1 plus petit que t 2 plus petit
que t 3 . Nous prétendons alors que la matrice qui fait passer de t1 à c est le produit de ce qui se
passe lorsque vous attendez de t1 à t 2 et ensuite de t 2 à t 3 . C'est exactement comme dans la
situation où nous avions deux appareils A et B en série. Nous pouvons alors écrire
(6) U (t 3 , t1 ) = U (t 3 , t 2 )U (t 2 , t1 )
Autrement dit, nous pouvons analyser tout intervalle de temps si nous pouvons analyser une
séquence de petits intervalles de temps. Nous n'avons qu'à faire le produit de tous les morceaux.
C'est de cette façon que l'on analyse la mécanique quantique dans le cas non relativiste.
Notre problème est alors de comprendre la matrice U (t 2 ,t1 ) pour un intervalle de temps
infinitésimal, c'est-à-dire pour t 2 = t1 + ∆t . Nous nous posons la question suivante : si nous avons
un état, à quoi ressemble-t-il après un intervalle de temps infinitésimal ∆t ? Voyons comment nous
pouvons écrire cela. Appelons l'état au temps t, ψ (t ) (nous étudions la dépendance dans le temps
de ψ pour ce que nous entendons par état au temps t soit parfaitement clair). Nous demandons
maintenant : quel état avons-nous après le petit intervalle de temps ∆t ? La réponse est
(7) ψ (t + ∆t = U (t + ∆t , t ) ψ (t )
Ceci signifie la même chose que l'équation avec opérateur, c'est-à-dire que l'amplitude pour trouver
χ au temps t + ∆t est
(8) χ ψ (t + ∆t ) = χ U (t + ∆t , t )ψ (t )
Comme nous ne sommes pas encore très forts dans ces raisonnements abstraits, projetons nos
amplitudes dans une représentation bien définie. Si nous multiplions les deux cotés de l'équation (7)
par i , nous obtenons
(9) i ψ (t + ∆t ) = i U (t + ∆t , t )ψ (t )
Ceci nous donne une idée de ce que va être la dynamique de la mécanique quantique.
Jusqu'ici nous ne savons pas grand chose sur les U ij sauf ceci : nous savons que si ∆t tend vers 0,
il ne se passe rien, nous devons obtenir exactement l'état original. Donc U ii tend vers 1 et U ij → 0
si i ≠ j . En d'autres termes, U ij → δ ij pour ∆t → 0 . Nous pouvons aussi supposer que, pour de
petits ∆t , chacun des coefficients U ij doit différer de δ ij par une quantité proportionnelle à ∆t
(développement au premier ordre pour des quantités infinitésimales). Nous écrivons donc
(13) U ij = δ ij + K ij ∆t
C'est bien entendu la même équation que (13) et, si vous voulez, elle ne fait que définir les
coefficients H ij (t ) . Les termes H ij sont simplement les dérivées par rapport à t 2 des coefficients
U ij (t 2 , t1 ) évalués à t 2 = t1 = t .
Vous vous rappelez que C i (t ) est l'amplitude i ψ pour trouver l'état ψ dans l'un des états de
base i (au temps t). L'équation (17) nous dit donc comment chacun des coefficients i ψ varie
dans le temps. Mais c'est la même chose que de dire que l'équation (17) nous donne la façon dont
l'état ψ varie dans le temps puisque nous décrivons ψ en fonction des amplitudes i ψ . La
variation de ψ dans le temps est décrite en fonction de la matrice H ij , qui doit évidemment inclure
tout ce que nous faisons au système pour le faire changer. Si nous connaissons les H ij , qui
contiennent la physique du problème et peuvent, en général, dépendre du temps, nous avons une
description complète du comportement du système dans le temps. L'équation (17) est alors la loi
quantique de la dynamique du monde.
Nous devons ajouter que nous prendrons toujours un ensemble d'états de base qui sont fixes et qui
ne varient pas dans le temps. Il y a des gens qui utilisent des états de base qui varient aussi. Mais
c'est la même chose que d'utiliser un système de coordonnées tournant et nous ne voulons pas
entrer dans de telles complications.
I.2.5. La matrice hamiltonienne
L'idée, alors, est que pour décrire le monde quantique, il nous faut choisir un ensemble d'états de
base i et écrire les lois de la physique en donnant les coefficients de la matrice H ij . Nous avons
alors tout ce qu'il nous faut, nous pouvons répondre à n'importe quelle question sur ce qui va se
passer. Nous devons donc apprendre quelles sont les règles pour trouver les H ij qui correspondent
à une situation physique donnée, à un champ magnétique, ou à un champ électrique, etc. Et c'est là
le plus difficile. Par exemple, pour les nouvelles particules étranges, nous n'avons aucune idée du
H ij qu'il faut employer. Autrement dit, personne ne connaît le H ij complet pour le monde entier.
Une partie de la difficulté vient de ce que l'on peut difficilement espérer découvrir le H ij quand on
ne sait même pas quels sont les états de base. Nous avons d'excellentes approximations pour les
phénomènes non relativistes et pour quelques autres cas spéciaux. En particulier, nous connaissons
les formes dont on a besoin pour décrire les mouvements des électrons dans les atomes, c'est-à-dire
pour décrire la chimie. Mais nous ne connaissons pas le vrai H ij complet pour l'univers tout entier.
Les coefficients H ij sont appelés "la matrice hamiltonienne" ou, en bref, l'hamiltonien (comment
Hamilton, qui travaillait en l'année 1830, a pu donner son nom à une matrice de la mécanique
quantique est toute une histoire. Mais on devine le lien, ne fut ce que par l'équation décrivant
l'évolution des états dans le temps en fonction de l'hamiltonien, le lien avec l'hamiltonien de la
mécanique analytique). Il serait mieux de l'appeler la matrice d'énergie, pour des raisons qui
deviendront apparentes au fut et à mesure que nous l'emploierons. Le problème est donc : trouvez
votre hamiltonien !
Ceci vient de la condition que la probabilité totale pour qu'un système soit dans un état quelconque
ne change pas. Si vous commencez avec une particule, un objet ou le monde entier, vous l'avez
encore après tout intervalle de temps. Et même dans le cas de particules instables, pouvant se
désintégrer, les états de base doivent en tenir compte (on doit avoir un état sans la particule), on a
encore une situation ou l'on a toujours ou bien la particule ou pas. On ne peut mieux comme
lapalissade. La probabilité totale de trouver le système dans un état quelconque est
∑ C (t )
2
(2) i
i
qui ne doit pas changer au cours du temps. Pour que ceci soit vrai, en l'appliquant à l'équation
décrivant l'évolution dans le temps de ces coefficients, quel que soit l'état de départ φ , il faut que
l'équation (1) soit vraie.
Comme premier exemple, considérons la situation dans laquelle les conditions physiques ne
changent pas avec le temps. Nous voulons dire les conditions physiques extérieures, de sorte que H
est indépendant du temps. Il n'y a personne qui branche ou débranche des électro-aimants. Nous
choisissons aussi un système qui peut être décrit avec un seul état de base. C'est une approximation
que nous pourrions faire pour un atome d'hydrogène au repos ou pour quelque chose de semblable.
L'équation d'évolution dans le temps dit alors que
dC
(3) ih 1 = H 11C1
dt
Une seule équation et c'est tout ! Et si H est constant, cette équation différentielle se résout
facilement pour donner
− (i / h ) H11t
(4) C1 = (const )e
Ceci donne la dépendance dans le temps d'un état d'énergie définie E = H 11 . Vous voyez pourquoi
H ij devrait être appelé la matrice d'énergie. C'est une généralisation de l'énergie pour des situations
complexes.
Ensuite, pour comprendre un peu mieux ce que signifie l'équation, nous considérons un système qui
a deux états de base. L'équation d'évolution se lit alors
dC1
ih = H 11 C1 + H 12 C 2
dt
(5)
dC
ih 2 = H 21 C1 + H 22 C 2
dt
De nouveau, si les H sont indépendants du temps, vous pouvez facilement résoudre ces équations.
Nous vous laissons essayer de le faire pour vous amuser, nous y reviendrons et nous le résoudrons
plus tard. Oui, vous pouvez résoudre les problèmes de mécanique quantique sans connaître les H,
tant qu'ils sont indépendants du temps.
I.2.6. La molécule d'ammoniac
Nous voulons vous montrer maintenant comment on peut utiliser l'équation dynamique de la
mécanique quantique pour décrire des conditions physiques particulières. Nous avons choisi un
exemple simple et intéressant dans lequel, en essayant de deviner raisonnablement l'hamiltonien,
nous pouvons calculer quelques résultats importants et ayant même une valeur pratique. Nous
allons prendre une situation que l'on peut décrire par deux états : la molécule d'ammoniac.
La molécule d'ammoniac a un atome d'azote et trois atomes d'hydrogène disposés dans un plan sous
l'azote, si bien que la molécule a la forme d'une pyramide, comme ci-dessus. Cette molécule,
comme tout autre, a un nombre infini d'états. Elle peut tourner autour de n'importe quel axe, elle
peut se déplacer dans n'importe quelle direction, elle peut vibrer, etc. etc. Par conséquente, ce n'est
pas du tout un système à deux états. Mais nous allons faire l'approximation que tous les autres états
restent fixes, car ils n'interviennent pas dans ce qui nous intéresse pour l'instant. Nous considérons
que la molécule est juste en train de tourner autour de son axe de symétrie (comme le montre la
figure), qu'elle a une impulsion nulle et qu'elle vibre aussi peu que possible (par exemple à très
basse température et dans le référentiel de la molécule). Cela définit toutes ses caractéristiques sauf
une : il y a encore les deux positions possibles de l'atome d'azote, l'azote peut être d'un coté ou de
l'autre du plan des atomes d'hydrogène, comme le montrent les figures (a) et (b). Nous allons donc
discuter cette molécule comme si c'était un système à deux états. Cela signifie qu'il n'y a que deux
états dont nous allons nous soucier, tout le reste sera supposé ne pas changer. Vous voyez, même si
nous savons que la molécule tourne avec un certain moment cinétique autour de l'axe et si nous
savons qu'elle se déplace avec une certaine impulsion et qu'elle vibre d'une certaine façon, il y a
encore deux états possibles. Nous dirons que la molécule est dans l'état 1 lorsque l'azote est en
haut, comme dans la figure (a), et qu'elle est dans l'état 2 quand l'azote est en bas comme dans
(b). Les états 1 et 2 seront pris comme états de base pour notre analyse du comportement de la
molécule d'ammoniac. A tout instant, l'état réel ψ de la molécule peut être représenté en donnant
C1 = 1 ψ , l'amplitude pour être dans l'état 1 et C 2 = 2 ψ , l'amplitude pour être dans l'état 2 .
Alors, nous pouvons écrire le vecteur d'état ψ comme
(1) ψ = 1 1 ψ + 2 2 ψ
ou
(2) ψ = 1 C1 + 2 C 2
Maintenant, le fait intéressant est que si la molécule est dans un certain état à un certain moment
donné, elle n'est pas dans le même état un instant plus tard. Les deux coefficients C changeront
avec le temps suivant l'équation d'évolution que nous venons de voir, valable pour tout système à
deux états. Supposez par exemple, que vous ayez fait une observation ou que vous ayez fait une
certaine sélection des molécules et que vous sachiez que la molécule était initialement dans l'état
1 . Un instant plus tard, il y a une certaine chance pour qu'on la trouve dans l'état 2 . Pour trouver
ce qu'est cette chance nous devons résoudre l'équation différentielle qui nous dit comment les
amplitudes changent avec le temps.
Le seul ennui est que nous ne savons pas quoi prendre pour les coefficients H dans l'équation. Il y a
cependant certaines choses que nous pouvons affirmer. Supposez qu'il n'y ait aucune chance pour
que la molécule puisse jamais aller dans l'état 2 , une fois qu'elle est dans l'état 1 , et
réciproquement. Alors H 12 et H 21 seraient tous les deux zéro et l'équation serait
dC dC
(3) ih 1 = H 11C1 , ih 2 = H 22 C 2
dt dt
Ces équations sont très simples et peuvent être résolues de plusieurs façons différentes. Une façon
commode est la suivante. En prenant la somme des deux, nous obtenons
(7) ih (C1 + C 2 ) = (E 0 − A)(C1 + C 2 )
d
dt
dont la solution est
− (i / h )(E0 − A )t
(8) C1 + C 2 = ae
Nous avons appelé a et b les deux constantes d'intégration. Bien entendu, il faut les choisir de façon
à obtenir les conditions initiales de chaque problème particulier. Maintenant, en ajoutant et en
soustrayant (8) et (10), nous obtenons C1 et C 2 :
(11) C1 (t ) = e − (i / h )( E0 − A )t + e − (i / h )( E0 + A )t
a b
2 2
(12) C2 (t ) = e −(i / h )( E0 − A )t − e −(i / h )( E0 + A )t
a b
2 2
Ce sont des équations similaires sauf pour le signe du second terme.
Nous avons les solutions. Mais que veulent-elles dire ? La difficulté avec la mécanique quantique
n'est pas seulement de résoudre les équations mais de comprendre ce que leurs solutions signifient !
D'abord, remarquez que si b = 0, les deux termes ont la même fréquence ω = (E 0 − A) / h . Si tout
varie avec la même fréquence, cela veut dire que le système est dans un état d'énergie bien définie,
ici l'énergie est E 0 − A . Il y a donc un état stationnaire d'énergie pour lequel les deux amplitudes
C1 et C 2 sont égales. Nous trouvons que la molécule d'ammoniac a une énergie définie E 0 − A si
les amplitudes pour que l'atome d'azote soit "en haut" ou "en bas" sont égales.
Il y a un autre état stationnaire possible si a = 0. Les deux amplitudes ont alors la fréquence
(E0 + A) / h . Il y a donc un autre état d'énergie définie E 0 + A si les deux amplitudes sont égales
mais de signes opposés : C 2 = −C1 . Ce sont les seuls états d'énergie définie.
Nous concluons que, du fait qu'il y a une certaine chance pour que l'atome d'azote passe d'une
position à l'autre, l'énergie de la molécule n'est pas exactement E 0 , comme nous aurions pu
l'attendre, mais il y a deux niveaux d'énergie E 0 + A et E 0 − A . Chacun des états possibles de la
molécule, quelle que soit son énergie, est divisé en deux niveaux. Nous disons chacun des états car,
vous vous souvenez, nous avons choisi un état particulier de rotation, d'énergie interne, etc. Pour
chaque état possible de ce genre il y a un doublet de niveaux d'énergie dû au "flip-flop" de la
molécule.
Les deux amplitudes ont une grandeur qui varie harmoniquement dans le temps.
La probabilité pour que la molécule soit trouvée dans l'état 2 au temps t est le carré du module de
C 2 (t ) :
(18) C 2 (t ) = sin 2
2 At
h
La probabilité part de zéro (comme il se doit), monte jusqu'à un et oscille ensuite entre zéro et un,
comme le montre la courbe P2 de la figure ci-dessous. La probabilité pour être dans l'état 1 ne
reste évidemment pas l'unité. Elle "se vide" dans le deuxième état jusqu'à ce que la probabilité de
trouver la molécule dans le premier état soit zéro, comme le montre la courbe P1 . La probabilité va
et vient entre les deux.
Lorsque vous avez étudié le pendule, vous avez probablement vu ce qui se passe lorsque l'on a deux
pendules identiques faiblement couplés. Si nous déplaçons l'un d'eux et si nous le laissons partir, il
se balance et progressivement l'autre commence à se balancer. Très vite, le deuxième pendule prend
toute l'énergie. Alors le processus se renverse et le pendule numéro un prend toute l'énergie. C'est
exactement le même genre de chose. La vitesse à laquelle l'énergie est échangée de l'un à l'autre
dépend du couplage entre les deux pendules, c'est-à-dire du taux de fuite "d'oscillations" de l'un
vers l'autre. Egalement, il y a deux types de mouvements particuliers de deux pendules, chacun
ayant une fréquence définie, que l'on appelle les modes fondamentaux. Si nous déplaçons les deux
pendules à la fois, ils se balancent ensemble à la même fréquence. Par ailleurs, si nous déplaçons
l'un d'une façon et l'autre d'une autre façon, il y a un autre mode stationnaire également avec une
fréquence définie.
Eh bien, nous avons ici une situation similaire. L'ammoniac est mathématiquement semblable à une
paire de pendules. Les deux fréquences, quand ils oscillent ensemble ou quand ils oscillent en
opposition sont (E0 + A) / h et (E0 − A) / h .
L'analogie avec des pendules n'est pas beaucoup plus profonde que le fait que deux équations
identiques ont des solutions identiques. Les équations linéaires donnant les amplitudes sont tout à
fait semblables aux équations linéaires d'oscillateurs harmoniques (en fait, c'est là la raison qui
explique le succès de la théorie classique de l'indice de réfraction dans laquelle on remplace l'atome
quantique par un oscillateur harmonique alors que, classiquement, ce n'est pas une vue raisonnable
du mouvement des électrons autour du noyau). Si vous tirez l'azote d'un coté, vous obtenez une
superposition de ces deux fréquences et vous obtenez une sorte de battement parce que le système
n'est pas dans l'un des états de fréquence définie. La séparation des niveaux d'énergie de la
molécule d'ammoniac est cependant un effet strictement quantique.
Il nous faut commencer par ce qu'on appelle les interactions fortes des particules nucléaires. Ce
sont les interactions responsables des forces nucléaires fortes. Elles se distinguent en particulier des
interactions électromagnétiques, relativement plus faibles. Ces interactions sont "fortes" en ce sens
que si deux particules s'approchent suffisament pour enfin interagir, elles interagissent de façon
intense et produisent facilement d'autres particules. Les particules nucléaires ont aussi ce qu'on
appelle une "interaction faible" par laquelle certaines choses peuvent se produire, telle que la
désintégration bêta, mais toujours très lentement du moins à l'échelle du temps nucléaire. Les
interactions faibles sont de beaucoup, beaucoup d'ordres de grandeur plus faibles que les
interactions fortes et même beaucoup plus faibles que les interactions électromagnétiques. C'est
d'ailleurs une des raisons pour laquelle ces interactions faibles sont souvent associées au neutrino,
particule légère, non chargée électriquement et insensible aux interactions fortes.
Lorsque l'on s'est mis à étudier les interactions fortes à l'aide des grands accélérateurs, ont fut
surpris de trouver que certaines choses qui "auraient dû" se produire, et auxquelles ont s'attendait,
ne se réalisaient pas. Par exemple, dans certaines interactions, une particule d'un certain type ne se
manifestait pas quand on l'attendait. Gell-Mann et Nishijima se sont aperçus que beaucoup de ces
observations surprenantes pouvaient s'expliquer immédiatement par l'invention d'une nouvelle loi
de conservation : la conservation de l'étrangeté. Ils suggérèrent l'existence d'un attribut d'une
nouvelle sorte associé à chaque particule, dénommé par eux nombre "d'étrangeté", tout comme peut
l'être, par exemple, la charge électrique, et la conservation de la "quantité d'étrangeté" dans toute
interaction forte.
Supposez, par exemple, qu'un méson négatif de grande énergie, disons une énergie de plusieurs
milliards d'eV, percute un proton. De l'interaction, peuvent provenir beaucoup d'autres particules :
mésons pi, mésons K, particules lambda, particules sigma, n'importe lequel des mésons et baryons
répertoriés dans les expériences de physique des particules (voir en annexe). On observe cependant
que certaines combinaisons seulement apparaissent et d'autres jamais. On connaissait déjà certaines
lois de conservation. Tout d'abord, l'énergie et l'impulsion sont toujours conservées. L'énergie et
l'impulsion totales après l'événement doivent être les mêmes qu'avant. Il y a en second lieu la
conservation de la charge électrique qui exige que la charge totale des particules sortantes soit égale
à la charge totale apportée par les particules initiales. Dans notre exemple d'un méson K et d'un
proton qui se rencontrent ont réellement lieu :
(1) K − + p → p + K − + π + + π − + π 0 ou K − + p → Σ − + π +
Néanmoins, ces lois n'expliquent pas l'étrange absence des réactions suivantes, qui ne semblent pas
à première vue particulièrement différentes de certaines autres dans (1) et (3) :
(5) K − + p → p + K − + K 0 ou K − + p → p + π − ou K − + p → Λ0 + K 0
De toute évidence cela est lié au méson K auquel on peut attribuer une quantité appelée étrangeté et
qui serait conservée. On a donc un nombre associé à chaque particule, son étrangeté S, et une loi
qui existe selon laquelle l'étrangeté totale sortante, pour toute interaction forte, doit être égale à
l'étrangeté totale entrante. Le proton et l'antiproton (p, p ), le neutron et l'antineutron (n, n ) et les
mésons ( π + , π 0 , π − ) ont tous zéro pour nombre d'étrangeté, les mésons K + et K 0 ont l'étrangeté
+1, le K − et le K 0 (l'anti K 0 ou K zéro bar) ont l'étrangeté -1. On a aussi découvert une particule
d'étrangeté -2, la particule Ξ ("ksi" majuscule) et d'autres peut-être non encore connues. Mettons
ces étrangetés dans un tableau
S
-2 -1 0 +1
+
Σ p
Baryons Ξ 0
Λ , Σ0
0 n
− −
Ξ Σ
π+ K+
Mésons K0 π0 K0
K− π−
Voyons comment fonctionne la conservation de l'étrangeté pour certaines des réactions que nous
avons écrites. Si nous avons au départ un K − et un proton, l'étrangeté totale est de -1 + 0 = -1. La
conservation de l'étrangeté nous dit que l'étrangeté des produits après réaction doit aussi avoir -1
comme somme. Vous voyez qu'il en est ainsi pour les réactions (1) et (3). Mais dans les réactions
(5), l'étrangeté du terme de droite est zéro dans chaque cas. De telles réactions ne conservent pas
l'étrangeté et ne se produisent pas. Pourquoi ? Cela est lié à la composition en quarks de ces
particules, la charge étrange étant portée par le quark étrange, et par les propriétés de l'interaction
forte qui remanie les quarks mais ne les transforme pas. Mais nous n'aurons pas besoin de nous
plonger dans la structure en quarks de ces particules pour comprendre la suite. Donc, à ce stade on
peut juste considérer que la conservation de l'étrangeté est un constat.
Voyons maintenant la réaction suivante : un π − heurte un proton. Vous pourriez obtenir, par
exemple, une particule Λ0 plus un méson K neutre, deux particules neutres. Mais quel K neutre
obtenez-vous ? Du fait que la particule Λ a l'étrangeté -1 et le π et le p + une étrangeté zéro et
puisqu'il s'agit d'une réaction de production rapide, l'étrangeté ne doit pas changer. La particule K
doit avoir l'étrangeté +1. Il faut donc que ce soit le K 0 . La réaction est
(6) π − + p → Λ0 + K 0
avec S = 0 + 0 = -1 + +1 (conservé)
Si c'était le K 0 au lieu du K 0 , l'étrangeté sur la droite serait -1, ce que la nature ne permet pas
puisque l'étrangeté sur la gauche est zéro. Par contre, on peut produire un K 0 dans d'autres
réactions telles que
(7) n + n → n + p + K 0 + K +
S = 0 + 0 = 0 + 0 + +1 + -1
Ou
(8) K − + p → n + K 0
S = -1 + 0 = 0 + -1
Peut-être vous dites-vous : "tout cela, c'est du vent, car comme savez-vous s'il s'agit d'un K 0 ou
d'un K 0 ? Ils se ressemblent tout à fait. Ils sont antiparticules l'un de l'autre, ils ont donc
exactement la même masse et tous deux ont une charge électrique zéro. Le K pourrait être sa propre
antiparticule comme le photon. Comment les distinguez-vous ?" Par les réactions qu'ils produisent.
Par exemple, un K 0 peut interagir avec la matière pour produire une particule Λ , comme ceci :
(9) K 0 + p → Λ0 + π +
un K 0 ne le peut pas. Par aucun moyen un K 0 ne pourra produire une particule Λ lorsqu'il
interagit avec la matière ordinaire (des protons et des neutrons). Sauf, bien sûr, s'il produit aussi
deux K + ou d'autres particules d'étrangeté totale +1. Il suffit d'imaginer qu'il s'agit ici de réactions
où l'énergie est insuffisante pour produire ces particules supplémentaires étranges. Et, quoi qu'il en
soit, ces différents cas sont expérimentalement faciles à distinguer en regardant les particules
produites. Les K 0 produits par certaines réactions produisent eux-mêmes certaines réactions et les
K 0 produits par d'autres réactions produisent certaines réactions différentes. Il y a clairement deux
particules différentes. Ainsi, une distinction expérimentale possible entre le K 0 et le K 0 serait que
l'un d'eux produise ensuite des Λ et l'autre pas.
L'une des prédictions de la théorie de l'étrangeté consiste donc en ceci : si, au cours d'une
expérience avec des pions de haute énergie, une particule Λ est produite en même temps qu'un
méson K neutre, ce méson K neutre rencontrant à nouveau la matière ne produira jamais un Λ .
L'expérience pourrait se faire à peu près de cette façon : vous envoyez un faisceau de méson π −
dans une grande chambre à bulles à hydrogène (qui ne laisse la trace que des particules chargées
électriquement). La trace d'un π − disparaît, mais quelque part ailleurs une paire de trace apparaît
(un proton et un π − ) montrant qu'une particule Λ s'est désintégrée. Vous savez alors qu'il existe
quelque part un K 0 que vous ne pouvez pas voir.
Vous pouvez quand même savoir par où il est parti en utilisant la conservation de l'impulsion et de
l'énergie (il pourrait se manifester plus tard en se désintégrant en deux particules chargées, comme
indiqué dans la figure (a)). Tandis qu'il continue son chemin, le K 0 peut rencontrer l'un des noyaux
d'hydrogène (un proton) et produire peut-être d'autres particules. La théorie de l'étrangeté prédit
qu'il ne produira jamais une particule Λ , du moins au moyen d'une réaction simple telle que
(9) K 0 + p → Λ0 + π +
alors qu'un K 0 peut très bien le faire. Autrement dit, dans une chambre à bulles, un K 0 pourrait
produire l'événement schématisé dans la figure (b), dans lequel un Λ0 est vu grâce à sa
désintégration, un K 0 par contre ne peut pas le produire. C'est la première partie de notre histoire :
la conservation de l'étrangeté.
Notons que les trajectoires dans les chambres à bulles représentées droites sont en réalité courbées
par la présence d'un champ magnétique qui permet ainsi, par la mesure du rayon de courbure, de
mesurer l'impulsion de chaque particule chargée laissant une trace.
La conservation de l'étrangeté n'est pas absolument stricte. Il existe des désintégrations très lentes
de particules étranges, elles prennent beaucoup de temps, typiquement de l'ordre de 10 −10 sec , dans
lesquelles l'étrangeté n'est pas conservée (un temps caractéristique, pour les interactions fortes, est
plutôt de l'ordre de 10 −23 sec ). Ainsi la particule Λ à l'état libre se désintègre lentement, par le biais
d'une interaction faible. Les produits de désintégration sont ou bien un p et un π − ou bien un n et
un π 0 . Le temps de vie est de 2,2 × 10 −10 sec . De même, le K 0 se désintègre en deux mésons pi (+
et -) avec une durée de vide de 10 −10 sec . C'est d'ailleurs grâce à ces désintégrations que les
particules K furent d'abord observées. Notez que la réaction de désintégration
(10) K 0 → π + + π −
ne conserve pas l'étrangeté et ne peut donc pas avoir lieu "rapidement" par interaction forte. Elle ne
peut procéder que d'une interaction faible.
Le K 0 se désintègre lui aussi de cette manière, en deux mésons pi, et aussi avec la même durée de
vie
(11) K 0 → π + + π −
A nouveau, nous avons une désintégration faible puisque l'étrangeté n'est pas conservée. Il existe
un principe selon lequel à toute réaction correspond une autre réaction, où "matière" est remplacé
par "antimatière" et vice versa. L'antimatière étant ce qui est obtenu après renversement du signe de
toutes les charges, y compris les charges des particules internes dans le cas où la particule possède
une structure interne (ce qui est le cas des mésons qui contiennent deux quarks). C'est une simple
opération de symétrie. Le K 0 étant l'antiparticule du K 0 , il devrait se désintégrer en donnant les
antiparticules du π + et su π − , mais l'antiparticule d'un π + c'est le π − (ou vice versa, si vous
préférez. Dans le cas des mésons pi, il se trouve que peu importe lequel on appelle "matière"). Du
fait des désintégrations faibles, le K 0 et le K 0 peuvent transiter vers les mêmes produits finaux.
Quand ils sont "vus" par leur désintégration, comme dans une chambre à bulles, ils semblent être la
même particule. Seules les interactions fortes sont différentes.
Enfin, nous voilà prêts à décrire le travail de Gell-Mann et de Pais. Ils ont d'abord noté que le K 0
et le K 0 peuvent l'un et l'autre se transformer en des états formés de deux mésons pi, il doit exister
une certaine amplitude pour que le K 0 puisse devenir un K 0 et aussi pour que le K 0 puisse
devenir un K 0 . En écrivant les réactions comme on le fait en chimie, nous aurions
(12) K 0 ↔ π − + π + ↔ K 0
Ces réactions impliquent qu'il existe une certaine amplitude par unité de temps, disons − i / h que
multiplie K 0 W K 0 , pour qu'un K 0 se transforme en K 0 par le biais de l'interaction faible
responsable de la désintégration en deux mésons pi. Il existe aussi l'amplitude correspondante
K 0 W K 0 pour le processus inverse. Du fait que matière et antimatière se comportent exactement
de la même manière, ces deux amplitudes sont égales numériquement. Nous les désignons l'une et
l'autre par A :
(13) K 0 W K 0 = K 0 W K 0 = A
C'est là, on dit Gell-Mann et Pais, une situation très intéressante. Là où les gens ont vu jusqu'à
présent deux états distincts du monde, le K 0 et le K 0 , il n'y aurait lieu de voir en fait qu'un seul
système à deux états puisqu'il existe une amplitude pour passer de l'un à l'autre état. Pour une
analyse complète, il faudrait bien sûr s'occuper de beaucoup plus que deux états, car il y a aussi les
états de pi et autres. Mais étant surtout intéressés par la relation entre le K 0 et le K 0 , ils n'ont pas
eut à trop compliquer les choses et ils ont pu faire l'approximation d'un système à deux états. Il fut
tenu compte des autres états dans la mesure où leur effet contribuait implicitement aux amplitudes
de l'équation (13).
En conséquence, Gell-Mann et Pais ont analysé la particule neutre comme un système à deux états.
Ils commencèrent par choisir, pour les deux états de base, les états K 0 et K 0 (à partir de là,
l'histoire se déroule de manière très similaire à celle de la molécule d'ammoniac). Tout état ψ de
la particule K neutre pouvait alors être défini en précisant les amplitudes pour qu'il soit dans l'un et
l'autre des états de base. Nous désignerons ainsi ces amplitudes
(14) C + = K 0 ψ , C − = K 0 ψ
L'étape suivante fut d'écrire les équations hamiltoniennes pour ce système à deux états. S'il n'y avait
pas de couplage entre le K 0 et le K 0 , les équations seraient simplement
dC
ih + = E 0 C +
dt
(15)
dC −
ih = E0 C −
dt
Mais ce n'est pas tout. Lorsqu'on tient compte de l'effet des deux pions, il faut additionner
l'amplitude pour que le K 0 se transforme en lui-même par le processus
(17) K 0 → π − + π + → K 0
Nous faisons ici une simplification car le système de deux pions peut avoir beaucoup d'états
correspondant aux diverses impulsions des mésons pi. Nous devrions écrire le coté droit de cette
équation sous la forme d'une somme portant sur les divers états de base des pi. Mais le traitement
complet conduirait aux même conclusions avec juste des notations beaucoup plus lourdes.
Il nous faut rectifier quelque chose que nous avons dit au cours des sections précédentes : à savoir
que deux amplitudes concernant deux processus inverses, comme K 0 W K 0 et K 0 W K 0 sont
toujours des complexes conjugués. C'était vrai tant qu'il s'agissait de particules qui ne se
désintégraient pas. Mais si les particules peuvent se désintégrer, et donc "se perdre", les deux
amplitudes ne sont plus nécessairement des complexes conjugués. Le raisonnement permettant de
montrer que les amplitudes étaient conjuguées utilisait le fait que le passage d'un état A vers B, si
on le renversait dans le temps, donnait le passage de l'état B vers A. Mais ici il existe un autre état :
un état avec deux pions s'échappant, définitivement. Il existe donc une "perte" et il n'est pas
toujours possible de revenir à la situation initiale. Ainsi le méson K 0 peut se transformer en K 0
mais le retour n'est pas toujours possible si, avant, les deux mésons pi s'échappent. La description
en deux états n'est qu'approximative, comme nous l'avions signalé plus haut, et le détail est caché
dans l'amplitude A. L'égalité (13) ne signifie donc pas que les amplitudes sont des nombres réels.
Elles sont en fait complexes. Par conséquent le coefficient A est complexe et nous ne pouvons pas
simplement l'incorporer dans l'énergie E 0 .
Ayant souvent été confronté à des systèmes à deux états comme celui de l'ammoniac ou le spin de
l'électron, nos héros savaient que les équations hamiltoniennes signifiaient qu'il existait une autre
paire d'états de base que l'on pourrait utiliser aussi pour représenter le système de la particule K et
qui auraient des comportements particulièrement simples. Tout comme nous avons vu dans le cas
de l'ammoniac que des combinaisons des états de base donnaient des états stationnaires. Ils se
dirent "prenons la somme et la différence de ces deux équations. D'autre part, mesurons toutes nos
énergies en prenant E 0 pour origine et prenons des unités d'énergie et de temps pour lesquelles
h = 1 " (c'est ce que font toujours les théoriciens modernes de la physique. Cela ne change rien à la
physique mais les équations prennent une forme plus simple et réintroduire la ou les constantes
manquantes à la fin peut se faire par simple analyse dimensionnelle, ce qui revient à revenir à des
unités plus conventionnelles). Voici leur résultat :
(23) i (C + + C − ) = 2 A(C + + C − ) , i (C + − C − ) = 0
d d
dt dt
Ils dirent qu'au lieu de penser aux mésons K 0 et K 0 , on peut tout aussi bien penser en termes de
deux particules (ou "états") K 1 et K 2 . Cela n'a rien d'extraordinaire puisque nous avons vu que ces
deux mésons sont en fait deux états d'un même système, d'une même particule pouvant prendre
plusieurs états.
Mais Gell-Mann et Pais ne firent pas tout cela dans le seul but de donner de nouveaux noms aux
particules. Il y a aussi dans tout cela une certaine physique étrange et nouvelle. Supposez que C1 et
C 2 sont les amplitudes pour qu'un certain état ψ soit un méson K 1 ou K 2 :
(25) C1 = K 1 ψ , C 2 = K 2 ψ
Si l'on se souvient que A est un nombre complexe, il est commode de poser A = α − iβ (nous
écrivons moins iβ parce que la partie imaginaire de 2A se trouve être négative). Après cette
substitution, C1 (t ) devient
(30) C1 (t ) = C1 (0 )e − β t e − iα r
La probabilité de trouver une particule K 1 à l'instant t est le carré du module de cette amplitude,
soit e −2 β t . Et, du fait des équations (28), la probabilité de trouver l'état K 2 est nulle à tout moment.
Cela signifie que si vous mettez une particule K dans un état K 1 , la probabilité de la retrouver
dans le même état décroît exponentiellement avec le temps, mais vous ne la retrouverez jamais dans
l'état K 2 . Où va-t-elle ? Elle se désintègre en deux mésons pi avec la vie moyenne τ = 1 / 2 β
laquelle est, expérimentalement, 10 −10 sec . Nous tenions compte de cela lorsque nous disions que A
était complexe.
D'autre part, les équations (28) nous disent que si nous mettons une particule K entièrement dans
l'état K 2 , elle y restera pour toujours. Eh bien, ce n'est pas tout à fait vrai. Expérimentalement, on
observe qu'il se désintègre en trois mésons pi, mais 600 fois plus lentement que la désintégration en
deux pions que nous avons décrite. Mais, tant que l'on considère seulement la désintégration en
deux pions, le K 2 a une durée "éternelle".
Maintenant, terminons l'histoire de Gell-Mann et Pais. Ils en vinrent à considérer ce qui se passe
lorsque la particule K est produite en même temps qu'une particule Λ0 dans une interaction forte.
Puisqu'elle doit dans ce cas avoir l'étrangeté +1, elle doit être produite dans l'état K 0 . Ainsi, à t = 0,
ce n'est ni un K 1 ni un K 2 mais un mélange. Les conditions initiales sont
(31) C + (0) = 1 , C − (0) = 0
Mais, d'après (25), cela signifie que
(32) C1 (0 ) = , C 2 (0 ) =
1 1
2 2
et encore, d'après (27),
(33) C1 (t ) = e e , C 2 (t ) =
1 − β t −iα t 1
2 2
Que signifie tout cela ? Revenons-en à l'expérience que nous avions schématisée dans la figure plus
haut. Un méson π − produit une particule Λ0 et un méson K 0 qui se ballade à travers l'hydrogène
de la chambre. Tandis qu'il progresse, il a une certaine chance, faible mais constante, de percuter un
noyau d'hydrogène. Au début, nous pensions que la conservation de l'étrangeté empêcherait la
particule K de fabriquer un Λ0 dans une telle interaction. Nous voyons maintenant que ceci n'est
pas vrai. Car, bien que notre particule K soit, lors de sa création, un K 0 , lequel ne peut pas
fabriquer de Λ0 , elle ne reste pas dans cet état. Bientôt, il y aura une certaine amplitude pour qu'elle
ait basculé dans l'état K 0 . On doit donc s'attendre à observer parfois un Λ0 produit sur le parcours
de la particule K. Les chances que cela arrive sont données par l'amplitude C − que nous pouvons
relier à C1 et C 2 (en utilisant à rebours les équations (26)). Cette relation s'écrit
(34) C − =
1
(
2
)
(C1 − C 2 ) = 1 e − β t e −iα t − 1
2
Tandis que notre particule K continue son chemin, la probabilité pour qu'elle "agisse comme" un
2
K 0 est égale à C − , c'est-à-dire
(35) C −
2
=
1
4
(
1 + e − 2 β t − 2e − β t cos αt )
Un résultat étrange et compliqué !
Voilà donc la remarquable prédiction de Gell-Mann et Pais. Quand un K 0 est produit, les chances
pour qu'il se transforme en K 0 , fait que pourra mettre en évidence la production d'un Λ0 , varient
avec le temps selon l'équation (35). Cette prédiction provient seulement de la logique pure et des
principes de base de la mécanique quantique, sans qu'il soit nécessaire de rien savoir du
fonctionnement interne de la particule K. Etant donné que personne ne savait rien à l'époque sur les
rouages internes, Gell-Mann et Pais ne pouvaient pas aller au-delà. Ils ne pouvaient pas donner des
valeurs théoriques à α et β . Et personne n'a su le faire depuis même si les rouages internes ont été
décryptés (la structure en quark et l'interaction faible dont la violation de la symétrie dite CP, que
nous verrons plus tard. Mais l'importance de cette violation reste un paramètre libre, non calculé).
Ils ont pu donner pour β une valeur déduite du taux expérimental de désintégration en deux pi
( 2 β = 1010 sec ), mais, quant à α , ils ne purent rien en dire.
Nous avons fait le graphique des fonctions (35) ci-dessus pour deux valeurs de α . Vous voyez que
la forme dépend très fortement du rapport entre α et β . Au départ, la probabilité K 0 est nulle.
Elle croît ensuite. Si α est grand, la probabilité aura de fortes oscillations. Si α est petit, il y aura
peu ou pas d'oscillations, la probabilité aura simplement une croissance régulière jusqu'à 1/4.
Dans une situation expérimentale typique, la particule K, dotée d'une très grande énergie, se
déplace à une vitesse constante proche de la vitesse de la lumière. Les courbes ci-dessus
représentent donc aussi la probabilité d'observer un K 0 en fonction de la longueur parcourue, avec
des distances qui sont typiquement de quelques centimètre. Vous pouvez voir ce que cette
prédiction a d'étonnant. Vous produisez une seule particule et au lieu de se désintégrer simplement,
elle fait quelque chose d'autre. Parfois elle se désintègre et parfois, elle se transforme en une
particule d'un type différent. Sa probabilité caractéristique de produire un effet varie d'étrange
manière le long de son parcours. Il n'y a rien de tout à fait semblable dans la nature. Et cette
prédiction des plus remarquables a été déduite de spéculations portant seulement sur les
interférences entre amplitudes.
S'il existe un endroit où l'on a des chances de vérifier de la manière la plus pure les principes
essentiels de la mécanique quantique, la superposition des amplitudes se produit-elle ou pas ?, c'est
bien là. Depuis, de nombreuses expériences conçues dans le but d'étudier finement ce mécanisme
ont été menées confirmant les prédictions de Gell-Mann et Pais.
Notons que cet effet manifeste aussi quelque chose d'extraordinaire. En effet, on part d'une
particule de matière, le K 0 , et on aboutit à une particule d'antimatière, le K 0 . Il y a donc une
légère asymétrie dans la matière - antimatière. C'est la seule manifestation connue de cette
asymétrie car cette symétrie, fortement reliée à la symétrie CP, est parfaitement respectée par les
interactions électromagnétiques et fortes. Il est possible que cette petite différence puisse être à
l'origine de l'abondance de matière dans l'univers et de la rareté de l'antimatière.
L'analyse que nous venons de décrire est très caractéristique de la façon dont on utilise aujourd'hui
la mécanique quantique pour la recherche d'une compréhension des particules étranges. Toutes les
théories compliquées dont vous pouvez entendre parler à ce sujet ne sont ni plus ni moins que de
simples tours de passe-passe de ce genre là, utilisant le principe de superposition et autres principes
de mécanique quantique de cet acabit. Certains prétendent avoir des théories qui leur permettent de
calculer α et β , ou au moins α , connaissant β , mais ces théories n'ont aucun intérêt. Par
exemple, la théorie qui prédit la valeur de α connaissant β , nous dit que cette valeur de α devrait
être infinie. L'ensemble des équations dont ils partent concerne deux mésons pi qui transitent vers
un K 0 et ainsi de suite. Après manipulation, on aboutit en effet à deux équations similaires à celles
que nous avons ici. Mais comme il y a un nombre infini d'états à deux pions, selon leurs
impulsions, l'intégration sur toutes les possibilités donne un α infini. Pourtant l' α de la nature
n'est pas infini. Les théories dynamiques sont donc fausses. Il est vraiment remarquable que les
seules prédictions que l'on puisse faire dans le monde des particules étranges aient pour origine les
principes de mécanique quantique du niveau de ce cours.
I.4. Généralisation aux systèmes à N états
Nous en avons terminé avec les systèmes à deux états dont nous voulions parler. Nous reviendrons
à des systèmes de ce genre lorsque nous aborderons le spin. Dans la suite, nous en viendrons à
l'étude des systèmes à d'avantages d'états. L'extension aux systèmes à N états des idées que nous
avons développées pour les systèmes à deux états est assez directe. Cela se fait ainsi.
Si un système à N états distincts, nous pouvons représenter chaque état ψ (t ) comme une
combinaison linéaire d'un ensemble quelconque d'états de base i , où i = 1, 2, 3,… N.
(1) ψ (t ) = ∑ i C (t )i
tout i
Nous avons déjà trouvé les solutions pour les C d'un système à deux états lorsque la matrice énergie
est constante (indépendante de t). Il n'est pas non plus difficile de résoudre l'équation (2) pour un
système à N états quand H ne dépend pas du temps. A nouveau, commençons par chercher une
solution possible pour laquelle les amplitudes ont toutes la même dépendance en temps. Nous
essayons
(3) C i = a i e − (i / h )Et
Quand on substitue ces C i dans (2), les dérivées dC i / dt deviennent simplement (− i / h )EC i . En
supprimant le facteur commun à tous les termes, on obtient :
(4) Ea i = ∑ H ij a j
j
Si néanmoins vous voulez être formalistes, vous pouvez écrire (4) sous la forme
(5) ∑ (H ij − δ ij E )a j = 0
j
Vous pouvez ensuite utiliser la règle, si vous la connaissez, selon laquelle ces équations n'ont une
solution que pour les valeurs de E qui satisfont à
(6) det (H ij − δ ij E ) = 0
Chaque terme du déterminant est simplement H ij sauf que E est soustrait de chaque élément
diagonal. Ainsi, l'équation (6) signifie simplement
H 11 − E H 12 H 13 L
H 21 H 22 − E H 23 L
(7) det =0
H 31 H 32 H 33 − E L
L L L L
Ce n'est là, bien sûr, qu'une forme particulière d'équation algébrique pour la variable E. C'est la
somme d'un tas de produits portant sur tous les termes pris dans un certain ordre. Ces produits
donneront toutes les puissances de E jusqu'à E N .
Nous avons donc un polynôme du Nième ordre égal à zéro. Il y a en général N racines (nous
devons nous souvenir que certaines d'entre elles peuvent être des racines multiples, autrement dit,
plusieurs racines peuvent être égales). Désignons ces N racines par
(8) E I , E II , E III , …, En , …, E N
(nous utiliserons n pour représenter le nième chiffre romain. n prend donc toutes les valeurs I, II,
…, N). Il se peut que certaines de ces énergies soient égales, disons E II = E III , mais nous préférons
leur conserver des noms différents.
Les équations (4) ou (5) ont une seule solution pour chaque valeur de E. Si nous portons l'une
quelconque des valeurs de E, disons En , dans (4) et si nous cherchons les solutions pour les a i ,
nous obtenons un ensemble de valeurs associées à l'énergie En . Nous désignons ces solutions par
a i (n ) .
En portant ces a i (n ) dans (3), nous obtenons les amplitudes C i (n ) , amplitudes pour qu'un état
d'énergie définie soit dans l'état de base i . En désignant par n le vecteur d'état représentant à t =
0 l'état d'énergie définie, nous pouvons écrire
(i / h )En t
(9) C i (n ) = i n e
avec
(10) i n = ai (n )
Les vecteurs d'état n décrivent la configuration des états d'énergie définie, mais le facteur de
dépendance au temps est omis. Ils constituent ainsi des vecteurs constants que l'on peut utiliser
comme nouvelle base si on le désire. Chacun des états n a la propriété suivante, que vous pouvez
facilement établir, sous l'action de l'opérateur hamiltonien Ĥ , il redonne simplement le même état
que multiplie En .
(13) Hˆ n = E nn
De manière générale, les états n , qui sont au nombre de N, peuvent définir une base. Pour que ce
soit vrai, il faut que tous les états soient orthogonaux, ce qui signifie que pour deux quelconques
d'entre eux, disons n et m ,
(14) n m = 0
Ceci sera automatiquement vrai si toutes les énergies sont différentes. On peut d'autre part
multiplier tous les a i (n ) par un facteur approprié pour que tous états soient normalisés, par là nous
entendons que,
(15) n n = 1
pour tout n .
Quand il arrive par accident que l'équation (7) a deux racines (ou plus) à la même énergie, il y a
encore quelques complications mineures. Tout d'abord, il y a bien encore deux séries différentes de
coefficients a i même pour des valeurs égales de l'énergie, mais les états qu'ils définissent peuvent
ne pas être orthogonaux. Supposez qu'ayant procédé de façon normale, vous trouviez deux états
stationnaires avec des énergies égales, désignons les par µ et ν . Il se peut qu'ils ne soient pas
orthogonaux, si vous êtes malchanceux, vous aurez
(16) µ ν ≠ 0
Mais il vous sera chaque fois possible de mijoter deux nouveaux états que nous désignerons par
µ ′ et ν ′ qui, tout en ayant la même énergie, sont aussi orthogonaux. On aura donc
(17) µ ′ ν ′ = 0
Nous aimerions, pour le plaisir, prouver que deux états stationnaires d'énergies différentes sont
toujours orthogonaux. Pour l'état n d'énergie En , on a
(18) Hˆ n = E n n
Cette équation d'opérateur implique en fait une équation entre nombres. D'ailleurs, après que nous
ayons remis les parties manquantes, elle s'écrit
(19) ∑ i Hˆ j j n = E i nn
j
Si nous prenons le complexe conjugué de cette équation, nous obtenons
∗ ∗ ∗
(20) ∑
j
i Hˆ j jn = En∗ i n
Souvenez-vous maintenant que le complexe conjugué d'une amplitude est l'amplitude du processus
inverse. Ainsi, (20) peut se récrire sous la forme
(21) ∑ n j j Hˆ i = E ∗ n i n
j
Cette équation étant vraie quel que soit i, elle a pour "forme condensée"
(22) n Ĥ = En∗ n
On peut maintenant prouver sans difficulté que En est un nombre réel. Nous multiplions (18) par
n pour obtenir
(23) n Hˆ n = En
puisque n n = 1 . Nous multiplions ensuite (22) sur la gauche par n et nous obtenons
(24) n Ĥ n = En∗
Les termes de gauche de ces deux équations étant égaux, les termes de droite le sont aussi, d'où :
(28) Em m n = En m n
Si Em = En , l'équation ne nous apprend rien. Mais si les énergies des deux états m et n sont
différentes ( Em ≠ En ), l'équation (28) nous dit que m n doit être nul. C'est ce que nous voulions
montrer. Les deux états sont nécessairement orthogonaux, pour autant que En et Em sont
numériquement différents.
II. Equation de Schrödinger
En nous servant de ce que nous avons vu avec les solutions des équations quantiques dans le cas à
N états, nous allons étudier comment peut se comporter un électron lorsqu'il se propage dans un
cristal.
A partir de là, par analogie et un passage à la limite, nous pourrons en déduire l'équation de
Schrödinger pour une particule libre ou plongée dans un potentiel.
II.1.1. Propagation dans un réseau cristallin
La conduction des électrons dans un cristal est un exemple parmi d'autres d'un phénomène très
général. Il n'y a pas que les électrons à pouvoir voyager à travers des cristaux, d'autres "choses"
aussi, telles que les excitations atomiques peuvent se comporter de manière semblable. Ainsi, le
phénomène dont nous voulons discuter apparaît de multiples façons dans l'étude de la physique à
l'état solide.
Nous avons déjà discuté d'exemples de systèmes à deux états. Imaginons maintenant un électron
qui puisse se trouver dans l'une des deux positions, l'environnement restant du même type dans l'un
et l'autre cas. Supposons aussi qu'il existe une certaine amplitude pour qu'il passe d'une position à
l'autre et bien sûr la même amplitude pour le passage inverse. Les lois de la mécanique quantique
donnent alors les résultats suivants. Il existe deux états d'énergie définie possible pour l'électron.
Tout état peut être décrit en donnant les amplitudes pour que l'électron soit dans chacune des deux
positions de base. Pour l'un et l'autre état d'énergie définie, les grandeurs de ces amplitudes sont
constantes dans le temps et les phases varient en fonction du temps avec une même fréquence. Par
ailleurs, si l'électron est au départ dans une position, il passera plus tard à l'autre et plus tard encore
il sera de retour à la première position. L'amplitude est analogue au mouvement de deux pendules
couplés.
Considérez maintenant un réseau cristallin parfait et imaginez qu'un électron puisse y être situé
dans une sorte de "trou", près d'un certain atome et qu'il ait une certaine énergie. Supposez en outre
que cet électron a une certaine amplitude de se déplacer dans un trou différent, près de l'un des
atomes voisins. C'est un peu comme le système à deux états, mais avec une complication
supplémentaire. Une fois l'électron arrivé à l'atome voisin, il peut repartir vers une nouvelle
destination ou bien revenir au point de départ. Nous avons maintenant une situation analogue non
pas à deux pendules couplés mais à une infinité de pendules tous couplés les uns avec les autres.
Cela peut vous rappeler l'une de ces machines, faite d'une longue série de barres montées sur un fil
de torsion, et que l'on utilise en première année de physique pour démontrer la propagation des
ondes.
Si vous avez un oscillateur harmonique couplé à un autre oscillateur harmonique, celui-ci étant
couplé à un autre et ainsi de suite… et si vous provoquez une irrégularité en un endroit, cette
irrégularité se propagera comme une onde le long de la ligne. La même situation existe si vous
placez un électron près de l'un des atomes d'une longue chaîne d'atomes.
Habituellement, la manière la plus simple d'analyser le problème mécanique n'est pas de penser à
ce qui se passe si une impulsion est donnée en un point précis mais plutôt de considérer les
solutions d'ondes stationnaires. Il existe certains modes de perturbation qui se propagent au travers
du cristal comme une onde de fréquence constante et unique. La même chose se produit avec
l'électron et pour les mêmes raisons car il est décrit, en mécanique quantique, par le même type
d'équations.
Cependant vous devez bien comprendre ceci : l'amplitude pour que l'électron soit en un lieu est une
amplitude et non une probabilité. Si l'électron ne faisait que s'écouler d'un endroit vers l'autre,
comme l'eau à travers un trou, le comportement serait complètement différent. Par exemple, si nous
avions deux réservoirs réunis par un tuyau permettant un certain écoulement de l'un vers l'autre, les
niveaux tendraient exponentiellement à s'égaliser. Mais ce qui se passe pour l'électron, c'est un
écoulement d'amplitude et non pas un banal écoulement de probabilité. Et c'est une caractéristique
du terme imaginaire, le i dans les équations différentielles de mécanique quantique, qui change la
solution exponentielle en une solution oscillatoire. Ce qui se passe alors est tout à fait différent de
l'écoulement entre deux réservoirs reliés entre eux.
Bien sûr, l'électron peut ensuite passer à un autre atome, transférant ailleurs l'ion négatif. Nous
supposerons que cet électron peut sauter d'un atome à l'atome voisin de droite ou de gauche avec
une certaine amplitude.
Comment décririons-nous un tel système ? Quels seront les états de base raisonnables ? Vous
pouvez aisément deviner comment cela va se passer. Supposez que, dans notre rangée d'atomes,
tous les espaces sont égaux (c'est un cristal) et nous donnons à chaque atome un numéro d'ordre,
comme indiqué sur la figure (a). L'un des états de base correspond à l'électron situé sur l'atome
numéro 6, pour un autre état de base, l'électron est à l'atome numéro 7, ou à l'atome numéro 8 et
ainsi de suite. Nous pouvons décrire le nième état de base en disant que l'électron est à l'atome
numéro n. Disons que c'est l'état de base n . La figure ci-dessus montre ce que nous entendons par
les trois états n − 1 , n et n + 1 .
A partir de ces états de base, nous pouvons décrire tout état φ de notre cristal à une dimension en
donnant l'amplitude n φ pour que l'état φ soit dans l'un des états de base, autrement dit
l'amplitude pour que l'électron soit localisé à un atome particulier. Nous pouvons ensuite écrire
l'état φ comme une superposition des états de base
(1) φ = ∑ n n φ
n
Puis, nous supposerons que l'électron, situé à l'un des atomes, a une certaine amplitude pour passer
à l'atome voisin de droite ou de gauche. Et pour prendre le cas le plus simple, nous supposerons
qu'il ne peut passer qu'aux atomes immédiatement voisins pour atteindre le plus proche parmi les
autres, il lui faut donc procéder en deux étapes. Nous poserons que les amplitudes pour le saut d'un
atome au suivant sont iA / h (par unité de temps).
Pour le moment nous représenterons par C n l'amplitude n φ pour que l'électron soit au nième
atome. Alors l'équation (1) devient
(2) φ = ∑ n C n
n
Si nous connaissions chacune des amplitudes C n à un instant donné, nous pourrions prendre le
carré de leurs modules et obtenir la probabilité que vous trouviez l'électron, si vous le cherchiez à
l'atome n à cet instant.
Quelle sera la situation un peu plus tard ? Par analogie avec les systèmes à deux états que nous
avons étudiés, nous pouvons supposer que les équations hamiltoniennes pour ce système doivent
être de ce type :
dC (t )
(3) ih n = E 0 − AC n+1 (t ) − AC n −1 (t )
dt
Le premier coefficient sur la droite, E 0 , est, physiquement, l'énergie qu'aurait l'électron s'il ne
pouvait pas passer d'un atome à l'autre (ce que nous représentons par E 0 importe peu. E 0 ne
représente en effet, comme nous l'avons déjà vu, rien d'autre que notre convention de niveau zéro
d'énergie). Le terme suivant représente l'amplitude par unité de temps pour que l'électron passe
dans le nième trou venant du (n+1)ième et le dernier terme est l'amplitude pour qu'il y vienne à
partir du (n-1)ième. Comme d'habitude nous supposerons que A est une constante (indépendante du
temps).
La description intégrale du comportement de tout état φ demanderait que nous ayons une équation
telle que (3) pour chacune des amplitudes C n . Comme le cristal que nous considérons a un très
grand nombre d'atomes, nous supposerons qu'il y a un nombre infiniment grand d'états et que la
chaîne d'atomes s'étend à l'infini dans les deux directions (pour traiter le cas fini, il nous faudra
faire particulièrement attention à ce qui se passe aux extrémités). Si le nombre N de nos états de
base est infiniment grand, nos équations hamiltoniennes sont aussi en nombre infini ! Nous n'en
écrirons qu'un échantillon :
M M
dC n −1
ih = E0 C n −1 − AC n − 2 − AC n
dt
dC
(4) ih n = E 0 C n − AC n −1 − AC n +1
dt
dC
ih n +1 = E0 C n +1 − AC n − AC n + 2
dt
M M
II.1.1.2. Etats d'énergie définie
Il y a beaucoup de choses que l'on pourrait étudier concernant un électron dans un réseau, mais
essayons d'abord de trouver les états d'énergie définie. Autrement dit, comme nous l'avons vu
précédemment, il nous faut trouver une situation telle que les amplitudes varient toutes avec la
même fréquence, si, du moins elles varient avec le temps. Nous cherchons des solutions de la forme
(1) C n = a n e − iEt / h
Le nombre complexe a n nous renseigne sur la partie, invariante avec le temps, de l'amplitude pour
que l'on trouve l'électron au nième atome. Si nous essayons cette solution dans notre système
d'équations pour voir ce qui en résulte, nous obtenons ceci :
(2) Ea n = E0 a n − Aa n +1 − Aa n −1
Nous avons un nombre infini d'équations de ce type, concernant un nombre infini d'inconnues a n ,
ce qui est assez effrayant.
Tout ce que nous avons à faire, c'est de prendre le déterminant… mais attendez ! Des déterminants
pour 2, 3 ou 4 équations, cela va bien. Mais s'il y a un grand nombre d'équations ou un nombre
infini, les déterminants ne sont plus très pratiques. Nous ferions mieux d'essayer de résoudre les
équations directement. Désignons d'abord les atomes par leurs positions. Nous dirons que l'atome n
est à x n et l'atome (n+1) à x n +1 . Si l'espacement des atomes est b, nous aurons x n +1 = x n + b . En
choisissant notre origine à l'atome 0, nous avons simplement x n = nb . Nous pouvons récrire ainsi
l'équation (1)
(3) C n = a ( x n )e − iEt / h
et l'équation (2) devient alors
(4) Ea ( x n ) = E 0 a ( x n ) − Aa ( x n +1 ) − Aa ( x n −1 )
Les équations différentielles linéaires avec coefficients constants peuvent toujours se résoudre en
termes de fonctions exponentielles. Nous pouvons essayer la même chose ici. Essayons la solution
(6) a ( x n ) = e
ikxn
Nous avons trouvé que, pour n'importe quelle constante k, il y a une solution dont l'énergie est
donnée par cette équation. Il y a différentes énergies possibles qui dépendent de k et à chaque
valeur de k correspond une solution différente. Il y a un nombre infini de solutions, ce qui n'est pas
surprenant puisque nous sommes partis d'un nombre infini d'états de base.
Voyons ce que signifient ces solutions. Pour chaque k, les a sont donnés par (6). Les amplitudes C n
sont alors données par
(10) C n = e e − (i / h )Et
ikxn
où l'énergie E, il ne vous faut pas l'oublier, dépend aussi de k selon l'équation (9). La dépendance
d'espace de ces amplitudes est eikxn . Les amplitudes oscillent quand nous nous déplaçons d'atome
en atome.
Ce que nous disons, c'est que, dans l'espace, l'amplitude se comporte comme une oscillation
complexe, la grandeur est la même en chaque atome, mais la phase à un instant donné augmente
(ikb) d'un atome à l'autre. Nous pouvons nous représenter ce qui se passe en dessinant une ligne
verticale qui, à chaque atome, représente uniquement la partie réelle. Ce que nous avons fait dans la
figure ci-dessus. L'enveloppe de ces lignes verticales (indiquée par le trait discontinu) est, bien
entendu, une sinusoïde. La partie imaginaire de C n est aussi une fonction oscillante mais dont la
phase est décalée de 90°, de sorte que le carré du module (qui est la somme des carrés des parties
réelles et imaginaires) est le même pour tous les C.
Ainsi, ayant choisi un k, nous avons un état stationnaire d'énergie particulière E. Et pour tout état de
ce type, on a une chance égale de trouver l'électron à chacun des atomes, il n'y a pas de préférence
pour un atome ou pour un autre. La phase seule est différente pour différents atomes. De plus,
lorsque le temps passe, les phrases varient. D'après l'équation (10), les parties réelles et imaginaires
de propagent le long du cristal comme des ondes, précisément comme les parties réelles et
imaginaires de
[
i kxn − ( E / h )t ]
(11) e
L'onde peut voyager vers les x positifs ou négatifs selon le signe que nous avons choisi pour k.
Notez que nous avons supposé réel le nombre k placé dans notre solution d'essai (6). Nous pouvons
voir maintenant pourquoi il doit en être ainsi, lorsque nous avons une ligne infinie d'atomes.
k ′x
Supposez que nous ayons k imaginaire, disons ik ′ . Les amplitudes a n varieraient comme e n ,
l'amplitude deviendrait donc de plus en plus grande lorsque nous irions vers les grand x, vers les x
négatifs si k ′ est négatif. Ce type de solution pourrait marcher si nous avions affaire à une ligne
d'atomes qui ait une fin, mais ne peut pas être une solution physique pour une chaîne infinie
d'atomes. Il en résulterait des amplitudes non bornées et donc des probabilités non bornées, quel
que soit le facteur de normalisation qui serait choisi, ce qui ne peut représenter une situation réelle.
Plus loin nous verrons un exemple dans lequel un k imaginaire aurait un sens.
La relation entre l'énergie E et le nombre d'ondes k donnée par l'équation (9) est représentée ci-
dessus. Comme vous pouvez le voir sur la figure, l'énergie peut aller de E 0 − 2 A pour k = 0 à
E 0 + 2 A pour k = ±π / b . Le dessin est fait pour A positif. Si A était négatif, la courbe serait
simplement renversée, mais le "domaine" serait le même. Le résultat significatif est que toute
énergie est possible à l'intérieur d'un certain domaine, d'une certaine "bande" d'énergies, mais pas à
l'extérieur. Dans le cadre de nos hypothèses, si un électron dans un cristal est dans un état
stationnaire, il ne peut avoir d'énergie dont la valeur ne soit dans cette bande.
Selon (6), les plus petits k correspondent aux états de basse énergie, E ≈ E0 − 2 A . Si k augmente
en valeur absolue (vers des valeurs positives ou négatives) l'énergie commence par croître, mais
elle atteint un maximum à k = ±π / b , comme indiqué sur la figure. Pour des k plus grand que
π / b , l'énergie recommencerait à décroître. Mais il n'y a pas lieu de considérer de telles valeurs de
k car elles ne donnent pas de nouveaux états, elles ne font que répéter les états que nous avons déjà
pour k plus petit. Nous pouvons voir cela de la manière suivante. Considérez l'état d'énergie
minimum, pour lequel k = 0. Le coefficient a ( x n ) est le même pour tout x n . Nous aurions la même
énergie pour k = 2π / b . Mais alors (6) nous donne
i ( 2π / b ) xn
(12) a ( x n ) = e
L'état décrit par ces a ( x n ) est physiquement le même que celui que nous avons obtenu pour k = 0.
Il ne représente pas une autre solution.
Pour prendre un autre exemple, supposez que k soit égal à π / 4b . La partie réelle de a ( x n )
varierait comme indiqué par la courbe 1 ci-dessus. Si k était sept fois plus grand ( k = 7π / 4 ), la
partie réelle de a ( x n ) varierait comme indiqué par la courbe 2 (les sinusoïdes complètes n'ont bien
entendu aucune signification en soit. Tout ce qui importe ce sont les valeurs aux points x n . Les
courbes ne sont là que pour vous aider à voir ce qui se passe). Vous voyez que les deux valeurs de k
donnent les mêmes amplitudes pour tous les x n .
En conséquence, pour avoir toutes les solutions possibles de notre problème, il nous suffit de
prendre les k dans un certain domaine fini. Nous choisirons le domaine allant de − π / b à + π / b ,
celui de la figure plus haut. Dans ce domaine, l'énergie des états stationnaires croît uniformément
lorsque k croît en valeur absolue.
Une remarque en passant à propos d'une liberté que vous avez. Supposez que l'électron puisse non
seulement sauter d'un atome à son voisin le plus proche avec l'amplitude iA / h , mais qu'il ait aussi
la possibilité de passer d'un seul bon jusqu'à l'atome suivant avec quelqu'autre amplitude iB / h .
Vous verrez que la solution peut à nouveau s'écrire sous la forme a n = e n , ce type de solution est
ikx
universel. Vous trouverez également que les états stationnaires de nombre d'onde k ont une énergie
égale à E 0 − 2 A cos kb − 2 B cos 2kb . Ceci montre que la forme de la courbe de E en fonction de k
n'est pas universelle mais dépend des hypothèses particulières au problème. Ce n'est pas toujours
une forme sinusoïdale et, même, il n'y a pas toujours une symétrie par rapport à une quelconque
ligne horizontale. Ce qui reste vrai, c'est que la courbe se répète à l'extérieur de l'intervalle allant de
− π / b à + π / b . Il n'y a donc jamais lieu de s'occuper des autres valeurs de k.
Regardons d'un peu plus près ce qui se passe pour les petites valeurs de k, c'est-à-dire lorsque les
variations des amplitudes d'un x n au suivant sont très lentes. Choisissons le zéro d'énergie de sorte
que E 0 = 2 A . Le minimum de la courbe est alors à l'énergie zéro. Pour k suffisament petit, nous
pouvons écrire
(14) cos kb ≈ 1 − k 2 b 2 / 2
et l'énergie de l'équation (9) devient
(15) E = Ak 2 b 2
Nous obtenons pour ces états une énergie proportionnelle au carré du nombre d'ondes qui décrit les
variations spatiales des amplitudes C n .
II.1.1.3. Etats qui varient dans le temps
A présent, nous voudrions discuter, de façon plus détaillée, le comportement des états dans un
réseau à une dimension. Si l'amplitude pour qu'un électron soit en x n est C n , la probabilité de le
2
trouver là est C n . Pour les états stationnaires décrits plus haut, cette probabilité est la même pour
tous les x n et ne change pas avec le temps. Comment représenter une situation que nous pourrions
décrire grossièrement en disant qu'un électron d'une certaine énergie est localisé en une certaine
région, de sorte que l'on a plus de chance de le trouver en un endroit plutôt qu'un autre ? Cela peut
se faire par la superposition de plusieurs solutions stationnaires dont les valeurs de k diffèrent
légèrement, et donc aussi les énergies. Alors, au moins à t = 0, l'amplitude variera avec la position
du fait de l'interférence entre les divers termes, tout comme l'on obtient des battements lorsqu'on a
un mélange d'ondes de différentes longueurs d'onde. Nous pouvons ainsi fabriquer un "paquet
d'ondes" ayant un nombre d'ondes dominant k 0 mais contenant d'autres nombres d'ondes voisins de
k 0 (à condition de ne pas chercher à faire un paquet trop étroit).
Dans notre superposition d'états stationnaires, les amplitudes avec différents k représenteront des
états d'énergie un peu différente et donc de fréquences un peu différentes. Par suite, pour le C n
total, la figure d'interférence variera aussi avec le temps, elle présentera des battements. Les
2
maximums des battements (les maximums de C n ) se déplacent le long de x lorsque le temps
passe. Ils se déplacent avec une vitesse appelée "vitesse de groupe". Cette vitesse de groupe est
reliée à la variation de k en fonction de la fréquence
dω
(1) v groupe =
dk
Un électron dont l'état serait un "bouquet" d'états de base, le C n variant dans l'espace comme le
paquet d'ondes ci-dessus, se déplacerait le long du "cristal" à une dimension à une vitesse v égale à
dω / dk où ω = E / h . En utilisant pour E l'équation obtenue précédemment, nous obtenons
2 Ab 2
(2) v = k
h
Autrement dit, l'électron se déplace avec une vitesse proportionnelle à la valeur centrale de k.
L'équation vue précédemment nous dit alors que son énergie est proportionnelle au carré de sa
vitesse, il se comporte comme une particule classique. Tant que nous regardons les choses d'assez
loin pour ne pas voir la structure fine, notre description quantique commence à donner des résultats
semblables à ceux que donne la physique classique. De fait, en substituant dans la dernière équation
de la section précédente le k déduit de (2), on obtient
(3) E = 12 meff v 2
où meff est une constante. Le complément "d'énergie de mouvement" dans un paquet d'ondes a la
même dépendance en vitesse qu'une particule classique. La constante meff , appelée "masse
effective", est donnée par
h2
(4) meff =
2 Ab 2
Si nous désignons par convention meff v comme "impulsion", celle-ci est alors reliée au nombre
d'ondes k de la même façon que pour une particule libre.
N'oubliez pas que meff n'a rien à voir avec la masse réelle d'un électron. Il peut y avoir une très
grande différence, mais en général dans les cristaux, l'ordre de grandeur reste voisin, environ deux à
vingt fois la masse de l'électron libre.
Nous avons pu expliquer ce grand mystère, comment un électron dans un cristal (comme par
exemple un électron ajouté à un cristal de germanium) peut-il le traverser et s'y déplacer librement,
bien qu'il doive se heurter à tous les atomes ? Il peut le faire parce que ses amplitudes font bip-bip-
bip d'un atome à l'autre, lui frayant ainsi son trajet. C'est pour cette raison qu'un solide peut
conduire l'électricité.
II.1.1.4. Un électron dans un réseau à trois dimensions
Voyons un peu comment on pourrait appliquer les mêmes idées pour voir ce qui arrive à un
électron dans l'espace à trois dimensions. On aboutit à des résultats très similaires. Supposez que
nous ayons un réseau rectangulaire d'atomes d'espacements a, b, c, suivant les trois directions (si
vous voulez un réseau cubique, prenez a, b, et c tous égaux). Supposez que les amplitudes pour un
bond jusqu'à l'atome voisin dans l'alignement x, y ou z soient respectivement iAx / h , iAy / h ,
iAz / h . Et maintenant, comment devons nous décrire les états de base ? Comme dans le cas à une
dimension, un état de base est constitué pat l'électron situé près de l'atome de coordonnées x, y, z,
où (x, y, z) est un des points du réseau. Si nous prenons l'un des atomes pour origine, les positions
des points sont toutes données par
(1) x = n x a , y = n y b et z = n z c
où n x , n y et n z sont trois entiers quelconques. Mais il nous suffira de dire x, y et z en sous-
entendant qu'il s'agit de l'un des points du réseau. On peut alors représenter l'état de base par le
symbole électron en x, y, z et l'amplitude pour qu'un électron dans un état ψ soit dans cet état
de base est donnée par C ( x, y, z ) = électron en x, y, z ψ .
Comme précédemment, les amplitudes C ( x, y, z ) peuvent varier avec le temps. Avec nos
hypothèses, les équations hamiltoniennes devraient être comme ceci :
dC ( x, y, z )
ih = E 0 C ( x, y, z ) ) − Ax C ( x + a, y, z ) − Ax C ( x − a, y, z )
dt
(2) − Ay C (x, y + b, z ) − Ay C (x, y − b, z )
− Az C ( x, y, z + c ) − Az C ( x, y, z − c )
Nous allons essayer de trouver un état stationnaire pour lequel tous les C varient de la même
manière avec le temps. A nouveau, la solution est une exponentielle :
i k x x + k y y + k z z
(3) C ( x, y, z ) = e −iEt / h e
Si vous portez ceci dans (2), vous voyez que ça marche, pourvu que l'énergie E soit reliée à k x , k y
et k z de la manière suivante
(4) E = E0 − 2 Ax cos k x a − 2 Ay cos k y b − 2 Az cos k z c
L'amplitude varie comme une onde plane complexe à trois dimensions, se déplaçant dans la
(
direction de k et dont le nombre d'ondes est k = k x2 + k y2 + k z2 )
1/ 2
.
L'énergie associée à ces états stationnaires dépend des trois composantes de k de la manière
compliquée donnée par l'équation (4). Le mode de variation de E en fonction de k dépend des
signes et grandeurs relatifs de Ax , Ay et Az . Si ces trois nombres sont tous positifs et si nous nous
intéressons aux petites valeurs de k, la dépendance est relativement simple.
En développant les cosinus comme nous l'avions fait plus haut, nous obtenons cette fois
(6) E = E min + Ax a 2 k x2 + Ay b 2 k y2 + Az c 2 k z2
Pour un simple réseau cubique d'espace a, nous attendons que Ax , Ay et Az soient tous égaux,
mettons à A, et l'on doit avoir simplement
(
(7) E = E min + Aa 2 k x2 + k y2 + k z2 )
ou
(8) E = E min + Aa 2 k 2
Ce que nous avions déjà pour le cristal à une dimension. Si nous suivons les raisonnements utilisés,
nous devons en conclure que le paquet d'ondes à trois dimensions représentant un électron (formé
de la superposition de nombreux états d'énergies très voisines) se déplace lui aussi comme une
particule classique avec une certaine masse effective.
Dans un cristal de moindre symétrie qu'un cube (ou même dans un cristal cubique dans le cas où
l'état de l'électron à chaque atome n'est pas symétrique, les trois coefficients Ax , Ay et Az sont
différents. Alors la "masse effective" d'un électron localisé dans une petite région dépend de la
direction de son mouvement. Par exemple, il pourrait avoir une inertie différente selon x et selon y
(pour décrire avec exactitude cet état de chose, on fait parfois appel au "tenseur de masse
effective").
II.1.1.5. Autres états dans un réseau
Selon l'équation de l'énergie dans un réseau, les états d'électron dont il a été question ont leurs
énergies confinées dans une certaine "bande" qui s'étend depuis le niveau minimum
(1) E 0 − 2(Ax + Ay + Az )
jusqu'au niveau maximum
(2) E 0 + 2(Ax + Ay + Az )
D'autres énergies sont possibles, mais elles concernent des états d'électron d'un type différent.
Jusqu'à présent, nous avons imaginé des états de base constitués d'un électron situé à l'un des
atomes d'un cristal où il occupe un certain état, mettons l'état d'énergie minimum.
Si, à un atome libre dans l'espace, vous ajoutez un électron pour former un ion, l'ion peut se former
de diverses façons. L'électron peut s'arranger pour former l'état d'énergie minimum, il peut aussi
former l'un ou l'autre des nombreux "états excités" de cet ion dont chacun a une énergie définie au-
dessus de l'énergie minimum.
La même chose peut se passer dans un cristal. Supposons que l'énergie E 0 que nous avons choisie
ci-dessus corresponde aux états de base pour lesquels les ions ont l'énergie la plus faible possible.
Nous pourrions aussi imaginer un nouvel ensemble d'états de base pour lesquels l'électron est
agencé de manière différente avec son atome, dans l'un des états excités de l'ion, de sorte que
l'énergie E 0 se trouve alors notablement plus grande. Comme précédemment, il y a une certaine
amplitude A (pas la même) pour que l'électron saute de son état excité vers un même état excité
dans un atome voisin. Toute l'analyse se déroule comme précédemment et nous trouvons une bande
d'énergies possibles centrées à un niveau plus élevé. En général, il y aura de nombreuses bandes,
chacune correspondant à un niveau d'excitation différent.
Il y a encore d'autres possibilités. Il peut y avoir une certaine amplitude pour que l'électron passe
d'un état excité dans un atome vers un état non excité dans un autre atome voisin (cela s'appelle une
interaction entre bandes). La théorie mathématique devient de plus en plus compliquée, lorsque
vous considérez un nombre de bandes de plus en plus grand et que vous ajoutez de plus en plus de
coefficients de fuite entre les états possibles. Mais il n'y a là aucune idée nouvelle. Les équations se
posent comme nous l'avons fait dans notre exemple simple.
Il nous faudrait aussi noter qu'il n'y a pas grand chose à ajouter sur les divers coefficients qui, telle
l'amplitude A, apparaissent dans la théorie. Ils sont en général très difficiles à calculer. Par suite,
dans les cas d'intérêt pratique, la théorie ne nous apprend pas grand chose sur ces paramètres et tout
ce que nous pouvons faire, c'est utiliser les valeurs déterminées expérimentalement.
Il y a d'autres situations dont la physique et la mathématique sont presque exactement les mêmes
que ce que nous avons trouvé dans le cas d'un électron qui se déplace dans un cristal mais dans
lesquelles "l'objet" en mouvement est tout autre. Par exemple, supposez que notre cristal de départ,
ou plutôt notre réseau linéaire, soit constitué d'une rangée d'atomes neutres, ayant chacun un
électron extérieur faiblement lié. Puis imaginez que nous retirons un électron. Lequel des atomes a
perdu son électron ? Désignons par C n l'amplitude pour que l'électron manquant provienne de
l'atome n. Il y aura en général une certaine amplitude iA / h pour que l'électron d'un atome voisin,
mettons le (n-1)ième atome, saute au nième, laissant le (n-1)ième sans son électron. Il revient au
même de dire qu'il y a une amplitude A pour que l'électron manquant saute du nième atome au (n-
1)ième. Comme vous pouvez le voir, les équations sont exactement les même mais, bien sûr, la
valeur de A peut ne pas être la même. Nous aurons à nouveau les mêmes formules pour les niveaux
d'énergies, pour les "ondes" de probabilités qui se déplacent à travers le cristal avec une vitesse de
groupe, une certaine masse effective, etc. Mais, cette fois, les ondes décrivent le comportement d'un
électron manquant, d'un "trou" comme on l'appelle. Un "trou" agit donc tout à fait comme une
particule ayant une certaine masse effective meff . Cette particule vous paraîtra avoir une charge
positive. Nous reparlerons de ces trous en étudiant les semi-conducteurs.
Un autre exemple encore : imaginez une rangée d'atomes neutre tous identiques, mais dont l'un a
été mis dans un état excité, il a donc une énergie supérieure au niveau minimum. Soit C n
l'amplitude pour que le nième atome ait cette excitation. Il peut interagir avec l'atome voisin en lui
passant son excès d'énergie et en retournant lui-même à l'état minimum. Soit iA / h l'amplitude
correspondante. Vous voyez que c'est encore et toujours la même mathématique. L'objet en
mouvement s'appelle maintenant un exciton. Il se comporte comme une "particule" neutre qui, se
déplaçant à travers le cristal, transporte l'énergie d'excitation. Un mouvement de ce type est
impliqué dans certains processus biologiques, tels que la vision ou les photosynthèses. On a
supposé que l'absorption de la lumière dans la rétine produit un "exciton" qui se déplace à travers
une certaine structure périodique et que ces excitons s'accumulent en un point particulier où
l'énergie est utilisée pour induire une réaction chimique. Ces excitons se propage à travers des
molécules telles que la rhodopsine ou la chlorophylle.
II.1.1.6. Diffusion par les imperfections dans un cristal
Considérons maintenant le cas d'un électron unique dans un cristal qui ne soit pas parfait. Notre
étude précédente nous a montré que les cristaux parfaits ont une conductivité parfaite, les électrons
peuvent glisser sans frottement à travers le cristal, comme dans le vide. Parmi les choses
susceptibles d'arrêter ce mouvement perpétuel de l'électron, l'une des plus importantes consiste en
une imperfection ou irrégularité dans le cristal. A titre d'exemple, supposez qu'il y ait un atome
manquant quelque part dans le cristal ou bien supposez que quelqu'un ait mis un mauvais atome en
l'un des emplacements de sorte que la situation n'y soit pas la même qu'aux autres emplacements.
Admettons que l'énergie E 0 ou bien l'amplitude A y diffèrent. Comment pourrions-nous décrire ce
qui se passe dans ce cas ?
Pour préciser les choses, revenons au cas à une dimension et supposons que l'atome "zéro" est un
atome "d'impureté" pour lequel E 0 n'a pas la même valeur que pour les autres atomes. Désignons
cette énergie par E 0 + F . Que va-t-il se passer ? Quand l'électron arrive à l'atome "zéro", il y a une
certaine probabilité pour que l'électron soit diffusé vers l'arrière. Si un paquet d'ondes se propage et
s'il atteint un endroit où les choses sont un peu différentes, une partie du paquet va continuer sa
route et l'autre partie va rebondir vers l'arrière. Il est très difficile d'analyser une situation de ce
genre à l'aide des paquets d'ondes parce qu'alors tout change avec le temps. Il est bien plus facile de
travailler sur les solutions stationnaires. C'est ce que nous ferons donc et nous verrons que ces états
stationnaires peuvent se représenter en termes d'ondes continues ayant des parties transmises et des
parties réfléchies. En trois dimensions, nous aurions une onde diffusée au lieu d'une onde réfléchie
car elle serait alors éparpillée dans diverses directions.
Nous partons d'une série d'équations qui sont exactement les mêmes que celles que nous avions
vues à l'exception de l'équation pour n = 0 qui diffère des autres .Les cinq équations pour n = -2, -1,
0, +1 et +1 sont comme ceci :
M M
Ea − 2 = E0 a − 2 − Aa −1 − Aa −3
Ea −1 = E 0 a −1 − Aa 0 − Aa − 2
(1) Ea 0 = (E0 + F )a 0 − Aa1 − Aa −1
Ea1 = E0 a1 − Aa 2 − Aa 0
Ea 2 = E 0 a 2 − Aa3 − Aa1
M M
Bien sûr, il y a en plus toutes les autres équations pour n plus grand que 2. Elles seront exactement
semblables aux équations que nous avions vues.
Pour nous placer dans le cas le plus général, il nous faudrait prendre une valeur de A différente,
suivant qu'il s'agit de l'amplitude pour que l'électron saute de ou vers l'atome "zéro". Mais l'exemple
simplifié pour lequel tous les A sont égaux suffit à dégager les grandes lignes.
ikx
La solution exponentielle complexe e n que nous avions vue continuerait à être une solution pour
toutes les équations à l'exception de l'équation à l'atome "zéro", cela ne marche pas à cause de cette
seule équation. Il nous faut une solution différente que nous pouvons mijoter de la manière
suivante. Cette solution représente une onde se déplaçant dans la direction des x positifs. Une onde
se déplaçant dans la direction des x négatifs aurait été une solution tout aussi bonne. Elle s'écrirait
(2) a ( x n ) = e
− ikxn
La solution la plus générale serait une combinaison linéaire d'une onde vers l'avant et d'une onde
vers l'arrière, à savoir
− ikxn
(3) a n = αe + βe
ikxn
Cette solution représente une onde complexe d'amplitude α se déplaçant dans la direction +x et
une onde d'amplitude β se déplaçant dans la direction -x.
Regardez maintenant les équations de notre nouveau problème, l'équation (1) et les équations pour
tous les autres atomes. Les équations concernant les a n tels que n ≤ 1 sont toutes satisfaites par
l'équation (3) à la condition que k soit relié à E et au pas du réseau b par
(4) E = E0 − 2 A cos kb
Cela représente physiquement une onde "incidente" d'amplitude α s'approchant de l'atome "zéro"
(le "diffuseur") en venant de la gauche et une onde "diffusée" ou "réfléchie" d'amplitude β
repartant vers la gauche. Nous ne perdons rien de la généralité si nous imposons à l'amplitude α de
l'onde incidente la valeur 1. En général l'amplitude β est alors un nombre complexe.
Nous pouvons dire exactement la même chose à propos des solutions de a n pour n ≥ 1 . Comme les
coefficients peuvent être différents, nous écrivons
− ikxn
(5) a n = γe + δe
ikxn
Ici γ est l'amplitude d'une onde allant vers la droite et δ celle d'une onde venant de la droite.
Considérons la situation physique dans laquelle, initialement, il n'y a qu'une onde venant de la
gauche et, au-delà du diffuseur, ou atome d'impureté, il n'y a qu'une onde "transmise". Nous allons
essayer une solution pour laquelle δ = 0 . Nous pouvons certainement satisfaire toutes les équations
pour les a n à l'exception des trois du milieu de l'équation (1), par les solutions d'essai suivantes
a n (pour n < 0 ) = e
− ikxn
+ βe
ikxn
(6)
a n (pour n > 0 ) = γe
ikxn
Cette équation nous dit que l'onde transmise ( γ ) est exactement l'onde initiale incidente (1) avec
une onde supplémentaire égale à l'onde réfléchie. Ce n'est pas toujours vrai mais c'est ainsi pour
une diffusion par un atome seulement. S'il y avait un amas d'atomes d'impureté, la quantité ajoutée
à l'onde se propageant vers l'avant ne serait pas nécessairement égale à l'onde réfléchie.
Nous pouvons obtenir l'amplitude β de l'onde réfléchie à l'aide de l'équation centrale de (7). Nous
trouvons
−F
(11) β =
F − 2iA sin kb
Nous avons la solution complète pour le réseau avec un unique atome anormal.
Vous vous demandez peut-être comment l'onde transmise peut-être "plus" que l'onde incidente,
comme il apparaît dans l'équation (10). Mais souvenez-vous que β et γ sont des nombres
complexes et que le nombre de particules dans une onde (ou plutôt la probabilité d'y trouver une
particule) est proportionnel au carré du module de l'amplitude.
Vous pouvez montrer que ceci est vrai pour notre solution.
II.1.1.7. Capture par une imperfection d'un réseau
Il existe un cas d'un intérêt particulier, qui peut se produire si F est un nombre négatif. Si l'énergie
de l'électron à l'endroit de l'atome d'impureté (à n = 0) est plus faible qu'ailleurs, il peut y être
capturé. En d'autres termes, si E 0 + F est en-dessous de la limite inférieure E 0 − 2 A de la bande
d'énergie permise, l'électron peut alors se trouver "piégé" dans un état tel que E < E 0 − 2 A . Une
telle solution ne peut ressortir de ce que nous avons fait jusqu'à présent. Nous l'obtiendrons, par
contre, en accordant au nombre k la possibilité d'être imaginaire dans la solution d'essai précédente.
Posons k = iκ . Cette fois encore, nous pourrons avoir des solutions différentes pour n < 0 et pour n
> 0. Une solution possible pour n < 0 serait
(1) a n (pour n < 0 ) = ce
+ κx n
Nous devons prendre le signe plus pour l'exposant, autrement l'amplitude augmenterait
indéfiniment pour les valeurs négatives élevées de n. De même, une solution possible pour n > 0
serait
(2) a n (pour n > 0 ) = c ′e −κxn
Si nous portons ces solutions d'essai dans les équations, toutes, à part les trois du milieu, sont
satisfaites à condition que
(
(3) E = E0 − A e κb + e −κb )
La somme des deux termes exponentiels étant toujours plus grande que deux, cette énergie est en
dessous de la bande régulière et c'est ce que nous cherchons. Les trois équations restantes sont
satisfaites si c = c ′ et si κ est choisi de telle sorte que
( )
(4) A e κb − e −κb = − F
En combinant cette équation avec (3), nous obtenons l'énergie de l'électron piégé :
(5) E = E0 − 4 A 2 + F 2
L'électron piégé a une énergie unique, quelque peu en-dessous de la bande de conduction.
Notez que nos amplitudes (1) et (2) ne disent pas que l'électron piégé se trouve exactement là où se
trouve l'atome d'impureté. La probabilité de trouver l'électron au niveau des atomes voisins est
donnée par le carré de ces amplitudes. Pour un choix particulier des paramètres, elle pourrait varier
comme indiqué par les barres verticales ci-dessus. C'est à l'endroit de l'atome d'impureté que la
probabilité de trouver l'électron est la plus grande. Pour les atomes voisins, la probabilité tombe
exponentiellement avec la distance depuis l'atome d'impureté. C'est un autre exemple de "barrière
de pénétration". D'un point de vue de la physique classique, l'électron n'a pas assez d'énergie pour
s'échapper du "puits" d'énergie, mais, en mécanique quantique, il peut prendre un peu de large.
II.1.1.8. Amplitudes de diffusion et états liés
Enfin, notre exemple peut servir à illustrer un point très utile actuellement en physique des
particules de hautes énergies. Ce point concerne la relation entre les amplitudes de diffusion et les
états liés. Supposez que nous ayons découvert, par l'expérience ou par l'analyse théorique, comment
les pions diffusent sur les protons. Puis une nouvelle particule est découverte et quelqu'un se
demande si ce ne pourrait pas être tout simplement une combinaison d'un pion et d'un proton
maintenus ensemble dans un certain état lié (tout comme un électron est lié à un proton pour faire
un atome d'hydrogène). Par état lié, nous entendons une association ayant une énergie inférieure à
celle des deux particules libres.
Il y a une théorie générale qui affirme ceci : il existera un état lié à l'énergie pour laquelle
l'amplitude de diffusion, que l'on obtient par extrapolation algébrique (en mathématique on parle de
"prolongement analytique") dans les domaines d'énergie en dehors de la bande permise, deviendra
infinie.
La signification physique est la suivante. Un état lié constitue une situation où il n'y a que des
ondes attachées à un point, sans qu'aucune onde vienne de l'extérieur pour mettre en route ce
système qui fonctionne tout seul. Le rapport entre ce que l'on appelle l'onde "diffusée" ou l'onde
créée, d'une part, et l'onde "incidente" d'autre part, est infinie. Nous pouvons essayer cette idée dans
notre exemple. Ecrivons notre expression pour l'amplitude diffusée, directement en termes de
l'énergie E de la particule diffusée (au lieu que ce soit en termes de k). Nous pouvons récrire ainsi
l'équation
(1) 2 A sin kb = 4 A 2 − (E − E0 )
2
De la façon dont nous avons établi dette équation, nous ne devions l'utiliser que pour des états réels,
ceux dont l'énergie est dans la bande permise, E = E0 ± 2 A . Mais supposez qu'ayant oublié ce fait,
nous étendions la formule dans le domaine 'non physique" où E − E 0 > 2 A . Pour ce domaine non
physique, nous pouvons écrire
(3) 4 A 2 − (E − E 0 ) = i (E − E 0 ) − 4 A 2
2 2
(la question du signe à choisir est un détail technique. Il dépend du signe permis pour κ . Nous
laissons de coté cette discussion).
La question est maintenant : y a-t-il une énergie E pour laquelle β devienne infini (c'est-à-dire
pour laquelle l'expression pour β a un "pôle") ? Oui, si du moins F est négatif, le dénominateur de
(4) deviendra nul lorsque
(5) (E − E0 ) − 4 A 2 = F 2
2
ou lorsque
(6) E = E0 ± 4 A 2 + F 2
Le signe moins nous donne exactement la valeur que nous avions trouvée plus haut pour l'énergie
de capture.
Et le signe plus ? Il donne une énergie au-dessus de la bande permise. Et de fait, il y a là un autre
état lié et nous sommes passés à coté lorsque nous avons résolu les équations. A vous de trouver
l'énergie et les amplitudes a n pour cet état lié.
La relation entre la diffusion et les états liés est l'un des fils directeurs les plus utiles dans les
recherches actuelles pour une compréhension des observations expérimentales sur les nouvelles
particules étranges.
II.1.2. Variation des amplitudes avec la position
Nous allons maintenant regarder comment varient dans l'espace les amplitudes de probabilité de la
mécanique quantique. Dans ce qui a précédé, vous avez pu avoir cette impression désagréable que
certaines choses étaient laissées de coté. Par exemple, quand nous avons parlé de la molécule
d'ammoniac, nous avons pris l'option de la décrire en termes de deux états de base. Pour l'un de ces
états de base, nous avons pris la situation pour laquelle l'atome d'azote se trouve "au-dessus" du
plan des trois atomes d'hydrogène et, pour l'autre, celle où il est "en-dessous". Pourquoi avons-nous
pris uniquement ces deux états ? Pourquoi ne serait-il pas possible que l'atome d'azote soit à 2
angströms au-dessus du plan des trois atomes d'hydrogène, ou bien à 3 angströms ou à 4 ? Très
certainement, l'atome d'azote pourrait occuper beaucoup de positions diverses. Il est évident que
nous avons laissé beaucoup de détails de coté.
Nous avons sciemment éludé ces détails. Nous avons dit que seuls certains aspects du problème
nous intéressaient et, par suite, nous avons supposé que l'atome d'azote placé au-dessus du plan des
atomes d'hydrogènes se mettrait dans une certaine condition assez bien définie. Alors, la probabilité
de trouver l'azote aurait eut une certaine distribution assez bien définie au-dessus du plan des
atomes d'hydrogènes, mais les détails ne nous importaient pas.
On peut aussi voir les choses d'une autre manière. Dans notre discussion sur la molécule
d'ammoniac, nous avions choisi une description approchée, lorsque nous parlions en termes de
deux états de base. En réalité, il y a une foule d'états. Par exemple, pour l'électron se propageant
dans un cristal, l'électron peut se mettre dans la situation de l'état le plus bas, mais il y a aussi de
nombreux états excités. Nous l'avions déjà suggéré. Pour chaque état excité, la distribution de
l'électron au voisinage de l'atome est différente. Nous avons ignoré ces détails en déclarant que seul
nous importait la présence de l'électron au voisinage de l'atome. Nous avons ignoré le détail des
états excités. Mais ce sont justement ces états excités qui donnent lieu à des distributions diverses
de l'électron autour de l'atome. Si nous voulons décrire en détail les atomes, nous devons prendre
aussi en considération ces autres états de base possibles. Nous pourrions le faire de diverses
manières dont l'une consisterait à considérer de plus près des états pour lesquels la position de
l'électron dans l'espace est plus explicitement décrite.
Nous sommes maintenant en mesure d'envisager une procédure plus élaborée qui nous permettra de
parler de manière précise de la position de l'électron, ceci en donnant une amplitude probabilité
pour trouver l'électron en quelque endroit que ce soit. Cette théorie plus complète fournira les
soubassements des approximations que nous avons faites dans nos discussions antérieures. Les
équations que nous avions alors peuvent apparaître comme une sorte d'approximation d'une théorie
plus complète.
Mais pourquoi n'avons nous pas commencé par la théorie plus complète, en faisant des
approximations au fur et à mesure ? Nous avons pensé qu'il vous serait plus facile de saisir les
rouages de la mécanique quantique en commençant par les approximations à deux états pour tendre
progressivement vers la théorie plus complète, plutôt qu'en abordant le sujet en sens inverse. Notre
façon d'aborder le sujet se trouve ainsi être l'ordre inverse de celui que vous trouverez dans
beaucoup de livres.
Quand nous entrerons dans le vif du sujet, vous remarquerez l'abandon d'une règle que nous avons
toujours suivie jusqu'à présent. Chaque fois que nous avons abordé un sujet, nous avons essayé de
donner une description plus ou moins complète de la physique, cherchant, si possible, à vous
montrer où conduisaient les idées énoncées. Tout en décrivant certains détails particuliers, nous
nous sommes efforcés de vous montrer les conséquences générales d'une théorie, de sorte que vous
puissiez voir où elle pouvait conduire. Nous allons abandonner cette règle. Nous allons voir
comment on peut parler des amplitudes de probabilité dans l'espace et vous montrer les équations
différentielles qui les gouvernent. Nous n'aurons pas la possibilité de traiter toutes les implications
qui découlent directement de cette théorie. De fait, nous ne pourrons pas même aller jusqu'à relier
cette théorie à certaines des formules approchées que nous avons utilisées précédemment, en ce qui
concerne par exemple la molécule d'ammoniac. Nous pourrons toutefois montrer de nombreux
prolongements et développements de la théorie et il sera toujours possible au lecteur d'approfondir
certains domaines ou applications à travers la littérature spécialisée. Après tout, il nous faut bien
laisser quelque chose pour l'avenir.
II.1.2.1. Les amplitudes le long d'une droite
Comment un électron peut-il se déplacer le long d'une ligne d'atomes ? Revoyons une fois encore
ce que nous avons appris à ce sujet. Quand un électron a une certaine amplitude pour sauter d'un
atome à l'atome voisin, il existe alors des états d'énergie définie, pour lesquels l'amplitude de
probabilité pour trouver l'électron est distribuée le long du réseau sous la forme d'une onde
progressive. Pour de grandes longueurs d'onde, c'est-à-dire pour les faibles valeurs du nombre
d'ondes k, l'énergie de l'état est proportionnelle au nombre d'ondes. Pour un réseau cristallin de pas
b, dans lequel l'amplitude par unité de temps pour le saut de l'électron d'un atome à l'autre est
iA / h , l'énergie de l'état est reliée à k (pour kb petit) par
(1) E = Ak 2 b 2
Nous avons vu aussi qu'un groupe d'ondes de ce type avec des énergies voisines pouvait constituer
un paquet d'ondes ayant le comportement d'une particule classique de masse effective meff donnée
par :
h2
(2) meff =
2 Ab 2
Du fait que les ondes d'amplitude de probabilité se comportent dans un cristal comme une particule,
on pourrait bien s'attendre à ce que la description quantique d'une particule présente le même type
de comportement ondulatoire. Imaginez un réseau linéaire et supposez que nous rendions le pas b
de plus en plus petit. A la limite, nous pourrions trouver l'électron n'importe où le long de la ligne.
Ce serait une manière de décrire le mouvement d'un électron dans le vide. En d'autres termes, si
nous imaginons l'espace comme une infinité de points tous très proches les uns des autres et si nous
savons établir les équations qui relient les amplitudes en un point aux amplitudes aux points
voisins, nous aurons les lois quantiques du mouvement d'un électron dans l'espace.
Il peut sembler quelque peu audacieux de remplacer une ligne d'atomes par une simple ligne de
points. Après tout, les atomes sont pour le moins différents des points de l'espace ! Mais ce qui a
servi à élaborer les équations (1) et (2) n'est pas tant le fait que ces atomes soient particuliers avec
une certaine structure plus ou moins complexe que le fait que l'électron était localisé au voisinage
de l'atome. En outre, si un électron est localisé autour d'une petite zone de l'espace, qu'elle soit
occupée par un atome ou pas, l'électron a une certaine amplitude pour se déplacer autour d'une
autre petite zone de l'espace. La comparaison est donc plus qu'une analogie et les équations
utilisées peuvent s'appliquer telles qu'elles. En outre, les équations (1) et (2) ont été obtenues avec
l'approximation de kb petit et pour l'espace, où b tend vers zéro (les points sont contigus), cette
approximation est évidemment valide. Nous ne rencontrerons évidemment pas ici des situations
telles qu'un atome dans un état excité étant entendu qu'un point de l'espace est immatériel et
pourrait difficilement être dans un état excité.
Commençons par rappeler certains des principes généraux de la mécanique quantique. Supposez
que nous ayons dans un système quantique une particule qui peut se trouver dans diverses
conditions. Nous appelons "état" toute condition particulière dans laquelle un électron peut se
trouver et nous la représentons par un vecteur d'état, disons φ . Une autre condition peut être
représentée par un autre vecteur d'état, disons ψ . Nous introduisons ensuite l'idée d'états de base.
Nous disons qu'il y a un ensemble d'états de base 1 , 2 , 3 , 4 , etc. ayant les propriétés
suivantes. D'abord, tous ces états sont tout à fait distincts, nous disons qu'ils sont orthogonaux. Par
là, nous voulons dire que pour deux états de base quelconques i et j , l'amplitude i j pour
qu'un électron que l'on sait être dans l'état j soit aussi dans l'état i est égale à zéro, à moins bien sûr
que i et j représentent le même état. Symboliquement, nous écrivons
(3) i j = δ ij
Ensuite, les états de base i doivent constituer un ensemble complet, de sorte que n'importe quel
état puisse être représenté en termes de ces états de base. C'est-à-dire que n'importe quel état φ
doit pouvoir être décrit complètement par la donnée des amplitudes i φ pour qu'une particule
dans l'état φ se trouve aussi dans l'état i . En fait, le vecteur d'état φ est égal à la somme de
tous les états de base, chacun étant multiplié par un coefficient qui est l'amplitude pour que l'état
φ soit aussi dans l'état i :
(4) φ = ∑ i i φ
i
Finalement, si nous considérons deux états quelconques φ et ψ , l'amplitude pour que l'état ψ
soit aussi dans l'état φ sera déterminée en faisant d'abord la projection de l'état ψ sur les états
de base et en projetant à nouveau à partir de ces états de base sur l'état φ . Nous écrivons cela de la
manière suivante :
(5) φ ψ = ∑ φ i i ψ
i
Quand nous considérions un électron sur une ligne d'atomes, nous avions pris pour états de base
l'ensemble des états pour lesquels l'électron est localisé en l'un des atomes. L'état de base n
représentait la condition pour laquelle l'électron est localisé à l'atome numéro "n" (que nous
appelions nos états de base n au lieu de i n'a bien sûr aucune signification particulière). Un peu
plus tard, nous avons préféré désigner les états de base par la coordonnée x n de l'atome plutôt que
par son numéro d'ordre. L'état x n est le même que l'état n , seule l'écriture a changé. Ensuite,
selon les règles générales, n'importe quel état, disons ψ , est déterminé une fois les amplitudes
données pour qu'un électron dans l'état ψ soit aussi dans les divers états x n . Pour des raisons
pratiques, nous avons utilisé le symbole C n pour ces amplitudes
(6) C n = x n ψ
Du fait que les états de base sont associés à des positions sur la ligne, nous pouvons concevoir
l'amplitude C n comme une fonction de la coordonnée x et écrire C ( x n ) . De façon générale, les
amplitudes C ( x n ) vont varier avec le temps et sont donc aussi des fonctions de t. Mais, sauf
exception, nous ne nous soucierons pas d'écrire explicitement cette dépendance.
Nous avons ensuite conjecturé que la variation des amplitudes C ( x n ) avec le temps devait être
dictée par l'équation hamiltonienne. Dans notre nouvelle notation, cette équation s'écrit
∂C ( x n )
(7) ih = E0 C (x n ) − AC ( x n + b ) − AC ( x n − b )
∂t
Les deux derniers termes sur la droite représentent le processus par lequel un électron venant de
l'atome n + 1 ou de l'atome n - 1 vient se placer en n.
Nous avons trouvé que l'équation (7) a des solutions qui correspondent à des états d'énergie définie,
que nous avons écrit ainsi
(8) C ( x n ) = e iEt / h e
ikxn
Pour les états de faible énergie, les longueurs d'onde sont grandes (k est faible) et l'énergie est reliée
à k par
(9) E = (E 0 − 2 A) + Ak 2 b 2
elle est aussi donnée par l'équation (1) si nous choisissons notre zéro d'énergie de façon à ce que
E0 − 2 A = 0 .
Voyons ce qui se passerait si nous faisions tendre le pas b vers zéro, tout en conservant le nombre
d'ondes k inchangé. Si seul b changeait, le dernier terme de (9) tendrait tout simplement vers zéro et
il n'y aurait plus de physique. Mais supposez que A et b varient ensemble de sorte que le produit
Ab 2 reste constant quand b tend vers zéro. Cela se justifie intuitivement puisque si le point voisin
est beaucoup plus proche, on imagine facilement que l'électron a plus facile pour s'y rendre et donc
que l'amplitude augmente. En faisant appel à l'équation (2), nous remplaçons Ab 2 par la constante
h 2 / 2meff . Dans ces conditions, l'équation (9) resterait la même, mais que deviendrait alors
l'équation différentielle (7) ?
Avec notre choix pour E 0 , le premier terme disparaît. Nous pouvons ensuite penser à une fonction
continue C ( x ) qui passe par les valeurs propres C ( x n ) en chaque x n . Quand le pas b tend vers
zéro, les points x n se rapprochent de plus en plus et la quantité entre crochets (si nous maintenons
une variation de C ( x ) suffisament régulière) devient tout simplement proportionnelle à la dérivée
seconde de C ( x ) . Nous pouvons écrire, comme vous pourrez vous en convaincre en faisant le
développement de Taylor de chaque terme ou en passant directement par la définition de la dérivée,
l'égalité
∂ 2 C (x )
(11) 2C ( x ) − C (x + b ) − C ( x − b ) ≈ −b 2
∂x 2
Nous avons une équation qui nous dit que le taux de variation de C ( x ) , l'amplitude pour trouver
l'électron en x, en fonction du temps, dépend de l'amplitude pour trouver l'électron en des points
voisins et ceci de manière proportionnelle à la seconde dérivée de l'amplitude par rapport à la
position.
L'équation quantique correcte pour le mouvement d'un électron dans l'espace libre fut découverte
en premier par Schrödinger. Pour un mouvement le long d'une droite, elle a exactement la forme de
l'équation (12) après que l'on ait remplacé la masse effective meff par la masse m de l'électron dans
l'espace libre. Pour un mouvement le long d'une droite dans l'espace libre, l'équation s'écrit
∂C ( x ) h 2 ∂ 2 C (x )
(13) ih =−
∂t 2m ∂x 2
Nous ne voulons pas vous faire croire que nous avons établi l'équation de Schrödinger, mais
seulement vous montrer une manière de voir les choses. Quand Schrödinger a écrit cette équation
pour la première fois, il en a donné une sorte de démonstration fondée sur des raisonnements
heuristiques et sur quelques brillantes suppositions intuitives. Certains des raisonnements qu'il a
utilisés étaient même faux, mais cela n'a pas d'importance. Ce qui importe c'est qu'en fin de compte
l'équation donne une description correcte de la nature. Le but de notre discussion était simplement
de vous montrer que l'équation fondamentale de la mécanique quantique (13) a la même forme que
celle que vous obtenez pour le cas limite d'un électron se déplaçant sur une ligne d'atomes. On peut
donc penser à l'équation différentielle (13) comme la description de la diffusion d'une amplitude de
probabilité d'un point à l'autre le long d'une ligne. Autrement dit, si l'électron a une certaine
amplitude pour être en un point, il aura, un instant plus tard, une certaine amplitude pour être en des
points voisins. De fait, l'équation ressemble un peu aux équations de diffusion. Mais il y a une
différence essentielle : le coefficient imaginaire devant la dérivée par rapport au temps donne un
comportement complètement différent de celui que vous obtiendriez pour la diffusion ordinaire, par
exemple pour un gaz se répandant autour d'un tube fin. La diffusion ordinaire donne lieu à des
solutions exponentielles réelles, tandis que les solutions de (13) sont des ondes complexes.
II.1.2.2. La fonction d'onde
Maintenant que vous avez une certaine idée sur la façon dont les choses vont se présenter, nous
voulons revenir au point de départ et étudier la description du mouvement d'un électron le long
d'une droite sans avoir à considérer des états associés à des atomes dans un réseau. Nous voulons
retourner au point de départ et voir quelles idées nous devons utiliser si nous voulons décrire le
mouvement d'une particule libre dans l'espace. Etant donné que nous nous intéressons au
comportement d'une particule libre dans un milieu continu, nous aurons affaire à un nombre infini
d'états possibles et, comme vous le verrez, les idées que nous avons élaborées pour traiter d'un
nombre fini d'états devront subir quelques modifications techniques.
Tout d'abord, nous maintenons le vecteur d'état x comme représentation d'un état pour lequel une
particule est exactement localisée à la coordonnée x. A toute valeur de x le long de la ligne, par
exemple 1.73, 9.67 ou 10, correspond un état. Nous prendrons ces états x comme états de base et, si
nous incluons tous les points de la droite, nous aurons un ensemble complet pour un mouvement à
une dimension. Supposez que nous ayons maintenant un type différent d'état, disons ψ , pour
lequel un électron est distribué d'une certaine manière le long de la droite. Une façon de décrire cet
état est de donner toutes les amplitudes pour que l'électron se trouve aussi dans chacun des états de
base x . Nous devons donner un ensemble infini d'amplitudes, une pour chaque x. Nous écrirons
ces amplitudes sous la forme x ψ . Chacune de ces amplitudes est un nombre complexe et
puisqu'il y a un nombre complexe de ce type pour chaque valeur de x, l'amplitude x est tout
simplement une fonction de x. Nous pouvons aussi l'écrire sous la forme C ( x ) ,
(1) C ( x ) ≡ x ψ
Nous avons déjà eut affaire à des amplitudes qui varient d'une manière continue en fonction des
coordonnées lorsque nous avons parlé des variations de l'amplitude avec le temps. Nous avons
montré par exemple que l'amplitude pour une particule d'impulsion définie doit avoir une variation
particulière dans l'espace. Si une particule a une impulsion définie p et une énergie correspondante
E, l'amplitude pour qu'elle se trouve en une position x quelconque doit avoir l'aspect suivant
(2) x ψ = C ( x ) ∝ e + ipx / h
Cette équation exprime un principe général important de la mécanique quantique qui relie les états
de base correspondant aux diverses positions dans l'espace à un autre système d'états de base, à
savoir : tous les états d'impulsion définie. Les états d'impulsion définie sont souvent plus pratique
que les états en x pour certains types de problèmes. L'un et l'autre ensemble d'états de base sont
bien sur tout aussi acceptables pour la description d'une situation de mécanique quantique. Nous
reviendrons plus tard sur la question de leur relation réciproque. Pour le moment, nous voulons
nous en tenir à notre discussion sur une description en termes des états x .
Avant de continuer, nous voulons faire un petit changement de notation qui, nous l'espérons,
n'introduira pas trop de confusion. La fonction C ( x ) définie dans (1) aura une forme qui dépendra
bien entendu de l'état ψ considéré. Il nous faudrait l'indiquer d'une manière ou d'une autre. Par
exemple, nous pourrions spécifier de quelle fonction C ( x ) il s'agit par un indice, disons Cψ (x ) .
Ceci serait une notation parfaitement satisfaisante, mais elle est un peu compliquée et ce n'est pas
celle que vous trouverez dans la plupart des livres. Presque tout le monde laisse tomber la lettre C
et utilise le symbole ψ pour définir la fonction
(3) ψ ( x ) ≡ Cψ ( x ) = x ψ
Cette notation étant la plus utilisée dans le monde entier, il vaut mieux vous y habituer pour ne pas
être déroutés quand vous la rencontrerez quelque part. C'est d'ailleurs avec cette notation que nous
avons présentée brièvement la fonction d'onde au début. Gardez cependant à l'esprit que nous allons
maintenant utiliser ψ de deux manières différentes. Dans l'équation (1), ψ est une désignation que
nous avons donnée à un état physique particulier de l'électron. Par contre, dans (3), le symbole ψ
est utilisé pour définir une fonction mathématique de x laquelle est égale à l'amplitude pour être
localisé en chaque point x de la ligne. Nous espérons que ce ne sera pas trop déroutant une fois que
vous vous serez fait à cette idée. Rappelons à ce propos que la fonction ψ ( x ) est habituellement
appelée la "fonction d'onde" car c'est le plus souvent une fonction complexe des variables, qui
représente une onde.
Ayant défini ψ ( x ) comme l'amplitude pour qu'un électron dans l'état ψ se trouve à la position x,
nous serions tenté d'interpréter le module carré de ψ comme probabilité de trouver un électron à la
position x. Malheureusement, la probabilité de trouver une particule exactement en un point est
généralement nulle. En général, l'électron sera étalé sur une certaine région de la droite et comme il
y a sur tout un segment même petit un nombre infini de points, la probabilité que l'électron soit en
l'un de ces points ne peut pas être un nombre non nul (la somme sur l'infinité de points donnerait
forcément une probabilité supérieure à un, ce qui est une absurdité). On ne peut décrire la
probabilité de trouver un électron qu'au moyen d'une distribution de probabilité (ou densité de
probabilité) qui fixe la probabilité relative de trouver l'électron en diverses positions
approximatives le long de la droite. Soit prob( x, ∆x ) la chance de trouver l'électron dans un petit
intervalle ∆x au voisinage de x. Pour toute situation physique, si nous nous plaçons à une échelle
suffisament petite, la probabilité variera d'une manière régulière d'un endroit à l'autre et, pour tout
segment ∆x , petit mais non nul, elle sera proportionnelle à ∆x . Nous pouvons modifier nos
définitions de manière à tenir compte de cela.
On peut concevoir l'amplitude x ψ comme représentant une sorte de "densité d'amplitude" pour
tous les états de base x dans une petite région. Puisque la probabilité de trouver un électron dans
un petit intervalle ∆x doit être proportionnelle à cet intervalle, nous modifions notre définition de
x ψ de façon qu'elle réponde à la relation suivante :
(4) prob( x, ∆x ) = x ψ
2
∆x
L'amplitude x ψ est donc proportionnelle à l'amplitude pour qu'un électron dans l'état ψ se
trouve dans l'état de base x et la constante de proportionnalité est choisie de manière à ce que le
module carré de l'amplitude x ψ donne la densité de probabilité pour trouver l'électron dans une
petite région quelconque. On peut récrire l'équation ci-dessus sous la forme
(5) prob( x, ∆x ) = ψ ( x ) ∆x
2
Notons que toutes ces modifications ne sont pas arbitraires. Elles sont conformes au passage à la
limite que nous avons fait en passant d'un nombre fini d'états à un nombre infini, ainsi qu'au
passage à la limite en théorie des probabilités lorsque l'on passe de probabilités discrètes à une
densité de probabilités.
Il nous faut maintenant modifier certaines de nos équations précédentes pour les rendre compatibles
avec cette nouvelle définition d'une amplitude de probabilité. Supposez que nous ayons un électron
dans l'état ψ et que nous voulions connaître l'amplitude pour le trouver dans un état différent φ ,
lequel peut correspondre à un autre type d'étalement de l'électron. S'il s'agissait d'un ensemble fini
d'états discrets, nous aurions utilisé la relation habituelle. Avant la modification de notre définition
des amplitudes, nous aurions écrit
(6) φ ψ = ∑ φ x x ψ
tout x
Si l'une et l'autre de ces amplitudes sont normalisées de façon que nous avons décrite ci-dessus, une
somme sur tous les états d'une petite région x donnerait la même chose qu'une multiplication par x
et la somme sur toutes les valeurs de x devient alors tout simplement une intégrale. Avec nos
définitions modifiées, la forme correcte devient
(7) φ ψ = ∫ φ x x ψ dx
tout x
L'amplitude x ψ est ce que nous appelons maintenant ψ ( x ) et de façon similaire, nous décidons
que l'amplitude sera représentée par φ (x ) . Nous souvenant que φ x est le conjugué complexe de
ψ ( x ) , nous pouvons récrire (6)
(8) φ ψ = ∫ φ ∗ ( x )ψ ( x )dx
Avec nos nouvelles définitions, toutes les formules que nous avions précédemment s'appliquent à
condition de remplacer tout signe de sommation par une intégrale sur x.
Il nous faut ajouter une précision à ce que nous venons de dire. Tout ensemble satisfaisant d'états de
base doit être complet pour que son utilisation donne une description correcte de ce qui se passe.
Pour un électron dans une dimension, ne spécifier que les états de base x ne suffit pas car, pour
chacun de ces états, l'électron peut avoir son spin ou bien en haut, ou bien en bas. Une façon
d'obtenir un ensemble complet consiste à prendre deux ensembles d'états suivant x, l'un pour le spin
vers le haut et l'autre pour le spin vers le bas. Mais nous ne nous soucierons pas de ces
complications pour l'instant.
II.1.2.3. Les états de moment défini
Supposez que nous ayons un électron dans un état ψ décrit par l'amplitude de probabilité
x ψ = ψ ( x ) . Nous savons que ceci représente un état pour lequel l'électron est étalé le long de la
ligne suivant une certaine distribution, de sorte que la probabilité de trouver l'électron dans un petit
intervalle dx à l'emplacement x est simplement
(1) prob( x, dx ) = ψ ( x ) dx
2
Que pouvons-nous dire sur l'impulsion de l'électron ? Nous pourrions nous demander quelle est la
probabilité pour que cet électron ait l'impulsion p ? Calculons d'abord l'amplitude pour que l'état
ψ soit dans un autre état mom p , que nous définissons comme un état d'impulsion définie p.
Nous pouvons trouver cette amplitude en utilisant la dernière équation de la section précédente, qui
est la clef pour le calcul des amplitudes. En termes de l'état mom p
+∞
(2) mom p ψ = ∫ mom p x x ψ dx
x = −∞
Et la probabilité pour que l'on trouve l'électron avec l'impulsion p devrait être donnée par le module
carré de cette amplitude. Nous avons cependant, cette fois encore, une petite difficulté au sujet des
normalisations. De manière générale, nous pouvons nous interroger seulement sur la probabilité de
trouver un électron avec une impulsion à l'intérieur d'un petit domaine dp au voisinage de p. La
probabilité pour que l'impulsion ait exactement une certaine valeur p doit être nulle (à moins que
l'état se trouve être un état d'impulsion définie). Si nous demandons la probabilité de trouver
l'impulsion à l'intérieur d'un petit domaine dp alors nous obtiendrons une probabilité finie. Il y a
diverses manières d'ajuster les normalisations. Nous choisirons celle que nous considérons être la
plus pratique, bien que cet aspect puisse vous échapper pour l'instant.
Nous définissons les normalisations de manière à ce que la probabilité soit reliée à l'amplitude par
(3) prob( p, dp ) = mom p ψ
2 dp
2πh
Avec cette définition, la normalisation de l'amplitude mom p ψ est déterminée. L'amplitude
mom p ψ est bien sûr le conjugué complexe de l'amplitude x mom p , cette dernière étant celle
que nous avons donné au début de la section précédente. Avec la normalisation que nous avons
choisie, il se trouve que la constante de proportionnalité placée devant l'exponentielle est tout
simplement égale à 1. Plus précisément
∗
(4) mom p x = x mom p = e −ipx / h
Prenons un cas particulier, par exemple celui d'un électron localisé dans une certaine région au
voisinage de x = 0. Prenons une fonction d'onde ayant la forme suivante :
(6) ψ ( x ) = Ke − x
2 / 4σ 2
La distribution de probabilité en x pour cette fonction d'onde en est le module carré, c'est-à-dire
(7) prob( x, dx ) = P( x )dx = K 2 e − x
2 / 2σ 2
dx
La fonction densité de probabilité est une courbe gaussienne représentée ci-dessus. La plus grande
partie de la probabilité est concentrée entre x = +σ et x = −σ . Nous disons que la "demi-largeur"
de la courbe est σ (plus précisément, pour quelque chose de réparti suivant cette distribution, σ
est égal à la racine carrée de la moyenne des carrés de la coordonnée x, c'est l'écart type). Il nous
faudrait choisir la constante K de façon à ce que la densité de probabilité P( x ) ne soit pas
simplement proportionnelle à la probabilité par unité de longueur de trouver l'électron mais une
échelle telle que P( x )∆x soit égal à la probabilité de trouver l'électron dans l'intervalle ∆x au
voisinage de x. Nous obtenons la constante K qui correspond à cela, en imposant que
+∞
∫ P(x )dx = 1 , puisqu'il doit y avoir une probabilité unité pour que l'électron soit trouvé quelque
−∞
part, c'est-à-dire sur un intervalle couvrant toute la droite. Dans le cas présent, après le calcul de
(
l'intégrale, nous obtenons K = 2πσ 2 )−1 / 4
.
+∞ 2
Pour calculer cette intégrale il suffit d'utiliser le résultat mathématique classique ∫ e −t dt = π .
−∞
Cherchons maintenant la distribution en impulsion. Soit φ ( p ) l'amplitude pour trouver l'électron
avec l'impulsion p,
(8) φ ( p ) ≡ mom p ψ
Les mathématiciens ne seraient sans doute pas tout à fait d'accord avec notre manière de procéder,
néanmoins le résultat est correct.
(12) φ ( p ) = 8πσ 2 ( )
1/ 4
e− p σ
2 2
/ h2
On peut prouver, c'est assez étonnant, que pour aucune autre forme de distribution en x ou en p, le
produit ∆p∆x ne peut être plus petit que celui que nous avons trouvé ici. La distribution gaussienne
donne la plus petite valeur possible pour le produit des moyennes quadratiques. De manière
générale, nous pouvons dire que
h
(16) ∆p∆x ≥
2
C'est là une expression quantitative du principe d'indétermination de Heisenberg dont nous avons
déjà discuté de façon qualitative. Généralement, nous disions, de façon approximative, que la
valeur minimum du produit ∆p∆x est du même ordre que h .
II.1.2.4. Normalisation des états en x
Revenons à la discussion sur les modifications qu'il nous faut introduire dans les équations
générales lorsque nous avons affaire à un continuum d'états de base. Lorsque nous avons un
nombre fini d'états discrets, une condition fondamentale à laquelle doit répondre l'ensemble des
états de base est
(1) i j = δ ij
Si une particule est dans un état de base, l'amplitude pour qu'elle soit dans un autre état de base est
nulle. En choisissant une normalisation appropriée, nous avons fait en sorte que i i soit 1. Ces
deux choses sont inclues dans (1). Nous voulons voir maintenant comment on peut modifier cette
relation lorsque l'on utilise les états de base x d'une particule sur une droite. Si l'on sait que la
particule est dans l'un des états de base x , quelle est l'amplitude pour qu'elle soit dans un autre
état de base x ′ ? Si x et x' sont deux emplacements différents le long de la droite, l'amplitude
x x ′ est certainement nulle, ce qui est en accord avec l'équation (1). Mais si x et x' sont égaux,
l'amplitude x x ′ ne sera pas 1, à cause de ce bon vieux problème de normalisation. Pour voir
comment nous pouvons arranger les choses, retournons à l'équation donnant les amplitudes entre
états en fonction des états de base que nous appliquons au cas particulier où l'état φ est
précisément l'état de base x ′ . Nous obtenons ainsi
(2) x ′ ψ = ∫ x ′ x x ψ dx
L'amplitude x ψ est tout simplement ce que nous avons appelé la fonction ψ ( x ) . De même,
l'amplitude x ′ ψ , qui se réfère au même état ψ , est la même fonction de la variable x', à savoir
ψ ( x ′) . Nous pouvons donc écrire l'équation (2) sous la forme
(3) ψ ( x ′) = ∫ x ′ x ψ ( x )dx
Cette équation doit être vraie pour tout état ψ et donc pour toute fonction arbitraire ψ ( x ) . Cette
exigence devrait déterminer complètement la nature de l'amplitude x x ′ , c'est bien sûr une
fonction qui dépend de x et x'.
Nous sommes ramenés au problème qui consiste à trouver une fonction f ( x, x ′) qui multipliée par
ψ ( x ) et intégrée sur tous les x donne simplement la quantité ψ ( x ′) . Or, il n'existe pas de fonction
mathématique qui puisse faire cela ! Du moins, rien qui ressemble à ce que nous appelons
normalement une "fonction".
Prenons pour x' le nombre particulier 0 et définissons l'amplitude 0 x comme une certaine
fonction de x, disons f ( x ) . L'équation (1) devient alors ceci :
(4) ψ (0 ) = ∫ f ( x )ψ ( x )dx
Quelle sorte de fonction f ( x ) pourrait bien satisfaire à cette équation ? Puisque l'intégrale ne peut
pas dépendre des valeurs que prend ψ ( x ) sauf pour x nulle, il faut que f ( x ) soit 0 pour tout x autre
que 0. Mais si f ( x ) est 0 partout, l'intégrale sera zéro elle aussi et l'équation (4) ne sera pas
satisfaire. Nous avons donc une situation impossible : nous voulons une fonction qui soit nulle
partout, sauf en un point, et qui cependant donne une intégrale finie. Comme nous ne pouvons pas
trouver de fonction qui remplisse ces conditions, une échappatoire consiste à dire que la fonction
f ( x ) est définie par l'équation (2). C'est-à-dire que f ( x ) est la fonction qui rend (4) correcte. Cette
fonction, inventée par Dirac, porte son nom. On l'écrit δ ( x ) . Plus exactement, c'est ce qu'on appelle
une distribution ou une fonction généralisée et les mathématiciens ont donné un support
mathématique rigoureux à cette approche intuitive à travers la théorie des distributions.
Ainsi, en remplaçant f ( x ) par cette fonction dans (4), l'intégrale sélectionne la valeur de ψ ( x )
pour x = 0. Tout ce que nous avons à dire de la fonction δ ( x ) est qu'elle possède cette étrange
propriété. Et puisque l'intégrale ne doit pas dépendre des valeurs de ψ ( x ) pour tout x différent de
zéro, la fonction δ ( x ) doit être nulle partout sauf en x = 0. En résumé, nous pouvons écrire
(5) 0 x = δ (x )
où δ ( x ) est définie par
(6) ψ (0 ) = ∫ δ ( x )ψ ( x )dx
Remarquez ce qui se passe lorsque l'on prend pour ψ la fonction particulière "1". L'équation (6)
devient alors
(7) 1 = ∫ δ ( x )dx
Autrement dit, la fonction δ ( x ) qui a la propriété d'être nulle partout sauf en x = 0 a cependant une
intégrale finie de valeur 1. Il nous faut donc imaginer un infini fantastique en un point pour que la
surface totale sous δ ( x ) soit égale à 1.
Une façon de concevoir ce qu'est la fonction δ de Dirac, consiste à imaginer une série de
rectangles ou, à votre choix, toute autre fonction qui ait la forme d'un pic (voir plus bas), qui soient
de plus en plus étroits et de plus en plus hauts en gardant toujours une surface unité, comme dans la
figure ci-dessus. L'intégrale de cette fonction de − ∞ à + ∞ est toujours 1. Si vous la multipliez par
une fonction ψ ( x ) quelconque et si vous intégrez le produit, vous obtenez quelque chose qui est
approximativement la valeur de la fonction en x = 0 (moyennée sur la largeur du rectangle),
l'approximation devenant meilleure au fur et à mesure que le rectangle devient plus étroit. Vous
pouvez donc imaginer la fonction δ ( x ) comme la limite de ce processus. Mais la seule chose
importante est que la fonction est définie de sorte que l'équation (6) soit vraie pour toute fonction
ψ ( x ) . Cela définit de manière unique la fonction δ . Ses propriétés sont alors telles que nous les
avons décrites.
Nous en avons ainsi terminé avec les modifications des équations fondamentales, modifications
qu'il nous fallait faire pour traiter du continuum des états de base qui correspondent aux points le
long d'une droite. L'extension à trois dimensions est assez immédiate. Nous remplaçons d'abord la
coordonnée x par le vecteur r. Les intégrales sur x sont alors remplacées par des intégrales sur x, y
et z. Elles deviennent des intégrales de volumes. Et enfin, Il faut remplacer la fonction δ à une
dimension tout simplement par le produit de trois fonctions δ , l'une en x, une autre en y et la
troisième en z, δ ( x − x ′)δ ( y − y ′)δ ( z − z ′) . En rassemblant toutes ces choses, nous obtenons
l'ensemble suivant d'équations sur les amplitudes pour une particule à trois dimensions :
(10) φ ψ = ∫ φ r r ψ dV
(11) r ψ = ψ (r )
(12) r φ = φ (r )
(13) φ ψ = ∫ φ ∗ (r )ψ (r )dV
(14) r r ′ = δ ( x − x ′)δ ( y − y ′)δ ( z − z ′)
Que se passe-t-il lorsqu'il y a plus d'une particule ? Nous allons vous dire comment l'on traite le cas
de deux particules et vous verrez aisément ce qu'il faut faire si vous voulez vous occuper d'un
nombre plus grand. Supposez que deux particules que nous appelons particule N° 1 et particule N°
2. Qu'allons nous prendre pour états de base ? Si nous décrivons un état en disant que la particule 1
est en x1 et la particule 2 est en x 2 , nous aurons un ensemble tout à fait correct, que nous écrirons
x1 , x 2 . Notez que la donnée de la position de l'une des deux particules ne définit pas un état de
base. Chaque état de base doit décrire le système entier. Vous ne devez pas penser que chaque
particule se déplace indépendamment comme une onde à trois dimensions. Tout état physique peut
se définir en donnant toutes les amplitudes x1 , x 2 pour trouver les deux particules en x1 et x 2 .
L'amplitude généralisée est donc une fonction de deux ensembles de coordonnées x1 et x 2 . Vous
voyez qu'une telle fonction n'est pas une onde, au sens d'une oscillation qui se déplace dans les trois
dimensions. De façon générale, ce n'est pas non plus le simple produit de deux ondes individuelles,
une pour chaque particule, mais une sorte d'onde selon les six dimensions définies par x1 et x 2 . S'il
y a dans la nature deux particules qui interagissent entre elles, il n'y a pas moyen de décrire ce qui
arrive à l'une des deux particules en cherchant à écrire une fonction d'onde pour elle uniquement.
Ce caractère non séparable des particules est une des particularités les plus étonnantes (mais qui
complique aussi singulièrement les calculs). Elle conduit à des situations parfois difficiles à saisir et
que nous aurons l'occasion d'examiner. Certaines de ces situations semblent paradoxales et ont
donné beaucoup de difficultés aux gens qui, à tort, essayaient de penser à la fonction d'onde pour
une particule toute seule et non à la fonction d'onde correcte qui dépend des coordonnées des deux
particules. La description complète ne peut se faire de façon correcte qu'en utilisant des fonctions
des coordonnées des deux particules.
Une représentation particulière qui est assez utile implique sin ( gx ) / πx comme une fonction de x
où g est un nombre positif. Son avantage par rapport aux rectangles est d'être une fonction
infiniment dérivable. Elle a la valeur g / π en x = 0 et oscille avec une amplitude décroissante et
avec la période 2π / g lorsque x croit. Elle a également une intégrale unité pour x variant de − ∞
à + ∞ , indépendamment de la valeur de g. Donc, la limite de ces fonctions lorsque g → ∞ a toutes
les propriétés de la fonction δ . Elle devient infiniment grande en x = 0, elle a une intégrale unité et
les oscillations infiniment rapides lorsque x croît signifie que la contribution entière de l'intégrale
contenant cette fonction vient du voisinage infinitésimal de x = 0. Nous pouvons donc poser
(15) δ ( x ) = lim
sin gx
g →∞ πx
Chacune des six premières équations peut être établie en multipliant les deux cotés par une fonction
différentiable continue f ( x ) et en intégrant sur x. Par exemple, la quatrième équation donne
(17) ∫ f ( x )xδ ′( x )dx = − ∫ δ ( x ) [xf ( x )]dx = − ∫ δ ( x )[ f ( x ) + xf ′( x )]dx = − ∫ f (x )δ ( x )dx
d
dx
où le terme de conditions aux limites résultant de l'intégration par partie s'annule. Donc, xδ ′( x ) a le
même effet lorsqu'il est un facteur dans l'intégrand que − δ ( x ) . De même, la septième équation
signifie que les deux cotés donnent le même résultat quand ils sont multipliés par f (a ) ou f (b ) et
intégrés sur a et b. La dernière équation est vérifiée en intégrant les deux cotés sur x ou a.
II.1.3. L'équation de Schrödinger
Jusqu'à présent, nous nous sommes uniquement souciés de décrire des états susceptibles de
représenter un électron situé en n'importe quel point de l'espace. Il nous faut maintenant voir
comment insérer dans notre description la physique de ce qui peut se produire dans diverses
circonstances. Comme précédemment, il nous faut voir comment les états peuvent varier dans le
temps. Si nous avons un état ψ qui se transforme un peu plus tard dans un autre état ψ ′ , nous
pouvons décrire la situation à tout instant en faisant de la fonction d'onde, qui n'est rien d'autre que
l'amplitude r ψ , une fonction du temps aussi bien que des coordonnées. On peut alors décrire
une particule dans une situation donnée par une fonction d'onde dépendant du temps
ψ (r, t ) = ψ ( x, y, z , t ) . Cette fonction d'onde, qui varie avec le temps, décrit l'évolution des états
successifs qui se produisent au cours du temps. Cette "représentation d'espace", qui donne des
projections de l'état ψ sur les états de base r peut ne pas être toujours la plus pratique, mais
c'est elle que nous allons considérer d'abord.
Plus tôt, nous avons décrit la variation des états en fonction du temps en terme de l'hamiltonien
H ij . La variation des diverses amplitudes en fonction du temps était donnée par l'équation
matricielle
dC
(1) ih i = ∑ H ij C j
dt j
Cette équation nous dit que la variation de chaque amplitude C i en fonction du temps est
proportionnelle à toutes les autres amplitudes C j , avec les coefficients de proportionnalité H ij .
Quel aspect peut bien prendre l'équation (1) lorsqu'on utilise un continuum d'états de base x ?
Souvenons-nous d'abord que l'équation (1) peut aussi s'écrire
d
(2) ih i ψ = ∑ i Hˆ j j ψ
dt j
Ce que nous avons à faire est maintenant très clair. Pour la représentation x nous pouvons écrire
d
(3) ih x ψ = ∫ x Hˆ x ′ x ′ ψ dx ′
dt
La somme sur tous les états de base j se trouve remplacée par une intégrale sur x'. Puisque x Hˆ x ′
doit être une certaine fonction de x et de x', nous pouvons l'écrire sous la forme H ( x, x ′) , ce qui
correspond au H ij de l'équation (1). L'équation (3) est donc identique à
ψ ( x ) = ∫ H ( x, x ′)ψ ( x ′)dx ′
d
(4) ih
dt
avec
(5) H ( x, x ′) ≡ x Hˆ x ′
Pour une particule se déplaçant librement dans l'espace, sans qu'il y ait de force ni de perturbation,
la loi correcte de la physique est
h2 d 2
(6) ∫ H (x, x ′)ψ ( x ′)dx ′ = − ψ (x )
2m dx 2
Où avons-nous trouvé cette forme ? Nulle part. Il n'est pas possible de la déduire de quoi que ce soit
que vous connaissiez. Elle est sortie de l'esprit de Schrödinger, lorsqu'il luttait pour trouver une
compréhension des observations expérimentales du monde réel. Pourquoi doit-elle être ainsi, vous
pouvez en avoir une certaine intuition en pensant à la façon dont nous avons établi la version pour
une particule libre à partir de la considération de la propagation d'un électron dans un cristal. La
naissance originale de cette équation est d'ailleurs représentative. Au départ, Schrödinger présenta
son équation sans explication sur la manière de l'obtenir. Mais les physiciens n'aiment pas trop voir
quelque chose tiré comme d'un chapeau de magicien sans avoir ne fut ce qu'une idée de la manière
dont on a pu l'obtenir, même si cette équation marche admirablement bien ce qui, a posteriori, en
constitue la seule validation expérimentale valable. Ce n'est que sur l'insistance de ses pairs que
Schrödinger donna le cheminent de sa pensée ayant abouti à ce résultat. Nous donnerons ci-dessous
une autre "déduction" intuitive plus proche de cette approche traditionnelle.
Les particules libres ne sont pas, à vrai dire, très excitantes. Que se passe-t-il si nous faisons agir
des forces sur la particule . Eh bien, si la force sur la particule peut être dérivée d'un potentiel
scalaire, nous pensons à des forces électriques, non magnétiques, et si nous nous en tenons à des
énergies faibles, de sorte que nous pouvons ignorer les complications dues aux mouvements
relativistes, l'hamiltonien qui s'adapte au monde réel donne alors ceci
h2 d 2
(7) ∫ H (x, x ′)ψ ( x ′)dx ′ = − ψ ( x ) + V ( x )ψ ( x )
2m dx 2
A nouveau, vous pouvez vous faire une certaine idée de l'origine de cette équation si vous revenez
au mouvement de l'électron dans un cristal et si vous regardez comment il faudrait modifier les
équations pour tenir compte d'une lente variation de l'énergie de l'électron d'un emplacement
atomique à l'autre, ce serait le cas s'il y avait un champ électrique à travers le cristal. Le terme E 0
varierait alors lentement avec la position et correspondrait au nouveau terme que nous avons ajouté
dans (7).
Vous vous demandez sans doute pourquoi nous sommes allés directement de l'équation (6) à
l'équation (7) au lieu de vous donner tout simplement l'expression correcte pour l'amplitude
H ( x, x ′) = x Hˆ x ′ . La raison en est que H ( x, x ′) ne peut s'exprimer qu'au moyen de fonctions
algébriques étranges, bien que toute l'intégrale à droite de l'équation (6) puisse s'écrire avec des
choses qui vous sont maintenant familières. Si vous êtes vraiment curieux, H ( x, x ′) peut s'écrire de
la manière suivante :
h2
(8) H ( x, x ′) = − δ ′′( x − x ′) + V ( x )δ (x − x ′)
2m
où δ ′′ représente la dérivée seconde de la fonction de Dirac. Cette fonction assez étrange peut être
remplacée par un opérateur algébrique différentiel qui lui est totalement équivalent
h2 d 2
(9) H ( x, x ′) = − 2
+ V ( x )δ ( x − x ′)
2m dx
Nous n'utiliserons pas ces expressions et nous travaillerons directement avec la forme (7).
Si nous portons l'expression (7) dans l'intégrale en (3), nous obtenons pour ψ ( x ) = x ψ l'équation
différentielle suivante :
∂ψ h2 ∂2
(10) ih =− ψ ( x ) + V ( x )ψ ( x )
∂t 2m ∂x 2
Si nous nous intéressons à un mouvement à trois dimensions, nous voyons clairement comment
modifier l'équation (10). Il suffit de remplacer d 2 / dx 2 par
∂2 ∂2 ∂2
(11) ∇ 2 = 2 + 2 + 2
∂x ∂y ∂z
et V ( x ) par V ( x, y, z ) . L'amplitude ψ ( x, y, z ) pour un électron qui se place dans un potentiel
V ( x, y, z ) obéit à l'équation différentielle
∂ψ h2 2
(12) ih =− ∇ ψ + Vψ
∂t 2m
Bien que nous ayons abordé le sujet selon une voie complètement différente, le grand moment
historique de la naissance de la description quantique de la matière s'est produit lorsque
Schrödinger en 1926 a écrit pour la première fois son équation. Pendant de longues années, la
structure atomique interne de la matière était restée un grand mystère. Personne n'avait été capable
de comprendre ce qui maintient la matière ensemble, pourquoi il y a des forces de liaisons
chimiques et surtout comment il peut se faire que des atomes puissent être stables. Si Bohr avait su
donner une description du mouvement interne d'un électron dans un atome d'hydrogène, description
qui paraissait expliquer le spectre de la lumière émise par cet atome, la raison pour laquelle les
électrons se déplacent de cette manière restait un mystère. La découverte par Schrödinger des
équations propres du mouvement des électrons à l'échelle atomique a fourni une théorie à partir de
laquelle on peut calculer des phénomènes atomiques de façon quantitative, précise et détaillée. En
principe, l'équation de Schrödinger permet d'expliquer tous les phénomènes atomiques sauf ceux
qui font intervenir le magnétisme et la relativité. Elle permet d'expliquer les niveaux d'énergie d'un
atome ainsi que tous les faits qui concernent les liaisons chimiques. Cependant, ceci n'est vrai qu'en
principe, pour résoudre exactement n'importe quel problème sauf les plus simples, les calculs
deviennent rapidement trop compliqués. Seuls les atomes d'hydrogène et d'hélium ont pu être
calculés avec une grande précision. Cependant, à l'aide de diverses approximations, dont certaines
sont assez vaseuses, de nombreux faits concernant des atomes plus compliqués et concernant les
liaisons chimiques de molécules ont pu être compris. Nous vous avons montré certaines de ces
approximations dans ce qui a précédé. Depuis, avec l'usage de calculateurs de plus en plus puissant
et le développement du calcul numérique massif, des calculs précis de situations un peu plus
compliquées que l'atome d'hélium ont pu être abordés avec succès. Mais les méthodes
d'approximations restent indispensables pour des situations plus complexes.
Cette limite à la capacité du calcul peut sembler un défaut de la théorie. Le fait que l'équation soit
difficile à résoudre dans les cas compliqués n'enlève rien au fait que l'équation est correcte et on ne
peut évidemment simplifier cette équation, dans le simple but d'avoir des calculs plus simples, sans
obtenir un résultat qui ne correspond en rien à la réalité. La nature n'existe pas telle qu'elle est dans
le but de nous rendre la vie facile. En outre, ce genre de situation ne devrait pas tellement
surprendre. Déjà, avec la théorie de la gravitation de Newton, dont les équations sont
particulièrement simples, les équations générales pour trois corps ne peuvent être résolues
exactement et, pire encore, les solutions manifestent un comportement chaotique dans de nombreux
régimes, ce qui rend l'analyse des solutions, même numériques, très difficile. Enfin, il va de soit
qu'il est plus facile de décrire le plan d'une maison en donnant les dimensions des murs qu'en
donnant la position de chaque brique. Plus on rentre dans le détail et plus le travail devient
considérable. L'équation de Schrödinger permet de descendre dans l'infiniment petit et de
comprendre les comportements des atomes mais reconstruire le monde qui nous entoure avec toute
sa complexité et ses milliards de milliards d'atomes ne peut évidemment se faire sans difficulté.
L'équation de Schrödinger, telle que nous l'avons écrite, ne tient compte d'aucun effet magnétique.
Il est possible de tenir compte de ces effets d'une manière approchée en ajoutant quelques termes de
plus à l'équation. Cependant, le magnétisme est essentiellement un effet relativiste. Une description
correcte du mouvement d'un électron dans un champ électromagnétique arbitraire ne peut donc se
faire que par une équation relativiste. L'équation relativiste correcte pour le mouvement d'un
électron a été découverte par Dirac une année après que Schrödinger ait proposé son équation. Elle
se présente sous une forme très différente.
La fonction de potentiel V est l'équivalent classique de l'énergie potentielle totale de toutes les
particules. Si aucune force extérieure n'agit sur les particules, la fonction V est simplement l'énergie
électrostatique d'interaction de toutes les particules. Autrement dit, si la ième particule porte la
charge Z i q e , la fonction V est alors simplement (avec la convention selon laquelle e 2 = q e2 / 4πε 0 )
Zi Z j 2
(14) V (r1 , r2 , r3 , K) = ∑ e
rij
Développement de l'équation
Nous allons maintenant présenter une autre approche pour déduire l'équation de Schrödinger par la
recherche d'une équation d'onde généralisant les propriétés ondulatoires des particules quantiques.
Cette déduction a l'avantage de la rapidité mais elle n'offre pas la profondeur de compréhension
physique qui a été apportée par la déduction précédente. Toutefois, cette déduction à l'avantage de
bien mettre en avant le coté ondulatoire des particules quantiques en même temps que le fait que ce
ne sont pas tout à fait des ondes classiques.
Une fonction d'onde ψ ( x, t ) qui représente une particule de position totalement indéterminée
voyageant dans la direction de x positif avec un moment connu avec précision p et une énergie
cinétique E devrait avoir une des formes
cos(kx − ω t )
sin (kx − ω t )
(17)
e i (kx −ω t )
e −i ((kx −ω t ))
ou une combinaison linéaire de ces solutions. Cela suit directement des expériences de diffractions
et d'interférences et de l'exigence qu'un paquet d'ondes d'approximativement le nombre d'ondes k et
la pulsation ω a une vitesse de groupe égale à celle d'une particule libre classique de moment p et
d'énergie E.
A la recherche d'une équation d'ondes
Afin d'aller au-delà du problème très simple d'une onde harmonique continue, il est désirable
d'avoir une équation dont les ondes harmoniques et les ondes plus compliquées sont solution. Un
exemple d'un domaine plus familier de la physique devrait aider à clarifier ce point. Dans le cas des
ondes sonores à trois dimensions dans un gaz, il est possible d'obtenir une solution du problème de
la diffusion du son par une sphère rigide en superposant des ondes harmoniques progressives
voyageant dans différentes directions. Mais il est beaucoup plus simple de résoudre l'équation
différentielle pour les ondes sonores directement en coordonnées sphériques. Si la température du
gaz change de point en point, aucun progrès ne peut être fait dans le cas général sans une telle
équation différentielle. L'équation correcte pour les ondes sonores peut être trouvée directement à
partir de considérations sur les propriétés mécaniques du gaz. Bien que ce ne soit pas le cas avec
l'équation dont les fonctions d'onde sont solutions, il n'est pas moins impératif de trouver la forme
de l'équation. La nécessité devient encore plus évidente quand la fonction d'onde d'écrit le
mouvement d'une particule sous l'influence de forces externes. Cette situation s'avère être
l'analogue de la propagation des ondes sonores dans un gaz non homogène. Nous allons donc
trouver une telle équation pour ψ puis nous la regarderons comme un attribut plus fondamental de
la fonction d'onde que les formes harmoniques (17).
L'équation doit avoir deux propriétés de base. Tout d'abord elle doit être linéaire, afin que les
solutions puissent obéir au principe de superposition, produire des effets d'interférences (dans le cas
à trois dimensions).et permettre la construction de paquets d'ondes. Et, ensuite, les coefficients de
l'équation doivent seulement impliquer des constantes telles que h et la masse et la charge de la
particule, et non les paramètres d'un type particulier de mouvement de la particule (impulsion,
énergie, nombre d'ondes et fréquence). La raison de cette exigence est que nous désirons laisser
ouvert la possibilité de superposer des solutions qui possèdent différentes valeurs de ces
paramètres. Cela signifie qu'une telle fonction d'onde plus générale ne peut pas être solution d'une
équation qui implique ces paramètres dans sa structure. Puisque les équations différentielles sont
les plus faciles à manipuler, il est intéressant d'essayer de type d'équation d'abord et il s'avère que
les exigences peuvent être satisfaites par une équation différentielle.
Avec toutes ces considérations à l'esprit, nous regardons d'abord l'équation d'onde à une dimension
la plus familière qui décrit le mouvement d'une onde transverse sur une corde ou une onde sonore
plane dans un gaz :
∂ 2ψ ∂ 2ψ
(18) = γ
∂t 2 ∂x 2
où γ est le carré de la vitesse de l'onde. La substitution des formes (17) dans l'équation (18) montre
que chacune des quatre solutions harmoniques et donc leurs combinaisons linéaires satisfont
l'équation différentielle si et seulement si nous posons
ω2 E2 p2
(19) γ = 2 = 2 =
k p 4m 2
où m est la masse de la particule décrite par l'équation (18). A cause de la structure (19), il est
évident que le coefficient γ qui apparaît dans (18) implique les paramètres du mouvement (E ou
p). Nous écartons donc cette équation différentielle.
La substitution montre que les deux premières fonctions d'onde (17) ne sont pas solutions de (20)
mais que les deux dernières le sont (mais pas les deux en une fois) si la constante γ est choisir de
manière appropriée. En particulier, si nous choisissons
i ω i hE i h
(21) γ = 2 = 2 =
k p 2m
alors la troisième fonction d'onde (17) satisfait (20). De plus, la valeur de γ donnée dans (21)
implique seulement les constantes h et m.
Nous sommes donc conduit à la forme à une dimension de l'équation d'onde de Schrödinger pour
une particule libre de masse qui, à partir de (20) et (21), peut être écrite
∂ψ h 2 ∂ 2ψ
(22) ih =−
∂t 2m x 2
La forme particulière sous laquelle (22) est écrite est significative pour la solution harmonique, la
troisième fonction d'onde (17), car elle transforme le coté gauche en Eψ et le coté droit en
(p 2
)
/ 2m ψ .
Les développements ultérieurs montreront que ce sont aussi des représentations valides quand la
particule n'est pas libre.
Tout comme la relation classique entre l'énergie et le moment est utilisée ci-dessus pour en déduire
la structure de l'équation (25), il est maintenant désirable de partir de la relation classique
correspondante qui inclut les forces extérieures. Cela est simplement exprimé en terme de l'énergie
potentielle
p2
(29) E = + V (r, t )
2m
où E est maintenant l'énergie totale et le premier et le second termes sur la droite sont
respectivement les énergies cinétiques et potentielles de la particule.
Puisque V ne dépend pas de p ni de E, les équations (29) et (27) suggèrent que l'équation (25) se
généralise en
∂ψ h2 2
(30) ih =− ∇ ψ + V (r, t )ψ
∂t 2m
La fonction d'onde ψ (r, t ) qui est solution de l'équation de Schrödinger est maintenant supposée
fournir une description complète en mécanique quantique du comportement d'une particule de
masse m avec l'énergie potentielle V (r, t ) et est donc l'analogue de la trajectoire classique r (t ) . La
signification de la fonction d'onde doit toutefois être agrémentée de détails concernant son
interprétation qui nous permet d'extraire de ψ le maximum d'information permis par la nature.
Tout comme la validité de l'équation de Schrödinger, l'interprétation de la fonction d'onde doit être
jugée par sa consistance logique et sont adéquation aux résultats expérimentaux.
Interprétation statistique
Revenons sur le fait que la fonction d'onde est en fait une amplitude et fournit donc les probabilités
de trouver la particule à un endroit déterminé. Cela signifie qu'en pratique, on doit interpréter ψ en
termes statistiques.
Nous pouvons imaginer un nombre très grand de régions de l'espace identiques, indépendantes et
sans parties communes, suffisament grandes pour contenir toutes les propriétés intéressantes du
mouvement et dans chacune le comportement d'une particule avec l'énergie potentielle V (r, t ) est
décrit par la même fonction d'onde ψ (r, t ) . Dans chaque cas, r se rapporte à une origine dans la
région concernée. Ou bien, nous pouvons imaginer un très grand nombre de répétitions du même
mouvement dans la même région de l'espace avec, à chaque fois, t se rapportant à une origine
particulière du temps. Le lien entre amplitude et probabilité découle d'une hypothèse, due à Born,
que le résultat numérique de la mesure à un moment particulier t (pour autant que le moment où la
mesure est faite puisse être spécifié) de toute quantité physique significative, tel que position
moment ou énergie, ne sera en général pas le même dans chaque région mais sera plutôt une
distribution de valeurs qui peut être décrit par une fonction de probabilité.
Il est naturel de relier cette probabilité à la fonction ψ mais celle-ci est en général un nombre
complexe. L'hypothèse de Born est de supposer que le produite de ψ avec son complexe conjugué
ψ ∗ donne la densité de probabilité de la position. Comme nous l'avions vu.
(1) P(r, t ) = ψ ∗ (r, t )ψ (r, t ) = ψ (r, t )
2
Cela signifie que P(r, t )dxdydz est la probabilité de trouver une particule dans son élément de
volume dx dy dz autour du point r à l'instant t, quand un grand nombre de mesures précises de la
position sont effectuées sur des particules indépendantes, chacune décrite par la fonction d'onde à
une particule ψ (r, t ) .
Normalisation de ψ
La probabilité de trouver la particule quelque part dans la région doit être l'unité. L'équation (1)
implique donc que la fonction d'onde est normalisée :
(2) ∫ ψ (r, t ) d 3 r = 1
2
où l'intégrale s'étend sur la région entière. Ici d 3 r est l'élément de volume à trois dimensions dx dy
dz. Si ψ est un paquet d'onde, l'intégrale (2) converge et le coefficient numérique de ψ peut être
ajusté pour que l'intégrale soit égale à l'unité. Une telle normalisation ne change pas le fait que ψ
est une solution de l'équation de Schrödinger car celle-ci est homogène en ψ . Il y a cependant des
solutions, comme une onde plane, telles que l'intégrale (2) ne converge pas sur un volume infini.
De telles fonctions nécessitent des considérations particulières sur lesquelles nous reviendrons.
Pour le moment, nous pouvons imaginer que la fonction d'onde est définie dans une région de
l'espace éventuellement très grande mais finie. Dans ce cas, l'intégrale (2) est faites sur un volume
fini et elle converge, permettant la normalisation.
Le coefficient de ψ qui normalise doit être indépendant du temps afin que ψ satisfasse l'équation
de Schrödinger. Donc, si (2) est satisfait, l'interprétation de ψ comme densité de probabilité
2
nécessite que l'intégrale de normalisation soit indépendante du temps. C'est en fait le cas et cela
peut être vérifié en calculant la dérivée par rapport au temps de l'intégrale de P sur tout volume fixé
Ω :
∂ ∗ ∂ψ ∂ψ ∗ 3
P(r, t )d r = ∫ ψ ψ d r
∂t ∫Ω
3
+
Ω
∂t ∂t
=
ih
∫Ω
[ (
ψ ∗ ∇ 2ψ − ∇ 2ψ ∗ ψ d 3 r ) ]
(3) 2m
=
ih
2m ∫Ω
[ (
∇ ⋅ ψ ∗ ∇ψ − ∇ψ ∗ ∇ψ d 2 r ) ]
=
ih
2m ∫A
[ (
ψ ∗∇ψ − ∇ψ ∗ ∇ψ n dA ) ]
où on a remplacé ∂ψ / ∂t en utilisant l'équation de Schrödinger et son conjugué complexe. La
dernière intégrale est obtenue par intégration partielle (théorème de Green) où A est la surface
frontière de la région d'intégration et l'indice n indique la composante du vecteur entre crochet dans
la direction normale vers l'extérieure à l'élément de surface dA.
(4) S(r, t ) =
h
2im
[
ψ ∗∇ψ − (∇ψ ∗ )ψ ]
Ce qui nous donne
∂
(5) ∫ P(r, t )d 3 r = − ∫ ∇ ⋅ Sd 3 r = − ∫ S n dA
∂t Ω Ω A
Dans le cas d'un paquet d'ondes pour lequel ψ s'annule à grande distance et l'intégrale de
normalisation converge, l'intégrale de surface est évidemment zéro quand Ω est l'espace entier.
Pour une fonction d'onde de type onde plane, ψ peut être définie dans une région finie Ω telle
qu'elle s'annule ou a une structure périodique le long de la frontière, comme nous verrons. Dans
tous ces cas, on vérifie sans difficulté que l'intégrale de surface dans (6) est nulle, tel que l'intégrale
de normalisation dans (1) est constante dans le temps.
Bien que cette interprétation de S soit suggestive, on doit bien comprendre que S n'est pas
susceptible d'une mesure directe dans le sens où P l'est. Il serait trompeur, par exemple, de dire que
S(r, t ) est la moyenne du flux de particule mesuré au point r et au moment t car une mesure du flux
local moyen implique des mesures simultanées de haute précision de la position et de la vitesse (qui
est équivalente à l'impulsion) et est donc inconsistante avec la relation d'indétermination.
Néanmoins, il est quelque fois utile de voir S comme un vecteur de flux, en particulier quand il
dépend seulement légèrement ou pas du tout de r tel qu'une détermination précise de la vitesse peut
être faite sans altérer l'utilité du concept de flux.
Valeur moyenne
L'existence de la densité de probabilité de position P(r, t ) rend possible le calcul de ce que nous
appelons la valeur moyenne du vecteur position d'une particule, qui est définie comme le vecteur
dont les composantes sont les moyennes pondérées des composantes correspondantes de la position
de la particule. La valeur moyenne est la moyenne mathématique (dans le sens de la théorie des
probabilités) pour le résultat d'une seule mesure ou est la moyenne des résultats d'un grand nombre
de mesures sur des systèmes indépendant du type discuté au début de cette section. Nous écrivons
la valeur moyenne de r comme
(8) r = ∫ rP (r, t )d 3 r = ∫ψ ∗ (r, t )rψ (r, t )d 3 r
qui est équivalente aux trois équations
(9) x = ∫ψ ∗ xψd 3 r y = ∫ψ ∗ yψd 3 r z = ∫ ψ ∗ zψ d 3 r
où ψ est normalisé.
Attention de ne pas confondre la notation < > pour une moyenne avec la notation des crochets de
Dirac pour les amplitudes. Il arrive parfois que certaines notations se trouvent avoir plusieurs
usages, ce dont nous sommes désolés, mais il est préférable de suivre les notations conventionnelles
pour ne pas que vous soyez déroutés en lisant des articles spécialisés dans le domaine.
La valeur moyenne est une fonction de seulement le temps puisque ψ et P dépendent de t et que les
coordonnées spatiales ont été intégrées.
Les valeurs moyennes de toute autre quantité physiquement significative peut être obtenue d'une
manière similaire si elles sont uniquement fonctions de la coordonnée de la particule r. Donc, la
valeur moyenne de l'énergie potentielle est
(10) V = ∫ V (r, t )P(r, t )d 3 r = ∫ψ ∗ (r, t )V (r, t )ψ (r, t )d 3 r
Une quantité telle que l'impulsion ou l'énergie doivent, cependant, être exprimées en fonction de r
et de t avant qu'un calcul de ce type puisse être fait. Nous supposons qu'il est possible d'utiliser les
représentations sous forme d'opérateurs différentiels que nous avons vues. Nous reviendrons sur ce
point. La question qui est cependant immédiatement soulevée est comment de tels opérateurs
différentiels doivent être combinés avec la densité de probabilité P.
On peut répondre à la question en imposante l'exigence raisonnable suivante aux valeurs moyennes
:
p2
(11) E = + V
2m
en analogie avec l'équation classique de l'énergie. Cette exigence est raisonnable car on s'attend à
ce qu'en moyenne, les particules quantiques obéissent aux équations classiques. En termes
d'opérateurs différentiels, (11) peut être écrit
∂ h2 2
(12) ih = − ∇ + V
∂t 2m
Il est visible que l'équation (12) est consistante avec l'équation de Schrödinger seulement si la
valeur moyenne est définie dans le cas général avec l'opérateur agissant sur ψ et multiplié à gauche
par ψ ∗ . Nous obtenons donc, par exemple,
∂ψ 3
(13) E = ∫ψ ∗ih d r p = ∫ψ ∗ (− ih )∇ψd 3 r
∂t
Comme dans l'équation (8), la deuxième équation (13) est équivalente aux équations sur les
composantes
∂ψ 3
p x = −i h ∫ ψ ∗ d r
∂x
∂ψ 3
(14) p y = −ih ∫ψ ∗ d r
∂y
∂ψ 3
p z = −i h ∫ ψ ∗ d r
∂z
Théorème d'Ehrenfest
Il est assez raisonnable de s'attendre à ce que le mouvement d'un paquet d'ondes soit en accord avec
le mouvement d'une particule classique quant l'énergie potentielle change de manière négligeable
sur les dimensions du paquet. Ce que nous avons déjà constaté pour la propagation d'un électron
dans un cristal ou la limite classique des forces. Si nous entendons par vecteurs "position" et
"impulsion" du paquet les moyennes pondérées ou valeurs moyennes de ces quantités, nous
pouvons montrer que les équations classiques et quantiques sont toujours en accord. Une
composante de la "vitesse" du paquet sera le taux de changement dans le temps de la valeur
moyenne de cette composante de la position car x dépend seulement du temps et la variable x
dans l'intégrand de (9) est une variable d'intégration, c'est-à-dire
d d ∂ψ 3 ∂ψ ∗
(15) x = ∫ψ ∗ xψd 3 r = ∫ψ ∗ x d r+∫ xψd 3 r
dt dt ∂t ∂t
On peut simplifier cette expression en substituant, aux dérivées du temps de la fonction d'onde et de
son complexe conjugué, la partie droite de l'équation de Schrödinger et en annulant les termes V où
nous continuons à supposer pour le moment que V est réel :
d i h2 2 h2 2 ∗
x = − ∫ψ ∗ x − ∇ ψ + Vψ d 3 r − ∫ − ∇ ψ + Vψ ∗ xψd 3 r
dt h 2m 2m
(16)
=
ih
2m ∫ [ ( ) ( ) ]
ψ ∗ x ∇ 2ψ − ∇ 2ψ ∗ xψ d 3 r
De même, nous pouvons calculer le taux de changement dans le temps d'une composante de
"l'impulsion" de la particule comme
d d ∂ψ 3
p x = −i h ∫ ψ ∗ d r
dt dt ∂x
∗ ∂ ∂ψ 3 ∂ψ ∗ ∂ψ 3
= −i h ∫ ψ
d r+∫ d r
∂x ∂ t ∂t ∂x
∂ h2 2 h2 2 ∗ ∂ψ 3
= − ∫ψ ∗ − ∇ ψ + Vψ d 3 r + ∫ − ∇ ψ + Vψ ∗ d r
∂x 2m 2m ∂x
(20)
∂ ∂ψ 3
= − ∫ψ ∗ (Vx ) − V d r
∂x ∂x
∂V
= − ∫ψ ∗ ψd 3 r
∂x
∂V
= −
∂x
à nouveau en utilisant l'équation de Schrödinger et en intégrant deux fois par parties.
Les équations (19) et (20) ainsi que pour les autres composantes constituent le théorème
d'Ehrenfest. Elles sont les analogues des équations classiques du mouvement :
dr p dp
(21) = = −∇V
dt m dt
Puisque le coté gauche de (1) ne dépend que de t et le coté droit que de r, les deux cotés doivent
être égaux à la même constante de séparation que nous appellerons E (le lecteur ne doit pas
s'inquiéter d'un risque de confusion avec l'énergie car ce choix n'est pas innocent comme nous
allons le voir). Alors, l'équation pour f est facilement intégrée pour donner
(2) f (t ) = Ce − iEt / h
où C est une constante arbitraire et l'équation pour u devient
h2 2
(3) − ∇ + V (r )u (r ) = Eu (r )
2m
Puisque l'équation (3) est homogène en u, la constante C peut être choisie pour normaliser u. Alors
une solution particulière de l'équation de Schrödinger est
(4) ψ (r, t ) = u (r )e − iEt / h
Signification de la constante de séparation E
L'opérateur dérivée du temps donnée comme une représentation de l'énergie peut être appliqué à ψ
de l'équation (4) pour donner
∂ψ
(5) ih = Eψ
∂t
Une équation de ce type est appelée une équation aux valeurs propres. Une fonction ψ solution de
cette équation est appelée une fonction propre ou un état propre de l'opérateur qui apparaît à
gauche et la constante multiplicative E qui apparaît à droite est appelée valeur propre.
Une fonction propre, comme la fonction ψ donnée par (4), est appelée un état stationnaire de la
particule puisque ψ est constant dans le temps. Nous avions déjà vu auparavant de telles
2
solutions stationnaires d'énergie bien définie dans certains cas particuliers, comme les particules
libres.
L'équation (3) est aussi une équation aux valeurs propres. Elle dit que u (et donc aussi ψ ) est une
( )
fonction propre de l'opérateur − h 2 / 2m ∇ 2 + V (r ) avec la même valeur propre E. On s'attend bien
sûr à ce que ψ soit une fonction propre de cet opérateur si c'est une fonction propre de l'opérateur
dérivée dans le temps puisque selon l'équation de Schrödinger les deux opérateurs sont équivalents
non seulement pour des fonctions séparées de la forme (4) mais aussi pour des solutions plus
générales.
Nous allons anticiper un peu sur la discussion de la signification physique des fonctions propres et
des valeurs propres que nous verrons bientôt et nous allons supposer que les valeurs propres E sont
les seuls résultats possibles de mesures précises de l'énergie totale d'une particule. Il est alors
intéressant de se demander si oui ou non des solutions physiques intéressantes u (r ) de l'équation
(3) existent pour toute valeur réelle de E. Une réponse ne peut pas être obtenue sans avoir précisé la
signification de "physiquement intéressantes" en fonction des conditions aux limites imposées à
u (r ) . Cette spécification et le caractère général des valeurs propres de l'énergie qui sont associées
avec différents types de fonctions d'énergies potentielles V (r ) seront alors considérées.
harmoniques qui se propagent qui ont une grandeur constante à grande distance tel que l'intégrale
de normalisation prise sur un volume infini diverge. La première classe peut être interprétée comme
représentant des particules qui sont initialement bien localisées ou qui sont restreintes à une région
particulière de l'espace par des forces extérieures dérivées d'une énergie potentielle V (r ) . La
deuxième classe représente des particules qui ne sont ni localisées ni restreintes mais qui se
propagent à travers la région considérée sur de grandes distances. De telles fonctions d'onde seront
utiles pour décrire la diffusion de particules par un champ de force. Dans les deux cas, les fonctions
d'onde sont bornées à grande distance dans toutes les directions.
Une autre classe possible consiste en fonctions d'onde qui deviennent infinies à grande distance.
Cependant, elles ne sont pas physiquement intéressantes puisque nous n'avons aucune raison d'être
concerné par des particules dont la densité de probabilité de position devient arbitrairement grande
dans les régions éloignées de l'espace. Normaliser une telle fonction nécessiterait de diviser la
densité de probabilité par une grandeur infinie, puisque même pour une région de taille finie la
fonction d'onde n'est pas bornée à grande distance, ce qui conduirait au résultat absurde que dans
toute région on a une probabilité nulle de trouver la particule !
Conditions de continuité
L'équation de Schrödinger indépendante du temps (3) est une équation différentielle linéaire du
second ordre en r. Donc, tant que V (r ) est fini, qu'il soit ou non continu, une connaissance de la
fonction d'onde et de son gradient le long d'une surface rend possible l'intégration de l'équation
pour obtenir la fonction d'onde en tout point. Il est donc raisonnable d'exiger que la fonction d'onde
et son gradient soit continu, fini et avec une seule valeur en tout point de l'espace afin qu'une
situation physique définie puisse être représentée de manière unique par une fonction d'onde. Ces
exigences ont aussi la conséquence que la densité de probabilité de position P(r ) et la densité de
courant de probabilité S(r ) soient finis et continus partout.
Supposons, par exemple, qu'il y a une discontinuité infinie dans V à travers une surface continue,
tel que l'énergie potentielle est finie d'un coté et + ∞ de l'autre, et nous voulons déterminer la
condition aux limites sur u (r ) et ∇u à cette surface. Les propriétés essentielles du problème sont
gardées si nous remplaçons la surface continue par le plan qui est tangent au point considéré et
l'énergie potentielle changeant de manière continue d'un coté de la surface par un potentiel constant
qui peut, sans perte de généralité, est choisi égal à zéro puisque tout changement constant dans V
est équivalent à un changement identique dans E. Nous choisissons l'origine des coordonnées au
point considéré et l'axe des x perpendiculaires au plan tangent.
L'équation (3) se sépare alors dans les coordonnées spatiales et la dépendance de u en y et z n'est
pas affectée par la discontinuité de V au plan x = 0. Nous voulons donc résoudre l'équation à une
dimension
h 2 d 2u
(6) − + V ( x )u = Eu
2m dx 2
où V ( x ) = 0 pour x < 0, V ( x ) = V0 pour x > 0 et nous passerons ensuite à la limite V0 → +∞ . Si
nous supposons que 0 ≤ E < V0 , les solutions générales de (6) sont
1
2mE 2
u ( x ) = A sin αx + B cos αx x<0 α = + 2
h
(7) 1
2m(V0 − E ) 2
u ( x ) = Ce − β x + De β x x>0 β = +
h2
La condition aux limites que u est borné à grande distance nécessite que nous posions D = 0.
Ensuite, la continuité de u en x = 0 donne la relation B = C et la continuité de du / dx donne la
relation αA = − βC . Puisque β devient infini quand V0 devient infini et que la solution pour x < 0
doit être finie, la deuxième relation montre que C tend vers zéro lorsque V0 → +∞ donnant donc
aussi une valeur zéro pour B. A n'est pas déterminée à partir de ces relations mais peut être fixé par
normalisation.
Donc, la condition aux limites sur une surface où il y a un saut infini de potentiel est que la fonction
d'onde y vaut zéro et la composante du gradient de la fonction d'onde normale à la surface n'est pas
déterminée. L'hypothèse ci-dessus que E < V0 n'est évidemment pas une restriction puisque V0
tend vers l'infini. Pour E < 0, le sinus et le cosinus dans la solution pour x < 0 sont remplacés par
des sinus et cosinus hyperboliques (ce qui est autorisé puisque la solution a seulement besoin d'être
valide près de x = 0) sans changement sur le résultat final. On notera qu'à la fois P et S x s'annulent
lorsque x → 0 pour les valeurs négatives de x et sont donc continues en x = 0 même si du / dx ne
l'est pas.
Une frontière de ce type représente un mur impénétrable et parfaitement rigide puisque dans la
situation classique analogue, une particule de toute énergie fini aurait sa composante x de
l'impulsion instantanément renversée au contact de la surface.
Il peut sembler très surprenant qu'une équation différentielle n'impliquant que des fonctions
continues aboutisse au final à des solutions discrètes. Cela peut être constaté qualitativement en
considérant la nature des solutions de l'équation à une dimension (6).
Nous supposerons d'abord que V ( x ) devient égal à une certaine valeur constante qui peut être posée
égale à zéro pour des valeurs négatives et positives de x suffisament grandes et que E < 0. Une
particule classique avec cette énergie totale E ne peut pas s'évader à l'infini et ne peut en effet
exister dans la région que si E est plus grand ou égal à la plus petite valeur Vmin de V ( x ) . La forme
−β x
permise de la fonction d'onde pour x suffisament grand pour que V = 0 est évidemment e où
β = +(− 2mE / h 2 )2 . Ces deux solutions pour de grand x positifs et négatifs peuvent être prolongées
1
Clairement, ce qui est nécessaire pour que les deux solutions se rejoignent doucement est une
( )
région dans laquelle E > V ( x ) , afin que d 2 u / dx 2 / u soit négatif et que u soit concave vers l'axe
des x. Cela permet au rapport des pentes aux valeurs de devenir égales. La figure (c) montre les
deux solutions prolongées jusqu'à ce qu'elles se rencontrent, mais pour une valeur assez petite de E
et lorsque les u sont identiques au même endroit x = 0, les pentes ne sont pas égales (courbes
pleines) ou quand les pentes sont identiques en x = 0 les u ne sont pas égaux (courbe en tiret à
gauche et pleine à droite). La figure (d) montre une valeur de E un peu plus grande et la figure E
une valeur encore plus grande. Les valeurs de E et de Vmin sont indiquées sur l'axe des u et les
points d'inflexion sont indiqués sur l'axe des x, dans les trois derniers cas.
Donc, pour une énergie potentielle qui approche une valeur constante finie lorsque x → ±∞ , il peut
y avoir un nombre fini de niveaux d'énergie discrets ou, dans certains cas, un nombre infini (si
V ( x ) diminue suffisament lentement pour de grands x ), selon V ( x ) et la masse de la particule.
Cependant, si V ( x ) → +∞ lorsque x → ±∞ , un argument comme celui donné ci-dessus montre
qu'il y aura toujours un nombre infini de niveaux d'énergie discrets. En dehors de constantes
multiplicatives arbitraires, il y aura une seule fonction propre u ( x ) pour chaque niveau.
Un exemple de ce type que nous avons déjà vu est l'électron diffusé par une impureté dans un
cristal.
Les termes classiques périodiques (ou avec périodicité multiple) et apériodique sont parfois utilisés
pour désigner les mouvements des particules associés avec respectivement les valeurs propres
discrètes et continues de l'énergie.
Valeurs propres discrètes et continues à trois dimensions
Nous supposerons sans plus approfondir que tous les résultats précédents peuvent se généraliser
naturellement à l'équation de Schrödinger à trois dimensions. Nous pouvons nous attendre à ce que,
si V (r ) → +∞ lorsque r → ∞ dans toutes les directions, alors il y aura un ensemble infini de
niveaux d'énergie discrets s'étendant jusqu'à + ∞ . Si V (r ) est borné lorsque r → ∞ dans une
certaine direction, il y aura un nombre fini ou infini de niveaux d'énergie, selon la forme de V.
Dans ce cas, les niveaux d'énergie ne peuvent pas excéder la plus petite valeur de V (∞ ) dans toute
direction. Pour des valeurs de E plus grandes que ce plus petit V (∞ ) , les valeurs propres de
l'énergie couvrent un domaine continu s'étendant jusque + ∞ .
II.4. Fonctions propres et valeurs propres
L'interprétation physique de la fonction d'onde a été discutée précédemment. Elle se rattache
essentiellement au calcul de valeurs moyennes des opérateurs qui représentent différentes quantités
physiques. En plus, une densité de probabilité de position a été introduite. Nous sommes donc dans
la position de calculer à partir de la fonction d'onde toute propriété qui dépend de la distribution
spatiale d'une particule (par exemple, l'écart type de sa position par rapport à la moyenne) mais
nous ne pouvons calculer que des valeurs moyennes pour les opérateurs autres que la position.
Clairement, ce dont nous avons besoin pour boucler notre interprétation de la fonction d'onde est
une méthode de calcul des fonctions de probabilité pour les opérateurs en général. Cela nous
permettrait en plus d'obtenir des expressions pour les valeurs moyennes sans hypothèse séparée.
Nous allons maintenant poser trois postulats physiques à partir desquels l'interprétation complète de
la fonction d'onde peut être dérivée. L'interprétation présentée précédemment peut être vue comme
un cas particulier du traitement plus général que nous allons voir.
II.5. Postulats d'interprétation et fonctions propres de l'énergie
Nous partons de la fonction d'onde ψ (r, t ) solution de l'équation de Schrödinger qui décrit le
mouvement d'une particule de masse m avec une énergie potentielle V (r ) . A partir de cette fonction
d'onde, nous voulons obtenir une description aussi complète que possible des propriétés du
mouvement de la particule qui soit consistante avec la relation d'indétermination dont nous avons
discuté.
Un opérateur Ω est linéaire s'il satisfait l'équation Ω(a1ψ 1 + a 2ψ 2 ) = a1Ωψ 1 + a 2 Ωψ 2 pour des
nombres complexes a i et des fonctions ψ i arbitraires.
L'opérateur peut être simplement un opérateur multiplication tel que r pour la position ou il peut
être un opérateur différentiel tel que − ih∇ pour l'impulsion.
A chaque opérateur peut être associé une équation linéaire aux valeurs propres. Donc, à l'opérateur
Ω on peut associer l'équation
(1) Ωv µ = ω µ v µ
où v µ est la fonction propre de Ω correspondant à la valeur propre ω µ .
Notre deuxième postulat est que les valeurs propres ω µ sont les seuls résultats possibles d'une
mesure précise de la variable dynamique représentée par Ω . Cela implique que les valeurs propres
de tout opérateur qui représente une quantité physique mesurable sont des nombres réels.
Supposons maintenant qu'une fonction d'onde particulière ψ est développée en terme des fonctions
propres v µ de l'opérateur Ω . Nous adoptons l'interprétation statistique de ψ que nous avons vue
selon laquelle il y a un grand nombre de régions identiques indépendantes de l'espace ou des
intervalles de temps dans lesquels une particule est décrite par ψ . Nous faisons alors des mesures
de la variable dynamique représentée par Ω sur chacune de ces particules. Notre troisième postulat
physique est que le nombre de mesures qui donnent la valeur propre ω µ est proportionnel au carré
de la grandeur du coefficient de v µ dans le développement de ψ . Ce postulat dû à Born nous
permet d'associer une fonction de probabilité à chaque variable dynamique. Un corollaire est que
nous sommes certains de mesurer une valeur propre particulière ω µ seulement quand la fonction
d'onde qui décrit la particule est la fonction propre correspondante v µ .
Plutôt que de développer les conséquences de ces postulats pour un opérateur arbitraire Ω , nous
allons considérer ici l'énergie totale de la particule et l'impulsion. La plus part des résultats obtenus
sont facilement généralisables aux autres opérateurs physiques.
Soit une particule passant à travers un processus physique déterminé Ω . L'amplitude pour passer
d'un état à un autre en passant par ce processus est φ Ω ψ . Nous avions alors identifié un
ensemble d'états de base qui sont associés à ce processus (éventuellement un processus de mesure).
Par exemple, le passage de la particule à travers des fentes ou la position de la particule autour d'un
atome dans un cristal.
Cet ensemble d'états de base peut être développé sur la base position et cela nous fournit
immédiatement un ensemble complet de fonctions d'ondes associées aux états du processus. Par
construction, les seuls états propres qui peuvent être mesurés sont ceux associés à ces états ou
fonctions propres particulières.
De plus, en développant un état ψ arbitraire sur cet ensemble d'états de base et avec l'interprétation
probabiliste nous avons immédiatement le troisième postulat.
Le lien entre valeurs propres et valeurs mesurées est moins immédiat. Nous avions déjà vu ce lien
avec l'énergie et l'opérateur hamiltonien. Le premier postulat est simplement une généralisation à
tout opérateur. C'est aussi une manière de définir les opérateurs associés aux quantités physiques.
Comme nous l'avons vu, les fonctions propres de l'énergie peuvent être divisées en deux classes :
celles qui sont bien localisées et qui sont associées avec des valeurs propres discrètes et celles qui
restent finies à grande distance et qui possèdent un domaine continu de valeurs propres.
Normalisation dans une boite
Il est souvent souhaitable de traiter ces deux classes sur la même base. Cela peut être obtenu en
enfermant la particule analysée dans une boite de volume arbitrairement grand mais fini. La
situation physique la plus simple à laquelle cette approche est applicable est une où les murs de la
boîte sont parfaitement rigides tel que la fonction d'onde s'y annule. Les discussions précédentes
montrent alors que toutes les valeurs propres sont discrètes. Si la boite est grande par rapport aux
dimensions physiques caractéristiques du problème, les valeurs propres qui étaient discrètes en
l'absence de la boite sont pratiquement inaffectées puisque avant que les murs ne soient introduits,
la fonction d'onde était extrêmement petite à cet endroit. De même, les valeurs propres qui étaient
continues en l'absence de la boîte sont très peu espacées. Nous le verrons explicitement pour une
particule libre.
Il est plus pratique de supposer que la fonction d'onde obéit à des conditions aux limites
périodiques sur les murs de la boite plutôt que de les annuler puisqu'il est alors possible d'avoir une
description plus simple des fonctions propres du moment, comme nous le verrons. Nous
choisissons la région finie comme un cube avec des cotés de longueur L centré sur l'origine et nous
demandons que chaque fonction d'onde ait la même valeur pour les points correspondants sur les
faces opposées du cube et la même dérivée normale au mur. Ces conditions aux limites rendent
discrètes les valeurs propres continues puisque la phase de la fonction propre à grande distance
n'est plus arbitraire. Comme avec la boite rigide, la présence des murs a un effet négligeable en
dehors de légèrement discrétiser les valeurs propres continues et de fournir un volume fini dans
lequel ces fonctions d'onde peuvent être normalisées. Nous continuerons à utiliser le mot "continu"
pour décrire ces fonctions même quand la boite de normalisation est utilisée.
∫ u (r )
2
L'intégrale E d 3 r qui converge dans tous les cas pour les fonctions propres de l'ensemble
discret convergent pour toutes les fonctions propres quand elles sont normalisées dans la boite de
volume fini L3 . Le coefficient de u E peut être choisi pour que cette intégrale soit égale à l'unité et
les u E (r ) sont normalisés.
Nous allons maintenant montrer que les fonctions propres de deux valeurs propres différentes E et
E' sont orthogonales, c'est-à-dire que l'intégrale du produit de l'une par le complexe conjugué de
l'autre sur le domaine commun est zéro. Nous avions déjà eut l'occasion de voir cela sous la forme
des amplitudes pour les états de l'hamiltonien. A partir de (2) nous avons que u E∗ ′ (r ) satisfait
l'équation (où V est à nouveau supposé réel)
h2 2
(3) − ∇ + V (r )u E∗ ′ (r ) = E ′u E∗ ′ (r )
2m
En accord avec notre interprétation physique, nous avons supposé que E' est réel. Cela sera vérifié
ci-dessous. Nous multiplions (2) par u E∗ ′ et (3) par u E et nous intégrons sur le volume L3 puis nous
prenons la différence entre les deux équations résultantes. Les termes en V s'annulent et il reste
(4) −
h2
2m ∫
( )
u E∗ ′ ∇ 2 u E − u E ∇ 2 u E∗ ′ d 3 r = (E − E ′)∫ u E∗ ′ u E d 3 r
L'intégrale du coté gauche de (4) peut être transformée par le théorème de Green en une intégrale
de surface sur la surface A du cube :
∫( ) ( )
u E∗ ′ ∇ 2 u E − u E ∇ 2 u E∗ ′ d 3 r = ∫ ∇ ⋅ u E∗ ′ ∇u E − u E ∇u E∗ ′ d 3 r
(5)
( )
= ∫ u E∗ ′ ∇u E − u E ∇u E∗ ′ n dA
A
où l'indice n désigne la composante du vecteur dans la direction sortante normale à l'élément de
surface dA. Puisque l'imposition des conditions aux limites périodiques donne à chaque fonction
d'onde et sa dérivée normale les mêmes valeurs aux points correspondants des faces opposées du
cube, la dérivée normale sortante a des signes opposés sur des faces opposées et l'intégrale de
surface (5) s'annule. Alors, l'équation (4) nous dit que, si E ≠ E ′ , u E et u E ′ sont orthogonaux.
Il est évident que cette démonstration d'orthogonalité peut être appliquée à un ensemble discret de
fonctions propres même si la boite n'est pas introduite puisque les u s'annulent rapidement à grande
distance et l'intégrale de surface, qui est alors une sphère de rayon infini, est zéro. L'ensemble
continu de fonctions propres de l'énergie peut aussi être traité sans utiliser la normalisation dans
une boite.
Une valeur propre de l'énergie E est dite dégénérée quand deux ou plusieurs fonctions propres
linéairement indépendantes u1 , u 2 , … lui correspondent. Des combinaisons linéaires orthogonales
de fonctions propres dégénérées peuvent être trouvées de plusieurs manières, comme nous l'avions
déjà vu avec les états. Par exemple, u a = a1u1 + a 2 u 2 peut être rendu orthogonale à u1 en
choisissant les coefficients constants a1 et a 2 tels que
a1 ∫ u1∗ u 2 d 3 r
(6) =−
∫
2
a2 u1 d 3 r
Ce choix n'interfère pas avec la normalisation de u a et u a est encore une fonction propre de
l'énergie avec la valeur propre E. Evidemment, le choix des combinaisons linéaires orthogonales
n'est pas unique. En continuant cette procédure, toutes les fonctions propres de l'énergie peuvent
être rendues orthogonales les unes aux autres même si certaines valeurs propres sont dégénérées.
Un tel ensemble de fonctions propres, toutes normalisées et orthogonales les unes aux autres, est
appelé un ensemble orthonormal de fonctions. Nous spécifions un ensemble orthonormal de
fonctions propres de l'énergie non dégénérées par la relation
(7) ∫ u E∗ ′ (r )u E (r )d 3 r = δ EE ′
où δ EE ′ est le symbole δ symétrique de Kronecker qui est égal à l'unité si E = E ′ et zéro
autrement. S'il y a dégénérescence, (7) doit être remplacé par
(8) ∫ u E∗ ′s′ (r )u Es (r )d 3 r = δ EE ′δ ss′
où l'indice s distingue les fonctions propres dégénérées orthogonales. Il est souvent pratique
d'omettre explicitement la mention de s et d'utiliser (7) également pour les situations dégénérées,
auquel cas l'indice s est implicite.
Réalité des valeurs propres de l'énergie
Nous pouvons maintenant voir directement que E est un nombre réel, comme cela a été supposé.
Multiplions (2) par u E∗ ′ (r ) et intégrons sur le volume L3 de la boite. Si u E est normalisé, le résultat
est
h2
(9) E = − ∫ u E∗ ∇ 2 u E d 3 r + ∫ V (r ) u E d 3 r
2
2m
qui peut être exprimé en fonction des valeurs moyennes comme (1 / 2m ) p 2 + V .
Le deuxième terme V est réel puisque son intégrand est réel. Le premier terme peut être montré
explicitement comme étant réel en utilisant une intégration par partie :
( )
(10) − ∫ u E∗ ∇ 2 u E d 3 r = ∫ ∇u E∗ ⋅ (∇u E )d 3 r − ∫ u E∗ (∇u E )n dA
A
L'intégrale de volume à droite est manifestement réelle et l'intégrale de surface, comme dans (5),
s'annule à cause des conditions aux limites périodiques sur les murs de la boite. Il est intéressant de
noter que p 2 ne peut pas être négatif.
La propriété de permutation de l'ordre des sommations et des intégrales doit être en principe
analysé séparément dans chaque cas. Les considérations mathématiques impliquées vont au-delà du
but cherché ici et nous supposerons toujours qu'une telle permutation est autorisée dans les
situations physiquement intéressantes.
La propriété de fermeture
La substitution de l'expression (12) pour AE dans (11) donne
[ ]
(13) ψ (r ) = ∑ ∫ u E∗ (r ′)ψ (r ′)d 3 r ′ u E (r )
E
que nous réarrangeons pour donner
(14) ψ (r ) = ∫ψ (r ′)∑ u E∗ (r ′)u E (r ) d 3 r ′
E
Puisque ψ (r ) est une fonction continue arbitraire de r, l'équation (14) implique que la partie entre
crochet de l'intégrand s'annule sauf si r' = r puisque autrement la valeur de ψ au point r donnée
par (14) changerait quand les valeurs de ψ en d'autres points r ′ ≠ r seraient modifiées et cela
serait contraire à l'hypothèse que ψ peut avoir une forme arbitraire. De plus, l'intégrale du terme
entre crochet doit être l'unité quand le volume d'intégration inclut le point r' = r. Nous en
concluons donc que
∑ u (r ′)u (r ) = 0
E
∗
E E r′ ≠ r
(15)
∫ ∑ u (r )u (r )d
∗
E E
3
r =1
E
si le volume d'intégration inclut le point r' = r.
(17) = ∫∫ψ ′(r ′)ψ (r )∑ u E∗ (r )u E (r ′) d 3 rd 3 r ′
E
= ∫ ψ (r ) d 3 r = 1
2
puisque ψ est normalisé. Nous avons utilisé ici les équations (15).
Nous pouvons aussi calculer la valeur moyenne de l'énergie à partir de la fonction de probabilité :
(18) E = ∑ EP(E ) = ∑ ∫ Eu E∗ (r )ψ (r )d 3 r ∫ u E (r ′)ψ ∗ (r ′)d 3 r ′
E E
Si nous remplaçons Eu E∗ (r ) par (2), la première intégrale de (18) peut être intégrée deux fois par
partie comme suit :
h2 2 ∗
∫ Eu E (r )ψ (r )d r = ∫ψ (r )− 2m ∇ + V (r )u E (r )d r
∗ 3 3
(19)
h2 2
= ∫ u E∗ (r )− ∇ + V (r )ψ (r )d 3 r
2m
Les deux intégrales de surface qui résultent des intégrations par partie s'annulent à cause des
conditions aux limites périodiques sur u E et ψ . Donc, avec l'aide de (15), l'équation (18) devient
h2 2
E = ∑ ∫ u (r )−∗
E ∇ + V (r )ψ (r )d 3 r ∫ u E (r ′)ψ ∗ (r ′)d 3 r
E 2m
h 2
(20) = ∫∫ψ ∗ (r ′)− ∇ 2 + V (r )ψ (r )∑ u E∗ (r )u E (r ′) d 3 rd 3 r ′
2m E
h2 2
= ∫ψ ∗ (r )− ∇ + V (r )ψ (r )d 3 r
2m
Le résultat obtenu dans (20) confirme l'hypothèse faites plus tôt que la valeur moyenne d'un
opérateur doit être calculée en insérant l'opérateur entre ψ ∗ (r ) et ψ (r ) pour qu'il opère seulement
sur ce dernier et ensuite en intégrant sur r.
Donc, si ψ (r, t ) est connu au temps t = t 0 , la solution à tout instant t est donnée par (21) et (24) :
− iE (t −t 0 ) / h
ψ (r, t ) = ∑ AE (t 0 )e u E (r )
(25) E
AE (t 0 ) = ∫ u E∗ (r ′)ψ (r ′, t 0 )d 3 r ′
ou
− iE (t −t 0 ) / h
(26) ψ (r, t ) = ∫ ∑ u E∗ (r ′)u E (r )e ψ (r ′, t 0 )d r ′
3
E
La solution (25) est une combinaison linéaire des fonctions propres de l'énergie.
II.6. Fonctions propres de l'impulsion
Les fonctions propres de l'opérateur impulsion linéaire − ih∇ fournissent un deuxième exemple
instructif de l'application des idées générales développées au début de la section précédente. Elles
sont aussi d'une utilité considérable pour résoudre des problèmes physiquement intéressant. Ce sera
aussi un approfondissement de l'analyse des fonctions propres de l'impulsion que nous avions déjà
vue dans la section II.1.2.3.
Ce sont des fonctions propres de l'opérateur impulsion avec les valeurs propres hk .
Normalisation dans une boîte
Comme avec les fonctions propres de l'énergie, nous pouvons restreindre le domaine des u k (r ) à
une boîte cubique arbitrairement grande mais finie de volume L3 centrée à l'origine et sur les murs
de laquelle les fonctions obéissent à des conditions aux limites périodiques. Alors u k est normalisé
3
−
si C = L 2 . De plus, k n'est plus un vecteur réel arbitraire. Ses composantes sont restreintes aux
valeurs
2πn x 2πn y 2πn z
(5) k x = ky = kz =
L L L
où n x , n y et n z sont des entiers positifs, négatifs ou nuls. L'espacement des vecteurs k voisins et
de leurs valeurs propres h 2 k 2 / 2m peut être rendu aussi petit que souhaité en prenant L
suffisament grand. Il est toujours supposé que la limite L → ∞ est prise à la fin des calculs.
Il est intéressant de noter que les fonctions propres de l'impulsion (4) ne peuvent pas exister dans
une boîte qui a des murs parfaitement rigides car ces fonctions propres ne s'annulent nul part. C'est
analogue à la situation classique où l'impulsion d'une particule qui est reflété par un mur rigide n'est
pas conservée. D'un autre coté, la boîte cubique avec des conditions aux limites périodiques est
équivalente à une situation dans laquelle l'espace entier est divisé en cubes adjacents et toutes les
fonctions d'onde sont périodiques à travers tout l'espace avec la période L le long des trois axes. Si
la périodicité de l'espace est transposée à la situation classique analogue, une particule passant à
travers un mur serait équivalente à une qui frappe ce mur et apparaît au point correspondant du mur
opposé avec son vecteur impulsion inchangé.
= δ k xlx δ k y l y δ k z l z ≡ δ kl
où nous avons utilisé (5). L'orthogonalité pourrait aussi être montrée par la méthode plus générale
utilisé pour les fonctions propres de l'énergie.
En utilisant la fonction de Dirac, on a par exemple pour la fermeture des fonctions propres de
l'énergie :
(8) ∑ u E∗ (r ′)u E (r ) = δ ( x − x ′)δ ( y − y ′)δ ( z − z ′) ≡ δ 3 (r − r ′)
E
La comparaison avec l'orthonormalité montre que la propriété de fermeture est une sorte
d'orthonormalité des fonctions propres par rapport à la sommation sur les valeurs propres.
On peut aussi l'appliquer à la normalisation (7) où nous n'imposons maintenant pas de boîte de
normalisation et nous permettons aux fonctions propres de l'impulsion d'avoir la forme (4) sur tout
l'espace avec tout vecteur réel k. L'intégrale ∫ u l∗ (r )u k (r )d 3 r est le produit de trois intégrales qui
peuvent être exprimées avec l'aide de la fonction de Dirac. En utilisant la représentation de cette
fonction à l'aide d'un sinus, on a :
∞ ( )
i k x −l x x g ( )
i k x −l x x
∫ −∞
e dx = lim ∫ e
g →∞ − g
dx
2 sin g (k x − l x )
(9) = lim
g →∞ k x − lx
= 2πδ (k x − l x )
Donc, les fonctions propres du moment dans un espace infini peuvent être écrites
(10) u k (r ) = (8π 3 ) 2 exp(ik ⋅ r )
1
−
Nous aurons l'occasion de voir que dans un problème typique, la normalisation des fonctions
propres de l'impulsion par une boîte ou par fonction Delta donne le même résultat final.
Fermeture
La propriété de fermeture des fonctions propres de l'impulsion, avec la normalisation dans une
boîte ou avec les fonctions Delta, peut être établie sans l'aide de l'hypothèse de complétude qui a
été faites dans la section précédente pour les fonctions propre de l'énergie. Avec la normalisation
dans une boîte, l'expression analogue, l'expression analogue au coté gauche de (8) est
∞ ∞ ∞ 2πu n x ( x − x′ )+ n y ( y − y ′ )+ n z ( z − z ′ ) / L
(12) ∑ uk∗ (r ′)u k (r ) = L−3
k
∑ ∑ ∑e
n x = −∞ n y = −∞ n z = −∞
On l'évalue facilement à la limite des grands L auquel cas le contenu de la sommation change d'une
quantité négligeable lorsque chaque n change d'une unité. Nous pouvons alors voir n x comme une
∞ ∞ ∞
variable continue et remplacer ∑ par ∫ dn x = (L / 2π )∫ dk x . Nous obtenons alors
−∞ −∞
n x = −∞
∑ u (r′)u (r ) → (8π ) ∫ ∫ ∫
∗ 3 −1
∞ ∞ ∞ [ ]
i k x ( x − x′ )+ k y ( y − y ′ )+ k z ( z − z ′ )
k k e dk x dk y dk z
L →∞ −∞ − ∞ − ∞
(13) k
Un calcul similaire peut être effectué, en utilisant la normalisation par la fonction de Dirac, auquel
cas nous obtenons de (10) et (9)
(14) ∫ u k∗ (r ′)u k (r )d 3 k = ∫∫∫ u k∗ (r ′)u k (r )dk x dk y dk z = δ 3 (r − r ′)
La relation de fermeture (13) ou (14) montre que les fonctions propres de l'impulsion sont
orthonormales par rapport à la sommation ou l'intégration sur les valeurs propres k aussi bien que
par rapport à l'intégration sur le vecteur position r.
Si nous substituons le coté gauche de (13) à la place de la fonction Delta dans (16), nous obtenons
ψ (r ) = ∫ψ (r ′)∑ u k∗ (r ′)u k (r )d 3 r ′ = ∑ Ak u k (r )
(16) k k
Ak = ∫ u k (r ′)ψ (r ′)d r ′
∗ 3
La valeur moyenne de l'impulsion quand une normalisation dans une boîte est utilisée est
(20) p = h ∑ kP(k ) = h ∑ ∫ ku k∗ (r )ψ (r )d 3 r ∫ u k (r ′)ψ ∗ (r ′)d 3 r ′
k k
A partir du conjugué complexe de (4), nous pouvons remplacer ku k∗ (r ) par i∇u k∗ (r ) . Alors, la
première intégrale dans (20) peut être intégrée par partie et l'intégrale de surface s'annule à cause
des conditions aux limites périodiques sur ψ et u k∗ . Donc, avec l'aide de (13), l'équation (20)
devient
p = −ih ∑ ∫ u k∗ (r )∇ψ (r )d 3 r ∫ u k (r ′)ψ ∗ (r ′)d 3 r ′
k
= −ih ∫ψ ∗ (r )∇ψ (r )d 3 r
Comme exemple explicite simple du calcul des niveaux d'énergie discret d'une particule en
mécanique quantique, considérons le mouvement à une dimension d'une particule qui est restreinte
par des murs réflecteurs qui terminent une région d'énergie potentielle constante. Deux types
simples d'énergie potentielle sont considérés.
La figure (a) ci-dessus montre une situation où V ( x ) = 0 pour − a < x < a et V ( x ) = +∞ pour
x > a , correspondant à des murs parfaitement rigides, impénétrables aux points x = ± a . Dans la
figure (b) l'accroissement de l'énergie potentiel aux murs est abrupt mais fini, tel que V ( x ) = V0
pour x > a . A cause de son apparence, il est souvent appelé un puits carré de potentiel. Le
mouvement d'une particule classique avec une énergie totale E inférieure à V0 est le même pour ces
deux potentiels mais, comme nous le verrons, le comportement quantique est différent. En général,
un accroissement abrupt mais fini d'énergie potentielle aux limites d'une région force une particule
vers l'intérieur de la région. Un tel potentiel peut être vu comme un cas limite d'un potentiel plus
réaliste comme celui étudié dans la discrétisation des niveaux d'énergie et où la force − dV / dx est
toujours dirigée vers x = 0. La force associée à un puits de potentiel carré est nulle excepté aux
frontières, ainsi la particule ne subit aucune force excepté une soudaine impulsion dirigée vers
l'origine lorsqu'elle passe les points x = ± a .
Nous ne voulons pas que A et B soient tous les deux zéros car cela donnerait la solution
physiquement sans intérêt u = 0 partout. De même, nous ne pouvons pas avoir à la fois sin αa et
cos αa égaux à zéro pour une valeur donnée de α ou E. Il y a donc deux classes possibles de
solutions. Pour la première classe
(5) A = 0 et cos αa = 0
et pour la deuxième classe
(6) B = 0 et sin αa = 0
Donc, αa = nπ / 2 , où n est un entier impair pour la première classe et un entier pair pour la
deuxième classe. Les deux classes de solutions et leurs valeurs propres de l'énergie sont alors
nπ x
(7) u ( x ) = B cos n impair
2a
nπx
(8) u ( x ) = A sin n pair
2a
π 2h 2n 2
(9) E = dans les deux cas
8ma 2
Il est évident que n = 0 donne le résultat physiquement sans intérêt u = 0 et que les solutions pour
des valeurs négatives de n ne sont pas linéairement indépendantes de celles pour n positif. Les
constantes A et B peuvent être facilement choisies dans chaque cas pour que les fonctions propres
u ( x ) soient normalisées.
Il y a donc une séquence infinie d'énergies discrètes qui correspondent à toutes les valeurs entières
positives du nombre quantique n. Il y a juste une fonction propre pour chaque niveau et le nombre
de nœuds de la nième fonction qui est dans le puits de potentiel est n - 1. Ces résultats sont en
accord avec la discussion que nous avons eut sur les solutions générales. Il est intéressant de noter
que l'ordre de grandeur du niveau d'énergie le plus bas ou état de base est en accord avec le principe
d'indétermination. L'incertitude de la position de l'ordre de a implique une incertitude sur le
moment au moins de l'ordre de h / a qui, en retour, implique une énergie cinétique minimale de
l'ordre de h 2 / ma 2 .
Echelon de potentiel fini
Quand l'énergie potentielle a la forme (b), il est nécessaire de compléter la solution générale (2), qui
est encore valide pour x < a puisque l'équation (1) est inchangée, par une solution pour x > a .
L'équation de Schrödinger dans cette région est
h 2 d 2u
(10) − + V0 u = Eu
2m dx 2
qui a la solution générale pour E < V0 (états liés)
1
2m(V0 − E ) 2
(11) u ( x ) = Ce − β x + De β x β = +
h2
Les conditions aux limites en x = ±∞ nécessitent que nous posions D = 0 si (11) représente la
solution pour x > a et C = 0 si c'est la solution pour x < -a.
Nous imposons maintenant sur les solutions (2) et (11) les exigences que u et du / dx soient
continus en x = ± a .
A sin α a + B cos α a = Ce − β a
α A cos α a − α B sin α a = − βCe − β a
(12)
− A sin α a + B cos α a = De − β a
α A cos α a + α B sin α a = βDe − β a
d'où nous tirons
(13) 2 A sin α a = (C − D )e − β a 2α A cos α a = − β (C − D )e − β a
(14) 2 B cos α a = (C + D )e − β a 2α B sin α a = β (C + D )e − β a
Il est impossible pour les équations (15) et (16) d'être valides en même temps puisqu'en éliminant
β il faudrait que tan 2 α a = −1 ce qui donnerait un α imaginaire et un β négatif, contrairement à
(11). De même, nous ne souhaitons pas que A, B, C et D s'annulent tous. Donc, les solutions
peuvent nouveau être divisées en deux classes. Pour la première classe
(17) A = 0 C=D α tan α a = β
et pour la deuxième classe
(18) B = 0 C = −D α cot α a = − β
Niveaux d'énergie
Les niveaux d'énergie sont trouvés par une solution numérique ou graphique des équations (15) et
(16) avec les définitions de α et β donnés par (2) et (11). Une simple méthode graphique pour
trouver ces solutions est décrite ici, puisqu'elle montre assez clairement la manière avec laquelle le
nombre de niveaux discrets dépend de V0 et a. Nous posons ξ = α a et η = β a . Donc, l'équation
(16) devient ξ tan ξ = η avec
2mV0 a 2
(19) ξ 2 + η 2 =
h2
Puisque ξ et η sont restreint à des valeurs positives, les niveaux d'énergie peuvent être trouvés
dans ce cas à partir des intersections dans le premier quadrant de la courbe ξ tan ξ avec le cercle de
( )
1
rayon connu 2mV0 a 2 / h 2 2 . La construction est tracée ci-dessus pour trois valeurs de V0 a 2 . Pour
chacune des deux plus petites de ces valeurs il y a une solution à l'équation (16) et pour la plus
grande, il y en a deux.
La figure ci-dessus est une construction similaire pour la solution de (15) dans laquelle les niveaux
d'énergie sont obtenus à partir des intersections des même cercles avec la courbe − ξ cot ξ dans le
premier quadrant. La plus petite valeur de V0 a 2 ne donne aucune solution et les deux plus grandes
en donnent une. Donc les trois valeurs croissantes de V0 a 2 donnent respectivement une, deux et
trois niveaux d'énergie.
Il est clair à partir de ces figures que pour une particule de masse donnée, les niveaux d'énergie
dépendent du paramètre de l'énergie potentielle à travers la combinaison V0 a 2 . Pour V0 a 2 entre
zéro et π 2 h 2 / 8m , il y a seulement un niveau d'énergie de la première classe. Pour V0 a 2 entre
π 2 h 2 / 8m et quatre fois cette valeur, il y a un niveau d'énergie de chaque classe. Lorsque V0 a 2
croit, des niveaux d'énergie apparaissent successivement dans les premières et deuxièmes classes. Il
n'est pas difficile de voir à partir de (11) que lorsqu'elles sont ordonnées avec des valeurs propres
croissantes, la nième fonction propre a n - 1 nœuds.
Parité
Il suit de la discussion précédente que les fonctions propres de la première classe sont paires par
rapport au changement de signe de x ( u (− x ) = u ( x ) ) tandis que les fonctions propres de la
deuxième classe sont impaires ( u (− x ) = −u ( x ) ). Cette division des fonctions propres en types pairs
et impairs n'est pas accidentelle et nous allons montrer maintenant que c'est une conséquence
directe du fait que la fonction énergie potentielle V ( x ) est symétrique par rapport à x = 0. Si nous
changeons le signe de x dans l'équation de Schrödinger :
h 2 d 2u
(20) − + V ( x )u ( x ) = Eu ( x )
2m dx 2
et si V (− x ) = V ( x ) , nous obtenons
h 2 d 2 u (− x )
(21) − + V ( x )u (− x ) = Eu (− x )
2m dx 2
Donc, u ( x ) et u (− x ) sont solutions de la même équation avec la même valeur propre R. Supposons
d'abord qu'il y a seulement une fonction propre linéairement indépendante qui correspond à ce
niveau d'énergie. Alors u ( x ) et u (− x ) peuvent différer seulement par une constante multiplicative :
(22) u (− x ) = εu ( x )
Changer le signe de x dans (22) donne u ( x ) = εu (− x ) . A partir de ces deux équations, il s'ensuit
que
(23) ε 2 = 1 ou ε = ±1
Donc, de telles fonctions propres d'un potentiel symétrique sont ou paires ou impaires par rapport
au changement de signe de x. De telles fonctions sont dites avoir une parité paire ou impaire.
Si une valeur propre a plus d'une fonction propre linéairement indépendante, l'argument précédent
échoue et ces fonctions propres n'ont pas nécessairement une parité définie. Elles n'ont pas besoin
d'être paires ou impaires. Cependant, nous pouvons facilement voir que des combinaisons linéaires
de telles fonctions propres peuvent être trouvées de telles manières que chacune a une parité paire
ou impaire. Supposons qu'une fonction propre u ( x ) n'a pas de parité définie. On peut toujours
écrire
(24) u ( x ) = u p ( x ) + u i ( x )
où u p ( x ) = 12 [u ( x ) + u (− x )] est pair, u i ( x ) = 12 [u ( x ) − u (− x )] est impair et u p et u i sont linéairement
dépendant. Alors, si l'équation (20) est symétrique, nous pouvons l'écrire comme
2
h2 d u p h 2 d 2ui
(25) − + (V − E )u p − + (V − E )u i = 0
2m dx 2 2m dx 2
L'addition et la soustraction de (25) et (26) montre que u p et u i sont séparément des solutions de
l'équation de Schrödinger avec la même valeur propre E.
(1)
(∆p )2 = ( p − p )
2
= p2 − p
2
Ces égalités suivent directement de la définition générale des valeurs moyennes que nous avons
vues. Notez que ∆x et ∆p sont chacune calculées séparément à partir de ψ . Nous ne considérons
pas l'existence possible d'une "distribution de probabilité conjointe" pour x et p. Si nous posons
maintenant
d d
(2) α ≡ x − x β ≡ p − p = −ih −
dx dx
alors
∞ ∞
(∆x )2 (∆p )2 = ∫−∞ψ ∗α 2ψdx ∫−∞ψ ∗ β 2ψdx
(3)
= ∫ (α ∗ψ ∗ )(αψ )dx ∫ (β ∗ψ ∗ )(βψ )dx
∞ ∞
−∞ −∞
L'inégalité
2
∗
(4) ∫ f − g
∫ fg dx
dx ≥ 0
∫g
2
dx
où toutes les intégrales sont prises de x = −∞ à + ∞ , est évidemment vraie et l'égalité est
applicable seulement si f = γg où γ est une constante. A partir de cette inégalité, nous obtenons
directement
2
∫ f dx ∫ g dx ≥ ∫ f ∗ gdx
2 2
(5)
Si nous remplaçons maintenant f par αψ et g par βψ , avec l'aide de (5), l'équation (3) devient
(6) (∆x ) (∆p ) ≥ ∫ (α ψ )(βψ )dx
2 2
∗ ∗
= ∫ψ ∗αβψdx
2 2
Le terme croisé dans le produit est omit sur le coté droit de (7) car il s'annule. On peut le voir en
utilisant la relation
(8) (∫ψ αβψdx ) = ∫ψα β ψ
∗
∗
∗ ∗ ∗
( )
dx = ∫ β ∗ψ ∗ (αψ )dx = ∫ψ ∗ βαψdx
qui est obtenue en utilisant une intégration par partie et en se souvenant que α est réel.
Maintenant, à partir de (2)
dψ d
(9) (αβ − βα )ψ = −ih x − ( xψ ) = ihψ
dx dx
où l'égalité est seulement obtenue si le deuxième terme sur le coté droit de (7) est zéro. C'est
l'expression précise de la relation d'indétermination de Heisenberg quand les incertitudes ∆x et ∆p
sont définies comme dans (1).
Les équations (11) et (2) nous donnent une équation différentielle pour ψ
dψ i i p
(13) = (x − x ) + ψ
dx γh h
qui est facilement intégrée pour donner
i
(14) ψ ( x ) = N exp (x − x )2 + i p x
2γh h
où N est une constante arbitraire.
∫ (x − x ) ψ dx = (∆x )
2 2 2
(17)
Les intégrales sont facilement évaluées et cela conduit au paquet d'ondes minimal normalisé
(x − x )2 i p x
[ ]
1
(18) ψ ( x ) = 2π (∆x )
2 −4
exp − +
4(∆x )
2
h
pour la normalisation par fonction de Dirac. Puisque pour une particule libre, l'équation de
Schrödinger a la forme simple
∂ψ h 2 ∂ 2ψ
(21) ih =−
∂t 2m ∂x 2
les fonctions propres de l'impulsion sont aussi des fonctions propres de l'énergie. L'inverse n'est pas
nécessairement vrai puisqu'il y a deux solutions à (23) ci-dessous pour k (positif et négatif) pour
chaque valeur de E k . Donc, toute solution de l'équation d'onde peut être écrite comme
(22) ψ ( x, t ) = ∑ ou ∫ dk Ak e −iEk t / h u k ( x )
k
où mes Ak sont indépendant de x et de t. La dépendance au temps est contenue entièrement dans le
facteur exponentiel. On vérifie facilement que (22) est une solution de (21) par substitution, pourvu
que
h 2k 2
(23) E k =
2m
Le problème de trouver le mouvement d'un paquet d'ondes est donc résolu en trouvant les
coefficients de développement Ak à un certain moment particulier, disons t = 0, et en utilisant (22)
et (23) pour trouver ψ ( x, t ) à d'autres moments. En t = 0, les facteurs exponentiels dans (22) sont
l'unité et nous pouvons utiliser l'expression que nous connaissons pour trouver les Ak .
(24) Ak = ∫ u k∗ ( x )ψ ( x,0 )dx
Les limites de l'intégrale sont x = ± 12 L ou x = ±∞ selon qu'on a utilisé la normalisation dans une
boîte ou par fonction de Dirac. La fonction de probabilité de l'impulsion P(k ) = Ak e −iEk t / h
2
= Ak
2
[ ]
1 1
x2
Ak = 2πL2 (∆x ) 4 ∫ 21 exp −
2 − L
− ikx dx
4(∆x )
− L 2
2
(25) 1
8π (∆x )2 4 −k 2 (∆x )2
= 2 e
L
où L est supposé être suffisament grand pour que la contribution de l'intégrale pour x > 12 L puisse
être négligée. La substitution dans (22) donne la fonction d'onde pour des valeurs quelconques de t
:
(26) ψ ( x, t ) = ∑ Ak e −ihk u k (x )
2
t / 2m
k
où k = 2πn / L et n prennent toutes les valeurs entières positives, négatives ou zéro. L peut être pris
arbitrairement grand pour que n puisse être vu comme une variable continue et la sommation est
remplacée par ∫ dn qui en retour est le même que (L / 2π )∫ dk . Donc
1
(∆x )2 4 ∞ 2 i hk 2 t
ψ ( x, t ) = 3 ∫− ∞
exp − k (∆x ) 2
− + ikx dk
(27) 2π 2m
1
−
i ht x2
= (2π )
1 2
−
∆x + exp−
4(∆x ) + 2iht / m
4
2m∆x 2
[ ]
2
2
4m 2 (∆x ) 2 (∆x ) + h 2 t 2 / 4m 2 (∆x )
2 2
L'équation (28) est de la même forme que ψ ( x,0 ) , excepté que (∆x ) est remplacé par
2 2
(∆x )2 + h 2 t 2 / 4m 2 (∆x )2 , qui est égal à (∆x )2 + (∆p )2 t 2 / m 2 . Donc, le centre du paquet reste en x =
0 tandis que la largeur du paquet s'accroît lorsque t s'écarte de 0 dans les directions passées et
futures. Plus petites est l'incertitude initiale sur la position, plus grande est l'incertitude sur
l'impulsion et plus rapidement le paquet se disperse. La partie dépendant du temps de l'expression
ci-dessus, t∆p / m est simplement la distance parcourue par une particule classique d'impulsion ∆p
pendant le temps t.
L'utilisation de la normalisation par fonction de Dirac ne modifie pas les résultats du calcul
précédent. L'expression de Ak donnée par (25) doit être multipliée par (L / 2π ) 2 . Dans l'équation
1
(26) la sommation doit être replacée directement par ∫ dk éliminant un facteur L / 2π . Enfin, u k
dans (26) doit être multiplié par (L / 2π ) 2 . Ces trois facteurs s'annulent et ainsi (27) et (28) sont
1
Limite classique
Nous avons vu qu'un paquet d'ondes se déplace toujours comme une particule classique tant que
cela concerne les valeurs moyennes de sa position et de l'impulsion. Cependant, la dynamique
classique est utile comme une description du mouvement seulement si la dispersion du paquet
d'ondes peut être négligée pendant la durée d'un problème particulier.
Comme exemple simple du type de paramètre qui indique quand la limite classique est atteinte,
considérons un paquet d'ondes qui correspond à une particule classique se déplaçant sur une orbite
circulaire de rayons a et une période T. Nous supposerons que ce paquet est suffisament bien
localisé de manière à ce que l'énergie potentielle ne varie pas de manière appréciable sur ses
dimensions. Alors, la théorie classique peut fournir une description utile du mouvement seulement
si un paquet d'onde tel que celui discuté ci-dessus se disperse d'une quantité qui est petite en
comparaison de a durant un temps qui est grand en comparaison de T. La plus petite dispersion du
paquet durant un intervalle de temps de grandeur t est atteinte quand ∆x est choisi de l'ordre de
(ht / m) 2 . Nous exigeons que (ht / m) 2
1 1
<< a quand t >> T . Cette condition peut être exprimée en
disant que le moment angulaire 2πma / T de la particule doit être très grand par rapport à h .
2
Donc, pour la plus part des systèmes atomiques, où le moment angulaire est de l'ordre de h , un
paquet d'ondes correspondant à une particule bien localisée se disperse tellement en une seule
période que ce type de description du mouvement n'est pas physiquement intéressant.
IV. Etats liés
Le formalisme qui a été développé et formalisé précédemment va maintenant être appliqué au
calcul explicite de niveaux d'énergie discrets et les fonctions propres correspondantes. Nous
sommes donc concernés ici par les états liés dans lesquels la particule est restreinte par des forces
externes (énergie potentielle) à une région particulière de l'espace.
Le nombre relativement faible de fonctions énergie potentielle V (r ) pour lesquelles une solution
analytique de la fonction d'onde est possible sont important au-delà de leur intérêt pour ces
problèmes puisqu'elles servent souvent de base pour des calculs approchés sur des systèmes plus
complexes.
IV.1. Oscillateur harmonique linéaire
Le mouvement à une dimension d'une masse ponctuelle attirée par un centre fixe par une force qui
est proportionnelle au déplacement par rapport à ce centre fournit un des problèmes fondamentaux
de la dynamique classique. Son étude est importante non seulement en elle-même mais aussi parce
que des systèmes plus compliqués peuvent toujours être analysés en termes de modes normaux du
mouvement quand les forces inter-particules sont des fonctions linéaires des déplacements relatifs
et ces modes normaux sont formellement équivalents aux oscillateurs harmoniques. Cette linéarité
des équations newtoniennes du mouvement signifie que l'énergie potentielle du système est une
fonction bilinéaire des coordonnées. Puisque cet aspect se transpose en mécanique quantique, les
modes normaux harmoniques peuvent également y être trouvés. Donc, l'oscillateur harmonique à
une dimension est très important pour le traitement en mécanique quantique de problèmes tels que
les vibrations d'atomes individuels dans des molécules et des cristaux. Il fournit aussi la clef de la
théorie quantique du champ électromagnétique. Les vibrations du champ électromagnétique dans
une cavité peuvent être analysées en modes normaux harmoniques, chacun ayant les niveaux
d'énergie de l'oscillateur type. L'excitation d'un mode particulier de fréquence angulaire ω au
nième état excité signifie que l'énergie du système est augmentée de nhω et correspond
physiquement à l'addition de n photons de cette fréquence au système.
Nous n'aborderons pas ici la théorie quantique des champs mais cette étude des oscillateurs
harmoniques est donc un passage obligé avant d'attaquer un cours sur la quantification des champs.
Comportement asymptotique
La force F = − Kx peut être représentée par l'énergie potentielle V ( x ) = 12 Kx 2 et l'équation de
Schrödinger devient
h 2 d 2u 1 2
(1) − + Kx u = Eu
2m dx 2 2
Il est utile pour travailler avec une équation de ce type de la récrire sous forme sans dimension. A
cette fin, nous introduisons une variable indépendante sans dimension ξ = αx et une valeur propre
sans dimension λ et nous tentons de mettre (1) sous la forme
(2)
d 2u
dξ 2
( )
+ λ −ξ 2 u = 0
La comparaison des équations (1) et (2) montre que cela est possible si et seulement si
1
mK 2E m 2 2E
(3) α = 2
4
λ= =
h h K hω c
La solution de (2) est facilitée en examinant d'abord le comportement dominant de u dans la région
1
± ξ2
asymptotique ξ → ±∞ . Pour ξ suffisament grand, il est évident que u (ξ ) = ξ en 2
satisfait (2) si
on ne considère que les termes dominant (qui sont de l'ordre de ξ u ), quand n a toute valeur finie.
2
Les conditions aux limites nous permettent de garder seulement le signe moins de l'exponentielle.
Cela suggère qu'il est peut-être possible de trouver une solution exacte à (2) de la forme
1
− ξ2
(4) u (ξ ) = H (ξ )e
2
où H (ξ ) est un polynôme d'ordre fini en ξ . La substitution de (4) dans (2) donne l'équation pour
H (ξ )
(5) H ′′ − 2ξH ′ + (λ − 1)H = 0
où l'apostrophe indique la dérivée par rapport à ξ .
Niveaux d'énergie
Nous allons trouver une solution pour H de la forme
(6) H (ξ ) = ξ s (a 0 + a1ξ + a 2ξ 2 + L) a 0 ≠ 0 s ≥ 0
Elle est nécessairement finie pour ξ = 0 . L'équation (5) est valide pour toute valeur de ξ et donc,
quand (6) est substitué dedans, le coefficient de chaque puissance de ξ peut être égalisé à zéro.
s (s − 1)a 0 = 0
(s + 1)sa1 = 0
(s + 2)(s + 1)a 2 − (2s + 1 − λ )a0 = 0
(7)
(s + 3)(s + 2)a3 − (2s + 3 − λ )a1 = 0
L
(s + ν + 2)(s + ν + 1)aν +2 − (2s + 2ν + 1 − λ )aν
=0
où ν est un entier. Puisque a 0 ne peut pas être nul, la première équation de (7) nous dit que s = 0
ou s = 1. La deuxième équation nous dit que s = 0 ou a1 = 0 ou les deux. La troisième équation
nous donne alors a 2 en fonction de a 0 . La quatrième nous donne a3 en fonction de a1 . Et
l'équation générale nous donne aν + 2 en fonction de aν .
La discussion sur la parité a montré que u (ξ ) et donc aussi H (ξ ) peuvent être choisi ou pair ou
impair en ξ . Il suit alors de (6) que a1 et tous les autres coefficients d'indice impair sont zéros. La
fonction d'onde est alors paire ou impaire selon que s = 0 ou s = 1.
Il suit de (7) que la présence dans la série (6) d'un nombre fini ou infini de termes dépend du choix
de s et de la valeur propre λ . Si la série ne se termine pas, son comportement asymptotique
dominant peut être inféré des coefficients de ses termes les plus grands :
a 2
(8) ν + 2 →
aν ν →∞ ν
Ce rapport est le même que celui des séries pour ξ n eξ pour toute valeur finie de n. L'équation (4)
2
montre que ce comportement de H viole les conditions aux limites sur u pour ξ grand.
Donc, la série (6) doit se terminer. Cela signifie que
(9) λ = 2 s + 2ν + 1
ν doit être un entier pair puisque a0 ≠ 0 et autrement les termes d'indice pair formeraient une série
infinie. L'indice s peut encore être 0 ou 1 et, correspondant à ces deux valeurs, λ est égal à 2ν + 1
ou 2ν + 3 où ν est un entier pair. Nous pouvons exprimer les deux cas en fonction d'un nombre
quantique n :
1
(10) λ = 2n + 1 E n = n + hω c n = 0,1,2, K
2
Il suit des équations (10) et (7) que n est la plus grande valeur de s + ν dans la série (6) pour H. Si
nous notons le polynôme correspondant H n (ξ ) , nous voyons que H n est de degré n en ξ et est
1
− ξ2
entièrement pair ou impair selon que n est pair ou impair. Puisque e 2 est pair et n'a pas de
nœuds, la fonction propre correspondante u n (ξ ) a la parité de n et a n nœuds.
Polynômes de Hermite
Le polynôme d'ordre n qui a la parité de n et est une solution de (5) avec λ = 2n + 1
(11) H n′′ − 2ξH n′ + 2nH n = 0
est appelé le nième polynôme de Hermite H n (ξ ) . Il est clair de la discussion précédente de
l'équation (5) que ces conditions définissent H n de manière unique excepté pour une constante
multiplicative arbitraire. Il n'est pas nécessaire, alors, d'utiliser la relation de récursion (7) pour
étudier les propriétés détaillées de H n si une autre formulation peut être trouvée qui est consistante
avec ces conditions. Une formulation beaucoup plus utile est effectivement disponible. Elle
exprime les H n en fonction d'une fonction génératrice S (ξ , s ) .
S (ξ , s ) = e ξ
2 − ( s −ξ )2 2 + 2 sξ
= e −s
(12) ∞
H n (ξ ) n
=∑ s
n =0 n!
Pour montrer que H n satisfait l'équation différentielle (11), nous différentions les deux cotés de
(12) par rapport à ξ et ensuite par rapport à s.
∂S 2 s n +1 sn
= 2 se − s + 2 sξ = ∑ H n (ξ ) = ∑ H n′ (ξ )
2
∂ξ n n! n n!
(13)
∂S
= (− 2 s + 2ξ )e − s + 2 sξ = ∑
(− 2s + 2ξ )s n H (ξ ) = s n −1
∑n (n − 1)! H n (ξ )
2
∂s
n
n n!
En égalant les puissances de s dans les sommes de ces deux équations, on a, respectivement,
H n′ = 2nH n−1
(14)
H n+1 = 2ξH n − 2nH n −1
L'équation différentielle à l'ordre le plus bas impliquant seulement H n qui peut être construite à
partir des équations (14) est facilement vue comme étant (11). Donc, le H n (ξ ) donné par (12) sont
les polynômes de Hermite.
Les relations (14) peuvent être utilisées pour le calcul de H n et leurs dérivées ou une expression
explicite obtenue directement de la fonction génératrice peut être utilisée. Si S (ξ , s ) est différentiée
n fois par rapport à s puis que s est posé égal à 0, (12) montre que le résultat est simplement H n (ξ ) .
Maintenant, pour toute fonction de la forme f (s − ξ ) , il est évident que
∂f ∂f
(15) =−
∂s ∂ξ
Donc
∂nS ξ2 ∂
n
n ξ2 ∂
n
− ( s −ξ )2
( ) e −( s −ξ )
2
(16) = e e = − 1 e
∂s n
∂s n
∂ξ n
∂ξ n
L'intégrale sur le coté droit peut être exprimée comme une série de coefficients dans le
développement d'une intégrale contenant de produit de deux fonctions génératrices.
∞ ∞
∞ s nt m ∞
(21) ∫ e − s + 2 sξ e −t + 2tξ e −ξ dξ = ∑ ∑ ∫ H n (ξ )H m (ξ )e −ξ dgx
2 2 2 2
−∞ − ∞
n = 0 m = 0 n! m!
L'intégrale sur la gauche de (21) est facilement évaluée directement pour donner
1
(22) π e = π ∑
2 2 st
1 ∞
2
(2 st )
n
n =0 n!
Si les puissances égales de s et t sont égalisées dans les séries sur le coté droit de (21) et (22), nous
obtenons les résultats
1
∞
∫ H n2 (ξ )e −ξ dξ = π 2 2 n n!
2
−∞
(23)
∞
∫ H n (ξ )H m (ξ )e −ξ dξ = 0 n ≠ m
2
−∞
La première équation dans (23) nous dit que la constante de normalisation peut être choisie comme
1
2
α
(24) N n = 1
2 n
π 2 n!
où un facteur multiplicatif de phase complexe constante de grandeur unité est encore arbitraire. La
deuxième de ces équations nous dit que u n ( x ) et u m ( x ) sont orthogonaux si n ≠ m . C'est en accord
avec le résultat général pour les fonctions propres de l'énergie non dégénérées puisque, en accord
avec (10), E n ≠ E m si n ≠ m et ainsi il n'y a pas dégénérescence.
L'intégrale
∞ N n∗ N m ∞
∫ u n∗ ( x )xum ( x )dx = ∫ ξH n (ξ )H m (ξ )e −ξ dξ
2
(25)
−∞ α 2 −∞
est typique de celles qui peuvent être évaluées avec l'aide de la fonction génératrice. Les deux
expressions en séries pour l'intégrale
∞ ∞
∞ s nt m ∞
(26) ∫ e − s + 2 sξ e −t + 2tξ ξe −ξ dξ = ∑ ∑ ( ) ( )
2 2 2 −ξ 2
∫−∞ ξ H n ξ H m ξ e dξ
−∞
n = 0 m = 0 n! m!
et
1
(27) π (s + t )e = π 2 ∑
2 2 st
1 ∞
(
2 n s n +1t n + s n t n +1 )
n =0 n!
peuvent être égalisées terme à terme. Avec l'aide de (24), nous avons
1
1 n + 1 2
m = n +1
α 2
1
∞ 1 n 2
(28) ∫ u n ( x )xu m ( x )dx =
∗
m = n −1
α 2
−∞
0 autrement
Correspondance avec la théorie classique
Le tracé des six premières fonctions d'onde de l'oscillateur harmonique est donné ci-dessus. Il est
2
évident que les densités de probabilité de position u n associées à ces fonctions d'onde
stationnaires ont peu de ressemblance avec les densités correspondantes pour l'oscillateur
( )
1
−
harmonique classique. Ces dernières sont proportionnelles à ξ 02 − ξ 2 2 où ξ 0 est l'amplitude de
l'oscillateur classique dont l'énergie est égale à la valeur propre de la mécanique quantique.
L'accord entre les densités de probabilité classiques et quantiques s'améliore rapidement avec n
croissant.
2
La figure ci-dessus contient un tracé de u n pour n = 10 (ligne en trait plein) et la densité de
l'oscillateur classique d'énergie totale 21
2 hω c (courbe en tirets). L'accord est relativement bon en
2
moyenne, le principal écart étant les oscillations rapides de u n .
D'une manière similaire, on peut montrer que x = p = 0 pour toute fonction d'onde de
l'oscillateur harmonique et donc (∆x ) = x 2 et (∆p ) = p 2 . Il est facile de voir que le produit
2 2
π4
qui, comme on s'y attendrait, a la forme d'un paquet minimal. Donc le paquet minimal est une
fonction propre de l'équation de Schrödinger de l'oscillateur harmonique si son ∆x est relié de
manière appropriée à K et m.
n=0 n =0
1
− ω ct
où les An sont des constantes arbitraires. Donc, en dehors du facteur de phase e 2
, ψ ( x, t ) est
une fonction périodique de t avec la période de l'oscillateur classique 2π / ω c . Cela suggère qu'il est
peut-être possible de trouver une solution sous la forme d'un paquet d'ondes dont le centre de
gravité oscille avec la période du mouvement classique.
Pour étudier cette possibilité, nous supposons qu'à t = 0, le ψ de (33) a la forme d'un paquet d'onde
normalisé (31) excepté que le centre de gravité est déplacé dans la direction des x positifs d'une
quantité a.
1
∞
α2
1
− α 2 ( x − a )2
(34) ψ ( x,0 ) = ∑ An u n ( x ) = 1
e 2
n =0
π 4
L'intégrale sur le coté droit peut être évaluée avec l'aide des fonctions génératrices en égalant terme
à terme les deux expressions en séries pour l'intégrale :
1 ∞ 1
∞ − ξ 2 −ξξ 0 + ξ 02 sn ∞ − ξ 2
−ξξ 0 + ξ 02
(36) ∫ e − s 2 + 2 sξ
e 2
dξ = ∑ ∫ H n (ξ )e 2
dξ
−∞ −∞
n = 0 n!
et
1 1
− ξ 02 + sξ 0
1
− ξ 02 ∞
1
(sξ 0 )n
(37) π 2 e 4
= π 2e 4
∑
n=0 n!
(2 n!)
1
n 2
1
α 2
1 1 1 1
(39) = 1
exp − ξ 2 − ξ 02 − iω c t − ξ 02e − 2iωct + ξξ 0e −iωct
2 4 2 4
π 4
1
α2 1 1
exp − (ξ − ξ 0 cos ω c t ) − i ω c t + ξξ 0 sin ω c t − ξ 02 sin 2ω c t
1
=
2
1
2 2 4
π 4
où la somme est évaluée avec l'aide de la fonction génératrice. Le carré de la grandeur de cette
fonction d'onde donne une densité de probabilité de position
α
(40) ψ ( x, t ) = e −α ( x − a cos ω c t )2
2 2
1
π2
Cela montre que ψ représente un paquet d'ondes qui oscille sans changer de forme autour de x = 0
avec l'amplitude a et la fréquence classique.
1
− ω ct
Lorsque a → 0 , ψ tend vers la fonction propre d'énergie la plus basse u0 ( x )e 2 . Plus a devient
grand, plus le nombre d'états stationnaires qui contribuent de manière significative au paquet
augmente et plus le nombre n0 pour lequel An de (389) présente un maximum augmente. Pour n
>> 1, nous pouvons utiliser la formule de Stirling pour maximiser ln An . En négligeant les termes
d'ordre ln n et inférieurs
1
ln An ≈ n ln ξ 0 − ln 2 − n(ln n − 1)
1
2 2
(41) 2
1 Ka
n0 ≈ ξ 02 =
2 2hω c
1
Donc le niveau d'énergie E n0 = n0 + hω c dont l'essentiel du voisinage contribue à ψ est
2
approximativement égal à l'énergie 2 Ka 2 de l'oscillateur classique qui a la même amplitude.
1
IV.2. Potentiels à symétrie sphérique à trois dimensions
Il est généralement impossible d'obtenir des solutions analytiques à l'équation de Schrödinger à
trois dimensions à moins qu'elle puisse être séparée en équations différentielles pour chacune des
trois coordonnées spatiales. On a pu montrer qu'il y a onze systèmes de coordonnées dans lesquels
l'équation de Schrödinger pour la particule libre (avec V = 0) peut être séparée. Un des plus
importants est le système de coordonnées sphériques en fonction duquel les coordonnées
rectangulaires sont données par
x = r sin θ cos φ
(1) y = r sin θ sin φ
z = r cosθ
Si l'énergie potentielle est à symétrie sphérique, tel que V (r ) = V (r ) est seulement fonction de la
grandeur r de r mesurée à partir d'une certaine origine, l'équation de Schrödinger peut toujours être
séparée en coordonnées sphériques. Plusieurs problèmes physiquement intéressant peuvent être
représentés exactement ou approximativement en fonction de potentiels à symétrie sphérique de
différentes formes. Dans cette section, nous allons effectuer la séparation et résoudre les équations
différentielles en θ et φ . Nous traiterons de la solution radiale pour des formes particulière de
V (r ) dans la section suivante ainsi que lorsque nous résoudrons le cas de l'atome d'hydrogène.
Nous séparons d'abord les parties radiales et les parties angulaires en substituant
(3) u (r ,θ , φ ) = R(r )Y (θ , φ )
dans (2) et en divisant par u
1 d 2 dR 2mr 2 1 1 ∂ ∂Y 1 ∂ 2Y
(4) r + 2 [E − V (r )] = − sin θ +
R dr dr h Y sin θ ∂θ ∂θ sin 2 θ ∂φ 2
Puisque le coté gauche de l'équation (4) dépend seulement de r et le coté droit dépend seulement de
θ et φ , les deux cotés doivent être égaux à une constante que nous appelons λ . Donc, (5) nous
donne une équation radiale
1 d 2 dR 2m λ
(5) 2 r + 2 [E − V (r )] − 2 R = 0
r dr dr h r
et une équation angulaire
1 ∂ ∂Y 1 ∂ 2Y
(6) sin θ + + λY = 0
sin θ ∂θ ∂θ sin 2 θ ∂φ 2
L'équation angulaire (6) peut être encore séparée en substituant Y (θ , φ ) = Θ(θ )Φ(φ ) dedans et en
suivant la même procédure pour obtenir
d 2Φ
(7) + νΦ = 0
dφ 2
1 d dΘ ν
(8) sin θ + λ − Θ = 0
sin θ dθ dθ sin 2 θ
L'équation en φ (7) peut être résolue directement. Sa solution générale peut être écrite
1 1
iν φ − iν φ
(9) Φ(φ ) = Ae + Be ν ≠0
2 2
Φ(φ ) = A + Bφ ν =0
où maintenant toutes les solutions physiquement significatives sont inclues si m peut être un entier
positif, négatif ou nul. La constante multiplicative est choisie égale à (2π )
1
−
2 afin que Φ soit
normalisé à l'unité sur le domaine de φ .
Notons que la constante m ne doit pas être confondue avec la masse de la particule. Il y a un léger
risque de confusion que nous regrettons mais l'usage veut que le nombre quantique associé à la
composante φ soit noté m (qui est l'abréviation de "magnétique" pour des raisons qui apparaîtront
plus tard).
Polynômes de Legendre
A moins que V (r ) soit spécifié, le plus loin où nous pouvons aller dans notre traitement est de
résoudre l'équation θ (8) où maintenant ν = m 2 . Il est pratique de substituer w = cosθ à θ et de
poser
(11) Θ(θ ) = P(ω )
Alors (8) devient
(12)
d
1 − w (
2 dP
+
dw
λ )
−
m2
P = 0
dw 1 − w 2
Les solutions physiquement acceptables de (12) quand m = 0 sont appelées polynômes de Legendre
Pl (w) . Tout comme dans le cas des polynômes de Hermite, leurs propriétés peuvent être discutées
en terme d'une fonction génératrice
( )
1
T (w, s ) = 1 − 2 sw + s 2
−
2
(13) ∞
= ∑ Pl (w)s l s <1
l =0
(14)
( )
1 − w 2 Pl′ = −lwPl + lPl −1
(l + 1)Pl +1 = (2l + 1)wPl − lPl −1
où l'apostrophe indique la dérivée par rapport à w. On vérifie facilement que l'équation
différentielle à l'ordre le plus bas impliquant seulement les Pl qui peuvent être construits à partir
des équations (14) est l'équation (12) avec λ = l (l + 1) et m = 0.
Pour m non nécessairement égal à zéro, (12) a des solutions physiquement acceptables si
λ = l (l + 1) et m ≤ l . Ces solutions, qui sont appelées fonctions de Legendre associées, peuvent
être exprimées en fonction des polynômes de Legendre :
( )
1 m
(15) Pl m (w) = 1 − w 2 2 Pl (w)
m d
m
dw
On peut le montrer en remplaçant (15) dans l'équation qui est obtenue en différentiant m fois
l'équation pour Pl (w) . La fonction génératrice pour les fonctions de Legendre associées est obtenue
( )
1
2 2m
en différentiant (13) m fois par rapport à w et en multipliant par 1 − w .
(2 m )!(1 − w ) s
1
2 2m m
Tm (w, s ) =
( m )!(1 − 2sw + s )
1
m 2 m+
(16) 2 2
∞
= ∑ P (w)s
l= m
l
m l
Harmoniques sphériques
La partie angulaire Ylm (θ , φ ) de la fonction d'onde complète, qui est solution de (6) quand
λ = l (l + 1) , est appelée une harmonique sphérique. Il est évident que
(17) Ylm (θ , φ ) = N lm Pl m (cosθ )Φ m (φ )
où c est donné par (10) et N lm est la constante de normalisation pour la fonction de Legendre
associée.
La même démonstration que fut donnée pour l'orthogonalité des fonctions propres de l'énergie peut
être utilisée pour montrer que les solutions de (4) correspondant à différentes valeurs propres λ ou
l sont orthogonales. La valeur propre l est, cependant, (2l + 1) fois dégénérée puisqu'il existe des
solutions linéairement indépendantes Ylm (θ , φ ) pour cette valeur de l et toutes les valeurs entières
de m entre +l et -l. Le choix de (10) pour Ylm (θ , φ ) rend ces fonctions propres dégénérées
orthogonales. Il s'ensuit que l'intégrale
π 2π 2π
Ylm∗ (θ , φ )Yl ′m′ (θ , φ )sin θdθdφ = ∫
1
(18) ∫∫ ∫ Ylm∗ Yl ′m′ dwdθ
0 0 −1 0
s'annule sauf si l = l ′ et m = m′ . Il est intéressant de noter qu'il n'y a pas plus d'orthogonalité que
nécessaire pour que cette intégrale s'annule quand elle le doit. Donc, la partie φ de l'intégrale
s'annule quand m ≠ m′ quelle que soit la valeur de l. La partie θ ou w de l'intégrale s'annule
seulement quand l ≠ l ′ et m = m′ puisque pour m ≠ m′ , l'orthogonalité est prise en compte par
l'intégration sur φ .
L'intégrale
Pl m (w)Pl ′m (w)dw
1
(19) ∫
−1
peut être évaluée de plusieurs manières, par exemple, en utilisant la fonction génératrice (16) d'une
manière similaire à celle décrite dans la section précédente. Comme attendu, l'intégrale (19)
s'annule sauf si l = l ′ . Elle a alors la valeur [2 / (2l + 1)][(l + m )! / (l − m )!] . Donc, N lm est l'inverse de
la racine carrée de cette quantité, excepté pour un facteur de phase complexe arbitraire de grandeur
unité. Pour des raisons pratiques, nous choisissons l'harmonique sphérique comme
2l + 1 (l − m )! 2 m
1
4 π (l + m )!
où ε = (− 1) pour m > 0 et ε = 1 pour m ≤ 0 . Les premières harmoniques sphériques sont
m
1
1 3 2
Y0, 0 = Y1,0 = cosθ
(4π ) 4π
1
2
1 1
(21) Y1, ±1
3 2
= m sin θ e ± iφ Y2, 0
5 2
= (
3 cos θ − 1
2
)
8π 16π
1 1
15 2 15 2
Y2, ±1 = m sin θ cosθ e ± iφ Y2, ±2 = sin θ e
2 ± 2 iφ
8π 32π
Parité
Le concept de parité peut maintenant être étendu aux problèmes à trois dimensions du type discuté
dans cette section. Supposons que la coordonnée position r est renversée par rapport à l'origine tel
que r est remplacé par -r. Cela correspond à remplacer x par -x, y par -y et z par -z ou à remplacer
θ par π − θ , φ par φ + π et à laisser r inchangé. Il est clair que le seul changement dans l'équation
de Schrödinger est que u (t ,θ , φ ) est remplacé par u (r , π − θ , φ + π ) , le reste de l'équation étant
inaffecté. Alors la discussion que nous avons eut sur la parité montre que des combinaisons
linéaires des fonctions propres dégénérées peuvent être trouvées qui ont des parités définies et
qu'une fonction propre non dégénérée doit avoir une parité définie.
Les niveaux d'énergie pour un potentiel à symétrie sphérique sont dégénérés au moins par rapport
au nombre quantique m, pour l > 0. Dans ce cas, les fonctions propres dégénérées ont toutes la
même parité que nous allons montrer être la parité de l. Quand r est renversé par rapport à l'origine,
la partie radiale R(r ) de la solution est inchangée, la partie Φ(φ ) donnée par (10) a la parité de m
( )
1
et la partie Pl m (cosθ ) a la parité de l − m puisque Pl m (w) est égal à une partie paire 1 − w 2
m
2
Donc, le mouvement radial est similaire au mouvement à une dimension d'une particule dans un
potentiel
l (l + 1)h 2
(23) V (r ) +
2mr 2
"L'énergie potentielle" supplémentaire peut être vue physiquement comme étant reliée au moment
angulaire de la manière suivante. Une particule classique qui a un moment angulaire L autour de
l'axe passant par l'origine et perpendiculaire au plan de son orbite a la vitesse angulaire ω = L / r 2
quand sa distance radiale à l'origine est r. Une force centripète
L2
(24) mω 2 r =
mr 3
est requise pour maintenir la particule sur son orbite. Cette force centripète est fournie par l'énergie
potentielle et donc ajoute au V (r ) qui apparaît dans le mouvement une "énergie potentielle
centrifuge" supplémentaire L2 / 2mr 2 . Elle a exactement la forme du terme supplémentaire dans
(23) si nous posons
(25) L = [l (l + 1)]2 h
1
L'argument physique précédent pour identifier le nombre quantique l avec le moment angulaire de
la particule peut être mis sous forme quantitative en trouvant les opérateurs qui correspondent aux
trois composantes du vecteur moment angulaire. Classiquement, nous avons L = r × p et donc, en
mécanique quantique, nous prenons
∂ ∂
L x = yp z − zp y = −ih y − z
∂z ∂y
∂ ∂
(26) L y = zp x − xp z = −ih z − x
∂x ∂z
∂ ∂
L z = xp y − yp x = −ih x − y
∂y ∂x
L'opérateur qui représente le carré du moment angulaire total est alors obtenu à partir de (27)
comme
L2 = L2x + L2y + L2z
(28) 1 ∂ ∂ 1 ∂2
= −h 2 sin θ +
sin θ ∂θ ∂θ sin 2 θ ∂φ 2
La comparaison de (28) et (6) montre que Ylm (θ , φ ) est une fonction propre de L2 avec la valeur
propre l (l + 1)h 2 :
(29) L2Ylm (θ , φ ) = l (l + 1)h 2Ylm (θ , φ )
De manière similaire, il suit de la structure de (10) et de la dernière relation (27) que Φ m (φ ) et
donc aussi Ylm (θ , φ ) sont fonction propre de L z avec la valeur propre mh :
(30) L z Ylm (θ , φ ) = mhYlm (θ , φ )
Comme exemple, considérons le puits de potentiel de profondeur finie pour lequel V (r ) = −V0 , r <
a, V (r ) = 0 , r > a, où V0 est positif. Une région sphérique de ce type dans laquelle le potentiel est
inférieur à l'environnement sert à attirer une particule tout comme dans le cas à une dimension que
nous avons vu.
La solution de l'équation (1) est la même que celle obtenue pour l'échelon de potentiel fini excepté
sur trois points. Tout d'abord, l'échelle d'énergie est abaissée partout dans ce problème de la
quantité V0 . Deuxièmement, le domaine de r est 0 à + ∞ au lieu du domaine − ∞ à + ∞ . Et
troisièmement, la condition aux limites que la fonction d'onde ne devienne pas infinie en x = −∞
est maintenant remplacée par la même condition en r = 0.
A partir des résultats déjà trouvés, on voit que les solutions de (1) sont
2m(V0 − E ) 2
1
La forte ressemblance entre (4) et l'équation de Bessel suggère que R(r ) puisse être exprimé en
terme des fonctions de Bessel. C'est en fait le cas. Si nous définissons la "fonction de Bessel
sphérique" jl ( ρ ) qui est régulière en ρ = 0 par
1
π
(5) jl ( ρ ) = J 1 ( ρ )
2
2 ρ l+ 2
où J est une fonction de Bessel ordinaire d'ordre demi entier, on vérifie facilement que jl ( ρ )
satisfait (4). De même, la "fonction de Neumann sphérique" est
1
l +1 π
(6) nl ( ρ ) = (− 1) J 1 ( ρ )
2
2 ρ −l − 2
jl ( ρ ) →
ρl
nl ( ρ ) → −
(2l − 1)!!
(8) ρ →0 (2l + 1)!! ρ →0 ρ l +1
(2l + 1)!!≡ 1 ⋅ 3 ⋅ 5L (2l + 1)
Ces équations sont des approximations utiles pour ρ 2 un peu plus petit que 4l+6 et 2
respectivement.
Ces équations sont des approximations utiles pour ρ un peu plus grand que 12 l (l + 1) . Cependant
les grandeurs (mais pas les phases) de jl et nl sont données à une bonne approximation par (9) si
ρ est un peu plus grand que l, ce qui est approximativement la valeur de ρ pour laquelle la
grandeur de jl est la plus grande.
jl ( ρ ) nl ( ρ ) − nl ( ρ ) jl ( ρ ) = 2
d d 1
dρ dρ ρ
d
dρ
[ ]
ρ −l j l ( ρ ) = − ρ −l jl +1 ( ρ )
∫ j (ρ )dρ = − j (ρ )
1 0
∫ j (ρ )ρ dρ = ρ j (ρ )
2 2
0 1
∫ j (ρ )ρ
l
2 2
dρ =
2
[
ρ jl ( ρ ) − jl −1 ( ρ ) j l +1 ( ρ )
1 3 2
] l>0
Puisque R(r ) doit être fini pour r = 0, la solution désirée pour r < a est
(12) R(r ) = Ajl (αr )
On peut montrer que le développement asymptotique, dont (14) donne le terme dominant, ne
contient pas de terme pour lequel l'exposant a le signe opposé à celui donné.
Niveaux d'énergie
Les niveaux d'énergie sont obtenus en exigeant que (1 / R )(dR / dr ) soit continu en r = a. Quand
cette condition est appliquée à la solution intérieure (12) et la solution extérieure (15) avec l = 0,
nous obtenons l'équation (3). On peut l'écrire comme
2mV0 a 2
(17) ξ cot ξ = −η ξ 2 +η2 =
h2
où nous avons posé ξ = αa et η = βa . La même condition appliquée aux solutions l = 1 se réduit,
avec l'aide de (7) et (16), à
cot ξ 1 1 1 2mV0 a 2
(18) − 2 = + 2 ξ 2 +η2 =
ξ ξ η η h2
Les équations (18) peuvent être résolues numériquement ou graphiquement comme nous l'avions
déjà vu dans le cas des équations (17). En général, il n'y a pas de dégénérescence entrer les valeurs
obtenues pour la solution des équations comme (17) et (18) pour différentes valeurs de l.
Il est facile de voir combien on a de niveaux d'énergie (17) pour différentes valeurs de V0 a 2 sans
plonger dans le travail numérique. Un nouveau niveau apparaît quand η est zéro ou cot ξ est
infini. Cela se produit en ξ = π ,2π , K . Donc, il n'y a pas de niveau d'énergie avec l = 1 quand
π 2h 2
(19) V0 a 2 ≤
2m
Il y a un état lié avec l = 1 si π 2 h 2 / 2m < V0 a 2 ≤ 2π 2 h 2 / m , etc.
La plus petite valeur de V0 a 2 pour laquelle il existe un état lié avec l = 1 est plus grande que la
valeur correspondante de V0 a 2 pour l = 0. C'est raisonnable d'un point de vue physique.
L'interprétation du terme l dans l'équation de Schrödinger radiale comme une énergie potentielle
supplémentaire qui correspond à une "force centrifuge" répulsive suggère qu'une particule
possédant un moment angulaire nécessite un potentiel attractif plus fort pour la lier qu'une particule
sans moment angulaire. En effet, il s'avère que la "force" minimale du puits de potentiel carré V0 a 2
nécessaire pour lier une particule de nombre quantique de moment orbital l croît de manière
monotone avec l croissant.
On peut montrer que les états liés apparaissent avec une énergie zéro pour une valeur particulière l
quand [(1 / R )(dR / dr )]r = a = −(l + 1) / a . Pour l > 0, c'est équivalent à la condition jl −1 (ξ ) = 0 où
( )
1
maintenant ξ = 2mV0 a 2 / h 2 2 .
Exercices
1. La règle de quantification de Bohr peut s'exprimer sous une forme beaucoup plus générale. Elle
dit que l'intégrale de l'impulsion par rapport à la coordonnée sur un cycle est égal à un nombre
entier fois la constante de Planck.
Appliquez cette règle au cas de l'atome d'hydrogène à titre de vérification puis appliquez cette
règle à l'oscillateur harmonique linéaire et comparez aux résultats obtenus dans la section IV.1.
2. Quelle est l'ordre de grandeur de la dispersion des nombres quantiques et des énergies des états
qui contribuent de manière significative à la solution du paquet d'onde oscillant pour
l'oscillateur harmonique ?
3. Utilisez la fonction génératrice des polynômes de Hermite pour évaluer
∞
∫ u n∗ ( x )x 2 u m ( x )dx
−∞
où les fonctions u sont les fonctions d'onde normalisées de l'oscillateur harmonique.
4. Utilisez la fonction génératrice des polynômes de Legendre pour évaluer
∫ P (w)P (w)dw
1
l l′
−1
5. Obtenez une expression analytique approchée pour le niveau d'énergie dans un puits de
potentiel carré (l = 0) quand V0 a 2 est nettement plus grand que π 2 h 2 / 8m .
6. Montrez que pour un puits de potentiel carré, les valeurs limites de V0 a 2 qui correspondent à de
nouveaux niveaux d'énergie avec une valeur de l plus grande que zéro sont données par
h 2 z 2 / 2m , où les nombres z sont les solutions non nulles de l'équation jl −1 ( z ) = 0 .
7. Supposez que l'interaction entre le neutron et le proton qui constituent un deutéron puisse être
représentée par un puits de potentiel carré avec a = 2.00 × 10 −13 cm . Si le niveau d'énergie le
plus bas (l = 0) du système est -2.23 MeV, calculez V0 en MeV pour les trois figures
significatives. Comparez cette réponse avec celle obtenue à partir de la formule approximative
dérivée dans le problème 5.
8. Considérez l'équation (22) de la section de la section IV.2 avec l = 0 et V (r ) = −V0 e − r / a . Faites
un changement de variable de r à z = e − r / 2 a et montrez que le résultat est l'équation de Bessel.
Quelles conditions aux limites doivent être imposées sur χ comme fonction de z et comment
l'utiliser pour déterminer les niveaux d'énergie ? Quelle est la limite inférieure de V0 pour
laquelle un état lié existe ?
9. Trouvez les expressions pour les fonctions propres et les niveaux d'énergie d'une particule dans
une boîte circulaire à deux dimensions qui a des murs parfaitement rigides.
10. On a montré dans la section III.1 qu'un puits de potentiel carré a une dimension a des états liés
pour toute valeur positive de V0 a 2 et dans la section IV.3 qu'un puits de potentiel carré à trois
dimensions à symétrie sphérique a un état lié seulement pour V0 a 2 > π 2 h 2 / 8m . Quelle est la
situation analogue pour un puits de potentiel carré à deux dimensions à symétrie circulaire ?
Quelle est la signification physique de ces résultats ?
11. L'équation de Schrödinger pour un corps rigide qui est contraint à tourner autour d'un axe fixe
et qui a un moment d'inertie I par rapport à cet axe est
∂ψ h 2 ∂ 2ψ
ih =−
∂t 2 I ∂φ 2
où ψ (φ , t ) est une fonction du temps t et de l'angle φ de rotation autour de l'axe. Quelles
conditions aux limites doivent être appliquées aux solutions de cette équation ? Trouvez les
fonctions propres normalisées et les valeurs propres de l'énergie. Y a-t-il dégénérescence ?
12. Trouvez les niveaux d'énergie de l'oscillateur harmonique isotrope à trois dimensions
( V (r ) = 12 Kr 2 ) en résolvant l'équation de Schrödinger en coordonnées cartésiennes. Quelle est
la dégénérescence de chaque niveau ? Montrez que cette équation peut aussi être séparée en
coordonnées sphériques et cylindriques.
V. Théorie des collisions
Les problèmes pour lesquels les valeurs propres de l'énergie sont distribuées de manière continue
apparaissent habituellement en relation avec les collisions d'une particule avec un champ de force.
La méthode d'approche est différente de celle employée pour les états liés. Dans ce denier cas, les
conditions aux limites à grande distance étaient utilisées pour déterminer les niveaux d'énergie
discrets de la particule. Dans un problème de collision, l'énergie est spécifiée à l'avance et le
comportement de la fonction d'onde à grande distance en est déduit. Ce comportement
asymptotique peut alors être relié à des quantités de diffusion de la particule par le champ de force.
Le nombre relativement faible de solutions exactes qui sont obtenues ici sont d'un usage plus large
qu'il pourrait sembler au premier abord puisqu'elles peuvent servir de fondations à des calculs
approchés pour des systèmes plus compliqués. Il est intéressant de noter que l'étude des collisions
est particulièrement important en relation avec le noyau atomique et les particules élémentaires où
très peu d'information peut être obtenue par d'autres moyens.
V.1. Barrière de potentiel carrée à une dimension
Nous considérons d'abord la collision à une dimension d'une particule avec la barrière de potentiel
carrée V ( x ) montrée ci-dessus. Dans ce problème, nous sommes intéressés par une particule qui
approche de la région avec x négatif et qui est réfléchie ou transmise par la barrière. Dans le
problème classique correspondant, la particule est toujours réfléchie si son énergie est inférieure à
celle du sommet de la barrière et est toujours transmise si son énergie est plus grande. Nous verrons
que, dans le problème quantique, la réflexion et la transmission se produisent tous les deux avec
une probabilité finie pour la plus part des énergies de la particule. A cause du manque de symétrie
entre x positif et négatif qui est introduit dès le départ, il est désavantageux de travailler avec des
solutions qui ont des parités définies et ainsi il n'y a aucune raison pour rendre V ( x ) symétrique par
rapport à x = 0. Nous supposons donc que V ( x ) = 0 pour x < 0 et x > a et V ( x ) = V0 pour 0 < x < a,
où V0 est positif.
Comportement asymptotique
Nous sommes intéressés par représenter une particule qui approche de la gauche avec une énergie E
> 0 et qui peut être renvoyée par la barrière ou y pénétrer. Donc, le comportement asymptotique
(dans les régions où V ( x ) = 0 ) est le suivant : pour x < 0, nous désirons que la fonction d'onde
représente une particule se déplaçant vers le gauche (particule réfléchie) aussi bien que vers la
droite (particule incidente). Pour x > a, nous désirons que la fonction d'onde représente seulement
une particule se déplaçant vers la droite (particule transmise).
Une particule dans une région sans potentiel qui se déplace dans une direction définie avec une
énergie définie a une impulsion définie et donc peut être représentée par une fonction propre de
l'impulsion à une dimension u ( x )e ipx / h si la particule se déplace dans la direction des x positifs avec
l'impulsion p et u ( x ) ∝ e − ipx / h si la particule se déplace dans la direction des x négatifs avec la
même énergie. Donc, puisque l'équation de Schrödinger dans la région où V ( x ) = 0 est
h 2 d 2u
(1) − = Eu
2m dx 2
nos solutions asymptotiques sont
u ( x ) = Ae ikx + Be − ikx x≤0
(2)
u ( x ) = Ce ikx x≥a
où k = p / h = + (2mE / h 2 )2 est la grandeur du nombre d'ondes. Les solutions (2) sont appropriées
1
pour les régions sans potentiel qui sont externes au potentiel diffuseur qu'il ait ou pas la forme
simple montrée plus haut.
Normalisation
La signification physique des coefficients A, B et C peut être inférée en substituant (2) dans la
forme à une dimension de la densité de courant de probabilité.
(3)
(
S (x ) = v A − B
2 2
) x<0
S (x ) = v C
2
x>a
où v = hk / m est la vitesse de la particule avec le nombre d'odes k. Puisque ces expressions sont
indépendantes de x, elles peuvent être interprétées comme le flux net (positif vers la droite) dans les
deux régions. Cette interprétation est consistante avec l'affirmation ci-dessus que A, B et C sont les
amplitudes des fonctions d'onde incidentes, réfléchies et transmises, respectivement.
La normalisation absolue des fonctions d'ondes (2) est peu important pour ce problème car nous
2 2 2
sommes seulement intéressés par les rapports B et C à A qui sont, respectivement, les
coefficients de réflexion et de transmission de la barrière. Il est quelque fois utile, cependant, de
1
normaliser la fonction d'onde incidente à un flux unité. Cela correspond à prendre A = 1 / v . Une
2
telle normalisation ne doit pas être interprétée comme indiquant que u ( x ) représente plus d'une
particule. Cela signifie plutôt que nous choisissons un nombre assez grand de systèmes (chacun
décrit par u ( x ) ) qui sont identiques et indépendant de manière telle que le flux incident total pour
tous est l'unité. Une normalisation plus précise mais quelque fois moins pratique supposerait une
"boîte" à une dimension de longueur L avec des conditions aux limites périodiques et en exigeant
que
∫( ) u (x ) dx = 1
2
(4)
L
Coefficients de diffusion
Le caractère de la solution à l'intérieur de la barrière de potentiel dépend du fait que E est plus
grand ou plus petit que V0 . Supposons d'abord que E > V0 , de manière à ce que nous puissions
[ ]
1
définir un nombre d'onde à l'intérieur de la barrière : α = 2m(E − V0 ) / h 2 2 . Alors la solution à
l'intérieur est
(5) u ( x ) = Fe iαx + Ge − iαx 0≤ x≤a
(7)
(k )
−1 −1
− α 2 sin 2 αa V 2 sin 2 αa
2 2 2
C
= 1 + = 1 + 0
A 4k 2α 2 4 E (E − V0 )
2 2
On vérifie facilement à partir de (7) que B / A + C / A = 1 comme on s'y attendait.
Les coefficients de réflexion et de transmission pour 0 < E < V0 sont plus facilement obtenus en
remplaçant α par iβ dans (6) où
1
2m(V0 − E ) 2
(9) β =
h2
Il y a deux manières d'approcher le problème. La solution peut être développée en fonctions propres
de l'énergie et la sommation effectuée explicitement. Bien que cela puisse être fait de manière
analytique dans le cas d'une particule libre, cela est généralement impossible quand un potentiel est
présent. L'autre approche consiste à effectuer une intégration numérique en choisissant des
intervalles de temps petits mais finis et d'approcher l'équation différentielle dans le temps par une
équation aux différences. Même dans le cas à une dimension, cela est réalisable seulement avec un
calculateur rapide et des techniques de calculs spéciales doivent être imaginées pour rendre le
problème abordable.
I.
II.
III.
IV.
Dans ces calculs, les unités sont choisies telles que h = 1 et m = 12 . L'unité de longueur peut encore
être choisie arbitrairement et est légèrement plus longue que l'abscisse totale montrée dans chaque
graphique. Alors le temps et l'inverse de l'énergie sont exprimés en termes d'une unité qui est le
carré de l'unité de longueur. Le paquet d'onde incident est de forme gaussienne avec ∆x = 0.035 et
p = 50π , 70.7π et 100π . Le potentiel a la largeur a = 0.064 et l'intensité V0 = ±(70.7π ) , ainsi
2
l'énergie moyenne du paquet d'ondes incident est 12 V0 , V0 et 2V0 . Les images successives sont
montrées dans la figure I lorsque l'énergie moyenne du paquet d'ondes est la moitié de la hauteur de
la barrière et dans la figure II quand l'énergie moyenne est égale à V0 . Les figures III et IV
montrent le cas attractif dans lesquels l'énergie moyenne est la moitié de la profondeur du puits et
égale à la profondeur du puits, respectivement. Dans tous les cas, ψ est tracé comme ordonnée et
2
x comme abscisse et la hauteur et la largeur du potentiel sont également tracés. Le nombre dans
chaque image indique le temps en unités arbitraires. La figure II est particulièrement intéressante
car elle montre comme la probabilité décroît lentement puis rebondi et passe à travers la barrière
quand l'énergie cinétique moyenne de la particule dans la barrière est zéro.
V.2. Collisions à trois dimensions
Ce qui nous intéresse particulièrement est la situation des collisions à trois dimensions où une
particule heurte un champ de force fixe ou lorsque deux particules se heurtent. Dans le cas du
mouvement relativiste de deux particules, lorsque les seules forces présentent dépendent seulement
de leurs mouvements relatifs, on peut séparer le problème en deux problèmes à une seule particule.
L'un décrit le mouvement des particules relativement l'une à l'autre ou par rapport au centre de
masse et l'autre décrit le mouvement libre du centre de masse. Ce résultat valide en mécanique
classique s'étend à la mécanique quantique (cela peut paraître évident pour des raisons de lois de
conservation de l'impulsion, mais nous allons le vérifier ci-dessous). Bien que le centre de masse
puisse être pris au repos dans le calcul des niveaux d'énergie des mouvements internes, il a un
mouvement définit dans une collision qui ne peut pas être ignoré dans le calcul des résultats d'une
telle expérience. La raison en est que la procédure habituelle en laboratoire consiste à bombarder
une particule qui est initialement au repos avec une autre particule qui porte l'énergie totale
E 0 = E + E ′ . Donc, l'énergie E du mouvement relatif des deux particules est différent de l'énergie
de bombardement E 0 et la diffusion observée dépend du fait que la particule est initialement au
repos ou du fait que le centre de masse est initialement au repos.
Nous appelons le système de coordonnées dans lequel la particule bombardée est initialement au
repos le système de coordonnées du laboratoire et le système de coordonnées dans lequel le centre
de masse des deux particules est (initialement et toujours) au repos le système de coordonnées du
centre de masse. Il est évidemment plus facile de calculer le résultat d'une expérience de collision
dans le système du centre de masse que dans le système du laboratoire puisque seuls trois degrés de
liberté apparaissent dans le premier à comparer aux six du second. Le processus de collision dans le
système du centre de masse peut être vu comme celui d'une particule qui a la masse réduite
µ = m1 m2 / (m1 + m2 ) et une vitesse initiale v qui entre en collision avec un centre de diffusion fixe.
La distribution en angles de la particule diffusée sera affectée par la transformation entre le système
de coordonnées du centre de masse, dans lequel les calculs sont faits, et le système de coordonnées
du laboratoire, dans lequel les observations sont faites.
Masse réduite
L'équation de Schrödinger décrit le mouvement d'une seule particule dans un champ de force
externe. Nous sommes maintenant intéressés par le mouvement de deux particules qui sont attirées
l'une par l'autre ou qui se repoussent par une force qui dépend seulement de la distance entre elles.
La forme de l'équation de Schrödinger a utiliser pour deux particules est suggérée par l'extension de
l'équation de Schrödinger de une à trois dimensions. Cette extension utilisait le fait la fonction
d'onde dépend des trois coordonnées rectangulaires x, y et z au lieu de juste x et en introduisant
l'impulsion correspondant aux nouvelles coordonnées telle qu'elles apparaissent dans l'expression
classique de l'énergie.
Une extension similaire de trois à six coordonnées rectangulaires conduit directement à l'équation
de Schrödinger, que nous avions déjà suggérée, pour deux particules de masse m1 et m2 :
∂
ih ψ ( x1 , y1 , z1 , x 2 , y 2 , z 2 , t ) =
∂t
h2 ∂2 ∂2 ∂2 h2 ∂2 ∂2 ∂2
(1) −
2 + +
2
−
2 + +
2
+ V ( x , y , z , x , y , z , t )
2m1 ∂x1 ∂y1 ∂z1 2m2 ∂x 2 ∂y 2 ∂z 2
2 2 1 1 1 2 2 2
ψ ( x1 , y1 , z1 , x 2 , y 2 , z 2 , t )
où l'énergie potentielle est supposée dépendre d'une manière arbitraire des six coordonnées et du
temps. Si maintenant l'énergie potentielle dépend seulement des coordonnées relatives, c'est-à-dire
V = V ( x1 − x 2 , y1 − y 2 , z1 − z 2 ) , une simplification importante peut être faite. Nous définissons les
coordonnées relatives x, y, z et les coordonnées du centre de masse X, Y, Z par
x = x1 − x 2 y = y1 − y 2 z = z1 − z 2
(2)
MX = m1 x1 + m2 x 2 MY = m1 y1 + m2 y 2 MZ = m1 z1 + m2 z 2
Ici, M = m1 + m2 est la masse totale du système. L'équation (1) peut être récrite en fonction des
nouvelles coordonnées
∂ψ h 2 ∂ 2 ∂2 ∂2 h2 ∂2 ∂2 ∂2
(3) ih = − + +
2
−
+ + + V ( x, y, z )ψ
2
∂t 2 M ∂X 2
∂Y 2
∂Z 2 µ ∂x 2
∂y 2
∂z
où
m1 m2
(4) µ =
m1 + m2
est appelée masse réduite.
Deux séparations de l'équation (3) peuvent maintenant être faites. Tout d'abord, la dépendance en
temps peut être séparée, comme nous l'avons déjà vu, et, deuxièmement, une séparation peut être
faite en un produit de fonctions des coordonnées relatives et des coordonnées du centre de masse.
Le processus est immédiat et simple et le résultat est
ψ ( x, y, z, X , Y , Z , t ) = u ( x, y, z )U ( X , Y , Z )e −i ( E + E ′ )t / h
h2 2
(5) − ∇ u + Vu = Eu
2µ
h2 2
− ∇ U = E ′U
2M
où les opérateurs ∇ 2 dans la deuxième et troisième équation impliquent la différentiation par
rapport aux coordonnées relatives et du centre de masse, respectivement. La deuxième équation (5)
décrit le mouvement relatif des deux particules et est la même que l'équation du mouvement d'une
particule qui a la masse réduite µ dans une énergie potentielle externe V . La troisième équation
(5) nous dit que le centre de masse du système de deux particules se déplace comme une particule
libre de masse M, comme on s'y attendait.
Alors le nombre de particules incidentes qui émerge par unité de temps dans ∆ω 0 peut s'écrire
(6) nNσ 0 (θ 0 , φ 0 )∆ω 0
où le facteur de proportionnalité σ 0 (θ 0 , φ 0 ) et appelé section efficace différentielle de diffusion.
Puisque (6) a la dimension de l'inverse d'un temps, σ 0 (θ 0 , φ 0 ) a la dimension d'une surface.
σ 0 (θ 0 , φ 0 )∆ω 0 est égale à la section efficace du flux parallèle incident qui contient le nombre de
particules diffusées dans ∆ω 0 par une seule particule cible ou centre de diffusion. L'intégrale de
σ 0 (θ 0 , φ 0 ) sur la sphère est appelée section efficace totale de diffusion
(7) σ 0 = ∫ σ 0 (θ 0 , φ 0 )dω 0
Pour la collision d'une particule avec un centre de diffusion fixe, la définition (6) de la section
efficace différentielle de diffusion est également valide dans les systèmes de coordonnées du
laboratoire et du centre de masse puisqu'un centre de diffusion qui est fixé à une masse effective
infinie et ainsi le centre de masse du système ne se déplace pas. Pour une collision entre deux
particules de masse finie, cependant, la section efficace différentielle (6) s'applique en général
seulement au système de coordonnées du laboratoire et à l'observation de la particule incidente
diffusée. Elle ne décrit pas l'observation des particules bombardées éjectées dans le système du
laboratoire bien qu'il soit bien sûr possible d'obtenir une section efficace différentielle pour
l'éjection des particules à partir de σ 0 (θ 0 , φ 0 ) . Dans le système du centre de masse, la section
efficace différentielle σ (θ , φ ) peut être définie en analogie avec (6) où, à nouveau, la particule
incidente diffusée est celle qui est observée et le flux N de particules incidentes est calculé par
rapport aux particules bombardées, par le centre de masse. Puisque dans ce système de coordonnées
les deux particules se déplacent dans des directions opposées l'une de l'autre après la collision, il est
clair que la section efficace différentielle pour l'observation des particules bombardées éjectées
dans la direction θ , φ est juste σ (π − θ , φ + π ) .
Relation entre les angles dans le laboratoire et le centre de masse
La relation entre les sections efficaces différentielles et les angles dans le système du laboratoire et
dans le système du centre de masse peuvent être trouvées en déplaçant le système du laboratoire
dans la direction de la particule incidente avec une vitesse suffisante pour mettre le centre de masse
au repos. La figure (a) ci-dessus montre une particule de masse m1 et une vitesse initiale va frapper
une particule de masse m2 initialement au repos. Le centre de masse se déplace vers la droite avec
la vitesse v ′ = m1v / (m1 + m2 ) , comme on peut le voir de la conservation de l'impulsion. Donc, dans
le système du centre de masse, les particules de masse m1 et m2 approchent du centre de masse
avec les vitesses
m2 v
(8) v ′′ = v − v ′ =
m1 + m2
et v ′ , respectivement. Si la collision est élastique, elles s'écartent évidemment du centre de masse
après la collision avec les mêmes vitesses (figure (b)). Il suit de la géométrie de la situation que θ
et φ sont reliés à θ 0 et φ 0 par
v ′′ cosθ + v ′ = v1 cosθ 0
(9) v ′′ sin θ = v1 sin θ 0
φ = φ0
Les équations (9) et (10) peuvent être valides pour des collisions non élastiques aussi. Considérons
une collision binaire générale (par exemple, une réaction nucléaire) dans laquelle une particule de
masse m1 frappe une particule de masse m2 initialement au repos et, après la collision, les
particules de masse m3 et m4 émergent, où m1 + m2 = m3 + m4 . Si en plus une quantité d'énergie Q
est convertie de l'énergie interne en énergie cinétique des particules émergentes (Q est positif pour
des collisions exothermiques et négatif pour des collisions endothermiques) et la particule de masse
m3 est observée, la première équation de (10) est encore valide. Dans ce cas, γ est encore égal au
rapport de la vitesse du centre de masse dans le système du laboratoire à la vitesse de la particule
observée dans le système du centre de masse puisque tout cela est déduit de simples considérations
géométriques. Cependant, γ n'est plus m1 / m2 mais on peut montrer qu'il est donné par
1
mm E 2
(11) γ = + 1 3
m m
2 4 E + Q
où E = m1 m2 v / 2(m1 + m2 ) est l'énergie initialement associée au mouvement relatif dans le
2
Avec l'aide de la dernière équation (9) et la première équation (10), l'équation (12) donne
) = (1 + γ )
1
+ 2γ cosθ 2
2
(13) σ 0 (θ 0 , φ 0 σ (θ , φ )
1 + γ cosθ
où en général γ est donné par (6). On notera que la section efficace totale est la même dans les
deux systèmes du laboratoire et du centre de masse puisque le nombre total de collisions qui se
produisent est indépendant du mode de description du processus.
Dépendance en γ
Pour γ < 1 , l'équation (10) montre que θ 0 croît de manière monotone de 0 à π lorsque θ croît de 0
à π . Pour γ = 1 , θ 0 = 12 θ et varie de 0 à 12 π lorsque θ varie de 0 à π . Dans ce cas
(14) σ 0 (θ 0 , φ 0 ) = 4 cosθ 0σ (2θ 0 , φ 0 )
et aucune particule n'apparaît dans l'hémisphère arrière dans le système du laboratoire. Pour γ > 1 ,
θ 0 croît d'abord de 0 à une valeur maximale sin −1 (1 / γ ) , puis décroît jusqu'à 0 pendant que θ varie
jusque π . Dans ce cas, σ 0 (θ 0 , φ 0 ) est habituellement infini a la valeur maximale de θ 0 bien que
cette singularité donne une contribution finie à la section efficace totale. Aucune particule
n'apparaît au-delà du maximum de θ 0 dans le système du laboratoire. Les deux valeurs de θ qui
conduisent à une valeur particulière de θ 0 entre 0 et sin −1 (1 / γ ) peuvent être distinguées par
l'énergie de la particule observée qui est d'autant plus grande que θ est petit.
Ce dernier cas ( γ > 1 ) est illustré schématiquement dans la figure (c). La résultante de la vitesse v ′′
de la particule observée dans le centre de masse et la vitesse v ′ du centre de masse dans le système
du laboratoire donne la vitesse v1 de la particule observée dans le système du laboratoire. Le lieu
des points terminaux de v1 quand son origine est au point O est le cercle de rayon v ′′ . Donc, quand
v ′′ < v ′ , l'angle θ 0 de la résultante v1 avec la direction de bombardement ne peut pas excéder
l'angle
v ′′ 1
(15) sin −1 = sin −1
v′ γ
L'utilisation des relations géométriques dans la discussion précédente est valide aussi bien en
mécanique quantique qu'en mécanique classique car ce sont essentiellement des relations entres
vecteurs impulsions qui sont appliquées dans la région asymptotique où les particules n'ont pas
besoin d'être localisées avec précision dans l'espace et donc peuvent avoir des impulsions définies.
Il est intéressant de noter que la différence entre les systèmes du laboratoire et du centre de masse
est négligeable dans les collisions d'électrons avec des atomes à cause du grand rapport de masse
des particules en jeu. Dans les collisions nucléaires, cependant, la différence entre les deux
systèmes de coordonnées est habituellement significative.
Comportement asymptotique
La section efficace différentielle de diffusion σ (θ , φ ) dans le système de coordonnées du centre de
masse peut être trouvée à partir de la forme asymptotique de la solution à la deuxième équation (5),
h2 2
(16) − ∇ u + Vu = Eu
2µ
qui est l'équation de Schrödinger pour le mouvement relatif. La fonction d'onde u peut être écrite
comme une fonction des angles θ , φ et de la distance radiale entre les deux particules. L'énergie E
associée au mouvement relatif se lit sur la figure ci-dessus comme
m2
(17) E = E0
m1 + m2
où E 0 est l'énergie initiale de la particule incidente. Il est intéressant de noter que E est égal à
l'énergie cinétique de la particule dont la masse est la masse réduite µ et dont la vitesse est la
vitesse relative v. Donc, nous pouvons voir (16) comme représentant la collision élastique d'une
particule de masse µ , de vitesse initiale v et d'énergie cinétique E = 12 µv 2 avec un centre de
diffusion fixe qui est décrit par l'énergie potentielle V (r ) où r est la distance entre la particule
fictive µ et l'origine du potentiel de diffusion.
Comme dans la section précédente, la diffusion est déterminée par la forme asymptotique de
u (r ,θ , φ ) dans la région où V = 0. Quand les particules qui se heurtent sont très éloignées, nous
désirons que u contiennent une partie qui représente une particule incidente de masse µ se
déplaçant dans une direction particulière avec la vitesse v et une partie qui représente une particule
sortante radiale :
µv
[
r →∞
]
(18) u (r ,θ , φ ) → A e ikz + r −1 f (θ , φ )e ikr k=
h
Le premier terme dans (18) représente une particule se déplaçant dans la direction des z positifs ou
le long de l'axe polaire θ = 0 puisque z = r cosθ . C'est une onde plane infinie de la forme d'une
fonction propre de l'impulsion où le vecteur de propagation k a la grandeur k et est dirigé le long de
l'axe polaire. Le deuxième terme dans (18) représente une particule qui se déplace radialement vers
l'extérieur. Son amplitude dépend de θ et de φ et inversement proportionnelle à r puisque le flux
radial doit diminuer comme l'inverse du carré de la distance. On vérifie facilement que (18) satisfait
l'équation (16) asymptotiquement à travers des termes d'ordre 1 / r dans la région où V = 0 pour
toute forme de la fonction f (θ , φ ) .
Normalisation
La signification physique du coefficient A et de la fonction angulaire f peut être obtenue par un
calcul du flux de particule, comme dans la section précédente. Une substitution directe de (18) dans
l'équation de la densité de courant de probabilité conduit cependant à des termes d'interférence
entre les ondes incidentes et diffusées qui n'apparaissent pas dans la plus part des arrangements
expérimentaux. Le fait qu'ils ne peuvent pas apparaître peut être vu de la manière suivante.
En pratique, les particules incidentes et diffusées sont séparées l'une de l'autre en les collimatant
l'une sur l'autre. Supposons, par exemple, que l'arrangement expérimental est comme indiqué
schématiquement ci-dessus, tel que les particules incidentes venant de la source S sont collimatées
par les diaphragmes DD en un faisceau plus ou moins bien défini. Un tel faisceau collimaté n'est
pas une onde plane infinie de la forme e ikx mais peut être obtenue en superposant une infinité
d'ondes planes qui sont des vecteurs de propagation de grandeurs et directions légèrement
différentes. La dispersion angulaire totale en radians sera de l'ordre du rapport de la longueur
d'onde de la particule au diamètre du collimateur (diffraction) et ainsi peut être extrêmement petit
en pratique. Maintenant, f ne varie habituellement pas très rapidement avec l'angle, tel que la petite
dispersion en directions des vecteurs de propagation incidents n'affecte pas f de manière
significative. Donc, au point d'observation P, seul le terme f est présent et est essentiellement le
même que celui qui apparaît dans (18). Le flux incident peut être calculé à partir du terme d'onde
plane seul puisque si nous allons suffisament loin de la zone de diffusion, le terme f peut être rendu
négligeable. Donc, dans la région observée, les termes d'interférences sont une conséquence de
l'idéalisation implicite en supposant une onde plane infinie dans (18) et ils n'ont habituellement pas
de signification physique sauf dans quelques cas exceptionnels.
La substitution des deux termes de (18) séparément dans l'équation de la densité de flux de
2
probabilité montre que le flux incident est de grandeur v A le long de l'axe polaire et que le terme
dominant dans le flux diffusé est de grandeur
v A f (θ , φ )
2 2
(19)
r2
le long d'un rayon vers l'extérieur. A partir de la définition de la section efficace, il s'ensuit que
(20) σ (θ , φ ) = f (θ , φ )
2
Comme discuté dans la section précédente, le choix du coefficient A n'est pas important tant que le
calcul de la diffusion est considéré. La fonction d'onde peut être normalisée à un flux incident unité
1
en choisissant A = 1 / v ou elle peut être normalisée en posant ∫u d 3 r = 1 dans une grande boîte
2 2
qui a des conditions aux limites périodiques. Nous poserons souvent simplement A égal à l'unité.
V.3. Diffusion par des potentiels à symétrie sphérique
Le comportement asymptotique de la fonction d'onde détermine la section efficace différentielle
mais ne peut pas en elle-même être trouvée sans résoudre l'équation de Schrödinger dans tout
l'espace. Comme cela est le cas dans le calcul des niveaux d'énergie, cela peut être fait seulement
quand l'équation de Schrödinger est séparable et un cas particulier de grand intérêt physique est
celui dans lequel l'énergie potentielle est à symétrie sphérique. Nous allons supposer ici que V est
seulement fonction de r et nous allons trouver la relation entre les solutions séparées en
coordonnées sphériques et la forme asymptotique. Cette procédure est appelée la méthode des
ondes partielles.
Dans la suite nous ne distinguerons généralement pas les collisions d'une particule avec un centre
fixe de diffusion et les collisions entre deux particules traitées dans le système de coordonnées du
centre de masse.
La diffusion élastique, pour laquelle V est réel, est considérée ici. La situation où V est complexe
sera discutée plus loin et est intéressante puisque certains processus inélastiques peuvent être
décrits approximativement de cette manière.
Comportement asymptotique
Il est évident que le problème possède maintenant une symétrie autour de l'axe polaire tel que u, f et
σ sont indépendants de l'angle φ . La solution générale de l'équation de Schrödinger peut être
écrite comme une somme de produits de fonctions radiales et de polynômes de Legendre. Pour des
raisons pratiques, nous l'écrivons sous la forme
∞
u (r ,θ ) = ∑ (2l + 1)i l Rl (r )Pl (cosθ )
l =0
(1) ∞
= ∑ (2l + 1)i l r −1 χ l (r )Pl (cosθ )
l =0
La condition aux limites en r = 0 que Rl soit fini ou que χ l s'annule détermine la forme
asymptotique de la solution à (2) excepté pour une constante multiplicative arbitraire.
a
où a et A sont des constantes. La première exponentielle est supposée être une fonction de r variant
lentement pour de grands r, ce qui implique que f (r ) diminue plus rapidement que t −1 lorsque
r → ∞ . La substitution de (3) dans (2) donne l'équation suivante pour f :
l (l + 1)
(4) f ′ + f 2 ± 2ikf = U (r ) + ≡ W (r )
r2
où l'apostrophe indique la dérivée par rapport à r. Si maintenant W (r ) diminue comme r − s pour de
grands r (s > 0), le dernier terme sur le coté gauche est le terme dominant et f diminue aussi comme
r − s . Dans ce cas, χ l varie comme e ± ikr pour de grands r si s > 1 puisque alors l'intégrale dans
l'exponentielle de (3) converge pour de grands r. Si, d'autre part, W diminue comme une
exponentielle ou une fonction d'erreur de r (ce qui implique que l = 0), le premier et le troisième
terme sur le coté gauche de (4) doivent être considérés tous les deux. On peut alors montrer sans
difficulté que χ l varie encore comme e ± ikr pour de grands r. Le champ coulombien, pour lequel U
et W varie comme r −1 pour de grands r indépendamment de la valeur de l est le seul cas
physiquement intéressant qui nécessite une attention particulière et qui sera discuté plus loin.
La forme asymptotique de χ l peut être écrite assez généralement
(5) χ l (r ) → Al′ sin (kr + δ l′ )
r →∞
où jusqu'à preuve du contraire Al′ et δ l′ peuvent être complexe. La solution de (2) qui s'annule en r
= 0 est unique à une constante multiplicative près. On peut montrer que cette solution est réelle
partout si elle est réelle en r = 0, puisque k, U et l sont tous réels. Donc, δ l′ doit être réel bien que
Al′ n'a pas besoin de l'être. Cela étant dit, on vérifie facilement que le flux radial total de particules
à travers une grande sphère s'annule :
π
(6) lim 2πr 2 ∫ S r sin θdθ = 0
r →∞ 0
Nous voulons maintenant identifier la forme asymptotique de (1) avec la forme asymptotique vue
dans la section précédente. Pour faire cela, nous avons besoin d'un développement de e ikz = e ikr cosθ
en polynômes de Legendre :
∞
(9) e ikr cos θ = ∑ (2l + 1)i l jl (kr )Pl (cosθ )
l =0
l =0
(10) ∞
= ∑ (2l + 1)i l Al (kr ) sin (kr − 12 lπ + δ l )Pl (cosθ )
−1
l =0
Lorsque les fonctions sinus sont écrites sous forme d'exponentielles complexes, les coefficients de
e ikr et e −ikr des deux cotés de cette équation doivent être égaux :
∞ 1 ∞ 1
− ilπ i δ l − lπ
2ikf (θ ) + ∑ (2l + 1)i e l 2
Pl (cosθ ) = ∑ (2l + 1)i Al e l 2
Pl (cosθ )
l =0 l =0
(11)
∞ 1 ∞ 1
ilπ −i δ l − lπ
∑ (2l + 1)i e
l =0
l 2
Pl (cosθ ) = ∑ (2l + 1)i Al e
l =0
l 2
Pl (cosθ )
Puisque ces relations sont vraies pour toute valeur de θ et que les polynômes de Legendre sont
orthogonaux, la deuxième équation (11) devient
iδ l
(12) Al = e
La substitution de cette valeur dans la première équation (11) donne pour l'amplitude de diffusion
∑ (2l + 1)(e )
∞
(13) f (θ ) = (2ik ) − 1 Pl (cosθ )
−1 2 iδ l
l =0
Il est utile de noter que la relation asymptotique de la section précédente, (13) et (14), qui se
rapportent toutes au comportement asymptotique de la fonction d'onde, sont aussi valides quand la
relativité restreinte est prise en compte. Aussi longtemps que nous travaillons avec le mouvement
dans le système de coordonnées du centre de masse, qui peut être décrit par une fonction u des
coordonnées relatives, nous pouvons spécifier la diffusion de cette manière en fonction de δ l où
hk est l'impulsion relative. Cela est vrai même quand l'interaction ne peut pas être décrite par un
potentiel.
La section efficace totale peut aussi être reliée à f (0) . Il suit de la fonction génératrice des
polynômes de Legendre que Pl (1) = 1 pour tout l, tel que (13) donne pour θ = 0
∑ (2l + 1)(e )
∞
(16) f (0 ) = (2ik )
−1 2 iδ l
−1
l =0
L'interprétation physique de (17) est la suivante : afin que la diffusion prenne place, les particules
doivent être éliminées dans quantité proportionnelle à σ du flux incident, tel que son intensité est
plus petite derrière la région de diffusion ( θ ≈ 0 ) qu'en face d'elle. Cela peut se produire seulement
par interférence entre les deux termes dans l'expression asymptotique de la section précédente.
Puisqu'un tel terme d'interférence doit être une fonction linéaire de l'amplitude de diffusion vers
l'avant, on s'attend à une relation générale de la forme de (17). Un calcul réel de ce terme
d'interférence montre que (17) doit être valable plus généralement : quand f dépend aussi bien de φ
que de θ et quand σ inclut une diffusion inélastique et de l'absorption en plus de la diffusion
élastique.
Décalages de phase
L'angle δ l est appelé décalage de phase de la lième onde partielle puisque selon (8) c'est la
différence de phase entre les formes asymptotiques de la fonction radiale Rl (r ) et la fonction
radiale jl (kr ) en l'absence de potentiel de diffusion (U = 0). Le décalage de phase détermine
complètement la diffusion et la section efficace de diffusion s'annule quand chacun des δ l est 0° ou
180°.
On notera que la dérivation de (13) est valide qu'il existe ou pas le rayon supposé a au-delà duquel
U (r ) est négligeable pourvu que U (r ) diminue plus rapidement que 1 / r . Cependant, la méthode
des ondes partielles est la plus utile pour le calcul des sections efficaces de diffusion si un tel rayon
a existe, particulièrement si ka est de l'ordre de l'unité ou moins. La raison en est que le premier et
plus grand maximum de jl (kr ) est approximativement en r = l / k . Pour r beaucoup plus petit, jl
est petit et croît comme r l . Donc, si a << l / k , jl sera très petit où U est appréciable. Alors la
lième onde partielle sera peu affectée par le potentiel, le décalage de phase δ l sera très petit et la
contribution à la diffusion pour ce l sera négligeable. Il s'ensuit que la section efficace de diffusion
consiste en une série de termes s'étendant de l = 0 à un l maximum qui est de l'ordre de ka . Puisque
le calcul des décalages de phase est habituellement un travail fastidieux, plus petite est la grandeur
de ka , plus la méthode est facile à appliquer. Donc ces méthodes des ondes partielles sont surtout
utiles aux bombardements à faible énergie.
Il est intéressant de noter que la distance classique d'approche la plus proche d'une particule de
masse µ , de vitesse v et de moment angulaire lh de l'origine est lh / µv = l / k . Donc, les
remarques précédentes sont analogues à l'affirmation qu'une particule classique n'est pas diffusée si
elle a un moment angulaire suffisant pour ne pas entrer dans la région du potentiel r < a .
Calcul de δ l
Le décalage de phase δ l est calculé en comparant la fonction d'onde radiale Rl (r ) pour r < a , qui
peut avoir une forme analytique et peut toujours être trouvé numériquement si nécessaire, à la
solution (7). La condition aux limites en r = a est que (1 / Rl )(dRl / dr ) doit être continu. Donc, si γ l
est le rapport de la pente à la valeur de la fonction d'onde intérieure, nous avons que
k [ jl′ (ka ) cos δ l − nl′ (ka )sin δ l ]
(18) =γl
jl (ka ) cos δ l − nl (ka )sin δ l
En calculant les dérivées jl′ et nl′ avec l'aide des expressions que nous avons vues, δ l est donné
par
kj ′ (ka ) − γ l jl (ka )
(19) tan δ l = l
knl′ (ka ) − γ l nl (ka )
L'équation (19) peut être utilisée directement pour obtenir une expression approchée de δ l quand l
est grand et δ l supposé petit. Dans ce cas, γ l diffère peu du rapport de la pente à la valeur de la
solution en l'absence d'un potentiel de diffusion, et nous posons
j ′ (ka ) j ′ (ka )
(20) γ l = k l + εl ε l << l
jl (ka ) jl (ka )
L'équation (19) peut-être écrite avec les expressions que nous avons vues sur les jl et les nl
comme
ε l (ka )2 j l2 (ka )
(21) tan δ l =
ε l (ka )2 j l (ka )nl (ka ) − 1
qui est encore exact. Si nous utilisons maintenant le développement en série de jl quand l >> (ka )
2
Donc, même si ε l a la valeur maximale indiquée par (22), δ l diminue comme l'inverse de la
factorielle de l (plus vite qu'une exponentielle) et les séries qui apparaissent dans les expressions de
la diffusion convergent assez rapidement pour l grand.
d'énergie potentielle V ou U est positif, correspondant à des forces qui sont principalement
répulsives, l'équation (2) montre que le rapport de la courbure à la valeur de la fonction d'onde
radiale est plus positive que dans le cas libre. Cela signifie que le rapport de la pente à la valeur est
plus positif en r = a que dans le cas où U = 0. Donc, un potentiel répulsif rend ε l positif et δ l
négatif. Un décalage de phase négatif signifie que la fonction d'onde radiale est "poussée vers
l'extérieur" en comparaison de la fonction d'onde libre.
De même, nous voyons qu'un potentiel négatif rend ε l négatif et δ l positif. Cela signifie que la
fonction d'onde est "tirée vers l'intérieur" par le potentiel attractif.
Cela peut être vu graphiquement en comparant rj 0 (kr ) et χ 0 (kr ) quand ont les fait démarrer
arbitrairement avec la même pente en r = 0. Les figures (a) et (b) montrent le résultat de calculs
numériques effectués pour des potentiels carrés répulsifs et attractifs, respectivement. Les unités
sont choisies tel que h = 1 , m = 12 et la longueur unité est un cinquième de la longueur totale de
l'abscisse montrée dans le graphique. Le potentiel a le rayon a = 1 et l'intensité V0 = ±2 , l'énergie
est E = 4 tel que ka = 2 . Dans chaque cas la courbe en tiret est rj 0 (kr ) et la courbe pleine est
χ 0 (kr ) .
Effet Ramsauer-Townsend
La figure (b) suggère qu'un potentiel attractif peut être assez fort pour que l'onde partielle l = 0 soit
tirée de juste un demi cycle et son décalage de phase est 180°. Si c'était le cas, le terme
correspondant dans l'expression (13) pour f (θ ) s'annulerait et il n'y aurait pas de contribution à la
diffusion.
La situation est montrée ci-dessus, à nouveau calculée numériquement. Ici a = 2, V0 = −5 et E = 1
tel que ka = 2 . La courbe en tiret est rj 0 (kr ) et la largeur du potentiel est également indiquée.
Dans une telle situation, il peut arriver que ka soit assez petit et le potentiel attractif assez fort pour
tous les autres décalages de phase soient négligeables quand δ 0 = 180° . L'amplitude de diffusion
f (θ ) s'annule alors pour tout θ et il n'y a pas de diffusion. C'est l'explication de l'effet Ramsauer-
Townsend, le minimum extrêmement bas observé dans la section efficace de diffusion des électrons
par les atomes de gaz rares à une énergie de bombardement d'environ 0.7 eV. Cette explication fut
suggérée par Bohr puis montrée raisonnable quantitativement par Faxén et Holtsmark. Un atome de
gaz rare, qui consiste entièrement en une coquille fermée, est relativement petit et la force
combinée du noyau et des électrons atomiques exercée sur les électrons incidents est forte et d'une
portée bien définie. Il est clair que cette section efficace minimale se produit à une énergie définie
puisque la forme de la fonction d'onde à l'intérieur du potentiel est insensible à l'énergie de
bombardement relativement faible tandis que la phase de la fonction d'onde libre en dépend
rapidement.
Physiquement, l'effet Ramsauer-Townsend peut être vu comme une diffraction de l'électron autour
de l'atome de gaz rare dans laquelle la fonction d'onde à l'intérieur de l'atome est déformée juste ce
qu'il faut pour s'ajuster à la fonction d'onde régulière et non déformée à l'extérieur. Cet effet est
analogue à la transmission parfaite trouvée à des énergies particulière dans le problème à une
dimension que nous avons examiné. Contrairement à la situation à une dimension, cependant, l'effet
Ramsauer-Townsend ne peut pas se produire avec un potentiel répulsif car ka devrait être au moins
de l'ordre de l'unité pour avoir δ 0 = −180° et un potentiel de ce large domaine produirait des
décalages de phase à des l plus grands.
(26) tan δ l ≈ −
(ka )2l +1
(2l + 1)[(2l − 1)!!]2
Donc, δ l diminue très rapidement lorsque l croît, en accord avec (23). Tous les décalages de phase
s'annulent lorsque k → 0 . Cependant, l'onde partielle l = 0 donne une contribution finie à la
diffusion à cause du facteur 1 / k 2 qui apparaît dans (14) et (15). Nous obtenons donc
(27) σ (α ) ≈ a 2 σ ≈ 4πa 2
La diffusion est à symétrie sphérique et la section efficace totale est quatre fois la valeur classique.
A la limite des hautes énergies ( ka >> 1 ), on peut s'attendre à retrouver le résultat classique
puisqu'il est alors possible d'avoir des paquets d'ondes qui sont petit par rapport à la taille de la
région diffusante et ils peuvent suivre des trajectoires classiques sans se disperser de manière
appréciable. Cela correspond à la limite de l'optique géométrique en théorie ondulatoire de la
lumière ou du son. La section efficace différentielle de diffusion est assez difficile à trouver et nous
voulons seulement indiquer le calcul du terme dominant dans la section efficace totale. La
substitution de (25) dans (15) donne
4π ∞ (2l + 1) jl2 (ka )
(28) σ = 2 ∑ 2
k l =0 jl (ka ) + nl2 (ka )
Nous pouvons utiliser les développements asymptotiques des fonctions de Bessel qui sont valides
quand l'argument est grand. Le calcul montre que la plus part des contributions de la somme dans
(28) viennent de
(29) l < (ka ) − C (ka ) 2
1
à des termes de l'ordre de (ka ) 3 et peuvent donc être négligés à limite des hautes énergies. Donc
4
(30) σ ≈ 2πa 2
qui est deux fois la limite classique.
Donc, les décalages de phase sont donnés par (19) où le rapport de la pente à la valeur de la lième
onde partielle en r = a est
αj ′ (αa )
(33) γ l = l
j l (αa )
A la limite basse énergie ( ka << 1 ) on trouve les deux premiers décalages de phase
γ ka 2
tan δ 0 ≈ − 0
1 + γ 0a
(34)
tan δ 1 ≈
(ka ) 1 − γ 1 a
3
3 2 + γ 1a
A moins que γ 0 a = −1 ou γ 1 a = −2 , les deux s'annulent lorsque k → 0 . Comme avec la sphère
rigide, cependant, l'onde partielle l = 0 donne une contribution finie à la diffusion à cause du facteur
1 / k 2 qui apparaît dans (14) et (15). A partir de (33), nous voyons que γ 0 a = αa cot αa − 1 et ainsi
tan αa
2
(35) σ ≈ 4πa 1 −
2
αa
La conclusion à laquelle on arrive ici en relation avec la sphère rigide que la diffusion à basse
énergie est essentiellement indépendante de l'énergie de bombardement et de l'angle d'observation
est presque toujours valide pour tout potentiel qui a un domaine fini. Des exceptions peuvent se
produire, comme signalé après l'équation (34), si un des γ l est tel que le dénominateur de
l'expression pour tan δ l est très petit. Dans une telle situation, la lième onde partielle est dite être
en résonance avec le potentiel diffusant. Alors, elle domine habituellement la diffusion.
Diffusion résonante
Une expression approchée pour la section efficace résonante peut être obtenue en utilisant le fait
( )
1
que γ l décroît linéairement avec α croissant quand α est suffisament près de α 0 ≡ 2µV0 / h 2 2 .
Un α croissant conduit la fonction d'onde intérieure à se courber plus rapidement et ainsi diminue
le rapport de la pente à la valeur en r = a. Maintenant
( ) k2
1
(36) α = α 0 + k
2 2 2
≈ α0 +
2α 0
quand k est petit et ainsi nous pouvons écrire à l'ordre le plus bas en k
(37) γ l a ≈ γ l0 a − bl (ka )
2
On peut montrer que la lième onde partielle est exactement en résonance à un bombardement
d'énergie zéro quand γ l0 a = −(l + 1) . Dans ce cas bl = 12 pour tout l.
La substitution dans (34) puis dans (14) donne pour le terme dominant dans la section efficace
différentielle, dans les deux cas pour lesquels la valeur de l pour l'onde partielle qui est en
résonance est 0 et 1,
a2
(38) σ (θ ) ≈ l =0
( )
ζ 0 − b0 k 2 a 2 + (ka )2
9a 2 cos 2 θ (ka )
4
(39) σ (θ ) ≈ l =1
(ζ 1 − b1 k a
2 2
) + (ka )
2 6
On voit que l'onde partielle l = 0 est en résonance pour les bombardements à basse énergie quand
α 0 a est approximativement un multiple impair de π / 2 tel que V0 a 2 ≈ π 2 h 2 / 8µ , 9π 2 h 2 / 8µ , etc.
La discussion dans l'analyse du puits de potentiel montre que ce sont juste les valeurs de V0 a 2 pour
lesquels de nouveaux niveaux d'énergie avec l = 0 apparaissent. Il est vrai assez généralement qu'un
puits de potentiel (pas nécessairement carré) qui a un niveau d'énergie proche de zéro exhibe une
résonance dans la diffusion basse énergie des particules avec la même valeur de l (pas
nécessairement zéro) que le niveau d'énergie. D'un point de vue physique, nous pouvons dire
qu'une particule incidente qui a presque la bonne énergie pour être liée par le potentiel tend à s'y
concentrer et produit une forte distorsion dans la fonction d'onde et donc une grande quantité de
diffusion.
Le maxima aigu de résonance dans la diffusion à basse énergie comme celui trouvé ci-dessus pour l
= 1 avec ζ 1 positif peut apparaître pour toute valeur de l excepté l = 0, pourvu que le puits de
potentiel ne soit pas assez large ou profond pour contenir un nouveau niveau d'énergie de ce
moment angulaire (cela correspond dans le cas du puis de potentiel à avoir ζ 1 petit et positif). Nous
pouvons voir physiquement un tel potentiel comme contenant un niveau d'énergie virtuel
légèrement au-dessus de zéro. Bien qu'un niveau d'énergie discret ne puisse pas exister avec une
énergie positive, le "potentiel centrifuge" positif l (l + 1)h 2 / 2 µr 2 pour l > 0 agit comme une
barrière de potentiel qui empêche l'évasion de la particule qui est dans ce niveau d'énergie virtuel.
La figure ci-dessus illustre cette barrière qui est caractérisée par une petite transmission à basse
énergie de la même manière que la barrière de potentiel qui nous avions étudiée. Donc, le niveau
virtuel a une sorte d'existence transitoire et produit une plus grande distorsion de la fonction d'onde
incidente à son énergie qu'aux énergies voisines. A la limite de l'énergie zéro, on peut montrer que
la transmission de la barrière centrifuge est zéro et ainsi la particule ne peut pas fuir si l > 0. La
résonance à énergie zéro conduit à un véritable état lié si l n'est pas zéro.
Distribution angulaire à basse énergie
Quand l'énergie de bombardement est petite mais non nulle, l'onde partielle l = 2 peut avoir un effet
observable sur la diffusion. Si seuls δ 0 et δ 1 sont différents de zéro de manière appréciable, les
équations (14) et (15) deviennent
[ ]
σ (θ ) = 2 sin 2 δ 0 + 6 sin δ 0 sin δ 1 cos(δ 1 − δ 0 ) cosθ + 9 sin 2 δ 1 cos 2 θ
k
1
(41)
4π
(
σ = 2 sin 2 δ 0 + 3 sin 2 δ 1
k
)
En l'absence de résonance, nous voyons avec les équations (34) et (41) que le rapport des
contributions à la section efficace totale des ondes partielles l = 1 et l = 0 est de l'ordre de (ka ) .
4
Cependant, le rapport du terme le plus grand dépendant de l'angle dans la section efficace
différentielle (qui est proportionnel à cosθ ) au terme constant est de l'ordre de (ka ) .
2
Donc, l'onde partielle l =1 se manifeste dans la distribution angulaire à basse énergie avant de
devenir significative dans la section efficace totale. Cela est dû aux interférences avec l'onde
partielle plus forte l = 0. Par exemple, si δ 0 = 20° et δ 1 = 2° à une énergie de bombardement
donnée, l'onde partielle l = 1 contribue seulement à 3 pour-cent de la section efficace totale mais
elle rend la diffusion en avant ( θ = 0° ) 3.5 fois plus grande que la diffusion en arrière ( θ = 180° ).
V.4. Diffusion par des potentiels complexes
On a supposé jusqu'ici que l'énergie potentielle V (r ) était réelle. C'est une hypothèse naturelle
puisque V est issu de la mécanique classique. Cependant, il y a des situations dans lesquelles il est
utile d'utiliser un potentiel complexe comme une description fortement abrégée d'un système
physique beaucoup plus compliqué. Par exemple, les neutrons peuvent être diffusés de manière
élastique ou inélastique par des noyaux d'atomes. Dans le premier cas, le noyau est laissé dans son
état original et la somme des énergies cinétiques du neutron et du noyau est la même avant et après
la collision. Dans une collision inélastique, le noyau est laissé dans un état excité et la quantité Q,
définie en relation avec la valeur de γ dans le cas inélastique, est négative. La diffusion inélastique
et l'absorption de neutrons pour former un noyau différent sont des processus dans lesquels les
neutrons sont enlevés du flux incident et ne réapparaissent pas comme une partie de l'amplitude de
diffusion f (φ ,θ ) .
Tant que l'on considère seulement l'effet de ces autres processus sur la diffusion élastique, une
approximation utile consiste à voir l'interaction entre le neutron et le noyau comme étant représenté
par un potentiel complexe. Cela fut utilisé la première fois dans ce but par Feshbach, Porter et
Weisskopf en 1954.
Cela est habituellement appelé le modèle optique du potentiel en analogie avec l'utilisation de
longue date d'un indice de réfraction complexe pour discuter des propriétés optiques de médiums
partiellement absorbants. Cette section décrit les modifications de la théorie développée jusqu'ici
qui sont nécessaires dans l'hypothèse dans potentiel V complexe.
Conservation de la probabilité
On a montré que la densité de probabilité de position P(r, t ) et la densité de courant de probabilité
S(r, t ) obéissent à une relation différentielle de conservation. La dérivation de cette relation fait un
usage essentiel de l'hypothèse que V est réel. Si nous supposons maintenant que V est complexe et
que nous l'écrivons pour des raisons pratiques sous la forme
(1) V = VR − iV I
où VR et VI sont réels, une répétition de la dérivation montre que la relation de conservation est
remplacée par
∂P(r, t ) 2V
(2) + ∇ ⋅ S(r, t ) = − I P(r, t )
∂t h
Puis que P est non négatif, le coté droit de cette équation agit comme une source si VI est négatif et
comme une perte si VI est positif. Pour les raisons physiques discutées ci-dessus, nous supposerons
toujours que VI ≥ 0 . S'il y a une région où ∇ ⋅ S = 0 , l'équation (2) montre que P diminue
exponentiellement dans le temps, P ∝ e −2VI t / h et on s'attend à ce que la fonction d'onde ait une
dépendance en le temps ψ ∝ e (−iE −VI )t / h .
Si ψ est suffisament borné à grande distance pour que l'intégrale de surface s'annule quand Ω est
l'espace entier, nous voyons que l'intégrale de normalisation décroît au cours du temps. C'est ce à
quoi on s'attendait puisque les particules sont absorbées.
Il est plus intéressant d'appliquer (3) à une situation de diffusion. Dans ce cas, nous demandons que
ψ soit stationnaire, avec la dépendance en le temps ψ ∝ e −iEt / h . La discussion de (2) montre alors
qu'il n'y a pas de région où VI ≠ 0 et ∇ ⋅ S = 0 . Le coté gauche de (3) est maintenant zéro et
lorsque Ω devient grand, le premier terme sur le coté droit, − ∫ S n dA devient le flux entrant total
A
de particules entrant dans Ω en venant de très grandes distances. Dans la discussion sur le
comportement asymptotique dans la section précédente, il fut signalé que l'annulation de cette
intégrale impliquait que les particules diffusées vers l'extérieur sont fournies par l'onde plane
incidente. Dans la situation actuelle, nous voyons que cette intégrale est le flux de particules
éliminées de l'onde incidence plus l'onde diffusée élastiquement par le potentiel complexe pourvu
que ψ soit normalisé à une onde plane d'amplitude unité à l'infini. Elle peut donc être posée égale à
vσ abs où v est la vitesse relative et σ abs est la somme de l'absorption totale et de la section efficace
inélastique. Nous obtenons donc la relation
2
(4) σ abs = ∫ VI ψ d 3 r
2
hv
Bien que cette équation soit valide quand ψ est normalisé de manière appropriée, elle est utile
seulement si ψ est connu dans la région où VI ≠ 0 .
La dérivation de l'expression pour l'amplitude de diffusion est inchangée, ainsi l'équation devient
∞
(7) f (θ ) = (2ik ) ∑ (2l + 1)(S − 1)Pl (cosθ )
−1
l
l =0
La section efficace différentielle élastique est f (θ ) et la section efficace totale élastique est
2
π
σ el = 2π ∫ f (θ ) sin θdθ
2
0
∑ (2l + 1)(1 − 2e )
π ∞
− βl −4 βl
(8) = 2
cos 2α l + e
k l =0
π ∞
= ∑ (2l + 1)1 − S
2
2 l
k l =0
Elle se réduit à l'expression que nous avons vue quand β l = 0 comme attendu.
La section efficace d'absorption peut aussi être exprimée en fonction des décalages de phase.
Comme signalé ci-dessus, elle est égale à − v −1 ∫ S n dA où il est maintenant pratique de choisir la
A
surface A comme une grande sphère de rayon r :
1 2π π
σ abs = − lim r 2 ∫ ∫ S r sin θdθdφ
v r →∞ 0 0
(9)
1 π
= − lim 2πr 2 ∫ S r sin θdθ
v r →∞ 0
= (2l + 1) e
2 2 −2 β l
La substitution dans (12) et l'expression Al conduit à
∑ (2l + 1)(1 − e )
π ∞
−4 β l
σ abs = 2
k l =0
(14)
∑ (2l + 1)(1 − S )
π ∞
2
= 2 l
k l =0
La section efficace totale est définie comme la somme des sections efficaces élastiques et
d'absorption. Avec (8) et (14), on a
2π ∞
(
σ tot = 2 ∑ (2l + 1) 1 − e l cos 2α l
k l =0
−2 β
)
(15)
2π ∞
= 2 ∑ (2l + 1)[1 − Re(S l )]
k l =0
Relations asymptotiques
Trois relations utiles et intéressantes, le théorème de réciprocité, le théorème optique généralisé et
le théorème optique, peuvent être dérivées à partir de considérations sur le comportement
asymptotique de la fonction d'onde diffusée. Nous allons les obtenir dans l'ordre indiqué bien que
ce ne soit pas la séquence historique. Le théorème optique fut d'abord dérivé de cette manière par
Feenberg en 1932. Cette approche fut ensuite généralisée, pour conduite aux deux autres
théorèmes, par Glauber et Schomaker en 1953.
Il est utile de récrire la forme asymptotique de la section précédente, avec A = 1, sous une forme
qui n'insiste pas sur le rôle particulier joué par l'axe z :
(16) u k (r ) → exp(ik ⋅ r ) + r −1 f (k r , k )e ikr
r →∞
Puisque u k (r ) et u −k ′ (r ) satisfont tous les deux l'équation de Schrödinger avec la même valeur de
E, il s'ensuit que
(18) u −k ′ ∇ 2 u k − u k ∇ 2 u −k ′ = 0
que V soit réel ou complexe.
L'équation (18) peut être intégrée sur un grand volume sphérique Ω de rayon r et cette intégrale
peut être transformée en une intégrale sur la surface de la sphère :
∂u ∂u
( ) 2π π
(19) ∫ u −k ′ ∇ 2 u k − u k ∇ 2 u −k ′ d 3 r = r 2 ∫ ∫ u −k ′ k − u k −k ′ sin θ r dθ r dφ r = 0
Ω ∂r ∂r
0 0
où θ r , φ r sont les angles polaires de r par rapport à un axe polaire choisi arbitrairement. La
substitution des formes asymptotiques (16) et (17) donne à la limite des grands r
2π π ik 1
r 2 ∫ ∫ ik (cosθ + coθ ′)e ikr (cosθ −cosθ ′ ) + (1 + cosθ ′) − 2 f (k r , k )e ikr (1−cos θ ′ )
0 0
r r
(20)
ik 1
− (1 − cosθ ) − 2 f (k r ,−k ′)e ikr (1+cos θ ) sin θ r dθ r dφ r = 0
r r
où θ est l'angle entre k et r et θ ′ est l'angle entre k ′ et r. Le premier terme dans l'intégrand
s'annule sur l'intégration sur les directions de r puisque pour toute paire d'angles θ , θ ′ il y a une
paire qui s'annule avec π − θ ′ , π − θ . Les termes en 1 / r 2 dans l'intégrand ainsi que les autres
termes en 1 / r 2 qui ont été ignorés dans le développement de (16) peuvent être négligés pour une
raison qui deviendra claire dans la discussion de (22) ci-dessous.
∫ [(1 + cosθ ′) f (k ]
2π π
(21) ikr ∫ r , k )e ) ik (1−cos θ ′ ) − (1 − cosθ ) f (k r ,−k ′)e ikr (1+cos θ ) sin θ r dθ r dφ r = 0
0 0
qui doit être évaluée à la limite r → ∞ . Dans le premier terme, nous pouvons décaler l'axe polaire
de son choix initial arbitraire vers la direction k ′ et donc remplacer les variables d'intégration θ r ,
φ r par θ ′ , φ ′ . Alors, avec w ≡ cosθ ′ , nous considérons l'intégrale
(22) r ∫ F (w, φ ′)e ikr (1− w ) dw
1
−1
k −1
−
k ∫ −1 ∂w
e dw
On voit que des intégrations par partie supplémentaires conduiraient successivement à des
puissances de plus en plus grandes de r au dénominateur et ainsi seuls les premiers termes doivent
être gardés à la limite r → ∞ . C'est la raison pour laquelle les termes mentionnés ci-dessus en 1 / r 2
pouvaient être négligés. Nous trouvons donc que la limite de (22) est
[
(24) F (1, φ ′) − F (− 1, φ ′)e 2ikr
i
k
]
Avec la forme ci-dessus de F (w, φ ′) , nous voyons que F (− 1, φ ′) = 0 . Cependant le second terme de
(24) pourrait avoir été éliminé avant puisque le facteur e 2ikr oscille autour de zéro lorsque r → ∞ .
C'est une application de la méthode des phases stationnaires qui est quelque fois utile pour obtenir
des expressions asymptotiques des intégrales. Dans ce cas, le point w = 1 est appelé point de phase
stationnaire, puisque la phase de l'intégrand de (22) est stationnaire lorsque w approche l'unité.
Théorème de réciprocité
Le point de phase stationnaire du premier terme de (22) est cosθ ′ = 1 ou θ ′ = 0 . Cela correspond à
r le long de k ′ ou la substitution de k ′ à k r dans l'amplitude de diffusion f (k r , k ) . De plus,
l'intégrand ne dépend pas de φ ′ et ainsi l'intégration sur φ ′ introduit seulement un facteur
multiplicatif 2π . De même, le deuxième terme dans (22) a son point de phase stationnaire en
cos α = −1 ou θ = π , tel que k r est remplacé par -k dans f (k r ,−k ′) .
Il arrive souvent que V (r ) = V (− r ) tel que V possède une symétrie par inversion de l'espace. Alors,
tous les vecteurs dans le problème de diffusion peuvent être inversés sans altérer la situation
physique et nous avons que
(26) f (− k ,−k ′) = f (k , k ′)
La substitution des formes asymptotiques comme (16) dans le premier terme donne alors à la limite
de r grand
2π π ik 1
r 2 ∫ ∫ ik (cosθ + cosθ ′)e ikr (cos θ −cos θ ′ ) + (1 + cosθ ′) − 2 f (k r , k )e ikr (1−cosθ ′ )
0 0
r r
ik 1
(30) + (1 + cosθ ) + 2 f ∗ (k r , k ′)e −ikr (1−cos θ ) + 2 f ∗ (k r , k ′) f (k r , k ) sin θ r dθ r dφ r
2ik
r r r
4iµ
+ 2 ∫ VI u k∗′ u k d 3 r = 0
h
où l'intégrale de volume est maintenant sur tout l'espace.
Comme avant, le premier terme donne zéro et les termes qui sont produits de 1 / r 2 et
d'exponentielles peuvent être négligés. Les deux termes exponentiels restant peuvent être évalués
par la méthode des phases stationnaires. Le premier terme a son point de phase stationnaire au
même endroit : cosθ ′ = 1 ou k r = k ′ . Cependant, le second terme a maintenant son point de phase
stationnaire en cosθ = 1 ou k r = k plutôt qu'en k r = −k comme avant. Il y a aussi un changement
de signe qui vient du signe altéré dans l'exponentielle. L'équation (30) devient donc
2π π 4iµ
(31) − 4πf (k ′, k ) + 4πf ∗ (k , k ′) + 2ik ∫ ∫ f ∗ (k r , k ′) f (k r , k ) sin θ r dθ r dφ r + 2 ∫ V I u k∗′ u k d 3 r = 0
0 0 h
Comme telle, cette relation n'est pas utile car le dernier terme est difficile à évaluer et n'a en général
pas d'interprétation physique simple. Nous considérons donc d'abord le cas où V est réel et donc
VI = 0 . L'équation (31) est alors appelée théorème optique généralisé :
2πi ∗
0
2π π
(32) ∫ ∫ f ∗ (k r , k ′) f (k r , k )sin θ r dθ r dφ r =
0 k
[
f (k , k ′) − f (k ′, k ) ]
Si V possède une inversion par symétrie, la relation (27) peut être utilisée pour simplifier cette
relation :
4π
Im[ f (k ′, k )]
2π π
(33) ∫ ∫ f ∗ (k ′, k r ) f (k r , k )sin θ r dθ r dφ r =
0 0 k
Il est important de noter que les équations (31) et (32) sont valides seulement si V est réel.
L'équation (33) peut être utilisée en conjonction avec l'approximation de Born, que nous verrons
plus tard, de la manière suivante. L'approximation de Born donne une expression approchée
extrêmement simple pour l'amplitude de diffusion f qui est du premier ordre en V et ce f est réel
quand V est réel. L'équation (33) nous permet donc de calculer la partie imaginaire de f qui est à
l'ordre le plus bas en V et de montrer qu'elle est en réalité du second ordre.
Théorème optique
Il y a une situation dans laquelle l'intégrale de volume dans (31) a une interprétation physique
simple, c'est-à-dire quand k ′ = k . Alors, en accord avec (4),
1
(34) ∫ V I u k∗ u k d 3 r = hvσ abs
2
puisque la normalisation de u k est en accord avec celle utilisée plus tôt pour ψ . Alors l'équation
(31) devient
4π
Im[ f (k , k )]
2π π
(35) ∫ ∫ f (k r , k ) sin θ r dθ r dφ r + σ abs =
2
0 0 k
Le premier terme sur le coté gauche est la section efficace totale élastique σ el tel que le coté
gauche est égal à σ tot .
On voit que f (k , k ) entre dans le théorème optique à travers une interférence entre les ondes
planes et diffusées dans (16). Cette interférence est caractérisée par le facteur de phase e ikr (1−cos θ )
qui, comme fonction de θ , oscille rapidement autour de zéro pour de grands r excepté dans le
voisinage de θ = 0 . Donc, la densité de courant de probabilité asymptotique consiste en une partie
de l'onde plane seule qui est partout dans la direction k, une partie de l'onde diffusée seule qui est
toujours radialement sortante et qui s'intègre en σ el et une partie qui vient de l'interférence. Cette
dernière est appréciable seulement quand kr (1 − cosθ ) ≤ 1 et proche de 1. Pour de grands kr et de
petits θ , c'est équivalent à θ ≤ (kr ) 2 . Dans cette région angulaire, l'onde diffusée interfère de
1
−
manière destructive avec l'onde plane enlevant donc de l'onde plane juste assez du flux incident
pour prendre en compte l'absorption et la diffusion inélastique et toute la diffusion élastique sauf
pour les angles infinitésimaux.
Dans la région asymptotique, ce domaine angulaire d'interférence peut être vu comme un résidu de
l'ombre qui ne peut pas s'étendre au-delà d'une distance rs telle que la partie qui interfère ou la
partie imaginaire de l'amplitude diffusée en avant, Im[ f (k , k )] / rs est de l'ordre de l'amplitude de
l'onde plane, qui est l'unité, et donc rs ~ Im[ f (k , k )] ~ kσ tot . A cette distance limite, le diamètre de
l'ombre est d ~ (rs / k ) 2 ~ (σ tot ) 2 . Maintenant, σ tot est de l'ordre du carré du diamètre du diffuseur
1 1
à la limite classique ou des courtes longueurs d'ondes. Donc le diffuseur et l'ombre sont à peu près
de la même taille à la distance limite où l'ombre existe, comme on s'y attendrait.
V.5. Diffusion par un champ coulombien
On avait noté plus tôt que le champ coulombien est un diffuseur exceptionnel en ce qui concerne
l'application de la méthode des ondes partielles. Si V (r ) = ZZ ′e 2 / r pour une collision entre des
particules de charge Ze et Z ′e , il est facile de voir que la relation (3) de la section sur la diffusion
par un potentiel sphérique devient
(1) χ l (r ) ∝ e ± i (kr −n ln r )
Coordonnées paraboliques
Aussi longtemps que σ (θ ) pour un champ coulombien pur est tout ce qui souhaité, il est plus
simple de travailler avec la séparation de l'équation de Schrödinger en coordonnées paraboliques
qu'en coordonnées sphériques. La raison en est que la solution désirée dépend presque entièrement
de la variable ξ définie ci-dessous et pas des deux autres variables η et φ .
Les coordonnées paraboliques ξ , η et φ sont données en fonction des coordonnées sphériques par
les relations
ξ = r − z = r (1 − cosθ )
(2) η = r + z = r (1 + cosθ )
φ =φ
Les surfaces de ξ constant sont un ensemble de paraboloïdes confocaux de révolution autour de
l'axe z ou axe polaire avec le foyer à l'origine qui sont ouvert dans la direction des z positifs ou
θ = 0 . Les surfaces de η constant sont des ensembles similaires de paraboloïdes confocaux qui
s'ouvrent dans la direction des z négatifs ou θ = π . Les surfaces de φ constant sont les mêmes
qu'en coordonnées sphériques : des plans autour de l'axe polaire.
Puisque le coté gauche de (5) dépend seulement de ξ et η et le coté droit seulement de φ , les deux
cotés doivent être égaux à une constante que nous appelons m 2 . Cela donne la solution en φ
normalisée :
(6) Φ m (φ ) = (2π ) 2 e imφ
1
−
Puisque ces deux équations sont de la même forme et diffèrent seulement dans leurs termes
constants, il est suffisant d'en résoudre une.
Il est apparent que la solution n'impliquera pas φ à cause de la symétrie axiale du problème. Si
maintenant le terme e ikz de l'onde plane incidente est sorti comme facteur, il est plausible que le
reste de la solution n'implique pas η . Nous posons
(9) u c = e ikz f
où u c représente la fonction d'onde coulombienne complète (onde incidente plus diffusée).
Maintenant u c doit contenir une partie dont le comportement asymptotique dominant est de la
forme r −1e ikr mais aucune partie qui se comporte comme r −1e −ikr . Puisqu'une expression
e ikz f (r − z ) peut être de cette forme tandis qu'une expression e ikz f (r + z ) ne le peut pas, nous
anticipons que la fonction f apparaissant dans (9) dépendra seulement de ξ = r − z . Nous
substituons (2) dans (3) après avoir remplacé Z par − ZZ ′ et en nous souvenant que E > 0 .
L'équation différentielle pour f est alors
d2 f
+ (1 − ikξ )
df
(10) ξ − nkf = 0
dξ 2
dξ
La solution de (11) qui est régulière à l'origine peut être prise comme
(15) G (a, b, z ) = iW1 (a, b, z ) − iW2 (a, b, z )
Nous prendrons la solution non régulière pour les problèmes dans lesquels le champ coulombien ne
s'étend pas en r = 0.
La forme asymptotique de la fonction d'onde coulombienne peut être obtenue à partir des équations
(1), (12) et (14). Le résultat à des termes de l'ordre r −1 est
1
nπ
2 i [kz + n ln k (r − z )] n2
+ r −1 f c (θ )e i (kr − n ln 2 kr )
Ce
(16) u c → e 1 +
r →∞ Γ (1 + in )
ik (r − z )
où
1
−in ln sin 2 θ
Γ(1 + in ) e 2
f c (θ ) =
iΓ(− in ) 1
2k sin 2 θ
2
1
n −in ln sin 2 θ + iπ + 2 iη 0
(17) = e 2
1
2k sin θ 2
2
η 0 = arg Γ(1 + in )
Rappelons que la fonction arg pour un nombre complexe est définie comme φ = arg z avec
z = z e iφ .
(18)
2
ZZ ′e 2
= 2
cosec 4 12 θ
2 µv
C'est exactement la formule obtenue par Rutherford à partir de la dynamique classique et qui a été
vérifiée expérimentalement par les collisions de particules alpha (noyaux d'hélium) avec des
noyaux lourds. On notera, cependant, que la partie dépendant de l'angle du facteur de phase dans
l'amplitude diffusée f c (θ ) donnée dans l'équation (17) peut se manifester de manière non classique
quand les particules qui se heurtent sont identiques (on verra cela plus tard).
Si le flux incident est normalisé au flux unité, la constante C doit être choisie comme
1 1
− − nπ
(19) C = v Γ(1 + in )e 2 2
Alors la densité de particules en r = 0 est trouvée à partir du développement en série (13) comme
u c (0) = C = v −1 Γ(1 + in ) e − nπ
2 2 2
(21) 2nπ
=
(
v e 2πn − 1 )
Pour de petites vitesses de collision ( n >> 1 ), l'équation (21) nous dit que
2π n
u c (0 ) ≈ cas attractif, n < 0
2
v
(22)
2π n
u c (0 ) ≈ e −2 nπ cas répulsif, n > 0
2
La deuxième équation (22) a un certain intérêt pratique. L'exponentielle est le facteur dominant
dans le taux de réactions entre des noyaux positivement chargés pour des énergies de
bombardement faibles, quand le rayon nucléaire peut être supposé suffisament petit pour que les
noyaux qui se heurtent passent à travers la barrière de potentiel par effet tunnel jusqu'à la distance
2
zéro afin d'initier une réaction. Dans ce cas, E −2πZZ ′e / hv est appelé le facteur de Gamow et c'est le
terme dominant dans le taux de plusieurs réactions nucléaires pour de faibles énergies de
bombardement.
Nous posons
∞
(23) u c = ∑ Rl (r )Pl (cosθ )
l =0
où l'équation de Schrödinger radiale est
1 d 2 dRl 2 2nk l (l + 1)
(24) 2 r + k − − Rl = 0
r dr dr r r 2
C'est l'équivalent de l'équation hypergéométrique confluente (11) et elle a comme solution régulière
en r = 0
(26) f l (r ) = C l F (l + 1 + in,2l + 2,−2ikr )
La forme asymptotique de (26) peut être trouvée de (14) et donne pour la fonction d'onde radiale à
grande distance
1
nπ + iηl
Γ(2l + 2 )
sin (kr − 12 lπ − n ln 2kr + η l )
2
Cl e
(27) Rl (r ) →
r →∞(2k ) Γ(l + 1 + in )kr
l
où η l = arg Γ(l + 1 + in ) .
Les coefficients C l doivent être déterminés tel que le développement en ondes partielles (23) soit
identique avec la solution (20) en coordonnées paraboliques. A cause de l'orthogonalité des
polynômes de Legendre, nous avons la relation
2l + 1 π
(28) Rl (r ) = Pl (cosθ )u c (r ,θ )sin θdθ
2 ∫0
où u c (r ,θ ) est donné par la deuxième équation (20). L'évaluation complète de cette intégrale peut
être évitée en utilisant le fait que nous savons tout de la fonction Rl (r ) excepté le facteur
multiplicatif C l . C l peut être trouvé en faisant correspondre la forme connue de Rl (r ) de (12) près
de r = 0. C'est-à-dire
1
− nπ
(29) C l =
(2ik ) el 2
Γ(l + 1 + in )
1
v (2l )!
2
L'équation (33) peut être vérifiée en multipliant des deux cotés par Pl ′ (cosθ ) et en intégrant
sin θdθ de 0 à π et en se souvenant que l'intégrale sur la droite est effectuée sans passer par le
point θ = 0 . Nous trouvons donc que f c (θ ) s'annule effectivement à la limite n → 0 pour θ ≠ 0
mais qu'elle a une singularité de Dirac en θ = 0 telle que
θ
(34) lim ∫ 0 f c (θ ) sin θdθ = −
i
n →0 0 k
pour toute valeur finie θ 0 . L'équation (34) est facilement vérifiée par intégration directe de (17)
pourvu que la valeur de l'intégrale à la limite inférieure soit interprétée comme la moyenne de sa
valeur en ε lorsque ε → 0 . Ce comportement particulier vient du caractère longue portée du
champ coulombien. Peut importe la faiblesse de l'interaction elle force toujours les particules qui
passent à grande distance à être déviée d'un très petit angle.
Nous devons donc substituer à chaque terme F dans (30) une combinaison linéaire de F et G dans
laquelle la quantité du terme entrant W2 est inchangée. Une telle combinaison est
(35) eiδ l (F cos δ l + G sin δ l ) = W1e 2iδ l + W2
La fonction d'onde modifiée, qui est une solution de l'équation de Schrödinger sortante de
l'anomalie de potentiel, peut alors être écrite
− nπ ∞ Γ(l + 1 + in )
( )
1 1
−
(36) um = uc + v e 2 ∑
2
(2ikr )l eikr e 2iδ l − 1 W1 (l + 1 + in,2l + 2,−2ikr )Pl (cosθ )
l =0 (2l )!
La forme asymptotique de u m est
1 ∞
sin (kr − 12 lπ − n ln 2kr + ηl + δ l )Pl (cosθ )
−
(37) um → v
r →∞
2
∑ (2l + 1)i e (η δ ) (kr )
l =0
l i l+ l −1
Comme montré en relation avec la forme asymptotique de χ l dans l'analyse des potentiels
sphériques, si V est réel, chaque terme sur le coté droit de (37) doit être une fonction réelle de r
excepté pour des facteurs multiplicatifs complexes, tel que δ l soit être réel.
Les décalages de phase supplémentaires δ l peuvent être trouvés en faisant correspondre chaque
onde radiale partielle dans (36) avec la solution intérieure au bord de l'anomalie de potentiel,
exactement de la même manière que les décalages de phase furent trouvés dans l'analyse des
potentiels sphériques. Bien que les décalages de phase δ l représentaient l'écart de la fonction
d'onde à celle d'une particule libre, elles représentent ici l'écart de la fonction d'onde à celle d'une
particule diffusée par un champ coulombien pur. Le calcul de δ l dans (36) nécessite la
connaissance de G pour de petits r. Les formules ont été données par Yost, Wheeler et Breit en
1936. On peut montrer à partir de (36) que la forme asymptotique de u m peut être écrite sous la
forme (16) où f c (θ ) est remplacée par
∞
( )
(38) f m (θ ) = f c (θ ) + ∑ k −1 (2l + 1)e sin δ l Pl (cosθ )
i 2ηl +δ l
l =0
La section efficace différentielle de diffusion est juste f m (θ ) et contient en général des termes
2
Il est important de noter que ces δ l ne sont pas égaux à ceux qui seraient obtenus de l'anomalie de
potentiel en l'absence du champ coulombien.
Il est intéressant de noter que pour le champ coulombien, la limite classique est approchée pour de
petits v tandis que pour des potentiels qui ont un domaine fini a tels que ceux discutés
précédemment, la limite classique est approchée quand (a / D ) 2 >> 1 , c'est-à-dire pour de grands v.
1
Cela est dû à la "taille" ZZ ′e 2 / µv 2 du champ coulombien qui s'accroît plus rapidement que
D = h / µv lorsque v décroît.
Exercices
1. Montrez que les coefficients de diffusion par un puits de potentiel carré à une dimension sont
donnés par l'équation (7) de la section V.1 si le signe de V0 y est changé ainsi que dans
l'expression de α . Discutez de la dépendance du coefficient de transmission avec E dans ce
cas.
2. Montrez que les équations (10) et (13) de la section V.2 sont valides pour une collision binaire
générale si γ est donné par (11). Utilisez la conservation de l'énergie et de la masse.
3. Montrez que quand une particule de masse m1 entre en collision élastique avec une particule de
masse m2 qui est initialement au repos, toutes les particules éjectées (de masse m2 ) sont
diffusées dans l'hémisphère avant dans le système de coordonnées du laboratoire. Si la
distribution angulaire est à symétrie sphérique dans le système du centre de masse, quelle est-
elle pour m2 dans le système du laboratoire ?
4. Exprimez la fonction d'onde diffusée (1) de la section V.3 hors du potentiel de diffusion (mais
pas nécessairement dans la région asymptotique) comme la somme d'une onde plane et d'une
série infinie de fonctions de Hankel sphériques du premier type (voir les équations (13) de la
section IV.3). A partir de cette expression et de la discussion des équations (14) de la section
IV.3, montrez que l'onde diffusée est purement sortante même dans la région asymptotique.
5. Deux objets A et B, ont des formes irrégulières et sont identiques en taille et forme. L'objet A
est remplit avec un potentiel positif infini (impénétrable) et diffuse des particules de masse m.
L'objet B est fait de métal et a une certaine capacité électrostatique C quand il est isolé des
autres objets. Dérivez des expressions pour les sections différentielles et totales pour la
diffusion élastique de particules de masse m par l'objet A à la limite k 0 et en fonction de la
capacité C de l'objet B.
6. Trouvez une expression générale pour le décalage de phase produit par un potentiel de diffusion
V (r ) = A / r 2 , où A > 0. La section efficace totale est-elle finie ? Si non, est-ce que la
divergence se produit pour de petits angles de diffusion ou de grands angles et pourquoi ?
Quelles modifications du calcul sont nécessaires si A < 0 ? Y a-t-il des difficultés rencontrées
dans ce dernier cas ?
7. Que doit valoir V0 a 2 pour un puits de potentiel carré à trois dimensions afin que la section de
diffusion totale soit zéro à une énergie de bombardement égale à zéro (effet Ramsauer-
Townsend) ? Trouvez le terme dominant dans les expressions des sections efficaces
différentielles et totales pour de faibles énergies de bombardement. Montrez que les ondes
partielles avec l > 2 peuvent être négligées.
8. Enoncez clairement les hypothèses qui mènent à la dérivation de l'équation (40) de la section
V.3 et vérifiez que c'est une approximation appropriée pour la section efficace totale pour de
faibles énergies de bombardement quand l'onde l = 0 est en résonance.
9. Utilisez l'équation (40) de la section V.3 et le résultat du problème 5 à la fin de la section IV.3
pour obtenir une expression approchée de la section efficace totale de diffusion par un potentiel
particulier en fonction de l'énergie de bombardement E et de l'énergie de liaison ε d'une
particule dans ce potentiel, quand E et ε sont petit par rapport à V0 .
10. Calculez et tracez en, coordonnées polaire la section efficace différentielle d'une sphère
parfaitement rigide lorsque ka = 1 / 2 en utilisant les trois premières ondes partielles (l = 0, 1,
2). Quelle est la section efficace totale dans ce cas et quelle est la précision approchée de ce
résultat quand les trois termes sont utilisés ?
11. Calculez les sections efficaces élastiques de diffusion et d'absorption pour un potentiel de la
forme V (r ) = −V0 (1 + iξ ) si r < a et V (r ) = 0 si r > a. V0 et ξ sont positifs. Supposez que k et
ξ sont très petits et qu'il n'y a ni résonance ni effet de Ramsauer-Townsend. Gardez seulement
le terme dominant en k et ξ dans chaque section efficace.
12. Montrez que l'inégalité suivante est valide pour tout potentiel :
kσ
2
σ el (0) ≥ tot
4π
La quantité à gauche est la section efficace différentielle de diffusion élastique dans la direction
en avant.
13. Des protons de 200000 eV sont diffusés par de l'aluminium. L'intensité diffusée directement
vers l'arrière ( θ = 180° ) est trouvée égale à 96% de celle calculée avec la formule de
Rutherford. Supposez que cela est dû à une modification du potentiel coulombien à suffisament
courte portée pour que seule le décalage de phase l = 0 soit affecté. Cette modification est-elle
attractive ou répulsive ? Trouvez le signe et la grandeur du changement du décalage de phase
pour l = 0 produit par la modification.
VI. Formulation matricielle
Dans les chapitres précédents, l'équation d'onde de Schrödinger a été développée et ses solutions
obtenues dans un certain nombre de cas physiquement intéressants. Nous allons maintenant revenir
à la formulation de la mécanique quantique que nous avons partiellement utilisée au début avec la
forme matricielle, par exemple de l'hamiltonien, mais que nous allons développer de manière plus
formelle et plus systématique.
Dans cette formulation, les variables telles que les coordonnées, les composantes de l'impulsion et
l'énergie d'une particule apparaissent explicitement dans les équations du mouvement du système
sans devoir les multiplier ou différentier une fonction d'onde. Les équations classiques ont
exactement cette structure et ainsi on peut s'attendre à ce qu'il y ait une plus grande ressemblance
entre le formalisme classique et quantique ici que dans la théorie de Schrödinger.
C'est réellement le cas. La principale différence formelle est que les variables dynamiques
quantiques n'obéissent pas à la loi commutative de la multiplication. Il est pratique de représenter
de telles variables dynamiques non commutatives, qui sont souvent simplement appelées
opérateurs, comme des matrices. La théorie matricielle fournit un schéma de représentation
particulièrement flexible puisqu'il y a un nombre arbitrairement grand de manières de choisir les
lignes et les colonnes d'une matrice, toutes étant également valides.
C'est suite à cette ressemblance formelle entre la mécanique quantique matricielle et la dynamique
classique que la mécanique quantique matricielle fut historiquement la première formulation de la
théorie quantique à être découverte, par Heisenberg en 1925.
La relation entre la mécanique quantique matricielle et l'équation de Schrödinger fut établie par
Schrödinger et Eckart en 1926.
Dans ce chapitre, nous allons d'abord rappeler brièvement les plus importantes propriétés des
matrices puis montrer leur relation avec la théorie quantique et leur utilité dans des problèmes
particuliers.
VI.1. Algèbre matricielle
Nous allons restreindre notre discussion d'abord aux matrices qui ont un nombre fini de lignes et de
colonnes puis nous indiquerons comment les résultats obtenus peuvent être étendus aux matrices
qui ont un nombre infini de lignes et de colonnes.
Une matrice peut multiplier à gauche une matrice B si le nombre de colonnes de A est égal au
nombre de lignes de B. Alors, la matrice produit C a le nombre de lignes de A et le nombre de
colonnes de B.
(3) C = AB C kl = ∑ Akm Bml
m
où la sommation se fait sur l'indice m qui indique les colonnes de A et les lignes de B. Il suit
directement de (2) et (3) que la loi de distributivité de la multiplication est valide
(4) A(B + C ) = AB + AC
Il est clair, en voyant (3) que AB n'est, en général, pas égal à BA . Donc la loi de commutativité de
la multiplication n'est généralement pas valide.
Le produit d'un nombre c et d'une matrice A est la matrice cA qui est obtenue en multipliant
chaque élément de A par c. Donc, si nous définissons une matrice constante C comme un multiple
de la matrice unité tel que chaque élément non nul est c au lieu de l'unité, alors
(9) cA = CA C kl = cδ kl
Il est facile de montrer, avec l'aide de (3), que la trace possède la propriété cyclique
(11) tr ( ABC L EF ) = tr (BC L EFA)
La déterminant d'une matrice carrée, noté det ( A) , est trouvé par la méthode habituelle de calcul de
déterminant d'un tableau carré de nombre. Nous ne le détaillerons pas ici. Si A et B sont carrés et
de même rang, alors
(12) det ( AB ) = det ( A) ⋅ det (B )
Une matrice peut ou non posséder une inverse A −1 qui est définie par les relations
(13) AA −1 = 1 A −1 A = 1
A est dite non singulière si elle possède une inverse et singulière sinon. Si A est non singulière et
de rang fini, on peut montrer qu'elle est carrée et qu'une des deux équations (13) implique l'autre.
L'élément kl de A −1 est juste le cofacteur de Akl divisé par det ( A) . Donc, A est singulière si son
déterminant s'annule. On vérifie facilement que pour des matrices non singulières A, B, C
(14) ( ABC ) = C −1 B −1 A −1
−1
On vérifie facilement que l'adjoint hermitique du produit d'une série de matrices est le produit de
leurs adjoints dans l'ordre inverse :
(16) ( ABC ) = C + B + A +
+
Une matrice est hermitique ou auto adjointe si elle est égale à son adjoint hermitique. Donc, H est
hermitique si
(17) H = H +
Une matrice est unitaire si son adjoint hermitique est égal à son inverse. Donc, U est une matrice
unitaire si
(18) U + = U −1 ou si UU + = 1 et U +U = 1
Les matrices unitaires de rang fini doivent être carrées et l'une des deux dernières relations dans
(18) entraîne l'autre.
La forme d'une équation matricielle est inaffectée par une transformation. Donc, l'équation
(20) AB + CDE = F
peut être transformée en
(21) SABS −1 + SCDES −1 = SFS −1
ce qui est équivalent à
(22) SAS −1 SBS −1 + SCS −1 SDS −1 SES −1 = SFS −1
ou
(23) A′B ′ + C ′D ′E ′ = F ′
où l'apostrophe désigne les matrices transformées. Cette invariance des équations matricielles par
rapport aux transformations rend possible de travailler avec toute transformation pratique d'un
ensemble de matrices sans affecter la validité de tout résultat obtenu. On notera aussi que tr ( A) et
det ( A) sont inchangés par une transformation.
Une matrice carrée est diagonale si elle a des éléments non nuls seulement le long de sa diagonale
principale (k = l). Les éléments diagonaux sont alors appelés les valeurs propres de la matrice. Il
est facile de voir que la puissance nième d'une matrice diagonale est aussi diagonale et a comme
valeurs propres les puissances nième des valeurs propres de la matrice originale. La matrice A dans
(19) est dite diagonalisée par la matrice S si la matrice A′ qui résulte de la transformation est
diagonale, tel que Akl′ = Ak′ δ kl . Pour trouver A′ explicitement, multiplions (19) à droite par S, où
nous supposons qu'un tel S existe.
(24) SA = A′S
L'ensemble des équations algébriques qui sont obtenues en écrivant les éléments de (24) pour une
ligne particulière k et toute colonne l est
(25) ∑ S km Aml = Ak′ S kl ou ∑ S km ( Aml − Ak′ δ ml ) = 0
m m
où Ak′ est une valeur propre particulière de A′ et l'indice m est supposé aller de un jusqu'au rang N
de la matrice A.
(25) peut être vu comme un ensemble de N équations algébriques homogènes pour les éléments de
matrice S km où k est fixé. La condition nécessaire et suffisante pour que ces équations aient une
solution est que le déterminant de leurs coefficients s'annule ou que le déterminant de la matrice
carrée ( Aml − Ak′ δ ml ) soit zéro. Cela fournit une équation algébrique simple appelée équation
séculaire, qui est d'ordre N et a N racines Ak′ . Donc, les valeurs propres de la matrice diagonale A′
résultant de A par transformation sont les mêmes quelle que soit la manière dont A est
diagonalisée, excepté peut-être pour l'ordre dans lequel elles sont arrangées. Pour cette raison elles
sont aussi appelées les valeurs propres de la matrice originale A non diagonale. On parle aussi, pour
l'ensemble des valeurs propres, du spectre. A′ et A sont dits dégénérées quand deux ou plusieurs
valeurs propres sont égales.
Il n'est pas difficile de voir qu'en général les équations qui impliquent à la fois A et A + ne sont pas
invariantes par rapport à une transformation sauf si la matrice S de transformation est unitaire.
Fonctions de matrices
Une fonction d'une matrice peut souvent être définie avec un développement en série. Donc, si
f ( z ) est un polynôme en le nombre z, alors f ( A) est le même polynôme en la matrice A. Avec des
séries infinies, on doit faire attention à la convergence. Il est évident que, si A peut être diagonalisé
et est mis sous sa forme diagonale A′ = SAS −1 , alors S transforme aussi f ( A) en la forme
diagonale f ( A′) et la kième valeur propre de f ( A′) est simplement f ( Ak′ ) . Donc, si le
développement en série f ( z ) converge quand z est égal à chaque valeur propre de A, le
développement en série S −1 f ( A′)S = f ( A) est bien défini. Cette dernière forme peut fournir une
définition utile de f ( A) même quand f ( z ) ne peut pas être représenté par un développement en
série.
Les fonctions exponentielles et trigonométriques des matrices peuvent être représentées par des
développements en séries qui convergent pour toute valeur finie de leurs arguments et donc son
( )
bien définie. Il est facile de voir, par exemple, que e A
+ +
= e A et ainsi e iH est unitaire si H est
hermitique.
En mécanique quantique, nous sommes concernés principalement par les matrices hermitiques et
unitaires, surtout de rang infini. Un théorème fondamental que nous supposerons sans preuve est
que toute matrice hermitique peut être diagonalisée par une transformation unitaire. Un corollaire
de ce théorème est que les valeurs propres résultantes de la matrice hermitique sont uniques,
excepté peut-être pour l'ordre dans lequel elles sont arrangées. En partant de ce théorème, il n'est
pas difficile de montrer que la condition nécessaire et suffisante pour que deux matrices
hermitiques puissent être diagonalisées par la même transformation unitaire est qu'elles commutent
(les matrices A et B commutent si AB = BA ).
Il suit aussi de ce théorème que les valeurs propres d'une matrice hermitique sont réelles. Si le S et
le A dans (19) sont unitaires et hermitiques, respectivement, cette équation peut être récrite
(27) SAS + = A′
Puisque A′ + = A′ , cela montre que la propriété d'hermiticité est maintenue durant les
transformations par une matrice unitaire. Si A′ est diagonale et hermitique, il suit de (15) que ses
valeurs propres sont réelles. Il est facile de voir que l'inverse est aussi vrai : une matrice qui peut
être diagonalisée par une transformation unitaire et qui a des valeurs propres réelles est hermitique.
Il est important de noter avec les matrices de rang infini que les deux équations (13) doivent être
valides pour que A −1 soit l'inverse de A. De même, les deux équations (18) doivent être valides
pour que U soit unitaire.
VI.2. Théorie des transformations
L'apparition des matrices en mécanique quantique peut être reliée d'une manière simple avec la
solution de l'équation de Schrödinger. Dans cette section, nous adoptons la notation hamiltonienne
et nous la justifierons en détail dans la section suivante. Nous récrivons la fonction de Schrödinger
comme
(1) Hu k (r ) = E k u k (r )
où l'indice k indique les différents membres de l'ensemble complet orthonormal de fonctions
propres de l'énergie u k (r ) et leurs valeurs propres correspondantes E k . k spécifie l'énergie et
distingue aussi les fonctions propres dégénérées. Elle inclut donc à la fois E et s, comme nous
l'avions vu. Par exemple, k représente k x , k y et k z , dans le cas des ondes planes et n x , n y et n z
dans le cas des fonctions propres de l'oscillateur harmonique à trois dimensions.
de son domaine. Nous utiliserons aussi l'accent circonflexe quand il semblera désirable de
distinguer entre un opérateur comme (2) et sa matrice équivalente.
Matrice unitaire W
Supposons que nous ayons un deuxième ensemble orthonormal complet de fonctions v µ (r ) qui
sont fonctions propres d'un certain opérateur Ω avec les valeurs propres réelles ω µ :
(3) Ωv µ (r ) = ω µ v µ (r )
Ω peut, par exemple, être l'opérateur impulsion ou l'hamiltonien pour un certain potentiel différent
de celui dans (2). Les v µ peuvent être développés en fonction des u k avec les coefficients de
développement wkµ :
(4) v µ (r ) = Sw k kµ u k (r )
Les deux cotés de cette équation peuvent être multipliés par u k∗ (r ) et intégrés pour obtenir
(5) wkµ = ∫ u k∗ (r )v µ (r )d 3 r
La complétude de l'ensemble u k a été utilisée pour obtenir (4) et son orthonormalité pour obtenir
(5). De même, u k peut être développé en fonction des v µ :
(6) u k (r ) = S µ wk∗µ v µ (r )
Nous pouvons montrer que la matrice W, dont les wkµ sont les éléments, est unitaire en calculant
un élément de matrice typique de WW + :
(WW ) +
kl = S µ wkµ wl∗µ = S ∫u
µ
∗
k (r )v µ (r )d 3 r ∫ v µ∗ (r ′)u l (r ′)d 3 r ′
(7)
= ∫∫ u k∗ (r )δ 3 (r − r ′)u l (r ′)d 3 rd 3 r ′ = ∫ u k∗ (r )u l (r )d 3 r
Nous avons utilisé ici la propriété de fermeture de tout ensemble orthonormal complet de fonctions
qui a la forme ici
(8) S v (r )v µ∗ (r ′) = δ 3 (r − r ′)
µ µ
La dernière intégrale sur le coté droit de (7) est ou un symbole de Kronecker ou une fonction de
Dirac selon que k est un ensemble discret ou continu d'indices. Dans tous les cas, cette intégrale est
équivalente à un élément de la matrice unité et ainsi WW + = 1 . De même, on peut établir que
(
(9) W +W )
µν = Sw k
∗
kµ wkν = (1)µν
Transformation de l'hamiltonien avec W
Nous avons montré que W est une matrice unitaire qui relie deux ensembles de fonctions u k et v µ .
Elle peut aussi être utilisée pour transformer la matrice hamiltonienne H ′ que nous définissons par
ses éléments de matrice
(10) H kl′ = ∫ u k∗ (r )Hˆ u l (r )d 3 r = E k δ kl ou E k δ (k − l )
où Ĥ est l'opérateur différentiel (2). Nous avons utilisé ici (1) pour montrer que H ′ est sous forme
diagonale avec les éléments diagonaux qui sont les valeurs propres de l'énergie E k . Une autre
matrice hamiltonienne H ′′ peut être construire en utilisant les fonctions v µ :
′′ = ∫ v µ∗ (r )Hˆ vν (r )d 3 r
(11) H µν
Cela peut être écrit dans l'utilisation explicite des indices sous forme d'équation matricielle
(15) WH ′′W + = H ′
Donc, nous voyons que W est la matrice unitaire qui transforme la matrice non diagonale H ′′ en la
forme diagonale H ′ . W + transforme aussi H ′ en H ′′ .
Une autre manière de décrire ce qui a été fait jusqu'ici est de dire que le processus de résolution de
l'équation de Schrödinger (1) est complètement équivalent au processus de diagonalisation d'une
matrice particulière. La matrice H ′′ peut être calculée à partir de l'opérateur Ĥ (2) en utilisant un
ensemble orthonormal complet quelconque de fonctions v µ (r ) qui s'avère pratique. Si sa
diagonalisation peut être effectuée, à la fois la forme diagonale H ′ , qui consiste en les valeurs
propres E k , et la matrice de transformation W sont obtenus dans le processus. Une fois W connu,
les fonctions propres u k (r ) peuvent être obtenues en utilisant (6).
Il est intéressant de noter que W n'est pas nécessairement une matrice carrée. C'est-à-dire que ces
lignes et colonnes peuvent être indicées différemment. Par exemple, les fonctions u k peuvent être
les fonctions propres d'un oscillateur harmonique à trois dimensions qui forment un ensemble
discret complet et les fonctions v µ peuvent être les fonctions propres de l'impulsion, qui forment un
ensemble entièrement continu. Cependant, les matrices hamiltoniennes H ′ et H ′′ sont toutes les
deux carrées.
Il est évident que H ′ et H ′′ sont hermitiques puisque leurs valeurs propres sont réelles. La
discussion que nous avons eue sur les valeurs propres de tout opérateur disaient qu'elles
représentent une quantité physiquement mesurable. Elles sont donc réelles puisque ce sont les seuls
résultats de mesures précises de ces quantités. Donc une variable dynamique qui est physiquement
mesurable est représentée par une matrice hermitique quand elle est sous forme diagonale. Il suit
alors de la discussion de la section précédente que toute transformation unitaire de cette matrice est
aussi hermitique.
Cette équation peut être écrite HU + = U + H ′ qui devient, lorsqu'elle est exprimée en éléments de
matrice, (HU + )rk = (U + H ′)rk ou
(19) S r′ H rr′ (U + )r′k = S (U ) l
+
rl H lk′
où Ĥ opère sur la dépendance en r de (U + )rk . Le coté droit de (19) peut être récrit en utilisant (10),
il devient (U + )rk E k . Donc (19) est équivalent à
( )
(21) Hˆ U + = E U + rk k ( ) rk
La comparaison avec l'équation de Schrödinger (1) montre que (U + )rk doit être identifié avec la
fonction propre de l'énergie u k (r ) .
Dans ce cas particulier, U transforme H en H ′ en accord avec (18). Il est facilement vérifié que U
est, en fait, unitaire. Par exemple,
(
(23) UU + )kl = S U (U ) = ∫ u
r kr
+
rl
∗
k (r )u l (r )d 3 r = (1)kl
par orthonormalité et
(24) (U +U )rr′ = S (U )
k
+
rk U kr ′ = Su k k (r )u k∗ (r ′) = (1)rr′
par fermeture.
Les éléments de matrice µν des deux cotés de cette équation sont précisément les deux cotés de
(11).
La matrice H peut être éliminée entre les équations (18) et (26) comme suit :
H = V + H ′′V
(27)
H ′ = UHU + = UV + H ′′VU +
∫ [∫ (Ω ) ]
∗
(36) +
r ′r ψ α (r )d 3 r ψ β (r ′)d 3 r ′
où (Ω + )r′r = Ω ∗r ′r sont les éléments r ′ , r de la matrice Ω + qui est l'adjoint hermitique de Ω .
L'équation (31) peut aussi être utilisée pour définit l'opérateur adjoint hermitique Ω̂ + en accord
avec
ˆ +ψ (r ) = (Ω + ) ′ψ (r ′)d 3 r ′
(37) Ω α ∫ rr α
Donc, (35) peut être récrit
[ ] [
(38) ∫ψ α∗ (r ) Ω opψ β (r ) d 3 r = ∫ Ω op
+
]
ψ α (r ) ψ β (r )d 3r
∗
L'équation (38) est quelque fois utile puisqu'une intégrale de ce type peut être plus facilement
évaluée quand Ω̂ opère sur une des fonctions ψ α , ψ β plutôt que sur l'autre. Les intégrations par
parties que nous avons utilisées sont des exemples de l'application de (38). Dans ces exemples, Ω̂
est un opérateur différentiel et sa représentation coordonnées implique des dérivées de δ 3 (r − r ′) .
Cependant, Ω̂ n'a pas besoin d'être de ce type spécialisé mais peut avoir des éléments de matrice
non nuls pour r − r ′ fini. En tout cas, si Ω̂ représente une variable dynamique physiquement
mesurable, il doit être hermitique, auquel cas Ω̂ + peut être remplace par Ω̂ sur le coté droit de
(38).
Une propriété importante des transformations unitaires est qu'elles laissent la norme d'une fonction
d'état inchangée. Dans la représentation coordonnées, la norme est juste l'intégrale de normalisation
qui peut être écrite comme
(45) ∫ψ α∗ (r )ψ α (r )d 3 r = Sψ
r
∗
α (r )ψ α (r ) = ψ α+ψ α
Le coté droit est le produit matriciel d'une matrice ligne ψ α+ , qui est l'adjoint hermitique de ψ α et a
ses colonnes indicées par la coordonnée r, et la matrice colonne ψ α . Le résultat est une matrice
avec une ligne et une colonne, qui est simplement un nombre. Il est évident que la norme est réelle
et non négative. Avec l'aide de (41), la norme peut être écrite
(46) ψ α+ψ α = aα+UU + aα = aα+ aα
S
qui est égal à k aαk . De même, ψ α+ψ α = bα+ bα , ainsi les trois représentations de la fonction d'état
2
ont la même norme. Une fonction d'état pour laquelle la norme existe (c'est-à-dire, n'est pas infinie)
( )
1
peut être normalisée en la divisant par ψ α+ψ α 2 , auquel cas sa norme devient égale à l'unité.
Il est intéressant de noter que l'identité (38) devient trivialement valide quand elle est récrite dans la
représentation matricielle coordonnées des fonctions d'états ψ α et ψ β :
(
(46) ψ α+ Ωψ β = Ω +ψ α ψ β)
+
L'équation (22) montre que les deux cotés sont identiques. La structure du produit matriciel est tel
que chaque coté est une matrice avec une ligne et une colonne et donc un nombre.
Espace de Hilbert
Une image géométrique qui est souvent utilisé considère une fonction d'état telle que ψ α , aα ou
bα comme un vecteur d'état dans un espace de Hilbert avec une infinité de dimensions. Chaque
dimension correspond à une des lignes de la matrice colonne qui décrit l'état et la composante du
vecteur d'état le long de cet axe de l'espace de Hilbert est numériquement égale à l'élément de
matrice correspondant. Différents choix pour l'orientation des axes dans l'espace de Hilbert
correspondent à différents choix pour la représentation. Par exemple, la représentation énergie
correspond à choisir les axes de telle manière qu'un vecteur d'état orienté le long d'un de ces axes
est un état propre de l'hamiltonien. Plus généralement, le vecteur aα a la composante aαk le long de
l'axe qui est rattaché à la valeur propre de l'énergie E k .
La norme d'une fonction d'état est juste le carré de la longueur du vecteur d'état correspondant dans
l'espace de Hilbert, où "longueur" est généralisé de manière appropriée pour prendre en compte les
composantes qui peuvent être des nombres complexes. La norme est un cas particulier du produit
scalaire de deux vecteurs d'état ψ α et ψ β défini comme
(47) (ψ α ,ψ β ) = ψ α+ψ β = ∫ψ α∗ (r )ψ β (r )d 3 r
et est aussi un nombre. Quand α et β sont le même état, il est égal à la norme. Quand le produit
scalaire s'annule, les vecteurs d'état sont dits orthogonaux. Les produits scalaires de ces vecteurs
d'états, exprimés dans les représentations énergie et Ω , sont
(48) (aα , a β ) = aα+ a β et (bα , bβ ) = bα+ bβ
respectivement. On voit sur (41) et (43) que le produit scalaire est indépendant de la représentation,
tout comme la norme. Il s'ensuit qu'une transformation d'une représentation à l'autre correspond à
une rotation des axes dans l'espace de Hilbert sans changer les vecteurs d'états. Un vecteur d'état
particulier a différentes composantes quand on le rapporte à des axes différents et ils constituent les
représentations différentes de l'état.
Il s'ensuit que l'opération sur ψ β avec Ω̂ effectue une transformation du vecteur d'état ψ β tel qu'il
devient un autre vecteur d'état Ωψ β . Nous nous référons à cette transformation comme une
rotation généralisée du vecteur d'état dans l'espace de Hilbert, le mot "généralisé" indiquant que la
rotation peut impliquer une dilatation ou une contraction des composantes aussi bien qu'une
rotation "pure". En particulier, la rotation généralisée ne conserve habituellement pas la norme du
vecteur d'état. L'élément de matrice ψ α+ Ωψ β = (ψ α , Ωψ β ) est alors le produit scalaire des vecteurs
d'état ψ α et Ωψ β . Il est facile de voir qu'il est indépendant de la représentation.
Nous décrivons une fonction d'état ou vecteur d'état, qu'il soit représenté par ψ α , aα ou bα , par le
ket α et l'état adjoint hermitique ψ α+ , aα+ ou bα+ par le bra α . Le produit scalaire de deux
vecteurs d'états est écrit
(49) ψ α+ψ β = α β
qui est un nombre.
Opération sur un vecteur ket à gauche avec Ω produit un autre vecteur ket
(50) Ω β = β ′
et l'opération sur un vecteur bra à droite avec Ω produit un autre vecteur bra
(51) α Ω = α ′′
L'élément de matrice de Ω entre les états α et β est un nombre et être écrit sous plusieurs formes
équivalentes
[ ]
Ωαβ = ∫ψ α∗ (r )Ωψ β (r )d 3 r = ∫ Ω +ψ α (r ) ψ β (r )d 3 r
∗
(
(52) = (ψ α , Ωψ β ) = Ω +ψ α ,ψ β )
= α β ′ = α ′′ β = α Ω β
La première et la dernière sont les notations utilisées le plus fréquemment. Les éléments de matrice
de l'opérateur adjoint hermitique Ω + sont donnés par
(53) (Ω + )βα = Ωαβ
∗
∗
= β Ω+ α = α Ω β
Un exemple particulier des équations (50) et (52) est celui où Ω est l'opérateur unité :
(54) α 1 β = α β
Ces équations peuvent être utilisées pour obtenir une expression pour la matrice unitaire W de (5)
en identifiant ψ α avec u k et ψ β avec v µ :
∗
(55) wkµ = k µ = µ k
Nous sommes maintenant en position de récrire les principales équations de cette section dans les
notations de Dirac et ainsi de clôturer définitivement la relation entre toutes les notations que nous
avons utilisées. Nos trois représentations seront spécifiées par les trois ensembles complets de kets
k , µ et r . Tout comme k est un état propre de l'énergie avec la valeur propre E k et µ un
état propre de Ω avec la valeur propre ω µ , r est un état propre des coordonnées avec la valeur
propre r. Alors, en analogie avec (52), (22) peut être écrit sous les formes
(56) k r = u k∗ (r ) et r k = u k (r )
Une convention de sommation sera employée tel que tout symbole d'état qui apparaît deux fois
dans une expression données (une fois dans le ket et une fois dans le bra) est supposé être sommé
sur un ensemble complet orthonormal d'états. Donc, le symbole S µ sera omis des expressions de
la forme
(59) S µ Lµ µL
C'est une convention semblable à la convention de sommation d'Einstein sur la sommation sur les
indices muets dans les expressions vectorielles et tensorielles.
Les équations récrites ci-dessous sont numérotées avec des apostrophes sur leur numérotation
originale.
(3') Ω µ = ω µ µ ou r Ω r ′ r ′ µ = ω µ r µ
(4') µ = k k µ ou r µ = r k = k µ
(5') k µ = k r r µ
(6') k = µ µ k ou r k = r µ µ k
(7') k µ µ l = k r r l = k l
(8') r µ µ r ′ = r r ′
(9') µ k k ν = µ ν
(10') h H l = E k k l
(15') k µ µ H ν ν l = k H l
(19') r H r ′ r ′ k = r l l H k
(26') µ r r H r ′ r ′ ν = µ H ν
(28') k µ = k r r µ
(39') r α = r k k α
(40') k α = k r r α
(43') r α = r µ µ α et µ α = µ r r α
(47') α β = α r r β
A l'exception des équations (3') et (10') qui sont des équations aux valeurs propres pour Ω et H,
respectivement, toutes ces équations ont une propriété en commun. Si nous supposons qu'un
symbole répété (k, µ ou r), qui est sous-entendu sommé sur un ensemble orthonormal complet
d'états comme dans (59), est équivalent à l'opérateur unité, ces équations deviennent des identités
triviales. Par exemple, chacun des deux cotés de (15') devient égal à r H k puisque r ′ r ′ et
l l peut être remplacé par des opérateurs unités sur les cotés gauches et droits, respectivement.
Nous avions déjà vu cette propriété. Ce replacement est évidemment équivalent à l'utilisation de la
propriété de fermeture de tout ensemble complet orthonormal de fonctions. Inversement, des
opérateurs unités peuvent toujours être insérés, comme lorsque l'on passe du coté gauche au coté
droit de (4'). La preuve la plus simple de l'exactitude de ces hypothèses est l'observation que la
suppression ou l'insertion de tels symboles d'états répétés conduit toujours à des équations valides.
Notons qu'une insertion peut aussi être faite entre deux opérateurs. Par exemple,
(60) ΩΓ = Ω k k Γ
Opérateurs projection
Considérons l'équation
(61) α = S µ µ µ α = S µ Pµ α
où l'opérateur Pµ est définit par
(62) Pµ ≡ µ µ
pour un état unique µ , c'est-à-dire sans effectuer la sommation généralisée. Il est clair en voyant
(3') que Pµ α est un état propre de Ω avec la valeur propre ω µ . Donc, un ket arbitraire α peut
être écrit comme une somme généralisée des états propres de tout opérateur Ω avec (61).
L'opérateur Pµ est appelé opérateur de projection puisqu'il projette α sur la partie qui est un état
propre particulier de Ω .
Supposons maintenant que Ω a seulement deux valeurs propres distinctes ω1 et ω 2 avec une très
grande dégénérescence. En exemple peut être l'opérateur parité avec les valeurs propres ± 1 ou la
composante du moment angulaire de spin d'une particule de spin 1/2 avec les valeurs propres ± 12 h
(voir le tome suivant). Dans une telle situation, il est quelquefois souhaitable d'écrire tout état α
comme une somme de deux parties, chacune étant un état propre de Ω avec les valeurs propres ω1
et ω 2 . Cela peut être obtenu en définissant les opérateurs projection par les équations
(63) Pi ≡ S µ = µi Pµ
avec i = 1, 2, au lieu de (62). Alors Pi α est un état propre de Ω avec la valeur propre ω i . On
vérifie facilement que
Ω −ω2 Ω − ω1
(64) P1 = et P2 =
ω1 − ω 2 ω 2 − ω1
et que
(65) ∑ Pi = 1 Pi Pj = δ ij Pi
i
Les équations (63) peuvent être généralisées à des situations où Ω a plus de deux valeurs propres
distinctes. Avec la définition (63), nous avons maintenant
Ω −ω j
(66) Pi = ∏
j ≠1 ω i − ω j
Puisque Ω est hermitique, ses valeurs propres ω µ sont réelles et les Pµ et Pi sont évidemment
hermitiques. Finalement, il est facile de voir que tr (Pµ ) = 1 si µ est un état propre normalisé qui
correspond à une valeur propre discrète. Dans ce cas tr (Pi ) est égal au nombre d'états propres
linéairement indépendant qui ont la valeur propre ω i . Donc, il est égal aux nombres de dimensions
du sous-espace de Hilbert qui correspond à ω i .
Jusqu'ici, nous n'avons pas d'interprétation simple des éléments non diagonaux tels que α Ω β .
Nous verrons plus tard qu'ils sont, entre autres choses, reliés aux probabilités de transition entre
états.
VI.3. Equations du mouvement
La théorie des transformations développée dans la section précédente ne fait pas référence à la
dynamique. Elle traite de la description d'un système physique à un instant du temps. Cette
description implique trois sortes d'objets. Tout d'abord, il y a ceux qui spécifient l'état du système à
un moment particulier. Ils peuvent être écrits comme des fonctions d'état ψ α (r ) , comme des
matrices colonnes ψ α , aα ou bα , comme des vecteurs de l'espace de Hilbert ou comme des kets
α . A chacun correspond une quantité adjointe hermitique tel que ψ α+ ou α . Ensuite, il y a les
transformations unitaires qui peuvent être écrites comme des matrices rectangulaires tel que U et
dont les éléments sont les expressions k r . Leur effet est de changer une représentation en une
autre. Du point de vue de l'espace de Hilbert, elles tournent les axes sans changer les vecteurs
d'états de manière à ce qu'un vecteur d'état particulier se rapporte à un ensemble différent d'axes.
Les troisièmes, ce sont les variables dynamiques, tel que Ω , qui peuvent être écrites comme des
opérateurs ou des matrices carrées. Les éléments de ces matrices peuvent être calculés par rapport à
un ensemble d'axes particuliers dans l'espace de Hilbert et une matrice unitaire transforme leurs
valeurs d'un ensemble d'axes ou représentation à un autre. Donc, U transforme Ω de la
représentation coordonnées r Ω r ′ à la représentation énergie k Ω l , tout comme elle transforme
α de la représentation coordonnées r α à la représentation énergie k α .
De manière alternative, les éléments de matrice de Ω peuvent être calculés par rapport à des
vecteurs d'état particuliers ψ α , qui n'ont pas besoin d'être les membres d'un ensemble complet. Ces
éléments de matrice sont le produit scalaire (ψ α , Ωψ β ) = α Ω β et ils sont invariants par rapport
aux transformations unitaires (choix des axes dans l'espace de Hilbert). Le résultat de l'opération
avec Ω sur un ket β est un nouveau ket Ω β qui est relié à β par une rotation généralisée du
vecteur d'état dans l'espace de Hilbert. Si β est un état propre µ de Ω , alors la "rotation"
consiste simplement à multiplier le vecteur d'état par ω µ sans changer sa direction.
Une distinction doit être faite entre les rotations des axes dans l'espace de Hilbert sans changer les
vecteurs d'états, qui sont produit par les transformations unitaires, et les rotations généralisées des
vecteurs d'états sans changer les axes, qui sont produites par les variables dynamiques.
Nous allons considérer dans cette section la manière avec laquelle un système physique change d'un
instant à l'autre. Comme nous le verrons, cette dépendance au temps peut être vue de différentes
manières comme un changement dans les vecteurs d'états, dans les variables dynamiques ou les
deux. Il s'avère qu'il y a un point de vue qui met les équations du mouvement sous une forme très
similaire à celle des équations classiques du mouvement dans leur formulation hamiltonienne. Cette
similarité suggère une méthode assez générale pour trouver les équations quantiques qui sont en
accord sous une limite appropriée avec les équations classiques du même système.
α S (t ) = H α S (t )
d
(1) ih
dt
La dérivée totale par rapport au temps est utilisée ici puisque la dépendance du ket par rapport aux
coordonnées ou d'autres variables n'apparaît pas explicitement. L'indice S se rapporte au ket vu
dans le point de vue de Schrödinger, selon lequel il varie dans le temps conformément à l'équation
différentielle ordinaire (1). L'équation adjointe hermitique du mouvement est
α S (t ) = α S (t ) H + = α S (t ) H
d
(2) − ih
dr
puisque H est hermitique.
Les solutions des équations différentielles (1) et (2) sont faciles à trouver si H est indépendant du
temps, ce que nous supposerons être le cas :
(3) α S (t ) = e − iHt / h α S (0) α S (t ) = α S (0) e iHt / h
Le fait que les équations différentielles dérivent de (3) peut être vérifié en développant les
exponentielles en séries et en différentiant terme à terme.
L'opérateur e − iHt / h est une somme infinie de puissances de H, chacune étant une variable
dynamique qui peut être écrite comme un opérateur ou une matrice carrée. Donc, la série entière est
aussi une variable dynamique. Dans ce cas particulier, on voit facilement qu'elle est unitaire
puisque H est hermitique. Cependant, il est essentiel de se souvenir que e − iHt / h n'est pas une
transformation unitaire dans le même sens que U, V ou W. Elle ne passe pas d'une représentation à
une autre (rotation des axes dans l'espace de Hilbert) mais change plutôt le ket α S (0) en le ket
α S (t ) et effectue ainsi une rotation généralisée du vecteur d'état dans l'espace de Hilbert.
Cependant, puisque e − iHt / h est unitaire, la norme du ket est inchangée et la rotation généralisée est
dans cas une rotation pure.
Le taux de changement dans le temps d'un élément de matrice d'une variable dynamique Ω S dans
le point de vue de Schrödinger est facile à trouver avec l'aide de (1) et (2) :
α S (t ) Ω S β S (t )
d
dt
d ∂Ω d
(4) = α S (t ) Ω S β S (t ) + α S (t ) β S (t ) + α S (t ) Ω S β S (t )
dt ∂t dt
∂Ω
= α S (t ) β S (t ) + α S (t )(Ω S H − HΩ S ) β S (t )
1
∂t ih
Le premier terme sur le coté droit est la partie du changement dans l'élément de matrice qui vient de
la dépendance explicite de Ω S avec le temps et le second terme est celui causé par le changement
dans le temps des vecteurs d'états. L'opérateur qui apparaît dans le second terme est appelé un
commutateur et est défini par
(5) [ A, B ] ≡ AB − BA
Notons qu'en accord avec les définitions de la formulation matricielle, le commutateur n'a pas de
signification à moins que les deux matrices ne soient carrées et avec les lignes et colonnes indicées
de la même manière.
Un cas particulier intéressant de (4) est celui où Ω S commute avec H et n'a pas de dépendance
explicite avec le temps. Alors, le coté droit est zéro et tous les éléments de matrice de Ω S sont
constants dans le temps. Une telle variable dynamique est dite être une constante du mouvement.
Puisque α H (t ) ne dépend pas du temps, la mention explicite de t peut être omise. De plus, la
dérivée par rapport au temps sur le coté gauche de (6) peut être mise dans l'élément de matrice et
l'équation devient ainsi
∂Ω H
β H + α H [Ω H , H ] β H
d 1
(9) α H ΩH β H = α H
dt ∂t ih
où selon (8) nous avons défini
∂Ω H ∂Ω iHt / h ∂Ω S
(10) ≡ =e e −iHt / h
∂t ∂t H ∂t
Puisque (9) est valide pour des bras et des kets arbitraires, elle doit être valide pour les opérateurs
eux-mêmes. Nous sommes donc conduit à l'équation du mouvement vue dans le point de vue de
Heisenberg :
dΩ H ∂Ω H 1
(11) = + [Ω H , H ]
dt ∂t ih
Cette équation qui suit aussi directement de la différentiation de (8) est celle qui est la plus proche
de l'équation correspondante du mouvement, comme nous le verrons ci-dessous. On notera que
selon (8) H est le même dans les points de vue de Schrödinger et de Heisenberg.
Nous voyons donc que la description du changement dans le temps d'un système physique peut être
vue de deux manières opposées. Dans le point de vue de Schrödinger, les variables dynamiques
sont constantes dans le temps (sauf éventuelle dépendance explicite avec le temps) et les vecteurs
d'états varient selon (1). Dans le point de vue de Heisenberg les vecteurs d'états sont constants dans
le temps et les variables dynamiques varient selon (11). La transformation d'un point de vue à
l'autre se fait avec l'aide de la variable dynamique e ± iHt / h selon (7) et (8).
Nous avons délibérément évité d'appeler ces "points de vue" des "représentations" comme cela se
fait parfois puisque nous voulons réserver le terme "représentation" pour désigner le choix des axes
dans l'espace de Hilbert ou, de manière équivalente, le choix d'un ensemble orthonormal complet
de fonctions par rapport auxquelles les états et variables dynamiques sont spécifiés. Il est important
de noter que les équations (1), (7), (8) et (11) ont la même forme dans toutes les représentations,
comme on le montre facilement. D'autre part, nous utilisons le terme "transformation" en relation
avec le changement d'un point de vue à l'autre puisqu'il est accomplit au moyen d'un opérateur
unitaire. A cause de cela, toutes les normes et produits scalaires des vecteurs d'états sont
indépendants du point de vue et constants dans le temps aussi bien qu'indépendants de la
représentation.
Un troisième point de vue particulièrement utile peut être spécifié en divisant l'hamiltonien en deux
parties,
(12) H = H 0 + H ′
tel que H 0 ne dépend pas explicitement du temps et a aussi une structure simple. Par exemple, H 0
peut être l'énergie cinétique et H ′ l'énergie potentielle. Ou H 0 peut être l'hamiltonien pour un
potentiel relativement simple tel que le champ coulombien et H ′ une certaine interaction
supplémentaire tel qu'un champ électromagnétique externe. Dans ce dernier cas, il est souvent
intéressant d'autoriser H ′ à dépendre explicitement du temps et ainsi nous admettrons cette
possibilité dans ce qui suit. Puisque H, H 0 et H ′ ne commutent en général pas l'un avec l'autre, un
indice doit être utilisé pour distinguer les différents points de vue.
α I (t ) = − H 0 S e iH 0 S t / h α S (t ) + ihe iH 0 S t / h α S (t )
d d
ih
dt dt
(14) = − H 0 S α I (t ) + e α I (t )
iH 0 S t / h − iH 0 S t / h
HSe
= e iH 0 S t / h H S′ e −iH 0 S t / h α I (t )
= H I′ α I (t )
où nous avons utilisé (1) et (12) et la deuxième équation de (13). De même, la différentiation de la
deuxième équation (13) donne pour l'équation du mouvement de Ω I (t )
dΩ I ∂Ω I 1 ∂Ω I 1
(15) = + [Ω I , H 0 S ] = + [Ω I , H 0 I ]
dt ∂t ih ∂t ih
Ce que le point de vue interaction réalise est d'assigner une partie de la dépendance avec le temps
aux vecteurs d'états et une partie aux variables dynamiques au lieu d'avoir l'un constant et l'autre
avec une dépendance dans le temps due à l'hamiltonien complet. Dans ce point de vue, les vecteurs
d'états changent en accord avec H ′ et les variables dynamiques en accord avec H 0 . Notez la
ressemblance des équations (1) et (14) d'un coté et des équations (11) et (15) de l'autre. Cela est
utile si H ′ est une petite perturbation puisque alors les variables dynamiques ont la forme non
perturbée et les fonctions d'états sont presque constantes dans le temps.
Représentation énergie
La représentation énergie est spécifiée par les kets k qui sont valeurs propres de l'hamiltonien
complet H avec les valeurs propres E k . L'équation (1) montre alors que dans le point de vue de
Schrödinger, le ket dépendant du temps k S (t ) satisfait l'équation
k S (t ) = H k S (t ) = E k k S (t )
d
(16) ih
dt
qui s'intègre en
(17) k S (t ) = k S (0) e − iEk t / h
L'équation (17) et son adjointe peuvent être utilisées pour trouver la dépendance dans le temps des
éléments de matrice dans le point de vue de Schrödinger d'un opérateur qui n'a pas de dépendance
explicite avec le temps :
(18) k S (t ) Ω S l S (t ) = k S (0 ) Ω S l S (0 ) e i ( Ek − Et )t / h
On vérifie facilement explicitement que cela est égal à l'élément de matrice k H Ω H l H , comme
on s'y attend.
L'équation (18) montre que les éléments non diagonaux dans la représentation énergie oscillent
dans le temps avec des fréquences qui sont proportionnelles à la différence d'énergie entre les états
stationnaires, en accord avec la règle de Bohr. Cela est consistant avec la remarque à la fin de la
section précédente que les éléments de matrice sont reliés aux probabilités de transition entre états.
Il suit aussi de (18) que les éléments de matrice diagonaux ou les valeurs moyennes dans la
représentation énergie sont constants dans le temps pour des opérateurs qui n'ont pas de dépendance
explicite avec le temps.
t1
Les équations lagrangiennes résultantes sont
d ∂L ∂L
(20) − = 0 i = 1,… f
dt ∂qi ∂qi
i =1
La dépendance avec le temps de toute fonction des coordonnées, des moments et du temps,
calculée le long d'un point de phase en mouvement (trajectoire physique dans l'espace des variables
ou espace des phases ou espace de configuration) est
∂F ∂F ∂F
F (q1 , K , q f , p1 , K , p f , t ) =
f
d
+ ∑ q& i + p& i
dt ∂t i =1 ∂q i ∂pi
(23)
∂F f
∂F ∂H ∂H ∂F
+ ∑ −
∂t i =1 ∂q i ∂p i ∂q i ∂pi
en utilisant les équations hamiltoniennes (22). Le crochet de Poisson {A, B} de deux fonctions des
coordonnées et des moments est définit comme
f
∂A ∂B ∂B ∂A
(24) {A, B} ≡ ∑ −
i =1 ∂q i ∂p i ∂qi ∂pi
En terme des crochets de Poisson, l'équation du mouvement pour la fonction F des variables
dynamiques devient
dF ∂F
(25) = + {F , H }
dt ∂t
Le coté gauche de (25) est la dérivée totale par rapport au temps de F le long d'un point de phase en
mouvement. Le premier terme sur le coté droit prend en compte la dérivée explicite par rapport au
temps de F et le dernier terme est le changement de F venant du mouvement du point de phase où F
est évalué.
Il y a deux observations qui tendent à supporter cette suggestion. La première concerne les
conditions classiques pour une transformation d'un ensemble de variables canoniques q i , p i à un
autre Qi , Pi :
(27) {Qi , Pj } = δ ij {Q , Q } = 0 {P , P } = 0
i j i j
où les crochets de Poisson sont calculés par rapport aux variables originales q i , p i . Nous avons vu
qu'un passage correct de la théorie classique à la théorie quantique pouvait être obtenu en
substituant l'opérateur différentiel − ih(∂ / ∂x ) à p x , etc. Le commutateur de x et p x peut alors être
trouvé en opérant sur une fonction arbitraire g (r ) des coordonnées.
∂g ∂
(28) ( xp x − p x x )g (r ) = −ihx + ih ( xg ) = ihg (r )
∂x ∂x
Puisque g (r ) est arbitraire, cette relation et les autres commutateurs peuvent être écrits comme des
équations d'opérateurs :
∂ ∂
xp x − p x x = −ih x − x = ih
∂x ∂x
∂ ∂
(29) xp y − p y x = −ih x − x = 0
∂y ∂y
xy − yx = 0
px py − p y px = 0
etc.
Elles sont en accord avec les équations classiques (27) quand la substitution (26) est faite.
La deuxième observation est que les propriétés algébriques des commutateurs sont identiques à
celles des crochets de Poisson. On vérifie facilement à partir de la définition (24) que
{A, B} = −{B, A}
{A, c} = 0
(30) {( A1 + A2 ), B} = {A1 , B} + {A2 , B}
{A1 A2 , B} = {A1 , B}A2 + A1 {A2 , B}
{A, {B, C}} + {B, {C , A}} + {C , {A, B}} = 0
où c est un nombre.
L'ordre des facteurs éventuellement non commutant n'a pas été altéré. Dirac a montré que la forme
de l'analogue quantique des crochets de Poisson est déterminée par les équations (30) remplacé par
le coté droit de (26). La constante h est, bien sûr, arbitraire tant que l'on se cantonne à cette
discussion.
Notons que l'on peut alors montrer, comme nous l'avons fait pour la position et l'impulsion, que
pour toute paire de variables canoniques : ∆q i ⋅ ∆p i ≥ 12 h .
Ces conditions quantiques sont une généralisation de (29) et on vérifie facilement qu'elles sont
valides dans tous les points de vue discutés au début de cette section. Donc, le point de vue de
Heisenberg doit seulement être précisé pour les équations du mouvement. Nous supposerons
toujours que c'est le cas dans le reste de cette section et l'indice H sera omis.
Deux précautions sont nécessaires pour appliquer cette procédure de quantification. Tout d'abord,
les coordonnées et moments doivent être exprimés en coordonnées cartésiennes. Deuxièmement,
les ambiguïtés sur l'ordre des facteurs non commutant sont habituellement résolues en prenant une
moyenne symétrique des différents ordres possibles. Ces précautions sont illustrées dans l'exemple
suivant.
Il est important de réaliser qu'il n'y a pas de manière unique d'effectuer la transition de la
mécanique classique à la mécanique quantique. Des termes peuvent toujours être ajoutés aux
équations quantiques du mouvement s'ils s'annulent à la limite classique ou de correspondance.
D'autre part, si le comportement classique d'un système est connu, certaines restrictions sont
placées sur ses équations quantiques. La procédure actuelle conduit généralement au système
quantique le plus simple qui a la limite classique correcte. Ce système le plus simple peut omettre
certains aspects intéressants de la vraie situation. Ainsi, le spin intrinsèque et le moment
magnétique que possèdent certaines particules chargées n'apparaissent pas dans l'exemple traité ci-
dessous.
Il suit de (36) que pour toute fonction f (r ) qui peut être exprimée comme un développement en
série en x, y, z, la relation
∂
(37) [ f (r ), p x ] = f (r ) p x − p x f (r ) = ih
f (r )
∂x
est valide. Cela correspond à la relation classique { f (r ), p x } = ∂f (r ) / ∂x . L'équation (37) peut aussi
être établie pour des fonctions plus générales que les développements en série en utilisant la
représentation de p x comme − ih(∂ / ∂x ) comme dans (28). Si nous opérons avec la gauche de (37)
sur une fonction arbitraire g (r ) , nous obtenons
∂ ∂ ∂
(38) [ f (r ), p x ]g (r ) = −ih f (r ) − f (r ) g (r ) = g (r )ih f (r )
∂x ∂x ∂x
qui est équivalent à l'égalité d'opérateurs (37) puisque g (r ) est arbitraire. Par application répétée de
(37), on montre facilement que
∂f ∂f ∂f ∂2 f
(39) f (r ) p x2 − p x2 f (r ) = ih p x + p x = 2ih px + h 2 2
∂x ∂x ∂x ∂x
La dérivée par rapport au temps d'une composante de r est facilement trouvée à partir de (11)
dx 1 e
(41) = p x − Ax
dt m c
en accord avec la relation classique entre la vitesse et l'impulsion d'une particule en présence d'un
champ électromagnétique.
La force de Lorentz
L'équation (43), avec des équations similaires pour les composantes y et z, peut être écrite comme
une seule équation vectorielle pour la "force" :
d 2r 1 ∂A
m 2 = e − − ∇φ
dt c ∂t
1 e1 e 1 e
(44) + p − A × (∇ × A ) − (∇ × A ) × p − A
2 c m c m c
1 e dr dr
= eE + ×H −H×
2 c dt dt
où nous avons utilisé (33) et (41). L'équation (44) avec l'équation classique correspondante
(45) eE + (v × H )
e
c
où v = dr / dt est la vitesse de la particule, si nous prenons une moyenne symétrique des deux
termes v × H et − H × v . Elles sont identiques en mécanique classique mais diffèrent en mécanique
quantique car le v donné par (41) ne commute pas avec H. De même, bien que leur comme soit
hermitique, les termes séparés ne le sont pas.
L'équation (44) inclut une généralisation du théorème d'Ehrenfest. Si nous considérons un élément
diagonal, le coté gauche est le produit de la masse et de la dérivée seconde par rapport au temps de
la valeur moyenne du vecteur position de la particule puisque les kets du point de vue de
Heisenberg sont indépendant du temps. Le coté droit est la valeur moyenne de la force de Lorentz
agissant sur la charge de la particule. Donc, (44) dit qu'un paquet d'ondes se déplace comme une
particule classique si elle est suffisament bien localisée pour que le champ électromagnétique
change d'une quantité négligeable sur ses dimensions. Ce résultat peut aussi être obtenu par la
méthode que nous avons vu avec le théorème d'Ehrenfest si, en accord avec (1) et (40), l'équation
de Schrödinger dans le point de vue de Schrödinger est prise comme
∂ψ h 2 2 ieh ieh e2
(46) ih = − ∇ + A⋅∇ + ∇⋅A + A 2 + eφ ψ
∂t 2m mc 2mc 2mc 2
Théorème du viriel
Une preuve du théorème du viriel en mécanique quantique peut être donnée en analogie avec la
démonstration correspondante en mécanique classique. Dans cette dernière, le point de départ est la
moyenne dans le temps de la dérivée par rapport au temps de la quantité r ⋅ p qui est zéro pour un
système périodique. La quantité analogue en mécanique quantique est la dérivée par rapport au
temps de la valeur moyenne de r ⋅ p ou l'élément de matrice diagonal du commutateur de r ⋅ p et H
dans la représentation énergie, qui est aussi zéro.
d
r ⋅p =
1
[(r ⋅ p ), H ] = 0
dt ih
p2 + p2 + p2
[(r ⋅ p ), H ] = (xp x + yp y + zp z ), x y z + V (x, y, z )
(47) 2m
∂V ∂V ∂V
= (
ih 2
)
p x + p y2 + p z2 − ih x +y +z
∂z
m ∂x ∂y
= 2ihT − ih(r ⋅ ∇V )
où T est l'énergie cinétique. Nous en concluons que
(48) 2 T = r ⋅ ∇V
Notez que cela n'a pas d'importance de commencer avec r ⋅ p ou p ⋅ r puisque la différence entre
les deux est une constante et donc commute avec H.
Si V est à symétrie sphérique et proportionnel à r n et si la valeur moyenne existe, (48) montre que
2T =nV .
VI.4. Théorie matricielle de l'oscillateur harmonique
L'oscillateur harmonique a été discuté du point de vue de l'équation de Schrödinger. Ce système
peut aussi être traité en manipulant directement les équations matricielles. L'hamiltonien est de la
forme à une dimension avec V ( x ) = 12 Kx 2 :
p2 1 2
(1) H = + Kx
2m 2
où x et p sont hermitiques puisque ce sont des variables dynamiques physiquement mesurables. La
condition quantique est
(2) xp − px = ih
Aucune autre information n'est nécessaire pour obtenir les valeurs propres de l'énergie et les
fonctions propres.
Représentation énergie
Nous travaillons d'abord dans la représentation énergie où H est diagonal. L'équation (1) peut être
écrite en notation de Dirac comme
1
(3) k H l = E k k l = k p j j p l + 12 K k x j j x l
2m
où le symbole de sommation S j a été omit. Maintenant
∗ ∗
(4) j p l = l p + j = lpj
puisque p est hermitique et une expression semblable existe pour les éléments de matrice de x.
Donc, pour les éléments diagonaux de (3), le coté droit est une somme de carrés des valeurs
absolues des éléments matriciels et donc est non négatif. Une valeur propre de l'énergie E k peut
être zéro seulement si les éléments de matrice k p j et k x j sont zéro pour tout j. Cependant,
cela serait inconsistant avec l'élément de matrice diagonal k de (2). Nous en concluons donc que
toutes les valeurs propres de l'énergie sont positives.
Comme prochaine étape, nous calculons le commutateur de x et p avec H :
ih
(5) xH − Hx = p pH − Hp = −ihKx
m
Des équations de ce type sont généralement utiles si la représentation est choisie telle qu'un des
facteurs dans le commutateur est diagonal puisque alors une différente entre deux valeurs propres
apparaît quand un élément de matrice est pris. Donc, la première équation (5) devient
ih
(6) k x j j H l − k H j j x l = (El − E k ) k x l = k pl
m
Donc, k ( p − imω c x ) l est non nul seulement quand E k = El − hω c . Cela signifie que le résultat
de l'opération avec p − imω c x sur le ket l est un certain multiple du ket k qui a une énergie
diminuée de hω c . De même, il est facile de voir que l'opérateur adjoint hermitique p + imω c x
augmenter l'énergie de tout état de hω c . L'application répétée de l'opérateur d'abaissement sur tout
ket conduira finalement à une difficulté puisque l'énergie doit être positive, sauf s'il y a un état
d'énergie la plus basse 0 tel que
(10) ( p − imω c x ) 0 = 0
L'état d'énergie la plus basse peut être trouvé avec (10) en opérant sur lui à gauche avec p + imω c x .
Le résultat est
[ ]
( p + imω c x )( p − imω c x ) 0 = p 2 + m 2ω c2 x 2 + imω c (xp − px ) 0
( )
(11)
= p 2 + m 2ω c2 x 2 − mhω c 0 = 2m(H − 12 hω c ) 0 = 0
Il est souvent pratique de mettre les opérateurs d'augmentation et d'abaissement sous forme sans
dimension en les multipliant par − i (2mhω c ) et i (2mhω c ) 2 , respectivement. Nous appelons
1 1
− −
2
Il suit des équations (12) et (15) que les valeurs propres de a + a sont les entiers positifs et zéro.
Pour cette raison, a + a est souvent appelé l'opérateur de nombre. Ce résultat est une conséquence
directe de la relation de commutation (14) et ne nécessite aucune autre information. Le fait que les
valeurs propres de a + a , quand a est tout opérateur qui satisfait (14), soient les entiers positifs ou
zéro est utile en relation avec la quantification des champs. Les opérateurs a + et a y apparaissent
ab initio plutôt que comme des combinaisons de x et p et ont la signification physique de
respectivement augmenter de diminuer le nombre de particules représentées par le champ. D'où leur
nom d'opérateurs de création et de destruction. Dans le même contexte, l'opérateur de nombre a + a
spécifie le nombre de particules présentes dans l'état propre du champ.
Matrices pour a, x et p
Les seuls éléments de matrice non nuls de a sont n − 1 a n , que nous appellerons λ n . De même,
les seuls éléments non nuls de a + sont n a + n − 1 , ils sont égaux à λ∗n . Alors, un élément de
matrice diagonal de a + a est
(16) n a + a n = n a + n ′ n ′ a n = λ n
2
où une sommation sur l'ensemble complet n ′ est sous-entendue. Puisque cet élément diagonal est
1
égal à n, λ n est égal à n 2 à un facteur de phase multiplicatif de grandeur unité près, que nous
pouvons choisir égal à un. Donc, les matrices pour a et a + sont
0 1 0 0
1
0 0 2 2
0
1
0 0 0 32
a=
0 0 0 0
⋅
⋅
⋅
0 0 0 0
1 0 0 0
1
2
0 2 0
1
0
a =
+
2
0 0 3 0
⋅
⋅
(17) ⋅
Le produit a + a peut être effectué à partir de ces matrices. Il est diagonal avec les valeurs propres 0,
1, 2,… comme attendu.
Des matrices explicites pour x et p sont faciles à trouver à partir de (17) et (18). Chacune a des
éléments non nuls qui bordent la diagonale principale sur les deux cotés.
Représentation coordonnées
Le ket 0 peut être trouvé en représentation coordonnées x 0 en résolvant (10) dans cette
représentation. Nous avons
(19) x ( p − imω c x ) 0 = x ( p − imω c x ) x ′ x ′ 0 = 0
où
δ ( x − x ′) et x x x ′ = xδ ( x − x ′)
d
(20) x p x ′ = −ih
dx
et donc
d
(21) − ih − imω c x x 0 = 0
dx
La solution est
(22) x 0 = A0 e − (mω c / 2 h ) x
2
harmonique.
L'induction à ( p + imω c x ) g ( x ) est évidente. Donc, quand g ( x ) est choisi comme (22), nous
n
obtenons
n
mω x 2 / 2 h d − mω c x 2 / 2 h
(27) x n = An e c e
dx n
où An est une constante de normalisation.
Tous ces résultats sont en accord avec ceux obtenus lors de notre étude précédente de l'oscillateur
harmonique.
Exercices
1. Supposez qu'une matrice hermitique donnée puisse être diagonalisée par une matrice unitaire.
Montrez alors que la condition nécessaire et suffisante pour que deux matrices hermitiques
puissent être diagonalisées par la même transformation unitaire est qu'elles commutent.
2. Montrez qu'une matrice non singulière de rang fini doit être carrée. Montrez aussi que dans ce
cas, l'équation AA −1 = 1 implique l'équation A −1 A = 1 .
( )
3. Montrez que det e A = e tr ( A ) . Donnez les conditions sur A qui doivent être supposées dans votre
démonstration.
4. Trouvez deux matrices A et B qui satisfont les équations suivantes :
A2 = O
AA + + A + A = 1
B = A+ A
où O est la matrice nulle et 1 la matrice unité. Montrez que B 2 = B . Obtenez des expressions
explicites pour A et B dans une représentation où B est diagonale, en supposant qu'elle est non
dégénérée. Est-ce que A peut être diagonalisée dans une certaine représentation ?
5. Trouvez trois matrices A, B et C qui satisfont les équations suivantes :
A2 = B 2 = C 2 = 1
AB + BA = BC + CB = CA + AC = O
où O est la matrice nulle et 1 la matrice unité. Obtenez des expressions explicites pour les trois
matrices dans une représentation où A est diagonal, en supposant qu'elle est non dégénérée.
6. Trouvez trois matrices A, B et C qui satisfont les équations suivantes :
A2 = B 2 = C 2 = 1
BC − CB = iA
où 1 est la matrice unité. Montrez que AB + BA = AC + CA = O , où O est la matrice nulle.
Obtenez des expressions explicites des trois matrices dans une représentation où A est diagonal,
en supposant qu'elle est non dégénérée.
7. Si A et B sont deux matrices carrées de même rang et C ≡= [B, A] , montrez que
1
C
A+ B
e =e e e
A B 2
pourvu que [C , A] = [C , B ] = 0 .
8. Si H = p 2 / 2 µ + V (x ) pour le mouvement à une dimension d'une particule et si V ( x ) peut être
exprimé comme un développement en série de x, montrez par des méthodes purement
matricielles que
dx p
=
dt µ
dp dV
=−
dt dx
où x et p sont considérés dans le point de vue de Heisenberg.
9. A( x, p ) et B( x; p ) peuvent être exprimés comme des développements en série de x et p et
[x, p] = ih . Montrez par des méthodes purement matricielles que
lim [A, B ] = {A, B}
1
h → 0 ih
où le coté droit est le crochet de Poisson calculé comme si x et p étaient des variables
classiques.
10. L'hamiltonien H = p 2 / 2 µ + V (r ) a un ensemble de vecteurs propres k avec les valeurs
propres E k . Montrez que, si l est un vecteur donné qui a une valeur propre discrète,
h2
S k (E k − E l ) k x l =
2
2µ
où x st une composante cartésienne de r. Comme sous-produit de votre solution, donnez une
démonstration matricielle du problème 9 à la fin de la section III.2.
11. L'hamiltonien de l'oscillateur harmonique peut être écrit en représentation coordonnées comme
h2 d 2
δ ( x − x ′) + Kx 2δ ( x − x ′)
1
x H x′ = − 2
2m dx 2
Transformez H dans la représentation impulsion et trouvez les fonctions d'onde dans cette
représentation qui correspondent aux fonctions d'onde dans la représentation x données dans
l'équation (19) de la section IV.1 ou l'équation (27) de la section VI.4.
12. Montrez que la matrice pour x obtenue à partir des équations (17) et (18) de la section VI.4 est
en accord avec l'équation (28) de la section IV.1 et que l'équation (27) de la section VI.4 est en
accord avec les équations (17) et (19) de la section IV.1.
Annexes
Nous n'avons pas indiqué les particules d'antimatière. Elles se déduisent des particules existantes
par le changement de signe des charges.
L'ensemble de ces particules et leurs propriétés est le résultat de décennies d'étude à l'aide des
accélérateurs de particules élémentaires.
Les particules composites ont une structure interne composée de quarks. On peut avoir plusieurs
structures possibles suivant la charge. Lorsque l'on donne une addition, il s'agit en fait d'une
superposition quantique. La barre sur un symbole indique l'antiparticule.