Professional Documents
Culture Documents
http://spoirier.lautre.net/
Relativite restreinte et
initiation `a la physique mathematique
1. Introduction generale
1.1. Quest-ce que la science mathematique ?
Pour le dire bri`evement, cest letude des syst`emes eventuellement innis mais constitues de
purs objets elementaires, dont lexistence est abstraite, independante du monde exterieur. Chaque
constituant (element, relation. . . ) de ces syst`emes a pour seule nature le fait detre exact, du type
tout ou rien : deux objets sont egaux ou dierents, sont relies ou ne sont pas relies, une operation
donne un resultat exactement. . .
Le choix de tels syst`emes `a etudier est lui-meme egalement un choix mathematique, en ce sens
quil est donne par des conditions de complexite limitee (contrairement par exemple `a la biologie qui
depend des choix arbitraires secr`etement accumules par la Nature pendant des milliards dannees).
La science mathematique est ainsi autonome par rapport aux contingences de notre Univers, mais
peut toujours sappliquer `a chacun des innombrables lieux ou aspects particuliers de ce dernier o` u
de telles situations de complexite limitee peuvent se rencontrer.
Bien que ces objets soient de nature independante de toute forme de representation sensible (ou
apparence) particuli`ere, on ne peut les comprendre quen se les representant sous une certaine forme.
Il peut y avoir plusieurs formulations ou mani`eres de se representer une meme theorie, toutes etant
rigoureusement equivalentes entre elles mais leur ecacite, leur pertinence peut etre tr`es dierente.
Le plus souvent, les idees sont dabord developpees sous forme dintuitions, dimaginations plus ou
moins visuelles, puis cristallisees en des formules et des phrases litteraires pour etre communiquees,
ecrites ou travaillees sous ces autres formes. Et on ne peut se liberer dune forme de representation
particuli`ere quen developpant dautres formes de representation et en sexercant `a traduire les
objets et les concepts dune forme `a lautre.
1.2. Quest-ce que la geometrie ?
Etymologiquement, le mot geometrie signie mesure de la terre. Cest donc, `a lorigine, une
science reliee `a la realite concr`ete : celle de lespace qui nous entoure, ou celle des plans : celui
du sol lorsquil est plat, ou de toute surface plane (papier, tableau. . . ), que lon peut voir et sur
laquelle on peut dessiner facilement. Le geom`etre grec Euclide en a ecrit le premier une formulation
axiomatique dans le cas du plan, do` u le nom donne `a la geometrie plane usuelle.
La geometrie euclidienne est ainsi la premi`ere theorie physique, cest-`a-dire une theorie mathe-
matique qui modelise la realite physique, en lidealisant : tandis que deux points trop proches
lun de lautre peuvent dicilement etre distingues par des mesures physiques, en mathematique
il faut trancher : ils sont soit egaux, soit distincts (ainsi, entre deux points distincts se trouvent
dautres points, et ainsi de suite : dans un segment de droite de longueur nie il existe une innite
de points). Et on tranche au plus simple : cette geometrie se denit comme etant la plus simple
theorie du plan ou de lespace en accord avec lexperience physique habituelle. Cest aussi lunique
theorie dans laquelle est vrai exactement tout enonce simple qui semble vrai, aux incertitudes de
mesure pr`es, pour cette meme experience.
Pour un mathematicien moderne, le mot geometrie designe le nom de famille que portent
un grand nombre de theories mathematiques qui ont entre elles plus ou moins de liens de parente,
notamment le fait quil est plus ou moins possible de les visualiser, den dessiner des gures. Dun
point de vue mathematique, elles sont toutes egalement vraies, se rapportant toutes `a des realites
mathematiques (des ensembles de points. . . ).
1.3. Comment peut-on visualiser dautres geometries ?
1
Mais comment visualise-t-on la geometrie euclidienne, dabord ? Elle nest pas celle que lon
voit directement, car la geometrie du champ de vision est la geometrie spherique.
En eet, la vue dun point ne nous renseigne que sur la demi-droite issue de lil auquel ce
point appartient; et cette demi-droite peut se representer par son point dintersection avec une
sph`ere centree sur lil. Lorsquon bouge lil et/ou la tete, la modication de ce quon voit
correspond `a une rotation de cette sph`ere. Lexemple le plus clair en ce sens est celui des objets
astronomiques dont on ne percoit que limage sur la sph`ere celeste (qui tourne `a cause de la
rotation de la Terre sur elle-meme).
Mais la geometrie euclidienne (du plan ou de lespace) est seulement celle quon a le plus
lhabitude de concevoir. En eet, en voyant ou en imaginant une image de dimension 2 (sur la
sph`ere de vision), on attribue `a chaque point une sensation de proximite ou deloignement, et on
est familier avec la mani`ere dont cette perception se transforme lorsquon tourne lobjet ou quon
change de point de vue par rapport `a lui. Cest cette faculte, fruit dune construction mentale,
qui constitue notre comprehension de la geometrie, et notre agilite `a lemployer en rend lusage
tellement facile comme celui dune sensation elementaire, que son caract`ere indirect en est presque
anecdotique.
Or, la perception intuitive des autres geometries rel`eve du meme principe : celui qui consiste `a
voir une chose pour en concevoir une autre. Et pour parvenir `a concevoir ainsi dautres geometries
en sappuyant sur une vision qui (helas) demeure la meme, un bon moyen est de travailler sur cette
faculte de concevoir lespace euclidien, en la particularisant, en la modiant ou en la generalisant.
(Mais ensuite, il est vrai que ce lien avec la vision ne se preserve pas facilement, et que le travail
de conception devient plus intense et traduit en formules avec un role de la vision relativement
moindre).
Par exemple, on peut concevoir des espaces (euclidiens ou non) de dimension superieure `a
3. Ils ne comportent mathematiquement aucune veritable nouveaute par rapport `a la droite, au
plan et `a lespace usuel, meme si labsence totale dexperience par rapport `a eux donne aux novices
limpression dune diculte insurmontable. Pour concevoir ces espaces, on peut par exemple se dire
quon ne voit que deux ou trois dimensions en meme temps sous forme de coupe ou de projection,
mais quil y en a dautres en reserve, on peut les changer. . .
1.4 La geometrie euclidienne decrit-elle exactement lespace physique ?
Non. Non seulement le temps sy ajoute en relativite restreinte pour former un espace de
dimension 4 qui nest pas euclidien (lespace-temps) et est plus reel (proche de la realite physique)
que notre espace de dimension 3 usuel, mais meme si on se restreint `a considerer son apparence
despace de dimension 3, la theorie de la relativite generale nous enseigne quen realite, cet espace,
pour autant quon puisse encore le mesurer, nobeit pas exactement `a la geometrie euclidienne
(independamment de toute question de materialisation des objets ou de precision des mesures).
Bien s ur, lerreur de le supposer euclidien est extremement faible, plus encore que dautres erreurs
beaucoup plus comprehensibles et dej`a couramment negligees : lorsquon cartographie une region
de la Terre (de forme `a peu pr`es carree par exemple) de taille L, en lassimilant `a une region dun
plan, lerreur geometrique normale due `a la rotondite de la Terre vaut (en distance sur le terrain)
L
3
R
2
o` u R = 6370 km est le rayon de la Terre, ce qui fait par exemple 2,4 cm pour une region large de
10 km.
Celle due `a la relativite generale, qui mesure donc le meme type de decallage par rapport
`a la geometrie euclidienne plane mais concerne le plan tangent `a la Terre et constitue un eet
supplementaire par rapport `a celui quon calculerait en termes de la seule rotondite de la Terre,
vaut
2L
3
g
Rc
2
o` u g = 9, 8 m.s
2
est lacceleration de pesanteur et c = 3.10
8
m.s
1
est la vitesse de la lumi`ere.
Elle est donc 720 millions de fois plus faible (precisement, pour nimporte quelle region choisie);
2
dans le cas de la mesure de la Terre enti`ere au lieu dune region, lerreur est de lordre de quelques
centim`etres. Ainsi, etant donne un choix dequateur parfaitement circulaire, sa longueur est
inferieure `a sa distance au centre multipliee par 2 (mais le calcul precis de sa distance au centre
depend de la repartition de la masse de la Terre entre les dierentes profondeurs).
Si maintenant on consid`ere un plan vertical, une autre erreur survient, elle aussi plus forte que
celle issue de la relativite generale : le solide de longueur L que lon tourne pour comparer des
longueurs horizontales et verticales se deforme sous son propre poids (il setire sil est pendu, il se
contracte sil est pose), dune amplitude de lordre de
L
2
g
c
2
o` u c
est la vitesse du son dans le solide, qui est forcement inferieure `a c dapr`es la relativite
restreinte.
De lautre cote, la physique de linniment petit pose actuellement tellement de probl`emes
que certains physiciens theoriciens envisagent serieusement que les concepts usuels de geometrie
ne seraient plus valables `a lechelle de Planck (qui est bien plus petite que la plus petite distance
pour laquelle le comportement des particules est actuellement connu).
1.5. Quest-ce que la physique mathematique ?
Egalement, nous pouvons `a peine imaginer le temps, meme juste conformement `a la mani`ere
dont nous le vivons, qui montrerait la nature de cette experience vivante du temps au-del`a de la
seule forme de la droite qui le represente mathematiquement : en aucun instant nous ne pouvons
imaginer une duree en tant que telle, puisquun instant ne contient aucune duree; il ny a que
les durees futures qui nexistent pas encore, et les durees passees, que nous percevons dans notre
souvenir. Mais dej`a, un souvenir dune duree nest plus une duree, car il ne fait que representer
cette duree par une certaine autre sensation instantanee.
Ainsi, la pretention de decrire les choses comme elles sont serait vaine, ou alors, ce nest
plus de la physique mais de la metaphysique, ce qui peut eventuellement se defendre `a condi-
tion de lannoncer clairement. Eventuellement, cela peut etre utile lorsquon travaille avec une
theorie provisoire quon est en train de remettre en question pour tenter den construire une autre
plus precise comme explicitation de structures sous-jacentes `a une structure donnee (par exemple,
cela est pertinent pour passer des moles aux molecules, et de la thermodynamique classique `a la
mecanique statistique). Mais cela na lieu que de mani`ere relative et non absolue, et nest pas le
cas general.
Lobjet de la Physique est donc de decrire les lois physiques, cest-`a-dire lexpression sous
forme de theorie mathematique des relations constatees entre les resultats de nos observations du
monde physique, puisque cest une caracteristique generale des mathematiques que de sinteresser
aux structures, relations entre les objets, et non `a leur nature. Alors, entre plusieurs presentations
mathematiquement equivalentes (ou traductions) dune theorie, faisant dierents choix de formes
dimagination pour representer tel ou tel aspect de la realite, la meilleure est celle qui permet de
saisir cette theorie mathematique de la mani`ere la plus facile ou ecace.
Lintuition quotidienne du monde physique est adaptee `a la comprehension des probl`emes de
la vie quotidienne. Mais lorsquon veut passer `a letude des structures de la realite qui apparaissent
dans dautres contextes, il peut etre judicieux de modier ce choix. Mais de toute mani`ere, un
discours sappuyant ainsi judicieusement sur un syst`eme inhabituel de correspondances entre objets
4
reels et formes dimagination employees `a les representer, est donc bien s ur pareillement vide de
signication sur la vraie nature de ces aspects ou objets de la realite physique que tout autre
discours.
Faute davoir une theorie compl`ete de la physique, on a des theories partielles, dont chacune
concerne les proprietes des resultats des experiences dun certain domaine experimental de la realite,
cest-`a-dire un certain type dexperiences avec un certain degre de precision des mesures (dependant
des param`etres de lexperience). Au cours de lexploration de la physique mathematique, on est
amene `a considerer une succession de theories correspondant `a dierents domaines experimentaux,
de plus en plus larges et dont les consequences theoriques sont de plus en plus precisement en
accord avec lexperience (ou donnent de plus en plus dinformations `a lui confronter).
Chacune de ces theories est dabord par nature une theorie mathematique; sa signication
physique (son titre de theorie physique) consiste alors `a attribuer `a chaque experience du domaine
experimental considere une traduction dans la theorie, cest-`a-dire un certain sous-syst`eme dobjets
de la theorie qui represente mathematiquement le dispositif experimental utilise.
Mais une theorie a aussi une signication intuitive, qui reside dans le choix de la forme de
representation la mieux adaptee `a la comprehension de la theorie. Dans cette exploration, beaucoup
de theories geometriques interviennent, non seulement pour rendre compte du comportement de
la mati`ere evoluant `a linterieur de lespace qui nous est familier, mais aussi pour remplacer cet
espace lui-meme par dautres (ce dernier cas narrive pas souvent : principalement en Relativite
restreinte, Relativite generale et ce qui inclut la gravitation quantique). Et, parmi nos intuitions
ou capacites habituelles `a percevoir le monde physique, la vision est celle qui est la plus claire
mathematiquement, et la plus facile `a exercer pour pouvoir, avec elle, concevoir beaucoup de ces
theories geometriques.
La diculte du naf `a remettre en question la forme de ses perceptions se presente aussi en
termes du principe de realite, suivant lequel la realite physique existe que nous la percevions ou
pas, au nom de quoi il voudrait continuer `a penser les choses en termes dobjets reels ou concrets
tels quil les percoit habituellement. Or le probl`eme nest pas de savoir si la realite comporte ou
non dautres objets que ceux de notre experience ou perception, car de toute mani`ere les theories
physiques avec lesquelles nous travaillons en presentent. Le probl`eme est de savoir lesquels. Le
naf imagine ces objets de la realite sous-jacente, quil ne peut percevoir directement, comme
ressemblant `a ceux qui lui sont familiers. Il na pas toujours tort, dailleurs, dans la mesure o` u tel
ou tel phenom`ene quil a besoin dexpliquer peut etre d u `a des mecanismes situes dans un domaine
experimental plus large que son experience courante, mais pas encore assez pour que son intuition
cesse detre valide, son incapacite `a observer directement ces mecanismes suivant cette meme
intuition etant seulement contingente et remediable par des instruments adaptes (microscopes,
telescopes, etc.).
Par contre, lorsquen poussant plus avant le domaine experimental on se trouve confronte `a
une impossibilite plus fondamentale daner les instruments de mesure pour observer le meme
type de mecanismes reels explicatifs, il est temps denvisager quil y ait `a cela une bonne raison:
`a savoir quil nexiste pas de realite explicative ressemblant `a ce que le naf voudrait croire, parce
que la realite est dune autre forme qui ne peut etre comprise que par des moyens dierents, en
des termes dierents.
1.6. Quelques mots de geometrie euclidienne
de lelectron r
e
= 2, 82.10
15
m. Cependant cette taille est
t|| = 1.
Cet emploi purement articiel du vocabulaire despace et de temps pour designer les coor-
donnees est seulement motive ici par le fait quun point parcourant laxe du temps `a la vitesse v
aura une vitesse apparente egale `a 1 sur le dessin, en sorte que la coordonnee de temps sur cet
axe sidentie au temps de ce parcours. On aura donc v = k
1
.
Ensuite, `a partir dun tel rep`ere principal, les autres rep`eres quon se permettra dutiliser seront
ceux qui sont reellement orthogonaux et ont les memes valeurs des normes des vecteurs de base (et
16
donc la meme valeur de k) sans tenir compte des apparences du dessin, autrement dit des rep`eres
obtenus par de vraies rotations `a partir dun rep`ere orthogonal xe construit comme ci-dessus.
1
2
3
4
1
3
2
4
2
3
4
4
3
2
1
x
1
0
k
1
t
Figure reelle etudiee Dessin utilise (agrandi ici)
Les distances
Il ne sera pas question de mentionner les distances apparentes sur le dessin, car elles nont pas
de rapport naturel avec la realite etudiee. Nous allons considerer les mesures des distances reelles,
mais suivant deux unites de longueur possibles, qui sont les longueurs reelles des deux vecteurs de
base principaux. Precisement, lunite despace vaut k fois lunite de temps. Ainsi, la mesure en
unite de temps de la norme dun vecteur u de coordonnees (t, x) est donnee par
||u||
t
=
_
t
2
+k
2
x
2
=
_
t
2
+
x
2
v
2
et est la longueur apparente sur le dessin du vecteur obtenu par une vraie rotation de u pour
lamener sur laxe du temps, et de mani`ere analogue sa mesure en unite despace est donnee par
||u||
x
= k
1
||u||
t
=
_
v
2
t
2
+x
2
.
`
A chacune de ces unites correspond de la meme mani`ere une mesure du produit scalaire :
u u
= tt
+k
2
xx
ou v
2
tt
+xx
.
Ainsi, k sera traite comme un nombre xe. Cependant, sans le traiter dune mani`ere dierente,
et puisque sa valeur eective nintervient pas dans les calculs formels, on peut plus judicieusement
linterpreter comme etant non un nombre reel mais une quantite dans le cas dune etude en co-
ordonnees : les mesures en unites de temps et despace sont alors interpretees non comme des
nombres reels mais des quantites independantes (des temps et des longueurs), et la quantite v ou
son inverse k est alors la constante universelle qui fait le lien physique naturel entre les deux.
Les angles
Les angles sont denis par le rapport de la longueur dun arc de cercle `a la mesure du rayon.
Or, pour cela on mesurera le rayon en unite de temps, et la longueur de larc en unite despace.
Lunite dangle utilisee sera donc egale `a k radians. Les fonctions cos et sin utilisant comme il se
doit la mesure des angles en radians, la rotation dun angle exprime dans cette nouvelle unite
enverra donc le vecteur temps
t = (1, 0) sur le vecteur de composantes (cos(k), k
1
sin(k)), et le
vecteur espace x = (0, 1) sur (k sin(k), cos(k)).
On remarque que tant quon ne sinteresse jamais aux intersections dun meme cercle avec
les deux axes dun rep`ere, ni aux rotations dun angle droit, le coecient k et les fonctions
trigonometriques napparaissent pas de mani`ere independante, mais on peut toujours regrouper
leurs apparitions en blocs de cos(k), k
1
sin(k) et k
2
. (Ou plus generalement, les fonctions de k
qui interviennent sont des fonctions analytiques de k
2
). Nous exclurons dans la suite toute notion
geometrique dans laquelle ils napparaissent pas ainsi groupes.
3.4. Passage `a la geometrie pseudo-euclidienne
17
Pour passer de letude deformee de la geometrie euclidienne `a celle de la geometrie pseudo-
euclidienne (dont toute representation est necessairement deformee), il sut de supposer k
2
negatif.
Precisement, la geometrie pseudo-euclidienne, o` u la correspondance naturelle entre les mesures
despace et de temps est exprimee par la vitesse de la lumi`ere c, sobtient `a partir du mod`ele
precedent par la formule
v
2
= c
2
(= k
2
)
do` u on peut deduire que
cos(k) = cos(
v
) = ch(
c
)
k
1
sin(k) = v sin(
v
) = c sh(
c
)
o` u les fonctions cosinus hyperbolique ch et sinus hyperbolique sh sont denies par
ch u =
e
u
+e
u
2
, sh u =
e
u
e
u
2
.
(Ces expressions peuvent aussi se deduire des calculs suivant les rep`eres de lumi`ere presentes plus
loin).
Les inegalites qui etaient vraies en geometrie euclidienne ne le sont generalement plus ici. En
particulier, le produit scalaire continue `a exister mais le carre scalaire nest plus toujours positif.
Contrairement au cas precedent, pour mesurer la norme dun vecteur donne u(t, x) on ne peut
plus choisir arbitrairement entre lunite de temps et celle despace, mais ce choix est determine par
le genre du vecteur, cest-`a-dire par le signe de son carre scalaire, disons ici (celui en unite de temps
au carre) t
2
c
2
x
2
: sil est positif, le vecteur u est du genre temps et ||u|| peut seulement se
mesurer en unite de temps; sil est negatif, u est du genre espace et ||u|| peut seulement se mesurer
en unite despace; sil est nul bien que u = 0, u est un vecteur isotrope ou vecteur de lumi`ere (sa
direction est une direction possible dun photon dans lespace-temps) et ||u|| = 0.
En xant lorigine du plan (ou mieux en regardant lensemble des vecteurs, ensemble qui forme
un plan), les vecteurs de lumi`ere forment deux droites secantes qui divisent le plan en quatre parties,
dont lune est constituee des vecteurs isotropes ou du genre temps tels que t 0, et du vecteur
nul : ce sont les vecteurs futurs.
Plus generalement, cette notion de denit en dimension plus grande: dans un syst`eme de
coordonnees, soit le vecteur u = (x, y, z, t). Son carre scalaire compte en unite de temps au carre
vaut
u
2
= t
2
c
2
(x
2
+y
2
+z
2
).
Le vecteur u est appele un vecteur futur si en ce sens u
2
0 et t 0.
On peut maintenant denir la relation dordre temporel entre les points du plan pseudo-
euclidien: etant donnes deux points M et N, on pose que M N (M est anterieur `a N) si
et seulement si
MN est un vecteur futur. On peut verier que ceci est bien une relation dordre.
Si M N, lintervalle de temps (distance en mesure temporelle) de M `a N est
_
MN
2
.
Une courbe est une ligne dunivers possible `a condition que la relation dordre temporel ci-
dessus denie entre les points de la courbe soit un ordre total; cet ordre concide alors avec lordre du
temps vecu par le visiteur qui suit cette ligne. En fait, cette condition est equivalente `a demander
que la longueur de cette courbe soit une quantite bien denie.
Pour deux points M N, parmi les lignes dunivers possibles de M `a N, la ligne droite est
la plus longue ligne dunivers possible et la seule dont la longueur en mesure temporelle soit egale
`a lintervalle de temps de M `a N. Les plus courtes lignes sont de longueur nulle et constituees de
segments ayant des directions de lumi`ere, mais ce ne sont pas des lignes dunivers possibles pour
des observateurs ou tout objet de masse non nulle, qui ne peuvent pas atteindre la vitesse de la
lumi`ere: pour la ligne dunivers dun photon les vecteurs tangents sont de carre scalaire nul tandis
que pour celle dune particule de masse non nulle ou dun observateur, tous les vecteurs tangents
sont strictement de genre temps (de carre scalaire non nul).
18
Les cercles de cette geometrie sont non plus des ellipses particuli`eres mais des hyperboles parti-
culi`eres, de deux genres possibles (le genre dun cercle etant celui de ses rayons). Celles dun meme
genre sont l`a encore celles obtenues `a partir de lune delles (quon peut choisir arbitrairement) par
homotheties et translations. Tous les cercles (des deux genres) sont les hyperboles ayant la meme
paire de directions des asymptotes, qui sont les directions de lumi`ere. Chaque cercle est en deux
branches de longueur innie chacune, puisque la longueur dun arc de cercle est proportionnelle `a
langle qui se voit aussi comme angle de rotation, et que les rotations peuvent toujours se composer
(additionnant les angles) sans jamais boucler un tour.
Deux droites sont orthogonales si et seulement si on peut passer de lune `a lautre par symetrie
par rapport `a une droite de lumi`ere et parall`element `a lautre direction de lumi`ere. Les vecteurs
de lumi`ere sont les vecteurs orthogonaux `a eux-memes.
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
0
1
t
x
c
-2
Les rep`eres de lumi`ere
Le plan pseudo-euclidien admet un nouvel outil detude par rapport `a la geometrie euclidienne :
lutilisation dun rep`ere dont les deux axes sont suivant les directions de lumi`ere. En notant (a, b)
les coordonnees dans un tel rep`ere, la rotation dun angle autour de lorigine sexprime par
_
a
= a exp(
c
)
b
= b exp(
c
)
On peut remarquer le rapport avec lutilisation des nombres complexes en geometrie eucli-
dienne, o` u la rotation dun angle sexprime par la multiplication par exp(i). En eet, en
coherence avec la denition de la nouvelle unite dangle que nous avons introduite, abordons cette
fois le probl`eme en unite de temps, et en representant le plan euclidien (x, y) par des coordonnees
despace-temps (t, x
) denies par (t = x, x
= k
1
y). Cette deformation des coordonnees se
repercute sur lecriture des nombres complexes: on remplace lemploi de i par celui dun certain
i
, do` u
i
2
= k
2
= c
2
.
Le carre de i
etant alors positif, Cette formule admet donc deux solutions reelles i
= c
1
qui correspondent aux deux coordonnees dans un rep`ere de lumi`ere. Cest ainsi le fait de pouvoir
regarder les solutions de cette equation (au lieu de la conserver telle quelle lors des calculs) qui
est nouveau par rapport `a la geometrie euclidienne et permet, en imitant lecriture en nombres
complexes de la geometrie euclidienne, de rendre certains calculs en quelque sorte plus simples ou
explicites.
Il est facile de voir que le coecient exp(
c
) est la mesure de leet Doppler (le nombre par
lequel se multiplie la frequence dune onde electromagnetique lors de cette rotation).
Lordre temporel M N sexprime dans un rep`ere de lumi`ere par le meme ordre sur chacune
des coordonnees : (a
M
a
N
et b
M
b
N
).
Exemple de calcul concret
Enonce
Imaginons un voyageur qui part de la Terre en subissant de son propre point de vue une
acceleration g pendant une duree t
1
, puis continue sur sa lancee sans acceleration pendant une
19
duree t
2
, et enn decel`ere suivant la meme acceleration quau depart en sens contraire. A quelle
distance d de la Terre se trouve-t-il alors ? Et sil revient ensuite sur Terre de la meme mani`ere,
de combien sera la dierence t entre la duree de son voyage pour lui et pour quelquun reste
immobile sur la Terre ? (Precisons que pour que ce probl`eme soit eectivement traite par la
relativite restreinte sans faire appel `a la relativite generale, il faut negliger dune certaine mani`ere la
pesanteur terrestre, plus precisement la vitesse dechappement du champ de gravitation terrestre).
Solution
Traduisons dabord lenonce de ce probl`eme dans le langage de la geometrie euclidienne.
Partant dune route droite appelee Terre, un vehicule (allant `a une grande vitesse constante
v = k
1
) se met `a devier, le volant etant braque dans une certaine position qui lui fait sentir
une poussee laterale g pendant une duree t
1
. Puis brusquement le volant est redresse, et reste
ainsi pendant une duree t
2
. Enn, en braquant dans lautre sens de la meme mani`ere on parvient
apr`es encore une duree t
1
`a redresser le vehicule sur une route droite parall`ele `a la Terre. A quelle
distance de la Terre se trouve-t-on alors ? Si on revient de la meme mani`ere, quelle est la dierence
de duree mise pour y atteindre le point darrivee B `a partir du point de depart A, par rapport `a
un vehicule qui les aurait relies en restant sur la route droite Terre ?
A B
Terre
Vhicule
R
d
t
t
t
1
2
1
Pendant la duree de la poussee, le vehicule parcourt un arc de cercle de longueur t
1
en unite
de temps ou vt
1
en unite despace, dangle = t
1
g (ce qui donne en radians k = t
1
gv
1
) et de
rayon (en unite despace) R = v
2
g
1
.
On en deduit par une observation geometrique elementaire
d = 2R(1 cos(k)) +vt
2
sin(k) = 2v
2
g
1
(1 cos(kt
1
g)) +vt
2
sin(
t
1
g
v
)
donc en utilisant la formule magique v
2
= k
2
= c
2
on obtient le resultat au probl`eme de
relativite
d = 2c
2
g
1
(ch(
t
1
g
c
) 1) +ct
2
sh(
t
1
g
c
).
De meme on calcule la dierence de longueur en mesure temporelle entre la courbe et la ligne
droite :
t = 4(t
1
kRsin(k)) + 2t
2
(1 cos(k)) = 4(t
1
cg
1
sh(
t
1
g
c
)) + 2t
2
(1 ch(
t
1
g
c
))
qui est nalement une quantite negative, la ligne droite etant plus longue que la ligne courbe comme
on lavait annonce.
Note. A partir dici il est possible de passer directement au chapitre suivant (mecanique classique).
3.5. Visions de la relativite de la simultaneite `a une dimension
Dans les sections 3.5 et 3.6, nous allons etudier les proprietes de ce quon voit experimentale-
ment, par la lumi`ere qui se propage dans le vide dans lespace-temps de la relativite restreinte.
Limage du monde quun observateur situe en un point recoit alors en un instant, est donnee
par lensemble des photons qui lui parviennent. La ligne dunivers dun photon est une droite de
lespace-temps de direction isotrope (dans tout referentiel galileen, son vecteur vitesse est constant
de norme c).
20
Autrement dit, de son ev`enement O dobservation, il voit lensemble des points M tels que
MO est un vecteur futur de carre scalaire nul. Mais, sauf eet de perspective o` u la largeur de
lobservateur lui permet de reconstituer une information sur la profondeur, il ne percoit pas le point
M lui-meme mais seulement la direction de droite (OM). On posera ici par convention c = 1.
Dans cette section 3.5, on se concentrera sur les visions experimentales possibles de la geometrie
du plan pseudo-euclidien, soit une droite au cours du temps.
Un premier cas est celui o` u lobservateur se trouve sur la droite meme o` u ont lieu les pheno-
m`enes observes. On passe des coordonnees (t, x) aux coordonnees de lumi`ere (t + x, t x) dont
lune donne la mesure de la date dobservation par un observateur immobile (x
0
= constante),
suivant lascisse x de lev`enement observe (`a une constante additive pr`es x
0
; de toute facon la
mesure du temps na de sens physique qu`a une constante additive pr`es) : la premi`ere (t +x x
0
)
si x > x
0
, la deuxi`eme (t x +x
0
) si x < x
0
.
Nous avons vu que ce syst`eme de coordonnees (t + x, t x) presente limmense avantage de
reduire les rotations du plan pseudo-euclidien, `a la multiplication de chaque coordonnee par une
valeur de leet Doppler, lune inverse de lautre : ces deux axes etant de directions invariantes,
une rotation sobtient en etirant lun et en contractant lautre.
Que deviennent les vecteurs
t et x dune base orthogonale de ce plan lors dune telle rotation ?
Remarquons quil sut de decrire au premier ordre dapproximation leet dune rotation de petit
angle , car une rotation dangle quelconque sen deduit en repetant une rotation de petit angle
un grand nombre de fois. Dans letude deformee de la geometrie euclidienne, cette rotation qui fait
avancer le vecteur
t denviron x fait avancer le vecteur x de k
2
.
S
S
1
O
O
O
Soit S
. Or, S
`a S
, S
. Mais S
rencontre O. Mais
la lum`ere ne lui en parvient que plus tard, alors que O
correspond `a la
perception de tout observateur que O
que O
, x
, y
), u.v = tt
xx
yy
, x
, y
) = tt
xx
yy
)
Spineurs de lespace-temps `a 3+1 dimensions
Dapr`es ce quon a decrit, les transformations de la sph`ere de vision sont les transformations
dun espace projectif de dimension 1 complexe. Lespace vectoriel de dimension 2 complexe auquel
il est associe sera notre espace spinoriel S.
25
Un vecteur v = (t, x, y, z) equivalent `a la donnee de la forme lineaire (produit scalaire par v),
de composantes (t, x, y, z), se denit alors comme etant lespace des elements hermitiens de
S S (produit tensoriel sur le corps C de lespace conjugue de S par S), ou si on parle en termes
duaux, celui des formes sesquilineaires hermitiennes sur S, de matrice
A =
_
t x y iz
y +iz t +x
_
(Contrairement au cas precedent, lespace S mentionne ici nest pas la solution du probl`eme
spinoriel dans lequel on denit L, qui serait plus compliquee) On verie : det A = t
2
x
2
y
2
z
2
.
La rotation spatio-temporelle la plus generale est donc de la forme
t
PAP o` u P est dans SL(2, C).
A quelques acrobaties pr`es, cela redonne dans le cas purement spatial (t = 0) la presentation
quaternionique des rotations. Lapplication de lespace spinoriel dans le cone de lumi`ere sexprime
par : s s( v, w) = det(s, v) det(s, w) =
t
vBw o` u
t
s = (a, b) et
B =
_
bb
ba
ab aa
_
On remarque que dans ce passage de s `a B ce nest pas seulement le signe qui est perdu mais
tout largument : multiplier s par un nombre complexe de module 1 ne modie pas le resultat.
On voudrait donc donner un sens `a cet argument. Ce nest pas possible dans labsolu, puisquune
homothetie de S de rapport un nombre complexe de module 1 ne change rien. Mais il est possible de
comparer les arguments de plusieurs vecteurs. Pour mieux voir ce qui se passe, fabriquons de toutes
pi`eces une reference : cest largument du determinant de deux vecteurs dans S (qui nintervenait
pas ci-dessus puisquon avait le produit dun determinant et du conjugue dun autre). Soit donc
un spineur s. On cherche une image visuelle de son argument. Pour cela, prenons un vecteur s
) = B(1 + a, ) et en
negligeant les termes en
2
:
_
0
1 +(a + a)
_
soit 2t = 2x = 1 + (a + a), y = , z = 0. Comme on veut retenir linformation independante
de a, cest que le vecteur de lumi`ere qui est parti de t = x =
1
2
peut sallonger ou se raccourcir
comme il veut mais il avance de mani`ere determinee dans la direction de y. Finalement, pour s
xe, lapplication qui `a s
associe det(s, s
vaut us + us
= u(s + u
2
s
. (Le nom
de scalaire semploie aussi comme synonyme de quantite, designant un element dune droite
vectorielle ou ane, traite comme un nombre, par opposition au cas delements despaces vectoriels
de dimension plus grande.) Sa dierentielle en un point est une forme lineaire sur lespace des
vecteurs de E multipliee par une quantite de D
MO). On trouve ainsi le resultat: le champ des moments est lapplication qui
`a tout O associe r(f)(
t) = 1 et une equation de S
est T(M) = 0).
Voici les conventions. On a un champ daction sur lespace de conguration theorique. Choisis-
sons de representer theoriquement le principe de moindre action en termes dequilibre, en denissant
lenergie theorique comme etant lopposee de laction (ce qui dans notre approche constitue en fait
la denition de laction `a partir de lexperience), et donc la force theorique est egale `a la dierentielle
de laction. Nous denirons la force experimentale comme etant la restriction `a S de la densite
de force theorique par rapport au temps. En eet, nous allons demontrer que cela redonne toutes
les proprietes experimentales usuelles de la force, et ceci nous sert de denition des conventions de
signes theoriques en fonction des donnees experimentales. (Ce choix de faire correspondre ainsi les
forces theorique et experimentale sans changement de signe semble en eet le choix de convention
le plus naturel).
Lois de conservation
Nous allons obtenir les lois de conservation de la mecanique relativiste comme traduction
experimentale des bilans des forces exterieures que nous avons presentes en mecanique de lequilibre,
avec un choix de referentiel. Considerons un syst`eme en evolution (scenario). Chaque instant
(element de la droite darrivee de T) denit un sous-espace de dimension 3 qui divise le scenario
en une partie passee et une partie future. Alors, lobjet qui se conserve se denit comme etant
le torseur (resultante et moment) des forces theoriques que la partie passee exerce sur la partie
future.
En eet, considerons le syst`eme theorique delimite par les deux faces parall`eles dequations
T(M) = t
1
et T(M) = t
2
(avec t
1
< t
2
xes) et des parois laterales. Lannulation de la somme
des forces appliquees `a ce syst`eme se reecrit en disant que ce qui sort par t
2
moins ce qui entre par
t
1
est egal `a la somme de ce qui entre par les parois laterales ou qui sapplique dans linterieur du
syst`eme. Cest donc la variation experimentale de lobjet associe au syst`eme entre les instant t
1
et
t
2
qui est egale au torseur theorique des forces appliquees au syst`eme entre ces instants. Donc, la
derivee par rapport au temps de cette quantite est egale `a la densite temporelle de lexercice de ce
torseur. En particulier, cette quantite se conserve au cours du temps dans le cas dun syst`eme isole
(non soumis `a des forces autres que les forces internes apparaissant dans les coupes du syst`eme en
t
1
et t
2
).
Enumerons `a present ces quantites qui se conservent dans le cas dun syst`eme isole:
- La resultante theorique f se decompose experimentalement en sa partie spatiale (restriction
de f `a S) appelee quantite de mouvement ou impulsion et notee p, et sa partie temporelle appelee
energie, denie par E = f(
t) o` u
t represente le mouvement
theorique de translation dans la direction du temps, du passe vers le futur (et `a la vitesse du temps
qui passe). Pour montrer legalite voulue, remarquons que la dierence entre ces termes vaut
f
t +v). Or
t +v represente un mouvement de coulissement du scenario sur lui-meme, auquel la
force f
doit etre insensible si elle ne comporte pas dechange thermique avec le syst`eme. Bien s ur,
dans le cas contraire cette dierence correspond `a la quantite de chaleur transmise.
Ainsi est retrouvee la relation entre force et energie constituant la theorie de lequilibre dans
le cas experimental, comme consequence du principe de moindre action.
Exemple de calcul concret
Soit une particule de masse m immobile au depart eclatant en deux particules de masses m
1
et m
2
. Calculer leurs energies E
1
, E
2
.
Solution : soient p, p
1
et p
2
les quadrivecteurs energie-impulsion des particules respectives.
Leur conservation sexprime par p = p
1
+ p
2
. La particule de depart etant declaree immobile, p
est dans la direction du vecteur temps; la composante temporelle de p
1
etant
E
1
c
2
, on a le calcul
suivant avec le produit scalaire en mesure temporelle :
m
2
2
= p
2
2
= (p p
1
)
2
= m
2
+m
2
1
2m
E
1
c
2
= E
1
=
c
2
2m
(m
2
+m
2
1
m
2
2
)
Centre dinertie
Nous allons denir le centre dinertie dun syst`eme en termes de la mesure du moment du
syst`eme sur les rotations theoriques daxes de directions spatiales (axes de dimension 2 parall`eles
39
`a S). Notons que ces rotations ne forment pas un groupe (la composee de deux telles rotations
nest pas une telle rotation). Mais rappelons que ce sont seulement les vitesses de rotation qui nous
importent.
Dabord, donnons une description geometrique de ces rotations, en commencant par les rota-
tions vectorielles (ou autrement dit, dont laxe plan passe par un point origine xe).
Voici: une rotation qui deplace le vecteur temps
t suivant une vitesse w S, deplace tout
v S suivant la vitesse
wv
c
2
t.
Ensuite, considerons lensemble des rotations daxe contenu dans un meme espace de simul-
taneite S(t) (espace euclidien de direction S forme des ev`enements dune meme date t dans le
referentiel choisi). La propriete commune de toutes ces rotations est le fait que la vitesse de tout
point de S(t) est colineaire `a
t. Or il sut de decrire le mouvement de tout point de S(t) car le
reste de la rotation sen deduit (comme le mouvement dun plan determine celui des solides poses
dessus). Ainsi, on representera une telle rotation par lapplication ane w denie sur S(t) qui
denit la vitesse de tout point N S(t) par lexpression
w(N)
c
2
t.
Nous venons ainsi de decrire geometriquement un certain sous-espace vectoriel de lalg`ebre de
Lie du groupe des deplacements theoriques. Decrivons maintenant la forme de la restriction dun
torseur `a ce sous-espace, autrement dit une forme lineaire sur ce sous-espace.
A quoi ressemble donc une forme lineaire sur lespace des formes anes sur lespace euclidien
S(t) ? Cest un point pondere de S(t), autrement dit, ou bien un vecteur auquel sapplique la
partie lineaire de w, ou bien un point G pondere par une masse m, designant lapplication lineaire
qui `a tout w associe mw(G). Attention: ce que nous appelons ici et plus bas la masse ne doit
pas etre confondu avec la notion de masse que nous avons invoquee precedemment en parlant de
la masse dune particule, et qui est la denition communement admise en mecanique relativiste
(elle designe ordinairement la norme du vecteur de la resultante conservee, tandis que ce que nous
appelons provisoirement ici la masse est sa composante temporelle.
Calculons la masse m de ce point pondere: elle sobtient en appliquant cette expression au cas
de la forme ane constante w egale `a 1. Ceci correspond au mouvement qui deplace tout point de
S(t) suivant le meme vecteur
1
c
2
t. Cest donc le mouvement de translation de vitesse
1
c
2
t.
Or, nous avons deni lenergie E du syst`eme comme etant moins la composante temporelle de
la resultante, autrement dit la puissance theorique transmise par le passe sur le futur lors dune
translation theorique de vitesse
t.
Do` u nalement
E = mc
2
.
Mais bien s ur pour lobtenir, nous avons triche en ajustant le coecient dans la denition de w
qui se repercute sur la denition de m. Il ne nous reste plus qu`a justier ce coecient par le fait
quil en resulte la propriete suivante:
Mouvement du centre dinertie. Dans un referentiel donne, la vitesse de variation au cours
du temps du centre pondere dinertie mG dun syst`eme isole est egale au vecteur impulsion p du
syst`eme (correspondant `a la forme lineaire impulsion, par le produit scalaire spatial usuel).
Nous allons donner deux demonstrations de ce resultat, lune simple et intuitive, lautre com-
pl`ete et rigoureuse.
Demonstration 1.
Reprenons la remarque demontree dans le cas du plan que le moment par rapport `a un point
sexprime par une forme ane dont la direction est celle du vecteur force. Levolution du centre
dinertie constitue une droite de lespace-temps dirigee par le quadrivecteur energie-impulsion p +
E
c
2
t. Une droite dirigee par ce vecteur apparat experimentalement comme un point anime de la
vitesse
p
m
si ce m est deni par E = mc
2
.
Demonstration 2.
On reprend une demonstration compl`ete partant de la construction des torseurs en termes de
rotations.
40
Pour verier la relation enoncee entre centres ponderes dinertie, xons une forme ane w sur
lespace euclidien S du referentiel, qui est identie `a chacun des espaces S(t), o` u la correspondance
entre tous les S(t) se denit par la translation temporelle dans la direction de
t. Quelle est alors la
relation entre mw(G(t)) et mw(G(t
). On a donc:
mw(G(t
)) mw(G(t)) = (r(t
)) (r(t)) = (r(t
) r(t)).
Ensuite, le mouvement r(t
) par
la translation de vecteur (t
t)
)r(t)(
t).
Enn, la valeur de r(t)(
)) mw(G(t)) = ((t t
)r(t)(
t)) = (t
t)( w) = (t
t)p( w) = (t
t)w( p).
Ceci etant valable pour tout w, on conclut:
mG(t
) mG(t) = (t
t) p.
4.8. Lespace des phases
La mecanique classique que nous avons expose se traduit en une loi devolution, par laquelle
letat dun syst`eme `a un instant donne determine son etat `a venir. Voyons les notions de base qui
interviennent dans cette question.
Letat dune particule classique consiste en sa position et sa vitesse, ou encore sa position et son
impulsion. Plus generalement pour un syst`eme quelconque, son etat en un instant se denit par la
coupe du scenario par cet instant dans lespace-temps, et lensemble de toutes les forces theoriques
(les impulsions) qui sont vehiculees `a travers cette coupe. En eet, pour un syst`eme donne `a
lequilibre, je peux le couper sans perturber lequilibre de la moitie qui minteresse `a condition de
maintenir en place toute la disposition de ce qui se trouve sur cette coupe et dy exercer pour cela
toutes les forces necessaires. Si je minteresse `a levolution que cette moitie aurait si le syst`eme
evoluait sans avoir ete coupe, je peux reproduire la meme evolution en exercant sur la coupe les
memes mouvements et forces qui seraient vehiculees `a travers ce plan si le syst`eme netait pas
coupe. En eet, il ny a pas `a prendre en compte de mouvements de cette coupe qui sortent de
son plan, puisque tout est fait de particules qui, comme nous avons decrit, peuvent etre prolongees
par la simple traction de leur bord suivant leur long, sans en etre aectees. Ainsi tout mouvement
qui sortirait de ce plan est representable de mani`ere unique par un mouvement demeurant dedans.
Pour la meme raison, il nest pas besoin de preciser la composante temporelle des forces theoriques
(les energies) mais seulement celles qui agissent suivant la direction du plan de coupe (impulsions),
car cette composante temporelle est determinee de mani`ere unique par ces conditions.
On appelle espace des phases dun syst`eme la variete constituee de tous les etats quil pourrait
avoir `a un instant donne, o` u la notion de letat dune coupe est constituee de sa forme et celle des
forces qui la traversent (impulsions).
Nous lavons deni `a laide dune coupe, mais lusage que nous en ferons pourrait sappliquer
`a des mani`eres beaucoup plus generales de maintenir le bord dun syst`eme.
Limportant, donc, est quon a un syst`eme en equilibre (un scenario) pouvant etre soumis
`a des potentiels quelconques, et quil y a deux acteurs qui, chacun de son cote, maintient une
partie du syst`eme, et peut agir dessus en la deplacant et en modiant la force quil exerce dessus.
41
Ces deux parties sont disjointes lune de lautre, en sorte que les acteurs interagissent uniquement
par lintermediaire du syst`eme: les actions de lun sur le syst`eme sont ressenties par lautre et
inversement. Si lun choisit par exemple de maintenir xe sa partie, lautre pourra bouger la sienne
et aectera la force `a laquelle le premier doit resister pour maintenir cette xite. Ou sil decide de
laisser sa partie suivre le mouvement suivant une certaine elasticite, les actions de lautre la feront
bouger.
Denissons lespace des phases comme etant lensemble des etats dequilibre possibles pour le
syst`eme dont on oublie les voisinages immediats des deux acteurs, et dont la realisation depend du
bon vouloir conjoint de ceux-ci. (On ne sinteresse pas `a la mani`ere dont chacun se debrouile de son
cote pour faire evoluer sa prise en sorte de saccorder `a chaque instant avec la position du syst`eme
dans lespace des phases). Et subjectivement, chaque acteur se represente lespace des phases en
decrivant tout etat dequilibre du syst`eme en dehors de lui sous la forme de ce quil peut ressentir
de son cote lorsque le syst`eme se trouve dans cet etat.
Theor`eme. Les structures symplectiques attribuees par chaque acteur `a lespace des phases sont
opposees (donc egales si lun a le role demetteur et lautre de recepteur).
Une structure symplectique est (`a peu de chose pr`es) une application qui `a toute courbe fermee
munie dun sens de parcours, associe une quantite daction (que nous traduisons par le terme
denergie dans notre langage theorique), dune mani`ere lineaire (condition que nous ne detaillerons
pas; disons seulement que la meme courbe parcourue dans deux sens opposes doit donner des
resultats opposes). A toute courbe fermee de lespace des phases, donc, chaque acteur associe le
travail total quil doit fournir au syst`eme lorsque letat du syst`eme eectue le parcours de cette
courbe (inniment lentement: letat `a chaque instant est suppose etre un etat dequilibre), en
supposant que cet acteur reprend `a larrivee la meme disposition quil avait au depart (ce qui est
possible puisque le syst`eme parcourant une boucle se retrouve `a la n dans le meme etat quau
depart et donc il ne tient qu`a lacteur de se remettre dans le meme etat).
Ces deux structures symplectiques sont opposees car le syst`eme est suppose etre uniquement
soumis aux actions libres des deux acteurs dune part, `a des forces issues de potentiels dautre
part. Quand le syst`eme revient `a sa conguration initiale apr`es avoir fait un tour, donc, le total
des energies fournies au syst`eme par toutes les forces est nul `a lexception du travail fourni par
les deux acteurs. Au bilan, le travail total donne par lun est donc celui recu par lautre, ce quil
fallait demontrer.
De cela decoule le
Theor`eme de Liouville. Le mouvement de lespace des phases dans lui-meme qui exprime la loi
devolution dun syst`eme au cours du temps, preserve le volume.
Comme nous venons de voir quil preserve la structure symplectique, il sut de donner une
denition de la mesure du volume dans lespace des phases qui depend uniquement de cette struc-
ture symplectique. Note: la notion de volume na un sens mathematiquement coherent que dans
des varietes de dimension nie. Nous supposons donc que lespace des phases est de dimension
nie, ce qui est le cas en pratique pour un syst`eme de particules (il y a 6 dimensions par particule),
mais non pour le cas dun champ.
Dans le cas dun espace des phases de dimension 2, laire dune surface se denit par la quantite
daction associee `a la courbe fronti`ere de cette surface, une orientation etant donnee. Dans le cas
general (en dimension nie), la denition est plus compliquee mais elle existe; elle consiste en une
simple expression tensorielle dont nous admettons ici lexistence.
42
5. Mecanique statistique
5.1. Fondements de la mecanique statistique.
Il y a deux mani`eres possibles de fonder la mecanique statistique: sur la mecanique classique
dune part, sur la mecanique quantique dautre part. Comme la realite est quantique et que la
mecanique classique en est une approximation ayant un large domaine de validite pratique, ainsi
la mecanique statistique nest pas exactement la meme suivant quon la fonde de lune ou lautre
mani`ere, et cest celle fondee sur la mecanique quantique qui decrit plus precisement la realite. Cela
nempeche pas de chercher `a la decrire et lexpliquer dans les termes de la mecanique classique, ce
qui est une approche valable dans nombre de situations pratiques.
Contrairement `a ce `a quoi on pourrait sattendre a priori, son fondement sur la physique
classique comporte des dicultes mathematiques, notamment des probl`emes de divergence, qui
nexistent pas avec la physique quantique. Ainsi peut-on dire que sous certains aspects, le fonde-
ment sur la physique quantique est plus aise pour arriver quasiment aux memes resulats. Comme
il correspond mieux `a la realite, il est plus satisfaisant.
De quoi sagit-il ? Nous avons montre que la loi devolution au cours du temps en mecanique
classique sexprime par une transformation de lespace des phases E qui preserve son volume
(theor`eme de Liouville).
Le passage `a la physique statistique consiste `a dire quon ne connat plus letat x E du
syst`eme dans lespace des phases, mais que cet etat est aleatoire suivant une loi de probabilite
bien determinee appelee letat statistique du syst`eme, qui sexprime par une densite de probabilite:
on peut imaginer la densite de probabilite comme la densite dune substance presente en quantite
totale egale `a 1, comme une cuill`ere de cafe dans la marmite de lespace des phases. La densite de
probabilite en chaque point est le rapport de la probabilite de presence dans un petit voisinage de
ce point sur le volume de ce voisinage.
De l`a on peut denir lentropie comme une mesure de la dilution de cette probabilite:
S =
_
E
p ln p
moyenne par rapport aux possibilites elementaires de se retrouver en les dierents lieux de E (donc
integrale suivant p fois lelement de volume) de la mesure ln p de cette dilution.
Un des probl`emes que cela pose est le probl`eme de la divergence, notamment du fait que dans
le cas dun champ classique lespace des phases est de dimension innie et donc cela pose des
probl`emes `a la notion delement de volume. Concr`etement, si on se detourne de la simple manie
de pinaillage danalyse des mathematiciens pour adopter les grandes demarches dapproximations
ch`eres aux physiciens, il nen reste pas moins que les divergences en question devraient se retrou-
ver concr`etement dans les consequences experimentales de ces hypoth`eses, ce quon a appele la
catastrophe ultraviolette: en considerant lespace des phases de dimension innie du champ
electromagnetique, le rayonnement thermique du corps noir dune temperature donnee devrait
avoir une intensite tendant vers linni au fur et `a mesure quon inclut dans le calcul ces dimen-
sions correspondant aux frequences de plus en plus elevees, qui sont autant de voies de rayonnement
supplementaires.
Un autre inconvenient de cette presentation est quelle semblerait indiquer une conservation et
non une augmentation de lentropie, le mouvement deplacant les concentrations de probabilite et
ne les diluant pas. Ceci peut etre surmonte sous forme de lapproximation dun melange (resultat
de mouvement o` u la concentration demeure mais est dispersee un peu partout) par une dilution,
du fait quil est pratiquement impossible de reeectuer `a linverse ce mouvement assez precisement
pour eectivement defaire le melange de facon constatable en pratique.
Un autre defaut encore de lapproche par la physique classique est quelle nadmet pas la
possibilite dune variation du nombre de particules presentes. En eet, la dimension de lespace
vaut six fois le nombre de particules presentes, donc une creation ou une annihilation de particules
devrait sexprimer par une transformation preservant le volume dun espace de phases vers un
autre de dimension dierente, ce qui apparat quelque peu absurde. En eet, si `a la limite on
43
pourrait considerer une creation de particules comme plongeant le premier espace en une sous-
variete du suivant (denie par le point exact o` u la nouvelle particule a ete creee), la densite de
probabilite qui avait une dilution volumique dans le premier naurait plus une dilution volumique
dans le second mais une concentration sur une sous-variete, ce qui donnerait alors `a lentropie
nale la valeur de moins linni (!). Par exemple, si on interpr`ete classiquement la lumi`ere comme
syst`eme de particules et non comme onde, toute emission de lumi`ere apparat comme une creation
de particules.
Par rapport `a cela, que nous dit la physique quantique ? Quil y a une limite `a la division
du volume de lespace des phases (et donc une limite `a la concentration de la probabilite). En
eet, dans toute direction de surface de dimension 2 dans lespace des phases, on a une mesure des
aires donnee par la restriction de la structure symplectique `a cette surface. Une aire y etant ainsi
homog`ene `a une action, on a comme unite de mesure naturelle de cette aire la constante de Planck
h. Alors, la possibilite de division de cette surface est limitee comme ne pouvant pas etre plus ne
quun decoupage en cellules daire h = 2h chacune (cela se comporte comme tel decoupage bien
que les fronti`eres entre les cellules ne soient pas localisables en termes de la geometrie usuelle).
Ainsi sexprime le principe dincertitude de Heisenberg: letat dun syst`eme dans lespace des
phases nest pas plus precisement deni suivant chaque direction de surface, que par la donnee de
la cellule qui le contient dans un tel decoupage ou. Par consequent, le volume minimal quon
peut considerer dans un espace des phases de dimension 2k vaut h
k
. En fait, la realite qui se cache
derri`ere lapparence classique dune portion de lespace des phases de volume nh
k
, est un espace
de Hilbert de dimension n, et ce qui se cache derri`ere une apparente evolution incompressible de
ce volume, est une rotation lespace de Hilbert.
Alors, nous allons ici developper la mecanique statistique `a partir dun mod`ele de depart
mathematiquement simple, intuitivement proche de la mecanique classique tout en reetant assez
bien les proprietes essentielles de la realite quantique.
Il consiste `a partir dun ensemble E discret (ni ou denombrable) nomme ensemble des etats
classiques. Il sinterpr`ete classiquement comme lensemble des cellules de volume h
k
en lesquelles
on aurait decoupe lespace des phases, ou quantiquement comme celui des vecteurs dune base
choisie dans lespace de Hilbert. Nous oublierons totalement la forme geometrique de lespace des
phases, son rapport avec lespace physique et ses points dequilibre au sens experimental classique.
On consid`ere quon ne connat pas la valeur x E de letat classique du syst`eme mais que cet
etat est aleatoire suivant une loi de probabilite p bien determinee: `a chaque etat classique x est
associe sa probabilite p(x) detre realise. Cette loi de probabilite p est appelee letat statistique (ou
thermodynamique) du syst`eme. Un etat statistique sur un espace E est donc une application p de
E dans [0, 1] dont la somme des valeurs vaut 1:
xE
p(x) = 1.
On passe ainsi de la notion detat classique `a la notion detat statistique en remplacant lespace
E par lensemble des lois de probabilite sur E. On passe alors de la notion dequilibre classique
`a celle dequilibre statistique (ou thermodynamique). Un etat dequilibre statistique est un etat
statistique qui ne varie pas au cours du temps. Lequilibre statistique nimplique pas lequilibre
classique car il enonce seulement que la diminition de chaque p(x) par levolution possible de letat
x vers dautres etats sera exactement compense par son augmentation due aux evolutions des autres
etats vers x, en sorte que p(x) demeure constant.
Pour pouvoir etablir ses proprietes, il faut partir dun postulat physique que nous allons enoncer
maintenant. Introduisons dabord des notations.
Soit un syst`eme S isole, detat statistique p
1
sur un espace E `a linstant t
1
, en evolution vers
un espace E
`a linstant t
2
> t
1
. Pour tous x E et y E
yE
p(x, y) = 1,
et cet objet determine la transformation de letat statistique du syst`eme de p
1
`a linstant t
1
`a p
2
`a linstant t
2
par la formule
y E
, p
2
(y) =
x
p(x, y)p
1
(x).
44
Laxiome de base dont nous allons partir, senonce alors par la formule :
y E
xE
p(x, y) 1
ou bien cette meme formule mais comme une egalite, en fonction du contexte pour la raison
suivante: fondamentalement, la loi est celle dune egalite; mais en pratique, on peut se restreindre
`a lexpression des parties qui interviennent eectivement: E E
0
, E
E
0
avec : x E
0
, p
1
(x) =
0 x E dune part, p
2
(x) = 0 x E
E(x)E
0
kT
o` u k est la constante de Boltzmann servant de correspondance entre les energies et les temperatures,
E(x) est lenergie de letat x et E
0
est la quantite qui sert `a la normalisation :
x
p(x) = 1 e
E
0
kT
=
x
e
E(x)
kT
E
0
= kT ln
_
x
e
E(x)
kT
_
.
En fait, nous verrons que E
0
est lenergie libre du syst`eme dans cet etat dequilibre thermody-
namique.
Dans la suite on xera la constante de Boltzmann `a k = 1 par denition de lunite de tempera-
ture.
En voici la demonstration, `a partir de notre axiome sous sa forme degalite et de lhypoth`ese
suivant laquelle lenergie est la seule quantite physique qui se conserve dans le cas dun syst`eme isole.
(Remarque: il existe des situations physiques comportant dautres param`etres qui se conservent,
ce qui aboutit `a des lois dequilibre plus compliquees).
Dabord, montrons que la condition dequilibre thermique dun syst`eme isole est que p(x) doit
ne dependre que de lenergie E(x). En eet, en se restreignant `a un niveau denergie donne, la plus
forte probabilite nale ne peut exceder la plus forte probabilite initiale, et de meme la plus faible
ne peut pas diminuer. Si elle demeurait constante, le nombre detats ayant cette meme probabilite
diminuerait: il ne peut augmenter et sil ne diminuait pas, en repetant le meme raisonnement sur
les etats restants menant `a un etat nal dequilibre p, alors cette fonction p serait une quantite qui
se conserve, contrairement `a lhypoth`ese que lenergie (et donc aussi toute fonction de lenergie)
est la seule quantite qui se conserve.
En tout cas, si les probabilites sur un niveau denergie sont egales `a linstant t, elles le sont
necessairement aussi `a linstant t
.
Ensuite, la relation entre les probabilites pour des energies dierentes vient concr`etement de
la possibilite dechanger cette energie avec des parties du milieu ambiant. Soit une particule du
milieu ambiant pouvant se trouver dans un etat e denergie E
1
avec la probabilite p
1
ou dans
un etat e
denergie E
2
avec la probabilite p
2
, et venant interagir avec notre syst`eme S. On
45
suppose que ces probabilites p
1
et p
2
ne dependent pas de letat de S (on dit que la particule nest
pas correlee `a S; lhypoth`ese sous-jacente est que le milieu ambiant est inniment plus vaste et
quil peut donc echanger avec S une quantite de chaleur quelconque sans modier ses proprietes
generales). Comme on la suppose en equilibre thermique avec le milieu ambiant, le syst`eme forme
de S et de la particule doit etre en equilibre thermique, et en particulier deux etats de meme
energie doivent avoir la meme probabilite. Donc, quels que soient deux etats x et x
de S tels
que E(x
) E(x) = E(e
) et (x
) = E(x
)p
1
, autrement dit
p(x
)
p(x)
=
p
2
p
1
.
Donc le rapport des probabilites de deux etats ne depend que de la dierence denergie entre ces
deux etats et est identique au rapport des probabilites de deux etats dune particule du milieu
ambiant ayant la meme dierence denergie. (Au lieu dune particule on peut prendre un grand
syst`eme, les consequences sont les memes). La demonstration de la loi de Boltzmann est maintenant
terminee.
On peut remarquer la propriete suivante, qui se deduit de notre axiome et le generalise. Soit
un syst`eme S detat statistique p sur un espace E `a linstant t. On le met en contact thermique
avec un syst`eme exterieur S
:
y E
xE
p(x, y)e
E(y)E(x)
T
1
ou bien la meme formule avec egalite, pour les memes raisons.
5.3. Energie, energie libre
Nous allons calculer lenergie libre F du syst`eme dans letat thermodynamique p, cest-`a-
dire lenergie quon peut en extraire par un travail mecanique (reversible), sans tenir compte des
echanges de chaleur avec le milieu ambiant `a temperature T.
Dabord, denissons lenergie U dun etat statistique p : cest la moyenne des energies des
etats particuliers, suivant leur probabilite :
U(p) =
x
p(x)E(x).
Ensuite, pour calculer lenergie libre il faut choisir une reference pour laquelle on convient que
cette energie est nulle. Admettons pour le moment quelle est nulle dans le cas o` u le syst`eme est
en equilibre suivant la loi de Boltzmann avec E
0
= 0 (et nous verrons pourquoi cette supposition
est bonne; en attendant, prenons cela comme une denition) : p(x) = e
E(x)
T
. Tout autre etat p
peut (tr`es theoriquement !) se ramener `a cette situation par le travail mecanique suivant.
On commence par isoler S thermiquement du milieu ambiant et interdire toute evolution
thermique de S. Autrement dit, le decoupage en cellules de lespace des phases est transporte par
levolution en sorte quelle sy exprime par p(x, y) = 1 si x = y et 0 sinon. Etant donne un etat
statistique p xe (suppose connu, tandis quon ne connat pas letat particulier x du syst`eme),
modions mecaniquement la fonction denergie E(x) pour la remplacer par la fonction E
denie
par
E
(x) = T ln p(x).
A larrivee, letat p etant reste le meme, son energie libre sest annulee, dapr`es notre hypoth`ese.
Comme cette transformation est adiabatique (i.e. sans echange de chaleur avec lexterieur) et
46
reversible, lenergie libre F(p) du syst`eme au depart est egale `a lenergie retiree sous forme de
travail lors de cette transformation :
F(p) = U(p) U
(p) =
x
p(x)(E(x) +T ln p(x)).
On pourrait considerer que ce raisonnement nest pas valable du fait quil faudrait travailler avec
lenergie reellement echangee et non son esperance, mais nous allons conrmer plus loin ce resultat
par dautres moyens. Dej`a, le fait que dans le cas de lequilibre de Boltzmann le E
0
concide avec
lenergie libre ainsi denie est immediat (on a tout fait pour).
Ensuite, et cest l`a le plus interessant, voyons comment cette energie libre se modie lorsque
le syst`eme subit une transformation innitesimale, dans laquelle les fonctions E(x) et p(x) se
modient innitesimalement de E(x) et p(x) respectivement.
L`a encore par denition, la part deet direct pour p xe de E(x) sur lenergie libre F(p), de
meme que sur lenergie totale U(p), concide avec le travail fourni de lexterieur sur le syst`eme,
W =
x
p(x)E(x).
Dautre part, leet de p, qui apporte `a lenergie U une quantite de chaleur
Q =
x
E(x)p(x)
modie F dune ampleur de
x
p(x)(E(x) +T ln p(x))
puisque
x
p(x)(ln p(x)) =
x
p(x) = (
x
p(x)) = 0.
On remarque alors que la condition pour que les variations de F au premier ordre ci-dessus soient
nulles quel que soit p (qui verie toujours
x
p(x) = 0) pour une loi denergie E xee, est
que E(x) + T ln p(x) soit independant de x, donc que p soit deni par la loi de Boltzmann de
temperature T.
Ainsi, lequilibre statistique concide avec lequilibre de letat p dans lespace des etats statis-
tiques, en prenant en guise denergie potentielle lenergie libre F.
On remarque que cet unique etat dequilibre est precisement celui o` u lenergie libre prend sa
valeur minimale.
En eet (en cherchant des p tels que F soit la plus petite possible), on remarque quelle ne prend
pas sa valeur minimale en un etat statistique qui soit au bord (une valeur limite) de lensemble
des etats statistiques possibles, cest-`a-dire en loccurence un etat qui sannule pour un certain x
(x, p(x) = 0). En eet, en sapprochant dun tel bord, ln p(x) approche (moins linni), donc
p(x) donne une contribution denergie libre importante de signe contraire p(x)(E(x) +T ln p(x))
ce qui prouve que F augmente lorsquon sapproche du bord du domaine. Donc F doit prendre
sa valeur minimale pour une position de p interieure `a son domaine (i.e. un p qui ne sannule
pas) donc une valeur autour de laquelle ses variations sont nulles au premier ordre, ce quon vient
detudier.
Verions maintenant que lenergie libre est eectivement la mesure du travail quon peut retirer
reversiblement dun syst`eme `a lequilibre statistique en lamenant `a un etat pur x
0
(deni comme
etat statistique par p(x
0
) = 1 et p(x) = 0 pour tout autre x) grace `a des echanges thermiques avec
le milieu exterieur de temperature T : le procede consite `a amener le syst`eme dun etat statistique `a
lautre en modiant la loi denergie E (et donc lui fournissant un travail) de facon progressive pour
le laisser `a chaque instant rejoindre (par contact avec le milieu exterieur) lequilibre thermique
des lois denergie successives. Alors la part thermique de la variation de lenergie libre devient
47
dautant plus negligeable, et lenergie mecanique fournie se rapproche dautant plus du montant
de cette variation que cette evolution est progressive (la somme des travaux se rapprochant de
son esperance du fait que, plus levolution est progressive, plus le travail se divise en contributions
independantes, la contribution de chaque instant etant aleatoire dapr`es la probabilite p dequilibre
de linstant considere sans correlation avec les contributions des instants precedents).
Il reste la question : au cours dune transformation quelconque dun syst`eme, lenergie libre
F diminue-t-elle ? Comme lenergie U se conserve pour un syst`eme isole, la question se ram`ene `a
celle de la dierence entre les deux.
5.4. Entropie.
La formule de lentropie S dun etat statistique p se deduit de celle de lenergie libre que nous
avons etablie, suivant la formule F = U TS :
S(p) =
x
p(x) ln p(x)
(`a multiplier par la constante de Boltzmann que nous avons ici xee `a 1). Lentropie dun syst`eme
forme de deux sous-syst`emes non correles (p(x, y) = p
1
(x)p
2
(y)) est la somme des entropies S
1
=
S(p
1
) et S
2
= S(p
2
) de ces sous-syst`emes :
S(p) =
x,y
p
1
(x)p
2
(y) ln(p
1
(x)p
2
(y)) =
x,y
p
1
(x)p
2
(y) ln(p
1
(x)) +
x,y
p
1
(x)p
2
(y) ln(p
2
(y))
= (S
1
+S
2
).
Dans le cas de syst`emes correles, lentropie du tout S = S(p) est inferieure `a la somme des
entropies S
1
et S
2
des etats p
1
(x) =
y
p(x, y) et p
2
(y) =
x
p(x, y). En eet, en attribuant
`a ces deux sous-syst`emes les energies respectives E
1
(x) = T ln p
1
(x) et E
2
(y) = T ln p
2
(y),
on constate que U(p) = U(p
) o` u p
(x, y) = p
1
(x)p
2
(y);
mais p
etant letat dequilibre statistique de cette energie, il poss`ede la plus grande entropie:
F(p
) = S
1
+S
2
.
Verions maintenant que lentropie dun syst`eme isole ne peut quaugmenter au cours du
temps, `a partir de notre axiome.
On a pour une evolution de p
1
`a p
2
dun syst`eme isole
S
1
=
x
p
1
(x) ln p
1
(x) =
x,y
p(x, y)p
1
(x) ln p
1
(x)
S
2
=
y
p
2
(y) ln p
2
(y)
Or, pour tout y on a
x
p(x, y)p
1
(x) ln p
1
(x) p
2
(y) ln p
2
(y)
parce que lapplication qui `a u associe uln u etant convexe, la moyenne ponderee par p(x, y) des
images des p
1
(x) est superieure `a limage de leur moyenne p
2
(y).
Maintenant que la croissance de lentropie est etablie, on en deduit la decroissance de lenergie
libre dun syst`eme S lors dun echange thermique avec un milieu S
de temperature T ainsi :
Lenergie totale U(S+S
)
diminue. Les syst`emes S et S
) au
depart mais lui est superieur `a la n. Comme S
E
kT
devient e
i
A
h
o` u A est laction (normalement laction
est notee S mais nous avons dej`a trop use la lettre S).
Dans cette analogie, `a la fonction probabilite correspond la fonction amplitude qui nest plus
une probabilite, puisquelle peut prendre des valeurs negatives voire complexes, que sa somme nest
plus contrainte `a valoir 1, et quelle ne sera pas la probabilite qui interviendra concr`etement.
La theorie R
Cest celle qui traite du probl`eme du lien `a lexperience avec sa realite factuelle, ses mesures, son
hasard, son role de lobservateur. Ses fondements mathematiques sont parfaitement denis et sans
myst`ere, permettant de calculer les probabilites experimentales en fonction precise des resultats de
la theorie U. En fait, cest cette theorie R elle-meme qui est la mecanique statistique quantique
que nous avons evoque. Son ecriture en fonction de U nest aectee que de facon supercielle par
la grande reformulation que traverse U quand il passe de la mecanique quantique de base `a son
expression relativiste.
Le probl`eme est quelle arrive sur la theorie U sans y etre invitee; elle constitue une rupture
par rapport `a levolution gouvernee par U, que U est par nature incapable de produire lui-meme
(quelle que soit la complexite de lenvironnement quon pourrait prendre en compte). De plus,
aucune r`egle ne semble pouvoir indiquer quand ni comment elle intervient. Mais elle intervient
dune telle mani`ere que la question des param`etres particuliers de son intervention, nayant (jusqu`a
present du moins) aucune inuence mesurable sur les phenom`enes, ne se pose nalement pas : elle
intervient comme si elle nintervenait pas. Elle est issue de nulle part et elle est introuvable (sans
quil y ait pour autant la moindre ambigute pratique sur les resultats de ses predictions). De
la mani`ere la plus remarquablement subtile (et facilement demontrable), elle est reinterpretable
comme fondue `a linterieur de la theorie U jusquau dernier moment : tant que ce sont les appareils
de mesure qui observent, on peut interpreter ces appareils de mesure comme nayant pas declenche
R mais comme etant de simples objets quantiques determines par U, et comme si seuls les humains
(ou plus generalement les organismes vivants) avaient le pouvoir de la faire intervenir, ce qui dici
l`a resoud le probl`eme de son intervention comme nayant pas eu lieu.
Dun autre cote, d`es quun syst`eme un tant soit peu complexe et thermiquement agite comme
un organisme vivant ou meme un simple appareil de mesure entre dans le coup, son agitation
thermique engendre (conformement `a U) un phenom`ene statistique de perte de controle de certains
param`etres du syst`eme nomme decoherence, tel quil ne reste plus aucune chance pour que la
dierence entre lhypoth`ese de la non-intervention de R ou de son intervention dune mani`ere
correspondant precisement au type dobservation eectuee, puisse encore nalement jouer quelque
role observable que ce soit. Cette sorte dintervention virtuelle donne ainsi en pratique le droit
dinterpreter R comme ayant eu lieu.
Mais, alors quau niveau microscopique (fondamental) lintervention de R passe pour inexis-
50
tente ou virtuelle, son existence reelle globale est quasiment incontestable : cest elle qui, une fois
pour toutes, xe `a partir de rien lorientation du temps thermodynamique (celui de la croissance
de lentropie, equivalent au choix de lordre de causalite temporel) et qui fait se realiser un seul
des avenirs possibles suivant les probabilites donnees par les calculs lorsque ce que la theorie U
determine est en fait une combinaison davenirs ne se ressemblant pas du point de vue de ce qui
est observe subjectivement `a lobservateur (par exemple dans la fameuse experience du chat de
Schrodinger, une combinaison (chat mort)+(chat vivant)). (A la rigueur on nen a pas de preuve,
on pourrait supposer quils se realisent tous conformement `a U dans des univers parall`eles qui `a
cause de la decoherence perdent toute relation entre eux).
Et en fait, la situation est encore pire que cela. Cette theorie R ne fait pas que laisser par-
fois un intervalle de temps et de circonstances possibles pour son intervention, entre lesquelles on
ignorerait quelle hypoth`ese dintervention serait la vraie. Elle va jusqu`a demontrer, si on admet
quelques principes physiques dicilement contestables, quaucune des hypoth`ese raisonnables de
loi generale pouvant determiner les circonstances particuli`eres de son intervention dans lintervalle
des possibilites, ne peut nalement tenir la route, cet intervalle de possibilites etant nalement
reduit `a lensemble vide dapr`es ces principes sans quon puisse pour autant la prendre au pi`ege de
ses contradictions. Voil`a ce que nous montrera le paradoxe EPR : non seulement on ne sait pas
comment seectue lintervention de R, mais en plus, alors que les predictions experimentales de
la theorie demeurent parfaitement coherentes et sans ambig uite, le raisonnement montre quaucun
scenario particulier dintervention de R ne peut etre considere comme le vrai sans rompre arbi-
trairement une symetrie du probl`eme quaucune experience ne vient mettre en doute par ailleurs.
Aucun, sauf limpensable interpretation en univers parall`eles (suivant laquelle R na jamais lieu et
le chat de Schrodinger demeure dans la superposition mort+vivant), toujours en coherence avec
toutes les interpretations geocentriformes particuli`eres.
6.2. Le paradoxe EPR
Cest lun des paradoxes les plus etranges de la physique quantique (theorie R), qui, au-del`a de
la simple dualite onde/particule ou du principe dincertitude, exprime assez nettement le probl`eme
que cette physique pose au realisme classique. Et il semble que sa signication precise nait pas ete
toujours vulgarisee tr`es parfaitement : on trouve souvent larmation dune inuence instantanee
dune particule sur lautre, comme si cette inuence etait reelle. Do` u pretexte pour dire que la
theorie de la relativite restreinte, qui entrane limpossibilite dune relation de cause `a eet propagee
plus vite que c, serait fausse. Or, dans ce phenom`ene quantique il ny a rien, ni theoriquement
ni experimentalement, qui permette de situer eectivement dans lespace-temps quelque inuence
que ce soit plus rapide que c. Seul le realisme classique peut nous y conduire, en deposant l`a son
echec quil na pas voulu avouer ailleurs.
Et pour mieux cerner sa signication, nous nous concentrerons ici sur lenonce exact des pre-
dictions experimentales de la theorie quantique dans les purs termes des consequences observables
de R oubliant tous ses liens avec U par lesquels ces resultats se demontrent habituellement, en sorte
de ne pas confondre les myst`eres de la realite avec les intermediaires de calcul. Ces predictions
auraient ete verifees experimentalement dapr`es les nouvelles de ces derni`eres annees. (Mais je ne
minteresse pas precisement aux details experimentaux du probl`eme, et le but de cette page est
uniquement den presenter ses aspects theoriques.)
Quelles particules utiliser ?
Lexperience a ete faite avec des photons correles. Do` u lerreur classique de certaines personnes
nayant pas de connaissances solides en physique, de supposer que ce phenom`ene de correlation
sexpliquerait par le fait que la duree du voyage dun photon est pour lui-meme toujours nulle, ce
qui preserverait un lien de causalite reciproque de ces photons sur leur origine commune. Ceci est
faux, la vitesse de la lumi`ere nayant rien `a faire avec tout cela : le phenom`ene est en principe
independant du type de particule utilise et de leurs vitesses.
A ceux qui font cette erreur, je conseille de seorcer de mieux comprendre ce que dit la
relativite restreinte `a ce sujet : la mesure des durees est une chose, mais lordre de causalite
temporel en est une tout autre. Entre deux ev`enements distincts relies par une droite de direction
de lumi`ere, bien que lecart en mesure de temps soit nul, lordre temporel na lieu que dans un seul
51
sens. Ce qui peut inuencer un ev`enement se trouve dans son cone de lum`ere passee (interieur et
fronti`ere), tandis que les points de son cone de lumi`ere future ou de lhyperplan t = 0 en sont bien
loin.
La meme experience peut se concevoir avec des electrons, sauf que dans ce cas elle devient
beaucoup plus dicile `a realiser techniquement. Voici pourquoi : la reussite de lexperience suppose
que la particule (ou plus precisement le param`etre qui nous interesse dans la particule, ici le spin
de lelectron) na subi aucune interaction thermique avec son environnement, qui ferait perdre en
la dispersant dans la nature cette information sur le spin quon veut etudier.
Or, lelectron presente un risque dinteraction avec lenvironnement beaucoup plus fort que le
photon, parce quil interagit avec les photons (le champ electromagnetique) tandis que le photon
ninteragit quavec des charges electriques, or il est beaucoup plus dicile de vider lespace de ses
photons que de le vider de ses charges : le rayonnement thermique, quon pourrait dailleurs appeler
lagitation thermique du champ electromagnetique, est en general relativement important, et il
a dautant plus le temps de perturber un des electrons avant quils ne parviennent `a la distance
voulue lun de lautre, que leur vitesse est faible devant celle de la lumi`ere. Donc probablement le
seul moyen de faire le vide de rayonnement serait de refrigerer les parois pr`es du zero absolu.
Cependant nous decrirons cette experience dans le cas delectrons, pour des motifs theoriques :
1) Dans le fond, `a equivalence mathematique pr`es, cela ne change rien : toute experience
(et les paradoxes qui en decoulent) avec le spin dun electron est exactement traduisible en une
experience avec la polarisation dun photon et inversement. Cette equivalence vient du fait que le
nombre detats quantiques possibles du spin de chaque particule (ce qui designe la dimension de
son espace de Hilbert) est le meme, `a savoir 2 (il en faut au moins 2 pour quil se passe quelque
chose, `a partir de 3 ce serait plus complique).
2) Entre ces deux cas, cest le cas de lelectron, et uniquement lui, qui manifeste dans la
geometrie de lespace physique la forme des symetries internes du probl`eme quantique considere,
ou si on pref`ere celle de ses manifestations experimentales. Ces proprietes geometriques sont
remarquables (son rapport `a U sexprime par la theorie des spineurs), plus que dans la description
de la polarisation du photon.
3) Par la meme occasion, le recit de cette experience permettra de se familiariser avec les
proprietes du spin de lelectron et la notion de doublet delectrons quon rencontre en chimie.
Nous allons donc maintenant entrer dans quelques manifestations de la theorie R. Noublions
pas quil nexiste aucune separation quon puisse faire entre cette theorie et la mecanique statis-
tique. Les vecteurs que nous emploierons seront uniquement des vecteurs de lespace euclidien `a 3
dimensions, un referentiel galileen etant xe une fois pour toutes.
Mesure du spin dun electron
Prenons dabord le cas dun seul electron. Cest une particule de spin
1
2
. Que represente son
spin ? Dans le langage de la physique classique, cest son moment cinetique de rotation sur lui-
meme. Cest bien l`a lobjet quantique qui se conserve dans U et qui, dans la correspondance entre
physique classique et physique quantique, traduit la notion de moment cinetique qui se conserve.
Or, du point de vue de la physique classique, en choisissant conventionnellement une orientation
de lespace, on peut representer ce moment cinetique par un vecteur . Comme un moment
cinetique est homog`ene `a une action, cest donc h lui servira dunite de mesure de la norme de
en physique quantique, et la propriete de spin
1
2
signie que classiquement, |||| =
1
2
.
Mais, du point de vue quantique, il ny a que deux etats possibles du spin dun electron ,
pouvant donner un seul bit dinformation : ce spin vaut un tel vecteur de norme
1
2
, ou bien son
oppose. Et pas un autre vecteur. Il est oriente dans un sens, mais il na pas de direction. Sil avait
une direction, cette direction serait une propriete du spin de lelectron plus riche que cette seule
alternative `a deux possibilites : ce serait un param`etre porte par lelectron pouvant varier con-
tinument, en prenant une innite de valeurs dierentes au passage. Mais une telle diversite detats
nexiste pas. (On peut voir avec la teleportation quantique quen un certain sens, linformation sur
letat de spin de lelectron peut etre classiquement contenue dans deux bits dinformation, soit un
etat parmi quatre possibles.)
52
Alors, comment se manifeste le sens du spin de lelectron, sans quil ait une direction ? Cest
lexperimentateur qui, pour observer ce sens, est libre den decider la direction comme il veut. Il
choisit une droite, ou ce qui revient au meme une paire de vecteurs opposes {, } de norme
1
2
, de
mani`ere symetrique : il ne propose pas un vecteur puis son oppose, mais les deux en meme temps
pour nen privilegier aucun a priori. Son experience consiste `a demander `a lelectron : Autour
de cette droite, dans quel sens tournes-tu ? (Ou pour le dire plus rigoureusement, il lui demande
non le vecteur moment cinetique mais sa composante suivant la direction donnee, sans soccuper
des autres composantes). Alors, necessairement, sans lombre dune hesitation ni quelque autre
humeur que ce soit, celui-ci donnera sa reponse, qui sera lun des deux vecteurs et (en fait,
lune des deux valeurs
1
2
de cette composante). Mais alors, comment cette reponse depend-elle
de la direction choisie ?
Voici ce que dit la theorie dans le cas dun electron dans un etat spatial precis, cest-`a-dire une
disposition de la fonction donde dans lespace physique, qui englobe linformation en positions et
impulsions de cet electron (ceci an deviter toute question de correlation entre letat spatial et
letat de spin):
1) Pour tout electron detat spatial donne issu dun processus dont les conditions initiales
seraient enti`erement connues en un certain sens (`a savoir quil nexiste aucune inuence exterieure
qui aurait pu etre analysee et qui ne la pas ete; `a ce titre, un etat statistique est considere comme
enti`erement connu), il existe un vecteur de norme ||||
1
2
qui resume linuence mesurable de
ces conditions sur le spin de lelectron considere separement du contexte de lexperience, au sens de
la r`egle suivante: quel que soit le vecteur unitaire u, si lexperimentateur decide alors de mesurer
le spin suivant la direction de u, la probabilite dobtenir
u
2
sera egale `a
1
2
+ u. Ce vecteur est
alors appele le spin de lelectron produit par ce processus.
On remarque que cet enonce est coherent avec la possibilite de decider au hasard du processus
qui produira le spin: le processus qui consiste `a decider suivant une probabilite p de faire appel `a un
processus produisant le spin et suivant la probabilite 1p de faire appel `a un autre processus qui
produit le spin
.
2) Quelle quait pu etre la situation auparavant, si on mesure le spin dun electron suivant la
paire {, }, apr`es la mesure le spin de lelectron au sens du 1) sera egal au resultat trouve par la
mesure (cette mesure detruit donc enti`erement toute autre information qui a pu exister auparavant
dans ce spin).
Ainsi, une fois obtenu le resultat dune mesure, par exemple
1
2
u, si on lui pose `a nouveau
exactement la meme question (suivant la meme direction u), il donnera necessairement la meme
reponse
1
2
u, Par contre, si on lui pose ensuite la question de sa direction par rapport `a un autre
vecteur unitaire v, il repondra par une nouvelle valeur de =
1
2
v suivant la probabilite egale `a
(
1
2
+ u). Si apr`es cela on lui redemande sa direction suivant u, il aura oublie sa premi`ere reponse,
mais sa nouvelle reponse dependra uniquement de la derni`ere quil avait donnee, suivant la meme
loi de probabilite.
Preparation de la paire correlee
On part dun doublet delectrons. Cest un ensemble de deux electrons qui sont dans un meme
etat spatial, mais dans des etats de spin opposes au sens de ce que nous allons decrire. Pour
lobtenir, il sut de les contraindre `a se mettre dans le meme etat spatial, car le principe dexclusion
de Pauli les empeche detre `a la fois dans le meme etat spatial et le meme etat de spin (ou pour le
voir autrement, il implique que deux electrons de meme etat spatial sont de spin opposes). (En fait,
le principe dexclusion de Pauli et le principe dincertitude de heisenberg ne se pas des principes
mais des consequences dautres lois).
Enn, cela nest pas parfaitement exact : ils sont bien dans des etats de spin opposes mais
leurs etats spatiaux ne sont pas identiques mais seulement assez proches (cest-`a-dire que les prob-
abilites de resultats de toute mesure de cet etat spatial sur les deux electrons sont des probabilites
voisines lune de lautre et de faible correlation. . . en les distinguant lun de lautre suivant leur spin
bien entendu), `a cause de la repulsion electrostatique qui empeche cette identite detre parfaite.
Navement, on pourrait penser que cette repulsion entre les electrons les empeche de se rencontrer,
et rend ainsi superu le principe dexclusion de Pauli. Ce nest pas vrai, `a cause dun phenom`ene
53
ondulatoire quantique qui se manifeste par ce quon appelle leet tunnel : alors quil faudrait
classiquement une energie innie pour que des charges ponctuelles de meme signe se rencontrent,
en mecanique quantique la densite de probabilite du syst`eme dans lespace de conguration dun
doublet ne tend pas vers 0 lorsque la distance r entre eux tend vers 0.
Pour que le principe dexclusion de Pauli puisse se mettre en uvre, il faut le rendre dominant
sur la repulsion electrostatique. Dans le cas dune paire delectrons seuls mobiles dans un environ-
nement xe, le seul moyen est de reduire leur etalement spatial x. En eet, lenergie de repulsion
electrostatique est proportionnelle `a
1
r
tandis que lenergie de repulsion due au principe dexclusion
se lit sur le principe dincertitude de Heisenberg avec r x : limpulsion p est de lordre de
h
x
et lenergie cinetique dune particule dimpulsion p et de masse m vaut
p
2
2m
, soit une energie de
lordre de
h
2
mr
2
. Pour des distances assez faibles, il domine donc sur la repulsion electrostatique.
En pratique on na pas besoin que le principe dexclusion devienne inniment plus grand que
la repulsion electrostatique : si les electrons sont connes dans un espace reduit, la decomposition
en etats distincts suivant les niveaux denergie donne dune part des doublets (o` u les spins sont
exactement opposes meme si les etats spatiaux peuvent etre tr`es dierents), et dautre part des
etats o` u les spins des deux electrons sajoutent en un certain sens. Le plus bas niveau denergie des
doublets est plus bas que celui des paires delectrons o` u les spins sajoutent; il sut donc de laisser
le syst`eme perdre son energie pour obtenir un doublet. En fait, ce nest pas exactement vrai `a
une distance encore plus petite `a cause du moment magnetique de lelectron qui vient perturber ce
phenom`ene par linteraction entre les spins des deux electrons, mais cest une bonne approximation.
En particulier dans le cas de latome dhelium, le puits de potentiel d u au noyau a cet eet de
conner les electrons dans un meme etat spatial, creant un doublet.
Maintenant quon a le doublet, il faut separer les electrons. Bon, ici ce nest pas pratique,
mais imaginons quon arrive `a virer le noyau sans inuer sur le spin (en le bombardant par un
neutron de haute energie par exemple, ou encore en appliquant un fort champ electrique qui envoie
les electrons dans un sens et le noyau dans lautre sens; bien s ur on parle ici de theorie et non de
la methode la plus pratique pour tester EPR).
Voil`a donc nos deux electrons du doublet subitement libres de seloigner lun de lautre. Main-
tenant, on veut quils se retrouvent dans deux botes distinctes quon eloignera ensuite lune de
lautre, un electron dans chaque bote (les botes sont elles aussi tr`es theoriques, pour supposer
quelles puissent contenir et transporter chacune un electron sans perturber son spin). Comment
peut-on faire ? Il ne faut surtout pas trier les electrons dapr`es leur spin, il ny aurait plus deet
EPR. Il faut que jusquau dernier moment, aucune mesure ou autre inuence exterieure ne vienne
interagir avec leur spin.
Il faut les trier dapr`es leur position spatiale. Pour cela, on peut par exemple disposer une
bote de chaque cote, attendre que les electrons puissent venir dedans, fermer les botes et compter
sil y a bien, oui ou non, exactement un electron dans chaque bote. Sinon, on recommence (avec
un autre doublet, ou bien en rouvrant les botes pour laisser une seconde chance `a notre doublet),
jusqu`a ce que cette condition voulue se realise.
Maintenant, ca y est, notre paire EPR est prete.
Mesure des spins dune paire EPR delectrons
Nous avons maintenant deux experimentateurs avec chacun son electron dans une bote, les
deux electrons etant issus dun meme doublet. Et chacun peut, quand il veut, mesurer le spin de
son electron dans la direction quil veut.
Quels sont alors les probabilites de resultats ? La theorie enonce `a ce sujet les predictions
suivantes :
Proposition 1. Le premier qui mesure le spin, quelle que soit la direction choisie, obtient in-
dieremment lun ou lautre resultat suivant la probabilite
1
2
chacun, autrement dit son spin est
nul avant la mesure au sens que nous avons enonce. Notons le resultat de la mesure. Alors ce
resultat fait connatre lautre electron comme etant de spin oppose: si lautre observateur mesure
le spin de son electron par rapport `a un autre vecteur v, alors la connaissance du premier resultat
permet destimer la probabilite dobtenir
1
2
v pour le deuxi`eme `a la hauteur de (
1
2
v).
54
Proposition 2. Si les deux experimentateurs mesurent chacun leur spin de mani`ere independante,
suivant des directions librement choisies au dernier moment par eux (peu importe comment), alors,
le choix de leurs directions de mesure etant donne, la probabilite que le couple des reponses soit
un certain (,
) est egale `a (
1
4
).
Proposition 3. Comme on le voit, les propositions 1 et 2 ne sont que des formulations equivalentes
dun meme resultat, interprete suivant des points de vue dierents.
Consistance du phenom`ene dun point de vue quantique.
Dune mani`ere generale (quels que soient les syst`emes consideres avec un plus grand nombre
detats), le resultat de mesures successives ne peut dierer du cas de mesures independantes que
dans la situation o` u une mesure viendrait aecter lautre partie du syst`eme par une interaction
materielle (quelle quen soit la forme, champ electromagnetique ou autre). Or, conformement `a la
relativite restreinte, une telle inuence ne se produire dune mesure sur lautre que suivant lordre
temporel entre ces deux ev`enements, autrement dit pas plus vite que la lumi`ere. Si lintervalle entre
les mesures est de type espace, ces mesures sont independantes.
Chaque observateur peut interpreter le phenom`ene en disant que les mesures ont lieu dans
lordre o` u il les observe, cest-`a-dire lordre dans lequel il en recoit linformation par des signaux
lumineux. Donc dans le cas EPR, si les deux mesures sont independantes (separees par un intervalle
de type espace), chacun des experimentateurs peut considerer que cest lui qui eectue la premi`ere
mesure qui a une chance sur deux de donner lun ou lautre resultat. Ce resultat obtenu, il peut
alors considerer (les chances ulterieures de resultats sur) lautre electron eloigne exactement comme
sil lavait dej`a mesure suivant la meme direction et quil en avait obtenu le resultat oppose. En un
certain sens, on pourrait dire que cest le meme electron dont la ligne dunivers va dune mesure
`a lautre en passant par le doublet initial. (Ceci ne remet nullement en question lorientation du
temps : les lignes dunivers des particules sont decrites par la theorie U qui ignore lordre temporel
en tant quordre de causalite.)
Le lien qui existe dans la loi de probabilite entre les resultats de mesures, nest pas une
interaction mais une correlation quantique, qui etend la notion classique de correlation entre deux
parties dun syst`eme (que nous avions denie en mecanique statistique: une loi de probabilite
p(x, y) qui nest pas de la forme p
1
(x)p
2
(y)). En eet, quelle que soit la situation, toute identite
algebrique entre probabilites valable dans le cas des correlations classiques est egalement valable
dans le cas de correlations quantiques, et les seules proprietes qui peuvent etre mises en defaut
sont des inegalites sur ces probabilites. La correlation quantique ne fait que prolonger lespace
des correlations classiques, utilisant les memes param`etres et leur permettant simplement daller
un peu plus loin sur la meme lancee. On sait bien quune correlation classique na absolument
aucune chance de transmettre quelque information que ce soit, ne faisant quexprimer un hasard qui
setait dej`a produit avant que les sous-syst`emes ne soient separes. En allant un peu plus loin dans
la correlation, on ne fait que multiplier par quelque chose une interaction instantanee `a distance
qui etait nulle, ce qui donne toujours une interaction nulle.
Un syst`eme statistique classiquement correle devrait avoir une entropie dau moins ln 2 pour
pouvoir presenter un spin nul `a la premi`ere mesure, jusqu`a la valeur maximale de 2 ln 2 correspon-
dant au cas dun syst`eme non correle. Par contre, lentropie dune paire EPR delectrons reste
nulle tant quaucune mesure de spins nest eectuee.
Precisement, dapr`es la theorie quantique, les paires delectrons suivantes sont dans le meme
etat concernant le spin pour des etats spatiaux donnes dans deux botes (cest-`a-dire que quel
que soit le type dexperience quon puisse concevoir `a partir dune paire delectrons, les lois de
probabilites sur les resultats observables seront toujours identiques dune paire `a lautre):
Dune part, une paire delectrons founis par un processus ayant secr`etement tire au sort un
vecteur u uniformement sur la sph`ere, puis fourni une paire delectrons mesures comme etant de
spins respectifs
1
2
u et
1
2
u (linformation sur ce vecteur etant ensuite oubliee).
Dautre part, une paire delectrons founis par un processus ayant secr`etement tire au sort le
choix entre donner une paire EPR (issue dun doublet) suivant la probabilite
1
3
, ou donner une paire
delectrons de spins compl`etement aleatoires (spins nuls et independants) suivant la probabilite
2
3
.
Plus generalement, des theor`emes similaires peuvent se demontrer pour tout syst`eme quantique
55
correle, quels que soient le nombre de parties du syst`eme et la forme (nombre detats quantiques
possibles suppose ni) de chaque partie.
, une proportion de (
1
2
2
) de chances issues de M se
retrouvent dans M
M) de chances
issues du complementaire de M.
Dautre part, si au lieu de cela on eectue la deuxi`eme mesure suivant une autre direction,
le meme raisonnement sapplique avec un ensemble M
. Et
on est alors amenes `a penser quentre une direction ou une autre pour la deuxi`eme mesure, si on
compare lensemble M
avec celui M
de celles dobtenir
,
la quantite de remplacements de M
`a M
`a M et de M `a M