Sylvain POIRIER

http://spoirier.lautre.net/
Relativit´e restreinte et
initiation `a la physique math´ematique
1. Introduction g´en´erale
1.1. Qu’est-ce que la science math´ematique ?
Pour le dire bri`evement, c’est l’´etude des syst`emes ´eventuellement infinis mais constitu´es de
purs objets ´el´ementaires, dont l’existence est abstraite, ind´ependante du monde ext´erieur. Chaque
constituant (´el´ement, relation. . . ) de ces syst`emes a pour seule nature le fait d’ˆetre exact, du type
“tout ou rien” : deux objets sont ´egaux ou diff´erents, sont reli´es ou ne sont pas reli´es, une op´eration
donne un r´esultat exactement. . .
Le choix de tels syst`emes `a ´etudier est lui-mˆeme ´egalement un choix math´ematique, en ce sens
qu’il est donn´e par des conditions de complexit´e limit´ee (contrairement par exemple `a la biologie qui
d´epend des choix arbitraires secr`etement accumul´es par la Nature pendant des milliards d’ann´ees).
La science math´ematique est ainsi autonome par rapport aux contingences de notre Univers, mais
peut toujours s’appliquer `a chacun des innombrables lieux ou aspects particuliers de ce dernier o` u
de telles situations de complexit´e limit´ee peuvent se rencontrer.
Bien que ces objets soient de nature ind´ependante de toute forme de repr´esentation sensible (ou
apparence) particuli`ere, on ne peut les comprendre qu’en se les repr´esentant sous une certaine forme.
Il peut y avoir plusieurs formulations ou mani`eres de se repr´esenter une mˆeme th´eorie, toutes ´etant
rigoureusement ´equivalentes entre elles mais leur efficacit´e, leur pertinence peut ˆetre tr`es diff´erente.
Le plus souvent, les id´ees sont d’abord d´evelopp´ees sous forme d’intuitions, d’imaginations plus ou
moins visuelles, puis cristallis´ees en des formules et des phrases litt´eraires pour ˆetre communiqu´ees,
´ecrites ou travaill´ees sous ces autres formes. Et on ne peut se lib´erer d’une forme de repr´esentation
particuli`ere qu’en d´eveloppant d’autres formes de repr´esentation et en s’exer¸cant `a traduire les
objets et les concepts d’une forme `a l’autre.
1.2. Qu’est-ce que la g´eom´etrie ?
´
Etymologiquement, le mot g´eom´etrie signifie “mesure de la terre”. C’est donc, `a l’origine, une
science reli´ee `a la r´ealit´e concr`ete : celle de l’espace qui nous entoure, ou celle des plans : celui
du sol lorsqu’il est plat, ou de toute surface plane (papier, tableau. . . ), que l’on peut voir et sur
laquelle on peut dessiner facilement. Le g´eom`etre grec Euclide en a ´ecrit le premier une formulation
axiomatique dans le cas du plan, d’o` u le nom donn´e `a la g´eom´etrie plane usuelle.
La g´eom´etrie euclidienne est ainsi la premi`ere th´eorie physique, c’est-`a-dire une th´eorie math´e-
matique qui mod´elise la r´ealit´e physique, en l’id´ealisant : tandis que deux points trop proches
l’un de l’autre peuvent difficilement ˆetre distingu´es par des mesures physiques, en math´ematique
il faut trancher : ils sont soit ´egaux, soit distincts (ainsi, entre deux points distincts se trouvent
d’autres points, et ainsi de suite : dans un segment de droite de longueur finie il existe une infinit´e
de points). Et on tranche au plus simple : cette g´eom´etrie se d´efinit comme ´etant la plus simple
th´eorie du plan ou de l’espace en accord avec l’exp´erience physique habituelle. C’est aussi l’unique
th´eorie dans laquelle est vrai exactement tout ´enonc´e simple qui semble vrai, aux incertitudes de
mesure pr`es, pour cette mˆeme exp´erience.
Pour un math´ematicien moderne, le mot “g´eom´etrie” d´esigne le nom de famille que portent
un grand nombre de th´eories math´ematiques qui ont entre elles plus ou moins de liens de parent´e,
notamment le fait qu’il est plus ou moins possible de les visualiser, d’en dessiner des figures. D’un
point de vue math´ematique, elles sont toutes ´egalement “vraies”, se rapportant toutes `a des r´ealit´es
math´ematiques (des ensembles de “points”. . . ).
1.3. Comment peut-on visualiser d’autres g´eom´etries ?
1
Mais comment visualise-t-on la g´eom´etrie euclidienne, d’abord ? Elle n’est pas celle que l’on
voit directement, car la g´eom´etrie du champ de vision est la g´eom´etrie sph´erique.
En effet, la vue d’un point ne nous renseigne que sur la demi-droite issue de l’œil auquel ce
point appartient; et cette demi-droite peut se repr´esenter par son point d’intersection avec une
sph`ere centr´ee sur l’œil. Lorsqu’on bouge l’œil et/ou la tˆete, la modification de ce qu’on voit
correspond `a une rotation de cette sph`ere. L’exemple le plus clair en ce sens est celui des objets
astronomiques dont on ne per¸coit que l’image sur la “sph`ere c´eleste” (qui tourne `a cause de la
rotation de la Terre sur elle-mˆeme).
Mais la g´eom´etrie euclidienne (du plan ou de l’espace) est seulement celle qu’on a le plus
l’habitude de concevoir. En effet, en voyant ou en imaginant une image de dimension 2 (sur la
sph`ere de vision), on attribue `a chaque point une sensation de proximit´e ou d’´eloignement, et on
est familier avec la mani`ere dont cette perception se transforme lorsqu’on tourne l’objet ou qu’on
change de point de vue par rapport `a lui. C’est cette facult´e, fruit d’une construction mentale,
qui constitue notre compr´ehension de la g´eom´etrie, et notre agilit´e `a l’employer en rend l’usage
tellement facile comme celui d’une sensation ´el´ementaire, que son caract`ere indirect en est presque
anecdotique.
Or, la perception intuitive des autres g´eom´etries rel`eve du mˆeme principe : celui qui consiste `a
voir une chose pour en concevoir une autre. Et pour parvenir `a concevoir ainsi d’autres g´eom´etries
en s’appuyant sur une vision qui (h´elas) demeure la mˆeme, un bon moyen est de travailler sur cette
facult´e de concevoir l’espace euclidien, en la particularisant, en la modifiant ou en la g´en´eralisant.
(Mais ensuite, il est vrai que ce lien avec la vision ne se pr´eserve pas facilement, et que le travail
de conception devient plus intense et traduit en formules avec un rˆole de la vision relativement
moindre).
Par exemple, on peut concevoir des espaces (euclidiens ou non) de dimension sup´erieure `a
3. Ils ne comportent math´ematiquement aucune v´eritable nouveaut´e par rapport `a la droite, au
plan et `a l’espace usuel, mˆeme si l’absence totale d’exp´erience par rapport `a eux donne aux novices
l’impression d’une difficult´e insurmontable. Pour concevoir ces espaces, on peut par exemple se dire
qu’on ne voit que deux ou trois dimensions en mˆeme temps sous forme de coupe ou de projection,
mais qu’il y en a d’autres en r´eserve, on peut les changer. . .
1.4 La g´eom´etrie euclidienne d´ecrit-elle exactement l’espace physique ?
Non. Non seulement le temps s’y ajoute en relativit´e restreinte pour former un espace de
dimension 4 qui n’est pas euclidien (l’espace-temps) et est plus r´eel (proche de la r´ealit´e physique)
que notre espace de dimension 3 usuel, mais mˆeme si on se restreint `a consid´erer son apparence
d’espace de dimension 3, la th´eorie de la relativit´e g´en´erale nous enseigne qu’en r´ealit´e, cet espace,
pour autant qu’on puisse encore le mesurer, n’ob´eit pas exactement `a la g´eom´etrie euclidienne
(ind´ependamment de toute question de mat´erialisation des objets ou de pr´ecision des mesures).
Bien sˆ ur, l’erreur de le supposer euclidien est extrˆemement faible, plus encore que d’autres erreurs
beaucoup plus compr´ehensibles et d´ej`a couramment n´eglig´ees : lorsqu’on cartographie une r´egion
de la Terre (de forme `a peu pr`es carr´ee par exemple) de taille L, en l’assimilant `a une r´egion d’un
plan, l’erreur g´eom´etrique normale due `a la rotondit´e de la Terre vaut (en distance sur le terrain)
L
3
R
2
o` u R = 6370 km est le rayon de la Terre, ce qui fait par exemple 2,4 cm pour une r´egion large de
10 km.
Celle due `a la relativit´e g´en´erale, qui mesure donc le mˆeme type de d´ecallage par rapport
`a la g´eom´etrie euclidienne plane mais concerne le plan tangent `a la Terre et constitue un effet
suppl´ementaire par rapport `a celui qu’on calculerait en termes de la seule rotondit´e de la Terre,
vaut
2L
3
g
Rc
2
o` u g = 9, 8 m.s
−2
est l’acc´el´eration de pesanteur et c = 3.10
8
m.s
−1
est la vitesse de la lumi`ere.
Elle est donc 720 millions de fois plus faible (pr´ecis´ement, pour n’importe quelle r´egion choisie);
2
dans le cas de la mesure de la Terre enti`ere au lieu d’une r´egion, l’erreur est de l’ordre de quelques
centim`etres. Ainsi, ´etant donn´e un choix d’“´equateur” parfaitement circulaire, sa longueur est
inf´erieure `a sa distance au centre multipli´ee par 2π (mais le calcul pr´ecis de sa distance au centre
d´epend de la r´epartition de la masse de la Terre entre les diff´erentes profondeurs).
Si maintenant on consid`ere un plan vertical, une autre erreur survient, elle aussi plus forte que
celle issue de la relativit´e g´en´erale : le solide de longueur L que l’on tourne pour comparer des
longueurs horizontales et verticales se d´eforme sous son propre poids (il s’´etire s’il est pendu, il se
contracte s’il est pos´e), d’une amplitude de l’ordre de
L
2
g
c
2
o` u c

est la vitesse du son dans le solide, qui est forc´ement inf´erieure `a c d’apr`es la relativit´e
restreinte.
De l’autre cˆot´e, la physique de l’infiniment petit pose actuellement tellement de probl`emes
que certains physiciens th´eoriciens envisagent s´erieusement que les concepts usuels de g´eom´etrie
ne seraient plus valables `a l’´echelle de Planck (qui est bien plus petite que la plus petite distance
pour laquelle le comportement des particules est actuellement connu).
1.5. Qu’est-ce que la physique math´ematique ?
´
Etat des lieux
Il y a deux types de travaux en physique math´ematique: la physique fondamentale et la
physique appliqu´ee. La partie th´eorique de la physique appliqu´ee consiste essentiellement `a d´eve-
lopper les cons´equences de la physique fondamentale `a l’aide d’approximations adapt´ees (en s’aidant
parfois de l’exp´erience quand les approximations sont trop difficiles `a r´ealiser sur le plan th´eorique).
La partie physique de cet ouvrage aura pour but de pr´esenter des th´eories physiques fondamen-
tales bien ´etablies et largement v´erifi´ees `a ce jour, des plus simples (math´ematiquement simples et
proches de l’exp´erience courante) aux plus ´evolu´ees (math´ematiquement sophistiqu´ees et `a la base
de l’explication du plus grand nombre de ph´enom`enes). Mais cet ordre de rangement n’est pas
strict. Du point de vue de la “r´ealit´e physique”, seules les derni`eres auraient le titre de th´eories
physiques fondamentales puisqu’elles sont physiquement plus fondamentales et pr´ecis´ement con-
formes `a la r´ealit´e que les premi`eres qui n’en sont que des r´esultats et approximations; mais il
se trouve que l’ordre p´edagogique des th´eories fondamentales (l’ordre de la compr´ehension dans
leur apprentissage et le sens intuitif donn´e aux notions) est plus ou moins l’inverse de leur ordre
de d´ependance en tant que th´eories physiques. (C’est finalement logique puisque si une th´eorie
A pr´ec´edait une th´eorie B `a la fois physiquement et p´edagogiquement, on classerait B dans la
physique appliqu´ee).
D’abord il y a la m´ecanique classique, celle de Galil´ee et Newton, qui traite des forces et
des mouvements; la loi de la gravitation s’y ´enonce simplement. A partir d’elle on peut avancer
dans deux directions, qui sont les deux types de physique moderne qui s’opposent `a la physique
classique : d’une part la Relativit´e (restreinte puis g´en´erale), d’autre part, la physique quantique et
la physique statistique, qui sont deux th´eories parentes et ´etroitement li´ees entre elles. Ces th´eories
seront introduites plus en d´etails dans les chapitres correspondants.
Nous ne pr´eciserons pas les justifications th´eoriques et exp´erimentales sur lesquelles repose
leur reconnaissance, car ces justifications sont actuellement innombrables et parmi elles, celles `a
l’origine historique de leur d´ecouverte ont d´esormais perdu tout caract`ere privil´egi´e.
Une telle d´emarche p´edagogique d´ebarrass´ee des questions de justification exp´erimentale est
largement satisfaisante du fait que ces th´eories bien ´etablies et v´erifi´ees avec une extrˆeme pr´ecision,
englobent d´ej`a dans leur domaine d’application la plupart des exp´eriences de physique r´ealisables.
Cependant, beaucoup de ces exp´eriences ´echappent en pratique `a cette r´eduction `a cause de
l’extrˆeme complexit´e de leur expression th´eorique, ou des difficult´es parfois insurmontables de
la r´esolution des probl`emes math´ematiques correspondants.
Ceci ne fait pas de la physique fondamentale une science morte pour autant, car non seule-
ment les th´eories ´etablies sont manifestement incompl`etes (la relativit´e g´en´erale et la physique
3
quantique sont difficilement conciliables pour des raisons impossibles `a vulgariser), mais la th´eorie
quantique sous sa forme compl`ete compatible avec la relativit´e restreinte (th´eorie quantique des
champs) s’av`ere, au niveau fondamental, d’une complexit´e quasi-insondable manquant d’un fonde-
ment math´ematique bien clair sur lequel reposer, et le travail de reformulation `a la recherche d’un
meilleur fondement demeure actif.
Aspects philosophiques
Mˆeme si on supposait que les objets physiques aient une nature, nous ne pourrions de toute
mani`ere pas la connaˆıtre par l’exp´erience car toutes nos perceptions passent par une traduction
des ph´enom`enes ext´erieurs en la conscience qu’on peut avoir d’eux. Donc, le mieux qu’on puisse
faire est d’´etudier le monde physique en tant que syst`eme math´ematique, ce qui nous laisse libres
de nous le repr´esenter sous des formes sans rapport avec celles sous lesquelles nous le percevons
habituellement. Expliquons cela en d´etails:
Au moins jusqu’`a maintenant, il semble que toute pr´etention `a dire qu’un ´el´ement de l’ima-
gination serait plus qu’un autre ressemblant `a la “vraie nature” d’un certain ´el´ement de la r´ealit´e
physique est vaine, parce qu’il n’existe aucun moyen de comparer ces natures : toutes nos percep-
tions du monde ext´erieur sont indirectes, traduites par notre corps en impulsions nerveuses, que le
cerveau retraite pour en distinguer les formes globales. Donc, du monde physique ext´erieur, seules
les structures, c’est-`a-dire les relations entre les choses, sont accessibles `a nos sens et peuvent faire
l’objet de nos discours, non une quelconque nature ontologique. Et de toute mani`ere, comment
esp´erer qu’un objet physique puisse avoir une quelconque identit´e de nature avec un ph´enom`ene
mental ?
Par exemple il n’y a aucune ressemblance de nature entre le sentiment d’une couleur et les
qualit´es des objets vus, qui sont responsables de cette couleur. Cette qualit´e consiste en des
coefficients d’absorption de diff´erentes fr´equences d’ondes ´electromagn´etiques par ces objets, qui
d´eterminent la composition en fr´equences de la lumi`ere que l’oeil re¸coit. Puis, ce n’est qu’une faible
partie de l’information sur cette composition que les cellules de l’oeil peuvent transmettre (suivant
les propri´et´es des mol´ecules dans la r´etine qui font ce travail).
´
Egalement, nous pouvons `a peine imaginer le temps, mˆeme juste conform´ement `a la mani`ere
dont nous le vivons, qui montrerait la nature de cette exp´erience vivante du temps au-del`a de la
seule forme de la droite qui le repr´esente math´ematiquement : en aucun instant nous ne pouvons
imaginer une dur´ee en tant que telle, puisqu’un instant ne contient aucune dur´ee; il n’y a que
les dur´ees futures qui n’existent pas encore, et les dur´ees pass´ees, que nous percevons dans notre
souvenir. Mais d´ej`a, un souvenir d’une dur´ee n’est plus une dur´ee, car il ne fait que repr´esenter
cette dur´ee par une certaine autre sensation instantan´ee.
Ainsi, la pr´etention de d´ecrire les choses “comme elles sont” serait vaine, ou alors, ce n’est
plus de la physique mais de la m´etaphysique, ce qui peut ´eventuellement se d´efendre `a condi-
tion de l’annoncer clairement. Eventuellement, cela peut ˆetre utile lorsqu’on travaille avec une
th´eorie provisoire qu’on est en train de remettre en question pour tenter d’en construire une autre
plus pr´ecise comme explicitation de structures sous-jacentes `a une structure donn´ee (par exemple,
cela est pertinent pour passer des moles aux mol´ecules, et de la thermodynamique classique `a la
m´ecanique statistique). Mais cela n’a lieu que de mani`ere relative et non absolue, et n’est pas le
cas g´en´eral.
L’objet de la Physique est donc de d´ecrire les lois physiques, c’est-`a-dire l’expression sous
forme de th´eorie math´ematique des relations constat´ees entre les r´esultats de nos observations du
monde physique, puisque c’est une caract´eristique g´en´erale des math´ematiques que de s’int´eresser
aux structures, relations entre les objets, et non `a leur nature. Alors, entre plusieurs pr´esentations
math´ematiquement ´equivalentes (ou traductions) d’une th´eorie, faisant diff´erents choix de formes
d’imagination pour repr´esenter tel ou tel aspect de la r´ealit´e, la meilleure est celle qui permet de
saisir cette th´eorie math´ematique de la mani`ere la plus facile ou efficace.
L’intuition quotidienne du monde physique est adapt´ee `a la compr´ehension des probl`emes de
la vie quotidienne. Mais lorsqu’on veut passer `a l’´etude des structures de la r´ealit´e qui apparaissent
dans d’autres contextes, il peut ˆetre judicieux de modifier ce choix. Mais de toute mani`ere, un
discours s’appuyant ainsi judicieusement sur un syst`eme inhabituel de correspondances entre objets
4
r´eels et formes d’imagination employ´ees `a les repr´esenter, est donc bien sˆ ur pareillement vide de
signification sur la vraie nature de ces aspects ou objets de la r´ealit´e physique que tout autre
discours.
Faute d’avoir une th´eorie compl`ete de la physique, on a des th´eories partielles, dont chacune
concerne les propri´et´es des r´esultats des exp´eriences d’un certain domaine exp´erimental de la r´ealit´e,
c’est-`a-dire un certain type d’exp´eriences avec un certain degr´e de pr´ecision des mesures (d´ependant
des param`etres de l’exp´erience). Au cours de l’exploration de la physique math´ematique, on est
amen´e `a consid´erer une succession de th´eories correspondant `a diff´erents domaines exp´erimentaux,
de plus en plus larges et dont les cons´equences th´eoriques sont de plus en plus pr´ecis´ement en
accord avec l’exp´erience (ou donnent de plus en plus d’informations `a lui confronter).
Chacune de ces th´eories est d’abord par nature une th´eorie math´ematique; sa signification
physique (son titre de th´eorie physique) consiste alors `a attribuer `a chaque exp´erience du domaine
exp´erimental consid´er´e une traduction dans la th´eorie, c’est-`a-dire un certain sous-syst`eme d’objets
de la th´eorie qui repr´esente math´ematiquement le dispositif exp´erimental utilis´e.
Mais une th´eorie a aussi une signification intuitive, qui r´eside dans le choix de la forme de
repr´esentation la mieux adapt´ee `a la compr´ehension de la th´eorie. Dans cette exploration, beaucoup
de th´eories g´eom´etriques interviennent, non seulement pour rendre compte du comportement de
la mati`ere ´evoluant `a l’int´erieur de l’espace qui nous est familier, mais aussi pour remplacer cet
espace lui-mˆeme par d’autres (ce dernier cas n’arrive pas souvent : principalement en Relativit´e
restreinte, Relativit´e g´en´erale et ce qui inclut la gravitation quantique). Et, parmi nos intuitions
ou capacit´es habituelles `a percevoir le monde physique, la vision est celle qui est la plus claire
math´ematiquement, et la plus facile `a exercer pour pouvoir, avec elle, concevoir beaucoup de ces
th´eories g´eom´etriques.
La difficult´e du na¨ıf `a remettre en question la forme de ses perceptions se pr´esente aussi en
termes du principe de r´ealit´e, suivant lequel “la r´ealit´e physique existe” que nous la percevions ou
pas, au nom de quoi il voudrait continuer `a penser les choses en termes d’“objets r´eels” ou concrets
tels qu’il les per¸coit habituellement. Or le probl`eme n’est pas de savoir si la r´ealit´e comporte ou
non d’autres objets que ceux de notre exp´erience ou perception, car de toute mani`ere les th´eories
physiques avec lesquelles nous travaillons en pr´esentent. Le probl`eme est de savoir lesquels. Le
na¨ıf imagine ces objets de la r´ealit´e sous-jacente, qu’il ne peut percevoir directement, comme
ressemblant `a ceux qui lui sont familiers. Il n’a pas toujours tort, d’ailleurs, dans la mesure o` u tel
ou tel ph´enom`ene qu’il a besoin d’expliquer peut ˆetre dˆ u `a des m´ecanismes situ´es dans un domaine
exp´erimental plus large que son exp´erience courante, mais pas encore assez pour que son intuition
cesse d’ˆetre valide, son incapacit´e `a observer directement ces m´ecanismes suivant cette mˆeme
intuition ´etant seulement contingente et rem´ediable par des instruments adapt´es (microscopes,
t´el´escopes, etc.).
Par contre, lorsqu’en poussant plus avant le domaine exp´erimental on se trouve confront´e `a
une impossibilit´e plus fondamentale d’affiner les instruments de mesure pour observer le mˆeme
type de m´ecanismes r´eels explicatifs, il est temps d’envisager qu’il y ait `a cela une bonne raison:
`a savoir qu’il n’existe pas de r´ealit´e explicative ressemblant `a ce que le na¨ıf voudrait croire, parce
que la r´ealit´e est d’une autre forme qui ne peut ˆetre comprise que par des moyens diff´erents, en
des termes diff´erents.
1.6. Quelques mots de g´eom´etrie euclidienne
´
Evoquons ici les g´eom´etries euclidiennes de dimensions 1, 2 et 3. Celle de dimension 1 (de
la droite) est la plus simple math´ematiquement; les deux suivantes (du plan et de l’espace) sont
presque de complexit´e ´equivalente, et seront trait´ees ici de la mˆeme mani`ere.
Notre vision est habitu´ee `a comprendre le plan et l’espace, mais se trouve un peu large pour
parler de la droite : quelle droite ? horizontale, verticale. . . ? On a tendance `a vouloir placer cette
droite quelque part. On a d´ej`a moins tendance `a vouloir disposer le plan dans l’espace, puisque
les deux dimensions du plan remplissent les deux dimensions du champ de vision, ne laissant pas
voir le vide qui se trouve de chaque cˆot´e. Mais quels que soient nos modes de repr´esentations et
d’´eventuels rapports avec notre Univers physique, chacune de ces g´eom´etries, en tant que th´eorie
math´ematique, se limite `a consid´erer les constructions pouvant ˆetre faites `a l’int´erieur de son
5
syst`eme (la droite, le plan, l’espace) ind´ependamment de toute consid´eration d’un ´eventuel espace
ext´erieur dans lequel ce syst`eme pourrait ˆetre dispos´e. Mˆeme si une telle disposition peut ˆetre
utile pour des calculs et raisonnements interm´ediaires ou comme support intuitif, elle n’est pas
consid´er´ee comme faisant partie des r´ealit´es premi`eres dans cette th´eorie, et doit donc disparaˆıtre
dans les objets d’´etude et les r´esultats finaux. Cette ind´ependance de chaque g´eom´etrie apparaˆıt
clairement dans l’exemple d´ej`a ´evoqu´e du champ de vision, qui a la forme (ou g´eom´etrie) d’une
sph`ere : cette sph`ere a certes un centre bien d´efini (l’œil) mais n’a pas de rayon, il serait faux de la
confondre avec une sph`ere particuli`ere dispos´ee dans l’espace. (Elle est l’ensemble des demi-droites
issues de l’œil.)
Pour cette raison, il est bon de fournir `a disposition de notre intuition des formes de repr´esen-
tations autres que visuelle pour figurer la g´eom´etrie de la droite (ou g´eom´etrie de dimension 1).
En voici deux. D’abord, la sensation du temps. Ensuite, la notion de fil (infiniment fin), en tant
qu’objet m´ecanique dont la nature est pr´eserv´ee quelles que soient les dispositions dans l’espace
(droites, courbes, lignes bris´ees. . . ) qu’on lui donne. Pr´esentons maintenant une introduction
intuitive `a la g´eom´etrie euclidienne.
Consid´erons des fils de longueur finie, arrˆet´es en deux extr´emit´es (on les coupe l`a, ou bien on
oublie les prolongements comme s’ils n’existaient pas). On appellera courbe une image d’un fil,
lieu du plan ou de l’espace en lequel il peut ˆetre dispos´e. Chaque fil se caract´erise par sa longueur,
qui est une quantit´e positive. Pour toute courbe, les fils pouvant ˆetre dispos´es dessus sont tous
ceux qui ont une mˆeme longueur, qu’on appelle alors la longueur de la courbe. Tout point d’un fil
le divise en deux parties, dont la somme des longueurs est ´egale `a la longueur du fil de d´epart. La
longueur d’une courbe se mesure ´egalement par le temps qu’on met `a parcourir cette courbe du
regard `a vitesse fix´ee (ainsi sont reli´ees ces 3 intuitions unidimensionnelles: les fils, le temps et les
courbes).
Marquer le fil d’une graduation r´eguli`ere rep´erant les longueurs depuis une extr´emit´e (ou plus
g´en´eralement depuis un point quelconque du fil), ou de mani`ere ´equivalente chronom´etrer le temps
de parcours `a vitesse constante, fournit un marquage de chaque point de la courbe par un nombre
ou une quantit´e appel´e son abscisse curviligne.
Entre deux points distincts A et B, il y a une valeur minimale non nulle des longueurs de
courbes qui les relient; c’est la seule longueur pour laquelle il n’existe qu’une seule courbe qui les
relie. Cette courbe est not´ee [AB], et est appel´ee un segment. Sa longueur s’appelle la distance
entre A et B. Inversement, la longueur d’une courbe peut se d´efinir `a partir de la notion de distance
(sans utiliser la mesure des longueurs des fils) : c’est la valeur vers laquelle s’approche la somme
des distances entre des points de la courbe cons´ecutifs pour le fil, lorsque ces points sont de plus en
plus nombreux et rapproch´es dans le fil (envahissant toutes les parties du fil). On pourrait d´efinir `a
partir des segments les demi-droites et les droites, ou inversement les segments `a partir des droites
d´efinies en termes de sym´etrie axiale qui sont des antid´eplacements (voir plus bas), mais passons.
La notion de disposition d’un fil dans le plan ou dans l’espace se g´en´eralise `a la disposition
d’un morceau de plan dans l’espace (une feuille de papier), d’un volume dans l’espace (un solide),
ou d’un morceau de plan dans un plan (une feuille de papier pos´ee sur une table).
Exprimons-nous maintenant dans le cas de la g´eom´etrie plane.
L’ensemble des points `a ´egale distance d d’un point donn´e O s’appelle le cercle de centre O
et de rayon d. Une droite divise le plan en deux demi-plans. L’intersection ou la r´eunion de deux
demi-plans s’appelle un secteur angulaire S qui se mesure par son angle : O ´etant `a l’intersection
des deux droites fronti`eres, l’intersection de S avec un cercle de centre O est une courbe, dont la
longueur divis´ee par le rayon est la mesure en radians de l’angle (qui ne d´epend pas du rayon).
(Ce qui suit serait g´en´eralisable `a la g´eom´etrie dans l’espace en rempla¸cant feuille par solide
et table par espace.)
Chaque disposition d’une feuille sur une table fait voir une figure sur la feuille comme ´etant
une figure sur la table.
On appelle d´eplacement la transformation d’une figure (dessin´ee sur la feuille mais vue comme
´etant sur la table), qui r´esulte d’un changement de disposition de la feuille sur la table r´ealis´e par
simple glissement, sans retournement. La notion d’antid´eplacement se d´efinit de la mˆeme mani`ere
6
sauf que la feuille (de pr´ef´erence un papier calque) est de plus retourn´ee. (Dans le cas de l’espace,
le “retournement” ne peut ˆetre que virtuel, et consiste `a prendre l’image miroir). Les d´eplacements
conservent l’orientation du plan (le sens des aiguilles d’une montre), les antid´eplacements les ren-
versent.
Tout d´eplacement dans le plan est soit une rotation, obtenue en tournant la feuille autour d’un
point (appel´e centre et unique point fixe) suivant un certain angle et dans un certain sens (d´efini
par rapport `a l’orientation du plan), soit une translation (qui avance la feuille sans la tourner, et
peut ˆetre vue comme la limite d’une rotation d’angle infiniment petit autour d’un centre infiniment
´eloign´e).
Th´eor`eme et d´efinition. On appelle isom´etrie une transformation f du plan (ou l’espace) dans
lui-mˆeme qui v´erifie les trois conditions ´equivalentes suivantes :
1) f conserve les distances (ou les longueurs de courbes)
2) f conserve toutes les notions de g´eom´etrie euclidienne
3) f est un d´eplacement ou un antid´eplacement.
1.7. Fondement exp´erimental de la g´eom´etrie affine plane
Nous d´efinirons la g´eom´etrie affine du plan par l’exp´erience suivante. On observe de loin une
figure trac´ee sur une vitre; on ne sait pas (et on ne saura jamais) `a quelle distance cette vitre se
trouve, ni comment elle est dispos´ee (de face ou de biais; on ne voit pas son contour), ni si on
la voit par devant ou par derri`ere (ou, ce qui revient au mˆeme, `a travers un miroir). Diff´erents
observateurs seront toujours suppos´es ignorer mˆeme comment ils sont dispos´es dans l’espace les
uns par rapport aux autres.
On sait seulement ce qu’on en voit, et la taille apparente en est petite (elle pourrait tenir dans
le disque lunaire par exemple) : on peut la prendre en photo, et faire des mesures g´eom´etriques
sur la photo. Le passage de la figure r´eelle `a la figure ainsi vue s’appelle une transformation affine.
Dans ces conditions, quels sont les notions de g´eom´etrie (propri´et´es ou mesures d’une figure
– on appellera cela plus loin les structures) dont l’apparence de tout point de vue de ce type est
toujours fid`ele `a la r´ealit´e, aux incertitudes de mesure pr`es (n´egligeant les effets de distorsion li´es
au quotient de la taille de l’objet `a sa distance) ?
On appelle g´eom´etrie affine du plan la g´eom´etrie du plan* r´eduite `a l’´etude des notions qui
apparaissent fid`element dans cette exp´erience. Elle diff`ere donc de la g´eom´etrie euclidienne `a laque-
lle nous sommes habitu´es, par le fait que son langage est plus r´eduit : lorsque deux observateurs
plac´es en des points de vue diff´erents se communiquent leurs observations d’une mˆeme figure par
t´el´ephone, en ayant seulement le droit de s’exprimer dans ce langage, ils seront toujours d’accord.
Et ils peuvent mˆeme introduire de nouveaux termes, tant qu’ils peuvent les d´efinir enti`erement au
moyen de ce langage, ils resteront toujours d’accord.
Ainsi, toutes les notions de g´eom´etrie affine sont des notions qui existent aussi en g´eom´etrie
euclidienne. Mais certaines notions habituelles de g´eom´etrie euclidienne n’´etant plus valables, on
a alors besoin, pour pouvoir encore travailler, de recourir `a des notions moins habituelles qui
subsistent en g´eom´etrie affine, pouvant correspondre aux anciennes notions pour des observateurs
particuliers.
Un mˆeme objet de g´eom´etrie affine admet de multiples interpr´etations (ou mesures) possibles
dans le langage de la g´eom´etrie euclidienne (chaque observateur a son interpr´etation d´efinie par
ce qu’il voit), et aucune mesure ou propri´et´e qui utilise seulement le langage affine ne permet
d’exprimer comment distinguer “quelle est la vraie”. N’importe laquelle peut ˆetre consid´er´ee
comme vraie du point de vue correspondant.
La notion de droite fait partie de la g´eom´etrie affine. Toutes les notions d´efinissables `a partir
de notions de g´eom´etrie affine, font aussi partie de la g´eom´etrie affine. Par exemple, font partie
de la g´eom´etrie affine les notions d’alignement des points, de demi-droites, segments, parall`eles et
* Voici pourquoi on se permettra de parler de plan (infini) bien que la figure soit suppos´ee tenir
dans le disque lunaire : il suffit de partir de figures beaucoup plus petites que le disque lunaire (on
a donc besoin d’un t´el´escope pour l’observer), `a partir de quoi le disque lunaire semblera presque
infiniment grand comme un plan: on peut y continuer la figure librement. . .
7
parall´elogrammes, rapports de longueurs de segments parall`eles, rapports des aires, barycentres,
translations et homoth´eties, paraboles, ainsi que les ellipses et hyperboles avec leurs centres.
En fait, la notion de droite est suffisante pour d´efinir toutes les autres notions de g´eom´etrie
affine, c’est-`a-dire qui ne d´ependent pas de l’observateur dans l’exp´erience ci-dessus. Par suite,
toute transformation qui transforme les droites en droites pr´eserve aussi toutes ces notions et est
une transformation affine.
Ne font pas partie de la g´eom´etrie affine les notions de distances, longueurs de courbe ou de
segment, d’angles, d’orthogonalit´e, de cercles, de rotations, de produit scalaire, d’axes et de foyers
de coniques, car des observateurs plac´es en des lieux diff´erents peuvent ne pas ˆetre d’accord dessus.
Par exemple, si l’un croit voir un cercle, un autre ne verra pas un cercle mais seulement une el-
lipse. Ainsi peut-on d´efinir la notion d’ellipse: une ellipse est une figure obtenue par transformation
affine `a partir d’un cercle. De mˆeme, les rotations et antid´eplacements de la g´eom´etrie euclidienne
sont des transformations affines du plan qui en g´eom´etrie affine ne sont plus distinguables dans un
ensemble plus large de transformations affines.
On a vu en g´eom´etrie euclidienne les dispositions de fils dans le plan, qui sont certaines ap-
plications d’un fil dans le plan. Ici, il n’y a plus lieu de les distinguer `a l’int´erieur d’un certain
ensemble plus vaste d’applications d’un fil dans le plan, par exemple celui des courbes param´etr´ees
(le fil est remplac´e par un ´elastique; si on garde l’intuition du temps pour imaginer le fil, la vitesse
de parcours de la courbe peut alors varier d’une mani`ere quelconque, diff´erente d’un point de vue
`a l’autre suivant la transformation affine subie).
2. L’´etranget´e de la th´eorie de la Relativit´e
Ce chapitre d’introduction `a la relativit´e et `a son ´etranget´e vise notamment `a analyser la
m´ethodologie sur laquelle reposent traditionnellement les cours d’initiation `a la relativit´e restreinte,
et `a motiver l’adoption d’une nouvelle approche refl´etant mieux l’usage de cette th´eorie dans
un contexte plus large de physique th´eorique. Il s’adresse particuli`erement `a ceux ayant vu la
pr´esentation habituelle, mais devrait ˆetre au moins partiellement compr´ehensible par tous.
Il est possible d’aborder directement les choses s´erieuses en passant au chapitre 3.
2.1. Son nom et quelques autres aspects ext´erieurs
La relativit´e est en deux ´etapes nomm´ees “restreinte” et “g´en´erale”. La th´eorie de la relativit´e
restreinte est une th´eorie de l’espace et du temps qui remplace celle pr´ec´edemment ´enonc´ee par
Galil´ee et Newton, en r´eduisant cette derni`ere au rang d’approximation valable lorsque les vitesses
relatives des objets ´etudi´es sont n´egligeables devant celle de la lumi`ere. (Nous sous-entendrons
parfois l’adjectif “restreinte”, comme nous n’aborderons pas ici la relativit´e g´en´erale).
Une cons´equence de la relativit´e est qu’aucun signal, aucune information ne peut ˆetre transmis
plus vite que la vitesse de la lumi`ere dans le vide (qui est aussi celle des ondes radio), pas plus
qu’elle ne peut arriver avant d’ˆetre partie, pour des raisons de non-contradiction de la r´ealit´e.
Cette vitesse est une constante universelle c ≈ 3.10
8
m.s
−1
, ce qui signifie pr´ecis´ement que celui qui
envoie un signal `a cette rapidit´e ind´epassable, sous forme d’ondes radio par exemple, `a un point
situ´e `a 3.10
8
m de l`a d’o` u il est aussitˆot renvoy´e, devra attendre deux secondes avant d’en recevoir
le retour.
Il ne faut pas se laisser abuser par le nom de la “relativit´e” qui refl`ete mal le sens de
cette th´eorie : certains auteurs de la th´eorie l’ont par la suite regrett´e, pensant que celui de
“chronog´eom´etrie” par exemple aurait mieux convenu, mais il ´etait trop tard. Le slogan caricat-
ural “tout est relatif” avait d´ej`a pris possession de l’imagination populaire, mais son sens n’´etait
ni nouveau ni correctement repr´esentatif de la th´eorie. En effet, d’une part le Principe de rel-
ativit´e ´etait d´ej`a contenu dans la th´eorie galil´eenne, la seule diff´erence ´etant que le changement
de r´ef´erentiel affecte un plus grand nombre de param`etres (par exemple le temps) qui d´ecrivent
des objets physiques donn´es, en th´eorie de la relativit´e par rapport `a la th´eorie galil´eenne (et ce
principe est ainsi r´ehabilit´e apr`es que l’´electromagn´etisme a sembl´e le contredire). D’autre part, ce
slogan risque de provoquer par exemple des blocages psychologiques `a l’acceptation du caract`ere
objectif et mesurable du mouvement de rotation d’un objet sur lui-mˆeme (gyroscope, pendule de
Foucault. . . ).
8
La relativit´e restreinte a ´et´e d´ecouverte par diff´erents chercheurs : Poincar´e, Lorentz, Minkow-
ski, Einstein. La relativit´e g´en´erale a ´et´e d´ecouverte par Einstein et Hilbert; elle englobe la relativit´e
restreinte et la gravitation (qu’elle interpr`ete comme n’´etant pas une force mais l’effet de la courbure
de l’espace-temps. . . ).
Entre les deux on peut placer l’´electromagn´etisme, pour son niveau de complexit´e (la relativit´e
g´en´erale n’en d´epend pas en toute rigueur mais utilise `a peu pr`es les mˆemes outils math´ematiques).
La relativit´e g´en´erale cohabite naturellement avec l’´electromagn´etisme : le champ ´electromagn´e-
tique et le champ gravitationnel interagissent de mani`ere coh´erente tout en restant des objets
distincts.
On peut remarquer un outil math´ematique qui traverse un grand nombre de th´eories physiques :
le calcul tensoriel. Pour r´esumer, ce formalisme consiste en assemblages d’op´erations g´en´erales de
“multiplications” entre des vecteurs pouvant appartenir `a diff´erents espaces vectoriels. Il s’exprime
dans toute son ´etendue en th´eorie quantique des champs o` u n’importe quelle expression tensorielle
qu’on peut ´ecrire `a partir de certains objets (donn´es par les types de particules pr´esents) se r´ealise
par le diagramme de Feynman correspondant.
Son absence apparente des cours habituels d’´electromagn´etisme est en fait une maladresse :
certains calculs (en m´ecanique classique et ´electromagn´etisme) utilisent des formules vectorielles
ou autres r`egles de transformations d’expressions qui semblent alors d’origine tr`es myst´erieuse
ou n´ecessitent des d´emonstrations compliqu´ees, mais deviendraient simples et naturelles une fois
traduites en langage tensoriel. La raison pour laquelle cette situation perdure est qu’il ne semble
pas exister actuellement dans la litt´erature une pr´esentation suffisamment claire et p´edagogique
du calcul tensoriel pour qu’on puisse songer `a l’introduire `a ce niveau d’enseignement.
Historiquement, l’´electromagn´etisme a ´et´e d´evelopp´e avant la relativit´e restreinte, et actuelle-
ment on enseigne encore l’´electromagn´etisme d’abord en premi`eres ann´ees d’universit´e, pour en
d´eduire qu’il oblige `a construire la relativit´e restreinte d’apr`es la loi de constance de la vitesse de
la lumi`ere qu’il induit. Mais cette d´emarche h´erit´ee de l’histoire, perp´etu´ee par inertie, manque
fortement d’´el´egance (sans relativit´e, le champ ´electromagn´etique se pr´esente sous forme de deux
objets, champ ´electrique et champ magn´etique, ob´eissant aux quatre ´equations de Maxwell qui
semblent bien peu naturelles, alors qu’une ou deux ´equations tensorielles sur un seul objet suffit en
partant de la relativit´e). Il serait plus ´el´egant et efficace de commencer par la relativit´e restreinte
et le calcul tensoriel, si seulement des approches convenables de ces th´eories ´etaient trouvables dans
la litt´erature.
L’´electromagn´etisme dans le cadre relativiste s’appelle ´egalement l’´electrodynamique classique
(par opposition `a l’´electrodynamique quantique qui traite cette force en physique quantique). On
peut concevoir cette th´eorie comme une extension de l’´electrostatique, de la mani`ere suivante.
Il y a une similitude formelle entre les th´eories de l’´electrostatique et de l’induction magn´etique
(dans l’espace tridimensionnel) qui se correspondent en rempla¸cant les charges de dimension z´ero
(densit´es) par des charges de dimension 1 (courants). Une fois cela remarqu´e en termes de calcul
tensoriel, il suffit de r´eappliquer cette mˆeme th´eorie, formellement ind´ependante du choix d’une
dimension particuli`ere, au cas de l’espace-temps de la relativit´e, pour obtenir l’´electrodynamique
classique. Le champ magn´etique et le champ ´electrique ne sont que les deux composantes d’un
mˆeme champ d´ecompos´e par rapport `a un r´ef´erentiel choisi.
Cette th´eorie pr´esente l’´etrange d´efaut de ne pas pouvoir consid´erer les ´electrons comme
ponctuels en toute exactitude sans cons´equences absurdes, mais seulement suivant des approx-
imations, en renon¸cant `a d´efinir la position d’un ´electron avec une pr´ecision plus fine qu’une
distance de l’ordre du rayon classique

de l’´electron r
e
= 2, 82.10
−15
m. Cependant cette taille est

Comparable `a la taille du noyau atomique, c’est le double du rayon de la sph`ere `a l’ext´erieur
de laquelle l’´energie du champ ´electrique calcul´e classiquement atteint l’´energie de masse mc
2
de
l’´electron : vu de plus pr`es que cela, si l’´electron ´etait ponctuel, en lui soustrayant cette ´energie
et donc cette masse qui se trouve dans le champ qui l’entoure, il lui resterait une masse n´egative,
d´efiant les lois de la m´ecanique. . . mais en fait, l’´energie de masse du champ magn´etique dˆ u au spin
de l’´electron est plus importante encore pr`es de ce rayon classique, et donnerait donc un rayon plus
grand.
9
bien inf´erieure `a la fameuse “incertitude” de la physique quantique (dans le cadre de laquelle ce
probl`eme de l’´energie du champ se r´esoud mais de mani`ere tr`es compliqu´ee).
2.2. L’origine de ses paradoxes : l’intuition galil´eenne
Vue du haut d’une tour, une voiture peut s’´eloigner tant qu’elle veut, ind´efiniment; elle semble
rapetisser et ralentir au fur et `a mesure qu’elle s’approche de l’horizon, bien qu’il ne lui arrive
en r´ealit´e rien de sp´ecial `a son approche. Elle ne pourra jamais atteindre cet horizon si ce n’est
`a cause de la rotondit´e de la terre, ni encore moins le d´epasser. Ces faits n’´etonnent personne.
Pourquoi s’´etonnerait-t-on alors des fait suivants qui leur sont pourtant analogues : un voyageur
peut acc´el´erer tant qu’il veut sans qu’il ne lui arrive quoi que ce soit, tandis que quelqu’un qui se
pr´etendrait immobile le verrait ainsi atteindre des vitesses arbitrairement proches de celle de la
lumi`ere, sans jamais l’atteindre, mais en subissant `a son approche quelques distorsions, dont un
ralentissement du temps et une contraction des longueurs dans le sens de sa vitesse (qui n’apparaˆıt
d’ailleurs mˆeme pas visuellement comme une contraction mais comme une rotation; voir les d´etails
plus loin) ?
Cet ´etonnement, qui traduit une l´egitime soif de comprendre, est dˆ u `a notre tendance naturelle
`a penser le probl`eme par ce que (`a moins que vous ayez une meilleure suggestion) nous appellerons
“l’intuition galil´eenne”, que nous allons maintenant expliquer.
Nous percevons le monde sous forme d’images re¸cues par les yeux et instantan´ement in-
terpr´et´ees par le cerveau en images tridimensionnelles. On a ainsi une succession continue d’images,
ou pour le dire autrement une image en ´evolution. De mˆeme dans l’activit´e th´eorique, on imagine
des figures ou des images qui se succ`edent ou ´evoluent au cours du temps. L’intuition galil´eenne est
alors le fait d’utiliser cette dimension temporelle de notre imagination, cette facult´e `a faire ´evoluer
dans notre imagination les images au cours du temps, pour repr´esenter la dimension temporelle de
l’univers physique que l’on cherche `a concevoir.
Ce mode de repr´esentation ´etait adapt´e `a la th´eorie galil´eenne, qui autorisait les interactions
instantan´ees `a distance et dans laquelle la vitesse de la lumi`ere ´etait infinie. En effet, l’image qu’un
observateur re¸coit du monde `a un instant y correspondait `a l’image qu’un autre observateur ´eloign´e
du premier (et pouvant ˆetre en mouvement par rapport `a lui) en re¸coit aussi `a un certain instant
(donc au “mˆeme” instant), par une simple transformation g´eom´etrique (un d´eplacement). C’est
donc une image de dimension 3 que le th´eoricien peut imaginer `a un certain instant, et `a laquelle
il peut attribuer une r´ealit´e objective.
Mais cela devient faux en relativit´e, du fait que la vitesse de la lumi`ere est finie et ind´epassable
par l’information. L’intuition galil´eenne n’est donc pas adapt´ee pour concevoir cette th´eorie.
2.3. Le pi`ege m´ethodologique de son enseignement actuel
La plupart des cours de relativit´e restreinte, mˆeme r´ecents, que l’on trouve sur le march´e,
emploient encore plus ou moins la mˆeme d´emarche fid`ele `a l’histoire de sa d´ecouverte, loin de
toute tentative de r´enovation r´eput´ee impossible ou sans objet, tellement cette m´ethode a ´et´e
r´ep´et´ee plus ou moins telle quelle depuis bientˆot un si`ecle: au nom du sens des principes et r´ealit´es
exp´erimentales, ils commencent par consid´erer comme r´ealit´e premi`ere le type d’apparences du
monde per¸cues par les mis´erables points dans l’univers que nous sommes. S’enfermant ainsi dans
l’intuition galil´eenne, ils ne peuvent alors qu’entreprendre d’y faire entrer ´egalement coˆ ute que
coˆ ute la r´ealit´e de l’espace-temps physique.
La correspondance entre r´ealit´e physique et intuition galil´eenne que donne naturellement
l’observation n’´etant pas satisfaisante, ils en construisent une autre artificielle plus satisfaisante
pour l’esprit, appel´ee “r´ef´erentiel galil´een”, au moyen d’un dispositif exp´erimental fictif, com-
plexe et pratiquement irr´ealisable. Cette notion de r´ef´erentiel galil´een qui ´etait h´erit´ee de la
th´eorie galil´eenne, sera finalement un outil math´ematique ´equivalent `a la notion de rep`ere orthog-
onal en g´eom´etrie euclidienne (ou parfois `a la donn´ee d’un seul vecteur de base de ces rep`eres,
`a savoir le vecteur temps) : notion utile mais non essentielle `a l’´etude de la g´eom´etrie, et ici
d´etourn´ee de son sens au profit d’une intuition inadapt´ee. (En effet, elle d´eclare instantan´es des
´ev`enements ind´ependants, donnant `a “voir” en imagination un ´ev`enement “pr´esent” ´eloign´e dont
la lumi`ere n’arrivera que plus tard, comme si on pouvait voir venir un signal lumineux avant qu’il
10
ne nous parvienne. . . ) (Le qualificatif “galil´een” des r´ef´erentiels ´etait dˆ u au fait que dans la th´eorie
galil´eenne on pouvait aussi consid´erer des r´ef´erentiels “non-galil´eens” sans trop de complications,
ce qui n’est plus le cas : car les syst`emes mat´eriels acc´el´er´es aussi ´etudiables, qui sont sens´es d´efinir
ces autres r´ef´erentiels, sont alors de plus mauvais points de vue pour l’intuition galil´eenne; un tel
emploi de cet intuition correspondrait math´ematiquement `a l’emploi de syst`emes de coordonn´ees
curvilignes.)
Naturellement incapables d’articuler cette intuition conform´ement `a la th´eorie `a concevoir,
ils d´eclarent que la th´eorie ne peut ˆetre appr´ehend´ee que par la rigueur des formules et des
d´emonstrations, en rejetant toute inspiration intuitive. Mais en mˆeme temps, au nom du sens
des r´ealit´es, ils continuent `a s’accrocher `a cette intuition d´esesp´er´ement. Car les formules ne
peuvent exister `a l’´etat pur sous peine de perdre toute signification, elles ne peuvent qu’ˆetre des
relations entre des param`etres qui correspondent `a la r´ealit´e, laquelle se d´efinit comme objet de
nos sens et donc de notre intuition, oui mais lesquels et suivant quelle correspondance ? C’est ce
choix malheureux d’un mode de repr´esentation fix´e arbitrairement, ni fid`ele `a l’exp´erience dans sa
relation `a la r´ealit´e, ni adapt´e `a la compr´ehension interne de la th´eorie `a concevoir, qui d´etermine
l’apparence des formules “fondamentales” et leur complexit´e.
Alors, faute de pouvoir donner un sens physique intuitif `a une formule, ils la consacrent
de la force d’autorit´e que lui donne la longueur des preuves du fait qu’il ne peut exister au-
cune th´eorie de l’espace-temps ou de la m´ecanique (compatible avec certains principes formul´es
exp´erimentalement), aussi tordue soit-elle, dans laquelle elle ne serait rigoureusement vraie. Ainsi,
au nom du sens des r´ealit´es physiques, ils prouvent l’unicit´e de la th´eorie sans la donner `a com-
prendre vraiment, en oubliant presque d’en justifier l’existence (c’est-`a-dire la non-contradiction),
satisfaits pour cela de constater que l’univers existe. (D’o` u la prolif´eration de pseudo physi-
ciens r´evolutionnaires qui pr´etendent r´efuter la relativit´e par de simples exp´eriences de pens´ee,
la pr´esentant comme une interpr´etation absurde et m´ediocre des fameuses exp´eriences).
2.4. Pour une nouvelle approche de la th´eorie
Nous aborderons la relativit´e restreinte par une pr´esentation intuitive qui consiste `a employer,
`a la place de l’intuition galil´eenne, une intuition g´eom´etrique purement spatiale.
En voici le motif. Nous percevons les dimensions de la r´ealit´e physique sous forme de trois
sensations : images visuelles (de dimension 2), profondeur et temps; elles fournissent naturellement
trois formes d’imagination pour le th´eoricien. On reconnaˆıt que les trois dimensions d’espace sont
physiquement de mˆeme nature et en continuit´e entre elles malgr´e leur diff´erence de forme sensible
(vision et profondeur). Cette identit´e de nature et cette continuit´e apparaissent intuitives lorsque
par une rotation de l’objet la profondeur s’´echange avec une des deux dimensions visuelles. Alors,
g´en´eralisons ce raisonnement en supposant que la dimension temporelle elle aussi est physiquement
de mˆeme nature que les trois autres, et rendons ce fait intuitif en repr´esentant le temps lui aussi
par une dimension visuelle de l’imagination (en fait l’identit´e de nature n’est pas compl`ete mais
cette d´emarche n’en est pas moins pertinente, et la diff´erence sera pr´ecis´ee plus loin).
On pourra ˆetre tent´e de reprocher `a cette m´ethode l’absence de d´emarche rigoureuse fond´ee sur
la r´ealit´e (les ´enonc´es de principes physiques issus de constatations exp´erimentales) pour construire
et prouver la th´eorie (ou pour le dire plus clairement, le fait qu’elle ne se fonde pas sur l’intuition
galil´eenne). Mais son objectif est de donner une claire vision des choses sans s’embarrasser au d´epart
de leurs apparences exp´erimentales. La coh´erence et les cons´equences de cette vision montreront
naturellement qu’elle d´ecrit un monde possible compatible avec les fameux principes physiques.
Les lecteurs int´eress´es par la preuve qu’il n’y a pas d’autre monde possible, `a part la relativit´e
restreinte et la th´eorie galil´eenne, sont donc invit´es `a se r´ef´erer pour cela aux cours traditionnels
sur ce sujet. (Remarquons en passant que la relativit´e g´en´erale d´ecrit justement un autre monde
plus proche de la v´erit´e. . . )
On pourra aussi lui reprocher de n’ˆetre pas plus simple, voire d’ˆetre plus difficile `a com-
prendre que la m´ethode traditionnelle. D´ej`a, les gens habitu´es `a cette derni`ere, ou mˆeme ceux qui
ayant commenc´e `a l’apprendre voudraient qu’on la leur explique mieux, risquent de mal accepter de
reprendre les choses `a z´ero en changeant ainsi compl`etement d’approche. Mais peut-ˆetre mˆeme cer-
tains, suivant leur mani`ere de penser, pouvaient r´eellement mieux s’y retrouver. En effet, elle avait
11
en quelque sorte l’avantage de permettre de formuler la th´eorie et r´esoudre des probl`emes sans faire
vraiment le travail de la comprendre et de rentrer dedans : “il suffit” d’´ecrire les d´emonstrations
et d’appliquer les formules. Cependant, cet avantage qu’on peut trouver jusqu’`a la formulation
de la th´eorie risque de se transformer en handicap ensuite, lorsque face `a un probl`eme concret on
se perd devant ces formules qu’on ne sait pas toujours comment appliquer ou manipuler, ou dont
l’utilisation n´ecessite des pages de calcul.
Enfin, on pourrait ˆetre tent´e de penser qu’elle ne serait pas compl`ete, omettant les formules
consacr´ees r´eput´ees n´ecessaires `a la r´esolution exacte des probl`emes pratiques (en confondant sou-
vent le caract`ere “pratique” d’un probl`eme avec l’emploi arbitraire des r´ef´erentiels galil´eens ainsi
que du vocabulaire et des formes d’imagination associ´es dans sa formulation). Mais finalement, il
n’est pas n´ecessaire de d´evelopper tellement de formules sp´ecifiques comme si c’´etait une th´eorie
totalement ´etrang`ere `a nos connaissances courantes, car la partie essentielle de la relativit´e est une
g´eom´etrie au fond tr`es similaire `a la g´eom´etrie euclidienne (comme on l’expliquera plus loin) : il
suffit donc, en vue de faire face `a la plupart des probl`emes, de reprendre les divers outils d’´etude
de la g´eom´etrie euclidienne, port´es par l’intuition qui les accompagne, et de pr´eciser comment ils
sont modifi´es dans la nouvelle g´eom´etrie.
Et pourtant, le point de vue que la pr´esentation qui suit vise `a exprimer n’est pas r´eellement
nouveau, comme en t´emoignent maints d´eveloppements ult´erieurs de la physique th´eorique ayant
suivi historiquement la d´ecouverte de la relativit´e. On observe en effet que les lourdes for-
mules (“transformation de Lorentz” et ce qui s’ensuit) pr´etendument constitutives de la relativit´e,
tout en restant vraies, n’apparaissent plus telles quelles dans les chapitres de relativit´e g´en´erale,
´electrodynamique classique ou autres th´eories fond´ees sur la relativit´e restreinte. A leur place, in-
tervient un simple objet (une “m´etrique” dite “pseudo-euclidienne”!) qui t´emoigne de l’assimilation
r´eelle de cette nature g´eom´etrique de l’espace-temps dans l’esprit des physiciens. C’est pour eux
si naturel qu’il est inutile se s’attarder sur ce fait, le plus int´eressant ´etant d’aller de l’avant dans
son utilisation. Donc, l’approche qui sera propos´ee ici serait nouvelle non pas en elle-mˆeme, mais
seulement relativement `a l’univers habituel de l’enseignement universitaire.
Alors, pourquoi donc une telle r´enovation de son enseignement ne s’est-elle jamais produite
depuis que tant de physiciens l’ont si bien acquise ? La r´eponse est simple, mais seulement ´etrang`ere
`a notre monde habitu´e `a juger les connaissances des ´el`eves et ´etudiants d’apr`es leur capacit´e `a
r´ediger des d´emonstrations dans les formes r`eglementaires : c’est qu’un abˆıme s´epare parfois la
claire assimilation personnelle d’une connaissance, de la capacit´e `a trouver les mots justes pour la
traduire en une forme verbale claire et transmissible.
3. Nouvelle pr´esentation de la relativit´e restreinte
3.1. Le sch´ema de la th´eorie
En vertu de ce qui pr´ec`ede, la meilleure fa¸con de comprendre l’espace-temps est de com-
mencer par renoncer `a la tentative de le comprendre en tant que tel, en sorte de pouvoir assimiler
tranquillement les notions qui le constituent comme si cela n’avait aucun rapport, pour ne pas
d´ependre d’arri`ere-pens´ees qui risqueraient d’ˆetre contre-productives,. Le fait que la relativit´e re-
streinte a le titre de th´eorie physique ´equivaut `a dire que le monde imaginaire que nous allons
maintenant pr´esenter correspond math´ematiquement `a l’espace-temps de notre univers dans le do-
maine d’approximation consid´er´e. Mais ce fait n’a pour le moment aucune importance dans la
mesure o` u il n’apporte rien `a la compr´ehension de la th´eorie elle-mˆeme. Il suffira `a la fin, quand
tout sera clairement compris, de remarquer simplement : “Et pourquoi pas ?”.
Passons donc au contenu conceptuel de la relativit´e.
Voici:
Imaginons un monde o` u toutes choses mat´erielles sont fixes, en ´equilibre.
Pouvez-vous imaginer cela ? Vous allez dire : bien sˆ ur, c’est trop facile, ce genre de situation
est un cas particulier de l’exp´erience de la vie de tous les jours, laquelle est plus compliqu´ee. Mais
la relativit´e restreinte doit ˆetre forc´ement quelque chose de plus compliqu´e encore, sinon on l’aurait
comprise depuis longtemps, non ?
12
Certes, il n’est pas exactement suffisant d’imaginer un monde immobile, mais math´emati-
quement la diff´erence est accessoire. L’essentiel de la complexit´e des choses se trouve contenu dans
ce type particulier d’exp´erience quotidienne.
Cette exp´erience n’est math´ematiquement pas une chose triviale du tout. En effet, pour d´ecrire
la disposition des diff´erents objets en ´equilibre, il faut faire appel au langage de la g´eom´etrie. Or
la g´eom´etrie euclidienne est en fait une th´eorie math´ematiquement complexe, qu’on ne pourrait
pas facilement expliquer de mani`ere simple et purement logique sans s’appuyer sur l’exp´erience
visuelle (par exemple `a un aveugle qui n’aurait au d´epart aucune exp´erience de l’espace, s’il en
existe). De mˆeme pour la notion d’´equilibre. Mais nous avons de la chance, ces deux choses nous
sont famili`eres. Il ne reste qu’`a y ajouter les trois points suivants, qui peuvent s’introduire chacun
ind´ependamment des autres, ainsi qu’`a pr´eciser certaines interactions particuli`eres qu’il y a entre
eux.
– Le rapport de cette g´eom´etrie `a la perception spatio-temporelle que nous en donne l’exp´e-
rience.
– Le changement de g´eom´etrie: l’espace dans lequel les choses sont ainsi dispos´ees ob´eit `a une
g´eom´etrie diff´erente de celle qui nous est famili`ere; il faut donc la d´efinir.
– L’expression math´ematique de la m´ecanique de l’´equilibre et les propri´et´es m´ecaniques des
particules.
Cette diff´erence de g´eom´etrie est faible en soi, la nouvelle g´eom´etrie n’´etant pas partic-
uli`erement plus compliqu´ee que la g´eom´etrie euclidienne, mais nous sommes tellement marqu´es
par notre habitude que cette diff´erence peut nous sembler extraordinaire et insurmontable.
Plus pr´ecis´ement, il y a deux diff´erences de g´eom´etrie. La premi`ere est la dimension: elle vaut
4, alors que nous ne sommes habitu´es qu’aux dimensions 2 et 3. La deuxi`eme est qu’il ne s’agit
pas l`a de la g´eom´etrie euclidienne de dimension 4 qui g´en´eralise automatiquement celles du plan
et de l’espace usuels. Mais c’est une autre g´eom´etrie qui a de fortes parent´es avec la g´eom´etrie
euclidienne, et quelques diff´erences. Suivant un certain usage, nous l’appellerons la g´eom´etrie
pseudo-euclidienne. Comme la g´eom´etrie euclidienne, elle existe en dimension quelconque n ≥ 2.
Il y a environ trois mani`eres possibles de l’introduire. La premi`ere serait de partir de principes
physiques dont l’invariance de la vitesse de la lumi`ere. Elle masque son analogie profonde avec la
g´eom´etrie euclidienne, en privil´egiant les structures qui lui sont sp´ecifiques, li´ees au cˆone de lumi`ere
(que nous verrons en dernier).
Une deuxi`eme m´ethode consiste `a en donner une construction math´ematique `a partir de la
g´eom´etrie affine, de mani`ere analogue `a la construction de la g´eom´etrie euclidienne (le moyen le plus
commode ´etant probablement l’introduction d’un produit scalaire sur l’espace vectoriel associ´e).
Comme ces deux premi`eres m´ethodes se trouvent facilement par ailleurs, ce que nous pr´esen-
terons ici sera une troisi`eme m´ethode (non qu’elle soit meilleure dans l’absolu mais qu’elle a aussi
des avantages qui lui sont propres), qui consiste en une sorte de transformation “magique” (non
rigoureuse) qui fait la correspondance entre g´eom´etrie euclidienne et g´eom´etrie pseudo-euclidienne.
Son avantage est qu’elle ne n´ecessite pas de remonter aux fondements math´ematiques de la g´eom´e-
trie, mais qu’elle permet de r´eutiliser les connaissances na¨ıves et les m´ethodes g´en´erales dont on
dispose en g´eom´etrie euclidienne, en appliquant finalement une simple traduction des r´esultats
pour obtenir ceux correspondants en g´eom´etrie pseudo-euclidienne. Elle a donc l’avantage de nous
permettre de transporter directement dans la nouvelle g´eom´etrie des intuitions tr`es diverses que
nous avons pu h´eriter de l’exp´erience en rapport avec la g´eom´etrie euclidienne sans n´ecessiter leur
reconstruction math´ematique, avantage dont nous ne nous priverons pas par la suite.
Cette m´ethode s’exprime math´ematiquement par la notion de prolongement analytique: on
d´emontre des formules ou relations g´eom´etriques pour les valeurs positives d’une variable, avant
d’appliquer finalement le r´esultat `a une valeur n´egative. Dans cette correspondance, les ´egalit´es
sont g´en´eralement pr´eserv´ees, mais non les in´egalit´es.
Nous nous contenterons de l’introduire en dimension 2 (g´eom´etrie du plan pseudo-euclidien),
car il est plus facile d’y exercer l’intuition visuelle de la g´eom´etrie, et cela suffit `a r´ealiser l’essentiel
du travail de pr´esentation des nouveaut´es par rapport `a la g´eom´etrie euclidienne. Ensuite, passer `a
la dimension 3 ou 4 serait un exercice d’intuition difficile mais secondairement utile, car d’un point
13
de vue abstrait cette g´en´eralisation est quasi automatique et ne comporte que peu de ph´enom`enes
nouveaux (qu’on abordera par la suite; mais on n’a pas souvent besoin en pratique de tenir compte
de toutes les dimensions en mˆeme temps).
Les deux autres probl`emes, le rapport `a l’exp´erience et la m´ecanique, s’appuient sur les struc-
tures g´eom´etriques de l’espace, donc ils d´ependent de cette g´eom´etrie. Cependant, ils peuvent
s’exprimer de la mˆeme mani`ere avec n’importe laquelle de toutes ces g´eom´etries (euclidienne ou
pseudo-euclidienne, de dimension quelconque), grˆace au fait que ces g´eom´etries ont toutes en com-
mun le mˆeme langage fondamental (la mˆeme liste de structures; seules les propri´et´es de certaines
de ces structures pr´esentent des diff´erences).
Nous les exprimerons donc en invoquant les structures g´eom´etriques suivant le langage de
la g´eom´etrie euclidienne. Et il sera permis de les interpr´eter effectivement dans le cadre de la
g´eom´etrie euclidienne, autrement dit celui de notre exp´erience quotidienne d’objets fixes, pour
bien en comprendre la nature.
Le fait que l’expression de la m´ecanique relativiste soit la mˆeme que celle de l’´equilibre
s’explique simplement : l’´equilibre est la situation de la m´ecanique relativiste o` u les syst`emes
mat´eriels ne subissent aucune ´evolution dans une certaine direction temporelle; alors, tout peut
encore se produire dans les trois dimensions restantes suivant les lois normales de la m´ecanique
relativiste, `a la seule diff´erence pr`es que la dimension temporelle (plus pr´ecis´ement la direction
temporelle en question) n’intervient plus. La loi de l’´equilibre est donc la mˆeme que la m´ecanique
relativiste avec une dimension de moins, ce qu’il fallait d´emontrer.
3.2. Lien `a l’exp´erience
La question du rapport de cette r´ealit´e `a notre exp´erience de l’espace et du temps, est la seule
question facile, qui ne n´ecessite pas de travail math´ematique important; elle n’apporte aucune
information sur les lois de la physique elles-mˆemes. La question est celle-ci: de quelle mani`ere
visitons-nous ce monde de dimension 4 o` u les choses sont fixes, en sorte qu’il nous apparaisse sous
forme d’un monde de dimension 3 o` u les choses ´evoluent ?
En g´en´eral, cette question s’applique `a la visite d’un monde de dimension n ≥ 2 o` u les choses
sont fixes (et pour lesquelles le temps n’existe donc pas), le laissant percevoir sous la forme d’un
monde de dimension n −1 o` u les choses ´evoluent.
Dans cette histoire, le temps au cours duquel les choses paraissent ´evoluer n’est pas un temps
objectif, mais il n’a de sens que subjectif, ´etant v´ecu s´epar´ement pour chaque observateur, et
n’ayant donc pas d’autres relations n´ecessaires a priori avec celui des autres que celles s’´etablissant
par l’interm´ediaire des choses mat´erielles qui sont fixes.
En fait, nous avons d´ej`a effleur´e la r´eponse en introduisant la g´eom´etrie euclidienne : physique-
ment, chaque observateur (ou son corps ou son vaisseau spatial ou mˆeme la Terre si on veut, vu
qu’ici la taille de la Terre est finalement n´egligeable car elle vaut moins d’un dixi`eme de seconde-
lumi`ere), est semblable `a un fil dispos´e dans l’espace en une courbe appel´ee sa ligne d’univers.
L’id´ee est que ce fil en tant qu’espace de dimension 1 joue le rˆole de ligne du temps personnel de
l’observateur. Ainsi, au cours de son temps `a lui, il visite le monde en parcourant sa ligne d’univers
`a vitesse constante, comme un train suivrait une voie ferr´ee `a vitesse constante ou comme une
impulsion lumineuse suit une fibre optique. On postule que cette vitesse de parcours est une con-
stante universelle not´ee v; on peut lui donner num´eriquement la valeur qu’on veut puisque le temps
´etant ainsi une quantit´e subjective et non physique (les objets physiques ne peuvent pas le mesurer
puisqu’ils sont fixes), on ne peut d´efinir physiquement son unit´e qu’en termes de la longueur de
courbe parcourue `a cette vitesse.
Un observateur peut, de sa ligne d’univers, observer la ligne d’univers d’un autre observa-
teur, non l’autre observateur lui-mˆeme (car seule la ligne d’univers est mat´erielle). La sensation
d’acc´el´eration est d´efinie par la courbure de cette ligne de la mˆeme mani`ere que la force centrifuge
dans une voiture roulant `a vitesse constante est d´efinie par la courbure de la route ou de mani`ere
´equivalente par la position du volant.
Une horloge est physiquement semblable `a un observateur: c’est aussi un fil dispos´e dans
l’espace, mais gradu´e r´eguli`erement. Donc si la ligne d’univers d’un observateur est superpos´ee
14
`a celle d’une horloge (il garde l’horloge avec lui), il voit au cours de son temps personnel les
graduations de l’horloge d´efiler `a un rythme r´egulier, comme une bonne horloge doit se comporter.
Les paradoxes de la relativit´e viennent des effets g´eom´etriques qui se pr´esentent dans leur
complexit´e mais coup´es de l’intuition g´eom´etrique explicative.
On peut v´erifier que la th´eorie galil´eenne de l’espace-temps s’obtient comme limite de ce mod`ele
lorsque la vitesse de parcours v des lignes d’univers tend vers l’infini; et par rapport `a la th´eorie
galil´eenne, le pr´esent mod`ele apporte des corrections dont le premier terme a une amplitude de
l’ordre de v
−2
. Or, le travail de changement de g´eom´etrie que nous ferons plus loin peut se r´esumer
(si on oublie les exp´eriences faisant intervenir la lumi`ere elle-mˆeme, qui ne correspond `a rien dans
ce mod`ele euclidien) au fait de donner `a ce v
−2
une valeur n´egative, suivant la formule
v
2
= −c
2
.
Donc les effets relativistes (exprim´es `a l’aide de c) sont finalement invers´es par rapport `a ceux
qu’on obtiendrait normalement dans la situation telle que nous venons de la d´ecrire dans le cas de
la g´eom´etrie euclidienne.
Les effets g´eom´etriques suivants, exactement inverses des effets relativistes correspondants,
ne seraient-ils pas paradoxaux d’un point vue purement logique en l’absence de support visuel
explicatif :
– Quand on voit au loin un camion avancer de gauche `a droite, pourquoi r´etr´ecit-il subitement
lorsque son chemin se tourne vers nous ou vers le lointain (dilatation relativiste du temps) ?
– Pourquoi ses deux roues avant qui ´etaient superpos´ees se s´eparent-elles par rapport `a nous
(relativit´e de la simultan´eit´e) ?
– Pourquoi cela prend-il des temps diff´erents pour aller d’un point `a un autre suivant des
chemins diff´erents, alors qu’on y va dans tous les cas `a la mˆeme vitesse (paradoxe des jumeaux) ?
– Enfin, en d´efinissant la grosseur d’un saucisson par la largeur de ses rondelles, comment se
fait-il qu’il est plus gros lorsque son axe est inclin´e par rapport au plan de coupe que lorsqu’il lui
est orthogonal (contraction relativiste des longueurs) ?
Voil`a, l’essentiel est dit. Ajoutons quelques remarques.
Un r´ef´erentiel galil´een est la donn´ee d’une direction temporelle (i.e. qu’on peut parcourir
comme temps, ce qui en g´eom´etrie pseudo-euclidienne ne peut pas ˆetre une direction “spatiale”)
pour ˆetre la direction de droite d’univers d’un observateur ou des observateurs choisi(s) comme
r´ef´erence.
Vocabulaire. Par commodit´e pour la suite de cet expos´e, nous emploierons le qualificatif de
“th´eorique” comme d´esignant l’emploi du mode de repr´esentation g´eom´etrique de l’espace-temps,
o` u les choses apparaissent fixes (pouvant se comprendre d’abord comme si la g´eom´etrie ´etait eu-
clidienne, puis en tenant compte de sa forme pseudo-euclidienne). A cela s’opposera le qualificatif
d’“exp´erimental” pour d´esigner la description donn´ee par les apparences exp´erimentales ordinaires
de fixit´e ou de non fixit´e dans l’espace `a 3 dimensions que peuvent prendre les objets de la m´ecanique
relativiste par rapport `a un r´ef´erentiel donn´e (la fixit´e qualifiant les syst`emes invariants par trans-
lation temporelle suivant le r´ef´erentiel).
Cet usage quelque peu d´etourn´e des termes oppos´es de “th´eorie” et “exp´erience” ne devrait
pas prˆeter `a confusion puisque leur usage normal auquel il fait concurrence n’apparaˆıtra pas dans
cet expos´e (o` u tout est th´eorique au sens usuel).
Par exemple, la notion th´eorique de point est d´esign´ee exp´erimentalement par le terme d’´ev`ene-
ment, c’est-`a-dire un point qui pour un observateur n’apparaˆıt qu’`a un instant pr´ecis.
Remarque 1. A la description ci-dessus il faut ajouter deux informations n´ecessitant l’usage de
notions sp´ecifiques `a la g´eom´etrie pseudo-euclidienne.
La premi`ere information est la condition pour qu’une courbe th´eorique puisse ˆetre le lieu d’une
ligne d’univers (d’un observateur ou d’une particule). En effet, en g´eom´etrie euclidienne toute
courbe pouvait ˆetre le lieu de disposition d’un fil (qui permet de d´efinir l’abscisse curviligne), ce qui
n’est plus vrai en g´eom´etrie pseudo-euclidienne. Notamment, une courbe referm´ee sur elle-mˆeme
15
n’est pas une ligne d’univers possible, de sorte qu’on ne puisse pas remonter le temps. Pr´ecis´ement,
la succession des points d’une ligne d’univers doit respecter l’ordre temporel (ou ordre de causalit´e):
c’est une relation d’ordre partiel qui se conserve par le groupe des rotations-translations th´eoriques.
Il est ´evident qu’une telle relation d’ordre ne peut pas exister dans le cas de la g´eom´etrie euclidienne,
puisque la sym´etrie centrale y ´etant une rotation de pi radians la renverserait. Mais la sym´etrie
centrale du plan pseudo-euclidien n’est pas une rotation.
La deuxi`eme chose est de d´efinir ce que l’observateur observe effectivement : l’image observ´ee
en un ´ev`enement d’observation, est donn´ee par la lumi`ere, qui arrive “`a la vitesse de la lumi`ere”,
donc issue d’un ensemble d’´ev`enements formant un cˆone de sommet l’´ev`enement d’observation,
appel´e le cˆone de lumi`ere pass´ee. Nous d´ecrirons plus loin ses propri´et´es g´eom´etriques.
Remarque 2. Un d´efaut superficiel de cette vision est qu’elle semble porter une conception fatal-
iste du monde (philosophie d’apr`es laquelle toutes choses `a venir seraient ´ecrites avant qu’elles ne se
produisent), ainsi qu’une distinction entre mati`ere et esprit. Mais ce n’est l`a qu’une impression li´ee
`a l’usage d’une forme d’intuition particuli`ere choisie pour ses avantages pratiques de compr´ehension
de l’espace physique, et qui n’exprime aucun v´eritable argument en faveur de l’une ou l’autre de
ces philosophies.
3.3. Etude d´eform´ee de la g´eom´etrie euclidienne plane
Nous allons pr´esenter ici la g´eom´etrie euclidienne exprim´ee `a travers des modes de repr´esen-
tation d´eform´es. Puis les moyens ici n´ecessaires pour g´erer une telle approche nous permettront
“magiquement” de passer `a la g´eom´etrie pseudo-euclidienne.
Cette d´eformation s’applique, de mani`ere ´equivalente, aux deux modes de repr´esentation
habituels de la g´eom´etrie: les dessins (dans le plan habituel), et les syst`emes de coordonn´ees.
Les dessins ne repr´esenteront pas fid`element les propri´et´es des figures g´eom´etriques que l’on veut
´etudier, car par rapport `a la r´ealit´e, elles apparaˆıtront ´ecras´ees dans une certaine direction, comme
lorsqu’on les voit de biais, d’un point de vue ´eloign´e. On ne peut alors se fier aux apparences du
dessin qu’en ce qui concerne les notions de g´eom´etrie affine du plan. Les autres notions doivent
ˆetre reconstruites, d’une mani`ere non conforme `a ce qui se voit sur le dessin.
Les cercles
Un cercle a sur le dessin l’aspect d’une ellipse, avec un grand axe et un petit axe, qui sont des
droites orthogonales (aussi bien en r´ealit´e que sur le dessin; leurs directions sont la seule paire de
directions ayant cette propri´et´e). La direction du petit axe et le rapport mesur´e sur le dessin
k =
longueur du petit axe
longueur du grand axe
d´ependent du point de vue employ´e pour faire le dessin, mais ne d´ependent pas du cercle.
Remarque: `a partir d’une ellipse quelconque dans un dessin, on peut supposer qu’elle repr´esente
un cercle. Puis, ayant choisi une ellipse pour jouer le rˆole de cercle, les autres cercles se d´efinissent
comme ´etant les ellipses obtenues `a partir de celle-ci par homoth´eties et translations.
Les rep`eres orthogonaux
Nous allons utiliser ces axes pour former un syst`eme de coordonn´ees, orthonorm´e sur le dessin
(en effet, `a l’aide de la g´eom´etrie euclidienne du dessin on peut copier l’unit´e de longueur apparente
d’un axe sur l’autre), mais seulement orthogonal en r´ealit´e. Les coordonn´ees seront not´ees (t, x),
o` u l’axe du temps (d’´equation x = 0) est le petit axe de l’ellipse, et l’axe d’espace (d’´equation t = 0)
est le grand axe. Notons (O,

t, x) ce rep`ere. Les vecteurs

t et x semblent tous deux de norme 1 sur
le dessin, mais en fait ||x|| = k||

t|| = 1.
Cet emploi purement artificiel du vocabulaire d’espace et de temps pour d´esigner les coor-
donn´ees est seulement motiv´e ici par le fait qu’un point parcourant l’“axe du temps” `a la vitesse v
aura une vitesse apparente ´egale `a 1 sur le dessin, en sorte que la “coordonn´ee de temps” sur cet
axe s’identifie au temps de ce parcours. On aura donc v = k
−1
.
Ensuite, `a partir d’un tel rep`ere principal, les autres rep`eres qu’on se permettra d’utiliser seront
ceux qui sont r´eellement orthogonaux et ont les mˆemes valeurs des normes des vecteurs de base (et
16
donc la mˆeme valeur de k) sans tenir compte des apparences du dessin, autrement dit des rep`eres
obtenus par de vraies rotations `a partir d’un rep`ere orthogonal fix´e construit comme ci-dessus.
1
2
3
4
1
3
2
4
2
3
4
4
3
2
1
x
1
0

1
t
Figure r´eelle ´etudi´ee Dessin utilis´e (agrandi ici)
Les distances
Il ne sera pas question de mentionner les distances apparentes sur le dessin, car elles n’ont pas
de rapport naturel avec la r´ealit´e ´etudi´ee. Nous allons consid´erer les mesures des distances r´eelles,
mais suivant deux unit´es de longueur possibles, qui sont les longueurs r´eelles des deux vecteurs de
base principaux. Pr´ecis´ement, l’unit´e d’espace vaut k fois l’unit´e de temps. Ainsi, la mesure en
unit´e de temps de la norme d’un vecteur u de coordonn´ees (t, x) est donn´ee par
||u||
t
=
_
t
2
+k
2
x
2
=
_
t
2
+
x
2
v
2
et est la longueur apparente sur le dessin du vecteur obtenu par une vraie rotation de u pour
l’amener sur l’axe du temps, et de mani`ere analogue sa mesure en unit´e d’espace est donn´ee par
||u||
x
= k
−1
||u||
t
=
_
v
2
t
2
+x
2
.
`
A chacune de ces unit´es correspond de la mˆeme mani`ere une mesure du produit scalaire :
u · u

= tt

+k
2
xx

ou v
2
tt

+xx

.
Ainsi, k sera trait´e comme un nombre fixe. Cependant, sans le traiter d’une mani`ere diff´erente,
et puisque sa valeur effective n’intervient pas dans les calculs formels, on peut plus judicieusement
l’interpr´eter comme ´etant non un nombre r´eel mais une quantit´e dans le cas d’une ´etude en co-
ordonn´ees : les mesures en unit´es de temps et d’espace sont alors interpr´et´ees non comme des
nombres r´eels mais des quantit´es ind´ependantes (des temps et des longueurs), et la quantit´e v ou
son inverse k est alors la constante universelle qui fait le lien physique naturel entre les deux.
Les angles
Les angles sont d´efinis par le rapport de la longueur d’un arc de cercle `a la mesure du rayon.
Or, pour cela on mesurera le rayon en unit´e de temps, et la longueur de l’arc en unit´e d’espace.
L’unit´e d’angle utilis´ee sera donc ´egale `a k radians. Les fonctions cos et sin utilisant comme il se
doit la mesure des angles en radians, la rotation d’un angle α exprim´e dans cette nouvelle unit´e
enverra donc le vecteur temps

t = (1, 0) sur le vecteur de composantes (cos(kα), k
−1
sin(kα)), et le
vecteur espace x = (0, 1) sur (−k sin(kα), cos(kα)).
On remarque que tant qu’on ne s’int´eresse jamais aux intersections d’un mˆeme cercle avec
les deux axes d’un rep`ere, ni aux rotations d’un angle droit, le coefficient k et les fonctions
trigonom´etriques n’apparaissent pas de mani`ere ind´ependante, mais on peut toujours regrouper
leurs apparitions en blocs de cos(kα), k
−1
sin(kα) et k
2
. (Ou plus g´en´eralement, les fonctions de k
qui interviennent sont des fonctions analytiques de k
2
). Nous exclurons dans la suite toute notion
g´eom´etrique dans laquelle ils n’apparaissent pas ainsi group´es.
3.4. Passage `a la g´eom´etrie pseudo-euclidienne
17
Pour passer de l’´etude d´eform´ee de la g´eom´etrie euclidienne `a celle de la g´eom´etrie pseudo-
euclidienne (dont toute r´epr´esentation est n´ecessairement d´eform´ee), il suffit de supposer k
2
n´egatif.
Pr´ecis´ement, la g´eom´etrie pseudo-euclidienne, o` u la correspondance naturelle entre les mesures
d’espace et de temps est exprim´ee par la vitesse de la lumi`ere c, s’obtient `a partir du mod`ele
pr´ec´edent par la formule
v
2
= −c
2
(= k
−2
)
d’o` u on peut d´eduire que
cos(kα) = cos(
α
v
) = ch(
α
c
)
k
−1
sin(kα) = v sin(
α
v
) = c sh(
α
c
)
o` u les fonctions cosinus hyperbolique ch et sinus hyperbolique sh sont d´efinies par
ch u =
e
u
+e
−u
2
, sh u =
e
u
−e
−u
2
.
(Ces expressions peuvent aussi se d´eduire des calculs suivant les rep`eres de lumi`ere pr´esent´es plus
loin).
Les in´egalit´es qui ´etaient vraies en g´eom´etrie euclidienne ne le sont g´en´eralement plus ici. En
particulier, le produit scalaire continue `a exister mais le carr´e scalaire n’est plus toujours positif.
Contrairement au cas pr´ec´edent, pour mesurer la norme d’un vecteur donn´e u(t, x) on ne peut
plus choisir arbitrairement entre l’unit´e de temps et celle d’espace, mais ce choix est d´etermin´e par
le genre du vecteur, c’est-`a-dire par le signe de son carr´e scalaire, disons ici (celui en unit´e de temps
au carr´e) t
2
− c
−2
x
2
: s’il est positif, le vecteur u est du genre temps et ||u|| peut seulement se
mesurer en unit´e de temps; s’il est n´egatif, u est du genre espace et ||u|| peut seulement se mesurer
en unit´e d’espace; s’il est nul bien que u = 0, u est un vecteur isotrope ou vecteur de lumi`ere (sa
direction est une direction possible d’un photon dans l’espace-temps) et ||u|| = 0.
En fixant l’origine du plan (ou mieux en regardant l’ensemble des vecteurs, ensemble qui forme
un plan), les vecteurs de lumi`ere forment deux droites s´ecantes qui divisent le plan en quatre parties,
dont l’une est constitu´ee des vecteurs isotropes ou du genre temps tels que t ≥ 0, et du vecteur
nul : ce sont les vecteurs futurs.
Plus g´en´eralement, cette notion de d´efinit en dimension plus grande: dans un syst`eme de
coordonn´ees, soit le vecteur u = (x, y, z, t). Son carr´e scalaire compt´e en unit´e de temps au carr´e
vaut
u
2
= t
2
−c
−2
(x
2
+y
2
+z
2
).
Le vecteur u est appel´e un vecteur futur si en ce sens u
2
≥ 0 et t ≥ 0.
On peut maintenant d´efinir la relation d’ordre temporel entre les points du plan pseudo-
euclidien: ´etant donn´es deux points M et N, on pose que M ≤ N (M est ant´erieur `a N) si
et seulement si
−−→
MN est un vecteur futur. On peut v´erifier que ceci est bien une relation d’ordre.
Si M ≤ N, l’intervalle de temps (distance en mesure temporelle) de M `a N est
_
−−→
MN
2
.
Une courbe est une ligne d’univers possible `a condition que la relation d’ordre temporel ci-
dessus d´efinie entre les points de la courbe soit un ordre total; cet ordre co¨ıncide alors avec l’ordre du
temps v´ecu par le visiteur qui suit cette ligne. En fait, cette condition est ´equivalente `a demander
que la longueur de cette courbe soit une quantit´e bien d´efinie.
Pour deux points M ≤ N, parmi les lignes d’univers possibles de M `a N, la ligne droite est
la plus longue ligne d’univers possible et la seule dont la longueur en mesure temporelle soit ´egale
`a l’intervalle de temps de M `a N. Les plus courtes lignes sont de longueur nulle et constitu´ees de
segments ayant des directions de lumi`ere, mais ce ne sont pas des lignes d’univers possibles pour
des observateurs ou tout objet de masse non nulle, qui ne peuvent pas atteindre la vitesse de la
lumi`ere: pour la ligne d’univers d’un photon les vecteurs tangents sont de carr´e scalaire nul tandis
que pour celle d’une particule de masse non nulle ou d’un observateur, tous les vecteurs tangents
sont strictement de genre temps (de carr´e scalaire non nul).
18
Les cercles de cette g´eom´etrie sont non plus des ellipses particuli`eres mais des hyperboles parti-
culi`eres, de deux genres possibles (le genre d’un cercle ´etant celui de ses rayons). Celles d’un mˆeme
genre sont l`a encore celles obtenues `a partir de l’une d’elles (qu’on peut choisir arbitrairement) par
homoth´eties et translations. Tous les cercles (des deux genres) sont les hyperboles ayant la mˆeme
paire de directions des asymptotes, qui sont les directions de lumi`ere. Chaque cercle est en deux
branches de longueur infinie chacune, puisque la longueur d’un arc de cercle est proportionnelle `a
l’angle qui se voit aussi comme angle de rotation, et que les rotations peuvent toujours se composer
(additionnant les angles) sans jamais boucler un tour.
Deux droites sont orthogonales si et seulement si on peut passer de l’une `a l’autre par sym´etrie
par rapport `a une droite de lumi`ere et parall`element `a l’autre direction de lumi`ere. Les vecteurs
de lumi`ere sont les vecteurs orthogonaux `a eux-mˆemes.
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
0
1
t
x
c
-2
Les rep`eres de lumi`ere
Le plan pseudo-euclidien admet un nouvel outil d’´etude par rapport `a la g´eom´etrie euclidienne :
l’utilisation d’un rep`ere dont les deux axes sont suivant les directions de lumi`ere. En notant (a, b)
les coordonn´ees dans un tel rep`ere, la rotation d’un angle α autour de l’origine s’exprime par
_
a

= a exp(
α
c
)
b

= b exp(−
α
c
)
On peut remarquer le rapport avec l’utilisation des nombres complexes en g´eom´etrie eucli-
dienne, o` u la rotation d’un angle α s’exprime par la multiplication par exp(iα). En effet, en
coh´erence avec la d´efinition de la nouvelle unit´e d’angle que nous avons introduite, abordons cette
fois le probl`eme en unit´e de temps, et en repr´esentant le plan euclidien (x, y) par des coordonn´ees
d’espace-temps (t, x

) d´efinies par (t = x, x

= k
−1
y). Cette d´eformation des coordonn´ees se
r´epercute sur l’´ecriture des nombres complexes: on remplace l’emploi de i par celui d’un certain
i

pour pouvoir toujours ´ecrire le “nombre complexe” sous la forme z = x + iy = t + i

x

, d’o` u
i
2
= −k
2
= c
−2
.
Le carr´e de i

´etant alors positif, Cette formule admet donc deux solutions r´eelles i

= ±c
−1
qui correspondent aux deux coordonn´ees dans un rep`ere de lumi`ere. C’est ainsi le fait de pouvoir
regarder les solutions de cette ´equation (au lieu de la conserver telle quelle lors des calculs) qui
est nouveau par rapport `a la g´eom´etrie euclidienne et permet, en imitant l’´ecriture en nombres
complexes de la g´eom´etrie euclidienne, de rendre certains calculs en quelque sorte plus simples ou
explicites.
Il est facile de voir que le coefficient exp(
α
c
) est la mesure de l’effet Doppler (le nombre par
lequel se multiplie la fr´equence d’une onde ´electromagn´etique lors de cette rotation).
L’ordre temporel M ≤ N s’exprime dans un rep`ere de lumi`ere par le mˆeme ordre sur chacune
des coordonn´ees : (a
M
≤ a
N
et b
M
≤ b
N
).
Exemple de calcul concret
Enonc´e
Imaginons un voyageur qui part de la Terre en subissant de son propre point de vue une
acc´el´eration g pendant une dur´ee t
1
, puis continue sur sa lanc´ee sans acc´el´eration pendant une
19
dur´ee t
2
, et enfin d´ec´el`ere suivant la mˆeme acc´el´eration qu’au d´epart en sens contraire. A quelle
distance d de la Terre se trouve-t-il alors ? Et s’il revient ensuite sur Terre de la mˆeme mani`ere,
de combien sera la diff´erence ∆t entre la dur´ee de son voyage pour lui et pour quelqu’un rest´e
immobile sur la Terre ? (Pr´ecisons que pour que ce probl`eme soit effectivement trait´e par la
relativit´e restreinte sans faire appel `a la relativit´e g´en´erale, il faut n´egliger d’une certaine mani`ere la
pesanteur terrestre, plus pr´ecis´ement la vitesse d’´echappement du champ de gravitation terrestre).
Solution
Traduisons d’abord l’´enonc´e de ce probl`eme dans le langage de la g´eom´etrie euclidienne.
Partant d’une route droite appel´ee “Terre”, un v´ehicule (allant `a une grande vitesse constante
v = k
−1
) se met `a d´evier, le volant ´etant braqu´e dans une certaine position qui lui fait sentir
une pouss´ee lat´erale g pendant une dur´ee t
1
. Puis brusquement le volant est redress´e, et reste
ainsi pendant une dur´ee t
2
. Enfin, en braquant dans l’autre sens de la mˆeme mani`ere on parvient
apr`es encore une dur´ee t
1
`a redresser le v´ehicule sur une route droite parall`ele `a la Terre. A quelle
distance de la Terre se trouve-t-on alors ? Si on revient de la mˆeme mani`ere, quelle est la diff´erence
de dur´ee mise pour y atteindre le point d’arriv´ee B `a partir du point de d´epart A, par rapport `a
un v´ehicule qui les aurait reli´es en restant sur la route droite “Terre” ?
A B
Terre
Véhicule
R
d
t
t
t
1
2
1
Pendant la dur´ee de la pouss´ee, le v´ehicule parcourt un arc de cercle de longueur t
1
en unit´e
de temps ou vt
1
en unit´e d’espace, d’angle α = t
1
g (ce qui donne en radians αk = t
1
gv
−1
) et de
rayon (en unit´e d’espace) R = v
2
g
−1
.
On en d´eduit par une observation g´eom´etrique ´el´ementaire
d = 2R(1 −cos(kα)) +vt
2
sin(kα) = 2v
2
g
−1
(1 −cos(kt
1
g)) +vt
2
sin(
t
1
g
v
)
donc en utilisant la “formule magique” v
2
= k
−2
= −c
2
on obtient le r´esultat au probl`eme de
relativit´e
d = 2c
2
g
−1
(ch(
t
1
g
c
) −1) +ct
2
sh(
t
1
g
c
).
De mˆeme on calcule la diff´erence de longueur en mesure temporelle entre la courbe et la ligne
droite :
∆t = 4(t
1
−kRsin(kα)) + 2t
2
(1 −cos(kα)) = 4(t
1
−cg
−1
sh(
t
1
g
c
)) + 2t
2
(1 −ch(
t
1
g
c
))
qui est finalement une quantit´e n´egative, la ligne droite ´etant plus longue que la ligne courbe comme
on l’avait annonc´e.
Note. A partir d’ici il est possible de passer directement au chapitre suivant (m´ecanique classique).
3.5. Visions de la relativit´e de la simultan´eit´e `a une dimension
Dans les sections 3.5 et 3.6, nous allons ´etudier les propri´et´es de ce qu’on voit exp´erimentale-
ment, par la lumi`ere qui se propage dans le vide dans l’espace-temps de la relativit´e restreinte.
L’image du monde qu’un observateur situ´e en un point re¸coit alors en un instant, est donn´ee
par l’ensemble des photons qui lui parviennent. La ligne d’univers d’un photon est une droite de
l’espace-temps de direction isotrope (dans tout r´ef´erentiel galil´een, son vecteur vitesse est constant
de norme c).
20
Autrement dit, de son ´ev`enement O d’observation, il voit l’ensemble des points M tels que
−−→
MO est un vecteur futur de carr´e scalaire nul. Mais, sauf effet de perspective o` u la largeur de
l’observateur lui permet de reconstituer une information sur la profondeur, il ne per¸coit pas le point
M lui-mˆeme mais seulement la direction de droite (OM). On posera ici par convention c = 1.
Dans cette section 3.5, on se concentrera sur les visions exp´erimentales possibles de la g´eom´etrie
du plan pseudo-euclidien, soit une droite au cours du temps.
Un premier cas est celui o` u l’observateur se trouve sur la droite mˆeme o` u ont lieu les ph´eno-
m`enes observ´es. On passe des coordonn´ees (t, x) aux coordonn´ees de lumi`ere (t + x, t − x) dont
l’une donne la mesure de la date d’observation par un observateur immobile (x
0
= constante),
suivant l’ascisse x de l’´ev`enement observ´e (`a une constante additive pr`es ±x
0
; de toute fa¸con la
mesure du temps n’a de sens physique qu’`a une constante additive pr`es) : la premi`ere (t +x −x
0
)
si x > x
0
, la deuxi`eme (t −x +x
0
) si x < x
0
.
Nous avons vu que ce syst`eme de coordonn´ees (t + x, t − x) pr´esente l’immense avantage de
r´eduire les “rotations” du plan pseudo-euclidien, `a la multiplication de chaque coordonn´ee par une
valeur de l’effet Doppler, l’une inverse de l’autre : ces deux axes ´etant de directions invariantes,
une “rotation” s’obtient en ´etirant l’un et en contractant l’autre.
Que deviennent les vecteurs

t et x d’une base orthogonale de ce plan lors d’une telle rotation ?
Remarquons qu’il suffit de d´ecrire au premier ordre d’approximation l’effet d’une rotation de petit
angle α, car une rotation d’angle quelconque s’en d´eduit en r´ep´etant une rotation de petit angle
un grand nombre de fois. Dans l’´etude d´eform´ee de la g´eom´etrie euclidienne, cette rotation qui fait
avancer le vecteur

t d’environ αx fait avancer le vecteur x de −k
2
α

t. Donc en posant c = 1, cela
fait avancer le vecteur spatial x (directeur des droites d’instantan´eit´e), de α

t. C’est l’effet nomm´e
“relativit´e de la simultan´eit´e”. Nous savons que cette appellation ne doit pas nous abuser, car cette
notion de simultan´eit´e d´efinie par une ´equation de la forme t = constante dans un r´ef´erentiel, n’est
au fond rien qu’un ´enonc´e sur cette coordonn´ee t dont nous ne venons de voir qu’un rapport t´enu
`a l’exp´erience, celui d’ˆetre d´efini par la formule t =
1
2
((t + x) + (t − x)) `a partir des coordonn´ees
de lumi`ere t + x et t − x qui correspondent `a des mesures de temps de r´eceptions de photons par
des horloges consid´er´ees comme fixes. Cette coordonn´ee de “temps” est bien diff´erente des notions
physiques de temps, les temps que mesurent les horloges d’une part, l’ordre de causalit´e temporel
d´efini par le cˆone de lumi`ere d’autre part.
C’est de cette construction abstraite, artificielle, de la repr´esentation de la coordonn´ee t sous
forme du “temps” intuitif, que r´esulte ce ph´enom`ene a priori paradoxal de “relativit´e de la si-
multan´eit´e”. On peut alors se demander si cette repr´esentation est d´efinitivement inutilisable
comme aide `a la compr´ehension des ph´enom`enes. La r´eponse est non, `a condition de fonder
ses motivations exp´erimentales non sur des constructions artificielles mais en termes de ce que
l’exp´erience elle-mˆeme nous propose. Alors, la pertinence de l’intuition temporelle (que nous avons
jusqu’ici consid´er´ee comme nulle pour ne pas en abuser) sera, sans plus, celle qui r´esidera dans
cette exp´erience.
Nous avons donc besoin d’une situation exp´erimentale donnant `a un observateur de percevoir
naturellement des ´ev`enements se produisant sur un segment d’une droite spatiale D au cours du
temps (en fait on peut ´etendre automatiquement cette exp´erience `a la perception d’un morceau
de plan au cours du temps), suivant des sensations visio-temporelles conformes aux coordonn´ees
orthogonales d’espace-temps (t, x) que nous avons utilis´ees dans l’´etude geom´etrique.
Voici cette exp´erience. Les ´ev`enements `a observer se produisant en apparence sur un segment
de droite S ⊂ D et dans certaines limites de temps (donc th´eoriquement dans une certaine r´egion
d’un plan P pseudo-euclidien), soit un observateur O ´eloign´e de D dans une direction autre que
celle de D (par exemple perpendiculaire `a D mais pas n´ecessairement) `a une distance infiniment
grande par rapport `a la longueur de S. Autrement dit, posons S immobile par rapport `a O et
infiniment petit par rapport `a sa distance `a O (on peut dessiner le tout comme vu point de vue d’un
autre observateur immobile par rapport `a O, situ´e encore infiniment plus loin perpendiculairement
au plan contenant O et D).
On d´efinit alors le temps des ´ev`enements sur S sous forme du temps qu’indique l’horloge de
O lors de la perception en O des photons qu’ils ´emettent, et leur position par la direction visuelle
de ces photons (dont la variation est infiniment petite, autour d’une direction donn´ee). Ceci forme
21
un syst`eme de coordonn´ees affine de P.
La question est alors : `a quelle condition ce syst`eme de coordonn´ees d’espace-temps est-il
orthogonal pour la g´eom´etrie pseudo-euclidienne, avec des mesures de temps et d’espace conformes
`a ce que nous avons d´ecrit ? R´eponse : il est orthogonal si et seulement si l’observateur O voit les
points de S comme ´etant `a ´egale distance de lui, autrement dit, s’il voit le plan P comme ´etant `a
chaque instant une droite D perpendiculaire `a la direction de son regard (la direction allant de O
vers S; pour le dire th´eoriquement, le plan contenant la droite d’univers O et un rayon lumineux
vu est perpendiculaire `a P). Sa mesure d’espace est alors correcte. Ensuite, dans ce cas, l’unit´e
de mesure de temps sera correcte si et seulement si D est immobile par rapport `a O (c’est-`a-dire
que sa distance `a D est fixe au cours du temps, sans regarder les mouvements de coulissement de
la droite D sur elle-mˆeme; dit th´eoriquement, O est parall`ele `a P).
Remarquons que la position visuelle d’un point de D peut ´egalement se d´efinir par une gradu-
ation de D immobile par rapport `a O (chaque marque est th´eoriquement une droite de P parall`ele
`a O).
Nous allons maintenant rendre compte de la relativit´e de la simultan´eit´e quand on passe `a un
deuxi`eme observateur O

en mouvement par rapport `a O, dans la direction de D.
Pour cela, partons de la notion de simultan´eit´e dans S relative `a l’observateur O par rapport
auquel S est immobile et perpendiculaire `a la direction qui le relie `a O. La subtilit´e se trouve dans
la mani`ere suivant laquelle cette condition exp´erimentale se retrouve avec O

.
S
S’
1
O
O
O’
Soit S

un segment immobile par rapport `a O

, coulissant le long de D, et rencontrant S lorsque
les ´ev`enements s’y produisent. C’est ce segment S

qui doit ˆetre perpendiculaire `a sa direction `a
O

. Or, S

est parall`ele au mouvement, donc la direction de O

`a S

est `a chaque instant parall`ele
`a celle de O `a S. (En effet, si on imagine le syst`eme (O

, S

) comme ´etant une boˆıte rigide tr`es
allong´ee, elle est lanc´ee dans la direction orthogonale `a sa longueur, donc il n’y a pas de raison
qu’une de ses extr´emit´es devance l’autre, et sa direction reste fixe).
Pour que les conditions soient respect´ees, O

doit observer des ´ev`enements qui se produisent
sur S

. Mais S

doit recouvrir S quand ils se produisent; pendant ce temps, O

rencontre O. Mais
la lum`ere ne lui en parvient que plus tard, alors que O

est d´ej`a ´eloign´e de O. Les rayons lumineux
arrivant en O

de ces ´ev`enements, bien que de direction spatiale perpendiculaires `a D par rapport
`a O

, ne sont pas perpendiculaires `a D par rapport `a O. Cette perception pour O

correspond `a la
perception de tout observateur que O

rencontre alors, en particulier de O
1
immobile par rapport
`a O. La condition d’orthogonalit´e est fausse pour O
1
: les points en avant de S sont plus proches
de O
1
que ceux qui sont en arri`ere. Donc, pour des ´ev`enement simultan´es par rapport `a O qui se
produisent sur S, ceux qui sont en avant de S sont per¸cus par O

avant ceux qui sont en arri`ere.
Ce raisonnement redonne la relativit´e de la simultan´eit´e, et la forme de la rotation pseudo-
euclidienne en premi`ere approximation, que nous avons mentionn´ees.
3.6. Transformation relativiste d’une photographie en relief
Cas d’un espace-temps `a 2+1 dimensions (qui se g´en´eraliserait ais´ement `a 3+1 dimensions).
Nous n’allons pas ´etudier ici les rapports de toutes les observations possibles mais consid´erer
seulement la question suivante.
Soit l’image en relief (`a deux dimensions, une dimension angulaire et une dimension de pro-
fondeur) qu’un observateur per¸coit du monde en UN instant. C’est donc le cˆone de lumi`ere pass´ee
repr´esent´e sous forme projet´ee sur le plan t = 0 parall`element `a l’axe du temps. Soit un autre
observateur en mouvement par rapport au premier mais le rencontrant `a l’instant de l’observation.
En cet instant, il observe ´egalement le monde en relief en recevant les mˆemes rayons lumineux que
22
le premier (son cˆone de lumi`ere pass´ee est le mˆeme). Quelle est alors la loi de transformation qui
fait passer de ce que voit l’un `a ce que voit l’autre ?
Il s’agit d’une transformation du plan. L’origine O du plan y joue un rˆole privil´egi´e, puisque
c’est l’image du sommet du cˆone de lumi`ere. Voici quelques r´esultats:
Th´eor`eme 1. Une telle transformation envoie toute ellipse de foyer O en une autre ellipse de
foyer O ayant mˆeme mesure du petit axe; sa restriction `a toute ellipse de foyer O co¨ıncide avec une
transformation affine.
Th´eor`eme 2. Sa restriction `a toute demi-droite issue de O est lin´eaire.
Th´eor`eme 3. Quelles que soient deux ellipses de foyer O et de mˆeme mesure du petit axe, toute
restriction `a l’une d’une transformation affine qui l’envoie sur l’autre se prolonge de fa¸con unique
en une transformation possible produite par ce type d’exp´erience, pour un deuxi`eme observateur
de mouvement et de disposition convenables.
Tout cela se d´eduit ais´ement du fait qu’une ellipse de foyer O est l’image de l’intersection du
cˆone de lumi`ere avec un plan, et que la longueur du petit axe est li´ee au volume d´elimit´e entre le
cˆone et le plan, ou encore au carr´e scalaire du vecteur u = (a, b, c) qui d´efinit ce plan comme ´etant
celui d’´equation “(produit scalaire par u) = 1”, soit at −bx −cy = 1.
Le th´eor`eme 2 s’obtient soit directement, soit comme limite du th´eor`eme 1, et suffit `a construire
le prolongement unique ´evoqu´e au th´eor`eme 3.
On peut ajouter pour la mˆeme raison :
Th´eor`eme 4. La restriction d’une telle transformation `a toute parabole de foyer O, de mˆeme qu’`a
toute branche d’hyperbole de foyer O, co¨ıncide avec une transformation affine et O est toujours
foyer de l’image. (La condition sur le petit axe a un ´equivalent ici mais qui est moins facile `a
exprimer).
Attention : les deux branches d’une mˆeme hyperbole de foyer O se transforment en deux
branches d’hyperboles diff´erentes (on ne peut retrouver une correspondance qu’`a travers une
sym´etrie centrale. . . ). Les droites doivent ˆetre rang´ees parmi les branches d’hyperboles de foyer O
car elles sont ´echang´ees avec elles par ces transformations.
Autre explication : la preuve th´eorique ´etant d´ej`a faite ci-dessus, ajoutons une interpr´etation en
termes plus exp´erimentaux de ces faits. Comme ces transformations forment un groupe, il suffit
de les justifier au premier ordre d’approximation pour des vitesses faibles. Pour cela, voyons le
premier ordre d’approximation du r´esultat pr´ec´edent `a red´emontrer, concernant l’effet sur un cercle
C de centre O : son image sera une ellipse de foyer O et de faible excentricit´e, donc approxima-
tivement un cercle de mˆeme rayon mais de centre d´ecall´e par rapport `a O, et on passe de l’un
`a l’autre par translation. Pour justifier cela, consid´erons (en imaginant encore ´evidemment les
choses du point de vue d’un troisi`eme observateur immobile par rapport au premier et situ´e dans
la troisi`eme dimension, loin perpendiculairement au plan de la sc`ene) une figure C

d´efinie par les
deux propri´et´es suivantes: d’abord, C

co¨ıncidera avec C lorsqu’il ´emettra sa lumi`ere vers O, donc
c’est un cercle par rapport au premier observateur O (donc `a un instant pr´ecis pour O, qui pr´ec`ede
l’´ev`enement d’observation d’une dur´ee ´egale au rayon du cercle); ensuite, il est immobile par rap-
port au deuxi`eme observateur O

qui rejoindra le centre O de C lors de l’observation. Donc il n’en
est pas le centre, car il n’´etait pas au centre quand la lumi`ere a ´et´e ´emise. Fin de red´emonstration
(d’o` u r´esulte la forme d’ellipse de C

par propri´et´e de groupe, c’est-`a-dire d´eduite de la premi`ere
approximation en r´ep´etant celle-ci, d’amplitude infinit´esimale, un grand nombre de fois).
En reprenant les mˆemes notations, on remarque ensuite la contraction relativiste des longueurs :
cette ellipse C

que O

observe se contracte en un cercle (de diam`etre donn´e par le petit axe) en
passant au premier observateur. On parle de contraction des longueurs puisque cet ensemble
d’´ev`enements est synchronis´e par rapport `a O mais non par rapport `a O

: c’est l’ensemble des
´ev`enements d’´emissions des photons d’un objet fixe par rapport `a O

donc en mouvement par
rapport `a O, qui parviendront au centre `a un instant donn´e, venus `a la vitesse de la lumi`ere de
distances diff´erentes, interpr´et´es comme une observation abstraite instantan´ee par rapport `a O.
23
La sph`ere de vision dans l’espace-temps `a 3+1 dimension
Commen¸cons par motiver les choses g´eom´etriquement. Cette fois, en consid´erant l’image qu’on
re¸coit par la lumi`ere, nous allons oublier la profondeur et ne retenir que l’image qu’on a des choses
sur la sph`ere de vision. De toute fa¸con, la transformation de la profondeur se d´eduit de celle de
l’angle de vision d’un petit objet, puisque la largeur-image de cet objet (produit de la profondeur par
l’angle de vision) se conserve (en effet, il n’y a pas de contraction des longueurs perpendiculairement
au mouvement, ou on peut encore le voir en prenant une ellipse presque aplatie, de petit axe la
largeur-image de l’objet). On remarque que ce rapport des profondeurs, inverse du rapport des
angles de vision, co¨ıncide ´egalement avec le rapport des fr´equences des ondes re¸cues suivant l’effet
Doppler (li´e naturellement au rapport de perception du temps).
La question est alors : quelles sont donc les transformations de cette sph`ere par changement
de r´ef´erentiel ? La r´eponse sort en fait imm´ediatement de la remarque ci-dessus : la variation de
la profondeur est li´ee `a celle de la largeur angulaire (infinit´esimale). Donc la variation de largeur
angulaire ne d´epend pas de la direction de cette largeur, mais seulement du lieu o` u elle se trouve sur
la sph`ere de vision. Ceci montre que c’est une transformation conforme de la sph`ere (“conforme”
signifie: qui pr´eserve les angles: en effet, elle transforme dans la sph`ere de vision un petit disque
en petit disque donc aussi les angles comme secteurs d’un tel disque).
Pour une ´etude plus approfondie de ces transformations, voir le texte no3.ps de ce site. Ce
sont les transformations de Moebius de la sph`ere (celles qui transforment les cercles en cercles, et
qui par la projection st´er´eographique correspondent aux transformations homographiques du plan
complexe).
3.7. Introduction `a la th´eorie des spineurs
(Note: ce paragraphe est beaucoup moins corrig´e que les autres; `a long terme, il pourra ˆetre
chang´e ou d´eplac´e. Il est pour le moment inutile `a la suite: on peut passer au chapitre 4).
Comme nous l’avons signal´e, les tenseurs sont d’une importance capitale en physique th´eorique.
Pour aborder s´erieusement la physique math´ematique, il faudrait ´etudier d’abord en d´etails la
th´eorie du calcul tensoriel. Mais comme le pr´esent document ne cherche pas `a approfondir les no-
tions mais se contente de les survoler superficiellement, un aper¸cu rapide et superficiel des tenseurs
suffira.
A l’avenir peut-ˆetre ce chapitre sera compl´et´e, mais en fait ce n’est pas n´ecessaire car toutes
les id´ees de cette approche superficielle ici en vue, suffisantes pour la suite, se trouvent dans le
document pr´esent sur ce site : http://spoirier.lautre.net/tenseurs.dvi (extraits de messages des
newsgroups sur les tenseurs).
La th´eorie des spineurs est une th´eorie indispensable en physique des particules dans la d´efintion
des spins demi-entiers (´equation de Dirac de l’´electron par exemple). Nous supposerons ici connues
les notions usuelles d’alg`ebre lin´eaire.
Dans sa forme la plus g´en´erale, l’objet de la th´eorie des spineurs est le suivant: ´etant donn´e un
espace quadratique E (espace vectoriel r´eel ou complexe muni d’une forme bilin´eaire B sym´etrique
non d´eg´en´er´ee), on trouve un espace vectoriel S, dit espace spinoriel associ´e `a E, avec une
application lin´eaire L de E dans l’espace des endomorphismes de S, tels qu’on ait l’identit´e
L(x)L(y) +L(y)L(x) = −2B(x, y) Id (o` u Id est l’application identique sur S).
Nous n’allons pas ici tenter de r´esoudre ce probl`eme. Mentionnons simplement le fait qu’une
solution th´eorique g´en´erale (existence avec une certaine forme d’unicit´e) est connue, pouvant mˆeme
se construire relativement facilement, sauf que cela laisse un myst`ere : `a quoi peut donc bien ressem-
bler g´eom´etriquement la solution en fin de compte, “une fois effac´es les traits de construction” ?
Il se trouve que pour un E de petite dimension, on peut raisonnablement la comprendre.
En particulier, dans le cas qui int´eresse la physique, o` u E est l’espace-temps de la Relativit´e
restreinte, les structures g´eom´etriques de ce probl`eme r´ealisent en quelque sorte une reconstitution
de E `a partir de son cˆone de lumi`ere, autrement dit de ”ce qu’on voit” exp´erimentalement en un
point et `a un instant donn´es de l’epace-temps. Nous en verrons un aper¸cu. Malheureusement,
nous ne pourrons pas pr´esenter ainsi tous les aspects de la th´eorie, car la bonne pr´esentation de
certains aspects n´ecessiterait l’usage du calcul tensoriel (`a moins bien sˆ ur de simuler ce dernier par
d’obscures acrobaties).
24
Ce qui suit s’appuie sur les r´esultats des sections pr´ec´edentes sur les exp´eriences visuelles.
Spineurs d’un espace-temps `a 2+1 dimensions
Les transformations d´ecrites pr´ec´edemment de ce qu’on voit admettent une formulation ´el´e-
gante en termes de spineurs. Nous verrons cet outil appliqu´e d’abord au cas d’un espace `a 2
dimensions spatiales plus le temps.
La propri´et´e fondamentale du spin 1/2 est que quand l’espace physique fait un tour complet
sur lui-mˆeme, ce spin ne fait qu’un demi-tour. Le mod`ele de base de ce ph´enom`ene est celui d’une
variable complexe dont le carr´e s’identifierait `a un vecteur d’un plan de l’espace physique. Prenons
donc comme espace spinoriel S le plan ”racine carr´ee complexe” du plan d’observation ci-dessus,
ou image r´eciproque par l’op´eration de carr´e complexe. Quelle est donc l’image r´eciproque par
le carr´e complexe d’une ellipse de foyer O ? R´eponse : c’est une ellipse de centre O ! Et le type
de transformations d´ecrit pr´ec´edemment est l’image par le carr´e complexe des transformations
sp´eciales lin´eaires (lin´eaires de d´eterminant 1) de S (vu comme R-espace vectoriel de dimension 2).
La mesure du petit axe de l’ellipse de foyer O est proportionnelle `a l’aire de l’ellipse de centre
O correspondante, dont on sait qu’elle est pr´eserv´ee par les transformations sp´eciales lin´eaires.
Ainsi, un vecteur du genre temps, vecteur int´erieur au cˆone de lumi`ere future, et correspondant
`a un r´ef´erentiel, donne une ellipse de foyer O dans le plan de vision : c’est celle qui apparaˆıt sous
forme d’un cercle dans ce r´ef´erentiel. L’ellipse de centre O correspondante dans le plan spinoriel
donne une forme bilin´eaire sym´etrique d´efinie positive (qui est la structure euclidienne qui donnait
`a ce plan la structure de plan complexe utilis´ee plus haut).
Plus g´en´eralement, un vecteur spatio-temporel u = (t, x, y) s’identifie au tenseur sym´etrique
dans le plan spinoriel (´el´ement sym´etrique de S ⊗S) de matrice
_
t +x y
y t −x
_
De mani`ere ´equivalente, on peut dire que la forme lin´eaire associ´ee `a u, produit scalaire par u
d’un vecteur v = (t

, x

, y

), u.v = tt

−xx

−yy

) s’identifie `a la forme bilin´eaire sym´etrique dans
le plan spinoriel, de matrice
A =
_
t −x −y
−y t +x
_
(Elle ´equivaut `a la donn´ee de la solution L du probl`eme des spineurs ´evoqu´e au d´ebut, en ´etant
l’application qui `a (v,w) associe det(v, L(u)(w))) (On retrouve ainsi le fait que t +x et t −x sont
plus fondamentaux que t et x !) Une transformation sp´eciale lin´eaire de matrice P envoie cette
forme bilin´eaire sur celle de matrice
t
PAP.
C’est l’expression de la rotation spatio-temporelle (transformation de Lorentz combin´ee avec
des rotations spatiales) la plus g´en´erale avec deux dimensions spatiales !
On v´erifie : det A = t
2
−x
2
−y
2
(invariant relativiste, carr´e scalaire du vecteur (t, x, y)).
Donc la forme bilin´eaire est d´eg´en´er´ee si elle appartient au cˆone de lumi`ere; elle est dans le cˆone
de lumi`ere future si elle est positive. L’application du plan spinoriel dans le cˆone de lumi`ere, qu’on
a ´evoqu´e pr´ec´edemment en disant que c’est le carr´e complexe, est finalement le carr´e tensoriel. De
mani`ere ´equivalente, `a un spineur s correspond la forme bilin´eaire sym´etrique correspondant au
carr´e tensoriel de s, d´efinie par s
2
(v, w) = det(s, v) det(s, w) =
t
vBw o` u
t
s = (a, b) et
B =
_
b
2
−ab
−ab a
2
_
(ou son oppos´e si on veut un vecteur du cˆone de lumi`ere pass´ee). On v´erifie que
t
sAs est le 2 fois
le produit scalaire des vecteurs d´efinis par A et B (o` u (t, x, y).(t

, x

, y

) = tt

−xx

−yy

)
Spineurs de l’espace-temps `a 3+1 dimensions
D’apr`es ce qu’on a d´ecrit, les transformations de la sph`ere de vision sont les transformations
d’un espace projectif de dimension 1 complexe. L’espace vectoriel de dimension 2 complexe auquel
il est associ´e sera notre espace spinoriel S.
25
Un vecteur v = (t, x, y, z) ´equivalent `a la donn´ee de la forme lin´eaire (produit scalaire par v),
de composantes (t, −x, −y, −z), se d´efinit alors comme ´etant l’espace des ´el´ements hermitiens de
¯
S ⊗S (produit tensoriel sur le corps C de l’espace conjugu´e de S par S), ou si on parle en termes
duaux, celui des formes sesquilin´eaires hermitiennes sur S, de matrice
A =
_
t −x −y −iz
−y +iz t +x
_
(Contrairement au cas pr´ec´edent, l’espace S mentionn´e ici n’est pas la solution du probl`eme
spinoriel dans lequel on d´efinit L, qui serait plus compliqu´ee) On v´erifie : det A = t
2
−x
2
−y
2
−z
2
.
La rotation spatio-temporelle la plus g´en´erale est donc de la forme
t
¯
PAP o` u P est dans SL(2, C).
A quelques acrobaties pr`es, cela redonne dans le cas purement spatial (t = 0) la pr´esentation
quaternionique des rotations. L’application de l’espace spinoriel dans le cˆone de lumi`ere s’exprime
par : ¯ s ⊗s(¯ v, w) = det(s, v) det(s, w) =
t
vBw o` u
t
s = (a, b) et
B =
_
¯
bb −
¯
ba
−¯ ab ¯ aa
_
On remarque que dans ce passage de s `a B ce n’est pas seulement le signe qui est perdu mais
tout l’argument : multiplier s par un nombre complexe de module 1 ne modifie pas le r´esultat.
On voudrait donc donner un sens `a cet argument. Ce n’est pas possible dans l’absolu, puisqu’une
homoth´etie de S de rapport un nombre complexe de module 1 ne change rien. Mais il est possible de
comparer les arguments de plusieurs vecteurs. Pour mieux voir ce qui se passe, fabriquons de toutes
pi`eces une r´ef´erence : c’est l’argument du d´eterminant de deux vecteurs dans S (qui n’intervenait
pas ci-dessus puisqu’on avait le produit d’un d´eterminant et du conjugu´e d’un autre). Soit donc
un spineur s. On cherche une image visuelle de son argument. Pour cela, prenons un vecteur s

tel que det(s, s

) = 1 : ceci le d´efinit modulo l’addition avec un multiple complexe de s. Pour le
moment, cela semble ne rien apporter puisque s

peut avoir n’importe quelle direction dans S, mais
l’information int´eressante est la variation de s +λs

pour un nombre r´eel λ positif au voisinage de
λ = 0. Prenons par exemple s = (1, 0) et s

= (a, 1). On a alors B(s + λs

) = B(1 + λa, λ) et en
n´egligeant les termes en λ
2
:
_
0 −λ
−λ 1 +λ(a + ¯ a)
_
soit 2t = 2x = 1 + λ(a + ¯ a), y = λ, z = 0. Comme on veut retenir l’information ind´ependante
de a, c’est que le vecteur de lumi`ere qui est parti de t = x =
1
2
peut s’allonger ou se raccourcir
comme il veut mais il avance de mani`ere d´etermin´ee dans la direction de y. Finalement, pour s
fix´e, l’application qui `a s

associe det(s, s

) signifie une application du plan tangent `a la sph`ere que
forme le cˆone de lumi`ere future, en l’image de s, dans C, conservant la structure euclidienne (elle
renverse l’orientation si on oriente cette sph`ere “de l’ext´erieur”, par le vecteur sortant, ou encore
si on prend la sph`ere de vision d´efinie par le cˆone de lumi`ere pass´ee). Une mesure du module du
r´esultat signifie qu’une fl`eche (direction et sens) est marqu´ee sur la sph`ere de vision, en l’image de
s. Lorsque s tourne d’un angle h, donc est multipli´e par un complexe u = e
ih
, cette fl`eche tourne
de 2h. en effet, s

doit tourner de −h pour que det(s, s

) reste ´egal `a un. Puis, le nouveau s + ls

vaut us + λus

= u(s + λu
2
s

) dont l’image physique a bien tourn´e de 2h. Cela manifeste encore
une fois le ph´enom`ene de spin demi-entier : quand on le tourne d’un angle, son image dans l’espace
physique tourne d’un angle double.
Pour finir, donnons la repr´esentation spinorielle du champ ´electromagn´etique en un point.
D’abord, quelle est donc la forme d’un tel champ en un point ? C’est une forme bilin´eaire anti-
sym´etrique de l’espace vectoriel associ´e (tangent) `a l’espace-temps, de matrice (o` u les coordonn´ees
sont ´ecrites dans l’ordre (t, x, y, z) :
_
_
_
0 E
x
E
y
E
z
−E
x
0 −B
z
B
y
−E
y
B
z
0 −B
x
−E
z
−B
y
Bx 0
_
_
_
26
Comme n’importe quelle forme bilin´eraire antisym´etrique (comme par exemple le moment
cin´etique), elle se repr´esente dans l’espace spinoriel par une forme bilin´eaire sym´etrique : soit
M = E + iB (donc de composantes M
x
= E
x
+ iB
x
, etc), vecteur de l’espace quadratique C
3
de
base orthonorm´ee, qui s’incarne par la forme bilin´eaire sym´etrique de matrice
_
−My +iMz Mx
Mx My +iMz
_
La transformation du champ ´electromagn´etique par changement de r´ef´erentiel (ou rotation spatio-
temporelle) en r´esulte, par l’action naturelle des transformations sp´ecial lin´eaires de l’espace
spinoriel sur l’espace de ses formes bilin´eaires (A →
t
PAP). On retrouve l’invariant relativiste
du champ par le carr´e scalaire M
2
= E
2
−B
2
+ 2i(E.B) aussi ´egal `a l’oppos´e du d´eterminant de
la matrice.
27
4. M´ecanique classique
4.1. Introduction `a la g´eom´etrie diff´erentielle
Pour aborder la m´ecanique nous aurons besoin de notions de g´eom´etrie diff´erentielle. Nous
avons introduit la g´eom´etrie affine qui est une g´eom´etrie plus souple que la g´eom´etrie euclidienne
(avec plus de transformations et moins de structures). De mˆeme la g´eom´etrie diff´erentielle est plus
souple que la g´eom´etrie affine. Il n’y a plus de notion de droite, mais il reste la notion de courbe.
Nous allons d’abord introduire les principales notions de g´eom´etrie diff´erentielle dans le cadre
de la g´eom´etrie affine, puis nous nous affranchirons de ce cadre pour retenir ces notions en elles-
mˆemes. Nous ne chercherons pas `a donner de cela une d´efinition rigoureuse axiomatiquement mais
l’accent sera mis sur les id´ees et notions de base qui sont utilis´ees en pratique.
On connaˆıt la notion de d´eriv´ee d’une application de l’ensemble des nombres r´eels dans lui-
mˆeme, ou plus g´en´eralement, la d´eriv´ee d’une application d’une droite affine dans une autre;
la valeur d’une telle d´eriv´ee en un point est homog`ene au rapport d’une quantit´e associ´ee `a la
deuxi`eme droite (appartenant `a la droite vectorielle qui lui correspond, ensemble des diff´erences de
deux ´el´ements) sur une quantit´e associ´ee `a la premi`ere. Pour fixer les id´ees, disons qu’on travaillera
avec les applications d´erivables et dont la d´eriv´ee est continue, mais d’autres choix seraient possibles
(de pr´ef´erence une condition de r´egularit´e plus forte). Pour simplifier, les applications appartenant
`a la classe de r´egularit´e consid´er´ee (celle-l`a ou une autre) seront qualifi´ees de lisses.
G´en´eralisons cela aux deux cas suivants.
– Le cas d’une courbe param´etr´ee, application lisse d’une droite affine D dans un espace affine
E. Sa diff´erentielle est une application de D dans l’espace des vecteurs de E divis´es par les quantit´es
associ´ees `a D. Si on se repr´esente D comme ´etant la droite du temps, cette courbe param´etr´ee se
voit comme ´etant le mouvement d’un point, et sa diff´erentielle est la donn´ee du vecteur vitesse de
ce point en chaque instant.
– Le cas d’un champ scalaire, application lisse d’un espace E dans une droite D

. (Le nom
de “scalaire” s’emploie aussi comme synonyme de “quantit´e”, d´esignant un ´el´ement d’une droite
vectorielle ou affine, trait´e comme un nombre, par opposition au cas d’´el´ements d’espaces vectoriels
de dimension plus grande.) Sa diff´erentielle en un point est une forme lin´eaire sur l’espace des
vecteurs de E multipli´ee par une quantit´e de D

. Et sa diff´erentielle (tout court) est l’application
qui `a tout point de E associe la diff´erentielle en ce point.
En rassemblant ces deux notions, on peut dire que quand un point se d´eplace dans un espace
muni d’un champ scalaire, la d´eriv´ee par rapport au temps de la valeur du champ rencontr´e `a chaque
instant est le r´esultat de la diff´erentielle du champ en la position courante du point, appliqu´ee `a son
vecteur vitesse. Par abus de convention on sous-entendra parfois dans la notion d’appartenance
d’un vecteur `a un espace vectoriel, le fait que ce peut ˆetre en r´ealit´e le produit d’un ´el´ement de cet
espace vectoriel par une quantit´e.
Introduisons maintenant les espaces de la g´eom´etrie diff´erentielle, qu’on appelle des vari´et´es.
Intuitivement, une vari´et´e de dimension n est un espace qui est approximativement un espace
affine de dimension n au voisinage infinit´esimal de chacun de ses points. Par exemple, on a les
sous-vari´et´es d’un espace affine (c’est-`a-dire des parties de cet espace qui sont des vari´et´es): les
surfaces dans l’espace usuel sont les sous-vari´et´es de dimension 2. Dans un espace affine E de
dimension n muni d’un champ scalaire f, l’ensemble S d’´equation f = 0 est une sous-vari´et´e de
dimension n −1 `a condition que la diff´erentielle de f ne soit en aucun point de S ´egale `a la forme
lin´eaire nulle sur l’espace des vecteurs de E. Un th´eor`eme dit que toute vari´et´e de dimension n est
repr´esentable comme sous-vari´et´e d’un espace affine de dimension 2n+1 (ou toute dimension plus
grande mais pas toujours moindre).
A chaque point x d’une vari´et´e S de dimension n est associ´e de mani`ere continue un espace
vectoriel T
x
S de dimension n appel´e l’espace tangent de la vari´et´e en ce point. Dans le cas d’une
sous-vari´et´e d’un espace affine, on imagine facilement l’espace tangent en chaque point comme ´etant
l’espace tangent en ce point qu’on connaˆıt comme sous-espace affine de l’espace de d´epart, avec le
point de tangence pris comme origine pour en faire un espace vectoriel. C’est d’ailleurs ainsi qu’on
peut d´efinir la notion de sous-vari´et´e de dimension n d’un espace affine: une sous-vari´et´e est une
28
partie qui en chaque point admet un espace tangent, c’est-`a-dire un sous-espace affine approximant
la partie pr`es du point.
Mais dans le cas g´en´eral d’une vari´et´e, les espaces tangents se d´efinissent abstraitement, sans
ˆetre vus comme inclus dans un mˆeme espace affine. C’est ainsi une notion ind´ependante de la
mani`ere dont on repr´esente la vari´et´e comme sous-vari´et´e d’un espace affine.
Les notions de diff´erentielle qu’on a vues pour un espace affine se g´en´eralisent au cas d’une
vari´et´e de la mani`ere suivante, en s’aidant de repr´esentations comme sous-vari´et´es d’un espace
affine. Finalement, dans le cas contraire d’une vari´et´e abstraite, ces op´erations tiennent lieu de
d´efinition des espaces tangents.
Une courbe param´etr´ee d’une sous-vari´et´e S de E est une courbe param´etr´ee de E qui est inclue
dans S, autrement dit qui est une application c de D dans S. Sa diff´erentielle en tout point t ∈ D
(sa vitesse `a tout instant) est un vecteur appartenant `a T
c(t)
S (divis´e par une quantit´e de temps).
Un champ scalaire sur S est la restriction `a S d’un champ scalaire de E. Sa diff´erentielle en chaque
x ∈ S est une forme lin´eaire sur T
x
S (restriction `a l’espace tangent de la diff´erentielle du champ
de E auquel il correspond).
Par exemple, en choisissant un rep`ere de E, chaque coordonn´ee ´etant un champ scalaire sur
E donne un champ scalaire sur S. La donn´ee de ces champs scalaires sur S ´equivaut `a la donn´ee
de cette repr´esentation de S comme sous-vari´et´e de E. Une mani`ere facile de construire d’autres
repr´esentations de S comme sous-vari´et´e d’espaces affines consiste `a prendre une repr´esentation
donn´ee, donc une liste de champs scalaires modulo un choix de rep`ere, et `a ajouter `a cette liste un
ou plusieurs autres champs. Ou autrement dit, consid´erer le graphe de cet autre champ scalaire sur
une sous-vari´et´e comme une autre repr´esentation de cette vari´et´e. Ceci donne une repr´esentation
dans un espace affine ayant une dimension de plus que celle de d´epart.
4.2. Notion d’´equilibre
Introduisons une grandeur physique (autrement dit une droite vectorielle) appel´ee ´energie (ses
´el´ements sont les quantit´es d’´energie).
Equilibre d’un point
Consid´erons un point mat´eriel libre de se d´eplacer dans une vari´et´e E et soumis `a des forces
dues `a des causes ext´erieures fixes. Par exemple, E peut ˆetre une surface sur laquelle une bille
est libre de rouler, soumise `a la pesanteur et au champ magn´etique d’un aimant fixe cach´e sous
la surface. Ici, on ne s’int´eressera pas au mouvement de rotation de la bille sur elle-mˆeme, qui
pourrait aussi bien glisser, mais seulement au d´eplacement de son centre, r´eduisant l’id´ee de la
bille `a un point. Et plus pr´ecis´ement, on ´etudiera la condition pour qu’elle soit `a l’´equilibre.
Chaque force s’exprime sous la forme d’un champ scalaire V , appel´e le potentiel et `a valeurs
dans la droite des ´energies (ou une droite affine correspondant, ceci pour exprimer que “le potentiel
n’est d´efini qu’`a une constante additive pr`es”).
L’effet global d’un syst`eme de forces donn´ees par des potentiels est identique `a celui d’une
seule force dont le potentiel est ´egal `a la somme des potentiels des diff´erentes forces.
Il y a deux notions d’´equilibre qu’on peut consid´erer.
Equilibre stable. Dans une vari´et´e E munie d’une force de potentiel V , un point d’´equilibre
stable est un minimum local de V .
En effet, une particule en mouvement ne peut pas passer par des lieux o` u l’´energie potentielle
est sup´erieure `a l’´energie qu’elle poss´edait au d´epart. Donc en partant du voisinage d’un minimum
de potentiel sans autre ´energie elle ne peut pas en sortir.
On remarque qu’`a moins de se trouver sur un bord de la vari´et´e, en un minimum local la
diff´erentielle s’annule. Plus g´en´eralement:
Equilibre. Un point d’´equilibre de E muni d’une force de potentiel V est un point o` u la diff´eren-
tielle de V est nulle. Un point d’´equilibre instable est un point d’´equilibre qui n’est pas stable.
La justification n´ecessiterait ici que le potentiel soit diff´erentiable deux fois, car pour que la
variation soit trop faible pour fournir `a la particule qui commencerait infinit´esimalement `a s’´ecarter
de cette position l’´energie n´ecessaire pour achever de s’´eloigner nettement en un temps limit´e, il
29
est quasiment n´ecessaire (et suffisant) que cette variation ne d´epasse pas en ordre de grandeur le
carr´e de la distance.
Par exemple, pour un point sur un relief soumis `a la pesanteur, le fond d’un creux est une
position d’´equilibre stable, tandis qu’un sommet et un col sont des positions d”´equilibre instable.
Dans le cas o` u plusieurs forces s’exercent, la condition d’´equilibre en un point est l’annulation
de la diff´erentielle de la somme des potentiels, qui est ´egale `a la somme des diff´erentielles des
potentiels au mˆeme point.
Force. Dans une vari´et´e E o` u r´eside une force de potentiel V , la force qui s’exerce sur une particule
situ´ee en un point donn´e de E se d´efinit comme ´etant moins la diff´erentielle de V en ce point. La
condition d’´equilibre d’une particule en un point soumise `a plusieurs forces est que la somme de
ces forces soit nulle.
Equilibre d’un syst`eme
On imagine un syst`eme comme ´etant un assemblage de mat´eriaux d´eformables pouvant ˆetre
soumis `a des forces ext´erieures, qu’on peut imaginer comme ´etant des champs ou l’effet de contacts
avec d’autres mat´eriaux d´eformables li´es `a des supports fixes. (En fait, il se trouve qu’en physique
fondamentale, les champs se comprennent comme des d´eformations de sortes de milieux ´elastiques
dans l’espace-temps qui interagissent par contact avec la mati`ere).
Espace de configuration. On appelle espace de configuration d’un syst`eme l’ensemble des ma-
ni`eres dont il pourrait ˆetre dispos´e dans l’espace (appel´ees ´etats), sans tenir compte de la question
de son ´equilibre.
C’est souvent une vari´et´e de dimension infinie. Chaque ´etat serait en principe r´ealisable, soit
en tant que clich´e `a un instant donn´e d’un syst`eme en mouvement, soit en ajoutant au syst`eme
d’autres forces ext´erieures ajust´ees en sorte d’annuler exactement les forces pr´esentes.
Cette notion permet de ramener la notion d’´equilibre d’un syst`eme `a celle de l’´equilibre d’un
point que nous avons introduite, `a savoir un point qui se d´eplace dans l’espace de configuration.
Les forces s’expriment par des potentiels d´efinis sur l’espace de configuration, `a savoir la mesure de
l’´energie pr´esente pour chaque ´etat du syst`eme, et se r´epartissent en deux esp`eces: les forces internes
d’une part, les forces ext´erieures d’autre part (dont l’´energie r´eside `a l’ext´erieur du syst`eme).
4.3. Bilans des forces ext´erieures
Nous allons voir maintenant comment on peut faire un bilan des forces ext´erieures qui exprime
une condition n´ecessaire d’´equilibre en oubliant les forces internes. L’espace tangent en un point
de l’espace de configuration repr´esente l’ensemble des petites modifications ou vitesses d’´evolution,
de l’´etat du syst`eme `a partir d’un ´etat donn´e. Les forces sont des formes lin´eaires sur cet espace,
et la condition d’´equilibre est que leur somme soit nulle. Une condition n´ecessaire d’´equilibre est
que la somme de leurs restrictions `a un sous-espace donn´e soit nulle. Les forces int´erieures peuvent
alors ˆetre oubli´ees si on sait que leurs restrictions `a ce sous-espace sont toujours nulles.
Or, on connaˆıt des types d’´evolutions d’un syst`eme suivant lesquels les forces internes ne
peuvent pas agir, c’est-`a-dire que leur potentiel y demeure constant: ce sont les mouvements qui
ne d´eforment pas le syst`eme (et n’affectent pas son ´etat interne) parce qu’ils sont d´efinis par un
d´eplacement g´eom´etrique de l’espace physique (translation ou rotation), comme celui d’un solide
ind´eformable. Formalisons cela.
Soit G le groupe des d´eplacements de l’espace physique, ou encore une de ses sous-vari´et´es
contenant l’´el´ement neutre Id (l’identit´e, le d´eplacement qui ne d´eplace rien). C’est une vari´et´e.
Fixons un ´etat x de l’espace de configuration E. Soit alors l’application diff´erentiable de G dans E
qui `a tout d´eplacement associe l’´etat obtenu en appliquant ce d´eplacement `a x. En la composant
avec un champ de potentiel V sur E, on obtient un champ de potentiel V
G
d´efini sur G. La
diff´erentielle en Id de cette application de G dans E est une application lin´eaire de L = T
Id
G vers
T
x
E. On dit que L est l’alg`ebre de Lie de G si G est un groupe. La compos´ee de cette application
lin´eaire par la force (comme forme lin´eaire en x) co¨ıncide avec la force de potentiel V
G
en Id.
Ainsi, on pose alors comme condition n´ecessaire d’´equilibre, l’´equilibre de Id dans G soumis
aux forces de potentiels V
G
.
30
L’argument plus haut se traduit par le fait que le potentiel sur G correspondant `a toute force
interne est une constante, et donc sa diff´erentielle en Id est nulle.
Torseur d’une force. Le torseur d’une force ext´erieure appliqu´ee `a un syst`eme dans un ´etat
donn´e, est la forme lin´eaire sur l’alg`ebre de Lie du groupe G des d´eplacements g´eom´etriques de
l’espace physique, construite comme force de potentiel V
G
en Id (oppos´ee de la diff´erentielle de V
G
)
d´efini ci-dessus.
Ainsi, la condition n´ecessaire d’´equilibre du bilan des forces ext´erieures est que la somme des
torseurs de ces forces soit nulle.
On peut g´en´eraliser cette notion au cas du torseur d’un lien rigide, qui consiste `a interdire tout
mouvement `a une partie du syst`eme (un bord, un point, un axe. . . ) qu’on appellera le support
de ce lien. Le probl`eme est que les d´eplacements qui permettaient de calculer le torseur sont ici
interdits, et que cette force ne s’exprime pas par un potentiel. Alors, on peut quand mˆeme la
calculer d’apr`es les forces internes, `a deux conditions. D’abord, que le syst`eme soit `a l’´equilibre.
Ensuite, qu’au voisinage du support il n’y ait pas d’autres liens rigides qui contraignent le syst`eme,
et que les autres forces ext´erieures qui s’y exercent soient n´egligeables. En effet, l’´equilibre implique
que la force du lien est ´equilibr´ee par les forces internes voisines, `a condition qu’elle ne soit pas
directement compens´ee par d’autres forces ext´erieures qui ne passeraient pas par l’int´erieur du
syst`eme.
Voyons donc comment reconstituer le torseur de la force du lien rigide sur le syst`eme, en sup-
posant connue l’´energie interne du syst`eme en toute circonstance, et appliquons cette connaissance
au cas o` u le support du lien subirait un d´eplacement, contrairement `a ce qui ´etait suppos´e au d´epart.
Remarquons que cette connaissance est en fait comprise dans celle des effets de mouvements con-
formes `a l’hypoth`ese, puisqu’il s’agit de l’´energie interne qui est invariante par d´eplacements, et
donc l’effet d’un d´eplacement du support seul avec son voisinage ´equivaut au d´eplacement inverse
du reste du syst`eme par rapport `a ce support.
Regardons donc la variation d’´energie interne du syst`eme lorsque seul le voisinage imm´ediat
du support suit ce mouvement, r´ealisant une transition lisse avec les parties plus ´eloign´ees (celles
soumises aux autres forces ext´erieures) qui ne suivent pas. Le torseur force du lien rigide sur le
syst`eme, donc, se d´eduit des variations d’´energie interne du voisinage r´esultant d’un d´eplacement
du support, par le fait que le support doit se trouver dans sa position d’´equilibre entre la force
ext´erieure donn´ee par le lien et la force int´erieure du voisinage du lien dans le syst`eme: la somme
de ces deux torseurs de forces ´etant nulle (appliqu´ees au support), elles doivent ˆetre oppos´ees.
Remarquons qu’apparaˆıt ainsi le principe d’action-r´eaction entre deux objets distants inter-
agissant par l’interm´ediaire d’un syst`eme (pouvant ˆetre un milieu ´elastique ou un champ), ces
objets ´etant vus comme deux parties du syst`eme: cette interaction s’exprime par la mˆeme ´energie
interne qui d´epend des mouvements de ces deux objets l’un par rapport `a l’autre. Le torseur force
que A exerce sur B se lit `a la variation d’´energie quand B se d´eplace par rapport `a A, et celui de
la force que B exerce sur A se lit `a celle quand A se d´eplace par rapport `a B. La somme des deux
est nulle, l’´energie interne ne variant pas quand le mˆeme d´eplacement s’exerce sur le tout.
On a aussi:
Th´eor`eme. Dans un syst`eme `a l’´equilibre, Le torseur des forces traversant une hypersurface S
(surface de dimension n −1 dans un espace de dimension n) ne d´epend que du bord de S.
En effet, soient deux surfaces disjointes ayant le mˆeme bord. V´erifions que le torseur des
forces les traversant sont ´egaux (le cas de deux surfaces non disjointes s’en d´eduit en prenant
une succession de surfaces de mˆeme bord o` u deux surfaces successives sont disjointes). Ces deux
surfaces enferment un volume, et on peut alors faire le bilan des forces entrant dans ce volume.
Le torseur des forces entrant dans ce volume vaut celui des forces entrant par la premi`ere surface,
moins celui des forces sortant par la deuxi`eme. Le r´esultat vaut z´ero puisqu’il y a ´equilibre, donc
les forces traversant les deux surfaces sont ´egales. En toute rigueur, pour que ces notions aient un
sens il faudrait que le voisinage de ce bord soit vide afin de pouvoir consid´erer la d´eformation de la
partie int´erieure quand on d´eplace les deux surfaces l’une par rapport `a l’autre, mais on admettra
que les r´esultats sont bien d´efinis `a la limite quand on fait tendre vers z´ero l’´epaisseur de ce vide.
31
Remarque. La mesure de cette force traversant une hypersurface, qui se d´eduit des variations
d’´energie interne de la partie du syst`eme contenu dans un volume dont cette hypersurface est une
partie du bord, quand on la d´eplace par rapport au reste du bord, ne se retrouve pas inscrite dans
le potentiel sur l’espace de configuration du plus grand syst`eme non bord´e par elle. En effet, pour
l’y retrouver il faudrait d´eplacer les deux surfaces l’une par rapport `a l’autre du point de vue de
l’espace du volume int´erieur (pour d´eformer ce volume) sans affecter leurs dispositions du point
de vue de l’espace ext´erieur, ce qui n’est possible qu’en th´eorie de la relativit´e g´en´erale. Ce qui
explique d’ailleurs pourquoi c’est la relativit´e g´en´erale qui exprime un champ (le champ de gravit´e)
comme naturellement induit par la disposition de la somme des forces mat´erielles elles-mˆemes.
Abordons maintenant les d´etails de la forme du torseur force. Comme le groupe des rotations
est compliqu´e, on d´ecompose en pratique le torseur d’une force en les deux notions suvantes,
restrictions de cette forme lin´eaire `a deux sous-espaces vectoriels de L qui sont suppl´ementaires:
R´esultante d’une force. La r´esulante d’une force ext´erieure appliqu´ee `a un syst`eme est la
forme lin´eaire sur l’espace des vecteurs de l’espace physique construite de la mˆeme mani`ere par
l’identification naturelle de cet espace vectoriel `a l’alg`ebre de Lie du groupe des translations (espace
des vitesses de translation).
Pour le dire intuitivement, ceci assemble par translation dans le mˆeme espace vectoriel des
vecteurs de l’espace physique, les forces exerc´ees en tous points du syst`eme pour en faire le bilan.
Moment d’une force par rapport `a un point. Mˆeme construction appliqu´ee au groupe des
rotations autour de ce point (les d´eplacements qui laissent fixe ce point).
En effet, une vitesse de d´eplacement solide quelconque se d´ecompose de mani`ere unique comme
somme de la vitesse de translation ´egale `a la vitesse d’un point par ce d´eplacement, et de la vitesse
de rotation autour de ce point d´efinie par la partie lin´eaire de ce mouvement.
Ces constructions semblent faire uniquement apparaˆıtre les forces comme des formes lin´eaires,
`a l’encontre de l’usage courant de repr´esenter les forces par des vecteurs. Bien sˆ ur, les notions de
vecteur et de forme lin´eaire se correspondent rigoureusement par le produit scalaire. Ce qui les
distingue c’est intuitivement la direction qu’ils d´esignent, orthogonale l’une `a l’autre: dans l’espace
euclidien de dimension 3, un vecteur d´esigne une direction de droite tandis que la forme lin´eaire
correspondante d´esigne celle de son plan orthogonal. En m´ecanique classique, le vecteur force
apparaˆıt sous la forme exp´erimentale de l’acc´el´eration d’une particule soumise `a cette force.
La question qui se pose alors est: la direction d’un vecteur force joue-t-elle g´eom´etriquement
un rˆole dans la notion d’´equilibre ? La r´eponse est oui: il se trouve que dans la forme g´eom´etrique
des torseurs par rapport `a l’espace physique, la direction importante est celle du vecteur de la
r´esultante et non de la forme lin´eaire. Cela ne doit pas nous ´etonner, puisque la notion de torseur
est fond´ee sur le groupe des d´eplacements, qui repr´esente la g´eom´etrie euclidienne de l’espace.
Nous allons maintenant ´etudier en particulier la g´eom´etrie des torseurs et leur ´equilibre dans
le cas du plan, qui est la plus petite dimension o` u cette notion apparaˆıt. Nous ne l’´etudierons
pas en dimension 3 comme voudrait l’usage, puisque ces efforts suppl´ementaires dans cet autre cas
particulier plus compliqu´e cacheraient le fait que c’est finalement une notion g´en´erale qui serait
traitable plus simplement en tant que telle `a condition d’introduire au pr´ealable le calcul tensoriel,
ce que nous ne ferons pas dans l’imm´ediat.
4.4. G´eom´etrie des forces dans le plan
D´ecrivons d’abord la forme des torseurs dans le plan.
Un torseur peut se repr´esenter sous forme du champ des moments, application qui `a tout point
du plan associe le moment du torseur par rapport `a ce point. C’est-`a-dire qu’on restreint le torseur
en tant que forme lin´eaire sur l’alg`ebre de Lie du groupe des d´eplacements, `a l’alg`ebre de Lie du
groupe des rotations autour de chaque point. Ce faisant, on ne perd aucune information, et ceci est
valable en g´en´eral au-del`a du plan en toute dimension, car les vitesses de d´eplacements quelconques
s’obtiennent en ajoutant des vitesses de rotations: d’abord comme on a dit, une rotation avec une
translation, puis une translation s’obtient en ajoutant deux vitesses de rotations de parties lin´eaires
oppos´ees mais de centres diff´erents.
32
Dans le plan, le moment en un point est simplement un scalaire, parce que le groupe des
rotations autour d’un point est de dimension 1. Ces rotations se mesurent par leur vitesse angulaire,
`a condition de choisir une orientation du plan (un sens de rotation). Donc, le champ des moments
d’un torseur est l’application qui `a tout point associe la puissance fournie par la force lors de la
rotation de centre ce point `a la vitesse angulaire d’un radian par unit´e de temps (le r´esultat est
homog`ene `a une ´energie).
Quelle est alors la forme du champ des moments d’un torseur ?
Torseurs du plan. Une orientation du plan ´etant choisie, l’alg`ebre de Lie des d´eplacements
du plan s’identifie `a l’espace des points pond´er´es du plan; le torseur d’une force dans le plan se
repr´esente par une forme affine (application affine du plan dans une droite vectorielle, ici l’ensemble
des quantit´es d’´energie), dont la partie lin´eaire est la r´esultante tourn´ee d’un angle droit dans le
sens direct.
Ces deux ´enonc´es sont ´equivalents, puisque l’espace des formes affines et celui des points
pond´er´es sont le dual l’un de l’autre.
On pourrait d´emontrer cela abstraitement, mais pour donner un aper¸cu plus concret de la
situation nous allons la regarder sur l’exemple fondamental d’une force exerc´ee en un point. Soit
donc une force donn´ee par une forme lin´eaire f de l’espace physique, n’´etant sensible qu’`a la vitesse
d’un point mat´eriel M donn´e dans le syst`eme. Sa r´esultante est ´egale `a f. Calculons le moment de
cette force par rapport `a tout point O. Soit r la rotation vectorielle d’un angle droit dans le sens
direct suivant l’orientation choisie du plan. La rotation d’un radian par unit´e de temps autour de
O dans le sens direct entraˆıne le point M suivant la vitesse r(
−−→
OM), donc la puissance fournie par
f au syst`eme, qui d´efinit son moment par rapport `a O, vaut f(r(
−−→
OM)), soit en appliquant encore
r sur le tout, r(f)(
−−→
MO). On trouve ainsi le r´esultat: le champ des moments est l’application qui
`a tout O associe r(f)(
−−→
MO). C’est donc la forme affine s’annulant en M et de partie lin´eaire r(f),
qui est la r´esultante f tourn´ee d’un angle droit.
D’autre part il est naturel que l’ensemble des vitesses de rotations s’identifie `a l’espace des
points pond´er´es du plan, o` u la position d’un point pond´er´e correspond au centre de la rotation et
sa masse correspond `a la vitesse angulaire.
Nous allons compl´eter cette description par celle de la transmission des forces `a travers les
syst`emes, sachant que les forces se transmettent uniquement de proche en proche, et qu’en tout
point le torseur de la force qui est transmise par l`a s’annule en ce point. Voici:
Th´eor`eme. Toute disposition des forces en ´equilibre dans le plan peut se d´ecrire au moyen d’un
champ scalaire f (d´efini `a l’addition pr`es par une forme affine) d’apr`es la r`egle suivante: quels que
soient deux points M et N du plan, le torseur de la force traversant de droite `a gauche toute courbe
reliant M `a N se repr´esente par la diff´erence T(N) −T(M) des formes affines dont les graphes sont
les plans tangents au graphe de f aux points M et N.
Ce th´eor`eme n’a pas d’´equivalent pour des forces en dimension plus grande.
On a d´ej`a vu `a la section pr´ec´edente qu’`a l’´equilibre, le torseur d’une force traversant une
courbe (cas particulier d’hypersurface) ne d´epend que des extr´emit´es de la courbe.
Fixons une origine O dans le plan. Pour tout point M, soit T(M) le torseur de la force
traversant de droite `a gauche toute courbe reliant O `a M. Alors il est imm´ediat que pour tous
points M et N, le torseur de la force traversant toute courbe reliant M `a N vaut T(N) − T(M).
Il suffit en effet de prolonger une courbe de O `a M par une courbe de M `a N pour obtenir une
courbe de O `a N.
Posons maintenant pour tout M, f(M) = T(M)(M) (le moment en M de T(M)). Il ne reste
qu’`a v´erifier que le graphe de T(M) est le plan tangent en M au graphe de f.
Calculons la valeur de f en un point N voisin de M:
f(N) = (T(N) −T(M))(N) +T(M)(N).
Or T(N) −T(M) est le torseur des forces traversant une courbe reliant M `a N. Non seulement ce
torseur est petit correspondant `a la proximit´e des deux points, mais la droite o` u il s’annule passe
33
par le voisinage commun de ces points, d’o` u le fait que sa valeur en N est un infiniment petit du
second ordre. En effet, son moment par rapport `a N correspond `a l’effet des rotations de centre
N qui se traduisent par une faible vitesse sur la petite courbe reliant ces points directement dans
leur voisinage.
Ainsi, T(M)(N) approxime f(N) au premier ordre au voisinage de M, ce qu’il fallait d´emon-
trer.
4.5. M´ecanique relativiste, introduction
Abordons maintenant l’´etude de la m´ecanique relativiste. En un certain sens nous en avons
d´ej`a tout dit: c’est la th´eorie de l’´equilibre que nous venons d’´etudier, en employant dans le rˆole
d’espace physique l’espace `a 4 dimensions de la relativit´e restreinte. On remplace “syst`eme” par
“sc´enario”, “´energie” par “action”, et comme tout est `a l’´equilibre, la d´efinition de l’´equilibre
(annulation de la diff´erentielle de l’´energie) est ´erig´ee en principe, nomm´e le principe de moindre
action.
Mais en fait, il reste plusieurs probl`emes.
Un probl`eme est de d´ecrire, `a l’int´erieur de ce cadre g´en´eral, quelles sont en particulier les
propri´et´es m´ecaniques des objets physiques qui se rencontrent le plus couramment en pratique,
`a savoir les particules ´el´ementaires ou non. Par mesure de simplicit´e on ne d´ecrira pas d’autres
choses comme les champs, en sorte qu’on ne verra que la notion ´el´ementaire de particule sans rien
pr´eciser de ce qui fait en r´ealit´e la diversit´e des esp`eces de particules existantes.
Or, comme il s’agit l`a de d´ecrire au mieux les propri´et´es des objets physiques en eux-mˆemes
sans s’occuper de leurs apparences exp´erimentales, le langage le mieux adapt´e pour l’intuition est
le langage que nous avons appel´e le langage th´eorique, `a savoir celui de l’´equilibre avec son ´energie
potentielle, et non celui de la m´ecanique relativiste. Il n’en reste pas moins que si ce langage est
adapt´e, cela ne signifie pas que les choses soient r´eellement telles qu’elles semblent quand on les
d´ecrit dans ce langage. Cela signifie qu’il y a une correspondance entre les concepts de la r´ealit´e
`a d´ecrire et ceux qui nous sont familiers par notre exp´erience des situations d’´equilibre dans la
vie de tous les jours, et que nous choisissons d’utiliser cette familiarit´e pour exprimer ais´ement
les choses `a d´ecrire `a travers cette correspondance. Or, tout irait bien dans cette affaire s’il n’y
avait qu’une seule bonne mani`ere de faire cette traduction, par laquelle les description intuitives
puissent s’´elaborer sans h´esitation. H´elas, ce n’est pas le cas car il y a deux possibilit´es. Comment
est-ce possible ? Entre deux traductions, la diff´erence consiste bien sˆ ur en une retraduction de
la repr´esentation dans elle-mˆeme. Ici, dans la th´eorie de l’´equilibre c’est le signe de l’´energie qui
s’inverse.
En effet, la notion g´en´erale d’´equilibre est conserv´ee quand tous les signes des ´energies sont
´egalement invers´es. Seule la notion d’´equilibre stable est perdue et remplac´ee par celle de l’´equilibre
le plus instable, celui de l’´equilibre sur les sommets de potentiels, ce qui, il faut le dire, constitue
malgr´e son extrˆeme simplicit´e math´ematique une gymnastique tr`es inhabituelle pour notre intuition
courante de l’´equilibre. D’o` u la question ridicule en th´eorie mais grave en pratique pour nous
pauvres humains devant savoir g´erer au mieux les ressources de notre imagination: parmi ces deux
traductions possibles, y en a-t-il une qui soit meilleure que l’autre, et suivant quels crit`eres ?
Dans la section suivante, nous d´evelopperons une description th´eorique qualitative des pro-
pri´et´es m´ecaniques des particules en termes d’une traduction choisie suivant le fait qu’elle induit
la plus grande fr´equence de situations d’´equilibre stable, en sorte de pr´eserver le confort de notre
intuition. Ce confort sera d’autant mieux pr´eserv´e que la description utilis´ee se fera encore en ter-
mes de la g´eom´etrie euclidienne de l’espace, en d´epit du fait que l’espace r´eel est pseudo-euclidien
et que pour cette raison il n’existe aucune correspondance compl`etement coh´erente et rigoureuse
entre cette description et la r´ealit´e. On peut mˆeme aller plus loin en disant que ce probl`eme du
changement de g´eom´etrie relativise la d´efinition d’un choix du signe de l’´energie dans les descrip-
tions, car elle consiste justement `a faire planer dans l’air un changement de signe qui remet en
question les relations habituelles entre les signes des quantit´es en jeu dans les ´etats d’´equilibre,
et leur rapport avec la notion de stabilit´e. D’o` u la difficult´e pour l’intuition `a appr´ehender la
coh´erence d’une description donn´ee lorsque la g´eom´etrie pseudo-euclidienne est prise en compte.
Puis, nous ferons quelques remarques sur la notion de stabilit´e, montrant qu’`a travers la
34
correspondance entre th´eorie et exp´erience elle se comporte ´etrangement, en sorte qu’elle ne devrait
mˆeme pas ˆetre prise comme r´ef´erence et que le “principe de moindre action” porte mal son nom.
Enfin, nous ´etablirons rigoureusement les lois g´en´erales de la m´ecanique relativiste exprim´ees en
termes de leur formulation exp´erimentale usuelle, comme traductions des lois g´en´erales de l’´equilibre
pr´ec´edemment ´etablies appliqu´ees `a l’espace pseudo-euclidien suivant une certaine repr´esentation
th´eorique (dont la coh´erence vient du fait qu’elle ne r´eutilise sans examen que ce qu’on a pu d´efinir
sans utiliser les sp´ecificit´es de la g´eom´etrie euclidienne).
4.6. Description des particules
Nous allons ici introduire une description th´eorique des propri´et´es m´ecaniques des particules
comme dans un espace eulicien, d´eduite par traduction de leur comportement exp´erimental usuel
sans tenir compte des questions d’accords de signe ou autres coefficients de proportionnalit´e li´es `a
la vitesse de la lumi`ere.
Qu’est-ce qu’une particule ? Exp´erimentalement, c’est un point anim´e d’une vitesse rectiligne
uniforme quand il n’est soumis `a aucune force; sa vitesse varie uniquement quand il est soumis `a
des forces de somme non nulle (ni avant, ni apr`es).
Traduit th´eoriquement, cela donne une ligne qui est droite si aucune force ext´erieure ne s’exerce
dessus, et qui est incurv´ee uniquement l`a o` u s’exercent des forces ext´erieures de somme non nulle.
On trouve facilement dans la vie courante deux sortes d’ojets se comportant ainsi: les ficelles et les
´elastiques. Ces deux objets pr´esentent une r´esistance `a l’´elongation. Celle de l’´elastique est variable
tandis que celle de la ficelle est totale, pouvant se voir comme la limite d’un ´elastique dont la raideur
tend vers l’infini. Par contre ils ne pr´esentent aucune r´esistance `a la courbure contrairement au fil
de fer. Comme une telle r´esistance permettrait `a la courbure de se prolonger en dehors du strict
lieu d’application des forces ext´erieures contrairement `a ce qu’indique l’exp´erience des particules,
elle ne sera pas admise et le mod`ele des fils de fer sera donc exclu.
La seule question qui reste `a pr´eciser dans cette description est donc celle de la raideur de
l’´elastique, qui est sa r´esistance `a l’´elongation. Cette question se formule en termes du champ
de potentiel sur l’espace de configuration: l’´energie de chaque partie d’un ´elastique s’exprime en
fonction de sa longueur. La force de tension de l’´elastique en chaque lieu est alors la d´eriv´ee de
l’´energie par rapport `a la longueur. Dans le cas d’une r´esistance infinie (un fil), la relation s’exprime
en disant que la longueur est ind´ependante de la tension. Alors, qu’en est-il pour une particule ?
Que dire de sa tension, `a quoi correspond-elle exp´erimentalement ? Pour un ´elastique de tension
donn´ee faiblement incurv´e en un lieu par une force, la courbure (ou la diff´erence de direction de
part et d’autre du lieu d’application de la force) est proportionnelle `a cette force, ce qui correspond
bien exp´erimentalement `a l’effet d’acc´el´eration proportionnel `a la force exerc´ee. Ainsi s’accordent
les notions th´eorique et exp´erimentale de force comme ´etant proportionnelles. Plus pr´ecis´ement,
la force exp´erimentale correspond `a la densit´e de force th´eorique par rapport au temps.
Ensuite, pour un ´elastique de courbure donn´ee, la force n´ecessaire pour ´equilibrer cette cour-
bure est proportionnelle `a sa tension, de mˆeme que la force n´ecessaire pour donner `a une particule
une acc´el´eration donn´ee est proportionnelle `a sa masse. Ainsi voit-on que la tension th´eorique
d’une particule repr´esente (est proportionnelle `a) sa masse exp´erimentale.
Or, que nous dit l’exp´erience sur les masses des particules et leurs variation ? Elle nous dit
que la masse de chaque esp`ece de particule ´el´ementaire est une constante universelle. On a donc
affaire `a un ´elastique dont la tension est ind´ependante de sa longueur ! Ainsi son ´energie est
proportionnelle `a sa longueur.
Connaissons-nous un tel ph´enom`ene dans la vie courante ? S’il n’est pas facile de trouver une
substance visqueuse qui se comporte ainsi assez pr´ecis´ement quand on l’´etire dans une dimension,
on en connaˆıt un ´equivalent en dimension 2: la surface de l’eau ou d’une bulle de savon v´ehicule
aussi une tension superficielle constante, qui est cette fois une tension par unit´e de longueur du
bord, et correspond `a une densit´e surfacique d’´energie constante. En fait, comme on le verra plus
loin, cette densit´e surfacique constante d’´energie dans sa description exp´erimentale correspond
th´eoriquement `a la composante temporelle du mˆeme ph´enom`ene de surface tendue en dimension 3,
dans lequel cette tension ne privil´egie aucune des directions de son extension dans l’espace-temps
pseudo-euclidien. En effet, cette uniformit´e s’exprime par le fait qu’il n’y a pas de notion de vitesse
35
d’une partie ou d’un bord coulissant dans la surface, qui ait des effets m´ecaniques mesurables dans
la surface. Et donc, que les contractions et dilatations n’ont pas d’effet sur la tension.
Le mˆeme ph´enom`ene existe aussi en dimension 4, sauf qu’en l’occurence celui qu’on observe
semble s’´etendre universellement sans avoir aucune fronti`ere sur laquelle sa tension puisse s’exercer:
c’est la constante cosmologique.
On peut expliquer ces propri´et´es des particules de la mani`ere suivante: Prenons un tel ´elastique
(une particule) attach´e `a ses extr´emit´es (sa cr´eation et sa fin), saisissons-en un de ses points
(´ev`enements) et tirons-le dans la direction de l’´elastique. Le r´esultat pr´ec´edent s’exprime ici par le
fait que cet acte de tirer ainsi un point de l’´elastique dans le sens de la longueur n’implique aucune
transmission d’´energie par celui qui tire. Seule la partie avant de l’´elastique transmet son ´energie
`a la partie arri`ere.
Finalement, ce r´esultat apparaˆıt naturel: car en saisissant un point et en le tirant, qu’avons-
nous fait finalement ? En quoi le fait de saisir tel ´ev`enement et de l’amener vers tel autre de la
mˆeme ligne d’univers diff`ererait-il du fait de saisir cet autre point d`es le d´epart ? Car il s’agit l`a
de la mˆeme particule !
Un ´elastique habituel est fait d’un nombre fini d’atomes, avec des nombres pr´ecis d’entre eux
de part et d’autre du point qu’on saisira, en sorte que le choix du lieu o` u le saisit a une implication
physique sur l’´elastique, qui intervient lors de l’allongement que peuvent ensuite subir les parties
de l’´elastique de chaque cˆot´e de ce point. Mais il ne se passe rien de tel dans une particule: la
forme g´eom´etrique de chacune de ses parties suffit `a la d´ecrire physiquement en toute circonstance.
On peut ´egalement r´einterpr´eter ce ph´enom`ene en termes de rugosit´e: pour que saisir un point
de l’´elastique et le d´eplacer puisse r´eellement d´eplacer quelque chose dedans pour modifier l’´etat de
la particule et donc son potentiel, il faudrait qu’il y ait quelque chose d’irr´egulier dans sa longueur,
que ce d´eplacement puisse affecter. Or, de cela il n’y a rien, puisque la particule est parfaitement
lisse.
Bien sˆ ur, dans une “grosse particule” form´ee d’un grand nombre d’atomes, comme par exemple
un grain de sable, l’agitation thermique des atomes constitue dans la dimension temporelle une
rugosit´e sur l’appui de laquelle on peut tirer. La force th´eorique qui prend alors appui sur cette
rugosit´e pour tirer dans la dimension temporelle, et entraˆıner une variation de tension (masse)
entre les deux parties (pass´e et futur), s’appelle exp´erimentalement la transmission d’une quantit´e
de chaleur vers ce grain.
Le spin
Citons pour finir la derni`ere propri´et´e m´ecanique des particules, qui est leur spin. Mais en
fait, il n’est pas exact que ce soit encore vraiment l`a une propri´et´e m´ecanique dont on puisse
rendre compte suivant l’expression de la m´ecanique classique (ou de l’´equilibre) que nous avons
employ´ee jusqu’`a pr´esent. En effet, le spin est par nature une propri´et´e quantique des particules,
qui met en d´efaut certaines r`egles de la m´ecanique classique. Une attitude sage serait de passer
simplement sous silence ce ph´enom`ene ´etrange en le n´egligeant, ce que nous aurions le droit de faire,
puisqu’`a l’´echelle de la m´ecanique classique qui est celle des ph´enom`enes que nous avons d´ecrit et
o` u les approximations g´en´erales n´ecessaires ` a la pertinence de cette description sont valables, le
spin est ´egalement n´egligeable. Malgr´e cela, nous allons pr´esenter ici le spin dans les termes de
la m´ecanique classique, et ce faisant nous allons pr´eciser en quoi cette m´ecanique classique par
laquelle nous exprimons ce ph´enom`ene est mise en d´efaut.
Voici: le spin repr´esente la torsion de l’´elastique, c’est-`a-dire, dans le cas o` u il suit une droite
(la particule est isol´ee), le moment de la force v´ehicul´ee par rapport `a cette droite elle-mˆeme.
L’exp´erience quotidienne de ce ph´enom`ene est facile: on pend un objet `a un fil que l’on tient par
le haut, on roule le fil dans la main et l’objet se met `a tourner. L’explication de cette exp´erience
courante est facile: le nombre de tours que l’on a fait subir au fil sur lui-mˆeme se trouve enregistr´e
dans les d´etails de la disposition de la mati`ere que constitue le fil, et `a cet ´etat de torsion du fil
ainsi affect´e est associ´e une ´energie, de laquelle d´erive le moment de la force qui fera tourner l’objet
suspendu.
Seulement, dans le cas du spin d’une particule, cette explication tombe `a l’eau: son ´etat en
tant qu’´elastique `a l’´equilibre dans l’espace pseudo-euclidien n’est pas affect´e par le mouvement de
36
torsion qu’on inculque `a une de ses extr´emit´es; pourtant, une puissance est r´eellement transmise
dans ce mouvement. Au fait, peut-on r´eellement tenir et rouler ainsi la particule sur elle-mˆeme ?
En un sens non, puisqu’il n’y a pas de rugosit´e dans la largeur de la particule, sur laquelle ce
mouvement pourrait s’exercer. Mais d’autre part, le moment de la force v´ehicul´ee est bien r´eel.
En quoi peut-il alors consister ?
Ce mod`ele a cette part d’incoh´erence, qu’on peut “fournir une puissance au syst`eme” par
un mouvement de son bord qui ne modifie pas l’´etat du syst`eme. Cela peut se comprendre par
le fait que cet exp´erience doit ˆetre interpr´et´ee autrement, en disant que qu’il faut inclure dans
l’´etat du syst`eme celui de son bord, `a savoir ici, dans quelle direction lat´erale est orient´ee la main
qui tient l’´elastique en chaque extr´emit´e. Cette main ne peut alors changer sa direction qu’en
tournant et fournissant donc une ´energie, dans le cas o` u cette prise d´efinit la terminaison physique
de l’extension de l’´elastique. Si on fait faire un tour complet `a cette direction autour de l’axe de
l’´elastique, alors on lui a donn´e ou pris une ´energie pr´ecise correspondant au spin, en revenant `a
l’´etat initial. Et c’est l`a que l’insuffisance de ce mode de repr´esentation apparaˆıt.
Mais si au contraire l’´elastique se prolonge plus loin, on ne peut d´efinir la mani`ere dont l’´energie
se r´epartit de chaque cˆot´e d’une surface de coupe qu’en choisissant une direction lat´erale `a cette
coupe. Si on coupe suivant cette direction, cela donne donne aux deux extr´emit´es issues de cette
coupe cette mˆeme direction de prise.
Stabilit´e et instabilit´e, exemples
Nous allons aborder la question de la stabilit´e de l’´equilibre au sens th´eorique en m´ecanique
relativiste, et son rapport avec la stabilit´e de l’´equilibre exp´erimental pour le cas d’un syst`eme
n’´evoluant pas au cours du temps. La question est: y a-t-il des sc´enarios qui constituent des
minima ou maxima d’action, et lesquels ? On verra en fait qu’en sortant de l’exemple restrictif
des particules il n’y en a pas, d’autant plus que cette action qui est minimis´ee dans le cas des
particules correspond `a l’oppos´ee de l’´energie potentielle. (Ceci a bien sˆ ur l’avantage que la “force”
issue d’une action se d´efinit par la diff´erentielle de l’action et non son oppos´e.) Comme les ´equilibres
exp´erimentaux minimisent cette ´energie, ils maximisent l’action par rapport aux sc´enarios voisins
de fixit´e par rapport au temps. Ceci ruine tout espoir de voir l’action minimis´ee ou maximis´ee en
g´en´eral (et le changement de g´eom´etrie n’y change rien).
[Quelques exemples sont donn´es ici; d’autres exemples compl´ementaires de ceux-ci pourront
ˆetre ajout´es `a l’avenir]
On pourrait imaginer un ´elastique (une particule) tendu au fond d’une vall´ee de potentiel (on
suppose qu’il est lourd et ne d´ecolle pas). Ce serait un ´etat stable d’un point de vue th´eorique,
mais que donne-t-il exp´erimentalement ? Pour le voir, il faut attacher ses extr´emit´es ailleurs que
pr´ecis´ement au fond de la val´ee. Alors, en parcourant la vall´ee, que voit-on ? Qu’il reste quasiment
au fond sauf `a la fin (et de mˆeme au d´ebut sym´etriquement) o` u il s’´ecarte de mani`ere acc´el´er´ee.
C’est donc, exp´erimentalement, un ´equilibre instable.
Veut-on faire le contraire et demander un ´equilibre stable d’un point de vue exp´erimental ?
Le sc´enario de la particule restant fixe et les sc´enarios de la particule oscillant suivant n’importe
quelle amplitude autour du point d’´equilibre stable ´etant tous permis par la m´ecanique relativiste,
on peut transiter continument d’un sc´enario `a l’autre en fixant les extr´emit´es (la particule partant
et finissant en sa position d’´equilibre). Alors l’action ne saurait varier puisque sa variation est
nulle au premier ordre `a toute ´etape de ce changement. C’est donc que la variation de l’action
due `a l’´ecart par rapport `a la position d’´equilibre d’apr`es la force ext´erieure compense celle due `a
l’oscillation (action interne). Le rapport pr´ecis de compensation entre les deux est ce qui d´etermine
la p´eriode de l’oscillation: une variation plus serr´ee du potentiel n´ecessite pour ˆetre compens´ee une
oscillation plus serr´ee (rapide).
Donc, si on veut que le potentiel ext´erieur ressemble en th´eorie `a son apparence exp´erimentale
afin que les notions de stabilit´e se correspondent, il faut changer le signe par rapport `a ce que
nous avons d´ecrit jusqu’`a pr´esent et consid´erer l’´elastique tendu (la particule) comme un syst`eme
instable, comme si on comprimait l’´elastique et qu’il r´esiste du fait qu’il n’a pas d´ecid´e de quel cˆot´e
il allait se plier. En fait, le point important ici n’est pas le signe de la tension mais l’instabilit´e
fondamentale de la particule comme ´elastique th´eorique en prenant comme r´ef´erence de stabilit´e
37
celle du point de vue exp´erimental.
C’est pourquoi, le “principe de moindre action” repr´esentant la minimisation de l’action des
sc´enarios d’une particule isol´ee, il a ´et´e convenu de donner `a l’action le signe oppos´e `a l’´energie
au sens exp´erimental (le sens exp´erimental ´etant le seul `a d´eterminer une correspondance entre les
deux tandis que la correspondance th´eorique est au libre choix des goˆ uts et des couleurs).
4.7. M´ecanique relativiste, formulation
Etablissons enfin les lois fondamentales de la m´ecanique relativiste comme traductions exp´e-
rimentales des lois de l’´equilibre.
Le point de vue exp´erimental part du choix d’un r´ef´erentiel. Un r´ef´erentiel s’exprime de mani`ere
´equivalente par sa direction temporelle, ou par son vecteur temps not´e

t (objet trait´e comme un
vecteur mais qu’il faut en fait multiplier par une quantit´e de temps pour obtenir un vrai vecteur
g´eom´etrique), ou son espace S orthogonal `a

t (des vecteurs de l’espace usuel), ou la coordonn´ee de
temps T (de mˆeme direction que

t au sens du produit scalaire), qui est une forme lin´eaire multipli´ee
par une quantit´e de temps, autrement dit d´efinie par les relations: (T(

t) = 1 et une ´equation de S
est T(M) = 0).
Voici les conventions. On a un champ d’action sur l’espace de configuration th´eorique. Choisis-
sons de repr´esenter th´eoriquement le principe de moindre action en termes d’´equilibre, en d´efinissant
l’´energie th´eorique comme ´etant l’oppos´ee de l’action (ce qui dans notre approche constitue en fait
la d´efinition de l’action `a partir de l’exp´erience), et donc la force th´eorique est ´egale `a la diff´erentielle
de l’action. Nous d´efinirons la force exp´erimentale comme ´etant la restriction `a S de la densit´e
de force th´eorique par rapport au temps. En effet, nous allons d´emontrer que cela redonne toutes
les propri´et´es exp´erimentales usuelles de la force, et ceci nous sert de d´efinition des conventions de
signes th´eoriques en fonction des donn´ees exp´erimentales. (Ce choix de faire correspondre ainsi les
forces th´eorique et exp´erimentale sans changement de signe semble en effet le choix de convention
le plus naturel).
Lois de conservation
Nous allons obtenir les lois de conservation de la m´ecanique relativiste comme traduction
exp´erimentale des bilans des forces ext´erieures que nous avons pr´esent´es en m´ecanique de l’´equilibre,
avec un choix de r´ef´erentiel. Consid´erons un syst`eme en ´evolution (sc´enario). Chaque instant
(´el´ement de la droite d’arriv´ee de T) d´efinit un sous-espace de dimension 3 qui divise le sc´enario
en une partie pass´ee et une partie future. Alors, l’objet qui “se conserve” se d´efinit comme ´etant
le torseur (r´esultante et moment) des forces th´eoriques que la partie pass´ee exerce sur la partie
future.
En effet, consid´erons le syst`eme th´eorique d´elimit´e par les deux faces parall`eles d’´equations
T(M) = t
1
et T(M) = t
2
(avec t
1
< t
2
fix´es) et des parois lat´erales. L’annulation de la somme
des forces appliqu´ees `a ce syst`eme se r´e´ecrit en disant que ce qui sort par t
2
moins ce qui entre par
t
1
est ´egal `a la somme de ce qui entre par les parois lat´erales ou qui s’applique dans l’int´erieur du
syst`eme. C’est donc la variation exp´erimentale de l’objet associ´e au syst`eme entre les instant t
1
et
t
2
qui est ´egale au torseur th´eorique des forces appliqu´ees au syst`eme entre ces instants. Donc, la
d´eriv´ee par rapport au temps de cette quantit´e est ´egale `a la densit´e temporelle de l’exercice de ce
torseur. En particulier, cette quantit´e se conserve au cours du temps dans le cas d’un syst`eme isol´e
(non soumis `a des forces autres que les forces internes apparaissant dans les coupes du syst`eme en
t
1
et t
2
).
Enum´erons `a pr´esent ces quantit´es qui se conservent dans le cas d’un syst`eme isol´e:
- La r´esultante th´eorique f se d´ecompose exp´erimentalement en sa partie spatiale (restriction
de f `a S) appel´ee quantit´e de mouvement ou impulsion et not´ee p, et sa partie temporelle appel´ee
´energie, d´efinie par E = −f(

t). La conversion de ce f = p −ET en vecteur par le produit scalaire
en unit´e d’espace d´efinit le quadrivecteur ´energie-impulsion p+
E
c
2

t. Sa norme en mesure temporelle
s’appelle sa masse
- Le moment (par rapport `a une origine arbitraire de l’espace-temps), qui se d´ecompose en
deux parties: d’une part, sa restriction aux rotations spatiales appel´ee le moment cin´etique qui
correspond aux rotations spatiales (celles de S), et d’autre part ce qui repr´esente le centre d’inertie
du syst`eme (voir plus bas).
38
Il ne reste plus qu’`a v´erifier que tout cela redonne l’expression exp´erimentale usuelle des lois
de la m´ecanique (classique ou relativiste).
D´ej`a, on tire imm´ediatement des d´efinitions et r´esultats ci-dessus la
Relation fondamentale de la dynamique. La d´eriv´ee par rapport au temps de l’impulsion
d’un syst`eme est ´egale `a la r´esultante des forces ext´erieures appliqu´ees au syst`eme en cet instant.
La difficult´e dans la v´erification de ce r´esultat est de montrer l’´equivalence des d´efinitions
exp´erimentales des termes employ´es (force et impulsion) `a leurs d´efinitions usuelles. Comme d’autre
part on admet la relation fondamentale de la dynamique comme principe physique, le r´esultat ci-
dessus est en fait la confirmation de notre d´efinition de la force exp´erimentale comme densit´e
temporelle de force th´eorique, restreinte `a l’espace.
Relions d’abord la force exp´erimentale `a l’´energie exp´erimentale:
Th´eor`eme de la puissance. La puissance m´ecanique exp´erimentale exerc´ee par une force f sur
un syst`eme ´evoluant `a la vitesse v est ´egale `a f(v).
Ici, la puissance d´esigne la densit´e temporelle (ou d´ebit) d’energie transmise par cette force;
“m´ecanique” signifie que toute transmission d’une quantit´e de chaleur est retranch´ee de ce bilan;
v est un vecteur tangent `a l’espace de configuration des ´etats exp´erimentaux; ces ´etats sont d´efinis
th´eoriquement comme ´etant les coupes possibles de sc´enarios par un espace fixe S
1
d’´equation
T(M) = constante.
Le vecteur tangent v repr´esente la vitesse de variation des coupes successives suivant le temps
T, ramen´ees abstraitement par translation temporelle `a l’espace S
1
. Mais nous allons l’utiliser
comme vecteur tangent `a l’espace de tous les sc´enarios par un prolongement arbitraire, dont on
demande seulement que dans ce mouvement th´eorique, la coupe par S
1
demeure contenue dans S
1
et y co¨ıncide avec le mouvement exp´erimental de vitesse v invoqu´e.
La force f repr´esente la force exp´erimentale; notons f

la force th´eorique correspondante exerc´ee
entre deux instants infiniment proches l’un de l’autre, divis´ee par l’intervalle entre ces instants.
(Ceci compl`ete donc f par les composantes temporelles de cette force th´eorique, qui l’accompagnent
naturellement.)
Quelle est donc la puissance transmise par cette force au syst`eme ? D’apr`es la d´efinition de
l’´energie exp´erimentale donn´ee plus haut, cette puissance vaut −f

(

t) o` u

t repr´esente le mouvement
th´eorique de translation dans la direction du temps, du pass´e vers le futur (et `a la vitesse du temps
qui passe). Pour montrer l’´egalit´e voulue, remarquons que la diff´erence entre ces termes vaut
f

(

t +v). Or

t +v repr´esente un mouvement de coulissement du sc´enario sur lui-mˆeme, auquel la
force f

doit ˆetre insensible si elle ne comporte pas d’´echange thermique avec le syst`eme. Bien sˆ ur,
dans le cas contraire cette diff´erence correspond `a la quantit´e de chaleur transmise.
Ainsi est retrouv´ee la relation entre force et ´energie constituant la th´eorie de l’´equilibre dans
le cas exp´erimental, comme cons´equence du principe de moindre action.
Exemple de calcul concret
Soit une particule de masse m immobile au d´epart ´eclatant en deux particules de masses m
1
et m
2
. Calculer leurs ´energies E
1
, E
2
.
Solution : soient p, p
1
et p
2
les quadrivecteurs ´energie-impulsion des particules respectives.
Leur conservation s’exprime par p = p
1
+ p
2
. La particule de d´epart ´etant d´eclar´ee immobile, p
est dans la direction du vecteur temps; la composante temporelle de p
1
´etant
E
1
c
2
, on a le calcul
suivant avec le produit scalaire en mesure temporelle :
m
2
2
= p
2
2
= (p −p
1
)
2
= m
2
+m
2
1
−2m
E
1
c
2
=⇒ E
1
=
c
2
2m
(m
2
+m
2
1
−m
2
2
)
Centre d’inertie
Nous allons d´efinir le centre d’inertie d’un syst`eme en termes de la mesure du moment du
syst`eme sur les rotations th´eoriques d’axes de directions spatiales (axes de dimension 2 parall`eles
39
`a S). Notons que ces rotations ne forment pas un groupe (la compos´ee de deux telles rotations
n’est pas une telle rotation). Mais rappelons que ce sont seulement les vitesses de rotation qui nous
importent.
D’abord, donnons une description g´eom´etrique de ces rotations, en commen¸cant par les rota-
tions vectorielles (ou autrement dit, dont l’axe plan passe par un point origine fix´e).
Voici: une rotation qui d´eplace le vecteur temps

t suivant une vitesse w ∈ S, d´eplace tout
v ∈ S suivant la vitesse
w·v
c
2

t.
Ensuite, consid´erons l’ensemble des rotations d’axe contenu dans un mˆeme espace de simul-
tan´eit´e S(t) (espace euclidien de direction S form´e des ´ev`enements d’une mˆeme date t dans le
r´ef´erentiel choisi). La propri´et´e commune de toutes ces rotations est le fait que la vitesse de tout
point de S(t) est colin´eaire `a

t. Or il suffit de d´ecrire le mouvement de tout point de S(t) car le
reste de la rotation s’en d´eduit (comme le mouvement d’un plan d´etermine celui des solides pos´es
dessus). Ainsi, on repr´esentera une telle rotation par l’application affine w d´efinie sur S(t) qui
d´efinit la vitesse de tout point N ∈ S(t) par l’expression −
w(N)
c
2

t.
Nous venons ainsi de d´ecrire g´eom´etriquement un certain sous-espace vectoriel de l’alg`ebre de
Lie du groupe des d´eplacements th´eoriques. D´ecrivons maintenant la forme de la restriction d’un
torseur `a ce sous-espace, autrement dit une forme lin´eaire sur ce sous-espace.
A quoi ressemble donc une forme lin´eaire sur l’espace des formes affines sur l’espace euclidien
S(t) ? C’est un point pond´er´e de S(t), autrement dit, ou bien un vecteur auquel s’applique la
partie lin´eaire de w, ou bien un point G pond´er´e par une masse m, d´esignant l’application lin´eaire
qui `a tout w associe mw(G). Attention: ce que nous appelons ici et plus bas la masse ne doit
pas ˆetre confondu avec la notion de masse que nous avons invoqu´ee pr´ec´edemment en parlant de
la masse d’une particule, et qui est la d´efinition commun´ement admise en m´ecanique relativiste
(elle d´esigne ordinairement la norme du vecteur de la r´esultante conserv´ee, tandis que ce que nous
appelons provisoirement ici la masse est sa composante temporelle.
Calculons la masse m de ce point pond´er´e: elle s’obtient en appliquant cette expression au cas
de la forme affine constante w ´egale `a 1. Ceci correspond au mouvement qui d´eplace tout point de
S(t) suivant le mˆeme vecteur
−1
c
2

t. C’est donc le mouvement de translation de vitesse
−1
c
2

t.
Or, nous avons d´efini l’´energie E du syst`eme comme ´etant moins la composante temporelle de
la r´esultante, autrement dit la puissance th´eorique transmise par le pass´e sur le futur lors d’une
translation th´eorique de vitesse −

t.
D’o` u finalement
E = mc
2
.
Mais bien sˆ ur pour l’obtenir, nous avons trich´e en ajustant le coefficient dans la d´efinition de w
qui se r´epercute sur la d´efinition de m. Il ne nous reste plus qu’`a justifier ce coefficient par le fait
qu’il en r´esulte la propri´et´e suivante:
Mouvement du centre d’inertie. Dans un r´ef´erentiel donn´e, la vitesse de variation au cours
du temps du centre pond´er´e d’inertie mG d’un syst`eme isol´e est ´egale au vecteur impulsion p du
syst`eme (correspondant `a la forme lin´eaire impulsion, par le produit scalaire spatial usuel).
Nous allons donner deux d´emonstrations de ce r´esultat, l’une simple et intuitive, l’autre com-
pl`ete et rigoureuse.
D´emonstration 1.
Reprenons la remarque d´emontr´ee dans le cas du plan que le moment par rapport `a un point
s’exprime par une forme affine dont la direction est celle du vecteur force. L’´evolution du centre
d’inertie constitue une droite de l’espace-temps dirig´ee par le quadrivecteur ´energie-impulsion p +
E
c
2

t. Une droite dirig´ee par ce vecteur apparaˆıt exp´erimentalement comme un point anim´e de la
vitesse
p
m
si ce m est d´efini par E = mc
2
.
D´emonstration 2.
On reprend une d´emonstration compl`ete partant de la construction des torseurs en termes de
rotations.
40
Pour v´erifier la relation ´enonc´ee entre centres pond´er´es d’inertie, fixons une forme affine w sur
l’espace euclidien S du r´ef´erentiel, qui est identifi´e `a chacun des espaces S(t), o` u la correspondance
entre tous les S(t) se d´efinit par la translation temporelle dans la direction de

t. Quelle est alors la
relation entre mw(G(t)) et mw(G(t

)) ? C’est le mˆeme torseur µ qui s’applique aux deux vitesses
de rotations r(t) et r(t

) d´efinies par le mˆeme w sur les diff´erents espaces S(t) et S(t

). On a donc:
mw(G(t

)) −mw(G(t)) = µ(r(t

)) −µ(r(t)) = µ(r(t

) −r(t)).
Ensuite, le mouvement r(t

)−r(t) ´etant la diff´erence de deux mouvements de rotation de mˆeme
partie lin´eaire, est un mouvement de translation. Calculons le vecteur vitesse de ce mouvement.
Une fa¸ con de le faire est de remarquer qu’on passe de l’objet g´eom´etrique r(t) `a l’objet r(t

) par
la translation τ de vecteur (t

−t)

t. Donc, pour tout point M,
(r(t

) −r(t))(M) = τ(r(t))(M) −r(t)(M) = r(t)(τ
−1
(M) −M) = (t −t

)r(t)(

t).
Enfin, la valeur de r(t)(

t) se d´eduit de la d´efinition du rapport entre w et r(t) et de la description
donn´ee plus haut de ces rotations: r(t)(

t) = − w o` u w est le vecteur repr´esentant la partie lin´eaire
de w.
Donc,
mw(G(t

)) −mw(G(t)) = µ((t −t

)r(t)(

t)) = (t

−t)µ( w) = (t

−t)p( w) = (t

−t)w( p).
Ceci ´etant valable pour tout w, on conclut:
mG(t

) −mG(t) = (t

−t) p.
4.8. L’espace des phases
La m´ecanique classique que nous avons expos´e se traduit en une loi d’´evolution, par laquelle
l’´etat d’un syst`eme `a un instant donn´e d´etermine son ´etat `a venir. Voyons les notions de base qui
interviennent dans cette question.
L’´etat d’une particule classique consiste en sa position et sa vitesse, ou encore sa position et son
impulsion. Plus g´en´eralement pour un syst`eme quelconque, son ´etat en un instant se d´efinit par la
coupe du sc´enario par cet instant dans l’espace-temps, et l’ensemble de toutes les forces th´eoriques
(les impulsions) qui sont v´ehicul´ees `a travers cette coupe. En effet, pour un syst`eme donn´e `a
l’´equilibre, je peux le couper sans perturber l’´equilibre de la moiti´e qui m’int´eresse `a condition de
maintenir en place toute la disposition de ce qui se trouve sur cette coupe et d’y exercer pour cela
toutes les forces n´ecessaires. Si je m’int´eresse `a l’´evolution que cette moiti´e aurait si le syst`eme
´evoluait sans avoir ´et´e coup´e, je peux reproduire la mˆeme ´evolution en exer¸cant sur la coupe les
mˆemes mouvements et forces qui seraient v´ehicul´ees `a travers ce plan si le syst`eme n’´etait pas
coup´e. En effet, il n’y a pas `a prendre en compte de mouvements de cette coupe qui sortent de
son plan, puisque tout est fait de particules qui, comme nous avons d´ecrit, peuvent ˆetre prolong´ees
par la simple traction de leur bord suivant leur long, sans en ˆetre affect´ees. Ainsi tout mouvement
qui sortirait de ce plan est repr´esentable de mani`ere unique par un mouvement demeurant dedans.
Pour la mˆeme raison, il n’est pas besoin de pr´eciser la composante temporelle des forces th´eoriques
(les ´energies) mais seulement celles qui agissent suivant la direction du plan de coupe (impulsions),
car cette composante temporelle est d´etermin´ee de mani`ere unique par ces conditions.
On appelle espace des phases d’un syst`eme la vari´et´e constitu´ee de tous les ´etats qu’il pourrait
avoir `a un instant donn´e, o` u la notion de l’´etat d’une coupe est constitu´ee de sa forme et celle des
forces qui la traversent (impulsions).
Nous l’avons d´efini `a l’aide d’une coupe, mais l’usage que nous en ferons pourrait s’appliquer
`a des mani`eres beaucoup plus g´en´erales de maintenir le bord d’un syst`eme.
L’important, donc, est qu’on a un syst`eme en ´equilibre (un sc´enario) pouvant ˆetre soumis
`a des potentiels quelconques, et qu’il y a deux acteurs qui, chacun de son cˆot´e, maintient une
partie du syst`eme, et peut agir dessus en la d´epla¸cant et en modifiant la force qu’il exerce dessus.
41
Ces deux parties sont disjointes l’une de l’autre, en sorte que les acteurs interagissent uniquement
par l’interm´ediaire du syst`eme: les actions de l’un sur le syst`eme sont ressenties par l’autre et
inversement. Si l’un choisit par exemple de maintenir fixe sa partie, l’autre pourra bouger la sienne
et affectera la force `a laquelle le premier doit r´esister pour maintenir cette fixit´e. Ou s’il d´ecide de
laisser sa partie suivre le mouvement suivant une certaine ´elasticit´e, les actions de l’autre la feront
bouger.
D´efinissons l’espace des phases comme ´etant l’ensemble des ´etats d’´equilibre possibles pour le
syst`eme dont on oublie les voisinages imm´ediats des deux acteurs, et dont la r´ealisation d´epend du
bon vouloir conjoint de ceux-ci. (On ne s’int´eresse pas `a la mani`ere dont chacun se d´ebrouile de son
cˆot´e pour faire ´evoluer sa prise en sorte de s’accorder `a chaque instant avec la position du syst`eme
dans l’espace des phases). Et subjectivement, chaque acteur se repr´esente l’espace des phases en
d´ecrivant tout ´etat d’´equilibre du syst`eme en dehors de lui sous la forme de ce qu’il peut ressentir
de son cˆot´e lorsque le syst`eme se trouve dans cet ´etat.
Th´eor`eme. Les structures symplectiques attribu´ees par chaque acteur `a l’espace des phases sont
oppos´ees (donc ´egales si l’un a le rˆole d’´emetteur et l’autre de r´ecepteur).
Une structure symplectique est (`a peu de chose pr`es) une application qui `a toute courbe ferm´ee
munie d’un sens de parcours, associe une quantit´e d’action (que nous traduisons par le terme
d’´energie dans notre langage th´eorique), d’une mani`ere lin´eaire (condition que nous ne d´etaillerons
pas; disons seulement que la mˆeme courbe parcourue dans deux sens oppos´es doit donner des
r´esultats oppos´es). A toute courbe ferm´ee de l’espace des phases, donc, chaque acteur associe le
travail total qu’il doit fournir au syst`eme lorsque l’´etat du syst`eme effectue le parcours de cette
courbe (infiniment lentement: l’´etat `a chaque instant est suppos´e ˆetre un ´etat d’´equilibre), en
supposant que cet acteur reprend `a l’arriv´ee la mˆeme disposition qu’il avait au d´epart (ce qui est
possible puisque le syst`eme parcourant une boucle se retrouve `a la fin dans le mˆeme ´etat qu’au
d´epart et donc il ne tient qu’`a l’acteur de se remettre dans le mˆeme ´etat).
Ces deux structures symplectiques sont oppos´ees car le syst`eme est suppos´e ˆetre uniquement
soumis aux actions libres des deux acteurs d’une part, `a des forces issues de potentiels d’autre
part. Quand le syst`eme revient `a sa configuration initiale apr`es avoir fait un tour, donc, le total
des ´energies fournies au syst`eme par toutes les forces est nul `a l’exception du travail fourni par
les deux acteurs. Au bilan, le travail total donn´e par l’un est donc celui re¸cu par l’autre, ce qu’il
fallait d´emontrer.
De cela d´ecoule le
Th´eor`eme de Liouville. Le mouvement de l’espace des phases dans lui-mˆeme qui exprime la loi
d’´evolution d’un syst`eme au cours du temps, pr´eserve le volume.
Comme nous venons de voir qu’il pr´eserve la structure symplectique, il suffit de donner une
d´efinition de la mesure du volume dans l’espace des phases qui d´epend uniquement de cette struc-
ture symplectique. Note: la notion de volume n’a un sens math´ematiquement coh´erent que dans
des vari´et´es de dimension finie. Nous supposons donc que l’espace des phases est de dimension
finie, ce qui est le cas en pratique pour un syst`eme de particules (il y a 6 dimensions par particule),
mais non pour le cas d’un champ.
Dans le cas d’un espace des phases de dimension 2, l’aire d’une surface se d´efinit par la quantit´e
d’action associ´ee `a la courbe fronti`ere de cette surface, une orientation ´etant donn´ee. Dans le cas
g´en´eral (en dimension finie), la d´efinition est plus compliqu´ee mais elle existe; elle consiste en une
simple expression tensorielle dont nous admettons ici l’existence.
42
5. M´ecanique statistique
5.1. Fondements de la m´ecanique statistique.
Il y a deux mani`eres possibles de fonder la m´ecanique statistique: sur la m´ecanique classique
d’une part, sur la m´ecanique quantique d’autre part. Comme la r´ealit´e est quantique et que la
m´ecanique classique en est une approximation ayant un large domaine de validit´e pratique, ainsi
la m´ecanique statistique n’est pas exactement la mˆeme suivant qu’on la fonde de l’une ou l’autre
mani`ere, et c’est celle fond´ee sur la m´ecanique quantique qui d´ecrit plus pr´ecis´ement la r´ealit´e. Cela
n’empˆeche pas de chercher `a la d´ecrire et l’expliquer dans les termes de la m´ecanique classique, ce
qui est une approche valable dans nombre de situations pratiques.
Contrairement `a ce `a quoi on pourrait s’attendre a priori, son fondement sur la physique
classique comporte des difficult´es math´ematiques, notamment des probl`emes de divergence, qui
n’existent pas avec la physique quantique. Ainsi peut-on dire que sous certains aspects, le fonde-
ment sur la physique quantique est plus ais´e pour arriver quasiment aux mˆemes r´esulats. Comme
il correspond mieux `a la r´ealit´e, il est plus satisfaisant.
De quoi s’agit-il ? Nous avons montr´e que la loi d’´evolution au cours du temps en m´ecanique
classique s’exprime par une transformation de l’espace des phases E qui pr´eserve son volume
(th´eor`eme de Liouville).
Le passage `a la physique statistique consiste `a dire qu’on ne connaˆıt plus l’´etat x ∈ E du
syst`eme dans l’espace des phases, mais que cet ´etat est al´eatoire suivant une loi de probabilit´e
bien d´etermin´ee appel´ee l’´etat statistique du syst`eme, qui s’exprime par une densit´e de probabilit´e:
on peut imaginer la densit´e de probabilit´e comme la densit´e d’une substance pr´esente en quantit´e
totale ´egale `a 1, comme une cuill`ere de caf´e dans la marmite de l’espace des phases. La densit´e de
probabilit´e en chaque point est le rapport de la probabilit´e de pr´esence dans un petit voisinage de
ce point sur le volume de ce voisinage.
De l`a on peut d´efinir l’entropie comme une mesure de la dilution de cette probabilit´e:
S = −
_
E
p ln p
moyenne par rapport aux possibilit´es ´el´ementaires de se retrouver en les diff´erents lieux de E (donc
int´egrale suivant p fois l’´el´ement de volume) de la mesure −ln p de cette dilution.
Un des probl`emes que cela pose est le probl`eme de la divergence, notamment du fait que dans
le cas d’un champ classique l’espace des phases est de dimension infinie et donc cela pose des
probl`emes `a la notion d’´el´ement de volume. Concr`etement, si on se d´etourne de la simple manie
de pinaillage d’analyse des math´ematiciens pour adopter les grandes d´emarches d’approximations
ch`eres aux physiciens, il n’en reste pas moins que les divergences en question devraient se retrou-
ver concr`etement dans les cons´equences exp´erimentales de ces hypoth`eses, ce qu’on a appel´e la
“catastrophe ultraviolette”: en consid´erant l’espace des phases de dimension infinie du champ
´electromagn´etique, le rayonnement thermique du corps noir d’une temp´erature donn´ee devrait
avoir une intensit´e tendant vers l’infini au fur et `a mesure qu’on inclut dans le calcul ces dimen-
sions correspondant aux fr´equences de plus en plus ´elev´ees, qui sont autant de voies de rayonnement
suppl´ementaires.
Un autre inconv´enient de cette pr´esentation est qu’elle semblerait indiquer une conservation et
non une augmentation de l’entropie, le mouvement d´epla¸cant les concentrations de probabilit´e et
ne les diluant pas. Ceci peut ˆetre surmont´e sous forme de l’approximation d’un m´elange (r´esultat
de mouvement o` u la concentration demeure mais est dispers´ee un peu partout) par une dilution,
du fait qu’il est pratiquement impossible de r´eeffectuer `a l’inverse ce mouvement assez pr´ecis´ement
pour effectivement d´efaire le m´elange de fa¸con constatable en pratique.
Un autre d´efaut encore de l’approche par la physique classique est qu’elle n’admet pas la
possibilit´e d’une variation du nombre de particules pr´esentes. En effet, la dimension de l’espace
vaut six fois le nombre de particules pr´esentes, donc une cr´eation ou une annihilation de particules
devrait s’exprimer par une transformation pr´eservant le volume d’un espace de phases vers un
autre de dimension diff´erente, ce qui apparaˆıt quelque peu absurde. En effet, si `a la limite on
43
pourrait consid´erer une cr´eation de particules comme plongeant le premier espace en une sous-
vari´et´e du suivant (d´efinie par le point exact o` u la nouvelle particule a ´et´e cr´e´ee), la densit´e de
probabilit´e qui avait une dilution volumique dans le premier n’aurait plus une dilution volumique
dans le second mais une concentration sur une sous-vari´et´e, ce qui donnerait alors `a l’entropie
finale la valeur de moins l’infini (!). Par exemple, si on interpr`ete classiquement la lumi`ere comme
syst`eme de particules et non comme onde, toute ´emission de lumi`ere apparaˆıt comme une cr´eation
de particules.
Par rapport `a cela, que nous dit la physique quantique ? Qu’il y a une limite `a la division
du volume de l’espace des phases (et donc une limite `a la concentration de la probabilit´e). En
effet, dans toute direction de surface de dimension 2 dans l’espace des phases, on a une mesure des
aires donn´ee par la restriction de la structure symplectique `a cette surface. Une aire y ´etant ainsi
homog`ene `a une action, on a comme unit´e de mesure naturelle de cette aire la constante de Planck
¯h. Alors, la possibilit´e de division de cette surface est limit´ee comme ne pouvant pas ˆetre plus fine
qu’un d´ecoupage en cellules d’aire h = 2π¯h chacune (cela se comporte comme tel d´ecoupage bien
que les fronti`eres entre les cellules ne soient pas localisables en termes de la g´eom´etrie usuelle).
Ainsi s’exprime le principe d’incertitude de Heisenberg: l’´etat d’un syst`eme dans l’espace des
phases n’est pas plus pr´ecis´ement d´efini suivant chaque direction de surface, que par la donn´ee de
la cellule qui le contient dans un tel d´ecoupage flou. Par cons´equent, le volume minimal qu’on
peut consid´erer dans un espace des phases de dimension 2k vaut h
k
. En fait, la r´ealit´e qui se cache
derri`ere l’apparence classique d’une portion de l’espace des phases de volume nh
k
, est un espace
de Hilbert de dimension n, et ce qui se cache derri`ere une apparente ´evolution incompressible de
ce volume, est une rotation l’espace de Hilbert.
Alors, nous allons ici d´evelopper la m´ecanique statistique `a partir d’un mod`ele de d´epart
math´ematiquement simple, intuitivement proche de la m´ecanique classique tout en refl´etant assez
bien les propri´et´es essentielles de la r´ealit´e quantique.
Il consiste `a partir d’un ensemble E discret (fini ou d´enombrable) nomm´e “ensemble des ´etats
classiques”. Il s’interpr`ete classiquement comme l’ensemble des cellules de volume h
k
en lesquelles
on aurait d´ecoup´e l’espace des phases, ou quantiquement comme celui des vecteurs d’une base
choisie dans l’espace de Hilbert. Nous oublierons totalement la forme g´eom´etrique de l’espace des
phases, son rapport avec l’espace physique et ses points d’´equilibre au sens exp´erimental classique.
On consid`ere qu’on ne connaˆıt pas la valeur x ∈ E de l’´etat classique du syst`eme mais que cet
´etat est al´eatoire suivant une loi de probabilit´e p bien d´etermin´ee: `a chaque ´etat classique x est
associ´e sa probabilit´e p(x) d’ˆetre r´ealis´e. Cette loi de probabilit´e p est appel´ee l’´etat statistique (ou
thermodynamique) du syst`eme. Un ´etat statistique sur un espace E est donc une application p de
E dans [0, 1] dont la somme des valeurs vaut 1:

x∈E
p(x) = 1.
On passe ainsi de la notion d’´etat classique `a la notion d’´etat statistique en rempla¸cant l’espace
E par l’ensemble des lois de probabilit´e sur E. On passe alors de la notion d’´equilibre classique
`a celle d’´equilibre statistique (ou thermodynamique). Un ´etat d’´equilibre statistique est un ´etat
statistique qui ne varie pas au cours du temps. L’´equilibre statistique n’implique pas l’´equilibre
classique car il ´enonce seulement que la diminition de chaque p(x) par l’´evolution possible de l’´etat
x vers d’autres ´etats sera exactement compens´e par son augmentation due aux ´evolutions des autres
´etats vers x, en sorte que p(x) demeure constant.
Pour pouvoir ´etablir ses propri´et´es, il faut partir d’un postulat physique que nous allons ´enoncer
maintenant. Introduisons d’abord des notations.
Soit un syst`eme S isol´e, d’´etat statistique p
1
sur un espace E `a l’instant t
1
, en ´evolution vers
un espace E

`a l’instant t
2
> t
1
. Pour tous x ∈ E et y ∈ E

, notons p(x, y) la probabilit´e pour que, si
son ´etat est x `a l’instant t
1
, il passe `a y `a l’instant t
2
. On a ´evidemment ∀x ∈ E,

y∈E

p(x, y) = 1,
et cet objet d´etermine la transformation de l’´etat statistique du syst`eme de p
1
`a l’instant t
1
`a p
2
`a l’instant t
2
par la formule
∀y ∈ E

, p
2
(y) =

x
p(x, y)p
1
(x).
44
L’axiome de base dont nous allons partir, s’´enonce alors par la formule :
∀y ∈ E

,

x∈E
p(x, y) ≤ 1
ou bien cette mˆeme formule mais comme une ´egalit´e, en fonction du contexte pour la raison
suivante: fondamentalement, la loi est celle d’une ´egalit´e; mais en pratique, on peut se restreindre
`a l’expression des parties qui interviennent effectivement: E ⊂ E
0
, E

⊂ E
0
avec : ∀x ∈ E
0
, p
1
(x) =
0 ⇒ x ∈ E d’une part, p
2
(x) = 0 ⇒ x ∈ E

d’autre part. Le cas d’une in´egalit´e stricte provient donc
du fait que certains ´etats initiaux dans E
0
sont consid´er´es comme a priori impossibles et exclus de
E `a cause des conditions initiales de l’exp´erience qui ne leur permet pas de se r´ealiser.
Cet axiome se comprend comme reflet du th´eor`eme de Liouville (et il refl`ete ´egalement un
ph´enom`ene correspondant de physique quantique) de la mani`ere suivante: `a t
1
, l’espace des phases
est d´ecoup´e en cellules et l’´etat classique du syst`eme se r´esume `a la cellule dans laquelle il se
trouve. Il n’y a pas d’information plus pr´ecise, la densit´e de probabilit´e dans chaque cellule ´etant
donc “uniforme”. Puis on efface le d´ecoupage et on laisse le syst`eme ´evoluer suivant un mouvement
incompressible de l’espace des phases, jusqu’`a l’instant t
2
o` u on fait un red´ecoupage en de nouvelles
cellules. Ainsi, chaque d´ecoupage en cellules a pour effet d’op´erer un parfait mixage `a l’int´erieur
de chaque cellule, augmentant son entropie comme nous allons voir.
5.2. Loi de Boltzmann
L’´etat d’´equilibre statistique vers lequel tend un syst`eme en contact thermique avec un milieu
ambiant de temp´erature T, s’exprime par la formule
p(x) = e

E(x)−E
0
kT
o` u k est la constante de Boltzmann servant de correspondance entre les ´energies et les temp´eratures,
E(x) est l’´energie de l’´etat x et E
0
est la quantit´e qui sert `a la normalisation :

x
p(x) = 1 ⇔ e

E
0
kT
=

x
e

E(x)
kT
⇔ E
0
= −kT ln
_

x
e

E(x)
kT
_
.
En fait, nous verrons que E
0
est l’´energie libre du syst`eme dans cet ´etat d’´equilibre thermody-
namique.
Dans la suite on fixera la constante de Boltzmann `a k = 1 par d´efinition de l’unit´e de temp´era-
ture.
En voici la d´emonstration, `a partir de notre axiome sous sa forme d’´egalit´e et de l’hypoth`ese
suivant laquelle l’´energie est la seule quantit´e physique qui se conserve dans le cas d’un syst`eme isol´e.
(Remarque: il existe des situations physiques comportant d’autres param`etres qui se conservent,
ce qui aboutit `a des lois d’´equilibre plus compliqu´ees).
D’abord, montrons que la condition d’´equilibre thermique d’un syst`eme isol´e est que p(x) doit
ne d´ependre que de l’´energie E(x). En effet, en se restreignant `a un niveau d’´energie donn´e, la plus
forte probabilit´e finale ne peut exc´eder la plus forte probabilit´e initiale, et de mˆeme la plus faible
ne peut pas diminuer. Si elle demeurait constante, le nombre d’´etats ayant cette mˆeme probabilit´e
diminuerait: il ne peut augmenter et s’il ne diminuait pas, en r´ep´etant le mˆeme raisonnement sur
les ´etats restants menant `a un ´etat final d’´equilibre p, alors cette fonction p serait une quantit´e qui
se conserve, contrairement `a l’hypoth`ese que l’´energie (et donc aussi toute fonction de l’´energie)
est la seule quantit´e qui se conserve.
En tout cas, si les probabilit´es sur un niveau d’´energie sont ´egales `a l’instant t, elles le sont
n´ecessairement aussi `a l’instant t

.
Ensuite, la relation entre les probabilit´es pour des ´energies diff´erentes vient concr`etement de
la possibilit´e d’´echanger cette ´energie avec des parties du milieu ambiant. Soit une particule du
milieu ambiant pouvant se trouver dans un ´etat e d’´energie E
1
avec la probabilit´e p
1
ou dans
un ´etat e

d’´energie E
2
avec la probabilit´e p
2
, et venant interagir avec notre syst`eme S. On
45
suppose que ces probabilit´es p
1
et p
2
ne d´ependent pas de l’´etat de S (on dit que la particule n’est
pas corr´el´ee `a S; l’hypoth`ese sous-jacente est que le milieu ambiant est infiniment plus vaste et
qu’il peut donc ´echanger avec S une quantit´e de chaleur quelconque sans modifier ses propri´et´es
g´en´erales). Comme on l’a suppos´e en ´equilibre thermique avec le milieu ambiant, le syst`eme form´e
de S et de la particule doit ˆetre en ´equilibre thermique, et en particulier deux ´etats de mˆeme
´energie doivent avoir la mˆeme probabilit´e. Donc, quels que soient deux ´etats x et x

de S tels
que E(x

) −E(x) = E(e

) −E(e), les combinaisons d’´etats (x, e

) et (x

, e) ayant la mˆeme ´energie
E(x) +E(e

) = E(x

) +E(e) doivent avoir la mˆeme probabilit´e p(x)p
2
= p(x

)p
1
, autrement dit
p(x

)
p(x)
=
p
2
p
1
.
Donc le rapport des probabilit´es de deux ´etats ne d´epend que de la diff´erence d’´energie entre ces
deux ´etats et est identique au rapport des probabilit´es de deux ´etats d’une particule du milieu
ambiant ayant la mˆeme diff´erence d’´energie. (Au lieu d’une particule on peut prendre un grand
syst`eme, les cons´equences sont les mˆemes). La d´emonstration de la loi de Boltzmann est maintenant
termin´ee.
On peut remarquer la propri´et´e suivante, qui se d´eduit de notre axiome et le g´en´eralise. Soit
un syst`eme S d’´etat statistique p sur un espace E `a l’instant t. On le met en contact thermique
avec un syst`eme ext´erieur S

initialement non corr´el´e `a S et `a l’´equilibre de temp´erature T d´efini
par la loi de Boltzmann. On suppose que S ´evolue vers un espace E

d’´etats possibles `a l’instant
t

> t, tandis que l’ensemble des ´etats possibles de S

reste le mˆeme avec la mˆeme loi d’´energie, et
que le tout est isol´e de l’ext´erieur. Alors on a la formule suivante sur la loi d’´evolution p(x, y) de
S tandis qu’il interagit avec S

:
∀y ∈ E

,

x∈E
p(x, y)e
E(y)−E(x)
T
≤ 1
ou bien la mˆeme formule avec ´egalit´e, pour les mˆemes raisons.
5.3. Energie, ´energie libre
Nous allons calculer l’´energie libre F du syst`eme dans l’´etat thermodynamique p, c’est-`a-
dire l’´energie qu’on peut en extraire par un travail m´ecanique (r´eversible), sans tenir compte des
´echanges de chaleur avec le milieu ambiant `a temp´erature T.
D’abord, d´efinissons l’´energie U d’un ´etat statistique p : c’est la moyenne des ´energies des
´etats particuliers, suivant leur probabilit´e :
U(p) =

x
p(x)E(x).
Ensuite, pour calculer l’´energie libre il faut choisir une r´ef´erence pour laquelle on convient que
cette ´energie est nulle. Admettons pour le moment qu’elle est nulle dans le cas o` u le syst`eme est
en ´equilibre suivant la loi de Boltzmann avec E
0
= 0 (et nous verrons pourquoi cette supposition
est bonne; en attendant, prenons cela comme une d´efinition) : p(x) = e

E(x)
T
. Tout autre ´etat p
peut (tr`es th´eoriquement !) se ramener `a cette situation par le travail “m´ecanique” suivant.
On commence par isoler S thermiquement du milieu ambiant et interdire toute ´evolution
thermique de S. Autrement dit, le d´ecoupage en cellules de l’espace des phases est transport´e par
l’´evolution en sorte qu’elle s’y exprime par p(x, y) = 1 si x = y et 0 sinon. Etant donn´e un ´etat
statistique p fix´e (suppos´e connu, tandis qu’on ne connaˆıt pas l’´etat particulier x du syst`eme),
modifions m´ecaniquement la fonction d’´energie E(x) pour la remplacer par la fonction E

d´efinie
par
E

(x) = −T ln p(x).
A l’arriv´ee, l’´etat p ´etant rest´e le mˆeme, son ´energie libre s’est annul´ee, d’apr`es notre hypoth`ese.
Comme cette transformation est adiabatique (i.e. sans ´echange de chaleur avec l’ext´erieur) et
46
r´eversible, l’´energie libre F(p) du syst`eme au d´epart est ´egale `a l’´energie retir´ee sous forme de
travail lors de cette transformation :
F(p) = U(p) −U

(p) =

x
p(x)(E(x) +T ln p(x)).
On pourrait consid´erer que ce raisonnement n’est pas valable du fait qu’il faudrait travailler avec
l’´energie r´eellement ´echang´ee et non son esp´erance, mais nous allons confirmer plus loin ce r´esultat
par d’autres moyens. D´ej`a, le fait que dans le cas de l’´equilibre de Boltzmann le E
0
co¨ıncide avec
l’´energie libre ainsi d´efinie est imm´ediat (on a tout fait pour).
Ensuite, et c’est l`a le plus int´eressant, voyons comment cette ´energie libre se modifie lorsque
le syst`eme subit une transformation infinit´esimale, dans laquelle les fonctions E(x) et p(x) se
modifient infinit´esimalement de δE(x) et δp(x) respectivement.
L`a encore par d´efinition, la part d’effet direct pour p fix´e de δE(x) sur l’´energie libre F(p), de
mˆeme que sur l’´energie totale U(p), co¨ıncide avec le travail fourni de l’ext´erieur sur le syst`eme,
W =

x
p(x)δE(x).
D’autre part, l’effet de δp, qui apporte `a l’´energie U une quantit´e de chaleur
Q =

x
E(x)δp(x)
modifie F d’une ampleur de

x
δp(x)(E(x) +T ln p(x))
puisque

x
p(x)δ(ln p(x)) =

x
δp(x) = δ(

x
p(x)) = 0.
On remarque alors que la condition pour que les variations de F au premier ordre ci-dessus soient
nulles quel que soit δp (qui v´erifie toujours

x
δp(x) = 0) pour une loi d’´energie E fix´ee, est
que E(x) + T ln p(x) soit ind´ependant de x, donc que p soit d´efini par la loi de Boltzmann de
temp´erature T.
Ainsi, l’´equilibre statistique co¨ıncide avec l’´equilibre de l’´etat p dans l’espace des ´etats statis-
tiques, en prenant en guise d’´energie potentielle l’´energie libre F.
On remarque que cet unique ´etat d’´equilibre est pr´ecis´ement celui o` u l’´energie libre prend sa
valeur minimale.
En effet (en cherchant des p tels que F soit la plus petite possible), on remarque qu’elle ne prend
pas sa valeur minimale en un ´etat statistique qui soit au bord (une valeur limite) de l’ensemble
des ´etats statistiques possibles, c’est-`a-dire en l’occurence un ´etat qui s’annule pour un certain x
(∃x, p(x) = 0). En effet, en s’approchant d’un tel bord, ln p(x) approche −∞ (moins l’infini), donc
δp(x) donne une contribution d’´energie libre importante de signe contraire δp(x)(E(x) +T ln p(x))
ce qui prouve que F augmente lorsqu’on s’approche du bord du domaine. Donc F doit prendre
sa valeur minimale pour une position de p int´erieure `a son domaine (i.e. un p qui ne s’annule
pas) donc une valeur autour de laquelle ses variations sont nulles au premier ordre, ce qu’on vient
d’´etudier.
V´erifions maintenant que l’´energie libre est effectivement la mesure du travail qu’on peut retirer
r´eversiblement d’un syst`eme `a l’´equilibre statistique en l’amenant `a un ´etat pur x
0
(d´efini comme
´etat statistique par p(x
0
) = 1 et p(x) = 0 pour tout autre x) grˆace `a des ´echanges thermiques avec
le milieu ext´erieur de temp´erature T : le proc´ed´e consite `a amener le syst`eme d’un ´etat statistique `a
l’autre en modifiant la loi d’´energie E (et donc lui fournissant un travail) de fa¸con progressive pour
le laisser `a chaque instant rejoindre (par contact avec le milieu ext´erieur) l’´equilibre thermique
des lois d’´energie successives. Alors la part thermique de la variation de l’´energie libre devient
47
d’autant plus n´egligeable, et l’´energie m´ecanique fournie se rapproche d’autant plus du montant
de cette variation que cette ´evolution est progressive (la somme des travaux se rapprochant de
son esp´erance du fait que, plus l’´evolution est progressive, plus le travail se divise en contributions
ind´ependantes, la contribution de chaque instant ´etant al´eatoire d’apr`es la probabilit´e p d’´equilibre
de l’instant consid´er´e sans corr´elation avec les contributions des instants pr´ec´edents).
Il reste la question : au cours d’une transformation quelconque d’un syst`eme, l’´energie libre
F diminue-t-elle ? Comme l’´energie U se conserve pour un syst`eme isol´e, la question se ram`ene `a
celle de la diff´erence entre les deux.
5.4. Entropie.
La formule de l’entropie S d’un ´etat statistique p se d´eduit de celle de l’´energie libre que nous
avons ´etablie, suivant la formule F = U −TS :
S(p) = −

x
p(x) ln p(x)
(`a multiplier par la constante de Boltzmann que nous avons ici fix´ee `a 1). L’entropie d’un syst`eme
form´e de deux sous-syst`emes non corr´el´es (p(x, y) = p
1
(x)p
2
(y)) est la somme des entropies S
1
=
S(p
1
) et S
2
= S(p
2
) de ces sous-syst`emes :
−S(p) =

x,y
p
1
(x)p
2
(y) ln(p
1
(x)p
2
(y)) =

x,y
p
1
(x)p
2
(y) ln(p
1
(x)) +

x,y
p
1
(x)p
2
(y) ln(p
2
(y))
= −(S
1
+S
2
).
Dans le cas de syst`emes corr´el´es, l’entropie du tout S = S(p) est inf´erieure `a la somme des
entropies S
1
et S
2
des ´etats p
1
(x) =

y
p(x, y) et p
2
(y) =

x
p(x, y). En effet, en attribuant
`a ces deux sous-syst`emes les ´energies respectives E
1
(x) = −T ln p
1
(x) et E
2
(y) = −T ln p
2
(y),
on constate que U(p) = U(p

) o` u p

est l’´etat non corr´el´e correspondant p

(x, y) = p
1
(x)p
2
(y);
mais p

´etant l’´etat d’´equilibre statistique de cette ´energie, il poss`ede la plus grande entropie:
F(p

) < F(p) ⇒ S(p) < S(p

) = S
1
+S
2
.
V´erifions maintenant que l’entropie d’un syst`eme isol´e ne peut qu’augmenter au cours du
temps, `a partir de notre axiome.
On a pour une ´evolution de p
1
`a p
2
d’un syst`eme isol´e
−S
1
=

x
p
1
(x) ln p
1
(x) =

x,y
p(x, y)p
1
(x) ln p
1
(x)
−S
2
=

y
p
2
(y) ln p
2
(y)
Or, pour tout y on a

x
p(x, y)p
1
(x) ln p
1
(x) ≥ p
2
(y) ln p
2
(y)
parce que l’application qui `a u associe uln u ´etant convexe, la moyenne pond´er´ee par p(x, y) des
images des p
1
(x) est sup´erieure `a l’image de leur moyenne p
2
(y).
Maintenant que la croissance de l’entropie est ´etablie, on en d´eduit la d´ecroissance de l’´energie
libre d’un syst`eme S lors d’un ´echange thermique avec un milieu S

de temp´erature T ainsi :
L’´energie totale U(S+S

) se conserve, et l’entropie du tout S(S+S

) augmente, donc F(S+S

)
diminue. Les syst`emes S et S

´etant initialement d´ecorr´el´es, F(S +S

) est ´egal `a F(S) +F(S

) au
d´epart mais lui est sup´erieur `a la fin. Comme S

est initialement `a l’´equilibre de temp´erature T,
F(S

) ne peut qu’augmenter. Donc F(S) diminue.
48
6. Introduction `a la physique quantique
6.1. Introduction: une th´eorie en deux parties
La physique quantique est riche en th´eories math´ematiques int´eressantes, en paradoxes aussi.
Ses myst`eres ne sont pas “explicables” par les concepts de m´ecanique classique ordinaires, ni mˆeme
par les principes de r´ealit´e ordinaires. Certains de ses aspects lui sont sp´ecifiques, et d’autres sont
reli´es `a la physique classique qui leur donne son langage et ses concepts.
On peut consid´erer la physique quantique comme une conjonction de deux th´eories aux d´eve-
loppements plus ou moins s´epar´es, suivant la divergence de ses deux axiomes fondateurs com-
mun´ement not´es U et R. Elles sont toutes deux ´etranges et paradoxales et en manque de fonde-
ments clairs, mais pas du tout pour les mˆemes raisons. Il faut pr´eciser que, du moins suivant les
connaissances actuelles, ces deux th´eories sont tr`es ´eloign´ees l’une de l’autre au niveau fondamental,
tandis qu’elles interagissent en permanence au niveau de la physique appliqu´ee.
Les myst`eres de U sont le travail exclusif des physiciens math´ematiciens, et sont d’une bien trop
grande difficult´e technique pour que des non-sp´ecialistes puissent seulement en avoir une id´ee; c’est
uniquement sur cette th´eorie que se portent les recherches en physique des particules. La th´eorie R
par contre, une fois ´enonc´ees ses formules de base, ne laisse que des myst`eres de nature philosophique
(ou m´etaphysique) sans possibilit´e d’´epreuve exp´erimentale, et qui n’int´eressent g´en´eralement plus
les physiciens depuis longtemps.
Rare en son genre, Roger Penrose rˆeve d’unifier U et R comme ´etant deux approximations
d’une th´eorie plus vaste.
La th´eorie U
C’est celle du monde quantique en lui-mˆeme, de ses ondes et de ses particules qui sont une
mˆeme chose, et dont on n’a actuellement pas fini de sonder les profondeurs math´ematiques (sauf
approximations), lesquelles sont tr`es lointaines car cette exploration math´ematique, tout en ´etant
fructueuse, repousse ses fondements extrˆemement loin. On esp`ere en trouver un jour enfin le fond,
notamment avec la th´eorie des supercordes.
Cette th´eorie est enti`erement d´eterministe, de mˆeme que dans une th´eorie probabiliste les
valeurs calcul´ees des probabilit´es sont consid´er´ees comme parfaitement certaines. Le monde de la
th´eorie U est un monde platonicien, et la notion de r´ealit´e factuelle lui est ´etrang`ere. Son temps
est r´eversible, en dehors des propri´et´es de quelques particules exotiques (exception sans rapport
intrins`eque avec le sens de variation de l’entropie).
Elle peut se “construire” de fa¸con plus ou moins magique `a partir de la physique classique
suivant un proc´ed´e nomm´e “quantification”.
Pr´ecisions que ce n’est pas l`a un lien exact et rigoureux, et ne peut pas en ˆetre un, bien que
l’id´ee soit l`a, puisque le monde quantique n’est pas r´eductible au monde classique. Non que le
monde quantique soit diff´erent de ce qui sera d´ecrit ici [partie en projet], mais ce qui sera d´ecrit ici
n’est pas vraiment d´ecrit, car cette description sera vague, ´eludant ses nombreux probl`emes ainsi
que d’autres notions fondamentales de la physique quantique, compl´ementaires de ceux-ci (dont
les th´eories de jauge qui d´ecrivent “les propri´et´es m´ecaniques particuli`eres” des diverses sortes de
particules, cette expression ´etant `a prendre avec beaucoup de guillemets; les pires probl`emes de
divergence ´etant d´ependants de ces propri´et´es particuli`eres, les omettre peut simplifier beaucoup la
pr´esentation). En un mot, elle sera non-math´ematique (normal, ce n’est ici qu’une introduction !).
Non qu’elle soit d´epourvue de math´ematiques, ou que les math´ematiques ne puissent y p´en´etrer, ou
qu’elles n’y jouent pas un rˆole fondamental (bien au contraire !) mais que sa pleine r´eduction `a une
base math´ematique serait extraordinairement ardue et g´en´eralement incompl`ete. La formalisation
d´etaill´ee de la th´eorie pose, en effet, de graves probl`emes. On pourrait exprimer cette situation en
disant que la th´eorie ne repose pas sur un fondement bien solide contenu dans quelques axiomes
clairs et qui expliquerait ou impliquerait tout en d´etail. Mais faute de fondement sur lequel se
reposer, on peut se rep´erer `a l’aide du plafond (la m´ecanique classique qui en est une approximation
et dont les objets sont, eux, clairs).
Ici encore, les id´ees qui seront ´enonc´ees ne sont pas vraiment nouvelles par rapport `a ce qui
est connu, car elles sont sous-jacentes `a tout le formalisme de la th´eorie, mˆeme si en g´en´eral on ne
les trouve pas facilement explicit´ees ainsi dans les cours sur le sujet.
49
La restriction de l’´etude de la physique quantique `a des ph´enom`enes non-relativistes (aux
vitesses faibles devant celle de la lumi`ere) est le bon moyen couramment employ´e pour limiter dans
une premi`ere ´etape la profondeur de la th´eorie, ce mod`ele approch´e ´etant enti`erement r´eductible
`a un syst`eme axiomatique sans trop de difficult´e. Cette premi`ere approche axiomatique claire
et maˆıtrisable de la physique quantique, appel´ee “m´ecanique quantique de base” ou “premi`ere
quantification”, est suffisante dans beaucoup de situations.
Mais nous n’allons pas proc´eder ainsi car notre but ne sera pas de r´esoudre des probl`emes
standardis´es mais de donner un panorama plus large et qualitatif de la situation, en montrant au
maximum le sens et l’´el´egance des choses, quitte `a amener plus de questions que de r´eponses.
Voici donc le proc´ed´e de quantification qui passe de la m´ecanique classique `a la m´ecanique
quantique: il est semblable `a la construction de l’´equilibre statistique comme fond´e sur la m´ecanique
classique, mais appliqu´e au niveau de la repr´esentation th´eorique `a l’espace de configuration des
sc´enarios non soumis au principe de moindre action dans l’espace pseudo-euclidien. (On prend
l’espace de configuration au lieu de l’espace des phases: la diff´erence ne consiste qu’en le fait que
l’espace de phase y ajoute la donn´ee des impulsions, li´ee au rapport `a un temps qui n’existe plus et
qui n’a en fait de toute mani`ere pas d’influence sur le reste de l’´equilibre statistique). Le rˆole de la
temp´erature est jou´e par la constante de Planck et l’action correspond finalement `a une quantit´e
imaginaire d’´energie: la loi de Boltzmann e

E
kT
devient e
i
A
¯ h
o` u A est l’action (normalement l’action
est not´ee S mais nous avons d´ej`a trop us´e la lettre S).
Dans cette analogie, `a la fonction probabilit´e correspond la fonction amplitude qui n’est plus
une probabilit´e, puisqu’elle peut prendre des valeurs n´egatives voire complexes, que sa somme n’est
plus contrainte `a valoir 1, et qu’elle ne sera pas la probabilit´e qui interviendra concr`etement.
La th´eorie R
C’est celle qui traite du probl`eme du lien `a l’exp´erience avec sa r´ealit´e factuelle, ses mesures, son
hasard, son rˆole de l’observateur. Ses fondements math´ematiques sont parfaitement d´efinis et sans
myst`ere, permettant de calculer les probabilit´es exp´erimentales en fonction pr´ecise des r´esultats de
la th´eorie U. En fait, c’est cette th´eorie R elle-mˆeme qui est la m´ecanique statistique quantique
que nous avons ´evoqu´e. Son ´ecriture en fonction de U n’est affect´ee que de fa¸con superficielle par
la grande reformulation que traverse U quand il passe de la m´ecanique quantique de base `a son
expression relativiste.
Le probl`eme est qu’elle arrive sur la th´eorie U sans y ˆetre invit´ee; elle constitue une rupture
par rapport `a l’´evolution gouvern´ee par U, que U est par nature incapable de produire lui-mˆeme
(quelle que soit la complexit´e de l’environnement qu’on pourrait prendre en compte). De plus,
aucune r`egle ne semble pouvoir indiquer quand ni comment elle intervient. Mais elle intervient
d’une telle mani`ere que la question des param`etres particuliers de son intervention, n’ayant (jusqu’`a
pr´esent du moins) aucune influence mesurable sur les ph´enom`enes, ne se pose finalement pas : elle
intervient comme si elle n’intervenait pas. Elle est issue de nulle part et elle est introuvable (sans
qu’il y ait pour autant la moindre ambigu¨ıt´e pratique sur les r´esultats de ses pr´edictions). De
la mani`ere la plus remarquablement subtile (et facilement d´emontrable), elle est r´einterpr´etable
comme fondue `a l’int´erieur de la th´eorie U jusqu’au dernier moment : tant que ce sont les appareils
de mesure qui observent, on peut interpr´eter ces appareils de mesure comme n’ayant pas d´eclench´e
R mais comme ´etant de simples objets quantiques d´etermin´es par U, et comme si seuls les humains
(ou plus g´en´eralement les organismes vivants) avaient le pouvoir de la faire intervenir, ce qui d’ici
l`a r´esoud le probl`eme de son intervention comme n’ayant pas eu lieu.
D’un autre cˆot´e, d`es qu’un syst`eme un tant soit peu complexe et thermiquement agit´e comme
un organisme vivant ou mˆeme un simple appareil de mesure entre dans le coup, son agitation
thermique engendre (conform´ement `a U) un ph´enom`ene statistique de perte de contrˆole de certains
param`etres du syst`eme nomm´e d´ecoh´erence, tel qu’il ne reste plus aucune chance pour que la
diff´erence entre l’hypoth`ese de la non-intervention de R ou de son intervention d’une mani`ere
correspondant pr´ecis´ement au type d’observation effectu´ee, puisse encore finalement jouer quelque
rˆole observable que ce soit. Cette sorte d’intervention virtuelle donne ainsi en pratique le droit
d’interpr´eter R comme ayant eu lieu.
Mais, alors qu’au niveau microscopique (fondamental) l’intervention de R passe pour inexis-
50
tente ou virtuelle, son existence r´eelle globale est quasiment incontestable : c’est elle qui, une fois
pour toutes, fixe `a partir de rien l’orientation du temps thermodynamique (celui de la croissance
de l’entropie, ´equivalent au choix de l’ordre de causalit´e temporel) et qui fait se r´ealiser un seul
des avenirs possibles suivant les probabilit´es donn´ees par les calculs lorsque ce que la th´eorie U
d´etermine est en fait une combinaison d’avenirs ne se ressemblant pas du point de vue de ce qui
est observ´e subjectivement `a l’observateur (par exemple dans la fameuse exp´erience du chat de
Schr¨odinger, une combinaison (chat mort)+(chat vivant)). (A la rigueur on n’en a pas de preuve,
on pourrait supposer qu’ils se r´ealisent tous conform´ement `a U dans des univers parall`eles qui `a
cause de la d´ecoh´erence perdent toute relation entre eux).
Et en fait, la situation est encore pire que cela. Cette th´eorie R ne fait pas que laisser par-
fois un intervalle de temps et de circonstances possibles pour son intervention, entre lesquelles on
ignorerait quelle hypoth`ese d’intervention serait la vraie. Elle va jusqu’`a d´emontrer, si on admet
quelques principes physiques difficilement contestables, qu’aucune des hypoth`ese “raisonnables” de
loi g´en´erale pouvant d´eterminer les circonstances particuli`eres de son intervention dans l’intervalle
des possibilit´es, ne peut finalement tenir la route, cet intervalle de possibilit´es ´etant finalement
r´eduit `a l’ensemble vide d’apr`es ces principes sans qu’on puisse pour autant la prendre au pi`ege de
ses contradictions. Voil`a ce que nous montrera le paradoxe EPR : non seulement on ne sait pas
comment s’effectue l’intervention de R, mais en plus, alors que les pr´edictions exp´erimentales de
la th´eorie demeurent parfaitement coh´erentes et sans ambig¨ uit´e, le raisonnement montre qu’aucun
sc´enario particulier d’intervention de R ne peut ˆetre consid´er´e comme “le vrai” sans rompre arbi-
trairement une sym´etrie du probl`eme qu’aucune exp´erience ne vient mettre en doute par ailleurs.
Aucun, sauf l’impensable interpr´etation en univers parall`eles (suivant laquelle R n’a jamais lieu et
le chat de Schr¨odinger demeure dans la superposition mort+vivant), toujours en coh´erence avec
toutes les interpr´etations g´eocentriformes particuli`eres.
6.2. Le paradoxe EPR
C’est l’un des paradoxes les plus ´etranges de la physique quantique (th´eorie R), qui, au-del`a de
la simple dualit´e onde/particule ou du principe d’incertitude, exprime assez nettement le probl`eme
que cette physique pose au r´ealisme classique. Et il semble que sa signification pr´ecise n’ait pas ´et´e
toujours vulgaris´ee tr`es parfaitement : on trouve souvent l’affirmation d’une influence instantan´ee
d’une particule sur l’autre, comme si cette influence ´etait r´eelle. D’o` u pr´etexte pour dire que la
th´eorie de la relativit´e restreinte, qui entraˆıne l’impossibilit´e d’une relation de cause `a effet propag´ee
plus vite que c, serait fausse. Or, dans ce ph´enom`ene quantique il n’y a rien, ni th´eoriquement
ni exp´erimentalement, qui permette de situer effectivement dans l’espace-temps quelque influence
que ce soit plus rapide que c. Seul le r´ealisme classique peut nous y conduire, en d´eposant l`a son
´echec qu’il n’a pas voulu avouer ailleurs.
Et pour mieux cerner sa signification, nous nous concentrerons ici sur l’´enonc´e exact des pr´e-
dictions exp´erimentales de la th´eorie quantique dans les purs termes des cons´equences observables
de R oubliant tous ses liens avec U par lesquels ces r´esultats se d´emontrent habituellement, en sorte
de ne pas confondre les myst`eres de la r´ealit´e avec les interm´ediaires de calcul. Ces pr´edictions
auraient ´et´e v´erif´ees exp´erimentalement d’apr`es les nouvelles de ces derni`eres ann´ees. (Mais je ne
m’int´eresse pas pr´ecis´ement aux d´etails exp´erimentaux du probl`eme, et le but de cette page est
uniquement d’en pr´esenter ses aspects th´eoriques.)
Quelles particules utiliser ?
L’exp´erience a ´et´e faite avec des photons corr´el´es. D’o` u l’erreur classique de certaines personnes
n’ayant pas de connaissances solides en physique, de supposer que ce ph´enom`ene de corr´elation
s’expliquerait par le fait que la dur´ee du voyage d’un photon est pour lui-mˆeme toujours nulle, ce
qui pr´eserverait un lien de causalit´e r´eciproque de ces photons sur leur origine commune. Ceci est
faux, la vitesse de la lumi`ere n’ayant rien `a faire avec tout cela : le ph´enom`ene est en principe
ind´ependant du type de particule utilis´e et de leurs vitesses.
A ceux qui font cette erreur, je conseille de s’efforcer de mieux comprendre ce que dit la
relativit´e restreinte `a ce sujet : la mesure des dur´ees est une chose, mais l’ordre de causalit´e
temporel en est une tout autre. Entre deux ´ev`enements distincts reli´es par une droite de direction
de lumi`ere, bien que l’´ecart en mesure de temps soit nul, l’ordre temporel n’a lieu que dans un seul
51
sens. Ce qui peut influencer un ´ev`enement se trouve dans son cˆone de lum`ere pass´ee (int´erieur et
fronti`ere), tandis que les points de son cˆone de lumi`ere future ou de l’hyperplan t = 0 en sont bien
loin.
La mˆeme exp´erience peut se concevoir avec des ´electrons, sauf que dans ce cas elle devient
beaucoup plus difficile `a r´ealiser techniquement. Voici pourquoi : la r´eussite de l’exp´erience suppose
que la particule (ou plus pr´ecis´ement le param`etre qui nous int´eresse dans la particule, ici le spin
de l’´electron) n’a subi aucune interaction thermique avec son environnement, qui ferait perdre en
la dispersant dans la nature cette information sur le spin qu’on veut ´etudier.
Or, l’´electron pr´esente un risque d’interaction avec l’environnement beaucoup plus fort que le
photon, parce qu’il interagit avec les photons (le champ ´el´ectromagn´etique) tandis que le photon
n’interagit qu’avec des charges ´electriques, or il est beaucoup plus difficile de vider l’espace de ses
photons que de le vider de ses charges : le rayonnement thermique, qu’on pourrait d’ailleurs appeler
“l’agitation thermique du champ ´electromagn´etique”, est en g´en´eral relativement important, et il
a d’autant plus le temps de perturber un des ´electrons avant qu’ils ne parviennent `a la distance
voulue l’un de l’autre, que leur vitesse est faible devant celle de la lumi`ere. Donc probablement le
seul moyen de faire le vide de rayonnement serait de r´efrig´erer les parois pr`es du z´ero absolu.
Cependant nous d´ecrirons cette exp´erience dans le cas d’´electrons, pour des motifs th´eoriques :
1) Dans le fond, “`a ´equivalence math´ematique pr`es”, cela ne change rien : toute exp´erience
(et les paradoxes qui en d´ecoulent) avec le spin d’un ´electron est exactement traduisible en une
exp´erience avec la polarisation d’un photon et inversement. Cette ´equivalence vient du fait que le
nombre d’´etats quantiques possibles du spin de chaque particule (ce qui d´esigne la dimension de
son espace de Hilbert) est le mˆeme, `a savoir 2 (il en faut au moins 2 pour qu’il se passe quelque
chose, `a partir de 3 ce serait plus compliqu´e).
2) Entre ces deux cas, c’est le cas de l’´electron, et uniquement lui, qui manifeste dans la
g´eom´etrie de l’espace physique la forme des sym´etries internes du probl`eme quantique consid´er´e,
ou si on pr´ef`ere celle de ses manifestations exp´erimentales. Ces propri´et´es g´eom´etriques sont
remarquables (son rapport `a U s’exprime par la th´eorie des spineurs), plus que dans la description
de la polarisation du photon.
3) Par la mˆeme occasion, le r´ecit de cette exp´erience permettra de se familiariser avec les
propri´et´es du spin de l’´electron et la notion de doublet d’´electrons qu’on rencontre en chimie.
Nous allons donc maintenant entrer dans quelques manifestations de la th´eorie R. N’oublions
pas qu’il n’existe aucune s´eparation qu’on puisse faire entre cette th´eorie et la m´ecanique statis-
tique. Les vecteurs que nous emploierons seront uniquement des vecteurs de l’espace euclidien `a 3
dimensions, un r´ef´erentiel galil´een ´etant fix´e une fois pour toutes.
Mesure du spin d’un ´electron
Prenons d’abord le cas d’un seul ´electron. C’est une particule de spin
1
2
. Que repr´esente son
spin ? Dans le langage de la physique classique, c’est son moment cin´etique de rotation sur lui-
mˆeme. C’est bien l`a l’objet quantique qui se conserve dans U et qui, dans la correspondance entre
physique classique et physique quantique, traduit la notion de moment cin´etique qui se conserve.
Or, du point de vue de la physique classique, en choisissant conventionnellement une orientation
de l’espace, on peut repr´esenter ce moment cin´etique par un vecteur σ. Comme un moment
cin´etique est homog`ene `a une action, c’est donc ¯h lui servira d’unit´e de mesure de la norme de σ
en physique quantique, et la propri´et´e de spin
1
2
signifie que “classiquement”, ||σ|| =
1
2
.
Mais, du point de vue quantique, il n’y a que deux ´etats possibles du spin d’un ´electron ,
pouvant donner un seul bit d’information : ce spin vaut un tel vecteur de norme
1
2
, ou bien son
oppos´e. Et pas un autre vecteur. Il est orient´e dans un sens, mais il n’a pas de direction. S’il avait
une direction, cette direction serait une propri´et´e du spin de l’´electron plus riche que cette seule
alternative `a deux possibilit´es : ce serait un param`etre port´e par l’´electron pouvant varier con-
tinument, en prenant une infinit´e de valeurs diff´erentes au passage. Mais une telle diversit´e d’´etats
n’existe pas. (On peut voir avec la t´el´eportation quantique qu’en un certain sens, l’information sur
l’´etat de spin de l’´electron peut ˆetre classiquement contenue dans deux bits d’information, soit un
´etat parmi quatre possibles.)
52
Alors, comment se manifeste le sens du spin de l’´electron, sans qu’il ait une direction ? C’est
l’exp´erimentateur qui, pour observer ce sens, est libre d’en d´ecider la direction comme il veut. Il
choisit une droite, ou ce qui revient au mˆeme une paire de vecteurs oppos´es {σ, −σ} de norme
1
2
, de
mani`ere sym´etrique : il ne propose pas un vecteur puis son oppos´e, mais les deux en mˆeme temps
pour n’en privil´egier aucun a priori. Son exp´erience consiste `a demander `a l’´electron : “Autour
de cette droite, dans quel sens tournes-tu ?” (Ou pour le dire plus rigoureusement, il lui demande
non le vecteur moment cin´etique mais sa composante suivant la direction donn´ee, sans s’occuper
des autres composantes). Alors, n´ecessairement, sans l’ombre d’une h´esitation ni quelque autre
humeur que ce soit, celui-ci donnera sa r´eponse, qui sera l’un des deux vecteurs σ et −σ (en fait,
l’une des deux valeurs ±
1
2
de cette composante). Mais alors, comment cette r´eponse d´epend-elle
de la direction choisie ?
Voici ce que dit la th´eorie dans le cas d’un ´electron dans un ´etat spatial pr´ecis, c’est-`a-dire une
disposition de la fonction d’onde dans l’espace physique, qui englobe l’information en positions et
impulsions de cet ´electron (ceci afin d’´eviter toute question de corr´elation entre l’´etat spatial et
l’´etat de spin):
1) Pour tout ´electron d’´etat spatial donn´e issu d’un processus dont les conditions initiales
seraient enti`erement connues en un certain sens (`a savoir qu’il n’existe aucune influence ext´erieure
qui aurait pu ˆetre analys´ee et qui ne l’a pas ´et´e; `a ce titre, un ´etat statistique est consid´er´e comme
enti`erement connu), il existe un vecteur σ de norme ||σ|| ≤
1
2
qui r´esume l’influence mesurable de
ces conditions sur le spin de l’´electron consid´er´e s´epar´ement du contexte de l’exp´erience, au sens de
la r`egle suivante: quel que soit le vecteur unitaire u, si l’exp´erimentateur d´ecide alors de mesurer
le spin suivant la direction de u, la probabilit´e d’obtenir
u
2
sera ´egale `a
1
2
+σ · u. Ce vecteur σ est
alors appel´e le spin de l’´electron produit par ce processus.
On remarque que cet ´enonc´e est coh´erent avec la possibilit´e de d´ecider au hasard du processus
qui produira le spin: le processus qui consiste `a d´ecider suivant une probabilit´e p de faire appel `a un
processus produisant le spin σ et suivant la probabilit´e 1−p de faire appel `a un autre processus qui
produit le spin σ

, n’est finalement rien d’autre qu’un processus produisant le spin pσ + (1 −p)σ

.
2) Quelle qu’ait pu ˆetre la situation auparavant, si on mesure le spin d’un ´electron suivant la
paire {σ, −σ}, apr`es la mesure le spin de l’´electron au sens du 1) sera ´egal au r´esultat trouv´e par la
mesure (cette mesure d´etruit donc enti`erement toute autre information qui a pu exister auparavant
dans ce spin).
Ainsi, une fois obtenu le r´esultat d’une mesure, par exemple
1
2
u, si on lui pose `a nouveau
exactement la mˆeme question (suivant la mˆeme direction u), il donnera n´ecessairement la mˆeme
r´eponse
1
2
u, Par contre, si on lui pose ensuite la question de sa direction par rapport `a un autre
vecteur unitaire v, il r´epondra par une nouvelle valeur de σ = ±
1
2
v suivant la probabilit´e ´egale `a
(
1
2
+σ· u). Si apr`es cela on lui redemande sa direction suivant u, il aura oubli´e sa premi`ere r´eponse,
mais sa nouvelle r´eponse d´ependra uniquement de la derni`ere qu’il avait donn´ee, suivant la mˆeme
loi de probabilit´e.
Pr´eparation de la paire corr´el´ee
On part d’un doublet d’´electrons. C’est un ensemble de deux ´electrons qui sont dans un mˆeme
´etat spatial, mais “dans des ´etats de spin oppos´es” au sens de ce que nous allons d´ecrire. Pour
l’obtenir, il suffit de les contraindre `a se mettre dans le mˆeme ´etat spatial, car le principe d’exclusion
de Pauli les empˆeche d’ˆetre `a la fois dans le mˆeme ´etat spatial et le mˆeme ´etat de spin (ou pour le
voir autrement, il implique que deux ´electrons de mˆeme ´etat spatial sont de spin oppos´es). (En fait,
le principe d’exclusion de Pauli et le principe d’incertitude de heisenberg ne se pas des principes
mais des cons´equences d’autres lois).
Enfin, cela n’est pas parfaitement exact : ils sont bien dans des ´etats de spin oppos´es mais
leurs ´etats spatiaux ne sont pas identiques mais seulement assez proches (c’est-`a-dire que les prob-
abilit´es de r´esultats de toute mesure de cet ´etat spatial sur les deux ´electrons sont des probabilit´es
voisines l’une de l’autre et de faible corr´elation. . . en les distinguant l’un de l’autre suivant leur spin
bien entendu), `a cause de la r´epulsion ´electrostatique qui empˆeche cette identit´e d’ˆetre parfaite.
Na¨ıvement, on pourrait penser que cette r´epulsion entre les ´electrons les empˆeche de se rencontrer,
et rend ainsi superflu le principe d’exclusion de Pauli. Ce n’est pas vrai, `a cause d’un ph´enom`ene
53
ondulatoire quantique qui se manifeste par ce qu’on appelle l’effet tunnel : alors qu’il faudrait
classiquement une ´energie infinie pour que des charges ponctuelles de mˆeme signe se rencontrent,
en m´ecanique quantique la densit´e de probabilit´e du syst`eme dans l’espace de configuration d’un
doublet ne tend pas vers 0 lorsque la distance r entre eux tend vers 0.
Pour que le principe d’exclusion de Pauli puisse se mettre en œuvre, il faut le rendre dominant
sur la r´epulsion ´electrostatique. Dans le cas d’une paire d’´electrons seuls mobiles dans un environ-
nement fixe, le seul moyen est de r´eduire leur ´etalement spatial ∆x. En effet, l’´energie de r´epulsion
´electrostatique est proportionnelle `a
1
r
tandis que l’´energie de r´epulsion due au principe d’exclusion
se lit sur le principe d’incertitude de Heisenberg avec r ≈ ∆x : l’impulsion p est de l’ordre de
¯ h
∆x
et l’´energie cin´etique d’une particule d’impulsion p et de masse m vaut
p
2
2m
, soit une ´energie de
l’ordre de
¯ h
2
mr
2
. Pour des distances assez faibles, il domine donc sur la r´epulsion ´electrostatique.
En pratique on n’a pas besoin que le principe d’exclusion devienne infiniment plus grand que
la r´epulsion ´electrostatique : si les ´electrons sont confin´es dans un espace r´eduit, la d´ecomposition
en ´etats distincts suivant les niveaux d’´energie donne d’une part des doublets (o` u les spins sont
exactement oppos´es mˆeme si les ´etats spatiaux peuvent ˆetre tr`es diff´erents), et d’autre part des
´etats o` u les spins des deux ´electrons s’ajoutent en un certain sens. Le plus bas niveau d’´energie des
doublets est plus bas que celui des paires d’´electrons o` u les spins s’ajoutent; il suffit donc de laisser
le syst`eme perdre son ´energie pour obtenir un doublet. En fait, ce n’est pas exactement vrai `a
une distance encore plus petite `a cause du moment magn´etique de l’´electron qui vient perturber ce
ph´enom`ene par l’interaction entre les spins des deux ´electrons, mais c’est une bonne approximation.
En particulier dans le cas de l’atome d’h´elium, le puits de potentiel dˆ u au noyau a cet effet de
confiner les ´electrons dans un mˆeme ´etat spatial, cr´eant un doublet.
Maintenant qu’on a le doublet, il faut s´eparer les ´electrons. Bon, ici ce n’est pas pratique,
mais imaginons qu’on arrive `a virer le noyau sans influer sur le spin (en le bombardant par un
neutron de haute ´energie par exemple, ou encore en appliquant un fort champ ´electrique qui envoie
les ´electrons dans un sens et le noyau dans l’autre sens; bien sˆ ur on parle ici de th´eorie et non de
la m´ethode la plus pratique pour tester EPR).
Voil`a donc nos deux ´electrons du doublet subitement libres de s’´eloigner l’un de l’autre. Main-
tenant, on veut qu’ils se retrouvent dans deux boˆıtes distinctes qu’on ´eloignera ensuite l’une de
l’autre, un ´electron dans chaque boˆıte (les boˆıtes sont elles aussi tr`es th´eoriques, pour supposer
qu’elles puissent contenir et transporter chacune un ´electron sans perturber son spin). Comment
peut-on faire ? Il ne faut surtout pas trier les ´electrons d’apr`es leur spin, il n’y aurait plus d’effet
EPR. Il faut que jusqu’au dernier moment, aucune mesure ou autre influence ext´erieure ne vienne
interagir avec leur spin.
Il faut les trier d’apr`es leur position spatiale. Pour cela, on peut par exemple disposer une
boˆıte de chaque cˆot´e, attendre que les ´electrons puissent venir dedans, fermer les boˆıtes et compter
s’il y a bien, oui ou non, exactement un ´electron dans chaque boˆıte. Sinon, on recommence (avec
un autre doublet, ou bien en rouvrant les boˆıtes pour laisser une seconde chance `a notre doublet),
jusqu’`a ce que cette condition voulue se r´ealise.
Maintenant, ¸ca y est, notre paire EPR est prˆete.
Mesure des spins d’une paire EPR d’´electrons
Nous avons maintenant deux exp´erimentateurs avec chacun son ´electron dans une boˆıte, les
deux ´electrons ´etant issus d’un mˆeme doublet. Et chacun peut, quand il veut, mesurer le spin de
son ´electron dans la direction qu’il veut.
Quels sont alors les probabilit´es de r´esultats ? La th´eorie ´enonce `a ce sujet les pr´edictions
suivantes :
Proposition 1. Le premier qui mesure le spin, quelle que soit la direction choisie, obtient in-
diff´eremment l’un ou l’autre r´esultat suivant la probabilit´e
1
2
chacun, autrement dit son spin est
nul avant la mesure au sens que nous avons ´enonc´e. Notons σ le r´esultat de la mesure. Alors ce
r´esultat fait connaˆıtre l’autre ´electron comme ´etant de spin oppos´e: si l’autre observateur mesure
le spin de son ´electron par rapport `a un autre vecteur v, alors la connaissance du premier r´esultat
permet d’estimer la probabilit´e d’obtenir
1
2
v pour le deuxi`eme `a la hauteur de (
1
2
−σ · v).
54
Proposition 2. Si les deux exp´erimentateurs mesurent chacun leur spin de mani`ere ind´ependante,
suivant des directions librement choisies au dernier moment par eux (peu importe comment), alors,
le choix de leurs directions de mesure ´etant donn´e, la probabilit´e que le couple des r´eponses soit
un certain (σ, σ

) est ´egale `a (
1
4
−σ · σ

).
Proposition 3. Comme on le voit, les propositions 1 et 2 ne sont que des formulations ´equivalentes
d’un mˆeme r´esultat, interpr´et´e suivant des points de vue diff´erents.
Consistance du ph´enom`ene d’un point de vue quantique.
D’une mani`ere g´en´erale (quels que soient les syst`emes consid´er´es avec un plus grand nombre
d’´etats), le r´esultat de mesures successives ne peut diff´erer du cas de mesures ind´ependantes que
dans la situation o` u une mesure viendrait affecter l’autre partie du syst`eme par une interaction
mat´erielle (quelle qu’en soit la forme, champ ´electromagn´etique ou autre). Or, conform´ement `a la
relativit´e restreinte, une telle influence ne se produire d’une mesure sur l’autre que suivant l’ordre
temporel entre ces deux ´ev`enements, autrement dit pas plus vite que la lumi`ere. Si l’intervalle entre
les mesures est de type espace, ces mesures sont ind´ependantes.
Chaque observateur peut interpr´eter le ph´enom`ene en disant que les mesures ont lieu dans
l’ordre o` u il les observe, c’est-`a-dire l’ordre dans lequel il en re¸coit l’information par des signaux
lumineux. Donc dans le cas EPR, si les deux mesures sont ind´ependantes (s´epar´ees par un intervalle
de type espace), chacun des exp´erimentateurs peut consid´erer que c’est lui qui effectue la premi`ere
mesure qui a une chance sur deux de donner l’un ou l’autre r´esultat. Ce r´esultat obtenu, il peut
alors consid´erer (les chances ult´erieures de r´esultats sur) l’autre ´electron ´eloign´e exactement comme
s’il l’avait d´ej`a mesur´e suivant la mˆeme direction et qu’il en avait obtenu le r´esultat oppos´e. En un
certain sens, on pourrait dire que c’est le mˆeme ´electron dont la ligne d’univers va d’une mesure
`a l’autre en passant par le doublet initial. (Ceci ne remet nullement en question l’orientation du
temps : les lignes d’univers des particules sont d´ecrites par la th´eorie U qui ignore l’ordre temporel
en tant qu’ordre de causalit´e.)
Le lien qui existe dans la loi de probabilit´e entre les r´esultats de mesures, n’est pas une
interaction mais une corr´elation quantique, qui ´etend la notion classique de corr´elation entre deux
parties d’un syst`eme (que nous avions d´efinie en m´ecanique statistique: une loi de probabilit´e
p(x, y) qui n’est pas de la forme p
1
(x)p
2
(y)). En effet, quelle que soit la situation, toute identit´e
alg´ebrique entre probabilit´es valable dans le cas des corr´elations classiques est ´egalement valable
dans le cas de corr´elations quantiques, et les seules propri´et´es qui peuvent ˆetre mises en d´efaut
sont des in´egalit´es sur ces probabilit´es. La corr´elation quantique ne fait que prolonger l’espace
des corr´elations classiques, utilisant les mˆemes param`etres et leur permettant simplement d’aller
“un peu plus loin” sur la mˆeme lanc´ee. On sait bien qu’une corr´elation classique n’a absolument
aucune chance de transmettre quelque information que ce soit, ne faisant qu’exprimer un hasard qui
s’´etait d´ej`a produit avant que les sous-syst`emes ne soient s´epar´es. En allant un peu plus loin dans
la corr´elation, on ne fait que multiplier par quelque chose une interaction instantan´ee `a distance
qui ´etait nulle, ce qui donne toujours une interaction nulle.
Un syst`eme statistique classiquement corr´el´e devrait avoir une entropie d’au moins ln 2 pour
pouvoir pr´esenter un spin nul `a la premi`ere mesure, jusqu’`a la valeur maximale de 2 ln 2 correspon-
dant au cas d’un syst`eme non corr´el´e. Par contre, l’entropie d’une paire EPR d’´electrons reste
nulle tant qu’aucune mesure de spins n’est effectu´ee.
Pr´ecis´ement, d’apr`es la th´eorie quantique, les paires d’´electrons suivantes sont dans le mˆeme
´etat concernant le spin pour des ´etats spatiaux donn´es “dans deux boˆıtes” (c’est-`a-dire que quel
que soit le type d’exp´erience qu’on puisse concevoir `a partir d’une paire d’´electrons, les lois de
probabilit´es sur les r´esultats observables seront toujours identiques d’une paire `a l’autre):
– D’une part, une paire d’´electrons founis par un processus ayant secr`etement tir´e au sort un
vecteur u uniform´ement sur la sph`ere, puis fourni une paire d’´electrons mesur´es comme ´etant de
spins respectifs
1
2
u et −
1
2
u (l’information sur ce vecteur ´etant ensuite oubli´ee).
– D’autre part, une paire d’´electrons founis par un processus ayant secr`etement tir´e au sort le
choix entre donner une paire EPR (issue d’un doublet) suivant la probabilit´e
1
3
, ou donner une paire
d’´electrons de spins compl`etement al´eatoires (spins nuls et ind´ependants) suivant la probabilit´e
2
3
.
Plus g´en´eralement, des th´eor`emes similaires peuvent se d´emontrer pour tout syst`eme quantique
55
corr´el´e, quels que soient le nombre de parties du syst`eme et la forme (nombre d’´etats quantiques
possibles suppos´e fini) de chaque partie.
´
Echec de l’interpr´etation classique
Classiquement, on serait tent´es de faire le raisonnement suivant pour deux mesures ind´epen-
dantes.
Chaque exp´erimentateur, une fois sa mesure effectu´ee, peut pr´edire le r´esultat de l’autre d’une
mani`ere probabiliste, et mˆeme certaine si les directions des mesures sont identiques. Et comme
aucune des deux mesures ne peut r´eellement affecter l’autre, il peut consid´erer que le r´esultat
de l’autre est d´etermin´e d’avance quoi qu’il fasse. Du moins, c’est ce qui vient `a l’esprit quand
on consid`ere le cas o` u les mesures se font suivant la mˆeme direction. Or, chacun peut choisir
sa direction au dernier moment sans que cela ait la moindre cons´equence sur (les probabilit´es de
mesure de) l’autre particule. Donc, puisque c’est vrai quand les directions sont les mˆemes et qu’un
choix de direction n’a aucune influence `a distance sur l’autre ´electron, cela doit ˆetre vrai de mani`ere
g´en´erale.
Ainsi, les chances des r´esultats qu’on peut obtenir suivant les directions choisies sont d´etermi-
n´ees avant sa mesure. On peut alors compendre les propositions sur les probabilit´es de mesure en
disant que sur l’ensemble des chances initiales du syst`eme, une moiti´e M sont des chances d’obtenir
un vecteur σ si on mesure dans cette direction, et d’autre part une moiti´e M

´egalement sont des
chances d’obtenir pour l’autre ´electron un vecteur σ

si on le mesure dans cette autre direction.
Quand on compare M `a M

, une proportion de (
1
2
− 2 σ · σ

) de chances issues de M se
retrouvent dans M

(ce sont les chances dans M ∩M

), et les autres qui auraient donn´e le r´esultat
oppos´e (celles de M −M

) sont remplac´ees dans M

par un autre ensemble (M

−M) de chances
issues du compl´ementaire de M.
D’autre part, si au lieu de cela on effectue la deuxi`eme mesure suivant une autre direction,
le mˆeme raisonnement s’applique avec un ensemble M

de chances d’obtenir un vecteur σ

. Et
on est alors amen´es `a penser qu’entre une direction ou une autre pour la deuxi`eme mesure, si on
compare l’ensemble M

des chances qu’on avait d’obtenir σ

avec celui M

de celles d’obtenir σ

,
la quantit´e de remplacements de M

`a M

ne devrait pas surpasser la somme des quantit´es de
remplacements de M

`a M et de M `a M

. C’est ce qu’on appelle l’in´egalit´e de Bell.
Or, cette conclusion est r´efut´ee par les r´esultats ´enonc´es plus haut de la physique quantique.
On peut le voir par un simple exemple, ou qualitativement de la mani`ere suivante. Entre des
mesures des deux ´electrons suivant deux directions proches formant un angle θ, on est presque sˆ ur
d’obtenir les r´esultats oppos´es, la proportion d’exceptions ´etant ´egale `a
1−cos θ
2
, soit une quantit´e
nulle au premier ordre au voisinage de θ = 0. Les chances ne varient donc pas au premier ordre
d’approximation lorsqu’on bouge v au voisinage de u. Mais comme la position de u ne devrait
avoir aucune influence sur la proportion de chances qui sont remplac´ees pour le r´esultat de la
deuxi`eme mesure, cette annulation au premier ordre de la quantit´e de remplacements lors d’un
d´eplacement de v devrait ˆetre valable pour toute position de v, donc finalement de proche en
proche en additionnant les quantit´es de remplacements successifs, pour toute variation de v, ce
qui est absurde puisque le r´esultat doit s’inverser lorsque v va jusqu’`a se retourner vers la position
oppos´ee.
Ainsi, le raisonnement classique sur les “causes” des r´esultats observ´es m`ene `a des conclusions
contradictoires, ce qui prouve que les objets invoqu´es dans le raisonnement (les ensembles de
chances pr´eexistantes qui d´eterminent les r´esultats) ne correspondent pas `a des objets r´eels. Ceci
vient du fait que parler du r´esultat qu’on obtiendrait si on effectuait une certaine mesure n’a pas
de sens tant que cette mesure n’est pas r´eellement effectu´ee. Et pour mesurer l’´etat des spins de
la paire, on n’a que deux essais `a disposition : mesurer une fois le spin de l’un, et une fois le spin
de l’autre. Il est impossible de produire un triplet d’´electrons corr´el´es de la mˆeme mani`ere (cela
n’est pas concevable dans le formalisme de la m´ecanique quantique).
En conclusion, `a cause des in´egalit´es qui ne sont plus valables, le hasard quantique de l’obser-
vation d’un spin ne peut pas se comprendre suivant l’intuition classique comme ´etant d´etermin´e
par une cause (un “jet de d´es”) qui existait d´ej`a dans l’environnement local de chaque observateur
avant qu’il n’effectue sa mesure.
56

Mais comment visualise-t-on la g´om´trie euclidienne, d’abord ? Elle n’est pas celle que l’on e e voit directement, car la g´om´trie du champ de vision est la g´om´trie sph´rique. e e e e e En effet, la vue d’un point ne nous renseigne que sur la demi-droite issue de l’œil auquel ce point appartient; et cette demi-droite peut se repr´senter par son point d’intersection avec une e sph`re centr´e sur l’œil. Lorsqu’on bouge l’œil et/ou la tˆte, la modification de ce qu’on voit e e e correspond ` une rotation de cette sph`re. L’exemple le plus clair en ce sens est celui des objets a e astronomiques dont on ne per¸oit que l’image sur la “sph`re c´leste” (qui tourne ` cause de la c e e a rotation de la Terre sur elle-mˆme). e Mais la g´om´trie euclidienne (du plan ou de l’espace) est seulement celle qu’on a le plus e e l’habitude de concevoir. En effet, en voyant ou en imaginant une image de dimension 2 (sur la sph`re de vision), on attribue ` chaque point une sensation de proximit´ ou d’´loignement, et on e a e e est familier avec la mani`re dont cette perception se transforme lorsqu’on tourne l’objet ou qu’on e change de point de vue par rapport ` lui. C’est cette facult´, fruit d’une construction mentale, a e qui constitue notre compr´hension de la g´om´trie, et notre agilit´ ` l’employer en rend l’usage e e e e a tellement facile comme celui d’une sensation ´l´mentaire, que son caract`re indirect en est presque ee e anecdotique. Or, la perception intuitive des autres g´om´tries rel`ve du mˆme principe : celui qui consiste ` e e e e a voir une chose pour en concevoir une autre. Et pour parvenir ` concevoir ainsi d’autres g´om´tries a e e en s’appuyant sur une vision qui (h´las) demeure la mˆme, un bon moyen est de travailler sur cette e e facult´ de concevoir l’espace euclidien, en la particularisant, en la modifiant ou en la g´n´ralisant. e e e (Mais ensuite, il est vrai que ce lien avec la vision ne se pr´serve pas facilement, et que le travail e de conception devient plus intense et traduit en formules avec un rˆle de la vision relativement o moindre). Par exemple, on peut concevoir des espaces (euclidiens ou non) de dimension sup´rieure ` e a 3. Ils ne comportent math´matiquement aucune v´ritable nouveaut´ par rapport ` la droite, au e e e a plan et ` l’espace usuel, mˆme si l’absence totale d’exp´rience par rapport ` eux donne aux novices a e e a l’impression d’une difficult´ insurmontable. Pour concevoir ces espaces, on peut par exemple se dire e qu’on ne voit que deux ou trois dimensions en mˆme temps sous forme de coupe ou de projection, e mais qu’il y en a d’autres en r´serve, on peut les changer. . . e 1.4 La g´om´trie euclidienne d´crit-elle exactement l’espace physique ? e e e Non. Non seulement le temps s’y ajoute en relativit´ restreinte pour former un espace de e dimension 4 qui n’est pas euclidien (l’espace-temps) et est plus r´el (proche de la r´alit´ physique) e e e que notre espace de dimension 3 usuel, mais mˆme si on se restreint ` consid´rer son apparence e a e d’espace de dimension 3, la th´orie de la relativit´ g´n´rale nous enseigne qu’en r´alit´, cet espace, e e e e e e pour autant qu’on puisse encore le mesurer, n’ob´it pas exactement ` la g´om´trie euclidienne e a e e (ind´pendamment de toute question de mat´rialisation des objets ou de pr´cision des mesures). e e e Bien sˆr, l’erreur de le supposer euclidien est extrˆmement faible, plus encore que d’autres erreurs u e beaucoup plus compr´hensibles et d´j` couramment n´glig´es : lorsqu’on cartographie une r´gion e ea e e e de la Terre (de forme ` peu pr`s carr´e par exemple) de taille L, en l’assimilant ` une r´gion d’un a e e a e plan, l’erreur g´om´trique normale due ` la rotondit´ de la Terre vaut (en distance sur le terrain) e e a e L3 R2 o` R = 6370 km est le rayon de la Terre, ce qui fait par exemple 2,4 cm pour une r´gion large de u e 10 km. Celle due ` la relativit´ g´n´rale, qui mesure donc le mˆme type de d´callage par rapport a e e e e e a ` la g´om´trie euclidienne plane mais concerne le plan tangent ` la Terre et constitue un effet e e a suppl´mentaire par rapport ` celui qu’on calculerait en termes de la seule rotondit´ de la Terre, e a e vaut 2L3 g Rc2 o` g = 9, 8 m.s−2 est l’acc´l´ration de pesanteur et c = 3.108 m.s−1 est la vitesse de la lumi`re. u ee e Elle est donc 720 millions de fois plus faible (pr´cis´ment, pour n’importe quelle r´gion choisie); e e e 2

dans le cas de la mesure de la Terre enti`re au lieu d’une r´gion, l’erreur est de l’ordre de quelques e e centim`tres. Ainsi, ´tant donn´ un choix d’“´quateur” parfaitement circulaire, sa longueur est e e e e inf´rieure ` sa distance au centre multipli´e par 2π (mais le calcul pr´cis de sa distance au centre e a e e d´pend de la r´partition de la masse de la Terre entre les diff´rentes profondeurs). e e e Si maintenant on consid`re un plan vertical, une autre erreur survient, elle aussi plus forte que e celle issue de la relativit´ g´n´rale : le solide de longueur L que l’on tourne pour comparer des e e e longueurs horizontales et verticales se d´forme sous son propre poids (il s’´tire s’il est pendu, il se e e contracte s’il est pos´), d’une amplitude de l’ordre de e L2 g c2 o` c est la vitesse du son dans le solide, qui est forc´ment inf´rieure ` c d’apr`s la relativit´ u e e a e e restreinte. De l’autre cˆt´, la physique de l’infiniment petit pose actuellement tellement de probl`mes oe e que certains physiciens th´oriciens envisagent s´rieusement que les concepts usuels de g´om´trie e e e e ne seraient plus valables ` l’´chelle de Planck (qui est bien plus petite que la plus petite distance a e pour laquelle le comportement des particules est actuellement connu). 1.5. Qu’est-ce que la physique math´matique ? e ´ Etat des lieux Il y a deux types de travaux en physique math´matique: la physique fondamentale et la e physique appliqu´e. La partie th´orique de la physique appliqu´e consiste essentiellement ` d´vee e e a e lopper les cons´quences de la physique fondamentale ` l’aide d’approximations adapt´es (en s’aidant e a e parfois de l’exp´rience quand les approximations sont trop difficiles ` r´aliser sur le plan th´orique). e a e e La partie physique de cet ouvrage aura pour but de pr´senter des th´ories physiques fondamene e tales bien ´tablies et largement v´rifi´es ` ce jour, des plus simples (math´matiquement simples et e e e a e proches de l’exp´rience courante) aux plus ´volu´es (math´matiquement sophistiqu´es et ` la base e e e e e a de l’explication du plus grand nombre de ph´nom`nes). Mais cet ordre de rangement n’est pas e e strict. Du point de vue de la “r´alit´ physique”, seules les derni`res auraient le titre de th´ories e e e e physiques fondamentales puisqu’elles sont physiquement plus fondamentales et pr´cis´ment cone e formes ` la r´alit´ que les premi`res qui n’en sont que des r´sultats et approximations; mais il a e e e e se trouve que l’ordre p´dagogique des th´ories fondamentales (l’ordre de la compr´hension dans e e e leur apprentissage et le sens intuitif donn´ aux notions) est plus ou moins l’inverse de leur ordre e de d´pendance en tant que th´ories physiques. (C’est finalement logique puisque si une th´orie e e e A pr´c´dait une th´orie B ` la fois physiquement et p´dagogiquement, on classerait B dans la e e e a e physique appliqu´e). e D’abord il y a la m´canique classique, celle de Galil´e et Newton, qui traite des forces et e e des mouvements; la loi de la gravitation s’y ´nonce simplement. A partir d’elle on peut avancer e dans deux directions, qui sont les deux types de physique moderne qui s’opposent ` la physique a classique : d’une part la Relativit´ (restreinte puis g´n´rale), d’autre part, la physique quantique et e e e la physique statistique, qui sont deux th´ories parentes et ´troitement li´es entre elles. Ces th´ories e e e e seront introduites plus en d´tails dans les chapitres correspondants. e Nous ne pr´ciserons pas les justifications th´oriques et exp´rimentales sur lesquelles repose e e e leur reconnaissance, car ces justifications sont actuellement innombrables et parmi elles, celles ` a l’origine historique de leur d´couverte ont d´sormais perdu tout caract`re privil´gi´. e e e e e Une telle d´marche p´dagogique d´barrass´e des questions de justification exp´rimentale est e e e e e largement satisfaisante du fait que ces th´ories bien ´tablies et v´rifi´es avec une extrˆme pr´cision, e e e e e e englobent d´j` dans leur domaine d’application la plupart des exp´riences de physique r´alisables. ea e e Cependant, beaucoup de ces exp´riences ´chappent en pratique ` cette r´duction ` cause de e e a e a l’extrˆme complexit´ de leur expression th´orique, ou des difficult´s parfois insurmontables de e e e e la r´solution des probl`mes math´matiques correspondants. e e e Ceci ne fait pas de la physique fondamentale une science morte pour autant, car non seulement les th´ories ´tablies sont manifestement incompl`tes (la relativit´ g´n´rale et la physique e e e e e e 3

quantique sont difficilement conciliables pour des raisons impossibles ` vulgariser), mais la th´orie a e quantique sous sa forme compl`te compatible avec la relativit´ restreinte (th´orie quantique des e e e champs) s’av`re, au niveau fondamental, d’une complexit´ quasi-insondable manquant d’un fondee e ment math´matique bien clair sur lequel reposer, et le travail de reformulation ` la recherche d’un e a meilleur fondement demeure actif. Aspects philosophiques Mˆme si on supposait que les objets physiques aient une nature, nous ne pourrions de toute e mani`re pas la connaˆ e ıtre par l’exp´rience car toutes nos perceptions passent par une traduction e des ph´nom`nes ext´rieurs en la conscience qu’on peut avoir d’eux. Donc, le mieux qu’on puisse e e e faire est d’´tudier le monde physique en tant que syst`me math´matique, ce qui nous laisse libres e e e de nous le repr´senter sous des formes sans rapport avec celles sous lesquelles nous le percevons e habituellement. Expliquons cela en d´tails: e Au moins jusqu’` maintenant, il semble que toute pr´tention ` dire qu’un ´l´ment de l’imaa e a ee gination serait plus qu’un autre ressemblant ` la “vraie nature” d’un certain ´l´ment de la r´alit´ a ee e e physique est vaine, parce qu’il n’existe aucun moyen de comparer ces natures : toutes nos perceptions du monde ext´rieur sont indirectes, traduites par notre corps en impulsions nerveuses, que le e cerveau retraite pour en distinguer les formes globales. Donc, du monde physique ext´rieur, seules e les structures, c’est-`-dire les relations entre les choses, sont accessibles ` nos sens et peuvent faire a a l’objet de nos discours, non une quelconque nature ontologique. Et de toute mani`re, comment e esp´rer qu’un objet physique puisse avoir une quelconque identit´ de nature avec un ph´nom`ne e e e e mental ? Par exemple il n’y a aucune ressemblance de nature entre le sentiment d’une couleur et les qualit´s des objets vus, qui sont responsables de cette couleur. Cette qualit´ consiste en des e e coefficients d’absorption de diff´rentes fr´quences d’ondes ´lectromagn´tiques par ces objets, qui e e e e d´terminent la composition en fr´quences de la lumi`re que l’oeil re¸oit. Puis, ce n’est qu’une faible e e e c partie de l’information sur cette composition que les cellules de l’oeil peuvent transmettre (suivant les propri´t´s des mol´cules dans la r´tine qui font ce travail). ee e e ´ Egalement, nous pouvons ` peine imaginer le temps, mˆme juste conform´ment ` la mani`re a e e a e dont nous le vivons, qui montrerait la nature de cette exp´rience vivante du temps au-del` de la e a seule forme de la droite qui le repr´sente math´matiquement : en aucun instant nous ne pouvons e e imaginer une dur´e en tant que telle, puisqu’un instant ne contient aucune dur´e; il n’y a que e e les dur´es futures qui n’existent pas encore, et les dur´es pass´es, que nous percevons dans notre e e e souvenir. Mais d´j`, un souvenir d’une dur´e n’est plus une dur´e, car il ne fait que repr´senter ea e e e cette dur´e par une certaine autre sensation instantan´e. e e Ainsi, la pr´tention de d´crire les choses “comme elles sont” serait vaine, ou alors, ce n’est e e plus de la physique mais de la m´taphysique, ce qui peut ´ventuellement se d´fendre ` condie e e a tion de l’annoncer clairement. Eventuellement, cela peut ˆtre utile lorsqu’on travaille avec une e th´orie provisoire qu’on est en train de remettre en question pour tenter d’en construire une autre e plus pr´cise comme explicitation de structures sous-jacentes ` une structure donn´e (par exemple, e a e cela est pertinent pour passer des moles aux mol´cules, et de la thermodynamique classique ` la e a m´canique statistique). Mais cela n’a lieu que de mani`re relative et non absolue, et n’est pas le e e cas g´n´ral. e e L’objet de la Physique est donc de d´crire les lois physiques, c’est-`-dire l’expression sous e a forme de th´orie math´matique des relations constat´es entre les r´sultats de nos observations du e e e e monde physique, puisque c’est une caract´ristique g´n´rale des math´matiques que de s’int´resser e e e e e aux structures, relations entre les objets, et non ` leur nature. Alors, entre plusieurs pr´sentations a e math´matiquement ´quivalentes (ou traductions) d’une th´orie, faisant diff´rents choix de formes e e e e d’imagination pour repr´senter tel ou tel aspect de la r´alit´, la meilleure est celle qui permet de e e e saisir cette th´orie math´matique de la mani`re la plus facile ou efficace. e e e L’intuition quotidienne du monde physique est adapt´e ` la compr´hension des probl`mes de e a e e la vie quotidienne. Mais lorsqu’on veut passer ` l’´tude des structures de la r´alit´ qui apparaissent a e e e dans d’autres contextes, il peut ˆtre judicieux de modifier ce choix. Mais de toute mani`re, un e e discours s’appuyant ainsi judicieusement sur un syst`me inhabituel de correspondances entre objets e 4

r´els et formes d’imagination employ´es ` les repr´senter, est donc bien sˆr pareillement vide de e e a e u signification sur la vraie nature de ces aspects ou objets de la r´alit´ physique que tout autre e e discours. Faute d’avoir une th´orie compl`te de la physique, on a des th´ories partielles, dont chacune e e e concerne les propri´t´s des r´sultats des exp´riences d’un certain domaine exp´rimental de la r´alit´, ee e e e e e c’est-`-dire un certain type d’exp´riences avec un certain degr´ de pr´cision des mesures (d´pendant a e e e e des param`tres de l’exp´rience). Au cours de l’exploration de la physique math´matique, on est e e e amen´ ` consid´rer une succession de th´ories correspondant ` diff´rents domaines exp´rimentaux, ea e e a e e de plus en plus larges et dont les cons´quences th´oriques sont de plus en plus pr´cis´ment en e e e e accord avec l’exp´rience (ou donnent de plus en plus d’informations ` lui confronter). e a Chacune de ces th´ories est d’abord par nature une th´orie math´matique; sa signification e e e physique (son titre de th´orie physique) consiste alors ` attribuer ` chaque exp´rience du domaine e a a e exp´rimental consid´r´ une traduction dans la th´orie, c’est-`-dire un certain sous-syst`me d’objets e ee e a e de la th´orie qui repr´sente math´matiquement le dispositif exp´rimental utilis´. e e e e e Mais une th´orie a aussi une signification intuitive, qui r´side dans le choix de la forme de e e repr´sentation la mieux adapt´e ` la compr´hension de la th´orie. Dans cette exploration, beaucoup e e a e e de th´ories g´om´triques interviennent, non seulement pour rendre compte du comportement de e e e la mati`re ´voluant ` l’int´rieur de l’espace qui nous est familier, mais aussi pour remplacer cet e e a e espace lui-mˆme par d’autres (ce dernier cas n’arrive pas souvent : principalement en Relativit´ e e restreinte, Relativit´ g´n´rale et ce qui inclut la gravitation quantique). Et, parmi nos intuitions e e e ou capacit´s habituelles ` percevoir le monde physique, la vision est celle qui est la plus claire e a math´matiquement, et la plus facile ` exercer pour pouvoir, avec elle, concevoir beaucoup de ces e a th´ories g´om´triques. e e e La difficult´ du na¨ ` remettre en question la forme de ses perceptions se pr´sente aussi en e ıf a e termes du principe de r´alit´, suivant lequel “la r´alit´ physique existe” que nous la percevions ou e e e e pas, au nom de quoi il voudrait continuer ` penser les choses en termes d’“objets r´els” ou concrets a e tels qu’il les per¸oit habituellement. Or le probl`me n’est pas de savoir si la r´alit´ comporte ou c e e e non d’autres objets que ceux de notre exp´rience ou perception, car de toute mani`re les th´ories e e e physiques avec lesquelles nous travaillons en pr´sentent. Le probl`me est de savoir lesquels. Le e e na¨ imagine ces objets de la r´alit´ sous-jacente, qu’il ne peut percevoir directement, comme ıf e e ressemblant ` ceux qui lui sont familiers. Il n’a pas toujours tort, d’ailleurs, dans la mesure o` tel a u ou tel ph´nom`ne qu’il a besoin d’expliquer peut ˆtre dˆ ` des m´canismes situ´s dans un domaine e e e ua e e exp´rimental plus large que son exp´rience courante, mais pas encore assez pour que son intuition e e cesse d’ˆtre valide, son incapacit´ ` observer directement ces m´canismes suivant cette mˆme e e a e e intuition ´tant seulement contingente et rem´diable par des instruments adapt´s (microscopes, e e e t´l´scopes, etc.). ee Par contre, lorsqu’en poussant plus avant le domaine exp´rimental on se trouve confront´ ` e e a une impossibilit´ plus fondamentale d’affiner les instruments de mesure pour observer le mˆme e e type de m´canismes r´els explicatifs, il est temps d’envisager qu’il y ait ` cela une bonne raison: e e a a ` savoir qu’il n’existe pas de r´alit´ explicative ressemblant ` ce que le na¨ voudrait croire, parce e e a ıf que la r´alit´ est d’une autre forme qui ne peut ˆtre comprise que par des moyens diff´rents, en e e e e des termes diff´rents. e 1.6. Quelques mots de g´om´trie euclidienne e e ´ Evoquons ici les g´om´tries euclidiennes de dimensions 1, 2 et 3. Celle de dimension 1 (de e e la droite) est la plus simple math´matiquement; les deux suivantes (du plan et de l’espace) sont e presque de complexit´ ´quivalente, et seront trait´es ici de la mˆme mani`re. ee e e e Notre vision est habitu´e ` comprendre le plan et l’espace, mais se trouve un peu large pour e a parler de la droite : quelle droite ? horizontale, verticale. . . ? On a tendance ` vouloir placer cette a droite quelque part. On a d´j` moins tendance ` vouloir disposer le plan dans l’espace, puisque ea a les deux dimensions du plan remplissent les deux dimensions du champ de vision, ne laissant pas voir le vide qui se trouve de chaque cˆt´. Mais quels que soient nos modes de repr´sentations et oe e d’´ventuels rapports avec notre Univers physique, chacune de ces g´om´tries, en tant que th´orie e e e e math´matique, se limite ` consid´rer les constructions pouvant ˆtre faites ` l’int´rieur de son e a e e a e 5

qui r´sulte d’un changement de disposition de la feuille sur la table r´alis´ par e e e e simple glissement.) Pour cette raison. la notion de fil (infiniment fin). ) qu’on lui donne. qui a la forme (ou g´om´trie) d’une eae e e e sph`re : cette sph`re a certes un centre bien d´fini (l’œil) mais n’a pas de rayon. l’espace) ind´pendamment de toute consid´ration d’un ´ventuel espace e e e e ext´rieur dans lequel ce syst`me pourrait ˆtre dispos´. D’abord. mais passons. e e Entre deux points distincts A et B. il serait faux de la e e e confondre avec une sph`re particuli`re dispos´e dans l’espace. La notion d’antid´placement se d´finit de la mˆme mani`re e e e e 6 . la longueur d’une courbe peut se d´finir ` partir de la notion de distance e a (sans utiliser la mesure des longueurs des fils) : c’est la valeur vers laquelle s’approche la somme des distances entre des points de la courbe cons´cutifs pour le fil. e e e e En voici deux. Pour toute courbe. arrˆt´s en deux extr´mit´s (on les coupe l`. dont la e longueur divis´e par le rayon est la mesure en radians de l’angle (qui ne d´pend pas du rayon). Mˆme si une telle disposition peut ˆtre e e e e e e utile pour des calculs et raisonnements interm´diaires ou comme support intuitif. d’un volume dans l’espace (un solide). et est appel´e un segment. qu’on appelle alors la longueur de la courbe.) Chaque disposition d’une feuille sur une table fait voir une figure sur la feuille comme ´tant e une figure sur la table. ou de mani`re ´quivalente chronom´trer le temps e e e e e de parcours ` vitesse constante. et doit donc disparaˆ ee e e e e ıtre dans les objets d’´tude et les r´sultats finaux. en tant qu’objet m´canique dont la nature est pr´serv´e quelles que soient les dispositions dans l’espace e e e (droites. c’est la seule longueur pour laquelle il n’existe qu’une seule courbe qui les relie. (Elle est l’ensemble des demi-droites e e e issues de l’œil. Une droite divise le plan en deux demi-plans. ou d’un morceau de plan dans un plan (une feuille de papier pos´e sur une table). dont la somme des longueurs est ´gale ` la longueur du fil de d´part. elle n’est pas e consid´r´e comme faisant partie des r´alit´s premi`res dans cette th´orie. lieu du plan ou de l’espace en lequel il peut ˆtre dispos´. la sensation du temps. e e L’ensemble des points ` ´gale distance d d’un point donn´ O s’appelle le cercle de centre O ae e et de rayon d. Cette ind´pendance de chaque g´om´trie apparaˆ e e e e e ıt clairement dans l’exemple d´j` ´voqu´ du champ de vision. Sa longueur s’appelle la distance e e entre A et B. On pourrait d´finir ` e e a partir des segments les demi-droites et les droites. La e a e longueur d’une courbe se mesure ´galement par le temps qu’on met ` parcourir cette courbe du e a regard ` vitesse fix´e (ainsi sont reli´es ces 3 intuitions unidimensionnelles: les fils. Cette courbe est not´e [AB]. fournit un marquage de chaque point de la courbe par un nombre a ou une quantit´ appel´ son abscisse curviligne. Marquer le fil d’une graduation r´guli`re rep´rant les longueurs depuis une extr´mit´ (ou plus e e e e e g´n´ralement depuis un point quelconque du fil). . e e e La notion de disposition d’un fil dans le plan ou dans l’espace se g´n´ralise ` la disposition e e a d’un morceau de plan dans l’espace (une feuille de papier). . lignes bris´es. il y a une valeur minimale non nulle des longueurs de courbes qui les relient. courbes. Ensuite. Pr´sentons maintenant une introduction e e intuitive ` la g´om´trie euclidienne. e e e qui est une quantit´ positive. l’intersection de S avec un cercle de centre O est une courbe.syst`me (la droite. Tout point d’un fil e le divise en deux parties. Inversement. le plan. ou bien on e ee e e a oublie les prolongements comme s’ils n’existaient pas). ou inversement les segments ` partir des droites a d´finies en termes de sym´trie axiale qui sont des antid´placements (voir plus bas). sans retournement. e Exprimons-nous maintenant dans le cas de la g´om´trie plane. lorsque ces points sont de plus en e plus nombreux et rapproch´s dans le fil (envahissant toutes les parties du fil). On appellera courbe une image d’un fil. Chaque fil se caract´rise par sa longueur. il est bon de fournir ` disposition de notre intuition des formes de repr´sena e tations autres que visuelle pour figurer la g´om´trie de la droite (ou g´om´trie de dimension 1). les fils pouvant ˆtre dispos´s dessus sont tous e e e ceux qui ont une mˆme longueur. a e e Consid´rons des fils de longueur finie. On appelle d´placement la transformation d’une figure (dessin´e sur la feuille mais vue comme e e ´tant sur la table). e e (Ce qui suit serait g´n´ralisable ` la g´om´trie dans l’espace en rempla¸ant feuille par solide e e a e e c et table par espace. le temps et les a e e courbes). L’intersection ou la r´union de deux e demi-plans s’appelle un secteur angulaire S qui se mesure par son angle : O ´tant ` l’intersection e a des deux droites fronti`res.

e a Dans ces conditions. Toutes les notions d´finissables ` partir e e e a de notions de g´om´trie affine. obtenue en tournant la feuille autour d’un e point (appel´ centre et unique point fixe) suivant un certain angle et dans un certain sens (d´fini e e par rapport ` l’orientation du plan). La notion de droite fait partie de la g´om´trie affine. Ainsi. On observe de loin une e e e e figure trac´e sur une vitre. Diff´rents e e a e observateurs seront toujours suppos´s ignorer mˆme comment ils sont dispos´s dans l’espace les e e e uns par rapport aux autres. ils seront toujours d’accord. ni si on e la voit par devant ou par derri`re (ou. On sait seulement ce qu’on en voit. Par exemple. par le fait que son langage est plus r´duit : lorsque deux observateurs e e plac´s en des points de vue diff´rents se communiquent leurs observations d’une mˆme figure par e e e t´l´phone. ni comment elle est dispos´e (de face ou de biais. Tout d´placement dans le plan est soit une rotation. . en ayant seulement le droit de s’exprimer dans ce langage. . Mais certaines notions habituelles de g´om´trie euclidienne n’´tant plus valables. e e 1.7. (Dans le cas de l’espace. et a peut ˆtre vue comme la limite d’une rotation d’angle infiniment petit autour d’un centre infiniment e ´loign´). on ne sait pas (et on ne saura jamais) ` quelle distance cette vitre se e a trouve. ee e le “retournement” ne peut ˆtre que virtuel. font aussi partie de la g´om´trie affine. Le passage de la figure r´elle ` la figure ainsi vue s’appelle une transformation affine. quels sont les notions de g´om´trie (propri´t´s ou mesures d’une figure e e ee – on appellera cela plus loin les structures) dont l’apparence de tout point de vue de ce type est toujours fid`le ` la r´alit´. pouvant correspondre aux anciennes notions pour des observateurs e e particuliers. soit une translation (qui avance la feuille sans la tourner. on ne voit pas son contour). ` travers un miroir). et la taille apparente en est petite (elle pourrait tenir dans le disque lunaire par exemple) : on peut la prendre en photo. segments. N’importe laquelle peut ˆtre consid´r´e e ee comme vraie du point de vue correspondant. on e e e a alors besoin. tant qu’ils peuvent les d´finir enti`rement au e e e moyen de ce langage. et faire des mesures g´om´triques e e sur la photo. Fondement exp´rimental de la g´om´trie affine plane e e e Nous d´finirons la g´om´trie affine du plan par l’exp´rience suivante. de recourir ` des notions moins habituelles qui a subsistent en g´om´trie affine.sauf que la feuille (de pr´f´rence un papier calque) est de plus retourn´e. les antid´placements les rene versent. Elle diff`re donc de la g´om´trie euclidienne ` laquee e e e e a lle nous sommes habitu´s. font partie e e e e de la g´om´trie affine les notions d’alignement des points. et consiste ` prendre l’image miroir). toutes les notions de g´om´trie affine sont des notions qui existent aussi en g´om´trie e e e e euclidienne. aux incertitudes de mesure pr`s (n´gligeant les effets de distorsion li´s e a e e e e e au quotient de la taille de l’objet ` sa distance) ? a On appelle g´om´trie affine du plan la g´om´trie du plan* r´duite ` l’´tude des notions qui e e e e e a e apparaissent fid`lement dans cette exp´rience. ` partir de quoi le disque lunaire semblera presque ee a infiniment grand comme un plan: on peut y continuer la figure librement. parall`les et e e e * Voici pourquoi on se permettra de parler de plan (infini) bien que la figure soit suppos´e tenir e dans le disque lunaire : il suffit de partir de figures beaucoup plus petites que le disque lunaire (on a donc besoin d’un t´l´scope pour l’observer). ee Et ils peuvent mˆme introduire de nouveaux termes. ils resteront toujours d’accord. Les d´placements e a e conservent l’orientation du plan (le sens des aiguilles d’une montre). pour pouvoir encore travailler. de demi-droites. et aucune mesure ou propri´t´ qui utilise seulement le langage affine ne permet ee d’exprimer comment distinguer “quelle est la vraie”. e e Th´or`me et d´finition. On appelle isom´trie une transformation f du plan (ou l’espace) dans e e e e lui-mˆme qui v´rifie les trois conditions ´quivalentes suivantes : e e e 1) f conserve les distances (ou les longueurs de courbes) 2) f conserve toutes les notions de g´om´trie euclidienne e e 3) f est un d´placement ou un antid´placement. Un mˆme objet de g´om´trie affine admet de multiples interpr´tations (ou mesures) possibles e e e e dans le langage de la g´om´trie euclidienne (chaque observateur a son interpr´tation d´finie par e e e e ce qu’il voit). ce qui revient au mˆme. 7 .

e a e et ` motiver l’adoption d’une nouvelle approche refl´tant mieux l’usage de cette th´orie dans a e e un contexte plus large de physique th´orique.108 m de l` d’o` il est aussitˆt renvoy´. d’axes et de foyers e de coniques. qui sont certaines ape e plications d’un fil dans le plan.s−1 . 8 . mais devrait ˆtre au moins partiellement compr´hensible par tous.108 m. les rotations et antid´placements de la g´om´trie euclidienne a e e e e sont des transformations affines du plan qui en g´om´trie affine ne sont plus distinguables dans un e e ensemble plus large de transformations affines. sous forme d’ondes radio par exemple. . rapports de longueurs de segments parall`les. Son nom et quelques autres aspects ext´rieurs e La relativit´ est en deux ´tapes nomm´es “restreinte” et “g´n´rale”. paraboles. car des observateurs plac´s en des lieux diff´rents peuvent ne pas ˆtre d’accord dessus. en th´orie de la relativit´ par rapport ` la th´orie galil´enne (et ce e e e a e e principe est ainsi r´habilit´ apr`s que l’´lectromagn´tisme a sembl´ le contredire). pendule de e Foucault. On a vu en g´om´trie euclidienne les dispositions de fils dans le plan. pour des raisons de non-contradiction de la r´alit´. La th´orie de la relativit´ e e e e e e e restreinte est une th´orie de l’espace et du temps qui remplace celle pr´c´demment ´nonc´e par e e e e e Galil´e et Newton. d’orthogonalit´. En effet. De mˆme. e e translations et homoth´ties. un autre ne verra pas un cercle mais seulement une ellipse. la vitesse e e de parcours de la courbe peut alors varier d’une mani`re quelconque. L’´tranget´ de la th´orie de la Relativit´ e e e e Ce chapitre d’introduction ` la relativit´ et ` son ´tranget´ vise notamment ` analyser la a e a e e a m´thodologie sur laquelle reposent traditionnellement les cours d’initiation ` la relativit´ restreinte. de rotations. Le slogan caricate e e ural “tout est relatif” avait d´j` pris possession de l’imagination populaire. aucune information ne peut ˆtre transmis e e e plus vite que la vitesse de la lumi`re dans le vide (qui est aussi celle des ondes radio). longueurs de courbe ou de e e segment. e En fait. Par suite. devra attendre deux secondes avant d’en recevoir ea a u o e le retour. mais son sens n’´tait ea e ni nouveau ni correctement repr´sentatif de la th´orie.1. c’est-`-dire qui ne d´pendent pas de l’observateur dans l’exp´rience ci-dessus. mais il ´tait trop tard. en r´duisant cette derni`re au rang d’approximation valable lorsque les vitesses e e e relatives des objets ´tudi´s sont n´gligeables devant celle de la lumi`re. si l’un croit voir un cercle. Ainsi peut-on d´finir la notion d’ellipse: une ellipse est une figure obtenue par transformation e affine ` partir d’un cercle.parall´logrammes. de produit scalaire. de cercles. D’autre part. pensant que celui de e e e “chronog´om´trie” par exemple aurait mieux convenu. Ici. ` un point a e e a situ´ ` 3. si on garde l’intuition du temps pour imaginer le fil. e e e Une cons´quence de la relativit´ est qu’aucun signal. 2. barycentres. e 2. . ce qui signifie pr´cis´ment que celui qui e e envoie un signal ` cette rapidit´ ind´passable. comme nous n’aborderons pas ici la relativit´ g´n´rale). (Nous sous-entendrons e e e e parfois l’adjectif “restreinte”. Il ne faut pas se laisser abuser par le nom de la “relativit´” qui refl`te mal le sens de e e cette th´orie : certains auteurs de la th´orie l’ont par la suite regrett´. d’une part le Principe de rele e ativit´ ´tait d´j` contenu dans la th´orie galil´enne. la seule diff´rence ´tant que le changement e e ea e e e e de r´f´rentiel affecte un plus grand nombre de param`tres (par exemple le temps) qui d´crivent ee e e des objets physiques donn´s. e e e Il est possible d’aborder directement les choses s´rieuses en passant au chapitre 3. ). la notion de droite est suffisante pour d´finir toutes les autres notions de g´om´trie e e e affine. Il s’adresse particuli`rement ` ceux ayant vu la e e a pr´sentation habituelle. d’angles. il n’y a plus lieu de les distinguer ` l’int´rieur d’un certain a e ensemble plus vaste d’applications d’un fil dans le plan. ainsi que les ellipses et hyperboles avec leurs centres. par exemple celui des courbes param´tr´es e e (le fil est remplac´ par un ´lastique. e e e Cette vitesse est une constante universelle c ≈ 3. a e e toute transformation qui transforme les droites en droites pr´serve aussi toutes ces notions et est e une transformation affine. ce e e e e e e slogan risque de provoquer par exemple des blocages psychologiques ` l’acceptation du caract`re a e objectif et mesurable du mouvement de rotation d’un objet sur lui-mˆme (gyroscope. Ne font pas partie de la g´om´trie affine les notions de distances. diff´rente d’un point de vue e e a ` l’autre suivant la transformation affine subie). pas plus e qu’elle ne peut arriver avant d’ˆtre partie. e e e Par exemple. rapports des aires.

Il s’exprime a e dans toute son ´tendue en th´orie quantique des champs o` n’importe quelle expression tensorielle e e u qu’on peut ´crire ` partir de certains objets (donn´s par les types de particules pr´sents) se r´alise e a e e e par le diagramme de Feynman correspondant. de la mani`re suivante. si l’´lectron ´tait ponctuel. formellement ind´pendante du choix d’une e e e e dimension particuli`re. 82. et donnerait donc un rayon plus e e grand. en lui soustrayant cette ´nergie e e e e e et donc cette masse qui se trouve dans le champ qui l’entoure. Il serait plus ´l´gant et efficace de commencer par la relativit´ restreinte e ee e et le calcul tensoriel. ce formalisme consiste en assemblages d’op´rations g´n´rales de e e e e “multiplications” entre des vecteurs pouvant appartenir ` diff´rents espaces vectoriels. si seulement des approches convenables de ces th´ories ´taient trouvables dans e e la litt´rature. en renon¸ant ` d´finir la position d’un ´lectron avec une pr´cision plus fine qu’une c a e e e ∗ −15 distance de l’ordre du rayon classique de l’´lectron re = 2. pour son niveau de complexit´ (la relativit´ e e e e g´n´rale n’en d´pend pas en toute rigueur mais utilise ` peu pr`s les mˆmes outils math´matiques).La relativit´ restreinte a ´t´ d´couverte par diff´rents chercheurs : Poincar´. c’est le double du rayon de la sph`re ` l’ext´rieur a e a e de laquelle l’´nergie du champ ´lectrique calcul´ classiquement atteint l’´nergie de masse mc2 de e e e e l’´lectron : vu de plus pr`s que cela. pour en e e e e e d´duire qu’il oblige ` construire la relativit´ restreinte d’apr`s la loi de constance de la vitesse de e a e e la lumi`re qu’il induit. e e e a e e e La relativit´ g´n´rale cohabite naturellement avec l’´lectromagn´tisme : le champ ´lectromagn´e e e e e e e tique et le champ gravitationnel interagissent de mani`re coh´rente tout en restant des objets e e distincts. e e e Il y a une similitude formelle entre les th´ories de l’´lectrostatique et de l’induction magn´tique e e e (dans l’espace tridimensionnel) qui se correspondent en rempla¸ant les charges de dimension z´ro c e (densit´s) par des charges de dimension 1 (courants). Le champ magn´tique et le champ ´lectrique ne sont que les deux composantes d’un e e mˆme champ d´compos´ par rapport ` un r´f´rentiel choisi. alors qu’une ou deux ´quations tensorielles sur un seul objet suffit en e partant de la relativit´). 9 ∗ . pour obtenir l’´lectrodynamique e e e classique. il lui resterait une masse n´gative. Lorentz. La relativit´ g´n´rale a ´t´ d´couverte par Einstein et Hilbert. perp´tu´e par inertie. elle englobe la relativit´ e e e ee e e restreinte et la gravitation (qu’elle interpr`te comme n’´tant pas une force mais l’effet de la courbure e e de l’espace-temps. On a e peut concevoir cette th´orie comme une extension de l’´lectrostatique. . Cependant cette taille est Comparable ` la taille du noyau atomique. et actuellee e ee e e e ment on enseigne encore l’´lectromagn´tisme d’abord en premi`res ann´es d’universit´. ). Mais cette d´marche h´rit´e de l’histoire. On peut remarquer un outil math´matique qui traverse un grand nombre de th´ories physiques : e e le calcul tensoriel. e d´fiant les lois de la m´canique. l’´nergie de masse du champ magn´tique dˆ au spin e e e e u de l’´lectron est plus importante encore pr`s de ce rayon classique.10 e m. . manque e e e e e e fortement d’´l´gance (sans relativit´. il suffit de r´appliquer cette mˆme th´orie. . mais en fait. mais deviendraient simples et naturelles une fois e e e traduites en langage tensoriel. Entre les deux on peut placer l’´lectromagn´tisme. l’´lectromagn´tisme a ´t´ d´velopp´ avant la relativit´ restreinte. . La raison pour laquelle cette situation perdure est qu’il ne semble pas exister actuellement dans la litt´rature une pr´sentation suffisamment claire et p´dagogique e e e du calcul tensoriel pour qu’on puisse songer ` l’introduire ` ce niveau d’enseignement. ob´issant aux quatre ´quations de Maxwell qui e e e e semblent bien peu naturelles. le champ ´lectromagn´tique se pr´sente sous forme de deux ee e e e e objets. Pour r´sumer. a a Historiquement. Einstein. Une fois cela remarqu´ en termes de calcul e e tensoriel. champ ´lectrique et champ magn´tique. e e e a ee Cette th´orie pr´sente l’´trange d´faut de ne pas pouvoir consid´rer les ´lectrons comme e e e e e e ponctuels en toute exactitude sans cons´quences absurdes. mais seulement suivant des approxe imations. Minkowe ee e e e ski. e L’´lectromagn´tisme dans le cadre relativiste s’appelle ´galement l’´lectrodynamique classique e e e e (par opposition ` l’´lectrodynamique quantique qui traite cette force en physique quantique). Son absence apparente des cours habituels d’´lectromagn´tisme est en fait une maladresse : e e certains calculs (en m´canique classique et ´lectromagn´tisme) utilisent des formules vectorielles e e e ou autres r`gles de transformations d’expressions qui semblent alors d’origine tr`s myst´rieuse e e e ou n´cessitent des d´monstrations compliqu´es. au cas de l’espace-temps de la relativit´.

S’enfermant ainsi dans c e l’intuition galil´enne. ils ne peuvent alors qu’entreprendre d’y faire entrer ´galement coˆte que e e u coˆte la r´alit´ de l’espace-temps physique. L’intuition galil´enne n’est donc pas adapt´e pour concevoir cette th´orie. Cette notion de r´f´rentiel galil´en qui ´tait h´rit´e de la e ee e e e e th´orie galil´enne.3. De mˆme dans l’activit´ th´orique. comme si on pouvait voir venir un signal lumineux avant qu’il e 10 . sans jamais l’atteindre. au moyen d’un dispositif exp´rimental fictif. mais en subissant ` son approche quelques distorsions. ee ou pour le dire autrement une image en ´volution. loin de e e e a e toute tentative de r´novation r´put´e impossible ou sans objet. que nous allons maintenant expliquer. e Nous percevons le monde sous forme d’images re¸ues par les yeux et instantan´ment inc e terpr´t´es par le cerveau en images tridimensionnelles. Elle ne pourra jamais atteindre cet horizon si ce n’est e e e a a ` cause de la rotondit´ de la terre. qui traduit une l´gitime soif de comprendre.bien inf´rieure ` la fameuse “incertitude” de la physique quantique (dans le cadre de laquelle ce e a probl`me de l’´nergie du champ se r´soud mais de mani`re tr`s compliqu´e). Le pi`ge m´thodologique de son enseignement actuel e e La plupart des cours de relativit´ restreinte. elle semble e e rapetisser et ralentir au fur et ` mesure qu’elle s’approche de l’horizon. elle d´clare instantan´s des e e e e e ´v`nements ind´pendants. L’intuition galil´enne est e e e alors le fait d’utiliser cette dimension temporelle de notre imagination. tandis que quelqu’un qui se ee pr´tendrait immobile le verrait ainsi atteindre des vitesses arbitrairement proches de celle de la e lumi`re. e e e e e e 2. e e a e e a ` savoir le vecteur temps) : notion utile mais non essentielle ` l’´tude de la g´om´trie. on imagine e e e e des figures ou des images qui se succ`dent ou ´voluent au cours du temps. est dˆ ` notre tendance naturelle e e ua a ` penser le probl`me par ce que (` moins que vous ayez une meilleure suggestion) nous appellerons e a “l’intuition galil´enne”. par une simple transformation g´om´trique (un d´placement). une voiture peut s’´loigner tant qu’elle veut. du fait que la vitesse de la lumi`re est finie et ind´passable e e e par l’information. e e e 2. ind´finiment. ils en construisent une autre artificielle plus satisfaisante e pour l’esprit. qui autorisait les interactions e e e` e e instantan´es ` distance et dans laquelle la vitesse de la lumi`re ´tait infinie. sera finalement un outil math´matique ´quivalent ` la notion de rep`re orthoge e e e a e onal en g´om´trie euclidienne (ou parfois ` la donn´e d’un seul vecteur de base de ces rep`res. cette facult´ ` faire ´voluer ea e dans notre imagination les images au cours du temps. et ici a e e e d´tourn´e de son sens au profit d’une intuition inadapt´e. ni encore moins le d´passer. tellement cette m´thode a ´t´ e e e e ee r´p´t´e plus ou moins telle quelle depuis bientˆt un si`cle: au nom du sens des principes et r´alit´s e ee o e e e exp´rimentales. L’origine de ses paradoxes : l’intuition galil´enne e Vue du haut d’une tour. voir les d´tails e e plus loin) ? Cet ´tonnement. Ces faits n’´tonnent personne. En effet. a Ce mode de repr´sentation ´tait adapt´ a la th´orie galil´enne. appel´e “r´f´rentiel galil´en”. On a ainsi une succession continue d’images. et ` laquelle e a a il peut attribuer une r´alit´ objective. l’image qu’un e a e e observateur re¸oit du monde ` un instant y correspondait ` l’image qu’un autre observateur ´loign´ c a a e e du premier (et pouvant ˆtre en mouvement par rapport ` lui) en re¸oit aussi ` un certain instant e a c a (donc au “mˆme” instant). pour repr´senter la dimension temporelle de e l’univers physique que l’on cherche ` concevoir. (En effet. bien qu’il ne lui arrive a en r´alit´ rien de sp´cial ` son approche. ils commencent par consid´rer comme r´alit´ premi`re le type d’apparences du e e e e e monde per¸ues par les mis´rables points dans l’univers que nous sommes. e e e e emploient encore plus ou moins la mˆme d´marche fid`le ` l’histoire de sa d´couverte. dont un e a ralentissement du temps et une contraction des longueurs dans le sens de sa vitesse (qui n’apparaˆ ıt d’ailleurs mˆme pas visuellement comme une contraction mais comme une rotation.2. come ee e e plexe et pratiquement irr´alisable. mˆme r´cents. e e e Pourquoi s’´tonnerait-t-on alors des fait suivants qui leur sont pourtant analogues : un voyageur e peut acc´l´rer tant qu’il veut sans qu’il ne lui arrive quoi que ce soit. u e e La correspondance entre r´alit´ physique et intuition galil´enne que donne naturellement e e e l’observation n’´tant pas satisfaisante. que l’on trouve sur le march´. e e Mais cela devient faux en relativit´. donnant ` “voir” en imagination un ´v`nement “pr´sent” ´loign´ dont e e e a e e e e e la lumi`re n’arrivera que plus tard. C’est e e e e donc une image de dimension 3 que le th´oricien peut imaginer ` un certain instant.

e Les lecteurs int´ress´s par la preuve qu’il n’y a pas d’autre monde possible. un tel ee e emploi de cet intuition correspondrait math´matiquement ` l’emploi de syst`mes de coordonn´es e a e e curvilignes. pouvaient r´ellement mieux s’y retrouver. (Remarquons en passant que la relativit´ g´n´rale d´crit justement un autre monde e e e e plus proche de la v´rit´. le fait qu’elle ne se fonde pas sur l’intuition e galil´enne). aussi tordue soit-elle.) Naturellement incapables d’articuler cette intuition conform´ment ` la th´orie ` concevoir. Mais son objectif est de donner une claire vision des choses sans s’embarrasser au d´part e e de leurs apparences exp´rimentales. On reconnaˆ que les trois dimensions d’espace sont e ıt physiquement de mˆme nature et en continuit´ entre elles malgr´ leur diff´rence de forme sensible e e e e (vision et profondeur). ` part la relativit´ e e a e restreinte et la th´orie galil´enne. Mais en mˆme temps. ils continuent ` s’accrocher ` cette intuition d´sesp´r´ment. dans laquelle elle ne serait rigoureusement vraie. ) (Le qualificatif “galil´en” des r´f´rentiels ´tait dˆ au fait que dans la th´orie e ee e u e galil´enne on pouvait aussi consid´rer des r´f´rentiels “non-galil´ens” sans trop de complications. suivant leur mani`re de penser. D´j`. La coh´rence et les cons´quences de cette vision montreront e e e naturellement qu’elle d´crit un monde possible compatible avec les fameux principes physiques. voire d’ˆtre plus difficile ` come e a prendre que la m´thode traditionnelle. et la diff´rence sera pr´cis´e plus loin). Alors. . qui sont sens´s d´finir e e ee e e e e ces autres r´f´rentiels. Cette identit´ de nature et cette continuit´ apparaissent intuitives lorsque e e par une rotation de l’objet la profondeur s’´change avec une des deux dimensions visuelles. en oubliant presque d’en justifier l’existence (c’est-`-dire la non-contradiction). faute de pouvoir donner un sens physique intuitif ` une formule. e e e e e e la pr´sentant comme une interpr´tation absurde et m´diocre des fameuses exp´riences). e e ee e ce qui n’est plus le cas : car les syst`mes mat´riels acc´l´r´s aussi ´tudiables. e e a a ` la place de l’intuition galil´enne. elle avait e e 11 . Nous percevons les dimensions de la r´alit´ physique sous forme de trois e e sensations : images visuelles (de dimension 2).ne nous parvienne. Car les formules ne e e a a e ee peuvent exister ` l’´tat pur sous peine de perdre toute signification. . a satisfaits pour cela de constater que l’univers existe. profondeur et temps. qui d´termine a e e ea e e a e l’apparence des formules “fondamentales” et leur complexit´. ils la consacrent a de la force d’autorit´ que lui donne la longueur des preuves du fait qu’il ne peut exister aue cune th´orie de l’espace-temps ou de la m´canique (compatible avec certains principes formul´s e e e exp´rimentalement). e e e e On pourra ˆtre tent´ de reprocher ` cette m´thode l’absence de d´marche rigoureuse fond´e sur e e a e e e la r´alit´ (les ´nonc´s de principes physiques issus de constatations exp´rimentales) pour construire e e e e e et prouver la th´orie (ou pour le dire plus clairement. ni fid`le ` l’exp´rience dans sa e e e a e relation ` la r´alit´. les gens habitu´s ` cette derni`re.4. Mais peut-ˆtre mˆme cera e e e e tains. sont alors de plus mauvais points de vue pour l’intuition galil´enne. une intuition g´om´trique purement spatiale. e g´n´ralisons ce raisonnement en supposant que la dimension temporelle elle aussi est physiquement e e de mˆme nature que les trois autres. et rendons ce fait intuitif en repr´sentant le temps lui aussi e e par une dimension visuelle de l’imagination (en fait l’identit´ de nature n’est pas compl`te mais e e cette d´marche n’en est pas moins pertinente. sont donc invit´s ` se r´f´rer pour cela aux cours traditionnels e e e a ee sur ce sujet. e e e En voici le motif. au nom du sens e e des r´alit´s. e a e a ils d´clarent que la th´orie ne peut ˆtre appr´hend´e que par la rigueur des formules et des e e e e e d´monstrations. . elles fournissent naturellement trois formes d’imagination pour le th´oricien. Ainsi. ni adapt´ ` la compr´hension interne de la th´orie ` concevoir. oui mais lesquels et suivant quelle correspondance ? C’est ce choix malheureux d’un mode de repr´sentation fix´ arbitrairement. (D’o` la prolif´ration de pseudo physiu e ciens r´volutionnaires qui pr´tendent r´futer la relativit´ par de simples exp´riences de pens´e. Pour une nouvelle approche de la th´orie e Nous aborderons la relativit´ restreinte par une pr´sentation intuitive qui consiste ` employer. En effet. elles ne peuvent qu’ˆtre des a e e relations entre des param`tres qui correspondent ` la r´alit´. risquent de mal accepter de ea reprendre les choses ` z´ro en changeant ainsi compl`tement d’approche. laquelle se d´finit comme objet de e a e e e nos sens et donc de notre intuition. e e e e 2. ) e e On pourra aussi lui reprocher de n’ˆtre pas plus simple. e Alors. e au nom du sens des r´alit´s physiques. ou mˆme ceux qui e ea e a e e ayant commenc´ ` l’apprendre voudraient qu’on la leur explique mieux. . en rejetant toute inspiration intuitive. ils prouvent l’unicit´ de la th´orie sans la donner ` come e e e a prendre vraiment.

u e e Pouvez-vous imaginer cela ? Vous allez dire : bien sˆr. Passons donc au contenu conceptuel de la relativit´. pour ne pas d´pendre d’arri`re-pens´es qui risqueraient d’ˆtre contre-productives. mais e e seulement relativement ` l’univers habituel de l’enseignement universitaire.en quelque sorte l’avantage de permettre de formuler la th´orie et r´soudre des probl`mes sans faire e e e vraiment le travail de la comprendre et de rentrer dedans : “il suffit” d’´crire les d´monstrations e e et d’appliquer les formules. l’approche qui sera propos´e ici serait nouvelle non pas en elle-mˆme. en vue de faire face ` la plupart des probl`mes. non ? 12 . Cependant. cet avantage qu’on peut trouver jusqu’` la formulation a de la th´orie risque de se transformer en handicap ensuite. ou dont l’utilisation n´cessite des pages de calcul. port´s par l’intuition qui les accompagne. Mais e e la relativit´ restreinte doit ˆtre forc´ment quelque chose de plus compliqu´ encore. lorsque face ` un probl`me concret on e a e se perd devant ces formules qu’on ne sait pas toujours comment appliquer ou manipuler. pourquoi donc une telle r´novation de son enseignement ne s’est-elle jamais produite e depuis que tant de physiciens l’ont si bien acquise ? La r´ponse est simple. Le fait que la relativit´ ree e e e e streinte a le titre de th´orie physique ´quivaut ` dire que le monde imaginaire que nous allons e e a maintenant pr´senter correspond math´matiquement ` l’espace-temps de notre univers dans le doe e a maine d’approximation consid´r´. e Voici: Imaginons un monde o` toutes choses mat´rielles sont fixes. Il suffira ` la fin. de reprendre les divers outils d’´tude a e e de la g´om´trie euclidienne. comme en t´moignent maints d´veloppements ult´rieurs de la physique th´orique ayant e e e e suivi historiquement la d´couverte de la relativit´.. On observe en effet que les lourdes fore e mules (“transformation de Lorentz” et ce qui s’ensuit) pr´tendument constitutives de la relativit´. le plus int´ressant ´tant d’aller de l’avant dans e e son utilisation. e Enfin. et de pr´ciser comment ils e e e e sont modifi´s dans la nouvelle g´om´trie. n’apparaissent plus telles quelles dans les chapitres de relativit´ g´n´rale. Le sch´ma de la th´orie e e En vertu de ce qui pr´c`de. ce genre de situation u est un cas particulier de l’exp´rience de la vie de tous les jours. laquelle est plus compliqu´e. quand u a e e e a tout sera clairement compris. de remarquer simplement : “Et pourquoi pas ?”. c’est trop facile. il e n’est pas n´cessaire de d´velopper tellement de formules sp´cifiques comme si c’´tait une th´orie e e e e e totalement ´trang`re ` nos connaissances courantes. en ´quilibre. en sorte de pouvoir assimiler a tranquillement les notions qui le constituent comme si cela n’avait aucun rapport. car la partie essentielle de la relativit´ est une e e a e g´om´trie au fond tr`s similaire ` la g´om´trie euclidienne (comme on l’expliquera plus loin) : il e e e a e e suffit donc. la meilleure fa¸on de comprendre l’espace-temps est de come e c mencer par renoncer ` la tentative de le comprendre en tant que tel. e e e Et pourtant. 3. Donc. ine e e e tervient un simple objet (une “m´trique” dite “pseudo-euclidienne”!) qui t´moigne de l’assimilation e e r´elle de cette nature g´om´trique de l’espace-temps dans l’esprit des physiciens. Mais finalement.1. A leur place. Mais ce fait n’a pour le moment aucune importance dans la ee mesure o` il n’apporte rien ` la compr´hension de la th´orie elle-mˆme. on pourrait ˆtre tent´ de penser qu’elle ne serait pas compl`te. e e e ´lectrodynamique classique ou autres th´ories fond´es sur la relativit´ restreinte. mais seulement ´trang`re e e e a ` notre monde habitu´ ` juger les connaissances des ´l`ves et ´tudiants d’apr`s leur capacit´ ` e a ee e e e a r´diger des d´monstrations dans les formes r`glementaires : c’est qu’un abˆ e e e ıme s´pare parfois la e claire assimilation personnelle d’une connaissance. le point de vue que la pr´sentation qui suit vise ` exprimer n’est pas r´ellement e a e nouveau. omettant les formules e e e consacr´es r´put´es n´cessaires ` la r´solution exacte des probl`mes pratiques (en confondant soue e e e a e e vent le caract`re “pratique” d’un probl`me avec l’emploi arbitraire des r´f´rentiels galil´ens ainsi e e ee e que du vocabulaire et des formes d’imagination associ´s dans sa formulation). C’est pour eux e e e si naturel qu’il est inutile se s’attarder sur ce fait. a Alors. de la capacit´ ` trouver les mots justes pour la ea traduire en une forme verbale claire et transmissible. e e tout en restant vraies. Nouvelle pr´sentation de la relativit´ restreinte e e 3. sinon on l’aurait e e e e comprise depuis longtemps.

Il ne reste qu’` y ajouter les trois points suivants. de mani`re analogue ` la construction de la g´om´trie euclidienne (le moyen le plus e e e a e e commode ´tant probablement l’introduction d’un produit scalaire sur l’espace vectoriel associ´). – Le changement de g´om´trie: l’espace dans lequel les choses sont ainsi dispos´es ob´it ` une e e e e a g´om´trie diff´rente de celle qui nous est famili`re. – Le rapport de cette g´om´trie ` la perception spatio-temporelle que nous en donne l’exp´e e a e rience. passer ` e e a e e a la dimension 3 ou 4 serait un exercice d’intuition difficile mais secondairement utile. Cette diff´rence de g´om´trie est faible en soi. il n’est pas exactement suffisant d’imaginer un monde immobile. e e Il y a environ trois mani`res possibles de l’introduire. et cela suffit ` r´aliser l’essentiel e e a e du travail de pr´sentation des nouveaut´s par rapport ` la g´om´trie euclidienne. Elle masque son analogie profonde avec la e g´om´trie euclidienne. En effet. mais math´matie quement la diff´rence est accessoire. alors que nous ne sommes habitu´s qu’aux dimensions 2 et 3. ces deux choses nous e e sont famili`res. qui consiste en une sorte de transformation “magique” (non rigoureuse) qui fait la correspondance entre g´om´trie euclidienne et g´om´trie pseudo-euclidienne. e e e e e – L’expression math´matique de la m´canique de l’´quilibre et les propri´t´s m´caniques des e e e ee e particules. nous l’appellerons la g´om´trie e e e pseudo-euclidienne. mais non les in´galit´s. e e car il est plus facile d’y exercer l’intuition visuelle de la g´om´trie. La deuxi`me est qu’il ne s’agit e e pas l` de la g´om´trie euclidienne de dimension 4 qui g´n´ralise automatiquement celles du plan a e e e e et de l’espace usuels. qu’on ne pourrait e e e e pas facilement expliquer de mani`re simple et purement logique sans s’appuyer sur l’exp´rience e e visuelle (par exemple ` un aveugle qui n’aurait au d´part aucune exp´rience de l’espace. Mais nous avons de la chance. qui peuvent s’introduire chacun e a ind´pendamment des autres. e e Comme ces deux premi`res m´thodes se trouvent facilement par ailleurs. Comme la g´om´trie euclidienne. il faut donc la d´finir. pour d´crire e e e la disposition des diff´rents objets en ´quilibre. e Cette exp´rience n’est math´matiquement pas une chose triviale du tout. li´es au cˆne de lumi`re e e e e e o e (que nous verrons en dernier). mais nous sommes tellement marqu´s e e e e e par notre habitude que cette diff´rence peut nous sembler extraordinaire et insurmontable. Dans cette correspondance. avant e e e d’appliquer finalement le r´sultat ` une valeur n´gative. Mais c’est une autre g´om´trie qui a de fortes parent´s avec la g´om´trie e e e e e euclidienne. e Cette m´thode s’exprime math´matiquement par la notion de prolongement analytique: on e e d´montre des formules ou relations g´om´triques pour les valeurs positives d’une variable. De mˆme pour la notion d’´quilibre. mais qu’elle permet de r´utiliser les connaissances na¨ e ıves et les m´thodes g´n´rales dont on e e e dispose en g´om´trie euclidienne. s’il en a e e existe). car d’un point 13 .Certes. ainsi qu’` pr´ciser certaines interactions particuli`res qu’il y a entre e a e e eux. Or e e e e la g´om´trie euclidienne est en fait une th´orie math´matiquement complexe. il faut faire appel au langage de la g´om´trie. il y a deux diff´rences de g´om´trie. en appliquant finalement une simple traduction des r´sultats e e e pour obtenir ceux correspondants en g´om´trie pseudo-euclidienne. et quelques diff´rences. la nouvelle g´om´trie n’´tant pas partice e e e e e uli`rement plus compliqu´e que la g´om´trie euclidienne. e e e e e e Nous nous contenterons de l’introduire en dimension 2 (g´om´trie du plan pseudo-euclidien). e Plus pr´cis´ment. Ensuite. en privil´giant les structures qui lui sont sp´cifiques. Elle a donc l’avantage de nous e e permettre de transporter directement dans la nouvelle g´om´trie des intuitions tr`s diverses que e e e nous avons pu h´riter de l’exp´rience en rapport avec la g´om´trie euclidienne sans n´cessiter leur e e e e e reconstruction math´matique. Une deuxi`me m´thode consiste ` en donner une construction math´matique ` partir de la e e a e a g´om´trie affine. La premi`re serait de partir de principes e e physiques dont l’invariance de la vitesse de la lumi`re. Suivant un certain usage. e e e e Son avantage est qu’elle ne n´cessite pas de remonter aux fondements math´matiques de la g´om´e e e e trie. ce que nous pr´sene e e terons ici sera une troisi`me m´thode (non qu’elle soit meilleure dans l’absolu mais qu’elle a aussi e e des avantages qui lui sont propres). avantage dont nous ne nous priverons pas par la suite. L’essentiel de la complexit´ des choses se trouve contenu dans e e ce type particulier d’exp´rience quotidienne. elle existe en dimension quelconque n ≥ 2. les ´galit´s e a e e e sont g´n´ralement pr´serv´es. La premi`re est la dimension: elle vaut e e e e e e 4.

autrement dit celui de notre exp´rience quotidienne d’objets fixes. Donc si la ligne d’univers d’un observateur est superpos´e e e e e 14 . e Les deux autres probl`mes. est semblable ` un fil dispos´ dans l’espace en une courbe appel´e sa ligne d’univers. a Un observateur peut. u e Dans cette histoire. La sensation e e d’acc´l´ration est d´finie par la courbure de cette ligne de la mˆme mani`re que la force centrifuge ee e e e dans une voiture roulant ` vitesse constante est d´finie par la courbure de la route ou de mani`re a e e ´quivalente par la position du volant. le rapport ` l’exp´rience et la m´canique. donc ils d´pendent de cette g´om´trie. non l’autre observateur lui-mˆme (car seule la ligne d’univers est mat´rielle). il visite le monde en parcourant sa ligne d’univers a a ` vitesse constante. tout peut e e encore se produire dans les trois dimensions restantes suivant les lois normales de la m´canique e relativiste. pour e e e bien en comprendre la nature. le temps au cours duquel les choses paraissent ´voluer n’est pas un temps e objectif. e a e e L’id´e est que ce fil en tant qu’espace de dimension 1 joue le rˆle de ligne du temps personnel de e o l’observateur. Lien ` l’exp´rience a e La question du rapport de cette r´alit´ ` notre exp´rience de l’espace et du temps. grˆce au fait que ces g´om´tries ont toutes en coma e e mun le mˆme langage fondamental (la mˆme liste de structures. cette question s’applique ` la visite d’un monde de dimension n ≥ 2 o` les choses e e a u sont fixes (et pour lesquelles le temps n’existe donc pas). nous avons d´j` effleur´ la r´ponse en introduisant la g´om´trie euclidienne : physiqueea e e e e ment. e e Nous les exprimerons donc en invoquant les structures g´om´triques suivant le langage de e e la g´om´trie euclidienne. de dimension quelconque). en sorte qu’il nous apparaisse sous u forme d’un monde de dimension 3 o` les choses ´voluent ? u e En g´n´ral. est la seule e ea e question facile. ´tant v´cu s´par´ment pour chaque observateur. La question est celle-ci: de quelle mani`re e e visitons-nous ce monde de dimension 4 o` les choses sont fixes. e Une horloge est physiquement semblable ` un observateur: c’est aussi un fil dispos´ dans a e l’espace. Le fait que l’expression de la m´canique relativiste soit la mˆme que celle de l’´quilibre e e e s’explique simplement : l’´quilibre est la situation de la m´canique relativiste o` les syst`mes e e u e mat´riels ne subissent aucune ´volution dans une certaine direction temporelle. La loi de l’´quilibre est donc la mˆme que la m´canique e e e relativiste avec une dimension de moins. elle n’apporte aucune e e information sur les lois de la physique elles-mˆmes. e e En fait.de vue abstrait cette g´n´ralisation est quasi automatique et ne comporte que peu de ph´nom`nes e e e e nouveaux (qu’on abordera par la suite. alors. On postule que cette vitesse de parcours est une constante universelle not´e v. mais on n’a pas souvent besoin en pratique de tenir compte de toutes les dimensions en mˆme temps). on ne peut d´finir physiquement son unit´ qu’en termes de la longueur de e e courbe parcourue ` cette vitesse. seules les propri´t´s de certaines e e ee de ces structures pr´sentent des diff´rences). mais il n’a de sens que subjectif. Cependant. vu e qu’ici la taille de la Terre est finalement n´gligeable car elle vaut moins d’un dixi`me de secondee e lumi`re). ` la seule diff´rence pr`s que la dimension temporelle (plus pr´cis´ment la direction a e e e e temporelle en question) n’intervient plus. chaque observateur (ou son corps ou son vaisseau spatial ou mˆme la Terre si on veut. et e e e e n’ayant donc pas d’autres relations n´cessaires a priori avec celui des autres que celles s’´tablissant e e par l’interm´diaire des choses mat´rielles qui sont fixes.2. observer la ligne d’univers d’un autre observateur. mais gradu´ r´guli`rement. ce qu’il fallait d´montrer. s’appuient sur les struce a e e tures g´om´triques de l’espace. qui ne n´cessite pas de travail math´matique important. de sa ligne d’univers. Et il sera permis de les interpr´ter effectivement dans le cadre de la e e e g´om´trie euclidienne. ils peuvent e e e e e s’exprimer de la mˆme mani`re avec n’importe laquelle de toutes ces g´om´tries (euclidienne ou e e e e pseudo-euclidienne. on peut lui donner num´riquement la valeur qu’on veut puisque le temps e e ´tant ainsi une quantit´ subjective et non physique (les objets physiques ne peuvent pas le mesurer e e puisqu’ils sont fixes). Ainsi. e 3. le laissant percevoir sous la forme d’un monde de dimension n − 1 o` les choses ´voluent. comme un train suivrait une voie ferr´e ` vitesse constante ou comme une e a impulsion lumineuse suit une fibre optique. au cours de son temps ` lui.

e a e e La premi`re information est la condition pour qu’une courbe th´orique puisse ˆtre le lieu d’une e e e ligne d’univers (d’un observateur ou d’une particule). qui ne correspond ` rien dans e e e a ce mod`le euclidien) au fait de donner ` ce v −2 une valeur n´gative. e e ne seraient-ils pas paradoxaux d’un point vue purement logique en l’absence de support visuel explicatif : – Quand on voit au loin un camion avancer de gauche ` droite. ce qui en g´om´trie pseudo-euclidienne ne peut pas ˆtre une direction “spatiale”) e e e pour ˆtre la direction de droite d’univers d’un observateur ou des observateurs choisi(s) comme e r´f´rence. Ajoutons quelques remarques. e a e Les paradoxes de la relativit´ viennent des effets g´om´triques qui se pr´sentent dans leur e e e e complexit´ mais coup´s de l’intuition g´om´trique explicative. ee Vocabulaire. ce qui e e n’est plus vrai en g´om´trie pseudo-euclidienne. comment se e fait-il qu’il est plus gros lorsque son axe est inclin´ par rapport au plan de coupe que lorsqu’il lui e est orthogonal (contraction relativiste des longueurs) ? Voil`. e e e e On peut v´rifier que la th´orie galil´enne de l’espace-temps s’obtient comme limite de ce mod`le e e e e lorsque la vitesse de parcours v des lignes d’univers tend vers l’infini. une courbe referm´e sur elle-mˆme e e e e 15 . En effet. il voit au cours de son temps personnel les graduations de l’horloge d´filer ` un rythme r´gulier. Notamment. en g´om´trie euclidienne toute e e courbe pouvait ˆtre le lieu de disposition d’un fil (qui permet de d´finir l’abscisse curviligne). Par commodit´ pour la suite de cet expos´. et par rapport ` la th´orie a e galil´enne. pourquoi r´tr´cit-il subitement a e e lorsque son chemin se tourne vers nous ou vers le lointain (dilatation relativiste du temps) ? – Pourquoi ses deux roues avant qui ´taient superpos´es se s´parent-elles par rapport ` nous e e e a (relativit´ de la simultan´it´) ? e e e – Pourquoi cela prend-il des temps diff´rents pour aller d’un point ` un autre suivant des e a chemins diff´rents. a Un r´f´rentiel galil´en est la donn´e d’une direction temporelle (i. e u e Par exemple. nous emploierons le qualificatif de e e “th´orique” comme d´signant l’emploi du mode de repr´sentation g´om´trique de l’espace-temps. ee Cet usage quelque peu d´tourn´ des termes oppos´s de “th´orie” et “exp´rience” ne devrait e e e e e pas prˆter ` confusion puisque leur usage normal auquel il fait concurrence n’apparaˆ e a ıtra pas dans cet expos´ (o` tout est th´orique au sens usuel). e e Les effets g´om´triques suivants. Donc les effets relativistes (exprim´s ` l’aide de c) sont finalement invers´s par rapport ` ceux e a e a qu’on obtiendrait normalement dans la situation telle que nous venons de la d´crire dans le cas de e la g´om´trie euclidienne. en d´finissant la grosseur d’un saucisson par la largeur de ses rondelles. A la description ci-dessus il faut ajouter deux informations n´cessitant l’usage de e notions sp´cifiques ` la g´om´trie pseudo-euclidienne. puis en tenant compte de sa forme pseudo-euclidienne). l’essentiel est dit. comme une bonne horloge doit se comporter. la notion th´orique de point est d´sign´e exp´rimentalement par le terme d’´v`nee e e e e e ment. e e e e e o` les choses apparaissent fixes (pouvant se comprendre d’abord comme si la g´om´trie ´tait euu e e e clidienne. qu’on peut parcourir ee e e comme temps. exactement inverses des effets relativistes correspondants. le travail de changement de g´om´trie que nous ferons plus loin peut se r´sumer e e e (si on oublie les exp´riences faisant intervenir la lumi`re elle-mˆme. le pr´sent mod`le apporte des corrections dont le premier terme a une amplitude de e e e l’ordre de v −2 . a ıt a e Remarque 1. Or. suivant la formule e a e v 2 = −c2 . alors qu’on y va dans tous les cas ` la mˆme vitesse (paradoxe des jumeaux) ? e a e – Enfin. A cela s’opposera le qualificatif d’“exp´rimental” pour d´signer la description donn´e par les apparences exp´rimentales ordinaires e e e e de fixit´ ou de non fixit´ dans l’espace ` 3 dimensions que peuvent prendre les objets de la m´canique e e a e relativiste par rapport ` un r´f´rentiel donn´ (la fixit´ qualifiant les syst`mes invariants par transa ee e e e lation temporelle suivant le r´f´rentiel). c’est-`-dire un point qui pour un observateur n’apparaˆ qu’` un instant pr´cis.e.a ` celle d’une horloge (il garde l’horloge avec lui).

e e e e o` l’axe du temps (d’´quation x = 0) est le petit axe de l’ellipse. est donn´e par la lumi`re. aux deux modes de repr´sentation e e e e habituels de la g´om´trie: les dessins (dans le plan habituel). ` partir d’un tel rep`re principal. t. ` l’aide de la g´om´trie euclidienne du dessin on peut copier l’unit´ de longueur apparente a e e e d’un axe sur l’autre). Puis. qui arrive “` la vitesse de la lumi`re”. les autres cercles se d´finissent o e comme ´tant les ellipses obtenues ` partir de celle-ci par homoth´ties et translations. orthonorm´ sur le dessin e e e (en effet. Les vecteurs t et x semblent tous deux de norme 1 sur e le dessin. Les coordonn´es seront not´es (t. Cet emploi purement artificiel du vocabulaire d’espace et de temps pour d´signer les coore donn´es est seulement motiv´ ici par le fait qu’un point parcourant l’“axe du temps” ` la vitesse v e e a aura une vitesse apparente ´gale ` 1 sur le dessin. mais en fait ||x|| = k||t|| = 1.3. ainsi qu’une distinction entre mati`re et esprit. de sorte qu’on ne puisse pas remonter le temps. On aura donc v = k −1 . e e a Les cercles Un cercle a sur le dessin l’aspect d’une ellipse. qui sont des droites orthogonales (aussi bien en r´alit´ que sur le dessin. Un d´faut superficiel de cette vision est qu’elle semble porter une conception fatale iste du monde (philosophie d’apr`s laquelle toutes choses ` venir seraient ´crites avant qu’elles ne se e a e produisent). car par rapport ` la r´alit´. La direction du petit axe et le rapport mesur´ sur le dessin ee e k= longueur du petit axe longueur du grand axe d´pendent du point de vue employ´ pour faire le dessin. e e la succession des points d’une ligne d’univers doit respecter l’ordre temporel (ou ordre de causalit´): e c’est une relation d’ordre partiel qui se conserve par le groupe des rotations-translations th´oriques. Notons (O. e Il est ´vident qu’une telle relation d’ordre ne peut pas exister dans le cas de la g´om´trie euclidienne. x). Mais la sym´trie e e e centrale du plan pseudo-euclidien n’est pas une rotation. mais ne d´pendent pas du cercle. Etude d´form´e de la g´om´trie euclidienne plane e e e e Nous allons pr´senter ici la g´om´trie euclidienne exprim´e ` travers des modes de repr´sene e e e a e tation d´form´s. On ne peut alors se fier aux apparences du e e dessin qu’en ce qui concerne les notions de g´om´trie affine du plan. et l’axe d’espace (d’´quation t = 0) u e e est le grand axe. Puis les moyens ici n´cessaires pour g´rer une telle approche nous permettront e e e e “magiquement” de passer ` la g´om´trie pseudo-euclidienne. et qui n’exprime aucun v´ritable argument en faveur de l’une ou l’autre de e ces philosophies.n’est pas une ligne d’univers possible. La deuxi`me chose est de d´finir ce que l’observateur observe effectivement : l’image observ´e e e e en un ´v`nement d’observation. on peut supposer qu’elle repr´sente a e un cercle. en sorte que la “coordonn´e de temps” sur cet e a e axe s’identifie au temps de ce parcours. les autres rep`res qu’on se permettra d’utiliser seront a e e ceux qui sont r´ellement orthogonaux et ont les mˆmes valeurs des normes des vecteurs de base (et e e 16 . Pr´cis´ment. d’une mani`re non conforme ` ce qui se voit sur le dessin. Ensuite. e e o e e appel´ le cˆne de lumi`re pass´e. ayant choisi une ellipse pour jouer le rˆle de cercle. et les syst`mes de coordonn´es. Les autres notions doivent e e ˆtre reconstruites. e e e e Les dessins ne repr´senteront pas fid`lement les propri´t´s des figures g´om´triques que l’on veut e e ee e e ´tudier. e o e e e ee e e Remarque 2. leurs directions sont la seule paire de e e directions ayant cette propri´t´). mais seulement orthogonal en r´alit´. avec un grand axe et un petit axe. e e e Remarque: ` partir d’une ellipse quelconque dans un dessin. Nous d´crirons plus loin ses propri´t´s g´om´triques. comme e e lorsqu’on les voit de biais. e a e Les rep`res orthogonaux e Nous allons utiliser ces axes pour former un syst`me de coordonn´es. e e e e a e donc issue d’un ensemble d’´v`nements formant un cˆne de sommet l’´v`nement d’observation. 3. e e e puisque la sym´trie centrale y ´tant une rotation de pi radians la renverserait. de mani`re ´quivalente. a e e Cette d´formation s’applique. d’un point de vue ´loign´. Mais ce n’est l` qu’une impression li´e e a e a ` l’usage d’une forme d’intuition particuli`re choisie pour ses avantages pratiques de compr´hension e e de l’espace physique. x) ce rep`re. elles apparaˆ e a e e ıtront ´cras´es dans une certaine direction.

donc la mˆme valeur de k) sans tenir compte des apparences du dessin. mais on peut toujours regrouper e e e leurs apparitions en blocs de cos(kα). Cependant. la mesure en e e e e unit´ de temps de la norme d’un vecteur u de coordonn´es (t. ` A chacune de ces unit´s correspond de la mˆme mani`re une mesure du produit scalaire : e e e 2 2 u · u = tt + k xx ou v tt + xx . x) est donn´e par e e e ||u||t = t2 + k 2 x2 = t2 + x2 v2 et est la longueur apparente sur le dessin du vecteur obtenu par une vraie rotation de u pour l’amener sur l’axe du temps. pour cela on mesurera le rayon en unit´ de temps. les fonctions de k e e qui interviennent sont des fonctions analytiques de k 2 ). sans le traiter d’une mani`re diff´rente. le coefficient k et les fonctions e trigonom´triques n’apparaissent pas de mani`re ind´pendante. et la quantit´ v ou e e e e son inverse k est alors la constante universelle qui fait le lien physique naturel entre les deux. Ainsi.4. e e e et puisque sa valeur effective n’intervient pas dans les calculs formels. et le vecteur espace x = (0. cos(kα)). 1) sur (−k sin(kα). qui sont les longueurs r´elles des deux vecteurs de e e base principaux. Pr´cis´ment. k sera trait´ comme un nombre fixe. Nous allons consid´rer les mesures des distances r´elles. e ee e e e mais suivant deux unit´s de longueur possibles. a e e 43 2 1 4 1 2 3 1 0 k² t 4 3 2 x1 2 3 4 1 Figure r´elle ´tudi´e e e e Dessin utilis´ (agrandi ici) e Les distances Il ne sera pas question de mentionner les distances apparentes sur le dessin. on peut plus judicieusement l’interpr´ter comme ´tant non un nombre r´el mais une quantit´ dans le cas d’une ´tude en coe e e e e ordonn´es : les mesures en unit´s de temps et d’espace sont alors interpr´t´es non comme des e e ee nombres r´els mais des quantit´s ind´pendantes (des temps et des longueurs). l’unit´ d’espace vaut k fois l’unit´ de temps. et de mani`re analogue sa mesure en unit´ d’espace est donn´e par e e e ||u||x = k −1 ||u||t = v 2 t2 + x2 . ni aux rotations d’un angle droit. k −1 sin(kα)). (Ou plus g´n´ralement. e e L’unit´ d’angle utilis´e sera donc ´gale ` k radians. Les angles Les angles sont d´finis par le rapport de la longueur d’un arc de cercle ` la mesure du rayon. On remarque que tant qu’on ne s’int´resse jamais aux intersections d’un mˆme cercle avec e e les deux axes d’un rep`re. Les fonctions cos et sin utilisant comme il se e e e a doit la mesure des angles en radians. Nous exclurons dans la suite toute notion g´om´trique dans laquelle ils n’apparaissent pas ainsi group´s. e e e 3. e a Or. et la longueur de l’arc en unit´ d’espace. k −1 sin(kα) et k 2 . 0) sur le vecteur de composantes (cos(kα). car elles n’ont pas de rapport naturel avec la r´alit´ ´tudi´e. autrement dit des rep`res e e obtenus par de vraies rotations ` partir d’un rep`re orthogonal fix´ construit comme ci-dessus. Passage ` la g´om´trie pseudo-euclidienne a e e 17 . la rotation d’un angle α exprim´ dans cette nouvelle unit´ e e enverra donc le vecteur temps t = (1. Ainsi.

s’il est n´gatif. cet ordre co¨ e ıncide alors avec l’ordre du temps v´cu par le visiteur qui suit cette ligne. En fait. c’est-`-dire par le signe de son carr´ scalaire. u est du genre espace et ||u|| peut seulement se mesurer e e en unit´ d’espace. e On peut maintenant d´finir la relation d’ordre temporel entre les points du plan pseudoe euclidien: ´tant donn´s deux points M et N . Le vecteur u est appel´ un vecteur futur si en ce sens u2 ≥ 0 et t ≥ 0. les vecteurs de lumi`re forment deux droites s´cantes qui divisent le plan en quatre parties. Les in´galit´s qui ´taient vraies en g´om´trie euclidienne ne le sont g´n´ralement plus ici. e e dont l’une est constitu´e des vecteurs isotropes ou du genre temps tels que t ≥ 0. x) on ne peut e e e plus choisir arbitrairement entre l’unit´ de temps et celle d’espace. e e e e e e Pr´cis´ment. a e Contrairement au cas pr´c´dent. on pose que M ≤ N (M est ant´rieur ` N ) si e e e a −→ − et seulement si M N est un vecteur futur. qui ne peuvent pas atteindre la vitesse de la lumi`re: pour la ligne d’univers d’un photon les vecteurs tangents sont de carr´ scalaire nul tandis e e que pour celle d’une particule de masse non nulle ou d’un observateur.Pour passer de l’´tude d´form´e de la g´om´trie euclidienne ` celle de la g´om´trie pseudoe e e e e a e e euclidienne (dont toute r´pr´sentation est n´cessairement d´form´e). parmi les lignes d’univers possibles de M ` N . s’obtient ` partir du mod`le e e a e pr´c´dent par la formule e e v 2 = −c2 (= k −2 ) d’o` on peut d´duire que u e α α cos(kα) = cos( ) = ch( ) v c α α −1 k sin(kα) = v sin( ) = c sh( ) v c o` les fonctions cosinus hyperbolique ch et sinus hyperbolique sh sont d´finies par u e ch u = eu + e−u . t). mais ce ne sont pas des lignes d’univers possibles pour e des observateurs ou tout objet de masse non nulle. la g´om´trie pseudo-euclidienne. On peut v´rifier que ceci est bien une relation d’ordre. 2 sh u = eu − e−u . e 18 . tous les vecteurs tangents sont strictement de genre temps (de carr´ scalaire non nul). la ligne droite est a la plus longue ligne d’univers possible et la seule dont la longueur en mesure temporelle soit ´gale e a ` l’intervalle de temps de M ` N . il suffit de supposer k 2 n´gatif. e e Pour deux points M ≤ N . mais ce choix est d´termin´ par e e e le genre du vecteur. 2 (Ces expressions peuvent aussi se d´duire des calculs suivant les rep`res de lumi`re pr´sent´s plus e e e e e loin). Son carr´ scalaire compt´ en unit´ de temps au carr´ e e e e e vaut u2 = t2 − c−2 (x2 + y 2 + z 2 ). cette condition est ´quivalente ` demander e e a que la longueur de cette courbe soit une quantit´ bien d´finie. e − →2 − Si M ≤ N . u est un vecteur isotrope ou vecteur de lumi`re (sa e e direction est une direction possible d’un photon dans l’espace-temps) et ||u|| = 0. En e e e e e e e particulier. a Une courbe est une ligne d’univers possible ` condition que la relation d’ordre temporel cia dessus d´finie entre les points de la courbe soit un ordre total. soit le vecteur u = (x. pour mesurer la norme d’un vecteur donn´ u(t. le produit scalaire continue ` exister mais le carr´ scalaire n’est plus toujours positif. o` la correspondance naturelle entre les mesures e e e e u d’espace et de temps est exprim´e par la vitesse de la lumi`re c. Les plus courtes lignes sont de longueur nulle et constitu´es de a e segments ayant des directions de lumi`re. et du vecteur e nul : ce sont les vecteurs futurs. y. z. l’intervalle de temps (distance en mesure temporelle) de M ` N est M N . ensemble qui forme un plan). Plus g´n´ralement. disons ici (celui en unit´ de temps a e e au carr´) t2 − c−2 x2 : s’il est positif. En fixant l’origine du plan (ou mieux en regardant l’ensemble des vecteurs. cette notion de d´finit en dimension plus grande: dans un syst`me de e e e e coordonn´es. s’il est nul bien que u = 0. le vecteur u est du genre temps et ||u|| peut seulement se e mesurer en unit´ de temps.

Celles d’un mˆme e e e genre sont l` encore celles obtenues ` partir de l’une d’elles (qu’on peut choisir arbitrairement) par a a homoth´ties et translations. y) par des coordonn´es e e e e d’espace-temps (t. de deux genres possibles (le genre d’un cercle ´tant celui de ses rayons). Tous les cercles (des deux genres) sont les hyperboles ayant la mˆme e e paire de directions des asymptotes. en imitant l’´criture en nombres a e e e complexes de la g´om´trie euclidienne. x = k −1 y). de rendre certains calculs en quelque sorte plus simples ou e e explicites. En notant (a. Les vecteurs a e e a e de lumi`re sont les vecteurs orthogonaux ` eux-mˆmes. puisque la longueur d’un arc de cercle est proportionnelle ` a l’angle qui se voit aussi comme angle de rotation. e a e 1 2 3 4 0 c -2 t 1 x 1 2 3 4 2 1 3 4 1 2 3 4 Les rep`res de lumi`re e e Le plan pseudo-euclidien admet un nouvel outil d’´tude par rapport ` la g´om´trie euclidienne : e a e e l’utilisation d’un rep`re dont les deux axes sont suivant les directions de lumi`re. x ) d´finies par (t = x. qui sont les directions de lumi`re. En effet. e Exemple de calcul concret Enonc´ e Imaginons un voyageur qui part de la Terre en subissant de son propre point de vue une acc´l´ration g pendant une dur´e t1 . Deux droites sont orthogonales si et seulement si on peut passer de l’une ` l’autre par sym´trie a e par rapport ` une droite de lumi`re et parall`lement ` l’autre direction de lumi`re. Le carr´ de i ´tant alors positif. Cette formule admet donc deux solutions r´elles i = ±c−1 e e e qui correspondent aux deux coordonn´es dans un rep`re de lumi`re.Les cercles de cette g´om´trie sont non plus des ellipses particuli`res mais des hyperboles partie e e culi`res. b) e e les coordonn´es dans un tel rep`re. la rotation d’un angle α autour de l’origine s’exprime par e e a = a exp( α ) c b = b exp(− α ) c On peut remarquer le rapport avec l’utilisation des nombres complexes en g´om´trie euclie e dienne. d’o` e u 2 2 −2 i = −k = c . o` la rotation d’un angle α s’exprime par la multiplication par exp(iα). Chaque cercle est en deux e branches de longueur infinie chacune. puis continue sur sa lanc´e sans acc´l´ration pendant une ee e e ee 19 . C’est ainsi le fait de pouvoir e e e regarder les solutions de cette ´quation (au lieu de la conserver telle quelle lors des calculs) qui e est nouveau par rapport ` la g´om´trie euclidienne et permet. Il est facile de voir que le coefficient exp( α ) est la mesure de l’effet Doppler (le nombre par c lequel se multiplie la fr´quence d’une onde ´lectromagn´tique lors de cette rotation). abordons cette e e e fois le probl`me en unit´ de temps. et que les rotations peuvent toujours se composer (additionnant les angles) sans jamais boucler un tour. et en repr´sentant le plan euclidien (x. e e e L’ordre temporel M ≤ N s’exprime dans un rep`re de lumi`re par le mˆme ordre sur chacune e e e des coordonn´es : (aM ≤ aN et bM ≤ bN ). en u coh´rence avec la d´finition de la nouvelle unit´ d’angle que nous avons introduite. Cette d´formation des coordonn´es se e e e r´percute sur l’´criture des nombres complexes: on remplace l’emploi de i par celui d’un certain e e i pour pouvoir toujours ´crire le “nombre complexe” sous la forme z = x + iy = t + i x .

e e e Solution Traduisons d’abord l’´nonc´ de ce probl`me dans le langage de la g´om´trie euclidienne. Visions de la relativit´ de la simultan´it´ ` une dimension e e ea Dans les sections 3. plus pr´cis´ment la vitesse d’´chappement du champ de gravitation terrestre). Enfin. en braquant dans l’autre sens de la mˆme mani`re on parvient e e e apr`s encore une dur´e t1 ` redresser le v´hicule sur une route droite parall`le ` la Terre. il faut n´gliger d’une certaine mani`re la e a e e e e e pesanteur terrestre. e e L’image du monde qu’un observateur situ´ en un point re¸oit alors en un instant.5 et 3. le volant ´tant braqu´ dans une certaine position qui lui fait sentir a e e e une pouss´e lat´rale g pendant une dur´e t1 . 20 . et enfin d´c´l`re suivant la mˆme acc´l´ration qu’au d´part en sens contraire. et reste e e e e ainsi pendant une dur´e t2 . quelle est la diff´rence e e e de dur´e mise pour y atteindre le point d’arriv´e B ` partir du point de d´part A. la ligne droite ´tant plus longue que la ligne courbe comme e e e on l’avait annonc´. e On en d´duit par une observation g´om´trique ´l´mentaire e e e ee d = 2R(1 − cos(kα)) + vt2 sin(kα) = 2v 2 g −1 (1 − cos(kt1 g)) + vt2 sin( t1 g ) v d B donc en utilisant la “formule magique” v 2 = k −2 = −c2 on obtient le r´sultat au probl`me de e e relativit´ e t1 g t1 g d = 2c2 g −1 (ch( ) − 1) + ct2 sh( ). e e e e e Partant d’une route droite appel´e “Terre”.dur´e t2 . A quelle e e ee e ee e distance d de la Terre se trouve-t-il alors ? Et s’il revient ensuite sur Terre de la mˆme mani`re. Puis brusquement le volant est redress´. le v´hicule parcourt un arc de cercle de longueur t1 en unit´ e e e e −1 de temps ou vt1 en unit´ d’espace. son vecteur vitesse est constant ee e de norme c). d’angle α = t1 g (ce qui donne en radians αk = t1 gv ) et de e rayon (en unit´ d’espace) R = v 2 g −1 . A partir d’ici il est possible de passer directement au chapitre suivant (m´canique classique). e 3. e e de combien sera la diff´rence ∆t entre la dur´e de son voyage pour lui et pour quelqu’un rest´ e e e immobile sur la Terre ? (Pr´cisons que pour que ce probl`me soit effectivement trait´ par la e e e relativit´ restreinte sans faire appel ` la relativit´ g´n´rale.5. nous allons ´tudier les propri´t´s de ce qu’on voit exp´rimentalee ee e ment.6. par la lumi`re qui se propage dans le vide dans l’espace-temps de la relativit´ restreinte. par rapport ` e e a e a un v´hicule qui les aurait reli´s en restant sur la route droite “Terre” ? e e Véhicule R A t1 t1 t2 Terre Pendant la dur´e de la pouss´e. e Note. A quelle e e a e e a distance de la Terre se trouve-t-on alors ? Si on revient de la mˆme mani`re. un v´hicule (allant ` une grande vitesse constante e e a v = k −1 ) se met ` d´vier. La ligne d’univers d’un photon est une droite de l’espace-temps de direction isotrope (dans tout r´f´rentiel galil´en. est donn´e e c e par l’ensemble des photons qui lui parviennent. c c De mˆme on calcule la diff´rence de longueur en mesure temporelle entre la courbe et la ligne e e droite : ∆t = 4(t1 − kR sin(kα)) + 2t2 (1 − cos(kα)) = 4(t1 − cg −1 sh( t1 g t1 g )) + 2t2 (1 − ch( )) c c qui est finalement une quantit´ n´gative.

Ceci forme e 21 . t − x) pr´sente l’immense avantage de e e e r´duire les “rotations” du plan pseudo-euclidien. la pertinence de l’intuition temporelle (que nous avons e e jusqu’ici consid´r´e comme nulle pour ne pas en abuser) sera. C’est l’effet nomm´ e e e “relativit´ de la simultan´it´”. celui d’ˆtre d´fini par la formule t = 1 ((t + x) + (t − x)) ` partir des coordonn´es e e e 2 de lumi`re t + x et t − x qui correspondent ` des mesures de temps de r´ceptions de photons par e a e des horloges consid´r´es comme fixes. On passe des coordonn´es (t. ` condition de fonder a e e e e a ses motivations exp´rimentales non sur des constructions artificielles mais en termes de ce que e l’exp´rience elle-mˆme nous propose. e Nous avons vu que ce syst`me de coordonn´es (t + x. On peut alors se demander si cette repr´sentation est d´finitivement inutilisable e e e e comme aide ` la compr´hension des ph´nom`nes. t − x) dont e e e e e l’une donne la mesure de la date d’observation par un observateur immobile (x0 = constante). sauf effet de perspective o` la largeur de e u l’observateur lui permet de reconstituer une information sur la profondeur. suivant l’ascisse x de l’´v`nement observ´ (` une constante additive pr`s ±x0 . On d´finit alors le temps des ´v`nements sur S sous forme du temps qu’indique l’horloge de e e e O lors de la perception en O des photons qu’ils ´mettent. de αt. e Que deviennent les vecteurs t et x d’une base orthogonale de ce plan lors d’une telle rotation ? Remarquons qu’il suffit de d´crire au premier ordre d’approximation l’effet d’une rotation de petit e angle α. Un premier cas est celui o` l’observateur se trouve sur la droite mˆme o` ont lieu les ph´nou e u e m`nes observ´s. e Dans cette section 3. e Nous avons donc besoin d’une situation exp´rimentale donnant ` un observateur de percevoir e a naturellement des ´v`nements se produisant sur un segment d’une droite spatiale D au cours du e e temps (en fait on peut ´tendre automatiquement cette exp´rience ` la perception d’un morceau e e a de plan au cours du temps). soit un observateur O ´loign´ de D dans une direction autre que e e celle de D (par exemple perpendiculaire ` D mais pas n´cessairement) ` une distance infiniment a e a grande par rapport ` la longueur de S. de toute fa¸on la e e e a e c mesure du temps n’a de sens physique qu’` une constante additive pr`s) : la premi`re (t + x − x0 ) a e e si x > x0 . artificielle. et leur position par la direction visuelle e de ces photons (dont la variation est infiniment petite. cela fait avancer le vecteur spatial x (directeur des droites d’instantan´it´). x) que nous avons utilis´es dans l’´tude geom´trique. car cette e e e notion de simultan´it´ d´finie par une ´quation de la forme t = constante dans un r´f´rentiel. car une rotation d’angle quelconque s’en d´duit en r´p´tant une rotation de petit angle e e e un grand nombre de fois. de la repr´sentation de la coordonn´e t sous e e forme du “temps” intuitif. posons S immobile par rapport ` O et a a infiniment petit par rapport ` sa distance ` O (on peut dessiner le tout comme vu point de vue d’un a a autre observateur immobile par rapport ` O. Donc en posant c = 1. e e e Voici cette exp´rience. e une “rotation” s’obtient en ´tirant l’un et en contractant l’autre. n’est e e e e ee au fond rien qu’un ´nonc´ sur cette coordonn´e t dont nous ne venons de voir qu’un rapport t´nu e e e e a e a ` l’exp´rience. e o e C’est de cette construction abstraite.Autrement dit. soit une droite au cours du temps. situ´ encore infiniment plus loin perpendiculairement a e au plan contenant O et D). La r´ponse est non. la deuxi`me (t − x + x0 ) si x < x0 . Cette coordonn´e de “temps” est bien diff´rente des notions ee e e physiques de temps. Alors. celle qui r´sidera dans ee e cette exp´rience. ` la multiplication de chaque coordonn´e par une e a e valeur de l’effet Doppler. On posera ici par convention c = 1. suivant des sensations visio-temporelles conformes aux coordonn´es e orthogonales d’espace-temps (t. il voit l’ensemble des points M tels que e e −→ − M O est un vecteur futur de carr´ scalaire nul. x) aux coordonn´es de lumi`re (t + x. autour d’une direction donn´e). que r´sulte ce ph´nom`ne a priori paradoxal de “relativit´ de la sie e e e multan´it´”. cette rotation qui fait e e e e e avancer le vecteur t d’environ αx fait avancer le vecteur x de −k 2 αt. il ne per¸oit pas le point c M lui-mˆme mais seulement la direction de droite (OM ). Nous savons que cette appellation ne doit pas nous abuser. l’ordre de causalit´ temporel e d´fini par le cˆne de lumi`re d’autre part. sans plus.5. Autrement dit. les temps que mesurent les horloges d’une part. Mais. Les ´v`nements ` observer se produisant en apparence sur un segment e e e a de droite S ⊂ D et dans certaines limites de temps (donc th´oriquement dans une certaine r´gion e e d’un plan P pseudo-euclidien). Dans l’´tude d´form´e de la g´om´trie euclidienne. l’une inverse de l’autre : ces deux axes ´tant de directions invariantes. on se concentrera sur les visions exp´rimentales possibles de la g´om´trie e e e du plan pseudo-euclidien. de son ´v`nement O d’observation.

s’il voit le plan P comme ´tant ` e ae e a chaque instant une droite D perpendiculaire ` la direction de son regard (la direction allant de O a vers S. Mais la lum`re ne lui en parvient que plus tard. donc il n’y a pas de raison e e a qu’une de ses extr´mit´s devance l’autre. pour des ´v`nement simultan´s par rapport ` O qui se e e e e a produisent sur S. Soit un autre e e e e a observateur en mouvement par rapport au premier mais le rencontrant ` l’instant de l’observation. l’unit´ a e de mesure de temps sera correcte si et seulement si D est immobile par rapport ` O (c’est-`-dire a a que sa distance ` D est fixe au cours du temps. a En cet instant. (En effet. C’est ce segment S qui doit ˆtre perpendiculaire ` sa direction ` e e e a a O . bien que de direction spatiale perpendiculaires ` D par rapport e e a a ` O . c e Ce raisonnement redonne la relativit´ de la simultan´it´. S ) comme ´tant une boˆ rigide tr`s a e e ıte e allong´e. O est parall`le ` P ). en particulier de O1 immobile par rapport a ` O. dit th´oriquement. e e e a Remarquons que la position visuelle d’un point de D peut ´galement se d´finir par une gradue e ation de D immobile par rapport ` O (chaque marque est th´oriquement une droite de P parall`le a e e a ` O). C’est donc le cˆne de lumi`re pass´e c o e e repr´sent´ sous forme projet´e sur le plan t = 0 parall`lement ` l’axe du temps. dans la direction de D. donc la direction de O ` S est ` chaque instant parall`le e a a e a ` celle de O ` S. Mais S doit recouvrir S quand ils se produisent. dans ce cas. a e e e a Nous n’allons pas ´tudier ici les rapports de toutes les observations possibles mais consid´rer e e seulement la question suivante. ceux qui sont en avant de S sont per¸us par O avant ceux qui sont en arri`re. sans regarder les mouvements de coulissement de a la droite D sur elle-mˆme. Sa mesure d’espace est alors correcte. Nous allons maintenant rendre compte de la relativit´ de la simultan´it´ quand on passe ` un e e e a deuxi`me observateur O en mouvement par rapport ` O. alors que O est d´j` ´loign´ de O. et la forme de la rotation pseudoe e e euclidienne en premi`re approximation. Or. et sa direction reste fixe). elle est lanc´e dans la direction orthogonale ` sa longueur. La condition d’orthogonalit´ est fausse pour O1 : les points en avant de S sont plus proches e de O1 que ceux qui sont en arri`re. ne sont pas perpendiculaires ` D par rapport ` O. O rencontre O. une dimension angulaire et une dimension de proa fondeur) qu’un observateur per¸oit du monde en UN instant. La subtilit´ se trouve dans a a e la mani`re suivant laquelle cette condition exp´rimentale se retrouve avec O . partons de la notion de simultan´it´ dans S relative ` l’observateur O par rapport e e a auquel S est immobile et perpendiculaire ` la direction qui le relie ` O. autrement dit. que nous avons mentionn´es. e e Pour que les conditions soient respect´es. le plan contenant la droite d’univers O et un rayon lumineux e vu est perpendiculaire ` P ).6. et rencontrant S lorsque a les ´v`nements s’y produisent. S est parall`le au mouvement. Transformation relativiste d’une photographie en relief Cas d’un espace-temps ` 2+1 dimensions (qui se g´n´raliserait ais´ment ` 3+1 dimensions). Ensuite. Les rayons lumineux e eae e arrivant en O de ces ´v`nements. e e O1 O’ O S’ S Soit S un segment immobile par rapport ` O . e a Pour cela. coulissant le long de D. Donc. pendant ce temps. pour le dire th´oriquement. il observe ´galement le monde en relief en recevant les mˆmes rayons lumineux que e e 22 . avec des mesures de temps et d’espace conformes e e a ` ce que nous avons d´crit ? R´ponse : il est orthogonal si et seulement si l’observateur O voit les e e points de S comme ´tant ` ´gale distance de lui. O doit observer des ´v`nements qui se produisent e e e sur S . e e 3. e e La question est alors : ` quelle condition ce syst`me de coordonn´es d’espace-temps est-il a e e orthogonal pour la g´om´trie pseudo-euclidienne. si on imagine le syst`me (O . Soit l’image en relief (` deux dimensions. Cette perception pour O correspond ` la a a a perception de tout observateur que O rencontre alors.un syst`me de coordonn´es affine de P .

Les droites doivent ˆtre rang´es parmi les branches d’hyperboles de foyer O e e e car elles sont ´chang´es avec elles par ces transformations. puisque o e e c’est l’image du sommet du cˆne de lumi`re. b. voyons le premier ordre d’approximation du r´sultat pr´c´dent ` red´montrer. ensuite. (La condition sur le petit axe a un ´quivalent ici mais qui est moins facile ` e a exprimer). Tout cela se d´duit ais´ment du fait qu’une ellipse de foyer O est l’image de l’intersection du e e cˆne de lumi`re avec un plan. Attention : les deux branches d’une mˆme hyperbole de foyer O se transforment en deux e branches d’hyperboles diff´rentes (on ne peut retrouver une correspondance qu’` travers une e a sym´trie centrale. il est immobile par rape e e e port au deuxi`me observateur O qui rejoindra le centre O de C lors de l’observation. pour un deuxi`me observateur e e de mouvement et de disposition convenables. Th´or`me 2. d’amplitude infinit´simale. L’origine O du plan y joue un rˆle privil´gi´. C co¨ ee ıncidera avec C lorsqu’il ´mettra sa lumi`re vers O. venus ` la vitesse de la lumi`re de a a e a e distances diff´rentes. donc approximae tivement un cercle de mˆme rayon mais de centre d´call´ par rapport ` O. ou encore au carr´ scalaire du vecteur u = (a. sa restriction ` toute ellipse de foyer O co¨ e a ıncide avec une transformation affine. . donc e e c’est un cercle par rapport au premier observateur O (donc ` un instant pr´cis pour O. . Sa restriction ` toute demi-droite issue de O est lin´aire. Quelle est alors la loi de transformation qui o e e e fait passer de ce que voit l’un ` ce que voit l’autre ? a Il s’agit d’une transformation du plan. e ee e a 23 . Quelles que soient deux ellipses de foyer O et de mˆme mesure du petit axe. de mˆme qu’` e e a e a toute branche d’hyperbole de foyer O. concernant l’effet sur un cercle e e e a e C de centre O : son image sera une ellipse de foyer O et de faible excentricit´. qui parviendront au centre ` un instant donn´. on remarque ensuite la contraction relativiste des longueurs : e cette ellipse C que O observe se contracte en un cercle (de diam`tre donn´ par le petit axe) en e e passant au premier observateur. Fin de red´monstration e e eee e (d’o` r´sulte la forme d’ellipse de C par propri´t´ de groupe. toute e e e restriction ` l’une d’une transformation affine qui l’envoie sur l’autre se prolonge de fa¸on unique a c en une transformation possible produite par ce type d’exp´rience. Donc il n’en e est pas le centre. il suffit e de les justifier au premier ordre d’approximation pour des vitesses faibles. et suffit ` construire e e e e a le prolongement unique ´voqu´ au th´or`me 3. On parle de contraction des longueurs puisque cet ensemble d’´v`nements est synchronis´ par rapport ` O mais non par rapport ` O : c’est l’ensemble des e e e a a ´v`nements d’´missions des photons d’un objet fixe par rapport ` O donc en mouvement par e e e a rapport ` O. loin perpendiculairement au plan de la sc`ne) une figure C d´finie par les e e e deux propri´t´s suivantes: d’abord. soit at − bx − cy = 1. car il n’´tait pas au centre quand la lumi`re a ´t´ ´mise. et on passe de l’un e e e a a ` l’autre par translation. e e e En reprenant les mˆmes notations. consid´rons (en imaginant encore ´videmment les e e choses du point de vue d’un troisi`me observateur immobile par rapport au premier et situ´ dans e e la troisi`me dimension. Une telle transformation envoie toute ellipse de foyer O en une autre ellipse de e e foyer O ayant mˆme mesure du petit axe. un grand nombre de fois). e e a e Th´or`me 3. Pour cela. ajoutons une interpr´tation en e e ea e termes plus exp´rimentaux de ces faits. ). c) qui d´finit ce plan comme ´tant o e e e celui d’´quation “(produit scalaire par u) = 1”. Pour justifier cela. et que la longueur du petit axe est li´e au volume d´limit´ entre le o e e e e cˆne et le plan. interpr´t´s comme une observation abstraite instantan´e par rapport ` O.le premier (son cˆne de lumi`re pass´e est le mˆme). e e e e On peut ajouter pour la mˆme raison : e Th´or`me 4. Voici quelques r´sultats: o e e Th´or`me 1. La restriction d’une telle transformation ` toute parabole de foyer O. e e Autre explication : la preuve th´orique ´tant d´j` faite ci-dessus. Comme ces transformations forment un groupe. qui pr´c`de a e e e l’´v`nement d’observation d’une dur´e ´gale au rayon du cercle). soit comme limite du th´or`me 1. e Le th´or`me 2 s’obtient soit directement. co¨ ıncide avec une transformation affine et O est toujours foyer de l’image. c’est-`-dire d´duite de la premi`re u e ee a e e approximation en r´p´tant celle-ci.

autrement dit de ”ce qu’on voit” exp´rimentalement en un a o e e point et ` un instant donn´s de l’epace-temps. dans le cas qui int´resse la physique. un aper¸u rapide et superficiel des tenseurs c suffira. Introduction ` la th´orie des spineurs a e (Note: ce paragraphe est beaucoup moins corrig´ que les autres. il pourra ˆtre e a e chang´ ou d´plac´. e e Dans sa forme la plus g´n´rale. elle transforme dans la sph`re de vision un petit disque e e en petit disque donc aussi les angles comme secteurs d’un tel disque). sauf que cela laisse un myst`re : ` quoi peut donc bien resseme a bler g´om´triquement la solution en fin de compte. on peut raisonnablement la comprendre.net/tenseurs. on trouve un espace vectoriel S.dvi (extraits de messages des e newsgroups sur les tenseurs). dit espace spinoriel associ´ ` E. Donc la variation de largeur e a e angulaire ne d´pend pas de la direction de cette largeur. ou on peut encore le voir en prenant une ellipse presque aplatie. Il est pour le moment inutile ` la suite: on peut passer au chapitre 4). avec une e e ee e a application lin´aire L de E dans l’espace des endomorphismes de S. “une fois effac´s les traits de construction” ? e e e Il se trouve que pour un E de petite dimension. l’objet de la th´orie des spineurs est le suivant: ´tant donn´ un e e e e e espace quadratique E (espace vectoriel r´el ou complexe muni d’une forme bilin´aire B sym´trique e e e non d´g´n´r´e).lautre. pouvant mˆme e e e e e se construire relativement facilement. A l’avenir peut-ˆtre ce chapitre sera compl´t´. se trouvent dans le e document pr´sent sur ce site : http://spoirier. o` E est l’espace-temps de la Relativit´ e u e restreinte. il n’y a pas de contraction des longueurs perpendiculairement au mouvement. car la bonne pr´sentation de e e e certains aspects n´cessiterait l’usage du calcul tensoriel (` moins bien sˆr de simuler ce dernier par e a u d’obscures acrobaties). On remarque que ce rapport des profondeurs.ps de ce site. tels qu’on ait l’identit´ e e L(x)L(y) + L(y)L(x) = −2B(x. Nous supposerons ici connues e e les notions usuelles d’alg`bre lin´aire. Malheureusement. En particulier. Cette fois. ` long terme. De toute fa¸on. 24 . e e e a Comme nous l’avons signal´. nous allons oublier la profondeur et ne retenir que l’image qu’on a des choses c e sur la sph`re de vision. puisque la largeur-image de cet objet (produit de la profondeur par l’angle de vision) se conserve (en effet. Ce e sont les transformations de Moebius de la sph`re (celles qui transforment les cercles en cercles. la transformation de la profondeur se d´duit de celle de e c e l’angle de vision d’un petit objet. inverse du rapport des angles de vision. co¨ ıncide ´galement avec le rapport des fr´quences des ondes re¸ues suivant l’effet e e c Doppler (li´ naturellement au rapport de perception du temps). Mais comme le pr´sent document ne cherche pas ` approfondir les noe e a tions mais se contente de les survoler superficiellement. mais seulement du lieu o` elle se trouve sur e u la sph`re de vision. Ceci montre que c’est une transformation conforme de la sph`re (“conforme” e e signifie: qui pr´serve les angles: en effet. les tenseurs sont d’une importance capitale en physique th´orique. Nous en verrons un aper¸u. a e c nous ne pourrons pas pr´senter ainsi tous les aspects de la th´orie. La th´orie des spineurs est une th´orie indispensable en physique des particules dans la d´fintion e e e des spins demi-entiers (´quation de Dirac de l’´lectron par exemple). les structures g´om´triques de ce probl`me r´alisent en quelque sorte une reconstitution e e e e de E ` partir de son cˆne de lumi`re. et e qui par la projection st´r´ographique correspondent aux transformations homographiques du plan ee complexe). Pour une ´tude plus approfondie de ces transformations. mais en fait ce n’est pas n´cessaire car toutes e ee e les id´es de cette approche superficielle ici en vue.7. en consid´rant l’image qu’on c e e e re¸oit par la lumi`re. y) Id (o` Id est l’application identique sur S). 3. e e Pour aborder s´rieusement la physique math´matique. de petit axe la largeur-image de l’objet). voir le texte no3. u Nous n’allons pas ici tenter de r´soudre ce probl`me. e La question est alors : quelles sont donc les transformations de cette sph`re par changement e de r´f´rentiel ? La r´ponse sort en fait imm´diatement de la remarque ci-dessus : la variation de ee e e la profondeur est li´e ` celle de la largeur angulaire (infinit´simale).La sph`re de vision dans l’espace-temps ` 3+1 dimension e a Commen¸ons par motiver les choses g´om´triquement. il faudrait ´tudier d’abord en d´tails la e e e e th´orie du calcul tensoriel. Mentionnons simplement le fait qu’une e e solution th´orique g´n´rale (existence avec une certaine forme d’unicit´) est connue. suffisantes pour la suite.

Nous verrons cet outil appliqu´ d’abord au cas d’un espace ` 2 e a dimensions spatiales plus le temps. les transformations de la sph`re de vision sont les transformations e e e d’un espace projectif de dimension 1 complexe. x. L(u)(w))) (On retrouve ainsi le fait que t + x et t − x sont a plus fondamentaux que t et x !) Une transformation sp´ciale lin´aire de matrice P envoie cette e e t forme bilin´aire sur celle de matrice P AP . e C’est l’expression de la rotation spatio-temporelle (transformation de Lorentz combin´e avec e des rotations spatiales) la plus g´n´rale avec deux dimensions spatiales ! e e On v´rifie : det A = t2 − x2 − y 2 (invariant relativiste. y)). y) s’identifie au tenseur sym´trique e e e dans le plan spinoriel (´l´ment sym´trique de S ⊗ S) de matrice ee e t+x y y t−x De mani`re ´quivalente. y ) = tt − xx − yy ) e u Spineurs de l’espace-temps ` 3+1 dimensions a D’apr`s ce qu’on a d´crit. De e e e e e e mani`re ´quivalente. v) det(s. e e Donc la forme bilin´aire est d´g´n´r´e si elle appartient au cˆne de lumi`re. e e e e Ainsi. e Plus g´n´ralement. e ou image r´ciproque par l’op´ration de carr´ complexe. de matrice t − x −y A= −y t + x (Elle ´quivaut ` la donn´e de la solution L du probl`me des spineurs ´voqu´ au d´but. elle est dans le cˆne e e e ee o e o de lumi`re future si elle est positive. Le mod`le de base de ce ph´nom`ne est celui d’une e e e e variable complexe dont le carr´ s’identifierait ` un vecteur d’un plan de l’espace physique. x . d´finie par s2 (v. en ´tant e a e e e e e e l’application qui ` (v. b) et e e u B= b2 −ab −ab a2 (ou son oppos´ si on veut un vecteur du cˆne de lumi`re pass´e). w) = det(s. La propri´t´ fondamentale du spin 1/2 est que quand l’espace physique fait un tour complet ee sur lui-mˆme. un vecteur spatio-temporel u = (t. ce spin ne fait qu’un demi-tour. e e e e Spineurs d’un espace-temps ` 2+1 dimensions a Les transformations d´crites pr´c´demment de ce qu’on voit admettent une formulation ´l´e e e ee gante en termes de spineurs. x. vecteur int´rieur au cˆne de lumi`re future. w) = t vBw o` t s = (a. ` un spineur s correspond la forme bilin´aire sym´trique correspondant au e e a e e carr´ tensoriel de s. carr´ scalaire du vecteur (t.Ce qui suit s’appuie sur les r´sultats des sections pr´c´dentes sur les exp´riences visuelles. donne une ellipse de foyer O dans le plan de vision : c’est celle qui apparaˆ sous ee ıt forme d’un cercle dans ce r´f´rentiel. Prenons e a donc comme espace spinoriel S le plan ”racine carr´e complexe” du plan d’observation ci-dessus. produit scalaire par u e e e e a d’un vecteur v = (t . et correspondant e o e a ` un r´f´rentiel. un vecteur du genre temps. u.w) associe det(v. x . L’espace vectoriel de dimension 2 complexe auquel il est associ´ sera notre espace spinoriel S. L’ellipse de centre O correspondante dans le plan spinoriel ee donne une forme bilin´aire sym´trique d´finie positive (qui est la structure euclidienne qui donnait e e e a ` ce plan la structure de plan complexe utilis´e plus haut). on peut dire que la forme lin´aire associ´e ` u. e e e e La mesure du petit axe de l’ellipse de foyer O est proportionnelle ` l’aire de l’ellipse de centre a O correspondante.(t . y). qu’on e o e a ´voqu´ pr´c´demment en disant que c’est le carr´ complexe. L’application du plan spinoriel dans le cˆne de lumi`re.v = tt − xx − yy ) s’identifie ` la forme bilin´aire sym´trique dans a e e le plan spinoriel. x. y ). On v´rifie que t sAs est le 2 fois e o e e e le produit scalaire des vecteurs d´finis par A et B (o` (t. dont on sait qu’elle est pr´serv´e par les transformations sp´ciales lin´aires. e 25 . est finalement le carr´ tensoriel. Quelle est donc l’image r´ciproque par e e e e le carr´ complexe d’une ellipse de foyer O ? R´ponse : c’est une ellipse de centre O ! Et le type e e de transformations d´crit pr´c´demment est l’image par le carr´ complexe des transformations e e e e sp´ciales lin´aires (lin´aires de d´terminant 1) de S (vu comme R-espace vectoriel de dimension 2).

par le vecteur sortant. z = 0. Pour mieux voir ce qui se passe. cela redonne dans le cas purement spatial (t = 0) la pr´sentation e e quaternionique des rotations. e On voudrait donc donner un sens ` cet argument. Soit donc e e un spineur s. donnons la repr´sentation spinorielle du champ ´lectromagn´tique en un point. Cela manifeste encore e une fois le ph´nom`ne de spin demi-entier : quand on le tourne d’un angle. λ) et en n´gligeant les termes en λ2 : e 0 −λ −λ 1 + λ(a + a) ¯ soit 2t = 2x = 1 + λ(a + a). cette fl`che tourne e e de 2h. y. puisqu’une a homoth´tie de S de rapport un nombre complexe de module 1 ne change rien. ou si on parle en termes e duaux.Un vecteur v = (t. de matrice e A= t−x −y + iz −y − iz t+x (Contrairement au cas pr´c´dent. dans C. prenons un vecteur s tel que det(s. en effet. y = λ. le nouveau s + ls e a vaut us + λus = u(s + λu2 s ) dont l’image physique a bien tourn´ de 2h. 0) et s = (a. e e e ¯ La rotation spatio-temporelle la plus g´n´rale est donc de la forme t P AP o` P est dans SL(2. On cherche une image visuelle de son argument. se d´finit alors comme ´tant l’espace des ´l´ments hermitiens de e e ee ¯ S ⊗ S (produit tensoriel sur le corps C de l’espace conjugu´ de S par S). en l’image de e e e e s. l’application qui ` s associe det(s. −x. e e e D’abord. z) ´quivalent ` la donn´e de la forme lin´aire (produit scalaire par v). de matrice (o` les coordonn´es e e a u e sont ´crites dans l’ordre (t. Mais il est possible de e comparer les arguments de plusieurs vecteurs. b) et ¯ v B= ¯ bb −¯ ba −¯b aa a ¯ On remarque que dans ce passage de s ` B ce n’est pas seulement le signe qui est perdu mais a tout l’argument : multiplier s par un nombre complexe de module 1 ne modifie pas le r´sultat. quelle est donc la forme d’un tel champ en un point ? C’est une forme bilin´aire antie sym´trique de l’espace vectoriel associ´ (tangent) ` l’espace-temps. C). Comme on veut retenir l’information ind´pendante ¯ e 1 de a. w) = t vBw o` t s = (a. ou encore e e si on prend la sph`re de vision d´finie par le cˆne de lumi`re pass´e). 1). x. z) : e 0  −Ex  −Ey −Ez  Ex 0 Bz −By Ey −Bz 0 Bx 26  Ez By   −Bx 0 . s ) = 1 : ceci le d´finit modulo l’addition avec un multiple complexe de s. y. qui serait plus compliqu´e) On v´rifie : det A = t − x − y − z 2 . son image dans l’espace e e physique tourne d’un angle double. Lorsque s tourne d’un angle h. Pour cela. Finalement. fabriquons de toutes pi`ces une r´f´rence : c’est l’argument du d´terminant de deux vecteurs dans S (qui n’intervenait e ee e pas ci-dessus puisqu’on avait le produit d’un d´terminant et du conjugu´ d’un autre). v) det(s. s ) signifie une application du plan tangent ` la sph`re que e a a e forme le cˆne de lumi`re future. mais l’information int´ressante est la variation de s + λs pour un nombre r´el λ positif au voisinage de e e λ = 0. −y. cela semble ne rien apporter puisque s peut avoir n’importe quelle direction dans S. celui des formes sesquilin´aires hermitiennes sur S. x. e e u A quelques acrobaties pr`s. donc est multipli´ par un complexe u = eih . On a alors B(s + λs ) = B(1 + λa. en l’image de s. Pour finir. Ce n’est pas possible dans l’absolu. c’est que le vecteur de lumi`re qui est parti de t = x = 2 peut s’allonger ou se raccourcir e comme il veut mais il avance de mani`re d´termin´e dans la direction de y. Puis. conservant la structure euclidienne (elle o e renverse l’orientation si on oriente cette sph`re “de l’ext´rieur”. Pour le e moment. l’espace S mentionn´ ici n’est pas la solution du probl`me e e e e 2 2 2 spinoriel dans lequel on d´finit L. Une mesure du module du e e o e e r´sultat signifie qu’une fl`che (direction et sens) est marqu´e sur la sph`re de vision. −z). w) = det(s. s doit tourner de −h pour que det(s. Prenons par exemple s = (1. pour s e e e fix´. L’application de l’espace spinoriel dans le cˆne de lumi`re s’exprime o e u par : s ⊗ s(¯. e a e e de composantes (t. s ) reste ´gal ` un.

B) aussi ´gal ` l’oppos´ du d´terminant de e e a e e la matrice. 27 . par l’action naturelle des transformations sp´cial lin´aires de l’espace e e e spinoriel sur l’espace de ses formes bilin´aires (A → t P AP ).Comme n’importe quelle forme bilin´raire antisym´trique (comme par exemple le moment e e cin´tique). qui s’incarne par la forme bilin´aire sym´trique de matrice e e e −M y + iM z Mx Mx M y + iM z La transformation du champ ´lectromagn´tique par changement de r´f´rentiel (ou rotation spatioe e ee temporelle) en r´sulte. On retrouve l’invariant relativiste e du champ par le carr´ scalaire M 2 = E 2 − B 2 + 2i(E. elle se repr´sente dans l’espace spinoriel par une forme bilin´aire sym´trique : soit e e e e M = E + iB (donc de composantes Mx = Ex + iBx . vecteur de l’espace quadratique C3 de base orthonorm´e. etc).

l’ensemble S d’´quation f = 0 est une sous-vari´t´ de e ee dimension n − 1 ` condition que la diff´rentielle de f ne soit en aucun point de S ´gale ` la forme a e e a lin´aire nulle sur l’espace des vecteurs de E. avec le ıt e point de tangence pris comme origine pour en faire un espace vectoriel. les applications appartenant ee e e a ` la classe de r´gularit´ consid´r´e (celle-l` ou une autre) seront qualifi´es de lisses. Introduction ` la g´om´trie diff´rentielle a e e e Pour aborder la m´canique nous aurons besoin de notions de g´om´trie diff´rentielle. application lisse d’un espace E dans une droite D . disons qu’on travaillera ee e e a e e avec les applications d´rivables et dont la d´riv´e est continue. d´signant un ´l´ment d’une droite e e ee vectorielle ou affine.) Sa diff´rentielle en un point est une forme lin´aire sur l’espace des e e vecteurs de E multipli´e par une quantit´ de D . M´canique classique e 4. on imagine facilement l’espace tangent en chaque point comme ´tant ee e l’espace tangent en ce point qu’on connaˆ comme sous-espace affine de l’espace de d´part.1. puis nous nous affranchirons de ce cadre pour retenir ces notions en ellese e mˆmes. ou plus g´n´ralement. Nous ne chercherons pas ` donner de cela une d´finition rigoureuse axiomatiquement mais e a e l’accent sera mis sur les id´es et notions de base qui sont utilis´es en pratique. on peut dire que quand un point se d´place dans un espace e muni d’un champ scalaire. cette courbe param´tr´e se e a e e e e voit comme ´tant le mouvement d’un point. par opposition au cas d’´l´ments d’espaces vectoriels e ee de dimension plus grande. trait´ comme un nombre. e e e ee Intuitivement. e e On connaˆ la notion de d´riv´e d’une application de l’ensemble des nombres r´els dans luiıt e e e mˆme. qu’on appelle des vari´t´s. C’est d’ailleurs ainsi qu’on peut d´finir la notion de sous-vari´t´ de dimension n d’un espace affine: une sous-vari´t´ est une e ee ee 28 . Nous e e e e avons introduit la g´om´trie affine qui est une g´om´trie plus souple que la g´om´trie euclidienne e e e e e e (avec plus de transformations et moins de structures). Si on se repr´sente D comme ´tant la droite du temps. – Le cas d’un champ scalaire. a e En rassemblant ces deux notions. Et sa diff´rentielle (tout court) est l’application e e e qui ` tout point de E associe la diff´rentielle en ce point. Pour simplifier. la d´riv´e par rapport au temps de la valeur du champ rencontr´ ` chaque e e ea instant est le r´sultat de la diff´rentielle du champ en la position courante du point. Par exemple. on a les e sous-vari´t´s d’un espace affine (c’est-`-dire des parties de cet espace qui sont des vari´t´s): les ee a ee surfaces dans l’espace usuel sont les sous-vari´t´s de dimension 2. De mˆme la g´om´trie diff´rentielle est plus e e e e souple que la g´om´trie affine. e Introduisons maintenant les espaces de la g´om´trie diff´rentielle. mais il reste la notion de courbe.4. Un th´or`me dit que toute vari´t´ de dimension n est e e e ee repr´sentable comme sous-vari´t´ d’un espace affine de dimension 2n + 1 (ou toute dimension plus e ee grande mais pas toujours moindre). et sa diff´rentielle est la donn´e du vecteur vitesse de e e e ce point en chaque instant. Il n’y a plus de notion de droite. e e – Le cas d’une courbe param´tr´e. appliqu´e ` son e e e a vecteur vitesse. application lisse d’une droite affine D dans un espace affine e e E. Par abus de convention on sous-entendra parfois dans la notion d’appartenance d’un vecteur ` un espace vectoriel. Sa diff´rentielle est une application de D dans l’espace des vecteurs de E divis´s par les quantit´s e e e associ´es ` D. Pour fixer les id´es. le fait que ce peut ˆtre en r´alit´ le produit d’un ´l´ment de cet a e e e ee espace vectoriel par une quantit´. mais d’autres choix seraient possibles e e e (de pr´f´rence une condition de r´gularit´ plus forte). Dans le cas d’une e ee sous-vari´t´ d’un espace affine. la d´riv´e d’une application d’une droite affine dans une autre. A chaque point x d’une vari´t´ S de dimension n est associ´ de mani`re continue un espace ee e e vectoriel Tx S de dimension n appel´ l’espace tangent de la vari´t´ en ce point. (Le nom de “scalaire” s’emploie aussi comme synonyme de “quantit´”. ensemble des diff´rences de e a e deux ´l´ments) sur une quantit´ associ´e ` la premi`re. une vari´t´ de dimension n est un espace qui est approximativement un espace ee affine de dimension n au voisinage infinit´simal de chacun de ses points. e e e e e la valeur d’une telle d´riv´e en un point est homog`ne au rapport d’une quantit´ associ´e ` la e e e e e a deuxi`me droite (appartenant ` la droite vectorielle qui lui correspond. e e ee a e G´n´ralisons cela aux deux cas suivants. Dans un espace affine E de ee dimension n muni d’un champ scalaire f . e e Nous allons d’abord introduire les principales notions de g´om´trie diff´rentielle dans le cadre e e e de la g´om´trie affine.

une particule en mouvement ne peut pas passer par des lieux o` l’´nergie potentielle u e est sup´rieure ` l’´nergie qu’elle poss´dait au d´part. on ´tudiera la condition pour qu’elle soit ` l’´quilibre. appel´ le potentiel et ` valeurs e a dans la droite des ´nergies (ou une droite affine correspondant. il e e e e 29 . e e La justification n´cessiterait ici que le potentiel soit diff´rentiable deux fois. Dans une vari´t´ E munie d’une force de potentiel V . Notion d’´quilibre e Introduisons une grandeur physique (autrement dit une droite vectorielle) appel´e ´nergie (ses e e ´l´ments sont les quantit´s d’´nergie). La donn´e de ces champs scalaires sur S ´quivaut ` la donn´e e e a e de cette repr´sentation de S comme sous-vari´t´ de E. a e e e a e Chaque force s’exprime sous la forme d’un champ scalaire V . qui e e pourrait aussi bien glisser. sans e e ee e ˆtre vus comme inclus dans un mˆme espace affine. c’est-`-dire un sous-espace affine approximant a la partie pr`s du point. Par exemple. Sa diff´rentielle en tout point t ∈ D e (sa vitesse ` tout instant) est un vecteur appartenant ` Tc(t) S (divis´ par une quantit´ de temps). e a e L’effet global d’un syst`me de forces donn´es par des potentiels est identique ` celui d’une e e a seule force dont le potentiel est ´gal ` la somme des potentiels des diff´rentes forces. autrement dit qui est une application c de D dans S. e 4. Par exemple. ceci pour exprimer que “le potentiel e n’est d´fini qu’` une constante additive pr`s”). Une mani`re facile de construire d’autres e ee e repr´sentations de S comme sous-vari´t´ d’espaces affines consiste ` prendre une repr´sentation e ee a e donn´e. car pour que la e e variation soit trop faible pour fournir ` la particule qui commencerait infinit´simalement ` s’´carter a e a e de cette position l’´nergie n´cessaire pour achever de s’´loigner nettement en un temps limit´. e Mais dans le cas g´n´ral d’une vari´t´. Un point d’´quilibre instable est un point d’´quilibre qui n’est pas stable. ee e e Equilibre d’un point Consid´rons un point mat´riel libre de se d´placer dans une vari´t´ E et soumis ` des forces e e e ee a dues ` des causes ext´rieures fixes. Un point d’´quilibre de E muni d’une force de potentiel V est un point o` la diff´rene u e tielle de V est nulle. En effet. Et plus pr´cis´ment. r´duisant l’id´e de la e e e bille ` un point. E peut ˆtre une surface sur laquelle une bille a e e est libre de rouler. dans le cas contraire d’une vari´t´ abstraite. a a e e Un champ scalaire sur S est la restriction ` S d’un champ scalaire de E. on ne s’int´ressera pas au mouvement de rotation de la bille sur elle-mˆme. Ou autrement dit. e On remarque qu’` moins de se trouver sur un bord de la vari´t´. les espaces tangents se d´finissent abstraitement. Donc en partant du voisinage d’un minimum e a e e e de potentiel sans autre ´nergie elle ne peut pas en sortir. e a e Il y a deux notions d’´quilibre qu’on peut consid´rer. Ici.2. en s’aidant de repr´sentations comme sous-vari´t´s d’un espace ee e e ee affine. e e ee ee Les notions de diff´rentielle qu’on a vues pour un espace affine se g´n´ralisent au cas d’une e e e vari´t´ de la mani`re suivante. Sa diff´rentielle en chaque a e x ∈ S est une forme lin´aire sur Tx S (restriction ` l’espace tangent de la diff´rentielle du champ e a e de E auquel il correspond). soumise ` la pesanteur et au champ magn´tique d’un aimant fixe cach´ sous a e e la surface. Finalement. C’est ainsi une notion ind´pendante de la e e e mani`re dont on repr´sente la vari´t´ comme sous-vari´t´ d’un espace affine. e e Equilibre stable. e Une courbe param´tr´e d’une sous-vari´t´ S de E est une courbe param´tr´e de E qui est inclue e e ee e e dans S.partie qui en chaque point admet un espace tangent. Ceci donne une repr´sentation ee e ee e dans un espace affine ayant une dimension de plus que celle de d´part. mais seulement au d´placement de son centre. ces op´rations tiennent lieu de ee e d´finition des espaces tangents. et ` ajouter ` cette liste un e e a a ou plusieurs autres champs. chaque coordonn´e ´tant un champ scalaire sur e e e E donne un champ scalaire sur S. en choisissant un rep`re de E. Plus g´n´ralement: e e e Equilibre. consid´rer le graphe de cet autre champ scalaire sur e une sous-vari´t´ comme une autre repr´sentation de cette vari´t´. donc une liste de champs scalaires modulo un choix de rep`re. en un minimum local la a ee diff´rentielle s’annule. un point d’´quilibre ee e stable est un minimum local de V .

a e Les forces s’expriment par des potentiels d´finis sur l’espace de configuration. ou encore une de ses sous-vari´t´s e ee contenant l’´l´ment neutre Id (l’identit´. e e e a e e 4. C’est une vari´t´. 30 . Bilans des forces ext´rieures e Nous allons voir maintenant comment on peut faire un bilan des forces ext´rieures qui exprime e une condition n´cessaire d’´quilibre en oubliant les forces internes. la condition d’´quilibre en un point est l’annulation u e de la diff´rentielle de la somme des potentiels. La compos´e de cette application e e lin´aire par la force (comme forme lin´aire en x) co¨ e e ıncide avec la force de potentiel VG en Id. Ainsi. qu’on peut imaginer comme ´tant des champs ou l’effet de contacts a e e avec d’autres mat´riaux d´formables li´s ` des supports fixes. la force qui s’exerce sur une particule ee u e situ´e en un point donn´ de E se d´finit comme ´tant moins la diff´rentielle de V en ce point. L’espace tangent en un point e e de l’espace de configuration repr´sente l’ensemble des petites modifications ou vitesses d’´volution. La e e e e e condition d’´quilibre d’une particule en un point soumise ` plusieurs forces est que la somme de e a ces forces soit nulle. on pose alors comme condition n´cessaire d’´quilibre. e e a Or. Dans une vari´t´ E o` r´side une force de potentiel V . Les forces sont des formes lin´aires sur cet espace. on connaˆ des types d’´volutions d’un syst`me suivant lesquels les forces internes ne ıt e e peuvent pas agir. e e de l’´tat du syst`me ` partir d’un ´tat donn´. sans tenir compte de la question e e e e e de son ´quilibre. ` savoir la mesure de e a l’´nergie pr´sente pour chaque ´tat du syst`me. e Espace de configuration. e Soit G le groupe des d´placements de l’espace physique. tandis qu’un sommet et un col sont des positions d”´quilibre instable. le fond d’un creux est une a position d’´quilibre stable. La e diff´rentielle en Id de cette application de G dans E est une application lin´aire de L = TId G vers e e Tx E. les forces ext´rieures d’autre part (dont l’´nergie r´side ` l’ext´rieur du syst`me). e e e Cette notion permet de ramener la notion d’´quilibre d’un syst`me ` celle de l’´quilibre d’un e e a e point que nous avons introduite. e e Dans le cas o` plusieurs forces s’exercent.est quasiment n´cessaire (et suffisant) que cette variation ne d´passe pas en ordre de grandeur le e e carr´ de la distance. Une condition n´cessaire d’´quilibre est e e e que la somme de leurs restrictions ` un sous-espace donn´ soit nulle. (En fait. l’´quilibre de Id dans G soumis e e e aux forces de potentiels VG . En la composant a e e e a avec un champ de potentiel V sur E. pour un point sur un relief soumis ` la pesanteur. Formalisons cela. e Par exemple. comme celui d’un solide e e e ind´formable. les champs se comprennent comme des d´formations de sortes de milieux ´lastiques e e dans l’espace-temps qui interagissent par contact avec la mati`re). qui est ´gale ` la somme des diff´rentielles des e e a e potentiels au mˆme point. e Force. le d´placement qui ne d´place rien). il se trouve qu’en physique e e e a fondamentale. et se r´partissent en deux esp`ces: les forces internes e e e e e e d’une part. on obtient un champ de potentiel VG d´fini sur G. ` savoir un point qui se d´place dans l’espace de configuration. On appelle espace de configuration d’un syst`me l’ensemble des mae ni`res dont il pourrait ˆtre dispos´ dans l’espace (appel´es ´tats). soit en ajoutant au syst`me ea e e e d’autres forces ext´rieures ajust´es en sorte d’annuler exactement les forces pr´sentes. c’est-`-dire que leur potentiel y demeure constant: ce sont les mouvements qui a ne d´forment pas le syst`me (et n’affectent pas son ´tat interne) parce qu’ils sont d´finis par un e e e e d´placement g´om´trique de l’espace physique (translation ou rotation). Les forces int´rieures peuvent a e e alors ˆtre oubli´es si on sait que leurs restrictions ` ce sous-espace sont toujours nulles.3. Soit alors l’application diff´rentiable de G dans E e e qui ` tout d´placement associe l’´tat obtenu en appliquant ce d´placement ` x. On dit que L est l’alg`bre de Lie de G si G est un groupe. Chaque ´tat serait en principe r´alisable. e e a e e e et la condition d’´quilibre est que leur somme soit nulle. ee e e e ee Fixons un ´tat x de l’espace de configuration E. soit ee e e en tant que clich´ ` un instant donn´ d’un syst`me en mouvement. e C’est souvent une vari´t´ de dimension infinie. Equilibre d’un syst`me e On imagine un syst`me comme ´tant un assemblage de mat´riaux d´formables pouvant ˆtre e e e e e soumis ` des forces ext´rieures.

` condition qu’elle ne soit pas e e a directement compens´e par d’autres forces ext´rieures qui ne passeraient pas par l’int´rieur du e e e syst`me. e a Regardons donc la variation d’´nergie interne du syst`me lorsque seul le voisinage imm´diat e e e du support suit ce mouvement. et celui de a e e a la force que B exerce sur A se lit ` celle quand A se d´place par rapport ` B. En effet. et que cette force ne s’exprime pas par un potentiel. e et que les autres forces ext´rieures qui s’y exercent soient n´gligeables. elles doivent ˆtre oppos´es. On peut g´n´raliser cette notion au cas du torseur d’un lien rigide.L’argument plus haut se traduit par le fait que le potentiel sur G correspondant ` toute force a interne est une constante. Le r´sultat vaut z´ro puisqu’il y a ´quilibre. Le torseur des forces entrant dans ce volume vaut celui des forces entrant par la premi`re surface. e Ainsi. e e a e e 31 . se d´duit des variations d’´nergie interne du voisinage r´sultant d’un d´placement e e e e e du support. Ces deux e u surfaces enferment un volume. est la forme lin´aire sur l’alg`bre de Lie du groupe G des d´placements g´om´triques de e e e e e e l’espace physique. on peut quand mˆme la e calculer d’apr`s les forces internes. ces e e e e objets ´tant vus comme deux parties du syst`me: cette interaction s’exprime par la mˆme ´nergie e e e e interne qui d´pend des mouvements de ces deux objets l’un par rapport ` l’autre. Le probl`me est que les d´placements qui permettaient de calculer le torseur sont ici e e interdits. et a e e e donc l’effet d’un d´placement du support seul avec son voisinage ´quivaut au d´placement inverse e e e du reste du syst`me par rapport ` ce support. l’´quilibre implique e e e que la force du lien est ´quilibr´e par les forces internes voisines. La somme des deux a e a est nulle. e e e e Remarquons qu’apparaˆ ainsi le principe d’action-r´action entre deux objets distants interıt e agissant par l’interm´diaire d’un syst`me (pouvant ˆtre un milieu ´lastique ou un champ). e a e a e Ensuite. en supe posant connue l’´nergie interne du syst`me en toute circonstance. donc. e Voyons donc comment reconstituer le torseur de la force du lien rigide sur le syst`me. pour que ces notions aient un e sens il faudrait que le voisinage de ce bord soit vide afin de pouvoir consid´rer la d´formation de la e e partie int´rieure quand on d´place les deux surfaces l’une par rapport ` l’autre. l’´nergie interne ne variant pas quand le mˆme d´placement s’exerce sur le tout. Alors. donc e e e e les forces traversant les deux surfaces sont ´gales. u e a e e e Remarquons que cette connaissance est en fait comprise dans celle des effets de mouvements conformes ` l’hypoth`se. et appliquons cette connaissance e e au cas o` le support du lien subirait un d´placement. Le torseur force du lien rigide sur le e syst`me. et on peut alors faire le bilan des forces entrant dans ce volume. En toute rigueur. V´rifions que le torseur des e e forces les traversant sont ´gaux (le cas de deux surfaces non disjointes s’en d´duit en prenant e e une succession de surfaces de mˆme bord o` deux surfaces successives sont disjointes). et donc sa diff´rentielle en Id est nulle. la condition n´cessaire d’´quilibre du bilan des forces ext´rieures est que la somme des e e e torseurs de ces forces soit nulle. soient deux surfaces disjointes ayant le mˆme bord. Le torseur des forces traversant une hypersurface S e e e a e (surface de dimension n − 1 dans un espace de dimension n) ne d´pend que du bord de S. Le torseur d’une force ext´rieure appliqu´e ` un syst`me dans un ´tat e e a e e donn´. qu’au voisinage du support il n’y ait pas d’autres liens rigides qui contraignent le syst`me. un point. Dans un syst`me ` l’´quilibre. ` deux conditions. contrairement ` ce qui ´tait suppos´ au d´part. que le syst`me soit ` l’´quilibre. . D’abord. e e e On a aussi: Th´or`me. puisqu’il s’agit de l’´nergie interne qui est invariante par d´placements. ) qu’on appellera le support a e de ce lien. . e En effet. e Torseur d’une force. un axe. e moins celui des forces sortant par la deuxi`me. construite comme force de potentiel VG en Id (oppos´e de la diff´rentielle de VG ) e e d´fini ci-dessus. Le torseur force e a que A exerce sur B se lit ` la variation d’´nergie quand B se d´place par rapport ` A. qui consiste ` interdire tout e e a mouvement ` une partie du syst`me (un bord. mais on admettra e e a que les r´sultats sont bien d´finis ` la limite quand on fait tendre vers z´ro l’´paisseur de ce vide. par le fait que le support doit se trouver dans sa position d’´quilibre entre la force e ext´rieure donn´e par le lien et la force int´rieure du voisinage du lien dans le syst`me: la somme e e e e de ces deux torseurs de forces ´tant nulle (appliqu´es au support). r´alisant une transition lisse avec les parties plus ´loign´es (celles e e e soumises aux autres forces ext´rieures) qui ne suivent pas.

la direction importante est celle du vecteur de la a r´sultante et non de la forme lin´aire. une vitesse de d´placement solide quelconque se d´compose de mani`re unique comme e e e somme de la vitesse de translation ´gale ` la vitesse d’un point par ce d´placement. puis une translation s’obtient en ajoutant deux vitesses de rotations de parties lin´aires e oppos´es mais de centres diff´rents. a e ce que nous ne ferons pas dans l’imm´diat. En effet. G´om´trie des forces dans le plan e e D´crivons d’abord la forme des torseurs dans le plan.Remarque. La r´sulante d’une force ext´rieure appliqu´e ` un syst`me est la e e e e a e forme lin´aire sur l’espace des vecteurs de l’espace physique construite de la mˆme mani`re par e e e l’identification naturelle de cet espace vectoriel ` l’alg`bre de Lie du groupe des translations (espace a e des vitesses de translation). une rotation avec une translation. le vecteur force e e apparaˆ sous la forme exp´rimentale de l’acc´l´ration d’une particule soumise ` cette force. Mˆme construction appliqu´e au groupe des a e e rotations autour de ce point (les d´placements qui laissent fixe ce point). e Un torseur peut se repr´senter sous forme du champ des moments. qui est la plus petite dimension o` cette notion apparaˆ Nous ne l’´tudierons u ıt. les notions de e u vecteur et de forme lin´aire se correspondent rigoureusement par le produit scalaire. e e Abordons maintenant les d´tails de la forme du torseur force. puisque la notion de torseur e e e est fond´e sur le groupe des d´placements. Ce qui les e distingue c’est intuitivement la direction qu’ils d´signent. quand on la d´place par rapport au reste du bord. pour e e l’y retrouver il faudrait d´placer les deux surfaces l’une par rapport ` l’autre du point de vue de e a l’espace du volume int´rieur (pour d´former ce volume) sans affecter leurs dispositions du point e e de vue de l’espace ext´rieur. La mesure de cette force traversant une hypersurface. ` l’alg`bre de Lie du e e e a e groupe des rotations autour de chaque point.4. Bien sˆr. e e e e e Nous allons maintenant ´tudier en particulier la g´om´trie des torseurs et leur ´quilibre dans e e e e le cas du plan. e 4. e pas en dimension 3 comme voudrait l’usage. Ce faisant. un vecteur d´signe une direction de droite tandis que la forme lin´aire e e correspondante d´signe celle de son plan orthogonal. ne se retrouve pas inscrite dans e le potentiel sur l’espace de configuration du plus grand syst`me non bord´ par elle. ıt e ee a La question qui se pose alors est: la direction d’un vecteur force joue-t-elle g´om´triquement e e un rˆle dans la notion d’´quilibre ? La r´ponse est oui: il se trouve que dans la forme g´om´trique o e e e e des torseurs par rapport ` l’espace physique. car les vitesses de d´placements quelconques e e a e s’obtiennent en ajoutant des vitesses de rotations: d’abord comme on a dit. les forces exerc´es en tous points du syst`me pour en faire le bilan. Ce qui e e e e e explique d’ailleurs pourquoi c’est la relativit´ g´n´rale qui exprime un champ (le champ de gravit´) e e e e comme naturellement induit par la disposition de la somme des forces mat´rielles elles-mˆmes. on d´compose en pratique le torseur d’une force en les deux notions suvantes. qui se d´duit des variations e d’´nergie interne de la partie du syst`me contenu dans un volume dont cette hypersurface est une e e partie du bord. Pour le dire intuitivement. C’est-`-dire qu’on restreint le torseur a a en tant que forme lin´aire sur l’alg`bre de Lie du groupe des d´placements. En m´canique classique. e e Ces constructions semblent faire uniquement apparaˆ les forces comme des formes lin´aires. puisque ces efforts suppl´mentaires dans cet autre cas e particulier plus compliqu´ cacheraient le fait que c’est finalement une notion g´n´rale qui serait e e e traitable plus simplement en tant que telle ` condition d’introduire au pr´alable le calcul tensoriel. ıtre e a ` l’encontre de l’usage courant de repr´senter les forces par des vecteurs. orthogonale l’une ` l’autre: dans l’espace e a euclidien de dimension 3. e e 32 . et ceci est valable en g´n´ral au-del` du plan en toute dimension. qui repr´sente la g´om´trie euclidienne de l’espace. e En effet. et de la vitesse e a e de rotation autour de ce point d´finie par la partie lin´aire de ce mouvement. Cela ne doit pas nous ´tonner. ceci assemble par translation dans le mˆme espace vectoriel des e vecteurs de l’espace physique. on ne perd aucune information. application qui ` tout point e a du plan associe le moment du torseur par rapport ` ce point. e e Moment d’une force par rapport ` un point. ce qui n’est possible qu’en th´orie de la relativit´ g´n´rale. e e restrictions de cette forme lin´aire ` deux sous-espaces vectoriels de L qui sont suppl´mentaires: e a e R´sultante d’une force. Comme le groupe des rotations e est compliqu´.

qui d´finit son moment par rapport ` O. vaut f (r(OM )). Sa r´sultante est ´gale ` f . r(f )(M O). La rotation d’un radian par unit´ de temps autour de e −→ − O dans le sens direct entraˆ le point M suivant la vitesse r(OM ). a e Calculons la valeur de f en un point N voisin de M : f (N ) = (T (N ) − T (M ))(N ) + T (M )(N ). ee On pourrait d´montrer cela abstraitement. donc la puissance fournie par ıne −→ − f au syst`me. le moment en un point est simplement un scalaire. e e D’autre part il est naturel que l’ensemble des vitesses de rotations s’identifie ` l’espace des a points pond´r´s du plan. Donc. a Nous allons compl´ter cette description par celle de la transmission des forces ` travers les e a syst`mes. a Il suffit en effet de prolonger une courbe de O ` M par une courbe de M ` N pour obtenir une a a courbe de O ` N . e e e On a d´j` vu ` la section pr´c´dente qu’` l’´quilibre. sachant que les forces se transmettent uniquement de proche en proche. puisque l’espace des formes affines et celui des points e e e pond´r´s sont le dual l’un de l’autre. Il ne reste qu’` v´rifier que le graphe de T (M ) est le plan tangent en M au graphe de f . C’est donc la forme affine s’annulant en M et de partie lin´aire r(f ). On trouve ainsi le r´sultat: le champ des moments est l’application qui e −→ − a ` tout O associe r(f )(M O). le torseur d’une force traversant une ea a e e a e courbe (cas particulier d’hypersurface) ne d´pend que des extr´mit´s de la courbe. soit en appliquant encore e e a −→ − r sur le tout. parce que le groupe des rotations autour d’un point est de dimension 1. Calculons le moment de e e e e e a cette force par rapport ` tout point O. le champ des moments d’un torseur est l’application qui ` tout point associe la puissance fournie par la force lors de la a rotation de centre ce point ` la vitesse angulaire d’un radian par unit´ de temps (le r´sultat est a e e homog`ne ` une ´nergie). Soit r la rotation vectorielle d’un angle droit dans le sens a direct suivant l’orientation choisie du plan. Non seulement ce a torseur est petit correspondant ` la proximit´ des deux points. a Posons maintenant pour tout M . Une orientation du plan ´tant choisie. Ce th´or`me n’a pas d’´quivalent pour des forces en dimension plus grande. le torseur d’une force dans le plan se a ee repr´sente par une forme affine (application affine du plan dans une droite vectorielle. Or T (N ) − T (M ) est le torseur des forces traversant une courbe reliant M ` N . Toute disposition des forces en ´quilibre dans le plan peut se d´crire au moyen d’un e e e e champ scalaire f (d´fini ` l’addition pr`s par une forme affine) d’apr`s la r`gle suivante: quels que e a e e e soient deux points M et N du plan. le torseur de la force traversant toute courbe reliant M ` N vaut T (N ) − T (M ). mais la droite o` il s’annule passe a e u 33 . dont la partie lin´aire est la r´sultante tourn´e d’un angle droit dans le e e e e e sens direct. Ces rotations se mesurent par leur vitesse angulaire. le torseur de la force traversant de droite ` gauche toute courbe a reliant M ` N se repr´sente par la diff´rence T (N ) − T (M ) des formes affines dont les graphes sont a e e les plans tangents au graphe de f aux points M et N . Ces deux ´nonc´s sont ´quivalents. ici l’ensemble e des quantit´s d’´nergie). soit T (M ) le torseur de la force traversant de droite ` gauche toute courbe reliant O ` M . n’´tant sensible qu’` la vitesse e e e a d’un point mat´riel M donn´ dans le syst`me. Pour tout point M . l’alg`bre de Lie des d´placements e e e du plan s’identifie ` l’espace des points pond´r´s du plan. a ` condition de choisir une orientation du plan (un sens de rotation). Soit e donc une force donn´e par une forme lin´aire f de l’espace physique.Dans le plan. e a e Quelle est alors la forme du champ des moments d’un torseur ? Torseurs du plan. Alors il est imm´diat que pour tous a a e points M et N . e qui est la r´sultante f tourn´e d’un angle droit. o` la position d’un point pond´r´ correspond au centre de la rotation et ee u ee sa masse correspond ` la vitesse angulaire. Voici: a Th´or`me. f (M ) = T (M )(M ) (le moment en M de T (M )). mais pour donner un aper¸u plus concret de la e c situation nous allons la regarder sur l’exemple fondamental d’une force exerc´e en un point. et qu’en tout e point le torseur de la force qui est transmise par l` s’annule en ce point. e e e Fixons une origine O dans le plan.

nous d´velopperons une description th´orique qualitative des proe e pri´t´s m´caniques des particules en termes d’une traduction choisie suivant le fait qu’elle induit ee e la plus grande fr´quence de situations d’´quilibre stable. nomm´ le principe de moindre e e e e e action. Ici. Ainsi. Ce confort sera d’autant mieux pr´serv´ que la description utilis´e se fera encore en tere e e mes de la g´om´trie euclidienne de l’espace. D’o` la question ridicule en th´orie mais grave en pratique pour nous e u e pauvres humains devant savoir g´rer au mieux les ressources de notre imagination: parmi ces deux e traductions possibles. H´las. et non celui de la m´canique relativiste. car elle consiste justement ` faire planer dans l’air un changement de signe qui remet en a question les relations habituelles entre les signes des quantit´s en jeu dans les ´tats d’´quilibre. T (M )(N ) approxime f (N ) au premier ordre au voisinage de M . et suivant quels crit`res ? e Dans la section suivante. ` savoir celui de l’´quilibre avec son ´nergie e e a e e potentielle. en sorte de pr´server le confort de notre e e e intuition. En effet. dans la th´orie de l’´quilibre c’est le signe de l’´nergie qui e e e e e s’inverse. en sorte qu’on ne verra que la notion ´l´mentaire de particule sans rien ee pr´ciser de ce qui fait en r´alit´ la diversit´ des esp`ces de particules existantes. y en a-t-il une qui soit meilleure que l’autre. ee e a ` savoir les particules ´l´mentaires ou non. e e e et leur rapport avec la notion de stabilit´. e e e e Puis. Mais en fait.5.par le voisinage commun de ces points. par laquelle les description intuitives e puissent s’´laborer sans h´sitation. la diff´rence consiste bien sˆr en une retraduction de e u la repr´sentation dans elle-mˆme. le langage le mieux adapt´ pour l’intuition est e e le langage que nous avons appel´ le langage th´orique. Cela signifie qu’il y a une correspondance entre les concepts de la r´alit´ e e e a e ` d´crire et ceux qui nous sont familiers par notre exp´rience des situations d’´quilibre dans la e e vie de tous les jours. et comme tout est ` l’´quilibre. D’o` la difficult´ pour l’intuition ` appr´hender la e u e a e coh´rence d’une description donn´e lorsque la g´om´trie pseudo-euclidienne est prise en compte. M´canique relativiste. la d´finition de l’´quilibre e e a e e e (annulation de la diff´rentielle de l’´nergie) est ´rig´e en principe. Il n’en reste pas moins que si ce langage est e adapt´. “´nergie” par “action”. On remplace “syst`me” par a e e “sc´nario”. nous ferons quelques remarques sur la notion de stabilit´. la notion g´n´rale d’´quilibre est conserv´e quand tous les signes des ´nergies sont e e e e e ´galement invers´s. ce n’est pas le cas car il y a deux possibilit´s. e Un probl`me est de d´crire. En un certain sens nous en avons e e d´j` tout dit: c’est la th´orie de l’´quilibre que nous venons d’´tudier. tout irait bien dans cette affaire s’il n’y a e a avait qu’une seule bonne mani`re de faire cette traduction. Seule la notion d’´quilibre stable est perdue et remplac´e par celle de l’´quilibre e e e e e le plus instable. montrant qu’` travers la e a 34 . ce qu’il fallait d´mone trer. comme il s’agit l` de d´crire au mieux les propri´t´s des objets physiques en eux-mˆmes a e ee e sans s’occuper de leurs apparences exp´rimentales. 4. Par mesure de simplicit´ on ne d´crira pas d’autres ee e e choses comme les champs. ` l’int´rieur de ce cadre g´n´ral. ce qui. celui de l’´quilibre sur les sommets de potentiels. cela ne signifie pas que les choses soient r´ellement telles qu’elles semblent quand on les e e d´crit dans ce langage. il faut le dire. En effet. en d´pit du fait que l’espace r´el est pseudo-euclidien e e e e et que pour cette raison il n’existe aucune correspondance compl`tement coh´rente et rigoureuse e e entre cette description et la r´alit´. quelles sont en particulier les e e a e e e propri´t´s m´caniques des objets physiques qui se rencontrent le plus couramment en pratique. introduction e Abordons maintenant l’´tude de la m´canique relativiste. il reste plusieurs probl`mes. Or. Comment e e e e est-ce possible ? Entre deux traductions. On peut mˆme aller plus loin en disant que ce probl`me du e e e e changement de g´om´trie relativise la d´finition d’un choix du signe de l’´nergie dans les descripe e e e tions. e e e e e Or. en employant dans le rˆle ea e e e o d’espace physique l’espace ` 4 dimensions de la relativit´ restreinte. d’o` le fait que sa valeur en N est un infiniment petit du u second ordre. constitue e malgr´ son extrˆme simplicit´ math´matique une gymnastique tr`s inhabituelle pour notre intuition e e e e e courante de l’´quilibre. et que nous choisissons d’utiliser cette familiarit´ pour exprimer ais´ment e e les choses ` d´crire ` travers cette correspondance. son moment par rapport ` N correspond ` l’effet des rotations de centre a a N qui se traduisent par une faible vitesse sur la petite courbe reliant ces points directement dans leur voisinage.

e a e e e dans lequel cette tension ne privil´gie aucune des directions de son extension dans l’espace-temps e pseudo-euclidien. comme traductions des lois g´n´rales de l’´quilibre e e e e pr´c´demment ´tablies appliqu´es ` l’espace pseudo-euclidien suivant une certaine repr´sentation e e e e a e th´orique (dont la coh´rence vient du fait qu’elle ne r´utilise sans examen que ce qu’on a pu d´finir e e e e sans utiliser les sp´cificit´s de la g´om´trie euclidienne).6. Description des particules Nous allons ici introduire une description th´orique des propri´t´s m´caniques des particules e ee e comme dans un espace eulicien. cette uniformit´ s’exprime par le fait qu’il n’y a pas de notion de vitesse e 35 . e e e on en connaˆ un ´quivalent en dimension 2: la surface de l’eau ou d’une bulle de savon v´hicule ıt e e aussi une tension superficielle constante. e e e e e la force exp´rimentale correspond ` la densit´ de force th´orique par rapport au temps. comme on le verra plus a e e loin. pouvant se voir comme la limite d’un ´lastique dont la raideur e tend vers l’infini. e Qu’est-ce qu’une particule ? Exp´rimentalement. Ainsi voit-on que la tension th´orique ee e ` e d’une particule repr´sente (est proportionnelle `) sa masse exp´rimentale. En effet. Alors. Dans le cas d’une r´sistance infinie (un fil). e a e Or. et qui est incurv´e uniquement l` o` s’exercent des forces ext´rieures de somme non nulle. e a e elle ne sera pas admise et le mod`le des fils de fer sera donc exclu. cette densit´ surfacique constante d’´nergie dans sa description exp´rimentale correspond e e e th´oriquement ` la composante temporelle du mˆme ph´nom`ne de surface tendue en dimension 3. e La seule question qui reste ` pr´ciser dans cette description est donc celle de la raideur de a e l’´lastique. Cette question se formule en termes du champ e e a e de potentiel sur l’espace de configuration: l’´nergie de chaque partie d’un ´lastique s’exprime en e e fonction de sa longueur. e Traduit th´oriquement. cela donne une ligne qui est droite si aucune force ext´rieure ne s’exerce e e dessus. la courbure (ou la diff´rence de direction de e e e part et d’autre du lieu d’application de la force) est proportionnelle ` cette force. Ainsi s’accordent e a ee a e les notions th´orique et exp´rimentale de force comme ´tant proportionnelles. a Connaissons-nous un tel ph´nom`ne dans la vie courante ? S’il n’est pas facile de trouver une e e substance visqueuse qui se comporte ainsi assez pr´cis´ment quand on l’´tire dans une dimension. et correspond ` une densit´ surfacique d’´nergie constante. e e ee Enfin. c’est un point anim´ d’une vitesse rectiligne e e uniforme quand il n’est soumis ` aucune force. d´duite par traduction de leur comportement exp´rimental usuel e e sans tenir compte des questions d’accords de signe ou autres coefficients de proportionnalit´ li´s ` e e a la vitesse de la lumi`re. Plus pr´cis´ment. la force n´cessaire pour ´quilibrer cette coure e e e bure est proportionnelle ` sa tension. La force de tension de l’´lastique en chaque lieu est alors la d´riv´e de e e e l’´nergie par rapport ` la longueur. qui est cette fois une tension par unit´ de longueur du e bord. de mˆme que la force n´cessaire pour donner ` une particule a e e a une acc´l´ration donn´e est proportionnelle a sa masse. la relation s’exprime e a e en disant que la longueur est ind´pendante de la tension. en sorte qu’elle ne devrait e e e mˆme pas ˆtre prise comme r´f´rence et que le “principe de moindre action” porte mal son nom. que nous dit l’exp´rience sur les masses des particules et leurs variation ? Elle nous dit e que la masse de chaque esp`ce de particule ´l´mentaire est une constante universelle. ` quoi correspond-elle exp´rimentalement ? Pour un ´lastique de tension a e e donn´e faiblement incurv´ en un lieu par une force. sa vitesse varie uniquement quand il est soumis ` a a des forces de somme non nulle (ni avant. Par contre ils ne pr´sentent aucune r´sistance ` la courbure contrairement au fil e e a de fer. e a u e On trouve facilement dans la vie courante deux sortes d’ojets se comportant ainsi: les ficelles et les ´lastiques. e e e e 4. ce qui correspond a bien exp´rimentalement ` l’effet d’acc´l´ration proportionnel ` la force exerc´e. pour un ´lastique de courbure donn´e. Comme une telle r´sistance permettrait ` la courbure de se prolonger en dehors du strict e a lieu d’application des forces ext´rieures contrairement ` ce qu’indique l’exp´rience des particules. Celle de l’´lastique est variable e e e a e e tandis que celle de la ficelle est totale. Ces deux objets pr´sentent une r´sistance ` l’´longation. En fait. ni apr`s). qui est sa r´sistance ` l’´longation. e a e e Ensuite. qu’en est-il pour une particule ? e Que dire de sa tension. On a donc e ee affaire ` un ´lastique dont la tension est ind´pendante de sa longueur ! Ainsi son ´nergie est a e e e proportionnelle ` sa longueur. nous ´tablirons rigoureusement les lois g´n´rales de la m´canique relativiste exprim´es en e e e e e termes de leur formulation exp´rimentale usuelle.correspondance entre th´orie et exp´rience elle se comporte ´trangement.

Mais il ne se passe rien de tel dans une particule: la e oe forme g´om´trique de chacune de ses parties suffit ` la d´crire physiquement en toute circonstance. Or. cette explication tombe ` l’eau: son ´tat en a e tant qu’´lastique ` l’´quilibre dans l’espace pseudo-euclidien n’est pas affect´ par le mouvement de e a e e 36 . La force th´orique qui prend alors appui sur cette e e rugosit´ pour tirer dans la dimension temporelle. que les contractions et dilatations n’ont pas d’effet sur la tension. e Finalement. Mais en e ee e fait. le spin est par nature une propri´t´ quantique des particules. le u e e e ` spin est ´galement n´gligeable. comme par exemple u e un grain de sable. Malgr´ cela. l’agitation thermique des atomes constitue dans la dimension temporelle une rugosit´ sur l’appui de laquelle on peut tirer. et ce faisant nous allons pr´ciser en quoi cette m´canique classique par e e e laquelle nous exprimons ce ph´nom`ne est mise en d´faut. le moment de la force v´hicul´e par rapport ` cette droite elle-mˆme. il faudrait qu’il y ait quelque chose d’irr´gulier dans sa longueur. en sorte que le choix du lieu o` le saisit a une implication u physique sur l’´lastique. c’est-`-dire. de cela il n’y a rien. Le spin Citons pour finir la derni`re propri´t´ m´canique des particules. saisissons-en un de ses points e a e e e (´v`nements) et tirons-le dans la direction de l’´lastique. Seule la partie avant de l’´lastique transmet son ´nergie e e e a ` la partie arri`re. et entraˆ e ıner une variation de tension (masse) entre les deux parties (pass´ et futur). il n’est pas exact que ce soit encore vraiment l` une propri´t´ m´canique dont on puisse a ee e rendre compte suivant l’expression de la m´canique classique (ou de l’´quilibre) que nous avons e e employ´e jusqu’` pr´sent. e e a e On peut ´galement r´interpr´ter ce ph´nom`ne en termes de rugosit´: pour que saisir un point e e e e e e de l’´lastique et le d´placer puisse r´ellement d´placer quelque chose dedans pour modifier l’´tat de e e e e e la particule et donc son potentiel. qui ait des effets m´caniques mesurables dans e la surface. Bien sˆr. avec des nombres pr´cis d’entre eux e e de part et d’autre du point qu’on saisira. e que ce d´placement puisse affecter. Le r´sultat pr´c´dent s’exprime ici par le e e e e e e fait que cet acte de tirer ainsi un point de l’´lastique dans le sens de la longueur n’implique aucune e transmission d’´nergie par celui qui tire. et ` cet ´tat de torsion du fil e e a e ainsi affect´ est associ´ une ´nergie. e e e Voici: le spin repr´sente la torsion de l’´lastique. Seulement. dans le cas du spin d’une particule. ce que nous aurions le droit de faire. dans le cas o` il suit une droite e e a u (la particule est isol´e). ce r´sultat apparaˆ naturel: car en saisissant un point et en le tirant. Une attitude sage serait de passer e e e simplement sous silence ce ph´nom`ne ´trange en le n´gligeant. Le mˆme ph´nom`ne existe aussi en dimension 4. s’appelle exp´rimentalement la transmission d’une quantit´ e e e de chaleur vers ce grain. qui est leur spin. L’explication de cette exp´rience a e courante est facile: le nombre de tours que l’on a fait subir au fil sur lui-mˆme se trouve enregistr´ e e dans les d´tails de la disposition de la mati`re que constitue le fil. dans une “grosse particule” form´e d’un grand nombre d’atomes. e e e e puisqu’` l’´chelle de la m´canique classique qui est celle des ph´nom`nes que nous avons d´crit et a e e e e e o` les approximations g´n´rales n´cessaires a la pertinence de cette description sont valables. puisque la particule est parfaitement e lisse. qui intervient lors de l’allongement que peuvent ensuite subir les parties e de l’´lastique de chaque cˆt´ de ce point. qu’avonse ıt nous fait finalement ? En quoi le fait de saisir tel ´v`nement et de l’amener vers tel autre de la e e mˆme ligne d’univers diff`rerait-il du fait de saisir cet autre point d`s le d´part ? Car il s’agit l` e e e e a de la mˆme particule ! e Un ´lastique habituel est fait d’un nombre fini d’atomes. Et donc. En effet. On peut expliquer ces propri´t´s des particules de la mani`re suivante: Prenons un tel ´lastique ee e e (une particule) attach´ ` ses extr´mit´s (sa cr´ation et sa fin).d’une partie ou d’un bord coulissant dans la surface. de laquelle d´rive le moment de la force qui fera tourner l’objet e e e e suspendu. e e e a e L’exp´rience quotidienne de ce ph´nom`ne est facile: on pend un objet ` un fil que l’on tient par e e e a le haut. e a e ee qui met en d´faut certaines r`gles de la m´canique classique. sauf qu’en l’occurence celui qu’on observe e e e semble s’´tendre universellement sans avoir aucune fronti`re sur laquelle sa tension puisse s’exercer: e e c’est la constante cosmologique. on roule le fil dans la main et l’objet se met ` tourner. nous allons pr´senter ici le spin dans les termes de e e e e la m´canique classique.

e e Veut-on faire le contraire et demander un ´quilibre stable d’un point de vue exp´rimental ? e e Le sc´nario de la particule restant fixe et les sc´narios de la particule oscillant suivant n’importe e e quelle amplitude autour du point d’´quilibre stable ´tant tous permis par la m´canique relativiste. Mais si au contraire l’´lastique se prolonge plus loin. e Stabilit´ et instabilit´. en disant que qu’il faut inclure dans e e ee l’´tat du syst`me celui de son bord. en revenant ` e e e e a l’´tat initial. Et c’est l` que l’insuffisance de ce mode de repr´sentation apparaˆ e a e ıt. La question est: y a-t-il des sc´narios qui constituent des e e minima ou maxima d’action. ` savoir ici. a e e e u e e ee e C’est donc. En fait. comme si on comprimait l’´lastique et qu’il r´siste du fait qu’il n’a pas d´cid´ de quel cˆt´ e e e e oe il allait se plier. puisqu’il n’y a pas de rugosit´ dans la largeur de la particule. sur laquelle ce e mouvement pourrait s’exercer. Mais d’autre part. il faut changer le signe par rapport ` ce que e a nous avons d´crit jusqu’` pr´sent et consid´rer l’´lastique tendu (la particule) comme un syst`me e a e e e e instable. e e e e [Quelques exemples sont donn´s ici. on ne peut d´finir la mani`re dont l’´nergie e e e e se r´partit de chaque cˆt´ d’une surface de coupe qu’en choisissant une direction lat´rale ` cette e oe e a coupe. alors on lui a donn´ ou pris une ´nergie pr´cise correspondant au spin. Cela peut se comprendre par e e le fait que cet exp´rience doit ˆtre interpr´t´e autrement. un ´quilibre instable. e Donc. en parcourant la vall´e. il faut attacher ses extr´mit´s ailleurs que e e e pr´cis´ment au fond de la val´e. Si on fait faire un tour complet ` cette direction autour de l’axe de e a l’´lastique. peut-on r´ellement tenir et rouler ainsi la particule sur elle-mˆme ? e e En un sens non. Cette main ne peut alors changer sa direction qu’en e e e tournant et fournissant donc une ´nergie. qu’on peut “fournir une puissance au syst`me” par e e e un mouvement de son bord qui ne modifie pas l’´tat du syst`me.torsion qu’on inculque ` une de ses extr´mit´s. Ceci ruine tout espoir de voir l’action minimis´e ou maximis´e en e e e g´n´ral (et le changement de g´om´trie n’y change rien). e e e mais que donne-t-il exp´rimentalement ? Pour le voir. cela donne donne aux deux extr´mit´s issues de cette e e coupe cette mˆme direction de prise. que voit-on ? Qu’il reste quasiment e e e e au fond sauf ` la fin (et de mˆme au d´but sym´triquement) o` il s’´carte de mani`re acc´l´r´e. dans quelle direction lat´rale est orient´e la main e e a e e qui tient l’´lastique en chaque extr´mit´. Le rapport pr´cis de compensation entre les deux est ce qui d´termine e e la p´riode de l’oscillation: une variation plus serr´e du potentiel n´cessite pour ˆtre compens´e une e e e e e oscillation plus serr´e (rapide). exemples e e Nous allons aborder la question de la stabilit´ de l’´quilibre au sens th´orique en m´canique e e e e relativiste. d’autant plus que cette action qui est minimis´e dans le cas des e particules correspond ` l’oppos´e de l’´nergie potentielle. Alors. ils maximisent l’action par rapport aux sc´narios voisins e e e de fixit´ par rapport au temps. dans le cas o` cette prise d´finit la terminaison physique e u e de l’extension de l’´lastique. Si on coupe suivant cette direction.) Comme les ´quilibres e e e e exp´rimentaux minimisent cette ´nergie. si on veut que le potentiel ext´rieur ressemble en th´orie ` son apparence exp´rimentale e e a e afin que les notions de stabilit´ se correspondent. et lesquels ? On verra en fait qu’en sortant de l’exemple restrictif des particules il n’y en a pas. exp´rimentalement. C’est donc que la variation de l’action a e due ` l’´cart par rapport ` la position d’´quilibre d’apr`s la force ext´rieure compense celle due ` a e a e e e a l’oscillation (action interne). une puissance est r´ellement transmise a e e e dans ce mouvement. Ce serait un ´tat stable d’un point de vue th´orique. d’autres exemples compl´mentaires de ceux-ci pourront e e ˆtre ajout´s ` l’avenir] e e a On pourrait imaginer un ´lastique (une particule) tendu au fond d’une vall´e de potentiel (on e e suppose qu’il est lourd et ne d´colle pas). e e e En quoi peut-il alors consister ? Ce mod`le a cette part d’incoh´rence. le point important ici n’est pas le signe de la tension mais l’instabilit´ e fondamentale de la particule comme ´lastique th´orique en prenant comme r´f´rence de stabilit´ e e ee e 37 . le moment de la force v´hicul´e est bien r´el. Au fait. pourtant. et son rapport avec la stabilit´ de l’´quilibre exp´rimental pour le cas d’un syst`me e e e e n’´voluant pas au cours du temps. e e e on peut transiter continument d’un sc´nario ` l’autre en fixant les extr´mit´s (la particule partant e a e e et finissant en sa position d’´quilibre). (Ceci a bien sˆr l’avantage que la “force” a e e u issue d’une action se d´finit par la diff´rentielle de l’action et non son oppos´. Alors l’action ne saurait varier puisque sa variation est e nulle au premier ordre ` toute ´tape de ce changement.

Nous d´finirons la force exp´rimentale comme ´tant la restriction ` S de la densit´ e e e a e de force th´orique par rapport au temps. Sa norme en mesure temporelle e e e s’appelle sa masse . le “principe de moindre action” repr´sentant la minimisation de l’action des e sc´narios d’une particule isol´e. Choisise sons de repr´senter th´oriquement le principe de moindre action en termes d’´quilibre. M´canique relativiste.7. C’est donc la variation exp´rimentale de l’objet associ´ au syst`me entre les instant t1 et e e e e t2 qui est ´gale au torseur th´orique des forces appliqu´es au syst`me entre ces instants. Enum´rons ` pr´sent ces quantit´s qui se conservent dans le cas d’un syst`me isol´: e a e e e e . On a un champ d’action sur l’espace de configuration th´orique. consid´rons le syst`me th´orique d´limit´ par les deux faces parall`les d’´quations e e e e e e e T (M ) = t1 et T (M ) = t2 (avec t1 < t2 fix´s) et des parois lat´rales. e C’est pourquoi. Voici les conventions. qui se d´compose en a e deux parties: d’une part. e Le point de vue exp´rimental part du choix d’un r´f´rentiel. nous allons d´montrer que cela redonne toutes e e les propri´t´s exp´rimentales usuelles de la force. e 38 . et ceci nous sert de d´finition des conventions de ee e e signes th´oriques en fonction des donn´es exp´rimentales. Un r´f´rentiel s’exprime de mani`re e ee ee e ´quivalente par sa direction temporelle. Consid´rons un syst`me en ´volution (sc´nario). sa restriction aux rotations spatiales appel´e le moment cin´tique qui e e correspond aux rotations spatiales (celles de S). autrement dit d´finie par les relations: (T (t) = 1 et une ´quation de S e e e est T (M ) = 0). Alors. En effet. L’annulation de la somme e e des forces appliqu´es ` ce syst`me se r´´crit en disant que ce qui sort par t2 moins ce qui entre par e a e ee t1 est ´gal ` la somme de ce qui entre par les parois lat´rales ou qui s’applique dans l’int´rieur du e a e e syst`me.Le moment (par rapport ` une origine arbitraire de l’espace-temps). cette quantit´ se conserve au cours du temps dans le cas d’un syst`me isol´ e e e (non soumis ` des forces autres que les forces internes apparaissant dans les coupes du syst`me en a e t1 et t2 ). Donc. En particulier. et sa partie temporelle appel´e a e e e e ´nergie. l’objet qui “se conserve” se d´finit comme ´tant e e e le torseur (r´sultante et moment) des forces th´oriques que la partie pass´e exerce sur la partie e e e future.celle du point de vue exp´rimental. ou la coordonn´e de e e a e temps T (de mˆme direction que t au sens du produit scalaire). La conversion de ce f = p − ET en vecteur par le produit scalaire e e E en unit´ d’espace d´finit le quadrivecteur ´nergie-impulsion p+ c2 t. qui est une forme lin´aire multipli´e e e e par une quantit´ de temps. en d´finissant e e e e l’´nergie th´orique comme ´tant l’oppos´e de l’action (ce qui dans notre approche constitue en fait e e e e la d´finition de l’action ` partir de l’exp´rience). e e e e e e avec un choix de r´f´rentiel. d´finie par E = −f (t). En effet. et d’autre part ce qui repr´sente le centre d’inertie e du syst`me (voir plus bas). e u 4. formulation e Etablissons enfin les lois fondamentales de la m´canique relativiste comme traductions exp´e e rimentales des lois de l’´quilibre. (Ce choix de faire correspondre ainsi les e e e forces th´orique et exp´rimentale sans changement de signe semble en effet le choix de convention e e le plus naturel). Lois de conservation Nous allons obtenir les lois de conservation de la m´canique relativiste comme traduction e exp´rimentale des bilans des forces ext´rieures que nous avons pr´sent´s en m´canique de l’´quilibre. ou par son vecteur temps not´ t (objet trait´ comme un e e e vecteur mais qu’il faut en fait multiplier par une quantit´ de temps pour obtenir un vrai vecteur e g´om´trique).La r´sultante th´orique f se d´compose exp´rimentalement en sa partie spatiale (restriction e e e e de f ` S) appel´e quantit´ de mouvement ou impulsion et not´e p. Chaque instant ee e e e e (´l´ment de la droite d’arriv´e de T ) d´finit un sous-espace de dimension 3 qui divise le sc´nario ee e e e en une partie pass´e et une partie future. il a ´t´ convenu de donner ` l’action le signe oppos´ ` l’´nergie e e ee a e a e au sens exp´rimental (le sens exp´rimental ´tant le seul ` d´terminer une correspondance entre les e e e a e deux tandis que la correspondance th´orique est au libre choix des goˆts et des couleurs). la e e e e d´riv´e par rapport au temps de cette quantit´ est ´gale ` la densit´ temporelle de l’exercice de ce e e e e a e torseur. et donc la force th´orique est ´gale ` la diff´rentielle e a e e e a e de l’action. ou son espace S orthogonal ` t (des vecteurs de l’espace usuel).

Il ne reste plus qu’` v´rifier que tout cela redonne l’expression exp´rimentale usuelle des lois a e e de la m´canique (classique ou relativiste).) Quelle est donc la puissance transmise par cette force au syst`me ? D’apr`s la d´finition de e e e l’´nergie exp´rimentale donn´e plus haut. du pass´ vers le futur (et ` la vitesse du temps e e a qui passe). la composante temporelle de p1 ´tant E2 . E2 . e D´j`. e e a e a Ici. e Leur conservation s’exprime par p = p1 + p2 . Bien sˆr. e (Ceci compl`te donc f par les composantes temporelles de cette force th´orique. notons f la force th´orique correspondante exerc´e e e e e entre deux instants infiniment proches l’un de l’autre. Comme d’autre e e a e part on admet la relation fondamentale de la dynamique comme principe physique. La particule de d´part ´tant d´clar´e immobile. Mais nous allons l’utiliser e a comme vecteur tangent ` l’espace de tous les sc´narios par un prolongement arbitraire. Or t + v repr´sente un mouvement de coulissement du sc´nario sur lui-mˆme. e e Exemple de calcul concret Soit une particule de masse m immobile au d´part ´clatant en deux particules de masses m1 e e et m2 . Pour montrer l’´galit´ voulue. ces ´tats sont d´finis a e e e e th´oriquement comme ´tant les coupes possibles de sc´narios par un espace fixe S1 d’´quation e e e e T (M ) = constante. e e e “m´canique” signifie que toute transmission d’une quantit´ de chaleur est retranch´e de ce bilan. Calculer leurs ´nergies E1 . e e e u dans le cas contraire cette diff´rence correspond ` la quantit´ de chaleur transmise. p e e e e 1 est dans la direction du vecteur temps. e a e Ainsi est retrouv´e la relation entre force et ´nergie constituant la th´orie de l’´quilibre dans e e e e le cas exp´rimental. restreinte ` l’espace. auquel la e e e force f doit ˆtre insensible si elle ne comporte pas d’´change thermique avec le syst`me. le r´sultat cie dessus est en fait la confirmation de notre d´finition de la force exp´rimentale comme densit´ e e e temporelle de force th´orique. e a Relions d’abord la force exp´rimentale ` l’´nergie exp´rimentale: e a e e Th´or`me de la puissance. e e La force f repr´sente la force exp´rimentale. on a le calcul e c suivant avec le produit scalaire en mesure temporelle : m2 = p2 = (p − p1 )2 = m2 + m2 − 2m 2 2 1 =⇒ E1 = c2 (m2 + m2 − m2 ) 1 2 2m E1 c2 Centre d’inertie Nous allons d´finir le centre d’inertie d’un syst`me en termes de la mesure du moment du e e syst`me sur les rotations th´oriques d’axes de directions spatiales (axes de dimension 2 parall`les e e e 39 . comme cons´quence du principe de moindre action. ramen´es abstraitement par translation temporelle ` l’espace S1 . e Solution : soient p. La puissance m´canique exp´rimentale exerc´e par une force f sur e e e e e un syst`me ´voluant ` la vitesse v est ´gale ` f (v). cette puissance vaut −f (t) o` t repr´sente le mouvement e e e u e th´orique de translation dans la direction du temps. e e a e e e e La difficult´ dans la v´rification de ce r´sultat est de montrer l’´quivalence des d´finitions e e e e e exp´rimentales des termes employ´s (force et impulsion) ` leurs d´finitions usuelles. on tire imm´diatement des d´finitions et r´sultats ci-dessus la ea e e e Relation fondamentale de la dynamique. p1 et p2 les quadrivecteurs ´nergie-impulsion des particules respectives. La d´riv´e par rapport au temps de l’impulsion e e d’un syst`me est ´gale ` la r´sultante des forces ext´rieures appliqu´es au syst`me en cet instant. dont on a e demande seulement que dans ce mouvement th´orique. divis´e par l’intervalle entre ces instants. la coupe par S1 demeure contenue dans S1 e et y co¨ ıncide avec le mouvement exp´rimental de vitesse v invoqu´. remarquons que la diff´rence entre ces termes vaut e e e f (t + v). Le vecteur tangent v repr´sente la vitesse de variation des coupes successives suivant le temps e T . e e e v est un vecteur tangent ` l’espace de configuration des ´tats exp´rimentaux. la puissance d´signe la densit´ temporelle (ou d´bit) d’energie transmise par cette force. qui l’accompagnent e e naturellement.

Ainsi. dont l’axe plan passe par un point origine fix´). autrement dit. e D’o` finalement u E = mc2 . e c2 c2 Or. Notons que ces rotations ne forment pas un groupe (la compos´e de deux telles rotations e n’est pas une telle rotation). ou bien un vecteur auquel s’applique la ee partie lin´aire de w. e c2 Nous venons ainsi de d´crire g´om´triquement un certain sous-espace vectoriel de l’alg`bre de e e e e Lie du groupe des d´placements th´oriques. en commen¸ant par les rotae e c tions vectorielles (ou autrement dit. donnons une description g´om´trique de ces rotations. Attention: ce que nous appelons ici et plus bas la masse ne doit a pas ˆtre confondu avec la notion de masse que nous avons invoqu´e pr´c´demment en parlant de e e e e la masse d’une particule. L’´volution du centre e d’inertie constitue une droite de l’espace-temps dirig´e par le quadrivecteur ´nergie-impulsion p + e e E e ıt e e 2 t. autrement dit la puissance th´orique transmise par le pass´ sur le futur lors d’une e e e translation th´orique de vitesse −t. Calculons la masse m de ce point pond´r´: elle s’obtient en appliquant cette expression au cas ee de la forme affine constante w ´gale ` 1. nous avons trich´ en ajustant le coefficient dans la d´finition de w u e e qui se r´percute sur la d´finition de m. autrement dit une forme lin´aire sur ce sous-espace. Ceci correspond au mouvement qui d´place tout point de e a e S(t) suivant le mˆme vecteur −1 t. e Reprenons la remarque d´montr´e dans le cas du plan que le moment par rapport ` un point e e a s’exprime par une forme affine dont la direction est celle du vecteur force. d´signant l’application lin´aire e ee e e qui ` tout w associe mw(G). Il ne nous reste plus qu’` justifier ce coefficient par le fait e e a qu’il en r´sulte la propri´t´ suivante: e ee Mouvement du centre d’inertie. D’abord. par le produit scalaire spatial usuel). Une droite dirig´e par ce vecteur apparaˆ exp´rimentalement comme un point anim´ de la c p 2 vitesse m si ce m est d´fini par E = mc . l’autre come e pl`te et rigoureuse. l’une simple et intuitive. e D´monstration 1. C’est donc le mouvement de translation de vitesse −1 t. tandis que ce que nous e e e appelons provisoirement ici la masse est sa composante temporelle. ou bien un point G pond´r´ par une masse m. e a e Nous allons donner deux d´monstrations de ce r´sultat.a ` S). Ensuite. Or il suffit de d´crire le mouvement de tout point de S(t) car le e a e reste de la rotation s’en d´duit (comme le mouvement d’un plan d´termine celui des solides pos´s e e e dessus). D´crivons maintenant la forme de la restriction d’un e e e torseur ` ce sous-espace. e D´monstration 2. Mais rappelons que ce sont seulement les vitesses de rotation qui nous importent. La propri´t´ commune de toutes ces rotations est le fait que la vitesse de tout ee ee point de S(t) est colin´aire ` t. e On reprend une d´monstration compl`te partant de la construction des torseurs en termes de e e rotations. 40 . on repr´sentera une telle rotation par l’application affine w d´finie sur S(t) qui e e d´finit la vitesse de tout point N ∈ S(t) par l’expression − w(N ) t. et qui est la d´finition commun´ment admise en m´canique relativiste e e e (elle d´signe ordinairement la norme du vecteur de la r´sultante conserv´e. e Voici: une rotation qui d´place le vecteur temps t suivant une vitesse w ∈ S. d´place tout e e w·v v ∈ S suivant la vitesse c2 t. a e A quoi ressemble donc une forme lin´aire sur l’espace des formes affines sur l’espace euclidien e S(t) ? C’est un point pond´r´ de S(t). nous avons d´fini l’´nergie E du syst`me comme ´tant moins la composante temporelle de e e e e la r´sultante. Dans un r´f´rentiel donn´. Mais bien sˆr pour l’obtenir. la vitesse de variation au cours ee e du temps du centre pond´r´ d’inertie mG d’un syst`me isol´ est ´gale au vecteur impulsion p du ee e e e syst`me (correspondant ` la forme lin´aire impulsion. consid´rons l’ensemble des rotations d’axe contenu dans un mˆme espace de simule e tan´it´ S(t) (espace euclidien de direction S form´ des ´v`nements d’une mˆme date t dans le e e e e e e r´f´rentiel choisi).

le mouvement r(t )−r(t) ´tant la diff´rence de deux mouvements de rotation de mˆme e e e partie lin´aire. mais l’usage que nous en ferons pourrait s’appliquer e a a ` des mani`res beaucoup plus g´n´rales de maintenir le bord d’un syst`me. ou encore sa position et son e impulsion. sans en ˆtre affect´es. on conclut: e mG(t ) − mG(t) = (t − t)p. Calculons le vecteur vitesse de ce mouvement. Enfin. maintient une oe partie du syst`me. il n’est pas besoin de pr´ciser la composante temporelle des forces th´oriques e e e (les ´nergies) mais seulement celles qui agissent suivant la direction du plan de coupe (impulsions). e car cette composante temporelle est d´termin´e de mani`re unique par ces conditions. par laquelle e e e l’´tat d’un syst`me ` un instant donn´ d´termine son ´tat ` venir. En effet. la valeur de r(t)(t) se d´duit de la d´finition du rapport entre w et r(t) et de la description e e donn´e plus haut de ces rotations: r(t)(t) = −w o` w est le vecteur repr´sentant la partie lin´aire e u e e de w. Ainsi tout mouvement e e qui sortirait de ce plan est repr´sentable de mani`re unique par un mouvement demeurant dedans. e e e On appelle espace des phases d’un syst`me la vari´t´ constitu´e de tous les ´tats qu’il pourrait e ee e e avoir ` un instant donn´. e Une fa¸on de le faire est de remarquer qu’on passe de l’objet g´om´trique r(t) ` l’objet r(t ) par c e e a la translation τ de vecteur (t − t)t. L’´tat d’une particule classique consiste en sa position et sa vitesse. peuvent ˆtre prolong´es e e e par la simple traction de leur bord suivant leur long. e e c 41 . mw(G(t )) − mw(G(t)) = µ((t − t )r(t)(t)) = (t − t)µ(w) = (t − t)p(w) = (t − t)w(p). e e Pour la mˆme raison. et qu’il y a deux acteurs qui. Donc. 4. son ´tat en un instant se d´finit par la e e e e e coupe du sc´nario par cet instant dans l’espace-temps. pour un syst`me donn´ ` e e a e e a l’´quilibre. est un mouvement de translation. puisque tout est fait de particules qui. Voyons les notions de base qui e e a e e e a interviennent dans cette question. je peux le couper sans perturber l’´quilibre de la moiti´ qui m’int´resse ` condition de e e e e a maintenir en place toute la disposition de ce qui se trouve sur cette coupe et d’y exercer pour cela toutes les forces n´cessaires. Ceci ´tant valable pour tout w. o` la notion de l’´tat d’une coupe est constitu´e de sa forme et celle des a e u e e forces qui la traversent (impulsions). et peut agir dessus en la d´pla¸ant et en modifiant la force qu’il exerce dessus. comme nous avons d´crit. il n’y a pas ` prendre en compte de mouvements de cette coupe qui sortent de e a son plan. pour tout point M . Nous l’avons d´fini ` l’aide d’une coupe. (r(t ) − r(t))(M ) = τ (r(t))(M ) − r(t)(M ) = r(t)(τ −1 (M ) − M ) = (t − t )r(t)(t).8. Donc. chacun de son cˆt´. e e e e L’important. et l’ensemble de toutes les forces th´oriques e e (les impulsions) qui sont v´hicul´es ` travers cette coupe. Quelle est alors la e relation entre mw(G(t)) et mw(G(t )) ? C’est le mˆme torseur µ qui s’applique aux deux vitesses e de rotations r(t) et r(t ) d´finies par le mˆme w sur les diff´rents espaces S(t) et S(t ). je peux reproduire la mˆme ´volution en exer¸ant sur la coupe les e ee e e e c mˆmes mouvements et forces qui seraient v´hicul´es ` travers ce plan si le syst`me n’´tait pas e e e a e e coup´.Pour v´rifier la relation ´nonc´e entre centres pond´r´s d’inertie. L’espace des phases La m´canique classique que nous avons expos´ se traduit en une loi d’´volution. Si je m’int´resse ` l’´volution que cette moiti´ aurait si le syst`me e e a e e e ´voluait sans avoir ´t´ coup´. Plus g´n´ralement pour un syst`me quelconque. o` la correspondance ee ea u entre tous les S(t) se d´finit par la translation temporelle dans la direction de t. qui est identifi´ ` chacun des espaces S(t). donc. En effet. fixons une forme affine w sur e e e ee l’espace euclidien S du r´f´rentiel. Ensuite. est qu’on a un syst`me en ´quilibre (un sc´nario) pouvant ˆtre soumis e e e e a ` des potentiels quelconques. On a donc: e e e mw(G(t )) − mw(G(t)) = µ(r(t )) − µ(r(t)) = µ(r(t ) − r(t)).

donc. Au bilan. la d´finition est plus compliqu´e mais elle existe. (On ne s’int´resse pas ` la mani`re dont chacun se d´brouile de son e a e e cˆt´ pour faire ´voluer sa prise en sorte de s’accorder ` chaque instant avec la position du syst`me oe e a e dans l’espace des phases). Nous supposons donc que l’espace des phases est de dimension ee finie. e e o e e Une structure symplectique est (` peu de chose pr`s) une application qui ` toute courbe ferm´e a e a e munie d’un sens de parcours. Le mouvement de l’espace des phases dans lui-mˆme qui exprime la loi e e e d’´volution d’un syst`me au cours du temps. le travail total donn´ par l’un est donc celui re¸u par l’autre. e De cela d´coule le e Th´or`me de Liouville. elle consiste en une e e e e simple expression tensorielle dont nous admettons ici l’existence. ` des forces issues de potentiels d’autre a part. Et subjectivement. ce qui est le cas en pratique pour un syst`me de particules (il y a 6 dimensions par particule). l’autre pourra bouger la sienne et affectera la force ` laquelle le premier doit r´sister pour maintenir cette fixit´. disons seulement que la mˆme courbe parcourue dans deux sens oppos´s doit donner des e e r´sultats oppos´s). il suffit de donner une e d´finition de la mesure du volume dans l’espace des phases qui d´pend uniquement de cette struce e ture symplectique. Ou s’il d´cide de a e e e laisser sa partie suivre le mouvement suivant une certaine ´lasticit´. une orientation ´tant donn´e. ce qu’il e c fallait d´montrer. les actions de l’autre la feront e e bouger. Si l’un choisit par exemple de maintenir fixe sa partie. A toute courbe ferm´e de l’espace des phases. Quand le syst`me revient ` sa configuration initiale apr`s avoir fait un tour. chaque acteur associe le e e e travail total qu’il doit fournir au syst`me lorsque l’´tat du syst`me effectue le parcours de cette e e e courbe (infiniment lentement: l’´tat ` chaque instant est suppos´ ˆtre un ´tat d’´quilibre). chaque acteur se repr´sente l’espace des phases en e d´crivant tout ´tat d’´quilibre du syst`me en dehors de lui sous la forme de ce qu’il peut ressentir e e e e de son cˆt´ lorsque le syst`me se trouve dans cet ´tat. e a e e Ces deux structures symplectiques sont oppos´es car le syst`me est suppos´ ˆtre uniquement e e ee soumis aux actions libres des deux acteurs d’une part. Note: la notion de volume n’a un sens math´matiquement coh´rent que dans e e des vari´t´s de dimension finie. e e e Comme nous venons de voir qu’il pr´serve la structure symplectique. et dont la r´alisation d´pend du e e e e bon vouloir conjoint de ceux-ci. donc. e mais non pour le cas d’un champ. associe une quantit´ d’action (que nous traduisons par le terme e d’´nergie dans notre langage th´orique). le total e a e des ´nergies fournies au syst`me par toutes les forces est nul ` l’exception du travail fourni par e e a les deux acteurs. D´finissons l’espace des phases comme ´tant l’ensemble des ´tats d’´quilibre possibles pour le e e e e syst`me dont on oublie les voisinages imm´diats des deux acteurs. pr´serve le volume. en e a e e e e supposant que cet acteur reprend ` l’arriv´e la mˆme disposition qu’il avait au d´part (ce qui est a e e e possible puisque le syst`me parcourant une boucle se retrouve ` la fin dans le mˆme ´tat qu’au e a e e d´part et donc il ne tient qu’` l’acteur de se remettre dans le mˆme ´tat). oe e e Th´or`me. Dans le cas e a e e e g´n´ral (en dimension finie). l’aire d’une surface se d´finit par la quantit´ e e d’action associ´e ` la courbe fronti`re de cette surface. d’une mani`re lin´aire (condition que nous ne d´taillerons e e e e e pas. en sorte que les acteurs interagissent uniquement par l’interm´diaire du syst`me: les actions de l’un sur le syst`me sont ressenties par l’autre et e e e inversement. Dans le cas d’un espace des phases de dimension 2.Ces deux parties sont disjointes l’une de l’autre. Les structures symplectiques attribu´es par chaque acteur ` l’espace des phases sont e e e a oppos´es (donc ´gales si l’un a le rˆle d’´metteur et l’autre de r´cepteur). 42 .

e ee Un des probl`mes que cela pose est le probl`me de la divergence. le mouvement d´pla¸ant les concentrations de probabilit´ et e c e ne les diluant pas. si on se d´tourne de la simple manie e a ee e e de pinaillage d’analyse des math´maticiens pour adopter les grandes d´marches d’approximations e e ch`res aux physiciens. le fondement sur la physique quantique est plus ais´ pour arriver quasiment aux mˆmes r´sulats. mais que cet ´tat est al´atoire suivant une loi de probabilit´ e e e e bien d´termin´e appel´e l’´tat statistique du syst`me. ce qu’on a appel´ la e e e e e “catastrophe ultraviolette”: en consid´rant l’espace des phases de dimension infinie du champ e ´lectromagn´tique. M´canique statistique e 5. Comme e e e il correspond mieux ` la r´alit´. De l` on peut d´finir l’entropie comme une mesure de la dilution de cette probabilit´: a e e S=− E p ln p moyenne par rapport aux possibilit´s ´l´mentaires de se retrouver en les diff´rents lieux de E (donc e ee e int´grale suivant p fois l’´l´ment de volume) de la mesure − ln p de cette dilution. ce e a e e qui est une approche valable dans nombre de situations pratiques. e Il y a deux mani`res possibles de fonder la m´canique statistique: sur la m´canique classique e e e d’une part. ce qui apparaˆ quelque peu absurde. la dimension de l’espace e e vaut six fois le nombre de particules pr´sentes. Concr`tement. Fondements de la m´canique statistique. si ` la limite on e ıt a 43 . ainsi e e la m´canique statistique n’est pas exactement la mˆme suivant qu’on la fonde de l’une ou l’autre e e mani`re. La densit´ de e a e e e probabilit´ en chaque point est le rapport de la probabilit´ de pr´sence dans un petit voisinage de e e e ce point sur le volume de ce voisinage. Contrairement ` ce ` quoi on pourrait s’attendre a priori.5. a e e De quoi s’agit-il ? Nous avons montr´ que la loi d’´volution au cours du temps en m´canique e e e classique s’exprime par une transformation de l’espace des phases E qui pr´serve son volume e (th´or`me de Liouville). qui sont autant de voies de rayonnement e e e suppl´mentaires. En effet. e e c Un autre d´faut encore de l’approche par la physique classique est qu’elle n’admet pas la e possibilit´ d’une variation du nombre de particules pr´sentes. Comme la r´alit´ est quantique et que la e e e m´canique classique en est une approximation ayant un large domaine de validit´ pratique. il est plus satisfaisant. comme une cuill`re de caf´ dans la marmite de l’espace des phases. Cela e e e e e e e e n’empˆche pas de chercher ` la d´crire et l’expliquer dans les termes de la m´canique classique. Ceci peut ˆtre surmont´ sous forme de l’approximation d’un m´lange (r´sultat e e e e de mouvement o` la concentration demeure mais est dispers´e un peu partout) par une dilution. et c’est celle fond´e sur la m´canique quantique qui d´crit plus pr´cis´ment la r´alit´. son fondement sur la physique a a classique comporte des difficult´s math´matiques.1. le rayonnement thermique du corps noir d’une temp´rature donn´e devrait e e e e avoir une intensit´ tendant vers l’infini au fur et ` mesure qu’on inclut dans le calcul ces dimene a sions correspondant aux fr´quences de plus en plus ´lev´es. e Un autre inconv´nient de cette pr´sentation est qu’elle semblerait indiquer une conservation et e e non une augmentation de l’entropie. u e du fait qu’il est pratiquement impossible de r´effectuer ` l’inverse ce mouvement assez pr´cis´ment e a e e pour effectivement d´faire le m´lange de fa¸on constatable en pratique. e e Le passage ` la physique statistique consiste ` dire qu’on ne connaˆ plus l’´tat x ∈ E du a a ıt e syst`me dans l’espace des phases. donc une cr´ation ou une annihilation de particules e e devrait s’exprimer par une transformation pr´servant le volume d’un espace de phases vers un e autre de dimension diff´rente. qui s’exprime par une densit´ de probabilit´: e e e e e e e on peut imaginer la densit´ de probabilit´ comme la densit´ d’une substance pr´sente en quantit´ e e e e e totale ´gale ` 1. notamment des probl`mes de divergence. il n’en reste pas moins que les divergences en question devraient se retroue ver concr`tement dans les cons´quences exp´rimentales de ces hypoth`ses. En effet. notamment du fait que dans e e le cas d’un champ classique l’espace des phases est de dimension infinie et donc cela pose des probl`mes ` la notion d’´l´ment de volume. sur la m´canique quantique d’autre part. Ainsi peut-on dire que sous certains aspects. qui e e e n’existent pas avec la physique quantique.

Soit un syst`me S isol´. nous allons ici d´velopper la m´canique statistique ` partir d’un mod`le de d´part e e a e e math´matiquement simple. L’´quilibre statistique n’implique pas l’´quilibre e e classique car il ´nonce seulement que la diminition de chaque p(x) par l’´volution possible de l’´tat e e e x vers d’autres ´tats sera exactement compens´ par son augmentation due aux ´volutions des autres e e e ´tats vers x. dans toute direction de surface de dimension 2 dans l’espace des phases. 1] dont la somme des valeurs vaut 1: p(x) = 1. ou quantiquement comme celui des vecteurs d’une base e e choisie dans l’espace de Hilbert. la r´alit´ qui se cache e e e derri`re l’apparence classique d’une portion de l’espace des phases de volume nhk . Il s’interpr`te classiquement comme l’ensemble des cellules de volume h en lesquelles e on aurait d´coup´ l’espace des phases. y)p1 (x). Un ´tat statistique sur un espace E est donc une application p de e e E dans [0. en ´volution vers e e e a e un espace E ` l’instant t2 > t1 . p2 (y) = p(x. e e e Ainsi s’exprime le principe d’incertitude de Heisenberg: l’´tat d’un syst`me dans l’espace des e e phases n’est pas plus pr´cis´ment d´fini suivant chaque direction de surface. si on interpr`te classiquement la lumi`re comme e e syst`me de particules et non comme onde. que nous dit la physique quantique ? Qu’il y a une limite ` la division a a du volume de l’espace des phases (et donc une limite ` la concentration de la probabilit´). e Pour pouvoir ´tablir ses propri´t´s. ce qui donnerait alors ` l’entropie ee a finale la valeur de moins l’infini (!). On a ´videmment ∀x ∈ E. On passe alors de la notion d’´quilibre classique e e a ` celle d’´quilibre statistique (ou thermodynamique). Introduisons d’abord des notations. notons p(x. en sorte que p(x) demeure constant. et ce qui se cache derri`re une apparente ´volution incompressible de e e ce volume. Un ´tat d’´quilibre statistique est un ´tat e e e e statistique qui ne varie pas au cours du temps. le volume minimal qu’on e e peut consid´rer dans un espace des phases de dimension 2k vaut hk . Pour tous x ∈ E et y ∈ E . d’´tat statistique p1 sur un espace E ` l’instant t1 . on a comme unit´ de mesure naturelle de cette aire la constante de Planck e a e h ¯ . y∈E p(x. Par exemple. que par la donn´e de e e e e la cellule qui le contient dans un tel d´coupage flou. En a e effet. son rapport avec l’espace physique et ses points d’´quilibre au sens exp´rimental classique. Alors. la densit´ de ee e u e e ee e probabilit´ qui avait une dilution volumique dans le premier n’aurait plus une dilution volumique e dans le second mais une concentration sur une sous-vari´t´. Cette loi de probabilit´ p est appel´e l’´tat statistique (ou e e e e e e e e thermodynamique) du syst`me. En fait. y) = 1. on a une mesure des aires donn´e par la restriction de la structure symplectique ` cette surface. y) la probabilit´ pour que. ee e e Il consiste ` partir d’un ensemble E discret (fini ou d´nombrable) nomm´ “ensemble des ´tats a e e e k classiques”. e a a a e et cet objet d´termine la transformation de l’´tat statistique du syst`me de p1 ` l’instant t1 ` p2 e e e a a a ` l’instant t2 par la formule ∀y ∈ E . intuitivement proche de la m´canique classique tout en refl´tant assez e e e bien les propri´t´s essentielles de la r´alit´ quantique. toute ´mission de lumi`re apparaˆ comme une cr´ation e e e ıt e de particules. Par cons´quent. la possibilit´ de division de cette surface est limit´e comme ne pouvant pas ˆtre plus fine e e e qu’un d´coupage en cellules d’aire h = 2π¯ chacune (cela se comporte comme tel d´coupage bien e h e que les fronti`res entre les cellules ne soient pas localisables en termes de la g´om´trie usuelle). il passe ` y ` l’instant t2 . x∈E On passe ainsi de la notion d’´tat classique ` la notion d’´tat statistique en rempla¸ant l’espace e a e c E par l’ensemble des lois de probabilit´ sur E. e e On consid`re qu’on ne connaˆ pas la valeur x ∈ E de l’´tat classique du syst`me mais que cet e ıt e e ´tat est al´atoire suivant une loi de probabilit´ p bien d´termin´e: ` chaque ´tat classique x est e e e e e a e associ´ sa probabilit´ p(x) d’ˆtre r´alis´. Alors. est un espace e de Hilbert de dimension n. si a e son ´tat est x ` l’instant t1 . x 44 . est une rotation l’espace de Hilbert. Une aire y ´tant ainsi e a e homog`ne ` une action. Nous oublierons totalement la forme g´om´trique de l’espace des e e phases.pourrait consid´rer une cr´ation de particules comme plongeant le premier espace en une souse e vari´t´ du suivant (d´finie par le point exact o` la nouvelle particule a ´t´ cr´´e). il faut partir d’un postulat physique que nous allons ´noncer e ee e maintenant. Par rapport ` cela.

Si elle demeurait constante. s’´nonce alors par la formule : e ∀y ∈ E . Il n’y a pas d’information plus pr´cise. elles le sont e e e a n´cessairement aussi ` l’instant t . si les probabilit´s sur un niveau d’´nergie sont ´gales ` l’instant t. a e e D’abord. u e e E(x) est l’´nergie de l’´tat x et E0 est la quantit´ qui sert ` la normalisation : e e e a p(x) = 1 ⇔ e− kT = x x E0 e− E(x) kT ⇔ E0 = −kT ln x e− E(x) kT . p1 (x) = 0 ⇒ x ∈ E d’une part. la plus e e a e e forte probabilit´ finale ne peut exc´der la plus forte probabilit´ initiale. p2 (x) = 0 ⇒ x ∈ E d’autre part. a e e Cet axiome se comprend comme reflet du th´or`me de Liouville (et il refl`te ´galement un e e e e ph´nom`ne correspondant de physique quantique) de la mani`re suivante: ` t1 . augmentant son entropie comme nous allons voir. nous verrons que E0 est l’´nergie libre du syst`me dans cet ´tat d’´quilibre thermodye e e e namique. et venant interagir avec notre syst`me S. alors cette fonction p serait une quantit´ qui e a e e e se conserve. chaque d´coupage en cellules a pour effet d’op´rer un parfait mixage ` l’int´rieur e e a e de chaque cellule. y) ≤ 1 ou bien cette mˆme formule mais comme une ´galit´. e En tout cas. Le cas d’une in´galit´ stricte provient donc e e du fait que certains ´tats initiaux dans E0 sont consid´r´s comme a priori impossibles et exclus de e ee E ` cause des conditions initiales de l’exp´rience qui ne leur permet pas de se r´aliser. En voici la d´monstration. mais en pratique. et de mˆme la plus faible e e e e ne peut pas diminuer. E ⊂ E0 avec : ∀x ∈ E0 . On e e e e 45 . en fonction du contexte pour la raison e e e suivante: fondamentalement. s’exprime par la formule e p(x) = e− E(x)−E0 kT o` k est la constante de Boltzmann servant de correspondance entre les ´nergies et les temp´ratures. montrons que la condition d’´quilibre thermique d’un syst`me isol´ est que p(x) doit e e e ne d´pendre que de l’´nergie E(x). Soit une particule du e e e milieu ambiant pouvant se trouver dans un ´tat e d’´nergie E1 avec la probabilit´ p1 ou dans e e e un ´tat e d’´nergie E2 avec la probabilit´ p2 . le nombre d’´tats ayant cette mˆme probabilit´ e e e diminuerait: il ne peut augmenter et s’il ne diminuait pas. on peut se restreindre e e a ` l’expression des parties qui interviennent effectivement: E ⊂ E0 . ` partir de notre axiome sous sa forme d’´galit´ et de l’hypoth`se e a e e e suivant laquelle l’´nergie est la seule quantit´ physique qui se conserve dans le cas d’un syst`me isol´. contrairement ` l’hypoth`se que l’´nergie (et donc aussi toute fonction de l’´nergie) a e e e est la seule quantit´ qui se conserve. e a Ensuite. Dans la suite on fixera la constante de Boltzmann ` k = 1 par d´finition de l’unit´ de temp´raa e e e ture. la loi est celle d’une ´galit´. la densit´ de probabilit´ dans chaque cellule ´tant e e e e donc “uniforme”. x∈E p(x. Loi de Boltzmann L’´tat d’´quilibre statistique vers lequel tend un syst`me en contact thermique avec un milieu e e e ambiant de temp´rature T . e e e e (Remarque: il existe des situations physiques comportant d’autres param`tres qui se conservent. En effet. en r´p´tant le mˆme raisonnement sur e e e les ´tats restants menant ` un ´tat final d’´quilibre p. e ce qui aboutit ` des lois d’´quilibre plus compliqu´es). 5. l’espace des phases e e e a est d´coup´ en cellules et l’´tat classique du syst`me se r´sume ` la cellule dans laquelle il se e e e e e a trouve. en se restreignant ` un niveau d’´nergie donn´.2. Puis on efface le d´coupage et on laisse le syst`me ´voluer suivant un mouvement e e e incompressible de l’espace des phases. jusqu’` l’instant t2 o` on fait un red´coupage en de nouvelles a u e cellules. Ainsi.L’axiome de base dont nous allons partir. En fait. la relation entre les probabilit´s pour des ´nergies diff´rentes vient concr`tement de e e e e la possibilit´ d’´changer cette ´nergie avec des parties du milieu ambiant.

´nergie libre e Nous allons calculer l’´nergie libre F du syst`me dans l’´tat thermodynamique p. suivant leur probabilit´ : e e U (p) = x p(x)E(x). en attendant. les combinaisons d’´tats (x. Soit ee e e e un syst`me S d’´tat statistique p sur un espace E ` l’instant t. p(x) p1 Donc le rapport des probabilit´s de deux ´tats ne d´pend que de la diff´rence d’´nergie entre ces e e e e e deux ´tats et est identique au rapport des probabilit´s de deux ´tats d’une particule du milieu e e e ambiant ayant la mˆme diff´rence d’´nergie. Tout autre ´tat p e e peut (tr`s th´oriquement !) se ramener ` cette situation par le travail “m´canique” suivant.e. d´finissons l’´nergie U d’un ´tat statistique p : c’est la moyenne des ´nergies des e e e e ´tats particuliers. A l’arriv´e. tandis qu’on ne connaˆ pas l’´tat particulier x du syst`me).3. son ´nergie libre s’est annul´e. quels que soient deux ´tats x et x de S tels e e e e que E(x ) − E(x) = E(e ) − E(e). autrement dit e e p2 p(x ) = . prenons cela comme une d´finition) : p(x) = e− T . Ensuite. sans ´change de chaleur avec l’ext´rieur) et e e 46 . l’hypoth`se sous-jacente est que le milieu ambiant est infiniment plus vaste et ee a e qu’il peut donc ´changer avec S une quantit´ de chaleur quelconque sans modifier ses propri´t´s e e ee g´n´rales). e e e e e e e e e Comme cette transformation est adiabatique (i. qui se d´duit de notre axiome et le g´n´ralise. les cons´quences sont les mˆmes). Autrement dit. et en particulier deux ´tats de mˆme e e e e ´nergie doivent avoir la mˆme probabilit´. sans tenir compte des e e e ´changes de chaleur avec le milieu ambiant ` temp´rature T . x∈E p(x. e On peut remarquer la propri´t´ suivante. (Au lieu d’une particule on peut prendre un grand e e e syst`me. On suppose que S ´volue vers un espace E d’´tats possibles ` l’instant e e a t > t. l’´tat p ´tant rest´ le mˆme. le d´coupage en cellules de l’espace des phases est transport´ par e e l’´volution en sorte qu’elle s’y exprime par p(x. Etant donn´ un ´tat e e e statistique p fix´ (suppos´ connu. et e e e e que le tout est isol´ de l’ext´rieur. La d´monstration de la loi de Boltzmann est maintenant e e e e termin´e. On le met en contact thermique e e a avec un syst`me ext´rieur S initialement non corr´l´ ` S et ` l’´quilibre de temp´rature T d´fini e e eea a e e e par la loi de Boltzmann. d’apr`s notre hypoth`se. pour calculer l’´nergie libre il faut choisir une r´f´rence pour laquelle on convient que e ee cette ´nergie est nulle. e) ayant la mˆme ´nergie e e e E(x) + E(e ) = E(x ) + E(e) doivent avoir la mˆme probabilit´ p(x)p2 = p(x )p1 .suppose que ces probabilit´s p1 et p2 ne d´pendent pas de l’´tat de S (on dit que la particule n’est e e e pas corr´l´e ` S. e e ıt e e modifions m´caniquement la fonction d’´nergie E(x) pour la remplacer par la fonction E d´finie e e e par E (x) = −T ln p(x). e ) et (x . y)e E(y)−E(x) T ≤1 ou bien la mˆme formule avec ´galit´. y) de e e e S tandis qu’il interagit avec S : ∀y ∈ E . Alors on a la formule suivante sur la loi d’´volution p(x. tandis que l’ensemble des ´tats possibles de S reste le mˆme avec la mˆme loi d’´nergie. e e e e 5. Comme on l’a suppos´ en ´quilibre thermique avec le milieu ambiant. Admettons pour le moment qu’elle est nulle dans le cas o` le syst`me est e u e en ´quilibre suivant la loi de Boltzmann avec E0 = 0 (et nous verrons pourquoi cette supposition e E(x) est bonne. y) = 1 si x = y et 0 sinon. le syst`me form´ e e e e e e de S et de la particule doit ˆtre en ´quilibre thermique. Energie. pour les mˆmes raisons. Donc. c’est-`e e e a dire l’´nergie qu’on peut en extraire par un travail m´canique (r´versible). e a e D’abord. e e a e On commence par isoler S thermiquement du milieu ambiant et interdire toute ´volution e thermique de S.

e. est que E(x) + T ln p(x) soit ind´pendant de x. et c’est l` le plus int´ressant. un p qui ne s’annule e a pas) donc une valeur autour de laquelle ses variations sont nulles au premier ordre. l’´nergie libre F (p) du syst`me au d´part est ´gale ` l’´nergie retir´e sous forme de e e e e e a e e travail lors de cette transformation : F (p) = U (p) − U (p) = x p(x)(E(x) + T ln p(x)). e e W = x p(x)δE(x). ce qu’on vient d’´tudier. c’est-`-dire en l’occurence un ´tat qui s’annule pour un certain x e a e (∃x. Alors la part thermique de la variation de l’´nergie libre devient e e 47 . p(x) = 0). l’effet de δp. On pourrait consid´rer que ce raisonnement n’est pas valable du fait qu’il faudrait travailler avec e l’´nergie r´ellement ´chang´e et non son esp´rance. En effet. e L` encore par d´finition.r´versible. co¨ e e ıncide avec le travail fourni de l’ext´rieur sur le syst`me. on remarque qu’elle ne prend pas sa valeur minimale en un ´tat statistique qui soit au bord (une valeur limite) de l’ensemble e des ´tats statistiques possibles. e e On remarque que cet unique ´tat d’´quilibre est pr´cis´ment celui o` l’´nergie libre prend sa e e e e u e valeur minimale. ln p(x) approche −∞ (moins l’infini). Donc F doit prendre sa valeur minimale pour une position de p int´rieure ` son domaine (i. e Ainsi. D’autre part. en prenant en guise d’´nergie potentielle l’´nergie libre F . e e e Ensuite. en s’approchant d’un tel bord. En effet (en cherchant des p tels que F soit la plus petite possible). la part d’effet direct pour p fix´ de δE(x) sur l’´nergie libre F (p). D´j`. e V´rifions maintenant que l’´nergie libre est effectivement la mesure du travail qu’on peut retirer e e r´versiblement d’un syst`me ` l’´quilibre statistique en l’amenant ` un ´tat pur x0 (d´fini comme e e a e a e e ´tat statistique par p(x0 ) = 1 et p(x) = 0 pour tout autre x) grˆce ` des ´changes thermiques avec e a a e le milieu ext´rieur de temp´rature T : le proc´d´ consite ` amener le syst`me d’un ´tat statistique ` e e e e a e e a l’autre en modifiant la loi d’´nergie E (et donc lui fournissant un travail) de fa¸on progressive pour e c le laisser ` chaque instant rejoindre (par contact avec le milieu ext´rieur) l’´quilibre thermique a e e des lois d’´nergie successives. mais nous allons confirmer plus loin ce r´sultat e e e e e e par d’autres moyens. dans laquelle les fonctions E(x) et p(x) se e e modifient infinit´simalement de δE(x) et δp(x) respectivement. donc δp(x) donne une contribution d’´nergie libre importante de signe contraire δp(x)(E(x) + T ln p(x)) e ce qui prouve que F augmente lorsqu’on s’approche du bord du domaine. On remarque alors que la condition pour que les variations de F au premier ordre ci-dessus soient nulles quel que soit δp (qui v´rifie toujours e e e x δp(x) = 0) pour une loi d’´nergie E fix´e. donc que p soit d´fini par la loi de Boltzmann de e e temp´rature T . voyons comment cette ´nergie libre se modifie lorsque a e e le syst`me subit une transformation infinit´simale. de a e e e mˆme que sur l’´nergie totale U (p). le fait que dans le cas de l’´quilibre de Boltzmann le E0 co¨ ea e ıncide avec l’´nergie libre ainsi d´finie est imm´diat (on a tout fait pour). l’´quilibre statistique co¨ e ıncide avec l’´quilibre de l’´tat p dans l’espace des ´tats statise e e tiques. qui apporte ` l’´nergie U une quantit´ de chaleur a e e Q= x E(x)δp(x) modifie F d’une ampleur de δp(x)(E(x) + T ln p(x)) x puisque p(x)δ(ln p(x)) = x x δp(x) = δ( x p(x)) = 0.

V´rifions maintenant que l’entropie d’un syst`me isol´ ne peut qu’augmenter au cours du e e e temps.y p1 (x)p2 (y) ln(p1 (x)) + x. Donc F (S) diminue. l’entropie du tout S = S(p) est inf´rieure ` la somme des e ee e a entropies S1 et S2 des ´tats p1 (x) = y p(x. et l’entropie du tout S(S +S ) augmente. y). La formule de l’entropie S d’un ´tat statistique p se d´duit de celle de l’´nergie libre que nous e e e avons ´tablie. plus le travail se divise en contributions e e ind´pendantes. e a Maintenant que la croissance de l’entropie est ´tablie. ee e e e Il reste la question : au cours d’une transformation quelconque d’un syst`me. Entropie. l’´nergie libre e e F diminue-t-elle ? Comme l’´nergie U se conserve pour un syst`me isol´. y) et p2 (y) = x p(x. ` partir de notre axiome. suivant la formule F = U − T S : e S(p) = − x p(x) ln p(x) (` multiplier par la constante de Boltzmann que nous avons ici fix´e ` 1). la moyenne pond´r´e par p(x. y) = p1 (x)p2 (y). L’entropie d’un syst`me a e a e form´ de deux sous-syst`mes non corr´l´s (p(x. en attribuant e a ` ces deux sous-syst`mes les ´nergies respectives E1 (x) = −T ln p1 (x) et E2 (y) = −T ln p2 (y). il poss`de la plus grande entropie: e e e e e F (p ) < F (p) ⇒ S(p) < S(p ) = S1 + S2 .d’autant plus n´gligeable. e e on constate que U (p) = U (p ) o` p est l’´tat non corr´l´ correspondant p (x.y p1 (x)p2 (y) ln(p1 (x)p2 (y)) = x. En effet. 48 . F (S + S ) est ´gal ` F (S) + F (S ) au e e e ee e a d´part mais lui est sup´rieur ` la fin. y)p1 (x) ln p1 (x) ≥ p2 (y) ln p2 (y) x parce que l’application qui ` u associe u ln u ´tant convexe. on en d´duit la d´croissance de l’´nergie e e e e libre d’un syst`me S lors d’un ´change thermique avec un milieu S de temp´rature T ainsi : e e e L’´nergie totale U (S +S ) se conserve. y)p1 (x) ln p1 (x) −S2 = y p2 (y) ln p2 (y) Or.y p1 (x)p2 (y) ln(p2 (y)) = −(S1 + S2 ). pour tout y on a p(x. Dans le cas de syst`mes corr´l´s.4. e e a a e e F (S ) ne peut qu’augmenter. y) des a e ee images des p1 (x) est sup´rieure ` l’image de leur moyenne p2 (y).y p(x. a On a pour une ´volution de p1 ` p2 d’un syst`me isol´ e a e e −S1 = x p1 (x) ln p1 (x) = x. Comme S est initialement ` l’´quilibre de temp´rature T . e 5. Les syst`mes S et S ´tant initialement d´corr´l´s. plus l’´volution est progressive. u e ee mais p ´tant l’´tat d’´quilibre statistique de cette ´nergie. la contribution de chaque instant ´tant al´atoire d’apr`s la probabilit´ p d’´quilibre e e e e e e de l’instant consid´r´ sans corr´lation avec les contributions des instants pr´c´dents). et l’´nergie m´canique fournie se rapproche d’autant plus du montant e e e de cette variation que cette ´volution est progressive (la somme des travaux se rapprochant de e son esp´rance du fait que. la question se ram`ne ` e e e e a celle de la diff´rence entre les deux. donc F (S +S ) e diminue. y) = p1 (x)p2 (y)) est la somme des entropies S1 = e e ee S(p1 ) et S2 = S(p2 ) de ces sous-syst`mes : e −S(p) = x.

On esp`re en trouver un jour enfin le fond. ou e e e e e qu’elles n’y jouent pas un rˆle fondamental (bien au contraire !) mais que sa pleine r´duction ` une o e a base math´matique serait extraordinairement ardue et g´n´ralement incompl`te. En un mot. cette expression ´tant ` prendre avec beaucoup de guillemets. clairs). e Les myst`res de U sont le travail exclusif des physiciens math´maticiens. e e e Pr´cisions que ce n’est pas l` un lien exact et rigoureux. une fois ´nonc´es ses formules de base. puisque le monde quantique n’est pas r´ductible au monde classique. c’est e e e uniquement sur cette th´orie que se portent les recherches en physique des particules. ne laisse que des myst`res de nature philosophique e e e (ou m´taphysique) sans possibilit´ d’´preuve exp´rimentale. e a On peut consid´rer la physique quantique comme une conjonction de deux th´ories aux d´vee e e loppements plus ou moins s´par´s.6. Introduction ` la physique quantique a 6. La th´orie R e e par contre. Roger Penrose rˆve d’unifier U et R comme ´tant deux approximations e e d’une th´orie plus vaste. e Cette th´orie est enti`rement d´terministe. e e e Ses myst`res ne sont pas “explicables” par les concepts de m´canique classique ordinaires. repousse ses fondements extrˆmement loin. e La th´orie U e C’est celle du monde quantique en lui-mˆme. ni mˆme e e e par les principes de r´alit´ ordinaires.1. bien que e a e l’id´e soit l`. e e e e tandis qu’elles interagissent en permanence au niveau de la physique appliqu´e. ce n’est ici qu’une introduction !). car elles sont sous-jacentes ` tout le formalisme de la th´orie. Il faut pr´ciser que. Son temps e e e e e est r´versible. et qui n’int´ressent g´n´ralement plus e e e e e e e les physiciens depuis longtemps. de graves probl`mes. Elles sont toutes deux ´tranges et paradoxales et en manque de fondee e e ments clairs. e e Non qu’elle soit d´pourvue de math´matiques. du moins suivant les e e connaissances actuelles. ´ludant ses nombreux probl`mes ainsi e e e que d’autres notions fondamentales de la physique quantique. mais ce qui sera d´crit ici e e e n’est pas vraiment d´crit. Le monde de la e e ee th´orie U est un monde platonicien. on peut se rep´rer ` l’aide du plafond (la m´canique classique qui en est une approximation e a e et dont les objets sont. Certains de ses aspects lui sont sp´cifiques. car cette description sera vague. suivant la divergence de ses deux axiomes fondateurs come e mun´ment not´s U et R. La formalisation e e e e d´taill´e de la th´orie pose. e e notamment avec la th´orie des supercordes. On pourrait exprimer cette situation en e e e e disant que la th´orie ne repose pas sur un fondement bien solide contenu dans quelques axiomes e clairs et qui expliquerait ou impliquerait tout en d´tail. mˆme si en g´n´ral on ne a e e e e les trouve pas facilement explicit´es ainsi dans les cours sur le sujet. tout en ´tant e e e fructueuse. Ici encore. en dehors des propri´t´s de quelques particules exotiques (exception sans rapport e ee intrins`que avec le sens de variation de l’entropie). et ne peut pas en ˆtre un. Mais faute de fondement sur lequel se e reposer. en paradoxes aussi. en effet. de mˆme que dans une th´orie probabiliste les e e e e e valeurs calcul´es des probabilit´s sont consid´r´es comme parfaitement certaines. eux. e 49 . elle sera non-math´matique (normal. et sont d’une bien trop e e grande difficult´ technique pour que des non-sp´cialistes puissent seulement en avoir une id´e. de ses ondes et de ses particules qui sont une e mˆme chose. Non que le e a e monde quantique soit diff´rent de ce qui sera d´crit ici [partie en projet]. Rare en son genre. ou que les math´matiques ne puissent y p´n´trer. compl´mentaires de ceux-ci (dont e les th´ories de jauge qui d´crivent “les propri´t´s m´caniques particuli`res” des diverses sortes de e e ee e e particules. et la notion de r´alit´ factuelle lui est ´trang`re. lesquelles sont tr`s lointaines car cette exploration math´matique. et d’autres sont e e e reli´s ` la physique classique qui leur donne son langage et ses concepts. les omettre peut simplifier beaucoup la e e ee e pr´sentation). et dont on n’a actuellement pas fini de sonder les profondeurs math´matiques (sauf e e approximations). les id´es qui seront ´nonc´es ne sont pas vraiment nouvelles par rapport ` ce qui e e e a est connu. Introduction: une th´orie en deux parties e La physique quantique est riche en th´ories math´matiques int´ressantes. mais pas du tout pour les mˆmes raisons. e Elle peut se “construire” de fa¸on plus ou moins magique ` partir de la physique classique c a suivant un proc´d´ nomm´ “quantification”. ces deux th´ories sont tr`s ´loign´es l’une de l’autre au niveau fondamental. les pires probl`mes de e a e divergence ´tant d´pendants de ces propri´t´s particuli`res.

De plus. De ıt´ e e la mani`re la plus remarquablement subtile (et facilement d´montrable). c’est cette th´orie R elle-mˆme qui est la m´canique statistique quantique e e e e que nous avons ´voqu´. est suffisante dans beaucoup de situations. ` la fonction probabilit´ correspond la fonction amplitude qui n’est plus a e une probabilit´. son agitation e thermique engendre (conform´ment ` U ) un ph´nom`ne statistique de perte de contrˆle de certains e a e e o param`tres du syst`me nomm´ d´coh´rence. e Mais. a e e D’un autre cˆt´. quitte ` amener plus de questions que de r´ponses. son e a e e e hasard. et comme si seuls les humains e e e (ou plus g´n´ralement les organismes vivants) avaient le pouvoir de la faire intervenir. e ea e Dans cette analogie. Mais nous n’allons pas proc´der ainsi car notre but ne sera pas de r´soudre des probl`mes e e e standardis´s mais de donner un panorama plus large et qualitatif de la situation. on peut interpr´ter ces appareils de mesure comme n’ayant pas d´clench´ e e e R mais comme ´tant de simples objets quantiques d´termin´s par U . tel qu’il ne reste plus aucune chance pour que la e e e e e diff´rence entre l’hypoth`se de la non-intervention de R ou de son intervention d’une mani`re e e e correspondant pr´cis´ment au type d’observation effectu´e. e aucune r`gle ne semble pouvoir indiquer quand ni comment elle intervient. son rˆle de l’observateur. ses mesures. ce mod`le approch´ ´tant enti`rement r´ductible e e e e ee e e a ` un syst`me axiomatique sans trop de difficult´. permettant de calculer les probabilit´s exp´rimentales en fonction pr´cise des r´sultats de e e e e e la th´orie U .La restriction de l’´tude de la physique quantique ` des ph´nom`nes non-relativistes (aux e a e e vitesses faibles devant celle de la lumi`re) est le bon moyen couramment employ´ pour limiter dans e e une premi`re ´tape la profondeur de la th´orie. (On prend e l’espace de configuration au lieu de l’espace des phases: la diff´rence ne consiste qu’en le fait que e l’espace de phase y ajoute la donn´e des impulsions. Elle est issue de nulle part et elle est introuvable (sans qu’il y ait pour autant la moindre ambigu¨ e pratique sur les r´sultats de ses pr´dictions). ne se pose finalement pas : elle e e e intervient comme si elle n’intervenait pas. ce qui d’ici e e l` r´soud le probl`me de son intervention comme n’ayant pas eu lieu. Cette sorte d’intervention virtuelle donne ainsi en pratique le droit o d’interpr´ter R comme ayant eu lieu. Le rˆle de la e e o temp´rature est jou´ par la constante de Planck et l’action correspond finalement ` une quantit´ e e a e E iA − kT h o` A est l’action (normalement l’action ¯ devient e u imaginaire d’´nergie: la loi de Boltzmann e e est not´e S mais nous avons d´j` trop us´ la lettre S). En fait. elle constitue une rupture e e e e par rapport ` l’´volution gouvern´e par U . en montrant au e maximum le sens et l’´l´gance des choses. d`s qu’un syst`me un tant soit peu complexe et thermiquement agit´ comme oe e e e un organisme vivant ou mˆme un simple appareil de mesure entre dans le coup. a e e La th´orie R e C’est celle qui traite du probl`me du lien ` l’exp´rience avec sa r´alit´ factuelle. appel´e “m´canique quantique de base” ou “premi`re e e e quantification”. puisse encore finalement jouer quelque e e e rˆle observable que ce soit. Cette premi`re approche axiomatique claire e e e et maˆ ıtrisable de la physique quantique. Ses fondements math´matiques sont parfaitement d´finis et sans o e e myst`re. et qu’elle ne sera pas la probabilit´ qui interviendra concr`tement. Son ´criture en fonction de U n’est affect´e que de fa¸on superficielle par e e e e c la grande reformulation que traverse U quand il passe de la m´canique quantique de base ` son e a expression relativiste. que sa somme n’est e e plus contrainte ` valoir 1. li´e au rapport ` un temps qui n’existe plus et e e a qui n’a en fait de toute mani`re pas d’influence sur le reste de l’´quilibre statistique). elle est r´interpr´table e e e e comme fondue ` l’int´rieur de la th´orie U jusqu’au dernier moment : tant que ce sont les appareils a e e de mesure qui observent. n’ayant (jusqu’` e e a pr´sent du moins) aucune influence mesurable sur les ph´nom`nes. puisqu’elle peut prendre des valeurs n´gatives voire complexes. mais appliqu´ au niveau de la repr´sentation th´orique ` l’espace de configuration des e e e a sc´narios non soumis au principe de moindre action dans l’espace pseudo-euclidien. ee a e Voici donc le proc´d´ de quantification qui passe de la m´canique classique ` la m´canique e e e a e quantique: il est semblable ` la construction de l’´quilibre statistique comme fond´ sur la m´canique a e e e classique. Mais elle intervient e d’une telle mani`re que la question des param`tres particuliers de son intervention. que U est par nature incapable de produire lui-mˆme a e e e (quelle que soit la complexit´ de l’environnement qu’on pourrait prendre en compte). alors qu’au niveau microscopique (fondamental) l’intervention de R passe pour inexis50 . Le probl`me est qu’elle arrive sur la th´orie U sans y ˆtre invit´e.

fixe ` partir de rien l’orientation du temps thermodynamique (celui de la croissance a de l’entropie. e e e 6. si on admet e a e quelques principes physiques difficilement contestables. la vitesse de la lumi`re n’ayant rien ` faire avec tout cela : le ph´nom`ne est en principe e a e e ind´pendant du type de particule utilis´ et de leurs vitesses. en sorte e e de ne pas confondre les myst`res de la r´alit´ avec les interm´diaires de calcul.tente ou virtuelle. de supposer que ce ph´nom`ne de corr´lation e e e s’expliquerait par le fait que la dur´e du voyage d’un photon est pour lui-mˆme toujours nulle. o on pourrait supposer qu’ils se r´alisent tous conform´ment ` U dans des univers parall`les qui ` e e a e a cause de la d´coh´rence perdent toute relation entre eux). je conseille de s’efforcer de mieux comprendre ce que dit la relativit´ restreinte ` ce sujet : la mesure des dur´es est une chose.) e e Quelles particules utiliser ? L’exp´rience a ´t´ faite avec des photons corr´l´s. qui permette de situer effectivement dans l’espace-temps quelque influence e que ce soit plus rapide que c. mais en plus. Or. entre lesquelles on ignorerait quelle hypoth`se d’intervention serait la vraie. comme si cette influence ´tait r´elle. Et il semble que sa signification pr´cise n’ait pas ´t´ e e ee toujours vulgaris´e tr`s parfaitement : on trouve souvent l’affirmation d’une influence instantan´e e e e d’une particule sur l’autre. une combinaison (chat mort)+(chat vivant)). e e Et en fait. e Et pour mieux cerner sa signification. qu’aucune des hypoth`se “raisonnables” de e loi g´n´rale pouvant d´terminer les circonstances particuli`res de son intervention dans l’intervalle e e e e des possibilit´s. dans ce ph´nom`ne quantique il n’y a rien. qui entraˆ l’impossibilit´ d’une relation de cause ` effet propag´e e e ıne e a e plus vite que c. au-del` de e e a la simple dualit´ onde/particule ou du principe d’incertitude. e e A ceux qui font cette erreur. Le paradoxe EPR C’est l’un des paradoxes les plus ´tranges de la physique quantique (th´orie R). cet intervalle de possibilit´s ´tant finalement e e e r´duit ` l’ensemble vide d’apr`s ces principes sans qu’on puisse pour autant la prendre au pi`ge de e a e e ses contradictions. mais l’ordre de causalit´ e a e e temporel en est une tout autre. Ces pr´dictions e e e e e auraient ´t´ v´rif´es exp´rimentalement d’apr`s les nouvelles de ces derni`res ann´es. (Mais je ne ee e e e e e e m’int´resse pas pr´cis´ment aux d´tails exp´rimentaux du probl`me. Cette th´orie R ne fait pas que laisser pare fois un intervalle de temps et de circonstances possibles pour son intervention. l’ordre temporel n’a lieu que dans un seul e e 51 . le raisonnement montre qu’aucun e e u e sc´nario particulier d’intervention de R ne peut ˆtre consid´r´ comme “le vrai” sans rompre arbie e ee trairement une sym´trie du probl`me qu’aucune exp´rience ne vient mettre en doute par ailleurs. sauf l’impensable interpr´tation en univers parall`les (suivant laquelle R n’a jamais lieu et e e le chat de Schr¨dinger demeure dans la superposition mort+vivant). bien que l’´cart en mesure de temps soit nul. ne peut finalement tenir la route. (A la rigueur on n’en a pas de preuve. ce e e qui pr´serverait un lien de causalit´ r´ciproque de ces photons sur leur origine commune.2. nous nous concentrerons ici sur l’´nonc´ exact des pr´e e e dictions exp´rimentales de la th´orie quantique dans les purs termes des cons´quences observables e e e de R oubliant tous ses liens avec U par lesquels ces r´sultats se d´montrent habituellement. ni th´oriquement e e e ni exp´rimentalement. Elle va jusqu’` d´montrer. en d´posant l` son e e a ´chec qu’il n’a pas voulu avouer ailleurs. une fois e pour toutes. qui. Entre deux ´v`nements distincts reli´s par une droite de direction e e e de lumi`re. Voil` ce que nous montrera le paradoxe EPR : non seulement on ne sait pas a comment s’effectue l’intervention de R. ´quivalent au choix de l’ordre de causalit´ temporel) et qui fait se r´aliser un seul e e e des avenirs possibles suivant les probabilit´s donn´es par les calculs lorsque ce que la th´orie U e e e d´termine est en fait une combinaison d’avenirs ne se ressemblant pas du point de vue de ce qui e est observ´ subjectivement ` l’observateur (par exemple dans la fameuse exp´rience du chat de e a e Schr¨dinger. toujours en coh´rence avec o e toutes les interpr´tations g´ocentriformes particuli`res. D’o` l’erreur classique de certaines personnes e ee ee u n’ayant pas de connaissances solides en physique. exprime assez nettement le probl`me e e que cette physique pose au r´alisme classique. e e e Aucun. D’o` pr´texte pour dire que la e e u e th´orie de la relativit´ restreinte. Seul le r´alisme classique peut nous y conduire. son existence r´elle globale est quasiment incontestable : c’est elle qui. alors que les pr´dictions exp´rimentales de e e la th´orie demeurent parfaitement coh´rentes et sans ambig¨it´. et le but de cette page est e e e e e e uniquement d’en pr´senter ses aspects th´oriques. serait fausse. Ceci est e e e faux. la situation est encore pire que cela.

cela ne change rien : toute exp´rience ae e e e (et les paradoxes qui en d´coulent) avec le spin d’un ´lectron est exactement traduisible en une e e exp´rience avec la polarisation d’un photon et inversement. ee e e Nous allons donc maintenant entrer dans quelques manifestations de la th´orie R. et la propri´t´ de spin 2 signifie que “classiquement”. tandis que les points de son cˆne de lumi`re future ou de l’hyperplan t = 0 en sont bien e o e loin. que leur vitesse est faible devant celle de la lumi`re. e e e e Cependant nous d´crirons cette exp´rience dans le cas d’´lectrons. Mais une telle diversit´ d’´tats e e e e n’existe pas. e Or. sauf que dans ce cas elle devient e e e beaucoup plus difficile ` r´aliser techniquement. l’information sur ee l’´tat de spin de l’´lectron peut ˆtre classiquement contenue dans deux bits d’information.sens. ` partir de 3 ce serait plus compliqu´). Donc probablement le e seul moyen de faire le vide de rayonnement serait de r´frig´rer les parois pr`s du z´ro absolu. qui ferait perdre en e la dispersant dans la nature cette information sur le spin qu’on veut ´tudier. du point de vue de la physique classique. (On peut voir avec la t´l´portation quantique qu’en un certain sens. plus que dans la description a e de la polarisation du photon.) e 52 . e Or. C’est une particule de spin 1 . qu’on pourrait d’ailleurs appeler “l’agitation thermique du champ ´lectromagn´tique”. c’est donc ¯ lui servira d’unit´ de mesure de la norme de σ e e a h e 1 en physique quantique. “` ´quivalence math´matique pr`s”. e e pouvant donner un seul bit d’information : ce spin vaut un tel vecteur de norme 1 . c’est le cas de l’´lectron. ` savoir 2 (il en faut au moins 2 pour qu’il se passe quelque e a chose. Voici pourquoi : la r´ussite de l’exp´rience suppose a e e e que la particule (ou plus pr´cis´ment le param`tre qui nous int´resse dans la particule. traduit la notion de moment cin´tique qui se conserve. ici le spin e e e e de l’´lectron) n’a subi aucune interaction thermique avec son environnement. soit un e e e ´tat parmi quatre possibles. en prenant une infinit´ de valeurs diff´rentes au passage. Ce qui peut influencer un ´v`nement se trouve dans son cˆne de lum`re pass´e (int´rieur et e e o e e e fronti`re). et il e e e e a d’autant plus le temps de perturber un des ´lectrons avant qu’ils ne parviennent ` la distance e a voulue l’un de l’autre. 3) Par la mˆme occasion. e e e e ee ou si on pr´f`re celle de ses manifestations exp´rimentales. or il est beaucoup plus difficile de vider l’espace de ses e photons que de le vider de ses charges : le rayonnement thermique. il n’y a que deux ´tats possibles du spin d’un ´lectron . Que repr´sente son e 2 spin ? Dans le langage de la physique classique. dans la correspondance entre e a physique classique et physique quantique. le r´cit de cette exp´rience permettra de se familiariser avec les e e e propri´t´s du spin de l’´lectron et la notion de doublet d’´lectrons qu’on rencontre en chimie. est en g´n´ral relativement important. La mˆme exp´rience peut se concevoir avec des ´lectrons. Cette ´quivalence vient du fait que le e e nombre d’´tats quantiques possibles du spin de chaque particule (ce qui d´signe la dimension de e e son espace de Hilbert) est le mˆme. cette direction serait une propri´t´ du spin de l’´lectron plus riche que cette seule ee e alternative ` deux possibilit´s : ce serait un param`tre port´ par l’´lectron pouvant varier cona e e e e tinument. ||σ|| = 1 . parce qu’il interagit avec les photons (le champ ´l´ctromagn´tique) tandis que le photon ee e n’interagit qu’avec des charges ´lectriques. mais il n’a pas de direction. Il est orient´ dans un sens. en choisissant conventionnellement une orientation de l’espace. Ces propri´t´s g´om´triques sont ee e ee e e remarquables (son rapport ` U s’exprime par la th´orie des spineurs). N’oublions e pas qu’il n’existe aucune s´paration qu’on puisse faire entre cette th´orie et la m´canique statise e e tique. c’est son moment cin´tique de rotation sur luie mˆme. Comme un moment e e cin´tique est homog`ne ` une action. on peut repr´senter ce moment cin´tique par un vecteur σ. C’est bien l` l’objet quantique qui se conserve dans U et qui. ee 2 Mais. S’il avait e e une direction. un r´f´rentiel galil´en ´tant fix´ une fois pour toutes. et uniquement lui. a e 2) Entre ces deux cas. l’´lectron pr´sente un risque d’interaction avec l’environnement beaucoup plus fort que le e e photon. Les vecteurs que nous emploierons seront uniquement des vecteurs de l’espace euclidien ` 3 a dimensions. ou bien son 2 oppos´. pour des motifs th´oriques : e e e e 1) Dans le fond. du point de vue quantique. qui manifeste dans la e g´om´trie de l’espace physique la forme des sym´tries internes du probl`me quantique consid´r´. Et pas un autre vecteur. ee e e e Mesure du spin d’un ´lectron e e Prenons d’abord le cas d’un seul ´lectron.

sans s’occuper e e des autres composantes). si on lui pose ` nouveau e a 2 exactement la mˆme question (suivant la mˆme direction u). si on lui pose ensuite la question de sa direction par rapport ` un autre e a 1 vecteur unitaire v. en les distinguant l’un de l’autre suivant leur spin e bien entendu). ` cause d’un ph´nom`ne a e e 53 . n’est finalement rien d’autre qu’un processus produisant le spin pσ + (1 − p)σ . si l’exp´rimentateur d´cide alors de mesurer e e e le spin suivant la direction de u. on pourrait penser que cette r´pulsion entre les ´lectrons les empˆche de se rencontrer. si on mesure le spin d’un ´lectron suivant la e e paire {σ. Il e e choisit une droite. a e e e e e Na¨ ıvement. celui-ci donnera sa r´ponse. Mais alors. . une fois obtenu le r´sultat d’une mesure. 2) Quelle qu’ait pu ˆtre la situation auparavant. car le principe d’exclusion a e e de Pauli les empˆche d’ˆtre ` la fois dans le mˆme ´tat spatial et le mˆme ´tat de spin (ou pour le e e a e e e e voir autrement. Ce n’est pas vrai. −σ}. dans quel sens tournes-tu ?” (Ou pour le dire plus rigoureusement. il suffit de les contraindre ` se mettre dans le mˆme ´tat spatial. n´cessairement. il implique que deux ´lectrons de mˆme ´tat spatial sont de spin oppos´s). pour observer ce sens. au sens de e ee e e e la r`gle suivante: quel que soit le vecteur unitaire u. . C’est un ensemble de deux ´lectrons qui sont dans un mˆme e e e ´tat spatial. est libre d’en d´cider la direction comme il veut. un ´tat statistique est consid´r´ comme e e ee a e ee 1 e enti`rement connu). sans qu’il ait une direction ? C’est e l’exp´rimentateur qui. ` cause de la r´pulsion ´lectrostatique qui empˆche cette identit´ d’ˆtre parfaite. mais “dans des ´tats de spin oppos´s” au sens de ce que nous allons d´crire. e e e e mais sa nouvelle r´ponse d´pendra uniquement de la derni`re qu’il avait donn´e. ` ce titre.Alors. c’est-`-dire une e e e e a disposition de la fonction d’onde dans l’espace physique. Par contre. Alors. comment cette r´ponse d´pend-elle 2 de la direction choisie ? Voici ce que dit la th´orie dans le cas d’un ´lectron dans un ´tat spatial pr´cis. Son exp´rience consiste ` demander ` l’´lectron : “Autour e e a a e de cette droite. suivant la mˆme e e e e e loi de probabilit´. e Pr´paration de la paire corr´l´e e ee On part d’un doublet d’´lectrons. e e On remarque que cet ´nonc´ est coh´rent avec la possibilit´ de d´cider au hasard du processus e e e e e qui produira le spin: le processus qui consiste ` d´cider suivant une probabilit´ p de faire appel ` un a e e a processus produisant le spin σ et suivant la probabilit´ 1 − p de faire appel ` un autre processus qui e a produit le spin σ . (En fait. −σ} de norme 1 . la probabilit´ d’obtenir u sera ´gale ` 1 + σ · u. il lui demande non le vecteur moment cin´tique mais sa composante suivant la direction donn´e. e e e l’une des deux valeurs ± 1 de cette composante). e Enfin. e e e e le principe d’exclusion de Pauli et le principe d’incertitude de heisenberg ne se pas des principes mais des cons´quences d’autres lois). qui englobe l’information en positions et impulsions de cet ´lectron (ceci afin d’´viter toute question de corr´lation entre l’´tat spatial et e e e e l’´tat de spin): e 1) Pour tout ´lectron d’´tat spatial donn´ issu d’un processus dont les conditions initiales e e e seraient enti`rement connues en un certain sens (` savoir qu’il n’existe aucune influence ext´rieure e a e qui aurait pu ˆtre analys´e et qui ne l’a pas ´t´. comment se manifeste le sens du spin de l’´lectron. sans l’ombre d’une h´sitation ni quelque autre e e humeur que ce soit. Pour e e e e l’obtenir. apr`s la mesure le spin de l’´lectron au sens du 1) sera ´gal au r´sultat trouv´ par la e e e e e mesure (cette mesure d´truit donc enti`rement toute autre information qui a pu exister auparavant e e dans ce spin). par exemple 1 u. de e e 2 mani`re sym´trique : il ne propose pas un vecteur puis son oppos´. Si apr`s cela on lui redemande sa direction suivant u. il aura oubli´ sa premi`re r´ponse. Ainsi. il r´pondra par une nouvelle valeur de σ = ± 2 v suivant la probabilit´ ´gale ` e ee a 1 ( 2 + σ · u). qui sera l’un des deux vecteurs σ et −σ (en fait. e e e et rend ainsi superflu le principe d’exclusion de Pauli. ou ce qui revient au mˆme une paire de vecteurs oppos´s {σ. il donnera n´cessairement la mˆme e e e e 1 r´ponse 2 u. il existe un vecteur σ de norme ||σ|| ≤ 2 qui r´sume l’influence mesurable de e ces conditions sur le spin de l’´lectron consid´r´ s´par´ment du contexte de l’exp´rience. mais les deux en mˆme temps e e e e pour n’en privil´gier aucun a priori. cela n’est pas parfaitement exact : ils sont bien dans des ´tats de spin oppos´s mais e e leurs ´tats spatiaux ne sont pas identiques mais seulement assez proches (c’est-`-dire que les probe a abilit´s de r´sultats de toute mesure de cet ´tat spatial sur les deux ´lectrons sont des probabilit´s e e e e e voisines l’une de l’autre et de faible corr´lation. Ce vecteur σ est e e a 2 2 alors appel´ le spin de l’´lectron produit par ce processus.

la d´composition e e e e e e en ´tats distincts suivant les niveaux d’´nergie donne d’une part des doublets (o` les spins sont e e u exactement oppos´s mˆme si les ´tats spatiaux peuvent ˆtre tr`s diff´rents). e e en m´canique quantique la densit´ de probabilit´ du syst`me dans l’espace de configuration d’un e e e e doublet ne tend pas vers 0 lorsque la distance r entre eux tend vers 0. ¸a y est. Maina e e tenant. alors la connaissance du premier r´sultat e a e 1 permet d’estimer la probabilit´ d’obtenir 2 v pour le deuxi`me ` la hauteur de ( 1 − σ · v). un ´lectron dans chaque boˆ (les boˆ e ıte ıtes sont elles aussi tr`s th´oriques. aucune mesure ou autre influence ext´rieure ne vienne e interagir avec leur spin. e Voil` donc nos deux ´lectrons du doublet subitement libres de s’´loigner l’un de l’autre. En fait. Dans le cas d’une paire d’´lectrons seuls mobiles dans un environe e e nement fixe. ici ce n’est pas pratique. cr´ant un doublet. il faut s´parer les ´lectrons. il suffit donc de laisser e u le syst`me perdre son ´nergie pour obtenir un doublet. Le plus bas niveau d’´nergie des e u e e doublets est plus bas que celui des paires d’´lectrons o` les spins s’ajoutent. bien sˆr on parle ici de th´orie et non de e u e la m´thode la plus pratique pour tester EPR). Notons σ le r´sultat de la mesure. le puits de potentiel dˆ au noyau a cet effet de e u confiner les ´lectrons dans un mˆme ´tat spatial. e e mais imaginons qu’on arrive ` virer le noyau sans influer sur le spin (en le bombardant par un a neutron de haute ´nergie par exemple. e e e e Maintenant qu’on a le doublet. on peut par exemple disposer une e boˆ de chaque cˆt´. Alors ce e e e r´sultat fait connaˆ l’autre ´lectron comme ´tant de spin oppos´: si l’autre observateur mesure e ıtre e e e le spin de son ´lectron par rapport ` un autre vecteur v. autrement dit son spin est e e e 2 nul avant la mesure au sens que nous avons ´nonc´. Pour des distances assez faibles. il domine donc sur la r´pulsion ´lectrostatique. ıtes a jusqu’` ce que cette condition voulue se r´alise. e Quels sont alors les probabilit´s de r´sultats ? La th´orie ´nonce ` ce sujet les pr´dictions e e e e a e suivantes : Proposition 1. on recommence (avec e ıte. Le premier qui mesure le spin. soit une ´nergie de e e e 2 h ¯ l’ordre de mr2 . Pour cela. on veut qu’ils se retrouvent dans deux boˆ ıtes distinctes qu’on ´loignera ensuite l’une de e l’autre. un autre doublet. mesurer le spin de e e e son ´lectron dans la direction qu’il veut. c e 2 Mesure des spins d’une paire EPR d’´lectrons e Nous avons maintenant deux exp´rimentateurs avec chacun son ´lectron dans une boˆ les e e ıte. deux ´lectrons ´tant issus d’un mˆme doublet. et d’autre part des e e e e e e ´tats o` les spins des deux ´lectrons s’ajoutent en un certain sens. Il faut les trier d’apr`s leur position spatiale. il n’y aurait plus d’effet e e EPR. obtient indiff´remment l’un ou l’autre r´sultat suivant la probabilit´ 1 chacun. quand il veut. l’´nergie de r´pulsion e e e e 1 e e ´lectrostatique est proportionnelle ` r tandis que l’´nergie de r´pulsion due au principe d’exclusion e a h ¯ se lit sur le principe d’incertitude de Heisenberg avec r ≈ ∆x : l’impulsion p est de l’ordre de ∆x p et l’´nergie cin´tique d’une particule d’impulsion p et de masse m vaut 2m . Pour que le principe d’exclusion de Pauli puisse se mettre en œuvre. oui ou non. ce n’est pas exactement vrai ` e e a une distance encore plus petite ` cause du moment magn´tique de l’´lectron qui vient perturber ce a e e ph´nom`ne par l’interaction entre les spins des deux ´lectrons. quelle que soit la direction choisie. e e a 2 54 . mais c’est une bonne approximation. le seul moyen est de r´duire leur ´talement spatial ∆x. il faut le rendre dominant sur la r´pulsion ´lectrostatique. a e Maintenant. Bon. En effet. exactement un ´lectron dans chaque boˆ Sinon. Il faut que jusqu’au dernier moment. attendre que les ´lectrons puissent venir dedans. notre paire EPR est prˆte. pour supposer e e qu’elles puissent contenir et transporter chacune un ´lectron sans perturber son spin). e e e En particulier dans le cas de l’atome d’h´lium. Et chacun peut. ou bien en rouvrant les boˆ pour laisser une seconde chance ` notre doublet). Comment e peut-on faire ? Il ne faut surtout pas trier les ´lectrons d’apr`s leur spin. fermer les boˆ et compter ıte oe e ıtes s’il y a bien. ou encore en appliquant un fort champ ´lectrique qui envoie e e les ´lectrons dans un sens et le noyau dans l’autre sens. e e En pratique on n’a pas besoin que le principe d’exclusion devienne infiniment plus grand que la r´pulsion ´lectrostatique : si les ´lectrons sont confin´s dans un espace r´duit.ondulatoire quantique qui se manifeste par ce qu’on appelle l’effet tunnel : alors qu’il faudrait classiquement une ´nergie infinie pour que des charges ponctuelles de mˆme signe se rencontrent.

si les deux mesures sont ind´pendantes (s´par´es par un intervalle e e e de type espace). champ ´lectromagn´tique ou autre). toute identit´ e alg´brique entre probabilit´s valable dans le cas des corr´lations classiques est ´galement valable e e e e dans le cas de corr´lations quantiques. e Chaque observateur peut interpr´ter le ph´nom`ne en disant que les mesures ont lieu dans e e e l’ordre o` il les observe. interpr´t´ suivant des points de vue diff´rents. La corr´lation quantique ne fait que prolonger l’espace e e e e des corr´lations classiques. En allant un peu plus loin dans e ea e e e la corr´lation. e Un syst`me statistique classiquement corr´l´ devrait avoir une entropie d’au moins ln 2 pour e ee pouvoir pr´senter un spin nul ` la premi`re mesure. conform´ment ` la e e e e a relativit´ restreinte. e a 4 Proposition 3. les paires d’´lectrons suivantes sont dans le mˆme e e e e e e ´tat concernant le spin pour des ´tats spatiaux donn´s “dans deux boˆ e e e ıtes” (c’est-`-dire que quel a que soit le type d’exp´rience qu’on puisse concevoir ` partir d’une paire d’´lectrons. Si les deux exp´rimentateurs mesurent chacun leur spin de mani`re ind´pendante. le r´sultat de mesures successives ne peut diff´rer du cas de mesures ind´pendantes que e e e e dans la situation o` une mesure viendrait affecter l’autre partie du syst`me par une interaction u e mat´rielle (quelle qu’en soit la forme. autrement dit pas plus vite que la lumi`re. jusqu’` la valeur maximale de 2 ln 2 correspone a e a dant au cas d’un syst`me non corr´l´. e e e e e 3 Plus g´n´ralement. une paire d’´lectrons founis par un processus ayant secr`tement tir´ au sort un e e e vecteur u uniform´ment sur la sph`re.Proposition 2. il peut e e alors consid´rer (les chances ult´rieures de r´sultats sur) l’autre ´lectron ´loign´ exactement comme e e e e e e s’il l’avait d´j` mesur´ suivant la mˆme direction et qu’il en avait obtenu le r´sultat oppos´. puis fourni une paire d’´lectrons mesur´s comme ´tant de e e e e e 1 1 e e spins respectifs 2 u et − 2 u (l’information sur ce vecteur ´tant ensuite oubli´e). Comme on le voit. chacun des exp´rimentateurs peut consid´rer que c’est lui qui effectue la premi`re e e e mesure qui a une chance sur deux de donner l’un ou l’autre r´sultat. – D’autre part. on ne fait que multiplier par quelque chose une interaction instantan´e ` distance e e a qui ´tait nulle. le choix de leurs directions de mesure ´tant donn´. Par contre. e e D’une mani`re g´n´rale (quels que soient les syst`mes consid´r´s avec un plus grand nombre e e e e ee d’´tats). ou donner une paire e1 d’´lectrons de spins compl`tement al´atoires (spins nuls et ind´pendants) suivant la probabilit´ 2 . Or. En effet. ce qui donne toujours une interaction nulle. une paire d’´lectrons founis par un processus ayant secr`tement tir´ au sort le e e e choix entre donner une paire EPR (issue d’un doublet) suivant la probabilit´ 3 . les propositions 1 et 2 ne sont que des formulations ´quivalentes e d’un mˆme r´sultat. l’entropie d’une paire EPR d’´lectrons reste e ee e nulle tant qu’aucune mesure de spins n’est effectu´e. la probabilit´ que le couple des r´ponses soit e e e e un certain (σ. des th´or`mes similaires peuvent se d´montrer pour tout syst`me quantique e e e e e e 55 . quelle que soit la situation. y) qui n’est pas de la forme p1 (x)p2 (y)). qui ´tend la notion classique de corr´lation entre deux e e e parties d’un syst`me (que nous avions d´finie en m´canique statistique: une loi de probabilit´ e e e e p(x. Ce r´sultat obtenu. (Ceci ne remet nullement en question l’orientation du temps : les lignes d’univers des particules sont d´crites par la th´orie U qui ignore l’ordre temporel e e en tant qu’ordre de causalit´. ne faisant qu’exprimer un hasard qui s’´tait d´j` produit avant que les sous-syst`mes ne soient s´par´s. Si l’intervalle entre e e e les mesures est de type espace. e e e suivant des directions librement choisies au dernier moment par eux (peu importe comment). d’apr`s la th´orie quantique. alors. utilisant les mˆmes param`tres et leur permettant simplement d’aller e e e “un peu plus loin” sur la mˆme lanc´e. e e ee e Consistance du ph´nom`ne d’un point de vue quantique. c’est-`-dire l’ordre dans lequel il en re¸oit l’information par des signaux u a c lumineux. En un ea e e e e certain sens. On sait bien qu’une corr´lation classique n’a absolument e e e aucune chance de transmettre quelque information que ce soit. σ ) est ´gale ` ( 1 − σ · σ ). les lois de e a e probabilit´s sur les r´sultats observables seront toujours identiques d’une paire ` l’autre): e e a – D’une part.) e Le lien qui existe dans la loi de probabilit´ entre les r´sultats de mesures. ces mesures sont ind´pendantes. e Pr´cis´ment. Donc dans le cas EPR. une telle influence ne se produire d’une mesure sur l’autre que suivant l’ordre e temporel entre ces deux ´v`nements. n’est pas une e e interaction mais une corr´lation quantique. on pourrait dire que c’est le mˆme ´lectron dont la ligne d’univers va d’une mesure e e a ` l’autre en passant par le doublet initial. et les seules propri´t´s qui peuvent ˆtre mises en d´faut e ee e e sont des in´galit´s sur ces probabilit´s.

e D’autre part. une fois sa mesure effectu´e. Et comme e e aucune des deux mesures ne peut r´ellement affecter l’autre.corr´l´. chacun peut choisir e u e sa direction au dernier moment sans que cela ait la moindre cons´quence sur (les probabilit´s de e e mesure de) l’autre particule. Mais comme la position de u ne devrait avoir aucune influence sur la proportion de chances qui sont remplac´es pour le r´sultat de la e e deuxi`me mesure. e Ainsi. il peut consid´rer que le r´sultat e e e de l’autre est d´termin´ d’avance quoi qu’il fasse. Entre des e mesures des deux ´lectrons suivant deux directions proches formant un angle θ. on n’a que deux essais ` disposition : mesurer une fois le spin de l’un. e Quand on compare M ` M . Les chances ne varient donc pas au premier ordre d’approximation lorsqu’on bouge v au voisinage de u. donc finalement de proche en e e proche en additionnant les quantit´s de remplacements successifs. e e Ainsi. une proportion de ( 1 − 2 σ · σ ) de chances issues de M se a 2 retrouvent dans M (ce sont les chances dans M ∩ M ). cette conclusion est r´fut´e par les r´sultats ´nonc´s plus haut de la physique quantique. e le mˆme raisonnement s’applique avec un ensemble M de chances d’obtenir un vecteur σ . e ´ Echec de l’interpr´tation classique e Classiquement. Or. peut pr´dire le r´sultat de l’autre d’une e e e e mani`re probabiliste. Il est impossible de produire un triplet d’´lectrons corr´l´s de la mˆme mani`re (cela e ee e e n’est pas concevable dans le formalisme de la m´canique quantique). si on e a e compare l’ensemble M des chances qu’on avait d’obtenir σ avec celui M de celles d’obtenir σ . les chances des r´sultats qu’on peut obtenir suivant les directions choisies sont d´termie e n´es avant sa mesure. ce qui prouve que les objets invoqu´s dans le raisonnement (les ensembles de e chances pr´existantes qui d´terminent les r´sultats) ne correspondent pas ` des objets r´els. le hasard quantique de l’obsera e e vation d’un spin ne peut pas se comprendre suivant l’intuition classique comme ´tant d´termin´ e e e par une cause (un “jet de d´s”) qui existait d´j` dans l’environnement local de chaque observateur e ea avant qu’il n’effectue sa mesure. si au lieu de cela on effectue la deuxi`me mesure suivant une autre direction. cela doit ˆtre vrai de mani`re a e e e g´n´rale. et une fois le spin a de l’autre. Chaque exp´rimentateur. et mˆme certaine si les directions des mesures sont identiques. et d’autre part une moiti´ M ´galement sont des e e chances d’obtenir pour l’autre ´lectron un vecteur σ si on le mesure dans cette autre direction. puisque c’est vrai quand les directions sont les mˆmes et qu’un e choix de direction n’a aucune influence ` distance sur l’autre ´lectron. Ceci e e e a e vient du fait que parler du r´sultat qu’on obtiendrait si on effectuait une certaine mesure n’a pas e de sens tant que cette mesure n’est pas r´ellement effectu´e. ce e qui est absurde puisque le r´sultat doit s’inverser lorsque v va jusqu’` se retourner vers la position e a oppos´e. Donc. la proportion d’exceptions ´tant ´gale ` 1−cos θ . la quantit´ de remplacements de M ` M ne devrait pas surpasser la somme des quantit´s de e a e remplacements de M ` M et de M ` M . on est presque sˆr e u d’obtenir les r´sultats oppos´s. ou qualitativement de la mani`re suivante. et les autres qui auraient donn´ le r´sultat e e oppos´ (celles de M − M ) sont remplac´es dans M par un autre ensemble (M − M ) de chances e e issues du compl´mentaire de M . on serait tent´s de faire le raisonnement suivant pour deux mesures ind´pene e dantes. e e e e e On peut le voir par un simple exemple. ` cause des in´galit´s qui ne sont plus valables. e En conclusion. 56 . une moiti´ M sont des chances d’obtenir e e un vecteur σ si on mesure dans cette direction. Et pour mesurer l’´tat des spins de e e e la paire. a a e e Or. cette annulation au premier ordre de la quantit´ de remplacements lors d’un e e d´placement de v devrait ˆtre valable pour toute position de v. soit une quantit´ e e e e a e 2 nulle au premier ordre au voisinage de θ = 0. c’est ce qui vient ` l’esprit quand e e a on consid`re le cas o` les mesures se font suivant la mˆme direction. quels que soient le nombre de parties du syst`me et la forme (nombre d’´tats quantiques ee e e possibles suppos´ fini) de chaque partie. On peut alors compendre les propositions sur les probabilit´s de mesure en e e disant que sur l’ensemble des chances initiales du syst`me. Et e on est alors amen´s ` penser qu’entre une direction ou une autre pour la deuxi`me mesure. Du moins. pour toute variation de v. C’est ce qu’on appelle l’in´galit´ de Bell. le raisonnement classique sur les “causes” des r´sultats observ´s m`ne ` des conclusions e e e a contradictoires.

Sign up to vote on this title
UsefulNot useful