You are on page 1of 204

Introduction la physique statistique et la physique quantique

Frdric Hlein, Thierry Lvy 23 avril 2004

Table des matires


1 Thermodynamique classique 1.1 La thermodynamique classique . . . . . . . 1.2 Notions fondamentales . . . . . . . . . . . 1.3 Un exemple de systme : le piston . . . . . 1.4 Evolutions isothermes . . . . . . . . . . . . 1.5 Evolution adiabatique . . . . . . . . . . . 1.6 Le cycle de Carnot . . . . . . . . . . . . . 1.7 Lentropie . . . . . . . . . . . . . . . . . . 1.8 Le second principe de la thermodynamique 1.9 Conclusion . . . . . . . . . . . . . . . . . . 11 11 11 16 17 19 19 22 23 25 29 29 31 33 34 36 41 45 48 49 50 52 56 60 62

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . .

2 Physique statistique dun gaz rar 2.1 Une description microscopique dun gaz . . . . . . . . . . . . 2.1.1 Un modle de billard . . . . . . . . . . . . . . . . . . 2.1.2 Lespace des phases . . . . . . . . . . . . . . . . . . . 2.1.3 Rappels sur la mcanique hamiltonienne . . . . . . . 2.2 Le chaos ou comment les lois du hasard interviennent dans un systme dterministe . . . . . . . . . . . . . . . . . . . . . . 2.3 Premier usage des probabilits : les gaz dilus . . . . . . . . 2.4 Thorie cintique du gaz parfait . . . . . . . . . . . . . . . . 2.5 La distribution de Maxwell . . . . . . . . . . . . . . . . . . . 2.6 Interprtation statistique de lirrversibilit . . . . . . . . . . 2.6.1 Le paradoxe de Loschmidt . . . . . . . . . . . . . . . 2.6.2 Fluctuations de la densit dun gaz . . . . . . . . . . 2.6.3 Une premire approche statistique de lentropie . . . 2.6.4 Le paradoxe de Gibbs . . . . . . . . . . . . . . . . . 2.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3 Mcanique statistique avec interactions entre les particules 3.1 Lensemble micro-canonique . . . . . . . . . . . . . . . . . . . 3.1.1 Le choix de lespace des phases . . . . . . . . . . . . . 3.1.2 Reprsentation dun tat par une mesure . . . . . . . . 3.1.3 La construction dune mesure dcrivant ltat dquilibre 3.1.4 Existe-il dautres mesures dcrivant lquilibre ? . . . . 3.2 Lergodicit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Flots ergodiques . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Autres applications de lhypothse ergodique . . . . . . 3.3 Applications du formalisme micro-canonique . . . . . . . . . . 3.3.1 Dynamique dune volution quasi-statique . . . . . . . 3.3.2 Le gaz dilu lquilibre . . . . . . . . . . . . . . . . . 3.4 Entropie microcanonique . . . . . . . . . . . . . . . . . . . . . 3.4.1 Entropie statistique sur des ensembles nis . . . . . . . 3.4.2 Entropie statistique dun tat macroscopique . . . . . . 3.4.3 Entropie microcanonique . . . . . . . . . . . . . . . . . 3.5 Le formalisme canonique . . . . . . . . . . . . . . . . . . . . . 3.5.1 Lensemble canonique . . . . . . . . . . . . . . . . . . . 3.5.2 Identication de . . . . . . . . . . . . . . . . . . . . 3.5.3 Rpartition de lnergie . . . . . . . . . . . . . . . . . .

65 65 65 67 68 70 71 71 74 77 77 79 82 82 84 87 90 90 92 93

4 Interactions thermodynamiques entre la lumire et la matire 97 4.1 Prliminaire : lquipartition de lnergie . . . . . . . . . . . . 97 4.2 Le problme du rayonnement du corps noir . . . . . . . . . . . 99 4.2.1 La pense thermodynamique de Planck . . . . . . . . . 100 4.2.2 Position du problme . . . . . . . . . . . . . . . . . . . 102 4.2.3 Interpolation entre les lois de RayleighJeans et de Wien104 4.2.4 Comprendre la loi de Planck . . . . . . . . . . . . . . . 106 4.3 Leet photolectrique . . . . . . . . . . . . . . . . . . . . . . 108 4.4 Loi de dplacement de Wien et loi de Stefan-Boltzmann . . . . 109 4.5 Une approche combinatoire de la loi de Planck . . . . . . . . . 111 4.6 Prologue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 4.6.1 Gnralits . . . . . . . . . . . . . . . . . . . . . . . . 115 4.6.2 La jauge de Coulomb . . . . . . . . . . . . . . . . . . . 116 4.6.3 Formulation variationnelle des quations de Maxwell dans le vide . . . . . . . . . . . . . . . . . . . . . . . . 118 4

4.6.4 4.6.5

La lumire comme oscillation du champ lectromagntique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Les ondes lectromagntiques lintrieur dune cavit cubique . . . . . . . . . . . . . . . . . . . . . . . . . . 121 de . . . . . . . . . . la matire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 . 128 . 136 . 137 . 141 . 149 . 153

5 Vers la quantication des tats dnergie 5.1 Quelques lments de relativit . . . . . 5.2 Retour aux quanta de lumires . . . . . . 5.3 Le spectre des atomes . . . . . . . . . . 5.4 Lquation dHamiltonJacobi . . . . . . 5.5 Les dbuts de la mcanique ondulatoire 5.6 Lquation de Schrdinger . . . . . . . .

. . . . . .

. . . . . .

6 Lquation de Schrdinger et son interprtation 157 6.1 Du paquet donde linterprtation probabiliste de lquation de Schrdinger . . . . . . . . . . . . . . . . . . . . . . . . . . 159 6.1.1 Le paquet donde . . . . . . . . . . . . . . . . . . . . . 159 6.1.2 Une loi de conservation . . . . . . . . . . . . . . . . . . 161 6.1.3 Le dogme de l cole de Copenhague . . . . . . . . . 164 6.1.4 Le principe de superposition . . . . . . . . . . . . . . . 165 6.2 Observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 6.2.1 Une parenthse mathmatique : oprateurs auto-adjoints hermitiens . . . . . . . . . . . . . . . . . . . . . . . . . 169 6.3 Le thorme dEhrenfest et ses consquences . . . . . . . . . . 174 6.3.1 Le thorme dEhrenfest . . . . . . . . . . . . . . . . . 174 6.3.2 Interprtation et exemples dapplications . . . . . . . . 176 6.3.3 Un principe de correspondance . . . . . . . . . . . . . 177 7 Applications de la mcanique quantique 7.1 Leet tunnel . . . . . . . . . . . . . . . . . . . . 7.2 Loscillateur harmonique . . . . . . . . . . . . . . 7.2.1 Premire mthode . . . . . . . . . . . . . 7.2.2 Deuxime mthode . . . . . . . . . . . . . 7.3 Ensembles complets dobservables qui commutent 7.4 Le moment cintique . . . . . . . . . . . . . . . . 7.5 Latome dhydrogne . . . . . . . . . . . . . . . . 5 179 . 179 . 181 . 181 . 182 . 186 . 186 . 191

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

8 Le 8.1 8.2 8.3 8.4

point de vue de Heisenberg La mcanique des matrices . . . . . . . . . . . . . . . . Les relations dincertitudes dHeisenberg . . . . . . . . Reformulation des principes de la mcanique quantique Le spin . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Fonctions propres pour Lz . . . . . . . . . . . . 8.4.2 Retour sur le moment cintique angulaire . . . . 8.4.3 Le spin dun lectron . . . . . . . . . . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

195 . 195 . 195 . 196 . 197 . 197 . 198 . 200

Introduction
En apparence lessentiel des phnomnes physiques dont nous avons une exprience directe dans la vie de tous les jours obissent des lois qui ont t formules il y a plus de trois sicles par Galileo Galile et Isaac Newton (entre autres...) pour la mcanique et au XIXme sicle par Michael Faraday et James Clerck Maxwell (encore entre autres...) pour llectromagntisme. Toute personne relativement familire avec ces lois (comme vous) voit son intuition conforte par des expriences quotidiennes, que ce soit en conduisant sa voiture ou en observant la chute des pommes (mis part quelques phnomnes un peu plus droutant comme par exemple le mouvement dune toupie). Une des tapes les plus sensationnelles de lhistoire de la science fut la dcouverte au dbut du XXme sicle qu lchelle microscopique la matire se comporte dune manire profondment dirente de ce que lon pouvait prvoir laide de la physique classique. Et les physiciens ont t forcs dadmettre quil ntait pas possible de dcrire ce qui se passe lchelle atomique en des termes intelligibles pour nous. En revanche ils ont pu construire des modles mathmatiques (mcanique quantique, thorie quantique des champs) permettant des prdictions dune prcision stupante, mais malheureusement incapables de donner une image de ce qui se passe propre satisfaire notre intuition. Ce choc dans le monde de la physique a suscit de nombreux dbats : si certains physiciens (autour de Niels Bohr) ont prn une attitude pragmatique, savoir que puisque le modle mathmatique donne des rponses absolument conformes lexprience il ny a pas lieu de chercher plus loin, dautres scientiques en revanche (autour dAlbert Einstein) ont object quun certain nombre de principes qui sont postuls dans la mcanique quantique, relativement durs avaler (comme la probabilit de prsence ou la rduction du paquet donde), ne sont que des concepts provisoires, en attendant llaboration dun modle satisfaisant davantage notre besoin de comprendre. Ajoutons que la physique quantique 7

nest pas uniquement la physique du trs petit et quaucun phnomne nchappe en principe ses lois, hormis la description de situations extrmes comme dans les trous noirs ou lchelle de Planck (1033 cm) qui ncessiterait lutilisation dune thorie uniant la mcanique quantique et la thorie de la relativit gnrale (mais cette thorie nexiste pas encore). Simplement la plupart des phnomnes macroscopiques mettent en jeu un nombre gigantesque datomes, ce qui fait quune partie des lois de la physique est gomme plus grande chelle, et ce quil en reste est ce que nous nommons mcanique classique. Toutefois certains phnomnes particuliers, dont la mise en oeuvre ncessite une technologie sophistique, comme les laser ou la supraconductivit, obissent des lois quantiques non classiques, mme lchelle macroscopique. Nous allons essayer dans ce cours dexposer les concepts physiques et mathmatiques qui permettent actuellement dapprhender cette thorie en suivant un ordre historique. Deux raisons justient ce choix, qui nest pas habituel dans les textes dintroduction la mcanique quantique, sans doute en partie parce que le chemin historique est toujours plus compliqu quun expos synthtique et axiomatique, mais aussi parce que il ncessite un plus grand bagage mathmatique. La premire raison est simplement que le dveloppement historique de la mcanique quantique est passionnant. La deuxime raison est quune prsentation plus synthtique ou privilgiant un certain point de vue pourrait donner limpression que la thorie est acheve, quelle est une construction qui dcoulerait daxiomes qui ont t gravs dans le marbre par quelques physiciens dans les annes 1920. Rien ne serait plus faux : aucune thorie physique en gnral nest dnitive et a fortiori la mcanique quantique, o bien des points restent totalement opaques. Certes les axiomes de la mcanique quantiques des annes 1920 sont et seront toujours en accord avec la plupart des expriences que lon peut imaginer aujourdhui. Mais comme nous lavons voqu plus haut et comme nous le verrons en dtails plus tard, la thorie actuelle ne peut pas satisfaire notre intuition. Plus grave encore est le fait que lon ne sait toujours pas comment unier la physique quantique avec la relativit gnrale. Enn une autre dicult est que la thorie quantique des champs, qui dcrit avec une prcision extraordinaire les interactions entre particules, repose sur des calculs qui nont aucune base mathmatique (mme si les techniques mathmatique qui ont t dveloppes autour de cette thorie, comme par exemple la thorie de la renormalisation, sont des constructions subtiles et puissantes). Il semble que lon nait toujours pas bien compris quelles devaient tre les bases physiques et mathmatiques 8

de cette thorie. Ainsi toutes ces considrations conduisent penser que nos connaissances actuelles ne nous permettent pas de saisir rellement en quoi consiste la physique quantique. En attendant il est donc important de comprendre la thorie actuelle comme le rsultat dun long cheminement, dpres discussions, de changement de perspectives. Ce chemin nest toujours pas termin et il y aura probablement dautres rvolutions avant darriver (espronsle) une thorie complte. Et il est probable que beaucoup dides relgues aux oubliettes seront remises lhonneur (sous une forme sans doute modie) au cours des rvolutions venir, comme cest lhabitude en physique, plus encore quen mathmatiques. Cest pourquoi nous commencerons par deux questions anciennes, qui sont lorigine de cette aventure : les interactions thermodynamiques entre la matire et la lumire et le spectre (discret) de la lumire mise par les atomes. Dans la conception de ce cours, nous avons bien entendu largement utilis les rfrences bibliographiques qui sont mentionnes au cours du texte. Mais nous nous sommes aussi beaucoup inspirs du livre formidable sur les probabilits de Jacques Harthong1, la fois comme modle de style dexposition et aussi en lui empruntant un certain nombre de discussions sur lergodicit et le calcul de Planck. Deuximement la construction mme de ce cours, en tentant de dvelopper les ides suivant un parcours proche du cheminement historique, doit beaucoup de nombreuses discussions avec Joseph Kouneiher ainsi qu un certain nombre de notes quil ma communiques.

cf. http ://moire4.u-strasbg.fr/bouquins/proba/tabmat1.htm

10

Chapitre 1 Thermodynamique classique


1.1 1.2 La thermodynamique classique Notions fondamentales

Nous rappelons ici brivement quelques notions de thermodynamique. Pour comprendre quantitativement les liens entre les notions de volume, pression, temprature, nergie, chaleur, etc., il est ncessaire de considrer dans un premier temps des situations simplies et idalises comme celle qui suit. Un systme physique Isolons mentalement une certaine quantit de matire contenue dans une portion de lespace du reste du monde. Nous pouvons lui associer certaines grandeurs : la quantit la plus concrte est le volume occup V la pression p, gale au quotient de la force exerce par le gaz sur une portion de la paroi par laire de cette paroi. Cette dnition suppose que ce quotient soit le mme partout (ce qui nest pas le cas par exemple autour dune aile davion, sans quoi lavion tomberait) et donc que le gaz soit au repos. la temprature T : cest dj une notion plus subtile, bien que nous en ayons une perception immdiate. Dabord, tout comme la pression, on ne peut dnir la temprature dun systme que sil est lquilibre (Ce qui signie que lon a laiss reposer le systme susamment longtemps pour quil nvolue plus , le temps de relaxation pouvant varier entre une fraction de seconde et des heures suivant les situa11

tions). La possibilit thorique de dnir la temprature est dduite de lobservation exprimentale du principe zro de la thermodynamique. Celui-ci snonce : deux systmes, en quilibre thermique avec un mme troisime, restent en quilibre entre eux . Cest dire que la relation dquivalence A B entre des tats physiques A et B, signiant que A est en quilibre thermique avec B , qui est bien videmment rexive et symtrique, est aussi transitive, et est donc une relation dquivalence. Alors chaque classe dquivalence dnit une temprature1 . Ce principe conduit la dnition dune fonction temprature T sur lensemble des systmes physiques qui nest bien videmment pas unique, puisque, pour tout homomorphisme croissant de limage de T dans vers un ouvert de R, T est encore une fonction temprature2 . la quantit de molcules N . On lexprime soit en nombre de molcules N , soit en nombre de moles N/NA , o NA = 6, 022 136 7 1023 est le nombre dAvogadro.. Le nombre de molcules joue un rle important lorsquon considre un mlange de direntes espces chimiques (par exemple de lhydrogne H2 avec de loxygne O2 et de leau H2 O). On doit alors comptabiliser dans lnergie totale une nergie chimique (et des potentiels chimiques) dpendant de ces nombres. Exercice 1 Soit U un ensemble dnombrable dlments que lon notera A, B, etc. Supposons que U soit muni des relations , et , satisfaisant les proprits (i) et (ii) nonces dans la note en bas de page 1. Montrer quil existe une fonction T : U R telle que A B T (A) T (B). Toutes ces grandeurs sappellent grandeurs dtat. Nous les avons dni peu prs comme on aurait pu le faire au milieu du XIXme sicle, sur la base dun certain nombre de principes issus de lexprience, quil serait dicile de dduire logiquement de la mcanique. Nous verrons ultrieurement, avec la
Il faudrait complter ce principe en introduisant la relation A B signiant A est plus chaud que B et nest pas en quilibre thermique avec B et la relation A B signiant alors que A B ou A B . Alors en postulant que (i) est une relation dordre totale sur lensemble des systmes physiques et que (ii) A, B tels que A B il existe C tel que A C B, on peut dmontrer lexistence dune fonction temprature (cf. Exercice 1). 2 On peut exiger en plus que lorsque T varie (de faon quasi-statique), par exemple le volume V du systme varie en tant une fonction direntiable de T et mme que dV soit dT le plus proche possible dune constante : cest exactement le principe du thermomtre alcool ou mercure, reliant de faon ane la dilatation dun uide sa temprature.
1

12

mcanique statistique, une approche bien plus profonde de ces notions, notament en ce qui concerne la temprature. Notons que parmi ces grandeurs dtat, certaines sont dites extensives et dautres intensives. Les grandeurs extensives (volume, nombre de molcules) sajoutent lorsque lon superposent deux systmes en quilibre thermiques et chimiques : par exemple si jassemble deux systmes identiques et en quilibre en un seul, le volume du nouveau systme est la somme des volumes de chacune des parties. Les grandeurs intensives (temprature, pression, potentiel chimique) ne sajoutent pas : par exemple si jassemble deux systmes la mme temprature, le rsultat est un systme qui a encore la mme temprature. Lnergie interne. Enn nous aurions pu galement incorporer dans la liste des grandeurs dtat lnergie interne U : cest une notion historiquement issue de la mcanique o elle est dnie comme la somme de lnergie potentielle et de lnergie cintique. Pour un mouvement sans frottement, lnergie totale est conserve : cest ce qui rend la notion dnergie si importante. Au milieu du XIXme sicle, les travaux de N.L.S. Carnot, J.P. Joule et R.J. Mayer permirent de comprendre que la chaleur tait aussi une forme particulire dnergie, accomplissant ainsi un premier pas vers une unication de la mcanique et de la thermique. Notons qu la dirence des grandeurs dtat comme V , p, T , lnergie totale est un concept relativement abstrait (ou transcendant). En particulier lnergie totale ne se mesure pas directement, mais est value partir dun bilan des changes dnergie. En revanche, lnergie totale peut tre en gnral calcule partir des autres variables dtat : elle une fonction U = U (T, p, V, ). Enn, contrairement la temprature ou la pression, il est possible de dnir lnergie totale dun systme, mme si celui-ci est en dehors de lquilibre. A prsent nous pouvons commencer rcolter les fruits du travail des thermodynamiciens : sur des systmes parfois extrmement complexes, nous avons dni un petit nombre de grandeurs dtat ( partir du moment o les systmes sont lquilibre) et nous pouvons faire des prdictions en utilisant des relations qui ne font intervenir que ces grandeurs ! Considrons un exemple simple : un gaz monoatomique contenu dans une enceinte ferme, lquilibre. Les grandeurs dtat sont V , N , p et T . Ltat du systme semble a priori dpendre de quatre variables. Mais ces grandeurs sont lies par une relation dtat (entre V , N , p et T ). Par ailleurs U peut tre calcule partir des autres variables. Par exemple si nous avons un gaz parfait, alors lqua13

tion dtat (R. Boyle, E. Mariotte, L.J. Gay-Lussac, L. Boltzmann) est pV = N kT,
R o k = NA = 1, 380 658 1023 JK 1 est la constante de Boltzmann. Et lnergie totale sexprime en fonction de la temprature par

3 U = N kT. 2 Ainsi ltat macroscopique de ce systme dpend de 3 paramtres. Nous pourrions alors choisir trois grandeurs parmi V , N , p et T et tout exprimer en fonction de ces trois grandeurs. Mais quelles grandeurs choisir ? La pratique des calculs de thermodynamique sapparente souvent une sorte de gymnastique direntielle, consistant driver une variable par rapport une autre, tout en glant une troisime variable, etc., do il rsulte rapidement une certaine confusion. An de clarier cela nous allons reprsenter chaque tat A dun systme lquilibre thermodynamique par un point m dans une varit direntiable M, de dimension 3, sorte despace de conguration thermodynamique3 . Pourquoi une varit direntiable ? parce que beaucoup de raisonnements faits en thermodynamique supposent que lon laisse ou fait voluer un systme de faon susamment lente pour qu chaque instant il soit lquilibre et quon puisse ainsi dnir sa temprature et sa pression. Donc on peut chaque instant associer au systme un point dans la varit M et modliser lvolution par une courbe dans M. On parle alors dune volution rversible ou quasi-statique. On peut alors tudier les variations innitsimales des grandeurs dtat et leurs relations4 . Ainsi chaque grandeur dtat est manipule comme une fonction direntiable sur M. An de quantier les changes dnergie dun systme avec lextrieur sous forme de chaleur ou de travail, nous devons adjoindre aux 4 fonctions direntiables qui satisfont les relations dtats crites plus haut deux 1-formes direntielles sur M : la quantit de chaleur absorbe par le systme q la quantit de travail apporte par lextrieur au systme w.
ici M peut tre choisie diomorphe R3 , ou bien tre dni comme tant la sousvarit de {(V, N, p, T ) R4 } dnie par la relation dtat. 4 Il sagit l bien sr dune situation idale, mais que lon approcher exprimentalement
3

14

Alors si un systme volue dune faon rversible ou quasi-statique, et si nous reprsentons cette volution par un chemin orient sur M allant dun tat initial m0 un tat nal m1 , la quantit de chaleur (respectivement de travail) absorbe par le systme pour voluer de m0 m1 est q (respectivement w). Ces deux 1-formes ne sont pas fermes en gnral. En revanche nous

m 0 M m 1

Fig. 1.1 Une volution quasi-statique sur la varit des congurations thermodynamiques

avons : dU = q + w. Remarquons que lon aurait pu prendre cette relation comme dnition de lnergie ( une constante prs).

0 M

Fig. 1.2 Une volution non quasi-statique joignant deux points sur la varit M A loppos une volution non rversible ne peux pas tre reprsente par une courbe sur M, car en gnral le systme passe par des tats en dehors de lquilibre thermodynamique. Ainsi on ne peut dnir les tats de dpart et darrive dans M. 15

1.3

Un exemple de systme : le piston

Imaginons un gaz contenu dans une enceinte forme par un tube cylindrique ferm un bout par une paroi xe et lautre bout par un piston sans masse qui glisse sans frottement (gure 1.3). Dans cette exprience on remarque que (sauf sil y a des fuites) le nombre de molcules N est x, gal une valeur N0 . On peut donc remplacer la varit M par Envisageons un dplacement inniment petit dh du piston (h dsigne ici la MN0 := {m M/N (m) = N0 }.

Fig. 1.3 Un cylindre ferm par un piston hauteur du piston). Nous supposons quen mme temps une force dintensit trs lgrement infrieure p (o est laire du piston) est exerce de lextrieur sur le piston. Nous pouvons alors conclure en vertu du principe daction et de raction que le gaz a lui aussi exerc une force de mme intensit sur le piston et donc le gaz fournit un travail pratiquement gal p dh = p dV . Donc le travail apport par lextrieur est : Lexpression de q en revanche nest dicte par aucune considration mcanique. Tout ce que que lon peut faire est utiliser deux grandeurs en guise de coordonnnes locales sur M et dcomposer q linairement en fonction des direntielles de ces grandeurs. Par exemple si on prend comme grandeurs (T, V ) (ou bien respectivement (T, p)), on a q = CV dT + a dV (ou bien respectivement = Cp dT + b dp), o CV est la capacit thermique volume constant et Cp est la capacit thermique pression constante. w = p dV.

16

1.4

Evolutions isothermes

Dilatation isotherme quasi-statique Comme premier exemple dapplication de ce qui prcde, imaginons que notre cylindre, qui contient le gaz, est plong dans une grosse marmite deau bouillante T0 := 373K (100C) (gure 1.4). Cette quantit deau maintient le gaz dans le cylindre la temprature

100 C

Fig. 1.4 Le mme systme dans un thermostat 100 C ...

0C

Fig. 1.5 ... ou dans un thermostat 0 C constante T0 , elle joue le rle de thermostat. Initialement une certaine force (dintensit gale p, o est laire du piston) est exerce de lextrieur sur le piston, de faon comprimer le gaz. Le systme est ltat initial m0 de grandeurs dtat (p0 , V0 , T0 ). Ensuite nous rduisons trs lgrement la force exerce sur le piston, de faon ce que le gaz puisse se dtendre, tout en restant lquilibre. On continue ainsi jusqu un certain tat m1 de grandeurs dtat (p1 , V1 , T1 ). Le chemin entre m0 et m1 a pour eet daugmenter V , de diminuer p, tout en restant la temprature constante 17

T = T0 = T1 . Le travail fournit lextrieur par le gaz est, pour un gaz parfait, W = w = N kT dV = N kT0 V
V1 V0

p dV =

dV V1 = N kT0 log > 0. V V0

Le processus inverse, qui consiste faire revenir le systme son tat dorigine en poussant le piston, ncessite quune machine extrieure fournisse un travail gal N kT0 log V1 . Notons que, dans le cas du gaz parfait, U est foncV0 tion uniquement de T et donc ne varie pas ici. Donc dU = w + q = 0. Par consquent le travail fourni par le gaz lors de la dilatation est aliment en nergie par la chaleur du thermostat et lorsque le gaz se contracte le travail fourni par lextrieur est converti en chaleur intgralement transmise au thermostat. Dilatation isotherme non quasi-statique A prsent nous reprenons le dispositif exprimental prcdent mais nous nexerons plus de force sur le piston : comme le piston est suppos avoir une masse ngligeable, le gaz nexerce pratiquement aucune force et le travail fourni par le gaz est pratiquement nul. On observera aussi une dtente beaucoup plus rapide que dans le cas prcdent : il sagit dune dilatation non quasi-statique. Nous laissons monter ainsi librement le piston jusqu ce quil atteigne la mme hauteur que dans lexprience prcdente, puis nous attendons un certain temps, pour que le systme revienne un tat dquilibre. Alors ltat nal du systme doit tre le mme que dans lexprience quasi-statique : la temprature lintrieur du cylindre doit squilibrer avec celle du thermostat, cest tre T1 = T0 , le volume, le nombre de molcules sont les mmes, et donc la pression p1 , lie T1 , V1 et N1 par la relation dtat est aussi identique. Le bilan nergetique est donc le mme. Et pourtant le systme na pas fourni de travail. Lexplication est que le gaz dans le cylindre a puis une quantit de chaleur dans le thermostat qui est plus petite que dans lexprience prcdente : le caractre violent de la dtente a cr une agitation des molcules dans le cylindre qui a contribu chauer le gaz. Enn, contrairement lexprience quasi-statique, le systme nest pas pass par des tats dquilibre. Donc il nest pas possible de dnir toutes les grandeurs dtat (en particulier T ) et on ne pas modliser cette exprience par un chemin dans M. 18

1.5

Evolution adiabatique

Une volution est adiabatique si elle seectue sans change de chaleur avec lextrieur. Noter queune telle volution peut parfois tre trs rapide. Dans lexemple du piston, on doit remplacer le thermostat dans lequel baignait le piston par une enveloppe isolante. Il est possible de caractriser les courbes dans MN0 qui modlisent une volution rversible et adiabatique par une quation direntielle. En eet il sagit de la condition q| = 0. Et tant donn que MN0 est de dimension 2, en chaque point m MN0 cette condition prescrit totalement la droite tangent . Voyons ce que cela donne dans le cas dun gaz parfait. Des relations dU = q + w et q| = 0, 3 N k dT| = p dV| . 2 Il y a ici trois grandeurs dtat susceptibles de varier : T , V et p. Nous pouvons liminer p en fonction de T et V , laide de la relation dtat pV = N kT . Cela donne N kT 3 N k dT| = dV| 2 V En intgrant nous obtenons T 3/2 V = Constante. dV| 3 dT| = . 2 T V

3 on tire, sachant que U = 2 N kT et w = pdV , que

1.6

Le cycle de Carnot

Nous avons dja remarqu que q est une 1-forme non exacte sur M. En particulier, cela signie que, si est une courbe ferme dans M dcrivant une volution rversible, le travail reu par le systme au cours dun tel cycle est W = w= dw = dp dV = 0,
D D

(o D est limmersion dun disque orient dans M dont le bord est ) en vertu de la formule de Stokes. La quantiti de chaleur reue est, quand 19

elle, loppose de cette quantit. Nous percevons donc quun systme peut transformer de la chaleur en travail ou linverse au cours dun cycle, tout en revenant son tat initial la n. Cest le principe de la machine thermodynamique (moteur vapeur, rgrigrateur, etc.). Une situation o le bilan peut tre calcule relativement simplement a t imagine par N.L.S. Carnot. Cela consiste en un chemin constitu dvolutions rversibles alternativement isothermiques ou adiabatiques : Chemin 0 Dtente rversible isotherme (p0 , V0 , T0 ) (p1 , V1 , T0 ) Chemin 1 Dtente rversible adiabatique (p1 , V1 , T0 ) (p2 , V2 , T2 ) Chemin 2 Compression rversible isotherme (p2 , V2 , T2 ) (p3 , V3 , T2 ) Chemin 3 Compression rversible adiabatique (p3 , V3 , T2 ) (p0 , V0 , T0 ). On peut imaginer par exemple que le chemin 0 se fait dans un thermostat T0 373 K (100 C) (plong dans leau bouillante), puis que, durant le chemin 1 , on laisse le piston se dtendre jusqu ce que la temprature descende T2 273 K (0 C). Le chemin 2 se fait alors dans un thermostat rempli de glace 0 C, le chemin 3 est une recompression jusqu ce quon retrouve la temprature de 100 C. La quantit de chaleur Q reue par le systme se
T T0 0

1 q=0

q=0 T2 V0 V3

V1

V2

Fig. 1.6 Reprsentation schmatique du cycle de Carnot dcompose selon Q = Q0 + Q1 + Q2 + Q3 , o chaque Qa est la quantit reue pendant le chemin a . De mme on dcompose la quantit de travail 20

absorbes par le systme W = W0 + W1 + W2 + W3 . Ces quantits peuvent


T (p0 ,V0 ,T0 )

W0 ?

Q 0= - W 0 0

(p1 ,V1 ,T0 )

W1 ? W3 ? Q 3= 0 3 1 Q 1= 0

(p3 ,V3 ,T2 )

W2 ?

Q 2= - W 2 2

(p2 ,V2 ,T2 ) V

Fig. 1.7 Le bilan nergtique du cycle de Carnot

tre calcules partir des considrations prcdentes : Dtente (p0 , V0 , T0 ) (p1 , V1 , T0 ) : W0 = N kT0 log V1 (voir prcV0 demment) et comme T est constant et on a aaire un gaz parfait, U est constant, donc Q0 = N kT0 log V1 V0 Dtente (p1 , V1 , T0 ) (p2 , V2 , T2 ) : Q1 = 0 et donc W1 = U (p2 , V2 , T2 ) U (p1 , V1 , T0 ) = 3 N k(T2 T0 ). 2 Compression (p2 , V2 , T2 ) (p3 , V3 , T2 ) : W2 = N kT2 log V3 et Q2 = V2 V3 N kT2 log V2 . 3 Compression (p3 , V3 , T2 ) (p0 , V0 , T0 ) : Q3 = 0 et W3 = 2 N k(T0 T2 ). On voit tout de suite que Q1 + Q3 = 0 et W1 + W3 = 0 et donc les tapes adiabatiques ne jouent aucun rle dans le bilan de Q et W . En revanche, il est possible de comparer W0 et W2 comme suit. 3/2 3/2 Sachant que T0 V1 = T2 V2 (conservation de T 3/2 V le long de la dtente 3/2 3/2 adiabatique 1 ), et T2 V3 = T0 V0 (compression adiabatique 2 ) on dduit 21

que V2 = Donc W2 = N kT2 log Donc W = W0 1 T2 T0 T0 T2


3/2

V1

et V3 =

T0 T2

3/2

V0

V3 = V2

V1 V0

V1 T2 V3 = N kT2 log = W0 . V2 V0 T0 et Q = W0 1 T2 T0 .

Ainsi, si T0 > T2 et V2 > V0 (ce qui correspond au scnario que nous avions imagin), nous avons W0 < 0 et donc W < 0 et Q > 0 : le systme a fournit du travail lextrieur, en lchange dune quantit de chaleur. Mais si on parcourt le cycle en sens inverse, cest linverse.

1.7

Lentropie

La relation trouve entre W2 et W0 entra ne la mme relation entre Q2 et T2 Q0 , cest dire Q2 = T0 Q0 ou encore
0

q + T

q Q0 Q2 = + = 0. T T0 T2

Et comme q sannule sur les processus adiabatiques 1 et 3 , q = 0. T

q Cette identit peut permettre de dmontrer que la 1-forme T est exacte. En eet, elle est valable pour tous les cycles de Carnot (correspondant des choix de tempratures T0 et T2 et de volumes V0 et V1 arbitraires) donc en particulier pour des cycles inniment petits. Il est donc possible de dmontrer que cette identit est valable sur tous les cycles rversibles et den dduire que q d = 0. T

22

(Exercice : le vrier !) Mais surtout on vrie exprimentalement que cette loi sapplique pour tous les processus rversibles concernant des gaz. Cela entra ne quil existe une fonction S : M R telle que dS = q T sur M.

Cette fonction, dnie ici une constante dintgration prs, sappelle lentropie du systme. Dans le cas particulier des gaz parfaits, nous allons vrier directement cela par le calcul : q dU w 3 N k dT p dV = = + , T T 2 T T kT et en substituant p = NV dans la deuxime expression : q 3 N k dT N k dV = + = N k d log T 3/2 V T 2 T V Lentropie est donc S(p, V, T, N ) = S(p0 , V0 , T0 , N ) + N klog T 3/2 V
3/2

T0 V0 T 5/2 V0 = S(p0 , V0 , T0 , N ) + N klog 5/2 V T0

o lon a utilis pour dduire la deuxime expression de la premire la subkT stitution V = Np . Nous remarquons que, cause du facteur N devant le logarithme, lentropie est une grandeur extensive : elle cro t dans les mmes proportions que la quantit de matire. Ainsi lentropie dun systme constitu de plusieurs soussystmes coupls est la somme des entropies de chacun des sous-systmes.

1.8

Le second principe de la thermodynamique

Tout ce qui prcde concernait les volutions rversibles ou quasi-statiques. Mais chacun sait quun systme du type de celui considr prcdemment 23

subit des forces de frottement (invitables) et sil est laiss lui-mme, il nira toujours par ne plus tre anim daucun mouvement, toute lnergie mcanique ayant t dgrade en chaleur. Une avance importante ralise au XIXme sicle a t de comprendre cela et dtre capable de quantier cette perte. Cela nappara t pas immdiatement dans le calcul des changes de chaleur et de travail que nous avons eectu pour le cycle de Carnot. En eet lors dun cycle complet, le systme part dun tat dquilibre et revient au mme tat dquilibre. Donc comme lentropie est une fonction des grandeurs dtats, elle doit tre la mme au dbut et la n. Cela est vrai mme si, au lieu de faire un cycle de Carnot rversible, le systme volue de faon non quasistatique5 , il sut dattendre la n que le systme revienne lquilibre pour que lon retrouve la mme valeur que la valeur initiale pour lentropie, nouveau puisque lentropie est une fonction des grandeurs dtat. Donc pour observer lirrversibilit, cest dire un phnomne de dgradation de lnergie, on ne doit pas raisonner sur le systme constitu par le piston seul, mais sur un systme plus grand, constitu par le piston (P ) plus un systme environant (E)6 . Ainsi par exemple, durant la phase 0 , le travail reu par (E) est W0 (E) = W0 (P )irr = 0 pirr dV . Mais comme le processus nest pas exactement rversible, la pression pirr rellement exerce par le piston est plus petite que la pression calcule pour un processus parfaitement rversible, donc W0 (E) =
0

pirr dV <
0

p dV = W0 (P )rev .

A loppos, pendant la phase 2 , de compression isotherme, la pression pirr exercer sur le piston est suprieure celle pour un processus rversible : pirr > p, donc le gain7 de travail de (E) est (en tenant compte ici du fait que dV|2 < 0) W2 (E) =
2
5

pirr dV <
2

p dV = W2 (P )rev .

par exemple en sautant de (p0 , V0 , T0 ) (p1 , V1 , T0 ) (cest dire par une dtente isotherme non rversible), puis de (p1 , V1 , T0 ) (p2 , V2 , T2 ) (par une dilatation adiabiatique non rversible), puis de (p2 , V2 , T2 ) (p3 , V3 , T3 ) et enn de (p3 , V3 , T3 ) (p0 , V0 , T0 ) 6 comprenant les thermostats plus par exemple des poids que lon accrocherait des hauteurs direntes pour stocker le travail sous forme dnergie potentielle 7 ngatif ici, puisquil sagit dune perte

24

Pour ces deux processus isothermes, on a donc W0 (E) + W0 (P )rev < 0 et W2 (E) + W2 (P )rev < 0. On aurait pu arriver au mme rsultat en considrant les ux de chaleurs : pendant la phase 0 , lagitation thermique dans le piston cre de la chaleur qui nest pas puise dans le thermostat et donc (E) perd moins dnergie que pour un processus rversible, donc a un gain Q0 (E)irr = Q0 (P )irr > Q0 (P )rev = W0 (P )rev .. Et de mme, pendant la compression 2 une partie du travail eectu par (E) est dissipe dans le piston, ce qui fait que le thermostat soit absorber une quantit de chaleur suprieure au cas rversible. Donc nouveau Q2 (E)irr = Q2 (P )irr > Q2 (P )rev = W2 (P )rev . En conclusion, en supposant pour simplier que lentropie de (P ) et (E) ne varie pas pendant les phases adiabatique 1 et 3 , laugmentation de lentropie de (E) est : S(E)irr = Q0 (P )rev Q2 (P )rev Q0 (E)irr Q2 (E)irr + > = S(P )rev = 0. T0 T2 T0 T2

A prsent nous savons que S(P )irr = S(P )rev (puisque S(P ) est une fonction dtat), donc S(P + E)irr = S(P )rev + S(E)irr > 0. Enonons le second principe de la thermodynamique : Pour un systme isol en volution au cours du temps, lentropie ne dcro t jamais. Pour un systme lquilibre, lentropie est constante. Un corollaire des deux cas envisags dans ce principe est quun systme va voluer jusqu ce que son entropie ne puisse plus augmenter, cest dire est maximale. Noter quil existe bien dautres formulations plus ou moins quivalentes de ce principe (en terme de mouvement perptuels ou en des termes bien plus abstraits). Nous ne nous tendrons pas l-dessus, car le chapitre suivant va apporter un clairage dirent sur lentropie.

1.9

Conclusion

Le second principe de la thermodynamique et les proprits physiques quil contient (lirrversibilit) sont le premier concept dans lhistoire de la phy25

sique moderne qui entre en conit avec le postulat du dterminisme, troitement lie lide de rversibilit. Citons ce sujet P.-S. de Laplace : Une intelligence qui, pour un instant donn, conna trait toutes les forces dont la nature est anime, et la situation respective des tres qui la composent, si dailleurs elle tait assez vaste pour soumettre ces donnes lanalyse, embrasserait dans la mme formule les mouvements des plus grands corps de lunivers et ceux du plus lger atome : rien ne serait incertain pour elle, et lavenir comme le pass serait prsent ses yeux. (1819). An de concilier la rversibilit et le second principe de la thermodynamique une ide a t propose au milieu du XIXme sicle (notament par R. Clausius et Sir J. J. Thomsom) : supposons que la matire soit constitue datomes (une notion pas trs claire lpoque). Supposons de plus que ces atomes bougent dune manire totalement dsordonne, et quils se trouvent dans des positions alatoires et bougent dans des directions et avec des vitesses alatoires. Alors on pourrait imaginer que lnergie interne dun gaz (ou dun systme pus complexe) soit la somme des nergies cintiques de chacun de ces atomes, que la temprature mesure le degr dagitation des atomes et quenn la pression8 rsulte des chocs des atomes entrant en collision avec une paroi. Cette hypothse va savrer tre trs fructueuse. Elle sera mise en oeuvre dabord par J.C. Maxwell, qui retrouvera ainsi les proprits du gaz parfait, puis par L. Boltzmann, qui comprendra rellement9 ce quest lentropie et quel est le lien entre lentropie et le dsordre. Cela ncessite lintroduction des statistiques et des probabilits dans la physique, objet du prochain chapitre. Enn il faut souligner loriginalit des raisonnements faits en thermodynamique, par rapport la faon de penser traditionnelle de la mcanique. En eet, il nest pas possible en thermodynamique de dcrire avec exactitude ce qui passe dans un gaz (par exemple en modlisant lvolution par une quation direntielle) ou a fortiori dans un systme plus complexe. En revanche, lidentication de grandeurs dtat qui, mme si elles ne sont pas observables tout instant (en particulier quand le systme nest pas lquilibre), sont mesurables au dbut ou la n dune exprience lorsque le systme est lquilibre, permet de faire de nombreuses prdictions. Cest un peu une phy8 9

une explication dja propose par D. Bernouilli en 1736 et pendant longtemps restera le seul comprendre

26

sique de la bo te noire : on observe avant et aprs une exprience et on essaie de tirer des conclusions partir dun bilan sur certaines grandeurs. Ce type de raisonnement est garder en tte lorsquon aborde la mcanique quantique : nous allons chercher comprendre des expriences dans lesquelles on peut mesurer des grandeurs avant et aprs, mais il nous sera impossible davoir une ide correspondant un schma classique de ce qui se passe durant lexprience. Rfrence : W. Greiner, L. Neise, H. Stcker, Thermodynamique et mcanique statistique, Springer.

27

28

Chapitre 2 Physique statistique dun gaz rar


2.1 Une description microscopique dun gaz

Nous allons imaginer un gaz comme une assemble de N particules newtoniennes, cest dire dont le mouvement obit la dynamique newtonienne. Pour simplier nous supposerons que ces particules sont identiques entre elles (en particulier elles ont toutes la mme masse m). La position chaque instant t du centre de masse de ces particules est donne par les valeurs des N fonctions (i )N en t. Si le gaz est suppos tre contenu dans une enceinte i=1 ferme, chaque fonction i est astreinte prendre des valeurs dans un ouvert born de R3 . Nous supposerons que la frontire de est rgulire (de classe C 2 ). Parmi les modles dynamiques, les plus simples consistent supposer que chaque particule dcrit un mouvement de translation rectiligne uniforme en dehors de chocs. Cela signie que si la distance entre deux particules direntes est plus grande quune certaine valeur 2r (o r est le rayon de la particule), ces deux particules ninteragissent pas. Donc i est une fonction continue de t, ane par morceau et non drivable aux instants des chocs. Nous supposons les chocs lastiques, cest dire : pour un choc entre deux particules, lnergie cintique et la quantit de mouvement sont conserves. Ainsi, en numrotant les deux particules 29

qui se rencontrent par i et j, nous avons les relations : mi (t ) + mj (t ) = mi (t+ ) + mj (t+ ) c c c c m m m m |i (t )|2 + |j (t )|2 = c c |i (t+ )|2 + |j (t+ )|2 , c c 2 2 2 2 o tc est linstant du choc et on note f (t ) := limttc f (t) et f (t+ ) := c c limttc f (t) les valeurs limites prises par une fonction gauche et droite respectivement de tc . Notant vk := k (t ), les solutions de ce c systme sont de la forme 1 1 1 1 + + vi = (vi + vj ) + |vi vj |n et vj = (vi + vj ) |vi vj |n, 2 2 2 2 (2.1) o n est un vecteur quelconque de norme 1. (Exercice.) pour un choc dune particule contre la paroi lnergie cintique est conserve1 et la variation de la quantit de mouvement est gale la force exerce sur la paroi sur la particule. En numrotant i la particule incidente et en notant Fi (t tc ) la force exerce2 par la paroi sur la particule incidente, on a mi (t+ ) = Fi + mi (t ) et c c m m |i (t )|2 = |i (t+ )|2 , c c 2 2

avec, en plus, les conditions que i (t ), > 0 et i (t+ ), < 0, o c c est le vecteur normal sortant au point dimpact i (tc ). Do nous c dduisons ici, notant toujours vi := i (t ), que
+ vi = |vi |n et F i = |vi |n vi ,

(2.2)

o n est un vecteur quelconque de norme 1, tel que n, < 0. (Exercice.)


Une hypothse simplicatrice est faite ici : en ralit les molcules qui constituent la paroi sont animes de mouvements de vibration thermique et des changes dnergie et de quantit de mouvement ont lieu entre les molcules du gaz et celles de la paroi. Ces changes contribuent lquilibre thermodynamique entre les deux. 2 est ici la masse de Dirac, ce nest pas une fonction, mais une distribution, une sorte de fonction gnralise (voir un cours sur les distributions) : (t tc ) est nul sur tout t + compact dans R \ {tc } et tcc (t tc )dt = 1, > 0.
1

30

Dans cette description une certaine incertitude appara t dj, puisqu chaque choc entre deux particules, les vitesses aprs le choc ne sont pas compltement dtermines. En particulier le paramtre n S 2 est ici arbitraire. Il est possible, en faisant des hypothses sur la structure des particules (atomes ou molcules), de modliser de ce qui se passe durant le choc par une loi donnant n en fonction des vitesses avant le choc (section ecace). Notre propos ici sera de montrer que, mme en partant dun modle microscopique dterministe, une modlisation alatoire simpose. Nous allons donc considrer un modle simple qui, mme sil nest pas forcment raliste, est en accord avec les rgles de conservation dnergie et de quantit de mouvement nonces plus haut et est de plus dterministe.

2.1.1

Un modle de billard

Un modle simple est le suivant : nous supposons que chacune des particules est une sphre parfaitement dure et lastique de rayon r (comme une boule de billard). Ces particules voluent dans une enceinte := {x R3 /dist(x, ) < r}. A chaque choc, la force (et donc la variation de quantit de mouvement) exerce sur chaque particule est normale la surface de la sphre au point dimpact. Donc : un choc entre les deux particules i et j a lieu lorsque limttc |i (t) j (t)| = 2r. Alors nous supposons que la force Fji (t tc ), exerce par j sur i, est parallle au vecteur :=
+ Cela signie que vi vi =

j (tc ) i (tc ) . |j (tc ) i (tc )| est parallle , donc R tel que

Fji m

+ vi vi = . En utilisant la conservation de lnergie on trouve que = vi vj , et donc + vi = v i v i v j , + vj = vj + vi vj , .

Remarquer quici, comme |j (t) i (t)| 2r, t, on a toujours vi vj , 0. (Exercice.)

31

un choc entre la particule i et la paroi a lieu lorsque dist(i (tc ), ) = r. Alors nous supposons que la force exerce par la paroi sur la particule est parallle au vecteur normal extrieur au point dimpact. + Donc vi sexprime fonction de vi par la loi
+ vi = vi 2 vi , .

(2.3)

Observer que cette loi est la mme que celle de la rexion dun rayon lumineux sur un miroir. Noter aussi ici que vi , 0. (Exercice.) Nous avons exclu ici les collisions simultanes de trois particules ou plus : cela peut arriver, mais est extrmement improbable (en fait la probabilit dune telle collision est nulle). Il est possible de rinterprter les quations prcdentes comme celles du mouvement dun point de coordonnes (x1 , , xN ) dans un ouvert de R3N . Pour cela, nous observons que la particule sphrique centre en x R3 est contenue dans si et seulement si x . Ensuite nous considrons N := {(x1 , , xN ) N /i, j N tels que 1 i, j N et i = j, |xi xj | > 2r} r et nous noterons galement dans la suite (dans le cas o r = 0 et = ) N := {(x1 , , xN ) N /i, j N tels que 1 i, j N et i = j, |xi xj | > 0}. Il est clair que lon peut associer de faon bijective tout point x = (x1 , , xN ) N une conguration de N boules dans qui ne se touchent r pas entre elles et que les points de N reprsentent des collisions particuler paroi ou particule-particule. Soit maintenant = (1 , , N ) dcrivant le mouvement de ces N particules. Chaque collision sinterprte comme une rexion de sur N . Cela est clair pour les collisions contre la paroi . r Dans le cas dune collision entre deux particules i et j, le vecteur normal unitaire N en x = (tc ) est r N = 1 2|xi xj |
3 3

=1

(x x ) i j

+ (x x ) j i xi xj .

1 = 2

=1

xi xj 32

comme prcdemment. (Exercice.) Nous en dduisons que :

+ Et si nous demandons que se rchisse sur N , savoir v = v r N N 2 v , , nous obtenons + si k = i, j vk = v k + v = vi v i vj , i + vj = vj + vi vj , ,

Le mouvement de N particules assimiles des sphres dures parfaitement lastiques de mme rayon et mme masse dans une enceinte ferme est dcrit par le mouvement dun point dans un ouvert de dimension 3N se rchissant sur le bord de cet ouvert selon la loi (2.3).

2.1.2

Lespace des phases

Une autre proprit de la dynamique de ces N particules est quil sagit dun mouvement hamiltonien (singulier dans le cas du modle de billard cause des chocs). En eet, premirement toute lvolution du systme au cours du temps (pass et futur) peut tre retrouve en connaissant les positions et vitesses de chaque particule un instant donn. Plus prcisment le systme peut tre dcrit par un champ de vecteur (singulier) dans lespace des phases T N := {(x , p )/x N , p R3N }, r r o p := (p1 , , pN ) est la donne des impulsions pi = mvi . Cet espace est le br cotangent N et est muni de la forme symplectique canonique r
N 3

:=
i=1 =1

dpi, dx . i

Ainsi pour tout t R, nous pouvons considrer lapplication3 t : T N r T N qui, tout point (x , p ) T N associe les positions et impulsions des r r particules dont les positions et impulsions linstant initial 0 taient (x , p )
Dans la dnition qui suit, on exclut nouveau les collisions plus de trois particules ; cela signie quen ralit t est dni uniquement sur un sous-ensemble dense de T N , r celui des conditions initiales qui prcisment ne donnent pas lieu ces collisions.
3

33

et que lon a laiss voluer pendant le temps t.. La famille des homomorphismes (t )tR peut tre considre comme le ot du champ de vecteur singulier . Deuximement ce champ de vecteur singulier est hamiltonien.

2.1.3

Rappels sur la mcanique hamiltonienne

Rappelons que, si N est une varit direntielle de dimension n, la varit br cotangent T N est munie de la forme symplectique canonique = n 2 =1 dp dx . A toute fonction H C (N , R), on associe lunique champ de vecteur H sur T N , dni par V T(q,p) (T N ), (H , V ) + dH(V ) = 0. (V ) := (H , V ),

Notant H la 1-forme dnie par V T(q,p) (T N ), H cette relation peut encore scrire
n

+ dH = 0 ou bien H =
=1

H H . p x x p

On dit alors que H est un champ de vecteur hamiltonien. Lquation dvo lution = H () est le systme des quations dHamilton. Dans beaucoup de cas, H est obtenu partir dune densit lagrangienne L : T N R par la transforme de Legendre : alors la transformation TN T N L (x , v ) (x , p ) = x , v (x, v) est un diomorphisme et H(x, p) + L(x, v) = p v , x, v, p tel que p = L (x, v). De plus t (t) est un point critique4 de R L((t), (t))dt si et v seulement si t (t), L ((t), (t)) est solution des quations de Hamil v ton. Une proprit importante des quations de Hamilton est que le ot etH du champ vecteur H prserve la forme symplectique. Autrement dit, si est une portion de surface dans T N (limage du plongement dun ouvert de
et donc une solution des quations dEulerLagrange L x ((t), (t))
4 d dt L v ((t), (t))

34

R2 ), alors = etH () . Pour montrer cela on remarque dabord que = (etH ) .. Ensuite on dmontre que etH () LieH := lim (etH ) = 0, t0 t

qui entra ne bien le rsultat. Cette dernire identit est immdiate partir du moment o lon dispose de la formule LieH = d (H ) + H (d) ,

o est le produit intrieur dune forme par un vecteur. En eet, sachant que H = dH et d = 0, on a tout de suite LieH = d (dH) + H (d) = 0. Ici, on peut invoquer deux raisons pour justier le fait que le champ singulier est hamiltonien (bien quil ne soit pas rgulier). Une premire raison est que le mouvement de rexion dune particule est variationnel (principe de Hnon). Une deuxime raison, plus satisfaisante sur le plan mathmatique, consiste rgulariser le champ , cest dire montrer quil est limite dune famille de champs de vecteur hamiltoniens. Nous pouvons pour cela considrer lhamiltonien sur T N :
N 3

H (x , p ) =

i=1 =1

2 |pi, |2 + , 2m dist(x, N )2

o > 0 est cens tendre vers 0. Exercice 2 Calculer := H . Montrer que lorsque 0, H tend uniformment sur tout compact de T N . Faire une tude prs du bord dans le cas o lon remplace N par le demiespace Rn : montrer que, dans T Rn , les trajectoires harmiltoniennes de + + se projettent sur Rn en des branches dhyperboles et que, lorsque 0, ces + trajectoires convergent vers celles de . A partir de cette tude, on peut donc conclure que la famille des homomorphismes (t )tR prserve la forme symplectique . 35

Le crochet de Poisson Si F, H : T N R sont deux fonctions de classe C k (pour k N tel que k 1), nous dnissons le crochet de Poisson de F et H comme tant la fonction {F, H} : T N R dnie par
n

{F, H} := (H , F ) =

=1

H F H F . p x x p

Il est immdiat que {F, H} est de classe C k1 . Cette quantit appara t naturellement lorsque lon considre une solution (x, p) des quations de Hamilton d pour H : dt (x(t), p(t)) = H (x(t), p(t)), et que lon calcule le taux de variation de F (x(t), p(t)) au cours du temps, cest dire d (F (x(t), p(t))) = dF(x(t),p(t)) (H (x(t), p(t))).. dt Un calcul trs simple (Exercice) donne d (F (x(t), p(t))) = {F, H}(x(t), p(t)). dt Deux proprits fondamentales du crochet de Poisson sont quil est antisymtrique : {H, F } + {F, H} = 0 et quil satisfait lidentit de Jacobi : {F, {G, H}} + {G, {H, F }} + {H, {F, G}} = 0. Dans le cas o le problme variationnel est invariant au cours du temps, cest dire o le lagrangien ou lhamiltonien sont indpendant du temps, lantisyd mtrie du crochet de Poisson implique que, si dt (x(t), p(t)) = H (x(t), p(t)), d H(x(t), p(t)) = {H, H}(x(t), p(t)) = 0, dt cest dire la conservation de lnergie.

2.2

Le chaos ou comment les lois du hasard interviennent dans un systme dterministe

Dans les deux paragraphes qui prcdent, nous avons prsent un modle microscopique dun gaz qui entre parfaitement dans le cadre de la mcanique 36

classique, cest--dire dont la solution, du point de vue mathmatique, se ramne la rsolution dune quation direntielle. Dans lesprit du texte de Laplace cit la n du premier chapitre, on peut dire que la connaissance des conditions initiales du systme que nous tudions doit permettre de calculer compltement son volution. Nous allons voir dans ce paragraphe que ceci est impossible pour deux raisons principales. Nous verrons aussi comment il faut modier notre approche mathmatique pour pouvoir faire des prdictions pertinentes. La premire raison est trs simple : lquation direntielle quil nous faut rsoudre est une quation du premier ordre en 6N variable, o N est le nombre de particules de notre gaz. Cela est tout simplement hors de porte de la technologie humaine et le restera sans doute encore un certain temps. La seconde raison concerne ltat initial : il est impossible de dcrire ltat de 1023 particules un instant donn5 . On pourrait cependant penser quil est possible den dcrire une approximation et, si lvolution temporelle tait assez stable, cest--dire si elle gommait de petites erreurs faites sur ltat initial au fur et mesure que le temps passe, cela pourrait tre susant. Cest malheureusement exactement le contraire qui se passe. Pour illustrer le second problme (il ny a gure besoin dillustrer le premier !), nous allons tudier un exemple trs simple, en dimension 2 : le mouvement de rexion dune particule pige lintrieur dun disque circulaire et se rchissant sur le bord de D 2 selon la loi (2.3). Notons D 2 := {x + iy C/x2 + y 2 < 1}. Alors lensemble des trajectoires est E := {t ei (ct)/ ]0, ], [0, 2[, c R}, o n Z, t 2n sin , 2(n + 1) sin , 2 2 (t) = ein 1 + i t 2n sin 2 ei/2 .

(Exercice.) La solution est celle qui passe en 1 en t = 0 et dcrit le segment de droite joignant 1 ei avec une vitesse gale 1. Le paramtre c est la
Si on est capable de stocker un gigaoctet dans un gramme de matire (barrette de mmoire vive par exemple), il faut de lordre de un milliard de tonnes de matire pour noter un seul tat du systme.
5

37

Fig. 2.1 Une boule de billard dans un disque

clrit et est une sorte de phase. Enn la vitesse de est donne par n Z, t 2n sin , 2(n + 1) sin , 2 2 (t) = iei(n+ 2 ) .
1

Sur cet exemple, il facile de se rendre compte que : la moindre variation de est amplie au bout dun temps susamment long. Par exemple, pour deux valeurs , ]0, 2] direntes mais trs proches, les trajectoires dont les positions seraient confondues au point 1 et qui auraient comme vitesses respectives iei/2 et iei /2 linstant 0 niraient par scarter et par avoir des vitesses trs direntes au bout dun temps susamment long. Si 2Q, cest dire = 2p/q, o p Z et q N sont premiers entre eux, les valeurs prises par sont iei(2k+p)/q /0 k < q . Si ]0, ]\2Q les valeurs prises par sont denses dans le cercle S 1 . Notons que le premier cas a une probabilit gale 0, tandis que le deuxime cas a une probabilit gale 1. (Cela est physiquement signicatif et entra ne que dans une exprience pratique, il serait impossible de xer une valeur rationnelle pour .) Pour interprter cet exemple physiquement , il est important de distinguer les cas o lon observe le mouvement sur un temps trs court ou sur un temps trs long. Dans le premier cas, le systme se manifestera de faon dterministe. Dans le deuxime cas, comme il est impossible de prescrire ou de mesurer avec une prcision innie, on nira toujours par observer 38

un comportement chaotique au bout dun temps susamment long. A ce moment, on peut dire que le modle dterministe nest plus trs utile. En compensation nous pouvons observer le phnomne suivant : si ]0, ]\2Q, pour tout intervalle ouvert I S 1 , |I| |{t [T, T ]/ (t) I}| = , T 2T 2 lim (2.4)

o ici on dsigne la mesure de Lebesgue dun ensemble mesurable A par |A|. (Exercice.) Cela signie que, dfaut de faire des prdictions exactes, nous pouvons faire des prdictions probabilistes. Ici par exemple on pourra observer nimporte quelle vitesse dans S 1 avec une densit de probabilit uniforme. Des proprits comme (2.4) sont caractristiques de lergodicit de lvolution temporelle de notre systme. Cette ergodicit, lorsquelle est prsente, est ce quil reste de rgulier dans une volution chaotique. Cela nous suggre fortement quune description statistique de notre systme sera bien plus ecace quune description dterministe. Exercice 3 On considre, pour toute fonction f C 0 ([0, 1]), la limite (f ) := lim Montrer que (f ) =
1 sin

1 T T

f (| (t)|)dt.
0

f (r) 2r 2

peut-on faire lorsque lon mesure la distance de (t) 0 connaissant ? Nous voyons sur cet exemple simple que sur des temps trs longs, il est impossible de prdire quoi que ce soit de prcis sur la direction du vecteur vitesse, et trs peu de choses sur la position de la particule6 . Or il se trouve que ds que lon remplace le disque par pratiquement nimporte quelle courbe ferme, mme trs rgulire, les phnomnes de chaos seront beaucoup plus importants et concerneront autant les positions que les vitesses : la mesure de probabilit de la position dune particule sera la mesure uniforme dans le
On pourrait varier ce modle, par exemple remplacer le disque par lintrieur dune ellipse, et on observerait alors des phnomnes similaires. Mais les cercles et les ellipses sont des courbes trs particulires qui nexistent quen approximation dans la nature.
6

dr r sin2

. Interprter : quelles prdictions

39

domaine et il en sera de mme pour la direction du vecteur vitesse7 . Ces proprits dergodicit sont diciles dmontrer mathmatiquement en gnral, mais on peut les vrier de manire trs convaincante par des observations exprimentales (boules de Loto) ou par des simulations sur ordinateur (cf. le dernier chapitre du livre de Harthong). Revenons maintenant au modle de billard pour N particules : il ny aura pas de changement qualitatif dans lmergence du chaos, mais une amplication. Une premire raison pour cela est le fait que N est trs grand (de lordre du nombre dAvogadro) et que le mouvement des molcules est trs rapide (de lordre de 1840 m s1 pour lhydrogne 273 K). Par consquent, mme si lon part dune conguration ordonne , le temps au bout duquel les phnomnes deviendront chaotiques sera extrmement court et de plus, si nous voulons estimer une limite analogue (2.4) il sura de prendre un temps dobservation T petit lchelle des temps macroscopiques. Une deuxime raison qui est moins immdiate est lie aux proprits mathmatiques (chaotiques) du billard : les chocs entre particules engendrent encore davantage dinstabilits dynamiques que les chocs entre les parois. Cest dire que deux trajectoires direntes qui ont des conditions initiales trs proches dans T N r scartent trs rapidement lune de lautre (rsultats de Y. Sinai). En outre il est impossible de mesurer et de prparer un systme physique correspondant un point particulier (ou mme un voisinage extrmement petit dun point) dans lespace de phase T N . Pour toutes ces raisons, nous ne pouvons pas r dcrire de faon dterministe un tel gaz. En revanche une description statistique donnera dexcellents rsultats. En conclusion nous pouvons tirer deux enseignements des considrations prcdentes. Le premier est, quen dehors des cas exceptionnels (et irralisables en pratique) o lenceinte qui enferme le gaz a une gomtrie trs particulire, il est impossible davoir la moindre information prcise sur ltat microscopique dun gaz lquilibre, toute information partielle un instant donn tant immdiatement rendue obsolte par le caractre chaotique de lvolution de cet tat. La seule approche possible du problme est donc une
Seule ici la norme du vecteur vitesse est prdictible, car cest une constante du mouvement. Noter que si on remplace le domaine bidimensionnel par N comme dans la section r prcdente et si on interprte le mouvement comme celui dun systme de N particules, la conservation de la norme du vecteur vitesse dans N ne signie rien dautre que la r conservation de lnergie cintique totale du systme de particules.
7

40

approche statistique. Le deuxime enseignement vient temprer le premier : cest le caractre ergodique de lvolution microscopique (dans les bons cas), qui se traduit par un phnomne de balayage uniforme au cours du temps de lespace des phases par une trajectoire, illustr par (2.4). Nous aurons besoin au prochain chapitre de supposer que cela est vrai en gnral (principe ergodique).

2.3

Premier usage des probabilits : les gaz dilus

Nous allons commencer par appliquer le premier enseignement de la section prcdente sur un exemple simple : celui des gaz rars ou dilus. Nous allons ainsi retrouver certaines lois thermodynamiques des gaz parfaits. Dans ce qui suit, nous supposerons pour simplier que les particules sont ponctuelles (et donc r = 0) et nous poserons donc = . Imaginons que nous souhaitions calculer une quantit macroscopique de la forme
N

A(x (t), p (t)) :=

a(xi (t), pi (t)),


i=1

o (x , p ) : R T N est une solution des quations de Hamilton, t R et a est une fonction sur T (dont les valeurs sont microscopiques ). 2 Par exemple nous verrons dans la section suivante que si a(x, p) = |p| , cest 2m dire si a est lnergie cintique dune particule, alors A(x (t), p (t)) est la somme de toutes les nergies cintiques des particules donc (pour un gaz dilu) lnergie totale du systme en t (comme on nglige les chocs, il ny a pas dnergie potentielle ; noter que, comme lnergie est conserve, cette quantit ne dpend pas de t). Nous verrons aussi dans la section suivante quun autre choix de a permet dvaluer la force exerce par le gaz sur une portion de la paroi de et donc la pression du gaz. Comme il est impossible de calculer rellement A(x (t), p (t)), nous allons plutt en faire une estimation probabiliste, par un calcul de moyenne statistique. Il sagit donc de construire un espace probabilis adapt notre problme. Imaginons que lon dispose dun nombre trs grand voire inni de 41

systmes contenant la mme quantit de gaz, tirs au hasard , que tous les systmes sont lquilibre et identiques du point de vue des grandeurs thermodynamiques. Pour tout ouvert rgulier (ou plus gnralement tout sousensemble mesurable) C de T N , on dnombre la proportion de systmes tels que (x (t), p (t)) C et on note t (C) cette quantit. En dautres termes t est une mesure de probabilit sur T N et t (C) est la probabilit pour que (x (t), p (t)) C. Comme le gaz est lquilibre il est naturel de supposer que t ne dpend pas de t et donc t = . Nous disposons donc dsormais de lespace probabilis (T N , ), sur lequel La fonction A(x (t), p (t)) est maintenant une variable alatoire. Nous voulons tre capables de calculer des quantits comme sa moyenne, sa variance. Celles-ci dpendent bien entendu de la mesure quil nous faut essayer de prciser. Dans la suite nous noterons (x , p ) (x (t), p (t)) et il sera sous-entendu que (x , p ) reprsente ltat du systme un instant t choisi une fois pour toute. Soit la densit de , de sorte que d = (x , p ) N dx1 dx2 dx2 dpi,1 dpi,2 dpi,3 . i i i i=1 Linvariance du problme par rapport au temps8 implique aussi que est invariant par le champ de vecteur hamiltonien H : d(x ,p ) (H (x , p )) = {H, }(x , p ) = 0. Nous faisons maintenant lhypothse que le gaz contenu dans une enceinte , isol et lquilibre est dilu, ce qui entra ne que les chocs entre particules sont trs rares (cest bien pourquoi par exemple lair est un excellent isolant). Alors nous pouvons ngliger linuence des chocs et la dynamique du gaz est identique la superposition des mouvements de N particules qui rebondissent sur les parois de et qui signorent les unes les autres. Une N |pi |2 premire consquence de cela est lapproximation H(x , p ) i=1 2m et pi, N 3 donc H i=1 =1 m x et nous en dduisons que
i

d(x ,p ) (H ) =
i=1 =1

pi, (x , p ) = 0. m x i

(2.5)

Une deuxime consquence est que, puisque les direntes particules signorent entre elles, nous allons faire lhypothse (beaucoup moins innocente, comme nous le verrons en 2.6.1) que, pour tout 1 i, j N tels que i = j, les variables alatoires (xi , pi ) et (xj , pj ) sont indpendantes et de mme loi. Donc
8

nous reviendrons sur cette condition de faon plus dtaille au chapitre 3

42

il existe une densit de probabilit : T [0, [ telle que


N

(x , p ) =

(xi , pi ).
i=1

(2.6)

En substituant cette expression dans (2.5) et en divisant par (x , p ), nous obtenons :


N 3

i=1 =1

pi, (xi , pi ) = 0, m(xi , pi ) x

(x , p ) T N .

Cela nest possible que si x = 0. Nous obtenons ainsi que (x, p) = (p)/||, o : R3 [0, [ est une densit de probabilit. Cela signie que les particules se rpartissent uniformment en espace.. Enn, sur la base des considrations de la section prcdente et, compte tenu du fait que les quations du mouvement sont invariantes par rotation dans lespace R3 , nous pouvons aussi faire lhypothse que ne dpend que de la norme de p et poser (p) = f (|p|2 ), o f est une densit de probabilit sur [0, [. Ainsi N

d =
i=1

f (|pi |2 ) 1 2 2 dxi dxi dxi dpi,1 dpi,2 dpi,3 . ||

Lhypothse dindpendance et didentique distribution entre les particules que nous avons faite ci-dessus est extrmement importante. Considrons par exemple nouveau la variable A = A(x , p ). Elle est par dnition la somme des variables alatoires microscopiques ai , i = 1 . . . N , o ai est dnie par ai (x , p ) := a(xi , pi ), ou encore la moyenne des variables alatoires macroscopiques Ai (x , p ) := N ai (x , p ) = N a(xi , pi ). Cela entra ne par exemple que A(x , p )

=
T N N

A(x , p ) d ai (x , p ) d

=
i=1 N T N

=
i=1

ai (x , p ) 43

1 N

i=1

Ai (x , p ) .

(2.7)

Nous avons pour linstant seulement crit le fait que lesprance dune somme de variables alatoires est la somme de leurs esprances. Mais lhypothse dquidistribution assure que la moyenne ai (x , p ) ne dpend pas de i : cest en fait, pour chaque i, la moyenne de la fonction a sur le i-ime espace T , sous la mesure image de par lapplication i-ime coordonne T N T . Cette mesure scrit plus explicitement ai (x , p )

=
T

a(x, p)

f (|p|2 ) 1 2 3 dx dx dx dp1 dp2 dp3 . ||

Lhypothse dindpendance, quil faut distinguer de celle dquidistribution9 , nous permet destimer la variance de A = A(x , p ). Rappelons quelle est dnie par Var(A) = (A A )2 . On vrie aisment que les variances de variables alatoires indpendantes sajoutent et il est par ailleurs immdiat que la variance est une fonction homogne de degr 2. Ainsi,
N N

Var (A) = Var


i=1

ai

=
i=1

Var(ai ) =

1 Var(N a). N2

Cela nous montre, puisque N est gigantesque, que A uctue trs peu autour de sa valeur moyenne. Par exemple, lingalit de Chebyshev assure que P (|A A | > ) 1 1 Var (A) = 2 2 Var(N a). 2 N (2.8)

La valeur observe de A a donc de trs grandes chances dtre proche de A . Nous verrons cependant un peu plus tard des rsultats beaucoup plus ns dans cette direction, et nous tablirons que A a une probabilit exponentiellement faible en N de scarter sensiblement de A .
Pour bien les distinguer, il est peut-tre utile de sapesantir un peu sur la structure probabiliste de lespace des phases. Lespace T N est muni de N projections qui, phy siquement, extraient de ltat global du systme ltat dune particule donne : pour tout k entre 1 et N , nous avons donc k : T N T . La donne de la mesure sur T N dtermine les N mesures images (k ) sur T qui correspondent chacune des N particules. Lhypothse dquirpartition revient dire que toutes les mesures (k ) sont gales. Si les particules sont indiscernables, cela semble tre une hypothse invitable. Lhypothse dindpendance revient, elle, dire que est gale au produit k (k ) . Nous rutiliserons ce formalisme qui ici peut para tre un peu lourd lors de ltude de la distribution des vitesses de Maxwell.
9

44

2.4

Thorie cintique du gaz parfait

Nous allons maintenant appliquer les considrations prcdentes au calcul de lnergie et de la pression dun gaz dilu lquilibre thermodynamique et retrouver ainsi la loi des gaz parfaits. Lnergie interne est la somme des nergies cintiques de toutes les molcules :
N

U (x , p ) =

i=1

|pi |2 , 2m

et correspond donc une fonction macroscopique du type prcdent avec a(x, p) := |p|2 /2m. La relation (2.7) donne 1 U (x , p ) N 1 U (x , p ) N |p|2 f (|p|2 ) 1 2 2 = dx dx dx dp1 dp2 dp3 || T 2m |p|2 = f (|p|2 )dp1 dp2 dp3 . R3 2m

(2.9)

Pour le calcul de la pression, considrons une portion s du bord et calculons la valeur moyenne F t au cours dun intervalle de temps t de la force rsultant des chocs des particules sur s. Nous noterons s := |s| laire de s. Nous sommes obligs ici de considrer une moyenne sur un intervalle de temps car les chocs ont lieu des temps discrets. Nous choisissons s petit par rapport aux dimensions macroscopiques de lenceinte contenant le gaz, de sorte que nous pouvons assimiler avec une bonne approximation s un morceau de surface plane : nous notons alors le vecteur normal (extrieur) s (nous supposerons aussi dans la suite que est (0, 0, 1)). De mme nous choisissons t relativement bref par rapport aux temps macroscopiques, ce qui autorisera appliquer le rsultat de notre calcul pour la dnition dune pression instantane pour des processus dvolution rversible10 .
Noter que, dans la plupart des situations ralistes, le nombre gigantesque de particules (de lordre du nombre dAvogadro) et leur trs grandes vitesses permet de supposer en mme temps que s est grand par rapport aux chelles molculaires et t est grand par rapport aux temps de parcours envisags, de sorte que le nombre de particules qui vont frapper s pendant lintervalle de temps t est trs grand. Nous aurons besoin de cette
10

45

Nous commenons par une question simple : supposons quune particule se trouve en x avec une impulsion p un instant t0 . Quelle force exerce-telle sur s entre t0 et t0 + t ? Cette force nest non nulle que si la particule frappe s pendant lintervalle [t0 , t0 + t], cest dire si
p (x, p) Ct := {(x, p) T /tc [0, t], x + m tc s} p = {(y m tc , p) T /p3 > 0, y s, tc [0, t]}.

Et alors, en supposant le choc lastique et suivant (2.3), la force est F (t) = 2p3 (t tc ) (il sagit ici de lintensit de la force, sa direction est toujours ). p3 La moyenne de cette force sur [t0 , t0 +t] est donc 2 t . Ainsi, la moyenne sur
s

t v 3

Fig. 2.2 Le calcul de la pression pour un gaz parfait [t0 , t0 + t] de la force exerce par une particule de condition initiale (x, p) sur s est at (x, p), o : p3 si (x, p) Ct , at (x, p) = 2 t si (x, p) T \ Ct , at (x, p) = 0. Donc pour toute solution (x , p ) : R T N des quations de Hamilton reprsentant lvolution microscopique dun gaz dilu, la moyenne sur [t0 , t0 + t] de la force exerce par le gaz est
N

F t =
i=1

at (xi , pi ),

o at a t dni prcdemment. Appliquant le principe obtenu11 dans la


hypothse un peu plus loin (voir la note de bas de page 11). Par ailleurs, moyennant une hypothse raisonnable dergodicit dont nous reparlerons plus loin, la valeur du nombre de particules divise par t s sera un nombre quasi indpendant du temps, de la position et de t et s (un peu dans le mme sens que dans (2.4)). 11 pour que lapplication de ce principe soit valable, il est ncessaire que le nombre des particules concernes cest dire des particules i telles que (xi , pi ) Ct soit trs grand. Cela implique que t doit tre choisi pas trop petit, de faon ce que N t soit un grand nombre.

46

section prcdente, nous obtenons F t f (|p|2 ) 1 2 3 dx dx dx dp1 dp2 dp3 || T p3 f (|p|2 ) 1 2 3 dx dx dx dp1 dp2 dp3 . = N 2 Ct t || = N at (x, p)
p t, p) m

F t

Par le changement de variable (x, p) = (y {(p1 , p2 , p3 ) R3 /p3 > 0}, F t = N

cela donne, notant R3 := +


t 0

f (|p|2 ) 2p3 dp1 dp2 dp3 dy 1 dy 2 || t c R3 s + (p3 )2 s dp1 dp2 dp3 . f (|p|2 ) = 2N || R3 m +

p3 dt m

Exploitant dabord le fait que la quantit intgre est invariante par changement de signe de p3 , puis que R3 f (|p|2 ) (p1 )2 = R3 f (|p|2 ) (p2 )2 = R3 f (|p|2 ) (p3 )2 = 1 f (|p|2 )|p|2 , nous en dduisons que 3 R3 F t = N s || f (|p|2 )
R3

s (p3 )2 dp1 dp2 dp3 = N m 3||

f (|p|2 )
R3

|p|2 dp1 dp2 dp3 . m

Notons que cette quantit est indpendante de t. Ainsi la pression p := F t /s est m 2 3 1 2 3 |v| m dv dv dv , 2 R3 R3 (2.10) 2 2 2 |p| o V = ||. Dune part, nous constatons que pV = N 3 R3 f (|p| ) 2m dp1 dp2 dp3 , 2 2 ce qui, en identiant 3 R3 f (|p|2 ) |p| dp1 dp2 dp3 avec kT , redonne la relation 2m dtat des gaz parfaits. Dautre part, en comparant avec (2.9), nous obtenons p= f (|p|2 ) f (|mv|2 ) p= 2 U. 3V 2N 3V |p|2 2N dp1 dp2 dp3 = 2m 3V

Et donc en utilisant la relation pV = N kT , nous retrouvons le fait que 3 U = N kT. 2 47

2.5

La distribution de Maxwell

Nous allons prsent essayer de deviner, par des arguments heuristiques, une expression plus prcise de la densit f . Nous faisons lhypothse supplmentaire suivante : les variables alatoires p1 , p2 et p3 sont indpendantes deux deux et de mme loi. Soit f (p ) dp la mesure de probabilit de la variable p . Cest la projection de f (|p|2 ) dp1 dp2 dp3 sur laxe des p : = 1, 2, 3, L1 (R), (p )f (p ) dp =
R R3

(p )f (|p|2 ) dp1 dp2 dp3 ,

on en dduit que f est une fonction rgulire. Le fait que p1 , p2 et p3 aient la mme loi entra ne que f1 = f2 = f3 . Comme on a aussi manifestement f (p ) = f (p ), nous pouvons donc poser f (p ) = g((p )2 ). Lhypothse dindpendance des lois des composantes de limpulsion signie alors que g((p1 )2 )g((p2 )2 )g((p3 )2 ) = f ((p1 )2 + (p2 )2 + (p3 )2 ), p R3 .

Exercice 4 Dmontrer quil existe des constantes C > 0 et a R telles que f (|p|2 ) = Cea|p| .
2

(2.11)

Comme nous savons que f est une densit de probabilit, et donc en particulier que R3 f (|p|2 ) dp1 dp2 dp3 = 1, il est ncessaire que a > 0. La mesure f (|p|2 ) dp1 dp2 dp3 est donc gaussienne. De plus la normalisation prcdente a3 entra ne que C = (Exercice). Nous pouvons de plus calculer U en fonction de f , pour en dduire une relation supplmentaire sur a. Utilisant (2.9), U 3 N 2 N = 2m N = 2m N = 2m = f (|p|2 )
R3

a 3 a a

3 R3

|p|2 dp1 dp2 dp3 3m


2

ea|p| (p1 )2 dp1 dp2 dp3


2

e
R

aw 2 2

dw
R

eaw w 2 dw a
0

e
R

aw 2

N w dw = m 48

eaw w 2 dw.

Posant s = aw 2 , la dernire intgrale peut se calculer ainsi12 :


0

aw 2

1 w dw = 2a a
2

e sds =
s

1 2a a

3 2

1 = . 2a a 2

N U = . 3 4ma Comme on sait par ailleurs que U = 3N2kT , on en dduit que : N kT N = 4ma 2 a= 1 . 2mkT

on obtient donc

Nous avons obtenu la distribution de Maxwell pour une particule, dont la densit est : 1 |p|2 /2mkT . (x, v) = 3e || 2mkT Ce rsultat fournit une premire interprtation statistique de la temprature. Il est remarquable que lexposant de la fonction gaussienne soit Ec kT o Ec = |p|2 est lnergie cintique. 2m
N i=1

Nous en dduisons, en utilisant (2.6) et H(x , p ) mesure sur T N a pour densit (x , p ) = ||N 2mkT 1
3N

|pi |2 /2m, que la (2.12)

eH(x ,p )/kT .

2.6

Interprtation statistique de lirrversibilit

Nous avons vu dans ce qui prcde quune description probabiliste dun gaz permettait de faire des prdictions ecaces sur son tat macroscopique. On pourrait nanmoins rester un peu frustr de cette approche et considrer quelle nest quun pis-aller destin pallier temporairement nos trop faibles comptences calculatoires. Ce qui suit va montrer quau contraire lapproche probabiliste permet de rendre compte de certains phnomnes macroscopiques qui semblent trangers lapproche dterministe hamiltonienne.
On utilise la fonction (z) := z > 1.
12 x z1 x dx 0 e

et la relation (z) = (z 1)(z 1) si

49

2.6.1

Le paradoxe de Loschmidt

Considrons une certaine quantit de gaz enferme dans la moiti gauche dune enceinte divise en deux parties.

Fig. 2.3 Le gaz est conn dans une moiti de lenceinte. Si lon retire brusquement la sparation, le gaz va immdiatement se rpandre dans toute lenceinte. Lexprience quotidienne nous assure que jamais il ne reviendra spontanment se loger dans la demi-enceinte o il tait initialement conn. Si donc nous regardons un lm de lexpansion du gaz aprs que la sparation ait t retire, nous pourrons coup sr dire si ce lm est pass lendroit ou lenvers. En revanche, si nous pouvions voir un lm du mouvement dun petit nombre (trois ou quatre) des molcules du gaz prises sparment, rien ne nous permettrait de dcider si nous voyons le lm lenvers ou lendroit. Autrement dit, bien que les lois du mouvement des particules qui constituent le gaz soient rigoureusement invariantes par inversion du sens dcoulement du temps, nous observons lchelle macroscopique un phnomne irrversible. Cette contradiction apparente est connue sous le nom de paradoxe de Loschmidt13 . La rponse cette objection a t fournie par Boltzmann lui-mme, quelques annes plus tard. Il est indniable que si, aprs avoir t la cloison et laiss au gaz le temps datteindre son tat dquilibre o il occupe toute lenceinte nous transformions instantanment, par un procd inconnu, lensemble de toutes les vitesses des particules en leur oppos, alors, au bout dun laps de temps gal celui coul depuis le retrait de la cloison, le gaz irait se
Joseph Loschmidt publia en 1876, conformment la tradition de lpoque, une srie de critiques sur linterprtation molculaire de lentropie que L. Boltzmann avait expose en 1872.
13

50

concentrer entirement dans la moiti gauche de lenceinte. Cependant, un tel procd nexiste pas et mme sil existait, la moindre erreur dont serait entache linversion des vitesses se propagerait, par les collisions entre particules, extrmement vite lensemble du gaz et conduirait irrmdiablement un chec de lexprience14 . La seule exprience quil soit possible de faire est la suivante : prparer le gaz dans son tat dquilibre dans lenceinte complte, et attendre quil veuille bien aller se loger dans la moiti gauche. La seule chose que nous puissions contrler est ltat macroscopique du gaz, mais nous ne pouvons certainement pas prescrire son tat microscopique, cest--dire la position et la vitesse de chaque particule. Et sans doute, parmi tous les tats microscopiques qui correspondent ltat macroscopique o le gaz occupe toute lenceinte, il y en a un certain nombre qui, si on les laisse voluer, vont conduire un connement du gaz dans une moiti de lespace disponible. Mais combien y en a-t-il ? Lorsque nous prparons ltat macroscopique initial, quelle probabilit y a-t-il que nous prparions du mme coup un de ces tats microscopiques ? Le raisonnement grossier suivant nous donne un ordre dide de la rponse. Cherchons dans lensemble E des tats microscopiques correspondant une occupation de tout le volume le nombre de ceux qui voluent vers un connement du gaz en un temps T x. Lensemble C de ces tats est en bijection avec lensemble E1/2 des tats microscopiques qui correspondent une occupation de la moiti gauche de lenceinte. En eet, lcoulement du temps dnit un ot sur lensemble des tats microscopiques et loprateur qui correspond lcoulement dun temps T , compos avec lopration consistant retourner toutes les vitesses, envoie injectivement E1/2 sur C. Le nombre dtats microscopiques conduisant un connement est donc du mme ordre de grandeur que le nombre dtats microscopiques correspondant loccupation dune moiti de lespace15 . Pour chaque particule, la contrainte de se
Pour des explications plus dtailles ce sujet, voir le chapitre 14 du livre de J. Harthong. 15 noter ce propos que si lon faisait une exprience statistique analogue celle dcrite en 2.3, mais en ne puisant que des chantillons dans E1/2 (au lieu de E), on obtiendrait une mesure de probabilit 1/2 sur T N dirente de la mesure de Maxwell (une loi de probabilit conditionnelle). Il en rsulte que la mesure C est aussi dirente de . Et en particulier si T est susamment grand, C sera un exemple de mesure pour laquelle les lois de distribution de chaque particule sont identiques, mais ces lois ne sont pas indpendantes
14

51

trouver dans une moiti de lenceinte divise par 2 le nombre dtats possibles. Pour un ensemble de N particules, on a donc |C| 2N . |E| Cela rpond lobjection de Loschmidt : on ne peut absolument pas contrler ltat microscopique que lon prpare et on ne peut gure sen remettre au hasard pour le faire notre place, moins bien sr davoir la possibilit 23 de faire un nombre dessais de lordre de 210 . Cela nous claire aussi sur le sens de lexpression processus irrversible : il sagit dun processus dont le droulement rebours est non pas impossible en ce sens quil contredirait une quelconque loi physique, mais tellement peu probable quil est absolument in-vraisemblable. Pour bien comprendre ce point, on peut se demander : partir de combien de particules vues sur un lm se rassembler dans une moiti de lenceinte estimera-t-on que le lm a t projet lenvers ?

2.6.2

Fluctuations de la densit dun gaz

Nous allons maintenant nous intresser de faon plus gnrale aux uctuations du nombre de particules qui occupent une rgion donne lintrieur dune enceinte remplie de gaz. Considrons donc une enceinte contenant N molcules dun gaz parfait. Daprs la forme de la distribution de Maxwell, chacune de ces N particules est rpartie uniformment dans le volume de lenceinte, indpendamment de toutes les autres16 . Divisons par la pense notre enceinte, dont nous noterons V le volume, en 2 sous-enceintes de volumes respectifs V1 et V2 . Notons N1 et N2 les nombres respectifs de particules dans chacune des sous-enceintes. La
(et donc (2.6) est faux). 16 Bien entendu, dans la mesure o nous raisonnons dans le cadre de la mcanique newtonienne, chaque particule a une position bien dnie. Cependant, il est impossible de conna tre ltat microscopique du gaz un instant donn. Le sens de la description probabiliste de la position des particules est le suivant. Considrons un trs grand nombre (mme un nombre inni) denceintes identiques contenant chacune N molcules de notre gaz, et supposons que dans chaque enceinte ces particules soient numrotes de 1 N . Pour tout k m compris entre 1 et N , et pour tout entier m, notons k la position de la particule k dans lenceinte m. (On choisit bien entendu pour chaque enceinte un repre adapt, de telle sorte quelle corresponde une partie xe de R3 , indpendante de lenceinte.) Alors larmation que chaque particule est rpartie uniformment dans la bo te signie que,

52

somme de ces nombres est xe, gale N , mais chaque Ni est une variable alatoire de loi binomiale B(N, Vi /V ). En eet, chacune des N particules se trouve dans la i-ime sous-enceinte avec une probabilit Vi /V , que nous noterons dsormais pi , et ceci indpendamment de toutes les autres particules.

Fig. 2.4 Lenceinte est divise en 2 sous-enceintes. Ainsi, pour tout entier r1 compris entre 0 et N , on a
r P(N1 = r1 ) = CN1 pr1 (1 p1 )N r1 . 1

Lesprance de Ni est gale pi N . Nous allons tudier de quelle faon Ni uctue autour de cette valeur moyenne. Ainsi, un regroupement de toutes les particules dans une des sous-enceintes serait un exemple extrme de uctuation des Ni . Avant de nous lancer dans une tude prcise, commenons par voir ce que peut nous dire le thorme fondamental des probabilits en ce qui concerne les uctuations dune variable alatoire : le thorme de la limite centrale
pour tout k entre 1 et N , on a la convergence faible de mesures 1 M
M
m k = 1

m=1

dxdydz ||

lorsque M tend vers linni, cest--dire que pour toute fonction continue borne f sur , 1 M
M m=1 m f (k ) M

1 ||

f dxdydz.

Lindpendance se traduit de faon similaire.

53

(TCL)17 . En eet, N1 par exemple est la somme de N variables indpendantes de loi p1 1 + (1 p1 )0 . Le TCL arme que si N est assez grand (ou plutt : lorsque N tend vers linni), la variable alatoire (N1 p1 N )/ p1 (1 p1 )N a presque une loi gaussienne standard. Autrement dit, pour tout rel a > 0, on a18 2 2 et /2 dt. P(|N1 p1 N | a N ) 2 a Ce rsultat que des uctuations de N1 autour de sa valeur moyenne de dit lordre de a N sont trs improbables si a est grand mais pas si a est petit. En rsum, les uctuations de N1 autour de sa valeur moyenne sont de lordre de N . Si nous nous intressons aux uctuations relatives, cest--dire aux uctua tions de N1 /N autour de p1 , elles sont de lordre de 1/ N . Lorsque N est de lordre du nombre dAvogadro, les uctuations relatives sont de lordre de 1012 : pour dtecter les uctuations de pression dues lagitation molculaire dans un bocal dair au repos, il faudrait une sensibilit de lordre du milliardime de millibar. Nous allons maintenant aborder le problme sous un autre angle et calculer la probabilit dobserver des uctuations bien plus importantes, de lordre non plus de N , mais de N . Ces probabilits sont bien entendu extrmement faibles19 et nous allons montrer quelles dcroissent exponentiellement vite en fonction de N . Pour commencer, choisissons un rel q1 tel que p1 < q1 1 et estimons P(N1 /N > q1 ). Cela correspond une uctuation de N1 au-del de sa moyenne suprieure (q1 p1 )N . Nous avons P N1 q1 N =
rq1 N r CN pr (1 p1 )N r , 1

do on tire, en posant R = [q1 N ], la valeur minimale que doit avoir N1 pour


Ce paragraphe un peu informel ne dtermine pas ce qui suit. On nutilisera pas dans la suite le rsultat quon y nonce. 18 Nous avons ici dlibrment omis un facteur p1 (1 p1 ) qui ne joue aucun rle important pour ce qui nous intresse. 19 Ltude de ces uctuations trs rares sappelle la thorie des grandes dviations.
17

54

q Fig. 2.5 Le graphe de q q log 2/5 (1 q) log 1q . 3/5

raliser la uctuation laquelle on sintresse,


R CN pR (1 p1 )N R P 1

N1 q1 N

R (N + 1)CN pR (1 p1 )N R . 1

La dirence entre le minorant et le majorant dispara t lchelle logarithmique : 1 log P N N1 q1 N


N

1 R log CN pR (1 p1 )N R . 1 N

Il est maintenant facile dtablir que le second membre a une limite nie lorsque N tend vers linni et dobtenir le rsultat suivant20 : N1 1 log P q1 N N 1 N1 log P q1 N N
N

q1 log

On dmontrerait exactement de la mme faon que si 0 q1 < p1 , alors


N

q1 1 q1 (1 q1 ) log . p1 1 p1 q1 1 q1 (1 q1 ) log . p1 1 p1

q1 log

Par exemple, en prenant q1 = 0, on trouve une estimation de la probabilit que la premire sous-enceinte soit vide : P(N1 = 0) est de lordre de (1p1 )N . Si p1 = 1/2 comme dans notre problme initial, nous avons une probablit 23 22 de lordre de 210 103.10 .
20

Nous adoptons ici la convention 0 log 0 = 0.

55

2.6.3

Une premire approche statistique de lentropie

Les rsultats de dcroissance exponentielle obtenus au paragraphe ci-dessus ont des consquences trs importantes lchelle macroscopique. En eet, supposons que nous caractrisions ltat macroscopique de notre gaz par la proportion de particules se situant dans chaque sous-enceinte. Alors, comme N est trs grand, parmi lensemble des tats microscopiques possibles (on sintresse ici surtout aux positions des particules), une crasante majorit correspond des valeurs de N1 /N extrmement voisines de p1 . Cest en fait un phnomne trs gnral : lorsquon sintresse des grandeurs macroscopiques qui, comme A(x , p ) = i ai (x , p ), sont des sommes de grandeurs microscopiques (position, nergie cintique), il existe une valeur pour chaque grandeur macroscopique qui, une erreur prs, est ralise pour quasiment tous les tats microscopiques, sauf une fraction de lordre de 2 e N , o est un nombre positif de lordre de lunit21 . Autrement dit : la valeur moyenne de la grandeur microscopique est aussi celle qui est presque toujours ralise. On peut donc noncer le principe suivant : Un systme thermodynamique adopte lquilibre ltat macroscopique compatible avec le plus grand nombre dtats microscopiques , sous-entendu, parmi tous les tats macroscopiques compatibles avec les contraintes qui lui sont imposes. Nous voulons rapprocher cet nonc de celui du second principe de la thermodynamique dont une forme est : Un systme thermodynamique adopte lquilibre ltat macroscopique qui rend lentropie maximale. Cela suggre que lentropie associe un tat macroscopique est une fonction croissante du nombre dtats microscopiques qui conduisent cet tat. An de prciser cela, nous devons en prliminaire : dnir la liste des grandeurs dtat que nous utilisons pour caractriser un tat macroscopique. dnir clairement ce que nous entendons par nombres dtats microscopiques . Il y a l une dicult, puisquen principe lensemble
En gnral, est la drive seconde en un point critique dune fonction ordinaire , comme celle dont le graphe est reprsent la gure 2.5.
21

56

des tats microscopiques qui sont compatibles avec un mme tat thermodynamique macroscopique est un continuum (et donc a un cardinal inni, de la puissance du continu). La premire tche dpend du type dexprience que nous souhaitons raliser. Ici, dans un souci de simplication, nous supposerons que nous avons divis le domaine contenant un gaz dilu de N particules en deux sous-enceintes 1 et 2 , de volumes rexpectifs V1 := |1 | et V2 := |2 | et nous nous intresserons uniquement aux nombres de particules N1 et N2 qui se trouvent respectivement dans 1 et 2 un certain instant. Donc nous ne tenons pas compte de la pression et de la temprature et nous pourrons travailler dans la suite avec lespace des phases microscopique simpli N au lieu de T N , ignorant ainsi les degrs de libert des impulsions. Pour rsoudre la deuxime dicult, nous suivons la stratgie suivante, imagine par les physiciens : nous divisons le domaine reprsentant lenceinte en cellules trs petites (par exemple des cubes de taille ). Le nombre M de telles cellules sera de lordre de V /3 , o V est le volume de . Pour quune telle discrtisation ninduise pas trop de dformations par rapport au modle continu, il convient de choisir plus petit que la distance moyenne entre les particules, et donc, M plus grand que N . Numrotons les cellules par = 1, , M et dsignons les par q . Lide est de regrouper tous les tats microscopiques par paquets : deux tats microscopiques x et x dans N sont dans le mme pa quet si et seulement si ils correspondent au mme nombre de particules dans chaque cellule : [[1, M ]], |{i [[1, N ]]/xi q }| = |{i [[1, N ]]/xi q }|. Ensuite, tant donn un tat macroscopique , par exemple, spcier des valeurs (r1 , r2 ) pour les variables (N1 , N2 ), on compte le nombre de paquets dtats microscopiques qui sont compatibles avec ltat macroscopique correspondant. Pour formaliser un peu cela, nous introduisons un espace des phases discrtis intermdiaire, lensemble des applications de [[1, N ]] vers [[1, M ]] : := { : [[1, N ]] [[1, M ]]}. En eet presque tout tat microscopique x N nous pouvons associer lapplication dnie par la condition i [[1, N ]], (i) = o [[1, M ]] est lunique indice tel que xi q . 57

Autrement dit, tout tat microscopique x peut tre identi avec une application [[1, N ]] , et sobtient partir de x par la discrtisation de en M cellules. Le nombre total dtats est alors (N ) := Card = M N . Ensuite, pour un tat macroscopique caractris par (N1 , N2 ) = (r1 , r2 ), nous comptons combien dtats microscopiques dans sont compatibles avec cet tat macroscopique : si 1 et 2 sont rguliers, les nombres de cellules q dans respectivement 1 et 2 sont respectivement M1 p1 N et M2 p2 N (avec une approximation dautant plus bonne que est petit). Comme il y r r a M1 1 faons de rpartir r1 particules dans M1 cellules et M2 2 faons de rpartir r2 particules dans M2 cellules, le nombre dtats microscopiques est
1 ,2 (r1 , r2 )

N! M r1 M r2 . r1 !r2 ! 1 2

(2.13)

A ce propos, nous pouvons retrouver, laide de la formule de Stirling, une conrmation du fait dja illustr dans la section prcdente, que parmi les M N congurations dans , une crasante majorit de congurations correspondent (N1 , N2 ) (p1 N, p2 N ). Il sagit pour cela destimer (2.14) lorsque (r1 , r2 ) = (p1 N, p2 N ). Pour ce faire, dans un premier temps, nous avons, en utilisant p1 + p2 = 1, N! N N eN 2N (p1 N )!(p2 N )! pp1 N N p1 N ep1 N pp2 N N p2 N ep2 N 2p1 N 2p2 N 1 2 1 1 = . p1 p2 N 2p1 p2 N (p1 p2 )
p p Et comme M1 1 N M2 2 N = (p1 M )p1 N (p2 M )p2 N = (pp1 pp2 ) M N , nous en d1 2 duisons que MN 1 ,2 . (2.14) (p1 N, p2 N ) 2p1 p2 N N

Cette valeur dire de (N ) = M N , mais nous prtendons quelle est pra tiquement la mme ! Par l nous entendons que le facteur (2p1 p2 N )1/2 ne change pas lordre de grandeur. En fait cette observation est signicative parce que la quasi totalit des tats microscopiques correspondent des congurations o la dirence entre (N1 , N2 ) et (p1 N, p2 N ) est dordre infrieur N . Autrement dit et en rptant ce qui a t dit dans la section prcdente propos du paradoxe de Loschmidt, ds que r1 /N dire de faon signicative de p1 , le rapport 1 ,2 (r1 , r2 )/ 1 ,2 (p1 N, p2 N ) est extrmement petit 58

(plutt de lordre de 10N que de lordre N 1/2 ). Il est donc plus commode de comparer les logarithmes de ces nombres que ces nombres eux-mmes. Et comme les logarithmes de ces nombres sont encore gigantesques, il est aussi commode de les normaliser en les multipliant par une constante trs petite. Nous sommes ainsi conduits la Dnition 1 On appelle provisoirement entropie (cintique) dun systme thermodynamique lquilibre la quantit S 1 ,2 (N1 , N2 ) := k log
1 ,2 (N1 , N2 )

(2.15) 1, 3.10 23

o (N1 , N2 ) reprsente ltat macroscopique du systme, et o k est la constante de Boltzmann. Ainsi, pour (N1 , N2 ) = (p1 N, p2 N ), on obtient en utilisant (2.14) S 1 ,2 (p1 N, p2 N ) k log MN 2p1 p2 N

k = kN log M (log(2p1 p2 ) + log N ) . 2

En ayant en tte que dune part, N 1023 et donc log N 23 log 10 et, k dautre part, k est trs petit, nous voyons que 2 (log(2p1 p2 ) + log N ) est totalement ngligeable par rapport kN log M . Ainsi nous trouvons S 1 ,2 (p1 N, p2 N ) kN log M = k log
(N )

= S (N )

(2.16)

La prsence du logarithme dans cette dnition entra ne aussi lextensivit de lentropie, cause du facteur N devant le logarithme. De plus une autre vertu du logarithme est la suivante. En eet le nombre 1 ,2 (N1 , N2 ) dpend de . Par exemple si on divise par deux, ce nombre sera multipli par 23N et, 1 plus gnralement, pour ]0, 1[, ,2 (N1 , N2 ) 3N 1 ,2 (N1 , N2 ). Ainsi notre dnition de lentropie prsente le dsagrment de dpendre du choix de lchelle. Mais nous remarquons que, grce au logarithme, il en rsulte une indtermination de S une constante additive 3N k log prs. Cela est relativement satisfaisant, dans la mesure o, dans notre premire dnition de lentropie, nous admettions que la valeur de celle-ci soit indtermine une constante additive prs. 59

2.6.4

Le paradoxe de Gibbs

La dnition prcdente de lentropie soure dune incohrence, vis vis des proprits dadditivit que lentropie doit satisfaire. Appliquons en eet la dnition (2.15) de lentropie, aux deux sous-systmes 1 et 2 sparment. Nous obtenons, en supposant que (N1 , N2 ) = (p1 N, p2 N ),
N S 1 (p1 N ) = k log M1 1 = kp1 N (log M + log p1 )

et

N S 2 (p2 N ) = k log M2 2 = kp2 N (log M + log p2 ) .

Si le gaz dans 1 est lquilibre avec celui dans 2 , cest dire si N1 = p1 N et N2 = p2 N , lentropie du systme total S 1 ,2 (p1 N, p2 N ) doit tre la somme 1 des entropies des deux sous-enceintes S (p1 N ) + S 2 (p2 N ). Or nous avons estim lentropie du systme total lquilibre en (2.16) et nous avons trouv que S 1 ,2 (p1 N, p2 N ) kN log M = kN (log M + p1 log p1 + p2 log p2 ) = S 1 (p1 N ) + S 2 (p2 N ).

Cette contradiction est appele paradoxe de Gibbs. Pour mieux le comprendre, envisageons une situation un peu plus gnrale et estimons ce que donne notre dnition de lentropie pour des valeurs arbitraires de (N1 , N2 ) = (r1 , r2 ) : S 1 ,2 (r1 , r2 ) = k log
r S 1 (r1 ) = k log M1 1

N! r r M1 1 M2 2 , r1 !r2 !

r et S 2 (r2 ) = k log M2 2 .

Une faon de corriger ce dfaut consiste faire les substitutions 1 (r1 ) 1 ,2 1 2 2 (r1 , r2 ) 1 ,2 (r1 , r2 )/N !. (r1 )/r1 !, (r2 ) (r2 )/r2 ! et Ainsi nous adoptons une nouvelle dnition S de lentropie pour laquelle
S 1 (r1 ) = k log r M1 1 r1 !

S 2 (r2 ) = k log

r M2 2 r2 !

et
S 1 ,2 (r1 , r2 ) = k log

r r M1 1 M2 2 r1 !r2 !

Et lon obtient bien alors S 1 ,2 (r1 , r2 ) = S 1 (r1 ) + S 2 (r2 ) pour toute valeur (r1 , r2 ) des variables (N1 , N2 ) ! Observons que la substitution qui a t opre

60

consiste considrer non pas le nombre de faon de rpartir N particules numrotes de 1 N dans M bo tes, mais le nombre de faon de rpartir N particules indiscernables dans M bo tes. Cela signie que les particules sont indiscernables. Autrement dit ce raisonnement semble indiquer quil nest pas possible de numroter les particules ou de leur attribuer une individualit. Ce comportement un peu trange des particules sera conrm par la mcanique quantique : il savre que lindiscernabilit des particules est une proprit profonde de toutes les particules. En conclusion, nous sommes amens modier notre dnition de lentropie comme suit : Dnition 2 On appelle dnitivement entropie (cintique) dun systme thermodynamique lquilibre la quantit
S 1 ,2 (N1 , N2 ) := k log 1 ,2 (N1 , N2 )

N!

(2.17)

o (N1 , N2 ) reprsente ltat macroscopique du systme et N = N1 + N2 Exercice 5 1) Montrer que (r1 , r2 ) N2 tel que r1 + r2 = N , si r1 = p1 N et r2 = p2 N , alors S 1 ,2 (r1 , r2 ) (p1 , p2 ), o (p1 , p2 ) := kN (p1 log M1 + p2 log M2 p1 log p1 p2 log p2 log N + 1) . 2) Calculer la direntielle de . Dterminer le maximum de cette fonction lorsque lon impose la contrainte p1 + p2 = 1. 3) Retrouver le fait que supr1 +r2 =N S 1 ,2 (r1 , r2 ) S (N ) = k log M N /N ! . Remarque Nous avons vu propos du paradoxe de Loschmidt que ltat microscopique dun gaz isol lquilibre pouvait spontanment voluer vers un tat de dsquilibre, mais que la probabilit pour que cela ait lieu est extrmement petite. Cela a pour consquence que lentropie cintique peut trs bien diminuer. Cela semble tre en contradiction avec le second principe de la thermodynamique. En fait lentropie cintique que nous venons de dnir dire de lentropie de Clausius que nous avons dni au premier chapitre : les deux quantits ne co ncident qu la limite thermodynamique cest dire lorsque lon considre que le nombre de particules N tend vers linni. 61

2.7

Conclusion

Nous avons donc retrouv un certain nombre de lois qui avaient t tablies exprimentalement pour les gaz parfaits, par des estimations probabilistes sur la dynamique dun gaz de particules lastiques dilu. Lapproximation faite nest bien videmment pas tout fait satisfaisante, puisque nous avons nglig les chocs entre particules, alors que nous pressentons intuitivement que les chocs entre particules devraient jouer un rle capital. En eet, cest par ces chocs que les particules changent de lnergie et se rpartissent entre elles toute lnergie cintique dune faon peu prs uniforme : une particule beaucoup plus rapide que les autres sera freine par ses chocs avec ses camarades particules, tandis quune particule qui a tendance rester sur place a de fortes chances dtre rveille brutalement par une collision. Cest donc la comprhension du mcanisme de marche vers lquilibre du gaz qui nous chappe pour linstant. Par ailleurs le modle probabiliste que nous avons utilis mne dans certains cas quelques incohrences apparentes : dans la section 2.3 nous avions fait lhypothse que nous observions un trs grand nombre dchantillons identiques de gaz qui ont les mmes proprits macroscopiques. Donc en particulier, chacun de ces chantillons a la mme temprature T . Or nous avons aussi tabli que lnergie totale U valait 3 N kT . Nous en dduisons que nos 2 chantillons ont tous la mme nergie et donc quils correspondent tous des solutions des quations de Hamilton avec la mme valeur de lhamiltonien N |pi |2 H(x , p ) i=1 2m . Autrement dit tous les chantillons ont des tats mi3 croscopiques situs dans la mme hypersurface H(x , p ) = 2 N kT de T N (qui ici est le produit de N par une sphre dans R3N ). Donc la mesure de probabilit doit tre concentre sur cette hypersurface et en particulier sannuler en dehors de lhypersurface. Cela nest videmment pas compatible avec le rsultat (2.12) que nous avons obtenu sur la distribution de Maxwell. Quelle est lexplication de ce paradoxe ? Il y a une erreur de raisonnement ici 3 car en fait, cest la moyenne U qui vaut exactement 3 N kT et rien noblige ce que chaque chantillon ait exactement une nergie gale U . Mais nous avons nanmoins montr quil tait extrmement probable pour U soit trs proche de U . Cela rvle lexistence de deux points de vue possibles : si le gaz dilu nest pas isol, mais en contact avec un thermostat qui maintient sa temprature constante, alors lnergie totale nest pas ncessairement constante ( cause des ventuels changes dnergie avec le thermostat) et la 62

distribution de Maxwell22 dcrit correctement ltat statistique du gaz. En revanche si le systme est parfaitement isol, la mesure est bien concen3 tre23 sur lhypersurface H(x , p ) = 2 N kT et la distribution de Maxwell ne convient pas. Dans ce dernier cas, nous devons utiliser un autre modle et donc partir dune hypothse dans laquelle on ne suppose pas forcment que chaque particule a une loi de probabilit indpendante des autres. Donc, pour un gaz isol, nous aurons besoin demployer une mesure de probabilit sur T N concentre sur une hypersurface H(x , p ) = E (o E est une constante). Nous ferons alors lhypothse que : La mesure a pour support lhypersurface H(x , p ) = E et a une densit constante par rapport la mesure naturelle sur cette hypersurface. La mesure naturelle sera prcise dans le prochain chapitre et est construite partir de la forme symplectique sur T N . Cette hypothse conduit ce que lon appelle le formalisme micro-canonique. Il nous faudra alors trouver dans un deuxime temps un moyen pour justier que des prdictions faites grce cette hypothse, sur la base de raisonnements probabilistes (et donc en principe ne sappliquant qu une moyenne sur une collection trs grande dchantillons tirs au hasard) entra nent des prdictions valables sur un seul chantillon ! Dans le cas du gaz dilu, nous avions russi dans la section 2.3 le faire grce lhypothse dindpendence des lois de chaque particule et en utilisant le fait que le nombre N de particules est trs lev, grce la loi des grands nombres. En labsence dhypothse dindpendance des lois de probabilit de chaque particule, nous aurons besoin de lhypothse ergodique. Enn nous avons vu une premire interprtation statistique de lentropie, dans le cadre de la distribution de Maxwell. Nous aurons besoin dans la suite de gnraliser ces ides dans le cadre du formalisme micro-canonique (ou pour dautres cadres plus gnraux). En fait, en apportant une rponse cette question, Ludwig Boltzmann a fait de lentropie la clef de voute de la physique statistique.
22 23

ou plus gnralement une thorie canonique, voir plus loin ce qui correspondra une thorie micro-canonique, voir plus loin

63

Rfrences : W. Greiner, L. Neise, H. Stcker, Thermodynamique et mcanique statistique, Springer. J. Harthong, Probabilits et statistiques, Diderot Multimdia 1996 ou : http ://moire4.u-strasbg.fr/bouquins/proba/tabmat1.htm

64

Chapitre 3 Mcanique statistique avec interactions entre les particules


3.1 Lensemble micro-canonique

Notre but est ici de btir une thorie statistique applicable un systme isol et susceptible de tenir compte des interactions entre particules. La premire tape pour cela est de construire un espace des phases du type T N avec une famille dpendant du temps de mesures de probabilit (t )tR qui dcrit statistiquement les tats microscopiques dune collection innie dchantillons de gaz, choisis au hasard , au cours du temps t. Ensuite nous verrons comment l hypothse ergodique justie le fait que lon modlise un seul systme par une telle mesure. Mais pour quune telle description probabiliste soit signicative, il faut avant tout que tous les chantillons possdent les mme caractristiques thermodynamiques.

3.1.1

Le choix de lespace des phases

Ici il y a lieu de sinterroger : les grandeurs dtats (par exemple pour un gaz dans une enceinte V, p, T, N ) de chaque chantillon de la collection devraient heuristiquement tre toutes identiques. Cela ne pose pas de problme en principe raliser en ce qui concerne le voume V et le nombre de particules N . Et donc, si le systme est lquilibre thermodynamique, il surait alors de xer T ou p (compte tenu de la relation dtat entre V, p, T et N ). Mais le problme est que la pression et la temprature ne sont dnies qu lquilibre. Or nous avons vu, propos du paradoxe de Loschmidt, quun gaz isol 65

mme sil est lquilibre thermodynamique peut en principe voluer hors de lquilibre thermodynamique (par exemple si toutes les particules viennent se loger dans une fraction du volume), mme si la probabilit pour que cela ait lieu est extrmement faible. Cela signie quen thorie lquilibre thermodynamique nest pas stable ! Cela na aucune incidence en pratique. Mais en thorie, et dans la mesure o nous envisageons des expriences par la pense faisant intervenir une innit dchantillons, nous ne pouvons pas exclure les dviations de lquilibre. Ici nous sommes sauvs par lnergie U . En eet lquilibre, grce la relation dtat entre V, p, T et N et la relation donnant U en fonction de V, p, T et N , nous pouvons aussi caractriser ltat thermodynamique du gaz en spciant V , N et U . Lavantage est que lnergie U du gaz est dnie mme en dehors de lquilibre (puisquen particulier U gal la valeur de lhamiltonien microscopique). Ainsi, suivant L. Boltzmann, nous sommes conduits dnir pour tout ouvert R3 (enceinte contenant le gaz) et pour toutes valeurs de N N et E R lensemble micro-canonique : cest lensemble de toutes les congurations microscopiques que peut adopter un gaz de N particules identiques contenu dans et dnergie totale E. En termes plus mathmatiques, aprs avoir spci lhamiltonien H : T N R, nous dnissons lensemble micro-canonique comme tant lhypersurface HE := {(x , p ) T N /H(x , p ) = E}. Une variante qui sera trs utile est de considrer lensemble des tats microscopiques sur lequel lhamiltonien prend des valeurs comprises entre E et E + E
E+E TE := {(x , p ) T N /E < H(x , p ) < E + E},

o E > 0 est trs petit1 . Remarquons enn que la traduction gomtrique du fait que lnergie soit conserve au cours du temps est que le champ de vecteur H est tangent aux hypersurfaces HE , cest dire dH(H ) = 0. Cela entrane que toute courbe intgrale de H est tangente une hypersurface HE .
1

nous verrons en section 3.4.3 comment choisir E en fonction de E

66

Enn, dans un certain nombre dexemples, comme un gaz monoatomique, nous avons vu propos du paradoxe de Gibbs que nous devons remplacer N N lespace des phases T N par la varit quotient T S , o S est le produit symtris de , N fois par lui-mme, cest dire :
N S := {x = (x1 , , xN ) N }/N ,

o N est le groupe des permutations de N lments. Par consquent, dans E+E le formalisme microcanonique, nous remplacerons HE par HE /N et TE E+E par TE /N . Toutefois, dans la suite et lorsquil ne sera pas nssaire de quotienter par N , nous travaillerons dans T N , an de simplier les nota tions.

3.1.2

Reprsentation dun tat par une mesure

Lide est ici de reprsenter un tat macroscopique en volution2 au cours du temps (et donc qui nest pas ncessairement lquilibre) par une famille E+E de mesures (t )tR sur HE ou TE , selon le modle envisag. Pour cela nous imaginons une famille de N systmes physiques en volution, qui sont tous, chaque instant t, dans le mme tat macroscopique et choisis au hasard . Numrotons chacun des chantillons par I = 1, , N et notons (xI , pI ) : R T N le chemin dcrivant lvolution de lchantillon I au cours du temps. Bien entendu chaque (xI , pI ) est une solution des quations de Hamilton. Pour toute fonction observable f C 0 (T N , R), nous sup posons que t R, la limite f
t

:= lim

N I=1

f (xI (t), pI (t)) N

(3.1)

existe. Cela dnit une mesure de probabilit t et nous noterons f (x , p )dt := f


t .

T N

Il y a, dans cette dnition, une part dempirisme, puisque cest la fortune qui va dcider des tats de chaque systme choisis au hasard . Nous verrons un peu plus loin quelques raisonnements thoriques, sappuyant sur lhypothse
2

volution que nous aurons besoin de suppposer quasi-statique un peu plus tard

67

ergodique, permettant dans certains cas de caractriser cette mesure. Remarquons que la famille (t )tR ne peut pas tre arbitraire, puisque chaque chantillon volue de faon hamiltonienne. Notons etH tR le ot du champ de vecteur H , cest dire la famille de diomorphismes etH : T N T N telle que e0H soit lidentit et t etH = H etH . Alors pour tout sous-ensemble mesurable C T N , et pour tout instant t R, tous les chantillons qui se trouvent dans C linstant 0, et seulement ces chantillons, sont dans etH (C) linstant t. Comme la proportion des chantillons qui se trouvent dans C linstant 0 est 0 (C) et que la proportion des chantillons qui se trouvent dans etH (C) linstant t est t etH (C) , on en dduit que
C t

Fig. 3.1 Convection dun ouvert C par le ot de H

Si nous notons etH t la mesure dnie pour tout sous-ensemble mesurable C T N par etH t (C) := t etH (C) , alors la relation (3.1.2) signie que 0 = etH t , t R. Enn la condition (3.2) sur (t )tR est aussi quivalente f C 0 (T N , R),
T N

t R,

0 (C) = t etH (C) .

(3.2)

f etH d0 =

f dt .
T N

(3.3)

Cette quation, consquence de la conservation de la quantit de matire, traduit la conservation de la densit de probabilit.

3.1.3

La construction dune mesure dcrivant ltat dquilibre

Nous nous intressons ici un systme macroscopique lquilibre thermodynamique et nous cherchons faire des prdictions thoriques sur toute famille 68

de mesures (t )tR modlisant lvolution dun tel systme. Nous commenons par analyser les proprits que doit satisfaire une telle mesure. le support de t est contenu dans lensemble des tats microscopiques : E+E HE ou TE , selon le modle envisag. puisque le gaz est lquilibre, la mesure de probabilit t ne dpend pas du temps. Donc, daprs ce qui prcde, il existe une mesure de probabilit sur T N telle que t R, t = . En vertu de (3.2), cela nest possible que si etH ne dpend pas du temps t. Do la condition ncessaire sur : d etH () =0 dt

LieH = 0.

(3.4)

Or sur toute varit symplectique (T N , ) de dimension 2n (o est la forme symplectique) il existe une mesure qui satisfait la relation (3.4) pour nimporte quel champ de vecteur hamiltonien H . Cest la mesure Liou := (1)n n = (1)n . n! n!

En eet nous avons vu la section 2.1.3 que LieH = 0. Et comme (exercice) LieH n = n (LieH ) n1 , il est immdiat que LieH Liou = 0. Ce rsultat est d Liouville et Liou sappelle la mesure de Liouville. Remarquons aussi que la mesure de Liouville est celle dont lexpression est la plus simple dans les coordonnes (x, p) : Liou = (1)
n n

n!

= dp1 dpn dx1 dxn .

Revenant T N , nous avons donc ici un candidat naturel pour notre mesure E+E de probabilit sur TE : la mesure 1 1 3N := Liou = , Z Z (3N )! o Z =
E+E TE

3N (3N )!

(Z est la constante de normalisation.) Dans le cas o nous travaillons sur HE , nous obtenons une mesure concentre sur HE et galement invariante 69

par le ot de H en prenant la limite de la mesure prcdente lorsque E tend vers 0. Cette limite est gale := 1 X Z Liou = 1 X Z 3N , (3N )!

o X : HE T R3N est un champ de vecteur rgulier dni le long de HE tel que dH(X) = 1 partout et Z := HE X 3N /(3N )! est la constante de normalisation (voir exercice ci-dessous). Exercice 6 Soit C un ouvert dans HE . Soit X : HE T R3N un champ de vecteur rgulier dni le long de HE . On suppose que dH(X) = 1 partout (en particulier X est donc transverse HE ). Soit, pour E > 0 susamment petit C E := {m + sX(m)/m C, s R, E < H(m + sX(m)) < E + E}. 1) Montrer que limE0 Liou (C E )/E = X Liou (C E ). 2) Montrer que si X : HE T R3N est un autre champ de vecteur tel que dH(X ) = dH(X) = 1, alors X Liou|HE = X Liou|HE .

3.1.4

Existe-il dautres mesures dcrivant lquilibre ?

E+E Nous avons construit une mesure de probabilit sur HE ou TE qui est invariante par le ot de H . A prsent reste la question : cette mesure estelle la bonne ? reprsente-elle la rpartition statistique que choisirait la nature pour un gaz lquilibre ?

An de rpondre cette question nous devons nous demander sil existe une autre mesure qui soit une mesure de probabilit dont le support est HE E+E ou TE et qui soit invariant par H . Pour simplier, nous allons supposer dans un premier temps que = , o C 1 (T N , [0, [) est une densit E+E et, pour xer les ides, nous allons travailler dans TE . La condition que est une mesure de probabilit signie alors simplement que = 1

E+E TE

et la condition LieH = 0 donne, en utilisant LieH = 0 (voir aussi la section 3.3.1) : 0 = LieH () = d(H ) 70 d(H ) = {, H} = 0.

A premire vue on aurait envie de dire quil y a beaucoup de solutions : il surait de choisir une hypersurface S transverse au champ de vecteur H , de choisir arbitrairement une fonction 0 sur S et de prolonger 0 par la fonction en dehors de S de faon ce que la valeur de sur une trajectoire hamiltonienne soit constante et gale la valeur prise par 0 au point dintersection de la trajectoire avec S. Mais cette construction ne marche pas en gnral. Pourquoi ? Nous navons pris en compte que le comportement local des trajectoires hamiltoniennes, mais rien ne nous dit que la trajectoire ne va pas revenir au bout dun certain temps et couper S un autre endroit. Bien au contraire, le thorme de rcurrence de Poincar semble suggrer que cela risque de se produire un grand nombre de fois. Et cela impose que 0 doit prendre les mmes valeurs sur tous les points dintersection dune trajectoire avec S. Exercice 7 On considre le tore T 2 := R2 /Z2 . Pour tout (x, y) R2 on note [x, y] sa classe dquivalence dans T 2 . Soit R \ Q. On considre le champ de vecteur sur T 2 dni par ([x, y]) := (, 1), [x, y] T 2 et la mesure = dxdy. Soit : T 2 [0, [ une densit continue, soit := et soit 0 la restriction de R Z/Z2 . 1) A quelle condition sur a-t-on Lie = 0 sur {[x, y]/x R, y [0, 1[} ? 2) A quelle condition sur a-t-on Lie = 0 sur T 2 ? Conclure. Dans lexercice prcdent, la proprit fondamentale du ot de est son ergodicit. Cest elle qui entrane le rsultat de la question 2), car elle implique une proprit de rcurrence des trajectoires bien plus forte que celle nonce par le thorme de Poincar.

3.2
3.2.1

Lergodicit
Flots ergodiques

Soit (X, b, ) un espace topologique sparable muni dune mesure borlienne. Soit (t )tR une famille dapplications continues X X dpendant continument de t et dnissant un ot t qui prserve , cest--dire que pour tout B b, (1 (B)) = (B). On suppose que, pour tous t, s R, t t+s = t s . Lexemple que nous avons en tte est bien entendu un espace 71

des phases muni de la mesure de Liouville et dun ot hamiltonien. Pour un tel ot, le thorme de Poincar snonce comme suit. Thorme 1 (Poincar, 1889) On suppose que (X) < . Soit B une partie borlienne de b. Alors, pour presque tout x appartenant B, la borne suprieure (resp. infrieure) de lensemble {t R | t (x) B} est + (resp. ). Lhypothse (X) < est essentielle : pour sen convaincre, on peut essayer dappliquer le thorme X = R muni de la mesure de Lebesgue et t (x) = x + t. Dans le cas qui nous intresse, la mesure de Liouville de lespace des phases est nie, parce que lnergie du systme est xe (le vrier !). On suppose dsormais que (X) est ni et, quitte normaliser , on suppose que (X) = 1. On dit alors que le ot est ergodique si toute partie borlienne B de X telle que 1 (B) = B pour tout t R vrie (B) = 0 t ou (B) = 1. Autrement dit, un ot ergodique ne laisse aucune partie nontriviale (au sens de la mesure) invariante3 . La proprit fondamentale des ots ergodiques est la suivante. Thorme 2 (Birkho, 1931) Soit un ot ergodique sur (X, b, ). Soit f une fonction de L1 (X, ). Pour tout x X et tout T R+ , on pose
fT (x) =

1 T

f (t (x)) dt.
0

Alors, pour tout T R+ , fT est une fonction de L1 (X, ) et la convergence fT

f d
X

a lieu -presque partout dune part et dans L1 (X, ) dautre part.


On montre facilement que cette proprit est quivalente la suivante, apparemment un peu plus faible : toute partie borlienne B de X telle que (1 (B) B) = 0 pour t tout t R vrie (B) = 0 ou (B) = 1, o on a utilis le symbole pour la dirence symtrique.
3

72

Birkho est en fait parti de la conclusion de ce thorme, qui tait admise plus ou moins implicitement dans beaucoup de calculs de physique statistique. Ce quil a donc dcouvert, cest sous quelle hypothse remarquablement simple sur le ot elle tait vrie. Cependant, il ne faut pas sy tromper : il est souvent dicile de prouver quun ot est ou nest pas ergodique. Lhypothse ergodique de la mcanique statistique peut sexprimer comme suit : Pour tout E > 0, le ot hamiltonien est ergodique sur lhypersurface H E E+E ou sur la tranche TE . Pour discuter cette hypothse, remarquons tout dabord que si est un ot ergodique et si f L1 (X, ) est invariante, cest--dire si f t = f pour tout t R, alors f est constante presque partout. (Le vrier !). Dans le cas o f est continue et o supp = X, cela peut se voir comme une consquence de la proprit de rcurrence suivante, qui renforce le thorme de Poincar. Proposition Soit un ot ergodique sur (X, b, ). Pour presque tout x X, la trajectoire de x repasse dans tout ouvert de X de mesure strictement positive des temps arbitrairement grands, positifs et ngatifs. En particulier, ladhrence de {t (x), t R} est gale au support de . Pour le ot hamiltonien sur HE , qui reprsente lvolution dun systme mcanique, cela signie quaucune quantit autre que lnergie totale du systme nest conserve au cours du mouvement : il ny a aucune autre intgrale premire du mouvement que lnergie. Cela est par exemple incompatible avec un modle microscopique de particules qui signorent et ne se rencontrent pas. En eet, dans un tel systme, les nergies cintiques de chacune des particules seraient inchanges au cours du temps, donc seraient des intgrales premires. Nous pouvons en conclure que les interactions entre les particules sont essentielles lorsquon sintresse lergodicit du ot hamiltonien. Y. Sinai a dmontr que le ot correspondant au mouvement de sphres dures qui se choquent et rebondissent lastiquement dans une enceinte est ergodique. Cependant, ce modle est trs simpli et on ne sait dmontrer pour aucun hamiltonien plus raliste que le ot correspondant est ergodique. Revenons notre problme initial, qui tait de dterminer si la mesure de Liouville tait la bonne mesure invariante pour le ot etH sur une hypersurface dnergie. Lhypothse que etH est ergodique pour nous permet 73

dapporter un lment de rponse. En eet, soit une autre mesure sur lhypersurface invariante par le ot hamiltonien. Alors se dcompose par rapport en une partie absolument continue et une partie singulire. On vrie que ces deux parties sont invariantes par le ot (le faire !) et que la partie absolument continue est proportionnelle . En eet, si est invariante, alors est une fonction L1 invariante, donc constante presque partout. Si nous excluons des mesures singulires par rapport la mesure de Liouville, la seule mesure invariante, donc correspondant lquilibre, est donc elle-mme.

3.2.2

Autres applications de lhypothse ergodique

Une reformulation de lhypothse ergodique pour un gaz est la suivante. Pour tout ouvert C T N et pour toute condition initiale (x0 , p0 ) pour la conguration microscopique du gaz, soit (x , p ) : R T N la solution des quations de Hamilton avec (x (0), p (0)) = (x0 , p0 ). De faon similaire (2.4) nous considrons |{t [0, t]/(x (t), p (t)) C}| . t t Alors lhypothse ergodique signie que (C) = (C), C. (C) := lim (3.5)

En plus de garantir que la mesure de probabilit construite partir de la mesure de Liouville est la seule qui puisse dcrire statistiquement lquilibre, lhypothse ergodique sert aussi justier et largir le champ dapplication de la modlisation statistique au cas dun seul chantillon. Lide repose sur le fait que la convergence de la limite dnie en (3.5) est susament rapide. Pour cela, nous posons, pour tout t > 0 |{t [0, t]/(x (t), p (t)) C}| . t Et nous faisons lhypothse ergodique forte :
t

(C) :=

Pour tout ouvert C T N , lapproximation (C) = (C) valable mme si lintervalle de temps t est petit.

(C) est

Par petit on entend ici de lordre de grandeur du temps ncessaire pour raliser une mesure (de lordre de la seconde). Cette hypothse est-elle valable ? Cherchons analyser le pour et le contre : 74

dun ct la trs grande rapidit des mouvements des particules dun gaz plaide en faveur de cette hypothse dun autre ct lespace T N est lui-mme gigantesque et il nous semble4 qu cause de la taille et de la dimension gigantesque de cet espace, le temps t partir duquel lapproximation de (C) par une moyenne sur une dure t est bonne est trs grand. Une estimation grossire de ce temps peut tre donne par le thorme de rcurrence de Poincar et donne en eet une valeur de t elle aussi gigantesque. cette mauvaise nouvelle doit tre tempre par ce que le paradoxe de Gibbs nous a appris, savoir que les particules sont indiscernables. Ainsi, si lhamiltonien H sur T N est invariant par les substitutions des particules entre elles, nous devons remplacer lespace des phases N N T N par la varit quotient T S , o S est le produit symtris de , N fois par lui-mme :
N S := {x = (x1 , , xN ) N }/N ,

o N est le groupe des permutations de N lments. Cela a pour eet de diviser le volume de lespace des phases par N !, un facteur qui est loin dtre petit ! enn il faut probablement essayer de tenir compte aussi dune persistance du phnomne de mlange mis en vidence dans le cas dun gaz dilu, mme en prsence dintractions. En ralit nous (les auteurs de ce texte) devons avouer ici notre ignorance dune justication rellement satisfaisante. Lhypothse ergodique forte telle que nous lavons nonce nest peut-tre pas ncessaire (et peut-tre mme fausse) et pourrait tre remplace par une version un peu moins forte. En eet, nous ne sommes pratiquement jamais capables de mesurer ltat microscopique dune gaz : la plupart des observations (sinon toutes) se font par le biais de grandeurs dtat A C 0 (T N , R) que nous cherchons valuer. Et ces fonctions sont de la forme A(x , p ) = N a(xi , pi ). Donc il i=1 surait en fait que lhypothse ergodique forte ne soit vrie que pour des ouverts C T N cylindriques , cest dire de la forme T N N (T )j q (T )N j1 , j=1
4

aux auteurs de ce texte

75

o q est un ouvert de T N (le cas chant il faut remplacer un tel ouvert par son image dans le quotient par N ). En admettant que lhypothse ergodique forte est vraie pour des ouverts cylindriques, ce que nous ferons dans la suite, nous pouvons en dduire les consquences suivantes. Observables Considrons une grandeur dtat A C 0 (T N , R) et ima ginons que nous fassions une mesure de A sur un seul chantillon dun gaz, dans un tat microscopique (x , p ) T N , pendant un certain intervalle de t+t 1 A(x (t), p (t))dt. temps t, relativement bref. Cela donne le rsultat t t t+t 1 Avec quel degr de certitude peut-on dire que t t A(x (t), p (t))dt = A ? Nous avons vu au chapitre prcdent que, dans le cas dun gaz dilu, lgalit t+t 1 A(x (t), p (t))dt A t t est extrmement probable. Dans un cas plus gnral, la justication quune telle galit a lieu presque srement est plus dlicate obtenir. Si nous supposons que A est de la forme A(x , p ) = N a(xi , pi ), alors nous di=1 duisons de lhypothse ergodique forte pour les ouverts cylindriques que, si t (x (t), p (t)) est une solution des quations de Hamilton, 1 t
t+t t

A(x (t), p (t))dt

A ,

avec une trs forte probabilit. Gaz en dehors de lquilibre Nous pouvons tendre lhypothse ergodique forte, pour les ouverts cylindriques, des systmes en volution quasi-statique (cest dire en fait, en trs lger dsquilibre). Pour cela nous dnissons, pour tout temps t et pour tout ouvert C T N , |{s [t, t + t]/(x (s), p (s)) C}| , t o t est un intervalle de temps petit lchelle macroscopique et grand pour les chelles microscopiques. Lhypothse est alors que, pour tout temps t et pour tout ouvert C T N cylindrique,
t t (C)

:=

t t (C)

t (C), 76

o t est la mesure par (3.1).

3.3
3.3.1

Applications du formalisme micro-canonique


Dynamique dune volution quasi-statique

Adoptant lhypothse ergodique forte pour les ouverts cylindriques, nous sommes capables de modliser lvolution quasi-statique dun gaz par une famille (t )tR de mesures. Nous avons vu que, cause de la conservation de la matire, cette famille soit satisfaire la condition (3.2) ou (3.3). Nous allons revisiter cette condition en faisant lhypothse supplmentaire que, pour tout t, la mesure t est rgulire par rapport la mesure de lquilibre (construite partir de la mesure de Liouville). Plus prcisment nous supposons quil existe une famille de densits (t )tR , telle que

t R,

t = t

et (t, x , p ) t (x , p ) est une fonction de classe C 1 . Nous allons en dduire une quation dvolution sur la densit t . Pour simplier les calculs, E+E nous allons travailler sur TE (donc dans ce qui suit, sannule en dehors E+E de TE ).
E+E 1 Pour toute fonction f Cc (TE , R) ( support compact), nous avons dune part :

d f dt

d dt

f t d
T N

=
T N

dt d. dt

(3.6)

77

Et dautre part, d f dt
t

d = dt = = = = lim

N N I=1 N I=1

lim

N I=1

f (xI (t), pI (t))

df(xI (t),pI (t)) H (xI (t), pI (t)) {f, H}(xI (t), pI (t))
t

lim

(3.7)

{f, H}
T N

{f, H}t d
T N

=
T N

{f t , H}d

{t , H}f d.

A prsent nous prtendons que {f t , H}d = 0. (3.8)

T N

En eet,
N 3

{f t , H} = =

i=1 =1 N 3

(f t ) H (f t ) H pi, xi x pi, i pi, f t H x i x i f t H pi, .

i=1 =1

E+E Et, en intgrant cette quantit sur TE et en utilisant le fait que le support de f est compact, on obtient (3.8) par la formule de Stokes. Ainsi (3.7) d entrane que dt f t = T N {t , H}f d. En comparant avec (3.6), on en dduit que 1 E+E f Cc (TE , R),

f
T N

dt d = dt

T N

{t , H}f d. (3.9)

Cela nest possible que si

dt = {H, t }. dt Cette quation dcrit lvolution au cours du temps de la densit t . 78

3.3.2

Le gaz dilu lquilibre

Pour un gaz dilu lquilibre nous faisons, comme au chapitre prcdent, lhypothse que lon peut ngliger les chocs. Cela revient donc adopter sur N 2 lespace des phases T N lhamiltonien H(x , p ) = i=1 |pi | /2m. Alors lensemble micro-canonique est
N

HE := {(x , p ) T

N /

i=1

|pi |2 /2m = E}

cest dire le produit de N par la sphre de rayon 2mE dans R3N . Avec la distribution de Maxwell nous avions calcul que, pour un gaz dilu lqui3 libre la temprature T , la valeur moyenne de lnergie U tait 2 N kT . 3 Nous allons donc supposer ici que E = 2 N kT . La mesure de probabilit sur HE est alors 1 = Z X n n!
N 3

,
|HE

o X :=
i=1 =1

pi,

. pi,

Notant R := 2mE = 3N mkT et renumrotant pour simplier (x , p ) = xA , pA A[[1,3N ]] , nous avons = pA 1 3N 1 |S 3N 1 | R R pA A=1
3N

dp1 dp3N

1 dx1 dx3N ||N

,
|HE

o, pour tout n N, nous notons S n1 := {p Rn /|p| = 1} et |S n1 | est le volume de S n1 . Un calcul de mesure image Nous allons prsent nous intresser N1 particules dans le gaz et chercher la mesure de probabilit sur les variables de positions et dimpulsion de ces N1 particules. Nous noterons N2 := N N1 . Ici nous oublions momentanment notre rsolution prise aprs avoir vu le paradoxe de Gibbs et nous suppposons les particules discernables. Nous noterons les coordonnes de positions et dimpulsion de ces N1 particules sous la forme xA , pA A[[1,3N1 ]] . Il sagit donc de calculer la mesure N1 sur les variables de positions et dimpulsions xA , pA A[[1,3N1 ]] , qui est limage de 79

par la projection de T N sur T N1 . Il est clair que N1 = N1 1 dx1 dx3N1 , ||N1

o N1 est la mesure sur R3N1 qui est limage de R3N 1 1 3N 1 | 3N pA pA dp1 A=1 R |S dp3N . En particulier le support de N1 est contenu dans ladhrence de 3N la boule BR 1 := {p R3N1 /|p| R}. 3N Pour calculer N1 , nous considrons la paramtrisation suivante de SR 1 , la sphre de rayon R dans R3N = {(p, q) R3N1 R3N2 } : 3N : BR 1 S 3N2 1 (p, u) (p,

R3N R2 |p|2 u).

3N La mesure N1 est caractrise par : f C 0 (BR 1 ),

BR

3N1

f (p)dN1 (p) = = =

3N SR 1

f (p)d(p, q) f (p)( d)(p, u) f (p)|Jac(d)(p,u) |(dp)3N1 d(u),

3N BR 1 S 3N2 1 3N BR 1 S 3N2 1

3N o est la mesure euclidienne sur S 3N2 1 . En un point (p, u) BR 1 S 3N2 1 , 3N choisissons une base orthonorme ( 1 , , 3N1 , e1 , , e3N2 1 ) de T(p,u) BR 1 S 3N2 1 telle que ( 1 , , 3N1 ) soit une base orthonorme de R3N1 et (e1 , , e3N2 1 ) soit une base orthonorme de Tu S 3N2 1 . Alors ( 1 , , 3N1 , e1 , , e3N2 1 , u) est une base orthonorme de R3N et la matrice jacobienne de d(p,u) (applica3N tion de T(p,u) BR 1 S 3N2 1 vers R3N ) scrit en utilisant ces deux bases :

Jac(d)(p,u)

Ici |Jac(d)(p,u) | est la norme euclidienne du vecteur dont les composantes sont tous les mineurs (N 1)(N 1) extraits de Jac(d)(p,u) . Cette quantit est aussi gale la valeur absolue du dterminant de la matrice N N obtenue 80

13N1 0 = t p/ R2 |p|2

0 R2 |p|2 13N2 1 . 0

3N ( cause du fait que ce vecteur est de norme 1 et orthogonal T(p,u) SR 1 ). On trouve ainsi (le calcul peut aussi tre simplier en choisissant la base ( 1 , , 3N1 ) de faon ce que p = |p| 1 ) que

en ajoutant Jac(d)(p,u) le vecteur colonne p 1 0 R 2 |p|2 R

|Jac(d)(p,u) | = R trique. (|Jac(d)(p,u) | = Ainsi =


BR
3N1

R2 |p|2

3N2 2

Exercice Retrouver cette expression par un raisonnement plus gom1


|p|2 R2

R2 |p|2

3N2 1

.)

f (p)dN1 (p) 1 f (p)R


S 3N2 1

|S 3N2 1 | = R3N1 |S 3N 1 |

R3N2 1 |S 3N2 1 | = R3N 1 |S 3N 1 |

R3N 1 |S 3N 1 |

3N BR 1

R2 |p|2
3 N 1 2 2

3N2 2

(dp)3N1 d(u)

BR

3N1

|p|2 f (p) 1 2 R

(dp)3N1

3N BR 1

|p|2 f (p) 1 2 R

3 N 1 2 2

(dp)3N1 .

A prsent nous exploitons le fait que N est trs grand et supposons aussi que N1 N . Alors, comme n N, |S
n1

2 |=2 n , ( 2 )

1 on obtient en utilisant le fait que (n)/(n 2 )

n lorsque n que
3 N 2 3N1 3N1

R3N1 |S 3N 1 |

|S

3N2 1

1 ( 3 N ) 2 R3N1 3 N ( 3 N2 ) 2 2
3 N 1 2 2

3 N 2 2

R3N1

. R,

Par ailleurs, nous pouvons aussi faire lapproximation, pour |p| |p|2 1 2 R e
3 2 N2 1 |p|2 R2

81

Nous concluons que, pour N1 3N mkT , dN1 (p)

N , |p| 1

R, en remplaant R par sa valeur e 2mkT (dp)3N1 . 3N1


|p|2

2mkT 3N Et donc nous observons que le support de N1 est N1 BR 1 , qui tend vers N1 R3N1 lorsque N tend vers , et qualors N1 tend vers la distribution de Maxwell. Les consquences physiques de ce calcul Premirement nous pouvons appliquer ce calcul au cas N1 = 1. Alors, nous obtenons que la mesure de probabi3 3 lit sur la position et limpulsion dune particule est 1 3 e 2mkT (dp) (dx) , || 2mkT cest dire la mme densit que ce que donne la distribution de Maxwell. Deuximement nous voyons que ce rsultat sapplique aussi au cas dun sousensemble plus gros de particules. On peut, en extrapolant, imaginer que, parmi un systme isol de N particules identiques, les N1 particules que lon a ainsi slectionn forment un systme que lon tudie et que les N N1 particules restantes forment un thermostat. On dduit alors de ce calcul que, en adoptant une description micro-canonique pour le systme total (ce qui est cohrent, puisque ce systme est isol), le sous-systme obit la statistique de Maxwell ou, en anticipant sur la suite, une statistique canonique.
|p|2

3.4
3.4.1

Entropie microcanonique
Entropie statistique sur des ensembles nis

Dans ce paragraphe, nous allons introduire de faon abstraite la notion dentropie dune mesure de probabilits. Nous verrons par la suite comment elle sapplique la physique statistique. Pour commencer, soit X = {x1 , . . . , xr } un ensemble ni. Une mesure de probabilits sur X est un n-uplet = (1 , . . . , r ) de nombres positifs tels que i = 1. Dans tout ce qui suit, on adopte la convention 0 log 0 = 0. Dnition 3 Soient et deux mesures de probabilits sur X. On appelle entropie de et on note H() la quantit
r

H() = 82

i log i .
i=1

On montre facilement que H() est positive, nulle si et seulement si = xi pour un certain xi , maximale pour uniforme sur X, alors gale log n. On dit parfois que H() mesure le manque dinformation sur ltat rel dun systme lorsquon sait seulement que son tat est distribu selon la mesure . On montre aussi grce lingalit de Jensen que H(|) est positive, nulle si et seulement si = . On peut retenir que, bien que lentropie relative ne soit pas une distance (elle nest mme pas symtrique), elle mesure lcart entre deux mesures. Un rsultat frappant cet gard est le thorme de Sanov, qui est le cadre dans lequel sexpriment naturellement les rsultats de convergence exponentielle que nous avons rencontr au chapitre prcdent. Soit une mesure de probabilits sur X. Nous supposons, quitte restreindre X, quelle charge tout X, cest--dire que i > 0 pour tout i = 1 . . . r. Soit X1 , X2 , . . . une suite de v.a. indpendantes, valeurs dans X, de loi . La loi des grands nombres assure que dans un grand chantillon X1 , . . . , XN , la proportion de x1 est (presque srement) proche de 1 , celle de x2 proche de 2 , etc... Le thorme de Sanov estime la probabilit que ces proportions ne soient pas celles auxquelles on sattend. Plus prcisment, on dnit la mesure empirique LN par
N

On appelle entropie relative de par rapport et on note H(|) la quantit r i i log i si << H(|) = i i i=1 + sinon.

LN =
n=1

Xn .

Cest une mesure de probabilits alatoire sur X : si est lespace de pro+ babilits sur lequel sont dnis les Xi et si on note M1 (X) lensemble des + mesures de probabilits sur X, LN est une fonction LN : M1 (X). La loi des grands nombres entrane la convergence presque-sre de LN vers lorsque N tend vers linni5 .
On devrait dire : LN converge presque-srement faiblement vers , mais cest une prcision inutile puisque toutes les convergences usuelles de mesure sont quivalentes sur un ensemble ni.
5

83

+ Thorme 3 (Thorme de Sanov) Soit M1 (X) un ensemble quelconque de mesures sur X. Alors

lim sup
N

1 log P(LN ) inf H(|). N

Si est un ensemble de mesures assez loignes de , cest--dire ayant une grande entropie relative disons suprieure hmin , la probabilit dobtenir un chantillon de taille N dont la rpartition correspond une mesure de est plus petite6 que eN hmin . Exercice 8 Supposons que X na que deux lments. Montrer que la fonction dont le graphe est reprsent la gure 2.5 nest autre que lentropie relative de la mesure qx1 + (1 q)x2 par rapport la mesure px1 + (1 p)x2 .

3.4.2

Entropie statistique dun tat macroscopique

Nous cherchons maintenant gnraliser et transposer au cadre micro-canonique la dnition de lentropie (cintique) que nous avions propose la n du chapitre prcdent. Nous gardons lesprit lide originelle que premirement lentropie est, un facteur prs, le logarithme du nombre dtats microscopiques compatibles avec un tat macroscopique donn et deuximement, si on a divis lespace en petites cellules de mmes tailles et si lon est lquilibre, chacune delle a la mme probabilit dtre occupe. Mais cette fois le paradigme est un peu dirent, car au lieu de dcouper (voire mme T ) en petites cases et de dnombrer la proportion de N particules dans chaque case, cest une partie de lespace des phases T N (ou T SN ) que nous allons dcouper en petites cellules (qI )I[[1,M ]] et, comme ltat microscopique du gaz est alors reprsent par un point dans lespace des phases, nous devons faire appel un artice supplmentaire : imaginer une exprience avec N chantillons macroscopiquement identiques, tirs au hasard . En premier nous devons calibrer les cellules qI de faon ce qu lquilibre, elles soient toutes quiprobables. Grce lhypothse ergodique qui,
Le thorme de Sanov complet fournit en fait aussi un minorant, qui est du mme ordre que le majorant, et mme gal si est ouvert.
6

84

dans le cas du formalisme micro-canonique, privilgie la mesure de Liouville Liou , lquiprobabilit sexprime simplement par la condition Liou (qI ) = Liou (qI ), I, I . Mais en plus lentropie est une quantit extensive. Donc ici nous devons choisir une fois pour toute une valeur universelle7 pour la quan3N tit Liou (qI ) (qui sexprime en (kg m2 s1 ) ). Appelons l h3N , o h est une grandeur8 qui sexprime en kgm2 s1 . Alors il nest pas dicile de dnir la valeur de lentropie lquilibre : nous divisons lespace des phases microE+E E+E canonique TE ou TE /N en cellules qI de tailles Liou (qI ) = h3N . Pour E+E d cela nous en consommons un nombre Wh := Liou (TE )/h3N , si nous traE+E E+E i vaillons sur TE (particules discernables) et Wh := Liou (TE /N )/h3N E+E si nous travaillons sur TE /N (particules indiscernables). Alors, pour des particules discernables, lentropie est :
d d Sh := k log Wh = k log E+E Liou (TE ) h3N

(3.10)

et, pour des particules indiscernables, lentropie est :


i Sh

:= k

i log Wh

E+E E+E Liou (TE ) Liou (TE /N ) = k log . = k log 3N 3N N ! h h

(3.11)

Ltape suivante consiste comprendre comment dnir lentropie dun systme hors de lquilibre9 . Un tel systme est dni par une mesure sur E+E E+E TE ou TE /N , qui nest pas uniforme en gnral. Ici nous pouvons nous inspirer du paragraphe prcdent, o nous avons dni lentropie relative de deux mesures de probabilit (en adaptant, puisque lentropie thermodynamique est extensive alors que lentropie relative de 2 mesures de probabilit ne mesure que le degr duniformit de la rpartition dune distribution).
exactement comme pour toutes les quantits extensives (les longueurs, les masses, etc.), pour lesquelles nous devons introduire une unit de mesure (m, kg, etc.). 8 Par exemple nous choisissons une chelle despace minimale x (exprimes en m) et une chelle dimpulsion minimale p (exprime en kg ms1 ) (avec x diamtre() et p N 3 2mE 2mE) et nous utilisons des cubes (qI )I[[1,M ]] de la forme i=1 =1 [x , x + i i x] [pi, , pi, + x], o (x , p ) T N . Alors h = (p)(x). 9 en fait il est ncessaire de supposer que nous sommes presque lquilibre, par exemple que le systme est en volution quasi-statique, pour pouvoir dnir les grandeurs thermodynamiques qui caractrisent nos chantillons ; pour xer les ides, on peut imaginer que le systme est divis en deux sous-sytmes qui sont pratiquement chacun lquilibre et qui voluent de faon quasi-statique en changeant du travail et de lnergie
7

85

E+E E+E Notons P = TE ou TE /N lespace des phases. Soit = Liou /Liou (P) la mesure de probabilit reprsentant ltat dquilibre et soit une autre mesure de probabilit sur P, reprsentant un autre tat. Alors, inspir par (3.10) ou (3.11) et la section prcdente, nous dnissons lentropie correspondant ltat par

Sh () := k

d log d

h3N d d. Liou (P) d

Remarquons que cette quantit peut sinterprter comme la somme Sh () = k log Liou (P) k h3N d log d d d, d

cest dire la somme de S(), lentropie lquilibre, et de k fois lentropie relative H(|). Enn une troisime expression de lentropie est : Sh () := k d d log h3N dLiou dLiou dLiou

et apparat comme (k fois) une gnralisation de lentropie relative de deux mesures de probabilit des mesures positives qui ne sont pas ncessairement de probabilit. Ici le facteur h3N est essentiel pour que largument du logarithme soit sans dimension. Nous remarquons bien sr que lentropie dpend du choix de lchelle h. Ainsi pour tout > 0, il est immdiat que Sh () = Sh () + 3N k log . Cette indtermination nest pas trop gnante, puisque, dans la premire dnition de lentropie, propose par Clausius sur la base de lquation dS = q/T (q : gain innitsimal de chaleur), lentropie ntait dni qu une constante additive prs. Dnition 4 Soit la mesure de probabilit sur lespace des phases T N (discernabilit) ou T N /N (indiscernabilit) reprsentant un tat macroscopique donn, et donc caractris par des grandeurs thermodynamiques E, V, . Soit P T N (ou T N /N ) le support de . Supposons que, sur P, a une densit rgulire par rapport la mesure de Liouville, cest dire : d = dLiou . Alors on appelle entropie statistique de cet tat macroscopique la quantit Sh (E, V, ) = Sh () = k 86 log h3N dLiou ,
P

o h est une grandeur choisie une fois pour toute qui sexprime en kg m 2 s1 et k est la constante de Boltzmann. Dans la dmarche prcdente, le choix de lchelle h apparat tout fait arbitraire et est rendu ncessaire pour des raisons dhomognit et parce que nous avons besoin de xer une certaine chelle pour compter le nombre dtats. Il se trouve que la nature privilgie en fait une certaine valeur, trs petite, qui sera sensible en physique quantique : la constante de Planck.

3.4.3

Entropie microcanonique

Dans le formalisme microcanonique, lensemble des tats accessibles pour le E+E systme quon considre est une tranche TE de lespace des phases ou E+E bien son quotient TE /N . La mesure associe un tat macroscopique
p H=E+dE H=E

Fig. 3.2 Reprsentation schmatique des tats microscopiques accessibles par un systme. Ici, le volume du systme est born, ce qui empche q de sortir dun intervalle dont lextrieur est hachur. Lors dune dtente de Joule par exemple, cette contrainte est suprime sans que soit rompu lisolement du systme.

E+E de notre systme a donc une densit nulle hors de TE .

87

Entropie micro-canonique du gaz dilu Nous allons maintenant calculer lentropie pour un gaz dilu lquilibre. E+E E+E Notons P lespace des tats (TE ou TE /N ). A lquilibre la mesure de probabilit est distribue uniformment par rapport la mesure de Liouville Liou et donc on a = Liou sur P, o est constant et est donn par 1 1 dLiou = 1, cest dire = (Liou (P))1 = P dLiou = h3N Wh . P Alors Sh = k log h3N dLiou = k log 1 Wh dLiou = k log Wh .
P

Il nous faut donc calculer Wh .


d Particules discernables Nous calculons tout dabord Wh := h3N T E+E dLiou , E ce qui signie que nous supposons les particules discernables. Il sagit de calculer le volume dune tranche comprise entre deux sphres de rayons res pectifs R et R + R (fois le volume de ||N ), o = 2mE et R + R = R 2m(E + E). Cela entrane R 2mEE/2 E. Nous poserons E = E, o ]0, 1[, de sorte que R 2mE/2. Alors, en supposant que 1, d h3N Wh (R)R3N 1 |S 3N 1 | ||N 3N 3N 1 2 2 2mE ||N 2mE = 3N 2 2 3N 3N 2 = 2mE V N. 3N 2

Donc
d Sh

= k log h

3N

2mE

3N

2 VN 3N 2 h3N (2mE)3N/2 3N/2 V N

3N

(3N/2 1)3N/21 e3N/2+1 (3N 2) h3N (2mE)3N/2 V N k log() + k log (3N/2)3N/2 e3N/2 3/2 3 V 4mE = k log() + kN log + . 3 h 3N 2 88

k log() + k log

Cest le moment de xer : nous supposons que, en plus de 1, | log | N , ce qui est parfaitement raisonable. Alors le premier terme dans lexpres3 sion qui prcde est ngligeable. Enn en utilisant E = 2 N kT , on obtient
d Sh

kN

log

V (2mkT )3/2 3 h

3 . 2

Cette quantit prsente linconvnient de ne pas tre extensive, notament cause de largument du logarithme qui crot linairement avec le volume V . Ce dfaut va tre corrig en supposant lindiscernabilit des particules.
E+E Particules indiscernables Alors lespace des phases est P = TE /N et i nous devons calculer Wh := h3N T E+E /N dLiou . Le calcul est trs simple et E i d i i il sut de diviser par N ! : Wh = Wh /N !. Cela a pour eet que Sh = k log Wh d est obtenue en retranchant la quantit k log N ! Sh . Comme

k log N ! on en dduit que


i Sh

kN (log N 1),

kN

log

V (2mkT )3/2 3 Nh

5 2

(3.12)

i Et on peut constater cette fois-ci que Sh est une quantit extensive.

Retrouver la temprature Envisageons un gaz quelconque, dont la valeur de lnergie est xe E et qui, par consquent, peut tre modlis par le formalisme microcanonique. Supposons que, par une volution quasi-statique, le systme absorbe une quantit dnergie innitsimale et que cette volution se fait sans changement du nombre de particules N , ni changement du volume V . Cela signie, sur le plan de la description microscopique, que lespace des phases T SN et lhamiltonien H C 1 (T SN ) ne changent pas. Ce qui va changer, cest HE , cest dire la rpartition statistique et donc la mesure . Sur le plan de la description macroscopique, cet apport dnergie se fait sous forme de chaleur : dE = dU = q (avec les notations du chapitre 1).

89

Il dcoule des considrations thermodynamiques que nous avons faites lorsque nous avons dni lentropie de Clausius, que dS i = q/T = dE/T . Nous en dduisons une dnition de la temprature partir de lentropie statistique micro-canonique i Sh 1 . (3.13) := T E |N,V A titre dapplication du paragraphe prcdent, en utilisant lexpression (3.12) i pour calculer la variation innitsimale de lentropie Sh , nous obtenons
i dSh = kN d log

V (2mk)3/2 3 Nh

5 2

+k
|N,V

3N 3N dT d log T = k . 2 2 T

3 i Et, en utilisant E = 2 N kT , nous obtenons dSh = dU/T , ce qui conrme que la relation (3.13) est en adquation avec la dnition de Clausius de lentropie.

3.5
3.5.1

Le formalisme canonique
Lensemble canonique

Le formalisme microcanonique dcrit correctement des systmes isols mais il est en fait bien plus frquent quun systme S soit en mesure dchanger de la chaleur avec un systme beaucoup plus gros que lui T et dont la temprature nest pas sensiblement aecte par ces changes. Par exemple, cest le cas dune enceinte en verre contenant du gaz et place dans une pice remplie dair une certaine temprature. Dans ce cas, on appelle T un thermostat. Le systme S peut alors se trouver dans des tats microscopiques dnergie variable et, contrairement ce qui se passe pour un systme isol, ces tats ne sont pas quiprobables. Il faut une nouvelle loi de probabilits pour dcrire correctement ltat macroscopique de S, qui ne sera pas porte par une hypersurface ou une tranche de lespace des phases, mais par lespace tout entier. La prsence du thermostat entrane une autre dirence importante entre les formalismes microcanonique et canonique. Le premier sapplique de grands systmes, contenant au moins des milliards de particules. Le second peut se comprendre comme lapplication du premier au systme S T , quon peut 90

souvent considrer comme isol. Or, pour que T puisse jouer son rle de thermostat, il doit ncessairement tre trs gros, si bien que S peut, lui, tre aussi petit quon veut, et mme tre constitu dune seule particule. Ainsi, le formalisme canonique peut sappliquer des systmes arbitrairement petits. Nous lavons dailleurs dj fait sans le dire dans la section prcdente, o, en projetant la mesure dcrivant ltat dun gaz dilu sur les composantes correspondant un petit nombre de particules, nous avons (re)trouv la distribution de Maxwell-Boltzmann. Nous verrons quelle est un cas particulier de lensemble canonique. Considrons donc un systme de hamiltonien H dni sur lespace des phases T N en contact avec un thermostat la temprature T . Pour dterminer la mesure = Liou correspondant lquilibre de ce systme, nous allons considrer que laction du thermostat revient xer la valeur moyenne de lnergie, une certaine valeur E. Autrement dit, doit satisfaire la contrainte H dLiou = E. (3.14)
T N

Par ailleurs, doit galement vrier dLiou = 1,


T N

(3.15)

pour que soit une mesure de probabilits. Pour dterminer parmi toutes les fonctions qui satisfont ces deux contraintes, nous allons galement demander quelle maximise lentropie statistique S() = k log(h3N ) dLiou .
T N

(3.16)

Pour rsoudre, un peu formellement, ce problme, on prend qui satisfait les deux conditions (3.15), (3.14) et maximise lentropie. Alors, pour toute petite variation de telle que + satisfasse encore (3.15) et (3.14), on doit avoir S(+) = S() des termes du second ordre prs. Or la variation de S scrit : S( + ) S() = (log(h3N ) + 1) dLiou + O(2 ).
T N

91

Dautre part, le fait que + satisfait encore (3.15) et (3.14) scrit dLiou =
T N T N

H dLiou = 0.

Dnissons () = (log(h3N ) + 1) dLiou , 1 () = dLiou et 2 () = H dLiou = 0. On a trois formes linaires , 1 et 2 sur un espace de fonctions, la premire dpendant de qui est inconnue. On demande que le noyau de contienne lintersection de ceux de 1 et 2 . Cela est quivalent demander que soit une combinaison linaire de 1 et 2 , ce qui signie quil existe deux constantes et telles que log(h3N ) + 1 = H, autrement dit = h3N CeH . Ces deux constantes doivent tre dtermines, selon lexpression de H, par les conditions (3.15) et (3.14). On aura toujours en particulier 1 1 = 3N C h eH dLiou ,
T N

et on notera Z ce nombre, qui sappelle aussi la fonction de partition.

3.5.2

Identication de
|p |2 , 2m

Dans le cas dun gaz dilu, o H(x , p ) = calculer en fonction de E. En eet, 1 Z He


T N H

nous pouvons facilement


3N

dLiou

1 = 2m = 3N 2m

R3N

2m

1
|pi |2

(dp)3N

R3N i=1
2

|pi |2 e 2m

|pi |2

(dp)3N

1
2m p2 1

dp1 e 3N m 3N = = . 2m 2

p2 e 2m p1 dp1 1

Pour un gaz dilu isol, on sait que E est relie la temprature par E = 3 N kT . En utilisant cette galit dans le formalisme canonique, on obtient la 2 relation fondamentale 1 . = kT 92

On dnit donc lensemble canonique pour un systme de hamiltonien H mis en contact avec un thermostat la temprature T comme tant la mesure can = 1 h3N Z e kT Liou .
H

Exemple 1 Dans une enceinte contenant un gaz dilu la temprature T , choisissons une molcule par la pense. Elle ne constitue pas un systme isol : elle change constamment de lnergie avec le reste du gaz au cours des chocs quelle subit avec les autres molcules. Cependant, la temprature du systme form par ces autres molcules nest pas sensiblement aecte par ces chocs : ils mettent en jeu une nergie de lordre de kT , alors que lnergie du reste des molcules est de lordre de N kT . La molcule que nous avons choisie est donc en situation canonique, la temprature T . Son hamiltonien scrit H(x, p) = |p|2 /2m donc son tat peut tre reprsent par la mesure 1 |p|2 e 2mkT dxdp, hZ qui est la distribution de Maxwell-Boltzmann.

3.5.3

Rpartition de lnergie

Le facteur exponentiel dans la mesure canonique indique quentre deux tats microscopiques, le plus nergtique est aussi le moins probable. Cependant, entre deux nergies donnes, celle laquelle on est le plus susceptible de trouver le systme nest pas forcment la plus basse. En eet, les tats dnergie plus leve sont moins probables mais aussi beaucoup plus nombreux. Nous allons vrier dans le cas du gaz dilu que ces deux phnomnes contraires se compensent autour de la valeur moyenne impose lnergie. La distribution de lnergie du systme prsente un pic autour de cette valeur moyenne dont nous allons aussi valuer la largeur. Commenons par exprimer la loi de lnergie du systme sous la mesure can . Pour toute fonction f , on a f (H)
can

1 Z

r2 2m

r 3N 1 e 2mkT dr|S 3N 1 |d, 93

r2

en se plaant en coordonnes sphriques et en notant d la mesure uniforme de masse 1 sur la sphre unit. Comme lintgrande est invariant par rotation, la partie sphrique disparat et il ne reste que f (H)
can

= =

1 Z s

f 1
3N 1 2

r2 2m e
s kT

r 3N 1 e 2mkT dr

r2

ds

f (s)s

3N 1 2

e kT ds.

e . On vrie facilement que d sannule en smax = Posons d(s) = s 3N 1 3 kT N kT = E. Ainsi, la densit est bien maximale au voisinage de 2 2 lnergie moyenne qui est impose au systme. On peut aussi calculer d et vrier que d (smax ) = (kT )
3N 5 2

3N 1 2

s kT

3N21

3N 1 2

3N 3 2

En ngligeant les termes dordre suprieur deux et donc en identiant localement le graphe de la densit une parabole, on peut estimer la largeur du pic de la distribution par la formule E d(smax ) . d (smax )

Le rapport sous la racine carre est gal 3N21 N (kT )2 , cest--dire quil est E2 E de lordre de grandeur de N (kT )2 . Ainsi, E est de lordre de N et N on obtient 1 E . E N Ce calcul indique, lorsque le systme est macroscopique (ce qui, encore une fois, nest pas toujours le cas dans le formalisme canonique), que lnergie uctue trs peu autour de sa valeur moyenne. A la limite o N tend vers linni, qui sappelle aussi limite thermodynamique, lnergie est toujours gale sa valeur moyenne : la distribution canonique se concentre sur une hypersurface dnergie et devient nalement identique la distribution microcanonique10 . Cette proprit entre dans le cadre de lquivalence des dirents ensembles (microcanonique, canonique, . . .) la limite thermodynamique.
La signication mathmatique de cette remarque demanderait tre prcise, car lorsque N varie, on se trouve dans des espaces des phases de plus en plus gros.
10

94

Appendice
La fonction Elle est dnie par (z) := 0 ex xz1 dx. Elle satisfait la relation (z) = (z1)(z1) si z > 1. On en dduit (n) = (n1)!, n N . La formule de Stirling (z + 1) au sens o limz z
z ez

z z ez 2z,

2z (z+1)

= 1.

Le volume de la sphre S n1 := {x Rn /|x| = 1} Il vaut |S


n1

2 |=2 n . ( 2 )
2

Pour le dmontrer on calcule de 2 faons direntes Rn e|x| dx1 dxn : par 2 1 2 n 2 le thorme de Fubini et en utilisant e|x| = e(x ) e(x ) ,
n

e
Rn

|x|2

dx dx =

e
R

t2

dt

En intgrant en coordonnes sphriques : e|x| dx1 dxn = |S n1 |


2

er r n1 dr.

Rn

Alors on fait le changement de variable r 2 = t, dr = dt/2 t : e|x| dx1 dxn = |S n1 |


2

et t 2 1

Rn

dt |S n1 | n = ( ). 2 2 2

On en dduit ainsi le rsultat.


x Approximation de (1 + n )n , lorsque n

1+

x n

ex .
x n x e n

Pour le dmontrer on crit que log 1 + tit qui tend vers 0 lorsque n . 95

= n log 1 +

x n

x, quan-

Equivalent de

(n) (n1/2)

lorsque n (n) (n 1/2) n.

Pour le dmontrer (n) (n 1/2) (n 3/2)(n3/2) en+3/2 2(n 3/2) 1 1 n(1 n ) nn1 1 n 3 3 n(1 2n ) 1/2 e nn3/2 1 2n 1 (1 n ) e n 3 n. 3 e 2 (1 2n ) e1/2 (n 1)(n1) en+1 2(n 1)

96

Chapitre 4 Interactions thermodynamiques entre la lumire et la matire


Lorsque Max Planck, la n du XIXme sicle, aborda ltude des changes thermodynamiques entre la matire et la lumire, il tait alors un spcialiste de la thermodynamique classique et, comme la plupart de ses contemporains, relativement peu convaincu par la physique statistique de Boltzmann. A tel point quun de ses buts tait de mettre en vidence des contradictions dans la thorie de Boltzmann. Il ne se doutait pas que, grce notamment sa grande honntet intellectuelle, ses travaux dboucheraient sur une conrmation clatante des ides de Boltzmann et surtout sur une dcouverte qui allait bouleverser la physique.

4.1

Prliminaire : lquipartition de lnergie

Commenons par examiner une consquence de la physique statistique : nous envisageons un systme avec M degrs de libert indpendants possdant chacun une nergie quadratique. Cela peut tre par exemple : Un gax dilu de N particules Lensemble des tats dun systme (sans tenir compte de lindiscernabilit) est T N , o est un ouvert born de R3 et lhamiltonien est :
N

H(x , p ) := 97

i=1

|pi |2 , 2m

et alors M = 3N . Ou bien : Un systme de N oscillateurs harmoniques Cela peut modliser par exemple les petits mouvement datomes rpartis en un rseau critallin autour de leurs positions dquilibre. Alors N est gal 3 fois (degrs de libert) le nombre datomes. Lensemble des tats du systme est T RN , avec
N

H(x , p ) := Alors M = 6N .

i=1

i 2 (pi )2 2 (x ) + m . 2m 2

Dans les deux cas, la situation est modlisable par un systme de M + L degrs de libert (zA )A[[1,M +L]] (qui reprsentent les coordonnees pi, , xi dans le premier exemple) et lhamiltonien
M

H(z) :=
A=1

cA

2 zA , 2

o chaque coecient cA est dans ]0, [. Nous supposons ici que, pour tout A [[1, M ]], zA prend ses valeurs dans R. Notons que les variables zA , pour A [[M + 1, M + L]], napportent aucune contribution dans lnergie (comme cest le cas pour les variables xi dans le premier exemple). On doit donc supposer que (zA )A[[M +1,M +L]] prend ses valeurs dans un ensemble born K, pour que la mesure canonique que nous allons considrer plus loin soit de masse totale nie. Nous considrons le formalisme canonique et introduisons pour cela la fonction de partition 1 Z() = =
M +L

e
RM K M R

H(z) A=1
2

|K| dzA =

e
RM

H(z) A=1

dzA

|K| A=1

ecA zA /2 dzA ,

o = hM +L est l unit de mesure sur RM K. La mesure de probabilit canonique sur RM K est alors d := 1 eH(z) Z() 98
M +L

dzA .
A=1

Lemme 1 Pour tout A [[1, M ]], la valeur moyenne de lnergie correspondant au degr de libert zA vaut : cA o kT = 1. Preuve Il sagit dun calcul : cA
2 zA 2 2 zA kT = , 2 2

= = =

1 Z()

cA
RM K M

2 zA PM cB zB /2 2 B=1 e 2

M +L

dzB
B=1

|K| Z() B=A;B=1 ecA zA /2 dzA


R
2

ecB zB /2 dzB
R 1 R R

cA

2 zA cA zA /2 2 e dzA 2

cA

2 zA cA zA /2 2 e dzA . 2

On pose alors t = z2 cA A 2

cA /2zA , dt = =
R

cA /2dzA , et 2 dt cA dt
1 1 R

t2

t2 t2 e dt =

2 dt cA 1 . 2

1 = do le rsultat.

e
R

t2

t e
R

2 t2

4.2

Le problme du rayonnement du corps noir

A la n du XIXme sicle, les interactions entre la lumire et la matire sont la source dnigmes face auxquelles on disposait dassez peu de moyens thoriques. Par exemple il ntait pas vident de savoir comment la thermodynamique sapplique la lumire. Et pourtant on peut exprimenter des relations videntes entre la temprature dun corps et lintensit et la distribution en longueur donde du rayonnement lumineux quil met. De mme il est vident que le simple fait de rester expos au soleil conduit une augmentation de la temprature. A lpoque les travaux de Maxwell avaient permis de montrer de faon convaincante que la lumire tait une onde du 99

champ lectromagntique (voir lappendice de ce chapitre). M. Planck, qui ne croyait pas la thorie de L. Boltzmann et en particulier son interprtation statistique de lentropie, pensait, parce que les quations de Maxwell sont linaires et donc ses solutions sont superposables, que ltude de la lumire lui permettrait de mettre en dfaut cette interprtation statistique.

4.2.1

La pense thermodynamique de Planck

M. Planck envisage une exprience relativement facile mettre en oeuvre, dans laquelle on considre une bote totalement ferme constitue par un matriau opaque (que nous supposerons tre un conducteur parfait). Lintrieur de la bote est vide et le tout est laiss au repos, une certaine temprature T pendant un temps susamment long pour quun quilibre thermodynamique ait lieu, les ondes lectromagntiques lintrieur pouvant changer de lnergie avec les molcules qui constituent la bote. En pratiquant une petite ouverture dans la bote, on peut alors, par des mesures sur lintensit du rayonnement qui en sort en dduire la densit volumique dnergie lectromagntique. Rappelons que toute onde lumineuse peut tre dcompose en une somme innie (transforme de Fourier) dondes monochromatiques pour lesquelles les champs lectriques et magntiques sont de la forme : E(t, x) = Re Eei(t+kx) B(t, x) = Re Bei(t+kx) ,

o est la pulsation ( = 2, o est la frquence), k (R3 ) est le vecteur donde et satisfait c|k| = . De plus, si on se donne une base orthonorme directe ( 1 , 2 , 3 ) de R3 telle que ck = 3 , alors on a ncessairement E = ei (b2 1 +b1 2 ) et B = ei (b1 1 +b2 2 ), o , b1 et b2 sont des constantes relles (voir lappendice de ce chapitre). Les deux degrs de libert dans le plan engendr par ( 1 , 2 ) correspondent lexistence de deux polarisations possibles. Il est remarquer quil est possible exprimentalement de slectionner des valeurs du nombre donde1 (ou de faon quivalente de la longueur donde = 2c/). Nous pouvons ainsi dnir la densit dnergie lectromagntique par unit de volume despace et par unit de nombre donde : cest une fontion (x, , T ), o T est la temprature, telle que la quantit dnergie
et mme des valeurs du vecteur donde k (dont la direction est celle de la propagation du rayon lumineux et la longueur dpend de la longueur donde) et de la polarisation (grce des ltres)
1

100

lectromagntique contenue dans un voisinage dun point x R3 de volume (x)3 et dont le nombre donde est contenu dans lintervalle [, + ] (ou de faon quivalente la longueur donde est contenue dans [, + ], avec = ( + )( + ) = 2c) est gale : (x, , T )(x)3 . Dans la suite nous ne considrerons que des tats dquilibre, pour lesquels la valeur de ne dpend pas de la position, et nous supposerons donc que (x, , T ) = (, T ). Comme il est possible2 de mesurer exprimentalement la densit (, T ), nous pouvons considrer le sous-systme thermodynamique obtenu en isolant par la pense les ondes lumineuses dont le nombre donde est dans un intervalle [, + ]. Pendant un temps relativement court (de faon ce que les changes entre la lumire et la bote aient des eets ngligeables), ce sous-systme peut lgitimement tre considr comme isol parce que prcisment les quations de Maxwell sont linaires et donc il ny a pas dchange directs entre dirents modes. Ainsi, il est possible destimer lentropie pour ce sous-systme, en adaptant la relation de Clausius dS = q/T : nous dnissons la densit dentropie par unit de volume despace et unit de nombre donde comme tant la quantit s(, T ) caractrise par la relation d(, T ) , ds(, T ) = T o ici la direntielle d agit sur les variables dtats thermodynamiques u et T du systme (et non sur k qui joue ici le rle dun paramtre). Loriginalit du raisonnement3 de M. Planck a t de sappuyer sur la relation entre la densit dnergie et la densit dentropie s, alors que la plupart
en pratique on mesure la quantit dnergie transmise travers un lment de surface dS pendant une dure dt, dans des directions comprises dans un angle solide d, dans un intervalle de nombre donde d et selon une certaine polarisation, quantit note J(, T )dtddSd, o J(, T ) est la radiance. Cette densit est relie la densit dnergie lectromagntique par unit de volume despace et par unit de nombre donde (, T ) par la relation J(, T ) = c(, T )/8. 3 en ralit M. Planck a travaill sur un autre type de densit dnergie et dentropie. En eet il a suivi une approche un peu plus complique : il na pas raisonn sur la lumire directement mais sur ltat thermodynamique de la matire lorsquelle est lquilibre avec la lumire et il a modlis les uctuations de la position des particules charges de la matire par de petits oscillateurs harmoniques changeant de lnergie avec le champ lectromagntique. Cela se comprend dans la mesure o il ignorait si les lois de la thermo2

101

de ses contemporains cherchaient en vain deviner ce qui se passait en travaillant directement sur le lien entre la temprature et la frquence /2. Il est parti du principe que lentropie doit tre une fonction concave de lnergie d2 s et donc en particulier que (d)2 < 0 et cela pour deux raisons : parce quil
d s avait foi en la thermodynamique et parce que le fait que (d)2 < 0 tait une des rares informations que lon avait pu vrier exprimentalement.
2

4.2.2

Position du problme

Nous supposerons pour simplier que la bote est un cube de cts de longueur . Soit N3 := (N )3 et N3 := {n N3 /! [[1, 3]], n = 0}. Nous 2 1 considrons lensemble dnombrable dindices : := {(n, 1)/n N3 } {(n, A)/n N3 , A {1, 2}}. 1 2 Une dcomposition de Fourier des champs lectriques et magntiques lintrieur de la bote, tenant compte des conditions au bord, et une formulation variationnelle des quations de Maxwell conduisent identier la dynamique des quations de Maxwell dans la bote celles dune assemble doscillateurs harmoniques numrots par les indices = (n, A) parcourant . Physiquement chaque correspond un mode stationnaire de vecteur donde k = n/ (lambiguit du signe est due au fait que, comme il sagit dondes stationnaires, un mode k est superpos avec le mode k) et o les deux modes de polarisation possibles sont reprs par lindice A. Nous renvoyons le lecteur lappendice de ce chapitre pour tous les dtails. Lespace des phases est alors lespace vectoriel de dimension innie (ici un espace de Hilbert) E := {(b , p ) / , b R, p R, H(b , p ) < }. Sur cet espace, nous dnissons lhamiltonien : H(b , p ) := 1 2 c2 2 |n|2
2

(p )2 + (b )2

dynamique sappliquaient la lumire (extrapoler la thermodynamique aux ondes lectromagntiques peut nous sembler naturel une fois que nous avons assimil linterprtation statistique des phnomnes thermodynamiques, mais il faut se souvenir qu lpoque M. Planck navait pas conance en la thorie de Boltzmann). Ainsi le raisonnement que nous prsentons dire sensiblement de celui de Planck, mais reproduit nanmoins une partie de son cheminement.

102

et la forme symplectique :=

dp db .

Alors les quations dvolution du champ lectromagntique lintrieur de la bote sont quivalentes aux quations de Hamilton pour une assemble dnombrable doscillateurs harmoniques dont la pulsation est = c|n|/ . Si nous essayons dappliquer la thorie de Boltzmann et dutiliser le formalisme canonique ce systme, nous butons sur une dicult trs srieuse : nous avons vu au dbut de ce chapitre (lemme 1) que chaque oscillateur harmonique avait en moyenne une nergie gale kT . Comme nous sommes en prsence dune innit dnombrable doscillateurs harmoniques, lnergie moyenne totale devrait tre : kT,

une quantit innie ! Par chance les mesures exprimentales permettaient de connatre la densit dnergie par unit de nombre donde et donc davoir des informations assez prcises sur la rpartition statistique des niveaux dnergie selon la longueur donde. Ignorons donc momentanment le problme de lnergie totale moyenne innie et explorons la rpartition de lnergie dans une certaine gamme de frquence. Nous nous intressons aux oscillateurs harmoniques dont le nombre donde est compris entre les valeurs et + . Nous ferons lhypothse que tous les oscillateurs harmoniques dans la tranche [, + ] ont approximativement la mme nergie moyenne, gale

:= 2 (p )2 + (b )2 ,

o = (k, A) et = c|k| =

c|n|

Nous devons dabord dnombrer le nombre dindices = (n, A) tels que < c|k| < + , o k = n/ , cest dire tels que < |n| < + . c c c En tenant compte de la polarisation et en ngligeant les restrictions lorsque n N3 (o il ny a quune seule polarisation), on trouve que le nombre de 2 103

modes dans la tranche [, + ] est approximativement


3 2 4 2 |n| |n| = 3 3 . 8 c Alors la valeur moyenne de lnergie totale de tous les oscillateurs dans cette 3 2 tranche est approximativement c32 ( 3 reprsente ici le volume du cube).

A prsent supposons que le formalisme canonique sapplique : alors le lemme 1 entrane que = kT . Donc la valeur moyenne de lnergie totale de tous les oscillateurs dans la tranche [, +] est approximativement 3 RJ (, T ) = 3 2 kT . Cette relation conduit dnir la densit de RayleighJeans c3 2 2 kT. c3 2 Bien videmment nous savions lavance que cette densit doit conduire une nergie totale moyenne innie, ce que conrme le fait que [0, ]3 0 RJ (, T )d3xd = . Il est nanmoins intressant de confronter cette prdiction aux observations exprimentales : celles-ci nous enseignent que la densit RJ est trs proche de la valeur exprimentale de la densit dnergie par unit de volume et unit de nombre donde (, T ) pour les petites valeurs de (plus prcisment si h kT ). Nous en concluons que le raisonnement suivi a une certaine validit pour petit. RJ (, T ) := Lorsque les valeurs de sont grandes, les observations exprimentales ont permis dtablir la loi (empirique) de Wien, savoir que la densit dnergie concide avec une bonne approximation avec : W (, T ) := A 3 e kT , o A et sont des constantes empiriques positives4 .

4.2.3

Interpolation entre les lois de RayleighJeans et de Wien

La premire dmarche de M. Planck consiste essayer de trouver une loi qui interpole entre les deux lois prsentes prcdemment. Pour cela il sappuie
Le fait de dsigner par suivre
4

la constante devant /kT est une anticipation de ce qui va

104

sur un raisonnement thermodynamique classique dans lesprit de ce que nous avons dcrit la section 1.2. Lide est dliminer la temprature et dtudier la relation entre la densit dnergie et la densit dentropie dnie la section 1.2. Dans le cas dapplication de la loi de RayleighJeans, nous avons T = et dans celui de la loi de Wien, T = 1 W . k log A3 RJ c3 2 , k 2

Partant de ds = d/T (ici la chaleur recu est gale la variation de lnergie), on obtient deux densits dentropie possibles, selon les lois adoptes : dsRJ dRJ k 2 = = dRJ T RJ c3 2 et dsW
W k log A3 dW = = dW . T

On en dduit que 2 sRJ k 2 = 3 2 2 (RJ )2 c RJ et k 2 sW = . 2 (W ) W


2

s Dans les deux cas M. Planck observe que ()2 < 0, ce qui est en accord avec la concavit de lentropie. Lide est alors de chercher interpoler entre ces deux lois. L M. Planck a probablement d faire plusieurs ten2s tatives avant de trouver la bonne faon dinterpoler : en posant ()2 = 2s ()2 1 RJ

2s ()2

1 W

. Cela nous conduit supposer que : 1 1 3 + c3 2 .

2s k = 2 ()

Aprs, nous revenons en arrire, cest dire nous intgrons cette relation pour obtenir 1 s k 3 = = log 1 + 3 2 +a , T c o a est une constante dintgration. On dduit de cette relation : (, T ) = 3 c3 2 ea e kT 1 105

Il reste comparer cette nouvelle loi avec les deux lois que lon connat. Sachant que la loi de RayleighJeans est en parfait accord avec les mesures exprimentales pour les petites valeurs de , il est primordial de vrier si la valeur de obtenue est proche de RJ lorsque 0 : cela est bien le cas condition que a = 0. Nous en dduisons que devrait tre gal P (, T ) = 3 c3 2 e kT 1

(4.1)

Cest la loi de Planck. Ici h = 2 est appele la constante de Planck. Sur le plan thorique le but est atteint : on vrie immdiatement que P RJ pour les petites valeurs de et P W pour les grandes valeurs de .

Fig. 4.1 La loi de Planck (en noir) et les lois de Rayleigh-Jeans et Wien (en gris). Mais le moment de vrit, cest quand on compare avec lexprience, et l a marche ! M. Planck a trouv une loi de densit pour le rayonnement qui concorde avec les mesures exprimentales et, de plus, lnergie totale moyenne est bien borne, puisque 0 P (, T )d < .

4.2.4

Comprendre la loi de Planck

Lhistoire nest pas nie : comme Planck, nous aimerions comprendre lorigine de cette formule. Pour cela essayons de remonter en arrire dans le calcul et 106

estimer quelle valeur de conduit la densit dnergie de Planck. Pour cela il sut de rsoudre lquation 2 c3 2 ce qui donne
3

= P (, T ) 3 =

c3 2 e kT 1

. e 1 Un mathmaticien exerc reconnatrait dans cette expression que


kT

1 e
kT

Est-ce cela qui a guid Planck ? Nous nen savons rien. Et est-ce que Planck sest souvenu de ce que lui avait dit Boltzmann en 1891 : Je en vois aucune raison pour laquelle lnergie ne pourrait pas tre regarde comme divise atomiquement ? En tout cas Planck fait alors lhypothse que lnergie prise par un oscillateur est quantie et montre dans ce cas que lnergie moyenne peut tre obtenue par un procd tout fait analogue au formalisme canonique de Boltzmann : supposons que lnergie dun oscillateur harmonique de nombre donde ne soit autoris prendre que les valeurs n , avec n N et que la valeur n soit atteinte avec la probabilit e kT
n

e kT 1e

kT

=e

kT

n=0

n kT

n=1

e kT .

n kT n=1 e

.
e kT 1

Alors la valeur moyenne de lnergie est bien simple est de poser = 1/kT et Z() :=
n=1

. Pour le vrier, le plus

en .

d Calculons de deux faons direntes d log Z() : dune part

d log Z() = d 107

n n=1 n e . n n=1 e

Dautre part Z() = 1 e

implique que

qui est prcisment la valeur que nous cherchons comprendre. Ce calcul va amener Planck remettre en question sa mance vis vis de la thorie de Bolzmann. Remarque Il est intressant de noter que, premirement, lorsque 0, 1 = kT et, deuximement, si lon supposait que, au lieu dtre e 1 discrtise, lnergie pouvait prendre toutes les valeurs dans [0, [ avec la densit de probabilit e / 0 e d , alors la valeur moyenne de lnergie serait 1 e d = = kT. 0 Il faut souligner le fait qu lpoque, Planck est rest pendant longtemps trs prudent. Sa premire conclusion a t que les changes dnergie entre la lumire et la matire taient quantis. Le pas supplmentaire a t franchi par Einstein en 1905 : cest lui qui a suppos le premier que le champ lectromagntique tait quanti et il a considrablement clari les calculs de Planck. Ainsi la prsentation qui a t faite plus haut est largement inspire du travail dEinstein, ne serait-ce que parce que, ds le dpart, nous avons appliqu les ides de physique statistique la lumire et non la matire.

e d log Z() = = , d 1e e 1

4.3

Leet photolectrique

LorsquEinstein revisite le calcul de Planck en 1905 et quil fait lhypothse que le champ lectromagntique est quanti, il montre que cette mme hypothse permet de rsoudre une nigme insolubles depuis plusieurs annes : leet photolectrique. Ce phnomne physique a t observ pour la premire fois en 1887, par Hertz. Lexprience consiste en deux lectrodes une certaine distance lune de lautre, lune charge ngativement (anode) et lautre positivement (cathode). La dirence de potentiel est non nulle, mais relativement faible, de sorte quaucun arc lectrique napparat entre les deux lectrodes. En revanche, lorsque lanode est claire par de la lumire, on peut observer un 108

arc lectrique. Leet photolectrique a t tudi ensuite par Millikan. Le plus trange est la faon dont le courant dpend de lintensit lumineuse et de sa longueur donde. Si le nombre donde de la lumire est infrieur ue certaine valeur 0 , il
Anode

arc electrique lumiere Cathode

Fig. 4.2 Leet photolectrique ne se passe rien, mme si lintensit lumineuse est trs grande. En revanche, si dpasse 0 (et donc la longueur donde est infrieure c/20 ), un arc lectrique est observ. Lintensit du courant lectrique augmente avec lintensit lumineuse. Einstein comprend que ce mcanisme est profondment reli au calcul de Planck : il faut apporter une certaine nergie E0 pour arracher llectron lanode et quensuite il puisse se laisser entraner par la force lectrique qui sexerce sur lui entre les deux lectrodes. Cette nergie est apporte dans cette exprience par la lumire. Mais la lumire ne peut transmettre son nergie que sous forme de quantas , cest dire par paquets de niveau . Cest pour cela que si < E0 / , la lumire narrive pas transmettre de paquet dnergie susante pour arracher un lectron lanode. En revanche, si > E0 / , des lectrons sont arrachs, leur nombre dpend du nombre de quanta de lumire incidents, donc de lintensit lumineuse. En 1926, Lewis proposera dappeler photons ces quanta.

4.4

Loi de dplacement de Wien et loi de StefanBoltzmann

Si lon compare les distributions P (, T ) pour direntes valeurs de T , on constate que la pulsation pour laquelle la densit dnergie est maximale crot avec T . Ceci sappelle la loi de dplacement de Wien, qui correspond au fait intuitif quun corps plus chaud rayonne principalement des frquences plus leves (ne dit-on pas : chauer au rouge, chauer blanc ?). 109

Fig. 4.3 La distribution de Planck pour trois valeurs direntes de T .

Cette loi se dmontre trs facilement, en drivant P . En posant x = kT , on d x trouve que d P = 0 quivaut e (x 3) + 3 = 0, ce qui a lieu pour une seule valeur non nulle de x, que nous notons a et qui vaut environ 2, 82. On en dduit immdiatement que

max = a

kT

On crit en gnral cette loi sous la forme max T = cste 0, 29 cm K.

Par exemple, pour une temprature de 6000 Kelvin (temprature de surface du Soleil), la longueur donde dominante est denviron 480 nm, ce qui correspond la lumire jaune. Cependant, cette application numrique na quune valeur trs limite, car le Soleil ne peut tre assimil un corps noir : le rayonnement qui en sort nest pas ncessairement lquilibre thermodynamique. La loi de Stefan-Boltzmann concerne lnergie (volumique) totale du rayonnement du corps noir. Nous avons vu que, contrairement la loi de RayleighJeans, celle de Planck prvoit une nergie nie. Calculons-la : il sut dintgrer P par rapport . En utilisant nouveau le changement de variable 110

x = /kT , on trouve
0

k4 P (, T ) d = 3 3 2 T 4 c 6(4)k 4 4 T = c3 3 2 2 k4 = T 4. 15c3 3

x3 dx ex 1

La constante 2 k 4 /15c3 3 vaut environ 7, 56 J m3 K 4 . On retiendra que lnergie totale est proportionnelle la puissance quatrime de la temprature. Voici une application un peu fantaisiste de cette loi, attribue Richard Feynman. Pour faire refroidir une tasse de th brlante, vaut-il mieux ajouter du lait et attendre un moment, ou attendre un moment puis ajouter du lait ? La loi de Stefan-Boltzmann indique quil vaut mieux attendre puis ajouter le lait au moment de boire, car le th, rest plus chaud plus longtemps, aura rayonn plus dnergie et sera donc nalement moins chaud que si lon avait ajout le lait tout de suite. Avis aux amateurs...

4.5

Une approche combinatoire de la loi de Planck

Il est possible de retrouver la forme gnrale de la loi de Planck par des arguments combinatoires simples. Considrons une population de particules indiscernables (nous pensons bien sr aux photons), en contact avec un thermostat et lquilibre thermodynamique. Cela signie que la valeur de lnergie totale de ce systme ne uctue pas : elle est xe. Appelons lensemble des tats accessibles pour chacune de ces particules. Par exemple, pour des photons dans une bote cubique, on peut identier E avec lensemble discret {(n, 1)/n N3 } {(n, A)/n N3 , A {1, 2}}, cest1 2 -dire lensemble des modes et des polarisations compatibles avec les donnes au bord. Sur est dni un hamiltonien H : R+ et nous choisissons un pas > 0 de discrtisation de lnergie. Il ne sagit pas du tout dun pas de quantication de lnergie, mais juste dune longueur de dcoupage : posons i = i pour i = 0, 1, . Appelons Ti lensemble des tats tels que 111

H() appartienne [i , i+1 [5 . Notons mi le cardinal de Ti . Nous supposons que est choisi de telle faon que tous les mi soient la fois grands devant 1 et petits devant le cardinal de . Ltat macroscopique du systme est compltement dtermin par la suite (n0 , n1 , ) des nombres doccupations des paquets dtats Ti : il y a n0 particules dans des tats appartenant au paquet T0 , etc... Ltat microscopique du systme, lui, est la donne du nombre n() de particules dans chacun des tats de (rappelons que les particules sont indiscernables). La valeur de lnergie n()H() du systme tant xe, nous pouvons faire un raisonnement micro-canonique et armer que tous les tats microscopiques sont quiprobables. Si nous supposons que le phnomne dsormais familier de concentration exponentielle de la loi de distribution des quantits macroscopiques a lieu, nous pouvons armer que ltat macroscopique du systme est presque certainement celui qui est compatible avec le plus grand nombre dtats microscopiques. La premire question est donc : combien y a-t-il dtats microscopiques compatibles avec ltat macroscopique (n0 , n1 , ) ? Ce nombre N peut scrire N = i B(ni mi ), o B(n m) est le nombre de faons de placer n boules indiscernables dans m botes. Il faut calculer B(n m). Pour cela, on peut remarquer quil est quivalent de mettre n boules dans m botes ou daligner dans un ordre arbitraire n petits ronds (reprsentant les boules) et m 1 btons (les sparations entre les botes). Par exemple, la ligne | || | |

correspond la disposition suivante de sept boules dans six botes : premire bote vide, seconde contient deux boules, troisime bote vide, la quatrime contient une boule, la cinquime trois, la sixime une. Le nombre de telles n lignes de ronds et de btons est gal Cn+m1 , puisquil sut de choisir la place des ronds parmi les n + m 1 caractres. Nous savons donc maintenant que (ni + mi 1)! N= . ni !(mi 1)! i Pour trouver quelle suite (n0 , n1 , ) maximise N , nous allons imiter le calcul
5

dans le cas des photons dans la bote cubique H() = , o = c|k| et = (k, A).

112

direntiel et faire subir aux ni une petite variation : nous allons remplacer chaque ni par ni + ji . Les ji ne sont cependant pas tout--fait arbitraires, car lnergie totale du systme est xe6 . La contrainte sur les ji scrit donc i ji i = 0. Appelons N le nombre dtats microscopiques compatibles avec ltat macroscopique modi (n0 + j0 , n1 + j1 , ). Pour calculer N /N , nous tudions le rapport B(ni + ji mi )/B(ni mi ). B(ni + ji mi ) = B(ni mi ) ni + m i ni ni + m i ni ni + m i ni ni + m i ni Ainsi, N = exp N
i ji

1+

1 ni +mi 1 ni

1+ 1+

ji 1 ni +mi ji ni

1+
ji

exp
ji

1 + + (ji 1) 1 + + ji ni + m i ni ji2 ji2 2(ni + mi ) 2ni mi ji2 . 2ni (ni + mi ) mi 1+ ni


ji

exp
ji

exp

mi ji2 2ni (ni + mi )

Pour que (n0 , n1 , ) soit la distribution qui maximise N , il faut que N /N soit gal 1 au premier ordre en les ji . Comme le terme exponentiel est maximal pour ji = 0, il faut donc que le terme produit soit stationnaire. Sans contrainte sur les ji , cela ne pourrait tre le cas pour aucune valeur des ni . Mais avec la contrainte exprime plus haut, nous pouvons choisir un indice entier a tel que a = 0 (en fait, tout indice non nul convient) et exprimer ja en fonction des autres ji : 1 ja = i ji . a i=a Nous pouvons maintenant rcrire le produit sous la forme mi 1+ ni
ji

i
6

ma 1+ na

i=a i ji

i=a

mi 1+ ni

ji

Le nombre total de particules en revanche nest pas x : il peut y avoir mission ou absorption de photons.

113

=
i=a

1+ 1+

mi ni
i a

ma na

ji

Comme tous les ji , pour i = a, peuvent varier sans contrainte, ce dernier produit nest stationnaire que si chaque terme entre crochets est gal 1, cest--dire que pour chaque i, mi 1+ ni
1 i

= cste =

ma 1+ na

1 a

En appelant K cette constante, on en dduit la forme de ni : ni = K i mi . 1

En remplaant mi par le nombre de modes dans une tranche donne de pulsations [, + [ et i par lnergie correspondante , on retrouve une expression qui est presque celle de Planck : stat () = 3 , c3 2 (K 1)
1

o il ne reste plus qu poser K = e kT .

4.6

Prologue

Le formalisme canonique avait pour consquence le fait que la valeur moyenne de lnergie dun oscillateur harmonique dans un systme ergodique lquilibre est gale kT , et ce, quelles que soient les constantes caractrisant loscillateur. Ltude de la lumire a conduit faire une autre hypothse, savoir que la valeur prise par lnergie de loscillateur harmonique est ncessairement n , pour n N , et que la loi de probabilit de ces niveaux dnergie est un analogue discret des mesures de probabilits canoniques. Il existe toutefois un principe qui rtablit une autre forme de dmocratie entre oscillateurs harmoniques dont les constantes sont direntes, mme lorsque lnergie est quantie. Pour cela revenons la formulation hamiltonienne 114

dun oscillateur harmonique : sur lespace des phases R2 , avec les variables (p, q) et la forme symplectique := dp dq, on considre lhamiltonien p2 q2 + m 2 . 2m 2 Exercice 1) Dmontrer que les solutions des quations de Hamilton sont de la forme H(p, q) = q(t) = A cos t + B sin t et p(t) = m(A sin t + B cos t). Il est immdiat que toutes les solutions des quations de Hamilton sont priodiques, de priode 2/ (et elles dcrivent des ellipses dans le plan). Nous nous intressons la quantit
2/

A :=

p(t)dq(t),
0

o t (q(t), p(t)) est une solution des quations de Hamilton. 2) On suppose que t (q(t), p(t)) est une solution des quations de Hamilton telle que H(q(t), p(t)) = n , o n N . Dmontrer que A = nh. Le rsultat de cette exercice montre que, pour un oscillateur harmonique, la condition de quantication est quivalente demander que laire enferme lintrieur dune trajectoire hamiltonienne priodique soit un multiple entier de h.

Appendice : les quations de Maxwell


4.6.1 Gnralits

Ces quations gouvernent le comportement des champs lectrique et magntique, en prsence de charges lectriques distribues dans lespace, en fonction du temps. Soit E et B sont respectivement le champ lectrique et le champ magntique. On peut les considrer comme des champs de vecteurs ( valeurs dans R3 ) dnis sur lespacetemps R R3 . Les quations de Maxwell sont : rot E + 1 B = 0 rot B 1 E = 4 j c t c t c , div E = 4, div B = 0 115

o : R R3 R est la densit de charge lectrique par unit de volume, j : R R3 R3 est le vecteur densit de courant lectrique et c est la vitesse de la lumire. Rappelons que lon peut considrer E et B comme les composantes dune paire de 2-formes sur lespacetemps RR3 , et j et comme les composantes dune 3-forme sur R R3 . Les 2-formes sont : F := (E1 dx1 +E2 dx2 +E3 dx3 )cdt+(B1 dx2 dx3 +B2 dx3 dx1 +B3 dx1 dx2 ), et F := (B1 dx1 +B2 dx2 +B3 dx3 )cdt+(E1 dx2 dx3 +E2 dx3 dx1 +E3 dx1 dx2 ). La 3-forme est : J := dx1 dx2 dx3 (j1 dx2 dx3 + j2 dx3 dx1 + j3 dx1 dx2 ) dt. Alors les deux sous-systmes dquations de Maxwell sont quivalents respectivement aux deux relations dF = 0 et d( F ) = 4J. De plus la relation dF = 0 entra ne, grce au lemme de Poincar, quil existe une 1-forme sur R R3 telle que d = F . En crivant
3

= V c dt +
=1

A dx ,

on obtient ainsi que E et B drivent du potentiel V et du potentiel-vecteur A (de composantes A ) par les relations E = gradV 1 A c t et B = rotA.

4.6.2

La jauge de Coulomb

La forme , que nous appellerons potentiel de jauge nest pas unique, car pour toute fonction : R R3 R, + d satisfait galement d( + d) = F et donc est un autre potentiel de jauge. Cette ambiguit est source de dicults, car cela signie que les composantes de contiennent des degrs de libert qui ne sont pas physiquement observables. Pour remdier cela, il est possible dimposer des conditions supplmentaires sur , que lon appelle 116

conditions de jauge. Une possibilit est de supposer que 1 V divA = 0 : c t cest la jauge de Lorentz. Elle peut tre impose dans nimporte quelle situation. Ici nous sommes intresss par la lumire dans une cavit, cest dire les ondes lectromagntiques, et la jauge la plus adapte est celle de Coulomb : V = 0 et divA = 0. Dmontrons que, en labsence de charges et de courants lectriques, une telle condition peut toujours tre impose. Nous envisageons la situation sur un ouvert R3 dont le bord est rgulier (ou bien rgulier par morceau, comme cest le cas pour un cube). Nous allons montrer quil est possible de construire A satisfaisant la condition de jauge de Coulomb et quen plus nous pouvons supposer que A n = 0 sur le bord de , o n est le vecteur normal . La premire tape consiste annuler V . Pour cela nous prenons une fonction sur R telle que 1 V = c t Par exemple (t, x) =
3 t 0 3

d = V c dt +
=1

. x

cV (s, x)ds. Alors := d satisfait : (cest dire V = 0) et d = d = F.

=
=1

A dx

Utilisons lhypothse quil ny a pas de charges lectriques. Cela signie que div E = 0. On en dduit que t
3

=1

A x

=
=1

A t

=1

(cE ) = 0. x

Donc divA :=

3 A =1 x

est indpendant du temps t.

Pour la deuxime tape, nous choisissons f : R solution de f = divA sur df (n) = (n) sur . 117

Remarquons que f existe et est unique une constante additive prs. Alors := df satisfait : divA = divA f = 0 sur (n) = (n) df (n) = 0 sur . Conclusion : satisfait la jauge de Coulomb. De plus est unique si en plus nous imposons une condition telle que = 0.

4.6.3

Formulation variationnelle des quations de Maxwell dans le vide

Les quations de Maxwell sont les quations dEulerLagrange dun problme variationnel sur lespace-temps. Pour tout compact K R R3 , nous considrons lespace EK := E, B C 1 (K, R3 )/E + 1 B = 0, div B = 0 . c t

(Noter que les contraintes imposes sont quivalentes la condition dF = 0.) Nous dnissons sur EK la fonctionnelle : AK (E, B) := 1 2
K

|E|2 |B|2 dt dx1 dx2 dx3 .

Proposition 1 Les champs (E, B) EK sont points critiques de AK , pour des variations support compact, si et seulement si rot B 1 E = 0 c t div E = 0. Preuve Toute variation innitsimale de (E, B) EK peut scrire sous la forme 1 U + grad, B + rotU , (E , B ) := E c t 118

2 2 o Cc (K, R) et U Cc (K, R3 ). Nous crivons alors AK (E , B ) = AK (E, B) + +2(,U) AK (E, B) + o() o :

(,U ) AK (E, B) =

grad

1 U c t

B rotU

dt dx1 dx2 dx3 .

En utilisant la relation B rotU = div(U B) + U rotB, nous obtenons (,U ) AK (E, B) =


K

div E U B
K

1 EU c t divE

dt dx1 dx2 dx3 dt dx1 dx2 dx3 .

1 E rotB c t

En vertu du thorme de Stokes, le premier terme dans le membre de droite est gal une intgrale sur le bord de K. Mais comme et U sont ici support compact, cett intgrale sannule. A prsent nous concluons que (E, B) est point critique de AK si et seulement si la dernire intgrale est nulle pour nimporte quel choix de (, U ), ce qui entra ne le rsultat.

4.6.4

La lumire comme oscillation du champ lectromagntique

Toujours en labsence de charges lectriques, les champs lectrique et magntique satisfont lquation des ondes. Pour cela il sut par exemple dappliquer loprateur rotationnel rotE + 1 B = 0, ce qui donne c t grad(divE) E + 1 rotB = 0. c t

En utilisant lquation rotB 1 E = 0 pour liminer rotB et en utilisant c t aussi divE = 0, on en dduit que 1 2E E = 0.. c2 (t)2
B Une manipulation similaire permet dobtenir lquation c12 (t)2 B = 0. Cela signie que les deux champs, en oscillant, propagent des ondes se d2

119

plaant la vitesse7 c. Enn on peut aussi montrer que si on choisit la jauge de Coulomb, alors le potentiel vecteur A satisfait galement lquation 1 2A A = 0. c2 (t)2 Des solutions trs simples sont les ondes planes. Elles sont obtenues en recherchant des solutions particulires des quations de Maxwell dans le vide, pour lesquelles nous supposons que E et B sont de la forme8 E(t, x) = Eei(t+kx) B(t, x) = Bei(t+kx) ,

o E et B sont des vecteurs constants dans C3 . Ici est une constante relle (la pulsation, gale 2, o est la frquence) et k est un vecteur constant (le vecteur donde, dont la direction est celle de la propagation des ondes et la longueur est |k| = 2/, o est la longueur donde). Pour que ces quantits soient solutions de lquation des ondes, il faut et il sut que la relation = c|k| soit satisfaite. Alors les quations de Maxwell deviennent kB E = 0 kE+ B = 0 c c , kB = 0 kE = 0.

En particulier E et B sont orthogonaux entre eux et avec k. Soit 1 et 2 deux vecteurs de R3 tels que ( 1 , 2 , k/|k|) soit une base orthonorme directe de R3 . Alors les solutions du systme prcdent sont : B = b(cos
1

+ sin 2 ) E = b( sin

+ cos 2 )

Ici b est un nombre complexe (dont le module reprsente lintensit et largument une phase) tandis que R/2Z paramtrise un degr de libert supplmentaire qui est la polarisation de la lumire. Notons que, dans la jauge de Coulomb, le potentiel vecteur scrit A = Aei(t+kx) , o A C3 satisfait les conditions k A = 0 et B = ik A. Cela entra ne que A = ik/|k|2 B = c2 ib 2 ( sin 1 + cos 2 ).
si on avait crit les quations de Maxwell en faisant intervenir les constantes 0 (permittivit lectrique dans le vide) et 0 (permabilit magntique dans le vide), on aurait obtenu que c est relie ces constantes par la relation 0 0 c2 = 1 8 en fait E et B sont les parties relles de ces vecteurs complexes
7

120

4.6.5

Les ondes lectromagntiques lintrieur dune cavit cubique

Nous imaginons ici une bote vide dont les parois sont parfaitement conductrice. Nous supposons quelle a une forme de cube et nous la modlisons par louvert Q :=]0, [3 , o est la longueur des artes du cube. Les parois sont une certaine temprature T et nous supposons que le champ lectromagntique lintrieur de la bo te a interagit susament longtemps avec les particules charges qui constituent la paroi, pour quil soit lquilibre thermodynamique avec la paroi. Nous disons alors que le champ lectromagntique lintrieur est la temprature T . Les conditions satisfaites par le champ lectromagntique sur le bord du bord sont que E est parallle au vecteur normal la surface et B est orthogonal . Prliminaire : dcomposition de Fourier sur un intervalle Nous considrons ici des fonctions f C 0 ([0, ]) L2 ([0, ]) et nous rappelons comment il est possible de les dcomposer en sries de Fourier. Nous distinguons deux cas. Dans le cas gnral, on peut tendre toute fonction f C 0 ([0, ]) L2 ([0, ]) en une fonction 2 -priodique et paire sur R, cest dire : x R, f (x) = f (x) et f (x + 2 ) = f (x),

tout en satisfaisant la condition f C 0 (R) L2 (R). Alors nous pouvons loc crire 2 nx a0 cos f (x) = + . an
n=1

Dans le cas particulier o f (0) = f ( ) = 0, alors il est possible dtendre f en une fonction dans C 0 (R) L2 (R), 2 -priodique et impaire, cest dire : loc x R, f (x) = f (x) et f (x + 2 ) = f (x).

Alors nous avons une autre dcomposition de Fourier : f (x) =


n=1

bn

sin

nx

121

Dans chacun des cas, la dcomposition se fait suivant une base hilbertienne orthonorme, qui est soit (cn )nN , soit (sn )nN , o les cn et sn sont des fonctions dnies sur [0, ] par x [0, ], 1 c0 (x) := , cn (x) := 2
n=0

cos

nx

sn (x) :=

sin

nx

En particulier || || bn sn ||2 2 = n=1 L

2 n=0 an cn ||L2 = 2 n=1 |bn | pour

|an |2 pour les fonctions paires et les fonctions impaires.

Dcomposition de Fourier dans un cube Revenons au champ lectromagntique dans le cube Q :=]0, [3 . Nous supposons ici qu tout instant t, les champs lectrique et magntique sont continus sur Q et sont dans L2 (Q, R3 ), cest dire Q |E(t, x)|2 dx1 dx2 dx3

et Q |B(t, x)|2 dx1 dx2 dx3 sont borns t. Cette dernire hypothse est trs naturelle en raison du fait que lnergie lectromagntique linstant t est la quantit 1 (4.2) |E(t, x)|2 + |B(t, x)|2 dx1 dx2 dx3 . 2 Q

Rappelons que, pour toutes fonctions f1 , f2 , f3 L2 ([0, ]), on note f1 f2 f3 le produit tensoriel de ces trois fonctions, cest dire la fonction dnie sur [0, ]3 par f1 f2 f3 (x1 , x2 , x3 ) := f1 (x1 )f2 (x2 )f3 (x3 ). On note L2 ([0, ]) L2 ([0, ]) L2 ([0, ]) lespace vectoriel des combinaisons linaires nies de fonctions de la forme f1 f2 f3 , o chaque fonction f est dans L2 ([0, ]). Alors L2 ([0, ]) L2 ([0, ]) L2 ([0, ]) est dense dans L2 (Q). Une consquence de cela est que, puisque (cn )nN est une base hermitienne orthogonale de L2 ([0, ]), alors (cn1 cn2 cn3 )(n1 ,n2 ,n3 )N3 est une base hermitienne orthogonale de L2 (Q). Et si par exemple on sintresse aux fonctions g L2 (Q) C 0 (Q) qui sannulent lorsque x1 = 0 et x1 = , alors il peut tre plus judicieux de dcomposer g dans la base (sn1 cn2 cn3 )n1 N ,(n2 ,n3 )N2 . Nous appliquons cela aux composantes des champs lectrique et magntique : n E1 (t)cn1 (x1 )sn2 (x2 )sn3 (x3 ) n E(t, x) = E n (t, x), o E n (t, x) := E2 (t)sn1 (x1 )cn2 (x2 )sn3 (x3 ) , n E3 (t)sn1 (x1 )sn2 (x2 )cn3 (x3 ) nN3 122

et B(t, x) =
nN3

B n (t, x),

n n Ici on convient que s0 = 0 et que tous les coecients E (t) ou B (t) sont nuls ds quils apparaissent en facteur de s0 . Cest dire : , [[1, 3]], si n n = et n = 0, alors E (t) = 0 et [[1, 3]], si n = 0, alors B (t) = 0. Lintrt dune telle dcomposition est que chaque terme E n (t, x) ou B n (t, x) dans la dcomposition de E(t, x) ou B(t, x) satisfait les bonnes conditions sur le bord de Q, savoir E n (t, x)// et B n (t, x) sur chaque face de Q.

n B1 (t)sn1 (x1 )cn2 (x2 )cn3 (x3 ) n o B n (t, x) := B2 (t)cn1 (x1 )sn2 (x2 )cn3 (x3 ) . n B3 (t)cn1 (x1 )cn2 (x2 )sn3 (x3 )

Dynamique du champ lectromagntique dans un cube Nous considrons lespace


ERQ :=

(E, B) C 1 R Q, R3 rotE +

C 1 R, C 0 Q, R3

1 B = 0 et div B = 0, E//, B sur R Q c t

et, pour tout compact K R, la fonctionnelle sur ERQ :

AKQ(E, B) :=

1 2

KQ

|E|2 |B|2 dt dx1 dx2 dx3 .

Nous nous intressons donc aux champs dans ERQ qui sont points critiques de AKQ pour tout compact K R. Les dveloppements en sries de Fou rier nous permettent de paramtriser les champs (E, B) dans ERQ par une n n famille dnombrable de fonctions E et B dpendant du temps t R. Nous devons dabord trouver les conditions sur ces fonctions pour que les contraintes rotE + 1 B = 0 et div B = 0 soient satisfaites. Pour cela nous c t calculons que d n n n n2 E3 (t) n3 E2 (t) + c dt B1 (t) sn1 (x1 )cn2 (x2 )cn3 (x3 ) 1 B n n n n3 E1 (t) n1 E3 (t) + d B2 (t) cn1 (x1 )sn2 (x2 )cn3 (x3 ) (t, x) = rotE(t, x)+ c dt c t d n n n n1 E2 (t) n2 E1 (t) + c dt B3 (t) cn1 (x1 )cn2 (x2 )sn3 (x3 ) nN3

et

div B(t, x) =

nN3

n n n n1 B1 (t) + n2 B2 (t) + n3 B3 (t) cn1 (x1 )cn2 (x2 )cn3 (x3 ).

123

Nous en dduisons que

doivent satisfaire les conditions : n, n E n (t) +

n E1 (t) n E n (t) := E2 (t) n E3 (t)

n B1 (t) n et B n (t) := B2 (t) . n B3 (t) (4.3)

dB n (t) = 0 et n B n (t) = 0. c dt

Pour tout n N3 , soit ( 1 , 2 , 3 ) une base orthonorme de R3 telle que 3 = n/|n|. Les solutions de (4.3) sont alors B n (t) = bn,1 (t) 1 +bn,2 (t) 2 , E n (t) = c|n| dbn,2 (t) dt
1

dbn,1 (t) dt

+en,3 (t) 3 ,

o bn,1 , bn,2 et en,3 sont des fonctions C 1 arbitraires. Les deux degrs de libert correspondant bn,1 et bn,2 correspondent la polarisation de la lumire. Revenons aux conditions aux bords. Elles avaient pour consquence sur les n coecients B que, si [[1, 3]] et n N3 sont tels que n = 0 alors n B (t) = 0. Cela peut tre rexprim de la faon suivante : soit (1 , 2 , 3 ) une base orthonorme de R3 associe au cube Q, cest dire constitue par des vecteurs orthogonaux aux faces du cube, alors [[1, 3]], n = 0 entra ne que B n = 0. Donc, en plus dtre orthogonal n, B n doit parfois tre orthogonal dautres direction, selon les valeurs de n. Cela a les consquences suivantes. Soit N3 := (N )3 , N3 := {n N3 /! [[1, 3]], n = 0} et N3 := {n 0 1 2 N3 /, [[1, 3]] avec = et n = n = 0}, de sorte que N3 est la runion disjointe de N3 , N3 et N3 . Alors si n N3 , n est orthogonal au 0 2 1 0 moins deux vecteurs et , avec = ; on peut alors choisir sans perte de gnralit 1 = et 2 = , mais alors comme B n = B n = 0, on a ncessairement bn,1 = bn,2 = 0. Si n N3 , n est orthogonal un unique 1 vecteur ; on peut alors choisir sans perte de gnralit 2 = et alors comme B n = 0, on a ncessairement bn,2 = 0. Enn si n N3 , il ny a 2 aucune contrainte supplmentaire sur bn,1 et bn,2 . Conclusion9 : pour n N3 , 0
9

de mme on obtient que n N3 N3 , en,3 = 0. 0 1

124

il ny a pas de mode, pour n N3 , il ny a quune seule polarisation possible 1 et pour n N3 il y a deux polarisations. 2 Nous pouvons maintenant crire laction AKQ(E, B) en fonction des variables bn,1 , bn,2 et en,3 : nous notons := {(n, 1)/n N3 } {(n, A)/n 1 N3 , A {1, 2}} lensemble des indices pour lesquels b est non nul. Alors 2 2 2 1 db (t) 2 en,3 (t) dt. (b (t))2 + AKQ(E, B) = 2 2 |n|2 2 K c dt 3
nN2

Les quations dEulerLagrange de cette action sont : ,

d2 b (t) c2 2 |n|2 + b (t) = 0, 2 (dt)2 n N3 , 2 en,3 (t) = 0.

La dernire quation exprime le fait que divE = 0 (loi de Gauss) et nous retrouvons ainsi une des quations de Maxwell en labsence de charge. Les autres quations sur les variables b montrent que notre problme a une formulation semblable celle dune assemble dnombrable doscillateurs harmoniques. Formulation hamiltonienne Il est maintenant ais de formuler les quations de Maxwell dans notre cube sous une forme hamiltonienne. Nous laissons de ct les variables en,3 , puisquelles sont nulles10 . La transformation de Legendre est trs simple ici puisquil sut de changer le signe de l nergie potentielle et de faire la sub2 d stitution p = c2 2 |n|2 dt b . Nous obtenons ainsi lhamiltonien : H(b , p ) :=
10

1 2

c2 2 |n|2
2

(p )2 + (b )2 .

le fait que lon retrouve ces quations o la drive par rapport au temps nintervient pas (i.e. en,3 (t) = 0) parmi les quations de la dynamique est caractristique des thories de jauge et est reli au fait quil existe une innit de potentiel de jauge pour le champ lectromagntique. Ces relations sont un obstacle la formulation hamiltonienne (car la transformation de jauge est alors dgnre) et cest pourquoi elles font lobjet dun traitement spcial : nous annulons ici simplement toutes les quantits en,3 et nous ignorons donc ces composantes dans la suite.

125

Il est remarquable11 que cette quantit co ncide avec lnergie totale dnie en (4.2). Rfrences : J. Harthong, Probabilits et statistiques, Diderot Multimdia 1996 ou : http ://moire4.u-strasbg.fr/bouquins/proba/tabmat1.htm J. Kouneiher, Cours de Mcanique quantique, Universit de Marne-la-Valle.

en fait a nest pas un hasard et il est possible darriver au mme rsultat directement sans passer par des sries de Fourier

11

126

Chapitre 5 Vers la quantication des tats dnergie de la matire


Le problme de lquilibre thermodynamique de la lumire et de la matire, rsolu par Planck en 1900 et Einstein en 1905, ntait quune partie des dicults thoriques rencontres pour concilier la mcanique de Galile et Newton et llectromagntisme de Maxwell. Deux autres problmes se posaient : la mcanique newtonienne et llectromagntisme se comportent trs diremment par changement de rfrentiel. Suite aux travaux de G.F. Fitzgerald et H.A. Lorentz et aux expriences de A.A. Michelson et E.W. Morley, la rponse ces dicults fut apporte par la thorie de la relativit restreinte, construite par A. Einstein et H. Poincar en 1905. les raies spectrales : lorsquils sont excits, des atomes dhydrogne nmettent de la lumire que dans certaines frquences, qui forment un sous-ensemble discret de toutes les frquences envisageables, le spectre de latome dhydrogne. Ce phnomne avait fait lobjet de nombreuses expriences assez prcises. Toutefois on ne connaissait aucune explication thorique ces raies spectrales. Nous allons voir plus en dtail ces deux nigmes et examiner comment elles ont t rsolues. Au passage nous dcouvrirons comment les rponses apportes ont contribu ldice de la mcanique quantique. 127

5.1

Quelques lments de relativit

Lhistoire remonte en fait Galile (15641642) qui observe et formule son principe dinertie : Le mouvement dun corps massif qui nest soumis aucune force est un mouvement de translation rectiligne uniforme. Tel quil est nonc, ce principe est incomplet, car nous navons pas prcis dans quelles conditions et plus prcisment dans quel repre il sapplique. Il est clair que lon peut le vrier avec une bonne approximation sur la terre ferme ( condition davoir pu se dbarasser de la force de gravit et des forces de frottement), par exemple en faisant rouler des billes sur une surface parfaitement plane et horizontale. Mais si la surface et lobservateur sont embarqus sur un bateau soumis divers mouvements, cest bien videmment faux. Galile prend ainsi conscience de la ncessit de prciser les conditions dapplication du principe dinertie. En termes mathmatiques (avec les acquis des coordonnes de Descartes et beaucoup plus tard de la gomtrie direntielle) nous pouvons modliser ces conditions par un repre, cest dire un systme de coordonnes sur lespace-temps. Notons E lespace-temps, ou lensemble des vnements , cest dire de la donne dune position dans lespace et dun instant au cours du temps. Un systme de coordones est une bijection : E R R3 e (t, x1 , x2 , x3 ).

Jusqu la n du XIXme sicle, comme on supposait implicitement que E a une structure despace ane, on nenvisageait que des systmes de coordonnes anes, donc compltement caractriss par la donne dune origine 0 (un point dans lespace une certaine date), dune chelle de temps (donne par une horloge qui se trouve en 0 linstant 0) et de trois axes de coordonnes, cest dire un repre despace-temps. Galile avait donc suppos, pour complter son principe dinertie, quil existait des repres que lon dit tre inertiels dans lesquels son principe dinertie sappliquait. Noter qu partir du moment o lon sait quil existe au moins un systme de coordonnes inertielles, il est facile den trouver une innit : soit : E R R3 un autre systme de coordonnes anes et supposons que = T , o T : R R3 R R3 est une bijection ane. Alors si 128

le repre R associ est inertiel, le repre R associ est aussi inertiel et vice-versa. A lpoque il tait naturel de se restreindre des bijections anes T qui ne modient pas lchelle de temps (sauf changer lorigine du calendrier) et qui respectent les longueurs (sinon cela aurait pour eet de changer la dnition de la masse dun rfrentiel un autre). Lensemble des transformations T qui transforment un systme de coordonnes inertielles en un autre (et qui prservent lorientation) sidentie au groupe : G := T : t x 1 0 v R t x + t0 x0 /t0 R, x0 , v R3 , R SO(3) ,

que lon appelle groupe de Galile. Une fois cette observation faite se pose la question suivante, de nature plus philosophique : dans chaque repre inertiel les lois de la physique sont les mmes, donc apparemment aucun ne semble tre privilgi par les lois de la physique. Est-ce que cela signie quil nexiste aucun repre inertiel privilgi ou absolu, comme celui (approximativement inertiel) associ la terre (voire au soleil) ? Allant contre le sens commun et les intrts de lEglise, Galile suppose que non : il ny a pas de repre privilgi. Cest le principe de relativit galilenne. Ce principe fut admis et il tait en particulier compatible avec les lois de la mcanique newtonienne. Rien ne semblt le remettre en question pendant longtemps. Mais au XIXme sicle les progrs accomplis dans la comprhension de la lumire soulevrent de nouvelles dicults. En eet les expriences de Fresnel et de Young montraient de faon irrfutable que la lumire est un phnomne ondulatoire, cest dire analogue la propagation des ondes la surface dun tang ou aux ondes sonores. Dans les deux comparaisons, le phnomne ondulatoire a lieu au sein dun milieu matriel (qui est leau pour les ondes la surface de ltang et lair pour les ondes acoustiques) et la propagation dune onde est la transmission dune nergie (potentielle et cintique) travers ce milieu. Lide la plus naturelle qui se prsenta fut dimaginer que la lumire avait une nature similaire. Cela conduisit lhypothse quil existait un milieu matriel uide emplissant lunivers, que lon appela ther, dont les vibrations pouvaient sinterprter comme les ondes lumineuses. Bien videmment on ne disposait lpoque daucunes donnes exprimentales sur cet ther. La propagation de la lumire pouvait alors tre modlise par 129

lquation des ondes : 1 2f f = 0, c2 (t)2 dans laquelle on pourrait concevoir la fonction f comme une sorte de pression locale de lther. La mme poque voit ltablissement des lois de llectromagntisme par M. Faraday et J.C. Maxwell et lexplication de la lumire comme un phnomne lectromagntique. Ainsi les proprits de lther devaient aussi expliquer llectromagntisme. Ce nest que plus tard que le concept, relativement plus abstrait, de champ lectromagntique fut introduit et remplaca la notion dther. En fait la thorie de lther tait en contradiction avec la relativit galilenne. En eet lquation des ondes nest pas invariante par le groupe de Galile, comme lillustre lexercice qui suit. Exercice 9 On considre la transformation T G dnie par 1 0 0 0 t t v 1 0 0 x1 x1 T : 2 0 0 1 0 x2 . x x3 0 0 0 1 x3

Soit F : E R une composante du champ lectromagntique (dont lvolu tion dcrit une onde lumineuse) et R et R deux rfrentiels galilens. On note (respectivement ) la carte locale et (t, x1 , x2 , x3 ) (respectivement , x1 , x2 , x3 )) le systme de coordonne associ R (respectivement R) et (t f (respectivement f ) la reprsentation de F dans R (respectivement R), de sorte que F = f = f . Dmontrer que, si = T , 1 2f (t, x) f c2 (t)2 (t, x) = +
2 . (3 )2 x 2 2 2 1 2f f 2v f + v f T (t, x), c2 ( t)2 c t x1 c2 ( x1 )2

o =

2 (1 )2 x

2 (2 )2 x

130

Cet exercice montre que, si jamais f est solution de lquation des ondes, alors f nest pas une solution de lquation des ondes en gnrale. Cela montre que lquation des ondes lumineuse est altre lorsque lon passe dun rfrentiel galilen un autre. Cest a fortiori aussi le cas pour les quations de Maxwell. Les physiciens de lpoque se trouvrent face un choix : il fallait soit abandonner le principe de relativit de Galile, soit renoncer linterprtation ondulatoire de la lumire, qui reposait lpoque sur la thorie de lther. Comme la nature ondulatoire de la lumire est un phnomne exprimental beaucoup plus vident que lexistence ou labsence dun repre absolu, il semblait prfrable de simplement supposer que le principe de relativit de Galile ntait pas vrai. Et alors il devait exister un repre privilgi, du moins du point de vue des phnomnes lectromagntiques, dans lequel lther tait au repos. Une troisime possibilit, permettant de rconcilier le principe de relativit de Galile et la nature ondulatoire de la lumire, fut mise au point la n du XIXme sicle et au dbut du XXme sicle et est lobjet de la thorie de la relativit. La premire tape vers cette thorie est la dcouverte dun groupe de changements de coordonnes despace-temps compatible avec les quations de llectromagntisme et pouvant se substituer au groupe de Galile. De telles transformations furent proposes dabord par G.F. Fitzgerald et H.A. Lorentz comme lois phnomnologiques dcrivant comment la matire est "dforme" lorsque lon passe dun repre un autre, qui est en mouvement de translation vitesse constante par rapport au premier. Cette thorie navait pas lambition de remettre en question la thorie de lther mais reposait sur lhypothse physique que les particules de matires taient des phnomnes lectromagntiques, donc supports par lther. Un peu plus tard H. Poincar remarqua que ces rgles forment un groupe de transformations, tout commes les changements de repre galilens. En mme temps ces transformations laissent invariantes les quations de Maxwell, ce qui nest pas surprenant puisque prcisment la dmarche de Fitzgerald et Lorentz sappuyait sur une vision "lectromagntique" de la matire. Lensemble de ces transformations est SO (1, 3) := T : t x ch 1 shn c cshn Rch t x / R, n S 2 , R SO(3) .

H. Poincar appela cet ensemble groupe de Lorentz et montra que lon peut 131

tendre ce groupe en en faisant le produit semi-direct par les translations dans lespace-temps (ce groupe tendu est appel groupe de Poincar). Lexercice suivant permet de vrier que lquation des ondes est invariante par le groupe de Lorentz. Exercice 10 Dmontrer que, pour toute transformation R SO (1, 3), si f = f T , alors 1 2f f = c2 (t)2 1 2f f T. c2 ( t)2

Une des particularits de ces transformations (et qui sera lorigine des rsistance psychologiques opposes la thorie de la relativit ultrieurement) est que lchelle de temps peut se retrouver contracte ou dilatee dun systme de coordonnnes un autre, semblant passer plus ou moins vite dans lun des systmes. Et il en est de mme pour certaines cordonnes despace. Mais pour Lorentz ou Fitzgerald il ne sagissait que deets phnomnologiques, explicables par les forces de freinage que devait exercer lther sur tout corps qui se dplaait par rapport lui. Lhypothse de lther suggrait une exprience dont le but serait de dterminer le rfrentiel absolu, autrement dit de mesurer le dplacement du rfrentiel li un laboratoire contruit sur terre par rapport lther, suppos immobile. Une telle exprience fut ralise par A.A. Michelson et E.W. Morley en 1887. Le rsultat fut un choc : tout se passait comme si la terre tait immobile ! Cela semble tre une concidence hautement improbable, sachant que la terre tourne autour delle-mme, autour du soleil et que le soleil na aucune raison dtre lui-mme immobile, etc. Sans rentrer dans une description dtaille de lexprience, il faut mentionner quelle reposait sur une mesure trs ne (grce des mesures dinterfrences lumineuses) des variations de la vitesse de la lumire lorsquelle se propage dans direntes directions. A vrai dire, ce quindiquait clairement le rsultat de lexprience, cest que la vitesse de la lumire est constante dans toute les directions dans le rfrentiel li la terre. Il tait dicile de supposer que la terre soit immobile : ceut t revenir la thse ocielle de lglise lpoque de G. Bruno et G. Galile. Une solution radicale fut propose par Einstein en 1905. Elle ncessite tout dabord 132

dabandonner lide de lther, mais en contrepartie elle rtablit le principe de relativit de Galile qui avait t momentanment cart. Mais il sagit bien sr dadapter le principe de relativit, an quil soit compatible avec les lois de llectromagntisme et les rsultats de lexprience de Michelson et Morley. Cela fut accompli en partant du principe que la vitesse de la lumire est la mme dans tous les rfrentiels inertiels. Mathmatiquement ce postulat de base amne remplacer le groupe de Galile par le groupe de Lorentz ou le groupe de Poincar. Alors les transformations entre deux rfrentiels inertiels laissent invariantes les quations de Maxwell. Cela est la base de la thorie de la relativit. Une version un peu dirente de cette thorie fut propose indpendamment et la mme poque par H. Poincar. Dun point de vue mathmatique, il est utile dobserver, comme le rent H. Poincar et H. Minkowski, que le groupe de Poincar est le groupe des isomtries linaires qui laissent invariantes la forme quadratique1 ( produit scalaire de Minkowski ) (t1 , x1 , x2 , x3 ), (t2 , x1 , x2 , x3 ) := c2 t1 t2 x1 x1 x2 x2 x3 x3 . 1 1 1 2 2 2 1 2 1 2 1 2 Lespace-temps M 4 muni dune structure ane et de la distance obtenue partir de ce produit scalaire est appel espace de Minkowski. Cette proprit est trs utile du point de vue mathmatique, puisquil est possible de dduire linvariance des quations de Maxwell dans le vide par SO (1, 3) partir du fait que les transformations dans SO (1, 3) prservent le produit scalaire de Minkowski2 . Cela tant acquis, il restait reconstruire ce qui avait t dmoli et trouver une thorie de la dynamique pouvant se substituer la thorie de Newton suiplus exactement SO (1, 3) est la composante connexe de lidentit du groupe O(1, 3) des transformations linaires qui sont des isomtries de R4 muni du produit scalaire de Minkowski. Ce groupe a 4 composantes connexes qui se distinguent entre elles selon que les transformations prservent ou non lorientation de lespace-temps et le sens dcoulement du temps. 2 un procd pour dmontrer cela consiste crire les quations de Maxwell dans le vide sous la forme dF = d( F ) = 0, o F est la 2-forme sur lespace-temps de Minkowski dont les composantes reprsentent le champ lectromagntique et sapercevoir que F est limage de F par loprateur de Hodge : 2 R4 2 R4 qui toute 2-forme associe dunique 2-forme telle que, pour toute 2-forme , = , cdt dx1 dx2 dx3 . Ici , est le produit scalaire sur les 2-formes construit partir du produit scalaire de Minkowski.
1

133

vant ces nouveaux principes. Nnous allons la retrouver en nous aidant dune formulation variationnelle. Nous nous contentons ici dtudier le mouvement dune particule dans lespace-temps de Minkowski qui nest soumise aucune force. Fidles aux principes noncs par Galile, nous postulons quune telle particule doit avoir un mouvement de translation rectiligne uniforme, dont la trajectoire dans lespace-temps de Minkowski est une droite. Parmi les fonctionnelles dnies sur lespace des paramtrisations de trajectoires C 2 (R, M 4 ) qui sont invariantes par le groupe de Poincar, celles qui sont les plus simples gomtriquement et dont les points critiques sont des droites sont : la lond ( ), ( ) d et lnergie R 1 ( ), ( ) d , o := d . Nous gueur R 2 remarquons ici que la quantit ( ), ( ) nest pas toujours positive : cette norme au carr est nulle si ( ) prend ses valeurs dans un cone, appel cone de lumire, positive l intrieur de cone et ngative l extrieur de ce cone. Lingalit ( ), ( ) > 0 signie que la vitesse de la particule qui suit la trajectoire est strictement infrieure celle de la lumire. Cest bien la situation la plus raliste pour une particule matrielle, cest pourquoi nous considrons les fonctionnelles sur lespace : := { C 2 (R, M 4 )/ R, ( ), ( ) > 0} ( ), ( ) des trajectoires de type temps . Cela permet dviter de considrer lorsque ( ), ( ) est ngatif. Les deux types daction (longueur ou nergie) donnent essentiellement les mmes rsultats. Prenons par exemple le cas de la longueur : L[] = A ( ), ( ) d.
R

Cette fonctionnelle est invariante par changement de paramtrisation de : pour tout diomorphisme : R R, L[ ] = L[] (Exercice : vrier). Ici la constante A peut tre ajuste de faon essayer de retrouver les principes de la physique newtonienne lorsque la particule a une vitesse trs petite par rapport la vitesse de la lumire. Envisageons une trajectoire qui soit un point critique de L, cest dire dont limage dans M 4 est une droite. En vertu de linvariance par changement de paramtrisation, nous sommes libres de choisir une paramtrisation telle que ( ) = t(, v 1 , v 2 , v 3 ). Alors L[] = A = A
R

c2
R

|v|2 d

c 1

|v|2 + O(c4 ) d = 2c2 134

|v|2 =A c 1 2 c R
R

1 2

d Ac A |v|2 + O(c3 ) d. 2c

>0 =0 <0

Fig. 5.1 Le cone de lumire et le signe de v, v selon que v soit lintrieure, lextrieur ou sur le cone de lumire.

Nous voyons que le premier terme napporte aucune information tandis que le deuxime concide avec laction de Maupertuis condition que A = mc. Nous choisissons donc cette valeur : L[] := mc R c2 |v|2 d . Il est intressant de calculer les valeurs des impulsions donnes par le lagrangien L(( )) = mc ( ), ( ) , toujours pour une trajectoire ( ) = t 1 2 3 (, v , v , v ) : L = t mc3 c2 |v|2 = mc2 1 |v|2 /c2 mcv = c2 |v|2 = mc2 m mv . 1 |v|2 /c2 |v|2 + O(c2 ), 2

L = x

Cela nous donne les valeurs du moment cintique p = gie E = L = t


mc2 1|v|2 /c2
2

mv 1|v|2 /c2

et de lner-

= mc2 + m |v| + O(c2 ) pour une particule en 2

mcanique relativiste. A des vitesses petites par rapport c, il apparat que lnergie est approximativement la somme de deux contributions : le fameux terme mc2 qui sinterprte comme une nergie au repos et lnergie cintique classique. Dans le point de vue gomtrique de Minkowski, il est 135

naturel dinterprter ces quantits comme les composantes (p0 , p1 , p2 , p3 ) := que lon a coutume dappeler quadrivecteur 3 . Ce covecteur satisfait une relation importante, c12 (p0 )2 (p1 )2 (p2 )2 (p3 )2 = m2 c2 , que les physiciens ont lhabitude dcrire sous la forme : E 2 c2 |p|2 = (mc2 )2 . (5.1)
mc2 , 1|v|2 /c2

mv 1|v|2 /c2

dun covecteur quadri-impulsion dans T M 4 ,

5.2

Retour aux quanta de lumires

qui relie la pulsation au vecteur donde k, une analogie saute aux yeux. Nous avons ici volontairement multipli le terme 2 c2 |k|2 par 2 . Sachant que sinterprte comme lnergie dun quantum de lumire (photon), nous sommes tents de faire le rapprochement et dimaginer que : Le photon est une particule dont la masse au repos est nulle, lnergie est E = et dont limpulsion est p = k. Cette hypothse fut propose par Einstein en 1905. Elle attribue ainsi au quantum de lumire le statut de particule. Elle sera conrme en 1923 par la dcouverte exprimentale de leet Compton, observ lors de la diraction de rayons X (photons trs nergtiques) sur une mince feuille daluminium : les lectrons sont expulss et le rayonnement est dius avec une longueur donde dirente de la longueur donde incidente. Ce phnomne ne peut pas sexpliquer avec un point de vue ondulatoire sur la lumire, mais corpusculaire. Les observations exprimentales conrment que lon doit appliquer les mmes rgles de conservation dnergie et de moment cintique que pour les collisions de particules relativistes massives, avec la valeur p = k pour le photon. Plus tard nous reviendrons sur la comparaison entre (5.1) et (5.2).
3

La relation (5.1) a jou un rle important dans le dveloppement de la mcanique quantique. En la comparant avec la relation de dispersion pour la lumire 2 2 c2 2 |k|2 = 0, (5.2)

un gomtre direntiel dirait plutt quadricovecteur .

136

5.3

Le spectre des atomes

Un autre problme se posait la physique, celui des raies spectrales des atomes. Soulignons qu la dirence des questions lorigine de la thorie de la relativit restreinte, rien ne laissait prsager au dpart que la comprhension des raies spectrales ncessitait de bouleverser les rgles de la physique. De plus, jusquau dbut du XXme sicle, on ne disposait pas de modle dcrivant latome de faon susamment complte pour pouvoir tre test4 . Le phnomne est le suivant : les atomes nmettent de la lumire (ou plus gnralement des rayonnements lectromagntiques) qu certaines longueurs donde. Par exemple latome dhydrogne ne peut mettre qu des frquences = c/ particulires. En 1885 Balmer (il ntait pas physicien, mais un professeur de lyce, passionn de numrologie) dcouvre que la longueur donde de la lumire mise par lhydrogne dans le spectre visible satisfait ncessairement la relation : 1 1 = L 1 4 n2 , o n N et n 3.

Ultrieurement dautres valeurs de ont pu tre mesures (en dehors du spectre visible) : elles obissent la rgle de Rydberg, gnralisant celle de Balmer : 1 1 1 =R 2 , o n, m N et m < n, 2 m n o R est la constante de Rydberg R = 4/L (L tant la longueur de Balmer ). Ltude du spectre des atomes tait une discipline scientique part entire, mais relativement ignore des physiciens, tel point que Bohr, dont nous parlerons plus loin neut connaissance de la rgle de Balmer que quelques semaines avant de faire sa dcouverte. En 1911, grce des expriences qui consistent bombarder des plaques mtalliques par des rayonnements 5 , E. Rutherford dcouvre que la structure
toutefois un modle avait t bti par Lorentz, en partant dune ide propose par Thomson. Dans ce modle les lectrons taient agits dun mouvement de vibration lintrieur de latome. Cest notament sur ce modle que Planck sappuya dans son travail sur linteraction de la matire avec la lumire. 5 il sagit de noyaux dHlium, cest dire constitus de 2 protons et 2 neutrons
4

137

de latome est dirente de ce que lon pensait jusqualors : les charges positives sont en fait concentres dans un volume trs petit par rapport au reste de latome. Rutherford conoit alors son modle plantaire de latome, calqu sur le systme solaire : des lectrons trs lgers (que lon imagine comme des particules quasiment ponctuelles) gravitent autour dun noyau charg positivement et plusieurs milliers de fois plus massif que llectron. La taille du noyau est de lordre de 104 fois plus petite que celle de latome. Cela autorise une description plus prcise de latome dhydrogne : soit mp la masse du noyau (proton) et me celle de llectron, soit q la charge du noyau et q celle de llectron. Lvolution du systme atomique est dcrite par les points critiques de |p |2 |e |2 q2 mp + me + dt. 2 2 40 |p e | R Exercice 11 On pose C(t) :=
mp me mp +me mp p (t)+me e (t) mp +me

(masse rduite) et e2 = (position relative), m := 1) Dmontrer que laction se rcrit : (mp + me )


R

(centre de masse), := e p
q2 . 40

|C|2 dt + 2

m
R

||2 e2 + dt. 2 ||

On notera A() la deuxime intgrale. 2) Dmontrer que les quations dEuler-Lagrange de cette action sont : (mp + me )C = 0 et m = e2 . ||3

Expliquer pourquoi on peut se ramener ltude de (et laisser de ct C). 3) On recherche les solutions circulaires, de la forme (t) = t(r cos t, r sin t, 0). Dmontrer quune telle expression est solution des quations du mouvement si et seulement si : e2 m 2 r = . (5.3) r
e 4) Lnergie cintique est Ec = m || , lnergie potentielle est Ep = || et 2 lnergie totale E = Ec + Ep . Calculer la valeur de Ec pour une solution circulaire en fonction de e2 et r. En dduire que E = e2 /2r. 5) Lintensit du moment angulaire6 pour une trajectoire circulaire est J =
2 2

J := m

138

mr 2 . Exprimer J en fonction de m, e2 et r pour une solution circulaire (on pourra utiliser (5.3)). En dduire la relation suivante entre lnergie totale et J : me4 (5.4) E = 2. 2J Le modle de Rutherford permettait de faire un certain nombre de calculs mais, pas dexpliquer les raies spectrales, cest dire lapparition de valeurs discrtes pour les frquences de la lumire mise par les atomes. De plus ce modle sourait dune dicult que nous navons pas le temps de dtailler ici : le mouvement de llectron est ncessairement acclr (que la trajectoire de llectron soit circulaire ou elliptique). Or on peut dmontrer (en utilisant les quations de Maxwell avec source) que toute particule lectriquement charge rayonne de lnergie sous forme donde lectromagntique. Or la relation E = e2 /2r (pour une trajectoire circulaire) montre que si llectron perd de lnergie sa distance au noyau diminue. En dautre termes le rayonnement lectromagntique mis par llectron freine celui-ci et lon peut calculer que llectron devrait scraser sur le noyau en une fraction de seconde. Cela est videmment en contradiction avec la trs grande stabilit de latome. Ainsi nous sommes face une incohrence srieuse, qui nest pas sans rappeler les dicults rencontres pour comprendre le rayonnement du corp noir. En 1912 N. Bohr a connaissance de ces problmes, de la quantication de la lumire par Planck et Einstein et enn, tout rcemment il vient dapprendre les rgles de Balmer. Il conoit alors en quelques semaines le modle suivant : Comme pour la lumire, les niveaux dnergie de llectron dans latome sont quantis. Plus prcisment, en dehors des phnomnes transitoires, llectron est dans un tat stationnaire et les tats stationnaires ne peuvent prendre que certains niveaux dnergies, discrets : E1 < E2 < < En < < 0. Lorsquun lectron passe dun tat stationnaire avec un niveau dnergie E n un autre tat stationnaire avec un niveau dnergie Em , avec m < n, il met un photon dont lnergie est = En Em . Lide est donc en quelque sorte de se dbarrasser du problme de la perte dnergie par rayonnement en postulant que les orbites de llectron dans 139

latome nobissent pas aux lois de la physique classique, mais dautres rgles qui, comme pour la quantication de la lumire, restent encore mystrieuses. Lintrt est aussi dinterprter les raies spectrales : la rgle de Rydberg (associe avec la quantication de Planck et Einstein de la lumire) nous enseigne que les photons mis par latome dhydrogne ont une nergie = hc = hcR 1 1 2 m2 n , o n, m N et m < n.

Une telle expression est bien du type En Em , o : En = hcR , n2 Em = hcR m2 pour n, m N et m < n.

Il reste interprter le sens de cette relation. Nous pouvons comparer la rgle de quantication En = hcR avec le rsultat du calcul classique donn en n2 me4 (5.4) : E = 2J 2 . Cela donne : me4 hcR = 2 n2 2J J= me4 n. 2hcR
me4 2hcR

Rappelons que la constante de Rydberg R tait phnomnologique. Une observation cruciale est que la valeur du coecient = h/2. concide avec...

Conclusion N. Bohr adopte comme rgle de quantication des niveaux dnergie de llectron dans latome dhydrogne que le moment cintique angulaire J est gal Jn o : Jn := n me4 1 En = 2 2 , 2 n pour n N .

Exercice 12 Dmontrer que, si (t) est une solution classique circulaire de m = e2 /||3 de priode 2/ et si J = n, alors
2/ 0 3

p dq = nh,
=1 L ((t), (t)) v

o q(t) = (t) est la position et p (t) = m|v|2 /2 + e2 /|x|) est limpulsion. 140

(avec L(x, v) :=

Fig. 5.2 Une interprtation semi-classique de la quantication dun mouvement priodique : laire entoure par la trajectoire dans lespace symplectique est un multiple entier de h.

Le rsultat de cet exercice montre que la rgle de quantication de Bohr a une interprtation de mme nature que celle de Planck (o lon avait assimil un mode lectromagntique un oscillateur harmonique) : dans les deux cas, lintgrale pdq sur une orbite priodique (donc laire symplectique enferme par la trajectoire hamiltonienne) est un multiple entier de h (il sagit dune observation due Einstein).

5.4

Lquation dHamiltonJacobi

Nous allons remonter un peu en arrire et revenir une question que stait pose Hamilton : comment concilier le principe de Huygens et celui de Fermat pour la lumire ? Rappelons que, selon le point de vue de Huygens, la lumire est une onde qui se propage dans lespace un peu la manire des ronds que lon observe la surface de leau dun tang lorsquon jette un caillou. Cette hypothse fut conrme exprimentalement par les expriences de diraction de Young et Fresnel et est totalement prise en compte dans la description de la lumire comme une oscillation du champ lectromagntique donne par la thorie de Maxwell. Suivant Huygens, nous pouvons donc associer une onde lumineuse des surfaces ( fronts donde , que dans le cadre de la thorie de Maxwell nous pouvons interprter comme les surfaces de niveau dune des composantes du champ lectromagntique satisfaisant lquation des ondes) se propageant dans lespace. Il argua quen connaissant 141


q nh

t +dt

Fig. 5.3 Le principe de Huygens : le front donde linstant t + dt est lenveloppe des sphres de rayon c dt centres sur tous les points du front donde linstant t.

la position dun front donde un certain instant t et la direction dans laquelle la lumire se propage, il est possible de construire gomtriquement la position du front donde un instant innitsimalement ultrieur t + dt, comme tant lenveloppe de sphres innitsimales de rayon cdt centres sur tous les points du front donde. Cette construction est le principe de Huygens. Ce principe tait concurrent dune autre description de la lumire, envisage comme la propagation dun rayon suivant le plus court chemin, comme le prvoit le principe de Fermat. Il semblait toutefois que les partisans dun tel point de vue aient perdu la bataille au dbut du XIXme sicle, lorsque les expriences de diraction avaient impos le point de vue de Huygens7 . Cependant Hamilton cherchait comprendre comment les deux aspects antagonistes de la lumire pouvaient tre compris simultanment : il sagit de btir une description intgrant la propagation de fronts donde et de rayons ponctuelles. Lide est que chaque sphre innitsimale de Huygens de rayon cdt soit simplement le lieu des extrmits des chemins de longueur extrmale (donc des segments de droite) issus dun mme point A sur le front donde initial ( linstant t). Le front donde ultrieur ( linstant t + dt) tant lenveloppe de toutes les petites sphres, il est ncessairement tangent aux sphres innitsimales. Donc le segment de droite innitsimal qui joint
Bien sr les dcouvertes de Planck et Einstein viendront restaurer partiellement la pertinence dune thorie corpusculaire de la lumire
7

142

t+dt

t+dt

Fig. 5.4 Le chemin de A A est la fois le plus court chemin entre A et le point de contact de la sphre de Huygens avec le front donde ultrieur (en t + dt) et le plus court chemin entre A et le front donde ultrieur.

le point A sur la surface initiale au point de contact de la sphre centre en A avec la surface ultrieure est aussi le plus court chemin qui joint A la surface ultrieure (voir gure 5.4). Nous donnons dans la suite une prsentation mathmatique de cette ide et de sa gnralisation (en partie due Carathodory) pour un problme variationnel une variable (le temps). Dans la suite on pourra imaginer que la densit lagrangienne est L(, ) = m ||2 V (), cest dire est celle du 2 principe de Maupertuis. Principe Nous considrons un ouvert de R R3 (espace-temps) et une densit lagrangienne L C 1 ( R3 ) (une fonction des variables (t, x) et v R3 ). Cela dnit une action A pour toute trajectoire (I, ) (o I est un intervalle de R et I t (t) = (t, (t)) paramtrise une courbe de classe C 1 ) par : A[I, ] := L(t, (t), (t))dt.
I

Nous cherchons : une famille dhypersurfaces (Hs )s[s,s] qui forme un feuilletage de (les fronts donde dans lespace-temps) une famille de trajectoires (Iq , q )q (o est un ouvert de R3 ) qui 143

forme un feuilletage de , o Iq Avec les proprits que

t q (t) = (t, q (t)) .

(i) chaque trajectoire q coupe chaque hypersurface Hs en un seul point (ts , xs ) := (ts , q (ts )) et q q q q
s s s (ii) si Iq :=] , ts ] Iq , (Iq , q|Iq ) est point critique de A pour des variaq tions qui autorisent le point extrmit (ts , q (ts )) glisser le long q q de Hs .

q Hs

Hs

tq Hs q

Fig. 5.5 Le feuilletage de par la famille de fronts donde (Hs )s[s,s] et la famille de trajectoires (Iq , q )q . La proprit (ii) est une gnralisation du principe de Huygens. Prcisons un peu les hypothses. Sans perte de gnralit, nous pouvons choisir lindice q de faon ce quil dsigne le point de lespace dont est issue la trajectoire q : Iq est un intervalle de la forme [ts , ts ] et q (ts ) = q. Nous supposons de plus q q q que {(ts , q)/q } co ncide avec une hypersurface Hs et {(ts , xs )/q } q q q avec une autre hypersurface Hs . Pour tout s ]s, s] nous notons
s s s Eq := {([tq , t], )/ C 1 ([ts , t], ), [ts , t], ( ) = (, ( )), (tq ) = q, (t) Hs } q q

et, pour toute valeur de (s , s ) telle que s s < s s s, nous dnissons 144

s la fonctionnelle sur Eq

As (I, ) = s

(t,(t))Hs

L(t, (t), (t))dt.


(t,(t))Hs

s s Noter que lhypothse (ii) signie que (Iq , q|Iq ) est point critique de As sur s s Eq .

Cela va entraner la proprit suivante : pour tout q1 , q2 Hs les trajectoires s s q1 et q2 issues respectivement de (tq1 , q1 ) et (tq2 , q2 ) ont mme action entre deux valeurs s < s . Cest dire, s , s , telles que s s < s s, As (Iq1 , q1 ) = As (Iq2 , q2 ). s s (5.5)

Preuve Supposons dans un premier temps que s < s . Soit ]0 , 0 [ q() un chemin de classe C 1 dans et considrons la famille de trajectoires un paramtre (Iq() , q() ) correspondantes. Nous posons q := q(0). Nous considrons une famille de dformations (I , ) de (Iq , q ), o I = [ts , ts ], q q() co ncide avec q sur un voisinage de ts dans [ts , ts [, et co telle que q q q() ncide avec q() sur [ts , ts ]. De q() q() As (I , ) = As (Iq , q ) + o() s s et As (I , ) = As (Iq , q ) + o(), s s As (Iq() , q() ) = As (I , ) = As (Iq , q ) + o(). s s s Cela entra ne donc que As (Iq , q ) est constant lorsque q parcourt Hs (car s la drive de cette expression par rapport est nulle). Lidentit (5.5) pour s < s < s s stend au cas s = s de la faon s suivante : puisque q est C 1 sur [tq , ts ], lims s As (q ) = As (q ). Il sut s q s donc de passer la limite dans (5.5) lorsque s s.

nous dduisons par soustraction (puisque As = As + As ) que s s s

Une consquence de (5.5) est la suivante : puisque As (Iq , q ) ne dpend s que de s et s , on peut poser As (Iq , q ) = F (s , s ). Et cause de la pros prit dadditivit As (Iq , q ) = As (Iq , q ) + As (Iq , q ), on a F (s , s ) = s s s 145

s A s A

s s =

s A s - A

s s + A

s s - A

s s

= o( )

Fig. 5.6 Lide du calcul de As (Iq() , q() ) As (Iq , q ). s s F (s , s ) + F (s , s ) et donc F (s , s ) = f (s ) f (s ), pour une certaine fonction f . Supposons que f soit une fonction monotone8 (et donc un diomorphisme), alors, quitte changer s en f (s), nous pouvons supposer que f (s) = s. Donc nous nous ramenons ainsi au cas o As (Iq , q ) = s s. s (5.6)

Dnissons la fonction S : R par s [s, s], (t, x) Hs , S(t, x) = s. Autrement dit les ensembles de niveau de S sont exactement les hypersurfaces Hs . La dnition de S et la proprit (5.6) peuvent tre rsumes par q , s [s, s], S(ts , xs ) q q
ts q

=s=s+

tq

L(, q ( ), q ( ))d.

(5.7)

Cette relation entra ne, en remplaant (ts , xs ) par (ts + t, q (ts + t)) et en q q q q
cela est vrai si par exemple L(t, q , q ) > 0, q , t, une proprit satisfaite dans la plupart des exemples emprunts la mcanique.
8

146

drivant par rapport t, en t = 0 : S s s S s s s (tq , xq ) + (t , xq )q (tq ) = L(ts , xs , q (ts )). q q q q t x =1


3

(5.8)

Equation dEulerLagrange pour (Iq , q ) Nous allons prsent chercher la condition sur les trajectoires (Iq , q ) qui caractrise le fait que ces trajectoires sont points critiques de As , pour tout s ]s, s]. Pour cela nous envisageons des s s s s s variations de (Iq , q ), o Iq = [tq , ts ] de la forme ([tq , ts + ()], q +), o q q 1 1 s ]0 , 0 [, C (]0 , 0 [, ]T, T [) satisfait (0) = 0 et Cc (]tq , ts +T ], R4 ) q est de la forme (t) = (0, (t)). Nous voulons que ([ts , ts + ()], q + ) q q s reste dans Eq , et donc il est ncessaire que q (ts + ()) + (ts + ()) Hs . q q Comme q (ts + ())+(ts + ()) = (ts , xs )+ (0), q (ts ) (0) + (ts ) + q q q q q q o(), cette condition entra ne lordre 1 en que (0), q (ts ) (0) + (ts ) q q T(ts ,xs ) Hs ou encore : q q S s s S s s (tq , xq ) (0) + (t , xq ) q (ts ) (0) + (ts ) = 0. q q q t x =1 A prsent nous calculons la variation premire de As en (Iq , q ) : s
s As [tq , ts + ()], q + s q ts + () q 3

(5.9)

= =

tq ts q
s tq

L(t, q (t) + (t), q (t) + (t))dt L(t, q (t), q (t))dt + (0)L(t, xs , q (ts )) q q
ts q tq
s

L L (t, q (t), q (t)) (t) + (t, q (t), q (t)) (t) dt + o() x v

s = As [tq , ts ], q + (0)L(t, xs , q (ts )) q q q s ts q L + (t, q (t), q (t)) (t) s v tq ts q L d L + (t, q (t), q (t)) (t, q (t), q (t)) s x dt v tq

(t)dt + o().

147

Pour exploiter cette relation, nous pouvons dans un premier temps supposer que = 0 et sannule sur un voisinage de ts . Alors la condition (5.9) est q bien videmment satisfaite. Tous les termes lordre 1 dans le membre de droite de la dernire expression sannulent sauf la dernire intgrale. Pour que la variation premire soit nulle pour toutes les valeurs de , il faut donc que q soit solution de lquation dEulerLagrange d L (t, q (t), q (t)) x dt L (t, q (t), q (t)) v = 0.

Dans un deuxime temps, on utilise lquation que nous venons dobtenir pour simplier la variation premire de As qui vaut maintenant As = L(t, xs , q (ts )) (0) + q q s L s s (t , x , q (ts )) (ts ). q q v q q

Il faut que cette expression soit nulle pour toutes les valeurs de ( (0), (ts )) q satisfaisant (5.9). Cela est vrai si et seulement si il existe un rel (multiplicaS teur de Lagrange) tel que L(t, xs , q (ts )) = S (ts , xs ) + x (ts , xs )q (ts ) q q q q q q t q L S et v (ts , xs , q (ts )) = x (ts , xs ). Inversant ces relations nous obtenons q q q q q S (ts , xs ) = 1 L (ts , xs , q (ts )) q x q q v q q S (ts , xs ) = 1 L(t, xs , (ts )) L (ts , xs , (ts )) (ts ) q q q q q q q t q q v q q

S Nous observons alors que x (ts , xs ) co ncide avec la valeur de limpulq q q sion, image de (ts , xs , q (ts )) par la transforme de Legendre, tandis que q q L S (ts , xs ) co ncide avec la valeur de lhamiltonien en ts , xs , v (ts , xs , q (ts )) . q q q q q q t q s En liminant q (tq ), nous obtenons

Enn en substituant ces valeurs dans (5.8) on dduit immdiatement que = 1. Nous en concluons que S satisfait : L s s S s s (t , xq ) = (t , xq , q (ts )) q q q x v (5.10) S (ts , xs ) = L(t, xs , (ts )) L (ts , xs , (ts )) (ts ) q q q q q q q t q q v q q

S s s S (tq , xq ) + H ts , xs , (ts , xs ) q q t x q q 148

= 0.

Il faut noter que pour tout (t, x) il existe un unique q et un unique s tels que (t, x) = (ts , xs ). Donc nous obtenons que S est solution de lquation q q dHamiltonJacobi sur : S S (t, x) + H t, x, (t, x) t x = 0. (5.11)

5.5

Les dbuts de la mcanique ondulatoire

Le travail de Bohr avait permis une comprhension plus synthtique des mcanismes dabsorption et dmission de la lumire par les atomes. Toutefois il nexpliquait pas comment et pourquoi les lectrons dans latome devaient rester pigs dans des modes stationnaires dont lnergie est quantie. Il y avait besoin dune ide nouvelle, qui fut apporte par L. de Broglie en 1923. Commenons avec quelques considrations intuitives qui ont certainement guid de Broglie. Une premire piste est de penser une analogie entre latome et un tuyau dorgue ou une corde de violon : les sons mis par une corde vibrante sont une superposition dharmoniques dont les frquences sont aussi discrtises parce que les extrmits de la corde tant xes, la longueur donde de chaque mode propre doit satisfaire n = , o est la longueur de la corde. Do lhypothse : le mouvement de llectron dans un tat stationnaire dans latome a une nature ondulatoire. Pour linstant cette ide est encore un peu vague. Deux observations vont la rendre plus prcise : L. de Broglie remarque la profonde analogie entre le principe de Fermat pour loptique et le principe de LeibnizMaupertuis pour la mcanique. Sachant que loptique admettait deux descriptions thoriques complmentaires et toutes deux pertinentes sur le plan physique (loptique gomtrique, incarne par le principe de Maupertuis, et loptique ondulatoire, que lon peut driver du principe de Huygens), de Broglie a lintuition que la matire elle-mme est la fois susceptible dune description gomtrique , qui est le contenu de la mcanique de Newton et du principe de Maupertuis et une description ondulatoire , dont la formulation tait trouver. La ressemblance entre la relation (5.1) pour une particule relativiste et la relation (5.2) pour une onde lumineuse : de faon rciproque la proposition dEinstein dassocier des particules au champ lectroma149

gntique, de Broglie suppose que lon peut associer toute particule dimpulsion p une onde dont le vecteur donde est k = p/ . Voyons comment en partant de ces deux principes nous pouvons retrouver les conditions de quantication de Bohr. Nous suivons pour cela un raisonnement qui peut appara tre un peu biais : nous faisons comme si llectron, lorsquil tourne autour du noyau de latome ne subissait aucune acclration 9 . Cela semble extravagant, puisque nous avons imagin au dpart que llectron tournait autour du noyau. Mais aprs tout pourquoi pas, puisque N. Bohr avait dj mis en vidence le fait que ce mouvement acclr chappe aux lois de la physique classique qui prvoient quune particule charge dont le mouvement est acclr rayonne de lnergie et est freine. Sur la base de cette constatation, nous allons donc assimiler le mouvement de llectron dans latome celui dune translation rectiligne uniforme dans R/ Z, o est la longueur de la trajectoire. Ncessairement londe associe a une longueur donde telle que = n, o n N . La rgle propose par de Broglie nous dit alors que le vecteur donde k = 2/ de londe dpend de limpulsion de la particule p par la relation p = k = h/. Nous en dduisons que
recollement par priodicit

Fig. 5.7 Reprsentation schmatique de la condition de quantication de de Broglie.

de Broglie na pas procd ainsi et a suivi un chemin beaucoup plus long, reposant sur des considrations thermodynamiques. La prsentation faite ici est donc un racourci du travail de de Broglie.

150

pdq =
R/ Z R/ Z

h h dq = = nh.

Nous retrouvons ainsi la condition de quantication de BohrSommerfeld. Conclusion L. de Broglie a suppos que : A toute particule dimpulsion p et dnergie E est associe une onde de vecteur donde k = p/ et dimpulsion = E/ . Et cette hypothse permet dexpliquer et retrouver par un mcanisme ondulatoire les conditions de quantication de Bohr. Nous allons revisiter cet argument de faon un peu plus prcise en suivant une approche inspire par celle dveloppe ultrieurement par E. Schrdinger, qui utilise lquation dHamiltonJacobi. Nous adopterons nouveau un point de vue abusif, dans lequel nous devrons un certain moment ignorer lacclration que subit llectron. Rappellons que lquation dHamilton Jacobi nous enseigne comment associer une fonction S sur lespace-temps (dont les hypersurfaces de niveau dcrivent des fronts donde) un faisceau de trajectoires de particules virtuelles (satisfaisant certaines conditions de compatibilit). Imaginons donc un faisceau de trajectoires priodiques circulaires tournant autour du noyau de latome dhydrogne, associ une solution S de lquation dHamiltonJacobi. En vrit une telle solution nexiste pas ( cause des dirents rayons de courbure des trajectoires, qui interdisent lintgrabilit de dS), mais nouveau nous choisissons de passer outre cette incohrence, arguant que, puisque llectron ignore lacclration et donc la courbure de sa trajectoire, sa trajectoire est assimilable une ligne droite10 . A priori S na pas de caractre oscillant (cest plutt une fonction monotone du temps et de langle dans lespace), il est donc naturel de supposer que lamplitude de londe recherche est plutt une quantit comme eiS/A , o A est une constante dterminer. Remarquons que S a les dimensions dune action (i.e. sexprime
intuitivement une telle hypothse a des connexions avec la relativit gnrale qui explique la gravit universelle par la courbure de lespace-temps. Dans cette thorie une particule soumise la force gravitationnelle nest pas acclre, mais se dplace selon une godsique de lespace-temps, lanalogue dune ligne droite en gomtrie riemannienne.
10

151

en kg m2 s1 ) et donc a la mme homognit que la constante de Planck h. Nous en dduisons que A pourrait sexprimer en fonction de h. A prsent, considrons un chemin c : [0, 1] R3 dont limage co ncide avec une trajectoire circulaire (et tel que c(0) = c(1)), et une dtermination de S le long de ce chemin (cest dire, un peu comme en analyse complexe, une primitive de dS le long de ce chemin). Il semble ncessaire de supposer qu chaque instant t, eiS/A soit continue et quen particulier eiS(t,c(0))/A = eiS(t,c(1))/A . Cela implique que S(t, c(1)) S(t, c(0)) soit de la forme 2An, n N . Cette condition est intressante car la relation (5.10) que nous avons obtenue sur S signie essentiellement que dS = p dq Hdt. La condition obtenue sur S(t, c(1)) S(t, c(0)) peut donc scrire 2An = S(t, c(1)) S(t, c(0)) =
c([0,1])

p dq Hdt =

p dq ,
c([0,1])

t.

Cette relation est identique la relation p dq = hn qui caractrise les orbites stationnaires de Bohr, condition de supposer que A = h/2 = . Nous avons ainsi obtenu heuristiquement une expression pour lamplitude de londe de de Broglie : = eiS/ . A nouveau cette expression est prendre dans un sens intuitif, puisque la fonction S qui intervient ici nexiste pas en ralit, cause de la courbure des trajectoires. Remarques 1) Il faut faire attention que le principe nonc par de Broglie nest pas tout fait conforme lutilisation de lquation dHamiltonJacobi que nous avons faite : cette quation nassocie pas une onde une trajectoire, mais un faisceau de trajectoires (plus ou moins virtuelles) satisfaisant certaines conditions de compatibilit. Lassimilation dune particule ou de sa trajectoire une onde est assez trompeuse et est source de confusion en mcanique quantique. Il est possible que de Broglie lui-mme se soit un peu fourvoy dans son travail ultrieur cause de cela11 .
L. de Broglie, comme Einstein, tait insatisfait de linterprtation probabiliste qui fut donne lquation de Schrdinger et rechercha toute sa vie une autre autre interprtation de londe associe la matire, dans laquelle la matire reste toujours sous forme de particule, mais est guide par une onde. Ces tentatives nont jamais rien donn. Cependant la question pose par de Broglie de savoir si on peut viter davoir recours aux probabilits reste sans doute dactualit.
11

152

2) Le petit raisonnement heuristique que nous avons fait sur le mouvement de llectron dans latome est bien videmment assez fragile et nous verrons ultrieurement quil faudra labandonner au prot dune description beaucoup plus raliste. Il est nanmoins correct sur deux points : il explique les raies spectrales et est une tape indispensable pour la suite.

5.6

Lquation de Schrdinger

Suite au travail de de Broglie il tait urgent didentier londe et de trouver une quation dcrivant sa dynamique, an de conrmer davantage cette hypothse et de lappliquer des questions plus sophistiques. Ce fut loeuvre dErwin Schrdinger en 1926. Lide se situe dans le prolongement des considrations de la section prcdente : nous imaginons que lamplitude de londe ressemble sous certaines hypothses (notament si la particule est en mouvement de translation rectiligne) avec la fonction (t, x) := eiS(t,x)/ , o S est une solution des quations dHamiltonJacobi. Nous pouvons dja remarquer que, si une telle relation est satisfaite, alors (t, x) i (t, x) x = S (t, x) = p (t, x), x (5.12)

la valeur de limpulsion de la trajectoire faisant partie du faisceau de trajectoires associ S qui passe au point x linstant t. De mme, (t, x) i (t, x) t = S S (t, x) = H x, (t, x) t x = E, (5.13)

la valeur de lnergie de la trajectoire faisant partie du faisceau de trajectoires associ S qui passe au point x linstant t. Nous allons chercher une loi dvolution dynamique, cest dire une quation direntielle spciant comment varie au cours du temps. Avant toute chose il convient aussi de savoir de quelle thorie classique 12 nous partons, cest dire quel est le lagrangien et donc quel est lhamiltonien de dpart.
12

au sens non quantique

153

Exercice 13 On considre : la densit lagrangienne de Maupertuis L M (x, v) := 2 m |v| V (x) sur T R3 , et les deux densits lagrangiennes pour le mouvement 2 dune particule relativiste soumise aucune force : L1 () := mc , et m 4 t 2 2 L2 () := 2 , sur T M (o ( ) = (t( ), x( )) et , = c t |x|2 ). 1) Dmontrer que les hamiltoniens HM : T R3 R, H1 : T M 4 R et H2 : T M 4 R, images respectivement de LM , L1 et L2 par la transforma2 2 p2 0 tion de Legendre, sont HM (q, p) = |p| + V (q), H1 = 0 et H2 (p) = 2mc2 |p| . 2m 2m S 2) Expliciter les quations de HamiltonJacobi : S + HM (x, x ) = 0 (pour t S une fonction S : R R3 R) et H2 ( x ) = E (pour une fonction S : M 4 R). 3) Calculer les solutions pour les deux quations dHamiltonJacobi prcdentes qui sont de la forme S(t, x) = Et + p1 x1 + p2 x2 + p3 x3 , o E et les p sont des constantes. Lide la plus naturelle qui vient lesprit est dutiliser lhamiltonien relativiste H2 pour dnir lquation dHamiltonJacobi et de chercher ensuite une quation ressemblant celle que doit satisfaire eiS(t,x)/ lorsque S est solution de cette quation dHamiltonJacobi. Schrdinger obtint ainsi une quation linaire relativiste sur : 1 2 + 2 = 0. 2 (t)2 c Mais, fait relativement intrigant, il ne fut pas capable dexploiter cette quation pour, par exemple, lappliquer ltude de latome dhydrogne13 . A contre-coeur (et on le comprend) il revint alors vers une version non relativiste, en partant de lhamiltonien H(q, p) = |p|2 + V (q), 2m

hrit de laction de Maupertuis. Lquation dHamiltonJacobi est alors S | S|2 (t, x) + (t, x) + V (x) = 0. t 2m
Cette quation fut redcouverte plus tard par Klein et Gordon, dont elle porte le nom. Cest beaucoup plus tard que lon comprit comment exploiter et interprter cette quation dans le cadre de la thorie quantique des champs.
13

154

Considrons nouveau (t, x) = eiS(t,x)/ . Nous avons alors : i S = eiS(t,x)/ = H(x, t t | S|2 + V (x). = 2m S) (5.14)

Dun autre ct,


2 2

2m

= =

2m
2

div

SeiS(t,x)/
2

2m | S|2 S = +i . 2m 2m

| S|2

eiS(t,x)/ + i

eiS(t,x)/

(5.15)

Comparant les deux quations, nous en dduisons que i = t


2

2m

+ V (x) i

S . 2m

(5.16)

Lquation (5.16) est linaire en , lexception du dernier terme (puisque S dpend de ). Rappelons que S (et donc eiS/ ) nexiste pas toujours (notamment pour londe associe llectron dans latome) et que donc il est vain de chercher imposer que lquation (5.16) soit toujours satisfaite, sauf peuttre pour les particules en mouvement de translation rectiligne uniforme. Or dans ce dernier cas, il est facile de construire une solution S de lquation dHamiltonJacobi, associe un faisceau de trajectoires parallles, et alors S est une fonction ane de (t, x). En particulier S = 0 et dans ce cas le dernier terme dans lquation (5.16) sannule. Cela nous amne, suivant Schrdinger, supposer que la fonction , cense modliser les vritables phnomnes quantiques, satisfait lquation de Schrdinger 2 = + V (x) . (5.17) i t 2m Il ny a pas de justication prcise pour dcider de supprimer le dernier terme dans (5.16), part les considrations prcdentes sur les ondes de de Broglie planes et le souci de trouver une quation direntielle relativement simple et, en particulier, linaire (noter aussi que cela revient ngliger les termes 155

en O( ) dans les termes de droite de (5.14) et (5.15)). In ne la justication pour ce choix est donne a posteriori : en lappliquant ltude de phnomnes physiques, elle donne des prdictions qui saccordent remarquablement bien avec les rsultats exprimentaux... tant que les eets relativistes sont ngligeables (et donc que les vitesses envisages sont petites par rapport la vitesse de la lumire). Conclusion Nous avons obtenu une quation qui savrera tre parfaitement adapte pour dcrire des phnomnes quantiques non relativistes (mais aussi bien videmment les phnomnes classique , qui prdominent lorsque la valeur de h est ngligeable par rapport aux autres grandeurs en jeu). Avant de lappliquer, il reste mettre en place un cadre mathmatique pour crire correctement lquation et surtout... construire un cadre conceptuel pour linterprter physiquement. Cette dernire tche est la plus complexe : le paradigme qui fut propos un peu plus tard par l cole de Copenhague remplit totalement cette fonction, sans la moindre incohrence logique, ni la moindre contradiction avec lexprience, mais il na convaincu ni Einstein, ni de Broglie, ni Schrdinger. Rfrences J.-L. Basdevant, Cours de mcanique quantique, Ecole Polytechnique. H. Rund, The HamiltonJacobi theory in the calculus of variations, its role in mathematics and physics, Krieger Pub. Comp., 1973.

156

Chapitre 6 Lquation de Schrdinger et son interprtation


Il nous reste maintenant interprter lquation de Schrdinger (5.17) et comprendre comment lutiliser. Notament, en formulant les choses dune faon un peu nave, on peut se demander comment extraire des informations telles que la position, la vitesse ou lnergie dune particule dcrite par une solution de cette quation. Une premire approche, due de Broglie, consiste privilgier des solutions de lquation de Schrdinger dont le comportement serait analogue celui dun corpuscule. Lide est que, pour ces solutions, l essentiel de la fonction donde soit concentr dans une portion relativement petite de lespace, o serait localise la particule. De telles solutions existent et son appeles paquets donde , puisque, grce la transforme de Fourier, on peut les reprsenter comme une superposition dondes planes monochromatiques. Puis nous chercherons analyser lquation de Schrdinger avec un point de vue plus global. Cela ncessite une petite rexion prliminaire sur la notion de quantit observable (nous anticipons ici sur certaines ides proposes par Heisenberg, dont nous reparlerons plus loin) : tant que le systme physique que lon tudie est un ballon ou une voiture, les choses sont relativement claires pour nous et nous navons pas besoin dun eort conceptuel important pour comprendre ce que sont la position ou la vitesse dun tel objet. Mais si le systme est un lectron, nos conceptions habituelles ne susent plus : comme premire observation, force est dadmettre que toute mesure eectue 157

sur un lectron est extrmement indirecte : si llectron est isol, il ragit un choc avec un photon comme une particule relativiste (eet Compton), sil est li un atome (ou dans un matriau conducteur) il ragit comme un systme oscillatoire, passant dun mode stationnaire un autre. Dans tous les cas, on observe jamais directement llectron, mais plutt le photon, ou du moins sa variation dnergie et dimpulsion, cest dire un changement de la frquence de la lumire diuse et de sa direction.

Lexemple prcdemment voqu (une mesure sur ltat dun lectron par le biais dinteractions avec un photon) illustre un fait gnral en physique : notre perception et donc notre comprhension du monde reposent sur la mesure de quantits (par exemple lnergie et la quantit de mouvement) associes un systme (par exemple un photon) qui sont conserves si le systme ninteragit pas (par exemple si le photon voyage dans le vide) mais qui, au cours dune exprience spcialement conue pour cela (par exemple la rencontre du photon avec llectron), seront modies. Pourquoi ncessairement utiliser des quantits qui ont la proprit dtre conserves lorsquil ny a pas dinteractions ? Prcisment parce quune exprience doit tre reproductible et donc reposer sur la mesure de quantits stables et inaltrables pour un systme isol. Ainsi une grande partie de la physique moderne repose sur lidentication des quantits conserves , comme lnergie, le moment cintique, la quantit de matire ou la charge lectrique.

Cela est rapprocher dun autre fait : les lois de la nature sont gouvernes par des principes variationnels. Or dans ce contexte nous savons, grce au thorme de Noether, quune quantit conserve est associe une symtrie, cest dire une invariance des lois de la physique par laction dun groupe (par exemple le groupe de Poincar). Cela explique le rle trs important que joue la thorie des groupes en physique, incarn par la dnition (en apparence abstraite) dune particule propose par E. Wigner : une particule est la reprsentation dune symtrie. 158

6.1
6.1.1

Du paquet donde linterprtation probabiliste de lquation de Schrdinger


Le paquet donde

Pour mettre nos nouvelles connaissances lpreuve, il nous faudrait quelques solutions explicites de cette quation ! Commenons donc par essayer de la rsoudre dans le vide, cest--dire en labsence de potentiel. Nous allons chercher des solutions particulires, telles que ltat physique du systme nvolue pas au cours du temps. Autrement dit, nous cherchons une fonction (t, x) dont la dpendance en t ne consiste qu multiplier une fonction (x) donne par un scalaire variable (t). Lquation de Schrdinger peut alors se mettre sous la forme i = . t 2m Il doit donc exister une constante telle que = i t 2 = . 2m

Les solutions que nous cherchons, qui sappellent des solutions stationnaires, sont donc priodiques en temps, de la forme (t, x) = (x)eit . En cherchant sous la forme (x1 , x2 , x3 ) = 1 (x1 )2 (x2 )3 (x3 ), un petit calcul montre que se met, normalisation prs, sous la forme (t, x) = e
i p ( 2m tpx) 2

o p est un vecteur quelconque tel que p2 /2m = . On reconnat dans cette expression londe de de Broglie associe une particule libre dimpulsion p. Cependant cette expression ne nous satisfait pas compltement : si en eet il est facile dassocier une impulsion une telle solution ( savoir p), nous ne voyons pas du tout o se trouve la particule. Nous verrons plus loin que le principe dHeisenberg xe une limite thorique infranchissable dans la prcision avec laquelle nous pouvons dterminer simultanment la position et limpulsion dune particule (voir lexercice la n de ce paragraphe). Cela dit nous aimerions trouver des solutions un peu mieux localises 159

dans lespace. Par ailleurs nous verrons au prochain paragraphe des raisons thoriques (conrmes par linterprtation de N. Bohr qui est la seule qui, jusqu maintenant, saccorde avec lexprience) pour demander ce que la densit := ||2 soit intgrable. Or nous voyons qu aucun instant la fonction donde obtenue prcdemment nest de carr intgrable par rapport aux variables despace. Ce problme est similaire celui que lon rencontre lorsquon rsout les quations de Maxwell dans le vide et que lon trouve des ondes lectromagntiques planes dont lnergie totale est innie. Et de mme quen lectromagntisme on est amen considrer des superpositions dondes planes, nous allons exploiter le fait que lquation de Schrdinger est linaire et envisager la solution suivante : (t, x) =
R3

(p)e

(Etpx)

dp , (2 )3/2

o on a naturellement pos E = p2 /2m et o est une fonction dterminer. A nouveau pour des raisons que nous verrons plus loin, la contrainte principale sur est que doit tre de carr sommable. Or, quelques constantes prs, et t x, les fonctions et sont transformes de Fourier lune de lautre. Comme la transformation de Fourier ralise une isomtrie de L2 (R3 ) sur lui-mme, est L2 si et seulement si lest. Cette symtrie entre et ainsi que le rapprochement avec londe de de Broglie que nous avons fait plus haut conduisent postuler que la fonction joue vis--vis de limpulsion de la particule le mme rle que pour la position. Si est extrmement concentre autour dune certaine valeur de p, on sapproche de la situation de londe de de Broglie et on parle de paquet donde localis en impulsion. Si en revanche est trs concentre autour dune certaine valeur de x, cest qui sapproche dune onde plane et on parle de paquet localis en position. Une consquence fondamentale de linterprtation de comme amplitude de rpartition de limpulsion est due une ingalit trs gnrale liant deux fonctions qui sont transformes de Fourier lune de lautre. Lexercice suivant illustre ce phnomne en une dimension despace. 160

Exercice 14 Soient f et g deux fonctions de L2 (R) qui sont transformes de Fourier lune de lautre. On dnit deux nombres f et f (ce na rien voir avec le laplacien) par f =
R

x|f (x)|2 dx ,

(f )2 =
R

(x f )2 |f (x)|2 dx.

En particulier, on suppose que f existe. On dnit de mme g et g. Montrer que 1 f g . 2 On pourra commencer par supposer que f = g = 0 et tudier le signe de lintgrale R |xf (x) + f (x)|2 dx, o est un paramtre rel. Plus gnralement en dimension 3, notons par exemple x1 la dispertion de labscisse, dnie par (x1 )2 =
R3

(x1 x1 )2 |(x)|2 dx.


. x1

De mme, notons p1 la dispersion de limpulsion selon x1 p1 /2

Alors lingalit

a lieu. Autrement dit, il y a une limite de principe (et non due un manque de capacits techniques) la localisation simultane en position et en impulsion dune fonction donde : on ne peut prparer une particule dans un tat o on connat simultanment et exactement sa position et son impulsion. Nous reviendrons sur ce point plus tard.

6.1.2

Une loi de conservation

Revenons lide expose en introduction de privilgier les quantits conserves et recherchons comment associer de telles quantits une solution de lquation de Schrdinger i = H = t
2

2m

+ V (x) .

(6.1)

qui se conservent. Nous supposerons dans un premier temps que C (R R3 , C). Une ide est de considrer la quantit (t, x) := (t, x)(t, x). La 161

drive par rapport au temps de est = + . Elle peut donc t t t sexprimer en fonction de et de ses drives spatiales en utilisant lquation de Schrdinger et sa conjugue. Cela donne : i = t = = Cela entrane que j + = 0, t =1 x o j := 2im . x x
3 2 2

2m
3

+ V (x)

2m

+ V (x)

2m
2

() ()
=1

2m

. x x

(6.2)

Une quation du type (6.2) porte le nom de loi de conservation. Elle signie que la 3-forme := dx1 dx2 dx3 dt j1 dx2 dx3 + j2 dx3 dx1 + j3 dx1 dx2 est ferme. Par consquent on a U = U d = 0 sur tout ouvert rgulier U R R3 , en vertu du thorme de Stokes. Dans le cas o lon suppose en plus que et ses drives spatiales dcroissent vers 0, lorsque |x| , cette relation a une consquence globale. Proposition 2 Soit C (R R3 , C) une solution de lquation de Schrdinger (6.1). Supposons que t R, R3 (|(t, x)|2 + | (t, x)|2 ) dx C < . Alors la quantit P (t) :=
R3

(t, x)dx =
R3

|(t, x)|2 dx

est constante. 162

Preuve Nous observons tout dabord que, en notant |j| = lingalit de Young implique que t R,
2 R3

2 2 2 j1 + j 2 + j 3 ,

|j(t, x)|dx

2m

R3

C :=

3 2 C. 2m

3|(t, x)|2 + | (t, x)|2 dx

Soit C 2 (R, R) telle que (s) = 0 s R \ [2, 2], (s) = 1 s [1, 1] et | (s)| 2 partout. Posons, pour R ]0, [ R (x) := (|x|/R) et B2R := {x R3 /|x| < 2R}. Nous considrons la 3-forme R , o a t dni un peu plus haut. Soit, pour t1 < t2 , louvert U :=]t1 , t2 [B2R . Comme R sannule sur ]t1 , t2 [B2R , on a R R =
{t1 }B2R U

R d (R ) =
U U

{t2 }B2R

= Cela entrane R (x)((t2 , x) (t1 , x))dx =

dR .

R3

dR

]t1 ,t2 [R3

| R (x)| |j(t, x)|dt dx |j(t, x)|dx 2C (t2 t1 ) . R

2 R

]t1 ,t2 [R3

En faisant tendre R on dduit de cette ingalit en utilisant le thorme de convergence domine de Lebesgue (observer que L1 (R3 ), puisque |(t, x)|2 dx < ) que R3
R3

((t2 , x) (t1 , x))dx = 0,

cest dire P (t1 ) = P (t2 ). Nous avons donc obtenu que, sous certaines hypothses de dcroissance linni, la quantit P (t) est constante. Si lon se rfre aux ides discutes au dbut du chapitre, P (t) devrait donc correspondre une quantit 163

physiquement signicative. Comme le rsultat ne dpend pas du choix du potentiel de force V dans lhamiltonien, la premire interprtation qui vient lesprit est que P (t) reprsente la quantit de matire ou de charge lectrique. Et donc serait alors une densit volumique de matire ou de charge lectrique. Cest en eet lhypothse qui fut propose par de Broglie et Schrdinger. Mais cette interprtation savra tre imparfaite car en fait, en plus de son comportement corpusculaire, la matire doit aussi maintenant manifester une nature ondulatoire.

6.1.3

Le dogme de l cole de Copenhague

Nous sommes en face de la question dicile de savoir si la matire est ondulatoire ou corpusculaire. En fait on ne peut pas rpondre cette question, mais simplement admettre que la matire a un comportement tantt ondulatoire, tantt corpusculaire. On parle de dualit ondeparticule . Linterprtation propose par N. Bohr est que (t, x) est une densit de probabilit : Pour tout ouvert R3 et pour tout temps t R, la probabilit pour que la particule se trouve dans louvert linstant t est gale |(t, x)|2 dx1 dx2 dx3 . Comme la particule doit srement se trouver quelque part dans lespace, il est donc naturel de supposer que est normalis de faon ce que P (t) = 1, t. Autrement dit la norme de dans L2 (R3 , C) est constante et gale 1. Ce paradigme sest impos car il correspond eectivement ce que lon observe et toutes les expriences qui ont t faites jusqu prsent nont fait que conrmer cette thse ! Une consquence immdiate de ce nouveau principe est que la fonction , appele fonction donde ne donne pas dinformation dterministe sur la position de la particule, mais uniquement des informations probabilistes. Il sagit dun premier exemple dune situation tout fait universelle en physique quantique : ltat physique dune particule , ici dcrit par la fonction donde , ne donne que des informations partielles et statistiques sur les quantits mesurables (ici la position). Une telle conclusion, rvolutionnaire et relativement choquante, a amen les physiciens une rexion philosophique profonde sur la nature du monde 164

physique1 . Elle les a notament forc faire la distinction entre dune part ltat dun systme physique et dautre part les observations et les mesures que lon en fait. Une interprtation du principe qui prcde est la suivante : supposons que nous disposions dun grand nombre N de systmes qui sont tous dans le mme tat quantique L2 (R3 , C), et que nous mesurions la position de la particule dans chaque systme, nous obtenons des rsultats x1 , , xN R3 . 1 La valeur moyenne est N (x1 + + xN ), sa limite lorsque N , x , doit alors satisfaire : x =
R3

x(x)dx =
R3

(x)x(x)dx.

6.1.4

Le principe de superposition

Ce principe est, daprs Dirac, lide fondamentale nouvelle de la mcanique quantique . Il est mathmatiquement quivalent la linarit de lquation de Schrdinger : toute combinaison linaire coecients complexes de fonctions dondes est encore une fonction donde. Cela signie, tant donn deux tats possibles dun systme, que toute superposition de ces tats est galement un tat possible. Cette proprit est tout fait nouvelle pour la
Einstein en particulier est rest convaincu jusqu la n de sa vie quune thorie essentiellement non-dterministe ne pouvait tre au mieux quune thorie provisoire. Il pensait quil devait exister une description plus ne du monde dans laquelle lala dont la mcanique quantique rend compte appara trait comme une dpendance par rapport des degrs de liberts encore inconnus, les variables caches. Avec B. Podolsky et N. Rosen, il a imagin en 1935 une exprience, irralisable lpoque, mais simple dans son principe, qui lui semblait de nature prendre en dfaut linterprtation de Copenhague. En 1966, J.S. Bell dmontra quune certaine quantit statistique, qui pouvait tre calcule partir de mesures dans lexprience EPR, devait, sil existait des variables caches, satisfaire une certaine ingalit, alors que la mcanique quantique orthodoxe prvoyait quelle serait viole. Il ne restait plus qu faire lexprience... ce qua fait Alain Aspect au dbut des annes 1980, Orsay. Et il a observ que les ingalits de Bell taient violes. Le dbat semble tranch, et pourtant tous ne sont pas convaincus. Les hypothses plus ou moins implicites sous lesquelles Bell a dmontr son thorme, les conditions dans lesquelles A. Aspect a conclu que les ingalits taient violes, tout cela prte encore de nombreuses discussions et publications : on trouve environ 250 articles avec le mot Bell dans le titre dans la rubrique quant-ph darxiv pour ces cinq dernires annes (Le lecteur interess trouvera plus de dtails et une bibliographie la page math.ucr.edu/home/baez/physics/Quantum/bells_inequality.html).
1

165

mcanique puisque les quations de Newton taient non linaires. Cela pose immdiatement la question de comprendre les implications physiques de ce principe. Une situation simple est lorsque lon suppose que deux solutions 1 et 2 de lquation de Schrdinger sont telles qu un certain instant t les supports2 de 1 et de 2 sont disjoints, i.e. supp(1 )supp(2 ) = . Alors, pour tous coecients , C,
R3

|1 + 2 |2 dx = ||2

R3

|1 |2 dx + ||2

R3

|2 |2 dx = ||2 + ||2 .

En supposant que ||2 + ||2 = 1, il est possible dappliquer le postulat de Bohr et notament dinterprter la densit |1 + 2 |2 comme une densit de probabilit de prsence de llectron. Dans le cas particulier qui a t considr ici cela signie que lon a une probabilit gale ||2 pour que llectron se trouve dans supp(1 ) et une probabilit gale ||2 pour que llectron se trouve dans supp(2 ). Dirac propose alors dtendre la porte de ce principe. En prliminaire Dirac donne une dnition pragmatique de ltat dun systme : celui-ci est dtermin lorsquon connat la manire dont a t prpar le systme et que cette prparation est reproductible. Pour une particule, un tel tat est compltement caractris par une fonction donde. Le sens dune superposition de deux tats est alors le suivant : un tat 0 peut tre form par superposition de deux tats 1 et 2 lorsquil existe une probabilit non nulle pour quun rsultat quelconque, obtenu au moyen dune observation eectue sur le systme dans ltat 0, puisse se retrouver identiquement par la mme observation eectue sur le systme dans lun (au moins) des tats 1 et 2 . Autrement dit : ... si le systme a une probabilit non nulle disons p de se comporter comme sil tait dans ltat 1 et une probabilit galement non nulle 1 p de se comporter comme sil tait dans ltat 2 . Donnons tout de suite la forme quantitative de ce principe. Si 1 et 2 sont des fonctions donde, cest--dire des solutions de lquation de Schrdinger, correspondant aux tats 1 et 2 et si 1 et 2 sont des nombres complexes, alors 0 = 1 1 + 2 2
le support supp() dune fonction continue est le complmentaire du plus grand ouvert tel que sannule sur
2

166

est la fonction donde qui dcrit ltat dans lequel le systme se comporte comme sil tait dans ltat 1 avec probabilit p1 = |1 |2 |1 |2 + |2 |2

et comme sil tait dans ltat 2 avec probabilit p2 = 1 p 1 = |2 |2 . |1 |2 + |2 |2

Daprs cette dnition de la superposition, la superposition dun tat avec lui-mme est encore ce mme tat. Autrement dit, pour tout complexe non nul, les fonctions donde et dcrivent le mme tat physique.

6.2

Observables

La question suivante est de dnir une notion dimpulsion ou dnergie pour une particule dcrite par une fonction donde, qui aurait une connexion avec la notion classique. Cela nest pas non plus immdiat. A ce sujet il peut tre utile de revenir sur la forme mathmatique que revt lide de dterminisme dans les descriptions classiques et quantiques dune particule. Cette ide signie que si lon connat exactement ltat dun systme isol (ou bien mme de lunivers) un certain instant, on devrait tre en mesure de dterminer toute son volution future en utilisant les quations de la dynamique. Pour tre formule mathmatiquement de faon cohrente, cette ide ncessite davoir identi les quations de la dynamique (les quations de Newton ou bien de Hamilton en physique classique, lquation de Schrdinger en mcanique quantique non relativiste), an den dduire une dnition de condition initiale satisfaisante, cest dire telle qu une condition initiale corresponde une et une seule volution3 . En physique classique, ces conditions initiales sont simplement la position et la vitesse si lon travaille avec les quations de Newton, ou bien la position et limpulsion si lon travaille avec les quations de Hamilton. Lquation de Schrdinger se comporte diremment au sens o elle est du premier ordre en temps et donc il sut de connatre la valeur initiale de pour dterminer son volution ultrieure.
cette question rejoint par consquent une procupation naturelle des mathmaticiens travaillant sur les problmes dvolution, savoir si un problme de Cauchy est bien pos.
3

167

Ces considrations nous conduisent supposer que l impulsion quantique de la particule doit pouvoir tre dduite de la connaissance de (et non de ). Comment ? Cela ne semble pas vident a priori, mais nous pout vons nous aider de ce que nous avons vu propos du lien entre lquation dHamiltonJacobi et lquation de Schrdinger : la valeur ponctuelle de limpulsion dun faisceau de trajectoires classiques associ une solution S de lquation dHamiltonJacobi sobtient partir de la fonction = eiS/ par la relation (5.12), i.e. p = i x . Nous devons transposer cela dans le contexte de linterprtation quantique de lquation de Schrdinger. De faon analogue ce qui prcde nous considrons cette fois-ci la quantit p :=
R3

(x)

(x) dx. i x

Quel sera le sens de p ? Ce sera la valeur moyenne de la composante de limpulsion dune particule dans un tat quantique . Cela signie que si nous disposons dun grand nombre N de systmes qui sont tous dans ltat L2 (R3 , C), et que nous mesurons limpulsion de la particule dans chaque systme, nous obtenons des rsultats p1 , , pN (R3 ) . Alors 1 limN N (p1 + + pN ) est gal p , dont les composantes sont p . Cette interprtation est nouveau totalement conforme avec lexprience. Ainsi la valeur p doit aussi tre comprise comme une valeur moyenne, savoir lesprance mathmatique de la variable alatoire p . Il faut noter quil est totalement impossible de dduire cette valeur de la densit de probabilit comme nous lavions fait pour la position. En particulier, et en dpit de ce que suggrent les notations, p et x sont deux esprances mathmatiques qui correspondent deux lois de probabilit direntes. Cette proprit curieuse est nouveau relie au principe dincertitude dHeisenberg. Un raisonnement similaire peut tre fait en ce qui concerne lnergie, partir de la relation (5.13) : la quantit H :=
R3

(x) H(x) dx
2 R3

(x)

2m

(x) + V (x)(x) dx

sera la valeur moyenne de lnergie.

168

Les trois exemples de quantits envisags (position, impulsion, nergie) ont en commun que leur valeur moyenne est de la forme a :=
R3

(x) A(x) dx,

o A

est un oprateur qui agit sur les fonctions donde : loprateur position x : [x x (x)] loprateur impulsion p : [x i x (x)] 2 loprateur nergie ou lhamiltonien H : [x 2m (x) + V (x)(x)] Ces oprateurs sont, comme nous allons le voir, des oprateurs auto-adjoints hermitiens. Mais en plus il faut signaler la dicult quils ne sont pas dnis sur tout L2 (R3 , C). Il est toutefois possible de leur donner un sens comme des oprateurs non borns sur L2 (R3 , C).

6.2.1

Une parenthse mathmatique : oprateurs autoadjoints hermitiens

Oprateurs auto-adjoints hermitiens borns Soit H un espace vectoriel sur C. Une forme hermitienne sur H est une application , : H H C,

satisfaisant les proprits u, v, w H, , C, u, v + w = u, v + u, w u, v H, v, u = u, v u H, u, u 0 et u, u = 0 = u = 0. Une consquence de ces relations est que u, v = u, v . Nous avons adopt ici la convention des physiciens, malheureusement inverse de celle utilise par les mathmaticiens4 . La dernire proprit garantit le fait que || || : H [0, [, dni par ||u||2 = u, u , est une norme. Si (H, || ||) est complet, nous dirons que (H, , ) est un espace de Hilbert hermitien. Dans la suite nous ne considrerons que des espaces de Hilbert hermitiens qui sont soit de dimension nie, soit sparables (ce qui entrane quils admettent
4

qui crivent plutt u, v = u, v .

169

une base hilbertienne dnombrable). Exemples Lespace H = C n , muni du produit hermitien u, v n t 1 n t 1 n j j j=1 u v , o u = (u , , u ) et v = (v , , v ). Lespace H := L2 (R3 , C) muni du produit hermitien ,
L2 Cn

:=

:=
R3

(x)(x)dx.

Oprateur adjoint Soit H1 et H2 deux espaces de Hilbert, H1 et H2 respectivement leurs duaux topologiques et T : H1 H2 un oprateur linaire continu. Son adjoint est loprateur T : H2 H1 dni par H2 , u H1 ,

(T ) u = (T u).

En prsence du produit hermitien, ladjoint T peut tre reprsent par un oprateur de H2 dans H1 . En eet daprs le thorme de RieszFrchet il existe des isomorphismes R1 : H1 H1 et R2 : H1 H2 dnis par u Ha , v Ha , (Ra u)v = u, v , pour a = 1 ou 2. Il dcoule de cette dnition que lisomorphisme de RieszFrchet Ra est R-linaire et C-antilinaire, cest dire u Ha , C, Ra (u) = Ra u.

Ces isomorphismes permettent alors de construire loprateur T : H2 H1 1 par T := R1 T R2 . Par exemple si H1 = H2 = C n , on peut identier T avec une matrice n n complexe et T sidentie alors la transpose de la conjugue de T : T = t T . Dnition 5 Soit H un espace de Hilbert hermitien. Un oprateur T : H H est dit hermitien auto-adjoint si et seulement si T = T . Cette proprit est quivalente u, v H, T u, v = u, T v . Les bra- et les -cket de Dirac Un systme de notation fut introduit par P.A.M. Dirac. Il savre tre relativement commode et est trs largement utilise par les physiciens. Etant donn un espace de Hilbert hermitien H (cens reprsenter un espace des tats physiques), si H, on note 170

| := | := R H , o R : H H est lisomorphisme de RieszFrchet. Si de plus T : H H, on notera T | := T limage de par T |T := T (R) = R(T ), limage de | par T . Alors le produit hermitien entre et H se note , = (R) = |(| ) =: | . Ne rsistant pas au plaisir dun jeu de mot5 , Dirac appelle alors un bra- tout | H et un -cket tout | . Un intrt de cette notation est quun oprateur T est auto-adjoint hermitien si et seulement si | H, | H , ( |T ) | = | (T | ) ,

qui peut sinterprter comme une proprit dassociativit. On notera donc, pour tout oprateur T tel que T = T , |T | := ( |T ) | = | (T | ) . Par exemple si H = L2 (R3 , C), alors si , H et si T : H H est autoadjoint, on note |T | = T dx.
R3

En outre cette notation savrera tre commode lorsque, dans la suite, on dsignera un vecteur par des grandeurs qui le caractrisent compltement (modulo la multiplication par une constante complexe de module gal un, qui na pas de sens physique). Par exemple supposons quun oprateur autoadjoint hermitien (lhamiltonien) H : H H soit diagonalisable avec des sous-espaces propres de dimension 1 sur C, cest dire : H = Vn n=0 (somme hilbertienne), chaque Vn est une droite complexe de vecteurs propres de H pour la valeur propre En et les valeurs propres En sont distinctes deux deux. Alors on notera |En ou mme de faon plus concise |n un vecteur engendrant Vn , de sorte que H|n = En |n . Si la connaissance de la valeur propre En ne sut pas, on peut ajouter dautres nombres, correspondant des valeurs propres dautres oprateurs commutant avec H. Nous verrons cela plus en dtail plus loin ( propos des Ensembles Complets dObservables qui Commutent).
5

le mot crochet se dit bracket en anglais

171

Oprateurs non borns Malheureusement les seuls exemples doprateurs auto-adjoint hermitiens que nous avons rencontrs au dbut de ce chapitre ne sont pas dnis sur lespace de Hilbert hermitien sur lequel il serait naturel de travailler, savoir 2 L2 (R3 , C). Par exemple loprateur hamiltonien H = 2m + V de lquation de Schrdinger est un oprateur direntiel du second ordre, dni a priori sur le sous-espace C 2 L2 (R3 , C). Il est possible de faire un peu mieux et de donner un sens cet oprateur sur un espace un peu plus large, lespace de Sobolev H 2 (R3 , C) := L2 (R3 , C)/ , L2 (R3 , C) (, = 1, 2, 3),
2 f Cc (R2 ), R3

f + f = 0, x

R3

f + f = 0 . x

Les fonctions sont appeles les drives faibles ou drives au sens des distributions de , les sont les drivs secondes au sens des distributions. 2 On les note respectivement x := , x x := , bien quil ne sagisse pas de drives partielles au sens classique. On peut vrier que si V C (R3 ) et si V et ses drives premires et secondes sont uniformment borns sur R3 , alors H applique continument H 2 (R3 , C) sur L2 (R3 , C). Mais il nest pas possible dtendre cet oprateur tout L2 (R3 , C). Dnition 6 Soit H1 et H2 deux espaces de Hilbert munis de structures hermitiennes , 1 et , 2 , respectivement. Un oprateur non born de H1 dans H2 est la donne dun sous-espace vectoriel D(T ) de H1 (le domaine de loprateur) et dun oprateur T : D(T ) H2 . Nous ne considrerons que le cas H1 = H2 = H et des oprateurs non borns T tels que : D(T ) est muni dune structure hermitienne , T , a priori dirente de celle de (H, , ) D(T ) est ferm pour la topologie induite par , T D(T ) est dense dans (H, , ) T est un oprateur non born born , cest dire : T : (D(T ), , T ) (H, , ) est continu. 172

Toutes ces conditions sont satisfaites dans H = L2 (R3 , C) pour T = H et D(T ) = H 2 (R3 , C) muni du produit hermitien , H 2 := R3 + 2 2 x x + , x x x x , condition que V et ses drives premires et secondes soient bornes. Deux autres exemples doprateurs borns de H = L2 (R3 , C) dans lui-mme sont : loprateur x , dont le domaine est D(x ) := { L2 (R3 , C)/x L2 (R3 , C)} avec le produit hermitien , x := R3 + (x )2 b loprateur p , dont le domaine est D(p ) := { L2 (R3 , C)/ x L2 (R3 , C)} avec le produit hermitien , p := R3 + x x b Adjoint dun oprateur non born Soit T : H1 H2 un oprateur non born entre deux espaces de Hilbert dont le domaine est D(T ). Nous supposerons que D(T ) est dense dans H1 et que T : D(T ) H2 est continu. On dnit :
D(T ) := { H2 /C > 0 tel que |(T )| C||||1 , D(T )}.

Pour tout D(T ) nous dnissons T , une forme linaire sur D(T ), de la faon suivante : D(T ), (T ) = (T ).

Il est clair que, cause de la dnition de D(T ), T est une forme linaire sur D(T ) qui est continue pour la topologie induite par , 1 . Comme D(T ) est dense dans H1 pour cette topologie, il existe une unique forme linaire sur H1 qui prolonge T . Nous noterons galement T ce prolongement6 . Alors loprateur T : D(T ) H1 T est ladjoint de T . Dnition 7 Soit (H, , ) un espace de Hilbert hermitien et T un oprateur non born de (H, , ) dans lui-mme. On suppose que D(T ) est dense dans (H, , ) et que T : (D(T ), , D(T )) (H, , ) est continu. Alors
dans le cas o D(T ) nest pas dense dans H1 , il est possible de construire un prolongement (non unique) de T en utilisant le thorme de HahnBanach.
6

173

on dit que T est auto-adjoint hermitien si et seulement si D(T ) est limage de D(T ) par lisomorphisme de RieszFrchet R : H H et T R = RT sur D(T ). Exercice 15 On considre loprateur hamiltonien H = 2m + V , o V C (R3 ) est uniformment born sur R3 , ainsi que ses drives premires et secondes. Son domaine est H 2 (R3 , C) L2 (R3 , C). On rappelle que Cc (R3 , C), lespace des fonctions de C de R3 vers C support compact, est dense dans (L2 (R3 , C), , L2 ) et dans (H 2 (R3 , C), , H 2 ). 1) Dmontrer que Cc (R3 , C), H 2 (R3 , C), , H
L2
2

= H,

L2 .

2) En dduire que D(H ) = RL2 (H 2 (R3 , C)) et que H est auto-adjoint hermitien. 3) Dmontrer de mme que p et x sont des oprateurs auto-adjoints hermitiens non borns de L2 (R3 , C) dans lui-mme.

6.3
6.3.1

Le thorme dEhrenfest et ses consquences


Le thorme dEhrenfest

Nous revenons lquation de Schrdinger et allons rechercher comprendre les observables considres la section 6.2 de ce chapitre. Nous allons trouver dautres lois de conservation, ou mme des relations dun type plus gnral, qui permettent de prdire la variation de certaines quantits. Nous notons ici H := L2 (R3 , C) et nous considrons un oprateur linaire auto-adjoint hermitien A, non born en gnral, agissant sur H. Nous considrons une solution C (R R3 , C) de lquation de Schrdinger et nous faisons aussi lhypothse que t R, A(t, ) C (R3 , C). Nous associons et A la densit b A (t, x) := (t, x)A(t, x). Observer quen gnral, et la dirence du cas o A est lidentit, cette fonction nest pas relle positive, mais prend ses valeurs dans C. Calculons b A sa drive par rapport au temps : partir de = A + A et de t t t 174

lquation de Schrdinger, nous obtenons A = A i t = =


b 2 2

2m

+ V (x)

2m

+ V (x) A

2m 2

A() ()A + A(V ) V (A)

(A) ()A 2m 2 A() (A) + A(V ) V (A) 2m 3 2 (A) A + AH H A . = 2m =1 x x x Cela entrane que i o
A j := b A A j + t x =1 b 3 b

A, H ,

(6.3)

2im

(A) A x x

et A, H := AH H A est le commutateur des deux oprateurs. En procdant de la mme faon que pour la proposition 2 on en dduit le rsultat suivant. Proposition 3 (Thorme dEhrenfest) Soit C (R R3 , C) une solution de lquation de Schrdinger (6.1). Supposons que t R, (t, ) et A(t, ) H 1 (R3 , C). Alors i d dt (t, x)A(t, x)dx =
R3 R3

(t, x)

A, H (t, x)dx.

(6.4)

Remarque Il est possible dtendre ce rsultat des solutions de lquation de Schrdinger qui sont moins rgulires, en supposant par exemple qu chaque instant t, (t, ) prenne ses valeurs dans { L2 (R3 , C)/A, H, AH, H A L2 (R3 , C)}. Le rsultat peut alors se dduire de la proposition 6.4 en utilisant le fait que fonctions qui sont contenues dans ce sous-ensemble et qui sont C sont denses dans ce sous-ensemble. 175

6.3.2

Interprtation et exemples dapplications

Un principe gnral est qu toute quantit observable a est associ un oprateur auto-adjoint hermitien, en gnral non born A. Alors si, un certain instant t, la particule est dans un tat physique quantique dcrit par la fonction donde D(A) L2 (R3 , C), les valeurs prises par la quantit observable a sont alatoires et la valeur moyenne de a vaut : a =
R3

A dx.

Alors si ltat physique de la particule volue en tant gouvern par lhamiltonien H, cest dire si est une solution de lquation de Schrdinger i d = H, lvolution de a est donne en vertu du thorme dEhrenfest dt par da = i [A, H] dx. (6.5) dt R3 Il est particulirement intressant dexaminer ce que donne ce rsultat lorsque A est x , p ou H. Exercice 16 Dmontrer les relations suivantes : [H, H] = 0, [x , H] = i p m et [p , H] = V . i x

En appliquant les rsultats de lexercice prcdent, on obtient que dH d = dt dt H dx


R3

= 0 (conservation de lnergie), =
R3

d x d = dt dt et d p d = dt dt

x dx
R3

p p dx = , m m V x .

p dx
R3

R3

V dx = x

Ces relations permettent de retrouver les lois de Newton pour la mcanique. Mais il est encore plus intressant de les comparer avec la formulation hamiltonienne de la mcanique, savoir : dH = {H, H} = 0, dt dx p = = {H, x } et dt m dp V = = {H, p }. dt x

176

Plus gnralement, pour toute fonction F C (T N , R) (observable classique) et toute trajectoire hamiltonienne t (q(t), p(t)), dF (q(t), p(t)) = {F, H}(q(t), p(t)), dt quation dont lanalogie avec (6.5) est frappante. (6.6)

6.3.3

Un principe de correspondance

Rcapitulons les observations faites jusqu prsent : les lois de la physique classique et de la mcanique quantique peuvent se prsenter toutes les deux comme la donne dun espace des phases : lespace E de tous les tats physiques e que peut adopter un systme (dcrivant une particule par exemple) un certain instant. Cette description est dterministe car la connaissance de ltat physique un certain instant dtermine en principe les tats physiques futurs (et passs) du systme. une loi dvolution : celle-ci permet justement de prciser comment dduire les tats dans le futur et le pass partir de la connaissance de ltat du systme un certain instant. Mathmatiquement cette loi dvolution est dcrite par un systme dynamique, cest dire une quation de = X(e(t)), o X est un champ de vecteur dni sur lespace dt des phases E. des grandeurs observables : il sagit de quantits a que nous sommes capables de mesurer exprimentalement. Les exemples les plus courants sont lnergie, la position, limpulsion dune particule7 . Ces grandeurs observables sont modlises mathmatiquement par des fonction ou des oprateurs sur lespace des phases E.
Notons ce sujet que trouver une dnition concise et purement mathmatique de cette notion est une question dicile. De plus si nous revenons aux considrations prsentes lintroduction de chapitre et si nous rchissons bien, nous remarquons quil existe des quantits plus directement observables (la longueur donde dun photon incident ou dius par exemple) que dautres, qui ncessitent des calculs de physique plus ou moins sophistiqus an de pouvoir tre dduites des mesures exprimentales.
7

177

Concept Espace des phases : un tat : Loi dvolution :

Mcanique classique Varit symplectique T R3 ou T N (q, p) d (q, p) = H (q, p) dt 2 H(q, p) = |p| + V (q) 2m F C (T N , R) F (q, p) = valeur observe

Mcanique quantique Espace de Hilbert H = L2 (R3 , C) ou L2 (N , C) | avec | = 1 = H t2 H = 2m + V (x) i A : H H, A = A |A| = a = valeur moyenne de a

Observables : Lien avec des mesures exprimentales : Evolution de la valeur dune observable :

d dt

(F (q, p)) = {F, H}(q, p)

d dt

a = |[A, H]|

Malgr ces parallles il existe des dirences profondes entre la mcanique classique et la mcanique quantique ici, notament en ce qui concerne le lien entre tat physique et quantit observable : dune part en physique classique, pour un tat physique donn, si on connat la valeur de toutes les observables en cet tat, on peut en dduire ltat physique correspondant. En mcanique quantique, on ne peut pas connatre les valeurs de A pour tous les oprateurs observables simultanment, mais seulement pour une famille doprateurs A1 , , Ap qui commutent entre eux (cf. Chapitre 7). De plus, on ne connat au mieux qu une phase prs, puisque toutes les quantits observables sont des fonctions de invariantes par les transformations ei , o est une constante relle8 . Enn il faut se rappeler que | ne donne que des informations probabilistes sur les observations.

On peut en fait remdier cela en posant que lensemble des tats physiques est le quotient de {| H/ | = 1} par {ei / R}, ou encore le quotient de H \ {0} par C , cest dire lespace projectif complexe P H.

178

Chapitre 7 Applications de la mcanique quantique


Aprs avoir expos quelques uns des principes fondateurs de la mcanique quantique, nous allon maintenant essayer de jouer avec ces nouvelles rgles et examiner la description quantique de quelques systmes physiques simples.

7.1

Leet tunnel

Dans ce paragraphe, nous allons montrer que lquation de Schrdinger prvoit quune particule dote dune certaine nergie peut, avec une probabilit non nulle, franchir une barrire de potentiel plus haute que son nergie. Cet eet tunnel, purement quantique, est vri et mis en pratique quotidiennement, en particulier par son application aux semi-conducteurs. Nous allons considrer un problme unidimensionnel, ce qui ne change rien au phnomne physique mais simplie les calculs. Commenons par nous placer dans un domaine o le potentiel est constant, gal V . Si nous cherchons nouveau une solution stationnaire, sous la forme (t, x) = (x)eit , lquation de Schrdinger scrit
2

+ (V E) = 0, 2m o on a pos E = . Les solutions de cette quation sont de la forme (x) = Aei


px

+ Bei ,

px

179

o p2 /2m = E V . Si E > V , cest--dire, daprs linterprtation inspire de de Broglie, si lnergie de la particule est suprieure au potentiel, la fonction donde est une superposition de deux ondes planes monochromatiques, lune se dplaant vers la droite, lautre vers la gauche. En revanche, si E < V , p est imaginaire. Cette situation, interdite en mcanique classique, est possible en mcanique quantique : la fonction donde est alors une somme dexponentielles relles. Lorsque le potentiel est constant sur un intervalle non born, nous sommes nouveau confronts des problmes de normalisabilit de notre solution. Dans le cas dexponentielles relles, il sut de ne conserver que celle des deux exponentielles qui reste borne (le cas o E < V sur R tout entier est dnu de sens physique). Dans le cas dexponentielles imaginaires, la meilleure faon i de procder est dinterprter une onde plane monochromatique e (Etpx) comme un ux ininterrompu de particules, se dplaant vers la droite ou vers la gauche suivant le signe de p (resp. positif ou ngatif). Ce tour de passepasse permet de se contenter de la forme simple des solutions que nous avons crites plus haut et dviter davoir utiliser des paquets donde explicites. Supposons maintenant que le potentiel soit dni comme suit : V (x) = 0
V

Fig. 7.1 Un exemple de potentiel pour lquation de Schrdinger pour x < 0, V (x) = V0 > 0 pour 0 < x < a et V (x) = 0 pour x > a. Imaginons maintenant quun ux de particules dnergie E = < V0 et venu de vient frapper cette barrire de potentiel. Classiquement, le ux est compltement rchi et aucune particule nest transmise. Voyons ce que donne lquation de Schrdinger. Pour cela, posons k = 2mE/ et k = 2m(V0 E)/ . La solution scrit (t, x) = eit (x) avec eikx + eikx x < 0 (x) = ek x + ek x 0 < x < a ikx e a < x. 180

On a normalis 1 le coecient de londe incidente et on a limin demble dans le domaine a < x la partie de la solution correpondant un ux issu de +. Pour dterminer les constantes, on demande que soit de classe C 1 sur R. On trouve la valeur suivante pour le coecient : = 4ikk eika . (k + ik )2 ek a (k ik )2 ek a 4kk ek a . +k2

Lorsque k a >> 1, ce qui est le cas dans la plupart des applications, on a || k2

En particulier, nest pas nul : les particules incidentes ont une probabilit non nulle de franchir la barrire de potentiel. Par exemple, pour un ux dlectrons dnergie 1eV arrivant sur une barrire de hauteur 2eV et de largeur 1, la probabilit de traverser est de 0,8 environ ! (Dans ce cas par exemple, on na pas k a >> 1.)

7.2
7.2.1

Loscillateur harmonique
Premire mthode

Cet exemple fondamental va nous permettre dillustrer les principes du chapitre prcdent. Il sagit dune particule de masse m plonge dans un potentiel unidimensionnel quadratique V (x) = 1 m 2 x2 , o est une constante. 2 Nous cherchons les tats stationnaires, cest- dire les fonctions propres du hamiltonien : 2 1 (x) + m 2 x2 (x) = E(x). 2m 2 Posons = E/( ), = m/ et (y) = (y/ ). Avec ces changements de variable, lquation devient 1 2 d2 y 2 dy
2

(y) = (y).
y2

Exercice 17 En posant (y) = f (y)e 2 , montrer que lquation satisfaite par f scrit f 2yf + (2 1)f = 0. On peut chercher des solutions sous forme de sries entires f (y) = an y n . Montrer alors que les coecients 181

2 12n satisfont la relation an+2 = (n+1)(n+2) an . Montrer que si f nest pas un po-

lynme, nest pas de carr intgrable en montrant que (y) e 2 . Montrer que f nest un polynme que lorsque E = (n + 1/2) . Cette quation na de solutions L2 que lorsque E = (n + 1/2) pour un certain entier n. La fonction donde n correspondante est la fonction 2 n (x) = Cn ex /2 Hn (x 2), o Hn est le n-ime polynme de Hermite. Ainsi, les nergies que peut prendre loscillateur forment-elles un ensemble discret, on dit que lnergie est quantie, do le nom de la thorie. Remarquons aussi que lnergie minimale de loscillateur est strictement positive, ce qui est rapprocher des relations dincertitude : une particule ne peut tre parfaitement au repos en un point parfaitement dtermin.

y2

7.2.2

Deuxime mthode

Voyons maintenant comment une approche plus algbrique permet dobtenir les mmes rsultats. Le hamiltonien H= p2 1 + m 2 x2 2m 2
m

peut se factoriser de la faon suivante. Posons X = H = H. Alors Posons a =


1 (X 2

x, P =

1 p m

et

1 H = (X 2 + P 2 ). 2 + iP ) et a =
1 (X 2

adjoints lun de lautre. Essayons de les utiliser pour exprimer H :

iP ). Ces deux oprateurs sont

1 i i 1 H = (X iP ) (X + iP ) [X, P ] = a a [X, P ]. 2 2 2 2 Il y a un reste quil nous faut calculer. Tout dabord, on vrie que [x, px ] = i , 182

ce qui signie que, pour toute fonction , x i x i x (x) = i . On en dduit immdiatement que [X, P ] = i. Ainsi, nous obtenons

1 H = a a + . 2 Posons N = a a. Les oprateurs a, a et N sappellent respectivement oprateurs dannihilation, de cration et de nombre, pour une raison qui sera plus claire dans un instant. Nous cherchons les vecteurs propres de H, ou, ce qui revient au mme, ceux de N . Loprateur N est positif, car, pour tout , (|N |) = a 2 0. Soit un vecteur propre de N pour une certaine valeur propre n. Les relations fondamentales pour ce qui suit sont les suivantes (Exercice : les vrier !) : [N , a] = a [ N , a ] = a .

En eet, ces relations nous permettent de calculer N (a) = a(N ) + [N , a] = (n 1)a, Ces deux calculs simples sont fondamentaux. Ils indiquent que lorsque est un tat propre de H pour la valeur propre n + 1/2, a et a , sils ne sont pas nuls, sont encore vecteurs propres de H, pour les valeur propres n 1/2 et n + 3/2 respectivement. La rsolution du problme aux valeurs propres est maintenant possible. Commenons par le niveau fondamental : n = 0. La fonction 0 doit satisfaire a0 = 0, puisque 1 nest pas une valeur propre de loprateur nombre. Ceci scrit m et se rsout en 0 (x) = C0 e x0 + 0 = 0, x
m x2 2

N (a ) = a (N ) + [N , a ] = (n + 1)a .

On obtient des tats excits en appliquant un nombre arbitraire de fois loprateur a 0 . On trouve 1 n = C n n 2 x m d m dx
n

0 .

183

Exercice 18 1) Soit P (x) un polynme. Montrer que 1 2 x m d m dx P (x)e


m x2 2

2m

d 2m dx

P (x) e

m x2 2

Montrer que si lon pose R(x) = P x x 2m d 2m dx


n

2m

, alors 2m .

P (x) = [(x x )n R] x

En dduire que n = Cn [(x x )n 1] x 2m e


m x2 2

o 1 dsigne le polynme constant gal 1. 2) On dnit maintenant le produit scalaire (f, g) =


x2 dx f (x)g(x)e 2 . 2 R

Autrement dit, on considre lespace L2 de la mesure gaussienne standard sur R. Montrer que ladjoint formel de loprateur x par rapport ce produit scalaire est loprateur x = x x . On dnit maintenant une suite de polynmes Hn par la relation
hn (x) = (x )n 1.

Montrer que, si m < n, alors les fonctions xm et hn sont orthogonales. En dduire que les hn forment une famille orthogonale pour le produit scalaire (, ). Montrer que hn
2

=
R

hn (x)2 e

x2 2

dx = n!. 2

On pose donc Hn (x) = 1 hn (x). Ces polynmes sappellent les polynmes n! de Hermite et ce sont les polynmes orthogonaux de la mesure gaussienne standard. x2 3) Nous allons maintenant montrer que la famille Hn (x)e 2 est totale dans 184

lespace de Hilbert ususel L2 (R, dx). Tout dabord, montrer que ceci est une consquence du fait, dmontrer, que la famille des Hn est totale dans lespace L2 de la mesure gaussienne standard. Nous nous plaons donc dsormais x2 dans cet espace L2 (R, e 2 dx/ 2). Montrer que, pour tout t rel, la srie (itx)n /n! y converge vers eitx . En dduire que si une fonction u(x) est orthogonale tous les polynmes de Hermite, elle satisfait la relation u(x)eitx d(x),
R

o on a dni la mesure par x2 d(x) = e 2 dx/ 2. Comme u L2 (R, d) et (R) = 1 < , on a aussi u L1 (R, d). Ainsi, la mesure u existe et, daprs la relation prcdente, elle satisfait, pour tout t rel, u(t) = 0, o le chapeau indique la transformation de Fourier, cest--dire la fonction caractristique. Comme celle-ci est nulle identiquement, la mesure u est la mesure nulle, donc u = 0 p.p., donc u = 0.

Nous avons donc compltement identi les fonctions propres du hamiltonien : x2 2m x e 2 . n (x) = Hn

Il ny en a en eet pas dautres : nous avons dmontr que la famille 0 , 1 , tait totale dans L2 (R). Il ny a donc plus de place pour dautres vecteurs propres ! Ces fonctions satisfont la relation Hn = (n + 1/2) n. Les tats stationnaires de loscillateur harmonique une dimension scrivent donc n (t, x) = ei(n+ 2 )t Hn
1

2m

x e 2 .

x2

La forme exacte du rsultat est moins importante ici que la faon dont on la obtenu. En particulier, cette seconde mthode illustre limportance fondamentale des relations algbriques entre les observables et tout particulirement leurs relations de commutation. 185

7.3

Ensembles complets dobservables qui commutent

Comment peut-on prparer un systme dans un tat bien dni ? Lorsquon eectue une mesure sur un systme, le rsultat donne une information qui peut tre partielle sur le systme, car une valeur propre donne dune observable peut tre dgnre, cest--dire de multiplicit plus grande que 1. On peut savoir que la fonction donde se trouve dans un espace propre donn, sans toutefois la connatre une constante prs. Une mesure dune seconde quantit peut alors aner notre connaissance du systme, condition quelle ne dtruise pas linformation fournie par la premire : il faut que les observables en jeu commutent. On appelle ensemble complet dobservables qui commutent (ECOC en abrg) une famille a1 , a2 , . . . (nie ou innie) dobservables qui commutent deux deux et telles que, si V1 , V2 , . . . sont respectivement des espaces propres de a1 , a2 , . . ., alors n1 Vn est au plus de dimension 1. Notons quil existe une analogue classique de la notion de famille dobservables qui commutent : on le retrouve en revenant au principe de correspondance nonc la n du chapitre prcdent. Il sagit en eet dune famille de fonctions F1 , F2 , . . . appartenant C (T N ) telles que i, j, {Fi , Fj } = 0. En termes physiques, les quantits a1 , a2 , . . . sont mesurables simultanment et leur connaissance dtermine compltement ltat du systme. Par exemple, pour un oscillateur harmonique, le hamiltonien H forme lui seul un ECOC : la condition de commutation est vraie par dfaut et les valeurs propres de H sont simples. Nous allons voir au paragraphe suivant un exemple plus sophistiqu, o le choix dun ECOC est particulirement utile.

7.4

Le moment cintique

Le moment cintique joue un rle important dans ltude de problmes mcanique invariants par rotation. Un exemple classique est celui du problme de Kpler, o lon tudie le mouvement de deux masses ponctuelles (gurant des astres) interagissant par la force de gravitation universelle. Aprs 186

stre ramen au mouvement dun point mobile autour dun point xe1 , on remarque que les trois composantes du vecteur moment cintique par rapport lorigine (o se trouve le centre de masse) : Lx x px L = Ly := y py Lz z pz

sont constantes. Cela est trs utile : on en dduit dans un premier temps que la trajectoire est entirement contenue dans un plan (qui est celui passant par lorigine, orthogonal L). Donc il sut denvisager un mouvement plan : sans perte de gnralit on peut, grce un choix judicieux du systme de coordonnes, supposer que ce plan est celui contenant les axes x et y. Alors il nous reste encore une information utile, savoir que Lz = xpy ypx est constant. Sachant galement que lnergie totale est conserve, il est alors possible de dterminer toutes les trajectoires (les trajectoires elliptiques, paraboliques et hyperboliques de Kpler). Si ce problme a pu tre simpli, cest parce que, outre la relation {H, H} = 0 o H est lhamiltonien, qui entrane la conservation de lnergie, on a : {L, H} = 0. On dit que H est en involution avec chacune des composantes de L. Cette relation permet en eet de retrouver le fait que les composantes du moment cintique sont conserves. Lorsque lon tudie la version quantique de ce type de problme, comme par exemple latome dhydrogne (mouvement de rotation dun lectron autour dun proton selon le modle de Rutherford), des relations analogues entre lhamiltonien H et les composantes de loprateur moment cintique Lx x px ypz zpy L = Ly := y py = zpx xpz z pz xpy ypx Lz
1

par rduction dans le rfrentiel li au centre de masse, voir Exercice 11 au chapitre 5, section 5.3

187

peuvent tre obtenues et sont aussi dune grande utilit. Il sagit des relations L, H = L2 , H = L, L2 = 0, o ici les crochets de Poisson ont t remplacs par des commutateurs et L2 := (Lx )2 + (Ly )2 + (Lz )2 . En particulier nous pouvons choisir trois oprateurs qui commutent tous deux deux, par exemple H, L2 et n1 Lx + n2 Ly + n3 Lz , o (n1 , n2 , n3 ) sont les composantes dun vecteur non nul (sans perte de gnralit nous choisirons (n1 , n2 , n3 ) = (0, 0, 1)). Rappelons un rsultat bien connu en algbre linaire : si A et B M (n, C) sont deux matrices hermitiennes, i.e. A = A et B = B, qui commutent, i.e. [A, B] = 0, alors elles sont diagonalisables dans une mme base. Ce rsultat stend aux oprateurs hermitiens auto-adjoints qui commutent. En admettant cela et en revenant latome dhydrogne, nous pouvons prvoir a priori quil existe une base hermitienne de Hilbert |E, (2) , z , de L2 (R3 , C), avec H|E, L2 |E, Lz |E,
(2)

, z, (2) , z, (2) , z,

Lindice a t incorpor ici pour tenir compte de la possible multiplicit du sous-espace propre du triplet doprateurs (H, L2 , Lz ) pour le triplet de valeurs propres (E, (2) , z ). En fait nous verrons plus loin que, si nous ne tenons pas compte du spin de llectron, chacun de ces sous-espace, sil existe, est de dimension 1 et donc que lindice est superu. Daprs les rsultats de lexercice qui suit, le simple fait que L, L2 = 0 et2 L, L = i L a les consquences suivantes : les seules valeurs propres autorises pour L2 sont de la forme (2) = j(j + 1) 2 , o 2j N. dans le sous-espace vectoriel des fonctions | telles que L2 | = j(j + 1) 2 | , les seules valeurs propres autorises pour Lz sont du type z = m , o m = j, j + 1, , j 1, j.
2

= E|E, (2) , z , , = (2) |E, (2) , z , , = z |E, (2) , z , .

i.e. Ly , Lz = i Lx , Lz , Lx = i Ly et Lx , Ly = i Lz

188

En particulier nous remarquons que, si j est entier, alors toutes les valeurs de m sont aussi entires et si j est un demi-entier, alors toutes les valeurs de m sont demi-entires. Exercice 19 On rappelle que le moment cintique angulaire classique dune particule, par rapport lorigine 0 est le vecteur J := x p. On considre la version quantique de cette observable, cest dire loprateur ypz z py J := x p = z px xpz . xpy ypx

On rappelle que [x , p ] = i . 1) Dmontrer que J J = i J. 2 2 2 2) On pose J 2 := Jx + Jy + Jz et J+ := Jx + iJy et J := Jx iJy . Dmontrer que [J 2 , J+ ] = [J 2 , J ] = [J 2 , Jz ] = 0, [Jz , J+ ] = J+ , [Jz , J ] = J et [J+ , J ] = 2 Jz . Dans la suite nous allons considrer une reprsentation sur un espace de Hilbert complexe de ces oprateurs. On dsigne par E ,m lensemble des vecteurs propres pour J 2 et Jz avec les valeurs propres 2 et m respectivement. On note |, m un vecteur dans E,m . Il satisfait donc J 2 |, m = 2 |, m et Jz |, m = m |, m . Sil ny a pas de vecteur propre pour (, m) on convient de poser E,m := {0}. 3) Montrer que, pour que E,m := {0}, il est ncessaire que , m R et 0. 4) Dmontrer que J+ |, m E,m+1 et J |, m E,m1 . 2 5) Dmontrer que ladjoint de J est J et que J J = J 2 Jz Jz . Utiliser 2 ce rsultat pour calculer ||J |, m || et en dduire que, si |, m est vecteur propre (et donc en particulier non nul), alors m2 m 0. Dans la suite on xe (, m) et on suppose que |, m = 0. n 6) Soit p := inf{n N/J |, m = 0}. Dmontrer que p existe dans N et que p p1 J |, m = 0 et J |, m = 0. En dduire que = (mp+1)2 (mp+1). n 7) Soit q := inf{n N/J+ |, m = 0}. Dmontrer que q existe dans N et que q1 q J+ |, m = 0 et J+ |, m = 0. En dduire que = (m+q1)2 +(m+q1). 8) Montrer que m = 1 (p q) et = j(j + 1), o j := 1 (p + q) 1. 2 2 9) En dduire que les valeurs propres autorises pour J 2 sont de la forme j(j + 1) 2 , pour j 1 N et que, dans le sous-espace vectoriel des vecteurs 2 2 propres de J pour j(j +1) 2 , les valeurs propres de Jz sont m = j , (j

189

1) , , (j 1) , j 3 . Adoptons la notation j,m = |j, m . Si nous crivons Jz = xpy ypx en coordonnes sphriques (r, , ), nous obtenons Jz = i Ainsi, |j, m est-il solution de i donc j,m (r) = j,m (r, )eim . Cette fonction nest priodique de priode divisant de 2 que si m est entier. Ainsi, les cas o m est demi-entier sont-ils exclus pour dcrire le moment cintique orbital. Cela force galement j tre entier. Les oprateurs Jz et J 2 sexpriment naturellement en coordonnes sphriques. Nous avons dj crit Jz , et nous avons de plus J2 =
2

j,m = m j,m ,

1 1 2 sin + sin sin2 2

Ces deux oprateurs ne dpendent donc que de et . Ainsi, les fonctions j,m ne dpendent que de ces deux variables. Nous les noterons Yj,m (, ). Elles sappellent les harmoniques sphriques. titre dexemple, voici une table des premires harmoniques sphriques : 1 Y0,0 = , 4 Y1,1 = Y2,2 = 3 sin ei Y1,0 = 8 3 cos Y1,1 = 4 3 sin ei , 8

15 15 5 sin2 e2i Y2,1 = sin cos ei Y2,0 = (3 cos2 1). 32 8 16 Les harmoniques sphriques vont jouer un rle trs important dans la description de latome dhydrogne.
3

lusage est alors de noter |j, m ce que nous avons not ici |, m = |j(j + 1), m .

190

7.5

Latome dhydrogne

Nous allons maintenant tudier le comportement dun lectron dans un potentiel coulombien. Vu les symtries de ce systme, il est commode de passer en coordonnes sphriques. Nous utilisons lexpression suivante du laplacien : = 1 2 1 r 2 2 J 2. r r 2 r

Lquation de Schrdinger stationnaire scrit donc J2 1 2 r+ + V (x) (x) = E(x). 2m r r 2 2mr 2


2

Il est important de remarquer que cet hamiltonien commute Jz et J. Nous armons que H, Jz , J 2 forment un ECOC (exercice : le vrier). Cherchons les solutions sous la forme j,m (x) = Rj (r)Yj,m (, ).
q On a V (r) = 4 0 r = er , o la seconde galit dnit e. Comme J 2 Yj,m = j(j + 1) 2 Yj,m , lquation stationnaire devient
2 2

1 2 j(j + 1) r+ 2 2m r r 2mr 2

e2 r

Rj (r) = ERj (r).

An de simplier lquation, nous allons nous placer dans un systme dunits adapt notre problme. Tout dabord, dnissons la constante de structure ne sans dimension, e2 1 = . c 137 Elle est construite comme le rapport de deux vitesses, e2 / et c. Lunit de longueur du problme est le rayon de Bohr
2

a1 =

me2

0, 53.

Cest lordre de grandeur de la taille dun atome. Enn, lunit dnergie est 1 1 e4 = mc2 2 EI = m 2 2 2 191 13, 6 eV,

qui est lnergie dionisation de lhydrogne. En posant maintenant r = a1 et E = EI , lquation devient 1 d2 j(j + 1) 2 + 2 d 2 Posons R() = e F () + 2

Rj (r) = 0.

F (). Lquation en F scrit alors F () + j(j + 1) 2 + (1 ) F () = 0. 2

Cherchons la solution sous la forme F () = s (c0 + c1 + ). Lorsque tend vers 0, lquation se comporte comme 2 j(j + 1) F () + F () F () = 0 2 et on doit avoir s(s + 1) = j(j + 1), cest--dire s = j ou s = j 1. Seule la solution s = j est acceptable pour des raisons de normalisabilit. Posons donc F () = l f (). Lquation satisfaite par f scrit alors f () + 2 j+1 2 f () + (1 (j + 1) )f () = 0. cn n . On trouve

On cherche f sous la forme dune srie entire : f () = la relation de rcurrence 1 (j + n + 1) cn+1 = 2 cn . (n + 1)(2j + n + 2)

De la mme faon que pour loscillateur harmonique, cette srie doit sarrter aprs un nombre ni de termes pour que la solution soit de carr intgrable. Il doit donc exister n tel que = 1 . (n + j + 1)2 192

Les polynmes f () sappellent polynmes de Laguerre. La fonction donde radiale scrit alors Rj () = e
j

(c0 + c1 + + cn n ).

On appelle n = n + j + 1 le nombre quantique principal. Une solution est donc dtermine par trois nombres quantiques : le nombre quantique principal n = 1, 2, . . ., les nombres j et m qui satisfont 0 j < n et j m j. Lnergie de la solution n,j,m est En = EI /n2 . On a n,j,m = Yj,m (, )e
r na 1

r a1

c0 + c 1

r + + cnj1 a1

r a1

nj1

193

194

Chapitre 8 Le point de vue de Heisenberg


8.1 La mcanique des matrices

rdiger

8.2

Les relations dincertitudes dHeisenberg

Soient a et b deux observables et A et B les oprateurs auto-adjoints hermitiens correspondants. Rappelons que, si lon observe un trs grand nombre de systmes physiques tous physiquement identiques , cest dire dcrits par le mme vecteur | H, les valeurs moyennes de a et de b sont donnes par a = |A| et b = |B| , mais que ces deux esprances mathmatiques correspondent des lois de probabilit en gnral direntes. La relation dHeisenberg prcise justement cette dirence, en imposant une relation entre les variances de chacune des observables, pour les lois de probabilits correspondantes. Dnissons les variances : (a)2 := (a a )2 = |(A )2 | et (b)2 := (b b )2 = |(B )2 | , o A := A a et B := B b . 195

Nous partons1

du fait que, R,

0 ||(A + iB )| ||2 = |(A + iB ), (A + iB )| = |, (A iB )(A + iB )| =

|(A )2 | + 2 |(B )2 | + |i A B B A | .
2

Donc le discriminant de ce polynome doit tre ngatif, cest dire = |i[A , B ]| Do lon dduit que 1 |i[A, B]| 2 . 4 Cela entrane lingalit suivante sur les carts-type : |(A )2 | |(B )2 | 1 (a)(b) | |, [A, B]| |. (8.1) 2 Cest la relation dincertitude dHeisenberg. Elle entrane notamment que, si A et B ne commutent pas, alors il nexiste pas dtat physique | pour lequel lcart-type de a et celui de b soient simultanment nuls. Lexemple le plus important est celui des observables x et p : comme [x , p ] = i , on en dduit que (x )(p ) 2
.

4 |(A )2 | |(B )2 | 0.

8.3

Reformulation des principes de la mcanique quantique

rdiger
Il faut se souvenir que, pour tout oprateur U , | (U | ) = |U | ou encore, en notant |, U | := | (U | ) et |U, | := ( |U ) | , |, U | = |U , | . Cest pourquoi nous avons |, U | = |U, | en gnral, sauf si U = U . De plus, il est clair que, si U et V sont des oprateurs auto-adjoints hermitiens, alors (U + iV ) = U iV . Enn rappelons que si U = U on note |U | = |, U | = |U, | . 2 Nous utilisons le fait que, si U et V sont deux oprateurs auto-adjoints hermitiens, alors i[U, V ] est aussi auto-adjoint hermitien.
1

196

8.4
8.4.1

Le spin
Fonctions propres pour Lz

Revenons sur les calculs eectus propos du moment cintique angulaire. Nous considrons loprateur Lz agissant sur L2 (R3 , C) C (R3 \ {0}, C) et nous recherchons les vecteurs propres L2 (R3 , C) C (R3 \ {0}, C) pour Lz avec la valeur propre z . Cela signie que : Lz = (xpy ypx ) = i x y y x =
z .

(8.2)

Considrons alors la famille de fonctions ( )R , dnie par (x, y, z) := (x cos y sin , x sin + y cos , z), (x, y, z) R3 \ {0}.

Alors, en utilisant (8.2) on obtient, notant x := x cos y sin et y := x sin + y cos , que d ( (x, y, z)) = y (x , y , z) + x (x , y , z) d x y i = Lz (x , y , z) = = Nous en concluons que d i z = . d Nous pouvons intgrer cette quation direntielle ordinaire valeurs dans C (R (R3 \ {0})) : nous trouvons que = e
i z

i i

z (x , y , z) z (x, y, z).

0 = e

i z

Nous remarquons alors quil dcoule de la dnition de que nous devons avoir 2 = , ce qui nest possible que si 2 z 2Z, cest dire
z

= m,

o m Z. 197

Nous retrouvons ainsi une condition ncessaire sur z analogue celle obtenue lexercice (19), la dirence quici m est ncessairement entier et ne peux pas tre un demi-entier. Donc si est en mme temps un vecteur propre pour L2 , cela ne peut tre quavec une valeur propre de la forme j(j + 1) 2 , o j est un entier positif.

8.4.2

Retour sur le moment cintique angulaire

Rappelons nouveau les rsultats de lExercice (19). On considre un espace de Hilbert hermitien H et des oprateurs auto-adjoints hermitiens Jx , Jy et Jz agissant de H dans lui-mme. On note Jx 2 2 2 J = Jy et J 2 := Jx + Jy + Jz Jz et on suppose que ces oprateurs satisfont les relations J , J 2 = 0 et J J = i J. Alors H se dcompose3 en une somme directe aA HA , o chaque sous-espace Ha satisfait les proprits suivantes :

Ha est stable par J, i.e. Ha , Jx , Jy , Jz Ha Ha est un sous-espace propre de J 2 pour une valeur propre ja (ja + 1) 2 , avec 2ja N Ha est irrductible, i.e. les seuls sous-espaces de Ha stables par J sont Ha et {0}. Enn, on peut dcomposer chaque sous-espace Ha = ja a C|a, ja , m , m=j

les composantes de J sont des oprateurs compacts (cf. H. Brezis, Analyse fonctionnelle, Masson) pour obtenir ce rsultat. Alors la somme est hilbertienne, ce qui signie que A est un ensemble dnombrable et aA HA est dense dans H. Dans le cas o les oprateurs ne sont pas compacts, un rsultat similaire sobtient, mais son nonc, en terme de mesure spectrale, est plus compliqu (cf. T. Kato, Perturbation theory for linear operators, Springer).

ici, soit H est de dimension nie et alors il ny a pas de dicult particulire, soit H est de dimension innie et alors, nous devons supposer que H est sparable et que

198

o Jz |a, ja , m = m |a, ja , m et4 (Jx iJy )|a, ja , m C|a, ja , m 1 . Ce rsultat permet de dcomposer H par blocs irrductibles, qui sont tous de dimension nie. Chaque bloc est isomorphe un espace de la forme j m=j C|j, m , pour un certain j tel que 2j N et laction des oprateurs J sur la base peut tre explicite. Observations du moment cintique Le moment cintique angulaire pour une particule charge peut sobserver en prsence dun champ magntique : tout dabord on dnit loprateur aimantation dune particule charge en mouvement de rotation comme tant le vecteur := J ,
q o est une constante relle, qui vaut 0 = 2me pour un lectron de charge q et de masse me dans un potentiel central. Si ce systme est soumis un champ magntique B, alors lnergie dinteraction entre la particule et le champ magntique est HM = B.

Si par exemple B est constant, de la forme B(0, 0, 1), alors HM = z B = B Jz .

Imaginons prsent un atome dhydrogne baignant dans un champ magntique constant. Alors lhamiltonien gouvernant le systme est la somme HH + HM , o HH est lhamiltonien standard pour latome dhydrogne, sans champ magntique (il contient lnergie cintique de llectron et lnergie dinteraction lectrostatique avec le noyau.) Puisque les deux hamiltoniens commutent, les niveaux dnergie de lhamiltonien total sont de la forme En mB , o En , pour n N, est une des valeurs propres de HH et o m {j, j + 1, , j 1, j}. Ainsi les niveaux En se subdivisent en familles de niveaux dnergie dont la valeur reste proche de En (si B est petit), mais les niveaux dnergie restent discrets. On parle de clivage des niveaux dnergie de latome. On peut remarquer ce propos que, en faisant des calculs dans un cadre classique, on trouverait que lnergie de latome
en posant J+ |a, ja , m = (ja (ja + 1) m(m + 1)|a, ja , m + 1 et J |a, ja , m = (ja (ja + 1) m(m 1)|a, ja , m 1 , on peut supposer sans perte de gnralit que || |a, ja , m || = 1.
4

199

serait aussi altre par le champ magntique, mais dune faon continue. Les clivages peuvent tre mesurs par des expriences de spectroscopie, puisque les photons mis ou absorbs par latome doivent avoir une nergie gale (En mB ) (En m B ). De tels clivages en prsence dun champ magntique ont ts observs trs tt. Donc tout concorde... sauf que les clivages pour lhydrogne et les atomes alcalins sont en nombre pair. Cet eet a t constat entre 1896 et 1903 par Pieter Zeeman et porte le nom de ce physicien. Ou est le problme ?

8.4.3

Le spin dun lectron

On ne peut pas expliquer un clivage en un nombre pair des niveaux dnergie par un calcul utilisant lquation de Schrdinger comme nous avons fait au dbut de ce chapitre. En eet, en supposant que B = B(0, 0, 1), lnergie dinteraction de llectron dans latome dhydrogne avec B devrait provenir de la composante verticale (en z) du moment cintique angulaire de cet lectron et donc des valeurs propres de loprateur Lz = xpy ypx , agissant sur l espace des phases de llectron, cest dire L2 (R3 , C). Or nous avons dja calcul au dbut de ce chapitre que les valeurs propres de Lz sont ncessairement de la forme m , o m = j, j + 1, , j 1, j est entier (et donc j aussi est un entier). Et nous voyons bien que, pour chaque valeur entire de j, il y a 2j+1 valeurs possibles pour m, cest dire un nombre impair ! Il sagit l dun problme qui a occup les physiciens pendant beaucoup de temps. La solution, labore en 1925-26 par Wolfgang Pauli et par GeorgeEugne Uhlenbeck et Samuel Abraham Goudsmit, ncessite de prendre encore plus au srieux le point de vue, inspir des ides de Heisenberg, que nous avons vu au dbut de ce chapitre. A savoir : lespace des tats physiques est un espace de Hilbert dont lessence est totalement inobservable et on nobserve que les valeurs propres doprateurs agissant sur cet espace de Hilbert et qui sont caractriss par des relations de commutations. Ainsi les rsultats de lExercice (19) sont bien plus quun simple exercice dalgbre destin rendre plus lgants des calculs que lon pourrait raliser partir des expressions explicites de laction de J sur L2 (R3 , C). En eet ils montrent 200

que les oprateurs J 2 et Jz sont a priori autoriss admettre respectivement des valeurs propres j(j + 1) 2 et m , o j et m sont soit des entiers, soit des demi-entiers. Mais alors, pour une valeur demi-entire de j, le nombre de valeurs de m compatibles est pair. Il faut donc admettre que de tels oprateurs soient observables dans un atome dhydrogne. Plus prcisment leet Zeeman est explicable en admettant que llectron est dot dune sorte de moment cintique angulaire , pour lequel Jz ne possde que deux valeurs propres, cest dire correspondant j = 1 . 2 Ce moment cintique angulaire est appel le spin. Il nexiste pas danalogue en mcanique classique de ce degr de libert purement quantique, et en particulier le spin ne correspond pas la rotation dune charge dans lespace.
1 Examinons un exemple despace de Hilbert H sur lequel agit J avec j = 2 . Il sagit du bloc non trivial le plus simple pouvant apparatre dans la

dcomposition dun espace de Hilbert sur lequel agirait J avec J J = i J. (On parle de reprsentation irrductible la plus simple du groupe Spin). Cet 1 1 1 espace est engendr par deux vecteurs | 2 , 2 (correspondant j = 2 et 1 1 1 1 m = 2 ) et | 2 , 2 (correspondant j = m = 2 ). Nous noterons, pour plus de simplicit 1 1 | := | , 2 2 1 1 et | := | , . 2 2
2

Rappelons aussi la notation J := Jx Jy . Alors nous avons J 2 | = 34 | , 2 J 2 | = 34 | et Jz | = 2 | et Jz | = 2 | . De plus il est possible de poser, sans perte de gnralit, | = J+ | . Alors nous avons || | || = || | ||, ce qui entrane que nous pouvons normaliser ces deux vecteurs simultanment. Enn ces deux vecteurs sont hermitiens orthogonaux, puisquils sont vecteurs propres de Jz pour deux valeurs propres direntes. Ainsi lespace H, muni de la base hermitienne (| , | ), est isomorphe C 2 . Nous pouvons donc identier les vecteurs tats quantiques | = 1 0 , | = 0 1 ,

201

et alors les oprateurs J 2 , Jz et J sidentient aux matrices J2 = 3 2 4 1 0 0 1 0 1 0 0 , Jz = 2 1 0 0 1 0 0 1 0 . ,

J+ = Nous en dduisons que Jx =

J =

0 1 1 0

Jy =

0 i i 0

On crit souvent que Jx = 2 x , Jy = 2 y et Jz = 2 z , o lon a introduit les matrices de Pauli 5 x = 0 1 1 0 , y = 0 i i 0 et z = 1 0 0 1 .

Appendice : produits tensoriels


Dnitions
Soient E et F deux espaces vectoriels sur un corps K (qui est souvent R dans les applications la gomtrie direntielle et C dans les applications la physique quantique). Supposons dans un premier temps que E et F sont de dimension nie et considrons (e1 , , en ), une base de E, et (f1 , , fp ), une base de F . Alors lespace vectoriel engendr par les vecteurs nots ei fj , pour 1 i n et 1 j p est appel produit tensoriel de E et F et est not E F . Ainsi un vecteur z E F se dcompose de faon unique selon
n p

z=
i=1 j=1
5

z ij ei fj ,

ces matrices admettent plusieurs interprtations. Lune delles est que lapplication H R+ SU (2), t + ix + jy + kz t i(xx yy zz ) est un isomorphisme de corps entre les quaternions et R+ SU (2) := {r a/r [0, [, a SU (2)}.

202

o les coecients z ij sont dans K. On remarque qu toute forme bilinaire B : E F K correspond une unique forme linaire B : E F K, dnie par
n B i=1 j=1 p n p

z ei f j

ij

:=
i=1 j=1

z ij B(ei , fj ).

Rciproquement il est facile de voir partir de cette relation que toute forme linaire sur E F dnit une unique forme bilinaire sur E F . Cette proprit peut tre utilise pour donner une autre dnition de E F , indpendante du choix dune base. Dnition 8 Etant donn deux espaces vectoriels E et F sur K. Il existe un espace vectoriel sur K, unique un isomorphisme prs, que nous noterons E F et une application bilinaire P : E F E F , unique au mme isomorphisme prs, tels que pour toute application bilinaire B : E F K, il existe une unique application linaire L : E F K telle que B = L P. Lespace EF est appel produit tensoriel de E par F et on note P (x, y) = x y, x E, y F . Remarque Il faut prendre garde au fait que le produit tensoriel est trs dirent du produit cartsien. Ainsi, si dim E = n et dim F = p, alors dim(E F ) = n + p et dim(E F ) = np. Exemple Le produit tensoriel E E sidentie lespace vectoriel des formes bilinaires sur E. Plus gnralement, si (e1 , , en ) est une base de E et si ( 1 , n ) est la base duale (de E ), alors, on a (les signes sommes n i,j=1 tant sous-entendus, chaque fois quun indice appara t une fois en haut et une fois en bas) E E = {x = xij ei ej /xij K}, E E = {x = xij i j /xij K}, E E = {x = xi j ei j /xi j K}, E E = {x = xi j i ej /xi j K}.

Dans le cas o E et F sont des espaces vectoriels de dimension innie, il est utile dans ce qui nous concerne de supposer que E et F sont des espaces de 203

Banach. Alors nous pouvons adapter la dnition prcdente en demandant que : lapplication P soit continue et que les applications B et L soient continues.

204

You might also like