You are on page 1of 176

Algemene Relativiteitstheorie

N. Van den Bergh

februari, 2007
ii
Inhoudsopgave

1 Differentiaalmeetkundige Begrippen 1
1-1 Differentiaalvariëteiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1-2 Vectoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1-3 Eénvormen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1-4 Tensoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1-5 Differentiaalvormen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1-6 Uitwendige Afleiding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1-7 Integratie van vormen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1-8 Lie-afleiding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1-9 Covariante afleiding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1-9.1 Algemeenheden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1-9.2 Parallel transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1-9.3 Normale coördinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1-9.4 Symmetrische connecties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1-10 Kromming . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1-11 Metrieken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1-11.1 Algemeenheden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1-11.2 Eigenschappen van de riemann-tensor . . . . . . . . . . . . . . . . . . . . . 34
1-11.3 Hyperoppervlakken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1-11.4 Dualiteit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1-12 Isometrieën . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1-13 Uitgewerkte voorbeelden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

2 Beperkte Relativiteitstheorie 51
2-1 Inleiding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2-2 Lorentz-transformaties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2-3 Minkowski-diagrammen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2-4 Minkowski-metriek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2-5 Relativistische Mechanica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2-5.1 Inleiding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2-5.2 Energie-impulstensor van een deeltjeswolk . . . . . . . . . . . . . . . . . . . 66
2-5.3 Energie-impulstensor van een perfecte vloeistof . . . . . . . . . . . . . . . . 68
2-5.4 Behoudswetten en energievoorwaarden . . . . . . . . . . . . . . . . . . . . . 71
2-6 Electrodynamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2-6.1 Algemeenheden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

iii
iv INHOUDSOPGAVE

2-6.2 Electromagnetische golven . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76


2-6.3 Energie-impulstensor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3 Beginselen van de Algemene Relativiteitstheorie 81


3-1 Beginsel van Mach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3-2 Zwak Equivalentiebeginsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3-3 Covariantiebeginsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3-4 Einstein’s Equivalentiebeginsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3-5 Sterk Equivalentiebeginsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3-6 Minimale koppeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3-6.1 Testdeeltjes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3-6.2 Perfecte vloeistoffen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3-6.3 Electromagnetisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3-6.4 Behoudswetten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3-7 Correspondentiebeginsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

4 Veldvergelijkingen 97
4-1 Vacuümvergelijkingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4-2 Veldvergelijkingen in de aanwezigheid van materie . . . . . . . . . . . . . . . . . . 100
4-3 Structuur van de veldvergelijkingen . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

5 Zwakke velden en gravitationele straling 105


5-1 De lineaire benadering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5-2 Vlakke gravitatiegolven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

6 Ist das wirklich so? 111


6-1 Zwak Equivalentiebeginsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6-2 Einstein’s Equivalentiebeginsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6-3 Metrische Theorieën en het Zonnestelsel . . . . . . . . . . . . . . . . . . . . . . . . 117
6-3.1 Algemeenheden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6-3.2 Gebonden beweging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6-3.3 Ongebonden beweging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
6-3.4 Gravity Probe B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

7 Bijzondere Oplossingen 125


7-1 Inleiding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
7-2 Sferische symmetrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
7-3 Schwarzschild-oplossing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7-4 Eddington-finkelstein-metriek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7-5 Statische en sferisch symmetrische perfecte vloeistoffen . . . . . . . . . . . . . . . . 135
7-6 Kruskal’s vorm van de schwarzschild-oplossing . . . . . . . . . . . . . . . . . . . . . 140
7-7 Conforme compactificatie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

8 Inleiding tot de kosmologie 149


8-1 Standaard model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
8-2 Symmetrie en geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
8-3 Energie-impuls tensor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
8-4 Veldvergelijkingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
INHOUDSOPGAVE v

8-5 Oplossingen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164


8-5.1 Einstein’s statisch model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
8-5.2 Niet-statische modellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
8-5.3 Modellen met Λ = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
8-5.4 Modellen met Λ 6= 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
vi INHOUDSOPGAVE
Inleiding

Opbouw van deze cursus

Alhoewel de algemene relativiteitstheorie (A.R.) bijna een eeuw oud is, blijven er in dit onder-
zoeksdomein nog vele fundamentele vragen onopgelost en worden er nog regelmatig opwindende
ontdekkingen gemaakt. De doelstelling van deze cursus is dan ook tweezijdig: het is in de eerste
plaats de bedoeling een gedetailleerd overzicht te geven van de fundamentele concepten en hy-
pothesen die aan de basis liggen van de theorie (in het bijzonder de mathematische grondslagen
ervan) en ook wens ik even halt te houden bij de belangrijkste ontdekkingen en experimenten van
de voorbije vijftig jaar. Het is inderdaad zo dat A.R. vanaf ongeveer 1960 een ‘renaissance’ gekend
heeft, die enerzijds te danken is aan een reeks van fascinerende theoretische ontwikkelingen (zwarte
gaten, wormgaten, gravitatiegolven, kosmische snaren, inflationair heelal, ...), en anderzijds aan
een ganse reeks vernieuwende experimenten. Misschien wel vóór alles zijn het deze experimenten
die nieuw leven geblazen hebben in een theorie die, na haar eerste grote successen, tussen 1920 en
1960 langzaam in een toestand van menopauze gesukkeld was. Vandaag echter is experimentele
gravitatie opnieuw een essentieel en levendig onderdeel van A.R. en is de theorie zelf een actieve
ingrediënt van de astrofysica, de kosmologie en de theoretische fysica.

In een inleidende cursus is het onmogelijk om op alle details in te gaan en regelmatig zullen
resultaten dus zonder enige vorm van bewijs gegeven worden. Er wordt geen poging ondernomen
om volledigheid te bereiken, wel om voldoende details te verschaffen die toelaten een algemeen
inzicht in de materie te verkrijgen. Door de geweldige vlucht die de algemene relativiteitstheorie
de laatste jaren genomen heeft, is het ook niet mogelijk de meest recente ontwikkelingen in het
gebied zelfs maar aan te raken. Ik hoop echter om hiermee de geı̈nteresseerde student een voldoend
sterke basis te kunnen verschaffen, zodat hij/zij aan de hand van de vakliteratuur zijn weg in dit
domein verder kan vinden.
Hoofdstuk I bevat een overzicht van enkele essentiële elementen uit de differentiaalmeetkunde.
Het is belangrijk dat men zich deze materie zo spoedig mogelijk eigen maakt, aangezien dit de
taal levert waarin het resterende deel wordt aangeboden. De nadruk wordt gelegd op het gebruik
van coördinaatvrije methoden in de differentiaalmeetkunde en als dusdanig vergt deze cursus enige
voorkennis op het vlak van de differentiaalmeetkunde (van oppervlakken in R3 ) en van de klassieke
tensorrekening. Een goede inleiding tot de differentiaalmeetkunde is het boek Introduction to Dif-
ferential Geometry van B. O’ Neill (verschillende exemplaren zijn voorradig in de UA bibliotheek).

vii
viii INHOUDSOPGAVE

Naslagwerken
Het boek dat zonder enige twijfel nog steeds de bijbel van de relativiteitstheorie mag genoemd
worden is The large scale structure of space-time van Stephen Hawking en George Ellis (Cambridge
1973). Hieruit zijn grote stukken zonder meer -en zonder al te veel schaamte- overgenomen. Het
grootste deel van dit werk is echter totaal ongeschikt voor gebruik bij een inleidende cursus.
Bijzonder goed zijn ook General Relativity van Robert Wald (U. of Chicago Press 1984) en
Advanced general relativity van John Stewart (Cambridge 1991). De cursus loopt min of meer
parallel met het eerste gedeelte van beide werken. Het tweede gedeelte bevat gevorderd materiaal,
dat eveneens niet erg geschikt is bij een eerste kennismaking.
Een goed boek is ook Introducing Einstein’s Relativity van Ray d’Inverno (Clarendon 1992).
d’Inverno neemt bewust afstand van de moderne geometrische aanpak en verkiest opnieuw de
weg van de klassieke tensorrekening. Het boek bevat m.i. enkele onnauwkeurigheden, maar is
vlot leesbaar en is voorzien van talrijke illustraties. Als ’klassieke’ aanvulling op de modernere,
geometrische aanpak, is het zeker aan te bevelen! Hetzelfde geldt voor A First Course in General
Relativity (Cambridge 1985) van Bernard F. Schutz en Relativity van Hans Stephani (Cambridge
2004). Een bondige (eveneens heel klassieke en met soms nogal eigenzinnige conventies) inleiding
tot de relativiteitstheorie wordt gegeven door James Foster en David Nightingale (A short course
in general relativity, Springer 1994).
Sterk fysisch geöriënteerde werken zijn Gravity van James Hartle (Addison Wesley 2003) en
Gravitation and cosmology van Steven Weinberg (Wiley 1972). Dit laatste bevat een schitterende
historische inleiding en is een absolute klassieker voor wat betreft het onderdeel kosmologie (en
volgt de traditionele tensorcalculus).
Wie een snelle en bondige introductie verlangt tot de meer mathematische aspecten van huidig
onderzoek in A.R, kan zich wenden tot de eerste hoofdstukken uit Exact solutions of Einstein’s field
equations van Dietrich Kramer, Hans Stephani, Malcolm MacCallum en Eduard Herlt (Cambridge
2003). Het grootste deel van dit boek is echter een encyclopedie van zg. ‘algebraı̈sch speciale’
oplossingen.
Tenslotte bestaat er een schat aan informatie over vrijwel elk onderwerp dat met A.R. verband
houdt, namelijk Gravitation van Misner, Thorne en Wheeler (Freeman 1973).

Enkele aanraders uit de oudere literatuur (helaas niet zo makkelijk meer te vinden):

A. Einstein The Meaning of Relativity (Methuen 1922)


V. Fock The Theory of Space-time and Gravitation (Pergamon 1964)
L. Landau en E. Lifschitz The Classical Theory of Fields (Addison-Wesley 1962)
C. Möller The Theory of Relativity (Oxford U.P. 1952)
H. Robertson en T. Noonan Relativity and Cosmology (Saunders 1968)
E. Schrödinger Space-Time Structure (Cambridge U.P.)
J.A. Schouten Ricci Calculus (Springer 1954)
J. Synge Relativity: the General Theory (North-Holland 1960)
Hoofdstuk 1

Differentiaalmeetkundige
Begrippen

Volgende nota’s vormen geen substituut voor een cursus differentiaalmeetkunde: ze dienen slechts
(1) als herhaling van reeds geziene begrippen (2) als bondige introductie tot eventueel nieuwe
begrippen (3) als houvast voor de in deze cursus gebruikte notaties en andere conventies.

1-1 Differentiaalvariëteiten

Figuur 1.1: Bernhard Riemann

1
2 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

Een n-dimensionale differentiaalvariëteit (of manifold ) is grofweg een topologische ruimte M


die lokaal op de standaard euclidische ruimte Rn lijkt. Om dit wat preciezer te maken voert men
eerst het begrip in van een kaart.
Een kaart (U, Φ) op een een topologische ruimte M bestaat uit een deelverzameling van M en
een homeomorfisme Φ van een open deel U naar een open deel van Rn .
Φ associeert met elk punt p ∈ U een n-tupel van reële getallen (x1 , ..., xn ), de lokale coördinaten
van p genoemd t.o.v. (U, Φ). Alhoewel de coördinaten van p in werkelijkheid dus de getallen
xi ◦ Φ(p) zijn, zullen we deze meestel kort noteren als xi (p).

m
Ua Ub
p

Fb

Fa

Fa (P) Fb (P)

-1
Fb Fa
t t t t
i i’
x x

Figuur 1.2:

Twee kaarten (U, Φ) en (V, Ψ) met U ∩ V 6= heten C k -compatibel als de bijectie Ψ ◦ Φ−1 :
Φ(U ∩ V ) → Ψ(U ∩ V ) een C k -afbeelding is tussen open delen van Rn (is dit het geval voor alle
k ≥ 0 dan zegt men dat ze C ∞ -compatibel zijn). Om deze nota’s min of meer leesbaar te houden
zullen we voortaan veronderstellen dat alle gebruikte functies glad zijn, in de zin dat ze voldoende
differentieerbaar zijn (desnoods C ∞ of zelfs analytisch) om de nodige constructies toe te laten. We
zullen de differentieerbaarheidsklasse dan ook niet langer expliciet vermelden.
Een atlas op M is een verzameling van compatibele kaarten (Uα , Φα ) zodat M = ∪α Uα . We
noemen M dan een n-dimensionale variëteit. Dit betekent dat in het gebied Uα ∩ Uβ van twee
lokale coördinaatomgevingen Uα en Uβ de lokale coördinaten in de ene omgeving gladde functies
′ ′ ′
zijn van de lokale coördinaten in de andere omgeving: xi = xi (xj ), met dus det( ∂x
∂x ) 6= 0. Merk op
dat we de indices van de ‘nieuwe’ coördinaten voorzien van een accent, eerder dan de coördinaten
zelf: dit mag op het eerste zicht wat vreemd lijken, maar brengt achteraf enig soelaas.
Gewoonlijk worden nog extra topologische beperkingen opgelegd, die weliswaar een rol spelen
bij het afleiden van sommige der hierop volgende resultaten, maar die bij een eerste kennismaking
weinig relevant zijn.
Een afbeelding f : M → N van een variëteit M naar een variëteit N is glad in een punt p
als er een lokaal coördinatenstelsel bestaat waarvoor de lokale coördinaten van f (p) in N gladde
functies zijn van de lokale coördinaten van p in M. (en in dat geval geldt dit voor alle lokale
coördinatenstelsels). Een afbeelding die glad is in elk punt noemen we een gladde afbeelding.
Bestaat de inverse afbeelding f −1 en is deze eveneens glad, dan zeggen we dat f een diffeomor-
fisme is. Bestaat er tussen M en N een diffeomorfisme, dan zijn M en N diffeomorf, wat wil
1-1. DIFFERENTIAALVARIËTEITEN 3

zeggen dat ze glad in elkaar te vervormen zijn. De verzameling der gladde afbeeldingen M → R
noteren we als F(M). Dit is een commutatieve algebra over R, wat betekent (a) dat F(M)
een reële vectorruimte is onder de puntsgewijs gedefinieerde optelling en vermenigvuldiging met
scalairen (namelijk (f + g)(p) = f (p) + g(p) en (αf )(p) = αf (p)) en (b) dat de puntsgewijs
gedefinieerde vermenigvuldiging van gladde functies ((f g)(p) = f (p)g(p)) voldoet aan de eigen-
schappen f (gh) = (f g)h, (f + g)h = f h + gh, f g = gf en 1f = f (waarbij 1 beschouwd wordt als
de constante functie die elk element p afbeeldt op 1 ∈ R).

NB: men kan zich de vraag stellen in welke mate, voor een gegeven topologie, de resulterende
differentiaalstructuur afhangt van de gekozen atlas. Voor R3 is het antwoord eenvoudig: alle
differentaalstructuren zijn dan onderling diffeomorf. Voor R4 bestaan er echter oneindig veel
onderling niet-diffeomorfe differentiaalstructuren!
Een kromme γ in M is een gladde afbeelding van een open interval ]a, b[⊂ R naar M .
4 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

1-2 Vectoren
Vectoren kunnen in een differentiaalvariëteit M niet meer bekeken worden als ‘pijlen met een
aangrijpingspunt en een eindpunt’. Daarom definiëren we eerst het begrip rakende krommen :
als γ1 en γ2 krommen zijn in M met γ1 (t0 ) = γ2 (t0 ) = p ∈ U ⊂ M en (U, Φ) een kaart,
dan noemen we γ1 en γ2 rakend in p als D(Φ ◦ γ1 )(t0 ) = D(Φ ◦ γ2 )(t0 )

oefening 1: toon aan dat deze definitie onafhankelijk is van de gebruikte kaart

‘Rakend zijn in een punt’ is duidelijk een equivalentierelatie; een equivalentieklasse [γ]p noemen
we een (rakende) vector in p. We definiëren ook Tp (M) = {[γ]p ; γ is een kromme door p} als de
rakende ruimte van M in p.

m
g1

F F (U)

R p

to
F (P)

g2
Rn

Figuur 1.3:

Een vector in een punt p definieert dan ook een lineaire operator van F(M) naar R: als γ(t0 ) = p
d
dan stellen we [γ]p (f ) = dt (f ◦ γ)(t)|t0 .

oefening 2: toon aan dat deze definitie onafhankelijk is van de gekozen representant γ.
Zijn nu xi lokale coördinaten in een omgeving van p en noteren we met γ i de i-de coördinaat-
kromme, i.e. de kromme t → φ−1 (φ(p) + t.e) (met e de i-de basisvector van Rn ), waarvoor dus de
lokale vergelijkingen gegeven zijn door xj (t) = xj (p) + t.δ ij , dan geldt
d
[γ i ]p (f ) = (f ◦ φ−1 (φ(p) + t.e))
dt
=D(f ◦ φ−1 )(φ(p)).[0 . . . 1 . . . 0]T

= i (f ◦ φ−1 )(φ(p))
∂x
∂f
wat we gewoonlijk noteren als ∂xi |p . Dit rechtvaardigt volgende notatie

[γ i ]p = |p (1-2.1)
∂xi
1-2. VECTOREN 5

en men toont aan dat deze vectoren in p een basis vormen voor de rakende ruimte Tp (M). We
noemen deze basis een coördinaatbasis of een holonome basis.
Elke vector vp ∈ Tp (M) kan dus geschreven worden als

vp = v i |p met v i ∈ R (1-2.2)
∂xi
∂f
en de werking van vp op f ∈ F(M) wordt bepaald door vp (f ) = v i ∂x i |p (we gebruiken vanaf nu

de einstein-sommatieconventie: over elke dubbel optredende index wordt gesommeerd van 1 tot n
).

T.o.v. een willekeurige ‘anholonome basis’ {ea }van n onafhankelijke vectoren in p, ea = eia ∂x i |p
a
schrijven we vp = v ea . We zullen proberen om op zo consistent mogelijke wijze de eerste acht
letters van het alfabet te gebruiken voor anholonome indices en i, j, k, . . . voor holonome indices.

Uiteraard lukt dit niet altijd: als bv. v = v i ∂x a
i = v ea , dan is het niet duidelijk wat we met v
1

bedoelen: als de context dit vereist zullen we de anholonome indices daarom voorzien van een ˆ :
∂f
dus v a ea = v 1̂ e1̂ + . . . + v n̂ en̂ . Verder zullen we ook dikwijls de notaties ∂x i = f,i , ea (f ) = f|a en

∂i = ∂xi gebruiken.
In de oudere literatuur werd vooral gewerkt met coördinaatbases; het gebruik van anholonome
bases blijkt echter veel efficiënter te zijn en is nu algemeen verspreid.

Bij een verandering van lokale coördinaten xi → xi (i.e. bij een verandering van kaart in een
i ∂ i′ ∂
omgeving van p), geldt vp = v ∂xi |p = v ∂xi′ |p zodat uit de kettingregel onmiddellijk volgt

∂xi ′
vi =
|p v j (1-2.3)
∂xj
Voor een willekeurige basistransformatie geldt analoog dat als
ea′ = La′ b eb , (1-2.4)
of, in matrixnotatie,    
e1′ e1
 ..   .. 
 .  = L . , (1-2.5)
en′ en
dan ′ ′
v a = La b v b , (1-2.6)
1
of, in matrixnotatie , ′ ′
[v 1 . . . v n ] = [v 1 . . . v n ]L−1 (1-2.7)
a′ a′ c a′ a′
waarbij L b gedefinieerd is door L b La′ = δbc ,
t.t.z. (L )b = L b . −1

We kunnen tenslotte een vectorveld definiëren door met elk punt p ∈ M een vector vp ∈ Tp (M)

te associëren. Dan geldt in lokale coördinaten dat v = v i ∂x i i
i met v functies van x . De verzameling

der vectorvelden op M noteren we voortaan X (M). De werking van een vectorveld v op f ∈ F(M)
wordt puntsgewijs gedefinieerd en geeft dus als resultaat v(f ) ∈ F(M). Een vectorveld v is dus
een afbeelding F(M) → F(M) die voldoet aan de volgende eigenschappen:
v(f + g) =v(f ) + v(g)
v(f g) =gv(f ) + f v(g)
v(λf ) =λv(f ) (λ constant) (1-2.8)

1 Let op: de onderste index in zowel La′ b als La is dus altijd de rij-index!
b
6 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

Onder de puntsgewijs gedefinieerde optelling en vermenigvuldiging met gladde functies2 , wordt


χ(M) dan een F(M)-moduul:

f (u + v) = f u + f v
(f + g)u = f u + gu
(f g)u = f (gu)
1u = u (1-2.9)

Onthou echter bovenal dat er geen zinvolle definitie bestaat van “de som van een rakende vector
in p en een rakende vector in q”, wat zich later zal vertalen in het feit dat het zinloos is om te
spreken over “de snelheid van een deeltje in een punt p t.o.v. een waarnemer in het punt q”.

N.a.v. de analogie tussen vectoren en richtingsafgeleiden, ligt het voor de hand dat de achtereen-
volgende werking van twee vectoren op een functie afhankelijk is van de volgorde waarin ze worden
toegepast. De commutator of lie-haak van twee vectorvelden u en v wordt gedefinieerd door

[u, v](f ) = u(v(f )) − v(u(f )) (1-2.10)

Dat dit opnieuw een vectorveld is, kan men gemakkelijk nagaan ((oefening!): de lineariteit stelt
geen problemen, enkel de leibniz-eigenschap dient geverifieerd te worden.
Voor een coördinaatbasis geldt uiteraard
∂ ∂
[ , ] = 0, (1-2.11)
∂xi ∂xj
maar voor een willekeurige basis moeten we rekening houden met de commutatiecoëfficiënten
Dc ab = −Dc ba ∈ F(M) bepaald door

[ea , eb ] = Dc ab ec . (1-2.12)

Uit de jacobi-identiteit
[u, [v, w]] + [v, [w, u]] + [w, [u, v]] = 0 (1-2.13)
volgt
e[a Dd bc] − Dd e[a De bc] = 0. (1-2.14)
Hierbij maken we gebruik van de conventie dat m indices, ingesloten door vertikale haken, duiden
1 1
op m! × de alternerende som van alle permutaties; analoog duiden ronde haken op m! × de som
van alle permutaties. B.v.
1
x[ab] = (xab − xba )
2
1
x(ab) = (xab + xba ) (1-2.15)
2
1
x[abc] = (xabc + xbca + xcab − xacb − xcba − xbac )
6
oefening:
∂ i ∂
3. Zij u = ui ∂x i
i en v = v ∂xi . Bepaal de componenten van [u, v] t.o.v. de lokale coördinaten x .

2 (u + v)(f ) = u(f ) + v(f ) en (gu)(f ) = g(u(f ))


1-2. VECTOREN 7

4. Bepaal, zo eenvoudig mogelijk,


x∂x + y∂y x∂y − y∂x
[p ,p ].
x2 + y 2 x2 + y 2

5. Beschouw in R2 de vectorvelden X = ∂x , Y = ∂y en Z = −(x2 y + y 3 )∂x + (x3 + xy 2 )∂y . Ga over


∂ ∂
op poolcoördinaten en schrijf X, Y en Z als combinaties van ∂r en ∂θ . Bepaal alle commutatoren
van X, Y en Z.
∂ ∂ ∂ ∂
6. Beschouw in R3 de basis e1 = ex ∂y , e2 = ex ∂z + xex ∂y , e3 = ∂x . Bepaal de commutatiecoëffi-
ciënten.
7. Ga expliciet na dat, met X, Y ∈ X (M), de componenten [X, Y ]i transformeren zoals de com-
ponenten van een vector in X (M).
8 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

1-3 Eénvormen
1-vormen in een punt p ∈ M zijn lineaire operatoren die vectoren in p omzetten in reële getallen:
een 1-vorm σ in p is dus een element van de duale ruimte Tp∗ (M).
Het beeld σ(v) ∈ R noteren we ook als < σ, v > en noemen we de ook contractie van σ en v.
Voor een gegeven basis {ea } zijn de n lineair onafhankelijke 1-vormen ω a bepaald door < ω a , eb >
= δba een basis voor Tp∗ (M). We noemen deze basis de duale basis van {ea }. Elke 1-vorm σ ∈
Tp∗ (M) kan dan geschreven worden als
σ = σa ω a (1-3.1)
en met v = v a ea geldt dus
< σ, v >= σa v a (1-3.2)
Voor f ∈ F(M) definiëren we de uitwendige afgeleide van f als de 1-vorm df , bepaald door
< df, vp >= vp (f ) = v a f|a (1-3.3)
voor alle v ∈ Tp (M). Voor het bijzonder geval van de coördinaatfuncties xi geldt dan

< dxi , >= δji (1-3.4)
∂xj

i.e {dxi } is de duale basis van ∂xj . T.o.v. een lokale coördinaatbasis kan elke 1-vorm dus geschreven
worden als
σ = σi dxi (1-3.5)
en geldt i.h.b
df = f,i dxi = f|a ω a (1-3.6)
Merk op dat voor alle f, g, h ∈ F(M) en α ∈ R
d(f + g) = df + dg
d(αf ) = αdf
(g + h)df = g df + h df
d(f g) = f dg + g df (1-3.7)
waarbij vooral de laatste leibniz -eigenschap van cruciaal belang is.
Net zoals voor vectorvelden definiëren we tenslotte een 1-vorm-veld σ door met elk punt p ∈ M
een 1-vorm σp ∈ Tp∗ (M) te associëren en de werking van σ op een vectorveld puntsgewijs te
definiëren: (σ(v))p = σp (vp ). Alzo worden de 1-vorm velden F(M)-lineaire afbeeldingen van
χ(M) naar F(M):
σ(v1 + v2 ) = σ(v1 ) + σ(v1 ) en σ(f v) = f σ(v). (1-3.8)
De verzameling van 1-vorm-velden op M noteren we als Ω1 (M). Met puntsgewijs gedefinieerde
optelling en vermenigvuldiging met gladde functies, geldt dat ook Ω1 (M) een F(M)-moduul is:
(σ1 + σ2 )v = σ1 v + σ2 v en (f σ)v = f (σv). (1-3.9)
In de oudere (fysica) literatuur komen we 1-vormen tegen onder de benaming covariante vec-
toren. Deze benaming werd ingevoerd om, bij overgang naar nieuwe lokale coördinaten, de transfor-
matieformules voor de componenten te onderscheiden van deze voor vectoren (ook contravariante

vectoren genoemd). Inderdaad, met 1-3.5 geldt σ = σi dxi = σi′ dxi , zodat onmiddellijk volgt
∂xj
σi′ = σj (1-3.10)
∂xi′
1-3. EÉNVORMEN 9

(vergelijk met 1-2.3).


Bij een willekeurige basistransformatie met

ea′ = La′ b eb

geldt voor de duale basis ′ ′


ω a = La b ω b
zodat met σ = σa ω a volgt
σa′ = La′ b σb (1-3.11)

oefening1: bepaal de duale basis van {e1 , e2 , e3 } optredend in oefening 6 van de vorige paragraaf.
10 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

1-4 Tensoren
Een tensor S van type (r, s) in een punt a ∈ M is een element van de ruimte Tsr (a) = Ta ⊗ · · · ⊗
Ta ⊗ Ta∗ ⊗ · · · ⊗ Ta∗ (r factoren Ta , die we identificeren met Ta∗∗ , en s factoren Ta∗ ). In het bijzonder
definiëren we T01 (a) = Ta en T10 (a) = Ta∗ . Een tensor S van type (r, s) in een punt is dus een
multilineaire operator die (r + s)-tupels (σ 1 , . . . σ r , v1 , . . . vs ) van r 1-vormen σ a en s vectoren
va omzet in een reëel getal. Zo is b.v.

u1 ⊗ · · · ⊗ ur ⊗ τ 1 ⊗ · · · ⊗ τ s ((σ 1 , . . . σ r , v1 , . . . vs )) =

< u1 , σ 1 > . · · · < ur , σ r > . < v1 , τ 1 > . · · · < vs , τ s > (1-4.1)


Elke tensor S ∈ Tsr (a) kan geschreven worden als een lineaire combinatie van elementaire tensor-
producten:
S = Sba11 ...
... ar
bs ea1 ⊗ · · · ⊗ ear ⊗ ω
b1
⊗ . . . ⊗ ω bs (1-4.2)
De coëfficiënten Sba11 ...
... ar
bs (met, in de standaard terminologie, r contravariante en s covariante
indices) noemen we de componenten van S t.o.v. de bases {ea }, {ω a }. Er geldt dus

Sba11 ...
... ar a1 ar
bs = S(ω , . . . , ω , eb1 , . . . ebs ) (1-4.3)

De som, het scalaire product en het product van tensoren worden gedefinieerd alsvolgt, met S,

T ∈ Tsr (a), T′ ∈ Tsr′ (a), α ∈ R en met (σ, v) een korte schrijfwijze voor (σ 1 , . . . σ r , v1 , . . . vs ),

(T + S)(σ, v) =T(σ, v) + S(σ, v)


(α . T)(σ, v) =α . T(σ, v) (1-4.4)
(T ⊗ T )(σ, σ ′ , v, v′ ) =T(σ, v) . T′ (σ ′ , v′ ),


r+r
zodat T ⊗ T′ ∈ Ts+s ′ (a). Dit leidt tot de betrekkingen

(S + T )ab11 ... ar
... bs =Sba11 ...
... ar a1 ... ar
bs + Tb1 ... bs
(αS)ab11 ...
... ar
bs =αSba11 ...
... ar
bs (1-4.5)
a1 ... ar+r′ a ′ ... a ′
(T ⊗ T ′ )b1 ... bs+s ′
=Tba11 ...... basr . T ′ b11′ ... bsr′
′ ′
Voeren we een basistransformatie uit ea′ = La′ b eb , ω a = La b ω b , dan veranderen de componenten
van S alsvolgt:
a′ ... a′ ′ ′
Sb′1 ... b′r = La1 a1 . . . Lar ar . Lb′1 b1 . . . Lb′s bs . Sba11 ...
... ar
bs (1-4.6)
1 s


(in het bijzonder geval van een verandering van lokale coördinaten, substitueren we hierin La a
a′ a
a
door ∂x
∂xa en La

∂x
door ∂xa′ ).

De contractie C1 (T) van T, t.ov. een basis {ea } met duale basis {ω a }, over de eerste con-
1

travariante en covariante indices, definiëren we door


aa2 ...ar
C11 (T) = Tab2 ...bs
ea2 ⊗ · · · ⊗ ear ⊗ ω b2 ⊗ · · · ⊗ ω bs (1-4.7)

opmerking: ook deze definitie is onafhankelijk van de gekozen basis, wat toelaat om 1-4.7 voortaan
de contractie van T over de eerste contravariante en covariante indices te noemen. Vanzelfsprekend
kan op dezelfde manier Cqp (T) gedefinieerd worden.
1-4. TENSOREN 11

Een tensor wordt symmetrisch (respectievelijk antisymmetrisch) genoemd in de contravariante


indices p . . . p + q naargelang
a1 ...ap ...ap+q ...ar a1 ...a(p ...ap+q) ...ar
T... = T...
of
a1 ...ap ...ap+q ...ar a1 ...a[p ...ap+q] ...ar
T... = T... (1-4.8)
Voor een stel covariante indices verloopt de definitie analoog.
Tensorvelden van type (r, s) definiëren we door met elk punt a ∈ M een element van Tsr (a)
te associëren. De verzameling van deze tensorvelden noteren we als Tsr (M). Met puntsgewijs
gedefinieerde optelling en vermenigvuldiging met scalaire velden wordt ook Tsr (M) een F(M)-
moduul.
M.b.v. een gladde één - één afbeelding F van een variëteit M naar een variëteit N is het
vervolgens mogelijk tensoren van de ene variëteit naar de andere ‘over te hevelen’. Definiëren we
eerst de pull-back F ∗ (f ) van een f ∈ F(N ):
F ∗ f = f ◦ F ∈ F(M) (1-4.9)
Voor een gegeven v ∈ T01 (M) laat dit vervolgens toe de push-forward F∗ v ∈ T01 (N ) te bepalen:
∀f ∈ F(N ) en ∀a ∈ M (F∗ v)F (a) (f ) = va (F ∗ f ) (1-4.10)
wat we kort ook schrijven als (F∗ v) f = v(F ∗ f ). Tenslotte definiëren we hiermee de pull-back
F ∗ σ van σ ∈ T10 (N ):
∀v ∈ T01 (M) en ∀a ∈ M (F ∗ σ)a (va ) = σF (a) (F∗ v)F (a) (1-4.11)
wat kort geschreven wordt als (F ∗ σ)v = σ(F∗ v). De veralgemening tot T0p (M) en Tp0 (M) ligt voor
de hand. Noteer dat zowel F∗ als F ∗ lineaire afbeeldingen zijn. Als bovendien F een diffeomorfisme
is (d.w.z. de inverse bestaat en is voldoende differentieerbaar) dan zijn met F en F −1 tensorvelden
van elk type (r, s) over te hevelen van M naar N en omgekeerd. Zo wordt b.v. de push-forward
van een 1-vorm ω gegeven door F∗ (ω) = (F −1 )∗ ω.
Opmerking: bij sommige auteurs (voornamelijk wiskundigen) bestaat de gewoonte om de begrippen
contravariant en covariant te hechten aan resp. de eenvormen en de vectoren, en dit omwille van
hun gedrag onder push-forward en pull-back.
De volgende eigenschappen zijn niet moeilijk om aan te tonen:
• Als f ∈ F(N ) dan is
F ∗ (df ) = d(F ∗ f ) (1-4.12)

• Als F in lokale coördinaten xj op M en y i op N gegeven is door y i = y i (x) en σ = σi dy i ∈


T10 (N ), dan wordt F ∗ σ bekomen door ‘substitutie’:
∂y i (x) j
F ∗ σ = σi (y(x)) dx (1-4.13)
∂xj
Opmerking: bekijken we een diffeomorfisme Φ : M → M : p 7→ p′ = Φ(p) dan kunnen we
hiermee een coördinaattransformatie, of zgn. passief diffeomorfisme, associëren door x′ (p′ ) = x(p)
te stellen. Omgekeerd bepalen twee coördinaatkaarten x en x′ in hun overlappingsgebied een actief
diffeomorfisme dat het punt p met x-coördinaat xp afbeeldt op het punt p′ met x′ -coördinaat
x′ p′ = xp .
12 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

1-5 Differentiaalvormen
Willen we het vectorieel product van vectoren in R3 veralgemenen naar n dimensies, dan blijkt
dat dit eigenlijk eenvoudiger gaat voor de 1-vormen dan voor de (contravariante) vectoren. Het
resultaat zijn tensoren van type (0, p) die, voor p ≥ 2, antisymmetrisch zijn in al hun covariante
indices. In een gegeven punt a vormen deze tensoren de vectorruimte Ωpa (M) van p-vormen. Men
noemt dit differentiaalvormen of p-vormen. De verzameling van de p-vormvelden noteren we als
Ωp (M). Uiteraard is dit ook weer een F(M)-moduul. We identificeren hierbij F(M) met Ω0 (M)
en X ∗ (M) met Ω1 (M). Voor wat volgt zijn vooral de 2-vormen van belang. Een voorbeeld van
een 2-vorm is
ω1 ⊗ ω2 − ω2 ⊗ ω1 , (1-5.1)
wat we noteren als ω 1 ∧ ω 2 . We noemen dit het uitwendig product, wedge product of grassmann-
product van ω 1 en ω 2 . D.m.v. bilineariteit kan deze definitie uitgebreid worden: zo is met θ1 =
2ω 1 − ω 3 en θ2 = ω 1 + ω 2 + 5ω 3 ,

θ1 ∧ θ2 = 2ω 1 ∧ ω 2 + 10ω 1 ∧ ω 3 − ω 3 ∧ ω 1 − ω 3 ∧ ω 2
= 2ω 1 ∧ ω 2 + 11ω 1 ∧ ω 3 + ω 2 ∧ ω 3

Meer algemeen vinden we voor twee 1-vormen θ1 = θ1 a ω a en θ2 = θ2 b ω b ,

θ1 ∧ θ2 = (θ1 a θ2 b − θ1 b θ2 a )ω a ⊗ ω b = 2!θ1 [a θ2 b] ω a ⊗ ω b

en dus
(θ1 ∧ θ2 )ab = 2!θ1 [a θ2 b] . (1-5.2)
Deze eigenschap kunnen we gebruiken om het uitwendig product van vormen van hogere orde
te definiëren:

voor θ1 ∈ Ωp (M) en θ2 ∈ Ωq (M) noemen we θ1 ∧ θ2 de (p + q)-vorm met componenten

(p + q)! 1
(θ1 ∧ θ2 )a...bc...d = θ [a...b θ2 c...d] (1-5.3)
p!q!

Voor f ∈ Ω0 (M) en θ ∈ Ωp (M) spreken we af dat f ∧ θ = θ ∧ f = f θ. Hieruit volgt dat ∧ bilineair


is en tevens voldoet aan
θ1 ∧ θ2 = (−1)pq θ2 ∧ θ1 (1-5.4)
en
θ1 ∧ (θ2 ∧ θ3 ) = (θ1 ∧ θ2 ) ∧ θ3 (1-5.5)
Het uitwendig product van b.v. meerdere 1-vormen is dus duidelijk lineair in elke variabele en
verdwijnt wanneer twee of meer variabelen gelijk zijn.
Let op: de definitie 1-5.3 verschilt van deze in Hawking & Ellis en Kramer et al. met de
factor (p+q)!
p!q! . Ze heeft echter het voordeel dat in latere formules een geringer aantal numerieke
coëfficiënten optreedt.
Een basis van Ωpa (M) wordt gegeven door de (np ) onafhankelijke p-vormen
X
ω a1 ∧ · · · ∧ ω ap = (−1)σ ω σ(a1 ) ⊗ · · · ⊗ ω σ(ap ) (1-5.6)
σ
1-5. DIFFERENTIAALVORMEN 13

waarbij de som genomen wordt over alle permutaties van a1 , . . . , ap (1 ≤ a1 < · · · < ap ≤ n).

De componenten θa1 ...ap van een p-vorm (die bij definitie voldoen aan θ = θa1 ...ap ω a1 ⊗· · ·⊗ω ap )
kunnen afgelezen worden door θ uit te schrijven in de basis 1-5.6:
1
θ= θa ...a ω a1 ∧ · · · ∧ ω ap (1-5.7)
p! 1 p
X
= θa1 ...ap ω a1 ∧ · · · ∧ ω ap (1-5.8)
a1 <a2 <···<ap

of worden bekomen uit


θa1 ...ap = θ(ea1 . . . eap ) (1-5.9)
I.h.b. geldt dat ∀k (1 ≤ k ≤ n)

ω 1 ∧ ω 2 ∧ · · · ∧ ω k (e1 , e2 , . . . ek ) = 1 (1-5.10)

Voor elke v ∈ X (M) kunnen we een afbeelding construeren iv : Ωp+1 (M) → Ωp (M) bepaald
door
iv θ(u1 , . . . up ) = θ(v, u1 , . . . up ) (1-5.11)
Er geldt dan
(iv θ)a1 ...ap = v a θaa1 ...ap (1-5.12)
(dit is dus de ‘contractie’ van een (p + 1)-vorm met een vector). Een bijzonder geval hiervan is de
betrekking
iea ω b = δab (1-5.13)
Voorbeeld: met v = 2e1 − e2 en θ = 3ω 1 + ω 2 + ω 3 is

iv θ = 2ie1 θ − ie2 θ = 6 − 1 = 5.

Passen we de definitie 1-5.11 toe op θ = θ1 ∧ θ2 met θ1 = θ1 a ω a , θ2 = θ2 b ω b , dan vinden we

iv θ(u) = θ(v a ea , ub eb ) = v a ub θ(ea , eb )


= v a ub θab = v a ub (θ1 a θ2 b − θ1 b θ2 a )
= (θ1 a v a )(θ2 b ub ) − (θ2 a v a )(θ1 b ub )
= (iv θ1 )θ2 − (iv θ2 )θ1 u


en dus
iv (θ1 ∧ θ2 ) = (iv θ1 )θ2 − θ1 (iv θ2 ). (1-5.14)
Ook deze ‘Leibniz-achtige’ eigenschap kan veralgemeend worden tot vormen van hogere orde:
voor alle α ∈ Ωp (M) en β ∈ Ωq (M) geldt:

iv (α ∧ β) = (iv α) ∧ β + (−1)p α ∧ (iv β) (1-5.15)

Omwille van de lineariteit van de afbeelding iv en voorgaande eigenschap, noemen we iv ook wel
de inwendige afgeleide. We spreken af dat voor f ∈ F(M) geldt iv f = 0.
14 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

1-6 Uitwendige Afleiding


In 1-3 definieerden we reeds de uitwendige afgeleide van een afbeelding f ∈ F(M), namelijk de
1-vorm df = f,i dxi . Aan een 1-vorm θ = θi dxi kunnen we vervolgens een 2-vorm associëren door
te stellen
dθ = d(θi ) ∧ dxi = θi,j dxj ∧ dxi .
Hiermee is voldaan aan de eigenschappen (ga na)

d(θ1 + θ2 ) = dθ1 + dθ2


d(f θ) = df ∧ θ + f dθ
d(df ) = 0,

waarbij in de derde eigenschap gebruik gemaakt werd van de symmetrie van de tweede afgeleide:
d(df ) = d(f,i dxi ) = f,i,j dxj ∧ dxi = 0. We kunnen nu van deze eigenschappen gebruik maken om
de uitwendige afgeleide te definiëren voor vormen van hogere orde, door te postuleren dat voor
α ∈ Ωp (M), β ∈ Ωq (M) en f ∈ F(M):

(i) d(α + β) = d(α) + d(β) (1-6.1)


(ii) d(α ∧ β) = (dα) ∧ β + (−1)p α ∧ d(β) (1-6.2)
(iii) df = f,i dxi (1-6.3)
(iv) d(df ) = 0 (1-6.4)

(men kan aantonen dat de operator d hierdoor uniek bepaald is).


1
Voor een willekeurige p-vorm α = p! αi1 ...ip dxi1 ∧ · · · ∧ dxip impliceert dit

1
dα = αi ...i ,j dxj ∧ dxi1 ∧ · · · ∧ dxip (1-6.5)
p! 1 p
zodat voor alle p-vormen α volgt dat
d(dα) = 0 (1-6.6)

De volgende stellingen (waarvan de omgekeerden triviaal zijn) worden vrij vaak gebruikt; ze
gelden enkel lokaal en we vermelden ze zonder enige vorm van bewijs:
(i) poincaré-stelling:
als α ∈ Ωp (M) (p ≥ 1) en dα = 0 dan bestaat een β ∈ Ωp−1 (M) zó dat α = dβ
(ii) fröbenius-stelling: als σ een 1-vorm is, dan geldt

σ ∧ dσ = 0 ⇒ ∃f, g ∈ M : σ = f dh. (1-6.7)


Toon als oefening aan dat de in R \ {0} gedefineerde 1-vorm ω = (xdy − ydx)/(x + y 2 )
2 2

weliswaar gesloten is (dω = 0), maar niet globaal exact (d.w.z. er bestaat geen globaal
gedefinieerde f (x, y) zó dat ω = df .
opmerking: het resultaat 1-4.12 is te veralgemenen tot willekeurige p-vormen: als F een afbeelding
is van M naar N dan geldt
∀α ∈ Ωp (N ) : d(F ∗ α) = F ∗ (dα) (1-6.8)
1-7. INTEGRATIE VAN VORMEN 15

1-7 Integratie van vormen


n
RBekijken we eerst het geval van R met n = 1: is θ = f (x)dx een 1-vorm op R, dan definiëren we
θ als de gewone riemann-integraal
Z Z
θ= f (x)dx. (1-7.1)
R

Noteer dat, bij overgang op een nieuwe integratieveranderlijke x′ de jacobiaan ∂x/∂x′ ‘automatisch’
zijn intrede doet, zodat deze definitie coördinaat-onafhankelijk is: als θ = f (x)dx = g(x′ )dx′ , dan
∂x
is g(x′ ) = f (x(x′ )) ∂x′ zodat
Z Z
f (x)dx = g(x′ )dx′ .
R R
R
Bekijken we nu het geval n = 2 met θ = f (x, y)dx ∧ dy en definiëren we opnieuw θ als de gewone
riemann-integraal, Z Z
θ= f (x, y)dxdy. (1-7.2)
R2

Opnieuw stellen we vast dat deze definitie coördinaat-onafhankelijk is, omdat in de transfor-
matieformules voor 2-vormen ‘automatisch’ met de jacobiaan wordt rekening gehouden:

∂x ′ ∂x ∂y ∂y
θ = f (x, y)dx ∧ dy = f (x(x′ , y ′ ), y(x′ , y ′ ))( dx + ′ dy ′ ) ∧ ( ′ dx′ + ′ dy ′ )
∂x′ ∂y ∂x ∂y
∂x ∂y ∂y ∂x
= f (x(x′ , y ′ ), y(x′ , y ′ ))( ′ ′ − )dx′ ∧ dy ′
∂x ∂y ∂x′ ∂y ′

∂x ∂x
′ ′ ′ ′ ∂x′ ∂y ′ ′ ′
= f (x(x , y ), y(x , y )) ∂y ∂y dx ∧ dy
∂x′ ∂y ′

= g(x′ , y ′ )dx′ ∧ dy ′

en dus f (x, y)dx ∧ dy = g(x′ , y ′ )dx′ ∧ dy ′ .


R R

Deze eigenschap blijft algemeen geldig en toont aan dat de natuurlijke objecten die in aanmerk-
ing komen voor integratie op een n-dimensionale variëteit precies de n-vormen zijn:
∂ ∂
Zij U open ⊂ Rn en ω ∈ Ωn (U ) met compacte R drager in U (t.t.z. ω1...n ≡ ω( ∂x1 , . . . ∂xn ) heeft
een compacte drager in U ). We definiëren dan ω als de riemann-integraal,
Z Z
ω = ω1...n dx1 . . . dxn , (1-7.3)

wat, t.g.v. de transformatieformules voor ω1...n , onafhankelijk is van de gekozen coördinaten:

∂xi1 ∂xin
ω1′ ...n′ = ′ ... ωi ...i
∂x 1 ∂xn′ 1 n
∂xi1 ∂xin
=ei1 ...in 1′ . . . n′ ω1...n
∂x ∂x
∂x
=det( ′ ) ω1...n (1-7.4)
∂x
16 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

Stel nu dat ω ∈ Ωn (M) een compacte drager heeft, gelegen in U , met (U, Φ) een kaart in M. We
kunnen dan Φ∗ ω ∈ Ωn (Rn ) vormen en m.b.v.
R de transformatieformules
R aantonen dat, voor elke
andere kaart (V, Ψ) met drager van ω ⊂ V , Φ∗ ω = Ψ∗ ω. Vandaar de definitie
Z Z
ω = Φ∗ ω (1-7.5)

In lokale coördinaten xi , met


R ω = u(x)dx
1
∧· · ·∧dxn , komt deze definitie gewoon neer op de bepaling
van de riemann-integraal u(x)dx . . . dxn . In de differentiaalmeetkunde wordt aangetoond dat
1

deze procedure te veralgemenen is voor n-vormen waarvan de drager niet noodzakelijk gelegen
is binnen het domein van één enkele kaart (hiervoor worden dan z.g. partities van de eenheid
gebruikt).
Belangrijk is dat de zo gedefinieerde integraal invariant is onder diffeomorfismen: als F : M →
N een (oriëntatie bewarend) diffeomorfisme is, dan geldt
Z Z
ω = F ∗ω (1-7.6)

Om de hierboven aangehaalde redenen noemt men een n-vorm Ω ∈ Ωn (M) op een n-dimensionale
variëteit M (zó dat Ω 6= 0) ook wel een volume-vorm op M.
In veel handboeken wordt integratie op een variëteit ingevoerd via scalar dichtheden of densi-
ties, t.t.z. objecten SR die bij een verandering van lokale coördinaten transformeren als S ′ (x′ ) =
∂x ′ 1′ n′ 1
. . . dxn . De hypothese dat zulke objecten bestaan,
R
det( ∂x ′ ) S(x), zodat S dx . . . dx = Sdx
komt dus duidelijk neer op het bestaan van een volume-vorm Ω, die toelaat om voor een gegeven
scalaire functie met compacte drager f ∈ F(M) de integraal van f m.b.t. Ω te definiëren als
Z Z
f = fΩ (1-7.7)

Later zullen we zien dat het bestaan van een metrische structuur op M toelaat om een cano-
nieke volume-vorm Ω te definiëren, zodat we op intrinsieke wijze zullen kunnen spreken van ‘de’
integraal van f als f ∈ F(M) een compacte drager heeft.

We eindigen deze paragraaf met de stelling van Stokes en definiëren hiertoe eerst het begrip
van een variëteit met een rand :
stel 21 Rn = {x ∈ Rn ; x1 ≤ 0} en vervang in de definitie van kaarten, atlassen enz. Rn door 21 Rn :
we bekomen dan een variëteit M met rand ∂M, die in lokale coördinaten gegeven is door x1 = 0.
Stel nu α ∈ Ωn−1 (M) met compacte drager en stel M oriënteerbaar. De stelling van Stokes zegt
dan Z Z
α= dα (1-7.8)
∂M M

R
waarbij het linkerlid eigenlijk staat voor ∂M i α met i de inclusie ∂M → M. Let op het verschil
met b.v. Hawking & Ellis, waar het rechterlid van 1-7.8 een extra factor n bevat: dit vindt zijn
verklaring in de verschillende definities van het uitwendig product.
We schetsen het bewijs. T.g.v. de definities van integratie van vormen en van 1-7.6 volstaat
het in lokale coördinaten te werken met α = u(x1 , x2 , . . . xn )dx2 ∧ . . . dxn ∈ Ωn−1 (U ), U ⊂ Rn , ∂U
∂u
gegeven door x1 = 0 en met de drager van u compact. We hebben dan dα = ∂x 1 dx
1
∧dx2 · · ·∧dxn ,
∂u
zodat α2...n = u en (dα)1...n = ∂x 1.
1-7. INTEGRATIE VAN VORMEN 17

Als ∂U = ∅ dan is
∂u 1
Z Z Z Z
α=0= ( dx )dx2 . . . dxn = dα
∂U Rn−1 R ∂x1 U

(vermits de drager van u compact is)


Anderzijds geldt als ∂U 6= ∅
Z Z
α= u(0, x2 , . . . xn )dx2 . . . dxn
∂U Rn−1
0
∂u 1
Z Z
= ( dx )dx2 . . . dxn
n−1 −∞ ∂x1
ZR
∂u 1
= dx . . . dxn
∂x1
ZU
= dα
U

Opmerking: vervangen we in bovenstaande eigenschap α door dα, dan stellen we vast (gebruik
makend van ddα = 0) dat voor alle α voldaan is aan
Z
α = 0,
∂∂M

wat verklaart waarom de eigenschap d2 = 0 soms bestempeld wordt als

the boundary of a boundary is zero ...


18 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

1-8 Lie-afleiding
Wat volgt is van belang bij de behandeling van symmetrieën op een variëteit. We beginnen met een
lokale congruentie van krommen te beschouwen, t.t.z. een familie van krommen, zó dat door elk
punt p ∈ U ⊂ M precies één kromme γp gaat. Dergelijke congruentie bepaalt dan een vectorveld
v ∈ X (U ), door vp = [γ]p .

Figuur 1.4:

Omgekeerd bepaalt elk vectorveld v ook een lokale congruentie van krommen γp , die we de
integraalkrommen van het vectorveld noemen:

Figuur 1.5:

Deze krommen γp worden in lokale coördinaten gegeven door xi = y i (t), met de functies y i
oplossingen van het stelsel differentiaalvergelijkingen

dy i
= v i (y 1 (t), . . . y n (t)) (1-8.1)
dt
onder de beginvoorwaarden y i (0) = xi (p).
Voor |t| voldoende klein en vast gekozen, kunnen we elk punt p ∈ U meeslepen langs γp over
een parameter-afstand t, door p af te beelden op γp (t). Men toont aan dat deze afbeelding Φt :
p → γp (t) een lokaal diffeomorfisme is voor voldoend kleine waarden van |t| en bovendien dat
d
Φt ◦ Φs = Φt+s . Met p vast geldt dan dt (xi ◦ Φt (p)) = v i .
De lie-afgeleide van een tensorveld T ∈ Tsr (M) wordt nu bekomen door de pull-back van TΦt (p)
te vergelijken met Tp zelf:

1 d
Lv T = lim (Φ∗t T − T) = (Φ∗t T)|t=0 (1-8.2)
t→0 t dt
(noteer dat Φ∗t T en T behoren tot dezelfde vectorruimte Tsr (p))
Uit de eigenschappen van de pull-back volgt onmiddellijk dat Lv :
1-8. LIE-AFLEIDING 19

1. tensoren van een bepaald type omzet in tensoren van het zelfde type,

2. een lineaire operator is die commuteert met contracties

3. aan de leibniz-eigenschap voldoet:

Lv (T1 ⊗ T2 ) = (Lv T1 ) ⊗ T2 + T1 ⊗ (Lv T2 ) (1-8.3)

We geven enkele belangrijke eigenschappen van de lie-afgeleide:

(i) Voor f ∈ F(M) geldt


Lv f = v[f ] (1-8.4)
Bewijs:
1
Lv f |p = lim [(Φ∗t f )(p) − f (p)]
t→0 t
1
= lim [f ◦ Φt (p) − f (p)]
t→0 t
1
= lim [f (y i (t)) − f (y i (0))]
t→0 t
∂f dyi
= i |p (0)
∂y dt
=v(f )|p

(ii) Voor een vectorveld u ∈ X(M) is

∂ui j ∂ j ∂v
i

Lv u = v − u = [v, u] (1-8.5)
∂xj ∂xi ∂xj ∂xi
Bewijs: de i-de component van Φ∗t (uq ) is

(Φ−1 i
t )∗ (uq )(x )
=uq (xi ◦ Φ−1
t )
=uq (xi ◦ Φ−t )

zodat (Φ∗t (uq ))i = uj (q) ∂x i
j (x ◦ Φ−t ).

We bekomen dan
∂uj dxk ∂v i
(Lv u)i = k
|t=0 .δji − uj j
∂x dt ∂x
∂ui j ∂v i j
= jv − u
∂x ∂xj
=[v, u]i

(iii) Gebruik makend van 1-8.5 en van het feit dat lie-afleiding commuteert met contracteren, geldt
voor 1-vormen ω:
∂ωi j i ∂v j
Lv ω = j
v dx + ωj i dxi . (1-8.6)
∂x ∂x
20 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

Immers,
∂ ∂ ∂
Lu (ω ⊗ ) = (Lu ω) ⊗ + ω ⊗ Lu i ,
∂xi ∂xi ∂x
zodat na contractie,
∂ j
Lu (ωi ) = (Lu ω)i + ωj [u, ] ,
∂xi
of

(Lu ω)i = u(ωi ) + ωj [ , u]j
∂xi
= ωi,j uj + ωj uj ,m δim = ωi,j uj + ωj uj ,i .

(iv) Door inductie op k toont men aan dat voor ω ∈ Ωk (M) geldt

Lv ω = iv (dω) + d(iv ω) (1-8.7)

wat we ook kort noteren als


Lv = iv d + d iv
(v) Een gevolg van (iv) is dat lie-afleiding commuteert met uitwendige afleiding: voor ω ∈ Ωk (M)
geldt
d(Lv ω) = Lv dω (1-8.8)
(vi) Voor een willekeurige tensor T veralgemenen 1-8.5 en 1-8.6 zich tot

(Lv T)ij... kl... =v m T ij... kl... , m − T mj... kl... v,m


i
− [alle boven-indices]
ij... m
+T ml... v,k + [alle onder-indices] (1-8.9)

Let op: bovenstaande formules gelden enkel in holonome basissen. In een anholonome basis
komt er b.v.
(Lv u)a = v c ua |c − uc v a |c + v c ud Da cd .
1-9. COVARIANTE AFLEIDING 21

1-9 Covariante afleiding


1-9.1 Algemeenheden
Alhoewel de lie-afgeleide van een afbeelding f ∈ F(M) m.b.t. een vector v in een punt p precies de
richtingsafgeleide is van f (zie 1-8.4), is de lie-afgeleide van een tensor duidelijk geen geschikte ver-
algemening van het begrip richtingsafgeleide in een punt: in 1-8.9 treden immers nog de afgeleiden
op van de componenten van v zelf!
Om over de ‘richtingsafgeleide van een tensor’ te kunnen spreken zijn we verplicht een extra
structuur op de variëteit M op te leggen:
Een connectie ∇ (in een punt van M) is een operator, die met elk vectorveld v een operator
∇v : X (M) → X (M) associeert, zó dat
(i) voor u, v, w ∈ X (M) en f , g ∈ F(M)

∇f u+gv (w) = f ∇u w + g∇v w (1-9.1)

(ii) voor u, v, w ∈ X (M) en α, β ∈ R

∇u (αv + βw) = α∇u v + β∇u w (1-9.2)

(iii) voor u, v ∈ X (M) en f ∈ F(M)

∇u (f v) = u(f )v + f ∇u v (1-9.3)

Met behulp van de differentiaalstructuur op M alléén is het niet mogelijk zulke operator ∇ te
construeren. Het bestaan van ∇ is dus een extra veronderstelling die men over M maakt. De
gegeven definitie is erg abstract, maar in de volgende paragrafen zal blijken dat aan het opleggen
van de ∇-structuur wel degelijk een fysische interpretatie gekoppeld is.
Noteer dat voorwaarde (i) garandeert dat ∇v w|p enkel afhangt van de componenten van v in
p en niet van hun afgeleiden. Immers als vp = ṽp dan bestaan lokale coördinaten zodat ∇v w|p =
v i (p)∇ ∂ i w|p = ṽ i (p)∇ ∂ i w|p = ∇ṽ w|p .
∂x ∂x
We noemen (∇v u)p de covariante afgeleide (m.b.t. de connectie ∇) van u in de richting van
vp . Dan is ook ∇u het tensorveld van type (1, 1) dat, wanneer gecontracteerd met v, de vector
∇v u oplevert:
∇u = ω b ⊗ ∇b u (1-9.4)
waarbij we ∇eb = ∇b noteren.
Deze definitie kan uitgebreid worden tot willekeurige tensorvelden door de volgende afspraken:
i) ∇ beeldt tensoren van type (r, s) af op tensoren van type (r, s + 1)
ii) ∇ is R-lineair en commuteert met contracties
iii) de leibnizregel geldt:
∇(T ⊗ S) = ∇T ⊗ S + T ⊗ ∇S (1-9.5)
iv)
∀f ∈ F(M) geldt ∇f = df (1-9.6)
I.h.b. geldt dus
∇u f =< df, u >= u(f ) (1-9.7)
en dus ook
∇b f = f|b (1-9.8)
22 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

De componenten van ∇u zullen we voortaan noteren als ua ;b :

∇u = ω b ⊗ ua ;b ea (1-9.9)

De covariante afgeleide van u in de richting van v zal dan gegeven worden door

∇v u = (ua ;b v b )ea (1-9.10)

T.g.v. de eigenschappen 1-9.1-1-9.6 zal het volstaan de covariante afgeleiden van de basisvectoren
te bepalen om de covariante afgeleide van een willekeurige vector te kennen. Daartoe voeren we
de componenten Γc ab in van de vectoren ∇eb ea , die we kort ook noteren als ∇b ea :

∇b ea = Γc ab ec (1-9.11)

(let op de volgorde van de indices!). We noemen dan

Γc ab =< ω c , ∇b ea > (1-9.12)

de connectiecoëfficiënten (noteer het verschil met Hawking & Ellis).


oefening 1: gebruik de eigenschappen van ∇ om aan te tonen dat voor de duale basis volgt

∇b ω a = −Γa cb ω c (1-9.13)

De componenten ua ;c van de covariante afgeleide van u ∈ T01 (M) kunnen dan afgelezen worden
uit ∇c u = ∇c (ua ea ) = (ua |c + Γa dc ud )ea = ua ;c ea :

ua ;c = ua |c + Γa dc ud (1-9.14)

oefening 2: toon aan dat voor σ ∈ T10 (M) geldt

σa;c = σa|c − Γd ac σd (1-9.15)

en voor T ∈ Tsr (M)

T a1 ...ar b1 ...bs ;c =(T a1 ...ar b1 ...bs )|c + Γa1 dc T d...ar b1 ...bs + [alle boven-indices ]
− Γd b1 c T a1 ...ar d...bs − [alle beneden-indices ] (1-9.16)

N.B.: let op de tekenverschillen met de lie-afgeleide!


Uit 1-2.3, 1-3.11 en 1-9.12 volgt dat de connectiecoëfficiënten niet transformeren zoals de com-
ponenten van een tensor:
′ ′
Γa b′ c′ = La a (eb′ (Lc′ a ) + Lb′ b Lc′ c Γa bc ) (1-9.17)

of, i.h.b. voor lokale coördinaten x en x′ ,



′ ∂xi ∂ 2 xi ∂xj ∂xk i
Γi j ′ k′ = ( j ′ k′ + Γ jk ) (1-9.18)
i
∂x ∂x ∂x ∂xj ′ ∂xk′
a
Noteer echter dat voor twee connecties ∇ en ∇ geldt ∇u − ∇u = (Γa bc − Γ bc )ub ea ⊗ ω c , zodat,
a
gezien het linkerlid een tensor is voor alle u, (Γa bc − Γ bc )ω b ⊗ ea ⊗ ω c wél een tensor is. Kort
zeggen we dat ‘het verschil van twee connecties een tensor is’.
1-9. COVARIANTE AFLEIDING 23

1-9.2 Parallel transport


Het bestaan van een connectie laat toe de covariante afgeleide van een tensor langs een kromme te
bepalen:
Zij γ : I → M een kromme in M, waarvan de vergelijking in lokale coördinaten gegeven is door
i
xi = xi (t). Zij u de rakende vector aan γ, i.e. ui = dxdt en zij T een tensorveld gedefiniëerd op
(een omgeving van) γ(I). We noemen dan de covariante afgeleide van T langs γ het tensorveld
D
∇u T, en noteren dit als dt T. Er geldt dus b.v. voor een éénvorm σ
 
D
σ = σa;b ub (1-9.19)
dt a

of, voor een vector v en gebruik makend van lokale coördinaten x,


i
Dv i dxj dv i dxj

D
≡ v = v i ;j = + Γi kj v k (1-9.20)
dt dt dt dt dt

We zeggen dat de tensor T parallel getransporteerd wordt langs γ als

D
T=0 (1-9.21)
dt
Parallel transport langs een kromme van een punt p naar een punt q is duidelijk een lineaire
afbeelding van Tsr (p) naar Tsr (q) en is, vermits basisvectoren worden omgezet in basisvectoren,
bovendien een isomorfisme tussen Tp (M) en Tq (M).
Een (affiene) geodeet is nu een kromme in M waarvan de rakende vector parallel langs zichzelf
getransporteerd wordt:
D
u = ∇u u = f (t)u (1-9.22)
dt
dxi
(met ui = dt en met xi = xi (t) de vergelijkingen van γ in lokale coördinaten).

Oefening: toon aan dat steeds een gepaste herparametrizering bestaat van de parameter van γ,
zodat de geodetische vergelijking 1-9.22 te herschrijven valt als ∇u u = 0, t.t.z.

Dui d2 xi j
i dx dx
k
≡ + Γ jk =0 (1-9.23)
ds ds2 ds ds
Zulke parameter s (uniek op affiene transformaties s 7→ as+b nà) noemen we een affiene parameter
langs γ. Noteer dat we m.b.v. een affiene parameter affiene afstanden kunnen vergelijken tussen
punten gelegen op een zelfde geodeet (niet echter tussen punten gelegen op verschillende geodeten,
t.g.v. de onbepaaldheid in de affiene parameters).

1-9.3 Normale coördinaten


Uit de existentiestelling voor stelsels van gewone differentiaalvergelijkingen volgt dat, voor elke
keuze van p = γ(0) en v|p = γ̇(0) = dγ ds |0 , een unieke geodeet γv (s) bestaat voor s in een open
interval I ⊂ R (als I =] − ∞, +∞[ dan noemen we γ een volledige geodeet). Als γ(s) een geodeet
is, dan is γ(λs) (λ ∈ R) eveneens een geodeet, met beginsnelheid λγ̇(0). Voor een voldoend kleine
omgeving V van 0 ∈ Tp (M) zijn alle geodeten dus zeker gedefinieerd op [0, 1]. Dit laat toe elk
24 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

element vp ∈ V af te beelden op het punt γ(1), dat een parameter-afstand 1 verwijderd is van p
langs de geodeet γv , die voldoet aan [γv ]p = vp . Dit definieert dan de exponentiële afbeelding exp:

expp : V ⊂ Tp (M) → M : vp = [γv ]p 7→ γv (1) (1-9.24)

Uit de homogeniteit van de geodetische vergelijkingen 1-9.23 volgt dan tevens

expp (tv) = γv (t)

(vermits γtv (λ) = γv (λt)) en men toont aan dat expp een diffeomorfisme is van een omgeving V
van 0 ∈ Tp (M) op een omgeving N van p ∈ M. Bovendien kan men V klein genoeg kiezen zodat
N convex is (d.w.z. door elk paar punten van N gaat precies één, volledig in N gelegen, geodeet).
Dit diffeomorfisme bepaalt een lokale kaart xi , door aan punten q ∈ N de standaard coördinaten
xi van expp −1 (q) te geven. In het coördinatenstelsel xi corresponderen de geodeten door p dan
d2 xi
precies met de rechten door 0. In het bijzonder geldt ds2 |0 = 0 of
i
Γ (jk) (p) =0 (1-9.25)

Men noemt deze xi (geodetische) normale coördinaten en de omgevingen N convexe normale


omgevingen.

1-9.4 Symmetrische connecties


Uit 1-9.23 volgt duidelijk dat informatie over de geodeten van M enkel informatie zal kunnen
verschaffen over het symmetrische deel Γi (jk) van de connectie in lokale coördinaten. Vandaar dat
we voortaan zullen onderstellen dat

T(u, v) ≡ ∇u v − ∇v u − [u, v] = 0 (1-9.26)

De tensor T van type (1, 2) in het linkerlid noemen we de torsietensor en een connectie die aan
1-9.26 voldoet een torsievrije connectie.
Uitgedrukt in basisvectoren geldt dan

2Γc [ab] = −Dc ab (1-9.27)

en dus i.h.b. voor een lokale coördinaatbasis Γi [jk] = 0, t.t.z. ∀f ∈ F(M)

f;i;j = f;j;i (1-9.28)

We noemen zulke connectie daarom ook wel een symmetrische connectie.


Een torsievrije connectie kan dus volledig bepaald worden uit de studie van haar geodeten.3 Ze
biedt bovendien het voordeel dat in uitdrukkingen voor de uitwendige afgeleide of de lie-afgeleide
‘komma’s vervangen mogen worden door punt-komma’s’.
Inderdaad, zo betekent b.v. 1-9.26 dat

Lu v = ∇u v − ∇v u (1-9.29)
3 Tenminste, als ook de affiene parameters langs elke geodeet gekend zijn: de geodeten zelf bepalen de connectie

enkel op projectieve transformaties nà (Γc ab 7→ Γc ab + δac ψb + δbc ψa , met ψ een willekeurige scalaire functie)!
1-9. COVARIANTE AFLEIDING 25

Ook geldt nu voor de basis 1-vormen dat

dω a =ω a i,j dxj ∧ dxi = ω a i;j dxj ∧ dxi


=Γa bc ω b ∧ ω c (1-9.30)

Bij de afleiding van deze betrekking maken we gebruik van 1-9.13, i.e.

Γc ab = −ω c j;i eb i ea j (1-9.31)

Er geldt immers dat ∇b ω a = ej b ∇j ω a = ej b ω a i;j dxi .

Oefening: toon aan dat ook


Γc ab = ej a;i eb i ω c j (1-9.32)
Introduceren we tenslotte de connectievormen Γa b ∈ Ω1 (M) door

Γa b = Γa bc ω c (1-9.33)

dan bekomen we uit 1-9.30 de z.g. eerste structuurvergelijkingen van Cartan

dω a = −Γa b ∧ ω b (1-9.34)

Merk op dat, voor een gegeven basis, enkel de combinaties Γc [ab] uit 1-9.34 kunnen opgelost
worden, wat volledig consistent is met 1-9.27. Duidelijk vormen dus de combinaties Γc (ab) extra
informatie op de variëteit M, die niet uit de differentiaalstructuur alléén te verkrijgen is, maar wel
b.v. uit de kennis van de geodetische structuur.
We noemen een connectie integreerbaar als voor alle punten p het parallel transport van vectoren
van p naar q (met q in een voldoend kleine omgeving van p) onafhankelijk is van de gevolgde
weg. Een connectie heet affien vlak als een basis bestaat waarin Γa bc = 0. Beide begrippen
zijn equivalent: als ∇ integreerbaar is, kan een basis {ea } in een punt p door parallel transport
uitgebreid worden tot een basis op een ganse omgeving V van p. Voor de basisvectoren geldt dan
∀uj : ea i ;j uj = 0 zodat uit 1-9.32 volgt dat Γc ab = 0 op V . Het omgekeerde is triviaal.
Merk op dat, als in een bepaalde basis Γc ab = 0, deze basis dan bovendien een coördinaatbasis is:
de eerste structuurvergelijkingen impliceren dan immers dω a = 0, zodat, volgens de stelling van
Poincaré, lokaal functies xa bestaan met ω a = dxa .
Een gemakkelijke manier om na te gaan of een connectie al dan niet vlak is, wordt gegeven in
de volgende paragraaf.
26 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

1-10 Kromming
Net zoals het nemen van twee lie-afgeleiden (naar een vector u en een vector v) afhangt van de
volgorde waarin dit gebeurt, zo geldt dit ook voor covariante afleiding - zelfs als de vectoren u en
v commuteren. We beschouwen daarom volgende uitdrukking voor u, v, w ∈ T01 (M):

R(u, v)w = (∇u ∇v − ∇v ∇u − ∇[u, v] )w (1-10.1)

Deze uitdrukking is F(M)-lineair in u, v en w (oefening!) en de tensor R die elk geördend viertal


(σ, w, u, v) (met σ ∈ T10 (M) en u, v, w ∈ T01 (M)) afbeeldt op

σa wb uc v d Ra bcd = hσ, R(u, v)wi (1-10.2)

noemen we de krommingstensor of riemann-tensor. Zijn componenten worden gegeven door

hω d , R(ea , eb )ec i = Rd cab . (1-10.3)

Bijgevolg geldt ∀σ, u, v en w:

σa wb uc v d Ra bcd =σa [(wa ;c v c );d ud − (wa ;c uc );d v d − wa ;c (ud v c ;d − v d uc ;d )]


=σa (wa ;c;d − wa ;d;c )v c ud (1-10.4)

zodat ∀w ∈ X (M)
wa ;c;d − wa ;d;c = Ra bdc wb , (1-10.5)
wat we de ricci-identiteit noemen. Met 1-9.14 vinden we hieruit

Ra bcd = Γa bd|c − Γa bc|d + Γe bd Γa ec − Γe bc Γa ed − De cd Γa be (1-10.6)

Deze betrekking volgt ook rechtstreeks uit de definitie 1-10.1 en uit

R(ea , eb )ec = Rm cab em . (1-10.7)

Men verifieert onmiddellijk dat de componenten van de riemann-tensor voldoen aan de betrekking-
en
Ra b(cd) = 0 en Ra [bcd] = 0 (1-10.8)
oefening 1: bewijs zelf, bij voorkeur door over te gaan op normale coördinaten, de bianchi-
identiteiten
Ra b[cd;e] = 0 (1-10.9)
Contractie van de riemann-tensor levert de ricci-tensor, met componenten

Rbd = Ra bad (1-10.10)

oefening 2: toon aan dat


Ra abc = 2R[bc] (1-10.11)
We bewijzen nu de volgende belangrijke stelling:
Een nodige en voldoende voorwaarde opdat een connectie lokaal integreerbaar zou zijn, is dat
de riemann-tensor nul is.
1-10. KROMMING 27

Het nodig zijn van die voorwaarde volgt onmiddellijk uit de opmerking aan het einde van vorige
paragraaf. Het klassieke bewijs dat de voorwaarde ook voldoende is, toont aan dat de verandering
∆X = X ′ − X van een vector onder parallel transport over een gesloten kromme te schrijven is
als de som van ‘N 2 bijdragen’ over willekeurig kleine gesloten krommen γ gelegen in een convexe
normale omgeving (cf. het klassieke bewijs van de stelling van Stokes). Het volstaat dan om aan
te tonen dat Ra bcd = 0 impliceert dat de verandering onder parallel transport over een willekeurig
kleine gesloten kromme klein is van orde O(δx3 ), opdat ∆X(= limN →∞ δx) = 0 zou zijn.
Voor dit laatste deel van het bewijs beschouwen we het parallel transport van een vector X over
een kleine gesloten kromme γ gelegen in een convexe normale omgeving U van p (met xi (p) = 0
i
k dxj
en Γk ij |p = 0): langs γ (bepaald door xi = xi (τ ) en γ(0) = p) geldt dX i
dτ = −Γ kj X dτ , zodat
k
we met Γi kj = xm ∂x∂m Γi kj |0 + O(x2 ) en X k (x) = X k (0) + O(x2 ) (dit laatste omdat dX dτ |τ =0 = 0)
bekomen
Z τ
dxj
 
i i m ∂ i k
X (τ ) = X (0) − x Γ kj X (0) dτ + O(x3 )
0 ∂xm 0 dτ

Bijgevolg is δX i = X i (τ1 ) − X i (τ i k
H m j 3
H 0 ) =m −j ∂xm Γ kj |0 X (0) x dx + O(x ). De kringintegraal is
echter antisymmetrisch, vermits d(x x ) = 0, zodat
   
1 ∂ i ∂ i
I
i
δX = − ( Γ kj − Γ km )X (0) xm dxj + O(x3 )
k
2 ∂xm 0 ∂xj 0
1 i
I
= R kmj (0)X k (0) xm dxj + O(x3 ) (1-10.12)
2

wat inderdaad klein is van 3de orde als Ri kmj = 0.

Ndx

X
P
1
x

Figuur 1.6:

Een zeer efficiënte methode om de componenten van de riemann-tensor te bepalen in een


willekeurige basis, maakt gebruik van de krommings-2-vormen Θa b gedefinieerd door

1 a
Θa b = R bcd ω c ∧ ω d (1-10.13)
2
28 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

Men kan aantonen4 dat 1-10.6 dan equivalent is met de tweede structuurvergelijkingen van Cartan:

dΓa b + Γa c ∧ Γc b = Θa b (1-10.14)

Uitgewerkte voorbeelden van deze methode zullen gegeven worden na de invoering van de metrische
structuur in de volgende paragraaf.

4 doe dit als oefening


1-11. METRIEKEN 29

1-11 Metrieken
1-11.1 Algemeenheden
Een metriek of metrische tensor op M is een symmetrische tensor g van type (0, 2). Een metriek
laat toe om aan elke vector v ∈ Tp (M) een scalair |g(v, v)|1/2 toe te kennen (soms ook wel de
lengte van v genoemd, zelfs al is de met g geassociëerde kwadratische vorm niet positief definiet)
en laat toe om voor twee vectoren u, v ∈ Tp (M) met g(u, u) en g(v, v) 6= 0 een scalair

g(u, v)
(1-11.1)
|g(u, u)g(v, v)|1/2

te bepalen, het inwendig product van u en v genoemd.


Twee vectoren u en v zijn orthogonaal als g(u, v) = 0.
De componenten van g t.o.v. een basis ea noteren we

gab = g(ea , eb ) (1-11.2)

In lokale coördinaten geldt dus


g = gij dxi ⊗ dxj (1-11.3)
Als er geen verwarring mogelijk is, zullen we ook vaak noteren hu, vi (of u.v) = g(u, v), u2 = hu, ui
en |u| = |hu, ui|1/2 .

Als voor een kromme γ (xi = xi (t)) de raakvector u = ∂t de eigenschap heeft dat u2 niet
van teken verandert, dan kan de metrische afstand tussen twee willekeurige punten a = γ(t1 ) en
b = γ(t2 ) van de kromme bepaald worden als
Z t2
s= |u|dt (1-11.4)
t1

i
ds dxj 1/2
Bijgevolg is dt = |gij dx
dt dt | , wat vaak symbolisch genoteerd wordt als

ds2 = gij dxi dxj (1-11.5)

We onderstellen altijd dat de metriek niet-ontaard is, t.t.z.

als ∀v g(u, v) = 0 dan u = 0 (1-11.6)

In dat geval is de matrix gab inverteerbaar, wat toelaat een symmetrische tensor van type (2, 0) te
bepalen met componenten g ab zó dat
g ab gbc = δ a c (1-11.7)
M.b.v. de tensoren gab en g ab (tot dit soort foutief taalgebruik worden we verplicht, vermits we het
zelfde symbool g voor beide tensoren gebruiken . . . ) kan nu een isomorfisme geconstrueerd worden
tussen Tsr+p (M) en Ts+p
r
(M): als b.v. T ∈ T20 (M) componenten Tab heeft, dan bepaalt g unieke
tensoren in T1 (M) en T0 (M) door T a b = g ac Tcb en T ab = g bd T a d = g ac g bd Tcd . Al deze tensoren
1 2

zullen we voortaan opvatten als representaties van hetzelfde geometrische object T.


De signatuur s van een metriek is het aantal positieve eigenwaarden min het aantal negatieve
eigenwaarden van de matrix gab . We zijn vooral geı̈nteresserd in lorentz-metrieken, t.t.z. me-
trieken met constante signatuur n−2. Een vier-dimensionale (samenhangende hausdorff-) variëteit
30 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

voorzien van een lorentz-metriek noemen we voortaan een ruimte-tijd. Voor een lorentz-metriek
kan dus een orthonormale basis ea geconstrueerd worden zó dat

gab = diag (−1, +1, . . . , +1) (1-11.8)

We maken hierbij de onderstelling dat de componenten ea i van de eigenvectoren voldoend diffe-


rentieerbare functies zijn op M.
Orthonormale basissen zijn niet uniek: de automorfismen van Tp (M) die 1-11.8 invariant laten,
zijn precies de lorentz-transformaties (zie 2-4).
Een lorentz-metriek laat toe de vectoren u 6= 0 in Tp (M) te verdelen in tijdachtige vectoren,
nul-vectoren en ruimte-achtige vectoren, naargelang u2 < 0, u2 = 0 of u2 > 0. De nul-vectoren
genereren een dubbele kegel in Tp (M), met top in p (zie 2-3).

Beschikken we over een metriek, dan kunnen we ook het inwendig product van twee p-vormen
definiëren door
hσ 1 ∧ . . . ∧ σ p , τ 1 ∧ . . . ∧ τ p i = det(hσ i , τ j i) (1-11.9)
te stellen en door deze definitie via bilineariteit uit te breiden tot gans Ωp (M).
Ga zelf na dat, als (ω 1 , . . . , ω n ) een orthonormale basis is van 1-vormen, met

hω i , ω i i = ǫi (ǫi = ±1), (1-11.10)

een orthonormale basis van Ωp (M) dan gegeven wordt door de uitwendige producten

ω i1 ∧ . . . ∧ ω ip , (1-11.11)

waarbij
hω i1 ∧ . . . ∧ ω ip , ω i1 ∧ . . . ∧ ω ip i = ǫi1 . . . ǫip . (1-11.12)
3
Voorbeeld: op R met de standaard euclidische metriek en met

H = H1 dy ∧ dz + H2 dz ∧ dx + H3 dx ∧ dy

geldt
hH, Hi = H12 + H22 + H32 . (1-11.13)
oefening: toon aan dat in een z.g. Minkowski-ruimte-tijd met metriek ds2 = −dt2 +dx2 +dy 2 +dz 2 ,
met H zoals hierboven, E = E1 dx + E2 dy + E3 dz en

F = H + E ∧ dt (1-11.14)
voldaan is aan
1 1
− hF, Fi = (hE, Ei − hH, Hi), (1-11.15)
2 2
waarbij we in het rechterlid de lagrangiaan van het electromagnetisch veld herkennen.
Tot nu onderstelden we geen enkel verband tussen de metrische en de affiene structuur op M:
zij kunnen inderdaad volkomen onafhankelijk van elkaar gekozen worden. Belangrijk is echter dat
bij een gegeven metriek g een unieke symmetrische connectie ∇ bestaat zó dat ∇g = 0, i.e.

gab;c = 0 (1-11.16)
1-11. METRIEKEN 31

(wat impliceert dat hoeken en lengtes behouden blijven onder parallel transport).
Inderdaad, voor de basisvectoren geldt ea .eb = gab zodat5

gab|c = ∇c (gab ) = (∇c ea ).eb + ea .(∇c eb ) (1-11.17)

Verwisseling van b en c, respectievelijk a en c geeft

gac|b =(∇b ea ).ec + ea .(∇b ec )


gcb|a =(∇a ec ).eb + ec .(∇a eb )

zodat we, na optellen van de laatste twee betrekkingen en aftrekken van 1-11.17, bekomen

gac|b + gcb|a − gab|c =eb .(∇a ec − ∇c ea ) + ea .(∇b ec − ∇c eb )


+ ec .(∇a eb − ∇b ea ) + 2ec .(∇b ea ) (1-11.18)

M.b.v. 1-9.11 en 1-9.27 herschrijven we het rechterlid als

ea .[eb , ec ] + eb .[ea , ec ] + ec .[ea , eb ] + 2ec .(Γd ab ed )

Definiëren we
Γabc = gad Γd bc en Dabc = gad Dd bc (1-11.19)
(let op de volgorde van de indices!) dan volgt hiermee dat
1
Γcab = (gac|b + gcb|a − gba|c + Dacb + Dcba − Dbac ) (1-11.20)
2
Hiermee is i.h.b. aan 1-9.27 identiek voldaan.
De unieke symmetrische connectie die hierdoor bepaald wordt, noemt men de metrische con-
nectie en we zullen ons hiertoe voortaan beperken.
Twee bijzondere gevallen van de betrekkingen 1-11.20 zijn van belang

(i) het geval van een coördinaatbasis (ei = ∂x i ):

we hebben dan Dijk = 0 en 1-11.20 reduceert zich tot de christoffel-betrekkingen


1
Γijk = (gij,k + gik,j − gjk,i ) (1-11.21)
2
Er geldt dan
Γijk = Γikj (1-11.22)
en, vermits Γi jk = g im Γmjk , dus ook

Γi jk = Γi kj (1-11.23)

(ii) het geval van een stijve basis (gab constanten):


dan is gab|c = 0, zodat uit 1-11.20 en Dabc = −Dacb volgt

Γ(ab)c = 0 (1-11.24)

Met
Γab = gac Γc b (1-11.25)
5 bekijk de dubbele contractie van ∇(g ⊗ ea ⊗ eb )
32 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

geldt dan
Γ(ab) = 0 (1-11.26)
oefening 1: toon aan dat in een willekeurige basis ea de voorwaarde 1-11.16 (of dus 1-11.20)
te schrijven is als
dgab = Γab + Γba (1-11.27)
oefening 2: bekijk terug oefening van van paragraaf 1.2 en onderstel dat de gegeven basis
orthonormaal is; bereken de Γab uit de Dabc en verifieer de eerste structuurvergelijkingen van
Cartan.
Het voordeel van het werken met een stijve basis i.p.v. met een coördinaatbasis is nu duidelijk:
2
terwijl er in het algemeen in een coördinaatbasis n (n+1) 2 onafhankelijke christoffel-symbolen zijn
2
(i.e. 40 als n = 4), zijn er in een stijve basis slechts n 2−n onafhankelijke connectievormen (elk met
n componenten), wat voor n = 4 nog slechts 4 × 6 = 24 onafhankelijke componenten oplevert.
Noteer ook dat we de connectiecoëfficiënten niet expliciet dienen te berekenen, indien we
b.v. enkel geı̈nteresseerd zijn in de vergelijkingen van de metrische geodeten. Deze vergelijkingen
kunnen doorgaans snel bekomen worden m.b.v. een variationele methode: in een convexe normale
omgeving is de metrische geodeet tussen twee punten immers precies de kromme waarvoor de
metrische ‘afstand’ een extremum is onder variaties van de verbindende krommen.
Deze eigenschap is eenvoudig in te zien: bekijk een 1-parameter familie van b.v. tijdachtige
krommen gegeven door xi = xi (t, u) met u ∈] − ǫ, ǫ[, zó dat ∀t en u

xi (t1 , u) =xi (t1 )


xi (t2 , u) =xi (t2 )
xi (t, 0) =xi (t) (1-11.28)
Rt i
en herschrijf 1-11.4 als s = t12 Ldt met L = (−gij ẋi ẋj )1/2 en ẋi = ∂x
∂t . Stellen we dan de
∂s
variationele afgeleide δs = ∂u |u=0 = 0, dan bekomen we de euler-lagrange-vergelijkingen

∂L d ∂L
− ( i) = 0 (1-11.29)
∂xi dt ∂ ẋ
Dat deze niets anders zijn dan de geodetische vergelijkingen 1-9.23, verifiëren we door 1-11.29 met
2L te vermenigvuldigen:

∂L2 d ∂L2 dL ∂L
0= i
− ( i)+2
∂x dt ∂ ẋ dt ∂ ẋi
∂ k l d ∂ k l d2 s ∂
=− (gkl ẋ ẋ ) + (gkl ẋ ẋ ) + 2 (−gkl ẋk ẋl )1/2
∂xi dt ∂ ẋi dt2 ∂ ẋi
d d2 s
= (2gij ẋj ) − gkl,i ẋk ẋl − 2 2 (−gkl ẋk ẋl )−1/2 gij ẋj
dt dt
d2 s ds
=2gij ẍ + 2gij,k ẋ ẋ − gkl,i ẋk ẋl − 2 2 .( )−1 gij ẋj
j j k
dt dt
1 1 1 s̈
=2gij ẍj + 2ẋj ẋk ( gij,k + gik,j − gkj,i ) − 2 gij ẋj
2 2 2 ṡ
We bekomen dus

ẍi + Γi jk ẋj ẋk = ẋi (1-11.30)

1-11. METRIEKEN 33

en herparametrizering van t naar s levert dan inderdaad 1-9.23.


Deze methode werkt uiterst efficiënt voor een in lokale coördinaten gegeven metriek. Ze heeft
als bijkomend voordeel dat eerste integralen onmiddellijk te identificeren zijn aan de hand van
cyclische coördinaten!
Nog eenvoudiger wordt alles door op te merken dat het extremaliseren van de actie
1 t2 2 1 t2
Z Z
− L dt = gij ẋi ẋj dt
2 t1 2 t1
precies dezelfde vergelijkingen oplevert, met als bonus dat t nu ineens ook de eigentijd τ blijkt
te zijn! Het grootste voordeel van het gebruik van de ’slechte’ lagrangiaan L2 is echter dat een
hamiltoniaanse vorm van de vergelijkingen kan worden opgesteld: het moment toegevoegd aan ẋi
is immers
∂ − 12 L2
pi = = gij ẋj ,
∂ ẋi
zodat
1 1 1
H = pi ẋi − gij ẋi ẋj = gij ẋi ẋj = g ij pi pj .
2 2 2
De hamiltonvergelijkingen
∂H
ṗi = − (1-11.31)
∂xi
∂H
ẋi = (1-11.32)
∂pi
leveren dan, gebruik makend van g ij ,k = −g im g jℓ gmℓ,k , onmiddellijk terug de gewenste bewegings-
vergelijking6 .

Voorbeeld: de geodeten van de statisch en sferisch symmetrische metriek (zie ook hoofdstuk 6)
ds2 = −B(r)dt2 + A(r)dr2 + r2 dθ2 + r2 sin2 θdφ2 .
Met (g ij ) = diag(−B −1 , A−1 , r−2 , r−2 sin−2 θ) is
1
H= (−B −1 p20 + A−1 p21 + r−2 p22 + r−2 sin−2 θp23 ), (1-11.33)
2
waaruit
ṗ0 = ṗ3 = 0
1 1
ṗ1 = −r−3 (p22 + sin−2 θp23 ) − (B −1 )′ p20 + (A−1 )′ p21
2 2
ṗ2 = −r−2 sin−3 θ cos θp23

en

ṫ = −B −1 p0
ṙ = A−1 p1
θ̇ = r−2 p2
φ̇ = r−2 sin−2 θp3 .
6 dit mislukt bij de lagrangiaan L, omdat de hamiltoniaan dan identiek 0 is!
34 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

Kiezen we de coördinaten zó dat de beweging begint in het θ = π2 -vlak (θ̇0 = 0 en θ0 = π2 ), dan is
p2 = 0 zodat de beweging beperkt blijft tot dit vlak. Verder zijn p0 en p3 = J constanten, waarbij
we p0 = −1 kunnen stellen, zodat H = 21 (−B −1 + A−1 p21 + r−2 J 2 ) een constante van de beweging
oplevert. De baanvergelijking wordt bijgevolg gegeven door

dr 2
−B −1 + AJ 2 r−4 ( ) + r−2 J 2 = 2H. (1-11.34)

1-11.2 Eigenschappen van de riemann-tensor


Het ligt voor de hand dat bij het gebruik van een metrische connectie ook de riemann-tensor aan
bijkomende eigenschappen zal voldoen. Bekijken we hiertoe normale coördinaten in een omgeving
∂g
van een punt p ∈ M: er geldt dan Γi jk |p = 0 en dus ∂xijk |p = 0. Onder een lineaire transfor-
matie met constante coëfficiënten blijven deze relaties behouden, zodat we bovendien gij |p tot ±δij
kunnen herleiden.
Met normale coördinaten in een (convexe normale) omgeving van p bedoelen we voortaan dus
coördinaten waarvoor, naast de voorwaarden besproken in 1.9.c, tevens voldaan is aan

∂gij
gij |p = ±δij en |p = 0 (1-11.35)
∂xk
Deze coördinaten kunnen in een punt p praktisch geconstrueerd worden door (i) een tijd-
achtige geodeet γ door p te beschouwen en e0 te definiëren als de eenheidsraakvector aan γ in p,
m.a.w. door een vrij-vallende waarnemer te beschouwen (2) e0 aan te vullen tot een orthonormaal
referentiestelsel ea in p (3) door alle geodeten te beschouwen vertrekkend vanuit p in willekeurige
ruimte-achtige richtingen n = nα eα en de punten langs deze geodeten de coördinaten xα = snα
toe te kennen (dit laatste kan slechts in een voldoend kleine omgeving waar deze geodeten elkaar
niet snijden).
Geldt nu bovendien dat gij |p = ±δij , in elk punt van elke lokale coördinaten-omgeving, dan noemen
we de metriek g (lokaal) vlak. Aangezien 0 = gij;k = gij,k − gim Γm jk − gjm Γm ik levert de stelling
op het einde van paragraaf 1.9 onmiddellijk het volgende resultaat:
Een nodige en voldoende voorwaarde opdat een metriek lokaal vlak zou zijn, is dat de
riemann-tensor 0 is.

In het algemeen geldt voor de riemann-tensor in normale coördinaten in het punt p

Rijkl |p =(Γijl,k − Γijk,l )|p


=(gil,jk − gjl,ik + gjk,il − gik,jl )|p

waaruit blijkt dat de symmetrieën 1-10.8 kunnen uitgebreid worden tot

Rabcd = Rcdab (1-11.36)

en
R(ab)cd = Rab(cd) = Ra[bcd] = 0 (1-11.37)
Uit 1-10.11 volgt nu ook dat de ricci-tensor symmetrisch is:

R[ab] = 0 (1-11.38)
1-11. METRIEKEN 35

Contractie van de bianchi-identiteiten 1-10.9 levert


Rbd;e − Rbe;d + Ra bde;a = 0 (1-11.39)
Definiëren we nu de ricci-scalar
R = Ra a (1-11.40)
dan bekomen we, door 1-11.39 nogmaals te contracteren, de belangrijke betrekking
1
(Ra b − Rδ a b );a = 0 (1-11.41)
2
De tensor
1
Gab = Rab − Rgab (1-11.42)
2
die hierin optreedt, noemen we de einstein-tensor.

oefening 2: toon aan dat


Rab = iea iem Θm b (1-11.43)
oefening 3: gebruik de resultaten van oefening 1.11.2 om de ricci-tensor te bepalen voor de
metriek ds2 = dx2 + e−2x dz 2 + e−2x (dy − xdz)2 in de in 1.11.2 gegeven orthonormale basis.

De volgende geometrische interpretatie van de riemann-tensor zal fundamenteel zijn bij de


afleiding van de einstein-veldvergelijkingen:
Bekijk een familie van geodeten γs (t) (met t een affiene parameter) en onderstel dat de afbeelding
(t, s) 7→ γs (t) een diffeomorfisme is tussen een open deel van R2 en een 2-dimensionale deelvariëteit
Σ ⊂ M (t.t.z. Σ wordt ‘opgespannen door de familie van geodeten’).

g
s1
g
s2
g S
s3
gs
4

Figuur 1.7:
∂ ∂
Kiezen we t en s als twee van de lokale coördinaten in M en stellen we T = ∂t en X = ∂s .
Deze vectoren zijn niet uniek bepaald t.g.v. de resterende vrijheid in de keuze van de affiene
parameter: t → u(s)t + v(s). We maken nu gebruik van deze vrijheid om T en X zó te definiëren
dat T2 = T a Ta constant is over Σ (door middel van een herschaling t 7→ t′ = u(s)t van de t-
coördinaat)7 . Hiermee is dan ook Ta X a langs elke geodeet constant, want ∇T (T.X) = T.∇T X =
(vermits X en T commuteren) T.∇X T = 12 ∇X (T2 ) = 0.
7 T2 is reeds constant langs elke geodeet afzonderlijk, want ∇T (T.T) = 2T.∇T T = 0
36 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

M.b.v. een translatie t 7→ t′ = t + v(s) kan vervolgens T.X = 0 gemaakt worden langs een
willekeurige kromme C die de gegeven familie geodeten transversaal snijdt, zodat uiteindelijk
T.X = 0 over gans Σ. Het zo geconstrueerde vectorveld X noemen we het deviatievectorveld en
v = ∇T X de relatieve snelheid van een infinitesimaal nabije geodeet (v a = T b ∇b X a is een maat
voor de snelheid waarmee het deviatievectorveld verandert langs een gegeven geodeet). Analoog
definiëren we de relatieve versnelling a = ∇T v. Er geldt dan

a =∇T ∇T X
=∇T ∇X T
=∇T ∇X T − ∇X ∇T T − ∇[T,X] T
=R(T, X)T (1-11.44)

of, in componenten,
aa = Ra bcd T b T c X d (1-11.45)
ook wel de geodetische deviatie vergelijking genoemd. In een vlakke ruimte blijven initieel parallelle
geodeten dus parallel; in een gekromde ruimte bewegen initieel parallelle geodeten zich daarentegen
naar elkaar toe of van elkaar weg.

Het aantal algebraisch onafhankelijke componenten van de riemann-tensor kan gevonden worden
door Rabcd te bekijken als een symmetrische tensor in de N = 21 n(n−1) index-koppels (ab) en (cd).
Deze tensor heeft 12 N (N + 1) componenten, waartussen nog de betrekkingen Ra[bcd] = 0 bestaan.
Het linkerlid van deze laatste gelijkheid is echter antisymmetrisch in elk paar indices en bevat dus
(n4 ) onafhankelijke termen. Het aantal onafhankelijke componenten van de riemann-tensor wordt
bijgevolg
1 1 1 n(n − 1)(n − 2)(n − 3) 1 2 2
. n(n − 1)[ n(n − 1) + 1] − = n (n − 1)
2 2 2 4! 12
als n = 1, dan is Rabcd = 0
als n = 2, dan is er slechts 1 onafhankelijke component, namelijk de ricci-scalar R. Er geldt dan

Rabcd = Rga[c gd]b (1-11.46)

als n = 3, dan is de riemann-tensor volkomen bepaald door de 6 componenten van de ricci-tensor


als n > 3, dan worden de overblijvende componenten (20 als n = 4) van de riemann-tensor bepaald
door de weyl-tensor Cabcd , gedefiniëerd door
2 2
Rabcd = Cabcd + (ga[c Rd]b + gb[d Rc]a ) − Rga[c gd]b (1-11.47)
n−2 (n − 1)(n − 2)
De weyl-tensor heeft dezelfde symmetrieën als de riemann-tensor, maar bovendien zijn al zijn
contracties 0 (C a bca = 0).
oefening 4: gebruik de symmetrieën van de weyl-tensor om aan te tonen dat C a bcd = 0 voor elke
3-dimensionale ruimte.
Veruit de belangrijkste eigenschap van de weyl-tensor is zijn invariantie onder conforme transfor-
maties: dit zijn overgangen van een metriek g naar een metriek ĝ = Ω2 g, met Ω (6= 0) ∈ F(M),
zodat de nulkegel-structuur van beide lorentz-metrieken identiek is. Met enig rekenwerk bepaalt
men de connectievormen en de riemann-tensor van de metriek ĝ in functie van deze van de metriek
g, wat met 1-11.47 leidt tot
Cˆa bcd = C a bcd (1-11.48)
1-11. METRIEKEN 37

Een metriek wordt conform vlak genoemd, als een functie Ω bestaat zodat ĝ een vlakke metriek
is. Men bewijst de volgende stelling:
een nodige en voldoende voorwaarde opdat een metriek op een n (n > 3) dimensionale
variëteit conform vlak zou zijn is dat de weyl-tensor 0 is.
oefening 5: toon aan dat een 2-dimensionale variëteit altijd conform vlak is.
Het geval n = 3 is nogal moeilijk en vereist de studie van 3de orde afgeleiden van de metriek (net
zoals de riemann- tensor bevat de weyl-tensor enkel 2de orde afgeleiden).

1-11.3 Hyperoppervlakken
Een deelverzameling Σ ⊂ M wordt een hypervlak van de n-dimensionale variëteit M genoemd, als
Σ in de spoortopologie van M homeomorf is met een (n − 1)-dimensionale variëteit S (Σ = θ(S))
en wel zó dat θ : S → M een diffeomorfisme is tussen open delen U ⊂ S en θ(U ) ⊂ Σ (we noemen
de afbeelding θ dan een inbedding).

q
qX n
*
x q(p)
p Tp q Tp
*

Figuur 1.8:

Voor elke p ∈ S is θ∗ Tp dan een (n−1)-dimensionale deelvectorruimte in Tθ(p) , waarvan de normaal


n loodrecht staat op elke θ∗ X (X ∈ Tp ).
Kaarten invoerend op omgevingen van p en θ(p), toont men aan dat Σ lokaal gegeven wordt door
een vergelijking f = 0 (f ∈ F(M)) met n ∝ df 6= 0.
Is g een lorentz-metriek op M dan noemen we
Σ een tijdachtig hyperoppervlak, als n een ruimte-achtige vector is
Σ een nul-hyperoppervlak, als n een nul-vector is
Σ een ruimte-achtig hyperoppervlak, als n een tijdachtige vector is
De verklaring voor deze terminologie is te zoeken in de aard van de door g geı̈nduceerde metriek
θ∗ (g) op S. Bedenk dat θ∗ (g) bepaald wordt door θ∗ (g)(u, v)p = g(θ∗ u, θ∗ v)|θ(p) voor u, v ∈ Tp .
Merk ook op dat in lokale coördinaten (y 1 , . . . y n−1 ) op S en (x1 , . . . xn ) op M, met Σ gegeven
door de vergelijkingen xi = xi (y), we de geı̈nduceerde metriek gewoon vinden door ‘substitutie’:

∂xi ∂xj k m
ds2S = gij (x(y)) dy dy (1-11.49)
∂y k ∂y m
de z.g. eerste fundamentele vorm van S.
Onderstel nu dat n tijdachtig is, t.t.z. n2 < 0. We construeren dan in M de basis (n, θ∗ (e2 ),
. . . , θ∗ (en )) met (e2 , . . . , en ) een basis in S. Vermits n en θ∗ (ea ) orthogonaal zijn, wordt g hierin
38 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

n2
 
0
voorgesteld door de matrix . Deze matrix heeft signatuur n − 2, zodat θ∗ g
0 θ∗ g(ea , eb )
positief definiet is, wat de benaming ruimte-achtig hyperoppervlak rechtvaardigt.
Voor een tijdachtige n nemen we de gewoonte aan n te normaliseren zodat gab na nb = −1. Dit
laat ons toe de projectie tensor h te construeren, met componenten

hab = gab + na nb (1-11.50)

Duidelijk geldt dat


hab nb = 0 (1-11.51)
zodat elke vector v ∈ Tθ(p) (M) kan ontbonden worden in een component ha b v b rakend aan Σ en
een component loodrecht op Σ: v a = ha b v b + λna , waarbij we de coëfficiënt λ bepalen door te
contracteren met na , wat resulteert in

v a = ha b v b − na nb v b (1-11.52)

(noteer dat h inderdaad als een projectie operator kan bekeken worden, vermits de geassocieerde
matrix idempotent is, ha b hb c = ha c ).

Voor later gebruik is de volgende terminologie nog van belang: een vectorveld u ∈ X (M) heet
hyperoppervlak-orthogonaal (afgekort: HSO) als door elk punt p van M een hyperoppervlak Σp
kan gevonden worden, zodat, in een voldoend kleine omgeving van p, voor alle punten x ∈ Σp ux
loodrecht staat op Tx (Σp ).
Merk op dat bij een gegeven willekeurig vectorveld u weliswaar in elk punt p een (n−1)-dimensionale
deelruimte Wp ⊂ Tp (M) kan geconstrueerd worden, zodat Wp loodrecht staat op elke up , maar
dat deze deelruimten niet noodzakelijk ‘glad aan elkaar te sluiten zijn’, in de zin dat ze de rakende
ruimten vormen van een hyperoppervlak!
Stel nu met ũ de aan u geassocieerde 1-vorm voor (t.t.z. ũa = gab ub ) en stel dat voor een gekozen
punt p Σp bepaald is door f = 0, met normaal n ∼ df . Als u hyperoppervlak-orthogonaal is, dan is
voor alle v ∈ TΣp hũ, vi = 0 = hdf, vi, waaruit onmiddellijk volgt dat een functie h bestaat zodat
ũ = hdf en dus ũ ∧ dũ = 0. Omgekeerd toont de stelling van Fröbenius dat deze laatste betrekking
op haar beurt impliceert dat u loodrecht staat op de hyperoppervlakken met vergelijking f = 0.
We bekomen dus volgend resultaat:

Een vectorveld is hyperoppervlak-orthogonaal als en slechts als voor de geassocieerde 1-vorm


ũ geldt dat
ũ ∧ dũ = 0 (1-11.53)
(merk op dat in 2 dimensies dus elk vectorveld hyperoppervlak-orthogonaal is: in klassieke
terminologie betekent dit dat er voor elke differentiaalvergelijking u(x, y)dx + v(x, y)dy = 0 een
integrerende factor λ bestaat die het linkerlid exact maakt).
Uitgedrukt in componenten betekent dit

u[a ub;c] = 0 (1-11.54)

1-11.4 Dualiteit
We besluiten met een addendum bij paragraaf 7, waar we reeds opmerkten dat we, om scalaire
functies f ∈ F(M) over een variëteit te integreren, dienen te beschikken over een volumevorm op
1-11. METRIEKEN 39

M. Op zichzelf is het construeren van volumevormen geen probleem: neem een willekeurige basis
ea , construeer de duale basis ω a en bekijk b.v.

σ = ω1 ∧ · · · ∧ ωn (1-11.55)
′ ′
Deze vorm is echter niet invariant onder basistransformaties. Inderdaad, als ω a = La a ω a een
gelijk-geöriënteerde basis is (d.w.z. det L > 0), dan is

σ ′ = det(La a )σ (1-11.56)

Beschikken we nu over een metriek g, dan geldt

det(ga′ b′ ) = det (La′ a )2 det(gab )

of korter
g ′ = det(La′ a )2 g
Bijgevolg is (met |g| de absolute waarde van det gab )

|g ′ |1/2 = det(La a )−1 |g|1/2 (1-11.57)

wat ons m.b.v. 1-11.56 volgende z.g. canonieke volumevorm Ω oplevert

Ω = |g|1/2 σ (1-11.58)

ook de levi-civita-tensor genoemd (bij een basistransformatie geldt dan Ω′ = Ω). In de meeste
naslagwerken vindt men i.p.v. Ω de notatie η: omdat dit, vooral in Hoofdstuk 2 verwarring kan
opleveren met de minkowski-tensor, verkiezen we hier van af te wijken! Het is nu helemaal niet evi-
dent dat globaal, t.t.z. over gans de variëteit M, een dergelijke volume-vorm Ω kan geconstrueerd
worden: dit komt immers neer op de globale constructie van een ‘positieve’ orthonormale basis en,
zoals het voorbeeld van de möbius-strip aantoont, is dit niet altijd mogelijk! Kan dit wél gebeuren,
dan zeggen we dat M oriënteerbaar is. Orthonormale basissen (i.e. basissen met gab = ǫa δab en
ǫa = ±1) waarvoor
ω 1 ∧ · · · ∧ ω n = +Ω (1-11.59)
worden dan positieve orthonormale basissen genoemd.

Het bestaan van de volumevorm Ω laat verder nog toe om in een n-dimensionale variëteit aan
een p-vorm ω een unieke n − p-vorm te associëren, de hodge-duale (of kortweg de duale) van ω
genoemd. We noteren deze n − p-vorm als ∗ω: hij wordt gedefinieerd door

µ ∧ ∗ω = hµ, ωi Ω ∀ µ ∈ Ωp (M) (1-11.60)

Is (ω 1 , . . . , ω n ) een positieve orthonormale basis, dan bestaat er voor de duale van de basis-p-
vormen ω i1 ∧ . . . ω ip een eenvoudige uitdrukking: met 1 6 i1 < . . . < ip 6 n is

∗(ω i1 ∧ . . . ∧ ω ip ) = (−1)σ ǫi1 . . . ǫip ω ip+1 ∧ . . . ∧ ω in . (1-11.61)

Hierbij is (ip+1 , . . . , in ) de rij die ontstaat uit (1, . . . , n) door er (i1 , . . . , ip ) uit weg te laten:

(ip+1 , . . . , in ) = (1, . . . , n) − (i1 , . . . , ip ) (1-11.62)


40 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

en is σ de permutatie die (1 . . . n) afbeeldt op (i1 . . . in ).


In R3 met de standaard euclidische metriek is dualiteit niets anders dan de afbeelding die
toelaat om aan de 1-vormen dx, dy en dz de 2-vormen

∗dx = dy ∧ dz, ∗dy = dz ∧ dx, ∗dz = dx ∧ dy (1-11.63)

te associëren en omgekeerd:

∗(dx ∧ dy) = dz, ∗(dy ∧ dz) = dx, ∗(dz ∧ dx) = dy. (1-11.64)

Tevens geldt dan


∗1 = dx ∧ dy ∧ dz en ∗ (dx ∧ dy ∧ dz) = 1. (1-11.65)
In het 3-d euclidische geval is dus
∗2 = 1 (1-11.66)
Let op: in het 4-d lorentz-geval daarentegen geldt voor p-vormen (ga na)

∗2 = (−1)p(4−p)+1 (1-11.67)

Bovenstaande eigenschappen tonen expliciet aan dat het uitwendig product een directe veral-
gemening is van het vectorieel product: in de standaard euclidische ruimte R3 kunnen we immers
(vermits gij = g ij = δij ) vectoren ui ∂i identificeren met 1-vormen ui dxi en, indien we beide
objecten aanduiden met hetzelfde symbool u, dan kunnen we de eigenschap

(u1 dx + u2 dy + u3 dz) ∧ (v1 dx + v2 dy + v3 dz) = (u2 v3 − u3 v1 )dx + (u3 v1 − u1 v3 )dy + (u1 v2 − u2 v1 )dz

herschrijven als
∗(u ∧ v) = u × v (1-11.68)
De analogie met de vectoranalyse gaat nog veel verder, als we bedenken dat

∗u = ∗(u1 dx + u2 dy + u3 dz) = u1 dy ∧ dz + u2 dz ∧ dx + u3 dx ∧ dy

en dus
∂u1 ∂u2 ∂u3
d∗u=( + + )dx ∧ dy ∧ dz
∂x ∂y ∂z
waaruit,
∗d ∗ u = ∇ · u. (1-11.69)
Anderzijds is (ga na)

∂u3 ∂u2 ∂u1 ∂u3 ∂u2 ∂u1


d(u1 dx + u2 dy + u3 dz) = ( − )dy ∧ dz + ( − )dz ∧ dx + ( − )dx ∧ dy,
∂y ∂z ∂z ∂x ∂x ∂y

waaruit volgt
∗du = ∇ × u. (1-11.70)
Tenslotte is voor een scalaire functie Φ
∂Φ ∂Φ ∂Φ
dΦ = dx + dy + dz,
∂x ∂y ∂z
1-11. METRIEKEN 41

waaruit
∗dΦ = ∇Φ. (1-11.71)
De twee befaamde identiteiten uit de vectoranalyse, rot grad = 0 en div rot = 0 blijken alzo bij-
zondere gevallen te zijn van de eigenschap d2 = 0! Hiermee wordt ook duidelijk dat de klassieke
stellingen van Stokes en Gauss bijzondere gevallen zijn van de eigenschap 1-7.8.

We besluiten deze paragraaf met enkele beschouwingen over de maxwell-vergelijkingen. Bekij-


ken we eerst het paar vergelijkingen

∇ · H =0 (1-11.72)
∂H
∇×E=−
∂t
Bedenken we dat, om het magnetisch veld te definiëren, we het verschil moeten kennen tussen
“links” en “rechts”, dan suggereert dit dat we met H een 2-vorm laten overeenkomen en met E
een 1-vorm:

E = E1 dx + E2 dy + E3 dz en H = H1 dy ∧ dz + H2 dz ∧ dx + H3 dx ∧ dy. (1-11.73)

In het licht van voorgaande beschouwingen zijn dan, in het statische geval, de vergelijkingen
∇ · H = 0 en ∇ × E = 0 eenvoudig te schrijven als dH = dE = 0. Wat wordt dit in het
niet-statische geval? Beschouwen we daartoe de volgende 2-vorm op R4 ,

F = H + E ∧ dt, (1-11.74)

Splitsen we de uitwendige afgeleide van een p-vorm ω op in een ruimtelijk deel en tijdelijk deel,
door
∂ω
dω = d(3) ω + dt ∧ , (1-11.75)
∂t
dan blijkt dat

dF = dH + dE ∧ dt
= d(3) H + dt ∧ ∂t H + (d(3) E + dt ∧ ∂t E) ∧ dt
= d(3) H + (∂t H + d(3) E) ∧ dt.

Het koppel vergelijkingen 1-11.72 kan dus geschreven worden als

dF = 0. (1-11.76)
42 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

1-12 Isometrieën
Symmetrieën spelen een fundamentele rol bij de constructie en de classificatie van oplossingen van
de einstein-vergelijkingen. Een precieze discussie van symmetriegroepen, vereist het gebruik van
lie-groepen en valt buiten het kader van deze cursus. Enige vaagheid is dus onvermijdelijk.
Voeren we eerst het begrip van een isometrie in: dit is een diffeomorfisme φ : M → M
waaronder de metriek invariant is, t.t.z. φ∗ g = g; m.a.w. φ is een isometrie als voor alle u en
v ∈ Tp (M) en voor alle p
g(u, v)|p = g(φ∗ u, φ∗ v)|φ(p) (1-12.1)
In 1-8 hebben we gezien hoe met elk vectorveld X een lokale 1-parameter groep van diffeomorfismen
Φt geassocieerd is, en omgekeerd. Onderstel nu dat deze Φt isometrieën zijn, zodat we beschikken
over een lokale 1-parameter groep van isometrieën of een 1-dimensionale symmetriegroep. Er geldt
dan dat
1
LX g = lim (Φt ∗ g − g) = 0 (1-12.2)
t→0 t

en we noemen X dan een killing-vectorveld. Ook zeggen we dat X de generator is van de symme-
triegroep {Φt }. Intuı̈tief betekent dit dus dat in elk punt p alle metrische betrekkingen onveranderd
blijven onder een infinitesimaal kleine translatie in de richting Xp .
M.b.v. 1-8.9 bekomen we dan 0 = LX gab = gab;c X c + gmb X m ;a + gam X m ;b , i.e.

X(a;b) = 0 (1-12.3)

wat we de killing-vergelijkingen noemen.


Omgekeerd kan men aantonen dat elk vectorveld dat voldoet aan de killing-vergelijkingen ook de
generator is van een lokale 1-parameter groep van isometrieën. Een aanschouwelijker voorstelling

V
b’
b
q’
q

p p’
n

Figuur 1.9:

van killing-vectoren wordt verkregen door een hyperoppervlak Σ te kiezen, met p ∈ Σ zó dat
Σ niet rakend is aan Xp (wat mogelijk is in elk punt p waar Xp 6= 0). Definiëren we in Σ
coördinaten (x2 , . . . xn ), dan zijn in een voldoend kleine omgeving V van p alle punten a′ ∈ V
uniek te karakteriseren m.b.v. de parameter x1 = t en de coördinaten x2 (a), . . . xn (a) van a, waarbij
Φ−t a′ = a ∈ Σ:
1-12. ISOMETRIEËN 43

M.a.w. we kiezen de coördinaten zó dat de 1ste coördinaatkrommen precies de integraal-


1
krommen zijn van X. M.b.v. 1-8.1 vinden we dan voor de componenten van X dat X 1 = dxdt = 1,
2
X 2 = dx
dt = 0 etc. :

X i = δ i 1 of X = (1-12.4)
∂t
∂gij
Gesubstitueerd in 1-12.2 levert dit ∂t = 0 en dus

gij = gij (x2 . . . xn ) (1-12.5)

wat expliciet toont dat de metrische componenten niet veranderen langs de integraalkrommen van
X.

Oefening:
1. Toon aan dat
Lu g = Lv g = 0 => L[u, v] g =0 (1-12.6)
waaruit volgt dat de killing-vectorvelden een lie-algebra vormen t.o.v. de bewerking [ , ].

2. Toon aan dat symmetriegroepen aanleiding geven tot behoudswetten, in de zin dat, als u = ∂s
de raakvector is aan een geodeet (s is een affiene parameter) en X een killing-vectorveld is, dan
d
u.X een constante van de beweging is: ds (ua Xa ) = 08 .
3. Maak gebruik van de symmetrie-eigenschappen van de riemann-tensor om aan te tonen dat elk
killing-vectorveld voldoet aan
Xa;b;c = Rmcba X m (1-12.7)
Vermits t.g.v. 1-12.7 ook alle hogere orde afgeleiden ∇(∇(. . . (∇X) . . . )) kunnen gevonden wor-
den in functie van X en ∇X, is een killing-vectorveld lokaal volledig bepaald door het vastleggen
van de getallen Xa en Xa;b in één willekeurig punt. Voor een gegeven lie-algebra bepalen deze
n + 12 n(n − 1) getallen dus het maximum aantal lineair onafhankelijke vectoren in de algebra. Is de
dimensie van de lie-algebra r, dan zeggen we dat de variëteit een groep Gr van isometrieën bezit.
Er geldt dus
1
r = dim Gr ≤ n(n + 1) (1-12.8)
2
Voor de deelgroep H ⊂ Gr van isotropieën (i.e. de isometrieën die een gegeven punt p vast laten:
Φt (p) = p) toont men analoog aan dat

1
dim H ≤ n(n − 1) (1-12.9)
2
Als r = 12 n(n + 1) dan noemen we de variëteit maximaal symmetrisch.
We vermelden drie belangrijke eigenschappen van maximaal symmetrische variëteiten (voor de
bewijzen zie b.v. Weinberg):
(i) Elke maximaal symmetrische variëteit is homogeen, t.t.z. voor elk tweetal punten p en
q ∈ M bestaat een isometrie Φt zodat Φt (p) = q
8 Niet alle behoudswetten zijn af te leiden uit een isometrie. Als bv. een tensor K
ab bestaat met Kab = Kba
d
en K(ab;c) = 0 (een z.g. killing-tensor), dan bekomen we behoudswetten van de gedaante ds (Kab ua ub ) = 0. We
(1) (2)
noemen een killing-tensor triviaal als hij is opgebouwd uit killing-vectoren: bv Kab = Ka Kb ; er bestaan echter
ruimte-tijden die niet-triviale killing-tensoren bevatten. Dit leidt bv. in het geval van de kerr-metriek tot een extra
behoudswet die de volledige integratie van de bewegingsvergelijkingen toelaat.
44 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

(ii) Een variëteit is maximaal symmetrisch als en slechts als ze een constante kromming
heeft:
Rabcd = K(gac gbd − gad gbc ) = 2Kga[c gb]d (1-12.10)
met K constant. Ga na dat de ricci-scalar dan gegeven wordt door R = n(n − 1)K.
Gevolg: elke maximaal symmetrische variëteit is conform vlak (wat niet triviaal is in 3D!).
(iii) Elke maximaal symmetrische variëteit is (lokaal en op diffeomorfismen na) uniek bepaald
door haar dimensie n, de signatuur s van haar metriek g en door de constante K.

Tengevolge van deze laatste eigenschap volstaat het om voor elke n, s en K een voorbeeld
van een maximaal symmetrische variëteit te construeren. Vermits 1-12.10 impliceert dat de weyl-
tensor 0 is, ligt het voor de hand om lokale coördinaten te gebruiken waarvoor gij = e2U ĝij met
ĝij = diag (±1, ±1, · · · ± 1)9 . Substitutie in de voorwaarden 1-12.10 levert dan de vergelijkingen

2(e−U ),ij = K ĝij

ĝ ij (e−U ),i (e−U ),j = K(e−U − 1) (1-12.11)


−U K i j
waaruit we oplossen e =1+ 4 ĝij x x , zodat

ĝij dxi dxj


ds2 = (1-12.12)
(1 + K i j 2
4 ĝij x x )

De corresponderende maximaal symmetrische ruimtes kunnen alle bekomen worden door inbedding
van een (pseudo-) sfeer in een (n+1)-dimensionale vlakke ruimte (voor een gedetailleerde discussie,
zie Weinberg).
Enkele bijzondere gevallen, die in de algemene relativiteitstheorie een belangrijke rol spelen,
zijn
(i) (n = 2)
ds2 = a2 [(dx1 )2 ± Σ2 (dx2 )2 ] (1-12.13)
met K en Σ(x1 , ǫ) als in 1-12.17. Vaak voorkomende vormen voor signatuur 2 en K < 0 zijn ook

ds2 = a2 (dx2 + cosh2 xdy 2 ) (1-12.14)

of
ds2 = a2 (dx2 + e2x dy 2 ) (1-12.15)
(ii) n = 3, s = 3 (b.v. een ruimtelijk hyperoppervlak in een 4-dimensionale lorentz-variëteit)

dx2 + dy 2 + dz 2
ds2 = (1-12.16)
[1 + K 2 2
4 (x + y + z )]
2 2

of, na overgaan op sferische coördinaten ρ, θ, φ door x = ρ sin θ cos φ, y = ρ sin θ sin φ, z = ρ cos θ:

ds2 = a2 [dr2 + Σ2 (dθ2 + sin2 θdφ2 )] (1-12.17)

met K = ǫa−2 en 
 sin r (ǫ = +1)
Σ(r, ǫ) = r (ǫ = 0)
sinh r (ǫ = −1)

9 Dat dit ook mogelijk is voor n = 3 wordt gegarandeerd door 1-12.10


1-12. ISOMETRIEËN 45

Hierbij is r gekoppeld aan de sferische coördinaat ρ door ρ = 2a tan 2r (ǫ = 1), ρ = 2atanh 2r


(ǫ = −1) of ρ = ar (ǫ = 0). Bovenstaande metrieken 1-12.17 spelen een fundamentele rol in de
kosmologie.
(iii) n = 4, s = 2
2 2 2 2
2 −dx4 + dx1 + dx2 + dx3
ds = (1-12.18)
[1 + K 1 2 + x2 2 + x3 2 − x4 2 )]2
4 (x
2 2 2 2
M.b.v. de coördinaattransformatie xa = 2X a /1 + [1 − K(X 1 + X 2 + X 3 − X 4 )]1/2 blijkt dat dit
2 2 2 2 2
precies de geı̈nduceerde metriek is in het hyperoppervlak X 1 + X 2 + X 3 − X 4 + kX 5 = kα2
2
(met K = kα en k = ±1) van een 5-dimensionale vlakke ruimte met metriek ds = dX 1 +
−2 2
2 2 2 2
dX 2 + dX 3 − dX 4 + kdX 5 .
Voor k = +1 bekomen we de de Sitter-ruimte. Vermeld hyperoppervlak wordt dan een hyper-
boloı̈de, waarop we coördinaten kunnen invoeren door

X 5 =α cosh(α−1 t) cos χ
X 4 =α sinh(α−1 t)
X 3 =α cosh(α−1 t) sin χ cos θ
X 2 =α cosh(α−1 t) sin χ sin θ cos φ
X 1 =α cosh(α−1 t) sin χ sin θ sin φ (1-12.19)

We bekomen dan

ds2 = −dt2 + α2 cosh2 (α−1 t)[dχ2 + sin2 χ(dθ2 + sin2 θdφ2 )] (1-12.20)

Met −∞ < t < ∞, 0 ≤ χ ≤ π, 0 ≤ θ ≤ π, 0 ≤ φ ≤ 2π overdekken deze coördinaten de ganse


hyperboloı̈de. Een coördinatenstelsel dat slechts de helft (X 4 + X 5 ≥ 0) overdekt, is gegeven door
4 5 i
t̃ = α log X +X
α , x̃i = XαX
4 +X 5 (i = 1, 2, 3), zodat

2 2 2 2
ds2 = −dt̃ + exp(2α−1 t̃)(dx˜1 + dx˜2 + dx˜3 ) (1-12.21)

Dit is de metriek van het z.g. steady state heelal10 .

10 zie ook Hoofdstuk 8-5


46 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

1-13 Uitgewerkte voorbeelden


In deze paragraaf laten we zien hoe, voor een gegeven metriek, de riemann-tensor, ricci-tensor enz.,
snel kunnen bepaald worden.

(i)
ds2 = dx2 + f (x)2 dy 2 (1-13.1)
Kies een orthonormale basis met
ω 1 =dx
ω 2 =f dy (1-13.2)

zodat g = ω 1 ⊗ ω 1 + ω 2 ⊗ ω 2 . Dan is dω 1 = 0 en dω 2 = fx dx ∧ dy = ffx ω 1 ∧ ω 2 . Van de


connectievormen dient enkel Γ12 beschouwd te worden, vermits Γ11 = Γ22 = 0. Uit de eerste
structuurvergelijkingen dω a = −Γa b ∧ ω b leiden we af (voor a = 1) dat Γ12 = λ(x)ω 2 . De
coëfficiënt λ volgt uit dezelfde vergelijkingen met a = 2 en levert Γ12 = −fx /f ω 2 . De kromming
bepalen we met de tweede structuurvergelijkingen:
Θ12 = dΓ12 + Γ1c ∧ Γc 2 = dΓ12
fxx 1
= − (fx /f )x + (fx /f )2 ω 1 ∧ ω 2 = − ω ∧ ω2
 
f
De enige niet-triviale component van de riemann-tensor is de ricci-scalar
fxx
R = R11 + R22 = −2 (1-13.3)
f
(= 2× de gauss-kromming).

(ii)
ds2 = e2t (−dt2 + dx2 ) + dy 2 + dz 2 (1-13.4)
P3
Kies een orthonormale basis zodat g = α=1 ω α ⊗ ω α − ω 4 ⊗ ω 4 en stel
ω 1 =et dx
ω 2 =dy
ω 3 =dz
ω 4 =et dt (1-13.5)
Er volgt dω 2 = dω 3 = dω 4 = 0 en dω 1 = e−t ω 4 ∧ ω 1 . Na een blik op de eerste structuurvergelij-
kingen gokken we dat Γ2a = Γ3a = 0 en Γ14 = λ(t)ω 1 . Hiermee is inderdaad dω 4 = 0, terwijl dω 1 =
−Γ1 b ∧ ω b = −Γ1 4 ∧ ω 4 resulteert in λ = e−t . De enig mogelijke niet-triviale component van de
kromming is Θ14 , waarvoor de tweede structuurvergelijkingen geven Θ14 = dΓ14 = d(e−t et dx) =
0, wat betekent dat de metriek 1-13.4 vlak is. Inderdaad, de coördinaattransformatie
t → t′ = et cosh x

(1-13.6)
x → x′ = et sinh x
1-13. UITGEWERKTE VOORBEELDEN 47

2 2
zet 1-13.4 om in de minkowski-metriek ds2 = −dt′ + dx′ + dy 2 + dz 2 .
N.B. Als men weet dat een metriek vlak is (b.v. door berekening van de kromming) , is het
vinden van een gepaste coördinaattransformatie, zoals 1-13.6, niet altijd even gemakkelijk. Zo is
de metriek

4v v2
ds2 = dx2 + dy 2 − 2dudv + dudx + 2 du2 (1-13.7)
x x

vlak (zie verder), maar is het vinden van een coördinaattransformatie naar de minkowski-vorm
niet triviaal...

(iii)

ds2 = −f (r)dt2 + h(r)dr2 + r2 (dθ2 + sin2 θdφ2 ) (1-13.8)

(f en h > 0 ondersteld). Dit is een z.g. statische en sferisch symmetrische metriek ; zie ook
Hoofdstuk 5. Kies opnieuw een orthonormale basis met nu ω 1 = h1/2 dr, ω 2 = rdθ, ω 3 = r sin θdφ
d
en ω 4 = f 1/2 dt. Met ′ = dr geldt dan

dω 1 =0 (1-13.9)
2 −1 −1/2 1 2
dω =r h ω ∧ω (1-13.10)
3 −1 −1/2 1 2 3
dω =r (h ω + cot θω ) ∧ ω (1-13.11)

1 f
dω 4 = h−1/2 ω 1 ∧ ω 4 (1-13.12)
2 f

Uit 1-13.9 en dω 1 = −Γ1 b ∧ ω b zouden we ons kunnen laten verleiden tot het besluit Γ1b = 0. Dan
is echter ook Γ21 = Γ31 = Γ41 = 0, wat niet consistent is met 1-13.10 - 1-13.12! Een betere gok lijkt
daarom Γ1b ∼ ω b (hiermee blijft nog steeds dω 1 = 0). Analoog stellen we op basis van 1-13.10 en
1-13.11 dat Γ23 ∼ ω 3 (dan is er immers geen ω 2 ∧ω 3 term in dω 2 = −Γ2 b ∧ω b , maar wél een ω 2 ∧ω 3
term in dω 3 = −Γ3 b ∧ ω b ). We stellen dus Γ12 = U ω 2 , Γ13 = V ω 3 , Γ14 = W ω 4 en Γ23 = Xω 3 .
De coëfficiënten U , V , W en X halen we onmiddellijk uit de eerste structuurvergelijkingen (let op:
Γ4 1 = +Γ14 )

Γ12 = − r−1 h−1/2 ω 2


Γ13 = − r−1 h−1/2 ω 3
1 f′
Γ14 = h−1/2 ω 4
2 f
Γ23 = − r cot θω 3
−1
(1-13.13)
48 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

De tweede structuurvergelijkingen geven nu


1
Θ12 = r−1 h−2 h′ ω 1 ∧ ω 2
2
1
Θ13 = r−1 h−2 h′ ω 1 ∧ ω 3
2
1  ′
Θ14 = (f h)−1/2 (f h)−1/2 f ′ ω 1 ∧ ω 4
2
Θ23 =r−2 (1 − h−1 )ω 2 ∧ ω 3
1 f′
Θ24 = r−1 h−1 ω 2 ∧ ω 4
2 f
1 −1 −1 f ′ 3
Θ34 = r h ω ∧ ω4 (1-13.14)
2 f
waaruit, m.b.v. 1-11.43, onmiddellijk volgt
1  ′
R11 =r−1 h−2 h′ − (f h)−1/2 (f h)−1/2 f ′
2
1 −1 −1 h′ f′
R22 = R33 = r h ( − ) + r−2 (1 − h−1 )
2 h f
1  ′
R44 =(rf h)−1 f ′ + (f h)−1/2 (f h)−1/2 f ′ (1-13.15)
2
en alle andere Rab = 0.
Oefening: bepaal voor bovenstaande metriek opnieuw de componenten van de ricci-tensor t.o.v.
de duale basis {dt, dr, dθ, dφ}, maar nu gebruik makend van de christoffel-symbolen en de relaties
1-10.6. Vergelijk de hoeveelheid rekenwerk met de hier gebruikte methode.

(iv) In de vorige voorbeelden werd uitsluitend gebruik gemaakt van orthonormale bases. In vele
toepassingen in de relativiteitstheorie maakt men ook gebruik van stijve bases, waarin de basisvec-
toren nul-vectoren zijn. Stel n = 4 en s = 2 en bekijk de orthonormale basis {E1 , E2 , E3 , E4 }.
De geı̈nduceerde metriek op de vectorruimte voortgebracht door E3 en E4 is lorentz, zodat we als
basis in deze deelruimte ook twee nul-vectoren e3 en e4 kunnen gebruiken, gewoonlijk genoteerd
als l en k:
1
k = e4 = √ (E4 + E3 )
2
1
l = e3 = √ (E4 − E3 ) (1-13.16)
2
Anderzijds is de geı̈nduceerde metriek op de vectorruimte voortgebracht door E1 en E2 positief
definiet, zodat we voor een basis van nul-vectoren noodzakelijk beroep moeten doen op complexe
vectoren e1 en e2 , die we gewoonlijk noteren als m en m:
1
m =e1 = √ (E1 − iE2 )
2
1
m =e2 = √ (E1 + iE2 ) (1-13.17)
2
1-13. UITGEWERKTE VOORBEELDEN 49

We noemen {ea } dan een (complex) nul-tetrad. Is {θa } de duale basis van {Ea } en {ω a } de duale
basis van {ea }, dan geldt dus
1
ω 4 = √ (θ4 + θ3 )
2
1
ω 3 = √ (θ4 − θ3 )
2
1 1
ω = √ (θ − iθ2 )
2
2
1
ω 1 = √ (θ1 + iθ2 ) (1-13.18)
2
Met αβ een korte schrijfwijze voor 21 (α ⊗ β + β ⊗ α)) kan de metriek dan geschreven worden als
2 2 2 2
g = θ1 + θ2 + θ3 − θ4
= 2ω 1 ω 2 − 2ω 3 ω 4 (1-13.19)
a
en heeft t.o.v. {ω } de componenten
 
0 1 0 0
1 0 0 0
gab = g ab

=  (1-13.20)
0 0 0 −1 
0 0 −1 0
Dit impliceert dat alle contracties van de basisvectoren 0 zijn, behalve
k a la = −1 en ma ma = 1 (1-13.21)
Het gebruik van dergelijke nul-tetrads reduceert de hoeveelheid rekenwerk nog verder, aangezien
Γ24 = Γ14 , Γ13 = Γ23 en bovendien Γ34 ∈ R, Γ12 ∈ i R.
We illusteren deze methode met de metriek 1-13.7, die we herschrijven als
v2 2v
ds2 = dx2 + dy 2 − 2du(− du − dx + dv) (1-13.22)
2x2 x
zodat
1
ω 1 = ω 2 = √ (dx + idy)
2
ω 3 = du
2v v2
ω 4 = dv − dx − 2 du (1-13.23)
x 2x
Er volgt dan
dω 1 = 0
dω 3 = 0
2 v v2
dω 4 = − dv ∧ dx − 2 dv ∧ du + 3 dx ∧ du
x x !x

v 3 2 1
= ω + (ω + ω 2 ) ∧ ω 4 (1-13.24)
x2 x
50 HOOFDSTUK 1. DIFFERENTIAALMEETKUNDIGE BEGRIPPEN

Schrijven we de eerste structuurvergelijkingen uit (let op: nu is Γ4 4 = −Γ34 en Γ2 2 = Γ12 ), dan


bekomen we

dω 1 =Γ12 ∧ ω 1 − Γ23 ∧ ω 3 − Γ24 ∧ ω 4


dω 3 = − Γ14 ∧ ω 1 − Γ24 ∧ ω 2 − Γ34 ∧ ω 3
dω 4 = − Γ13 ∧ ω 1 − Γ23 ∧ ω 2 + Γ34 ∧ ω 4 (1-13.25)

wat, na enig wikken en wegen, suggereert dat de niet-triviale connectievormen gegeven zijn door

Γ14 =αω 3
Γ13 =βω 4
Γ34 =γω 1 + γω 2 + aω 3 (1-13.26)

met α, β, γ ∈ C en a ∈ R. Subsitutie toont dat hiermee aan 1-13.24 voldaan is, op voorwaarde
dat α = β = γ = √12 x−1 en a = vx−2 . Berekening van Θ12 , Θ13 , Θ14 en Θ34 (alle andere Θab
zijn triviale combinaties van deze vier!) toont dat Θab = 0, zodat de metriek vlak is.

(v) Oefening:
ds2 = 2dζdζ − 2dudv − 2Hdu2 (1-13.27)
met H een reële functie waarvoor geldt
x + iy
H = H(u, ζ, ζ) en ζ = √ (1-13.28)
2
is de metriek van z.g. vlakke gravitatiegolven.
Herschrijf ds2 in de vorm 1-13.19 met

ω 1 =dζ
ω 3 =du
ω 4 =dv + Hdu (1-13.29)

Als (m, m, l, k) de duale basis is van {ω a }, bewijs dan dat de ricci-tensor voldoet aan

Rab = 2H,ζζ ka kb (1-13.30)

Toon ook aan dat ka;b = 0 (we noemen k dan een constant vectorveld ).
Hoofdstuk 2

Beperkte Relativiteitstheorie

In dit hoofdstuk wordt een overzicht gegeven van de beperkte relativiteitstheorie, met de nadruk
op een aantal theoretische aspecten, die in de rest van de cursus nog aan bod komen. Er wordt
niet ingegaan op experimenten (Michelson-Morley, ...) of fysische effecten (Doppler, aberratie,
Compton,...), die enerzijds wellicht gekend zijn en anderzijds ook van weinig belang zijn voor de
hierop volgende hoofdstukken. Bovendien is hierover voldoende literatuur beschikbaar.

2-1 Inleiding

Op het einde van de 19de eeuw werd de newtoniaanse mechanica met zware problemen geconfron-
teerd. In 1864 werden door Maxwell de vergelijkingen opgesteld voor het electromagnetisme:

~ =4πρ
∇.D
~ =0
∇.B
~
~ = − 1 ∂B
∇×E
c ∂t
~
~ = 1 ∂ D + ~j
∇×H (2-1.1)
c ∂t

Deze vergelijkingen waren niet langer invariant onder de galilei-transformaties: Maxwell’s theorie
van het electromagnetisme leek dus onverenigbaar met het relativiteitsbeginsel dat zegt dat de
wetten van de fysica voor alle inertiële waarnemers identiek zouden zijn. Einstein’s grandioze
bijdrage tot de fysica bestond erin van in te zien dat deze schijnbare onverenigbaarheid verband
hield met een derde —verborgen— hypothese, namelijk dat het mogelijk is om van elk tweetal
gebeurtenissen te beslissen of ze al dan niet gelijktijdig zijn. Terzijde merken we op dat reeds in

51
52 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

1881 door Voigt een stelsel van transformaties ontdekt werd,


r
′ vx v2
t =(t − 2 )/ 1 − 2
c c
r
v 2
x′ =(x − vt)/ 1 − 2
c
y ′ =y
z ′ =z (2-1.2)

waaronder Maxwell’s vergelijkingen wél invariant waren! Dit stelsel van transformaties werd in
het begin bekeken als een mathematische curiositeit, maar kreeg snel een respectabele status en
evolueerde uiteindelijk tot het mathematisch fundament van de relativiteitstheorie.
In plaats van dus aan de maxwellvergelijkingen te sleutelen en ze aan te passen aan het newton-
iaanse wereldbeeld, zette Einstein dit wereldbeeld opzij en gaf Maxwell’s electrodynamica een
sleutelpositie in de nieuwe theorie. Aan de basis van de theorie lag het Relativiteitsbeginsel :

1. de wetten van de dynamica, zowel als van het electromagnetisme, nemen dezelfde vorm aan
voor een gepriviligieerd stelsel van waarnemers, de zgn. inertiële waarnemers

2. de snelheid van het licht in vacuum is dezelfde voor alle inertiële waarnemers 1

1 te motiveren a.d.h.v. het experiment van Albert Michelson en Edward Morley 1887; een moderne versie (Brillet

en Hall 1978) maakt gebruik van een He-Ne laser en een staande golf in een caviteit: de newtoniaanse additiewet
van de snelheden zou een frequentieverschil ∆ν/ν ≈ 10−8 moeten geven, wat schril afsteekt tegen het experimentele
resultaat ∆ν/ν ≈ (1.5 ± 2.5)10−15 !
2-2. LORENTZ-TRANSFORMATIES 53

2-2 Lorentz-transformaties
Bekijk twee inertiële waarnemers A en A′ , uitgerust met identieke klokken, zò dat A′ zich met
constante snelheid v verplaatst langs de x-as van A. Beide waarnemers synchroniseren hun klokken,
zodat t = t′ = 0 op het ogenblik dat ze samenvallen.2

A
t3

A’

p t’2

t1

x=x’=t=t’=0

Figuur 2.1:

Stel nu dat A op tijdstip t1 een lichtsignaal zendt naar A′ : A′ ontvangt dit op t2 ′ en zendt het
terug naar A, die het gereflecteerde signaal ontvangt op t3 . Omwille van de symmetrie van het
experiment (elke waarnemer ziet de andere met dezelfde snelheid wegvliegen en de lichtsnelheid
is voor beide waarnemers gelijk) moet een functie f bestaan zodat t2 ′ = f (t1 ) en t3 = f (t2 ′ ),
t.t.z. f ◦ f (t1 ) = t3 . Kent nu A aan de gebeurtenis, of event, P de coördinaten (t, x) toe, dan is
t1 = t − xc = t(1 − vc ) en t3 = t + xc = t(1 + vc ), zodat met
s
1 + v/c
k= (2-2.1)
1 − v/c

voor alle t1 geldt dat


f ◦ f (t1 ) = k 2 t1 (2-2.2)
Men kan aantonen dat de enige oplossing van deze functionele vergelijking (voor continu differen-
tieerbare f ) gegeven wordt door
f (t) = kt (2-2.3)
Oefening: bewijs dit!
2 De hier gevolgde manier om de lorentz-transformaties te introduceren is te danken aan G.J. Whitrow en werd

vooral gepopulariseerd door H. Bondi.


54 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

Beschouwen we vervolgens een gebeurtenis E die niet gelegen is op de wereldlijn van A of A′ :


A en A′ kennen door middel van lichtsignalen, uitgezonden en ontvangen op de respectievelijke

A t+x/c A’

t’+x’/c
E

t’-x’/c
t-x/c

Figuur 2.2:

tijdstippen t − x/c, t + x/c, t′ − x′ /c, t′ + x′ /c, aan E de coördinaten (t, x) resp. (t′ , x′ ) toe. Zoals
hiervoor aangetoond, geldt dan
t2 ′ ≡ t′ − x′ /c =k(t − x/c) ≡ kt1
t3 ≡ t + x/c =k(t′ + x′ /c) ≡ kt3 ′ (2-2.4)
waaruit we, m.b.v. 2-2.1 de 1+1 dimensionale lorentz-transformaties bekomen:
t − vx/c2
t′ = p
1 − v 2 /c2
x − vt
x′ = p (2-2.5)
1 − v 2 /c2
Noteer dat de inverse transformatie van 2-2.5 gewoon gegeven wordt door v te vervangen door −v
en dat voor |v| << c de galilei-transformaties (t′ = t en x′ = x − vt) bekomen worden.
Vanaf nu werken we in eenheden waarvoor c = 1 en stellen we γ = (1 − v 2 )−1/2 . Er geldt dan
t′ =γ(t − vx)
x′ =γ(x − vt) (2-2.6)
Het is duidelijk dat deze transformaties een 1-parameter groep vormen. Immers, als
t′ − x′ =k12 (t − x)
−1
t′ + x′ =k12 (t + x)
2-2. LORENTZ-TRANSFORMATIES 55

en

t′′ − x′′ =k23 (t′ − x′ )


−1 ′
t′′ + x′′ =k23 (t + x′ )

dan is

t′′ − x′′ =k13 (t − x)


−1
t′′ + x′′ =k13 (t + x)

met
k13 = k12 k23 (2-2.7)
q
1+v12
Hiermee vinden we nu onmiddellijk de additie-wet der snelheden: stellen we k12 = 1−v12 etc.,
dan volgt dat
v12 + v23
v13 = (2-2.8)
1 + v12 v23
Tevens volgt uit t′ − x′ = k(t − x), t′ + x′ = k −1 (t + x), y ′ = y en z ′ = z dat de uitdrukking

−t2 + x2 + y 2 + z 2 (2-2.9)

dezelfde is voor alle inertiële waarnemers F en F ′ , die op t = t′ = 0 samenvallen op x = x′ = 0


en die t.o.v. elkaar éénparig bewegen langs de x-as. Vermits echter x2 + y 2 + z 2 invariant is onder
rotaties, is dit te veralgemenen tot willekeurige inertiële waarnemers die op t = t′ = 0 samenvallen.
We noemen daarom 2-2.9 een lorentz-invariant: als twee inertiële waarnemers, die op t = t′ = 0
samenvallen, aan een gebeurtenis E de coördinaten (t, x, y, z), resp. (t′ , x′ , y ′ , z ′ ) toekennen, dan
geldt dat
2 2 2 2
−t2 + x2 + y 2 + z 2 = −t′ + x′ + y ′ + z ′ (2-2.10)
We beschouwen vervolgens waarnemers A en A′ , waarvan de wereldlijnen niet noodzakelijk snijden
op t = t′ = 0, en die aan twee gebeurtenissen E1 en E2 coördinaten (t1 , x1 , y1 , z1 ), (t2 , x2 , y2 , z2 )
resp. (t′ 1 , x′ 1 , y ′ 1 , z ′ 1 ) en t′ 2 , x′ 2 , y ′ 2 , z ′ 2 toekennen. Door middel van translaties van de oorsprong
zijn deze waarnemers te associëren met waarnemers Ã1 en Ã2 , die aan E1 en E2 de coördinaten
(0, 0, 0, 0), t2 − t1 , x2 − x1 , y2 − y1 , z2 − z1 resp. (0, 0, 0, 0) en (t′ 2 − t′ 1 , x′ 2 − x′ 1 , y ′ 2 − y ′ 1 , z ′ 2 − z ′ 1 )
toekennen, zodat t.g.v. voorgaande opmerking

− (t2 − t1 )2 + (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2


(2-2.11)
= −(t′ 2 − t′ 1 )2 + (x′ 2 − x′ 1 )2 + (y ′ 2 − y ′ 1 )2 + (z ′ 2 − z ′ 1 )2

een invariant is voor alle inertiële waarnemers.


De invariant 2-2.11 heeft dus een duidelijke fysische betekenis:

de eigentijd ∆τ verlopen tussen de gebeurtenissen E1 en E2 is precies de tijd aangeduid door


de klok van een inertiële waarnemer F (die zijn klok zò heeft afgesteld dat t = 0 in E1 ) op het
ogenblik dat hij samenvalt met E2 :
2
∆τ 2 = ∆t′ = ∆t2 − ∆x2 − ∆y 2 − ∆z 2 (2-2.12)
56 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

2-3 Minkowski-diagrammen
Uit vorige paragraaf volgt dat het oppervlak

−t2 + x2 + y 2 + z 2 = 0 (2-3.1)

een belangrijke rol speelt in de beperkte relativiteitstheorie. Dit is de zgn. lichtkegel in de oorsprong
O en is de verzameling van de punten die uit O bereikbaar zijn m.b.v. lichtsignalen (immers licht
heeft snelheid 1, zodat t = (x2 + y 2 + z 2 )1/2 ). We stellen de lichtkegel gewoonlijk voor door 1
dimensie weg te laten: Noteer dat de raaklijnen aan de wereldlijnen van testdeeltjes steeds een
hoek < 45o maken met de t-as (want |v| < 1)! Een nog eenvoudiger voorstelling bekomen we

wereldlijn van een


deeltje (mKo) door O

y
O

Figuur 2.3: lichtkegel

door twee dimensies weg te laten. De resulterende ‘1+1 dimensionale minkowski-diagrammen’ zijn
dikwijls nuttig om causale verbanden te illustreren: Voor de waarnemer F (t, x) volgen de drie

t’

E1

E2 x’

E3
x

Figuur 2.4: 1+1 minkowski- diagram


2-3. MINKOWSKI-DIAGRAMMEN 57

t’

l’
l’ > l

x’

l
x

t’

l’ < l ?
l

l’
x’

Figuur 2.5: staaf (lengte l) is in rust t.o.v. waarnemer A′

gebeurtenissen E1 , E2 en E3 op de gebeurtenis O. Voor de waarnemer F ′ (t′ , x′ ) gaat E3


echter aan O vooraf. Er bestaat dus geen causaal verband tussen O en E3 (of O en E2 ), maar
wel tussen O en E1 : hoe snel F ′ zich ook beweegt, steeds zal E1 zich binnen de zgn. toekomstige
lichtkegel van O bevinden. We zeggen daarom dat O causaal aan E1 voorafgaat, dat E1 in de
causale toekomst van O ligt, of dat O in het causaal verleden van E1 ligt (dat OE12 < 0 is duidelijk
een invariante uitspraak).
Enige voorzichtigheid bij het ‘lezen’ van minkowski-diagrammen is wel nodig. Bekijk b.v. de
inconsistentie die ontstaat bij de volgende ‘aanschouwelijke’ voorstelling van de fitzgerald-lorentz-
contractie: (waarnemer A′ beweegt met snelheid v t.o.v. waarnemer A). Figuur 2.5 (a) suggereert
(terecht trouwens) dat l < l′ . Figuur 2.5 (b) (getekend vanuit het gezichtspunt van A′ ) daarentegen
suggereert dat l′ < l! De oorzaak is te zoeken in het feit dat de standaard metrische relaties van ons
blad papier geen correcte weergave leveren van de pseudo-metrische relaties in de minkowski-ruimte.

Om uit beide diagrammen de correcte conclusie te trekken, moeten zowel l als l′ in elke figuur
vergeleken worden met de lengtes van de eenheidsvectoren ex en ex ′ : deze zijn te bekomen door de
58 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

2 2
doorsnede te bepalen van de hyperbolen x2 − t2 = x′ − t′ = 1 met de rechten t = 0 resp. t′ = 0.

Figuur 2.6: correcte interpretatie

In beide diagrammen vinden we dan dat l/OA = 1 < l′ /OA′ .

Er wordt soms beweerd dat de beperkte relativiteitstheorie zich enkel zou lenen tot de beschrij-
ving van waarnemingen voor onderling eenparig bewegende waarnemers. Dit is echter niet het
geval! Bekijk b.v. een deeltje dat zich met veranderlijke snelheid v = dx
dt verplaatst langs de x-as
van een inertiële waarnemer F . We definiëren3 dan de eigentijd, gemeten door een klok die met
het deeltje meebeweegt, door de voorwaarde dat deze klok op elk tijdstip P ‘even snel tikt’ als de
klok van een inertiële waarnemer F ′ die in P met het deeltje ogenblikkelijk meebeweegt:
3 dat een ideale fysische klok gehoorzaamt aan deze eigenschap en dus ongevoelig is voor de lokale versnelling is

een ver-reikende hypothese, waarvan de draagwijdte pas in volgend hoofdstuk zal duidelijk worden; we beklemtonen
’ideale’, aangezien echte klokken wél degelijk gevoelig zijn voor lokale versnellingen (dit laatste is echter eerder een
technisch dan een fysisch probleem!)
2-3. MINKOWSKI-DIAGRAMMEN 59

Wereldlijn van een niet-éénparig


bewegend deeltje

Wereldlijn van een waarnemer voor


wie het deeltje ogenblikkelijk in rust is in P

Figuur 2.7:


We stellen dus dt′ = 1, zodat m.b.v. 2-2.12

dτ dτ dt′
= ′ = (1 − v 2 )1/2 (2-3.2)
dt dt dt
en we definiëren tenslotte de versnelling jP van het deeltje in P door
d2 x′ dv ′
jP = |P = |P (2-3.3)
dt′ 2 dt′
Om jP uit te drukken in functie van v en zijn afgeleiden naar t is enige voorzichtigheid nodig:
we voeren eerst een inertiële waarnemer F ′′ in, die met snelheid w beweegt t.o.v. F en voor
′′
v ′′ +w
wie het deeltje beweegt met veranderlijke snelheid v ′′ = dx dx
dt′′ . Dan is v = dt = 1+v ′′ w en dus
2 ′′
dv (1−w ) dv dt′′ dv ′′ dv ′
dt = (1+v ′′ w)2 dt′′ dt . Laten we F ′′ en F ′ samenvallen in P , dan is v ′′ = v ′ = 0 en dt′′ = dt′ = jP ,
zodat (in P )
dv
= (1 − v 2 )j(1 − v 2 )1/2
dt
en dus  
d v
j= (2-3.4)
dt (1 − v 2 )1/2
dxi dt
Mits invoering van de vier-snelheid (zie ook paragraaf 2.5) u door ui = dτ = v i dτ (zodat ui ui =
−1), laat deze uitdrukking zich in het algemeen herschrijven als
duα dτ
jα = = aα , (2-3.5)
dt dt
i
waarbij ai = ui,j uj = du
dτ de componenten zijn van de relativistische versnellingsvector. M.a.w. er
geldt (vergelijk ook met uα = γv α )
aα = γj α . (2-3.6)
60 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

Oefening: toon aan dat een deeltje, dat vanuit rust vertrekt in (t = 0, x = 0) en dat onderhevig
is aan een constante versnelling j, voldoet aan
1
t = sinh(jτ )
j
1
x = (cosh(jτ ) − 1) (2-3.7)
j
en dus nooit sneller zal bewegen dan het licht! Noteer echter wel dat dit niet impliceert dat

Figuur 2.8:

lichtsignalen dit deeltje steeds kunnen ‘inhalen’: i.h.b. kan vanuit het gearceerde deel van de
figuur geen communicatie naar het deeltje plaats hebben! We noemen de rechte t = x + 1/j
daarom een event horizon 4 .

4 zie ook Hoofdstuk 7-4


2-4. MINKOWSKI-METRIEK 61

2-4 Minkowski-metriek
We keren opnieuw terug naar 2-2, waar we aantoonden dat in de omgeving van elk punt O op
invariante wijze een afbeelding Φ : M → R kan gedefinieerd worden, door voor een willekeurig
inertieel referentiestelsel Φ(t, x, y, z) te bepalen als5
Φ(t, x, y, z) = −t2 + x2 + y 2 + z 2 (2-4.1)
Deze afbeelding voldoet (voor een willekeurig referentiestelsel xi ) aan
∂Φ
|0 = 0 (2-4.2)
∂xi
en laat toe een bilineaire afbeelding g te construeren
1 ∂2Φ i j
g : T02 (M) × T02 (M) → R : (u, v) 7→ g(u, v) = uv (2-4.3)
2 ∂xi ∂xj
Oefening: toon aan, m.b.v. 2-4.2, dat deze definitie onafhankelijk is van het gebruikte referentie-
stelsel.
Kiezen we i.h.b. inertiële coördinaten t, x, y en z, dan reduceert 2-4.3 zich tot
g(u, v) = ηij ui v j (2-4.4)
met  
−1 0 0 0
0 1 0 0
η=
0
 (2-4.5)
0 1 0
0 0 0 1
zodat g duidelijk een lorentz-metriek is (zie 1-11). We noemen g de minkowski-metrische tensor
of de minkowski-metriek. In inertiële coördinaten xi geldt dus
g = ηij dxi ⊗ dxj (2-4.6)
wat ook genoteerd wordt (zie 1-11.5) als
ds2 = ηij dxi dxj (2-4.7)
2
(Het linkerlid wordt in overeenstemming met 2-2.12 vaak ook genoteerd als −dτ ).
M.b.v. de minkowski-metriek kunnen vectoren x ingedeeld worden in de klassen van tijd-achtige,
ruimte-achtige en nul vectoren, al naargelang x.x < 0, > 0 of = 0.
Een belangrijke vector is de (vier-)snelheid u van een deeltje met wereldlijn gegeven door xi =
i √ dy dz
xi (τ ). Deze vector heeft componenten ui = dx 2 2
v |2 en ~v = ( dx
dτ , met dτ = dt 1 − v , v = |~ dt , dt , dt )
(τ is dan de eigentijd langs de wereldlijn van het deeltje).

In wat voorafging hebben we de metrische structuur van de minkowski-ruimte-tijd gededuceerd


uit de (fysische) postulaten van de beperkte relativiteitstheorie. Cruciaal hierbij was de rol die
werd gespeeld door de bijzondere klasse van inertiële waarnemers, die toelieten om de functie Φ te
bepalen.
Een alternatieve, meer mathematische, benadering bestaat erin de lorentz-transformaties en
het bestaan van de klasse van inertiële waarnemers te deduceren uit de volgende postulaten:
5 sommige auteurs noemen Φ de wereldfunctie
62 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

1. De minkowski-ruimte-tijd (M, g) is een 4-dimensionale differentiaalvariëteit, voorzien van


een vlakke lorentz-metriek g (i.e. ∇c gab = 0 en Ra bcd = 0).
2. Langs elke (!) tijd-achtige kromme is een parameter τ gedefinieerd door dτ 2 = −gij dxi dxj .
Deze parameter is de eigentijd, gemeten door ideale klokken die langs deze krommen bewegen.
3. In (M, g) bestaan twee gepriviligieerde klassen van krommen: dit zijn de tijd-achtige geode-
ten (de ‘wereldlijnen van vrije, massieve, deeltjes’) en anderzijds de nul-geodeten (de ‘wereld-
lijnen van fotonen’).
Er bestaan dan steeds lokale coördinaten waarin gij = ηij en waarin deze bijzondere wereldlijnen
gegeven
P zijn door x0 = t, xα = v α t + aα , met aα en v α (α = 1, 2, 3) constanten en met
2 α 2
v = α (v ) < 1 of = 1.
We kunnen vervolgens aantonen dat de isomorfismen van de minkowski-ruimte-tijd precies
gegeven zijn door de inhomogene lorentz-transformaties. Het klassieke bewijs verloopt alsvolgt:
′ ′
invariantie van ηij dxi dxj onder de gezochte coördinaattransformaties xi = xi (xj ) betekent dat
′ ′
∂xi ∂xj
ηi′ j ′ = ηlm
∂xl ∂xm
Partieel afleiden van deze betrekking naar xn , levert na cyclisch permuteren van l, m en n en het
nemen van enkele lineaire combinaties, dat
′ ′
∂ 2 xi ∂xj
ηi′ j ′ =0
∂xn ∂xl ∂xm
Onderstellen we dat de jacobiaan van de transformatie verschillend van 0 is, dan reduceert dit zich

∂ 2 xi i′ i′ ′ ′ ′ ′
tot ∂x n ∂xl = 0, zodat constanten L j en a bestaan waarvoor xi = Li j xj +ai of xi = Li j ′ xj +bi .

De fysische betekenis van de coëfficiënten volgt door een referentiestelsel (xα , t′ ) te beschouwen,
waarin een deeltje, dat met snelheid ~v beweegt t.o.v. (xα , t),in rust is: dan is dt = L0 0′ dt′ en
dxα = Lα 0′ dt′ , zodat L0 0′ = γ en Lα 0′ = γv α .
Een ‘moderner’ bewijs bestaat erin eerst de generatoren van deze isomorfismen te zoeken,
namelijk de oplossingen van de killing-vergelijkingen X(i,j) = 0 in de minkowski-ruimte-tijd.
Oefening: Toon aan dat de oplossingen van deze vergelijkingen gegeven worden door
X 0 = −X0 =a1 x1 + a2 x2 + a3 x3 + c0
X 1 = X1 =a1 x0 + b1 x2 − b3 x3 + c1
X 2 = X2 =a2 x0 + b2 x3 − b1 x1 + c2
X 3 = X3 =a3 x0 + b3 x1 − b2 x2 + c3
met ai , bi en ci constanten.
De killing-vectoren van de minkowski-ruimte-tijd liggen bijgevolg in de opspanning van de
volgende 10 vectoren:

T=
∂x0

Sα = α
∂x
∂ ∂
Rα =ǫαβγ (xβ γ
− xγ β )
∂x ∂x
0 ∂ α ∂
Bα = − x −x (2-4.8)
∂xα ∂x0
2-4. MINKOWSKI-METRIEK 63

Elk van deze vectoren genereert een isomorfisme φt (in de notatie van 1-8), dat we nu noteren als
T , Sα , Rα en Bα . We bepalen deze isomorfismen m.b.v. de methode besproken in 1-8.

(1) Voor T lossen we eerst dy 0 /dλ = 1, dy α /dλ = 0 op onder de beginvoorwaarden y i (0) = X i (X i


zijn de coördinaten van een gegeven punt P ) en vinden y 0 (λ) = λ + X 0 en y α (λ) = X α . Hieruit
volgt dat
T (P (X 0 , X α )) = P ′ (X 0 + λ, X α )
Bijgevolg is T een tijdstranslatie.
(2) Analoog zijn Sα de drie ruimtelijke translaties.
(3) We bekijken b.v. R3 : oplossen van dy 1 /dλ = −y 2 , dy 2 /dλ = y 1 , dy 0 /dλ = dy 3 /dλ = 0 geeft,
onder dezelfde beginvoorwaarden als hierboven, y 1 = X 1 cos λ − X 2 sin λ, y 2 = X 1 sin λ + X 2 cos λ,
y 3 = X 3 , y 0 = X 0 . Bijgevolg geldt dat

R3 (P (X 0 , X α )) = P ′ (X 0 , X 1 cos λ − X 2 sin λ, X 1 sin λ + X 2 cos λ, X 3 )

zodat R3 een rotatie voorstelt in het (1, 2)-vlak, en analoog voor R1 en R2 .


(4) Bekijken we tenslotte B1 : oplossen van dy 0 /dλ = −y 1 , dy 1 /dλ = −y 0 , dy 2 /dλ = dy 3 /dλ = 0
geeft y 0 = X 0 cosh λ − X 1 sinh λ, y 1 = −X 0 sinh λ + X 1 cosh λ, y 2 = X 2 , y 3 = X 3 , zodat

B1 (P (X 0 , X α )) = P ′ (X 0 cosh λ − X 1 sinh λ, −X 0 sinh λ + X 1 cosh λ, X 2 , X 3 )

Dit zijn√ precies de lorentz-transformaties 2-2.6 (of boosts langs de x-as), want met v = tanh λ is
′ ′
γ = 1/ 1 − v 2 = cosh λ, zodat inderdaad X 0 = γ(X 0 − X 1 v) en X 1 = γ(X 1 − X 0 v).

De verzameling van alle lorentz-transformaties heeft duidelijk een groepsstructuur, voor ai 6= 0


de poincaré-groep of de inhomogene lorentz-groep genoemd. Voor ai = 0 bekomen we de homogene
lorentz-groep. Een deelgroep hiervan, de eigenlijke lorentz-groep genoemd, wordt gevormd door
′ ′ ′ ′ ′
die matrices Li j waarvoor detLi j = +1 en L0 0 ≥ 1 (noteer dat −1 = η00 = ηi′ j ′ Li 0 Lj 0 im-
′ 3 ′
pliceert dat (L0 0 )2 = 1 + α′ =1 (Lα 0 )2 ≥ 1). Deze eigenlijke lorentz-transformaties zijn volkomen
P
gekarakteriseerd door het feit dat ze (1) oriëntatie behoudend zijn en (2) toekomst gerichte vec-
toren afbeelden op toekomst gerichte vectoren: u.Lu < 0 voor alle tijd-achtige u. Eigenlijke
lorentz-transformaties die de tijdsas behouden (Le0 = e0 ) vormen precies de speciale rotatiegroep
SO(3, R). Alle andere eigenlijke lorentz-transformaties zijn producten van één boost en één
dergelijke rotatie. Voor twee gegeven lorentz-tetrads (e0 , eα ) en (e0′′ , eα′′ ) kunnen we immers
eerst e0 op e0′′ afbeelden d.m.v. een boost, om vervolgens het tetrad (e0′′ , eα′ ) d.m.v. een rotatie
af te beelden op (e0′′ , eα′′ ).
N.B. In al wat voorafging werd stilzwijgend aangenomen dat de globale topologie van de
minkowski-ruimte-tijd gegeven is door de standaardtopologie van R4 . Identificeren we hierin echter
b.v. de t = ±1 hypervlakken, dan ontstaat een lokaal equivalente ruimte-tijd, die we de minkowski-
cilinder noemen, maar waarin gesloten tijd-achtige krommen (met alle erbij horende paradoxale
toestanden) voorkomen: in de minkowski-cilinder omvat zowel de toekomstige als de verleden
lichtkegel van elk punt de ganse ruimte-tijd!

Oefeningen: bewijs de volgende eigenschappen


64 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

• Twee nul-vectoren zijn parallel als en slechts als ze orthogonaal zijn.


Vraagje: hoe verklaren we dan het 1+1-diagram van figuur 2.9, waarin de vectoren k = e0 +e1
en l = e0 − e1 duidelijk niet parallel zijn?

Figuur 2.9: twee niet-parallelle nulvectoren

• Twee ruimte-achtige vectoren zijn nooit tegelijk parallel en orthogonaal.

• Twee tijd-achtige vectoren zijn nooit orthogonaal.

• Een ruimte-achtige vector en een nul-vector kunnen wel orthogonaal zijn, maar nooit parallel.

• Een tijd-achtige vector en een nul-vector kunnen nòch parallel, nòch orthogonaal zijn.
2-5. RELATIVISTISCHE MECHANICA 65

2-5 Relativistische Mechanica


2-5.1 Inleiding
Bekijken we eerst de beweging van een deeltje met rustmassa m0 en snelheid
(1, ~v )
u= √ (2-5.1)
1 − v2
Vermits m0 een invariant is, is
p = m0 u (2-5.2)
een vector, die we het impuls noemen. De projectie van deze vector in de 3-dimensionale rustruimte
van de waarnemer,
m0
p~ = √ ~v (2-5.3)
1 − v2
noemen we het 3-impuls en
m0
m (of E) = p0 = √ (2-5.4)
1 − v2
de relativistische massa of energie. Deze terminologie komt niet uit de lucht vallen, want p~ treedt
op in een behoudswet, die precies overeenkomt met de wet van behoud van impuls in de klassieke
mechanica. De bewegingsvergelijkingen voor één deeltje zijn immers af te leiden (zie 1-11) uit een
actiebeginsel met actie S gedefinieerd door
Z τ2
S=− m0 dτ (2-5.5)
τ1

of (vermits dτ 2 = (1 − v 2 )dt2 )
Z t2
S= L dt
t1

met L = −m0 (1 − v 2 )1/2 . Voor een bepaalde waarnemer is de relativistische mechanica van een
systeem van niet-interagerende deeltjes dus niets anders dan de klassieke mechanica van een stelsel
deeltjes met lagrangiaan X
2
L=− m0(n) (1 − v(n) )1/2 (2-5.6)
n

Het canoniek 3-impuls van een dergelijk systeem wordt gegeven door
∂L
p~(n) =
∂~v(n) (2-5.7)
2
=m0(n) (1 − v(n) )−1/2~v(n) = m(n)~v(n)

in overeenstemming met 2-5.3, terwijl de hamiltoniaan bekomen wordt als


X X
H= p~(n) .~v(n) − L = m(n) (2-5.8)
n n

in overeenstemming met 2-5.4. Voor een systeem van niet-interagerende deeltjes (of voor een
systeem van deeltjes die interageren via ideale, gelocaliseerde, punt-interacties) reduceert de wet
van behoud van energie zich dus tot het behoud van relativistische massa, terwijl de invariantie
66 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

van de actie onder translaties resulteert in het behoud van het totale 3-impuls. Treden er wél
interacties tussen de deeltjes op, dan zijn totale relativistische massa en totaal 3-impuls (zoals
hierboven gedefinieerd) niet langer behouden grootheden. Beide behoudswetten zijn dan echter
wel te veralgemenen door de invoering van de energie-impulstensor van het systeem (zie verder).
Definiëren we vervolgens, in analogie met de klassieke mechanica, de relativistische kracht als
de vector
dp
F = (F 0 , F~ ) = (2-5.9)

dt

dan bekomen we door projectie in de rustruimte van de waarnemer, wegens dτ = 1/ 1 − v 2 ,

1 d
√ (m~v ) = F~ (2-5.10)
1 − v dt
2

Het analogon van de newtoniaanse 3-kracht ~f is dus niet F~ , maar wel


p
1 − v 2 F~ = f~ (2-5.11)

Hieruit volgt dan ook het klassieke resultaat dat de arbeid, die nodig is om een deeltje in rust te
versnellen tot een snelheid v, gegeven wordt door
x t t
d
Z Z Z
∆E = f dx = f v dt = (mv)v dt
dt
Z0 v 0 0
(2-5.12)
= v d[m0 v(1 − v 2 )−1/2 ]
0
=m0 [(1 − v 2 )−1/2 − 1] = m − m0

Noteren we tenslotte nog dat uit de invariantie van p2 en uit p = (m, ~p) volgt dat
2
m2 (of E 2 ) = m20 + ~p (2-5.13)

(wat zich voor een foton, met m0 = 0, reduceert tot E = |~p|). Noteer ook dat de relativistische
massa (of energie) van een deeltje met impuls p, gemeten door een waarnemer met snelheid uobs ,
gegeven wordt door
E = −p.uobs (2-5.14)
(deze uitdrukking is immers een invariant, die zich in het ruststelsel van de waarnemer reduceert
tot −p0 u0obs = −p0 = p0 = E).

2-5.2 Energie-impulstensor van een deeltjeswolk


We introduceren nu de zgn. energie-impulstensor door een wolk van niet-interagerende (of via
punt-interacties interagerende) deeltjes te bekijken, elk met rustmassa m0(n) en met impuls p(n) .

Definiëren we eerst de totale energie-impuls-dichtheid

pi (n) δ 3 (~x − ~x(n) (t))


X
T i0 = (2-5.15)
n
2-5. RELATIVISTISCHE MECHANICA 67

evenals de flux van deze grootheid

X dxα (n) 3 ~ ~
T iα = pi (n) δ (x − x(n) (t)) (2-5.16)
n
dt

en de deeltjesstroom

X dxi (n)
Ni = δ 3 (~x − ~x(n) (t)) (2-5.17)
n
dt

waarbij ~x(n) (t) de positievector is van het n-de deeltje en δ 3 de 3-dimensionale dirac-distributie
( R3 f (~x)δ 3 (~x − ~y ) d3 x = f (~y )). Beide uitdrukkingen 2-5.15 en 2-5.16 kunnen dan verenigd worden
R

in de definitie

X dxj (n) 3 ~ ~
T ij = pi (n) δ (x − x(n) (t)) (2-5.18)
n
dt

dxi (n)
Dan is, vermits pi (n) (t) = E(n) dt met E(n) = γ(n) m0(n) , T ij = T ji :

X pi (n) pj (n)
T ij = δ 3 (~x − ~x(n) (t)) (2-5.19)
n
E(n)

Bovendien zijn T ij de componenten van een tensor, want

+∞
XZ dxj (n) 4 k
T ij = pi (n) (t) δ (x − xk (n) (τ )) dτ (2-5.20)
n −∞ dτ

en δ 4 (xk − xk(n) (τ )) = δ(t − τ )δ 3 (~x − ~x(n) (τ )) is een lorentz-invariant6 . We noemen de symmetrische


tensor T = T ij ei ⊗ ej de energie-impulstensor van de deeltjeswolk. Voor de deeltjesstroom geldt
analoog dat

+∞
i
XZ dxi (n) 4 k
N = δ (x − xk (n) (τ )) dτ (2-5.21)
n −∞ dτ

6 onder 1
een lineaire transformatie x′ = Λx is immers δ 4 (x′ ) = |detΛ|
δ 4 (x), met |detΛ| = 1 voor een lorentz-
transformatie
68 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

Vermits
∂T iα X i dxα (n) ∂ 3 ~ ~
= p (n) δ (x − x(n) (t))
∂xα n
dt ∂xα
dxα (n) ∂
δ 3 (~x − ~x(n) (t))
X
=− pi (n) α
n
dt ∂x (n)


pi (n) δ 3 (~x − ~x(n) (t))
X
=−
n
∂t
! (2-5.22)
∂ X i 3 ~ ~
=− p (n) δ (x − x(n) (t))
∂t n
X ∂pi (n)
+ δ 3 (~x − ~x(n) (t))
n
∂t
∂ i0 X dpi (n) 3 ~ ~
=− T + δ (x − x(n) (t))
∂t n
dt

geldt
∂T ij
= Fi (2-5.23)
∂xj
met
X dpi (n)
Fi = δ 3 (~x − ~x(n) (t))
n
dt
X dτ
= F i (n) δ 3 (~x − ~x(n) (t)) (2-5.24)
n
dt

~ = P ~f δ 3 (~x − ~x (t))). Voor een geı̈soleerd stelsel is de


de uitwendige krachtdichtheid (F n (n) (n)
uitwendige kracht = 0, zodat we de behoudswetten
T ij ,j = 0 (2-5.25)
bekomen.

2-5.3 Energie-impulstensor van een perfecte vloeistof


In de niet-relativistische hydrodynamica wordt de beweging van een perfecte vloeistof bepaald door
de continuı̈teitsvergelijking
∂ρ
+ div(ρ~v) = 0 (2-5.26)
∂t
en uit de navier-stokes vergelijkingen

∂~v 1
+ (~v.∇)~v = − ∇p + ~f (2-5.27)
∂t ρ

met ~f de uitwendige kracht, die we hier = 0 stellen. We onderstellen bovendien dat een toestands-
vergelijking geldt, die van de vorm is
p = p(ρ) (2-5.28)
2-5. RELATIVISTISCHE MECHANICA 69

We gaan nu op zoek naar een stelsel van tensoriële vergelijkingen, dat zich in de limiet van kleine
snelheden en kleine drukken (v << 1 en p << ρ, zgn. normale omstandigheden) reduceert tot
bovenstaande vergelijkingen. Als eerste stap schrijven we 2-5.26 en 2-5.27 simultaan als

∂ ∂
(ρvα ) + (ρvα v β + pδα β ) = 0 (2-5.29)
∂t ∂xβ
of nog, met
ρ~v
" #
ij ρ
t = ~ (2-5.30)
ρv ρv ⊗ ~v + pI3
~

(met I3 de eenheidsmatrix), als


∂ ij
t =0 (2-5.31)
∂xj
Men kan nu aantonen, wát de transformatieregels voor de objecten p of ρ ook mogen zijn, dat
∂ ∂
tij ∂x i ⊗ ∂xj geen tensor is. De vorm van 2-5.30 suggereert echter de definitie van twee scalaire

invarianten p en ρ, namelijk de druk en dichtheid van de vloeistof zoals gemeten door een ogen-
blikkelijk meebewegende inertiële waarnemer, evenals de definitie van een tensor T door

T = (p + ρ)u ⊗ u + pη (2-5.32)

waarbij u = γ(1, ~v ). Dan is

T ij =(p + ρ)ui uj + pη ij (2-5.33)


(ρ + p)~vγ 2
" #
(ρ + pv 2 )γ 2
= (2-5.34)
(ρ + p)~vγ 2 (ρ + p)~v ⊗ ~vγ 2 + pI3

Deze tensor T, die zich onder ‘normale omstandigheden’ inderdaad reduceert tot t, noemen we
de energie-impulstensor van de perfecte vloeistof met druk p, dichtheid ρ en snelheid u. Noteer
dat ook hier T een symmetrische tensor is en dat de tensorvergelijking die zich onder normale
omstandigheden reduceert tot 2-5.31 terug de vorm 2-5.25 aanneemt!
Het begrip energie-impulstensor is van zeer groot belang, o.a. omdat het in de algemene
relativiteit optreedt als bronterm voor de gravitatie in de Einstein veldvergelijkingen.
Dat er een factor γ 2 optreedt in b.v. T 00 is logisch: voor een waarnemer, die de vloeistof met
snelheid ~v ziet bewegen, neemt de energie in een volume-elementje toe met een factor γ, maar
anderzijds zal voor deze waarnemer het volume-elementje, t.g.v. de fitzgerald-lorentz-contractie,
in de bewegingsrichting ook krimpen met een factor γ. De grootheid ρ staat dus voor de energie-
dichtheid (met inbegrip van de kinetische energie) van de vloeistof. De continuı̈teitsvergelijking zal
dus behoud van energie uitdrukken, eerder dan behoud van deeltjesaantal.
Men kan zich afvragen waarom in 2-5.33-2-5.34 geen andere coëfficiënten werden gekozen, waarmee
het resultaat zich onder normale omstandigheden eveneens zou kunnen reduceren tot de tensor t
(b.v. ρ + 5p i.p.v. ρ + p ...). Om hierop een antwoord te geven maken we even een ommetje ...
Eerst voeren we op invariante wijze de deeltjesdichtheid n in, als de deeltjesdichtheid gemeten
door een ogenblikkelijk met de vloeistof meebewegende inertiële waarnemer. Voor een perfecte
vloeistof definiëren we dan de deeltjesstroom als de vector

N = nu (2-5.35)
70 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

In elk referentiestelsel waarvoor N α = 0 geldt dan T α0 = 0; in het algemeen — t.t.z. voor


niet-perfecte vloeistoffen — kan echter een netto energie-impulsstroom optreden zelfs zonder netto
deeltjestransport.
Voor een perfecte vloeistof wordt verder gepostuleerd dat

∂N i
=0 (2-5.36)
∂xi

wat zich, in normale omstandigheden, reduceert tot ∂n


∂t + div(n~v) = 0.
We herschrijven nu 2-5.25 als

((p + ρ)uj ),j ui + (p + ρ)uj ui ,j + p,j η ij = 0 (2-5.37)

Partieel afleiden van ui ui = −1 geeft ui ,j ui = 0, zodat contractie van 2-5.37 met ui resulteert in

−((p + ρ)uj ),j + p,j uj = 0 (2-5.38)

i.e.
p+ρ j
−( N ),j + p,j uj = 0 (2-5.39)
n
of, m.b.v. 2-5.36
p+ρ ρ 1
−N j ( ),j + p,j uj = N j (( ),j + p( ),j ) = 0 (2-5.40)
n n n
Met V = 1/n het specifiek volume en e = ρ/n de specifieke inwendige energie, herschrijven we
deze laatste betrekking als
uj (e,j + pV,j ) = 0 (2-5.41)
Volgens de tweede hoofdwet van de thermodynamica, kT ds = de + pdV , volgt dan dat de specifieke
entropie constant is langs de stroomlijnen van een perfecte vloeistof:

∂s
uj =0 (2-5.42)
∂xj
Als we in de definitie van de energie-impulstensor andere coëfficiënten hadden gekozen voor de
p-bijdragen, dan was in deze laatste paragraaf een conflict ontstaan met deeltjesbehoud óf met de
tweede hoofdwet!
Merk tenslotte nog op dat 1-10.11 kan herschreven worden als

ρ̇ + (ρ + p)Θ = 0 (2-5.43)

met ρ̇ = ρj uj en met Θ = ui ,i de zgn. volume-expansie. Substitutie hiervan in 2-5.37 geeft de


ruimtelijke componenten van de drukgradiënt als

p,α + (ρ + p)aα = 0. (2-5.44)

De betekenis van de scalair Θ is in te zien door een basis X1̂ , X2̂ , X3̂ te beschouwen die met een
infinitesimaal klein vloeistof-elementje wordt meegesleept: voor elk van deze basisvectoren geldt
dan Lu X = 0 en dus Ẋi = Xi,j uj = ui,j X j of Ẋ = BX met Bαβ = uα,β . Introduceren we de
matrix A = [X1 , X2 , X3 ] dan is
Ȧ = BA (2-5.45)
2-5. RELATIVISTISCHE MECHANICA 71

zodat
1 V̇
Θ = tr(B) = tr(ȦA−1 ) = (detA)˙ = , (2-5.46)
detA V
met V het volume van het beschouwde vloeistof-elementje. Andere —o.a. voor de kosmologie
belangrijke— zgn. kinematische grootheden die we aan de vloeistofstroom associëren, zijn de
shear -tensor
1
σαβ = B(αβ) − Θηαβ (2-5.47)
3
en de vorticity-tensor
ωαβ = B[αβ] . (2-5.48)

2-5.4 Behoudswetten en energievoorwaarden


P P
We leggen nu een verband tussen de grootheden n p~(n) en n m(n) uit paragraaf 2-5.1 en de
grootheden p en ρ uit paragraaf 2-5.3 en bekijken daartoe een perfecte vloeistof als de limiet van
een deeltjeswolk.
Identificeren we de hierboven bekomen energie-impulstensor van een deeltjeswolk met deze van
een perfecte vloeistof, dan vinden we

X pi (n) pi (n)
T i i = −ρ + 3p = δ 3 (~x − ~x(n) (t)) (2-5.49)
n
E(n)

en
X (pi (n) ui )2
T ij ui uj = ρ = δ 3 (~x − ~x(n) (t))
n
E(n)
(2-5.50)
E(n) δ 3 (~x − ~x(n) (t))
X
=
n

2
Uit beide betrekkingen volgt nog, gebruik makend van p2(n) = −E(n)
2
+ ~p(n) ,

~2
1 X p(n) 3 ~ ~
p= δ (x − x(n) (t)) (2-5.51)
3 n E(n)

2
en dus, vermits ~p(n) < E(n) 2 ,
1
0≤p≤
ρ (2-5.52)
3
Twee bijzondere gevallen van 2-5.51 zijn het vermelden waard.
Voor een koud, weinig-relativistisch gas is
2
E(n) =(m20(n) + ~p(n) )1/2
~2 (2-5.53)
1 p(n)
≈m0(n) + .
2 m0(n)
72 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

M.a.w. voor een koud, weinig-relativistisch gas geldt


3
ρ ≈ ρ0 + p (2-5.54)
2
2
terwijl voor een heet, extreem relativistisch gas E(n) ≈ (~p(n) )1/2 en dus

ρ ≈ 3p (2-5.55)

Bij normale omstandigheden is in 2-5.54 de term 32 p te verwaarlozen t.o.v. de rustmassadichtheid


ρ0 , zodat we (voor identieke deeltjes) het klassieke resultaat ρ ≈ nm0 vinden. Grote drukken
zijn echter in staat om een significante bijdrage te leveren tot de energie-dichtheid (en dus tot het
gewicht!). Vandaar dat b.v. zware sterren niet zonder meer in evenwicht te houden zijn door de
inwendige druk onbeperkt op te drijven; we komen hier later nog op terug.

De voorwaarden 2-5.52 zijn erg sterk: ze werden hier afgeleid voor een zeer eenvoudig gasmodel.
Voor meer realistische materieverdelingen zijn ze niet noodzakelijk geldig (de concepten ‘druk’ en
‘dichtheid’ verliezen dan trouwens ook hun betekenis).

Essentieel voor meer complexe materiemodellen is echter dat de totale energie-impuls verdeling
altijd beschreven wordt door een symmetrische tensor T ij die voldoet aan de behoudswetten T ij ,j =
07 . In paragraaf 2-6.3 tonen we dit nogmaals aan voor een wolk van geladen testdeeltjes, die
onderling interageren via de lorentz-krachten. Aan elke dergelijke tensor is dan in een vlakke ruimte
een behouden vectoriële grootheid gekoppeld, het (veralgemeend) totaal impuls met componenten
Z
Pi = T i0 d3 x (2-5.56)
t=const

en gehoorzamend aan
dP
=0 (2-5.57)
dt
Immers
dP i ∂
Z
= T i0 d3 x
dt ∂t t=const
Z X ∂T iα (2-5.58)
=− d3 x
t=const α ∂xα
=0

door toepassing van de wet van Gauss én onder de aanname dat het systeem begrensd is. E = P 0
~ met componenten P α zijn dan de veralgemeningen van de in 2-5.1 geı̈ntroduceerde
en de vector P
behouden grootheden ‘totale energie’ en ‘totaal drie-impuls’. Expliciete berekening van E en P~
voor de in paragraaf 2-5.2 beschouwde wolk van niet-interagerende deeltjes, levert trouwens precies
de uitdrukkingen 2-5.7 en 2-5.8 op.

7 In de veldentheorie wordt hieraan automatisch voldaan door T ij te definiëren a.d.h.v. een gepast variationeel

beginsel
2-5. RELATIVISTISCHE MECHANICA 73

Vermelden we tenslotte een aantal voorwaarden, waarvan algemeen wordt aangenomen dat ook
meer complexe energie-impulstensoren er aan voldoen.8

De eerste twee voorwaarden beperken de grootte van mogelijke negatieve drukken:

• De zwakke energievoorwaarde stelt dat de lokaal gemeten T 00 component nooit negatief mag
zijn: Voor alle tijdachtige ξ is Tab ξ a ξ b ≥ 0.
Voor het bijzonder geval van een perfecte vloeistof (2-5.33) en met ξ 2 = −1 is Tab ξ a ξ b =
2
(p + ρ)(ua ξa )2 − p. Aangezien ua ξa ≤ −1 ( want ξ 0 = 1 + α ξ α 2 ) impliceert dit dat ρ ≥ 0
P
en ρ + p ≥ 0.

• De sterke energievoorwaarde stelt dat voor alle tijdachtige ξ met ξ 2 = −1 geldt


1
(Tab − ηab T )ξ a ξ b ≥ 0.
2
1
Voor een perfecte vloeistof wordt deze voorwaarde (p + ρ)(ua ξ a )2 ≥ 2 (ρ − p), waar aan
voldaan is voor alle ξ met ξ 2 = −1 als ρ + 3p ≥ 0 en ρ + p ≥ 0.

• Tenslotte drukt de dominante energievoorwaarde uit dat de lokaal gemeten energie-impuls-


stromen niet sneller dan het licht bewegen:
voor elke tijdachtige en toekomstgerichte ξ (i.e. ξ 0 > 0) is de waargenomen energie-impulsflux
−T a b ξ b tijdachtig of nul en toekomstig gericht.
Voor perfecte vloeistoffen reduceert deze voorwaarde zich tot ρ ≥ |p|. Is p = ρ dan spreken
we van een ”stijve vloeistof”. Perturbatieanalyse toont aan dat kleine perturbaties zich in
 1/2
∂p
een vloeistof voortbewegen met de “geluidssnelheid” cs = ∂ρ . Voor een stijve vloeistof
is de geluidssnelheid dus maximaal: cs = 1.

8 afwijkingen van deze voorwaarden kunnen optreden onder zeer extreme situaties, b.v. wanneer quantum effecten

niet langer te verwaarlozen zijn


74 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

2-6 Electrodynamica
2-6.1 Algemeenheden
Beschouwen we een electromagnetisch veld in vacuum: de maxwellvergelijkingen 2-1.1 reduceren
zich (met c = 1) voor een willekeurige inertiële waarnemer tot

~ =4πρ
∇.E (2-6.1)
~
∇×H~ = ∂ E + 4π~j (2-6.2)
∂t
~
∇.H =0 (2-6.3)
~
~ = − ∂H
∇×E (2-6.4)
∂t
en een testlading e ondergaat in dit electromagnetisch veld een kracht

~f = e(E
~ + ~v × H)
~ (2-6.5)

In hoofdstuk 1 (zie p. 41) hebben we al gezien dat het paar vergelijkingen (2-6.3, 2-6.4) te
schrijven is als
dF = 0 (2-6.6)
met
F = H + E ∧ dt. (2-6.7)
De componenten van de 2-vorm
1
F= Fij dxi ∧ dxj (2-6.8)
2
(de maxwell-2-vorm van het electromagnetisch veld genoemd of de electromagnetische veldtensor )
worden dan met x0 = t voluit gegeven door de matrix

−E 1 −E 2 −E 3
 
0
E 1 0 H3 −H 2 
Fij = 
E 2 −H 3 0
. (2-6.9)
H1 
E3 H 2 −H 1 0

Hiermee corresponderen de matrices F ij = η ik η jm Fkm en F i j = η ik Fkj :

E1 E2 E3
 
0
E 1 0 H3 −H 2 
F ij =
E 2 (2-6.10)
−H 3 H1 

0
E3 H2 −H 1 0

E1 E2 E3
 
0
−E 1 0 H3 −H 2 
F ij =
−E 2
. (2-6.11)
−H 3 0 H1 
−E 3 H2 −H 1 0
2-6. ELECTRODYNAMICA 75

Dit is een meevaller, want op die manier is9 2-6.5 te herschrijven als
dpα
= e(u0 E α + (~u × H)
~ α)

en dus
dpα
= eF α j uj (2-6.12)

Anderzijds is
dp0 dp0 dE
=γ =γ = γ~f .~v = γe(E
~ + ~v × H).
~ ~v
dτ dt dt
of
dp0
= eF 0 j uj , (2-6.13)

zodat beide vergelijkingen 2-6.12 en 2-6.13 simultaan te schrijven zijn als

dpi
= eF i j uj (2-6.14)

Merken we tenslotte nog op dat ook het eerste paar maxwellvergelijkingen in een zeer eenvoudige
vorm te schrijven is, door gebruik te maken van de hodge-duale 2-vorm ∗F. Definiëren we immers
de stroomdichtheid J als de 1-vorm
J = j − ρdt (2-6.15)
dan reduceren 2-6.1 en 2-6.2 zich tot
∗d ∗ F = 4πJ (2-6.16)
Noteer dat de corresponderende vector J voldoet aan de behoudswet J,ii = 0, terwijl het feit dat
dF = 0, of
F[ij,k] = 0 (2-6.17)
betekent dat, volgens de poincaréstelling, lokaal een 1-vorm A bestaat, de electromagnetische
potentiaal genoemd, waarvoor
F = dA (2-6.18)
of
Fij = 2A[j,i] = Aj,i − Ai,j (2-6.19)
Uitschrijven van deze betrekkingen toont enerzijds dat E α = −F0α = −Aα,0 + A0,α en dus, met

~ = Aα ∂
A en φ = A0 (2-6.20)
∂xα
dat
~
~ + ∂ A = −∇φ
E (2-6.21)
∂t
~ 1 , zodat
terwijl anderzijds b.v. H 1 = F23 = ∂2 A3 − ∂3 A2 = (∇ × A)

~ =∇×A
H ~ (2-6.22)
9 aangezien nu dpα /dτ = F α = γf α (α = 1, 2, 3) en u = γ(1, ~v)
76 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

Beide betrekkingen hadden we natuurlijk ook, zoals bekend, rechtstreeks uit de maxwellvergelij-
kingen zelf kunnen afleiden.
Merken we tenslotte nog op dat A slechts op een totale differentiaal dϕ na bepaald is, aangezien
F = d(A + dϕ) en dat een willekeurige waarnemer met snelheid u in een electromagnetisch veld F
~ en een magnetisch veld H
een electrisch veld E ~ zal waarnemen, met

E i = F ij uj en H i = ∗ F ij uj (2-6.23)

zoals gemakkelijk te verifiëren valt door ui = −δ 0 i te kiezen.

2-6.2 Electromagnetische golven


We herschrijven de maxwellvergelijkingen in functie van de electromagnetische potentiaal: substi-
tutie van 2-6.19 in 2-6.16 levert

∂ j ∂j Ai − ∂ j ∂i Aj = −4πJi (2-6.24)

De tweede term in het linkerlid kunnen we = 0 maken door de gradiënt van een gepaste scalaire
functie ϕ bij A op te tellen zó dat
∂ j Aj = 0 (2-6.25)
We noemen een dergelijk vastleggen van de functie ϕ een keuze van de ijk. In het bijzonder noemen
we de ijkkeuze waarvoor 2-6.25 geldt de zgn. lorentz-ijk.
In de lorentz-ijk reduceren de maxwellvergelijkingen zich tot de eenvoudiger gedaante

Ai ≡ ∂ j ∂j Ai = −4πJi (2-6.26)

Voor een vrij maxwell-veld, i.e. J = 0, ligt het dan voor de hand om golf oplossingen te zoeken
van de vorm
A = C expiS (2-6.27)
met C een constant vectorveld en met S de zgn. fase van de golf. De fase moet dan voldoen aan

S =0 (2-6.28)
2 j
(∇S) ≡∂j S∂ S = 0 (2-6.29)
j
Cj ∂ S =0 (2-6.30)

Stellen we k = ∇S = de normaal op de oppervlakken van constante fase, dan betekent 2-6.29


dat k een nul-vector is, de zgn. propagatievector. De constante-fase oppervlakken zijn dus nul-
hyperoppervlakken.
Een waarnemer met snelheid u (u2 = −1) zal de fase zien veranderen met een snelheid dS/dτ .
Deze snelheid is wat we de frequentie noemen van de golf:
dS
ω =− = −∂j Suj
dτ (2-6.31)
= − uj kj
P3
Belangrijke bijzondere oplossingen van 2-6.28-2-6.30 zijn de zgn. vlakke golven, met S = i=0 ki xi
en ki constanten waarvoor −k0 2 + k1 2 + k2 2 + k3 2 = 0.
2-6. ELECTRODYNAMICA 77

2-6.3 Energie-impulstensor
Net zoals in 2-5 beschouwen we nu opnieuw een wolk puntdeeltjes, maar voorzien elk deeltje van
een lading e(n) . We definiëren dan de ladingsdichtheid en de stroomdichtheid als

e(n) δ 3 (~x − ~x(n) (t))


X
ρ= (2-6.32)
n

d~x(n)
~j = δ 3 (~x − ~x(n) (t))
X
e(n) (2-6.33)
n
dt

Beide begrippen zijn te verenigen in de (vier-)stroomdichtheid J met


X dxi (n) 3 ~ ~
Ji = e(n) δ (x − x(n) (t))
n
dt
+∞
(2-6.34)
XZ
i 4 k k
= e(n) u (n) δ (x − x (n) (τ )) dτ
n −∞

De vector J voldoet aan de behoudswet


∂J k
=o (2-6.35)
∂xk
Immers
 dxα
e(n) ∂α δ 3 (~x − ~x(n) (t)

(n)
X
∂α j α =
n
dt
∂  3~ ~  dxα
(n)
X
=− e(n) α δ (x − x(n) (t)
n
∂x (n) dt
(2-6.36)

δ 3 (~x − ~x(n) (t)
X  
=− e(n)
n
∂t
∂ρ ∂j 0
=− =− 0
∂t ∂x
(wat dus precies de continuı̈teitsvergelijking is).
Een gevolg is dat Z
Q= J 0 d3 x (2-6.37)
R3
(met de integratie uitgevoerd over het hyperoppervlak t = constant) een constante is, de totale
lading genoemd:
dQ d
Z
= J 0 d3 x
dt dt R3
∂J 0 3
Z Z
(2-6.38)
= d x=− ∇.~j d3 x
R 3 ∂t R 3

=0

na toepassing van de stelling van Gauss en onder de voorwaarde dat het systeem begrensd is, of
dat j ‘voldoende snel klein wordt op oneindig’.
78 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE

Uit het feit dat Q constant is in de tijd volgt nu ook dat Q een invariante grootheid is:
Z +∞
Q(t) =Q(0) = Q(t′ )δ(t′ ) dt′
Z Z−∞
=Q = J 0 (t′ , x) d3 xδ(t′ ) dt′ (2-6.39)
R R3
Z
= −uk J k δ(−ui xi ) d4 x
R4

We bekijken nu terug de energie-impulstensor van de wolk punt-deeltjes, zoals opgesteld in 2-5


en noteren deze als T(M ) (de ‘zuivere materie bijdrage’):

X pi (n) pj (n)
T(M ) ij = δ 3 (~x − ~x(n) (t)) (2-6.40)
n
E(n)

Vermits de deeltjes geladen zijn, is elk deeltje nu onderworpen aan een lorentz-kracht

dxk (n)
F i (n) = e(n) F i k (2-6.41)

De uitwendige krachtdichtheid F (2-5.24) wordt hiermee
X dτ dxk (n) 3 ~ ~
Fi = e(n) F i k δ (x − x(n) (t))
n
dt dτ
X dxk (n) 3 ~ ~ (2-6.42)
=F i k e(n) δ (x − x(n) (t))
n
dt
=F i k J k

zodat uit 2-5.23 volgt dat


∂T(M ) ij
= F ik J k (2-6.43)
∂xj
T(M ) voldoet dus niet aan de behoudswetten 2-5.25: de oorzaak is te zoeken in het feit dat de
deeltjes niet langer lokaal interageren (cf. de lorentz-krachten!). Het veld dat verantwoordelijk is
voor de interactie, het electromagnetisch veld, draagt namelijk zelf bij tot de energie-impulstensor
en deze bijdrage, T(EM ) is zodanig dat ze het rechterlid van 2-6.43 opheft:

∂(T(M ) ij + T(EM ) ij )
=0 (2-6.44)
∂xj
We verifiëren nu dat hieraan voldaan wordt door de volgende symmetrische tensor, die we de
energie-impulstensor van het maxwell-veld noemen:
1 1
T(EM ) ij = (F i k F jk − η ij Fkl F kl ) (2-6.45)
4π 4
Inderdaad, substitueren we in
1 1
∂j T(EM ) ij = (∂j F i k F jk + F i k ∂j F jk − η ij Fkl ∂j F kl )
4π 2
2-6. ELECTRODYNAMICA 79

de eerste term door

η il F jk ∂j Flk = − η il F jk (∂k Fjl + ∂l Fkj )


= − η ij F lk ∂k Flj − η ij F lk ∂j Fkl

dan bekomen we voor ∂j T(EM ) ij


 
1 1 ij
η Fkl ∂j F kl − η ij F lk ∂k Flj + F i k ∂j F jk
4π 2
 
1 1 ij kl
= η (F ∂j Fkl + F kl ∂k Flj + F kl ∂k Flj ) + F i k ∂j F jk
4π 2
 
1 1 ij kl
= η F (∂j Fkl + ∂k Flj + ∂l Fjk ) + F i k ∂j F jk
4π 2
(door omwisseling van k en l in de derde term)
1
= F i k ∂j F jk

(door toepassing van 2-6.17)
= − F ik J k

Dat 2-6.45 inderdaad de energie-impulstensor is van het maxwell-veld, blijkt tenslotte ook nog uit
het feit dat, bij berekening, T 00 en T 0α zich reduceren tot, respectievelijk, de klassieke energie-
1 1 ~ ~ α van dit veld.
dichtheid 8π (E 2 + H 2 ) en de poynting-vector 4π (E × H)

Merk tenslotte nog op dat de energie-impulstensor van het maxwell-veld spoorvrij is:
1 i
T(EM ) i i = (F k Fi k − Fkℓ F kℓ ) = 0 (2-6.46)
4
80 HOOFDSTUK 2. BEPERKTE RELATIVITEITSTHEORIE
Hoofdstuk 3

Beginselen van de Algemene


Relativiteitstheorie

Na de mathematische fundamenten bekijken we nu de fysische en filosofische grondslagen.


Hierbij wordt geen historische volgorde gerespecteerd: de besproken beginselen zijn dus geenszins
vergelijkbaar met de beginselen die Einstein zelf hanteerde bij de opbouw van de theorie. Wat volgt
is ook geen axiomatische of formele benadering: er wordt enkel getracht om binnen een zo breed
mogelijk referentiekader een plausibele weg te schetsen, die naar de algemene relativiteitstheorie
leidt. De meeste der gehanteerde beginselen zijn voor verschillende interpretaties vatbaar: m.i. is
dit geen nadeel, maar eerder de kracht van een filosofisch/fysische aanpak, in tegenstelling tot de
beperkingen van een meer formele benadering.

3-1 Beginsel van Mach


Eén der belangrijkste pijlers van de klassieke mechanica (in de gangbare, moderne formulering) is
de eerste wet van Newton, die het bestaan postuleert van een bijzondere klasse van waarnemers (de
inertiële waarnemers), die t.o.v. elkaar in éénparig rechtlijnige beweging verkeren. Enkel en alleen
voor deze waarnemers geldt de tweede wet van Newton (F ~ = m~a): deeltjes waarop geen kracht

81
82 HOOFDSTUK 3. BEGINSELEN VAN DE ALGEMENE RELATIVITEITSTHEORIE

werkt bewegen bijgevolg éénparig en rechtlijnig t.o.v. de inertiële waarnemers. Voor willekeurige
waarnemers echter treden correctie-versnellingen op, zoals de sleepversnelling ~aS , de centripetale
versnelling ~a en de Coriolis-versnelling ~a , die toelaten de tweede wet te herschrijven als
c C

~ − m~a − m~a − m~a = m~a


F (3-1.1)
S c C

De extra termen in het linkerlid worden in de klassieke mechanica de fictieve of schijnbare krachten
genoemd en de eerste wet is essentieel om ze te onderscheiden van de ’werkelijke’ krachten. Er
bestaat m.a.w. geen dynamisch onderscheid tussen beide grootheden. Newton probeerde dit op te
vangen door de inertiële waarnemers zelf een dynamische status te geven en ze te definiëren door
de ‘afwezigheid van krachten’. Hierdoor werd hij echter verplicht (om niet in een cirkel-redenering
gevangen te raken en zéér tegen zijn zin) het concept van een absolute ruimte in de theorie in te
voeren en stelde hij zich bloot aan de kritieken van de relationisten, zoals Leibniz en Berkeley. Zij
betoogden dat enkel relatieve bewegingen zinvol waren en weigerden het bestaan te aanvaarden van
een niet-observeerbare absolute ruimte, die enerzijds op geen enkele manier beinvloed werd door de
materie, maar anderzijds wel alle materie kon beinvloeden. Een bekend tegen-argument, waarmee
Newton het belang probeerde te benadrukken van absolute, eerder dan van relatieve bewegingen,
ligt vervat in het gedachten-experiment, waarbij een met water gevulde emmer aan het draaien
wordt gebracht rond een vertikale as.
Newton merkt op

• dat op het ogenblik waarop de relatieve rotatie van emmer en water het grootst is, het
wateroppervlak nog horizontaal is

• dat, wanneer na enkele ogenblikken de relatieve rotatie van emmer en water klein is, het
wateroppervlak daarentegen gekromd is

en besluit dat niet relatieve beweging van water en emmer het oppervlak doen krommen, maar wel
de absolute beweging van het water! Het zal bijna 300 jaar duren voor iemand op deze meesterlijke
zet weet te reageren ...
We moeten wachten op de Oostenrijkse wetenschapsfilosoof Ernst Mach (1893), die net als
Leibniz de opvatting verdedigt dat enkel relatieve bewegingen zinvol zijn: voor Mach was het
b.v. zinloos om te spreken over de beweging van een testdeeltje in een leeg universum. In een niet-
leeg universum daarentegen, is het volgens Mach mogelijk om inertiële waarnemers te definiëren
als waarnemers, die in rust zijn of eenparig rechtlijnig bewegen t.o.v. de ‘gemiddelde materie-
verdeling’ in dit universum (de ‘vaste sterren’ zijn hiervoor een goede benadering). M.b.t. Newton’s
gedachten-experiment stelt Mach dat het wateroppervlak enkel gekromd is, omdat het water roteert
t.o.v. de vaste sterren.
We kunnen ook het volgende experiment uitvoeren: stellen we een Foucault-slinger op aan
de Noordpool, dan blijkt dat de slinger precies 24 uur nodig heeft om over 360o te draaien. In
Newton’s wereldbeeld betekent dit dat de aarde 24 uur nodig heeft om over 360o te draaien t.o.v.
de absolute ruimte. Nu blijkt dit ook precies de tijd te zijn om over 360o te draaien t.o.v. de vaste
sterren. Deze coı̈ncidentie (ook het samenvallen genoemd van het lokaal inertiaal kompas met
het lokaal licht-kompas) is binnen het newtoniaanse beeld zuiver toeval (en wordt alleszins niet
verklaard), maar vindt daarentegen binnen de standpunten van Mach een natuurlijke verklaring!
Mach’s opvattingen—alhoewel vrij vaag en zonder expliciete uitwerking van b.v. de manier waarop
inertiële massa zou moeten afhangen van de materieverdeling in het universum— hadden een zeer
diepe invloed op Einstein. Einstein probeerde deze ideeën in zijn theorie te verwerken, maar lukte
3-1. BEGINSEL VAN MACH 83

hierin slechts gedeeltelijk (het z.g. lenz-thirring effect). Zo zal b.v., bij de uitvoering in A.R. van
Newton’s gedachten-experiment met een voldoend zware emmer, het wateroppervlak ook reeds in
het begin (wanneer relatieve rotatie van water en emmer maximaal is) lichtjes gekromd zijn: de
rotatie van de draaiende emmer zal het lokaal inertiaal kompas rechtstreeks beı̈nvloeden (gebruik
makend van Newtoniaanse terminologie zouden we zeggen dat de rotatie van materie een extra
bijdrage levert tot het gravitatieveld). Van de volgende versies van ‘het beginsel van Mach’, is dus
de eerste (gedeeltelijk) verwezenlijkt in A.R.; de twee andere, sterkere, vormen daarentegen gelden
geen van beide:

• De materieverdeling van het universum bepaalt de geometrie van het universum.

• Zonder materie is er geen geometrie (de veldvergelijkingen voor een leeg universum zouden
dan b.v. geen oplossingen mogen toelaten).

• Zonder materie is er geen inertie (de inertiële massa van een testdeeltje in een leeg universum
zou = 0 moeten zijn).
Ernst Mach was een van de leidinggevende figuren van de positivistische school van de 19de eeuw en
Einstein werd hierdoor sterk beinvloed. I.h.b. zal Mach’s vraag naar de observationele status van de
inertiaalwaarnemer in de klassieke mechanica hem rechtstreeks leiden naar het equivalentiebeginsel.
84 HOOFDSTUK 3. BEGINSELEN VAN DE ALGEMENE RELATIVITEITSTHEORIE

3-2 Zwak Equivalentiebeginsel

Figuur 3.1: WEP

Aan het equivalentiebeginsel werd de openingsparagraaf van Newton’s Principia gewijd, terwijl
Einstein het in 1907 gebruikte als hoeksteen voor de algemene relativiteitstheorie. Vandaag
beschouwen we dit beginsel als fundament van de ganse klasse van gravitatietheorieën, die gebaseerd
zijn op de brede, onderliggende gedachte dat de ruimte-tijd gekromd is.
Het zwak equivalentiebeginsel (Weak Equivalence Principle, WEP), is het beginsel waar Newton
op doelde, toen hij stelde dat de eigenschap ‘massa’ (van een lichaam) evenredig was met de
eigenschap ‘gewicht’. Vandaag zeggen we dat inertiemassa mI evenredig is (en dus, door een
geschikte keuze van eenheden, gelijk is) aan passieve gravitationele massa mP . In een gravitatieveld
V vallen beide massa’s dan t.o.v. elkaar weg in de vergelijking
−mP .∇V = mI .a (3-2.1)
zodat alle testdeeljes bij gelijke beginvoorwaarden dezelfde baan volgen. We bekomen alzo de
volgende formulering:
• Als een ongeladen testdeeltje in een punt P van de ruimte-tijd geplaatst wordt en er een
welbepaalde beginsnelheid krijgt, dan is de daarop volgende beweging onafhankelijk van de
interne structuur en samenstelling van dit deeltje.
3-2. ZWAK EQUIVALENTIEBEGINSEL 85

Voor een gedetailleerde bespreking van WEP en de ermee samenhangende experimenten verwijzen
we naar Hoofdstuk 5.
Het principe oogt —op eerste zicht— vrij vanzelfsprekend en onschuldig, maar is één van de
belangrijkste peilers van de theorie. Het is aan het equivalentiebeginsel te danken dat de algemene
relativiteitstheorie, vertrekkend van Einstein’s eerste pogingen om gravitatie ‘à la Maxwell’ in de
beperkte relativiteitstheorie in te bouwen, is uitgegroeid tot een conceptuele revolutie in ons denken
over ruimte en tijd.
86 HOOFDSTUK 3. BEGINSELEN VAN DE ALGEMENE RELATIVITEITSTHEORIE

3-3 Covariantiebeginsel
In de klassieke mechanica zijn alle inertiële waarnemers equivalent en zijn de wetten invariant
onder galileitransformaties. Ook in de beperkte relativiteitstheorie zijn alle inertiële waarnemers
equivalent, maar zijn de wetten invariant onder lorentz-transformaties. Wensen we nu gravitatie
in de theorie in te bouwen, dan heeft het geen enkele zin meer om aan de inertiële waarnemers nog
een bijzondere status te geven (zie figuur 3.2). Newtoniaans geredeneerd zou de linker waarnemer

Figuur 3.2: Einstein’s gedachten-experiment

(in rust op een statische aarde) immers een inertiële waarnemer zijn en de rechter waarnemer (een
éénparig versnelde) zeker niet. Einstein besefte nu dat er geen enkel experiment bestond 1 , dat
een onderscheid kon maken tussen het labo in rust in het uniform gravitatieveld ~g, en het labo dat
wordt voortgestuwd met uniforme versnelling −~g, zodat het klassieke begrip ‘inertiële waarnemer’
zijn betekenis wel moest verliezen in een relativistische gravitatietheorie. Hij stelde daarom het
volgende algemene relativiteitsbeginsel voor:

• Alle waarnemers zijn equivalent.

Deze versie staat enigszins open voor kritiek, aangezien in nogal wat oplossingen van A.R.
waarnemers duidelijk niet equivalent zijn. Dit is b.v. het geval in elke stationaire ruimte-tijd.
waar de integraalkrommen van de tijd-achtige killing-vectoren vormen dan gepriviligieerde families
van waarnemers vormen! Ook laten uiterst nauwkeurige metingen van de di-pool anisotropie in
de kosmische microgolf achtergrond-straling toe om een vorm van ‘absolute rust’ te definiëren,
namelijk die bewegingstoestand waarvoor de straling isotroop is.
Het is dus van belang om niet zozeer de nadruk te leggen op equivalentie van waarnemers (of
coördinaatsystemen), maar eerder op de mogelijkheid de theorie zó te formuleren dat de wetten in-
1 zie de paragrafen i.v.m. de equivalentiebeginsels!
3-3. COVARIANTIEBEGINSEL 87

variant zijn onder willekeurige coördinaattransformaties. Vandaar dat men het relativiteitsbeginsel
soms herformuleert als het covariantiebeginsel :
• De wetten van de fysica moeten een tensoriële vorm aannemen.
Hierbij zijn echter ook weer enkele bemerkingen te maken:
1. ‘Moeten’ is met een korrel zout te nemen, aangezien fermionen beschreven worden met
spinoren en niet met tensoren. Beide begrippen zijn wel nauw aan elkaar verwant.
2. Het covariantiebeginsel heeft een vreemde geschiedenis achter de rug: reeds kort na de publi-
catie in 1905 van de beperkte relativiteitstheorie had Einstein al de belangrijkste ingrediënten
klaar voor de algemene theorie (equivalentiebeginsel, covariantiebeginsel) en wijdde hij zich
aan een studie van de differentiaalmeetkunde om een stel covariante veldvergelijkingen voor
het gravitatieveld op te stellen. In 1912, op het ogenblik dat alle stukjes van de puzzel op tafel
lagen, gebeurde er iets merkwaardigs: Einstein nam afstand van de algemene covariantie2 !
De verklaring was in de eerste plaats te zoeken bij de hierna volgende (maar in moderne
terminologie geformuleerde) redenering (Einstein’s ‘Loch argument’):

Stel dat men beschikt over een ruimte-tijd variëteit M bestaande uit een materieverdeling
met bijhorende metriek en dat zich daarin een ‘gat’ L bevindt (een Loch), waarbij men zich tot
doel stelt de metriek in het gat te bepalen op basis van een stel covariante veldvergelijkingen,
uitgaande van de randvoorwaarden die vastliggen op de rand van het gat. Stel dat deze
procedure als resultaat de metriek g oplevert. Beschouw nu een punt p ∈ L en een actief
diffeomorfisme Φ (zie paragraaf 1-4) van het gebied L, dat zich buiten en op de rand van
L tot de identiteit reduceert. Als g een oplossing is van het randwaardenprobleem, dan is
t.g.v. algemene covariantie, ook g′ = Φ∗ (g) een oplossing. Men vindt dan voor de metriek
in p twee, in het algemeen verschillende uitdrukkingen, gp en g′ p , leidend tot verschillende
observationele consequenties (de ricci-scalar in p kan b.v. voor de ene metriek 0 zijn en voor
de andere niet). Voor een deterministische theorie is dit een desastreus gevolg en Einstein
formuleerde pas in 1915 een bevredigend antwoord. Zijn oplossing kwam er —in een moderne
formulering— op neer dat het zinloos is om een fysische betekenis toe te kennen aan het
(mathematische) punt p van de ruimte-tijd variëteit M: lokalisatie van punten heeft enkel
en alleen zin m.b.t. de aanwezige deeltjes (en velden) ... Bekijken we b.v. terug hetzelfde
probleem, waarbij we nu in L twee wereldlijnen van deeltjes γ1 en γ2 beschouwen, die elkaar
snijden in het punt p: onder het diffeomorfisme Φ worden deze wereldlijnen afgebeeld op
nieuwe wereldlijnen Φ ◦ γ1 en Φ ◦ γ2 die elkaar snijden in het punt p′ = Φ(p). Als b.v. de
ricci-scalar voor de metriek g 0 was in het punt p, dan is hij ook 0 voor de metriek g′ in
het punt p′ : Rp = R′ p′ . De twee oplossingen (L, g) en (L, g′ ) zijn dus equivalent in de zin
dat ze dezelfde fysische situatie beschrijven. Een vergelijkbaar fenomeen doet zich voor in
de theorie van het electromagnetisme, in de zin dat we te maken hebben met ijk-invariantie
(gauge invariance), alleen is de ijkgroep nu de groep van de actieve diffeomorfismen! Einstein
brengt hiermee de genadestoot toe aan de newtoniaanse fysica en verwezenlijkt in zekere zin
de oude droom van Leibniz en Descartes: niet alleen tijd en ruimte worden opzij geschoven,
maar de ruimte-tijd variëteit zelf. Deze variëteit op zichzelf is een wiskundige artefact zonder
enige fysische betekenis: fysische velden en deeltjes leven niet ‘in’ een ruimte-tijd variëteit,
maar vormen samen met hun onderlinge betrekkingen de ruimte-tijd zelf.
2 Des te merkwaardiger omdat op dat ogenblik een nek aan nek race begint met David Hilbert, die eveneens op

zoek was naar een formulering van de veldvergelijkingen


88 HOOFDSTUK 3. BEGINSELEN VAN DE ALGEMENE RELATIVITEITSTHEORIE

Helaas vindt dit grandiose inzicht zijn weerslag in het overgrote deel van de moderne literatuur
(meestal en in het beste geval) enkel onder de vorm van één of andere voetnoot, waarin een
ruimte-tijd gedefinieerd wordt als een equivalentieklasse van lorentz-variëiten (M, g), waarbij
(M, g) equivalent is met (M′ , g′ ) als en slechts als er een diffeomorfisme Φ : M → M′ bestaat
zó dat g′ = Φ∗ (g). Dat de draagwijdte van dit inzicht na bijna 100 jaar nog steeds niet ten
volle is doorgedrongen, zou wel eens mee aan de basis kunnen liggen van het falen van alle
pogingen om tot een geünifieerde quantumveldentheorie te komen.

3. Door een aantal critici van Einstein (b.v. E. Kretschmann) werd aangevoerd dat het covari-
antiebeginsel eigenlijk ‘leeg’ is, aangezien elke theorie (ook de newtoniaanse mechanica) in
tensoriële vorm kan gegoten worden. Dit is ten dele correct: de newtoniaanse fysica kan
inderdaad in algemeen covariante vorm gegoten worden, net zoals het mogelijk is om de
algemene relativiteitstheorie op een niet-covariante manier te formuleren (door op één of an-
dere manier een coördinaatstelsel te fixeren). Beide theorieën (covariante newtoniaanse en
niet-covariante A.R.) zijn echter conceptuele monstruositeiten . . . . Dat covariantie dus wel
degelijk een leidraad is (het was Einstein’s belangrijkste leidraad!) blijkt dan ook uit dit
zelfde voorbeeld: als men zich tot taak zou stellen om de newtoniaanse fysica op algemeen
covariante wijze te omschrijven, dan zou men extra dynamische velden moeten introduceren
(corresponderend met tijd en ruimte) en vervolgens de dynamica van deze velden op een
vreemde manier moeten beperken om tot een absolute tijd te komen en een slicing van ab-
solute rustruimtes. Het zou op dat ogenblik een natuurlijke stap zijn om deze beperkingen op
de dynamica te laten varen en een volledig dynamische theorie te ontwikkelen: Kretschmann’s
argument toont dus de grote cognitieve sterkte aan van het covariantiebeginsel, eerder dan
de zwakte ervan!
3-4. EINSTEIN’S EQUIVALENTIEBEGINSEL 89

3-4 Einstein’s Equivalentiebeginsel


Einstein ging nog een stap verder dan WEP, door te stellen dat, in een vrij vallend labo, niet alleen
de wetten van de mechanica zich gedragen alsof er geen gravitatie aanwezig is, maar dat alle wetten
van de fysica zich dan zo gedragen. Hij noemde dit later ‘der glücklichste Gedanke meines Lebens’
en het vormt, samen met het covariantiebeginsel, inderdaad de hoeksteen van de ganse theorie
... Tegenwoordig formuleren we Einstein’s Equivalentiebeginsel (Einstein Equivalence Principle,
EEP) alsvolgt:

(i) WEP geldt,

(ii) het resultaat van elk lokaal en niet-gravitationeel experiment is onafhankelijk van de snelheid
van het vrij-vallend referentiestelsel waarin dit experiment wordt uitgevoerd,

(iii) het resultaat van elk lokaal en niet-gravitationeel experiment is onafhankelijk van de plaats
en het tijdstip waarop het experiment wordt uitgevoerd.

Delen (ii) en (iii) noemen we, respectievelijk, het LLI-beginsel (Local Lorentz-invariance) en het
LPI-beginsel (Local Position Invariance). In de formulering hierboven slaat de term ‘lokaal’ op
het feit dat het experiment wordt uitgevoerd in een voldoend kleine omgeving, zodat b.v. effecten
t.g.v. getijdenwerking verwaarloosbaar zijn. De term ‘niet-gravitationeel’ spreekt voor zichzelf:
de meting van b.v. de electrostatische aantrekkingskracht tussen twee geladen deeltjes is een niet-
gravitationeel experiment, terwijl de meting van de cavendish-constante G een voorbeeld is van
een gravitationeel experiment.
LLI wordt in principe getest door elk experiment dat B.R. test, zoals b.v. het michelson-morley
experiment. Experimenten die LLI testen door anisotropieën te zoeken, die aanleiding zouden geven
tot opsplitsing van de grondtoestand van een Li7 kern in een magneetveld3 , bereikten reeds in 1960
een precisie van 10−16 . Recente verbeteringen hebben de ‘anisotropie-parameter’ δ verder gere-
duceerd tot δ . 10−20 , waarmee LLI één der best geverifieerde hypothesen uit de fysica geworden
is. Voor een bespreking van de LPI-experimenten (slechts resulterend in δ . 10−4 ) zij verwezen
naar Hoofdstuk 6.
De LLI- en LPI-voorwaarden staan niet geheel los van elkaar. Het is zelfs vrij waarschijnlijk dat
elke volledige en zelf-consistente gravitatietheorie, die aan WEP voldoet, noodzakelijk ook EEP
impliceert. Dit is de zg. Schiff-Conjecture 4 . Een theorie wordt hierbij volledig genoemd, als ze
voorzien is van de nodige basisprincipes om het resultaat van een willekeurig experiment effectief
te voorspellen. Het volstaat b.v. niet dat een theorie postuleert dat twee deeltjes met verschillende
samenstelling even snel vallen in een gravitatieveld: dergelijk gedrag moet afleidbaar zijn uit
de wetten die de verschillende inwendige structuren vastleggen! Strikt beschouwd verdient geen
enkele huidige gravitatietheorie het etiket ‘volledig’. In de praktijk blijkt echter dikwijls, dat het
al voldoende is om over een gravitationeel gemodifieerd stel maxwell-vergelijkingen te beschikken
om experimenteel verifieerbare uitspraken te kunnen maken over het gedrag van deeltjes met een
verschillende chemische samenstelling.
De eigenschap van zelf-consistentie slaat op de uniciteit van de voorspellingen voor een gegeven
experimentele situatie. Zo wordt gewoonlijk geëist dat de berekening van de afbuiging van het
licht nabij de zon (zie Hoofdstuk 5) hetzelfde resultaat moet opleveren, zowel in de geometrische-
optica-limiet van de maxwell-vergelijkingen, als in de m0 = 0-limiet van massieve testdeeltjes.
3 Hughes-Sherwin-Drever
4 L. Schiff, 1960
90 HOOFDSTUK 3. BEGINSELEN VAN DE ALGEMENE RELATIVITEITSTHEORIE

Schiff’s Conjecture is moeilijk—zoniet onmogelijk—te bewijzen. We beschikken immers niet


over een algemeen model van volledige en zelf-consistente gravitatie-theorieën, waarin niet aan
LLI of LPI voldaan is. Gedeeltelijke bewijzen zijn geformuleerd, waarin afwijkingen van EEP
b.v. gemodelleerd werden, door op zeer algemene wijze lorentz-invariantie verbrekende termen in
de actie-integraal van het electromagnetisch veld te introduceren. Het blijkt dan dat lichamen met
een verschillende chemische samenstelling (waarvoor dus de electromagnetische bindingsenergie
op verschillende wijze bijdraagt tot de totale relativistische energie) inderdaad een verschillend
valgedrag vertonen in een gegeven gravitationeel veld!

Het belang van EEP ligt in het feit dat het het bestaan impliceert van een unieke symmetrische
tensor g van type (2, 0), die zich in elk vrij vallend referentiestelsel reduceert tot de minkowski-
metriek en die instaat voor de koppeling tussen gravitatie en de niet-gravitationele velden. On-
derstel immers het bestaan van twee zulke metrieken: één die het gedrag bepaalt van neutrale
testdeeltjes, en één die optreedt in de gravitationeel gemodifieerde maxwell-vergelijkingen: ten-
minste voor theorieën gebaseerd op een actiebeginsel, zou dit resulteren in een plaats-afhankelijke
verhouding van electromagnetische bindingsenergie tot totale energie en dus, zoals hiervoor, in een
verbreking van EEP.
De uniciteit van de tensor g laat nu toe om de niet-gravitationele wetten van de fysica in de
aanwezigheid van gravitatie te bepalen, door op covariante wijze over te gaan van hun beperkt
relativistische vorm naar de algemene vorm. We vatten dit samen in de volgende twee regels5 :
• Vervang η door g.
• Vervang partiële afgeleiden door covariante afgeleiden.
We stellen dus vast dat er een vrij nauw afgebakend pad bestaat dat, van WEP via EEP, leidt
naar de z.g. metrische gravitatietheorieën. Deze theorieën gaan ervan uit dat
(i) de ruimte-tijd voorzien is van een lorentz-metriek,
(ii) de banen van ongeladen testdeeltjes gegeven worden door de geodeten van deze metriek,
(iii) de niet-gravitationele wetten van de fysica uitsluitend via deze metriek (en evt. de ervan
afgeleide geometrische objecten) gekoppeld zijn aan de structuur van de ruimte-tijd, en wel
zó dat deze wetten in geodetische normale coördinaten hun standaard B.R. vorm aannemen
(de supersnaar theorie b.v. is geen metrische gravitatietheorie).
Het principe dat slechts één metriek verantwoordelijk is voor de koppeling tussen de ruimte-tijd
en de lokale fysica, wordt soms ook het universal coupling principle genoemd. Gebruik makend
van newtoniaanse terminologie zeggen we dat gravitatie een ‘universele kracht’ is. Dit is precies
wat toelaat om gravitatie te promoveren tot een eigenschap van de ruimte-tijd, eerder dan een
extra fysisch veld op de ruimte-tijd! Hieromtrent bestaan nog steeds de grootste misvattingen, zie
b.v. de populaire interpretatie m.b.t. het gedrag van klokken in een gravitatieveld, of de kritieken
van de conventionalistische school op de relativiteitstheorie.
Voorbeelden van enkele klassieke metrische theorieën zijn, naast A.R., de Brans-Dicke en de
ermee verwante scalar-tensor theorieën, de vector-tensor theorieën (Nordtvedt) en Rosen’s bi-
metrische theorieën. Op de laatste na, zijn dit bovendien gevallen van z.g. zuiver dynamische
theorieën: de optredende tensor-velden (φ, g, v, . . . ) beı̈nvloeden (samen met de ‘conventionele’
5 zoals zal blijken in de volgende paragraaf, verloopt dit proces echter niet altijd op triviale wijze . . .
3-4. EINSTEIN’S EQUIVALENTIEBEGINSEL 91

materie ruimte - tijd

Figuur 3.3: zuiver dynamische theorie

materie-vormen) via de veldvergelijkingen de structuur van de ruimte-tijd, terwijl deze laatste op


zijn beurt—maar uitsluitend via g—het gedrag van de materie bepaalt.
Hiertegenover staan de absolute theorieën, waarin zgn. absolute elementen in optreden. Dit
zijn b.v. velden waarvan de structuur of de evolutie onafhankelijk is van de evolutie van de overige
velden uit de theorie: dit kan een vlakke achtergrond- metriek zijn (Rosen), een kosmische tijd t,
of zelfs algebraische betrekkingen van de vorm gab = hab + ka kb met h en k dynamische velden.
92 HOOFDSTUK 3. BEGINSELEN VAN DE ALGEMENE RELATIVITEITSTHEORIE

3-5 Sterk Equivalentiebeginsel


Bekijken we nu, binnen de klasse van zuiver dynamische theorieën, een z.g. lokaal gravitationeel
experiment. Zulk experiment speelt zich per definitie af in een omgeving, die klein genoeg is om
inhomogeniteiten—veroorzaakt door de ‘uitwendige’ gravitatievelden— te verwaarlozen, maar die
groot genoeg is om een lokaal gravitationeel systeem te bevatten. Dergelijk systeem kan b.v. een
cavendish-opstelling zijn in het labo of, desgewenst, het zonnestelsel . . . . Om het resultaat van dit
experiment te berekenen zijn twee stappen nodig:

1) bepaal het gedrag van het ‘uitwendig’ systeem en leg alzo de randvoorwaarden vast voor het
lokale systeem,

2) los m.b.v. de bekomen randvoorwaarden de veldvergelijkingen op voor het lokale systeem.

We stellen dus vast dat, via de randvoorwaarden, de lokale resultaten (b.v. de cavendish-constante
of de evolutie-eigenschappen van een ster) beı̈nvloed kunnen worden door het uitwendig sys-
teem. Dit geldt niet voor A.R., omdat in het grensgebied van de twee deelsystemen steeds een
coördinatenstelsel kan gekozen worden6 waarin g ≈ η, zodat de randvoorwaarden onafhankelijk
zijn van de positie of de snelheid van het lokale systeem t.o.v. zijn omgeving. Binnen andere
theorieën kan dit fenomeen echter leiden tot zgn. preferred frame of preferred location effects. Zo
zal in b.v. Brans-Dicke-theorie de lokaal gemeten cavendish-constante evolueren in functie van de
tijd, onder invloed van de kosmische evolutie van een scalair veld φ(t).
Vandaar dat nog een sterker beginsel dan EEP geı̈ntroduceerd wordt, namelijk het Sterk Equi-
valentiebeginsel (Strong Equivalence Principle, SEP), waarin gesteld wordt dat:

(i) WEP geldt voor neutrale testdeeltjes en voor zelf-graviterende lichamen,

(ii) het resultaat van elk lokaal experiment onafhankelijk is van de snelheid van de vrij vallende
waarnemer,

(iii) het resultaat van elk lokaal experiment onafhankelijk is van de plaats en het tijdstip waarop
het werd uitgevoerd.

Op het ogenblik is, op A.R. na, geen enkele zuiver dynamische theorie gekend die aan SEP voldoet.
Bovendien leveren zonnestelsel-experimenten en waarnemingen van binaire pulsars uiterst sterke
beperkingen op ‘preferred frame’ of ‘preferred location’ parameters van mogelijke andere theorieën7 .

6 kan
dit wel globaal over de rand, b.v. voor niet enkelvoudig samenhangende gebieden?
7 wat
geen van deze andere theorieën uitsluit: dikwijls komen hierin parameters voor, die zodanig aan te passen
zijn, dat de theorie elke SEP test—samen met A.R.—glansrijk doorstaat
3-6. MINIMALE KOPPELING 93

3-6 Minimale koppeling


Als we ons binnen de klasse van zuiver dynamische theorieën beperken tot de meest eenvoudige—
en wellicht ook tot de enige theorie waarin strikt aan SEP voldaan is, dan belanden we bij de
algemene relativiteitstheorie. Reeds eerder merkten we echter al op dat de overgang van B.R. naar
A.R. niet uniek vastligt. Bekijken we b.v. de behoudswetten van B.R., namelijk

∂b T ab = 0 (3-6.1)

dan is de eenvoudigste covariante veralgemening weliswaar

∇b T ab = 0 (3-6.2)

maar anderzijds reduceren ook de vergelijkingen

∇b T ab + Rabcd ∇c Tbd = 0 (3-6.3)

zich, in afwezigheid van gravitatie, tot 3-6.1.


Een bijkomend principe is dus nodig om de stap van B.R. naar A.R. op éénduidige wijze te
kunnen zetten. We aanvaarden daarom volgend z.g. minimale koppelingsbeginsel :
• Bij de overgang van B.R. naar A.R. mogen geen termen gebruikt worden waarin de krom-
mingstensor expliciet optreedt.
Dit beginsel is erg vaag: een preciezere formulering kan gegeven worden voor theorieën gebaseerd
op een actiebeginsel (door in de lagrangiaan voor de niet-gravitationele velden enkel bijdragen in
g en zijn eerste afgeleiden toe te laten), maar dient zelfs dán met de nodige omzichtigheid gehan-
teerd te worden8 . Dat neemt niet weg dat het minimale koppelingsbeginsel ons een leidraad geeft
om de wetten van de fysica op te stellen in de aanwezigheid van gravitatie. We bekijken in de
volgende paragrafen achtereenvolgens het gedrag van testdeeltjes, van perfecte vloeistoffen en van
electromagnetische velden.

3-6.1 Testdeeltjes
Net zoals in B.R. stellen we de beweging van massieve en van massaloze testdeeltjes voor d.m.v.
tijd-achtige, respectievelijk nul-krommen. Voor tijd-achtige krommen normeren we de snelheid u
steeds zó dat
u2 = gab ua ub = −1 (3-6.4)
i.e. ui = dxi /dτ met τ de eigentijd langs de kromme. Vrije deeltjes bewegen op geodeten:

a = ∇u u = 0 (3-6.5)

wat, in componenten uitgedrukt, betekent dat

ub ua ;b = 0 (3-6.6)

of
d2 xi dxj dxk
2
+ Γi jk =0 (3-6.7)
dτ dτ dτ
8 in vele modellen wordt hier trouwens vandaag bewust van afgeweken!
94 HOOFDSTUK 3. BEGINSELEN VAN DE ALGEMENE RELATIVITEITSTHEORIE

Is a 6= 0, dan zeggen we dat er op het deeltje een kracht f werkt met, per definitie, f = ma
(voortaan gebruiken we m voor de rustmassa). Voor een geladen deeltje in een electromagnetisch
veld bekomen we dan b.v. de lorentz-wet
q b a
ua ∇a ub = F au (3-6.8)
m
Het impuls van het deeltje blijft gedefinieerd door

p = mu (3-6.9)

en een waarnemer (waarvan de baan deze van het deeltje snijdt in een punt A) met snelheid v
(v2 = −1) schrijft aan het deeltje in A een energie

E = −pa v a (3-6.10)

toe.
Tot besluit van deze paragraaf weze opgemerkt dat een beperkt aantal fysisch plausibele hypothesen
m.b.t. het gedrag van massieve en massaloze testdeeltjes volstaat om het bestaan aan te tonen
van een — op een constante schaalfactor na — unieke lorentz-metriek g met de eigenschap dat de
testdeeltjes bewegen op resp. de geodeten en de nulgeodeten van g9 . Hypothesen over het gedrag
van fysische klokken en meetstaven zijn dus totaal overbodig bij het opstellen van de fundamenten
van de theorie!

3-6.2 Perfecte vloeistoffen


De ganse bespreking van 2-5.2 kan nu herhaald worden, mits ηab te vervangen door gab . We
herhalen even de hoofdpunten:
Een perfecte vloeistof wordt gekenmerkt door een energie-impulstensor

Tab = ρua ub + p(gab + ua ub ) (3-6.11)

die voldoet aan de behoudswetten


∇b Ta b = 0 (3-6.12)
Hieruit volgen dan de algemeen relativistische versies van
i) de continuı̈teitsvergelijking
ρ̇ + (ρ + p)Θ = 0 (3-6.13)
waarbij we de notaties ρ̇ = ρ|a ua en Θ = ∇a ua gebruiken, en
ii) de Navier-Stokes-vergelijkingen:

(p + ρ)ab + (g ab + ua ub )∇a p = 0 (3-6.14)

3-6.3 Electromagnetisme
In een gekromde ruimte-tijd worden de maxwell-vergelijkingen gegeven door

F ab ;b =4πJ a (3-6.15)
9 Ehlers-Pirani-Schild 1971
3-6. MINIMALE KOPPELING 95

en

F[ab;c] =0 (3-6.16)
of resp. ∗d ∗ F = 4πJ en dF = 0 in een 2-vorm formalisme. T.g.v. de anti-symmetrie van F is dan
automatisch voldaan aan de behoudswet
J b ;b = 0 (3-6.17)
De energie-impulstensor van het electromagnetisch veld is gegeven door
1 1
T ab = (F a c F bc − g ab Fcd F cd ) (3-6.18)
4π 4
en voldoet, t.g.v. 3-6.15 en 3-6.16 aan
∇b T ab = −F a b J b (3-6.19)
zodat voor een vrij maxwell-veld (J = 0) opnieuw de behoudswetten 3-6.12 geldig zijn. Voeren
we net zoals in 2-6 de vectorpotentiaal A in, zodat Fab = 2A[b;a] , dan volgt nu echter dat in de
z.g. lorentz-ijk (Ab ;b = 0)
−4πJb =∇a (Ab;a − Aa;b )
=∇a ∇a Ab − ∇a ∇b Aa
=∇a ∇a Ab − ∇b ∇a Aa + g ac (∇b ∇c − ∇c ∇b )Aa
(3-6.20)
=∇a ∇a Ab + g ac Rm abc Am
=∇a ∇a Ab − Rmc cb Am
=∇a ∇a Ab − Rm b Am
wat wijst op dubbelzinnigheden bij de toepassing van de minimale koppelingsregel. Een ander
gevolg is dat de discussie m.b.t. electromagnetische golven in 2-6 alleen maar geldig is voor
A.R., indien de kromming slechts weinig verandert over afstanden die vergelijkbaar zijn met de
golflengtes!

3-6.4 Behoudswetten
We blijven de vergelijkingen 3-6.12 de behoudswetten voor de energie-impulstensor noemen. Een
belangrijk onderscheid met B.R. is echter, dat met deze wetten niet zonder meer behouden groothe-
den te construeren zijn! Begrippen als ‘totale energie’ of ‘totaal impuls’ van b.v. een wolk niet-
interagerende deeltjes zijn dus, in het algemeen, niet meer gedefinieerd. Alleen als de ruimte-tijd
symmetrieën toelaat, kunnen corresponderende behouden grootheden gevonden worden:
Als b.v. K een killing-vector is, voldoet P a = T ab Kb aan
P a ;a =T ab ;a Kb + T ab Kb;a
(3-6.21)
=0
t.g.v. 3-6.12 en de anti-symmetrie van Ka;b .
M.b.v. de stelling van Gauss resulteert dan voor elke killing-vector K een behoudswet, in de zin
dat de ‘K-flux van energie-impuls doorheen een gesloten oppervlak verdwijnt’:
Z
Pa dσ a = 0 (3-6.22)
∂U
voor elk compact en oriënteerbaar gebied U met rand ∂U .
96 HOOFDSTUK 3. BEGINSELEN VAN DE ALGEMENE RELATIVITEITSTHEORIE

3-7 Correspondentiebeginsel
Een laatste beginsel heeft te maken met het feit dat (succesvolle) fysische theorieën over een
welbepaald geldigheidsgebied beschikken en dat nieuwe theorieën consistent dienen te zijn met de
voorspellingen van oude, binnen het geldigheidsgebied van deze laatste. I.h.b. verwachten we van
A.R. dat ze overeenstemt met B.R. in de afwezigheid van gravitatie én overeenstemt met Newton’s
gravitatietheorie in de limiet van traag bewegende lichamen en zwakke gravitationele velden. Dit
is de inhoud van het correspondentiebeginsel, dat in volgend hoofdstuk een belangrijke rol gaat
spelen bij het opstellen van de veldvergelijkingen.
Hoofdstuk 4

Veldvergelijkingen

In het vorige hoofdstuk hebben we gezien op welke manier we het gedrag van materie in een
gekromde ruimte-tijd kunnen beschrijven. Daarmee beschikken we echter nog niet over een dy-
namische gravitatietheorie. Om tot het volgende machiaanse schema te komen, moeten we de

“geometry tells matter how to move”

gab Tab

“matter tells geometry how to be”


Figuur 4.1:

geometrie zélf promoveren tot een dynamische variabele, die op zijn beurt afhankelijk is van de
materie-verdeling in de ruimte-tijd. De te gebruiken variabele ligt voor de hand, namelijk de me-
triek g. Voor de componenten van g gaan we vervolgens op zoek naar een gepast stel partiële
differentiaalvergelijkingen, waarin de materieverdeling fungeert als bron-term (cf. de poisson-
vergelijking). De studie van geodeten, i.h.b. van de geodetische deviatie, zal hierbij de belangrijkste
leidraad worden. Het is immers het optreden van deviatie dat karakteristiek is voor gravitatie!

97
98 HOOFDSTUK 4. VELDVERGELIJKINGEN

Figuur 4.2:

Bekijken we opnieuw het gedachten-experiment met de labo’s A en B, waarbij A wordt voort-


gestuwd met uniforme versnelling −~g en waarbij B in rust is op het aardoppervlak: B is onderhevig
aan de valversnelling ~g en, zoals in vorig hoofdstuk werd uiteengezet, locale experimenten geven
voor beide waarnemers A en B precies dezelfde resultaten. Indien echter het labo B voldoende
groot is (of indien de waarnemingen in B voldoende precies gebeuren), dan zal men vaststellen
dat testdeeltjes (die in A parallelle banen beschrijven) tijdens hun val beginnen te convergeren. In
B kan daarom besloten worden dat men zich in een ‘echt’ gravitatieveld bevindt, terwijl A zich
slechts in een ‘fictief’ gravitatieveld bevindt. Door middel van een gepaste coördinaattransformatie
kan de metriek van A gereduceerd worden tot de minkowski-metriek, terwijl dit in B niet mogelijk
is!
4-1. VACUÜMVERGELIJKINGEN 99

4-1 Vacuümvergelijkingen
Stellen we eerst de newtoniaanse deviatievergelijking op voor twee testdeeltjes, die in vacuüm
bewegen langs naburige krommen C1 en C2 . Stel dat de vergelijkingen van deze krommen respec-
tievelijk gegeven zijn door ~r1 = ρ
~(t) en ~r2 = ρ ~
~(t) + X(t), ~ de deviatievector: Noemen we Φ
met X

C1
C2

Figuur 4.3: geodetische afwijking

de gravitationele potentiaal, dan is

~¨ = − ∇Φ|C1
ρ (4-1.1)

en

ρ ~¨ = − ∇Φ|C
~¨ + X (4-1.2)
2

~ voldoende klein, ∇Φ|C ≈ ∇Φ|C + X.∇(∇Φ)|


Nu is, voor |X| ~ C1 , zodat
2 1

~¨ + X.∇(∇Φ)
X ~ =0 (4-1.3)

In componenten uitgedrukt betekent dit (met α, β = 1, 2, 3)

Ẍ α + K α β X β = 0 (4-1.4)

waarbij K (de getijdentensor genoemd) de symmetrische tensor is met

Kαβ = ∇α ∇β Φ (4-1.5)

Bekijken we nu terug de relativistische deviatievergelijkingen uit 1-11 en noteren we ˙ = ∇T , met


T de eenheidsvector rakend aan de deeltjesbaan:

Ẍ a − Ra bcd T b T c X d = 0 (4-1.6)
100 HOOFDSTUK 4. VELDVERGELIJKINGEN

Kiezen we een orthonormale basis met e0 = T, dan worden de ruimtelijke componenten van deze
vergelijkingen gegeven door
Ẍ α − Rα 00β X β = 0 (4-1.7)
wat precies van dezelfde vorm is als 4-1.4, mits we de tensor K α β identificeren met −Rα 00β . Nu
reduceren in newtoniaanse gravitatie de vacuumvergelijkingen zich tot de laplacevergelijking, i.e.
tot het spoor-vrij zijn van K:
tr(K) = ∇α ∇α Φ = 0 (4-1.8)
zodat het correspondentiebeginsel suggereert om aan de krommingstensor de eis op te leggen dat
Rα 00α = 0. Met 1-10.8 betekent dit dat R00 = 0 voor elke keuze van de tijd-achtige eenheidsvector
e0 , waaruit we afleiden dat de volledige riccitensor 0 moet zijn: stel t ∼ e0 + λeα met λ klein
genoeg opdat t2 < 0. Uit Rab ta tb = 0 volgt dan

∀λ : λRαα + 2Raα ea 0 = 0

en dus R0α = 0. Bijgevolg bestaat er een basis waarin Rab diagonaal is1 en een herhaling van
dezelfde redenering toont dat dan ook de diagonaal-elementen Rαα = 0 zijn.
We besluiten dus, op basis van het correspondentiebeginsel, dat de vacuumvergelijkingen van
A.R. gegeven zijn door Rab = 0, of, volkomen equivalent hiermee, door

1
Gab ≡ Rab − Rgab = 0 (4-1.9)
2
Opmerking: een eerste lezing van de paragrafen over het equivalentiebeginsel (zie hoofdstuk 3)
suggereert wellicht dat ’echte’ gravitationele effecten (m.a.w. effecten die niet weg te transformeren
zijn door over te gaan op een lokaal vrij vallend referentiestelsel) éénduidig herkend kunnen worden
aan het niet 0 zijn van de getijdentensor K α β = −Rα 00β . Dit is een heikel punt —zelfs in vacuum—
omdat de weyltensor nog een ander, zogenaamd ’magnetisch’, deel bevat dat zich onafhankelijk van
het ’coulombgedeelte’ K α β gedraagt. Het al dan niet bestaan van dergelijke ’zuiver magnetische’
vacuum oplossingen of ’gravito-magnetische monopolen’ is een open probleem, waarin pas recent
enige doorbraak is gekomen.

4-2 Veldvergelijkingen in de aanwezigheid van materie


In de inleiding beklemtoonden we reeds dat de energie-impulsverdeling in de ruimte-tijd moet
leiden tot het ontstaan van kromming. Op basis van de in vorige paragraaf bekomen vacuümver-
gelijkingen en van het feit dat de energie-impulstensor een symmetrische tensor is, die net zoals
de einstein-tensor voldoet aan de behoudswetten ∇b Ta b = 0, ligt het voor de hand om voor de
volledige veldvergelijkingen te postuleren dat

Gab = κTab (4-2.1)

met κ een constante. De waarde van κ volgt dan opnieuw uit het correspondentie-beginsel en de
newtoniaanse limiet:
1 Dit is niet triviaal: de signatuur van de metriek maakt dat een symmetrische tensor, zoals R , niet zonder
ab
meer te diagonaliseren is: er bestaat dus niet noodzakelijk een lorentz-transformatie zodat Rab Λa a′ Λb b′ diagonaal
is
4-3. STRUCTUUR VAN DE VELDVERGELIJKINGEN 101

Herschrijven we 4-2.1 eerst als


1
Rab = κ(Tab − T gab ) (4-2.2)
2
en bekijken we, t.o.v. een bepaalde waarnemer met snelheid = e0 , een energie-impulsverdeling
waarvoor druk en energie-impulsstroom verwaarloosbaar zijn t.o.v. T00 = ρ. Er geldt dan T ≈ −ρ,
zodat 4-2.2 impliceert dat R00 ≈ 21 κρ. Stellen we dan, zoals hiervoor, K α β = −Rα 00β , dan is dus
tr(K) = −Rα 00α = Rα 0α0 = 12 κρ.
Nu voldoet in newtoniaanse gravitatietheorie K aan de poisson-vergelijking:
tr(K) = ∇α ∇α Φ = 4πρ (4-2.3)
zodat het correspondentiebeginsel impliceert dat κ = 8π. We bekomen dus voor de volledige
veldvergelijkingen de gedaante
Gab = 8πTab (4-2.4)
N.B. Dit is de vorm van de vergelijkingen in z.g. gravitationele eenheden (zie bijgevoegde tabel),
namelijk G = 1 en c = 1. In willekeurige eenheden geldt dat
8πG
Gab = Tab (4-2.5)
c2
met G en c de waarden van de cavendish-constante en van de lichtsnelheid in de gekozen eenheden
(G ≈ 6, 67 10−11 m3 kg −1 s− 1 en c ≈ 3 108 ms−1 ).
In onderstaande tabel geven we enkele standaardgrootheden in gravitationele eenheden:

massa straal

elektron 2.10−66 s . 10−26 s


proton 4.10−61 s 10−23 s
aarde 1, 5.10−11 s 2.10−3 s
zon 5.10−6 s 2, 3 s
sterrenstelsel ≈ 105 s ≈ 1013 s
Hubble-volume van het heelal & 6.1015 s & 5.1017 s

Men kan zich de vraag stellen of de einstein-tensor de enige divergentie-vrije tensor is, die is
opgebouwd m.b.v. de metriek en zijn eerste en tweede orde partiële afgeleiden (op de triviale
veralgemening Gab + Λgab na, met Λ een constante). Het antwoord op deze vraag is bevestigend,
op voorwaarde dat de dimensie van de ruimte-tijd = 4 is (in tegenstelling tot wat beweerd wordt in
[Weinberg], is het niet nodig de bijkomende eis op te leggen dat de tweede orde partiële afgeleiden
hoogstens lineair optreden). Pas als de dimensie groter is dan 4, ontstaan er problemen met de
uniciteit van de einstein- tensor .

4-3 Structuur van de veldvergelijkingen


Voor een gegeven energie-impulstensor vormen de veldvergelijkingen een stelsel van 10 niet-lineaire
partiële differentiaalvergelijkingen voor de 10 metrische componenten gab . Deze vergelijkingen zijn
echter niet onderling functioneel onafhankelijk, t.g.v. de gecontracteerde bianchi-identiteiten:
∇b Ga b = 0 (4-3.1)
102 HOOFDSTUK 4. VELDVERGELIJKINGEN

De resulterende onder-bepaaldheid van 4-2.4 was te verwachten, aangezien dit een tensor-verge-
lijking is en dus invariant is onder diffeomorfismen F : M → M. Als g een oplossing is van de
veldvergelijkingen, dan is ook F∗ g een oplossing: stellen we F voor door het stel vergelijkingen
a a
x′ = x′ (x), dan komt deze uitspraak gewoon neer op het feit dat de componenten gij slechts
a
bepaald zijn op coördinaattransformaties xa → x′ na.
M.b.v. deze coördinaattransformaties kunnen we 4 van de 10 metrische componenten vrij kiezen.
Een mogelijke keuze (de z.g. gauss-normale coördinaten) kan b.v. leiden tot g00 = 1 en g0α = 0
(α = 1, 2, 3). De zes componenten gαβ kunnen dan in principe uit de zes resterende onafhankelijke
vergelijkingen bepaald worden. We leggen de nadruk op ‘in principe’, omdat—zelfs voor vacuüm—
een algemene oplossing van de veldvergelijkingen niet gekend is. De grote moeilijkheid ligt in de
niet-lineariteit van de vergelijkingen, wat resulteert in het ontbreken van een superpositieprincipe.
Een aanzienlijk aantal bijzondere oplossingen (voor vacuüm, zowel als voor verschillende materie-
vormen) is nochtans gekend: de meeste van deze oplossingen werden bekomen door het opleggen
van sterke symmetrie-voorwaarden. Op een aantal van deze oplossingen komen we in de volgende
hoofdstukken terug.
Ook via benaderingsmethoden werden belangrijke resultaten geboekt, vooral dan in het domein
van de hemelmechanica (PPN- en PPPN-formalismen), de astrofysica van neutronensterren en van
zwarte gaten. Recent numeriek onderzoek concentreert zich vooral op de interacties tussen zwarte
gaten en de hierbij gegenereerde gravitationele straling. Een belangrijke rol hierbij wordt gespeeld
door een herformulering van de veldvergelijkingen als een beginwaardenprobleem. Hiertoe wordt
arbitrair een ruimtelijk hyperoppervlak Σ gekozen evenals een tijdscoördinaat t = x0 en worden
de veldvergelijkingen geschreven als een stel evolutievergelijkingen voor g met beginwaarden g|Σ
en ∂t g|Σ . Een moeilijkheid die hierbij ontstaat blijkt duidelijk wanneer we de identiteiten 4-3.1
herschrijven als
∂t G0i = −∂α Gαi − Γjmj Gmi − Γimj Gjm
(α = 1, 2, 3). Het rechterlid bevat geen 3de orde afgeleiden van gij naar t, zodat de termen
G0i in het linkerlid hoogstens 1ste orde afgeleiden naar t kunnen bevatten. De corresponderende
(0i) vergelijkingen zijn bijgevolg geen evolutievergelijkingen, maar wel z.g. constraints op de
beginwaarden. Dit toont opnieuw aan dat er slechts 6 ‘echte’ evolutievergelijkingen zijn, namelijk2
Gαβ = 8πTαβ voor 10 onbekenden, waarvan er 4 vrij te kiezen zijn.

Een gevolg van de invariantie van de veldvergelijkingen onder diffeomorfismen, is dat zoals
eerder reeds beklemtoond een ruimte-tijd gezien moet worden als een equivalentieklasse van koppels
(M, g), waarbij (M, g) ∼ (M, g′ ) als g′ = F∗ g. Dit leidt onmiddellijk tot de vraag of, voor twee
gegeven metrieken een methode bestaat om te bepalen of ze al dan niet representanten zijn van
dezelfde klasse. Dit is het z.g. equivalentie-probleem. Door E. Cartan werd een methode ontwikkeld,
die o.a. de berekening inhoudt van alle covariante afgeleiden van de beide riemanntensoren, tot
en met de 10de orde! Recent werd, m.b.v. tetrad-methodes, een verbetering bekomen door A.
Karlhede, waarbij in het slechtst denkbare geval maximaal 7de orde afgeleiden berekend dienen
te worden. Met computer-algebra pakketten en speciaal ontworpen programma’s, zoals SHEEP,
CLASSI en STENSOR, is momenteel een database samengesteld van exacte oplossingen, die toelaat
om de originaliteit van elke ‘nieuwe’ oplossing op invariante wijze te controleren3 . Hierbij bleek dat
2 elk van de gedaante g00 gαβ,00 = φαβ (g, ġ)
3 De gevolgde procedure is niet volledig algorithmisch: de enige niet-algorithmische stap kon—tot op heden—
echter steeds ‘op zicht’ genomen worden.
4-3. STRUCTUUR VAN DE VELDVERGELIJKINGEN 103

voor de classificatie van alle tot dusver gekende oplossingen van de veldvergelijkingen, nog nooit
meer dan 4 covariante afgeleiden van de riemanntensor bepaald moesten worden. Of er metrieken
zijn, waarvoor we tot de theoretische bovenlimiet 7 dienen te gaan, is alsnog een open vraag.
104 HOOFDSTUK 4. VELDVERGELIJKINGEN
Hoofdstuk 5

Zwakke velden en gravitationele


straling

De geometrie van de ruimte-tijd wordt bepaald door de energie-impulsverdeling. We verwachten


daarom dat een kleine ’verandering’ in de energie-impulsverdeling, bij niet stationaire fenomenen,
aanleiding kan geven tot kleine ’rimpeltjes’ in de geometrie. In tegenstelling tot de newtoniaanse
action at a distance verwachten we —bij gebrek aan een andere karakteristieke snelheid die in de
theorie optreedt— dat de rimpeltjes zich golfsgewijs verplaatsen met de lichtsnelheid. Als gevolg
van de zwakte van gravitatie verwachten we ook dat gravitationele straling een zeer zwak ver-
schijnsel is. Dit heeft als nadeel dat de straling zeer moeilijk detecteerbaar is (een internationaal
netwerk van laser-interferometer detectoren staat nog steeds in zijn kinderschoenen en resultaten
zijn tot dusver niet geboekt), maar dit maakt het fenomeen precies ook weer interessant: moeilijke
detecteerbaarheid gaat hand in hand met zwakke absorptie, zodat gravitatiestraling ons in principe
een heel nieuwe en ‘doordringende’ kijk op het heelal kan leveren. Er zijn immers heel wat bronnen
in het heelal die dergelijke gravitatiegolven kunnen veroorzaken, zoals binaire sterren, niet-sferische
collaps of botsingen van zwarte gaten.

We beperken ons in wat volgt tot zwakke gravitatiegolven in een zgn. asymptotisch vlakke
ruimte-tijd, waarvoor de lineaire benadering van de veldvergelijkingen volstaat.

5-1 De lineaire benadering


Onderstel dat de metriek g kan geschreven worden als een vlakke metriek η + een kleine pertur-
batie:
g = η + ǫh (5-1.1)
met |ǫ| ≪ 1 en |h| ≈ 1 (waarmee bedoeld wordt dat er coördinaten x bestaan zodat

gij = ηij + ǫhij (5-1.2)

met |ǫ| ≪ 1 en |hij | ≈ 1 ∀xi , xj ).

Een eerste moeilijkheid die we ontmoeten is (zie paragraaf 3-3) dat een ruimte-tijd een equi-
valentieklasse is van lorentz-variëteiten (M, g) die slechts op een diffeomorfisme na bepaald zijn.

105
106 HOOFDSTUK 5. ZWAKKE VELDEN EN GRAVITATIONELE STRALING

Herinneren we ons dat, met Φ een diffeomorfisme van M, de metrieken g′ = Φ∗ g en g dezelfde


fysische eigenschappen hebben: dat geldt i.h.b. voor de 1-parametergroepen van diffeomorfismen
geassocieerd aan een vectorveld ξ (zie paragraaf 1-8) waarvoor
1
Lξ g = lim (Φ∗ǫ g − g) (5-1.3)
ǫ→0 ǫ

en dus

Φ∗ǫ g ≈ g + ǫLξ g ≈ η + ǫh + ǫLξ η (5-1.4)


m
Nu is (Lξ η)ij = ηim ξ,j + ηjm ξ,im = ξi,j + ξj,i , wat impliceert dat de metrieken gij = ηij + ǫhij

en gij = ηij + ǫ(hij + ξi,j + ξj,i ) dezelfde ruimte-tijd representeren. M.a.w. hij en

h′ij = hij + ξi,j + ξj,i (5-1.5)


stellen dezelfde fysische perturbatie voor.

We spreken nu verder af indices te ‘verhogen’ en te ‘verlagen’ met de tensor η, m.a.w.

hij = η im η jn hmn (5-1.6)


zodat (alle gelijkheden dienen nu gelezen te worden als geldend tot op orde 1 in ǫ)

g ij = η ij − ǫhij . (5-1.7)
Voor de christoffelsymbolen resulteert dit in
1 i
Γijk = ǫ(h + hik,j − h,i
jk ) (5-1.8)
2 j,k
en dus voor de riemann-tensor in
1
Rijkl = ǫ(hil,jk + hjk,il − hik,jl − hjl,ik ). (5-1.9)
2
Opmerking:

1) Dit toont nogmaals dat h′ij = hij + ξi,j + ξj,i en hij dezelfde fysische perturbatie voorstellen,
aangezien tot op 1ste orde in ǫ

Rijkl = Rijkl + ǫ(Lξ R)ijkl (5-1.10)
m
Rmjkl ξ,im

= Rijkl + ǫ ξ Rijkl,m + + ... (5-1.11)
2
= Rijkl + O(ǫ ) (5-1.12)

2) 5-1.9 voldoet automatisch aan de bianchi-identiteiten.

Hiermee bekomen we voor de ricci-tensor


1 m
Rij = ǫ(h + hm
j ,im − hij − h,ij ) (5-1.13)
2 i ,jm
met h = hm ij
m en  = η ∂i ∂j en dus
5-1. DE LINEAIRE BENADERING 107

R = ǫ(hmn ,mn − h). (5-1.14)


Enige vereenvoudiging treedt op door over te gaan op de nieuwe veranderlijke
1
ψij = hij − ηij h (5-1.15)
2
(de zgn. trace-reversed amplitudes, vanwege ψ = −h). We bekomen dan

1
Rij = ǫ(ψim ,jm + ψjm ,im − hij ) (5-1.16)
2
1
R = ǫ(2ψ mn ,mn − h) (5-1.17)
2
en dus
1  m 
ǫ ψi ,jm + ψjm ,im − ψij − ηij ψ mn ,mn
Gij (= 8πTij ) = (5-1.18)
2
De volgende stap is cruciaal: merk op dat voorgaande vergelijking zich reduceert tot een gewone
golfvergelijking

ǫψij = −16πTij (5-1.19)


mits we aan ψ de bijkomende voorwaarde opleggen dat

ψim ,m = 0. (5-1.20)
Aan deze voorwaarde kan nu altijd voldaan worden door middel van een transformatie 5-1.5,
of, in termen van ψ,
m
0 = ψ′ i ,m = ψim ,m − ξi (5-1.21)
Naar analogie met het electromagnetisme noemen we zulke keuze van het diffeomorfisme Φ de
lorentz-ijk 1 . Het diffeomorfisme is daarmee vastgelegd op transformaties 5-1.5 na, die nog voldoen
aan de voorwaarden ξi = 0.

Merk nog op dat 5-1.19 te herschrijven is als


1
ǫhij = −16π(Tij − ηij T )
2
en dus
1
ǫh00 ≈ −16π(ρ + (−ρ)) = −8πρ.
2
In de newtoniaanse benadering reduceert dit zich tot

ǫ∆h00 = 8πρ,

wat aantoont dat ǫh00 ≈ 2φ (φ de newtoniaanse gravitationele potentiaal) en dus

ds2 ≈ −(1 + 2φ)dt2 + dx2 + dy 2 + dz 2 .


1 ook wel de Einstein, de Donder, Hilbert of Fock ijk genoemd
108 HOOFDSTUK 5. ZWAKKE VELDEN EN GRAVITATIONELE STRALING

5-2 Vlakke gravitatiegolven


In vacuum reduceren de vergelijkingen 5-1.19 zich tot

hij = 0, (5-2.1)
waarbij h tevens moet voldoen aan de ijk-voorwaarden

1
Yi ≡ hm
i ,m − h,i = 0. (5-2.2)
2
De oplossingen van 5-2.1 zijn superposities van vlakke golven

hij = aij eik.x (5-2.3)


met aij de constante amplitude-matrix en met k2 = 0: de golfvector k is een nulvector en gra-
vitatiegolven planten zich dus voort met de lichtsnelheid. Men kan nu aantonen dat de resterende
diffeomorfisme-vrijheid (met ξi = 0) kan gebruikt worden om aan de amplitude-matrix de vol-
gende voorwaarden op te leggen (waarbij de coördinaten x0 = t, x1 = x, x2 = y, x3 = z zó gekozen
zijn dat ηij dxi dxj = −dt2 + dx2 + dy 2 + dz 2 ):

h = h0α = 0 (α = 1, 2, 3) (5-2.4)
(vanwege de keuze h = 0 noemt men dit ook de traceless gauge). De voorwaarden Yi = 0
reduceren zich hiermee tot

∂ 0
Y0 ≡ h = a00 iωeik.x = 0 (5-2.5)
∂t 0

→ −

waarbij we k = (ω, k ) gesteld hebben en ω = | k |, zodat a00 = 0. De voorwaarden

∂ m ∂ β
Yα ≡ h = h = aαβ k β eik.x = 0 (5-2.6)
∂xm α ∂xβ α
tonen dan aan dat, na oriëntatie van het assenstelsel zó dat de golf zich in de z-richting voort-
plant, aα3 = 0.

Er blijven dus slechts twee fysische vrijheidsgraden over en de amplitude-matrix neemt de


volgende gedaante aan,
 
0 0 0 0
0 a b 0
0 b −a 0 .
aij =   (5-2.7)
0 0 0 0
De corresponderende golf bestaat uit een superpositie van twee lineair gepolariseerde golven, e1 en
e2 ,

hij = aeij ij
1 + be2 (5-2.8)
met
5-2. VLAKKE GRAVITATIEGOLVEN 109

   
0 0 0 0 0 0 0 0
0 1 0 0 iω(z−t)
0 0 1 0
e1 =  e en e2 =   eiω(z−t) (5-2.9)
0 0 −1 0 0 1 0 0
0 0 0 0 0 0 0 0
Dat we hier werkelijk met een fysisch golfverschijnsel (en niet met een artefact van het coördi-
natenstelsel) te maken hebben, blijkt uit de studie van het onderling gedrag van testdeeltjes. Men
kan gemakkelijk nagaan dat Γα α
00 = 0 zodat de wereldlijnen x = constant geodten beschrijven.
α
Bekijken we echter twee testdeeltjes met constante x coördinaten (en b.v. gescheiden door een
coördinaatsafstand dα − ∆xα ), dan wordt hun onderlinge eigen-afstand d gegeven door

d2 = gαβ dα dβ = dα dβ + ǫhαβ dα dβ (5-2.10)


Dit betekent dat voor deeltjes gelegen langs de z-as d een constante is, terwijl deeltjes gelegen
in het xy-vlak een tijdsafhankelijke d vertonen: we spreken daarom van de transverse-traceless
gauge of de TT gauge. De beweging van de deeltjes in het xy-vlak is het gemakkelijkst voor te
stellen door invoering van een euclidisch vlak, waarin de posities van de deeltjes gegeven wordt
door de coördinaten Xα = dα + ǫ/2hβα dβ (immers d2 = Xα X α tot op 1ste orde in ǫ). De golven
h = e1 geven dan aanleiding tot het volgende gedrag in het XY -vlak,

X(0)(1 + 2ǫ cos ωt)


   
X(t)
= (5-2.11)
Y (t) Y (0)(1 − 2ǫ cos ωt)
Een op t = 0 cirkelvormige ring van testdeeltjes zal dus in de X en Y richtingen samengetrokken
resp. uitgerokken worden tot een ellips, terwijl onder invloed van de e2 golf hetzelfde gebeurt, maar
nu met ellipsen waarvan de assen gelegen zijn langs de bissectrices van de X, Y assen:

X(0) + 2ǫ Y (0) cos ωt)


   
X(t)
= (5-2.12)
Y (t) Y (0) + 2ǫ X(0) cos ωt)
Met behulp van laser-interferometrie wordt verwacht dat dergelijk gedrag in de loop van dit
decennium nog zal bevestigd worden.
110 HOOFDSTUK 5. ZWAKKE VELDEN EN GRAVITATIONELE STRALING
Hoofdstuk 6

Ist das wirklich so?

6-1 Zwak Equivalentiebeginsel


Alhoewel de eerste qualitatieve testen van WEP worden toegeschreven aan Simon Stevin en Galileo
Galilei op het einde van de 16de eeuw, moeten we voor de eerste quantitatieve resultaten wachten
op Newton. Newton besefte dat de inertiële massa mI , die optreedt als maat voor de ‘traagheid’
van een deeltje (mI ~a = F~ ), en de passieve1 gravitationele massa mP , die de kracht bepaalt waarmee
een deeltje wordt aangetrokken in een gravitationeel veld (F~ = −mP ∇V ), een verschillende rol
speelden in zijn theorie. Om over de massa van een deeltje te kunnen spreken, was het essen-
tieel dat de verhouding mI /mP voor deeltjes van verschillende samenstelling constant was. Pas
dan kon de wet mI a = mP g er voor zorgen dat de baan van dergelijke deeltjes onafhankelijk
was van hun samenstelling. Newton controleerde dit p m.b.v. een slinger: de bewegingsvergelijk-
ing mI lθ̈ + sin θmP g = 0 geeft een periode T ≈ 2π mI l/mP g, wat toeliet om met een relatieve
nauwkeurigheid van ongeveer 10−3 te verifiëren dat mI /mP onafhankelijk was van de samenstelling
der gebruikte testmassa’s:
(1) (1)
m /m − m(2) /m(2)

P I P I
2 (1) (1) (2) (2)
. 10−3 (6-1.1)
mP /mI + mP /mI

Aan het linkerlid van bovenstaande uitdrukking kunnen we een interpretatie geven, door bv. te
veronderstellen dat de verschillende inwendige energie-vormen (rust-energie en bindings-energieën
t.g.v. de wisselwerkingen) op verschillende wijzen bijdragen tot mP en mI . We kunnen dan in het
algemeen schrijven dat
X EA
m P = mI + ηA (6-1.2)
c2
A

met E A de bindingsenergie t.g.v. wisselwerking A en met η A een dimensieloze parameter, die een
maat is voor de WEP-verbreking. Twee deeltjes, geplaatst in een zelfde gravitationeel veld ~g ,

1 de actieve gravitationele massa is de grootheid mA , die optreedt in V = −GmA /r

111
112 HOOFDSTUK 6. IST DAS WIRKLICH SO?

ondervinden dan een relatieve versnelling


(1) (1)
m /m − m(2) /m(2)
(1)
a − a(2)
P I P I
η ≡2 (1) =2
(1) (1) (2) (2)
a + a(2) mP /mI + mP /mI
(1) (2)
X EA EA
≈ ηA ( (1) 2
− (2) c2
) (6-1.3)
A
m c m
(1) (2)
X EA EA
≤ ηA (1) −
A
m c2 m(2) c2

De parameter η wordt de eötvös-parameter genoemd, naar Lorand von Eötvös (1848-1919), die er
op het einde van de 19de eeuw in slaagde Newton’s resultaat te verbeteren met 5 grootte-ordes2 .
In het experiment van Newton was de rotatie van de slinger verantwoordelijk voor de termen in
het linkerlid van de bewegingsvergelijking, zodat variaties in de slingerlengte een natuurlijke limiet
plaatsten op de nauwkeurigheid van het experiment. Eötvös daarentegen gebruikte de rotatie van
de aarde om haar as en een torsiebalans, waarvan de arm loodrecht stond op een meridiaanvlak: op

as
GMr
r3 S ( ~ f1 + f2 )

q m1 d1 d2 m2

( as = w2 r sin q) f1 f2

Figuur 6.1: Eötvös - experiment

de deeltjes (1) en (2), opgehangen aan de balans, worden dan netto-krachten f~ = −mP GM
r3 ~
r +mI ~aS
uitgeoefend, zodat een netto-moment ontstaat

n = (d~1 × f~1 + d~2 × f~2 ).~s

Met ~s ∼ f~1 + f~2 en d~1 ≈ −d~2 ≈ d,


~ is dan

f~1 × f~2 ~
n =2 .d
|f~1 + f~2 |
m1 m2 GM ω 2 d
≈−η sin θ cos θ
m1 + m2 rg

Natuurlijk is de resulterende afwijking van de torsiebalans niet direct waarneembaar, maar door de
ganse opstelling over 180o te draaien, kan wél een waarneembaar effect ontstaan (want ~n → −~n):
2 gebruik makend van de torsiedraden van Charles Vernon Boyce (1855-1944), die erin geslaagd was om tot 9m

lange kwartsdraden te produceren met een doormeter van 10−2 tot 2 · 10−3 mm!
6-2. EINSTEIN’S EQUIVALENTIEBEGINSEL 113

de eerste resultaten op deze manier bekomen (η . 10−8 ) werden door Eötvös in 1890 gepubliceerd.
Een belangrijk nadeel van het experiment was de noodzaak om het ganse instrumentarium over
180o te moeten omkeren: daarom werd door Eötvös voorgesteld om de balans vast op te stellen
in een meridiaanvlak. Weliswaar verdwijnt dan het netto-moment t.g.v. de dagelijkse rotatie
van de aarde, maar de aantrekkingskracht van de zon zorgt nu voor een moment, dat bovendien
t.g.v. de dagelijkse rotatie een duidelijk herkenbaar signaal vertoont. Eötvös en zijn medewerkers
bereikten hiermee η . 6 10−9 en recentere versies van het experiment resulteerden in η . 10−11 (3 ),
η . 10−12 (4 ) en η . 10−13 (5 ). Een verbetering met nogmaals 2 tot 6 grootte-ordes mag verwacht
worden van het MICROSCOPE (2009) en het STEP-experiment (Satellite Test of the Equivalence
Principle), waarbij in een zgn. ‘drag-free satellite’ de beweging rond de aarde zal gevolgd worden
van deeltjes met verschillende samenstelling.

6-2 Einstein’s Equivalentiebeginsel


Gravitationele frequentieverschuivingsexperimenten werden door Einstein beschouwd als één der
drie belangrijkste testen van A.R.. Vandaag echter zien we ze eerder als testen van EEP (i.h.b. dan
nog van LPI), omdat ze in alle metrische gravitatietheorieën identieke resultaten opleveren. Het
mag dan ook geen verwondering wekken dat Einstein al in een vroeg stadium —nog voor de meeste
wiskundige details van de theorie geformuleerd waren— in staat was om op basis van het equi-
valentiebeginsel de frequentieverschuiving te voorspellen. We herhalen eerst Einstein’s redenering
en reproduceren vervolgens het resultaat vertrekkende van een statische en gekromde ruimte-tijd,
waarbij we ook rekening houden met mogelijke afwijkingen van EEP.

In een gravitationeel frequentieverschuivingsexperiment wordt de frequentie- of golflengte-ver-


schuiving z = ∆ν/ν = −∆λ/λ gemeten tussen twee frequentie-standaarden (ideale klokken,
atomen, . . . ), die geplaatst zijn op verschillende hoogtes in een gravitatieveld. Is het hoogte-
verschil tussen de twee waarnemers (bv. A op het oppervlak van de aarde en B op een hoogte h)
niet te groot, dan vertelt het equivalentiebeginsel ons dat het effect van het gravitationeel poten-
tiaalverschil ∆V = VA − VB = −gh op het gedrag van electromagnetische signalen uitgewisseld
tussen A en B identiek moet zijn aan het effect dat ontstaat wanneer we A (achteraan) en B
(vooraan) in een space shuttle plaatsen die onderhevig is aan een versnelling van 1g. Kiezen we de
z-as van A naar B en zorgen we ervoor dat A zich in de oorsprong bevindt op t = 0, dan wordt de
positie van A en B resp. gegeven door
1 2 1
zA = gt en zB = h + gt2 .
2 2
Zendt nu B twee signalen met een tussenpauze van ∆τB naar A (vertrekkend op resp. t = 0 en
∆τB en aankomend op resp. t1 en t1 + ∆τA ), dan legt het eerste signaal een afstand

zB (0) − zA (t1 ) = t1

af en het tweede signaal een afstand

zB (∆τB ) − zA (t1 + ∆τA ) = t1 + ∆τA − ∆τB .


3 Roll,
Krotkov en Dicke, 1964
4 Braginsky en Panov, 1968
5 Anderson en Williams, 2001
114 HOOFDSTUK 6. IST DAS WIRKLICH SO?

Invullen van de uitdrukkingen voor zA en zB geeft


1 1
h − gt21 = t1 en h − gt21 − gt1 ∆τA = t1 + ∆τA − ∆τB ,
2 2
waarna lid aan lid aftrekken resulteert in

∆τA = ∆τB (1 − gh) = ∆τB (1 + ∆V ).

Is bv. ∆τB de periode van een electromagnetisch signaal vertrekkend uit B naar A, dan blijkt
dus dat dit signaal in A ontvangen wordt met een kleinere periode (m.a.w. een grotere frequentie
en een grotere energie: we spreken dan van een gravitationele blauw verschuiving). Definiëren we
de frequentieverschuiving z door
∆τA ωB
1+z = =
∆τB ωA
dan is dus
z = ∆V.
(wordt het signaal van A naar B gestuurd, dan treedt er analoog een gravitationele rood verschuiving
op).
We leiden nu dit resultaat opnieuw af op een meer wiskundige manier, gebruik makend van

een statisch gravitatieveld, met killing-vector ξ = ∂t en met twee statische waarnemers A en B
die de eigentijd meten verlopen langs hun wereldlijn tussen de tijdstippen t1 en t2 (t.t.z. tussen
de twee hypervlakken t = t1 en t = t2 ). De wereldlijnen van deze waarnemers zijn dus precies de
integraalkrommen van ξ: als (t, xα ) aangepaste coördinaten zijn, dan worden deze wereldlijnen
gegeven door xα = constant. Alle gebeurtenissen in de hypervlakken t = constant zijn voor
zulke waarnemers gelijktijdig. Als nu A en B beschikken over ideale klokken, waarmee de eigentijd

t = t2

t = t1

xa= xaA xa= xaB

(A) (B)

Figuur 6.2: gelijktijdigheid

verlopen tussen t1 en t2 gemeten wordt, dan is voor A


Z t2 r
dxi dxj
∆τA = −gij dt
t1 dt dt (6-2.1)
q
= −gtt (xα A )(t2 − t1 )
6-2. EINSTEIN’S EQUIVALENTIEBEGINSEL 115

terwijl voor B een analoge betrekking geldt. Bijgevolg vinden we


1/2
gtt (xα

∆τA A)
= (6-2.2)
∆τB gtt (xα
B)

Is EEP geldig, dan gaat bovenstaande redenering op voor een eigentijd ∆τ gemeten door om het
even welke frequentiestandaard (veer-, atoom- of biologische klok . . . ). Voor het bijzonder geval
van de aarde zullen we in het volgend hoofdstuk afleiden dat gtt = −(1 − 2m/r), zodat
1/2
1 − 2m/rA

∆τA 1 1
= ≈ 1 + m( − ) (6-2.3)
∆τB 1 − 2m/rB rB rA

wat < 1 is als rA < rB . Voor de z.g. gravitationele frequentieverschuiving z = ωB /ωA − 1 vinden
we dan opnieuw
z = VA − VB (6-2.4)

met V = −m/r de gravitationele potentiaal.


NB: een gemakkelijke manier om in te zien dat in de Newtoniaanse benadering gtt ≈ 1 + 2V , is
2 α
∂V
van gebruik te maken van de geodetische vergelijking: uit ddtx2 ≈ − ∂xα en

d2 xα i
α dx dx
j
1 ∂g44
= −Γ ij ≈ −Γα
44 =
dt2 dτ dτ 2 ∂xα
volgt immers onmiddellijk dat g44 ≈ −2V + const.
De populaire vertaling van het resultaat (6-2.3) is dat ‘identieke klokken trager lopen in A
dan in B’. Dit zorgt voor redelijk wat verwarring: de correcte interpretatie is dat de klokken even
snel lopen, maar verschillende wereldlijnen volgen en tussen de in de figuur aangeduide tijdstippen
tA en tB simpelweg verschillende eigentijden meten. Een moeilijkheid bij het hier beschreven
experiment is dat de waarnemer in A, noch de waarnemer in B, weet wanneer de tijdstippen
t1 en t2 zijn aangebroken en dus ook niet weet wanneer hij zijn klok moet starten of stoppen
. . . . Een mogelijke oplossing bestaat erin beide klokken eerst te synchroniseren in A, vervolgens
één der klokken te transporteren naar B en ze na voldoend lange tijd terug naar A te brengen:
gebruiken we, bij wijze van illustratie, radioactief verval als frequentiestandaard, dan zou men—na
terugkomst in A—kunnen vaststellen dat, van twee identieke hoeveelheden radioactief materiaal,
bv. 49 % vervallen is van het materiaal dat was achtergebleven in A en 50 % van het materiaal dat
de trip naar B gemaakt heeft. Nogmaals: dit is niet omdat de wetten van het radio-actief verval
zich anders zouden gedragen langs A dan langs B, maar omdat ∆τA < ∆τB ...
Experimenten die dit effect verifiëren zijn reeds uitgevoerd, maar blijven erg onnauwkeurig om-
dat, tijdens de verplaatsing van een frequentiestandaard een niet te verwaarlozen doppler-effect
optreedt. In principe kan dit opgevangen worden door het ‘verblijf’ in B lang genoeg te maken,
zodat het (cumulatief) gravitationeel effect het doppler-effect gaat domineren. Helaas zijn de
meest precieze frequentiestandaarden waarover we vandaag beschikken, slechts stabiel over korte
tijdspannes6 . Daarom wordt gewoonlijk gebruik gemaakt van een meer indirect experiment, waar-
bij de frequentiestandaard in B bv. lichtsignalen uitzendt naar A, waar deze vergeleken worden
met de signalen van een in A geplaatste referentie-standaard. Voor de frequentie van de in B
6 Cs-fountain klokken zoals NIST-F1 bereiken een nauwkeurigheid van 10−15 over een periode van enkele 103 s

maar zijn niet erg transporteerbaar


116 HOOFDSTUK 6. IST DAS WIRKLICH SO?

B emitter

A receiver referentie-standaard

Figuur 6.3: gravitationele verschuiving

(e)
geëmitteerde golf, ωB , vinden we dan uit 2-6.36:

(e) ki ξ i
ωB = −(ki ui )B = −( )B (6-2.5)
kξk

Omdat langs de nul-geodeten ki ξ i behouden blijft (zie 1-12), zal in A een signaal ontvangen worden
(r)
met frequentie ωA gegeven door
(r) (e)
ωA .kξkA = ωB .kξkB (6-2.6)
zodat
(e)  1/2
ωB gtt,A
(r)
= = 1 + VA − VB (6-2.7)
ωA gtt,B
(r) (e) (e)
Nu kunnen we in de praktijk ωA niet vergelijken met ωB , maar wel met ωA , zodat voor de
waargenomen frequentieverschuiving z geldt dat
(e) (e) (e)
ωA ωA ωB
1+z = (r)
= (e) (r)
(6-2.8)
ωA ωB ωA

In de eerste factor van deze uitdrukking kunnen nu bijdragen optreden, die te wijten zijn aan
afwijkingen van EEP, zodat we bekomen dat

z = (1 + δ)(VA − VB ) (6-2.9)

met δ een parameter die nul is in elke metrische gravitatietheorie.


Bestaan er afwijkingen van EEP, door bv. een plaatsafhankelijke fijn-structuurconstante α, dan zal
bv. een experiment met SCSO-klokken (Superconducting Cavity Stabilised Oscillators, waarvoor
de periode een veelvoud is van de bohr-straal en dus van α) leiden tot
αB
z= (1 + VA − VB ) − 1
αA (6-2.10)
=(1 + δ)∆V
6-3. METRISCHE THEORIEËN EN HET ZONNESTELSEL 117

met δ = ∆α/α∆V . De eerste succesvolle experimenten werden door Pound, Rebka en Snider
uitgevoerd in Harvard (1960-65), door de frequentieverschuiving te meten van γ-fotonen afkomstig
uit een Fe57 kern: men bewam hierbij dat |δ| . 10−1 . Tot vandaag blijft het meest precieze
experiment het Vessot-Levine (Gravity Probe A, 1976) experiment, waarbij de frequentie van een in
een raket verplaatste H-maser vergeleken werd (gedurende een vlucht tot op 10.000 km hoogte) met
de frequentie van een identieke H-maser op de grond: dit resulteerde in de beperking |δ| . 2 10−4 .
Tegenwoordig worden gravitationele correcties (zowel als de meer vertrouwde doppler-correcties)
courant gebruikt bij Global Positioning Systems. De gravitationele correctie is hierbij zelfs groter
dan de correctie t.g.v. de tijdsdilatatie: voor een satelliet in een cirkelvormige baan op een hoogte
van 18000 km is immers
√ de gravitationele correctie gegeven door GM/r(= v 2 ) ≈ 16 10−11 terwijl
v ≈ 1.3 10 en dus 1 − v 2 −1 ≈ 8 10−11 . Dit mag allemaal futiel lijken, maar bedenk dat, zonder
−5

deze kleine correctietermen in acht te nemen, na 5 minuten de door je GPS ontvangen klokdata je
al minstens 15 m naast je werkelijke positie zouden plaatsen!
Wijzen we er tenslotte nog op dat de uitdrukking 6-2.4 voor de roodverschuiving, die optreedt
wanneer een electromagnetische golf zich beweegt van A naar B, ook te bekomen is door toepassing
van de wet van behoud van energie op een foton dat uit de gravitationele potentiaal-put klimt. Het
effect werd trouwens waargenomen bij het onderzoek van de spectraallijnen van witte dwergen.

6-3 Metrische Theorieën en het Zonnestelsel


6-3.1 Algemeenheden
Metrische gravitatietheorieën verschillen in hun voorspellingen voor het gedrag van testdeeltjes en
fotonen in het zonnestelsel enkel in de vorm van de metriek die dit gedrag bepaalt. Voor elke
metrische theorie kan de metriek van het zonnestelsel (bekomen via oplossingen van de correspon-
derende veldvergelijkingen), ontwikkeld worden als Taylor-reeks in grootheden, die zijn opgebouwd
uit de newtoniaanse potentiaal en de materieverdeling van het zonnestelsel. Dit leidt tot het zgn.
PPN-formalisme (Parametrised Post Newtonian formalism), waarin een nauwkeurige boekhouding
van de gebruikte grootte-ordes van belang is. Aangezien een bespreking van dit formalisme veel
te ver zou voeren, beperken we ons in deze paragraaf tot een model van een sferisch symmetrisch
en statisch zonnestelsel7 , met als enige variabele de newtoniaanse potentiaal V = −m/l, met m de
massa van de zon. Ontwikkelen we de metriek naar deze variabele, dan kan aangetoond worden
dat

m m2 m 2 2 2
ds2 = −(1 − 2 + 2β 2 + · · · )dt2 + (1 + 2γ + · · · )(dx1 + dx2 + dx3 ) (6-3.1)
l l l
2 2 2
met l2 = x1 + x2 + x3 . Voor de meeste testdeeltjes in het zonnestelsel geldt dat v 2 ≈ m/l:
termen als gαβ treden dus in de bewegingsvergelijking enkel op in de combinatie gαβ ml , zodat we
de coëfficiënt van dt2 moeten ontwikkelen tot op tweede orde in V , als we eerste-orde correcties op
het ruimtelijk deel van de metriek in acht willen nemen.
Vervolgens voeren we z.g. standaard-coördinaten in, door de substitutie r = l(1 + γm/l). Dit leidt
tot de metriek
ds2 = −B(r)dt2 + A(r)dr2 + r2 dθ2 + r2 sin2 θdφ2 (6-3.2)

7 zie volgend hoofdstuk voor een verklaring van de terminologie


118 HOOFDSTUK 6. IST DAS WIRKLICH SO?

met
m m2
B(r) ≈(1 − 2 + 2(β − γ) 2 ) (6-3.3)
r r
en
m
A(r) ≈1 + 2γ
r
In elke metrische theorie hebben β en γ (de z.g. eddington-robertson-parameters) welbepaalde
numerieke waarden8 . Voor het bijzonder geval van A.R., geldt een zeer eenvoudige gedaante: in
Hoofdstuk 7 tonen we aan dat voor de schwarzschild-oplossing β = γ = 1.
Om de beweging van testdeeltjes in een ruimte-tijd met metriek 6-3.2 na te gaan, construeren
we eerst een volledig stel integralen van de geodetische vergelijkingen, zonder deze vergelijkingen
echter expliciet op te stellen! We maken daartoe gebruik van de behoudswetten ui ξ(A) i = constant,
met ui = dxi /dλ (λ een affiene parameter) en met ξ(A) de 4 killing-vectoren van een statische en
∂ ∂ ∂ ∂
sferische symmetrische metriek9 : ξ(1) = ∂t , ξ(2) = ∂φ , ξ(3) = cos φ ∂θ − sin φ cot θ ∂φ en ξ(4) =
∂ ∂
sin φ ∂θ + cos φ cot θ ∂φ .
De eerste drie killing-vectoren leveren de volgende behoudswetten:

dt
B =constant (6-3.4)


r2 sin2 θ =constant (6-3.5)

dθ dφ
r2 cos φ − sin φ cot θ =constant (6-3.6)
dλ dλ
(de vierde killing-vector geeft geen extra informatie).
Uit 6-3.6 volgt dat een beweging, die begint in het θ = π2 -vlak (wat zonder verlies van alge-
meenheid kan worden aangenomen), steeds beperkt blijft tot dit vlak (dit was intuı̈tief ook wel
te verwachten voor sferische symmetrie!). Normaliseren we dan de affiene parameter zó dat op
oneindig λ = t, dan reduceren de vergelijkingen 6-3.4 en 6-3.5 zich in het θ = π2 -vlak tot

dt
B =1 (6-3.7)

en


r2 =J (6-3.8)

Een laatste integraal van de bewegingsvergelijkingen volgt tenslotte uit het feit dat ui ui constant
is:
dt dr dφ
gij ui uj = −B( )2 + A( )2 + r2 ( )2 = −E (6-3.9)
dλ dλ dλ
met E = 0 voor massaloze en E > 0 voor massieve deeltjes. Noteer dat λ voor deze laatste niet
de eigen-tijd is, want (dτ /dλ)2 = E.
8 dat de eerste orde coëfficiënt in gtt dezelfde is voor alle metrische theorieën, is een gevolg van EEP!
9 zie Hoofdstuk 6
6-3. METRISCHE THEORIEËN EN HET ZONNESTELSEL 119

M.b.v. 6-3.7 en 6-3.8 bekomen we dan



r2 =JB (6-3.10)
dt
en

1 J 2 A dr J2
− + 4 ( )2 + 2 = − E (6-3.11)
B r dφ r
Voor trage beweging in een zwak gravitatieveld reduceren deze vergelijkingen zich tot de Newton-
iaanse vergelijkingen

r2 =J (6-3.12)
dt
en
1 dr 2 dφ m 1−E
[( ) + r2 ( )2 ] − = (6-3.13)
2 dt dt r 2
voor een deeltje met draaimoment per eenheidsmassa = J en met kinetische + gravitationele
energie per eenheidsmassa = 1−E 2 . Noteer dat we met het concept ‘energie’ voorzichtig moeten
omspringen: de ‘echte’ (i.e. behouden) totale energie per eenheidsmassa is voor een statische
j

waarnemer (met killing-vector ξ = ∂t ) gegeven door −g(ξ, u) = −gij ξ i dx dt dλ
dτ = B dτ = dτ = E
−1/2
.
−1/2 1−E
Als nu E ≈ 1 + ǫ met ǫ klein, dan is ǫ ≈ 2 , zodat de gravitationele + kinetische energie per
eenheidsmassa = E −1/2 − 1 ≈ 1−E 2 .
Definiëren we nu, net zoals in het newtoniaanse geval, u = 1/r, dan bekomen we
du 2 1
( ) + Q=0 (6-3.14)
dφ A
met
Q = u2 − J −2 1 − E + 2mu + 2m2 (2 + γ − β)u2 ) .

(6-3.15)
2 −2
Met A = 1 en Q = u − J (1 − E + 2mu) bekomen we de Newtoniaanse baanvergelijking met
als oplossing
u = mJ −2 (1 + e cos φ)
en
2mJ −2
2a = r+ + r− = u−1 −1
± + u− = .
1 − e2

6-3.2 Gebonden beweging


Voor een gebonden beweging wordt de kwadratische vorm Q nul voor precies twee waarden van
u, namelijk u = u± = 1/r± , met r± de afstanden tot respectievelijk aphelium en perihelium. Er
geldt dan
Q = k(u − u− )(u − u+ ) (6-3.16)
met
2m2
k =1 − (2 + γ − β) (6-3.17)
J2
120 HOOFDSTUK 6. IST DAS WIRKLICH SO?

en

2mJ −2
k= (6-3.18)
u+ + u−

Uit 6-3.14 bekomen we dan, na een halve ‘omwenteling’10 ,


Z u− Z u−
A 1/2
φ+ − φ− = du = √1 p
(1 + γmu) du
(6-3.19)
u+ Q k u+ (u − u+ )(u− − u)

of, met u = 21 (u+ + u− ) − 21 (u− − u+ ) sin ψ


π/2
1 γm γm
Z
φ+ − φ− = √ [1 + (u+ + u− ) − (u− − u+ ) sin ψ] dψ
k −π/2 2 2
(6-3.20)
π m2
≈ √ (1 + γm2 J −2 ) ≈ π[1 + 2 (2 + 2γ − β)].
k J

Hierbij werd de benadering


k ≈ 1 − m(u+ + u− )(2 + γ − β) (6-3.21)
gebruikt, die volgt uit het feit dat de parameter ǫ = m2 /J 2 in het zonnestelsel erg klein is (voor
Mercurius is ǫ ≈ 10−7 ) en dus mJ −2 ≈ 21 (u+ + u− ). Per omwenteling vinden we hiermee een
precessie van het perihelium
6πm2 2 + 2γ − β
∆φ = . (6-3.22)
J2 3
waarbij in A.R. de tweede factor van het rechterlid precies = 1 is.
Vermits
u+ + u− 1 1 1 1
mJ −2 ≈ = ( + )=
2 2a 1 + e 1 − e a(1 − e2 )
met a de halve lange as en e de excentriciteit van de (in benadering) ellipsvormige baan, kunnen
we dit ook nog schrijven als
6πm 2 + 2γ − β
∆φ = . (6-3.23)
a(1 − e2 ) 3
Voor Mercurius, met 415 omwentelingen per eeuw, geeft A.R. dan een precessie van 43.03′′ per
eeuw, wat exact in overeenstemming is met de experimentele gegevens. Voor de andere planeten
wordt het effect snel kleiner en worden, t.g.v. de kleine excentriteiten, de onnauwkeurigheden bij
de bepaling van het perihelium groter. Alleen met Icarus (e = 0.827) wordt een vergelijkbare
nauwkeurigheid bereikt.

10 we gebruiken deze term alhoewel de banen nu geen gesloten krommen zijn


6-3. METRISCHE THEORIEËN EN HET ZONNESTELSEL 121

6p m
aantal omwentelingen
Df (”/eeuw)
Planeet
6
a(10 km) e a(1-e2) eeuw (A.R.) (waargenomen)

Mercurius 57.91 0.2056 0.1038” 415 43.03 43.11 0.45


Venus 108.21 0.0068 0.058” 149 8.6 8.4 4.8
Aarde 149.60 0.0167 0.038” 100 3.8 5.0 1.2
Icarus 161.0 0.827 0.115” 89 10.3 9.8 0.8

Figuur 6.4: precessie

6-3.3 Ongebonden beweging


Bekijken we tenslotte de ongebonden beweging van een deeltje met impactparameter b ≈ r sin(φ∞ −
φ) ≈ r(φ∞ − φ) en met snelheid v ≈ dr/dt: De integratieconstante E in 6-3.11 is dan gegeven door

F Fh
m
ro b

Figuur 6.5: afbuiging van het licht


dr
E = 1 − v 2 en, als we de afstand van dichtste benadering r0 noemen (zodat dφ |r0 = 0), volgt er
dat  1/2
1 2
J = r0 −1+v (6-3.24)
B(r0 )
Voor een foton (v = 1) is i.h.b. J −2 = r0 −2 B(r0 ), zodat 6-3.15 gereduceerd wordt tot
Q = u2 − u0 2 B(r0 )(1 + 2mu + 2m2 (2 + γ − β)u2 ) (6-3.25)
Vermits nu B(r0 ) ≈ 1 − 2mu0 + 2(β − γ)m2 u0 2 , is
2mu0 2
Q ≈ (u2 − u0 2 ).(1 − ) (6-3.26)
u + u0
122 HOOFDSTUK 6. IST DAS WIRKLICH SO?

(let op de tweede factor!) en dus


2
dφ 1 + γmu + mu 0
u+u0
≈ √ . (6-3.27)
du u0 2 − u2

Na integratie wordt de afbuiging van het licht, ∆φ, dan uiteindelijk gegeven door

∆φ =2|φ(u0 ) − φ∞ | − π
4m 1 + γ (6-3.28)
≈ .
r0 2

Voor de zon betekent dit een maximale afwijking (namelijk als r0 = R⊙ ) van

1+γ
∆φ ≈ 1.75′′ . (6-3.29)
2
Deze hoek wordt gemeten door de onderlinge hoekafstand te vergelijken van twee ‘vaste’ hemel-
lichamen, tussen een tijdstip waarop één van beide zich ‘dicht’ bij de zon bevindt en een tijdstip
waarop beide zich ‘ver’ van de zon bevinden (bv. 6 maanden later). Voor waarnemingen in het
optisch venster impliceert dit dat het eerste stel waarnemingen moet gebeuren tijdens een volledige
eclips. Omdat in de praktijk r0 niet kleiner mag zijn dan ongeveer 2R⊙ en omdat het oplossend
vermogen van telescopen van de orde 0.1′′ is, mogen we van dergelijke waarnemingen geen hoge
nauwkeurigheid verwachten. Desondanks waren de resultaten van Eddington’s 1919 eclips expedi-
tie zo prachtig in overeenstemming met de voorspellingen van A.R., dat de theorie er in één klap
mee in het centrum van de toenmalige belangstelling raakte.
Na de tweede wereldoorlog werd meer en meer overgestapt op het gebruik van radio-interferometrie,
zodat we met een veel hogere nauwkeurigheid (het oplossend vermogen bedraagt dan 3 10−4′′ ), de
hoekafstanden kunnen volgen tussen QSO’s (Quasi Stellaire Objecten). Op deze wijze was men ook
niet langer beperkt tot eclips-waarnemingen. Tegenwoordig is het zelfs mogelijk om met z.g. Very
Long Baseline Interferometry het effect van de lichtafbuiging te meten voor bronnen, die zich op
een hoek van 90o van de zon bevinden (∆φ is dan ≈ 4 10−3′′ ). De verzamelde metingen van de
laatste decennia hebben alzo geleid tot het resultaat

γ = 1.000 ± 0.004 (6-3.30)

Een vergelijkbare nauwkeurigheid wordt bereikt met de tijd-oponthoud experimenten. Hierbij


wordt een radarsignaal vanop aarde doorheen het zonnestelsel gezonden en, na reflectie op het
oppervlak van een planeet, weer ontvangen. Met 6-3.2 kan de precieze tijd berekend worden, die
verloopt tussen emissie en ontvangst van het signaal. Het verschil met de newtoniaanse ‘heen-en-
terug-tijd’ is wat het relativistische tijd-oponthoud genoemd wordt. Voor Mercurius in bovencon-
junctie bedraagt dit ongeveer 240 µs op een totaal van 20 minuten. Dergelijke experimenten werden
lang bemoeilijkt door onzekerheden in de ephemeris van de reflecterende planeet en onzekerheden
m.b.t het reflecterende oppervlak. Beide moeilijkheden werden opgevangen met de plaatsing van
de Viking-landers op het oppervlak van Mars. Hiermee kon een uiterst betrouwbare ephemeris
voor Mars worden opgesteld (door radar-tracking vér van bovenconjunctie), waarna een klein-
ste kwadraten-analyse van voorspelde en waargenomen heen-en-terug-tijd uiteindelijk leidde tot
γ − 1 = ±0.002 (Reasenberg, 1979). De meest precieze data worden momenteel bekomen uit
Doppler tracking van de CASSINI-missie (2002): γ − 1 = (6 ± 4) 10−5 .
6-3. METRISCHE THEORIEËN EN HET ZONNESTELSEL 123

6-3.4 Gravity Probe B


Na tientallen jaren oponthoud werd in 2004 de Gravity Probe B satelliet gelanceerd. Het betreft
een ‘drag-free satellite’, waarin 4 kwarts-gyroscopen met een spin-frequentie van 150 Hz in een
polaire baan op 640 km hoogte worden gebracht. De ‘vrij vallende’ gyroscopen (die ondertussen
een laboratorium testperiode van ongeveer 105 uur achter de rug hadden) zullen de geodetische
precessie (door A.R. voorspelde waarde 6.6′′ per jaar) en het meesleep-effect t.g.v. de rotatie van de
aarde (het z.g. Lense-Thirring effect — voorspelde waarde 0.042′′ per jaar) testen met een precisie
van resp. 10−4 en 10−2 . Men is nog steeds (2007) bezig met de verwerking van de binnengekomen
data.
124 HOOFDSTUK 6. IST DAS WIRKLICH SO?
Hoofdstuk 7

Bijzondere Oplossingen

7-1 Inleiding
In dit hoofdstuk vatten we de studie aan van een aantal belangrijke oplossingen van de einstein-
veldvergelijkingen, te beginnen uiteraard met de meest eenvoudige. Vermits de einstein-vergelij-
kingen partiële differentiaalvergelijkingen zijn, ligt het voor de hand eerst te kijken naar situaties
waarin het aantal veranderlijken zo klein mogelijk is (in sommige gevallen zullen we de verge-
lijkingen dan zelfs kunnen reduceren tot gewone differentiaalvergelijkingen). Daartoe maken we
gebruik van opgelegde symmetrie-eisen.
Eén van de eigenschappen die we kunnen opleggen is dat de oplossingen stationair zijn. Intuı̈tief
houdt dit in dat coördinaten (t, xα ) kunnen gekozen worden, zó dat de componenten van de
metriek enkel functies zijn van de xα . Gebruik makend van wat we in hoofdstuk 1.12 gezien
hebben, herformuleren we dit op coördinaat-onafhankelijke wijze als volgt:

Een ruimte-tijd (M, g) is stationair als en slechts als een tijd-achtig killing-vectorveld ξ
bestaat, met de eigenschap dat Lξ Ψ = 0 voor alle materievelden Ψ gedefinieerd op M.

∂ ∂g
Met ξ = ∂t geldt dan inderdaad dat ∂tij = 0 ∀ i, j. Noteer de extra eis dat de materievelden
∂g ∂T
de symmetrie overerven: als ∂tij = 0 dan volgt uit de veldvergelijkingen weliswaar dat ∂tij = 0,
maar dit impliceert geenszins dat de materievelden, waaruit T is opgebouwd, voldoen aan ∂Ψ ∂t = 0
(tegenvoorbeelden zijn gekend o.a. voor een maxwell-veld).
Is (M, g) stationair, dan geldt in locale coördinaten dat gij = gij (xα ). In het algemeen zullen in ds2
dus nog kruistermen dt dxα optreden. De aanwezigheid van deze termen impliceert (1) dat g niet
noodzakelijk invariant is onder de reflectie t → −t (wat gewoonlijk duidt op de aanwezigheid van

rotaties) en (2) dat waarnemers verbonden aan de integraalkrommen van ξ = ∂t niet noodzakelijk
eensgezinde uitspraken kunnen maken over de gelijktijdigheid van gebeurtenissen. Voor dit laatste

moeten eerst de locale rust-ruimtes (de orthogonale complementen in Tp (M) van ∂t ) van deze
waarnemers glad aan elkaar gesloten worden. Volgens de discussie in 1-11.3 vereist dit dat ξ
hyperoppervlak-orthogonaal is. Dit brengt ons tot de volgende definitie:

Een ruimte-tijd (M, g) is statisch als en slechts als een tijd-achtig hyperoppervlak-orthogonaal
killing-vectorveld bestaat, met de eigenschap dat Lξ Ψ = 0 voor alle op M gedefiniëerde ma-
terievelden Ψ.

125
126 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

Is (M, g) statisch, dan bestaan locale coördinaten zodat


ν
ds2 = −e2U (x ) dt2 + hαβ (xν )dxα dxβ (7-1.1)

met −e2U = ξ 2 . De metriek is dan duidelijk invariant onder de reflectie t → −t. Bovendien
kan men aantonen (c.f. Weinberg) dat de metriek ds(3) 2 = hαβ (xν )dxα dxβ kan gediagonaliseerd
worden, zodat voor een statische ruimte-tijd steeds geldt dat
3
ν
fα (xν )dxα 2
X
ds2 = −e2U (x ) dt2 + (7-1.2)
α=1

Zelfs met deze vereenvoudigingen blijven de einstein-vergelijkingen nog altijd een uiterst gecom-
pliceerd stelsel: van de vacuum vergelijkingen (Rij = 0) zijn alle zogenaamd algebraisch ontaarde 1
oplossingen gekend, maar slechts een handvol van de niet-ontaarde oplossingen is tot dusver gevon-
den!

1 Levi-Civita, 1920
7-2. SFERISCHE SYMMETRIE 127

7-2 Sferische symmetrie


De veldvergelijkingen kunnen nog sterker vereenvoudigd worden door, i.p.v. het bestaan op te
leggen van één killing-vectorveld (dus het bestaan van een één-dimensionale symmetrie-groep), het
bestaan te eisen van een r-dimensionale symmetrie-groep met r > 1. Eén van de fysisch meest
relevante gevallen is dat van sferische symmetrie, waarbij we eisen dat een ruimte-tijd een met
SO(3) isomorfe 3-dimensionale groep van isometrieën bezit, zó dat (a) de generatoren van deze
groep ruimte-achtige vectoren zijn en (b) de banen Op van de groep diffeomorf zijn met de 2-sfeer
(de baan van een symmetrie-groep G in een punt p van M is de verzameling van alle punten p′
die bekomen worden door willekeurige elementen van G op p te laten werken). Net zoals in vorige
paragraaf eisen we bovendien dat alle materievelden de symmetrie van de groep overerven.
Als we de voorwaarde (b) verzwakken en enkel opleggen dat de banen 2- dimensionaal zijn, dan
volgt uit 1-12 dat de banen maximaal symmetrisch zijn en dus een geı̈nduceerde metriek hebben
van de vorm 1.12.19,

ds2(2) = Y 2 (dx2 + Σ2 dy 2 ) met Σ = sin x, x, of sinh x (7-2.1)

Naargelang de vorm van Σ spreken we dan respectievelijk van een sferisch symmetrische, planair
symmetrische of pseudo-sferisch symmetrische variëteit.
Vervolgens kan men aantonen (cf. Weinberg of Kramer et al.) dat bovenstaande voorwaarden
leiden tot het bestaan van een coördinaatstelsel waarin de metriek te schrijven is als

ds2 = f (u, v)du2 + g(u, v)dv 2 + h(u, v)dudv + Y 2 (u, v)(dx2 + Σ2 dy 2 ) (7-2.2)

Beperken we ons verder tot het sferisch symmetrische geval en diagonaliseren we de metriek van
de (u, v)-ruimte, dan bekomen we uiteindelijk

ds2 = −e2ν dt2 + e2λ dr2 + Y 2 (dθ2 + sin2 θdφ2 ) (7-2.3)

met ν, λ en Y functies van r en t. De killing-vectoren worden dan gegeven door


∂ ∂
ξ1 = cos φ − sin φ cot θ
∂θ ∂φ

ξ2 = (7-2.4)
∂φ
∂ ∂
ξ3 = sin φ + cos φ cot θ
∂θ ∂φ

Voeren we een orthogonale basis in met ω 1 = Y dθ, ω 2 = Y sin θdφ, ω 3 = eλ dr en ω 4 = eν dt en


noteren we met ˙ en ′ respectievelijk de partiële afgeleiden naar t en r, dan kan geverifieerd worden
dat de connectievormen gegeven worden door

Y′ N
ΓN 3 =e−λ ω (N = 1, 2)
Y

ΓN 4 =e−ν ω N (N = 1, 2)
Y (7-2.5)
4
Γ 3 =e−λ ν ′ ω 4 + e−ν λ̇ω 3
1
Γ2 1 = cot θω 2
Y
128 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

Hiermee vinden we voor de componenten van de einstein-tensor

2 Y ′′ Y′ ′ Y′ ′
G11 =G22 = e−2λ (ν ′′ + ν ′ − ν ′ λ′ + + ν − λ)
Y Y Y
Ÿ Ẏ Ẏ
− e−2ν (λ̈ + λ̇2 − λ̇ν̇ + + λ̇ − ν̇) (7-2.6)
Y Y Y
2
1 2 −2ν Ẏ 2 2 Y′
G33 =− 2 − e (Ÿ − Ẏ ν̇ + ) + e−2λ (Y ′ ν ′ + ) (7-2.7)
Y Y 2Y Y 2Y
2
1 2 Y′ 2 Ẏ 2
G44 = 2 − e−2λ (Y ′′ − Y ′ λ′ + ) + e−2ν (Ẏ λ̇ + ) (7-2.8)
Y Y 2Y Y 2Y
2
G34 = − e−ν−λ (Y˙ ′ − Ẏ ν ′ − Y ′ λ̇) (7-2.9)
Y
Vermits Y −2 de kromming is van de maximaal symmetrische 2-ruimte, is Y een invariant en bestaat
2
er een fysisch onderscheid tussen gebieden waar (∇Y )2 ≡ g ij Y,i Y,j = e−2λ Y ′ − e−2ν Ẏ 2 > 0 (R-
gebied ), < 0 (T-gebied ), of = 0.
Merk ook op dat de vorm 7-2.3 niet uniek is: coördinaattransformaties die het diagonale karak-
ter van de metriek van de (r, t) ruimte behouden zijn nog steeds toegelaten: zo kunnen in de R
gebieden coördinaten gekozen worden zodat Y = r (ga na!). Bekijken we hiermee het bijzonder
geval van vacuum oplossingen, dan blijkt onmiddellijk uit 7-2.9 dat λ̇ = 0, zodat 7-2.7 impliceert
dat ν˙′ = 0. Bijgevolg is eν separabel in r en t en kan dus , mits een herdefiniëren van de t
coördinaat, eν onafhankelijk van t gekozen worden. In de T-gebieden komen we, mits omwisselen
van r en t, tot precies dezelfde conclusie. Anderzijds kan men aantonen dat er geen open delen
van (M, g) bestaan waarin (∇Y )2 = 0 en Gab = 0. Dit is het makkelijkst te verifiëren door 7-2.3
te herschrijven als ds2 = 2H(u, v)dudv + Y 2 (u, v)(dθ2 + sin2 θdφ2 ): de voorwaarde (∇Y )2 = 0
vereenvoudigt zich dan tot Y = f (u) of g(v).
Samenvattend bekomen we de volgende belangrijke stelling (G.D. Birkhoff 1923):

Elke sferisch symmetrische vacuum oplossing van de einstein-vergelijkingen bevat een 4-


dimensionale isometrie-groep. De extra killing-vector is tijdachtig in het R-gebied en ruimte-
achtig in het T-gebied.

De oorspronkelijke formulering dat sferisch symmetrische vacuum oplossingen statisch zouden zijn
geldt dus enkel voor het R-gebied! De stelling kan veralgemeend worden (a) tot planaire en pseudo-
sferisch symmetrische oplossingen en (b) tot oplossingen voor energie-impuls tensoren van het ‘Λ
type’ (Tab = Λgab ) of van maxwell-velden. Voor deze laatste moet dan wel de extra voorwaarde
(∇Y )2 6= 0 toegevoegd worden.
7-3. SCHWARZSCHILD-OPLOSSING 129

7-3 Schwarzschild-oplossing
We maken nu gebruik van de birkhoff-stelling om een unieke familie vacuum-oplossingen van 6.2.6-
7-2.9 te bekomen. Om de gedachten te vestigen kijken we eerst naar het R-gebied (Y = r): optellen
van G33 en G44 toont dat λ′ + ν ′ = 0 zodat, mits herdefiniëren van de tijd-coördinaat, λ = −ν.
Hiermee geeft 7-2.7 (re2ν )′ = 1, wat we (met m een constante) integreren tot e2ν = 1 − 2mr . Voor
de metriek bekomen we dan (K. Schwarzschild, 1916)
2m 2 2m −1 2
ds2 = −(1 − )dt + (1 − ) dr + r2 (dθ2 + sin2 θdφ2 ) (7-3.1)
r r

met killing-vectoren gegeven door 7-2.4 en ξ4 = ∂t en r > 2m. Een analoge redenering in het
T-gebied levert dezelfde vorm 7-3.1 op, maar met omwisseling van r en t (en t < 2m). Vermits
de naamgeving van coördinaten volstrekt irrelevant is, stelt 7-3.1 de unieke oplossing voor van
de vacuum einstein-vergelijkingen met sferische symmetrie (op diffeomorfismen na). Verliezen we
hierbij echter niet uit het oog dat een ruimte-tijd gedefinieerd werd als een variëteit voorzien van
een niet-ontaarde en gladde metriek: vermits de coëfficiënt grr singulier is voor r = 2m, geldt dat
7-3.1 de metriek bepaalt van twee verschillende variëteiten: (M(1) , g) met r > 2m en (M(2) , g)

met r < 2m. De extra killing-vector is in beide gevallen ξ = ∂t , met ξ tijdachtig in (M(1) , g) en
ruimte-achtig in (M(2) , g). Deze twee ruimte-tijden corresponderen dus precies met de hiervoor
reeds vermelde R- en T-gebieden, vermits (∇Y )2 = g ij r,i r,j = g rr = 1 − 2mr . De naam gebieden is
enigszins misleidend, omdat dit suggereert dat (M(1) , g) en (M(2) , g) deelvariëteiten zouden zijn
van één zelfde variëteit (M, g). Deze indruk wordt nog versterkt door het feit dat we dezelfde
symbolen (r, t,...) gebruiken voor de coördinaatfuncties in beide variëteiten, met r > 2m in de ene
en r < 2m in de andere. Tot nu hebben we echter geen enkele garantie dat we ons het T-gebied
mogen voorstellen alsof het ‘in’ het R-gebied gelegen was!
Een opmerkelijke eigenschap is dat het R-gebied asymptotisch vlak is, d.w.z. voor r → ∞ be-
naderen de componenten van g deze van de minkowski-metriek, uitgedrukt in sferische coördinaten.
Dit laat ons toe het R-gebied te beschouwen als het uitwendig gravitatieveld van een geı̈soleerd
lichaam: de integratieconstante m kan dan geı̈nterpreteerd worden door het gedrag van testdeelt-
jes te vergelijken met hun gedrag in newtoniaanse gravitatie. Een studie van de geodeten van de
schwarzschild-metriek (cf. hoofdstuk 5) toont aan dat, voor r voldoende groot, het gedrag van een
testdeeltje correspondeert met dat van een testdeeltje in een newtoniaanse potentiaal Φ = − m r
(gebruik makend van eenheden waarin G = 1 en c = 1; met de gebruikelijke eenheden zouden
we in 7-3.1 1 − 2m/r moeten substitueren door 1 − 2Gm/c2 r). We identificeren daarom voor-
taan m met de massa van het centrale, graviterende lichaam. Drukken we m uit in eenheden van
zonsmassa’s, dan definiëren we de schwarzschild-straal als rS = 2Gm m
c2 ≈ 3( m⊙ )km. Voor ‘gewone’
objecten, zoals de aarde, de zon, ... is dus rS veel kleiner dan de straal R van deze objecten, zodat
voor de studie van het uitwendig gravitationeel veld enkel het R-gebied in aanmerking komt en,
meer in het bijzonder, dan nog enkel het r > R deel van dit gebied.
130 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

Op het eerste zicht lijkt het dus vanuit fysisch standpunt weinig zinvol om de eigenschappen
van het R gebied te onderzoeken nabij r = rS . Aan de andere kant is een blik op 7-3.1 voldoende
om ons te overtuigen dat dit precies de plek is waar wat boeiends te beleven valt . . . . Een handig
hulpmiddel, dat we hierbij vaak zullen gebruiken, zijn ruimte-tijd diagrammen, waarbij één of
meer dimensies zijn weggelaten. We zijn i.h.b. geı̈nteresseerd in het gedrag van nulgeodeten
(lichtsignalen), omdat deze ons immers ook een qualitatief inzicht geven in het gedrag van tijd-
achtige geodeten, die op hun beurt corresponderen met de banen van testdeeltjes.
We beginnen met het eenvoudigste geval te bekijken, nl. de radiale nulgeodeten, waarvoor we
θ = π2 en φ = 0 kunnen stellen. Uit ds2 = 0 volgt onmiddellijk

dt r
=± (7-3.2)
dr r − 2m
en dus
t = ±(r + 2m log |r − 2m|) + constante (7-3.3)
dt
De familie met, in het R-gebied, dr > 0 noemen we de uitgaande familie van radiale nulgeodeten
dt
en die met dr < 0 de inkomende familie. In een ruimte-tijd diagram waarin twee dimensies (θ en
φ) zijn weggelaten (en waarin elk punt dus een twee-sfeer met oppervlakte 4πr2 voorstelt), worden
de twee families als volgt voorgesteld:

Figuur 7.1: R-gebied in standaardcoördinaten


7-3. SCHWARZSCHILD-OPLOSSING 131

In het T-gebied bekomen we met dezelfde conventies volgend diagram:

r = 2m

0 r
Figuur 7.2: T-gebied in standaardcoördinaten

Een vraag die bij deze figuren onmiddellijk rijst, is of het singuliere gedrag van grr (in 7-3.1)
wijst op één of andere fysische ‘barrière’, die ons belet van de ene variëteit (R-gebied) naar de
andere (T-gebied) te raken, dan wel op de aanwezigheid van een z.g. coördinaatsingulariteit.
Met het begrip coördinaatsingulariteit zijn we reeds vertrouwd n.a.v. de introductie van poolcoördinaten
in het euclidische vlak: we definiëren dan op M = R2 \{(0, 0)} een niet-ontaarde metriek g =
dr ⊗ dr + r2 dθ ⊗ dθ en bekijken een radiale geodeet γ(λ) ≡ (r = r0 + λ, θ = constant), met λ een
affiene parameter. Het domein I van γ is dus I =] − r0 , ∞[: bewegen we ons naar de oorsprong
toe, dan bevinden we ons, na een eindige afstand r0 te hebben afgelegd, niet meer in de variëteit
M! We zeggen dat de geodeet γ -ondanks zijn eindige lengte- geen beginpunt heeft en dus niet
volledig is (een punt p ∈ M wordt een beginpunt (eindpunt) van een kromme γ : I → M genoemd,
als voor alle omgevingen V van p een t0 ∈ I bestaat zodat voor alle t < t0 (t > t0 ) γ(t) ∈ V ).
We kennen echter de oorzaak van deze pathologische toestand: de oorsprong was artificieel
uit het vlak verwijderd om de metriek in poolcoördinaten te kunnen definiëren! Gaan we over
op standaard cartesische coördinaten, dan stellen we vast dat (M, g) een deelvariëteit is van de
euclidische ruimte (R2 , η) die geodetisch volledig is2 . We zeggen daarom dat, bij het gebruik van
poolcoördinaten, de oorsprong een coördinaatsingulariteit is, of ook wel een verwijderbare singula-
riteit.
2 Men kan aantonen -zie b.v. Kobayashi en Nomizu- dat voor positief definiete metrieken geodetische volledigheid

equivalent is met cauchy-volledigheid. Het wegvallen van deze eigenschap voor lorentz-metrieken is de oorzaak van
grote moeilijkheden bij de definitie van singulariteten in de relativiteitstheorie.
132 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

Bekijken we als tweede voorbeeld een lorentz-variëteit (M, g1 ), met 0 < t < ∞, −∞ < x < ∞
en
1
g1 = −
dt ⊗ dt + dx ⊗ dx (7-3.4)
t4
Beschouw in (M, g1 ) de beweging van een testdeeltje, voorgesteld door een tijd-achtige geodeet
γ(λ) ≡ ((t0 − λ)−1 , x0 ) met λ een affiene parameter. Het domein van γ is ] − ∞, t0 [, wat
opnieuw betekent dat na een eindige tijd λ = t0 het testdeeltje niet meer tot M behoort! We
noemen (M, g1 ) dan (toekomstig) geodetisch onvolledig. We zien echter onmiddellijk dat, onder
de coördinaattransformatie t → t′ = 1/t, (M, g1 ) isometrisch equivalent is met (M, g2 ), waarbij
g2 = −dt′ ⊗ dt′ + dx ⊗ dx (met 0 < t′ < ∞ en −∞ < x < ∞). In de nieuwe coördinaten (t′ , x)
wordt γ gegeven door γ(λ) = (t0 − λ, x0 ) en is nog steeds onvolledig vermits (0, x0 ) 6∈ M. Nu
is echter de onvolledigheid van (M, g2 ) duidelijk te verklaren omdat we (M, g2 ) herkennen als
slechts de helft (t′ > 0) van de twee-dimensionale minkowski-ruimte (R2 , η): in (R2 , η) houdt
niets ons tegen om de affiene parameter voort te zetten in het interval ] − ∞, 0]. Daarom zeggen
we opnieuw dat we de oorspronkelijke coördinaatsingulariteit van (M, g1 ) verwijderd hebben door
(M, g1 ) uit te breiden naar (R2 , η):

t t’

2
C ( R ,n)
(m 1g1) (m 1g2)

t0 t’0

X0 X X0 X

Figuur 7.3: extensies

In het algemeen is het erg moeilijk coördinaatsingulariteiten in een variëteit te herkennen, be-
halve door de hierboven beschreven constructie van de uitbreiding van de oorspronkelijke variëteit.
Hiervoor bestaan echter geen kant en klare recepten. Een vaak gebruikte methode bestaat erin
langs een goed gekozen familie geodeten naar de kandidaat-singulariteit toe te bewegen en de
affiene parameter langs de geodeten te gebruiken als één der coördinaten aan de ‘andere’ zijde van
de singulariteit.
Een aanwijzing dat deze werkwijze enige kans op slagen zal hebben, is de afwezigheid van
singulariteiten (in de gewone betekenis van divergerende uitdrukkingen) in de invarianten van
(M, g). Stel b.v. dat een scalaire uitdrukking S (zoals R of Rabcd Rabcd ) singulier wordt in
een punt p met xi (p) = xi 0 , in de zin dat limxi →xi 0 S = ∞ (p kan dan strikt gezien niet tot
M behoren, zodat de terminologie ‘S is singulier in p’ eigenlijk foutief is). De aanwezigheid
van zulke krommingssingulariteiten verhindert duidelijk de constructie van een uitbreiding van
(M, g), waarin de singulariteit niet langer voorkomt. De afwezigheid van krommingssingulari-
teiten daarentegen biedt geenszins een garantie voor de afwezigheid van pathologisch gedrag3 .

3 Hiermee hebben we nog steeds niet gezegd wat een singulariteit is, of wat een singulariteit-vrije variëteit is. Een

precieze definitie van deze concepten is uiterst moeilijk — tenminste toch voor lorentz-variëteiten — en valt buiten
het kader van deze cursus.
7-4. EDDINGTON-FINKELSTEIN-METRIEK 133

7-4 Eddington-finkelstein-metriek
Passen we nu de ideeën uit de vorige paragraaf toe op de schwarzschild-oplossing 7-3.1: berekening
van de invariant
Rabcd Rabcd = 48m2 r−6 (7-4.1)
(1) toont aan dat in het T-gebied r = 0 een niet te verwijderen krommingssingulariteit is en dus
essentieel verschilt van de standaard coördinaatsingulariteit die optreedt bij het gebruik van
sferische coördinaten)
(2) suggereert dat r = 2m een coördinaatsingulariteit kan zijn.
Ook een studie van de radiale tijd-achtige geodeten wijst in deze richting4 : we vinden dan met
d
˙ = dτ de afgeleide naar de affiene parameter en met l een integratieconstante
2m −1
ṫ = (1 − ) l (7-4.2)
r
en
2m 2 2m −1 2
(1 − )ṫ − (1 − ) ṙ = 1 (7-4.3)
r r
∂ ∂ ∂t ∂ ∂r ∂
Hierbij volgt 7-4.2 uit de behoudswet ξ.u = constant met ξ = ∂t en u = ∂τ = ∂τ . ∂t + ∂τ . ∂r ,
2
terwijl 7-4.3 uitdrukt dat u = −1.
Het eenvoudigste geval (l = 1) levert ṙ2 = 2mr en laat zich onmiddellijk integreren tot
2
√ (r03/2 − r3/2 ) = τ (7-4.4)
3 2m
waaruit blijkt dat r = 2m in een eindige eigentijd door vallende testdeeltjes bereikt wordt.
Om duidelijkheid te verkrijgen over de mogelijke uitbreidbaarheid van het R-gebied, bekijken
we de inkomende nul-geodeten: uit 7-4.2 en 7-4.3 (met in het rechterlid 0 i.p.v. 1) volgt dat de
dr
affiene parameter λ dan voldoet aan dλ = constante en dus, op een translatie na, evenredig is met
r. Uit 7-3.3 weten we echter dat t + 2m log(r − 2m) + constante = −r, zodat λ evenredig is met
t + 2m log(r − 2m) + constante. In navolging van de hiervóór uiteengezette methode om variëteiten
uit te breiden, construeren we dan een nieuwe tijdachtige coördinaat
t = t + 2m log(r − 2m) (7-4.5)
Het R-gebied van de schwarzschild-oplossing wordt hierdoor isometrisch afgebeeld op het gebied
r > 2m van een variëteit met metriek
2m 2 4m 2m
ds2 = −(1 − )dt + dtdr + (1 + )dr2 + r2 (dθ2 + sin2 θdφ2 ) (7-4.6)
r r r
Deze uitbreiding van het oorspronkelijke R-gebied is de zgn. eddington-finkelstein 5 vorm van de
schwarzschild-oplossing, waarin de familie van inkomende geodeten eenvoudig wordt voorgesteld
door
r + t = constant (7-4.7)
4 zie
hoofdstuk 5 voor een meer gedetailleerde bespreking van de geodeten in de schwarzschild-geometrie
5 Reedsin 1921 werd door P. Painlevé een tijdcoördinaat ingevoerd waaruit kon blijken dat r = 2m geen ‘echte’
singulariteit was, maar hij ging -net zoals A.S. Eddington drie jaar later- aan dit opmerkelijke feit voorbij. G.
Lemaı̂tre (1923) was wellicht de eerste die het fictieve karakter van de r = 2m singulariteit opmerkte: hij noteerde
dit echter in een vrij onbekende publikatie en zijn opmerking verdween in het stof van de geschiedenis. Als gevolg
bleef de ‘schwarzschild-singulariteit’ — met alle implicaties aan de naam verbonden — de vakliteratuur teisteren,
tot er opheldering kwam met het werk van D. Finkelstein (1958) en M. Kruskal (1960).
134 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

Dit is echter niet alles: door de coördinaattransformatie

t = t + 2m log(2m − r) (7-4.8)

wordt bovendien het T-gebied van de schwarzschild-oplossing isometrisch afgebeeld op het 0 < r <
2m gebied van 7-4.6, zodat 7-4.6 een uitbreiding blijkt te zijn van zowel het R- als het T-gebied!
Hiermee kunnen figuren 7.1 en 7.2 als volgt verenigd worden:

Uitgaande familie

Inkomende familie

r
r=0 2m

Figuur 7.4: advanced eddington-finkelstein-extension

Hieruit blijkt duidelijk dat het hyperoppervlak r = 2m werkt als een half-doorlaatbaar mem-
braan: toekomstgerichte ( dt dt > 0) tijd-achtige geodeten en nul-geodeten worden enkel van ‘buiten’
(r > 2m) naar ‘binnen’ (r < 2m) doorgelaten. Dit oppervlak wordt een event horizon genoemd,
aangezien het de grens vormt van alle events die door een waarnemer uit het R-gebied kunnen
worden waargenomen. We benadrukken dat het fenomeen van een event horizon gekoppeld is aan
het feit dat r = 2m een nul-hyperoppervlak is (g rr = 0): het feit dat in de schwarzschild-oplossing
toevallig ook gtt = 0 heeft hier dus niets mee te maken!
Het feit dat zelfs lichtsignalen niet uit het gebied r < 2m kunnen ontsnappen, heeft aanleiding
gegeven tot de naam van zwarte gaten of black holes. Figuur 7.4 suggereert dat testdeeltjes, vanaf
het ogenblik waarop ze het T-gebied binnendringen, nog slechts een eindige levensduur hebben.
Er is echter méér: zelfs een waarnemer die niet op een geodeet beweegt (en b.v. probeert om met
een krachtige raketmotor ‘rond’ de singulariteit r = 0 te vliegen, zal zijn radiale coördinaat r zien
kleiner worden met een snelheid
dr 2m
| |≥( − 1)1/2 (7-4.9)
dτ r
Hieruit kan afgeleid worden dat de maximale levensduur van om het even welke waarnemer in het
T-gebied gegeven wordt door
m
∆τ = πm (≈ 10−5 ( )s) (7-4.10)
m⊙
oefening: bewijs beide voorgaande betrekkingen.
7-5. STATISCHE EN SFERISCH SYMMETRISCHE PERFECTE VLOEISTOFFEN 135

7-5 Statische en sferisch symmetrische perfecte vloeistoffen


Alhoewel de mogelijkheid van zwarte gaten reeds voorspeld werd (a) op basis van zuiver newto-
niaanse argumenten door J. Michell in 1784 en door P.S. de Laplace in 1796 en (b) op basis van
de einstein-vergelijkingen door R. Oppenheimer en H. Snyder in 1939, duurde het tot ongeveer
1960-1970 vooraleer het bestaan ervan min of meer algemeen aanvaard was!
Een eerste mogelijke verklaring hiervoor is de grootte (ρ ≈ 1021 kg m−3 ) die de materiedichtheid
van een ster van een tiental zonsmassa’s moet bereiken, opdat ze zou kunnen inkrimpen tot haar
straal de schwarzschild-straal rS ≈ 3( mm⊙ ) km benadert: dergelijke enorme dichtheden werden door
de meeste astronomen gedurende lange tijd als volslagen onzin van de hand gewezen6 . Een bijzonder
langzaam proces was nodig om (hand in hand met de ontwikkeling van de quantum mechanica)
via de vertrouwdheid met witte dwergen (1926: ρ ≈ 109 kg m−3 ) en met neutronensterren (1968:
ρ ≈ 1018 kg m−3 ), uiteindelijk te leiden tot het vandaag alom aanvaarde scenario van z.g. totale
gravitationele collaps (zie verder).
Een tweede reden was -en bij een aantal onderzoekers is nog steeds- de 19de eeuwse visie
van een geordend universum, waarin de materie uiteindelijk evolueert naar stationaire of statische
evenwichtstoestanden. Einstein zelf was één der felle verdedigers van dit geloof, alhoewel dit hem
reeds eerder parten had gespeeld bij de introductie van de kosmologische constante (nl. om een
statisch heelal model als oplossing van de veldvergelijkingen te kunnen bekomen). Twintig jaar
na de invoering van de kosmologische constante bracht dezelfde overtuiging hem er opnieuw toe
een (foutief) bewijs te leveren dat (in de toenmalige terminologie) ‘schwarzschild singulariteiten’
in werkelijkheid niet kunnen voorkomen. Hiertoe beschouwde hij een stationair roterende wolk van
deeltjes en toonde dat een evenwichtsoplossing enkel mogelijk was voor een straal > 32 rS , zoniet
zouden de buitenste deeltjes van de wolk zich moeten bewegen met een snelheid groter dan de
lichtsnelheid. De redenering was volledig consistent, maar de conclusie was fout omdat opnieuw
werd voorbij gegaan aan de mogelijkheid van een niet-stationaire eindtoestand van de materie!
Een derde reden tenslotte is dat pas na de tweede wereldoorlog voldoend krachtige computers
op het toneel verschenen om het uiterst complexe probleem van gravitationele collaps in detail
te volgen. In wat volgt zullen we het eigenlijke probleem van de collaps niet aansnijden, maar
ons beperken tot het ermee verwante probleem van gravitationeel evenwicht. In het bijzonder
zullen we de voorwaarden onderzoeken waaraan een sferisch symmetrisch systeem moet voldoen
om een statische oplossing te kunnen zijn van de einstein-vergelijkingen. We zullen hierbij een
zgn. inwendige oplossing (met Tab 6= 0) in een hyperoppervlak r = R ‘lijmen’ aan een uitwendige
oplossing (Tab = 0), die een deel is van het R-gebied van de schwarzschild-oplossing (R > RS )7 .

Het hyperoppervlak r = R noemen we het matching oppervlak en we onderstellen dat de


metriek samen met zijn eerste normale afgeleiden continu is doorheen dit oppervlak.
We vertrekken met de hypothese dat het inwendige deel beschreven wordt door een perfecte
vloeistof,
Tab = ρua ub + p(gab + ua ub ) (7-5.1)

en dat de inwendige en uitwendige oplossingen samen worden voorgesteld door de metriek 7-2.3
met Y = r en λ̇ = ν̇ = 0. De perfecte vloeistof beschreven door 7-5.1 is statisch als u parallel is
6 De dag van vandaag hanteren astronomen zonder schroom massa-concentraties van 108 m , zodat een samen-

drukking tot rS reeds wordt bereikt bij een dichtheid van 103 kg m−3 , wat vanuit microfysisch standpunt zéker
geen fundamentele problemen stelt!
7 verwar zulke inwendige oplossing dus niet met het T-gebied van de schwarzschild-oplossing!
136 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN


met de killing-vector ∂t , t.t.z.

u = e−ν (7-5.2)
∂t
Hierdoor worden de van 0 verschillende componenten van Tab gegeven door
T(0)(0) = ρ en T(1)(1) = T(2)(2) = T(3)(3) = p (7-5.3)
en de einstein-vergelijkingen worden
2
8πp =e−2λ (ν ′′ + ν ′ − ν ′ λ′ + (ν ′ − λ′ )r−1 ) (7-5.4)
8πpr2 = − 1 + e−2λ (1 + 2rν ′ ) (7-5.5)
2 −2λ ′
8πρr =(r(1 − e )) (7-5.6)
Uit 7-5.6 bekomen we onmiddellijk
2µ(r) −1
e2λ = (1 − ) (7-5.7)
r
met Z r
µ(r) = 4π ρ(x)x2 dx + constante (7-5.8)
0
Leggen we de eis op dat de metriek voor voldoend kleine waarden van r in benadering vlak moet
zijn (wat we uitdrukken door de eis dat de oppervlakte van een sfeer met straal r gegeven is door
4π × ( eigenstraal)2 ), dan moet limr→0 λ(r) = 0 en is de integratieconstante optredend in 7-5.8
noodzakelijk 0.
Lijmen van inwendige en uitwendige oplossing in r = R betekent dan dat de constante m die
optreedt in de uitwendige oplossing gegeven is door
Z R
m = 4π ρ(x)x2 dx (7-5.9)
0

Alhoewel dit identiek is met de uitdrukking voor de totale massa in Newtoniaanse


p gravitatie, dienen
we te bedenken dat het ruimtelijk volumeëlement gegeven is door (3) gd3 x = eλ r2 sin θdrdθdφ,
zodat de totale massa mp (de eigenmassa) in werkelijkheid gegeven wordt door
Z R
mp = 4π ρ(x)x2 eλ(x) dx .
0

Noteer dat mp > m, waarbij het verschil kan geı̈nterpreteeerd worden als de gravitationele bindings-
energie.
Uit 7-5.5 bekomen we nu
8πpr3 + 2µ(r)
ν′ = (7-5.10)
2r(r − 2µ(r))
In de newtoniaanse limiet, met pr3 << µ en µ << r, reduceert dit zich tot de poisson-verge-
lijking, zodat we ν kunnen interpreteren als de veralgemening van de newtoniaanse gravitationele
potentiaal.
Substitutie van 7-5.7 en 7-5.10 in 7-5.4 levert nu een vergelijking voor p′ . We kunnen echter dit
rekenwerk vermijden door gebruik te maken van de behoudswetten T ab ;b = 0: met 7-5.1 en 7-5.2
reduceren deze zich tot precies één vergelijking, nl.
p′ = −(p + ρ)ν ′ (7-5.11)
7-5. STATISCHE EN SFERISCH SYMMETRISCHE PERFECTE VLOEISTOFFEN 137

oefening: verifieer voorgaande betrekking


Op deze manier bekomen we onmiddellijk de vergelijking van Tolman-Oppenheimer-Volkov
voor hydrostatisch evenwicht:
8πpr3 + 2µ(r)
p′ = −(p + ρ) (7-5.12)
2r(r − 2µ(r))
waaruit we, samen met 7-5.8 en een gekozen toestandsvergelijking p = p(ρ), p(r) en ρ(r) kunnen
bepalen:

(a) kies een centrale dichtheid ρc : via de toestandsvergelijking ligt dan ook pc vast,

(b) integreer 7-5.8 en 7-5.12 buitenwaarts, tot het oppervlak (p = 0) van de ster bereikt wordt:
dit bepaalt de constante m (7-5.9) die optreedt in de uitwendige oplossing,

(c) integreer 7-5.10 binnenwaarts vanaf r = R.

Het essentiële verschil met newtoniaanse gravitatie is dat het rechterlid van 7-5.12 in absolute
waarde steeds groter is dan de newtoniaanse term ρµ(r)/r2 , zodat hydrostatisch evenwicht in A.R.
‘moeilijker’ te behouden is dan in de newtoniaanse theorie. Dit blijkt duidelijk uit b.v. de exacte
oplossing die bekomen wordt voor een ster met uniforme dichtheid ρ(r) = ρ0 . Uit 7-5.8 volgt dan

4 3
µ(r) = πr ρ0 (7-5.13)
3
Integreren we hiermee de newtoniaanse vergelijking voor hydrostatisch evenwicht, dan bekomen
we
2
p(r) = πρ20 (R2 − r2 ) (7-5.14)
3
4/3
zodat de centrale druk pc = 23 πρ20 R2 = ( π6 )1/3 m2/3 ρ0 willekeurig groot kan zijn (m.a.w. voor elke
waarde van m en ρ0 bestaat een newtoniaanse evenwichtsconfiguratie). Integratie daarentegen van
de relativistische vergelijking 7-5.12 levert (K. Schwarzschild 1916)

1 − c(1 − 2mr2 /R3 )1/2


p=ρ
c(1 − 2mr2 /R3 )1/2 − 3

met m = 4/3πρR3 en c uit p(R) = 0:

(1 − 2m/R)1/2 − (1 − 2mr2 /R3 )1/2


 
p(r) = ρ0 (7-5.15)
(1 − 2mr2 /R3 )1/2 − 3(1 − 2m/R)1/2

zodat
1 − (1 − 2m/R)1/2
 
pc = ρ0 (7-5.16)
3(1 − 2m/R)1/2 − 1
Wil de centrale druk eindig blijven, dan moet een ster met uniforme dichtheid dus een massa m
hebben met
4
m< R (7-5.17)
9
of
4 1/2
mmax = ρ (7-5.18)
9(3π)1/2 0
138 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

Men kan nu aantonen dat, onder de hypothese dρ dr ≤ 0, de voorwaarde 7-5.17 onafhankelijk van de
gekozen toestandsvergelijking geldt en dat de maximum waarde 4R 9 precies bereikt wordt voor het
geval van uniforme dichtheid. Dit resultaat is van fundamenteel belang omdat het aantoont dat,
van zodra een sferisch symmetrische materieverdeling is ingekrompen tot een straal ≤ 89 rS , geen
enkele toestandsvergelijking nog bij machte is om verdere collaps tegen te houden!
Dergelijk scenario kan zich afspelen als een ster al haar nucleaire brandstof heeft opgebruikt
en een Fe-Ni kern heeft opgebouwd: is de massa van de ster op dat ogenblik kleiner dan de Chan-
drasekhar limiet mc ≈ 1.4M⊙ , dan trekt de ster verder samen tot een stabiele evenwichtstoestand
van witte dwerg bereikt wordt, waarbij de gravitationele aantrekking gecompenseerd wordt door
ontaarde electronen druk. Is de massa groter dan mc dan gaat de gravitationele samentrekking
verder tot in de kern nucleaire materiedichtheden bereikt worden. Is de totale massa van de sa-
mentrekkende kern op dat ogenblik kleiner dan een kritische massa mn ≈ 4M⊙ , dan kan verdere
collaps worden tegengehouden door de ontaarde neutronen druk en door de kernkrachten. Het
resultaat is dan een neutronenster : bij de afremming van de kern ontstaat een schokgolf die ver-
antwoordelijk is voor het wegslingeren van de buitenste lagen van de ster, wat dan aanleiding geeft
tot de vorming van een supernova. Is echter de massa van de samentrekkende kern groter dan mn ,
dan tonen numerieke simulaties aan dat de collaps onbeperkt verder gaat. Het volgende scenario
ontvouwt zich dan:

r = 2m

Vacuüm

singulariteit

Inwendige van de ster

Figuur 7.5: collaps van een ster

Fig. 6.6
Een statische waarnemer buiten r = 2m, waarvoor de eigentijd dus op een constante factor nà
gegeven wordt door de schwarzschild-tijd ‘t’, zal de samentrekkende ster echter nooit doorheen
het oppervlak r = 2m zien verdwijnen: ten eerste geschiedt dit op een welbepaalde eddington-
finkelstein-tijd t0 en bijgevolg op een oneindige tijd t en, ten tweede, zal het oppervlak van de ster
reeds kort voor r = 2m bereikt is uit het zicht verdwenen zijn. Het oppervlak r = 2m is immers niet
7-5. STATISCHE EN SFERISCH SYMMETRISCHE PERFECTE VLOEISTOFFEN 139

alleen een event horizon (g rr = 0), maar ook een oneindig roodverschuivingsoppervlak : in hoofdstuk
5 hebben we gezien dat een electromagnetische golf, vertrekkend vanuit positie r, op oneindig wordt
−1/2
waargenomen met een roodverschuivingsfactor 1 + z ∼ gtt . Vermits gtt = 1 − 2m/r, divergeert
deze uitdrukking voor r → 2m.
Bij het hier geschetste scenario bestaan nog een aantal onzekerheden:
Ten eerste is er de onzekerheid i.v.m. mn : in de oorspronkelijke berekeningen van Oppenheimer
en Volkov werd mn ≈ 0.7M⊙ bekomen, uitgaande van een ideaal gas van neutronen als model voor
een neutronenster. Meer realistische modellen kunnen deze massa opdrijven tot 5M⊙ (afhankelijk
van de keuze van toestandsvergelijking, de rol van kernkrachten, de aanwezigheid van electromag-
netische velden, . . . ). Nemen we bovendien rotatie in acht, dan kan de limiet zelfs opgedreven
worden tot 6M⊙ .
Ten tweede is er de onzekerheid i.v.m. de te gebruiken gravitatietheorie: andere gravitatietheo-
rieën dan A.R. voorspellen andere maximale massa’s voor neutronensterren. Deze zelfde opmerking
geldt in nog sterkere mate voor de uiteindelijke fase van de collaps, t.t.z. nadat de ster zich binnen
rS heeft samengetrokken: deze fase treedt binnen een aantal alternatieve theorieën zelfs helemaal
niet op.
Blijven we echter binnen het kader van A.R., dan kunnen we nog opmerken dat het alles behalve
verwonderlijk is dat, bij zuiver sferisch symmetrische collaps, uiteindelijk een singulariteit optreedt
in r = 0. Men kan zich i.h.b. afvragen of een niet-singuliere eindtoestand van de materie mis-
schien mogelijk wordt als we afwijkingen van de sferische symmetrie beschouwen. Een gedeeltelijk
antwoord op deze vraag wordt gegeven door de zgn. singulariteitstheorema’s (R. Penrose en S.W.
Hawking, 1965-1970), die aantonen dat, onafhankelijk van de precieze vorm van de veldvergelij-
kingen of van de energie-impuls tensor, de belangrijkste eigenschappen van sferisch symmetrische
collaps worden overgedragen naar het geval van algemene collaps. Deze theorema’s vertrekken van
een beperkt aantal ‘voor de hand liggende’ hypothesen betreffende het gedrag van de materie (de
z.g. energie voorwaarden) en betreffende de causale structuur van de ruimte-tijd en tonen aan dat
onder deze algemene voorwaarden singulariteiten altijd optreden. De singulariteitstheorema’s zijn
echter zuivere existentietheorema’s en ze geven geen enkele informatie over de plaats of de aard
van de resulterende singulariteiten: dit moeten dus niet noodzakelijk (zoals o.a. in het sferisch
symmetrische geval) krommingssingulariteiten zijn!
140 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

7-6 Kruskal’s vorm van de schwarzschild-oplossing


In paragraaf 6.4 slaagden we er reeds in om m.b.v. de eddington-finkelstein-metriek (7-4.6) zowel
het R-gebied als het T-gebied van de schwarzschild-oplossing te bekijken als deelvariëteiten van
één zelfde variëteit. We gebruikten hiervoor de familie van inkomende geodeten en zorgden ervoor
dat hun affiene parameter kon voortgezet worden aan beide zijden van r = 2m.
Een blik op figuur 7.4 doet echter vermoeden dat hiermee nog niet alle problemen uit de weg
geruimd zijn. De uitgaande nul-geodeten in het R-gebied kunnen onmogelijk uit het T-gebied
afkomstig zijn: elk punt heeft slechts een eindige parameter-afstand tot r = 2m, wat wijst op
onvolledigheid nabij r = 2m, t = −∞! Inderdaad, met τ een affiene parameter zijn de radiale
dr dt
nulgeodeten gegeven door dτ = ±l en dτ = (1 − 2m
r )
−1
l, i.e.

dt r + 2m
=l
dr r − 2m
De oplossingen hiervan zijn

r =r0 − lτ
(7-6.1)
t + r =t0 + r0

voor de inkomende familie en


r =r0 + lτ
r − 2m (7-6.2)
t − r =t0 − r0 + 4m log
r0 + 2m
voor de uitgaande familie.
Als alternatief kunnen we ook de uitgaande familie ‘recht trekken’: i.p.v. 7-4.8 voeren we nu
een nieuwe tijd-coördinaat in
t∗ = t − 2m log(r − 2m) (7-6.3)
en bekomen hiermee de gedaante
2m ∗ 2 4m ∗ 2m
ds2 = −(1 − )dt − dt dr + (1 + )dr2 + r2 (dθ2 + sin2 θdφ2 ) (7-6.4)
r r r
wat precies de tijds-omkering is van 7-4.68 . Figuur 7.4 wordt nu

8 men noemt dit de retarded eddington-finkelstein-extension van gebied I, in tegenstelling tot 7-4.6, die ook de

advanced eddington-finkelstein-extension van gebied I genoemd wordt


7-6. KRUSKAL’S VORM VAN DE SCHWARZSCHILD-OPLOSSING 141

t*

r=0 r = 2m r
Figuur 7.6: retarded eddington-finkelstein-extension

zodat we hoger vermeld probleem uiteindelijk slechts verschoven hebben van de uitgaande naar
de inkomende geodeten!
Om de onvolledigheid bij r = 2m te vermijden dienen we blijkbaar op één of andere manier
simultaan de uitgaande én inkomende families recht trekken. M. Kruskal’s oplossing (1960) van
dit probleem bestond erin twee nul-coördinaten v en w te definiëren door

w = t∗ − r =t − r − 2m log(r − 2m)
(7-6.5)
v = t + r =t + r + 2m log(r − 2m)

Hierdoor worden beide families nul-geodeten dan eenvoudig bepaald door

w = constant (uitgaande familie)

en
v = constant (inkomende familie) (7-6.6)
en vinden we de metriek door 7-6.5 op te lossen naar r:
r v−w
r + 2m log( − 1) = (7-6.7)
2m 2
Hiermee wordt de schwarzschild-metriek 7-3.1 herschreven als
2me−r/2m (v−w)/4m
ds2 = − e dwdv + r2 (dθ2 + sin2 θdφ2 ) (7-6.8)
r
2m
= − (1 − )dvdw + r2 (dθ2 + sin2 θdφ2 ) (7-6.9)
r
De metriek bevat nog steeds een coördinaatsingulariteit bij r = 2m, maar men kan nu deze singu-
lariteit opheffen door een nieuwe keuze van nul-coördinaten v ′ = v ′ (v) en w′ = w′ (w).
142 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

Met Kruskal’s keuze


√ r+t
v ′ = ev/4m = r − 2m exp( )
4m
√ r−t
w′ = −e−w/4m = − r − 2m exp( ) (7-6.10)
4m
bekomen we
e−r/2m ′ ′
ds2 = −32m3 dv dw + r2 (dθ2 + sin2 θdφ2 ) (7-6.11)
r
of nog, na invoering van T = 12 (v ′ + w′ ) en X = 12 (v ′ − w′ )

e−r/2m
ds2 = 32m3 (−dT 2 + dX 2 ) + r2 (dθ2 + sin2 θdφ2 ) (7-6.12)
r
Hierin is r(X, T ) impliciet bepaald door 7-6.7, i.e.
r
( − 1)er/2m = X 2 − T 2 (7-6.13)
2m
terwijl de oorspronkelijke t coördinaat gegeven wordt door t = 4m tanh−1 X
T
.
De coördinaten T en X worden enkel beperkt door de voorwaarde r > 0, vermits r = 0 een
niet te verwijderen krommingssingulariteit is. Uitgedrukt in X en T betekent dit

X 2 − T 2 > −1 (7-6.14)

wat het domein van de kruskal-coördinaten beperkt tot het in figuur 6.8 voorgestelde gebied van
de hyperbool X 2 − T 2 = −1.
In dit diagram worden de krommen r = constant voorgesteld door gelijkzijdige hyperbolen en de
krommen t = constant door rechten door de oorsprong. Nul-geodeten worden voorgesteld door
rechten die een hoek van ±45o maken met de X-as, wat de conforme structuur uiterst eenvoudig
maakt.
De unie van de gebieden I en II van het kruskal-diagram is isometrisch equivalent met de unie van
de gebieden I en II besproken in hoofdstuk 7 (de advanced eddington-finkelstein-extension), terwijl
de unie van de gebieden I en III isometrisch equivalent is met de retarded eddington-finkelstein-
extension 7-6.4. Men kan aantonen dat de kruskal-oplossing de unieke analytische uitbreiding is
van de schwarzschild-oplossing, die maximaal is in de zin dat ze geen deelvariëteit is van een andere
locaal niet-uitbreidbare uitbreiding van Schwarzschild.
Het gebied I kan geı̈nterpreteerd worden als het uitwendige van een statisch en sferisch sym-
metrisch lichaam. In gebied II eindigt elke nul-geodeet—en dus ook elke tijd-achtige kromme—
noodzakelijk op het singuliere oppervlak r = 0: dit gebied correspondeert dus met de in vorig
hoofdstuk besproken zwarte gaten. De tijdsomkering van gebied II is gebied III. Elke nul-geodeet
begint er noodzakelijk op het singuliere oppervlak r = 0 en de eigenschappen ervan zijn volkomen
analoog aan deze van gebied II: men noemt dit daarom ook wel een wit gat.
7-6. KRUSKAL’S VORM VAN DE SCHWARZSCHILD-OPLOSSING 143

r= m
T

4m
r=

3
r = 2m, t= h

r=
t = 2m
II
t=m
X
IV t=0
t = -m
I
III
t =- 2m

r = 2m, t=- h

r=
0
Figuur 7.7: kruskal-extensie

Zeer vreemd in de kruskal-oplossing is het optreden van een tweede asymptotisch vlak gebied IV,
waarvan de eigenschappen analoog zijn aan deze van gebied I. Gebieden I en IV zijn echter causaal
volledig van elkaar losgekoppeld: elk signaal dat tussen beide zou verzonden worden, wordt door
de r = 0 singulariteit opgeslokt. Het is ver van duidelijk of de ganse kruskal-oplossing, i.h.b. ge-
bied IV, enige fysische betekenis heeft: geen enkel fysisch proces is gekend, dat aanleiding kan
geven tot de vorming van de vier gebieden. Desondanks kunnen we proberen ons een voorstelling
van de oplossing te vormen door twee asymptotisch vlakke oplossingen van de einstein-vacuum-
vergelijkingen aan elkaar te ‘lijmen’ in r = r(t). Bekijken we b.v. het bijzonder geval van het
t = T = 0 hyperoppervlak, waarvan de ruimtelijke geometrie bepaald wordt door de metriek
2m −1 2
ds2 = (1 − ) dr + r2 (dθ2 + sin2 θdφ2 ) (7-6.15)
r
De doorsnedes hiervan met de vlakken θ = π2 kunnen voorgesteld worden als 2-dimensionale
omwentelingsoppervlakken z = z(r) ingebed in een 3-dimensionale euclidische ruimte met me-
triek dz 2 + dr2 + r2 dφ2 . De precieze geometrie van de oppervlakken hangt af van de keuze van
het oorspronkelijke hyperoppervlak: kwalitatief worden ze voor voldoend kleine |T | echter allen
voorgesteld door volgende figuur, waarin we de verbindende ‘tunnel’ tussen beide asymptotisch
vlakke ruimten de einstein-rosen-brug noemen.
144 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

r= 2m op T = 0

Figuur 7.8: einstein-rosen brug

Aangezien de einstein-vergelijkingen enkel de locale structuur van de oplossingen bepalen, be-


hoort echter ook onderstaande alternatieve topologie tot de mogelijkheden:

Figuur 7.9: wormgat

De einstein-rosen-brug verbindt nu twee gedeelten van één zelfde asymptotisch vlakke ruimte:
we spreken in dit geval van een wormgat. Onderzoek naar z.g. tijdmachines houdt zich o.a. met
de vorming van dergelijke wormgaten bezig. . . 9

9 Wie een echt (nou ja ...) wormgat wil zien moet op het eiland Aran (Ierland) de Poll na bPéist eens gaan

bekijken.
7-7. CONFORME COMPACTIFICATIE 145

7-7 Conforme compactificatie


Alhoewel figuur 6.10 reeds een inzicht geeft in de causale structuur van de kruskal-oplossing, is
het gedrag ‘op oneindig’ er niet onmiddellijk uit af te lezen. In het bijzonder is de structuur
van de oplossing op z.g. nul-oneindig moeilijk te herkennen: het is deze structuur -eerder dan de
structuur op ruimtelijk oneindig- die van belang is, als we bij meer gecompliceerde oplossingen b.v.
het asymptotisch gedrag van straling wensen te onderzoeken. Om dergelijke vragen te bestuderen
werden door R. Penrose een aantal belangrijke technieken ontwikkeld. Het is de bedoeling om in
deze paragraaf enkele van deze technieken, samen met de ermee gepaard gaande terminologie, te
illustreren aan de hand van de minkowski- en kruskal-metrieken.
Zoals hierboven gesuggereerd, is het opzet een compactificatie van het ruimte-tijd model te
bekomen, waarbij we ‘bewerkingen op oneindig’ kunnen vervangen door bewerkingen bij eindige
waarden van de coördinaten (door gebruik te maken van functies zoals tan−1 ). Tijdens zulke
procedure worden echter meestal nieuwe coördinaatsingulariteiten ingevoerd, die we proberen op
te vangen door een andere metriek op de gegeven variëteit te definiëren: omdat we op zijn minst
verlangen dat de causale structuur van de nieuwe metriek (de onfysische metriek gab ) identiek zou
zijn aan deze van de oude metriek ( de fysische metriek gab ), stellen we

gab = Ω2 gab (7-7.1)

waarbij Ω ∈ F(M) zo gekozen is dat de door de compactificatie geı̈ntroduceerde coördinaat-


singulariteiten verdwijnen.
Bekijken we eerst het geval van de minkowski-metriek, die we m.b.v. nul-coördinaten v = t + r
en w = t − r herschrijven als
1
ds2 = −dvdw + (v − w)2 (dθ2 + sin2 θdφ2 ) (7-7.2)
4
Aangezien −∞ < t < ∞ en 0 < r < ∞ geldt

−∞ < v < ∞
−∞ < w < ∞ (7-7.3)
v>w

Definiëren we nu coördinaten v ′ en w′ door v ′ = tan−1 v en w′ = tan−1 w dan geldt


π π
− < v′ <
2 2
π ′ π
− <w <
2 2
v ′ > w′

en wordt de metriek
1
ds2 = sec2 v ′ sec2 w′ −4dv ′ dw′ + sin2 (v ′ − w′ )(dθ2 + sin2 θdφ2 )
 
(7-7.4)
4
De coördinaatsingulariteiten bij ± π2 kunnen we nu opheffen door een onfysische metriek 7-7.1 in
te voeren met Ω = 12 sec v ′ sec w′ . Stellen we bovendien t′ = v ′ + w′ en r′ = v ′ − w′ , dan bekomen
we
2 2
ds2 = −dt′ + dr′ + sin2 r′ (dθ2 + sin2 θdφ2 ) (7-7.5)
146 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

met
−π < t′ + r′ < π
−π < t′ − r′ < π (7-7.6)
r′ > 0

De metriek 7-7.5 met −∞ < t′ < ∞, 0 < r′ < π, 0 < θ < π, 0 < φ < 2π is de metriek van het
Einstein statisch heelal : dit kan beschouwd worden als de inbedding van een cilinder x2 + y 2 + z 2 +
w2 = 1 in een 5-dimensionale euclidische ruimte met metriek ds2 = −dt2 + dx2 + dy 2 + dz 2 + dw2
(stel x = cos r′ , y = sin r′ sin θ cos φ, z = sin r′ sin θ sin φ en w = sin r′ cos θ).
Elk hyperoppervlak t′ = constant van het einstein-heelal heeft de topologie van een 3-sfeer.
Laten we de w en z coördinaten weg, dan kan de minkowski-ruimte dus conform voorgesteld worden
als de ‘ruit’ −π < t′ ± r′ < π van de einstein-cilinder x2 + y 2 = 1, gelegen in een 3-dimensionale
ruimte met metriek ds2 = −dt2 + dx2 + dy 2 :

t’= p
+
i

+
J
io

t’=0

- t’= -p
J
-
i
r’=p

r’=0

Figuur 7.10: einstein cilinder en gecompactifieerde minkowski ruimte


7-7. CONFORME COMPACTIFICATIE 147

We noemen de resulterende variëteit de gecompactifieerde minkowski-ruimte. De conforme


structuur ‘op oneindig’ van de minkowski-ruimte wordt nu voorgesteld door de rand van de ruit.
Deze rand bestaat uit de volgende delen:
π
• een nul-hyperoppervlak v ′ = 2 (ℑ+ )

• een nul-hyperoppervlak w′ = − π2 (ℑ− )


π
• een punt v ′ = w′ = 2 (i+ )
π
• een punt v ′ = 2, w′ = − π2 (i0 )

• een punt v ′ = w′ = − π2 (i− )

Men kan aantonen dat

(1) alle tijdachtige geodeten van de originele metriek beginnen, in i− en eindigen in i+ ,

(2) dat alle nul-geodeten beginnen op ℑ− , en eindigen op ℑ+ en

(3) dat alle ruimte-achtige geodeten beginnen en eindigen in i0 . Vandaar dat men i+ en i−
respectievelijk toekomstig en verleden tijdachtig oneindig noemt, ℑ+ en ℑ− respectievelijk
toekomstig en verleden nul oneindig en i0 ruimte-achtig oneindig.

In een penrose-diagram wordt, met weglating van de θ en φ coördinaten, slechts de halve ruit r′ > 0
voorgesteld (r′ = 0 is de standaard coördinaatsingulariteit die steeds optreedt bij poolcoördinaten).
In onderstaande figuur zijn bovendien de r en t coördinaatkrommen getekend. De nul geodeten
(i.e. de v ′ = constant en w′ = constant krommen) zijn precies de rechten die een hoek van ±45o
maken met de horizontale.

t i+ +
J
+
ip

+
J

o r=o io r’
i
O p
t = konstant

J-

r = konstant
-p -
i
-
J
i-

Figuur 7.11: penrose diagram van minkowski ruimte

Met een penrose-diagram kan ook de asymptotische structuur van niet-conform vlakke me-
trieken worden voorgesteld, op voorwaarde dat ze aan bijkomende eigenschappen -zoals sferische
symmetrie- voldoen. Zo wordt b.v. de asymptotische structuur van de radiale nul-geodeten in 6.2.3
volkomen bepaald door de 2-vlakken met (conform vlakke) metriek ds(2) 2 = −e2ν dt2 + e2λ dr2 . Dit
148 HOOFDSTUK 7. BIJZONDERE OPLOSSINGEN

suggereert ons om de kruskal-metriek als volgt te vervormen: eerst definiëren we nul-coördinaten


v ′′ en w′′ door v ′′ = tan−1 v ′ en w′′ = tan−1 w′ . Er geldt dan
π π
− < v ′′ <
2 2
π ′′ π
− <w < (7-7.7)
2 2
π π
− < v ′′ + w′′ <
2 2
en de metriek van de θ = constant, φ = constant deelvariëteit van 6.6.11 wordt

e−r/2m ′′ ′′
ds(2) 2 = −32m3 sec2 v ′′ sec2 w′′ dv dw (7-7.8)
r
Met Ω = sec v ′′ sec w′′ en T ′′ = v ′′ +w′′ , X ′′ = v ′′ −w′′ bekomen we dan voor de onfysische metriek

e−r/2m 2 2
ds(2) 2 = 8m3 (−dT ′′ + dX ′′ ) (7-7.9)
r
Hieruit wordt volgend diagram afgeleid voor de kruskal-oplossing: de figuur toont nogmaals over-
duidelijk dat r = 0 een ruimte-achtig singulier oppervlak is, waarop alle nul-geodeten eindigen die
vertrekken vanuit gebied II.

..
r constant < 2m
.
..
..
. ..
.
..
... ..
.... .. .... . . . . .
.
........... .............. .............. ............... .............. .............. ......................... +
i
.. .
.. ...... ... .. .......... .. .. .......... . ............
. ..... ..... ..... .....
.. ........................ ............
..... ................................ .. ...... . ..
..... ..... ... ........... . ........ .... .... ........
..
....... ..... ................. .... .
. ..
.. ..... .
........... ......... ... ......
. ..... ................. ... ...... . ..
..... ..... ................. ...... .......................... ..... ... ......
....... ..... ... .. . ... ..... ... .....
..
..... ......
.
. .
.. ....... ...
........ ...
...
.....
.....
..... .. ....... . ..... .....
..
. . ..
. ... .....
... . ..... ... +
. ..
.....
... .
...
.
..
. . . . . . .......
..
.....
.. .... ....
.
..
..
...........
... ......... . . .
.
....
...
.
.....
.....
.....
.....

.
...... . . .....
..
..... .
...... . .
..
. .
..
......
.... .. .... ..
..... ..... ..... . .. .....
..... .. ..... ..... .. .....
..... ..... .....

.
.. .
...........
. . . ..
.....
.....
..
......
.
II ..
.....
........
r = 2m
..
..
.
.
..
.....
.....
.....
.... . ...... .... .
.. .....
..... . .. .
......... ..
. . .....
......... . .. ....
.....
.....
..... . . . .
IV .
.......
..
.
..
..
... .......
.....
..
I .
.
.
.
.
.
...
......
.
..... i0
..... .. ..
..... .....
.
.
.
.
. .
......
..... . .... ..... .. ....
..... ..... ..... .. .....
.....
.....
..... ..
.
.
.

..
.....
.....
..... III .....
.....
.....
.
. ..
.
..
..
.......
.....
.....
..... . .. ...... . ..
...... ..... ..... .. . .....
....
.... ..... ..... .. .......
.. ...... .....
. ..... ..... ..... .. ..... .........
. ......... ..... −
.
.
.. .....
.....
..... .....
.
.....
.
......
.....
..
......
.....
.....
..
..
....
.....
..
..
..... ...
. ℑ
. ..... . ..
. .
. .
. .
. .
. ..... .... .....
... .......
.. ..
. ..... ..... ..... ..
. ..... ..... ..... ... ....... ...
. ..... ..... .....
..... ............. . . .. .
. ..... ........ . . . ....

.
.
.
.
....
.
.........
....
. . ............ ...
. . ..
.......... ....... .........
......
..
..........
..
..........
. .
.... ....... ....... ......... ....... ....... ....... ....... ....... ....... ....... ....... ....... ..........................
..........
..
..........
. . .
. . ..
r constant > 2m
. .
.
.
.
.
..
.. i −
. ..
. . . ..
. . . .. .
. . . .
. . . . . . . . . . . . . .. .
toekomstige en verleden singulariteit r = 0

Figuur 7.12: de ‘penrose-diamant’


Hoofdstuk 8

Inleiding tot de kosmologie

Giordano Bruno
Filosofo, arso vivo a Roma,
PER VOLONTA DEL PAPA
IL 17 FEBBRAIO 1600

8-1 Standaard model


Twee soorten van waarnemingen liggen aan de basis van de moderne kosmologie: (1) waarnemingen
van individuele bronnen (sterrenstelsels, radiobronnen, QSO’s e.d.) en (2) waarnemingen van de
stralingsachtergrond (radio-, microgolf-, infrarood, etc.). Het oerknal (of big bang) model is het
resultaat van deze waarnemingen en wordt algemeen aanvaard als het standaard-model waarbinnen
kosmologisch onderzoek zich dient te situeren.
De meest in het oog springende kenmerken van het standaard-model zijn:
• dat het een sterke symmetrie vertoont (het heelal ziet er ‘overal’ ongeveer hetzelfde uit),
• dat het zeer groot is,1
1 op het eerste zicht een vrij triviale opmerking; cf. echter de ‘small universe’ theorie van Ellis, recent terug in de

belangstelling (J.P. Luminet)

149
150 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

• dat het evolueert in de tijd,


• dat het een eindige ouderdom heeft.
Het standaard-model dient in de eerste plaats bekeken te worden als een 0-de orde-model dat ons
toelaat om welbepaalde fysische vragen over het heelal te formuleren. Waarnemingen kunnen dan
achteraf aanwijzingen verstrekken over die aspecten van het model die verder moeten verfijnd wor-
den. Als eerste stap bij de constructie van zulk 0-de orde-model, vertrekken we van de hypothese
dat het heelal kan beschreven worden als een n-dimensionale differentiaalvariëteit,
P voorzien van
een lorentz-metriek g en een energie-impuls tensor T. We stellen T = TM , met TM de bijdra-
gen van alle materievelden in het heelal aanwezig. Voor elke component dienen de noodzakelijke
toestandsvergelijkingen afzonderlijk gegeven te worden. De metriek wordt bekomen door oplossen
van de Einstein-vergelijkingen
Gab + Λgab = 8πTab (8-1.1)
Voor de algemeenheid houden we ook rekening met een eventuele kosmologische constante Λ. De
kosmologische constante werd door Einstein in de veldvergelijkingen ingevoerd om een statische
en homogene oplossing mogelijk te maken. Deze modificatie van de veldvergelijkingen werd door
Einstein enkele jaren later — nadat de waarnemingen van Hubble 2 hadden aangetoond dat het
heelal niet in een toestand van statisch evenwicht verkeerde, maar onderhevig was aan een expan-
sie — bestempeld als ”de grootste blunder van zijn leven”. De kosmologische constante heeft een
bewogen geschiedenis achter de rug en werd regelmatig weer ingevoerd (en naderhand afgevoerd),
al naargelang de stand van zaken in de observationele kosmologie. Ondertussen hebben echter de
deeltjesfysici ons geleerd dat de Λ-term geı̈nterpreteerd dient te worden als de energiedichtheid van
het vacuüm: deze energiedichtheid is de som van een groot aantal op eerste zicht niet gecorreleerde
bijdragen, die elk op zich vele grootte-ordes groter zijn dan de (astronomisch bepaalde) observa-
tionele bovenlimiet van Λ. Het vinden van een verklaring van dit gigantische verschil tussen de
voorspelde en de waargenomen waarde van de energiedichtheid van het vacuüm is uitgegroeid tot
een van de grootste problemen van de hedendaagse fysica (misschien wel het grootste ...). Vandaag
lijkt het er sterk op dat de waarnemingen opnieuw suggereren dat er wel degelijk rekening moet
worden gehouden met een “effectieve” kosmologische constante in de veldvergelijkingen. Of deze al
dan niet te verklaren is op basis van (gekende) quantum-effecten of ook een bijdrage bevat van een
zgn. “bare Λ” is een open vraag. Om met deze laatste mogelijkheid rekening te houden zullen we
in de volgende paragrafen echter stelselmatig de veldvergelijkingen hanteren in de gedaante 8-1.1.

We aanvaarden verder dat in elk punt van het model een unieke vector u gedefinieerd is, zodat
u2 = ua ua = −1 (8-1.2)
die de ‘gemiddelde beweging’ van de materie voorstelt.
De integraalkrommen van het vectorveld u worden de wereldlijnen van de fundamentele waarne-
mers genoemd. Noemen we τ de eigentijd van deze waarnemers, dan geldt dus ui = dxi /dτ . De
beweging van individuele sterrenstelsels valt in goede benadering samen met de beweging van de
fundamentele waarnemers.
Fundamentele waarnemers beschikken in elk punt over een ogenblikkelijke rustruimte (de zgn.
surfaces of instantaneity), die het orthogonaal complement zijn in Tp (M) van u. De projectie op
deze ogenblikkelijke rustruimte wordt beschreven door de projectietensor
hab = gab + ua ub (8-1.3)
2 E.P. Hubble, Proc. Natl. Acad. Sci., 168 (1929)
8-1. STANDAARD MODEL 151

M.b.v. 8-1.3 kan de metriek dan geschreven worden als

ds2 = gij dxi dxj = −(ui dxi )2 + hij dxi dxj (8-1.4)
152 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

8-2 Symmetrie en geometrie


Ondanks de respectabele ouderdom van de astronomie, hebben we het heelal —naar kosmische
maatstaven— tot nu toe slechts in één punt P (‘nu’) waargenomen:

P DX y 2.104 sec

Dt y 100 à 3000 jaar

Dt y 9
15 à 20.10 jaar

Big Bang

Figuur 8.1: ons beeld van het heelal

Deze waarnemingen doen ons, na uitmiddeling op een gepaste schaal, besluiten dat het heelal
isotroop is t.o.v. dit punt P . In het bijzonder blijkt uit waarnemingen van de kosmische microgolf-
achtergrondstraling (COBE 1990) dat de relatieve anisotropie in de temperatuursverdeling van
deze straling kleiner is dan 10−5 .
Gaan we er van uit dat het punt P geen bevoorrechte plaats inneemt op zijn wereldlijn, dan
kunnen we bovenstaand resultaat extrapoleren en bekomen we dat het heelal isotroop is t.o.v. de
ganse wereldlijn van P . Deze redenering is een voorbeeld van toepassing van het Kosmologisch
Beginsel. We extrapoleren nu nogmaals door te veronderstellen dat P ’s wereldlijn al evenmin een
bevoorrechte wereldlijn is en besluiten dat het heelal dus isotroop is t.o.v. de wereldlijn van elke
fundamentele waarnemer.
Beschouwen we nu de covariante afgeleide van u, dan kunnen we hiermee de versnellingsvector u̇
= ∇u u definiëren. Aangezien u2 = −1 is u.u̇ = 0, zodat u̇ een ruimte-achtige vector is, die de
isotropie zal verbreken, tenzij
u̇ = 0 (8-2.1)
Schrijven we vervolgens ua;b als
ua;b =u(a;b) + u[a;b]
1 (8-2.2)
=σab + ωab + Θhab
3
met
1
σab =u(a;b) − Θhab (8-2.3)
3
ωab =u[a;b] (8-2.4)
Θ =ua ;a (8-2.5)

dan volgt uit u2 = −1 dat de tensoren σ en ω orthogonaal zijn met u: σab ub = ωab ub = 0 en dus in
een gepaste basis (met e0 = u) kunnen voorgesteld worden door 3 × 3 matrices σαβ (symmetrisch
8-2. SYMMETRIE EN GEOMETRIE 153

en spoorvrij) en ωαβ (anti-symmetrisch). Beide matrices zullen de isotropie verbreken, tenzij hun
eigenwaarden 0 zijn, t.t.z. σαβ = ωαβ = 0. Isotropie t.o.v. elke fundamentele waarnemer leidt dus
tot
Θ
ua;b = hab (8-2.6)
3
waarbij we Θ, bepaald door 8-2.5, de expansiescalar noemen. Bovendien volgt uit ωab = 0 dat u
hyperoppervlak-orthogonaal is, t.t.z. er bestaat een scalaire functie t zodat

ua = −t,a (8-2.7)

met dus i.h.b. t0̂ = t,a ua = 1.


De op een constante na bepaalde functie t noemen we de kosmische tijd : t.g.v. 8-2.7 meet t
de eigentijd langs de wereldlijnen van de fundamentele waarnemers. De hyperoppervlakken t =
constant zijn precies de hyperoppervlakken Σt die de ogenblikkelijke rustruimtes glad aan elkaar
sluiten: u.v = 0 als en slechts als v rakend is aan Σt . We noemen deze voortaan zonder meer de
rustruimtes.
Er zijn nog andere manieren om in deze kosmologische modellen ruimtelijke hyperoppervlakken
te construeren. We vermelden er twee:

1) Vertrekkend vanuit een punt P construeren we alle ruimte-achtige geodeten, die in P lood-
recht staan op uP . Deze hyperoppervlakken worden soms wel de ‘private rest spaces’ van de
fundamentele waarnemers genoemd:

Figuur 8.2: private rest space


154 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

2) Vertrekkend vanuit een punt P construreren we de verzameling van alle gebeurtenissen E die
‘gelijktijdig’ zijn met P . Gelijktijdigheid bepalen we door een lichtsignaal uit te zenden op
tA , het in E gereflecteerde signaal op te vangen op tB en aan E de ‘radar’-tijd 12 (tA + tB ) toe
te kennen: gelijktijdige gebeurtenissen zijn dan gebeurtenissen met dezelfde radar-tijd en de
resulterende hyperoppervlakken noemt men soms de ‘radar spaces’.

tB

p
E

tA

Figuur 8.3: radar rest space

Fig. 7.3

In een evoluerend heelal (Θ 6= 0) zullen noch de private spaces, noch de radar spaces samenvallen
met de rustruimtes t = constant!
Voeren we nu coördinaten in door x0 = t te stellen en x1 , x2 , x3 als labels te gebruiken voor
de fundamentele wereldlijnen, dan is xα (α = 1, 2, 3) constant langs elke wereldlijn, i.e. ẋα = 0.
We bekomen hiermee dat
ui = δ0i (8-2.8)
en dus (zie 8-1.4)
ds2 = hαβ dxα dxβ − dt2 (8-2.9)
Voor elke fysisch waarneembare grootheid Φ moet nu gelden dat Φ = Φ(t), zoniet zou de ruimtelijke
gradient van Φ opnieuw de isotropie van de rustruimtes verbreken. In het bijzonder geldt dan

Θ = Θ(t) (8-2.10)

Nu is echter 13 Θhαβ = uα;β = −ui Γiαβ = Γ0αβ = 1 ∂


2 ∂t hαβ , zodat

hαβ = S 2 (t)fαβ (xρ ) (8-2.11)


8-2. SYMMETRIE EN GEOMETRIE 155

met

Θ=3 (8-2.12)
S
De op een constante factor na bepaalde functie S noemen we de schaalfactor van het heelal:

d2

St 2

d1

St
1

Figuur 8.4: schaalfactor

Fig. 7.4
Zij d1 de afstand in Σt1 tussen twee fundamentele waarnemers, gemeten langs een kromme γ1
(t = t1 , xα = φα (λ)) en d2 de afstand in Σt2 tussen dezelfde twee waarnemers, gemeten langs
‘dezelfde’ kromme γ2 (t = t2 , xα = φα (λ)), dan is

d2 S(t2 )
= (8-2.13)
d1 S(t1 )
Men noemt 8-2.13 de wet van Hubble en de verhouding


H≡ (8-2.14)
S
(zie 8-2.12) de hubble-parameter.
Uit de isotropie van de hyperoppervlakken Σt kunnen we afleiden (zie hoofdstuk 1.12) dat de
rustruimtes een constante kromming hebben en dus ook homogeen zijn. Een andere manier om dit
in te zien is de volgende:
Voor een 3-dimensionale ruimte is de weyl-tensor 0, zodat uit 1.11.35 volgt dat
(3) (3)
R(3) αβγδ = 2hα[γ Rδ]β + 2hβ[δ Rγ]α − R(3) hα[γ hδ]β (8-2.15)

Vermits de ricci-tensor van de 3-ruimtes isotroop moet zijn,


(3) 1 (3)
Rαβ = R hαβ (8-2.16)
3
156 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

vinden we dat
R(3)
R(3) αβγδ = hα[γ hβ]δ (8-2.17)
3
wat inderdaad toont dat de hyperoppervlakken Σt een constante kromming hebben.
Stellen we nu k de kromming van de hyperoppervlakken met metriek fαβ dxα dxβ , dan is R(3) /6 =
K = k/S 2 de kromming van de hyperoppervlakken met metriek hαβ dxα dxβ = S 2 fαβ dxα dxβ . We
zullen hierbij, als k 6= 0, S steeds zó herschalen dat k = ±1.
Gebruik makend van de resultaten van hoofdstuk 1.12 bekomen we tenslotte de metriek

ds2 = −dt2 + S 2 (t)[dr2 + Σ2 (r, k)(dθ2 + sin2 θdφ2 )) (8-2.18)

wat ons, na transformatie van de r coördinaat de zgn. friedmann-robertson-walker-metriek oplevert

dr2
 
2 2 2 2 2 2 2
ds = −dt + S (t) + r (dθ + sin θdφ ) (8-2.19)
1 − kr2

Meestal herschrijft men de “FRW-metriek” in een genormalizeerde gedaante, gebruik makend van
a(t) = S(t)/S0 , waarbij een grootheid voorzien van een beneden-index 0 altijd betrekking heeft op
haar momenteel gemeten waarde. Zo bekomen we dus

dr2
 
2 2 2 2 2 2 2 2
ds = −dt + a (t)S0 + r (dθ + sin θdφ ) (8-2.20)
1 − kr2

Als k = 0, zijn de rustruimtes vlak en kan men euclidische coördinaten invoeren zodat

ds2 = −dt2 + a2 (t)S02 (dx2 + dy 2 + dz 2 ) (8-2.21)

Doorgaans kent men aan deze coördinaten het domein ] − ∞, ∞[ toe, zodat de rustruimtes een
oneindig volume hebben en dus ook de totale hoeveelheid materie in het heelal oneindig is (hetzelfde
geldt ook voor k = −1, wat aan de k = 0 en k = −1 modellen de naam open modellen verleent).
We kunnen de rustruimtes echter ook de topologie van een torus geven door de punten (x+ma, y +
nb, z + pc) met elkaar te identificeren (m, n, p ∈ Z). De rustruimtes worden dan compact en de
totale hoeveelheid materie in het heelal is eindig.
Als k = −1 hebben de rustruimtes een lobachevski-geometrie en, net zoals bij k = 0, wordt
de topologie doorgaans zo gekozen dat ze een oneindig volume hebben. Verschillende andere
topologieën kunnen echter gekozen worden, zodat ook hier een eindig volume tot de mogelijkheden
behoort3 .
Als k=+1 verschilt de situatie grondig van beide voorgaande gevallen: twee, uit een willekeurig
punt P , in tegengestelde zin vertrekkende geodeten zullen elkaar steeds ontmoeten in P ’s antipode
Q. De topologie is bijgevolg steeds compact, tenzij we het domein der coördinaten artificieel
inperken. Deze modellen worden dan ook gesloten modellen genoemd. Het totale volume van het
heelal is in dat geval4
Z 1
r2
2 × 4πS03 a3 √ dr = 2π 2 a3 S03
0 1 − r2
Ondanks deze problemen met de topologie van de rustruimtes, houden we ons verder aan de
ingeburgerde benamingen van open en gesloten modellen. De termen ‘oneindige’ respectievelijk
3 Lachièze-Rey en Luminet, gr/qc/9605010, Phys. Rept. 254,1995
4 bedenk dat r = sin χ met χ van 0 tot π
8-2. SYMMETRIE EN GEOMETRIE 157

‘eindige’ modellen (voor k = 0, −1 of voor k = +1) dienen echter beter vermeden te worden.
Merk tenslotte nog op dat 8-2.21 duidelijk conform vlak is:

ds2 = S02 a(τ )2 (−dτ 2 + dx2 + dy 2 + dz 2 ) (8-2.22)

met dt = S0 adτ . Deze eigenschap geldt echter ook als k = ±1 (alhoewel de gepaste coördinaat-
transformatie in deze gevallen niet op eerste zicht te herkennen is).

Metingen van de hubble-constante H0 gebeuren op basis van de roodverschuiving: een fun-


damentele waarnemer zal de frequentie van een lichtsignaal met propagatievector k meten als
ω = − < u, k > (zie 2-6.31). Omdat k een nulvector is, is de projectie van k op u echter gelijk in
grootte aan de projectie van k in de ogenblikkelijke rustruimte van de waarnemer. Noemen we ξ
een van de killingvectoren in deze ruimte, dan is dus
| < ξ, k > |
ω= (8-2.23)
||ξ||
Dk
Vermits de propagatievector verder nog voldoet aan de nulgeodetische vergelijking dλ = 0, is (zie
1-11) < k, ξ > echter een behouden grootheid langs elke nulgeodeet zodat

ω ∝ ||ξ||−1 ∝ S(t)−1 (8-2.24)

t.t.z.
λ ∝ S(t) (8-2.25)
Definiëren we de roodverschuiving z als in 6-2.8 opnieuw door
(r) (r) (e)
λ0 λ0 λ1
1+z = (e)
= (e) (e)
(8-2.26)
λ0 λ1 λ0
dan geldt dus
(e)
S0 λ 1
1+z = (8-2.27)
S1 λ(e)
0
Gaan we er van uit dat de fundamentele constanten van de fysica onveranderd blijven in de loop
van de kosmische tijd t (een hypothese waarover de discussie recent opnieuw is opgeflakkerd n.a.v.
(e) (e)
van waarnemingen van QSO-absorptielijnen) dan is λ1 = λ0 en dus
S0 1
1+z = = (8-2.28)
S1 a(t1 )
Voor kleine roodverschuivingen geldt in goede benadering
1
a(t) ≈ 1 + H0 (t − t0 ) − q0 H02 (t − t0 )2 + . . . (8-2.29)
2
met H0 de hubble-constante en q0 de zgn vertragingsparameter

q0 = −ä0 H0−2 (8-2.30)

zodat
1
z ≈ H0 (t0 − t1 ) + H02 (1 + q0 )(t0 − t1 )2 + . . . (8-2.31)
2
158 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

De lineaire betrekking
z ≈ H0 ∆t (8-2.32)
wordt de hubble-expansiewet genoemd en wordt meestal geı̈nterpreteerd als een dopplerverschui-
ving z ≈ v/c met v de recessiesnelheid van de lichtbron. Vermits c∆t in goede benadering de
“afstand” is van de bron, verklaart dit waarom H0 dikwijls gegeven wordt in eenheden van km s−1
Mpc−1 .
Iets preciezer wordt ∆t (de zgn. look back time) gegeven door de reeks 8-2.31 te inverteren:
1
t0 − t1 ≈ H0−1 (z − (1 + q0 )z 2 + . . . ) (8-2.33)
2
De coördinaatafstand r1 waar het lichtsignaal werd uitgezonden volgt dan uit
dr2
0 = −dt2 + S 2 (t)
1 − kr2
t.t.z.
1 1
r1 ≈ (z − (1 + q0 )z 2 ) (8-2.34)
H0 S 0 2
De coördinaatafstand r1 is echter geen fysisch observeerbare grootheid. Evenmin geldt dit voor de
eigenafstand dp gedefinieerd door

Z r1
dr  Arcsinr1 k = +1
dp = S0 √ = r1 k=0 (8-2.35)
0 1 − kr2 
Arcsinhr1 k = −1
Daarom wordt in de astronomie gebruik gemaakt van vier andere “afstanden” dpar , dpm , da en
dl , resp. de parallax distance, proper motion distance, angular diameter distance en luminosity
distance genoemd. Met b de afstand tussen twee (naburige) waarnemers in het zonnestelsel en
θ de gemeten parallactische hoek, met v⊥ de snelheid van de bron (loodrecht op de zichtlijn en
gemeten door een waarnemer in rust in r1 ) en µ de in r0 gemeten eigenbeweging, met D de (eigen)
doormeter van de lichtbron en δ de waargenomen schijnbare doormeter, en met L en ℓ de absolute
resp. schijnbare lichtkracht van de bron, gelden de volgende definities:
b
dpar =
θ
v⊥
dpm =
µ
D
da =
δ
L 1/2
dL =( ) (8-2.36)
4πℓ
Men kan aantonen dat deze afstanden in een FRW-model gegeven worden door (zie bv. Weinberg)
r1
dpar =S0 p
1 − kr12
dpm =S0 r1
da =S1 r1
S0
dL = S0 r1 (8-2.37)
S1
8-2. SYMMETRIE EN GEOMETRIE 159

Er geldt dus da = (1 + z)−2 dL en dpm = (1 + z)−1 dL . De factor S0 /S1 ∝ 1 + z resulteert in een


verkleining van de schijnbare lichtkracht met een factor (1 + z)−2 : dit is een gevolg van een (1 + z)
factor optredend in (1) het energieverlies van elk foton en (2) in de verhouding van de tijdseenheden
waarbinnen elk foton wordt uitgezonden resp. ontvangen. In principe kan enkel dpar rechtstreeks
informatie verschaffen over q0 en H0 : helaas is dit momenteel technisch onhaalbaar en wordt
dpar samen met dpm enkel gebruikt om de “eerste treden” van de kosmische “afstandsladder” te
calibreren. De hieruit bekomen informatie wordt vervolgens gebruikt om afschattingen te bekomen
van de absolute lichtkracht L van verschillende klassen van objecten. Uit 8-2.34 en 8-2.36 bekomen
we de relatie
1
dL ≈ H0−1 (z + (1 − q0 )z 2 ) (8-2.38)
2
waaruit tenslotte afschattingen van H0 en q0 bekomen worden. Verschillende soorten van waarne-
mingen (sterrenstelsels, radiobronnen en QSO’s) lijken momenteel te convergeren naar een waarde
voor H0 van ongeveer 70 ± 7 km s−1 Mpc−1 , i.e. H0−1 ≈ 14 109 jaar. Over q0 blijven de gegevens
eerder beperkt: nochtans lijkt er een consensus te ontstaan (vooral gebaseerd op de type Ia super-
nova waarnemingen) dat alleszins q0 < 0.
160 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

8-3 Energie-impuls tensor


In een orthonormale basis (e0 , eα ) met e0 = u, zijn de vectoren eα bepaald op rotaties in de
1 1
rustruimte na. Bijgevolg zijn T(0)(0) = 8π G(0)(0) en T(1)(1) = 8π G(1)(1) (G(1)(1) = G(2)(2) = G(3)(3) )
twee scalaire grootheden, die we respectievelijk de (fenomenologische) materiedichtheid ρ en druk
p noemen. In een willekeurige basis geldt dan

Tab = ρua ub + phab (8-3.1)

waarbij ρ en p constant zijn in elke rustruimte, zodat

ρ = ρ(t) en p = p(t) (8-3.2)

De FRW-metriek leidt dus tot de conclusie dat de materie-inhoud van het universum te beschrij-
ven is — althans op fenomenologische wijze — als een perfecte vloeistof. Deze vloeistof kan echter
bestaan uit verschillende fysische componenten, die zich elk afzonderlijk niet noodzakelijk als per-
fecte vloeistof moeten gedragen.
Om de veldvergelijkingen op te lossen moet nog een relatie tussen p en ρ gegeven worden
(de toestandsvergelijking). Een vaak voorkomende toestandsvergelijking voor een model met één
enkele vloeistofcomponent is de zgn. ‘γ-wet’

p = (γ − 1)ρ (8-3.3)

met γ een constante. Dit bevat o.a. het geval van ‘stof’ of druk-vrije materie:

p = 0 (γ = 1) (8-3.4)

en het geval van ‘zuivere straling’:


ρ 4
p= (γ = ) (8-3.5)
3 3
waarbij ρ gegeven wordt de stralingswet van Stefan-Boltzmann, ρ = σT 4 met T de stralingstem-
peratuur is.
Substitutie van 8-3.1 in T ab ;b = 0 leidt nu tot de enige behoudswet

ρ̇ + (ρ + p)3 =0 (8-3.6)
a
i.e. ρ̇ + (ρ + p)Θ = 0, wat met een toestandsvergelijking van de gedaante 8-3.4 resulteert in

ρ = ρ0 a−3γ (8-3.7)

Voor een stofmodel geeft dit i.h.b.


(m)
ρ(m) = ρ0 a−3 (8-3.8)
en voor een zuiver stralingsmodel
(r)
ρ(r) = ρ0 a−4 (8-3.9)
zodat
T = T0 a−1 (8-3.10)
(m) (r) 1 (r)
Voor een gemengd model met ρ = ρ +ρ en p = 3ρ leiden huidige schattingen tot

10−27 kg m−3 < ρ(m) < 10−26 kg m−3 (8-3.11)


8-3. ENERGIE-IMPULS TENSOR 161

terwijl de temperatuur van de microgolf-achtergrondstraling T0 ≈ 2.73o K en dus

ρ(r) ≈ 10−30 kg m−3 (8-3.12)

Als laatste voorbeeld bekijken we het geval van een scalair veld Φ met massa m en potentiaal
V (Φ), waarvoor
1
Tab = Φa Φb − gab (Φe Φe + 2V (Φ) + m2 Φ2 ) (8-3.13)
2
De behoudswetten resulteren dan in
∂V
Φ − m2 Φ ≡ Φ;a ;a − m2 Φ = − (8-3.14)
∂Φ
wat precies de veldvergelijking voor Φ is.

oefening: Bewijs dat in een FRW-model noodzakelijk geldt dat Φ = Φ(t).


Identificatie van 8-3.13 met 8-3.1 levert dan onmiddellijk

2ρΦ = Φ̇2 + m2 Φ2 + 2V (Φ) (8-3.15)

2pΦ = Φ̇2 − m2 Φ2 − 2V (Φ) (8-3.16)


terwijl de behoudswet 8-3.14 zich laat herschrijven als
∂V
a−3 (a3 Φ̇)˙ = m2 Φ − (8-3.17)
∂Φ
Voor m = V = 0 bekomen we hiermee de toestandsvergelijking van zgn. stiff matter : p = ρ.
162 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

8-4 Veldvergelijkingen
We bekijken nu
Gab + Λgab = 8πTab (8-4.1)
met
Tab = ρua ub + phab (8-4.2)
Noteer dat we desgewenst Λ in Tab kunnen absorberen door p en ρ te herdefiniëren:
1
p′ =p − Λ
8π (8-4.3)
1
ρ′ =ρ + Λ

Voor de componenten van de ricci-tensor t.o.v. een orthonormale basis (e0 , eα ) met e0 = u vinden
we

R00 = − 3 (8-4.4)
a
2
ä ȧ k
Rαα = + 2 2 + 2 2 (8-4.5)
a a a
en dus voor de ricci-scalar
ä ȧ2 k
R = 6( + 2 + 2 2 ) (8-4.6)
a a S0 a
De veldvergelijkingen reduceren zich hiermee tot twee differentiaalvergelijkingen voor a:

ȧ2 k
3 2
+ 3 2 2 = 8πρ + Λ (8-4.7)
a S0 a

ä ȧ2 k
−2 − 2 − 2 2 = 8πp − Λ (8-4.8)
a a S0 a
De eerste vergelijking wordt de friedmann-vergelijking genoemd. Eliminatie van de ruimtelijke
kromming uit 8-4.7 en 8-4.8 levert anderzijds de raychaudhuri-vergelijking:

3 + 4π(ρ + 3p) − Λ = 0 (8-4.9)
a
Deze vergelijkingen zijn niet onafhankelijk: de som van 8-4.7 en 8-4.8 geeft

ȧ2 k ȧ
(3 2
+ 3 2 2 ) ˙ = −24π(ρ + p) (8-4.10)
a S0 a a

waaruit blijkt dat, als p en ρ aan elkaar gekoppeld zijn door de behoudswet 8-3.6, dan 8-4.7 een
eerste integraal is van 8-4.8.
Merk op dat uit de raychaudhuri-vergelijking en uit de zgn. sterke energie voorwaarde (ρ + 3p
en ρ + p ≥ 0) volgt dat het heelal voor Λ ≤ 0 een singuliere oorsprong (a = 0) heeft, de oerknal of
big bang genoemd, terwijl de friedmann-vergelijking impliceert dat voor open modellen met ρ en
Λ ≥ 0 de expansie onbeperkt verder gaat.
8-4. VELDVERGELIJKINGEN 163

Om oplossingen van de veldvergelijkingen te bepalen, zoekt men gewoonlijk bij een gegeven
toestandsvergelijking eerst een oplossing ρ = ρ(a), p = p(a) van de behoudswet, en lost hiermee de
friedmann-vergelijking op (dit is niet altijd mogelijk: b.v. voor een scalair veld leveren 8-3.17 en
de friedmann-vergelijking een gekoppeld stelsel eerste-orde differentiaalvergelijkingen in Φ en a).
We illustreren deze methode in de volgende paragraaf.
164 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

8-5 Oplossingen
8-5.1 Einstein’s statisch model
Uit 8-4.7 en 8-4.8 volgt met ȧ = 0 dat ρ en p constanten zijn waarvoor geldt dat
k
8π(ρ + p) = 2 .
S02 a2

Uit de zgn. zwakke energievoorwaarde (ρ ≥ 0 en ρ + p ≥ 0) volgt dan noodzakelijk dat k = +1.


Uit 8-4.8 blijkt dan bovendien dat de druk p enkel ≥ 0 kan zijn, als we het bestaan onderstellen
van een positieve kosmologische constante (het was precies om zulk model mogelijk te maken dat
Einstein de kosmologische constante aan de oorspronkelijke veldvergelijkingen had toegevoegd).

8-5.2 Niet-statische modellen


Het is nuttig van de vergelijkingen verder te vereenvoudigen door de introductie van de zgn.
kritische dichtheid
3H 2
ρcrit = (8-5.1)

Dit is (zie 8-4.7) de totale energiedichtheid (gewone materie + Λ term) van een k = 0 heelal. Voor
elke mogelijke bijdrage tot de energiedichtheid, ρ(i) = ρ(m) , ρ(r) , ... , Λ/8π, kunnen we vervolgens
een dimensieloze parameter Ω(i) definiëren door

ρ(i)
Ω(i) = (8-5.2)
ρcrit
P (i)
Noteren we de totale energiedichtheid parameter als Ω = Ω dan volgt uit de friedmann-
vergelijking 8-4.7 onmiddellijk een verband tussen de geometrie en de totale energiedichtheid:
k
= Ω0 − 1 (8-5.3)
H02 S02

Uit het gedrag van de individuele energiedichtheden (8-3.7) volgt voor de dichtheidsparameters
(i)
Ω0 H02 −3γi
Ω(i) = a (8-5.4)
H2
en dus
Ω(i)
∼ a−3(γi −γj ) (8-5.5)
Ω(j)
Men definieert soms ook een effectieve krommings-energiedichtheid ρ(k) = −3k/(8πS02 a2 ), waarmee
de friedmann-vergelijking zich laat herschrijven als
8π X (i) X (i)
H2 = ρ = H02 Ω0 a−3γi (8-5.6)
3
i,k i,k

waarbij de som nu loopt over alle bijdragen, inclusief de Λ-term en de kromming, met

(k) k
Ω0 = − (8-5.7)
S02 H02
8-5. OPLOSSINGEN 165

en waarbij H0 de huidige waarde van de hubble-parameter voorstelt: H0 = (ȧ/a)0 . Deze schrijf-


wijze heeft als voordeel dat ze duidelijk maakt op welke manier de verschillende componenten van
het model bijdragen tot de expansie:

3 γi

stof 3
straling 4
Λ 0
kromming 2

Dit toont b.v. dat de bijdrage van de fotonen, voornamelijk via de kosmische achtergrondstral-
ing, in de uitdrukking 8-5.6 momenteel weliswaar verwaarloosbaar is, aangezien 8-3.12 impliceert
dat Ω(r) ≈ 5 10−5 , maar dat de fotonen in de vroegste fasen van het heelal de dynamica duidelijk
zullen domineren.
Een andere parameter die in principe observeerbaar is, is de vertragingsparameter


q0 = −H0−2 ( ) (8-5.8)
a 0
Uit de raychaudhuri-vergelijking volgt dan voor een mengsel van stof, straling en Λ-term dat

1 (m) (r) (Λ)


q0 = (Ω + 2Ω0 ) − Ω0 (8-5.9)
2 0
Een positieve kosmologische constante zorgt dus duidelijk voor een versnelling van de expansie.
De combinatie van verschillende soorten waarnemingen leidt momenteel tot een schatting van
(Λ) (m) (m)
Ω0 ≈ 0.7 en van Ω0 ≈ 0.3. Bovendien blijkt slechts een fractie (1/3 ?) van Ω0 te bestaan uit
standaard gekende materievormen.
Samen met de friedmannvergelijking 8-5.6, evenals 8-3.11 en 8-3.12, t.t.z. 0.04 < Ω(m) < 1
en Ω(r) ≈ 5 10−5 , toont dit hoe we —in principe althans— uit waarnemingen van q0 en H0 de
waarden kunnen bepalen van Λ en van de ruimtelijke kromming k/S02 .

8-5.3 Modellen met Λ = 0


8-5.6 toont onmiddellijk dat de gesloten modellen expanderen tot een maximale straal bereikt
wordt en vervolgens terug samentrekken, terwijl de open modellen onbeperkt expanderen.
Voor een mengsel van stof en straling wordt 8-5.6 gegeven door
!
(m) (r)
Ω0 Ω k
ȧ2 = H02 + 02 − 2 2 (8-5.10)
a a S 0 H0

en zijn de oplossingen het eenvoudigst te bekomen door de introductie van een zgn. conforme tijd
1 2 2 (m 2 2 (r) 1/2
τ = dt
R
S . We vinden dan met α = 2 S0 H0 Ω0 en β = (S0 H0 Ω0 )
voor k = +1:

a =α(1 − cos τ ) + β sin τ


(8-5.11)
t =S0 [α(τ − sin τ ) + β(1 − cos τ )]
166 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

voor k = 0:
α
a = τ 2 + βτ
2
(8-5.12)
α β
t =S0 [ τ 3 + τ 2 ]
6 2

en voor k = −1:

a =α(coshτ − 1) + βsinhτ
(8-5.13)
t =S0 [α(sinhτ − τ ) + β(coshτ − 1)]

5
k = –1
4

k=0
3
a

2
k = +1

0 1 2 3 4 5 6
t

Figuur 8.5: evolutie van de Λ = 0 modellen met stof en straling

Belangrijke bijzondere gevallen zijn (waarbij we telkens één integratieconstante elimineren


d.m.v. een tijdstranslatie)

a) ρ(r) = 0, k = 0, q0 = 21 :
a ∝ t2/3 (8-5.14)

Dit is het zgn. einstein-de sitter-model, dat een goede benadering is voor de ‘late’ evolutie van
het heelal,wanneer de effekten van de straling verwaarloosbaar klein zijn. De ouderdom bedraagt
t0 = 23 H0−1 .
8-5. OPLOSSINGEN 167

b) ρ(m) = 0, k = 0, q0 = 1:
a ∝ t1/2 (8-5.15)

Dit model geeft een goede benadering voor de ‘vroege’ evolutie van het heelal, wanneer de materie-
inhoud gedomineerd wordt door relativistische deeltjes en straling. De ouderdom bedraagt t0 =
1 −1
2 H0 .

c) ρ(m) = ρ(r) = 0, k = −1, q0 = 0:


a∝t (8-5.16)

Dit is het zgn. milne-model, met ouderdom t0 = H0−1 : dit is niets anders dan de minkowski-ruimte
in bijzondere coördinaten! Dit heelal beschrijft het asymptotisch gedrag van alle open modellen
waarin de materie-dichtheid sneller afneemt dan S −2 (zoals het geval is in de hoger vermelde
stof-straling mengsels).

8-5.4 Modellen met Λ 6= 0


Exacte oplossingen kunnen nu enkel gegeven worden voor een aantal bijzondere toestandsvergelij-
kingen. Zo kunnen b.v. alle modellen met ρ(r) = 0 opgelost worden met elliptische functies. Over
het algemeen leren we echter met deze analytische uitdrukkingen weinig of niets bij. Een quali-
tatieve discussie aan de hand van het ȧ = ȧ(a) gedrag is doorgaans instructiever. We onderscheiden
volgende gevallen:

i) Λ < 0
Een negatieve kosmologische constante kan via de friedmann-vergelijking geı̈nterpreteerd wor-
den als een extra aantrekkende kracht (zie ook 8-4.3) die de expansie van het heelal tegenwerkt. De
Λ-term zal uiteindelijk in de friedmann-vergelijking domineren en zorgen voor een samentrekking
van het heelal.

ii) Λ > 0
Een positieve kosmologische constante impliceert een extra repulsieve kracht die de expansie
van het model versterkt. Het uiteindelijke resultaat hangt echter af van de ruimtelijke kromming:

a) Voor k ≤ 0 wordt ȧ nooit 0 en gaat de expansie onbeperkt verder. Al deze modellen


hebben bovendien, voor ‘normale’ materie, een singulariteit
q in het verleden. Een belangrijke
Λ
uitzondering is het de sitter-heelal met a ∝ exp( 3 t) en ρ(m) = ρ(r) = 0, dat model staat
voor het zgn. steady state universe.

b) Voor k = +1 bestaat een rijk gevarieerde verzameling van oplossingen:


168 HOOFDSTUK 8. INLEIDING TOT DE KOSMOLOGIE

1) Einstein’s statisch heelal (a = ac ) is één van deze mogelijkheden, met ac een constante,
afhankelijk van de gekozen toestandsvergelijking en van Λ.
2) Voor a < ac (> ac ) is ä < 0 (> 0). Er bestaan bijgevolg modellen die in het
verleden ‘asymptotisch’ vertrekken zoals het einstein-heelal, om vervolgens onbeperkt te
expanderen ofwel samen te trekken tot een singulariteit.
Een andere mogelijkheid wordt geboden door modellen die, vertrekkend van a = ∞ in
het verleden:
• samentrekken tot een singulariteit in de toekomst
• asymptotisch samentrekken tot a = ac
• samentrekken tot am > ac om vervolgens onbeperkt te expanderen
Tenslotte zijn er de modellen die, vertrekkend van een singulariteit in het verleden:
• opnieuw samentrekken tot een singulariteit in de toekomst
• asymptotisch tot a = ac expanderen
• onbeperkt expanderen
In dit laatste geval wordt de expansiesnelheid vertraagd nabij a = ac en ontstaat
de mogelijkheid om het heelal gedurende lange tijd te laten ‘sudderen’ nabij ac . Dit
zijn de zgn. eddington-lemaı̂tre-modellen, waarvoor recent opnieuw belangstelling
bestaat, i.v.m. de extra mogelijkheden die dan geboden worden voor de vorming van
sterrenstelsels.

You might also like