You are on page 1of 446

Dirk W.

Hoffmann

Grenzen
der Mathematik
Eine Reise durch die Kerngebiete
der mathematischen Logik
3. Auflage
Grenzen der Mathematik
Dirk W. Hoffmann

Grenzen der
Mathematik
Eine Reise durch die Kerngebiete
der mathematischen Logik

3. Auflage
Dirk W. Hoffmann
Fakultät für Informatik und
Wirtschaftsinformatik
Hochschule Karlsruhe – Technik
und Wirtschaft
Karlsruhe, Deutschland

ISBN 978-3-662-56616-9 ISBN 978-3-662-56617-6 (eBook)


https://doi.org/10.1007/978-3-662-56617-6

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen National-


bibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

Springer Spektrum
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2011, 2013, 2018
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die
nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung
des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen,
Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem
Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen
im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und
daher von jedermann benutzt werden dürften.
Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informa-
tionen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder
der Verlag noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit,
Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im
Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und
Institutionsadressen neutral.

Verantwortlich im Verlag: Andreas Rüdinger

Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier

Springer Spektrum ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und
ist ein Teil von Springer Nature
Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
Vorwort

Das Unmögliche zu erkennen, ist eine intellektuelle Leistung, die den Menschen einzigartig macht. In der Physik
haben uns die Einstein’sche Relativitätstheorie oder die Heisenberg’sche Unschärferelation Grenzen aufgezeigt,
die wir niemals überwinden werden. Die Aussagen sind negativ, und gerade deshalb verbreiten sie eine unwider-
stehliche Faszination. Es ist das Unmögliche, das uns noch stärker zu fesseln vermag als das Mögliche.

Auch die Mathematik ist von ähnlichen Negativresultaten betroffen. Die mathematische Logik des zwanzigsten
Jahrhunderts hat fundamentale Erkenntnisse hervorgebracht, die uns die Grenzen dieser präzisen Wissenschaft in
aller Klarheit vor Augen führen. So wissen wir heute, dass sich der Begriff der Wahrheit selbst für so scheinbar
einfache Theorien wie die Zahlentheorie nicht in Einklang mit dem Begriff der Beweisbarkeit bringen lässt. Es ist
unmöglich, die Mathematik in einem formalen System einzufangen, in dem alle wahren Aussagen beweisbar und
alle falschen Aussagen unbeweisbar sind.

Dieses Buch entführt Sie auf eine Reise durch die Kerngebiete der mathematischen Logik. Es ist mein erklärtes
Ziel, die Konzepte, Methoden und Ergebnisse dieser Disziplin in verständlicher Form offenzulegen, ohne einen
Verlust an Tiefe zu erleiden. Wo immer es möglich ist, habe ich versucht, die Definitionen und Sätze mit Beispie-
len zu motivieren und durch zahlreiche Querbezüge in ihren sachlichen und historischen Kontext einzuordnen.
Beweise von Sätzen, die nur am Rand eine Rolle spielen, sind bewusst nur skizzenhaft aufgenommen, oder es
wird darauf hingewiesen, wo ein Beweis nachgeschlagen werden kann. In diesem Sinn kann das vorliegende
Buch die formal präzise Literatur aus dem Bereich der mathematischen Logik nicht an jeder Stelle ersetzen – und
will es auch gar nicht. Allem Anderen voran möchte ich die Faszination transportieren, die dieses Teilgebiet der
Mathematik unzweifelhaft ausstrahlt. Sie, liebe Leser, müssen beurteilen, inwieweit mir dies gelungen ist.

Vorwort zur dritten Auflage

Inzwischen sind die Grenzen der Mathematik in der dritten Auflage erschienen. Genau wie zur ersten Auflage
habe ich auch zur zweiten Auflage zahlreiche Zuschriften erhalten, über die ich mich sehr gefreut habe. Na-
mentlich erwähnen möchte ich Henning Dieterichs, Dr. Bernd Grave, Dr. Olaf von Grudzinski, Dr. Wolfgang
Heinrich, Tankred Hirschmann, Patrick Holzer, Thomas Klimpel, Joachim Lillig und Prof. Dr. Ronald Ortner, die
mir mit zahlreichen Hinweisen geholfen haben, Fehler im Manuskript der zweiten Auflage zu beseitigen. Eine
inhaltliche Änderung hat in dieser Auflage das Kapitel Modelltheorie erfahren. Ich habe es um eine skizzenhafte
Beschreibung der Forcing-Technik ergänzt, die im Jahr 1963 von Paul Cohen entdeckt wurde und heute zu den
Standardinstrumenten für das Führen von Unabhängigkeitsbeweisen gehört.

Karlsruhe, im Januar 2018 Dirk W. Hoffmann


Symbolwegweiser

Definition
Satz, Lemma, Korollar
 Leichte Übungsaufgabe
 Mittelschwere Übungsaufgabe
 Schwere Übungsaufgabe

Lösungen zu den Übungsaufgaben

In wenigen Schritten erhalten Sie die Lösungen zu den Übungsaufgaben:


1. Gehen Sie auf die Webseite www.dirkwhoffmann.de/GM

2. Geben Sie den neben der Aufgabe abgedruckten Webcode ein.

3. Die Musterlösung wird als PDF-Dokument angezeigt.

Alternativ können Sie ein PDF-Dokument abrufen, das alle Musterlösun-


gen gesammelt enthält.
Inhaltsverzeichnis

1 Historische Notizen 1
1.1 Wahrheit und Beweisbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Der Weg zur modernen Mathematik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 Rätsel des Kontinuums . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2 Auf den Spuren der Unendlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.3 Macht der Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.4 Aufbruch in ein neues Jahrhundert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.2.5 Grundlagenkrise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.2.6 Axiomatische Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.2.7 Hilberts Programm und Gödels Beitrag . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.2.8 Grenzen der Berechenbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
1.2.9 Auferstanden aus Ruinen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
1.3 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2 Formale Systeme 71
2.1 Definition und Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.2 Entscheidungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.3 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.3.1 Syntax und Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.3.2 Aussagenlogischer Kalkül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
2.4 Prädikatenlogik erster Stufe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
2.4.1 Syntax und Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
2.4.2 Prädikatenlogischer Kalkül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
2.5 Prädikatenlogik mit Gleichheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
2.6 Prädikatenlogik höherer Stufe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
2.6.1 Syntax und Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
2.6.2 Henkin-Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
2.7 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

3 Fundamente der Mathematik 135


3.1 Peano-Arithmetik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
3.1.1 Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
3.1.2 Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
3.1.3 Axiome und Schlussregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
VIII Inhaltsverzeichnis

3.2 Axiomatische Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149


3.2.1 Zermelo-Fraenkel-Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
3.2.1.1 ZF-Axiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
3.2.1.2 Das Auswahlaxiom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
3.2.1.3 Mengenlehre als Fundament der Mathematik . . . . . . . . . . . . . . . . . . . 166
3.2.1.4 Einbettung der natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 174
3.2.2 Ordinalzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
3.2.2.1 Definition und Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
3.2.2.2 Der Unendlichkeit entgegen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
3.2.2.3 Ordnungstypen und Wohlordnungen . . . . . . . . . . . . . . . . . . . . . . . 188
3.2.2.4 Transfinite Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
3.2.3 Kardinalzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
3.3 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

4 Beweistheorie 201
4.1 Gödel’sche Unvollständigkeitssätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
4.2 Der erste Unvollständigkeitssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
4.2.1 Arithmetisierung der Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
4.2.2 Primitiv-rekursive Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
4.2.3 Arithmetische Repräsentierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
4.2.4 Gödels Diagonalargument . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
4.2.5 Rossers Beitrag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
4.2.6 Das Diagonalisierungslemma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
4.2.7 Das Wahrheitsprädikat von Tarski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
4.2.8 Das Berry-Paradoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
4.3 Der zweite Unvollständigkeitssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
4.3.1 Hilbert-Bernays-Löb-Kriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
4.3.2 Der Satz von Löb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
4.4 Gödels Sätze richtig verstehen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
4.5 Der Satz von Goodstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
4.6 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267

5 Berechenbarkeitstheorie 271
5.1 Berechnungsmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
5.1.1 Turing-Maschinen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
5.1.1.1 Erweiterungen des Basismodells . . . . . . . . . . . . . . . . . . . . . . . . . 276
5.1.1.2 Alternative Beschreibungsformen . . . . . . . . . . . . . . . . . . . . . . . . . 278
5.1.1.3 Universelle Turing-Maschine . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
5.1.2 Registermaschinen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
5.2 Die Church’sche These . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
5.3 Grenzen der Berechenbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
5.3.1 Das Halteproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
Inhaltsverzeichnis IX

5.3.2 Der Satz von Rice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299


5.4 Folgen für die Mathematik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
5.4.1 Unentscheidbarkeit der PL1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
5.4.2 Unvollständigkeit der Arithmetik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
5.4.3 Hilberts zehntes Problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
5.4.3.1 Diophantische Repräsentierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . 320
5.4.3.2 Codierung von Registermaschinen . . . . . . . . . . . . . . . . . . . . . . . . 322
5.5 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333

6 Algorithmische Informationstheorie 341


6.1 Algorithmische Komplexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
6.2 Die Chaitin’sche Konstante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
6.3 Unvollständigkeit formaler Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
6.4 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363

7 Modelltheorie 367
7.1 Meta-Resultate zur Prädikatenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368
7.1.1 Modellexistenzsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
7.1.2 Kompaktheitssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
7.1.3 Satz von Löwenheim-Skolem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377
7.2 Nichtstandardmodelle von PA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380
7.2.1 Abzählbare Nichtstandardmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381
7.2.2 Überabzählbare Nichtstandardmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
7.3 Das Skolem-Paradoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
7.4 Boolesche Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
7.4.1 Boolesche Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
7.4.2 Boolesche Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
7.4.3 Boolesche Semantik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
7.5 Forcing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
7.6 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415

Literaturverzeichnis 421

Bildnachweis 429

Namensverzeichnis 431

Sachwortverzeichnis 435
1 Historische Notizen

„Mathematics takes us still further from what is human,


into the region of absolute necessity, to which not only
the world, but every possible world, must conform.“
Bertrand Russell [169]

„Im Sinne des zureichenden Grundes


1.1 Wahrheit und Beweisbarkeit finden wir, dass keine Tatsache als wahr
oder existierend und keine Aussage als
Wenige Dinge fesseln den Wissenschaftler so sehr wie die Rätsel der wahr betrachtet werden kann, ohne dass
Natur. Von der Neugier getrieben, sind wir fortwährend auf der Suche ein zureichender Grund vorhanden wäre,
warum es so ist und nicht anders“ [116]
nach Regeln und Strukturen in einer Welt, die mehr Fragen aufwirft
als Antworten zulässt. Und trotzdem: Fassen wir die Entwicklungen
der letzten Jahrhunderte zusammen, so blicken wir auf eine beachtliche
Erfolgsbilanz zurück. Immer wieder ist es Wissenschaftlern gelungen,
komplexe Sachverhalte auf einfachere, weniger komplexe Zusammen-
hänge zu reduzieren und auf diese Weise einer adäquaten Erklärung zu-
zuführen. Damit hat die Wissenschaft nicht nur unser tägliches Leben
massiv verändert, sondern gleichsam die Grundlage geschaffen, auf der
wir unser neuzeitliches Weltbild haben errichten können.

Dass die Natur elementaren Regeln folgt, wurde bis zu Beginn des
zwanzigsten Jahrhunderts von niemandem ernsthaft in Zweifel gezo-
gen. Schließlich entspricht es sowohl unserer Intuition als auch unse-
rer Erfahrung, dass jeder Wirkung eine Ursache vorausgeht und nichts
in der Welt ohne Grund geschieht. Dieses Prinzip des zureichenden
Grunds (lat. principium rationis sufficientis oder franz. principe de la Gottfried Wilhelm Leibniz
raison suffisante) ist die unausgesprochene Grundannahme aller Na- (1646 – 1716)
turwissenschaften. Ohne sie wäre die wissenschaftliche Methode ein
Abbildung 1.1: Gottfried Wilhelm Leib-
stumpfes Schwert. niz gehört zu den berühmtesten und außer-
gewöhnlichsten Gelehrten des ausgehenden
Das Prinzip des zureichenden Grunds findet seine Personifizierung in
17. und beginnenden 18. Jahrhunderts. Sei-
Gottfried Wilhelm Leibniz, dem wahrscheinlich letzten Universalge-
ne universelle Begabung war einzigartig.
lehrten der Welt (Abbildung 1.1). In Form eines metatheoretischen Zahllose Publikationen und Schriftwechsel
Grundsatzes ist das Prinzip eine tragende Säule in der Leibniz’schen aus den Bereichen der Philosophie, der Ma-
Philosophie. Nach ihr ist die Welt, in der wir leben, die perfektest mög- thematik, den Naturwissenschaften sowie
liche, eine Welt der vollständigen Harmonie, in der nicht nur jeder ein- der Geschichts- und Rechtskunde bilden
zelne physikalische Vorgang eine Ursache, sondern auch jede metaphy- einen beispiellosen Nachlass.

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6_1
2 1 Historische Notizen

sische Wahrheit eine Begründung besitzt. Demnach sind Aussagen nie-


mals grundlos wahr und lassen sich stets durch andere Aussagen recht-
fertigen, deren Wahrheit bereits bewiesen wurde.

Mit seinem visionären Denken war Leibniz seiner Zeit weit voraus. Er
träumte von einer Characteristica universalis, einer universellen Spra-
che, in der sich alle Facetten der menschlichen Erkenntnis in präziser
Form erfassen lassen. Seine Sprache war nicht als Lautsprache konzi-
piert. Stattdessen hatte er eine symbolische Notation im Sinn, in der ein-
zelne Alphabetzeichen Objekte oder Konzepte der realen Welt repräsen-
tieren und die Beziehungen, die zwischen den Objekten oder Konzepten
Characteristica universalis
bestehen, auf der symbolischen Ebene sichtbar werden. Aufgrund der
formalen Natur seiner Sprache war Leibniz überzeugt, dass der Wahr-
heitsgehalt von Aussagen durch die Anwendung eines festen Regel-
werks, des Calculus ratiocinator, auf systematische Weise berechnet
werden kann (Abbildung 1.2).
Leibniz wusste um das Ausmaß seines ehrgeizigen Projekts und un-
ternahm zu keiner Zeit den Versuch, sein großes Ziel allein zu errei-
Calculus ratiocinator
chen. Nichtsdestotrotz hielt er konkrete Pläne für dessen Umsetzung
bereit. In einem ersten Schritt galt es eine Enzyklopädie zu erstellen,
die das gesamte bis dato verfügbare Menschheitswissen in sich vereint.
Im zweiten Schritt war eine formale Sprache zu definieren, mächtig ge-
nug, um alle Konzepte und Beziehungen der erarbeiteten Wissensbasis
Falsch Wahr zu beschreiben. Im letzten Schritt galt es, die logischen Schlussregeln
auf die symbolische Ebene zu übertragen. Hierdurch wäre der formale
Abbildung 1.2: Sein Leben lang war Leib-
Schlussapparat geschaffen, mit dem sich wahre Aussagen auf mecha-
niz von der Idee gefesselt, eine Universal-
sprache (Characteristica universalis) zu er- nische Weise erzeugen und verifizieren ließen. Leibniz war der festen
sinnen, in der sich die Objekte, Konzepte Überzeugung, das Projekt mit einer Gruppe ausgewählter Wissenschaft-
und Beziehungen der realen Welt symbo- ler in rund fünf Jahren verwirklichen zu können. Zu Lebzeiten wurde
lisch erfassen lassen. Er war davon über- ihm die Chance nie geboten, und so verblieb die Characteristica univer-
zeugt, dass für diese Kunstsprache ein Re- salis im Reich der Träume. Als vielleicht größter Visionär seiner Zeit
gelwerk (Calculus ratiocinator) erschaffen starb Gottfried Wilhelm Leibniz am 14. November 1716 im Alter von
werden könne, mit dem sich der Wahrheits- 70 Jahren – und mit ihm sein ehrgeiziges Projekt.
gehalt einer Aussage im Sinne einer me-
chanischen Prozedur systematisch berech- Es sollte noch mehr als 200 Jahre dauern, bis sein Traum zumindest teil-
nen lässt. weise in Erfüllung ging. Im neunzehnten Jahrhundert führten die Fort-
schritte im Bereich der symbolischen Logik zu der Entwicklung for-
maler Systeme, die einer Characteristica universalis im Leibniz’schen
Sinne in vielerlei Hinsicht nahe kommen. Heute sind wir mit der Aus-
sagenlogik und der Prädikatenlogik im Besitz künstlicher Sprachen, mit
denen wir mathematische Aussagen in symbolischer Form codieren und
durch die Anwendung fest definierter Schlussregeln logische Folgerun-
gen ableiten können. Beide Logiken sind Gegenstand von Kapitel 2. In
Kapitel 3 werden wir auf der Prädikatenlogik die axiomatische Men-
1.1 Wahrheit und Beweisbarkeit 3

genlehre errichten. Diese wird sich als stark genug erweisen, um alle
Gebiete der klassischen Mathematik zu beschreiben, und dient heute
als formaler Unterbau für die gesamte moderne Mathematik.

Mit der fortschreitenden Formalisierung der Mathematik rückten Frage-


stellungen in den Vordergrund, die sich nicht mit Theoremen befassten,
die innerhalb eines formalen Systems abgeleitet werden konnten, son-
dern mit den Eigenschaften und Limitierungen der Systeme selbst. Zur
Blüte reifte dieser Forschungszweig, den wir heute als Metamathematik
bezeichnen, Anfang des zwanzigsten Jahrhunderts. Die seither gewon-
nenen Erkenntnisse sind gewaltig und zugleich verstörend.

Bis in das zwanzigste Jahrhundert hinein zweifelte kaum ein Mathema-


tiker ernsthaft daran, dass für jede mathematische Aussage ein Beweis
oder ein Gegenbeweis gefunden werden kann, wenn nur lange genug
danach gesucht wird. Dass Wahrheit und Beweisbarkeit in einem har-
monischen Einklang stehen, war das ungeschriebene Dogma der Ma-
thematik. Heute wissen wir, dass sich der Begriff der Wahrheit und der
Begriff der Beweisbarkeit selbst für einfache Theorien wie die Zahlen-
theorie nicht in Kongruenz bringen lassen. Es ist unmöglich, die Ma-
thematik in einem formalen System einzufangen, in dem alle wahren
mathematischen Aussagen als solche bewiesen werden können.

Die Erkenntnisse des zwanzigsten Jahrhundert haben unser mathemati-


sches Weltbild von Grund auf verändert. Indem sie fundamentale Gren-
zen aufzeigen, die wir niemals werden überwinden können, haben sie in
der Mathematik eine ganz ähnliche Bedeutung wie die Relativitätstheo-
rie in der Physik. Heute wissen wir, dass ein Calculus ratiocinator nicht
existieren kann. Die Leibniz’sche Vision einer mechanisierbaren Ma-
thematik, so verlockend sie auch sein mag, ist ein Traum, der niemals
Realität werden wird.

Die Überlegungen, die zu diesem Ergebnis führen, sind der Inhalt dieses
Buchs, und wir werden sie in den nächsten Kapiteln im Detail heraus-
arbeiten. Soviel vorweg: Sie werden von so grundlegender Natur sein,
dass es kein Entrinnen gibt; die Mathematik entzieht sich jedem forma-
len Korsett.

An zwei Beispielen wollen wir demonstrieren, welche Auswirkungen


sich für die gewöhnliche Mathematik ergeben.

Vermutung 1.1 (Goldbach)

Jede gerade natürliche Zahl n > 2 lässt sich als Summe zweier
Primzahlen schreiben.
4 1 Historische Notizen

y
Goldbach'sche Vermutung

12000

10000

Abbildung 1.3: Nach der Goldbach’schen


Vermutung lassen sich alle geraden Zah- 8000
len n > 2 als Summe zweier Primzahlen
schreiben. In dem nebenstehenden Dia-
6000
gramm sind die geraden natürlichen Zah-
len auf der x-Achse und die Anzahl der
möglichen Goldbach-Zerlegungen auf der 4000
y-Achse aufgetragen. Die Goldbach’sche
Vermutung ist genau dann wahr, wenn
die x-Achse frei von Datenpunkten bleibt. 2000
Auch wenn vieles für die Wahrheit der
Vermutung spricht, steht ein formaler Be- Gerade natürliche Zahlen > 2
0
weis bis heute aus. 100000 200000 300000 400000 500000 600000 700000 800000 x

Die Goldbach’sche Vermutung gehört zu den ältesten und bedeutsam-


sten Problemen der Zahlentheorie (Abbildung 1.3). Benannt ist sie nach
dem deutschen Mathematiker Christian Goldbach, der im Jahr 1742 in
einem Brief an den Schweizer Mathematiker Leonhard Euler die These
aufstellte, dass sich jede natürliche Zahl größer 2 als die Summe dreier
Primzahlen1 schreiben lässt (Abbildung 1.4). Die hier formulierte Vari-
ante wird auch als starke Goldbach’sche Vermutung bezeichnet, da sich
aus ihr die Gültigkeit der ursprünglich formulierten Variante ergibt.

Das zweite Beispiel stammt ebenfalls aus dem Gebiet der Zahlentheorie
und ist nicht weniger prominent:

Vermutung 1.2 (Primzahlzwillinge)

Es existieren unendlich viele Zahlen n mit der Eigenschaft, dass n


und n + 2 Primzahlen sind.

Tabelle 1.1 gibt eine Übersicht über die ersten 35 Primzahlzwillinge.

Jede der beiden hier aufgeführten Vermutungen macht eine Aussage


über die natürlichen Zahlen und ist entweder wahr oder falsch. Trotz-
1 In Goldbachs Definition ist die 1 ebenfalls eine Primzahl. Sonst wäre seine These

bereits für den Fall n = 4 widerlegt.


1.1 Wahrheit und Beweisbarkeit 5

Aus dem Brief von Christian Goldbach an Leonhard Euler

Leonhard Euler (1707 – 1783)

Abbildung 1.4: Im Jahr 1742 äußerte Christian Goldbach seine berühmte Vermutung in einem Brief an Leonhard Euler.

dem waren alle bisher getätigten Anstrengungen vergebens, sie zu be-


weisen oder zu widerlegen. Ob wir die Vermutungen mit den Mitteln
der Zahlentheorie überhaupt beweisen oder widerlegen können, wissen Primzahlzwillinge
wir nicht. Die Vehemenz, mit der sich beide einer Lösung bisher entzo-
(3, 5) (5, 7)
gen haben, mag den Verdacht der Unbeweisbarkeit nähren, Gewissheit
(11, 13) (17, 19)
liefert sie freilich nicht.
(29, 31) (41, 43)
Auch eine andere berühmte Vermutung der Zahlentheorie widersetzte (59, 61) (71, 73)
sich über dreihundert Jahre lang allen Versuchen, sie zu beweisen. Im
(101, 103) (107, 109)
Jahr 1637 stellte der französische Mathematiker Pierre de Fermat die
(137, 139) (149, 151)
Behauptung auf, dass die Gleichung
(179, 181) (191, 193)
an + bn = cn (197, 199) (227, 229)
(239, 241) (269, 271)
für n > 2 keine Lösungen in den positiven ganzen Zahlen besitzt (Ab- (281, 283) (311, 313)
bildung 1.5). Erst im Jahr 1995 konnte der Brite Andrew Wiles einen (347, 349) (419, 421)
lückenlosen Beweis für die Taniyama-Shimura-Vermutung vorbringen, (431, 433) (461, 463)
aus der sich der Fermat’sche Satz als Korollar ergibt [178, 216]. Ob
(521, 523) (569, 571)
für die Goldbach’sche Vermutung oder die Vermutung über die Exis-
(599, 601) (617, 619)
tenz unendlich vieler Primzahlzwillinge doch noch ein Beweis gefun-
den werden wird, steht in den Sternen. Auch wenn sich die Anzeichen (641, 643) (659, 661)
mehren [209, 211], herrscht bis heute Unsicherheit. (809, 811) (821, 823)
(827, 829) (857, 859)
Das Wissen über die Unvollständigkeit formaler Systeme ist die viel- (881, 883)
leicht größte Errungenschaft der mathematischen Logik des zwanzigs-
ten Jahrhunderts und zweifelsfrei eine der verblüffendsten mathema- Tabelle 1.1: Die Primzahlzwillinge im Zah-
tischen Erkenntnisse überhaupt. In Kapitel 4 werden wir uns ausführ- lenbereich zwischen 0 und 1000
6 1 Historische Notizen

Abbildung 1.5: Pierre de Fermat schrieb „Cubum autem in duos cu-


sein berühmtes lateinisches Zitat im Jahr
bos, aut quadratoquadratum
1637 an den Rand seiner Ausgabe der
in duos quadratoquadratos,
Arithmetica (siehe Abschnitt 1.2.1). Über-
setzt lautet es wie folgt: „Es ist unmög- et generaliter nullam in infi-
lich, einen Kubus in zwei Kuben zu zerle- nitum ultra quadratum pote-
gen oder ein Biquadrat in zwei Biquadrate statem in duos eiusdem no-
oder allgemein irgendeine Potenz größer minis fas est dividere. Cuius
als die zweite in Potenzen gleichen Gra- rei demonstrationem mirabi-
des. Ich habe hierfür einen wahrhaft wun- lem sane detexi. Hanc margi-
derbaren Beweis gefunden, doch ist der nis exiguitas non caperet.“
Rand hier zu schmal, um ihn zu fassen.“
Über 300 Jahre suchten Mathematiker er-
folglos nach Fermats „wunderbarem Be-
weis“, und es gilt heute als sicher, dass Pierre de Fermat
kein kurzer Beweis für seine Vermutung (1607 – 1665)
existiert.

lich mit dieser Thematik auseinandersetzen und die Schlüsselergebnisse


sorgfältig herleiten.

In Kapitel 5 werden wir noch einen Schritt weiter gehen und den Be-
griff der Beweisbarkeit um einen weiteren ergänzen. Die Rede ist von
der Berechenbarkeit, einem Schlüsselbegriff, der für uns in zweierlei
Hinsicht von Bedeutung ist. Zum einen wird er uns einen alternativen
Weg aufzeigen, der uns einen schnelleren und eleganteren Zugang zu
den Grenzen der Beweisbarkeit gewähren wird als jener, den wir in Ka-
pitel 4 beschreiten. Zum anderen spielt er eine zentrale Rolle in der
Informatik, wo sich die Grenzen der Berechenbarkeit ganz praktisch
auswirken. Heute wissen wir, dass es unmöglich ist, einen Algorithmus
zu formulieren, der für jedes vorgelegte Programm immer korrekt ent-
scheidet, ob es eine gewisse funktionale Eigenschaft erfüllt oder nicht.
Selbst so einfache Probleme wie die Frage nach der Existenz von End-
losschleifen liegen außerhalb des Berechenbaren. Genau dies ist der
Grund, warum selbst die modernsten Compiler heute nicht viel mehr
als eine syntaktische Prüfung der Quelltexte durchführen und nur we-
nige funktionale Fehler selbstständig erkennen. Auch hier sind wir mit
einer ebenso grundlegenden wie unvermeidlichen Beschränkung kon-
frontiert, die wir nicht überwinden können.
1.2 Der Weg zur modernen Mathematik 7

1.2 Der Weg zur modernen Mathematik

Bevor wir uns voll und ganz den technischen Details der umrissenen
Ideen widmen, wollen wir einen Rückblick auf die bewegte Geschichte
der mathematischen Logik wagen. Nur so ist es möglich, die Ergebnis-
se adäquat einzuordnen und in ihrer gesamten Tragweite zu verstehen.
Verlieren wir also keine Zeit!

1.2.1 Rätsel des Kontinuums

Wir beginnen unseren Streifzug durch die Geschichte der Mathema-


tik im Griechenland des dritten Jahrhunderts. Dort entstand jenes drei-
zehnbändige Werk, das die Grundlagen der modernen Algebra schaffen
sollte. Die Rede ist von der Arithmetica, einer Sammlung von über hun-
dert algebraischen Rätseln und ihren Lösungen (Abbildung 1.6). Nur
die Bände 1 bis 3 und 8 bis 10 sind heute noch im Original vorhanden.
Für die Bände 4 bis 7 wurden arabische Übersetzung gefunden, die rest-
lichen drei sind bis heute verschollen. Verfasst wurde die Arithmetica
von Diophantos von Alexandria, von dessen Leben wir heute keine ver-
lässliche Kenntnis haben. Lediglich ein Rätselvers aus der Zeit nach
seinem Tod gibt uns zaghafte Hinweise über den Verlauf seines Lebens.
In einer deutschen Übersetzung lautet er wie folgt [79]:

„Wanderer, unter diesem Stein ruht Diophantos. Oh,


großes Wunder, die Wissenschaft zeigt Dir die Dauer sei-
nes Lebens. Gott gewährte ihm die Gunst, den sechsten Teil
seines Lebens jung zu sein. Ein Zwölftel dazu, und er ließ
bei ihm einen schwarzen Bart sprießen. Ein Siebtel später
war der Tag seiner Hochzeit, und im fünften Jahr ging aus
dieser Verbindung ein Sohn hervor. Ach, bedauernswerter
Jüngling: Er bekam die Kälte des Todes zu spüren, als er
nur halb so alt war, wie sein Vater schließlich wurde. Vier
Jahre danach fand dieser dann Trost für seinen Schmerz,
und mit dieser Weisheit schied er aus dem Leben. Wie lan- Abbildung 1.6: Die Arithmetica ist ein
ge währte es?“ dreizehnbändiges Werk, in dem Diophantos
von Alexandria mehr als hundert algebrai-
sche Rätsel samt ihren Lösungen zusam-
Bezeichnen wir das erreichte Alter des Diophantos mit x, so lässt sich mentrug. Die allgemeine Lösbarkeit dio-
phantischer Gleichungen ist Bestandteil des
der Rätselvers in die folgende Gleichung übertragen:
zehnten Hilbert’schen Problems, auf das
x x x x wir in Abschnitt 5.4.3 im Detail zu sprechen
x= + + +5+ +4 kommen.
6 12 7 2
8 1 Historische Notizen

Die Multiplikation mit 84 eliminiert sämtliche Brüche:


x
84x = 14x + 7x + 12x + 420 + 42x + 336
10 =
Damit können wir Diophantos’ Alter als die Lösung der Gleichung
y
370  9x − 756 = 0 (1.1)

bestimmen und erhalten das Ergebnis x = 84. Ob Diophantos wirklich


84 Jahre alt wurde und den Schmerz verkraften musste, seinen eige-
nen Sohn sterben zu sehen? Wir werden es wahrscheinlich niemals mit
x + y = 10
Sicherheit wissen.
x3 + y3 = 370
Gleichung (1.1) ist ein einfaches Beispiel dessen, was wir heute als dio-
Abbildung 1.7: Im vierten Band der Arith-
phantische Gleichung bezeichnen. Im allgemeinen Fall hat eine solche
metica stellte Diophantos die Aufgabe, die Gleichung die Form
Seitenlängen x, y zweier Würfel so zu be- p(x1 , x2 , . . . , xn ) = 0, (1.2)
stimmen, dass die Summe der Seitenlängen wobei p ist ein multivariables Polynom mit ganzzahligen Koeffizien-
gleich 10 und die Summe der Würfelvolu- ten ist. Die Lösung einer diophantischen Gleichung ist die Menge der
mina gleich 370 ist.
ganzzahligen Nullstellen von p.

Wenn wir im Folgenden von diophantischen Gleichungen sprechen,


werden wir, wo immer es sinnvoll erscheint, den Symbolvorrat gering-
fügig anpassen und z. B. x für x1 und y für x2 schreiben. Die Gleichung

x1 3 + x2 3 + x1 + x2 − 380 = 0

liest sich dann beispielsweise so:

x3 + y3 + x + y − 380 = 0 (1.3)

Gleichung (1.3) hat eine geometrische Bedeutung und löst ein Problem
aus dem vierten Buch der Arithmetica. Wie in Abbildung 1.7 darge-
stellt, lassen sich x und y als die Seitenlängen zweier Würfel interpre-
tieren, deren gemeinsames Volumen gleich 370 ist und die Summe ihrer
Seitenlängen den Wert 10 ergibt. Mit x = 7, y = 3 und x = 3, y = 7 hat
die Gleichung genau zwei Lösungen in den natürlichen Zahlen.

Unendlich viele Lösungen besitzt z. B. die nachstehende diophantische


Gleichung:
x2 + y2 − z2 = 0 (1.4)
Sie beschreibt das im zweiten Buch der Arithmetica beschriebene Pro-
blem, ein Quadrat so in zwei Quadrate aufzuteilen, dass sich der Flä-
cheninhalt nicht ändert. Die Lösungen dieser Gleichung sind die soge-
nannten pythagoreischen Tripel. Nach dem Satz des Pythagoras umfas-
sen sie alle Dreiergruppen natürlicher Zahlen (x, y, z), die als Seitenlän-
gen rechtwinkliger Dreiecke vorkommen (Abbildung 1.8).
1.2 Der Weg zur modernen Mathematik 9

Gleichung (1.4) können wir auf nahe liegende Weise verallgemeinern I Pythagoreische Tripel
und erhalten mit x
x n + yn − zn = 0 (1.5)
jene legendäre Gleichung, die Pierre de Fermat zu seiner berühmten
Vermutung veranlasste. Heute wissen wir, dass sie für n > 2 keine Lö-
sungen in den positiven ganzen Zahlen besitzt.

Beachten Sie, dass (1.5) keine gewöhnliche diophantische Gleichung y


ist, da die Variable n als Exponent auftaucht. Sie fällt in die größere
Gruppe der exponentiellen diophantischen Gleichungen, die uns in Ab-
schnitt 5.4.3 erneut begegnen wird. Dort werden wir uns ausführlich
mit der Frage beschäftigen, ob sich die Lösbarkeit diophantischer Glei-
chungen durch ein systematisches Verfahren bestimmen lässt. Soviel z
vorweg: Wir werden eine verblüffende Antwort erhalten.

Dass wir den Begriff der diophantischen Gleichungen heute ausschließ- Berechnen lassen sich pythagoreische
lich dann verwenden, wenn wir Lösungen in den ganzen Zahlen suchen, Tripel über die Formeln
wird seinem Namensgeber nur teilweise gerecht. Diophantos stellte den
Leser der Arithmetica unter anderem vor das Problem, die pythagore- x = m(u2 − v2 )
ische Gleichung (1.4) für den Fall z2 = 16 zu lösen. Unter dieser Vor- y = m(2uv)
aussetzung hat die Gleichung keine Lösung in den ganzen Zahlen und z = m(u2 + v2 )
mit 12 16
5 und 5 genau eine Lösung in der Menge der rationalen Zahlen.
Hierin sind m, u, v positive natürliche
Genau wie die natürlichen Zahlen, die das Abzählen von Dingen er- Zahlen mit u > v.
möglichen, haben auch die rationalen Zahlen einen ganz praktischen
Hintergrund: Sie entstehen immer dann, wenn zwei geometrische Län- I Beispiele
gen p und q zueinander in Bezug gesetzt werden, und sind in diesem (m, u, v) (x, y, z)
Sinne die algebraischen Grundbausteine der Geometrie. 1 2 1 3 4 5
Wir wollen an dieser Stelle nicht vorschnell über die Tatsache hinweg- 1 3 1 8 6 10
gehen, dass die Bruchschreibweise nur eine von mehreren Darstellungs- 1 3 2 5 12 13
möglichkeiten ist. Beispielsweise können wir jede rationale Zahl qp auch 1 4 1 15 8 17
in Form eines periodischen Dezimalbruchs schreiben: 1 4 2 12 16 20
1 4 3 7 24 25
1
8 = 0,125 = 0,1250
2 2 1 6 8 10
1
3 = 0,3333 . . . = 0, 3 2 3 1 16 12 20
1
1 = 1, 0 = 0, 9 2 3 2 10 24 26
Umgekehrt lässt sich jeder periodische Dezimalbruch systematisch in 2 4 1 30 16 34
die Bruchdarstellung überführen. Um z. B. die Zahl 2 4 2 24 32 40
2 4 3 14 48 50
x = 0,0238095 (1.6) ...
p
in der Form darzustellen, wenden wir einen einfachen Trick an. Zu-
q Abbildung 1.8: Pythagoreische Tripel
nächst multiplizieren wir beide Seiten mit 1 000 000:
1 000 000x = 23809,5238095
10 1 Historische Notizen

1 2 3 Subtrahieren wir (1.6) von dieser Gleichung, so verschwindet der peri-


4 4 4 odische Anteil:
999 999x = 23809,5

2 3 4 Damit erhalten wir für x die folgende Darstellung:


8 8 8
23809,5 238095 1
x= = =
999 999 9 999 990 42
6 7 8
16 16 16 Anders als die natürlichen Zahlen liegen die rationalen Zahlen dicht auf
der Zahlengeraden. Das bedeutet, dass wir jeden Punkt beliebig genau
durch eine Folge rationaler Zahlen annähern können. Dass die Appro-
12 13 14 ximation immer möglich ist, verdanken wir der Eigenschaft, dass für
32 32 32 zwei beliebige Zahlen x, y ∈ Q auch das arithmetische Mittel x+y2 eine
rationale Zahl ist (Abbildung 1.9).
Abbildung 1.9: Da für zwei Zahlen x, y ∈ Dennoch weist die Menge der rationalen Zahlen Lücken auf. So war
Q auch das arithmetische Mittel x+y2 eine bereits den Pythagoreern bekannt, dass die Länge der Diagonalen eines
rationale Zahl ist, können wir jeden Punkt Quadrats mit der Seitenlänge 1 nicht durch eine rationale Zahl ausge-
mit einer beliebigen Genauigkeit annähern. drückt werden kann (Abbildung 1.10). Was hat es mit dieser mysteri-
ösen Diagonallänge auf sich? Von ihr wissen wir zunächst nur, dass √
sie
mit sich selbst multipliziert das Ergebnis
√ 2 liefert und deshalb als 2
geschrieben werden darf. Der Wert von 2 lässt sich mit

2 ≈ 1,41421356237309504880168872420969807856
1

ziemlich genau beziffern und kann durch die Angabe weiterer Nach-
kommastellen beliebig angenähert werden. Trotzdem wird es uns nie-
mals gelingen, den
√ Wert exakt niederzuschreiben. Schuld daran ist die
1 Eigenschaft von 2, keine Bruchdarstellung zu besitzen. Ihre Dezimal-
bruchdarstellung ist nichtperiodisch und setzt sich aus unendlich vielen,
unregelmäßig auftretenden Nachkommaziffern zusammen.

Indem wir die Lücken zwischen den rationalen Zahlen schließen, errei-
2 chen wir die Menge der reellen Zahlen R, den wichtigsten Zahlenraum
der gewöhnlichen Mathematik. Aufgrund ihrer Eigenschaft, den Zah-
lenstrahl lückenlos zu überdecken, wird die Menge der reellen Zahlen
als das Kontinuum bezeichnet.

Betrachten wir die Zahl 2 genauer, so tritt eine weitere wichtige Ei-
Abbildung 1.10: Die rationalen Zahlen
können den Zahlenstrahl nicht lückenlos
genschaft zum Vorschein. Sie ist eine reellwertige Lösung der algebrai-
überdecken. Beispielsweise lässt sich die schen Gleichung
Länge der Diagonalen eines Quadrats mit x2 − 2 = 0
der Seitenlänge 1 nicht durch eine rationale
Zahl ausdrücken.
1.2 Der Weg zur modernen Mathematik 11

Dies führt uns direkt zum Begriff der algebraischen Zahl. Eine komple-
xe Zahl x heißt algebraisch, wenn sie eine Gleichung der Form

an xn + an−1 xn−1 + . . . + a1 x + a0 = 0 (1.7)

löst, wobei die Koeffizienten ai allesamt aus der Menge der ganzen Zah-
len stammen.
p
Offensichtlich ist jede rationale Zahl q auch algebraisch, da sie die Lö-
sung der folgenden Gleichung ist:

q·x− p = 0

Mit 2 haben wir zudem eine irrationale Zahl kennen gelernt, die eben-
falls algebraisch ist. Dies wirft eine interessante Frage auf: Ist jede reel-
le Zahl auch algebraisch? Sollte es tatsächlich Zahlen geben, die keine
Lösung einer algebraischen Gleichung sind, so wären sie nicht einfach
zu erfassen, da wir diese Zahlen weder als Dezimalbruch hinschreiben
noch indirekt als Nullstelle eines algebraischen Terms charakterisieren ∞
können. L= ∑ 10−k!
k=1
Einer der Ersten, die fest an die Existenz solcher transzendenten Zahlen 1! 3! 5!
glaubten, war Leonhard Euler. Konkret hegte er die Vermutung, dass die   

= 0,1100010 ... 010 ... 010 ...
Zahl a für alle rationalen Zahlen a = 1 und alle natürlichen Zahlen b,
b
 
die keine Quadratzahlen sind, außerhalb der Menge der algebraischen 2! 4!
Zahlen liegen müsse. Dennoch sollte es ihm zu Lebzeiten nicht gelin-
gen, einen Beweis für seine Vermutung zu finden.
Erst 1844 sollte Eulers Vermutung zur Gewissheit werden. In diesem
Jahr gelang es dem französischen Mathematiker Joseph Liouville als
erstem, die Existenz transzendenter Zahlen zweifelsfrei zu belegen [21].
Liouville führte den Beweis konstruktiv und konnte eine konkrete Zahl
angeben, die sich der Beschreibung durch eine algebraischen Gleichung
entzieht (Abbildung 1.11). Es ist die berühmte Zahl

L := ∑ 10−k! ,
k=1

die nach ihrem Entdecker heute als Liouville’sche Zahl bezeichnet wird.
Ab dem Jahr 1844 war die Transzendenz nicht mehr länger eine pure
Möglichkeit; sie war zur mathematischen Realität geworden. Joseph Liouville
Liouvilles faszinierende Entdeckung blieb kein Einzelfall. 1873 bewies (1809 – 1882)
der französische Mathematiker Charles Hermite die Transzendenz der Abbildung 1.11: Im Jahr 1844 bewies der
berühmten eulerschen Konstante e, der Basis des natürlichen Logarith- französische Mathematiker Joseph Liou-
mus. Im Jahr 1882 machte der deutsche Mathematiker Ferdinand von ville die Existenz transzendenter Zahlen.
12 1 Historische Notizen

Abbildung 1.12: Die reellen Zahlen las-


sen sich in rationale Zahlen und irrationa-
Ra
le Zahlen einteilen. Jede rationale Zahl ist tio
Z a h nale 0, 1, 2, . . . che
auch algebraisch, aber √ nicht umgekehrt. len
e b rais
n
So lässt sich die Zahl 2 als Lösung einer Alg Zahle
2, 3, 5,...
1 2 4
algebraischen Gleichung darstellen, aber
nicht als Bruch. Seit dem Jahr 1844 wis- Irra
ti √ √ (1+√5)
sen wir, dass Zahlen existieren, die kei- Z a h onale 2, 5, 2 , . . . n te
ne Lösung einer algebraischen Gleichung len nde
a n sze len
sind. Sie bilden zusammen die Menge der Tr Zah
transzendenten Zahlen, der unter anderem e, π, . . .
die eulersche Konstante e und die Kreis-
zahl π angehören.

Lindemann eine weitere wichtige Entdeckung. Es gelang ihm zu be-


weisen, dass die Gleichung

β1 eα1 + . . . + βn eαn = 0,

in der α1 , . . . , αn und β1 , . . . , βn algebraische Zahlen sind, nur die trivia-


le Lösung β1 = . . . = βn = 0 besitzt, falls alle αi paarweise verschie-
den sind. Dies ist die Aussage des berühmten Satzes von Lindemann-
Weierstraß. Mit diesem Satz und der bekannten Beziehung eiπ = −1
ließ sich zeigen, dass auch die Kreiszahl π transzendent sein muss. Da-
mit waren mit der eulerschen Konstante e und der Kreiszahl π gleich
zwei der wichtigsten Konstanten der Mathematik als transzendent iden-
tifiziert (Abbildung 1.12).

Lindemann hatte mit seinem Ergebnis zugleich eine der berühmtesten


Fragen der Geometrie beantwortet. Die Rede ist von der Quadratur des
d = 
Kreises, also der Aufgabe, zu einem gegebenen Kreis ein Quadrat mit
dem gleichen Flächeninhalt zu konstruieren (Abbildung 1.13). Da sich
r=1 jede mit Lineal und Zirkel konstruierbare Länge als Lösung einer alge-
braischen Gleichung formulieren lässt, folgt aus der Transzendenz von
π die Unlösbarkeit des Quadraturproblems [199]. Heute ist die „Qua-
dratur des Kreises“ eine beliebte Metapher für ein unlösbares Problem.
Schnell warf die Erkenntnis über die Existenz transzendenter Zahlen die
Abbildung 1.13: Unter der Quadratur des Frage auf, wie viele dieser schwer greifbaren Zahlen tatsächlich existie-
Kreises wird die Aufgabe verstanden, zu ei- ren. Ist die Transzendenz eine seltene Eigenschaft ausgewählter Zahlen
nem gegebenen Kreis ein Quadrat mit dem
oder sollte sie gar das Kontinuum durchziehen, lautlos und für lange
gleichen Flächeninhalt zu konstruieren. Aus
Zeit unbemerkt wie die hypothetische dunkle Materie unser Univer-
der Transzendenz der Kreiszahl
√ π lässt sich
die Transzendenz von π ableiten, und dar- sum? Es ist das Wissen über die Unendlichkeit, das uns eine erstaun-
aus folgt, dass eine Konstruktion mit Zirkel liche Antwort auf diese Frage liefern wird. Wir kommen gleich darauf
und Lineal nicht möglich ist. zurück.
1.2 Der Weg zur modernen Mathematik 13

1.2.2 Auf den Spuren der Unendlichkeit

Die moderne Mathematik hat ihre Wurzeln im neunzehnten Jahrhun-


dert, einem Jahrhundert des schier grenzenlosen Fortschritts, das nicht
nur auf gesellschaftliche und politische Fragen neue Antworten ge-
ben konnte, sondern auch Wirtschaft und Wissenschaft revolutionieren
sollte. Neue Erkenntnisse sorgten für eine Aufbruchstimmung in allen
Bereichen der Ingenieurs- und Naturwissenschaften. Mendels Geset-
ze der Vererbung und Darwins Entdeckungen zur Entstehung der Ar-
ten ließen die Natur in einem neuen Licht erscheinen. Die Offenlegung
des Periodensystems der Elemente legte den Grundstein der modernen
Chemie. In der Physik revolutionierten die Maxwell’schen Gesetze das
physikalische Weltbild, und mit der Entwicklung des ersten Impfstoffs
durch Louis Pasteur nahm der Mensch todbringenden Krankheiten ih-
ren Schrecken. Zur Jahrhundertwende wähnte sich die Wissenschafts-
gemeinde an der Grenze der Allwissenheit, und für viele war es nur
eine Frage der Zeit, bis auch das letzte Rätsel dieser Welt gelüftet sein
würde. Allumfassende Theorien schienen in greifbarer Nähe.

Auch die Mathematik stand im neunzehnten Jahrhundert ganz im Zei-


chen des Fortschritts. Die Infinitesimalrechnung wurde durch Cauchy
und Weierstraß auf ein solides Fundament gestellt, und auch in anderen
Bereichen wurden das unendlich Große und das unendlich Kleine von
ihrer mystischen Aura befreit. Riemann und Gauß gaben der Geometrie
durch den rigorosen Einsatz analytischer Methoden ein neues Gesicht,
Dedekind und Kronecker lieferten wichtige Beiträge zur Zahlentheo-
rie. Es war ein Jahrhundert der Spezialisierung, in dem das Interesse an
erkenntnistheoretischen Fragen allmählich zu verblassen begann.

Allen Fortschritten zum Trotz hatte die präziseste aller Wissenschaften


eines nicht erreicht: die Schaffung einer einheitlichen Grundlage, auf
der sich die Mathematik als Ganzes errichten lässt. Dass wir mit der
Mengenlehre eine solche Grundlage heute unser eigen nennen, ist keine
Selbstverständlichkeit, und wie so oft war es der Zufall, der die große
Wende herbeiführen sollte.

Es ist ein Kuriosum der Geschichte, dass ausgerechnet eine Frage der
Analysis den Anstoß zur Begründung der Mengenlehre gab. Auslöser
war die 1822 geäußerte Vermutung des französischen Mathematikers
Jean Baptiste Fourier, dass sich jede beliebige Funktion in Form einer
trigonometrischen Reihe darstellen lässt.2 Für stetige Funktionen war
Fouriers Vermutung weitgehend bewiesen, und immer mehr Mathema-
2 Heute wissen wir, dass Fouriers Vermutung in ihrer ursprünglichen Form falsch ist.

An ihrem wegbereitenden Charakter ändert dies jedoch nichts.


14 1 Historische Notizen

rz 6 Jan Der deutsche Mathematiker Georg Cantor schreckte nie davor zurück, neue Wege zu beschrei-
3 M
1845 1918
Cantor wurde am 3. März 1845 ten. Dennoch sollte das hohe Maß an Unverständnis, Miss-
in Sankt Petersburg geboren. Sein trauen und Feindseligkeit, das ihm auf seinem einsamen
Studium absolvierte er von 1862 Weg entgegenschlug, tiefe Furchen in seiner Psyche hinter-
bis 1867 in Zürich, Göttingen und Berlin, wo er berühm- lassen.
te Größen wie Karl Weierstraß, Ernst Eduard Kummer oder Es ist ein tragischer Aspekt in seinem Leben, dass vor allem
Leopold Kronecker zu seinen Lehrern zählen durfte. 1867 sein Lehrer Leopold Kronecker gegen ihn rebellierte und ihn
wurde ihm von der Universität Berlin die Doktorwürde ver- mit blinder Wut zu bekämpfen versuchte. Kronecker, der in
liehen. Danach wechselte er nach Halle, wo er zuerst als Pri- ihm einen „Verderber der Jugend“ sah, nutzte seinen Ein-
vatdozent, danach als Extraordinarius und schließlich als or- fluss geschickt aus, um einen Wechsel Cantors an die ehr-
dentlicher Professor lehrte und forschte. würdige Universität Berlin zu verhindern [219]. Halle sollte
Cantor gehört zu den bedeutendsten Mathematikern des spä- für Cantor die erste und zugleich letzte Station seiner wis-
ten neunzehnten und frühen zwanzigsten Jahrhunderts. Er senschaftlichen Laufbahn sein.
gilt als der Begründer der Mengenlehre und legte mit dem Im Alter von 39 Jahren erkrankte Cantor an manischer De-
Begriff der Kardinalität den Grundstein für den Umgang pression – ein Leiden, das ihn bis zu seinem Lebensende be-
mit der Unendlichkeit. Der Begriff der Abzählbarkeit geht gleiten sollte. Kurz nach seinem siebzigsten Geburtstag wur-
genauso auf Cantor zurück wie die Diagonalisierungsme- de er nach einem erneuten Krankheitsausbruch in die Uni-
thode, auf die wir gleich an mehreren Stellen dieses Buchs versitätsklinik Halle eingewiesen. Dort starb Georg Cantor
zurückgreifen werden. am 6. Januar 1918 im Alter von 72 Jahren.

tiker gingen dazu über, die Ergebnisse auf den unstetigen Fall zu über-
tragen. Der deutsche Mathematiker Georg Cantor war einer davon (Ab-
bildung 1.14). Cantor verfolgte den Plan, die Annahme der Stetigkeit
schrittweise abzuschwächen, um sie schließlich ganz zu eliminieren.
Seine Arbeit sollte schon bald Früchte tragen. In einem ersten Schritt
gelang es ihm zu zeigen, dass Fouriers Vermutung auf Funktionen zu-
trifft, die endlich viele Unstetigkeitsstellen besitzen. Von seinem An-
fangserfolg beflügelt, ging er daran, seine Ergebnisse auf Funktionen
mit unendlich vielen Unstetigkeitsstellen zu übertragen. Cantor gelang
dies nicht uneingeschränkt, sondern nur dann, wenn die Verteilung der
Unstetigkeitsstellen bestimmten Eigenschaften genügte. Indem er die
Unstetigkeitsstellen in Mengen (Mannigfaltigkeiten) zusammenfasste,
konnte er zeigen, dass sich die Verteilungseigenschaften auf struktu-
relle Eigenschaften der konstruierten Mengen übertragen ließen. Noch
wurden Cantors Mannigfaltigkeiten von vielen Mathematikern als be-
fremdliche Obskuritäten empfunden, die so gar nicht zu den bis dato
üblichen Begriffen passten. Bis sich die Mengenlehre als akzeptierte
Georg Cantor Grundlage der gesamten Mathematik etablieren konnte, war es noch
(1845 – 1918)
ein langer Weg.
Abbildung 1.14: Georg Cantor war der Be-
gründer der modernen Mengenlehre. Mit Das Instrumentarium, das Cantor für seine Untersuchungen geschaf-
zahlreichen Beiträgen zur Untersuchung fen hatte, war von so allgemeiner Natur, dass er sowohl endliche als
des Unendlichen führte er die Mathematik auch unendliche Mengen in der gleichen Weise untersuchen konnte.
in die Moderne. Der Schlüssel für den Umgang mit dem Unendlichen liegt in der Be-
1.2 Der Weg zur modernen Mathematik 15

trachtung der Mächtigkeit (Kardinalität) einer Menge M. Sie wird mit I Bijektive Abbildung von N+ nach N
|M| bezeichnet und entspricht für endliche Mengen schlicht der Anzahl
ihrer Elemente. Zum Beispiel gelten die folgenden Beziehungen: 1 2 3 4 5 6 7 ...

M1 = 0/ ⇒ |M1 | = 0
M2 = {, ♦, ◦} ⇒ |M2 | = 3
M3 = {2, 3, 5} ⇒ |M3 | = 3
0 1 2 3 4 5 6 7 ...
Die Mengen M2 und M3 sind gleichmächtig, da sie die gleiche Anzahl
an Elementen enthalten. In diesem und nur in diesem Fall sind wir in
der Lage, die Elemente beider Mengen eindeutig einander zuzuordnen. I Bijektive Abbildung von 2N nach N
Für unser Beispiel könnte die Zuordnung folgendermaßen aussehen:
0 2 4 6 ...
 → 2, ♦ → 3, ◦ → 5

Stimmt die Anzahl der Elemente nicht überein, so kann eine derartige
Zuordnung nicht gelingen.

Damit sind wir in der Lage, den Begriff der Mächtigkeit an die Existenz 0 1 2 3 4 5 6 7 ...
einer entsprechenden Abbildung zu knüpfen:
I Bijektive Abbildung von Z nach N

Definition 1.1 (Mächtigkeit)


−1 −2 −3 −4 ...
Mit M1 und M2 seien zwei beliebige Mengen gegeben. M1 und M2
heißen gleichmächtig, geschrieben als 0 1 2 3 4 5 6 7 ...

|M1 | = |M2 |
0 1 2 3 ...
wenn eine bijektive Abbildung f : M1 → M2 existiert. Wir schreiben
Abbildung 1.15: Die Existenz einer bijek-
|M1 | ≤ |M2 | tiven Abbildung zwischen den natürlichen,
den positiven, den geraden und den ganzen
wenn eine injektive Abbildung f : M1 → M2 existiert. Zahlen beweist die Gleichmächtigkeit die-
ser Mengen.

Zwei unendliche Mengen sind per Definition genau dann gleichmäch-


tig, wenn sich ihre Elemente jeweils umkehrbar eindeutig einander zu-
ordnen lassen. Auf den ersten Blick erscheint die Herangehensweise als
unnatürlich und unnötig umständlich. Auf den zweiten Blick wird deut-
lich, dass die Definition darauf verzichtet, die Elemente einer Menge
explizit zu zählen. Damit sind wir in der Lage, auch dann die Kardinali-
tät zweier Mengen zu vergleichen, wenn diese unendlich viele Elemente
enthalten.
Hieraus ergeben sich überraschende Konsequenzen. Als Erstes betrach-
ten wir die Menge N der natürlichen Zahlen und die Menge N+ der
16 1 Historische Notizen

In Definiton 1.1 haben wir positiven ganzen Zahlen. Obwohl die Menge N+ eine echte Teilmenge
die Schreibweise von N ist, lässt sie sich mit der folgenden Zuordnungsvorschrift bijektiv
auf die natürlichen Zahlen abbilden (Abbildung 1.15 oben):
|M1 | ≤ |M2 |
f : x → (x − 1)
eingeführt, um auszudrücken, dass die
Menge M1 injektiv in die Menge M2 ab- In ähnlicher Weise können wir eine Abbildung zwischen 2N, der Menge
gebildet werden kann. An mehreren Stel- der geraden nichtnegativen Zahlen, und N herstellen (Abbildung 1.15
len werden wir ausnutzen, dass ‚≤‘ eine Mitte):
totale oder vollständige Relation ist. x
f : x →
Beide Begriffe drücken aus, dass zwei 2
beliebige Mengen M1 und M2 stets ver- Ebenso können wir die ganzen Zahlen, wie in Abbildung 1.15 (unten)
gleichbar sind, also Folgendes gilt: gezeigt, bijektiv auf die Menge der natürlichen Zahlen abbilden. Die
folgende Zuordnung ist eine von – Sie werden es ahnen – unendlich
|M1 | ≤ |M2 | oder |M2 | ≤ |M1 |
vielen Möglichkeiten:

Auch wenn diese Eigenschaft intuitiv wie −2x − 1 falls x < 0
eine Selbstverständlichkeit wirkt, ist ihr f : x →
2x falls x ≥ 0
Beweis keine mathematische Trivialität.
Dass wir das Symbol ‚≤‘ verwendet ha- Die Mengen der natürlichen und der ganzen Zahlen erweisen sich in
ben, ist ebenfalls kein Zufall. Es lässt sich der Tat als gleichmächtig. Doch damit nicht genug. Auch die Menge
zeigen, dass die Relation alle Eigenschaf- alle Paare natürlicher Zahlen lässt sich bijektiv auf N abbilden. Abbil-
ten einer Ordnung erfüllt. Die Reflexivität dung 1.16 zeigt, wie eine passende Abbildung konstruiert werden kann.
und Transitivität, also die Beziehungen Alle Elemente von N2 sind in einer Matrix angeordnet, die sich un-
|M1 | ≤ |M1 | endlich weit nach rechts und nach unten ausbreitet. Ein Element (x, y)
können wir mit einer eindeutigen Zahl πN (x, y) ∈ N versehen, indem wir
|M1 | ≤ |M2 |, |M2 | ≤ |M3 | ⇒ |M1 | ≤ |M3 |,
links oben, bei (0,0), beginnen und uns anschließend diagonal durch die
sind leicht einzusehen; beide ergeben sich Matrix bewegen. Die entstehende Abbildung πN : N2 → N heißt Can-
mit wenig Aufwand aus den Merkmalen tor’sche Paarungsfunktion und lässt sich über die nachstehende Formel
injektiver Funktionen. Härter ist die Ei- direkt berechnen:
genschaft der Antisymmetrie, die Folgen- x+y
(x + y)(x + y + 1)
des besagt: πN (x, y) = y + ∑ i = y +
i=0 2
|M1 | ≤ |M2 |, |M2 | ≤ |M1 | ⇒ |M1 | = |M2 |
Über die Existenz einer bijektiven Zuordnung zwischen N und N2 haben
Dass ‚≤‘ diese Eigenschaft tatsächlich er- wir gezeigt, dass beide Mengen die gleiche Mächtigkeit besitzen.
füllt, ist die Aussage des berühmten Theo-
rems von Cantor-Schröder-Bernstein, das Mithilfe der Cantor’schen Paarungsfunktion lassen sich weitere Men-
wir auf Seite 23 detaillierter besprechen. gen als gleichmächtig identifizieren. Durch die rekursive Anwendung
sind wir z. B. in der Lage, nicht nur jedem Paar (x, y) ∈ N2 , sondern
auch jedem Tripel (x, y, z) ∈ N3 ein eindeutiges Element in N zuzuord-
nen. Diesen Zweck erfüllt die Funktion πN3 : N3 → N mit
πN3 (x, y, z) := πN (πN (x, y), z)
Führen wir den Gedanken in dieser Richtung fort, so erhalten wir mit
πN1 (x1 ) := x1 (1.8)
πNn+1 (x1 , . . . , xn , xn+1 ) := πN (πNn (x1 , . . . , xn ), xn+1 ) (1.9)
1.2 Der Weg zur modernen Mathematik 17

Abbildung 1.16: Die abgebildete Paa-


rungsfunktion ordnet
0 1 3 6 10 15 21 28 ...
jedem Tupel (x, y) ∈ N2
eine Zahl πN (x, y) ∈ N zu.

...
2 4 7 11 16 22 29
Die Abbildung ist bijektiv und beweist,

...
5 8 12 17 23 30 dass N2 und N gleichmächtig sind.

...
9 13 18 24 31 Genauso können wir jedem gekürzten
Bruch der Form xy ∈ Q ein individuelles

...
14 19 25 32 Feld der Matrix zuordnen, indem wir x
als Spaltennummer und y als Zeilennum-
...

20 26 33 mer interpretieren. Überspringen wir in


der dargestellten Aufzählung alle Felder,
die einem ungekürzten Bruch oder einem
...

27 34
Bruch mit dem Nenner 0 entsprechen, so
erhalten wir eine bijektive Abbildung zwi-
...

35
schen den rationalen Zahlen Q und den
natürlichen Zahlen N. Demnach sind auch
...
...

diese Mengen gleichmächtig.

eine bijektive Abbildung von Nn auf N. Damit ist bewiesen, dass der n-
dimensionale Zahlenraum Nn stets die gleiche Mächtigkeit besitzt wie
die Grundmenge N selbst – unabhängig davon, wie groß wir die Dimen-
sion n ∈ N auch wählen.

In einer berühmten Arbeit aus dem Jahr 1874 publizierte Cantor, wie
sich auch die Menge der algebraischen Zahlen bijektiv auf die Menge
der natürlichen Zahlen abbilden lässt [22]. Hierzu ordnete er jeder alge-
braischen Gleichung der Form (1.7) zunächst eine Höhe N zu, die sich
wie folgt berechnet:

N := n − 1 + |an | + . . . + |a3 | + |a2 | + |a1 | + |a0 |

Für jeden Wert von N existieren nur endlich viele algebraische Glei-
chungen, und jede dieser Gleichungen kann maximal N Lösungen be-
sitzen. Damit sind wir in der Lage, die algebraischen Zahlen der Reihe
nach aufzuzählen, und erhalten so eine eindeutige Zuordnung zu den
natürlichen Zahlen.

Cantors wesentlich bedeutsamere Entdeckung war aber eine andere. In


der gleichen Arbeit, in der er die Gleichmächtigkeit von N und der Men-
ge der algebraischen Zahlen zeigte, bewies er, dass sich das Kontinuum
18 1 Historische Notizen

Cantors Arbeit aus dem Jahr einer entsprechenden Zuordnung entzieht. Offenbar scheint die Anzahl
1874 trägt den unscheinba- der reellen Zahlen jene der natürlichen Zahlen so sehr zu übersteigen,
ren Titel „Über eine Eigenschaft des In- dass es unmöglich ist, eine Eins-zu-eins-Zuordnung zwischen beiden
begriffs aller reellen algebraischen Zah- Mengen herzustellen. Damit hatte Cantor gezeigt, dass die Menge der
len“. Die Frage, warum Cantor einen Ti-
natürlichen Zahlen und die Menge der reellen Zahlen stellvertretend für
tel wählte, der dem Leser keinerlei Hin-
weis auf sein erzieltes Hauptergebnis,
verschiedene Unendlichkeiten stehen. Begrifflich bringen wir den Un-
die Überabzählbarkeit der reellen Zahlen, terschied wie folgt zum Ausdruck:
gibt, ist in Historikerkreisen umstritten.
Zum einen gibt es Anlass für die Vermu-
Definition 1.2 (Abzählbarkeit, Überabzählbarkeit)
tung, dass Cantor das eigentlich Revolu-
tionäre seiner Arbeit zur Zeit der Veröf-
Eine Menge M heißt
fentlichung selbst nicht gesehen hat und
ausschließlich an einem alternativen Be- I abzählbar, falls |M| = |N|,
weis des Liouville’schen Satzes interes-
siert war. Hinweise darauf finden sich in I höchstens abzählbar, falls |M| ≤ |N|, und
einem Brief Cantors an Richard Dedekind
vom 2.12.1873: [140] I überabzählbar, falls |M| ≤ |N|.
„Übrigens möchte ich hinzufügen, dass
ich mich nie ernstlich mit ihr [der Frage
nach der Abzählbarkeit des Kontinuums] In Worten ausgedrückt ist eine Menge M höchstens abzählbar, wenn sie
beschäftigt habe, weil sie kein besonderes endlich oder abzählbar ist.
praktisches Interesse für mich hat und ich
trete Ihnen ganz bei, wenn Sie sagen, dass
sie aus diesem Grund nicht zu viel Mü- Cantors erster Überabzählbarkeitsbeweis
he verdient. Es wäre nur schön, wenn sie
beantwortet werden könnte; z.B., voraus-
gesetzt dass sie mit nein beantwortet wür- Um die Überabzählbarkeit der reellen Zahlen zu zeigen, führte Cantor
de, wäre damit ein neuer Beweis des Liou- einen klassischen Widerspruchsbeweis. Zunächst nahm er an, dass sich
ville’schen Satzes geliefert, dass es tran- die reellen Zahlen vollständig in Form einer unendlich langen Liste auf-
szendente Zahlen gibt.“ zählen lassen:
Dagegen ist der Cantor-Biograph Joseph ω1 , ω2 , ω3 , . . . (1.10)
Dauben davon überzeugt, dass die Titel-
wahl politisch motiviert war und nur dazu
Jedes Element ωi bezeichnet eine reelle Zahl, und für jede reelle Zahl
dienen sollte, seinen Erzfeind Kronecker x existiert per Annahme ein Index i mit ωi = x. Cantor gelang es zu
nicht auf die Arbeit aufmerksam zu ma- zeigen, dass in jedem nichtleeren Intervall (α1 , β1 ) dennoch mindestens
chen [39]. eine reelle Zahl ν existieren muss, die nicht in der Liste (1.10) auftaucht.
„Had Cantor been more direct with a Den Widerspruch leitete er her, indem er das Startintervall (α1 , β1 ) zu
title like ’The set of real numbers is non- einer Intervallfolge der folgenden Bauart ergänzte:
denumerably infinite’ or ’A new and in-
dependent proof of the existence of tran- (α1 , β1 ), (α2 , β2 ), (α3 , β3 ), . . .
scendental numbers’, he could have coun-
ted on a strongly negative reaction from Um das Folgeintervall (αi+1 , βi+1 ) zu bestimmen, wird die aufgestell-
Kronecker. After all, when Lindemann la- te Liste der reellen Zahlen von links nach rechts durchsucht, bis zwei
ter established the transcendence of π in Zahlen gefunden werden, die innerhalb des Intervalls (αi , βi ) liegen.
1882, Kronecker asked what value the re- Die kleinere von beiden bildet die linke Grenze und die größere die
sult could possibly have, since irrational rechte Grenze des neuen Intervalls (Abbildung 1.17). Anschließend un-
numbers did not exist.“ terschied Cantor die nachstehenden Fälle:
1.2 Der Weg zur modernen Mathematik 19

I Fall 1: Die Anzahl der geschachtelten Intervalle ist endlich (Abbil- 3 4 9 10 11 7
dung 1.18 oben). Dann gäbe es ein letztes Intervall (αν , βν ), und
wir hätten mit αν +β
2
ν
und 2αν3+βν zwei Zahlen vor uns, von denen
mindestens eine nicht in (1.10) vorkommt. 2 8 6 5 1

1 = 2 1 = 1
I Fall 2: Die Anzahl der geschachtelten Intervalle ist unendlich. Aus
der Tatsache, dass die Intervallgrenzen αi und βi beschränkt und 1 1
gleichzeitig streng monoton steigend bzw. fallend sind, müssen bei-
de Folgen einem Grenzwert zustreben, den Cantor als α∞ bzw. β∞ 2 = 4 2 = 5
bezeichnet. Wäre α∞ < β∞ , so könnten wir mit α∞ +β 2

erneut eine
Zahl konstruieren, die in (1.10) nicht vorkommt (Abbildung 1.18 1 2 2 1
Mitte). Aber auch die letzte Alternative, α∞ = β∞ , führt zu einem
Widerspruch (Abbildung 1.18 unten). Einerseits ist der Grenzwert 3 = 8 3 = 6
in jedem der gebildeten Intervalle enthalten. Andererseits stellt die
Konstruktionsvorschrift sicher, dass jedes ωi ab einem gewissen In- 1 2 3 3 2 1
dex j nicht mehr in (α j , β j ) liegt. Damit kann der Grenzwert nicht
in (1.10) auftauchen.

...
Offensichtlich gibt es kein Entrinnen! Die entstehenden Widersprüche
bringen unsere Annahme zu Fall, dass eine bijektive Abbildung zwi- Abbildung 1.17: Cantors erster Beweis der
Überabzählbarkeit des Kontinuums. Ausge-
schen den reellen und den natürlichen Zahlen existieren kann.
hend von einer Aufzählung ωi der reellen
Aus den von Cantor erzielten Teilergebnissen ergibt sich eine weitrei- Zahlen konstruierte Cantor zunächst eine
chende Konsequenz für die Menge der transzendenten Zahlen. Da die Intervallfolge der Form (α1 , β1 ), (α2 , β2 ),
(α3 , β3 ), . . .
Menge der algebraischen Zahlen abzählbar und die Menge der reel-
len Zahlen überabzählbar ist, kann keine Abbildung der transzendenten
Zahlen auf die natürlichen Zahlen gelingen. Genau wie das Kontinuum
ist auch die Menge der transzendenten Zahlen überabzählbar. I Fall 1
α1 α2 ... αν βν ... β2 β1
Waren in der Mitte des neunzehnten Jahrhunderts nur eine Handvoll
transzendenter Zahlen bekannt, so wissen wir heute, dass die Transzen-
denz alles andere als eine exotische Eigenschaft ausgewählter Zahlen I Fall 2
ist. Bis auf eine kleine Teilmenge sind sämtliche Elemente des Konti- α1 α2 ... α∞ β∞ ... β2 β1
nuums transzendent!
oder
Cantor hatte für diese Behauptung einen wahrhaft eleganten Beweis
α1 α2 ... α∞ ... β2 β1
geliefert. Die inhaltliche Aussage seines Satzes war jedoch nicht neu;
Liouville hatte bereits ein paar Jahre zuvor ein ähnliches Ergebnis er- β∞
zielt. Der historisch bedeutende Teil in Cantors Arbeit ist in einem sei-
ner Teilergebnisse versteckt: Es ist der Beweis der Überabzählbarkeit Abbildung 1.18: Gleichgültig, wie die
der reellen Zahlen. Konstruktion der Intervallfolge verlaufen
wird: Sämtliche Möglichkeiten führen zu
einem Widerspruch.
20 1 Historische Notizen

Abbildung 1.19: Das Diagonalisierungs-


argument. Gäbe es eine bijektive Abbil-
dung von den natürlichen auf die reel-
len Zahlen, so müsste sich die (unend-
lich lange) Ziffernfolge jeder reellen Zahl f (0) = 0 , 5 4 9 0 0 7 5 8 ...
in einer Zeile der Zuordnungsmatrix wie-
derfinden lassen. Unabhängig von der ge- f (1) = 0 , 7 1 4 4 5 6 6 3 ...
wählten Zuordnung sind wir immer im
Stande, die Ziffernfolge einer reellen Zahl f (2) = 0 , 7 4 3 9 6 1 4 2 ...
zu konstruieren, die nicht in der Matrix
vorkommt. Diese können wir erzeugen, f (3) = 0 , 2 3 1 1 1 7 4 5 ...
indem wir uns entlang der Hauptdiagona-
len von links oben nach rechts unten be- f (4) = 0 , 2 7 9 7 7 4 0 0 ...
wegen und die vorgefundene Ziffer um
eins erhöhen oder erniedrigen. Die kon-
struierte Ziffernfolge kommt nirgends in
f (5) = 0 , 3 8 6 4 8 7 2 8 ...

der Matrix vor, da sie sich von jener der i-


ten Zeile per Konstruktion in der i-ten Zif-
f (6) = 0 , 5 6 0 6 9 3 7 4 ...
fer unterscheidet. Die Überlegung zeigt,
dass eine bijektive Zuordnung der Ele- f (7) = 0 , 2 1 3 4 4 9 9 9 ...
mente aus R zu den Elementen aus N
...

...

...

...

...

...

...

...

...

...
nicht möglich ist. Kurzum: Die Menge der
reellen Zahlen ist nicht abzählbar.

Cantors zweiter Überabzählbarkeitsbeweis

Drei Jahre später bewies Cantor seine Aussage erneut – diesmal auf
verblüffend einfache Weise. Den Kern des Beweises bildet das von ihm
entwickelte Diagonalisierungsargument, eine genauso leistungsfähige
wie intuitive Methode, um eine Menge als überabzählbar zu identifizie-
ren. Cantor stellte die folgende Überlegung an: Wenn die beiden Men-
gen N und R gleichmächtig wären, dann müsste eine bijektive Abbil-
dung f : N → R existieren, die jedes Element x ∈ N eineindeutig auf
ein Element f (x) ∈ R abbildet. Listen wir die Nachkommaanteile von
f (1), f (2), f (3), . . . von oben nach unten auf, so entsteht eine Matrix,
wie sie in Abbildung 1.19 skizziert ist. Formal entspricht das Element in
Spalte x und Zeile y der x-ten Nachkommaziffer der Dezimalbruchdar-
stellung von f (y). Natürlich können wir nur einen winzigen Ausschnitt
der entstehenden Matrix zeichnen, da die Funktion f für unendlich vie-
le Werte y ∈ N definiert ist und sich die Dezimalbruchdarstellung der
reellen Zahlen f (y) über unendlich viele Ziffern erstreckt.

Mithilfe des Diagonalisierungsarguments können wir zeigen, dass die


Matrix nie vollständig sein kann. Unabhängig von der konkreten Wahl
von f existieren reelle Zahlen, die nicht in der Matrix enthalten sind
1.2 Der Weg zur modernen Mathematik 21

und damit die Bijektivität von f ad absurdum führen. Wir konstruie-

...
ren eine solche Zahl, indem wir uns entlang der Hauptdiagonalen von

7
links oben nach rechts unten bewegen und die vorgefundenen Ziffern 0
4
jeweils um eins erhöhen oder erniedrigen. Die entstehende Ziffernfolge 8
5 0
interpretieren wir als die Nachkommaziffern einer reellen Zahl r. Wä- 3 5
0 , 1
re f eine bijektive Abbildung von N auf R, so müsste auch die Zahl r
in irgendeiner Zeile vorkommen. Aufgrund des gewählten Konstrukti- 0 , 1 4 3 2 5 1 5 0 0 0 8 7 4 5 0 9 7 ...
onsschemas ist jedoch sichergestellt, dass sich die reelle Zahl der i-ten
0 , 4 2 1
Zeile in der i-ten Ziffer von r unterscheidet. Die Annahme, eine bijek- 0 0 7
tive Zuordnung zwischen N und R könnte existieren, führt zu einem 5
unmittelbaren Widerspruch. Folgerichtig ist jeder Versuch, die reellen 9
...
Zahlen nacheinander durchzunummerieren, zum Scheitern verurteilt.
Abbildung 1.20: Im Reißverschlussverfah-
Trotzdem gelten einige der Eigenschaften, die wir für die Menge N her- ren lassen sich zwei reelle Zahlen zu einer
ausgearbeitet haben, auch in der Menge der reellen Zahlen. So sind wir einzigen reellen Zahl verschmelzen. Auf
auch hier in der Lage, ein Tupel (x, y) ∈ R2 bijektiv auf die Menge diese Weise lässt sich eine bijektive Abbil-
R abzubilden. Abbildung 1.20 skizziert die zugrunde liegende Kon- dung von R2 auf R konstruieren und damit
struktionsidee. Die beiden reellen Zahlen x ∈ R und y ∈ R werden die Gleichmächtigkeit der beiden Mengen
zu einer gemeinsamen reellen Zahl πR (x, y) ∈ R verschmolzen, indem zeigen.
die Vor- und Nachkommaziffern reißverschlussartig miteinander ver-
schränkt werden.

Erneut hat uns der Cantor’sche Zugang zur Unendlichkeit eine verblüf-
fende Eigenschaft von Zahlenmengen offengelegt. Die Gleichmächtig-

...
keit von R und R2 bedeutet, dass eine Gerade in der Ebene gleich viele
Punkte besitzt wie die Ebene selbst (Abbildung 1.21). Wir sind damit
in der Lage, die Punkte der Ebene verlustfrei auf die Punkte einer Ge-
raden abzubilden. Ebenso ist es möglich, die Ebene lückenlos mit den
Punkten einer Geraden zu belegen. ... ...

Kombinieren wir die Aufrufe von πR wieder rekursiv miteinander, so


entsteht für jede natürliche Zahl n ∈ N eine Abbildung πRn , die den n-
dimensionalen Zahlenraum Rn bijektiv auf R reduziert. Formal ist die
Abbildung πRn , in Analogie zu den Gleichungen (1.8) und (1.9), wie
...

folgt definiert:

πR1 (x1 ) := x1
... ...
πRn+1 (x1 , . . . , xn , xn+1 ) := πR (πRn (x1 , . . . , xn ), xn+1 )
Abbildung 1.21: Die zweidimensionale
Am Beispiel der reellen Zahlen haben wir gesehen, dass eine Unend- Ebene und die eindimensionale Gerade
lichkeit existiert, die mächtiger ist als jene der natürlichen Zahlen. Das beinhalten die gleiche „Anzahl“ reeller
Ergebnis wirft die Frage auf, ob es eine weitere Unendlichkeit gibt, die Punkte. Jeder Punkt des einen geometri-
wiederum mächtiger ist als jene der reellen Zahlen. Der folgende Satz schen Objekts lässt sich eindeutig auf einen
von Cantor beantwortet diese Frage positiv: Punkt des anderen abbilden.
22 1 Historische Notizen

Satz 1.1 (Satz von Cantor)

Für jede Menge M ist die Potenzmenge P(M) mächtiger als M.

Wir können diese Aussage beweisen, indem wir ein ähnliches Diagona-
lisierungsargument verwenden, mit dem wir bereits die Überabzählbar-
keit der reellen Zahlen zeigen konnten. Auch hier gehen wir wieder von
der Existenz einer bijektiven Abbildung f : M → P(M) aus und führen
die Annahme zu einem Widerspruch.

Sei f eine Funktion, die M bijektiv auf die Menge P(M) abbildet. Für
jedes Element x ∈ M können wir zwei Fälle unterscheiden: Entweder
ist x im Bildelement f (x) enthalten (x ∈ f (x)) oder nicht (x ∈ f (x)).
Alle Elemente, auf die Letzteres zutrifft, fassen wir in der Menge T
zusammen:
T := {x ∈ M | x ∈ f (x)}
Da f bijektiv und damit insbesondere auch surjektiv ist, muss ein Urbild
xT existieren mit f (xT ) = T . Wie für alle Elemente aus M gilt auch für
das Element xT entweder die Eigenschaft xT ∈ T oder xT ∈ T . Beide
Fälle führen jedoch unmittelbar zu einem Widerspruch:

xT ∈ T ⇒ x T ∈
 f (xT ) ⇒ xT ∈
 T
xT ∈ T ⇒ xT ∈ f (xT ) ⇒ xT ∈ T

Damit haben wir gezeigt, dass es eine bijektive Funktion f : M → P(M)


nicht geben kann.

Aus dem Cantor’schen Satz ergeben sich zwei wichtige Konsequenzen.


Zum einen zeigt er, dass es keine maximale Unendlichkeit gibt, d. h.,
wir sind nicht in der Lage, eine Universalmenge zu konstruieren, die
mächtiger ist als alle anderen Mengen. Es scheint, als ob es die Un-
endlichkeit abermals schafft, sich jeglichen Grenzen zu entziehen. Zum
anderen bringt der Satz eine hierarchische Ordnung in die unendliche
Menge der verschiedenen Unendlichkeiten:

|N| < |P(N)| < |P(P(N))| < |P(P(P(N)))| < |P(P(P(P(N))))| < . . .

Cantor verwendete den hebräischen Buchstaben Aleph (ℵ), um die


Mächtigkeit einer unendlichen Menge zu beschreiben. Die kleinste Un-
endlichkeit wird mit der Kardinalzahl ℵ0 bezeichnet; sie entspricht der
Kardinalität der natürlichen Zahlen. Eine kleinere Unendlichkeit als |N|
kann es nicht geben, da sich alle unendlichen Teilmengen von N bijek-
tiv auf N abbilden lassen. Die nächstgrößere Unendlichkeit wird durch
1.2 Der Weg zur modernen Mathematik 23

die Kardinalzahl ℵ1 beschrieben und so fort. Besitzt eine Menge M die I Injektionen f und g
Kardinalität ℵn , so bezeichnen wir die Kardinalität der Potenzmenge (1;1) [1;1]
P(M) mit 2ℵn . 1 1

An dieser Stelle wollen wir mit dem berühmten Cantor-Schröder-


Bernstein-Theorem (CSB-Theorem) ein wichtiges Hilfsmittel einfüh-
ren, mit dem sich die Gleichmächtigkeit vieler Mengen bequem be-
weisen lässt. Um die Aussage des Theorems zu verstehen, werfen wir
erneut einen Blick auf Definition 1.1. Dort haben wir die Schreibwei- 1/2 1/2
se |M1 | ≤ |M2 | eingeführt, um auszudrücken, dass sich die Menge M1
injektiv in die Menge M2 abbilden lässt. Bildlich gesprochen bedeutet
dies, dass sich die Elemente von M1 in die Menge M2 einbetten lassen, 1/4 1/4
ohne ein Element von M2 doppelt zu belegen. Da jede bijektive Abbil- 1/8 1/8
dung auch injektiv ist, folgt aus |M1 | = |M2 | immer auch |M1 | ≤ |M2 |
...
und |M2 | ≤ |M1 |. Das Cantor-Schröder-Bernstein-Theorem besagt nun, 0 0
dass dieser Schluss sogar in der umgekehrten Richtung gilt: 1/8 1/8

1/4 1/4
Satz 1.2 (Cantor-Schröder-Bernstein-Theorem)

Für zwei beliebige Mengen M1 und M2 gilt: 1/2 1/2

Aus |M1 | ≤ |M2 | und |M2 | ≤ |M1 | folgt |M1 | = |M2 |.

Einen Beweis dieses Satzes finden Sie z. B. in [48] oder [217].


g f
1 1
An zwei Beispielen wollen wir demonstrieren, wie sich das Cantor-
Schröder-Bernstein-Theorem einsetzen lässt.
I Bijektion h : (−1; 1) → [−1; 1]
Als erstes wollen wir es dazu verwenden, um das offene Intervall ⎧
⎪ (−)1 falls x = (−) 12
(−1; 1) und das geschlossene Intervall [−1; 1] als gleichmächtig zu ⎪


⎪ (−) 1
x = (−) 14
identifizieren. Zunächst halten wir fest, dass sich die Menge (−1; 1) ⎪
⎪ 2 falls

über die identische Abbildung f : x → x auf triviale Weise injektiv in h : x → (−) 1
4 falls x = (−) 18

⎪ (−) 18 x = (−) 16
1
die Menge [−1; 1] einbetten lässt. Andersherum existiert mit g : x → 2x ⎪
⎪ falls

⎪ ...
auch eine injektive Abbildung des geschlossenen Intervalls in das of- ⎪

x sonst
fene. Damit sind wir schon am Ziel. Aus dem CSB-Theorem folgt die
Gleichmächtigkeit der beiden Intervalle. Unbestritten stellt das Ergeb- Abbildung 1.22: Lässt sich eine Men-
nis unsere Intuition erneut auf eine harte Probe, da das geschlossene ge injektiv in eine andere Menge abbil-
Intervall [−1; 1] zwei Elemente mehr zu enthalten scheint als sein offe- den und umgekehrt, so kann durch die ge-
nes Pendant (−1; 1). Abbildung 1.22 beseitigt die Zweifel, ob hier alles schickte Kombination der beiden Abbil-
mit rechten Dingen zugeht. Sie zeigt, wie eine bijektive Abbildung zwi- dungen eine Bijektion zwischen den Men-
schen den beiden Intervallen konkret aussehen kann. gen hergestellt werden. Dies ist die Aussage
des berühmten Cantor-Schröder-Bernstein-
Auf die gleiche Art und Weise können wir zeigen, dass sich die Menge Theorems, hier demonstriert am Beispiel
der reellen Zahlen bijektiv auf das Einheitsintervall [0; 1] abbilden lässt. der Intervalle (−1; 1) und [−1; 1].
24 1 Historische Notizen

... 0 0 0 3 4 8 6 0 7 , 5 7 3 0 0 9 1 2 ... Eine injektive Einbettung von [0; 1] in R ist trivial. Umgekehrt können
wir durch die Zuordnung
∞ ∞  
∑ bi 10i → b0 10−1 + ∑ b−i 10−2i + bi 10−2i−1
i=−∞ i=1

jede reellen Zahl in das Intervall [0; 1] abbilden, ohne ein Element der
Zielmenge doppelt zu belegen (Abbildung 1.23). Damit haben wir er-
0 , 7 5 0 7 6 3 8 0 4 0 3 9 0 1 0 2 0 ...
neut die Voraussetzungen des CSB-Theorems erfüllt und die Gleich-
Abbildung 1.23: Durch die Umsortierung mächtigkeit von [0; 1] und R bewiesen.
der Ziffernfolge lassen sich alle reellen Zah-
len injektiv in das Intervall [0; 1] einbetten.
Dass sich die reellen Zahlen bijektiv auf das Intervall [0; 1] abbilden
lassen, bringt eine entscheidende Vereinfachung mit sich, die wir in den
nachfolgenden Kapiteln mehrfach ausnutzen werden. Anstatt die reel-
len Zahlen als Ganzes zu behandeln, ist es völlig ausreichend, unsere
Betrachtungen auf die reellen Zahlen mit dem Vorkommaanteil 0 zu
beschränken.
Jetzt sind wir gewappnet, um einen wichtigen Zusammenhang zwischen
den reellen Zahlen und der Potenzmenge der natürlichen Zahlen her-
zustellen. Schreiben wir eine reelle Zahl x aus dem Intervall [0; 1] im
Binärsystem auf, so besitzt sie die folgende Form:

x = ∑ bi 2−i
i=1

Die Koeffizienten bi bilden aneinandergereiht eine unendlich lange Fol-


ge von Nullen und Einsen. Damit können wir x eindeutig eine Teilmen-
ge der natürlichen Zahlen zuordnen, indem wir die Zahl n ∈ N genau
dann in die Teilmenge aufnehmen, wenn die n-te Nachkommastelle von
x gleich 1 ist:

∑ bi 2−i → {n ∈ N | bn = 1} (1.11)
i=1

Umgekehrt können wir jede Teilmenge von N injektiv in das Intervall


[0; 1] einbetten:
{n1 , n2 , . . .} → ∑ 2−2ni −1 (1.12)
i

Das CSB-Theorem liefert uns das Ergebnis, nach dem wir gesucht ha-
ben. Es zeigt, dass die Menge der reellen Zahlen die gleiche Mächtigkeit
besitzt wie die Potenzmenge der natürlichen Zahlen:

|R| = |P(N)| = 2ℵ0 (1.13)

Cantor beschäftigte sich intensiv mit der Frage, ob sich zwischen den
Mengen N und R weitere Unendlichkeiten verbergen. Schon früh hegte
1.2 Der Weg zur modernen Mathematik 25

er die Vermutung, dass es keine Menge geben kann, die bezüglich ihrer Über die Zuordnungsvor-
Kardinalität zwischen den natürlichen und den reellen Zahlen liegt. schrift (1.11) haben wir es
geschafft, die reellen Zah-
Demnach befänden sich die reellen Zahlen an zweiter Position (ℵ1 ) len aus dem Intervall [0; 1]
in der unendlich langen Liste der Unendlichkeiten. Genau dies ist der injektiv in die Menge P(N) einzubetten.
Inhalt der berühmten Kontinuumshypothese, die in ihrer symbolischen Die Abbildung haben wir über die Bi-
Form wie folgt lautet: närdarstellung einer reellen Zahl definiert,
? und genau hier laufen wir in eine tech-
|R| = ℵ1 (1.14) nische Schwierigkeit hinein, die auf den
Aufgrund der oben herausgearbeiteten Äquivalenz (1.13) können wir ersten Blick gern übersehen wird. Ausge-
Gleichung (1.14) auch in der Form löst wird sie durch die Eigenschaft man-
cher reeller Zahlen, mehrere Binärdarstel-
2ℵ0 = ℵ1
? lungen zu besitzen. Beispielsweise besitzt
die Zahl 12 die beiden Darstellungen 0,1
schreiben und in naheliegender Weise verallgemeinern: und 0,0111 . . .. Das bedeutet, dass die Vor-
schrift (1.11) der Zahl 12 sowohl die Men-
2ℵn = ℵn+1
?
(1.15) ge {1} als auch die Menge {2, 3, 4, . . .}
zuordnet und damit streng genommen gar
Die in Gleichung (1.15) geäußerte Vermutung heißt allgemeine Konti- keine Abbildung definiert. Glücklicher-
nuumshypothese. Plakativ besagt sie, dass die Potenzmengenoperation, weise lässt sich dieses Problem einfach
lösen. Die Mehrdeutigkeit verschwindet,
während sie uns von einer Unendlichkeit zur nächsten führt, keine Un-
wenn wir per Definition immer diejeni-
endlichkeiten überspringt. ge Darstellung mit der geringsten Anzahl
Einsen zugrunde legen.
Die Kontinuumshypothese sollte Cantor bis zu seinem Lebensende be-
Bei der Einbettung von P(N) in [0; 1]
schäftigen. Einige Male glaubte er sich im Besitz eines Beweises, an- müssen wir ebenfalls vorsichtig sein.
dere Male dachte er, die Hypothese widerlegt zu haben. Doch immer Würden wir z. B. die Abbildungsvor-
wieder tauchten Fehler auf, die seinen schon sicher geglaubten Erfolg schrift
zunichte machten. So sehr er sich auch bemühte, es blieb ihm zu Leb-
zeiten verwehrt, dieses große Rätsel des Kontinuums zu lüften. Cantor {n1 , n2 , . . .} → ∑ 2−n −1
i

i
konnte nicht wissen, wie sehr er zum Scheitern verdammt war.
verwenden, so wäre die Abbildung nicht
Dass Cantors Mengenbegriff von vielen seiner Zeitgenossen abgelehnt
mehr injektiv. Beispielsweise würden die
und von einigen sogar heftig bekämpft wurde, lässt sich nur im histo-
Mengen {0} und {1, 2, 3, . . .} beide der
rischen Kontext verstehen. Cantor schuf seinen Mengenbegriff in einer Zahl 12 zugeordnet. Genau dies ist der
Zeit, in der die Diskussion um das Wesen der Unendlichkeit in vollem Grund, weshalb ni in Gleichung (1.12)
Gange war. Zwei Begriffe standen im Mittelpunkt des Diskurses: Die mit 2 multipliziert wird. Erst durch die-
potenzielle Unendlichkeit und die aktuale Unendlichkeit. sen Trick wird die Zuordnung injektiv,
d. h., verschiedene Teilmengen der natür-
Den Unterschied zwischen diesen beiden Begriffen wollen wir am Bei- lichen Zahlen werden auf verschiedene re-
spiel der natürlichen Zahlen elle Zahlen abgebildet.

0, 1, 2, 3, . . .

sichtbar machen. Außer der 0 wird jedes Element in dieser unendlich


langen Liste durch die Anwendung der Nachfolgeroperation aus sei-
nem Vorgänger gewonnen. Mit diesem Prozess können wir fortwäh-
rend neue Zahlen generieren, ohne dass die Anzahl der Iterationen nach
26 1 Historische Notizen

oben beschränkt ist. Wir sagen, die Anzahl der Iterationen ist potenziell
unendlich. Diese Art der Unendlichkeit birgt keinerlei Risiken in sich.
Auch wenn die Anzahl der Iterationen keiner Grenze unterliegt, errei-
chen wir jede natürliche Zahl nach endlich vielen Schritten und müssen
die Nachfolgeroperation daher niemals unendlich oft anwenden.

Reden wir stattdessen von den Zahlen, die sich durch die endliche Ite-
ration der Nachfolgeroperation erzeugen lassen, als Ganzes, so haben
wir den Sprung von der potenziellen Unendlichkeit in die aktuale Un-
endlichkeit vollzogen. Das besagte Ganze ist in diesem Fall nichts an-
deres als die Menge der natürlichen Zahlen selbst und besitzt unendlich
„So protestiere ich gegen den Gebrauch viele Elemente. Ob wir die natürlichen Zahlen tatsächlich als ein ab-
einer unendlichen Größe als einer geschlossenes Ganzes betrachten können oder lediglich das potenziell
Vollendeten, welches in der Mathematik Unendliche als alleinige Grundlage akzeptieren dürfen, wurde in der
niemals erlaubt ist.“ [65] Vergangenheit kontrovers diskutiert. Schon Aristoteles gehörte zu den
Kritikern der aktualen Unendlichkeit [168].
Befeuert wurde die Kritik durch die scheinbaren Widersprüche, die sich
im Umgang mit der Unendlichkeit ergeben. Weiter oben haben wir her-
ausgearbeitet, dass eine Eins-zu-eins-Zuordnung zwischen den ganzen
Zahlen Z und den natürlichen Zahlen N besteht, obwohl uns die Inklu-
sionsbeziehung N ⊂ Z das Gegenteil suggeriert. In analoger Weise lässt
sich zeigen, dass jede unendliche Teilmenge von N die gleiche Mäch-
tigkeit besitzt wie die natürlichen Zahlen selbst. Einige Wissenschaft-
ler, wie der namhafte Astronom Galileo Galilei, sahen hierin die Be-
stätigung dafür, dass Größenvergleiche zwischen unendlichen Mengen
unzulässig sind und nur im Falle endlicher Mengen einen Sinn erge-
ben [63, 111]. Andere Wissenschaftler, wie der berühmte Mathematiker
Carl Friedrich Gauß, lehnten den Umgang mit unendlichen Mengen als
in sich geschlossene Größen vollständig ab (Abbildung 1.24).
Carl Friedrich Gauß
(1777 – 1855) Für Cantor waren die angeblichen Paradoxien nichts weiter als Ei-
genschaften unendlicher Mengen. Er sah, dass die augenscheinlichen
Abbildung 1.24: Der deutsche Mathema- Widersprüche lediglich von der unbegründeten Annahme herrühren,
tiker Carl Friedrich Gauß zählt zu den ge- dass unendliche Mannigfaltigkeiten die gleichen Eigenschaften besit-
nialsten Mathematikern des ausgehenden zen müssen, wie die uns vertrauten endlichen Mengen. Einen Fürspre-
achtzehnten und beginnenden neunzehnten
cher fand Cantor in Richard Dedekind. Genau wie er sah Dedekind in
Jahrhunderts. Gauß hat in verschiedenen
Gebieten der Mathematik, Astronomie und
dem, was andere als Paradoxie bezeichneten, eine definierende Eigen-
Physik Bahnbrechendes geleistet und führ- schaft unendlicher Mengen. Offensichtlich hat eine Menge genau dann
te die Göttinger Mathematik zu Weltruhm. unendlich viele Elemente, wenn eine echte Teilmenge mit der gleichen
Eine Gedenkmünze, die ein Jahr nach sei- Mächtigkeit existiert.
nem Tod ausgegeben wurde, ehrt den bril-
lanten Mathematiker mit dem Titel „Ma- Obgleich das hohe Maß an Unverständnis, Misstrauen und Feindselig-
thematicorum Principi“ (lat. „Dem Fürsten keit tiefe Furchen in Cantors Psyche hinterließ, hielt er Kurs. Unbeirrt
der Mathematiker“). steuerte er in Richtung einer neuen Mathematik, die das aktual Unend-
1.2 Der Weg zur modernen Mathematik 27

„[Cantors] Widerlegung der Bedenken gegen das Unendliche


scheint mir im Ganzen wohlgelungen und treffend zu sein. Die
Bedenken entstehen dadurch, dass dem Unendlichen Eigen-
schaften beigelegt werden, die ihm nicht zukommen, indem
entweder Eigenschaften des Endlichen auf das Unendliche wie
selbstverständlich übertragen werden oder eine Eigenschaft,
die nur dem Absolutunendlichen zukommt, auf alles Unend-
liche übertragen wird. Auf die Unterschiede im Unendlichen
nachdrücklich hinzuweisen, ist ein Verdienst dieser Schrift.“ [56]

„Das Unendliche wird sich in der Arithmetik doch schließlich


nicht leugnen lassen, und andererseits ist es mit jener erkennt-
nistheoretischen Richtung unvereinbar. Hier ist, wie es scheint,
Gottlob Frege (1848 – 1925) das Schlachtfeld, wo eine große Entscheidung fallen wird.“ [56]

Abbildung 1.25: Der deutsche Mathematiker Gottlob Frege begründete mit dem Logizismus eine neue Denkrichtung. Auch er
schreckte nicht vor dem aktual Unendlichen zurück; wie Cantor sah er darin den Schlüssel zu einer modernen Mathematik.

liche zum Protagonisten erheben und damit ein für allemal von seiner
Statistenrollen befreien sollte. Noch ahnte Cantor nicht, dass sein Ge-
dankengerüst schon bald ins Wanken geraten würde.

1.2.3 Macht der Symbole

Genau wie Cantor war auch der drei Jahre später geborene Gottlob
Frege ein Verfechter des aktual Unendlichen (Abbildung 1.25). Frege
sah früh voraus, dass sich der Umgang mit der Unendlichkeit zu ei-
ner Grundsatzfrage der gesamten Mathematik entwickeln würde, die
kontrovers genug war, um die Wissenschaftsgemeinde für lange Zeit
zu spalten. Nichtsdestotrotz war er davon überzeugt, dass sich das ak-
tual Unendliche über kurz oder lang als akzeptiertes Instrument in der
Mathematik etablieren würde. Genau wie Cantor sah er die Mathema-
tik von einer „mächtigen akademisch-positivistischen Skepsis“ [56] be-
herrscht, die den Fortschritt zwar verzögern konnte, aber nicht im Stan-
de war, ihn dauerhaft aufzuhalten.

Im Jahr 1879 publizierte Gottlob Frege sein wichtigstes Werk, die Be-
griffsschrift. In der Rückschau markiert das knapp hundertseitige Buch
einen Meilenstein in der Geschichte der mathematischen Logik und ge-
hört zu den wichtigsten Einzelpublikation in diesem Bereich. In seinem
Werk schuf Frege das, was wir heute als symbolische Logik bezeichnen.
28 1 Historische Notizen

v Friedrich Ludwig Gottlob Frege sagenlogik von George Boole hinausging. Mit den einge-
8 No 26 Jul
1848 1925
wurde am 8. November 1848 im führten Begriffen und Konzepten schuf er die Grundlage der
mecklenburgischen Wismar gebo- modernen Prädikatenlogik.
ren. 1869 schrieb er sich an der Die meiste Zeit seines Lebens vertrat Frege die Auffassung,
Universität Jena ein, wo er in Ernst Abbe, dem Direktor der dass die Mathematik ein Teil der Logik sei, und war damit
Carl-Zeiss-Werke, einen einflussreichen Lehrer und lebens- ein überzeugter Verfechter des Logizismus. Nach Frege müs-
langen Unterstützer fand. Wahrscheinlich war es ein Vor- sen sich alle Wahrheiten auf eine Menge von Axiomen zu-
schlag Abbes, der Frege bewog, nach vier Semestern an die rückführen lassen, die nach seinen Worten „eines Beweises
renommierte mathematische Fakultät der Universität Göttin- weder fähig noch bedürftig“ seien. Er stand damit in einer
gen zu wechseln. Dort promovierte er im Jahr 1873 auf dem Gegenposition zu anderen Mathematikern seiner Zeit, von
Gebiet der Geometrie. Zurück in Jena reichte er 1874 seine denen viele die Logik als isoliertes Teilgebiet der Mathema-
Habilitationsschrift ein. Nach einigen Jahren der Privatdo- tik begriffen.
zentur wurde er 1879 zum Extraordinarius und 1896 schließ- Frege zog sich nach der niederschmetternden Entdeckung
lich zum ordentlichen Professor berufen. der Russell’schen Antinomie weitgehend aus der Wissen-
Frege zählt zu den Begründern der mathematischen Logik schaft zurück und sollte keine bedeutenden Arbeiten mehr
und der analytischen Philosophie. Im Jahr 1879 schuf er mit publizieren. Die Trümmer seines logizistischen Programms
seiner berühmten Begriffsschrift einen axiomatischen Zu- vor Augen, starb Frege als verbitterter Mann am 26. Juli
gang zur Logik [62], der weit über die bereits bekannte Aus- 1925 im Alter von 76 Jahren.

Ihm gelang es, eine künstliche Sprache zu ersinnen, die ausdrucksstark


genug ist, um die gesamte gewöhnliche Mathematik zusammen mit ih-
rem logischen Schlussapparat zu formalisieren. Dennoch wurde die Be-
deutung, die Freges Werk für die Mathematik haben sollte, zur Zeit der
Drucklegung gemeinhin verkannt. Mehrheitlich trat man seiner Arbeit
mit Gleichgültigkeit entgegen oder stand seinen Ideen gar abweisend
gegenüber. Auch Cantor hielt die Begriffsschrift für weitgehend bedeu-
tungslos.

Aber was war es genau, das Freges Arbeit so besonders machte? Schon
ein paar Jahre zuvor hatte George Boole mit der Aussagenlogik das
Grundgerüst erschaffen, um logische Relationen zwischen Elementar-
aussagen mithilfe symbolischer Operatoren auszudrücken [12, 13]. Fre-
ges Ansatz ging jedoch weit über die boolesche Logik hinaus. Er er-
kannte, dass sich die logischen Direktiven nicht nur dazu verwenden
ließen, um die Zusammenhänge zwischen elementaren Aussagen zu be-
schreiben; sie entpuppten sich als stark genug, um die Struktur der Ele-
mentaraussagen selbst zu formalisieren. Damit hob Frege eine wichtige
Einschränkung der booleschen Logik auf, die streng zwischen der Ebe-
ne der Elementaraussagen (Boolesche Variablen, primary propositions)
und der Ebene der logischen Relationen (Aussagenlogische Ausdrücke,
secondary propositions) unterschied.

In der Frege’schen Logik wird beispielsweise die Aussage

„Alle Menschen sind sterblich“


1.2 Der Weg zur modernen Mathematik 29

in der folgenden Implikationsform dargestellt: I Negation („nicht A“)

„Für alle x gilt: Wenn x ein Mensch ist, dann ist x sterblich.“ A ¬A
I Implikation („Aus B folgt A“)
In ähnlicher Weise lässt sich die Aussage
A
„Manche Menschen sind reich“ B→A
B
auf die Und-Verknüpfung (Konjunktion) zurückführen: I Konjunktion („B und A“)

„Für ein x gilt: x ist ein Mensch und x ist reich.“ A


B∧A
B
Die von Frege eingeführte Darstellungsform ist die Grundlage der mo-
dernen Prädikatenlogik. Legen wir die heute gebräuchliche Schreibwei- I Disjunktion („B oder A“)
se zugrunde, so lassen sich die oben formulierten Aussagen in der Form
A
B∨A
∀ x (Mensch(x) → Sterblich(x)) (1.16) B
∃ x (Mensch(x) ∧ Reich(x)) (1.17) I Allquantifikation („Für alle x ...“)

oder kürzer als x A ∀x A

∀ x (M(x) → S(x)) (1.18) I Existenzquantifikation („Für ein x ...“)

∃ x (M(x) ∧ R(x)) (1.19) x A ∃x A

ausdrücken.
Abbildung 1.26: Die Notation in Freges
Der Allquantor ‚∀‘ und der Existenzquantor ‚∃‘ werden verwendet, um Begriffsschrift und die Schreibweise der
quantitative Aussagen über die Elemente der Grundmenge (hier die modernen Prädikatenlogik im Vergleich
Menge aller Menschen) zu machen. Gelesen wird ∀ x als „Für alle x
gilt ...“ und ∃ x als „Es existiert ein x, für das gilt: ...“. Die Zeichen ‚→‘
und ‚∧‘ sind die heute üblichen Symbole für die logische Wenn-Dann-
Beziehung (Implikation) und die Und-Verknüpfung (Konjunktion).
Obwohl sich der konzeptionelle Kern der Begriffsschrift kaum von je-
nem der modernen Prädikatenlogik unterscheidet, könnten ihre Erschei-
nungsformen kaum unterschiedlicher sein. Verantwortlich hierfür ist die I „Alle Menschen sind sterblich“
komplizierte zweidimensionale Notation, in der Frege seine Formeln
niederschrieb (Abbildung 1.26). Die Art der Darstellung hat nicht nur x S(x) ∀ x (M(x) → S(x))
die Zunft der Buchdrucker vor neue Herausforderungen gestellt; sie ist M(x)
ebenso dafür verantwortlich, dass wir Freges Buch heute nur nach einer
I „Manche Menschen sind reich“
gründlichen Einarbeitung lesen können. Um einen plastischeren Ein-
druck von der Notation zu erhalten, zeigt Abbildung 1.27, wie sich die x R(x) ∃ x (M(x) ∧ R(x))
Formeln (1.18) und (1.19) in Freges Notation ausdrücken lassen. M(x)
Mit der Begriffsschrift war es Frege gelungen, das logische Denken auf
eine symbolische Ebene zu heben. Doch seine eigentlichen Ambitionen Abbildung 1.27: Zusammengesetzte Aus-
gingen deutlich weiter. Im Gegensatz zu vielen seiner Zeitgenossen, zu drücke in Freges Notation
30 1 Historische Notizen

denen auch Cantor und Boole gehörten, sah er die Logik nicht als Teil
der Mathematik, sondern umgekehrt die Mathematik als Teil der Logik
an. Mit Vehemenz verfolgte er das Ziel, sämtliche mathematischen Be-
griffe und Konzepte auf elementare Begriffe der Logik zurückzuführen
und auf diese Weise die gesamte Mathematik mit einem soliden Unter-
bau zu versehen. Mit seinem ambitionierten Projekt begründete Frege
eine neue philosophische Denkrichtung, die wir heute als Logizismus
bezeichnen.

Einen wichtigen Teilerfolg erzielte Frege im Jahr 1884 mit der Publika-
tion der Grundlagen der Arithmetik [61]. In diesem Werk unternahm er
den Versuch, den Zahlenbegriff formal zu definieren, und erläuterte den
Plan für die Durchführung seines logizistischen Programms. Anders als
die Begriffsschrift war sein neues Werk eine rein umgangssprachliche
Abhandlung.

Frege hatte sein Ziel klar vor Augen und sollte die nächsten zwanzig
Jahre seines Lebens fast vollständig der Formalisierung seiner Ideen
widmen. Die Früchte seiner Arbeit waren die Grundgesetze der Arith-
metik, ein zweibändiges Buch, das wir neben der Begriffsschrift als das
zweite Hauptwerk Freges ansehen dürfen (Abbildung 1.28) [58, 59].

Um die Arithmetik logisch zu begründen, stellte Frege einen Zusam-


menhang zwischen dem Begriff der Zahl und dem Begriff der Men-
ge her. Betrachten wir beispielsweise die Menge aller Wochentage, die
Menge aller Weltwunder oder die Menge aller Siegel eines unverständ-
lichen Buchs, so zählen wir in jedem Fall 7 Elemente. Wüssten wir
noch nichts über die Zahl 7, so könnten wir zumindest feststellen, dass
alle genannten Mengen gleich viele Elemente enthalten. Die Erkennt-
nis, dass wir über die Gleichmächtigkeit von Mengen sprechen können,
ohne die konkrete Anzahl ihrer Elemente zu benennen, ermöglicht es,
den Zahlenbegriff auf eine Mengeneigenschaft zurückzuführen. Frege
tat genau dies. Im Sinne seiner Logik wird die Zahl 7 mit der Men-
ge aller Mengen identifiziert, die sich bijektiv auf eine der genannten
Beispielmengen abbilden lassen.

Genau wie Cantor war auch Frege von der Korrektheit seiner Arbeit
überzeugt. Noch waren die Wolken außer Sichtweite, die sich hinter
dem Horizont zusammenzogen und den strahlend blauen Himmel der
neu geschaffenen Mathematik schon bald verdunkeln sollten.
1.2 Der Weg zur modernen Mathematik 31

Abbildung 1.28: Auszug aus dem 1. Band der Grundgesetze der Arithmetik. Gottlob Frege schrieb das zweibändige Werk als
Teil seines logizistischen Programms. Es war der erste umfassende Versuch, die Mathematik auf die Logik zurückzuführen.

1.2.4 Aufbruch in ein neues Jahrhundert

In der Nacht zum 1.1.1900 begrüßten die Menschen das neue Jahrhun-
dert voller Euphorie. Die wissenschaftlichen Erkenntnisse des neun-
zehnten Jahrhunderts hatten die Allmachtsphantasie der Menschen be-
feuert, und auch die Mathematik wähnte sich dank der errungenen Er-
folge auf dem richtigen Pfad. Vor diesem Hintergrund verwundert es
nicht, dass auf dem 2. internationalen Kongress der Mathematiker in
Paris ein Vortrag gehalten wurde, dessen alleiniger Inhalt ein Ausblick
auf das kommende Jahrhundert war. Die Rede fand am Morgen des 8.
August 1900 statt und begann mit den folgenden Worten:

„Wer von uns würde nicht gern den Schleier lüften, unter
dem die Zukunft verborgen liegt, um einen Blick zu werfen
auf die bevorstehenden Fortschritte unserer Wissenschaft
32 1 Historische Notizen

n 14 Feb David Hilbert wurde am 23.1.1862 Hilbert war nicht nur ein außerordentlich begabter, sondern
23 Ja
1862 1943
in Königsberg als ältestes Kind ei- auch ein ungewöhnlich vielseitiger Mathematiker. Im Lau-
ner ostpreußischen Juristenfamilie fe seiner akademischen Karriere hat er seinen Forschungs-
geboren. Die in seiner Heimatstadt schwerpunkt mehrfach gewechselt und nicht nur im Bereich
ansässige Albertus-Universität (Albertina) bot ihm optimale der mathematischen Logik, sondern auch in der Geometrie,
Voraussetzungen, um seine Talente zu entwickeln. Das Stu- der Zahlentheorie, der Analysis und der theoretischen Phy-
dium der Mathematik beendete er 1884 mit der Promotion, sik seine Spuren hinterlassen.
1886 folgte die Habilitation. Nach einigen Jahren der Pri- Wie kein anderer beeinflusste Hilbert die Mathematik des
vatdozentur wurde er 1892 von der Albertina zum Professor beginnenden zwanzigsten Jahrhunderts. Im Jahr 1900 hielt
berufen. er auf dem internationalen Kongress der Mathematiker in
1895 folgte Hilbert einem Ruf an die mathematische Fakul- Paris seine berühmte Jahrhundertrede, in der er 23 ungelöste
tät der Universität Göttingen. Es waren Größen wie Gauß, Probleme vortrug, die Mathematiker für Jahrzehnte beschäf-
Dirichlet und Riemann, die der Göttinger Mathematik einst tigen sollten. Noch heute sind einige Probleme offen.
zu großem Ruhm verhalfen. Gegen Ende des neunzehnten Hilbert starb am 14.2.1943 im Alter von 81 Jahren. Ein un-
Jahrhunderts drohte dieser aufgrund mangelnder Nachfolger auffälliger Grabstein auf dem Göttinger Stadtfriedhof erin-
allmählich zu verblassen. Die Berufung Hilberts war Teil nert leise und bescheiden an einen der größten Visionäre sei-
eines Neuanfangs, der die Göttinger Mathematik zu neuer ner Zeit. In Stein gemeißelt trägt er seine berühmten Worte:
Blüte führen sollte. „Wir müssen wissen. Wir werden wissen.“

und in die Geheimnisse ihrer Entwicklung während der


künftigen Jahrhunderte! Welche besonderen Ziele werden
es sein, denen die führenden mathematischen Geister der
kommenden Geschlechter nachstreben? Welche neuen Me-
thoden und neuen Tatsachen werden die neuen Jahrhunder-
te entdecken – auf dem weiten und reichen Felde mathema-
tischen Denkens?“ [91]

Der Redner auf dem Podium war der erst 38 jährige David Hilbert (Ab-
bildung 1.29). Trotz seines ungewöhnlichen Alters war der junge Ma-
thematiker kein Unbekannter. Durch zahlreiche Erfolge auf verschiede-
nen Gebieten der Mathematik stieg er früh in den Olymp der bedeu-
tendsten Mathematiker auf.

In Hilbert fand die axiomatische Methode einen genauso berühmten wie


prominenten Fürsprecher, und es ist eines seiner Verdienste, dass sie
David Hilbert (1862 – 1943) Ende des neunzehnten Jahrhunderts in den Mittelpunkt des Interesses
Abbildung 1.29: Der deutsche Mathemati-
rückte. Für ihn war sie die einzige adäquate Antwort auf die jahrzehn-
ker David Hilbert zählt zu den berühmtesten telang geführte Diskussion über das Wesen der mathematischen Grund-
und einflussreichsten Mathematikern der elemente.
vorigen Jahrhundertwende. Im Jahr 1900
hielt er auf dem internationalen Kongress Anders als Frege hielt Hilbert nichts von dem Versuch, die natürlichen
der Mathematiker in Paris eine wegweisen- Zahlen durch die Rückführung auf andere Begriffe zu erklären; die ver-
de Rede, an der sich die weitere Stoßrich- wendeten Begriffe waren für ihn kaum einsichtiger als der Begriff der
tung der gesamten Mathematik über Jahr- natürlichen Zahlen selbst. Ebensowenig teilte er die Ansicht des promi-
zehnte hinweg orientieren sollte. nenten Zahlentheoretikers Leopold Kronecker, die „natürlichen Zahlen
1.2 Der Weg zur modernen Mathematik 33

habe der liebe Gott geschaffen“ [207], so dass sich jede Definition der-
selben als genauso überflüssig wie sinnlos erweisen müsse.

Hilberts Weg aus dem Dilemma war ein formalistischer. Anstatt die
mathematischen Grundelemente ihrem Wesen nach zu erklären, be-
schränkte er sich auf die Benennung der logischen Beziehungen, die
zwischen den betrachteten Objekten bestehen. Mit seiner Vorgehens-
weise konnte er im Jahr 1899 mit der Neuformulierung der euklidischen
Geometrie einen durchschlagenden Erfolg erzielen. Aus insgesamt 20
Axiomen, eingeteilt in 5 Axiomengruppen, lassen sich alle Sätze der
euklidischen Geometrie ableiten, ohne die verwendeten Symbole mit
einer speziellen Interpretation zu versehen [87]. Mit dieser Arbeit wies
Hilbert den Weg, auf dem ihn viele Mathematiker über Jahre hinweg be-
gleiten sollten. In der Folgezeit wurden weite Bereiche der Mathematik
in der gleichen Art und Weise axiomatisiert und damit einer präzisen
Betrachtung zugänglich gemacht. In diesem modernen Sinn wird die
Mathematik zu einem symbolischen Spiel, in dem die Regeln und nicht
die Bedeutungen der Figuren die Partie bestimmen. Hilberts formali-
stische Methode bringt das Maß an Ehrlichkeit und Klarheit mit sich,
nach dem Mathematiker von jeher streben: Sie ist frei von Interpretati-
onsspielräumen jeglicher Art.

In seiner Pariser Rede adressierte Hilbert 23 Probleme, die für die Ma-
thematik von immenser Wichtigkeit, aber bis dato eben ungelöst waren.
Nur die ersten 10 Probleme wurden vorgetragen, die letzten 13 sind nur
in der schriftlichen Ausarbeitung der Rede enthalten.

Hilbert war sich bewusst, welche wegweisende Rolle der Unendlich-


keitsbegriff für die Zukunft der Mathematik haben würde, und so avan-
cierte die Klärung der Kontinuumshypothese an die erste Stelle.

„Die Untersuchungen von Cantor über solche Punktmen-


gen machen einen Satz sehr wahrscheinlich, dessen Beweis
jedoch trotz eifrigster Bemühungen bisher noch nieman-
dem gelungen ist; dieser Satz lautet: Jedes System von un-
endlich vielen reellen Zahlen, d. h. jede unendliche Zahlen-
(oder Punkt)menge ist entweder der Menge der ganzen na-
türlichen Zahlen 1, 2, 3, ... oder der Menge sämtlicher re-
ellen Zahlen und mithin dem Kontinuum, d. h. etwa den
Punkten einer Strecke äquivalent; im Sinne der Äquivalenz
gibt es hiernach nur zwei Zahlenmengen, die abzählbare
Menge und das Kontinuum.“ [91]

An zweiter Stelle forderte Hilbert dazu auf, einen Beweis für die Wi-
derspruchsfreiheit der arithmetischen Axiome zu liefern.
34 1 Historische Notizen

„Vor allem aber möchte ich unter den zahlreichen Fragen,


welche hinsichtlich der Axiome gestellt werden können,
dies als das wichtigste Problem bezeichnen, zu beweisen,
dass dieselben untereinander widerspruchslos sind, d.h.,
dass man aufgrund derselben mittelst einer endlichen An-
zahl von logischen Schlüssen niemals zu Resultaten gelan-
gen kann, die miteinander in Widerspruch stehen.“ [91]

Konkret handelt es sich um eine Reihe von Axiomen, die nach Giuseppe
Peano benannt sind. Der italienische Mathematiker hatte sie im Jahr
1889 in einer Arbeit mit dem Titel Arithmetices principia publiziert,
die rückblickend zu seinen wichtigsten Werken zählt [142]. Die Arbeit
ist in lateinisch geschrieben und wurde erst später unter dem Titel The
principles of arithmetic in das Englische übersetzt [143].

Wenn wir heute von den Peano-Axiomen reden, so sind die fünf Axio-
me 1, 6, 7, 8 und 9 aus Abbildung 1.30 gemeint. Sie drücken jene fünf
Eigenschaften aus, über die sich die Ordnungsstruktur der natürlichen
Zahlen eindeutig charakterisieren lässt.3 In Abschnitt 3.1 werden wir
die Axiome in einer leicht modernisierten Form wieder aufgreifen und
in die moderne Prädikatenlogik übersetzen.

Der von Hilbert eingeforderte Widerspruchsfreiheitsbeweis für die


arithmetischen Axiome ist von tragender Bedeutung für die gesamte
Mathematik, da nahezu alle ihre Teilbereiche auf der Theorie der Zah-
len aufbauen. Solange die Widerspruchsfreiheit nicht garantiert werden
kann, besteht die Möglichkeit, dass sich sowohl die Gleichung 1 + 1 = 2
als auch die Gleichung 1 + 1 = 2 aus den Axiomen ableiten lässt. Die
Auswirkungen wären von fatalem Ausmaß für alle Bereiche der Mathe-
matik.

Hilbert war fest davon überzeugt, dass sich die Widerspruchsfreiheit


axiomatischer Systeme beweisen lässt, und seine Anfangserfolge schie-
nen ihm Recht zu geben. Im Rahmen seiner Neuformulierung der Geo-
metrie konstruierte er einen speziellen Zahlenbereich derart, dass jede
beweisbare Beziehung zwischen den geometrischen Objekten einer be-
weisbaren Beziehung zwischen den Elementen dieses Zahlenbereichs
entspricht und umgekehrt. Folgerichtig würde jeder Widerspruch, der
sich aus den geometrischen Axiomen ergibt, als Widerspruch in der
Arithmetik sichtbar werden. Mit anderen Worten: Vertrauen wir der
3 Dass Peano die natürlichen Zahlen mit der 1 beginnen ließ und nicht, wie heute üblich

mit der 0, spielt nur eine untergeordnete Rolle, schließlich haben wir in Abschnitt 1.2.2
gezeigt, dass sich die Mengen {0, 1, 2, . . .} und {1, 2, 3, . . .} bijektiv aufeinander abbilden
lassen.
1.2 Der Weg zur modernen Mathematik 35

Giuseppe Peano (1858 – 1932)

Abbildung 1.30: Auszug aus der über-


setzten Originalarbeit von 1889, in der
Giuseppe Peano die erste formale Axio-
matisierung der natürlichen Zahlen publi-
zierte. Das nach links geöffnete C verwen-
dete Peano für die logische Implikation.
Später wurde es als ⊃ geschrieben und
entspricht dem heute gebräuchlichen Im-
plikationsoperator →.

Arithmetik, so folgt daraus die Widerspruchsfreiheit der geometrischen


Axiome.

Was Hilbert vollbrachte, war ein relativer Widerspruchsbeweis. Er hat-


te die Widerspruchsfreiheit der Geometrie erfolgreich auf die Wider-
spruchsfreiheit der Arithmetik reduziert. Für die Arithmetik selbst for-
derte Hilbert dagegen einen absoluten Beweis, der ohne die Annahme
der Widerspruchsfreiheit eines anderen Systems auskommt. Ganz im
Sinne des Henne-Ei-Problems würde jeder relative Beweis die Frage
nach der Widerspruchsfreiheit lediglich auf ein anderes Axiomensy-
stem verschieben. Im Augenblick seiner Rede stand für Hilbert außer
Zweifel, dass ein absoluter Widerspruchsfreiheitsbeweis für die Arith-
metik existiert. Noch war es für ihn lediglich eine Frage der Zeit, bis er
gefunden werden würde.

An zehnter Stelle forderte Hilbert dazu auf, ein Lösungsverfahren für


diophantische Gleichungen zu erarbeiten (Abbildung 1.31).
36 1 Historische Notizen

x2 + y2  z2 = 0 „Eine diophantische Gleichung mit irgend welchen Unbe-


kannten und mit ganzen rationalen Zahlenkoeffizienten sei
vorgelegt: man soll ein Verfahren angeben, nach welchem
sich mittelst einer endlichen Anzahl von Operationen ent-
scheiden lässt, ob die Gleichung in ganzen rationalen Zah-
len lösbar ist.“ [91]

Wie in Abschnitt 1.2.1 dargelegt, hat eine diophantische Gleichung die


Form
p(x1 , x2 , . . . , xn ) = 0
wobei p ein multivariables Polynom mit ganzzahligen Koeffizienten ist.
Unlösbar Lösbar
Die Lösung einer diophantischen Gleichung ist die Menge der ganzzah-
ligen Nullstellen von p. Was Hilbert damals als Verfahren bezeichnete,
Abbildung 1.31: An zehnter Stelle seiner würden wir heute Algorithmus nennen. Zum Zeitpunkt seiner Rede war
Jahrhundertrede forderte Hilbert dazu auf, der Computer noch in weiter Ferne, und es herrschte nur eine vage Vor-
ein Verfahren zu erarbeiten, mit dem sich stellung davon, was unter einem Verfahren im Hilbert’schen Sinne ge-
die Lösbarkeit einer vorgelegten diophanti- nau zu verstehen sei. In der Tat sollten noch mehr als 30 Jahre vergehen,
sche Gleichungen entscheiden lässt. bis der Berechenbarkeitsbegriff durch Alan Turing und Alonzo Church
in eine mathematisch präzise Form gebracht werden konnte. In Kapi-
tel 5 werden wir im Detail auf die Berechenbarkeitstheorie zu sprechen
kommen und zeigen, warum jeder Versuch, das von Hilbert eingefor-
derte Verfahren zu konstruieren, von Grund auf zum Scheitern verurteilt
ist.

1.2.5 Grundlagenkrise

Das neue Jahrhundert war noch jung, als Gottlob Frege im Juni 1902
einen Brief des britischen Mathematikers und Philosophen Bertrand
Russell erhielt (Abbildung 1.32). Was Frege las, sollte nicht nur seine
eigene Arbeit im Mark erschüttern, sondern die gesamte Mathematik
in die größte Krise ihrer mehrere tausend Jahre alten Geschichte stür-
zen. Frege erreichte der Brief just zu der Zeit, als er den zweiten Band
der Grundgesetze der Arithmetik fertigstellte. Viele Jahre seines Le-
bens hatte er auf diese Arbeit verwendet und sah sie auf einen Schlag in
Trümmern liegen. Für größere Änderungen war es ohnehin zu spät, und
so schließt der zweite Band mit dem folgenden Nachwort [57, 60]:

„Einem wissenschaftlichen Schriftsteller kann kaum etwas


Unerwünschteres begegnen, als dass ihm nach Vollendung
einer Arbeit eine der Grundlagen seines Baues erschüttert
wird. In diese Lage wurde ich durch einen Brief des Herrn
1.2 Der Weg zur modernen Mathematik 37

ai 2 Feb Bertrand Arthur William Russell keit, in Cambridge ohne Lehrverpflichtungen zu forschen,
18 M
1872 1970
war der Enkel des zweimaligen und wurde 1908 in die Royal Society aufgenommen.
britischen Premierministers Lord Eine einschneidende Veränderung erfuhr sein Leben durch
John Russell und wurde am 18. den ersten Weltkrieg. Im Jahr 1916 wurde er aufgrund wie-
Mai 1872 als drittes Kind einer liberalen Aristokratenfamilie derholter pazifistischer Aktivitäten zu einer Geldstrafe ver-
geboren. Als er 2 Jahre alt war, fielen Mutter und Schwester urteilt und seiner Anstellung am Trinity College entho-
der Diphtherie zum Opfer. Als er 1876 auch noch seinen Va- ben [77]. Zwei Jahre später wurde ihm erneut der Prozess
ter verlor, erstritten seine Großeltern das Sorgerecht. Zwei gemacht und eine zweijährige Gefängnisstrafe auferlegt.
Jahre später verstarb sein Großvater, und seine Großmutter In der Folgezeit verfasste er eine Vielzahl bedeutender Wer-
übernahm allein die Erziehung. Schon in frühen Jahren wur- ke über philosophische und gesellschaftliche Themen und
de Russells einzigartige Begabung für Mathematik und Phi- wurde im Jahr 1950 mit dem Literaturnobelpreis geehrt.
losophie sichtbar. Zunächst wurde er privat und später am Durch seine literarische Arbeit gelangte er zu Weltruhm,
renommierten Trinity College in Cambridge unterrichtet. und etliche Menschen verbinden seinen Namen heute aus-
In den Jahren 1890 bis 1894 widmete er sich dem Studium schließlich mit seinem philosophischen Werk. Viele wissen
der Mathematik und lernte in dieser Zeit seinen Lehrer und nicht, dass sich hinter dem berühmten Philosophen Bertrand
späteren Freund Alfred North Whitehead kennen. Nach sei- Russell zugleich einer der größten Mathematiker des zwan-
nem Studium nutzte er bis 1901 die ihm gebotene Möglich- zigsten Jahrhunderts verbirgt.

Bertrand Russell versetzt, als der Druck dieses Bandes sich


seinem Ende näherte.“

Was konnte Freges Arbeit so grundlegend erschüttern, dass er sein ge-


samtes Lebenswerk gefährdet sah? Die Antwort ist in der Propositi-
on V, seinem fünften Grundgesetz, verborgen. Aus diesem Gesetz lässt
sich das allgemeine Komprehensionsaxiom ableiten, das in moderner
Schreibweise so lautet:

∃ y ∀ x ((x ∈ y) ↔ ϕ(x))

Hierin ist ϕ eine frei wählbare Formel, in der die Variable y nicht vor-
kommt. In Worten liest sich das allgemeine Komprehensionsaxiom wie
folgt: Es existiert eine Menge y, die genau diejenigen Elemente x ent-
hält, auf die die Eigenschaft ϕ zutrifft. Beschreibt ϕ beispielsweise die
Eigenschaft, eine Primzahl zu sein, so sichert uns das Komprehensions-
axiom zu, von der Menge aller Primzahlen reden zu dürfen. Das Axiom
Bertrand Russell
wird häufig auch als Separationsaxiom bezeichnet, da die Bedingung (1872 – 1970)
ϕ diejenigen Elemente, die in y enthalten sind, von jenen separiert, die
nicht in y enthalten sind. Abbildung 1.32: Dem britischen Mathe-
matiker und Philosophen Bertrand Russell
Es ist ein entscheidendes Merkmal der Frege’schen Logik, dass die For- gelang es, die Logik der naiven Mengenleh-
mel ϕ keinerlei Einschränkungen unterliegt. Russell erkannte die Ge- re als widersprüchlich zu entlarven. Seine
fahr dieser Freiheit und traf die folgende Wahl: Entdeckung stürzte die Mathematik in die
größte Krise ihrer mehrere tausend Jahre al-
ϕ(x) := (x ∈ x) ten Geschichte.
38 1 Historische Notizen

BARBIER -PARADOXON Die Formel beschreibt eine harmlos erscheinende Eigenschaft: Sie trifft
auf alle Mengen x zu, die sich nicht selbst als Element enthalten. ϕ ist
„You can define the barber as ’one who
für die meisten Mengen wahr. So ist die Menge aller Menschen selbst
shaves all those, and those only, who do
not shave themselves’. The question is, kein Mensch und auch die Menge aller Primzahlen selbst keine Prim-
does the barber shave himself?“ [170] zahl. Dagegen ist ϕ für die Menge aller Mengen falsch. Da sie selbst
eine Menge ist, enthält sie sich auch selbst als Element.
Fall 1: Der Barbier
rasiert sich selbst. Mit der getätigten Wahl von ϕ garantiert uns das Komprehensionsaxiom
Hieraus folgt... die Existenz einer Menge y mit der folgenden Eigenschaft:

∀ x ((x ∈ y) ↔ (x ∈ x))

In Worten: Die Menge y ist die Menge aller Mengen, die sich nicht
selbst als Element enthalten. Jetzt können wir über die sogenannte In-
stanziierungsregel den Allquantor eliminieren, indem wir x durch ein
beliebiges Element ersetzen. Wählen wir für x die besagte Menge y, so
erhalten wir den Widerspruch, dass sich die Menge y genau dann selbst
enthält, wenn sie sich nicht selbst enthält:

(y ∈ y) ↔ (y ∈ y)

Sowohl in der Frege’schen Logik als auch in der Cantor’schen Men-


Fall 2: Der Barbier genlehre ist das allgemeine Komprehensionsaxiom eine tragende Säu-

X
rasiert sich nicht selbst. le. Durch ihr Wegbrechen stand die neue Mathematik mit einem Schlag
Hieraus folgt... auf wackligen Füßen.

Die Russell’sche Antinomie macht deutlich, dass sowohl Frege als auch
Cantor im Umgang mit dem aktual Unendlichen zu unvorsichtig waren.
Abbildung 1.33: Der besagte Barbier ra- So harmlos das allgemeine Komprehensionsaxiom auch wirken mag –
siert genau diejenigen Männer, die sich es lässt uns Mengen konstruieren, die wir nicht als abgeschlossenes
nicht selbst rasieren. Die Frage, ob sich der Ganzes ansehen dürfen. Betrachten wir die Menge aller Mengen, die
Barbier selbst rasiert oder nicht, führt zu sich nicht selbst als Element enthalten, tatsächlich als aktual existent,
demselben Zirkelschluss, der auch der Rus-
so sind die entstehenden Widersprüche unausweichlich.
sell’schen Antinomie zugrunde liegt.
Heute wird der Zirkelschluss der Russell’sche Antinomie gern am Bei-
spiel des Barbier-Paradoxons erklärt (Abbildung 1.33). Russell selbst
griff auf dieses Paradoxon zurück, um seine Antinomie mit Begriffen
des Alltags einem größeren Leserkreis nahe zu bringen.
Der hohe Bekanntheitsgrad der Russell’schen Antinomie täuscht häufig
darüber hinweg, dass der Mengenbegriff schon vorher für Ungereimt-
heiten gesorgt hatte. So bemerkte Cantor im Jahr 1897, dass die Men-
ge aller Kardinalzahlen ihre eigene Kardinalzahl nicht umfassen kann.
Zwei Jahre später stieß er auf das Burali-Forti-Paradoxon, auf das wir
in Abschnitt 3.2.2 zurückkommen werden. Benannt ist es nach dem ita-
lienischen Mathematiker Cesare Burali-Forti, der schon 1897 entdeckt
1.2 Der Weg zur modernen Mathematik 39

hatte, dass die Definition der Menge aller Ordinalzahlen zu Widersprü-


chen führt.

Cantor hat die Entdeckung der Antinomien niemals publiziert, und wir
wissen von seinen Erkenntnissen ausschließlich aus Briefwechseln mit
Hilbert und Dedekind. Auch sie hielten die Antinomien wohl eher für
Kuriositäten, die aus dem unzulässigen, weil informellen Gebrauch ver-
schiedener Begriffe herrührten.

Die Russell’sche Antinomie war anders. Zum einen war sie so elemen-
tar, dass alle Bereiche der Mathematik betroffen waren, die in irgendei-
ner Form auf den Begriff der Menge zurückgriffen. Zum anderen hatte
Russell nicht nur gezeigt, dass die Menge aller Mengen, die sich nicht
selbst enthalten, zu Widersprüchen führt, sondern auch, dass diese Men-
ge innerhalb der Logik formal konstruiert werden kann. Anders als die
Antinomien der Ordinal- oder Kardinalzahltheorien, die als kuriose Be-
gleiterscheinungen am Rande eines ansonsten intakten mathematisch-
en Kerns gewertet wurden, ließ sich die Russell’sche Antinomie nicht
ignorieren. Was Russell entdeckte, war eine tektonische Verwerfung rie-
sigen Ausmaßes, mitten im Herzen der Mathematik.

Frege empfand die Entdeckung der Antinomie als schweren Schlag, der
sein Lebenswerk wie eine Seifenblase zerplatzen ließ. Als zwei Jahre
später seine Frau Margarete verstarb, verfiel er in eine tiefe Depression,
von der er sich zeitlebens nicht mehr erholen sollte.

Bertrand Russell teilte den Frege’schen Pessimismus nicht. Er erkann-


te, dass die entdeckten Antinomien durch die Konstruktion von Mengen
entstehen, die „zu groß“ sind, um als abgeschlossenes Ganzes einen
Sinn zu ergeben. Nach Russells Ansicht musste es durch die geschick-
te Abwandlung der zugrunde gelegten Axiome möglich sein, genügend
Kontrolle über den Mengenbegriff zu erlangen, um die Mathematik von
ihren Widersprüchen zu befreien. Zusammen mit dem britischen Ma-
thematiker Alfred North Whitehead versuchte er, Freges Traum doch
noch zu verwirklichen. Es war der zweite Anlauf, ein widerspruchs-
freies Fundament zu errichten, auf dem die Mathematik für alle Zeiten
einen sicheren Halt finden sollte.

Nach zehn Jahren intensiver Arbeit war das Ergebnis greifbar: Die Prin-
cipia Mathematica, erschienen in den Jahren 1910 bis 1913, waren fer-
tiggestellt (Abbildung 1.34). Russell und Whitehead schufen ein mo-
numentales Werk, das in Umfang und Tiefe weit über die Frege’sche
Arbeit hinausgeht. Auf über 1800 Seiten, verteilt auf 3 Bände, unter-
nahmen die Autoren den Versuch, alle mathematischen Erkenntnisse
aus einer kleinen Menge von Axiomen systematisch herzuleiten. Auch
40 1 Historische Notizen

Abbildung 1.34: Principia Mathematica. I Drei Formeln der Principia . . .


Dieses monumentale Werk von Russell
und Whitehead ist für uns nicht leicht zu
lesen, da sich die Notation von der heu-
te gebräuchlichen unterscheidet und in ei-
nigen Aspekten unglücklich gewählt wur-
de. So besitzt der Punkt in der Principia
eine Doppelbedeutung. In Abhängigkeit
I und deren moderne Schreibweise
von seiner Position wird er für die kon-
junktive Verknüpfung oder zum Klam-
(2.03)  (p → ¬q) → (q → ¬p)
mern von Teilausdrücken verwendet. Die
(2.15)  (¬p → q) → (¬q → p)
Abbildung zeigt drei Formeln aus der Ori-
ginalausgabe der Principia Mathematica (2.16)  (p → q) → (¬q → ¬p)
sowie deren Übersetzung in die heute üb- (2.17)  (¬q → ¬p) → (p → q)
liche Schreibweise.

heute noch zählen die Principia Mathematica zu den berühmtesten ma-


thematischen Werken unserer Geschichte.

An Russells und Whiteheads monumentalem Werk werden sowohl die


Vor- als auch die Nachteile einer vollständig formalisierten Mathematik
sichtbar. Zum einen machen die Principia deutlich, dass sich nahezu al-
le Bereiche der gewöhnlichen Mathematik mit einer Präzision erfassen
lassen, die in keiner anderen Wissenschaft vorhanden ist. Alle Bewei-
se sind bis ins Detail ausgearbeitet und werden durch die Anwendung
fest definierter Schlussregeln aus den Axiomen hergeleitet. Auf der an-
deren Seite fordert die erreichte Präzision ihren Tribut in einer gewal-
tig anwachsenden Komplexität. In Abbildung 1.35 ist die vielleicht be-
rühmteste Passage der Principia zu sehen. Sie zeigt den Abschluss des
formalen Beweises für die arithmetische Beziehung 1 + 1 = 2.

Vor dem historischen Hintergrund wird deutlich, warum ein großer Teil
der Principia der Typentheorie gewidmet ist. Hierbei handelt es sich
um eine spezielle Form der Mengenlehre, in der sich die Widersprüche
der Frege’schen Logik nicht reproduzieren lassen. Um die Antinomi-
en zu umgehen, verfolgte Russell den Ansatz, Mengen hierarchisch zu
ordnen. Auf der untersten Stufe befinden sich die Typ-1-Mengen, die
lediglich Elemente des Individuenbereichs umfassen. Auf der nächs-
ten Stufe befinden sich die Typ-2-Mengen, die aus Individuenelemen-
ten und Typ-1-Mengen bestehen. Dann folgen die Typ-3-Mengen, die
zusätzlich Typ-2-Mengen enthalten dürfen, und so fort. Da eine Typ-n-
Menge niemals selbst ein Element vom Typ n besitzen darf, kann sich
eine Menge in der Typentheorie der Principia niemals selbst enthal-
ten. Durch die Einführung dieser Mengenhierarchie war es Russell und
1.2 Der Weg zur modernen Mathematik 41

Abbildung 1.35: Formaler Beweis der arithmetischen Beziehung 1 + 1 = 2 im System der Principia Mathematica

Whitehead gelungen, jene Art von Selbstbezug zu vermeiden, die we-


nige Jahre zuvor die Mathematik in ihre tiefste Krise stürzte.

Dennoch hat die Typentheorie die Zeit nicht überdauert, was im We-
sentlichen an zwei Gründen liegt. Zum einen schränkt sie den Begriff
der Menge so stark ein, dass sich etliche als harmlos geltende Mengen
nicht mehr bilden lassen. Zum anderen führt ihre klobige Hierarchie da-
zu, dass viele Beweise im System der Principia deutlich umständlicher
geführt werden müssen als beispielsweise in der Frege’schen Logik.
42 1 Historische Notizen

1.2.6 Axiomatische Mengenlehre

Die moderne Mengenlehre ist durch den formalen axiomatischen Auf-


bau von Ernst Zermelo und Abraham Fraenkel geprägt [54, 223]. Den
Grundstein legte der deutsche Mathematiker Ernst Zermelo 1907 (Ab-
bildung 1.36). Seine Mengenlehre bestand aus insgesamt 7 Axiomen,
die zu dieser Zeit noch umgangssprachlich formuliert waren [223] (Ab-
bildung 1.37). Erst im Jahr 1929 wurde sie von Thoralf Skolem in der
Prädikatenlogik formal niedergeschrieben [181]. Obwohl die Zermelo-
Mengenlehre einen deutlichen Fortschritt gegenüber dem Typensystem
von Russell und Whitehead darstellt, ist sie ebenfalls zu konservativ
ausgelegt. Beispielsweise ist es unmöglich, die (gutartige) Menge aller
n-elementigen Mengen zu bilden, so dass selbst der widerspruchsfreie
Kern der Frege’schen Logik nicht innerhalb der Zermelo-Mengenlehre
nachgebildet werden kann.
In den Folgejahren bewegte sich die Mathematik auf einem schmalen
Grat. Einerseits galt es, die Zermelo-Axiome in einem Maß zu ver-
ändern, dass möglichst alle gutartigen Mengen innerhalb der Logik
dargestellt werden können. Andererseits mussten Antinomien um je-
den Preis ferngehalten werden, so dass die Erweiterung der Axiome
sehr konservativ zu geschehen hatte. Im Zuge dieser Entwicklung wur-
de die Zermelo-Mengenlehre 1922 von Abraham Fraenkel um das Er-
setzungsaxiom und 1930 von Zermelo um das Fundierungsaxiom er-
gänzt [54, 224] (Abbildung 1.37). Dafür ließ Zermelo in seiner Fassung
von 1930 das Unendlichkeitsaxiom „als nicht zur allgemeinen Men-
genlehre gehörig“ vorübergehend wegfallen, und auch das Auswahlaxi-
om war nicht mehr enthalten. Heute setzt sich die Zermelo-Fraenkel-
Mengenlehre, kurz ZF, aus den folgenden 9 Axiomen zusammen:

I Axiom der Bestimmtheit (Zermelo, 1908)


I Axiom der leeren Menge (Zermelo, 1908)
I Axiom der Paarung (Zermelo, 1908)
I Axiom der Vereinigung (Zermelo, 1908)
I Axiom der Aussonderung (Zermelo, 1908)
Ernst Friedrich Ferdinand Zermelo
I Axiom des Unendlichen (Zermelo, 1908)
(1871 – 1953) [99]
I Axiom der Potenzmenge (Zermelo, 1908)
Abbildung 1.36: Mit 7 umgangssprachlich
formulierten Axiomen legte der deutsche I Axiom der Ersetzung (Fraenkel, 1922)
Mathematiker Ernst Zermelo den Grund-
stein der axiomatischen Mengenlehre. I Axiom der Fundierung (Zermelo, 1930)
1.2 Der Weg zur modernen Mathematik 43

I Axiom I (Axiom der Bestimmtheit) I Axiom der Bestimmtheit (B)


„Ist jedes Element einer Menge M gleichzeitig Element „Jede Menge ist durch ihre Elemente bestimmt, sofern
von N und umgekehrt, ist also gleichzeitig M ⊂ N und sie überhaupt Elemente besitzt.“
N ⊂ M, so ist immer M = N. Oder kürzer: Jede Menge I Axiom der Aussonderung (A)
ist durch ihre Elemente bestimmt.“
„Durch jede Satzfunktion f(x) wird aus jeder Menge
I Axiom II (Axiom der Elementarmenge) m eine Untermenge mf ausgesondert, welche alle Ele-
„Es gibt eine (uneigentliche) Menge, die ‚Nullmenge‘ mente x umfasst, für die f(x) wahr ist. Oder: Jedem Teil
0,
/ welche gar keine Elemente enthält. Ist a irgend ein einer Menge entspricht selbst eine Menge, welche alle
Ding des Bereichs, so existiert eine Menge {a}, wel- Elemente dieses Teils enthält.“
che a und nur a als Element enthält; sind a, b irgend I Axiom der Paarung (P)
zwei Dinge des Bereichs, so existiert immer eine Men-
„Sind a, b irgend zwei Elemente, so gibt es eine Menge,
ge {a, b}, welche sowohl a als [auch] b, aber kein von
welche beide als Element enthält.“
beiden verschiedenes Ding x als Element enthält. “
I Axiom der Potenzmenge (U)
I Axiom III (Axiom der Aussonderung)
„Jeder Menge m entspricht eine Menge Um, welche alle
„Ist die Klassenaussage Φ(x) definit für alle Elemen-
Untermengen von m als Elemente enthält, einschließ-
te einer Menge M, so besitzt M immer eine Untermen-
lich der Nullmenge und m selbst. An die Stelle der
ge MΦ , welche alle diejenigen Elemente x von M, für
‚Nullmenge‘ tritt hier ein beliebig ausgewähltes ‚Ur-
welche Φ(x) wahr ist, und nur solche als Elemente ent-
element‘ u0 .“
hält.“
I Axiom der Vereinigung (V)
I Axiom IV (Axiom der Potenzmenge)
„Jeder Menge m entspricht eine Menge Sm, welche die
„Jeder Menge T entspricht eine zweite Menge U (die
Elemente ihrer Elemente enthält.“
‚Potenzmenge‘ von T ), welche alle Untermengen von
T und nur solche als Elemente enthält.“ I Axiom der Ersetzung (E)

I Axiom V (Axiom der Vereinigung) „Ersetzt man die Elemente x einer Menge m eindeutig
durch beliebige Elemente x des Bereiches, so enthält
„Jeder Menge T entspricht eine Menge ST (die ‚Verei-
dieser auch eine Menge m , welche alle diese x zu Ele-
nigungsmenge‘ von T ), welche alle Elemente der Ele-
menten hat.“
mente von T und nur solche als Elemente enthält.“
I Axiom der Fundierung (F)
I Axiom VI (Axiom der Auswahl)
„Jede (rückschreitende) Kette von Elementen, in wel-
„Ist T eine Menge, deren sämtliche Elemente von 0/
cher jedes Glied Element des vorangehenden ist, bricht
verschiedene Mengen und untereinander elementfremd
mit endlichem Index ab bei einem Urelement. Oder, was
sind, so enthält ihre Vereinigung ∪T mindestens eine
gleichbedeutend ist: Jeder Teilbereich T enthält wenig-
Untermenge S1 , welche mit jedem Element von T ein
stens ein Element t0 , das kein Element t in T hat.“
und nur ein Element gemein hat.“
I Optional: Axiom der Auswahl (AC)
I Axiom VII (Axiom des Unendlichen)
„Ist T eine Menge, deren sämtliche Elemente von 0/
„Der Bereich enthält mindestens eine Menge Z, welche
verschiedene Mengen und untereinander elementfremd
die Nullmenge als Element enthält und so beschaffen
sind, so enthält ihre Vereinigung ∪T mindestens eine
ist, dass jedem ihrer Elemente a ein weiteres Element
Untermenge S1 , welche mit jedem Element von T ein
der Form {a} entspricht, oder welche mit jedem ihrer
und nur ein Element gemein hat.“
Elemente a auch die entsprechende Menge {a} als Ele-
ment enthält.“

Abbildung 1.37: Links: Zermelo-Mengenlehre in der Formulierung von Ernst Zermelo aus dem Jahr 1908 [223]. Rechts:
Zermelo-Fraenkel-Mengenlehre in der Formulierung von Ernst Zermelo aus dem Jahr 1930 [224]
44 1 Historische Notizen

Wird das System zusätzlich um das Auswahlaxiom (axiom of choice) er-


weitert, so sprechen wir von der ZFC-Mengenlehre (Zermelo-Fraenkel
with Choice).

In Abschnitt 3.2 werden wir uns ausführlich mit der Zermelo-Fraenkel-


Mengenlehre befassen. Dort werden wir die Bedeutung der einzelnen
Axiome im Detail besprechen und zeigen, wie sich die umgangssprach-
lichen Formulierungen mithilfe der Prädikatenlogik formal ausdrücken
lassen.

Die Zermelo-Fraenkel-Mengenlehre ist zum Rückgrat der modernen


Mathematik geworden. Zum einen wurde mit ihr ein logisches Fun-
dament geschaffen, das stark genug ist, um alle Begriffe und Konzep-
te der gewöhnlichen Mathematik zu formalisieren. Zum anderen ist es
bis zum heutigen Tag niemand gelungen, einen Widerspruch innerhalb
von ZF oder ZFC herzuleiten. Aber können wir daraus schließen, dass
die Zermelo-Fraenkel-Mengenlehre tatsächlich frei von Widersprüchen
ist? Können wir auf ihr wirklich die Mathematik errichten, ohne Ge-
fahr zu laufen, dass unser Gedankengerüst eines Tages einstürzen wird
wie das Frege’sche Kartenhaus um die Jahrhundertwende? Mit letzter
Sicherheit wissen wir es nicht, und in Abschnitt 4.3 werden wir zu der
erstaunlichen Erkenntnis gelangen, dass wir es niemals wissen werden.

1.2.7 Hilberts Programm und Gödels Beitrag

Durch die zunehmende Beschäftigung mit den verschiedensten forma-


len Systemen entstand im Laufe der Zeit eine Meta-Mathematik, die
sich nicht mit der Ableitung von Sätzen innerhalb des Systems beschäf-
tigt, sondern mit Sätzen, die Aussagen über das System treffen. In das
Zentrum des Interesses rückten vor allem drei Fragestellungen vor:

I Vollständigkeit
Ein formales System heißt vollständig, wenn jede wahre Aussage,
die in der betrachteten Logik formuliert werden kann, innerhalb des
Systems beweisbar ist. Mit anderen Worten: Für jede wahre Aussage
ϕ muss es eine endliche Kette von Regelanwendungen geben, die
ϕ aus den Axiomen deduziert. Beachten Sie, dass ein vollständiges
formales System nicht preisgeben muss, wie eine solche Kette zu
finden ist. Die Vollständigkeit garantiert lediglich deren Existenz.
I Widerspruchsfreiheit
Ein formales System heißt widerspruchsfrei, wenn für eine Aussa-
ge ϕ niemals gleichzeitig ϕ und die Negation von ϕ (geschrieben
1.2 Der Weg zur modernen Mathematik 45

als ¬ϕ) abgeleitet werden kann. Erfüllt ein formales System diese Der Intuitionismus war ne-
Eigenschaft nicht, so könnte es kaum wertloser sein. Es würde uns ben dem Logizismus und
gestatten, jede beliebige Aussage zu beweisen. dem Formalismus die dritte
philosophische Strömung in
I Entscheidbarkeit der Mathematik des zwanzigsten Jahrhun-
derts. Er wurde im Jahr 1907 von dem nie-
Ein formales System heißt entscheidbar, wenn ein systematisches derländischen Mathematiker Luitzen Eg-
Verfahren existiert, mit dem für jede Aussage entschieden werden bertus Jan Brouwer begründet und fand in
kann, ob sie innerhalb des Kalküls beweisbar ist. Hinter der Eigen- Arend Heyting, Stephen Kleene, und Mi-
schaft der Entscheidbarkeit verbirgt sich nichts Geringeres als der chael Dummett prominente Fürsprecher.
Wunsch nach einer mechanisierten Mathematik. Wäre z. B. die Zah- Nach Brouwer baut die Mathematik auf
lentheorie vollständig und entscheidbar, so ließe sich für jede wah- intuitiv einsichtigen Begriffen auf, die
re zahlentheoretische Aussage auf maschinellem Wege ein Beweis keiner Definition bedürfen. Beispiele sind
konstruieren. Der Traum vieler Mathematiker würde wahr. die natürlichen Zahlen oder die kontinu-
ierlich verstreichende Zeit. Als existent
akzeptierte er ausschließlich Objekte, die
Hilbert war überzeugt, dass eine vollständige, widerspruchsfreie und sich gedanklich konstruieren lassen.
entscheidbare Axiomatisierung der Mathematik gefunden werden kann. Brouwer setzte die Wahrheit einer Aus-
sage mit deren Beweisbarkeit gleich. Das
Seine Bemühungen, die mathematische Methode mit einem sicheren
bedeutet, dass beispielsweise eine Aussa-
Fundament zu versehen, konkretisierte er in den zwanziger Jahren. Hil- ge der Form ϕ ∨ ψ nur dann als wahr an-
bert hatte im Sinn, die gewöhnliche Mathematik in ein formales Sys- gesehen wird, wenn ein Beweis für ϕ oder
tem zu überführen, das alle gebräuchlichen Beweismethoden umfasst. ein Beweis für ψ konstruiert werden kann.
Von innen betrachtet wäre dieses System eine formale Variante der ge- Damit ist die Aussage ϕ ∨ ¬ϕ in der in-
wöhnlichen Mathematik. Von außen betrachtet erschiene es als eine An- tuitionistischen Logik nicht allgemeingül-
sammlung von Axiomen und Schlussregeln. Gelänge es sicherzustellen, tig; sie ist nur dann wahr, wenn es gelingt,
dass durch die Anwendung der Schlussregeln keine Widersprüche aus einen Beweis für ϕ oder einen Beweis für
den Axiomen abgeleitet werden können, so wäre die Korrektheit aller ¬ϕ zu entwickeln. Altbewährte Grundan-
innerhalb des Systems verankerten Beweismethoden gesichert. nahmen wie der Satz vom ausgeschlosse-
nen Dritten (Tertium non datur) und der
Zugegebenermaßen wäre wenig gewonnen, wenn der Beweis der Wi- daraus resultierende Beweis durch Wider-
derspruchsfreiheit mit den gleichen umstrittenen Beweismethoden ge- spruch verlieren hierdurch ihre Gültigkeit.
führt würde, die im Inneren des Systems vorhanden sind. Hilbert hat- In [89] äußerte sich Hilbert wie folgt über
te im Sinn, die Widerspruchsfreiheit der Mathematik ausschließlich die intuitionistische Strömung:
mit finiten Mitteln zu führen. Grob gesprochen fasste dieser Begriff „Das Tertium non datur dem Mathemati-
ker zu nehmen, wäre etwa, wie wenn man
all jene Beweismittel zusammen, deren Korrektheit außer Frage stand.
dem Astronomen das Fernrohr oder dem
Ausgeschlossen waren Beweismethoden, die den Begriff des Unend-
Boxer den Gebrauch der Fäuste untersa-
lichen strapazieren. Ebenfalls ausgeschlossen waren nichtkonstruktive gen wollte.“
Schlussweisen wie der indirekte Beweis (reductio ad absurdum), der Heute spielt der Intuitionismus fast nur
auf dem Satz vom ausgeschlossenen Dritten beruht (tertium non datur). noch im Bereich der mathematischen Phi-
Der Ausschluss dieser Methoden war ein Tribut an den Intuitionismus, losophie eine Rolle. Aus der Schulmathe-
eine philosophische Strömung in der Mathematik, die zu Beginn des matik wurde die intuitionistische Denk-
zwanzigsten Jahrhunderts zunehmend an Popularität gewann und eine weise gegen Ende des zwanzigsten Jahr-
konstruktive Mathematik einforderte. hunderts nahezu vollständig verdrängt, als
die Auseinandersetzung mit philosophi-
Würde Hilberts Vorhaben gelingen, so wäre ein für alle Mal geklärt, schen Fragestellungen allmählich zu ver-
dass das Fundament, auf dem wir die moderne Mathematik errichtet blassen begann.
46 1 Historische Notizen

haben, ein sicheres ist. Vor einem tektonischen Beben, wie es Jahre zu-
vor die Frege’sche Logik ereilte, bräuchten wir uns dann nicht mehr
zu fürchten. Nebenbei hätte Hilbert auch auf einem anderen Schauplatz
einen Kantersieg errungen. Dem Intuitionismus, den Hilbert zeitlebens
zu bekämpfen versuchte, käme das Gelingen des Programms einem fi-
nalen Dolchstoß gleich.

Zu Beginn verlief das Programm wie geplant. Zunächst gelang es zwei


von Hilberts Schülern, Wilhelm Ackermann und John von Neumann,
einen finiten Beweis der Widerspruchsfreiheit für eine abgeschwächte
Variante der Peano-Arithmetik zu finden. Noch schien es nur eine Fra-
ge der Zeit zu sein, bis die technischen Probleme überwunden und der
Beweis auf die gesamte Peano-Arithmetik übertragen werden könnte.
Die Hoffnung auf ein schnelles Gelingen erfüllte sich nicht; stattdes-
sen folgte ein gescheiterter Versuch dem nächsten. Es schien, als sei
die Peano-Arithmetik von einer unsichtbaren Wand umgeben, die alle
Beweisversuche von sich abprallen ließ.
Im Jahr 1929 wurden Hilberts Hoffnungen durch die Arbeiten des jun-
gen Mathematikers Kurt Gödel zusätzlich genährt, als dieser in seiner
Promotionsschrift die Vollständigkeit des engeren Funktionenkalküls4
bewies (Abbildung 1.38) [67]. Es war also möglich, ein formales Sys-
tem zu konstruieren, in dem sich jede allgemeingültige prädikatenlogi-
sche Formel erster Stufe in endlich vielen Schritten aus den Axiomen
ableiten lässt. Damit hatte Gödel bewiesen, dass der logische Schluss-
apparat stark genug war, um als Grundlage für die Verwirklichung des
Hilbert’schen Programms zu dienen. In diesen Tagen glaubte man das
Programm auf einem guten Weg, und es schien nur eine Frage der Zeit
zu sein, bis aus Hilberts Vision Wirklichkeit werden würde.

1930 war das Jahr, in dem die Entwicklung eine abrupte Kehrtwende
nehmen sollte. Am 8. September bekräftigte Hilbert vor der Versamm-
lung Deutscher Naturforscher und Ärzte in seiner Heimatstadt Königs-
berg seine tiefe Überzeugung, dass es in der Wissenschaft keine unlös-
baren Probleme gebe. Ein Auszug aus seiner Rede wurde als Radioan-
sprache ausgestrahlt (Abbildung 1.39).

Zum Zeitpunkt seiner Rede wusste Hilbert noch nichts von den Ereig-
(1906 – 1978) nissen, die sich am Vortag an anderer Stelle in Königsberg abspielten.
Es war die Tagung der exakten Erkenntnislehre, die die Mathematik
Abbildung 1.38: Kurt Gödel ging als ei- für immer verändern sollte. Abgehalten wurde die dreitägige Konfe-
ner der größten Logiker aller Zeiten in die renz von 5. bis zum 7. September 1930 von der Berliner Gesellschaft
Geschichte ein. Seine bahnbrechenden Ent-
deckungen haben dazu geführt, dass wir un- 4 DerBegriff des engeren Funktionenkalküls wurde durch die Hilbert’sche Schule ge-
ser Verständnis der mathematischen Metho- prägt und beschreibt im Wesentlichen das, was wir heute als Prädikatenlogik erster Stufe
de von Grund auf überdenken mussten. bezeichnen.
1.2 Der Weg zur modernen Mathematik 47

„Das Instrument, welches die Trotzdem haben es alle Mathematiker abgelehnt, die An-
Vermittlung bewirkt zwischen wendungen als Wertmesser für die Mathematik gelten zu
Theorie und Praxis, zwischen lassen. Gauß spricht von dem zauberischen Reiz, den die
Denken und Beobachten, ist Zahlentheorie zur Lieblingswissenschaft der ersten Mathe-
die Mathematik; sie baut die matiker gemacht habe, ihres unerschöpflichen Reichtums
verbindende Brücke und ge- nicht zu gedenken, woran sie alle anderen Teile der Ma-
staltet sie immer tragfähiger. thematik so weit übertrifft. Kronecker vergleicht die Zah-
Daher kommt es, dass unsere ganze gegenwärtige Kultur, lentheoretiker mit den Lotophagen, die, wenn sie einmal
soweit sie auf der geistigen Durchdringung und Dienstbar- von dieser Kost etwas zu sich genommen haben, nie mehr
machung der Natur beruht, ihre Grundlage in der Mathe- davon lassen können. Der große Mathematiker Poincaré
matik findet. Schon Galilei sagt: ‚Die Natur kann nur der wendet sich einmal in auffallender Schärfe gegen Tolstoi,
verstehen, der ihre Sprache und die Zeichen kennengelernt der erklärt hatte, dass die Forderung ‚die Wissenschaft der
hat, in der sie zu uns redet; diese Sprache aber ist die Ma- Wissenschaft wegen‘ töricht sei. Die Errungenschaften der
thematik, und ihre Zeichen sind die mathematischen Figu- Industrie, zum Beispiel, hätten nie das Licht der Welt er-
ren‘. Kant tat den Ausspruch: ‚Ich behaupte, dass in jeder blickt, wenn die Praktiker allein existiert hätten und wenn
besonderen Naturwissenschaft nur so viel eigentliche Wis- diese Errungenschaften nicht von uninteressierten Toren
senschaft angetroffen werden kann, als darin Mathematik gefördert worden wären. ‚Die Ehre des menschlichen Gei-
enthalten ist‘. In der Tat: Wir beherrschen nicht eher ei- stes‘, so sagte der berühmte Königsberger Mathematiker
ne naturwissenschaftliche Theorie, als bis wir ihren mathe- Jacobi, ‚ist der einzige Zweck aller Wissenschaft‘.
matischen Kern herausgeschält und völlig enthüllt haben. Wir dürfen nicht denen glauben, die heute mit philosophi-
Ohne Mathematik ist die heutige Astronomie und Physik scher Miene und überlegenem Tone den Kulturuntergang
unmöglich; diese Wissenschaften lösen sich in ihren theo- prophezeien und sich in dem Ignorabimus gefallen. Für uns
retischen Teilen geradezu in Mathematik auf. Diese wie die gibt es kein Ignorabimus, und meiner Meinung nach auch
zahlreichen weiteren Anwendungen sind es, denen die Ma- für die Naturwissenschaft überhaupt nicht. Statt des törich-
thematik ihr Ansehen verdankt, soweit sie solches im wei- ten Ignorabimus heiße im Gegenteil unsere Losung: Wir
teren Publikum genießt. müssen wissen, wir werden wissen.“

Abbildung 1.39: Aus der Radioansprache von David Hilbert aus dem Jahr 1930 [90, 159]

für empirische Philosophie. Der erste Tag begann mit mehrstündigen


Vorträgen über die drei philosophischen Hauptströmungen der Mathe-
matik. Der Logizismus wurde von Rudolf Carnap, der Intuitionismus
von Arend Heyting, einem Schüler Brouwers, und der Formalismus von
John von Neumann vertreten. Zu den Rednern des zweiten Tags gehörte
auch Kurt Gödel, der in einem zwanzigminütigen Kurzvortrag über den
in seiner Dissertation erarbeiteten Vollständigkeitsbeweis referierte.

Die Bombe platzte am dritten Tag, als sich Gödel während der abschlie-
ßenden Podiumsdiskussion zu Wort meldete. Zunächst gab er zu beden-
ken, dass die Widerspruchsfreiheit eines formalen Systems, wie das der
Principia Mathematica, nicht garantieren könne, dass alle abgeleiteten
Theoreme wahre Aussagen sind. Selbst wenn die Widerspruchsfreiheit
der Principia bewiesen sei, wäre nicht auszuschließen, dass sich inner-
halb des Systems eine Aussage über die natürlichen Zahlen ableiten lie-
48 1 Historische Notizen

pr 14 Jan Kurt Gödel wurde am 28. April Obwohl sich die Verhältnisse in Wien nach der Machter-
28 A
1906 1978
1906 im österreichisch-ungarisch- greifung Hitlers sukzessive verschärften, war sich Gödel des
en Brünn geboren. Seine Geburts- Ausmaßes der Gefahr nicht bewusst. Erst im Jahr 1940 nutz-
stadt wurde 1918 Teil der neu ge- te er die wahrscheinlich letzte Möglichkeit zur Flucht in die
gründeten Tschechoslowakischen Republik, die er stets als USA. Sein Ziel war das Institute for Advanced Study in Prin-
Exil empfand. Im Alter von 17 Jahren nahm er die österrei- ceton, an dem er zuvor mehrere Gastaufenthalte absolviert
chische Staatsbürgerschaft an und zog ein Jahr später nach hatte. Aufgrund seines speziellen Charakters und seiner aus-
Wien, um das Studium der theoretischen Physik zu begin- geprägten Neigung zur Hypochondrie war Gödel nicht un-
nen. Die legendäre Vorlesung über Zahlentheorie von Phil- umstritten, und es dauerte bis zum Jahr 1953, bis ihn das
ipp Furtwängler lenkte Gödels Interesse aber schon bald auf IAS zum Professor ernannte. Einen treuen Fürsprecher fand
die Grundlagen der Mathematik. er in Albert Einstein, mit dem ihm eine lebenslange Freund-
Gödel war von dem gesellschaftlichen und kulturellen Leben schaft verband.
Wiens angetan. Unter anderem trat er dem Wiener Kreis bei, Gödels geistiger Zustand war seit seiner Kindheit labil
einem akademischen Zirkel um Moritz Schlick, der sich mit und sollte sich mit zunehmendem Alter kontinuierlich ver-
wissenschaftsphilosophischen Fragen beschäftigte. Es war schlimmern. Von starker Hypochondrie, Paranoia und De-
die Zeit in Wien, in der Gödel die beiden Unvollständig- pression gezeichnet, starb Kurt Gödel am 14. Januar 1978
keitssätze entdeckte, die unser mathematisches Weltbild so an den Folgen einer selbst herbeigeführten Unterernährung.
grundlegend verändert haben.

ße, die sich außerhalb des Systems betrachtet als falsch erweist. Dann
folgte der entscheidende Satz:

„Man kann – unter Voraussetzung der Widerspruchsfrei-


heit der klassischen Mathematik – sogar Beispiele für Sät-
ze (und zwar solche von der Art des Goldbach’schen oder
Fermat’schen) angeben, die zwar inhaltlich richtig, aber im
formalen System der klassischen Mathematik unbeweisbar
sind.“ [177]

Dies ist die erste öffentliche Formulierung des ersten Gödel’schen Un-
vollständigkeitssatzes. Die Bombe war geplatzt, und doch schien nie-
mand ihre seismischen Wellen zu spüren. Wir wissen nicht, ob sein zu-
rückhaltendes Auftreten oder die Vermessenheit seiner Aussage dazu
führte, dass niemand im Saal Gödels Beitrag kommentierte. Es ist wahr-
scheinlich, das kaum einer der Anwesenden richtig verstand, wovon der
junge Mathematiker überhaupt sprach.

Der einzige, der Gödel nach der Podiumsdiskussion um eine Unterre-


dung bat, war der ungarische Mathematiker John von Neumann (Ab-
bildung 1.40). Wie Gödel war auch von Neumann ein mathematisches
Ausnahmetalent, und seine rasche Auffassungsgabe war bereits zu Leb-
zeiten legendär. Als einziger im Saal schien er in vollem Umfang zu
verstehen, welche Auswirkungen sich aus der Unvollständigkeit für die
1.2 Der Weg zur modernen Mathematik 49

gesamte Mathematik ergeben. Entscheidend war, dass Gödels Ergebnis-


se von so allgemeiner Natur sind, dass sie auf jedes axiomatische Sys-
tem angewendet werden können, das ausdrucksstark genug ist, um die
Zahlentheorie zu formalisieren. Damit war nicht nur gezeigt, dass der
logische Apparat der Principia Mathematica unvollständig war, son-
dern auch, dass jeder Versuch, die Principia oder ein ähnliches System
zu vervollständigen, von Grund auf zum Scheitern verurteilt ist. Gödel
wies damit nicht nur den logischen Apparat der Principia Mathemati-
ca, sondern die gesamte formale Methode in ihre Grenzen. Seit seiner
Entdeckung wissen wir, dass kein formales System jemals in der Lage
sein wird, die Mathematik vollständig zu erfassen.
Von Gödels Ergebnissen berauscht, setzte sich von Neumann in den
Folgewochen intensiv mit den Konsequenzen des ersten Unvollständig-
keitssatzes auseinander. Was von Neumann nach nur wenigen Wochen
entdeckte, war von so frappierender Natur, dass er sich umgehend an John von Neumann
Gödel wandte. Sein Brief vom 20.11.1930 beginnt mit den folgenden (1903 – 1957)
Worten:
Abbildung 1.40: John von Neumann zähl-
te zu den führenden Mathematikern des
„Lieber Herr Gödel! zwanzigsten Jahrhunderts. Geboren wur-
de er unter dem Namen Neumann János
Ich habe mich in der letzten Zeit wieder mit Logik Lajos im österreichisch-ungarischen Buda-
beschäftigt, unter Verwendung der Methoden, die Sie zum pest. Später nannte er sich Johann von
Aufweisen unentscheidbarer Eigenschaften so erfolgreich Neumann und nahm nach seiner Emigra-
benützt haben. Dabei habe ich ein Resultat erzielt, das mir tion in die USA schließlich den Namen
John von Neumann an. Zu seinem wissen-
bemerkenswert erscheint. Ich konnte nämlich zeigen, dass
schaftlichen Vermächtnis gehören zahlrei-
die Widerspruchsfreiheit der Mathematik unbeweisbar ist. che Arbeiten aus den verschiedensten Ge-
Dies ist genauer so: In einem formalen System, das bieten der Mathematik. Rückblickend wird
die Arithmetik umfasst, lässt es sich, in Anlehnung an sein Name vor allem mit der Von-Neumann-
Ihre Betrachtungen, aussprechen, dass die Formel 1 = 2 Architektur verbunden. Sie ist auch heute
nicht Endformel eines von den Axiomen dieses Systems noch das vorrangige Organisationsprinzip
ausgehenden Beweises sein kann – und zwar ist die- moderner Computersysteme.
se Formulierung eine Formel des genannten formalen
Systems.“ [177]

Der Brief kam zu spät. Was von Neumann beschrieb, ist der Inhalt des
zweiten Gödel’schen Unvollständigkeitssatzes, den Gödel unabhängig
entdeckt und zusammen mit seinem ersten Unvollständigkeitssatz be-
reits zur Publikation eingereicht hatte (Abbildung 1.41). Seine Arbeit
trägt den unscheinbaren Namen „Über formal unentscheidbare Sätze
der Principia Mathematica und verwandter Systeme I“. Der Hauptteil
seiner Publikation beschäftigt sich mit der Herleitung des ersten Un-
vollständigkeitssatzes; dagegen wird der Beweis des zweiten Unvoll-
ständigkeitssatzes nur skizziert. Gödel hatte vor, seine Beweisskizze in
50 1 Historische Notizen

Abbildung 1.41: 1931 publizierte Kurt Gödel seine beiden Unvollständigkeitssätze, die unser mathematisches Grundverständ-
nis für immer verändern sollten [69]. Gödels Sätze manifestieren, dass sich die Begriffe der Beweisbarkeit und der Wahrheit
nicht in Kongruenz bringen lassen; sie zeigen der mathematischen Methode Grenzen auf, die wir niemals überwinden werden.

einer Folgepublikation ausführlich darzulegen, aber dazu kam es nie.


Bereits seine erste Arbeit stieß auf so viel Akzeptanz, dass er keine Not-
wendigkeit mehr sah, einen zweiten Teil zu veröffentlichen. Erst später
wurde ein formaler Beweis des zweiten Unvollständigkeitssatzes von
David Hilbert und Paul Bernays ausgearbeitet [93].

Was bedeutet der zweite Unvollständigkeitssatz für die Mathematik?


Gödel und von Neumann hatten gezeigt, dass der Beweis der Wider-
spruchsfreiheit eines formalen Systems, das die Zahlentheorie umfasst,
nicht mit den Mitteln des Systems selbst geführt werden kann. Hieraus
folgt unmittelbar, dass sich die Widerspruchsfreiheit der Mathematik
nicht mit den Mitteln der gewöhnlichen Mathematik selbst beweisen
lässt. Aber genau das war der Plan, den Hilbert seit Jahren so vehement
verfolgte. Der zweite Gödel’sche Satz versetzte dem Hilbert’schen Pro-
gramm einen schweren Schlag, von dem es sich nie erholen sollte.

Anders als von Neumann sah Gödel das Hilbert’sche Programm kei-
nesfalls als gescheitert an. Auch wenn die Widerspruchsfreiheit der ge-
1.2 Der Weg zur modernen Mathematik 51

wöhnlichen Mathematik nicht mit den Mitteln der gewöhnlichen Ma-


thematik selbst bewiesen werden kann, ist es nicht vollständig ausge-
schlossen, dass trotzdem ein einfacheres System existiert, in dem sich
ein entsprechender Widerspruchsbeweis durchführen lässt. In seiner Ar-
beit wies Gödel ausdrücklich darauf hin,

„dass Satz XI [der zweite Unvollständigkeitssatz] (und


die entsprechenden Resultate über M, A) in keinem Wi-
derspruch zum Hilbert’schen formalistischen Standpunkt
stehen. Denn dieser setzt nur die Existenz eines mit fini-
ten Mitteln geführten Widerspruchsfreiheitsbeweises vor-
aus, und es wäre denkbar, dass es finite Beweise gibt, die
sich in P (bzw. M, A) nicht darstellen lassen.“5 [69]

Doch wie sollte ein derartiges System aussehen, mit dem sich die
Widerspruchsfreiheit der gewöhnlichen Mathematik beweisen lassen
könnte? Zunächst müsste es neue Beweismittel umfassen, die in der ge-
wöhnlichen Mathematik heute nicht enthalten sind. Des Weiteren müss-
ten die neuen Beweismittel zu den finiten Mitteln zählen, d. h., sie müss-
ten aus offensichtlichen Überlegungen heraus korrekt sein. Auch wenn
die Existenz durch die Gödel’schen Unvollständigkeitssätze nicht aus-
geschlossen wird, hat noch niemand ein solches System bisher gefun-
den, geschweige denn eine Vorstellung davon, wie es aufgebaut sein
könnte. Nur wenige Experten sind der Meinung, dass ein solches Sys-
tem existiert.

Unbestritten gehören die Gödel’schen Unvollständigkeitssätze zu den


wichtigsten Erkenntnissen der Mathematik des zwanzigsten Jahrhun-
derts, und dem berühmten Philosophen Karl Popper schien sie „der
wichtigste Beitrag zur Logik zu sein, seit sie durch Aristoteles geschaf-
fen wurde“ [208]. In Kapitel 4 werden wir uns detailliert mit den Un-
vollständigkeitssätzen beschäftigen und zeigen, warum sie unser mathe-
matisches Grundverständnis dramatisch verändert haben.

Von Hilbert ist überliefert, dass er auf die Unvollständigkeitssätze zu-


nächst mit Zorn reagierte [221]. Dennoch verschloss er sich der Rea-
lität nicht auf Dauer und akzeptierte Gödels Ergebnisse schon bald als
unumstößliche Tatsachen. Für John von Neumann sollte die Logik da-
gegen nie mehr dieselbe sein. Er hielt zwar mehrere Vorlesungen über
die Unvollständigkeitssätze, wandte sich aber bald danach anderen Tä-
tigkeitsfeldern zu. Als wissenschaftlicher Berater begleitete er den Bau
5 P, M und A sind die Bezeichnungen Gödels für die formalisierte Peano-Arithmetik,

die Mengenlehre bzw. die gesamte klassische Mathematik.


52 1 Historische Notizen

Abbildung 1.42: Der ENIAC (Electro-


nic Numerical Integrator And Computer)
war die erste voll funktionsfähige Rechen-
maschine, die nahezu allen Definitionen
des modernen Computer-Begriffs stand-
hält und daher von vielen Experten als der
erste wirkliche Computer der Welt ange-
sehen wird. Der Rechnerkoloss wurde an
der Moore School of Electrical Enginee-
ring der University of Pennsylvania un-
ter der Leitung von J. Presper Eckert und
John W. Mauchly gebaut und beeindruck-
te schon aufgrund seiner schieren Grö-
ße. Der ENIAC bestand aus insgesamt 30
Einheiten, die U-förmig über den gesam-
ten Raum verteilt angeordnet waren. Die
gesamte Konstruktion kam auf ein Ge-
samtgewicht von knapp 30 Tonnen.

des ENIAC, den wir rückblickend als den ersten universellen Compu-
ter der Welt ansehen dürfen (Abbildung 1.42). Im Jahr 1946 publizierte
von Neumann ein wegweisendes Konzept für die Organisation von Mi-
krorechnern und auch heute noch ist die Von-Neumann-Architektur die
Grundlage für den Bau vieler moderner Computersysteme [138].

Auch Bertrand Russell zog sich in den Folgejahren fast vollständig von
der Logik zurück. Rückblickend ist es schwer zu ermessen, welche in-
tellektuelle Leistung das Verfassen der Principia Mathematica erfordert
haben muss. Fest steht, dass die zehnjährige Arbeit an diesem epocha-
len Werk auch in Russells brillantem Geist Spuren hinterließ (Abbil-
dung 1.43).

Andere Mathematiker reagierten mit Ignoranz auf die Unvollständig-


keitssätze. Um eine wahre und zugleich unbeweisbare Aussage zu er-
halten, konstruierte Gödel eine komplizierte Formel, die im Grunde ge-
nommen über sich selbst behauptet, nicht beweisbar zu sein. Viele sei-
ner Kritiker waren der Meinung, dass der vorhandene Selbstbezug eine
notwendige Bedingung ist, um eine unbeweisbare Aussage zu erhalten.
In ihren Augen waren die von Gödel konstruierten Formeln nichts wei-
ter als seltsame Kuriositäten am Rande eines intakten mathematischen
Kerns – und wurden weitgehend ignoriert.

Ist die von Gödel entdeckte Unvollständigkeit wirklich nur eine Lau-
ne der Logik, die in der gewöhnlichen Mathematik so gut wie kei-
ne Rolle spielt? In der zweiten Hälfte des zwanzigsten Jahrhunderts
1.2 Der Weg zur modernen Mathematik 53

wurde auch diese Hoffnung zerstört. Im Jahr 1977 gelang es den Ma- „[...] I always found myself hoping that
thematikern Jeff Paris und Leo Harrington, eine Variante des Ramsey- perhaps Principia Mathematica would be
Theorems zu finden, die sich innerhalb der Peano-Arithmetik formu- finished some day. Moreover the difficulties
appeared to me in the nature of a
lieren, aber nicht innerhalb der Peano-Arithmetik beweisen lässt. Das
challenge, which it would be pusillanimous
Ramsey-Theorem ist ein mathematisches Problem aus der Kombinato-
not to meet and overcome. So I persisted,
rik, benannt nach dem britischen Mathematiker Frank Plumpton Ram- and in the end the work was finished, but
sey [157]. Äußerlich unterscheidet es sich eklatant von den trickreich my intellect never quite recovered from the
konstruierten Formeln, mit denen Gödel die Unvollständigkeitssätze be- strain. I have been ever since definitely less
wies. Das Ramsey-Theorem ist frei von Selbstbezügen jeglicher Art, capable of dealing with difficult
und trotzdem ist es eine unbeweisbare Formel im Gödel’schen Sin- abstractions than I was before. This is part,
ne. Heute wissen wir, dass die Aussage der von Paris und Harrington though by no means the whole, of the
gefundenen Variante äquivalent zur Widerspruchsfreiheit der Peano- reason for the change in the nature of my
Arithmetik ist. Damit ergibt sich die Unbeweisbarkeit als zwangsläufige work.“ [171]
Folgerung aus dem zweiten Gödel’schen Unvollständigkeitssatz.
In Abschnitt 4.5 werden wir mit dem Satz von Goodstein ein ebenso
harmlos anmutendes Theorem der Zahlentheorie besprechen, das der
englische Logiker Reuben Louis Goodstein im Jahr 1944 mit den Mit-
teln der Mengenlehre bewies [75]. Auch hier handelt es sich um einen
wahren Satz, der sich innerhalb der Peano-Arithmetik formulieren, aber
nicht innerhalb der Peano-Arithmetik beweisen lässt. Dies ist das er-
staunliche Ergebnis einer Arbeit von Laurie Kirby und Jeff Paris aus
dem Jahr 1982 [108].

Beide Beispiele zeigen, dass die von Gödel entdeckte Unvollständigkeit


alles andere ist als eine kuriose Eigenschaft pathologisch konstruierter
Aussagen; sie ist ein allgegenwärtiges Phänomen der Mathematik, das
wir genauso akzeptieren müssen wie die Naturgesetze der Physik.

Bertrand Russell
(1872 – 1970)
1.2.8 Grenzen der Berechenbarkeit
Abbildung 1.43: In hohem Alter verfasste
Bertrand Russell seine dreibändige Auto-
Gödels Arbeit verwies die Mathematik zweifelsohne in ihre Grenzen; biographie, die in den Jahren 1967 bis 1969
unmissverständlich machte sie klar, dass ein widerspruchsfreier und zu- erschien.
gleich vollständiger Kalkül für die Theorie der natürlichen Zahlen nicht
existieren kann. Dennoch blieb die Hoffnung, dass zumindest die Frage
nach der Entscheidbarkeit positiv beantwortet werden könnte. Die Un-
vollständigkeitssätze schließen nicht aus, dass ein systematisches Ver-
fahren existiert, das für jede Aussage bestimmt, ob sie innerhalb des
Systems beweisbar ist oder nicht.

Um eine mathematisch exakte Lösung für das Entscheidungsproblem


herbeizuführen, war es unumgänglich, den diffusen Begriff des syste-
matischen Verfahrens zu präzisieren. Heute ist unser algorithmisches
54 1 Historische Notizen

Abbildung 1.44: 1936 gelang es Alan Turing, eine endgültige Klärung für das Hilbert’sche Entscheidungsproblem herbeizu-
führen [200]. Mit der Turing-Maschine schuf er ein abstraktes Maschinenmodell, auf dem weite Teile der modernen Berechen-
barkeitstheorien beruhen.

Denken durch den täglichen Umgang mit dem Computer gut geschult.
In den dreißiger Jahren war der Computer dem Reißbrett noch nicht
entsprungen, und es herrschte nur eine vage Vorstellung davon, was es
bedeutet, etwas „zu berechnen“.

Übersprungen wurde diese Hürde im Jahr 1936, als der britische Mathe-
matiker Alan Turing seine grundlegende Arbeit „On computable num-
bers, with an application to the Entscheidungsproblem“ der Öffentlich-
keit präsentierte (Abbildung 1.44). Um den Begriff der Berechenbarkeit
formal zu erfassen, konstruierte Turing ein abstraktes Maschinenmo-
dell, das dem Funktionsprinzip moderner Computer sehr nahe kommt.
In der Originalarbeit motivierte Turing die Konzeption seiner Maschi-
ne, die wir heute als Turing-Maschine bezeichnen, mit den folgenden
Worten:
1.2 Der Weg zur modernen Mathematik 55

„Computing is normally done by writing certain sym- I Zeichen ersetzen


bols on paper. We may suppose this paper is divided into
squares like a child’s arithmetic book.“ ...  1 0 0   ...
Band
Das Zitat zeigt die Unbefangenheit, die sich durch Turings gesamte Ar- 1

Maschine
beit zieht. Er startete seine Überlegungen über die Berechenbarkeit mit

Turing-
dem, was er seit seiner Kindheit zum Rechnen verwendete: einem lee-
ren Stück karierten Papier. Unmittelbar danach nahm Turing dann doch
eine erste Abstraktion vor. Er sah, dass die zweidimensionale Gestalt
des Rechenpapiers im Grunde genommen keine Rolle spielt. Alle Be-
I Kopf bewegen
rechnungen, die wir per Hand auf Papier durchführen können, sind auch
auf einem eindimensionalen Band möglich – wenngleich nicht immer
mit der gleichen Eleganz. ...  1 1 0   ...
Band
„[...] I think that it is agreed that the two-dimensional

Maschine
character of paper is no essential of computation. I as-

Turing-
sume then that the computation is carried out on one-
dimensional paper, i.e. on tape divided into squares.“

Turing lässt weitere Annahmen folgen. Zunächst geht er davon aus, dass I Zustand wechseln
es nur endlich viele Symbole gibt, mit denen die Felder seines Ban-
des gefüllt werden können. Er ging außerdem davon aus, dass sich das  1 1 0  
... ...
menschliche Gehirn im Zuge einer Berechnung zu jedem Zeitpunkt in
Band
einem von endlich vielen Zuständen befindet.

Maschine
Turing-
„We may suppose that there is a bound B to the number of
symbols or squares which the computer can observe at one
moment. [...] We will also suppose that the number of states
of mind which will be taken into account is finite.“
Abbildung 1.45: Turing definierte wenige
primitive Elementaroperationen, aus denen
Anschließend definiert Turing eine Menge von Elementaroperationen,
komplexe Berechnungen erwachsen. In je-
aus denen sich komplexe Berechnungen zusammensetzen. Diese erlau- dem Bearbeitungsschritt kann eine Turing-
ben, das Symbol des aktuell betrachteten Felds auszutauschen und die Maschine das aktuell betrachtete Symbol
Aufmerksamkeit auf eines der Nachbarfelder zu lenken: durch ein anderes ersetzen und das Betrach-
tungsfenster (observed square) verschie-
„The simple operations must therefore include: (a) Chan- ben. Die ausgeführten Aktionen gehen mit
einem potenziellen Wechsel des inneren
ges of the symbol on one of the observed squares. (b) Chan-
Zustands (state of mind) einher.
ges of one of the squares observed to another square within
L squares of one of the previously observed squares.“

Beide Aktionen werden durch einen möglichen Wechsel des internen


Zustands begleitet:
56 1 Historische Notizen

„The machine is to have the four m-configurations ’b’, ’c’, ’f’, ’e’ and
is capable of printing ’0’ and ’1’. The behaviour of the machine is
described in the following table in which ’R’ means ’the machine
moves so that it scans the square immediately on the right of the one it
was scanning previously’. Similarly for ’L’. ’E’ means ’the scanned
symbol is erased’ and ’P’ stands for ’prints’.“ [200]
Configuration Behaviour
m-config. symbol operations final m-config.
b None P0, R c
c None R e
e None P1, R f
f None R b

Alan Mathison Turing (1912 – 1954)

Abbildung 1.46: Das erste Beispiel einer Turing-Maschine. In seiner Arbeit aus dem Jahr 1936 bezeichnete sie Turing noch
schlicht als computing machine. Der Begriff der Turing-Maschine wurde 1937 durch Alonzo Church geprägt [85].

„It may be that some of these changes necessarily involve


a change of state of mind. The most general single ope-
ration must therefore be taken to be one of the following:
(A) A possible change (a) of symbol together with a possi-
ble change of state of mind. (B) A possible change (b) of
observed squares, together with a possible change of state
of mind.“

Abbildung 1.45 fasst die erwähnten Elementaroperationen bildlich zu-


sammen.

Turing ersann seine Maschine, um die Menge der berechenbaren Zah-


len zu charakterisieren. Was er hierunter im Detail verstand, wollen wir
am Beispiel der in Abbildung 1.46 beschriebenen Turing-Maschine her-
ausarbeiten. Konkret handelt es sich um das erste Beispiel aus seiner
Originalarbeit.

Die Maschine besitzt die vier Zustände b, c, e, f und wird in Zustand b


(begin) auf einem leeren Band gestartet. Wie sie sich im Detail verhält,
verrät ihre Instruktionstabelle. Direkt nach dem Start führt sie die Ak-
tion P0, R aus. P0 steht für „Print 0“ und sorgt dafür, dass eine 0 auf
das Band geschrieben wird. R steht für „Right“ und weist die Maschine
an, den Schreib-Lese-Kopf ein Feld nach rechts zu bewegen. Danach
wird der Zustand b verlassen und der Folgezustand c eingenommen. In
1.2 Der Weg zur modernen Mathematik 57

I Start I Schritt 3
...       ... ... 0  1    ...

Configuration Behaviour Configuration Behaviour


m-config. symbol operations final m-config. m-config. symbol operations final m-config.
b None P0, R c b None P0, R c
c None R e c None R e
e None P1, R f e None P1, R f
f None R b f None R b

I Schritt 1 I Schritt 4
... 0      ... ... 0  1    ...

Configuration Behaviour Configuration Behaviour


m-config. symbol operations final m-config. m-config. symbol operations final m-config.
b None P0, R c b None P0, R c
c None R e c None R e
e None P1, R f e None P1, R f
f None R b f None R b

I Schritt 2 I Schritt 5
... 0      ... ... 0  1  0  ...

Configuration Behaviour Configuration Behaviour


m-config. symbol operations final m-config. m-config. symbol operations final m-config.
b None P0, R c b None P0, R c
c None R e c None R e
e None P1, R f e None P1, R f
f None R b f None R b

Abbildung 1.47: Die erste Beispielmaschine aus Turings Originalarbeit in Aktion

diesem Zustand wird das Band nicht verändert; die Maschine bewegt
den Schreib-Lese-Kopf lediglich ein Feld nach rechts und wechselt in
den Zustand e. Jetzt schreibt die Maschine eine 1 auf das Band, bewegt
den Schreib-Lese-Kopf erneut nach rechts und nimmt den Zustand f
ein. Nach einer weiteren Rechtsbewegung wird wieder der Startzustand
b erreicht (Abbildung 1.47). Indem die Maschine diesen Zyklus konti-
58 1 Historische Notizen

n 7 Jun Alan Mathison Turing wurde am Danach diktierte der zweite Weltkrieg den Lauf der Dinge.
23 Ju
1912 1954
23. Juni 1912 in London-Padding- Turing begab sich nach Bletchley Park, wo er zusammen mit
ton geboren. Zusammen mit sei- anderen Wissenschaftlern im Geheimen daran arbeitete, den
nem älteren Bruder wuchs Alan in Verschlüsselungscode der deutschen Wehrmacht zu brechen.
England bei Freunden der Familie auf, während seine Mut- In dieser Zeit entstand mit der Turing-Bombe eine Rechen-
ter und sein Vater, ein Staatsdiener des britischen Empire, maschine, mit der sich der feindliche Funkverkehr in we-
die meiste Zeit im indischen Chatrapur verbrachten. Bereits nigen Stunden entschlüsseln ließ. Für Turing hatte ihr Bau
in seiner frühen Jugend wurde Turings außerordentliche ma- eine ganz besondere Bedeutung. Obwohl sich die Maschi-
thematische Begabung sichtbar, genauso wie sein Unvermö- ne in wichtigen Punkten von seiner theoretisch ersonnenen
gen, sich gesellschaftlichen Normen und staatlichen Autori- computing machine unterschied, wurden viele Aspekte sei-
täten zu beugen. ner Idee dennoch real.
Turing begann seine Ausbildung in einer Ganztagsschule in Nach dem zweiten Weltkrieg wandte sich Turing wieder ver-
St. Michaels und wechselte im Alter von 14 Jahren an das mehrt theoretischen Themen zu. Im Jahr 1950 schlug er mit
bekannte Sherborne-Internat in Dorset. Nach seinem Schul- dem Turing-Test ein Verfahren vor, mit dem sich der Intelli-
abschluss schrieb er sich als Mathematikstudent am King’s genzbegriff auf Maschinen übertragen lässt [202].
College in Cambridge ein. Für Turing war dies nur die zwei- Im Jahr 1952 sollte Turings Karriere ein abruptes Ende fin-
te Wahl; das renommiertere Trinity-College blieb ihm auf- den. Als die Polizei sein Haus nach einem Einbruch unter-
grund motivationsbedingter schlechter Noten in den nicht- suchte, gestand er eine homosexuelle Beziehung ein. Das
naturwissenschaftlichen Fächern verwehrt. prüde England der Fünfzigerjahre reagierte erbarmungslos
Bereits ein Jahr nach seinem Abschluss gelang ihm der und sprach Turing in einem Strafverfahren der sexuellen Per-
wissenschaftliche Durchbruch. 1936 publizierte er mit „On version schuldig. Die angeordnete Zwangstherapie machte
computable numbers, with an application to the Entschei- aus ihm einen gebrochenen Mann. Zwei Jahre später wur-
dungsproblem“ eine der historisch wichtigsten Arbeiten auf de er, kurz vor seinem 42ten Geburtstag, neben den Resten
dem Gebiet der mathematischen Logik. eines vergifteten Apfels tot aufgefunden.

nuierlich wiederholt, produziert sie den folgenden Bandinhalt:

... 0  1  0  1  0  ...

Die geschriebenen Ziffern werden als die Nachkommaziffern einer re-


ellen Zahl interpretiert, in unserem Fall als die Nachkommaziffern der
Zahl
0,0101010101010101 . . .
Die zwischen den Ziffern freigelassenen Bandstellen spielen für den
dargestellten Zahlenwert keine Rolle. In Turings Maschinendefinition
ist es ausdrücklich erlaubt, Felder leer zu lassen oder mit beliebigen
Symbolen zu beschreiben, die keine Ziffern sind. Dennoch ist es kein
Zufall, dass die betrachtete Maschine jedes zweite Feld leer lässt. In
vielen seiner Maschinen nutzt Turing die Freistellen als temporäre Ab-
lage für Hilfssymbole, die zur Steuerung des Programmablaufs benötigt
werden, für den berechneten Zahlenwert aber keine Rolle spielen.

Mit dem entwickelten Begriffsgerüst gelang Turing eine bemerkenswer-


te Gratwanderung. Zum einen erfüllt die Turing-Maschine in jeder Hin-
1.2 Der Weg zur modernen Mathematik 59

sicht die Anforderungen eines formalen Modells, so dass sie mathema-


tisch präzise Aussagen über den Berechenbarkeitsbegriff erlaubt. Zum
anderen ist sie von einer inneren Einfachheit und Klarheit geprägt, die
einen überraschend intuitiven Zugang zu dieser komplexen Materie er-
öffnet. Im Gegensatz zu rein mathematischen Ansätzen, zu denen z. B.
der zeitgleich von Alonzo Church entwickelte Lambda-Kalkül [32, 33]
oder die in Abschnitt 4.2.2 vorgestellte Theorie der primitiv-rekursiven
Funktionen gehören [51], erscheint die Turing-Maschine zum Anfassen
nah.
Turings erstes Hauptresul-
Die Popularität, die der Begriff der Turing-Maschine heute genießt, tat ist im Wesentlichen das,
lässt häufig vergessen, dass das Maschinenmodell nur Mittel zum was wir heute als die Unlös-
Zweck war. Turing hatte die Klärung des Entscheidungsproblems im barkeit des Halteproblems
Sinn und war hierfür gezwungen, den Berechenbarkeitsbegriff mathe- bezeichnen. Dass der Begriff Haltepro-
blem in seiner Originalarbeit nicht ein ein-
matisch präzise zu erfassen. Nachdem er mit der Turing-Maschine das
ziges Mal vorkommt, hat einen einfachen
nötige Instrumentarium geschaffen hatte, war er in der Lage, die folgen- Grund. Die von Turing gegebene Definiti-
den beiden Hauptresultate zu beweisen: on seines Maschinenmodells entspricht in
wenigen, aber wesentlichen Punkten nicht
mehr dem heute verwendeten. Weil Tu-
I Es ist unmöglich, ein Verfahren zu konstruieren, das für jede Turing-
rings computable machines für die Be-
Maschine korrekt entscheidet, ob sie eine 0 auf das Band schreiben rechnung von reellen Zahlen konzipiert
wird oder nicht. Gäbe es ein solches Verfahren, so ließe sich eine waren, schreiben sie eine unendliche Fol-
Turing-Maschine konstruieren, die eine andere Turing-Maschine in ge von Ziffern auf das Band und halten
codierter Form entgegennimmt und die Antwort stets korrekt berech- unter normalen Umständen niemals an.
net. Dass die Annahme über die Existenz einer solchen Maschine zu Erst im Jahr 1958 wurde das Maschinen-
Widersprüchen führt, lässt sich mit der gleichen Diagonalisierungs- modell von Martin Davis in seine heuti-
methode zeigen, mit der Cantor die Überabzählbarkeit des Kontinu- ge Form gebracht und das Halteproblem
ums bewies. das erste Mal erwähnt [42]. Konkret ver-
birgt sich dahinter die Frage, ob mithil-
I Eine Turing-Maschine lässt sich in eine prädikatenlogische Formel fe eines systematischen Verfahrens für ei-
erster Stufe übersetzen, die genau dann allgemeingültig ist, wenn ne vorgelegte Turing-Maschine stets kor-
rekt entschieden werden kann, ob sie für
die übersetzte Maschine irgendwann eine 0 ausgibt. Nach dem Gö-
eine bestimmte Eingabe terminieren wird
del’schen Vollständigkeitssatz ist jede allgemeingültige prädikaten-
oder nicht. Die Tatsache, dass sich die-
logische Formel erster Stufe beweisbar. Hätte das Hilbert’sche Ent- se Frage mit exakt denselben Mitteln ne-
scheidungsproblem eine Lösung, gäbe es also ein Verfahren, mit gativ beantworten lässt, mit denen Turing
dem wir für jede prädikatenlogische Formel bestimmen könnten, ob sein erstes Hauptresultat erzielte, ist die
sie beweisbar ist, so könnten wir für jede Turing-Maschine entschei- Legitimation für die regelmäßig geäußer-
den, ob sie eine 0 ausgibt oder nicht. Aber genau dies ist nach dem te Behauptung, Turing hätte die Unent-
oben Gesagten unmöglich. scheidbarkeit des Halteproblems bewie-
sen, obwohl der Begriff erst vier Jahre
nach seinem Tod geprägt wurde. In Ab-
Mit seinem bahnbrechenden Ergebnis zog Turing den Schlussstrich schnitt 5.1.1 werden wir uns ausführlich
unter die langjährige Jagd nach einem Entscheidungsverfahren. Heu- mit dem Aufbau und der Funktionsweise
te wissen wir: Es war eine Jagd nach dem mathematischen Perpetu- von Turing-Maschinen in ihrer modernen
Form beschäftigen.
um Mobile, die aus fundamentalen Überlegungen heraus nicht gelingen
60 1 Historische Notizen

konnte. Der Leibniz’sche Traum von einer mechanisierten Mathematik


war ausgeträumt.

Die von Turing begründete Berechenbarkeitstheorie ist insbesondere


für die Informatik von unschätzbarem Wert. Zum einen ermöglicht sie,
den zentralen Begriff des Algorithmus mathematisch präzise zu erfas-
sen. Zum anderen macht sie deutlich, dass Probleme existieren, die sich
nicht mithilfe systematischer Verfahren lösen lassen. Aber auch in ganz
anderer Hinsicht ist die Berechenbarkeitstheorie von Bedeutung. Durch
sie erhalten wir einen alternativen Zugang zur Beweistheorie, der uns er-
lauben wird, viele Beweise kürzer zu führen, als es vorher möglich war.
So werden wir in Abschnitt 5.4.2 herausarbeiten, wie über die Arithme-
tisierung von Turing-Maschinen ein genauso eleganter wie kurzer Be-
weis für den ersten Gödel’schen Unvollständigkeitssatz gewonnen wer-
den kann.
Emil Leon Post In den Folgejahren entwickelte sich die Berechenbarkeitstheorie zu ei-
(1897 – 1954) nem leistungsfähigen Instrument, mit dem sich eine Vielzahl von Frage-
stellungen als formal unentscheidbar identifizieren ließ. Die Hoffnung
Abbildung 1.48: Emil Post verdanken wir
wichtige Erkenntnisse auf dem Gebiet der
wuchs, auch hartnäckige Probleme einer Lösung zuzuführen, die bis
Berechenbarkeitstheorie. Heute wird sein dato jedem Angriffsversuch stand hielten. In diesem Zusammenhang
Name vor allem mit dem Post’schen Kor- rückte auch das zehnte Hilbert’sche Problem erneut in den Mittelpunkt
respondenzproblem verbunden, einem der des Interesses. Im Jahr 1944 äußerte sich der Mathematiker Emil Leon
wichtigsten unentscheidbaren Probleme. Post mit den folgenden Worten (Abbildung 1.48):

„One of the problems posed by Hilbert in his Paris ad-


dress of 1900 is the problem of determining for an arbitra-
ry diophantine equation with rational integral coefficients
whether it has, or has not, a solution in rational integers.
[...]. The above problem of Hilbert begs for an unsolvability
proof.“ [147]

Einer der ersten, die sich der Herausforderung annahmen, war Posts
Schüler Martin Davis. Im Jahr 1953 erreichte er ein wichtiges Zwi-
schenresultat [41], das er 1961 zusammen mit Hilary Putnam und Julia
Robinson zu einem fast vollständigen Beweis für die Unentscheidbar-
keit des zehnten Hilbert’schen Problems erweitern konnte [45]. In die-
ser Arbeit bewiesen die Autoren, dass kein Entscheidungsverfahren für
exponentielle diophantische Gleichungen existieren kann. Hier dürfen
Variablen, im Gegensatz zu gewöhnlichen diophantischen Gleichungen,
auch als Exponent verwendet werden.

Die verbleibende Beweislücke wurde 1970 durch Yuri Matijasevič ge-


schlossen (Abbildung 1.49) [124]. Der junge russische Mathematiker
1.2 Der Weg zur modernen Mathematik 61

zeigte, dass sich exponentielle diophantische Gleichungen auf gewöhn-


liche diophantische Gleichungen reduzieren lassen. Das bedeutet, dass
ein Entscheidungsverfahren für gewöhnliche diophantische Gleichun-
gen dazu verwendet werden kann, um auch den exponentiellen Fall zu
lösen. Damit war klar, dass das von Hilbert gesuchte Entscheidungsver-
fahren nicht existieren kann. Das Rätsel um Hilberts zehntes Problem
war gelöst, wenn auch nicht in seinem ursprünglich zugedachten Sinne.

Im Jahr 1984 publizierten James Jones und Yuri Matijasevič einen neu-
en Beweis, der die Unlösbarkeit des zehnten Hilbert’schen Problems auf
verblüffend einfache Weise belegt [101]. Im Kern steht die Idee, Regi-
stermaschinen so in diophantische Gleichungen zu übersetzen, dass die
übersetzte Maschine genau dann terminiert, wenn die generierte Glei-
chung eine Lösung in den ganzen Zahlen besitzt. Würde das von Hilbert
gesuchte Verfahren für die Lösung diophantischer Gleichungen tatsäch-
lich existieren, so wäre das Unmögliche geschafft: Wir hätten einen Yuri Matijasevič
Weg gefunden, das Halteproblem für Registermaschinen zu entschei- (geb. 1947) [123]
den, und könnten auf diesem Weg auch das Halteproblem für Turing-
Maschinen lösen. Damit hat Turings fundamentaler Beweis aus dem Abbildung 1.49: Im Jahr 1970 gelang es
Jahr 1936 nicht nur das Hilbert’sche Entscheidungsproblem zu Fall ge- dem russischen Mathematiker Yuri Matija-
bracht; er liefert uns zugleich eine plausible Begründung für die Unlös- sevič, die letzte Lücke im Beweis der Un-
barkeit des zehnten Hilbert’schen Problems. lösbarkeit des zehnten Hilbert’schen Pro-
blems zu schließen.

1.2.9 Auferstanden aus Ruinen

Die Arbeiten von Gödel und Turing waren ein Frontalangriff auf die
Grundfesten der Mathematik. Ende der dreißiger Jahre lag das Hil-
bert’sche Programm in Trümmern, genauso wie die Vision einer me-
chanisierbaren Mathematik. Und dennoch sollten die Erkenntnisse des
zwanzigsten Jahrhunderts einen Bereich der Mathematik ganz beson-
ders beflügeln: die Mengenlehre.

Kurt Gödel begann Ende der dreißiger Jahre, sich intensiv mit mengen-
theoretischen Problemen auseinanderzusetzen, und schon bald war er in
der Lage, die ersten Früchte seiner Arbeit zu ernten. In den Mittelpunkt
seines Interesses rückten relative Beweise der Widerspruchsfreiheit. In
einem solchen Beweis wird die Widerspruchsfreiheit eines Systems B
nicht direkt gezeigt; es wird lediglich bewiesen, dass sich die Wider-
spruchsfreiheit eines Systems A auf das System B überträgt.
Am Beispiel der Zermelo-Fraenkel-Mengenlehre (ZF) und der Peano-
Arithmetik (PA) wollen wir skizzieren, wie sich ein relativer Wider-
spruchsbeweis führen lässt. Im Vorgriff auf Abschnitt 3.2.2 halten wir
62 1 Historische Notizen

I Konstruktionsschema fest, dass jede natürliche Zahl in Form einer speziell konstruierten Men-
ge dargestellt werden kann (Abbildung 1.50) [134, 137]. Damit dürfen
0 := 0/
wir PA ruhigen Gewissens als ein Teilsystem von ZF ansehen und kön-
n+1 := n ∪ {n} nen jede zahlentheoretische Aussage aus PA in eine entsprechende men-
gentheoretische Aussage aus ZF übersetzen. Beispielsweise lässt sich
I Beispiele
eine arithmetische Aussage der Form
1 = {0}
„Für alle Zahlen x gilt ...“
= {0}
/
2 = {0, 1} wie folgt innerhalb von ZF darstellen:
= {0,
/ {0}}
/
3 = {0, 1, 2}
„Für alle Mengen x, falls x eine Zahl repräsentiert, gilt: ...“
= {0,
/ {0},
/ {0,
/ {0}}}
/ Gelingt die Übersetzung derart, dass jede in PA beweisbare Aussage
zu einer in ZF beweisbaren Aussage wird, so sind wir am Ziel. Jeder
Abbildung 1.50: Mengendarstellung der Widerspruch, der sich innerhalb von PA ableiten ließe, würde zugleich
natürlichen Zahlen einen Widerspruch in ZF ergeben (Abbildung 1.51). Mit anderen Wor-
ten: Aus der Widerspruchsfreiheit von ZF folgt die Widerspruchsfrei-
Widerspruch in PA heit von PA.
Durch eine ähnliche Konstruktion gelang es Gödel, die relative Wider-
¬φ1 spruchsfreiheit zwischen der ZF- und der ZFC-Mengenlehre (Zermelo-
Arithmetik (PA)

φ1
Fraenkel-Mengenlehre mit Auswahlaxiom) zu zeigen [71]. Hierzu ori-
φ2
Peano-

entierte er sich an einer Idee von John von Neumann, Mengen hierar-
Einbettung von PA in ZF

chisch anzuordnen [134]. Analog zur Neumann’schen Mengenhierar-


chie V definierte Gödel eine Hierarchie L, die ausschließlich aus Men-
gen besteht, die sich durch die wiederholte Anwendung bestimmter Bil-
dungsregeln erzeugen lassen. Gödel bezeichnete diese Mengen als kon-
struktible Mengen. Da jede konstruktible Menge eine Menge ist, gilt
Zermelo-Fraenkel-
Mengenlehre (ZF)

ψ3
ψ2
offensichtlich die Beziehung L ⊆ V .
ψ1 ψ5
¬ψ1 Gödel interessierte sich für die Konsequenzen, die sich aus der Annah-
ψ4 me ergeben, ausnahmslos jede Menge sei konstruktibel. Er tat dies, in-
dem er den ZF-Axiomen das Konstruktibilitätsaxiom, kurz (V =L), hin-
zufügte. Durch eine trickreiche Konstruktion gelang es ihm, die Theo-
Widerspruch in ZF
rie ZF+(V =L) so in ZF einzubetten, dass jede in ZF+(V =L) beweisbare
Aussage in eine Aussage übersetzt werden kann, die in ZF beweisbar
Abbildung 1.51: Relativer Beweis der ist. Aufgrund dieser Konstruktion führt jeder Widerspruch, der sich in
Widerspruchsfreiheit. Jede Formel ϕi der
ZF+(V =L) ableiten lässt, auch zu einem Widerspruch in ZF. Ist also ZF
Peano-Arithmetik (PA) wird so auf eine
Formel ψi der Zermelo-Fraenkel-Mengen-
widerspruchsfrei, so ist es auch ZF+(V =L). Jetzt kommt der entschei-
lehre (ZF) abgebildet, dass aus der Beweis- dende Schritt. In ZF+(V =L) lässt sich das Auswahlaxiom als Theorem
barkeit von ϕi in PA die Beweisbarkeit von beweisen. Daraus folgt, dass das Auswahlaxiom mit den Axiomen von
ψi in ZF folgt. Jeder Widerspruch innerhalb ZFC+(V =L) und damit erst recht mit den Axiomen von ZF verträglich
von PA wäre jetzt auch in ZF sichtbar, so ist. Mit anderen Worten: Ist die ZF-Mengenlehre selbst frei von Wider-
dass aus der Widerspruchsfreiheit von ZF sprüchen, so lässt sich das Auswahlaxiom widerspruchsfrei als weiteres
die Widerspruchsfreiheit von PA folgt. Axiom hinzufügen. In der gleichen Weise gelang es Gödel, zu zeigen,
1.2 Der Weg zur modernen Mathematik 63

pr 23 Mrz Paul Joseph Cohen wurde am 2. konnte als erster einen lückenlosen Beweis für die lang ge-
2 A
1934 2007
April 1934 in Long Branch, New hegte Vermutung vorlegen, dass sich sowohl das Auswahl-
Jersey, geboren. Schon in jungen axiom als auch die Kontinuumshypothese im System der
Jahren galt Cohen als mathemati- Zermelo-Fraenkel-Mengenlehre weder beweisen noch wi-
sches Wunderkind. Nach zwei Jahren am Brooklyn Colle- derlegen lassen.
ge in New York wechselte er an die University of Chicago. 1966 wurde er für sein Werk mit der Fields-Medaille geehrt.
Dort erhielt er im Jahr 1954 seinen Master-Abschluss, vier Die alle vier Jahre verliehene Auszeichnung ist die höchste
Jahre später folgte die Promotion. 1958 führte ihn sein Weg im Bereich der Mathematik und hat eine ähnliche Bedeutung
an das Massachusetts Institute of Technology. Die Zeit zwi- wie der Nobelpreis in anderen Wissenschaftsdisziplinen.
schen 1959 und 1961 verbrachte er am Institute for Advan- In den 70er Jahren setzte sich Cohen vermehrt mit Proble-
ced Study in Princeton. 1961 wechselte er an die Stanford men aus der Zahlentheorie auseinander, und mit der Rie-
University, die ihn 1964 zum Professor ernannte. mann’schen Vermutung sollte erneut eines der bedeutendsten
In Kalifornien hatte Cohen eine neue Heimat gefunden, die ungelösten Probleme der Mathematik sein Interesse wecken.
er als weniger hektisch empfand als seine vorherigen Sta- Mit großer Hingabe beschäftigte sich Cohen bis zu seinem
tionen an der Ostküste. In Stanford fand er die Ruhe, um Lebensende mit dieser Vermutung; ein Beweis sollte ihm
sich intensiv mit den Grundlagenproblemen der Mengenleh- aber nicht mehr gelingen. Paul J. Cohen starb am 23. März
re auseinanderzusetzen. Im Jahr 1963 war es soweit. Cohen 2007 an den Folgen einer seltenen Lungenkrankheit.

dass sich neben dem Auswahlaxiom auch die Kontinuumshypothese wi-


derspruchsfrei zu den ZF-Axiomen hinzufügen lässt.

Hatte Gödel mit seinem erneuten Coup das geschafft, wonach Cantor
bis zu seinem Lebensende trachtete? War es ihm tatsächlich gelun-
gen, dem Kontinuum das letzte große, über lange Zeit so vehement
gehütete Geheimnis endlich zu entlocken? Auch wenn Gödels Arbeit
von unschätzbarem Wert ist, war sie nur ein Teilerfolg. Aus der Tat-
sache, dass die Kontinuumshypothese mit den ZF-Axiomen verträglich
ist, folgt nicht, dass sie wahr ist. Gödel war längst davon überzeugt,
dass auch die Negation zu den ZF-Axiomen hinzugefügt werden kann,
ohne einen Widerspruch zu erzeugen. Sollte seine Überzeugung zur
Gewissheit werden, so wäre die Kontinuumshypothese innerhalb der
Zermelo-Fraenkel-Mengenlehre unentscheidbar, d. h., es gäbe innerhalb
von ZF weder einen Beweis für ihre Wahrheit noch einen Beweis für ih-
re Falschheit. Mehre Male glaubte Gödel, einen Beweis für seine Unab-
hängigkeitsvermutung in Händen zu halten, doch bei genauerer Analyse
fanden sich stets Fehler in seiner Beweisführung.

Erst im Jahr 1963 sollte Gödels Vermutung zur Gewissheit werden, als
Paul Cohen bewies, dass sowohl die Negation des Auswahlaxioms wie
auch die Negation der Kontinuumshypothese widerspruchsfrei zu den
ZF-Axiomen hinzugefügt werden können [35–37] (Abbildung 1.52).
Aus Gödels und Cohens Ergebnissen folgt, dass sich das Auswahl-
axiom und die Kontinuumshypothese innerhalb der Zermelo-Fraenkel-
Mengenlehre weder beweisen noch widerlegen lassen.
64 1 Historische Notizen

Abbildung 1.52: Im Jahr 1963 bewies der amerikanischen Mathematiker Paul Cohen, dass sich die Negation der Kontinuums-
hypothese widerspruchsfrei zu den Axiomen der Zermelo-Fraenkel-Mengenlehre hinzufügen lässt. Ab da war gewiss, dass sich
die Kontinuumshypothese innerhalb der ZF-Mengenlehre weder beweisen noch widerlegen lässt.

Cohens Arbeit ist ein Meilenstein auf dem Weg zur modernen Men-
genlehre. Um die Unabhängigkeit beider Axiome zu beweisen, führte
er eine neue Methode namens Forcing ein. Mit ihr lassen sich spezi-
elle Modelle konstruieren, aus deren Existenz die Widerspruchsfreiheit
eines Axiomensystems folgt. Anders als Gödel, der mithilfe des Kon-
struktibilitätsaxioms (V =L) ein inneres Modell der Mengenlehre kon-
struierte, führte Cohen eine Modellerweiterung durch. Unter gewissen
Voraussetzungen lassen sich in diesem größeren Modell gewisse Eigen-
schaften erzwingen, wie z. B. die Falschheit der Kontinuumshypothese.
Auf diese Weise konnte Cohen zeigen, dass die negierte Kontinuumshy-
pothese mit den ZF-Axiomen verträglich ist, d. h. widerspruchsfrei zu
den Axiomen hinzugefügt werden kann. Cohens Forcing-Methode ist so
allgemein, dass sie in der Folgezeit auch auf andere Eigenschaften an-
gewandt werden konnte. Heute gehört sie zu den Standardinstrumenten,
1.2 Der Weg zur modernen Mathematik 65

die uns im Bereich der Mengenlehre für das Führen von Unabhängig-
keitsbeweisen zur Verfügung stehen.

Cohens Vorgehensweise ist eng verwandt mit der Methode der boole-
schen Modelle [8, 175]. Diese wurde in den sechziger Jahren von Dana
Scott, Robert Solovay, and Petr Vopěnka mit dem Ziel eingeführt, einen
intuitiveren Zugang zur Forcing-Methode zu schaffen. In Abschnitt 7.4
werden wir die Grundidee umreißen, die sich hinter booleschen Model-
len verbirgt.

Für Gödel war das Rätsel der Kontinuumshypothese damit immer noch
nicht gelöst. Lange bevor Cohen seinen Beweis veröffentlichte, hatte er
ausdrücklich darauf verwiesen, dass der damals noch ausstehende Un-
entscheidbarkeitsbeweis die Kontinuumshypothese nicht klären würde.
Was Gödel damals zum Ausdruck brachte, war Zeugnis seiner platoni-
schen Weltauffassung. Für ihn waren Mengen real existierende Gebilde
der Gedankenwelt, so dass die Kontinuumshypothese in einem absolu-
ten Sinn entweder wahr oder falsch sein muss. Dementsprechend ist die
Unentscheidbarkeit lediglich der Beweis dafür, dass die zugrunde lie-
genden Axiome zu schwach sind, um die Wahrheit oder Falschheit der
Kontinuumshypothese zu belegen. Um eine endgültige Klärung herbei-
zuführen, war es nach Gödels Meinung unausweichlich, die Mengen-
lehre um weitere Axiome zu ergänzen.

In einer Veröffentlichung aus dem Jahr 1947 bringt Gödel seine Ansicht
wie folgt zum Ausdruck:

„Es könnte Axiome mit so reichen überprüfbaren Konse-


quenzen geben, die so viel Licht auf eine ganze Disziplin
werfen und so mächtige Werkzeuge zur Lösung bestehen-
der Probleme zur Verfügung stellen, [...] dass sie im glei-
chen Sinn wie eine gut etablierte physikalische Theorie als
wahr angesehen werden müssten.“ [72, 73]

Seine Worte unterstreichen, welche Kehrtwende die axiomatische Me-


thode im Laufe der Geschichte vollzogen hat. Galten die geometrischen
Axiome der alten Griechen noch als objektive, offensichtliche Wahrhei-
ten, die keinerlei Beweis bedürfen, so sind die Axiome der modernen
Mengenlehre davon weit entfernt. Sie erhalten ihre Legitimation nicht
durch ihre eigene Einsichtigkeit, sondern durch die Konsequenzen, die
sich aus ihnen ergeben. In der Tat folgt die Mathematik an dieser Stelle
dem Vorgehen in der modernen Physik. Auch hier strapazieren die Ge-
setze der Quantenphysik die menschliche Intuition auf das höchste, und
66 1 Historische Notizen

Der Positivismus und der dennoch akzeptieren wir sie als ernstzunehmende Theorie. Wir akzep-
Platonismus sind philoso- tieren sie deshalb, weil die Folgerungen, die sich aus ihnen ergeben, mit
phische Denkrichtungen in den Phänomenen der Natur in Einklang stehen.
der Wissenschaft, die auf
völlig unterschiedlichen mathematischen Doch welche Axiome sind die richtigen, um die Zermelo-Fraenkel-
und physikalischen Weltbildern beruhen. Mengenlehre so zu erweitern, dass sie zum einen den Begriff der Menge
Der Positivismus koppelt den Existenzbe- adäquat beschreibt und zum anderen Auskunft über bisher ungeklärte
griff an das Beobachtbare. Dementspre-
Fragen liefert? Gödel vermutete die Antwort im Bereich der Unend-
chend wird einer Fragestellung überhaupt
nur dann ein Sinn zugesprochen, wenn sie
lichkeitsaxiome. Durch die Hinzunahme eines solchen Axioms wird,
sich im Rahmen eines Experiments objek- grob gesprochen, die Existenz von sehr großen Zahlen postuliert – Zah-
tiv entscheiden lässt. Metaphysische An- len, die so groß sind, dass sich deren Existenz innerhalb der Zermelo-
schauungen oder Theorien gelten als be- Fraenkel-Mengenlehre weder beweisen noch widerlegen lässt.
deutungslos. Die Frage, ob z. B. die na-
türlichen Zahlen als Teil einer realen Ge- Anhand des „kleinsten“ Unendlichkeitsaxioms wollen wir einen Ein-
dankenwelt eigenständig existieren oder blick gewähren, wie die Hinzunahme eines solchen Axioms die Aus-
lediglich der menschlichen Phantasie ent- drucksstärke des entstehenden Systems verändert. Das besagte Axiom
springen, wird von einem Positivisten we- ist das Axiom des Unendlichen, das wir weiter oben schon kennen ge-
der bejaht noch verneint; stattdessen wird lernt haben. Es ist bereits Bestandteil von ZF und fordert die Existenz
sie als bedeutungsleer zurückgewiesen. einer Menge mit unendlich vielen Elementen. Die Theorie, die durch die
Der Platonismus erkennt mathematische Entnahme des Unendlichkeitsaxioms entsteht, sei mit ZF−ω bezeich-
Begriffe und Zusammenhänge als reale net. Zwischen ZF und ZF−ω besteht der erstaunliche Zusammenhang,
Gedankengebilde an, die in einem objek-
dass sich die Widerspruchsfreiheit von ZF−ω innerhalb von ZF bewei-
tiven Sinne existieren. Die Wahrheit oder
die Falschheit einer Aussage ist damit ei-
sen lässt. ZF−ω selbst ist aber stark genug, um die Zahlentheorie zu
ne Eigenschaft, die auch ohne das Vorhan- formalisieren, und kann nach dem zweiten Gödel’schen Unvollständig-
densein eines Beweises oder Gegenbewei- keitssatz ihre eigene Widerspruchsfreiheit nicht selbst beweisen. Das
ses existiert. Nicht nur in der Physik, son- bedeutet, dass wir durch die Hinzunahme des Unendlichkeitsaxioms in
dern auch in der Mathematik sehen Plato- der Lage sind, Theoreme zu beweisen, die in der alten Theorie unent-
niker den Wissenschaftler in der Rolle des scheidbar sind.
Entdeckers und nicht des Schöpfers.
Heute gehört die Erforschung von Unendlichkeitsaxiomen zu den ak-
tiven Forschungsschwerpunkten der Mengenlehre. Viele Male konnten
neue Axiome gefunden werden, mit denen sich die Zermelo-Fraenkel-
Mengenlehre zu immer stärkeren Theorien ausbauen lässt. Ob die Zah-
len überhaupt existieren, die durch die Hinzunahme großer Unendlich-
keitsaxiome postuliert wird, wissen wir nicht; die Existenz dieser Zah-
len ist ohne das Axiom weder beweisbar noch widerlegbar. Aber dür-
fen wir eine große unendliche Zahl überhaupt als existent bezeichnen?
Existieren diese Zahlen in einem platonisch absoluten Sinn, oder sind
wir gezwungen, auf eine positivistische Sichtweise auszuweichen, die
zwischen der Existenz und der Beweisbarkeit riesiger Zahlen nicht un-
terscheidet? Sie sehen, dass die Ergebnisse der modernen Mengenlehre
nicht nur aus inhaltlicher Sicht interessant sind. Mit ihr scheint eine
philosophische Auseinandersetzung in die Mathematik zurückzukeh-
ren, die der zunehmenden Formalisierung im zwanzigsten Jahrhundert
fast vollständig zum Opfer viel. Hier schließt sich der Kreis.
1.3 Übungsaufgaben 67

1.3 Übungsaufgaben

Die nachstehend aufgelisteten Axiome stammen aus Freges berühmter Begriffsschrift: Aufgabe 1.1

I Aussagenlogische Axiome
Webcode
§14 §15 §16 §17 §18 §19 1293
a a a b a a
b c d a a a
a b b a
c a b
a b
b d
c

I Prädikatenlogische Axiome
§20 §21 §22
f (d) (c ≡ c) f (c)
f (c) a f (a)
(c ≡ d)

Übersetzen Sie die Formeln in die moderne Notation.

In Abschnitt 1.2.2 haben wir herausgearbeitet, wie Cantor in seiner 1874 publizierten Arbeit Aufgabe 1.2
die Abzählbarkeit der algebraischen Zahlen bewies. Hierzu ordnete er jeder Gleichung der 
Form Webcode
an xn + an−1 xn−1 + . . . + a1 x + a0 1060
eine Höhe N zu, die sich wie folgt berechnet:
N = n − 1 + |an | + . . . + |a3 | + |a2 | + |a1 | + |a0 |
War Cantor gezwungen, die Definition in dieser komplizierten Form zu wählen, oder hätte er
sie durch eine der nachstehenden, leicht vereinfachten Definitionen ersetzen können?

a) N = n
b) N = |an | + . . . + |a3 | + |a2 | + |a1 | + |a0 |
c) N = n + |an | + . . . + |a3 | + |a2 | + |a1 | + |a0 |
68 1 Historische Notizen

Aufgabe 1.3 In Abschnitt 1.2.1 wurde gezeigt, wie sich die periodische Dezimalzahl 0,0238095 in den
 1
Bruch 42 überführen lässt.
Webcode
1898 a) Beweisen Sie auf die gleiche Weise die Beziehung 1 = 0, 9.
b) Hat der Trick, den wir zur Umwandlung verwendet haben, ein gewisses Unbehagen bei
Ihnen ausgelöst? Falls ja, dann besitzen Sie bereits ein gutes Gespür für die Gefahren im
Umgang mit dem aktual Unendlichen. Versuchen Sie, die Beziehung 1 = 0, 9 zu beweisen,
indem Sie vermeiden, eine unendliche Folge von Nachkommaziffern als ein abgeschlos-
senes Ganzes zu interpretieren.

Aufgabe 1.4 In Abbildung 1.20 haben wir gezeigt, wie sich zwei reelle Zahlen im Reißverschlussver-
 fahren zu einer einzigen reellen Zahl verschmelzen lassen. Auf diese Weise hatten wir eine
Webcode bijektive Abbildung zwischen R2 und R hergestellt und damit die Gleichmächtigkeit beider
1001 Mengen bewiesen.

...

...
0

9
0 9
0 9
0 0 9 9
0 0 9 9
0 , 1 0 0 , 1 9

0 , 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ... 0 , 1 0 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 ...

0 , 1 0 0 0 , 0 9 9
0 0 9 9
0 9
0 9
0 9
... ...

In Wirklichkeit haben wir an dieser Stelle ein wenig geschummelt, da die Dezimalbruchdar-
stellung einer reellen Zahl nicht immer eindeutig ist. Beispielsweise ist 0,11 = 0,109.

Das bedeutet, dass die von uns konstruierte Abbildung von R2 auf R nicht injektiv und da-
mit erst recht nicht bijektiv ist. Wie könnte man mit diesem Problem umgehen, ohne die
Grundidee der Reißverschlusskonstruktion komplett aufzugeben?

Aufgabe 1.5 Mit der Goldbach’schen Vermutung haben Sie eines der wichtigsten bis dato ungelösten
 Probleme der Zahlentheorie kennen gelernt. In ihrer starken Form lautet sie so:
Webcode
1367 „Jede gerade natürliche Zahl n > 2 lässt sich als Summe zweier Primzahlen schreiben.“

Zeigen Sie, dass aus der starken Goldbach’schen Vermutung die folgende Aussage folgt:

„Jede ungerade natürliche Zahl n > 5 lässt sich als Summe dreier Primzahlen schreiben.“
1.3 Übungsaufgaben 69

In dieser Aufgabe geht es erneut um die Goldbach’sche Vermutung. Aufgabe 1.6



a) Nehmen Sie an, die Vermutung sei falsch. Ließe sie sich dann mit den Mitteln der ge- Webcode
1651
wöhnlichen Arithmetik widerlegen?
b) Nehmen Sie an, die Goldbach’sche Vermutung sei mit den Mitteln der gewöhnlichen Ma-
thematik unbeweisbar. Lässt das Ergebnis in diesem Fall einen Rückschluss auf die Wahr-
heit oder die Falschheit der Vermutung zu?

c) Lässt sich das Ergebnis auf die Vermutung über die Existenz unendlich vieler Primzahl-
zwillinge übertragen?
d) Ist die Fermat’sche Vermutung ein mathematischer Satz vom Goldbach’schen Typ?

Die Erdős-Straus-Vermutung besagt, dass die Gleichung Aufgabe 1.7



4 1 1 1 Webcode
= + +
n a b c 1853
für jede natürliche Zahl n > 1 eine Lösung in den natürlichen Zahlen besitzt.

Könnten wir die Vermutung lösen, wenn wir im Besitz eines Entscheidungsverfahrens für
diophantische Gleichungen wären?

Ergänzen Sie die nachstehenden Aussagen. Aufgabe 1.8



Die Menge . . . leer endlich abzählbar überabzählbar Webcode
{M ∈ P(N) | N ⊆ M} ist     1600

{M ∈ P(N) | |M| = |N|} ist    


{M ∈ P(N) | |M| < |N|} ist    
{M ∈ P(N) | |M| > |N|} ist    
2 Formale Systeme

„Wenn es sich darum handelt, die


Grundlagen einer Wissenschaft zu untersuchen, so hat
man ein System von Axiomen aufzustellen, welche eine
genaue und vollständige Beschreibung derjenigen Be-
ziehungen enthalten, die zwischen den elementaren Be-
griffen jener Wissenschaft stattfinden. Die aufgestellten
Axiome sind zugleich die Definitionen jener elementa-
ren Begriffe, und jede Aussage innerhalb des Bereiches
der Wissenschaft, deren Grundlagen wir prüfen, gilt uns
nur dann als richtig, falls sie sich mittelst einer end-
lichen Anzahl logischer Schlüsse aus den aufgestellten
Axiomen ableiten lässt.“

David Hilbert [94]

2.1 Definition und Eigenschaften

In Kapitel 1 haben wir die axiomatische Methode als die Grundlage


der modernen mathematischen Beweisführung identifiziert und gezeigt,
wie sie das Bild der Mathematik im Laufe der Zeit verändert hat. Im
modernen Sinne wird das Führen eines Beweises als der Prozess ver-
standen, Sätze durch die Anwendung wohldefinierter Schlussregeln aus
einer kleinen Menge a priori festgelegter Grundannahmen, den Axio-
men, abzuleiten. Erst durch den präzisen deduktiven Charakter dieser
Vorgehensweise konnte sich die Mathematik zu der exakten Wissen-
schaft entwickeln, wie wir sie heute kennen.

Formale Systeme wurden mit dem Ziel geschaffen, die axiomatische


Methode in eine strenge Form zu bringen. Was wir darunter im Detail
zu verstehen haben, wollen wir anhand eines konkreten Beispiels, des
Beispielkalküls E, herausarbeiten. Der Begriff des Kalküls wird ab jetzt
häufiger auftauchen; wir werden ihn im Rest des Buchs als Synonym
für den Begriff des formalen Systems verwenden.

Dem Kalkül E nähern wir uns in mehreren Schritten, in denen nachein-


ander die Syntax, die Axiome und Schlussregeln sowie die Semantik von
E festgelegt werden.

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6_2
72 2 Formale Systeme

Ab jetzt werden wir es fort- Syntax


während mit zwei verschie-
denen Sprachebenen zu tun
haben. Die eine ist die Ebe- Die Syntax definiert, nach welchen Regeln die Ausdrücke (Formeln)
ne der Kalkülsprache, die andere die ge- aufgebaut sein müssen, die sich innerhalb des Kalküls erzeugen und
wöhnliche Sprache der Mathematik. Letz- manipulieren lassen. Eine Formel ist in diesem Stadium nichts weiter
tere wird auch als Meta-Ebene bezeichnet, als eine Folge von bedeutungsleeren Symbolen, die in einer festgelegten
weil wir sie verwenden können, um über Art und Weise miteinander kombiniert werden dürfen.
ein formales System zu sprechen. Auf die-
ser Ebene bewegen wir uns außerhalb des In den Formeln des Beispielkalküls E werden ausschließlich die Sym-
Systems und können unser volles mathe- bole ‚0‘, ‚s‘, ‚=‘, ‚>‘, ‚(‘, ‚)‘ und ‚¬‘ vorkommen. Die Menge dieser
matisches Instrumentarium einsetzen, um Symbole ist das Alphabet von E. Natürlich entspricht nicht jede Se-
seine Axiome und Schlussregeln zu ana- quenz von Alphabetzeichen einer Formel. Als Formeln gelten nur wohl-
lysieren und auf bestimmte Eigenschaf- geformte Zeichenketten, d. h. Zeichenketten, die nach bestimmten Bil-
ten hin zu untersuchen. Auf der Ebene der dungsregeln aufgebaut sind. Die Menge aller Formeln heißt die Sprache
Kalkülsprache (Objektebene) besitzen wir
von E.
diese Bewegungsfreiheit nicht. Die Syn-
tax und die Semantik der formulierbaren Für die Sprache des Beispielkalküls E vereinbaren wir die folgenden
Aussagen werden hier durch ein präzises Bildungsregeln:
Regelwerk in ein starres Korsett gepresst.
Die Vermischung von Objekt- und Meta-
I 0 ist ein Term.
Ebene ist eine häufige Ursache von Ver-
ständnisschwierigkeiten im Bereich der I Ist σ ein Term, dann ist es auch s(σ ).
mathematischen Logik und zugleich der
Ausgangspunkt vieler augenscheinlicher I Sind σ , τ Terme, so sind die folgenden Ausdrücke Formeln:
Paradoxa.
(σ = τ), (σ > τ), ¬(σ = τ), ¬(σ > τ)
Um eine klare Trennung beider Ebe-
nen herbeizuführen, werden alle For-
meln der Kalkülsprache in einer serifenlo- Terme sind die Grundbausteine der kalküleigenen Kunstsprache. In
sen Schrift dargestellt (z. B. s(0) = s(0)). symbolischer Form repräsentieren sie die Objekte, über die wir in E
Insbesondere dann, wenn die betrachte- sprechen können. Durch die wiederholte Anwendung der ersten beiden
ten Kalküle einen mächtigen Sprachum- Bildungsregeln lassen sich die nachstehenden Terme erzeugen:
fang besitzen, wird die unterschiedliche
Schriftwahl helfen, gewöhnliche mathe- 0, s(0), s(s(0)), s(s(s(0))), s(s(s(s(0)))), . . .
matische Aussagen von den Formeln des
Kalküls zu unterscheiden. Die dritte Bildungsregel definiert, wie Terme zu Formeln kombiniert
An verschiedenen Stellen dieses Buchs werden können. Unter anderem gehören die folgenden Formeln zur
werden immer wieder Formeln in ge- Sprache von E:
mischter Schreibweise auftreten, in denen
einzelne Formelbestandteile durch grie- (0 = 0), (0 > 0), ¬(0 = 0), (s(s(0)) = 0), ¬(0 = s(0)), . . .
chische Buchstaben ersetzt sind (z. B.
s(s(0)) = σ ). Ein solcher Ausdruck heißt
Formelschema und ist selbst keine For-
Axiome und Schlussregeln
mel der Kalkülsprache. Erst durch die
Substitution des Platzhalters σ durch
einen passenden Teilausdruck entsteht Die Axiome und die Schlussregeln von E sind in Tabelle 2.1 zusam-
eine wohlgeformte Zeichenkette (z. B. mengefasst. Ausgehend von einem einzigen Axiom stehen 6 Schlussre-
s(s(0)) = s(0)). geln zur Verfügung, die zur Ableitung neuer Theoreme genutzt werden
2.1 Definition und Eigenschaften 73

können. Für jede ableitbare Formel ϕ schreiben wir  ϕ und nennen ϕ Axiome (Kalkül E)
ein Theorem von E. Der Ausdruck  ϕ ist damit nichts anderes als die
symbolische Schreibweise für die Aussage: „ϕ ist in E beweisbar“.
(0 = 0) (A1)
Beachten Sie bei der Betrachtung der Schlussregeln, dass die Variablen
lediglich Platzhalter sind, die durch beliebige Terme substituiert wer- Schlussregeln (Kalkül E)
den können. So lassen sich aus dem Formelschema (s(σ ) > τ) unter
anderem die folgenden Instanzen bilden:
(σ = τ)
(S1)
(s(σ ) = s(τ))
I Substitution 1: S := [σ ← s(s(0)), τ ← 0]
(σ = τ)
(s(σ ) > τ)S = (s(s(s(0))) > 0) (S2)
(s(σ ) > τ)
I Substitution 2: S := [σ ← s(0), τ ← s(s(0))] (σ > τ)
(S3)
(s(σ ) > τ)S = (s(s(0)) > s(s(0))) (s(σ ) > τ)
(σ > τ)
(S4)
Mit den geleisteten Vorarbeiten sind wir in der Lage, den Kalkül ¬(σ = τ)
zum Leben zu erwecken und durch die systematische Anwendung von (σ > τ)
Schlussregeln neue Theoreme abzuleiten. (S5)
¬(τ = σ )
I Beispiel 1: Ableitung von (s(s(s(s(0)))) > s(s(0))) (σ > τ)
(S6)
¬(τ > σ )
1.  (0 = 0) (A1)
2.  (s(0) = s(0)) (S1, 1)
3.  (s(s(0)) = s(s(0))) (S1, 2) Tabelle 2.1: Axiome und Schlussregeln des
Beispielkalküls E. Alle Schlussregeln sind
4.  (s(s(s(0))) > s(s(0))) (S2, 3)
nach einem einheitlichen Schema aufge-
5.  (s(s(s(s(0)))) > s(s(0))) (S3, 4) baut. Über dem Mittelstrich ist die Prämisse
notiert. Sie beschreibt, auf welche Formeln
I Beispiel 2: Ableitung von ¬(s(s(0)) = s(s(s(0)))) die Schlussregel angewendet werden darf.
Die unter dem Mittelstrich notierte Aussa-
1.  (0 = 0) (A1) ge ist die Konklusion, d. h. die Schlussfol-
gerung, die aus der Prämisse abgeleitet wer-
2.  (s(0) = s(0)) (S1, 1)
den kann.
3.  (s(s(0)) = s(s(0))) (S1, 2)
4.  (s(s(s(0))) > s(s(0))) (S2, 3)
5.  ¬(s(s(0)) = s(s(s(0)))) (S5, 4)

Beide Beispiele verdeutlichen den symbolischen Charakter, den Bewei-


se in formalen Systemen besitzen. Dank der präzisen Ausformulierung
der Axiome und der Schlussregeln ist es nunmehr möglich, Theoreme
auf der syntaktischen Ebene abzuleiten, ohne den einzelnen Formel-
bestandteilen eine Bedeutung zuzumessen; das Führen eines Beweises
kommt der symbolischen Manipulation von Zeichenketten gleich.
74 2 Formale Systeme

Beweisbare Unbeweisbare Jetzt ist der Weg frei, um den Begriff des Beweises mit mathematischer
Aussagen Aussagen Präzision zu erfassen.

Syntaktische Ebene
(s(s(s(s(0)))) (0 > s(0))
> s(s(0))) Definition 2.1 (Beweis)
¬(s(s(0)) ¬(s(0) > s(0)) Ein formaler Beweis ist eine Kette von Formeln ϕ1 , ϕ2 , . . . , ϕn , die
Interpretation

= s(s(s(0))))
nach den folgenden Konstruktionsregeln gebildet wird:
I ϕi ist ein Axiom oder

23 Semantische Ebene I ϕi entsteht aus den vorangegangenen Gliedern der Beweiskette
durch die Anwendung einer Schlussregel.
11 0>1
4>2 Die letzte Formel dieser Kette ist das bewiesene Theorem.

Wahre Falsche
Aussagen Aussagen
Semantik
Abbildung 2.1: Eine Interpretation weist
den Formeln eines Kalküls eine Bedeutung
zu. In diesem Beispiel werden die Terme Nachdem wir die Sprache festgelegt und mit den Axiomen und den
als natürliche Zahlen, das Zeichen ‚=‘ als Schlussregeln die Grundlage für die Ableitung neuer Theoreme ge-
die Gleichheit und das Zeichen ‚>‘ als die schaffen haben, ist es Zeit, den Kalkül mit einer Semantik zu verse-
Größer-Relation auf den natürlichen Zahlen hen. Die Semantik bestimmt, wie wir die einzelnen Bestandteile einer
interpretiert. Das Symbol ‚¬‘ hat in allen Formel zu interpretieren haben, und verleiht den Formeln hierdurch ei-
Kalkülen die gleiche Bedeutung und steht
ne Bedeutung. Erst die Wahl einer konkreten Interpretation berechtigt
für die logische Negation (Verneinung).
uns dazu, von wahren und von falschen Formeln zu sprechen (Abbil-
dung 2.1). Behalten Sie dabei stets im Auge, dass der Wahrheitswert der
meisten Formeln von der gewählten Interpretation abhängt. Je nachdem,
für welche Interpretation wir uns entscheiden, kann eine Formel einmal
einer wahren und ein anderes Mal einer falschen Aussage entsprechen.

Von besonderem Interesse sind Interpretationen, in denen alle Theore-


me eines Kalküls wahre Aussagen sind. Eine solche Interpretation heißt
Modell. In Kapitel 7 werden wir uns im Rahmen der Modelltheorie aus-
führlich mit dem Aufbau, den Eigenschaften und der systematischen
Konstruktion von Modellen befassen.

Bevor wir die Semantik für den Beispielkalkül E festlegen, vereinbaren


wir die folgende Schreibweise:

n := s(s(. . . s (0) . . .)) (2.1)


n-mal

Die nachstehenden Beispiele zeigen, dass sich die meisten Formeln von
2.1 Definition und Eigenschaften 75

E jetzt deutlich kompakter schreiben lassen:

(4 > 2) steht für (s(s(s(s(0)))) > s(s(0)))


¬(2 = 3) steht für ¬(s(s(0)) = s(s(s(0))))
(0 > 1) steht für (0 > s(0))

Mithilfe der eingeführten Schreibweise legen wir die Interpretation der


Formeln von E wie folgt fest:

n) entspricht der natürlichen Zahl n ∈ N


(n = m) entspricht der Aussage n = m
(n > m) entspricht der Aussage n > m
¬(n = m) entspricht der Aussage n = m
¬(n > m) entspricht der Aussage n ≤ m

Weiter oben haben wir mit der Beweisbarkeitsrelation ‚‘ eine Schreib-
weise eingeführt, mit der die Ableitbarkeit einer Formel ausgedrückt
werden kann. In analoger Weise werden wir die Modellrelation ‚|=‘ ver-
wenden, um die Wahrheit einer Aussage zu äußern.

Offensichtlich gelten die folgenden Beziehungen:

|= (4 > 2)
|= ¬(2 = 3)
|= (0 > 1)
|= ¬(1 > 0)

Allgemein lässt sich die Modellrelation ‚|=‘ wie folgt definieren:

|= (n = m) :⇔ n = m (2.2)
|= (n > m) :⇔ n > m (2.3)
|= ¬ϕ :⇔ |= ϕ (2.4)

Die Definition stellt sicher, dass für keine Formel ϕ gleichzeitig |= ϕ


und |= ¬ϕ gelten kann. Diese Eigenschaft trägt der festen Semantik des
Negationsoperators ‚¬‘ Rechnung und wird von jeder Modellrelation
erfüllt. In unserem Beispiel gilt aber noch mehr. Die Beziehung (2.4)
stellt sicher, dass für jede Formel ϕ immer entweder |= ϕ oder |= ¬ϕ
gilt. Diese besondere Eigenschaft ist deshalb erfüllt, weil wir die Wahr-
heit und Falschheit einer Formel in unserem Beispiel bewusst an eine
ganz bestimmte Interpretation der Symbole geknüpft haben. In dieser
Standardinterpretation entspricht jede Formel ϕ einer arithmetischen
Aussage, die entweder wahr oder falsch ist, so dass entweder |= ϕ oder
76 2 Formale Systeme

|= ¬ϕ gelten muss. In der später diskutierten Aussagenlogik und Prädi-


katenlogik wird dies nicht mehr der Fall sein, da wir die Untersuchung
dort auf beliebige Interpretationen ausweiten werden. Mit |= ϕ werden
wir dann ausdrücken, dass ϕ allgemeingültig ist, d. h., in jeder mögli-
chen Interpretation wahr ist und nicht nur in einer ganz bestimmten. Ist
eine Formel ϕ für manche Interpretationen wahr und für andere falsch,
so gilt das Gleiche auch für ¬ϕ. In diesem Fall ist keine der Formeln ϕ
oder ¬ϕ allgemeingültig und es gilt weder |= ϕ noch |= ¬ϕ. Wir halten
fest:

Satz 2.1

I Es gilt niemals gleichzeitig |= ϕ und |= ¬ϕ.


I Aus |= ϕ folgt nicht in allen Logiken |= ¬ϕ.
Achten Sie darauf, die Ne-
gationsvollständigkeit nicht
mit der Vollständigkeit und Die Beweisbarkeitsrelation ‚‘ und die Modellrelation ‚|=‘ sind die
die Widerspruchsfreiheit Grundlage für die Definition wichtiger Kalküleigenschaften, die uns
nicht mit der Korrektheit zu verwechseln. durch alle Kapitel dieses Buchs begleiten werden. Behalten Sie die Be-
Jeder Begriff beschreibt eine andere griffe gut in Erinnerung!
Eigenschaft formaler Systeme.
In der angelsächsischen Literatur herrscht
eine genauso scharfe Abgrenzung zwi- Definition 2.2
schen den Begriffen. Ein negationsvoll-
ständiger Kalkül wird dort als negation
Ein formales System (Kalkül) heißt
complete und ein vollständiger Kalkül als I widerspruchsfrei, wenn aus  ϕ stets  ¬ϕ folgt,
complete bezeichnet. Ein widerspruchs-
freier Kalkül heißt consistent und ein kor- I negationsvollständig, wenn aus  ¬ϕ stets  ϕ folgt,
rekter Kalkül heißt sound.
Sowohl in der deutschsprachigen als auch I korrekt, wenn aus  ϕ stets |= ϕ folgt,
in der englischsprachigen Literatur wird
die Negationsvollständigkeit mitunter als I vollständig, wenn aus |= ϕ stets  ϕ folgt.
syntaktische Vollständigkeit und die Voll-
ständigkeit als semantische Vollständig-
keit bezeichnet. Wenn die Gefahr einer Demnach ist ein Kalkül genau dann widerspruchsfrei, wenn es nicht
Verwechslung ausgeschlossen ist, wird möglich ist, eine Formel ϕ zusammen mit ihrer Negation ¬ϕ abzu-
gerne auf den Zusatz „syntaktisch“ und leiten. Negationsvollständig ist ein Kalkül genau dann, wenn für jede
„semantisch“ verzichtet und dann nur Formel immer mindestens eine der beiden Alternativen ϕ oder ¬ϕ de-
noch von der Vollständigkeit eines Kal- duziert werden kann. Von besonderem Interesse sind Kalküle, die so-
küls gesprochen. Achten Sie bei dem Be- wohl widerspruchsfrei als auch negationsvollständig sind. Nur in die-
griff der Vollständigkeit also immer dar- sen Kalkülen gilt, dass für jede Formel immer genau eine der beiden
auf, ob er sich auf die syntaktische oder Alternativen ϕ oder ¬ϕ abgeleitet werden kann.
auf die semantische Ebene bezieht. In bei-
den Fällen ist seine Bedeutung eine völlig Die Widerspruchsfreiheit und die Negationsvollständigkeit sind syntak-
andere. tische Eigenschaften, da in ihrer Definition keinerlei Gebrauch von der
2.1 Definition und Eigenschaften 77

Bedeutung der einzelnen Symbolen gemacht wird. Im Gegensatz hierzu


sind die Korrektheit und die Vollständigkeit semantische Eigenschaften;
sie stellen einen Bezug zwischen der Beweisbarkeit und der Wahrheit
einer Aussage her. Ein Kalkül ist korrekt, wenn alle seine Theoreme
wahre Aussagen sind, und es ist vollständig, wenn jede wahre Aussage
auch ein Theorem ist, d. h., wenn sich jede wahre Formel durch die An-
wendung endlich vieler Schlussregeln aus den Axiomen ableiten lässt.
Es entsteht der natürliche Wunsch, sowohl korrekte als auch vollständi-
ge Kalküle zu definieren, da nur in ihnen der Unterschied zwischen der
Beweisbarkeit und der Wahrheit einer Aussage verschwindet.

Zwischen den syntaktischen Begriffen der Widerspruchsfreiheit und der


Negationsvollständigkeit sowie den semantischen Begriffen der Kor-
rektheit und der Vollständigkeit lassen sich zwei wichtige Zusammen-
hänge herstellen:

Satz 2.2

I Ist ein Kalkül vollständig und gilt für alle Formeln immer ent-
weder |= ϕ oder |= ¬ϕ, so ist er auch negationsvollständig.

I Ist ein Kalkül korrekt, so ist er auch widerspruchsfrei.

Die erste Aussage folgt direkt aus der Tatsache, dass zu jeder Formel ϕ
entweder ϕ selbst oder deren Negation ¬ϕ eine wahre Aussage ist (es
gilt nach Voraussetzung entweder |= ϕ oder |= ¬ϕ). Damit ist in einem
vollständigen Kalkül immer mindestens eine der beiden Formeln ab-
leitbar und der Kalkül damit negationsvollständig. Die zweite Aussage
folgt aus der Tatsache, dass sich in einem korrekten Kalkül nur wahre
Aussagen beweisen lassen. Da immer nur eine der beiden Formeln ϕ
und ¬ϕ wahr sein kann, ist immer auch nur eine der beiden Formeln
ableitbar und der Kalkül damit widerspruchsfrei.

Damit ist es an der Zeit, einen erneuten Blick auf das Beispielkalkül
E zu werfen und zu untersuchen, welche der in Definition 2.2 einge-
führten Eigenschaften erfüllt sind und welche nicht. Aus der genaueren
Analyse der Axiome und der Schlussregeln lassen sich die nachstehen-
den Schlussfolgerungen ziehen:

I E ist korrekt und widerspruchsfrei.


Die Korrektheit folgt aus der speziellen Bedeutung, die wir den For-
meln aus E zugewiesen haben. Mit der vorgenommenen Interpreta-
tion wird das (einzige) Axiom (A1) zu einer wahren Aussage über
78 2 Formale Systeme

die natürlichen Zahlen, und die Schlussregeln sind so gestaltet, dass


aus einer wahren Aussage wiederum eine wahre Aussage folgt. Nach
Satz 2.2 ist der Kalkül damit erst recht widerspruchsfrei.

I E ist weder negationsvollständig noch vollständig.


Negationsvollständig wäre der Kalkül nur dann, wenn sich für jede
Formel ϕ mindestens eine der Formeln ϕ und ¬ϕ ableiten lässt. Es
ist aber weder (0 > 0) noch ¬(0 > 0) ein Theorem von E. Damit
ist der Kalkül negationsunvollständig und wegen |= ¬(0 > 0) auch
unvollständig.

Wir wollen versuchen, den Kalkül E um zusätzliche Schlussregeln an-


zureichern. Hierzu sind in Tabelle 2.2 drei Kalkülerweiterungen zusam-
mengefasst, die wir jetzt nacheinander untersuchen werden. Unsere be-
sondere Aufmerksamkeit werden wir darauf richten, in welcher Weise
sich die eingeführten Kalküleigenschaften verändert haben.

Wir beginnen mit der Diskussion des Kalküls E2 , das sich von E le-
diglich durch die Hinzunahme der Schlussregel (S7) unterscheidet (Ta-
belle 2.2 links). Auf den ersten Blick geht durch die neue Regel die
Eigenschaft der Korrektheit verloren, da wir (S7) verwenden können,
um aus der Prämisse ¬(n > n) die Konklusion (n > n) abzuleiten. Über
den natürlichen Zahlen interpretiert, repräsentiert die erste Formel eine
wahre Aussage, die zweite aber ganz offensichtlich eine falsche.

Wir wollen nun versuchen, den Widerspruch innerhalb von E2 sichtbar


zu machen. Um mithilfe der Regel (S7) eine falsche Aussage herzulei-
ten, müssen wir für eine beliebige natürliche Zahl n zunächst die Formel
¬(n > n) beweisen. Anschließend können wir mit der Schlussregel (S7)
das Theorem (n > n) ableiten und hätten damit eine Formel ϕ gefunden,
für die sich sowohl ϕ als auch ¬ϕ beweisen lassen. Der Kalkül E2 wäre
hierdurch als widersprüchlich entlarvt.

Ein gezielter Blick auf die Schlussregeln zeigt, dass wir die Formel
¬(n > n) aber gar nicht innerhalb von E2 ableiten können. Die immer
noch nicht vorhandene Negationsvollständigkeit verhindert hier, dass
sich eine falsche Aussage beweisen lässt. Damit bleibt E2 trotz der
Hinzunahme der semantisch inkorrekten Schlussregel (S7) korrekt und
nach Satz 2.2 auch widerspruchsfrei.

Als Nächstes betrachten wir den Kalkül E3 , der aus E2 durch die erneu-
te Hinzunahme einer Schlussregel entsteht (Tabelle 2.2 Mitte). Durch
die neue Regel (S8) wird E3 in der Tat vollständig, d. h., jede wahre
Aussage, die sich in der begrenzten Sprache unserer Beispielkalküle
2.1 Definition und Eigenschaften 79

Axiome (Kalkül E2 ) Axiome (Kalkül E3 ) Axiome (Kalkül E4 )

(0 = 0) (A1) (0 = 0) (A1) (0 = 0) (A1)

Schlussregeln (Kalkül E2 ) Schlussregeln (Kalkül E3 ) Schlussregeln (Kalkül E4 )

(σ = τ) (σ = τ) (σ = τ)
(S1) (S1) (S1)
(s(σ ) = s(τ)) (s(σ ) = s(τ)) (s(σ ) = s(τ))
(σ = τ) (σ = τ) (σ = τ)
(S2) (S2) (S2)
(s(σ ) > τ) (s(σ ) > τ) (s(σ ) > τ)
(σ > τ) (σ > τ) (σ > τ)
(S3) (S3) (S3)
(s(σ ) > τ) (s(σ ) > τ) (s(σ ) > τ)
(σ > τ) (σ > τ) (σ > τ)
(S4) (S4) (S4)
¬(σ = τ) ¬(σ = τ) ¬(σ = τ)
(σ > τ) (σ > τ) (σ > τ)
(S5) (S5) (S5)
¬(τ = σ ) ¬(τ = σ ) ¬(τ = σ )
(σ > τ) (σ > τ) (σ > τ)
(S6) (S6) (S6)
¬(τ > σ ) ¬(τ > σ ) ¬(τ > σ )
¬(σ > τ) ¬(σ > τ)
(S7) (S7)
(τ > σ ) (τ > σ )
(σ = τ) (σ = τ)
(S8) (S8)
¬(σ > τ) ¬(σ > τ)

Tabelle 2.2: Axiome und Schlussregeln der Kalküle E2 , E3 und E4

formulieren lässt, ist ein Theorem von E3 . Nach Satz 2.2 ist E3 damit
automatisch auch negationsvollständig.

Gleichzeitig hat E3 durch die Hinzunahme von (S8) die nötige Aus-
drucksstärke erlangt, um den oben geschilderten Widerspruch innerhalb
des Kalküls nachvollziehen zu können. Der folgende Beweis demons-
triert, wie sich mit ¬(0 > 0) und (0 > 0) ein komplementäres Formel-
paar ableiten lässt:

1.  (0 = 0) (A1)
2.  ¬(0 > 0) (S8, 1)
3.  (0 > 0) (S7, 2)
80 2 Formale Systeme

Axiome (Kalkül E5 ) E3 ist somit widersprüchlich und nach Satz 2.2 erst recht inkorrekt.

Entfernen wir die problematische Schlussregel (S7), so gelangen wir


¬(0 = 0) (A1’) auf direktem Weg zu E4 (Tabelle 2.2 rechts). Obwohl dieser Kalkül ei-
ne Regel weniger besitzt, bleibt die Vollständigkeit erhalten; dafür sind
Schlussregeln (Kalkül E5 ) alle Widersprüche verschwunden. Mit E4 haben wir genau das vor uns,
wonach wir gesucht haben: Einen vollständigen und korrekten Kalkül,
in dem sich jede wahre Aussage durch die Anwendung von endlich vie-
¬(σ = τ)
(S1’) len Schlussregeln aus den Axiomen ableiten lässt.
¬(s(σ ) = s(τ))
Als vorletztes Beispiel betrachten wir den Kalkül E5 , dessen Axiome
¬(σ = τ) und Schlussregeln in Tabelle 2.3 zusammengefasst sind. Von dem kor-
(S2’)
¬(s(σ ) > τ) rekten und vollständigen Kalkül E4 unterscheidet er sich dadurch, dass
¬(σ > τ) alle Prämissen und Konklusionen negiert auftauchen. E5 verhält sich
(S3’) hierdurch vollständig komplementär zu E4 , d. h., eine Aussage ϕ lässt
¬(s(σ ) > τ)
sich in E5 genau dann ableiten, wenn seine Negation in E4 ableitbar ist.
¬(σ > τ) Der Kalkül ist der perfekte Lügner; jedes seiner Theoreme entspricht ei-
(S4’)
(σ = τ) ner falschen Aussage, und jede falsche Aussage ist zudem ein Theorem.
Damit ist E5 weder korrekt noch vollständig, besitzt aber weiterhin die
¬(σ > τ) syntaktischen Eigenschaften der Widerspruchsfreiheit und Negations-
(S5’)
(τ = σ ) vollständigkeit. E5 ist der Beweis dafür, dass die Schlussrichtungen in
Satz 2.2 nicht umgekehrt werden dürfen.
¬(σ > τ)
(S6’)
(τ > σ )
Satz 2.3

I Nicht jeder negationsvollständige Kalkül ist vollständig.


¬(σ = τ)
(S8’)
(σ > τ) I Nicht jeder widerspruchsfreie Kalkül ist korrekt.

Tabelle 2.3: Axiome und Schlussregeln des Alle formalen Systeme basieren auf demselben Kerngedanken, Theore-
Kalküls E5 me durch die Anwendung fest definierter Schlussregeln aus den Axio-
men herzuleiten. Erst aus der Nähe betrachtet werden die großen Unter-
schiede in ihren Erscheinungsformen sichtbar. Einige Kalküle, zu de-
nen auch die bisher besprochenen gehören, besitzen wenige Axiome
und erlangen ihre Aussagekraft durch ein umfangreiches Repertoire an
Schlussregeln. Andere sind reich an Axiomen und kommen dafür mit
wenigen Schlussregeln aus. Nicht selten verfügen solche Kalküle über
unendlich viele Axiome, die aus einem oder mehreren Axiomenschema-
ta erzeugt werden.

Was wir darunter im Detail zu verstehen haben, klärt ein Blick auf Ta-
belle 2.4. Der dargestellte Kalkül E6 verfügt neben dem bekannten Axi-
om (A1) über sieben Schemata, aus denen eine unendliche Anzahl wei-
terer Axiome gewonnen werden kann. Dagegen gibt es mit dem Modus
2.1 Definition und Eigenschaften 81

ponens (MP) nur noch eine einzige Schlussregel. Ein direkter Vergleich Axiome (Kalkül E6 )
zwischen E6 und dem vollständigen und korrekten Kalkül E4 zeigt, dass
zwischen beiden zwar ein struktureller, aber kein inhaltlicher Unter- (0 = 0) (A1)
schied besteht. In beiden Kalkülen lassen sich ausnahmslos die gleichen
Theoreme ableiten. (σ = τ) → (s(σ ) = s(τ)) (A2)

I Beispiel 1: Ableitung von (s(s(s(s(0)))) > s(s(0))) (σ = τ) → (s(σ ) > τ) (A3)

1.  (0 = 0) (A1) (σ > τ) → (s(σ ) > τ) (A4)


2.  (0 = 0) → (s(0) = s(0)) (A2)
3.  (s(0) = s(0)) (MP, 1,2) (σ > τ) → ¬(σ = τ) (A5)
4.  (s(0) = s(0)) → (s(s(0)) = s(s(0))) (A2)
(σ > τ) → ¬(τ = σ ) (A6)
5.  (s(s(0)) = s(s(0))) (MP, 3,4)
6.  (s(s(0)) = s(s(0))) → (s(s(s(0))) > s(s(0))) (A3) (σ > τ) → ¬(τ > σ ) (A7)
7.  (s(s(s(0))) > s(s(0))) (MP, 5,6)
8.  (s(s(s(0))) > s(s(0))) → (s(s(s(s(0)))) > s(s(0))) (A4) (σ = τ) → ¬(τ > σ ) (A8)
9.  (s(s(s(s(0)))) > s(s(0))) (MP, 7,8)
Schlussregeln (Kalkül E6 )
I Beispiel 2: Ableitung von ¬(s(s(0)) = s(s(s(0))))
σ,σ → τ
1. 
(0 = 0) (A1) (MP)
τ
2. 
(0 = 0) → (s(0) = s(0)) (A2)
3. 
(s(0) = s(0)) (MP, 1,2)
Tabelle 2.4: Axiome und Schlussregeln des
4. 
(s(0) = s(0)) → (s(s(0)) = s(s(0))) (A2)
Kalküls E6
5. 
(s(s(0)) = s(s(0))) (MP, 3,4)
6.  (s(s(0)) = s(s(0))) → (s(s(s(0))) > s(s(0))) (A3)
7.  (s(s(s(0))) > s(s(0))) (MP, 5,6)
8.  (s(s(s(0))) > s(s(0))) → ¬(s(s(0)) = s(s(s(0)))) (A6)
9.  ¬(s(s(0)) = s(s(s(0)))) (MP, 7,8)

In der Tat sind die meisten Kalküle, die wir später kennen lernen wer-
den, in dieser Form gestaltet. Die Beziehungen zwischen den unter-
suchten Objekten werden in den Axiomen codiert sein und nicht in den
Schlussregeln. Der gewählte Ansatz besticht vor allem durch seine All-
gemeinheit. Gleichgültig, ob wir es später mit der Zahlentheorie, der
Mengenlehre oder einem anderen Gebiet der Mathematik zu tun haben
werden: Der formale Schlussapparat bleibt stets der gleiche.

Um welche Schlussregeln es sich hierbei im Detail handelt, werden wir


in den Abschnitten 2.3 und 2.4 herausarbeiten. Dort werden wir mit der
82 2 Formale Systeme

Aussagenlogik und der Prädikatenlogik den Standardapparat des forma-


len logischen Schließens ausführlich besprechen.

An dieser Stellen wollen wir den Begriff des formalen Systems noch um
einen wichtigen Baustein ergänzen. Die Rede ist von Annahmen, die in
der klassischen Mathematik in den verschiedensten Formen gemacht
werden und nicht notwendigerweise selbst wahr sein müssen. Um auch
Aussagen der Form „Unter der Annahme, dass M gilt, folgt . . . “ mithil-
fe eines formalen Systems modellieren zu können, erlauben wir, einen
Beweis um eine Menge von Voraussetzungen zu ergänzen. In diesem er-
weiterten Kalkül ist ein Beweis eine Kette von Formeln ϕ1 , ϕ2 , . . . , ϕn ,
die nach den folgenden Konstruktionsregeln gebildet wird:

I ϕi ist ein Axiom oder


I ϕi ist eine Voraussetzung oder
I ϕi entsteht aus den vorangegangenen Gliedern der Beweiskette
durch die Anwendung einer Schlussregel.

Bezeichnet M die Menge der Voraussetzungen, so schreiben wir M  ϕ,


falls sich die Formel ϕ mit den beschriebenen Konstruktionsregeln ab-
leiten lässt. Mit dieser Notation können wir den weiter oben eingeführ-
ten Ausdruck  ϕ als abkürzende Schreibweise für 0/  ϕ auffassen.

Offenbar gelten die folgenden Beziehungen:

Satz 2.4

I {ϕ} ∪ M  ϕ

I Aus M ⊂ N und M  ϕ folgt N  ϕ


I Aus M  ϕ1 , . . . , M  ϕn und {ϕ1 , . . . , ϕn }  ϕ folgt M  ϕ
I M  ϕ ⇔ für eine endliche Teilmenge M  ⊆ M gilt M   ϕ

Die Korrektheit der ersten drei Aussagen folgt unmittelbar aus den oben
genannten Konstruktionsregeln. Einzig die letzte Aussage verdient un-
sere Beachtung. Sie gilt, da jeder Beweis aus einer endlichen Kette von
Formeln besteht. Das bedeutet, dass wir M  ganz einfach aus einem
vorliegenden Beweis konstruieren können, indem wir alle verwendeten
Voraussetzungen aufsammeln. Die endliche Anzahl von Beweisschrit-
ten stellt dann sicher, dass auch M  endlich ist.
2.2 Entscheidungsverfahren 83

2.2 Entscheidungsverfahren

„Das Entscheidungsproblem ist ge-


löst, wenn man ein Verfahren kennt, das bei einem vor-
gelegten logischen Ausdruck durch endlich viele Ope-
rationen die Entscheidung über die Allgemeingültigkeit
bzw. Erfüllbarkeit erlaubt. [...] Das Entscheidungspro-
blem muss als das Hauptproblem der mathematischen
Logik bezeichnet werden“

David Hilbert, Wilhelm Ackermann (Abb. 2.2) [92]

In Abschnitt 2.1 haben wir anhand mehrerer Beispiele die elementaren


Eigenschaften formaler Systeme herausgearbeitet. Wie die Sprache, die
Axiome oder die Schlussregeln eines Kalküls prinzipiell aussehen dür-
fen, haben wir bisher noch nicht exakt festgelegt und müssen es auch
gar nicht. Für alle Betrachtungen, die nun folgen werden, ist es völlig
ausreichend, wenn die untersuchten Kalküle die folgenden Minimal-
eigenschaften erfüllen:

I Die Anzahl der verwendeten Alphabetzeichen ist endlich.

I Für jede Zeichenkette lässt sich entscheiden, ob sie eine Formel ist.

I Für jede Formelfolge lässt sich entscheiden, ob sie ein Beweis ist.

Es bedarf einer gehörigen Portion destruktiven Scharfsinns, um ein for-


males System zu ersinnen, das diese Eigenschaften nicht erfüllt. Aus-
geschlossen werden lediglich pathologische Konstrukte, in denen z. B.
unendlich lange Beweisketten zugelassen sind oder ein endliches Sym-
bolalphabet nicht ausreicht, um alle Formeln niederzuschreiben.
Mit der getroffenen Vereinbarung sind wir gerüstet, um auf ein zentrales
Problem des Hilbert’schen Programms zurückzukommen:
Wilhelm Friedrich Ackermann
(1896 – 1962)
Definition 2.3 (Entscheidungsproblem, syntaktisch)
Abbildung 2.2: Der deutsche Mathemati-
Die syntaktische Variante des Entscheidungsproblems lautet: ker Wilhelm Ackermann gehörte zu den
bekanntesten Schülern von David Hilbert.
I Gegeben: ein Kalkül K und eine Formel ϕ Heute wird sein Name vor allem mit der
Ackermann-Funktion verbunden, die uns in
I Gefragt: Gilt  ϕ ? Kapitel 4 beschäftigen wird.
84 2 Formale Systeme

Um das Entscheidungsproblem zu lösen, müssen wir ein systematisches


Ist die Formel Verfahren ersinnen, das für jede Formel ϕ immer korrekt beantworten
 = (s(s(0)) > s(0)) kann, ob ϕ ein Theorem ist, d. h., ob sich ϕ durch die Anwendung end-
beweisbar? lich vieler Schlussregeln aus den Axiomen ableiten lässt. Ein solches
Verfahren heißt Entscheidungsverfahren.

Für Hilbert war die Suche nach einem Entscheidungsverfahren ein zen-
(0 = 0) traler Baustein seines Programms. In Kapitel 5 werden wir zeigen,
warum Hilberts Traum für weite Teile der Mathematik niemals Rea-
lität werden konnte, doch bevor wir dieses negative Resultat im Detail
diskutieren, wollen wir ein positives vorausschicken:
(s(0) = s(0))

(0 = 0)
Satz 2.5

Jeder widerspruchsfreie, negationsvollständige Kalkül besitzt ein


(s(0) > 0) Entscheidungsverfahren.

Ob eine vorgelegte Formel ϕ in einem widerspruchsfreien und negati-


(s(s(0)) = s(s(0)))
onsvollständigen Kalkül bewiesen werden kann, kann auf ganz unter-
(s(0) = s(0))
(s(s(0)) > s(0)) schiedlichem Wege entschieden werden. Abhängig von der Vorgehens-
weise sprechen wir von einem Bottom-up-Verfahren oder von einem
(0 = 0) (s(s(0)) > 0) Top-down-Verfahren:
¬(s(0) = 0)
(s(0) > 0) I Bottom-up-Entscheidungsverfahren (Abbildung 2.3)
¬(0 = s(0))
Um zu entscheiden, ob eine Formel ϕ bewiesen werden kann, prüfen
¬(0 > s(0)) wir zunächst, ob sich ϕ oder ¬ϕ unter den Axiomen befindet. Ist dies
nicht der Fall, erzeugen wir durch die Anwendung der Schlussre-
Abbildung 2.3: Bottom-up-Entscheidungs- geln neue Theoreme. Wenden wir die Regeln in jedem Schritt auf
verfahren für negationsvollständige und wi- ausnahmslos alle der bisher generierten Formeln an, so erhalten wir
derspruchsfreie Kalküle. Ausgehend von nach dem n-ten Schritt exakt diejenigen Theoreme, die in höchstens
den Axiomen werden durch die sukzessive n Ableitungsschritten aus den Axiomen deduziert werden können.
Anwendung der Ableitungsregeln so lange Die geschilderte Prozedur führen wir nun so lange durch, bis ent-
neue Theoreme erzeugt, bis ϕ oder ¬ϕ dar-
weder die Formel ϕ oder die Formel ¬ϕ unter den Theoremen auf-
unter ist.
taucht. Da in einem negationsvollständigen Kalkül mindestens ei-
ne dieser Formeln abgeleitet werden kann, terminiert das Verfahren
nach endlich vielen Schritten.
Das Bottom-up-Verfahren scheint uns auf direktem Weg zum Ziel zu
führen, und für Kalküle mit einer endlichen Axiomenmenge und ei-
ner endlichen Anzahl von Schlussregeln ist dies auch tatsächlich der
Fall. Für diese Kalküle haben wir ein einfaches Verfahren zur Hand,
mit dem wir in endlicher Zeit entscheiden können, ob eine Formel
ϕ beweisbar ist oder nicht. Komplizierter wird die Situation dann,
2.2 Entscheidungsverfahren 85

wenn die Axiome als Schemata ausgelegt sind, die mit beliebigen
Teilausdrücken instanziert werden dürfen. In diesem Fall müssten Ist die Formel
wir mit einer unendlichen Anzahl an Axiomen beginnen. Ebenfalls  = (s(s(0)) > s(0))
denkbar ist, dass die Schlussregeln schematisch definiert sind. Dann beweisbar?
wäre es möglich, dass in einem einzigen Schritt unendlich viele neue
Theoreme entstehen. Für solche Kalküle könnten wir das geschilder-
te Verfahren zunächst nicht anwenden.
 = (s(s(0)) > s(0))
Dennoch lassen sich auch solche Kalküle entscheiden, z. B. mit dem
Top-Down-Verfahren. Dieses ist so allgemein gehalten, dass es ohne Nein Erzeuge eine neue
Nachdenken auf jeden Kalkül anwendbar ist, der die oben formulier- Zeichenkette aus
ten Minimaleigenschaften erfüllt. den Symbolen der
Kalkülsprache
I Top-down-Entscheidungsverfahren (Abbildung 2.4)
Um zu entscheiden, ob eine Formel ϕ beweisbar ist, gehen wir fol-
gendermaßen vor: Ist die Zeichenkette
eine Formelfolge?
• Alle Zeichenketten, die mit Symbolen der Kalkülsprache aufge-
baut sind, werden der Reihe nach aufgezählt. Eine einfache Mög- Ja
lichkeit besteht darin, zunächst die Zeichenketten der Länge 1
aufzuzählen, danach die Zeichenketten der Länge 2 und so fort. Ist die Zeichenkette
ein Beweis?
Da wir nur endlich viele Alphabetzeichen zulassen, muss jede
Zeichenkette irgendwann in der Aufzählung erscheinen. Ja
• Alle Zeichenketten, die keiner Formelfolge entsprechen, werden
verworfen. Das Gleiche gilt für Formelfolgen, die keine Beweise Ist die letzte Formel
sind. Die Wahrscheinlichkeit, dass eine zufällig gebildete Zei- gleich  ? Ja
chenkette diese Überprüfungsschritte übersteht, ist denkbar ge- 


Nein
ring. Dennoch stellt die systematische Aufzählung sicher, dass
jeder Beweis, unabhängig von seiner Komplexität, irgendwann
Ist die letzte Formel
einmal erscheinen wird. gleich ¬  ? Ja
• Für jede gefundene Zeichenkette, die einem Beweis entspricht, 


wird geprüft, ob die letzte Formel gleich ϕ oder gleich ¬ϕ ist.
Im ersten Fall ist bewiesen, dass ϕ ein Theorem ist, im zweiten Abbildung 2.4: Top-down-Entscheidungs-
Fall, dass ϕ kein Theorem ist. Die Negationsvollständigkeit stellt verfahren für negationsvollständige und wi-
sicher, dass für mindestens eine der beiden Formeln ein Beweis derspruchsfreie Kalküle
existiert und der Algorithmus damit für jede Eingabe terminiert.

Die Forderung der Widerspruchsfreiheit ist essenziell für das Funk-


tionieren beider Verfahren, da wir in einem widersprüchlichen Kal-
kül aus der Ableitbarkeit von ¬ϕ nicht auf die Nichtableitbarkeit
von ϕ schließen können. Das bedeutet, dass wir in einem potenziell
widersprüchlichen Kalkül nicht abbrechen dürfen, wenn ein Beweis
für ¬ϕ gefunden wurde. Es wäre durchaus möglich, dass zu einem
späteren Zeitpunkt auch ein Beweis für ϕ auftaucht. ϕ wäre dann
ebenfalls ein Theorem.
86 2 Formale Systeme

An dieser Stelle wollen wir ein wenig Sand in unser Begriffsgetriebe


streuen und das Eingangszitat von Hilbert und Ackermann betrachten.
Ist Ihnen aufgefallen, dass der Begriff der Beweisbarkeit dort an kei-
ner Stelle erwähnt wird? Tatsächlich haben Hilbert und Ackermann das
Entscheidungsproblem gar nicht auf der syntaktischen, sondern auf der
semantischen Ebene definiert.

Definition 2.4 (Entscheidungsproblem, semantisch)

Die semantische Variante des Entscheidungsproblems lautet:

I Gegeben: eine Formel ϕ


I Gefragt: Gilt |= ϕ ?

Diese Definition entspricht der historischen Formulierung. Beide Va-


rianten des Entscheidungsproblems besagen inhaltlich etwas anderes,
und wir tun im Allgemeinen gut daran, sie wohl voneinander zu unter-
scheiden. Eine Ausnahme liegt dann vor, wenn wir einen korrekten und
vollständigen Kalkül vor uns haben. In diesem Fall gilt die Beziehung
 ϕ ⇔ |= ϕ, so dass wir jedes Entscheidungsverfahren für die syntakti-
sche Ebene ohne Änderung einsetzen können, um das semantische Ent-
scheidungsproblem zu lösen.

Satz 2.6

Für einen korrekten und vollständigen Kalkül sind das syntaktische


und das semantische Entscheidungsproblem äquivalent.

Wir haben gesehen, dass die Unterschiede zwischen der syntaktischen


und der semantischen Ebene verschwinden, wenn wir einen korrekten
und vollständigen Kalkül vor uns haben. Ein Kalkül, auf den das zutrifft,
ist die Prädikatenlogik erster Stufe, die wir in Abschnitt 2.4 behandeln
werden, und auf genau diesen Kalkül bezieht sich auch der Original-
wortlaut von Hilbert und Ackermann. Hier spielt es keine Rolle, ob wir
das Entscheidungsproblem auf der semantischen oder auf der syntakti-
schen Ebene formulieren. Dies ist der Grund, warum wir ab jetzt nur
noch ganz allgemein von dem (Hilbert’schen) Entscheidungsproblem
sprechen werden.
2.3 Aussagenlogik 87

2.3 Aussagenlogik

Die Aussagenlogik (PL0) beschäftigt sich mit atomaren Aussagen, die


entweder wahr oder falsch sein können, und den Beziehungen, die zwi-
In Definition 2.5 haben wir
schen solchen Aussagen bestehen („Es regnet“, „Die Straße ist nass“,
die logischen Operatoren in
„Wenn es regnet, dann ist die Straße nass“). Die Bedeutung der Aussa- der Schreibweise angegeben, die im deut-
genlogik ist beträchtlich. Sie ist als Teilmenge in nahezu allen formalen schen Sprachraum heute üblich ist. Tabel-
Schlussapparaten enthalten und damit der kleinste gemeinsame Nenner, le 2.5 zeigt, dass die verwendeten Symbo-
über den alle Logiken miteinander verbunden sind. le auf den deutschen Mathematiker Hans
Hermes zurückgehen [86]. Es ist keine
Besonderheit, dass sich die ursprünglich
verwendete Notation im Laufe der Zeit
2.3.1 Syntax und Semantik weiterentwickelt hat, wohl aber die Ge-
schwindigkeit, mit der sich die Verän-
Genau wie im Fall der Beispielkalküle aus Abschnitt 2.1 nähern wir uns derung vollzog. Die Gründe hierfür sind
der Aussagenlogik in zwei Schritten. Wir beginnen mit der Definition vielfältig. Zum einen betraten die Pro-
der Syntax und legen im Anschluss daran die Semantik fest. tagonisten der ersten Stunde unbefleck-
tes Neuland, und eine passende Notati-
on stand nicht griffbereit zur Seite. Zum
anderen waren viele Mathematiker der
Definition 2.5 (Syntax der Aussagenlogik) Überzeugung, ihre neuartigen Ideen nur in
einer eigens dafür geschaffenen Sprache
Die Menge der aussagenlogischen Formeln über dem Variablenvor- formulieren zu können. Die babylonische
rat V = {A1 , A2 , A3 , . . .} ist rekursiv definiert: Sprachverwirrung macht uns das Leben
heute nicht leicht. Auf frisch ausgebilde-
I 0 und 1 sind Formeln.
te Mathematiker wirken die historischen
I Jede Variable aus der Menge V ist eine Formel. Arbeiten aus dem Bereich der Logik oft
fremdartig und sind ohne eine aufwendi-
I Sind ϕ und ψ Formeln, dann sind es auch ge Einarbeitung in die damals verwendete
Nomenklatur kaum noch zu lesen.
(¬ϕ), (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ), (ϕ ↔ ψ), (ϕ  ψ)

Konjunktion
Disjunktion

Implikation

Äquivalenz
Negation

Der Operator ‚¬‘ ist die Negation, ‚∧‘ die Konjunktion (UND-
Operator), ‚∨‘ die Disjunktion (ODER-Operator) und ‚→‘ die Impli-
kation. Ferner bezeichnen wir ‚↔‘ als Äquivalenz- und ‚‘ als Antiva-
−ϕ ∪ ∩ . =
C
Peano
lenzoperator (XOR-Operator).
Russell ∼ϕ ∨ . ⊃ ≡
Eine Formel, die lediglich aus einem Wahrheitswert oder einer aussa-
genlogischen Variablen besteht, heißt atomar. Sie besitzt die Eigen- Hilbert ϕ ∨ & → ∼
schaft, dass sie nicht weiter zerlegt werden kann. Eine Formel ϕ, die Hermes ¬ϕ ∨ ∧ → ↔
als Teil einer anderen Formel ψ vorkommt, bezeichnen wir als Teilfor-
mel von ψ und verwenden hierfür die etwas informelle Notation ϕ ∈ ψ.
Ist ϕ keine Teilformel von ψ, so schreiben wir ϕ ∈ ψ. Variablen wer- Tabelle 2.5: Alternative Schreibweisen der
den im Folgenden durchweg mit Großbuchstaben bezeichnet, allerdings aussagenlogischen Operatoren [127]
88 2 Formale Systeme

I Bindungsregeln (Beispiele) werden wir von Fall zu Fall den Symbolvorrat anpassen und z. B. A, B, C
anstelle von A1 , A2 , A3 verwenden.
¬A ∧ B = ((¬A) ∧ B)
A ∨ B ∧ C = (A ∨ (B ∧ C)) Ferner werden wir auf die Niederschrift des einen oder anderen Klam-
A → C ∨ B = (A → (C ∨ B)) merpaars verzichten, wenn eine Formel hierdurch leichter lesbar wird.
A → B  C = ((A → B)  C) Wie in Abbildung 2.5 gezeigt, legen wir die übliche Konvention zugrun-
A  B → C = ((A  B) → C) de, dass die Negation ‚¬‘ stärker bindet als die Konjunktion ‚∧‘ und
diese wiederum stärker als die Disjunktion ‚∨‘. Die Operatoren ‚→‘,
I Kettenregeln (Beispiele) ‚↔‘ und ‚‘ binden am schwächsten; kommen sie in einem Ausdruck
gemischt vor, so erfolgt die Klammerung linksassoziativ. Werden Teil-
¬¬A = (¬(¬A)) terme mit demselben Operator verknüpft, so betrachten wir die entste-
A ∧ B ∧ C = ((A ∧ B) ∧ C) hende Kette ebenfalls als linksassoziativ geklammert. Die einzige Aus-
A ∨ B ∨ C = ((A ∨ B) ∨ C) nahme bildet der (einstellige) Negationsoperator, der rechtsassoziativ
A → B → C = ((A → B) → C) gruppiert wird.
A ↔ B ↔ C = ((A ↔ B) ↔ C) Die zweistelligen Operatoren ‚∧‘ und ‚∨‘ lassen sich zu mehrstelligen
A  B  C = ((A  B)  C) Operatoren verallgemeinern. Hierzu vereinbaren wir für die endlich vie-
len Formeln ϕ1 , . . . , ϕn die folgende Schreibweise:
   
Abbildung 2.5: Zur Vereinfachung der 
n 
n
Schreibweise dürfen Klammerpaare weg- ϕi := ϕ1 ∧ . . . ∧ ϕn ϕi := ϕ1 ∨ . . . ∨ ϕn
gelassen werden. Zweideutigkeiten werden i=1 i=1
mithilfe von Bindungs- und Kettenregeln
beseitigt. Erstere teilen die Operatoren in Nachdem wir den syntaktischen Aufbau einer Formel vollständig fixiert
schwächer bindende und stärker bindende haben, wollen wir im nächsten Schritt die Semantik der Aussagenlogik
Operatoren ein, Letztere regeln den Um- festlegen. Hierzu werden wir vorab klären, was sich hinter dem bereits
gang mit Ausdrücken, in denen der glei- mehrfach zitierten Begriff der Interpretation genau verbirgt, und im An-
che Operator mehrmals hintereinander vor- schluss daran die Modellrelation ‚|=‘ definieren.
kommt.

Definition 2.6 (Interpretation)

Sei ϕ eine aussagenlogische Formel. A1 , . . . , An bezeichnen die in


ϕ vorkommenden Variablen. Dann heißt jede Abbildung

I : {A1 , . . . , An } → {0, 1}

eine Interpretation von ϕ.

Eine Interpretation ordnet jeder Variablen einer aussagenlogischen For-


mel ϕ einen der beiden Wahrheitswerte 0 oder 1 zu und wird aufgrund
dieser Eigenschaft auch als Belegung bezeichnet.

Mit dem Begriff der Interpretation haben wir die Grundlage geschaffen,
um die Semantik der Aussagenlogik formal zu definieren:
2.3 Aussagenlogik 89

Definition 2.7 (Semantik der Aussagenlogik) I 1. Interpretation: I(A) = 0, I(B) = 0

ϕ und ψ seien aussagenlogische Formeln und I eine Interpretation. ( A → B )→( B → A )


Die Semantik der Aussagenlogik ist durch die Modellrelation ‚|=‘ I |= A I |= B I |= B I |= A
gegeben, die induktiv über dem Formelaufbau definiert ist: I |= A→B I |= B→A

I |= 1 I |= (A→B)→(B→A)

I |= 0
I 2. Interpretation: I(A) = 0, I(B) = 1
I |= Ai :⇔ I(Ai ) = 1
( A → B )→( B → A )
I |= (¬ϕ) :⇔ I |= ϕ
I |= A I |= B I |= B I |= A
I |= (ϕ ∧ ψ) :⇔ I |= ϕ und I |= ψ
I |= (ϕ ∨ ψ) :⇔ I |= ϕ oder I |= ψ I |= A→B I |= B→A

I |= (ϕ → ψ) :⇔ I |= ϕ oder I |= ψ I |= (A→B)→(B→A)

I |= (ϕ ↔ ψ) :⇔ I |= ϕ → ψ und I |= ψ → ϕ
I 3. Interpretation: I(A) = 1, I(B) = 0
I |= (ϕ  ψ) :⇔ I |= (ϕ ↔ ψ)
( A → B )→( B → A )
Eine Interpretation I mit I |= ϕ heißt Modell für ϕ. I |= A I |= B I |= B I |= A

I |= A→B I |= B→A

Abbildung 2.6 demonstriert den Semantikbegriff an einem konkreten I |= (A→B)→(B→A)


Beispiel.
I 4. Interpretation: I(A) = 1, I(B) = 1
Wir können jede aussagenlogische Formel ϕ mit n Variablen als eine
( A → B )→( B → A )
boolesche Funktion fϕ : {0, 1}n → {0, 1} auffassen, die für eine Bele-
gung I genau dann den Funktionswert 1 annimmt, wenn I ein Modell für I |= A I |= B I |= B I |= A
ϕ ist. Mit anderen Worten: Weist I den Variablen A1 , . . . , An die Wahr- I |= A→B I |= B→A
heitswerte a1 , . . . , an zu, dann ist der Funktionswert fϕ (a1 , . . . , an ) wie
I |= (A→B)→(B→A)
folgt gegeben:

1 falls I |= ϕ Abbildung 2.6: Eine Interpretation I ordnet
fϕ (a1 , . . . , an ) :=
0 falls I |= ϕ jeder aussagenlogischen Variablen einen
der beiden Wahrheitswerte 0 (falsch) oder
Aufgrund des diskreten Definitionsbereichs lässt sich eine n-stellige 1 (wahr) zu, hier demonstriert am Beispiel
der Formel ϕ = (A → B) → (B → A).
boolesche Funktion als Wahrheitstabelle darstellen, in der alle mögli-
chen Kombinationen der Argumente A1 , . . . , An zusammen mit dem zu-
geordneten Funktionswert zeilenweise aufgelistet sind (Abbildung 2.7).
Wahrheitstabellen werden in der Literatur auch als Wahrheitstafeln oder
Funktions(wert)tabellen bezeichnet.

Abbildung 2.8 zeigt, wie sich Wahrheitstafeln für zusammengesetz-


te Ausdrücke erzeugen lassen. Ausgehend von den Elementaraussagen
werden zunächst die Teilformeln und anschließend der Gesamtausdruck
ausgewertet. Die drei Beispiele wurden ganz bewusst ausgewählt und
90 2 Formale Systeme

ϕ = ¬A ϕ = A∧B ϕ = A∨B
A ϕ A B ϕ A B ϕ
0 1 0 0 0 0 0 0
1 0 0 1 0 0 1 1

Negation 1 0 0 1 0 1
1 1 1 1 1 1

Konjunktion Disjunktion

ϕ =A→B ϕ =A↔B ϕ =AB


A B ϕ A B ϕ A B ϕ
0 0 1 0 0 1 0 0 0
0 1 1 0 1 0 0 1 1
1 0 0 1 0 0 1 0 1
1 1 1 1 1 1 1 1 0
Abbildung 2.7: Wahrheitstafeln der aus-
sagenlogischen Operatoren Implikation Äquivalenz Antivalenz

stehen stellvertretend für drei wichtige Formelklassen. ϕ1 ist so be-


schaffen, dass sie genau dann wahr ist, wenn A wahr oder B falsch ist.
In der Terminologie der Aussagenlogik wird ϕ1 als erfüllbare Formel
bezeichnet. ϕ2 ist ebenfalls erfüllbar, besitzt aber im Gegensatz zu ϕ1
die Eigenschaft, dass sie unabhängig vom Wahrheitswert der Elemen-
taraussagen immer wahr ist. Solche Formeln heißen allgemeingültig. In
entsprechender Weise bezeichnen wir ϕ3 als unerfüllbare Formel, da sie
niemals wahr werden kann.

Formal halten wir das Gesagte in der folgenden Definition fest:

Definition 2.8 (Erfüllbarkeit, Allgemeingültigkeit)

Eine aussagenlogische Formel ϕ heißt


I erfüllbar, falls ϕ mindestens ein Modell besitzt,
I unerfüllbar, falls ϕ kein Modell besitzt,
I allgemeingültig, falls ¬ϕ unerfüllbar ist.
Eine allgemeingültige Formel bezeichnen wir auch als Tautologie.

Abbildung 2.9 demonstriert, wie die unterschiedlichen Formelklassen


zusammenhängen.
2.3 Aussagenlogik 91

Alle Begriffe aus Definition 2.8 lassen sich auf Mengen von aussa- I ϕ1 := (A → B) → (B → A)
genlogischen Formeln erweitern. Eine Menge M = {ϕ1 , . . . , ϕn } heißt ψ1 ψ2
erfüllbar, wenn eine Interpretation I existiert, die für alle ϕi ∈ M ein A B ψ1 ψ2 ϕ1
Modell ist. Die Unerfüllbarkeit und Allgemeingültigkeit von Formel- 0 0 1 1 1
mengen definieren wir analog. M ist unerfüllbar, wenn ϕ1 , . . . , ϕn kein 0 1 1 0 0
gemeinsames Modell besitzen. Ist dagegen jede Interpretation ein Mo-
1 0 0 1 1
dell für die Elemente von M, so nennen wir M allgemeingültig.
1 1 1 1 1
Mit der Modellrelation in Händen sind wir gerüstet, um den Begriff der
logischen Folgerung formal zu definieren: I ϕ2 := (A ∨ B) → (B ∨ A)
ψ3 ψ4

A B ψ3 ψ4 ϕ2
Definition 2.9 (Logische Folgerung)
0 0 0 0 1
Seien ϕ1 , . . . , ϕn , ψ aussagenlogische Formeln. Wir schreiben 0 1 1 1 1
1 0 1 1 1
{ϕ1 , . . . , ϕn } |= ψ, 1 1 1 1 1

wenn jedes Modell von {ϕ1 , . . . , ϕn } auch ein Modell von ψ ist.
I ϕ3 := (A ∨ ¬A) → (B ∧ ¬B)
ψ5 ψ6

Vereinbaren wir zusätzlich die beiden Kurzschreibweisen A B ψ5 ψ6 ϕ3


0 0 1 0 0
|= ψ für 0/ |= ψ 0 1 1 0 0
ϕ |= ψ für {ϕ} |= ψ 1 0 1 0 0
1 1 1 0 0
so gelten die folgenden Zusammenhänge:
Abbildung 2.8: Wahrheitstafeln zusam-
I |= ψ gilt genau dann, wenn ψ allgemeingültig ist. mengesetzter Formeln

I ϕ |= ψ gilt genau dann, wenn ϕ → ψ allgemeingültig ist.

I {ϕ1 , ϕ2 , . . . , ϕn } |= ψ gilt genau dann, wenn {ϕ2 , . . . , ϕn } |= ϕ1 → ψ.

Spiegel- Abbildung 2.9: Das Spiegelungsprinzip


Erfüllbar achse visualisiert, wie sich die Eigenschaften
der Formeln ϕ und ¬ϕ gegenseitig beein-
flussen. Ist ϕ allgemeingültig, so ist ¬ϕ
unerfüllbar. Ist ϕ nicht allgemeingültig,
φ ψ ¬ψ ¬φ aber dennoch erfüllbar, so gilt das Glei-
che für ¬ϕ. Damit ist die Allgemeingül-
tigkeit eine exklusive Eigenschaft, die nur
eine der beiden Formeln ϕ oder ¬ϕ erfül-
Allgemeingültig Erfüllbar, aber nicht Unerfüllbar len kann. Im Gegensatz hierzu können so-
(Tautologien) allgemeingültig
wohl ϕ als auch ¬ϕ erfüllbar sein.
92 2 Formale Systeme

I Kommutativgesetze In den kommenden Betrachtungen wird der Begriff der Äquivalenz im-
ϕ ∧ψ ≡ ψ ∧ϕ mer wieder auftauchen:
ϕ ∨ψ ≡ ψ ∨ϕ
Definition 2.10 (Äquivalenz)
I Distributivgesetze
ϕ ∧ (ψ ∨ χ) ≡ (ϕ ∧ ψ) ∨ (ϕ ∧ χ) Seien ϕ und ψ zwei aussagenlogische Formeln. Die Relation ’≡’
ϕ ∨ (ψ ∧ χ) ≡ (ϕ ∨ ψ) ∧ (ϕ ∨ χ) ist wie folgt definiert:
I Neutrale Elemente ϕ ≡ ψ :⇔ ϕ |= ψ und ψ |= ϕ
ϕ ∧1 ≡ ϕ
ϕ ∨0 ≡ ϕ Zwei Formeln ϕ und ψ mit ϕ ≡ ψ heißen äquivalent.

I Inverse Elemente
ϕ ∧ ¬ϕ ≡ 0 In Worten ausgedrückt, sind zwei Formeln ϕ und ψ genau dann äquiva-
ϕ ∨ ¬ϕ ≡ 1 lent, wenn sie exakt dieselben Modelle besitzen. In Abbildung 2.10 sind
wichtige Äquivalenzen zusammengefasst, die sich durch das Aufstellen
I Assoziativgesetze von Wahrheitstafeln leicht verifizieren lassen.
(ϕ ∧ ψ) ∧ χ ≡ ϕ ∧ (ψ ∧ χ)
Vielleicht haben Sie sich gewundert, dass Abbildung 2.10 ausschließ-
(ϕ ∨ ψ) ∨ χ ≡ ϕ ∨ (ψ ∨ χ)
lich Formeln enthält, in denen die aussagenlogischen Elementaropera-
I Idempotenzgesetze toren ‚¬‘, ‚∧‘ und ‚∨‘ vorkommen. Dies ist der Tatsache geschuldet,
dass sich alle anderen auf diese drei zurückführen lassen. Es ist
ϕ ∧ϕ ≡ ϕ
ϕ ∨ϕ ≡ ϕ ϕ → ψ ≡ ¬ϕ ∨ ψ
I Absorptionsgesetze ϕ ↔ ψ ≡ (¬ϕ ∨ ψ) ∧ (ϕ ∨ ¬ψ)
(ϕ ∧ ψ) ∨ ϕ ≡ ϕ ϕ  ψ ≡ (¬ϕ ∨ ¬ψ) ∧ (ϕ ∨ ψ)
(ϕ ∨ ψ) ∧ ϕ ≡ ϕ
Genauso gut können wir uns aufgrund der Äquivalenzen
I De Morgan’sche Regeln
ϕ ∧ ψ ≡ ¬(ϕ → ¬ψ)
¬(ϕ ∧ ψ) ≡ ¬ϕ ∨ ¬ψ
¬(ϕ ∨ ψ) ≡ ¬ϕ ∧ ¬ψ ϕ ∨ ψ ≡ ¬ϕ → ψ
ϕ ∧ ψ ≡ ¬(¬ϕ ∨ ¬ψ)
I Eliminationsgesetze
ϕ ∨ ψ ≡ ¬(¬ϕ ∧ ¬ψ)
ϕ ∧0 ≡ 0
ϕ ∨1 ≡ 1 auf eine der Mengen {¬, →}, {¬, ∨} oder {¬, ∧} beschränken und die
jeweils anderen Operatoren als syntaktische Abkürzungen für komple-
I Doppelnegationsgesetz
xere Formeln interpretieren.
¬¬ϕ ≡ ϕ
Im nächsten Abschnitt werden wir diesen Umstand ausnutzen und einen
Kalkül vorstellen, in dem ausschließlich Operatoren aus der Menge
Abbildung 2.10: Grundlegende Äquivalen- {¬, →} genannt werden. Der Ausschluss der anderen logischen Ver-
zen aussagenlogischer Ausdrücke knüpfungen ist keine Beschränkung im eigentlichen Sinne, da wir gera-
de gezeigt haben, dass sich alle aussagenlogischen Operatoren auf die
Negation und die Implikation zurückführen lassen.
2.3 Aussagenlogik 93

2.3.2 Aussagenlogischer Kalkül

In Abschnitt 2.3.1 haben wir die Semantik der Aussagenlogik über die
Modellrelation ‚|=‘ festgelegt. Wir wollen nun ein formales System ein-
führen, in dem sich alle allgemeingültigen Formeln, und nur diese, aus
den Axiomen ableiten lassen. Wie wir es mittlerweile gewohnt sind,
erfolgt die Ableitung ausschließlich auf der syntaktischen Ebene. Das
bedeutet, dass wir zum Beweis einer Aussage nichts über Interpreta-
tionen, Modelle oder andere Begriffe wissen müssen, die sich mit den
semantischen Eigenschaften von Formeln beschäftigen.

Die Axiome und Schlussregeln des aussagenlogischen Kalküls sind in


Tabelle 2.6 zusammengefasst. Das erste Axiom stellt sicher, dass aus je-
der Aussage ϕ die schwächere Aussage ψ → ϕ gefolgert werden kann
und wird aus diesem Grund als Abschwächungsregel bezeichnet. Das
zweite Axiom drückt die Distributivitätseigenschaft des Implikations-
operators aus. Das dritte und letzte Axiom ist die logische Kontraposi-
tion – ein Schlussprinzip, das wir tagtäglich einsetzen. Es besagt, dass
wir die logische Schlussrichtung umdrehen können, wenn wir die Argu-
mente verneinen („Wenn es regnet, dann ist die Straße nass“ ist gleich-
bedeutend mit „Wenn die Straße nicht nass ist, dann regnet es nicht“).
Innerhalb des Kalküls existiert mit dem Modus ponens eine einzige
Schlussregel, mit der neue Sätze abgeleitet werden können. Diese Regel
ist uns intuitiv vertraut. Sie garantiert, dass eine Aussage ψ wahr sein
muss, wenn wir wissen, dass ϕ wahr ist und ψ aus ϕ gefolgert werden
kann.

Axiome

ϕ → (ψ → ϕ) (A1)

(ϕ → (ψ → χ)) → ((ϕ → ψ) → (ϕ → χ)) (A2)

(¬ϕ → ¬ψ) → (ψ → ϕ) (A3)

Schlussregeln

ϕ, ϕ → ψ
(MP)
ψ
Tabelle 2.6: Axiome und Schlussregeln
des aussagenlogischen Kalküls
94 2 Formale Systeme

Dass die hier gewählte Bei- Die folgende Ableitung zeigt, wie die Tautologie ϕ = A → A aus den
spielformel A → A wahr ist, Axiomen abgeleitet werden kann:
folgt sofort aus der Defini-
tion des Implikationsopera- 1.  (A → ((A → A) → A)) → ((A → (A → A)) → (A → A)) (A2)
tors ‚→‘. Warum haben wir uns dann die
2.  A → ((A → A) → A) (A1)
Mühe gemacht, sie so aufwendig zu be-
weisen? Der Grund ist, dass die Beweis- 3.  (A → (A → A)) → (A → A) (MP, 1,2)
barkeit und die Wahrheit zwei völlig un- 4.  A → (A → A) (A1)
terschiedliche Begriffe sind. Um zu zei-
gen, dass die Formel A → A ein Theo-
5.  A → A (MP, 3,4)
rem ist, müssen wir ihre Beweisbarkeit
demonstrieren. Im formalen Sinne bedeu- Die ersten beiden Glieder der Beweiskette sind Instanzen des Distri-
tet dies nicht, dass sie wahr ist, sondern le- butivitätsaxioms und des Abschwächungsaxioms. Das dritte Glied ent-
diglich, dass sie innerhalb des Kalküls aus steht durch die Anwendung der Schlussregel auf die vorher erzeugten
den Axiomen hergeleitet werden kann. Formeln, und das vierte ist wiederum eine Instanz des Abschwächungs-
Kurzum: Die Beweisbarkeit einer Formel axioms. Jetzt lässt sich ϕ aus den Gliedern 3 und 4 durch die erneute
ist eine syntaktische Eigenschaft und die Anwendung der Modus-Ponens-Schlussregel ableiten.
Wahrheit einer Formel eine semantische.
Es ist der natürliche Wunsch der Mathe- Am Ende von Abschnitt 2.1 haben wir die Schreibweise M  ϕ einge-
matiker, beide Begriffe in Kongruenz zu führt. Sie drückt aus, dass wir ϕ mit einer Formelkette ϕ1 , . . . , ϕn ablei-
bringen, so dass aus der Beweisbarkeit die ten können, die nach dem folgenden Schema aufgebaut ist:
Wahrheit und aus der Wahrheit die Be-
weisbarkeit einer Formel folgt. Doch ge-
nau dies ist, wie wir in den nächsten Ka- I ϕi ist ein Axiom oder
piteln zeigen werden, für weite Teile der
Mathematik unmöglich. I ϕi ist eine Formel aus der Menge M oder

I ϕi entsteht aus den vorangegangenen Gliedern der Beweiskette


durch die Anwendung einer Schlussregel.

Am Ende der Formelkette steht die Formel ϕ, d. h., es ist ϕn = ϕ. Mit-


hilfe der Menge M konnten wir einen Beweis um eine Reihe von Vor-
aussetzungen ergänzen und auf diese Weise problemlos mit Aussagen
der Form „Unter der Annahme, dass M gilt, folgt . . . “ umgehen.

Vielleicht haben Sie sich die Frage gestellt, ob diese Erweiterung wirk-
lich notwendig ist; schließlich sind wir in der Lage, beliebige Wenn-
dann-Beziehungen mithilfe des Implikationsoperators zu formulieren.
Der Unterschied zwischen beiden Konstrukten besteht darin, dass der
Operator ‚→‘ innerhalb der Logik existiert, während die Folgerungs-
beziehung M  ϕ eine Aussage über die Beweisbarkeit der Aussage ϕ
macht. Mit anderen Worten: M  ϕ ist eine Meta-Aussage, die außer-
halb der Logik steht.

Nichtsdestotrotz existiert zwischen beiden Konstrukten ein enger Zu-


sammenhang, den das nachstehende Theorem klar zum Ausdruck
bringt:
2.3 Aussagenlogik 95

Satz 2.7 (Deduktionstheorem der Aussagenlogik)


1

Für beliebige aussagenlogische Formeln ϕ, ϕ1 , . . . , ϕn und ψ gilt: 2

Alter Beweis
...
{ϕ1 , . . . , ϕn } ∪ {ϕ}  ψ ⇔ {ϕ1 , . . . , ϕn }  ϕ → ψ
m  1


Beweis: Die Richtung von rechts nach links ist nahezu trivial. Gilt
1
{ϕ1 , . . . , ϕn }  ϕ → ψ,
2
so existiert ein formaler Beweis, der ϕ → ψ aus {ϕ1 , . . . , ϕn } ableitet.

Neuer Beweis
...
Diese Schlusskette können wir auf einfache Weise zu einem Beweis m  1
verlängern, der ψ aus {ϕ1 , . . . , ϕn , ϕ} deduziert. Hierzu setzen wir ϕ

zunächst als Instanz ein und leiten ψ anschließend durch die Modus-
ponens-Schlussregel aus ϕ → ψ und ϕ ab (vgl. Abbildung 2.11). 

Die Schlussrichtung von links nach rechts erfordert etwas mehr Auf-
wand, folgt aber dem gleichen Schema. Ausgehend von einem Beweis
für ψ aus {ϕ1 , . . . , ϕn } ∪ {ϕ} werden wir einen Beweis für ϕ → ψ aus Abbildung 2.11: Beweisschema des De-
{ϕ1 , . . . , ϕn } konstruieren. duktionstheorems (Richtung von rechts
nach links)
Das Grundschema des neuen Beweises ist in Abbildung 2.12 skizziert.
Aus der vorhandenen Beweiskette χ1 , . . . , χm−1 , ψ erzeugen wir eine 1
neue, in der nacheinander die Formeln ϕ → χi abgeleitet werden und 2

Alter Beweis
am Ende die zu beweisende Behauptung ϕ → ψ steht.
...
Damit ist die Grobstruktur festgelegt. Jetzt müssen wir noch überlegen, m  1
wie die verbleibenden Lücken in der Beweiskette geschlossen werden

können. Wir unterscheiden drei Fälle:

...
I χi ist ein Axiom oder eine Voraussetzung
  1
 χi
Neuer Beweis

...
 χi → (ϕ → χi ) (A1)
  2
 ϕ → χi (MP)
...

I χi ist die Formel ϕ   m  1

 (ϕ → ((ϕ → ϕ) → ϕ)) → ((ϕ → (ϕ → ϕ)) → (ϕ → ϕ)) (A2) ...

 ϕ → ((ϕ → ϕ) → ϕ) (A1) 

 (ϕ → (ϕ → ϕ)) → (ϕ → ϕ) (MP)
 ϕ → (ϕ → ϕ) (A1) Abbildung 2.12: Beweisschema des De-
duktionstheorems (Richtung von links nach
 ϕ →ϕ (MP) rechts)
96 2 Formale Systeme

Ableitbare Theoreme
I Theorem T1 I Theorem T6 I Theorem T11
ϕ →ϕ (ϕ → ψ) → (¬ψ → ¬ϕ) ¬(ϕ → ψ) → ¬ψ

I Theorem T2 I Theorem T7 I Theorem T12


(ϕ → ψ) → ((ψ → χ) → (ϕ → χ)) ϕ → (¬ψ → ¬(ϕ → ψ)) (ϕ → ¬ϕ) → ¬ϕ

I Theorem T3 I Theorem T8 I Theorem T13


ϕ → ((ϕ → ψ) → ψ) ¬ϕ → (ϕ → ψ) (¬ϕ → ϕ) → ϕ

I Theorem T4 I Theorem T9 I Theorem T14


¬¬ϕ → ϕ ϕ → (ψ → (ϕ → ψ)) (ϕ → ψ) → ((¬ϕ → ψ) → ψ)

I Theorem T5 I Theorem T10 I Theorem T15


ϕ → ¬¬ϕ ¬(ϕ → ψ) → ϕ ¬(ϕ → ϕ) → ψ

Tabelle 2.7: Eine kleine Auswahl von Formeln, die sich im aussagenlogischen Kalkül ableiten lassen.

Dem Theorem T8 kommt


eine ganz besondere Bedeu- I χi wurde durch die Regel (MP) aus χ j und χ j → χi erzeugt.
tung zu. Lässt es sich in Dann wissen wir, dass weiter oben im Beweis die beiden Zeilen
einem Kalkül ableiten und
steht der Modus ponens als Schlussregel  ϕ → χj
zur Verfügung, so gilt das Folgende: Ist  ϕ → (χ j → χi )
innerhalb des Kalküls ein einziger Wider-
spruch ableitbar, so ist ausnahmslos je- vorkommen müssen und wir folgendermaßen verfahren können:
de Formel ein Theorem. Warum dies so  (ϕ → (χ j → χi )) → ((ϕ → χ j ) → (ϕ → χi )) (A2)
ist, lässt sich leicht einsehen. Nehmen wir
an, die Formeln ϕ und ¬ϕ können bei-  (ϕ → χ j ) → (ϕ → χi ) (MP)
de aus den Axiomen hergeleitet werden.  ϕ → χi (MP)
Aus dem Theorem ¬ϕ → (ϕ → ψ) lässt
sich mithilfe des Modus ponens das Theo- Damit ist die Behauptung bewiesen.
rem ϕ → ψ deduzieren. Nach Vorausset-
zung ist ϕ ebenfalls ableitbar, so dass ei- Für die praktische Beweisführung ist das Deduktionstheorem von un-
ne erneute Anwendung des Modus po- schätzbarem Wert. Zum einen erlaubt es uns, zwischen der Logik- und
nens das Theorem ψ hervorbringt. Da die der Meta-Ebene nach Belieben hin- und herzuspringen. Zum anderen
Wahl von ψ keinen Einschränkungen un- versetzt es uns in die Lage, Beweise deutlich platzsparender aufzu-
terliegt, können wir eine beliebige Aussa- schreiben als es ohne das Theorem möglich wäre.
ge für ψ substituieren. Kurzum: In einem
widersprüchlichen Kalkül lassen sich aus- Wir werden den Kalkül nun zum Leben erwecken und nacheinander die
nahmslos alle Aussagen beweisen. Damit in Tabelle 2.7 genannten Theoreme beweisen. Sie stammen aus [126]
haben wir die Widerspruchsfreiheit als ei- und [125] und sollen einen plastischen Eindruck vermitteln, wie sich
ne unabdingbare Eigenschaft des mathe- im aussagenlogischen Kalkül komplexere Beweise führen lassen.
matischen Schließens entlarvt. Fehlt sie,
so verkommt jedes formale System zu ei-
nem wertlosen Gedankengebilde.
2.3 Aussagenlogik 97

1.  (ϕ → ((ϕ → ϕ) → ϕ)) → ((ϕ → (ϕ → ϕ)) → (ϕ → ϕ)) (A2) Theorem T1


2.  ϕ → ((ϕ → ϕ) → ϕ) (A1) ϕ →ϕ
3.  (ϕ → (ϕ → ϕ)) → (ϕ → ϕ) (MP, 2,1)
4.  ϕ → (ϕ → ϕ) (A1)
5.  ϕ →ϕ (MP, 3,4)

1. {ϕ → ψ, ψ → χ, ϕ}  ϕ (Satz 2.4) Theorem T2


2. {ϕ → ψ, ψ → χ, ϕ}  ϕ → ψ (Satz 2.4) (ϕ → ψ) → ((ψ → χ) → (ϕ → χ))
3. {ϕ → ψ, ψ → χ, ϕ}  ψ (MP, 1,2)
4. {ϕ → ψ, ψ → χ, ϕ}  ψ → χ (Satz 2.4)
5. {ϕ → ψ, ψ → χ, ϕ}  χ (MP, 3,4)
6. {ϕ → ψ, ψ → χ}  ϕ → χ (DT)
7. {ϕ → ψ}  (ψ → χ) → (ϕ → χ) (DT)
8.  (ϕ → ψ) → ((ψ → χ) → (ϕ → χ)) (DT)

Inhaltlich beschreibt das Theorem T2 den Modus barbara. Hierbei han-


delt es sich um den zweigliedrigen Kettenschluss, der in unserer sym-
bolischen Schreibweise so aussieht:
ϕ → ψ, ψ → χ
(MB)
ϕ→χ

Um eine Beweiskette übersichtlich aufschreiben zu können, werden wir


neben dem Modus ponens (MP) auch den Modus barbara (MB) als
Schlussregel zulassen. Dass wir dies bedenkenlos tun dürfen, verdeut-
licht die folgende Ableitungssequenz. Sie zeigt, wie sich aus ϕ → ψ
und ψ → χ die Formel ϕ → χ ohne den Modus barbara ableiten lässt:

1.  ϕ →ψ
2.  ψ→χ
3.  (ϕ → ψ) → ((ψ → χ) → (ϕ → χ)) (T2)
4.  (ψ → χ) → (ϕ → χ) (MP, 1,3)
5.  ϕ→χ (MP, 2,4)

Die Ableitungssequenz macht klar, dass wir mithilfe des Theorems T2


jede Beweiskette so umschreiben können, dass der Modus barbara voll-
ständig daraus verschwindet.
98 2 Formale Systeme

Theorem T3 1. {ϕ, ϕ → ψ}  ϕ (Satz 2.4)


ϕ → ((ϕ → ψ) → ψ) 2. {ϕ, ϕ → ψ}  ϕ → ψ (Satz 2.4)
3. {ϕ, ϕ → ψ}  ψ (MP, 1,2)
4. {ϕ}  (ϕ → ψ) → ψ (DT)
5.  ϕ → ((ϕ → ψ) → ψ) (DT)

Theorem T4 1.  ¬¬ϕ → (¬¬¬¬ϕ → ¬¬ϕ) (A1)


¬¬ϕ → ϕ 2. {¬¬ϕ}  ¬¬¬¬ϕ → ¬¬ϕ (DT)
3.  (¬¬¬¬ϕ → ¬¬ϕ) → (¬ϕ → ¬¬¬ϕ) (A3)
4. {¬¬ϕ}  ¬ϕ → ¬¬¬ϕ (MP, 2,3)
5.  (¬ϕ → ¬¬¬ϕ) → (¬¬ϕ → ϕ) (A3)
6. {¬¬ϕ}  ¬¬ϕ → ϕ (MP, 4,5)
7. {¬¬ϕ}  ϕ (DT)
8.  ¬¬ϕ → ϕ (DT)

Theorem T5 1.  ¬¬¬ϕ → ¬ϕ (T4)


ϕ → ¬¬ϕ 2.  (¬¬¬ϕ → ¬ϕ) → (ϕ → ¬¬ϕ) (A3)
3.  ϕ → ¬¬ϕ (MP, 1,2)

Theorem T6 1.  ¬¬ϕ → ϕ (T4)


(ϕ → ψ) → (¬ψ → ¬ϕ) 2. {ϕ → ψ}  ϕ → ψ (Satz 2.4)
3. {ϕ → ψ}  ¬¬ϕ → ψ (MB, 1,2)
4.  ψ → ¬¬ψ (T5)
5. {ϕ → ψ}  ¬¬ϕ → ¬¬ψ (MB, 3,4)
6.  (¬¬ϕ → ¬¬ψ) → (¬ψ → ¬ϕ) (A3)
7. {ϕ → ψ}  ¬ψ → ¬ϕ (MP, 5,6)
8.  (ϕ → ψ) → (¬ψ → ¬ϕ) (DT)

Theorem T7 1.  ϕ → ((ϕ → ψ) → ψ) (T3)


ϕ → (¬ψ → ¬(ϕ → ψ)) 2. {ϕ}  (ϕ → ψ) → ψ (DT)
3.  ((ϕ → ψ) → ψ) → (¬ψ → ¬(ϕ → ψ)) (T6)
4. {ϕ}  ¬ψ → ¬(ϕ → ψ) (MP, 2,3)
5.  ϕ → (¬ψ → ¬(ϕ → ψ)) (DT)
2.3 Aussagenlogik 99

1.  ¬ϕ → (¬ψ → ¬ϕ) (A1) Theorem T8


2. {¬ϕ}  ¬ψ → ¬ϕ (DT) ¬ϕ → (ϕ → ψ)
3.  (¬ψ → ¬ϕ) → (ϕ → ψ) (A3)
4. {¬ϕ}  (ϕ → ψ) (MP, 2,3)
5.  ¬ϕ → (ϕ → ψ) (DT)

1. {ϕ}  ψ → (ϕ → ψ) (A1) Theorem T9


2.  ϕ → (ψ → (ϕ → ψ)) (DT) ϕ → (ψ → (ϕ → ψ))

1.  ¬ϕ → (ϕ → ψ) (T8) Theorem T10


2.  (¬ϕ → (ϕ → ψ)) → (¬(ϕ → ψ) → ¬¬ϕ) (T6) ¬(ϕ → ψ) → ϕ
3.  ¬(ϕ → ψ) → ¬¬ϕ (MP, 1,2)
4.  ¬¬ϕ → ϕ (T4)
5.  ¬(ϕ → ψ) → ϕ (MB, 3,4)

1.  ψ → (ϕ → ψ) (A1) Theorem T11


2.  (ψ → (ϕ → ψ)) → (¬(ϕ → ψ) → ¬ψ) (T6) ¬(ϕ → ψ) → ¬ψ
3.  ¬(ϕ → ψ) → ¬ψ (MP, 1,2)

1.  ϕ → (¬¬ϕ → ¬(ϕ → ¬ϕ)) (T7) Theorem T12


2. {ϕ}  ¬¬ϕ → ¬(ϕ → ¬ϕ) (DT) (ϕ → ¬ϕ) → ¬ϕ
3.  ϕ → ¬¬ϕ (T5)
4. {ϕ}  ¬¬ϕ (DT)
5. {ϕ}  ¬(ϕ → ¬ϕ) (MP, 2,4)
6.  ϕ → ¬(ϕ → ¬ϕ) (DT)
7.  (ϕ → ¬(ϕ → ¬ϕ)) → (¬¬(ϕ → ¬ϕ) → ¬ϕ) (T6)
8.  ¬¬(ϕ → ¬ϕ) → ¬ϕ (MP, 6,7)
9.  (ϕ → ¬ϕ) → ¬¬(ϕ → ¬ϕ) (T5)
10.  (ϕ → ¬ϕ) → ¬ϕ (MB, 9,8)

1. {¬ϕ}  ϕ → ¬¬ϕ (T5) Theorem T13


2.  ¬ϕ → (ϕ → ¬¬ϕ) (DT) (¬ϕ → ϕ) → ϕ
3.  (¬ϕ → (ϕ → ¬¬ϕ)) → ((¬ϕ → ϕ) → (¬ϕ → ¬¬ϕ)) (A2)
100 2 Formale Systeme

4.  (¬ϕ → ϕ) → (¬ϕ → ¬¬ϕ) (MP, 2,3)


5. {¬ϕ → ϕ}  (¬ϕ → ¬¬ϕ) (DT)
6.  (¬ϕ → ¬¬ϕ) → ¬¬ϕ (T12)
7. {¬ϕ → ϕ}  ¬¬ϕ (MP, 5,6)
8.  ¬¬ϕ → ϕ (T4)
9. {¬ϕ → ϕ}  ϕ (MP, 7,8)
10.  (¬ϕ → ϕ) → ϕ (DT)

Theorem T14 1. {ϕ →ψ }  ϕ →ψ (Satz 2.4)


(ϕ → ψ) → ((¬ϕ → ψ) → ψ) 2.  (ϕ → ψ) → (¬ψ → ¬ϕ) (T6)
3. { ϕ → ψ }  (¬ψ → ¬ϕ) (MP, 1,2)
4.  (¬ψ → ¬ϕ) → ((¬ϕ → ψ) → (¬ψ → ψ)) (T2)
5. { ϕ → ψ }  (¬ϕ → ψ) → (¬ψ → ψ) (MP, 3,4)
6. {ϕ → ψ, ¬ϕ → ψ}  ¬ψ → ψ (DT)
7.  (¬ψ → ψ) → ψ (T13)
8. { ϕ → ψ, ¬ϕ → ψ }  ψ (MP, 6,7)
9. { ϕ → ψ }  (¬ϕ → ψ) → ψ (DT)
10.  (ϕ → ψ) → ((¬ϕ → ψ) → ψ) (DT)

Theorem T15 1. { ¬ψ }  (ϕ → ϕ) (T1)


¬(ϕ → ϕ) → ψ 2.  (ϕ → ϕ) → ¬¬(ϕ → ϕ) (T5)
3. { ¬ψ }  ¬¬(ϕ → ϕ) (MP, 1,2)
4.  ¬ψ → ¬¬(ϕ → ϕ) (DT)
5.  (¬ψ → ¬¬(ϕ → ϕ)) → (¬(ϕ → ϕ) → ψ) (A3)
6.  ¬(ϕ → ϕ) → ψ (MP, 4,5)

Denken Sie immer daran, dass die entwickelten Ableitungssequen-


zen keine echten formalen Beweise sind. Verantwortlich hierfür sind
der Modus Barbara und das Deduktionstheorems, die als Meta-
Schlussregeln Aussagen über Beweise machen und nicht innerhalb des
Kalküls existieren. Dass wir die Ableitungssequenzen trotzdem als Be-
weise ansehen dürfen, verdanken wir unserer geleisteten Vorarbeit. Wei-
ter oben haben wir gezeigt, wie sich jede mit (MB) oder (DT) mar-
kierte Ableitung durch eine äquivalente Sequenz ersetzen lässt, die mit
den nativen Sprachelementen auskommt. In diesem Sinne können wir
die gezeigten Ableitungssequenzen als Bauplan verstehen, aus dem sich
systematisch eine echte Beweiskette erzeugen lässt.
2.3 Aussagenlogik 101

Frege (1879) [55] Kleene (1952) [110]


ϕ → (ψ → ϕ) (K1)
ϕ → (ψ → ϕ) (F1)
(ϕ → ψ ∧ χ) → ((ϕ → ψ) → (ϕ → χ)) (K2)
(χ → (ψ → ϕ)) → ((χ → ψ) → (χ → ϕ)) (F2)
ϕ ∧ψ → ϕ (K3)
(χ → (ψ → ϕ)) → (ψ → (χ → ϕ)) (F3)
ϕ ∧ψ → ψ (K4)
(ψ → ϕ) → (¬ϕ → ¬ψ) (F4)
ϕ → (ψ → ϕ ∧ ψ) (K5)
¬¬ϕ → ϕ (F5)
ϕ → ϕ ∨ψ (K6)
ϕ → ¬¬ϕ (F6)
ψ → ϕ ∨ψ (K7)

Russell und Whitehead (1910) [212] (ϕ → ψ) → ((χ → ψ) → (ϕ ∨ ψ → χ)) (K8)


(ϕ → ψ) → ((ϕ → ¬ψ) → ¬ϕ) (K9)
ϕ ∨ϕ → ϕ (P1) ¬¬ϕ → ϕ (K10)
ψ → ϕ ∨ψ (P2)
Rosser (1953) [166]
ϕ ∨ψ → ψ ∨ϕ (P3)
ϕ → ϕ ∧ϕ (R1)
ϕ ∨ (ψ ∨ χ) → ψ ∨ (ϕ ∨ χ) (P4)
ϕ ∧ψ → ϕ (R2)
(ψ → χ) → (ϕ ∨ ψ → ϕ ∨ χ) (P5)
(ϕ → ψ) → (¬(ψ ∧ χ) → ¬(χ ∧ ϕ)) (R3)

Tabelle 2.8: Alternative Axiomatisierungen der Aussagenlogik.

Abschließend wollen wir uns mit der Frage beschäftigen, wie es um


die in Definition 2.2 fixierten Kalküleigenschaften bestellt ist. Die Kor-
rektheit unseres Kalküls (aus  ϕ folgt |= ϕ) liegt auf der Hand. Zu-
nächst lässt sich zeigen, dass alle Axiome allgemeingültig sind. Ferner
ist leicht nachzuvollziehen, dass die einzige Schlussregel des Kalküls
– der Modus ponens – die Tautologieeigenschaft erhält. Damit ist der
Kalkül korrekt und nach Satz 2.2 erst recht widerspruchsfrei.

Tatsächlich ist der Kalkül sogar vollständig, d. h., alle allgemeingültigen


Formeln lassen sich aus den Axiomen herleiten (aus |= ϕ folgt  ϕ).
Den vergleichsweise komplizierten Beweis wollen wir an dieser Stelle
nicht führen. Eine detaillierte Ausarbeitung findet sich in beispielsweise
in [104] oder [125].

Beachten Sie, dass der Kalkül nicht negationsvollständig ist, d. h., es


existieren Formeln ϕ, für die weder ϕ noch ¬ϕ aus den Axiomen abge-
leitet werden kann. Die Negationsunvollständigkeit ist kein Mangel des
Kalküls; sie ist allein der Tatsache geschuldet, dass wir die Semantik
aussagenlogischer Formeln nicht, wie in den Beispielen zuvor, an eine
einzige Interpretation gekoppelt haben. In der Aussagenlogik drücken
102 2 Formale Systeme

1. Axiom: CpCqp wir mit |= ϕ aus, dass ϕ allgemeingültig ist, d. h. unter jeder möglichen
Interpretation wahr ist. In diesem Fall existieren viele Formeln ϕ, für
(Q→P) die weder |= ϕ noch |= ¬ϕ gilt. Ein korrekter Kalkül für die Aussagen-
Cp Cqp logik kann daher niemals negationsvollständig sein.

P → (Q → P) Abschließend sei bemerkt, dass die Wahl der Axiome unseres Kalküls
bei weitem nicht eindeutig ist. Tabelle 2.8 fasst mehrere historisch wich-
tige Axiomatisierungen zusammen, die ebenfalls zu einem korrekten
2. Axiom: CCpCqrCCpqCpr
und vollständigen Kalkül für die Aussagenlogik führen.
(Q→R) (P→Q) (P→R)
Die Axiome von Frege stammen aus dessen berühmter Begriffsschrift
C Cp Cqr C Cpq Cpr und basieren, genau wie unsere, auf der Implikation und der Negati-
P→(Q→R) (P→Q)→(P→R) on als Grundoperatoren. Russell und Whitehead haben ihre Axiome im
ersten Band der Principia Mathematica publiziert. Sie bauen ihre Lo-
(P → (Q → R)) → ((P → Q) → (P → R)) gik auf den logischen Primitiven ‚¬‘ und ‚∨‘ auf und verwenden den
Ausdruck ϕ → ψ als abkürzende Schreibweise für die Formel ¬ϕ ∨ ψ.
3. Axiom: CCNpNqCqp Im Jahr 1926 gelang Hilberts Schüler Paul Bernays der Nachweis, dass
die aussagenlogischen Axiome der Principia nicht unabhängig vonein-
C C Np Nq Cqp ander sind. Das vierte Axiom kann aus den anderen Axiomen deduziert
¬P ¬Q (Q→P)
werden und ist daher überflüssig.
(¬P→¬Q) Auch die Frege’schen Axiome sind nicht minimal. Der polnische Ma-
(¬P → ¬Q) → (Q → P)
thematiker Jan Łukasiewicz hat gezeigt, dass sich die Anzahl der Axio-
me reduzieren lässt, ohne die Menge der daraus ableitbaren Theoreme
Abbildung 2.13: Die von Łukasiewicz vor- zu verändern. In [120] schreibt er:
geschlagenen Axiome sind jene, die in zeit-
genössischen Lehrbüchern am häufigsten
„Frege ist der Begründer des modernen Aussagenkalküls.
für die axiomatische Begründung der Aus-
sagenlogik herangezogen werden; so auch
Sein System, das nicht einmal in Deutschland bekannt
in diesem Buch. zu sein scheint, ist auf folgenden 6 Axiomen aufgebaut:
‚CpCqp‘, ‚CCpCqrCCpqCpr‘, ‚CCpCqrCqCpr‘, ‚CCqp-
CNqNp‘, ‚CNNpp‘, ‚CpNNp‘. Das dritte Axiom ist über-
flüssig, denn es ist aus den beiden ersten ableitbar. Die drei
letzten Axiome können durch den Satz ‚CCNpNqCqp‘ er-
setzt werden.“
Jan Łukasiewicz [120]

Die eigentümliche Notation, die Łukasiewicz für die Niederschrift von


Formeln benutzte, ging später unter dem Namen Polnische Notation in
die Literatur ein. Übersetzen wir die Formeln, wie in Abbildung 2.13
gezeigt, in unsere gewöhnliche Schreibweise zurück, so entstehen die
drei Axiome, mit denen wir in Tabelle 2.6 den aussagenlogischen Kal-
kül begründet haben. Damit ist auch die Urheberschaft der Axiome ge-
klärt, die wir in diesem Buch verwenden.
2.4 Prädikatenlogik erster Stufe 103

2.4 Prädikatenlogik erster Stufe I Zu jedem ε > 0 existiert . . .


f(x)

Mit der Aussagenlogik haben wir das nötige Instrumentarium geschaf- f(x0)+ε
fen, um logische Beziehungen zwischen elementaren Aussagen formal

ε-Korridor
zu erfassen. Auch wenn sich viele Sachverhalte in der gezeigten Weise
f(x0)
beschreiben lassen, sind die vorhandenen Ausdrucksmöglichkeiten bei
weitem nicht stark genug, um als Grundlage für die Formalisierung der
f(x0)−ε
Mathematik zu dienen.
Damit wir die Begriffe und Konzepte der gewöhnlichen Mathematik x
abbilden können, müssen wir die Aussagenlogik um mehrere Bausteine x0
erweitern. Um welche es sich konkret handelt, wollen wir an einem
wohlbekannten Beispiel aus der Analysis herausarbeiten: der Stetigkeit
reellwertiger Funktionen [217] (Abbildung 2.14).
I . . . ein δ > 0 mit der Eigenschaft, . . .
f(x)
Definition 2.11 (Stetigkeit)
δ-Korridor
f(x0)+ε
Die Funktion f : D → R ist stetig im Punkt x0 ∈ D, wenn zu jedem

ε-Korridor
ε > 0 ein δ > 0 mit der folgenden Eigenschaft existiert:
f(x0)
x ∈ D ∧ |x − x0 | < δ ⇒ | f (x) − f (x0 )| < ε
f(x0)−ε

Mithilfe der Quantoren ‚∀‘ („für alle“) und ‚∃‘ („es existiert“) können x
wir die Stetigkeitsbedingung wie folgt aufschreiben: x0−δ x0 x0+δ

∀ (ε > 0) ∃ (δ > 0) ∀ (x ∈ D) (|x − x0 | < δ → | f (x) − f (x0 )| < ε)

Analysieren wir die Definition im Detail, so lassen sich neben den aus- I . . . dass f (x) für alle x aus dem δ -Kor-
sagenlogischen Verknüpfungen die folgenden Bestandteile isolieren: ridor innerhalb des ε-Korridors liegt.
f(x)
I Variablen δ-Korridor
f(x0)+ε
Mit x, x0 , ε und δ enthält die Formel vier Variablen. Jede Einzelne
ε-Korridor
f(x)
steht stellvertretend für ein Element des Individuenbereichs, der sich f(x0)
in unserem Beispiel über die Menge der reellen Zahlen erstreckt.
f(x0)−ε
I Quantoren
Variablen werden an Quantoren gebunden, um quantitative Aussa- x
gen über die Elemente des Individuenbereichs zu machen. In unse- x0−δ x0 x x0+δ
rem Beispiel stehen die Variablen ε und x im Wirkungsbereich eines
Allquantors, während δ durch einen Existenzquantor gebunden ist. Abbildung 2.14: Eine reellwertige Funkti-
x0 steht nicht im Wirkungsbereich eines Quantors; eine solche Va- on ist stetig an der Stelle x0 , wenn sie das
riable heißt frei oder ungebunden. Epsilon-Delta-Kriterium erfüllt.
104 2 Formale Systeme

I Funktionen
Mit f und | · | (Betragsfunktion) enthält die Formel zwei einstelli-
ge Funktionssymbole. Im Allgemeinen repräsentiert ein n-stelliges
Funktionssymbol eine Abbildung, die n Elemente des Individuenbe-
reichs auf ein anderes Element des Individuenbereichs abbildet.

I Prädikate
Die Formel enthält mit ‚∈ D‘ ein einstelliges und mit ‚<‘ ein zwei-
stelliges Prädikat. Im Allgemeinen repräsentiert ein n-stelliges Prä-
dikat eine Relation, die das Bestehen oder Nichtbestehen einer Be-
ziehung zwischen n Elementen des Individuenbereichs ausdrückt.

Das diskutierte Beispiel vermittelt einen ersten Eindruck von der Be-
schaffenheit und der Ausdrucksstärke der Prädikatenlogik. Im nächsten
Abschnitt wollen wir die umrissenen Ideen konkretisieren und mathe-
matisch präzise aufarbeiten, was sich hinter einer prädikatenlogischen
Formel im Einzelnen verbirgt.

2.4.1 Syntax und Semantik


Die Aussagenlogik besitzt
große Parallelen zur Prä- Die Syntaxdefinition der Prädikatenlogik erfolgt in drei Schritten. Zu-
dikatenlogik und ist sogar nächst führen wir den Begriff der prädikatenlogischen Signatur ein.
vollständig als Teilmenge in Darauf aufbauend definieren wir den Begriff des prädikatenlogischen
ihr enthalten. Gerade deshalb ist Vorsicht Terms und erweitern diesen anschließend zum Begriff der prädikaten-
angebracht, um gewisse Termini nicht zu logischen Formel.
verwechseln. Insbesondere der Begriff der
Variable erweist sich für viele Anfänger
immer wieder als Fallstrick, da er in bei-
Definition 2.12 (Prädikatenlogische Signatur)
den Logiken mit unterschiedlichen Be-
deutungen belegt ist.
Eine prädikatenlogische Signatur Σ ist ein Tripel (VΣ , FΣ , PΣ ). Die-
In der Prädikatenlogik ist eine Variable
ein Platzhalter für ein beliebiges Element
ses besteht aus
einer festgelegten Grund- oder Individu- I einer Menge VΣ von Variablen, z. B. {x1 , x2 , . . .},
enmenge. Erst durch die konkrete Wahl
eines Individuenelements wird eine For- I einer Menge FΣ von Funktionssymbolen, z. B. {f1 , f2 , . . .},
mel wie P(x) zu einer wahren oder einer
falschen Aussage. I einer Menge PΣ von Prädikaten, z. B. {P1 , P2 , . . .}.
In der Aussagenlogik stehen Variablen da-
gegen für atomare Aussagen, die wahr Jede Funktion und jedes Prädikat besitzt eine feste Stelligkeit ≥ 0.
oder falsch sein können. Damit sind sie
in Wirklichkeit 0-stellige Prädikate und
haben mit den prädikatenlogischen Varia- Grob gesprochen definiert eine prädikatenlogische Signatur den Vorrat
blen nur den Namen gemeinsam.
an elementaren Symbolen, aus denen Formeln zusammengesetzt sind.
2.4 Prädikatenlogik erster Stufe 105

Genau wie in der Aussagenlogik werden wir auch hier den Symbolvor- I Signatur Σ
rat von Fall zu Fall anpassen und Variablen z. B. mit x, y, z, Funktionen
Σ = (VΣ , FΣ , PΣ ) mit
mit f, g, h und Prädikate mit P, Q, R bezeichnen.

VΣ = {x, y}
Definition 2.13 (Prädikatenlogischer Term)
FΣ = {f (2-stellig) }
Sei Σ = (VΣ , FΣ , PΣ ) eine prädikatenlogische Signatur. Die Menge PΣ = {P (2-stellig) }
der prädikatenlogischen Terme ist induktiv definiert:
I Jede Variable ξ ∈ VΣ ist ein Term. I Terme über Σ

I Jedes 0-stellige Funktionssymbol f ∈ FΣ ist ein Term. x


y
I Sind σ1 , . . . , σn Terme und ist f ∈ FΣ ein n-stelliges Funktions-
symbol, so ist f (σ1 , . . . , σn ) ein Term. f(x, x)
f(x, y)
f(f(x, y), x)
Wie in Abbildung 2.15 (oben) demonstriert, lassen sich aus dem Sym- f(x, f(x, y))
bolvorrat einer prädikatenlogischen Signatur meist unendlich viele Ter-
f(f(x, x), f(x, y))
me erzeugen. Eine besondere Bedeutung fällt dabei den 0-stelligen
...
Funktionssymbolen zu. Diese besitzen keine Parameter und spielen die
Rolle von Konstanten. I Atomare Formeln über Σ
Mit den hier eingeführten Begriffen sind wir in der Lage, die Menge der
prädikatenlogischen Formeln präzise zu definieren: P(x, x)
P(x, y)
P(f(x, y), x)
Definition 2.14 (Syntax der Prädikatenlogik)
P(x, f(x, y))
Sei Σ eine prädikatenlogische Signatur. Die Menge der atomaren P(x, f(f(x, y), x))
prädikatenlogischen Formeln ist folgendermaßen festgelegt: P(f(f(x, y), x), y)
I Sind σ1 , . . . , σn Terme und P ein n-stelliges Prädikat, so ist ...
P(σ1 , . . . , σn ) eine atomare Formel.
I Formeln über Σ
Die prädikatenlogischen Formeln sind induktiv definiert:
∀ x P(x, x)
I 0, 1 und jede atomare Formel sind Formeln. ∃ x P(x, x)
P(f(x, x), x) ↔ P(y, y)
I Sei ξ ∈ VΣ . Sind ϕ und ψ Formeln, dann sind es auch
∀ y ∃ x (P(f(x, x), x) ↔ P(y, y))
(¬ϕ), (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ), (ϕ ↔ ψ), (ϕ  ψ)
∃ y ∀ x (P(f(x, x), x) ↔ P(y, y))
∀ ξ ϕ, ∃ ξ ϕ ...

Abbildung 2.15 (unten) zeigt eine kleine Auswahl erzeugbarer Formeln. Abbildung 2.15: Schrittweise Konstrukti-
Beachten Sie, dass nicht alle Variablen zwangsläufig im Wirkungsbe- on prädikatenlogischer Ausdrücke
reich eines Quantors stehen müssen. Beispielsweise kommt die Variable
106 2 Formale Systeme

Achten Sie darauf, die Re- x in der Formel P(x, x) frei oder ungebunden, in der Formel ∀ x P(x) da-
geln für den syntaktischen gegen gebunden vor. Dass eine Variable in der gleichen Formel sowohl
Aufbau prädikatenlogischer frei als auch gebunden vorkommen kann, demonstriert das Beispiel in
Formeln korrekt zu inter- Abbildung 2.16. Formeln, die keine freien Variablen enthalten, heißen
pretieren! So steht die Formel ψ in
geschlossen, alle anderen sind offene Formeln. Im Folgenden schreiben
∀x ϕ → ψ wir ϕ(ξ1 , . . . , ξn ), um darauf hinzuweisen, dass die Variablen ξ1 , . . . , ξn
in ϕ frei vorkommen können. Ferner schreiben wir ϕ(ξ 1 , . . . , ξ
n ) um
nach den vereinbarten Bildungsregeln au- auszudrücken, dass in ϕ keine freien Vorkommen dieser Variablen vor-
ßerhalb des Quantors. Soll ψ zum Bin- handen sind.
dungsbereich des Quantors gehören, muss
der quantifizierte Teilausdruck als Ganzes Der Umgang mit prädikatenlogischen Ausdrücken wird erheblich er-
geklammert werden. Die falsche Interpre- leichtert, wenn die Variablen in zwei voneinander unabhängigen Teil-
tation der Bildungsregeln ist eine häufi-
ausdrücken unterschiedlich benannt werden. Sind die quantifizierten
ge Fehlerquelle; Sie sind gut beraten, sich
Variablen einer geschlossenen Formel ϕ paarweise verschieden, so
den folgenden Zusammenhang intensiv
einzuprägen: ∀ x ϕ → ψ = ∀ x (ϕ → ψ) sprechen wir von einer bereinigten Formel. Abbildung 2.17 zeigt, wie
jede Formel durch die Umbenennung mehrfach quantifizierter Varia-
blen ohne Umwege in eine bereinigte Form gebracht werden kann.
Gebundenes Vor- Freies Vor- Genau wie in der Aussagenlogik wird auch in der Prädikatenlogik die
kommen von x kommen von x Semantik über eine Modellrelation ‚|=‘ festgelegt. Um diese präzise de-
∀ x P(↓, y) → ∃ y P(↓, y) finieren zu können, müssen wir zunächst den Begriff der Interpretation
∀ x P(x, y) → ∃ y P(x, y) auf prädikatenlogische Formeln erweitern:
∀ x P(x,↑) → ∃ y P(x, ↑)
Freies Vor- Gebundenes Vor-
kommen von y kommen von y Definition 2.15 (Prädikatenlogische Interpretation)

Abbildung 2.16: Steht eine Variable im Sei Σ = (VΣ , FΣ , PΣ ) eine prädikatenlogische Signatur. Eine Inter-
Wirkungsbereich eines Quantors, so spre- pretation über Σ ist ein Tupel (U, I) mit den Eigenschaften:
chen wir von einem gebundenen, ansonsten
von einem freien Vorkommen. I U ist eine beliebige nichtleere Menge.
I I ist eine Abbildung, die
∀ x P(x, y) → ∃ x P(x, y)
• jedem Variablensymbol ξ ∈ VΣ ein Element I(ξ ) ∈ U,
Gebundene
• jedem n-stelligen Funktionssymbol f ∈ FΣ eine Funktion
Umbenennung
I( f ) : U n → U

• und jedem n-stelligen Prädikatsymbol P ∈ PΣ eine Relation


∀ x P(x, y) → ∃ z P(z, y)
(Bereinigte Formel) I(P) ⊆ U n

Abbildung 2.17: Durch die Umbenennung zuordnet.


mehrfach verwendeter Variablen lassen sich
prädikatenlogische Formeln bereinigen. In
einer bereinigten Formel sind alle quantifi- Die Menge U wird in der Literatur als Individuenbereich, Grundmenge
zierten Variablen paarweise verschieden. oder Universum bezeichnet.
2.4 Prädikatenlogik erster Stufe 107

Die Zuordnung von Variablen zu den Elementen von U spielt nur für
offene Formeln eine Rolle. Sie sorgt dafür, dass alle freien Variablen
mit einem Individuenelement belegt werden.

Beachten Sie, dass die getätigte Festlegung auch 0-stellige Funktions-


und Prädikatsymbole einschließt. Einem 0-stelligen Funktionssymbol
wird formal eine Funktion U 0 → U zugewiesen, hinter der sich ein
einzelnes Element aus dem Individuenbereich und damit eine Konstan-
te verbirgt. 0-stellige Prädikatsymbole stehen für Relationen über der
Menge U 0 . Sie sind atomare Aussagen, die entweder wahr oder falsch
sein können, und damit nichts anderes als die altbekannten aussagenlo-
gischen Variablen.

Die Abbildung I, die jedem Funktionssymbol f eine Funktion I( f ) zu- Der Begriff der Interpretati-
on ist in der Literatur unter-
ordnet, lässt sich in naheliegender Weise auf komplexe Terme übertra-
schiedlich definiert, genauso wie der Be-
gen. Hierzu erweitern wir I nach dem folgenden induktiven Schema: griff des Modells. In der hier verwende-
ten Form ist eine Interpretation ein Tupel
I( f (σ1 , . . . , σn )) := I( f )(I(σ1 ), . . . , I(σn )) (U, I) mit der Eigenschaft, dass der Defi-
nitionsbereich der Abbildung I nicht nur
Mit dieser Vereinbarung sind wir gerüstet, um die prädikatenlogische die Funktions- und Prädikatzeichen, son-
Modellrelation ‚|=‘ formal einzuführen: dern auch die Variablen einer Formel um-
fasst. Dies entspricht der Vorgehensweise
in [173]. Eine alternative Vorgehensweise
Definition 2.16 (Semantik der Prädikatenlogik) besteht darin, die Belegung der Variablen
durch eine separate Funktion b zu model-
ϕ und ψ seien prädikatenlogische Formeln und (U, I) eine Interpre- lieren und den hier verwendeten Ausdruck
(U, I) |= ϕ durch den folgenden zu erset-
tation. Die Semantik der Prädikatenlogik ist durch die Modellrela-
zen:
tion ‚|=‘ gegeben, die induktiv über dem Formelaufbau definiert ist:
(U, I, b) |= ϕ (2.5)
(U, I) |= 1 Wird dieser Weg bestritten, so gibt es
zwei Möglichkeiten, den Modellbegriff zu
(U, I) |= 0
definieren. Manche Autoren sehen in ei-
(U, I) |= P(σ1 , . . . , σn ) :⇔ (I(σ1 ), . . . , I(σn )) ∈ I(P) nem Modell ein Tripel (U, I, b), das die
(U, I) |= (¬ϕ) :⇔ (U, I) | = ϕ Beziehung (2.5) erfüllt. Diese Definition
unterscheidet sich von unserer in erster
(U, I) |= (ϕ ∧ ψ) :⇔ (U, I) |= ϕ und (U, I) |= ψ Linie durch die Wahl der Notation und
(U, I) |= (ϕ ∨ ψ) :⇔ (U, I) |= ϕ oder (U, I) |= ψ wird beispielsweise in [51] und [158] ver-
(U, I) |= (ϕ → ψ) :⇔ (U, I) |= ϕ oder (U, I) |= ψ folgt. Andere Autoren definieren ein Mo-
dell als ein Tupel (U, I), das die Bezie-
(U, I) |= (ϕ ↔ ψ) :⇔ (U, I) |= ϕ → ψ und (U, I) |= ψ → ϕ hung (2.5) für ausnahmslos alle Belegun-
(U, I) |= (ϕ  ψ) :⇔ (U, I) |= (ϕ ↔ ψ) gen b erfüllt [126]. Beachten Sie, dass sich
die unterschiedlichen Definitionen nur auf
(U, I) |= ∀ ξ ϕ :⇔ Für alle u ∈ U ist (U, I[ξ /u] ) |= ϕ
Formeln mit freien Variablen auswirken.
(U, I) |= ∃ ξ ϕ :⇔ Es gibt ein u ∈ U mit (U, I[ξ /u] ) |= ϕ Sind alle Variablen durch Quantoren ge-
bunden, erhalten wir in allen drei Fällen
Eine Interpretation (U, I) mit (U, I) |= ϕ heißt Modell für ϕ. einen äquivalenten Modellbegriff.
108 2 Formale Systeme

∀ x ∃ y P(f(x, y))
(VΣ = {x, y}, FΣ = {f}, PΣ = {P})

Erste Interpretation (U, I) Zweite Interpretation (U  , I  )

U := Z U  := N
I(f) := (x, y) → x + y I  (f) := (x, y) → x + y
I(P) := {0} I  (P) := {0}

… … … …
y 0 x y∉ 0 x
„Für alle x existiert ein y mit „Für alle x existiert ein y mit
x + y = 0“ x + y = 0“
ist in Z eine wahre Aussage. ist in N eine falsche Aussage.
Abbildung 2.18: Zwei Interpretationen (U, I) |= ∀ x ∃ y P(f(x, y)) (U  , I  ) |= ∀ x ∃ y P(f(x, y))
für die Formel ∀ x ∃ y P(f(x, y))

In Definition 2.16 wird erstmals der Ausdruck I[ξ /u] verwendet. Ist
(U, I) eine prädikatenlogische Interpretation, so ist mit (U, I[ξ /u] ) je-
ne Interpretation gemeint, die der Variablen ξ das Individuenelement u
zuordnet und sonst mit (U, I) identisch ist.

Abbildung 2.18 demonstriert den Interpretationsbegriff anhand zweier


Beispiele. Beide assoziieren das Funktionszeichen f mit der gewöhn-
lichen Addition und das Prädikatsymbol P mit der Menge {0}, d. h.,
P(x) ist genau für die Zahl 0 wahr. Unterschiedlich gewählt sind die
zugrunde liegenden Individuenmengen. Die erste Interpretation schöpft
aus dem Bereich der ganzen Zahlen, während die zweite Interpretation
nur die natürlichen Zahlen in Betracht zieht. Unter diesen Vorausset-
zungen liest sich die Beispielformel ϕ := ∀ x ∃ y P(f(x, y)) wie folgt:

„Für alle x existiert ein y mit x + y = 0“

Für die Menge der ganzen Zahlen ist die Aussage offensichtlich erfüllt,
für die natürlichen Zahlen dagegen nicht.

Die folgenden Begriffe, die wir bereits in der Diskussion der Aussagen-
logik kennen gelernt haben, tragen diesem speziellen Umstand Rech-
nung:
2.4 Prädikatenlogik erster Stufe 109

Definition 2.17 (Erfüllbarkeit, Allgemeingültigkeit) I Negationsgesetze

¬∃ ξ ϕ ≡ ∀ ξ ¬ϕ
Eine Formel ϕ mit den freien Variablen ξ1 , . . . , ξn heißt
∃ ξ ¬ϕ ≡ ¬∀ ξ ϕ
I erfüllbar, falls ϕ mindestens ein Modell hat.
es gibt ein (U, I) mit (U, I) |= ϕ I Bereichserweiterungsgesetze

I unerfüllbar, falls sie nicht erfüllbar ist. ϕ(ξ ) ∧ (∃ ξ ψ) ≡ ∃ ξ (ϕ ∧ ψ)


es gibt kein (U, I) mit (U, I) |= ϕ ϕ(ξ) ∧ (∀ ξ ψ) ≡ ∀ ξ (ϕ ∧ ψ)
ϕ(ξ ) ∨ (∃ ξ ψ) ≡ ∃ ξ (ϕ ∨ ψ)
I allgemeingültig, falls jede Interpretation ein Modell von ϕ ist.
für alle (U, I) ist (U, I) |= ϕ ϕ(ξ ) ∨ (∀ ξ ψ) ≡ ∀ ξ (ϕ ∨ ψ)
ϕ(ξ ) → (∃ ξ ψ) ≡ ∃ ξ (ϕ → ψ)
ϕ(ξ) → (∀ ξ ψ) ≡ ∀ ξ (ϕ → ψ)
Genau wie im Falle der Aussagenlogik können wir diese Begriffe auf
Mengen von Formeln erweitern. Eine Menge M = {ϕ1 , . . . , ϕn } heißt Abbildung 2.19: Wichtige prädikatenlogi-
erfüllbar, wenn eine Interpretation existiert, die für alle ϕi ∈ M ein Mo- sche Äquivalenzen. Die Schreibweise ϕ(ξ )
dell ist; sie heißt unerfüllbar, wenn ihre Elemente kein gemeinsames drückt aus, dass die Variable ξ in der For-
Modell besitzen. Ist dagegen jede Interpretation ein Modell für die For- mel ϕ nicht frei vorkommt.
meln ϕ1 , . . . , ϕn , so bezeichnen wir die Menge M als allgemeingültig.

Auch den Begriff der logischen Folgerung können wir aus der Aussa- In der Aussagenlogik haben
genlogik übernehmen. Ist M eine Mengen von Formeln und jedes Mo- wir den Begriff der Tautolo-
dell von M auch Modell einer Formel ϕ, so schreiben wir M |= ϕ („Aus gie als Synonym für den Begriff der allge-
M folgt ϕ“). Die Beziehung 0/ |= ϕ ist dann gleichbedeutend mit der meingültigen Formel eingeführt. Wir wol-
Aussage, dass ϕ eine allgemeingültige Formel ist. Wie gewohnt ver- len diese Konvention auch in der Prädika-
tenlogik beibehalten, wohl wissend, dass
wenden wir in diesem Fall die gekürzte Schreibweise |= ϕ und bezeich-
einige Bücher eine feinere Unterschei-
nen ϕ, wie in der Aussagenlogik, als Tautologie.
dung zwischen beiden Begriffen vorneh-
Auch der Begriff der prädikatenlogischen Äquivalenz ergibt sich nun men. Mitunter wird eine prädikatenlogi-
fast von selbst. Wir bezeichnen zwei prädikatenlogische Formeln ϕ und sche Formel in der Literatur nur dann als
Tautologie bezeichnet, wenn sie im aussa-
ψ genau dann als äquivalent, geschrieben als ϕ ≡ ψ, wenn sie diesel-
genlogischen Sinne allgemeingültig ist.
ben Modelle haben. Oder, was dasselbe ist: wenn die Formel ϕ ↔ ψ Was das bedeutet, wollen wir am Bei-
allgemeingültig ist. spiel der Formel (∀ x P(x)) ∨ ¬(∀ x P(x))
deutlich machen. Auf der aussagenlo-
Abbildung 2.19 fasst wichtige Äquivalenzen in einer Übersicht zusam- gischen Ebene hat diese Formel die
men. Die beiden Negationsgesetze sind von besonderer Bedeutung; Form ϕ ∨ ¬ϕ und ist deshalb auch im
sie zeigen, dass wir einen der beiden Quantoren aus dem Symbolvor- aussagenlogischen Sinne allgemeingül-
rat streichen können, ohne die Ausdrucksstärke der Prädikatenlogik zu tig. Dagegen hat die äquivalente Formel
verringern. Ausnutzen werden wir diese Eigenschaft im nächsten Ab- ∀ x P(x) ∨ ∃ x ¬P(x) die Form ϕ ∨ ψ und
schnitt. Dort besprechen wir einen Kalkül, der ausschließlich Axiome ist im aussagenlogischen Sinne nicht all-
und Schlussregeln für den Allquantor bereitstellt. gemeingültig. In Büchern, die dieser Ter-
minologie folgen, ist damit nicht jede
prädikatenlogisch allgemeingültige For-
mel auch eine Tautologie. Die Umkehrung
dieser Aussage gilt jedoch auch dort.
110 2 Formale Systeme

I Beispiel 1: S := [x ← a] 2.4.2 Prädikatenlogischer Kalkül


(∀ x P(x, y))S = (∀ x P(x, y))
(∀ y P(x, y))S = (∀ y P(a, y)) In diesem Abschnitt beschäftigen wir uns mit der Frage, wie die Allge-
meingültigkeit einer prädikatenlogischen Formel formal bewiesen wer-
(∀ x ∀ y P(x, y))S = (∀ x ∀ y P(x, y))
den kann. Genau wie im Fall der Aussagenlogik werden wir einen Kal-
kül definieren, in dem sich allgemeingültige Formeln durch die Anwen-
S ist eine Grundsubstitution
dung von Schlussregeln aus einer Menge a priori festgelegter Axiome
ableiten lässt. Um welche Axiome und Schlussregeln es sich konkret
I Beispiel 2: S := [x ← y, y ← f(y)] handelt, ist in Tabelle 2.9 zusammengefasst.

(∀ x P(x, y))S = (∀ x P(x, f(y))) Die Axiomenschemata (A1) bis (A3) sind alte Bekannte; sie sind
mit den Axiomen des aussagenlogischen Kalküls identisch. Das Sche-
(∀ y P(x, y))S = (∀ y P(y, y))
ma (A4) drückt aus, dass aus der Formel ∀ ξ ϕ Instanzen der Form
(∀ x ∀ y P(x, y))S = (∀ x ∀ y P(x, y)) ϕ[ξ ← σ ] folgen. Die Formel ϕ[ξ ← σ ] entsteht aus ϕ, indem alle frei-
S ist eine Substitution, en Vorkommen von ξ , und nur diese, durch den prädikatenlogischen
aber keine Grundsubstitution Term σ ersetzt werden. Wir sagen, die Formel ϕ(ξ ) wurde mit dem
Term σ instantiiert (Abbildung 2.20). Das Schema (A5) erlaubt uns, ei-
Abbildung 2.20: Eine Variablensubstituti- ne Teilformel ϕ immer dann aus dem Wirkungsbereich eines Quantors
on der Form [ξ ← σ ] ersetzt alle freien Vor- herauszunehmen, wenn die quantifizierte Variable in ϕ nicht vorkommt.
kommen der Variablen ξ durch den Term σ . Theoreme können entweder mithilfe des bereits bekannten Modus po-
Alle gebundenen Vorkommen bleiben un- nens (MP) oder der neu hinzugekommenen Generalisierungsregel (G)
angetastet. Enthalten die eingesetzten Ter- deduziert werden. Letztere macht es möglich, aus der Formel ϕ die Ge-
me selbst keine Variablen, so sprechen wir neralisierung ∀ ξ ϕ abzuleiten.
von einer Grundsubstitution.

Tabelle 2.9: Axiome und Schlussregeln Axiome


des prädikatenlogischen Kalküls.
Beachten Sie bei der Instanziierung von
ϕ → (ψ → ϕ) (A1)
(A4), dass eine Instanz nur dann ge-
bildet werden darf, wenn die Substituti-
on von ξ durch σ kollisionsfrei durch- (ϕ → (ψ → χ)) → ((ϕ → ψ) → (ϕ → χ)) (A2)
geführt werden kann. Von einer Kollisi-
on sprechen wir immer dann, wenn ei- (¬ϕ → ¬ψ) → (ψ → ϕ) (A3)
ne Variable von σ durch die Substituti-
on in den Wirkungsbereich eines Quan-
∀ ξ ϕ → ϕ[ξ ← σ ] (für jede kollisionsfreie Substitution) (A4)
tors gerät. Dies ist beispielsweise für
ϕ = ∃ y P(ξ , y) und σ = y der Fall. Wür-
den wir auf die Forderung der Kollisi- ∀ ξ (ϕ(ξ ) → ψ) → (ϕ → ∀ ξ ψ) (A5)
onsfreiheit verzichten, so wäre die falsche
Aussage ∀ x ∃ y P(x, y) → ∃ y P(y, y) ein
Theorem des Kalküls. Schlussregeln
Bei der Instanziierung von (A5) ist eben-
falls Vorsicht geboten. Hier dürfen für ϕ ϕ, ϕ → ψ ϕ
(MP) (G)
nur solche Formeln eingesetzt werden, in ψ ∀ξ ϕ
denen die Variable ξ nicht frei vorkommt.
2.4 Prädikatenlogik erster Stufe 111

Ableitbare Theoreme
I Theorem T16
∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ∀ ξ ϕ(ξ , ζ )

I Theorem T17
∀ ξ (ϕ(ξ ) → ψ(ξ )) → (∀ ξ ϕ(ξ ) → ∀ ξ ψ(ξ ))

I Theorem T18 Tabelle 2.10: Eine kleine Auswahl von


∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ξ ϕ(ξ , ξ ) Theoremen, die sich im prädikatenlogi-
schen Kalkül beweisen lassen

Genau wie im aussagenlogischen Fall ist das Deduktionstheorem ein


wichtiger Baustein in der Beweisführung. Für geschlossene Formeln
können wir die Formulierung aus Satz 2.7 eins zu eins übernehmen.
Im Umgang mit freien Variablen müssen wir dagegen mehr Vorsicht
walten lassen, wie die folgende Ableitungssequenz beweist:

1. { P(x) }  P(x) (Satz 2.4)


2. { P(x) }  ∀ x P(x) (G, 1)

Wäre das Deduktionstheorem uneingeschränkt gültig, so ließe sich mit


P(x) → ∀ x P(x)
eine Formel ableiten, die nicht allgemeingültig ist, aber genau dies darf
im prädikatenlogischen Kalkül nicht möglich sein. Um eine korrekte
Variante des Deduktionstheorems zu erhalten, müssen wir die Formu-
lierung geringfügig anpassen:

Satz 2.8 (Deduktionstheorem der Prädikatenlogik)

Es seien ϕ, ϕ1 , . . . , ϕn und ψ beliebige prädikatenlogische Formeln.


I Ist ϕ geschlossen, dann gilt:

{ϕ1 , . . . , ϕn } ∪ {ϕ}  ψ ⇔ {ϕ1 , . . . , ϕn }  ϕ → ψ

I Enthält ϕ die freien Variablen ξ1 , . . . , ξn , dann gilt:

{ϕ1 , . . . , ϕn } ∪ {ϕ}  ψ ⇔ {ϕ1 , . . . , ϕn }  (∀ ξ1 . . . ∀ ξn ϕ) → ψ

Wir wollen den Kalkül nun in Aktion erleben und exemplarisch die in
Tabelle 2.10 aufgeführten Theoreme beweisen (vgl. [125]):
112 2 Formale Systeme

Theorem T16 1. {∀ ξ ∀ ζ ϕ(ξ , ζ )}  ∀ ξ ∀ ζ ϕ(ξ , ζ ) (Satz 2.4)


∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ∀ ξ ϕ(ξ , ζ ) 2.  ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ϕ(ξ , ζ ) (A4)
3. {∀ ξ ∀ ζ ϕ(ξ , ζ )}  ∀ ζ ϕ(ξ , ζ ) (MP, 1,2)
4.  ∀ ζ ϕ(ξ , ζ ) → ϕ(ξ , ζ ) (A4)
5. {∀ ξ ∀ ζ ϕ(ξ , ζ )}  ϕ(ξ , ζ ) (MP, 3,4)
6. {∀ ξ ∀ ζ ϕ(ξ , ζ )}  ∀ ξ ϕ(ξ , ζ ) (G, 5)
7. {∀ ξ ∀ ζ ϕ(ξ , ζ )}  ∀ ζ ∀ ξ ϕ(ξ , ζ ) (G, 6)
8.  ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ∀ ξ ϕ(ξ , ζ ) (DT)

Theorem T17 1. {∀ ξ (ϕ(ξ ) → ψ(ξ ))}  ∀ ξ (ϕ(ξ ) → ψ(ξ )) (Satz 2.4)


∀ ξ (ϕ(ξ ) → ψ(ξ )) 2. {∀ ξ ϕ(ξ )}  ∀ ξ ϕ(ξ ) (Satz 2.4)
→ (∀ ξ ϕ(ξ ) → ∀ ξ ψ(ξ )) 3.  ∀ ξ (ϕ(ξ ) → ψ(ξ )) → (ϕ(ξ ) → ψ(ξ )) (A4)
4. {∀ ξ (ϕ(ξ ) → ψ(ξ ))}  ϕ(ξ ) → ψ(ξ ) (MP, 1,3)
5.  ∀ ξ ϕ(ξ ) → ϕ(ξ ) (A4)
6. {∀ ξ ϕ(ξ )}  ϕ(ξ ) (MP, 2,5)
7. {∀ ξ (ϕ(ξ ) → ψ(ξ )), ∀ ξ ϕ(ξ )}  ψ(ξ ) (MP, 4,6)
8. {∀ ξ (ϕ(ξ ) → ψ(ξ )), ∀ ξ ϕ(ξ )}  ∀ ξ ψ(ξ ) (G, 7)
9. {∀ ξ (ϕ(ξ ) → ψ(ξ ))}  ∀ ξ ϕ(ξ ) → ∀ ξ ψ(ξ ) (DT)
10.  ∀ ξ (ϕ(ξ ) → ψ(ξ )) → (∀ ξ ϕ(ξ ) → ∀ ξ ψ(ξ )) (DT)

Theorem T18 1. {∀ ξ ∀ ζ ϕ(ξ , ζ )}  ∀ ξ ∀ ζ ϕ(ξ , ζ ) (Satz 2.4)


∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ξ ϕ(ξ , ξ ) 2.  ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ζ ϕ(ξ , ζ ) (A4)
für jede kollisionsfreie 3. {∀ ξ ∀ ζ ϕ(ξ , ζ )}  ∀ ζ ϕ(ξ , ζ ) (MP, 1,2)
Substitution ϕ[ζ ← ξ ] 4.  ∀ ζ ϕ(ξ , ζ ) → ϕ(ξ , ξ ) (A4)
5. {∀ ξ ∀ ζ ϕ(ξ , ζ )}  ϕ(ξ , ξ ) (MP, 3,4)
6. {∀ ξ ∀ ζ ϕ(ξ , ζ )}  ∀ ξ ϕ(ξ , ξ ) (G, 5)
7.  ∀ ξ ∀ ζ ϕ(ξ , ζ ) → ∀ ξ ϕ(ξ , ξ ) (DT)

Abschließend wollen wir uns auch hier mit der Frage beschäftigen, wel-
che der in Definition 2.2 formulierten Eigenschaften erfüllt werden und
welche nicht. Von der Korrektheit des prädikatenlogischen Kalküls kön-
nen wir uns leicht überzeugen. Mit den Axiomenschemata (A1) bis (A3)
haben wir uns bereits in Abschnitt 2.3.2 auseinandergesetzt; sie sind so
beschaffen, dass alle Instanzen allgemeingültige Formeln sind. Ferner
folgt aus der Definition des Allquantors, dass auch alle Instanzen der
2.5 Prädikatenlogik mit Gleichheit 113

Axiomenschemata (A4) und (A5) allgemeingültige Formeln sind, und


diese Eigenschaft wird sowohl durch den Modus ponens als auch durch
die Generalisierungsregel erhalten. Für die Generalisierungsregel folgt
dies unmittelbar aus der Art und Weise, wie wir die Allgemeingültig-
keit von Formeln mit freien Variablen festgelegt haben (vgl. Definiti-
on 2.17). Damit ist der Kalkül korrekt und nach Satz 2.2 auch wider-
spruchsfrei.

Genau wie im Fall der Aussagenlogik ist auch der prädikatenlogische


Kalkül vollständig, d. h., jede allgemeingültige Formel lässt sich durch
die Anwendung der Schlussregeln nach endlich vielen Schritten aus den
Axiomen deduzieren. Dass es überhaupt möglich ist, einen vollständi-
gen Kalkül für die Prädikatenlogik erster Stufe zu definieren, wissen wir
seit dem Jahr 1929. Es ist das Ergebnis des berühmten Vollständigkeits-
satzes, den Kurt Gödel im Rahmen seiner Dissertation bewies [67, 68].
Der prädikatenlogische Teil des formalen Systems, das Gödel für seinen
Vollständigkeitsbeweis verwendete, ist mit jenem aus Tabelle 2.9 iden-
tisch. Unterschiede bestehen ausschließlich in den aussagenlogischen
Axiomen. Anstelle der Axiomenschemata (A1) bis (A3) verwendete
Gödel die vier von Ackermann und Hilbert eingeführten Schemata aus
Tabelle 2.8.

Achten Sie darauf, den Gödel’schen Vollständigkeitssatz nicht mit den


beiden Unvollständigkeitssätzen zu verwechseln, die Sie in Kapitel 4
kennen lernen werden. Auch wenn ihre Namen zum Verwechseln ähn-
lich klingen, sind ihre inhaltliche Aussagen völlig verschieden.

2.5 Prädikatenlogik mit Gleichheit

Beim Versuch, mathematische Sachverhalte innerhalb der Prädikatenlo-


gik zu formalisieren, werden Sie schnell bemerken, dass dies in einigen
Fällen problemlos gelingt, in anderen Fällen aber nur umständlich oder
gar nicht möglich ist. Um dieses Phänomen zu demonstrieren, wollen
wir eine Formel konstruieren, die genau dann wahr ist, wenn das zwei-
stellige Prädikatzeichen R als eine linkstotale, rechtseindeutige Relation
R interpretiert wird. Die Eigenschaft der Linkstotalität können wir pro-
blemlos niederschreiben:

∀ x ∃ y R(x, y)

Die Eigenschaft der Rechtseindeutigkeit bereitet uns dagegen Schwie-


rigkeiten. Wir müssen ausdrücken, dass zu keinem x zwei verschiedene
Elemente y und z mit R(x, y) und R(x, z) existieren. Mit anderen Worten:
114 2 Formale Systeme

Axiome Gilt sowohl R(x, y) als auch R(x, z), so müssen y und z Repräsentanten
desselben Elements sein. Um diesen Sachverhalt zu formalisieren, fehlt
ξ=
˙ ξ (A6) uns ein wichtiger Baustein: die Gleichheit. Eine einfache Lösungsmög-
lichkeit besteht darin, den Gleichheitsoperator in Form eines speziellen
ξ=
˙ ζ → (ϕ[ζ ← ξ ] → ϕ) (A7) Prädikatzeichens ‚=‘˙ direkt in die Logik zu integrieren. Folgen wir die-
(für jede kollisionsfreie Substitution)
sem Ansatz, so können wir die gesuchte Formel mit Leichtigkeit auf-
schreiben:
∀ x ∃ y (R(x, y) ∧ ∀ z (R(x, z) → z =
˙ y))
Tabelle 2.11: Fügen wir dem formalen Sys- Um die Prädikatenlogik mit Gleichheit formal zu definieren, müssen
tem aus Abschnitt 2.4.2 die Axiome (A6) wir lediglich zwei Definitionen aus Abschnitt 2.4 anpassen. Die erste
und (A7) hinzu, so entsteht ein vollstän- betrifft den Aufbau atomarer Formeln:
diger Kalkül für die Prädikatenlogik erster
Stufe mit Gleichheit. Die Symbole ξ und ζ
sind Platzhalter für prädikatenlogische Va- Ergänzung zu Definition 2.14
riablen.
I Sind σ und τ Terme, so ist (σ =
˙ τ) eine atomare Formel.

Ferner erweitern wir die Semantikdefinition um eine Zeile, die dem


ϕ := ∀ x x =
˙ y Symbol ‚=‘
˙ seine ihm zugedachte Bedeutung verleiht:

Axiomenschema (A7)
Ergänzung zu Definition 2.16
mit ξ = x und ζ = y

(U, I) |= (σ =
˙ τ) :⇔ I(σ ) = I(τ)
x=
˙ y → (∀ x x =
˙ x → ∀x x =
˙ y)

Zu guter Letzt wollen wir den in Abschnitt 2.4.2 eingeführten Kalkül


äquivalent zu
durch die Hinzunahme weiterer Axiome zu einem Kalkül für die Prädi-
katenlogik mit Gleichheit ausbauen. Tabelle 2.11 fasst zusammen, um
welche Axiome es sich hierbei handelt. Das Axiom (A6) beschreibt die
x=˙ y → ∀x x =˙ y
Reflexivität der Gleichheitsrelation. Es ist als Axiomenschema ausge-
(nicht allgemeingültig)
legt, in dem wir ξ durch eine beliebige Variable ersetzen dürfen. (A7)
heißt Substitutionsaxiom und ist ebenfalls als Axiomenschema ausge-
Abbildung 2.21: Wird in (A7) auf die For- legt. Hierin sind die Symbole ξ und ζ Platzhalter für prädikatenlogische
derung der Kollisionsfreiheit verzichtet, so Variablen.
lassen sich aus dem Axiomenschema For-
In Worten besagt das Substitutionsaxiom, dass kein Schaden angerich-
meln generieren, die nicht allgemeingültig
sind. In dem gezeigten Beispiel geht die
tet wird, wenn wir in einer Formel ϕ Gleiches durch Gleiches ersetzen.
Allgemeingültigkeit verloren, da die einge- Achten Sie darauf, das Axiomenschema nur dann anzuwenden, wenn
setzte Variable x in den Wirkungsbereich die Substitution von ζ durch ξ kollisionsfrei ist, die Variable ξ nach
eines Quantors gerät und damit in keinem der Einsetzung also nicht durch einen Quantor gebunden ist (Abbil-
Bezug mehr zu der Variablen x steht, die dung 2.21). Diese Einschränkung gewährleistet, dass sich die neu ein-
in dem Teilausdruck x =˙ y links neben dem gesetzte Variable ξ auf das gleiche Individuenelement bezieht wie die
Implikationsoperator auftaucht. Variable ξ , die in (A7) auf der linken Seite der Implikation auftaucht.
2.5 Prädikatenlogik mit Gleichheit 115

Ableitbare Theoreme

I Theorem T19 I Theorem T20


σ=˙ σ σ=˙ τ →τ =˙ σ Tabelle 2.12: Eine Auswahl von Theore-
men der Prädikatenlogik erster Stufe mit
I Theorem T21 Gleichheit (vgl. [125]). Die Platzhalter σ ,
τ und ρ stehen für beliebige prädikatenlo-
σ=˙ τ → (τ =
˙ ρ →σ =
˙ ρ)
gische Terme.

Als Beispiele wollen wir die Theoreme aus Tabelle 2.12 in unserem neu
geschaffenen Kalkül beweisen. Inhaltlich beschreiben die Theoreme die
Reflexivität, die Symmetrie und die Transitivität der Gleichheitsrelati-
on. Wie schon zuvor sind (T19) bis (T21) keine Theoreme im eigentli-
che Sinne, sondern Schemata, in denen wir die Platzhalter σ , τ und ρ
durch beliebige prädikatenlogische Terme ersetzen dürfen.

Sei ξ eine beliebige Variable. Theorem T19


σ=˙ σ
1.  ξ=˙ ξ (A6)
2.  ∀ξ ξ =˙ ξ (G, 1)
3.  ∀ξ ξ =˙ ξ →σ =
˙ σ (A4)
4.  σ=˙ σ (MP, 2,3)

Seien ξ , ζ beliebige Variablen. Theorem T20


σ=˙ τ →τ =
˙ σ
1.  ξ =
˙ ζ → (ξ =
˙ ξ →ζ =
˙ ξ) (A7)
2. { ξ =
˙ ζ}  ξ= ˙ ξ →ζ =
˙ ξ (DT)
3. { ξ =
˙ ζ, ξ =
˙ ξ}  ζ=˙ ξ (DT)
4. { ξ =
˙ ξ}  ξ= ˙ ζ →ζ = ˙ ξ (DT)
5.  ξ =˙ ξ → (ξ =˙ ζ →ζ = ˙ ξ) (DT)
6.  ξ =˙ ξ (A6)
7.  ξ =˙ ζ →ζ = ˙ ξ (MP, 5,6)
8.  ∀ ξ (ξ =
˙ ζ →ζ = ˙ ξ) (G, 7)
9.  ∀ ξ (ξ =
˙ ζ →ζ = ˙ ξ ) → (σ =
˙ ζ →ζ =
˙ σ) (A4)
10.  σ =
˙ ζ →ζ = ˙ σ (MP, 8,9)
11.  ∀ ζ (σ =
˙ ζ →ζ =˙ σ) (G, 10)
12.  ∀ ζ (σ =
˙ ζ →ζ =˙ σ ) → (σ =
˙ τ →τ =
˙ σ) (A4)
13.  σ =˙ τ →τ =˙ σ (MP, 11,12)
116 2 Formale Systeme

Theorem T21 Seien ξ , ζ , ν beliebige Variablen.


σ=˙ τ → (τ =
˙ ρ →σ =
˙ ρ)
1.  ξ =
˙ ζ →ζ = ˙ ξ (T20)
2.  ζ =
˙ ξ → (ζ =˙ ν →ξ =
˙ ν) (A7)
3.  ξ =˙ ζ → (ζ =
˙ ν →ξ =˙ ν) (MB, 1,2)
4.  ∀ ξ (ξ =
˙ ζ → (ζ =
˙ ν →ξ = ˙ ν)) (G, 2)
5.  ∀ ξ (ξ =
˙ ζ → (ζ =
˙ ν →ξ = ˙ ν)) →
(σ =
˙ ζ → (ζ =
˙ ν →σ =
˙ ν)) (A4)
6.  σ =˙ ζ → (ζ =
˙ ν →σ =˙ ν) (MP, 4,5)
7.  ∀ ζ (σ =
˙ ζ → (ζ =
˙ ν →σ = ˙ ν)) (G, 6)
8.  ∀ ζ (σ = ˙ ζ → (ζ = ˙ ν →σ = ˙ ν))
→ (σ = ˙ τ → (τ =˙ ν →σ = ˙ ν)) (A4)
9.  σ = ˙ τ → (τ =˙ ν →σ = ˙ ν) (MP, 7,8)
10.  ∀ ν (σ =˙ τ → (τ =˙ ν →σ = ˙ ν)) (G, 9)
11.  ∀ ν (σ =˙ τ → (τ =˙ ν →σ = ˙ ν)) →
(σ =˙ τ → (τ =˙ ρ →σ =˙ ρ)) (A4)
12.  σ =˙ τ → (τ =˙ ρ →σ =˙ ρ) (MP, 10,11)

Vielleicht haben Sie sich gefragt, warum wir die Gleichheit in Form
eines speziell hierfür geschaffenen Prädikatzeichens in die Logik in-
tegriert haben, das, anders als gewöhnliche Prädikatzeichen, mit einer
festen Semantik belegt ist. Die Antwort ist einfach: Innerhalb der Prä-
dikatenlogik erster Stufe ist es unmöglich, eine Formel ϕ= zu konstru-
ieren, die genau dann wahr ist, wenn ein bestimmtes Prädikatzeichen,
z. B. P, als die Gleichheitsrelation interpretiert wird:
(U, I) |= ϕ= ⇔ I(P) = {(x, y) ∈ U 2 | x = y} (2.6)
Wir werden nun aufklären, warum die Gleichheit nicht in der Prädika-
tenlogik erster Stufe definiert werden kann. Konkret werden wir zeigen,
dass aus jedem Modell (U, I) von ϕ= , in dem P als die Gleichheit in-
terpretiert wird, ein anderes Modell (U  , I  ) von ϕ= konstruiert werden
kann, in dem P diese Bedeutung verliert. Dies steht im Widerspruch zu
(2.6). Würde die Formel ϕ= existieren, müsste sie so beschaffen sein,
dass P in jedem Modell die Gleichheit ist.

Die Individuenmenge des neuen Modells entsteht, indem wir jedes Ele-
ment u ∈ U um ein Kopie u ergänzen. Ferner erweitern wir die Interpre-
tation der Prädikat- und Funktionszeichen so, dass es keine Rolle spielt,
ob wir ein Originalelement aus U oder seine Kopie vor uns haben.
2.5 Prädikatenlogik mit Gleichheit 117

Wie dies konkret funktioniert, demonstriert Abbildung 2.22 am Bei- I Übergang von U zu U 
spiel eines zweistelligen Prädikatsymbols P und einer Interpretation
U = {u1 , u2 }
(U, I) mit dem Individuenbereich U = {u1 , u2 }. In (U, I) wird P als
die Gleichheit interpretiert, d. h. als diejenige Relation, die exakt die
beiden Kombinationen (u1 , u1 ) und (u2 , u2 ) umfasst. In der Interpreta-
tion (U  , I  ) beinhaltet P dagegen die Kombinationen (u1 , u1 ), (u1 , u1 ), U  = {u1 , u2 , u1 , u2 }
(u1 , u1 ), (u1 , u1 ) und (u2 , u2 ), (u2 , u2 ), (u2 , u2 ), (u2 , u2 ). Die Wahl von
I  (P) sorgt dafür, dass es für das Bestehen oder Nichtbestehen der Re- I Übergang von I zu I 
lation nun irrelevant ist, ob wir ein Originalelement u ∈ U oder dessen
I(P) = { (u1 , u1 ), (u2 , u2 ) }
Kopie u betrachten. Folgerichtig haben wir keine Möglichkeit, auf der
Logikebene zwischen den Originalelementen und ihren Kopien zu un-
terscheiden. Ist (U, I) ein Modell für ϕ= , so ist es zwangsläufig auch
(U  , I  ). In (U  , I  ) wird das Prädikatzeichen P allerdings nicht mehr als I  (P) = { (u1 , u1 ), (u2 , u2 ),
die Gleichheitsrelation interpretiert, da jedes Element jetzt zusätzlich in
(u1 , u1 ), (u2 , u2 ),
Relation zu seiner Kopie steht. Der Widerspruch zeigt, dass die Quanti-
fikation über die Elemente des Individuenbereichs nicht stark genug ist, (u1 , u1 ), (u2 , u2 ),
um zwischen einem Element und seiner Kopie zu unterscheiden. (u1 , u1 ), (u2 , u2 ) }

Wenn Sie sich die vorgenommene Konstruktion ein zweites Mal be-
trachten, werden Sie bemerken, dass sich dahinter ein simpler mathe- Abbildung 2.22: Die Gleichheitsrelation
matischer Trick verbirgt. Hinter dem Übergang von U zu U  steckt eine lässt sich nicht innerhalb der Prädikatenlo-
Äquivalenzklassenbildung, die jedes Element x ∈ U mit seiner Kopie x gik erster Stufe definieren. Aus jedem Mo-
dell (U, I), das ein Prädikatzeichen als die
zu einer Äquivalenzklasse [x]∼ zusammenfasst:
Gleichheit interpretiert, lässt sich ein Mo-
dell (U  , I  ) konstruieren, in der das Prä-
[x]∼ = [x ]∼ = {x, x }
dikatzeichen seine ihm zugedachte Bedeu-
tung verliert.
Jetzt ist auch klar, welche Bedeutung dem Prädikatzeichen P unter der
Interpretation (U  , I  ) zukommt: Es ist die Gleichheit zwischen den ge-
bildeten Äquivalenzklassen. Kurzum: Erfüllt eine Interpretation (U, I)
die Beziehung
I(P) = {(x, y) | x = y}
so gilt für die Interpretation (U  , I  ) das Folgende:

I  (P) = {(x, y) | [x]∼ = [y]∼ }

Die Diskussion zeigt, dass wir mit den Mitteln der Prädikatenlogik er-
ster Stufe den Begriff der Gleichheit nur auf der Ebene von Äquiva-
lenzklassen erfassen können. Um den Gleichheitsbegriff auf der Indi-
viduenebene zu definieren, sind die Mittel der ersten Stufe aber ganz
offensichtlich zu schwach.
118 2 Formale Systeme

2.6 Prädikatenlogik höherer Stufe

In den vorangegangenen Abschnitten haben wir festgelegt, dass die prä-


dikatenlogischen Quantoren ‚∀‘ und ‚∃‘ ausschließlich auf Variablen
angewendet werden dürfen. Das bedeutet, dass wir zwar freizügig über
die Elemente des Individuenbereichs quantifizieren können, nicht aber
über Funktionen und Prädikate. Solche Logiken heißen Logiken erster
Stufe (first order logics). In diesem Abschnitt wollen wir uns von dieser
Fessel befreien und den Weg zu Logiken höherer Stufe (higher-order lo-
gics) ebnen. Die Frage, die uns dabei am meisten beschäftigen wird, ist
eine naheliegende: Können wir eine Logik erschaffen, die ausdrucks-
stärker ist als die PL1, die Prädikatenlogik erster Stufe, oder wird sich
die Quantifikation über Prädikate und Funktionen lediglich als eine Fra-
ge des Komforts erweisen? Am Ende dieses Abschnitts wird die Er-
kenntnis stehen, dass wir die Ausdrucksstärke der Prädikatenlogik tat-
sächlich erhöhen können. Für Euphorie gibt es trotzdem keinen Grund,
denn der Preis dafür ist hoch.

2.6.1 Syntax und Semantik

Wir beginnen mit den nötigen syntaktischen Modifikationen, um die


Prädikatenlogik erster Stufe zu einer Logik höherer Stufe auszubau-
en. Als erstes ergänzen wir die Menge VΣ einer prädikatenlogischen
Prädikatvariable Signatur um zwei neue Variablentypen. Die Variablen des ersten Typs
bezeichnen wir als Prädikatvariablen, die des zweiten als Funktions-
Prädikatvariable variablen. Um die verschiedenen Variablentypen auch optisch unter-
scheiden zu können, verwenden wir für Prädikatvariablen die Symbole
∃ P ∀ x ∀ y (P(x, y) ↔ ∀ R (R(x) ↔ R(y))) P, Q, R, . . . und für Funktionsvariablen die Symbole f, g, h, . . .. Jede der
neu eingeführten Variablen besitzt eine festgelegte Stelligkeit und darf
Individuenvariablen überall dort auftauchen, wo in prädikatenlogischen Ausdrücken erster
Stufe ein Prädikatzeichen bzw. ein Funktionssymbol mit der gleichen
Stelligkeit stehen darf. Lassen wir jetzt noch zu, dass die Quantoren
Funktionsvariable ‚∀‘ und ‚∃‘ auf die Variablen jeden Typs angewendet werden dürfen,
so sind wir am Ziel. Wir haben die Prädikatenlogik zweiter Stufe, kurz
Prädikatvariable
PL2, erreicht (Abbildung 2.23).
∀ P (∀ x ∃ y P(x, y) ↔ ∃ f P(x, f(x)))
Als Nächstes wollen wir den Quantoren ‚∀‘ und ‚∃‘ ihre intuitive Be-
deutung verleihen, zunächst in umgangssprachlicher Form:
Individuenvariablen
∀ P . . . = „Für alle Prädikate gilt . . . “
Abbildung 2.23: Prädikatenlogische For-
meln zweiter Stufe ∃ P . . . = „Es existiert ein Prädikat, für das gilt: . . . “
2.6 Prädikatenlogik höherer Stufe 119

∀ f . . . = „Für alle Funktionen gilt . . . “ Betrachten wir ein einstelli-


ges Prädikatzeichen P von
∃ f . . . = „Es existiert eine Funktion, für die gilt: . . . “
einem mengentheoretischen
Standpunkt, so können wir
In der formalen Definition der Semantik werden wir die Bezeichner
es als Teilmenge des Individuenbereichs
I[ξ /P] und I[ξ / f ] verwenden, in Anlehnung an den Bezeichner I[ξ /u] aus
interpretieren; P repräsentiert die Teil-
Definition 2.16. Ist (U, I) eine prädikatenlogische Interpretation und ξ menge, die genau jene Elemente enthält,
eine Prädikatvariable, so ist mit (U, I[ξ /P] ) jene Interpretation gemeint, für die P wahr ist. Dann ist eine Formel
die ξ die Relation P zuordnet und ansonsten mit (U, I) identisch ist. Das der Bauart ∀ P aber nichts anderes als ei-
Gleiche gilt für I[ξ / f ] auf der Ebene der Funktionen. ne Aussage, die über Teilmengen des In-
dividuenbereichs quantifiziert. Wir kön-
Mit den eingeführten Bezeichnern können wir die Semantik der Prädi- nen jetzt noch einen Schritt weiter ge-
katenlogik zweiter Stufe in wenigen Zeilen niederschreiben: hen und eine neue Variablenklasse einfüh-
ren, die eine Quantifikation über Teilmen-
I ξ ist eine Prädikatvariable der Stelligkeit n gen von Teilmengen gestattet. Auf die-
sem Weg gelangen wir zur Prädikatenlo-
(U, I) |= ∀ ξ ϕ :⇔ Für alle P ⊆ U n ist (U, I[ξ /P] ) |= ϕ gik dritter Stufe. In dieser Logik können
(U, I) |= ∃ ξ ϕ :⇔ Es gibt ein P ⊆ U n mit (U, I[ξ /P] ) |= ϕ wir nicht nur über Elemente der Indivi-
duenmenge sowie Prädikate und Funktio-
I ξ ist eine Funktionsvariable der Stelligkeit n nen, sondern zusätzlich über Eigenschaf-
ten von Prädikaten und Funktionen quan-
(U, I) |= ∀ ξ ϕ :⇔ Für alle f : U n → U ist (U, I[ξ / f ] ) |= ϕ tifizieren. Auf dem eingeschlagenen Weg
können wir zu immer neuen Logiken vor-
(U, I) |= ∃ ξ ϕ :⇔ Es gibt ein f : U n → U mit (U, I[ξ / f ] ) |= ϕ dringen. Als Nächstes erreichen wir die
Prädikatenlogik vierter Stufe, dann die
Dies ist die Standardsemantik der Prädikatenlogik zweiter Stufe. Prädikatenlogik fünfter Stufe und so fort.
Wir wollen nun ausloten, welche Freiheiten sich aus der vorgenomme-
nen Logikerweiterung ergeben. Hierzu betrachten wir zunächst zwei
prädikatenlogische Formeln erster Stufe. Eine davon liest sich so:

ϕI := ∀ x ∀ y (f(x) =
˙ f(y) → x =
˙ y)
I Injektive Funktionen
Die Formel ist genau dann wahr, wenn f als injektive Funktion interpre-


tiert wird (Abbildung 2.24 oben). Auf die gleiche Weise können wir die
Surjektivität einer Funktion beschreiben (Abbildung 2.24 unten). Auch „Jedes Element der
hier reicht eine Formel erster Stufe aus: Zielmenge besitzt
höchstens ein Urbild.“
ϕS := ∀ y ∃ x (y =
˙ f(x))
I Surjektive Funktionen
Jetzt nutzen wir die volle Ausdrucksstärke der PL2 und kombinieren ϕI
und ϕS in der folgenden Weise:
„Jedes Element der
Zielmenge besitzt
ϕ<N := ∀ f (ϕI → ϕS ) (2.7)
mindestens ein Urbild.“
= ∀ f (∀ x ∀ y (f(x) =
˙ f(y) → x =
˙ y) → ∀ y ∃ x (y =
˙ f(x)))

In Worten besagt ϕ<N , dass jede injektive Funktion auch surjektiv ist. Abbildung 2.24: Injektive und surjektive
Dass wir diese Aussage in der Prädikatenlogik zweiter Stufe ohne Mühe Funktionen
120 2 Formale Systeme

... formulieren können, verdeutlicht die Eleganz, die alle Logiken höherer
Stufe unzweifelhaft besitzen. Die eigentliche Bedeutung dieser Formel

...
ist aber eine andere. Ein wenig Wissen über injektive und surjektive
Funktionen reicht aus, um zu erkennen, dass ϕ<N genau dann wahr ist,

...
wenn sie über einem endlichen Individuenbereich interpretiert wird. In
diesem und nur in diesem Fall ist jede injektive Funktion auch zwangs-
...

läufig surjektiv. Wir halten fest:


...

(U, I) |= ϕ<N ⇔ U ist endlich (2.8)


...
...

Damit ist es uns gelungen, den Begriff der Endlichkeit innerhalb der
Prädikatenlogik zweiter Stufe präzise zu beschreiben. Wir sagen, der
Begriff der Endlichkeit wird durch ϕ<N definiert.
x f f
... Eine genauso interessante Formel ist diese hier:
...

f f f f ϕ≤N := ∃ f ∃ x ∀ P (P(x) ∧ ∀ y (P(y) → P(f(y))) → ∀ x P(x))


f
...

f f f Die Formel besagt, dass wir die Elemente des Individuenbereichs in


einer Sequenz der Form
...

f f
x, f (x), f ( f (x)), f ( f ( f (x))), f ( f ( f ( f (x)))), . . . (2.9)
f
...

f
erfassen können. Die Variable x beschreibt das erste Element, und die
...

Funktion f gibt an, wie wir von einem Element zum nächsten gelangen.
...

Dass tatsächlich alle Elemente des Individuenbereichs erfasst werden,


stellt die Formel wie folgt sicher: Sie besagt, dass sämtliche Elemente
des Individuenbereichs bereits dann eine Eigenschaft P besitzen, wenn
x, f (x), f ( f (x)), f ( f ( f (x))), . . . sie von allen in (2.9) aufgelisteten Elementen besessen wird. Wäre der
Individuenbereich überabzählbar, so wäre diese Aussage nicht für alle
Abbildung 2.25: Für jede endliche oder ab-
Eigenschaften P erfüllt, egal, wie wir x und f auch wählen. Auf der
zählbare Menge existieren ein Element x
und eine Funktion f , so dass sich die Ele-
anderen Seite können wir für jeden Individuenbereich, der endlich oder
mente durch die Folge x, f (x), f ( f (x)), . . . abzählbar ist, ein Element x und eine Funktion f finden, so dass alle
der Reihe nach aufzählen lassen. Individuenelemente irgendwo in der unendlich langen Kette (2.9) vor-
kommen (Abbildung 2.25). Somit gilt

(U, I) |= ϕ≤N ⇔ U ist höchstens abzählbar (2.10)

Verknüpfen wir ϕ≤N und ¬ϕ<N konjunktiv, so ergibt sich mit

ϕN := ∃ f ∃ x ∀ P (P(x) ∧ ∀ y (P(y) → P(f(y))) → ∀ x P(x)) ∧


¬∀ f (∀ x ∀ y (f(x) =
˙ f(y) → x =
˙ y) → ∀ x ∃ y (x =
˙ f(y)))

eine Formel, die genau unter denjenigen Interpretationen wahr wird, die
einen abzählbaren Individuenbereich aufweisen:

(U, I) |= ϕN ⇔ U ist abzählbar (2.11)


2.6 Prädikatenlogik höherer Stufe 121

Die Formeln ϕ<N , ϕ≤N und ϕN teilen eine faszinierende Eigenschaft;


sie beschreiben Begriffe, die innerhalb der Prädikatenlogik erster Stu-
fe nicht definiert werden können. Jeder Versuch, eine PL1-Formel mit
der Eigenschaft (2.8), (2.10) oder (2.11) zu finden, ist zum Scheitern
verurteilt. Dass sich die Formel ϕ<N ausschließlich in Logiken höhe-
rer Stufe formulieren lässt, folgt aus dem Kompaktheitssatz der PL1,
den wir in Kapitel 7 ausführlich besprechen werden. Dort werden wir
außerdem den berühmten Satz von Löwenheim-Skolem-Tarski disku-
tieren. Er wird uns die Begründung liefern, warum auch ϕ≤N und ϕN
nicht auf Formeln erster Stufe reduziert werden können.

Ein weiterer Begriff, der sich nicht in der PL1 definieren lässt, ist die
Gleichheit. Bereits in Abschnitt 2.5 hatten wir gezeigt, dass keine For-
mel erster Stufe existiert, die genau dann wahr ist, wenn ein bestimmtes
Prädikatzeichen als die Gleichheitsrelation interpretiert wird. In der Prä-
dikatenlogik zweiter Stufe haben wir dagegen kaum Mühe, diesen Be-
griff zu definieren. Es ist leicht einzusehen, dass für zwei unterschied-
liche Elemente immer eine Relation existiert, die beide voneinander se-
pariert. Das heißt im Umkehrschluss, dass sich hinter zwei Individuen-
variablen das gleiche Element verbergen muss, wenn sie durch keine
Relation unterschieden werden können:

ϕ= := ∀ x ∀ y (P(x, y) ↔ ∀ R (R(x) ↔ R(y)))

Diese Formel ist genau dann wahr, wenn das zweistellige Prädikat P als
die Gleichheitsrelation ‚=‘ interpretiert wird.

Die Vorteile der PL2 klingen verlockend, und dennoch spielt sie in der
mathematischen Logik eine weit geringere Rolle als die PL1, die Prä-
dikatenlogik erster Stufe. Gleich mehrere Gründe sind hierfür verant-
wortlich:

I Im direkten Vergleich mit der Prädikatenlogik erster Stufe basiert die


Definition der PL2-Semantik in viel stärkerem Maß auf dem naiven
Mengenbegriff. Um die Bedeutung der Quantifikationen ∀ P ϕ oder
∃ P ϕ festzulegen, mussten wir unweigerlich auf das Konstrukt der
Potenzmenge zurückgreifen und damit gleichsam darauf vertrauen,
dass sich hinter diesem Begriff keine Widersprüche verbergen. Vor
dem Hintergrund der mengentheoretischen Paradoxien wird dieses
Vorgehen von manchen Logikern als illegitim zurückgewiesen.
I Die Tatsache, dass Begriffe existieren, die sich in der PL2, nicht
aber in der PL1 definieren lassen, bedeutet keinesfalls, dass wir mit
der PL1 eine ausdrucksschwache Logik vor uns haben. In Kapitel 3
werden wir mit der Zermelo-Fraenkel-Mengenlehre eine sogenannte
122 2 Formale Systeme

Theorie erster Stufe kennen lernen, die stark genug ist, um nahezu
alle Gebiete der gewöhnlichen Mathematik zu formalisieren. In den
meisten Fällen gibt es daher keinen Grund, den sicheren Hafen der
PL1 zu verlassen.

I Legen wir die Standardsemantik zu Grunde, so ist die PL2 im Ge-


gensatz zur PL1 nicht mehr vollständig. Es ist also nicht mehr mög-
lich, ein korrektes formales System zu konstruieren, in dem alle all-
gemeingültigen PL2-Formeln aus den Axiomen abgeleitet werden
können. In Kapitel 4 werden Sie erkennen, warum die Unvollstän-
digkeit der PL2 unvermeidbar ist. Sie ist eine direkte Konsequenz
aus dem ersten Gödel’schen Unvollständigkeitssatz und der Tatsa-
che, dass sich die natürlichen Zahlen innerhalb der Prädikatenlogik
zweiter Stufe eindeutig axiomatisieren lassen.

2.6.2 Henkin-Interpretation

Die in der Standardsemantik festgelegte Interpretation der Quantoren


‚∀‘ und ‚∃‘ ist intuitiv naheliegend, aber nicht die einzig mögliche. Im
Jahr 1950 schlug der US-amerikanische Logiker Leon Albert Henkin
eine alternative Semantik vor, die wir jetzt in ihren Grundzügen darstel-
len wollen [82] (Abbildung 2.26).
Im Zentrum der Henkin-Semantik steht die Idee, mit den Quantoren ‚∀‘
und ‚∃‘ nicht mehr über alle möglichen Relationen bzw. Funktionen zu
iterieren, sondern nur noch über eine vorher festgelegte Auswahl. Zu
diesem Zweck existieren in einer Henkin-Interpretation (U, I) für je-
de positive natürliche Zahl n zwei dezidierte Mengen R(n) und F(n).
Die Menge R(n) enthält eine Auswahl an n-stelligen Relationen über
dem Individuenbereich U, und F(n) enthält eine Auswahl an n-stelligen
Funktionen. Die Bedeutung der Quantoren ‚∀‘ und ‚∃‘ ist folgenderma-
ßen festgelegt:

I ξ ist eine Prädikatvariable der Stelligkeit n


Leon Albert Henkin (1921 – 2006) [172] (U, I) |= ∀ ξ ϕ :⇔ Für alle P ∈ R(n) ist (U, I[ξ /P] ) |= ϕ
Abbildung 2.26: Dem US-amerikanischen (U, I) |= ∃ ξ ϕ :⇔ Es gibt ein P ∈ R(n) mit (U, I[ξ /P] ) |= ϕ
Logiker Leon Albert Henkin verdanken wir
wichtige Erkenntnisse auf dem Gebiet der I ξ ist eine Funktionsvariable der Stelligkeit n
Typentheorie. Im Jahr 1950 schuf er mit der
Henkin-Semantik eine Alternative zur Stan-
(U, I) |= ∀ ξ ϕ :⇔ Für alle f ∈ F(n) ist (U, I[ξ / f ] ) |= ϕ
dardsemantik der Prädikatenlogik höherer
Stufe. (U, I) |= ∃ ξ ϕ :⇔ Es gibt ein f ∈ F(n) mit (U, I[ξ / f ] ) |= ϕ
2.6 Prädikatenlogik höherer Stufe 123

pr 1 Nov Der US-amerikanische Logiker einen ist er deutlich einfacher als Gödels Originalbeweis, so
19 A
1921 2006
Leon Albert Henkin wurde am dass viele moderne Lehrbücher heute der Henkin’schen und
19.4.1921 in Brooklyn, New York, nicht der Gödel’schen Argumentationslinie folgen. Zum an-
geboren. Sein akademischer Wer- deren lassen sich vieler seiner Grundideen auch auf Logi-
degang führte ihn über das Columbia College an die renom- ken höherer Stufe übertragen. Henkin hatte dies schon wäh-
mierte Universität in Princeton, die ihm 1945, als Schüler rend seiner Doktorarbeit erkannt und wies auch in [81] dar-
von Alonzo Church, die Doktorwürde verlieh. 1953 wech- auf hin: „In the second place the proof suggests a new ap-
selte Henkin an die University of California in Berkeley, wo proach to the problem of completeness for functional calculi
er 1958 zum Professor berufen wurde. Seiner neuen akade- of higher order. Both of these matters will be taken up in
mischen Wirkungsstätte blieb er bis zu seiner Pensionierung future papers.“
im Jahr 1991 treu. Die versprochene Ausarbeitung folgte bereits ein Jahr später.
Heute wird sein Name vor allem mit einem Vollständigkeits- In [82] führte er jene Interpretationen ein, die wir heute als
beweis der Prädikatenlogik erster Stufe verbunden, den Hen- Henkin-Interpretationen bezeichnen. Mit dieser Arbeit be-
kin im Jahr 1949 veröffentlichte [78, 81]. Neu war sein Er- gründete er die wichtigste Alternative zur Standardsemantik
gebnis nicht, schließlich hatte Kurt Gödel die Vollständig- der Logiken höherer Stufe.
keit der PL1 rund 20 Jahre zuvor bereits bewiesen. Trotzdem Leon Albert Henkin starb am 1. November 2006 im Alter
ist der Beweis in zweierlei Hinsicht von Bedeutung. Zum von 85 Jahren.

Dies ist die Henkin-Semantik der Prädikatenlogik zweiter Stufe.

Eine Einschränkung gibt es noch: In einer Henkin-Interpretation dürfen


die Mengen R(n) und F(n) nicht vollständig frei gewählt werden. Sie
müssen die folgenden beiden Bedingungen erfüllen:

I Alle Instanzen des Komprehensionsschemas

∃ ξ (∀ x1 . . . ∀ xn (ξ (x1 , . . . , xn ) ↔ ϕ(x1 , . . . , xn )))

sind wahr. In diesem Schema steht der Platzhalter ξ für eine beliebi-
ge Prädikatvariable der Stelligkeit n, und ϕ steht für eine Formel mit
n freien Variablen, in der ξ nicht vorkommt. Das Komprehensions-
schema stellt sicher, dass all diejenigen Relationen in R(n) enthalten
sind, die sich durch eine Formel ϕ mit n freien Variablen charakteri-
sieren lassen.
I Alle Instanzen des Funktionsdefinitionsschemas

∀ ξ (∀ x1 . . . ∀ xn ∃1 y ξ (x1 , . . . , xn , y) →
∃ ν (∀ x1 . . . ∀ xn ξ (x1 , . . . , xn , ν(x1 , . . . , xn ))))

sind wahr. Hierin bezeichnet ξ eine Prädikatvariable der Stelligkeit


n + 1 und ν eine Funktionsvariable der Stelligkeit n. Den Ausdruck
∃1 y benutzen wir als Kurzschreibweise, um auszudrücken, dass die
nachfolgende Formel für genau eine Belegung von y wahr ist. In
Worten besagt das Funktionsdefinitionsschema, dass jede n-stellige
124 2 Formale Systeme

Interpretationen Funktion, die sich mithilfe einer linkstotalen, rechtseindeutigen Re-


lation aus R(n + 1) beschreiben lässt, auch in der Menge F(n) ent-
halten sein muss. Folgerichtig sind die Mengen R(n + 1) und F(n)
in einer Henkin-Interpretation nicht unabhängig voneinander.

Zwischen der Standardsemantik und der Henkin-Semantik besteht ein


enger Zusammenhang. Da wir R(n) und F(n) so wählen können, dass
ausnahmslos alle n-stelligen Relationen oder Funktionen darin enthal-
ten sind, ist jede Interpretation der Standardsemantik immer auch ei-
ne Henkin-Interpretation, aber nicht umgekehrt. Das bedeutet, dass je-
Henkin-Interpretationen
de Formel, die unter allen Henkin-Interpretationen wahr ist, auch unter
allen Interpretationen der Standardsemantik wahr sein muss. Genauso
Henkin-erfüllbare
ψ ist jede Formel, die unter mindestens einer Interpretation der Standard-
Formeln semantik wahr ist, auch unter mindestens einer Henkin-Interpretation
wahr. Damit offenbart sich uns der folgende Zusammenhang (Abbil-
Erfüllbare dung 2.27):
Formeln
ϕ ist Henkin-allgemeingültig ⇒ ϕ ist allgemeingültig
Henkin-
allgemeingültige
ϕ ist erfüllbar ⇒ ϕ ist Henkin-erfüllbar
Formeln
Die Umkehrungen dieser Aussagen gelten nicht.
Allgemeingültige
Formeln Mit der Henkin-Semantik gewinnen wir eine verloren geglaubte Ei-
genschaft zurück. Im Gegensatz zur Standardsemantik ist sie vollstän-
dig, d. h., es existieren formale Systeme, in denen sich die Henkin-
Unerfüllbare allgemeingültigen Formeln – und nur diese – aus den Axiomen ableiten
Formeln lassen. Bei aller Euphorie dürfen wir dabei zwei Punkte niemals aus
Henkin- den Augen verlieren. Zum einen tragen die Quantoren in der Henkin-
unerfüllbare
Semantik nicht mehr die intuitive Bedeutung in sich, die wir ihnen ger-
Formeln
¬ψ ne zukommen lassen möchten. Zum anderen verliert die Prädikatenlo-
gik zweiter Stufe an Ausdrucksstärke, wenn wir die Standardsemantik
Abbildung 2.27: Zwischen der Standard- durch die Henkin-Semantik ersetzen. Bereits so einfache Strukturen wie
semantik und der Henkin-Semantik be- die natürlichen Zahlen lassen sich dann nicht mehr eindeutig erfassen.
steht ein enger Zusammenhang. So ist je-
de Henkin-allgemeingültige Formel immer An dieser Stelle beginnen wir den Sog des ersten Gödel’schen Unvoll-
auch allgemeingültig und jede erfüllbare ständigkeitssatzes zu spüren, der uns von Kapitel zu Kapitel stärker in
Formel immer auch Henkin-erfüllbar.
seinen Bann ziehen wird. Doch bevor wir in Kapitel 4 klären, was sich
hinter diesen mysteriös anmutenden Sätzen im Detail verbirgt, wollen
wir unseren Blick in Kapitel 3 zunächst auf die Fundamente richten, auf
denen das verästelte Gebäude der modernen Mathematik errichtet ist.
2.7 Übungsaufgaben 125

2.7 Übungsaufgaben

Am Beispiel der Kalküle E, E2 , . . . , E6 haben wir grundlegende Eigenschaften formaler Sys- Aufgabe 2.1
teme herausgearbeitet. 
Webcode
2763
a) Rekapitulieren Sie die Eigenschaften der verschiedenen Systeme, indem Sie die nachste-
hende Tabelle vervollständigen:
E E2 E3 E4 E5 E6
Widerspruchsfrei 
Negationsvollständig 
Korrekt  
Vollständig 

b) Angenommen, das Alphabetzeichen ‚>‘ wird nicht mehr als „größer“, sondern als „größer
oder gleich“ interpretiert. Ist das System E4 dann weiterhin widerspruchsfrei, negations-
vollständig, korrekt und vollständig?

c) Ist es möglich, die Interpretationen der Symbole ‚>‘ und ‚=‘ so abzuändern, dass der
Kalkül E3 korrekt wird?

Betrachten Sie die nachstehenden fünf Axiome, die eine Reihe von Eigenschaften zweier Aufgabe 2.2
Klassen K und L festlegen. Sie stammen aus [133] und wurden in ihrer umgangssprachlichen 
Form belassen: Webcode
2129
1. Je zwei beliebige Elemente von K sind in genau einem Element von L enthalten.

2. Kein Element von K ist in mehr als zwei Elementen von L enthalten.

3. Die Elemente von K sind nicht alle in einem einzigen Element von L enthalten.

4. Je zwei beliebige Elemente von L enthalten genau ein Element von K [gemeinsam].

5. Kein Element von L enthält mehr als zwei Elemente von K.

Unter der Verwendung der üblichen mathematischen Schlussregeln lassen sich aus den Axio-
men verschiedene Konsequenzen ziehen. Ist es möglich, einen Widerspruch abzuleiten? Wie
könnte ein formaler Beweis der Widerspruchsfreiheit gelingen?
126 2 Formale Systeme

Aufgabe 2.3 In dieser Aufgabe betrachten wir vier Kalküle über einer rudimentären Sprache. Insgesamt
 lassen sich nur 42 Formeln bilden, die durch das Einsetzen der Terme 0, . . . , 6 in die Formeln
Webcode ϕ1 (ξ ), ϕ2 (ξ ), ϕ3 (ξ ), ¬ϕ1 (ξ ), ¬ϕ2 (ξ ) und ¬ϕ3 (ξ ) entstehen. Die folgende Matrix gibt an,
2748 welche der 42 Aussagen wahr und welche falsch sind:

0 1 2 3 4 5 6
ϕ1 (ξ ) |= |= |= |= |= |= |=
ϕ2 (ξ ) |= |= |= |= |= |= |=
ϕ3 (ξ ) |= |= |= |= |= |= |=
¬ϕ1 (ξ ) |= |= |= |= |= |= |=
¬ϕ2 (ξ ) |= |= |= |= |= |= |=
¬ϕ3 (ξ ) |= |= |= |= |= |= |=

Die Axiome und die Schlussregeln der vier Kalküle sind nicht bekannt. Dafür sind wir für
jeden Kalkül im Besitz einer Matrix, aus der wir ablesen können, welche Formeln aus den
Axiomen hergeleitet werden können und welche nicht. Geben Sie für jeden Kalkül an, ob er
vollständig, korrekt, widerspruchsfrei oder negationsvollständig ist.

K1 0 1 2 3 4 5 6 K2 0 1 2 3 4 5 6
ϕ1 (ξ )        ϕ1 (ξ )       
ϕ2 (ξ )        ϕ2 (ξ )       
ϕ3 (ξ )        ϕ3 (ξ )       
¬ϕ1 (ξ )        ¬ϕ1 (ξ )       
¬ϕ2 (ξ )        ¬ϕ2 (ξ )       
¬ϕ3 (ξ )        ¬ϕ3 (ξ )       

K3 0 1 2 3 4 5 6 K4 0 1 2 3 4 5 6
ϕ1 (ξ )        ϕ1 (ξ )       
ϕ2 (ξ )        ϕ2 (ξ )       
ϕ3 (ξ )        ϕ3 (ξ )       
¬ϕ1 (ξ )        ¬ϕ1 (ξ )       
¬ϕ2 (ξ )        ¬ϕ2 (ξ )       
¬ϕ3 (ξ )        ¬ϕ3 (ξ )       
2.7 Übungsaufgaben 127

Die Kalküle P1 und P2 seien durch die folgenden Axiome und Schlussregeln definiert: Aufgabe 2.4

Axiome (Kalkül P1 ) Axiome (Kalkül P2 ) Webcode
2890
(11,110) (A1) (01,011) (A1’)

Schlussregeln (Kalkül P1 ) Schlussregeln (Kalkül P2 )

(ϕ, ψ) (ϕ, ψ)
(S1) (S1’)
(ϕ011, ψ100) (ϕ001, ψ0)
(ϕ, ψ) (ϕ, ψ)
(S2) (S2’)
(ϕ11, ψ110) (ϕ01, ψ011)
(ϕ, ψ) (ϕ, ψ)
(S3) (S3’)
(ϕ010, ψ011) (ϕ01, ψ101)
(ϕ, ψ)
(S4’)
(ϕ10, ψ001)

Beide Kalküle arbeiten nach dem gleichen Grundprinzip. Das Axiom gibt ein Paar binärer
Zeichenketten vor, und die Schlussregeln bestimmen, wie sich die Zeichenketten sukzessive
verlängern lassen. Beide Kalküle unterscheiden sich lediglich in den binären Teilsequenzen,
die fest in das Axiom und die Schlussregeln hineincodiert sind.

a) Zu welchem Kalkül gehört der folgende Beweis? Geben Sie rechts für jeden Ablei-
tungsschritt an, welche Schlussregel angewendet wurde.
1.  (01,011) ( )
2.  (0110,011001) ( )
3.  (011001,011001101) ( )
4.  (01100110,011001101001) ( )
5.  (0110011010,011001101001001) ( )

b) Lässt sich in den Kalkülen P1 und P2 ein Theorem der Form (ϕ, ϕ) ableiten?

c) Existieren für die Kalküle P1 und P2 Entscheidungsverfahren?

d) Gibt es ein Verfahren, das für alle Kalküle obigen Typs entscheidet, ob ein Theorem
der Form (ϕ, ϕ) abgeleitet werden kann?
128 2 Formale Systeme

Aufgabe 2.5 Ergänzen Sie die Wahrheitstafeln der folgenden aussagenlogischen Formeln. Sind die For-
 meln erfüllbar, allgemeingültig oder unerfüllbar?
Webcode
2235 I ϕ1 = (¬A ∨ B) ∧ (¬B ∨ C) ∧ (¬C ∨ A)

A B C ¬A ∨ B ¬B ∨ C ¬C ∨ A (¬A ∨ B) ∧ (¬B ∨ C) ϕ1

I ϕ2 = (A → B) ∧ (B → C) → (A → C)

A B C A→B B→C A→C (A → B) ∧ (B → C) ϕ2

I ϕ3 = (A  B) ∧ (B  C) ∧ (A  C)

A B C AB BC AC (A  B) ∧ (B  C) ϕ3


2.7 Übungsaufgaben 129

Das Dirichlet’sche Schubfachprinzip ist nach dem deutschen Mathematiker Peter Gustav Aufgabe 2.6
Lejeune Dirichlet benannt. Es besagt, dass eine endliche Menge M nicht injektiv auf eine 
Menge N abgebildet werden kann, wenn N weniger Elemente enthält als M. Jedem von Webcode
uns ist das Schubfachprinzip aus dem Alltag geläufig. Verteilen wir m Gegenstände auf n 2857
Schubfächer und gilt m > n, so muss mindestens ein Schubfach mehrere Gegenstände ent-
halten. Im angelsächsischen Raum wird das Dirichlet’sche Schubfachprinzip als pigeonhole
principle (Taubenschlagprinzip) bezeichnet. Auch hier ist die angestellte Überlegung die
gleiche: Verteilen sich m Tauben auf n Taubenschläge und gilt m > n, so ist mindestens ein
Taubenschlag mehrfach besetzt.

Peter Gustav Lejeune Dirichlet


(1805 – 1859)
Ihre Aufgabe ist es, das Dirichlet’sche Schubfachprinzip für n Gegenstände und n − 1 Schub-
fächer zu formalisieren. Führen Sie hierzu für jede mögliche Kombination von Gegenständen
und Schubfächern eine aussagenlogische Variable Aij ein, die genau dann den Wert 1 an-
nimmt, wenn sich der i-te Gegenstand im j-ten Schubfach befindet.

In Abschnitt 2.3.1 haben wir gezeigt, dass sich jede aussagenlogische Formel so umschreiben Aufgabe 2.7
lässt, dass ausschließlich die Operatoren ‚¬‘ und ‚→‘ darin vorkommen. Wir sagen, die 
Menge {¬, →} ist ein vollständiges Operatorensystem. Webcode
2123
In dieser Aufgabe betrachten wir die binären Operatoren ‚∧‘ (nand) und ‚∨‘ (nor) mit

I |= (ϕ ∧ ψ) :⇔ I |= ϕ oder I |= ψ


I |= (ϕ ∨ ψ) :⇔ I |= ϕ und I | = ψ

a) Zeigen Sie, dass die Mengen { ∧ } und { ∨ } vollständige Operatorensysteme sind.

b) Weisen Sie nach, dass ‚∧‘ und ‚∨‘ die beiden einzigen binären Operatoren sind, die
allein ein vollständiges Operatorensystem bilden.
130 2 Formale Systeme

Aufgabe 2.8 Die aussagenlogischen Quantoren ‚∀‘ und ‚∃‘ seien folgendermaßen definiert:

Webcode ∀ x ϕ := ϕ[x ← 0] ∧ ϕ[x ← 1]
2956 ∃ x ϕ := ϕ[x ← 0] ∨ ϕ[x ← 1]

a) Worin unterscheiden sich diese Quantoren von jenen, die in der Prädikatenlogik verwendet
werden?

b) Es sei ϕ eine PL0-Formel, in der x die einzige Variable ist. Welche der folgenden Aussa-
gen sind richtig?

∃ x ϕ ≡ 1 ⇔ ϕ ist erfüllbar ∀ x ϕ ≡ 1 ⇔ ϕ ist allgemeingültig


¬∃ x ϕ ≡ 1 ⇔ ϕ ist unerfüllbar ¬∀ x ϕ ≡ 1 ⇔ ϕ ist unerfüllbar

c) Welche der folgenden Äquivalenzen sind richtig, und welche sind falsch?

∀ x (ϕ ∧ ψ) ≡ ∀ x ϕ ∧ ∀ x ψ ∃ x (ϕ ∧ ψ) ≡ ∃ x ϕ ∧ ∃ x ψ
∀ x (ϕ ∨ ψ) ≡ ∀ x ϕ ∨ ∀ x ψ ∃ x (ϕ ∨ ψ) ≡ ∃ x ϕ ∨ ∃ x ψ

Aufgabe 2.9 In einer Klausur habe ich vor geraumer Zeit die folgende Aufgabe gestellt:

Webcode Es sei ϕ eine aussagenlogische Formel, in der die Variable x vorkommt. Andere Variablen
2034 kommen in ϕ nicht vor. Zeigen oder widerlegen Sie die folgende Behauptung: „ϕ ist entweder
zu der Formel x äquivalent oder zu der Formel ¬x“

Mehrere Studenten haben die Aufgabe etwa so gelöst:

Die Aussage ist richtig. Beweis: Es gilt die Beziehung

ϕ ist äquivalent zu x oder äquivalent zu ¬x ⇔ (ϕ ↔ x) ∨ (ϕ ↔ ¬x) ≡ 1

Die Beziehung lässt sich durch elementare Umformungen beweisen:

(ϕ ↔ x) ∨ (ϕ ↔ ¬x) ≡ ¬ϕ¬x ∨ ϕx ∨ ¬ϕx ∨ ϕ¬x


≡ ϕ(x ∨ ¬x) ∨ ¬ϕ(x ∨ ¬x)
≡ ϕ ∨ ¬ϕ
≡1

Die Studenten haben übersehen, dass beispielsweise mit ϕ = x ∨ ¬x eine Formel existiert,
die weder zu x noch zu ¬x äquivalent ist. An welcher Stelle haben sie in ihrem Beweis einen
Fehler gemacht?
2.7 Übungsaufgaben 131

Russell und Whitehead haben den aussagenlogischen Kalkül der Principia Mathematica auf Aufgabe 2.10
den folgenden fünf Axiomen aufgebaut: 
Webcode
1. ϕ ∨ ϕ → ϕ (Taut) 2865
2. ψ → ϕ ∨ ψ (Add)
3. ϕ ∨ ψ → ψ ∨ ϕ (Perm)
4. ϕ ∨ (ψ ∨ χ) → ψ ∨ (ϕ ∨ χ) (Assoc)
5. (ψ → χ) → (ϕ ∨ ψ → ϕ ∨ χ) (Sum)

Hilberts Schüler Paul Bernays hat gezeigt, dass die aussagenlogischen Axiome der Principia
nicht unabhängig voneinander sind und das vierte Axiom (Assoc) aus den anderen formal
hergeleitet werden kann.

Die folgende Ableitungssequenz ist eine Adaption des Originalbeweises aus der 1926 er-
schienenen Arbeit Axiomatische Untersuchung des Aussagen-Kalküls der Principia Mathe-
matica [10]. In dieser Publikation hat Paul Bernays die Ergebnisse seiner Habilitationsschrift
aus dem Jahr 1918 zusammengefasst.

1.  χ → ϕ ∨ χ ( )
2.  (Sum)
3.  ψ ∨ χ → ψ ∨ (ϕ ∨ χ) (MP, 1,2)
4.  ( )
5.  ϕ ∨ (ψ ∨ χ) → ϕ ∨ (ψ ∨ (ϕ ∨ χ)) (MP, 3,4)
6.  ϕ ∨ (ψ ∨ (ϕ ∨ χ)) → (ψ ∨ (ϕ ∨ χ)) ∨ ϕ ( )
7.  (MB, 5,6)
8.  ϕ → χ ∨ ϕ ( )
9.  ( )
10.  ϕ → ϕ ∨ χ (MB, 8,9)
11.  ϕ ∨ χ → ψ ∨ (ϕ ∨ χ) ( )
12.  (MB, 10,11)
13.  (Sum)
14.  (ψ ∨ (ϕ ∨ χ)) ∨ ϕ → (ψ ∨ (ϕ ∨ χ)) ∨ (ψ ∨ (ϕ ∨ χ)) (MP, 12,13)
15.  ( )
16.  (ψ ∨ (ϕ ∨ χ)) ∨ ϕ → ψ ∨ (ϕ ∨ χ) (MB, 14,15)
17.  ϕ ∨ (ψ ∨ χ) → ψ ∨ (ϕ ∨ χ) ( )

Versuchen Sie, den Beweis, der hier nur lückenhaft abgedruckt ist, vollständig zu rekonstru-
ieren.
132 2 Formale Systeme

Aufgabe 2.11 Beweisen Sie die nachstehenden Formeln im aussagenlogischen Kalkül:



Webcode
a) (ϕ → (ψ → χ)) → (ψ → (ϕ → χ))
2881
b) ϕ → (ψ → ¬(ϕ → ¬ψ))

Aufgabe 2.12 In Abschnitt 2.5 haben Sie die Prädikatenlogik erster Stufe mit Gleichheit kennen gelernt. Ist
 es in dieser Logik möglich, Formeln mit den nachstehenden Eigenschaften zu konstruieren?
Webcode
2698 (U, I) |= ϕ≥n ⇔ U besitzt mindestens n Elemente
(U, I) |= ϕ≤n ⇔ U besitzt höchstens n Elemente
(U, I) |= ϕ=n ⇔ U besitzt genau n Elemente

Aufgabe 2.13 Eine Relation R heißt



Webcode
I reflexiv, wenn R(x, x) für alle x gilt,
2042
I linkskomparativ, wenn aus R(x, y) und R(x, z) immer R(y, z) folgt,

I symmetrisch, wenn aus R(x, y) immer R(y, x) folgt.

Formalisieren Sie die Aussage „Jede reflexive, linkskomparative Relation ist symmetrisch“
in der Prädikatenlogik erster Stufe. Versuchen Sie anschließend, die Aussage im prädikaten-
logischen Kalkül zu verifizieren. Um die Aufgabe nicht unnötig zu erschweren, dürfen Sie
alle aussagenlogischen Tautologien als bereits bewiesen ansehen.

Aufgabe 2.14 Nehmen Sie an, die Schlussregeln eines formalen Systems seien so beschaffen, dass die
 erzeugten Theoreme in jedem Schritt länger werden, d. h., die Konklusion stets aus mehr
Webcode Zeichen besteht als die Prämissen.
2128
→ → →

ϕ1 ϕ2 ϕ3 ϕ4
|ϕ2 | > |ϕ1 | |ϕ3 | > |ϕ2 | |ϕ4 | > |ϕ3 |

Existiert für ein solches System immer ein Entscheidungsverfahren?


2.7 Übungsaufgaben 133

In Abschnitt 2.6 haben wir erarbeitet, wie sich der Begriff der Endlichkeit innerhalb der Aufgabe 2.15
Prädikatenlogik zweiter Stufe definieren lässt. Im Kern stand die Idee, mithilfe einer Formel 
zu behaupten, jede injektive Funktion sei surjektiv. Hätten wir den Begriff auch über die Webcode
Forderung definieren können, dass jede surjektive Funktion auch injektiv ist? 2952

Welche Begriffe werden durch die nachstehenden Formeln definiert? Aufgabe 2.16

a) ∀ f (∀ x ∃ y (x =
˙ f(y)) → ∀ x ∀ y (f(x) =
˙ f(y) → x =
˙ y)) Webcode
2999
b) ∃ R (∀ x ∀ y ∀ z (R(x, y) ∧ R(y, z) → R(x, z)) ∧ ∀ x (¬R(x, x) ∧ ∃ y R(x, y)))
3 Fundamente der Mathematik

„Aus dem Paradies, das Cantor uns geschaffen hat,


soll uns niemand vertreiben können.“

David Hilbert [88]

In Kapitel 2 haben wir die Aussagenlogik und die Prädikatenlogik ein-


geführt und gezeigt, wie sich die Schlussweisen der gewöhnlichen Ma-
thematik innerhalb formaler Systeme nachbilden lassen. In diesem Ka-
pitel werden wir auf der Prädikatenlogik aufbauen und sie durch die
Hinzunahme neuer Axiome zu sogenannten Theorien erweitern. Kon-
kret verstehen wir unter einer mathematischen Theorie ein formales Bei einem Blick in andere
System, dessen Axiome in zwei Gruppen unterteilt sind. Bücher werden Sie bemer-
ken, dass mitunter eine Unterscheidung
I Die Theorieaxiome (proper axioms) legen die Beziehungen fest, die zwischen dem Begriff der Theorie und
dem Begriff der axiomatisierbaren Theo-
zwischen den modellierten Objekten bestehen, und verleihen einer
rie vorgenommen wird. Auf den ersten
Theorie ihr individuelles Gesicht. Beispielsweise beschreiben die Blick wirft dieses Vorgehen Rätsel auf, da
Theorieaxiome der Peano-Arithmetik die charakteristischen Eigen- wir ohne Axiome keine Theorie formulie-
schaften der natürlichen Zahlen und sorgen dafür, dass die Sym- ren können. Ist damit nicht jede Theorie
bole ‚+‘ und ‚ב ihre vertraute arithmetische Bedeutung erhalten. trivialerweise axiomatisiert? Und wenn ja,
In analoger Weise legen die Theorieaxiome der Zermelo-Fraenkel- warum existiert dann überhaupt eine der-
Mengenlehre fest, welche Beziehungen zwischen jenen Objekten artige Unterscheidung?
bestehen, die wir landläufig als Mengen bezeichnen. Der scheinbare Widerspruch löst sich da-
durch auf, dass der Begriff der Theorie in
I Die logischen Axiome (logical axioms) definieren den mathema- der Literatur nicht einheitlich definiert ist.
tischen Schlussapparat eines formalen Systems. Auch wenn sie bei Manchmal wird er nicht als Synonym für
der Diskussion von Theorien häufig außer Acht gelassen werden, eine formales System, sondern als Syn-
sind sie nicht weniger wichtig. Erst sie versetzen uns in die Lage, onym für eine Formelmenge M verwen-
logische Folgerungen aus den Theorieaxiomen abzuleiten. Sind die det, die unter der logischen Folgerungsre-
logischen Axiome die in Abschnitt 2.4 eingeführten Axiome der Prä- lation abgeschlossen ist (aus M |= ϕ folgt
dikatenlogik, so sprechen wir von einer Theorie erster Stufe (first ϕ ∈ M). In Büchern, in denen diese Defi-
nition zugrunde gelegt ist, erhält der Be-
order theory). Liegt dagegen die Prädikatenlogik zweiter Stufe zu-
griff der axiomatisierbaren Theorie eine
grunde, so sprechen wir von einer Theorie zweiter Stufe (second
ganz natürliche Bedeutung. Eine Theorie
order theory) und so fort. M ist genau dann axiomatisierbar, wenn
ein formales System existiert, in dem die
Den einleitenden Worten wollen wir Taten folgen lassen und mit der Formeln aus M, und nur diese, in endlich
Peano-Arithmetik und der Zermelo-Fraenkel-Mengenlehre die beiden vielen Schritten aus den Axiomen abge-
wichtigsten Theorien erster Stufe detailliert untersuchen. leitet werden können.

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6_3
136 3 Fundamente der Mathematik

3.1 Peano-Arithmetik
Arithmetische Terme Abkürzung
0 Die Peano-Arithmetik, kurz PA, ist die Theorie der natürlichen Zahlen,
x1 zusammen mit der Addition und der Multiplikation. Genau wie im Fall
der Beispielkalküle aus Kapitel 2 nähern wir uns in mehreren Schritten.
(x1 × x2 ) In Abschnitt 3.1.1 legen wir die Syntax der Peano-Arithmetik fest, d. h.,
s(0) 1 wir vereinbaren, nach welchen Regeln arithmetische Terme und arith-
metische Formeln aufgebaut sind. Anschließend definieren wir in Ab-
s(s(s(s(s(0))))) 5 schnitt 3.1.2 die Semantik, indem wir die Formelbestandteile mit einer
(x1 × s(s(0))) x1 × 2 konkreten Bedeutung belegen. Danach führen wir in Abschnitt 3.1.3 die
Axiome sowie den logischen Schlussapparat der Peano-Arithmetik ein
(s(0) + s(s(0))) 1+2
und demonstrieren anhand mehrerer Beispiele, wie sich arithmetische
(s(0) × (x1 + x2 )) 1 × (x1 + x2 ) Aussagen formal beweisen lassen.

Tabelle 3.1: Beispiele arithmetischer Ter-


me. Die Kurzschreibweise 3.1.1 Syntax
n := s(s(. . . s (0) . . .))
Definition 3.1 (Syntax der Peano-Arithmetik)
n-mal

haben wir bereits in Abschnitt 2.1 einge- Die Menge der arithmetischen Terme ist induktiv definiert:
führt; sie wird uns auch hier als wertvolle
I 0, x1 , x2 , x3 , . . . sind arithmetische Terme.
Schreiberleichterung dienen.
I Sind σ und τ arithmetische Terme, so sind es auch
Arithmetische Formeln
s(σ ), (σ + τ), (σ × τ)
∃ x1 2 × x1 = 6
∃ x1 x1 × x1 = 9 Die Menge der arithmetischen Formeln ist induktiv definiert:

∃ x1 3 × x1 = 9 I Sind σ und τ arithmetische Terme, so ist


∃ x1 7 = 6 + x1 (σ = τ) eine arithmetische Formel.
∀ x1 ∃ x2 (
∃ x5 (x2 = x1 + x5 + s(0)) ∧ I Sind ϕ und ψ arithmetische Formeln, dann sind es auch
¬(x2 = s(0)) ∧ (¬ϕ), (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ), (ϕ ↔ ψ), (ϕ  ψ)
∀ x3 (∃ x4 (x3 × x4 = x2 )
→ (x3 = s(0) ∨ x3 = x2 ))) I Ist ϕ eine arithmetische Formel, dann sind es auch

∀ ξ ϕ, ∃ ξ ϕ mit ξ ∈ {x1 , x2 , x3 , . . .}
Tabelle 3.2: Beispiele arithmetischer For-
meln. Solange die Eindeutigkeit gewahrt
bleibt, werden wir zur Verbesserung der
Lesbarkeit auf die Niederschrift mancher In den Tabellen 3.1 und 3.2 sind mehrere Terme und Formeln aufge-
Klammerpaare verzichten. führt, die sich mit den vereinbarten Regeln bilden lassen.
3.1 Peano-Arithmetik 137

Äußerlich scheint sich die Sprache der Peano-Arithmetik nur wenig I Schema
von der Sprache der Prädikatenlogik abzuheben, und ein vergleichen-
I(0) := 0
der Blick auf Definition 2.14 bestätigt diese Vermutung. Der einzige
Unterschied zwischen beiden Sprachen besteht darin, dass der Vorrat I(s(σ )) := I(σ ) + 1
an Konstanten- und Funktionszeichen in der Peano-Arithmetik auf die I(σ1 + σ2 ) := I(σ1 ) + I(σ2 )
Symbole ‚0‘, ‚s‘, ‚+‘, ‚ב und der Vorrat an Prädikatzeichen auf das I(σ1 × σ2 ) := I(σ1 ) × I(σ2 )
Symbol ‚=‘ beschränkt ist. Die für prädikatenlogische Formeln ein-
geführten Schreiberleichterungen können wir daher bedenkenlos auf I Beispiel: σ = s(s(0)) + s(0)
arithmetische Formeln übertragen. Insbesondere werden wir uns auch I(σ ) = I(s(s(0)) + s(0))
hier erlauben, die Notation der Variablen von Fall zu Fall anzupassen
= I(s(s(0))) + I(s(0))
und auf das eine oder andere Klammerpaar zu verzichten, solange die
Schreibweise immer noch eindeutig ist. = I(s(0)) + 1 + I(0) + 1
= I(0) + 1 + 1 + 1
= 1+1+1
3.1.2 Semantik = 3

Erinnert Sie das Aussehen der arithmetischen Terme an die Beispielkal-


küle aus Abschnitt 2.1, anhand derer wir die grundlegenden Eigenschaf- Abbildung 3.1: Enthält ein arithmetischer
ten formaler Systeme herausgearbeitet haben? Die Übereinstimmungen Term σ keine Variablen, so lässt sich
sind nicht zufällig, und wir können die Peano-Arithmetik tatsächlich sein zugeordneter Zahlenwert I(σ ) rekursiv
über den Termaufbau berechnen.
als eine Verallgemeinerung dieser Kalküle auffassen. Die Definition der
Modellrelation ‚|=‘ schreibt sich daher fast von selbst:

Definition 3.2 (Semantik der Peano-Arithmetik) Um den Nachfolger einer na-


türlichen Zahl zu benennen,
ϕ und ψ seien geschlossene arithmetische Formeln. Die Semantik existieren in der Literatur verschiedene
der Peano-Arithmetik ist durch die Modellrelation ‚|=‘ gegeben, die Nomenklaturen. So werden die natürlich-
induktiv definiert ist: en Zahlen 0, 1, 2, 3, . . . in diesem Buch
durch die arithmetischen Terme
|= (σ1 = σ2 ) :⇔ I(σ1 ) = I(σ2 )
0, s(0), s(s(0)), s(s(s(0))), . . .
|= (¬ϕ) :⇔ |= ϕ
|= (ϕ ∧ ψ) :⇔ |= ϕ und |= ψ beschrieben. Andere Bücher verwenden
dagegen die nachstehende Schreibweise:
|= (ϕ ∨ ψ) :⇔ |= ϕ oder |= ψ
|= (ϕ → ψ) :⇔ |= ϕ oder |= ψ 0, S0, SS0, SSS0, . . .
|= (ϕ ↔ ψ) :⇔ |= ϕ → ψ und |= ψ → ϕ Sie ist kompakter, weicht aber von der
|= (ϕ  ψ) :⇔ |= (ϕ ↔ ψ) gängigen Konvention ab, Funktionssym-
bole in prädikatenlogischen Formeln klein
|= ∀ξ ϕ :⇔ Für alle n ∈ N gilt |= ϕ[ξ ← n] zu schreiben. Wieder andere Bücher ver-
|= ∃ξ ϕ :⇔ Es gibt ein n ∈ N mit |= ϕ[ξ ← n] wenden anstelle von ‚S‘ einen Apostroph.
Die obige Zahlenreihe erscheint dann in
folgendem Gewand:
Jeder Term σ steht in der Peano-Arithmetik stellvertretend für eine na-
türliche Zahl, die in der Definition mit I(σ ) bezeichnet ist. Enthält σ 0, 0 , 0 , 0 , . . .
138 3 Fundamente der Mathematik

keine Variablen, so lässt sich I(σ ), wie in Abbildung 3.1 gezeigt, re-
„6 ist eine kursiv über den Termaufbau berechnen. Wie erwartet, beschreiben die
gerade Zahl“ Symbole ‚s‘, ‚+‘ und ‚ב die Nachfolgerfunktion, die Addition und die
„3 ist ein Teiler
Multiplikation.
von 9“
Seien Sie sich stets darüber im Klaren, dass die Modellrelation der
Peano-Arithmetik eine andere Bedeutung besitzt als die Modellrelati-
„7 ist größer als 6“ on der Aussagen- oder Prädikatenlogik. Dort drückt |= ϕ aus, dass die
Formel ϕ allgemeingültig ist, d. h., unter allen möglichen Interpretatio-
nen zu einer wahren Aussage wird. Im Fall der Peano-Arithmetik ist
dies anders: Hier haben wir mit den natürlichen Zahlen eine ganz be-
„Jede natürliche Zahl stimmte Interpretation im Sinn. Wir nennen sie die Standardinterpreta-
ist die Summe von vier tion und vereinbaren für sie die Kurzschreibweise (N, {s, +, ×}). In der
Quadratzahlen“ Peano-Arithmetik drückt |= ϕ somit aus, dass ϕ eine wahre Aussage
ist, wenn wir die Symbole im Sinne der Standardinterpretation deuten.
Noch prägnanter können wir den Zusammenhang so aufschreiben:

„7 ist eine |= ϕ :⇔ (N, {s, +, ×}) ist ein Modell von ϕ


Primzahl“
Da wir die Modellrelation in der Peano-Arithmetik an eine einzige In-
terpretation knüpfen, gilt für jede Formel ϕ entweder |= ϕ oder |= ¬ϕ.
In der Aussagen- und Prädikatenlogik ist dies nicht der Fall.
„Es gibt
unendlich viele Wir werden nun an mehreren Beispielen herausarbeiten, dass die Peano-
Primzahlen“ Arithmetik die nötige Ausdrucksstärke besitzt, um gewöhnliche Aussa-
gen der Zahlentheorie zu formalisieren. Abbildung 3.2 fasst in Worten
zusammen, um welche Aussagen es sich handelt.
PA
I ∃ x1 2 × x1 = 6
Abbildung 3.2: Auswahl typischer Aussa- Die Formel besagt, dass eine natürliche Zahl x1 existiert, die mit 2
gen der Zahlentheorie multipliziert das Ergebnis 6 ergibt. Sie steht damit für die äquivalen-
te Aussage „6 ist eine gerade Zahl“.
I ∃ x1 3 × x1 = 9
Die Formel postuliert die Existenz einer natürlichen Zahl x1 , die mit
3 multipliziert den Wert 9 ergibt und ist äquivalent zur Aussage „3
ist ein Teiler von 9“. Um Formeln dieser Bauart in Zukunft kom-
pakt niederschreiben zu können, vereinbaren wir die folgende Kurz-
schreibweise:

σ | τ := ∃ ξ σ × ξ = τ

In dieser und den nächsten Formeln, die eine abkürzende Schreib-


weise definieren, steht ξ für eine beliebige Variable, die in σ und τ
nicht frei vorkommt.
3.1 Peano-Arithmetik 139

I ∃ x1 7 = 6 + x1
Die Formel ist eine andere Formulierung für die Beziehung 7 ≥
6. Sie zeigt, dass sich die Vergleichsrelation ‚≥‘ problemlos auf
die Addition zurückführen lässt und damit innerhalb der Peano-
Arithmetik beschrieben werden kann. Genau wie im Fall der Teil-
barkeitsrelation wollen wir die Symbole ‚≥‘, ‚≤‘, ‚>‘ und ‚<‘ als
abkürzende Schreibweise innerhalb von arithmetischen Formeln zu-
lassen. Formal rechtfertigen wir die Schreiberleichterung durch die
folgenden Definitionen:

(σ ≥ τ) := ∃ ξ σ = τ + ξ
(σ ≤ τ) := ∃ ξ σ + ξ = τ
(σ > τ) := ∃ ξ σ = τ + ξ + 1
(σ < τ) := ∃ ξ σ + ξ + 1 = τ

Ferner wollen wir eine bedingte Quantifizierung erlauben und hierzu


die folgenden Abkürzungen vereinbaren:

∃ (ξ > σ ) ϕ := ∃ ξ (ξ > σ ∧ ϕ)
∀ (ξ > σ ) ϕ := ∀ ξ (ξ > σ → ϕ)

Eine analoge Definition gelte für die Operatoren ‚<‘, ‚≥‘ und ‚≤‘.
I ∀ z ∃ x1 ∃ x2 ∃ x3 ∃ x4 z = x1 × x1 + x2 × x2 + x3 × x3 + x4 × x4
Die Formel ist eine formale Beschreibung des Vier-Quadrate-Satzes
von Lagrange. Dieser besagt, dass sich jede natürliche Zahl als Sum-
me von vier Quadratzahlen schreiben lässt. In Abschnitt 5.4.3 wird
uns dieser Satz im Zusammenhang mit dem zehnten Hilbert’schen
Problem erneut begegnen.
I ∀ z (z | 7) → (z = 1 ∨ z = 7)
Diese Formel besagt, dass für alle natürlichen Zahlen z, die ein Tei-
ler von 7 sind, die Beziehung z = 1 oder z = 7 gilt. Damit ist die
Formel äquivalent zu der Aussage „7 ist eine Primzahl“. Auch hier
wollen wir durch eine entsprechende Definition für Schreiberleich-
terung sorgen:

prime(σ ) := ¬(σ = 1) ∧ ∀ ξ (ξ | σ → (ξ = 1 ∨ ξ = σ ))

I ∀ x1 ∃ (x2 > x1 ) prime(x2 )


In Worten liest sich die Formel wie folgt: Für jede natürliche Zahl
x1 existiert eine größere Zahl x2 , die eine Primzahl ist. Die Formel
ist damit nichts anderes als die Formalisierung des berühmten Satzes
von Euklid: „Es existieren unendlich viele Primzahlen“.
140 3 Fundamente der Mathematik

I Satz von Euklid: „Es existieren unendlich viele Primzahlen.“


„Für jede Zahl x1 existiert eine größere Zahl x2 , die eine Primzahl ist.“

I ∀ x1 ∃ (x2 > x1 ) prime(x2 )


∃ (x2 > x1 ) ϕ := ∃ x2 (x2 > x1 ∧ ϕ)

I ∀ x1 ∃ x2 (x2 > x1 ∧ prime(x2 ))


prime(x2 ) := ¬(x2 = 1) ∧ ∀ x3 (x3 | x2 → (x3 = 1 ∨ x3 = x2 ))

I ∀ x1 ∃ x2 (x2 > x1 ∧ ¬(x2 = 1) ∧ ∀ x3 (x3 | x2 → (x3 = 1 ∨ x3 = x2 )))


x3 | x2 := ∃ x4 (x3 × x4 = x2 )

I ∀ x1 ∃ x2 (x2 > x1 ∧ ¬(x2 = 1) ∧ ∀ x3 (∃ x4 (x3 × x4 = x2 ) → (x3 = 1 ∨ x3 = x2 )))


x2 > x1 := ∃ x5 (x2 = x1 + x5 + 1)

I ∀ x1 ∃ x2 (∃ x5 (x2 = x1 + x5 + 1) ∧ ¬(x2 = 1) ∧ ∀ x3 (∃ x4 (x3 × x4 = x2 ) → (x3 = 1 ∨ x3 = x2 )))


1 := s(0)

I ∀ x1 ∃ x2 (∃ x5 (x2 = x1 + x5 + s(0)) ∧ ¬(x2 = s(0)) ∧ ∀ x3 (∃ x4 (x3 × x4 = x2 ) → (x3 = s(0) ∨ x3 = x2 )))

Abbildung 3.3: Formalisierung des Satzes von Euklid in der Peano-Arithmetik

Vergessen Sie nicht, dass die neu eingeführten Operatoren lediglich den
Stellenwert von syntaktischen Abkürzungen haben und die Ausdrucks-
stärke der Peano-Arithmetik nicht erhöhen. Auch wenn sie prinzipiell
entbehrlich sind, erweisen sie uns wertvolle Dienste. Neben der Tatsa-
che, dass wir mit den eingeführten Abkürzungen viele Formeln deutlich
kompakter aufschreiben können, tragen Sie in großem Maße zu deren
Verständnis bei. Als Beispiel zeigt Abbildung 3.3, welche Darstellung
der Euklid’sche Satz besäße, wenn wir uns ausschließlich der syntakti-
schen Grundbausteine aus Definition 3.1 bedienten. Ihre wahre Bedeu-
tung ist der entstandenen Formel kaum noch anzusehen.

Zum Schluss führen wir mit dem erweiterten Existenzquantor ∃1 eine


letzte Schreiberleichterung ein:

∃1 ξ ϕ(ξ ) := ∃ ξ (ϕ(ξ ) ∧ ∀ ζ (ϕ(ζ ) → ζ = ξ ))

Mit der Formel ∃1 x ϕ(x) können wir auf kompakte Weise ausdrücken,
dass ϕ(x) für genau eine Belegung von x wahr wird. Die Aussage ist
stärker als jene der Formel ∃ x ϕ(x); diese besagt lediglich, dass min-
destens eine derartige Belegung existieren muss.
3.1 Peano-Arithmetik 141

3.1.3 Axiome und Schlussregeln 0 1 2 3 4 ...

Nachdem wir im vorigen Abschnitt die Syntax und die Semantik der
Peano-Arithmetik festgelegt haben, wollen wir in diesem Abschnitt die ...
Axiome und Schlussregeln ins Rampenlicht rücken. Um die tiefere Be-
deutung der Axiome zu verstehen, wollen wir zunächst versuchen, die
natürlichen Zahlen über ihre Eigenschaften zu charakterisieren. Abbildung 3.4: Kettenförmige Struktur der
natürlichen Zahlen
Die ersten beiden Axiome fließen wie von selbst aus der Feder:

I „0 ist eine natürliche Zahl.“ (P1) (a) 2 (b) 2

I „Jede Zahl x hat einen eindeutigen Nachfolger s(x).“ (P2) 0 0 1


3 3
Es scheint, als könnten wir die Struktur der natürlichen Zahlen aus Ab-
(c)
bildung 3.4 treffend über diese beiden Eigenschaften beschreiben. Ein
Blick auf die Beispiele in Abbildung 3.5 zeigt aber, dass auch solche 0 1 2 3 ...
Strukturen diese Eigenschaften erfüllen, die ganz und gar nicht unserer
Vorstellung von den natürlichen Zahlen entsprechen.
(d)
Die ungebetenen Gäste verschwinden erst dann, wenn wir zusätzlich
die folgenden beiden Eigenschaften fordern:
0 1 2 3 4 ...

I „0 ist nicht der Nachfolger irgendeiner Zahl.“ (P3)


I „Verschiedene Zahlen haben verschiedene Nachfolger.“ (P4)
Abbildung 3.5: Die Axiome (P1) und (P2)
reichen nicht aus, um die Strukturen (a) bis
Die erste Eigenschaft eliminiert die Strukturen (a) und (c), die zweite (d) auszuschließen.
die Strukturen (b) und (d). Auch wenn wir einer eindeutigen Charakteri-
sierung der natürlichen Zahlen schon sehr nahe sind, bleibt ein schwer-
wiegendes Problem bestehen. Die formulierten Eigenschaften schließen
nicht aus, dass neben dem Zahlenstrang der natürlichen Zahlen weitere 0 1 2 3 4 ...

Stränge mit der gleichen Struktur existieren (Abbildung 3.6). Um die


Existenz solcher Schattenzahlen auszuschließen, müssen wir auf eine ...
Eigenschaft zurückgreifen, die tiefgründiger ist als die bisher genann-
ten. Die Lösung kommt in Form des Induktionsaxioms: Abbildung 3.6: Die hier abgebildete Struk-
tur erfüllt die Axiome (P1) bis (P4). Erst
I „Enthält eine Menge M die Zahl 0 und folgt aus x ∈ M stets die durch das Induktionsaxiom wird sie elimi-
Beziehung s(x) ∈ M, so enthält M alle natürlichen Zahlen.“ niert.

Da wir die Mengenzugehörigkeit einer Zahl x als Eigenschaft interpre-


tieren und jede Eigenschaft in Form einer Mengenzugehörigkeit aus-
drücken können, dürfen wir das Induktionsaxiom alternativ auch so for-
mulieren:
142 3 Fundamente der Mathematik

Richard Dedekind (1831 – 1916) Giuseppe Peano (1858 – 1932)

I „0 ist eine natürliche Zahl.“

I „Jede Zahl x hat einen eindeutigen Nachfolger s(x).“

I „0 ist nicht der Nachfolger irgendeiner Zahl.“ I ∀ x ¬(0 = s(x))

I „Verschiedene Zahlen haben verschiedene Nachfolger.“ I ∀ x ∀ y (s(x) = s(y) → x = y)

I „Hat die Zahl 0 die Eigenschaft ϕ und folgt aus ϕ(x) I ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x))
stets ϕ(s(x)), so haben alle natürlichen Zahlen die
Eigenschaft ϕ.“

Abbildung 3.7: Die Peano-Axiome, links in einer umgangssprachlichen Formulierung und rechts in der modernen Schreibwei-
se der Peano-Arithmetik.

I „Hat die Zahl 0 die Eigenschaft ϕ und folgt aus ϕ(x) stets ϕ(s(x)),
so haben alle natürlichen Zahlen die Eigenschaft ϕ.“ (P5)

(P1) bis (P5) sind die berühmten Peano-Axiome, die Giuseppe Peano im
Jahr 1889 in seinem Werk Arithmetices principia veröffentlichte. In Ab-
bildung 1.30 hatten wir einen Auszug aus der übersetzten Originalarbeit
bereits kennen gelernt.

Die Beispiele in den Abbildungen 3.4 bis 3.6 haben gezeigt, dass wir
auf kein Peano-Axiom verzichten können. Entfernen wir auch nur eines,
so existieren neben den natürlichen Zahlen weitere Strukturen, die alle
verbleibenden Axiome erfüllen. Die gegenteilige Fragestellung ist nicht
weniger wichtig: Sind die natürlichen Zahlen durch die Peano-Axiome
vollständig charakterisiert oder müssen wir weitere Axiome hinzufü-
gen, um eine eindeutige Beschreibung zu erhalten? Der berühmte Iso-
morphiesatz von Richard Dedekind gibt eine beruhigende Antwort. Er
besagt, dass die natürlichen Zahlen durch die Axiome (P1) bis (P5) bis
auf Isomorphie eindeutig charakterisiert sind, d. h., bis auf die Art und
Weise, wie wir die Zahlen benennen oder niederschreiben.

Jetzt haben wir das nötige Wissen beisammen, um die Axiome und
Schlussregeln der Peano-Arithmetik in ihrer ganzen Fülle zu verstehen.
Zunächst zeigt Abbildung 3.7, wie die umgangssprachlich formulierten
3.1 Peano-Arithmetik 143

Theorieaxiome Logikaxiome

σ = τ → (σ = ρ → τ = ρ) (S1) ϕ → (ψ → ϕ) (A1)

σ = τ → s(σ ) = s(τ) (S2) (ϕ → (ψ → χ)) → ((ϕ → ψ) → (ϕ → χ)) (A2)

¬(0 = s(σ )) (S3) (¬ϕ → ¬ψ) → (ψ → ϕ) (A3)

s(σ ) = s(τ) → σ = τ (S4) ∀ ξ ϕ → ϕ[ξ ← σ ] ([ξ ← σ ] kollisionsfrei) (A4)

σ +0 = σ (S5) ∀ ξ (ϕ → ψ) → (ϕ → ∀ ξ ψ) (ξ ∈ ϕ) (A5)

σ + s(τ) = s(σ + τ) (S6) Schlussregeln

σ ×0 = 0 (S7) ϕ, ϕ → ψ
(MP)
ψ
σ × s(τ) = (σ × τ) + σ (S8)
ϕ
(G)
ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x)) (S9) ∀ξ ϕ

Tabelle 3.3: Alle Axiome der Peano-Arithmetik in der Übersicht

Axiome als arithmetische Formeln niedergeschrieben werden können.


Alle drei Formeln fügen wir der Peano-Arithmetik als Theorieaxiome
hinzu. Beachten Sie, dass wir die ersten beiden Axiome nicht überset-
zen müssen; sie sind bereits dadurch formalisiert, dass 0 als Konstan-
tensymbol und s als (einstelliges) Funktionssymbol in der Sprache der
Peano-Arithmetik verankert ist.

Die Peano-Axiome allein bilden noch keinen Kalkül. Um einen solchen


zu erhalten, müssen wir sie um weitere Theorieaxiome ergänzen. Dar-
über hinaus dürfen wir nicht vergessen, die unentbehrlichen Logikaxio-
me hinzuzufügen. Im Ergebnis entsteht eine längere Liste von Axiomen
und Schlussregeln, die in Tabelle 3.3 zusammengefasst sind. Die Theo-
rieaxiome (S1) und (S2) drücken wichtige Eigenschaften des Gleich-
heitsoperators aus. (S3) und (S4) sind die Peano-Axiome (P3) und (P4).
Die Axiome (S5) bis (S8) beschreiben die elementaren Eigenschaften
der Addition und Multiplikation und verleihen den Operatoren ‚+‘ und
‚ב ihre Bedeutung. Es folgt mit (S9) das Induktionsaxiom, von des-
sen Notwendigkeit wir uns weiter oben überzeugt haben. In der rechten
Tabellenhälfte sind die Logikaxiome und die Schlussregeln aufgeführt.
144 3 Fundamente der Mathematik

Ableitbare Theoreme Sie sind eins zu eins der Prädikatenlogik entnommen und machen die
Peano-Arithmetik zu einer Theorie erster Stufe.
I Theorem PA1
σ =σ Alle Axiome sind als Axiomenschemata ausgelegt. Hierin stehen die
Platzhalter σ und τ für Terme, ϕ, ψ und χ für Formeln und ξ für eine
I Theorem PA2 Variable.
σ =τ →τ =σ
Wir wollen kurz innehalten und unsere Aufmerksamkeit erneut auf das
I Theorem PA3 Induktionsaxiom lenken. Ein gezielter Blick auf die verschiedenen For-
σ = τ → (τ = ρ → σ = ρ) mulierungen zeigt, dass die formalisierte Variante (S9) eine prädikaten-
logische Formel erster Stufe, die umgangssprachliche Variante (P5) da-
I Theorem PA4
gegen eine Aussage zweiter Stufe ist. Dass wir tatsächlich eine Aussage
σ = τ → (ρ = τ → σ = ρ)
zweiter Stufe vor uns haben, ist leicht einzusehen. Indem das Induk-
I Theorem PA5 tionsaxiom eine Aussage über beliebige Eigenschaften der natürlichen
∀ x (σ = τ → σ + x = τ + x) Zahlen macht, quantifiziert es über Prädikate. In der Peano-Arithmetik
wird der Sachverhalt dadurch nachgebildet, dass wir (S9) als Axiomen-
I Theorem PA6 schema ausgelegt haben. Da wir den Platzhalter ϕ durch eine beliebige
∀ x (x = 0 + x) Formel ersetzen dürfen, gibt es in der Peano-Arithmetik nicht ein einzi-
ges Induktionsaxiom, sondern unendlich viele.
I Theorem PA7
σ + 1 = s(σ ) Auf den ersten Blick scheint es uns mit diesem Trick tatsächlich ge-
lungen zu sein, die umgangssprachliche Formulierung des Induktions-
I Theorem PA8 axioms formal zu erfassen. Auf den zweiten Blick wird jedoch schnell
σ ×1 = σ deutlich, dass wir einer exakten Formalisierung lediglich sehr nahe
kommen. Konkret stehen wir vor dem Problem, dass uns das Axiomen-
Tabelle 3.4: Eine kleine Auswahl arithmeti-
schema nicht die Gültigkeit des Induktionsprinzips für alle Eigenschaf-
scher Formeln, die sich im formalen System ten garantiert, sondern lediglich für jene, die sich durch eine Formel be-
der Peano-Arithmetik beweisen lassen. schreiben lassen. Da nur abzählbar viele Formeln existieren, kann das
Schema nur einen Teil der überabzählbar vielen Eigenschaften erfas-
sen. Für den Moment wollen wir diesen unscheinbaren Schönheitsfehler
ignorieren. Zu gegebener Zeit, in Abschnitt 7.2, werden wir die Thema-
tik wieder aufgreifen und zeigen, welch weitreichende Konsequenzen
sich aus diesem Phänomen tatsächlich ergeben.

Wir wollen unseren Kalkül nun zum Leben erwecken und nacheinander
die in Tabelle 3.4 aufgeführten Theoreme beweisen. Sie werden feststel-
len, dass sich die Beweisführung kaum von jener aus Abschnitt 2.4 un-
terscheidet; schließlich verwendet die Peano-Arithmetik den gleichen
logischen Schlussapparat wie die Prädikatenlogik erster Stufe. Damit
dürfen wir nicht nur den Fundus bisher bewiesener Tautologien nut-
zen, sondern auch auf sämtliche Hilfsmittel zurückgreifen, die wir im
Zusammenhang mit dem prädikatenlogischen Kalkül erarbeitet haben.
Allem voran wird uns auch hier das Deduktionstheorem treu zur Seite
stehen.

Calculemus – lasst uns rechnen!


3.1 Peano-Arithmetik 145

1.  σ +0 = σ (S5) Theorem PA1


2.  σ + 0 = σ → (σ + 0 = σ → σ = σ ) (S1) σ =σ
3.  σ +0 = σ → σ = σ (MP, 1,2)
4.  σ =σ (MP, 1,3)

1.  σ = τ → (σ = σ → τ = σ ) (S1) Theorem PA2


2. {σ = τ}  σ = σ → τ = σ (DT) σ =τ →τ =σ
3. {σ = τ, σ = σ }  τ = σ (DT)
4. {σ = σ }  σ = τ → τ = σ (DT)
5.  σ = σ → (σ = τ → τ = σ ) (DT)
6.  σ =σ (PA1)
7.  σ =τ →τ =σ (MP, 5,6)

1.  τ = σ → (τ = ρ → σ = ρ) (S1) Theorem PA3


2.  σ = τ → τ = σ (PA2) σ = τ → (τ = ρ → σ = ρ)
3. {σ = τ}  τ = σ (DT)
4. {σ = τ}  τ = ρ → σ = ρ (MP, 1,3)
5.  σ = τ → (τ = ρ → σ = ρ) (DT)

1.  σ = τ → (τ = ρ → σ = ρ) (PA3) Theorem PA4


2. {σ = τ}  τ = ρ → σ = ρ (DT) σ = τ → (ρ = τ → σ = ρ)
3.  ρ = τ → τ = ρ (PA2)
4. {ρ = τ}  τ = ρ (DT)
5. {σ = τ, ρ = τ}  σ = ρ (MP, 2,4)
6. {σ = τ}  ρ = τ → σ = ρ (DT)
7.  σ = τ → (ρ = τ → σ = ρ) (DT)

Beweis durch vollständige Induktion Theorem PA5


Sei ψ(x) := (σ = τ → (σ + x = τ + x)) ∀ x (σ = τ → σ + x = τ + x)
1.  σ + 0 = σ (S5) x∈/ σ, x ∈

2.  τ + 0 = τ (S5)
3.  σ + 0 = σ → (σ = τ → σ + 0 = τ) (PA3)
4.  σ = τ → σ + 0 = τ (MP, 1,3)
146 3 Fundamente der Mathematik

5. {σ = τ}  σ + 0 = τ (DT)
6.  σ + 0 = τ → (τ + 0 = τ → σ + 0 = τ + 0) (PA4)
7. {σ = τ}  τ + 0 = τ → σ + 0 = τ + 0 (MP, 5,6)
8. {σ = τ}  σ + 0 = τ + 0 (MP, 2,7)
9.  σ = τ → σ + 0 = τ + 0 (DT)
An dieser Stelle ist der 10.  ψ(0) (Definition)
Induktionsanfang bewiesen 11. {ψ(x)}  σ = τ → (σ + x = τ + x) (Satz 2.4)
12. {ψ(x), σ = τ}  σ + x = τ + x (DT)
13.  σ + s(x) = s(σ + x) (S6)
14.  τ + s(x) = s(τ + x) (S6)
15.  σ + x = τ + x → s(σ + x) = s(τ + x) (S2)
16. {ψ(x), σ = τ}  s(σ + x) = s(τ + x) (MP, 12,15)
17.  σ + s(x) = s(σ + x) →
(s(σ + x) = s(τ + x) → σ + s(x) = s(τ + x)) (PA3)
18.  s(σ + x) = s(τ + x) → σ + s(x) = s(τ + x) (MP, 13,17)
19. {ψ(x), σ = τ}  σ + s(x) = s(τ + x) (MP, 16,18)
20.  σ + s(x) = s(τ + x) →
(τ + s(x) = s(τ + x) → σ + s(x) = τ + s(x)) (PA4)
21. {ψ(x), σ = τ} 
τ + s(x) = s(τ + x) → σ + s(x) = τ + s(x) (MP, 19,20)
22. {ψ(x), σ = τ}  σ + s(x) = τ + s(x) (MP, 14,21)
23. {ψ(x)}  σ = τ → σ + s(x) = τ + s(x) (DT)
24. {ψ(x)}  ψ(s(x)) (Definition)
25.  ψ(x) → ψ(s(x)) (DT)
An dieser Stelle ist der 26.  ∀ x (ψ(x) → ψ(s(x))) (G, 25)
Induktionsschritt bewiesen 27.  ψ(0) → (∀ x (ψ(x) → ψ(s(x))) → ∀ x ψ(x)) (S9)
28.  ∀ x (ψ(x) → ψ(s(x))) → ∀ x ψ(x) (MP, 10,27)
29.  ∀ x ψ(x) (MP, 26,28)
30.  ∀ x (σ = τ → σ + x = τ + x) (Definition)

Theorem PA6 Beweis durch vollständige Induktion


∀ x (x = 0 + x) Sei ψ(x) := (x = 0 + x)
1.  0 + 0 = 0 (S5)
2.  0 + 0 = 0 → 0 = 0 + 0 (PA2)
3.  0 = 0 + 0 (MP, 1,2)
3.1 Peano-Arithmetik 147

4.  ψ(0) (Definition) An dieser Stelle ist der


5. {ψ(x)}  x = 0 + x Satz 2.4 Induktionsanfang bewiesen
6.  0 + s(x) = s(0 + x) (S6)
7.  x = 0 + x → s(x) = s(0 + x) (S2)
8. {ψ(x)}  s(x) = s(0 + x) (MP, 5,7)
9.  s(x) = s(0 + x) → (0 + s(x) = s(0 + x) → s(x) = 0 + s(x)) (PA4)
10. {ψ(x)}  0 + s(x) = s(0 + x) → s(x) = 0 + s(x) (MP, 8,9)
11. {ψ(x)}  s(x) = 0 + s(x) (MP, 6,10)
12. {ψ(x)}  ψ(s(x)) (Definition)
13.  ψ(x) → ψ(s(x)) (DT)
14.  ∀ x (ψ(x) → ψ(s(x))) (G, 13) An dieser Stelle ist der
15.  ψ(0) → (∀ x (ψ(x) → ψ(s(x))) → ∀ x ψ(x)) (S9) Induktionsschritt bewiesen
16.  ∀ x (ψ(x) → ψ(s(x))) → ∀ x ψ(x) (MP, 4,15)
17.  ∀ x ψ(x) (MP, 14,16)
18.  ∀ x (x = 0 + x) (Definition)

1.  σ + s(0) = s(σ + 0) (S6) Theorem PA7


2.  σ + 0 = σ (S5) σ + 1 = s(σ )
3.  σ + 0 = σ → s(σ + 0) = s(σ ) (S2)
4.  s(σ + 0) = s(σ ) (MP, 2,3)
5.  σ + s(0) = s(σ + 0) →
(s(σ + 0) = s(σ ) → σ + s(0) = s(σ )) (PA3)
6.  s(σ + 0) = s(σ ) → σ + s(0) = s(σ ) (MP, 1,5)
7.  σ + s(0) = s(σ ) (MP, 4,6)
8.  σ + 1 = s(σ ) (Definition)

1. 
σ × s(0) = (σ × 0) + σ (S8) Theorem PA8
2. 
σ ×0 = 0 (S7) σ ×1 = σ
3. 
∀ x (σ × 0 = 0 → (σ × 0) + x = 0 + x) (PA5)
4. 
∀ x (σ × 0 = 0 → (σ × 0) + x = 0 + x) →
(σ × 0 = 0 → (σ × 0) + σ = 0 + σ ) (A4)
5.  σ × 0 = 0 → (σ × 0) + σ = 0 + σ (MP, 3,4)
6.  (σ × 0) + σ = 0 + σ (MP, 2,5)
7.  σ × s(0) = (σ × 0) + σ →
148 3 Fundamente der Mathematik

((σ × 0) + σ = 0 + σ → σ × s(0) = 0 + σ ) (PA3)


8.  (σ × 0) + σ = 0 + σ → σ × s(0) = 0 + σ (MP, 1,7)
9.  σ × s(0) = 0 + σ (MP, 6,8)
10.  ∀ x x = 0 + x (PA6)
11.  ∀ x x = 0 + x → σ = 0 + σ (A4)
12.  σ = 0 + σ (MP, 10,11)
13.  σ = 0 + σ → 0 + σ = σ (PA2)
14.  0 + σ = σ (MP, 12,13)
15.  σ × s(0) = 0 + σ → (0 + σ = σ → σ × s(0) = σ ) (PA3)
16.  0 + σ = σ → σ × s(0) = σ (MP, 9,15)
17.  σ × s(0) = σ (MP, 14,16)
18.  σ × 1 = σ (Definition)

Nach einer langer Reise sind wir endlich am Ziel: Es ist uns gelungen,
sämtliche Theoreme aus Tabelle 3.4 im System der Peano-Arithmetik
formal zu beweisen. Dass wir die Beispiele in dieser Ausführlichkeit
durchexerziert haben, hat einen einfachen Grund. Die pure Auflistung
der Axiome und Schlussregeln eines Kalküls vermittelt keinerlei Emp-
findung dafür, wie leicht oder wie schwer es ist, Theoreme tatsächlich
abzuleiten. Um einen Kalkül in seiner vollen Tiefe zu verstehen, führt
kein Weg daran vorbei, die Axiome und Schlussregeln zum Leben zu
erwecken, und genau das haben wir mit dem Beweis der Beispieltheo-
reme auch getan.

Bevor wir unseren Blick gänzlich von den bewiesenen Theoremen ab-
wenden, wollen wir noch einen wichtigen Spezialfall betrachten. Sub-
stituieren wir in den Theoremen (PA7) und (PA8) den Platzhalter σ
durch 1, so ergeben sich auf einen Schlag zwei der am häufigsten zitier-
ten Weisheiten über die natürlichen Zahlen.

Korollar 3.1

Die nachstehenden Formeln sind Theoreme der Peano-Arithmetik:


1+1 = 2 1×1 = 1
3.2 Axiomatische Mengenlehre 149

3.2 Axiomatische Mengenlehre

In diesem Abschnitt rücken wir mit der Mengenlehre eines der wich-
tigsten Teilgebiete der Mathematik in den Mittelpunkt unserer Betrach-
tung. Dass dem Begriff der Menge heute eine so große Bedeutung zu-
kommt, geht vor allem auf seine Ausdrucksstärke zurück. Die Men-
genlehre enthält nicht nur die Peano-Arithmetik als Untertheorie; sie
erweist sich sogar als stark genug, um sämtliche Begriffe der gewöhnli-
chen Mathematik zu formalisieren. Zusätzlich haben die zu Beginn des
zwanzigsten Jahrhunderts aufgetauchten Antinomien die Blicke vieler
Forscher auf dieses Teilgebiet der Mathematik gelenkt. Sie haben der
Mengenlehre nicht nur zu unfreiwilliger Popularität verholfen, sondern
zugleich gezeigt, dass das Fundament der Mathematik ein fragiles ist,
dem wir uns mit großer Sorgfalt nähern müssen.
Unter dem Schirm der axiomatischen Mengenlehre versammeln sich Die Darstellung der axio-
heute viele Theorien, mit dem gemeinsamen Ziel, die Risse im Fun- matischen Mengenlehre un-
dament der Mathematik zu schließen. Eine der ältesten ist die Typen- terscheidet sich von jener
theorie. Als Herzstück der Principia Mathematica ist sie integraler Be- der Peano-Arithmetik in ei-
standteil jenes monumentalen Werks, das von Russell und Whitehead nem wichtigen Punkt. Anders als in Ab-
als vermeintliches Allheilmittel gegen die Antinomien der Mengenleh- schnitt 3.1 werden wir im Fall der Men-
re in Stellung gebracht wurde. Im Kern der Typentheorie steht der Ge- genlehre davon absehen, eine Standardin-
danke, jeder Menge eine Hierarchiestufe, einen Typ, zuzuordnen. In- terpretation zu definieren. Dass wir unsere
gewohnte Linie verlassen, hat einen trif-
dem nur solche Mengen als existent erachtet werden, die einen höhe-
tigen Grund: War es in der Peano-Arith-
ren Typ als ihre Elemente haben, sind selbstbezügliche Konstrukte wie metik vergleichsweise gefahrlos möglich,
die Menge aller Mengen a priori ausgeschlossen. Eine Vereinfachung unsere intuitive Vorstellung von den na-
hat die Typentheorie durch den amerikanischen Logiker Willard Van türlichen Zahlen in die Definition der Mo-
Orman Quine erfahren. Im Jahr 1937 publizierte er unter dem Namen dellrelation ‚|=‘ umzusetzen, so ist dies
New Foundations eine axiomatisierte Variante, die viele Defizite ihres in der Mengenlehre ungleich schwieri-
Vorgängers beseitigt [153, 154]. Seitdem gilt die Typentheorie in ihrer ger. Um eine Standardinterpretation zu
ursprünglichen Form als überholt. definieren, müssten wir uns zunächst auf
einen bestimmten Individuenbereich fest-
Heute wird der Mengenbegriff zumeist mit Theorien erklärt, die sich legen. Für die Peano-Arithmetik war dies
einer der beiden folgenden Kategorien zuordnen lassen: kein Problem: Dort entspricht der Indivi-
duenbereich schlicht der Menge der natür-
I Theorien über dem Mengenbegriff lichen Zahlen. Und in der Mengenlehre?
Der Individuenbereich wäre, wir wagen
Theorien dieser Kategorie kennen ausschließlich den Begriff der es kaum auszusprechen, die Menge aller
Menge. Ihr bekanntester Vertreter ist die Zermelo-Fraenkel-Men- Mengen. Würden wir eine Standardinter-
genlehre, kurz ZF, sowie die um das Auswahlaxiom erweiterte Va- pretation also tatsächlich auf diese nai-
riante ZFC (Zermelo-Fraenkel with Choice). Beide sind Theorien ve Weise bilden, so hätten wir der Rus-
erster Stufe und werden durch 9 bzw. 10 Axiome geformt, die von sell’schen Antinomie erneut Tür und Tor
Ernst Zermelo und Abraham Fraenkel in den Jahren 1908 bis 1921 geöffnet. Sie sehen, wie vorsichtig wir im
formuliert wurden. Ebenfalls zu dieser Kategorie zählt die weniger Falle der Mengenlehre tatsächlich agieren
müssen, um Widersprüche zu vermeiden.
bekannte Kripke-Platek-Mengenlehre (KP) [76].
150 3 Fundamente der Mathematik

I Theorien über dem Mengen- und dem Klassenbegriff


Theorien dieser Kategorie unterscheiden zwischen Mengen und
Klassen. Während z. B. die Russell’sche Menge aller Mengen in
ZF und ZFC nicht existiert, ist sie in solchen Theorien in Form ei-
ner Klasse enthalten. Bildlich können wir uns eine Klasse als ei-
ne Ansammlung von Objekten vorstellen, die zu groß ist, um als
abgeschlossenes Ganzes zu existieren. Antinomien werden in die-
sen Theorien also nicht durch den Ausschluss der strittigen Objek-
te überwunden; stattdessen werden sie von der Mengenwelt in die
Klassenwelt verschoben. Klassen unterliegen dabei wichtigen Ein-
schränkungen. Beispielsweise dürfen sie niemals ein Element einer
anderen Menge oder anderen Klasse sein.
Beispiele für Theorien dieser Art sind die Mengenlehre von Wil-
helm Ackermann [3] sowie die weniger bekannte Morse-Kelley-
Mengenlehre [107, 131]. Der bei weitem bekannteste Vertreter die-
Bei einem Blick in Zerme-
ser Kategorie ist die um 1940 entstandene Neumann-Bernays-Gödel-
los Originalarbeit aus dem Mengenlehre, kurz NBG. Im Gegensatz zu ZF ist sie endlich axioma-
Jahr 1908 werden Sie fest- tisierbar, d. h., sie kommt ohne die Verwendung von Axiomensche-
stellen, dass in seiner ur- mata aus. Trotz ihrer unterschiedlichen Ausrichtung sind ZF und
sprünglichen Mengenlehre neben Mengen NBG eng miteinander verflochten. Zum einen lassen sich sämtliche
noch andere Objekte existieren. Diese an- Theoreme von ZF auch in NBG beweisen. Zum anderen gilt auch
deren Objekte sind sogenannten Urele- die Umkehrung, wenn wir nur jene Theoreme betrachten, die aus-
mente, die im Gegensatz zu Mengen selbst schließlich Aussagen über Mengen tätigen. Sämtliche dieser NBG-
keine Elemente enthalten dürfen. In ge- Theoreme sind auch in ZF beweisbar.
wissem Sinne sind Urelemente und Klas-
sen zwei komplementäre Begriffe. Wäh-
rend Klassen zu groß sind, um selbst Ele- In Abschnitt 3.2.1 werden wir unseren Blick auf die Zermelo-Fraenkel-
ment einer anderen Menge oder Klasse zu Mengenlehre richten, der wichtigsten Theorie aus dem Bereich der
sein, sind Urelemente zu klein, um eige- axiomatischen Mengenlehre. Unter anderem werden wir zeigen, dass
nen Elemente zu enthalten. sich die natürlichen Zahlen als spezielle Mengen interpretieren lassen
Urelemente entsprechen unserer intuiti-
und die Theorien ZF oder ZFC dazu benutzt werden können, zahlen-
ven Vorstellung der Elemente einer Men-
theoretische Aussagen zu formalisieren. Der eingeschlagene Weg wird
ge. Dennoch lassen sie sich auf einfa-
che Weise durch andere Mengen reprä- uns in Abschnitt 3.2.2 in das faszinierende Reich der Ordinalzahlen füh-
sentieren und sind damit prinzipiell ent- ren. Mit ihnen werden wir vertraute Grenzen überwinden und riesige
behrlich. Dies ist der Grund, weshalb wir Zahlen kennen lernen, die sich weit jenseits des Vorstellbaren befin-
auch die Zermelo-Mengenlehre zu jenen den. Mit der Theorie der Ordinalzahlen in Händen werden wir in Ab-
Theorien zählen dürfen, die ausschließ- schnitt 3.2.3 schließlich in der Lage sein, den schon häufiger gefallenen
lich Mengen als Objekte kennen. Kon- Begriff der Kardinalität mathematisch präzise zu erklären.
sequenterweise wurde die Unterschei-
dung in der später entwickelten Zermelo- Damit ist es an der Zeit, hinter die Kulissen eines der spannendsten
Fraenkel-Mengenlehre dann auch fallen Gebiete der Mathematik zu blicken. Unbestritten ist der Weg, den wir
gelassen; hier wird der Begriff des Urele- gleich beschreiten, kein leichter. Doch seien Sie versichert: Durch die
ments nicht mehr erwähnt und nur noch Erkenntnisse am Ende des Kapitels werden Sie für die Mühen reichlich
von Mengen gesprochen.
belohnt.
3.2 Axiomatische Mengenlehre 151

3.2.1 Zermelo-Fraenkel-Mengenlehre

Die Grundbausteine der Zermelo-Fraenkel-Mengenlehre führen wir in


zwei Schritten ein. Zunächst legen wir fest, nach welchen Regeln men-
gentheoretische Formeln gebildet werden. Danach beschäftigen wir uns
ausführlich mit den Axiomen dieser Theorie.

Definition 3.3 (Syntax der Zermelo-Fraenkel-Mengenlehre)

Die Menge der mengentheoretischen Formeln über dem Variablen-


vorrat {x1 , x2 , x3 , . . .} ist rekursiv definiert:

I Sind ξ und ν Variablen, dann sind (ξ = ν) und (ξ ∈ ν) Formeln.


I Sind ϕ und ψ Formeln, dann sind es auch In der Literatur werden men-
gentheoretische Formeln un-
(¬ϕ), (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ), (ϕ ↔ ψ), (ϕ  ψ) einheitlich notiert. Allem anderen vor-
an unterscheiden sich die Schreibweisen
I Ist ϕ eine Formel, dann sind auch es auch der Variablen. Das Dilemma: In der Ma-
thematik sind wir daran gewöhnt, Men-
∀ ξ ϕ, ∃ ξ ϕ mit ξ ∈ {x1 , x2 , x3 , . . .} gen durchweg mit Großbuchstaben zu be-
zeichnen, genauso wie wir in der Logik
daran gewöhnt sind, für die Variablen ei-
ner Formel Kleinbuchstaben zu verwen-
Neben den aussagenlogischen Operatoren und den prädikatenlogischen den. In der axiomatischen Mengenlehre
Quantoren kennt die ZF-Mengenlehre mit ‚=‘ und ‚∈‘ nur zwei Prädi- stehen Variablen für Mengen, so dass es
katsymbole. Die intuitive Bedeutung dieser Symbole liegt auf der Hand: gute Gründe dafür gibt, sie sowohl groß
x1 = x2 drückt die Gleichheit zwischen den Mengen x1 und x2 aus, wäh- als auch klein zu schreiben. In diesem
rend x1 ∈ x2 besagt, dass x1 ein Element von x2 ist. Wie bisher werden Buch orientieren wir uns an der prädika-
wir den Variablenvorrat von Zeit zu Zeit anpassen und z. B. x, y, z an- tenlogischen Konvention, Variablen klein
statt x1 , x2 , x3 schreiben. Ebenfalls werden wir in gewohnter Weise auf zu schreiben.
Einige Theorien, zu denen beispielsweise
die Niederschrift des einen oder anderen Klammerpaars verzichten, so-
die NBG-Mengenlehre gehört, forcieren
fern die Eindeutigkeit gewahrt bleibt.
eine gemischte Schreibweise, um Men-
gen und Klassen bereits auf der syntakti-
Zur weiteren Vereinfachung wollen die folgenden Schreiberleichterun-
schen Ebene zu unterscheiden. Beispiels-
gen zulassen:
weise wird in der NBG-Formel
x = y := ¬(x = y) ∃X ∀y y ∈ X
x ∈ y := ¬(x ∈ y)
mit X eine Klasse und mit y eine Menge
x ⊆ y := ∀ z (z ∈ x → z ∈ y) bezeichnet. Letztendlich erfüllt jede No-
x ⊂ y := x ⊆ y ∧ x = y tation ihren Zweck. Dennoch sollten Sie
bei der Durchsicht fremder Literatur im-
∀ (x ∈ y) ϕ := ∀ x (x ∈ y → ϕ)
mer zunächst einen Blick auf die verwen-
∃ (x ∈ y) ϕ := ∃ x (x ∈ y ∧ ϕ) dete Schreibweise werfen, um Missver-
ständnisse im Vorfeld zu vermeiden.
152 3 Fundamente der Mathematik

3.2.1.1 ZF-Axiome

In diesem Abschnitt werden wir uns ausführlich mit dem Inhalt der
verschiedenen Theorieaxiome beschäftigen und die Zermelo-Fraenkel-
Mengenlehre so in ein helleres Licht rücken.

Axiom der Bestimmtheit I ∀ x ∀ y (x = y ↔ ∀ z (z ∈ x ↔ z ∈ y))


(auch Axiom der Extensionalität)
„Ist jedes Element einer Menge M gleichzeitig Element von
N und umgekehrt, ist also gleichzeitig M ⊂ N und N ⊂ M,
= so ist immer M = N. Oder kürzer: jede Menge ist durch
ihre Elemente bestimmt.“
Ernst Zermelo, 1908

 In der axiomatischen Mengenlehre gilt das Prinzip der Extensionali-
 tät. Es besagt, dass die Bedeutung eines Ausdrucks allein durch seinen

Umfang bestimmt ist, d. h. durch die Objekte, die er benennt oder be-
schreibt. In Bezug auf die Mengenlehre folgt daraus, dass zwei Mengen
x und y genau dann gleich sind, wenn sie die gleichen Elemente enthal-
ten (aus z ∈ x folgt immer auch z ∈ y und umgekehrt).

Legen wir die oben eingeführten Abkürzungen zu Grunde, so können


wir das Bestimmtheitsaxiom auch in der folgenden Form schreiben:

∀ x ∀ y (x = y ↔ x ⊆ y ∧ y ⊆ x)

Axiom der leeren Menge I ∃ x ∀ y y ∈ x

„Es gibt eine (uneigentliche) Menge, die ‚Nullmenge‘ 0,


/
welche gar keine Elemente enthält.“
Ernst Zermelo, 1908

Dieses Axiom postuliert die Existenz der leeren Menge. Von den kon-
struktiven Axiomen ist es das einzige, das uns eine Menge aus dem
Nichts heraus entstehen lässt. Alle anderen Axiome werden uns ledig-
lich erlauben, neue Mengen aus bestehenden zu erzeugen.

Zur Schreiberleichterung werden wir uns der gewöhnlichen mathema-


tischen Notation bedienen und die leere Menge mit dem Symbol 0/ be-
zeichnen. Behalten Sie dabei stets im Auge, dass wir mit 0/ kein neues
3.2 Axiomatische Mengenlehre 153

Symbol in die Sprache der Mengenlehre integrieren, sondern lediglich


eine syntaktische Abkürzung vereinbaren. Konkret steht jede Formel ϕ,
in der das Symbol 0/ vorkommt, stellvertretend für den Ausdruck

∃ x (∀ y y ∈ x ∧ ϕ[0/ ← x])

Hierin sind x und y zwei Variablen, von denen x nicht in ϕ vorkommen


darf. Ferner steht der Ausdruck

ϕ[0/ ← x]

für die Formel ϕ, in der jedes Vorkommen des Symbols 0/ durch die
neu eingeführte Variable x ersetzt wurde. Wenden wir die Ersetzung
beispielsweise auf den Ausdruck

0/ ∈ z

an, so entsteht die Formel

∃ x (∀ y y ∈ x ∧ x ∈ z) (3.1)

Der so entstandene Ausdruck macht deutlich, dass mengentheoretische


Formeln ohne die Einführung neuer Symbole schnell zu unüberschau-
baren Gebilden degradieren.

Dass die Ersetzung von 0/ vergleichsweise viel Mühe bereitet, hat einen
einfachen Grund: Während alle bisher eingeführten Abkürzungen den
Stellenwert von Prädikaten hatten, führen wir mit 0/ ein künstliches Kon-
stantensymbol ein. In der bereinigten Formel (3.1) wird die Konstante
durch die neu eingeführte Variable x beschrieben, und mithilfe der Va-
riablen y wird sichergestellt, dass x tatsächlich der leeren Menge ent-
spricht.

I ∀ x ∀ y ∃ z ∀ u (u ∈ z ↔ u = x ∨ u = y) Axiom der Paarung

„Sind a, b irgend zwei Dinge des Bereichs, so existiert im-


mer eine Menge {a, b}, welche sowohl a als [auch] b, aber
kein von beiden verschiedenes Ding x als Element enthält.“
Ernst Zermelo, 1908

Für zwei beliebige Mengen x und y garantiert das Paarungsaxiom die


Existenz einer Menge z, die ausschließlich x und y als Elemente enthält.
In gewöhnlicher mathematischer Notation besagt es, dass wir aus zwei
beliebigen Mengen x und y immer auch die Menge {x, y} konstruieren
können. Ist x = y, so entsteht die Menge {x}.
154 3 Fundamente der Mathematik

Zusammen mit dem Axiom der leeren Menge erlaubt das Paarungsaxi-
om die Konstruktion einer gehörigen Anzahl von Mengen, die sich in
gewöhnlicher mathematischer Notation wie folgt lesen:

/ {0},
0, / {0,
/ {0}},
/ {0,/ {0,
/ {0}}},
/ {{0},
/ {0,
/ {0}}},
/ {{0}},
/ ...

Axiom der Vereinigung I ∀ x ∃ y ∀ z (z ∈ y ↔ ∃ (w ∈ x) z ∈ w)

„Jeder Menge T entspricht eine Menge ST (die ‚Vereini-


gungsmenge‘ von T ), welche alle Elemente der Elemente
von T und nur solche als Elemente enthält.“
Ernst Zermelo, 1908

In gewöhnlicher mathematischer Notation besagt das Vereinigungsaxi-


om, dass für jede Menge x auch die Menge
 
y = x := w
w∈x

existiert. Beispielsweise garantiert das Axiom für

x = { 0,
/ {0,
/ {0}},
/ {{0}}
/ }

die Existenz der Menge

y = 0/ ∪ {0,
/ {0}}
/ ∪ {{0}}
/ = {0,
/ {0}}
/

Bildlich gesprochen entsteht die Vereinigungsmenge aus x, indem wir


die Mengenhierarchie durch das Auflösen der zweiten Klammernebene
abflachen und doppelte Vorkommen streichen.

Wie gewohnt werden wir die Vereinigungsmenge zweier Mengen mit


dem Symbol ‚∪‘ bezeichnen. Enthält eine Formel ϕ den Ausdruck
ξ ∪ ν, so betrachten wir sie als Abkürzung für die Formel

∃ x (∀ y (y ∈ x ↔ y ∈ ξ ∨ y ∈ ν) ∧ ϕ[ξ ∪ ν ← x]) (3.2)

Das Ersetzungsschema ist dem der leeren Menge sehr ähnlich. x und
y sind zwei neue Variablen, von denen x nicht in ϕ vorkommen darf,
und der Ausdruck ϕ[ξ ∪ ν ← x] steht für die Formel ϕ, in der jedes
Vorkommen der Zeichenkette ξ ∪ν durch die neu eingeführte Variable x
ersetzt wurde. Dass wir die zusätzliche Variable x tatsächlich benötigen,
hat einen ähnlichen Grund wie im Fall der leeren Menge. Wir haben mit
‚∪‘ ein neues Funktionssymbol geschaffen und benötigen die Variable
x, um den Funktionswert zu referenzieren.
3.2 Axiomatische Mengenlehre 155

Neben dem Symbol ‚∪‘ werden wir auch das Symbol ‚∩‘ verwenden,
um den Schnitt zweier Mengen zu beschreiben. Analog zu (3.2) kön-
nen wir jede Formel, die den Ausdruck ξ ∩ ν enthält, folgendermaßen
umschreiben:

∃ x (∀ y (y ∈ x ↔ y ∈ ξ ∧ y ∈ ν) ∧ ϕ[ξ ∩ ν ← x])

I ∀ x ∃ y ∀ z (z ∈ y ↔ z ∈ x ∧ ϕ(z)) Axiom der Aussonderung


(auch Axiom der Separation)
„Durch jede Satzfunktion f(x) wird aus jeder Menge m eine
Untermenge mf ausgesondert, welche alle Elemente x um-
fasst, für die f(x) wahr ist. Oder: Jedem Teil einer Menge
entspricht selbst eine Menge, welche alle Elemente dieses
Teils enthält.“
Ernst Zermelo, 1908

Dieses Axiom besagt, dass für jede Menge x und für jede Eigenschaft
P, die sich durch eine Formel ϕ beschreiben lässt, auch die Menge

y = {z ∈ x | P(z)}

existiert. In der ausgesonderten Menge y sind genau jene Elemente von


x enthalten, die P erfüllen. Das Axiom ist als Axiomenschema ausge-
legt, in dem der Platzhalter ϕ die Eigenschaft P repräsentiert. ϕ ist eine
beliebige Formel mit einer einzigen freien Variablen (z).

I ∃ x (0/ ∈ x ∧ ∀ (y ∈ x) {y} ∈ x) Axiom des Unendlichen

„Der Bereich enthält mindestens eine Menge Z, welche die


Nullmenge als Element enthält und so beschaffen ist, dass
jedem ihrer Elemente a ein weiteres Element der Form {a}
entspricht.“
Ernst Zermelo, 1908

Das Axiom garantiert uns die Existenz einer Menge x, ...

I so dass die leere Menge ein Element von x ist


0/ ∈ x

I und für jedes y ∈ x auch die Menge {y} in x enthalten ist.


∀ (y ∈ x) {y} ∈ x
156 3 Fundamente der Mathematik

Beachten Sie, dass der verwendete Ausdruck {y} kein natives Sprach-
element ist und im Vorgriff auf Abschnitt 3.2.1.3 verwendet wird. Dort
werden wir zeigen, wie sich der Ausdruck durch native Sprachelemente
ersetzen lässt.
...
Inhaltlich besagt das Axiom des Unendlichen, dass die Elemente
/ {0},
0, / {{0}},
/ {{{0}}},
/ {{{{0}}}},
/ {{{{{0}}}}},
/ ...
allesamt in x enthalten sind und trägt mit seinem Namen der Tatsache
Rechnung, dass die geforderte Eigenschaft von keiner endlichen Menge
erfüllt werden kann. Folgerichtig dürfen wir in der Zermelo-Fraenkel-
Mengenlehre immer davon ausgehen, dass Mengen mit unendlich vie-
len Elementen existieren.
Die Zermelo’sche Formulierung des Unendlichkeitsaxioms ist nicht die
einzig mögliche. In moderneren Abhandlungen über die Mengenlehre
wird das Axiom auch gerne so formuliert:

I ∃ x (0/ ∈ x ∧ ∀ (y ∈ x) y ∪ {y} ∈ x)

In dieser Variante wird gefordert,

I dass die leere Menge ein Element von x ist


0/ ∈ x
I und für jedes y ∈ x auch die Menge y ∪ {y} in x enthalten ist.
∀ (y ∈ x) y ∪ {y} ∈ x

Eine Menge mit dieser Eigenschaft ist z. B.


x = {0,
/ {0},
/ {0,
/ {0}},
/ {0,/ {0},
/ {0,
/ {0}}},
/
{0,
/ {0},
/ {0,
/ {0}},
/ {0,/ {0},
/ {0,
/ {0}}}},
/ ...
Beide Formulierungen des Unendlichkeitsaxioms sind gleichwertig.
Mithilfe der anderen ZF-Axiome können wir aus der einen Variante die
andere herleiten und umgekehrt.

Warum die Formulierung des Unendlichkeitsaxioms im Laufe der Zeit


geändert wurde, werden Sie in Abschnitt 3.2.1.4 verstehen, wenn wir
die Zermelo’sche und die Neumann’sche Zahlenreihe besprechen. Bei-
de Zahlenreihen geben uns alternative Möglichkeiten an die Hand, um
die natürlichen Zahlen in Form von Mengen darzustellen. Dort wird klar
werden, dass das Axiom der Unendlichkeit eine ganz intuitive Aussa-
ge tätigt. Es behauptet schlicht, dass die natürlichen Zahlen eine Men-
ge bilden. Das erste Axiom trägt diese Behauptung in sich, wenn wir
die Zermelo’sche Zahlenrepräsentation zugrunde legen, und das zwei-
te, wenn wir den Neumann’schen Ansatz verfolgen.
3.2 Axiomatische Mengenlehre 157

I ∀ x ∃ y ∀ z (z ∈ y ↔ z ⊆ x) Axiom der Potenzmenge

„Jeder Menge m entspricht eine Menge Um, welche alle


Untermengen von m als Elemente enthält, einschließlich
der Nullmenge und m selbst.“
Ernst Zermelo, 1908

Das Axiom garantiert, dass zu jeder Menge x auch die Menge aller Teil-
mengen, d. h. die Potenzmenge y = P(x), existiert. Für

x = {x1 , x2 , x3 }

liest sich die Potenzmenge beispielsweise wie folgt:

/ {x1 }, {x2 }, {x3 }, {x1 , x2 }, {x1 , x3 }, {x2 , x3 }, {x1 , x2 , x3 }}


y = {0,

I (∀ (a ∈ x) ∃1 b ϕ(a, b)) → (∃ y ∀ b (b ∈ y ↔ ∃ (a ∈ x) ϕ(a, b))) Axiom der Ersetzung

„Ist M eine Menge und wird jedes Element von M durch


‚ein Ding des Bereichs B‘ ersetzt, so geht M wiederum in
eine Menge über.“
Abraham Fraenkel, 1922

Das Axiom besagt, dass für jede Funktion f , die mit einer Formel ϕ
beschrieben werden kann, und jede Menge

x = {x1 , x2 , x3 , . . .}

auch die Menge


y = { f (x1 ), f (x2 ), f (x3 ), . . .}
existiert. Das Axiom ist als Axiomenschema ausgelegt, in dem wir den
Platzhalter ϕ durch eine beliebige Formel ersetzen dürfen, die a und b
als freie Variable enthält. Der Teilausdruck ∀ (a ∈ x) ∃1 b ϕ(a, b) stellt
dabei sicher, dass ϕ eine Funktion f modelliert, die jedem Element
a ∈ x genau ein Bildelement b zuordnet.

Abraham Fraenkel führte das Ersetzungsaxiom als Ersatz für das Aus-
sonderungsaxiom von Ernst Zermelo ein. In der Tat können wir in ZF
das Aussonderungsaxiom aus dem Ersetzungsaxiom ableiten, nicht aber
umgekehrt. Kurzum: Zermelos Mengenlehre ist eine echte Untertheorie
158 3 Fundamente der Mathematik

der Zermelo-Fraenkel’schen. Das Aussonderungsaxiom ist damit prin-


zipiell entbehrlich und manche Bücher wie z. B. [217] führen die ZF-
Mengenlehre konsequenterweise mit nur 8 Axiomen ein. In den meis-
ten Darstellungen wird das Aussonderungsaxiom trotzdem als Axiom
aufgeführt und auch wir wollen uns dieser Gepflogenheit nicht wider-
setzen.

Axiom der Fundierung I ∀ x (x = 0/ → ∃ (y ∈ x) x ∩ y = 0)


/
(auch Axiom der Regularität)
„Jede (rückschreitende) Kette von Elementen, in welcher
∉ jedes Glied Element des vorangehenden ist, bricht mit end-
∉ lichem Index ab bei einem Urelement. Oder, was gleichbe-
deutend ist: Jeder Teilbereich T [= 0]/ enthält wenigstens
∉ y ∉ ein Element t0 , das kein Element t in T hat.“
∉ Ernst Zermelo, 1930

Die bisher formulierten Axiome gestatten es uns, Mengen explizit zu
konstruieren; sie schließen aber nicht aus, dass daneben noch andere
Mengen existieren. Um solche ungebetenen Gäste fern zu halten, for-
muliere Fraenkel das sogenannte Beschränktheitsaxiom, das dem Be-
reich der Mengen „den geringsten mit den übrigen Axiomen verträgli-
chen Umfang“ auferlegte [54].

John von Neumann war mit der Formulierung dieses Axioms unzufrie-
den, da es sich inhaltlich auf die anderen Axiome bezieht. In seiner
Mengenlehre aus dem Jahr 1925 ersetzte er es durch das Axiom der
Fundierung, das unendlich absteigende Inklusionsketten verbietet. Das
Axiom wurde 1930 von Zermelo aufgegriffen und in die oben zitierte
Form gebracht. Es besagt, dass wir in jeder nichtleeren Menge x ein Ele-
ment y vorfinden können, dessen Elemente allesamt von den Elementen
von x verschieden sind ( x ∩ y = 0)./

Die Auswirkungen des Fundierungsaxioms sind größer, als es der erste


Blick erwarten lässt. Zunächst halten wir fest, dass keine Menge exis-
tieren kann, die sich selbst als Element enthält (Abbildung 3.8). Um
dies einzusehen, nehmen wir an, es gäbe eine Menge x1 mit x1 ∈ x1 .
Dann würde die Menge x = {x1 } unmittelbar gegen das Fundierungs-
axiom verstoßen, da x und x1 ein gemeinsames Element besäßen (we-
gen x1 ∈ x1 gilt x ∩ x1 = {x1 } = 0). / Das Fundierungsaxiom verhindert
die Selbstinklusion sogar dann, wenn sie in Form einer Ringinklusion
vorkommt, die sich über mehrere Hierarchiestufen erstreckt. Gäbe es
tatsächlich Mengen x1 , x2 , x3 , . . . xn mit
x1 ∈ x2 ∈ x3 ∈ . . . ∈ xn ∈ x1
3.2 Axiomatische Mengenlehre 159

so würde die Menge x = {x1 , x2 , x3 , . . . , xn } die Forderung des Fundie- I Selbstinklusion


rungsaxioms verletzen; jedes Element dieser Menge enthielte ein Ele-
ment, das in x ebenfalls enthalten ist. ∈

Gleichermaßen unterbunden werden unendlich absteigende Inklusions-


I Ringinklusion
ketten der Form

x1  x2  x3 . . . ∈ ∈

In diesem Fall steht die Menge {x1 , x2 , x3 , . . .} im Widerspruch zur Aus- ∈


∈ ∈
sage des Fundierungsaxioms. Beachten Sie, dass die Umkehrung in die-
sem Fall nicht gilt. Unendlich aufsteigende Folgen I Unendlicher Abstieg

x1 ∈ x2 ∈ x3 . . . ∋ ∋ ∋ ∋
...

sind mit dem Axiom durchaus verträglich.


Abbildung 3.8: Das Fundierungsaxiom
Ganz nebenbei demonstriert das Fundierungsaxiom auch, wie wichtig hält Mengen fern, die sich unmittelbar oder
die eingeführten Schreiberleichterungen sind, um die Lesbarkeit von mittelbar selbst enthalten oder eine endlos
Formeln sicherzustellen. Abbildung 3.9 zeigt, in welchem Gewand das absteigende Inklusionskette bilden.
Fundierungsaxiom erscheinen würde, wenn wir auf sämtliche Schreib-
erleichterungen verzichteten. Die wahre Bedeutung des Axioms ist jetzt
kaum noch zu erkennen und verschwindet fast vollständig im Nebel der
formalen Nomenklatur.

I Axiom der Fundierung Ernst Zermelo (1871 – 1953)


„Jeder Teilbereich T [= 0]
/ enthält wenigstens ein Element t0 , das kein Element t in T hat.“

I ∀ x (x = 0/ → ∃ (y ∈ x) x ∩ y = 0)
/
ϕ(0)
/ := ∃ e ((∀ z z ∈ e) ∧ ϕ(e))

I ∃ e ((∀ z z ∈ e) ∧ ∀ x (x = e → ∃ (y ∈ x) x ∩ y = e))
∃ (y ∈ x) ϕ := ∃ y (y ∈ x ∧ ϕ)

I ∃ e ((∀ z z ∈ e) ∧ ∀ x (x = e → ∃ y (y ∈ x ∧ x ∩ y = e)))
ϕ(x ∩ y) := ∃ c (∀ b (b ∈ c ↔ b ∈ x ∧ b ∈ y) ∧ ϕ(c))

I ∃ c (∀ b (b ∈ c ↔ b ∈ x ∧ b ∈ y) ∧ ∃ e ((∀ z z ∈ e) ∧ ∀ x (x = e → ∃ y (y ∈ x ∧ c = e))))
x ∈ y := ¬(x ∈ y), x = y = ¬(x = y)

I ∃ c (∀ b (b ∈ c ↔ b ∈ x ∧ b ∈ y) ∧ ∃ e ((∀ z ¬(z ∈ e)) ∧ ∀ x (¬(x = e) → ∃ y (y ∈ x ∧ c = e))))

Abbildung 3.9: Ohne die vereinbarten Schreiberleichterungen wird das Fundierungsaxiom zu einem wahren Monster.
160 3 Fundamente der Mathematik

3.2.1.2 Das Auswahlaxiom

Es ist an der Zeit, uns dem zehnten und letzten Axiom der Zermelo-
Fraenkel-Mengenlehre zuzuwenden: Dem Auswahlaxiom (Axiom of
Choice, kurz AC). In der Vergangenheit wurde kontrovers diskutiert,
ob AC zu den anderen Axiomen der Mengenlehre überhaupt hinzuge-
nommen werden soll oder nicht. Bis heute ist die Diskussion nicht voll-
ständig verebbt, und so haben wir es streng genommen mit zwei un-
terschiedlichen Mengenlehren zu tun: der ZF-Mengenlehre, bestehend
aus den 9 Axiomen aus Abschnitt 3.2.1.1, und der ZFC-Mengenlehre
(Zermelo-Fraenkel with Choice), die zusätzlich das Auswahlaxiom um-
fasst. Bevor wir uns im Detail damit befassen, welche Konsequen-
zen sich aus der Hinzunahme dieses in mancher Hinsicht mysteriösen
Axioms ergeben, wollen wir zunächst seinen Inhalt offenlegen:

Axiom der Auswahl I (∀ (u, v ∈ x) (u = v → u ∩ v = 0)


/ ∧ ∀ (u ∈ x) u = 0)
/ →
∃ y ∀ (z ∈ x) ∃1 (w ∈ z) w ∈ y

„Ist T eine Menge, deren sämtliche Elemente von 0/ ver-


schiedene Mengen und untereinander elementfremd sind,
so enthält ihre Vereinigung ∪T mindestens eine Untermen-
ge S1 , welche mit jedem Element von T ein und nur ein
Element gemein hat.“
Ernst Zermelo, 1930

Das Auswahlaxiom macht eine Aussage über alle Mengen x,

I deren Elemente paarweise disjunkte Mengen sind


∀ (u, v ∈ x) (u = v → u ∩ v = 0)
/
I und keines dieser Elemente die leere Menge ist.
∀ (u ∈ x) u = 0/

Für solche Mengen garantiert uns das Auswahlaxiom, dass wir aus je-
der Menge z ∈ x ein Element auswählen und die gewählten Elemente
anschließend in einer neuen Menge y zusammenfassen können.
∃ y ∀ (z ∈ x) ∃1 (w ∈ z) w ∈ y

Beachten Sie, dass uns das Auswahlaxiom lediglich die Existenz einer
Auswahlmenge zusichert, aber nicht erklärt, wie wir diese konstruieren
3.2 Axiomatische Mengenlehre 161

können. Das Axiom ist nicht konstruktiv. Des Weiteren wirkt es mehr I Beispiel 1: (Z \ {0}, ≺)
wie ein Theorem denn wie ein Axiom. Mit seiner sehr speziellen Aussa- Beispiel 1: mit x ≺ y :⇔ x < y ∧ |x| = |y|
ge erweckt es den Anschein, als müsse es sich aus den anderen Axiomen
-1 ≺ 1 -2 ≺ 2 -3 ≺ 3
als Konsequenz ergeben. Dass dem nicht so ist, haben Sie bereits in Ka-
... ...
pitel 1 auf Seite 63 erfahren. Das Auswahlaxiom ist von den anderen
Axiomen unabhängig und in ZF daher weder beweisbar noch wider- Ordnung:  Ja
legbar [35, 71]. Genau wie im Fall der Kontinuumshypothese können Totale Ordnung:  Nein
wir das Auswahlaxiom, oder alternativ auch dessen Negation, zu den Wohlordnung:  Nein
anderen Axiomen hinzufügen, ohne einen Widerspruch zu erhalten.

Seiner Unbeweisbarkeit zum Trotz scheint das Auswahlaxiom dennoch I Beispiel 2: (Z, <)
eine intuitive Wahrheit auszudrücken. Warum sollte es nicht möglich
-2 < -1 < 0 < 1 < 2 < 3
sein, aus nichtleeren Mengen Elemente herauszunehmen? An die Aus- ... ...
wahl selbst haben wir ja keinerlei Bedingung geknüpft, so dass beliebi-
ge Elemente unseren Zweck erfüllen. Und wenn eine Menge unendlich Ordnung:  Ja
viele Elemente enthält? Umso besser! Offensichtlich sind jetzt mehr Totale Ordnung:  Ja
als genug Elemente vorhanden, um eines davon zu entnehmen. Nun, Wohlordnung:  Nein
manchmal ist es ratsam, der eigenen Intuition zu misstrauen, insbeson-
dere dann, wenn wir dem Begriff der Unendlichkeit gefährlich nahe I Beispiel 3: (N, <)
kommen.

Wir wollen das Auswahlaxiom kurz beiseite stellen und einen bekann- 0 < 1 < 2 < 3 < 4 < 5 < 6
ten Begriff der Mathematik rekapitulieren: Den Begriff der Ordnung ...
(vgl. Abbildung 3.10 und Abbildung 3.11).
Ordnung:  Ja
Totale Ordnung:  Ja
Definition 3.4 (Ordnungsbegriffe) Wohlordnung:  Ja

Sei M eine Menge und ‚<‘ eine binäre Relation auf M.


Abbildung 3.10: Veranschaulichung der
I ‚<‘ ist eine Halbordnung oder Ordnung, wenn ‚<‘ Ordnungsbegriffe. Die Menge Z \ {0} ist
bezüglich ‚≺‘ geordnet, aber nicht total ge-
1. irreflexiv ist, d. h., es gilt niemals x < x, ordnet. Für alle Elemente x und y mit |x| =

2. asymmetrisch ist, d. h., aus x < y folgt y < x, |y| gilt hier weder x ≺ y noch y ≺ x. Die
Menge Z ist bezüglich ‚<‘ total geordnet,
3. transitiv ist, d. h., aus x < y und y < z folgt x < z.
aber nicht wohlgeordnet. Beispielsweise hat
I ‚<‘ ist eine lineare oder totale Ordnung auf M, wenn die Menge Z selbst kein minimales Ele-
ment. Wohlgeordnet bezüglich ‚<‘ ist da-
1. ‚<‘ eine Ordnung ist und gegen die Menge N. Hier ist in jeder nicht-
leeren Teilmenge immer auch ein minima-
2. für alle x, y ∈ M mit x = y entweder x < y oder y < x gilt. les Element enthalten.
I ‚<‘ ist eine Wohlordnung auf M, wenn
1. ‚<‘ auf M eine totale Ordnung ist und
2. jede Menge N ⊆ M mit N = 0/ ein kleinstes Element besitzt,
d. h., es existiert ein x ∈ N mit x < y für alle y ∈ N \ {x}.
162 3 Fundamente der Mathematik

I Georg Cantor, 1883 [23]


„Unter einer wohlgeordneten Menge ist jede wohldefinierte
Menge zu verstehen, 1) bei welcher die Elemente durch eine
bestimmt vorgegebene Succession miteinander verbunden sind,
2) welcher gemäß es ein erstes Element der Menge gibt, 3) und
sowohl auf jedes einzelne Element (falls es nicht das letzte in
der Succession ist) ein bestimmtes anderes folgt, 4) wie auch zu
jeder beliebigen endlichen oder unendlichen Menge von
Elementen ein bestimmtes Element gehört, welches das ihnen
allen nächst folgende Element in der Succession ist (es sei
denn, dass es ein ihnen allen in der Succession folgendes
überhaupt nicht gibt).“
I Moderne Formulierung

1) M ist bezüglich ‚<‘ total geordnet.


2) Ist M = 0,
/ so existiert in M ein kleinstes Element.
3) Existiert ein y mit x < y, so gibt es ein kleinstes y mit x < y.
4) Existiert ein y mit N < y (N ⊂ M), so gibt es ein kleinstes y mit N < y.

I Georg Cantor, 1897 [25]


„A. Jede Teilmenge F1 einer wohlgeordneten Menge F hat ein niederstes Element.“
„B. Ist eine einfach geordnete Menge F so beschaffen, dass sowohl F wie auch jede ihrer Teilmengen ein
niederstes Element haben, so ist F eine wohlgeordnete Menge.“

Abbildung 3.11: Ein Stück Geschichte. In seiner Arbeit aus dem Jahr 1883 charakterisierte Georg Cantor den Begriff der
Wohlordnung mithilfe von vier Eigenschaften, die sich auf den ersten Blick deutlich von jenen aus Definition 3.4 unterscheiden.
Dass beide Definitionen tatsächlich den gleichen Ordnungsbegriff beschreiben, bewies Cantor im Jahr 1897.

Totale Ordnungen besitzen die Eigenschaft, dass wir zwei Elemente x


und y immer in Beziehung zueinander setzen können; es gilt also entwe-
der x < y oder y < x. Totale Ordnungen werden gerne als lineare Ord-
nungen bezeichnet, da wir uns die Elemente kettenförmig angeordnet
vorstellen können. Seien Sie sich dabei stets bewusst, dass eine solche
Anordnung nicht bedeuten muss, dass jedes Element x einen direkten
Nachfolger besitzt. Beispielsweise ist die Menge Q bezüglich ‚<‘ to-
tal geordnet, aber zwischen zwei Elementen x und y gibt es stets ein
weiteres Element z mit x < z und z < y.

Vom Begriff der totalen Ordnung ist der Begriff der Wohlordnung nur
einen kleinen Schritt entfernt. Eine Totalordnung auf M ist genau dann
eine Wohlordnung, wenn sie zusätzlich die Eigenschaft erfüllt, dass je-
3.2 Axiomatische Mengenlehre 163

de nichtleere Teilmenge N ⊆ M ein minimales Element enthält. Es ist Der Begriff der Halbordnung
leicht einzusehen, dass die natürlichen Zahlen bezüglich ‚<‘ wohlge- wird in der Literatur unter-
ordnet sind; schließlich existiert in jeder Teilmenge von N ein Element, schiedlich definiert. In manchen Büchern
das kleiner ist als alle anderen. Betrachten wir hingegen die Menge der wird, wie hier, die Eigenschaft der Irre-
flexivität gefordert. Andere gehen von der
ganzen Zahlen, so wird die Wohlordnungseigenschaft bereits durch die
Eigenschaft der Reflexivität aus und for-
Menge Z selbst verletzt. Die Menge der ganzen Zahlen ist nach unten dern anstelle der Asymmetrie die Anti-
unbeschränkt und besitzt somit kein minimales Element. symmetrie. In der Mathematik wird eine
Relation als antisymmetrisch bezeichnet,
Genauso wenig ist die Menge der positiven rationalen Zahlen Q+
wenn die Beziehungen x < y und y < x
bezüglich ‚<‘ wohlgeordnet. Hier wird die Wohlordnungseigenschaft nur dann gleichzeitig gelten können, wenn
durch jedes linksseitig geöffnete Intervall verletzt. Trotzdem können wir x = y ist. Manche Autoren machen den
mit einem Trick die Elemente aus Q+ so umordnen, dass eine Wohlord- Unterschied explizit deutlich, indem sie
nung entsteht. Hierzu führen wir mit ‚≺‘ eine neue Ordnung ein, die wir ausdrücklich von irreflexiven oder reflexi-
für gekürzte Brüche folgendermaßen definieren (vgl. Abbildung 3.12): ven Ordnungen sprechen.
 Beide Varianten haben ihre Berechtigung.
p1 p2 p1 < p2 falls p1 = p2 Beispielsweise ist die Teilmengenrelation
≺ :⇔
q1 q2 q1 < q2 falls p1 = p2 ⊆ eine reflexive Ordnung (es gilt stets
x ⊆ x) und die Elementrelation ∈ eine
Um unter zwei rationalen Zahlen qp11 und qp22 die kleinere zu bestimmen, irreflexive Ordnung (für keine Menge x
werden zunächst die beiden Zähler p1 und p2 verglichen. Ein kleine- gilt x ∈ x). Spätestens diese Beispiele ma-
rer Zähler ist in der neuen Vergleichsrelation gleichbedeutend mit einer chen klar, dass die maßgebende Eigen-
kleineren Zahl. Nur wenn die Zähler gleich sind, entscheiden die Nen- schaft einer Ordnungsrelation nicht de-
ner q1 und q2 darüber, welche Zahl die kleinere ist. Tatsächlich haben ren Irreflexivität oder Reflexivität ist, son-
wir es durch die Umsortierung geschafft, auf den rationalen Zahlen eine dern die asymmetrische bzw. antisymme-
Wohlordnung zu definieren. Wir können jetzt eine beliebige nichtleere trische Anordnung der Elemente zusam-
Teilmenge herausgreifen und werden immer ein eindeutiges Element men mit der Transitivität. Auch in un-
seren Betrachtungen spielt es keine Rol-
identifizieren können, das bezüglich ‚≺‘ minimal ist.
le, ob die untersuchten Ordnungsrelatio-
Der errungene Erfolg mag uns zu der Annahme verleiten, dass sich aus- nen irreflexiv oder reflexiv sind. Aus die-
nahmslos jede Menge wohlordnen lässt. In Satzform lautet unsere Ver- sem Grund werden wir die Unterschei-
mutung wie folgt: dung weitgehend ignorieren und immer
nur allgemein von Ordnungen sprechen.

Satz 3.1 (Wohlordnungssatz)

Jede Menge kann wohlgeordnet werden.

Als Beispiel betrachten wir die reellen Zahlen. Bezüglich der gewöhn-
lichen Vergleichsoperation ‚<‘ ist R nicht wohlgeordnet, da z. B. jedes
nach links geöffnete Intervall die Wohlordnungseigenschaft verletzt.
Sollte sich der Wohlordnungssatz aber tatsächlich als wahr erweisen,
so müssten wir in der Lage sein, auch die Menge der reellen Zahlen
wohlzuordnen. Nehmen Sie sich an dieser Stelle ruhig etwas Zeit und
versuchen Sie, die reellen Zahlen so umzuordnen, dass eine Wohlord-
nung entsteht.
164 3 Fundamente der Mathematik

Wahrscheinlich haben Sie bemerkt, dass der Trick, der uns die rationa-
len Zahlen auf so einfache Weise wohlordnen ließ, im Fall der reellen
Zahlen versagt. Dass Sie mit Ihren Versuchen gescheitert sind, ist keine
1/1 1/2 1/3 ...
Schmach. Bis heute ist es niemandem gelungen, eine konstruktive Ord-
nungsvorschrift ‚≺‘ zu definieren, die zu einer Wohlordnung auf den
2/1 2/2 2/3 ... reellen Zahlen führt.

Die gescheiterten Versuche nähren den Verdacht, dass die Wohlordnung


3/1 3/2 3/3 ...
der reellen Zahlen überhaupt nicht gelingen kann. Dürfen wir unse-
rer Intuition, die uns mit steigender Beharrlichkeit von der Falschheit
4/1 4/2 4/3 ...
des Wohlordnungssatzes überzeugen möchte, dieses Mal trauen? Ist das
5/1 5/2 5/3 ...
Auswahlaxiom tatsächlich wahr und der Wohlordnungssatz falsch?
Damit ist es an der Zeit, den Schleier zu lüften und Fakten sprechen zu
6/1 6/2 6/3 ... lassen. Es ist ein fundamentales Ergebnis der modernen Mengenlehre,
dass der Wohlordnungssatz und das Auswahlaxiom äquivalent sind. In
7/1 7/2 7/3 ... der Tat können wir den Wohlordnungssatz innerhalb von ZFC beweisen
und umgekehrt das Auswahlaxiom in ZF herleiten, wenn wir den Wohl-
8/1 8/2 8/3 ... ordnungssatz als Axiom hinnehmen (Abbildung 3.13). Eine konkrete
Ordnungsvorschrift liefert der Beweis dagegen nicht. In der gleichen
Abbildung 3.12: Durch die geschickte Um- Weise, wie das Auswahlaxiom lediglich die Existenz einer Auswahl-
sortierung der rationalen Zahlen können wir menge postuliert, garantiert uns der Beweis des Wohlordnungssatzes
die Menge Q+ wohlordnen. In der neuen zwar die Existenz einer solchen Ordnung, er sagt aber nicht, wie wir
Aufzählung erscheinen zunächst die Brüche die Elemente konkret anordnen müssen.
mit dem Zähler 1, danach folgen die Brüche
mit dem Zähler 2 und so fort. Beachten Sie, Eine weitere Konsequenz ergibt sich aus der Unabhängigkeit des Aus-
dass jede rationale Zahl neben ihrer gekürz- wahlaxioms. Es folgt, dass die ZF-Axiome sowohl mit dem Wohlord-
ten Bruchdarstellung unendlich viele unge- nungssatz als auch mit seiner Negation verträglich sind. In der gleichen
kürzte Darstellungen besitzt. Letztere sind Weise sind die ZF-Axiome mit der spezielleren Annahme verträglich,
in der Abbildung grau dargestellt und spie-
die reellen Zahlen ließen sich wohlordnen, wie auch mit der Annahme,
len für die Ordnungsdefinition keine Rolle.
dass dies unmöglich ist. Genau hierin liegt auch der Grund, warum Sie
nicht in der Lage waren, eine konkrete Wohlordnung auf den reellen
Zahlen anzugeben. Wäre es Ihnen gelungen, so hätten Sie gezeigt, dass
die ZF-Axiome mit der Annahme, die reellen Zahlen ließen sich nicht
wohlordnen, unverträglich sind, doch genau dies ist nicht der Fall. Ein
wahrhaft erstaunliches Ergebnis der modernen Mengenlehre!

Eine dritte Charakterisierung des Auswahlaxioms wollen wir nicht ver-


schweigen. Sie kommt in Form des Zorn’schen Lemmas daher:

Satz 3.2 (Zorn’sches Lemma)

Jede nichtleere halbgeordnete Menge, in der jede total geordnete


Teilmenge eine obere Schranke besitzt, enthält mindestens ein ma-
ximales Element.
3.2 Axiomatische Mengenlehre 165

Beweis, dass jede Menge wohlgeordnet werden kann.


(Aus einem an Herrn Hilbert gerichteten Briefe.)
Von E. Z ERMELO in Göttingen

1) Es sei M eine beliebige Menge, [...] 6) Folgerungen. Haben zwei γ-Mengen ein Element a ge-
2) Jeder [nichtleeren] Teilmenge M  [von M] denke man sich meinsam, so haben sie auch den Abschnitt A der vorangehen-
ein beliebiges Element m1 zugeordnet, das in M  selbst vor- den Elemente gemein. Haben sie zwei Elemente a, b gemein,
kommt und das ‚ausgezeichnete‘ Element von M  genannt so ist in beiden Mengen entweder a ≺ b oder b ≺ a.
werden möge. So entsteht eine ‚Belegung‘ γ der Menge M 7) Bezeichnet man als ‚γ-Element‘ jedes Element von M, das
[P(M) − {0}] mit Elementen der Menge M von besonderer in irgendeiner γ-Menge vorkommt, so gilt der Satz: Die Ge-
Art. [...] Im Folgenden wird nun eine beliebige Belegung γ samtheit Lγ aller γ-Elemente lässt sich so ordnen, dass sie
zugrunde gelegt und aus ihr eine bestimmte Wohlordnung der selbst eine γ-Menge darstellt, und umfasst alle Elemente der
Elemente von M abgeleitet. ursprünglichen Menge M. Die letztere ist damit selbst wohl-
3) Definition. Als ‚γ-Menge‘ werde bezeichnet jede wohlge- geordnet. [...] Somit entspricht jeder Belegung γ eine ganz
ordnete Menge Mγ [⊆ M], welche folgende Beschaffenheit bestimmte Wohlordnung der Menge M. [...]
besitzt: ist a ein beliebiges Element von Mγ und A der ‚zu- Der vorliegende Beweis beruht auf der Voraussetzung, dass
gehörige‘ Abschnitt, der aus den vorangehenden Elementen Belegungen γ überhaupt existieren, also auf dem Prinzip,
x ≺ a von Mγ besteht, so ist a immer das ‚ausgezeichnete dass es auch für eine unendliche Gesamtheit von Mengen
Element‘ von M − A. immer Zuordnungen gibt, bei denen jeder Menge eines ih-
4) Es gibt γ-Mengen innerhalb M. So ist z. B. m1 , das ausge- rer Elemente entspricht. [...]
zeichnete Element von M  = M, selbst eine γ-Menge. [...] Die Idee, unter Berufung dieses Prinzip eine beliebige Bele-
5) Sind Mγ und Mγ irgend zwei verschiedene γ-Mengen (die gung γ der Wohlordnung zugrunde zu legen, verdanke ich
aber zu derselben ein für allemal gewählten Belegung gehö- Herrn Erhard Schmidt; meine Durchführung des Beweises
ren!), so ist immer eine von beiden identisch mit einem Ab- beruht dann auf der Verschmelzung der verschiedenen mög-
schnitte der anderen. [...] lichen ‚γ-Mengen‘, d. h. der durch das Ordnungsprinzip sich
ergebenden wohlgeordneten Abschnitte.

Münden i. Hann., den 24. September 1904.


Ernst Zermelo

Abbildung 3.13: Beweis des Wohlordnungssatzes durch Ernst Zermelo [48, 222]. Zum ersten Mal äußerte er den Beweis
im Jahr 1904 in dem hier zitierten Brief an David Hilbert. Die farblich hervorgehobenen Passagen zeigen, dass Zermelo das
Auswahlaxiom in einer etwas anderen Form verwendet hat, als es heute üblich ist. Zum einen postulierte er nicht die Existenz
einer Auswahlmenge, sondern die Existenz einer Auswahlfunktion. Zum anderen verzichtete auf die heute übliche Forderung,
dass die Mengen, aus denen ausgewählt wird, paarweise disjunkt sein müssen.

Das Zorn’sche Lemma, das Auswahlaxiom und das Wohlordnungsprin-


zip sind äquivalent. Fügen wir eines davon den ZF-Axiomen hinzu,
so können wir die anderen beiden als Theoreme ableiten. Auch wenn
das Zorn’sche Lemma die am wenigsten intuitive Aussage tätigt, hat es
mehrere Anwendungen in der gewöhnlichen Mathematik. Für wichtige
Sätze der linearen Algebra und der Funktionalanalysis lassen sich mit
ihm vergleichsweise kurze Beweise konstruieren.
166 3 Fundamente der Mathematik

I ! , " 3.2.1.3 Mengenlehre als Fundament der Mathematik

In diesem Abschnitt werden wir die Sprache der Zermelo-Fraenkel-


Mengenlehre weiter ausbauen und demonstrieren, wie sich die Begriffe
der gewöhnlichen Mathematik in ZF formalisieren lassen. Hierzu wer-
den wir eine Reihe neuer Sprachkonstrukte einführen, die in gewohn-
ter Weise als syntaktische Abkürzungen zu verstehen sind. Sie werden
dazu beitragen, die Formeln der ZF-Mengenlehre noch kompakter und
verständlicher niederzuschreiben, als es bisher schon möglich war.
I ! ,! , ""
Allem anderen vorweg wollen wir erlauben, die gewöhnliche Mengen-
schreibweise in Formeln der ZF-Mengenlehre zu verwenden. Für end-
liche Mengen ist dies problemlos möglich, da wir jede Formel ϕ, die
einen Ausdruck der Form {ξ1 , . . . , ξn } enthält, durch eine äquivalente
Formel der Bauart

∃ x (ψ(x) ∧ ϕ[{ξ1 , . . . , ξn } ← x])

ersetzen können. In dieser Formel wird ψ(x) so gewählt, dass die Men-
ge {ξ1 , . . . , ξn } eindeutig durch die neu eingeführte Variable x beschrie-
I !! , ", "
ben wird. Natürlich darf anstelle von x auch jede andere Variable ver-
wendet werden, die nicht in ϕ vorkommt.

Als Beispiel seien die Mengen y = {y1 } und x = {x1 , x2 } gegeben. Die
Menge y können wir durch die Formel

ψ1 (y) := y1 ∈ y ∧ ∀ (z ∈ y) z = y1

beschreiben und die Menge x durch die Formel

ψ2 (x) := x1 ∈ x ∧ x2 ∈ x ∧ ∀ (z ∈ x) (z = x1 ∨ z = x2 )

Damit sind wir in der Lage, auch die Formel


Abbildung 3.14: Mithilfe der Konstruktion
!ξ , ν" := { {ξ }, {ξ , ν} } lässt sich auf den {y1 } = {x1 , x2 } → (x1 = y1 ∧ x2 = y1 ) (3.3)
ungeordneten Elementen einer Menge eine
Reihenfolge definieren. Der Begriff des ge- in der ureigenen Sprache der ZF-Mengenlehre auszudrücken. In ihrer
ordneten Paares lässt sich dadurch genauso Reinform liest sie sich wie folgt:
auf die Mengenlehre reduzieren wie der all-
gemeinere Begriff des geordneten n-Tupels. ∃ y (y1 ∈ y ∧ ∀ (z ∈ y) z = y1 ∧
∃ y (∃ x (x1 ∈ x ∧ x2 ∈ x ∧ ∀ (z ∈ x) (z = x1 ∨ z = x2 ) ∧
∃ y (∃ x ((y = x → (x1 = y1 ∧ x2 = y1 ))))

Auf der eingeführten Mengenschreibweise können wir aufbauen und


den Begriff des geordneten Paares formalisieren. Anders als in der
Menge {ξ , ν} besitzen die Elemente ξ und ν in einem geordneten
3.2 Axiomatische Mengenlehre 167

I „x ist eine zweistellige Relation“ I Auflösen von {u, v}

∀ (y ∈ x) ∃ u ∃ v y = !u, v" ∀ (y ∈ x) ∃ u ∃ v
∃ z1 ((u ∈ z1 ∧
I Definition des geordneten Paares ∃ z1 ((∀ (z ∈ z1 ) z = u) ∧
∀ (y ∈ x) ∃ u ∃ v y = {{u}, {u, v}} ∃ z2 ((u ∈ z2 ∧ v ∈ z2 ∧
∃ z2 ((∀ (z ∈ z2 ) (z = u ∨ z = v)) ∧
I Auflösen von {{u}, {u, v}} ∃ z (z1 ∈ z ∧ z2 ∈ z ∧
∃ z ( ∀ (z ∈ z) (z = z1 ∧ z = z2 ) ∧
∀ (y ∈ x) ∃ u ∃ v
∃ z ( y = z)))
∃ z ({u} ∈ z ∧ {u, v} ∈ z ∧
∃ z ( ∀ (z ∈ z) (z = {u} ∨ z = {u, v}) ∧
∃ z ( y = z) I Eliminieren der bedingten Quantoren

∀ y (y ∈ x → ∃ u ∃ v
I Auflösen von {u}
∃ z1 ((u ∈ z1 ∧
∀ (y ∈ x) ∃ u ∃ v ∃ z1 ((∀ z (z ∈ z1 → z = u)) ∧
∃ z1 ((u ∈ z1 ∧ ∃ z2 ((u ∈ z2 ∧ v ∈ z2 ∧
∃ z1 ((∀ (z ∈ z1 ) z = u) ∧ ∃ z2 ((∀ z (z ∈ z2 → (z = u ∨ z = v))) ∧
∃ z (z1 ∈ z ∧ {u, v} ∈ z ∧ ∃ z (z1 ∈ z ∧ z2 ∈ z ∧
∃ z ( ∀ (z ∈ z) (z = z1 ∧ z = {u, v}) ∧ ∃ z ( ∀ z (z ∈ z → (z = z1 ∧ z = z2 )) ∧
∃ z ( y = z)) ∃ z ( y = z))))

Abbildung 3.15: Formalisierung des Relationenbegriffs in der Sprache der Zermelo-Fraenkel-Mengenlehre

Paar !ξ , ν" eine feste Position, d. h., wir müssen einen Weg finden, um
die Positionsinformation in eine gewöhnliche Menge hineinzucodieren.
Hierzu bedienen wir uns eines einfachen, aber eleganten Tricks (Abbil-
dung 3.14) und setzen

!ξ , ν" := { {ξ }, {ξ , ν} }

Die Definition erfüllt ihren Zweck: Obwohl die Menge { {ξ }, {ξ , ν} }


selbst ungeordnet ist, können wir die Position von ξ und ν eindeutig
aus der Struktur ihrer Elemente {ξ } und {ξ , ν} extrahieren.

Vorgeschlagen wurde diese Mengendarstellung für geordnete Paare im


Jahr 1921 von Kazimierz Kuratowski [114] und lässt sich in nahelie-
168 3 Fundamente der Mathematik

I Partielle Funktion gender Weise auf geordnete Tupel beliebiger Größe erweitern:
„Kein Element des Definitionsbereichs
wird auf mehr als ein Element des !ξ1 " := ξ1
Wertebereichs abgebildet“ !ξ1 , . . . , ξn+1 " := !!ξ1 , . . . , ξn ", ξn+1 "

Der eingeschlagene Kurs führt uns auf direktem Weg zum Begriff der
Relation. Formal gesehen verbirgt sich hinter einer Relation eine Menge
ξ von geordneten Paaren, so dass wir die Aussage „ξ ist eine Relati-
on“ wie folgt innerhalb der Zermelo-Fraenkel-Mengenlehre beschrei-
ben können:

I Totale Funktion R(ξ ) := ∀ (y ∈ ξ ) ∃ u ∃ v (y = !u, v")


„Jedes Element des Definitionsbereichs
In dieser Schreibweise wirkt die Formel kompakt und elegant. Was sich
wird auf ein und nur ein Element des
Wertebereichs abgebildet“ in Wirklichkeit hinter ihr verbirgt, wird deutlich, wenn wir die einge-
führten Abkürzungen schrittweise auflösen. Die entkleidete Formel ist
in Abbildung 3.15 zu sehen; sie ist ein wahres Monster und demonstriert
ein weiteres Mal, wie wichtig die vereinfachenden Schreibweisen wirk-
lich sind. Ohne sie degradieren mengentheoretische Formeln zu riesigen
Gebilden, deren Inhalt für uns Menschen nicht mehr zu erkennen ist.
Zu guter Letzt wollen wir den Begriff der partiellen Funktion formal
erfassen (Abbildung 3.16). Allgemein verstehen wir unter einer solchen
Abbildung 3.16: Der Begriff der partiel- Funktion eine binäre Relation ξ der folgenden Form:
len Funktion ist eine Verallgemeinerung des
Begriffs der Funktion. Von einer partiellen ξ = {!u, v" | v = f (u)}
Funktion sprechen wir bereits dann, wenn
zu jedem Element des Definitionsbereichs Präzise formuliert ist eine binäre Relation ξ genau dann eine partielle
höchstens ein Bildelement existiert; wir ver- Funktion, wenn sie rechtseindeutig ist, d. h., wenn zu jedem u höchstens
zichten also auf die Forderung, dass jedes ein v existiert mit (u, v) ∈ ξ . Somit können wir die Aussage „ξ ist eine
Element des Definitionsbereichs genau ein partielle Funktion“ folgendermaßen formalisieren:
Bildelement besitzt. Um partielle Funktio-
nen von den gewöhnlichen Funktionen ab- F(ξ ) := R(ξ ) ∧ ∀ u ∀ v ∀ w (!u, v" ∈ ξ ∧ !u, w" ∈ ξ → v = w)
zugrenzen, werden letztere auch als totale
Funktionen bezeichnet.
Beweisebenen

An mehreren Stellen dieses Buchs wurde betont, dass wir die Zermelo-
Fraenkel-Mengenlehre als das formale Fundament der Mathematik an-
sehen dürfen. Eine erste Rechtfertigung halten wir bereits in Händen.
Die Beispiele des geordneten Paares, der Relation und der Funktion ha-
ben gezeigt, dass ganz gewöhnliche Begriffe der Mathematik innerhalb
der Mengenlehre beschrieben werden können. Zusätzlich werden wir
in Abschnitt 3.2.2 erarbeiten, wie sich der Zahlenbegriff auf den Men-
genbegriff reduzieren lässt. Sobald die natürlichen Zahlen formalisiert
3.2 Axiomatische Mengenlehre 169

sind, können wir darauf aufbauen und die ganzen Zahlen definieren. Mengentheoretische Hilfstheoreme
Auf den ganzen Zahlen lässt sich die Theorie der rationalen Zahlen er-
richten und hierauf wiederum die Theorie der reellen Zahlen. Setzen
ξ ∈ {ξ , ν} (H1)
wir den Abstraktionsprozess fort, so erreichen wir sämtliche Gebiete
der gewöhnlichen Mathematik; sie sind die Äste eines Baums, dessen ξ ∈ {ν, ξ } (H2)
Wurzel im Fundament der Mengenlehre einen festen Halt gefunden hat. ξ ∈ {ν, μ} → (ξ = ν ∨ ξ = μ) (H3)

Ein wichtiger Baustein unserer Rechtfertigung steht allerdings noch ξ ∈ ν → (ν = μ → ξ ∈ μ) (H4)


aus. Wir müssen gewährleisten, dass sich nicht nur die Begriffe, sondern ξ =ν →ν =ξ (H5)
auch die Beweise der gewöhnlichen Mathematik innerhalb der Mengen- ξ = ν → (ν = μ → ξ = μ) (H6)
lehre nachvollziehen lassen. Am Beispiel des folgenden Satzes wollen
wir demonstrieren, dass dies tatsächlich gelingt: ν = ξ → ({ξ , μ} = {ν, υ} →
{ξ , μ} = {ξ , υ}) (H7)
{ξ } = {ν} → ξ = ν (H8)
Satz 3.3 (Komponentengleichheit geordneter Paare)
{ξ , ν} = {μ} → μ = ξ (H9)
Für beliebige geordnete Paare !x, y" und !u, v" gilt die Beziehung {ξ , ν} = {μ} → ν = μ (H10)
Aus !x, y" = !u, v" folgt x = u und y = v {ξ , ν} = {ξ , μ} → μ = ν (H11)
ξ = ν → {μ, ν} = {μ, ξ } (H12)

Um zu sehen, wie sich dieser Satz in der gewöhnlichen Sprache der


Aussagenlogische Hilfstheoreme
Mathematik beweisen lässt, schlagen wir in einem der Standardwerke
nach. In [125] lautet der Beweis im Originalwortlaut z. B. so:
ϕ → (ψ → (ϕ ∧ ψ)) (TA1)
„Assume !x, y" = !u, v". Then {{x}, {x, y}} = {{u}, {u, v}}. Sin- (ϕ ∨ ψ) → ((χ ∨ ψ) →
ce {x} ∈ {{x}, {x, y}}, {x} ∈ {{u}, {u, v}}. Hence, {x} = {u} or ((ϕ ∧ χ) ∨ ψ)) (TA2)
{x} = {u, v}. In either case, x = u. Now, {u, v} ∈ {{u}, {u, v}};
(ϕ → ψ) → ((¬ϕ → ψ) → ψ) (TA3)
so, {u, v} ∈ {{x}, {x, y}}. Then, {u, v} = {x} or {u, v} = {x, y}.
Similarly, {x, y} = {u} or {x, y} = {u, v}. If {u, v} = {x} and (ϕ ∨ ψ) → ((ϕ → χ) →
{x, y} = {u}, then x = y = u = v; if not, {u, v} = {x, y}. Hence, ((ψ → χ) → χ)) (TA4)
{u, v} = {u, y}. So, if v = u, then y = v; if v = u, then y = v. Thus,
(ϕ → (ψ → χ)) →
in all cases, y = v.“
(ϕ ∧ ψ → χ) (TA5)
Damit wir den Satz überhaupt innerhalb von ZF beweisen können, über-
setzen wir ihn zunächst in die formale Schreibweise:
Tabelle 3.5: Hilfstheoreme für den Beweis
∀ x ∀ y ∀ u ∀ v (!x, y" = !u, v" → x = u ∧ y = v) von Satz 3.3

Wir wollen versuchen, den Beweis nicht unnötig zu verkomplizieren.


Aus diesem Grund werden wir auf eine Reihe von Hilfstheoremen zu-
rückgreifen, die entweder aussagenlogische Tautologien sind oder ele-
mentare Aussagen über die Elementrelation ‚∈‘ und die Gleichheitsre-
lation ‚=‘ tätigen. Tabelle 3.5 fasst zusammen, auf welche Theoreme
wir dabei im Einzelnen zurückgreifen. Wir gehen davon aus, dass die
170 3 Fundamente der Mathematik

Variablen ξ , ν und μ nicht nur durch Variablen, sondern auch durch


Mengenkonstrukte wie z. B. {x, y} ersetzt werden dürfen.

Eine Warnung vorweg: Widerstehen Sie der Versuchung, die Rolle der
Hilfstheoreme zu unterschätzen! Auch wenn sie inhaltlich einer An-
sammlung von Trivialitäten gleichen, sind sie nicht in jedem Fall ein-
fach zu beweisen. Führten wir die Beweise zusätzlich auf, so würde sich
die nun folgende Ableitung um mehrere Seiten verlängern.

Assume !x, y" = !u, v". 1. !x, y" = !u, v" 


Then {{x}, {x, y}} = {{u}, {u, v}}. {{x}, {x, y}} = {{u}, {u, v}} (Def)
Since {x} ∈ {{x}, {x, y}}, 2.  {x} ∈ {{x}, {x, y}} (H1)
3.  {x} ∈ {{x}, {x, y}} →
({{x}, {x, y}} = {{u}, {u, v}} → {x} ∈ {{u}, {u, v}}) (H4)
4.  {{x}, {x, y}} = {{u}, {u, v}} → {x} ∈ {{u}, {u, v}} (MP, 2,3)
{x} ∈ {{u}, {u, v}}. 5. !x, y" = !u, v"  {x} ∈ {{u}, {u, v}} (MP, 1,4)
6.  {x} ∈ {{u}, {u, v}} → ({x} = {u} ∨ {x} = {u, v}) (H3)
Hence, {x} = {u} or {x} = {u, v}. 7. !x, y" = !u, v"  {x} = {u} ∨ {x} = {u, v} (MP, 5,6)
8.  {x} = {u} → x = u (H8)
9.  {u, v} = {x} → x = u (H9)
10.  {x} = {u, v} → {u, v} = {x} (H5)
11. {x} = {u, v}  {u, v} = {x} (DT)
12. {x} = {u, v}  x = u (MP, 9,11)
13.  {x} = {u, v} → x = u (DT)
14.  ({x} = {u} ∨ {x} = {u, v}) → (({x} = {u} → x = u) →
(({x} = {u, v} → x = u) → x = u)) (TA4)
15. !x, y" = !u, v"  ({x} = {u} → x = u) →
(({x} = {u, v} → x = u) → x = u) (MP, 7,14)
16. !x, y" = !u, v"  ({x} = {u, v} → x = u) → x = u (MP, 8,15)
In either case, x = u. 17. !x, y" = !u, v"  x = u (MP, 13,16)
Now, {u, v} ∈ {{u}, {u, v}}; 18.  {u, v} ∈ {{u}, {u, v}} (H2)
19.  {u, v} ∈ {{u}, {u, v}} →
({{u}, {u, v}} = {{x}, {x, y}} → {u, v} ∈ {{x}, {x, y}}) (H4)
20.  {{u}, {u, v}} = {{x}, {x, y}} →
{u, v} ∈ {{x}, {x, y}} (MP, 18,19)
21.  {{x}, {x, y}} = {{u}, {u, v}} →
{{u}, {u, v}} = {{x}, {x, y}} (H5)
3.2 Axiomatische Mengenlehre 171

22. !x, y" = !u, v"  {{u}, {u, v}} = {{x}, {x, y}} (MP, 1,21)
23. !x, y" = !u, v"  {u, v} ∈ {{x}, {x, y}} (MP, 20,22) so, {u, v} ∈ {{x}, {x, y}}.
24.  {u, v} ∈ {{x}, {x, y}} → ({u, v} = {x} ∨ {u, v} = {x, y}) (H3)
25. !x, y" = !u, v"  {u, v} = {x} ∨ {u, v} = {x, y} (MP, 23,24) Then, {u, v} = {x} or {u, v} = {x, y}.
26.  {x, y} ∈ {{x}, {x, y}} (H2) Similarly,
27.  {x, y} ∈ {{x}, {x, y}} →
({{x}, {x, y}} = {{u}, {u, v}} → {x, y} ∈ {{u}, {u, v}}) (H4)
28.  {{x}, {x, y}} = {{u}, {u, v}} →
{x, y} ∈ {{u}, {u, v}} (MP, 26,27)
29. !x, y" = !u, v"  {x, y} ∈ {{u}, {u, v}} (MP, 1,28)
30.  {x, y} ∈ {{u}, {u, v}} → ({x, y} = {u} ∨ {x, y} = {u, v}) (H3)
31. !x, y" = !u, v"  {x, y} = {u} ∨ {x, y} = {u, v} (MP, 29,30) {x, y} = {u} or {x, y} = {u, v}.
32. !x, y" = !u, v"  {x, y} = {u} → {x, y} = {u, v} (31, Def. ∨)
33. !x, y" = !u, v", {x, y} = {u}  {x, y} = {u, v} (DT)
34.  {x, y} = {u, v} → {u, v} = {x, y} (H5)
35. !x, y" = !u, v", {x, y} = {u}  {u, v} = {x, y} (MP, 33,34)
36. !x, y" = !u, v"  {x, y} = {u} → {u, v} = {x, y} (DT)
37. !x, y" = !u, v"  {x, y} = {u} ∨ {u, v} = {x, y} (36, Def. ∨)
38.  {x, y} = {u} → u = x (H9)
39. {x, y} = {u}  u = x (DT)
40.  {x, y} = {u} → y = u (H10)
41. {x, y} = {u}  y = u (DT)
42.  y = u → (u = x → y = x) (H6)
43. {x, y} = {u}  u = x → y = x (MP, 41,42)
44. {x, y} = {u}  y = x (MP, 38,43)
45.  y = x → x = y (H5)
46. {x, y} = {u}  x = y (MP, 44,45)
47.  {u, v} = {x} → x = u (H9)
48. {u, v} = {x}  x = u (DT)
49.  {u, v} = {x} → v = x (H10)
50. {u, v} = {x}  v = x (DT)
51.  v = x → (x = u → v = u) (H6)
52. {u, v} = {x}  x = u → v = u (MP, 50,51)
53. {u, v} = {x}  v = u (MP, 48,52)
54.  v = u → u = v (H5)
172 3 Fundamente der Mathematik

55. {u, v} = {x}  u = v (MP, 53,54)


56.  y = u → (u = v → y = v) (H6)
57. {x, y} = {u}  u = v → y = v (MP, 41,56)
58. {x, y} = {u}, {u, v} = {x}  y = v (MP, 55,57)
59.  x = y → (y = u → (x = y ∧ y = u)) (TA1)
60. {x, y} = {u}  y = u → (x = y ∧ y = u) (MP, 46,59)
61. {x, y} = {u}  x = y ∧ y = u (MP, 41,60)
62.  (x = y ∧ y = u) → (u = v → (x = y ∧ y = u ∧ u = v)) (TA1)
63. {x, y} = {u}  u = v → (x = y ∧ y = u ∧ u = v) (MP, 61,62)
If {u, v} = {x} and {x, y} = {u}, 64. {x, y} = {u}, {u, v} = {x} 
then x = y = u = v; x = y∧y = u∧u = v (MP, 55,63)
65.  ({x, y} = {u} ∨ {u, v} = {x, y}) →
(({u, v} = {x} ∨ {u, v} = {x, y}) →
(({x, y} = {u} ∧ {u, v} = {x}) ∨ {u, v} = {x, y})) (TA2)
66. !x, y" = !u, v"  ({u, v} = {x} ∨ {u, v} = {x, y}) →
(({x, y} = {u} ∧ {u, v} = {x}) ∨ {u, v} = {x, y}) (MP, 37,65)
67. !x, y" = !u, v" 
({x, y} = {u} ∧ {u, v} = {x}) ∨ {u, v} = {x, y} (MP, 25,66)
68. !x, y" = !u, v" 
¬({x, y} = {u} ∧ {u, v} = {x}) → {u, v} = {x, y} (67, Def. ∨)
if not, {u, v} = {x, y}. 69. !x, y" = !u, v", ¬({x, y} = {u} ∧ {u, v} = {x}) 
{u, v} = {x, y} (DT)
70.  x = u → ({u, v} = {x, y} → {u, v} = {u, y}) (H7)
71. !x, y" = !u, v"  {u, v} = {x, y} → {u, v} = {u, y} (MP, 17,70)
72. !x, y" = !u, v", ¬({x, y} = {u} ∧ {u, v} = {x}) 
{u, v} = {u, y} (MP, 69,71)
73. !x, y" = !u, v" 
¬({x, y} = {u} ∧ {u, v} = {x}) → {u, v} = {u, y} (DT)
74.  y = v → {u, v} = {u, y} (H12)
75. {x, y} = {u}, {u, v} = {x}  {u, v} = {u, y} (MP, 58,74)
76. {x, y} = {u}  {u, v} = {x} → {u, v} = {u, y} (DT)
77.  {x, y} = {u} → ({u, v} = {x} → {u, v} = {u, y}) (DT)
78.  ({x, y} = {u} → ({u, v} = {x} → {u, v} = {u, y})) →
({x, y} = {u} ∧ {u, v} = {x} → {u, v} = {u, y}) (TA5)
79.  {x, y} = {u} ∧ {u, v} = {x} → {u, v} = {u, y} (MP, 77,78)
3.2 Axiomatische Mengenlehre 173

80.  (({x, y} = {u} ∧ {u, v} = {x}) → {u, v} = {u, y}) →


((¬({x, y} = {u} ∧ {u, v} = {x}) → {u, v} = {u, y}) →
{u, v} = {u, y}) (TA3)
81.  (¬({x, y} = {u} ∧ {u, v} = {x}) → {u, v} = {u, y})
→ {u, v} = {u, y} (MP, 79,80)
82. !x, y" = !u, v"  {u, v} = {u, y} (MP, 73,81) Hence, {u, v} = {u, y}.
83. v = u  {u, v} = {u, y} → y = v (H11)
84. !x, y" = !u, v", v = u  y = v (MP, 82,83) So, if v = u, then y = v;
85. !x, y" = !u, v"  v = u → y = v (DT)
86. v = u  {u, v} = {u, y} → y = v (H11)
87. !x, y" = !u, v", v = u  y = v (MP, 82,86) if v = u, then y = v.
88. !x, y" = !u, v"  v = u → y = v (DT)
89.  (v = u → y = v) → ((v = u → y = v) → y = v) (TA3)
90. !x, y" = !u, v"  (v = u → y = v) → y = v (MP, 88,89)
91. !x, y" = !u, v"  y = v (MP, 85,90) Thus, in all cases, y = v.
92.  x = u → (y = v → (x = u ∧ y = v)) (TA1)
93. !x, y" = !u, v"  y = v → (x = u ∧ y = v) (MP, 17,92)
94. !x, y" = !u, v"  x = u ∧ y = v (MP, 91,93)
95.  !x, y" = !u, v" → x = u ∧ y = v (DT)
96.  ∀ x ∀ y ∀ u ∀ v (!x, y" = !u, v" → x = u ∧ y = v) (G, 4 mal)

Ein gehöriges Stück Arbeit liegt hinter uns! Auch wenn der Inhalt der
bewiesenen Aussage nur wenig Aufsehen erregt, so ist die Komplexität
des Beweises wahrlich beeindruckend. Das Beispiel zeigt nachdrück-
lich, wie schwierig die Beweisführung selbst für scheinbar naheliegende
Aussagen ist. Doch seien Sie beruhigt. Niemand wird von Ihnen verlan-
gen, komplizierte Theoreme auf einer solch tiefen Abstraktionsebene
zu Fuß abzuleiten, geschweige denn auf die Idee kommen, die symboli-
sche Ebene der Zermelo-Fraenkel-Mengenlehre als das Handwerkszeug
einer neuen Mathematik auszurufen. In ihrer täglichen Arbeit werden
Mathematiker aller Fachrichtungen auch in Zukunft Beweise auf der
uns vertrauten Abstraktionsebene führen, auf der sich Formeln und um-
gangssprachliche Formulierungen in vertrauter Symbiose befinden. Nur
so sind wir als Mensch überhaupt in der Lage, komplexe Theoreme zu
beweisen. Was an dieser Stelle zählt, ist einzig und allein das Wissen,
dass sich alle gezogenen Schlussfolgerungen soweit formalisieren las-
sen, dass sie auf der untersten Ebene einer symbolischen Manipulation
von Zeichenketten gleichkommen.
174 3 Fundamente der Mathematik

I Basisfall: n = 0 3.2.1.4 Einbettung der natürlichen Zahlen

In Abschnitt 3.2.1.3 haben wir am Beispiel von Relationen und Funktio-


nen demonstriert, wie sich elementare Begriffe der Mathematik inner-
halb der Zermelo-Fraenkel-Mengenlehre formalisieren lassen. Wir wol-
I Schritt von n auf n + 1 len in der eingeschlagenen Richtung voranschreiten und zeigen, dass die
Mengenlehre gleichermaßen stark genug ist, um über Zahlen zu spre-
chen. Das bedeutet, dass wir einen Weg finden müssen, die natürlichen
Zahlen eindeutig auf Mengen abzubilden. Glücklicherweise müssen wir
nicht lange suchen, da bereits die folgende Konstruktion ihren Zweck
erfüllt (Abbildung 3.17):

Abbildung 3.17: Bildungsschema der Zer-


melo’schen Zahlenreihe
Definition 3.5 (Zermelo, 1908)

Die Einbettung der natürlichen Zahlen in die Mengenlehre erfolgt


I Basisfall: n = 0 rekursiv:
0 := 0/ n + 1 := {n}

Diese Mengendarstellung der natürlichen Zahlen wurde erstmals im


I Schritt von n auf n + 1 Jahr 1908 von Ernst Zermelo untersucht. Er begründete darauf die be-
rühmte Zermelo’sche Zahlreihe Z0 :

„Die Menge Z0 enthält die Elemente 0, {0}, {{0}} usw.


und möge als ‚Zahlreihe‘ bezeichnet werden, weil ihre Ele-
mente die Stelle der Zahlzeichen vertreten können. Sie bil-
den das einfachste Beispiel einer ‚abzählbar unendlichen‘
Abbildung 3.18: Bildungsschema der Neu- Menge...“
mann’schen Zahlenreihe
Ernst Zermelo, 1908 [223]

Eine modernere Einbettung der natürlichen Zahlen geht auf John von
Neumann zurück (Abbildung 3.18). Da Ernst Zermelo diese Zahlenrei-
he nahezu zeitgleich entdeckt hat, wird sie mitunter auch als Neumann-
Zermelo’sche Zahlenreihe bezeichnet.

Definition 3.6 (von Neumann, 1923)

Die Einbettung der natürlichen Zahlen in die Mengenlehre erfolgt


rekursiv:
0 := 0/ n + 1 := n ∪ {n}
3.2 Axiomatische Mengenlehre 175

Zermelo’sche Zahlenreihe Von Neumann’sche Zahlenreihe

0 = 0/ 0 = 0/
1 = {0} 1 = {0}
= {0}/ = {0}/
2 = {1} 2 = {0, 1}
= {{0}}/ = {0,/ {0}}
/
3 = {2} 3 = {0, 1, 2}
= {{{0}}}
/ = {0,
/ {0},
/ {0,/ {0}}}
/
4 = {3} 4 = {0, 1, 2, 3}
= {{{{0}}}}
/ = {0,
/ {0},
/ {0, / {0}},
/ {0,/ {0},
/ {0,
/ {0}}}}
/
... ...

Abbildung 3.19: Einbettung der natürlichen Zahlen in die Mengenlehre nach Ernst Zermelo und nach John von Neumann.

In Abbildung 3.19 sind die Anfangsstücke beider Zahlenreihen gegen-


übergestellt. Auf den ersten Blick wirkt die Zermelo’sche Darstellung
überlegen, da sie die natürlichen Zahlen sehr kompakt in die Mengen-
lehre einbettet. Erst der zweite Blick führt zu einem anderen Ergebnis
und bringt die volle Eleganz der von Neumann’schen Zahlenreihe zum
Vorschein. Zwei Eigenschaften sind besonders beachtenswert:

I Die Mengendarstellung einer Zahl n ist genau dann in der Mengen-


darstellung einer Zahl m enthalten, falls n < m. Damit ist die von
Neumann’sche Zahlenreihe bezüglich der Elementrelation ‚∈‘ total
geordnet. In gleicher Weise ist sie bezüglich ‚⊆‘ total geordnet. Die
Teilmengeneigenschaft ist äquivalent zu n ≤ m.

I Die Mengendarstellung einer Zahl n enthält exakt n Elemente, d. h.,


ihre Mächtigkeit ist mit der Zahl, die sie repräsentiert, identisch.
Damit bringt die von Neumann’sche Zahlenreihe nicht nur den
Ordnungs-, sondern auch den Mächtigkeitsaspekt der natürlichen
Zahlen glasklar zum Ausdruck.

Die von Neumann’sche Konstruktion der natürlichen Zahlen ist der Spe-
zialfall eines allgemeineren Konstruktionsschemas, das uns im nächsten
Abschnitt genauer beschäftigen wird. Mit ihm werden wir die Tür in die
Welt der Ordinalzahlen aufstoßen, eine faszinierende Welt wahrhaft rie-
siger Zahlen, von denen wir gerade einmal die allerkleinsten mit unserer
begrenzten Vorstellungskraft noch intuitiv erfassen können.
176 3 Fundamente der Mathematik

3.2.2 Ordinalzahlen
„Jede einfach geordnete Menge M [hat] einen bestimm-
ten Ordnungstypus M; es ist dies der Allgemeinbegriff,
welcher sich aus M ergibt, wenn unter Festhaltung der
Rangordnung ihrer Elemente von der Beschaffenheit
der letzteren abstrahiert wird [...]; den Ordnungstypus
einer wohlgeordneten Menge F nennen wir die ihr zu-
kommende ‚Ordnungszahl‘“
Georg Cantor, 1897 [25]

In Abschnitt 3.2.1.4 haben wir einen Weg gefunden, die natürlichen


Zahlen in Form von Mengen darzustellen. Als besonders fruchtbar hat
sich dabei die von Neumann’sche Zahlenreihe erwiesen. Hierin wird
die Zahl 0 mit der leeren Menge identifiziert und der Nachfolger einer
natürlichen Zahl n über die Vorschrift n ∪ {n} gebildet. In diesem Ab-
schnitt werden wir die Idee der von Neumann’schen Zahlenreihe verall-
gemeinern und mit den Ordinalzahlen eine Mengenwelt kennen lernen,
die uns erlauben wird, weit über die Grenzen der natürlichen Zahlen
hinaus zu zählen.

Die Reise in die Welt der Ordinalzahlen ist eine Reise in die Tiefen der
Unendlichkeit, und wir wollen sie nicht beginnen, ohne eine Warnung
auszusprechen. Der Weg, auf den wir uns begeben werden, führt mitten
in die Dunkelheit. Steht uns unsere Vorstellungskraft zu Beginn noch
treu zur Seite, so werden Sie schon bald erleben, wie sie im Rausch
der Tiefe langsam schwinden und schließlich ganz versagen wird. Die
Zahlen, die auf uns warten, sind so komplex, dass wir keine Chance
haben, sie auch nur im Ansatz intuitiv zu erfassen.

3.2.2.1 Definition und Eigenschaften

So soll unsere Reise nun beginnen. Wir tasten uns behutsam voran und
schicken zunächst den Begriff der transitiven Menge voraus:

Definition 3.7 (Transitive Menge)

Eine Menge z heißt transitiv, wenn gilt:

I Aus x ∈ y und y ∈ z folgt x ∈ z.


Oder, was gleichbedeutend ist:
I Aus y ∈ z folgt y ⊆ z.
3.2 Axiomatische Mengenlehre 177

Die erste definierende Eigenschaft hat ein bekanntes Gesicht. Ersetzen


wir den Elementoperator ‚∈‘ beispielsweise durch das Symbol ‚⊆‘, so
liest sich der Wortlaut dieser Definition wie die bekannte Transitivitäts-
 Transitiv 
eigenschaft der Teilmengenrelation. Die zweite, äquivalente Definition
macht aber schnell deutlich, dass transitive Mengen wahrhaft eigentüm- {}
Transitiv 
liche Gebilde sind; sie besitzen die merkwürdige Eigenschaft, dass je-
des Element gleichzeitig auch eine Teilmenge ist. {{}} Nicht transitiv 
{}
 {{  }}
Wie sehen solche Mengen konkret aus? Um zu erkennen, wie sich
transitive Mengen von nicht transitiven Mengen unterscheiden, werfen {{{}}} Nicht transitiv 
wir erneut einen Blick auf die Zermelo’sche Zahlenreihe Z0 aus Ab- {{  }} 
 {{{  }}}
schnitt 3.2.1.4. Am Anfang dieser Reihe steht die leere Menge 0. / Sie
...
erfüllt auf triviale Weise die in Definition 3.7 eingeforderte Beziehung
und ist somit transitiv. An zweiter Position steht die Menge {0}. / Sie Abbildung 3.20: Nur die ersten beiden Ele-
ist ebenfalls transitiv, da ihr einziges Element 0/ eine Teilmenge von je- mente der Zermelo’schen Zahlenreihe sind
der anderen Menge und damit auch eine Teilmenge von {0} / ist. Die transitive Mengen.
Menge {{0}},/ die Zermelo’sche Repräsentation der Zahl 2, ist hinge-
gen nicht transitiv, da das Element {0} / keine Teilmenge von {{0}}/ ist.
Das Gleiche gilt für die Zermelo’schen Mengendarstellungen der ande- 
ren natürlichen Zahlen (Abbildung 3.20). Transitiv 
Betrachten wir dagegen ein beliebiges Anfangsstück von Z0 , also eine {}
Menge der Form { 0, / {0},
/ {{0}},
/ {{{0}}},
/ . . . , {. . . {{{0}}}
/ . . .} }, so
haben wir erneut eine transitive Menge vor uns. Jedes ihrer Elemente Transitiv 
ist eine Teilmenge ihrer selbst (Abbildung 3.21). {{}}

Der erworbene Eindruck soll für den Moment genügen. Wir werden
jetzt einige elementare Eigenschaften von transitiven Mengen erarbei- {{{}}} Transitiv 
ten und beginnen mit dem Beweis wichtiger Abschlussmerkmale:
...
Satz 3.4 Abbildung 3.21: Fassen wir die Elemen-
te eines beliebigen Anfangsstücks der Zer-
1. Ist x eine transitive Menge, dann ist es auch x ∪ {x}. melo’schen Zahlenreihe zusammen, so ent-
 steht eine transitive Menge.
2. Ist x eine Menge transitiver Mengen, so ist auch x transitiv.

3. Ist x eine Menge transitiver Mengen, so ist auch x transitiv.

4. Ist x eine transitive Menge, dann ist es auch P(x).

Beweis: 1. Sei y ∈ x ∪ {x}. Dann gilt y = x oder y ∈ x. Im ersten Fall


gilt trivialerweise y ⊆ x. Im zweiten Fall gilt y ⊆ x ebenfalls, aufgrund
der Transitivität von x. In beiden Fällen gilt also y ⊆ x und damit auch

y ⊆ x ∪ {x}. 2. Sei y ∈ x. Dann ist y in mindestens einer Menge x mit
178 3 Fundamente der Mathematik

x ∈x enthalten. Da 
x transitiv ist, gilt y ⊆ x . Folgerichtig gilt auch
 Ordinalzahl  y ⊆ x. 3. Sei y ∈ x. Dann ist y in allen Mengen x mit x  ∈ x enthal-
 
ten. Da x transitiv ist, gilt y ⊆ x . Folgerichtig gilt auch y ⊆ x. 4. Jedes
Element y ∈ P(x) ist per Definition eine Teilmenge von x. Die Teilmen-
{}
Ordinalzahl  geneigenschaft bedeutet, dass jedes Element y ∈ y auch Element von
x ist. Da x transitiv ist, folgt y ⊆ x und damit auch y ∈ P(x). Folge-
{{}} richtig ist y ⊆ P(x) und die Potenzmenge damit ebenfalls als transitiv
Keine Ordinalzahl, 
{{}} ist nicht transitiv
identifiziert.

{{{}}} Als direkte Anwendung aus diesem Satz folgt, dass die Zermelo’sche
Keine Ordinalzahl, 
{{{}}} ist nicht transitiv
Zahlenreihe Z0 selbst eine transitive Menge ist.
... Jetzt sind wir gewappnet, den Begriff der Ordinalzahl formal zu defi-
nieren:
Abbildung 3.22: Nur die ersten beiden Ele-
mente der Zermelo’schen Zahlenreihe sind
Ordinalzahlen. Definition 3.8 (Ordinalzahl)

Eine transitive Menge x heißt Ordinalzahl, wenn alle ihre Elemente


ebenfalls transitiv sind.

Ordinalzahl 
In den folgenden Betrachtungen werden wir der gängigen Konventi-
{}
on folgen und Ordinalzahlen mit den kleinen griechischen Buchsta-
Keine Ordinalzahl,
{{}} ist nicht transitiv
 ben α, β , . . . bezeichnen. Seien Sie sich stets darüber im Klaren, dass
{{}} sich hinter Ordinalzahlen keine Zahlen im eigentlichen Sinne verber-
gen, auch wenn ihr Name dieses Missverständnis geradezu provoziert.
Definition 3.8 macht unzweifelhaft klar: Ordinalzahlen sind Mengen!
{{{}}} Keine Ordinalzahl,
{{}} und {{{}}}
Die Abbildungen 3.22 und 3.23 machen deutlich, dass lediglich die bei-
den ersten Elemente der Zermelo’schen Zahlenreihe auch Ordinalzah-
... 
sind nicht transitiv
len sind. Bevor wir uns größeren Ordinalzahlen zuwenden, wollen wir
herausarbeiten, welche Konsequenzen sich aus Definition 3.8 ergeben.
Abbildung 3.23: Obwohl alle Anfangs- Zunächst halten wir fest, dass sich die meisten Aussagen von Satz 3.4
stücke der Zermelo’schen Zahlenreihe tran-
eins zu eins auf Ordinalzahlen übertragen lassen:
sitiv sind, verletzen sie ab einer Größe von
drei Elementen die Ordinalzahldefinition.
Satz 3.5

1. Ist α eine Ordinalzahl, dann ist es auch α ∪ {α}.



2. Ist x eine Menge von Ordinalzahlen, so ist x eine Ordinalzahl.

3. Ist x eine Menge von Ordinalzahlen, so ist x eine Ordinalzahl.

 
Beweis: Die Transitivität von α ∪ {α}, x und x ergibt sich unmittel-
bar aus Satz 3.4, so dass lediglich zu zeigen bleibt, dass diese Mengen
3.2 Axiomatische Mengenlehre 179

ausschließlich Elemente enthalten, die selbst transitiv sind. Dies folgt Viele Wege führen nach
aber direkt aus der Definition der Ordinalzahl. Rom. Diese sprichwörtli-
che Weisheit ist für kaum einen anderen
Die nächsten Sätze bringen eine Reihe von charakteristischen Merkma- mathematischen Begriff so zutreffend wie
len zum Vorschein, die einen intuitiven Zugang zu den Ordinalzahlen für den Begriff der Ordinalzahl. In der Li-
gewähren. Die Beweise dieser Sätze sind sehr technischer Natur und er- teratur werden Sie eine Vielzahl von Defi-
fordern unbestritten ein gewisses Maß an Fleißarbeit. Dass wir an die- nitionen vorfinden, die von außen betrach-
tet sehr unterschiedlich wirken, schluss-
ser Stelle trotzdem so formal vorgehen, hat einen einfachen Grund. Die
endlich aber alle den gleichen Zahlenbe-
Welt der Ordinalzahlen sprengt unsere Intuition, und wir stünden ihr
griff beschreiben.
vollkommen wehrlos gegenüber, wenn wir auf eine mathematisch prä- Der hier verfolgte Ansatz, eine Ordinal-
zise Absicherung verzichten würden. Dennoch können Sie die Beweise zahl als eine transitive Menge transitiver
beim ersten Lesen gefahrlos überspringen und später zu ihnen zurück- Mengen zu definieren, geht auf eine Idee
kehren. von Kurt Gödel aus dem Jahr 1937 zu-
rück. Eine alternative Charakterisierung
stammt von Paul Bernays aus dem Jahr
Satz 3.6 (Trichotomiesatz)
1941. Dieser Definition folgend ist eine
Ordinalzahl α eine transitive Menge mit
Für zwei beliebige Ordinalzahlen α und β gilt
der Eigenschaft, dass jede transitive echte
α ∈ β oder α = β oder β ∈ α Teilmenge von α auch selbst ein Element
von α ist [11].
Andere Autoren definieren Ordinalzah-
len als transitive Mengen, die bezüglich
Beweis: Wir schreiben T(α, β ) für (α ∈ β ∨ α = β ∨ β ∈ α) und führen
der Mengeninklusion wohlgeordnet sind.
den Beweis durch Widerspruch. Nehmen wir also an, T(α, β ) sei nicht Diese Charakterisierung kommt schon nä-
für alle Ordinalzahlen α und β wahr. In diesem Fall garantiert uns das her an die ursprüngliche Definition von
Fundierungsaxiom, dass es bezüglich ‚∈‘ ein kleinstes α geben muss Georg Cantor heran, der in Ordinalzah-
(wir nennen es α0 ), für das T(α, β ) für mindestens ein β falsch ist. len spezielle Repräsentanten für Wohlord-
Jetzt können wir analog schließen, dass es ein kleinstes β geben muss nungen sah [25]. Im Cantor’schen Sin-
(wir nennen es β0 ), für das T(α0 , β ) falsch wird. Wir halten fest: ne entstehen Ordinalzahlen durch einen
Abstraktionsprozess, an dessen Ende nur
a) ¬T(α0 , β0 ) (wegen der speziellen Wahl von α0 , β0 ). noch die Ordnungsstruktur einer Menge
zurückbleibt und die konkrete Beschaf-
b) Aus α ∈ α0 folgt T(α, β0 ) (wegen der Minimalität von α0 ).
fenheit ihrer Elemente keine Rolle mehr
c) Aus β ∈ β0 folgt T(α0 , β ) (wegen der Minimalität von β0 ). spielt. Die historische Definition der Ordi-
nalzahl ist eine bedeutende, und wir wer-
Wir werden nun zeigen, dass T(α0 , β0 ) dennoch wahr sein muss, im den an späterer Stelle in diesem Kapitel
Widerspruch zu a). Wir unterscheiden drei Fälle: auf sie zurückkommen.

1. α0 = β0 . Dann ist T(α0 , β0 ) trivialerweise erfüllt.


2. Es existiert ein α ∈ α0 mit α ∈ β0 . Wegen b) gilt T(α, β0 ) und damit
β0 = α oder β0 ∈ α. In beiden Fällen folgt β0 ∈ α0 (im letzteren Fall
aufgrund der Transitivität von α0 ) und damit T(α0 , β0 ).
3. Es existiert ein β ∈ β0 mit β ∈ α0 . Wegen c) gilt T(α0 , β ) und damit
α0 = β oder α0 ∈ β . In beiden Fällen folgt α0 ∈ β0 (im letzteren Fall
aufgrund der Transitivität von β0 ) und damit T(α0 , β0 ).
180 3 Fundamente der Mathematik

Die Trichotomieeigenschaft der Ordinalzahlen ist eine wesentliche. Sie


garantiert uns, dass wir zwei beliebige Ordinalzahlen vergleichen kön-
nen, und sorgt dafür, dass Ordinalzahlen bezüglich ‚∈‘ total geordnet
sind. Im Folgenden bringen wir diese Eigenschaft auch symbolisch zum
Ausdruck:

Achten Sie darauf, niemals Definition 3.9 (Ordinalzahlordnung)


von der Menge aller Or-
dinalzahlen zu sprechen! Auf den Ordinalzahlen vereinbaren wir die folgende Ordnung:
Dass die Annahme, alle Ordinalzahlen
ließen sich zu einer Menge zusammen-
α < β :⇔ α ∈ β
fassen, zu Widersprüchen führt, hat der
italienische Mathematiker Cesare Burali-
Forti bereits im Jahr 1897 entdeckt [20]. Der nächste Satz bringt eine andere wichtige Eigenschaft von Ordinal-
Um das Burali-Forti-Paradoxon herauf- zahlen zum Vorschein. Er besagt, dass die Teilmengenbeziehung und
zubeschwören, nehmen wir für den Mo- die Elementbeziehung für Ordinalzahlen zusammenfallen.
ment an, die Menge aller Ordinalzah-
len würde tatsächlich existieren. Da die-
se Menge, wir nennen sie O, ausschließ- Satz 3.7 (Äquivalenz von ‚∈‘ und ‚⊂‘)
lich Ordinalzahlen enthält, wäre sie ei-
ne Menge von transitiven Mengen. Nach Für zwei beliebige Ordinalzahlen α und β gilt:
Satz 3.8 sind alle Elemente von Ordinal-
zahlen ebenfalls wieder Ordinalzahlen, so α ∈ β genau dann, wenn α ⊂ β
dass jedes Element aus O auch eine Teil-
menge von O wäre. Kurzum: Die Menge
aller Ordinalzahlen wäre ebenfalls transi- Beweis: Ist α ∈ β , so folgt aus der Transitivität von β die Beziehung
tiv und damit selbst eine Ordinalzahl. Es α ⊆ β . Da sich eine Menge nicht selbst enthalten kann, folgt α = β
wäre eine Zahl, für die O ∈ O gelten müs- und damit die Behauptung α ⊂ β . Sei nun α ⊂ β . Damit kann weder
ste, was nach dem Regularitätsaxiom nie-
α = β noch β ∈ α gelten (im letzteren Fall erhielten wir β ∈ β ). Nach
mals sein kann. Insgesamt erweist sich der
Satz 3.6 folgt jetzt unmittelbar α ∈ β , was zu beweisen war.
Zusammenschluss aller Ordinalzahlen als
zu groß, um als geschlossenes Ganzes zu Der nächste Satz bringt eine wichtige Abgeschlossenheitseigenschaft
existieren.
ans Licht. Ordinalzahlen bleiben unter sich!
Gemeinsam bilden die Ordinalzahlen also
keine Menge, dafür aber eine echte Klas-
se, die in der Literatur mit dem großen Satz 3.8 (Abgeschlossenheit unter ‚∈‘)
griechischen Buchstaben Omega bezeich-
net wird: Für eine beliebige Ordinalzahl β gilt:
Ω = Klasse aller Ordinalzahlen Jedes Element α ∈ β ist ebenfalls eine Ordinalzahl.
Achten Sie darauf, das Symbol Ω nicht
mit der Chaitin’schen Konstante Ω zu ver-
wechseln, die Sie in Kapitel 6 kennen ler- Beweis: Sei α ∈ β . Die Elemente von Ordinalzahlen sind allesamt tran-
nen werden. Der gleiche Buchstabe be- sitiv, und somit ist auch α eine transitive Menge. Aufgrund der Transi-
zeichnet in beiden Fällen etwas völlig an- tivität von β gilt für jedes Element x ∈ α auch x ∈ β . Jedes Element von
deres. α ist somit ebenfalls transitiv und α als Ordinalzahl identifiziert.
3.2 Axiomatische Mengenlehre 181

3.2.2.2 Der Unendlichkeit entgegen

„Moria. Du fürchtest Dich vor diesen Minen. Die Zwer-


ge haben zu gierig und zu tief geschürft. Du weißt, was
sie aufgeweckt haben in der Dunkelheit von Khazad-
dûm. Schatten. Und Flamme.“
Aus D ER H ERR DER R INGE

In diesem Abschnitt werden wir damit beginnen, Ordinalzahlen real zu


konstruieren. Die einfachste unter ihnen ist die leere Menge 0,
/ und eine
weitere Ordinalzahl mit 0 Elementen kann es nicht geben. Das Ausse-
hen von Ordinalzahlen mit einem Element liegt ebenfalls auf der Hand.
Nach dem Trichotomiesatz muss 0/ in diesen Zahlen enthalten sein, so
dass nur {0}
/ in Frage kommt. Diese Menge haben wir bereits weiter
oben als Ordinalzahl identifiziert. Ordinalzahlen mit mehreren Elemen-
ten können wir nach dem gleichen Schema konstruieren. Aufgrund der
Trichotomieeigenschaft kommen wir dabei stets zu dem Schluss, dass
sämtliche der bisher konstruierten Ordinalzahlen in der neu konstruier-
ten Menge enthalten sein müssen und somit für jedes n ∈ N eine eindeu-
tig bestimmte Ordinalzahl mit genau n Elementen existiert. Ein Blick
auf Abbildung 3.24 offenbart, dass die so konstruierten Mengen alte
Bekannte sind: Die endlichen Ordinalzahlen sind exakt die Elemente
der von Neumann’schen Zahlenreihe aus Abschnitt 3.2.1.4.

Die Konstruktion macht gleichermaßen deutlich, wie wir innerhalb der


Ordinalzahlen zählen können. Ausgehend von einer Ordinalzahl x ge-
langen wir zur nächsten, indem wir über die Bildungsvorschrift x ∪ {x}
alle davor liegenden Ordinalzahlen zu x hinzufügen. Das Weiterzählen
innerhalb der Ordinalzahl ist so wichtig, dass wir diesem Begriff eine
eigene Definition gönnen:

+1 := x ∪ {x} +1
Definition 3.10 (Ordinalzahlnachfolger) {∅}
+1
Sei α eine Ordinalzahl. Die Ordinalzahl {∅,{∅}}
s(α) := α ∪ {α} +1
{∅,{∅},{∅,{∅}}}
heißt der Nachfolger von α. +1

...

Satz 3.5 liefert uns die nötige Gewissheit, dass die Menge α ∪ {α} für Abbildung 3.24: Die systematische Kon-
jede Ordinalzahl α wiederum eine Ordinalzahl ist und wir somit immer struktion aller endlichen Ordinalzahlen
weiterzählen können. Der Übergang von α zu s(α) ist ein Spezialfall bringt die von Neumann’schen Zahlenreihe
der Ordinalzahladdition, die wie weiter unten formal einführen werden. hervor.
182 3 Fundamente der Mathematik

Im Vorgriff darauf schreiben wir aber bereits jetzt α + 1 für s(α) sowie
∅ α + 2 für s(s(α)) und so fort.
+1 := x ∪ {x} +1
{∅} Wir wollen die endlichen Ordinalzahlen nun verlassen und die erste un-

Limes-Sprung ( ∪ )
endliche Menge konstruieren, die alle Ordinalzahleigenschaften erfüllt.
+1
Den Schlüssel hierzu liefert uns Satz 3.5 frei Haus. Bilden wir, wie in
{∅,{∅}}
Abbildung 3.25 dargestellt, die Vereinigung aller endlichen Ordinalzah-
+1
len, so erreichen wir erneut eine Ordinalzahl. Es ist die berühmte Zahl
{∅,{∅},{∅,{∅}}}
+1 ω := { 0,
/ {0},
/ {0,
/ {0}},
/ {0,/ {0},
/ {0,
/ {0}}},
/ ... }
...
ω ist in mehrfacher Hinsicht von Bedeutung. Zum einen ist sie die
kleinste transfinite Ordinalzahl, d. h., die kleinste Zahl, die unendlich
viele Elemente umfasst. Zum anderen besitzt sie die besondere Eigen-
schaft, nicht der Nachfolger einer anderen Ordinalzahl zu sein. Für
ω kein α gilt s(α) = ω. Ordinalzahlen mit dieser Eigenschaft sind von
so großer Bedeutung, dass wir ihnen einen eigenen Namen verleihen:

Abbildung 3.25: Limes-Sprung. Durch die


Definition 3.11 (Grenzzahl, Limes-Ordinalzahl)
Vereinigung aller endlichen Ordinalzahlen
Eine Ordinalzahl γ heißt
erreichen wir die erste unendliche Ordinal-
zahl ω. Sie ist identisch mit der von Neu- Grenzzahl oder Limes-Ordinalzahl,
mann’schen Zahlenreihe und entspricht der
Menge N der natürlichen Zahlen. wenn sie nicht der Nachfolger einer anderen Ordinalzahl ist.

Noch in einer anderen Hinsicht ist ω von Bedeutung. Sie ist mit
der von Neumann’schen Zahlenreihe identisch, die nach dem in Ab-
schnitt 3.2.1.4 Gesagten der Menge der natürlichen Zahlen entspricht.
Demnach lässt sich ω auch in der folgenden Form notieren (Abbil-
dung 3.26):
ω = {0, 1, 2, 3, . . .}
Damit können wir nicht nur jede natürliche Zahl als Ordinalzahl auffas-
sen, sondern auch die Menge der natürlichen Zahlen selbst.

Jetzt erfolgt der entscheidende Schritt: Durch die Anwendung der Nach-
folgeroperation können wir mit

ω + 1, ω + 2, . . .
Abbildung 3.26: Visualisierung der ersten
transfiniten Ordinalzahl ω. Jeder Strich re- immer neue Ordinalzahlen bilden und über die natürlichen Zahlen hin-
präsentiert eine natürliche Zahl. Die Folge auszählen. Mit der Theorie der Ordinalzahlen haben wir es geschafft,
der Striche erstreckt sich in das Unendliche. den Horizont der natürlichen Zahlen zu durchbrechen.
3.2 Axiomatische Mengenlehre 183

Der eingeschlagene Kurs führt uns auf direktem Weg in ein Zahlenuni-
versum, das sich weit über die Grenzen der natürlichen Zahlen hinaus
erstreckt. Wie groß diese neu geschaffene Welt tatsächlich ist, wollen
wir jetzt erkunden.

Ausgehend von ω bilden wir nach dem bekannten Schema neue Ordi-
nalzahlen und erhalten

ω = {0, 1, 2, . . .}
ω + 1 = {0, 1, 2, . . . , ω}
ω + 2 = {0, 1, 2, . . . , ω, ω + 1}
... Abbildung 3.27: Visualisierung von ω + 1
ω + (n + 1) = {0, 1, 2, . . . , ω, ω + 1, ω + 2, . . . , ω + n}
...

Wie sich die so erzeugten Ordinalzahlen grafisch veranschaulichen las-


sen, demonstrieren die Abbildungen 3.27 und 3.28.
Ein erneuter Limes-Sprung führt uns auf direktem Weg zur Zahl ω + ω
in Abbildung 3.29: 
ω +ω = (ω + n)
n∈N

Dass wir die erreichte Zahl als ω + ω bezeichnen, ist zwar naheliegend,
aber noch ohne formale Grundlage. Diese wollen wir nun schaffen und
das verwendete Bildungsschema zu einem allgemeinen Schema für die
Ordinalzahladdition erweitern. Wir vereinbaren:
Abbildung 3.28: Visualisierung von ω + 2
α + 0 := α
α + s(β ) := s(α + β )

α + γ := α +β (für alle Limes-Ordinalzahlen γ)
β <γ

Damit können wir unsere Reise fortsetzen und nach noch größeren Or-
dinalzahlen trachten. Es sind dies die Zahlen ω + ω + . . . + ω, die wir
mit der naheliegenden Schreibweise ω · n abkürzen. Dies bringt die fol-
genden Ordinalzahlen hervor:

ω · 2 = {0, 1, . . . , ω, ω + 1, . . .}
ω · 3 = {0, 1, . . . , ω, ω + 1, . . . , ω · 2, ω · 2 + 1, . . .}
...
ω · (n + 1) = ω · n ∪ {ω · n, ω · n + 1, ω · n + 2, . . .}
... Abbildung 3.29: Visualisierung von ω + ω
184 3 Fundamente der Mathematik

Vollziehen wir erneut einen Limes-Sprung, so erreichen wir die Zahl



ω ·ω = (ω · n)
n∈N

Auch hier fehlt uns die formale Rechtfertigung, die erreichte Zahl als
ω · ω zu bezeichnen. Die nachstehende Definition der Ordinalzahlmul-
tiplikation schließt die entstandene Lücke:
α · 0 := 0
α · s(β ) := α · β + α

α · γ := α ·β (für alle Limes-Ordinalzahlen γ)
β <γ

Abbildung 3.30 zeigt, wie wir uns die Menge ω · ω visuell vorstellen
können. Wir erhalten eine Struktur, in der sich die natürlichen Zahlen
unendlich oft wiederholen.
Abbildung 3.30: Visualisierung von ω · ω
Wir wollen weiter an Fahrt aufnehmen und noch größeren Zahlen ent-
gegenstreben. Es sind dies die Zahlen ω · ω · . . . · ω, die wir als ω n be-
zeichnen:
ω2 = ω · ω
ω3 = ω2 · ω
ω4 = ω3 · ω
Widerstehen Sie der Versu-
chung, vertraute Rechenre- ...
geln auf die Addition und ω n+1 = ω n · ω
Multiplikation von Ordinal-
zahlen zu übertragen! Anders, als wir es ...
von den natürlichen, rationalen oder reel-
In fast schon gewohnter Weise vollziehen wir den nächsten Limes-
len Zahlen gewohnt sind, ist weder die Or-
dinalzahladdition noch die Ordinalzahl- Sprung und erhalten die unglaublich große Zahl

multiplikation kommutativ. Im Allgemei- ωω = ωn
nen gilt: n∈N
α + β = β + α, α · β = β · α Abbildung 3.31 zeigt einen Weg auf, wie wir diese Zahl immer noch
visuell erfassen können.
Eine einfache Rechnung zeigt, warum.
Beispielsweise ist ω + 1 = ω, gleichzei- Nach der Addition und der Multiplikation führen wir als dritte wichtige
tig gilt aber
Operation die Potenzierung von Ordinalzahlen ein. Nach dem bisher

1+ω = β <ω 1 + β =ω Erarbeiteten lässt sich die Definition mit Leichtigkeit aufschreiben:

Für die Ordinalzahlmultiplikation ist die α 0 := 1


Situation ähnlich. Einerseits ist ω · 2 = ω,
α s(β ) := α β · α
auf der anderen Seite ergibt sich 
 α γ := αβ (für alle Limes-Ordinalzahlen γ)
2·ω = β <ω 2 · β = ω β <γ
3.2 Axiomatische Mengenlehre 185

Abbildung 3.31: Visualisierung der Ordi-


nalzahl ω ω durch eine sich unendlich ein-
drehende Spirale [215]. Um die Struktur
zu verstehen, betrachten wir zunächst die
ersten beiden Umdrehungen:

1. Umdrehung 2. Umdrehung

Beide Strukturen haben wir bereits ken-


nen gelernt; sie sind mit jenen aus den
Abbildungen 3.26 und 3.30 identisch und
entsprechen den Ordinalzahlen ω und ω 2 .
Der weitere Aufbau ist nun klar: Jede
Umdrehung repräsentiert eine Ordinal-
zahl der Form ω n . Die dritte Umdrehung
entspricht ω 3 , die vierte ω 4 und so fort.
Indem sich die Spirale unendlich oft ein-
dreht, entspricht sie der Vereinigung aller
Ordinalzahlen ω n und damit der Zahl ω ω .

Auch wenn die bisher konstruierten Ordinalzahlen unsere Intuition be-


reits stark strapazieren, ist unsere Reise noch nicht zu Ende. Mit einem
Handstreich können wir jetzt weitere Ordinalzahlen bilden, die ω ω weit
hinter sich lassen. Es sind dies
ω
ω ωω ωω
ω ωω ωω ωω ωω
ωω ωω ωω ωω ωω ωω
ω ,ω ,ω ,ω ,ω ,ω ,...,

Vollziehen wir den nächsten Limes-Sprung, indem wir die ω-Türme zu


der Gesamtmenge

 .ω
ε0 := ωω
.. } n-mal
n∈N

vereinen, so erreichen wir eine wahrhaft riesige Zahl, die in vielerlei


Hinsicht faszinierend ist. Beispielsweise besitzt ε0 als erste Ordinalzahl
186 3 Fundamente der Mathematik

die bemerkenswerte Fixpunkteigenschaft

ω ε0 = ε0

Diese Eigenschaft ist intuitiv kaum noch greifbar. Das Rechnen mit den
natürlichen Zahlen hat uns gelehrt, dass die Potenzierung mit großen
Zahlen zu immer größeren Zahlen führt und der Größenunterschied dra-
matisch zunimmt, wenn wir den Exponenten auch nur geringfügig er-
höhen. Die Zahl ε0 setzt diese Gesetzmäßigkeit außer Kraft. In gewis-
sem Sinn ist sie so unbegreiflich groß, dass sie ihre eigenen Potenzen
einschließt. Beachten Sie, dass sich hinter dieser Einschlusseigenschaft
keine Antinomie der Russell’schen Art verbirgt. ε0 ist eine wohldefi-
nierte Menge von Ordinalzahlen und enthält sich nicht etwa selbst. Die
Elemente, die in ε0 enthalten sind, lassen sich sogar durchnummerieren.
Folgerichtig ist die Menge ε0 , so unvorstellbar groß sie auch ist, immer
noch abzählbar.

ε0 besitzt eine weitere markante Eigenschaft. Alle Zahlen zwischen ω


und ε0 lassen sich durch eine endliche Anzahl von Additionen und Po-
tenzierungen von ω aus erreichen. Konkret bedeutet dieses Ergebnis,
dass wir jede Ordinalzahl α mit 0 < α < ε0 in der Form

α = ω β0 + ω β1 + . . . + ω βn (3.4)

schreiben können, wobei β1 , . . . , βn allesamt Ordinalzahlen kleiner α


sind. Lassen wir zusätzlich konstante Faktoren zu, so können wir Glei-
chung (3.4) in die sogenannte Cantor’sche Normalform übersetzen:

Satz 3.9 (Cantor’sche Normalform)

Jede Ordinalzahl α mit 0 < α < ε0 lässt sich in der Form

α = c0 · ω β0 + c1 · ω β1 + . . . + cn · ω βn

schreiben, mit α > β0 > β1 > . . . > βn und c0 , . . . , cn ∈ N.

Verzichten wir auf die Beschränkung α > β0 > β1 > . . . > βn , so lässt
sich die Zahl ε0 ebenfalls in Cantor’scher Normalform notieren. Als
Ergebnis erhalten wir dann die Fixpunktdarstellung

ε0 = ω ε0 ,

die wir schon kennen. In diesem Fall bringt die Cantor’sche Normal-
form keine Vereinfachung mehr mit sich; insbesondere ist eine Darstel-
lung von ε0 in der Form (3.4) nicht mehr möglich. Tatsächlich ist ε0 die
kleinste Zahl, für die diese Eigenschaft verloren geht.
3.2 Axiomatische Mengenlehre 187

Cantor hatte Ordinalzahlen entsprechend ihrer Mächtigkeit zu Zahlklas-


sen zusammengefasst, auf denen er später die Kardinalzahltheorie er-
Ω
richtete. Beispielsweise fallen alle endlichen Ordinalzahlen in die ers- …
te Zahlklasse und alle abzählbar unendlichen in die zweite. ω ist die
ωωωω... , ωωωω... + 1, . . .
kleinste Ordinalzahl der zweiten Zahlklasse. Cantor bemerkte, dass die …
Addition, die Multiplikation und die Potenzierung aus der jeweiligen ωωω , ωωω + 1, . . .
Zahlklasse nicht herausführen. Endliche Mengen werden durch diese …
Operationen auf endliche Mengen abgebildet, abzählbare auf abzähl- ωω , ωω + 1, . . .
bare und so fort. Noch faszinierender ist aber, dass wir durch die An- …
wendung dieser Operationen nicht jedes Element der jeweiligen Klasse ω2 , ω2 + 1, . . .
erreichen können. Ausgehend von ω bleiben wir durch die Anwendung …
endlich vieler Additionen, Multiplikationen und Potenzierungen stets ω1 , ω1 + 1, . . .
innerhalb von ε0 . Dennoch ist leicht einzusehen, dass es jenseits von ε0 …
weitere abzählbare Ordinalzahlen geben muss. Indem wir einfach wei- εεεω , εεεω + 1, . . .
terzählen, erhalten wir mit ε0 + 1, ε0 + 2 genau solche Zahlen. …
εεε1 , εεε1 + 1, . . .
Erliegen Sie nicht der Versuchung, sich diese Zahlen bildlich vorzu- …
stellen! Bereits die Menge ε0 sprengt unsere Vorstellungskraft, und wir εεε0 , εεε0 + 1, . . .
wollen die weitere Reise daher nur noch schemenhaft skizzieren. Wie …
in Abbildung 3.32 dargestellt, existieren jenseits von ε0 eine ganze Rei- εε1 , εε1 + 1, . . .
he anderer ε-Zahlen, die ebenfalls eine Lösung der Fixpunktgleichung …
ω x = x sind. Auch diese Zahlen gehören zur zweiten Zahlklasse, d. h., εε0 , εε0 + 1, . . .

sie sind immer noch abzählbare Mengen. Es lässt sich beweisen, dass
jede εα -Zahl, deren ordinaler Index selbst abzählbar ist, wiederum eine ε ωω , εω ω + 1, . . .

abzählbare Menge ergibt.
εω 2 , εω 2 + 1, . . .
Bewegen wir uns weiter zu noch größeren Zahlen, so erreichen wir ir- …
gendwann ω1 , den kleinsten Repräsentanten der dritten Zahlklasse. Sie εω · 2 , εω · 2 + 1, . . .
entsteht aus der Vereinigung aller abzählbaren Ordinalzahlen und er- …
füllt als erste die Eigenschaft der Überabzählbarkeit. Es folgen die Zah- εω+1 , εω+1 + 1, . . .
len ω2 , ω3 , . . ., und so können wir immer weiter gehen. So unvorstellbar …
groß die Zahl ε0 auch ist, gegen die Zahlen, die uns am Horizont erwar- εω , εω + 1, . . .

ten, wirkt sie wie ein einsamer Tropfen im Ozean der Unendlichkeit.
Wir wollen unsere Vorstellungskraft nicht weiter strapazieren. Zu weit ε1 , ε1 + 1, . . .

haben uns die Ordinalzahlen bereits in ihr Reich gelockt, um das Gese-
hene auch nur im Ansatz noch intuitiv erfassen zu können. ε0 + 1, . . .

Auch in anderer Hinsicht sind unsere Kräfte am Ende. Bereits zwi- ε0


schen ε0 und ω1 können Zahlen liegen, deren Existenz in der Zermelo-
Fraenkel-Mengenlehre weder bewiesen noch widerlegt werden kann. Es
scheint, als verlieren wir jenseits von ε0 den Halt; ohne Augenlicht wan-
deln wir in einer Welt, in der wir uns der Existenz der ertasteten Dinge
nicht mehr sicher sein können. Von den bezirzenden Lockrufen der Un-
endlichkeit wollen wir uns nicht weiter verführen lassen und beenden Abbildung 3.32: Einige Ordinalzahlen jen-
an dieser Stelle unsere Reise. seits von ε0
188 3 Fundamente der Mathematik

3.2.2.3 Ordnungstypen und Wohlordnungen

In Abschnitt 3.2.2.1 haben wir herausgearbeitet, dass sich Ordinalzah-


len über die Elementrelation ‚∈‘ ordnen lassen. Konkret hatten wir die
folgende Vereinbarung getroffen:

α < β :⇔ α ∈ β

Es ist ein wichtiges Ergebnis der Ordinalzahltheorie, dass diese Defi-


nition zu einer Wohlordnung führt. Warum dies so ist, wollen wir kurz
begründen. Zunächst einmal ist die Ordnung total, da wir zwei Ordinal-
zahlen α und β aufgrund der Trichotomieeigenschaft stets vergleichen
können. Des Weiteren enthält jede nichtleere Menge von Ordinalzahlen
ein minimales Element. Dies folgt unmittelbar aus der Tatsache, dass
wir jede unendlich absteigende Kette der Form

α1 > α 2 > α 3 > α 4 . . .

in eine äquivalente Kette der Form

α1  α2  α3  α4 . . .

umschreiben können. Die Wohlordnungseigenschaft ist damit eine un-


mittelbare Konsequenz aus dem Fundierungsaxiom, das die Konstruk-
tion unendlich absteigender ∈-Ketten unterbindet.

x M1 y
In der Tat ist der Zusammenhang zwischen Wohlordnungen und Ordi-
nalzahlen noch weit größer. Dies unterstreicht der folgende Satz, den
<1 wir ohne formalen Beweis akzeptieren wollen:

f f -1
 f -1
f
Satz 3.10 (Isomorphiesatz für Ordinalzahlen)

Jede wohlgeordnete Menge ist zu genau einer Ordinalzahl ord-


nungsisomorph.
<2

f (x) M2 f (y) Zunächst müssen wir klären, was sich hinter dem Begriff der Ordnungs-
isomorphie verbirgt. Wie in Abbildung 3.33 skizziert, werden zwei Ord-
nungen (M1 , <1 ) und (M2 , <2 ) als ordnungsisomorph bezeichnet, wenn
Abbildung 3.33: Zwei Mengen M1 und M2 eine bijektive Abbildung f : M1 → M2 existiert, die ordnungserhaltend
heißen ordnungsisomorph, wenn eine bijek- ist. Von einer ordnungserhaltenden Funktion sprechen wir immer dann,
tive Abbildung existiert, die alle Elemente wenn sie die folgende Eigenschaft besitzt:
von M1 ordnungserhaltend auf M2 abbildet.
Von einer ordnungserhaltenden Abbildung x <1 y ⇔ f (x) <2 f (y) für alle x, y ∈ M1
sprechen wir immer dann, wenn aus x <1 y
die Beziehung f (x) <2 f (y) folgt und um- Demnach sind zwei Mengen genau dann ordnungsisomorph, wenn sie
gekehrt. gleichmächtig sind und ihre Elemente die gleiche Ordnungsstruktur
3.2 Axiomatische Mengenlehre 189

aufweisen. Welche Elemente in M1 und M2 konkret enthalten sind, 0, 1, 2, 3, 4, 5, 6, 7, . . .


spielt dabei keine Rolle. Über die Isomorphiefunktion f haben wir es
Abstraktion
geschafft, von der konkreten Beschaffenheit der Mengenelemente zu
abstrahieren.

Jetzt sind wir in der Lage, den Isomorphiesatz in seiner voller Breite
zu verstehen. Er besagt, dass wir zu jeder wohlgeordneten Menge ei-
ne Ordinalzahl mit der gleichen Ordnungsstruktur finden können und
diese Zahl zudem eindeutig bestimmt ist. Folgerichtig dürfen wir jede
Ordinalzahl als Repräsentant einer ganz bestimmten Wohlordnung auf-
fassen. Umgekehrt können wir jeder Menge M einen Ordnungstyp in
Form einer eindeutig festgelegten Ordinalzahl zuordnen. Dieser Ord-
nungstyp ist „der Allgemeinbegriff, welcher sich aus M ergibt, wenn Abbildung 3.34: Wohlordnung der natür-
unter Festhaltung der Rangordnung ihrer Elemente von der Beschaffen- lichen Zahlen mit dem Ordnungstyp ω
heit der letzteren abstrahiert wird“. Den letzten Satz habe ich nicht mit
meinen eigenen Worten beendet. Es sind die Worte von Georg Cantor, 1, 2, 3, 4, 5, 6, 7, . . . , 0
entnommen aus dem Eingangszitat von Abschnitt 3.2.2. Die ursprüng-
liche Vorstellung, die Cantor mit den Ordinalzahlen verband, tritt nun Abstraktion
klar hervor. Cantor fand den Zugang zu den Ordinalzahlen nicht wie wir
über den Begriff der transitiven Menge. Es waren seine akribisch durch-
geführten Studien über das Wesen von Ordnungen und Wohlordnungen,
die ihn diese wahrhaft faszinierende Welt riesiger Zahlen entdecken lie-
ßen.

Beispiele

Wir wollen nun für verschiedene Wohlordnungen der natürlichen Zah-


Abbildung 3.35: Wohlordnung der natür-
len herausarbeiten, mit welchen Ordinalzahlen ihre Ordnungstypen be- lichen Zahlen mit dem Ordnungstyp ω + 1
schrieben werden können.
0, 2, 4, 6, . . . , 1, 3, 5, 7, . . .
I Beispiel 1 (Abbildung 3.34)
In diesem Beispiel sind die Elemente von N in ihrer natürlichen Rei- Abstraktion
henfolge belassen. Der Ordnungstyp dieser Zahlenreihe ist uns be-
reits bekannt; er wird durch die kleinste transfinite Ordinalzahl ω
beschrieben.
Wir können die natürlichen Zahlen auf verschiedene Weise umsor-
tieren, ohne die Wohlordnungseigenschaft zu verlieren. Die nächsten
Beispiele zeigen, auf welche Weise dies gelingen kann.
I Beispiel 2 (Abbildung 3.35)
Per Definition ist die Zahl 0 ist in dieser Anordnung größer als alle
anderen natürlichen Zahlen und taucht daher nicht am Anfang, son- Abbildung 3.36: Wohlordnung der natür-
dern am Ende der Zahlenreihe auf. Alle anderen natürlichen Zahlen lichen Zahlen mit dem Ordnungstyp ω · 2
190 3 Fundamente der Mathematik

0, 1, 2, 4, . . . , 3, 9, 15, . . . , 5, 25, 35, . . . behalten ihre übliche Position. Nach dem Ordnungstyp dieser An-
ordnung müssen wir nicht lange suchen. Er wird durch ω + 1, den
direkten Nachfolger von ω, beschrieben.
Abstraktion

I Beispiel 3 (Abbildung 3.36)


Hier sind die natürlichen Zahlen in zwei Folgen aufgeteilt. Die erste
umfasst alle geraden, die zweite alle ungeraden Zahlen. Jede Teil-
menge besitzt ein minimales Element, so dass wir immer noch eine
Wohlordnung vor uns haben. Erneut finden wir in den Reihen der
Ordinalzahlen einen eindeutigen Vertreter, der exakt diese Anord-
nung der Elemente aufweist: Es ist die Ordinalzahl ω + ω oder, in
anderer Schreibweise, die Ordinalzahl ω · 2.

I Beispiel 4 (Abbildung 3.37)


Die Anordnung basiert auf der Idee, die natürlichen Zahlen als Viel-
fache von Primzahlen aufzuzählen. Auf die Zahlen 0 und 1 folgen
Abbildung 3.37: Wohlordnung der natür- zunächst alle Vielfache der Primzahl 2, danach alle Vielfache der
lichen Zahlen mit dem Ordnungstyp ω · ω Primzahl 3 und so fort. Um Doppelnennungen zu vermeiden, wird
jede Zahl nur einmal aufgeführt. Mit diesem Vorgehen haben wir
es geschafft, die natürlichen Zahlen in unendlich viele Folgen mit
0, 1, 2, 4, 8, 16, 32, . . . , jeweils unendlich vielen Elementen zu zerlegen. Den zugehörigen
3, 9, 27, . . . , 6, 18, 54, . . . , 12, 36, 108, . . . , Ordnungstyp kennen wir ebenfalls schon: Er wird durch die Ordi-
5, 25, . . . , 10, 50, . . . , 20, 100, . . . , nalzahl ω · ω = ω 2 beschrieben.
15, 75, . . . , 45, 225, . . . , 135, 675, . . . ,
30, 150, . . . , 90, 450, . . . , 270, 1350, . . . , I Beispiel 5 (Abbildung 3.38)
60, 300, . . . , 180, 900, . . . , 540, 2700, . . .
Wie im vorigen Beispiel beginnen wir mit der Zahl 0. Der Rest der
Anordnung basiert auf der Idee, die Position einer natürlichen Zahl
Abstraktion aus ihrer Primfaktorzerlegung abzuleiten. Auf die 0 lassen wir zu-
nächst alle Zweierpotenzen der Form 2n (n ≥ 0) folgen:

1, 2, 22 , 23 , 24 , 25 , . . . (3.5)

Die Aufzählung setzen wir jetzt fort, indem wir diese Elemente
nacheinander mit allen Dreierpotenzen der Form 3n (n ≥ 1) multi-
plizieren. Auf diese Weise erhalten wir die Zahlen

3, 32 , 33 , . . . , 2 · 3, 2 · 32 , 2 · 33 , . . . , 22 · 3, 22 · 32 , 22 · 33 , . . .

Beachten Sie, dass aus jedem Element des Anfangsstücks (3.5) eine
eigene Folge mit unendlich vielen Elementen geworden ist.
Im nächsten Schritt schreiben wir die Zahlenreihe fort, indem wir
Abbildung 3.38: Wohlordnung der natür- die bisher erzeugten Elemente mit allen Fünferpotenzen der Form
lichen Zahlen mit dem Ordnungstyp ω ω 5n (n ≥ 1) multiplizieren:
3.2 Axiomatische Mengenlehre 191

5, 52 , . . . , 2 · 5, 2 · 52 , . . . , 22 · 5, 22 · 52 , . . . ,
3 · 5, 3 · 52 , . . . , 32 · 5, 32 · 52 , . . . , 33 · 5, 33 · 52 , . . . ,
2 · 3 · 5, 2 · 3 · 52 , . . . , 2 · 32 · 5, 2 · 32 · 52 , . . . , 2 · 33 · 5, 2 · 33 · 52 , . . . ,
22 · 3 · 5, 22 · 3 · 52 , . . . , 22 · 32 · 5, 22 · 32 · 52 , . . . , 22 · 33 · 5, 22 · 33 · 52 , . . . ,

Bisher haben wir nur diejenigen Zahlen erfasst, die neben 2, 3 und 5
keine weiteren Primfaktoren besitzen. Fahren wir nach diesem Sche-
ma fort und multiplizieren das erzeugte Anfangsstück mit immer
neuen Primzahlpotenzen, so erreichen wir irgendwann jede natür-
liche Zahl. Die so erzeugte Anordnung ist eine abenteuerliche Kon-
struktion aus Reihen und Unterreihen, die sich immer weiter ver-
zweigen. Dennoch ist uns auch diese Ordnungsstruktur bereits be-
kannt. Es ist die Struktur aus Abbildung 3.31, repräsentiert durch
die Ordnungszahl ω ω .

3.2.2.4 Transfinite Induktion


ϕ ¬ϕ ϕ ¬ϕ ¬ϕ
In diesem Abschnitt wollen wir das Beweisprinzip der vollständigen
M = { , , , , }
Induktion auf beliebige wohlgeordnete Mengen verallgemeinern. Die
angestellten Überlegungen werden uns auf direktem Weg zur transfini-
ten Induktion führen, mit der sich viele Aussagen über wohlgeordnete Aussonderungsaxiom
M  := {x ∈ M | ¬ϕ(x)}
Mengen elegant beweisen lassen.
Zunächst wollen wir rekapitulieren, was wir unter dem Prinzip der voll- ¬ϕ ¬ϕ ¬ϕ
ständigen Induktion zu verstehen haben. Eingeführt haben wir es in Ab-
schnitt 3.1 in Form des Induktionsaxioms: M = { , , , , }

ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x)) (3.6) Wohlordnungsprinzip


M  hat ein minimales Element.
Das Prinzip der vollständigen Induktion ist immer dann anwendbar,
wenn eine parametrisierte Aussage ϕ(x) für alle natürlichen Zahlen
¬ϕ ¬ϕ ¬ϕ
x ∈ N bewiesen werden soll. In diesem Fall reicht der Beweis, dass
die Aussage für x = 0 wahr ist und sich deren Gültigkeit von einem M = { , , , , }
beliebigen x ∈ N auf dessen Nachfolger vererbt.

Mitunter wird das Prinzip der vollständigen Induktion in einer alterna- „Existiert ein x mit ¬ϕ(x), so gibt es ein
tiven Formulierung verwendet, die wir jetzt herleiten wollen. Sie folgt kleinstes x mit ¬ϕ(x).“
unmittelbar aus dem Minimalitätsprinzip, das in seiner umgangssprach-
lichen Formulierung folgendermaßen lautet:
Abbildung 3.39: In jeder wohlgeordneten
„Existiert ein x mit ¬ϕ(x), so gibt es ein kleinstes x mit ¬ϕ(x).“ Menge M gilt das Minimalitätsprinzip. Es
besagt, dass wir in M zu jeder Eigenschaft
In formaler Schreibweise liest sich das Minimalitätsprinzip wie folgt: ϕ immer ein kleinstes Gegenbeispiel finden
können, sofern in dieser Menge überhaupt
∃ x ¬ϕ(x) → ∃ x (¬ϕ(x) ∧ ∀ (y < x) ϕ(y)) eines existiert.
192 3 Fundamente der Mathematik

Wir wollen uns an dieser Drehen wir die Schlussrichtung um, indem wir die linke und die rechte
Stelle einen Moment Zeit Seite der Implikation negieren, so entsteht eine äquivalente Aussage der
nehmen und einen zweiten folgenden Gestalt:
Blick auf die Formel (3.7)
werfen. Zunächst sieht es so aus, als sei ∀ x (ϕ(x) ∨ ¬∀ (y < x) ϕ(y)) → ∀ x ϕ(x)
in der alternativen Formulierung der voll-
ständigen Induktion der Induktionsanfang Bringen wir den Ausdruck jetzt noch in die Implikationsform, so sind
abhanden gekommen. Dass dem nicht so wir am Ziel:
ist, lässt sich leicht einsehen. Hierzu lösen
wir den Allquantor auf und betrachten die ∀ x (∀ (y < x) ϕ(y) → ϕ(x)) → ∀ x ϕ(x) (3.7)
linke Seite der Formel (3.7) für den Fall
x = 0: Dies ist die zweite Variante, in der die vollständige Induktion gern ver-
∀ (y < 0) ϕ(y) → ϕ(0) wendet wird. Um eine Aussage ϕ(x) für alle x ∈ N zu beweisen, nehmen
wir für ein beliebiges x an, ϕ(y) sei für alle y < x wahr. Ist unter die-
Da keine natürliche Zahl kleiner als 0 ser Annahme auch ϕ(x) eine wahre Aussage, so ist ϕ(x) für alle x ∈ N
existiert, ist die Unterformel bewiesen.
∀ (y < 0) ϕ(y) Unbestritten ist die vollständige Induktion ein starkes Beweismittel.
Umso verblüffender ist es, dass wir sie durch die simple Tatsache le-
immer wahr, und wir können die linke
gitimieren konnten, dass innerhalb der natürlichen Zahlen immer ein
Seite von Formel (3.7) folgendermaßen
kleinstes Gegenbeispiel existiert, sofern es überhaupt eines gibt. Diese
vereinfachen:
Eigenschaft gilt aber nicht nur für die natürlichen Zahlen, sondern für
ϕ(0) jede wohlgeordnete Menge (Abbildung 3.39).
Der Induktionsanfang ist also keineswegs Damit sind wir bereit, das Prinzip der transfiniten Induktion für wohl-
verschwunden, sondern als Spezialfall in geordnete Mengen auszusprechen:
der Induktionsformel versteckt.

Satz 3.11 (Transfinite Induktion für wohlgeordnete Mengen)

Für jede wohlgeordnete Menge (ξ , <) und jede Formel ϕ(ν) gilt

∀ (x ∈ ξ ) (∀ (y ∈ ξ ∧ y < x) ϕ(y) → ϕ(x)) → ∀ (x ∈ ξ ) ϕ(x)

Sehr häufig wird das Prinzip der transfiniten Induktion verwendet, um


Eigenschaften von Ordinalzahlen zu beweisen. Die Formel in Satz 3.11
wird dann zu

∀ α (∀ (β < α) ϕ(β ) → ϕ(α)) → ∀ α ϕ(α) (3.8)

Wir können noch einen Schritt weitergehen und die Ordinalzahl α einer
Fallunterscheidung unterziehen:

I α = 0.
I α ist der Nachfolger einer anderen Ordinalzahl.
3.2 Axiomatische Mengenlehre 193

ϕ(0) ∀ α (ϕ(α) → ϕ(α + 1)) ∀ γ (∀ (β < γ) ϕ(β ) → ϕ(γ))

Abbildung 3.40: Ein transfiniter Induktionsbeweis besteht aus drei Teilen. Im Induktionsanfang wird der Beweis verankert.
Danach wird gezeigt, dass sich die Gültigkeit von ϕ auf alle direkten Nachfolger und alle Limes-Ordinalzahlen vererbt.

I α ist eine Limes-Ordinalzahl.

Damit können wir aus Formel (3.8) eine Form herleiten, wie wir sie in
vielen Büchern unter dem Stichwort „Transfinite Induktion“ nachschla-
gen können:
⎛ ⎞
ϕ(0) ∧
⎝ ∀ α (ϕ(α) → ϕ(α + 1)) ∧ ⎠ → ∀ α ϕ(α)
∀ γ (∀ (β < γ) ϕ(β ) → ϕ(γ))

In dieser Formel ist der Ausdruck ∀ γ als bedingter Quantor zu ver-


stehen, der ausschließlich über Limes-Ordinalzahlen quantifiziert. Um
eine Eigenschaften von Ordinalzahlen zu beweisen, reicht es demnach
aus, die in Abbildung 3.40 skizzierten Einzelaussagen zu verifizieren.
Konkret handelt es sich dabei um die folgenden drei Beweisschritte:

I Induktionsanfang
ϕ(0)

I 1. Induktionsschritt: Vererbung auf den Ordinalzahlnachfolger


∀ α (ϕ(α) → ϕ(α + 1))

I 2. Induktionsschritt: Vererbung auf die nächste Limes-Ordinalzahl


∀ γ (∀ (β < γ) ϕ(β ) → ϕ(γ))

Gelingt der Beweis für alle drei, so garantiert uns das Prinzip der trans-
finiten Induktion, dass ϕ für alle Ordinalzahlen wahr sein muss.
194 3 Fundamente der Mathematik

Für Cantor waren Ordinal- 3.2.3 Kardinalzahlen


und Kardinalzahlen zwei
verschiedene Paar Schuhe. „‚Mächtigkeit‘ oder ‚Kardinalzahl‘ von M nennen wir
Welche begriffliche Tren-
den Allgemeinbegriff, welcher mithilfe unseres aktiven
nung er zwischen beiden Begriffen vor-
nahm, zeigt ein vergleichender Blick auf
Denkvermögens dadurch aus der Menge M hervorgeht,
die Eingangszitate der Abschnitte 3.2.2 dass von der Beschaffenheit ihrer verschiedenen Ele-
und 3.2.3. Ordinalzahlen waren für Can- mente m und von der Ordnung ihres Gegebenseins ab-
tor das Ergebnis einer Abstraktion, in der strahiert wird. Das Resultat dieses zweifachen Abstrak-
die konkrete Beschaffenheit der Elemen- tionsakts, die Kardinalzahl oder Mächtigkeit von M, be-
te einer Menge keine Rolle mehr spielt, zeichnen wir mit M.“
wohl aber die Ordnung, in der sie zueinan- Georg Cantor, 1895 [24]
der stehen. Mit der Theorie der Kardinal-
zahlen vollzog er eine zweite Abstraktion,
in der Mengen weder durch die Beschaf- Nachdem wir uns ausführlich mit den Ordinalzahlen auseinandergesetzt
fenheit ihrer Elemente noch durch de- haben, wollen wir in diesem Abschnitt einen Blick auf die verwandten
ren Ordnung unterschieden werden (Ab- Kardinalzahlen werfen. Ganz fremd sind uns diese Zahlen nicht. Bereits
bildung 3.41). in Kapitel 1 haben wir sie ausgiebig dazu verwendet, die Mächtigkeit
Auch wenn es der menschlichen Intuition
von Mengen zu beschreiben. Für endliche Mengen war dies einfach;
entgegenkommt, Ordinalzahlen und Kar-
dinalzahlen als Beschreibungen von Men-
hier haben wir die Mächtigkeit einer Menge ganz einfach mit der An-
gen auf verschiedenen Abstraktionsebe- zahl ihrer Elemente gleichgesetzt. Für unendliche Mengen hatten wir
nen zu sehen, ist diese Trennung nicht dagegen auf das Cantor’sche Begriffsinstrumentarium zurückgegriffen.
notwendig. Aus diesem Grund verzich- Nach ihm wird die kleinste Unendlichkeit mit der Kardinalzahl ℵ0 be-
tet die moderne Mengenlehre gänzlich auf zeichnet, die nächst größere mit ℵ1 und so fort.
diese Unterscheidung und führt den Be-
griff der Kardinalzahl direkt auf den Be- Zugegebenermaßen haben wir den Begriff der Kardinalzahl bisher nur
griff der Ordinalzahl zurück. Als Denk- informell verwendet. Dies wollen wir nun ändern und ihn formal ze-
stütze ist die Cantor’sche Vorstellung den- mentieren. Wie die folgende Definition zeigt, können wir die Kardinal-
noch wertvoll. Verglichen mit der forma- zahlen ganz einfach auf die uns mittlerweile wohlvertrauten Ordinal-
len Formulierung in Definition 3.12 schält zahlen zurückführen:
sie klarer heraus, welche Grundgedanken
sich hinter den Ordinal- und den Kardinal-
zahlen wirklich verbergen. Definition 3.12 (Kardinalzahl)

Eine Ordinalzahl α heißt Kardinalzahl, wenn

aus β < α stets |β | < |α| folgt.

Die Definition macht unmissverständlich deutlich, dass Kardinalzah-


len nichts anderes als besondere Ordinalzahlen sind. Ganz konkret sind
es genau jene Ordinalzahlen, die bezüglich ihrer Mächtigkeit minimal
sind; d. h., wir können zu einer Kardinalzahl niemals eine kleinere Or-
dinalzahl mit der gleichen Mächtigkeit finden. Im Folgenden halten wir
uns an die Konvention, Kardinalzahlen mit den kleinen griechischen
Buchstaben κ, λ oder μ zu bezeichnen.
3.2 Axiomatische Mengenlehre 195

Beachten Sie, dass für zwei endliche Ordinalzahlen α und β die Bezie- 0, 1, 2, 3, 4, 5, 6, . . .
hungen β < α und |β | < |α| äquivalent sind. Solange wir den vertrauten
Erste Ordinaler
Boden des Endlichen nicht verlassen, ist also jede Ordinalzahl auch eine
Abstraktion Typ: ω
Kardinalzahl. Im Unendlichen müssen wir mehr Vorsicht walten lassen.
Zunächst gilt, dass die kleinste unendliche Kardinalzahl ℵ0 der klein-
sten unendlichen Ordinalzahl entspricht; d. h., es gilt die Gleichung:
ℵ0 = ω
Auch wenn sich ab jetzt die Wege trennen, bleiben große strukturelle
Gemeinsamkeiten zwischen den beiden Zahlenwelten bestehen. So er-
streckt sich die Aleph-Reihe ebenfalls in das Unendliche hinein und hat
eine ähnliche Struktur wie die Ordinalzahlen selbst. Konkret existiert Zweite Kardinaler
für jede Ordinalzahl α auch eine Kardinalzahl ℵα . Daraus folgt sofort, Abstraktion Typ: ω
dass auch die Kardinalzahlen eine echte Klasse bilden.

Genau wie im Fall der Ordinalzahlen können wir uns zu immer größe-
ren Kardinalzahlen vorarbeiten, allerdings preschen wir jetzt mit noch
schwindelerregenderer Geschwindigkeit voran. Erinnern Sie sich an die
astronomisch große Zahl ω1 , die kleinste überabzählbare Ordinalzahl?
Auf der unendlichen Aleph-Skala ist ω1 nicht weit entfernt; sie er-
scheint bereits an zweiter Stelle! Danach folgt unmittelbar die Ordi-
nalzahl ω2 und so fort.
Zweite Kardinaler
Die formale Definition der Kardinalzahl versetzt uns in die Lage, die Abstraktion Typ: ω
Symbolik |M| auch für unendliche Mengen präzise zu erfassen. Bisher
haben wir die Schreibweise |M| hauptsächlich in Vergleichen der Form
|M| = |N| verwendet und damit ausgedrückt, dass eine bijektive Abbil-
dung zwischen den Mengen M und N existiert. Ohne das Gleichheits-
zeichen hatte die Schreibweise |M| aber noch keine präzise Bedeutung.
Dies wollen wir nun ändern und die Symbolik |M| über den Begriff der
Kardinalzahl formal definieren:

Erste Ordinaler
Definition 3.13 (Kardinalität, Mächtigkeit) Abstraktion Typ: ω + ω
Sei M eine beliebige Menge. Diejenige Kardinalzahl κ, die sich
0, 2, 4, . . . , 1, 3, 5, . . .
bijektiv auf M abbilden lässt, heißt die Kardinalität oder die Mäch-
tigkeit von M, geschrieben als |M|. Abbildung 3.41: Ordinalzahlen abstrahie-
ren von der Beschaffenheit der Elemente ei-
ner Menge. Kardinalzahlen vollziehen ei-
Damit ist die Bringschuld beglichen, die wir uns mit der informellen ne zweite Abstraktion, in der die Ordnung
Verwendung von |M| und den Aleph-Zahlen in Kapitel 1 aufgebür- der Elemente ebenfalls keine Rolle mehr
det haben. Mit Definition 3.13 im Blick ist die vormals symbolische spielt. In diesem Beispiel sind zwei Ord-
Schreibweise |M| = ℵn jetzt zu einer echten Gleichung geworden, einer nungen der natürlichen Zahlen dargestellt,
Gleichung, auf deren linker und rechter Seite präzise definierte Mengen die unterschiedliche ordinale Typen, aber
stehen. den gleichen kardinalen Typ besitzen.
196 3 Fundamente der Mathematik

3.3 Übungsaufgaben

Aufgabe 3.1 Formalisieren Sie die folgenden Aussagen innerhalb der Peano-Arithmetik:

Webcode a) „Es gibt natürliche Zahlen x, y mit x2 + y2 = 9.“
3667
b) „x3 + y3 = z3 hat keine Lösung in den positiven natürlichen Zahlen.“
c) „x ist eine Zweierpotenz.“

Aufgabe 3.2 Welche der folgenden Formeln entspricht der Aussage „7 ist eine Primzahl“?

Webcode a) ∀ z (z | 7 → (z = 1 ∨ z = 7))
3195
b) ¬∃ (y > 1) ∃ (z > 1) 7 = y × z

Welche der folgenden Formeln entspricht der Aussage „x ist eine Primzahl“?

c) ∀ z ((z | x) → (z = 1 ∨ z = x))
d) ¬∃ (y > 1) ∃ (z > 1) x = y × z

Aufgabe 3.3 Formalisieren Sie die folgenden Aussagen mithilfe der Peano-Arithmetik:

Webcode a) „Jede gerade natürliche Zahl n > 2 lässt sich als Summe zweier Primzahlen schreiben.“
3367
b) „Für unendlich viele Zahlen n ist sowohl n als auch n + 2 eine Primzahl.“

Beide Aussagen sind alte Bekannte aus Kapitel 1. Die erste ist die berühmte Goldbach’sche
Vermutung, die zweite die Vermutung über die Existenz unendlich vieler Primzahlzwillinge.

Aufgabe 3.4 In manchen Büchern wird das Induktionsaxiom



Webcode ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x))
3734 in der geringfügig abweichenden Form

(ϕ(0) ∧ ∀ x (ϕ(x) → ϕ(s(x)))) → ∀ x ϕ(x)

eingeführt. Zeigen Sie, dass beide Definitionen äquivalent sind.


3.3 Übungsaufgaben 197

An erster Stelle der ZF-Axiomenliste haben wir das Axiom der Bestimmtheit eingeführt. In Aufgabe 3.5
formaler Schreibweise lautete es wie folgt: 
Webcode
∀ x ∀ y (x = y ↔ ∀ z (z ∈ x ↔ z ∈ y)) 3212

Nehmen Sie an, wir würden das Gleichheitszeichen aus der Sprache entfernen und das Be-
stimmtheitsaxiom nicht als Axiom sondern als Definition des Gleichheitszeichens auffassen.
Dies bedeutet, dass wir das Gleichheitszeichen nicht mehr länger als natives Sprachelement,
sondern nur noch als syntaktische Abkürzung behandeln dürfen. Können wir in der so modi-
fizierten Mengenlehre immer noch die gleichen Theoreme ableiten?

An vierter Stelle der ZF-Axiomenliste haben wir das Axiom der Vereinigung eingeführt: Aufgabe 3.6

∀ x ∃ y ∀ z (z ∈ y ↔ ∃ (w ∈ x) z ∈ w) Webcode
3700
Unter anderem garantiert es uns, dass für zwei Mengen x und y die Vereinigungsmenge x ∪ y
existiert. Im Zusammenhang mit diesem Axiom haben wir auch die Schreibweise x ∩ y als
syntaktische Abkürzung für die Schnittmenge eingeführt. Ist die Existenz der Schnittmen-
ge ebenfalls durch das Vereinigungsaxiom abgesichert? Falls nein, welche Axiome werden
hierzu benötigt?

Ein unentbehrlicher Bestandteil der ZF-Mengenlehre ist das Fundierungsaxiom. Es besagt, Aufgabe 3.7
dass wir in jeder nichtleeren Menge x ein Element y finden können, das mit x keine Elemente 
gemeinsam hat. Webcode
3866
a) Welche Bedeutung besitzt das Axiom für die ZF-Mengenlehre?

b) Ist das Fundierungsaxiom mit der Russell’schen Typentheorie verträglich?

In Abschnitt 3.2.1.3 haben wir gezeigt, dass sich der Begriff des geordneten Paares durch die Aufgabe 3.8
Definition 
!ξ , ν" := { {ξ }, {ξ , ν} } Webcode
3115
auf den Begriff der Menge reduzieren lässt. Die gezeigte Möglichkeit ist nur eine von vielen.
Beispielsweise können wir geordnete Paare nach einem Vorschlag von Norbert Wiener aus
dem Jahr 1914 auch so darstellen [141, 213, 214]:

!ξ , ν" := { {0,
/ {ξ }}, {{ν}} }
198 3 Fundamente der Mathematik

a) Durch welche der folgenden Mengendiagramme werden die in diesem Kapitel diskutier-
ten Definitionen des geordneten Paares visualisiert?

b) Nach welchem Konstruktionsmuster bildet das verbleibende Diagramm den Begriff des
geordneten Paares ab? Ist es für die Darstellung geordneter Paare überhaupt geeignet?

Aufgabe 3.9 In Abschnitt 3.2.1.2 haben wir herausgearbeitet, dass die Relation ‚<‘ keine Wohlordnung
 auf der Menge Z der ganzen Zahlen ist.
Webcode
3060 Definieren Sie die Ordnungsrelation ‚<‘ so um, dass Z zu einer wohlgeordneten Menge wird.

Aufgabe 3.10 Das kartesische Produkt zweier Mengen ν und μ ist in der Mathematik wie folgt definiert:

Webcode
3463 ν × μ := {!x, y" | x ∈ ν ∧ y ∈ μ}

a) Formalisieren Sie das kartesische Produkt im System der ZF-Mengenlehre. Geben Sie
hierzu eine Formel K(ξ , ν, μ) an, die genau dann wahr ist, wenn ξ , ν, μ die Beziehung
ξ = ν × μ erfüllen.

b) Geben Sie eine Formel R(ξ , ν) an, die genau dann wahr ist, wenn ξ eine Relation über
der Menge ν ist. Führen Sie Ihre Definition auf die Formel K(ξ , ν, μ) aus Teilaufgabe a)
zurück.

c) Auf Seite 168 haben Sie die Formel R(ξ ) kennen gelernt, die genau dann wahr ist, wenn
ξ eine Relation über einer beliebigen Menge ist. Versuchen Sie, für R(ξ ) eine alternative
Definition zu finden, die den Begriff der Relation auf das kartesische Produkt zurückführt.

d) Aufbauend auf dem Relationenbegriff haben wir herausgearbeitet, wie sich der Begriff
der partiellen Funktion innerhalb der Zermelo-Fraenkel-Mengenlehre beschreiben lässt.
Lassen sich die Begriffe der totalen, der injektiven und der surjektiven Funktion auf die
gleiche Weise formalisieren?
3.3 Übungsaufgaben 199

In dieser Übungsaufgabe greifen wir den formalen Beweis von Satz 3.3 auf, den Beweis über Aufgabe 3.11
die Komponentengleichheit geordneter Paare. 
Webcode
a) Werfen Sie einen Blick auf die Beweisschritte in den Zeilen 59 – 64. War es wirklich 3567
nötig, die Aussage x = y = u = v vollständig zu beweisen?
b) Am Ende des umgangssprachlich formulierten Originalbeweises werden zwei Fälle un-
terschieden. Zunächst wird der Fall v = u betrachtet, danach der Fall v = u. Hätten wir im
formalen ZF-Beweis auf die Durchführung dieser Fallunterscheidung verzichten können?

Welche der folgenden Mengen sind transitiv? Welche sind Ordinalzahlen? Welche sind Aufgabe 3.12
Kardinalzahlen? 
Webcode
a) 0/ c) { {0},
/ {{0}}
/ } e) { 0,
/ {0},
/ {{0}}
/ } 3234
b) { 0/ } d) { 0,
/ {{0}}
/ } f) { 0,
/ {0},
/ {0,
/ {0}}
/ }

Beweisen oder widerlegen Sie die folgenden Behauptungen: Aufgabe 3.13



a) Ist x eine Ordinalzahl, dann ist es auch P(x). Webcode
3196
b) Die Ordinalzahladdition ist kommutativ, d. h., es gilt α + β = β + α.
c) Die Ordinalzahlmultiplikation ist kommutativ, d. h., es gilt α · β = β · α.

Welche der folgenden Aussagen sind jeweils äquivalent zueinander? Aufgabe 3.14

a) X ist leer g) |X| = 0/ m) |X| ∈ ℵ0 Webcode
3034
b) X ist endlich h) |X| = ℵ0 n) |X| ⊆ ℵ0
c) X ist höchstens abzählbar i) |X| < ℵ0 o) |X| ⊂ ℵ0
d) X ist abzählbar j) |X| > ℵ0 p) ℵ0 ∈ |X|
e) X ist unendlich k) |X| ≤ ℵ0 q) ℵ0 ⊆ |X|
f) X ist überabzählbar l) |X| ≥ ℵ0 r) ℵ0 ⊂ |X|
4 Beweistheorie

„Man kann – unter Voraussetzung der Widerspruchs-


freiheit der klassischen Mathematik – sogar Beispie-
le für Sätze (und zwar solche von der Art des Gold-
bach’schen oder Fermat’schen) angeben, die zwar in- Im Zusammenhang mit Gö-
haltlich richtig, aber im formalen System der klassi- dels Unvollständigkeitssät-
schen Mathematik unbeweisbar sind.“ zen werden wir immer wie-
der von formalen Systemen
reden, die stark genug sind, um die Peano-
Kurt Gödel [177] Arithmetik zu formalisieren. Was genau
ist damit gemeint? In seiner Originalar-
beit hat Gödel den Unvollständigkeitssatz
In diesem Kapitel werden wir uns ausführlich mit der Beweistheorie,
für ein spezielles formales System bewie-
einer der tragenden Säulen der mathematischen Logik, beschäftigen. In
sen, das er kurzerhand als P bezeichnete.
ihrem Kern steht der Gedanke, Beweise als mathematische Objekte zu In seinen eigenen Worten ist P „im we-
interpretieren und auf diese Weise einer präzisen Analyse zugänglich zu sentlichen das System, welches man er-
machen. Zur vollen Blüte ist die Beweistheorie in der ersten Hälfte des hält, wenn man die Peano’schen Axiome
zwanzigsten Jahrhundert gereift. Sie hat verblüffende Erkenntnisse her- mit der Logik der PM [Principia Mathe-
vorgebracht, die einen tiefen Einblick in das Wesen des mathematischen matica] überbaut“ [69]. Weiter hinten in
Schließens gewähren und uns zugleich die Grenzen der Mathematik in seiner Arbeit führt er aus, dass sein Er-
aller Klarheit vor Augen führen. Um welche Erkenntnisse es sich hier- gebnis keinesfalls auf P beschränkt ist,
bei im Detail handelt, ist Gegenstand dieses Kapitels. sondern alle formalen Systeme erfasst,
die ausdrucksstark genug sind, um über
In den Abschnitten 4.1 bis 4.4 werden wir ausführlich die Gödel’schen die additiven und multiplikativen Eigen-
Unvollständigkeitssätze diskutieren. Anschließend werden wir heraus- schaften der natürlichen Zahlen zu spre-
arbeiten, wie allgegenwärtig das Phänomen der Unvollständigkeit wirk- chen. Neben der Peano-Arithmetik fal-
len hierunter auch alle Theorien, in denen
lich ist. Die in Abschnitt 4.5 vorgestellte Goodstein-Folge wird verdeut-
sich die natürlichen Zahlen in Form an-
lichen, dass selbst harmlos wirkende Aussagen der gewöhnlichen Ma- derer Objekte repräsentieren lassen. Mit
thematik betroffen sind. der Zermelo-Fraenkel-Mengenlehre ha-
ben wir eine solche Theorie bereits ken-
nen gelernt. Obwohl die natürlichen Zah-
4.1 Gödel’sche Unvollständigkeitssätze len in ZF und ZFC nicht als eigenstän-
dige Objekte existieren, lassen sie sich
in Form spezieller Mengen repräsentieren
Die Gödel’schen Unvollständigkeitssätze sind das Herzstück der mo- und die Addition und Multiplikation auf
dernen Beweistheorie. Ihre Inhalte sind düster, und dennoch werfen sie entsprechende Mengenoperationen abbil-
ein so helles Licht auf das Wesen der mathematischen Methode, dass den. Dies ist gemeint, wenn wir sagen, ein
sie seit ihrer Entdeckung im Jahr 1931 unzählige Mathematiker und formales System sei stark genug, um die
Naturwissenschaftler in ihren Bann ziehen konnten. Ich selbst las von Peano-Arithmetik zu formalisieren.

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6_4
202 4 Beweistheorie

ihnen das erste Mal in Douglas Hofstadters Meisterwerk Gödel, Escher,


Bach [97], kurz vor Beginn meines Studiums. Auch wenn seitdem fast
20 Jahre vergangen sind, ist die Faszination, die ich für Gödels Werk
empfinde, ungebrochen. Unzweifelhaft sind es die Unvollständigkeits-
sätze, die mich zum Verfassen dieses Buchs bewegt haben.

Zwei Leitmotive prägen die folgenden Abschnitte. Zunächst ist es mir


ein Anliegen, die Unvollständigkeitssätze entlang Gödels ursprüngli-
cher Argumentationslinie aus dem Jahr 1931 herzuleiten. Auf diese
Weise will ich versuchen, nicht nur den Inhalt der Unvollständigkeits-
sätze zu beweisen, sondern so weit wie dies möglich ist, auch einen
Zu Gödels ärgsten Kritikern ge- Einblick in Gödels Gedankenwelt zu gewähren. Vorschnelle Euphorie
hörte kein geringerer als der be- möchte ich an dieser Stelle gleichwohl bremsen, denn auch nach der
rühmte Mengentheoretiker Ernst Zerme- Lektüre dieses Kapitels wird sein Werk eine schwer zu lesende Arbeit
lo, dessen Name uns schon mehrfach in bleiben. Gödel hat sie mit zahllosen Formeln und Definitionen gespickt,
diesem Buch begegnet ist. Im September
die den Blick auf das Wesentliche zunächst verstellen. Dennoch ist die
1931 trafen beide auf der Versammlung
akribische Präzision, mit der er seine Ergebnisse bewiesen hat, alles
der Deutschen Mathematiker-Vereinigung
in Bad Elster zusammen. Erscheinungs- andere als ein Makel; ohne sie hätten die Sätze bei seinen Kritikern nie-
bildlich hatte der zurückhaltende Gödel mals die notwendige Akzeptanz gefunden. Für fast alle seiner Zeitge-
seinem damals 60-jährigen Antagonisten nossen waren Gödels Unvollständigkeitssätze ein schwerer Schlag, und
wenig entgegenzusetzen. Zermelo war be- viele standen ihnen schon deshalb kritisch gegenüber, weil nicht sein
kannt für seine Wortgewandtheit und sei- kann, was nicht sein darf.
ne aufbrausende, manchmal auch jähzor-
nige Art [47]. Er ließ in Bad Elster kei- Es ist nicht mein Ziel, Gödels Ergebnisse mit diesem Buch gegen kri-
nen Zweifel daran, was er von dem jungen tische Stimmen zu verteidigen. Stattdessen möchte ich versuchen, den
Gödel und seinen absurden Ergebnissen Kern seiner faszinierenden Beweise offenzulegen und habe aus diesem
hielt, und lehnte zunächst jede Konversa- Grund bewusst vermieden, die folgenden Abschnitte mit technischen
tion mit ihm ab. Dennoch kam ein persön- Details zu überfrachten. Dies trifft insbesondere auf eine Reihe von
liches Gespräch zustande, das unerwartet Hilfssätzen zu, die inhaltlich wenig spektakulär sind, aber in vielen Fäl-
friedlich verlief. Bereits sechs Tage später
len eine ausführliche technische Begründung erfordern. Die Beweise
teilte Zermelo dann aber schriftlich mit,
dieser Sätze sind nicht im Detail aufgeführt; dafür wird an den betref-
einen Fehler im Beweis der Unvollstän-
digkeitssätze gefunden zu haben. Es folg- fenden Textstellen darauf hingewiesen, wo sie nachgeschlagen werden
te ein Briefwechsel, in dem Gödel ver- können.
suchte, die offensichtlichen Missverständ-
nisse auszuräumen. Zermelo ließ sich von
den gelieferten Argumenten nicht beirren 4.2 Der erste Unvollständigkeitssatz
und machte seine Kritik 1932 schließlich
öffentlich [225]. Gödel war kein Mann der
Konfrontation und unternahm danach kei- Der erste Gödel’sche Unvollständigkeitssatz ist der bekannteste und am
ne weiteren Versuche mehr, dem alternden häufigsten zitierte Satz der mathematischen Logik. Grob gesprochen
Zermelo seine Unvollständigkeitssätze zu besagt er, dass sich die Begriffe der Wahrheit und der Beweisbarkeit
erklären. Rudolf Carnap sagte später über in hinreichend ausdrucksstarken formalen Systemen nicht in Einklang
den Briefwechsel, dass Zermelo die Er- bringen lassen. Zwangsläufig müssen diese Systeme unvollständig sein,
klärungsversuche Gödels „völlig missver- d. h., es existieren stets Aussagen, die zwar inhaltlich wahr sind, aber
standen“ habe. [47]. nicht innerhalb des Systems bewiesen werden können.
4.2 Der erste Unvollständigkeitssatz 203

Abbildung 4.1: Zwei Sätze aus der Gö-


del’schen Originalarbeit [69]. Satz V ist
ein wichtiger Meilenstein im Beweis des
ersten Unvollständigkeitssatzes. Seine in-
haltliche Entsprechung ist Satz 4.5, den
wir in Abschnitt 4.2.3 diskutieren werden.
Gödel selbst hat den Beweis dieses Sat-
zes nur umrissen. Exakt ausgearbeitet ist
er beispielsweise in [183].
Satz VI ist das Hauptresultat zur Unvoll-
ständigkeit formaler Systeme. Aus ihm er-
hält Gödel an späterer Stelle seiner Arbeit
... die inhaltliche Aussage unseres Satzes 4.2
als Korollar. Beide Sätze sind hier be-
wusst in der ursprünglichen Gestalt darge-
stellt. Sie machen deutlich, wie sehr sich
die damals verwendete Terminologie von
der heutigen unterscheidet. Selbst auf den
zweiten Blick ist es nicht immer einfach,
zu erkennen, welche inhaltliche Aussage
sich tatsächlich hinter ihnen verbirgt.

Ein wichtiger Punkt vorweg: Nicht jedes formale System ist unvoll-
ständig. Betroffen sind nur jene, die ausdrucksstark genug sind, um die
Peano-Arithmetik, also die natürlichen Zahlen zusammen mit der Addi-
tion und der Multiplikation, zu formalisieren. Unbestritten gehören die
natürlichen Zahlen zum vitalen Kern der Mathematik; ohne sie würde
diese Wissenschaft auf wenige Teilgebiete zusammenschrumpfen. Der
Unvollständigkeitssatz attestiert damit nichts weniger als die Unmög-
lichkeit, ein formales System zu konstruieren, in dem alle wahren ma-
thematischen Aussagen der gewöhnlichen Mathematik auch als solche
bewiesen werden können.

Über den ersten Unvollständigkeitssatz wurde viel publiziert, und ein


Vergleich der verschiedenen Darstellungen offenbart zwei wichtige Be-
sonderheiten. Zum einen verstellt die uneinheitlich verwendete Termi-
nologie häufig den Blick darauf, dass es sich inhaltlich um den gleichen
Satz handelt (vgl. Abbildung 4.1). Zum anderen werden Beweise an-
geführt, die sich in ihrer Länge drastisch unterscheiden. So kommt der
Autor in [174] bereits nach wenigen Absätzen zu dem gewünschten Er-
gebnis, während sich Gödels Originalbeweis aus dem Jahr 1931 über
viele Seiten erstreckt. Wie kann das sein?

Zwei Gründe sind hierfür maßgebend. Zunächst einmal basieren vie-


le der neueren Beweise auf dem Begriff der Berechenbarkeit. Mit der
204 4 Beweistheorie

Formalisierung dieses Begriffs ebnete Alan Turing 1936 einen Weg,


auf dem sich Gödels Ergebnis vergleichsweise rasch erreichen lässt.
Der Hauptgrund ist aber ein anderer: Es existieren mehrere Varianten
des ersten Unvollständigkeitssatzes, die sich nicht nur in der gewählten
Formulierung unterscheiden, sondern auch inhaltlich eine geringfügig
andere Aussage treffen. In der Literatur wird darauf nur selten hinge-
wiesen, und dennoch ist es wichtig, diese Unterschiede zu verstehen.
I Semantische Variante Nur so lassen sich Missverständnisse vorab vermeiden. Eine häufig be-
mühte Variante ist diese:
„Jedes korrekte formale System, das
stark genug ist, um die
Peano-Arithmetik zu formalisieren, ist Satz 4.1 (Erster Unvollständigkeitssatz, semantisch)
unvollständig.“
Jedes korrekte formale System, das stark genug ist, um die Peano-
Arithmetik zu formalisieren, ist unvollständig.
Widerspruchs-
Korrekte
freie formale
formale Systeme


Systeme
Dies ist die semantische Variante des ersten Gödel’schen Unvollstän-
digkeitssatzes. Sie macht eine Aussage über korrekte formale Systeme,
also über Systeme, in denen sich ausschließlich wahre Aussagen ablei-
Negations-
ten lassen (aus  ϕ folgt |= ϕ). Umfasst ein solches System die Peano-
Unvollständige Arithmetik, ist es also ausdrucksstark genug, um über die additiven und
unvollständige
formale Systeme
formale Systeme multiplikativen Eigenschaften der natürlichen Zahlen zu sprechen, so ist
es der Unvollständigkeit preisgegeben. In einem solchen System exis-
tiert stets eine wahre Aussage ϕ, die nicht innerhalb des Systems bewie-
I Syntaktische Variante
sen werden kann. Für die semantische Variante des ersten Gödel’schen
Unvollständigkeitssatzes gibt es in der Tat vergleichsweise kurze Be-
„Jedes widerspruchsfreie formale weise, auf die wir in Kapitel 5 zurückkommen werden.
System, das stark genug ist, um die
Peano-Arithmetik zu formalisieren, ist Neben der semantischen Version existiert eine zweite Variante, die den
negationsunvollständig.“ Begriff der Korrektheit vollständig vermeidet. Sie lautet wie folgt:

Widerspruchs- Satz 4.2 (Erster Unvollständigkeitssatz, syntaktisch)


Korrekte
freie formale
formale Systeme
Systeme
Jedes widerspruchsfreie formale System, das stark genug ist, um


die Peano-Arithmetik zu formalisieren, ist negationsunvollständig.

Negations-
Unvollständige Dies ist die syntaktische Variante des ersten Gödel’schen Unvollständig-
unvollständige
formale Systeme keitssatzes. Sie macht eine Aussage über eine größere Klasse formaler
formale Systeme
Systeme, da als Voraussetzung nur noch die Widerspruchsfreiheit und
nicht mehr die Korrektheit des Kalküls gefordert wird. Da jedes nega-
Abbildung 4.2: Die semantische Variante tionsunvollständige formale System, das die Peano-Arithmetik formali-
des ersten Gödel’schen Unvollständigkeits- siert, auch unvollständig ist und aus der Korrektheit eines formalen Sys-
satzes ist inhaltlich schwächer als die syn- tem stets dessen Widerspruchsfreiheit folgt, ist die semantische Formu-
taktische Variante. lierung eine direkte Folgerung aus der syntaktischen (Abbildung 4.2).
4.2 Der erste Unvollständigkeitssatz 205

Die inhaltliche Aussage des ersten Gödel’schen Unvollständigkeitssatz Welche Variante des ersten
ist zweifellos beeindruckend; noch verblüffender ist allerdings die Art Unvollständigkeitssatzes hat
und Weise, wie Gödel diese Sätze bewies. In groben Worten gespro- Gödel im Jahr 1931 bewie-
chen, gelang es ihm, einen Satz mit der folgenden Bedeutung zu kon- sen? Ein Blick in seine Ori-
ginalarbeit zeigt, dass sein Unvollstän-
struieren:
digkeitsresultat eine abgeschwächte Va-
riante von Satz 4.2 ist. Gödel schaffte
„Ich bin innerhalb des Kalküls unbeweisbar.“ (4.1)
es damals noch nicht, sein Ergebnis un-
ter der Annahme der Widerspruchsfreiheit
Die Selbstbezüglichkeit dieses Satzes erinnert an das Barbier-
zu beweisen, und musste stattdessen die
Paradoxon aus Abschnitt 1.2.5 und ist ein Schlüsselelement in Gödels sogenannte ω-Widerspruchsfreiheit vor-
Beweisführung. Für diesen Satz werden wir später zeigen, dass in einem aussetzen. Erst im Jahr 1936 gelang
formalen System, das die Voraussetzungen des ersten Unvollständig- Barkley Rosser der Nachweis, dass sich
keitssatzes erfüllt, weder der Satz selbst noch dessen Negation aus den die ω-Widerspruchsfreiheit durch die ge-
Axiomen abgeleitet werden kann. Mit anderen Worten: Gödels Aussage wöhnliche Widerspruchsfreiheit ersetzen
ist innerhalb des Systems unentscheidbar. In Abschnitt 4.2.4 werden wir lässt [43, 164]. Was sich hinter Gödels
sehen, dass sich die Unentscheidbarkeit dieses Satzes in wenigen Zeilen ursprünglicher Voraussetzung genau ver-
beweisen lässt. Die eigentliche Schwierigkeit liegt woanders, nämlich birgt, werden wir im Laufe dieses Kapi-
in der Konstruktion des Satzes selbst. tels herausarbeiten. Soviel vorweg: Jedes
ω-widerspruchsfreie Kalkül ist auch wi-
Wie um alles in der Welt konnte es Gödel schaffen, einen Satz zu kon- derspruchsfrei, nicht aber umgekehrt.
struieren, der seine eigene Unbeweisbarkeit postuliert? Dieser Satz ist Die Entscheidung Gödels, nicht die se-
mantische, sondern die schwierigere syn-
anders als alle uns vertrauten Theoreme der Analysis, der Algebra oder
taktische Variante zu beweisen, ist nur
eines anderen Gebiets der gewöhnlichen Mathematik. Es ist ein Satz
im historischen Kontext zu verstehen. Für
der Meta-Ebene, schließlich stellt er eine Behauptung über das forma- Gödel war es wichtig, seinen Beweis
le System auf, in dem er selbst formuliert wurde. Indem der Satz über nicht auf den semantischen Wahrheitsbe-
sich selbst spricht, tritt er gewissermaßen aus seinem eigenen formalen griff zu stützen, schließlich entstand sei-
System heraus. Aber wie kann so etwas gelingen? ne Arbeit in einer Zeit, in der die Nach-
beben der mengentheoretischen Paradoxi-
Tatsächlich hatte Gödel eine Hintertür entdeckt, durch die Sätze ihr ei-
en noch immer zu spüren waren und viele
genes formales System in gewissem Sinne verlassen können. Die Kern- seiner Zeitgenossen dem Wahrheitsbegriff
idee seines Ansatzes besteht in der Konstruktion arithmetischer Aussa- skeptisch oder gar feindselig gegenüber-
gen, die zur gleichen Zeit zwei inhaltlich verschiedene Bedeutungen in standen. Es war eine Zeit, in der nach Gö-
sich tragen (Abbildung 4.3). dels Worten „ein Konzept der objektiven
mathematischen Wahrheit [...] mit größ-
tem Misstrauen betrachtet und in weiten
I Zuallererst besitzen diese Sätze eine arithmetische Bedeutung. In- Kreisen als bedeutungsleer zurückgewie-
nerhalb des Kalküls betrachtet sind sie gewöhnliche Sätze der sen wurde.“ [47].
Peano-Arithmetik, und als solche machen sie Aussagen über die na-
türlichen Zahlen.

I Von außen betrachtet besitzen die Sätze eine zweite, metatheoreti-


sche Bedeutung. Sie kommt durch einen verdeckten Isomorphismus
zu Stande, dessen Entdeckung zu den Sternstunden der mathema-
tischen Logik zählt. Gödel konnte zeigen, dass die Regeln und Axio-
me eines formalen Systems arithmetisch repräsentiert werden kön-
nen und sich die symbolischen Manipulationen von Zeichenketten,
206 4 Beweistheorie

Metatheoretische wie sie bei der Durchführung formaler Beweise verwendet werden,
Bedeutung auf die arithmetische Ebene übertragen lassen. Auf diese Weise ge-
lang es ihm, metatheoretische Aussagen, wie z. B. die Frage nach
Meta-Ebene

der Existenz eines Beweises, in arithmetische Formeln hineinzuco-


dieren.
"Ich bin innerhalb
des Kalküls unbeweisbar."
Das einzige, was Gödel hierfür benötigte, waren die Mittel der Peano-
"Für alle natürlichen Arithmetik, d. h. die natürlichen Zahlen zusammen mit der Addition
Kalkülebene

Zahlen gilt, ..." und der Multiplikation. Damit hatte er ein erstaunliches Phänomen ent-
deckt: Jedes formale System, das die Peano-Arithmetik umfasst, ist
stark genug, um metatheoretische Aussagen zu formulieren, und damit
implizit in der Lage, über sich selbst zu sprechen.
Zahlentheoretische
Bedeutung

Abbildung 4.3: Gödel gelang es, eine arith-


4.2.1 Arithmetisierung der Syntax
metische Aussage zu konstruieren, die ne-
ben ihrer zahlentheoretischen Bedeutung Es ist Zeit, uns genauer mit der Frage zu beschäftigen, wie wir mit-
eine zweite, metatheoretische Bedeutung hilfe arithmetischer Formeln über die Eigenschaften formaler Systeme
besitzt. Diese kommt durch einen unsicht- sprechen können. Um unser Ziel zu erreichen, müssen wir eine Mög-
baren Isomorphismus zustande, der einen
lichkeit finden, Formeln und Beweise mit den natürlichen Zahlen in Be-
Zusammenhang zwischen den symboli-
ziehung zu setzen. Konkret werden wir diesen Bezug über eine Zuord-
schen Manipulationen von Zeichenketten
und den arithmetischen Eigenschaft der na- nungsvorschrift herstellen, über die wir jede Formel und jeden Beweis
türlichen Zahlen herstellt. Auf diese Weise eines formalen Systems systematisch in eine natürliche Zahl überset-
gelang es Gödel, eine arithmetische Aussa- zen können. Die berechnete Zahl wird uns später als Stellvertreter für
ge zu konstruieren, die ihr eigenes System die ursprüngliche Formel bzw. den ursprünglichen Beweis dienen. Das
verlassen und ihre eigene Unbeweisbarkeit formale System, für das wir uns in diesem Kapitel interessieren, ist die
postulieren kann. Peano-Arithmetik aus Abschnitt 3.1, und deshalb werden wir uns auf
die Betrachtung dieses Systems beschränken. Die aufgezeigte Metho-
dik ist aber so allgemein, dass sie auf beliebige formale Systeme ange-
wendet werden kann.

Die Syntax der Peano-Arithmetik lässt sich auf ganz unterschiedliche


Weisen arithmetisieren. Eine einfache Möglichkeit besteht darin, die
Formeln auf dem heimischen PC einzutippen und die intern abgelegte
Bitfolge als natürliche Zahl zu interpretieren. Besonders einfach wird
die Umwandlung, wenn wir auf den Unicode zurückgreifen (Abbil-
dung 4.4). In dieser standardisierten Zeichentabelle sind sämtliche der
von uns benötigten Logiksymbole vorhanden, so dass wir keine Ände-
rung an der Formelsyntax vornehmen müssen. Um beispielsweise die
Formel
∀x x = x
unter dem Betriebssystem OS X in das Unicode-basierte UTF-16-
Format zu übersetzen, genügt es, auf der Konsole die folgende Befehls-
4.2 Der erste Unvollständigkeitssatz 207

Abbildung 4.4: Der Unicode umfasst insgesamt 16 Bereiche (planes), die jeder für sich 65536 verschiedene Zeichen aufneh-
men können [4]. Das Ergebnis ist eine universelle Symboltabelle, die jedem bekannten Zeichen einen eindeutigen binären Code
zuordnet, der auf jeder Hardware, unter jedem Betriebssystem und in jeder Programmiersprache immer derselbe ist.

sequenz einzutippen:
echo -n "∀xx=x" | iconv -t UTF-16 | hexdump
Das Ergebnis ist eine 12-elementige Byte-Sequenz oder, gleichbedeu-
tend, eine 24-stellige Hexadezimalzahl, die wir mit ϕ notieren:
ϕ = FE FF 22 00 00 78 00 78 00 3D 00 78
Header ’∀’ ’x’ ’x’ ’=’ ’x’
Die ersten zwei Bytes sind der UTF-16-Header. Danach folgen jeweils
zwei Bytes, die den Unicode des jeweiligen Formelzeichens enthalten.
Die Zahl ϕ bezeichnen wir als Gödelnummer der Formel ϕ und den
Vorgang des Codierens als Gödelisierung.

Die vorgestellte Codierung ist nur eine von vielen möglichen, und tat-
sächlich spielt es eine untergeordnete Rolle, mit welchem konkreten
Zahlenwert eine Formel beschrieben wird. Damit eine Codierung für
unsere Zwecke dienlich ist, muss sie lediglich drei Mindestanforderun-
gen erfüllen:

I Die Codierung muss die Menge der Formeln injektiv in die Menge
der natürlichen Zahlen einbetten, d. h., sie muss verschiedene For-
meln mit unterschiedlichen Gödelnummern belegen. Die UTF-16-
Codierung erfüllt diese Forderung, da verschiedene Textfragmente
immer auch eine unterschiedliche UTF-16-Darstellung besitzen.
208 4 Beweistheorie

Syntaktische Ebene Arithmetische Ebene


Gödelisierung
 0+0 = 0 (S5) ϕ1  = FE FF 00 30 00 2B 00 30 00
=ϕ1 3D 00 30

Gödelisierung
 0 + 0 = 0 → (0 + 0 = 0 → 0 = 0) (S1) ϕ2  = FE FF 00 30 00 2B 00 30 00
=ϕ2 3D 00 30 21 92 00 28 00 30
00 2B 00 30 00 3D 00 30 21
92 00 30 00 3D 00 30 00 29

Gödelisierung
 0+0 = 0 → 0 = 0 (MP, 1,2) ϕ3  = FE FF 00 30 00 2B 00 30 00
=ϕ3 3D 00 30 21 92 00 30 00 3D
00 30
ϕ2  = ϕ1  · 1648 + 21920028 · 1640 + (ϕ3  − FEFF · 1636 ) · 164 + 29
’→ (’ Header ’)’

Gödelisierung
 0=0 (MP, 1,3) ϕ4  = FE FF 00 30 00 3D 00 30
=ϕ4 ϕ3  = ϕ1  · 1616 + 2192 · 1612 + (ϕ4  − FEFF · 1612 )
’→’ Header

Abbildung 4.5: Jede syntaktische Manipulation, die eine Beweiskette ϕ0 , . . . , ϕi z. B. durch die Anwendung einer Schlussregel
verlängert, lässt sich als arithmetische Beziehung deuten, die zwischen den Gödelnummern ϕ0 , . . . , ϕi , ϕi+1  besteht.

I Die Gödelnummern müssen berechenbar sein, d. h., es muss ein Ver-


fahren existieren, mit dem wir die Zahl ϕ für jede Formel ϕ syste-
matisch ermitteln können. Die UTF-16-Codierung erfüllt diese For-
derung auf triviale Weise, schließlich können wir sie auf jedem PC
direkt erzeugen.

I Wir müssen für jede natürliche Zahl entscheiden können, ob sie ei-
ne Symbolkette codiert, die nach den Syntaxregeln unserer Kalkül-
sprache aufgebaut ist. Kurzum: Wir müssen für jede natürliche Zahl
entscheiden können, ob sie eine Formel repräsentiert. Dies ist für
UTF-16-codierte Zahlen ganz offensichtlich möglich.
4.2 Der erste Unvollständigkeitssatz 209

Auch wenn die UTF-16-Codierung alle Anforderungen erfüllt, ist sie ¬ ∧ ∨ → ↔


für unsere Zwecke nur bedingt geeignet. Um den Grund hierfür zu # # # # #
verstehen, nehmen wir an, ϕ0 , . . . , ϕi+1 seien Formeln der Peano-
1 3 5 7 9
Arithmetik und ϕi+1 sei durch die Anwendung einer Schlussregel aus
den vorangegangenen Formeln hervorgegangen. Auf der einen Seite be-
steht zwischen den Formeln ϕ0 , . . . , ϕi+1 eine syntaktische Beziehung, ∀ ∃ = ( )
da die Anwendung einer Schlussregel einer symbolischen Manipulati- # # # # #
on der Zeichenketten gleich kommt. Auf der anderen Seite besteht zwi- 11 13 15 17 19
schen den Gödelnummern ϕ0 , . . . , ϕi+1  eine arithmetische Bezie-
hung. Abbildung 4.5 demonstriert das Gesagte am Beispiel eines Be- 0 s + ×
weises, den wir in Abschnitt 3.1.3 geführt haben. Es ist der Beweis von # # # #
Theorem PA1 mit der Instanziierung σ = 0. Verwenden wir zur Codie- 21 23 25 27
rung das UTF-16-Format, so lassen sich die arithmetischen Beziehun-
gen zwischen den verschiedenen Gödelnummern nur umständlich be-
x y z ...
schreiben. Verwunderlich ist dies nicht, schließlich haben wir den Uni-
# # # #
code für etwas verwendet, für das er nicht geschaffen wurde.
2 4 6 ...
Aus diesem Grund werden wir jetzt einen Ansatz verfolgen, der sich an
den Darlegungen in [183] orientiert und aufgrund seines mathematisch- Tabelle 4.1: Um die Syntax der Peano-
en Charakters für unsere Zwecke besser geeignet ist. Die Codierung ist Arithmetik zu arithmetisieren, wird zu-
jener in Gödels Originalarbeit sehr ähnlich. Die Übersetzung in natürli- nächst jedes Grundsymbol der Kalkülspra-
che Zahlen erfolgt schrittweise: che in eine natürliche Zahl übersetzt.

I Wie bei der UTF-16-Codierung ordnen wir jedem Symbol der Kal-
külsprache eine natürliche Zahl zu, verwenden anstelle der Unicodes
aber die Zahlenwerte aus Tabelle 4.1. Die Werte sind so gewählt,
dass sämtlichen Logiksymbolen jeweils eine ungerade Zahl zuge- 0 + =
ordnet wird. Die geraden Zahlen sind für die Codierung von Varia-   
blen vorgesehen. 21 25 15

I Um eine einzelne Formel ϕ der Kalkülsprache zu codieren, schrei-


ben wir die Zahlenwerte, anders als bei der UTF-16-Codierung,
nicht einfach hintereinander auf. Stattdessen verwenden wir den 21 25 21 15 21
Zahlenwert des i-ten Formelzeichens als Exponent der i-ten Prim- 0 + 0 = 0 → 2 ∙ 3 ∙ 5 ∙ 7 ∙ 11
zahl und fassen alle Ausdrücke, wie in Abbildung 4.6 gezeigt, zu
einem gemeinsamen Produkt zusammen. Bezeichnen wir den Zah-
lenwert des i-ten Formelzeichens mit ci und die i-te Primzahl mit πi , 2 3 5 7 11 ...
so können wir die Gödelnummer ϕ wie folgt notieren: Primzahltabelle
c
ϕ := π1c1 · π2c2 · π3 3 · ... Abbildung 4.6: Um eine Formel zu gödeli-
sieren, wird der Zahlenwert des i-ten For-
Die Verwendung von Primzahlen ist an dieser Stelle essenziell. Da melzeichens als Exponent der i-ten Prim-
jede natürliche Zahl eindeutig durch ihre Primfaktoren beschrieben zahl verwendet. Anschließend werden alle
ist, werden zwei verschiedene Formeln immer auf verschiedene Gö- Ausdrücke zu einem gemeinsamen Produkt
delnummern abgebildet. Abbildung 4.7 fasst zusammen, wie sich zusammengefasst.
210 4 Beweistheorie

I Gödelisierung von ϕ1 die vier Formeln aus dem Beweis von Theorem PA1 auf diese Weise
0 + 0 = 0 gödelisieren lassen.
= 221 · 325 · 521 · 715 · 1121
= 2976791086050777886254142258705... I Ein formaler Beweis ist nach Definition 2.1 eine Folge von Formeln
4735259615108039000000000000000... und lässt sich nach dem gleichen Schema in eine natürliche Zahl
000000 übersetzen. Um eine Folge der Form ϕ1 , ϕ2 , ϕ3 , . . . zu codieren, ver-
≈ 3 · 1067 wenden wir die Gödelnummer der i-ten Formel als Exponent der
i-ten Primzahl und fassen alle Ausdrücke erneut zu einem gemein-
I Gödelisierung von ϕ2 samen Produkt zusammen:
0 + 0 = 0 → (0 + 0 = 0 → 0 = 0)
ϕ  ϕ  ϕ 
= 221 · 325 · 521 · 715 · 1121 · 137 · 1717 · ϕ1 , ϕ2 , ϕ3 , . . . := π1 1 · π2 2 · π3 3 · . . .
1921 · 2325 · 2921 · 3115 · 3721 · 417 ·
4321 · 4715 · 5321 · 5919 Für unseren Beispielbeweis erhalten wir mit
= 4254009852517873300162885099095...
2062912177152225723412983561076... 21 325 521 715 1121
4204241788115952166723818682709... 22 ·
21 325 521 715 1121 137 1717 1921 2325 2921 3115 3721 417 4321 4715 5321 5919
1838340314531482866349985859639... 32 ·
6267146087126501265378899938492... 21 25 21 15 21 7 21 15 21
1198219578838439107499451558520... 52 3 5 7 11 13 17 19 23 ·
21 315 521
6839301168107657439662602002788... 72
1200381075268878821015628074667...
9122187572659828211350474489248...
5934282167896560823266182229402... eine Zahl mit rund 210383 Dezimalziffern. Kein Buch der Welt hat ge-
7587626403589167148247045777416...
0442969912665803065843000000000...
nug Seiten, um ihrer Dezimalschreibweise auch nur annähernd Platz
000000000000 zu bieten. Wir sind deshalb gut beraten, die Zahl in ihrer faktorisier-
≈ 4,3 · 10383 ten Darstellung zu belassen.

I Gödelisierung von ϕ3
Auch wenn sich die beiden vorgestellten Codierungen deutlich vonein-
0 + 0 = 0 → 0 = 0
ander unterscheiden, teilen sie einen gemeinsamen Makel: Beide bil-
= 221 · 325 · 521 · 715 · 1121 · 137 · 1721 · den die Menge der Formeln zwar injektiv in die natürlichen Zahlen
1915 · 2321
ab, aber nicht surjektiv. Das bedeutet, dass natürliche Zahlen existie-
= 7733351355658080332438994260291... ren, die keine Gödelnummern sind. Für manche Betrachtungen ist es
6040167200248925434737188323592...
2061839580272843306988370847036... aber durchaus bequem, von einer Eins-zu-eins-Beziehung zwischen der
4426273272154163855898916739004... Menge der Formeln und der Menge der natürlichen Zahlen auszugehen,
7767000000000000000000000 und so stellt sich fast zwangsläufig die Frage, ob auch bijektive Göde-
= ≈ 7,7 · 10148 lisierungen existieren. Die Antwort ist ein klares Ja, schließlich können
wir alle syntaktisch korrekt aufgebauten Symbolsequenzen der Reihe
I Gödelisierung von ϕ4 nach aufzählen und der i-ten Formel ganz einfach die Gödelnummer i
0 = 0 zuweisen. Praktisch ist diese Art der Gödelisierung nicht. Genau wie
= 221 · 315 · 521 die UTF-16-Codierung hat sie den Nachteil, dass sich die syntaktischen
Beziehungen, die durch die Axiome und Schlussregeln eines formalen
= 14348907000000000000000000000
Systems definiert werden, auf der arithmetischen Ebene nur umständ-
≈ 1,4 · 1028
lich beschreiben lassen.
Abbildung 4.7: Gödelisierung der Beweis-
schritte von Theorem PA1
4.2 Der erste Unvollständigkeitssatz 211

4.2.2 Primitiv-rekursive Funktionen Die moderne Terminologie


im Bereich der rekursiven
Funktionen wurde erst nach dem Jahr
In diesem Abschnitt werden wir unser Augenmerk auf spezielle arith- 1931 geboren, und so findet sich der Be-
metische Funktionen richten, die in Gödels Beweis eine zentrale Rol- griff der primitiv-rekursiven Funktion an
le spielen. In der Literatur werden sie treffend als primitiv-rekursive keiner Stelle in Gödels Originalarbeit wie-
Funktionen bezeichnet, da sie rekursiv aus einer Reihe primitiver Ele- der. Was wir heute als primitiv-rekursiv
mentarfunktionen gewonnen werden können. Was wir darunter genau bezeichnen, nannte Gödel rekursiv.
zu verstehen haben, klärt die folgende Definition: Die älteste bekannte Arbeit, die den Be-
griff der primitiven Rekursion verwendet,
wurde von der ungarischen Mathematike-
Definition 4.1 (Primitiv-rekursive Funktionen) rin Rózsa Péter (Abbildung 4.8) im Jahr
1934 publiziert [149], und der Begriff der
I Die folgenden Funktionen sind primitiv-rekursiv: primitiv-rekursiven Funktion taucht zum
ersten Mal in einer Arbeit von Stephen
• Die Nullfunktion z(n) := 0 Cole Kleene aus dem Jahr 1936 auf [109].
• Die Nachfolgerfunktion s(n) := n + 1 Trotzdem wird der Begriff der rekursi-
ven Funktionen auch heute noch verwen-
• Die Projektion pni (x1 , . . . , xn ) := xi det, allerdings meist als Abkürzung für
die größere Klasse der sogenannten μ-
I Sind g : Nk → N und h1 , . . . , hk : Nn → N primitiv-rekursiv, dann rekursiven Funktionen, die alle berechen-
ist es auch f (x1 , . . . , xn ) mit baren Funktionen umfasst.

f (x1 , . . . , xn ) = g(h1 (x1 , . . . , xn ), . . . , hk (x1 , . . . , xn ))

I Sind g : Nn → N und h : Nn+2 → N primitiv-rekursiv, dann ist es


auch f (m, x1 , . . . , xn ) mit

f (0, x1 , . . . , xn ) = g(x1 , . . . , xn ),
f (m + 1, x1 , . . . , xn ) = h( f (m, x1 , . . . , xn ), m, x1 , . . . , xn )

Die erste Regel legt die elementaren primitiven Funktionen fest; na-
mentlich sind dies die Nullfunktion, die Nachfolgerfunktion und die
Projektion. Die anderen Regeln geben an, wie sich aus bereits bekann-
ten primitiv-rekursiven Funktionen weitere erschaffen lassen. Insge-
samt haben wir es mit zwei verschiedenen Konstruktionsschemata zu Rózsa Péter
tun: (1905 – 1977)

Abbildung 4.8: Die ungarische Mathema-


I Komposition tikerin Rózsa Péter war eine der führenden
Die Kompositionsregel erlaubt uns, primitiv-rekursive Funktionen Persönlichkeiten auf dem Gebiet der Re-
als Parameter in andere primitiv-rekursive Funktionen einzusetzen. kursionstheorie. Zudem gelang es ihr als
Ist beispielsweise g(x1 , x2 , x3 ) primitiv-rekursiv, dann ist es auch die Verfasserin mehrerer populärwissenschaft-
Funktion licher Bücher, ein Publikum weit über die
Wissenschaftsgemeinde hinaus für sich zu
f (x1 , x2 ) := g(x2 , x1 , x1 ) = g(p22 (x1 , x2 ), p21 (x1 , x2 ), p21 (x1 , x2 )) begeistern [151, 152].
212 4 Beweistheorie

Primitiv-rekursive Funktio- Im Vorbeigehen demonstriert das Beispiel eine wertvolle Eigen-


nen gibt es in Hülle und Fül- schaft der Projektionsfunktion. Sie lässt sich gezielt einsetzen, um
le! In der Tat ist es gar nicht gewisse Variablen auszuwählen oder zu vertauschen.
so einfach, eine Funktion zu
konstruieren, die sich systematisch be- I Primitive Rekursion
rechnen lässt, aber nicht nach dem Sche-
Hinter diesem Konstruktionsschema verbirgt sich der wahre Kern
ma der primitiven Rekursion aufgebaut
ist. Im Jahr 1926 äußerte David Hilbert
primitiv-rekursiver Funktionen. Ein gezielter Blick auf das Rekursi-
sogar die Vermutung, dass alle berechen- onsschema zeigt, dass der Funktionswert f in einer Schleife berech-
baren Funktionen primitiv-rekursiv sei- net wird, in der m die Rolle der Schleifenvariablen spielt. Ist m = 0,
en [88]. Widerlegt wurde Hilberts Annah- so wird der Funktionswert über die Funktion g bestimmt. Ist m > 0,
me noch im selben Jahr durch Wilhelm so wird der Funktionswert ermittelt, indem die Funktion h auf den
Ackermann. Ihm gelang es, eine Funk- berechneten Funktionswert f (m − 1, x1 , . . . , xn ) sowie auf die Para-
tion zu konstruieren, die nicht primitiv- meter m − 1 und x1 , . . . , xn angewendet wird.
rekursiv ist, aber mithilfe verschachtel-
ter Rekursionsaufrufe berechnet werden Das Schema der primitiven Rekursion ist stark genug, um alle üblichen
kann. Veröffentlicht hat Ackermann sei-
Arithmetikoperationen auszudrücken. Um z. B. die Addition, die Multi-
ne Funktion im Jahr 1928 [2]. 1935 wurde
sie von Rózsa Péter vereinfacht und in die
plikation und die Potenzierung von natürlichen Zahlen primitiv-rekursiv
folgende bekannte Form gebracht [150]: zu formulieren, gehen wir von der folgenden Darstellung aus:

A(0, n) := 2 · n + 1 n falls m = 0
add(m, n) = (4.2)
s(add(m − 1, n)) falls m > 0
A(m + 1,0) := A(m,1)
A(m + 1, n + 1) := A(m, A(m + 1, n)) 
0 falls m = 0
mult(m, n) = (4.3)
Auf den ersten Blick kommt die Funkti- add(mult(m − 1, n), n) falls m > 0
on harmlos daher. Ihr geschickt gewähl- 
tes Rekursionsschema hat aber zur Folge, 1 falls m = 0
pow(m, n) = (4.4)
dass sie stärker wächst als jede primitiv- mult(pow(m − 1, n), n) falls m > 0
rekursive Funktion. Bereits A(4,2) ent-
spricht einer Zahl mit ca. 20.000 Dezimal- Durch den geschickten Einsatz der Projektionsfunktion können wir
stellen, und für noch größere Werte von m (4.2) bis (4.4) in die gesuchte Form bringen:
und n können wir A(m, n) faktisch kaum
noch ausrechnen. add(0, n) = p11 (n),
Zu Ehren Ackermanns wird diese Funk-
add(m + 1, n) = s(p31 (add(m, n), m, n))
tion als Ackermann-Funktion bezeichnet.
Manche Autoren sind präziser und be-
zeichnen sie ihrer Herkunft entsprechend mult(0, n) = 0,
als Ackermann-Péter-Funktion. mult(m + 1, n) = add(p31 (mult(m, n), m, n), p33 (mult(m, n), m, n))

pow(0, n) = s(0),
pow(m + 1, n) = mult(p31 (pow(m, n), m, n), p33 (pow(m, n), m, n))

Ohne Mühe können wir den Begriff der primitiv-rekursiven Funktion


auch auf Relationen übertragen. Hierzu koppeln wir das Bestehen oder
Nichtbestehen einer Relation ganz einfach an die Existenz einer ent-
sprechenden charakteristischen Funktion:
4.2 Der erste Unvollständigkeitssatz 213

Definition 4.2 (Primitiv-rekursive Relationen)

Eine Relation R zwischen den natürlichen Zahlen x1 , . . . , xn heißt


primitiv-rekursiv, wenn eine primitiv-rekursive Funktion f mit der
folgenden Eigenschaft existiert:
R(x1 , . . . , xn ) ⇔ f (x1 , . . . , xn ) = 0
f nennen wir die charakteristische Funktion von R.

4.2.3 Arithmetische Repräsentierbarkeit

In diesem Abschnitt wollen wir die Peano-Arithmetik (PA) dazu ver-


wenden, um über primitiv-rekursive Funktionen zu sprechen. Dass wir
diverse Eigenschaften von Zahlen und Funktionen innerhalb von PA
formalisieren können, wurde bereits mehrfach erwähnt. Aber wie war
das genau gemeint? Wie können wir beispielsweise formal ausdrücken,
dass eine natürliche Zahl x eine gerade Zahl ist? Die Peano-Arithmetik
kennt neben der Nachfolgerfunktion, der Addition und der Multiplika-
tion keine anderen Operationen; wie kann sie über etwas reden, das gar
nicht in ihrem Sprachreservoir vorhanden ist?

Die Lösung kommt erneut in Form des Extensionalitätsprinzips, das wir


im Zusammenhang mit der Mengenlehre bereits kennen gelernt haben.
Diesem Prinzip folgend, wird die Bedeutung eines Ausdrucks durch sei-
nen Umfang – seine Extension – beschrieben, d. h. durch die Objekte,
die er benennt oder beschreibt. In unserem Fall sind dies Mengen von
natürlichen Zahlen. Damit ist klar, wie wir die Aussage

„x ist eine gerade natürliche Zahl“

extensional erfassen können; sie wird eindeutig durch die Menge der
geraden Zahlen beschrieben.

Innerhalb der Peano-Arithmetik ist es ein Leichtes, die Menge der ge-
raden Zahlen durch eine Formel ϕ(ξ ) mit einer freien Variablen ξ zu
charakterisieren. Hierzu wählen wir ϕ(ξ ) derart, dass die Formeln

ϕ(0), ϕ(2), ϕ(4), ϕ(6), ϕ(8), ϕ(10), . . .

allesamt wahr und die Formeln

ϕ(1), ϕ(3), ϕ(5), ϕ(7), ϕ(9), ϕ(11), . . .


214 4 Beweistheorie

Arithmetisch repräsentierbare Relationen allesamt falsch sind. Eine Formel mit dieser Eigenschaft ist z. B.

I „x ist eine gerade natürliche Zahl.“ ϕ(x) = (∃ z x = z × 2)


ϕ(x) := (∃ z x = z × 2)
Die Grundidee ist damit vorgezeichnet, und bei genauerem Hinsehen
wird klar, dass wir auf diese Weise nicht nur Eigenschaften von natür-
I „x ist eine Quadratzahl.“
lichen Zahlen, d. h. einstellige Relationen, arithmetisch repräsentieren
ϕ(x) := (∃ z x = z × z) können, sondern auch beliebige Beziehungen, die zwischen zwei oder
mehreren natürlichen Zahlen bestehen (Abbildung 4.9). Hierzu müssen
I „x teilt y.“ wir unsere Vorgehensweise lediglich auf mehrstellige Relationen erwei-
ϕ(x, y) := (∃ z x × z = y)
tern. Die folgende Definition bringt Klarheit:

I „x ist größer oder gleich y.“ Definition 4.3 (Semantisch repräsentierbare Relationen)
ϕ(x, y) := (∃ z x = y + z)
Sei R ⊆ Nn eine Relation und ϕ eine Formel mit n freien Variablen.
R wird durch ϕ semantisch repräsentiert, wenn gilt:
I „x ist größer als y.“
ϕ(x, y) := (∃ z x = y + z + 1) (x1 , . . . , xn ) ∈ R ⇒ |= ϕ(x1 , . . . , xn )
(x1 , . . . , xn ) ∈ R ⇒ |= ¬ϕ(x1 , . . . , xn )
I „x ist eine Primzahl.“
ϕ(x) :=
Auch Funktionen lassen sich arithmetisch repräsentieren. Hierzu nutzen
(¬(x = 1) ∧
wir aus, dass sich jede n-stellige Funktion als Relation mit der Stellig-
∀ z (z | x → (z = 1 ∨ z = x))) keit n + 1 auffassen lässt.

I „x und y sind Primzahlzwillinge.“


Definition 4.4 (Semantisch repräsentierbare Funktionen)
ϕ(x, y) :=
(¬(x = 1) ∧ ¬(y = 1) ∧ Sei f : Nn → N eine Funktion und ϕ eine Formel mit n + 1 freien
Variablen. f wird durch ϕ semantisch repräsentiert, wenn gilt:
∀ z (z | x → (z = 1 ∨ z = x)) ∧
∀ z (z | y → (z = 1 ∨ z = y)) ∧ f (x1 , . . . , xn ) = y ⇒ |= ϕ(x1 , . . . , xn , y)
y = x + 2) f (x1 , . . . , xn ) = y ⇒ |= ¬ϕ(x1 , . . . , xn , y)

Abbildung 4.9: Eine kleine Auswahl arith- Um die Definition mit Leben zu füllen, wollen wir erarbeiten, wie sich
metisch repräsentierbarer Relationen die Funktion pow(x, y) aus Abschnitt 4.2.2 arithmetisch repräsentieren
lässt. Als erstes probieren wir, eine Formel mit einer freien Variablen z
zu konstruieren, die nach dem folgenden Schema aufgebaut ist:

∃ u0 . . . ∃ uy (ψ0 (x, u0 ) ∧ . . . ∧ ψy (x, uy ) ∧ z = uy ) (4.5)

Für jede natürliche Zahl i mit 0 ≤ i ≤ y enthält diese Formel eine gebun-
dene Variable ui und eine Teilformel ψi . Wählen wir ψi so, dass ψi (x, ui )
genau für ui = xi wahr ist, so entspricht der gesuchte Funktionswert z
4.2 Der erste Unvollständigkeitssatz 215

dem Inhalt der Variablen uy . Die Konstruktion der Teilformeln ψi berei- I ϕα (u,0, 1)
tet uns dabei keinerlei Schwierigkeit; wir können ihren Wortlaut direkt „An Position 0 von u steht der Wert 1.“
aus dem primitiven Rekursionsschema der Exponentialfunktion extra-
hieren: u= 1 ...
ψ0 (x, u0 ) := (u0 = 1)
ψi + 1 (x, ui + 1 ) := (∀ w (ψi (x, w) → ui + 1 = w × x)) I ∀ v ∀ w (v < y ∧ ϕα (u, v, w) →
ϕα (u, v + 1, w × x))
Ein schwerwiegendes Problem bleibt allerdings bestehen: Da wir eine
variable Anzahl an Quantoren verwendet haben und die freie Variable „Steht an Position v der Wert w, so steht
an Position v + 1 der Wert w · x.“
y zusätzlich im Index der Variablen uy auftaucht, ist (4.5) keine Formel
der Peano-Arithmetik. Gelöst ist unser Problem erst dann, wenn wir es u= 1 x x2 ... xy
schaffen, sie in eine echte arithmetische Formel zu übersetzen.
Um dieses Ziel zu erreichen, verfolgen wir die gleiche Grundidee, mit
I ϕα (u, y, z)
der wir die Mengen N und Nn in Kapitel 1 als gleichmächtig identifi-
ziert haben. Dort haben wir gezeigt, dass sich endliche Folgen natürli- „z ist der Wert an Position y.“
cher Zahlen eineindeutig in eine natürliche Zahl hineincodieren lassen,
und genau das werden wir auch mit unserer Zahlenfolge x0 , . . . , xy ver- u= 1 x x2 ... z
suchen. y

Hierzu nehmen wir an, uns stehe eine Funktion α : N2 → N zur Verfü-
Abbildung 4.10: Gäbe es eine Funktion mit
gung, so dass für jede endliche Sequenz a0 , . . . , ay eine Zahl b mit
den Eigenschaften von ϕα , so wären wir in
α(b,0) = a0 , α(b,1) = a1 , . . . , α(b, y) = ay der Lage, die Exponentialfunktion z = xy
arithmetisch zu repräsentieren.
existiert. Wenn es uns jetzt noch gelänge, die Funktion α mit einer For-
mel ϕα arithmetisch zu repräsentieren, dann ließe sich Formel (4.5) fol-
gendermaßen umschreiben:
∃ u (ϕα (u,0, 1) ∧
∀ v ∀ w (v < y ∧ ϕα (u, v, w) → ϕα (u, v + 1, w × x)) ∧ (4.6)
ϕα (u, y, z))
Abbildung 4.10 veranschaulicht die Bedeutung der einzelnen Formel-
bestandteile.

Der Lösung unseres Problems sind wir schon sehr nahe. Die Anzahl
der in (4.6) verwendeten Quantoren ist nun konstant, und die Variable y
kommt nicht mehr als Index einer anderen Variablen vor. Am Ziel sind
wir aber erst, wenn wir eine reale Funktion mit der Eigenschaft von α
finden.

Es ist Gödel zu verdanken, dass wir eine solche Funktion heute unser
Eigen nennen dürfen. Im Gegensatz zu unserer fiktiven Funktion α mit
zwei Variablen führte er eine Funktion β mit drei Variablen ein:
β (x, y, z) := x mod (1 + y · (z + 1))
216 4 Beweistheorie

Das Sun Zi suanjing zählt Der folgende Satz zeigt, dass diese Funktion unseren Zweck erfüllt:
zu den wichtigsten chine-
sischen Frühwerken der
Mathematik. Niedergeschrieben wurde es Satz 4.3
von dem Rechenmeister Sun Zi in der ers-
ten Hälfte des ersten Jahrhunderts, wahr- Für jede endliche Zahlenfolge a0 , . . . , ak−1 existieren b und c mit
scheinlich in den Jahren zwischen 280
und 473 n. Chr. [206]. Die bekannteste ai = β (b, c, i) = b mod (1 + c · (i + 1))
Stelle des Sun Zi suanjing befindet sich im
dritten und letzten Kapitel [220]. Dort, in
Aufgabe 26, fordert der Meister zur Lö- Beweis: Wir beweisen den Satz in zwei Schritten:
sung des folgenden Rätsels auf:

„Es sei nun eine unbekannte Anzahl von I Zunächst zeigen wir, dass die Zahlen
Dingen gegeben. Wenn wir sie zu je drei
zählen, bleibt der Rest zwei übrig. Wenn 1 + l! · 1, 1 + l! · 2, 1 + l! · 3, . . . , 1 + l! · l
wir sie zu je fünf zählen, bleibt der Rest
drei übrig. Wenn wir sie zu je sieben für jede Zahl l ∈ N paarweise teilerfremd sind. Der Beweis lässt sich
zählen, bleibt der Rest zwei übrig. Finde mit elementaren zahlentheoretischen Argumenten führen. Gäbe es
die Anzahl der Dinge heraus.“ eine Primzahl p, die sowohl
In moderner Sprechweise ist dies die Auf- (1 + l! · i) als auch (1 + l! · j) (1 ≤ i < j ≤ l)
forderung, das folgende System linearer
Kongruenzen zu lösen: teilt, so wäre p auch ein Teiler der Differenz
x≡2 mod 3 (1 + l! · j) − (1 + l! · i) = l! · ( j − i)
x≡3 mod 5
x≡2 mod 7
Das würde bedeuten, dass mindestens eine der Zahlen l! oder ( j − i)
durch p teilbar ist. Wir zeigen nun, dass beide Annahmen zu einem
Wir nennen ein solches System auch eine Widerspruch führen:
simultane Kongruenz. Heute kennen wir
eine Reihe von Sätzen, die Aussagen dar- • Angenommen, es gelte p|l!. Dann ist p auch ein Teiler von l! · i,
über treffen, wann solche Kongruenzen im Widerspruch zur Annahme, p teile den Wert 1 + l! · i.
lösbar sind. Ihrer Herkunft entsprechend
werden diese Sätze als Chinesische Rest- • Angenommen, es gelte p|( j − i). Wegen ( j − i) < l ist ( j − i)
sätze bezeichnet. Die Variante, die im Be- ein Teiler von l!. Dann ist aber auch p ein Teiler von l!, was wir
weis von Satz 4.3 verwendet wird, besagt gerade widerlegt haben. 
das Folgende:
Sind m0 , . . . , mn natürliche, paarweise tei- Jetzt ergibt sich die Aussage von Satz 4.3 fast von selbst. Wir defi-
lerfremde Zahlen und a0 , . . . , an beliebi- nieren die Zahl l als
ge ganze Zahlen, so besitzt die simultane
Kongruenz l := max{k, a0 , a1 , . . . , ak−1 }

x ≡ a0 mod m0 und betrachten die Kongruenz


...
x ≡ a0 mod (1 + l! · 1)
x ≡ an mod mn x ≡ a1 mod (1 + l! · 2)
genau eine Lösung modulo m0 · . . . · mn .
...
x ≡ ak−1 mod (1 + l! · k)
4.2 Der erste Unvollständigkeitssatz 217

Da die Module (1 + l! · i) paarweise teilerfremd sind, können wir I a0 = 1, a1 = 2


den Chinesischen Restsatz anwenden. Dieser garantiert uns, dass die
Für b = 5 und c = 1 gilt:
simultane Kongruenz eine Lösung besitzt. Bezeichnen wir diese Lö-
sung mit b und setzen c := l!, so gilt für alle ai die Beziehung 5 mod (1 + 1 · 1) = 1
5 mod (1 + 1 · 2) = 2
ai = b mod (1 + c · (i + 1)) 5 mod (1 + 1 · 3) = 1
was zu beweisen war. 5 mod (1 + 1 · 4) = 0
5 mod (1 + 1 · 5) = 5
Abbildung 4.11 demonstriert, wie sich mithilfe der Gödel’schen β -
Funktion die Anfangsstücke der Folge aller Zweierpotenzen repräsen- 1 2 1 0 5 ...
tieren lassen.

β (b, c,0)

β (b, c,1)

β (b, c,2)

β (b, c,3)

β (b, c,4)
Natürlich existiert eine ganze Schar von Funktionen, um Sequenzen von
natürlichen Zahlen in eine einzige Zahl hineinzucodieren. Wir dürfen
in diesem Zusammenhang aber nicht vergessen, dass wir die Funktion
I a0 = 1, a1 = 2, a2 = 4
arithmetisch repräsentieren müssen, und genau dies ist bei Gödels β -
Funktion problemlos möglich: Für b = 67 und c = 2 gilt:
ϕβ (b, c, i, a) := ∃ d b = s(c × s(i)) × d + a ∧ a < s(c × s(i)) (4.7) 67 mod (1 + 2 · 1) = 1
67 mod (1 + 2 · 2) = 2
Damit sind wir am Ziel und können die Exponentialfunktion folgender-
67 mod (1 + 2 · 3) = 4
maßen repräsentieren:
67 mod (1 + 2 · 4) = 4
∃ b ∃ c (ϕβ (b, c,0, 1) ∧ 67 mod (1 + 2 · 5) = 1
∀ v ∀ w (v < y ∧ ϕβ (b, c, v, w) → ϕβ (b, c, v + 1, w × x)) ∧
1 2 4 4 1 ...
ϕβ (b, c, y, z)) β (b, c,0)

β (b, c,1)

β (b, c,2)

β (b, c,3)

β (b, c,4)
Ersetzen wir die Funktion ϕβ jetzt noch durch ihre Definition, so erhal-
ten wir
∃ b ∃ c (∃ d b = s(c × s(0)) × d + 1 ∧ 1 < s(c × s(0)) ∧ I a0 = 1, a1 = 2, a2 = 4, a3 = 8
∀ v ∀ w (v < y ∧ ∃ d b = s(c × s(v)) × d + w ∧ w < s(c × s(v)) →
Für b = 43058 und c = 6 gilt:
∃ d b = s(c × s(v + 1)) × d + (w × x) ∧ (w × x) < s(c × s(v + 1))) ∧ 43058 mod (1 + 6 · 1) = 1
∃ d b = s(c × s(y)) × d + z ∧ z < s(c × s(y))) 43058 mod (1 + 6 · 2) = 2
Auch wenn diese Formel von außen betrachtet wie eine wahllose An- 43058 mod (1 + 6 · 3) = 4
sammlung arithmetischer Ausdrücke wirkt, lässt sie ihr streng konstruk- 43058 mod (1 + 6 · 4) = 8
tiver Aufbau in einem hellen Licht erstrahlen. In ihrem Inneren verbirgt 43058 mod (1 + 6 · 5) = 30
sie mit der Gödel’schen β -Funktion ein mathematisches Juwel.
1 2 4 8 30 ...
Können wir auf die gleiche Weise auch andere Funktionen arithmetisch
β (b, c,0)

β (b, c,1)

β (b, c,2)

β (b, c,3)

β (b, c,4)

repräsentieren? Die Antwort lautet Ja! Die Gödel’sche β -Funktion ist


von so allgemeiner Natur, dass wir nach dem gleichen Schema belie-
bige primitiv-rekursive Funktionen oder Relationen arithmetisch reprä-
sentieren können. Tatsächlich lässt sich durch eine Verallgemeinerung Abbildung 4.11: Codierung von Zahlenfol-
der oben gezeigten Formelkonstruktion der folgende Satz beweisen: gen mit der Gödel’schen β -Funktion
218 4 Beweistheorie

Satz 4.4

Jede primitiv-rekursive Relation R(x1 , . . . , xn ) ist innerhalb der


Peano-Arithmetik semantisch repräsentierbar.

Die bisher benutzte Art der Repräsentation war eine semantische, da


wir zwischen wahren und falschen Formeln unterschieden haben. Wir
wollen unser Begriffsgerüst jetzt um eine zweite Art der arithmetischen
Repräsentierbarkeit ergänzen, die den Begriff der Wahrheit durch den
Begriff der Beweisbarkeit ersetzt. Da Beweise in formalen Systemen
vollständig auf der syntaktischen Ebene geführt werden, reden wir in
diesem Zusammenhang von einer syntaktischen Repräsentation.

Definition 4.5 (Syntaktisch repräsentierbare Relationen)

Sei R ⊆ Nn eine Relation und ϕ eine Formel mit n freien Variablen.


R wird durch ϕ syntaktisch repräsentiert, wenn gilt:

(x1 , . . . , xn ) ∈ R ⇒  ϕ(x1 , . . . , xn )
(x1 , . . . , xn ) ∈ R ⇒  ¬ϕ(x1 , . . . , xn )

Auch der Begriff der arith-


metischen Repräsentierbar- Alle Relationen und Funktionen aus Abbildung 4.9 werden durch die
keit ist von der babyloni-
angegebenen Formeln nicht nur semantisch, sondern auch syntaktisch
schen Sprachverwirrung be-
troffen, mit der wir im Bereich der ma-
repräsentiert. Den Beweis hierfür wollen wir nicht führen, da er mit er-
thematischen Logik an vielen Stellen le- heblichem Aufwand verbunden ist. Für alle natürlichen Zahlen müssten
ben müssen. Insbesondere in der angel- wir zeigen, dass die entsprechenden Formelinstanzen von ϕ im forma-
sächsischen Literatur werden hierfür eine len System der Peano-Arithmetik ableitbar bzw. nicht ableitbar sind.
Vielzahl unterschiedlicher Begriffe ver-
wendet. Beispielsweise werden syntak-
Gödel zeigte, dass die Aussage von Satz 4.4 auch auf der syntaktischen
tisch repräsentierbare Relationen in El- Ebene gilt. Genau dies ist die Aussage seines berühmten Satzes V, den
liott Mendelsons Standardwerk als ex- wir in Abbildung 4.1 im Originalwortlaut zitiert hatten. In modernerer
pressable und syntaktisch repräsentierba- Formulierung liest er sich wie folgt:
re Funktionen als representable bezeich-
net [125]. Peter Smith verwendet den Be-
griff expressable in seinem Buch über Satz 4.5 (Gödel, 1931)
die Gödel’schen Unvollständigkeitssätze
dagegen als Synonym für die semanti- Jede primitiv-rekursive Relation R(x1 , . . . , xn ) ist innerhalb der
sche Repräsentierbarkeit, unabhängig da- Peano-Arithmetik syntaktisch repräsentierbar.
von, ob damit Funktionen oder Relatio-
nen gemeint sind [183]. Syntaktisch re-
präsentierbare Funktionen und Relationen Dieser Satz ist ein wichtiges Etappenziel auf dem Weg zu den Unvoll-
bezeichnet Smith als capturable.
ständigkeitsresultaten. Sein Beweis ist sehr technisch, und selbst Gödel
4.2 Der erste Unvollständigkeitssatz 219

hat ihn in seiner Arbeit nur skizzenhaft angedeutet. Ausführlich ausge-


arbeitet ist er beispielsweise in [183].

Als Nächstes wollen wir den Begriff der syntaktischen Repräsentierbar-


keit auf Funktionen übertragen. Für Relationen war dies eine einfache
Aufgabe, wie ein vergleichender Blick auf die Definitionen 4.3 und 4.5
beweist. In diesem Fall unterscheidet sich die syntaktische Variante von
der semantischen Variante nur dadurch, dass die Modellrelation ‚|=‘
durch die Beweisbarkeitsrelation ‚‘ ersetzt ist. Für Funktionen könnten
wir genauso vorgehen und in Anlehnung an Definition 4.4 die folgende
Formulierung wählen:

Seien f : Nn → N eine Funktion und ϕ eine Formel mit n + 1 freien


Variablen. f wird durch ϕ syntaktisch repräsentiert, wenn gilt:

f (x1 , . . . , xn ) = y ⇒  ϕ(x1 , . . . , xn , y) (4.8)


f (x1 , . . . , xn ) = y ⇒  ¬ϕ(x1 , . . . , xn , y) (4.9)

Tatsächlich wäre diese Definition in einem bedeutenden Punkt schwach:


Repräsentieren wir eine Funktion f (x1 , . . . , xn ) semantisch, so ist
ϕ(x1 , . . . , xn , y) nämlich genau dann eine wahre Aussage, wenn der
Funktionswert f (x1 , . . . , xn ) gleich y ist:

|= ϕ(x1 , . . . , xn , y) ⇔ y = f (x1 , . . . , xn )

Diesen Sachverhalt können wir auch innerhalb der Peano-Arithmetik


ausdrücken. Wird die Funktion f durch ϕ semantisch repräsentiert, so
sind die folgenden Formelinstanzen allesamt wahr:

∀ y (ϕ(x1 , . . . , xn , y) ↔ y = f (x1 , . . . , xn )) (4.10)

Repräsentieren wir die Funktion f dagegen syntaktisch, so haben wir


keine Garantie dafür, dass die Formelinstanzen (4.10), obgleich sie wahr
sein müssen, auch beweisbar sind. Es ist dann durchaus möglich, dass
wir innerhalb des Kalküls über die relationalen Eigenschaften einer
Funktion f im Sinne von (4.8) und (4.9) reden können, aber nicht über
die Eigenschaft von f , eine Funktion zu sein. An vielen Stellen ist aber
genau dies wünschenswert und wichtig. Aus diesem Grund wollen wir
eine Funktion f nur dann als syntaktisch repräsentiert ansehen, wenn
die Formel ϕ, zusätzlich zu (4.8) und (4.9), das Folgende erfüllt:

 ∀ y (ϕ(x1 , . . . , xn , y) ↔ y = f (x1 , . . . , xn ))

Eine äquivalente Formulierung ist diese hier:

f (x1 , . . . , xn ) = y ⇒  ∀ y (ϕ(x1 , . . . , xn , y) ↔ y = y) (4.11)


220 4 Beweistheorie

Die neu hinzugefügte Forderung (4.11) ist wiederum so stark, dass sich
die Eigenschaften (4.8) und (4.9) mühelos daraus ableiten lassen. Es
genügt deshalb, die Forderung (4.11) zur alleinigen Grundlage für die
syntaktische Repräsentierbarkeit von Funktionen zu erheben, und genau
dies wollen wir an dieser Stelle tun:

Definition 4.6 (Syntaktisch repräsentierbare Funktion)

Sei f : Nn → N eine Funktion und ϕ eine Formel mit n + 1 freien


Variablen. f wird durch ϕ syntaktisch repräsentiert, wenn gilt:

f (x1 , . . . , xn ) = y ⇒  ∀ y (ϕ(x1 , . . . , xn , y) ↔ y = y)

Der nachstehend abgedruckte Satz spricht aus, dass die Eigenschaft, in-
nerhalb der Peano-Arithmetik syntaktisch repräsentierbar zu sein, nicht
nur für primitiv-rekursive Relationen gilt, sondern auch für primitiv-
rekursive Funktionen:

Satz 4.6

Jede primitiv-rekursive Funktion f (x1 , . . . , xn ) ist innerhalb der


Peano-Arithmetik syntaktisch repräsentierbar.

Der Beweis dieses Satzes ist, genau wie der Beweis von Satz 4.5,
technisch aufwendig. Wir wollen die formalen Details an dieser Stelle
überspringen und verweisen als Ersatz auf die ausführliche Darstellung
in [183].

4.2.4 Gödels Diagonalargument

Bevor wir die Bühne zum großen Finale des Gödel’schen Beweises frei-
geben, wollen wir die bis jetzt erarbeiteten Ergebnisse kurz zusammen-
fassen:

I In Abschnitt 4.2.1 haben wir gezeigt, wie sich die Syntax einer for-
malen Sprache arithmetisieren lässt. Indem wir jeder Formel ϕ eine
Gödelnummer ϕ zugeordnet haben, konnten wir die Manipulation
von Zeichenketten auf der arithmetischen Ebene deuten.
4.2 Der erste Unvollständigkeitssatz 221

I In Abschnitt 4.2.2 haben wir den Begriff der primitiv-rekursiven


Funktion eingeführt und anschließend auf numerische Relationen
übertragen. Ohne uns in Details zu verlieren, haben wir angedeutet,
dass sich viele im mathematischen Alltag angetroffene Funktionen
primitiv-rekursiv formulieren lassen.
I In Abschnitt 4.2.3 haben wir den Begriff der arithmetischen
Repräsentierbarkeit eingeführt. Am Ende stand die Erkenntnis,
dass wir die Gödel’sche β -Funktion dazu verwenden können, um
primitiv-rekursive Relationen und Funktionen innerhalb der Peano-
Arithmetik syntaktisch zu repräsentieren.

Betrachten wir die gewonnenen Ergebnisse isoliert voneinander, so wir-


ken sie wie gewöhnliche mathematische Aussagen. Jede Einzelne be-
leuchtet einen interessanten Aspekt der mathematischen Logik, aber
keine von ihnen scheint das Potenzial zu besitzen, die Mathematik in
ihren Grundfesten zu gefährden. Eine wahrhaft zerstörerische Wirkung
entfalten sie jedoch dann, wenn wir sie in geeigneter Weise miteinan-
der kombinieren. Wie die einzelnen Puzzle-Stücke zusammenpassen,
hat Gödel in akribischer Präzision ausgearbeitet, und so liest sich seine
Arbeit aus dem Jahr 1931 stellenweise wie der Bauplan eines mathe-
matischen Sprengsatzes. Die explosive Wirkung seiner Arbeit ist be-
kannt. Mit dem Beweis der Unvollständigkeitssätze hat Gödel die lange
gehegte Hoffnung auf die vollständige Formalisierung der Mathematik
mit einem Handstreich in Schutt und Asche gelegt.

Auf den folgenden Seiten werden wir die Gödel’sche Konstruktion in


ihren Grundzügen nachvollziehen. Eine wesentliche Rolle spielen dabei
diejenigen arithmetischen Formeln, die in Gödels Originalarbeit Klas-
senzeichen heißen. Mit diesem Begriff sind die Formeln der Form ϕ(ξ )
gemeint, also diejenigen Formeln, in denen genau eine Variable frei vor-
kommt.

Für das Verständnis der folgenden Überlegungen ist es hilfreich, sich


diese Formeln als Zeileneinträge einer unendlich großen Tabelle vor-
zustellen (vgl. Tabelle 4.2). Innerhalb der Tabelle sind die Formeln so
angeordnet, dass in der i-ten Zeile die Formel mit der Gödelnummer i
erscheint. Die Formel in Zeile i bezeichnen wir im Folgenden mit ϕi (ξ ).
Beachten Sie, dass nicht jede natürliche Zahl eine Gödelnummer ist und
auch nicht jede Gödelnummer eine Formel beschreibt, die, wie hier ge-
fordert, genau eine freie Variable besitzt. Deswegen sind in der Tabelle
mehrere Zeilen vorhanden, die keine Einträge besitzen.

Nun sind wir nicht an offenen, sondern an geschlossenen Formeln inter-


essiert. Diese können wir erhalten, indem wir in der Formel ϕi (ξ ) die
222 4 Beweistheorie

Tabelle 4.2: Abgebildet ist ein Ausschnitt


0 1 2 3 4 5 6 7 8 g
einer unendlich großen Tabelle, die alle
arithmetischen Formeln mit einer einzi- ... ...
gen freien Variablen enthält. Die Tabel-
le ist so aufgebaut, dass die Formel mit ϕ1 (ξ )          ...  ...
der Gödelnummer i in der i-ten Zeile steht ... ...
und alle Zeilen leer gelassen sind, de-
ren Zeilennummer nicht die Gödelnum- ... ...
mer einer Formel mit einer freien Varia-
ϕ4 (ξ )          ...  ...
blen ist. Die Tabelle enthält unendlich vie-
le Spalten, von denen jede einzelne mit ϕ5 (ξ )          ...  ...
einer natürlichen Zahl n markiert ist. Ist
die Formel ϕi (n) innerhalb der Peano- ϕ6 (ξ )          ...  ...
Arithmetik beweisbar, so enthält die i-te ... ...
Zeile in der n-ten Spalte den Eintrag .
Ist sie es nicht, so ist das entsprechen- ϕ8 (ξ )          ...  ...
de Feld mit  markiert. In seiner Arbeit .. .. .. .. .. .. .. .. .. .. ..
aus dem Jahr 1931 hat Gödel dargelegt, . . . . . . . . . . .
dass sich auf der Hauptdiagonalen ein un-
ϕg (ξ )          ...  ...
entscheidbarer Satz befinden muss. Hier-
zu konstruierte er eine natürliche Zahl g, .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . .
für die er anschließend zeigte, dass weder
ϕg (g) noch ¬ϕg (g) innerhalb der Peano- ¬ϕg (ξ )          ...  ...
Arithmetik beweisbar sein kann.

freie Variable durch einen arithmetischen Term der Form n ersetzen.


Auf diese Weise entsteht für jede Zahl n ∈ N eine geschlossene For-
mel ϕi (n). Einige dieser Formeln sind innerhalb der Peano-Arithmetik
beweisbar ( ϕ(n)), andere sind es nicht ( ϕ(n)). Um die Beweisbar-
keitseigenschaft in unserer Tabelle sichtbar zu machen, existiert für jede
natürliche Zahl n ∈ N eine separate Spalte. Steht in der i-ten Zeile und
n-ten Spalte unserer Tabelle das Zeichen , so ist die Formel ϕi (n) be-
weisbar. Andernfalls ist das Feld mit dem Symbol  markiert.

In seinem Beweis machte sich Gödel eine trickreiche Argumentation


zu eigen, die dem Cantor’schen Diagonalargument aus Abschnitt 1.2.2
sehr ähnlich ist. Es gelang ihm zu zeigen, dass sich auf der Hauptdiago-
nalen unserer Tabelle mindestens eine Formel befinden muss, die inner-
halb der Peano-Arithmetik unentscheidbar ist. Konkret bedeutet dieses
Ergebnis, dass eine natürliche Zahl g ∈ N existiert, für die weder ϕg (g)
noch ¬ϕg (g) beweisbar ist.

Wir werden nun herausarbeiten, wie sich der Wert von g berechnen
lässt. Hierzu betrachten wir zunächst die Funktion diag(y) und die Re-
4.2 Der erste Unvollständigkeitssatz 223

Dass wir mit x B y eine primitiv-rekursive


Relation vor uns haben, ist keinesfalls
selbstverständlich. Tatsächlich erstreckt
sich der Beweis in Gödels Arbeit über
sechs eng beschriebene Seiten. Gödel erzielte sein
Resultat, indem er insgesamt 45 primitiv-rekursive
Funktionen und Relationen definierte, die aufeinan-
der aufbauen und immer komplexer werdende Sach-
verhalte ausdrücken. Aus heutiger Sicht wirken die-
se Funktionen und Relationen wie die Hilfsroutinen
eines Computerprogramms, und dieser Vergleich ist
durchaus angebracht. Heute wissen wir, dass jede
Funktion, die von einem Programm ohne die Verwen-
dung von While-Schleifen berechnet werden kann,
primitiv-rekursiv ist und sich jede primitiv-rekursive
Funktion in ein ebensolches Programm übersetzen
lässt [96]. Auch wenn die Notation den Blick darauf
versperrt, verbirgt sich im Beweis des ersten Unvoll-
ständigkeitssatzes eines der ersten Computerprogram-
me des zwanzigsten Jahrhunderts. Gödel konnte dies Wie Sie sehen, definiert Gödel in seiner Originalarbeit nicht
freilich noch nicht wissen. Im Jahr 1931 waren pro- 45, sondern 46 Funktionen und Relationen. Die letzte ist die
grammierbare Computer, wie wir sie heute kennen, Beweisrelation Bew, die uns in Abschnitt 4.2.6 begegnen wird.
Anders als die ersten 45 Funktionen und Relationen ist diese
noch in weiter Ferne. aber nicht primitiv-rekursiv.

lation x B y, die folgendermaßen definiert sind:



ϕy (y) falls y = ϕy (ξ )
diag(y) :=
0 sonst
x codiert einen Beweis
x B y :⇔
für die Formel mit der Gödelnummer y
Die Definition der Funktion diag(y) besagt, dass die Gödelnummer y
der Formel ϕy (ξ ) auf die Gödelnummer der Formel ϕy (y) abgebildet
wird. Die Formel ϕy (y) ist das y-te Diagonalelement in unserer Tabelle.
Ist y keine Gödelnummer oder die Gödelnummer einer Formel mit kei-
nen oder mehr als einer freien Variablen, so spielt der Funktionswert für
uns keine Rolle. Wir haben hier, eher willkürlich, den Wert 0 gewählt.

Und was sagt die Relation x B y genau aus? Zunächst halten wir fest,
dass x und y natürliche Zahlen sind und wir x als die Gödelnummer
eines Beweises und y als die Gödelnummer einer arithmetischen Formel
ϕ interpretieren. Per Definition stehen x und y genau dann in Relation
zueinander, wenn x einen Beweis für ϕ codiert. Anders gesagt: x codiert
224 4 Beweistheorie

eine Sequenz von Formeln, die ϕ in endlich vielen Schritten aus den
Axiomen der Peano-Arithmetik ableitet.

In seiner Originalarbeit hat Gödel bewiesen, dass sowohl diag als auch
B primitiv-rekursiv sind. Aus den Sätzen 4.5 und 4.6 folgt dann, dass die
Funktion diag durch eine Formel Diag(y, z) und die Relation B durch
eine Formel B(x, y) syntaktisch repräsentiert werden. Für diese Formeln
gilt also:

diag(y) = z ⇒  ∀ z (Diag(y, z) ↔ z = z) (4.12)

(x, y) ∈ B ⇒  B(x, y) (4.13)


(x, y) ∈ B ⇒  ¬B(x, y) (4.14)

Als Nächstes konstruieren wir aus Diag und B die Formel

ψGdl (x, y) := ∃ z (Diag(y, z) ∧ B(x, z))

Aus den Beziehungen (4.12) bis (4.14) können wir mit etwas Umfor-
mungsaufwand die folgenden Schlüsse ziehen:

x codiert einen Beweis für die Formel ϕy (y) ⇒  ψGdl (x, y)


x codiert keinen Beweis für die Formel ϕy (y) ⇒  ¬ψGdl (x, y)

Damit ist klar, welche Bedeutung die Formel ψGdl (x, y) innehat. Sie ist
die syntaktische Repräsentation der Relation

Gdl(x, y) :⇔ x ist die Gödelnummer eines Beweises von ϕy (y)

Per Definition stehen x und y genau dann in Relation zueinander, wenn


x einen Beweis für die Formel ϕy (y) codiert. Anders gesagt: x codiert
eine Sequenz von Formeln, die das Diagonalelement ϕy (y) in endlich
vielen Schritten aus den Axiomen der Peano-Arithmetik ableitet.

Jetzt konstruieren wir aus ψGdl (x, y) die Formel

ϕg (y) := ∀ x ¬ψGdl (x, y) (4.15)

Das Ergebnis ist eine arithmetische Formel mit genau einer freien Va-
riablen. Sie kommt in der g-ten Zeile unserer Tabelle vor und ist jene
Formel, nach der wir gesucht haben. Sie besitzt die faszinierende Ei-
genschaft, dass ihre diagonalisierte Aussage ϕg (g) innerhalb von PA
unentscheidbar ist, d. h., weder ϕg (g) noch ¬ϕg (g) lassen sich aus den
Axiomen der Peano-Arithmetik herleiten. Warum dies so ist, werden
wir jetzt begründen:
4.2 Der erste Unvollständigkeitssatz 225

I Angenommen, es gelte  ϕg (g). Weiter oben haben wir her-


ausgestellt, dass Gödels Be-
Wäre ϕg (g) beweisbar, so müsste eine Gödelnummer m existieren,
weis im Kern auf der Kon-
die den Beweis dieser Formel codiert. ϕg (g) ist das Diagonalelement struktion einer Aussage be-
der Formel ϕg (ξ ), und somit gilt Gdl(m, g). Da ψGdl die Relation ruht, die ihre eigene Unbeweisbarkeit po-
Gdl syntaktisch repräsentiert, folgt daraus stuliert. Ohne explizit darauf hinzuwei-
sen, haben wir diese Formel mit ϕg (g) be-
 ψGdl (m, g) (4.16) reits konstruiert. Warum dies so ist, lässt
sich leicht einsehen. Zunächst ist ϕg (g)
Die Annahme  ϕg (g) lautet ausgeschrieben  ∀ x ¬ψGdl (x, g). In-
das Diagonalelement von
stanziieren wir die Variable x mit m, so erhalten wir mit
ϕg (y) = ∀ x ¬ψGdl (x, y)
 ¬ψGdl (m, g)
Jede konkrete Instanz ϕg (y) besagt, dass
einen unmittelbaren Widerspruch zu (4.16). Die Formel ϕg (g) kann kein x die Gödelnummer eines Beweises
nur dann beweisbar sein, wenn die Peano-Arithmetik widersprüch- für das Diagonalelement ϕy (y) ist:
lich ist. In diesem Fall könnten wir jede beliebige arithmetische For-
mel aus den Axiomen ableiten. ϕg (y) = „ϕy (y) ist nicht beweisbar.“

I Angenommen, es gelte  ¬ϕg (g). Dann trägt die Formel ϕg (g) aber die fol-
gende inhaltliche Aussage in sich:
Die Annahme lautet ausgeschrieben  ¬∀ x ¬ψGdl (x, g), und daraus
folgt ϕg (g) = „ϕg (g) ist nicht beweisbar.“
 ∃ x ψGdl (x, g) (4.17)
Oder, was gleichbedeutend ist:
Ist die Peano-Arithmetik widerspruchsfrei, so ist nicht gleichzeitig
die Formel ϕg (g) beweisbar. Das bedeutet, dass keine natürliche ϕg (g) = „Ich bin nicht beweisbar.“
Zahl die Gödelnummer eines Beweises für ϕg (g) sein kann. Es gilt Nicht selten wird Gödels Beweis dahinge-
also hend missverstanden, dass er auf der se-
mantischen Bedeutung von ϕg (g) beruht.
(0, g) ∈ Gdl, (1, g) ∈ Gdl, (2, g) ∈ Gdl, (3, g) ∈ Gdl, . . . Einige Kritiker sehen in der Konstruktion
von ϕg (g) sogar einen irregulären Selbst-
Da ψGdl die Relation Gdl syntaktisch repräsentiert, können wir die
bezug, der Parallelen zur Russell’schen
folgenden Schlüsse ziehen: Antinomie aufweist und die Legitimität
 ¬ψGdl (0, g) (4.18) des Beweises in Frage stellt. Wenn Sie die
Ausführungen auf diesen Seiten nochmals
 ¬ψGdl (1, g) (4.19) durchgehen, werden Sie jedoch schnell
 ¬ψGdl (2, g) (4.20) bemerken, dass wir die Formel ϕg (g) gar
nicht inhaltlich gedeutet haben. Dass we-
... der ϕg (g) noch ¬ϕg (g) beweisbar sein
kann, sofern die Peano-Arithmetik frei
Damit haben wir uns in eine prekäre Situation manövriert. Wäre von Widersprüchen ist, haben wir rein
¬ϕg (g) innerhalb der Peano-Arithmetik beweisbar, so wäre es auch auf der syntaktischen Ebene gezeigt. Den-
die Formel (4.17). Diese besagt, dass innerhalb der Menge der na- noch hilft die semantische Interpretation
türlichen Zahlen eine Zahl x existieren muss, für die ψGdl (x, g) wahr von ϕg (g) dabei, den Gödel’schen Be-
ist. Auf der anderen Seite scheinen die Formeln (4.18), (4.19), (4.20) weis zu verstehen. Sie gibt einen Hin-
usw. genau dies zu widerlegen. Für jede beliebige natürliche Zahl x weis darauf, warum in jedem hinreichend
können wir die Formel  ¬ψGdl (x, g) beweisen. Offensichtlich ist es ausdrucksstarken formalen System unent-
uns gelungen, einen Widerspruch zu erzeugen. Oder etwa nicht? scheidbare Sätze existieren müssen.
226 4 Beweistheorie

Über den augenscheinlich entstandenen Widerspruch dürfen wir nicht


allzu schnell hinweggehen. Wir haben ihn erhalten, weil wir die bewie-
senen Formeln semantisch interpretiert haben. Hätten wir die Korrekt-
heit der Peano-Arithmetik vorausgesetzt, hätten wir also angenommen,
dass sich nur wahre arithmetische Aussagen aus den Axiomen ableiten
lassen, so wären wir tatsächlich am Ziel. Ganz offensichtlich können die
Formeln (4.17), (4.18), (4.19), (4.20), ... nicht gleichzeitig wahr sein.

In der syntaktischen Variante des ersten Gödel’schen Unvollstän-


digkeitssatzes ist aber lediglich die Widerspruchsfreiheit der Peano-
Arithmetik gefordert. Um hiergegen einen Einwand zu erheben, müs-
sen wir für eine gewisse Formel ϕ zeigen, dass sowohl ϕ als auch
¬ϕ beweisbar sind. Dies ist uns mit den Formeln (4.17), (4.18), (4.19),
(4.20), . . . aber nicht gelungen. Auch wenn sie nicht gleichzeitig wahr
sein können, erzeugen sie auf der syntaktischen Ebene keinen Wider-
spruch. Gödel sah sich mit genau diesem Problem konfrontiert und
konnte es nur lösen, indem er nicht die Widerspruchsfreiheit, sondern
die ω-Widerspruchsfreiheit zur Voraussetzung des ersten Unvollstän-
digkeitssatzes erhob. Was wir unter diesem Begriff genau zu verstehen
haben, klärt die folgende Definition:

Definition 4.7 (ω-Widerspruchsfreiheit)

Ein formales System (Kalkül) heißt ω-widerspruchsfrei, wenn


I es widerspruchsfrei ist und die folgende Eigenschaft erfüllt:
I Gilt  ¬ϕ(n) für alle n ∈ N, so folgt daraus  ∃ x ϕ(x).

Die ω-Widerspruchsfreiheit ist eine stärkere Eigenschaft als die Wider-


spruchsfreiheit. Ganz offensichtlich ist jedes ω-widerspruchsfreie for-
male System auch widerspruchsfrei, nicht aber umgekehrt.

Mit dem neuen Begriff sind wir in der Lage, jene Variante des ersten
Unvollständigkeitssatzes zu formulieren, die Gödel in seiner Original-
arbeit bewiesen hat. In moderner Sprechweise lautet sie wie folgt:

Satz 4.7 (Gödel, 1931)

Jedes ω-widerspruchsfreie formale System, das stark genug ist, um


die Peano-Arithmetik zu formalisieren, ist negationsunvollständig.

Mit diesem Ergebnis hat unsere Reise auf Gödels historischem Pfad ein
erfolgreiches Ende gefunden. Zumindest für den Moment.
4.2 Der erste Unvollständigkeitssatz 227

4.2.5 Rossers Beitrag Um die Konstruktion der


Rosser’schen Formel ϕr zu
verstehen, wollen wir zu-
In seiner ursprünglichen Formulierung macht der erste Gödel’sche Un- nächst die inhaltliche Be-
vollständigkeitssatz eine Aussage über ω-widerspruchsfreie formale deutung der Gödel’schen Formel ϕg re-
Systeme. Dass sich die Annahme der ω-Widerspruchsfreiheit durch kapitulieren. Weiter oben haben wir her-
die schwächere Annahme der Widerspruchsfreiheit ersetzen lässt, wur- ausgearbeitet, dass jede konkrete Instanz
de erst 1936 von dem US-amerikanischen Mathematiker John Barkley ϕg (y) für die Aussage
Rosser bewiesen, rund fünf Jahre nach der Publikation der Unvollstän-
digkeitssätze [164, 184]. „ϕy (y) ist nicht beweisbar“

steht und das Diagonalelement ϕg (g) da-


Es ist ein bemerkenswerter Aspekt seiner Arbeit, dass Rosser die Gö-
mit der folgenden Aussage entspricht:
del’sche Argumentationslinie fast vollständig beibehalten konnte. Um
den Unvollständigkeitssatz in seiner vollen Allgemeinheit zu beweisen, „Ich bin nicht beweisbar.“
reicht es, die Gödel’sche Formel ϕg (y) durch die Rosser’sche Formel
Die Rosser’sche Formel lässt sich auf die
ϕr (y) := ∀ x (ψGdl (x, y) → ∃ (z ≤ x) ψGdl (z, y)) (4.21) gleiche Weise analysieren. Übersetzen wir
die einzelnen Formelbestandteile in die
zu ersetzen. Der Austausch von ϕg (g) durch ϕr (r) wird in der Literatur natürliche Sprache, so lässt sich die inhalt-
häufig als Rossers Trick bezeichnet. liche Bedeutung von ϕr (y) folgenderma-
ßen ausdrücken:
Die in (4.21) verwendete Teilformel ψGdl (z, y) kommt an dieser Stelle
das erste Mal vor. Sie ist die syntaktische Repräsentation der folgenden „Ist ϕy (y) beweisbar, so existiert ein
primitiv-rekursiven Relation: kürzerer Beweis für ¬ϕy (y).“

Damit entspricht das Diagonalelement


Gdl (x, y) :⇔ x ist die Gödelnummer eines Beweises von ¬ϕy (y)
ϕr (r) der Aussage
Wir werden nun zeigen, dass die Formel ϕr (r) innerhalb der Peano-
„Ist ϕr (r) beweisbar, so existiert ein
Arithmetik unentscheidbar ist. kürzerer Beweis für ¬ϕr (r)“

I Angenommen, es gelte  ϕr (r). oder, was gleichbedeutend ist:


Wäre ϕr (r) beweisbar, so müsste eine Gödelnummer m existieren, „Wenn ich beweisbar bin, so existiert ein
die den Beweis dieser Formel codiert. ϕr (r) ist das Diagonalelement kürzerer Beweis für meine Negation.“
der Formel ϕr (ξ ), und somit gilt Gdl(m, r). Da ψGdl die Relation
Gdl syntaktisch repräsentiert, folgt daraus Unter der Annahme der Widerspruchsfrei-
heit ist diese Aussage aber äquivalent zu
 ψGdl (m, r) (4.22)
„Ich bin nicht beweisbar.“
Die Annahme  ϕr (r) lautet ausgeschrieben
Unsere Betrachtung zeigt, dass zwischen
 ∀ x (ψGdl (x, r) → ∃ (z ≤ x) ψGdl (z, r)) dem Gödel’schen und dem Rosser’schen
Diagonalelement kein semantischer Un-
Instanziieren wir die Variable x mit m, so erhalten wir terschied besteht; beide postulieren ih-
re eigene Unbeweisbarkeit. Die Art und
 ψGdl (m, r) → ∃ (z ≤ m) ψGdl (z, r) (4.23) Weise, wie beide Formeln ihre inhaltliche
Aussage codieren, ist dagegen eine völ-
Mit der Modus-ponens-Schlussregel folgt aus (4.22) und (4.23) lig andere, und genau hierin liegt das Ge-
heimnis des Rosser’schen Beweises.
 ∃ (z ≤ m) ψGdl (z, r) (4.24)
228 4 Beweistheorie

ez 5 Sep John Barkley Rosser wurde am 6. dem Church-Rosser-Theorem verbunden, das die Konflu-
6 D
1907 1989
Dezember 1907 in Jacksonville ge- enzeigenschaft gewisser Termersetzungssysteme garantiert
boren. An der University of Florida (Theorem 2 in [34]). Einen hohen Bekanntheitsgrad erziel-
studierte er Physik und wechselte te Rosser nicht zuletzt durch mehrere Bücher, die heute zur
nach seinem Master-Abschluss an die renommierte Prince- Standardliteratur der mathematischen Logik zählen [165–
ton University, wo er 1935 unter Alonzo Church in mathe- 167].
matischer Logik promovierte [163]. Nach kürzeren Aufent- Rosser war nicht nur Theoretiker. Während des zweiten
halten in Princeton und Harvard erhielt er 1936 den Ruf an Weltkriegs beschäftigte er sich mit der Konstruktion balli-
die Cornell University, die für die nächsten 30 Jahre zu sei- stischer Raketen und übernahm später wichtige Beraterposi-
ner wissenschaftlichen Heimat werden sollte. tionen in der Weltraum- und Militärforschung. Im Jahr 1963
Rosser ist neben der Verbesserung des Gödel’schen Bewei- wurde er zum Direktor des Army Mathematics Research
ses (Rossers Trick) vor allem für seine Arbeiten auf dem Centers (AMRC) ernannt, einer Einrichtung des US-Militärs
Gebiet der Rekursionstheorie bekannt. Im Jahr 1935 sorg- zur strategischen Unterstützung der US-Invasion in Vietnam.
te er für Aufsehen, als er zusammen mit Stephen Cole In dieser Rolle war er nicht unumstritten; öffentlich demen-
Kleene einen Widerspruch in der ursprünglichen Formu- tierte er jegliche Beteiligung des AMRC an militärischen
lierung des λ -Kalküls von Alonzo Church fand (Kleene- Projekten. Im Jahr 1973 ging Rosser in den Ruhestand und
Rosser-Paradoxon). Heute wird sein Name vor allem mit starb am 5. September 1989 mit 81 Jahren.

Ist die Peano-Arithmetik widerspruchsfrei, so ist nicht gleichzeitig


die Formel ¬ϕr (r) beweisbar. Das bedeutet, das keine natürliche
Zahl die Gödelnummer eines Beweises für ¬ϕr (r) sein kann. Es gilt
also:

 ¬ψGdl (0, r) (4.25)


 ¬ψGdl (1, r) (4.26)
 ¬ψGdl (2, r) (4.27)
...

Aus (4.25) und (4.26) folgt

 ¬∃ (z ≤ 1) ψGdl (z, r)

Nehmen wir Formel (4.27) hinzu, so können wir

 ¬∃ (z ≤ 2) ψGdl (z, r)

herleiten. Fahren wir in dieser Weise fort, so erhalten wir irgend-


wann

 ¬∃ (z ≤ m) ψGdl (z, r),

im Widerspruch zu (4.24). Das Diagonalelement ϕr (r) kann also nur


dann beweisbar sein, wenn die Peano-Arithmetik widersprüchlich
ist.
4.2 Der erste Unvollständigkeitssatz 229

I Angenommen, es gelte  ¬ϕr (r)


Die Annahme lautet ausgeschrieben

 ¬∀ x (ψGdl (x, r) → ∃ (z ≤ x) ψGdl (z, r)) (4.28)

Sei m die Gödelnummer eines Beweises für ¬ϕr (r). Dann gilt:

 ψGdl (m, r)

Die Peano-Arithmetik ist ausdrucksstark genug, um hieraus die fol-


gende, inhaltlich abgeschwächte Aussage abzuleiten:

 ∀ x ((m ≤ x) → ∃ (z ≤ x) ψGdl (z, r)) (4.29)

Ist die Peano-Arithmetik widerspruchsfrei, so ist nicht gleichzeitig


die Formel ϕr (r) beweisbar. Das bedeutet, dass keine natürliche Zahl
die Gödelnummer eines Beweises für ϕr (r) sein kann. Es gilt also:

 ¬ψGdl (0, r)
 ¬ψGdl (1, r)
 ¬ψGdl (2, r)
...

Genau wie im ersten Fall lassen sich hieraus nacheinander die fol-
genden Theoreme herleiten:

 ¬∃ (z ≤ 1) ψGdl (z, r)
 ¬∃ (z ≤ 2) ψGdl (z, r)
...
 ¬∃ (z ≤ m − 1) ψGdl (z, r)

Aus diesen Ergebnissen können wir innerhalb der Peano-Arithmetik


den folgenden Schluss ziehen:

 ∀ x (ψGdl (x, r) → (m ≤ x)) (4.30)

Kombinieren wir die Ergebnisse (4.30) und (4.29) transitiv mitein-


ander, so erhalten wir das folgende Theorem:

 ∀ x (ψGdl (x, r) → ∃ ( z ≤ x)ψGdl (z, r)) (4.31)

Damit haben wir es geschafft, mit (4.28) und (4.31) ein komplemen-
täres Formelpaar abzuleiten. Wäre ¬ϕr (r) also tatsächlich beweis-
bar, so hätten wir die Peano-Arithmetik als widersprüchlich identifi-
ziert.
230 4 Beweistheorie

Das Eingangszitat, mit dem Wir sind so weit, die Früchte unserer Arbeit zu ernten. Dank Rossers
der Abschnitt über das Dia- Trick können wir die Forderung der ω-Widerspruchsfreiheit fallen las-
gonalisierungslemma beginnt, stammt aus sen und durch die schwächere Widerspruchsfreiheit ersetzen:
der Arbeit On Undecidable Propositions
of Formal Mathematical Systems [70].
Hierbei handelt es sich um eine überar- Satz 4.8 (Rosser, 1936)
beitete Mitschrift der berühmten Prince-
ton lectures, die Gödel im Frühjahr 1934 Jedes widerspruchsfreie formale System, das stark genug ist, um
am Institute for Advanced Study abhielt. die Peano-Arithmetik zu formalisieren, ist negationsunvollständig.
Im Original ist die zitierte Textstelle mit
einer Fußnote versehen, in der Gödel die
Urheberschaft des Prinzips offenlegt. Es Dieser Satz wird in der Literatur häufig als das Gödel-Rosser-Theorem
heißt dort:
bezeichnet und ist im Wortlaut mit Satz 4.2 identisch. Es ist jenes Theo-
„This was first noted by R. Carnap in: rem, das wir als die syntaktische Variante des ersten Gödel’schen Un-
Logische Syntax der Sprache, Wien, vollständigkeitssatzes bezeichnet haben.
1934, page 91.“

Sehen wir bei Carnap nach, so finden wir


dort in der Tat eine Konstruktion beschrie- 4.2.6 Das Diagonalisierungslemma
ben, die dem klassischen Diagonalisie-
rungsmuster folgt: „It is even possible, for any metamathematical property
f which can be expressed in the system, to construct a
„Es sei eine beliebige syntaktische
proposition which says of itself that it has this property.“
Eigenschaft von Ausdrücken gewählt [...].
S1 sei derjenige Satz mit der freien
Variablen ‚x‘ (für die wir die Gliedzahl 3 Kurt Gödel [70]
nehmen wollen), der diese Eigenschaft
ausdrückt [...]. S2 entstehe aus S1 , In den vorangegangenen Abschnitten haben wir mehrfach herausge-
indem für ‚x‘ ‚subst[x,3, str(x)]‘ stellt, wie trickreich Gödel seine unentscheidbare Formel ϕg (g) kon-
eingesetzt wird. [...] Ist S2 aufgestellt, so struiert hat. ϕg (g) ist das Diagonalelement von ϕg (y), und für jede na-
kann daher die Reihenzahl von S2 türliche Zahl y behauptet die Instanz ϕg (y), dass sich das Diagonalele-
berechnet werden; sie sei mit ‚b‘
ment der Formel mit der Gödelnummer y nicht aus den Axiomen der
bezeichnet. Der Satz ‚subst [b, 3, str(b)]‘
sei S3 ; S3 ist also der Satz, der aus S2
Peano-Arithmetik herleiten lässt. Die natürliche Zahl g ist die Gödel-
dadurch entsteht, daß für ‚x‘ das St mit nummer der Formel ϕg (y), und damit behauptet die Formel ϕg (g) nichts
dem Wert b eingesetzt wird. Man kann anderes als ihre eigene Unbeweisbarkeit!
sich leicht klarmachen, daß S3 bei
syntaktischer Deutung besagt, S3 selbst Über die Beweisbarkeit einer Formel können wir auch innerhalb der
habe die gewählte syntaktische Peano-Arithmetik sprechen. Setzen wir
Eigenschaft.“
Bew(y) := ¬∃ x B(x, y),
Carnaps Konstruktionsidee ist exakt jene,
mit der wir auf Seite 231 das Diagonali- so drückt die Formel Bew(y) aus, dass für die Formel mit der Gödel-
sierungslemma beweisen werden. S1 , S2 nummer y kein Beweis existiert. Damit können wir die inhaltliche Aus-
und S3 sind das Gleiche wie die dort ver- sage von ϕg (g) direkt in eine Formel der Peano-Arithmetik übertragen;
wendeten Formeln χ, ψ und γ. sie entspricht der Formel

ϕg (g) ↔ ¬Bew(ϕg (g)) (4.32)


4.2 Der erste Unvollständigkeitssatz 231

Am Ende dieses Abschnitts werden wir die Erkenntnis in Händen hal-


ten, dass die Peano-Arithmetik zu weit mehr fähig ist, als die Nieder-
schrift dieser Formel zuzulassen. Sie ist gleichsam in der Lage, sie auch
zu beweisen:
 ϕg (g) ↔ ¬Bew(ϕg (g))
Wir werden dieses Ergebnis als Spezialfall eines sehr allgemeinen Re-
sultats erzielen, das in der Literatur meistens als Diagonalisierungslem-
ma und manchmal als Fixpunktsatz bezeichnet wird:

Satz 4.9 (Diagonalisierungslemma, Fixpunktsatz)

Zu jeder PA-Formel χ(ξ ) existiert eine PA-Formel γ mit

 γ ↔ χ(γ)

Für den Beweis dieses Satzes konstruieren wir aus χ(ξ ) zunächst die
Formel
ψ(y) := ∀ z (Diag(y, z) → χ(z))
Die Formel Diag haben wir bereits auf Seite 224 kennen gelernt. Sie ist
die syntaktische Repräsentation der Diagonalisierungsfunktion diag(y),
die eine natürliche Zahl y auf die Gödelnummer der Formel ϕy (y) ab-
bildet. Damit liegt die inhaltliche Bedeutung von ψ auf der Hand: Für
eine beliebig gewählte natürliche Zahl y drückt die Formelinstanz ψ(y)
aus, dass dem Diagonalelement ϕy (y) die Eigenschaft χ zukommt.

Eine dieser Formelinstanzen ist die Formel γ, mit der wir das Diagona-
lisierungslemma beweisen werden. Sie entsteht, indem wir ψ(y) selbst
diagonalisieren, also y durch die Gödelnummer von ψ ersetzen:

γ := ψ(ψ)
= ∀ z (Diag(ψ, z) → χ(z))

Wir werden nun zeigen, dass diese Formel die postulierte Eigenschaft
 γ ↔ χ(γ) erfüllt. Bevor wir die Ableitungssequenz offenlegen, er-
innern wir uns daran, dass die Formel Diag(y, z) die Funktion diag(y)
syntaktisch repräsentiert, und das bedeutet Folgendes:

diag(y) = z ⇒  ∀ z (Diag(y, z) ↔ z = z) (4.33)

Per Definition ist γ ist das Diagonalelement von ψ, es ist also

diag(ψ) = γ
232 4 Beweistheorie

Im Beweis des Diagonali- Aus (4.33) folgt dann


sierungslemmas haben wir
darauf vertraut, dass aus  ∀ z (Diag(ψ, z) ↔ z = γ) (4.34)
dem Theorem χ(γ) das
Theorem z = γ → χ(z) deduziert wer- und daraus wiederum
den kann. Tatsächlich ist die Herleitung
aufwendiger als gedacht: Sie basiert auf  Diag(ψ, γ) (4.35)
der Substitutionseigenschaft der Gleich-
heit, die sich formal so erfassen lässt: Sind  Diag(ψ, z) → z = γ (4.36)
x und y gleich und ist E eine Eigenschaft,
so kommt x genau dann die Eigenschaft E Damit ist die Vorarbeit erledigt, und wir können uns an die Herleitung
zu, wenn sie y zukommt: der Formel χ(γ) ↔ γ wagen. Diese gelingt am einfachsten, wenn
beide Richtungen der Äquivalenz zunächst getrennt bewiesen werden:
x = y ⇒ (E(x) ⇔ E(y))

Aufgrund der Symmetrie der Gleichheit I Richtung von links nach rechts:  γ → χ(γ)
können wir auch die folgende, gleichwer-
tige Charakterisierung wählen: 1. { γ }  γ (Satz 2.4)
2. { γ }  ∀ z (Diag(ψ, z) → χ(z)) (Def)
x = y ⇒ (E(y) ⇒ E(x))
3.  ∀ z (Diag(ψ, z) → χ(z)) →
Die Peano-Arithmetik ist stark genug, um (Diag(ψ, γ) → χ(γ)) (A4)
die Substitutionseigenschaft zu beweisen;
dort ist jede Formel der Form 4. { γ }  Diag(ψ, γ) → χ(γ) (MP, 2,3)
5.  Diag(ψ, γ) (4.35)
ξ = ζ → (ϕ(ζ ) → ϕ(ξ )) ()
6. { γ }  χ(γ) (MP, 4,5)
ein Theorem. Von hier aus ist die gesuchte 7.  γ → χ(γ) (DT)
Herleitung einfach. Aus
I Richtung von rechts nach links:  χ(γ) → γ
 z = y → (χ(y) → χ(z))
8. {χ(γ)}  χ(γ) (Satz 2.4)
folgt
...
 z = γ → (χ(γ) → χ(z)) 9. {χ(γ)}  z = γ → χ(z) (aus 8)
und daraus wiederum 10.  Diag(ψ, z) → z = γ (4.36)
11. {χ(γ)}  Diag(ψ, z) → χ(z) (MB, 10,9)
 χ(γ) → (z = γ → χ(z))
12. {χ(γ)}  ∀ z (Diag(ψ, z) → χ(z)) (G, 11)
Zusammen mit  χ(γ) liefert der Mo- 13. {χ(γ)}  γ (Def)
dus ponens das gewünschte Ergebnis:
14.  χ(γ) → γ (DT)
 z = γ → χ(z)
I Beide Teilergebnisse zusammen ergeben die Behauptung
Es bleibt zu zeigen, dass alle Formeln der
Bauart () auch wirklich Theoreme sind, ...
und genau hier verbirgt sich der eigent- 15.  γ ↔ χ(γ) (aus 7 und 14)
liche Aufwand. Es ist ein induktiver Be-
weis über den Formelaufbau notwendig,
der ausführlich in [125] beschrieben ist. Damit ist das Diagonalisierungslemma bewiesen. 
4.2 Der erste Unvollständigkeitssatz 233

Wir kommen nun auf unser ursprüngliches Vorhaben zurück, den Be- I ϕg (y)
weis der Formel
Definition von ϕg (y)
ϕg (g) ↔ ¬Bew(ϕg (g)) (4.37)
I ∀ x ¬ψGdl (x, y)
Das Diagonalisierungslemma bringt uns hier nur teilweise weiter. Es
garantiert zwar die Existenz einer Formel γ mit
Definition von ψGdl
γ ↔ ¬Bew(γ), I ∀ x ¬∃ z (Diag(y, z) ∧ B(x, z))

macht jedoch keine weitergehende Aussage darüber, wie die Formel γ Hineinziehen der Negation
konkret aussieht. Es wäre ein plumper Zufall, wenn die Formel γ mit
I ∀ x ∀ z (¬Diag(y, z) ∨ ¬B(x, z))
der Gödel’schen Formel ϕg (g) identisch wäre.
Definition der Implikation
Trotzdem sind wir unserem Ziel sehr nahe: Wir können (4.37) näm-
lich nach dem gleichem Muster beweisen wie das Diagonalisierungs- I ∀ x ∀ z (Diag(y, z) → ¬B(x, z))
lemma selbst. Eine geringfügige Modifikation der Ableitungssequenz
reicht hierfür aus. Vertauschen der Quantoren
Wir wiederholen jetzt den Beweis des Diagonalisierungslemmas, ver- I ∀ z ∀ x (Diag(y, z) → ¬B(x, z))
wenden für die Formel ψ(y) aber die Gödel’sche Formel ϕg (y). Dann
ist γ = ϕg (g) und x ∈ Diag(y, z)

diag(g) = diag(ϕg (y)) = γ I ∀ z (Diag(y, z) → ∀ x ¬B(x, z))

Hieraus folgt, analog zu (4.34), die Beziehung Herausziehen der Negation

I ∀ z (Diag(y, z) → ¬∃ x B(x, z))


 ∀ z (Diag(g, z) ↔ z = ϕg (g)) (4.38)
Definition von Bew
und daraus wiederum
I ∀ z (Diag(y, z) → ¬Bew(z))
 Diag(g, ϕg (g)) (4.39)
 Diag(g, z) → z = ϕg (g) (4.40) Abbildung 4.12: Alle der hier gezeigten
Umformungen lassen sich innerhalb der
Peano-Arithmetik nachbilden.
Abbildung 4.12 zeigt, dass die Formel ϕg (y) logisch äquivalent zu der
Formel
∀ z (Diag(y, z) → ¬Bew(z))
ist. Um die Äquivalenz zu zeigen, wurden lediglich elementare prä-
dikatenlogische Umformungen benutzt, die sich innerhalb der Peano-
Arithmetik nachbilden lassen. Das bedeutet, dass wir in PA das Theo-
rem
 ϕg (y) ↔ ∀ z (Diag(y, z) → ¬Bew(z))
ableiten können, und damit gilt erst recht

 ϕg (g) ↔ ∀ z (Diag(g, z) → ¬Bew(z))


234 4 Beweistheorie

Dies wiederum können wir aufteilen in

 ϕg (g) → ∀ z (Diag(g, z) → ¬Bew(z)) (4.41)


 ∀ z (Diag(g, z) → ¬Bew(z)) → ϕg (g) (4.42)

Jetzt sind wir in der Lage, die Ableitungssequenz, die uns das Diagona-
lisierungslemma hervorgebracht hat, in eine Ableitungssequenz für die
Formel (4.37) umzuschreiben.

I Richtung von links nach rechts:  ϕg (g) → ¬Bew(ϕg (g))


1. { ϕg (g) }  ϕg (g) (Satz 2.4)
2.  ϕg (g) → ∀ z (Diag(g, z) → ¬Bew(z)) (4.41)
3. { ϕg (g) }  ∀ z (Diag(g, z) → ¬Bew(z)) (MP, 1,2)
4.  ∀ z (Diag(g, z) → ¬Bew(z)) →
(Diag(g, ϕg (g)) → ¬Bew(ϕg (g))) (A4)
5. { ϕg (g) }  Diag(g, ϕg (g)) → ¬Bew(ϕg (g)) (MP, 3,4)
6.  Diag(g, ϕg (g)) (4.39)
7. { ϕg (g) }  ¬Bew(ϕg (g)) (MP, 5,6)
8.  ϕg (g) → ¬Bew(ϕg (g)) (DT)

I Richtung von rechts nach links:  ¬Bew(ϕg (g)) → ϕg (g)


9. { ¬Bew(ϕg (g)) }  ¬Bew(ϕg (g)) (Satz 2.4)
...
10. { ¬Bew(ϕg (g)) }  z = ϕg (g) → ¬Bew(z) (aus 9)
11.  Diag(g, z) → z = ϕg (g) (4.40)
12. {¬Bew(ϕg (g))}  Diag(g, z) → ¬Bew(z) (MB, 11,10)
13. {¬Bew(ϕg (g))}  ∀ z (Diag(g, z) → ¬Bew(z)) (G, 12)
14.  ∀ z (Diag(g, z) → ¬Bew(z)) → ϕg (g) (4.42)
15. { ¬Bew(ϕg (g)) }  ϕg (g) (MP, 13,14)
16.  ¬Bew(ϕg (g)) → ϕg (g) (DT)

I Beide Teilergebnisse zusammen ergeben die Behauptung


...
17.  ϕg (g) ↔ ¬Bew(ϕg (g)) (aus 8 und 16)

Damit ist die Ziellinie überquert. Wir haben einen Beweis für den fol-
genden Satz gefunden:
4.2 Der erste Unvollständigkeitssatz 235

Satz 4.10

In der Peano-Arithmetik gilt:  ϕg (g) ↔ ¬Bew(ϕg (g))

4.2.7 Das Wahrheitsprädikat von Tarski

„Satz I. (α) Wie auch immer wir in der Metawis-


senschaft das Symbol ‚Wr‘, das eine Klasse von Aus- „[...] it is evident that all these results
only receive a clear content and can
drücken bezeichnet, definieren, so werden wir daraus only then be exactly proved, if a
die Negation eines der Sätze ableiten können, die in der concrete and precisely formulated
Bedingung (α) der Konvention W beschrieben werden; definition of [true] sentence is accepted
as a basis for the investigation“ [194]
(β ) vorausgesetzt also, dass die Klasse aller beweis-
baren Sätze der Metawissenschaft widerspruchsfrei ist,
ist es unmöglich, auf dem Boden der Metawissenschaft
eine zutreffende Definition der Wahrheit im Sinne der
Konvention W zu konstruieren.“

Alfred Tarski [193]

In den vorangegangenen Abschnitten wurde immer wieder betont, wie


wichtig es ist, streng zwischen der Beweisbarkeit und der Wahrheit ei- Alfred Tarski [9]
ner Formel zu unterscheiden. Dass wir heute in dieser Schärfe zwischen (1901 – 1983)
einer syntaktischen und einer semantischen Ebene trennen, ist alles an-
dere als selbstverständlich; es ist das Ergebnis eines langjährigen Pro-
zesses, an dem viele namhafte Mathematiker beteiligt waren. Besonde-
res hat ein Mann beigetragen, der unzweifelhaft zu den großen Logikern
des zwanzigsten Jahrhunderts zählt: Alfred Tarski (Abbildung 4.13).
Seine ersten semantischen Argumente entwickelte Tarski in einem Lo-
gikseminar, das er in den Jahren 1927 bis 1929 an der Universität War-
schau abhielt [74]. 1931 kanalisierte er seine Ideen und publizierte un-
ter dem Titel „Sur les ensembles définissables de nombres réels“ eine
Arbeit, die sich intensiv mit den semantischen Aspekten der Logik aus-
einandersetzt [191, 195]. Tarski definierte dort eine formale Sprache, in
der sich Aussagen über die reellen Zahlen formulieren lassen, und be-
schäftigte sich intensiv mit der Frage, was es bedeutet, eine reelle Zahl
innerhalb der Logik zu „definieren“. Abbildung 4.13: Die solide Fundierung des
Wahrheitsbegriffs gehört zu Tarskis wich-
Seine Arbeit aus dem Jahr 1931 war der Vorläufer einer auf polnisch tigsten Beiträgen zur mathematischen Lo-
verfassten Publikation, die im Rückblick zu Tarskis bedeutendsten Bei- gik. Mit ihr hat er die Tür zur Modelltheorie
trägen zur Logik zählt [192]. Hautsächlich geht es in diesem Werk um aufgestoßen, die fast ausschließlich auf se-
eine solide Definition des Wahrheitsbegriffs und um die Frage, in wie mantischen Argumenten beruht.
236 4 Beweistheorie

Das Zitat, mit dem wir weit sich dieser innerhalb einer formalen Sprache erfassen lässt. Tarski
diesen Abschnitt eingeleitet konstruierte spezielle Wahrheitsprädikate und untersuchte, unter wel-
haben, ist der Originalwort- chen Bedingungen sich diese innerhalb einer Logik definieren lassen.
laut dessen, was wir heu-
te als den Satz von Tarski über die Un- Am Beispiel der Peano-Arithmetik wollen wir herausarbeiten, was der
definierbarkeit der Wahrheit bezeichnen. Begriff des Wahrheitsprädikats genau bedeutet. Der Ausgangspunkt un-
Vielleicht ist Ihnen aufgefallen, dass in serer Untersuchung ist die folgende Definition:
Tarskis Formulierung von einer „Meta-
wissenschaft“ die Rede ist, ein solcher T := {x | x ist die Gödelnummer einer wahren Formel} (4.43)
Begriff in unserer eigenen Darstellung
aber an keiner Stelle auftaucht. Tarskis Die Menge T erfasst den Wahrheitsbegriff auf der Mengenebene; sie
„Metawissenschaft“ ist eine Art Meta-
reduziert die Frage nach der Wahrheit oder der Falschheit einer Formel
sprache, mit der Aufgabe, eine forma-
ϕ auf die Frage, ob die Gödelnummer von ϕ, d. h. die natürliche Zahl
le Sprache L um die notwendigen Aus-
drucksmittel anzureichern, um über den ϕ, zu T gehört oder nicht.
syntaktische Aufbau ihrer Formeln spre-
Als Nächstes wollen wir versuchen, den Wahrheitsbegriff auf der For-
chen zu können. In diesem Abschnitt be-
ziehen wir Tarskis Ergebnisse aber aus-
melebene zu erfassen, und genau an dieser Stelle kommt Tarskis Wahr-
schließlich auf die Peano-Arithmetik und heitsprädikat ins Spiel. Wir nennen eine Formel T (ξ ) mit der freien Va-
diese ist, wie wir bereits wissen, aus- riable ξ ein Wahrheitsprädikat, wenn es genau auf die Gödelnummern
drucksstark genug, um über ihren eigenen der wahren Formeln zutrifft, wenn also Folgendes gilt:
syntaktischen Aufbau zu reden. In diesem
Sinne können wir die Peano-Arithmetik |= T (x) ⇔ x ∈ T (4.44)
mit ihrer eigenen Metasprache gleichset-
zen und auf eine diesbezügliche Unter- Wir wollen uns mit den Konsequenzen dieser Definition beschäftigen
scheidung verzichten. und unterscheiden zwei Fälle:

I ϕ ist eine Formel mit |= T (ϕ)


Wegen (4.44) ist ϕ ∈ T , und aus (4.43) folgt dann, dass ϕ inhalt-
lich wahr ist; es gilt also |= ϕ.
I ϕ ist eine Formel mit |= ϕ
Wegen (4.43) ist ϕ ∈ T , und aus (4.44) folgt dann, dass T (ϕ)
inhaltlich wahr ist; es gilt also |= T (ϕ).

Zusammengefasst erhalten wir die folgende Beziehung:

Für alle Formeln ϕ gilt: |= ϕ ⇔ |= T (ϕ)

Oder, was dasselbe ist:

Für alle Formeln ϕ gilt: |= ϕ ↔ T (ϕ) (4.45)

Tarski hatte die Vermutung, dass gewisse formale Systeme nicht in der
Lage sind, den Wahrheitsbegriff auf diese Weise zu erfassen. In Bezug
auf die Peano-Arithmetik würde dies bedeuten, dass eine Formel T ,
4.2 Der erste Unvollständigkeitssatz 237

n 26 Okt Alfred Tarski wurde am 14. Janu- Am 1. September 1939 marschierte die deutsche Wehrmacht
14 Ja
1901 1983
ar 1901 in Warschau unter dem Na- in Polen ein. Tarski befand sich zu dieser Zeit auf einer Aus-
men Alfred Tajtelbaum geboren. Er landsreise in Harvard und entzog sich damit durch Zufall
verbrachte seine Kindheit in wohl- dem Zugriff der Nationalsozialisten. Eine Rückkehr nach
habenden Verhältnissen und war ein außergewöhnlich talen- Polen war ausgeschlossen; sie hätte für den jüdischstämmi-
tierter Junge. Nach seiner Schulausbildung, die er mit bril- gen Mathematiker den sicheren Tod bedeutet. Tarski schei-
lanten Noten abschloss, schrieb sich 1918 als Student an terte mehrmals mit dem Versuch, seiner Familie eine Ausrei-
der Universität in Warschau ein. Anfänglich entwickelte er segenehmigung zu verschaffen, und konnte seine Frau und
ein starkes Interesse für die Naturwissenschaften, entdeck- seine beiden Kinder erst nach Kriegsende in den USA nach-
te seine eigentliche Liebe dann aber in der Mathematik und holen. Seine Eltern und seinen Bruder sah er nicht wieder;
Logik. Tarski fand in Warschau ein hochkarätiges akademi- sie haben den zweiten Weltkrieg nicht überlebt.
sches Umfeld vor und durfte berühmte Mathematiker wie In den USA begleitete Tarski mehrere befristete Anstellun-
Jan Łukasiewicz und Wacław Sierpiński zu seinen Lehrern gen an renommierten Universitäten und Forschungseinrich-
zählen. tungen und akzeptierte im Jahr 1945 den Ruf der University
1923 nahm Alfred den Nachnamen Tarski an und konver- of California in Berkeley auf eine permanente Professoren-
tierte von der jüdischen Religion zum Katholizismus. Dieser stelle. Jetzt hatte er endlich eine Position inne, die er auf-
Zug war zu einen großen Teil strategisch motiviert; Tarski grund seiner brillanten wissenschaftlichen Leistungen längst
wusste, dass er es mit einer polnischen Identität zur dama- verdiente.
ligen Zeit leichter haben würde. Im gleichen Jahr reichte er Tarski absolvierte mehrere Gastaufenthalte an anderen Uni-
seine Doktorarbeit ein. In den Folgejahren scheiterte er meh- versitäten, kehrte aber immer wieder nach Berkeley zurück.
rere Male mit dem Versuch, eine Professur zu erhalten, und Auch im Alter ließ der umtriebige Mathematiker nicht von
verdiente sein Geld daher mit Lehraufträgen an Gymnasien seiner Arbeit ab und engagierte sich noch Jahre nach sei-
und der Universität. In dieser Phase seines Lebens hat Tarski ner Emeritierung in Forschung und Lehre. Die letzten zwölf
einiger seiner wichtigsten Publikationen verfasst, darunter Jahre seines Lebens investierte er in das Buch „A Formali-
seine bahnbrechende Arbeit über die formale Definition des zation of Set Theory without Variables“ [196]. Es war sein
Wahrheitsbegriffs [192, 193]. letztes großes Werk. Kurz nach dessen Vollendung starb Al-
fred Tarski im Alter von 82 Jahren.

wie wir sie oben definiert haben, nicht existieren kann. Einen Beweis
hierfür konnte Tarski damals noch nicht liefern, und so sprach er in
seiner polnischen Originalarbeit lediglich Vermutungen aus.

Kurze Zeit später überschlugen sich die Ereignisse. In dem gleichen


Jahr, in dem Tarski seine Arbeit veröffentlichte, publizierte Gödel die
beiden Unvollständigkeitssätze, und aus dem ersten Unvollständigkeits-
satz folgt in der Tat, dass es in Systemen wie der Peano-Arithmetik
keine Wahrheitsprädikate geben kann. Tarski kam dieses Resultat sehr
gelegen. Er plante zu dieser Zeit, seine auf polnisch verfasste Arbeit
auf deutsch zu veröffentlichen, und konnte seine ursprünglichen Vermu-
tungen jetzt mit einem formalen Beweis absichern. Dies ist der Grund,
warum sich die 1935 publizierte Übersetzung mit dem Titel „Der Wahr-
heitsbegriff in den formalisierten Sprachen“ nicht nur in ihrer Form,
sondern auch in ihrem Inhalt von der polnischen Originalarbeit unter-
scheidet. Tarski weist in einer Fußnote explizit darauf hin:
238 4 Beweistheorie

„88) Die hier angewandte Methode verdanken wir Gödel,


dem sie in seiner kürzlich erschienenen Arbeit [...] zu an-
deren Zwecken diente; [...] Bei dieser Gelegenheit bemerke
ich, dass ich den Satz I samt der Skizze seines Beweises
in die vorliegende Arbeit erst eingeführt habe, nachdem
sie bereits in Druck gegeben war; zur Zeit, als die Arbeit
der Warschauer Gesellschaft der Wissenschaften vorgelegt
wurde (21. III. 1931), war Gödels Artikel – so viel mir be-
kannt ist – noch nicht erschienen. Ich hatte daher in der
ursprünglichen Fassung an dieser Stelle anstatt positiver
Ergebnisse nur gewisse Vermutungen ausgesprochen.“
Alfred Tarski [193]

Als die deutsche Sprache nach dem zweiten Weltkrieg den Status ei-
ner akademischen Weltsprache verloren hatte, erschien Tarskis Arbeit
auch in Englisch, unter dem Titel „The Concept of Truth in Formalized
Languages“. Es ist jene Version der Arbeit, die im Zusammenhang mit
Tarskis Ergebnissen heute am häufigsten zitiert wird.

Mit unserem bisher erworbenen Wissen ist es gar nicht schwer, Tarskis
fulminantes Negativergebnis herzuleiten. Setzen wir nämlich

χ(y) := ¬T (y),

so garantiert uns das Diagonalisierungslemma die Existenz einer For-


mel γ mit der folgenden Eigenschaft:

 γ ↔ ¬T (γ) (4.46)

Ist die Peano-Arithmetik korrekt, und davon gehen wir aus, so ist jede
beweisbare Aussage inhaltlich wahr. Das bedeutet, dass wir aus (4.46)
den folgenden Schluss ziehen können:

|= γ ↔ ¬T (γ)

Aus (4.45) folgt aber


|= γ ↔ T (γ)
und dies beschert uns einen herben Widerspruch:

|= ¬T (γ) ↔ T (γ)

Damit müssen wir die Annahme, innerhalb der Peano-Arithmetik exi-


stiere ein Wahrheitsprädikat, fallen lassen und dürfen unserem Wissens-
repertoire den folgenden Satz hinzufügen:
4.2 Der erste Unvollständigkeitssatz 239

Satz 4.11 (Tarski, 1935)

Der Begriff der Wahrheit ist innerhalb der Peano-Arithmetik nicht


definierbar; es gibt kein Wahrheitsprädikat.

Wir wollen an dieser Stelle näher betrachten, in welchem Verhältnis der


Satz von Tarski zu Gödels erstem Unvollständigkeitssatz steht. Wir wis-
sen, dass die Peano-Arithmetik ausdrucksstark genug ist, um über die
Beweisbarkeit einer Formel zu sprechen. Zu diesem Zweck hatten wir
in Abschnitt 4.2.6 eine Formel Bew(y) mit der folgenden inhaltlichen
Bedeutung konstruiert:

|= Bew(y) ⇔ y ist die Gödelnummer einer beweisbaren Formel

Dann gilt das Folgende:

I Ist die Peano-Arithmetik korrekt, so gilt für jede Formel ϕ:

|= Bew(ϕ) → ϕ (4.47)

I Ist die Peano-Arithmetik vollständig, so gilt für jede Formel ϕ:

|= ϕ → Bew(ϕ) (4.48)

Wäre die Peano-Arithmetik gleichzeitig korrekt und vollständig, dann


könnten wir aus (4.47) und (4.48) den folgenden Schluss ziehen:

|= ϕ ↔ Bew(ϕ)

Dann wäre Bew ein Wahrheitsprädikat, das nach dem Satz von Tarski
nicht existieren kann. Der Widerspruch löst sich erst dann auf, wenn
wir die Annahme, die Peano-Arithmetik sei gleichzeitig korrekt und
vollständig, fallen lassen, und das bedeutet nichts anderes, als dass sich
die semantische Variante des ersten Unvollständigkeitssatzes direkt aus
dem Satz von Tarski ergibt.

In der Tatsache, dass sich der Begriff der Beweisbarkeit innerhalb der
Peano-Arithmetik formalisieren lässt, nicht aber der Begriff der Wahr-
heit, sah Gödel eine Art Schlüsselargument für die Existenz unent-
scheidbarer Sätze. Er schreibt in einem Brief an den US-amerikanischen
Mathematiker Arthur Burks:

„It is this theorem which is the true reason for the existence
of undecidable propositions in the formal systems contai-
ning arithmetic. I did not formulate it explicitly in my paper
240 4 Beweistheorie

of 1931, but only in my Princeton lectures of 1934. The sa-


me theorem was proved by Tarski in his paper on the con-
cept of truth published in 1933.“
Kurt Gödel [53, 136]

Die Überlegungen, die wir in den vorigen zwei Abschnitten angestellt


haben, nähren den Verdacht, dass der erste Unvollständigkeitssatz un-
trennbar mit dem Prinzip der Diagonalisierung verwoben ist. Dass die-
ser Eindruck zumindest teilweise trügt, wird der nächste Abschnitt zei-
gen. Dort werden wir die semantische Variante des ersten Unvollstän-
digkeitssatzes mit einem interessanten Argument herleiten, das ohne
einen direkten Bezug auf das Prinzip der Diagonalisierung auskommt.

4.2.8 Das Berry-Paradoxon

„What strikes the author as of interest in the proof via


Berry’s paradox is not its brevity but that it provides a
different sort of reason for [...] incompleteness [...].“
George Boolos [15]

Hinter dem Berry-Paradoxon verbirgt sich eine umgangssprachlich for-


mulierte Paradoxie, die das erste Mal in der Einleitung der Principia
Mathematica beschrieben wurde. Benannt ist sie nach ihrem geistigen
ÜEnglische OriginalformulierungÜ Urheber, dem Bibliothekar G. G. Berry von der Bodleian Library in Ox-
ford. Russell und Whitehead weisen in einer Fußnote eigens daraufhin,
dass ihnen das Beispiel durch Berry zugetragen wurde.
„The least integer not In Abbildung 4.14 ist der ursprüngliche Wortlaut des Berry-Paradoxons
nameable in fewer than
zu sehen, zusammen mit einer sinngemäßen deutschen Übersetzung. Es
nineteen syllables.“
ist ausgerechnet die prägnant knappe Formulierung, die dem Wortspiel
seine inhaltliche Sprengkraft verleiht. In seiner deutschen Variante be-
nennt das Paradoxon eine Zahl, die nicht mit weniger als vierzehn Wör-
Sinngemäße Übersetzung tern definierbar ist, schafft dies aber selbst mit dreizehn Wörtern. Eine
unhaltbare Situation!
„Die kleinste natürliche Ende der 1980er bemerkte der US-amerikanische Logiker George
Zahl, die nicht mit weniger Boolos, dass sich der selbstzerstörerische Widerspruch des Berry-
als vierzehn Wörtern
Paradoxons innerhalb der Peano-Arithmetik nachbilden ließe, sollte
definierbar ist.“
diese gleichzeitig korrekt und vollständig sein. Er konnte damit einen
Beweis für die semantische Variante des ersten Unvollständigkeitssatzes
Abbildung 4.14: Das Berry-Paradoxon, konstruieren, der neben den klassischen Beweisen sehr einfach wirkt
oben im Originalwortlaut und unten in ei- und zudem ohne einen direkten Bezug auf das Prinzip der Diagonali-
ner sinngemäßen deutschen Übersetzung. sierung auskommt [15].
4.2 Der erste Unvollständigkeitssatz 241

Im Folgenden wollen wir genauer untersuchen, wie Boolos dieses In PA sind die folgenden
Kunststück gelang. Wir starten mit einer einfachen Definition: Formeln beweisbar:
∀ x (x = s(0) ↔ x = 1)
∀ x (x + x = s(s(0)) ↔ x = 1)
Definition 4.8
∀ x (x + x + x = s(s(s(0))) ↔ x = 1)
Eine Formel ψ(ξ ) benennt die Zahl n, wenn Folgendes gilt: ...

 ∀ x (ψ(x) ↔ x = n) Definition 4.8

In Worten besagt diese Definition, dass eine Formel ψ(ξ ) die Zahl n ge- Alle nachstehenden Formeln
nau dann benennt, wenn die Zeichenkette ∀ x (ψ(x) ↔ x = n) aus den benennen die natürliche Zahl 1:
Axiomen der Peano-Arithmetik hergeleitet werden kann. Es ist ein we- x = s(0)
sentliches Merkmal dieser Definition, dass die Eigenschaft, eine Zahl zu x + x = s(s(0))
benennen, an die Beweisbarkeit und nicht an die Wahrheit einer Formel
x + x + x = s(s(s(0)))
gekoppelt ist!
...
Als Beispiele sind in Abbildung 4.15 mehrere Formeln zu sehen, die al-
lesamt die natürliche Zahl 1 benennen. Unter Anderem wird dort deut- Abbildung 4.15: In der umgangssprach-
lich, dass die Wahl von ψ(ξ ) nicht eindeutig ist; für jede Zahl gibt es lichen Formulierung des Berry-Paradoxons
stets unendlich viele Möglichkeiten, sie zu benennen. bleibt offen, was es genau bedeutet, eine
Zahl zu benennen. In der formalen Variante
In seinem Beweis macht Boolos von einer Formel ϕC (x, y) mit der fol- ist dieser Begriff mathematisch exakt defi-
genden inhaltlichen Bedeutung Gebrauch: niert.

|= ϕC (x, y) ⇔ x wird durch eine Formel ϕ mit |ϕ| = y benannt

Hierin steht |ϕ| für die Anzahl der Symbole in ϕ. Dass eine Formel mit
der genannten Eigenschaft gefunden werden kann, ist nach unserem bis-
herigen Wissensstand keine spektakuläre Nachricht mehr. Ihre Existenz
folgt aus der Tatsache, dass die Peano-Arithmetik ausdrucksstark ge-
nug ist, um über den syntaktischen Aufbau und die Beweisbarkeit von
Formeln zu sprechen.

Boolos verwendet die Formel ϕC (x, y) in der folgenden Definition:

ϕB (x, y) := ∃ z (z < y ∧ ϕC (x, z))

Die Bedeutung dieser Formel liegt auf der Hand. Sind x und y zwei
natürliche Zahlen, so ist die Formelinstanz ϕB (x, y) genau dann wahr,
wenn die Zahl x durch eine Formel benannt wird, die weniger als y
Symbole enthält:

|= ϕB (x, y) ⇔ x wird durch eine Formel ϕ mit |ϕ| < y benannt


242 4 Beweistheorie

Boolos argumentiert in sei- Die Bedeutung der nächsten Formel ist ebenfalls einfach zu verstehen:
nem Beweis, dass es nur
endlich viele Formeln einer ϕA (x, y) := ¬ϕB (x, y) ∧ ∀ (a < x)ϕB (a, y)
bestimmten Länge gibt. Für
die Peano-Arithmetik, wie wir sie in De- Sind x und y natürliche Zahlen, so ist die Formelinstanz ϕA (x, y) genau
finition 3.1 festgelegt haben, ist dies aber dann wahr, wenn
nicht richtig. Wir haben uns gestattet, aus
einem unendlich großen Variablenvorrat
zu schöpfen, und können deshalb unend- I keine Formel ϕ mit |ϕ| < y die Zahl x benennt ¬ϕB (x, y)
lich viele Formeln mit der gleichen Länge
bilden; z. B. diese hier: I und jede Zahl, die kleiner als x ist, ∀ (a < x)

∃ x (x = 1), I durch eine Formel ϕ mit |ϕ| < y benannt wird. ϕB (a, y)
∃ y (y = 1),
Mit anderen Worten:
∃ z (z = 1),
... x ist die kleinste Zahl, die nicht durch eine Formel
|= ϕA (x, y) ⇔
mit weniger als y Symbolen benannt wird.
Dass Boolos in seinem Beweis keinen
Fehler macht, hat er seiner Syntaxdefiniti- Dass für eine vorgelegte Zahl y überhaupt eine kleinste Zahl existiert,
on zu verdanken, die sich von unserer ge- die nicht durch eine Formel mit weniger als y Symbolen benannt wird,
ringfügig unterscheidet. In seiner Variante
folgt bei Boolos aus der Tatsache,
von PA gibt es nur einen endlichen Vor-
rat an Grundzeichen, und Variablen wer-
den durch zusammengesetzte Zeichenket- I dass in seiner Logik nur endlich viele Formeln existieren, die weni-
ten der Form x’, x’’, x’’’, ... repräsentiert. ger als y Symbole enthalten, und
Damit hat Boolos erreicht, dass es nur
endlich viele Formeln einer bestimmten I eine Formel niemals zwei oder mehr Zahlen gleichzeitig benennen
Länge gibt und gleichzeitig eine unbe- kann, falls die Peano-Arithmetik korrekt ist.
grenzte Anzahl an Bezeichnern erzeugt
werden kann.
Dass wir die Peano-Arithmetik anders de- Die zweite Eigenschaft ist leicht einzusehen. Gäbe es eine Formel ψ, die
finiert haben, braucht uns an dieser Stelle gleichzeitig mehrere Zahlen benennt, so würde für zwei verschiedene
aber nicht zu stören. Wir können der Ar- natürliche Zahlen n und m Folgendes gelten:
gumentation von Boolos unverändert fol-
gen, wenn wir eine Variable wie z. B. y  ∀ x (ψ(x) ↔ x = n)
oder z ganz einfach als syntaktische Ab-  ∀ x (ψ(x) ↔ x = m)
kürzungen für x’ oder x’’ verstehen. Die
oben genannten Beispiele sind dann ledig- Dann wäre aber auch die inhaltlich falsche Formel
lich Abkürzungen für die folgenden For-
meln mit einer jeweils anderen Länge: x=m↔x=n
∃ x (x = 1), ein Theorem, im Widerspruch zur Annahme, die Peano-Arithmetik sei
∃ x’ (x’ = 1), korrekt. Das bedeutet, dass es nur endlich viele Zahlen gibt, die durch
∃ x’’ (x’’ = 1), Formeln mit weniger als y Symbolen benannt werden können, und da-
... mit muss es auch eine größte geben. Deren Nachfolger ist dann die
kleinste Zahl, die nicht durch eine Formel mit weniger als y Symbo-
len benannt werden kann.
4.2 Der erste Unvollständigkeitssatz 243

Jetzt kommt der finale Schritt: Wir setzen k := |ϕA (x, y)| und definieren I Formel ϕF
eine letzte Formel:
∃ y ((y = 50 × k )∧( ϕA (x, y) ))
ϕF (x) := ∃ y ((y = 50 × k) ∧ (ϕA (x, y))) 6 151 1 1+3k 3 k 2

Nach dem bisher Gesagten ist klar, welche Bedeutung diese Formel hat:
Merke:
x ist die kleinste Zahl, die nicht durch eine Formel
|= ϕF (x) ⇔ 0 = 0 ( 1 Symbol)
mit weniger als 50k Symbolen benannt wird.
1 = s(0) ( 4 Symbole)
Bezeichnen wir die kleinste Zahl, die nicht durch eine Formel mit weni-
2 = s(s(0)) ( 7 Symbole)
ger als 50k Symbolen benannt wird, mit n, dann können wir den Sach-
verhalt so ausdrücken: 3 = s(s(s(0))) ( 10 Symbole)
...
|= ϕF (x) ⇔ x = n
50 = s(. . . s (0) . . .) ( 151 Symbole)
Dies ist äquivalent zu der Aussage 50 mal
...
|= ∀ x (ϕF (x) ↔ x = n) (4.49)
k = s(. . . s (0) . . .)( 1 + 3k Symbole)
Als Nächstes wollen wir uns mit der Frage beschäftigen, aus wie vielen
k mal
Symbolen ϕF besteht. Die Berechnung in Abbildung 4.16 zeigt, dass die
Anzahl kleiner als 50k ist, und damit kann ϕF die Zahl n nicht benennen. I Länge von ϕF
Dies bedeutet per Definition, dass die Formel ∀ x (ϕF (x) ↔ x = n) in PA
unbeweisbar ist: 6
 ∀ x (ϕF (x) ↔ x = n) (4.50) + 151
+ 1+3k
Jetzt sind wir am Ziel. Wir haben gezeigt, dass mit ϕF innerhalb der + 3
Peano-Arithmetik eine Formel existiert, die nach (4.49) inhaltlich wahr, + k
aber nach (4.50) formal unbeweisbar ist. Genau dies ist die Aussage + 2
der semantischen Variante des ersten Gödel’schen Unvollständigkeits- 163+4k
satzes. !
Lassen wir den Beweis von Boolos vor unserem geistigen Augen Revue Aus k > 3 folgt |ϕF | < 50k
passieren, so beeindruckt er zunächst einmal durch seine Knappheit.
Boolos ist es augenscheinlich gelungen, den ersten Unvollständigkeits-
satz in so wenigen Schritten herzuleiten, dass wir uns unweigerlich die Abbildung 4.16: Nach unserer Definition
Frage stellen müssen, ob der zuvor betriebene Aufwand überhaupt not- ist n die kleinste Zahl, die nicht von einer
wendig war. Für die Klärung dieser Frage dürfen wir zwei Dinge nicht Formel benannt werden kann, die weniger
aus den Augen verlieren: als 50k Symbole enthält. Die Formel ϕF be-
steht aus weniger als 50k Symbolen. Folg-
lich wird die Zahl n nicht von ϕF benannt.
I Boolos beweist nicht, wie Gödel, die komplizierte syntaktische Vari-
ante des ersten Unvollständigkeitssatz, sondern lediglich die seman-
tische. In der Tat ist diese viel einfacher herzuleiten, und im Jahr
1987 waren ähnlich kurze Beweise bereits bekannt. Einen genauso
kurzen wie eleganten Beweis werden wir in Abschnitt 5.4.2 bespre-
chen. Wir werden dort zeigen, wie sich die semantische Variante des
ersten Gödel’schen Unvollständigkeitssatzes elegant über die Arith-
metisierung von Turing-Maschinen herleiten lässt.
244 4 Beweistheorie

I In Wirklichkeit ist der Beweis von Boolos gar nicht so kurz, wie es
die ersten flüchtigen Blicke suggerieren. Verantwortlich hierfür ist
die Formel ϕC . Im Beweis haben wir schlicht und einfach darauf
vertraut, dass eine Formel mit der geforderten Eigenschaft existiert,
dies aber nicht formal gezeigt. Um die Existenz von ϕC mathema-
tisch präzise abzusichern, wird der komplette Gödelisierungsappa-
rat benötigt, genauso wie die alles andere als triviale Eigenschaft,
dass sich über die Beweisbarkeit einer Formel innerhalb der Peano-
Arithmetik sprechen lässt. Lückenlos aufgeschrieben würde sich der
Beweis von Boolos damit über viele Seiten erstrecken und enthielte
große Teile des Gödel’schen Originalbeweises.

Das Besondere an Boolos’ Beweis ist also gar nicht seine Kürze: Es
ist vielmehr die Tatsache, dass die Argumentationskette, im Gegensatz
zu den meisten anderen Beweisen, ohne einen direkten Bezug auf das
Prinzip der Diagonalisierung auskommt. Diese Eigenschaft ist außerge-
wöhnlich und verleiht dem Beweis tatsächlich einen besonderen Char-
me. Auch Boolos sah dies so, wie das Eingangszitat zu diesem Ab-
schnitt unterstreicht.

4.3 Der zweite Unvollständigkeitssatz

In seiner Arbeit aus dem Jahr 1931 hat Gödel weit mehr bewiesen als die
Unvollständigkeit der Arithmetik. Im zweiten Teil beschäftigte er sich
ausführlich mit den Konsequenzen des ersten Unvollständigkeitssatzes
und machte dabei eine weitreichende Entdeckung. Sie ist Inhalt dessen,
was wir heute als den zweiten Gödel’schen Unvollständigkeitssatz be-
zeichnen (Abbildung 4.17). Dieser Satz besagt, dass kein formales Sys-
tem, das stark genug ist, um über die additiven und die multiplikativen
Eigenschaften der natürlichen Zahlen zu sprechen, seine eigene Wider-
spruchsfreiheit beweisen kann. In diesem Abschnitt werden wir klären,
wie diese Aussage im Detail gemeint ist und welche Konsequenzen sich
hieraus für die Mathematik ergeben.

Wenn wir sagen, ein formales System kann seine eigene Widerspruchs-
freiheit beweisen, dann meinen wir das Folgende:

I Es existiert eine Formel Con, die genau dann wahr ist, wenn das
formale System widerspruchsfrei ist.

I Die Formel Con ist innerhalb des Systems beweisbar ( Con).


4.3 Der zweite Unvollständigkeitssatz 245

Abbildung 4.17: Mit Satz XI endet Gö-


dels Originalarbeit. Es ist jenes Theorem,
das wir heute als den zweiten Gödel’schen
Unvollständigkeitssatz bezeichnen.

Per Definition ist ein formales System widerspruchsfrei, wenn für kei-
Dass die Formel Con, wie wir
ne Formel ϕ sowohl ϕ als auch dessen Negation ¬ϕ aus den Axiomen
sie in (4.51) definiert haben,
abgeleitet werden kann. Mithilfe der Formel Bew(y), die wir auf Sei- tatsächlich die Widerspruchsfreiheit der
te 230 eingeführt haben, können wir die Widerspruchsfreiheit innerhalb Peano-Arithmetik beschreibt, hat mit ei-
der Peano-Arithmetik folgendermaßen formalisieren: ner Eigenschaft zu tun, die wir in der
Randnotiz auf Seite 96 erörtert haben.
Con := ¬∃ x (Bew(x) ∧ Bew(¬x)) Dort haben wir dargelegt, dass in jeder wi-
dersprüchlichen Theorie, die den gewöhn-
Inhaltlich besagt die Formel genau das, wonach wir suchen: Es gibt lichen aussagenlogischen Schlussapparat
keine Formel, die zusammen mit ihrer Negation innerhalb der Peano- enthält, ausnahmslos jede Formel aus den
Arithmetik beweisbar ist: Axiomen abgeleitet werden kann. Sind
also ϕ und ¬ϕ beweisbare Formeln, so
|= Con ⇔ Die Peano-Arithmetik ist widerspruchsfrei sind es auch 0 = 1 und 0 = 1. Umgekehrt
folgt dann aus der Nichtbeweisbarkeit von
Es gibt noch eine einfachere Möglichkeit, die Widerspruchsfreiheit zu 0 = 1, dass eine Formel ϕ niemals zu-
charakterisieren. Es genügt, eine beliebige beweisbare Formel zu wäh- sammen mit ihrer Negation ¬ϕ beweisbar
len, z. B. die Formel 0 = 1, und die Unbeweisbarkeit ihrer Negation zu sein kann.
fordern: In seiner Arbeit aus dem Jahr 1931 be-
Con := ¬Bew(0 = 1) (4.51) schrieb Gödel die Widerspruchsfreiheit
geringfügig anders, folgte aber der glei-
Es ist diese Definition von Con, die wir ab jetzt verwenden. chen Grundidee. Genau wir wir nutzte er
aus, dass ein formales System genau dann
Jetzt kommt der erste Unvollständigkeitssatz ins Spiel. In Worten be- widerspruchsfrei ist, wenn mindestens ei-
sagt er, dass jedes widerspruchsfreie formale System, das stark genug ne unbeweisbare Formel existiert. Gödel
ist, um die Peano-Arithmetik zu formalisieren, negationsunvollständig übersetzte diese Formulierung eins zu eins
ist. Für den Beweis des zweiten Unvollständigkeitssatzes sind die fol- in eine Formel, die er Wid nannte [69]:
genden beiden Tatsachen entscheidend:
Wid := ∃ x (Form(x) ∧ ¬Bew(x))

I Der erste Unvollständigkeitssatz lässt sich innerhalb der Peano- Hierin ist Form(x) eine Formel, die ge-
Arithmetik formulieren. Für unsere Zwecke benötigen wir gar nicht nau dann beweisbar ist, wenn x die Gö-
den vollständigen Satz, sondern lediglich die Aussage, dass aus der delnummer eines syntaktisch korrekt ge-
Widerspruchsfreiheit von PA die Unbeweisbarkeit des Gödel’schen formten arithmetischen Ausdrucks ist.
246 4 Beweistheorie

bla  ... (...)


In PA ist der formalisierte erste  Con → ¬Bew(ϕg (g))
Unvollständigkeitssatzes beweisbar.
Wäre die Widerspruchsfreiheit von  Con (Annahme)
PA innerhalb von PA beweisbar, . . .
 ¬Bew(ϕg (g)) (MP)
 ¬Bew(ϕg (g)) → ϕg (g) (4.54)
. . . so wäre auch die Gödel’sche
Diagonalaussage ein Theorem. Diese  ϕg (g) (MP)
ist in PA aber unbeweisbar! Aus dem ersten Unvollständigkeitssatz wissen wir:  ϕg (g)

Abbildung 4.18: Der finale Schritt im Beweis des zweiten Gödel’schen Unvollständigkeitssatzes. Wäre Con innerhalb der
Peano-Arithmetik beweisbar, so ergäbe sich hieraus ein Beweis von ϕg (g), im Widerspruch zum ersten Unvollständigkeitssatz.

Diagonalelements ϕg (g) folgt. Dies war der einfachere Fall im Be-


weis von Abschnitt 4.2.4. Innerhalb der Peano-Arithmetik können
wir die Aussage durch die folgende Formel beschreiben:
Con → ¬Bew(ϕg (g)) (4.52)

I Nicht nur der Unvollständigkeitssatz selbst, sondern auch sein Be-


weis lässt sich in die Peano-Arithmetik übertragen. Wie so etwas
prinzipiell gelingen kann, haben wir in Abschnitt 3.2.1.3 darge-
legt. Dort haben wir am Beispiel des Satzes über die Komponenten-
gleichheit geordneter Paare gezeigt, wie sich ein umgangssprachlich
formulierter Beweis innerhalb der Zermelo-Fraenkel-Mengenlehre
formal nachvollziehen lässt. Bezogen auf den ersten Unvollstän-
digkeitssatz bedeutet dieses Ergebnis, dass wir eine Formelsequenz
konstruieren können, die mit den Axiomen von PA beginnt und fol-
gendermaßen endet:
 Con → ¬Bew(ϕg (g)) (4.53)

Jetzt kommt der entscheidende Schritt: Wäre die Formel Con innerhalb
der Peano-Arithmetik ableitbar, so könnten wir, wie in Abbildung 4.18
gezeigt, auch die Formel
¬Bew(ϕg (g))
ableiten. Nach Satz 4.10 ist auch die Formel
ϕg (g) ↔ ¬Bew(ϕg (g))
4.3 Der zweite Unvollständigkeitssatz 247

ein Theorem und damit erst recht die abgeschwächte Aussage Die ausführliche Herleitung
von David Hilbert und Paul
¬Bew(ϕg (g)) → ϕg (g) (4.54) Bernays aus dem Jahr 1939
zeigt, wie kompliziert es ist,
Wenden wir jetzt den Modus ponens an, so erhalten wir einen Beweis den Beweis des ersten Unvollständigkeits-
für die Formel ϕg (g). Aus dem ersten Unvollständigkeitssatz wissen satzes in der Peano-Arithmetik nachzu-
wir aber bereits, dass ϕg (g) unbeweisbar ist. Damit sind wir am Ziel bilden [93]. Trotzdem wurde Gödels Be-
und können den zweiten Gödel’schen Unvollständigkeitssatz mit stolzer weisskizze des zweiten Unvollständig-
Brust verkünden: keitssatzes aus dem Jahr 1931 niemals
ernsthaft angezweifelt. Die Akzeptanz der
Beweisskizze war sogar so groß, dass Gö-
Satz 4.12 (Gödel, 1931) del davon absah, sie in der angekündigten
zweiten Veröffentlichung detailliert aus-
In jedem widerspruchsfreien formalen System, das stark genug ist, zuarbeiten. Wie kann das sein?
um die Peano-Arithmetik zu formalisieren, gilt  Con. Die undurchsichtige Situation klärt sich
auf, wenn wir uns daran erinnern, dass
Gödel sein Ergebnis gar nicht für die
Peano-Arithmetik, sondern für das Sys-
4.3.1 Hilbert-Bernays-Löb-Kriterien tem P bewiesen hat, das auf dem lo-
gischen Unterbau der Principia Mathe-
matica beruht. Dass sich ein umgangs-
Die Überlegung, die uns im letzten Abschnitt den zweiten Unvollstän-
sprachlicher Beweis innerhalb der Typen-
digkeitssatz in die Hände gespielt hat, war an einer bedeutenden Stelle theorie der Principia nachvollziehen lässt,
lückenhaft. Wir haben darauf vertraut, dass sich der Beweis des ersten war 1931 keine spektakuläre Nachricht. In
Unvollständigkeitssatzes innerhalb der Peano-Arithmetik formalisieren ihrem dreibändigen Werk hatten Russell
lässt, und dies ist alles andere als selbstverständlich. und Whitehead eindrucksvoll unter Be-
weis gestellt, dass in ihrem System alle
In seiner Originalarbeit lieferte Gödel ebenfalls keinen ausführlichen Schlussweisen der gewöhnlichen Mathe-
Beweis hierfür. Er skizzierte die Herleitung in einer ähnlichen Form matik reproduziert werden können.
wie wir und schloss seine Arbeit mit den folgenden Worten ab: Die Arbeit von Hilbert und Bernays ist so-
mit weit mehr als die Komplettierung der
Gödel’schen Beweisskizze. In ihr wurde
„In voller Allgemeinheit werden die Resultate in einer zum ersten Mal formal gezeigt, dass der
demnächst erscheinenden Fortsetzung ausgesprochen und Beweis des ersten Gödel’schen Unvoll-
bewiesen werden. In dieser Arbeit wird auch der nur skiz- ständigkeitssatzes innerhalb von Theorien
zenhaft geführte Beweis von Satz XI ausführlich dargestellt nachvollzogen werden kann, die deutlich
werden. (Eingelangt: 17. XI. 1930)“ primitiver sind als die Typentheorie der
Principia Mathematica.
Kurt Gödel [69]

Die angekündigte Fortsetzung seiner Arbeit hat es nie gegeben; bereits


die Skizze seines Beweises war für die meisten Mathematiker so über-
zeugend, dass kaum jemand an ihrer Richtigkeit zweifelte. Genauso
stand außer Frage, dass die vollständige Ausarbeitung des Beweises ein
langwieriges und technisch kompliziertes Unterfangen sein würde.
Die ersten, die sich dieser Aufgabe annahmen, waren David Hilbert und
Paul Bernays. Im Jahr 1939 führten sie den Beweis für die Systeme
248 4 Beweistheorie

Z und Zμ , zwei spezielle Varianten der Peano-Arithmetik [93]. Nach


getaner Arbeit drängte sich den beiden eine natürliche Frage auf: Lässt
sich der Beweis auf andere formale Systeme übertragen, und wenn ja,
welche Kriterien müssen diese Systeme erfüllen?

Hilbert und Bernays wurden schnell fündig. Sie fanden heraus, dass ihre
Argumentationskette immer dann auf ein formales System angewendet
werden kann, wenn das Beweisprädikat Bew gewisse Kriterien erfüllt,
die im Englischen als derivability conditions bezeichnet werden. Diese
wurden im Jahr 1955 von Martin Löb zu dem vereinfacht, was wir heute
als die Hilbert-Bernays-Löb-Kriterien bezeichnen. Konkret sind damit
die folgenden drei Eigenschaften gemeint:

 ϕ ⇒  Bew(ϕ) (4.55)
 Bew(ϕ → ψ) → (Bew(ϕ) → Bew(ψ)) (4.56)
 Bew(ϕ) → Bew(Bew(ϕ)) (4.57)

Im Zusammenhang mit diesen Kriterien hat sich eine vereinfachende


Schreibweise etabliert, die wir an dieser Stelle gerne aufgreifen wollen.
Sie folgt der Idee, das Beweisprädikat mithilfe des Modaloperators ‚‘
zu symbolisieren:
ϕ := Bew(ϕ)
In der neuen Notation sehen die Hilbert-Bernays-Löb-Kriterien so aus:

 ϕ ⇒  ϕ (DC1)
 (ϕ → ψ) → (ϕ → ψ) (DC2)
 ϕ → ϕ (DC3)

Der formalisierte erste Unvollständigkeitssatz nimmt in der modalen


Schreibweise die folgende Gestalt an:

 Con → ¬ϕg (g) (4.58)

mit
Con = ¬(0 = 1)
Wir werden nun zeigen, dass sich (4.58) aus den Hilbert-Bernays-Löb-
Kriterien innerhalb von PA formal herleiten lässt.

Zunächst erinnern wir uns an den Inhalt von Satz 4.10. Aus ihm folgt,
dass die Formeln

ϕg (g) → ¬ϕg (g) (4.59)


¬ϕg (g) → ϕg (g) (4.60)
4.3 Der zweite Unvollständigkeitssatz 249

Theoreme von PA sind, und mit der Ersten beginnt unser Beweis:

1.  ϕg (g) → ¬ϕg (g) (4.59)


2.  (ϕg (g) → ¬ϕg (g)) (DC1, 1)
3.  (ϕg (g) → ¬ϕg (g)) → (ϕg (g) → ¬ϕg (g)) (DC2)
4.  ϕg (g) → ¬ϕg (g) (MP, 2,3)
5.  ¬ϕg (g) → (ϕg (g) → 0 = 1) (T8)
6.  (¬ϕg (g) → (ϕg (g) → 0 = 1)) (DC1, 5)
7.  (¬ϕg (g) → (ϕg (g) → 0 = 1)) →
(¬ϕg (g) → (ϕg (g) → 0 = 1)) (DC2)
8.  ¬ϕg (g) → (ϕg (g) → 0 = 1) (MP, 6,7)
9.  ϕg (g) → (ϕg (g) → 0 = 1) (MB, 4,8)
10.  (ϕg (g) → 0 = 1) → (ϕg (g) → (0 = 1)) (DC2)
15.  ϕg (g) → (ϕg (g) → (0 = 1)) (MB, 9,10)
16.  (ϕg (g) → (ϕg (g) → (0 = 1))) →
((ϕg (g) → ϕg (g)) → (ϕg (g) → (0 = 1))) (A2)
17.  (ϕg (g) → ϕg (g)) → (ϕg (g) → (0 = 1)) (MP, 15,16)
18.  ϕg (g) → ϕg (g) (DC3)
19.  ϕg (g) → (0 = 1) (MP, 18,17)
20.  (ϕg (g) → (0 = 1)) → (¬(0 = 1) → ¬ϕg (g)) (T6)
21.  ¬(0 = 1) → ¬ϕg (g) (MP, 19,20)
22.  Con → ¬ϕg (g) (Def)

Damit sind wir in der Lage, die in Abbildung 4.18 präsentierte Beweis-
skizze des zweiten Unvollständigkeitssatzes zu komplettieren. Das Er-
gebnis ist in Abbildung 4.19 zu sehen.

Auch jetzt sind immer noch nicht alle Beweislücken gefüllt, denn
hierzu müssten wir zeigen, dass die Peano-Arithmetik tatsächlich alle
drei Hilbert-Bernays-Löb-Kriterien erfüllt. Dieser Teil ist technisch an-
spruchsvoll, und wir wollen ihn an dieser Stelle bewusst überspringen.
Ausführlich ausgearbeitet ist er beispielsweise in [183].

4.3.2 Der Satz von Löb

In den vorangegangenen Abschnitten haben wir skizziert, wie sich aus


den Hilbert-Bernays-Löb-Kriterien der formalisierte erste Gödel’sche
250 4 Beweistheorie

bla bla  ϕ ⇒  ϕ (DC1)


Aus den  (ϕ → ψ) → (ϕ → ψ) (DC2)
Hilbert-Bernays-Löb-Kriterien . . .
 ϕ → ϕ (DC3)

 ϕg (g) → ¬ϕg (g) (4.59)


 ... (...)
. . . folgt der formalisierte erste  Con → ¬ϕg (g)
Unvollständigkeitssatz.
Wäre die Widerspruchsfreiheit von  Con (Annahme)
PA innerhalb von PA beweisbar, . . .  ¬ϕg (g) (MP)
 ¬ϕg (g) → ϕg (g) (4.60)
. . . so wäre auch die Gödel’sche
Diagonalaussage ein Theorem. Diese  ϕg (g) (MP)
ist in PA aber unbeweisbar! Aus dem ersten Unvollständigkeitssatz wissen wir:  ϕg (g)

Abbildung 4.19: Ableitung des zweiten Gödel’schen Unvollständigkeitssatzes aus den Hilbert-Bernays-Löb-Kriterien.

Unvollständigkeitssatz ableiten lässt. Die historische Quelle der ver-


wendeten Kriterien ist die 1955 erschienene Arbeit

„Solution of a problem of Leon Henkin“

des deutschen Mathematikers Martin Löb [117]. Dieser Titel lädt zum
Lesen ein! Welches Problem hatte Leon Henkin damals geäußert und
auf welche Weise wurde es gelöst? Ein Blick in Löbs Arbeit liefert uns
die Antwort. Es geht dort um eine Frage, die 1955 in der Juni-Ausgabe
der renommierten Zeitschrift Journal of Symbolic Logic unter der Ru-
brik Problems veröffentlicht wurde. Dort hieß es:

„A problem concerning provability. If Σ is any standard


formal system adequate for recursive number theory, a for-
mula (having a certain integer q as its Gödel number) can
be constructed which expresses the proposition that the for-
mula with Gödel number q is provable in Σ. Is this formula
provable or independent in Σ?“
Leon Henkin [83]
4.3 Der zweite Unvollständigkeitssatz 251

Gödel’sche Formel ϕg (g) Henkin’sche Formel H

Die Gödel’sche Formel postuliert Die Henkin’sche Formel postuliert


ihre eigene Unbeweisbarkeit. ihre eigene Beweisbarkeit.
Sie kann entweder wahr und Sie kann entweder wahr und
unbeweisbar oder falsch und beweisbar oder falsch und
beweisbar sein. unbeweisbar sein.
Wahr Falsch Wahr Falsch
|= |= |= |=
Beweisbar

Beweisbar
ϕg (g) H



Unbeweisbar

Unbeweisbar

ϕg (g) H




Abbildung 4.20: Die Gödel’sche Formel


und die Henkin’sche Formel im Vergleich

Mit Σ bezeichnet Henkin ein formales System, das ausdrucksstark ge-


nug ist, um die Peano-Arithmetik zu formalisieren. Um die Überlegun-
gen an dieser Stelle einfach zu halten, nehmen wir an, Σ sei PA.

Denken wir an die Konstruktion der Gödel’schen Formel ϕg (g) zurück,


so können wir Henkins Überlegung leicht nachvollziehen. Mit ϕg (g)
haben wir eine Formel konstruiert, die über sich selbst sagt, sie sei un-
beweisbar. Analog hierzu hätten wir auch eine Formel konstruieren kön-
nen, die ihre eigene Beweisbarkeit behauptet. Besonders einfach erhal-
ten wir eine solche Formel aus dem Diagonalisierungslemma, das wir
in Abschnitt 4.2.6 bewiesen haben. Setzen wir χ := Bew, so folgt aus
dem Diagonalisierungslemma die Existenz einer Formel H mit
 H ↔ Bew(H)
Mit dem Modaloperator ‚‘ können wir dies auch so aufschreiben:
 H ↔ H (4.61)
Wir nennen H eine Henkin-Formel, da sie von sich selbst behauptet,
beweisbar zu sein. Sie tut dies auf die gleiche Weise, wie die Gödel’sche
Formel ϕg (g) von sich selbst behauptet, unbeweisbar zu sein.

Henkin beschäftigte sich damals mit der Frage, ob die Formel H inner-
halb der Peano-Arithmetik bewiesen werden kann, fand aber selbst kei-
252 4 Beweistheorie

1.  ϕ → ϕ (Annahme) ne Antwort darauf. Im Vergleich zu Gödels Formel ϕg (g), die ihre Nä-
... (...) he zu den semantischen Paradoxien nicht verbergen kann, ist Henkins
2.  γ → (γ → ϕ) (aus 4.63) Variante ein braver Musterschüler. Weder die Annahme sie sei beweis-
3.  (γ → ϕ) → γ (aus 4.63) bar, noch die Annahme, sie sei unbeweisbar, führen zu einem erkenn-
baren Widerspruch (Abbildung 4.20). Spielen wir ruhig beide Varianten
durch:
4.  (γ → (γ → ϕ)) (DC1, 2)
5.  (γ → (γ → ϕ)) →
I Angenommen, es gelte  H.
(γ → (γ → ϕ)) (DC2)
Da die Formel ihre eigene Beweisbarkeit behauptet, wäre sie inhalt-
6.  γ → (γ → ϕ) (MP, 4,5)
lich wahr; sie ist also gleichzeitig wahr und beweisbar.
7.  (γ → ϕ) →
(γ → ϕ) (DC2) I Angenommen, es gelte  H.
8.  γ → (γ → ϕ) (MB, 6,7) Da die Formel ihre eigene Beweisbarkeit behauptet, wäre sie inhalt-
9. { γ }  γ → ϕ (DT) lich falsch; sie ist also gleichzeitig falsch und unbeweisbar.
10.  γ → γ (DC3)
Auch wenn keine der beiden Möglichkeiten zu einem unmittelbaren Wi-
11. { γ }  γ (DT)
derspruch führt, ist eines ganz klar: nur eine davon kann zutreffen. Drei
12. { γ }  ϕ (MP, 9,11) Jahre lang blieb Henkins Frage ungelöst, bis Martin Löb schließlich ei-
13.  γ → ϕ (DT) ne Antwort fand.
14.  γ → ϕ (MB, 13,1)
Wir wollen uns genauer ansehen, wie Löb die Frage entschieden hat,
15.  γ (MP, 14,3)
und nehmen an, ϕ sei eine Formel mit der Eigenschaft
16.  γ (DC1, 15)
17.  ϕ (MP, 16,14)  ϕ → ϕ (4.62)

Abbildung 4.21: Ist die Formel ϕ → ϕ Weiter unten werden wir für ϕ die Henkin-Formel H einsetzen, die die-
innerhalb der Peano-Arithmetik beweisbar, se Eigenschaft aufgrund von (4.61) erfüllt.
so ist es auch die Formel ϕ [16].
Wählen wir für χ die Formel

χ(y) := Bew(y) → ϕ,

so folgt aus dem Diagonalisierungslemma, dass eine Formel γ mit der


folgenden Eigenschaft existiert:

 γ ↔ (Bew(γ) → ϕ)

Oder, was dasselbe in der neuen modalen Schreibweise ist:

 γ ↔ (γ → ϕ) (4.63)

Abbildung 4.21 zeigt, dass sich mit dieser Formel eine interessante Ab-
leitungssequenz erzeugen lässt. Aus ihr geht hervor, dass die Beweis-
barkeit der Form ϕ → ϕ die Beweisbarkeit der Formel ϕ nach sich
zieht, unabhängig von der Wahl von ϕ. Genau dies ist Aussage des Sat-
zes von Löb, der für die Peano-Arithmetik folgendermaßen lautet:
4.3 Der zweite Unvollständigkeitssatz 253

Wäre die Widerspruchsfreiheit von  Con (Annahme)


PA innerhalb von PA beweisbar, . . .
 ¬(0 = 1) (Def)
 ¬(0 = 1) → ((0 = 1) → (0 = 1)) (T8)
 (0 = 1) → (0 = 1) (MP, 2,3)
. . . so ließe sich mit dem Satz von Löb  (0 = 1) (Satz 4.13)
eine Formel ableiten,
. . . deren Negation ebenfalls ein
 (0 = 1)
Theorem ist.
Fazit: Ist Con beweisbar, so ist PA widersprüchlich.

Abbildung 4.22: Ableitung des zweiten Gödel’schen Unvollständigkeitssatzes aus dem Satz von Löb.

Satz 4.13 (Löb, 1955)

In der Peano-Arithmetik gilt: Aus  ϕ → ϕ folgt  ϕ.

Mit dem Satz von Löb sind wir in der Lage, Henkins Frage zu beant-
worten. Wir wissen aus (4.61), dass der Formel H die Eigenschaft

 H → H

zukommt und sie damit die Voraussetzung von Satz 4.13 erfüllt. Dar-
aus folgt unmittelbar, dass die Henkin-Formel H ein Theorem ist, also
innerhalb von PA bewiesen werden kann:

H

Dass wir mit Satz 4.13 Henkins Problem lösen konnten, ist zwar be-
achtenswert, es ist aber nicht der Hauptgrund für die Erwähnung in die-
sem Buch. Eine intensivere Beschäftigung mit Löbs Satz zeigt nämlich,
dass dessen inhaltliche Aussage viel tiefergehend ist, als es der erste
Blick suggeriert. Wie weitreichend er wirklich ist, verdeutlicht Abbil-
dung 4.22. Dort ist zu sehen, dass sich der Satz von Löb in der unmit-
telbaren Nähe eines Satzes aufhält, den wir in diesem Buch zu Recht
als eines der bedeutendsten Ergebnisse der mathematischen Logik be-
zeichnet haben: den zweiten Gödel’schen Unvollständigkeitssatz. Dies
ist die eigentliche Bedeutung des Satzes von Löb und unzweifelhaft ein
faszinierendes Ergebnis!
254 4 Beweistheorie

4.4 Gödels Sätze richtig verstehen

Nur wenige mathematische Erkenntnisse wurden in der Vergangenheit


so kontrovers diskutiert wie die Gödel’schen Unvollständigkeitssätze –
und nur wenige wurden so oft missverstanden. Die Gründe hierfür sind
vielfältig. Manche studieren die Sätze nur ungenau, andere ignorieren
die Voraussetzungen oder überinterpretieren ihre inhaltlichen Aussa-
gen; wiederum andere reißen die Unvollständigkeitssätze, bewusst oder
unbewusst, aus ihrem mathematischen Kontext und preisen sie als Le-
gitimation für die verschiedensten Dinge dieser Welt.

In diesem Abschnitt wollen wir einige besonders häufig wiederkehrende


Missverständnisse grob skizzieren und versuchen, sie durch eine sau-
bere Erklärung auszuräumen. Nicht alles in diesem Abschnitt ist neu.
Wenn Sie den bisherigen Text sorgsam gelesen haben, sollten Sie die
meisten der geschilderten Missverständnisse sehr schnell durchschau-
en. In diesem Fall haben Sie bereits ein gutes Verständnis für das ent-
wickelt, was die Gödel’schen Sätze besagen – und viel wichtiger noch:
für das, was sie nicht besagen.

Missverständnis 1: Aus dem ersten Gödel’schen Unvollständigkeitssatz wird des öfteren


der falsche Schluss gezogen, dass in der Mathematik Sätze existieren,
„Gödel hat gezeigt, dass in der Mathe- die in einem absoluten Sinn unbeweisbar sind. Das Missverständnis
matik wahre Sätze existieren, die nicht klärt sich auf, wenn wir uns daran erinnern, was es heißt, etwas zu
beweisbar sind.“ beweisen. Im formalen Sinne ist eine Formel ϕ beweisbar, wenn sie aus
den Axiomen eines Kalküls durch die Anwendung von Schlussregeln
hergeleitet werden kann. Das bedeutet, dass der Beweisbarkeitsbegriff
immer an einen bestimmten Kalkül gekoppelt ist. Es ist leicht einzu-
sehen, dass für jede Formel ϕ ein Kalkül existiert, in dem ϕ bewiesen
werden kann. Folgerichtig ist die Beweisbarkeit immer eine relative
Eigenschaft und niemals eine absolute.

Als Beispiel soll die Formel ϕ für die Goldbach’sche Vermutung ste-
hen, von der wir heute nicht wissen, ob sie in der Zermelo-Fraenkel-
Mengenlehre bewiesen werden kann oder nicht. Sollte sich herausstel-
len, dass ϕ in ZF unbeweisbar ist, so könnten wir ϕ zu den Axiomen
von ZF hinzufügen und erhielten mit ZF ∪ {ϕ} ein formales System,
in dem die Goldbach’sche Vermutung beweisbar ist. Ob es sinnvoll ist,
das Gebäude der Mathematik auf diesem Kalkül zu errichten, ist eine
andere Frage.

Auch in der gewöhnlichen Mathematik ist der Begriff der Beweisbar-


keit an einen Kalkül gekoppelt, allerdings wird er dort weder explizit
4.4 Gödels Sätze richtig verstehen 255

genannt, noch werden Beweise für gewöhnlich auf der formalen Ebene
aufgeschrieben. Hier meinen wir mit „beweisbar“, dass eine Aussage
im „gewöhnlichen Schlussapparat der Mathematik“ abgleitet werden
kann. Das formale Pendant zu diesem Schlussapparat ist die Zermelo-
Fraenkel-Mengenlehre, repräsentiert durch die Systeme ZF und ZFC.

Behalten Sie stets im Gedächtnis, dass nicht alle formalen Systeme Missverständnis 2:
von der Gödel’schen Unvollständigkeit betroffen sind, sondern nur
solche, die in der Lage sind, über die additiven und die multiplikativen „Gödel hat gezeigt, dass in jedem for-
Eigenschaften der natürlichen Zahlen zu sprechen. Hierunter fällt die malen System unentscheidbare Aussa-
Peano-Arithmetik, genauso wie die Zermelo-Fraenkel-Mengenlehre, in gen existieren.“
der sich die natürlichen Zahlen durch Mengen und die Addition sowie
die Multiplikation durch Mengenoperationen darstellen lassen.

Dass nicht jedes formale System unvollständig ist, hat auch schon die
in Abschnitt 2.1 geführte Diskussion gezeigt. Dort haben wir einen kor-
rekten und vollständigen Kalkül definiert, in dem eine Reihe primitiver
Aussagen über die natürlichen Zahlen abgeleitet werden kann. Natür-
lich ist dieser Kalkül viel zu ausdrucksschwach, als dass wir ihm eine
sinnvolle Anwendung innerhalb der Mathematik zuordnen könnten.

Wir halten fest: Nicht jedes formale System ist unvollständig. Damit
drängt sich unweigerlich die Frage auf, ab wann das Phänomen der Un-
vollständigkeit tatsächlich einsetzt. Wie ausdrucksstark muss ein for-
males System sein, damit es in den Sog des ersten Gödel’schen Unvoll-
ständigkeitssatzes gerät? Um der Antwort näher zu kommen, betrachten
wir die beiden formalen Systeme in Tabelle 4.3.

Links sind die Axiome der Presburger-Arithmetik aufgelistet, die bis


auf die fehlenden Axiome für die Multiplikation mit der Peano-
Arithmetik übereinstimmen. Im Jahr 1929 hat der polnische Mathemati-
ker Mojżesz Presburger gezeigt, dass die Presburger-Arithmetik korrekt
und vollständig ist. Das bedeutet, dass alle arithmetischen Formeln, die
das Multiplikationszeichen nicht enthalten, aus den Axiomen abgleitet
werden können. Um dem Phänomen der Unvollständigkeit zu erliegen,
reicht es also nicht aus, über die additiven Fähigkeiten der natürlichen
Zahlen sprechen zu können. Wir müssen zusätzlich in der Lage sein,
auch über die Multiplikation zu reden.

Das bedeutet mitnichten, dass ein formales System über die volle Aus-
drucksstärke der Peano-Arithmetik verfügen muss, um dem Unvoll-
ständigkeitssatz zum Opfer zu fallen. Eine genaue Analyse des Gö-
del’schen Beweises hat gezeigt, dass die vollständige Induktion in die-
sem Zusammenhang so gut wie keine Rolle spielt. Ersetzen wir in PA
256 4 Beweistheorie

Presburger-Arithmetik Robinson-Arithmetik

σ = τ → (σ = ρ → τ = ρ) (P1) σ = τ → (σ = ρ → τ = ρ) (R1)

σ = τ → s(σ ) = s(τ) (P2) σ = τ → s(σ ) = s(τ) (R2)

¬(0 = s(σ )) (P3) ¬(0 = s(σ )) (R3)

s(σ ) = s(τ) → σ = τ (P4) s(σ ) = s(τ) → σ = τ (R4)

σ +0 = σ (P5) σ +0 = σ (R5)

σ + s(τ) = s(σ + τ) (P6) σ + s(τ) = s(σ + τ) (R6)

ϕ(0) → (∀ x (ϕ(x) → ϕ(s(x))) → ∀ x ϕ(x)) (P7) σ ×0 = 0 (R7)

σ ×0 = 0 σ × s(τ) = (σ × τ) + σ (R8)

σ × s(τ) = (σ × τ) + σ σ = 0 ∨ ∃ ξ σ = s(ξ ) (R9)

Tabelle 4.3: Theorieaxiome der Presburger-Arithmetik (links) und der Robinson-Arithmetik (rechts)

das Induktionsaxiom durch das viel schwächere Axiom (R9) aus Ta-
belle 4.3, so gelangen wir auf direktem Weg zur Robinson-Arithmetik.
Sie ist ausdrucksschwächer als die Peano-Arithmetik, aber ausdrucks-
stärker als die Presburger-Arithmetik. Wir wissen heute, dass all das,
was zur Durchführung des Gödel’schen Beweises benötigt wird, in der
Robinson-Arithmetik bereits vorhanden ist. Das bedeutet, dass wir die
Voraussetzungen der Gödel’schen Unvollständigkeitssätze noch weiter
abschwächen können. Die Sätze greifen für alle formalen Systeme, die
stark genug sind, um die Robinson-Arithmetik zu formalisieren.

Missverständnis 3: Wird der erste Unvollständigkeitssatz im Widerspruch zu Gödels Voll-


ständigkeitssatz gesehen, so geht dies fast immer auf die nachlässige
„Der erste Gödel’sche Unvollständig- Verwendung der beteiligten Begriffe zurück. Auf die Schnelle betrach-
keitssatz steht im Widerspruch zu Gö- tet garantiert der Gödel’sche Vollständigkeitssatz den Zusammenhang
dels Vollständigkeitssatz.“  ϕ ⇔ |= ϕ, während uns der erste Unvollständigkeitssatz attestiert,
dass die Relationen ‚‘ und ‚|=‘ niemals in Einklang gebracht werden
können.

Der Widerspruch löst sich auf, wenn wir uns daran erinnern, wie das
Symbol ‚|=‘ jeweils zu lesen ist. Im Kontext des Vollständigkeitssatzes
besagt |= ϕ, dass ϕ allgemeingültig ist, d. h., die Formel ist unter allen
4.4 Gödels Sätze richtig verstehen 257

möglichen Interpretationen wahr. Im Kontext des Unvollständigkeits-


satzes drückt |= ϕ dagegen aus, dass ϕ unter einer ganz bestimmten In-
terpretation wahr ist. Im Fall der Peano-Arithmetik ist dies jene, die als
Grundmenge die natürlichen Zahlen umfasst und die Symbole ‚+‘, ‚ב
und ‚s‘ als die Addition, die Multiplikation und die Nachfolgerfunktion
interpretiert. Ferner gilt es zu beachten, dass der Gödel’sche Vollstän-
digkeitssatz ausschließlich eine Aussage über die Prädikatenlogik erster
Stufe tätigt und in der Prädikatenlogik zweiter Stufe seine Gültigkeit
verliert. Der erste Gödel’sche Unvollständigkeitssatz gilt dagegen in al-
len formalen Systemen, die stark genug sind, um die Peano-Arithmetik
zu formalisieren, und damit z. B. auch in der Prädikatenlogik zweiter
Stufe. Spätestens jetzt wird klar, dass die inhaltlichen Aussagen der bei-
den Sätze völlig andere sind und neben den ähnlich klingenden Namen
keine tiefer gehenden Gemeinsamkeiten bestehen.

Es ist ein bekanntes Ergebnis der euklidischen Geometrie, dass sich das Missverständnis 4:
Parallelenpostulat (Abbildung 4.23) nicht aus den anderen Axiomen
ableiten lässt, genauso wenig wie seine Negation. Tatsächlich ist das „Die Existenz unentscheidbarer Sät-
Parallelenpostulat unentscheidbar, weil die anderen euklidischen Axio- ze beruht auf der Unzulänglichkeit
me mehrere konsistente Interpretationen besitzen. Eine davon ist die der Axiome, die Eigenschaften der be-
Geometrie der Ebene; sie ist gewissermaßen die Standardinterpretation schriebenen Objekte eindeutig zu cha-
der euklidischen Geometrie, und hier ist das Parallelenpostulat ein rakterisieren. Unentscheidbare Sätze
wahrer Satz. Daneben existieren andere Interpretationen, wie die ellip- entstehen nur deshalb, weil die Axiome
tische oder die hyperbolische Geometrie, die ebenfalls im Einklang mit mehr als eine konsistente Interpretati-
den anderen euklidischen Axiomen stehen. In diesen nichteuklidischen on zulassen.“
Geometrien ist das Parallelenpostulat eine falsche Aussage.
Existieren für die Axiome eines korrekten formalen Systems mehrere
konsistente, nichtisomorphe Interpretationen, so müssen zwangsläufig
unentscheidbare Sätze existieren. Es ist wichtig, das von Gödel ent-
deckte Unvollständigkeitsphänomen nicht mit dieser Art der Unvoll-
„Zu einer Geraden und
ständigkeit zu verwechseln oder gar gleichzusetzen. Die Unentscheid-
einem Punkt außerhalb
barkeit des Parallelenpostulats rührt daher, dass die anderen Axiome zu der Geraden gibt es
schwach sind, um die geometrischen Objekte, die wir im Sinn haben, genau eine Gerade, die
eindeutig zu charakterisieren. Der entstehende Interpretationsspielraum durch den Punkt geht
sorgt dann für die Existenz unentscheidbarer Sätze. und parallel zur
ersten Geraden
Die Gödel’sche Unvollständigkeit ist viel tiefer gehend. Wir treffen sie ist.“
auch in formalen Systemen an, die nur eine einzige konsistente Inter-
pretation zulassen. Ein Beispiel eines solches Systems ist die Peano-
Arithmetik, formuliert in der Prädikatenlogik zweiter Stufe. Hier be- Euklid von Alexandria
sagt der Isomorphiesatz von Dedekind, dass alle Modelle isomorph (ca. 365 v. Chr. – ca. 300 v. Chr.)
zum Standardmodell sind, und auch in diesem System existieren un-
entscheidbare Sätze. Abbildung 4.23: Das Parallelenpostulat
258 4 Beweistheorie

Missverständnis 5: Gödel hat gezeigt, dass für jeden Kalkül, der die Voraussetzungen des
ersten Unvollständigkeitssatzes erfüllt, eine Formel ϕg (g) konstruiert
„Unvollständige formale Systeme las- werden kann, die unentscheidbar ist. Für diese Formel gilt, dass weder
sen sich vervollständigen, indem für je- sie selbst noch ihre Negation aus den Axiomen abgeleitet werden kann,
de unentscheidbare Formel entweder und somit können wir eine davon widerspruchsfrei zu den Axiomen
die Formel selbst oder deren Negation hinzufügen. Auf diese Weise, so scheint es, lässt sich das Gödel’sche
als Axiom hinzugefügt wird.“ Leck schließen und der Kalkül systematisch vervollständigen.

Der zweite Blick macht deutlich, dass dieser Ansatz ins Leere laufen
muss. Sobald wir die Axiomenmenge erweitert haben, können wir die
Gödel’sche Konstruktion abermals anwenden und erhalten als Ergeb-
nis eine Formel ϕg (g ), die von ϕg (g) verschieden ist und innerhalb
des neuen Systems unentscheidbar ist. Aber wie kann es sein, dass wir
beim zweiten Mal eine andere Formel erhalten? Der Grund ist dieser:
Da wir dem Kalkül ein neues Axiom hinzugefügt haben, ändern sich die
Gödelnummern aller Formeln, die in der Konstruktion des Gödel’schen
Diagonalelements eine Rolle spielen, und damit auch das Diagonalele-
ment selbst. Es gibt an dieser Stelle kein Entrinnen: Formale Systeme,
die ausdrucksstark genug sind, um die Peano-Arithmetik zu formalisie-
ren, lassen sich nicht vervollständigen.

Missverständnis 6: Der zweite Unvollständigkeitssatz besagt, dass ein formales System,


das stark genug ist, um die Peano-Arithmetik zu formalisieren, seine
„Es ist eine Konsequenz des zweiten eigene Widerspruchsfreiheit nicht beweisen kann. Daraus folgt, dass ein
Unvollständigkeitssatzes, dass die Wi- solches System erst recht nicht in der Lage ist, die Widerspruchsfreiheit
derspruchsfreiheit der Peano-Arithme- eines ausdrucksstärkeren Systems zu beweisen. Kurzum: Innerhalb von
tik unbeweisbar ist.“ PA ist die Widerspruchsfreiheit von PA genauso wenig beweisbar, wie
die Widerspruchsfreiheit von ZF oder ZFC.

Es ist falsch, die geschilderte Schlussrichtung umzukehren. Der zweite


Unvollständigkeitssatz schließt keinesfalls aus, dass die Widerspruchs-
freiheit eines formalen Systems in einem ausdrucksstärkeren System
bewiesen werden kann. Es könnte also tatsächlich möglich sein, die
Widerspruchsfreiheit von PA innerhalb von ZF oder ZFC zu zeigen.
Dass dies tatsächlich gelingt, hat der deutsche Mathematiker Gerhard
Gentzen im Jahr 1936 demonstriert [66]. Er codierte die Beweise der
Peano-Arithmetik so geschickt als Ordinalzahlen, dass sich mit dem
Prinzip der transfiniten Induktion die Widerspruchsfreiheit beweisen
lässt. Gentzens Ergebnis widerspricht dem zweiten Unvollständigkeits-
satz in keinem Wort. Mit der transfiniten Induktion hat er auf ein men-
gentheoretisches Mittel zurückgegriffen, das in PA nicht zur Verfügung
steht. Das bedeutet, dass sich Gentzens Beweis innerhalb von ZF oder
ZFC, nicht aber in PA formalisieren lässt.
4.4 Gödels Sätze richtig verstehen 259

Häufig wird der zweite Gödel’sche Unvollständigkeitssatz dahingehend Missverständnis 7:


falsch verstanden, dass aus der Beweisbarkeit von Con tatsächlich
die Widerspruchsfreiheit des zugrunde liegenden formalen Systems „Die Formel Con formalisiert die Wi-
folge. Dies ist aber keineswegs der Fall. Ist ein formales System, das derspruchsfreiheit. Daraus folgt, dass
den aussagenlogischen Schlussapparat beinhaltet, widersprüchlich, so ein formales System, das Con beweisen
lassen sich ausnahmslos alle Formeln aus den Axiomen ableiten und kann, widerspruchsfrei ist.“
somit auch die Formel Con.

Der gegenteilige Schluss ist korrekt: Gelingt es uns, in einem formalen


System mit der notwendigen Ausdrucksstärke, tatsächlich dessen Wi-
derspruchsfreiheit zu beweisen, so muss es zwangsläufig widersprüch-
lich sein. Das bedeutet, dass wir den zweiten Unvollständigkeitssatz
lediglich dazu nutzen können, die Widersprüchlichkeit, nicht aber die
Widerspruchsfreiheit eines formalen Systems zu beweisen.

Die wahre Bedeutung des zweiten Unvollständigkeitssatzes ist eine


andere: Wenn ein formales System seine eigene Widerspruchsfreiheit
nicht beweisen kann, so kann der Beweis auch in keinem ausdrucks-
schwächeren System gelingen. Hieraus folgt unmittelbar, dass sich die
Widerspruchsfreiheit der Mathematik nicht mit den Mitteln der ge-
wöhnlichen Mathematik selbst beweisen lässt. Aber genau das war der
Plan, den Hilbert über viele Jahre hinweg so vehement verfolgt hatte:
den Beweis der Widerspruchsfreiheit der klassischen Mathematik mit
finiten Mitteln.

Bedeutet dieses Ergebnis, dass wir z. B. der Peano-Arithmetik misstrau-


en müssen? Auch wenn der zweite Unvollständigkeitssatz die Hoffnung
zerstört, dass wir PA mit Schlussweisen absichern können, die primiti-
ver und damit glaubhafter sind als die Peano-Arithmetik selbst, so gibt
es für ein solches Misstrauen keinen Grund. Kaum jemand stellt die Wi-
derspruchsfreiheit von PA ernsthaft in Frage. Hierzu sind die Axiome zu
einfach und die natürlichen Zahlen eine zu vertraute Struktur.

Und wie sieht es mit der Mengenlehre aus? Reicht das Fundierungsaxi-
om wirklich aus, um sämtliche Antinomien aus der Mengenlehre zu ver-
drängen? Auch hier herrscht die Meinung vor, dass sich die Mathematik
widerspruchsfrei auf ZF oder ZFC errichten lässt, aber einen formalen
Beweis dafür halten wir nicht in Händen. Der zweite Unvollständig-
keitssatz macht unmissverständlich klar, dass ein solcher Beweis nur in
formalen Systemen möglich ist, die komplexer sind als ZF oder ZFC.
Wir würden die Frage also lediglich auf ein anderes System verschie-
ben. In der Tat zerstört der zweite Unvollständigkeitssatz jede Hoff-
nung, auf die Frage der Widerspruchsfreiheit von ZF oder ZFC jemals
eine präzise Antwort zu erhalten.
260 4 Beweistheorie

4.5 Der Satz von Goodstein

z 8 Mar
1 5 De Im Jahr 1944 bewies der englische Mathematiker Reuben Louis Good-

1912 1985
Der englische stein einen Satz, der die volle Tragweite des Gödel’schen Unvollstän-
Mathematiker digkeitsphänomens zum Vorschein bringt. Auf den ersten Blick wirkt
Reuben Louis der Satz von Goodstein wie ein gewöhnliches Theorem der Zahlentheo-
Goodstein wurde am 15. Dezember
rie; er macht eine Aussage über den Werteverlauf spezieller Zahlenfol-
1912 in London geboren. Von der dort
gen, die wir heute als Goodstein-Folgen bezeichnen, und lässt sich mit
ansässigen St. Paul’s School wechselte er
1931 an die renommierte University of den Mitteln der Ordinalzahltheorie aus Abschnitt 3.2.2 vergleichsweise
Cambridge. Das Studium der Mathematik einfach beweisen.
absolvierte Goodstein mit Bravour. Seine
nächste Station war eine Lecturer-Posi- Was den Satz von Goodstein so außergewöhnlich macht, ist die Tat-
tion an der University of Reading. Dort sache, dass er genau wie die Gödel’sche Formel ϕg (g) oder die Ros-
setzte er auch seine eigenen Forschungs- ser’sche Formel ϕr (r) innerhalb der Peano-Arithmetik unentscheidbar
vorhaben fort, für die er 1947 von der ist. Das bedeutet, dass weder der Satz selbst noch seine Negation aus
University of London mit der Doktorwür- den Axiomen hergeleitet werden kann, wenn die Peano-Arithmetik frei
de ausgezeichnet wurde. 1948 folgte er von Widersprüchen ist. Dies ist das erstaunliche Ergebnis einer Arbeit
einem Ruf an die University of Leicester, von Laurie Kirby und Jeff Paris aus dem Jahr 1982 [108]. Im Gegensatz
wo er bis zu seiner Pensionierung im Jahr zu den künstlich konstruierten Formeln von Gödel und Rosser ist der
1977 als Professor lehrte und forschte. Satz von Goodstein aber alles andere als ein Kunstprodukt: Er ist ein
Goodstein engagierte sich zeitlebens in
gewöhnlicher Satz der Zahlentheorie und im Gegensatz zu ϕg (g) und
der Lehre und galt als hervorragender Di-
ϕr (r) gänzlich frei von inhaltlichen Selbstbezügen.
daktiker. Heute wird sein Name vor allem
mit dem Satz von Goodstein verbunden, Um den Satz von Goodstein zu verstehen, benötigen wir ein wenig
dem bekanntesten Beispiel dessen, was Grundwissen über die Darstellung natürlicher Zahlen. Zunächst halten
wir in der mathematischen Logik als na- wir fest, dass sich jede natürliche Zahl x in der Form
türliches Unabhängigkeitsphänomen be-
zeichnen (natural independence pheno- x = an · bn + an−1 · bn−1 + an−2 · bn−2 + . . . + a1 b + a0 (4.64)
menon). Grob gesprochen zählen hierzu
alle gewöhnlichen Sätze der Mathematik, schreiben lässt mit a0 , . . . , an ≥ 0. b wird als Basis bezeichnet und ist
die sich genau wie die künstlich konstru- eine beliebige natürliche Zahl größer 1. Fordern wir zusätzlich für alle i
ierten Formeln von Gödel und Rosser der
die Beziehung ai < b, so sind die Ziffern a0 , . . . , an eindeutig bestimmt,
Beweisbarkeit in PA entziehen.
Weniger bekannt ist, dass Goodstein der
und wir nennen (4.64) die b-adische Darstellung von x.
Schöpfer eines bekannten Begriffssche-
Für b = 2 und x = 36 erhalten wir z. B. das Ergebnis
mas ist, das häufig verwendet wird, um
Operationen jenseits der Potenzierung
36 = 1 · 25 + 1 · 22
zu benennen. Die iterierte Potenzierung,
die gern auch als Hyper-Exponentiation
Was wir für die Konstruktion der Goodstein-Folge benötigen, ist eine
oder Super-Potenzierung bezeichnet wird,
Repräsentation von x, die wir als expandierte b-adische Darstellung be-
heißt bei Goodstein Tetration. Danach fol-
gen, in der Reihenfolge der griechischen zeichnen. Sie entsteht, indem die Exponenten in (4.64) rekursiv durch
Vorsilben, die Pentation, die Hexation, die ihre eigene b-adische Darstellung ersetzt werden. Für die Zahl 36 liest
Heptation, die Octation und so fort. sich die expandierte Darstellung zur Basis 2 wie folgt:
Reuben Goodstein starb in Leicester am 8. 2 +1
März 1985 im Alter von 72 Jahren. 36 = 1 · 22 + 1 · 22
4.5 Der Satz von Goodstein 261

Ferner benötigen wir eine spezielle Substitutionsfunktion, die Goodstein g0 (36) = 36


in seiner Originalarbeit mit Scb (x) bezeichnet. Für eine natürliche Zahl = 22
2
+1
+ 22
x wird Scb (x) berechnet, indem x zunächst in die expandierte b-adische
Darstellung gebracht wird und anschließend alle Basen durch c ausge- g1 (36) := S32 (g0 (36)) − 1
tauscht werden. Beispielsweise ergibt S32 (36) die Zahl  3 
g1 (36) = 33 +1 + 33 − 1
2 +1 3 +1
S32 (36) = S32 (22 + 22 ) = 33 + 33 = 22876792454988 (4.65) 3
+1
= 33 + 2 · 32 + 2 · 3 + 2
Jetzt besitzen wir das nötige Instrumentarium, um Goodstein-Folgen
formal zu beschreiben. Zunächst halten wir fest, dass für jede natürli- g2 (36) := S43 (g1 (36)) − 1
che Zahl x eine separate Goodstein-Folge existiert, deren Elemente wir  4 
g2 (36) = 44 +1 + 2 · 42 + 2 · 4 + 2 − 1
folgendermaßen notieren:
4
+1
= 44 + 2 · 42 + 2 · 4 + 1
g0 (x), g1 (x), g2 (x), g3 (x), . . .
x ist der Startwert der Folge, d. h., es gilt g0 (x) = x. Für die Berechnung g3 (36) := S54 (g2 (36)) − 1
von g1 übersetzen wir g0 zunächst in seine b-adische Darstellung mit  5 
g3 (36) = 55 +1 + 2 · 52 + 2 · 5 + 1 − 1
b = 2. Anschließend ersetzen wir die Basis b, wie in Abbildung 4.24 ge-
zeigt, durch b + 1 und erniedrigen das Ergebnis um 1. Die Berechnung = 55
5
+1
+ 2 · 52 + 2 · 5
der weiteren Folgenelemente funktioniert nach dem gleichen Schema.
In jedem Schritt wird die Basis um 1 erhöht (base bumping) und das Abbildung 4.24: Die ersten vier Elemente
Ergebnis anschließend um 1 erniedrigt: der Goodstein-Folge für den Startwert 36
 n+2
Sn+3 (gn (x)) − 1 falls gn (x) > 0
gn+1 (x) =
0 falls gn (x) = 0

Startwert 1 Startwert 2 Startwert 3 Startwert 4 Startwert 5 Startwert 6


g0 (1) = 1 g0 (2) = 2 g0 (3) = 3 g0 (4) = 4 g0 (5) = 5 g0 (6) = 6
g1 (1) = 0 g1 (2) = 2 g1 (3) = 3 g1 (4) = 26 g1 (5) = 27 g1 (6) = 29
g2 (1) = 0 g2 (2) = 1 g2 (3) = 3 g2 (4) = 41 g2 (5) = 255 g2 (6) = 257
g3 (1) = 0 g3 (2) = 0 g3 (3) = 2 g3 (4) = 60 g3 (5) = 467 g3 (6) = 3125
g4 (1) = 0 g4 (2) = 0 g4 (3) = 1 g4 (4) = 83 g4 (5) = 775 g4 (6) = 46655
g5 (1) = 0 g5 (2) = 0 g5 (3) = 0 g5 (4) = 109 g5 (5) = 1197 g5 (6) = 98039
g6 (1) = 0 g6 (2) = 0 g6 (3) = 0 g6 (4) = 139 g6 (5) = 1751 g6 (6) = 187243
g7 (1) = 0 g7 (2) = 0 g7 (3) = 0 g7 (4) = 173 g7 (5) = 2454 g7 (6) = 332147
g8 (1) = 0 g8 (2) = 0 g8 (3) = 0 g8 (4) = 211 g8 (5) = 3325 g8 (6) = 555551
g9 (1) = 0 g9 (2) = 0 g9 (3) = 0 g9 (4) = 253 g9 (5) = 4382 g9 (6) = 885775
g10 (1) = 0 g10 (2) = 0 g10 (3) = 0 g10 (4) = 299 g10 (5) = 5643 g10 (6) = 1357259
g11 (1) = 0 g11 (2) = 0 g11 (3) = 0 g11 (4) = 348 g11 (5) = 7126 g11 (6) = 2011162
... ... ... ... ... ...

Abbildung 4.25: Entwicklung der Goodstein-Folge für die Startwerte 1 bis 6


262 4 Beweistheorie

I Goodstein-Folge zum Startwert 1 Wie wahrscheinlich ist es, dass eine Goodstein-Folge den Wert 0 er-
gn (1) reicht? In Abbildung 4.24 konnten wir beobachten, dass die Folgenele-
4 mente durch die fortwährende Erhöhung der Basis so rasant anwach-
3
sen, dass wir bereits nach wenigen Schritten kaum noch in der Lage
sind, sie in Dezimalschreibweise zu notieren. Die Beispiele in Abbil-
2
dung 4.25 zeigen zudem, dass wir dieses Phänomen schon für kleine
1 Startwerte beobachten können. Ab x = 4 scheinen Goodstein-Folgen
0 n mit aller Macht gegen Unendlich zu streben, und die Vergrößerung des
0 1 2 3 4 5 6 7 Startwerts befeuert den rasanten Anstieg zusätzlich.
I Goodstein-Folge zum Startwert 2
Damit ist es an der Zeit, den Satz von Goodstein zu formulieren. Im
gn (2)
Angesicht der betrachteten Beispiele offenbart er Erstaunliches:
4
3 Satz 4.14 (Goodstein, 1944)
2
1 Jede Goodstein-Folge erreicht irgendwann den Wert 0.
0 n
0 1 2 3 4 5 6 7
Abbildung 4.26 zeigt, wann die ersten vier Goodstein-Folgen den Wert
I Goodstein-Folge zum Startwert 3 0 erreichen. Die ersten drei Folgen tun dies sehr rasch. Für den Startwert
gn (3) 4 steigt die Folge erst einmal für lange Zeit an und erreicht bei
4 1
i = 24 · 224 224 · 2 − 3 ≈ 1,72 · 10121210694
24
3 4
2 ihr Maximum [6, 160]. Danach bleibt sie lange konstant und tritt an-
1 schließend in eine kontinuierliche Abstiegsphase ein. Den Wert 0 er-
reicht die Folge bei
0 n
i = 24 · 224 224 · 2 − 3 ≈ 6,89 · 10121210694
0 1 2 3 4 5 6 7 24

I Goodstein-Folge zum Startwert 4


Diese Zahl sprengt unsere intuitive Vorstellung bei Weitem; sie ent-
gn (4) · 10-121210694 spricht einer Dezimalzahl mit mehr als 121 Millionen Ziffern!
4
Dass jede Goodstein-Folge irgendwann den Wert 0 erreicht, ist schon
3
für sich allein gesehen ein faszinierendes Ergebnis. Noch erstaunlicher
2 ist aber, dass sich der Satz von Goodstein vergleichsweise einfach mit
1 den Mitteln der Ordinalzahltheorie aus Abschnitt 3.2.2 beweisen lässt.
0 n
Wie dies genau funktioniert, wollen wir uns nun ansehen. Im Kern ba-
0 1 2 3 4 5 6 7 siert der Beweis auf der Idee, eine Goodstein-Folge nach dem folgenden
· 10121210694 Schema in eine Parallelfolge von Ordinalzahlen zu übersetzen:
gn (x) = Sωn+2 (gn (x))
Abbildung 4.26: Werteverläufe der ersten
vier Goodstein-Folgen Abbildung 4.27 demonstriert, wie wir die Folge konstruieren können.
Zunächst schreiben wir die Elemente einer Goodstein-Folge in expan-
dierter b-adischer Darstellung auf und ersetzen anschließend alle Basen
durch die Ordinalzahl ω.
4.5 Der Satz von Goodstein 263

2 +1 Transformation ω +1
22 + 22 ωω + ωω Abbildung 4.27: Jede Goodstein-Folge
lässt sich in eine Parallelfolge von Ordi-
3 +1 Transformation ω +1 nalzahlen übersetzen, die so lange streng
33 + 2 · 32 + 2 · 3 + 2 ωω + 2 · ω2 + 2 · ω + 2
monoton fällt, bis die Goodstein-Folge
den Wert 0 erreicht. Wäre Satz 4.14
4 +1 Transformation ω +1
44 + 2 · 42 + 2 · 4 + 1 ωω + 2 · ω2 + 2 · ω + 1 falsch, so gäbe es eine Goodstein-Folge,
deren Elemente allesamt von 0 verschie-
5 +1 Transformation ω +1 den sind, und damit gäbe es auch eine
55 + 2 · 52 + 2 · 5 ωω + 2 · ω2 + 2 · ω unendlich absteigende Folge von Ordinal-
zahlen. Wir wissen aber bereits, dass eine
... ... solche Folge nicht existieren kann.

Für die weitere Argumentation ist die Monotonieeigenschaft der Sub-


stitution Sωk von Bedeutung. Diese besagt, dass die Größenverhältnisse
zweier Zahlen durch die Substitution unangetastet bleibt:
x < y ⇒ Sωk (x) < Sωk (y) für alle k ∈ N (4.66)
Jetzt können wir die Elemente gn (x) für alle n mit gn (x) > 0 nach oben
abschätzen:
gn+1 (x) = Sωn+3 (gn+1 (x))
= Sωn+3 (Sn+3
n+2
(gn (x)) − 1)
< Sωn+3 (Sn+3
n+2
(gn (x))) wegen (4.66)
= Sωn+2 (gn (x))
= gn (x)
Voilà: Die konstruierte Parallelfolge ist streng monoton fallend. Das be-
deutet, dass sich aus jeder Goodstein-Folge, deren Elemente alle von 0
verschieden sind, eine unendlich absteigende Folge von Ordinalzahlen
konstruieren lässt. Aus Kapitel 3 wissen wir aber bereits, dass eine sol-
che Folge nicht existieren kann. Das bedeutet im Umkehrschluss, dass
jede Goodstein-Folge tatsächlich irgendwann den Wert 0 erreicht.

Mithilfe der Ordinalzahltheorie war es für uns vergleichsweise einfach,


den Satz von Goodstein als wahr zu identifizieren. Die eigentlich inter-
essante Frage ist natürlich eine andere: Warum lässt sich das Goodstein-
Theorem innerhalb der Peano-Arithmetik formulieren, aber nicht inner-
halb der Peano-Arithmetik beweisen? Wie kann es sein, dass wir auf
Beweismittel zurückgreifen müssen, die außerhalb der Theorie liegen,
in der sich das Theorem formulieren lässt?

Zu allererst wollen wir uns klar machen, dass die Peano-Arithmetik tat-
sächlich stark genug ist, um über den Satz von Goodstein zu sprechen.
264 4 Beweistheorie

I G(1) = 1 Zu diesem Zweck bringen wir die Goodstein-Funktion G : N → N ins


gn (1) Spiel, die wie folgt definiert ist:
4
G(x) := min{n | gn (x) = 0}
3
In Worten ausgedrückt, gibt der Funktionswert G(x) an, nach wie vie-
2
len Schritten die Goodstein-Folge mit dem Startwert x die Nulllinie er-
1 reicht. Abbildung 4.28 zeigt auf grafische Weise, wie sich die Funkti-
0 n onswerte G(x) für die ersten vier Goodstein-Folgen berechnen lassen.
0 1 2 3 4 5 6 7
Als Nächstes codieren wir die Goodstein-Funktion mithilfe einer arith-
I G(2) = 3
metischen Formel ϕG mit zwei freien Variablen x und y. Diese Formel
gn (2)
erfüllt die folgende Beziehung:
4
|= ϕG (x, y) ⇔ G(x) = y
3
2 Dass sich eine Formel mit dieser Eigenschaft tatsächlich konstruieren
lässt, ist ein Ergebnis, das wir in Kapitel 5 herausarbeiten werden. Dort
1
werden wir zeigen, wie sich Turing-Maschinen arithmetisieren lassen,
0 n und damit werden wir implizit den Beweis erbringen, dass sich je-
0 1 2 3 4 5 6 7
de Funktion, die mit einem systematischen Verfahren berechnet wer-
I G(3) = 5 den kann, innerhalb der Peano-Arithmetik repräsentieren lässt. Auch
gn (3) wenn wir im Moment nur eine vage Vorstellung davon haben, was
4 der Begriff des systematischen Verfahrens genau bedeutet, können wir
3
die Goodstein-Funktion bereits jetzt als berechenbar identifizieren. Wir
wissen ja schon, dass jede Goodstein-Folge irgendwann den Wert 0 er-
2
reicht. Damit können wir den Funktionswert G(x) systematisch ermit-
1 teln, indem wir die Folgenelemente so lange eines nach dem anderen
0 n ausrechnen, bis sich der Wert 0 einstellt.
0 1 2 3 4 5 6 7
Als Nächstes werden wir eine Beziehung zwischen der Goodstein-
I G(4) = 24 · 224 224 · 2 − 3
24
Funktion G(x) und dem Satz von Goodstein herstellen. Inhaltlich ist
gn (4) · 10-121210694 der Satz äquivalent zu der Aussage, die Funktion G(x) sei für alle
4 n definiert, und dies ist wiederum äquivalent zu der Behauptung, die
Goodstein-Funktion sei total. Wenn wir davon sprechen, die Totalität
3
von G(x) in PA zu beweisen, so meinen wir damit, das folgende Theo-
2 rem herzuleiten:
1  ∀ x ∃ y ϕG (x, y) (4.67)
0 n Für Formeln dieser Bauart greift ein starkes Resultat, das auf Georg
0 1 2 3 4 5 6 7
Kreisel zurückgeht:
· 10121210694

Abbildung 4.28: Die ersten vier Funktions- Satz 4.15 (Kreisel, 1952)
werte der Goodstein-Funktion G
Lässt sich die Totalität einer berechenbaren Funktion f : N → N in-
nerhalb der Peano-Arithmetik beweisen, so existiert eine Funktion
fα mit α < ε0 , die f dominiert.
4.5 Der Satz von Goodstein 265

Im Mittelpunkt dieses Satzes steht eine Dominanzaussage. Hier bezieht I Ackermann-Funktion


sich Kreisel auf eine Hierarchie schnell wachsender Funktionen, die auf
A(0, n) := 2 · n + 1
Stanley Wainer und Martin Löb zurückgeht [118, 205]. Auch wenn die
Hierarchie im Detail komplex ist, folgt sie der einfachen Grundidee, A(m + 1,0) := A(m,1)
Funktionen anhand ihrer Wachstumsrate zu ordnen. Dies ist ein gän- A(m + 1, n + 1) := A(m, A(m + 1, n))
giges Vorgehen in der Mathematik, und solange wir den Bereich der
I Funktionenhierarchie
„gewöhnlichen“ Funktionen nicht verlassen, auch nicht weiter schwer.
Beispielsweise bildet die Folge
n 2n
n, 2 · n, 3 · n, . . . , n2 , n3 , . . . , 2n , 3n , . . . , 22 , 22 , . . . (4.68)
A3 (n) := A(3, n) = O(2 ↑↑↑ n)
eine natürliche Hierarchie immer schneller wachsender Funktionen.
Komplizierter wird es, wenn wir versuchen, Funktionen in eine solche A2 (n) := A(2, n) = O(2 ↑↑ n)
Hierarchie zu integrieren, die noch viel schneller wachsen. Ein Beispiel A1 (n) := A(1, n) = O(2n )
hierfür ist die Ackermann-Funktion A(m, n), die wir auf Seite 212 be-
reits kennen gelernt haben. Ihre Definition sieht auf den ersten Blick A0 (n) := A(0, n) = O(n)
harmlos aus, und dennoch können wir den Funktionswert A(m, n) be-
reits für kleine Werte von m praktisch nicht mehr ausrechnen. Warum
dies so ist, wird klar, wenn wir den Parameter m für verschiedene Wer- Abbildung 4.29: Aus der Ackermann-
Funktion abgeleitete Operatorenhierarchie
te konstant halten. Auf diese Weise entsteht aus A(m, n) für jede Zahl
m ∈ N eine separate Funktion Am (n), deren Wachstumsverhalten in Ab-
bildung 4.29 dargestellt ist. Die Funktion A0 (n) wächst linear, A1 (n)
exponentiell, A2 (n) hyper-exponentiell und so fort. Damit entpuppt sich
Die in Abb. 4.29 verwende-
die Ackermann-Funktion als eine Art Universalfunktion, die eine un- te Notation 2 ↑k n geht auf
endliche Schar immer schneller wachsender Funktionen in sich vereint. den US-amerikanischen In-
Noch schneller wächst die Diagonalfunktion formatiker Donald E. Knuth
zurück [112]. 1976 schlug er diese Pfeil-
Aω (n) := An (n) notation als Lösung für ein lange beste-
hendes Problem der klassischen Mathe-
Für jeden Wert von m wird Aω (n) ab einem gewissen n größer sein als matik vor, für Funktionen jenseits der Ex-
Am (n). Wir sagen: Am wird durch Aω dominiert. Dass wir als Index die- ponentiation keine eigene Symbolik zu
ser Funktion die Ordinalzahl ω gewählt haben, ist naheliegend, schließ- kennen. Formal ist m ↑k n wie folgt defi-
lich können wir Aω in der gleichen Weise als Grenzfunktion ansehen, niert:
wie wir ω als Limes-Ordinalzahl für die natürlichen Zahlen definiert ⎧ b
⎨ a falls k = 1
haben. m ↑k n := 1 falls n = 0

m ↑k−1 (m ↑k (n − 1)) sonst
Ganz ähnlich sind auch Wainer und Löb vorgegangen. Die Löb-Wainer-
Hierarchie wird durch eine Folge von Funktionen fα mit einem ordi- Mit der 1976 geschaffenen Notation hat
nalen Index α gebildet. Die Funktionen f0 und f1 wachsen linear, f2 Knuth den Weg geebnet, um Funktionen
wächst bereits exponentiell, und für die Niederschrift für f3 müssten wir verschiedener Grade nach einem einheit-
auf Exponentialtürme zurückgreifen, wie wir sie in Abschnitt 3.2.2.2 für lichen Schema zu benennen. Die am lang-
samsten wachsende Funktion, die mit der
die Konstruktion von Ordinalzahlen verwendet haben.
Pfeilnotation dargestellt werden kann, ist
Mithilfe der Löb-Wainer-Hierarchie sind wir in der Lage, das rasante die Potenzierung (m ↑ n). Danach folgt mit
(m ↑↑ n) die Tetration und so fort.
Wachstumsverhalten der diagonalisierten Ackermann-Funktion quanti-
266 4 Beweistheorie

tativ einzufangen: Aω wächst mit der gleichen Geschwindigkeit wie die


0 ...
Funktion fω .
1 1 0 0 0
1 1

1 1 1 0 0 0 0 0
Jetzt ist auch klar, wie wir den Satz von Kreisel zu lesen haben. Wird
... ...
eine berechenbare Funktion f durch eine arithmetische Formel ϕ f be-
schrieben, so können wir innerhalb von PA nur dann auf einen Beweis
für die Formel
... 1 1 1 1 0 ∀ x ∃ y ϕ f (x, y)
0 0 ...
hoffen, wenn f von einer Funktion fα mit α < ε0 dominiert wird.
Existieren Funktionen,
die schneller wachsen als die Goodstein- Damit ist es an der Zeit, das Wachstumsverhalten der Goodstein-
Funktion? Die Antwort ist Ja! Eine be- Funktion näher zu beleuchten. Der eklatante Sprung von G(3) auf G(4)
kanntes Beispiel ist die Biber-Funktion weckt bereits die Vermutung, dass wir es hier mit einer Wachstums-
B(n) (busy beaver function), die der un- rate zu tun haben, die jene der diagonalisierten Ackermann-Funktion
garische Mathematiker Tibor Radó 1962 noch deutlich übersteigt. Dass wir heute sehr genau über das Wachs-
im Rahmen eines Wettbewerbs formulier-
tumsverhalten der Goodstein-Funktion Bescheid wissen, verdanken wir
te [18, 156]. Das ausgerufene Ziel war es,
eine Turing-Maschine (busy beaver) mit
Laurie Kirby und Jeff Paris. Im Jahr 1982 führten sie als erste den Be-
möglichst wenig Zuständen zu konstruie- weis, dass G(x) genauso schnell wächst wie die Funktion fε0 aus der
ren, die möglichst viele Einsen auf ein lee- Löb-Wainer-Hierarchie [108]. Das bedeutet im Umkehrschluss, dass G
res Band schreibt [18, 156]. Der Funkti- jede Funktion fα mit α < ε0 dominiert, und damit folgt aus dem Satz
onswert B(n) ist die maximal mögliche von Kreisel, dass es unmöglich ist, Formel (4.67) innerhalb der Peano-
Anzahl Einsen für einen Biber mit n Zu- Arithmetik zu beweisen. Aus der Äquivalenz des Satzes von Goodstein
ständen. Da für jedes n nur endlich viele und der Totalität von G(x) folgt jetzt sofort das gesuchte Ergebnis:
Biber existieren, ist der Wert der Biber-
funktion für alle n wohldefiniert. Trotz-
dem sind die Funktionswerte nur bis n = 4 Satz 4.16 (Kirby, Paris, 1982)
exakt bekannt:
Der Satz von Goodstein ist innerhalb von PA unbeweisbar.
B(1) B(2) B(3) B(4) B(5)
1 4 6 13 ≥ 4098
Ein interessanter Aspekt soll an dieser Stelle nicht unerwähnt bleiben.
Auch wenn es nicht möglich ist, Formel (4.67) in PA herzuleiten, so
Auch wenn für n ≥ 5 nur noch grobe
Abschätzungen existieren, lassen sich be- können wir für jeden konkreten Wert von x durchaus beweisen, dass die
eindruckende Aussagen über die Wachs- Funktion G an der Stelle x definiert ist. Das bedeutet, dass wir
tumsrate von B(n) treffen. So lässt sich
 ∃ y ϕG (x, y) (4.69)
beweisen, dass die Biberfunktion stär-
ker wachsen muss als jede berechenba- für alle x beweisen können. Gleichzeitig attestiert uns Satz 4.16:
re Funktion. Das bedeutet, dass B(n) so-
wohl die Ackermann-Funktion als auch  ∀ x ∃ y ϕG (x, y) (4.70)
die Goodstein-Funktion dominiert. Die
Biberfunktion selbst ist unberechenbar, Beide Varianten unterscheiden sich nur dadurch, dass die Quantifikati-
d. h., es ist nicht möglich, ein Verfahren on über x in (4.69) außerhalb des Kalküls und in (4.70) innerhalb des
zu konstruieren, mit dem sich der Funkti- Kalküls vorgenommen wurde. Erneut wird deutlich, wie penibel wir
onswert B(n) für alle n systematisch er- zwischen der Kalkülebene (∀x) und der Meta-Ebene (für alle x) unter-
mitteln lässt. scheiden müssen.
4.6 Übungsaufgaben 267

4.6 Übungsaufgaben

Auf Seite 209 haben Sie gelernt, wie sich Formeln der Peano-Arithmetik auf natürliche Aufgabe 4.1
Zahlen abbilden lassen. Diese Übungsaufgabe soll Ihnen einen Eindruck über die Größe der 
Zahlen vermitteln, mit denen wir es hier konkret zu tun haben. Versuchen Sie herauszufinden, Webcode
welche Formeln den folgenden Gödelnummern entsprechen: 4689

a) 27945122556290792802283166332500000000000
b) 920783852754905293279042680914408826637119384453120000

Hinweis: Es ist sehr aufwendig, derart große Zahlen per Hand zu faktorisieren. Greifen Sie
hierzu auf ein Software-Werkzeug wie Mathematica oder Maple zurück oder verwenden Sie
das Web-Portal WolframAlpha.

Verwenden Sie die auf Seite 209 beschriebene Methode, um die Gödelnummer der Formel Aufgabe 4.2
∃ x s(x) = x zu berechnen. Wiederholen Sie die Rechnung für die Formel 1 + 0 = 1. 
Webcode
Hinweis: Es reicht, wenn Sie die Gödelnummern in faktorisierter Schreibweise notieren. Bei- 4044
de Zahlen besitzen ausgeschrieben weit über hundert Dezimalziffern.

Eine clevere Art der Gödelisierung hat Raymond Smullyan in [185] vorgeschlagen. In seiner Aufgabe 4.3
Codierung wird jedem Formelzeichen zunächst einer der folgenden Basiscodes zugeordnet: 
Webcode
 4884
0 ( ) f , v ∼ ⊃ ∀ = ≤ 
# # # # # # # # # # # # #
1 0 2 3 4 5 6 7 8 9 10 11 12

Anschließend werden die ermittelten Codes als Ziffern einer Zahl zur Basis 13 aufgefasst.
Konkret: Besteht eine Formel ϕ aus n Zeichen und bezeichnen wir den Basiscode des i-ten
Zeichens mit ci , so berechnet sich die Gödelnummer über die Formel ϕ := ∑ni=1 ci · 13n−i .

a) Ermitteln Sie die Gödelnummer für die Formel ∀ v v = v.


b) Smullyan verwendet in seiner Logik das Hochkomma für die Nachfolgerfunktion. 0 steht
für die Zahl 1, 0 für die Zahl 2 und so fort. Welche Gödelnummer besitzt der Ausdruck,
der stellvertretend für die natürliche Zahl n steht?
268 4 Beweistheorie

Aufgabe 4.4 Gegeben sei ein Kalkül K, in dem sich Relationen und Funktionen auf die gleiche Weise
 arithmetisch repräsentieren lassen, wie wir es von der Peano-Arithmetik her gewohnt sind.
Webcode A1 und A2 stehen für die folgenden Aussagen:
4449
A1 : Repräsentiert ϕ eine Relation R semantisch, so repräsentiert sie R auch syntaktisch.
A2 : Repräsentiert ϕ eine Relation R syntaktisch, so repräsentiert sie R auch semantisch.

Vervollständigen Sie die folgende Aussagenmatrix: Aussage A1 Aussage A2


Ist der Kalkül K . . . wahr falsch wahr falsch

I korrekt und vollständig, so ist

I korrekt und negationsvollständig, so ist

I widerspruchsfrei und vollständig, so ist

I widerspruchsfrei und negationsvollständig, so ist

Aufgabe 4.5 Die Gödel’sche Originalarbeit aus dem Jahr 1931 enthält einen handwerklichen Teil, in dem
 45 primitiv-rekursive Funktionen und Relationen definiert werden. Los geht es mit zwei
Webcode Relationen und drei Funktionen:
4787
P1 (x, y) :⇔ ∃ z (z ≤ x ∧ x = y · z)

P2 (x) :⇔ ¬∃ (z ≤ x) (z = 1 ∧ z = x ∧ P1 (x, z)) ∧ x > 1

f3 (0, x) := 0
f3 (n + 1, x) := min{y ≤ x | P2 (y) ∧ P1 (x, y) ∧ y > f3 (n, x)}

f4 (0) := 1
f4 (n + 1) := (n + 1) · f4 (n)

f5 (0) := 0
f5 (n + 1) := min{y ≤ f4 ( f5 (n)) + 1 | P2 (y) ∧ y > f5 (n)}

Finden Sie heraus, welche inhaltliche Bedeutung den definierten Relationen und Funktionen
jeweils zukommt.
4.6 Übungsaufgaben 269

Betrachten Sie die folgende Argumentation: Aufgabe 4.6



a) Jede wahre Aussage der Zahlentheorie ist eine logische Fol- Webcode
gerung aus den Peano-Axiomen. 4135

b) Die Peano-Arithmetik formalisiert die Peano-Axiome. Als


Theorie erster Stufe erfüllt sie die Voraussetzungen des Gö-
del’schen Vollständigkeitssatzes. Dieser besagt, dass in Theo-
rien erster Stufe alle logischen Folgerungen innerhalb des
Kalküls bewiesen werden können.
c) Aus a) und b) folgt, dass jede wahre Aussage der Zahlentheo-
rie innerhalb der Peano-Arithmetik beweisbar ist.

Offensichtlich steht das Ergebnis im Widerspruch zu Gödels erstem Unvollständigkeitssatz.


Wo steckt der Fehler?

In Abschnitt 4.2 haben Sie die semantische und die syntaktische Variante des ersten Gö- Aufgabe 4.7
del’schen Unvollständigkeitssatzes kennen gelernt. Eine weitere Variante ist diese hier: 
Webcode
4040
Widerspruchs-
Korrekte
freie formale
formale Systeme


Systeme
„Jedes korrekte formale System, das stark
genug ist, um die Peano-Arithmetik zu for-
malisieren, ist negationsunvollständig.“
Negations-
Unvollständige
unvollständige
formale Systeme
formale Systeme

Die Formulierung ist stärker als die semantische Variante, aber schwächer als die syntakti-
sche. Lässt sie sich dennoch mit wenig Aufwand aus der semantischen Variante herleiten?

Auf Seite 224 haben wir behauptet, dass aus den drei Beziehungen Aufgabe 4.8

z = diag(y) ⇒  ∀ z (Diag(y, z) ↔ z = z) (4.71) Webcode
(x, y) ∈ B ⇒  B(x, y) (4.72) 4895
(x, y) ∈ B ⇒  ¬B(x, y) (4.73)
270 4 Beweistheorie

mit ein wenig Umformungsaufwand die folgenden Beziehungen abgeleitet werden können:
x codiert einen Beweis für die Formel ϕy (y) ⇒  ψGdl (x, y)
x codiert keinen Beweis für die Formel ϕy (y) ⇒  ¬ψGdl (x, y)
Skizzieren Sie den fehlenden Beweis.

Aufgabe 4.9 In Abschnitt 2.6 haben Sie die Prädikatenlogik zweiter Stufe kennen gelernt. Wir haben
 dort herausgearbeitet, dass wir die Ausdrucksstärke der PL1 durch die Hinzunahme von
Webcode Prädikat- und Funktionsvariablen erhöhen können. Ebenfalls wurde erwähnt, dass wir dafür
4875 einen hohen Preis zahlen müssen. Im Gegensatz zur Prädikatenlogik erster Stufe ist die PL2
nicht mehr vollständig, wenn wir die Standardsemantik zugrunde legen. Das bedeutet, dass
kein Kalkül existiert, in dem sich genau diejenigen Formeln der PL2 ableiten lassen, die
bezüglich der Standardsemantik allgemeingültig sind.

a) Konstruieren Sie eine PL2-Formel ϕ, die genau unter jenen Interpretationen wahr ist,
deren Individuenbereiche isomorph zu den natürlichen Zahlen sind:
(U, I) |= ϕ ⇔ U ∼
=N (4.74)

b) Zeigen Sie, dass die Unvollständigkeit der PL2 eine direkte Folge des ersten Gödel’schen
Unvollständigkeitssatzes ist.
c) Zeigen Sie, dass keine PL1-Formel existieren kann, die (4.74) erfüllt.

Aufgabe 4.10 In Abschnitt 4.2.8 haben wir definiert, was es bedeutet, eine natürliche Zahl mit einer Formel
 der Peano-Arithmetik zu benennen.
Webcode
4998 Welche Zahlen werden durch die folgenden Formeln benannt?

a) x + x = (s(s(0))) b) x + x = s(s(s(s(0))))
c) x × x = s(s(0)) d) x × x = s(s(s(s(0))))

Welche der folgenden Aussagen über die Formeln der Peano-Arithmetik sind richtig?

e) „Jede Formel benennt eine natürliche Zahl.“


f) „Jede natürliche Zahl wird durch eine Formel benannt.“
g) „Es gibt für jede natürliche Zahl unendlich viele Möglichkeiten, sie zu benennen.“
5 Berechenbarkeitstheorie

„If it should turn out that the basic


logics of a machine designed for the numerical solution
of differential equations coincide with the logics of a
machine intended to make bills for a department store, I
would regard this as the most amazing coincidence that
I have ever encountered.“

Howard Aiken [44]

Die Berechenbarkeitstheorie ist neben der Beweistheorie die zweite tra- Behalten Sie stets im Auge,
dass sich die Berechenbar-
gende Säule der mathematischen Logik. Unter ihrem Schirm vereint
keitstheorie mit der Existenz
sie alle Methoden und Erkenntnisse, die sich mit den Möglichkeiten von algorithmischen Lösun-
und Grenzen der algorithmischen Methode beschäftigen. Zwei Frage- gen beschäftigt, aber nicht mit deren Effi-
stellungen sind in diesem Zusammenhang von vorrangiger Bedeutung: zienz. Die ersten Arbeiten auf diesem Ge-
biet stammen aus einer Zeit, in der es den
I Wie lässt sich der Berechenbarkeitsbegriff formal definieren? Computer in seiner modernen Form noch
gar nicht gab, und so waren Fragen nach
Jeder von uns besitzt eine intuitive Vorstellung davon, was es bedeu- dem Ressourcenverbrauch eines algorith-
tet, etwas zu berechnen. Bei genauerer Betrachtung entpuppen sich mischen Verfahrens ohne Belang. Eher
unsere Gedankenmodelle aber schnell als zu vage, um daraus hand- zufällig erhielt die Berechenbarkeitstheo-
feste Schlüsse zu ziehen. In der Berechenbarkeitstheorie wird die rie mit dem Bau der ersten Rechenma-
intuitive Vorstellung durch die Definition präziser Berechnungsmo- schinen eine ganz praktische Bedeutung.
delle mit einem formalen Unterbau versehen. Einige dieser Modelle In der Folgezeit entstand mit der Kom-
besitzen durch und durch mathematischen Charakter, während sich plexitätstheorie ein eigenständiger For-
schungszweig, der sich mit der Laufzeit-
andere sehr nahe an der Hardware-Architektur realer Computersys-
und der Platzkomplexität von Algorith-
teme orientieren.
men beschäftigt. Die Berechenbarkeits-
I Wo sind die Grenzen der Berechenbarkeit? theorie und die Komplexitätstheorie sind
mittlerweile zu einem festen Bestandteil
Es ist ein Kernergebnis der Berechenbarkeitstheorie, dass viele un- des Informatikstudiums geworden, und je-
entscheidbare Probleme existieren, Probleme, deren Lösungen zwar der Absolvent ist heute mit den Grund-
existieren, aber nicht auf algorithmischem Wege bestimmt werden zügen beider Theorien vertraut. Dennoch
können. Die Konsequenzen, die sich hieraus ergeben, sind folgen- wissen nur wenige, dass insbesondere die
schwer, und ihre Auswirkungen sind weit über die Algorithmen- Berechenbarkeitstheorie ihre Wurzeln gar
oder Computertechnik hinaus zu spüren. So wissen wir heute, dass nicht in der Informatik hat. Sie wurde ge-
die Berechenbarkeits- und die Beweistheorie eng miteinander ver- schaffen, um Fragestellungen der mathe-
flochten sind und sich viele Negativresultate des einen Gebiets auf matischen Logik zu beantworten, und ist
älter als der erste real gebaute Computer.
das andere übertragen.

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6_5
272 5 Berechenbarkeitstheorie

In diesem Kapitel werden wir uns diesen Zusammenhang in zwei-


erlei Hinsicht zu Nutze machen. Zum einen werden wir zeigen, wie
sich für bereits bekannte Ergebnisse der Beweistheorie verblüffend
Maschine
Turing-

einfache Beweise konstruieren lassen. Zum anderen werden wir die


Ergebnisse der Berechenbarkeitstheorie dazu verwenden, um bisher
offen gebliebene Fragen zu beantworten.
Configuration Behaviour
final
m-config. symbol operations m-config.
b None P0, R c 5.1 Berechnungsmodelle
c None R e
e None P1, R f
f None R b In den folgenden beiden Unterabschnitten werden wir mit der Turing-
Maschine und der Register-Maschine zwei der wichtigsten Berech-
nungsmodelle genauer untersuchen. Anschließend werden wir die
Church’sche These diskutieren und dabei feststellen, dass es keine Rolle
b → q1 spielt, welches Modell wir für die Untersuchung des Berechenbarkeits-
c → q2 begriffs konkret verwenden.
e → q3
f → q4

’None’ → S0 5.1.1 Turing-Maschinen


0 → S1
1 → S2 In Abschnitt 1.2.8 haben wir die grundlegende Funktionsweise von
Turing-Maschinen dargelegt und auch schon eine konkrete Beispielma-
schine in Aktion erlebt. Wir wollen nun daran gehen, den Turing’schen
Maschinenbegriff formal zu definieren:
Q = {q1 , q2 , q3 , q4 }
S = {S0 , S1 , S2 } Definition 5.1 (Turing-Maschine)
I = {(q1 , S0 , S1 , R, q2 ),
(q2 , S0 , S0 , R, q3 ), Eine Turing-Maschine ist ein Tripel (Q, S, I). Sie besteht aus
(q3 , S0 , S2 , R, q4 ), I der endlichen Zustandsmenge Q = {q1 , . . . , qN },
(q4 , S0 , S0 , R, q1 )}
I dem Bandalphabet S = {S0 , . . . , SM } und

Abbildung 5.1: Formale Beschreibung der I der Instruktionsmenge I = {I1 , . . . , IK }.


ersten Maschine aus Turings Originalarbeit
Eine Instruktion aus der Menge I hat die Form
(qi , S j , Sk , L, ql ) oder (qi , S j , Sk , R, ql ) oder (qi , S j , Sk , N, ql )
mit qi , ql ∈ Q und S j , Sk ∈ S.

Abbildung 5.1 zeigt, wie sich die erste Beispielmaschine aus Turings
Originalarbeit in der vereinbarten Nomenklatur beschreiben lässt. Es ist
5.1 Berechnungsmodelle 273

(qi , S j , Sk , L, ql ) (qi , S j , Sk , R, ql ) (qi , S j , Sk , N, ql )

I Wird im Zustand qi I Wird im Zustand qi I Wird im Zustand qi


das Symbol S j gelesen, dann das Symbol S j gelesen, dann das Symbol S j gelesen, dann

  Sj      Sj      Sj   
... ... ... ... ... ...

qi qi qi

I ersetze S j durch Sk , I ersetze S j durch Sk , I ersetze S j durch Sk ,


I gehe nach links, I gehe nach rechts, I behalte die aktuelle Position,
I wechsle in den Zustand ql . I wechsle in den Zustand ql . I wechsle in den Zustand ql .

  Sk      Sk      Sk   
... ... ... ... ... ...
ql ql ql

Abbildung 5.2: Interpretation der Instruktionen einer Turing-Maschine

die gleiche Maschine, die uns in Abschnitt 1.2.8 als Demonstrationsob-


jekt treu zur Seite stand.

Der Zustand q1 und das Bandsymbol S0 besitzen in unserem Modell


eine besondere Bedeutung. q1 ist der Initialzustand oder Startzustand,
in dem jede Turing-Maschine per Definition beginnt. Das Symbol S0
wird dazu verwendet, um eine leere Bandstelle zu markieren. Um es
optisch von den anderen zu unterscheiden, verwenden wir für S0 auch
das Zeichen . Turing ließ seine Maschinen stets auf einem leeren Band
starten, d. h., auf einem Band, dessen Felder allesamt mit dem Symbol
 vorbeschrieben waren.

Nach dem Start beginnt eine Turing-Maschine mit der Ausführung von
Berechnungsschritten (Abbildung 5.2). Zu Beginn eines Berechnungs-
schritts liest sie das Zeichen unter dem Schreib-Lese-Kopf ein. Findet
die Maschine dort beispielsweise das Bandzeichen S j , so sucht sie in
274 5 Berechenbarkeitstheorie

Abhängigkeit vom aktuellen Zustand qi nach einer passenden Instrukti-


on der Form
(qi , S j , _, _, _) (5.1)
Die gefundene Instruktion wird ausgeführt und im nächsten Berech-
nungsschritt der gesamte Vorgang wiederholt.

Zwei Sonderfälle dürfen wir an dieser Stelle nicht übergehen. Unsere


Definition schließt nicht aus, dass für ein Bandzeichen S j und einen
Zustand qi mehr als eine Instruktion der Form (5.1) existiert. Solche
Maschinen heißen indeterministisch und spielen in der Komplexitäts-
theorie eine wichtige Rolle (siehe z. B. [96]). Für unsere Betrachtungen
gehen wir davon aus, dass die betrachteten Turing-Maschinen allesamt
deterministisch sind und somit für kein Bandzeichen S j und Zustand qi
mehr als eine Instruktion der Form (5.1) existiert. Davon unberührt ist
es immer möglich, dass überhaupt keine passende Regel gefunden wer-
den kann. In diesem Fall hält die Maschine an und führt keine weiteren
Berechnungen mehr aus; wir sagen, die Maschine terminiert.

Wir wollen nun darangehen, den geschilderten Berechnungsablauf for-


mal zu beschreiben. Im Kern steht der Begriff der Konfiguration, der
uns erlaubt, den augenblicklichen Zustand einer Turing-Maschine im
Sinne einer Momentaufnahme zu erfassen.

Definition 5.2 (Konfiguration)

Sei M = (Q, S, I) eine Turing-Maschine. Jeder Vektor der Form


x = (q, i, s0 , s1 , . . . , sn )
heißt Konfiguration von M.
I q ist der aktuelle Zustand der Maschine,

I i die Position des Schreib-Lese-Kopfs (0 ≤ i ≤ n)


I und s0 , s1 , . . . , sn der bisher benutzte Bandabschnitt.

Weiter oben haben wir festgelegt, dass eine Turing-Maschine im Zu-


stand q1 beginnt und alle Bandstellen initial mit dem Zeichen  be-
schrieben sind. Demnach startet jede Turing-Maschine in der Start- oder
Initialkonfiguration
xStart := (q1 , 0, )
Ausgehend von der Initialkonfiguration können wir die Berechnungsse-
quenz einer Turing-Maschine in eine Folge von Konfigurationen über-
5.1 Berechnungsmodelle 275

setzen. Abbildung 5.3 demonstriert, wie diese für unsere Beispielma- (q1, 0 ,  )
schine aussieht.
(q1 , , S1 , R, q2 )
Behalten Sie stets im Gedächtnis, dass die Maschinen aus Turings Ori-
ginalarbeit für die Erzeugung von reellen Zahlen konzipiert waren. Ei- (q2, 1 ,S1,  )
ne solche Maschine schreibt die Ziffern einer reellen Zahl nacheinander
(q2 , , , R, q3 )
auf ein initial leeres Band und hält im Normalfall niemals an.
An dieser Stelle werden wir Turings historische Route verlassen und das (q3, 2 ,S1,  ,  )
Verhalten seiner Maschinen in einem moderneren Sinne interpretieren;
wir werden sie dazu verwenden, um Funktionen der Form (q3 , , S2 , R, q4 )

f : S∗ → S∗ (q4, 3 ,S1,  ,S2,  )

zu berechnen. Hierzu wird zunächst ein Eingabewort ω ∈ S∗ an einer (q4 , , , R, q1 )


beliebigen Stelle auf das Band geschrieben und der Schreib-Lese-Kopf
auf das erste Zeichen positioniert. Anschließend werden die oben be- (q1, 4 ,S1,  ,S2,  ,  )
schriebenen Berechnungsschritte durchgeführt. Terminiert die Maschi-
ne, so interpretieren wir den Bandinhalt als den Funktionswert f (ω). (q1 , , S1 , R, q2 )
Terminiert sie nicht, so betrachten wir die Funktion f an der Stelle ω
als undefiniert. Turing-Maschinen sind damit auf natürliche Weise in (q2, 5 ,S1,  ,S2,  ,S1,  )
der Lage, partielle Funktionen zu berechnen. Im Folgenden bezeichnen (q2 , , , R, q3 )
wir jede Funktion, die sich auf die geschilderte Weise berechnen lässt,
als Turing-berechenbar. (q3, 6 ,S1,  ,S2,  ,S1,  ,  )
Wir halten fest: Turing-Maschinen nehmen von Hause aus Zeichense- (q3 , , S2 , R, q4 )
quenzen entgegen und keine Zahlen. Wollen wir mit Turing-Maschinen
arithmetische Operationen ausführen, d. h., Funktionen der Form (q4, 7 ,S1,  ,S2,  ,S1,  ,S2,  )
f : N→N (q4 , , , R, q1 )
berechnen, so müssen wir eine geeignete Codierung finden, die Zahlen-
(q1, 8 ,S1,  ,S2,  ,S1,  ,S2,  ,  )
werte auf Wörter der Menge S∗ abbildet. Zwei Codierungen drängen
sich an dieser Stelle regelrecht auf: (q1 , , S1 , R, q2 )

I Unäre Codierung (q2, 9 ,S1,  ,S2,  ,S1,  ,S2,  ,S1,  )


Die Ein- und Ausgabewerte werden durch Einserfolgen entsprechen- (q2 , , , R, q3 )
der Länge repräsentiert (vgl. Abbildung 5.4 Mitte). Die unäre Co-
dierung besitzt den Vorteil, dass sich viele Algorithmen besonders (q3 ,10,S1,  ,S2,  ,S1,  ,S2,  ,S1,  ,  )
einfach in eine entsprechende Turing-Maschine übersetzen lassen.
Für Komplexitätsbetrachtungen ist sie nicht geeignet, da bereits das (q3 , , S2 , R, q4 )
Schreiben einer Zahl n einen linear steigenden Aufwand verursacht.
...
I Binäre Codierung
Die Ein- und Ausgabewerte werden im Binärformat auf das Band Abbildung 5.3: Konfigurationsübergänge
geschrieben (vgl. Abbildung 5.4 unten). Die Codierung entspricht der diskutierten Beispielmaschine
276 5 Berechenbarkeitstheorie

I Allgemeines Berechnungsschema jener, die in realen Computersystemen zum Einsatz kommt. Im Be-
reich der Komplexitätstheorie ist die binäre Codierung die bevorzug-
...  ω    ... te Darstellung, da sich viele Ergebnisse direkt auf reale Rechnerar-
chitekturen übertragen lassen.

Mithilfe einer Turing-Maschine lässt sich die unäre Codierung einer na-
türlichen Zahl vergleichsweise einfach in die binäre Codierung überset-
Turing-
f (ω) zen und umgekehrt. Für die Problemstellungen aus dem Gebiet der Be-
Maschine
rechenbarkeitstheorie ist die Wahl der Codierung damit irrelevant, da es
...  f (ω)   ... hier lediglich um die Frage geht, ob und nicht wie effizient eine Lösung
Band gefunden werden kann.

I Unäre Codierung
5.1.1.1 Erweiterungen des Basismodells

...  1 1 1   ... In der Vergangenheit wurden aus dem Turing’schen Maschinenmodell


verschiedene Varianten abgeleitet, von denen wir drei skizzenhaft vor-
stellen wollen (Abbildung 5.5). Eine ausführliche Beschreibung der
f (3) = 4 Maschinentypen finden Sie in [96] oder [186].
Turing-
f (x) = x + 1 Maschine
I Einseitig beschränkte Turing-Maschinen
...  1 1 1 1  ... Einseitig beschränkte Turing-Maschinen verwenden ein Band, das
Band sich nur in einer Richtung unendlich weit ausbreitet. Ohne Beschrän-
kung der Allgemeinheit können wir von einem nach links begrenzten
I Binäre Codierung
Band ausgehen und die Felder mit den natürlichen Zahlen durch-
nummerieren. Der Bandanfang besitzt den Index 0 und speichert
das erste Zeichen der Eingabesequenz. Der Schreib-Lese-Kopf ei-
...  1 1    ... ner einseitig beschränkten Turing-Maschine kann sich nicht über das
Bandende hinausbewegen. Eine angeforderte Linksbewegung wird
in diesem Fall ignoriert, und der Schreib-Lese-Kopf verharrt in sei-
f (3) = 4 ner Position.
Turing- I Mehrspur-Turing-Maschinen
f (x) = x + 1 Maschine
Eine k-Spur-Turing-Maschine besteht aus einem Band, das in k sepa-
...  1 0 0   ... rate Spuren unterteilt ist. Die einzelnen Spuren werden von fest an-
Band einandergekoppelten Schreib-Lese-Köpfen angesprochen. Ähnlich
dem Prinzip, das konventionellen Festplattenlaufwerken zugrunde
liegt, können sich die Köpfe alle gleichzeitig nach links oder rechts,
Abbildung 5.4: Die unäre und die binäre
aber nicht unabhängig voneinander bewegen.
Codierung im Vergleich
I Mehrband-Turing-Maschinen
Eine k-Band-Turing-Maschine besteht aus k Bändern, die von se-
paraten Schreib-Lese-Köpfen angesprochen werden. Im Gegensatz
5.1 Berechnungsmodelle 277

Einseitig beschränkte Maschine Mehrspur-Maschine gMehrband-Maschineg

...  1 1 0 0  ... ...  1 1 0   ...


...   0 1   ... Band 1

 1 1 0   ... ...  1 1 0   ... ...  0 1    ...


Band Band Band 2
Maschine

Maschine

Maschine
Turing-

Turing-

Turing-
Abbildung 5.5: Die einseitige Beschränkung des Bandes sowie das Hinzufügen neuer Spuren oder Bänder ändert nichts an der
Berechnungsstärke der Turing-Maschine. Die entstehenden Maschinenmodelle sind äquivalent.

zu Mehrspur-Turing-Maschinen gestattet sie, dass alle Schreib-Lese-


Köpfe unabhängig voneinander bewegt werden.

Es ist ein bekanntes Ergebnis der Berechenbarkeitstheorie, dass sich


die vorgestellten Maschinenmodelle ineinander überführen lassen und
die gleiche Berechnungsstärke besitzen wie das Basismodell [96]. Kon-
kret besagt die Äquivalenz das Folgende: Ist eine Funktion mit einer
Turing-Maschine berechenbar, so ist sie z. B. auch mit einer einseitig
beschränkten Turing-Maschine berechenbar und umgekehrt. Das Glei-
che gilt für die anderen Maschinentypen. Diese Eigenschaft wird in
der Berechenbarkeitstheorie häufig ausgenutzt. Wird ein Ergebnis bei-
spielsweise für einseitig beschränkte Maschinen hergeleitet, so stellen
die Äquivalenzen sicher, dass die Ergebnisse auch für die anderen Ma-
schinenmodelle Bestand haben.

Am Beispiel der einseitig beschränkten Turing-Maschinen wollen wir


demonstrieren, wie sich die verschiedenen Maschinenmodelle gegen-
seitig simulieren lassen. Einseitig beschränkte Turing-Maschinen lassen
sich durch das Basismodell simulieren, indem das Bandende durch ein
spezielles Symbol ‚♦‘ markiert und für alle qi ∈ Q eine Instruktion

(qi , ♦, ♦, R, qi )

hinzugefügt wird. Hierdurch wird der Schreib-Lese-Kopf auf die Start-


position zurückbewegt, bevor der Bandanfang verlassen wird.
278 5 Berechenbarkeitstheorie

S1 S2
Die Umkehrung gilt ebenfalls, d. h., wir können jede Turing-Maschine
♢   ... durch eine einseitig beschränkte Turing-Maschine simulieren. Wir be-
Band ginnen, indem wir den Bandanfang erneut mit dem speziellen Symbol
‚♦‘ markieren. Anschließend bewegen wir den Schreib-Lese-Kopf nach
Maschine

rechts auf das erste Zeichen der Eingabe und starten die Maschine. So-
Turing-

lange sich der Kopf rechts des ersten Eingabezeichens befindet, ver-
läuft die Berechnung wie gehabt. Bewegt die Maschine den Schreib-
Lese-Kopf jedoch über die linke Grenze hinaus, treffen wir also auf das
vorher eingefügte Symbol ‚♦‘, so müssen wir ein wenig Sonderarbeit
leisten. Wir schaffen zunächst Platz für ein neues Zeichen, indem wir
♢ S1 S2   ...
den gesamten Bandinhalt um eine Stelle nach rechts verschieben (Ab-
bildung 5.6). Anschließend führen wir die Berechnung in gewohnter
Band
Weise fort.
Maschine
Turing-

Die Konstruktion zeigt, dass wir jede Turing-Maschine in eine äqui-


valente Maschine übersetzen können, die niemals versuchen wird, den
Schreib-Lese-Kopf nach links über die Startposition hinauszubewegen.

5.1.1.2 Alternative Beschreibungsformen


♢  S1 S2  ...
Band Die bisherige Darstellung von Turing-Maschinen orientierte sich eng
an Turings Originalarbeit. In diesem Abschnitt wollen wir eine andere
Maschine

Darstellungsvariante diskutieren, die auf den britischen Mathematiker


Turing-

Stephen Wolfram zurückgeht und sich an jener des linearen Automaten


orientiert [218]. Lineare Automaten bilden eine Untergruppe der zellu-
lären Automaten:
Abbildung 5.6: Jede Turing-Maschine lässt
sich durch eine einseitig beschränkte Ma-
schine simulieren. Steht der Schreib-Lese- Definition 5.3 (Zellulärer Automat)
Kopf, wie hier, ganz links, so wird die
Kopfbewegung simuliert, indem der gesam-
Ein zellulärer Automat (cellular automaton), kurz ZA, ist ein 4-
te Bandinhalt eine Stelle nach rechts kopiert Tupel (Z, Q, ν, δ ). Er besteht aus
wird. Das Symbol ‚♦‘ wird benötigt, um das
I der Zellmenge Z,
linke Ende des Bands zu markieren.
I der endlichen Zustandsmenge Q,

I der Nachbarschaftsfunktion ν : Z → Z n ,
I der Zustandsübergangsfunktion δ : Q × Qn → Q

Ein zellulärer Automat setzt sich aus mehreren Elementarautomaten zu-


sammen, die in der Menge Z zusammengefasst sind und als Zellen be-
zeichnet werden. Jede Zelle befindet sich zu jedem Zeitpunkt in einem
5.1 Berechnungsmodelle 279

gVon-Neumann-Nachbarschaftg gMoore-Nachbarschaftg gHexagon-Nachbarschaftg

z1 z2 z3 z1 z2 z3 z2
z1 z3
z4 z z5 z4 z z5 z
z4 z6
z6 z7 z8 z6 z7 z8 z5

ν(z) = (z2 , z4 , z5 , z7 ) ν(z) = (z1 , z2 , z3 , z4 , z5 , z6 , z7 , z8 ) ν(z) = (z1 , z2 , z3 , z4 , z5 , z6 )

Abbildung 5.7: Verschiedene Nachbarschaftsbeziehungen zellulärer Automaten

von endlich vielen Zuständen aus der Menge Q. In der Literatur werden
die Zustände gern durch verschiedene Farben dargestellt. In diesem Fall
entspricht die Menge Q dem verfügbaren Farbvorrat.

In einem zellulären Automaten stehen die einzelnen Zellen in ständi-


ger Interaktion. Wie sich eine Zelle verhält, wird zum einen durch ihren
eigenen, aktuell eingenommenen Zustand und zum anderen durch den
Zustand ihrer Nachbarzellen bestimmt. In welcher Nachbarschaftsbe-
ziehung sich die Zelle befinden, definiert die Funktion ν. Sie bildet eine
Zelle z auf einen n-elementigen Vektor ab, der alle Nachbarn von z ent-
hält. Abbildung 5.7 zeigt, dass mit ν beliebige Topologien von Nach-
barschaftsbeziehungen modelliert werden können.

Das Schaltverhalten eines zellulären Automaten wird durch die Zu-


standsübergangsfunktion δ bestimmt. Befinden sich die Nachbarzellen
z1 , . . . , zn von z in den Zuständen

qz1 , . . . , qzn ,

so lässt sich der Nachfolgezustand von z wie folgt berechnen:

qz = δ (qz , qz1 , . . . , qzn ) (5.2)

Jede Auswertung von δ entspricht der Änderung des Zustands einer


einzelnen Zelle.

Lineare Automaten sind zelluläre Automaten mit einer eindimensiona-


len Topologie; die Zellen sind nebeneinander angeordnet und erstrecken
sich in beide Richtungen in das Unendliche. Damit bilden sie exakt
280 5 Berechenbarkeitstheorie

I Regelschema das unendliche Band nach, das wir für die Modellierung von Turing-
Maschinen benötigen. Der Bandinhalt wird durch die Färbungen der
Aktueller Aktuelles
Zustand Bandzeichen
Zellen dargestellt, so dass wir die zur Verfügung stehende Farbmenge
in direkter Weise als das Bandalphabet einer Turing-Maschine interpre-
tieren können.

Folgezustand
Beachten Sie, dass die Berechnung in einem linearen Automaten ver-
Neues teilt erfolgt und alle Zellen parallel eine Zustandsänderung durchfüh-
und Bewegung
Bandzeichen
nach links ren. Im Gegensatz hierzu arbeitet eine Turing-Maschine mit einem ein-
zigen Schreib-Lese-Kopf, der sich zu jeder Zeit an einer wohldefinier-
I Vollständiger Regelsatz ten Position befindet. Um das Verhalten einer Turing-Maschine trotz-
dem mithilfe eines linearen Automaten beschreiben zu können, müs-
Regel 1 Regel 2 Regel 3 Regel 4
sen wir das Automatenmodell geringfügig anpassen. Zunächst erwei-
tern wir den linearen Automaten um eine spezielle Kopfzelle (head
cell), die als Schreib-Lese-Kopf fungiert. Das Schaltverhalten des er-
weiterten linearen Automaten legen wir analog zur Funktionsweise der
I Automat in Aktion
Turing-Maschine fest. In jedem Berechnungsschritt wird die Kopfzelle
umgefärbt und gegebenenfalls um eine Position nach links oder rechts
geschoben. Außerdem reichern wir die Kopfzelle um einen zusätzlichen
Zustand an, der mit dem Zustand der modellierten Turing-Maschine
identisch ist.
Abbildung 5.8 zeigt, wie sich die Beispielmaschine aus Abbildung 5.1
in der Notation des modifizierten linearen Automaten beschreiben lässt.
Die Zustände q1 , q2 , q3 , q4 werden durch die Richtungen der verwende-
ten Keilsymbole und die Bandzeichen S0 , S1 , S2 durch die unterschiedli-
chen Einfärbungen der Zellen repräsentiert. Jede der vier Instruktionen
Zeit
wird durch je zwei Farbfelder und zwei Keilsymbole beschrieben. Das
obere Farbfeld definiert das aktuelle und das untere das neu zu schrei-
Abbildung 5.8: Durch eine Modifikation bende Bandzeichen. Die Richtung des oberen Keils gibt an, in welchem
des Grundmodells lassen sich lineare zel- Zustand sich die Maschine befinden muss, damit die entsprechende Re-
luläre Automaten für die Simulation von gel angewendet werden kann. Der Folgezustand und die auszuführende
Turing-Maschinen einsetzen. Kopfbewegung werden durch den unteren Keil festgelegt. Ist das Keil-
symbol links des Folgezustands eingezeichnet, bewegt sich der Schreib-
Lese-Kopf nach links, ist es rechts eingezeichnet, bewegt er sich nach
rechts. In unserem Beispiel führen alle Instruktionen eine Kopfbewe-
gung nach rechts aus.

In der Nomenklatur von Stephen Wolfram wird der so konstruierte Au-


tomat als 4,3-Maschine bezeichnet, da er insgesamt 4 Keilrichtungen
und 3 Farben unterscheidet.
5.1 Berechnungsmodelle 281

5.1.1.3 Universelle Turing-Maschine I Turing-Maschine M

In seiner Arbeit aus dem Jahr 1936 hat Turing gezeigt, dass seine Ma- ... ω     ...
schinen zu weit mehr fähig sind, als einfache Berechnungen durchzu- Eingabeband von M
führen. Besonders eindrucksvoll stellte er dies mit der Konstruktion

Berechnung
einer universellen Maschine unter Beweis, die in der Lage ist, andere
Maschinen zu simulieren. In seiner Arbeit hat Turing die universelle
Maschine ausführlich in §6 beschrieben. Seine Ausführung beginnt mit
den folgenden Worten [200]: M

Ausgabeband von M
„It is possible to invent a single machine which can be used f (ω)  
... ...
to compute any computable sequence. If this machine U is
supplied with a tape on the beginning of which is written
the S.D of some computing machine M, then U will compu- I Universelle Turing-Maschine U
te the same sequence as M. “

Abbildung 5.9 veranschaulicht auf grafische Weise, wie die universelle


Turing-Maschine arbeitet. Als Eingabe nimmt sie die Beschreibung ei-
ner anderen Maschine M in einer codierten Form entgegen, die Turing
als Standardbeschreibung bezeichnet (standard description, kurz S.D). M
Nach dem Start beginnt die universelle Turing-Maschine, das Verhalten
von M Schritt für Schritt zu simulieren. Ist die Berechnung beendet, so Codierung von M
steht der gleiche Inhalt auf dem Band, den auch M produziert hätte; von
... S.D.  ω  ...
außen ist dann nicht mehr zu unterscheiden, ob die Bandausgabe von M
selbst geschrieben wurde oder im Rahmen einer Simulation entstanden Eingabeband von U
ist. Insgesamt ist die universelle Turing-Maschine in ihrer Funktions-
weise dem modernen Computer sehr ähnlich; sie agiert als Interpreter, Berechnung
der das Verhalten einer anderen Maschine in stoischer Manier simuliert.
Die Standardbeschreibung ist das Programm, das von der universellen
Maschine nach dem Start abgearbeitet wird. U

Für die Definition der Standardbeschreibung machte sich Turing zu Ausgabeband von U
Nutze, dass das Verhalten einer Maschine durch ihre Instruktionsmenge ... f (ω)   ...
eindeutig definiert ist. Werden die Instruktionen hintereinander aufge-
schrieben, so entsteht eine Zeichenkette, aus der sich die Funktions-
weise einer Turing-Maschine vollständig rekonstruieren lässt. Für die
Abbildung 5.9: Arbeitsweise der universel-
Maschine aus Abbildung 5.1 sieht diese Zeichenkette z. B. so aus:
len Turing-Maschine. Eine andere Maschi-
; q1 S0 S1 Rq2 ; q2 S0 S0 Rq3 ; q3 S0 S2 Rq4 ; q4 S0 S0 Rq1 ne M wird simuliert, indem M als Zeichen-
kette codiert und zusammen mit dem Einga-
Mit dem Semikolon hatte Turing ein neues Symbol eingeführt, das als bewort ω auf das Band von U geschrieben
Orientierungsmarke fungiert. Seine universelle Maschine sucht gezielt wird. Nach dem Start wird U den Bandin-
halt analysieren und das Verhalten von M
nach diesem Symbol, um mit wenig Aufwand den Anfang oder das En-
Schritt für Schritt simulieren.
de einer Instruktion anzusteuern. Unbedingt benötigt wird es nicht, da
282 5 Berechenbarkeitstheorie


(q1 , S0 , S1 , R, q2 ) ⎪
⎪ sich die Instruktionen mit etwas Zusatzaufwand auch ohne das Semiko-

(q2 , S0 , S0 , R, q3 ) Instruktions- lon rekonstruieren lassen.
(q3 , S0 , S2 , R, q4 ) ⎪
⎪ tabelle

(q4 , S0 , S0 , R, q1 ) Abbildung 5.10 zeigt, wie es weitergeht. Nachdem die Instruktionskette
gebildet ist, werden die Symbole qi und Si nach dem folgenden Schema
durch die Bandsymbole D, A und C ersetzt.
⎫ qi := D AAA . . . A Si := DCCC . . .C
; q1 S0 S1 Rq2 ⎪


; q2 S0 S0 Rq3 Instruktions- i-mal i-mal
; q3 S0 S2 Rq4 ⎪
⎪ kette
⎭ Als Ergebnis erhalten wir das, was Turing als standard description, kurz
; q4 S0 S0 Rq1
S.D, bezeichnet. Es ist eine Folge von Zeichen, die das Verhalten der
qi := D A . . . A, Si := D C . . .C codierten Maschine eindeutig beschreibt. Zusätzlich hat Turing den Be-
i-mal i-mal griff der description number, kurz D.N, eingeführt. Sie wird aus der
Standardbeschreibung gewonnen, indem jedes Zeichen durch eine fest-

; DADDCRDAA ⎪ gelegte Ziffer ersetzt wird.

⎬ Standard
; DAADDRDAAA
description Den Einfluss, den die Gödel’sche Arbeit aus dem Jahr 1931 auf Turing
; DAAADDCCRDAAAA ⎪

⎭ (S.D) gehabt haben muss, wird an keiner anderen Stelle so deutlich wie hier.
; DAAAADDRDA
Gödel hatte gezeigt, dass sich die Formeln eines formalen Systems in
A ↔1 C ↔2 D↔3
natürliche Zahlen übersetzen lassen. Turings Codierung erfüllt den glei-
L ↔4 R ↔5 N ↔6
chen Zweck; sie zeigt, dass wir das Verhalten einer Turing-Maschine
; ↔7
vollständig in eine einzige natürliche Zahl hineincodieren können. Wir

7313325311731133 . . . ⎬ Description wollen die Gemeinsamkeit auch sprachlich zum Ausdruck bringen und
5311173111332253 . . . number die description number einer Turing-Maschine M im Folgenden als die
⎭ Gödelnummer von M bezeichnen.
111173111133531 (D.N)

Abbildung 5.10: Gödelisierung von Turing war sich der großen Bedeutung seiner universellen Maschine
Turing-Maschinen bewusst und beschrieb sie in entsprechend großer Akribie. Neben einer
mehrseitigen Erklärung der grundlegenden Funktionsweise ist in sei-
ner Arbeit die vollständige Instruktionstabelle abgedruckt (vgl. Abbil-
dung 5.11 und 5.12). Die universelle Maschine ist modular aufgebaut
und setzt sich aus mehr als 50 Einzelmaschinen zusammen, die sich
Ein Blick in Turings Ori-
ginalarbeit deckt auf, dass gegenseitig referenzieren. Um eine möglichst kompakte Darstellung zu
dort eine andere Gödelnum- erreichen, ließ er den Folgezustand einer Maschine auf den Startzustand
mer abgedruckt ist als jene, einer anderen Maschine verweisen und versah die Referenz zusätzlich
die wir in Abbildung 5.10 ermittelt haben. mit einem oder mehreren Parametern. Auf diese Weise hatte Turing
Schuld daran ist die Position des Semiko- einen Sprungbefehl erschaffen und damit auf ein Konzept zurückge-
lons. In seinen Erklärungen hatte Turing griffen, das viele Jahre später zum Standardrepertoire imperativer Pro-
das Symbol benutzt, um das Ende einer grammiersprachen werden sollte.
Instruktion zu markieren, ganz so, wie es
in modernen Programmiersprachen üblich J. P. Burgess bezeichnet die universelle Maschine als „one of the intel-
ist. In Wahrheit funktioniert seine univer- lectual landmarks of the last century“ [16], und es ist unzweifelhaft,
selle Maschine aber anders; sie erwartet dass Turing 1936 ein begeisterndes Kapitel Wissenschaftsgeschichte
das Semikolon am Anfang und nicht am geschrieben hat. Teil dieses Kapitels sind aber auch zwei kleine Schön-
Ende einer Instruktion [148]. heitsfehler, die an dieser Stelle nicht unerwähnt bleiben sollen:
5.1 Berechnungsmodelle 283




e L f1 (C, B, α) cp1 (C, U, β ) γ f (cp2 (C, U, γ), U, β )

⎨ ⎧
f(C, B, α) Not e L f(C, B, α) ⎨ γ C

⎪ cp2 (C, U, γ)

⎩ None ⎩ Not γ
L f(C, B, α) U


⎪ α C cpe(C, U, F, α, β ) cp (e (e(C, C, β ), C, α) , U, F, α, β )


f1 (C, B, α) Not α R f1 (C, B, α) cpe(U, F, α, β ) cpe (cpe(U, F, α, β ), U, F, β )


⎪ None
⎩ ⎧
R f2 (C, B, α) ⎨ Any
⎧ R q(C)
⎪ q(C)
⎪ α
⎨ C ⎩ None R q1 (C)
f2 (C, B, α) Not α R f1 (C, B, α) ⎧

⎪ ⎨ Any R q(C)
⎩ q1 (C)
None R B
⎩ None C
pe(C, β ) f(pe1 (C, β ), C, )
e
⎧ q(C, α) q (q1 (C, α))
⎨ Any R, R pe1 (C, β ) ⎧
pe1 (C, β ) ⎨ α C
⎩ None Pβ C q1 (C, α)
⎩ Not α L q1 (C, α)
l(C) L C
pe2 (C, α, β ) pe (pe(C, β ), α)
r(C) R C
ce2 (B, α, β ) ce (ce(B, β ), α)
f (C, B, α) f(l(C), B, α)
ce3 (B, α, β , γ) ce (ce2 (B, β , γ), α)
f (C, B, α) f(r(C), B, α)
ce4 (B, α, β , γ, δ ) ce (ce3 (B, β , γ, δ ), α)
c(C, B, α) f (c1 (C), B, α)
ce5 (B, α, β , γ, δ , ε) ce (ce4 (B, β , γ, δ , ε), α)
c1 (C) β pe(C, β ) ⎧
⎨ e R e1 (C)
ce(C, B, α) c (e(C, B, α), B, α) e(C)
⎩ Not L e e(C)
ce(B, α) ce (ce(B, α), B, α) ⎧
⎨ Any R, E, R e (C)
cp(C, U, F, α, β ) f (cp1 (C1 , U, β ), f(U, C, β ), α) e1 (C)
1
⎩ None C

Abbildung 5.11: Hilfsroutinen für die Konstruktion von Turings universeller Maschine aus dem Jahr 1936 [200]. Die farblich
hervorgehobenen Passagen sind Korrekturen, die später von Emil Post und Donald Davies eingebracht wurden [40, 148].

I Streng genommen arbeitet Turings universelle Maschine nicht ex-


akt so, wie es in Abbildung 5.9 beschrieben ist. Das Problem stellt
sich wie folgt dar: Simuliert die Maschine U die Maschine M, so
ist sichergestellt, dass U die gleiche Ziffernfolge wie M generiert,
allerdings erscheinen die Ziffern nicht an den gleichen Bandpositio-
nen. Turing hatte seine Maschine so konstruiert, dass sie zusätzliche
Hilfszeichen auf das Band schreibt, die zur Ablaufsteuerung dienen.
Für ihn spielte der unterschiedliche Bandinhalt keine Rolle. Inter-
pretieren wir aber den kompletten Bandinhalt als Ausgabe, so wie
es heute üblich ist, dann produziert die universelle Maschine U eine
andere Ausgabe als die simulierte Maschine M.
284 5 Berechenbarkeitstheorie

b f(b1 , b1 , ::) ⎧
⎨ Not A R, R mk1
b1 R, R, P :, R, R, anf mk1
⎩ A L, L, L, L mk2
PD, R, R, PA

anf q(anf1 , :) ⎪
⎪ C R, Px, L, L, L mk2

mk2 : mk4
anf1 con(kom, y) ⎪

⎧ ⎩ D R, Px, L, L, L mk3
⎨ Not A R, R con(C, α) ⎧
con(C, α) ⎨ Not : R, Pv, L, L, L mk3
⎩ A L, Pα, R con1 (C, α) mk3
⎧ ⎩ : mk4

⎪ A R, Pα, R con1 (C, α)

⎨ mk4 con (l (l(mk5 )) , )
con1 (C, α) D R, Pα, R con2 (C, α) ⎧

⎪ ⎨ mk5

⎩ Any R, Pω, R
None PD, R, Pα, R, R, R C mk5
⎧ ⎩ None P: sh
⎨ C R, Pα, R con2 (C, α)
con2 (C, α) sh f(sh1 , inst, u)
⎩ Not C R, R C ⎧
⎧ ⎨
⎪ D R, R, R, R sh3

⎪ ; R, Pz, L con(kmp, x) sh2
⎨ ⎩ Not D inst
kom z L, L kom ⎧

⎪ ⎨

⎩ Not z nor ; C R, R sh4
L kom sh3
⎩ Not C inst
kmp cpe(e(kom, x, y), sim, x, y) ⎧
⎨ C R, R sh5
sim f (sim1 , sim1 , z) sh4
⎩ Not C pe2 (inst, 0, :)
sim1 con(sim2 , ) ⎧
⎧ ⎨ C inst
⎨ A sim3 sh5
sim2 ⎩ Not C pe2 (inst, 1, :)
⎩ Not A L, Pu, R, R, R sim2
⎧ inst q (l(inst1 ), u)
⎨ Not A L, Py e(mk, z) ⎧
sim3 ⎪
⎪ L R, E ce5 (ov, v, y, x, u, w)
⎩ A L, Py, R, R, R sim3 ⎪

inst1 R R, E ce5 (ov, v, x, u, y, w)
mk q(mk1 , :) ⎪


⎩ N R, E ce5 (ov, v, x, y, u, w)

Abbildung 5.12: Ein Stück Wissenschaftsgeschichte: Alan Turings universal machine aus dem Jahr 1936 [200]. Die farblich
hervorgehobenen Passagen sind Korrekturen, die später von Emil Post und Donald Davies eingebracht wurden [40, 148].

I Turings ursprüngliche Instruktionstabelle ist an mehreren Stellen


fehlerhaft. Vereinzelt hatte er Symbole vertauscht, die falschen Indi-
zes verwendet oder schlicht eine Instruktionsregel vergessen. Viele
dieser Fehler wurden später von Emil Post und Donald Davies ent-
deckt [40, 148]. Die meisten davon sind vergleichsweise einfach zu
korrigieren; sie sind das, was wir heute als typische Implementie-
rungsfehler bezeichnen.
5.1 Berechnungsmodelle 285

I Schwerer wiegt, dass Turing auch architektonische Fehler unterlie- I 2,5-Maschine


fen, die sich kaum beseitigen lassen. Beispielsweise versagt die Si-
mulation bei Maschinen, die den Schreib-Lese-Kopf mehrmals an (q1 , S4 , S3 , L, q2 ) (q2 , S4 , S2 , L, q2 )
die gleiche Stelle bewegen und eine vormals geschriebene Ziffer (q1 , S3 , S4 , R, q2 ) (q2 , S3 , S4 , R, q2 )
(q1 , S2 , S0 , R, q1 ) (q2 , S2 , S4 , R, q1 )
durch eine andere ersetzen. Wahrscheinlich hatte Turing diesen Fall
(q1 , S1 , S0 , R, q1 ) (q2 , S1 , S0 , R, q1 )
schlicht nicht bedacht, da er gedanklich immer nur solche Maschi-
(q1 , S0 , S1 , L, q1 ) (q2 , S0 , S3 , L, q1 )
nen im Sinn hatte, die eine reelle Zahl Ziffer für Ziffer von links nach
rechts auf das Band schreiben. Dennoch lässt sein Maschinenmodell
das geschilderte Verhalten explizit zu.

Dass seine Maschine in ihrer ursprünglichen Form kleine Fehler auf-


weist, mindert Turings Leistung nicht. Die Defizite sind nicht von
grundsätzlicher Natur, und so war es nur eine Frage der Zeit, bis die
ersten Maschinen entwickelt wurden, die jede andere Turing-Maschine
fehlerfrei simulieren konnten und damit exakt so funktionierten, wie
es in Abbildung 5.9 beschrieben ist. Ein Meilenstein in dieser Rich-
tung war die universelle Turing-Maschine von Marvin Minsky aus dem I 2,3-Maschine
Jahr 1962. Sie beseitigte sämtliche Fehler und Limitierungen des Tu-
ring’schen Originalentwurfs und war zudem deutlich einfacher aufge- (q1 , S2 , S1 , L, q1 ) (q2 , S2 , S1 , R, q1 )
(q1 , S1 , S2 , L, q1 ) (q2 , S1 , S2 , R, q2 )
baut; die Minsky-Maschine unterscheidet lediglich 7 Zustände und 4
(q1 , S0 , S1 , R, q2 ) (q2 , S0 , S2 , L, q1 )
Bandzeichen. In der von Stephen Wolfram vorgeschlagenen Nomen-
klatur wird sie als 7,4-Maschine bezeichnet.
Im Jahr 2002 stellte Wolfram eine weiterentwickelte Maschine vor, die
ebenfalls universell ist, aber mit noch weniger Zuständen auskommt
(Abbildung 5.13 oben). Während Minskys Modell noch 7 Zustände be-
nötigte, kommt die neue 2,5-Maschine mit nur 2 Zuständen aus. Die
Anzahl der Bandzeichen musste Wolfram allerdings von 4 auf 5 er-
höhen. Bedeutender sollte jedoch seine zeitgleich veröffentlichte 2,3- Abbildung 5.13: Turing-Maschinen von
Maschine werden (Abbildung 5.13 unten). Wolfram schlug die Maschi- Stephen Wolfram aus dem Jahr 2002 [218]
ne als einen potenziellen Kandidaten für die kleinstmögliche universelle
Turing-Maschine vor [218]. Obwohl er seine Vermutung nicht beweisen
konnte, erzielte er ein beachtliches Zwischenresultat: Ihm gelang der
Nachweis, dass 2 Bandzeichen und 2 Zustände nicht ausreichen, um
die Eigenschaft der Universalität zu erreichen. Wäre die 2,3-Maschine
also tatsächlich universell, so wäre sie gleichzeitig die kleinste.

2007 hat die Suche nach der kleinstmöglichen universellen Maschine


ein erfolgreiches Ende gefunden. In jenem Jahr gelang dem 20-jährigen
Briten Alex Smith der Nachweis, dass die 2,3-Maschine tatsächlich uni-
versell ist. Leider ist sie nicht einfach zu „programmieren“. Bevor eine
Maschine simuliert werden kann, muss sie mit einem speziellen Compi-
ler in eine passende Eingabe übersetzt werden, die bereits für primitive
Maschinen eine gigantische Größe erreicht.
286 5 Berechenbarkeitstheorie

5.1.2 Registermaschinen
Speicher Programm
i Ri i Li
1 1
In diesem Abschnitt werden wir mit der Registermaschine ein Be-
2 2 rechnungsmodell besprechen, das in Aufbau und Funktion dem realen
3 3 Computer sehr ähnlich ist [101, 129, 130]. Anders als bei der Turing-
4 4 Maschine ist kein Band mehr vorhanden; stattdessen existieren meh-
5 5 rere Register, die natürliche Zahlen beliebiger Größe aufnehmen kön-
... ... nen und sich wie bei realen Computern über eine individuelle Spei-
cheradresse direkt ansprechen lassen (Abbildung 5.14). Das aufwendi-
ge Hin- und Herbewegen eines Schreib-Lese-Kopfs, wie wir es von der
Turing-Maschine her gewöhnt sind, kann hierdurch vollständig entfal-
len. Gesteuert wird die Registermaschine über ein Programm, das aus
einer nummerierten Liste von Instruktionen besteht.
Abbildung 5.14: Allgemeiner Aufbau ei-
ner Registermaschine Definition 5.4 (Registermaschine)

Eine Registermaschine ist ein Tupel (R, I). Sie besteht aus
Der Begriff der Registerma-
schine wird in der Literatur I der endlichen Registermenge R = {R1 , . . . , Rr } und
unterschiedlich definiert. Manche Auto-
ren statten die Maschinen mit unend- I der endlichen Instruktionsmenge I = {L1 , . . . , Ll }.
lich vielen Registern aus, die entweder
beliebig große natürliche Zahlen spei- Jede Instruktion hat eine der folgenden Formen:
chern können oder nur Zahlen aus ei-
nem begrenzten Bereich. Noch unter- I Li : R j ← R j + 1 I Li : goto Ln (n = i + 1)
schiedlicher fallen die Befehlssätze aus.
I Li : R j ← R j − 1 I Li : if R j = 0 goto Ln (n = i + 1)
Der hier vorgestellte Maschinentyp ba-
siert auf einer Sprache, die in der Li- I Li : stop I Li : if R j = 0 goto Ln (n = i + 1)
teratur gern als Goto-Sprache bezeich-
net wird [96, 174, 186]. Andere Maschi-
nenmodelle nutzen dagegen Instruktio-
Nach dem Start einer Registermaschine werden alle Register per De-
nen, die an die Assembler-Sprachen der
frühen Mikroprozessoren erinnern [52,
finition mit dem Wert 0 initialisiert, und es wird mit der Ausführung
96]. Das Eingabe- und Ausgabeverhalten der Instruktion L1 begonnen. Die Auswahl der Folgeinstruktion funk-
wird ebenfalls unterschiedlich gehand- tioniert so, wie wir es von imperativen Programmiersprachen gewöhnt
habt. Einige Maschinentypen tauschen die sind. Normalerweise folgt auf die Instruktion Li die Instruktion Li+1 ,
Eingabe- und Ausgabewerte nicht, wie es sein denn, der Kontrollfluss wird durch einen unbedingten Sprung
hier, über die Register, sondern über spe- (goto) oder einen bedingten Sprung (if goto) direkt beeinflusst oder die
zielle Speicherbänder aus [52, 96]. Es ist Berechnung mit dem Befehl stop explizit beendet.
ein bedeutendes Ergebnis der Berechen-
barkeitstheorie, dass sich die genannten Registermaschinen verfügen über rudimentäre Arithmetikfähigkeiten,
Unterschiede nicht auf die Berechnungs- die im Vergleich zu realen Computern spartanisch wirken; außer der
stärke auswirken und es daher keine Rol- Möglichkeit, den Inhalt eines Registers um eins zu erniedrigen oder zu
le spielt, welches dieser Modelle für die erhöhen, werden keine anderen Operationen unterstützt. Für die Sub-
Untersuchungen des Berechenbarkeitsbe- traktion existiert eine Sonderregel. Da Registermaschinen keine nega-
griffs verwendet wird.
tiven Zahlen verarbeiten können, wird die Subtraktion saturiert ausge-
5.1 Berechnungsmodelle 287

Berechnende Maschine Akzeptierende Maschine

Speicher Programm Speicher Programm


i Ri i Li i Ri i Li
Ein- und 1 1 Eingabe 1
1
2 Ausgabe 2 2 2
2 3 3 3
3 4 4 4
4 5 5 5
... ... ... ...

Inhalt
von R1 Eingabe
Ja akzeptiert? Nein

Abbildung 5.15: Transduktoren und Akzeptoren im Vergleich L1 if R1 = 0 goto L20


L2 R2 ← R2 + 1, R3 ← R3 + 1
L3 R1 ← R 1 − 1
führt. Das bedeutet, dass die Berechnung 0 − 1 nicht dem Wert −1, L4 if R1 = 0 goto L16
sondern den Wert 0 liefert.
L5 R1 ← R 1 − 1
Genau wie Turing-Maschinen lassen sich auch Registermaschinen auf L6 R4 ← R4 + 1, R5 ← R5 + 1
zwei unterschiedliche Arten nutzen: L7 R3 ← R 3 − 1
L8 if R3 = 0 goto L6
L9 R4 ← R4 + 1, R2 ← R2 − 1
I Als berechnende Maschine (Abbildung 5.15 links) L10 if R2 = 0 goto L9
In diesem Fall nimmt die Maschine in Register R1 die Eingabe entge- L11 R3 ← R3 + 1, R4 ← R4 − 1
gen und legt dort auch das Ergebnis ab [102]. Alle anderen Register L12 if R4 = 0 goto L11
stehen für die Speicherung von Zwischenergebnissen zur Verfügung. L13 R2 ← R2 + 1, R5 ← R5 − 1
Eine berechnende Maschine wird auch als Transduktor bezeichnet. L14 if R5 = 0 goto L13
L15 if R1 = 0 goto L5
I Als akzeptierende Maschine (Abbildung 5.15 rechts) L16 R3 ← R3 − 1
Anstatt einen konkreten Ergebniswert zu berechnen, liefert die Ma- L17 if R3 = 0 goto L16
schine in diesem Fall lediglich eine Ja-Nein-Antwort. Wir sagen, ei- L18 R2 ← R2 − 1, R1 ← R1 + 1
ne Registermaschine akzeptiert die Eingabe in R1 , wenn sie nach L19 if R2 = 0 goto L18
endlich vielen Schritten terminiert und zu diesem Zeitpunkt alle Re- L20 stop
gister den Wert 0 enthalten [101]. Andernfalls wird die Eingabe nicht
akzeptiert. Wir sagen auch, die Eingabe wird zurückgewiesen oder Abbildung 5.16: Registermaschinenpro-
verworfen. gramm aus [102]
288 5 Berechenbarkeitstheorie

R1 R2 R3 R4 R5 Befehl R1 R2 R3 R4 R5 Befehl
0 2 0 0 0 0 L1 if R1 = 0 goto L20 12 0 0 1 1 1 L11 R3 ← R3 + 1
1 2 0 0 0 0 L2 R2 ← R2 + 1 R4 ← R4 − 1
R3 ← R3 + 1 13 0 0 2 0 1 L12 if R4 = 0 goto L11
2 2 1 1 0 0 L3 R1 ← R1 − 1 14 0 0 2 0 1 L13 R2 ← R2 + 1
3 1 1 1 0 0 L4 if R1 = 0 goto L16 R5 ← R5 − 1
4 1 1 1 0 0 L5 R1 ← R1 − 1 15 0 1 2 0 0 L14 if R5 = 0 goto L13
5 0 1 1 0 0 L6 R4 ← R4 + 1 16 0 1 2 0 0 L15 if R1 = 0 goto L5
R5 ← R5 + 1 17 0 1 2 0 0 L16 R3 ← R3 − 1
6 0 1 1 1 1 L7 R3 ← R3 − 1 18 0 1 1 0 0 L17 if R3 = 0 goto L16
7 0 1 0 1 1 L8 if R3 = 0 goto L5 19 0 1 1 0 0 L16 R3 ← R3 − 1
8 0 1 0 1 1 L9 R4 ← R4 + 1 20 0 1 0 0 0 L17 if R3 = 0 goto L16
R2 ← R2 − 1 21 0 1 0 0 0 L18 R2 ← R2 − 1
9 0 0 0 2 1 L10 if R2 = 0 goto L9 R1 ← R1 + 1
10 0 0 0 2 1 L11 R3 ← R3 + 1 22 1 0 0 0 0 L19 if R2 = 0 goto L18
R4 ← R4 − 1 23 1 0 0 0 0 L20 stop
11 0 0 1 1 1 L12 if R4 = 0 goto L11

Abbildung 5.17: Ablaufprotokoll für die Eingabe R1 = 2

Als Beispiel ist in Abbildung 5.16 das Registermaschinenprogramm


aus der bekannten Arbeit „Proof of Recursive Unsolvability of Hil-
bert’s Tenth Problem“ von James P. Jones und Juri Matijasevič aus dem
Jahr 1991 abgedruckt [102]. Das Programm ist für einen Transduktor,
d. h. für eine berechnende Maschine ausgelegt. Wird es mit der Eingabe
R1 = 2 gestartet, so werden nacheinander die in Abbildung 5.17 dar-
gestellten Berechnungsschritte ausgeführt. Nach 23 Schritten hält die
Maschine an und hinterlässt in R1 den Ergebniswert 1.

Vielleicht ist Ihnen aufgefallen, dass Jones und Matijasevič geringfügig


von den getroffenen Vereinbarungen aus Definition 5.14 abgewichen
sind, da sie in den Zeilen L2 , L6 , L9 , L11 , L13 und L18 mehrere Einzel-
instruktionen zu einem gemeinsamen Befehl zusammengefasst haben.
Diese Verallgemeinerung stellt uns vor keinerlei Probleme, da wir zu-
sammengefasste Befehle jederzeit auf mehrere Zeilen aufteilen können.
5.2 Die Church’sche These 289

n 11Aug Viele Errungenschaften auf dem war noch nicht abzusehen, dass die Zukunft des λ -Kalküls
14 Ju
1903 1995
Gebiet der Berechenbarkeitstheo- nicht in der Mathematik, sondern in der Informatik liegen
rie sind mit dem Namen Alonzo würde. Im Laufe der Zeit wurde er zu einem wertvollen
Church verbunden. Geboren wurde Hilfsmittel für die formale Untersuchung von Programmier-
der amerikanische Logiker am 14. Juni 1903 in Washing- sprachen und bildet heute den operativen Kern der funktio-
ton, D.C. Die Schule besuchte er in Ridgefield, Connecti- nalen Programmiersprachen Lisp.
cut. Nach dem Studium und der Promotion an der Princeton Im Jahr 1936 gelang es Church, aus dem λ -Kalkül das glei-
University folgten Aufenthalte in Chicago, Harvard, Göt- che Ergebnis abzuleiten, das Turing wenige Monate später
tingen und Amsterdam. Nach seiner Rückkehr in die USA mithilfe der Turing-Maschine erzielte: die Unentscheidbar-
wurde er 1929 in Princeton zum Assistant Professor, 1939 keit der Prädikatenlogik erster Stufe [32]. Damit nahm er das
zum Associate Professor und 1947 zum Full Professor er- Hauptresultat aus Turings berühmter Publikation zwar zeit-
nannt. Church blieb Princeton lange treu. Erst nach seiner lich vorweg, sein Beweis besaß aber bei Weitem nicht die
Emeritierung im Jahr 1967 wechselte er an die University of Klarheit und Eleganz des Turing’schen Ansatzes. Ebenfalls
California, Los Angeles, wo er weitere 23 Jahre lehrte und aus dem Jahr 1936 stammt die berühmte Church’sche The-
forschte. Drei Jahre nach seiner zweiten Emeritierung, am se [33], die wir in Abschnitt 5.2 diskutieren.
11. August 1995, starb Alonzo Church in Hudson, Ohio, im Rückblickend dürfen wir Church als den geistigen Ziehva-
Alter von 92 Jahren. ter einer neuen Logikergeneration bezeichnen. Unter seinen
Zu seinen größten Leistungen gehört die Entdeckung des λ - 31 Doktoranden befinden sich mit Martin Davis, Leon Hen-
Kalküls im Jahr 1930. Mit ihm wollte Church die Mathema- kin, Stephen Kleene, Michael Oser Rabin, Barkley Rosser,
tik mit einem formalen Unterbau versehen, der frei von Para- Dana Scott, Raymond Smullyan und Alan Turing namhafte
doxien, aber weniger umständlich sein sollte als die konkur- Logiker, von denen uns die meisten an anderer Stelle dieses
rierende Typentheorie von Russell und Whitehead. Damals Buchs schon begegnet sind oder noch begegnen werden.

5.2 Die Church’sche These

Mit der Turing-Maschine und der Registermaschine haben wir zwei Be-
rechnungsmodelle kennen gelernt, die auf den ersten Blick sehr unter-
schiedlich wirken. Aus der Ferne betrachtet scheint die Registermaschi-
ne das leistungsfähigere Berechnungsmodell zu sein, da alle Register
frei adressiert werden können und sich hierdurch viele Algorithmen oh-
ne große Umwege in ein Registermaschinenprogramm übersetzen las-
sen. Auf den ersten Blick wirkt auch ihr Speicher größer als der ei-
ner Turing-Maschine. Anstelle eines einzelnen Bands existiert eine frei
wählbare Anzahl von Registern, die beliebig große natürliche Zahlen
speichern können. Erst auf den zweiten Blick wird deutlich, dass die
großzügige Gestaltung des Maschinenmodells zu keiner Steigerung der
Berechnungsstärke führt. Jede Funktion, die mithilfe einer Registerma-
schine berechnet werden kann, ist auch mithilfe einer Turing-Maschine
berechenbar [130].

Lässt sich diese Beobachtung verallgemeinern? Um der Antwort näher


zu kommen, werden wir kurz eine Reihe weiterer Berechnungsmodelle
skizzieren. Anschließend werden wir klären, ob sich die Berechnungs-
stärke der Turing-Maschine mit einem dieser Modelle überbieten lässt.
290 5 Berechenbarkeitstheorie

while x1 = 0 do I While-Programme (Abbildung 5.18)


x3 := x2 ; Die While-Sprache ist eine fiktive Computersprache, die dem impe-
while x3 = 0 do
rativen Programmierparadigma folgt. Ein While-Programm schöpft
x0 := succ(x0 );
aus einem unendlichen Vorrat an Variablen xi , i ∈ N, von denen
x3 := pred(x3 )
end;
x1 , . . . , xn zur Übergabe der Eingabewerte verwendet werden. Das
x1 := pred(x1 ) Ergebnis wird in x0 gespeichert, und die restlichen Variablen dienen
end zur Ablage von Zwischenergebnissen.
Optisch erinnert die While-Sprache an klassische imperative Pro-
grammiersprachen wie C oder Pascal, allerdings ist der Sprachschatz
auf ein Minimum beschränkt. Er umfasst lediglich die beiden Opera-
x0 x1 x2 x3 Befehl
toren succ und pred, die Zuweisung ‚:=‘, den Kompositionsoperator
1 0 2 2 0 while x1 = 0 do ‚;‘ und das Schleifenkonstrukt while do end.
2 0 2 2 0 x3 := x2 I μ-rekursive Funktionen
3 0 2 2 2 while x3 = 0 do Die Menge der μ-rekursiven Funktionen ist die kleinste Menge, die
4 0 2 2 2 x0 := succ(x0 ) alle primitiv-rekursiven Funktionen enthält und außerdem unter der
Anwendung des μ-Operators abgeschlossen ist. Mit diesem Opera-
5 1 2 2 2 x3 := pred(x3 )
tor lässt sich eine n + 1-stellige Funktion f : Nn+1 → N nach dem
6 1 2 2 1 while x3 = 0 do folgenden Schema auf eine n-stellige Funktion reduzieren:
7 1 2 2 1 x0 := succ(x0 ) ⎧  ⎫
⎨  f (m, x1 , . . . , xn ) = 0 ⎬
(μ f )(x1 , . . . , xn ) := min m  und für alle k < m ist
8 2 2 2 1 x3 := pred(x3 )
(5.3)
while x3 = 0 do
⎩  ⎭
9 2 2 2 0 f (k, x1 , . . . , xn ) = ⊥
10 2 2 2 0 x1 := pred(x1 )
Das Symbol ‚⊥‘ steht stellvertretend für einen undefinierten Funkti-
11 2 1 2 0 x3 := x2 onswert. Degradiert die rechte Seite von Gleichung (5.3) zur leeren
12 2 1 2 2 while x3 = 0 do Menge, so ist kein minimales Element vorhanden und der Funkti-
13 2 1 2 2 x0 := succ(x0 ) onswert undefiniert ((μ f )(x1 , . . . , xn ) = ⊥).
14 3 1 2 2 x3 := pred(x3 ) I Lambda-Kalkül (Abbildung 5.19)
15 3 1 2 1 while x3 = 0 do Der Lambda-Kalkül (kurz λ -Kalkül) basiert auf der Idee, komplexe
16 3 1 2 1 x0 := succ(x0 ) mathematische Funktionen durch die Kombination allgemein gehal-
tener Rechenvorschriften zu definieren. Die grundlegende Operation
17 4 1 2 1 x3 := pred(x3 )
ist die Anwendung einer Funktion f auf ein Argument x, geschrie-
18 4 1 2 0 while x3 = 0 do ben als ( f x). Ist z. B. add eine Funktion zur Addition zweier Zahlen,
19 4 1 2 0 x1 := pred(x1 ) so berechnet ((add x) y) die Summe x + y. Mithilfe des λ -Operators
20 4 0 2 0 while x1 = 0 do
lassen sich Variablen binden und damit aus bestehenden Funktio-
nen neue erzeugen. Beispielsweise bezeichnet (λ x.((add x) x)) eine
Abbildung 5.18: While-Programm für die von x abhängige Funktion, die den Wert 2 · x berechnet. λ -Ausdrücke
Multiplikation zweier natürlicher Zahlen x1 lassen sich freizügig kombinieren. So kann eine Funktion beliebige
und x2 . Der Ablaufplan demonstriert die λ -Terme als Argumente erhalten und damit insbesondere auch auf
Programmausführung für den Fall x1 = 2 Funktionen angewendet werden. Wie der Ausdruck ((λ x.x) (λ x.x))
und x2 = 2. Am Ende der Berechnung ent- zeigt, kann sich eine Funktion sogar selbst als Argument entgegen-
hält das Register x0 den Ergebniswert 4. nehmen.
5.2 Die Church’sche These 291

I Termersetzungssysteme (Abbildung 5.20) I Reduktionsregeln

Ein Termersetzungssystem besteht aus einer Menge von Ersetzungs- μ∈ϕ


(α) λ ξ .ϕ → λ μ.ϕ[ξ ← μ]
regeln der Form l → r, den sogenannten Produktionen. Auf der lin-
ken und der rechten Seite stehen Terme, die neben den Symbolen ei- (β ) ((λ ξ .ϕ)ψ) → ϕ[ξ ← ψ]
ner Menge Σ auch Variablen enthalten dürfen. Die Ersetzungsregeln (η) λ ξ .ϕξ → ϕ
werden verwendet, um ein vorgelegtes Eingabewort ω ∈ Σ∗ sukzes-
sive umzuformen. Hierzu wird zunächst geprüft, ob sich ω und die I Ableitung
linke Seite einer Produktion l → r durch eine Substitution S anglei-
((((λ y.(λ z.(λ x.((yz)x))))
chen lassen (lS = rS). In diesem Fall ist rS das Ergebnis. Termer-
setzungssysteme existieren in vielen Variationen. Wichtige Vertre- (λ w.(λ x.(wx))))P)v)
ter sind die Phrasenstrukturgrammatiken (Typ-0-Grammatiken) [96] β
⇒ (((λ z.(λ x.(((λ w.(λ x.(wx)))z)x)))P)v)
oder die Semi-Thue-Systeme, die der norwegische Mathematiker β
⇒ ((λ x.(((λ w.(λ x.(wx)))P)x))v)
Axel Thue im Jahr 1914 zur Untersuchung von Ableitungskalkülen
β
ersann [198]. ⇒ (((λ w.(λ x.(wx)))P)v)
β
⇒ ((λ x.(Px))v)
Wir wissen heute, dass es keine Rolle spielt, welches der vorgestellten β
Modelle wir zur Begründung des Berechenbarkeitsbegriffs zu Rate zie- ⇒ (Pv)
hen; trotz ihrer unübersehbaren äußerlichen Unterschiede besitzen alle
die gleiche Ausdrucksstärke. Das bedeutet, dass der Berechenbarkeits- Abbildung 5.19: Ableitung im λ -Kalkül
begriff stets derselbe bleibt, egal ob wir ihn über die Turing-Maschine,
die Registermaschine, die While-Sprache, die Menge der μ-rekursiven
Funktionen, den λ -Kalkül oder mithilfe von Termersetzungssystemen
definieren.

Für den amerikanischen Logiker Alonzo Church war dies die empiri-
I Produktionen
sche Bestätigung für die These, dass der intuitive Berechenbarkeitsbe-
griff mit dem Begriff der Turing-Berechenbarkeit zusammenfällt. Ge- xI → xIU (Regel 1)
nau dies ist der Inhalt der berühmten Church’schen These: Mx → Mxx (Regel 2)
xIIIy → xUy (Regel 3)
Satz 5.1 (Church’sche These)
xUUy → xy (Regel 4)
Die Klasse der Turing-berechenbaren Funktionen stimmt mit der
I Ableitung von MUIIU aus MI
Klasse der intuitiv berechenbaren Funktionen überein.
MI ⇒ MII (Regel 2)
Der Begriff der intuitiv berechenbaren Funktion bedarf an dieser Stelle ⇒ MIIII (Regel 2)
besonderer Aufmerksamkeit. Er bezeichnet eine Funktion, die von ei- ⇒ MUI (Regel 3)
nem Menschen – in welcher Form auch immer – ausgerechnet werden ⇒ MUIU (Regel 1)
kann. Damit besagt die Church’sche These nichts anderes, als dass je- ⇒ MUIUUIU (Regel 2)
de Funktion, die überhaupt in irgendeiner Weise berechenbar ist, auch
⇒ MUIIU (Regel 4)
durch eine Turing-Maschine berechnet werden kann.

Die Church’sche These ist kein Satz im mathematisch präzisen Sinne, Abbildung 5.20: MIU-System von Douglas
da der Begriff der intuitiv berechenbaren Funktion keine formale Defi- Hofstadter [97], hier formuliert als Termer-
nition besitzt. Gäbe es diese, so hätten wir uns – bewusst oder unbewusst setzungssystem
292 5 Berechenbarkeitstheorie

– bereits auf ein konkretes Berechnungsmodell festgelegt und die ei-


gentliche Bedeutung dieses Begriffs ad absurdum geführt. Folgerichtig
wird es niemals möglich sein, die Church’sche These zu beweisen. Wir
können lediglich Indizien für ihre Gültigkeit sammeln, und genau dies
ist Forschern in der Vergangenheit vielfach gelungen. Alle bisher unter-
nommenen Versuche, die Menge der berechenbaren Funktionen durch
die Angabe eines ausdrucksstärkeren Berechnungsmodells zu vergrö-
ßern, waren bisher vergebens. Selbst so ausgefallene Konzepte wie der
Quantenrechner [139] oder das DNA computing [5] konnten die Grenze
des maschinell Berechenbaren nicht verschieben.

Die Church’sche These ist die Legitimation für die folgende Definiti-
on, die den bereits mehrfach bemühten Begriff der Berechenbarkeit nun
I Entscheidbarkeit
endlich mit einem formalen Unterbau versieht:


Definition 5.5 (Berechenbarkeit)

Eine partielle Funktion f : Σ∗ → Σ∗ heißt berechenbar, wenn eine


Turing-Maschine M mit der folgenden Eigenschaft existiert:
Entscheider I Ist f (ω) = ⊥, so
für N
beschreibt M bei Eingabe von ω das Band mit f (ω) und hält an.
 in N ?
I Ist f (ω) = ⊥, so
rechnet M bei Eingabe von ω für immer weiter.
Ja Nein
In dieser Definition ist Σ eine beliebige Menge, die als Bandalphabet
I Semi-Entscheidbarkeit einer Turing-Maschine in Frage kommt. Von hier ist es nur noch ein
 kleiner Schritt, um auch den Begriff der Entscheidbarkeit formal zu er-
fassen:

Definition 5.6 (Entscheidbarkeit, Semi-Entscheidbarkeit)

Eine Menge N ⊆ Σ∗ heißt entscheidbar, falls die charakteristische


Semi-Entscheider Funktion χN : Σ∗ → {0, 1} berechenbar ist mit
für N

 in N ? 1 falls ω ∈ N
χN (ω) :=
0 falls ω ∈ N

Eine Menge N ⊆ Σ∗ heißt semi-entscheidbar, falls die partielle cha-


Ja rakteristische Funktion χN : Σ∗ → {1} berechenbar ist mit

 1 falls ω ∈ N
Abbildung 5.21: Bildliche Darstellung der χN (ω) :=
⊥ falls ω ∈ N
beiden Entscheidbarkeitsbegriffe
5.2 Die Church’sche These 293

Im Kern dieser Definition steht der Begriff der charakteristischen Funk- 


tion. Sie ist das formale Bindeglied zwischen dem auf Funktionen aus-
gelegten Berechenbarkeitsbegriff und dem für Mengen formulierten
Entscheidbarkeitskriterium.

Abbildung 5.21 demonstriert, wie sich die beiden Entscheidbarkeitsbe-


griffe bildlich erfassen lassen. Ist eine Menge N entscheidbar, dann exis- Semi-Entscheider
tiert eine algorithmisch arbeitende Maschine, die ein Element ω ∈ N für N
in codierter Form entgegennimmt und die Frage beantwortet, ob ω zu
N gehört oder nicht. In der bildlichen Darstellung werden die beiden  in N ?
möglichen Antworten durch zwei separate Glühlampen symbolisiert,
von denen genau eine nach endlicher Zeit aufleuchtet. Wann eine der Ja Nein
Lampen zu glühen beginnt, wissen wir nicht. Dennoch können wir uns
darauf verlassen, dass dies sowohl für den Fall ω ∈ N als auch für den
Fall ω ∈ N irgendwann der Fall sein wird. Um die Mengenzugehörig-
Semi-Entscheider
keit zu entscheiden, müssen wir uns also lediglich in Geduld üben und für N
lange genug warten.

Im Gegensatz zu einem Entscheider besitzt ein Semi-Entscheider nur 


eine einzige Glühlampe. Wird er mit einem Element ω ∈ N gestartet, so
beginnt die Lampe nach endlicher Zeit zu leuchten. Für ω ∈ N lässt sich Abbildung 5.22: Sind sowohl N als auch
keine verlässliche Aussage mehr treffen. Hier können wir niemals mit das Komplement N semi-entscheidbar, so
Sicherheit sagen, ob sich die Maschine innerhalb einer Endlosschleife lässt sich die Menge N entscheiden.
befindet oder zu einem späteren Zeitpunkt doch noch eine positive Ant-
wort liefern wird. Damit ist die Semi-Entscheidbarkeit gleichbedeutend
mit einer Halbaussage. Die gestellte Frage „Ist ω ∈ N?“ wird nur im po-
sitiven Fall nach endlicher Zeit beantwortet. Fällt die Antwort negativ
aus, so zeigt die Maschine keinerlei Reaktion.
Ist eine Menge N entscheidbar, so ist es auch das Komplement N, und
daraus folgt, dass N und N dann erst recht semi-entscheidbar sind. Tat-
sächlich gilt auch die Umkehrung: Ist neben N auch das Komplement
N semi-entscheidbar, so reicht dies aus, um N zu entscheiden. Abbil-
dung 5.22 zeigt auf grafische Weise, wie sich die Semi-Entscheider für
N und N zu einem Entscheider für N kombinieren lassen. Beide Semi-
Entscheider werden gleichzeitig mit dem Eingabewort ω versorgt und
parallel simuliert. Liegt ω in N, so reagiert der erste Semi-Entscheider
nach einer endlichen Zeitspanne; ist ω nicht in N, so reagiert irgend-
wann der zweite. In Satzform lautet unser Ergebnis folgendermaßen:

Satz 5.2

Für eine Menge N gilt:

N ist entscheidbar ⇔ N und N sind semi-entscheidbar


294 5 Berechenbarkeitstheorie

I Entscheidbarkeit In derselben Weise wollen wir einen weiteren Begriff formal zementie-
ren, den wir bereits des öfteren informell verwendet haben. Die Rede
Ja Nein
ist von der Aufzählbarkeit von Mengen. Genau wie im Falle der Ent-
scheidbarkeit können wir auch diesen Begriff auf die Berechenbarkeit
einer Funktion zurückführen:

Definition 5.7 (Aufzählbarkeit)


Entscheider Entscheider
für N für N Eine Menge N heißt aufzählbar, wenn sie die leere Menge ist oder
ω∈N ω∉N eine surjektive und berechenbare Funktion f : N → N existiert.

I Semi-Entscheidbarkeit Aus dieser Definition geht erst auf den zweiten Blick hervor, dass hier
jenes Konzept beschrieben wird, das die meisten von uns intuitiv mit
Ja dem Begriff der Aufzählbarkeit verbinden. Sehen wir also genauer hin!
Ist eine Menge N aufzählbar, so existiert per Definition eine Turing-
Maschine M, die unter der Eingabe einer natürlichen Zahl x den Funk-
tionswert f (x) berechnet. M versetzt uns in die Lage, die Werte

f (0), f (1), f (2), f (3), . . .


Semi-Entscheider Semi-Entscheider
für N für N nacheinander zu berechnen. Auf diese Weise entsteht eine immer län-
ω∈N ω∉N ger werdende Liste von Elementen aus N. Wir wissen aber noch mehr.
Da f per Definition surjektiv ist, wird jedes Element ω ∈ N irgendwann
in unserer Aufzählung erscheinen. Als Ergebnis erhalten wir eine algo-
rithmisch arbeitende Maschine, die alle Elemente von N nacheinander
I Aufzählbarkeit
aufsagt (Abbildung 5.23). Beachten Sie, dass wir lediglich die Surjek-
ω1, ω2, ω3, ω4, ω5, ω6, ... tivität und nicht die Bijektivität von f gefordert haben. Damit ist es
explizit erlaubt, dass die Elemente von N in der generierten Aufzählung
mehrfach vorkommen dürfen.
Wir wollen versuchen, zwischen der Aufzählbarkeit, der Abzählbar-
keit und der Semi-Entscheidbarkeit einen Zusammenhang herzustellen.
Ganz offensichtlich ist jede aufzählbare Menge auch abzählbar, da wir
Aufzähler
für N jedes ihrer Elemente mit mindestens einer natürlichen Zahl in Bezug
setzen können. Auf der anderen Seite existieren zahlreiche abzählbare
Abbildung 5.23: Entscheidbarkeit, Semi- Mengen N, für die keine Funktion f : N → N existiert, die gleichzei-
Entscheidbarkeit und Aufzählbarkeit im tig surjektiv und berechenbar ist. Ein prominentes Beispiel werden wir
Vergleich bald kennen lernen: die Menge aller wahren arithmetischen Formeln.

Zwischen der Aufzählbarkeit und der Semi-Entscheidbarkeit einer


Menge besteht ebenfalls eine enge Verwandtschaft. Zunächst ist jede
aufzählbare Menge N auch semi-entscheidbar, schließlich können wir
alle Elemente der Reihe nach aufsagen und genau dann stoppen, wenn
wir das gesuchte Element ω gefunden haben. Ist ω ∈ N, so werden wir
5.2 Die Church’sche These 295

das Element nach endlich vielen Schritten antreffen. Ist ω ∈ N, so fah-


n := 0
ren wir für immer fort.

Es gilt sogar die umgekehrte Richtung: Jede semi-entscheidbare Menge


N ist aufzählbar. Dies einzusehen, ist alles andere als trivial. Um die ( i , j ) := 1(n)
Elemente von N aufzuzählen, müssen wir den zur Verfügung stehenden n := n + 1
Semi-Entscheider so ansteuern, dass er niemals in eine Endlosschleife
gerät. Aber wie kann das gelingen? Zum Erfolg verhilft uns abermals  := das i-te Element von *
die Cantor’sche Paarungsfunktion π, die eine Zuordnung zwischen der
Menge aller Tupel (i, j) ∈ N2 und der Menge der natürlichen Zahlen
herstellt. Durch geschickten Einsatz dieser Funktion ist es tatsächlich
möglich, die Elemente einer semi-entscheidbaren Menge nacheinander
aufzusagen. Abbildung 5.24 zeigt, wie dies möglich ist:
Semi-Entscheider
I In einer unendlichen Schleife werden nacheinander die Elemente für N

π −1 (0), π −1 (1), π −1 (2), π −1 (3), . . . (5.4)   N?

berechnet. Als Ergebnis erhalten wir eine Folge, in der jedes Tupel Abbruch nach
j Schritten
(i, j) ∈ N2 irgendwann auftaucht.
Ja
I Für jedes Tupel (i, j) starten wir den Semi-Entscheider mit dem i-
ten Element ω von Σ∗ . Stellt er die Mengenzugehörigkeit innerhalb
von j Schritten fest, so gibt er ω aus. Ist der Semi-Entscheider nach
 ausgeben
j Schritten noch zu keinem Ergebnis gekommen, brechen wir die
Berechnung ab und fahren mit dem nächsten Tupel fort. Da für je- Abbildung 5.24: Durch den geschickten
des ω ∈ N ein j ∈ N mit der Eigenschaft existiert, dass der Semi- Einsatz der Cantor’schen Paarungsfunktion
Entscheider die Mengenzugehörigkeit in j Schritten positiv beant- ist es möglich, die Elemente einer semi-
wortet, werden nacheinander alle Elemente von N erzeugt. entscheidbaren Menge der Reihe nach auf-
zuzählen.
Damit ist es uns gelungen, den folgenden Satz zu beweisen:

Satz 5.3 (Aufzählbarkeit und Semi-Entscheidbarkeit)

Für eine Menge N = 0/ gilt:

N ist aufzählbar ⇔ N ist semi-entscheidbar

Kombinieren wir die Aussagen der Sätze 5.2 und 5.3, so erhalten wir
ohne weiteres Zutun das folgende Ergebnis:

Korollar 5.1

Für eine Menge N = 0/ gilt:

N ist entscheidbar ⇔ N und N sind aufzählbar


296 5 Berechenbarkeitstheorie

5.3 Grenzen der Berechenbarkeit

In diesem Abschnitt werden wir die algorithmische Methode an ihre


Grenzen führen. Wir beginnen unsere Diskussion mit verschiedenen Va-
rianten des Halteproblems und werden die gewonnenen Erkenntnisse
anschließend mit dem Satz von Rice verallgemeinern.

5.3.1 Das Halteproblem

Als Halteproblem werden mehrere Fragestellungen bezeichnet, die sich


mit den Terminierungseigenschaften von Turing-Maschinen beschäfti-
gen. Konkret geht es um die Frage, ob auf algorithmischem Wege ent-
schieden werden kann, ob eine Turing-Maschine unter gewissen Ein-
gaben terminiert oder für immer weiter rechnet. Wir beginnen mit der
Definition des allgemeinen Halteproblems:

Definition 5.8 (Allgemeines Halteproblem)

Das allgemeine Halteproblem lautet wie folgt:


I Gegeben: Turing-Maschine M und Eingabewort ω
I Gefragt: Terminiert M unter Eingabe von ω?

Tabelle 5.1: Ein einfaches Diagonalisie- : Maschine terminiert


rungsargument reicht aus, um die Unent- : Maschine läuft für immer weiter
scheidbarkeit des Halteproblems zu be-
weisen. In der nebenstehenden Tabelle ω1 ω2 ω3 ω4 ω5 ω6 ω7 ...
sind alle Eingaben auf der horizontalen
Achse und alle Turing-Maschinen auf der
M1 ...
vertikalen Achse aufgelistet. Der Tabel- M2 ...
leneintrag in der i-ten Zeile und der j-ten
Spalte gibt an, ob die Maschine Mi un- M3 ...
ter Eingabe von ω j hält. Wäre das Hal- M4 ...
teproblem entscheidbar, so ließe sich ei-
ne Turing-Maschine konstruieren, die den M5 ...
Diagonaleintrag (i, i) bestimmt und genau
dann terminiert, wenn Mi unter Eingabe
M6 ...
von ωi nicht hält. Diese Maschine kann M7 ...
nirgends in der Liste auftauchen, im Wi-
.. .. .. .. .. .. .. .. ..
derspruch zur Tabellenkonstruktion. . . . . . . . . .
5.3 Grenzen der Berechenbarkeit 297

Für den Moment gehen wir davon aus, das Halteproblem sei entscheid- i
bar. Diese Annahme werden wir jetzt mit einem einfachen Diagonali-
sierungsargument, das jenem aus Abschnitt 1.2.2 sehr ähnlich ist, zu
Mi
einem Widerspruch führen.

Als Erstes konstruieren wir eine Matrix, wie sie in Tabelle 5.1 aus-
schnittsweise dargestellt ist. Auf der vertikalen Achse sind alle Turing- H
Maschinen und auf der horizontalen Achse alle Eingabewörter ver-
zeichnet. Die Reihenfolge spielt dabei keine Rolle; wichtig ist nur, dass
jede Turing-Maschine und jedes Eingabewort auch wirklich in irgend-

Turing-Maschine H'
einer Zeile oder Spalte erscheinen. Die einzelnen Felder der Matrix ge- „Hält Mi für i?
ben uns Auskunft über das Terminierungsverhalten unserer Maschinen. nein ja
Hierzu ist in der i-ten Zeile und der j-ten Spalte verzeichnet, ob die
Turing-Maschine Mi unter Eingabe von ω j terminiert.
Endlosschleife
Wäre das Halteproblem entscheidbar, so würde eine Turing-Maschine
H existieren, die ein Eingabewort ω und eine Turing-Maschine M in co-
dierter Form entgegennimmt und stets korrekt bestimmt, ob M bei Ein- Halte an
gabe von ω terminiert. Die fiktive Turing-Maschine H ist nichts ande-
res als eine Maschine zur Berechnung der soeben konstruierten Matrix. Abbildung 5.25: Gäbe es eine Turing-
Wie es in Abbildung 5.25 skizziert ist, können wir aus H eine zweite Maschine H, die das Halteproblem ent-
Maschine H  konstruieren. Diese berechnet für das Eingabewort ωi das scheidet, so könnten wir diese zu einer Ma-
Matrixelement (i, i) und verhält sich reziprok zu der erhaltenen Ant- schine H  umbauen, die genau dann für
das Eingabewort ωi terminiert, wenn die
wort. H  terminiert bei Eingabe von ωi genau dann, wenn Mi für immer
Turing-Maschine Mi bei Eingabe von ωi un-
weiter rechnen würde. endlich lange rechnet. Mithilfe des Diago-
Da H  selbst eine Turing-Maschine ist, müssen wir sie in einer bestimm- nalisierungsarguments können wir die Kon-
ten Zeile der konstruierten Matrix wiederfinden können; der Aufbau der struktion von H  als widersprüchlich entlar-
Matrix garantiert ja gerade, dass alle Maschinen der Reihe nach aufge- ven und daraus schließen, dass die Maschi-
zählt werden. Doch egal, in welcher Zeile wir auch nachschauen: Die ne H nicht existieren kann.
Diagonalkonstruktion führt immer einen Widerspruch herbei. Für alle
i ∈ N gilt H  = Mi , da Mi die Eingabe ωi genau dann akzeptiert, wenn Behalten Sie stets im Auge,
sie von H  abgelehnt wird. Der Widerspruch macht deutlich, dass wir dass sich die Gültigkeit von
die Annahme über die Existenz von H fallen lassen müssen und es keine Satz 5.4 auf jedes Berech-
Maschine geben kann, die das Halteproblem entscheidet. nungsmodell überträgt, das
dieselbe Ausdrucksstärke besitzt wie die
Turing-Maschine. Hierunter fallen die Re-
Satz 5.4
gistermaschine aus Abschnitt 5.1.2 sowie
alle besprochenen Varianten der Turing-
Das allgemeine Halteproblem ist unentscheidbar. Maschine aus Abschnitt 5.1.1.1. Dort hat-
ten wir mit der einseitig beschränkten Ma-
schine, der Mehrspur-Maschine und der
Ein einfaches Diagonalisierungsargument hat ausgereicht, um eines der Mehrband-Maschine drei Erweiterungen
wichtigsten Ergebnisse der Berechenbarkeitstheorie zu beweisen. Wie des Turing’schen Maschinenmodells ein-
bedeutend Satz 5.4 tatsächlich ist, werden die folgenden Betrachtungen geführt, die allesamt die gleiche Aus-
jetzt nach und nach zum Vorschein bringen. drucksstärke besitzen.
298 5 Berechenbarkeitstheorie

, M Halteproblem auf leerem Band

Neben dem allgemeinen Halteproblem existiert eine abgeschwächte Va-


Konstruiere aus riante, die wie folgt definiert ist:
 und M eine
neue Turing-
Maschine M.
Definition 5.9 (Halteproblem auf leerem Band)

Das Halteproblem auf leerem Band lautet wie folgt:


I Gegeben: Turing-Maschine M

I Gefragt: Terminiert M unter Eingabe des leeren Worts ε?

M
Während das allgemeine Halteproblem fordert, dass wir die Terminie-
Entscheider für das allgemeine Halteproblem

"Schreibe  auf das


Eingabeband und
rungseigenschaft für beliebige Turing-Maschinen und beliebige Einga-
simuliere M." ben entscheiden können, betrachtet das spezielle Halteproblem nur den
Fall, dass die Berechnung auf einem leeren Band gestartet wird. Formal
ist die Eingabe dann das leere Wort, das gewöhnlich mit ε bezeichnet
Entscheider für das wird.
Halteproblem auf
leerem Band
Das spezielle Halteproblem ist augenscheinlich einfacher zu lösen als
das allgemeine. Dennoch lässt sich mit einem einfachen Reduktions-
beweis zeigen, dass auch dieses Problem unentscheidbar ist. In einem
solchen Beweis wird gezeigt, dass aus der Entscheidbarkeit des Halte-
problems auf leerem Band die Entscheidbarkeit des allgemeinen Halte-
Hält M?
problems folgen würde. Wir sagen, das allgemeine Halteproblem wird
auf das Halteproblem auf leerem Band reduziert. Wie eine solche Re-
duktion in unserem speziellen Fall durchgeführt werden kann, zeigt Ab-
bildung 5.26.

Um zu entscheiden, ob eine Turing-Maschine für ein Eingabewort ω


Ja Nein hält, wird zunächst eine Turing-Maschine Mω konstruiert, die alle Zei-
chen von ω auf das Band schreibt und anschließend M simuliert. Mω
Abbildung 5.26: Reduktion des allgemei- wird mit einem leeren Band gestartet und terminiert genau dann, wenn
nen Halteproblems auf das Halteproblem die Originalmaschine M mit der Eingabe ω terminiert. Gäbe es also
auf leerem Band. Wären wir in der Lage, eine Turing-Maschine, die das Halteproblem auf leerem Band entschei-
das Halteproblem auf leerem Band zu lö- den würde, so wären wir auch in der Lage, das allgemeine Halteproblem
sen, so könnten wir einen Entscheider für
zu entscheiden. Aus Satz 5.4 folgt jetzt sofort, dass auch das spezielle
das allgemeine Halteproblem konstruieren.
Halteproblem unentscheidbar sein muss.
Aus der Unentscheidbarkeit des allgemei-
nen Halteproblems folgt unmittelbar, dass
auch das Halteproblem auf leerem Band
Satz 5.5
nicht entschieden werden kann.

Das Halteproblem auf leerem Band ist unentscheidbar.


5.3 Grenzen der Berechenbarkeit 299

5.3.2 Der Satz von Rice I Erster Fall: M⊥ erfüllt E


ω

Die Unentscheidbarkeit des Halteproblems hat uns gezeigt, dass Aus-


sagen über Turing-Maschinen existieren, die sich einer maschinellen
Beweisbarkeit entziehen. Kein algorithmisches Verfahren ist in der La-
ge, die Terminierungseigenschaft für alle Turing-Maschinen Mi und al- ε
le Eingabewörter ω j stets korrekt vorherzusagen. Durch eine geeignete
M
Reduktion waren wir darüber hinaus in der Lage, auch das Haltepro-
blem auf leerem Band als unentscheidbar zu identifizieren. In diesem
M terminiert
Abschnitt wollen wir uns mit der Frage beschäftigen, ob noch weite-

Turing-Maschine H
re Aussagen über Turing-Maschinen existieren, die nicht algorithmisch
entschieden werden können. So viel vorweg: Wir werden eine verblüf-
fende Antwort erhalten.
Im Folgenden bezeichnet M eine beliebige Turing-Maschine, fM die ME
von M berechnete Funktion und E eine funktionale Eigenschaft von M
(also eine Eigenschaft von fM ). E soll nichttrivial sein, d. h., es gibt
mindestens eine Maschine, die die untersuchte Eigenschaft besitzt, und f (ω)
mindestens eine Maschine, die sie nicht besitzt. Die folgende Aufzäh- I Zweiter Fall: M⊥ erfüllt E nicht
lung enthält eine exemplarische Auswahl möglicher Eigenschaften. Der ω
Phantasie sind an dieser Stelle keine Grenzen gesetzt:

I Es gibt eine Ausgabe von M, die das Symbol 0 enthält.


I Alle Ausgaben von M sind mindestens n Zeichen lang. ε
I M berechnet eine totale Funktion. M

Wir wollen ausloten, welche Konsequenzen sich aus der Existenz eines M terminiert
Entscheidungsverfahrens für E ergeben. Hierzu führen wir zunächst die

Turing-Maschine H
Turing-Maschine M⊥ ein, die die überall undefinierte Funktion f (ω) =
⊥ berechnet. M⊥ lässt sich sehr simpel konstruieren: Sie terminiert für
keine Eingabe.
ME
Für den Moment wollen wir annehmen, dass M⊥ die gewählte Eigen-
schaft E erfüllt. Da E nichttrivial ist, existiert mindestens eine weitere
Maschine ME , die E nicht erfüllt. Wir fassen zusammen: f (ω)

M⊥ erfüllt die Eigenschaft E (5.5) Abbildung 5.27: Kernstück des Beweises


für den Satz von Rice. Über die dargestell-
ME erfüllt die Eigenschaft E nicht (5.6)
te Zusammenschaltung wird ein direkter
Die Maschinen M und ME vereinen wir nun zu einer gemeinsamen Ma- Zusammenhang zwischen der untersuchten
schine H. Wie der obere Teil von Abbildung 5.27 zeigt, wird innerhalb Maschineneigenschaft E und dem Halte-
von H zunächst die Maschine M mit dem leeren Eingabewort ε ge- problem hergestellt.
startet. Hält diese nach endlich vielen Schritten an, so wendet H die
Maschine ME auf das Eingabewort ω an.
300 5 Berechenbarkeitstheorie

Die Tragweite des Satzes Um das Verhalten von H zu verstehen, unterscheiden wir zwei Fälle:
von Rice ist enorm! In ei-
nem Rundumschlag macht I M terminiert nicht: In diesem Fall ist H funktional identisch mit M⊥
er die Hoffnung zunichte, ir-
und erfüllt die Eigenschaft E.
gendeine nichttriviale funktionale Eigen-
schaft über Turing-Maschinen algorith- I M terminiert: In diesem Fall ist H funktional identisch mit ME und
misch entscheiden zu können. Die Gren- erfüllt die Eigenschaft E nicht.
zen, die uns dieser Satz auferlegt, rei-
chen tief in die Praxis der realen Software-
Entwicklung hinein. So folgt daraus un-
Mit dieser Konstruktion ist es uns gelungen, einen direkten Zusammen-
mittelbar, dass es keinen Algorithmus ge- hang zwischen der Eigenschaft E und der Terminierung von M herzu-
ben kann, der für ein beliebiges Programm stellen. Würde ein Verfahren existieren, das E entscheidet, so könnten
maschinell verifiziert, ob es sich entspre- wir das Halteproblem für jede beliebige Maschine M lösen. Kurzum:
chend seiner Spezifikation verhält. Selbst Wir hätten ein Entscheidungsverfahren für das Halteproblem gefunden.
so einfache Probleme wie die Frage nach
der Existenz von Endlosschleifen entzie- Beachten Sie, dass die obige Überlegung stets unter der Annahme stand,
hen sich einer algorithmischen Lösung. dass die gewählte Eigenschaft E auf M⊥ zutrifft. Sollte dies nicht der
Seine Allgemeinheit macht den Satz von Fall sein, so modifizieren wir die Maschine H wie in der unteren Hälfte
Rice zu einer der wertvollsten Aussagen von Abbildung 5.27 gezeigt. Anstelle von ME starten wir eine beliebige
der Berechenbarkeitstheorie. Maschine ME , die E erfüllt. Die Fallunterscheidung liest sich jetzt wie
folgt:

I M terminiert nicht: In diesem Fall ist H funktional identisch mit M⊥


und erfüllt die Eigenschaft E nicht.
I M terminiert: In diesem Fall ist H funktional identisch mit ME und
erfüllt die Eigenschaft E.

Wiederum ist es uns gelungen, einen Eins-zu-eins-Zusammenhang zwi-


schen E und der Terminierung von M herzustellen. Gäbe es ein Ent-
scheidungsverfahren für die Eigenschaft E, so könnten wir das Halte-
problem ebenfalls lösen.

Die Unentscheidbarkeit des Halteproblems führt damit unweigerlich zu


der Erkenntnis, dass ein Entscheidungsverfahren für E nicht existieren
kann. Genau dies ist die Aussage des berühmten Satzes von Henry Gor-
don Rice aus dem Jahr 1953.

Satz 5.6 (Satz von Rice)

Sei E eine nichttriviale funktionale Eigenschaft von Turing-Ma-


schinen. Dann ist das folgende Problem unentscheidbar:
I Gegeben: Turing-Maschine M
I Gefragt: Besitzt M die Eigenschaft E?
5.4 Folgen für die Mathematik 301

5.4 Folgen für die Mathematik


Turing-
Zu Beginn dieses Kapitels haben wir den hohen Stellenwert der Bere- maschine
chenbarkeitstheorie unter anderem damit begründet, dass die Erkennt- M
nisse auf diesem Gebiet tief in die Mathematik hineinwirken. Wie eng-
maschig die Berechenbarkeitstheorie auf der einen und die Beweistheo-
Reduktion Turing, 1936
rie auf der anderen Seite tatsächlich miteinander verwoben sind, werden
wir in diesem Abschnitt am Beispiel von drei prominenten Negativre- Prädikatenlogische Formel
sultaten demonstrieren. Es sind dies keine Geringeren als

I die Unlösbarkeit des Hilbert’schen Entscheidungsproblems, Entscheidungsverfahren


für die Prädikatenlogik
I die Unvollständigkeit der Arithmetik und erster Stufe

I die Unlösbarkeit des zehnten Hilbert’schen Problems.

Alle drei Negativresultate werden wir durch die Reduktion des Halte- Hält M auf
problems beweisen. Konkret werden wir zeigen, dass sich die Lösung Ja leerem Band? Nein
für eines der drei Probleme dazu verwenden lässt, um die Terminierung
von Turing-Maschinen oder Registermaschinen zu entscheiden (Abbil-
dungen 5.28 und 5.29). Wäre auch nur eines der drei Probleme lösbar,
so wäre es auch das Halteproblem. Wir wissen aber bereits aus Ab- Turing-
schnitt 5.3.1, dass das Halteproblem unentscheidbar ist. maschine
M
Um den Blick auf das Große und Ganze zu wahren, wollen wir zunächst
alle drei Reduktionen grob skizzieren. Im Anschluss daran liefern wir
Reduktion
die technischen Details in separaten Unterabschnitten nach.
Arithmetische Formel
I Unlösbarkeit des Hilbert’schen Entscheidungsproblems
In Abschnitt 5.4.1 werden wir demonstrieren, dass sich das Halte-
problem auf leerem Band mithilfe eines Entscheidungsverfahrens Korrekter und
vollständiger Kalkül für
für die Prädikatenlogik erster Stufe lösen lässt. Im Kern des Bewei- die Peano-Arithmetik
ses steht die Idee, eine einseitig beschränkte Turing-Maschine M in
eine prädikatenlogische Formel ϕM mit der folgenden Eigenschaft
zu übersetzen:
Hält M auf
M terminiert ⇔ ϕM ist allgemeingültig Ja leerem Band? Nein

Über die so hergestellte Beziehung lässt sich die Frage nach der Ter- Abbildung 5.28: Gäbe es ein Entschei-
minierung einer einseitig beschränkten Turing-Maschine mithilfe ei- dungsverfahren für die Prädikatenlogik er-
nes prädikatenlogischen Entscheidungsverfahrens beantworten. Aus ster Stufe (oben) oder einen korrekten
der Unentscheidbarkeit des Halteproblems können wir dann schlie- und zugleich vollständigen Kalkül für die
ßen, dass kein Entscheidungsverfahren für die Prädikatenlogik exis- Peano-Arithmetik (unten), so ließe sich da-
tieren kann. mit das Halteproblem entscheiden.
302 5 Berechenbarkeitstheorie

I Unvollständigkeit der Arithmetik


Register- In Abschnitt 5.4.2 werden wir zeigen, dass sich das Halteproblem
maschine auf leeren Band auch mit einem Entscheidungsverfahren für die
R
Peano-Arithmetik lösen lässt. Die Beweisidee ist wiederum die glei-
che. Wir werden zeigen, dass sich eine Turing-Maschine M in eine
Jones, arithmetische Formel ϕM übersetzen lässt, für die gilt:
Reduktion Matijasevi
1984 ϕM ist wahr ⇔ M terminiert
Diophantische Gleichung
Über diese Beziehung können wir die Frage nach der Terminierung
einer Turing-Maschine mit einem Entscheidungsverfahren für PA
Lösungsverfahren beantworten und daraus schließen, dass ein solches Verfahren nicht
für diophantische existieren kann. In Kombination mit Satz 2.5 erhalten wir ein er-
Gleichungen
staunliches Ergebnis als Nebenprodukt frei Haus: die semantische
Variante des ersten Gödel’schen Unvollständigkeitssatzes.
I Unlösbarkeit des zehnten Hilbert’schen Problems
Hält R unter
Ja Eingabe von x? Nein In Abschnitt 5.4.3 werden wir demonstrieren, dass sich das Halte-
problem auch mit einem Entscheidungsverfahren für diophantische
Abbildung 5.29: Ein Lösungsverfahren für Gleichungen lösen lässt. Dieses Mal werden wir den Beweis aber
diophantische Gleichungen könnten wir nicht mithilfe von Turing-Maschinen führen. Stattdessen werden wir
verwenden, um das Halteproblem für Regi- zeigen, wie sich eine Registermaschine in eine diophantische Glei-
stermaschinen zu entscheiden. chung ϕR = 0 mit der folgenden Eigenschaft übersetzen lässt:

ϕR = 0 hat eine Lösung ⇔ R terminiert

Über die so hergestellte Beziehung können wir die Frage nach der
Terminierung einer Registermaschine mithilfe eines Lösungsverfah-
rens für diophantische Gleichungen beantworten. Wiederum folgt
aus der Unentscheidbarkeit des Halteproblems sofort, dass kein Lö-
sungsverfahren für diophantische Gleichungen existieren kann.

Die Marschroute ist damit vorgezeichnet, und wir können uns ruhigen
Gewissens den Einzelheiten widmen. Für das Verständnis der weiteren
Kapitel werden die Details nicht benötigt, und es ist gefahrlos, sie beim
ersten Lesen zu überspringen.

5.4.1 Unentscheidbarkeit der PL1

In diesem Abschnitt werden wir herausarbeiten, wie sich eine einsei-


tig beschränkte Turing-Maschine M in eine prädikatenlogische Formel
übersetzen lässt, die genau dann allgemeingültig ist, wenn M unter Ein-
gabe eines leeren Bands terminiert. Die Konstruktion dieser Formel ist
5.4 Folgen für die Mathematik 303

ein Schlüsselelement in Turings historischem Beweis und wird ausführ- RS0(t,0) RS0(t,2)
lich in §11 seiner Arbeit beschrieben [200]. Auf den nächsten Seiten
werden wir den Kern seines Gedankengangs offenlegen.
RS2(t,1) RS0(t,3)
Turing beginnt mit der Definition mehrerer Prädikate, mit denen sich
die Konfigurationen von einseitig beschränkten Turing-Maschinen be-
schreiben lassen (Abbildung 5.30):  S2   ...
0 1 2 3
I(t, y) : Zum Zeitpunkt t steht der Kopf über der Zelle y
RSj (t, y) : Zum Zeitpunkt t enthält die Zelle y das Symbol S j I(t,0)
Kqi (t) : Zum Zeitpunkt t ist die Maschine im Zustand qi q2
F(x, y) : x, y sind natürliche Zahlen mit y = x + 1
Die angegebene Bedeutung der Prädikate ist deren intendierte Bedeu- Kq2(t)
tung. Damit die nachfolgende Konstruktion funktioniert, müssen wir si-
cherstellen, dass die Symbole I, RSj , Kqi und F nur in dem gewünschten Abbildung 5.30: In seiner Arbeit aus dem
Sinne interpretiert werden können. Wie dies geschehen kann, werden Jahr 1936 führte Turing mehrere Prädi-
wir weiter unten diskutieren. Für den Moment gehen wir einfach davon kate ein, mit denen sich die Konfigura-
aus, dass die Prädikate die gewünschte Bedeutung besitzen. tionen von einseitig beschränkten Turing-
Maschinen beschreiben lassen.
Unter den getroffenen Annahmen sind wir in der Lage, jede Instruk-
tion in eine prädikatenlogische Formel ‚Inst‘ zu übersetzen, die den
Übergang von einer Konfiguration zur nächsten beschreibt. Als erstes
betrachten wir eine Instruktion der Form (qi , S j , Sk , L, ql ). Der Konfigu-
rationsübergang, der durch diese Instruktion ausgelöst wird, lässt sich
wie folgt charakterisieren:

I Wenn in der Konfiguration zum Zeitpunkt t...


• die Zelle y das Zeichen S j enthält RSj (t, y)
• und der Schreib-Lese-Kopf über der Zelle y steht I(t, y)
• und sich die Maschine im Zustand qi befindet, Kqi (t)
I dann ist in der Konfiguration zum Zeitpunkt t + 1...
• der Schreib-Lese-Kopf nach links gerückt I(t + 1, y − 1)
• und das Zeichen S j durch Sk ersetzt RSk (t + 1, y)
• und der Folgezustand ql eingenommen. Kql (t + 1)

Kombinieren wir die Teilformeln miteinander, so erhalten wir das fol-


gende Zwischenergebnis:
∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t))
→ (I(t + 1, y − 1) ∧ RSk (t + 1, y) ∧ Kql (t + 1))) (5.7)
304 5 Berechenbarkeitstheorie

Einen wichtigen Aspekt haben wir noch vergessen. Wir müssen sicher-
stellen, dass der Bandinhalt an allen Stellen unverändert bleibt, über
denen sich der Schreib-Lese-Kopf nicht befindet:


M
∀ z (z = y → (RSi (t, z) → RSi (t + 1, z))) (5.8)
i=0

Die Formeln (5.7) und (5.8) fügen wir jetzt konjunktiv zusammen:

∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t))

→ (I(t + 1, y − 1) ∧ RSk (t + 1, y) ∧ Kql (t + 1)



M
∧ ∀ z (z = y → (RSi (t, z) → RSi (t + 1, z))))) (5.9)
i=0

Diese Formel ist noch keine Formel der Prädikatenlogik, da wir mit
‚+‘ ein Funktionszeichen und mit ‚=‘ ein Prädikatzeichen verwendet
haben, das uns in der PL1 gar nicht zur Verfügung steht. Über das Prä-
dikat F(x, y) können wir die Ausdrücke t + 1, y − 1 und z = y aber ganz
Die Formel (5.10) unterschei- einfach eliminieren:
det sich in zwei Punkten von
Turings eigener Formulierung. Zum einen
wurde die in der Originalarbeit verwende- Inst(qi , S j , Sk , L, ql ) :=
te Variable x in t umbenannt, um ihre in-
∀ t ∀ y ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t) ∧ F(t, t ) ∧ F(y , y))
haltliche Bedeutung hervorzuheben. t be-
zeichnet einen Zeitpunkt – den t-ten Be-
rechnungsschritt – und y eine Zellennum-
→ (I(t , y ) ∧ RSk (t , y) ∧ Kql (t )
mer. Zum anderen ist Turing in der letzten 
M
Formelzeile ein gravierender Fehler unter- ∧ ∀ z (F(y , z) ∨ (RSi (t, z) → RSi (t , z))))) (5.10)
laufen. Im Original lautet sie folgender- i=0
maßen:

∀ z (F(y , z) ∨ (RSj (x, z) → RSk (x , z))) Jetzt ist klar, wie sich die anderen Instruktionstypen in eine prädika-
Sinn ergibt diese Formel nicht, und sie tenlogische Formeln übersetzen lassen. Hierzu brauchen wir (5.10) nur
wurde von Turing auch schnell verbes- geringfügig umzuschreiben:
sert. Ein Jahr nach dem Erscheinen seiner
Originalarbeit publizierte er mehrere Kor- Inst(qi , S j , Sk , R, ql ) :=
rekturen in einem Artikel mit dem Titel
„On Computable Numbers, with an Ap- ∀ t ∀ y ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t) ∧ F(t, t ) ∧ F(y, y ))
plication to the Entscheidungsproblem. A
Correction“ [201]. Dort hat er seine ur- → (I(t , y ) ∧ RSk (t , y) ∧ Kql (t )
sprüngliche Formel korrigiert und bis auf

M
einen vergessenen Allquantor in die kor- ∧ ∀ z (F(z, y ) ∨ (RSi (t, z) → RSi (t , z))))) (5.11)
rekte Form gebracht. i=0
5.4 Folgen für die Mathematik 305

Inst(qi , S j , Sk , N, ql ) :=

∀ t ∀ y ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t) ∧ F(t, t ) ∧ F(y , y))

→ (I(t , y) ∧ RSk (t , y) ∧ Kql (t )



M
∧ ∀ z (F(y , z) ∨ (RSi (t, z) → RSi (t , z))))) (5.12)
i=0

Indem wir alle Instruktionen einer Turing-Maschine M auf die gezeigte


Weise in Formeln übersetzen und diese anschließend konjunktiv mit-
einander verknüpfen, können wir den kompletten Instruktionssatz von
M in eine einzige Formel hineincodieren. Für unsere Beispielmaschine
aus Abbildung 5.1 sieht diese Formel folgendermaßen aus:

Des(M) = Inst(q1 , S0 , S1 , R, q2 ) ∧ Inst(q2 , S0 , S0 , R, q3 ) ∧


Inst(q3 , S0 , S2 , R, q4 ) ∧ Inst(q4 , S0 , S0 , R, q1 )

Die Bezeichnung Des(M) stammt von Turing und ist die Abkürzung
für „description of M“. Ausgeschrieben ergibt die Formel ein wahres
Monstrum:

∀ t ∀ y ∀ t ∀ y ((RS0 (t, y) ∧ I(t, y) ∧ Kq1 (t) ∧ F(t, t ) ∧ F(y, y ))


→ (I(t , y ) ∧ RS1 (t , y) ∧ Kq2 (t )
∧ ∀ z (F(z, y ) ∨ ((RS0 (t, z) → RS0 (t , z)) ∧
(RS1 (t, z) → RS1 (t , z)) ∧ (RS2 (t, z) → RS2 (t , z)))))) ∧
∀ t ∀ y ∀ t ∀ y ((RS0 (t, y) ∧ I(t, y) ∧ Kq2 (t) ∧ F(t, t ) ∧ F(y, y ))
→ (I(t , y ) ∧ RS0 (t , y) ∧ Kq3 (t )
∧ ∀ z (F(z, y ) ∨ ((RS0 (t, z) → RS0 (t , z)) ∧
(RS1 (t, z) → RS1 (t , z)) ∧ (RS2 (t, z) → RS2 (t , z)))))) ∧
∀ t ∀ y ∀ t ∀ y ((RS0 (t, y) ∧ I(t, y) ∧ Kq3 (t) ∧ F(t, t ) ∧ F(y, y ))
→ (I(t , y ) ∧ RS2 (t , y) ∧ Kq4 (t )
∧ ∀ z (F(z, y ) ∨ ((RS0 (t, z) → RS0 (t , z)) ∧
(RS1 (t, z) → RS1 (t , z)) ∧ (RS2 (t, z) → RS2 (t , z)))))) ∧
∀ t ∀ y ∀ t ∀ y ((RS0 (t, y) ∧ I(t, y) ∧ Kq4 (t) ∧ F(t, t ) ∧ F(y, y ))
→ (I(t , y ) ∧ RS0 (t , y) ∧ Kq1 (t )
∧ ∀ z (F(z, y ) ∨ ((RS0 (t, z) → RS0 (t , z)) ∧
(RS1 (t, z) → RS1 (t , z)) ∧ (RS2 (t, z) → RS2 (t , z))))))
306 5 Berechenbarkeitstheorie

Des(M) beschreibt den Übergang von einer Konfiguration in die nächs-


te, sagt aber nichts darüber aus, in welcher Konfiguration die Maschine
startet.

Per Definition hatten wir vereinbart, dass zum Zeitpunkt 0

I der Schreib-Lese-Kopf über der Zelle 0 steht, I(0,0)

I der Startzustand q1 eingenommen ist und Kq1 (0)

I ein leeres Band vorliegt. ∀ y RS0 (0, y)

Damit können wir das Gesamtverhalten von M folgendermaßen be-


schreiben:
I(0, 0) ∧ Kq1 (0) ∧ ∀ y RS0 (0, y) ∧ Des(M) (5.13)

Um diese Formel zu einer echten prädikatenlogischen Formel zu ma-


chen, muss die 0 eliminiert werden. Turing nutzte aus, dass es keine
Rolle spielt, ob sich die Maschine zum Zeitpunkt 0 oder zu einem spä-
teren Zeitpunkt u in dieser Konfiguration befindet. Damit lässt sich das
Problem lösen, indem die 0 durch ein existenziell quantifiziertes Kon-
stantensymbol u ersetzt wird. Formel (5.13) wird dann zu

A(M) := ∃ u (I(u, u) ∧ Kq1 (u) ∧ ∀ y RS0 (u, y)) ∧ Des(M)

Zu guter Letzt wollen wir die Terminierung von M mithilfe einer For-
mel Halt(M) beschreiben. Um den Aufbau dieser Formel zu verstehen,
erinnern wir uns daran, dass eine Turing-Maschine genau dann wei-
ter rechnet, wenn eine Instruktion angewendet werden kann. Betrachten
wir eine Instruktion der Gestalt (qi , S j , _, _), so ist sie genau dann an-
wendbar, wenn

I sich die Maschine im Zustand qi befindet und Kqi (t)

I in der aktuell adressierten Zelle y I(t, y)

I das Bandzeichen S j gespeichert ist. RSj (t, y)

Damit können wir das Weiterrechnen einer Maschine mit einer Formel
Cont(M,t) beschreiben, indem wir für jede Instruktion (qi , S j , _, _) die
Teilformel
 
∃ y Kqi (t) ∧ I(t, y) ∧ RSj (t, y)
5.4 Folgen für die Mathematik 307

bilden und anschließend alle Teilformeln disjunktiv miteinander ver- In Turings historischer Arbeit
knüpfen. Für unsere Beispielmaschine erhalten wir: aus dem Jahr 1936 werden
Sie die Definition der Formel Halt(M)
Cont(M, t) = ∃ y (Kq1 (t) ∧ I(t, y) ∧ RS0 (t, y)) ∨ nicht finden, genauso wenig wie das Wort
Halteproblem. In seinem ursprünglichen
Instruktion (q1 ,S0 ,S1 ,R,q2 ) Beweis hatte Turing nämlich gar nicht das
∃ y (Kq2 (t) ∧ I(t, y) ∧ RS0 (t, y)) ∨ Halteproblem reduziert, sondern gezeigt,
dass sich mit einem Entscheidungsver-
Instruktion (q2 ,S0 ,S0 ,R,q3 )
fahren für die Prädikatenlogik erster Stu-
∃ y (Kq3 (t) ∧ I(t, y) ∧ RS0 (t, y)) ∨ fe bestimmen lässt, ob eine Maschine ir-
gendwann das Symbol S1 auf das Band
Instruktion (q3 ,S0 ,S2 ,R,q4 )
schreibt. Folgen wir dem Turing’schen
∃ y (Kq4 (t) ∧ I(t, y) ∧ RS0 (t, y)) Weg, so erhalten wir eine Formel, die so-
gar noch einfacher ist als die hier konstru-
Instruktion (q4 ,S0 ,S0 ,R,q1 )
ierte. Anstatt der vergleichsweise kompli-
Mithilfe der so erzeugten Formel können wir die Terminierung einer zierten Formel Halt(M) enthält sie den
viel simpleren Ausdruck
Turing-Maschine jetzt ohne Umwege beschreiben:
∃ t ∃ y RS1 (t, y)
Halt(M) := ∃ t ¬Cont(M, t)
Diese Formel besagt, dass die betrachte-
In Worten besagt die Formel, dass die Maschine irgendwann eine Kon- te Maschine irgendwann eine Konfigura-
figuration erreicht, in der kein Weiterkommen mehr möglich ist. tion erreicht, in der eine Zelle y das Band-
symbol S1 enthält. Kurzum: Die Maschine
Kombinieren wir die Teilformeln A(M) und Halt(M) zu schreibt irgendwann das Symbol S1 .
Genau wie das Halteproblem, ist auch das
Un(M) := A(M) → Halt(M)
Problem, ob eine Turing-Maschine ein be-
stimmtes Symbol auf das Band schreibt,
so erhalten wir eine Formel mit der folgenden inhaltlichen Aussage:
unentscheidbar; beide Formeln erfüllen
„M terminiert auf leerem Band.“ also den gleichen Zweck.

Einen wichtigen Punkt dürfen wir an dieser Stelle nicht übergehen. Die
Formel Un(M) steht nur dann für diese Aussage, wenn wir die ver-
wendeten Prädikate entsprechend ihrer intendierten Bedeutung inter-
pretieren. Bezeichnen wir diese Interpretation mit (U, I) so können wir
den Zusammenhang zwischen Un(M) und der Terminierung von M wie
folgt präzisieren:

M terminiert ⇔ (U, I) |= Un(M)

Um das Hilbert’sche Entscheidungsproblem negativ zu beantworten,


brauchen wir aber eine Formel, die genau dann allgemeingültig ist,
wenn die Maschine M terminiert:

M terminiert ⇔ |= Un(M) (5.14)

Wir wollen uns nun mit der Frage beschäftigen, ob unsere Formel
Un(M) diese Eigenschaft erfüllt. Die Richtung von rechts nach links
308 5 Berechenbarkeitstheorie

⎫ ist einfach. Ist Un(M) allgemeingültig, gilt also |= Un(M), so ist die
I G(z, x) ⎪ Formel unter jeder Interpretation wahr und damit auch unter jener In-


z ... x ⎪


⎪ terpretation, die alle verwendeten Prädikatzeichen mit ihrer intendier-



⎪ ten Bedeutung versieht. Dann besagt die Formel Un(M) genau das Ge-
z<x ⎪


⎪ wünschte: M wird irgendwann eine Konfiguration erreichen, in der kein



⎪ Weiterkommen mehr möglich ist. Kurzum: M terminiert.
I ∨(G(x, y) ∧ F(y, z)) ⎪


⎬ ⇒
x ... y z Gilt vielleicht sogar die Richtung von links nach rechts? Die Antwort ist
¬F(x, z)

⎪ Nein! Da wir die Allgemeingültigkeit einer Formel betrachten, müssen

⎪ x + 1 = z
x < y∧y+1 = z ⎪
⎪ wir jetzt auch solche Interpretationen in Betracht ziehen, in denen die





⎪ verwendeten Prädikate ihre intendierte Bedeutung verlieren. Beispiels-
I ∨(F(x, y) ∧ F(z, y)) ⎪


⎪ weise sind wir bisher ohne Begründung davon ausgegangen, dass F(x, y)
x, z y ⎪


⎪ die Beziehung y = x + 1 ausdrückt. Werden die Symbole mit einer an-


⎭ deren Bedeutung versehen, dann kann Un(M) durchaus falsch sein,
x+1 = y∧z+1 = y
die Turing-Maschine M aber dennoch terminieren. Um die Beziehung
Abbildung 5.31: Die Formel Q stellt un- (5.14) in beiden Richtungen sicherzustellen, müssen wir Un(M) um ei-
ter anderem sicher, dass die Prädikate F und ne Teilformel ergänzen, die F in seine intendierte Bedeutung zwingt.
G die dargestellten Ordnungseigenschaften Genau dies leistet Turings Formel Q, die er in [201] folgendermaßen
erfüllen. angibt:
Q = ∀ x ∃ w ∀ y ∀ z (F(x, w) ∧ (F(x, y) → G(x, y)) ∧
Die Formel Q werden Sie (F(x, z) ∧ G(z, y) → G(x, y)) ∧
in Turings Originalarbeit aus
(G(z, x) ∨ (G(x, y) ∧ F(y, z)) ∨ (F(x, y) ∧ F(z, y)) → ¬F(x, z)))
dem Jahr 1936 nicht finden. Dort hatte
er noch versucht, die intendierte Bedeu- Mit G hat Turing ein neues Prädikatsymbol mit der folgenden intendier-
tung des Prädikatzeichens F folgenderma- ten Bedeutung eingeführt:
ßen zu beschreiben:
G(x, y) : x, y sind ganze Zahlen, und x ist kleiner als y
N(u) ∧ ∀ x (N(x) → ∃ x F(x, x )) ∧
Die einzelnen Formelbestandteile von Q besagen dann das Folgende:
∀ y ∀ z (F(y, z) → N(y) ∧ N(z))

In Turings Formel drückt N(ξ ) aus, dass I Jede Zahl hat einen Nachfolger
die Variable ξ einer natürlichen Zahl ent- F(x, w)
spricht. Unter dieser Interpretation besagt
der erste Formelbestandteil, dass u ∈ N I x + 1 ist größer als x
ist, der Mittelteil postuliert, dass jede Zahl F(x, y) → G(x, y)
einen Nachfolger hat, und der letzte For-
I Ist x + 1 < y, dann ist auch x < y
melbestandteil drückt aus, dass aus y +
1 = z stets y, z ∈ N folgt.
F(x, z) ∧ G(z, y) → G(x, y)
Turing übersah, dass seine Formel nicht I F und G erfüllen die Ordnungseigenschaften aus Abbildung 5.31
garantiert, dass eine Zahl x einen eindeuti- G(z, x) ∨ (G(x, y) ∧ F(y, z)) ∨ (F(x, y) ∧ F(z, y)) → ¬F(x, z)
gen Nachfolger besitzt. In seinem Beweis
greift er auf diese Eigenschaft aber expli-
zit zurück. In den 1937 publizierten Kor- In seinen 1937 publizierten Korrekturen hat Turing gezeigt, dass die
rekturen hat Turing den Fehler behoben Formel Q die intendierte Bedeutung unserer Prädikate tatsächlich hin-
und die Formel Q als Ersatz für den oben reichend beschreibt. Damit erhalten wir mit
genannten Ausdruck eingeführt.
(A(M) ∧ Q) → Halt(M) (5.15)
5.4 Folgen für die Mathematik 309

die Formel, nach der wir gesucht haben; sie ist genau dann allgemein-
gültig, wenn die beschriebene Turing-Maschine M auf leerem Band ter-
miniert.

Den finalen Schluss in Turings Beweis haben wir weiter oben bereits
vorweggenommen. Gäbe es tatsächlich ein Entscheidungsverfahren für
die Prädikatenlogik erster Stufe, so könnten wir damit das Halteproblem
entscheiden. Um festzustellen, ob eine einseitig beschränkte Turing-
Maschine M auf leeren Band terminiert, müssten wir lediglich die For-
mel (5.15) konstruieren und anschließend überprüfen, ob sie allgemein-
gültig ist oder nicht. Im ersten Fall wüssten wir, dass M terminiert, im
zweiten, dass M für immer weiterrechnet. Wir wissen aber bereits, dass
das Halteproblem unentscheidbar ist, und deshalb kann auch für das
Hilbert’sche Entscheidungsproblem keine positive Lösung existieren:

Satz 5.7 (Turing, 1936)

Es gibt kein Entscheidungsverfahren für die Prädikatenlogik.

5.4.2 Unvollständigkeit der Arithmetik

In diesem Abschnitt werden wir eine alternative Codierung von Turing-


Maschinen diskutieren. Anders als im vorangegangenen Abschnitt wird
das Ergebnis keine gewöhnliche Formel der PL1 mehr sein, sondern ei-
ne Formel der Peano-Arithmetik. Konkret werden wir zeigen, wie sich
eine Turing-Maschine M in eine arithmetische Formel übersetzen lässt,
die genau dann wahr ist, wenn M terminiert. Der Begriff der Allgemein-
gültigkeit wird keine Rolle mehr spielen, da wir uns nur noch dafür in-
teressieren, ob die konstruierten Formeln unter der Standardinterpretati-
on der Peano-Arithmetik wahr oder falsch sind. In dieser Interpretation
sind die Grundelemente die natürlichen Zahlen, ‚+‘ entspricht der Ad-
dition, ‚ב der Multiplikation und ‚s‘ der Nachfolgeroperation.

Die Konstruktion basiert auf der Idee, eine Folge von Konfigurations-
übergängen in eine einzige natürliche Zahl hineinzucodieren und über
diese Zahl zu behaupten, dass sie eine terminierende Berechnungsse-
quenz beschreibt.

Wir wollen unserem Ziel in mehreren Etappen entgegen gehen und zu-
nächst überlegen, wie eine einzelne Konfiguration als natürliche Zahl
codiert werden kann. Im Allgemeinen hat eine Konfiguration die Form
(q, i, s0 , s1 , . . . , sn ) (5.16)
310 5 Berechenbarkeitstheorie

R0(x) = 0 R2(x) = 0
wobei q den aktuellen Zustand, i die Position des Schreib-Lese-Kopfs
und s0 , s1 , . . . , sn den bis jetzt benutzten Bandabschnitt repräsentiert.
Den aktuellen Zustand und die Bandzeichen stellen wir durch natürliche
R1(x) = 2
Zahlen dar und verwenden die Zahl n stellvertretend für den Zustand qn
L(x) = 3 oder das Bandzeichen Sn . Somit können wir alle Komponenten einer
Konfiguration ausnahmslos als natürliche Zahlen auffassen.
  S2  
... ...
0 1 2 3 Um über die Komponenten einer Konfiguration innerhalb einer Formel
q1 sprechen zu können, führen wir mit I, Rj , K und L mehrere neue Funk-
I(x) = 0
tionssymbole ein, die stellvertretend für die folgenden Funktionen ste-
hen:
I : (q, i, s0 , . . . , sn ) → i (Kopfposition)
K(x) = 1
Rj : (q, i, s0 , . . . , sn ) → sj (Symbol in der j-ten Zelle)
K : (q, i, s0 , . . . , sn ) → q (Zustand der Maschine)
Abbildung 5.32: Beschreibung von Turing-
Maschinen-Konfigurationen mit den Funk- L : (q, i, s0 , . . . , sn ) → n+1 (Anzahl benutzter Bandzellen)
tionen I, Rj , K und L
Abbildung 5.32 zeigt, wie sich die Konfiguration einer Turing-Maschi-
ne mit den definierten Funktionen beschreiben lässt.

Behalten Sie stets im Gedächtnis, dass wir eine Formel der Peano-
Arithmetik suchen. Eine solche Formel darf neben ‚0‘, ‚s‘, ‚+‘ und ‚ב
keine weiteren Funktionszeichen und neben ‚=‘ keine weiteren Prädi-
katzeichen enthalten. Wir kommen also nicht umhin, die neu eingeführ-
ten Symbole irgendwann durch äquivalente arithmetische Ausdrücke zu
ersetzen. Für den Moment wollen wir uns an diesem Missstand nicht
stören, doch schon jetzt sei angemerkt, dass sich die neu eingeführten
Funktionen durch äquivalente arithmetische Ausdrücke ersetzen lassen.
Wie dies im Einzelnen gelingt, werden wir weiter unten klären.
Mit den neu eingeführten Funktionen werden wir jetzt zwei wichtige
Teilformeln definieren. Die erste ist die Formel ϕStart (x). Sie soll ge-
nau dann wahr sein, wenn die Variable x die Startkonfiguration einer
Turing-Maschine beschreibt. Weiter oben haben wir festgelegt, dass in
der Startkonfiguration

I der Schreib-Lese-Kopf über der Zelle 0 steht, I(x) = 0


I der Startzustand q1 eingenommen ist K(x) = 1
I und ein leeres Band vorliegt. L(x) = 1 ∧ R0 (x) = 0

Die gesuchte Formel ϕStart (x) erhalten wir durch die konjunktive Ver-
knüpfung der ermittelten Teilausdrücke:
ϕStart (x) := (I(x) = 0 ∧ K(x) = 1 ∧ L(x) = 1 ∧ R0 (x) = 0)
5.4 Folgen für die Mathematik 311

Die zweite ist die Formel ϕCont (x). Sie soll genau dann wahr sein, wenn R0(x) = 0 R2(x) = 0
die Maschine in der Konfiguration x nicht terminiert, wenn also eine
Instruktion gefunden werden kann, die x in eine Folgekonfiguration
R1(x) = 2
überführt. Die Formel können wir analog zur Formel Cont(M) aus Ab-
schnitt 5.4.1 konstruieren. Für die dort betrachtete Maschine lautet sie L(x) = 3
beispielsweise so:
S2
  ...     ...
ϕCont (x) := ∃ (y < L(x)) I(x) = y ∧ K(x) = 1 ∧ Ry (x) = 0 ∨ 0 1 2 3
q1
Instruktion (q1 ,S0 ,S1 ,R,q2 ) I(x) = 0
 
∃ (y < L(x)) I(x) = y ∧ K(x) = 2 ∧ Ry (x) = 0 ∨
Instruktion (q2 ,S0 ,S0 ,R,q3 )
 
∃ (y < L(x)) I(x) = y ∧ K(x) = 3 ∧ Ry (x) = 0 ∨ K(x) = 1

Instruktion (q3 ,S0 ,S2 ,R,q4 )


 
∃ (y < L(x)) I(x) = y ∧ K(x) = 4 ∧ Ry (x) = 0 (q1 , S0 , S1 , N, q2 )
Instruktion (q4 ,S0 ,S0 ,R,q1 )

Zusätzlich definieren wir für jede Instruktion I eine Formel ϕI (x, y), R0(x) = 1 R2(x) = 0
die den Übergang von der Konfiguration x in die Konfiguration y be-
schreibt. Als erstes betrachten wir eine Instruktion (qi , S j , Sk , N, ql ), die
R1(x) = 2
den Schreib-Lese-Kopf nicht bewegt (Abbildung 5.33). Wird sie ausge-
führt, so geht die Turing-Maschine von der Konfiguration x genau dann L(x) = 3
in die Konfiguration y über,
 S1 S2  
... ...
I wenn in der Ausgangskonfiguration x . . . 0 1 2 3

I(x) = 0
• n beschriebene Zellen codiert sind, L(x) = n
• der Zustand qi eingenommen ist, K(x) = i q2

• der Schreib-Lese-Kopf über der Zelle h steht I(x) = h


K(x) = 2
• und die Zelle h das Zeichen S j enthält Rh (x) = j
I und in der Folgekonfiguration y . . . Abbildung 5.33: Ausführung einer Instruk-
tion der Form (qi , S j , Sk , N, ql )
• n beschriebene Zellen codiert sind, L(y) = n
• der Zustand ql eingenommen ist, K(y) = l
• der Schreib-Lese-Kopf über der Zelle h steht I(y) = h
• und die Zelle h das Zeichen Sk enthält. Rh (y) = k

Ferner dürfen wir nicht vergessen, dass der Bandinhalt an allen Stellen
gleich bleibt, an denen der Schreib-Lesekopf nicht steht:

∀ (h < n) (h = h → ∃ s (Rh (x) = s ∧ Rh (y) = s))


312 5 Berechenbarkeitstheorie

R0(x) = 1 R2(x) = 0
Fügen wir alle Teilformeln zusammen, so erhalten wir das nachstehende
Ergebnis:
R1(x) = 2 I Instruktionstyp (qi , S j , Sk , N, ql )
L(x) = 3 ϕI (x, y) := ∃ h ∃ n (
 S1 S2   L(x) = n ∧ K(x) = i ∧ I(x) = h ∧ Rh (x) = j ∧
... ...
0 1 2 3 L(y) = n ∧ K(y) = l ∧ I(y) = h ∧ Rh (y) = k ∧
I(x) = 0 ∀ (h < n) (h = h → ∃ s (Rh (x) = s ∧ Rh (y) = s)))

q2 Für die anderen Instruktionstypen können wir ganz ähnlich verfahren,


allerdings müssen wir ein wenig Mehrarbeit leisten, wenn der Schreib-
K(x) = 2 Lese-Kopf auf der ersten oder der letzten Zelle der codierten Bandse-
quenz positioniert ist. Der einfachere Fall ist die Rechtsbewegung (Ab-
bildung 5.34). Bezeichnen wir mit n1 und n2 die Längen der in x bzw. y
(q2 , S1 , S2 , R, q3 ) codierten Bandabschnitte und mit h1 und h2 die Positionen des Schreib-
Lese-Kopfs, so gilt:

I Steht der Schreib-Lese-Kopf nicht ganz rechts, h1 + 1 = n1


R0(x) = 2 R2(x) = 0
• so codiert y genauso viele Zellen wie x. n1 = n2
R1(x) = 2 I Steht der Schreib-Lese-Kopf ganz rechts, h1 + 1 = n1
L(x) = 3 • so ist in y eine Zelle mehr codiert als in x, n1 + 1 = n2

...  S2 S2   ...


• und diese Zelle ist leer. Rn1 (y) = 0
0 1 2 3 I In beiden Fällen rückt der Kopf nach rechts. h1 + 1 = h2
I(x) = 1
Die Formel ϕI (x, y) stellt sich dann folgendermaßen dar:
q3
I Instruktionstyp (qi , S j , Sk , R, ql )

K(x) = 3
ϕI (x, y) := ∃ h1 ∃ h2 ∃ n1 ∃n2 (
L(x) = n1 ∧ K(x) = i ∧ I(x) = h1 ∧ Rh1 (x) = j ∧
Abbildung 5.34: Ausführung einer Instruk- L(y) = n2 ∧ K(y) = l ∧ I(y) = h2 ∧ Rh1 (y) = k ∧
tion der Form (qi , S j , Sk , R, ql )
(h1 + 1 = n1 → n1 = n2 ) ∧
(h1 + 1 = n1 → (n1 + 1 = n2 ∧ Rn1 (y) = 0)) ∧
h1 + 1 = h2 ∧
∀ (h < n1 ) (h = h1 → ∃ s (Rh (x) = s ∧ Rh (y) = s)))
Im Falle der Linksbewegung müssen wir noch wachsamer sein (Abbil-
dungen 5.35 und 5.36). Steht der Schreib-Lese-Kopf bereits ganz links,
ist also h1 = 0, so wird die Kopfbewegung simuliert, indem der gesamte
Bandinhalt eine Stelle nach rechts kopiert wird. Wir halten fest:
5.4 Folgen für die Mathematik 313

I Steht der Schreib-Lese-Kopf nicht ganz links, h1 = 0 R0(x) = 2 R2(x) = 0


• so codiert y genauso viele Zellen wie x n1 = n2
• und der Schreib-Lese-Kopf rückt nach links. h1 = h2 + 1 R1(x) = 2

L(x) = 3
I Steht der Schreib-Lese-Kopf ganz links, h1 = 0
• so ist in y eine Zelle mehr codiert als in x, n1 + 1 = n2 ...  S2 S2   ...
• diese Zelle ist leer R0 (y) = 0 0 1 2 3

• und der Schreib-Lese-Kopf bleibt wo er ist. h1 = h2 I(x) = 1

Das Umkopieren des Bandinhalts können wir mit der folgenden For- q3
mel beschreiben:
∀ (h < n1 ) (h = 0 → ∃ s (Rh (x) = s ∧ Rh+1 (y) = s)) K(x) = 3

Insgesamt erhalten wir die folgende Formel:


(q3 , S2 , S3 , L, q3 )
I Instruktionstyp (qi , S j , Sk , L, ql )
ϕI (x, y) := ∃ h1 ∃ h2 ∃ n1 ∃n2 (
L(x) = n1 ∧ K(x) = i ∧ I(x) = h1 ∧ Rh1 (x) = j ∧ R0(x) = 2 R2(x) = 0
L(y) = n2 ∧ K(y) = l ∧ I(y) = h2 ∧
(h1 = 0 → ( R1(x) = 3

n1 = n2 ∧ h1 = h2 + 1 ∧ Rh1 (y) = k ∧ L(x) = 3

∀ (h < n1 ) (h = h1 → ∃ s (Rh (x) = s ∧ Rh (y) = s)))) ∧  S2 S3  


... ...
(h1 = 0 → ( 0 1 2 3
n1 + 1 = n2 ∧ R0 (y) = 0 ∧ h1 = h2 ∧ R1 (y) = k ∧ I(x) = 0
∀ (h < n1 ) (h = 0 → ∃ s (Rh (x) = s ∧ Rh+1 (y) = s)))))
q3
Indem wir alle Instruktionsformeln disjunktiv miteinander verknüpfen,
erhalten wir eine Formel, die genau dann wahr ist, wenn die Maschine
einen Übergang von der Konfiguration x in die Konfiguration y vollzie- K(x) = 3
hen kann:
Abbildung 5.35: Ausführung einer Instruk-
ϕTrans (x, y) := ϕI1 (x, y) ∨ ϕI2 (x, y) ∨ ϕI3 (x, y) ∨ . . . ∨ ϕIK (x, y)
tion der Form (qi , S j , Sk , L, ql )
Als Nächstes werden wir versuchen, beliebige Anfangsstücke einer Be-
rechnungssequenz, d. h. eine endliche Folge von Konfigurationen κ0 ,
κ1 , κ2 , . . . , κm als natürliche Zahl zu codieren. Hierzu führen wir mit
M ein einstelliges und mit C ein zweistelliges Funktionssymbol mit der
folgenden Bedeutung ein:
M : (κ0 , κ1 , κ2 , . . . , κm ) → m (Anzahl Berechnungsschritte)
C : (κ0 , κ1 , κ2 , . . . , κm ), k → κk (k-te Konfiguration)
314 5 Berechenbarkeitstheorie

R0(x) = 2 R2(x) = 0
Mit den beiden neuen Funktionen können wir eine terminierende Be-
rechnungssequenz ohne Umwege beschreiben. Hierzu brauchen wir uns
lediglich darauf zu besinnen, dass eine Turing-Maschine M nach n Be-
R1(x) = 3
rechnungsschritten terminiert, wenn sie
L(x) = 3
I in der Starkonfiguration beginnt ϕStart (C(z,0))
 S2 S3  
... ...
0 1 2 3 I und rechnet, n = M(z) ∧ ∀ (u < n) ϕTrans (C(z, u), C(z, s(u)))
I(x) = 0 I bis es kein Weiterkommen gibt. ¬ϕCont (C(z, n))

q3 Zusammenfassend erhalten wir mit


ϕM := ∃ z ∃ n (ϕStart (C(z,0)) ∧ (5.17)
K(x) = 3 n = M(z) ∧ ∀ (u < n) ϕTrans (C(z, u), C(z, s(u))) ∧
¬ϕCont (C(z, n)))
(q3 , S2 , S3 , L, q3 ) jene Formel, nach der wir gesucht haben. ϕM ist genau dann wahr, wenn
die Turing-Maschine M terminiert. Ihr einziger Makel: Sie ist keine For-
mel der Peano-Arithmetik, da sie eine Reihe von Funktionszeichen ent-
hält, die uns in PA nicht zur Verfügung stehen, und die Variable y in der
R0(x) = 0 R2(x) = 3
Formel ϕCont zudem als Index eines Funktionszeichens vorkommt. Die-
ses Umstands wollen wir uns jetzt annehmen und die Funktionszeichen
L(x) = 4 R1(x) = 3 R3(x) = 0 nacheinander eliminieren. Der Schlüssel für unser Vorhaben ist wieder
einmal die Gödel’sche β -Funktion

S3 S3 β (x, y, z) := x mod (1 + y · (z + 1))


...    ...
0 1 2 3 mit der wir uns ausführlich in Abschnitt 4.2.3 beschäftigt haben. Dort
haben wir nachgewiesen, dass für jede Sequenz natürlicher Zahlen
I(x) = 0
a0 , . . . , an zwei Zahlen b und c existieren mit
q3 β (b, c,0) = a0 , β (b, c,1) = a1 , β (b, c,2) = a2 , . . .
Damit sind wir in der Lage, jede Konfiguration
K(x) = 3
x = (q, i, s0 , s1 , . . . , sn )
Abbildung 5.36: Ausführung einer Instruk- mithilfe zweier Zahlen b und c zu repräsentieren. Diese Zahlen lassen
tion der Form (qi , S j , Sk , L, ql ). Im darge- sich so wählen, dass die folgenden Eigenschaften erfüllt sind:
stellten Fall steht der Schreib-Lese-Kopf
bereits ganz links. Die Kopfbewegung wird β (b, c,0) = n + 1 (Anzahl der codierten Zellen, L(x))
simuliert, indem der gesamte Bandinhalt ei- β (b, c,1) = q (Zustand der Maschine, K(x))
ne Stelle nach rechts kopiert wird.
β (b, c,2) = i (Kopfposition, I(x))
β (b, c,3) = s0 (Inhalt der ersten Zelle, R0 (x))
...
β (b, c, n + 3) = sn (Inhalt der letzten Zelle, Rn (x))
5.4 Folgen für die Mathematik 315

Jetzt ist es nur noch eine Formsache, die Formeln ϕStart (x), ϕTrans (x) und
ϕCont (x) in Formeln der Peano-Arithmetik zu übersetzen. Beispielswei-
se können wir die Formel
ϕStart (x) = (I(x) = 0 ∧ K(x) = 1 ∧ L(x) = 1 ∧ R0 (x) = 0)
wie folgt umschreiben:
ϕStart (b, c) := (β (b, c, 2) = 0) ∧ (β (b, c, 1) = 1) ∧
(β (b, c,0) = 1) ∧ (β (b, c, 3) = 0)
Ersetzen wir jetzt noch den Platzhalter β (b, c, n) durch den äquivalenten
arithmetischen Ausdruck (4.7) aus Abschnitt 4.2.3, so erhalten wir eine
echte PA-Formel:
ϕStart (b, c) := ∃ d b = s(c × s(2)) × d + 0 ∧ 0 < s(c × s(2)) ∧
∃ d b = s(c × s(1)) × d + 1 ∧ 1 < s(c × s(1)) ∧
∃ d b = s(c × s(0)) × d + 1 ∧ 1 < s(c × s(0)) ∧
∃ d b = s(c × s(3)) × d + 0 ∧ 0 < s(c × s(3))
Auf die gleiche Weise können wir die Formeln ϕTrans (x) und ϕCont (x)
in entsprechende Formeln ϕTrans (b1 , c1 , b2 , c2 ) und ϕCont (b, c) transfor-
mieren. Übersichtlich sind diese Formeln nicht, und deshalb wollen wir
darauf verzichten, sie in voller Gänze auszuschreiben. Auch den Platz-
halter β (b, c, n) wollen wir ab jetzt nicht mehr eliminieren.

Nachdem wir es geschafft haben, einzelne Konfigurationen arithmetisch


zu codieren, wollen wir uns im nächsten Schritt davon überzeugen, dass
sich endliche Berechnungssequenzen auf die gleiche Weise codieren
lassen. Dies gelingt, indem wir die Gödel’sche β -Funktion ein zwei-
tes Mal bemühen. Nach dem oben Gesagten können wir eine endliche
Berechnungssequenz
κ0 , κ1 , κ2 , . . . , κm
als eine Folge von jeweils zwei natürlichen Zahlen auffassen:
b0 , c0 , b1 , c1 , . . . , bm , cm
Mithilfe der Gödel’schen β -Funktion können wir diese Folge in der
gewohnten Weise auf zwei natürliche Zahlen b und c verdichten. Wir
wissen, dass b und c so gewählt werden können, dass die folgenden
Eigenschaften gelten:
β (b, c,0) = m (Anzahl der Berechnungsschritte, M(z))
β (b, c,2 · i + 1) = bi (erste Komponente von C(z, i))
β (b, c,2 · i + 2) = ci (zweite Komponente von C(z, i))
316 5 Berechenbarkeitstheorie

Damit können wir Formel (5.17) folgendermaßen umschreiben:


ϕM =∃ b ∃ c ∃ n (ϕStart (β (b, c, 1), β (b, c, 2)) ∧ (5.18)
n = β (b, c,0) ∧
∀ (u < n) ϕTrans (β (b, c, 2 × u + 1), β (b, c, 2 × u + 2),
∀ (u < n) ϕTrans (β (b, c, 2 × u + 3), β (b, c, 2 × u + 4)) ∧
¬ϕCont (β (b, c, 2 × n + 1), β (b, c, 2 × n + 2)))
Jetzt sind wir am Ziel. Mit ϕM haben wir eine PA-Formel konstruiert,
die genau dann wahr ist, wenn die codierte Turing-Maschine M termi-
niert. Der Rest der Argumentation ist der gleiche wie im vorherigen Ab-
schnitt. Gäbe es ein Entscheidungsverfahren für die Peano-Arithmetik,
so könnten wir damit das Halteproblem lösen. Hierzu müssten wir le-
diglich Formel (5.18) konstruieren und prüfen, ob sie wahr oder falsch
ist. Aus der Unentscheidbarkeit des Halteproblems folgt nun sofort

Satz 5.8

Die semantische Variante des Entscheidungsproblems ist für die


Peano-Arithmetik unlösbar.

Der Satz besagt, dass kein systematisches Verfahren existiert, das für
jede arithmetische Formel immer korrekt entscheidet, ob sie wahr oder
falsch ist. Daraus folgt unmittelbar, dass es auch kein formales Sys-
tem für die Peano-Arithmetik geben kann, das korrekt und vollständig
ist. Gäbe es ein solches, so könnten wir nach Satz 2.6 die semantische
Variante des Entscheidungsproblems lösen. Aber genau dies ist nach
Satz 5.8 unmöglich, und wir erhalten eines der bedeutendsten Ergebnis-
se der Beweistheorie als Korollar: die semantische Variante des ersten
Gödel’schen Unvollständigkeitssatzes.

Korollar 5.2 (Erster Gödel’scher Unvollständigkeitssatz)

Jedes korrekte formale System, das stark genug ist, um die Peano-
Arithmetik zu formalisieren, ist unvollständig.

Die Überlegungen in diesem Abschnitt haben gezeigt, dass wir die se-
mantische Variante des ersten Gödel’schen Unvollständigkeitssatzes auf
verblüffend einfache Weise herleiten können. Alles, was wir für sei-
nen Beweis benötigen, sind das Wissen über die Unentscheidbarkeit des
Halteproblems sowie die Erkenntnis, dass wir jede Turing-Maschine als
arithmetische Formel codieren können. Ein wunderbares Ergebnis.
5.4 Folgen für die Mathematik 317

5.4.3 Hilberts zehntes Problem

In den beiden vorangegangenen Abschnitten haben wir durch die Re-


duktion des Halteproblems elegante Beweise für die Unlösbarkeit des
Entscheidungsproblems der Prädikatenlogik und für die Unvollständig-
keit der Arithmetik erhalten. Auf die gleiche Weise werden wir jetzt 1953 Davis:
ein weiteres bedeutendes Negativresultat herleiten: die Unlösbarkeit des „Jede semi-entscheidbare
zehnten Hilbert’schen Problems. Auf dem 2. internationalen Kongress Relation lässt sich als
der Mathematiker in Paris hatte David Hilbert das Problem mit den fol- diophantische Gleichung
genden Worten formuliert: mit einer beschränkt
allquantifizierten Variable
codieren.“ [41]
„Eine diophantische Gleichung mit irgend welchen Unbe-
kannten und mit ganzen rationalen Zahlenkoeffizienten sei
vorgelegt: man soll ein Verfahren angeben, nach welchem 1961 Davis, Putnam, Robinson:
sich mittelst einer endlichen Anzahl von Operationen ent-
„Jede semi-entscheidbare
scheiden lässt, ob die Gleichung in ganzen rationalen Zah- Relation lässt sich als
len lösbar ist.“ exponentielle
David Hilbert, 1900 [91] diophantische Gleichung
codieren.“ [45]

In Kapitel 1 haben wir vorweggenommen, dass sich Hilberts zehntes


Problem nicht lösen lässt, d. h., dass es unmöglich ist, ein systematisch- 1970 Matijasevič:
es Verfahren anzugeben, das für jede diophantische Gleichung immer „Jede exponentielle
korrekt entscheidet, ob sie lösbar ist oder nicht. Historisch wurde dieses diophantische Gleichung
Ergebnis in mehreren Etappen erzielt (Abbildung 5.37): lässt sich in eine
gewöhnliche diophantische
I Im Jahr 1953 publizierte Martin Davis eine Arbeit mit dem Ti- Gleichung
tel „Arithmetical Problems and Recursively Enumerable Predica- übersetzen.“ [124]
tes“ [41]. Darin konnte er zeigen, dass sich jede semi-entscheidbare ⇒ Hilberts zehntes Problem
Relation R(a1 , . . . , an ) in der Form ist unlösbar!
∃ y ∀ (z ≤ y) ∃ x1 . . . ∃ xm p(a1 , . . . , an , y, z, x1 , . . . , xm ) = 0 (5.19)
1984 Jones, Matijasevič:
darstellen lässt. Hierin ist p ein multivariables Polynom mit n+m+2
Unbekannten. Mit dieser Gleichung hatte Davis den Fuß an den „Jede Registermaschine
Rand der Ziellinie gesetzt; lediglich der Quantor ∀ (z ≤ y) hinderte lässt sich exponentiell
ihn daran, sie zu überschreiten. Wäre es Davis gelungen, den All- diophantisch
repräsentieren.“ [101]
quantor zu eliminieren, so hätte er Hilberts zehntes Problem ent-
schieden. In Worten würde Gleichung (5.19) dann besagen, dass für
jede semi-entscheidbare Relation R eine diophantische Gleichung Abbildung 5.37: Sternstunden der Mathe-
konstruiert werden kann, die für (a1 , . . . , an ) ∈ R lösbar und für matik. Seit dem Jahr 1970 wissen wir, dass
(a1 , . . . , an ) ∈ R unlösbar ist. Aus der Tatsache, dass das Haltepro- das zehnte Hilbert’sche Problem keine Lö-
blem semi-entscheidbar ist, ergäbe sich dann in der Tat die Unlös- sung besitzt, und seit 1984 haben wir einen
barkeit des zehnten Hilbert’schen Problems. 1953 schien die Lösung eleganten Beweis dafür in Händen.
318 5 Berechenbarkeitstheorie

Jones, Matijasevič (1984) zum Greifen nahe. Dennoch blieben alle Versuche, den Allquantor
aus Gleichung (5.19) zu eliminieren, zunächst ohne Erfolg.
Registermaschine
I Im Jahr 1961 publizierten Martin Davis, Hilary Putnam und Julia
Robinson eine wegweisende Arbeit mit dem Titel „The Decision
Problem for Exponential Diophantine Equations“ [45]. In dieser Ar-
beit bewiesen die Autoren einen Satz, der heute als Bounded quan-
tifier theorem bekannt ist. Damit konnten sie den Davis’schen All-
quantor tatsächlich eliminieren, doch der Preis dafür war hoch. Die
Reduktion
resultierende Gleichung hatte die Form

Exponentielle
∃ x1 . . . ∃ xm r(a1 , . . . , an , x1 , . . . , xm ) = s(a1 , . . . , an , x1 , . . . , xm )
diophantische
Gleichung wobei r = s keine gewöhnliche diophantische Gleichung mehr war,
sondern eine exponentielle. Im Gegensatz zu gewöhnlichen diophan-
tischen Gleichungen dürfen Variablen hier auch als Exponent ver-
Reduktion
wendet werden. Auch wenn das Ergebnis keinen direkten Rück-
Diophantische schluss auf Hilberts zehntes Problem zuließ, wurde dennoch ein
Gleichung wichtiger Meilenstein erreicht: Davis, Putnam und Robinson hatten
bewiesen, dass kein Entscheidungsverfahren für exponentielle dio-
Matijasevič (1970)
phantische Gleichungen existieren kann.
Abbildung 5.38: Im Jahr 1984 zeigten Jo- I Die Gewissheit, dass auch für gewöhnliche diophantische Gleichun-
nes und Matijasevič, wie sich Registerma- gen kein Entscheidungsverfahren existiert, haben wir seit 1970. In
schinen exponentiell diophantisch repräsen-
diesem Jahr bewies Yuri Matijasevič, dass sich jede exponentielle
tieren lassen. Zusammen mit dem Ergeb-
diophantische Gleichung in eine gewöhnliche diophantische Glei-
nis von Matijasevič aus dem Jahr 1970 er-
gibt sich daraus ein eleganter Beweis für chungen übersetzen lässt (Abbildung 5.38 unten) [124]. Der Beweis
die Unlösbarkeit des zehnten Hilbert’schen ist wenig anschaulich, und wir wollen ihn an dieser Stelle nicht füh-
Problems. ren. Dennoch spielt er in unserer Argumentation eine wichtige Rolle.
Nur mit ihm folgt aus der Unlösbarkeit des Entscheidungsproblems
für exponentielle diophantische Gleichungen auch wirklich die Un-
lösbarkeit des zehnten Hilbert’schen Problems.

I Obwohl das Rätsel im Jahr 1970 gelöst war, verebbte das Interesse
nicht. Der gefundene Beweis war zwar korrekt, dafür aber ungemein
technisch und kompliziert. Im Jahr 1984 publizierten James Jones
und Yuri Matijasevič schließlich einen neuen Beweis für die Un-
entscheidbarkeit exponentieller diophantischer Gleichungen (Abbil-
dung 5.38 oben) [101]. Inhaltlich bewiesen sie das Gleiche wie Da-
vis, Putnam und Robinson etliche Jahre zuvor, erzielten ihr Ergebnis
aber auf verblüffend elegante Weise. Sie fanden heraus, wie sich Re-
gistermaschinen exponentiell diophantisch codieren lassen. Dass es
kein Entscheidungsverfahren für exponentielle diophantische Glei-
chungen geben kann, folgt dann sofort aus der Unentscheidbarkeit
des Halteproblems.
5.4 Folgen für die Mathematik 319

Der Beweis von Jones und Matijasevič besticht so sehr durch seine Klar- I Reduktion von Z auf N
heit und Eleganz, dass er sich zur Untersuchung in diesem Buch gerade- p(x1 , . . . , xm ) = 0
zu aufzwingt. Um ihn im Detail verstehen zu können, müssen wir aber hat eine Lösung in Zm
noch ein wenig Vorarbeit leisten. Zunächst wollen wir klären, wann wir
eine diophantische Gleichung als lösbar erachten. Anders als von Hil- ⇓⇑
bert gefordert, werden wir die Lösungen nicht in den ganzen Zahlen,
sondern in den natürlichen Zahlen suchen. Auf den ersten Blick ma- p(p1 − q1 , . . . , pm − qm ) = 0
chen wir hierdurch einen gewaltigen Fehler. Beispielsweise besitzt die hat eine Lösung in N2m
Gleichung
I Reduktion von N auf Z
(x + 1)3 + (y + 1)3 = (z + 1)3 (5.20)
p(x1 , . . . , xm ) = 0
in den natürlichen Zahlen gar keine, in den ganzen Zahlen dagegen un- hat eine Lösung in Nm
endlich viele Lösungen. Dass wir den Wertebereich dennoch bedenken-
los wechseln dürfen, liegt daran, dass wir nicht an der Lösbarkeit ganz Lagrange1) ⇓⇑ Lagrange1)
bestimmter Gleichungen, sondern an der Existenz von Entscheidungs-
p(w21 + x12 + y21 + z21 , . . . , w2m + xm
2 + y2 + z2 ) = 0
verfahren interessiert sind. Hier gilt, dass wir ein Verfahren für die Lös- m m

barkeit in den ganzen Zahlen dazu verwenden können, um die Lösbar- hat eine Lösung in Z4m
keit in den natürlichen Zahlen zu entscheiden, und umgekehrt. Wie die
Abbildung 5.39: Gegenseitige Reduktion
jeweiligen Problemreduktionen aussehen, ist in Abbildung 5.39 darge- der Entscheidungsprobleme diophantischer
stellt. Eine der vier Schlussrichtungen ist nicht unmittelbar einsichtig. Gleichungen
Um sie zu legitimieren, benötigen wir den berühmten Vier-Quadrate-
Satz von Lagrange, der uns in Abschnitt 3.1.2 bereits begegnet ist. Er 1) „Jede
natürliche Zahl lässt sich als
besagt, dass sich jede natürliche Zahl als die Summe von vier Quadrat- Summe von vier Quadratzahlen
zahlen darstellen lässt (Abbildung 5.40). darstellen.“

Bezogen auf die Beispielgleichung (5.20) bedeutet die Reduktion das


Folgende: Die Frage, ob sie in den ganzen Zahlen lösbar ist, ist äquiva-
lent zur Frage, ob die Gleichung

(p1 − q1 + 1)3 + (p2 − q2 + 1)3 = (p3 − q3 + 1)3

eine Lösung in den natürlichen Zahlen hat. Analog gilt, dass (5.20) ge-
nau dann in den natürlichen Zahlen lösbar ist, wenn es für die Gleichung

(w21 + x12 + y21 + z21 + 1)3 + (w22 + x22 + y22 + z22 + 1)3 =
(w23 + x32 + y23 + z23 + 1)3

eine Lösung in den ganzen Zahlen gibt. Die Frage nach der Existenz Joseph Louis de Lagrange (1736 – 1813)
eines Entscheidungsverfahrens ist damit unabhängig von der konkreten
Wahl des Wertebereichs. Würde ein Verfahren existieren, das für jede Abbildung 5.40: Im Jahr 1770 bewies der
diophantische Gleichung immer korrekt entscheidet, ob sie in den na- französische Mathematiker Joseph Louis de
türlichen Zahlen lösbar ist, so würde auch ein Entscheidungsverfahren Lagrange eine von Bachet de Méziriac im
für die Lösbarkeit in den ganzen Zahlen existieren und umgekehrt. Jahr 1612 geäußerte Vermutung. Sie besagt,
dass sich jede natürliche Zahl als Summe
von vier Quadratzahlen darstellen lässt.
320 5 Berechenbarkeitstheorie

5.4.3.1 Diophantische Repräsentierbarkeit

In diesem Abschnitt wollen wir klären, wie sich Relationen diophan-


tisch repräsentieren lassen. Die Idee, die wir hierbei verfolgen, ist jener
aus Abschnitt 4.2.1 sehr ähnlich. Dort haben wir gezeigt, wie sich Re-
lationen arithmetisch repräsentieren lassen.

Definition 5.10 (Diophantisch repräsentierbare Relationen)

Sei R ⊆ Nn . Die (exponentielle) diophantische Gleichung


p(a1 , . . . , an , x1 , . . . , xm ) = 0
repräsentiert R, wenn sie die folgende Eigenschaft erfüllt:

(a1 , . . . , an ) ∈ R ⇔ p(a1 , . . . , an , x1 , . . . , xm ) = 0 hat eine Lösung

In Worten besagt die Definition das Folgende: Eine Relation R wird


durch die Gleichung p = 0 diophantisch repräsentiert, wenn wir für jede
Kombination (a1 , . . . , an ) ∈ R natürliche Zahlen x1 , . . . , xm finden kön-
nen, mit p(a1 , . . . , an , x1 , . . . , xm ) = 0. Gilt umgekehrt (a1 , . . . , an ) ∈ R,
so darf die Gleichung für keine Kombination von x1 , . . . , xm lösbar sein.
In mathematischer Notation können wir den Sachverhalt so ausdrücken:

R(a1 , . . . , an ) ⇔ ∃ x1 . . . ∃ xm p(a1 , . . . , an , x1 , . . . , xm ) = 0

Jetzt ist klar, wie wir Gleichung (5.19) zu lesen haben. Die von Davis
verwendete Form ist bis auf den zusätzlichen Allquantor mit der hier
präsentierten identisch.

In Abbildung 5.41 sind mehrere diophantisch repräsentierbare Relatio-


nen exemplarisch zusammengefasst. Auch wenn die meisten davon sehr
simpel sind, lässt das letzte aufgeführte Beispiel schon jetzt erahnen,
dass auch komplexe Relationen diophantisch repräsentiert werden kön-
nen. Es handelt sich um eine Gleichung mit 26 Unbekannten, die genau
dann eine Lösung in den positiven natürlichen Zahlen besitzt, wenn die
Zahl k + 2 eine Primzahl ist. [103, 161, 210]

Das Primzahlbeispiel wollen wir nicht vorschnell übergehen. Vielleicht


ist Ihnen aufgefallen, dass sich die abgebildete Gleichung aus insgesamt
14 Teilausdrücken zusammensetzt, die konjunktiv miteinander verbun-
den sind. Streng genommen ist sie damit keine echte diophantische
Gleichung mehr, da sie neben arithmetischen Verknüpfungen auch Lo-
gikoperatoren enthält. Glücklicherweise lassen sich die Operatoren ‚∧‘
5.4 Folgen für die Mathematik 321

Auswahl diophantisch repräsentierbarer Relationen


I „x ist eine gerade natürliche Zahl“ I „k + 2 ist eine Primzahl“ wz + h + j − q = 0 ∧
x−2·y = 0 (gk + 2g + k + 1)(h + j) + h − z = 0 ∧
16(k + 1)3 (k + 2)(n + 1)2 + 1 − f 2 = 0 ∧
I „x ist eine Quadratzahl“ 2n + p + q + z − e = 0 ∧
x − y2 = 0 e3 (e + 2)(a + 1)2 + 1 − o2 = 0 ∧
(a2 − 1)y2 + 1 − x2 = 0 ∧
I „x teilt y“
16r2 y4 (a2 − 1) + 1 − u2 = 0 ∧
x·z−y = 0 n+l +v−y = 0 ∧
(a2 − 1)l 2 + 1 − m2 = 0 ∧
I „x ist größer oder gleich y“
ai + k + 1 − l − i = 0 ∧
y+z−x = 0
((a + u2 (u2 − a))2 − 1)(n + 4dy)2 + 1 − (x + cu)2 = 0 ∧
p + l(a − n − 1) + b(2an + 2a − n2 − 2n − 2) − m = 0 ∧
I „x ist größer als y“
q + y(a − p − 1) + s(2ap + 2a − p2 − 2p − 2) − x = 0 ∧
y+z+1−x = 0
z + pl(a − p) + t(2ap − p2 − 1) − pm = 0

Abbildung 5.41: Auswahl diophantischer repräsentierbarer Relationen. Auch die Menge aller Primzahlen lässt sich diophan-
tisch repräsentieren [210]. Die Zahl k + 2 ist genau dann eine Primzahl, wenn die rechts abgebildete Gleichung eine Lösung in
den positiven natürlichen Zahlen besitzt.

und ‚∨‘ sehr einfach eliminieren, so dass wir sie bedenkenlos innerhalb
von diophantischen Gleichungen verwenden können. Es gelten die fol-
genden Zusammenhänge:

p=0 ∨ q=0 ⇔ p·q = 0 (5.21)


p=0 ∧ q=0 ⇔ p +q = 0
2 2
(5.22)

Als Nächstes definieren wir mit der Maskierungsrelation ‚‘ einen der
Protagonisten im Beweis von Jones und Matijasevič:

Definition 5.11 (Maskierungsrelation ‚‘)

r und s seien natürliche Zahlen mit den Binärdarstellungen


n n
r = ∑ ri 2i (0 ≤ ri ≤ 1), s = ∑ si 2i (0 ≤ si ≤ 1)
i=0 i=0

Die Maskierungsrelation ‚‘ ist wie folgt festgelegt:

r  s :⇔ ri ≤ si für alle i mit 0 ≤ i ≤ n


322 5 Berechenbarkeitstheorie

In Worten drückt r  s aus, dass die i-te Binärstelle von r niemals grö-
ßer ist als die i-te Binärstelle von s. Für den Moment wollen wir an-
nehmen, dass auch die Maskierungsrelation diophantisch repräsentiert
werden kann. Weiter unten werden wir uns davon überzeugen, dass dies
wirklich so ist.

Im Folgenden wird die Maskierungsrelation häufig im Zusammenhang


mit einer speziellen Konstanten auftauchen, die Jones und Matijasevič
mit I bezeichnen. Sie steht stellvertretend für die Zahl
s
Datenflussmatrix I := ∑ Qt = 111...111Q (5.23)
t=0 s + 1 Ziffern

s 2 1 0 t Q ist die Basis von I und wird später passend gewählt werden.
r1,s ... r1,2 r1,1 r1,0 R1
Auf den ersten Blick ist die Bedeutung der Konstanten I schwer zu er-
r2,s ... r2,2 r2,1 r2,0 R2 kennen, da ihr exakter Wert in unserer Betrachtung überhaupt keine
Rolle spielt. Benötigt wird sie ausschließlich aufgrund der speziellen
r3,s ... r3,2 r3,1 r3,0 R3
Struktur ihrer Ziffernfolge; stellen wir I zur Basis Q dar, so entspricht
r4,s ... r4,2 r4,1 r4,0 R4 sie einer Folge von genau s + 1 Einsen.
.. .. .. ..
. . . .
5.4.3.2 Codierung von Registermaschinen
s 2 1 0 t
l1,s ... l1,2 l1,1 l1,0 L1 Jetzt sind wir gewappnet, um die Berechnungssequenz einer Register-
l2,s ... l2,2 l2,1 l2,0 L2 maschine mithilfe einer exponentiellen diophantischen Gleichung zu
codieren. Das Verhalten der Maschine werden wir über die folgenden
l3,s ... l3,2 l3,1 l3,0 L3 Bezeichner erfassen:
l4,s ... l4,2 l4,1 l4,0 L4
r j,t = Inhalt von Register R j zum Zeitpunkt t
.. .. .. .. 
. . . . 1 zum Zeitpunkt t wird die Instruktion L j ausgeführt
l j,t =
0 eine andere Instruktion wird ausgeführt
Kontrollflussmatrix
Die Berechnungssequenz einer Registermaschine können wir mit einer
zweidimensionalen Matrix beschreiben, wie sie in Abbildung 5.42 ge-
Abbildung 5.42: Tabellarische Darstellung
zeigt ist. Die horizontale Achse ist die Zeitachse und erstreckt sich von
der Berechnungssequenz einer Registerma-
schine. Die x-Achse ist die Zeitachse; hier rechts nach links. Vertikal besteht die Darstellung aus zwei Teilmatri-
hält die Tabelle für jeden Berechnungs- zen. Die Datenflussmatrix (oben) hält für jedes Register eine eigene
schritt eine separate Spalte vor. Für jedes Zeile vor und beschreibt, wie sich die Registerinhalte über die Zeit ver-
Register und jede Instruktion existiert ei- ändern. In der Kontrollflussmatrix (unten) existiert für jede Instruktion
ne eigene Zeile. In den Zeilen der Daten- eine eigene Zeile. Dort ist mit einer 1 bzw. einer 0 vermerkt, ob die
flussmatrix ist vermerkt, wie sich die Inhal- Instruktion gegenwärtig ausgeführt wird oder nicht.
te der Register ändern. Die Zeileneinträge
der Kontrollflussmatrix enthalten entweder In Abbildung 5.43 (oben) ist die vollständig ausgefüllte Daten- und
den Wert 1 oder 0. Eine 1 bedeutet, dass die Kontrollflussmatrix für das Registermaschinenprogramm aus Abbil-
Instruktion ausgeführt wird. dung 5.16 zu sehen. Die Maschine wird mit der Eingabe R1 = 2 gestartet
5.4 Folgen für die Mathematik 323

23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 t
1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 2 2 2 R1 Registerinhalt
0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 R2 Registerinhalt
0 0 0 0 1 1 2 2 2 2 2 1 1 0 0 0 0 1 1 1 1 1 0 0 R3 Registerinhalt
0 0 0 0 0 0 0 0 0 0 0 1 1 2 2 1 1 1 0 0 0 0 0 0 R4 Registerinhalt
0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 R5 Registerinhalt
23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 t
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 L1 if R1 = 0 goto L20
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 L2 R2 ← R2 + 1, R3 ← R3 + 1
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 L3 R1 ← R1 − 1
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 L4 if R1 = 0 goto L16
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 L5 R1 ← R1 − 1
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 L6 R4 ← R4 + 1, R5 ← R5 + 1
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 L7 R3 ← R3 − 1
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 L8 if R3 = 0 goto L6
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 L9 R4 ← R4 + 1, R2 ← R2 − 1
0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 L10 if R2 = 0 goto L9
0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 L11 R3 ← R3 + 1, R4 ← R4 − 1
0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 L12 if R4 = 0 goto L11
0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 L13 R2 ← R2 + 1, R5 ← R5 − 1
0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 L14 if R5 = 0 goto L13
0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 L15 if R1 = 0 goto L5
0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 L16 R3 ← R3 − 1
0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 L17 if R3 = 0 goto L16
0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 L18 R2 ← R2 − 1, R1 ← R1 + 1
0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 L19 if R2 = 0 goto L18
1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 L20 stop

Q − 22+s+20 = 0 ∧ 1 + (Q − 1) · I = Qs+1 ∧ Qs = L20 ∧ R1  (Q/2 − 1)I ∧ R2  (Q/2 − 1)I ∧ R3  (Q/2 − 1)I ∧


R4  (Q/2 − 1)I ∧ R5  (Q/2 − 1)I ∧ R1 = QR1 + QL18 − QL3 − QL5 + 2 − y · Qs+1 ∧ R2 = QR2 + QL2 + QL13 −
QL9 − QL18 ∧ R3 = QR3 + QL2 + QL11 − QL7 − QL16 ∧ R4 = QR4 + QL6 + QL9 − QL11 ∧ R5 = QR5 + QL6 − QL13
∧ L1  I ∧ L2  I ∧ L3  I ∧ L4  I ∧ L5  I ∧ L6  I ∧ L7  I ∧ L8  I ∧ L9  I ∧ L10  I ∧ L11  I ∧
L12  I ∧ L13  I ∧ L14  I ∧ L15  I ∧ L16  I ∧ L17  I ∧ L18  I ∧ L19  I ∧ L20  I ∧ I = L1 + L2 +
L3 + L4 + L5 + L6 + L7 + L8 + L9 + L10 + L11 + L12 + L13 + L14 + L15 + L16 + L17 + L18 + L19 + L20 ∧ 1  L1 ∧
Q · L1  L20 + L2 ∧ Q · L1  L2 + Q · I − 2R1 ∧ Q · L2  L3 ∧ Q · L3  L4 ∧ Q · L4  L16 + L5 ∧ Q · L4  L5 + Q · I − 2R1
∧ Q · L5  L6 ∧ Q · L6  L7 ∧ Q · L7  L8 ∧ Q · L8  L6 + L9 ∧ Q · L8  L6 + Q · I − 2R3 ∧ Q · L9  L10 ∧ Q · L10 
L9 + L11 ∧ Q · L10  L9 + Q · I − 2R2 ∧ Q · L11  L12 ∧ Q · L12  L11 + L13 ∧ Q · L12  L11 + Q · I − 2R4 ∧ Q · L13  L14
∧ Q · L14  L13 + L15 ∧ Q · L14  L13 + Q · I − 2R5 ∧ Q · L15  L5 + L16 ∧ Q · L15  L5 + Q · I − 2R1 ∧ Q · L16  L17 ∧
Q · L17  L16 + L18 ∧ Q · L17  L16 + Q · I − 2R3 ∧ Q · L18  L19 ∧ Q · L19  L18 + L20 ∧ Q · L19  L18 + Q · I − 2R2 ∧

Abbildung 5.43: Codierte Berechnungssequenz der hier besprochenen Beispielmaschine für die Eingabe R1 = 2
324 5 Berechenbarkeitstheorie

und terminiert nach 23 Schritten. Die so entstandene Berechnungsse-


quenz kennen wir bereits; sie ist die gleiche, die wir in Abschnitt 5.1.2
verwendet haben, um das Verhalten von Registermaschinen zu erklä-
ren. Lediglich die Darstellung ist eine andere. In Abbildung 5.17 hatten
wir das Verhalten noch mithilfe eines gewöhnlichen Ablaufprotokolls
analysiert.

Um die Berechnungssequenz einer Registermaschine diophantisch zu


codieren, stellen wir zunächst jede Zeile der Datenflussmatrix und der
Registermaschine terminiert Kontrollflussmatrix durch eine Zahl zur Basis Q dar. Dabei verfolgen
unter Eingabe von x wir die Idee, den Eintrag in der t-ten Spalte in die t-te Ziffer hineinzu-
codieren:
⇓⇑ s
Q
Es existiert eine Lösung für Rj = ∑ r j,t Qt , 0 ≤ r j,t <
2
(5.24)
p (Q, I, s, x, y, R1,..., Rr, L1,..., Ll ) = 0 t=0
s
… … Lj = ∑ l j,t Qt , 0 ≤ l j,t ≤ 1 (5.25)
t=0
Kontrollfluss
Datenfluss In diesen Gleichungen ist s die Anzahl der Berechnungsschritte, durch-
Ausgabe geführt von einer Maschine mit den Registern R1 , . . . , Rr und den Code-
Eingabe Zeilen L1 , . . . , Ll . Damit die Codierung funktioniert, muss Q eine Zwei-
Anzahl Schritte erpotenz sein und so groß gewählt werden, dass alle darzustellenden
111...111Q Werte in eine einzige Ziffer hineinpassen. Insbesondere müssen wir
2x+s+l (Basis) auch darauf achten, dass bei der Verrechnung zweier Werte keine Über-
läufe zwischen den einzelnen Ziffern generiert werden. Auf der siche-
Abbildung 5.44: Codierung von Register- ren Seite sind wir, wenn der Wert von Q für eine Registermaschine mit
maschinen mithilfe exponentieller diophan- r Registern, l Code-Zeilen und der Eingabe x folgendermaßen gewählt
tischer Gleichungen. wird [101]:
Q = 2x+s+l (5.26)
Die Forderung, dass die Ziffern r j,t nicht den vollen Bereich 0 bis Q−1,
sondern nur den Bereich 0 bis Q2 − 1 ausschöpfen dürfen, wird weiter
unten wichtig werden. Wir benötigen sie, damit die Modellierung der
bedingten Verzweigungsbefehle korrekt funktioniert.
Wir werden nun daran gehen, die gesuchte diophantische Gleichung
aufzustellen. Wie in Abbildung 5.44 gezeigt, wird sie die Variablen

Q, I, s, x, y, R1 , . . . , Rr , L1 , . . . , Ll

enthalten und für einen festgelegten Wert von x genau dann lösbar sein,
wenn die codierte Registermaschine unter Eingabe von x terminiert. Es
gilt sogar noch mehr: Haben wir eine konkrete Lösung in Händen, so
können wir daraus die vollständige Berechnungssequenz rekonstruie-
ren. In diesem Fall gilt:
5.4 Folgen für die Mathematik 325

I I und Q besitzen die in (5.23) und (5.26) angegebenen Werte, Q2 Q1 Q0

I die Registermaschine terminiert nach s Schritten, I= 0 0 0 0 0 1 0 0 1

I im Ausgaberegister R1 steht am Ende der Berechnung der Wert y, ⇓⇑


2
Q Q1 Q0
I R j codiert den Datenfluss, wie er in (5.24) festgelegt ist,
1= 0 0 0 0 0 0 0 0 1
I L j codiert den Kontrollfluss, wie er in (5.25) festgelegt ist.
+(Q − 1)I= 0 0 0 1 1 1 1 1 1

Wir werden nun eine Reihe von diophantischen Gleichungen formulie-


= Qs+1 = 0 0 1 0 0 0 0 0 0
ren, mit denen sich die genannten Eigenschaften erzwingen lassen:
Abbildung 5.45: Visualisierung der Glei-
I Dass Q und I die gewünschten Werte erhalten, können wir folgen- chung (5.27) für den Fall Q = 8 und s = 1.
dermaßen sicherstellen: Die einzelnen Ziffern sind hier im Binär-
system dargestellt. Die Ziffernwerte liegen
Q − 2x+s+l = 0 ∧ 1 + (Q − 1) · I = Qs+1 (5.27) zwischen 0 und 7 und sind deshalb 3 Bits
breit.
Abbildung 5.45 demonstriert an einem konkreten Beispiel, auf wel-
che Weise Gleichung (5.27) den gewünschten Wert von I erzwingt.

I Um die Terminierung der Registermaschine zu beschreiben, fordern


wir, dass nach s Berechnungsschritten die Instruktion stop ausge-
führt wird. Hierzu verwenden wir eine Gleichung der Form
Q2 Q1 Q0

Q = ∑ Lk ,
s
Q: 0 0 0 0 0 1 0 0 0
k
Q2 Q1 Q0
wobei die Summe über alle Zeilen der Form Lk : stop iteriert. Q
: 0 0 0 0 0 0 1 0 0
2
I Um den Datenfluss adäquat zu beschreiben, fordern wir zunächst, Q2 Q1 Q0
dass die Variablen R j die in (5.24) vereinbarte Form besitzen. Mit- Q
2 −1 : 0 0 0 0 0 0 0 1 1
hilfe der Maskierungsrelation gelingt dies folgendermaßen (Abbil-
dung 5.46): Q2 Q1 Q0
Q
R j  ( − 1)I ( Q2 − 1) · I : 0 1 1 0 1 1 0 1 1
2
Ferner fügen wir für jedes Register eine eigene Registergleichung
R j  ( Q2 − 1)I
(register equation) hinzu, die beschreibt, wie sich der Registerinhalt
über die Zeit verändert. Diese Gleichungen lauten folgendermaßen: Q2 Q1 Q0

R1 = QR1 + ∑ QLk − ∑ QLi + x − y · Qs+1 (5.28) Rj : 0 ? ? 0 ? ? 0 ? ?


k i
R j = QR j + ∑ QLk − ∑ QLi (2 ≤ j ≤ r) (5.29) r j,2 r j,1 r j,0

k i
Abbildung 5.46: R j  ( Q2 − 1)I stellt si-
Die erste Summe iteriert über alle Zeilen der Form Lk : R j ← R j + 1 cher, dass in jeder Ziffer r j,t das höchstwer-
und die zweite Summe über alle Zeilen der Form Li : R j ← R j − 1. tige Bit gleich 0 ist.
326 5 Berechenbarkeitstheorie

I Li : R j ← R j + 1, Li : R j ← R j − 1 Erstere führen zu einer Erhöhung des j-ten Registers und letztere zu


Q2 Q1 Q0 einer Erniedrigung. Die Gleichungen codieren zudem die Start- und
Li : 0 0 0 0 0 1 0 0 0 die Endkonfiguration. Sie sind so angelegt, dass die am weitesten
rechts stehende Ziffer in R1 gleich x und in R2 , . . . , Rr gleich 0 ist.
li,2 li,1 li,0
Ferner muss die Ziffer an der Position s + 1 in R1 gleich y und in
R2 , . . . , Rr gleich 0 sein.

Q2 Q1 Q0
I Um den Programmablauf korrekt zu beschreiben, fordern wir, dass
die Elemente der Kontrollflussmatrix ausschließlich die Werte 0 und
Q · Li : 0 0 1 0 0 0 0 0 0
1 annehmen können und die Programmausführung mit der Instruk-
tion L1 beginnt:
li,1 li,0

Q · Li  Li+1 L1  I ∧ . . . ∧ Ll  I ∧ 1  L1
Q2 Q1 Q0
Darüber hinaus müssen wir sicherstellen, dass zu jedem Zeitpunkt
Li+1 : ? ? 1 ? ? ? ? ? ? genau eine Instruktion ausgeführt wird. Dies ist genau dann der Fall,
wenn in jeder Spalte der Kontrollflussmatrix genau eine 1 vorhanden
li+1,2 li+1,1 li+1,0 ist:
l
I = ∑ Li
I Li : goto Ln i=1
Q2 Q1 Q0
Zusätzlich müssen wir mehrere Gleichungen formulieren, die den
Li : 0 0 0 0 0 1 0 0 0 Übergang von einer Konfiguration in die nächste festlegen. Für
nichtverzweigende Instruktionstypen lassen sie sich recht einfach
li,2 li,1 li,0 niederschreiben (Abbildung 5.47):

Q2 Q1 Q0 Li : R j ← R j + 1 : Q · Li  Li+1
Q · Li : 0 0 1 0 0 0 0 0 0 Li : R j ← R j − 1 : Q · Li  Li+1
Li : goto Ln : Q · Li  Ln
li,1 li,0

Q · L i  Ln Die Sprungbefehle Li : if R j = 0 goto Ln und Li : if R j = 0 goto Ln er-


fordern mehr Aufmerksamkeit. Dass die Programmausführung ent-
Q2 Q1 Q0 weder in Zeile n oder in Zeile i+1 fortgesetzt wird, können wir noch
Ln : ? ? 1 ? ? ? ? ? ? vergleichsweise einfach formulieren:

ln,2 ln,1 ln,0 Q · Li  Ln + Li+1

Abbildung 5.47: Modellierung des Kon- Jetzt müssen wir noch sicherstellen, dass immer die korrekte Folge-
trollflusses mithilfe der Maskierungsrelati- instruktion ausgeführt wird. Um zu sehen, wie dies gelingen kann,
on ‚‘ betrachten wir den Ausdruck

Q·I −2·Rj

Abbildung 5.48 zeigt, welches Bitmuster entsteht, wenn wir die Sub-
traktion im Binärsystem durchführen. Wichtig an dieser Stelle ist,
5.4 Folgen für die Mathematik 327

I Schema Wegen ri, t < 2


Q I Beispiel 1: r j,3 = 2, r j,2 = 1, r j,1 = 2, r j,0 = 1
und der Multiplikation mit 2
Q · I 0001 0001 0001 0001 0000
sind diese Bits gleich 0.
−2R j 0100 0010 0100 0010
0001 1001 1101 1001 110
Q2 Q1 Q0 = 0000 1100 1110 1100 1110
QI 0 0 0 1 0 0 0 1 0 0 0 0
I Beispiel 2: r j,3 = 2, r j,2 = 1, r j,1 = 0, r j,0 = 0
- 2Rj 0 0 0 0 ? ? ? 0 ? ? ? 0
Q · I 0001 0001 0001 0001 0000
? (Übertrag) ? (Übertrag)
−2R j 0100 0010 0000 0000
1 1001 1100 0000 000
= 0000 1100 1111 0001 0000
= ? ? ? ? ? ? ? ? ?
I Beispiel 3: r j,3 = 0, r j,2 = 0, r j,1 = 1, r j,0 = 2

Q · I 0001 0001 0001 0001 0000


⎧ 0 falls ri, t- = 0
=⎨ 1 −2R j 0000 0000 0010 0100
⎩ 1 falls ri, t-1 ≠ 0 ⎧ 1 falls ri, t- = 0
1 0000 0001 1101 10
=⎨
⎩ 0 falls ri, t-1 ≠ 0 = 0001 0001 0000 1110 1100

Abbildung 5.48: Die Bedeutung der Formel Q · I − 2 · R j . Das am weitesten rechts stehende Bit der t-ten Ziffer zeigt an, ob der
Registerinhalt R j zum Zeitpunkt t − 1 gleich oder ungleich 0 ist.

dass wir in Gleichung (5.24) gefordert haben, dass die Ziffern r j,t
allesamt die Bedingung r j,t < Q2 erfüllen. Das hat zur Folge, dass
wir den Wert R j mit 2 multiplizieren können, ohne zwischen den
Ziffern Überläufe zu generieren. Somit sind alle Ziffern von 2 · R j
gerade, oder anders formuliert: In allen Ziffern von 2 · R j ist das am
weitesten rechts stehende Bit gleich 0. Dies wiederum hat zur Fol-
ge, dass die Subtraktion Q · I − 2 · R j genau dann ein Übertragsbit
von einem Binärpaket auf das nächste generiert, wenn das Regis-
ter R j einen Wert = 0 enthält. Das bedeutet, dass wir am Bitmuster
von Q · I − 2 · R j ablesen können, ob der Inhalt von Register R j zum
Zeitpunkt t gleich oder ungleich 0 ist. Hierzu müssen wir lediglich
die Ziffer mit der Wertigkeit Qt+1 betrachten. Ist das am weitesten
rechts stehende Bit dieser Ziffer gleich 1, so ist r j,t = 0, ansonsten
ist r j,t = 0.
Damit können wir das Verhalten der bedingten Sprungbefehle wie
folgt charakterisieren:
Li : if R j = 0 goto Ln : Q · Li  Ln + Li+1 ∧
Q · Li  Li+1 + Q · I − 2R j
328 5 Berechenbarkeitstheorie

r=0
s=0 rs r=1
s=1 rs rs r=2
s=2 r  s r  s r  s r = 3
s=3 rs rs rs rs r=4
s=4 r  s r  s r  s r  s r  s r = 5
s=5 r  s r  s r  s r  s r  s r  s r = 6
s=6 r  s r  s r  s r  s r  s r  s r  s r = 7
s=7 rs rs rs rs rs rs rs rs r=8
s=8 r  s r  s r  s r  s r  s r  s r  s r  s r  s r = 9
s=9 r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r = 10
s = 10 r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r = 11
s = 11 r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r = 12
s = 12 r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r = 13
s = 13 r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r = 14
s = 14 r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r = 15
s = 15 r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s r  s

Abbildung 5.49: Ordnen wir die Kombinationen von r und s mit r  s zweidimensional an, so entsteht die fraktale Struktur
des Sierpinski-Dreiecks. Die Werte von s sind zeilenweise aufgetragen. Die Werte von r befinden sich auf den nach unten links
verlaufenden Diagonalen.

Li : if R j = 0 goto Ln : Q · Li  Ln + Li+1 ∧
Q · Li  Ln + Q · I − 2R j

Fügen wir alle Bausteine zusammen, so haben wir die Ziellinie fast er-
reicht. Wir erhalten eine diophantische Gleichung, die genau dann eine
Lösung in den natürlichen Zahlen besitzt, wenn die codierte Register-
maschine für die gewählte Eingabe terminiert. Wie die Formel für un-
sere konkrete Beispielmaschine aussieht, ist im unteren Teil von Abbil-
dung 5.43 zu sehen.

Nur noch ein einziges Puzzle-Stück fehlt in unserem Beweis. Wir sind
bisher davon ausgegangen, dass sich die Maskierungsrelation ‚‘ dio-
phantisch repräsentieren lässt, haben dafür aber noch keine Begründung
geliefert. Dies wollen wir jetzt nachholen.
5.4 Folgen für die Mathematik 329

Als erstes wollen wir klären, für welche konkreten Werte von r und s
die Beziehung r  s erfüllt ist und für welche nicht. Wir unterscheiden
zwei Fälle:

I 1. Fall: r > s: An mindestens einer Bitstelle hat r den Wert 1 und s


an der gleichen Bitstelle den Wert 0. Es gilt daher immer r  s.

I 2. Fall: r ≤ s: Für manche Kombinationen gilt r  s, für andere nicht.


Die genaue Verteilung ist in Abbildung 5.49 dargestellt.

Die Struktur aus Abbildung 5.49 ist in der Mathematik keine Unbekann-
te. Wir haben das sogenannte Sierpinski-Dreieck vor uns, benannt nach
dem polnischen Mathematiker Wacław Sierpiński (Abbildung 5.50). Im
Bereich der fraktalen Geometrie wird das Dreieck gern verwendet, um
das Prinzip der Selbstähnlichkeit zu demonstrieren. Grob gesprochen
ist ein Objekt genau dann selbstähnlich, wenn es als Ganzes die gleiche
Struktur aufweist wie seine Teile. Am Beispiel des Sierpinski-Dreiecks
lässt sich die Eigenschaft gut erkennen. Trennen wir eines der drei Teil-
dreiecke heraus, so erhalten wir erneut ein Sierpinski-Dreieck, das in
seiner Struktur dem ursprünglichen gleicht.

Das Sierpinski-Dreieck ist eng mit dem Pascal’schen Dreieck verwandt,


das in der oberen Hälfte von Abbildung 5.51 dargestellt ist. Die Einträge
des Pascal’schen Dreiecks lassen sich auf einfache Weise berechnen,
indem die Randzellen zunächst mit dem Wert 1 gefüllt werden. Der
Wert einer inneren Zelle entspricht dann ganz einfach der Summe der
beiden darüber liegenden Werte.

Das Pascal’sche Dreieck hat eine ganz praktische Bedeutung. Die Zelle
in Zeile s und Spalte r enthält den Wert des Binomialkoeffizienten
!
s
r Wacław Sierpiński (1882 – 1969)
Diese Eigenschaft folgt sofort aus der vereinbarten Konstruktionsvor- Abbildung 5.50: Im Jahr 1915 beschrieb
schrift und der bekannten Gleichung der polnische Mathematiker Wacław Sier-
! ! ! piński jenes Fraktal, das wie heute als
s+1 s s Sierpinski-Dreieck bezeichnen [176]. Im
= +
r+1 r r+1 Bereich der fraktalen Geometrie wird es
gerne dazu verwendet, um den Begriff der
Für unsere Zwecke wird das Pascal’sche Dreieck interessant, wenn wir Selbstähnlichkeit zu erklären.
seine Einträge modulo 2 betrachten. Jede gerade Zahl wird dann zu ei-
ner 0 und jede ungerade Zahl zu einer 1. Die untere Hälfte von Ab-
bildung 5.51 zeigt, dass wir auf diese Weise genau jene Struktur er-
halten, nach der wir suchen; wir erhalten das Sierpinski-Dreieck aus
330 5 Berechenbarkeitstheorie

r=0
s=0 1 r=1
s=1 1 1 r=2
s=2 1 2 1 r=3
s=3 1 3 3 1 r=4
s=4 1 4 6 4 1 r=5
s=5 1 5 10 10 5 1 r=6
s=6 1 6 15 20 15 6 1 r=7
s=7 1 7 21 35 35 21 7 1 r=8
s=8 1 8 28 56 70 56 28 8 1 r=9
s=9 1 9 36 84 126 126 84 36 9 1 r = 10
s = 10 1 10 45 120 210 252 210 120 45 10 1 r = 11
s = 11 1 11 55 165 330 462 462 330 165 55 11 1 r = 12
s = 12 1 12 66 220 495 792 924 792 495 220 66 12 1 r = 13
s = 13 1 13 78 286 715 1287 1716 1716 1287 715 286 78 13 1 r = 14
s = 14 1 14 91 364 1001 2002 3003 3432 3003 2002 1001 364 91 14 1 r = 15
s = 15 1 15 105 455 1365 3003 5005 6435 6435 5005 3003 1365 455 105 15 1
r=0
s=0 1 r=1
s=1 1 1 r=2
s=2 1 0 1 r=3
s=3 1 1 1 1 r=4
s=4 1 0 0 0 1 r=5
s=5 1 1 0 0 1 1 r=6
s=6 1 0 1 0 1 0 1 r=7
s=7 1 1 1 1 1 1 1 1 r=8
s=8 1 0 0 0 0 0 0 0 1 r=9
s=9 1 1 0 0 0 0 0 0 1 1 r = 10
s = 10 1 0 1 0 0 0 0 0 1 0 1 r = 11
s = 11 1 1 1 1 0 0 0 0 1 1 1 1 r = 12
s = 12 1 0 0 0 1 0 0 0 1 0 0 0 1 r = 13
s = 13 1 1 0 0 1 1 0 0 1 1 0 0 1 1 r = 14
s = 14 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 r = 15
s = 15 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

Abbildung 5.51: Berechnen wir alle Koeffizienten modulo 2, so entsteht aus dem Pascal’schen Dreieck das Sierpinski-Dreieck.
5.4 Folgen für die Mathematik 331

I Darstellung zur Basis 10

(10 + 1)0 = 1 · 100


(10 + 1)1 = 1 · 101 + 1 · 100
(10 + 1)2 = 1 · 102 + 2 · 101 + 1 · 100
(10 + 1)3 = 1 · 103 + 3 · 102 + 3 · 101 + 1 · 100
(10 + 1)4 = 1 · 104 + 4 · 103 + 6 · 102 + 4 · 101 + 1 · 100
Ab (10 + 1)5 ist die Basis 10 zu klein. Es entstehen Ziffernüberläufe.
Abbildung 5.52: Jede Zeile des Pas-
I Darstellung zur Basis 16
cal’schen Dreiecks können wir als die
Ziffernfolge der Zahl (u + 1)s auffassen,
(16 + 1)0 = 1 · 160
wenn wir die Basis u hinreichend groß
(16 + 1)1 = 1 · 161 + 1 · 160 wählen. Die beiden nebenstehenden Bei-
spiele zeigen, dass die Basis 10 ausreicht,
(16 + 1)2 = 1 · 162 + 2 · 161 + 1 · 160
um die ersten 5 Zeilen zu beschreiben; erst
(16 + 1)3 = 1 · 163 + 3 · 162 + 3 · 161 + 1 · 160 in der sechsten Zeile entstehen Überläu-
fe. Gehen wir zur Basis 16 über, so wird
(16 + 1)4 = 1 · 164 + 4 · 163 + 6 · 162 + 4 · 161 + 1 · 160 auch die sechste Zeile korrekt dargestellt.
(16 + 1)5 = 1 · 165 + 5 · 164 + 10 · 163 + 10 · 162 + 5 · 161 + 1 · 160 Wollen wir zusätzlich auch die siebte Zei-
le erfassen, so müssen wir die Basis erneut
Ab (16 + 1)6 ist die Basis 16 zu klein. Es entstehen Ziffernüberläufe. vergrößern.

Abbildung 5.49. Damit haben wir es geschafft, einen elementaren Zu-


sammenhang zwischen der Eigenschaft r  s und den Elementen des
Pascal’schen Dreiecks herzustellen: r  s gilt genau dann, wenn das
Pascal’sche Dreieck in Zeile s und Spalte r eine ungerade Zahl enthält:
!
s
rs ⇔ ist eine ungerade Zahl (5.30)
r

Nun gilt nach dem binomischen Lehrsatz das Folgende:


s !
s r
(u + 1)s = ∑ u
r=0 r

Das bedeutet, dass wir jede Zeile des Pascal’schen Dreiecks als die Zif-
fernfolge der Zahl (u + 1)s betrachten können, wenn wir die Basis u
hinreichend groß wählen (Abbildung 5.52). Da die Binomialkoeffizien-
ten die bekannte Beziehung
s !
s
∑ r = 2s
r=0
332 5 Berechenbarkeitstheorie

erfüllen, sind wir auf der sicheren Seite, wenn wir für u den Wert 2s + 1
wählen.

Damit sind wir in der Lage, die Binomialkoeffizienten exponentiell dio-


phantisch zu erfassen. Es gilt:
!
s
m= ⇔ u = 2s + 1 und m ist die r-te Ziffer von (u + 1)s
r


⎪ ∃ u ∃ w ∃ v u = 2s + 1 ∧

(u + 1)s = vur+1 + mur + w ∧
⇔ (5.31)

⎪ w < ur ∧

m<u

Jetzt können wir auch die Beziehung (5.30) problemlos umschreiben.


Hierzu müssen wir (5.31) nur geringfügig ergänzen:


⎪ ∃ m ∃ z ∃ u ∃ w ∃ v u = 2s + 1 ∧


⎨ (u + 1)s = vur+1 + mur + w ∧
rs ⇔ w < ur ∧ (5.32)



⎪ m < u ∧

m = 2z + 1

Voilà: Die Maskierungsrelation ‚‘ ist exponentiell diophantisch re-


präsentierbar. Damit ist die letzte Beweislücke geschlossen; wir wis-
sen nun, dass sich jede Berechnungssequenz einer Registermaschine als
exponentielle diophantische Gleichung codieren lässt. Aus der Unent-
scheidbarkeit des Halteproblems folgt jetzt unmittelbar

Satz 5.9 (Jones, Matijasevič, 1984)

Es gibt kein Entscheidungsverfahren für exponentielle diophanti-


sche Gleichungen.

Kombinieren wir den Satz mit dem Ergebnis von Matijasevič aus dem
Jahr 1970, so erhalten wir das, was wir in diesem Abschnitt gesucht
haben: Die Antwort auf Hilberts zehntes Problem.

Korollar 5.3

Das zehnte Hilbert’sche Problem hat keine Lösung.


5.5 Übungsaufgaben 333

5.5 Übungsaufgaben

Die Instruktionsmengen zweier Turing-Maschinen M1 und M2 seien wie folgt gegeben: Aufgabe 5.1

I1 := {(q1 , S0 , S1 , R, q2 ), (q2 , S0 , S0 , R, q3 ), (q3 , S0 , S2 , R, q1 )} Webcode
I2 := {(q1 , S0 , S1 , R, q2 ), (q2 , S0 , S0 , R, q3 ), (q3 , S0 , S2 , R, q1 ), (q4 , S0 , S0 , R, q1 )} 5089

a) Erzeugen Sie die Standardbeschreibungen von M1 und M2 .


b) Analysieren Sie das Verhalten der Maschinen. Welche Unterschiede fallen Ihnen auf?

In Abbildung 5.12 ist die Instruktionstabelle von Turings historischer universal machine Aufgabe 5.2
dargestellt. Unter anderem wird dort die folgende Teilmaschine definiert: 
⎧ Webcode
⎨ Not A R, R con(C, α)
con(C, α)
5743
⎩ A L, Pα, R con1 (C, α)


⎪ A R, Pα, R con1 (C, α)


con1 (C, α) D R, Pα, R con2 (C, α)



⎩ None PD, R, Pα, R, R, R C

⎨ C R, Pα, R con2 (C, α)
con2 (C, α)
⎩ Not C R, R C

Wird die Maschine in der Konfiguration

... ;  D  A  D  D  C  R  D  A  A

gestartet, so terminiert sie nach 10 Berechnungsschritten, und der Schreib-Lese-Kopf steht


an der folgenden Bandposition:

...

a) Tragen Sie den produzierten Bandinhalt in die Abbildung ein.


b) Welche Teilaufgabe könnte die Maschine in Turings Gesamtkonstruktion erfüllen?
334 5 Berechenbarkeitstheorie

Aufgabe 5.3 Damit eine Turing-Maschine von einer universellen Maschine simuliert werden kann, muss
 sie in geeigneter Weise codiert werden. In dieser Aufgabe geht es um die Codierung, die
Webcode Turing in seiner Arbeit aus dem Jahr 1936 vorgeschlagen hat.
5272
Bewerten Sie die folgenden Aussagen: wahr falsch

I Jede natürliche Zahl ist die Gödelnummer einer Maschine.

I Die Codierung ist injektiv.

I Die Codierung ist surjektiv.

I Die Codierung ist bijektiv.

Aufgabe 5.4 Wir haben gezeigt, dass sich eine Turing-Maschine oder eine Registermaschine auf zwei
 Arten nutzen lässt: als Transduktor oder als Akzeptor. Für eine Funktion f : N → N bedeutet
Webcode dies das Folgende: Als Transduktor nimmt die Registermaschine x als Eingabe entgegen und
5543 produziert y als Ausgabe. Als Akzeptor nimmt sie das Tupel (x, y) entgegen und akzeptiert
die Eingabe genau dann, wenn x und y die Beziehung f (x) = y erfüllen.

Ziel dieser Aufgabe ist es, einen Zusammenhang zwischen diesen Begriffen herzustellen.

a) Kann eine berechnende Maschine eine akzeptierende Maschine simulieren?


b) Kann eine akzeptierende Maschine eine berechnende Maschine simulieren?

Aufgabe 5.5 In Abschnitt 5.1.2 haben Sie eine Registermaschine kennen gelernt, die von James P. Jones
 und Yuri Matijasevič im Jahr 1991 entworfen wurde [102]. Hierbei handelte es sich um einen
Webcode Transduktor, der in Register R1 die Eingabe x entgegennimmt und dort auch die Ausgabe
5781 f (x) ablegt. Anhand des Ablaufprotokolls aus Abbildung 5.17 konnten Sie einen Eindruck
gewinnen, wie sich die Maschine für den Fall R1 = 2 verhält. Nach 23 Schritten hielt sie an
und hinterließ in R1 den Ergebniswert 1.

a) Vervollständigen Sie die nachstehende Liste, indem Sie den Ablauf für weitere Eingaben
simulieren:

f (0) = , f (1) = , f (2) = 1 , f (3) = , f (4) = , f (5) =

b) Welche bekannte Zahlenfolge wird durch die Registermaschine berechnet?


5.5 Übungsaufgaben 335

Alle diskutierten Registermaschinen waren mit drei Sprungbefehlen ausgestattet: Aufgabe 5.6

I Li : goto Ln I Li : if R j = 0 goto Ln I Li : if R j = 0 goto Ln Webcode
a) Ist es möglich, damit den folgenden erweiterten Sprungbefehl zu implementieren? 5696

Li : if R j = 0 goto Ln else goto Lm

b) Ändert sich die Ausdrucksstärke des Maschinenmodells, wenn wir uns auf den Sprungbe-
fehl Li : if R j = 0 goto Ln beschränken?

In dieser Aufgabe sollen Sie sich mit dem zellulären Automaten beschäftigen, der über das Aufgabe 5.7
folgende Regelschema definiert ist: 
Webcode
Regel 1 Regel 2 Regel 3 Regel 4 Zustand 5742

Linker Rechter
Nachbar Nachbar
Regel 5 Regel 6 Regel 7 Regel 8

Folgezustand

Welche Ihnen bekannte Struktur wird durch diesen Automaten erzeugt? Vervollständigen Sie
zur Beantwortung dieser Frage das folgende Diagramm. Die ersten drei Zeilen sind bereits
ausgefüllt.
336 5 Berechenbarkeitstheorie

Aufgabe 5.8 In dieser Aufgabe geht es um die folgende Turing-Maschine:



Webcode Q = {q1 , q2 , q3 , q4 , q5 , q6 }
5911 S = {0, 1}
I = {(q1 , 0, 1, R, q2 ), (q2 , 0, 1, R, q3 ), (q3 , 0, 1, R, q4 ), (q4 , 0, 1, L, q1 ), (q5 , 0, 1, R, q6 ),
(q1 , 1, 1, L, q3 ), (q2 , 1, 1, R, q2 ), (q3 , 1, 0, L, q5 ), (q4 , 1, 1, L, q4 ), (q5 , 1, 0, L, q1 )}

a) Vervollständigen Sie den nachstehend abgedruckten Simulationslauf.

0 0 0 0 0 0 0 0 0 0
!q1 " !__"

0 0 0 0 1 0 0 0 0 0
!q2 " !__"

0 0 0 0 1 1 0 0 0 0
!q3 " !__"

!__" !__"

!__" !__"

!__" !__"

!__" !__"

!__" !__"

!__" !__"

b) Recherchieren Sie, welche bekannte Turing-Maschine wir hier vor uns haben. Wird die
Maschine irgendwann terminieren?
5.5 Übungsaufgaben 337

In Definition 5.7 haben wir vereinbart, dass eine Menge N genau dann aufzählbar ist, wenn Aufgabe 5.9
eine surjektive und berechenbare Funktion f : N → N existiert. Welche Konsequenzen 
ergeben sich, wenn wir die Forderung nach der Surjektivität durch die Forderung nach der Webcode
Bijektivität ersetzen? 5800

In Abschnitt 5.3.2 haben Sie den Satz von Rice kennen gelernt. In einem Rundumschlag Aufgabe 5.10
macht er die Hoffnung zunichte, irgendeine nichttriviale Eigenschaft von Turing-Maschinen 
algorithmisch zu entscheiden. Doch ist das wirklich so? Als Beispiel betrachten wir die Webcode
Eigenschaft einer Maschine, exakt 5 Zustände zu besitzen. Mit einem Blick auf die In- 5932
struktionstabelle können wir diese Eigenschaft für jede vorgelegte Maschine immer korrekt
entscheiden. Aber genau dies dürfte nach dem Satz von Rice nicht möglich sein, oder
vielleicht doch?

In dieser Aufgabe betrachten wir die Formel Inst(qi , S j , Sk , L, ql ) aus Abschnitt 5.4.1. Mit Aufgabe 5.11
ihr hat Turing in seiner Arbeit aus dem Jahr 1936 die Linksbewegung einer einseitig 
beschränkten Turing-Maschine beschrieben: Webcode
5193
Inst(qi , S j , Sk , L, ql ) :=
∀ t ∀ y ∀ t ∀ y ((RSj (t, y) ∧ I(t, y) ∧ Kqi (t) ∧ F(t, t ) ∧ F(y , y))
→ (I(t , y ) ∧ RSk (t , y) ∧ Kql (t )

M
∧ ∀ z (F(y , z) ∨ (RSi (t, z) → RSi (t , z)))))
i=0

Auf Seite 276 haben wir festgelegt, wie sich eine solche Maschine verhält, wenn der Schreib-
Lese-Kopf ganz links steht:

„Der Schreib-Lese-Kopf einer einseitig beschränkten Turing-


Maschine kann sich nicht über das Bandende hinausbewegen.
Eine angeforderte Linksbewegung wird in diesem Fall ignoriert,
und der Schreib-Lese-Kopf verharrt in seiner Position.“

Offenbar ist die verbale Beschreibung in der Formel ϕI (x, y) überhaupt nicht umgesetzt.

a) Ist der Turing’sche Beweis etwa unvollständig?


b) Wie schwierig wäre es, die verbale Beschreibung in die Formel ϕI (x, y) zu integrieren?
338 5 Berechenbarkeitstheorie

Aufgabe 5.12 In Abschnitt 5.4.2 haben wir herausgearbeitet, wie sich Turing-Maschinen arithmetisieren
 lassen. In diesem Zusammenhang haben wir die PA-Formel ϕI (x, y) eingeführt, die den Über-
Webcode gang von einer Konfiguration x in eine Konfiguration y beschreibt. Für die Linksbewegung
5892 lautetet sie beispielsweise so:

ϕI (x, y) := ∃ h1 ∃ h2 ∃ n1 ∃n2 (
L(x) = n1 ∧ K(x) = i ∧ I(x) = h1 ∧ Rh1 (x) = j ∧
L(y) = n2 ∧ K(y) = l ∧ I(y) = h2 ∧
(h1 = 0 → (
n1 = n2 ∧ h1 = h2 + 1 ∧ Rh1 (y) = k ∧
∀ (h < n1 ) (h = h1 → ∃ s (Rh (x) = s ∧ Rh (y) = s)))) ∧
(h1 = 0 → (
n1 + 1 = n2 ∧ R0 (y) = 0 ∧ h1 = h2 ∧ R1 (y) = k ∧
∀ (h < n1 ) (h = 0 → ∃ s (Rh (x) = s ∧ Rh+1 (y) = s)))))

Wir hätten den Beweis vereinfachen können, indem wir ihn für einseitig beschränkte Turing-
Maschinen führen. Wie würde die Formel dann aussehen?

Aufgabe 5.13 Am Beispiel der diophantischen Gleichung



Webcode (x + 1)3 + (y + 1)3 = (z + 1)3
5970
haben wir in Abschnitt 5.4.3 argumentiert, dass es einen Unterschied darstellt, ob wir nach
Lösungen in den ganzen Zahlen oder in den natürlichen Zahlen suchen.

a) Zeigen Sie, dass die Gleichung in den ganzen Zahlen unendlich viele Lösungen hat.
b) Warum ist die Gleichung in den natürlichen Zahlen unlösbar?

Aufgabe 5.14 In Abschnitt 5.4.3 haben wir erarbeitet, wie sich diophantische Gleichungen konjunktiv oder
 disjunktiv zusammenfassen lassen.
Webcode
5100 a) Welche Relationen werden durch die folgenden beiden Gleichungen repräsentiert?

a+x+1−b = 0 ∨ b+y+1−a = 0
a+x−b = 0 ∧ b+y−a = 0

b) Formen Sie die Ausdrücke in gewöhnliche diophantische Gleichungen um.


5.5 Übungsaufgaben 339

R und S seien zwei diophantisch repräsentierbare Relationen. Aufgabe 5.15



a) Ist die Relation R ∪ S diophantisch repräsentierbar? Webcode
5651
b) Ist die Relation R ∩ S diophantisch repräsentierbar?

In Abbildung 5.41 ist eine diophantische Gleichung mit 26 Unbekannten aufgeführt, die Aufgabe 5.16
genau dann eine Lösung in den positiven natürlichen Zahlen besitzt, wenn k + 2 eine 
Primzahl ist. Webcode
5999
a) Kann diese Gleichung dazu verwendet werden, alle Primzahlen aufzuzählen?
b) Lässt sich die Menge aller Primzahlzwillinge ebenfalls diophantisch repräsentieren?

Das nachstehende Registermaschinenprogramm stammt aus der mehrfach zitierten Arbeit Aufgabe 5.17
von Jones und Matijasevič aus dem Jahr 1984 [101]: 
Webcode
L0 R2 ← R2 + 1 R2 ← R2 − 1 L11 if R2 < R1 goto L10 5156
L1 R2 ← R2 + 1 L6 if 0 < R2 goto L5 L12 R1 ← R1 − 1
L2 if R3 = 0 goto L5 L7 R2 ← R2 + 1 R2 ← R2 − 1
L3 R3 ← R3 − 1 R4 ← R4 − 1 R3 ← R3 − 1
L4 goto L2 L8 if 0 < R4 goto L7 L13 if 0 < R1 goto L12
L5 R3 ← R3 + 1 L9 if R3 < R1 goto L5 L14 stop
R4 ← R4 + 1 L10 if R1 < R3 goto L1

a) Mit Ri < R j wird eine Operation verwendet, die unser Registermaschinenmodell nicht von
Hause aus unterstützt. Zeigen Sie, dass sich die Operationen mit den nativen Sprachele-
menten nachbilden lassen.
b) Führen Sie das Programm für die Eingabe R1 = 2 händisch aus und erstellen Sie ein
Ablaufdiagramm, das ähnlich aussieht wie jenes aus Abbildung 5.17. Beachten Sie, dass
die Programmausführung in Zeile L0 beginnt und nicht, wie bisher, in Zeile L1 .
c) Stellen Sie für diese Berechnungssequenz die Daten- und Kontrollflussmatrix auf. Wie
eine solche Matrix aussieht, wurde in Abbildung 5.43 gezeigt.
d) Wenn Sie die Registermaschine für verschiedene Eingabewerte starten, werden Sie fest-
stellen, dass sie in manchen Fällen hält und in anderen für immer weiter rechnet. Versu-
chen Sie, einen Zusammenhang zwischen dem Eingabewert und der Terminierungseigen-
schaft herzustellen.
340 5 Berechenbarkeitstheorie

Aufgabe 5.18 In Abschnitt 5.4.3.2 haben wir gezeigt, wie sich Registermaschinen diophantisch codieren
 lassen. Die von uns konstruierte Gleichung enthielt unter anderem den Teilausdruck
Webcode
5548 L1  I ∧ . . . ∧ Ll  I (5.33)

Er stellt sicher, dass L1 , . . . , Ll ausschließlich aus den Ziffern 0 und 1 besteht. Darüber hinaus
hatten wir über den Teilausdruck
l
I = ∑ Li (5.34)
i=1

erzwungen, dass in jeder Spalte der Kontrollflussmatrix höchstens eine 1 vorkommt. Auf
den ersten Blick scheinen wir (5.33) gar nicht zu benötigen, da deren inhaltliche Aussage
augenscheinlich aus (5.34) folgt. Beweisen oder widerlegen Sie diese Vermutung.
6 Algorithmische Informationstheorie

„Any one who considers arithmetical methods of


producing random digits is, of course, in a state of sin.“

John von Neumann [135]

In Kapitel 5 haben wir uns ausführlich mit der Funktionsweise von


Turing-Maschinen beschäftigt und dabei zwei wichtige Beobachtungen
gemacht: Einerseits können wir Turing-Maschinen dazu verwenden, um
Zeichensequenzen zu generieren. Andererseits können wir sie wie die
Programme einer beliebigen Programmiersprache behandeln und somit
selbst als Zeichensequenzen auffassen. In diesem Abschnitt werden wir
diese Beziehung verallgemeinern und eine Zeichensequenz s mit dem
kürzesten Programm in Bezug setzen, das s erzeugt. Auf diese Wei-
se wird es uns gelingen, den Informationsgehalt oder die Komplexi-
tät einer endlich langen oder unendlich langen Zeichenkette exakt zu
messen. Die ersten Untersuchungen dieser Art wurden gegen Ende der
Sechzigerjahre von Ray Solomonoff, Andrej Kolmogorov und Gregory
Chaitin durchgeführt. Aus diesen Forschungsarbeiten hat sich eine neue
Theorie der Information entwickelt, die wir heute als algorithmische In-
formationstheorie bezeichnen.

Das Ziel dieses Kapitels ist es, die Kernideen der algorithmischen In-
formationstheorie in ihren Grundzügen darzustellen. Hierzu werden wir
in Abschnitt 6.1 zunächst klären, wie sich die Komplexität einer Zei-
chenkette durch die Rückführung auf den Algorithmenbegriff formal
erfassen lässt. Unter anderem werden wir dabei lernen, präzise zwi-
schen zufälligen und nicht zufälligen Zeichenketten zu unterscheiden.
Gegenstand von Abschnitt 6.2 wird dann erneut das Turing’sche Halte-
problem sein. Über den Begriff der Haltewahrscheinlichkeit werden wir
auf direktem Weg zur Chaitin’schen Konstanten geführt, einer wahrhaft
wundersamen Zahl, deren Entdeckung zu den Sternstunden der mo-
dernen mathematischen Logik zählt. Anschließend werden wir in Ab-
schnitt 6.3 einen trickreichen Zusammenhang zwischen Kalkülen und
Programmen herstellen und auf diese Weise die wahre Bedeutung der
algorithmischen Informationstheorie offenlegen. Am Ende unserer Be-
trachtungen werden wir mit dem Chaitin’schen Unvollständigkeitssatz
ein Theorem unser Eigen nennen, das uns die Grenzen der mathema-
tischen Methode ein weiteres Mal messerscharf vor Augen führen wird.

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6_6
342 6 Algorithmische Informationstheorie

6.1 Algorithmische Komplexität

Wir beginnen unsere Diskussion mit zwei Fragen:

I Wie viel Information enthält die Struktur aus Abbildung 6.1?

I Worin unterscheiden sich die Binärsequenzen aus Abbildung 6.2?

Die zweite Frage behandelt wir zuerst. In beiden Beispielen scheint die
Abfolge der Nullen und Einsen augenscheinlich keiner Gesetzmäßig-
keit zu folgen; sowohl die linke als auch die rechte Sequenz wirken
geradewegs so, als hätten wir sie durch eine Reihe von Münzwürfen er-
zeugt. Doch dürfen wir unserer Intuition an dieser Stelle trauen? Sind
die Nullen und Einsen tatsächlich willkürlich verteilt oder unterliegen
ihre Anordnungen vielleicht doch verborgenen Gesetzmäßigkeiten, die
wir mit bloßem Auge nur nicht erkennen?
Um dieser Frage auf den Grund zu gehen, wollen wir versuchen, beide
Zahlenfolgen mit dem Computerprogramm Zip zu verkürzen. Die Idee
ist naheliegend: Kompressionsprogramme suchen nach Gesetzmäßig-
keiten, anhand derer sich die vorgelegte Eingabe aus einer verkürzten
Bitsequenz wiederherstellen lässt. Gelingt die Kompression, so wäre
der Beweis erbracht, dass die vorgelegten Ziffernfolgen keine Zufalls-
sequenzen sind. Wurden die Folgen aber tatsächlich mit einer Münze
erzeugt, so enthielten die ersten n Ziffern keine Information über die
Abbildung 6.1: Visualisierung einer drei- Werte an den übrigen Bitstellen. Die Binärsequenz wäre frei von jegli-
dimensionalen Mandelbrot-Menge von Da- cher Redundanz, und das Kompressionsprogramm würde eine Ausgabe
niel White und Paul Nylander [146, 190] produzieren, die etwa die gleiche Länge besitzt wie die Eingabe.

1011100111011110100000011010111000001111011111111010001101001 0000000111110010110101001001001111110100110001100011011001010
1010101000000000011000001000110011100110010000011100010000101 1110101111011111101000101011100010010111000111110001111010100
1000001110100011101111000100001111010000100101110101101111000 0101001110111100111011110011000011011110010100101001110110010
0001001101101011000000101110011110001000110000111001011010110 1111001111110111011000100010111100000111010001000111010110100
0110110100010010100010001001010000001111100100000110101110010 1011100100111000000110101000001100101101101001100010011101111
1000000111100110001100100100001010011111100101010110100011110 1011101101010001011111100000000010101011010001111001111011010
1101000000001011001001111011110010110110101011111111110101001 0110110001000000111001001101100011101001110110101000010010100
1110111001111110111010001000011110010110111100111010001100111 1100011011011101001111011001010111100001110101010000001001000
0101011101101011011100000010001000001110100111000111110100111 0110111010110101011010000001000111100100101001100010001111101
0001011001101110111100111101101000100100010010011100001001011 1000010000000101100011010001111101001001101001110001111001100
0100110000110111110011110100111101111010100000010100011101010 0111100101110000010011101011000101010111010011101011000101101
0101101111010110011001010101100011110110101001100000010010111 0001101101101111100000101010000100110111110100011011100011001
0110011101111011001101010111011111101101100011110111111100100 1111001110101111011011011011110001101001010000100110100011100
1011011100001101110010010000010010001110000101100111110011101 0000011011100000100010011001011001001100011111010000100100101
0001111010110000101111000101000011111001101101110011010000111 1001011000100110000011010010011100001010010110110111010100011
0001111111000010001111011111111111010111001101110000000110011 0100000100011101011001101110010000000110101100010010010100111
010100111111010100001101 . . . 011111100111000001000101 . . .

Abbildung 6.2: Sind die dargestellten Binärsequenzen zufällig? (Vgl. [160])


6.1 Algorithmische Komplexität 343

Das Ergebnis des Experiments ist in Abbildung 6.3 zusammengefasst.


Auf den ersten Blick scheint sich unsere Vermutung, zwei zufällige Bi- Erste Sequenz:
närsequenzen vor uns zu haben, tatsächlich zu bestätigen. In beiden 125 Byte 158 Byte
Fällen produziert Zip eine Ausgabe, die geringfügig länger ist als die
Eingabe. Doch wie aussagekräftig ist unser Experiment? Im Prinzip
Zweite Sequenz:
ist es nicht ausgeschlossen, dass sich in den willkürlich erscheinenden
Ziffernfolgen eine Gesetzmäßigkeit verbirgt, die das Kompressionspro- 125 Byte 162 Byte
gramm einfach nicht erkennt.
Abbildung 6.3: Keine der beiden Sequen-
Abbildung 6.4 zeigt, dass die linke Ziffernfolge tatsächlich einer sol- zen lässt sich mit dem Kompressionspro-
chen Gesetzmäßigkeit unterliegt; sie besteht aus den ersten 1000 Nach- gramm Zip verkleinern.
kommaziffern der Zahl π, gerechnet modulo 2. Die Ziffernfolge ist da-
mit alles andere als eine Zufallszahl und lässt sich mit einem einfachen
I Sequenz 1

π
Programm systematisch erzeugen.

In der anderen Binärsequenz ist eine solche Gesetzmäßigkeit nicht vor-


handen. Sie wurde aus den Ziffern einer Zufallszahl generiert, die dem
1955 erschienenen Buch A Million Random Digits with 100,000 Normal 3.14159265358979323846. . .
Deviates entstammt [38]. Dieses sehr spezielle Werk enthält auf mehr 3.26433832795028841971. . .
als 600 dicht beschriebenen Seiten insgesamt 1.000.000 Ziffern einer
experimentell ermittelten Zahlenfolge. Da die Abfolge der Nullen und
Einsen keiner Gesetzmäßigkeit unterliegt, lassen sich die Ziffern auch 3.10111001110111101000. . .
nicht systematisch berechnen. 3.00011010111000001111. . .

Wollen wir eine endliche Zufallssequenz mit einem Programm ausge- I Sequenz 2
ben, so sind wir gezwungen, alle Ziffern im Klartext zu codieren. Ein
solches Programm sähe etwas so aus:

PRINT "0000000111110010110101001001001111110100110..."

Es ist leicht einzusehen, dass die Länge eines Programms dieser Form
etwa der Länge der Ausgabe entspricht. Bei der Ausgabe von 1000 Zif-
fern ist dies noch kein Problem, und mit hoher Wahrscheinlichkeit ist 3.08422689531964509303. . .
ein solches Programm dann immer noch kürzer als eines zur Berech- 3.23209025601595334764. . .
nung von π. Dies ändert sich, wenn wir längere Binärsequenzen be-
trachten. Wollten wir nicht nur 1000, sondern 1.000.000 Ziffern ausge-
ben, so würde das Programm zur Ausgabe der Zufallssequenz um den 3.00000001111100101101. . .
Faktor 1000 länger. Das Programm zur Berechnung von π würde hin- 3.01001001001111110100. . .
gegen nur geringfügig länger werden1 . Wir sagen, die erste Sequenz hat
eine geringere algorithmische Komplexität. Abbildung 6.4: Nur die zweite Binärse-
quenz ist zufällig. Sie wurde aus den ersten
1 Tatsächlich bleibt die Programmlänge nicht konstant. Sie steigt an, da wir die Anzahl 1000 Ziffern einer 1955 publizierten Zahl
der auszugebenden Nachkommastellen als Konstante in das Programm hineincodieren generiert, die im Rahmen eines Zufallsex-
müssen. periments ermittelt wurde.
344 6 Algorithmische Informationstheorie

Die algorithmische Komple- Definition 6.1 (Algorithmische Komplexität)


xität hat viele Namen. Häu-
fig wird sie als Kolmogorov-Komplexität, Die algorithmische Komplexität κ(s) einer endlichen Binärsequenz
manchmal auch als Kolmogorov-Chaitin- s ist die Länge des kürzesten Programms, das s ausgibt.
Komplexität bezeichnet. Kolmogorov er-
sann den Begriff im Jahr 1965 [113]
(Abbildung 6.5), Chaitin griff ihn 1969
Um Missverständnissen vorab entgegenzuwirken, wollen wir die Defi-
auf [30] und machte ihn nicht zuletzt
durch die Publikation mehrerer popu-
nition in zwei Punkten präzisieren:
lärwissenschaftlicher Bücher einer brei-
ten Öffentlichkeit bekannt [27–29]. Der I Mit Programm meinen wir ein Programm, das in einer festgelegten
eigentliche Vater der algorithmischen Programmiersprache geschrieben ist. Welche Sprache wir dabei zu-
Komplexität ist aber ein anderer. Die grunde legen, spielt für unsere Betrachtungen keine Rolle. Wichtig
Idee, die Komplexität von Zeichenket- ist, dass die betrachteten Programme ohne Eingabe loslaufen, eine
ten auf den Algorithmenbegriff zurück- Reihe von Berechnungen durchführen und irgendwann eine Binär-
zuführen, wurde bereits 1960 von Ray
sequenz s ausgeben, sofern sie überhaupt terminieren. Das Vorbild
Solomonoff publiziert [187]. Eine zwei-
teilige Langfassung dieser Arbeit folgte
für unser Programmmodell sind Turing-Maschinen, die auf einem
im Jahr 1964 [188, 189]. Korrekterwei- leeren Band gestartet werden. Terminiert eine solche Maschine, so
se müssten wir also von der Solomonoff- ist der geschriebene Bandinhalt die Zeichenkette s.
Komplexität sprechen, doch nur wenige
I Mit der Länge eines Programms meinen wir die Anzahl der Bits,
Autoren verwenden diesen Begriff. Ver-
einzelt wird die algorithmische Komple- die für seine Codierung benötigt werden. Legen wir die Menge al-
xität auch als Beschreibungskomplexität ler Java-Programme zugrunde, so meinen wir damit die Länge der
bezeichnet, oder es wird von algorithmi- Programmdatei in Bits. Messen wir die algorithmische Komplexi-
scher Information gesprochen. tät mithilfe von Turing-Maschinen, so entspricht die Programmlän-
ge der Anzahl von Nullen und Einsen, die wir zur Darstellung ihrer
Gödelnummer im Binärsystem benötigen.

Behalten Sie stets im Gedächtnis, dass wir mit der algorithmischen


Komplexität keine Maßzahl im absoluten Sinn vor uns haben; der Wert
von κ(s) hängt nicht nur von der Binärsequenz s, sondern immer auch
von der vereinbarten Programmiersprache und der gewählten Gödeli-
sierung ab. Ändern wir einen dieser Parameter, so ändert sich auch die
algorithmische Komplexität κ(s).

Für die folgenden Betrachtungen ist es wichtig, dass wir Gödelnum-


mern nicht als natürliche Zahlen, sondern als Bitsequenzen auffassen.
Andrej Nikolajewitsch Kolmogorov Damit sind 0, 00, 000, . . . für uns verschiedene Gödelnummern, auch
(1903 – 1987) wenn sie der gleichen natürlichen Zahl entsprechen.

Abbildung 6.5: Der russische Mathemati- Jetzt sind wir in der Lage, auch die erste der zu Beginn dieses Abschnitts
ker Andrej Kolmogorov ist der Namensge- formulierten Fragen zu beantworten. Setzen wir den Informationsgehalt
ber der Kolmogorov-Komplexität. Diese Be- eines Objekts mit seiner algorithmischen Komplexität gleich, so enthält
zeichnung ist das am häufigsten benutzte das Fraktal aus Abbildung 6.1 trotz seines Detailreichtums nur wenig
Synonym für den Begriff der algorithmi- Information. Mit einem überschaubaren Programm lässt sich die Bitfol-
schen Komplexität. ge der Bilddatei in beliebiger Auflösung erzeugen.
6.1 Algorithmische Komplexität 345

Alles in allem hat die bisherige Diskussion zwei Dinge gezeigt:


Ist die algorithmische
Komplexität  (s)
I Mit der algorithmischen Komplexität κ(s) halten wir eine Maßzahl berechenbar?
in Händen, die wir mit bloßem Auge nicht erfassen können. Die
eingangs diskutierten Binärsequenzen unterstreichen nachdrücklich,
dass ähnlich wirkende Objekte völlig unterschiedliche Komplexitä- Eingabe:
ten besitzen können.

I Die Maßzahl κ(s) geht nicht immer mit unserer intuitiven Vor-
stellung von Komplexität einher. Selbst hochkompliziert wirkende
Strukturen, wie das Fraktal aus Abbildung 6.1, können eine geringe n := 0
algorithmische Komplexität aufweisen.

Die Frage, die sich uns an dieser Stelle aufdrängt, ist eine naheliegen- n := n + 1
de: Können wir ein Verfahren ersinnen, mit dem wir die algorithmische
Komplexität für eine vorgelegte Binärsequenz s systematisch berechnen
können? Die Antwort auf diese Frage ist negativ.
s := die n-te Binärsequenz
Satz 6.1

Es existiert kein systematisches Berechnungsverfahren für κ(s). s durchläuft


die Binärsequenzen
0, 1, 00, 01, 10, 11,
000, 001, 010, 011, 100, ...
Beweis: Wir beweisen den Satz durch Widerspruch und nehmen an, es
gäbe ein Programm, das κ(s) für beliebige Binärsequenzen s berechnen
kann. Dieses können wir, wie in Abbildung 6.6 gezeigt, zu einem grö-  (s) > N
Ja?
Nein
ßeren Programm P erweitern. Die Funktionsweise von P ist simpel: Zu
Beginn wird die Variable n mit dem Wert 0 initialisiert und anschließend Ja
in einer Schleife schrittweise um eins erhöht. In jeder Iteration wird die Ausgabe: s
n-te Binärsequenz bestimmt (wir nennen sie s) und ihre algorithmische
Komplexität berechnet. Sobald κ(s) größer als eine vordefinierte Kons-
tante N ist, gibt das Programm s aus und hält an. Abbildung 6.6: Für jeden Wert der Kons-
tanten N wird das Programm irgendwann
Wie wird sich das Programm P für große Werte von N verhalten? eine Binärsequenz s ausgeben, deren Kom-
plexität größer als N ist (κ(s) > N). Wäh-
len wir den Wert von N so, dass er die Län-
I Zunächst halten wir fest, dass P für alle Werte von N irgendwann ge des Programms signifikant übersteigt, so
eine Ausgabe produzieren und anhalten wird. Der Grund hierfür ist wird s von einem Programm ausgegeben,
leicht einzusehen: Da es nur endlich viele Binärsequenzen mit ei- das kürzer als N ist (κ(s) < N). Der entstan-
ner algorithmischen Komplexität kleiner als N geben kann, müssen dene Widerspruch lässt nur einen Ausweg
im Umkehrschluss unendlich viele Sequenzen mit einer Komplexität zu: Es kann kein Verfahren geben, das die
größer als N existieren. Folgerichtig muss die Bedingung κ(s) > N algorithmische Komplexität einer vorgeleg-
irgendwann wahr werden und das Programm terminieren. ten Binärsequenz immer korrekt berechnet.
346 6 Algorithmische Informationstheorie

I Für unsere Betrachtung ist die Programmlänge |P| entscheidend.


Im Wesentlichen besteht P aus einer konstanten Anzahl Bits, und
seine Länge wird lediglich durch die konkrete Wahl der Konstan-
ten N noch geringfügig beeinflusst. Zur Codierung von N reichen
(log2 N) + 1 Bits aus, so dass wir die folgende Formel aufstellen
können:
|P| ≤ c + (log2 N)
Der exakte Wert der Konstanten c spielt für unsere Betrachtung kei-
ne Rolle. Ihn exakt zu beziffern, ist ohnehin schwierig, da er maß-
geblich durch die verwendete Programmiersprache und die gewählte
Gödelisierung beeinflusst wird.
I Wählen wir für N den Wert 2c , so gilt |P| ≤ c + (log2 2c ) = 2 · c. Jetzt
ist N wesentlich größer als die Programmlänge |P|. Starten wir P, so
beginnt die Suche nach einer Binärsequenz s mit κ(s) > N. Nach
dem oben Gesagten, wird P eine solche Sequenz finden, diese aus-
geben und anschließend terminieren. Aber genau dies steht im Wi-
derspruch zu der Tatsache, dass wir s gerade mit einem Programm
ausgegeben haben, das kürzer ist als N; es müsste also gleichzei-
tig κ(s) < N und κ(s) > N gelten. Der Widerspruch lässt nur einen
Ausweg zu: Wir müssen die Annahme verwerfen, κ(s) sei für jede
Eine zufällig herausgegrif-
fene Binärsequenz ist nur beliebige Binärsequenz s berechenbar, und damit ist Satz 6.1 bewie-
selten regelmäßig. Um den sen.
Grund hierfür zu verstehen,
betrachten wir exemplarisch alle Sequen- Satz 6.1 besagt nicht, dass die algorithmische Komplexität für keine Bi-
zen mit 1.000.000 Binärziffern. Eine Se- närsequenz berechnet werden kann; für einzelne Sequenzen kann eine
quenz s soll als zufällig gelten, wenn Berechnung durchaus gelingen. Ausgeschlossen ist jedoch die Existenz
ihre algorithmische Komplexität mindes- eines allgemeinen Verfahrens, dass die algorithmische Komplexität für
tens |s| − 10 beträgt. In unserem Beispiel- jede vorgelegte Binärsequenz immer korrekt berechnet.
szenario existieren 21000000 Binärsequen-
zen der Länge |s|, aber nur 2999990 Binär- An dieser Stelle kommen wir auf die eingangs diskutierte Fragestellung
sequenzen der Länge |s| − 10. Damit gibt zurück: Wann ist eine Binärsequenz zufällig? Mit dem Begriff der algo-
es weniger als 2999990 Programme, die für rithmischen Komplexität verfügen wir über das passende Instrumenta-
die Erzeugung regelmäßiger Binärsequen- rium, um zwischen zufälligen und nicht zufälligen Binärsequenzen zu
zen in Frage kommen. Der Prozentsatz re- unterscheiden:
gelmäßiger Sequenzen lässt sich dann fol-
gendermaßen nach oben abschätzen:
Definition 6.2 (Endliche Zufallssequenz)
2999990 1
= 10 < 0,1%
21000000 2 I Eine endliche Binärsequenz s heißt zufällig, wenn ihre algorith-
Das bedeutet, dass sich unter 1000 Binär- mische Komplexität κ(s) ungefähr |s| entspricht.
sequenzen im statistischen Mittel höch-
stens eine regelmäßige befindet. Die I Eine endliche Binärsequenz s heißt regelmäßig oder kompri-
Rechnung zeigt: Fast alle Binärsequenzen mierbar, wenn ihre algorithmische Komplexität κ(s) deutlich
sind zufällig! kleiner ist als |s|.
6.1 Algorithmische Komplexität 347

Hinter dieser Definition verbirgt sich die Idee, dass wir immer dann von
einer Zufallssequenz sprechen, wenn sie sich nicht aus einer deutlich Wie lautet die erste
kleineren Bitsequenz rekonstruieren lässt. Mit anderen Worten: Zufalls- zufällige Binär-
sequenzen sind nicht signifikant komprimierbar. Sehr präzise ist diese sequenz > N ?
Festlegung freilich nicht, schließlich bleibt völlig offen, was mit „deut-
lich kleiner“ oder „signifikant komprimierbar“ genau gemeint ist. Die-
ses Problem wird sich weiter unten von selbst erledigen, wenn wir den Eingabe:
Übergang von endlich langen zu unendlich langen Binärsequenzen voll-
ziehen.

Zunächst wollen wir uns mit der Frage beschäftigen, ob wir mit einem n := N
systematischen Verfahren entscheiden können, ob eine vorgelegte Zei-
chenkette s zufällig ist oder nicht. Da wir zu diesem Zweck lediglich
entscheiden müssen, ob die algorithmische Komplexität einer Binärse-
quenz s ungefähr der Länge von s entspricht, schließt Satz 6.1 die Exis-
n := n + 1
tenz eines solchen Verfahrens nicht von vorneherein aus. Ein Argument,
das jenem aus dem Beweis von Satz 6.1 sehr ähnlich ist, lässt aber auch
diese Hoffnung zerbersten.

s := die n-te Binärsequenz


Satz 6.2

Es existiert kein Verfahren, das für eine vorgelegte Binärsequenz s


immer korrekt entscheidet, ob s zufällig ist oder nicht.
random(s)
Ja ?
Nein
Beweis: Wir nehmen an, es gäbe ein Programm, das eine beliebige Bi- Ja
närsequenz entgegennimmt und immer korrekt entscheidet, ob sie zu-
Ausgabe: s
fällig ist oder nicht. Dann wären wir in der Lage, ein Programm P zu
schreiben, das den Ablaufplan aus Abbildung 6.7 implementiert. Zu Be- Abbildung 6.7: Das dargestellte Programm
ginn wird die Variable n mit dem Wert N initialisiert und in einer Schlei- liefert den Beweis, dass kein Verfahren
fe schrittweise erhöht. Danach wird geprüft, ob die n-te Binärsequenz existieren kann, das für jede Binärsequenz
zufällig ist. Sobald P eine solche Sequenz findet, wird sie ausgegeben s immer korrekt entscheidet, ob s zufällig
und das Programm angehalten. ist oder nicht.

Erneut interessiert uns die Frage, wie sich P für große Werte von N
verhalten wird.

I Zunächst halten wir fest, dass P für jeden Wert von N terminiert. Den
Grund hierfür haben wir bereits im Beweis zu Satz 6.1 erörtert. Da
unendlich viele Zufallssequenzen existieren, können wir für jedes N
eine Zahl n mit n > N finden, die zu einer zufälligen Binärsequenz s
führen wird.
I Für unsere Betrachtung ist erneut die Programmlänge |P| entschei-
dend. Im Wesentlichen besteht P aus einer konstanten Anzahl von
348 6 Algorithmische Informationstheorie

Bits, und seine Länge wird lediglich durch die konkrete Wahl
von N noch geringfügig beeinflusst. Zur Codierung von N reichen
(log2 N) + 1 Bits aus, so dass wir die Programmlänge über die For-
mel
|P| ≤ c + (log2 N)
abschätzen können. Wiederum spielt der genaue Wert der Konstan-
ten c keine Rolle.

I Wählen wir für N den Wert 2c , so gilt |P| ≤ c + (log2 2c ) = 2 · c. Of-


fensichtlich ist die Konstante N jetzt signifikant größer als die Pro-
grammlänge |P|. Nach dem oben Gesagten wird das Programm auch
für diesen Wert von N irgendwann eine zufällige Binärsequenz s fin-
den, diese ausgeben und terminieren. Aber genau dies steht im Wi-
derspruch zu der Tatsache, dass wir s gerade mit einem Programm
ausgegeben haben, das signifikant kürzer ist als N.

Seien Sie sich auch hier dessen bewusst, dass Satz 6.2 nur die Existenz
eines systematischen Verfahrens ausschließt, das für jede vorgelegte Bi-
närsequenz immer korrekt entscheidet, ob sie zufällig ist oder nicht.
Für ganz spezielle Sequenzen kann ein Beweis trotzdem gelingen. Bei-
spielsweise waren wir weiter oben in der Lage, die erste der eingangs
diskutierten Binärsequenzen als regelmäßig zu entlarven.

Wir wollen nun daran gehen, den Begriff der algorithmischen Komple-
xität auf unendlich lange Binärsequenzen zu übertragen. Eine nahelie-
gende Definition wäre diese hier: Eine unendlich lange Binärsequenz s
heißt regelmäßig, wenn ein Programm existiert, das alle Ziffern von s in
einer Endlosschleife nacheinander ausgibt. Anstatt allgemein von einem
Programm zu sprechen, könnten wir auch die Existenz einer Turing-
Maschine fordern, die alle Ziffern von s nacheinander auf ein leeres
Band schreibt. Wiederum wird klar, was für eine Maschine wir im Sinn
haben: Sie arbeitet ganz genau so wie eine computing machine aus der
Turing’schen Originalarbeit.

Obwohl diese Definition auf den ersten Blick reizvoll erscheint, werden
wir sie nicht verwenden. Um den Grund hierfür zu verstehen, betrach-
ten wir die Binärsequenz aus Abbildung 6.8. Entstanden ist sie, indem
die Bits einer Zufallssequenz mit den Bits einer regelmäßigen Sequenz
paarweise verschränkt wurden. Die Bits an den ungeraden Positionen
sind aus den Nachkommastellen der Zahl π generiert und leicht bere-
chenbar. Die Bits an den ungeraden Positionen sind unserer Zufallsse-
quenz aus Abbildung 6.2 entnommen. Nach der vorgeschlagenen De-
finition wäre die konstruierte Bitfolge eine Zufallssequenz; sie enthält
eine unberechenbare Teilfolge und kann daher von keinem Programm
6.1 Algorithmische Komplexität 349

...
0
0 Abbildung 6.8: Die dargestellte Binärse-
1
0 quenz entsteht, indem eine regelmäßige
1 1
1 0 1 1 1 0 0 1 1 1 0 1 1 Bitfolge mit einer zufälligen Bitfolge ver-
schränkt wird. Da sie eine unberechenba-
1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 1 0 1 0 0 0 0 0 1 1 1 1 1 ... re Teilfolge enthält, kann sie von keinem
Programm erzeugt werden. Dennoch wür-
0 0 0 0 0 0 0 1 1 1 1 1 den wir die Binärsequenz nicht als zufäl-
0 0 1 lig erachten, da sich jedes Anfangsstück
0
1 mit einem Programm ausgeben lässt, das
1 ... etwa nur halb so lang ist wie die Sequenz
selbst.

erzeugt werden. Als zufällig würden wir sie dennoch nicht bezeichnen,
schließlich könnten wir jedes Anfangsstück mit einem Programm aus-
geben, das signifikant kürzer ist als die Sequenz selbst (Abbildung 6.9).

Aus diesem Grund werden wir einen anderen Weg wählen und den Be-
griff der unendlich langen Zufallssequenz auf die Definition für endli-
che Sequenzen zurückführen.

Definition 6.3 (Unendliche Zufallssequenz)

Eine unendlich lange Binärsequenz s = s1 , s2 , s3 , . . . mit si ∈ {0, 1}  (n)


n
heißt zufällig, wenn eine Konstante c ∈ N existiert mit

κ(s[1 . . . n]) > (n − c) für alle n n-c


s[1 . . . n] := s1 , . . . , sn bezeichnet das n-te Anfangsstück von s. n
2
Eine Binärsequenz, die nicht zufällig ist, heißt regelmäßig oder
komprimierbar.

n
Nach dieser Definition ist die Sequenz aus Abbildung 6.8 nicht mehr zu-
fällig. Da jedes Anfangsstück der Länge n mit einem Programm ausge- Abbildung 6.9: Jedes Anfangsstück der Bi-
geben werden kann, das etwa halb so lang ist wie n, können wir c wäh- närsequenz aus Abbildung 6.8 lässt sich mit
einem Programm ausgeben, das etwa halb
len, wie wir wollen: Selbst für riesige Werte für c wird die Komplexität
so lang ist wie die Sequenz selbst. Daher
des Anfangsstücks mit Sicherheit irgendwann kleiner sein als n − c. Die wird die Komplexität des Anfangsstücks ir-
Unschärfe, die Definition 6.2 negativ anhaftete, ist durch den Übergang gendwann kleiner sein als n−c, unabhängig
zu unendlich langen Binärsequenzen jetzt vollständig verschwunden. davon, wie groß wir die Konstante c wäh-
len. Die Bitfolge ist daher keine Zufallsse-
quenz im Sinne von Definition 6.3.
350 6 Algorithmische Informationstheorie

6.2 Die Chaitin’sche Konstante


„Omega [...] embodies an enormous
amount of wisdom in a very small space [...] inasmuch
as its first few thousand digits, which could be written
on a small piece of paper, contain the answers to more
mathematical questions than could be written down in
the entire universe.“
Charles Bennett, Martin Gardner [64]

Im vorigen Abschnitt haben wir die Grundlage geschafft, um den Be-


griff der unendlich langen Zufallssequenz formal zu erfassen. Dabei
sind wir zu der Erkenntnis gelangt, dass eine Binärsequenz selbst dann
komprimierbar sein kann, wenn sie unberechenbar ist. Ein prominentes
Beispiel ist die Haltesequenz H := h1 , h2 , h3 . . . mit

1 falls das i-te Programm terminert
hi := (6.1)
0 sonst

Wie bisher betrachten wir Programme, die in einer vorab festgelegten


Programmiersprache verfasst sind und keine Eingabe verarbeiten. Nach
dem Start läuft ein solches Programm entweder für immer weiter oder
Gödelnummer G gibt irgendwann eine Binärsequenz aus und terminiert. Wir denken uns
alle Programme anhand ihrer Gödelnummern durchnummeriert und be-
000
001
010
011
100
101

zeichnen das Programm mit der Gödelnummer i ganz einfach als das
00
01
10
11
0
1

i-te (Abbildung 6.10).


H = 0 0 0 1 0 0 0 0 0 0 0 1 ... Um über die genaue Abfolge der Nullen und Einsen in H eine Aussage
zu treffen zu, benötigen wir zweierlei (vgl. [160]):
Das Programm mit der
Gödelnummer 01 terminiert. I Wir müssen wissen, welchem Programm das i-te Bit in H entspricht.
Kurzum: Wir müssen die verwendete Gödelisierung kennen. Ändert
sich diese, so ändern sich auch die Bits von H. Die Haltesequenz ist
Das Programm mit der
also keine universelle Größe, sondern abhängig von der verwendeten
Gödelnummer 101 terminiert.
Gödelisierung.
Abbildung 6.10: Das i-te Bit in der Hal- I Wir müssen entscheiden können, ob das i-te Programm terminiert.
tesequenz H ist genau dann gleich 1, Dass dies nur in Einzelfällen gelingen kann, folgt unmittelbar aus
wenn das i-te Programm terminiert. Wür- der Unentscheidbarkeit des Halteproblems. Ein Verfahren, das alle
den wir die Bitfolge vollständig kennen, Bits von H nacheinander erzeugt, kann es nicht geben. Kurzum: Die
so könnten wir das Halteproblem lösen. Haltesequenz H ist unberechenbar.
Im Umkehrschluss können wir aus der Un-
entscheidbarkeit des Halteproblems sofort
schließen, dass H nicht systematisch be- Wir wollen versuchen, die Haltesequenz zu komprimieren. Hierzu nut-
rechnet werden kann. zen wir aus, dass uns die ersten m Bits von H Auskunft darüber geben,
6.2 Die Chaitin’sche Konstante 351

I wie viele der ersten m Programme anhalten ( Anzahl der Einsen) I HelloWorld.pas

I und welche Programme dies sind. ( Position der Einsen) PROGRAM HelloWorld;

BEGIN
Tatsächlich ist die zweite Information redundant. Sobald wir wissen, WRITELN(’Hello World’);
wie viele der ersten m Programme anhalten, können wir auch bestim-
END.
men, um welche es sich im Einzelnen handelt. Hierzu müssen wir le-
diglich den Ablauf der ersten m Programme parallel simulieren und die
anhaltenden Programme notieren. Da wir genau wissen, wie viele Pro- 50 52 4f 47 52 41 4d 20 48 65
gramme terminieren werden, wissen wir auch präzise, wann die Simu- 6c 6c 6f 57 6f 72 6c 64 3b 0a
lation beendet werden kann. 0a 42 45 47 49 4e 0a 20 20 20
Wir wollen versuchen, die Anzahl der terminierenden Programme als 57 52 49 54 45 4c 4e 28 27 48
Wahrscheinlichkeit anzugeben, und lassen uns dabei von der folgenden 65 6c 6c 6f 20 57 6f 72 6c 64
Vorstellung leiten: Wir packen die Binärsequenzen der ersten m Pro- 27 29 3b 0a 45 4e 44 2e
gramme in einen Behälter und nehmen wahllos eine Sequenz heraus.
Die Wahrscheinlichkeit, eine Bitsequenz zu entnehmen, die der Gödel- Abbildung 6.11: Pascal-Programme sind
nummer eines anhaltenden Programms entspricht, bezeichnen wir als von Hause aus präfixfrei. Alle Programme
Haltewahrscheinlichkeit. Kennen wir diese, so können wir die Anzahl enden mit dem Schlüsselwort ‚END‘, ge-
folgt von einem Punkt.
der terminierenden Programme ganz einfach durch die Multiplikation
mit m zurückgewinnen.

Problematisch wird diese Vorstellung dann, wenn wir nicht die ersten
m Binärsequenzen, sondern alle endlichen Binärsequenzen in den Be-
hälter packen. Hat dann die Vorstellung überhaupt noch Sinn, eine Bi-
närsequenz zufällig herauszuziehen? Wie wäre beispielsweise die zu
erwartende Durchschnittslänge der gezogenen Sequenzen? Für jeden
konkreten Wert von l erhalten wir einen unmittelbaren Widerspruch,
da nur endlich viele Sequenzen existieren, die kleiner sind als l, aber
unendlich viele, die größer sind. Wir werden gleich sehen, dass wir Wi- (q1 , S0 , S1 , R, q2 ) (q1 , S0 , S1 , R, q2 )
dersprüche dieser Art vermeiden können, wenn wir die erlaubten Gö- (q2 , S0 , S0 , R, q3 ) (q2 , S0 , S0 , R, q3 )
delisierungen geringfügig einschränken. Konkret werden wir nur noch (q3 , S0 , S2 , R, q4 ) (q3 , S0 , S2 , R, q4 )
solche zulassen, die das Kriterium der Präfixfreiheit erfüllen. Die fol- (q4 , S0 , S0 , R, q1 ) (q4 , S0 , S0 , R, q1 )
(q1 , S1 , S1 , R, q2 )
gende Definition klärt, was wir hierunter im Detail zu verstehen haben.

Definition 6.4 (Präfixfreie Programmcodierung) 73 13 32 53 11 73 11 33 53 11


17 31 11 33 22 53 11 11 73 11
Eine Programmcodierung heißt präfixfrei, wenn die Gödelnummer 11 33 53 17 31 32 32 53 11
eines Programms niemals mit der Gödelnummer eines anderen Pro-
gramms beginnt. Abbildung 6.12: Turings Originalcodie-
rung aus dem Jahr 1936 ist nicht präfix-
frei. Die Gödelnummer der rechten Maschi-
Eine präfixfreie Codierung stellt sicher, dass jede Binärsequenz mit der ne beginnt mit der Gödelnummer der lin-
Gödelnummer von höchstens einem Programm beginnt; kein Programm ken.
352 6 Algorithmische Informationstheorie

I Beispiel ist der Anfang eines anderen. Einige Programmiersprachen wie z. B.


Pascal sind von Hause aus präfixfrei. Hier endet jedes Programm mit
01 0010 1110 dem speziellen Schlüsselwort ‚END.‘ (Abbildung 6.11). Viele Gödeli-
sierungen von Turing-Maschinen erfüllen das Kriterium der Präfixfrei-
H = 000100000001000011000000000010...
heit nicht. Verwenden wir beispielsweise das Codierungsschema aus
101 0011 Turings Originalarbeit, so können wir aus jeder Gödelnummer durch
das Anhängen weiterer Zeichen eine andere Gödelnummer erzeugen
⇒ Die Programme mit den Gödelnummern (Abbildung 6.12). Es ist leicht einzusehen, dass sich durch eine gering-
01, 101, 0010, 0011, 1110 terminieren. fügige Modifikation auch Turing-Maschinen so codieren lassen, dass
keine Gödelnummer der Anfang einer anderen ist. Somit können wir
I Haltewahrscheinlichkeiten die Eigenschaft der Präfixfreiheit in den nachstehenden Betrachtungen
bedenkenlos einfordern.
0 00 000 0000
1 01 001 0001 Jetzt sind alle Voraussetzungen geschaffen, um den Begriff der Halte-
10 010 0010 wahrscheinlichkeit solide zu definieren (Abbildung 6.13):
Ω1 = 0 11 011 0011
100 0100
101 0101 Definition 6.5 (Haltewahrscheinlichkeit Ωn )
Ω2 = 1
4 110 0110
111 0111 Sei s eine Binärsequenz, die aus allen 2n Binärsequenzen der Län-
1000 ge n zufällig herausgegriffen wurde. Die Haltewahrscheinlichkeit
Ω3 = 3 1001 Ωn ist die Wahrscheinlichkeit, dass s mit der Gödelnummer eines
8 1010 terminierenden Programms beginnt.
1011
1100
1101
Wir wollen versuchen, dem Begriff der Haltewahrscheinlichkeit eine
1110
noch intuitivere Bedeutung zu verleihen. Stellen Sie sich hierzu vor,
1111
dass wir die Gödelnummer eines Programms im Rahmen eines Zufalls-
experiments erzeugen möchten. Zu diesem Zweck werfen wir mehr-
Ω4 = 9
16 mals hintereinander eine Münze und notieren eine 1 für Kopf und eine 0
für Zahl. Wenn wir Glück haben, entsteht auf diese Weise irgendwann
Abbildung 6.13: In diesem Beispiel exis- die Gödelnummer eines Programms. In diesem Fall beenden wir un-
tieren 5 terminierende Programme. Die
ser Experiment, da eine Verlängerung der erzeugten Binärsequenz auf-
Haltewahrscheinlichkeit Ωn können wir er-
grund der Präfixfreiheit nicht mehr zum Erfolg führen kann. Natürlich
mitteln, indem wir alle Bitsequenzen der
Länge n auflisten und anschließend zählen, kann es uns auch passieren, dass wir auf diese Weise niemals zu einer
wie viele davon mit der Gödelnummer eines Gödelnummer gelangen. In diesem Fall fahren wir für immer mit dem
terminierenden Programms beginnen. Münzwurf fort.

In Abbildung 6.14 ist der Entscheidungsbaum unseres Experiments zu


sehen. Ausgehend von der Wurzel besitzt jeder Knoten zwei Nachfol-
ger, die jeweils für eine der beiden Möglichkeiten stehen, die Sequenz
um ein weiteres Bit zu verlängern. Als Ergebnis erhalten wir einen
Baum, dessen Pfade entweder unendlich lang sind oder zu Blättern füh-
ren, die mit der Gödelnummer eines Programms markiert sind. Bezo-
gen auf unser Zufallsexperiment besitzt die Haltewahrscheinlichkeit ei-
6.2 Die Chaitin’sche Konstante 353

Gödelnummer eines terminie-


0000 renden Programms
000
0001
00 Gödelnummer eines nichtter-
0010 minierenden Programms
001
0011
0 (Noch) keine Gödelnummer ei-
0100 nes Programms
010
0101
01
0110
011
0111
1000
100
1001
10 Abbildung 6.14: Durch das Werfen ei-
1010 ner Münze werden so lange neue Bits ge-
101
1011 neriert, bis die Gödelnummer eines Pro-
1 gramms entsteht. Die Haltewahrschein-
1100
110 lichkeit Ωn hat in diesem Münzwurfex-
1101 periment eine intuitive Bedeutung. Sie ist
11
1110 die Wahrscheinlichkeit, mit maximal n
111 Würfen ein terminierendes Programm zu
1111
erzeugen.

ne ganz praktische Bedeutung: Ωn ist die Wahrscheinlichkeit, mit maxi-


mal n Münzwürfen die Gödelnummer eines terminierenden Programms
zu erzeugen.

Das Experiment zeigt uns zugleich den Weg auf, wie wir die Halte-
wahrscheinlichkeit berechnen können. In unserem Beispiel existieren
fünf terminierende Programme, gegeben durch die Gödelnummern 01,
101, 0010, 0011 und 1110. Das Programm mit der Gödelnummer 01
wird in unserem Experiment mit der Wahrscheinlichkeit 14 erzeugt, das
Programm 101 mit der Wahrscheinlichkeit 18 und die Programme 0010,
1
0011 und 1110 jeweils mit der Wahrscheinlichkeit 16 . Alle Ereignisse
sind paarweise disjunkt. Somit ist die Gesamtwahrscheinlichkeit, eine
der fünf Maschinen zu erzeugen, die Summe der Einzelwahrscheinlich-
keiten. Mit
Ω1 = 0
1
Ω2 =
4
1 1 3
Ω3 = + =
4 8 8
1 1 1 1 1 9
Ω4 = + + + + =
4 8 16 16 16 16
354 6 Algorithmische Informationstheorie

„Suche die erste gerade erhalten wir exakt die durch Abzählen ermittelten Wahrscheinlichkeiten
natürliche Zahl > 2, die aus Abbildung 6.13. Unsere Überlegung können wir in nahe liegender
sich nicht als Summe Weise verallgemeinern. Bezeichnet P ein terminierendes Programm und
zweier Primzahlen |P| die Länge seiner Gödelnummer, so geht P mit dem Gewicht 2|P| 1
in
schreiben lässt. die Berechnung der Gesamtwahrscheinlichkeit ein. Somit ist
1
Ωn = ∑ 2|P|
(6.2)
P hält,
|P| ≤ n
P
Die Haltewahrscheinlichkeiten Ωn sind verblüffende Objekte der ma-
|P |= n thematischen Logik. In ihnen ist das nötige Wissen konzentriert, um
sämtliche Fragestellungen zu entscheiden, die sich durch die Angabe
eines berechenbaren Gegenbeispiels widerlegen lassen. Jede derartige
Fragestellung können wir in ein Programm P übersetzen, das nach ei-
Terminiert P ? n nem Gegenbeispiel sucht und im Erfolgsfall anhält (Abbildung 6.15).
Hat P die Länge n, so können wir mithilfe von Ωn die Anzahl der Binär-
sequenzen bestimmen, die mit der Gödelnummer eines terminierenden
Programms beginnen. Durch die schrittweise Simulation aller in Frage
kommenden Programme können wir die terminierenden herausfiltern
und auf diese Weise herausbekommen, ob P terminiert oder unendlich
Ja Nein
lange läuft. Im ersten Fall ist die mathematische Fragestellung wider-
Die Die
legt, im zweiten Fall ist sie bewiesen.
Goldbach'sche Goldbach'sche
Vermutung Vermutung Die Schar von mathematischen Problemen, die sich auf diesem Weg
ist falsch. ist wahr. prinzipiell beweisen oder widerlegen lassen, ist riesig. Hierunter fallen
viele berühmte und bisher ungelöste Probleme der Mathematik, wie die
Abbildung 6.15: In der Bitfolge der Hal-
Goldbach’sche Vermutung oder die Riemann’sche Hypothese. In der
tewahrscheinlichkeit Ωn sind die Antwor-
ten auf sämtliche mathematischen Frage-
Haltewahrscheinlichkeit liegt die Antwort auf diese Fragen verborgen,
stellungen codiert, die sich über die Termi- codiert in einer Abfolge von Bits, die auf wenigen Buchseiten problem-
nierungseigenschaft eines Programms der los Platz finden würde.
Maximallänge n entscheiden lassen. Soweit die Theorie. Aber können wir tatsächlich darauf hoffen, die
Goldbach’sche Vermutung oder die Riemann’sche Hypothese eines Ta-
ges auf solche Art und Weise zu entscheiden? Zunächst müssten wir
einen Weg finden, die Haltewahrscheinlichkeit Ωn zu berechnen. Für
kleine Werte von n kann dies tatsächlich gelingen. Da in diesem Fall nur
wenige Gödelnummern betrachtet werden müssen, können wir darauf
hoffen, alle terminierenden Programme durch eine individuelle Analy-
se zu bestimmen. Es ist leicht einzusehen, dass die Berechnung von
Ωn aber höchstens für endliche viele n möglich ist. Wären wir in der
Lage, unendlich viele Ωn zu berechnen, so hätten wir Zugriff auf ge-
nug Wissen, um das Halteproblem zu entscheiden. Um festzustellen,
ob ein Programm P der Länge n anhält, müssten wir dann lediglich die
nächst größere Zahl m bestimmen, für die Ωm berechenbar ist. Über die
Haltewahrscheinlichkeit Ωm erhielten wir dann Auskunft darüber, wie
6.2 Die Chaitin’sche Konstante 355

viele Programme der maximalen Länge m terminieren. Anschließend


könnten wir durch die parallele Simulation aller in Frage kommenden
Programme entscheiden, ob P dazu gehört oder nicht. Aus der Unent-
scheidbarkeit des Halteproblems folgt also unmittelbar, dass Ωn unbe-
rechenbar sein muss, sobald n eine gewisse Grenze überschreitet.

Wir wollen nun analysieren, wie sich die Haltewahrscheinlichkeiten


Ωn für größere Werte von n entwickeln. Offensichtlich ist die Folge
Ω1 , Ω2 , Ω3 , . . .

I monoton steigend und ( Ωn ≤ Ωn+1 )

I nach oben beschränkt. ( Ωn ≤ 1)

Hieraus folgt sofort, dass die Folge einem Grenzwert zustreben muss.
Sie konvergiert gegen die berühmte Chaitin’sche Konstante Ω.

Definition 6.6 (Chaitin’sche Konstante)

Die Chaitin’sche Konstante Ω ist definiert als der Grenzwert


1
Ω := lim Ωn =
n→∞
∑ 2 |P|
P hält

Können wir Ω systematisch berechnen? Fest steht zunächst nur, dass


wir aus der Definition der Chaitin’schen Konstanten keine direkte Be-
rechnungsvorschrift ableiten können; soeben haben wir ja gezeigt, dass
alle Ωn ab einem gewissen n unberechenbar sein müssen. Wir wollen
daher versuchen, Ω auf anderem Wege zu erreichen, und schicken die
folgende Definition voraus:
Ω
Definition 6.7 (Haltewahrscheinlichkeit Ωkn )
Ωn Ωnn
Sei s eine Binärsequenz, die aus allen 2n Binärsequenzen der Län-
ge n zufällig herausgegriffen wurde. Die Haltewahrscheinlichkeit
Ωkn ist die Wahrscheinlichkeit, dass s mit der Gödelnummer eines
Programms beginnt, das nach maximal k Schritten terminiert. n

Abbildung 6.16: Die monoton steigen-


Der einzige Unterschied zwischen Ωn und Ωkn besteht darin, dass in die den Folgen Ωn und Ωnn streben demselben
Berechnung von Ωkn nicht mehr alle anhaltenden Programme der Ma- Grenzwert entgegen. Sie konvergieren von
ximallänge n eingehen, sondern nur noch solche, die innerhalb von k unten gegen die Chaitin’sche Konstante Ω.
356 6 Algorithmische Informationstheorie

Eingabe: [1…n] Schritten terminieren. Offensichtlich gelten die folgenden Zusammen-


(Die ersten n Bits von ) hänge (Abbildung 6.16):

Ωnn ≤ Ωn ≤ Ω (6.3)
k := 0 lim Ωnn = lim Ωn = Ω (6.4)
n→∞ n→∞

Auch wenn die Folgen Ω1 , Ω2 , Ω3 , . . . und Ω11 , Ω22 , Ω33 , . . . dem gleichen
Grenzwert zustreben, sind sie grundverschieden. Im Gegensatz zur ers-
k := k + 1 ten Folge sind nämlich sämtliche Elemente der zweiten Folge berechen-
bar. Den Wert Ωnn können wir ganz einfach bestimmen, indem wir alle
Programme P mit |P| ≤ n für maximal n Schritte simulieren und mitzäh-
len, wie viele davon terminieren. Mit größeren Werten für n kommen
Berechne kk wir auf diese Weise immer weiter an den Wert von Ω heran. Zahlen,
die sich wie hier durch eine Folge berechenbarer Zahlen beliebig nahe
annähern lassen, heißen rekursiv aufzählbar.

kk[1…n] Folgt daraus, dass die Chaitin’sche Konstante Ω berechenbar ist? Auf
= [1…n]?
Ja den ersten Blick scheint dies tatsächlich der Fall zu sein. Die Konver-
Nein
genzeigenschaft lehrt uns, dass sich die Nachkommabits von Ωnn mit der
Ja Zeit von links nach rechts stabilisieren müssen.
Jetzt wissen wir:
Jedes terminierende Dabei dürfen wir ein schwerwiegendes Problem nicht übersehen: Zu
Programm P mit |P |  n hält nach keinem Zeitpunkt lässt sich mit Sicherheit sagen, ob ein Bit seinen end-
höchstens k Schritten an. gültigen Wert eingenommen hat. Selbst wenn wir uns mit Ωnn bereits so
nahe an Ω herangetastet haben, dass der Übergang von Ωnn zu Ωn+1 n+1 nur
M := Menge aller noch weit rechts stehende Bits beeinflusst, können sich diese Änderun-
Binärsequenzen der gen durch die Generierung von Überträgen nach links ausbreiten und
Länge n, die mit der
somit auch Bits an den vorderen Positionen verändern. Es könnten also
Gödelnummer eines
Programms beginnen, durchaus rekursiv aufzählbare Zahlen existieren, die nicht berechenbar
das innerhalb von k sind. Dass wir mit der Chaitin’schen Konstanten Ω eine genau solche
Schritten anhält. Zahl vor uns haben, ist eine Folge aus dem nachstehenden Satz:

|M|
Ausgabe: n = Satz 6.3
2n

Abbildung 6.17: In Ω sind sämtliche Hal- Ωn lässt sich aus den ersten n Bits von Ω rekonstruieren.
tewahrscheinlichkeiten Ωn in einer einzi-
gen Zahl vereint. Die ersten n Bits der
Chaitin’schen Konstanten (Ω[1 . . . n]) rei-
Beweis: Um aus den ersten n Bits von Ω die Haltewahrscheinlichkeit Ωn
chen aus, um die Haltewahrscheinlichkeit
Ωn zu rekonstruieren.
zu rekonstruieren, folgen wir dem Ablaufschema aus Abbildung 6.17:

I Wir fangen an, nacheinander die Folgenelemente Ω11 , Ω22 , Ω33 , . . . aus-
zurechnen. Auf diese Weise nähern wir uns von unten immer weiter
6.2 Die Chaitin’sche Konstante 357

an Ω an und irgendwann werden Ωkk und Ω in den ersten n Bits über- Der Beweis zu Satz 6.3 ent-
einstimmen. Sobald dies passiert, notieren wir den Wert von k und hält ein konstruktives Ver-
bezeichnen ihn als k0 . fahren, mit dem die Halte-
wahrscheinlichkeit Ωn aus
I Angenommen, wir erhöhen k über k0 hinaus. Können sich die ersten den ersten n Bits von Ω extrahiert wer-
n Bits von Ωkk dann noch ändern? Die Antwort ist Nein! Würde auch den kann. Wären wir in der Lage, diesen
nur eines der ersten n Bits einen anderen Wert annehmen, so wäre Algorithmus auch praktisch einzusetzen?
Ωkk > Ω, im Widerspruch zu (6.3). Da jedes Programm P mit dem Die Antwort ist Nein! Um den Grund hier-
für zu verstehen, erinnern wir uns an das
1
Gewicht 2|P| in die Haltewahrscheinlichkeit Ωkk eingeht und sich die
Kernelement des Algorithmus: die Be-
ersten n Bits nicht mehr ändern können, muss jedes Programm P, das rechnung der Sequenz
erst nach mehr als k0 Schritten anhält, eine Länge größer n haben.
Ω11 , Ω22 , Ω33 , Ω44 , . . .
I Wir wissen jetzt, dass kein Programm P mit |P| ≤ n existieren kann,
das nach mehr als k0 Schritten terminiert. Damit ist klar, wie wir die Wir müssen so lange neue Folgenelemen-
Haltewahrscheinlichkeit Ωn ermitteln können. Es ist ausreichend, al- te ausrechnen, bis die ersten n Bits von Ωkk
mit den ersten n Bits von Ω übereinstim-
le Programme P mit |P| ≤ n für k0 Schritte zu simulieren. Terminiert
1 men. Für welche Werte von k wird dies
ein Programm, so geht es mit dem Gewicht 2|P| in die Haltewahr-
ungefähr der Fall sein? Den Zeitpunkt, an
scheinlichkeit Ωk ein. Hat es nach k0 Schritten noch nicht angehal-
k
dem die ersten n Bits von Ωkk mit den
ten, so wissen wir, dass es niemals anhalten wird. ersten n Bits von Ω übereinstimmen, be-
zeichnen wir mit f (n):
Die Bedeutung von Satz 6.3 ist weit größer, als es der erste Blick vermu- f (n) := min{k | Ωkk [1 . . . n] = Ω[1 . . . n]}
ten lässt. Indem die Chaitin’sche Konstante das Wissen über sämtliche
Haltewahrscheinlichkeiten in sich vereint, enthält sie die Antwort auf Es lässt sich leicht zeigen, dass die Funk-
eine unermessliche Fülle mathematischer Fragestellungen. Unter ande- tion f schneller gegen Unendlich streben
rem enthält Ω das Wissen, um das Halteproblem für beliebige Program- muss als jede berechenbare Funktion. Wä-
me zu entscheiden, und muss daher unberechenbar sein. Damit macht re dies nicht der Fall, so könnten wir f (n)
durch eine berechenbare Funktion g(n)
Satz 6.3 unmissverständlich klar, dass der größte Teil dieser spektaku-
nach oben abschätzen. Dann wären die
lären Bitfolge unserem Auge für immer verborgen sein wird. g(n)
ersten n Bits von Ωg(n) mit Sicherheit mit
Gleichsam weist Satz 6.3 den Weg, wie sich die zu Beginn dieses Ab- den ersten n Bits von Ω identisch, und wir
schnitts eingeführte Haltesequenz H komprimieren lässt. Da wir die ers- hätten einen Weg gefunden, um jedes be-
liebige Bit der Chaitin’schen Konstanten
ten 2n Bits von H aus der Haltewahrscheinlichkeit Ωn zurückgewinnen
zu berechnen.
können und sich Ωn aus den ersten n Bits von Ω rekonstruieren lässt, Aus der Unberechenbarkeit von Ω folgt
kann jedes Anfangsstück von H mit einem Programm erzeugt werden, damit unmittelbar, dass die Funktion g(n)
dessen Länge nur logarithmisch wächst. Damit ist H keine Zufallszahl, und damit auch der Aufwand, die Halte-
und die einzelnen Bits sind nicht unabhängig voneinander. wahrscheinlichkeiten Ωn aus Ω zu extra-
hieren, stärker wachsen muss als jede be-
Die Chaitin’sche Konstante Ω ist ein wahrhaft wundersames Objekt der
rechenbare Funktion.
Mathematik. Selten wurde ihr Wesen treffender beschrieben als in ei-
In der Chaitin’schen Konstanten steckt
nem Artikel von Charles Bennett und Martin Gardner aus dem Jahr mehr Wissen, als wir uns träumen las-
1979. Ein mittlerweile berühmtes Zitat aus diesem Artikel wollen wir sen, und gleichzeitig ist die Information
an dieser Stelle keinesfalls übergehen: darin optimal verschlüsselt. Ω entpuppt
sich als der perfekte Gralshüter, der sein
„Throughout history mystics and philosophers have sought a vollständiges Wissen niemals preisgeben
compact key to universal wisdom, a finite formula or text which, wird. Ein deprimierendes Ergebnis.
358 6 Algorithmische Informationstheorie


when known and understood, would provide the answer to eve-
0,00000010...
ry question. The use of the Bible, the Koran and the I Ching for
00000100...
00011000... divination and the tradition of the secret books of Hermes Tris-
10000110... megistus, and the medieval Jewish Cabala exemplify this belief
10001111... or hope. Such sources of universal wisdom are traditionally pro-
11001011... tected from casual use by being hard to find, hard to understand
10111010... when found, and dangerous to use, tending to answer more questi-
00010000... ons and deeper ones than the searcher wishes to ask. The esoteric
book is, like God, simple yet undescribable. It is omniscient, and
Abbildung 6.18: Die ersten 64 Nachkom- transforms all who know it. Omega is in many senses a cabali-
mabits von Ω stic number. It can be known of, but not known, through human
reason. To know it in detail, one would have to accept its uncom-
putable digit sequence on faith, like words of a sacred text.“
Charles Bennett, Martin Gardner [64]

Die Unberechenbarkeit der Chaitin’schen Konstanten macht unmissver-


ständlich klar, dass diese niemals als Ganzes erfasst werden kann. Den-
noch bestand seit der Entdeckung von Ω die Hoffnung, zumindest über
das Anfangsstück dieser anmutigen Ziffernfolge etwas zu erfahren. Tat-
sächlich ging dieser Wunsch 2002 zu einem guten Stück in Erfüllung. In
diesem Jahr gelang es Cristian Calude, Michael Dinneen und Chi-Kou
Shu, die ersten 64 Ziffern von Ω auszurechnen. Um die Bitwerte zu be-
Behalten Sie stets im Ge- stimmen, betrachteten die drei Forscher zunächst alle Binärsequenzen
dächtnis, dass die Bitfolge mit einer Länge von 84 Bits. Im ersten Schritt sortierten sie diejenigen
von Ω sowohl von der Wahl aus, die keine Gödelnummer eines Programms repräsentieren. Danach
der Programmiersprache als galt es, den restlichen Datenbestand durch die Identifikation funktional
auch von der vereinbarten Gödelisierung identischer Programme zu reduzieren. Für die verbleibenden Program-
abhängt. Ändern wir diese, so ändern sich me wurde nun individuell untersucht, ob sie anhalten oder nicht, und auf
auch die Nachkommabits von Ω. Die her- diese Weise wurde das Wissen, das in den ersten Bits von Ω codiert ist,
ausgearbeiteten Eigenschaften bleiben da-
Stück für Stück zusammengetragen. Nachdem die terminierenden Pro-
von unberührt. So ist Ω z. B. immer ei-
gramme identifiziert waren, musste noch der Beweis erbracht werden,
ne rekursiv aufzählbare Zufallszahl, un-
abhängig von der jeweils gewählten Pro- dass die ermittelte Bitfolge stabil ist. Die entscheidende Entdeckung
grammiersprache. war, dass jedes terminierende Programm mit einer Länge größer als 84
Im Jahr 2001 gelang Antonín Kučera und Bits mit einer speziellen Bitsequenz beginnen muss, woraus Calude,
Theodore Slaman der erstaunliche Be- Dinneen und Shu schließlich folgern konnten, dass mindestens 64 der
weis, dass auch die Umkehrung gilt [115]: 84 berechneten Bits stabil sein müssen. Abbildung 6.18 präsentiert das
Für jede rekursiv aufzählbare Zufallszahl Ergebnis.
x aus dem offenen Intervall von 0 bis 1
können wir eine Programmiersprache und Auf den ersten Blick wirkt die Abfolge der Nullen und Einsen rein zu-
eine Codierung finden mit x = Ω. Die fällig. Handelt es sich bei der Chaitin’schen Konstanten Ω vielleicht um
Haltewahrscheinlichkeiten sind damit al- eine echte Zufallszahl im Sinne von Definition 6.3? Die Antwort ist Ja!
les andere als einsame Skurrilitäten im Den Grund hierfür wird uns das Ablaufdiagramm aus Abbildung 6.19
grenzenlosen Raum der reellen Zahlen. offenbaren. Zu Beginn bestimmt das beschriebene Programm – wir nen-
Ganz im Gegenteil: Sie sind überall!
nen es P – mithilfe der ersten n Bits von Ω alle terminierenden Program-
6.2 Die Chaitin’sche Konstante 359

me der Maximallänge n und merkt sich deren Ausgabe. Anschließend


wird die Variable i mit dem Wert 1 initialisiert und in einer Schleife Ist  eine zufällige
schrittweise erhöht. In jeder Iteration wird die Variable s mit dem i-ten Bitfolge?
Binärmuster beschrieben und mit den vorher ermittelten Ausgaben ver-
glichen. Genau dann, wenn s nicht die Ausgabe von einem der vorher
simulierten Programme ist, gibt P den Inhalt von s aus und hält an.
Wie groß ist die algorithmische Komplexität des ausgegebenen Bitmu- Eingabe: 
sters s? Ganz offensichtlich kann κ(s) nicht größer als |P| sein, denn s
wird von P ausgegeben. Auf der anderen Seite wird s von keinem Pro-
gramm mit einer Länge ≤ n ausgegeben, und deshalb muss κ(s) größer Ermittle mithilfe der
sein als n. Wir halten fest: ersten n Bits von 
alle terminierenden
n < κ(s) ≤ |P| (6.5) Programme der
Maximallänge n,
Über |P| können wir ebenfalls eine Aussage treffen. Um den Algorith- simuliere sie und fasse
mus in der skizzierten Form umzusetzen, benötigen wir eine konstante ihre Ausgaben in der
Anzahl von Bits für die Implementierung der Programmlogik. Zusätz- Menge M zusammen.
lich brauchen wir Platz, um die ersten n Bits von Ω zu speichern, also
mindestens κ(Ω[1 . . . n]) Bits. Damit können wir die Programmlänge
von P folgendermaßen quantifizieren:
i := 0
|P| = c + κ(Ω[1 . . . n])
Jetzt können wir (6.5) ganz einfach in
n < κ(x) ≤ c + κ(Ω[1 . . . n])
i := i + 1
umschreiben. Lösen wir die Ungleichung nach κ(Ω[1 . . . n]) auf, so er-
halten wir die Beziehung
κ(Ω[1 . . . n]) > n − c
s := die i-te Binärsequenz
Jetzt haben wir das Ergebnis schwarz auf weiß: Die algorithmische
Komplexität eines beliebigen Anfangsstücks Ω[1 . . . n] ist nur eine kons-
tante Anzahl von Bits kleiner als n. Aber genau dies ist das charakteris-
tische Merkmal, mit dem wir in Definition 6.3 den Begriff der Zufalls-
s  M?
zahl eingeführt haben. Damit gilt: Ja
Nein
Satz 6.4
Ausgabe: s
Die Bitfolge der Chaitin’schen Konstanten Ω ist zufällig.
Abbildung 6.19: Die Analyse dieses Pro-
gramms offenbart, dass die Bitfolge der
Chaitin’schen Konstanten keinerlei Gesetz-
Aus Satz 6.4 folgt unmittelbar, dass die Chaitin’sche Konstante das Wis-
mäßigkeit folgen kann: Ω ist eine Zufalls-
sen über sämtliche Haltewahrscheinlichkeiten Ωn in extrem verdichteter
zahl.
Form in sich vereint. Die Information ist darin so perfekt codiert, dass
keine weitere Kompression mehr möglich ist. Auch in dieser Hinsicht
ist Ω ein wahrhaft wundersames Objekt der Mathematik!
360 6 Algorithmische Informationstheorie

Kalkül K 6.3 Unvollständigkeit formaler Systeme




⎬ 0=0
σ =σ In diesem Abschnitt werden wir unsere Erkenntnisse aus dem Gebiet

⎭ f(σ ) = f(σ )
der algorithmischen Informationstheorie auf die Beweistheorie übertra-
gen und mit dem Chaitin’schen Unvollständigkeitssatz ein Resultat im
Gödel’schen Sinne erzielen. Dieser Satz wird ein helles Licht auf die
Gründe werfen, warum es in jedem hinreichend ausdrucksstarken for-
0=0 malen System wahre Sätze geben muss, die sich der formalen Beweis-
f(0) = f(0) barkeit entziehen.
f(f(0)) = f(f(0))
...
Der Brückenschlag zwischen der algorithmischen Informationstheorie
und der Beweistheorie gelingt auf erstaunlich einfache Weise, wenn wir
einen Kalkül K mit dem kleinstmöglichen Programm PK in Beziehung
setzen, das seine Theoreme aufzählt und nacheinander ausgibt (Abbil-
dungen 6.20 und 6.21). Dass ein solches Programm für jeden Kalkül
existieren muss, ist ein Ergebnis, das wir in Abschnitt 2.2 erzielt haben.
Programm PK
Dort haben wir herausgearbeitet, dass sich die Theoreme eines Kalküls
K sogar dann aufzählen lassen, wenn K nicht endlich axiomatisierbar
ist. Manchmal wird die Wahl von PK nicht eindeutig sein, da es mehre-
Abbildung 6.20: Wir setzen einen Kalkül re kleinstmögliche Programme geben kann. In diesem Fall kann jedes
K mit dem kleinstmöglichen Programm PK davon die Rolle von PK übernehmen; die konkrete Wahl ist für unsere
in Beziehung, das die Theoreme von K auf- Überlegung irrelevant.
zählt und der Reihe nach ausgibt.
Wir wollen nun versuchen, die Programmlänge |PK | grob abzuschätzen.
Zunächst halten wir fest, dass PK die Axiome und Schlussregeln von K
enthalten muss. Die Anzahl der Bits, die wir hierfür benötigen, bezeich-
nen wir mit |K|. Hinzu kommt eine konstante Anzahl an Bits, die wir
für die Implementierung der Aufzählroutine benötigen. Damit können
Kalkül K Programm PK wir die Länge von PK wie folgt beziffern:

|PK | = |K| + c

Den genauen Wert der Konstanten c kennen wir nicht, er spielt für un-
sere Überlegung aber auch keine Rolle.
Axiome Startwerte
Wenn wir im Folgenden von einem formalen System der Länge n oder
Schlussregeln Programm einfach nur von einem n-Bit-System sprechen, so meinen wir damit,
dass der betrachtete Kalkül K die Beziehung |PK | = n erfüllt. Mit ande-
Theoreme Ausgabe ren Worten: Es existiert ein Programm der Länge n, das die Theoreme
von K der Reihe nach aufzählt.
Ableitung Berechnung
Nehmen wir an, K sei ein Kalkül, der hinreichend ausdrucksstark ist,
Abbildung 6.21: Zusammenhang zwischen um Formeln ϕn (s) mit der folgenden Bedeutung zu formalisieren:
formalen Systemen (links) und Program-
men (rechts) „Die algorithmische Komplexität von s ist größer als n.“ (6.6)
6.3 Unvollständigkeit formaler Systeme 361

Für einen festen Wert von n wollen wir uns die Frage stellen, ob sich
eine Formel ϕn (s) innerhalb von K beweisen lässt. Hierzu könnten wir Ist eine Formel mit
das Programm PK starten und die ausgegebenen Theoreme beobachten. der Aussage (s) > n
in K beweisbar?
Mit etwas Glück taucht eine der Formeln ϕn (s) irgendwann unter den
ausgegebenen Theoremen auf und wir wüssten dann, dass sie innerhalb
von K bewiesen werden kann. Für kleine Werte von n könnte dies tat-
sächlich so ablaufen.
Eingabe: 
Wir werden das Programm PK jetzt zu einem Programm PK modifizie-
ren, das nicht mehr alle gefundenen Theoreme ausgibt, sondern still
nach dem Beweis für eine der Formeln ϕn (s) sucht (Abbildung 6.22). Generiere ein
Wird ein solcher Beweis gefunden, so extrahiert PK die Binärsequenz s, Theorem von K
gibt sie aus und hält an. Wird kein passender Beweis gefunden, läuft PK
für immer weiter, ohne jemals eine Ausgabe zu produzieren. Das aktuell generierte
Theorem sei T. Die
Für dieses Programm können wir dieselbe Größenüberlegung anstellen
Aufzählung soll so
wie vorhin. Es ist erfolgen, dass jedes
|PK | ≤ |K| + (log2 n) + c Theorem von K
irgendwann auftaucht.
für eine Konstante c ∈ N. Wenn wir den Wert von n sehr groß wählen,
dann gilt mit Sicherheit irgendwann die Beziehung
|PK | < n T = n(s)?
Nein
Wie wird sich das Programm PKfür solche Werte von n verhalten?
Per Konstruktion wird es genau dann eine Zeichenkette s ausgeben, Ja
wenn eine Formel ϕn (s) innerhalb von K beweisbar ist. Inhaltlich besagt
ϕn (s), dass die algorithmische Komplexität der Binärsequenz s größer Extrahiere die
ist als die Konstante n. Aber genau dies ist unmöglich, da wir s soeben Binärsequenz s
mit einem Programm ausgegeben haben, das kürzer ist als n. Hieraus
folgt, dass PK ab einem gewissen Wert von n keine Ausgabe mehr pro-
duzieren kann, falls der Kalkül K korrekt ist. Das heißt, dass in einem
Ausgabe: s
korrekten formalen System alle Aussagen der Form (6.6) ab einem ge-
wissen Wert von n unbeweisbar sein müssen. Genau dies ist die Aussage Abbildung 6.22: Das hier dargestellte Pro-
des Chaitin’schen Unvollständigkeitssatzes: gramm sucht nach einem Theorem mit der
inhaltlichen Aussage κ(s) > n. Ist die Su-
Satz 6.5 (Chaitin’scher Unvollständigkeitssatz) che erfolgreich, so wird die Binärsequenz s
ausgegeben, und das Programm angehalten.
In einem korrekten formalen System sind alle Aussagen der Form Ist der simulierte Kalkül K korrekt, so kann
das Programm für große Werte von n keine
κ(s) > n unbeweisbar, sobald n einen gewissen Wert übersteigt.
Ausgabe mehr produzieren. Würde es dies
dennoch tun, so wäre κ(s) < n. Gleichzeitig
Offensichtlich ist für jeden Wert n die Aussage κ(s) > n für gewisse würde K ein Theorem mit der inhaltlichen
Aussage κ(s) > n beweisen.
Binärsequenzen s wahr. Damit folgt aus Satz 6.5, dass in jedem korrek-
ten formalen System, das hinreichend ausdrucksstark ist, um Sätze der
Form (6.6) zu formalisieren, wahre, aber unbeweisbare Sätze existieren.
362 6 Algorithmische Informationstheorie

Aus der Unberechenbarkeit Wie ausdrucksstark muss ein formales System sein, um in den Sog des
von Ω folgt noch ein weite- Chaitin’schen Unvollständigkeitssatzes zu geraten? Um diese Frage zu
res Unvollständigkeitsresul- beantworten, bringen wir die umgangssprachliche Formulierung (6.6)
tat. Da sich nicht alle Bits zunächst in eine etwas formalere Form. (6.6) ist äquivalent zu der Be-
von Ω systematisch ermitteln lassen, kön-
hauptung, dass kein Programm P mit |P| ≤ n existiert, das s ausgibt.
nen die Aussagen der Form
Eine entsprechende Formel hätte demnach die folgende Gestalt:
„Das i-te Bit von Ω ist 0“ oder (6.8)
ϕn (s) = ¬∃ x (program(x) ∧ |x| ≤ n ∧ output(x) = s) (6.7)
„Das i-te Bit von Ω ist 1“ (6.9)

in einem korrekten formalen System nicht Der Teilausdruck |x| ≤ n ist eine arithmetische Aussage, und die Teil-
für alle i ∈ N beweisbar sein. Gregory formeln program(x) und output(x) drücken zusammen aus, dass x die
Chaitin gelang es, einen verblüffenden Gödelnummer eines Programms ist, das die Ausgabe s produziert. In
Zusammenhang zwischen Aussagen die- Abschnitt 5.4.2 haben wir am Beispiel der Turing-Maschine detailliert
ser Art und den Axiomen und Schlussre- gezeigt, dass sich Aussagen dieser Art arithmetisieren lassen. Auch
geln eines formalen Systems herzustellen. wenn hier noch viele technische Detailfragen zu klären sind, ist das
Er konnte zeigen, dass ein formales Sys- Ergebnis längst sichtbar: Bereits so einfache Systeme wie die Peano-
tem K, dessen Theoreme sich mit einem Arithmetik sind stark genug, um Aussagen der Form (6.7) zu formalisie-
Programm PK aufzählen und der Reihe
ren. Damit erfüllt jedes formale System, das die nötigen Ausdrucksmit-
nach ausgeben lassen, höchstens
tel enthält, um über die additiven und die multiplikativen Eigenschaf-
|PK | + 15328 ten der natürlichen Zahlen zu sprechen, die Voraussetzungen des Chai-
tin’schen Unvollständigkeitssatzes, und wir können aus Satz 6.5 den
Aussagen der Form (6.8) oder (6.9) be- folgenden Schluss ziehen:
weisen kann [26]. Ein faszinierendes Er-
gebnis!
Korollar 6.1

Jedes korrekte formale System, das stark genug ist, um die Peano-
Arithmetik zu formalisieren, ist unvollständig.

Dies ist exakt die Formulierung der semantischen Variante des ers-
ten Gödel’schen Unvollständigkeitssatzes aus Abschnitt 4.1. Anders als
dort ist es uns in diesem Abschnitt jedoch gelungen, den Unvollstän-
digkeitssatz auf verblüffend einfache Weise herzuleiten. Hierzu muss-
ten wir lediglich auf einige elementare Eigenschaften der algorithmi-
schen Komplexität zurückgreifen und einen geeigneten Zusammenhang
zwischen formalen Systemen und Programmen herstellen. Die Überle-
gung zeigt, warum die algorithmische Informationstheorie heute einen
so wichtigen Platz innerhalb der mathematischen Logik besetzt. Sie hat
einen Weg aufgezeigt, auf dem wir die Aussage des ersten Gödel’schen
Unvollständigkeitssatzes im Eiltempo erreichen können.
6.4 Übungsaufgaben 363

6.4 Übungsaufgaben

Mit ri (i ≥ 0) bezeichnen wir die i-te Ziffer einer zufälligen Binärsequenz. In welchen der Aufgabe 6.1
nachfolgend aufgelisteten Fälle ist die Sequenz s0 , s1 , s2 , . . . zufällig? 
Webcode
 
1 falls i < 10 rri falls i gerade 6988
a) si = b) si =
ri sonst ri sonst
 
ri falls i < 10 ri falls i eine Primzahl ist
c) si = d) si =
1 sonst 1 sonst
 
ri falls i gerade ri falls i eine Quadratzahl ist
e) si = f) si =
1 sonst 1 sonst

Benennen Sie, falls möglich, ein Beispiel für eine endlich lange Binärsequenz, die Aufgabe 6.2

I berechenbar und komprimierbar ist: Webcode
6125
I berechenbar, aber nicht komprimierbar ist:

I unberechenbar, aber komprimierbar ist:

I unberechenbar und nicht komprimierbar ist:

Benennen Sie, falls möglich, ein Beispiel für eine unendlich lange Binärsequenz, die

I berechenbar und komprimierbar ist:

I berechenbar, aber nicht komprimierbar ist:

I unberechenbar, aber komprimierbar ist:

I unberechenbar und nicht komprimierbar ist:


364 6 Algorithmische Informationstheorie

Aufgabe 6.3 In dieser Aufgabe wollen wir die inhaltliche Aussage von Satz 6.2 auf die Probe stellen.
 Der Satz besagt, dass kein systematisches Verfahren existieren kann, das stets korrekt
Webcode entscheidet, ob eine vorgelegte Binärsequenz s zufällig ist oder nicht. Das nachstehende
6879 Programm scheint aber genau dies zu leisten:

Eingabe: Wähle Q ∈ M Nein


Binärsequenz s M := M \ { Q }

M := Menge aller
Programme, die Output(Q) = s? M = ∅?
signifikant kürzer Nein
sind als s
Ja Ja
Ausgabe: Ausgabe:
„ s ist nicht zufällig  „ s ist zufällig

Der Algorithmus basiert auf der folgenden Überlegung: Es existieren nur endlich viele Pro-
gramme, die kürzer sind als die vorgelegte Binärsequenz s. Wäre diese Sequenz nicht zufällig,
so muss sie von einem dieser Programme ausgegeben werden. Wir müssen also lediglich über
die (endlich vielen) Programme iterieren, die signifikant kürzer sind als s, und die produzierte
Ausgabe mit s vergleichen. Stimmen beide überein, so ist s keine Zufallssequenz. Wird s von
keinem dieser Programme ausgegeben, dann liegt eine zufällige Sequenz vor. Offensichtlich
steht das Ergebnis im Widerspruch zu Satz 6.2. Wo steckt der Fehler?

Aufgabe 6.4 In Kapitel 1 haben wir die Vermutung über die Existenz unendlich vieler Primzahlzwillinge
 diskutiert. In Worten las sie sich wie folgt:
Webcode
6788 „Es existieren unendlich viele Zahlen n mit der Eigenschaft, dass n und n + 2
Primzahlen sind.“

Wir nehmen in dieser Aufgabe an, die Haltewahrscheinlichkeit Ωn sei für beliebige Werte
von n bekannt. Auf Seite 354 haben wir dargelegt, wie sich mit diesem Wissen z. B. die
Goldbach’schen Vermutung beweisen oder widerlegen ließe. Könnten wir mit der gleichen
Methode auch die Zwillingsvermutung entscheiden?

Aufgabe 6.5 In Abschnitt 6.2 haben wir herausgearbeitet, dass die Bitfolge der Chaitin’schen Konstanten
 zufällig ist. Ob an einer bestimmten Bitposition von Ω eine 0 oder eine 1 vorkommt, ist
Webcode damit völlig unabhängig von den Bits an anderen Positionen. Können wir trotzdem eine
6286 Aussage darüber treffen, wie viele Einsen und Nullen in einem Anfangsstück Ω[1 . . . n] für
größere Werte von n enthalten sein müssen?
6.4 Übungsaufgaben 365

In den Untersuchungen zur algorithmischen Komplexität haben wir vorausgesetzt, dass Aufgabe 6.6
die zugrunde gelegten Gödelisierungen präfixfrei sein müssen. Das bedeutet, dass die 
Gödelnummer eines Programms niemals mit der Gödelnummer eines anderen Programms Webcode
beginnt. Diese Aufgabe soll klären, warum wir diese Voraussetzung benötigen. 6799

Betrachten Sie hierzu die folgenden beiden Entscheidungsbäume:

000 000
00 00
001 001
0 0
010 010
01 01
011 011

100 100
10 10
101 101
1 1
110 110
11 11
111 111

Terminierendes Nichtterminierendes Nicht die Gödelnummer


Programm Programm eines Programms

I Begründen Sie, warum die jeweils verwendeten Gödelisierungen nicht präfixfrei sind.
I Berechnen Sie für jeden Entscheidungsbaum die Haltewahrscheinlichkeit Ω3 .
I Wiederholen Sie die Berechnung mit der nachstehenden Formel, die wir in Abschnitt 6.2
hergeleitet haben. Was stellen Sie fest?
1
Ωn = ∑ 2|P|
P hält,
|P| ≤ n
7 Modelltheorie

„So fängt denn alle


menschliche Erkenntnis mit Anschauungen an, geht von
da zu Begriffen und endigt mit Ideen.“

Immanuel Kant [105]

In den vorangegangenen Kapiteln haben wir mehrfach herausgestellt,


dass sich die Formeln eines Kalküls auf zwei Ebenen betrachten lassen.
Die erste ist die syntaktische Ebene. Hier sind Formeln nichts weiter
als Folgen von Symbolen über einem speziellen Zeichenvorrat, die sich
durch die Anwendung von Schlussregeln in andere Formeln übersetzen
lassen. Die zweite ist die semantische Ebene oder die Modellebene. Hier
wird den Logiksymbolen eine Bedeutung zugewiesen und eine Formel
hierdurch inhaltlich interpretierbar.

Die Modelltheorie ist derjenige Teilbereich der mathematischen Logik,


der sich mit den semantischen Eigenschaften von Formeln und For-
melmengen beschäftigt. Von vorrangiger Bedeutung sind die folgenden
Problemfelder:

I Modellkonstruktion
Die Modellkonstruktion verfolgt das Ziel, für eine vorgelegte For-
melmenge konstruktiv ein Modell zu erzeugen. Dabei ist der Nach-
weis der Existenz oftmals wichtiger als das Modell selbst. Der Grund
dafür ist einfach: Hat eine Formelmenge ein Modell, so ist automa-
tisch der Beweis erbracht, dass sie widerspruchsfrei ist; es ist dann
nicht möglich, dass sie eine Formel ϕ zusammen mit ihrer Negation
¬ϕ enthält. Eine Anwendung in dieser Richtung ist uns bereits in
Kapitel 1 begegnet, im Zusammenhang mit dem Hilbert’schen Wi-
derspruchsfreiheitsbeweis der euklidischen Geometrie.

I Modellanalyse
Im Rahmen der Modellanalyse wird versucht, Formelmengen an-
hand der Anzahl und der Struktur ihrer Modelle zu klassifizieren.
Typische Untersuchungen beschäftigen sich z. B. mit der Frage, ob

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6_7
368 7 Modelltheorie

die Modelle einer Formelmenge allesamt einen endlichen oder einen


unendlichen Individuenbereich aufweisen. Häufig wird nach For-
melmengen gesucht, die kategorisch sind. Das bedeutet, dass sie ein
Modell besitzen, das bis auf Isomorphie eindeutig bestimmt ist. Ein
wichtiges Resultat in dieser Hinsicht ist der Isomorphiesatz von De-
dekind. Dieser besagt, dass die natürlichen Zahlen bis auf Isomor-
phie eindeutig charakterisiert sind, wenn wir die Peano-Axiome in
der Prädikatenlogik zweiter Stufe niederschreiben.

I Axiomatisierbarkeit
1915 Leopold Löwenheim:
Viele Untersuchungen auf dem Gebiet der Modelltheorie sind Unter-
Löwenheim beweist den suchungen zur Axiomatisierbarkeit mathematischer Begriffe, etwa
Vorläufer des Satzes, den des Begriffs abzählbar. Hier geht es um die Frage, ob eine Formel
wir heute als den Satz von gefunden werden kann, die genau unter denjenigen Interpretationen
Löwenheim-Skolem wahr ist, die einen abzählbaren Individuenbereich aufweisen. Man-
bezeichnen. [119] che Untersuchungen beschäftigen sich mit der prinzipiellen Axio-
matisierbarkeit von Begriffen, d. h. mit der Frage, ob ein Begriff
1920 Thoralf Skolem: überhaupt innerhalb einer formalen Logik definiert werden kann.
Andere versuchen zu klären, ob eine Axiomatisierung in ganz be-
Skolem entwickelt die stimmten Logiken möglich ist. Überlegungen dieser Art haben wir
Arbeit von Löwenheim selbst schon angestellt. So haben wir in den Abschnitten 2.5 und 2.6
weiter. Er formuliert und
erkannt, dass weder der Begriff der Gleichheit noch der Begriff der
beweist den Satz von
Löwenheim-Skolem. [179]
Endlichkeit innerhalb der Prädikatenlogik erster Stufe definierbar
ist.

1929 Kurt Gödel:

In seiner Dissertation
formuliert und beweist 7.1 Meta-Resultate zur Prädikatenlogik
Gödel sowohl den
Vollständigkeitssatz als
auch den Getragen wird die Modelltheorie von vier Kernsätzen, die in der ersten
Modellexistenzsatz. [67] Hälfte des zwanzigsten Jahrhunderts entdeckt wurden (Abbildung 7.1).
Alle vier sind Meta-Resultate zur Prädikatenlogik erster Stufe.
1930 Kurt Gödel:
I Vollständigkeitssatz
Gödel restrukturiert die
Ergebnisse seiner Der Vollständigkeitssatz besagt, dass sich innerhalb der Prädikaten-
Dissertation. Unter logik erster Stufe alle allgemeingültigen PL1-Formeln aus den Axio-
anderem formuliert und men ableiten lassen. Er wurde im Jahr 1929 von Kurt Gödel im Rah-
beweist er dabei den
men seiner Dissertation bewiesen und wird aus diesem Grund als
Kompaktheitssatz. [68]
der Gödel’sche Vollständigkeitssatz bezeichnet. Wir haben uns mit
seiner inhaltlichen Aussage bereits ausgiebig in Abschnitt 2.4.2 be-
Abbildung 7.1: Meilensteine der Modell- schäftigt und werden ihn deshalb in diesem Kapitel nur noch am
theorie Rande streifen.
7.1 Meta-Resultate zur Prädikatenlogik 369

Abbildung 7.2: Das Jahr 1915 markiert


die Geburtsstunde der Modelltheorie. In
diesem Jahr publizierte der deutsche Ma-
thematiker Leopold Löwenheim den Vor-
läufer dessen, was wir heute als den
Satz von Löwenheim-Skolem bezeichnen.
Auch wenn die inhaltliche Aussage sei-
nes Satzes korrekt war, enthielt Löwen-
heims Beweis noch Fehler. Dem norwegi-
schen Mathematiker Thoralf Skolem ge-
lang es 1920, einen fehlerfreien Beweis
zu liefern und die inhaltliche Aussage des
Löwenheim’schen Satzes auf Formelmen-
gen auszuweiten. Skolems Variante aus
dem Jahr 1920 ist der Satz, den wir heute
als den Satz von Löwenheim-Skolem be-
zeichnen. Später wurde dessen inhaltliche
Aussage noch weiter verallgemeinert. Das
Ergebnis ist der Satz von Löwenheim-
Skolem-Tarski, den wir in Abschnitt 7.1.3
genauer untersuchen werden.

I Modellexistenzsatz
Der Modellexistenzsatz stellt einen Zusammenhang zwischen der
Widerspruchsfreiheit eines formalen Systems und der Existenz von
Modellen her. Neben dem Vollständigkeitssatz ist es das zweite
Kerntheorem, das die syntaktischen und die semantischen Eigen-
schaften eines formalen Systems in Beziehung setzt. Ausführlich
behandeln werden wir den Modellexistenzsatz in Abschnitt 7.1.1.
I Kompaktheitssatz
Der Kompaktheits- oder Endlichkeitssatz ist Gegenstand von Ab-
schnitt 7.1.2. Er besagt, dass eine unendliche Menge von Formeln
der Prädikatenlogik erster Stufe genau dann erfüllbar ist, wenn je-
de ihrer endlichen Teilmengen erfüllbar ist. Wir werden sehen, dass
wir mit dem Kompaktheitssatz ein wichtiges Instrument an die Hand
bekommen, mit dem sich viele Negativresultate der Prädikatenlogik
erster Stufe elegant herleiten lassen.
I Sätze von Löwenheim-Skolem und Löwenheim-Skolem-Tarski
Hat eine Formel der Prädikatenlogik erster Stufe ein unendliches
Modell, so folgt aus dem Satz von Löwenheim-Skolem-Tarski, dass
auch Modelle jeder anderen transfiniten Kardinalität existieren. Der
Satz gibt Antworten auf wichtige Kardinalitäts- und Kategorizitäts-
fragen der Prädikatenlogik erster Stufe und ist zugleich der Quell
370 7 Modelltheorie

Abbildung 7.3: Drei der vier Kernsätze


der Modelltheorie hat Kurt Gödel in ei-
ner Arbeit aus dem Jahr 1930 prägnant
ausformuliert [68]. In seiner Publikation
sind dies die Theoreme I, IX und X. Theo-
rem I ist das Hauptergebnis seiner 1929
erschienenen Dissertation, die Vollstän-
digkeit der Prädikatenlogik erster Stufe.
Der Modellexistenzsatz ist Theorem IX,
und der Kompaktheitssatz ist Theorem X.
Auch wenn die Reihenfolge anderes sug-
geriert, hat Gödel zuerst den Kompakt-
heitssatz bewiesen und daraus den Mo-
dellexistenzsatz als Korollar erhalten [46].
Eine kleine Notiz am Rande: Das Wort
Kompaktheit werden Sie in Gödels Arbeit
an keiner Stelle finden. Der Begriff wur-
de erst in den Fünfzigerjahren von Alfred
Tarski eingeführt.

scheinbarer Widersprüche. In Abschnitt 7.1.3 werden wir uns mit


den inhaltlichen Aussagen der Löwenheim-Skolem-Sätze auseinan-
dersetzen und danach einen Blick auf die Folgen und die vermeint-
lichen Paradoxien werfen, die sich aus ihnen ergeben.

Die Reihenfolge, in der wir die Kernsätze der Modelltheorie in diesem


Kapitel diskutieren, entspricht nicht der Reihenfolge ihrer Entdeckung.
Das historisch älteste Hauptergebnis ist der zuletzt genannte Satz, der
Satz von Löwenheim-Skolem. In seiner ursprünglichen Formulierung
wurde er von dem deutschen Mathematiker Leopold Löwenheim bereits
im Jahr 1915 entdeckt (Abbildung 7.2) [19, 119]. Obwohl sein Beweis
noch an mehreren Stellen fehlerhaft war, ist seine Arbeit von so großer
Bedeutung, dass wir das Jahr 1915 mit Fug und Recht als das Geburts-
jahr der Modelltheorie bezeichnen dürfen. 1920 bewies der norwegi-
sche Mathematiker Thoralf Skolem dann jenen Satz, den wir heute als
den Satz von Löwenheim-Skolem bezeichnen. Skolem gelang es, die
ursprüngliche Formulierung von Löwenheim zu verallgemeinern und
dessen Ergebnis korrekt zu beweisen. Im Rahmen dieser Arbeit führte
er auch die Skolem-Normalform ein, die heute zum Lehrstoff fast al-
ler Logikvorlesungen gehört (z. B. [173]). In den Folgejahren ließ Sko-
lem eine Reihe von Veröffentlichungen folgen, die zusätzliche Verein-
fachungen seines Beweises enthalten [180, 181].
7.1 Meta-Resultate zur Prädikatenlogik 371

Die drei anderen Kernsätze wurden zum ersten Mal von Kurt Gödel aus- Sind drei der vier Kerntheo-
drücklich formuliert. In seiner Dissertation aus dem Jahr 1929 bewies reme – gemeint sind die Sät-
Gödel den Vollständigkeitssatz und den Satz über die Modellexistenz ze über die Vollständigkeit, die Kompakt-
widerspruchsfreier Formelmengen. 1930 publizierte er seine Ergebnisse heit und die Modellexistenz – das alleini-
ge Werk von Kurt Gödel? Weder ein kla-
dann im Monatsheft für Mathematik und Physik [68] (Abbildung 7.3).
res Ja noch ein klares Nein würden der
Im Vergleich zu seiner Dissertation hatte er die Beweise in seiner Arbeit historischen Entwicklung gerecht werden.
aus dem Jahr 1930 erheblich umstrukturiert und um neue Theoreme er- Tatsächlich war Gödel der erste, der die
gänzt. Eine dieser Ergänzungen ist der Kompaktheitssatz, aus dem sich drei Kernsätze in präziser Form ausfor-
der Satz über die Modellexistenz als Korollar ergibt. In seiner Disserta- mulierte. Die Argumentationslinie, die er
tion hatte er den Modellexistenzsatz noch direkt bewiesen. in seinen Beweisen verwendete, war aber
keinesfalls neu; sie findet sich fast voll-
Dass wir von der historischen Reihenfolge in diesem Kapitel abweichen ständig in einer Arbeit von Skolem aus
und den Satz von Löwenheim-Skolem erst in Abschnitt 7.1.3 präsen- dem Jahr 1923 wieder [180]. Dort hat-
tieren, hat einen triftigen Grund. Wir werden sehen, dass sich wichti- te der Norweger sowohl den Vollständig-
ge Teilaspekte des Satzes von Löwenheim-Skolem über den Kompakt- keitssatz als auch den Modellexistenzsatz
heitssatz beweisen lassen und sich dieser elegant aus dem Modellexis- bewiesen, ohne sich dessen vollständig
tenzsatz herleiten lässt. In der gewählten Reihenfolge wird klar zum bewusst zu sein. Anders als Gödel un-
Vorschein treten, wie die Sätze inhaltlich zusammenhängen. terschied Skolem in seinen Untersuchun-
gen weniger rigide zwischen der syntak-
Ein Wort über die generelle Zielsetzung dieses Kapitels darf nicht feh- tischen und der semantischen Ebene, und
len. Anders als in den klassischen Lehrbüchern werden Sie hier kei- genau hierin sehen einige Historiker die
ne ausführlichen Beweise für die angesprochenen Kernsätze vorfinden. Ursache, warum Skolem die Tragweite
Wenn überhaupt, so werden wir lediglich die Beweisideen grob skizzie- seiner Ergebnisse schlicht nicht sah [46].
Rückblickend können wir sagen, dass der
ren. Aus diesem Grund kann dieses Kapitel die klassische Literatur zur
Weg durch Skolem geebnet wurde; doch
Modelltheorie nicht ersetzen – und will es auch gar nicht. Was uns in es war Gödel, der ihn als erster bis zum
diesem Kapitel interessiert, sind keine technischen Beweise; es sind die Ende ging. Dies ist der Grund, warum
inhaltlichen Aussagen der modelltheoretischen Kernsätze, ihre Zusam- der Modellexistenzsatz in der Literatur
menhänge und die abermals verblüffenden Folgen für die Mathematik. manchmal, und durchaus treffend, als das
Skolem-Gödel-Theorem bezeichnet wird.

7.1.1 Modellexistenzsatz

In diesem Abschnitt werden wir zu der Feststellung gelangen, dass die


syntaktische und die semantische Ebene eines formalen Systems nicht
unabhängig voneinander sind. Um keine unnötigen Hürden aufzubauen,
schicken wir zunächst ein paar sprachliche Vereinbarungen vorweg:

Definition 7.1 (Modelle von Kalkülen)

Sei K ein Kalkül und (U, I) eine Interpretation.


I Wir sagen, (U, I) ist ein Modell von K, wenn (U, I) ein Modell
für jedes Theorem von K ist.

I K heißt erfüllbar, wenn K mindestens ein Modell besitzt.


372 7 Modelltheorie

Ganz offensichtlich sind die Wir nehmen an, die Interpretation (U, I) sei ein Modell eines Kalküls
natürlichen Zahlen, zusam- K. Dann wissen wir, dass K widerspruchsfrei sein muss. Wäre nämlich
men mit der gewöhnlichen für eine Formel ϕ sowohl die Formel selbst als auch ihre Negation ¬ϕ
Addition und Multiplikati- beweisbar, so erhielten wir einen unmittelbaren Widerspruch zur Defi-
on, ein Modell für die Peano-Arithmetik.
nition der Modellrelation. Hierfür genügt es, uns die folgende Zeile aus
Nun hat die hier geführte Diskussion ge-
zeigt, dass wir aus der Existenz eines Mo-
Definition 2.16 in Erinnerung zu rufen:
dells sofort auf die Widerspruchsfreiheit
(U, I) |= (¬ϕ) ⇔ (U, I) |= ϕ (7.1)
des zugrunde liegenden formalen Systems
schließen können. Warum also hat Hilbert
Nun wollen wir uns die umgekehrte Frage stellen und annehmen, K sei
so lange nach einem Widerspruchsfrei-
heitsbeweis für die Arithmetik gesucht?
eine Theorie erster Stufe, d. h. ein formales System, das eine Reihe von
Verantwortlich hierfür ist die Tatsache, Theorieaxiomen vorhält und über den logischen Schlussapparat der PL1
dass wir die Widerspruchsfreiheit von PA verfügt. Können wir aus der Widerspruchsfreiheit von K folgern, dass
mit einem semantischen Argument be- diese Theorie ein Modell besitzt? Die Antwort lautet Ja!
gründet haben und nicht mit einem for-
malen Beweis. Dass die PA-Axiome un-
ter ihrer Standardinterpretation wahr sind,
Satz 7.1 (Modellexistenz, Gödel 1930)
erschließt sich uns aus intuitiven Grün-
Sei K eine Theorie erster Ordnung. Dann gilt:
den. Jeder von uns hat von Kindesbei-
nen an gelernt, mit den natürlichen Zah-
I K hat ein Modell ⇔ K ist widerspruchsfrei
len zu rechnen. Würden wir aber tatsäch-
lich versuchen, unsere intuitiven Argu-
Oder, was dasselbe ist:
mente zu formalisieren, so müssten wir,
bewusst oder unbewusst, auf Wissen und
I K ist erfüllbar ⇔ K ist widerspruchsfrei
Schlussweisen der Mengenlehre zurück-
greifen. Wir hätten die Widerspruchsfrei-
heit dann in einem System bewiesen, das
PA als Teilmenge enthält, und damit wäre Die Bedeutung des Modellexistenzsatzes ist weit größer, als es sein un-
nichts gewonnen. Niemand, der ernsthaft scheinbarer Wortlaut vermuten lässt. Zum einen ist er ein wertvolles
die Widerspruchsfreiheit von PA in Frage technisches Hilfsmittel, auf das in vielen Beweisen gern zurückgegrif-
stellt, würde einem Beweis vertrauen, der fen wird. Zum anderen hat er eine tiefgreifende philosophische Bedeu-
in ZF und damit in einem potenziell unsi- tung. Zu Beginn des zwanzigsten Jahrhunderts vertraten viele Gegner
chereren System geführt ist. der Formalisten die Meinung, dass die syntaktische Widerspruchsfrei-
heit einer Theorie nicht ausreicht, um sie als bedeutungstragend zu qua-
lifizieren [144]. Der Modellexistenzsatz besagt aber genau das: Es ist
möglich, jeder Theorie erster Stufe, in der niemals gleichzeitig eine For-
mel ϕ und ihre Negation ¬ϕ hergeleitet werden können, eine inhaltlich
konsistente Bedeutung zu verleihen.

Weiter oben haben wir erwähnt, dass der Modellexistenzsatz, zu Ehren


seiner Entdecker, gern als das Skolem-Gödel-Theorem bezeichnet wird.
Einen anderen Namen hat der US-amerikanische Mathematiker Abra-
ham Robinson in einer Publikation aus den Jahr 1951 geprägt [162].
Dort nennt er ihn den erweiterten Vollständigkeitssatz. Gemeint ist tat-
sächlich der Gödel’sche Vollständigkeitssatz der Prädikatenlogik erster
Stufe, ein Theorem, dessen inhaltliche Aussage eine völlig andere zu
7.1 Meta-Resultate zur Prädikatenlogik 373

sein scheint. Tatsächlich hängen beide Sätze viel enger zusammen, als Annahme: Es gibt eine
es der erste Blick erwarten lässt. Sehen wir also genauer hin! allgemeingültige Formel ,
die nicht aus den Axiomen
Wir nehmen an, ϕ sei eine allgemeingültige Formel erster Stufe, die der PL1 abgeleitet werden
sich nicht aus den Axiomen herleiten lässt. Fügen wir der PL1 die For- kann.
mel ¬ϕ als zusätzliches Axiom hinzu, so erhalten wir eine neue Theo-
rie, die wir PL1¬ϕ nennen (Abbildung 7.4). Da ϕ per Annahme nicht
innerhalb der PL1 bewiesen werden kann, ist PL1¬ϕ widerspruchsfrei.
Nach Satz 7.1 hat PL1¬ϕ ein Modell, d. h., es existiert eine Interpre- PL1 + ¬ϕ ist (U, I) |= ϕ
tation (U  , I  ), in der sämtliche Theoreme von PL1¬ϕ wahre Aussagen widerspruchsfrei für alle (U, I)
sind. Insbesondere ist auch ¬ϕ in (U  , I  ) wahr. Auf der anderen Seite
ist ϕ allgemeingültig. Das bedeutet, dass ϕ in allen möglichen Inter- Modellexistenzsatz
pretationen wahr ist und damit insbesondere in (U  , I  ). Somit würde
gleichzeitig (U  , I  ) |= ¬ϕ und (U  , I  ) |= ϕ gelten, im Widerspruch zu
Formel (7.1). Damit müssen wir die Annahme, ϕ sei innerhalb der Prä- (U  , I  ) |= ¬ϕ (U  , I  ) |= ϕ
dikatenlogik erster Stufe unbeweisbar, wohl oder übel fallen lassen und für ein (U  , I  ) für dieses (U  , I  )
erhalten den Gödel’schen Vollständigkeitssatz tatsächlich als Korollar
zu Satz 7.1:

Korollar 7.1 (Gödel’scher Vollständigkeitssatz, 1929)


Widerspruch
Die Prädikatenlogik erster Stufe ist vollständig. Jede allgemeingül-
Abbildung 7.4: Der Gödel’sche Vollstän-
tige PL1-Formel lässt sich aus den Axiomen herleiten. digkeitssatz ist eine direkte Folge aus dem
Modellexistenzsatz der Prädikatenlogik er-
ster Stufe.
Gilt der Modellexistenzsatz auch für Theorien höherer Stufe? Die Ant-
wort ist negativ: Die Modellexistenz ist eine exklusive Eigenschaft von
Theorien erster Stufe. Der Grund hierfür ist leicht einzusehen. Gäbe es
zu einer Theorie höherer Stufe bereits dann ein Modell, wenn sie wi-
derspruchsfrei ist, so könnten wir die gleiche Argumentationskette wie
eben anwenden und damit ihre Vollständigkeit beweisen. Wir wissen
aber schon, dass bereits die Prädikatenlogik zweiter Stufe unvollständig
ist; es bleiben dort immer allgemeingültige Formeln übrig, die nicht aus
den Axiomen abgeleitet werden können. Dass der Modellexistenzsatz
dort nicht gelten kann, ist also eine unmittelbare Konsequenz aus der
Unvollständigkeit der Prädikatenlogiken höherer Stufe.

7.1.2 Kompaktheitssatz

M sei eine höchstens abzählbare Menge prädikatenlogischer Formeln


erster Stufe. Wir nehmen an, M sei erfüllbar, d. h., es existiert eine In-
terpretation (U, I), unter der alle Formeln aus M wahre Aussagen sind.
374 7 Modelltheorie

M ist erfüllbar Wir wollen nun versuchen, einen Zusammenhang zwischen der Menge
(M hat ein Modell) M und ihren endlichen Teilmengen herzustellen. Ein offensichtliches
Ergebnis ist dieses hier: Ist (U, I) ein Modell von M, so ist (U, I) auch
ein Modell für jede endliche Teilmenge. Ungleich interessanter ist die
M umgekehrte Frage: Können wir aus dem Wissen, dass für jede endliche
Teilmenge von M ein Modell existiert, darauf schließen, dass auch M
ein Modell besitzt? Die Antwort liefert der Kompaktheitssatz (compact-

ness theorem) der Prädikatenlogik erster Stufe (Abbildung 7.5):
Endliche
Endliche Teilmenge Satz 7.2 (Kompaktheitssatz, Gödel 1930)
Teilmenge
Sei M eine höchstens abzählbare Menge von PL1-Formeln. Es gilt:
M
I M hat ein Modell ⇔
Jede endliche Teilmenge von M hat ein Modell
Endliche
Oder, was dasselbe ist:
Teilmenge
Jede endliche Teilmenge I M ist erfüllbar ⇔
von M ist erfüllbar
Jede endliche Teilmenge von M ist erfüllbar
(Jede endliche Teilmenge
von M hat ein Modell) Der Kompaktheitssatz wird auch als Endlichkeitssatz bezeichnet.
Abbildung 7.5: Der Kompaktheitssatz be-
sagt, dass eine höchstens abzählbare Men-
ge von PL1-Formeln genau dann erfüllbar Beweis: Die Richtung von links nach rechts ist trivial. Um die Richtung
ist, wenn alle endlichen Teilmengen erfüll- von rechts nach links zu zeigen, nehmen wir an, es gäbe tatsächlich eine
bar sind. unerfüllbare Menge M von PL1-Formeln, deren endliche Teilmengen
allesamt erfüllbar sind. Da M unerfüllbar ist, gibt es für diese Menge
kein Modell. Folgerichtig ist jede PL1-Formel eine logische Folgerung
aus M, beispielsweise diese hier:

ϕ := ∃ x (P(x) ∧ ¬P(x)) (7.2)

Für diese Formel gilt:

I ϕ ist unerfüllbar, da die Formel unter keiner Interpretation (U, I) zu


einer wahren Aussage werden kann. Also hat ϕ keine Modelle.
I ϕ lässt sich mit dem logischen Schlussapparat der PL1 aus der Men-
ge M herleiten. Dies ist eine Konsequenz aus dem Gödel’schen Voll-
ständigkeitssatz.

Wir wissen, dass eine Herleitung von ϕ nur endlich viele Beweisschrit-
te umfassen kann, und deshalb können innerhalb des Beweises auch nur
7.1 Meta-Resultate zur Prädikatenlogik 375

endlich viele Formeln aus der Menge M benutzt werden. Fassen wir alle
benutzten Formeln, wie in Abbildung 7.6 gezeigt, zusammen, so erhal- ψ1, ψ2, ψ3, …
ten wir eine endliche Teilmenge von M, aus der sich ein Widerspruch
herleiten lässt. Entgegen unserer Annahme existiert also doch eine end-
liche Teilmenge, die kein Modell besitzt. Jeder Beweis, der eine Formel φ
aus einer unendlichen Menge M
Bereits für sich allein gesehen ist der Kompaktheitssatz ein wertvolles ableitet, ...
Ergebnis. Mit seiner Hilfe können wir den schwer zu fassenden Begriff
der Unendlichkeit dieses Mal fest umgreifen. Noch spektakulärer sind Axiom
aber die Schlüsse, die wir aus dem Kompaktheitssatz ziehen können. Axiom
Unter anderem folgt aus ihm, dass sich der Begriff der Endlichkeit nicht …

Beweis für φ aus M


innerhalb der PL1 definieren lässt. In Abschnitt 2.6.1 hatten wir dieses ψ1 ∈ M
Ergebnis bereits vorweggenommen, aber erst jetzt sind wir in der Lage, …
eine solide Begründung dafür zu liefern. Gehen wir also davon aus, es ψ2 ∈ M
gäbe eine PL1-Formel ϕ<N mit der Eigenschaft …
ψn ∈ M
(U, I) |= ϕ<N ⇔ U ist endlich

Ohne Beschränkung der Allgemeinheit dürfen wir annehmen, dass die φ
Symbole P1 , P2 , P3 , . . . nicht in ϕ<N vorkommen. Mit den neuen Sym-
bolen definieren wir die folgende Schar von Formeln: kann nur endlich viele
Formeln aus M verwenden.
ϕ1 := ∃ x1 P1 (x1 ) Damit ist er auch ein Beweis,
ϕ2 := ∃ x2 (P2 (x2 ) ∧ ¬P1 (x2 )) der φ aus einer endlichen
Teilmenge von M
ϕ3 := ∃ x3 (P3 (x3 ) ∧ ¬P2 (x3 ) ∧ ¬P1 (x3 )) ableitet.
ϕ4 := ∃ x4 (P4 (x4 ) ∧ ¬P3 (x4 ) ∧ ¬P2 (x4 ) ∧ ¬P1 (x4 ))
... ψ1, ψ2, …, ψn

Kombinieren wir ϕ1 , . . . , ϕn konjunktiv miteinander, so erhalten wir mit

ϕ≥n := ϕ1 ∧ ϕ2 ∧ ϕ3 ∧ ϕ4 ∧ . . . ∧ ϕn Abbildung 7.6: Das Kernargument im Be-


weis des Kompaktheitssatzes
eine Formel, die offensichtlich nur dann wahr sein kann, wenn der In-
dividuenbereich mindestens n Elemente umfasst:

(U, I) |= ϕ≥n ⇒ U enthält mindestens n Elemente (7.3)

Als Nächstes betrachten wir die Menge

M := {ϕ<N , ϕ≥1 , ϕ≥2 , ϕ≥3 , . . .} (7.4)

Jede endliche Teilmenge ist ganz offensichtlich erfüllbar. Um für sie


ein Modell (U, I) zu konstruieren, suchen wir zunächst nach der Formel
ϕ≥n mit dem größten Index n und nehmen anschließend n Elemente
376 7 Modelltheorie

v1 , . . . , vn in die Individuenmenge U auf. Interpretieren wir das Prädi-


katzeichen Pi als die Relation {vi }, so ist (U, I) ein Modell. Nach dem
Kompaktheitssatz müsste dann auch M ein Modell besitzen, aber genau
dies ist unmöglich. Jedes Modell von M müsste wegen ϕ<N ∈ M einen
endlichen Individuenbereich besitzen, aber zugleich für jede beliebi-
ge natürliche Zahl n die Bedingung |U| ≥ n erfüllen. Der Widerspruch
zeigt, dass wir die Annahme über die Existenz von ϕ<N nicht aufrecht
erhalten können.

Korollar 7.2

Der Endlichkeitsbegriff ist innerhalb der Prädikatenlogik erster Stu-


fe nicht definierbar.

Obendrein können wir aus dem diskutierten Beispiel folgern, dass der
Kompaktheitssatz in Prädikatenlogiken höherer Stufe nicht gelten kann.
Sobald wir nämlich über Funktionen quantifizieren dürfen, lässt sich
ϕ<N problemlos auf Papier bringen:

ϕ<N := ∀ f (ϕI → ϕS )
= ∀ f (∀ x ∀ y (f(x) =
˙ f(y) → x =
˙ y) → ∀ y ∃ x (y =
˙ f(x)))

Die hier gezeigte Formel ist keine Fremde. Sie wurde von uns bereits
in Abschnitt 2.6.1 diskutiert und stimmt im Wortlaut mit der dort abge-
druckten Formel (2.7) überein.

Malcevs Beitrag

Eine unscheinbare, aber wertvolle Weiterentwicklung hat der Kompakt-


heitssatz durch den russischen Mathematiker Anatolij Ivanovič Malcev
erfahren. Im Jahr 1936 gelang ihm der Nachweis, dass sich die Voraus-
setzung, M sei eine höchstens abzählbare Menge, ersatzlos streichen
lässt [84, 121, 122]. Eine verständliche Herleitung dieses Ergebnisses
findet sich beispielsweise in der Dissertation von Leon Henkin aus dem
Jahr 1947 [80].

Satz 7.3 (Kompaktheitssatz, Malcev 1936)

Sei M eine Menge von Formeln der PL1. Dann gilt:

M ist erfüllbar ⇔ Jede endliche Teilmenge von M ist erfüllbar


7.1 Meta-Resultate zur Prädikatenlogik 377

Der Satz von Malcev garantiert uns, dass die Kompaktheitseigenschaft


selbst dann gilt, wenn M überabzählbar ist. Tatsächlich zeigte Malcev
in seinem Beweis noch mehr. Er hatte, anders als wir, zu keiner Zeit
verlangt, dass der Symbolvorrat einer Logik endlich sein muss. Malcevs
Ergebnis gilt sogar für Mengen von Formeln, die aus einem überabzähl-
baren Symbolvorrat schöpfen. Wir hatten bisher immer einen endlichen In seiner Arbeit aus dem
Symbolvorrat gefordert, und aus der Sicht des Logikers gibt es hierfür Jahr 1915 hat Löwenheim
gute Gründe. Niemand wird jemals in die Verlegenheit kommen, un- seinen berühmten Satz wie
endlich viele Symbole für die Niederschrift einer Formel zu benötigen. folgt formuliert:
Wozu ist diese Verallgemeinerung dann überhaupt nötig? Im momen-
Satz 2: „Jede Fluchtzählgleichung ist
tanen Licht der Diskussion wirkt sie wie eine Nebensächlichkeit, doch
bereits in einem abzählbaren
schon im nächsten Abschnitt werden wir die wahre Stärke des Mal-
Denkbereich nicht mehr für beliebige
cev’schen Resultats erkennen. Wir werden zeigen, dass sich daraus eine Werte der Relativkoeffizienten erfüllt.“
wichtige Teilaussage des Satzes von Löwenheim-Skolem-Tarski ergibt, ( [119], Seite 450)
und zwar fast von selbst.
Ein Denkbereich ist das, was wir heute
als Interpretation bezeichnen, und Löwen-
heims Fluchtzählgleichungen sind Logik-
7.1.3 Satz von Löwenheim-Skolem formeln erster Stufe, die nicht unbe-
dingt allgemeingültig sind, aber unter al-
Der Satz von Löwenheim-Skolem ist neben dem Modellexistenzsatz, len Interpretationen wahr werden, die ei-
dem Vollständigkeitssatz und dem Kompaktheitssatz das vierte große ne endliche Individuenmenge aufweisen.
Ergebnis der Modelltheorie. Seine historisch älteste Variante wurde im Um zu sehen, dass sich aus Löwenheims
Jahr 1915 von dem deutschen Mathematiker Leopold Löwenheim for- Satz 2 tatsächlich die inhaltliche Aussa-
ge von Satz 7.4 ableiten lässt, bringen wir
muliert [119]. In moderner Terminologie lautet sie folgendermaßen:
die Originalformulierung zunächst in eine
zeitgemäßere Form:
Satz 7.4 (Löwenheim, 1915) Satz 2’: „Jede Fluchtzählgleichung ist
unter mindestens einer abzählbaren
Sei ϕ eine Formel der Prädikatenlogik erster Stufe. Dann gilt: Interpretation falsch.“
I ϕ hat ein Modell ⇒ ϕ hat ein Modell (U, I) mit |U| ≤ |N| Sei nun ϕ eine Formel, die alle Voraus-
setzungen von Satz 7.4 erfüllt (ϕ ist eine
erfüllbare Formel der Prädikatenlogik er-
Der Satz von Löwenheim führt uns auf verblüffende Weise die Grenzen ster Stufe). Hat ϕ ein endliches Modell,
der PL1 vor Augen. Er schließt aus, dass wir innerhalb der Prädikaten- also ein Modell (U, I) mit |U| < |N|, so
logik erster Stufe eine Formel formulieren können, die ausschließlich ist die Aussage von Satz 7.4 trivialerwei-
Modelle mit einem überabzählbaren Individuenbereich besitzt. Hat ei- se erfüllt. Hat ϕ kein endliches Modell, so
ne PL1-Formel überhaupt ein Modell, so existiert auch immer eines, das muss ¬ϕ unter allen endlichen Interpre-
tationen wahr sein. Kurzum: ¬ϕ ist das,
eine höchstens abzählbare Grundmenge aufweist.
was Löwenheim als Fluchtzählgleichung
Im Jahr 1920 gelang es Thoralf Skolem, den Satz von Löwenheim zu bezeichnet. Dann folgt aus Satz 2’, dass
verallgemeinern. Er sah, dass der Satz nicht nur für einzelne Formeln ¬ϕ unter mindestens einer abzählbaren
gilt, sondern gleichermaßen für endliche oder abzählbar unendliche For- Interpretation falsch ist. Diese Interpreta-
melmengen. Als Ergebnis entstand jenes Theorem, das wir heute als die tion ist dann ein Modell für ϕ, und genau
dies ist die Aussage unseres Satzes 7.4.
klassische Formulierung des Satzes von Löwenheim-Skolem ansehen:
378 7 Modelltheorie

Dass wir Satz 7.6 heute als Satz 7.5 (Satz von Löwenheim-Skolem, Skolem 1920)
den Satz von Löwenheim-
Skolem-Tarski bezeichnen, wird seinen Sei M eine Menge von PL1-Formeln mit |M| ≤ |N|. Dann gilt:
Namensgebern nur bedingt gerecht. Es ist
historisch korrekt, die inhaltliche Aussa- I M hat ein Modell ⇒ M hat ein Modell (U, I) mit |U| ≤ |N|
ge des LST-Theorems mit Alfred Tarski
zu verbinden. Von ihm stammt die aufstei-
gende Komponente des LST-Theorems, In Wirklichkeit zeigte Skolem noch mehr. Er erkannte, dass sich das
also jener Teil, der uns auf die Existenz
Modell (U, I) in Satz 7.5 als Untermodell wählen lässt. Das bedeutet,
von Modellen mit höheren Kardinalitäten
schließen lässt. Fragwürdig ist dagegen
dass U eine Teilmenge der ursprünglichen Individuenmenge ist und die
die Nennung von Thoralf Skolem. Dass Interpretation der Prädikat- und Funktionssymbole für alle in U verblie-
wir den Satz heute unverhohlen mit sei- benen Elemente unverändert übernommen wird.
nem Namen verbinden, täuscht darüber
hinweg, dass sich Skolem niemals mit Obwohl Skolem, anders als Löwenheim, ein fehlerfreier Beweis gelang,
ihm identifizieren konnte. Tatsächlich hat war seine Arbeit aus dem Jahr 1920 mit einem Wermutstropfen behaftet.
er die Existenz überabzählbarer Mengen Er erzielte sein Ergebnis mithilfe des Auswahlaxioms; gleichwohl war
zeitlebens abgelehnt und die aufsteigende er davon überzeugt, dass ein Beweis auch ohne diese damals umstritte-
Variante des LST-Theorems niemals als ne Konstrukt der Mengenlehre gelingen müsse. Tatsächlich dauerte es
sinntragenden Satz der Mathematik ak- nicht lange, bis seine Anstrengungen erfolgreich waren, und so erschien
zeptiert. Bruno Poizat äußert sich in [145] bereits 1922 eine Variante, die das Auswahlaxiom nicht benötigt [180].
wie folgt über die Problematik:
In den Folgejahren konnte die Aussage des Satzes von Löwenheim-
„Legend has it that Thoralf Skolem, up Skolem noch weiter verstärkt werden. Das wichtigste Ergebnis in die-
until the end of his life, was scandalized ser Richtung ist der Satz von Löwenheim-Skolem-Tarski, der gern auch
by the association of his name to a result
als LST-Theorem bezeichnet wird. Skolem zufolge wurde er durch den
of this type, which he considered an
absurdity, nondenumerable sets being,
polnisch-US-amerikanischen Mathematiker Alfred Tarski in einem Se-
for him, fictions without real existence.“ minar im Jahr 1928 bewiesen, eine schriftliche Aufzeichnung darüber
existiert leider nicht [46,182,203]. Der erste publizierte Beweis stammt
von Malcev aus dem Jahr 1936.

Satz 7.6 (Satz von Löwenheim-Skolem-Tarski)

M sei eine Menge von PL1-Formeln, und λ , κ seien zwei beliebige


transfinite Kardinalzahlen. Dann gilt:
I M hat ein Modell mit |U| = λ ⇒ M hat ein Modell mit |U| = κ

Die Aussage des Satzes von Löwenheim-Skolem-Tarski verblüfft aber-


mals. Wissen wir, dass eine Menge M von PL1-Formeln irgendein un-
endliches Modell besitzt, so können wir eine beliebige transfinite Kar-
dinalzahl κ wählen und aus dem Satz von Löwenheim-Skolem-Tarski
folgern, dass für M auch ein Modell der Kardinalität κ existiert. In den
Abschnitten 7.2 und 7.3 werden wir erarbeiten, welch einschneidende
Konsequenzen sich hieraus für die Mathematik ergeben.
7.1 Meta-Resultate zur Prädikatenlogik 379

Manchmal wird der Satz von Löwenheim-Skolem-Tarski in zwei Teil-


sätze zerlegt. Wir sprechen dann von einer absteigenden und einer auf-
steigenden Variante (Abbildung 7.7):
Hat  ein
unendliches Modell, ...
Satz 7.7 (Absteigendes LST-Theorem)

M sei eine Menge von PL1-Formeln, und λ , κ seien zwei beliebige



transfinite Kardinalzahlen mit λ > κ. Dann gilt: ...so existieren Modelle jeder
beliebigen transfiniten Kardinalität.
I M hat ein Modell mit |U| = λ ⇒ M hat ein Modell mit |U| = κ …

Aufsteigendes LST-Theorem
In Worten besagt die absteigende Variante, dass wir aus der Existenz
eines unendlichen Modells stets darauf schließen können, dass auch für
alle kleineren unendlichen Kardinalitäten ein Modell existiert.
Kardinalitätssprung

Satz 7.8 (Aufsteigendes LST-Theorem)

M sei eine Menge von PL1-Formeln, und λ , κ seien zwei beliebige


transfinite Kardinalzahlen mit λ < κ. Dann gilt: Kardinalitätssprung

I M hat ein Modell mit |U| = λ ⇒ M hat ein Modell mit |U| = κ

Absteigendes LST-Theorem Kardinalitätssprung


In Worten besagt die aufsteigende Variante, dass wir aus der Existenz
eines unendlichen Modells stets darauf schließen können, dass auch für
alle größeren Kardinalitäten ein Modell existiert. Insbesondere folgt aus
der aufsteigenden Variante, dass es für jede PL1-Formel ϕ, die ein ab-
zählbar unendliches Modell besitzt, immer auch ein überzählbares ge- Kardinalitätssprung
ben muss.

Die aufsteigende Variante des LST-Theorems können wir elegant aus


der absteigenden Variante und dem Kompaktheitssatz herleiten. Wie in
Satz 7.8 verlangt, seien mit λ und κ zwei transfinite Kardinalzahlen mit Abzählbares Modell
λ < κ gegeben. Ferner sei M eine Menge von PL1-Formeln, die ein
Modell (U, I) mit |U| = λ besitzt. Dann können wir in wenigen Schrit- Abbildung 7.7: Der Satz von Löwenheim-
ten ein Modell (U  , I  ) mit |U  | = κ erhalten. Zu allererst erweitern wir Skolem-Tarski besagt, dass wir in der Prä-
das Vokabular unserer Logik um κ neue Konstantensymbole. Anschlie- dikatenlogik erster Stufe aus der Existenz
ßend drücken wir mit einer Reihe von PL1-Formeln aus, dass die neuen eines unendlichen Modells auf die Existenz
Symbole paarweise verschieden sind. Dies können wir mit κ · κ For- von Modellen beliebiger transfiniter Kardi-
nalität schließen können.
meln erledigen, die wir mit ϕ zu einer Menge M  vereinen. Ganz offen-
sichtlich ist jede endliche Teilmenge von M  erfüllbar, so dass wir aus
dem Kompaktheitssatz folgern können, dass auch M  ein Modell haben
muss.
380 7 Modelltheorie

Beachten Sie, dass wir diesen Beweisschritt nicht mit der klassischen
Variante des Kompaktheitssatzes legitimieren können, da M  überab-
zählbar viele Formeln umfassen kann. Was wir an dieser Stelle benö-
tigen, ist die von Malcev bewiesene Erweiterung aus dem Jahr 1936
(Satz 7.3). Sie besagt, dass der Kompaktheitssatz auch dann gilt, wenn
wir überabzählbar viele Formeln über einem überabzählbaren Symbol-
vorrat betrachten.

Aus dem Kompaktheitssatz wissen wir jetzt, dass M  ein Modell besitzt,
aber was können wir über dessen Kardinalität aussagen? Zunächst hal-
ten wir fest, dass M  so konstruiert ist, dass jedes Modell zwingend eine
Kardinalität ≥ κ haben muss. Jetzt folgt aus dem absteigenden LST-
Theorem, dass für M  auch ein Modell der Kardinalität κ existiert, und
genau dies ist die Aussage des aufsteigenden LST-Theorems.

Abschließend sei bemerkt, dass sich der Satz von Löwenheim-Skolem-


Tarski in dem gleichen Sinne verstärken lässt wie Satz 7.5. Es lässt sich
zeigen, dass die postulierten Modelle entweder als Untermodelle oder
als Modellerweiterungen erhalten werden können. Wir werden diese
Verstärkung hier nicht benötigen und haben das Theorem absichtlich in
der leicht schwächeren, aber verständlicheren Formulierung präsentiert.

7.2 Nichtstandardmodelle von PA

Wie gewohnt gehen wir davon aus, dass die Peano-Arithmetik frei von
Widersprüchen ist. Es soll also keine Formel ϕ existieren, die zusam-
men mit ihrer Negation ¬ϕ aus den Axiomen abgeleitet werden kann.
Unter dieser Annahme sind die natürlichen Zahlen mit der gewöhnli-
chen Addition und Multiplikation ein (abzählbares) Modell von PA, das
wir mit (N, {s, +, ×}) abkürzen. Wir hatten es das Standardmodell der
Peano-Arithmetik genannt, da es den arithmetischen Formeln ihre zu-
gedachte Bedeutung verleiht.

Eine Interpretation, die alle PA-Axiome erfüllt, aber nicht isomorph zu


den natürlichen Zahlen ist, heißt Nichtstandardmodell. Es ist ein Ziel
der Axiomatisierung, diese ungebetenen Gäste fern zu halten; gleich-
wohl können wir uns mit dem bisher erworbenen Wissen leicht da-
von überzeugen, dass dies weder für PA noch für ZF gelingen kann.
Die Existenz von Nichtstandardmodellen ist eine unausweichliche Fol-
ge aus dem Satz von Löwenheim-Skolem-Tarski und der Tatsache,
dass sowohl die Peano-Arithmetik als auch die Zermelo-Fraenkel-
Mengenlehre Theorien erster Stufe sind.
7.2 Nichtstandardmodelle von PA 381

Es war also keinesfalls folgenlos, dass wir das Prinzip der vollständigen
Induktion in Abschnitt 3.1.3 als Axiomenschema erster Stufe formu-
liert haben. Die Peano-Arithmetik verliert hierdurch die Eigenschaft,
kategorisch zu sein. Im ersten Moment ist diese Nachricht schwer zu
verdauen. Durch den Verzicht auf das Induktionsaxiom zweiter Stufe
haben wir Geistermodelle ins Leben gerufen, deren Existenz durch den
Satz von Löwenheim-Skolem-Tarski zweifelsfrei gesichert ist. Aber
wie sind diese Modelle aufgebaut? Wie können sie von der Struktur
der natürlichen Zahlen abweichen und dennoch mit sämtlichen Peano-
Axiomen verträglich sein?

Im nächsten Abschnitt werden wir versuchen, zwei dieser mysteriösen


Strukturen aus der Dunkelheit zu locken. Zu viel Euphorie ist an dieser
Stelle aber keinesfalls angebracht. Sie werden sehen, dass wir es hier
mit sehr scheuen Wesen zu tun haben.

7.2.1 Abzählbare Nichtstandardmodelle

Die Existenz eines abzählbaren Nichtstandardmodells können wir


mit wenig Aufwand aus dem Kompaktheitssatz und dem Satz von
Löwenheim-Skolem-Tarski herleiten. Hierzu definieren wir zunächst
eine Reihe von Formeln ϕn über die Beziehung
ϕn := (c > n)
Vereinigen wir diese Formeln mit den PA-Axiomen zu einer Menge
M := PA ∪ {ϕ0 , ϕ1 , ϕ2 , . . .}
so ist jede endliche Teilmenge von M ganz offensichtlich erfüllbar, und
wir können aus dem Kompaktheitssatz folgern, dass M ein Modell be-
sitzt. So wie wir die Formeln ϕn konstruiert haben, muss der Individu-
enbereich unendlich viele Elemente umfassen, und damit gibt es nach
dem Satz von Löwenheim-Skolem-Tarski auch ein abzählbares Modell.
Da die Formeln ϕn alle gleichzeitig wahr sind, muss dort ein Element
existieren, das größer ist als jede natürliche Zahl. Innerhalb von N kön-
nen wir ein solches Element nicht finden. Das bedeutet, dass wir tat-
sächlich ein Modell vor uns haben, das nicht zur Standardinterpretation
(N, {s, +, ×}) isomorph sein kann.

Wir wollen versuchen, ein wenig mehr über die Struktur dieses Modells
in Erfahrung zu bringen. Zunächst ist es offensichtlich, dass es auch
hier ein kleinstes Element, die Null, geben muss und sich die natürlich-
en Zahlen kettenförmig daran anschließen. Die Struktur des Nichtstan-
dardmodells beginnt demnach mit der Sequenz der natürlichen Zahlen.
382 7 Modelltheorie

I Erste Beobachtung Daneben muss ein Element existieren, wir nennen es λ , das größer ist
als alle natürlichen Zahlen (Abbildung 7.8 oben):
„Es existiert ein Element λ , das größer
ist als alle natürlichen Zahlen.“
λ >x für alle x ∈ N (7.5)
λ
… Die Peano-Axiome stellen sicher, dass die Null das einzige Element
ist, das keinen Vorgänger hat. Das heißt, dass sich unendlich viele Ele-
mente links von λ befinden müssen, die ihrerseits größer sind als alle
I Zweite Beobachtung natürlichen Zahlen. Genauso muss sich der Zahlenstrahl rechts von λ
in das Unendliche erstrecken, da nach den Peano-Axiomen jede Zahl
„Links und rechts von λ erstreckt sich einen Nachfolger besitzt. Unser Nichtstandardmodell beginnt also mit
ein Zahlenstrahl in das Unendliche. der Struktur der natürlichen Zahlen N, gefolgt von einer Kopie von Z,
Also liegt λ auf einer Kopie von Z.“
auf der sich irgendwo unser Element λ befindet (Abbildung 7.8 Mitte).
λ Damit ist die Struktur immer noch nicht vollständig beschrieben. Neben
… … … dem Element λ existiert auch das Element 2λ . Dieses kann aber nicht
auf dem Zahlenstrahl von λ liegen, da es andernfalls durch endlich viele
Nachfolgerschritte von λ aus erreichbar sein müsste. Für eine natürli-
I Dritte Beobachtung che Zahl x ∈ N wäre dann λ + x = 2λ , und hieraus würde x = λ folgen,
„Die Elemente 2λ , 3λ , . . . müssen sich im Widerspruch zu Ungleichung (7.5). Das bedeutet, dass hinter dem
auf separaten Kopien von Z befinden.“ Anfangsstück N unendlich viele Kopien von Z folgen müssten, auf de-
nen sich irgendwo die Elemente λ , 2λ , 3λ , . . . befinden (Abbildung 7.8
λ unten).
…… …
Auch damit sind wir noch nicht am Ende. Wir betrachten das Element

… … 3λ und nehmen an, es handele sich dabei um eine gerade Zahl. Ist sie
ungerade, so wiederholen wir die Betrachtung für den direkten Nachfol-
3λ ger 3λ + 1. Gerade Zahlen lassen sich als die zweifache Summer einer
… … anderen Zahl schreiben, d. h., es ist 3λ = 2κ. Das Element κ erfüllt of-
fenbar die Bedingung λ < κ < 2λ und liegt damit irgendwo zwischen
λ und 2λ . Aber wo befindet es sich genau?
Abbildung 7.8: Notwendige Eigenschaf-
ten eines abzählbaren Nichtstandardmo-
dells der Peano-Arithmetik I κ kann nicht auf dem Zahlenstrahl von λ liegen. Wäre dies der Fall,
so wäre κ = λ + x für ein x ∈ N. Daraus folgte 2κ = 2λ + 2x = 3λ .
Damit wäre 2x = λ , im Widerspruch zu Ungleichung (7.5).
I κ kann nicht auf dem Zahlenstrahl von 2λ liegen. Wäre dies der
Fall, so wäre κ + x = 2λ für ein x ∈ N. Daraus folgte 2κ + 2x =
3λ + 2x = 4λ . Damit wäre erneut 2x = λ , im Widerspruch zu Un-
gleichung (7.5).

Die Überlegung zeigt, dass zwischen dem Zahlenstrahl von λ und dem
Zahlenstrahl von 2λ ein weiterer liegen muss. Wir können das Argu-
ment verallgemeinern und daraus schließen, dass sich zwischen zwei
beliebigen Kopien von Z immer eine weitere befindet. Die Kopien von
7.2 Nichtstandardmodelle von PA 383

… … … … … …
25 26 27
16  16  16 

… … … … … …
5 6 7
4  4
 4


… … … … … … …

0 1 2 3 4  2 3

Abbildung 7.9: Ordnungsstruktur aller abzählbaren Nichtstandardmodelle der Peano-Arithmetik

Z bilden zusammen eine dichte Ordnung mit offenen Enden und be-
sitzen damit exakt die gleiche Anordnung wie die rationalen Zahlen.
Abbildung 7.9 fasst das Ergebnis unserer Überlegung zusammen. Die
Struktur des Nichtstandardmodells beginnt mit den natürlichen Zahlen
N, gefolgt von Q Kopien der ganzen Zahlen Z.

Die hier herausgearbeiteten Merkmale sind notwendige Eigenschaften


von abzählbaren Nichtstandardmodellen, in denen ein Element λ grö-
ßer ist als alle natürlichen Zahlen. Tatsächlich lässt sich zeigen, dass in
jedem Nichtstandardmodell der Peano-Arithmetik ein solches Element
vorhanden ist und somit jedes Modell, das nicht isomorph zu den natür-
lichen Zahlen ist, die Struktur aus Abbildung 7.9 aufweist [106].

Jetzt müssen wir nur noch die Addition und die Multiplikation so de-
finieren, dass sie nicht im Widerspruch zu den Peano-Axiomen stehen.
Tatsächlich hat es nie jemand geschafft, eine konkrete Abbildungsvor-
schrift zu formulieren. Der Beweis, dass eine verträgliche Definition
existiert, wird in der Literatur niemals konstruktiv geführt; die Existenz
einer geeigneten Addition und Multiplikation wird dort stets gezeigt,
ohne dass eine konkrete Berechnungsvorschrift angegeben wird.

Heute wissen wir, dass ein konstruktiver Beweis gar nicht existieren
kann. Dies ist das erstaunliche Ergebnis von Stanley Tennenbaum aus
dem Jahr 1959 [106, 197]:
384 7 Modelltheorie

Satz 7.9 (Tennenbaum, 1959)

Kein Nichtstandardmodell der Peano-Arithmetik ist berechenbar.

Konkret besagt der Satz von Tennenbaum, dass kein abzählbares Nicht-
standardmodell existiert, in dem sowohl die Multiplikation als auch die
Addition berechenbar sind. Damit stehen wir vor einem Dilemma. Ei-
nerseits wissen wir, dass ein abzählbares Standardmodell existiert; wir
kennen seine Struktur und wissen, dass es eine Interpretation der Sym-
bole ‚+‘ und ‚ב geben muss, die mit den Peano-Axiomen verträglich
ist. Andererseits werden wir niemals in der Lage sein, die Addition und
die Multiplikation präzise zu definieren. Jede konkrete Festlegung hätte
zur Folge, dass wir die Summe und das Produkt zweier Elemente aus-
rechnen könnten, und genau dies ist nach Satz 7.9 nicht möglich.

Nahe sind wir an die abzählbaren Nichtstandardmodelle herangekom-


men, doch der letzte Schritt bleibt uns offenbar verwehrt. Der Satz von
Tennenbaum macht unmissverständlich klar, dass die Nichtstandardmo-
delle von einem Schleier umgeben sind, den unsere Blicke niemals voll-
ständig durchdringen können. Ein faszinierendes Ergebnis.

7.2.2 Überabzählbare Nichtstandardmodelle


I Nachfolgeroperation In Abschnitt 7.2.1 haben wir den Kompaktheitssatz und den Satz
X =( x0 , x1 , x2 , . . .) von Löwenheim-Skolem-Tarski verwendet, um die Existenz eines ab-
zählbaren Nichtstandardmodells zu belegen. Der Satz von Skolem-
s(X) = ( s(x0 ) , s(x1 ) , s(x2 ) , . . .) Löwenheim-Tarski besagt aber noch mehr. Aus ihm geht zusätzlich
hervor, dass es für die Peano-Arithmetik nicht nur abzählbare, sondern
I Addition auch überabzählbare Modelle geben muss. Wie ein solches Modell kon-
struiert werden kann, wollen wir in diesem Abschnitt in groben Zügen
X =( x0 , x1 , x2 , . . .)
nachvollziehen.
Y =( y0 , y1 , y2 , . . .)
Die Grundbausteine, die wir in unserer Konstruktion verwenden, sind
X +Y = ( x0 + y0 , x1 + y1 , x2 + y2 , . . .) Folgen von natürlichen Zahlen. Formal sind sie Elemente der Menge
NN und haben die Form
I Multiplikation
(x0 , x1 , x2 , . . .) mit xi ∈ N.
X =( x0 , x1 , x2 , . . .) Die Nachfolgeroperation, die Addition und die Multiplikation definie-
Y =( y0 , y1 , y2 , . . .) ren wir komponentenweise, wie in Abbildung 7.10 gezeigt.
X ×Y = ( x0 × y0 , x1 × y1 , x2 × y2 , . . .)
In der Menge aller Zahlenfolgen sind die natürlichen Zahlen vollständig
enthalten, denn ganz offensichtlich ist die Menge
Abbildung 7.10: Komponentenweise Ad-
dition und Multiplikation von Zahlenfolgen N := {(x, x, x, . . .) | x ∈ N}
7.2 Nichtstandardmodelle von PA 385

mit den vereinbarten Rechenregeln isomorph zur Standardinterpretation Überabzählbare Menge


(N, {s, +, ×}) (Abbildung 7.11). aller Zahlenfolgen

Es ist leicht einzusehen, dass die vereinbarten Arithmetikoperationen


mit den Peano-Axiomen verträglich sind. Heißt das, die Menge der Zah- (x0, x1, x2, …)
lenfolgen, zusammen mit der komponentenweisen Addition und Mul- (y0, y1, y2, …)
tiplikation, ist bereits ein überabzählbares Modell von PA? Die Ant- (z0, z1, z2, …)
wort ist Nein! Hätten wir tatsächlich ein Modell vor uns, so müssten
auch alle Ordnungseigenschaften erfüllt sein, die sich aus den Peano-
Axiomen herleiten lassen. Hierzu gehört beispielsweise die Trichoto-
mieeigenschaft, die uns bereits im Zusammenhang mit den Ordinalzah- 0 := (0,0,0, . . .)
len begegnet ist: 1 := (1,1,1, . . .)
2 := (2,2,2, . . .)
„Für alle X und Y gilt entweder X < Y oder X = Y oder X > Y .“
...
Für die beiden ungleichen Zahlenfolgen
Abbildung 7.11: Einbettung von N in die
X := (1,0,0,0,0,0,0,0, . . .) und (7.6) Menge aller Zahlenfolgen
Y := (0,1,0,0,0,0,0,0, . . .) (7.7)

müsste also X < Y oder X > Y gelten. Im ersten Fall würde eine Folge Menge aller Zahlenfolgen
Z mit X + Z = Y existieren, im zweiten Fall eine Folge Z mit X = Y + Z.
Da unsere Zahlenfolgen aber niemals negative Werte enthalten, kann es
ein Z mit den geforderten Eigenschaften nicht geben. X1 = (•, •,…) Y1 = (•, •,…)
Y3 = (•, •,…) Y = (•, •,…)
Dieses Problem werden wir dadurch umgehen, dass zwei verschiedene 2
Zahlenfolgen nicht zwangsläufig für zwei verschiedene Individuenele- X3 = (•, •,…) X2 = (•, •,…)
mente stehen müssen, die Grundmenge unseres überabzählbaren Nicht- …
standardmodells (U, I) also nicht aus einzelnen Zahlenfolgen, sondern
aus Äquivalenzklassen besteht (Abbildung 7.12):
Äquivalenzklassenbildung
U := { [ X ] | X ∈ NN }

Damit diese Konstruktion funktioniert, müssen wir die in Abbil-


dung 7.10 vereinbarten Arithmetikoperationen auf die Menge der Äqui- [ X ] = {X1, X2, X3, …}
valenzklassen übertragen. Dies geschieht in der üblichen Weise:
[ Y ] = {Y1, Y2, Y3, …}
s([ X ]) := [ s(X) ]
[ X ] + [Y ] := [ X +Y ] …
[ X ] × [Y ] := [ X ×Y ]
Individuenbereich des
überabzählbaren Nichtstandardmodells
Als Nächstes müssen wir festlegen, nach welchen Regeln die Äquiva-
lenzklassen gebildet werden. Dies wird indirekt geschehen, indem wir Abbildung 7.12: Durch Äquivalenzklas-
auf der Menge NN eine eigene Ordnung etablieren. Gilt für zwei Zah- senbildung entsteht der Individuenbereich
lenfolgen X und Y in unserer Ordnung die Beziehung X < Y oder X > Y , des überabzählbaren Nichtstandardmodells
so weisen wir sie verschiedenen Äquivalenzklassen zu. Gilt dagegen der Peano-Arithmetik.
386 7 Modelltheorie

weder X < Y noch X > Y , so sind sie per Definition Repräsentanten


derselben Klasse.

Wir wollen nun an mehreren Beispielen überlegen, wie eine adäquate


Ordnung auf der Menge der Zahlenfolgen aussehen könnte. Als erstes
betrachten wir die Folge (1,2,3,4,5,6, . . .). Sie ist nur an endlich vie-
len Indexpositionen kleiner als eine Folge der Form (x, x, x, . . .), aber an
unendlich vielen Indexpositionen größer. Intuitiv können wir sie als Re-
präsentanten einer Zahl auffassen, die größer ist als jede natürliche Zahl
x ∈ N. Damit spielt sie eine ähnliche Rolle wie das Element λ , das uns
bei der Konstruktion abzählbarer Nichtstandardmodelle begegnet ist.

Aus der Folge (1,2,3,4,5,6, . . .) können wir durch die Addition einer
natürlichen Zahl weitere gewinnen:
1 + (1,2,3,4, . . .) = (1 + 1,1 + 2,1 + 3,1 + 4, . . .) = (2,3,4,5, . . .)
2 + (1,2,3,4, . . .) = (2 + 1,2 + 2,2 + 3,2 + 4, . . .) = (3,4,5,6, . . .)
3 + (1,2,3,4, . . .) = (3 + 1,3 + 2,3 + 3,3 + 4, . . .) = (4,5,6,7, . . .)
Die so erhaltenen Folgen sind an sämtlichen Indexpositionen größer als
ihre Summanden und dürfen im intuitiven Sinne deshalb auch als grö-
ßere Zahlen gelten.

Multiplizieren wir die Folge (1,2,3,4,5,6, . . .) mit 2, so erhalten wir mit


2 × (1,2,3,4, . . .) = (2 × 1,2 × 2,2 × 3,2 × 4, . . .) = (2,4,6,8, . . .)
eine Folge, die wiederum größer ist als alles, was wir durch die Addi-
tion einer natürlichen Zahl erhalten konnten. Ihre Ordnungseigenschaft
erinnert an das Element 2λ aus dem vorangegangenen Abschnitt. Auch
für dieses Element galt, dass es größer ist als alle Elemente der Form
λ + x mit x ∈ N. Es scheint, als könnten wir auf Folgen von natürlichen
Zahlen eine mit den Peano-Axiomen verträgliche Ordnung etablieren,
die an jene der abzählbaren Nichtstandardmodelle erinnert.

Wir wollen einen Schritt zurücktreten und unser bisheriges Vorgehen


rekapitulieren. In den betrachteten Beispielen hatten zwei Zahlenfolgen
X und Y die Beziehung X > Y genau dann erfüllt, wenn die Elemente
von X ab einem gewissen Index größer waren als die Elemente von
Y . Entsprechend galt die Beziehung X < Y , wenn die Elemente von X
ab einem gewissen Index kleiner waren als die Elemente von Y . Es ist
leicht einzusehen, dass diese Festlegung noch nicht ausreicht, um eine
adäquate Ordnung zu definieren. Zwei Probleme sind noch zu lösen:

I Angenommen, X und Y sind Folgen, die sich in einem endlichen


Anfangsstück unterscheiden, aber ab einem gewissen Index gleich
7.2 Nichtstandardmodelle von PA 387

Die Art und Weise, wie die natürlichen Zah- auf der x-Achse sind die reellen Zahlen.
len im überabzählbaren Individuenbereich des Genauso sind wir bei der Konstruktion des überabzählba-
Nichtstandardmodells eingebettet sind, ist die ren Nichtstandardmodells vorgegangen. Wir haben die Men-
gleiche, wie wir sie von der Konstruktion der ge der natürlichen Zahlen N in derselben Art erweitert, wie
komplexen Zahlen her kennen. Jede Zahl x + yi ∈ C können sich die reellen Zahlen R zu den komplexen Zahlen C erwei-
wir uns als Punkt der Gauß’schen Zahlenebene vorstellen, tern lassen. Die natürlichen Zahlen finden wir in der überab-
dessen Koordinaten durch den Realteil x und den Imaginär- zählbaren Individuenmenge unseres Nichtstandardmodells
teil y gegeben sind. in Form der Folgen (x, x, x, . . .) wieder, und genau wie im
Falle der komplexen Zahlen sind diese unter der Addition
Gauß'sche y
und der Multiplikation abgeschlossen.
Zahlenebene
3 + 2i
–3 + 32 i 2 y
z1 = 1 + 3i Addition
1
3
x
-2 -1 1 2 3 2 5 + 2i
-3
-1 z1 + z2
1
5
– 2
– 32 i -2 3
– 2i
2 x
-1 1 2 3 4 5
Betrachten wir die komplexen Zahlen als Vektoren, so lassen -1
sich die Addition und die Multiplikation geometrisch inter-
z2 = 4 – i
pretieren. Die Summe zweier komplexer Zahlen können wir y
ausrechnen, indem wir die Vektoren der beiden Summanden Multiplikation
addieren. Die Multiplikation lässt sich geometrisch deuten, – 4 + 3i
3
wenn die komplexen Zahlen in polaren Koordinaten (r, α) z2 = – 1 + 2i

|
dargestellt werden, wobei r die Vektorlänge und α der Win- |z2| = 5 2 z1 = 2 + 1i
z1

|
kel zur x-Achse ist. Das Produkt zweier komplexer Zahlen z |z1| = 5
2
(r1 , α1 ) und (r2 , α2 ) ist dann der Vektor (r1 · r2 , α1 + α2 ). 1
Betrachten wir ausschließlich diejenigen komplexen Zahlen,
die auf der x-Achse liegen, so sind diese sowohl unter der x
-4 -3 -2 -1 1 2
Addition als auch unter der Multiplikation abgeschlossen.
Diese Zahlen verhalten sich eins zu eins wie die reellen Zah-
len, und wir können gefahrlos sagen, die komplexen Zahlen

sind. Dann haben wir zwei unterschiedliche Zahlenfolgen vor uns,


aber es gilt weder X < Y noch Y > X. Dieses Problem lösen wir,
indem zwei Folgen, die sich nur an endlich vielen Indexposition-
en unterscheiden, immer der gleichen Äquivalenzklasse zugeordnet
werden. Damit sind die Beispielfolgen (7.6) und (7.7) Repräsentan-
ten der gleichen Zahl, in diesem Fall der Zahl Null.

I Bisher haben wir in unsere Betrachtung ausschließlich konstante und


monotone Folgen einbezogen. Hier war es intuitiv naheliegend, sie
der Größe nach zu ordnen. Dass die Situation im Allgemeinen kom-
388 7 Modelltheorie

I Beispiel 1 plizierter ist, macht das folgende Beispiel deutlich:


1 , 2 , 3 , 4 , 5 , ... X := (1,0,1,0,1,0,1,0, . . .), Y := (0,1,0,1,0,1,0,1, . . .)
X = ( 0 , 1 , 2 , 3 , 4 , ...)
Y = ( 2 , 2 , 2 , 2 , 2 , ...)
Nach unserer bisherigen Auslegung gilt weder X < Y noch X > Y .
Da X und Y an überhaupt keiner Indexposition übereinstimmen, wol-
len wir sie aber auf keinen Fall der gleichen Äquivalenzklasse zuord-
L = { 1 , 2 , 3 , 4 , 5 , ...} nen.
E = { 1 , 2 , 3 , 4 , 5 , ...}
G = { 1 , 2 , 3 , 4 , 5 , ...} Mit dem letzten Beispiel haben wir die Grenze des intuitiv Erkennba-
ren erreicht. Offensichtlich können wir mit keinem griffigen Argument
mehr entscheiden, ob nun X oder Y die größere Zahlenfolge sein soll.
I Beispiel 2

1 , 2 , 3 , 4 , 5 , ...
Ultrafilterkonstruktion
X = ( 1 , 2 , 3 , 4 , 5 , ...)
Y = ( 1 , 3 , 5 , 7 , 9 , ...)
Ab jetzt schlagen wir einen systematischeren Weg ein und definieren
mit L, E und G drei Indexmengen, die uns Auskunft über die komponen-
L = { 1 , 2 , 3 , 4 , 5 , ...} tenweisen Größenverhältnisse zweier Zahlenfolgen liefern (vgl. [160]):
E = { 1 , 2 , 3 , 4 , 5 , ...} L(X,Y ) := {i | xi < yi }
G = { 1 , 2 , 3 , 4 , 5 , ...} E(X,Y ) := {i | xi = yi }
G(X,Y ) := {i | xi > yi }
I Beispiel 3
xi ist das i-te Element der Folge X und yi das i-te Element der Folge Y .
1 , 2 , 3 , 4 , 5 , ... In den Mengen L(X,Y ), E(X,Y ) und G(X,Y ) sind demnach diejenigen
X = ( 0 , 1 , 0 , 1 , 0 , ...) Indexpositionen enthalten, an denen X kleiner Y , X gleich Y bzw. X
größer Y ist (Abbildung 7.13).
Y = ( 1 , 0 , 1 , 0 , 1 , ...)
Zusätzlich denken wir uns mit F eine Menge von Indexmengen gege-
ben. Wir werden F im Sinne eines Orakels verwenden, das uns Aus-
L = { 1 , 2 , 3 , 4 , 5 , ...} kunft über das Größenverhältnis zweier vorgelegter Zahlenfolgen X und
E = { 1 , 2 , 3 , 4 , 5 , ...} Y geben wird. Konkret läuft die Befragung des Orakels nach drei einfa-
G = { 1 , 2 , 3 , 4 , 5 , ...} chen Spielregeln ab (Abbildung 7.14):

L(X,Y ) ∈ F ⇒ X <Y
Abbildung 7.13: Berechnung der Index-
mengen L(X,Y ), E(X,Y ) und G(X,Y ) E(X,Y ) ∈ F ⇒ X =Y
G(X,Y ) ∈ F ⇒ X >Y

Um unser Orakel zu befragen, müssen wir lediglich die Indexmengen


L(X,Y ), E(X,Y ) und G(X,Y ) ausrechnen. Anschließend können wir
über einen einfachen Inklusionstest entscheiden, in welcher Ordnungs-
relation X und Y zueinander stehen. Intuitiv betrachtet sind die Ele-
mente der Orakelmenge F nichts anderes als Muster von signifikanten
7.2 Nichtstandardmodelle von PA 389

Indexpositionen. Sie legen fest, welche Positionen für den Vergleich X = (1,2,3,...) Y = (1,1,1,...)
zweier Zahlenfolgen eine Rolle spielen und welche nicht.

Natürlich ist nicht jede Menge F als Orakel geeignet, und es ist kei-
nesfalls selbstverständlich, dass überhaupt eine solche Menge existiert.
L := {i | xi < yi }
Aus diesem Grund wollen wir zunächst überlegen, welche Kriterien F E := {i | xi = yi }
notwendigerweise erfüllen muss. G := {i | xi > yi }

Orakelmenge F
I Sind X und Y zwei identische Folgen, so ist E(X,Y ) = N. Damit
unsere Orakelmenge X und Y als gleich erkennt, muss N ein Element
von F sein. Sind X und Y Folgen, die an keiner einzigen Position
übereinstimmen, so ist E(X,Y ) = 0.
/ Da wir vermeiden wollen, dass
X und Y in diesem Fall als gleich erkannt werden, darf die leere
Menge nicht in F enthalten sein.
0/ ∈ F, N ∈ F LF EF GF

I X, Y und Z seien drei Folgen. Ferner sei M := E(X,Y ) und N :=


E(Y, Z). Sind M und N beide in F enthalten, so ist X = Y und Y = Z.
Aufgrund der Transitivität der Gleichheit müssen wir von F fordern,
dass sie auch X und Z als gleich klassifiziert. Über die Folgen X
und Z lässt sich aber lediglich sagen, dass sie mindestens an den X>Y
X<Y
Indexpositionen M ∩ N übereinstimmen. Deshalb fordern wir, dass X=Y
für je zwei Mengen M, N ∈ F auch die Schnittmenge M ∩ N in F
enthalten sein muss. Abbildung 7.14: Um zwei Elemente X und
Y zu vergleichen, werden zunächst die In-
M, N ∈ F ⇒ M ∩ N ∈ F dexmengen L, E und G bestimmt. Anschlie-
ßend wird die Orakelmenge F danach be-
I Wir betrachten erneut zwei Folgen X, Y , die F als gleich klassifi- fragt, welche der drei Indexmengen in ihr
ziert, d. h., es ist E(X,Y ) ∈ F. Hat eine Folge Z eine noch bessere enthalten ist. Der Ausgang des Inklusions-
Übereinstimmung mit X, gilt also E(X, Z) ⊃ E(X,Y ), so soll die tests bestimmt, ob X und Y gleich sind oder
Orakelmenge F auch die Gleichheit zwischen X und Z feststellen. eine der Folgen größer ist als die andere.
Das bedeutet, dass für jede Menge M ∈ F auch alle Obermengen in
F enthalten sein müssen.
M ∈ F, N ⊃ M ⇒ N ∈ F

I Unsere Orakelmenge F kann nur dann funktionieren, wenn sie für


zwei vorgelegte Zahlenfolgen X und Y immer eine Antwort liefert.
Nehmen wir an, X und Y stimmen an keiner Indexposition überein,
es gelte also E(X,Y ) = 0.
/ Da 0/ nicht in F enthalten sein darf, ist ent-
weder L(X,Y ) oder G(X,Y ) ein Element von F. Dann ist G(X,Y )
aber die Komplementärmenge von L(X,Y ). Das heißt, dass für jede
Menge M entweder M selbst oder ihr Komplement M in F vorkom-
men muss.
M ⊆ N ⇒ (M ∈ F ⇔ M ∈ F)
390 7 Modelltheorie

I Wir wollen vermeiden, dass zwei Folgen X und Y als gleich, klei-
Mengenfilter
ner oder größer erkannt werden, wenn sie die Beziehungen xi = yi ,
I 0/ ∈ F, N ∈ F xi < yi oder xi > yi lediglich für endlich viele Indizes i erfüllen. Das
I M, N ∈ F ⇒ M ∩ N ∈ F bedeutet, dass F ausschließlich unendlich große Indexmengen ent-
I M ∈ F, N ⊃ M ⇒ N ∈ F
halten darf.
M ∈ F ⇒ |M| = |N|
Ultrafilter
• M ⊆ N ⇒ (M ∈ F ⇔ M ∈ F) Alle geforderten Beziehungen sind notwendige Eigenschaften, die eine
Orakelmenge F erfüllen muss. Die Frage, ob eine solche Menge über-
Freie Ultrafilter haupt existiert, ist damit aber keineswegs beantwortet. Doch an dieser
• M ∈ F ⇒ |M| = |N| Stelle haben wir Glück! Unser Forderungskatalog beschreibt eine be-
kannte mathematische Struktur, die inzwischen gut untersucht ist.

In der Terminologie der gewöhnlichen Mathematik heißt eine Menge,


Abbildung 7.15: Die verschiedenen Men-
die die ersten drei Bedingungen erfüllt, ein Mengenfilter oder einfach
genfilter im Vergleich
nur Filter. Gilt zusätzlich die Komplementeigenschaft, so ist die Men-
ge ein sogenannter Ultrafilter. Solche Filter zeichnen sich dadurch aus,
dass sie nicht weiter verfeinert werden können, d. h., es ist unmöglich,
sie um ein weiteres Element zu ergänzen, ohne die Filtereigenschaften
zu verletzen. Wegen dieser Eigenschaft werden Ultrafilter auch gern als
maximale Filter bezeichnet.
Umfasst ein Ultrafilter ausschließlich unendliche Mengen, so sprechen
wir von einem freien Ultrafilter (Abbildung 7.15). Die positive Nach-
richt ist, dass freie Ultrafilter tatsächlich existieren. Die von uns postu-
lierte Orakelmenge F gibt es also wirklich, und es lässt sich beweisen,
dass die hieraus resultierende Äquivalenzklassenstruktur zu einem über-
abzählbaren Nichtstandardmodell der Peano-Arithmetik führt [1, 106].

Die negative Nachricht ist, dass sich die Existenz freier Ultrafilter
ausschließlich nichtkonstruktiv mithilfe des Auswahlaxioms beweisen
lässt. Die Folgen, die sich hieraus ergeben, sind ernüchternd. Wir wis-
sen, dass ein Ultrafilter F existiert, der die Menge NN so in Äqui-
valenzklassen unterteilt, dass ein überabzählbares Modell der Peano-
Arithmetik entsteht. Gleichwohl wissen wir, dass es niemals möglich
sein wird, F explizit zu erzeugen. Die Nichtkonstruktivität der freien
Ultrafilter sorgt dafür, dass wir uns dem Nichtstandardmodell nur zu
einem gewissen Grad nähern können. Genau wie bei den abzählbaren
Nichtstandardmodellen bleibt uns auch hier der letzte Schritt verwehrt.
7.3 Das Skolem-Paradoxon 391

ai 23 Mar Thoralf Albert Skolem wurde am einem der vier Kernsätze der Modelltheorie. In seinem Be-
23 M
1887 1963
23. Mai 1887 im südnorwegischen weis führte er unter anderem eine wichtige Normalform-
Sandsvaer geboren. Seine Schul- darstellung für Logikformeln ein, die wir heute als Skolem-
ausbildung beendete er 1905 im Normalform bezeichnen. Mittlerweile gehört sie zum Lehr-
70 km entfernten Kristiania, dem späteren Oslo. Im selben stoff fast aller Logikvorlesungen. Auch die Argumentations-
Jahr schrieb er sich an der dort ansässigen Universität als linie, der Gödel in den Beweisen des Kompaktheitssatzes
Mathematikstudent ein und beendete sein Studium 1913 mit und des Satzes über die Modellexistenz folgte, geht auf Sko-
dem Staatsexamen. lem zurück. Auf dem Gebiet der Mengenlehre hat Skolem
Skolems wissenschaftliches Interesse ging weit über die Ma- ebenfalls wichtige Beiträge geleistet. Er war der erste, der
thematik hinaus, und er publizierte seine ersten Forschungs- eine exakte prädikatenlogische Formulierung der Zermelo-
arbeiten im Bereich der Physik. Nach mehreren Assistenztä- Fraenkel-Mengenlehre entwickelte [181]. Genauso untrenn-
tigkeiten und einem Forschungssemester an der Universität bar ist sein Name mit dem Skolem-Paradoxon verbunden,
in Göttingen nahm er 1918 eine Dozentenposition in Oslo einem vermeintlichen Widerspruch, der wertvolle Einsich-
an. Ursprünglich hatte Skolem nicht vor, den Doktorgrad zu ten in die Prädikatenlogik erster Stufe liefert [180].
erlangen, holte dies im Jahr 1926 aber dennoch nach. Zwi- 1957 ging Skolem offiziell in den Ruhestand. Trotzdem be-
schen 1930 bis 1938 bekleidete er eine Forschungsstelle im suchte er weiterhin zahlreiche Universitäten und behielt die
westnorwegischen Bergen. Im Jahr 1938 wurde Skolem von meisten seiner offiziellen Ämter. Wie in seinem ganzen Le-
der Universität in Oslo schließlich zum Professor berufen, ben war Skolem auch in hohem Alter ein aktiver Mann
im Alter von 51 Jahren. und sein wissenschaftlicher Schaffensdrang ungebrochen.
Im Bereich der mathematischen Logik und der Mengenleh- Dementsprechend plötzlich und unerwartet schied er aus
re hat Skolem Maßgebliches geleistet. Sein Name ist un- dem Leben. Thoralf Albert Skolem starb am 23. März 1963
trennbar mit dem Satz von Löwenheim-Skolem verbunden, im Alter von 75 Jahren.

7.3 Das Skolem-Paradoxon


1923 veröffentlichte der norwegische Mathematiker Thoralf Skolem ei-
ne Arbeit mit dem Titel „Einige Bemerkungen zur axiomatischen Be-
gründung der Mengenlehre“ [180]. In dieser Arbeit wird dem Leser
ein augenscheinlicher Widerspruch vor Augen geführt, der zu Beginn
des zwanzigsten Jahrhunderts zu kontroversen Auseinandersetzungen
in der Wissenschaftsgemeinde führte. Stein des Anstoßes war die zwei-
te von insgesamt acht Bemerkungen über das axiomatische System der
Zermelo-Mengenlehre. Skolem schreibt:

„Ist das präzisierte Zermelo’sche Axiomensystem wider-


spruchsfrei, so muss es möglich sein, eine unendliche Reihe
von Symbolen 1,2,3,. . . so einzuführen, dass diese einen Be-
reich B bilden, für welchen die Zermelo’schen Axiome alle
gültig sind [. . . ]. Soweit mir bekannt, hat niemand auf die-
sen eigentümlichen und scheinbar paradoxalen Sachver-
halt aufmerksam gemacht. Kraft der Axiome kann man die
Existenz höherer Zahlklassen zeigen usw. Wie kann es dann
sein, dass der ganze Bereich B sogar mithilfe der endlichen
ganzen positiven Zahlen abgezählt werden kann?“
392 7 Modelltheorie

Das Skolem-Paradoxon resultiert aus der Kombination zweier für sich


allein betrachtet harmloser Tatsachen:
x 0 1 2 3 4
y
0 0 1 3 6 10 I In der Prädikatenlogik erster Stufe lässt sich eine Formel ϕSkolem mit
der inhaltlichen Aussage konstruieren, der Individuenbereich enthal-
1 2 4 7 11 16
te überabzählbar viele Elemente. ϕSkolem besitzt ein überabzählbares
Modell, das sich auf einfache Weise konstruieren lässt.
2 5 8 12 17 23

I Aus dem Satz von Löwenheim-Skolem-Tarski folgt jetzt unmittel-


3 9 13 18 24
bar, dass ϕSkolem Modelle beliebiger transfiniter Kardinalitäten be-
sitzt. Folgerichtig muss auch ein abzählbares Modell existieren.
... 4 14 19 25
...

... 5 20 26
...

Aber wie kann in einem abzählbaren Modell eine Formel wahr sein,
die behauptet, der Individuenbereich sei überabzählbar? Eine wahrlich
... 6 27
...

paradoxe Situation.
...
...

...

So verstörend das Skolem-Paradoxon auch wirkt: Wir stehen ihm kei-


nesfalls machtlos gegenüber. In den vorangegangenen Kapiteln ha-
Abbildung 7.16: Durch die festgelegte
ben wir unser mathematisch-logisches Instrumentarium weit genug ge-
Ordnungsrelation werden die Elemente aus
N2 in die dargestellte Reihenfolge gebracht. schärft, um den entstandenen Widerspruch aufzulösen. Bevor wir dies
tun, wollen wir uns zunächst davon überzeugen, dass eine Formel
ϕSkolem mit der zugedachten Bedeutung tatsächlich konstruiert werden
kann. Danach werden wir den vermeintlichen Widerspruch aufklären
und dem Skolem-Paradoxon seinen Schrecken nehmen.

Für die Konstruktion der Formel ϕSkolem folgen wir der Idee aus [17].
Als Erstes vereinbaren wir auf der Menge der Zahlenpaare (x, y) mit
x, y ∈ N eine Ordnungsrelation ‚<‘, die folgendermaßen festgelegt ist:

x1 + y1 < x2 + y2 oder
(x1 , y1 ) < (x2 , y2 ) :⇔
x1 + y1 = x2 + y2 und y1 < y2

Die so definierte Ordnung basiert auf der Idee, zwei Zahlenpaare


(x1 , y1 ) und (x2 , y2 ) über ihre Komponentensummen zu vergleichen.
Sind die Werte x1 + y1 und x2 + y2 unterschiedlich, so ist dasjenige
Paar mit der kleineren Summe auch das kleinere Element. Nur wenn
die Summen übereinstimmen, entscheiden die Elemente y1 und y2 über
den Ausgang des Vergleichs. Auf diese Weise erhalten wir eine totale
Ordnung auf der Menge N2 , die in Abbildung 7.16 aufgezeichnet ist.

Die vereinbarte Ordnungsrelation ist eine alte Bekannte. Wir hatten sie
bereits in Kapitel 1 verwendet, um die Gleichmächtigkeit der Mengen
N und N2 zu beweisen (vgl. Abbildung 1.16). Dort hatten wir auch
7.3 Das Skolem-Paradoxon 393

gezeigt, dass sich die Position eines Elements (x, y) mithilfe einer ge- 0 1 2 3 4 5 x
schlossenen Formel direkt ausrechnen lässt. Diese Überlegungen brach-
0 ...
ten die Cantor’sche Paarungsfunktion hervor, die über die nachstehende
Formel gegeben ist: 1 ...
x+y
(x + y)(x + y + 1)
πN (x, y) = y + ∑ i = y + 2 ...
i=0 2
3 ...
Als Nächstes betrachten wir eine Menge M ⊆ P(N), also eine Men-
ge, deren Elemente Teilmengen der natürlichen Zahlen sind. M könnte 4 ...
beispielsweise so aussehen:
5 20 26 33 41 50 60 ...
M := {0,
/ {1,2,3}, {2,3,4}, {1, 3, 5}} (7.8)
..
y ↑ ↑ ↑ ↑ ↑ ↑ .
Für den Moment nehmen wir an, M sei höchstens abzählbar, d. h., die

{1,2,3}

{2,3,4}

{1,3,5}

0/

0/

0/
Menge sei entweder endlich oder sie habe die Kardinalität der natür-
lichen Zahlen. Dann lässt sich M in Form einer Matrix darstellen. Diese
entsteht, indem wir jedem Element {x1 , x2 , x3 , . . .} ∈ M eine separate
Spalte zuordnen und die Felder in den Zeilen x1 , x2 , x3 , . . . einfärben. Abbildung 7.17: Matrixdarstellung der
Abbildung 7.17 demonstriert, wie eine solche Matrixdarstellung für un- Menge {0,
/ {1,2,3}, {2,3,4}, {1,3,5}}
sere Beispielmenge aussehen kann.
Abbildung 7.18 zeigt die Matrix erneut, allerdings ist jetzt in jedem Feld
(x, y) zusätzlich der Wert der Cantor’schen Paarungsfunktion πN (x, y) 0 1 2 3 4 5 x
eingetragen. Die Zahlen sind der Schlüssel für den nächsten Schritt: 0 0 1 3 6 10 15 ...
Die Darstellung von M durch eine einzige Teilmenge der natürlichen
Zahlen. Eine solche Menge EM können wir ganz einfach dadurch er- 1 2 4 7 11 16 22 ...
halten, dass wir für jedes markierte Feld (x, y) den Wert π(x, y) in EM
aufnehmen. Für unsere Beispielmenge M ist 2 5 8 12 17 23 30 ...

EM = {2, 5, 7, 8, 9, 13, 18, 19, 33} (7.9) 3 9 13 18 24 31 39 ...

Die Menge EM nennen wir einen Enumerator für M. 4 14 19 25 32 40 49 ...


Wir vereinbaren zusätzlich, dass jeder Enumerator für eine Menge M 5 20 26 33 41 50 60 ...
per Definition auch ein Enumerator für jede Teilmenge von M ist. Mit
anderen Worten: Wir fordern nicht, dass die durch EM beschriebenen ..
y ↑ ↑ ↑ ↑ ↑ ↑ .
Elemente exakt den Elementen von M entsprechen, sondern lediglich,
{1,2,3}

{2,3,4}

{1,3,5}

0/

0/

0/

dass jede in M enthaltene Menge in der Matrixdarstellung von EM ir-


gendwo vorkommt. Somit ist neben EM beispielsweise auch die Menge

EM = {2, 5, 6, 7, 8, 9, 13, 18, 19, 22, 24, 32, 33, 39, 49}

ein Enumerator für M (Abbildung 7.19). Umgekehrt sind EM und EM EM = {2, 5, 7, 8, 9, 13, 18, 19, 33}
gleichzeitig auch Enumeratoren für die Mengen
Abbildung 7.18: Ein Enumerator für die
{{1,2,3}, {2,3,4}, {1, 3, 5}}, {{1,2,3}, {2,3,4}}, {{1,2,3}}, . . . Menge {0,
/ {1,2,3}, {2,3,4}, {1,3,5}}
394 7 Modelltheorie

0 1 2 3 4 5 x Zwischen Enumeratoren und höchstens abzählbaren Mengen besteht


ein enger Zusammenhang. Auf der einen Seite können wir für jede
0 0 1 3 6 10 15 ...
höchstens abzählbare Menge M ⊂ P(N) einen Enumerator finden. Hier-
1 2 4 7 11 16 22 ... zu brauchen wir M lediglich in die Matrixdarstellung zu übersetzen und
können den Enumerator dann direkt ablesen. Auf der anderen Seite sind
2 5 8 12 17 23 30 ... Enumeratoren Teilmengen der natürlichen Zahlen und damit ihrerseits
höchstens abzählbar. Wir halten fest:
3 9 13 18 24 31 39 ...
Satz 7.10
4 14 19 25 32 40 49 ...

5 20 26 33 41 50 60 ... Eine Menge M ⊆ P(N) hat einen Enumerator ⇔ |M| ≤ |N|


..
y ↑ ↑ ↑ ↑ ↑ ↑ .
Als Nächstes wollen wir den Begriff des Enumerators innerhalb der
{1,2,3}

{2,3,4}

{1,3,5}

{0,3,4}

{1,3,4}
0/

Prädikatenlogik erster Stufe formalisieren. Die dabei erarbeitete Formel


wird behaupten, dass der Individuenbereich keinen Enumerator besitzt.
Nach Satz 7.10 ist sie jene Formel, nach der wir suchen: Sie behauptet,
der Individuenbereich sei überabzählbar.
 = {2, 5, 6, 7, 8, 9, 13, 18,
EM Der Ausgangspunkt für unsere Formalisierung ist die folgende um-
19, 22, 24, 32, 33, 39, 49} gangssprachliche Charakterisierung des Enumerators:
Abbildung 7.19: Einer von vielen weiteren
Enumeratoren für die Menge „E ist ein Enumerator für den Individuenbereich U, wenn
M = {0,
/ {1,2,3}, {2,3,4}, {1,3,5}} für jede Menge natürlicher Zahlen z ∈ U eine natürliche
Zahl x mit der Eigenschaft existiert, dass eine natürliche
Zahl y genau dann in z ist, wenn π(x, y) in E ist.“

Nun sei (U, I) eine Interpretation mit U = N ∪ P(N). Das bedeutet, dass
wir im Individuenbereich alle natürlichen Zahlen sowie alle Teilmengen
der natürlichen Zahlen wiederfinden. Ferner sei I so beschaffen, dass die
Symbole ‚∈‘, S, N die folgende Bedeutung erhalten:

(U, I) |= N(ξ ) :⇔ ξ ist eine natürliche Zahl


(U, I) |= S(ξ ) :⇔ ξ ist eine Menge von natürlichen Zahlen
(U, I) |= ξ ∈ ν :⇔ ξ ist ein Element von ν

Ferner soll mit π ein zweistelliges Funktionszeichen existieren, das in


(U, I) als die Cantor’sche Paarungsfunktion πN (x, y) interpretiert wird.

(U, I) bezeichnen wir als Standardinterpretation, da sie den Symbo-


len ihre intendierte Bedeutung verleiht. Jetzt können wir die umgangs-
sprachliche Charakterisierung des Enumerators ohne Mühe in eine For-
mel der Prädikatenlogik übersetzen:
7.3 Das Skolem-Paradoxon 395

„E ist ein Enumerator für den Individuenbereich U,


wenn für jede Menge natürlicher Zahlen z ∈ U
∀ z (S(z) → (
eine natürliche Zahl x mit der Eigenschaft existiert,
∃ x (N(x) ∧ (
dass eine natürliche Zahl y
∀ y (N(y) →
genau dann in z ist, wenn π(x, y) in E ist.“
(y ∈ z ↔ π(x, y) ∈ E))))))

Fordern wir jetzt noch, dass kein Enumerator für den Individuenbereich
existiert, so sind wir am Ziel. Als Ergebnis erhalten wir die von uns
gesuchte Formel ϕSkolem :

ϕSkolem := ¬∃ w (S(w)∧
∀ z (S(z) → (∃ x (N(x) ∧ (∀ y (N(y) → (y ∈ z ↔ π(x, y) ∈ w)))))))

Offensichtlich ist ϕSkolem unter der oben konstruierten Interpretation


(U, I) eine wahre Aussage. Sie ist deshalb wahr, weil der Individuen-
bereich U = N ∪ P(N) überabzählbar ist, und genau dies haben wir mit
ϕSkolem auch behauptet.

Da ϕSkolem ein überabzählbares Modell besitzt, muss auch ein abzähl-


bares existieren. Dies folgt unmittelbar aus dem Satz von Löwenheim-
Skolem und ist die Ursache des Skolem-Paradoxons.

Der augenscheinliche Widerspruch klärt sich auf, wenn wir die inhalt-
liche Aussage von ϕSkolem in aller Präzision analysieren. Weiter oben
hatten wir die Formel mit der folgenden Bedeutung assoziiert:
„Es existiert kein Enumerator
ϕSkolem = (7.10)
für den Individuenbereich.“
Aber besitzt ϕSkolem diese Bedeutung wirklich? Die Antwort hängt da-
von ab, unter welcher Interpretation (U, I) wir sie betrachten. Schreiben
wir ihre inhaltliche Aussage in aller Ausführlichkeit nieder, so lautet sie
folgendermaßen:
„Innerhalb des Individuenbereichs existiert
ϕSkolem =
kein Enumerator für den Individuenbereich.“
(7.11)
In der festgelegten Standardinterpretation (N ∪ P(N), I) sind die Aussa-
gen (7.10) und (7.11) äquivalent. Das liegt daran, dass der Individuen-
bereich alle Teilmengen der natürlichen Zahlen umfasst und hierdurch
396 7 Modelltheorie

0 1 2 3 4 5 x auch sämtliche Enumeratoren einschließt. Unter der Standardinterpre-


tation behauptet die Formel ϕSkolem also tatsächlich, der Individuenbe-
0 0 1 3 6 10 15 ...
reich U sei überabzählbar.
1 2 4 7 11 16 22 ... Dies ändert sich, wenn wir ϕSkolem in einem Modell betrachten, des-
sen Individuenbereich nur noch eine abzählbare Auswahl an Enumera-
2 5 8 12 17 23 30 ...
toren umfasst. In einer solchen Interpretationen sind (7.10) und (7.11)
3 9 13 18 24 31 39 ... nicht äquivalent, da ein Enumerator für den Individuenbereich existie-
ren könnte, der selbst kein Element des Individuenbereichs ist. Das Mo-
4 14 19 25 32 40 49 ... dell wäre abzählbar und die Formel ϕSkolem trotzdem wahr.

5 20 26 33 41 50 60 ...
Ein solches Modell lässt sich direkt aus der Standardinterpretation ge-
winnen. Es entsteht, indem die Individuenmenge U durch die Menge
..
y ↑ ↑ ↑ ↑ ↑ ↑ . U  := N ∪ {{0}, {0, 1}, {0, 1, 2}, {0, 1, 2, 3}, . . .}
{0}

{0,1}

{0,1,2}

{0,1,2,3}

{0,1,2,3,4}

{0,1,2,3,4,5}

ersetzt wird. Die neue Individuenmenge U  ist abzählbar, so dass wir sie
als Matrix darstellen können. Wie diese aussieht, zeigt Abbildung 7.20.
Als abzählbare Menge besitzt der neue Individuenbereich einen Enu-
merator, den wir aus der Matrixdarstellung ohne Mühe ablesen können.
Es ist
EU  = {0, 1, 3, 4, 6, 7, 10, 11, 12, . . .} EU  = {0, 1, 3, 4, 6, 7, 10, 11, 12, 15, 16, 17, . . . , }
Weder der Enumerator EU  noch irgendeine seiner Obermengen sind in
Abbildung 7.20: Die Individuenmenge U 
U  enthalten und die Formel ϕSkolem deshalb wahr.
ist abzählbar und besitzt nach Satz 7.10
einen Enumerator. Dieser ist selbst kein Die Diskussion hat gezeigt, dass wir mit dem Skolem-Paradoxon kein
Element des Individuenbereichs und die Paradoxon im eigentlichen Sinne vor uns haben und der vermeintliche
Formel ϕSkolem daher eine wahre Aussage.
Widerspruch nur aus der Ferne sichtbar ist. Er löst sich auf, sobald wir
die inhaltliche Aussage der Formel ϕSkolem korrekt formulieren.

In seiner Veröffentlichung aus dem Jahr 1923 hatte Skolem nicht nur
sein vermeintliches Paradoxon formuliert, sondern zugleich eine ma-
thematisch einwandfreie Erklärung dafür geliefert. Zu keiner Zeit war
daher zu befürchten, das Paradoxon könne das Gebäude der Mathema-
tik in der gleichen Weise beschädigen wie einst die Russell’sche Anti-
nomie. Dennoch müssen wir aus dem Skolem’schen Resultat eine bit-
tere Lehre ziehen. Unverblümt führt es uns vor Augen, dass die Bedeu-
tung mancher Formeln maßgeblich davon abhängig ist, über welchem
Grundbereich wir ihre Symbole interpretieren; diese Formeln besitzen
keine inhaltliche Bedeutung in einem absoluten Sinn. Skolem, der sich
im Rahmen seiner Diskussion auf die Mengenlehre bezieht, nennt die-
ses Phänomen „eine Relativität der Mengenbegriffe, welche bei jeder
konsequenten Axiomatik unvermeidbar ist.“ [180]

Zur damaligen Zeit führte Skolems Ergebnis zu kontroversen Diskus-


sionen über die Sinnhaftigkeit der formalen Methode. Das von ihm
7.3 Das Skolem-Paradoxon 397

entdeckte Wechselspiel zwischen der syntaktischen und der semanti- Die Diskussion des Skolem-
schen Ebene läuft unserer Intuition zuwider, und von mehreren wur- Paradoxons hat uns gelehrt,
de die Meinung vertreten, die Mathematik dürfe nicht auf einem Fun- dass die inhaltliche Bedeu-
dament errichtet werden, das zwar mathematisch widerspruchsfrei sei, tung der Formel ϕSkolem da-
von abhängt, über welchem Grundbereich
aber gleichzeitig nicht die nötige Stabilität aufweise, um den Mengen-
wir ihre Symbole interpretieren; sie be-
begriff in einem absoluten Sinn zu definieren. Zu den Kritikern gehörte sitzt keine Bedeutung in einem absoluten
auch Skolem selbst. Für ihn war das entdeckte Phänomen schwerwie- Sinn. Dass wir dieses Phänomen nicht für
gend genug, um die im Aufbau befindliche axiomatische Mengenlehre jede Formel beobachten können, macht
vollständig in Frage zu stellen. Seine Arbeit schloss er mit den folgen- das folgende Beispiel deutlich:
den Worten:
ϕ := ∃ x ∃ y (x = y)
„Das wichtigste Ergebnis oben ist die Relativität der Men- Inhaltlich besagt diese Formel, dass der
genbegriffe. In einem mündlichen Gespräch habe ich dies Individuenbereich mindestens zwei ver-
schon im Winter 1915–1916 Herrn Prof. F. Bernstein in schiedene Elemente umfasst. ϕ besitzt
Göttingen erzählt. Dass ich nicht früher etwas darüber diese Bedeutung tatsächlich in einem ab-
publiziert habe, hat zwei Gründe: Erstens bin ich inzwi- soluten Sinn; ihre inhaltliche Aussage ist
schen mit anderen Problemen beschäftigt gewesen; zwei- unter allen Interpretationen immer die
tens glaubte ich, dass es so klar sei, dass diese Men- gleiche. Wir müssen daher vorsichtig sein,
um aus dem Paradoxon nicht die falschen
genaxiomatik keine befriedigende letzte Grundlage der
Schlüsse zu ziehen. Es wäre falsch, Sko-
Mathematik wäre, dass die Mathematiker größtenteils sich lems Ergebnis so zu interpretieren, als sei
nicht so sehr darum kümmern würden. In der letzten Zeit die Bedeutung einer Formel immer ei-
habe ich aber zu meinem Erstaunen gesehen, dass sehr ne relative. Wir lernen aus ihm lediglich,
viele Mathematiker diese Axiome der Mengenlehre als die dass nicht jede Formel in einem absoluten
ideale Begründung der Mathematik betrachten; deshalb Sinn bedeutungstragend ist.
schien mir die Zeit gekommen, eine Kritik zu publizieren.“
Thoralf Skolem [180]

Wie gehen wir heute mit Skolems Erbe um? Gegenwärtig wird nur noch
wenig über die philosophische Bedeutung des Paradoxons diskutiert.
Die meisten Mathematiker haben gelernt, mit ihm zu leben; sie sehen
darin eher ein Phänomen als ein Problem, und so beschränken sich fast
alle modernen Abhandlungen darauf, die mathematische Komponente
zu behandeln und den vermeintlichen Widerspruch sauber aufzulösen.
Aus diesem Blickwinkel wirken die Reaktionen, die Skolems Arbeit in
der ersten Hälfte des zwanzigsten Jahrhunderts hervorrief, als übertrie-
ben. Doch waren sie das wirklich? Vertreten wir vielleicht nur deswe-
gen diese Meinung, weil philosophische Betrachtungen in der moder-
nen Mathematik kaum noch eine Rolle spielen? Eine objektive Antwort
ist schwer zu geben, denn bei einer Beurteilung dürfen wir eines nicht
vergessen: Wir sind alle Kinder unserer Zeit.
398 7 Modelltheorie

7.4 Boolesche Modelle

Bisher hatten wir uns eine Interpretation stets als ein Tupel (U, I) vorge-
stellt, das neben einer nichtleeren Individuenmenge U eine Abbildung
I enthält, die jedem Prädikatzeichen und jedem Funktionssymbol eine
Relation bzw. eine Funktion über U zuordnet. Sind eine Interpretation
(U, I) und eine Formel ϕ vorgelegt, so ist ϕ unter dieser Interpretation
entweder wahr oder falsch. Im ersten Fall schreiben wir (U, I) |= ϕ und
im zweiten Fall (U, I) |= ϕ. Damit können wir uns eine Interpretation als
eine Abbildung vorstellen, die jeder Formel entweder den Wahrheits-
wert 1 (wahr) oder den Wahrheitswert 0 (falsch) zuordnet. Bezeichnen
wir den Funktionswert dieser Abbildung mit ϕ(U,I) , so lässt sich die-
ser Zusammenhang wie folgt aufschreiben:

1 falls (U, I) |= ϕ
ϕ(U,I) := (7.12)
0 falls (U, I) |= ϕ
Dieses Prinzip lässt sich verallgemeinern, indem der Wertebereich von
ϕ(U,I) auf die Elemente einer beliebigen booleschen Algebra ausge-
dehnt wird. Auf diesem Weg gelangen wir zu neuartigen Interpretatio-
nen, die in der Literatur als boolesche Modelle (boolean valued mo-
Dana Scott (geb. 1932) [7] dels) bezeichnet werden. Eingeführt wurden sie Ende der Siebzigerjah-
re von Dana Scott (Abbildung 7.21), Robert Solovay und Petr Vopěn-
Abbildung 7.21: Dem US-Amerikaner Da- ka [175,204]. Die ursprüngliche Idee stammt von Solovay aus dem Jahr
na Scott verdanken wir wertvolle Beiträ- 1965 und wurde von Scott zwei Jahre später in ihre moderne Form ge-
ge auf dem Gebiet der mathematischen Lo- bracht [175]. Vopěnka entwickelte seine Theorie unabhängig von den
gik und der theoretischen Informatik. Es anderen, inhaltlich traf er aber denselben Kern.
ist Scotts Verdienst, dass wir heute einen
vergleichsweise intuitiven Zugang zu Paul Die Theorie der booleschen Modelle wurde mit der Intention ent-
Cohens Beweis über die Unabhängigkeit wickelt, einen leichter verständlichen Zugang zu Paul Cohens Forcing-
der Kontinuumshypothese in Händen hal- Technik aus dem Jahr 1963 zu schaffen. Tatsächlich verbirgt sich in ei-
ten. 1972 wurde er für seine Arbeiten über nem Forcing-Beweis die Konstruktion eines speziellen booleschen Mo-
boolesche Modelle mit dem Leroy P. Steele dells, aus dem sich anschließend mehrere gewöhnliche Modelle gewin-
Prize ausgezeichnet. nen lassen. Gelingt die Konstruktion derart, dass die Theoreme eines
Seinen wohl größten Erfolg errang er im formalen Systems in allen Modellen wahr, eine Formel ϕ dagegen in
Bereich der theoretischen Informatik, als
einem Modell wahr und in einem anderen Modell falsch ist, so wissen
er 1959, zusammen mit Michael O. Ra-
bin, das Konzept des nichtdeterministischen
wir, dass weder ϕ noch ¬ϕ aus den Axiomen logisch gefolgert werden
Automaten ersann [155]. Hierdurch ist ei- können.
ne völlig neue Denkrichtung entstanden, die
Wir wollen die Idee der Forcing-Technik in groben Zügen offenlegen
sowohl die Berechenbarkeits- als auch die
Komplexitätstheorie bis heute prägt. 1976
und die Konstruktion eines Modells des formalen Systems ZFC skiz-
wurden Rabin und Scott für ihre bahnbre- zieren, in dem die Kontinuumshypothese (CH) falsch ist. Setzen wir die
chende Arbeit mit dem Turing Award aus- Korrektheit von ZFC voraus, so folgt aus der Existenz eines solchen
gezeichnet, der höchsten Auszeichnung im Modells, dass die Kontinuumshypothese in ZFC nicht bewiesen werden
Bereich der theoretischen Informatik. kann.
7.4 Boolesche Modelle 399

Wir wissen aus Kapitel 1, dass die Forcing-Technik auf dem Prinzip der Die Forcing-Technik setzt
Modellerweiterung beruht, die neu konstruierten Modelle also dadurch die Existenz eines abzähl-
entstehen, dass ein bestehendes Modell um neue Elemente ergänzt wird. baren, transitiven Standard-
Ferner ist uns aus Kapitel 4 bekannt, dass wir aufgrund des zweiten modells von ZFC voraus.
Dies wirft die Frage auf, ob ein solches
Gödel’schen Unvollständigkeitssatzes gar nicht sicher sein können, ob
Modell zwangsläufig existieren muss. Die
ZFC überhaupt Modelle hat. Die Existenz eines Modells müssen wir ehrliche Antwort auf diese Frage lautet
einem Forcing-Beweis daher stets in Form einer Annahme voranstel- Nein, und zwar selbst dann, wenn wir die
len. Tatsächlich müssen wir diese Annahme noch etwas verstärken und Widerspruchsfreiheit von ZFC vorausset-
die Existenz eines abzählbaren transitiven Standardmodells einfordern. zen. Ist ZFC widerspruchsfrei, so folgt
Standardmodelle zeichnen sich dadurch aus, dass das Formelsymbol aus dem Modellexistenzsatz und dem Satz
‚∈‘ als die gewöhnliche Elementrelation interpretiert wird. vom Löwenheim-Skolem-Tarski zwar die
Existenz von abzählbaren Modellen, aller-
Die Betrachtung von Standardmodellen bringt einige Vereinfachungen dings ist nicht garantiert, dass sich dar-
mit sich, die sich unter anderem auf die Notation auswirken, mit der unter auch transitive Standardmodelle be-
wir die Modelleigenschaft beschreiben. Anders als in der allgemeinen finden. Dennoch gibt es Gründe, weshalb
Sprache der Prädikatenlogik erster Stufe sind in der Sprache von ZFC die meisten Mathematiker die verschärfte
sämtliche Funktionssymbole verschwunden, und es gibt neben ‚=‘ und Voraussetzung als eine adäquate Annah-
‚∈‘ keine weiteren Prädikate. Um eine ZFC-Formel als wahr oder falsch me akzeptierten. Ein Teil davon stammt
zu klassifizieren, müssen wir uns daher nicht mehr um die Bedeutung aus der Theorie der großen Kardinalzahl-
frei definierbarer Funktionen oder Prädikate sorgen, sondern nur noch axiome, die wir in diesem Buch aber nicht
darum, über welchem Individuenbereich eine Formel interpretiert wird behandeln können.
Vielleicht haben Sie sich gefragt, warum
und mit welchen Individuen die freien Variablen belegt sind. Für eine
wir die Existenz eines Modells eingefor-
geschlossene Formel ϕ spielt dann nur noch der Individuenbereich eine dert haben, das transitiv ist. Tatsächlich
Rolle, so dass wir anstatt erweist sich diese Forderung als eine sehr
(U, I) |= ϕ (7.13) natürliche. Dies wird deutlich, wenn wir
die verkürzte Schreibweise uns an die Rolle eines Modells erinnern,
das Mengenuniversum zu repräsentieren
U |= ϕ (7.14) und damit sämtliche Mengen zu umfas-
sen, die als existent angenommen wer-
verwenden können. Für offene Formeln wollen wir uns eine solche Ver- den. Ist ein Modell nicht transitiv, so muss
mindestens eine Menge ein Element ent-
kürzung ebenfalls erlauben. In diesem Fall soll die Schreibweise (7.14)
halten, das nicht Teil des Mengenuniver-
ausdrücken, dass die Beziehung (7.13) unabhängig davon wahr ist, mit sums selbst ist. Diese Eigenschaft ist zwar
welchen Individuen die freien Variablen belegt werden. gut mit Zermelos ursprünglicher Vorstel-
lung vereinbar, dass Mengen hierarchi-
Erfüllt eine Menge die Beziehung (7.14) für jede in ZFC beweisbare
sche Zusammenfassungen gesondert exis-
Formel, so nennen wir sie ein Modell von ZFC. Das postulierte Modell, tierender Urelemente sind, aber nicht mit
aus dem wir mithilfe der Forcing-Technik neue Modelle erzeugen wol- der modernen Sichtweise, dass sämtli-
len, bezeichnen wir im Folgenden mit M. Wie oben bereits erwähnt, che Elemente von Mengen selbst Mengen
nehmen wir dabei an, dass die Menge M abzählbar viele Elemente um- sind.
fasst, eine transitive Menge im Sinne von Definition 3.7 ist und das For-
melzeichen ‚∈‘ als die gewöhnliche Elementrelation interpretiert wird.
Kurz: M ist ein abzählbares, transitives Standardmodell von ZFC.

Unser erstes Zwischenziel besteht darin, das Modell M zu einem soge-


nannten booleschen Modell M(B) zu erweitern. Bevor wir dieses Ziel
400 7 Modelltheorie

Tabelle 7.1: Boolesche Algebren sind al- I Kommutativgesetze I Distributivgesetze


gebraische Strukturen, die Mitte des neun-
zehnten Jahrhunderts von dem britischen a∧b = b∧a a ∧ (b ∨ c) = (a ∧ b) ∨ (a ∧ c)
Mathematiker und Philosophen George a∨b = b∨a a ∨ (b ∧ c) = (a ∨ b) ∧ (a ∨ c)
Boole (Abbildung 7.22) entwickelt wur-
den [13, 14].
I Neutrale Elemente I Inverse Elemente
Im Jahr 1904 konnte der amerikanische
Mathematiker Edward Vermilye Hunting- Es existieren 1, 0 mit Für alle a existiert ein ¬a mit
ton zeigen, dass sich boolesche Algebren
durch die Angabe von lediglich vier Ge- a∧1 = a a ∧ ¬a = 0
setzen, den Huntington’schen Axiomen, a∨0 = a a ∨ ¬a = 1
eindeutig charakterisieren lassen [98].

erreichen können, müssen wir jedoch noch ein wenig Grundlagenarbeit


leisten und uns zunächst erarbeiten, was unter dem Begriff der boole-
schen Algebra und dem Begriff der booleschen Menge verstanden wird.

7.4.1 Boolesche Algebren

Mit ‚∧‘ und ‚∨‘ seien zwei binäre Verknüpfungen auf einer nichtleeren
Menge B gegeben. Das Tripel (B, ∧, ∨) nennen wir eine boolesche Al-
gebra, wenn die beiden Verknüpfungen die vier Huntington’schen Axio-
me aus Tabelle 7.1 erfüllen. Achten Sie darauf, den Begriff des Axioms,
den wir bisher immer nur im Kontext von formalen Systemen verwen-
det haben, an dieser Stelle nicht falsch zu interpretieren. Die Hunting-
ton’schen Axiome sind in diesem Kontext als gewöhnliche algebrai-
sche Beziehungen zu verstehen und nicht als die Axiome eines forma-
len Systems. Das Gleiche gilt für die Symbole ‚∧‘ und ‚∨‘, die jetzt eine
Doppelbedeutung in sich tragen. Im Kontext von booleschen Algebren
stehen sie für die auf B definierten Verknüpfungen und haben mit den
beiden Junktoren, die wir innerhalb von Logikformeln verwenden, im
Augenblick noch nichts zu tun.
George Boole
Wir wollen den Begriff der booleschen Algebra sogleich mit Leben fül-
(1815 – 1864)
len und zwei prominente Beispiele ansehen:

Abbildung 7.22: Mit der Arbeit The laws


of thought verfasste der britische Mathe- I Potenzmengenalgebra
matiker und Philosoph George Boole eines
der bedeutendsten Frühwerke der mathema- Für eine nichtleere, aber sonst beliebige Trägermenge T ist das Tri-
tischen Logik [13]. pel (B, ∧, ∨) mit
7.4 Boolesche Modelle 401

a b∪c a ∩ (b ∪ c) a b∩c a ∪ (b ∩ c)
a a a a a a
b b b b b b
∩ = ∪ =
c c c c c c

=
=
a a a a a a
b b b b b b
∪ = ∩ =
c c c c c c
a∩b a∩c (a ∩ c) ∪ (a ∩ c) a∪b a∪c (a ∪ b) ∩ (a ∪ c)

Abbildung 7.23: Veranschaulichung der Distributivgesetze anhand von Venn-Diagrammen

B := P(T ) • T1 := {1}
a ∧ b := a ∩ b
{1}=1
a ∨ b := a ∪ b

eine boolesche Algebra. Dass (B, ∧, ∨) tatsächlich alle vier Hunting- ∅=0
ton’schen Axiome erfüllt, können wir leicht nachprüfen. Die Gül-
tigkeit der Kommutativgesetze liegt auf der Hand, genauso wie die • T2 := {1, 2}
Existenz neutraler und inverser Elemente: Das neutrale Element 0 ist { 1, 2 } = 1
die leere Menge 0,/ das Element 1 die Trägermenge T und das inverse
Element einer Menge a die Komplementärmenge T \a. Die Gültig-
keit der Distributivgesetze wird offensichtlich, wenn wir die Mengen {1} {2}
in Form von Venn-Diagrammen darstellen (Abbildung 7.23).
Abbildung 7.24 veranschaulicht die Struktur der Potenzmengenal- ∅=0
gebra für die Fälle T1 = {1}, T2 = {1, 2} und T3 = {1, 2, 3}.
• T3 := {1, 2, 3}
I Schaltalgebra
Die Schaltalgebra basiert auf einer zweielementigen Grundmenge { 1, 2, 3 } = 1
B = {0, 1} und der folgenden Operatorendefinition:
 { 1, 2 } { 1, 3 } { 2, 3 }
1 falls a = 1 und b = 1
a ∧ b :=
0 sonst
 {1} {2} {3}
1 falls a = 1 oder b = 1
a ∨ b :=
0 sonst
∅=0
Aus praktischer Sicht ist die Schaltalgebra die wichtigste aller boole- Abbildung 7.24: Ordnungsstrukturen der
schen Algebren. Sie ist die mathematische Grundlage des digitalen ersten drei Potenzmengenalgebren
402 7 Modelltheorie

Teilmengen der Schaltungsentwurfs und in diesem Sinne das theoretische Funda-


natürlichen Zahlen, z.B.: ment der technischen Informatik [95]. Aus mathematischer Sicht
{ 0, 2, 4, 6, … }, können wir die Schaltalgebra als spezielle Mengenalgebra auffas-
{ 1, 3, 5, 7, … }, sen. Setzen wir 0 := 0/ und 1 := {u} für ein beliebiges Element u, so
{ 1, 2, 4, 8, 16, … }, ist die Schaltalgebra isomorph zur Mengenalgebra (P({u}), ∩, ∪).
{ 2, 3, 5, 7, 11, … }

Komplemente Eine notwendige Eigenschaft, die alle booleschen Algebren erfüllen


Endliche der endlichen müssen, ist die Abgeschlossenheit der Operatoren ‚∧‘ und ‚∨‘. Ver-
Teilmengen, z.B.: Teilmengen, z.B: knüpfen wir zwei Elemente a, b ∈ B, so erhalten wir mit a ∧ b und
{ 0 }, { 1, 2, 3, … }, a ∨ b stets ein Element aus B zurück. In der Potenzmengenalgebra ist
{ 1 }, { 0, 2, 3, … }, diese Eigenschaft sogar dann erfüllt, wenn wir unendlich viele Elemen-
{ 2 }, { 0, 1, 3, … }, te miteinander verknüpfen. Daher können wir die Operatorendefinition
{ 0, 1 } { 2, 3, … } gefahrlos auf beliebige Teilmengen A ⊆ B ausdehnen:
 "
a := a (Infimum von A)
a∈A a∈A
 
|M| < | | a := a (Supremum von A)
a∈A a∈A

| \M|<| | Die Struktur der Potenzmenge stellt hier sicher, dass sowohl das Supre-
mum als auch das Infimum für jede beliebige Teilmenge A ⊆ B stets ein
Element von B ist. Boolesche Algebren mit dieser Eigenschaft heißen
vollständig.

Alle booleschen Algebren mit einer endlichen Grundmenge B sind of-


fensichtlich vollständig, genauso wie sämtliche Potenzmengenalgebren.
|M| < | | Unweigerlich drängt sich an dieser Stelle die Frage auf, ob überhaupt
| \M|<| | boolesche Algebren existieren, die unvollständig sind? Die Antwort lau-
tet Ja!

Grundbereich
Eine solche Struktur können wir mit wenig Mühe aus der Potenzmen-
genalgebra erhalten. Hierzu entfernen wir einige Elemente aus B so ge-
Abbildung 7.25: Konstruktion des Grund- schickt, dass die Huntington’schen Axiome immer noch erfüllt sind,
bereichs einer unvollständigen booleschen aber nicht mehr jede Teilmenge ein Infimum oder ein Supremum be-
Algebra sitzt. Das folgende Beispiel demonstriert, wie dies gelingen kann. Wir
wählen die natürlichen Zahlen als Trägermenge und definieren B fol-
gendermaßen:

B := {M ∈ P(N) | |M| < |N|} ∪ {M ∈ P(N) | |N \ M| < |N|}

In Worten ist eine Teilmenge M der natürlichen Zahlen genau dann in


B enthalten, wenn M oder ihr Komplement N\M endlich ist (Abbil-
dung 7.25). Es lässt sich leicht nachprüfen, dass wir mit (B, ∩, ∪) im-
mer noch eine boolesche Algebra vor uns haben. Die Elemente 0 = 0/
und 1 = N sind in B verblieben, und für jedes a ∈ B ist auch das inverse
7.4 Boolesche Modelle 403

Element ¬a immer noch ein Element von B. Ferner führen die Mengen-
operationen ‚∩‘ und ‚∪‘ niemals aus der Menge B heraus, so dass alle
vier Huntington’schen Axiome weiterhin erfüllt sind.

Anders als die bisher betrachteten Algebren ist (B, ∩, ∪) aber nicht mehr
vollständig. Beispielsweise ist

A := {{0}, {2}, {4}, {6}, . . .}

eine Teilmenge von B, dessen Supremum



a = {0, 2, 4, 6, . . .}
a∈A

nicht in B enthalten ist. Weder die Menge {0, 2, 4, 6, . . .} noch ihr Kom-
plement {1, 3, 5, 7, . . .} ist endlich.

Es sind ausschließlich die vollständigen booleschen Algebren, die für


unsere Betrachtungen in diesem Abschnitt wichtig sind. Warum dies so
ist, wird sich weiter unten fast von selbst begründen.

Wir blicken an dieser Stelle nochmals auf die grafischen Darstellungen


in Abbildung 7.24. Aus diesen geht hervor, dass die Elemente mit der
Teilmengenrelation ‚⊆‘ eine Halbordnung bilden, die nach oben und
unten durch ein größtes bzw. ein kleinstes Element begrenzt wird. Fer-
ner zeigen die Beispiele, welche Elemente der booleschen Algebra die
Rolle des größten und des kleinsten Elements übernehmen: die beiden
neutralen Elemente 1 und 0. Eine derartige Ordnungsstruktur ist nicht
nur in einer Potenzmengenalgebra, sondern in jeder booleschen Algebra
vorhanden. Durch die Vereinbarung

a ≤ b :⇔ a ∧ b = a

wird jede boolesche Algebra (B, ∧, ∨) zu einer Halbordnung (B, ≤). Be-
achten Sie, dass die Ordnung im Allgemeinen nicht total ist, da zwei
Elemente a, b ∈ B nicht notwendigerweise in einer der beiden Ord-
nungsbeziehungen a ≤ b oder b ≤ a stehen müssen.

Die Definition einer Ordnung auf den Elementen von B macht es mög-
lich, wichtige ordnungstheoretische Begriffe auf boolesche Algebren zu
übertragen. Besonders wichtig ist für uns der Begriff des Filters, den wir
an dieser Stelle formal einführen wollen:
404 7 Modelltheorie

{ 1, 2, 3 } = 1 Definition 7.2 (Filter einer booleschen Algebra)

Es sei (B, ∧, ∨) eine boolesche Algebra. Ein Filter ist eine Teilmen-
{ 1, 2 } { 1, 3 } { 2, 3 } ge F ⊂ B mit den folgenden Eigenschaften:

1 ∈ F, 0 ∈
/F (7.15)
{1} {2} {3}
a ∈ F und b ∈ B mit b ≥ a ⇒ b ∈ F (7.16)
a ∈ F und b ∈ F ⇒ a ∧ b ∈ F (7.17)
∅=0
F ist ein Ultrafilter, wenn zusätzlich gilt:
{ 1, 2, 3 } = 1
a ∈ F ⇔ ¬a ∈
/F (7.18)

{ 1, 2 } { 1, 3 } { 2, 3 }
Den Begriff des Ultrafilters kennen wir bereits aus Abschnitt 7.2.2, wo
{1} {2} {3} wir ihn in einem spezielleren Kontext verwendet haben.

Als Beispiele sind in Abbildung 7.26 die Ultrafilter der Potenzmen-


∅=0 genalgebra (P({1,2, 3}), ∩, ∪) zu sehen. Mit

F1 := {{1, 2, 3}, {1,2}, {1, 3}, {1}}


{ 1, 2, 3 } = 1
F2 := {{1, 2, 3}, {1,2}, {2, 3}, {2}}
F3 := {{1, 2, 3}, {1,3}, {2, 3}, {3}}
{ 1, 2 } { 1, 3 } { 2, 3 }
existieren genau drei Teilmengen von B, die sich als Ultrafilter qualifi-
{1} {2} {3} zieren.
Weiter unten werden wir mehrfach auf den Begriff des generischen Fil-
∅=0
ters stoßen. Um offenlegen zu können, was sich dahinter verbirgt, müs-
sen wir vorab den Begriff der dichten Teilmenge einer booleschen Al-
gebra einführen. Hierunter wird eine Teilmenge D ⊆ B\{0} verstanden,
Abbildung 7.26: Alle Ultrafilter der Po- die für jedes Element aus B\{0} entweder das Element selbst oder ein
tenzmengenalgebra (P({1,2, 3}), ∩, ∪) kleineres enthält:

Für alle b ∈ B\{0} existiert ein d ∈ D mit d ≤ b. (7.19)

Wir können den Begriff der dichten Teilmenge auf eine beliebige Halb-
ordnung (P, ≤) übertragen, indem wir die Menge B\{0} in (7.19) ganz
einfach durch P ersetzen. In diesem Fall entfällt die Sonderbehandlung
des Nullelements, da ein solches Element nicht in jeder Halbordnung
existiert.

Mit den eingeführten Begriffen steht die folgende Definition auf soliden
Füßen:
7.4 Boolesche Modelle 405

Definition 7.3 Für die Konstruktion einer


Modellerweiterung werden
Es sei (B, ∧, ∨) eine boolesche Algebra. Ein Filter G ⊂ B heißt ge- wir weiter unten einen M-
nerisch, wenn er die folgende Schnitteigenschaft erfüllt: generischen Filter benöti-
gen, was unweigerlich die Frage nach
G ∩ D = 0/ für alle dichten Teilmengen D ⊆ B\{0} (7.20) dessen Existenz aufwirft. Unter welchen
Bedingungen wir uns den Rückgriff auf
einen solchen Filter gestatten dürfen, be-
antwortet uns ein Lemma, das nach den
Es lässt sich zeigen, dass jeder generische Filter einer booleschen Al- polnischen Mathematikern Helena Rasio-
gebra auch ein Ultrafilter ist, aber nicht umgekehrt. Das bedeutet, dass wa und Roman Sikorski benannt ist. In der
wir die generischen Filter als spezielle Ultrafilter auffassen können, die Formulierung für boolesche Algebren lau-
mit jeder dichten Teilmenge von B mindestens ein Element gemeinsam tet es folgendermaßen:
haben.
Sei (B, ∧, ∨) eine boolesche Algebra,
Hieraus leitet sich unmittelbar der Begriff des M-generischen Filters b ∈ B\{0} und D die Menge aller dichten
ab, den wir weiter unten benötigen. Ein solcher Filter liegt vor, wenn Teilmengen von B\{0}. Umfasst D
er die formulierte Schnitteigenschaft zumindest für alle in M enthal- höchstens abzählbar viele Elemente,
tenen Teilmengen erfüllt. Ein generischer Filter ist somit immer auch dann existiert ein generischer Filter
M-generisch, aber nicht notwendigerweise umgekehrt. G ⊂ B mit b ∈ G.

Die Voraussetzung, dass die Menge D


höchstens abzählbar viele Elemente ent-
7.4.2 Boolesche Mengen hält, ist essenziell. Erfüllt D diese Voraus-
setzung nicht, so verliert das Lemma sei-
ne Gültigkeit. Glücklicherweise können
Für alle gewöhnlichen Mengen gilt, dass eine Menge u in einer anderen
wir uns in diesem Punkt auf der siche-
Menge x enthalten ist oder nicht. Im ersten Fall schreiben wir u ∈ x und ren Seite wähnen, da wir lediglich einen
im zweiten Fall u ∈
/ x. In der booleschen Welt werden wir Formeln über M-generischen Filter benötigen und an
booleschen Mengen interpretieren, die wir uns als eine besondere Spiel- M die Voraussetzung geknüpft haben,
art unscharfer Mengen vorstellen dürfen. Unscharfe Mengen zeichnen nur abzählbar viele Elemente zu enthal-
sich dadurch aus, dass ein Element nicht vollständig zu einer Menge ge- ten. Damit ist auch die Menge aller in M
hören muss, sondern auch nur zu einem gewissen Grad darin enthalten enthaltenen dichten Teilmengen abzählbar
sein kann. und die Existenz eines M-generischen
Filters gesichert. In diesem Fall garantiert
Zu den bekanntesten unscharfen Mengen gehören die Fuzzy-Mengen, uns das Lemma von Rasiowa-Sikorski so-
die die Zugehörigkeit eines Elements durch eine Wahrscheinlichkeit gar noch mehr. Es besagt, dass für jedes
aus dem Intervall [0; 1] beschreiben. Boolesche Mengen folgen der glei- Element b ∈ B\{0} ein generischer Filter
chen Idee. Von den Fuzzy-Mengen unterscheiden sie sich nur dadurch, existiert, der b enthält.
dass der Grad der Mengenzugehörigkeit nicht durch eine Zahl, sondern
durch ein Element einer booleschen Algebra beschrieben wird.

Mathematisch wird eine unscharfe Menge durch eine ganz gewöhnliche


Menge dargestellt, im Fall einer booleschen Menge durch eine Funkti-
on, die jedem Urbild ein Element einer booleschen Algebra zuordnet
und jedes Urbild selbst eine boolesche Menge ist.
406 7 Modelltheorie

x = {(0,
/ {2,3}), ({(0,
/ {1,3})}, {1,3})} Was dies konkret bedeutet, machen wir an zwei Beispielmengen x und
y = {(0,
/ {1,3}), ({(0,
/ {1,2,3})}, {1,2,3})} y fest. Beide sind boolesche Mengen über der Potenzmengenalgebra
(P({1,2,3}), ∩, ∪):

Welt 1 Welt 2 Welt 3 x := {(0,


/ {2,3}), ({(0,
/ {1,3})}, {1,3})}
y {(0,
:= / {1,3}), ({(0,
/ {1,2,3})}, {1,2,3})}
x = {0,
/ {0}}
/
y = {0,
/ {0}}
/
Ähnlich wie im Falle der Fuzzy-Mengen ließen sich auch die Elemente
einer booleschen Algebra als Wahrscheinlichkeiten interpretieren, hilf-
x=y reicher ist an dieser Stelle aber das Denken in Welten. Beispielsweise
können wir uns die drei Elemente 1, 2 und 3 der Trägermenge {1,2,3}
x = {0}
/ als drei mögliche Welten vorstellen und eine boolesche Menge in jeder
y = {{0}}
/ Welt als eine gewöhnliche Menge interpretieren. Was dies für unsere
x∈y Beispielmengen bedeutet, illustriert Abbildung 7.27.

x = {{0}}
/ Nach dem gleichen Denkmuster können wir den booleschen Wahrheits-
y = {0,
/ {0}}
/ wert ϕ einer ZFC-Formel ϕ interpretieren: ϕ gibt an, in welchen
x⊆y Welten die Formel ϕ eine wahre Aussage über die dort vorhandenen
Mengen ist. Eine Formel mit ϕ = 1 ist in allen Welten wahr, eine For-
Abbildung 7.27: Zur Welteninterpretation mel mit ϕ = 0 in allen Welten falsch und eine Formel mit 0 < ϕ < 1
boolescher Mengen in gewissen Welten wahr und in anderen falsch. Für die oben definierten
Mengen x und y gilt beispielsweise der folgende Zusammenhang:

x ⊆ y = {1, 3} (7.21)
x ∈ y = {2} (7.22)
x = y = {3} (7.23)

An dieser Stelle wollen wir eine wichtige Menge einführen, die uns
bis zum Ende dieses Kapitels begleiten wird: die Menge M(B) . Für ei-
M ne vollständige boolesche Algebra (B, ∧, ∨) enthält diese Menge genau
jene Elemente aus dem postulierten Modell M, die die Struktur einer
booleschen Menge aufweisen. Mit anderen Worten: M(B) ist die Menge
M(B) aller booleschen Mengen aus M.

x = {0,
/ {0}}
/ ∈M Obgleich das Modell M eine echte Obermenge von M(B) ist, finden
wir es vollständig eingebettet in M(B) wieder. Jedes Element x ∈ M
hat mit der Menge
x̌ := {(ǔ, 1) | u ∈ x} (7.24)
x̌ = {(0,1),
/ ({(0,1)},1)}
/ ∈ M(B) nämlich einen natürlichen Vertreter in M(B) . In der Terminologie der
booleschen Modelle ist die Menge x̌ die Standardrepräsentation oder
Abbildung 7.28: Einbettung der Menge M der Standardrepräsentant von x (Abbildung 7.28).
in M(B) durch die Bildung von Standardre-
präsentanten
7.4 Boolesche Modelle 407

7.4.3 Boolesche Semantik

Jetzt sind alle notwendigen Begriffe eingeführt, um die Funktion  · 


formal zu definieren. Um sie möglichst übersichtlich aufzuschreiben,
vereinbaren wir vorab noch eine Reihe von Notationserleichterungen.
Zunächst erinnern wir uns daran, dass der boolesche Wahrheitswert ei-
ner Formel ϕ sowohl von dem Individuenbereich M(B) abhängt als
auch von Elementen aus M(B) , mit denen die in ϕ frei vorkommen-
den Variablen belegt werden. Die Schreibweise ϕM(B), I verdeutlicht
diese Abhängigkeit. Wir wollen eine intuitive Notation vereinbaren, die
in (7.21) bis (7.23) bereits vorweggenommen wurde, ohne ausdrücklich
darauf hinzuweisen. Dort haben wir uns erlaubt, die freien Variablen in
einer Formel direkt durch die Mengen zu ersetzen, mit denen sie die
Funktion I belegt. Dies werden wir auch weiterhin tun. Wenn wir im
Folgenden etwa
x ∈ yM(B) = b (7.25)
schreiben, so meinen wir damit den folgenden Zusammenhang:
ξ ∈ ζ M(B), I = b mit I(ξ ) = x und I(ζ ) = y
Die Nennung von I ist in Ausdrücken der Form (7.25) nicht mehr not-
wendig, da die Belegung der freien Variablen dort direkt aus der Formel
abgelesen werden kann. Schreiben wir ϕM(B) = b, ohne die Belegung
der freien Variablen von ϕ explizit zu kennzeichnen, so drücken wir
damit aus, dass der Wahrheitswert für alle möglichen Belegungen der
freien Variablen immer gleich b ist. Mit den vereinbarten Regeln lässt
sich die Funktion  · M(B) vergleichsweise übersichtlich definieren:

Definition 7.4 (Boolesche Wahrheitsfunktion)

Es sei M ein abzählbares, transitives Standardmodell von ZFC und


(B, ∧, ∨) eine vollständige boolesche Algebra. Die Wahrheitsfunk-
tion  ·  ist für jede ZFC-Formel ϕ rekursiv über dem Formelaufbau
definiert:

1M(B) := 1
0M(B) := 0
  
x ∈ yM(B) := y(v) ∧ x = vM(B) (7.26)
v∈dom(y)

x = yM(B) := x ⊆ yM(B) ∧ y ⊆ xM(B)


  
x ⊆ yM(B) := x(u) → u ∈ yM(B) (7.27)
u∈dom(x)
408 7 Modelltheorie

Es lohnt sich, einen genaue-


ren Blick auf die Art und
Weise zu werfen, wie in De- ¬ϕM(B) := ¬ϕM(B)
finition 7.4 die Semantik der ϕ ∧ ψM(B) := ϕM(B) ∧ ψM(B)
beiden Ausdrücke
ϕ ∨ ψM(B) := ϕM(B) ∨ ψM(B)
x ∈ yM(B) 
∀ ξ ϕ(ξ )M(B) := ϕ(x)M(B) (7.28)
x ⊆ yM(B) x∈M(B)

festgelegt ist. Um die komplex wirken- ∃ ξ ϕ(ξ )M(B) := ϕ(x)M(B) (7.29)
den rechten Seiten von (7.26) und (7.27) x∈M(B)
intuitiv zu erfassen, hilft die Weltenvor-
stellung weiter, die wir weiter oben zur
Die nicht aufgeführten Junktoren ‚→‘, ‚↔‘ und ‚‘ werden in der üb-
Veranschaulichung von booleschen Men-
gen verwendet haben. Die Frage, in wel-
lichen Weise auf die Junktoren ‚¬‘, ‚∧‘ und ‚∨‘ zurückgeführt.
chen Welten die Beziehung x ∈ y wahr Aus der Definition geht unmittelbar hervor, warum wir in unsere Be-
ist, lässt sich entscheiden, indem in allen trachtung ausschließlich vollständige boolesche Algebren einbeziehen.
Welten separat geprüft wird, ob die Men- Nur so ist gewährleistet, dass die Ausdrücke (7.28) und (7.29) einen
ge y in dieser Welt ein Element v enthält,
definierten Wert annehmen.
das mit x übereinstimmt. Die Menge aller
Welten, in denen eine Menge v in y vor- Oben haben wir bereits dargelegt, dass im booleschen Fall nicht mehr
handen ist, ist y(v), und die Menge aller
ohne Weiteres von wahren und von falschen Formeln gesprochen wer-
Welten, in denen x und v übereinstimmen,
ist x = v.
den darf. Eine Ausnahme liegt vor, wenn die Wahrheitsfunktion einen
Die Definition der Teilmengenrelation der Werte 0 oder 1 ergibt. Es ist legitim, 1 als wahr und 0 als falsch an-
folgt einer ähnlichen Überlegung: Die Be- zusehen, und dies wollen wir auch sprachlich zum Ausdruck bringen.
ziehung x ⊆ y ist in einer Welt wahr, wenn Wir sagen, eine Formel ϕ ist in M(B) wahr, wenn sie die Beziehung
alle Elemente u, die in dieser Welt in x ent- ϕM(B) = 1 erfüllt. Ist ϕM(B) = 0, so sprechen wir von einer falschen
halten sind, in der gleichen Welt auch in y Formel.
vorkommen. Bringen wir die angestellten
Überlegungen in eine symbolische Form, Damit sind wir bereit, den zentralen Satz dieses Abschnitts zu präsen-
so entstehen unmittelbar die in Definiti- tieren. Dieser besagt, dass alle Theoreme von ZFC in M(B) wahr sind:
on 7.4 festgelegten Ausdrücke.
Auf den ersten Blick scheinen die De-
finitionen verbotene Selbstreferenzen zu Satz 7.11 (Boolesche Modelleigenschaft)
enthalten, da die Elementbeziehung auf
die Teilmengenbeziehung und die Teil- Es sei M ein abzählbares, transitives Standardmodell von ZFC und
mengenbeziehung auf die Elementbezie- (B, ∧, ∨) eine vollständige boolesche Algebra. Dann gilt für jede
hung zurückgeführt wird. Auf den zwei- ZFC-Formel ϕ:
ten Blick wird deutlich, dass es sich um ei-
ne gemeinsame induktive Definition han-  ϕ ⇒ ϕM(B) = 1 (7.30)
delt. Sie ist so gestaltet, dass uns die Fun-
diertheit der ∈-Relation immer irgend-
wann auf einen der Basisfälle x ∈ 0 / oder
0/ ⊆ y zurückführt und die Rekursion ter- Einen ausführlichen Beweis dieses Satzes finden Sie z. B. in [8]. Wenn
miniert. wir im Folgenden sagen, die Menge M(B) ist ein boolesches Modell, so
ist dies die verbale Umschreibung des in Satz 7.11 symbolisch formu-
lierten Zusammenhangs (7.30).
7.5 Forcing 409

7.5 Forcing
Gewöhnliches
Modell
Wir wissen aus Abschnitt 7.4.3, dass die Menge M(B) ein boolesches
Modell von ZFC ist. Seine eigentliche Durchschlagskraft entfaltet die- M |= ψ für alle ZFC-Theoreme ψ
ses Ergebnis allerdings erst dann, wenn wir es mit einem anderen Er- M |= ϕ oder M |= ϕ
gebnis über boolesche Modelle kombinieren: der Tatsache, dass sich
boolesche Modelle in gewöhnliche Modelle zurücktransformieren las-
sen.

Das aus M(B) generierte Modell heißt M[G] und ist so gestaltet, dass Boolesches
die wahren und falschen Formeln von M(B) auch in M[G] wahr bzw. Modell
falsch sind. Es gilt also:
ψM(B) = 1 für alle ZFC-Theoreme ψ
ϕM(B) = 1 ⇒ M[G] |= ϕ (7.31) ϕM(B) = b mit b = 0 und b = 1
ϕM(B) = 0 ⇒ M[G] |= ϕ (7.32)

Daneben existieren in M(B) auch Formeln, die weder wahr noch falsch
sind, da sie einen von 0 und 1 verschiedenen Wahrheitswert annehmen.
Ob diese Formeln in M[G] zu wahren oder zu falschen Aussagen wer- Gewöhnliches Gewöhnliches
den, steuert die Menge G. Sie ist eine spezielle Teilmenge von B und Modell Modell
determiniert den Wahrheitsgehalt auf die folgende Weise:
b ∈ G1 b∈/ G2
M[G] |= ϕ ⇔ ϕM(B) ∈ G (7.33) M[G1 ] |= ϕ M[G2 ] |= ϕ

Die Formel ϕ wird in M[G] also genau dann zu einer wahren Aussa- Abbildung 7.29: Um die Unabhängigkeit
ge, wenn ihr boolescher Wahrheitswert ein Element von G ist (Abbil- einer Formel ϕ zu beweisen, wird aus dem
dung 7.29). Die geschilderte Konstruktion funktioniert allerdings nicht postulierten Modell M ein boolesches Mo-
für beliebige Teilmengen von B, sondern nur für solche, die gewissen dell M(B) konstruiert, in dem jede in ZFC
Restriktionen unterliegen. Um beispielsweise die Beziehung (7.33) wi- beweisbare Formel wahr ist, ϕ aber we-
der wahr noch falsch. Im nächsten Schritt
derspruchsfrei mit den beiden zuvor formulierten Eigenschaften (7.31)
werden hieraus zwei gewöhnliche Modelle
und (7.32) in Einklang zu bringen, müssen wir an G die folgenden bei- gewonnen, und zwar so, dass ϕ in einem
den Forderungen stellen: dieser Modelle wahr und in dem anderen
falsch ist. Die Konstruktion wird mithilfe
1 ∈ G, 0 ∈
/G (7.34)
eines generischen Filters G gesteuert. Die
Kommen Ihnen diese Beziehungen bekannt vor? Ein Blick auf Defi- Formel ϕ ist genau dann wahr in M[G],
nition 7.2 zeigt, dass wir diese Forderungen auch an jene Teilmengen wenn der boolesche Wahrheitswert von ϕ
ein Element von G ist.
von B gestellt haben, die als Filter einer booleschen Algebra bezeichnet
werden. Damit haben wir die Beschaffenheit der Menge G schon so gut
wie offengelegt. Die beschriebene Transformation gelingt genau dann,
wenn G ein M-generischer Filter von B ist.
Alles in allem erscheint damit das folgende Vorgehen plausibel: Um ei-
ne Aussage wie die Kontinuumshypothese als unentscheidbar zu iden-
tifizieren, wechseln wir aus dem postulierten Grundmodell M gedank-
lich in das boolesche Modell M(B) hinüber und bestimmen dort den
410 7 Modelltheorie

Technisch gesehen erfolgt booleschen Wahrheitswert der Kontinuumshypothese. Wir nehmen an,
die Rücktransformation von dieser Wahrheitswert sei b und von 0 und 1 verschieden, da nur dann ein
M(B) nach M[G] in zwei Unabhängigkeitsbeweis möglich ist. Anschließend erzeugen wir einen
Schritten. Im ersten Schritt M-generischen Filter G1 mit b ∈ G1 und einen M-generischen Filter
wird aus M(B) ein sogenanntes Quotien-
G2 mit b ∈/ G2 . Transformieren wir das boolesche Modell M(B) mit
tenmodell M(B)/G erstellt, das die Ele-
diesen beiden Filtern in zwei gewöhnliche Modelle zurück, so erhal-
mente von M(B) in Äquivalenzklassen
zusammenfasst. Grundlage für die Klas- ten wir mit M[G1 ] eines, in dem die Kontinuumshypothese wahr, und
senbildung ist die folgende Äquivalenzre- mit M[G2 ] ein anderes, in dem sie falsch ist. Aus der Existenz dieser
lation auf den Elementen von M(B) : Modelle ergibt sich dann unmittelbar die Unentscheidbarkeit der Kon-
tinuumshypothese in ZFC.
x ∼G y :⇔ x = yM(B) ∈ G
So plausibel dieser Plan auch klingen mag: In der geschilderten Form
Die Menge aller Äquivalenzklassen ist ist er nur schwer durchzuführen. In erster Linie sind wir mit dem Pro-
das Quotientenmodell M(B)/G : blem konfrontiert, kaum etwas über das postulierte Modell M zu wis-
sen. Tatsächlich können wir uns noch nicht einmal sicher sein, ob dieses
M(B)/G := { [x]G | x ∈ M(B) }
Modell überhaupt existiert. Erst recht wissen wir nichts über den boole-
Dieses Quotientenmodell ist ein gewöhn- schen Wahrheitswert von CH in M(B) , geschweige denn, mit welcher
liches Modell von ZFC, in dem die Un- booleschen Algebra (B, ∧, ∨) wir das Modell M(B) überhaupt bilden
schärfe von M(B) bereits vollständig ver- sollen. Der Hebel, an dem wir ansetzen, wird daher ein anderer sein. Er
schwunden ist. Im Gegensatz zu M, dem ist Bestandteil des folgenden Satzes:
Ausgangspunkt der Konstruktion, ist das
Quotientenmodell aber ein Nichtstandard-
modell, da die Relation ‚∈‘ nicht als die Satz 7.12 (Modelltheorem für boolesche Algebren)
gewöhnliche Elementrelation interpretiert
wird. Stattdessen ist das Formelzeichen Es sei M ein abzählbares, transitives Standardmodell von ZFC,
‚∈‘ mit der folgenden Bedeutung belegt: (B, ∧, ∨) eine vollständige boolesche Algebra aus M und G ⊂ B
ein M-generischer Filter. Dann hat ZFC ein abzählbares, transiti-
M[G] |= [x]G ∈ [y]G :⇔ x ∈ yM(B) ∈ G
ves Standardmodell M[G] mit den folgenden Eigenschaften:
Im zweiten Schritt wird das Quotien-
tenmodell M(B)/G einer Transformati- M ⊆ M[G] (7.35)
on unterzogen, die der polnische Ma- G ∈ M[G] (7.36)
thematiker Andrzej Mostowski im Jahr
1949 entdeckte [132]. Das Resultat die-
ser Transformation wird als Mostowski-
Kollaps bezeichnet und ist das Ergebnis, Das Modelltheorem deckt auf, dass das generierte Modell M[G] den
das wir suchen: das transitive Standard- generischen Filter G als Element enthält. Anders als die boolesche Al-
modell M[G]. gebra (B, ∧, ∨), für die das Modelltheorem fordert, ein Element von M
zu sein, darf sich G auch außerhalb von M befinden. In diesem Fall ist
M[G] eine echte Modellerweiterung, in der G als neues Element hinzu-
gekommen ist. Genau diese Eigenschaft nutzen wir für unsere Zwecke
aus. Wir verwenden den Filter G als Einfallstor, um in M gezielt neue
Mengen einzubringen.

Bevor wir diesen Plan umsetzen, bringen wir das Modelltheorem zu-
nächst noch in eine verallgemeinerte Form, die einfacher zu handhaben
ist und ganz ohne den Begriff der booleschen Algebra auskommt:
7.5 Forcing 411

Satz 7.13 (Modelltheorem für Halbordnungen) In einem Forcing-Beweis


müssen wir auf ein Phä-
Es sei M ein abzählbares, transitives Standardmodell von ZFC, nomen Rücksicht nehmen,
(P, ≤) eine Halbordnung aus M und G ⊆ P ein M-generischer das wir im Rahmen des
Filter. Dann hat ZFC ein abzählbares, transitives Standardmodell Skolem-Paradoxons diskutiert haben: das
Phänomen, dass die inhaltliche Bedeu-
M[G] mit den folgenden Eigenschaften:
tung einer Formel davon abhängen kann,
über welchem Grundbereich ihre Symbo-
M ⊆ M[G] (7.37)
le interpretiert werden. Um die Auswir-
G ∈ M[G] (7.38) kungen auf unsere Modellkonstruktion zu
verstehen, erinnern wir uns daran, dass al-
le Theoreme von ZFC wahre Aussagen
über die in M enthaltenen Mengen sind.
Im Kern besteht die Verallgemeinerung darin, die boolesche Algebra
In M sind damit alle mathematischen Ob-
(B, ∧, ∨) durch eine Halbordnung (P, ≤) und den Filter G ⊂ B durch jekte vertreten, deren Existenz sich inner-
einen entsprechenden Filter G ⊂ P zu ersetzen. Wie ein solcher Filter halb von ZFC beweisen lässt. Neben sehr
aussieht, klärt die folgende Definition: einfachen Objekten, zu denen unter an-
derem die leere Menge gehört, existieren
in jedem Modell beispielsweise auch die
Definition 7.5 (Filter einer Halbordnung) Kardinalzahlen ℵ1 und ℵ2 . Von außen
betrachtet sind diese Mengen aber nicht
Es sei (P, ≤) eine Halbordnung. Ein Filter ist eine nichtleere Teil- immer dieselben. Zum Beispiel sind die
menge F ⊆ P mit den folgenden Eigenschaften: Mengen, die innerhalb von M die Rolle
der Kardinalzahlen ℵ1 und ℵ2 überneh-
a ∈ F und b ∈ P mit b ≥ a ⇒ b ∈ F (7.39) men, von außen betrachtet abzählbar und
a ∈ F und b ∈ F ⇒ c ≤ a und c ≤ b für ein c ∈ F (7.40) damit von den überabzählbaren Mengen
verschieden, die außerhalb von M mit ℵ1
und ℵ2 bezeichnet werden.
Wenn ein Symbol verschiedene Mengen
Auch für einen Ordnungsfilter gilt: Hat er mit allen dichten Teilmen- bezeichnen kann, werden wir es bei Be-
gen von P mindestens ein Element gemeinsam, so heißt er generisch, darf um die Nennung des Modells ergän-
und ein M-generischer Filter liegt vor, wenn er die Schnitteigenschaft zen, auf das es sich bezieht. Die Symbole
zumindest für all jene dichten Teilmengen erfüllt, die in M enthalten ℵM M
1 und ℵ2 stehen dann für jene Men-
sind. gen, die innerhalb des Modells M die
Rolle der zweiten oder dritten transfiniten
Mit der Hilfe von Satz 7.13 wollen wir ein Modell von ZFC konstru- Kardinalzahl übernehmen. Das Gleiche
ieren, in dem die Kontinuumshypothese eine falsche Aussage ist. Die- gilt für die reellen Zahlen. Wenn wir im
ses Ziel werden wir durch die Adjunktion einer bijektiven Abbildung Folgenden RM schreiben, so meinen wir
zwischen den Mengen R und ℵ2 erreichen. Existiert in einem Modell damit jene von außen abzählbare Menge,
die innerhalb von M die Rolle der reellen
eine solche Abbildung, so kann keine Bijektion zwischen R und ℵ1
Zahlen übernimmt.
existieren, im Widerspruch zur Kontinuumshypothese, die die Existenz Nicht alle Mengen sind relativ. Beispiels-
einer solchen Abbildung postuliert. Filter sind keine Abbildungen, so weise lässt sich für die Menge N der na-
dass die Möglichkeit entfällt, die Bijektionen in Form von G direkt türlichen Zahlen zeigen, dass sie in allen
hinzuzufügen. An dieser Stelle nutzen wir aus, dass G nicht die ein- Modellen die gleiche ist. Für Mengen, die
zige Menge ist, die im Zuge der Modellerweiterung ergänzt wird. Um in einem solchen absoluten Sinne existie-
die Modelleigenschaft zu erhalten, müssen beispielsweise auch all jene ren, können wir auf die zusätzliche Anga-
Mengen in M[G] aufgenommen werden, die sich direkt oder indirekt be des Modells bedenkenlos verzichten.
412 7 Modelltheorie

ℵM aus G konstruieren lassen. Unser Plan besteht deshalb darin, eine Halb-
α 2
ordnung (P, ≤) mit der Eigenschaft zu finden, dass sich aus einem M-
0 0 1 …
generischen Filter dieser Ordnung eine Bijektion zwischen R und ℵ2
n 1 0 … konstruieren lässt.
N Für unsere Zwecke passend wird sich die Halbordnung (P, ⊇) mit


… ℵM
P := { f : ℵM
2 × N → {0, 1} | f ∈ M und dom( f ) ist endlich}
α 2

1 … erweisen. In Worten ausgedrückt umfasst P alle partiellen Funktionen


aus M, die eine endliche Teilmenge von ℵM 2 × N in die Menge {0, 1}
n 0 0 …
abbilden. Geordnet sind die Elemente aus P durch die Obermengenbe-
N ziehung: Eine Funktion f ∈ P ist genau dann kleiner als eine Funktion

g ∈ P, wenn ihr Definitionsbereich eine Obermenge des Definitionsbe-


ℵM reichs von g ist und die Funktionswerte überall dort, wo beide Funktio-
α 2
nen definiert sind, übereinstimmen.
0 0 …
Die Abbildungen 7.30 und 7.31 machen deutlich, dass wir uns jede
n 1 1 0 1 …
Funktion aus P als eine unendliche Tabelle vorstellen können, die sich
N horizontal über alle Elemente aus der Menge ℵM

2 und vertikal über alle


Elemente aus der Menge N erstreckt. Die Funktionen von P entsprechen
Abbildung 7.30: Elemente der Halbord- dann genau jenen Tabellen, in denen endlich viele Einträge mit Nullen
nung (P, ⊇) oder Einsen markiert sind.
Genau wie P ist auch ein generischer Filter G ⊆ P eine Menge von
α ℵM Funktionen. Aus der Filtereigenschaft von G lässt sich eine Reihe in-
β 2
… teressanter Eigenschaften ableiten. Zunächst folgt aus (7.40), dass für
0 0 0 1
zwei Funktionen p, q ∈ G eine andere Funktion r ∈ G existieren muss,
n 0 1 1 … die sowohl die Beziehung r ≤ p als auch die Beziehung r ≤ q erfüllt.
N Folglich ist r eine Funktion, deren Definitionsbereich sowohl den Defi-

nitionsbereich von p als auch den Definitionsbereich von q umfasst und


überall dort, wo p oder q definiert sind, den gleichen Funktionswert
α ℵM
β 2
wie p bzw. q annimmt. Das bedeutet, dass die Funktionswerte von p
n 1 0 1 … und q im Schnitt ihrer Definitionsbereiche übereinstimmen müssen und
0 0 … die Vereinigung p ∪ q wiederum eine Funktion ist. Das Gleiche gilt,
wenn wir alle Elemente von G miteinander vereinen: Aus der Filterei-
N 

genschaft von G folgt, dass die Vereinigungsmenge G eine partielle


Funktion f der Form
α ℵM
β 2
f : ℵM
2 × N → {0, 1}
n 1 0 …
sein muss. Wir werden nun zeigen, dass sich über die Funktion f noch
1 1 0 1 …
mehr aussagen lässt, und werfen hierfür nochmals einen Blick auf Ab-
N

bildung 7.30. Die dort gezeigten Beispiele wurden bewusst so ausge-


wählt, dass ihre Definitionsbereiche das Element (α, n) enthalten. Alle


Abbildung 7.31: Weitere Elemente der Funktionen mit dieser Eigenschaft fassen wir in der Menge D(α,n) zu-
Halbordnung (P, ⊇) sammen. Die Beispiele in Abbildung 7.31 sind ebenfalls nicht zufällig
7.5 Forcing 413

gewählt. Sie zeichnen sich dadurch aus, dass sich die Funktionswerte Wenn Sie bereits ein wenig
in den mit α und β markierten Spalten in mindestens einer Zeile unter- Vorwissen über die Forcing-
scheiden. Diese Funktionen fassen wir in der Menge Dα,β zusammen. Technik mitbringen, werden
Sie mit Sicherheit ein ganz
Die Mengen D(α,n) und Dα,β weisen die Eigenschaft auf, dicht in (P, ⊇) bestimmtes Symbol vermissen. Gemeint
zu sein, so dass der generische Filter G mit jeder dieser Mengen min- ist die Forcing-Relation ‚‘, die von Paul
destens ein Element gemeinsam hat. Hieraus können wir zwei wichtige Cohen eingeführt wurde und gewisserma-
Schlüsse ziehen: ßen die symbolische Galionsfigur dieser
Beweistechnik ist. Dass wir das Symbol
‚‘ an keiner Stelle benötigt haben, geht
I Aus der Beziehung auf die Entscheidung zurück, die Forcing-
Technik über die Theorie der booleschen
G ∩ D(α,n) = 0/ für alle α ∈ ℵM
2 und alle n ∈ N Modelle zu erklären. Cohen kannte die-
folgt, dass die Funktion f jedes Element aus der Menge ℵM sen eleganten Zugang zu der von ihm
2 × N in
entwickelten Theorie noch nicht, so dass
ihrem Definitionsbereich enthält. Mit anderen Worten: Die Funktion
sich seine ursprüngliche Herleitung deut-
f ist total. lich von der hier skizzierten unterscheidet.
I Aus der Beziehung In Wirklichkeit ist der Unterschied aber
nur begrifflicher Natur, da sich die Begrif-
G ∩ Dα,β = 0/ für alle α, β ∈ ℵM
2 fe und Konzepte der booleschen Welt di-
rekt auf die von Cohen ersonnenen Be-
folgt, dass die Teilfunktionen fα (n) := f (α, n) paarweise verschie- griffe und Konzepte abbilden lassen. Dies
den sind. gelingt auch für die Forcing-Relation, die
folgendermaßen mit dem hier vorgestell-
Damit sind wir bereit für das große Finale. Da der generische Filter ten Begriffsgerüst zusammenhängt:

G ein Element von M[G] ist, finden wir auch die Funktion f = G
in M[G] wieder, genauso wie die Funktionen fα . Jede dieser Funktio- p  ϕ ⇔ p ≤ ϕM(B) (7.41)
nen beschreibt eine reelle Zahl in M[G]. Da diese Funktionen paarwei-
Damit können wir auch ein wenig er-
se verschieden sind, muss M[G] mindestens ℵM 2 verschiedene reel- hellen, weshalb Cohen seine Beweistech-
le Zahlen enthalten, was wir symbolisch folgendermaßen aufschreiben nik als Forcing und die Relation ‚‘ als
können: Forcing-Relation bezeichnet hatte. Neh-
M[G] |= |RM | ≥ ℵM 2 (7.42) men wir das Element p in den generischen
Um die Ziellinie zu überqueren, ist noch ein letzter Schritt notwendig. Filter G auf, so sind darin auch alle Ele-
mente q mit p ≤ q enthalten, mit der Fol-
Wir wissen im Moment nämlich nur, dass die Mengen, die in M die
ge, dass jede Formel ϕ mit p ≤ ϕM(B)
Rollen von R und ℵ2 übernehmen, in M[G] die Ungleichung (7.42)
zu einer wahren Aussage in M[G] wird.
erfüllen. Wir benötigen aber die Aussage, dass die Ungleichung für die Mit anderen Worten: Die Wahl p ∈ G er-
M[G]
Mengen RM[G] und ℵ2 gilt. zwingt die Wahrheit von ϕ in M[G]. Ge-
nauso wird die linke Seite von (7.41) ge-
Da M[G] eine echte Modellerweiterung von M ist, enthält M[G] min- lesen. p  ϕ bedeutet:
destens so viele reelle Zahlen wie M, so dass wir (7.42) in
„p erzwingt ϕ.“
M[G] |= |R| ≥ ℵM
2 (7.43)
Oder, wenn wir die englische Sprache be-
umschreiben können. Um den letzten Schritt zu vollziehen, ist un- mühen:
ser mathematisches Instrumentarium allerdings nicht weit genug ent-
wickelt. Wir benötigen an dieser Stelle eine Eigenschaft, die im Engli- „p forces ϕ.“
schen als Countable chain condition, kurz CCC, bezeichnet wird. Für
414 7 Modelltheorie

Sind a und b zwei Elemen- boolesche Algebren mit dieser Eigenschaft lässt sich zeigen, dass das
te einer booleschen Alge- mithilfe von Satz 7.12 generierte Modell M[G] die gleichen Kardinal-
bra, so schreiben wir a ⊥ b, zahlen wie das Modell M enthält und damit insbesondere die Bezie-
M[G]
falls a und b zwei inkompa- hung ℵM 2 = ℵ2 erfüllt. Eine analoge Beziehung gilt für den Fall,
tible Elemente sind. Hiermit sind Elemen-
dass M[G] mithilfe von Satz 7.13 und einer entsprechenden Halbord-
te gemeint, deren Konjunktion das Null-
nung gebildet wird. Hieraus folgt, dass wir (7.43) in
element ergibt:

a ⊥ b :⇔ a ∧ b = 0 M[G] |= |R| ≥ ℵ2 (7.44)

Eine Antikette einer booleschen Algebra umschreiben können, was das Gleiche ist wie
(B, ∧, ∨) ist eine Teilmenge A ⊆ B\{0}
mit der Eigenschaft, dass alle Elemente M[G] |= 2ℵ0 ≥ ℵ2
aus A paarweise inkompatibel sind. Da
zwei Elemente a, b ∈ B\{0} mit a ≤ b im- Damit sind wir am Ziel. Mit M[G] haben wir ein Modell erschaffen, in
mer kompatibel sind, erweisen sich sämt- dem die Kontinuumshypothese eine falsche Aussage ist.
liche Elemente einer Antikette als mitein-
ander unvergleichbar. Damit ist eine Anti- So leistungsfähig die Forcing-Technik ist, so kompliziert sind ihre De-
kette tatsächlich das Gegenteil einer Ket- tails. Es würde ein eigenes Buch füllen, sie in mathematischer Schär-
te, die als eine linear geordnete Teilmen- fe detailliert aufzuarbeiten, so dass die Ausführungen auf den voran-
ge von B definiert ist. Für zwei Elemente gegangenen Seiten lediglich als ein zaghafter Vorstoß in dieses span-
a und b einer Kette gilt stets a ≤ b oder nende Teilgebiet der Mengenlehre verstanden werden können. Diejeni-
b ≤ a. gen Leser, die sich tiefer in die Theorie der booleschen Modelle und
Die in der Literatur als Countable chain der Forcing-Technik einarbeiten möchten, finden in den Übersichtsarti-
condition bezeichnete Eigenschaft bedeu- keln [31] und [50] sowie den Büchern [8], [167] und [100] die ausge-
tet, dass jede Antikette einer booleschen
lassenen Details.
Algebra höchstens abzählbar viele Ele-
mente enthält. Dass sich diese Eigen-
schaft, wie es im Text angedeutet ist, auf
die Beschaffenheit der Kardinalzahlen in-
nerhalb des booleschen Modells M(B)
auswirkt, ist ein erstaunliches Ergebnis,
da selbst auf den zweiten Blick kein direk-
ter intuitiver Zusammenhang erkennbar
wird. Um dieses Ergebnis mathematisch
herzuleiten, sind zahlreiche Details aus
der Theorie der booleschen Modelle not-
wendig, die den Rahmen dieser Kurzein-
führung aber bei Weitem sprengen wür-
den.
7.6 Übungsaufgaben 415

7.6 Übungsaufgaben

In dieser Übungsaufgabe wollen wir die Prädikatenlogik erster Stufe verwenden, um gerich- Aufgabe 7.1
tete Graphen zu beschreiben. Hierzu fassen wir die Individuenmenge U einer Interpretation 
(U, I) als die Knotenmenge eines Graphen auf und legen über das zweistellige Prädikatzei- Webcode
chen E fest, ob zwischen zwei Knoten x und y eine Kante verläuft. Das folgende Beispiel 7731
verdeutlicht den Zusammenhang zwischen Interpretationen und Graphen:

I Interpretation (U, I) I Graph G


a
U := {a, b, c, d}

I(E) := {(a, b),


(b, a),
b d
(b, c),
(c, b),
(d, a),
(d, c)} c

Ferner sei die folgende Liste von prädikatenlogischen Formeln erster Stufe gegeben:

ϕ1 := ¬E(a, b)
ϕ2 := ¬∃ z1 (E(a, z1 ) ∧ E(z1 , b))
ϕ3 := ¬∃ z1 ∃ z2 (E(a, z1 ) ∧ E(z1 , z2 ) ∧ E(z2 , b))
. . . := . . .

a und b sind Konstantensymbole.

a) Welche intuitive Bedeutung besitzt die Formel ϕn ?

b) Die Eigenschaft, ein zusammenhängender Graph zu sein, ist nicht innerhalb der Prädika-
tenlogik erster Stufe definierbar. Beweisen Sie diese Behauptung, indem Sie zeigen, dass
keine PL1-Formel ϕ mit der folgenden Eigenschaft existiert:

(U, I) |= ϕ ⇔ (U, I) beschreibt einen zusammenhängenden Graphen

Hinweis: Ein Graph heißt zusammenhängend, wenn für zwei beliebig gewählte Knoten x
und y stets ein Pfad von x nach y existiert. Ein Pfad von x nach y ist eine endliche Folge
von Kanten, die x und y in der gewünschten Richtung miteinander verbinden.
416 7 Modelltheorie

Aufgabe 7.2 K sei ein formales System, in dem sich arithmetische Aussagen ableiten lassen. Wir nehmen
 an, K erfüllt die folgende Eigenschaft:
Webcode
7145  ϕ ⇔ |= ϕ

I Theoreme von K sind z. B. 1 + 1 = 3, ∃ x ∀ y x > y, ¬∃ y 1 + y = 2, . . .

I Keine Theoreme von K sind z. B. 1 + 1 = 2, ∀ x ∃ y x ≤ y, ∃ y 1 + y = 2, . . .

K ist der perfekte Lügner, da genau diejenigen arithmetischen Formeln aus den Axiomen
abgeleitet werden können, die im Standardmodell der Peano-Arithmetik falsch sind.

a) Lassen sich die Symbole ‚s‘, ‚=‘, ‚+‘ und ‚ב so uminterpretieren, dass K ein Modell
besitzt?

b) Kann ein formales System mit der postulierten Eigenschaft überhaupt existieren?

Aufgabe 7.3 Sei ϕ eine Formel der Prädikatenlogik erster Stufe mit Gleichheit. Sind die folgenden Aus-
 sagen richtig oder falsch? Begründen Sie Ihre Antworten.
Webcode
7878
a) Hat ϕ ein endliches Modell, dann hat ϕ auch ein unendliches Modell.

b) Hat ϕ ein unendliches Modell, dann hat ϕ auch ein endliches Modell.

c) Lassen sich a) oder b) mithilfe des Satzes von Löwenheim-Skolem-Tarski beantworten?

Aufgabe 7.4 Der Satz von Euklid besagt, dass es unendlich viele Primzahlen gibt. Hieraus folgt, dass
 keine natürliche Zahl x existieren kann, die von jeder Primzahl geteilt wird. Innerhalb der
Webcode Peano-Arithmetik können wir den Sachverhalt folgendermaßen ausdrücken:
7000
ϕ := ¬∃ x ∀ y (prime(y) → y | x)

Ganz offensichtlich ist die Formel ϕ im Standardmodell der Peano-Arithmetik eine wahre
Aussage. Wie üblich nehmen wir an, die Peano-Arithmetik sei frei von Widersprüchen.

I Zeigen Sie, dass ϕ nicht innerhalb der Peano-Arithmetik bewiesen werden kann.

I Ist die Unbeweisbarkeit von ϕ eine Folge des Gödel’schen Unvollständigkeitssatzes?


7.6 Übungsaufgaben 417

In der von uns gewählten Formulierung gilt der Modellexistenzsatz auch für die Prädikaten- Aufgabe 7.5
logik mit Gleichheit. Beschränken wir uns auf die PL1 ohne Gleichheit, so können wir ihn 
sogar geringfügig verschärfen: Webcode
7304

Satz 7.14 (Modellexistenz der PL1 ohne Gleichheit)

Sei K eine Theorie erster Ordnung. Dann gilt:

I K hat ein abzählbares Modell ⇔ K ist widerspruchsfrei

Der Unterschied ist unscheinbar, aber dennoch bemerkenswert: In der Prädikatenlogik ohne
Gleichheit können wir aus der Widerspruchsfreiheit nicht nur die Existenz eines Modells,
sondern die Existenz eines abzählbaren Modells folgern.

a) Welche Konsequenzen ergeben sich hieraus für den Satz von Löwenheim-Skolem-Tarski?

b) Zeigen Sie, dass die vorgenommene Verallgemeinerung nicht für die Prädikatenlogik mit
Gleichheit gilt.

Sei M := {N ⊆ N | 1 ∈ N} Aufgabe 7.6



a) Welche der folgenden Aussagen sind wahr? Welche sind falsch? Webcode
7837
Wahr Falsch

I M ist ein Filter.

I M ist ein maximaler Filter.

I M ist ein Ultrafilter.

I M ist ein freier Ultrafilter.

b) Sei F ein Ultrafilter. Was lässt sich über seine Elemente aussagen, wenn wir wissen, dass
die Menge {1} in ihm enthalten ist?
418 7 Modelltheorie

Aufgabe 7.7 In dieser Aufgabe sind E1 und E2 zwei Enumeratoren mit



Webcode E1 := {5, 8, 9, 18, 19, 25, 33}
7481 E2 := {8, 12, 19, 23, 24, 25, 31, 32, 39, 49, 60}

a) Erzeugen Sie jeweils eine Matrixdarstellung von E1 und von E2 :

0 1 2 3 4 5 x 0 1 2 3 4 5 x
0 ... 0 ...

1 ... 1 ...

2 ... 2 ...

3 ... 3 ...

4 ... 4 ...

5 20 26 33 41 50 60 ... 5 20 26 33 41 50 60 ...
.. .. .. .. .. .. .. .. .. .. .. .. .. ..
y . . . . . . . y . . . . . . .

b) Für welche der folgenden Mengen ist E1 bzw. E2 ein Enumerator?

M1 := {0,
/ {2, 3}, {2, 4}} M3 := {{2, 3}, {2, 4}}
M2 := {0,
/ {2, 3}, {2, 4}, {3, 4}, {3, 4, 5}} M4 := {{2, 3}, {2, 4}, {3, 4}, {3, 4, 5}}

Aufgabe 7.8 In Abschnitt 7.3 haben wir explizit festgelegt, dass ein Enumerator einer Menge M auch ein
 Enumerator für alle Teilmengen von M ist.
Webcode
7988 Nehmen Sie für den Moment an, wir hätten auf die Teilmengenregel verzichtet. Dann wäre
eine Menge E ∈ P(N) genau dann ein Enumerator für eine Menge M ⊂ P(N), wenn M exakt
diejenigen Mengen enthält, die in der Matrixdarstellung von E vorkommen. Die Menge

E = {0, 4, 12, 24, 40, 60}

wäre also ausschließlich ein Enumerator für die Menge

M = {{0}, {1}, {2}, {3}, {4}, {5}}


7.6 Übungsaufgaben 419

0 1 2 3 4 5 x
0 0 1 3 6 10 15 ...

1 2 4 7 11 16 22 ...

2 5 8 12 17 23 30 ...

3 9 13 18 24 31 39 ...

4 14 19 25 32 40 49 ...

5 20 26 33 41 50 60 ...
..
y ↑ ↑ ↑ ↑ ↑ ↑ .
{0}

{1}

{2}

{3}

{4}

{5}
Auf den ersten Blick scheint diese Definition unsere intuitive Vorstellung eines Enumerators
besser zu erfassen als die ursprüngliche, und dennoch haben wir sie bewusst nicht verwendet.
Welche Gründe könnte es hierfür geben?

a) Bildet das Tripel (P(0),


/ ∩, ∪) eine boolesche Algebra? Aufgabe 7.9

b) Zeigen Sie, dass keine boolesche Algebra (B, ∧, ∨) existiert, die eine endliche Grundmen- Webcode
ge B mit einer ungeraden Anzahl an Elementen besitzt. 7111

Die nachfolgende Liste enthält eine Reihe von Gesetzmäßigkeiten, die in jeder booleschen Aufgabe 7.10
Algebra gelten müssen. Zeigen Sie, dass sich alle Gesetze aus den vier Huntington’schen 
Axiomen ableiten lassen. Webcode
7573
I Assoziativgesetze I Idempotenzgesetze I Absorptionsgesetze

a ∨ (b ∨ c) = (a ∨ b) ∨ c a∨a = a a ∨ (a ∧ b) = a
a ∧ (b ∧ c) = (a ∧ b) ∧ c a∧a = a a ∧ (a ∨ b) = a

I Gesetze von De Morgan I Eliminationsgesetze I Doppelnegationsgesetz

¬(a ∨ b) = ¬a ∧ ¬b a∨1 = 1 ¬¬a = a


¬(a ∧ b) = ¬a ∨ ¬b a∧0 = 0
420 7 Modelltheorie

Aufgabe 7.11 In Abschnitt 7.4.1 haben wir mit der Relation ‚≤‘ eine Ordnung auf den Elementen einer
 booleschen Algebra eingeführt. Zeigen Sie die folgenden Äquivalenzen:
Webcode
7287 a ≤ b ⇔ a∨b = b ⇔ a → b = 1

Aufgabe 7.12 In Abschnitt 7.5 haben wir das Grundmodell M mithilfe der
 Forcing-Technik zu einem Modell M[G] erweitert, das eine Bi-
Webcode jektion zwischen R und ℵ2 enthält. Wenden wir die Forcing-
7212 Maschinerie ein zweites Mal an, und zwar auf das Modell M[G],
so können wir daraus ein weiteres Modell erzeugen, in dem z. B.
eine Bijektion zwischen R und ℵ3 besteht. Dann gäbe es in die-
sem Modell auch eine Bijektion zwischen ℵ2 und ℵ3 , was nicht
sein kann.

Was haben wir in dieser Argumentation übersehen?

Aufgabe 7.13 Wir wollen das Modelltheorem 7.13 auf die Halbordnung (P, ⊇) anwenden, mit:

Webcode P := { f : ℵM
1 →R
M
| f ∈ M und dom( f ) ist in M höchstens abzählbar}
7226 In Worten ausgedrückt umfasst P alle in M enthaltenen partiellen Funktionen, die auf einer
in M abzählbaren Teilmenge von ℵM 1 definiert sind und jedem Element des Definitions-
bereichs eine Menge zuordnen, die in M zu den reellen Zahlen gehört. Geordnet sind die
Elemente aus P durch die Obermengenbeziehung.

Wir definieren die folgenden Mengen:


Dα := {p ∈ P | α ∈ dom(p)} (7.45)
Dx := {p ∈ P | x ∈ ran(p)} (7.46)

In Worten ausgedrückt enthält die Menge Dα alle Funktionen aus P, die an der Stelle α ∈ ℵM
1
definiert sind, und die Menge Dx alle Funktionen aus P, die mindestens ein Element auf die
reelle Zahl x ∈ RM abbilden.

a) Zeigen Sie, dass die beiden Mengen für alle α ∈ ℵM


1 und alle x ∈ R
M
dicht in P sind.

b) Es sei G ein generischer Filter von P. Zeigen Sie, dass die Menge G eine totale und
surjektive Funktion von ℵM
1 nach R
M
ist.
c) Das Ergebnis der vorherigen Teilaufgabe bedeutet: M[G] |= |RM | ≤ |ℵM
1 |. Folgt daraus,
dass die Kontinuumshypothese in M[G] wahr ist?
Literaturverzeichnis

[1] Abian, A.: Nonstandard models for arithmetic and [14] Boole, G.; Corcoran, J.: The Laws of Thought
analysis. In: Studia Logica 33 (1974), Nr. 1, S. 11–22 (Reprint). New York: Prometheus Books, 2003
[2] Ackermann, W.: Zum Hilbert’schen Aufbau der [15] Boolos, G.: A New Proof of the Gödel Incompleteness
reellen Zahlen. In: Mathematische Annalen 99 (1928), Theorem. In: Notices of the American Mathematical
S. 118–133 Society (1989), Nr. 36, S. 388–390
[3] Ackermann, W.: Zur Axiomatik der Mengenlehre. In: [16] Boolos, G. S.; Burgess, J. P.; Jeffrey, R. C.:
Mathematische Annalen 131 (1956), August, Nr. 4, S. Computability and Logic. Cambridge: Cambridge
336–345 University Press, 2007
[4] Aliprand, J.: The Unicode Standard Version 5.0. [17] Boolos, G. S.; Jeffrey, R. C.: Computability and
Boston, MA: Addison-Wesley, 2007 Logic. Cambridge: Cambridge University Press, 1989
[5] Amos, M.: Theoretical and Experimental DNA [18] The Busy Beaver Game and the Meaning of Life.
Computation. Berlin, Heidelberg, New York: In: Brady, A. H.: The Universal Turing Machine: A
Springer-Verlag, 2005 Half Century Survey. Oxford: Oxford University
[6] Baez, J.: This Week’s Finds in Mathematical Physics. Press, 1991, S. 259–277
http://math.ucr.edu/home/baez/ [19] Brady, G.: From Peirce to Skolem: A Neglected
week236.html Chapter in the History of Logic. Amsterdam: Elsevier
[7] Bauer, Andrej: Portraitphoto von Dana Scott. Scienceg, 2000 (Studies in the History and Philosophy
http://creativecommons.org/licenses/ of Mathematics)
by-sa/2.5/. – Creative Commons License 2.5, [20] Burali-Forti, C.: Una questione sui numeri transfiniti.
Typ: Attribution-ShareAlike In: endiconti del Circolo Matematico di Palermo 11
[8] Bell, J. L.: Set Theory: Boolean-Valued Models and (1897), S. 154–164
Independence Proofs in Set Theory. Oxford: Oxford [21] Burger, E. B.; Tubbs, R.: Making Transcendence
University Press, 1985 (Oxford Logic Guides) Transparent. Berlin, Heidelberg, New York:
[9] Bergman, G. M.: Portraitphoto von Alfred Tarski. Springer-Verlag, 2004
1968. – GNU-Lizenz für freie Dokumentation, [22] Cantor, G.: über eine Eigenschaft des Inbegriffes aller
Version 1.2 reellen algebraischen Zahlen. In: Crelles Journal für
[10] Bernays, P.: Axiomatische Untersuchung des Mathematik 77 (1874), S. 258–262
Aussagen-Kalküls der „Principia Mathematica “. In: [23] Cantor, G.: Über unendliche, lineare
Mathematische Zeitschrift 25 (1926), S. 305–320 Punktmannigfaltigkeiten. 5. In: Mathematische
[11] Bernays, P.: A system of axiomatic set theory. II. In: Annalen 21 (1883), S. 545–591
Journal of Symbolic Logic 6 (1941) [24] Cantor, G.: Beiträge zur Begründung der transfiniten
[12] Boole, G.: The Mathematical Analysis of Logic, Being Mengenlehre. In: Mathematische Annalen 46 (1895),
an Essay Toward a Calculus of Deductive Reasoning. Nr. 4, S. 481–512
Cambridge: Macmillan, 1847 [25] Cantor, G.: Beiträge zur Begründung der transfiniten
[13] Boole, G.: An Investigation of the Laws of Thought. Mengenlehre (Zweiter Artikel). In: Mathematische
London: Walton and Maberley, 1854. – Nachgedruckt Annalen 49 (1897), S. 207–246
in [14] [26] Chaitin, G.: The Limits of Mathematics. Berlin,

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6
422 Literaturverzeichnis

Heidelberg, New York: Springer-Verlag, 1998 Enumerable Predicates. In: Journal of Symbolic Logic
[27] Chaitin, G.: The Unknowable. Berlin, Heidelberg, 18 (1953), S. 33–41
New York: Springer-Verlag, 1999 [42] Davis, M.: Computability and Unsolvability. New
[28] Chaitin, G.: Conversations with a Mathematician. York: McGraw-Hill, 1958
Berlin, Heidelberg, New York: Springer-Verlag, 2002 [43] Davis, M.: The Undecidable. Mineola, NY: Dover
[29] Chaitin, G.: Meta Maths: The Quest for Omega. Publications, 1965
London: Atlantic Books, 2007 [44] Davis, M.: Mathematical logic and the origin of
[30] Chaitin, G. J.: On the Simplicity and Speed of modern computers. (1987), S. 137–167
Programs for Computing Infinite Sets of Natural [45] Davis, M.; Putnam, H.; Robinson, J.: The Decision
Numbers. In: Journal of the ACM 16 (1969), Nr. 3, S. Problem for Exponential Diophantine Equations. In:
407–422 Annals of Mathematics 74 (1961), Nr. 3, S. 425–436
[31] Chow, T. Y.: A Beginner’s Guide to Forcing. In: [46] Dawson, J. W.: The Compactness of First-Order
Communicating Mathematics, Contemporary Logic: From Gödel to Lindström. In: History and
Mathematics 479 (2009), S. 25–40 Philosophy of Logic 14 (1993), S. 15–37
[32] Church, A.: A Note on the Entscheidungsproblem. In: [47] Dawson, J. W.: Kurt Gödel. Leben und Werk. Berlin,
Journal of Symbolic Logic 1 (1936), Nr. 1, S. 40–41 Heidelberg, New York: Springer-Verlag, 1999
[33] Church, A.: An Unsolvable Problem of Elementary [48] Deiser, O.: Einführung in die Mengenlehre. Berlin,
Number Theory. In: American Journal of Heidelberg, New York: Springer-Verlag, 2009
Mathematics 58 (1936), Nr. 2, S. 345–363 [49] DePauli-Schimanovich, W.: Europolis. Bd. 5: Kurt
[34] Church, A.; Rosser, J. B.: Some properties of Gödel und die Mathematische Logik. Linz: Trauner
conversion. In: Transactions of the American Verlag, 2005
Mathematical Society 39 (1936), S. 472–482 [50] Easwaran, K.: A Cheerful Introduction to Forcing and
[35] Cohen, P.: The Independence of the Continuum the Continuum Hypothesis. In: ArXiv e-prints (2007),
Hypothesis. In: Proceedings of the National Academy December
of Sciences of the United States of America Bd. 50. [51] Ebbinghaus, H.-D.; Flum, J.; Thomas, W.: Einführung
Washington, DC: National Academy of Sciences, in die mathematische Logik. Spektrum Akademischer
1963, S. 1143–1148 Verlag, 1996
[36] Cohen, P.: The Independence of the Continuum [52] Engesser, H. (Hrsg.); Claus, V. (Hrsg.); Schwill, A.
Hypothesis II. In: Proceedings of the National (Hrsg.): Duden Informatik. Mannheim: Dudenverlag,
Academy of Sciences of the United States of America 1988
Bd. 51. Washington, DC: National Academy of
[53] Feferman, S.: In the Light of Logic. Oxford: Oxford
Sciences, 1964, S. 105–110
University Press, 1999 (Logic and Computation in
[37] Cohen, P.: Set Theory and the Continuum Hypothesis. Philosophy)
New York: Benjamin, 1966
[54] Fraenkel, A.: Zu den Grundlagen der
[38] Corporation, Rand: A million random digits with Cantor-Zermeloschen Mengenlehre. In:
100,000 normal deviates. New York: Free Press, 1955 Mathematische Annalen 86 (1922), S. 230–237
[39] Dauben, J. W.: Georg Cantor and the Battle for [55] Frege, G.: Begriffsschrift. Eine der arithmetischen
Transfinite Set Theory. In: Proceedings of the 9th nachgebildeten Formelsprache. Ditzingen: Verlag
ACMS Conference, 1993, S. 1–22 Louis Nebert, 1879
[40] Corrections to Turing’s Universal Computing [56] Frege, G.: Rezension von Georg Cantor: Zur Lehre
Machine. In: Davies, D. W.: The Essential Turing. vom Transfiniten. In: Zeitschrift für Philosophie und
Oxford University Press, 2004, S. 97–101 Philosophische Kritik 100 (1892), S. 269–272
[41] Davis, M.: Arithmetical Problems and Recursively [57] Frege, G.: Grundgesetze der Arithmetik,
Literaturverzeichnis 423

Begriffsschriftlich abgeleitet. Bd. 2. Jena: Verlag [73] Gödel, K.: Collected Works II. Publications
Hermann Pohle, 1903 1938-1974. New York: Oxford University Press, 2001
[58] Frege, G.: Grundgesetze der Arithmetik. Bd. 1. [74] Gómez-Torrente, M.; Zalta, Edward N. (Hrsg.): Alfred
Hildesheim: Verlag Olms, 1962 Tarski. Spring 2011. http://plato.stanford.
[59] Frege, G.: Grundgesetze der Arithmetik. Bd. 2. edu/archives/spr2011/entries/tarski/,
Hildesheim: Verlag Olms, 1962 2011
[60] Frege, G.: Grundgesetze der Arithmetik, [75] Goodstein, R.: On the restricted ordinal theorem. In:
Begriffsschriftlich abgeleitet. Bd. 2. Darmstadt: Journal of Symbolic Logic 9 (1944), S. 33–41
Wissenschaftliche Buchgesellschaft, 1962 [76] Gostanian, R.: Constructible Models of Subsystems of
[61] Frege, G.: Die Grundlagen der Arithmetik: Eine ZF. In: Journal of Symbolic Logic 45 (1980), Nr. 2, S.
logisch-mathematische Untersuchung über den Begriff 237–250
der Zahl. Halle: Reclam, 1986 [77] Hardy, G. H.: Bertrand Russell and Trinity.
[62] Frege, G.: Begriffsschrift und andere Aufsätze. Cambridge: Cambridge University Press, 1970
Hildesheim: Verlag Olms, 2007 [78] Hasenjäger, G.: Eine Bemerkung zu Henkins Beweis
[63] Galilei, Galileo: Two New Sciences. Madison, WI: für die Vollstandigkeit des Prädikatenkalküls der
University of Wisconsin Press, 1974 Ersten Stufe. In: Journal of Symbolic Logic 18 (1953),
Nr. 1, S. 42–48
[64] Gardner, M.: The random number omega bids fair to
hold the mysteries of the universe. In: Scientific [79] Hemme, H.: 222 Knobeleien für jede Gelegenheit.
American 241 (1979), December, S. 22–31 Reinbek: Rowohlt Verlag, 2009
[65] Gauß, C. F.: Brief an H. C. Schumacher vom 12. Juli. [80] Henkin, L. A.: The Completeness of Formal Systems.
1831. – Abgedruckt in [128] (1947)
[66] Gentzen, G.: Die Widerspruchsfreiheit der reinen [81] Henkin, L. A.: The Completeness of the First-Order
Zahlentheorie. In: Mathematische Annalen 112 Functional Calculus. In: Journal of Symbolic Logic 14
(1936), S. 493–565 (1949), S. 159–166
[67] Gödel, K.: Über die Vollständigkeit des Logikkalküls, [82] Henkin, L. A.: Completeness in the Theory of Types.
Universität Wien, Diss., 1929 In: Journal of Symbolic Logic 15 (1950), S. 81–91
[68] Gödel, K.: Die Vollständigkeit der Axiome des [83] Henkin, L. A.: A Problem Concerning Provability. In:
logischen Funktionenkalküls. In: Monatshefte für Journal of Symbolic Logic 17 (1952), S. 160
Mathematik 37 (1930), S. 349–360 [84] Henkin, L. A.; Mostowski, A.: Review of Maltsev
[69] Gödel, K.: Über formal unentscheidbare Sätze der 1941 and 1956. In: Journal of Symbolic Logic 24
Principia Mathematica und verwandter Systeme I. In: (1959), S. 55–57
Monatshefte für Mathematik und Physik 38 (1931), S. [85] Herken, R.: The Universal Turing Machine. A Half-
173–198 Century Survey: A Half-century Survey. Berlin,
[70] Gödel, K.: On undecidable propositions of formal Heidelberg, New York: Springer-Verlag, 1995
mathematical systems. Princeton, NJ: Institute for [86] Hermes, H.: Einführung in die mathematische Logik.
Advanced Study, 1934 Stuttgart: Teubner Verlag, 1963
[71] Gödel, K.: The Consistency of the Axiom of Choice [87] Hilbert, D.: Grundlagen der Geometrie. Leipzig:
and of the Generalized Continuum-Hypothesis. In: Teubner Verlag, 1899
Proceedings of the U.S. National Academy of Sciences [88] Hilbert, D.: Über das Unendliche. In: Mathematische
Bd. 24, 1938, S. 556–557 Annalen 95 (1926), Nr. 1, S. 161–190
[72] Gödel, K.: What is Cantor’s Continuum Problem? In: [89] Hilbert, D.: Die Grundlagen der Mathematik. In:
American Mathematical Monthly 54 (1947), S. Abhandlungen aus dem mathematischen Seminar VI
515–525 (1928), S. 80
424 Literaturverzeichnis

[90] Hilbert, D.: Radioansprache als Audiodatei. http: (1976), S. 449–464


//math.sfsu.edu/smith/Documents/ [104] Kalmár, L.: über die Axiomatisierbarkeit des
HilbertRadio/HilbertRadio.mp3. Aussagenkalküls. In: Acta Scientiarum
Version: 1930 Mathematicarum 7 (1935), S. 222–243
[91] Hilbert, D.: Die Hilbert’schen Probleme. Frankfurt: [105] Kant, I.: Kritik der reinen Vernunft. Teddington,
Verlag Harri Deutsch, 1998 (Ostwalds Klassiker) Middlesex: Echo Library, 2006
[92] Hilbert, D.; Ackermann, W.: Grundzüge der [106] Kaye, R.: Models of Peano arithmetic. Oxford:
theoretischen Logik. 1. Auflage. Berlin, Heidelberg: Oxford University Press, 1991 (Oxford Logic Guides)
Springer-Verlag, 1928
[107] Kelley, J. L.: General Topology. New York: Van
[93] Hilbert, D.; Bernays, P.: Die Grundlehren der Nostrand Reinhold, 1955
mathematischen Wissenschaften in
[108] Kirby, L.; Paris, J.: Accessible independence results
Einzeldarstellungen. Bd. 50: Grundlagen der
for Peano arithmetic. In: Bulletin of the London
Mathematik – Band II. Berlin, Heidelberg:
Mathematical Society 14 (1982), S. 725–731
Springer-Verlag, 1939
[109] Kleene, S. C.: General recursive functions of natural
[94] Hilbert, D.; Hellinger, E.; Bernays, P.; Blumenthal, O.:
numbers. In: Mathematische Annalen 112 (1936), S.
Gesammelte Abhandlungen. Berlin, Heidelberg:
727–742
Springer-Verlag, 1932
[110] Kleene, S. C.: Introduction to Metamathematics.
[95] Hoffmann, D. W.: Grundlagen der Technischen
Amsterdam: North Holland, 1952 (Bibliotheca
Informatik. München: Hanser-Verlag, 2009. – 2.
Mathematica)
Auflage
[111] Kleene, S. C.: Mathematical Logic. Mineola, NY:
[96] Hoffmann, D. W.: Theoretische Informatik. München:
Dover Publications, 2002
Hanser-Verlag, 2009
[112] Knuth, D. E.: Mathematics and Computer Science:
[97] Hofstadter, D. R.: Gödel, Escher, Bach: Ein endloses
Coping with Finiteness. In: Science Magazine 194
geflochtenes Band. Stuttgart: Klett-Cotta, 2006
(1976), Nr. 4271, S. 1235–1242
[98] Huntington, E. V.: Sets of Independent Postulates for
[113] Kolmogorov, A. N.: Three approaches to the
the Algebra of Logic. In: Transactions of the
quantitative definition of information. In: Problems in
American Mathematical Society 5 (1904), S. 288–309
Information Transmission 1 (1965), S. 1–7
[99] Jacobs, K.: Portraitphoto von Ernst Zermelo.
[114] Kuratowski, K.: Sur la notion d’ordre dans la théorie
http://creativecommons.org/licenses/
des ensembles. In: Fundamenta Mathematicae 2
by-sa/2.0. Version: 1953. – Creative Commons
(1921), S. 161–171
License 2.0, Typ: Attribution-ShareAlike
[115] Kučera, A.; Slaman, T.: Randomness and Recursive
[100] Jech, T.: Set Theory: The Third Millennium Edition.
Enumerability. In: SIAM Journal on Computing 31
Berlin, Heidelberg, New York: Springer-Verlag, 2011
(2001), Nr. 1, S. 199–211
[101] Jones, J. P.; Matijasevič, Y. V.: Register Machine
[116] Leibniz, G. W.: Monadologie und andere
Proof of the Theorem on Exponential Diophantine
metaphysische Schriften. Hamburg: Felix Meiner
Representation of Enumerable Sets. In: Journal of
Verlag, 2002
Symbolic Logic 49 (1984), Nr. 3, S. 818–829
[117] Löb, M. H.: Solution of a problem of Leon Henkin.
[102] Jones, J. P.; Matijasevič, Y. V.: Proof of Recursive
In: Journal of Symbolic Logic 20 (1955), S. 115–118
Unsolvability of Hilbert’s Tenth Problem. In: The
American Mathematical Monthly 98 (1991), Nr. 8, S. [118] Löb, M. H.; Wainer, S. S.: Hierarchies of number
689–709 theoretic functions I, II: A Correction. In: Archive for
Mathematical Logic 14 (1970), S. 198–199
[103] Jones, J. P.; Sato, D.; Wada, H.; Wiens, D.:
Diophantine Representation of the Set of Prime [119] Löwenheim, L.: über Möglichkeiten im Relativkalkül.
Numbers. In: The American Mathematical Monthly 83 In: Mathematische Annalen 76 (1915), S. 447–470
Literaturverzeichnis 425

[120] Łukasiewicz, L.; Tarski, A.: Untersuchungen über den [134] Neumann, J. von: Zur Einführung der transfiniten
Aussagenkalkül. In: Comptes Rendus des séances de Zahlen. In: Acta Litterarum ac Scientiarum Regiae
la Société des Sciences et des Lettres de Varsovie 23 Universitatis Hungaricae (1923)
(1930), S. 30–50 [135] Neumann, J. von: Various techniques used in
[121] Maltsev, A.: Untersuchungen aus dem Gebiete der connection with random digits. In: Applied
mathematischen Logik. In: Matematicheskii Sbornik Mathematics Series (1951), Nr. 12, S. 36–38
43 (1936), S. 323–336 [136] Neumann, J. von; Burks, A. W. (Hrsg.): Theory of
[122] Maltsev, A.: Ob odnom obscem metode polucenia self-reproducing automata. Urbana: University of
lokal’nyh teorem grupp. In: Ivanovskii Illinois Press, 1966
Gosudarstvennyi Pedagogiceskii Institut, Ucenye [137] Brief an Ernst Zermelo vom 15. August 1923.
zapiski, Fiziko-matematicheskie nauki 1 (1941), Nr. 1, In: Neumann, J. von: Problemgeschichte der neueren
S. 3–9 Mathematik (1800–1950). Mannheim: B. I.
[123] Matijasevič, Y. V.: Portraitphoto von Yuri Matijasevič. Wissenschaftsverlag, 1978
http://creativecommons.org/licenses/ [138] Neumann, J. von: First Draft of a Report on the
by/3.0. Version: 1969. – Creative Commons EDVAC. In: IEEE Annals of the History of Computing
License 3.0, Typ: Attribution 15 (1993), Nr. 4, S. 27–75
[124] Matijasevič, Y. V.: Enumerable Sets are Diophantine. [139] Nielsen, M. A.; Chuang, I. L.: Quantum Computation
In: Soviet Mathematics Doklady 11 (1970), S. and Quantum Information. Cambridge: Cambridge
354–358 University Press, 2000 (Cambridge Series on
[125] Mendelson, E.: Introduction to Mathematical Logic. Information & the Natural Sciences)
4th edition. Boca Raton, FL: Chapman & Hall, CRC [140] Noether, E. (Hrsg.); Cavailles, J. (Hrsg.): Actualités
Press, 1997 scientifiques et industrielles. Bd. 518: Briefwechsel
[126] Menzel, W.; Schmitt, P. H.: Formale Systeme. Cantor-Dedekind. Paris: Hermann, 1937
Vorlesungsskript Wintersemester 94/95. Universität [141] Oberschelp, A.: On Pairs and Tuples. In: Zeitschrift
Karlsruhe, 1994 für Mathematische Logik und Grundlagen der
[127] Meschkowski, H.: Problemgeschichte der neueren Mathematik 37 (1991), S. 55–56
Mathematik (1800–1950). Mannheim: B. I. [142] Peano, G.: Arithmetices principia, nova methodo
Wissenschaftsverlag, 1978 exposita. Torino: Fratelli Bocca, 1889
[128] Meschkowski, H.; Nilson, W.: Georg Cantor. Briefe. [143] Peano, G.: The principles of arithmetic, presented by a
Berlin, Heidelberg, New York: Springer-Verlag, 1991 new method. In: Heijenoort, J. van (Hrsg.): From
[129] Minsky, M. L.: Recursive Unsolvability of Post’s Frege to Gödel. Cambridge, MA: Harvard University
Problem of ’Tag’ and Other Topics in the Theory of Press, 1977, S. 83–97
Turing Machines. In: Mathematische Annalen 74 [144] Podnieks, K.: About Model Theory.
(1961), Nr. 2, S. 437–455 http://www.ltn.lv/~podnieks/gt.html
[130] Minsky, M. L.: Computation: Finite and Infinite [145] Poizat, B.: A Course in Model Theory: An
Machines. Englewood Cliffs, N. J.: Prentice Hall, Introduction to Contemporary Mathematical Logic.
1967 (Prentice Hall Series in Automatic Computation) Berlin, Heidelberg, New York: Springer-Verlag, 2000
[131] Morse, A. P.: A Theory of Sets. New York: Academic [146] Pöppe, C.: Das Hotel Hilbert. In: Mandelbrot
Press, 1965 Dreidimensional 4 (2010), April
[132] Mostowski, A.: An undecidable arithmetical [147] Post, E. L.: Recursively enumerable sets of positive
statement. In: Fundamenta Mathematicae 36 (1949), integers and their decision problems. In: Bulletin of
Nr. 1, S. 143–164 the American Mathematical Society 50 (1944), S.
[133] Nagel, E.; Newman, J. R.: Der Gödel’sche Beweis. 284–316
München: Oldenbourg Wissenschaftsverlag, 2006 [148] Post, E. L.: Recursive Unsolvability of a Problem of
426 Literaturverzeichnis

Thue. In: Journal of Symbolic Logic 12 (1947), Nr. 1, North-Holland Publishing, 1952
S. 1–11 [166] Rosser, J. B.: Logic for Mathematicians. New York:
[149] Péter, R.: über den Zusammenhang der verschiedenen McGraw-Hill, 1953
Begriffe der rekursiven Funktionen. In: [167] Rosser, J. B.: Simplified Independence Proofs:
Mathematische Annalen 110 (1934), S. 612–632 Boolean Valued Models of Set Theory. New York:
[150] Péter, R.: Konstruktion nichtrekursiver Funktionen. Academic Press, 1969
In: Mathematische Annalen 111 (1935), S. 42–60 [168] Rucker, R.: Infinity and the Mind. The Science and
[151] Péter, R.: Rekursive Funktionen. Berlin: Philosophy of the Infinite. Basel: Birkhäuser-Verlag,
Akademie-Verlag, 1957 1982
[152] Péter, R.: Deutsche Taschenbücher. Bd. 37: Das Spiel [169] Russell, B.: Basic Writings of Bertrand Russell.
mit dem Unendlichen. Frankfurt: Verlag Harri London: Routledge, 1992
Deutsch, 1984 [170] The Philosophy of Logical Atomism. In: Russell, B.:
[153] Quine, W. V. O.: New Foundations for Mathematical The Collected Papers of Bertrand Russell. London:
Logic. In: American Mathematical Monthly 44 Routledge, 1993
(1937), S. 70–80 [171] Russell, B.: Autobiography. London: Routledge, 1998
[154] Quine, W. V. O.: Mathematical Logic, Revised [172] Salerno, Joe: Portraitphoto von Leon Henkin.
Edition. Harvard: Harvard University Press, 1981 http://creativecommons.org/licenses/
[155] Rabin, M.; Scott, D.: Finite automata and their by-sa/3.0. Version: 2007. – Creative Commons
decision problems. In: IBM Journal of Research and License 3.0, Typ: Attribution
Development 3 (1959), S. 114–125 [173] Schöning, U.: Logik für Informatiker. Heidelberg:
[156] Rado, T.: On Non-Computable Functions. In: The Bell Spektrum Akademischer Verlag, 2000
System Technical Journal 41 (1962), Nr. 3, S. 877–884 [174] Schöning, U.: Theoretische Informatik – kurzgefasst.
[157] Ramsey, F. P.: On a Problem in Formal Logic. In: Heidelberg: Spektrum Akademischer Verlag, 2001
Proceedings of the London Mathematical Society 30 [175] Scott, D.: A proof of the independence of the
(1930), S. 264–286 continuum hypothesis. In: Mathematical Systems
[158] Rautenberg, W.: Einführung in die Mathematische Theory 1 (1967), S. 89–111
Logik. 3. Auflage. Wiesbaden: Vieweg+Teubner [176] Sierpinski, W.: Sur une courbe dont tout point est un
Verlag, 2008 point de ramification. In: Comptes Rendus
[159] Reidemeister, K.: Hilbert Gedenkband. Berlin, hebdomadaires des séances de l’Acadeémie des
Heidelberg, New York: Springer-Verlag, 1971 Sciences (1915), S. 302–305
[160] Resag, J.: Die Grenzen der Berechenbarkeit. [177] Sigmund, K.; Dawson, J.; Mühlberger, K.: Kurt
Unvollständigkeit und Zufall in der Mathematik. Gödel: Das Album. Wiesbaden: Vieweg+Teubner
http://www.joerg-resag.de Verlag, 2006
[161] Riesel, H.: Prime Numbers and Computer Methods for [178] Singh, S.: Fermats letzter Satz. München: Deutscher
Factorization. Boston, MA: Birkhäuser-Verlag, 1994 Taschenbuch Verlag, 2000
[162] Robinson, A.: On the Metamathematics of Algebra. [179] Skolem, T.: Logisch-kombinatorische
Amsterdam: North-Holland, 1951 Untersuchungen über die Erfüllbarkeit und
[163] Rosser, J. B.: A mathematical logic without variables. Beweisbarkeit mathematischen Sätze nebst einem
In: Annals of Mathematics 36 (1935), S. 127–150 Theoreme über dichte Mengen. In: Det Norske
Videnskaps-Akademi 4 (1920), S. 1–36
[164] Rosser, J. B.: Extensions of Some Theorems of Gödel
and Church. In: Journal of Symbolic Logic 1 (1936), [180] Einige Bemerkungen zur axiomatischen Begründung
S. 87–91 der Mengenlehre. In: Skolem, T.:
Matematikerkongressen i Helsingfors den 4-7 Juli
[165] Rosser, J. B.: Many-valued logic. Amsterdam:
Literaturverzeichnis 427

1922. Helsinki: Akademiska Bokhandeln, 1923, S. [194] Tarski, A.: The Concept of Truth in Formalized
217–232 Languages. In: Corcoran, John (Hrsg.): Logic,
[181] Skolem, T.: über einige Grundlagenfragen der semantics, metamathematics. Indianapolis, IN:
Mathematik. In: Skrifter utgitt av Det Norske Hackett Publishing Co., 1983, S. 152–278
Videnskaps-Akademi i Oslo, I. [195] Tarski, A.: On Definable Sets of Real Numbers. In:
Matematisk-naturvidenskapelig klasse 7 (1929), S. Corcoran, John (Hrsg.): Logic, semantics,
1–49 metamathematics. Indianapolis, IN: Hackett
[182] Skolem, T.: über die Nichtcharakterisierbarkeit der Publishing Co., 1983, S. 110–142
Zahlenreihe mittels endlich oder abzählbar unendlich [196] Tarski, A.; Givant, S. R.: A Formalization of Set
vieler Aussagen mit ausschließlich Zahlvariablen. In: Theory Without Variables. American Mathematical
Fundamenta Mathematicae 23 (1934), S. 150–161 Society, 1987 (Colloquium Publications 41)
[183] Smith, P.: An Introduction to Godel’s Theorems. [197] Tennenbaum, S.: Non-archimedian models for
Cambridge: Cambridge University Press, 2007 arithmetic. In: Notices of the American Mathematical
(Cambridge Introductions to Philosophy) Society 6 (1959), S. 270
[184] The incompleteness theorems. In: Smoryński, C.: [198] Thue, A.: Probleme über Veränderungen von
Handbook of Mathematical Logic. Amsterdam: Zeichenreihen nach gegebenen Regeln. In: Skrifter
North-Holland Publishing, 1977 utgit av Videnskapsselskapet i Kristiania I.10 (1914)
[185] Smullyan, R. M.: Gödel’s Incompleteness Theorems. [199] Toenniessen, F.: Das Geheimnis der transzendenten
Oxford: Oxford University Press, 1992 (Oxford Logic Zahlen: Eine etwas andere Einführung in die
Guides) Mathematik. Berlin, Heidelberg, New York:
[186] Socher, R.: Theoretische Grundlagen der Informatik. Springer-Verlag, 2009
München: Hanser-Verlag, 2008 [200] Turing, A. M.: On computable numbers with an
[187] Solomonoff, R. J.: A Preliminary Report on a General application to the Entscheidungsproblem. In:
Theory of Inductive Inference. (1960), Februar, Nr. Proceedings of the London Mathematical Society 2
V-131 (1936), Juli – September, Nr. 42, S. 230–265
[188] Solomonoff, R. J.: A Formal Theory of Inductive [201] Turing, A. M.: On computable numbers with an
Inference. Part I. In: Information and Control 7 application to the Entscheidungsproblem. A
(1964), March, Nr. 1, S. 1–22 correction. In: Proceedings of the London
Mathematical Society 2 (1937), Nr. 43, S. 544–546
[189] Solomonoff, R. J.: A Formal Theory of Inductive
Inference. Part II. In: Information and Control 7 [202] Turing, A. M.: Computing Machinery and
(1964), June, Nr. 2, S. 224–254 Intelligence. In: Mind 59 (1950), S. 433–460
[190] St-Louis, Jerome: The Mandelbulb at 5 iterations. [203] Vaught, R.: Model theory before 1945. In: Henkin, L.
http://creativecommons.org/licenses/ (Hrsg.): Proceedings of Symposia in Pure
by-sa/3.0. Version: 2009. – Creative Commons Mathematics Bd. 25, American Mathematical Society,
License 3.0, Typ: Attribution-Share Alike 1974, S. 153–172
[191] Tarski, A.: Sur les ensembles définissables de [204] Vopěnka, P.: General theory of ∇-models. In:
nombres réels. In: Fundamenta Mathematicae 17 Commentationes Mathematicae Universitatis
(1931), S. 210–239 Carolinae 8 (1967), S. 145–170
[192] Tarski, A.: Poj˛ecie prawdy w j˛ezykach nauk [205] Wainer, S. S.: A classification of the ordinal recursive
dedukcyjnych. In: Nakłladem Towarzystwa functions. In: Archive for Mathematical Logic 13
Naukowego Warszawskiego (1933) (1970), S. 136–153
[193] Tarski, A: Der Wahrheitsbegriff in den formalisierten [206] Wang, L.: The date of the Sunzi suanjing and the
Sprachen. In: Studia Philosophica (1933), Nr. 1, S. Chinese remainder theorem. In: Proceedings of the
261–405 tenth international conference on history of science,
428 Literaturverzeichnis

1962, S. 489–492 [220] Yong, L. L.; Se, A. T.: Fleeting Footsteps. Tracing the
[207] Weber, H.: Leopold Kronecker. In: Jahresbericht der Conception of Arithmetic and Algebra in Ancient
Deutschen Mathematiker-Vereinigung 2 (1893), S. 19 China. Singapore: World Scientific Publishing, 2004
[208] Weibel, P.: Der wichtigste Beitrag seit Aristoteles. [221] Yourgrau, P.: Gödel, Einstein und die Folgen:
Gespräch mit Karl Popper. In: Wissenschaft Aktuell 1 Vermächtnis einer ungewöhnlichen Freundschaft.
(1980), September. – In [49] München: C. H. Beck, 2005
[209] Weisstein, E. W.: Goldbach Conjecture. From [222] Zermelo, E.: Beweis, dass jede Menge wohlgeordnet
MathWorld – A Wolfram Web Ressource. werden kann. In: Mathematische Annalen 59 (1904),
http://mathworld.wolfram.com/ S. 514–516
GoldbachConjecture.html [223] Zermelo, E.: Untersuchungen über die Grundlagen der
[210] Weisstein, E. W.: Prime Diophantine Equations. Mengenlehre I. In: Mathematische Annalen 65 (1908),
From MathWorld – A Wolfram Web Ressource. S. 261–281
http://mathworld.wolfram.com/ [224] Zermelo, E.: über Grenzzahlen und Mengenbereiche.
PrimeDiophantineEquations.html In: Fundamenta Mathematicae 16 (1930), S. 29–47
[211] Weisstein, E. W.: Twin Prime Conjecture. From [225] Zermelo, E.: über Stufen der Quantifikation und die
MathWorld – A Wolfram Web Ressource. Logik des Unendlichen. In: Jahresbericht der
http://mathworld.wolfram.com/ Deutschen Mathematiker-Vereinigung 41 (1932), S.
TwinPrimeConjecture.html 85–88
[212] Whitehead, A. N.; Russell, B.: Principia
Mathematica. Volume I. London: Merchant Books,
1910
[213] Wiener, N.: A Simplification of the Logic of
Relations. In: Proceedings of the Cambridge
Philosophical Society 17 (1914), S. 387–390
[214] Wiener, N.: A Simplification of the Logic of
Relations. In: Heijenoort, J. van (Hrsg.): From Frege
to Gödel. Cambridge, MA: Harvard University Press,
1977, S. 224–227
[215] Wikipedia: Ordinal number. Public domain image.
http://en.wikipedia.org/wiki/
Ordinal_number
[216] Wiles, A.: Modular Elliptic Curves and Fermat’s last
theorem. In: Annals of Mathematics 141 (1995), S.
443–551
[217] Wolf, R. S.: The Carus Mathematical Mongraphs.
Bd. 30: A Tour through Mathematical Logic.
Washington, DC: Mathematical Association of
America, 2005
[218] Wolfram, S.: A New Kind of Science. Champaign, IL:
Wolfram Media, Inc., 2002
[219] Wußing, H.: 6000 Jahre Mathematik: Eine
kulturgeschichtliche Zeitreise. Bd. Band 2: Von Euler
bis zur Gegenwart. Berlin, Heidelberg, New York:
Springer-Verlag, 2008
Bildnachweis

Seite 1 Gottfried Wilhelm Leibniz


commons.wikimedia.org/wiki/File:Gottfried_Wilhelm_Leibniz_c1700.jpg PD
Seite 4 Goldbach’sche Vermutung
commons.wikimedia.org/wiki/File:Goldbach-1000000.png CC
Seite 5 Leonhard Euler
commons.wikimedia.org/wiki/File:File:Leonhard_Euler.jpg PD
Seite 6 Pierre de Fermat
commons.wikimedia.org/wiki/File:Pierre_de_Fermat.jpg PD
Seite 7 Arithmetica
commons.wikimedia.org/wiki/File:Diophantus-cover.jpg PD
Seite 11 Joseph Liouville
commons.wikimedia.org/wiki/File:Joseph_liouville.jpeg PD
Seite 14 Georg Cantor
commons.wikimedia.org/wiki/File:Georg_Cantor2.jpg PD
Seite 26 Carl Friedrich Gauß
commons.wikimedia.org/wiki/File:Carl_Friedrich_Gauss.jpg PD
Seite 27 Gottlob Frege
commons.wikimedia.org/wiki/File:Young_frege.jpg PD
Seite 32 David Hilbert
commons.wikimedia.org/wiki/File:Hilbert.jpg PD
Seite 35 Giuseppe Peano
commons.wikimedia.org/wiki/File:Giuseppe_Peano.jpg PD
Seite 37 Bertrand Russell
commons.wikimedia.org/wiki/File:Russell1907-2.jpg PD
Seite 42 Ernst Zermelo
commons.wikimedia.org/wiki/File:Ernst_Zermelo.jpeg CC
Seite 46 Kurt Gödel
commons.wikimedia.org/wiki/File:1925_kurt_gödel.png PD
Seite 46 Unterschrift von Kurt Gödel
commons.wikimedia.org/wiki/File:Kurt_Gödel_signature.gif PD
Seite 49 John von Neumann
commons.wikimedia.org/wiki/File:JohnvonNeumann-LosAlamos.gif PD
Seite 52 ENIAC
commons.wikimedia.org/wiki/File:Classic_shot_of_the_ENIAC.jpg PD
Seite 53 Bertrand Russell
commons.wikimedia.org/wiki/File:FourAnalyticPhilosophers.JPG PD
Seite 56 Alan Turing
commons.wikimedia.org/wiki/File:Turing_statue_Surrey.jpg PD
Seite 60 Emil Leon Post
commons.wikimedia.org/wiki/File:Emil_Leon_Post.jpg PD
Seite 61 Yuri Matijasevič
commons.wikimedia.org/wiki/File:Yuri-Matiyasevich-1969.png CC
Seite 83 Wilhelm Ackermann
commons.wikimedia.org/wiki/File:Ackermann_Wilhelm.jpg PD
Seite 122 Leon Henkin
commons.wikimedia.org/wiki/File:Leon.Henkin.jpg CC

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6
430 Bildnachweis

Seite 129 Peter Gustav Lejeune Dirichlet


commons.wikimedia.org/wiki/File:Peter_Gustav_Lejeune_Dirichlet.jpg PD
Seite 140 Euklid von Alexandria
commons.wikimedia.org/wiki/File:Euklid-von-Alexandria_1.jpg PD
Seite 162 Georg Cantor
commons.wikimedia.org/wiki/File:Georgcantor01.png PD
Seite 211 Rózsa Péter
commons.wikimedia.org/wiki/File:RozsaPeter.jpg PD
Seite 235 Alfred Tarski
commons.wikimedia.org/wiki/File:AlfredTarski1968.jpeg GNU
Seite 319 Joseph-Louis Lagrange
commons.wikimedia.org/wiki/File:Joseph-Louis_Lagrange.jpeg PD
Seite 330 Wacław Sierpiński
de.wikipedia.org/w/index.php?title=Datei:Sierpinski.jpg PD
Seite 342 Dreidimensionale Mandelbrot-Menge
commons.wikimedia.org/wiki/File:Power_8_mandelbulb_fractal_overview.jpg CC
Seite 344 Andrej Kolmogorov
commons.wikimedia.org/wiki/File:Kolmogorov-m.jpg PD
Seite 398 Dana Scott
commons.wikimedia.org/wiki/File:Scott_Dana_small.jpg CC
Seite 400 George Boole
commons.wikimedia.org/wiki/File:PSM_V17_D740_George_Boole.jpg PD

PD Public domain
CC Creative-Commons-Lizenz
GNU GNU-Lizenz

Alle Clipart-Bilder stammen von www.openclipart.org.


Namensverzeichnis

Dinneen, Michael, 358 Henkin, Leon Albert, 122, 123, 289, 376
A Diophantos von Alexandria, 7 Hermes, Hans, 87
Abbe, Ernst, 28 Dirichlet, Peter Gustav, 129 Hermite, Charles, 11
Ackermann, Wilhelm F., 46, 83, 150, Dummett, Michael, 45 Heyting, Arend, 45, 47
212 Hilbert, David, 32, 47, 83, 212, 247, 317
Hofstadter, Douglas R., 202, 291
Aristoteles, 26, 51 E Huntington, Edward Vermilye, 400
Eckert, J. Presper, 52
B Einstein, Albert, 48
Euklid von Alexandria, 140, 257, 416
J
Bennett, Charles, 350, 357
Bernays, Paul, 102, 131, 150, 179, 247 Euler, Leonhard, 4, 5, 11 Jones, James P., 61, 288, 317, 318
Bernstein, Felix, 23, 397
Boole, George, 28, 400 F K
Brouwer, Luitzen E. J., 45, 47
Burali-Forti, Cesare, 38, 180 Fermat, Pierre de, 5, 6, 9 Kant, Immanuel, 367
Burgess, John P., 282 Fourier, Jean Baptiste, 13 Kelley, John L., 150
Fraenkel, Abraham A. H., 42, 157 Kirby, Laurie, 53, 260, 266
Frege, Gottlob, 27, 28, 32, 36 Kleene, Stephen C., 45, 211, 228, 289
C Furtwängler, Philipp, 48 Knuth, Donald E., 265
Calude, Cristian, 358 Kolmogorov, Andrej, 341, 344
Cantor, Georg, 14, 18, 23, 38, 162, 176, G Kreisel, Georg, 264
179, 186, 187, 189, 194 Kripke, Saul Aaron, 149
Carnap, Rudolf, 47, 202 Galilei, Galileo, 26 Kronecker, Leopold, 13, 14, 32
Cauchy, Augustin L., 13 Gardner, Martin, 350, 357 Kučera, Antonín, 358
Chaitin, Gregory, 341, 344, 362 Gauß, J. Carl Friedrich, 13, 26, 387 Kummer, Ernst Eduard, 14
Church, Alonzo, 36, 56, 59, 228, 289, Gentzen, Gerhard, 258 Kuratowski, Kazimierz, 167
291 Gödel, Kurt, 46, 48, 61, 65, 150, 179,
Cohen, Paul J., 63, 398 201, 215, 223, 226, 282, 368,
370, 371 L
Goldbach, Christian, 4
D Goodstein, Reuben L., 53, 260
Lagrange, Joseph-Louis, 139, 319
Leibniz, Gottfried Wilhelm, 1
Gottlob Frege, 27
Dauben, Joseph, 18 von Lindemann, C. L. Ferdinand, 12
Davies, Donald W., 283, 284 Liouville, Joseph, 11, 19
Davis, Martin, 59, 60, 317, 318 H Löb, Martin Hugo, 248, 265
Dedekind, J. W. Richard, 13, 26, 142, Löwenheim, Leopold, 368–370, 377
368 Harrington, Leo Anthony, 53 Łukasiewicz, Jan, 102, 237

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6
432 Namensverzeichnis

M R T
Malcev, Anatolij I., 376, 378 Rabin, Michael Oser, 289, 398 Tarski, Alfred, 370, 378
Matijasevič, Yuri W., 60, 288, 317, 318 Radó, Tibor, 266 Tennenbaum, Stanley, 383
Mauchly, John W., 52 Ramsey, Frank Plumpton, 53 Thue, Axel, 291
Mendelsons, Elliott, 218 Rasiowa, Helena, 405 Turing, Alan M., 36, 54, 56, 58, 272,
Minsky, Marvin L., 285 Rice, Henry G., 300 282, 289
Morse, Anthony P., 150 Riemann, G. F. Bernhard, 13
Mostowski, Andrzej, 410 Robinson, Abraham, 372
Robinson, Julia, 60, 317, 318 V
Rosser, J. Barkley, 205, 227, 228, 289
N Russell, Bertrand A. W., 1, 36, 37, 38, Vopěnka, Petr, 65, 398
Neumann, John von, 46–48, 62, 150, 52, 53, 149, 247, 289
174, 341 Russell, Lord John, 37
Nylander, Paul, 342 W
S Wainer, Stanley Scott, 265
P Weierstraß, Karl T. W., 12–14
Schlick, Moritz, 48 White, Daniel, 342
Paris, Jeffrey B., 53, 260, 266 Schröder, Ernst, 23 Whitehead, Alfred N., 37, 39, 149, 247,
Peano, Giuseppe, 34, 142 Scott, Dana S., 65, 289, 398 289
Péter, Rózsa, 211 Shu, Chi-Kou, 358 Wiener, Norbert, 197
Platek, Richard A., 149 Sierpiński, Wacław, 237, 329 Wiles, Andrew, 5
Poizat, Bruno, 378 Sikorski, Roman, 405 Wolfram, Stephen, 278, 285
Popper, Karl, 51 Skolem, Thoralf, 42, 368–371, 377, 378,
Post, Emil Leon, 60, 283, 284 391, 396
Presburger, Mojżesz, 255
Putnam, Hilary W., 60, 317, 318
Slaman, Theodore A., 358 Z
Smith, Alex, 285
Smith, Peter, 218 Zermelo, Ernst F. F., 42, 157, 165, 174,
Q Smullyan, Raymond M., 267, 289 202
Solomonoff, Ray, 341, 344 Zi, Sun, 216
Quine, Willard Van Orman, 149 Solovay, Robert M., 65, 398 Zorn, Max August, 164
Lebensdaten

Wilhelm Ackermann
1896 1962
Paul Bernays
1888 1977
George Boole
1815 1864
Luitzen Brouwer
1881 1966
Cesare Burali-Forti
1861 1931
Georg Cantor
1845 1918
Alonzo Church
1903 1995
Paul Cohen
1934 2007
Richard Dedekind
1831 1916
Abraham Fraenkel
1891 1965
Gottlob Frege
1848 1925
Gerhard Gentzen
1909 1945
Kurt Gödel
1906 1978
Reuben Goodstein
1912 1985
Leon Henkin
1921 2006
David Hilbert
1862 1943
Stephen Kleene
1909 1994
Andrej Kolmogorov
1903 1987
Leopold Kronecker
1823 1891
Joseph Liouville
1809 1882
Martin Löb
1921 2006
Leopold Löwenheim
1878 1957
Anatoly Malcev
1909 1967
John von Neumann
1903 1957
Giuseppe Peano
1858 1932
Emil Post
1897 1954
Rosza Peter
1905 1977
Mojzesz Presburger
1904 1943
Julia Robinson
1919 1985
Barkley Rosser
1907 1989
Bertrand Russell
1872 1970
Thoralf Skolem
1887 1963
Ray Solomonoff
1926 2009
Alfred Tarski
1901 1983
Alan Turing
1912 1954
Alfred Whitehead
1861 1947
Ernst Zermelo
1871 1953

1800 1820 1840 1860 1880 1900 1920 1940 1960 1980 2000 2020

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6
Sachwortverzeichnis

der Syntax, 206 Axiome


A Assoziativgesetz, 92, 419 von Huntington, 400
Abschwächungsregel, 93 Asymmetrische Relation, 161, 163 von Peano, 34, 142
Absorptionsgesetz, 92, 419 Atomare von Zermelo-Fraenkel, 152
Abzählbare Menge, 18 Aussage, 87 Axiomenschema, 80
Ackermann-Funktion, 212, 265 Formel, 87
diagonalisierte, 265 Aufzählbarkeit, 294
Ackermann-Péter-Funktion, 212 Aussagenlogik, 87 B
Äquivalenz Kalkül, 93
-operator, 87 Semantik, 87 b-adische Darstellung, 260
aussagenlogische, 92 Syntax, 87 expandierte, 260
prädikatenlogische, 109 Aussonderungsaxiom, 43, 155 Bandalphabet, 272
Aktuale Unendlichkeit, 25 Auswahlaxiom, 43, 44, 160 Barbier-Paradoxon, 38, 205
Akzeptor, 334 Automat Base bumping, 261
Algebraische Zahl, 11 linearer, 278 Basis, 260, 322
Algorithmische zellulärer, 278, 335 Begriffsschrift, 27
Information, 344 Axiom, 71 Berechenbarkeit, 6, 53
Informationstheorie, 341 der Aussonderung, 43, 155 Grenzen der, 296
Komplexität, 342 der Auswahl, 43, 44, 160 Berechnungsmodelle, 272
Algorithmus, 36, 60, 271 der Beschränktheit, 158 Berry-Paradoxon, 240
Allgemeine Kontinuumshypothese, 25 der Bestimmtheit, 43, 152 Beschränktheitsaxiom, 158
Allgemeines Halteproblem, 296 der Elementarmenge, 43 Beschreibungskomplexität, 344
Allgemeingültigkeit, 76, 256 der Ersetzung, 42, 43, 157 Bestimmtheitsaxiom, 43, 152
aussagenlogische, 90 der Extensionalität, 152 β -Funktion
prädikatenlogische, 109 der Fundierung, 42, 43, 158 Gödel’sche, 215, 314
Allquantor, 29 der Konstruktibilität, 62 Beweis, 74
bedingter, 139, 151 der leeren Menge, 42, 152 -ebene, 168
Alphabet, 72 der Paarung, 43, 153 -kalkül
Antinomie der Potenzmenge, 43, 157 arithmetischer, 141
Russell’sche, 38 der Regularität, 158 mengentheoretischer, 152
Antisymmetrische Relation, 163 der Separation, 37, 155 Reduktions-, 298
Antivalenzoperator, 87 der Vereinigung, 43, 154 Beweisbarkeit, 1
Arithmetica, 6, 7 des Unendlichen, 43, 66, 155 Beweisbarkeitsrelation, 75
Arithmetices principia, 34, 142 logisches, 135 Biber-Funktion, 266
Arithmetische Formel, 136 of choice, 43, 44, 160 Binäre Codierung, 275
Arithmetischer Term, 136 Theorie-, 135 Binomialkoeffizient, 329
Arithmetisches Mittel, 10 Axiomatische Mengenlehre, 42, 149 Binomischer Lehrsatz, 331
Arithmetisierung Axiomatisierbarkeit, 368 Boolean valued model, 398
endliche, 150 Boolesche

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018


D. W. Hoffmann, Grenzen der Mathematik, https://doi.org/10.1007/978-3-662-56617-6
436 Sachwortverzeichnis

Algebra, 398, 400 Diagonalisierungslemma, 231 Euklidische Geometrie, 33, 367


vollständige, 402 Dichte Menge, 404 Eulersche Konstante, 11
Funktion, 89 Diophantisch repräsentierbar, 320 Existenzquantor, 29
Menge, 405 Diophantische Gleichung, 8, 317 bedingter, 139, 151
-s Modell, 65, 398, 408 exponentielle, 9, 317 expressable (Eigenschaft), 218
Bottom-up-Verfahren, 84 Disjunktion, 87 Extensionalitätsaxiom, 152
Bounded quantifier theorem, 318 Distributivgesetz, 92, 93, 400 Extensionalitätsprinzip, 152, 213
Burali-Forti-Paradoxon, 38, 180 DNA computing, 292
Busy beaver function, 266 Dominanzaussage, 265
Doppelnegationsgesetz, 92, 419 F
Dreieck
C Pascal’sches, 329 Filter, 390, 404, 411
Sierpinski-, 329 generischer, 404, 411
Calculus ratiocinator, 2
M-generischer, 405
Cantor’sche
maximaler, 390
Normalform, 186
Paarungsfunktion, 16, 393 E Ultra-, 404
Finite Mittel, 45
capturable (Eigenschaft), 218
Einbettung First order logic, 118
Chaitin’sche
von PA in ZF, 174 First order theory, 135
Konstante, 180, 350, 355
Eingabewort, 275 Fixpunkteigenschaft, 186
Chaitin’scher
Element Fixpunktsatz, 231
Unvollständigkeitssatz, 341, 360
inverses, 92, 400 Fluchtzählgleichung, 377
Characteristica universalis, 2
neutrales, 92, 400 Folge
Charakteristische Funktion, 212, 292
Elementarmengenaxiom, 43 Goodstein-, 260
partielle, 292
Elementaroperatoren, 92 Folgerung
Chinesischer Restsatz, 217
Eliminationsgesetz, 92, 419 logische, 91
Church’sche These, 289, 291
Endlichkeit Forcing, 64, 398, 409
Codierung
als Formel der PL2, 120 Forcing-Relation, 413
binäre, 275
Endlichkeitssatz, siehe Kompaktheits- Formales System, 71
unäre, 275
satz Formel
von Registermaschinen, 322
Engerer Funktionenkalkül, 46 arithmetische, 136
Computing machine, 56
Entscheidbarkeit, 45, 292 atomare, 87
Countable chain condition, 413
Entscheidungsproblem aussagenlogische, 87
CSB-Theorem, 16, 23
semantisches, 86 bereinigte, 106
syntaktisches, 83 geschlossene, 106
D Entscheidungsverfahren, 59, 83, 84, 309 Henkin’sche, 251
Bottom-up-, 84 offene, 106
Datenflussmatrix, 322 Top-down-, 85 PA-, 136
De Morgan’sche Regel, 92, 419 Enumerator, 393 prädikatenlogische, 105
Deduktionstheorem Epsilon-Delta-Kriterium, 103 -schema, 72
der Aussagenlogik, 95 Erdős-Straus-Vermutung, 69 ZF-, 151
der Prädikatenlogik, 111 Erfüllbarkeit Freie Variable, 103
Denkbereich, 377 aussagenlogische, 90 Freier Ultrafilter, 390
Derivability conditions, 248 eines Kalküls, 371 Fundierungsaxiom, 42, 43, 158
Description number, 282 prädikatenlogische, 109 Funktion, 104, 168
Diagonalfunktion Ersetzungsaxiom, 42, 43, 157 syntaktisch repräsentierbare, 219
Ackermann’sche, 265 Erster Unvollständigkeitssatz, 48, 202, Ackermann-, 212, 265
Diagonalisierung, 14, 20, 220, 265 316, 362 diagonalisierte, 265
Sachwortverzeichnis 437

Ackermann-Péter-, 212 Unvollständigkeitssatz, 201 Implikation, 87


arithmetisch repräsentierbare, 213 erster, 48, 202, 316, 362 Individuenbereich, 103, 106
Biber-, 266 zweiter, 49, 244 Induktion
boolesche, 89 Vollständigkeitssatz, 113, 368, 373 transfinite, 191
charakteristische, 212, 292 erweiterter, 372 vollständige, 141, 191, 192
partielle, 292 Gödel-Rosser-Theorem, 230 Induktionsaxiom, 141
Goodstein-, 264 Gödelisierung, 207 Infimum, 402
injektive, 119, 198 Gödelnummer Informationsgehalt, 341, 344
μ-rekursive, 211, 290 einer Formel, 207 Informationstheorie
partielle, 168 einer Turing-Maschine, 282 algorithmische, 341
primitiv-rekursive, 59, 211, 290 Goldbach’sche Vermutung, 3, 68, 196, Initialzustand
semantisch repräsentierbare, 214 254 von Turing-Maschinen, 273
surjektive, 119, 198 Goodstein Injektive Funktion, 119, 198
syntaktisch repräsentierbare, 220 -Folge, 260 Instanz, 73
totale, 168, 198, 264 -Funktion, 264 Instanziierung, 110
Turing-berechenbare, 275 Satz von, 53, 260 Instanziierungsregel, 38
Wahrheits-, 407 Goto-Programm, 286 Instruktionsmenge, 286
Funktionenkalkül Grammatik, 291 von Registermaschinen, 286
engerer, 46 Grenzzahl, 182 von Turing-Maschinen, 272
Funktionsvariable, 118 Grundlagenkrise, 36 Interpretation
Fuzzy-Menge, 405 Grundmenge, 106 aussagenlogische, 88
Grundsubstitution, 110 Henkin-, 122
prädikatenlogische, 106
G Intuitionismus, 45
H Inverse Elemente, 92, 400
Gauß’sche Zahlenebene, 387 Irreflexive
Halbordnung, 161
Gebundene Variable, 103 Ordnung, 163
Halteproblem, 59, 296
Generalisierungsregel, 110 Relation, 161
allgemeines, 296
Generischer Filter, 404, 411
auf leerem Band, 298
Geometrie, 13, 257
Haltesequenz, 350
elliptische, 257
Haltewahrscheinlichkeit, 341, 352, 355 K
euklidische, 33, 367
Henkin
hyperbolische, 257 Kalkül, 71
-Formel, 251
nichteuklidische, 257 aussagenlogischer, 93
-Interpretation, 122
geordnetes Paar, 166 korrekter, 76
-Semantik, 123
Geschlossene Formel, 106 λ -, 290
Heptation, 260
Gesetz negationsvollständiger, 76
Hexation, 260
Absorptions-, 92, 419 prädikatenlogischer, 110
Higher-order logic, 118
Assoziativ-, 92, 419 vollständiger, 76
Hilbert-Bernays-Löb-Kriterien, 247
Distributiv-, 92, 400 widerspruchsfreier, 76
Hilbert-Programm, 44
Doppelnegations-, 92, 419 Kardinalität, 14, 15, 195
Hilberts zehntes Problem, 317
Eliminations-, 92, 419 Kardinalzahl, 22, 194
Höchstens abzählbare Menge, 18
Idempotenz-, 92, 419 Kartesisches Produkt, 198
Huntington’sche Axiome, 400
Kommutativ-, 92, 400 kategorisch, 368
Gleichung Kettenschluss, 97
diophantische, 8, 317 I Klasse, 150
exponentiell diophantische, 9, 317 Klassenzeichen, 221
Gödel’scher Idempotenzgesetz, 92, 419 Kleene-Rosser-Paradoxon, 228
438 Sachwortverzeichnis

Kolmogorov-Komplexität, 344 höherer Stufe, 118 -existenzsatz, 371


Kommutativgesetz, 92, 400 Prädikaten-, 103 -konstruktion, 367
Kompaktheitssatz, 121, 369, 373 symbolische, 27 Nichtstandard-, 380
Komplexität, 341 Logische Folgerung, 91 Quotienten-, 410
algorithmische, 342 Logisches Axiom, 135 -relation, 75, 137
Kolmogorov-, 344 Logizismus, 28, 30 aussagenlogische, 89
Komplexitätstheorie, 271 LST-Theorem, 378 prädikatenlogische, 107
Komprehensions -theorem, 410, 411
-axiom -theorie, 367
allgemeines, 37 M Modus ponens, 80, 93
-schema, 123 Morse-Kelley-Mengenlehre, 150
Konfiguration Mächtigkeit, 15, 195 Mostowski-Kollaps, 410
von Turing-Maschinen, 274 Mannigfaltigkeit, 14 μ-Operator, 290
Konjunktion, 29, 87 Maskierungsrelation, 321 μ-rekursive Funktion, 211, 290
Konstante Maximaler Filter, 390
Chaitin’sche, 180, 350, 355 Mehrband-Turing-Maschine, 276
eulersche, 11 Mehrspur-Turing-Maschine, 276 N
Konstruktibilitätsaxiom, 62 Menge, 149
Natürliche Zahl, 141
Konstruktible Menge, 62 abzählbare, 18
als Menge, 174
Kontinuum, 7, 10 boolesche, 405
Natural independence phenomenon, 260
Kontinuumshypothese, 25, 411, 420 Fuzzy-, 405
NBG-Mengenlehre, 150
allgemeine, 25 höchstens abzählbare, 18
Negation, 87
Kontraposition, 93 konstruktible, 62
Neutrale Elemente, 92, 400
Kontrollflussmatrix, 322 Null-, 43, 152
New Foundations, 149
Kopfzelle, 280 transitive, 176
Nichtstandardmodell, 380
Kripke-Platek-Mengenlehre, 149 überabzählbare, 18
der Peano-Arithmetik, 380
Kriterien Mengenfilter, 390
abzählbares, 381
Hilbert-Bernays-Löb-, 247 Mengenlehre
überabzählbares, 384
axiomatische, 42, 149
von ZFC, 410
Kripke-Platek-, 149
Normalform
L Morse-Kelley-, 150
Cantor’sche, 186
Neumann-Bernays-Gödel-, 150
Nullmenge, 43, 152
λ -Kalkül, 290 New-Foundations-, 149
Lemma Zermelo-, 42
Diagonalisierungs-, 231 Zermelo-Fraenkel-, 42, 151 O
von Rasiowa und Sikorski, 405 Meta
von Zorn, 164 -Ebene, 72 Objektebene, 72
Limes-Ordinalzahl, 182 -mathematik, 3 Octation, 260
Lineare Ordnung, 161 -wissenschaft ODER-Operator, 87
Linearer Automat, 278 von Tarski, 236 Offene Formel, 106
Liouville’sche Zahl, 11 Minimalitätsprinzip, 191 Operatorensystem
Lisp, 289 MIU-System, 291 vollständiges, 129
Löwenheim-Skolem-Theorem, 369, Modaloperator, 248 Ordinalzahl, 176, 178, 262
377, 391 Modell, 64, 74, 89, 107 -nachfolger, 181
Logical axiom, 135 -analyse, 367 Limes-, 182
Logik boolesches, 65, 398, 408 transfinite, 182
Aussagen-, 87 -ebene, 367 Ordnung, 161
erster Stufe, 118 eines Kalküls, 371 Halb-, 161
Sachwortverzeichnis 439

irreflexive, 163 Syntax, 104 Rekursiv aufzählbar, 356


lineare, 161 zweiter Stufe, 118 Relation, 168
reflexive, 163 Präfixfreiheit, 351 antisymmetrische, 163
totale, 161 Presburger-Arithmetik, 255 arithmetisch repräsentierbare, 213
Wohl-, 161, 188 Primitiv-rekursive asymmetrische, 161, 163
Ordnungsisomorphie, 188 Funktion, 59, 211, 290 Beweisbarkeits-, 75
Ordnungstyp, 188, 189 Relation, 213 diophantisch repräsentierbare, 320
Primitive Rekursion, 211 Forcing-, 413
Primzahlzwillinge, 4, 196, 364 irreflexive, 161
Principia Mathematica, 39 linkskomparative, 132
P Produkt Maskierungs-, 321
Paar kartesisches, 198 Modell-, 75, 137
geordnetes, 166 von Ordinalzahlen, 184 primitiv rekursive, 213
Paarungsaxiom, 43, 153 Produktion rechtseindeutige, 168
Paarungsfunktion eines Termersetzungssystems, 291 reflexive, 132
Cantor’sche, 16, 393 Programm, 341 semantisch repräsentierbare, 214
Paradoxon Goto-, 286 symmetrische, 132
Barbier-, 38, 205 While-, 290 syntaktisch repräsentierbare, 218
Berry-, 240 Proper axiom, 135 transitive, 161
Burali-Forti-, 38, 180 Pythagoreisches Tripel, 8 Repräsentierbare Funktion
Kleene-Rosser-, 228 arithmetisch, 213
Skolem-, 391 semantisch, 214
Parallelenpostulat, 257 Q Repräsentierbare Relation
Partielle Funktion, 168 arithmetisch, 213
Quadratur des Kreises, 12
Pascal’sches Dreieck, 329 diophantisch, 320
Quantenrechner, 292
Peano-Arithmetik, 136 semantisch, 214
Quantor, 29, 103
- Semantik, 137 syntaktisch, 218
bedingter, 139, 151
- Syntax, 136 representable (Eigenschaft), 218
Quotientenmodell, 410
Peano-Axiome, 34, 142 Restsatz
Pentation, 260 Chinesischer, 217
Pfeilnotation, 265 R Rice
Pigeonhole principle, 129 Satz von, 299, 337
Polare Koordinaten, 387 Ramsey-Theorem, 53 Riemann’sche Hypothese, 354
Polnische Notation, 102 Rationale Zahl, 9 Ringinklusion, 158
Potenzielle Unendlichkeit, 25 Reduktionsbeweis, 298 Robinson-Arithmetik, 256
Potenzmengenalgebra, 400 Reelle Zahl, 10 Rossers Trick, 227
Potenzmengenaxiom, 43, 157 Reflexive Russell’sche Antinomie, 38
Prädikat, 104 Ordnung, 163
-variable, 118 Relation, 132
Wahrheits-, 236 Regel S
Prädikatenlogik, 103 von De Morgan, 92, 419
dritter Stufe, 119 Register Satz
erster Stufe -gleichungen, 325 des Pythagoras, 8
mit Gleichheit, 113 -maschine, 61, 286, 302, 318 Vier-Quadrate-, 139, 319
höherer Stufe, 118 -menge, 286 vom ausgeschlossenen Dritten, 45
Meta-Resultate, 368 Regularitätsaxiom, 158 von Cantor, 22
mit Gleichheit, 114 Rekursion von Goodstein, 53, 260
Semantik, 104 primitive, 211 von Löwenheim-Skolem, 369,
440 Sachwortverzeichnis

377, 391 Erweiterungen, 276


von Rice, 299, 337 T indeterministische, 274
Schaltalgebra, 401 Taniyama-Shimura-Vermutung, 5 Mehrband-, 276
Schlussregel, 71 Taubenschlagprinzip, 129 Mehrspur-, 276
Second order theory, 135 Tautologie universelle, 281
Semantik, 74 aussagenlogische, 90 zelluläre, 278
der Aussagenlogik, 87 prädikatenlogische, 109 Turing-Test, 58
der Peano-Arithmetik, 137 Teilformel, 87 Typentheorie, 149
der Prädikatenlogik, 104 Term
Henkin-, 123 arithmetischer, 136
Standard-, 119 prädikatenlogischer, 105
U
Semi-Thue-System, 291 Termersetzungssystem, 291
Separationsaxiom, 37, 155 Überabzählbare Menge, 18
Tertium non datur, 45 Ultrafilter, 390, 404
Sierpinski-Dreieck, 329 Tetration, 260
Skolem freier, 390
Theorem, 73, 74 Unäre Codierung, 275
-Gödel-Theorem, 371, 372 CSB-, 16, 23
-Normalform, 370, 391 UND-Operator, 87
Gödel-Rosser-, 230 Unendlichkeit, 13
-Paradoxon, 391 Löwenheim-Skolem-, 369, 377,
Sprache, 72 aktuale, 25
391 potenzielle, 25
Standard LST-, 378
-beschreibung Unendlichkeitsaxiom, 43, 66, 155
Ramsey-, 53 Unerfüllbarkeit
von Turing-Maschinen, 281 Skolem-Gödel-, 371, 372
-interpretation, 75, 138 aussagenlogische, 90
Theorie, 135 prädikatenlogische, 109
-semantik axiomatisierbare, 135
der PL2, 119 Ungebundene Variable, 103
erster Stufe, 122 Universelle Turing-Maschine, 281
-modell, 380 Theorieaxiom, 135
Standardrepräsentation Universum, 106
These Untermodell, 378
einer Menge, 406 von Church, 289, 291
Startzustand Unvollständigkeitssatz, 201
Top-down-Verfahren, 85 Chaitin’scher, 341, 360
von Turing-Maschinen, 273 Totale
Stetigkeit, 103 Gödel’scher
Funktion, 168, 198, 264 erster, 48, 202, 316, 362
Substitution Ordnung, 161
kollisionsfreie, 110 zweiter, 49, 244
Transduktor, 287, 334 Missverständnisse, 254
Substitutionsaxiom Transfinite
der Gleichheit, 114 Urelement, 150
Induktion, 191
Subtraktion Ordinalzahl, 182
saturierte, 286 Transitive V
Supremum, 402 Menge, 176
Surjektive Funktion, 119, 198 Relation, 161 Variable, 87, 103, 151
Symbolische Logik, 27 Transzendente Zahl, 11 freie, 103
Syntax, 72 Trichotomieeigenschaft, 179, 385 Funktions-, 118
Arithmetisierung, 206 Tripel gebundene, 103
der Aussagenlogik, 87 pythagoreisches, 8 PL0- versus PL1-, 104
der Peano-Arithmetik, 136 Trägermenge, 400 Prädikat-, 118
der Prädikatenlogik, 104 Turing-Bombe, 58 ungebundene, 103
der ZF-Mengenlehre, 151 Turing-Maschine, 54, 272 Variablenbelegung, 88
einseitig beschränkte, 276 Venn-Diagramm, 401
Vereinigungsaxiom, 43, 154
Sachwortverzeichnis 441

Vermutung -tabelle, 89 Liouville’sche, 11


Goldbach’sche, 3, 68, 196, 254 -tafel, 89 natürliche, 141
Primzahlzwillinge, 4, 196, 364 While-Programm, 290 Ordinal-, 176, 178, 262
Taniyama-Shimura-, 5 Widerspruchsbeweis Limes-, 182
von Erdős-Straus, 69 absoluter, 35 transfinite, 182
Vier-Quadrate-Satz, 139, 319 relativer, 35 rationale, 9
Vollständige Induktion, 191 Widerspruchsfreiheit, 44 reelle, 10
Vollständigkeit, 44 Wiener Kreis, 48 transzendente, 11
semantische, 76 wohlgeformt, 72 Zahlenebene
syntaktische, 76 Wohlordnung, 161, 188 Gauß’sche, 387
Vollständigkeitssatz, 113, 368, 373 Zahlklasse, 187
erweiterter, 372 Zehntes Hilbert’sches Problem, 317
Vollständige Induktion, 141, 192 X Zelle, 278
Vollständiges Operatorensystem, 129 Zelluläre Turing-Maschine, 278
XOR-Operator, 87
Von-Neumann Zellulärer Automat, 278, 335
-Architektur, 52 Zermelo’sche Zahlenreihe, 174
-Mengenlehre, 150 Zermelo-Fraenkel
Z -Axiome, 152
-Mengenlehre, 42, 151
W Zahl
with Choice, 44, 149, 160
algebraische, 11
Wahrheit, 1 als Menge, 174 Zermelo-Mengenlehre, 42
Wahrheits eulersche, 11 ZF-Mengenlehre, 42, 151
-funktion, 407 Grenz-, 182 Zorn’sches Lemma, 164
-prädikat, 236 Kardinal-, 22, 194 Zweiter Unvollständigkeitssatz, 49, 244
springer.com

Willkommen zu den
Springer Alerts
Jetzt
• Unser Neuerscheinungs-Service für Sie:
anmelden!
aktuell *** kostenlos *** passgenau *** flexibel

Springer veröffentlicht mehr als 5.500 wissenschaftliche Bücher jährlich in


gedruckter Form. Mehr als 2.200 englischsprachige Zeitschriften und mehr
als 120.000 eBooks und Referenzwerke sind auf unserer Online Plattform
SpringerLink verfügbar. Seit seiner Gründung 1842 arbeitet Springer
weltweit mit den hervorragendsten und anerkanntesten Wissenschaftlern
zusammen, eine Partnerschaft, die auf Offenheit und gegenseitigem
Vertrauen beruht.
Die SpringerAlerts sind der beste Weg, um über Neuentwicklungen im
eigenen Fachgebiet auf dem Laufenden zu sein. Sie sind der/die Erste,
der/die über neu erschienene Bücher informiert ist oder das Inhalts-
verzeichnis des neuesten Zeitschriftenheftes erhält. Unser Service ist
kostenlos, schnell und vor allem flexibel. Passen Sie die SpringerAlerts
genau an Ihre Interessen und Ihren Bedarf an, um nur diejenigen Informa-
tion zu erhalten, die Sie wirklich benötigen.

Mehr Infos unter: springer.com/alert


A14445 | Image: Tashatuvango/iStock

You might also like