You are on page 1of 279

Wstęp do Analizy Matematycznej

Notatki do wykładów dla studentów kierunku Matematyka Komputerowa

Marian Mrozek
Uniwersytet Jagielloński

7 grudnia 2022
2
Spis treści

I Wprowadzenie 11
1 Wprowadzenie do analizy matematycznej 17
1.1 Rozwój pojęcia liczby . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.1 Liczby naturalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.2 Ułamki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.3 Liczby ujemne, całkowite i wymierne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.4 Liczby niewymierne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.1.5 Liczby rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1.6 Liczby urojone i zespolone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1.7 Liczby w komputerze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2 Ciągi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.2.1 Przybliżanie pierwiastka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.2.2 Ciągi przybliżeń . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.2.3 Granice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2.4 Obliczanie granic ciągu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.5 Liczba π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.1 Pole koła . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.2 Liczba π poprzez szereg. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.1 Koncepcja funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.2 Miejsca zerowe funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.3 Wykres funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.4.4 Geometryczne konstrukcje funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.4.5 Rozwijanie funkcji w szereg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.5 Pola figur i całkowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.5.1 Całka oznaczona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.5.2 Całka nieoznaczona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.6 Styczna do krzywej i granica funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.6.1 Styczna do krzywej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.6.2 Granica funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.6.3 Funkcje ciągłe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.6.4 Obliczanie granic. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.7 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.7.1 Lokalne maksima i minima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.7.2 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3
4 SPIS TREŚCI

1.7.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego . . . . . . . . . . . . . . . . . . . . . . . 40

II Granice 43
2 Liczby rzeczywiste i liczby zespolone 45
2.1 Ciało liczb rzeczywistych. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.1.1 Podzbiory R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.1.2 Geometryczna interpretacja zbioru liczb rzeczywistych . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.1.3 Liczby reprezentowalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.1.4 Zasada indukcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.1.5 Wzory skróconego mnożenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.1.6 Funkcja potęgowa w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.1.7 Nierówność Bernoullego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.1.8 Wartość bezwzględna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.2 Twierdzenie o istnieniu pierwiastka. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2.1 Własność Archimedesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2.2 Gęstość zbioru w zbiorze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.2.3 Pierwiastki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.3 Rozszerzony zbiór liczb rzeczywistych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.3.1 R uzupełniony o −∞ i +∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.3.2 Kresy funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.4 Granice ciągów w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.4.1 Eksperymenty numeryczne z liczbą π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.4.2 Granice pozorne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.4.3 Definicja Cauchy’ego granicy ciągu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.4.4 Granice nieskończone. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.5 Twierdzenia o granicach ciągów w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.5.1 Granica ciągu, a struktura ciała w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.5.2 Granica ciągu, a struktura porządkowa w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2.5.3 Granice kilku ważnych ciągów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.6 Liczba e i rzeczywista funkcja wykładnicza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.6.1 Procent składany . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.6.2 Liczba e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.6.3 Funkcja wykładnicza zmiennej rzeczywistej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.7 Ciało liczb zespolonych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.7.1 Liczby zespolone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.7.2 Ciało C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.7.3 Moduł liczby zespolonej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.7.4 Interpretacja geometryczna liczb zespolonych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.7.5 Zespolona funkcja kwadratowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.7.6 Liczby zespolone o module jeden czyli okrąg jednostkowy. . . . . . . . . . . . . . . . . . . . . . . . . . 83

3 Własności topologiczne przestrzeni metrycznych 85


3.1 Metryki i przestrzenie metryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.1.1 Metryka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.1.2 Granica ciągu w przestrzeni metrycznej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.1.3 Metryka w zbiorze liczb rzeczywistych i zespolonych . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.1.4 Metryka euklidesowa w Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
SPIS TREŚCI 5

3.1.5 Inne przykłady metryk w Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87


3.1.6 Metryka indukowana i podprzestrzenie przestrzeni metrycznej . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.7 Kule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.8 Zbiory i funkcje ograniczone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.1.9 Średnica zbioru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.2 Zbiory otwarte i domknięte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.3 Metryki równoważne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.3.1 Metryka w R̄ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.4 Punkty skupienia zbioru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
3.5 Zbiory spójne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.5.1 Zbiory niespójne i spójne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.5.2 Spójne podzbiory R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.6 Zbiory zwarte w przestrzeniach metrycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.6.1 Zwartość kostek w Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.6.2 Własności zbiorów zwartych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.6.3 Kryterium zwartości w Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.7 Zupełność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3.7.1 Warunek Cauchy’ego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3.7.2 Przestrzenie zupełne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

4 Granica i ciągłość funkcji 105


4.1 Granica funkcji w przestrzeniach metrycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.1.1 Eksperymenty numeryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.1.2 Definicja granicy funkcji w przestrzeniach metrycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.1.3 Jednoznaczność granicy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.1.4 Granice nieskończone i granice w nieskończoności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.1.5 Granica złożenia funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.2 Własności granicy funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.2.1 Suma, różnica, iloczyn i iloraz funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.2.2 Granica sumy, różnicy i iloczynu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
4.2.3 Granica ilorazu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.2.4 Zachowywanie nierówności w granicy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.2.5 Twierdzenie o trzech funkcjach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2.6 Granica funkcji monotonicznej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2.7 Granice w produkcie kartezjańskim . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.3 Granice jednostronne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.4 Punkty graniczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.4.1 Ciągowa charakterystyka granicy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.4.2 Zbiór punktów granicznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.4.3 Ciągowa charakterystyka granicy ciągu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.5 Granica dolna i górna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.5.1 Granica dolna i górna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.5.2 Własności granicy dolnej i górnej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.6 Ciągłość funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.6.1 Definicja ciągłości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.6.2 Kryteria ciągłości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.6.3 Ciągłość złożenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.6.4 Ciągłość operacji arytmetycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.6.5 Twierdzenie o lokalnym zachowywaniu znaku . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6 SPIS TREŚCI

4.6.6 Przykłady funkcji ciągłych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119


4.6.7 (*)Nieciągłości funkcji f : R → R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.6.8 Ciągłość bijekcji monotonicznej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.7 Ciągłość, a zwartość . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.7.1 Obraz zbioru zwartego przez odwzorowanie ciągłe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.7.2 Funkcja ciągła na przedziale zwartym osiąga swoje kresy . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.7.3 Funkcja odwrotna do funkcji ciągłej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.8 Jednostajna ciągłość . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.8.1 Funkcje Lipschitza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
4.9 Ciągłość, a spójność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.9.1 Obraz zbioru spójnego przez odwzorowanie ciągłe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.9.2 Własność Darboux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

5 Szeregi 127
5.1 Pojęcie szeregu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.1.1 Przybliżanie liczby π polami wielokątów wpisanych w koło. . . . . . . . . . . . . . . . . . . . . . . . . 127
5.1.2 Definicja szeregu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.1.3 Szereg harmoniczny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.2 Własności podstawowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.1 Warunek konieczny zbieżności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.2 Bezwzględna zbieżność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.3 Szereg geometryczny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.4 Szereg o wyrazach nieujemnych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.2.5 Kryterium porównawcze. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.3 Kryteria zbieżności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.3.1 Szereg harmoniczny rzędu p. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.3.2 Kryterium Leibniza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.3.3 Kryterium Cauchy’ego i kryterium d’Alemberta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.3.4 Szeregi potęgowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.4 Operacje na szeregach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4.1 Suma i iloczyn szeregów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4.2 Iloczyn Cauchy’ego szeregów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4.3 Zmiana kolejności sumowania. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.4.4 Szeregi w programie Mathematica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

6 Funkcje wykładnicza, logarytmiczna i trygonometryczne 145


6.1 Zespolona funkcja wykładnicza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
6.1.1 Liczba e jako suma szeregu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
6.1.2 Funkcja E. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
6.1.3 Własności funkcji E. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
6.1.4 Definicja zespolonej funkcji wykładniczej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
6.2 Rzeczywista funkcja wykładnicza i logarytmiczna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
6.2.1 Rzeczywista funkcja wykładnicza ex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
6.2.2 Własności rzeczywistej funkcji wykładniczej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
6.2.3 Logarytm naturalny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
6.2.4 Funkcja wykładnicza x 7→ ax i logarytm x 7→ loga x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
6.3 Funkcje trygonometryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
6.3.1 Nawijanie prostej na okrąg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
6.3.2 Funkcje sin i cos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
SPIS TREŚCI 7

6.3.3 Funkcje tangens i cotangens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158


6.4 Liczba π, okresowość, i wzory trygonometryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
6.4.1 Liczba π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
6.4.2 Okresowość . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.4.3 Wzory trygonometryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

III Rachunek różniczkowy i całkowy 163


7 Przestrzenie wektorowe 165
7.1 Definicja przestrzeni wektorowej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
7.1.1 Przestrzeń wektorowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
7.2 Przestrzenie wektorowe z iloczynem skalarnym . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
7.2.1 Iloczyn skalarny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
7.2.2 Nierówność Cauchy-Schwartza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.3 Przestrzenie wektorowe unormowane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.3.1 Norma i przestrzeń wektorowa unormowana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.3.2 Norma euklidesowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
7.3.3 Przestrzenie Hilberta i Banacha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

8 Pochodne i różniczki. 173


8.1 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8.1.1 Definicja pochodnej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8.1.2 Interpretacja fizyczna pochodnej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
8.1.3 Pochodna funkcji stałej i identycznościowej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
8.1.4 Pochodna lewo- i prawostronna. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
8.1.5 Ciągłość funkcji różniczkowalnej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
8.2 Pochodna sumy, różnicy, iloczynu i ilorazu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
8.2.1 Pochodna sumy i różnicy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
8.2.2 Pochodna iloczynu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
8.2.3 Pochodna ilorazu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
8.2.4 Symbole nieoznaczone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
8.2.5 Pochodna zestawienia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
8.3 Pochodna funkcji złożonej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
8.4 Pochodna funkcji wykładniczej i funkcji trygonometrycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
8.4.1 Pochodna funkcji wykładniczej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
8.4.2 Pochodna funkcji trygonometrycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
8.5 Nieciągłości pochodnej i funkcje klasy C 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
8.6 Metoda Newtona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
8.7 Pochodna, a ekstrema lokalne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
8.7.1 Maksima i minima lokalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
8.7.2 Twierdzenie Rolle’a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
8.8 Twierdzenia o wartości średniej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
8.8.1 Uogólnione twierdzenie o wartości średniej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
8.8.2 Twierdzenie Lagrange’a o wartości średniej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
8.8.3 Twierdzenie o przyrostach skończonych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
8.9 Zastosowania twierdzenia o wartości średniej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
8.9.1 Pochodna, a monotoniczność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
8.9.2 Twierdzenie o wartościach pośrednich dla pochodnej . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
8 SPIS TREŚCI

8.10 Reguła de l’Hospitala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193


8.11 Pochodna funkcji odwrotnej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
8.11.1 Wzór na pochodną funkcji odwrotnej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
8.11.2 Pochodna funkcji logarytmicznej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
8.11.3 Pochodna funkcji potęgowej i wykładniczej o dowolnej dodatniej podstawie. . . . . . . . . . . . . . . . 199
8.11.4 Funkcje kołowe (odwrotne do trygonometrycznych) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
8.12 Różniczka funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
8.12.1 Aproksymacja liniowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
8.12.2 Relacja "o małe" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
8.12.3 Płaskość w zerze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
8.12.4 Różniczkowalność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
8.13 Pochodne wyższych rzędów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
8.13.1 n-ta pochodna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
8.13.2 Wielomian Taylora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
8.13.3 n-płaskość w zerze. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.14 Wzory Taylora i szereg Taylora. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.14.1 Wzór Taylora z resztą Peano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.14.2 Wzór Taylora z resztą Lagrange’a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
8.14.3 Punkty przegięcia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
8.14.4 Szereg Taylora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

9 Całka oznaczona 217


9.1 Całka Riemanna funkcji jednej zmiennej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
9.1.1 Pole obszaru. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
9.1.2 Przedziały w R i ich podziały. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
9.1.3 Całkowalność w sensie Riemanna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
9.1.4 Epsilonowe kryterium całkowalności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
9.1.5 Miarowe kryterium całkowalności. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
9.2 Własności całki Riemanna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
9.2.1 Monotoniczność całki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
9.2.2 Przestrzeń wektorowa funkcji całkowalnych w sensie Riemanna. . . . . . . . . . . . . . . . . . . . . . . 224
9.2.3 Całkowalność złożenia i iloczynu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
9.2.4 Addytywność całki względem podziału przedziału . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
9.2.5 Całka Riemanna na podprzedziale. Całka oznaczona . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
9.2.6 Twierdzenie Riemanna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

10 Funkcja pierwotna i całka nieoznaczona 231


10.1 Podstawowe twierdzenie rachunku różniczkowego i całkowego . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
10.1.1 Pochodna całki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
10.1.2 Funkcja pierwotna i całka nieoznaczona. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
10.1.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego . . . . . . . . . . . . . . . . . . . . . . . 233
10.2 Podstawowe własności całki nieoznaczonej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
10.3 Całkowanie przez części . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
10.4 Całkowanie przez podstawienie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
10.5 Twierdzenia o wartości średniej dla całek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
10.6 Całkowanie funkcji wektorowych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
10.7 Zastosowania geometryczne całek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
10.7.1 Długość krzywej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
10.7.2 Objętość i pole powierzchni bocznej bryły obrotowej . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
SPIS TREŚCI 9

11 Ciągi i szeregi funkcyjne 245


11.1 Zbieżność punktowa i jednostajna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
11.1.1 Zbieżność punktowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
11.1.2 Zbieżność jednostajna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
11.1.3 Kryterium Cauchy’ego zbieżności jednostajnej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
11.2 Zbieżność jednostajna, a ciągłość, różniczka i całka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
11.2.1 Granica, a zbieżność jednostajna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
11.2.2 Całkowanie, a zbieżność jednostajna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
11.2.3 Różniczkowanie, a zbieżność jednostajna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
11.2.4 Funkcja ciągła nigdzie nieróżniczkowalna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
11.3 Aproksymacja funkcji ciągłych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
11.4 Szeregi potęgowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
11.4.1 Twierdzenie o szeregu Taylora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
11.4.2 Funkcje analityczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264
11.5 Szeregi Fouriera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
11.5.1 Wielomiany trygonometryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
11.5.2 Zespolony iloczyn skalarny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
11.5.3 Przestrzeń wektorowa z zespolonym iloczynem skalarnym . . . . . . . . . . . . . . . . . . . . . . . . . 269
11.5.4 Równość prawie wszędzie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
11.5.5 Układ ortonormalny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
11.5.6 Szereg Fouriera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
11.5.7 Rzut ortonormalny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
11.5.8 Jądro Dirichleta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
11.5.9 Zbieżność punktowa szeregu Fouriera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
10 SPIS TREŚCI
Część I

Wprowadzenie

11
13

Wstęp
Niniejsze notatki do kursu Analiza Matematyczna I przeznaczonego dla studentów kierunku Matematyka Komputerowa
stanowią roboczą wersję i w trakcie kursu mogą podlegać aktualizacji. Punktem wyjścia tych notatek jest rękopis moich
materiałów do wykładu z analizy matematycznej prowadzonego w latach 1984-1990 dla studentów informatyki UJ. W owym
czasie był to bardzo obszerny kurs obejmujący 240h wykładów i 240h ćwiczeń. Wykładało i studiowało się wtedy zupełnie
inaczej, bo wykładowca miał do dyspozycji tylko tablicę i kredę, a studenci to co zdołali w trakcie wykładu zanotować.
Dziś możliwości są zupełnie inne, stąd i te notatki są inne, choć w pewnym stopniu wykorzystują jeszcze mój dawny
rękopis. Już wtedy starałem się o to, by część odnosząca się do intuicji była obszerna i równocześnie wyraźnie oddzielona
od części formalnej. Wydaje się, że takie podejście jest szczególnie ważne dla studentów specjalności Matematyka Kompu-
terowa, dlatego planuję je kontynuować również w ramach obecnego wykładu. Część materiału poświęcona intuicjom ma
charakter całkowicie nieformalny. Dla wyraźnego odróżnienia od części formalnej jest złożona brązową, pochyloną czcionką.
W szczególności cały pierwszy rozdział jest nieformalny. Nieformalne mówienie o matematyce rodzi często więcej pytań niż
daje odpowiedzi. Ale takie właśnie jest jej zadanie: sprowokować do myślenia. Dociekliwy czytelnik, który czyta najpierw
nieformalny tekst matematyczny wyrabia sobie pewne idee, które wymagają dopracowania. W moim przekonaniu takie po-
dejście powoduje, że studiowanie tekstu formalnego, który to dopracowanie dostarcza, staje się w efekcie bardziej naturalne i
znacznie łatwiejsze. Najważniejsze pytania jakie rodzi tekst nieformalny zostały w tekście wyróżnione poprzez umieszczenie
w ramce o różowym tle. Pytań jest oczywiście dużo więcej niż tych, które w tekście zostały jawnie postawione.
Różne kolory tła tekstu oznaczają: blado pomarańczowy - twierdzenia, blado zielony - definicje, różowy - problemy, blado
niebieski (C++) i blado fioletowy (Mathematica) - listingi programów komputerowych, żółty - ćwiczenia tablicowe, niebieski
- ćwiczenia komputerowe.
Aspekty obliczeniowe analizy matematycznej, ilustrowane programami komputerowymi w języku C++ oraz instrukcjami
programu Mathematica złożone są czcionką w kolorze niebieskim.
Znajomość rozdziałów, podrozdziałów i dowodów oznaczonych (*) obowiązuje jedynie studentów mierzących w ocenę
bdb. Rozdziały i podrozdziały oznaczone (**) są nieobowiązkowe.
Życzę wszystkim uczestnikom kursu udanego studiowania matematyki komputerowej na Wydziale Matematyki i Infor-
matyki UJ.
14

Orientacyjne rozpisanie materiału na tematy


T01: Wprowadzenie

T02: Ciało liczb rzeczywistych (rozdz. 2.1 - 2.3 ) w tym dowody tw. 2.1.10 oraz tw. 2.2.4 .

T03: Granice ciągów w zbiorze liczb rzeczywistych (rozdz. 2.4 ) w tym dowód tw. 2.4.3 oraz tw. 2.4.4 . Twierdzenia o
granicach (rozdz. 2.5 ) w tym dowód tw. 2.5.1 oraz tw. 2.5.6 . Granice wybranych ciągów (rozdz. 2.5.3 ) w tym
dowód tw. 2.5.8

T04: Liczba e i rzeczywista funkcja wykładnicza (rozdz. 2.6 ) w tym dowód tw. 2.6.1 . Ciało liczb zespolonych (rozdz. 2.7
) w tym dowód tw. 2.7.4 oraz tw. 2.7.5 .

T05: Metryki, przestrzenie metryczne, kule (rozdz. 3.1 ) w tym dowód tw. 3.1.4 oraz tw. 3.1.8 . Zbiory otwarte i
domknięte, wnętrze, domknięcie i brzeg zbioru (rozdz. 3.2 ) w tym dowód tw. 3.2.10 oraz tw. 3.2.11 . Punkty
skupienia. (rozdz. 3.4 )

T06: Zbiory spójne (rozdz. 3.4 - 3.5 ) w tym dowód wn. 3.5.3 . Zbiory zwarte. (rozdz. 3.6 ) w tym dowód tw. 3.6.6 oraz
tw. 3.6.8 . Przestrzenie zupełne. (rozdz. 3.7 ) w tym dowód tw. 3.7.3 .

T07: Granica funkcji. (rozdz. 4.1 - 4.2 ) w tym dowód tw. 4.2.2 , tw. 4.2.3 oraz tw. 4.2.4 .

T08: Granice jednostronne, punkty graniczne, granice dolne i górne (rozdz. 4.3 - 4.5 ) w tym dowód tw. 4.4.1 oraz tw. 4.5.4
. Ciągłość funkcji (rozdz. 4.6 ) w tym dowód tw. 4.6.3 .

T09: Ciągłość, a zwartość (rozdz. 4.7 ) w tym dowód tw. 4.7.1 , tw. 4.7.3 oraz tw. 4.7.4 . Jednostajna ciągłość w tym
dowód tw. 4.8.4 . Funkcje Lipschitza. Ciągłość, a spójność (rozdz. 4.8 - 4.9 ) w tym dowód tw. 4.9.1 , wn 4.9.2 oraz
tw. 4.9.3 .

T10: Szeregi: eksperymenty numeryczne (rozdz. 5.1 ), własności podstawowe (rozdz. 5.2 ) w tym wszystkie dowody

T11: Szeregi: kryteria zbieżności (rozdz. 5.3 ), w tym dowód tw. 5.3.3 oraz tw. 5.3.4 tw. 5.3.6

T12: Operacje na szeregach (rozdz. 5.4 ) w tym dowód tw. 5.4.1 oraz tw. 5.4.3 .

T13: Zespolona funkcja wykładnicza (rozdz. 6.1 ) w tym dowód tw. 6.1.3 , wn. 6.1.4

T14: Rzeczywista funkcja wykładnicza i logarytmiczna (rozdz. 6.2 ) w tym dowód tw. 6.2.1 wraz z lematem 6.2.2 ,
tw. 6.2.3 oraz tw. 6.2.5 .

T15: Funkcje trygonometryczne (rozdz. 6.3 ) w tym dowód tw. 6.3.1 , tw. 6.3.4 oraz lematu 6.3.6 . Liczba π, okresowość,
i wzory trygonometryczne (rozdz. 6.4 ) w tym dowód tw. 6.4.1 , tw. 6.4.4 , tw. 6.4.9 oraz tw. 6.4.12 .

T16: Przestrzenie wektorowe (rozdz. 7 ).

T17: Pochodna funkcji (rozdz. 8.1 ). Pochodna sumy, różnicy, iloczynu, ilorazu (rozdz. 8.2 ).

T18: Pochodna złożenia funkcji (rozdz. 8.3 ). Pochodna funkcji wykładniczej i funkcji trygonometrycznych (rozdz. 8.4 ).
Nieciągłości pochodnej i funkcje klasy C 1 , (rozdz. 8.5 ). Metoda Newtona (rozdz. 8.6 ).

T19: Pochodna, a ekstrema lokalne (rozdz. 8.7 ). Twierdzenia o wartości średniej (rozdz. 8.8 ) z zastosowaniami (rozdz. 8.9
). Reguła de l’Hospitala, (rozdz. 8.10 ).
15

T20: Pochodna funkcji odwrotnej (rozdz. 8.11 ). Różniczka funkcji. (rozdz. 8.12 )
T21: Pochodne wyższych rzędów (rozdz. 8.13 ). Wzory Taylora i szereg Taylora. (rozdz. 8.14 )
T22: Całka Riemanna funkcji jednej zmiennej. (rozdz. 9.1 )

T23: Własności całki Riemanna. (rozdz. 9.2 )


T24: Podstawowe twierdzenie rachunku różniczkowego i całkowego (rozdz. 10.1 ). Własności całki nieoznaczonej (rozdz. 10.2
). Całkowanie przez części (rozdz. 10.3 ).
T25: Całkowanie przez podstawienie (rozdz. 10.4 ). Twierdzenia o wartości średniej dla całek (rozdz. 10.5 ). Całkowanie
funkcji wektorowych (rozdz. 10.6 ). Zastosowania geometryczne całek (rozdz. 10.7 ).

T26: Zbieżność punktowa i jednostajna (rozdz. 11.1 ).


T27: Zbieżność jednostajna, a ciągłość, różniczka i całka (rozdz. 11.2 ). Aproksymacja funkcji ciągłych (rozdz. 11.3 ).
T28: Szeregi potęgowe (rozdz. 11.4 ).

T29: Szeregi Fouriera (rozdz. 11.5 ).


16
Rozdział 1

Wprowadzenie do analizy matematycznej

Nim zabierzemy si˛e do studiowania analizy matematycznej w szczegółach, warto sobie zadać pytanie czym analiza matematyczna si˛e zajmuje. Nie da si˛e na nie
dać dobrej odpowiedzi bez przyjrzenia si˛e jak koncepcje, które ukształtowały współczesna˛ analiz˛e matematyczna˛ stopniowo kształtowały si˛e na przestrzeniach
dziejów. Niniejszy rozdział wprowadzajacy
˛ stanowi krótki przeglad˛ podstawowych problemów analizy matematycznej oraz ich umiejscowienia w historii matematyki.

1.1 Rozwój pojęcia liczby


1.1.1 Liczby naturalne
Umiej˛etność posługiwania si˛e liczbami rozwijała si˛e u człowieka stopniowo. Pierwotny zbiór liczebników ograniczał si˛e do trzech: jeden, dwa i wiele. Wraz z
rozwojem ludzkiej cywilizacji pojawiła si˛e konieczność dokładnego rozeznania w liczebności oddziału wojowników, stada bydła, czy zestawu strzał. Tak zrodziła si˛e
umiej˛etność porównywania liczności zbiorów, która doprowadziła do pojawienia si˛e abstrakcyjnego poj˛ecia liczby naturalnej. Zapewne niedługo potem człowiek
nauczył si˛e te liczby dodawać, odejmować i mnożyć. Operacje te wymagały opanowania stosownych algorytmów post˛epowania, a ich efektywność silnie zależała
od stosowanego sposobu zapisu liczb. Używany przez nas dziś dziesiatkowy
˛ system pozycyjny wywodzi si˛e z Indii, gdzie pojawił si˛e około VIII w. To tam też po raz
piewrwszy zaakceptowano zero jako pełnoprawna˛ liczb˛e, przydatna˛ w rachunkach.

1.1.2 Ułamki
Pojawienie si˛e ułamków wiaże
˛ si˛e z rozwojem handlu, który wymagał doskonalenia umiej˛etności mierzenia. Do mierzenia używano miary. Na przykład w przypadku
płynów i materiałów sypkich mogła to być gliniana amfora o ustalonej obj˛etości. Poczatkowo
˛ zaniedbywano powstajace ˛ przy odmierzaniu cz˛eści ułamkowe, ale
gdy z biegiem czasu rosła potrzeba dokładności, wprowadzano miary pomocnicze b˛edace ˛ cz˛eścia˛ wyjściowej miary, na przykład połowa,˛ jedna˛ trzecia˛ czy jedna˛
czwarta.˛ Co charakterystyczne, były to tzw. ułamki proste, czyli ułamki o liczniku jeden. Gdy handel zaczał˛ przekraczać granice pojedynczych plemion pojawiła si˛e
konieczność wprowadzania przelicznika dla różnych systemów miar obowiazuj ˛ acych
˛ w różnych rejonach. To zapewne przyczyniło si˛e do powstania abstrakcyjnej
postaci ułamka.

1.1.3 Liczby ujemne, całkowite i wymierne


Dwie liczby naturalne i dwa ułamki można zawsze do siebie dodać i w wyniku powstaje inna liczba naturalna lub inny ułamek. Jednakże od liczby a nie można odjać
˛
liczby b gdy b ­ a bez rozszerzenia zbioru liczb o liczby ujemne i zero. Jak wiemy z każda˛ liczba˛ a powiazać
˛ można liczb˛e do niej przeciwna,˛ oznaczana˛ −a,
tak że ich suma daje zero. Zbiór liczb naturalnych rozszerzony o zero i liczby przeciwne do liczb naturalnych nazywamy zbiorem liczb całkowitych, a analogicznie
rozszerzony zbiór ułamków nazywamy zbiorem liczb wymiernych. Zwyczajowo stosujemy oznaczenia N dla liczb naturalnych, Z dla liczb całkowitych oraz Q dla
liczb wymiernych. Natomiast zbiór liczb wymiernych dodatnich, czyli po prostu zbiór klasycznych ułamków oznaczamy Q+ .
Liczby ujemne w pewnym stopniu były znane już w starożytnych Chinach i Indiach, gdzie interpretowane były w kategoriach długu. Jednak nie były specjalnie
doceniane i na codzień radzono sobie bez nich. Matematyka europejska zaakceptowała liczby ujemne dopiero w XVII w, ale nawet dziś w życiu codziennym

17
18 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

Rysunek 1.1: Pitagoras z Samos, VI w. przed Chrystusem. Źródło: Wikipedia

Rysunek 1.2: c2 = (a + b)2 − 4 ab


2 =a +b
2 2

jesteśmy w stanie radzić sobie bez liczb ujemnych. Najwi˛ekszy pożytek z liczb ujemnych jest przy ujednolicaniu algorytmów, gdyż dzi˛eki nim nie musimy rozważać
różnych przypadków, by zagwarantować, że wszystkie rozważane w trakcie pracy algorytmu liczby sa˛ dodatnie.

1.1.4 Liczby niewymierne


Odkrycie, że ułamki nie wystarczaja˛ do mierzenia dowolnych wielkości przypisuje si˛e szkole pitagorejskiej, wywodzacej
˛ si˛e od żyjacego
˛ w VI w. przed Chrystusem
w Grecji Pitagorasa z Samos (rys. 1.1 ). Pitagorejczycy świ˛ecie wierzyli, że ułamki wystarczaja˛ do zmierzenia dowolnych długości. Dlatego dokonane przez nich
odkrycie było dla nich ciosem, tym wi˛ekszym, że było konsekwnecja˛ słynnego twierdzenia udowodnionego przez Pitagorasa (rys. 1.2 ).

Twierdzenie 1.1.1 (Pitagoras z Samos) W trójkacie


˛ prostokatnym
˛ suma kwadratów przyprostokatnych
˛ jest równa kwadratowi przeciwprostokatnej.
˛

Z twierdzenia Pitagorasa wynika, że przekatna


˛ kwadratu o boku długości jeden jest liczba,˛ która podniesiona do kwadratu wynosi dwa, czyli tak zwanym
pierwiastkiem z dwóch (rys. 1.3 ). Pitagorejczycy pierwsi zauważyli, że żaden ułamek podniesiony do kwadratu nie może dać liczby dwa. Było to szokujace
˛
1.1. ROZWÓJ POJĘCIA LICZBY 19

√ √
Rysunek 1.3: Przekątna kwadratu to 2. Ale ile to jest 2?

spostrzeżenie, z którym niełatwo było si˛e pogodzić. Tak pojawiły si˛e liczby niewymierne, a wraz nimi problem ich przybliżania ułamkami.


Ćwiczenie 1.1.2 • Rozkładajac
˛ na czynniki pierwsze licznik i mianownik ułamka spróbuj uzasadnić, dlaczego 2 nie może być ułamkiem.

• Czy podobne rozumowanie może być przeprowadzone dla 3 2? dla innych pierwiastków?


Problem 1.1.3 Czy wiemy czym naprawd˛e jest liczba 2? Czy ona rzeczywiście ma sens? Jakich liczb jeszcze brakuje wśród ułamków, by wszystkie
długości dało si˛e wymierzyć? W jaki sposób je zdefiniować?

1.1.5 Liczby rzeczywiste


Precyzyjna definicja liczby niewymiernej jest skomplikowana. Stwierdzenie, że liczby niewymierne, to wszystkie liczby, które nie sa˛ wymierne jest dobra˛ definicja˛
tylko wtedy gdy wiemy co oznacza zwrot "wszystkie liczby". Intuicyjnie chodzi nam o taki zbiór liczb, który pozwala mierzyć długości tak odcinków jak i krzywych.
Zbiór takich liczb został precyzyjnie zdefiniowany dopiero w XIX wieku. Określa si˛e go mianem zbioru liczb rzeczywistych i oznacza symbolem R. Natomiast zbiór
liczb rzeczywistych dodatnich oznacza si˛e symbolem R+ .

1.1.6 Liczby urojone i zespolone


Określenie liczby rzeczywiste zrodziło si˛e w kontraście do tzw. liczb urojonych. Liczba urojona to liczba, której kwadrat jest liczba˛ ujemna.˛ Kwadrat liczby rzeczy-
wistej nie może być ujemny, tak wi˛ec liczb urojona nie jest liczba˛ rzeczywista.˛ Sensowność takich liczb długo budziła watpliwości,
˛ co wyjaśnia ich nazw˛e.
Liczby zespolone, b˛edace˛ sumami liczb rzeczywistych i urojonych, maja˛ wiele cech podobnych do liczb rzeczywistych, a także wiele zalet, których liczby
rzeczywiste nie maja.˛ Dzi˛eki temu pozwalaja˛ rozwiazywać
˛ pewne problemy "na skróty". Jednym z pierwszych pożytków z liczb zespolonych było podanie w XVI
wieku algorytmów wyznaczania miejsc zerowych równania trzeciego i czwartego stopnia.

1.1.7 Liczby w komputerze


Rachunki liczbowe na papierze wykonywane sa˛ zazwyczaj na ułamkach zwykłych, a cz˛eściej na ułamkach dziesi˛etnych.
20 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

Wraz ze zbudowaniem w połowie XX w. pierwszych komputerów stworzono też koncepcj˛e przechowywania i przetwarzania liczb w komputerze. Było to
konieczne, bo wszystko co przetwarza współczesny komputer na poziomie procesora sprowadza si˛e do wykonywania obliczeń na liczbach. Typowy użytkownik
komputera oglada˛ filmy, słucha muzyki, przeglada˛ strony internetowe albo po prostu gra na komputerze i nie uświadamia sobie, że wszystko to sprowadza si˛e do
przetwarzania liczb. Zazwyczaj sa˛ to liczby całkowite, ale wiele pozamatematycznych zastosowań wymaga też obliczeń na liczbach wymiernych.
Komputer jest oczywiście równie niezastapiony
˛ jeśli naszym celem jest przeprowadzenie mniej lub bardziej skomplikowanych obliczeń matematycznych, inży-
nierskich badź
˛ naukowych. Jeśli obliczenia sa˛ bardzo specjalistyczne, jest ich szczególnie dużo, a nam zależy na efektywności, piszemy własny lub zamawiamy
stosowny program w kompilowanym j˛ezyku wysokiego poziomu. Jeśli obliczenia sa˛ typowe, a ich ilość jest umiarkowana, si˛egamy po specjalistyczne oprogramo-
wanie takie jak Mathematica, Maple, Matlab czy Scilab.
W ramach niniejszego kursu aspekty numeryczne analizy matematycznej demonstrować b˛edziemy programami napisanymi dla środowiska Mathematica, a
także programami napisanymi w j˛ezyku C++.
Mathematica to bogaty pakiet oprogramowania bardzo ułatwiajacy ˛ wszelkie obliczenia matematyczne. Umożliwia on tak prosta˛ prac˛e interaktywna˛ jak i pisanie
własnego oprogramowania. Na przykład, aby pomnożyć przez siebie liczby 123 i 456 wystarczy napisać
123*456

i przycisnać
˛ rówcznocześnie klawisze ’Shift’ i ’Enter’. Przyciśni˛ecie ’Shift’ wraz ’Enter’ jest sygnałem, że oczekujemy przeprowadzenia obliczeń. Natychmiast
otrzymujemy wynik
56088
W programie Mathematica operacje arytmetyczne dodawania, odejmowania, mnożenia, dzielenia i pot˛egowania oznaczamy odpowiednio znakami +,-,*,/,^.
Tak wi˛ec piszac
˛
3^4

otrzymujemy
81
W podobny sposób przeprowadzamy obliczenia na ułamkach dziesi˛etnych. Na przykład
3.14 + 2.72

daje wynik 5.86. Trzeba jedynie pami˛etać, że zgodnie z anglosaskim zwyczajem używamy kropki dziesi˛etnej, a nie przecinka. Obliczenia na liczbach dziesi˛etnych
zwiazane
˛ sa˛ niestety z bł˛edami zaokragleń.
˛ Na przykład
1.0/3.0

daje 0.333333 co jest wynikiem przybliżonym. Bł˛edu zaokragleń


˛ można uniknać
˛ przeprowadzajac
˛ obliczenia na liczbach wymiernych. Jeśli napiszemy
1/3

Mathematica zwróci ułamek


1
,
3
a piszac
˛
7/3+3/11

otrzymamy jako wynik ułamek


86
.
33
co , w przeciwieństwie do obliczeń na liczbach dziesi˛etnych, jest wynikiem dokładnym. Jeśli potrzebujemy jednak przybliżenia dziesi˛etnego, zawsze możemy je
otrzymać. Piszac
˛
N[1/23]
1
otrzymujemy przybliżenie ułamka 23
0.0434783.
1.2. CIĄGI 21

1.2 Ciągi
1.2.1 Przybliżanie pierwiastka
˛ wszystkie ułamki o mianowniku m znajdziemy taki, postaci
Choć wśród ułamków brak jest takiego, który podniesiony do kwadratu daje liczb˛e dwa, to rozważajac
i
m , że
2 2
i+1
 
i
<2< .
m m

Dla danego m licznik taki jest dokładnie jeden. Sam pierwiastek z dwóch, czymkolwiek jest, leży gdzieś pomi˛edzy i
m, a i+1
m , zatem i
m jest przybliżeniem 2z
1
dokładnościa˛ co najmniej m . Na przykład, dla m = 5 mamy

 2  2
7 49 64 8
= <2< =
5 25 25 5

zatem 7
5 jest przybliżeniem 2 z dokładnoscia˛ wi˛eksza˛ niż 15 . Aby dostać lepsza˛ dokładność wystarczy wziać
˛ odpowiednio duży mianownik m.

1.2.2 Ciągi przybliżeń


W praktyce wygodnie ograniczyć si˛e do mianowników postaci m = 10n . Niestety r˛eczne poszukiwanie stosownego licznika jest bardzo żmudne, a dla dużych
n praktycznie niewykonalne. Potrzebujemy algorytmu, który dla zadanego mianownika 10n pozwoli nam wyznaczyć stosowny licznik in oraz komputera, który
sprawnie wykona obliczenia w tym algorytmie. Łatwo zauważyć, że

in = max { i | i ∗ i < 2 ∗ 100n }.

√ i ∗ i < 2 ∗ 100 dla kolejnych liczb naturalnych i i zwraca in jako ostatnie i, dla którego
n
Sugeruje to algorytm, który przy zadanym n sprawdza nierówność
nierówność ta zachodzi. Wtedy xn := 10n jest przybliżeniem 2, które, jak łatwo sprawdzić, spełnia
in

√ 1
|xn − 2| ¬ .
10n

Kolejne liczby xn tworza˛ tzw. ciag


˛ liczbowy, w tym przypadku tzw. ciag ˛ przybliżeń. Ciag
˛ przybliżeń, to ciag
˛ skonstruowany w celu przybliżania pewnej liczby
niewymiernej liczbami wymiernymi. Ciagi˛ przybliżeń to nie jedyne ciagi
˛ rozważane w matematyce, choć ich rola praktyczna jest bardzo istotna. Badanie ciagów
˛ to
jeden z głównych obiektów zainteresowań analizy matematycznej.
Wprowadźmy w programie Mathematica rozdzielony średnikami ciag ˛ instrukcji

n = 3 ; i = 1 ; While [ i ^2 < 2*100^ n , i = i + 1 ] ; {( i −1)/10^ n , i /10^ n }

Pojawiaja˛ si˛e tu zmienne i oraz n. Instrukcja While to instrukcja p˛etli. Jak długo spełniony jest warunek i^2 < 2*100^n wykonywana jest instrukcja
i = i + 1. Ponieważ przed wykonaniem instrukcji While ustawiliśmy zmienna˛ n na 3, a i na 1, p˛etl˛e wykonujemy dla kolejnych wartości i = 1, 2, . . . aż
zajdzie nierówność i^2 ­ 2000000. Mathematica wyprowadza jako wynik ostatnie obliczone wyrażenie, którym jest para ułamków {(i-1)/10^n,i/10^n}.
W rozważanym przypadku otrzymamy
707 283
{ , }.
500 200

jako oszacowanie od dołu i od góry 2 z dokładnościa˛ do 1000
1
.

Podstawiajac ˛ obliczenia otrzymamy przybliżenia 2 od dołu i od góry o coraz lepszej
˛ w powyższym listingu za n kolejne liczby naturalne i wykonujac
22 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

dokładności:

14 15
 
,
10 10
141 142
 
,
100 100
1414 1415
 
,
1000 1000
14142 14143
 
,
10000 10000
141421 141422
 
,
100000 100000
1414213 1414214
 
,
1000000 1000000
···

Obliczenia
√ te, przynajmniej teoretycznie, możemy kontynuować w nieskończoność. Otrzymujemy w ten sposób ciag ˛ przybliżeń od dołu i ciagu
˛ przybliżeń od
góry liczby 2.
W tym miejscu trzeba zrobić uwag˛e na temat stosowanej w programie Mathematica notacji. Mathematica używa nawiasów wasiastych ˛ {, } do oznaczania list.
Zwyczajowo w matematyce nawiasów wasiastych˛ używa si˛e do oznaczania zbiorów. Różnica ta ma znaczenie, bo przy wypisywaniu elementów listy kolejność jest
istotna, a przy wypisywaniu elementów zbioru nie jest. Innymi słowy, dwie listy, które różnia˛ si˛e tylko kolejnościa˛ elementów sa˛ różne, a dwa zbiory, które różnia˛ si˛e
tylko kolejnościa˛ w jakiej wymieniono ich elementy sa˛ traktowane jako identyczne. Korzystajac ˛ z programu Mathematica musimu o tej różnicy pami˛etać.
Zaproponowana tu metoda liczenia pierwiastka należy do najprostszych, ale oczywiście jest daleka od doskonałości. Mathematica radzi sobie doskonale
nie tylko z liczeniem pierwiastków, ale również innych funkcji elementarnych, w szczególności funkcji trygonometrycznych i funkcji logarytmicznej. Trzeba jednak
pami˛etać, że jeśli jako argument podamy liczb˛e dokładna,˛ na przykład naturalna˛ lub ułamek, a wynik nie jest liczba˛ naturalna˛ badź ˛ ułamkiem, aby zachować
dokładność Mathematica nie przeprowadzi obliczeń. Na przykład piszac ˛
Sqrt [ 2 ]

otrzymamy jako wynik 2. Ale piszac
˛
Sqrt [ 2 . ]

otrzymamy 1.41421.
Do zagadnienia obliczania pierwiastka b˛edziemy jeszcze wracać w dalszych rozdziałach.
Oczywiście ciagi
˛ nie musza˛ być zadawane w tak skomplikowany sposób jak nasz ciag ˛ przybliżeń. Najprościej zadać ciag ˛ wzór na jego n-ty wyraz.
˛ podajac
Na przykład ciag
˛ dany wzorem
1
xn = (1.1)
n
to tak zwany ciag
˛ harmoniczny.

Problem 1.2.1 Czy ciag


˛ harmoniczny przybliża jakaś
˛ liczb˛e? Jeśli tak to jaka?
˛

˛ określony jest wzorem, na przykład wzorem (1.1), wystarczy napisać


Gdy ciag
Table [ 1 / n , { n , 1. , 10.}]

a otrzymamy przybliżenia poczatkowych


˛ wyrazów tego ciagu
˛

{1., 0.5, 0.333333, 0.25, 0.2, 0.166667, 0.142857, 0.125, 0.111111, 0.1}
1.2. CIĄGI 23

(−1)n
Rysunek 1.4: Wykres początkowych wyrazów ciągu 1 + n .

Można też łatwo uzyskać wizualizacj˛e (wykres) ciagu.


˛ Na przykład wykres poczatkowych
˛ wyrazów ciagu
˛ danego wzorem

(−1)n
un = 1 +
n
uzyskamy piszac
˛
D i s c r e t e P l o t [1 + ( −1)^ n / n , { n , 1 , 50}]

Uzyskamy w ten sposób wykres przedstawiony na rys. 1.4 .

1.2.3 Granice
√ √
Obrazowo mówimy, że ciag ˛ ten osiaga˛ liczb˛e 2 w granicy, albo krócej, że zmierza do 2. Właśnie
√ w tym celu go skonstruowaliśmy. Ale czy możemy mieć
˛ dla dużych wartości n nie zmieni zdania i na przykład zamiast zmierzać do 2 zacznie uciekać do nieskończoności? Jesteśmy w stanie
pewność, że nasz ciag
policzyć tylko skończona˛ ilość wyrazów tego ciagu.
˛ Zawsze zostanie nieskończenie wiele wyrazów, których nie policzyliśmy. Czy możemy mieć pewność, że nasz
ciag
˛ przybliżeń nigdy nas nie zawiedzie?

Problem 1.2.2 Co to znaczy, że ciag


˛ osiaga
˛ jakaś
˛ liczb˛e w granicy (zmierza do granicy)? Jakie ciagi
˛ maja˛ granic˛e? Czy, kiedy i jak granic˛e daje si˛e
policzyć?

Odpowiedź na te pytania to jedno z fundamantalnych zadań analizy matematycznej. Poj˛eciem granicy w takim badź ˛ innym sensie posługiwano si˛e już od
czasów starożytnych, jednak aż do wieku XIX matematycy nie umieli sobie poradzić z postawieniem precyzyjnej definicji. Dopiero czeski matematyk Bernard
Bolzano (rys. 1.5 ) oraz niezależnie francuski matematyk, Augustin-Louis Cauchy (rys. 1.5 ) pierwsi postawili precyzyjna˛ definicj˛e. Ponieważ prace Bolzano długo
pozostawały mało znane, przyj˛eło si˛e mówić o definicji Cauchy’ego.
Według definicji Cauchy’ego ciag ˛ liczb xn jest zbieżny do granicy g jeżeli dla każdego ε > 0 istnieje taka liczba naturalna N , że dla wszystkich liczb
naturalnych n ­ N zachodzi nierówność
|xn − g| < ε.
24 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

Rysunek 1.5: Augustin Louis Cauchy (1789 - 1857) i Bernard Bolzano (1781 - 1844) Źródło: Wikipedia

Piszemy wtedy
lim xn = g.
n→∞

Ćwiczenie komputerowe 1.2.3 Dla każdego z poniższych ciagów˛ postaw hipotez˛e, czy ma on granic˛e. Jeśli uważasz, że ma granic˛e, spróbuj odgadnać
˛
jaka.˛ Wcześniej przeprowadź eksperymenty wykorzystujac
˛ instrukcj˛e Table w Mathematica.
n
1. n+1

2. 1 + (−1)n
(−1)n
3. 1 + n

4. (*) cos nπ

5. (*) sin n
sin n
6. (*) n

1.2.4 Obliczanie granic ciągu.


W praktyce niewiele granic liczy si˛e wprost z definicji, choć najprostsze granice właśnie tak si˛e wyznacza. Znajac
˛ już granice jakichś ciagów
˛ liczymy granice innych
ciagów
˛ korzystajac
˛ z różnych twierdzeń. Do najważniejszych należa˛

˛ an , bn sa˛ zbieżne odpowiednio do a i b to ich suma, różnica, iloczyn oraz iloraz sa˛ zbieżne odpowiednio do a + b, a − b,
Twierdzenie 1.2.4 Jeśli ciagi
ab, ab , przy czym w przypadku ilorazu trzeba dodatkowo założyć, że b 6= 0.
1.2. CIĄGI 25

Rysunek 1.6: Archimedes z Syrakuz (ok. 287–212 pne.) (medal Fieldsa). Źródło: Wikipedia

˛ an , bn , cn spełniaja˛ nierówność
Twierdzenie 1.2.5 Jeśli ciagi

an ¬ bn ¬ cn

˛ an oraz cn sa˛ zbieżne i to do tej samej granicy, to ciag


i ciagi ˛ bn też jest zbieżny i też do tej granicy.

Ćwiczenie 1.2.6 • Posługujac


˛ si˛e definicja˛ granicy oblicz granice ciagów
˛ 1 √1 1
n , n , 2n oraz ciagu,
˛ którego wszystkie wyrazy sa˛ stale równe stałej
wielkości a.
2−3n+5n2
• (*) Oblicz granice ciagów
˛ n2 , 1+1√n .

1.2.5 Liczba π
Wśród ważnych problemów rozważanych już w starożytności było wyznaczanie obwodu i pola koła o zadanym promieniu. Kluczowy w tych obliczeniach jest
obwód koła o średnicy jeden, zwyczajowo oznaczany grecka˛ litera˛ π . Koło o innej średnicy ma proporcjonalnie wi˛ekszy badź˛ mniejszy obwód, w szególności koło
o promieniu r , a wi˛ec średnicy
√ 2r ma obwód 2πr .
Liczba π , podobnie jak 2, jest liczba˛ niewymierna,˛ ale o tym starożytni nie wiedzieli. Udowodniono to dopiero w XVIII w. Co wi˛ecej, w wieku XIX udowod-
niono, że π jest liczba˛ transcendentna,˛ to znaczy, że nie jest pierwiastkiem żadnego wielomianu o współczynnikach wymiernych. Oznacza to w szczególności, że
nawet jeśli zbiór ułamków rozszerzymy o wszystkie możliwe pierwiastki, to nadal nie wystarczy on do mierzenia wszelkich długości.
W starożytności przyjmowano różne liczby pomi˛edzy 3 i 3.16 jako przybliżenie liczby π bez przywiazywania
˛ szczególnej wagi do popełnianego bł˛edu. Dopiero
grecki matematyk Archimedes (rys. 1.6 ) zaproponował algorytmiczna˛ metod˛e wyznaczania π , która przez ponad 1000 lat dostarczała coraz lepszych przybliżeń.
Jest to metoda geometryczna, oparta o wpisywanie w okrag ˛ i opisywanie na okr˛egu wielokatów
˛ (rys. 1.7 ). Posługujac˛ si˛e 96-katem
˛ Archimedes oszacował, że
223/71 < π < 22/7 (3.1408 < π < 3.1429), co daje dobre przybliżenie π do dwóch miejsc po przecinku. Co ciekawe, w 1596 roku, ciagle ˛ w oparciu o
metod˛e metod˛e Archimedesa, holenderski matematyk Ludolph van Ceulen policzył π z dokładnościa˛ do 35 cyfr.
Oznaczmy przez an bok 2n -kata ˛ foremnego wpisanego w okrag ˛ o średnicy jeden. W oparciu o twierdzenie Pitagorasa można pokazać, że

2 1
q
a2 = = 2 − 4 − 4a2n . (1.2)
p
, an+1
2 2
Zatem obwód tego 2n -kata
˛ wynosi An := 2n an .
˛ An powinien zmierzać do liczby π , bo tyle wynosi obwód koła o średnicy jeden. W rozdziale 2.4.1 przyjrzymy si˛e bliżej
Można si˛e spodziewać, że ciag
˛ (1.2).
zachowaniu ciagu
26 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

Rysunek 1.7: Przybliżanie obwodu i pola koła wielokątami

Ćwiczenie 1.2.7 • (*) Opierajac


˛ si˛e na swojej wiedzy z geometrii spróbuj uzasadnić wzór (1.2).

• (*) Uzasadnij stwierdzenie, że bok 2n -kata


˛ foremnego opisanego na okr˛egu o średnicy jeden wyraża si˛e wzorem
an
bn := p .
1 − a2n

W programie Mathematica liczb˛e π zapisuje si˛e jako Pi.

1.3 Szeregi
1.3.1 Pole koła
Archimedesowi zawdzi˛eczamy również sposób liczenia pola koła. Zastosował on tu również metod˛e wielokatów.
˛ Najpierw zauważył, że pole n-kata
˛ foremnego
wpisanego w okrag ˛ pola n trójkatów
˛ można policzyć sumujac ˛ równoramiennych. Maja˛ one wszystkie jednakowa˛ podstaw˛e xn i jednakowa˛ wyskość hn , zatem
˛ wynosi Pn := nxn2 hn co równe jest Ln2hn , gdzie Ln := nxn jest obwodem wielokata.
pole wielokata ˛ Przy n zmierzajacym
˛ do nieskończoności wysokości
hn zmierzaja˛ do promienia r koła, a obwody Ln zmierzaja˛ do obwodu koła, o którym wiemy już, że wynosi 2πr. Zatem pola Pn zmierzaja˛ do 2πrr 2 skad˛
wnosimy, że pole koła o promieniu r to
P := πr2 . (1.3)

1.3.2 Liczba π poprzez szereg.


Powróćmy do obliczania liczby π . Widzieliśmy, że metoda oparta o przybliżanie obwodu koła daje niezbyt zadowalajacy
˛ wynik. Cz˛esto jednak, jeśli jeden algorytm
zastapimy
˛ innym, to możemy uzyskać lepsze wyniki przy zastosowaniu tej samej arytmetyki komputerowej. Wiemy, że liczba π jest nie tylko obwodem koła o
średnicy jeden, ale również polem koła o promieniu jeden.
˛ pole tego koła polami wpisanych w nie 2n -katów
Zast˛epujac ˛ foremnych również otrzymamy ciag ˛ przybliżeń liczby π . Oznaczmy przez Pn pole 2n -kata ˛
foremnego wpisanego w koło. Dla n = 1 rozważamy 2-kat˛ jako zdegenerowana,˛ pozbawiona˛ pola figur˛e redukujac ˛ a˛ si˛e do średnicy koła, zatem P1 = 0.
1.3. SZEREGI 27

Rysunek 1.8: Kolejne dodatki do pola koła.

Zauważmy, że 2n+1 -kat˛ powstaje z 2n -kata


˛ poprzez dorysowanie figury złożonej z 2n trójkatów
˛ równoramiennych wpisanych w koło o podstawach leżacych
˛ na
bokach 2n -kata
˛ (patrz rys. 1.8 ). Niech An oznacza pole tej figury. Zatem Zatem

Pn+1 = Pn + An ,
czyli An+1 jest poprawka,˛ która dodana do pola 2n -kata
˛ daje pole 2n+1 -kata.
˛ Stad
˛

Pn = A1 + A2 + A3 + A4 + . . . + An−1 ,
a pole koła PK otrzymamy sumujac
˛ wszystkie poprawki:

PK = A 1 + A 2 + A 3 + A 4 + . . . .

Wartości Ai można wyliczyć. Aby wykorzystać wzory z podrozdziału 1.2.5 , zamiast koła o promieniu jeden rozważymy ponownie koło o średnicy jeden,
a wi˛ec o promieniu 1/2. Zatem ze wzoru (1.3) jego pole to π4 . Zatem jako przybliżenie π interesuje nas ciag
˛ sn := 4Pn . Niech Tn oznacza pole trójkata ˛
równoramiennego o podstawie równej bokowi 2n -kata,˛ a ramionach równych bokowi 2n+1 -kata. ˛ Mamy

An = 2n Tn

an (1− 1−a2n )
Można policzyć, że Tn = 4 , gdzie an , jak poprzednio, oznacza bok 2n -kata
˛ foremnego wpisanego w koło o średnicy jeden. Zatem

n an (1 1 − a2n )
p

Pn+1 = Pn + 2
4
oraz
sn+1 = sn + 2n an (1 − 1 − a2n ). (1.4)
p

1.3.3 Szeregi
˛ sn jest specyficzny. Jego m-ty wyraz może zostać zapisany w postaci
Warto zwrócić uwag˛e, że ciag
m
X
sm = cn , (1.5)
n=1

gdzie 
0
 dla n = 1,
cn = 2 dla n = 2,
2 an (1 − 1 − a2n ) dla n > 2.

 n p
28 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

˛ takiego typu nazywamy szeregiem o wyrazach cn .


Ciag
Zazwyczaj (choć bardzo nieściśle) używamy zapisu

X
cn
n=1

na oznaczenie szeregu o wyrazach cn , a sm dane wzorem (1.5) nazywamy m-ta˛ suma˛ cz˛eściowa˛ szeregu.
˛ sn jest zbieżny. W takim przypadku granic˛e ciagu
Mówimy, że szereg jest zbieżny, jeżeli ciag ˛ sn nazywamy suma˛ szeregu i oznaczamy tym samym symbolem
co sam szereg.
Szeregi odgrywaja˛ ważna˛ rol˛e w wielu zastosowaniach, dlatego badaniu ich zbieżności poświ˛eca si˛e w analizie matematycznej szczególna˛ uwag˛e. Szczególnie
ważne sa˛ narz˛edzia, które pozwalaja˛ określić, czy szereg jest zbieżny, czy nie. Jeśli nie wiemy czy szereg jest zbieżny, to nie możemy z pożytkiem wykorzystywać
w obliczeniach numerycznych.

1.4 Funkcje
1.4.1 Koncepcja funkcji
Koncepcja funkcji, jedna z fundamentalnych idei współczesnej matematyki, jako samodzielny obiekt badań pojawiła si˛e w drugiej połowie XVII w. W tym pierwotnym
uj˛eciu funkcja była rozumiana jako wartość, tzw. zmienna zależna, która˛ można obliczyć rachunkiem algebraicznym badź ˛ poprzez konstrukcje geometryczne w
oparciu o inna˛ wartość, tzw. zmienna˛ niezależna˛ oraz pewne stałe. Jako przykład pierwszej kategorii może tu posłużyć funkcja kwadratowa

x 7→ x2 ,

˛ pole koła o promieniu r


funkcja wyznaczajaca
r 7→ πr2 ,
czy ogólnie wielomian
x 7→ a0 + a1 x + a2 x2 + · · · + an xn .

1.4.2 Miejsca zerowe funkcji


Wśród ważnych zagadnień praktycznych jakie pojawiaja˛ si˛e w kontekście funkcji jest pytanie czy i dla jakich wartości zmiennej niezależnej, albo inaczej argumentu,
funkcja przyjmuje wartość zero. Argument taki nazywa si˛e miejscem zerowym funkcji.
Jedna˛ z prostych metod poszukiwania miejsca zerowego funkcji jest tzw. metoda bisekcji. Wymaga ona dysponowania dwoma argumentami a < b, w których
funkcja przyjmuje wartości o znakach przeciwnych. Konstruujemy wtedy rekurencyjnie dwa ciagi. ˛ Oznacza to, że najpierw zadajemy ich wyrazy poczatkowe ˛

x1 := a,
y1 := b,

a nast˛epnie podajemy jak wyznaczyć wyrazy kolejne w oparciu o wyrazy wcześniejsze


(
xn jeżeli f (xn )f ( xn +y n
) < 0,
xn+1 := xn +yn
2

2 w przeciwnym razie,
(
yn jeżeli f (yn )f ( xn +yn
) < 0,
yn+1 := xn +yn
2

2 w przeciwnym razie.

W wielu przypadkach, choć niestety nie zawsze, ciagi


˛ te daż ˛ miejscem zerowym funkcji f .
˛ a˛ do wspólnej granicy b˛edacej
1.4. FUNKCJE 29

Rysunek 1.9: Wykres wielomianu Q(x) := −16 + 16x2 − 4x3 − 3x4 + x5 .

Ćwiczenie komputerowe 1.4.1 (*) Zaimplementuj metod˛e bisekcji w j˛ezyku Mathematica. Przetestuj ja˛ dla funkcji

(1) x 7→ x2 − 3 dla a = 1 i b = 3

(2) x 7→ x+cos x
sin x − 1 dla a = −1 i b = 1.

Postaw hipotezy na temat zbieźności ciagów


˛ xn i yn . Jeśli uznasz, że sa˛ one zbieżne do wspólnej granicy, zastanów si˛e, czy jest ona poszukiwanym
miejscem zerowym, a jeśli nie jest, to co jest tego przyczyna.˛

1.4.3 Wykres funkcji


Jeśli zadawala nas zgrubne przybliżenie miejsc zerowych funkcji, wystarczy narysować wykres funkcji. Z wykresu, obok miejsc zerowych możemy też odczytać
˛ funkcja w zadanym zbiorze. Rys. 1.9 przedstawia wykres wielomianu Q(x) := −16 +
tzw. ekstrema, czyli najwi˛eksze i jakie najmniejsze wartości osiaga
16x2 − 4x3 − 3x4 + x5 , z którego na przykład odczytać możemy, że wartościa˛ najmniejsza˛ w przedziale [−1, 1] jest −16. Analizowanie funkcji poprzez
narysowanie wykresu wystarcza jednak tylko do pobieżnego zapoznania si˛e z funkcja.˛ Jak zobaczymy, analiza matematyczna dostarcza znacznie lepsze metody
do analizowania własności funkcji.
Wykresy funkcji jednej zmiennej bardzo łatwo uzyskać przy pomocy programu Mathematica. Na przykład wykres wielomianu Q(x) := −16 + 16x2 −
4x − 3x4 + x5 na rys. 1.9 uzyskano instrukcja˛
3

P l o t [ −16+16 x ^2 −4 x ^3 −3 x ^4+ x ^ 5 , { x , − 2 . 5 , 3 . 5 } ]

1.4.4 Geometryczne konstrukcje funkcji


Funkcje pierwotnie definiowane poprzez konstrukcje geometryczne, to przede wszystkim funkcje trygonometryczne, na przykład

x 7→ sin x.
30 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

Rysunek 1.10: Geometryczna definicja funkcji sin i cos: w wycinku koła o promieniu 1 i długości łuku x wartość sin x
definiuje się jako długość odcinka spuszczonego z końca łuku prostopadle do ramienia wycinka koła ze znakiem plus, gdy
koniec łuku jest ponad ramieniem, a znakiem minus, gdy koniec łuku jest poniżej ramienia.

Rysunek 1.11: Wykres funkcji sin.

Konstrukcj˛e geometryczna˛ sin x i cos x pokazano na rys. 1.10 . W konstrukcji tej |x| jest interpretowane jako długość łuku wycinka koła o promieniu jeden, a
znak x rozstrzyga o wzajemnym położeniu poczatku
˛ i końca łuku. Przyj˛ete jest, że znak plus oznacza iż poczatek
˛ łuku wyst˛epuje przed końcem łuku przy ruchu
przeciwnym do ruchu wskazówek zegara. Wykres funkcji sin przedstawiono na rys. 1.11 .
W wielu zastosowaniach bardziej od funkcji sin i cos przydaje si˛e funkcja tangens

sin x
tg : x 7→
cos x
oraz funkcja cotangens
cos x
ctg : x 7→ .
sin x
Ponieważ dzielenie przez zero nie ma sensu, funkcja tangens nie ma określonej wartości dla argumentów x, dla których funkcja cos przyjmuje wartość zero, a
funkcja cotangens dla argumentów, dla których funkcja sinus si˛e zeruje. Wykres funkcji tg przedstawiono na rys. 1.12 .
W programie Mathematica zwyczajowo nazwy funkcji rozpoczyna si˛e od dużej litery. Sin, Cos, Tan, Cot to nazwy funkcji sinus, cosinus, tangens i cotangens.
Wykres funkcji sinus na rys. 1.11 uzyskano instrukcja˛
P l o t [ S i n [ x ] , { x , −2 P i , 2 P i } ]
1.4. FUNKCJE 31

Rysunek 1.12: Wykres funkcji tg.

Możemy też definiować własne funkcje, na przykład


f [ x_ ] : = x ^2

definiuje funkcj˛e, która zmiennej x przypisuje wartość x2 . Teraz piszac


˛
f [3]

otrzymamy wartość 9.
Co ciekawe, możemy też definiować funkcje, które w różnych przypadkach zdefiniowane sa˛ różnymi wzorami. Na przykład
g [ x_ ] : = I f [ x ^2 >1 , x ^ 2 , −1]

definiuje funkcj˛e, która˛ przy zastosowaniu tradycyjnej matematycznej notacji zapisalibyśmy wzorem
(
x2 gdy x2 > 1,
x 7→
−1 w przeciwnym razie.

Instrukcja If j˛ezyka Mathematica to tak zwana instrukcja warunkowa. Ma ona trzy argumenty. Zwraca drugi, gdy pierwszy ewaluuje si˛e do prawdy. W przeciwnym
razie zwraca argument trzeci.

1.4.5 Rozwijanie funkcji w szereg


Jednym z ważniejszych osiagni˛
˛ eć analizy matematycznej było odkrycie, że funkcje trygonometryczne nie musza˛ być obliczane metoda˛ geometryczna,˛ ale moga˛
być wyznaczone przez przybliżanie wartości szeregu. Na przykład

x3 x5 X x2n+1
sin x = x − + − ... = (−1)n ,
1·2·3 1·2·3·4·5 n=0
(2n + 1)!
gdzie m! = 1 · 2 · 3 · · · m, czytane m silnia, to iloczyn kolejnych liczb naturalnych od 1 do m. Wzór ten oraz podobne wzory dla innych funkcji trygonome-
trycznych odkrył w wieku XIV hinduski matematyk Madhavan of Sangamagramam.
Dzisiejsza definicja funkcji jest nieporównanie szersza od pierwotnej koncepcji i obejmuje ciagi
˛ jako szczególny przypadek. W stosowanej dzisiaj definicji nie
wnikamy w jaki sposób (algebraiczny, geometryczny czy jakikolwiek inny) określono jak zmiennej niezależnej przypisano zmienna˛ zależna,˛ traktujac
˛ ja˛ po prostu
jako skadś
˛ dana.˛ Taka˛ jest na przykład funkcja Dirichleta (
1 x∈Q
x 7→
0 x∈
6 Q,
w której definicji nie interesujemy si˛e jak w praktyce sprawdzić, czy liczba jest wymierna czy nie jest.
32 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

Rysunek 1.13: Pole soczewkowatej figury jest różnicą pól pod wykresami funkcji.

1.5 Pola figur i całkowanie


1.5.1 Całka oznaczona
Widzieliśmy, że koncepcja granicy jest pomocna przy obliczaniu pola koła. W podobny sposób możemy post˛epować z innymi figurami. Problem można sprowadzić
do liczenia pola pod wykresem funkcji. Rozważmy na przykład figur˛e o soczewkowatym kształcie przedstawiona˛ na rys. 1.13 .
Jak łatwo zauważyć pole tej figury jest różnica˛ pól pod wykresami funkcji

y = −x2 + 2x,
y = x2 .

Pole pod wykresem funkcji f na przedziale [a, b] określane jest mianem całki oznaczonej. Do policzenia całki oznaczonej z funkcji f na przedziale [a, b]
też możemy zastosować technik˛e przejścia granicznego. W tym celu dzielimy przedział [a, b] punktami a = x0 < x1 < x2 < . . . < xn = b na n
podprzedziałów, niekoniecznie równych, i nad każdym z nich budujemy prostokat˛ o wysokości równej wartości funkcji f w prawym końcu przedziału. Oznaczajac
˛
przez ∆xi := xi − xi−1 długość i-tego przedziału (i-ta˛ różnic˛e) i sumujac
˛ pola prostokatów
˛ otrzymujemy przybliżenie pola pod wykresem równe:
n
X
f (x1 )∆x1 + f (x2 )∆x2 + . . . f (xn )∆xn = f (xi )∆Xi . (1.6)
i=1

Biorac
˛ coraz wi˛ecej punktów i coraz krótsze przedziały, w granicy otrzymujemy poszukiwane pole. Oznaczamy je dość tajemniczym symbolem
Z b
f (x)dx,
a

w którym znak sumy przekształcił si˛e w wydłużona˛ liter˛e ’S’, a różnica ∆xi w "nieskończonie mała˛ różnic˛e", czyli różniczk˛e, oznaczona˛ symbolem dx.
1.5. POLA FIGUR I CAŁKOWANIE 33

Rysunek 1.14: Pole pod wykresem ćwiartki okręgu.

Przykładowy efekt takiego post˛epowania dla funkcji


p
y= 1 − x2

na przedziale [0, 1] przy n = 5 przedstawiono na rys. 1.14 .


Podobnie jak poprzednio naturalne jest oczekiwanie, że takie post˛epowanie w granicy da poszukiwane pole pod wykresem funkcji.
Ten sposób liczenia pól stosowano już w starożytności, choć zrozumienie przyczyn jego poprawności bardzo długo pozostawało mgliste. Proces przejścia
granicznego opisywano jako zastapienie
˛ skończonego podziału podziałem na nieskończona˛ ilość przedziałów o nieskończenie małej lecz dodatniej długości dx.
Ta tajemnicza liczba dx dawała po przemnożeniu przez wartość funkcji na tym przedziale kolejna˛ nieskończenie mała˛ lecz dodatnia˛ wartość f (x)dx. Dopiero
wysumowanie nieskończonej ilości tych nieskończenie małych wartości dawało poszukiwane pole. Opis ten oczywiście wyjaśnia zapis i nazw˛e całki (całkowita
suma, powstała przez wysumowanie wszystkich nieskończenie małych f (x)dx), ale w żadnym przypadku nie może być uznany za definicj˛e całki oznaczonej.
Dopiero niemiecki matematyk, Georg Friedrich Bernhard Riemann (rys. 1.15 ) podał jako pierwszy precyzyjna˛ definicj˛e całki oznaczonej oraz warunki, kiedy
ta definicja ma sens. Dziś wyrażenie (1.6) określa si˛e mianem sumy Riemanna.

1.5.2 Całka nieoznaczona


˛ że całka oznaczona z funkcji f jest dobrze zdefiniowana (do czego potrzebujemy sum Riemanna i granicy), możemy zdefiniować funkcj˛e
Zakładajac,
Z u
F (u) := f (x)dx,
0

dla której zachodzi wzór

Z b
f (x)dx = F (b) − F (a).
a
34 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

Rysunek 1.15: Georg Friedrich Bernhard Riemann, 1826-1866. Źródło: Wikipedia

Funkcja F spełniajaca
˛ powyższy wzór nosi nazw˛e całki nieoznaczonej funkcji f . Oznaczamy ja˛ (nieprecyzyjnie) symbolem
Z
f (x)dx

Jeśli potrafilibyśmy znaleźć analityczny sposób na znalezienie całki nieoznaczonej w oparciu o funkcj˛e f , liczenie pól znacznie ułatwiłoby si˛e. Żyjacy
˛ na
przełomie X i XI w. naukowiec arabski znany w Europie jako Alhacen potrafił pokazać (oczywiście w ówczesnym j˛ezyku matematyki), że jeśli f jest wielomianem
stopnia drugiego
f (x) := a0 + a1 x + a2 x2 ,

to jego całka˛ nieoznaczona˛ jest


a1 x2 a2 x3
F (x) := a0 x + + .
2 3
Alhacen potrafił też podać wzór na całk˛e nieoznaczona˛ dla wielomianów stopnia trzeciego i czwartego. Wykorzystujac
˛ ten wzór, możemy bardzo szybko
policzyć pole naszej soczewki z rys. 1.13 , bo przyjmujac
˛ wygodne oznaczenie

b
[F (u)]a := F (b) − F (u)

otrzymujemy

1
1
x3 1
Z 
x2 dx = =
0 3 0 3
1
1
2x2 2
Z  3
x
(−x2 + 2x)dx = − + = .
0 3 2 0 3

Płyna˛ z tego dwa ważne wnioski. Po pierwsze, granica skomplikowanego ciagu ˛ wcale nie musi być trudna˛ w wyliczeniu liczba˛ niewymierna.˛ Po drugie i
ważniejsze, poj˛ecie granicy może być pomocne nie tylko w obliczeniach liczb niewymiernych. Nie mniej, a może nawet wi˛ecej, przydaje si˛e ono do definiowania
nowych poj˛eć, trudnych do zdefiniowania inaczej.
1.6. STYCZNA DO KRZYWEJ I GRANICA FUNKCJI 35

Rysunek 1.16: Styczna do okręgu

1.6 Styczna do krzywej i granica funkcji


1.6.1 Styczna do krzywej
Problem wyznaczenia stycznej do krzywej w zadanym punkcie to też jeden z problemów rozwiazywanych ˛ już w starożytności przy wykorzystaniu przejścia gra-
nicznego. W uproszczeniu, styczna do krzywej w danym punkcie krzywej, to prosta przechodzaca ˛ przez zadany punkt, która w jego pobliżu nie przecina krzywej w
żadnym innym punkcie. Rys. 1.16 przedstawia styczna˛ do łuku okr˛egu.
Styczna˛ można wyznaczać geometrycznie, przykładajac ˛ do krzywej linijk˛e, ale nie jest to metoda dokładna. Lepiej jest wyliczyć kat˛ jaki styczna tworzy z prosta˛
pozioma,˛ albo tak zwany współczynnik nachylenia prostej, czyli tangens tego kata. ˛
Jeśli krzywa zadana jest funkcja˛ f , to współczynnik nachylenia stycznej w punkcie wykresu o współrz˛ednych (x0 , f (x0 )) można przybliżyć, analizujac ˛
sieczna˛ poprowadzona˛ z punktu (x0 , f (x0 )). Jest to prosta, która przecina krzywa˛ w punkcie (x0 , f (x0 )) oraz dodatkowo w punkcie (x1 , f (x1 )), gdzie
x1 = x0 + h jest bliskie x0 .
Rysujac ˛ stosowny trójkat˛ prostokatny ˛ jaki sieczna tworzy z osia˛ x wynosi
˛ (rys. 1.17 ), łatwo zauważyć, że tangens kata,

f (x1 ) − f (x0 ) f (x0 + h) − f (x0 )


= .
x1 − x0 h

Zmierzajac˛ z h do zera zbliżamy sieczna˛ do stycznej, a wi˛ec w granicy dostać powinniśmy współczynnik nachylenia stycznej. I rzeczywiście dostajemy, jeśli
tylko funkcja jest odpowiednio porzadna.
˛
Należy zwrócić uwag˛e, że mamy tu do czynienia z innego typu granica˛ niż rozważane do tej pory, bo nie rozważamy ciagu,
˛ lecz funkcj˛e

f (x0 + h) − f (x0 )
h 7→ (1.7)
h
zmiennej h (x0 traktujemy jako parametr). Jak definiuje si˛e granic˛e ciagu
˛ już mniej wi˛ecej wiemy. A jak si˛e to robi w przypadku granicy funkcji?

1.6.2 Granica funkcji


Chociaż poj˛eciem granicy funkcji operowano co najmniej od XVII w., to pierwsza˛ precyzyjna˛ definicj˛e postawił czeski matematyk Bernard Bolzano dopiero w 1817
roku, a używana˛ współcześnie definicj˛e podał niemiecki matematyk Karol Weierstrass (rys. 1.18 ).
36 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

Rysunek 1.17: Styczna i sieczna do krzywej.

Rysunek 1.18: Karol Weierstrass (1815-1897). Źródło: Wikipedia


1.6. STYCZNA DO KRZYWEJ I GRANICA FUNKCJI 37

Według Weierstrassa funkcja f ma w punkcie x0 granic˛e g jeżeli dla każdego ε > 0 istnieje δ > 0 takie, że dla wszystkich x 6= x0

|x − x0 | < δ ⇒ |f (x) − g| < ε.


Piszemy wtedy
lim f (x) = g.
x→x0

1.6.3 Funkcje ciągłe


Warto sobie od razu powiedzieć, że w przeciwieństwie do ciagów,
˛ typowa funkcja, z jaka˛ spotykamy si˛e na co dzień, jeśli jest określona w punkcie x0 , to ma w
nim granic˛e równa˛ swojej wartości w x0 . Może to robić wrażenie, że teoria granicy funkcji jest mniej użyteczna od granicy ciagu.
˛ Ale właśnie ten fakt, którego
bez poj˛ecia granicy funkcji nie da si˛e zaobserwować, jest interesujacy
˛ sam w sobie. Funkcje o tej własności określamy mianem ciagłych. ˛ Obrazowo mówimy, że
funkcja ciagła
˛ to taka funkcja, której wykres można narysować bez odrywania ołówka od papieru. Nie jest to do końca prawda,˛ bo dotyczy jedynie funkcji, których
dziedzina jest odcinkiem domkni˛etym.

1.6.4 Obliczanie granic.


Granica funkcji może być liczona w punkcie x0 , w którym funkcja jest nieokreślona, ale jest określona dla wartości różnych od x0 . Wtedy ciagłość
˛ funkcji w
punktach różnych od x0 nie wystarcza, by wyznaczyć granic˛e. Mimo to cz˛esto można ja˛ łatwo policzyć. Na przykład funkcja

2x + x2
f :x→
x
jest nieokreślona w zerze, ale określona dla wartości wi˛ekszych i mniejszych od zera. Dla wartości tych jest ona równa funkcji

x → 2 + x,
która jest ciagła
˛ i określona w zerze, a zatem ma w zerze granic˛e dwa. Zatem

lim f (x) = 2.
x→0

Przykład ten może wydawać si˛e sztuczny, ale docenimy jego wartość, gdy uświadomimy sobie, że dokładnie taka granica pojawia si˛e przy obliczaniu współczynnika
kierunkowego stycznej do wykresu funkcji x 7→ x2 w punkcie 1, bo zgodnie ze wzorem (1.7) jest to funkcja

(x0 + h)2 − x20 2h + h2


h 7→ = ,
h h
czyli funkcja f . Oczywiście nie wszystkie granice funkcji daja˛ si˛e tak łatwo policzyć. I tu, jak w przypadku ciagów,
˛ korzystamy z różnych twierdzeń. W szczególności
dla funkcji można udowodnić odpowiedniki twierdzenia o trzech ciagach ˛ oraz o granicy sumy, różnicy, iloczynu i ilorazu.

Problem 1.6.1 Jak uogólnić poj˛ecie granicy, tak by granica ciagu


˛ i funkcji wpadały "do jednego worka" i odpowiednie twierdzenia obejmowały tak ciagi
˛ jak
i funkcje? Jak dołaczyć
˛ do takiej definicji przypadek ciagu
˛ lub funkcji zmierzajacej
˛ do nieskończoności?

Oczywiście granica funkcji nie musi istnieć. Jest tak na przykład w przypadku funkcji (rys. 1.19 )
1
x 7→ sin ,
x
˛ dla wszystkich x z wyjatkiem
która jest określona i ciagła ˛ zera, ale w zerze nie ma granicy.
Z kolei funkcja
sin x
x 7→ ,
x
˛ dla wszystkich x z wyjatkiem
która też jest określona i ciagła ˛ zera, w zerze ma granic˛e wynoszac
˛ a˛ jeden, ale nie jest oczywiste jak to pokazać. Jednak z z wykresu
(rys. 1.20 ) widać, że należy si˛e tego spodziewać.
38 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

Rysunek 1.19: Wykres funkcji x 7→ sin x1 . Granica tej funkcji w zerze nie istnieje

Rysunek 1.20: Wykres funkcji x 7→ x .


sin x
Granica tej funkcji w zerze wynosi jeden.
1.7. POCHODNA FUNKCJI 39

Rysunek 1.21: Wybrane styczne do wykresu funkcji. Na czerwono zaznaczono styczne w miejscach gdzie wykres się wznosi,
na zielono gdzie opada, a na żółto miejsca gdzie styczna jest pozioma.

1.7 Pochodna funkcji


1.7.1 Lokalne maksima i minima
Współczynnik nachylenia stycznej do wykresu funkcji niesie w sobie informacje o samej funkcji. Tam gdzie ten współczynnik jest dodatni funkcja (umownie) rośnie,
a gdzie jest ujemny maleje. Zerowa wartość współczynnika nachylenia oznacza, że styczna jest pozioma. Może to świadczyć o lokalnej górce (lokalne maksimum)
lub lokalnym dołku (lokalne minimum). Pozioma styczna może też wystapić
˛ w miejcu, chwilowo przestaje rosnać ˛ badź
˛ maleć (rys. 1.21 ).

1.7.2 Pochodna funkcji


Dlatego dla danej funkcji f interesujace
˛ jest poszukiwanie miejsc zerowych nowej funkcji, która punktowi x przypisuje współczynnik nachylenia stycznej do
wykresu funkcji f w punkcie x. Funkcja taka nazywana jest pochodna˛ funkcji f i oznaczana f 0 . Wiemy, że współczynnik kierunkowy stycznej obliczamy jako
granic˛e przy h → 0 wyrażenia
f (x + h) − f (x)
h
zwanego ilorazem różnicowym. Zatem
f (x + h) − f (x)
f 0 (x) = lim (1.8)
h→0 h
oczywiście przy założeniu, że ta granica istnieje. Wprowadzajac
˛ oznaczenia na różnice

∆x := (x + h) − x = h
∆y := f (x + h) − f (x)

możemy iloraz różnicowy napisać w postaci


∆y
,
∆x
40 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ

co wyjaśnia jego nazw˛e. Używajac


˛ nieprecyzyjnego j˛ezyka nieskończenie małych można powiedzieć, że pochodna˛ funkcji otrzymujemy zast˛epujac
˛ w ilorazie róż-
nicowym róznice ∆y i ∆x nieskończenie małymi różnicami oznaczanymi dy i dx i zwanymi różniczkami. Wyjaśnia to używana˛ do dziś nazw˛e teorii pochodnych:
rachunek różniczkowy. Sama koncepcja różniczki doczekała si˛e precyzyjnej definicji i choć odbiega ona od pierwotnej idei, pozwala zapis

dy
f 0 (x) =
dx
uczynić precyzyjnym.
Jeśli potrafimy ze wzoru na funkcj˛e f wyprowadzić wzór na funkcj˛e f 0 oraz potrafimy znaleźć miejsca zerowe funkcji f 0 , to potrafimy wskazać miejsca
podejrzane o wyst˛epowanie lokalnych minimów i lub maksimów. Okazuje si˛e, że choć w definicji pochodnej wyst˛epuje granica, to w wielu przypadkach jest to
granica, która˛ możemy policzyć czysto analitycznie bez konieczności stosowania przybliżeń. Na przykład dla funkcji x 7→ f (x) := x2 − 4x + 5 mamy

(x + h)2 − 4(x + h) + 5 − (x2 − 4x + 5)


f 0 (x) = lim
h→0 h
= lim (2x + h − 4) = 2x − 4,
h→0

bo funkcja x 7→ 2x − 4 jest ciagła.


˛ Widać, że f 0 (2) = 0, zatem funkcja f , jeśli ma gdzieś minimu lokalne to w punkcie 2.

1.7.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego


Perski matematyk Sharaf al-Din al-Tusi już z końcem XII w. potrafił pokazać, że (używajac
˛ współczesnego j˛ezyka) pochodna˛ wielomianu trzeciego stopnia

Q(x) := b0 + b1 x + b2 x2 + b3 x3

jest
Q0 (x) = b1 + 2b2 x + 3b3 x2 .
Przypomnijmy, że około 200 lat wcześniej, Alhacen policzył, że całka˛ nieoznaczona˛

f (x) := a0 + a1 x + a2 x2 ,

jest
a1 x2 a2 x3
Z
F (x) = f (x)dx = a0 x + + .
2 3
Podstawiajac
˛

b1 = a0
2b2 = a1
3b3 = a2

możemy zaobserwować, że jest zwiazek


˛ mi˛edzy mi˛edzy liczeniem pochodnej i całkowaniem:
Z
Q0 (x)dx = b1 x + b2 x2 + b3 x3 = Q(x) − b0
Z 0
f (x)dx = F 0 (x) = f (x).

Zatem już w XII w. były podstawy do odkrycia tego zwiazku,


˛ ale udało si˛e to dopiero 500 lat później. Pod koniec XVII w. Anglik Isaac Newton oraz Niemiec
Gottfried Leibniz (rys. 1.22 ) pokazali nast˛epujace
˛ twierdzenie
1.7. POCHODNA FUNKCJI 41

Rysunek 1.22: Isaac Newton (1643 - 1727) i Gottfried Leibniz (1646 - 1716). Źródło: Wikipedia

Twierdzenie 1.7.1 Jeśli f jest pochodna˛ funkcji F , to F jest całka˛ nieoznaczona˛ funkcji f . Jeśli F jest całka˛ nieoznaczona˛ funkcji f , to pochodna˛ funkcji
F jest f .

Twierdzenie to jest dzisiaj określane mianem podstawowego twierdzenia rachunku różniczkowego i całkowego. Do czasu odkrycia tego twierdzenia teorie
pochodnej i całki rozwijane były niezależnie, przy czym w liczeniu pochodnych notowano wi˛eksze post˛epy niż w liczeniu całek. Odkrycie Newtona i Leibniza
pokazało, że w istocie jest jedna teoria, a każdy wzór na pochodna˛ jest równocześnie wzorem na całk˛e. Umożliwiło to liczenie wielu nowych całek, dało impuls do
intensywnego rozwoju rachunku różniczkowego i całkowego i przyczyniło si˛e do szybkiego rozwoju nauk technicznych.
42 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Część II

Granice

43
Rozdział 2

Liczby rzeczywiste i liczby zespolone

2.1 Ciało liczb rzeczywistych.


Jak przedstawiliśmy to w rozdziale wprowadzajacym,
˛ poj˛ecie liczby ewoluowało od liczby naturalnej, poprzez ułamki, liczby niewymierne, liczby całkowite aż po,
˛ liczby rzeczywiste mamy na myśli zbiór liczb pozwalajacy
mi˛edzy innymi, liczby urojone i zespolone. Mówiac ˛ w szczególności na mierzenie długości odcinków
˛ obj˛etości figur. Jak wiemy od czasów Pitagorasa, zbiór ułamków do tego nie wystarcza. Wyjaśnienia wymaga samo określenie liczby rzeczywiste.
czy pól badź
Pojawiło si˛e ono w XVII wieku w celu odróżnienia tych liczb od liczb urojonych i zespolonych, wymyślonych 100 lat wcześniej jako narz˛edzie do rozwiazywania
˛
równań algebraicznych.
Liczby rzeczywiste można zdefiniować poprzez podanie skończonego zbioru ich własności, które charakteryzuja˛ je jednoznacznie. Mówiac
˛ precyzyjniej, na
gruncie teorii mnogości można udowodnić, że zbiór o takich własnościach istnieje i jest przez te własności wyznaczony jednoznacznie.
Na poczatek
˛ podamy definicj˛e ciała liczbowego. Liczby rzeczywiste tworza˛ ciało, ale tworza˛ je również liczby wymierne, czy liczby zespolone. Sa˛ nawet ciała
b˛edace
˛ zbiorami skończonymi.

Definicja 2.1.1 Ciało liczbowe F to zbiór liczb z dwuargumentowymi działaniami + (dodawanie), · (mnożenie) i
wyróżnionymi liczbami 0 (zero) i 1 (jeden) taki, że
• dla dowolnego x ∈ F zachodzi x + 0 = x oraz x · 1 = x,
• dla dowolnego x ∈ F istnieje x0 ∈ F , zwyczajowo oznaczane −x, takie że x + x0 = 0,

• dla dowolnego x ∈ F \ {0} istnieje x00 ∈ F , zwyczajowo oznaczane x,


1
takie że x · x00 = 1,
• dla dowolnych x, y ∈ F zachodzi x + y = y + x oraz x · y = y · x,
• dla dowolnych x, y, z ∈ F zachodą równości

(x + y) + z = x + (y + z)
(x · y) · z = x · (y · z)
(x + y) · z = x · z + y · z

Główna˛ cecha˛ odróżniajac


˛ a˛ ciało liczb rzeczywistych od ciała liczb zespolonych jest to, że liczy rzeczywiste w przeciwieństwie do liczb zespolonych daje si˛e
sensownie (w zgodzie z działaniami) porównywać. Innymi słowy ciało liczb rzeczywistych jest ciałem uporzadkowanym
˛ w sensie poniższej definicji.

45
46 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Definicja 2.1.2 Ciało liczbowe uporządkowane to ciało liczbowe F dodatkowo z dwuargumentową relacją ¬ (mniejsze
lub równe) taką, że dla dowolnych x, y, z ∈ F zachodzą następujące własności
• (zwrotność) x ¬ x,

• (antysymetria) jeśli x ¬ y oraz y ¬ x to x = y,


• (przechodniość) jeśli x ¬ y oraz y ¬ z to x ¬ z,
• (spójność) albo x ¬ y albo y ¬ x,
• (monotoniczność względem mnożenia) jeśli 0 ¬ x oraz 0 ¬ y to 0 ¬ x · y,

• (monotoniczność względem dodawania) nierówność x ¬ y implikuje nierówność x + z ¬ y + z.

Piszemy x < y gdy x ¬ y oraz x 6= y. Dla wygody wprowadzamy też oznaczenie x ­ y równoważne y ¬ x oraz x > y
równoważne y < x.
Ciało liczbowe uporzadkowane
˛ ciagle
˛ nie musi być ciałem liczb rzeczywistych, bo również liczby wymierne (ułamki ze znakiem) tworza˛ takie ciało. To, czym
ciało
√ liczb rzeczywistych wyróżnia si˛
e od innych ciał jest fakt, że nie ma w nim dziur, takich jak na przykład dziura w zbiorze liczb wymiernych spowodowana faktem,
że 2 nie jest liczba˛ wymierna.˛ Postulat braku dziur formalizuje si˛e poprzez wprowadzenie poj˛ecia kresu górnego zbioru.
Mówimy, że b ∈ F jest majorantą zbioru A ⊂ F jeśli dla każdego x ∈ A mamy x ¬ b. Mówimy, że zbiór A ⊂ F jest
ograniczony od góry, jeśli ma majorantę. Mówimy, że a ∈ F jest kresem górnym zbioru A i piszemy a = sup A jeżeli a jest
najmniejszą majorantą zbioru A. Innymi słowy dla każdej majoranty a0 zbioru A zachodzi nierówność a ¬ a0 . Analogicznie
definiujemy minorantę, zbiór ograniczony od dołu i kres dolny, który oznaczamy inf A. Warto zauważyć, że poj˛ecie majoranty
i kresu górnego zbioru definiuje si˛e nie tylko dla ciał uporzadkowanych.
˛ Wystarczy przestrzeń z zadanym cz˛eściowym porzadkiem,
˛ a wi˛ec relacja˛ zwrotna,˛
antysymetryczna˛ i przechodnia.˛ Szczególna sytuacja zachodzi dla porzadków˛ liniowych, a wi˛ec porzadków,
˛ które maja˛ dodatkowo własność spójności. Można
wtedy pokazać, że a jest kresem górnym zbioru A jeśli a jest majoranta˛ zbioru A i zbiór A nie posiada majoranty mniejszej. Ta równoważna definicja może być
w szczególności stosowana w ciałach uporzadkowanych,
˛ których porzadek
˛ zawsze jest spójny, a wi˛ec liniowy.
Możemy wreszcze podać definicj˛e ciała liczb rzeczywistych. Warto od razu dodać, że w przeciwieństwie do ciała liczbowego i ciała liczbowego uporzadkowa-
˛
nego ciało liczb rzeczywistych jest dokładnie jedno, a jego konstrukcj˛e można uzyskać z aksjomatów teorii mnogości.

Definicja 2.1.3 Ciało liczb rzeczywistych R to ciało liczbowe uporządkowane o tej własności, że każdy niepusty
ograniczony od góry podzbiór X ⊂ R posiada kres górny.

Warto pami˛etać, że istnienie kresu górnego zbiorów ograniczonych od góry (jak również kresu dolnego zbiorów ograniczonych od dołu) to jedyna, ale kluczowa
własność, która odróżnia zbiór liczb rzeczywistych od zbioru liczb wymiernych. Oczywiście w zbiorze liczb wymiernych sa˛ zbiory ograniczone od góry, które maja˛
kres górny, ale sa˛ też takie, które tego kresu nie maja.˛ Udowodnienie, że rozszerzenie zbioru liczb wymiernych do zbioru liczb rzeczywistych istnieje, a wi˛ec jest
sensowne, zazwyczaj oddelegowane jest do kursu teorii mnogości. Istnienie kresu górnego pozwala w szczególności na zdefiniowanie pierwiastków (tw. 2.2.5 )
oraz liczby e (tw. 2.6.1 ).
Szczególną sytuację mamy, gdy zbiór A jest skończony, na przykład A = {a1 , a2 , . . . ak }. Wtedy kres górny i kres dolny za-
wsze (nawet w ciele liczb wymiernych) istnieją i pokrywają się odpowiednio z największym i najmniejszym elementem zbioru
A. W takim przypadku stosujemy zwyczajowo oznaczenia max A oraz min A. Często stosujemy też oznaczenia skrótowe

min ai := min{a1 , a2 , . . . ak } (2.1)


i=1,2,...,k
max ai := max{a1 , a2 , . . . ak } (2.2)
i=1,2,...,k

2.1.1 Podzbiory R
Przyj˛eliśmy abstrakcyjna˛ definicj˛e zbioru R liczb rzeczywistych. Intuicyjnie oczekujemy, że w zbiorze tym znajda˛ si˛e w szczególności liczby naturalne, całkowie
oraz wymierne (ułamki). Ale trzeba je jakoś zlokalizować. Nie jest to trudne. Ponieważ z naszej formalnej definicji zbioru liczb rzeczywistych R w szczególności
2.1. CIAŁO LICZB RZECZYWISTYCH. 47

Rysunek 2.1: Prosta jako oś liczbowa.

wiemy, że jest tam liczba 0 i liczba 1 o których zakładamy, że maja˛ takie własności jak intuicyjnie rozumiane zero oraz jeden, wystarczy si˛e nimi posłużyć, by krok
po kroku odtworzyć zbiór liczb naturalnych, a potem całkowitych i wymiernych,
Zbiór liczb naturalnych N definiujemy wzorem
n razy
z }| {
N := { x ∈ R | x = 0 lub x = 1 + 1 + . . . + 1 }

gdzie n jest tradycyjnie rozumianą liczbą naturalną.


W powyższej definicji przyj˛eliśmy, że zero jest liczba˛ naturalna.˛ To dla wygody. Problem czy zero jest liczba˛ naturalna,˛ czy nie, leży w sferze filozofii, a nie
matematyki. Wygoda bierze sie stad, ˛ że cz˛eściej potrzebny jest nam zbiór liczb naturalnych z zerem niż bez zera. Ale tam, gdzie rzeczywiście zero trzeba odrzucić,
użyjemy oznaczenia N1 , zgodnie z definicja˛ poniżej. Dla p ∈ N przyjmujemy oznaczenie

Np := { n ∈ N | n ­ p }.

W szczególności N0 = N, a N1 to zbiór liczb naturalnych rozumiany bardziej konserwatywnie, a więc bez zera.
Zbiór liczb całkowitych Z definiujemy wzorem

Z := { x ∈ R | x ∈ N lub − x ∈ N }.

Zbiór liczb wymiernych Q definiujemy wzorem

Q := { x ∈ R | ∃p ∈ Z ∃q ∈ N1 x = p · q −1 }.

Wprowadzamy oznaczenia

R+ := { x ∈ R | x > 0 },

R := { x ∈ R | x < 0 },

R := { x ∈ R | x ­ 0 }.

2.1.2 Geometryczna interpretacja zbioru liczb rzeczywistych


Zbiór liczb rzeczywistych można utożsamiać ze zbiorem punktów na nieskończonej prostej poprzez przypisanie punktom prostej liczb rzeczywistych, tak zwanych
współrz˛ednych. Najpierw wybieramy jeden punkt, nazwijmy go O , i przypisujemy mu współrz˛edna˛ zero. Punkt ten nazywamy poczatkiem ˛ układu współrz˛ednych.
Nast˛epnie wybieramy inny punkt, nazwijmy go A, i przypisujemy mu współrz˛edna˛ jeden. Punkt ten nazywamy punktem jednostkowym. Dla dowolnego innego
punktu X jego współrz˛edna˛ wyznaczamy obliczamy dzielac ˛ długość odcinka OX przez długość odcinka OA i przypisujac ˛ wynikowi znak plus, jeśli punkt X
leży po tej samej stronie punktu O co punkt A, a znak minus jeśli leży po stronie przeciwnej. Tak opisana˛ prosta˛ określamy mianem osi liczbowej. Przykładowa˛
oś przedstawiono na rysunku 2.1

2.1.3 Liczby reprezentowalne


48 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Rysunek 2.2: 32-bitowe słowo (4 bajty) używane do reprezentacji liczb typu int.

Rysunek 2.3: 64-bitowe słowo (8 bajtów) używane do reprezentacji liczb typu double.

W pamięci komputera możemy reprezentować jedynie pewien skończony podzbiór zbioru liczb. Używane są różne podzbiory.
W przypadku liczb, na których operuje procesor są to pewne podzbiory zbioru liczb całkowitych oraz pewne podzbiory
zbioru liczb wymiernych, najczęściej liczby całkowite typu int oraz wymierne typu double.
Do reprezentacji liczb typu int używa się zazwyczaj 32 cyfr dwójkowych, czyli inaczej bitów (rys. 2.2 ). Sama liczba
zapisana jest przy pomocy 31 bitów, a 32-gi bit używany jest do zapisania znaku. Pozwala to na zapisywanie liczb całkowitych
z zakresu −2147483648 do +2147483647.
Liczby typu double przechowywane są zazwyczaj na 64 bitach, z czego jeden bit reprezentuje znak s, 11 bitów cechę N ,
a pozostałe 52 mantysę m będącą ułamkiem o mianowniku 252 z przedziału [1, 2) (rys. 2.3 ). Umożliwa to zapisywanie liczb
w postaci
x = sm2N ,
a także, przy pomocy specjalnego kodu, liczby zero. Wykorzystanie cechy i mantysy pozwala na przybliżanie liczb o bardzo
dużym zakresie, od bardzo małych, rzędu 10−323 , do bardzo dużych, rzędu 10308 , przy zachowaniu w miarę stałej dokładności,
wynoszącej około 15 cyfr znaczących.
Większość języków programowania zadowala się takim systemem liczb reprezentowalnych jaki jest dostępny na poziomie
procesora. Tak jest na przykład w języku C++. Takie podejście jest wystarczające do większości zastosowań. Jeśli jednak
z jakiegoś powodu zachodzi potrzeba stosowania większej dokładności w obliczeniach, zawsze można skorzystać z biblioteki
udostępniającej liczby reprezentowalne reprezentowane na dowolnej ilości bitów, ograniczonej nie wielkością słowa maszy-
nowego ale jedynie całkowitą ilością wolnej pamięci. Jedyne co przy takim rozwiązaniu tracimy to czas obliczeń, który jest
istotnie wolniejszy niż w przypadku obliczeń wykonywanych na pojedynczych słowach maszynowych.
Specjalizowane programy do matematyki obliczeniowej, takie jak Mathematica mają tego typu biblioteki wbudowane.
Na przykład, aby pomnożyć przez siebie dwie liczby 25-cyfrowe wystarczy napisać
1234567890123456789012345∗1234567890123456789012345.

Natychmiast otrzymujemy wynik

1524157875323883675049533479957338669120562399025

Pisząc
2^200
2.1. CIAŁO LICZB RZECZYWISTYCH. 49

otrzymujemy
1606938044258990275541962092341162602522202993782792835301376
Możliwa jest też zamiana ułamka na liczbę dziesiętną o dowolnie wysokiej dokładności. Na przykład pisząc
N[ 1 / 2 3 , 5 0 ]
otrzymujemy przybliżenie ułamka 1
23

0.043478260869565217391304347826086956521739130434783

z dokładnością do 50 cyfr.
Tam gdzie liczy się prędkość obliczeń (na przykład, gdy musimy policzyć nie jeden pierwiastek, ale miliony pierwiastków
jako część innego zadania) zamiast języków interpretowanych, takich jak Mathematica, używamy języków kompilowanych.
Współcześnie wszędzie tam, gdzie kluczowa jest szybkość obliczeń prym wiedzie język C++, choć na przykład fizycy preferują
jeszcze szybszy, ale nieco już sędziwy język Fortran. Najszybszy kod można uzyskać stosując bezpośrednio język maszynowy,
ale pisanie w nim programów jest wyjątkowo żmudne.
Listingi 2.1 i 2.2 prezentują nasz algorytm liczenia pierwiastka metodą brutalnej siły napisany w języku C++. Działa
on z dokładnością do 10−4 . Większej dokładności w oparciu o użyty w nim standardowy typ całkowitoliczbowy int nie da
się uzyskać, bo dla n >= 100000 wyrażnie p ∗ n ∗ n nie może być policzone poprawnie gdy reprezentowane jest jako typ int.
Odpowiednik programu z listingu 2.4 napisany w języku C++ przedstawono na listingu 2.3 .

2.1.4 Zasada indukcji


Z aksjomatów teorii mmogości wyprowadza się następujące twierdzenie, zwane zasadą indukcji.

Twierdzenie 2.1.4 (Zasada indukcji) Aby pokazać, że pewna własność ϕ(n) zachodzi dla wszystkich liczb naturalnych
od liczby p ∈ N poczynając wystarczy udowodnić, że
1. zachodzi własność ϕ(p),
2. jeśli dla pewnego k ­ p zachodzi własność ϕ(k), to zachodzi również własność ϕ(k + 1).

Zasada indukcji jest bardzo wygodnym i szeroko stosowanym sposobem dowodzenia własności, które zależą od liczb
naturalnych.

2.1.5 Wzory skróconego mnożenia


Niniejsze wzory obowiązujące w każdym ciele będą nam wielokrotnie pomocne. Ich dowód pomijamy.

Twierdzenie 2.1.5 Niech (F, +, ·, 0, 1) będzie ciałem, a, b ∈ F oraz n ∈ N1 . Wtedy

bn − an = (b − a) an−1 + an−2 b + an−3 b2 + · · · + bn−1 , (2.3)




n! n n! n! n! n
(a + b)n = a + an−1 b + an−2 b2 + · · · + b , (2.4)
0!n! 1!(n − 1)! 2!(n − 2)! n!0!

gdzie 0! = 1, oraz k! := 1 · 2 · 3 · · · k dla k > 0.

Wykorzystując symbol Newtona nk := k!(n−k! n!


, wzór (2.4) można też zapisać w postaci


       
n n n n−1 n n−2 2 n n
(a + b) = n
a + a b+ a b + ··· + b .
0 1 2 n
50 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtTwoBf . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ Obliczanie przybli ż enia pierwiastka z 2 ∗/
/∗ metod a̧ b r u t a l n e j s i ł y ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗/

/∗ Tu wł a̧czamy standardow a̧ b i b l i o t e k ȩ wej s c i a wyj s c i a ∗/


#include <i o s t r e a m >
/∗ I podpinamy tak zwan a̧ standardow a̧ p r z e s t r z e ń nazw .
Bez t e g o nazwy t a k i e j a k c o u t p o n i ż e j m u s i e l i b y smy
p i s a ć j a k o s t d : : c o u t ∗/
using namespace s t d ;

/∗ Wł a s ciwy pocz a̧ t e k programu .


Program g ł ówny w C++ ma zawsze nazw ȩ main .
Pomi ȩ dzy nawiasami ( i ) moż e by ć l i s t a ewentualnych
argument ów ( danych wej s ciowych ) . W naszym przypadku
j e s t ona p u s t a . S ł owo i n t p r z e d main o z n a c z a typ
z w r a c a n e j warto s c i , kt ó ry musi tu by ć , a l e nas
n i e i n t e r e s u j e . Sam program mie s c i s i ȩ pomi ȩ dzy
nawiasami { i } ∗/
i n t main ( ) {

/∗ Deklarujemy i i n i c j a l i z u j e m y t r z y zmienne typu i n t ∗/


i n t a =2,n=10000 , i=n ;

/∗ Jak d ł ugo s p e ł niony j e s t warunek zwi ȩ kszamy zmienn a̧ i .


Taka k o n s t r u k c j a nazywana j e s t p ȩ t l a̧ w h i l e .
W t e j p ȩ t l i wykonywana j e s t t y l k o j e d n a i n s t r u k c j a ,
zwi ȩ k s z e n i a z m i e n n e j i o j e d e n . Znak = n i e pe ł n i tu
r o l i por ó wnania ( wtedy d o s t a l i b y smy s p r z e c z n o sć 0=1)
t y l k o p r z y p i s a n i a : zawarto sć i z a s t a̧p p r z e z i +1 ∗/
while ( i ∗ i<=a ∗n∗n ) i=i +1;

/∗ O s t a t n i a dobra warto sć z m i e n n e j i
by ł a m n i e j s z a o j e d e n . Poprawiamy ∗/
i=i −1;

/∗ Wyprowadzamy zmienn a̧ i , t e k s t " / " , zmienn a̧ n


o r a z znak nowej l i n i i na standardowe wyj s c i e ∗/
c o u t << i << "/" << n << e n d l ;
/∗ Koniec programu ∗/
}
 
Listing 2.1: Obliczanie pierwiastka metodą brutalnej siły w C++
2.1. CIAŁO LICZB RZECZYWISTYCH. 51
 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ S q r t B f P l u s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ U s p r a w n i e n i e programu SqrtTwoBf . cpp ∗/
/∗ Zamiast za c zy n a ć d o b i e r a n i e warto s c i z m i e n n e j i ∗/
/∗ od 1 , zaczynamy od p o p r z e d n i e j z n a l e z i o n e j ∗/
/∗ warto s c i . Implementacja w y k o r z y s t u j e typ d o u b l e ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗/
#include <i o s t r e a m >
/∗ Wł a̧ c z e n i e dodatkowej b i b l i o t e k i z a w i e r a j a̧ c e j
m. i n . s e t p r e c i s i o n wyja s n i o n e d a l e j ∗/
#include <iomanip>
#include <cmath>
using namespace s t d ;
/∗ Podprogram o b l i c z a j a̧ cy p i e r w i a s t e k z l i c z b y a .
Przyjmuje on warto sć j a k o argument typu d o u b l e .
Warto sć zwracana j e s t t e ż typu d o u b l e ∗/
double S q r t B f P l u s ( double a ) {
/∗ Ustawiamy p r e c y z j ȩ na 14 c y f r ∗/
// d o u b l e p = 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 . 0 ;
double p = 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 . 0 ;
/∗ Deklarujemy dwie zmienne l o k a l n e typu
z m i e n n o p o z y c y j n e g o ∗/
double n=1 , i =1;
/∗ Pȩ t l ȩ przerwiemy i n s t r u k c j a̧ break p o n i ż e j ∗/
while ( true ) {
/∗ Dopó k i kwadrat z i /n n i e p r z e k r a c z a a
zwi ȩ kszamy i ∗/
while ( i ∗ i<=a ∗n∗n ) i=i +1;
/∗ O s t a t n i e dobre i b y l o m n i e j s z e o j e d e n ∗/
i=i −1;
/∗ i /n j e s t naszym kolejnym
p r z y b l i ż eniem p i e r w i a s t k a ∗/
c o u t << i /n << e n d l ;
i f ( n>=p ) break ; /∗ Gdy o s i a̧ gniemy ż a̧dan a̧ p r e c y z j ȩ
przerywamy p ȩ t l ȩ ∗/
n=n ∗ 1 0 ; /∗ Zwi ȩ kszamy n 10− k r o t n i e ∗/
i=i ∗ 1 0 ; /∗ Zwi ȩ kszamy i 10− k r o t n i e ∗/
} /∗ Koniec bloku w h i l e . Zawracamy ∗/
return i /n ; /∗ Zwracamy wynik ∗/
} /∗ Koniec podprogramu ∗/
/∗ Program g ł ówny ∗/
i n t main ( ) {
/∗ Ustalamy dok ł adno sć wynik ów na 15 c y f r ∗/
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double a ;
c o u t << " Podaj liczbe naturalna : " ;
/∗ Wprowadzamy warto sć z m i e n n e j a z k l a w i a t u r y ∗/
c i n >> a ;
/∗ Uruchamiamy podprogram ∗/
c o u t << " Obliczony pierwiastek z " << a << " wynosi "
<< S q r t B f P l u s ( a ) << "\n" ;
c o u t << " Oczekiwany pierwiastek z " << a << " wynosi "
<< s q r t ( a ) << "\n" ;
} /∗ Koniec programu ∗/
 
Listing 2.2: Usprawnione podejście do obliczania pierwiastka w C++
52 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtBfQuick . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ S z y b k i s p o s ób l i c z e n i a p i e r w i a s t k a ∗/
/∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <iomanip>
using namespace s t d ;

/∗ Podprogram o b l i c z a j a̧ cy warto sć b e z w z g l ȩ dn a̧ ∗/
double abs ( double x ) {
i f ( x>=0) return x ;
e l s e return −x ;
}
/∗ Podprogram o b l i c z a j a̧ cy p i e r w i a s t e k z l i c z b y a ∗/
double SqrtBfQuick ( double a ) {
double x=a ;
/∗ Dopó k i warto sć b e z w z g l ȩ dna r ó ż n i c y kwadratu p r z e k r a c z a 10
w pot ȩ dze −15 z a p i s a n e w p o s t a c i wyk ł a d n i c z e j j a k o 1 e −15 ∗/
while ( abs ( x∗x−a)>1e −15){
x=(x∗x+a ) / ( 2 ∗ x ) ;
c o u t << x << e n d l ;
}
return x ;
}
/∗ Pocz a̧ t e k g ł ównego programu ∗/
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double a ;
c o u t << " Podaj liczbe dodatnia : " ;
c i n >> a ;
c o u t << " Pierwiastek z " << a << " wynosi " << SqrtBfQuick ( a ) << "\n" ;
}
 
Listing 2.3: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w C++.

 
( ∗ S z y b k i e o b l i c z a n i e p i e r w i a s t k a z l i c z b y a z d o k l a d n o s c i a do e p s i l o n ∗ )
SqrtQuick [ a_ , d_ ] := Module [ { x , e p s } ,
e p s = 10^(−d ) ; ( ∗ ż a̧ dana dok ł adno sć ∗ )
x = 1 ; ( ∗ warto sć pocz a̧ tkowa c i a̧gu r e k u r e n c y j n e g o ∗ )
While [ Abs [ x∗x − a ] / 2 > eps , ( ∗ j e s l i n i e o s i a̧ g n i ȩ t o ż a̧ d a n e j dok ł adno s c i ∗ )
x = ( x∗x + a ) / ( 2 ∗ x ) ; ( ∗ nowa warto sć c i a̧ gu r e k u r e n c y j n e g o ∗ )
Print [N[ { x − ( x∗x − a ) / 2 , x } , d + 1 ] ] ( ∗ wydruk k o n t r o l n y ∗ )
];
{x − ( x∗x − a ) / 2 , x} ( ∗ końcowy wynik ∗ )
]
 
Listing 2.4: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w języku Mathematica.
2.1. CIAŁO LICZB RZECZYWISTYCH. 53

2.1.6 Funkcja potęgowa w R


n razy
Dla n ∈ N1 i x ∈ R przyjmujemy oznaczenie xn := x · x · · · · · x. Liczbę xn nazywamy n-tą potęgą liczby x.
z }| {
Wzór
am
= am−n
an
am
prawdziwy dla m > n > 0 podpowiada (gdyby chcieć go rozszerzyć na przypadek m = n > 0), że wygodnie jest przyjać
˛ a0 = 1, bo 1 = am =
a m−m
= a . Trzeba jednak odrzucić przypadek a = 0, bo wtedy mamy dzielenie przez zero, które nie ma sensu.
0

Ponadto dla a ∈ R \ {0} przyjmujemy oznaczenie a0 := 1.


Przyporządkowując liczbie x liczbę xn otrzymujemy funkcję
R 3 x 7→ xn ∈ R.
Nazywamy ją funkcją potęgową.

Uwaga 2.1.6 Dla dowolnych x, y, z ∈ R zachodzą własności


(i) x2 ­ 0,
(ii) x2 = 0 ⇔ x = 0,

(iii) x > 0, y < z ⇒ xy < xz,


(iv) x < 0, y < z ⇒ xy > xz,
(v) x > 0 ⇒ x−1 > 0.

Dowód: ćwiczenie.
Przypomnijmy, że funkcja f : R → R jest silnie rosnąca jeżeli dla dowolnych x, x0 ∈ R zachodzi implikacja
x < x0 ⇒ f (x) < f (x0 ),
a słabo rosnąca lub krótko rosnąca jeżeli dla dowolnych x, x0 ∈ R zachodzi implikacja
x < x0 ⇒ f (x) ¬ f (x0 ),
Odwracając w tej definicji znak nierówności przy wartościach funkcji dostajemy definicję funkcji silnie malejącej i słabo
malejącej. Analogiczne definicje stawiamy dla ciągów o wartościach w R.
Twierdzenie 2.1.7 Funkcja potęgowa na zbiorze R∗ jest silnie rosnąca.
Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 teza pokrywa się z założeniem, więc implikacja jest
oczywiście prawdziwa. Załóżmy zatem, że dla pewnego k ∈ N mamy
∀x, y ∈ R∗ x < y ⇒ xk < y k . (2.5)
Chcemy pokazać, że
∀x, y ∈ R∗ x < y ⇒ xk+1 < y k+1 . (2.6)
Rozważmy więc x, y ∈ R takie, że x < y. Z założenia indukcyjnego (2.5) wnosimy, że x < y . Stosując dwukrotnie własność
k k

(iii) uwagi 2.1.6 dostajemy


xk+1 = xk x < y k x < y k y = y k+1 .
Zatem xk+1 < y k+1 co dowodzi, że implikacja (2.6) zachodzi. Zatem na mocy zasady indukcji twierdzenie zostało udowod-
nione. 
54 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

2.1.7 Nierówność Bernoullego


1 n
˛ o wyrazach 1 +

Poniższa nierówność przyda si˛e nam w dowodzie twierdzenia 2.6.1 , o zbieżności ciagu n . Jej autorem jest słynny matematyk szwajcarski
Jacob Bernoulli (rys. 2.6 ).

Twierdzenie 2.1.8
∀n ∈ N1 ∀x ∈ R : x > −1 ⇒ (1 + x)n ­ 1 + nx

Dowód: (*) Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 nierówność jest oczywista. Załóżmy, że zachodzi
ona dla pewnego k ∈ N i wszystkich x > −1. Ustalmy y > −1. Na mocy założenia

(1 + y)k ­ 1 + ky. (2.7)

Ponieważ y + 1 > 0, więc mnożąc nierówność (2.7) obustronnie przez y + 1 dostajemy

(1 + y)k+1 ­ (1 + ky)(1 + y) = 1 + (k + 1)y + ky 2 ­ 1 + (k + 1)y,

co dowodzi, że teza zachodzi dla n = k + 1 i kończy dowód indukcyjny. 

2.1.8 Wartość bezwzględna


Jak już wspomnieliśmy w rozdziale 1.1.5 liczby rzeczywiste potrzebne nam sa˛ w szczególności po to, by bez ograniczeń móc mierzyć długość odcinków i krzywych,
na przykład długość przekatnej
˛ kwadratu czy obwód koła. W szczególności potrzebne sa˛ też do mierzenia odległości, bo odległość pomi˛edzy punktami A i B to
długość łacz
˛ acego
˛ te punkty odcinka AB . Prostym lecz ważnym przypadkiem jest policzenie odległości punktów na osi liczbowej w oparciu o ich współrz˛edne.
Jeśli współrz˛edna˛ punktu A jest x, a współrz˛edna˛ punktu B jest y , to odległość pomi˛edzy punktami A i B jest różnica˛ y − x gdy y > x, a różnica˛ x − y gdy
y < x. By wyrazić to zwi˛eźle potrzebujemy poj˛ecia wartości bezwzgl˛ednej.

Definicja 2.1.9 Dla x ∈ R definiujemy wartość bezwzględną x jako


(
x gdy x ­ 0,
|x| :=
−x gdy x < 0.

Możemy zatem powiedzieć, że odległość punktu na osi liczbowej o współrz˛ednej x od punktu o współrz˛ednej y to |x − y|.

Twierdzenie 2.1.10 Niech x, y, a ∈ R. Wtedy

|x| = | − x|, |x| ­ 0, −|x| ¬ x ¬ |x|, (2.8)


|x| = 0 ⇔ x = 0, (2.9)
|x| ¬ a ⇔ −a ¬ x ¬ a, |x| ­ a ⇔ x ¬ −a lub x ­ a, (2.10)
| |x| − |y| | ¬ |x ± y| ¬ |x| + |y|, (2.11)

|xy| = |x||y|, x2 = |x|. (2.12)

Dowód: [•] Własności (2.8), (2.9), (2.10) i (2.12) są oczywiste gdy rozważy się oddzielnie przypadki x ­ 0 i x < 0. Aby
pokazać (2.11) najpierw udowodnimy, że dla dowolnych x, y ∈ R mamy

|x + y| ¬ |x| + |y|. (2.13)

Z własności (2.8) mamy


−|x| ¬ x ¬ |x| i − |y| ¬ y ¬ |y|.
2.2. TWIERDZENIE O ISTNIENIU PIERWIASTKA. 55

Z własności ciała uporządkowanego mamy zatem

−(|x| + |y|) ¬ x + y ¬ |x| + |y|.

Zatem z (2.10) dostajemy (2.13). Ponieważ (2.13) zachodzi dla dowolnych x, y ∈ R, więc w szczególności możemy podstawić
w (2.13) x − y za x. W efekcie dostajemy

|x| = |(x − y) + y| ¬ |x − y| + |y|.

Podobnie otrzymujemy
|y| ¬ |y − x| + |x|,

skąd wnosimy, że
|x| − |y| ¬ |x − y| i |y| − |x| ¬ |y − x| = |x − y|.

Zatem z (2.10) dostajemy


| |x| − |y| | ¬ |x − y|,

a także
| |x| − |y| | = | |x| − | − y| | ¬ |x − (−y)| = |x + y|,

co kończy dowód własności (2.11). 

2.2 Twierdzenie o istnieniu pierwiastka.


Naszym celem√w tym rozdziale jest udowodnienie, że w zbiorze liczb rzeczywistych dodatnich pierwiaski istnieja.˛ W szczególności ostatecznie zamkniemy spraw˛e
sensowności 2. Nim jednak twierdzenie to udowodnimy potrzebujemy dwa pomocniczne twierdzenia: własność Archimedesa oraz g˛estość Q w R.

2.2.1 Własność Archimedesa

Twierdzenie 2.2.1 Ciało liczb rzeczywistych ma własność Archimedesa, tzn.

∀a, b ∈ R+ ∃n ∈ N na > b.

Dowód: (*) Dowód poprowadzimy nie wprost. Załóżmy zatem, że istnieją liczby rzeczywiste dodatnie a, b takie, że
dla każdej liczby naturalnej n zachodzi na ¬ b. Oznacza to, że b jest majorantą zbioru

A := { x ∈ R | ∃n ∈ N x = na }.

Niech c := sup A będzie jego kresem górnym. Ponieważ c − a < c, więc c − a nie jest majorantą zbioru A. Zatem znajdziemy
n0 ∈ N takie, że n0 a > c − a. Ale wtedy (n0 + 1)a > c, a w konsekwencji c nie jest majorantą A, a tym bardziej kresem
górnym zbioru A. Otrzymana sprzeczność dowodzi twierdzenia. 

Wniosek 2.2.2 Ciało liczb wymiernych ma własność Archimedesa.

Dowód: ćwiczenie.
56 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

2.2.2 Gęstość zbioru w zbiorze

Definicja 2.2.3 Niech X będzie przestrzenią liniowo uporządkowaną, a A niech będzie podzbiorem X. Mówimy, że
A jest gęsty w X jeżeli
∀x, y ∈ X x < y ⇒ ∃z ∈ A x < z < y.
Gdy A = X, mówimy, że A jest gęsty w sobie.

Twierdzenie 2.2.4 Zbiór liczb wymiernych jest gęsty w zbiorze liczb rzeczywistych.

Dowód: [•] Niech x, y ∈ R będą takie, że x < y. Możliwe są trzy przypadki

x < 0 < y lub 0 ¬ x < y lub x < y ¬ 0.

W pierwszym przypadku teza jest oczywista, bo zero jest liczbą wymierną. Rozważmy drugi przypadek. Niech a := y −x > 0.
Z własności Archimedesa znajdziemy liczbę naturalną n taką, że na > 1. Wtedy n1 < a. Również z własności Archimedesa
wnosimy, że zbiór
A := { k ∈ N | k n1 > x }
jest niepusty. Niech m := min A. Wtedy m − 1 6∈ A. W szczególności m−1
n ¬ x oraz

m m−1 1 1
= + ¬ x + < x + a = y.
n n n n
Zatem x < m n < y, a ponieważ oczywiście n ∈ Q, teza w tym przypadku zachodzi. Pozostaje rozważyć trzeci przypadek.
m

Wtedy 0 ¬ −y < −x, zatem z rozważonego już przypadku znajdziemy z ∈ Q takie, że −y < z < −x. Ale wtedy x < −z < y
i oczywiście −z ∈ Q co kończy dowód twierdzenia. 

2.2.3 Pierwiastki
Teraz możemy już udowodnić twierdzenie o istnieniu n-tego pierwiastka

Twierdzenie 2.2.5 (o istnieniu n-tego pierwiastka) Dla każdej liczby naturalnej n > 1 i dla każdej nieujemnej liczby
rzeczywistej x istnieje dokładnie jedna nieujemna liczba rzeczywista y taka, że y n = x.

Dowód: (*)Pokażemy najpierw, że pierwiastek istnieje co najwyżej jeden. Dla dowodu nie wprost, przyjmijmy, że
istnieją y1 , y2 ∈ R∗ takie, że y1 6= y2 oraz y1n = y2n . Dla ustalenia uwagi możemy przyjąć, że y1 < y2 (dowód gdy y1 > y2 jest
analogiczny). Na mocy twierdzenia 2.1.7 mamy y1n < y2n co przeczy y1n = y2n i dowodzi jednoznaczności.
Dla dowodu istnienia zauważmy najpierw, że 0n = 0, zatem teza jest oczywista gdy x = 0. Możemy więc założyć, że
x > 0. Rozważmy zbiór
E := { u ∈ R∗ | un < x }.
Oczekujemy, że kres górny tego zbioru jest poszukiwanym pierwiastkiem. Musimy jednak najpierw pokazać, że E jest zbiorem niepustym i ograniczonym od
góry.
Pokażemy, że E 6= ∅. Niech t := x+1
x
. Mamy 0 < t < 1 oraz t < x. Mnożąc nierówności 0 < t < 1 obustronnie przez t > 0
z własności ciała uporządkowanego dostajemy 0 < t2 < t. Ale t < 1, zatem 0 < t2 < 1. Rozumując indukcyjnie stwierdzamy,
że również 0 < tn−1 < 1. Mnożąc tę nierówność obustronnie przez t > 0 dostajemy tn < t. Zatem tn < x co oznacza, że
t ∈ E. Tak więc E 6= ∅. Pokażemy z kolei, że 1 + x jest majorantą zbioru E. Gdyby tak nie było, znaleźlibyśmy s ∈ E,
takie, że s > 1 + x. Wtedy sn > s > x. Zatem s 6∈ E. Otrzymana sprzeczność pokazuje, że 1 + x rzeczywiście jest majorantą
zbioru E, zatem E jest ograniczony od góry. Zatem ma kres górny.
2.2. TWIERDZENIE O ISTNIENIU PIERWIASTKA. 57

Połóżmy y := sup E. Pokażemy, że rzeczywiście y n = x. Dla dowodu nie wprost załóżmy, że y n 6= x. Mamy do rozważenia
dwa przypadki: y n < x lub y n > x. Rozważmy najpierw przypadek y n < x.
Liczymy teraz, że da si˛e skonstruować y1 > y takie, że y1n < x, co przeczyłoby y = sup E . Naturalne jest poszukiwać y1 w postaci y1 = y + h.
Pytanie jak dobrać h? Mamy mieć (y + h)n < x co jest równoważne

(y + h)n − y n < x − y n . (2.14)

Wiemy ze wzoru (2.3), że


(y + h)n − y n = h (y + h)n−1 + (y + h)n−2 y + · · · y n−1 < hn(y + h)n .


Zatem, dla h < 1 mamy


(y + h)n − y n < hn(y + 1)n .
˛ by zagwarantować (2.14), wystarczy zapewnić, że
Stad,
hn(y + 1)n < x − y n ,
n
x−y
˛ h<
a w tym celu wystarczy wziać n(y+1)n . Jesteśmy teraz gotowi, by ze zrozumieniem wrócić do formalnego dowodu.
Dobierzmy h ∈ Q takie, że
x − yn
0 < h < min{1, }.
n(y + 1)n
Istnienie takiego h zapewnia nam gęstość Q w R (twierdzenie 2.2.4 ). Łatwo sprawdzamy, że wtedy

(y + h)n − y n < hn(y + 1)n < x − y n .

Zatem (y + h) < x, czyli y + h ∈ E. Ale y + h > y = sup E, skąd y + h 6∈ E. Otrzymana sprzeczność wyklucza nierówność
y n < x.
Pozostaje pokazać, że nierówność y n > x też prowadzi do sprzeczności. Tym razem liczymy, że uda si˛e skonstruować y2 < y ,
˛ majoranta˛ zbioru E , co doprowadzi do sprzeczności z faktem, że y jako kres górny jest najmniejsza˛ majoranta.˛ Poszukujemy y2 w postaci y − k .
również b˛edace
Chcemy mieć (y − k)n > x co jest równoważne postulatowi

y n − (y − k)n < y n − x

Rozpisujac
˛ podobnie jak poprzednio mamy

y n − (y − k)n = k y n−1 + y n−2 (y − k) + · · · + (y − k)n−1 < kny n−1 .




Podpowiada to jak dobrać k .


Dobierzmy k ∈ Q takie, że
yn − x
0<k< .
ny n−1
Łatwo sprawdzamy, że przy tak dobranym k mamy (y − k)n > x. Twierdzimy, że y − k jest majorantą zbioru E. Gdyby tak
nie było, znaleźlibyśmy v ∈ E takie, że v > y − k. Ale wtedy v n > (v − k)n > x, co przeczy v ∈ E. Zatem y − k rzeczywiście
jest majorantą zbioru E. Ale y − k < y, skąd y nie jest najmniejszą majorantą E< zatem y 6= sup E. Otrzymana sprzeczność
dowodzi, że y n = x. √ 
Nieujemną liczbę, której n-ta potęga jest równa liczbie x ­ 0 nazywamy n-tym pierwiastkiem z x i oznaczamy n x.

Twierdzenie 2.2.6 √
√ √
∀n ∈ N1 ∀x, y ∈ R∗ : n
xy = n
xny

Dowód: ćwiczenie.
W programie Mathematica pierwiastek kwadratowy z√x zapisujemy jako Sqrt[x]. Nie ma natomiast podobnej notacji
dla pierwiastków stopnia wyższego niż dwa. Aby policzyć √
n
x piszemy x^(1/n). Notacja ta bierze si˛e stad,
˛ że, jak wkrótce zobaczymy,
1
funkcj˛e pot˛egowa˛ można rozszerzyć na wykładniki rzeczywiste i wtedy x = x n .
n
58 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

2.3 Rozszerzony zbiór liczb rzeczywistych


2.3.1 R uzupełniony o −∞ i +∞
Aby brać kres górny lub dolny podzbioru R trzeba sprawdzać czy jest on ograniczony odpowiednio od góry lub dołu. Jest to niewygodnie, dlatego przydaje si˛e
zbiór liczb rzeczywistych rozszerzony o plus i minus nieskończoność. W takim rozszerzonym zbiorze każdy podzbiór ma kres górny lub dolny. Jest nim zwykła
liczba gdy zbiór jest ograniczony, a plus lub minus nieskończoność jeśli jest nieograniczony od góry lub nieograniczony od dołu.

Definicja 2.3.1 Definiujemy rozszerzony zbiór liczb rzeczywistych jako

R̄ := R ∪ {−∞, ∞}.

Ponadto przyjmujemy, że dla każdego x ∈ R − ∞ < x < ∞.

Uwaga 2.3.2 Każdy niepusty podzbiór R̄ posiada kresy.

Definicja 2.3.3 W R̄ definiujemy następujące działania:

(i) Dla x ∈ R x + ∞ := ∞, x − ∞ := −∞, x


∞ := x
−∞ := 0.

(ii) Dla x ∈ R+ x · ∞ := ∞, x · (−∞) := −∞.


(iii) Dla x ∈ R− x · ∞ := −∞, x · (−∞) := ∞.
(iv) Ponadto ∞ · ∞ := (−∞) · (−∞) := ∞, ∞ · (−∞) := (−∞) · ∞ := −∞.

(v) Oraz ∞ + ∞ := ∞, (−∞) + (−∞) := −∞.

Uwaga 2.3.4 Jeśli A ⊂ R̄ jest zbiorem niepustym, to A jest ograniczony od góry (od dołu) wtedy i tylko wtedy gdy
sup A < ∞ (inf A > −∞).

2.3.2 Kresy funkcji

Definicja 2.3.5 Niech X będzie zbiorem, A ⊂ X jego niepustym podzbiorem, a f : X → R̄ funkcją. Definiujemy kres
górny funkcji f na zbiorze A jako

sup f (x) := sup f (A) = sup { f (x) | x ∈ A }.


x∈A

Definiujemy kres dolny funkcji f na zbiorze A jako

inf f (x) := inf f (A) = inf { f (x) | x ∈ A }.


x∈A

Mówimy, że f jest ograniczona od góry (od dołu) na zbiorze A gdy f (A) jest ograniczony od góry (od dołu) co jest
równoważne warunkowi supx∈A f (x) < ∞ (inf x∈A f (x) > −∞).
2.3. ROZSZERZONY ZBIÓR LICZB RZECZYWISTYCH 59
x2
Przykład 2.3.6 Rozważmy funkcję f : R 3 x 7→ x2 +1 ∈ R. Łatwo się przekonać, że supx∈A f (x) = 1. Rzeczywiście,
2
dla dowolnego x ∈ R zachodzi nierówność < 1, zatem liczba jeden jest majorantą zbioru f (R). Jest najmniejszą
x
x2 +1
majorantą, bo dla 0 < a < 1 łatwo policzyć, że

1 1
r
xa :=
2 1−a
x2a
spełnia nierówność a < x2a +1 , co pokazuje, że takie a nie jest już majorantą.

Twierdzenie 2.3.7 Mamy następujące własności kresów funkcji:

(i) Niech f : X → R̄ będzie funkcją, a A ⊂ X. Wtedy

inf (−f (x)) = − sup f (x),


x∈A x∈A
sup (−f (x)) = − inf f (x).
x∈A x∈A

(ii) Niech fi : X → R̄ dla i ∈ {1, 2} będą funkcjami, a A ⊂ Xi . Wtedy

sup (f1 (x) + f2 (x)) ¬ sup f1 (x) + sup f2 (x),


x∈A x∈A x∈A
inf (f1 (x) + f2 (x)) ­ inf f1 (x) + inf f2 (x).
x∈A x∈A x∈A

Dowód: (*)Aby udowodnić własność (i) połóżmy a := supx∈A f (x) oraz b := inf x∈A (−f (x)). Wystarczy pokazać, że
−a ¬ b i −a ­ b. Niech x ∈ A. Wtedy z definicji kresu górnego f (x) ¬ a. Zatem −a ¬ −f (x) dla wszystkich elementów
x ∈ A. Zatem −a jest minorantą zbioru { −f (x) | x ∈ A }, skąd −a ¬ inf x∈A (−f (x)) = b. Potrzebujemy jeszcze pokazać,
że −a ­ b. Ustalmy ponownie x ∈ A. Z definicji kresu dolnego mamy b ¬ −f (x), skąd f (x) ¬ −b. Zatem −b jest majorantą
zbioru { f (x) | x ∈ A }, co oznacza, że −b ­ a, czyli −a ­ b. Dowodzi to pierwszej równości własności (i). Drugą dowodzi
się analogicznie.
Dla dowodu pierwszej nierówności własności (ii) połóżmy a1 := supx∈A f1 (x), a2 := supx∈A f2 (x) oraz ustalmy x ∈ A. Z
definicji kresu górnego mamy
f1 (x) ¬ a1 f2 (x) ¬ a2 .
Zatem
f1 (x) + f2 (x) ¬ a1 + a2 .
Ponieważ x ∈ A jest dowolnie ustalone, wnosimy, że a1 + a2 jest majorantą zbioru { f1 (x) + f2 (x) | x ∈ A }. Ponieważ
supx∈A (f1 (x) + f2 (x)) jest najmniejszą majorantą tego zbioru, dostajemy
sup (f1 (x) + f2 (x)) ¬ a1 + a2 ,
x∈A

co dowodzi pierwszej nierówności we własności (ii). Drugą nierówność dowodzi się analogicznie. 
W podobny sposób dowodzi się następujących twierdzeń.
Twierdzenie 2.3.8 Niech f : X1 × X2 → R̄ będzie funkcją, a Ai ⊂ Xi dla i ∈ {1, 2}. Wtedy
 
sup f (x1 , x2 ) = sup sup f (x1 , x2 ) ,
(x1 ,x2 )∈A1 ×A2 x1 ∈A1 x2 ∈A2
 
inf f (x1 , x2 ) = inf inf f (x1 , x2 ) .
(x1 ,x2 )∈A1 ×A2 x1 ∈A1 x2 ∈A2
60 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Twierdzenie 2.3.9 Niech fi : Xi → R̄ oraz Ai ⊂ Xi dla i ∈ {1, 2}. Jeśli inf xi ∈Ai fi (xi ) > −∞ oraz supxi ∈Ai fi (xi ) <
∞ to

sup (f1 (x1 ) + f2 (x2 )) = sup f1 (x1 ) + sup f2 (x2 ),


(x1 ,x2 )∈A1 ×A2 x1 ∈A1 x2 ∈A2

inf (f1 (x1 ) + f2 (x2 )) = inf f1 (x1 ) + inf f2 (x2 ).


(x1 ,x2 )∈A1 ×A2 x1 ∈A1 x2 ∈A2

Twierdzenie 2.3.10 Niech f : X → R̄ będzie funkcją, A ⊂ X, a c ∈ R. Wtedy

sup (f (x) + c) = sup f (x) + c,


x∈A x∈A
inf (f (x) + c) = inf f (x) + c.
x∈A x∈A

Rozważmy jeszcze funkcje f, g : X → R̄ takie, że f ¬ g, co oznacza, że dla każdego x ∈ X zachodzi nierówność


f (x) ¬ g(x). Mamy wtedy następujące twierdzenie.

Twierdzenie 2.3.11 Niech f, g : X → R̄ będą funkcjami, a A ⊂ X. Jeśli f ¬ g, to

inf f (x) ¬ inf g(x),


x∈A x∈A
sup f (x) ¬ sup g(x).
x∈A x∈A

Dowód: Połóżmy m := inf x∈A f (x) i ustalmy dowolne x ∈ X. Z definicji kresu dolnego mamy m ¬ f (x), a z założenia
mamy f (x) ¬ g(x)> Zatem dostajemy m ¬ g(x), a ponieważ x ∈ X jest dowolnie ustalone, oznacza to, że m jest minorantą
zbioru { g(x) | x ∈ X }. Wnosimy więc, że m ¬ inf x∈A g(x), bo kres dolny jest największą majorantą. Dowodzi to pierwszej
nierówności. Drugą dowodzimy analogicznie. 

2.4 Granice ciągów w R


W rozdziale 1.2 √przedstawiliśmy ciagi˛ jako narz˛edzie do przybliżania liczb, które nie sa˛ liczbami wymiernymi i analizowaliśmy prosty algorytm pozwalajacy ˛
przybliżać liczb˛e 2. Przedstawiliśmy też ide˛e granicy ciagu
˛ jako liczby, która˛ ciag
˛ przybliża. Teraz przyjrzymy si˛e temu poj˛eciu dokładniej, ale zaczniemy od
dwóch dodatkowych eksperymentów numerycznych.

2.4.1 Eksperymenty numeryczne z liczbą π


Listing 2.5 prezentuje program w j˛ezyku Mathematica obliczajacy ˛ (1.2) rozważanego w rozdziale 1.2.5 jako narz˛edzie do przybliżania liczby π .
˛ wyrazy ciagu
Jego odpowiednik w j˛ezyku C++ przedstawiono na listingu 2.6 .
Uruchamiajac
˛ program w C++ z listingu 2.6 otrzymujemy nast˛epujacy
˛ ciag
˛ liczb (moga˛ wyst˛epować drobne różnice dla różnych platform), z których pierwszych
2.4. GRANICE CIĄGÓW W R 61
 
( ∗ P r z y b l i ż a n i e l i c z b y p i obwodem wpisanych w i e l o k a̧ t ów ∗ )
P i B y C i r c umference [ d_ ] :=
Module [ { a , m, n , A} ,
( ∗ Zaczynamy od wpisanego kwadratu .
Jego bok a wynosi pó ł p i e r w i s t k a z dwó ch .
Do p o l i c z e n i a p i e r w i a s t k a wykorzystujemy f u n k c j ȩ wbudowana̧ S q r t ∗ )
a = Sqrt [ 2 . ] / 2 ;
m = 4 ; ( ∗ I l o sc bok ów w i e l o k a̧ ta , na pocz a̧ t e k c z t e r y ∗ )
n = 1; ( ∗ Numer k o l e j n e g o wyrazu c i a̧gu , na pocz a̧ t e k j e d e n ∗ )
Do[ ( ∗ Pocz a̧ t e k p ȩ t l i Do∗ )
A=m∗ a ; ( ∗ Obliczamy d ł ugo sć obwodu ∗ )
( ∗ Domy s l n i e d l a l i c z b maszynowych Mathematica w y p i s u j e t y l k o 6 c y f r .
NumberForm pozwala wydoby ć wi ȩ c e j c y f r ∗ )
Print [ "A[" , n , " ]= " , NumberForm[ A, 1 6 ] ] ; ( ∗ Wydruk k o n t r o l n y . ∗ )
n = n + 1; ( ∗ K o l e j n y wyraz c i a̧ gu ∗ )
m = m∗ 2 ; ( ∗ K o l e j n y w i e l o b o k b ȩ d z i e mia ł dwa r a z y wi ȩ c e j bok ów ∗ )
a = Sqrt [ 2 − Sqrt [ 4 − 4∗ a ∗ a ] ] / 2 , ( ∗ o t a k i e j d ł ugo s c i ∗ )
{d} ( ∗ I l o sć powtó r z e ń p ȩ t l i Do ∗ )
] ; ( ∗ Koniec p ȩ t l i Do∗ )
A ( ∗ Zwracany wynik ∗ )
]
 
Listing 2.5: Wyznaczenie ciągu przybliżeń liczby π w języku Mathematica w oparciu o obwody wielokątów

czternaście to:

A1 = 2.828427124746190
A2 = 3.061467458920719
A3 = 3.121445152258053
A4 = 3.136548490545940
A5 = 3.140331156954754
A6 = 3.141277250932759
A7 = 3.141513801144285
A8 = 3.141572940367515
A9 = 3.141587725275636
A10 = 3.141591421514008
A11 = 3.141592345563526
A12 = 3.141592576625775
A13 = 3.141592634298169
A14 = 3.141592650272843

Do tego miejsca ciag


˛ ten zachowuje si˛e bardzo przyzwoicie, a jego kolejne wyrazy rosna.˛ Jednak dalsze wyrazy pokazuja,˛ że nie do końca spełnia on nasze
62 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ PiByCircumference . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z obwody ∗/
/∗ w i e l o k a̧ t ów foremnych wpisanych w okr a̧ g o s r e d n i c y j e d e n ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <iomanip>
/∗ B i b l i o t e k a matematyczna , z a w i e r a standardowe i m p l e m e n t a c j e
w i e l u matematycznych f u n k c j i . My sko rzys tamy p o n i ż e j
z f u n k c j i s q r t l i c z a̧ c e j p i e r w i a s t e k kwadratowy ∗/
#include <cmath>
using namespace s t d ;

i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
c o u t << f i x e d << r i g h t ;
/∗ Zaczynamy od wpisanego kwadratu , kt ó r e g o
bok a wynosi pó ł p i e r w i a s t k a z 2 . Do p o l i c z e n i a
p i e r w i a s t k a wykorzystujemy b i b l i o t e c z n y
podprogram s q r t ∗/
double a=s q r t ( 2 . 0 ) / 2 ;

/∗ I l o sc bok ów w i e l o k a̧ ta , na pocz a̧ t e k c z t e r y ∗/
i n t m=4;
/∗ Numer k o l e j n e g o wyrazu c i a̧gu , i l o sć wyraz ów do p o l i c z e n i a ∗/
i n t n=1 ,nmax=40;

/∗ Dla w s z y s t k i c h n od 1 do nmax ∗/
while ( n<nmax ) {
/∗ Obliczamy d ł ugo sć obwodu ∗/
double A=m∗ a ;
c o u t << " A[" << setw ( 2 ) << n << "] =" ;
c o u t << setw ( 1 8 ) << A << e n d l ;
/∗ K o l e j n y w i e l o k a̧ t b ȩ d z i e mia ł dwa r a z y wi ȩ c e j bok ów ∗/
m=m∗ 2 ;
/∗ A t y l e w y n i e s i e d ł ugo sć j e g o boku ∗/
a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ;
/∗ K o l e j n y wyraz c i a̧ gu ∗/
n=n+1;
}
}
 
Listing 2.6: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o obwody wielokątów
2.4. GRANICE CIĄGÓW W R 63

oczekiwania.

A15 = 3.141592648934190
A16 = 3.141592684156058
A17 = 3.141592607672169
A18 = 3.141592910939673
A19 = 3.141591696683685
A20 = 3.141596553704820
A21 = 3.141596553704820
A22 = 3.141518840465548
A23 = 3.141207968282266
A24 = 3.142451272494134
A25 = 3.142451272494134
A26 = 3.162277660168380
A27 = 3.162277660168380
A28 = 2.828427124746190
A29 = 0.000000000000000

˛ od wyrazu A15 ciag


Poczynajac ˛ przestaje być rosnacy˛ i zamiast przybliżać, zaczyna oddalać si˛e od π , a wyraz A29 wynosi wr˛ecz zero! I w tym przypadku
przyczyna˛ ograniczeń algorytmu jest skończona arytmetyka komputera. Efekt obliczeń z precyzja˛ maszynowa˛ w środowisku Mathematica jest analogiczny.
Wartość liczby π z dokładnościa˛ do 15-tu miejsc dziesi˛etnych wynosi

π = 3.141592653589793 . . . .

Zatem przy zastosowaniu 64-bitowego typu double przedstawiona metoda pozwala policzyć π z dokładnościa˛ do około 8 cyfr znaczacych. ˛
Warto podkreślić, że sama obserwacja numeryczna zachowania tego ciagu ˛ może prowadzić do bł˛ednego wniosku iż ciag˛ ten jest zbieżny do zera. Aby mieć
praktyczny pożytek z ciagu
˛ jako narz˛edzia do przybliżania liczb, musimy umieć od strony teoretycznej przeanalizować jego zachowanie.
Mathematica radzi sobie łatwo z wyliczeniem π z duża˛ dokładnościa,˛ ale wymaga to obliczeń wysokiej precyzji, znacznie kosztowniejszych od obliczeń z
precyzja˛ maszynowa.˛ Na przykład piszac˛
N [ Pi , 1 0 0 0 ]

otrzymujemy
3.14159265358979323846264338327950288419716939937510582097494459230781\
6406286208998628034825342117067982148086513282306647093844609550582231\
7253594081284811174502841027019385211055596446229489549303819644288109\
7566593344612847564823378678316527120190914564856692346034861045432664\
8213393607260249141273724587006606315588174881520920962829254091715364\
3678925903600113305305488204665213841469519415116094330572703657595919\
5309218611738193261179310511854807446237996274956735188575272489122793\
8183011949129833673362440656643086021394946395224737190702179860943702\
7705392171762931767523846748184676694051320005681271452635608277857713\
4275778960917363717872146844090122495343014654958537105079227968925892\
3542019956112129021960864034418159813629774771309960518707211349999998\
3729780499510597317328160963185950244594553469083026425223082533446850\
3526193118817101000313783875288658753320838142061717766914730359825349\
0428755468731159562863882353787593751957781857780532171226806613001927\
876611195909216420199
64 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
 
( ∗ Przyk ł ad z c i a̧ giem p o z o r n i e z b i e żnym , zadanym r e k u r e n c y j n i e ∗ )
Henon [ n_ ] := Module [ { a , b , x0 , x1 , x2 , k } ,
a = 1 . 4 ; b = 0 . 3 ; ( ∗ Pomocnicze parametry a i b ∗ )
k = 0 ; ( ∗ L i c z n i k wyraz ów c i a̧ gu ∗ )
( ∗ Dwa pocz a̧ tkowe wyrazy c i a̧ gu ∗ )
x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ;
x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ;
Do[ k = k + 1 ;
( ∗ K o l e j n y wyraz c i a̧ gu wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗ )
x2 = b∗ x0 + 1 − a ∗ x1 ∗ x1 ;
( ∗ Nowe warto s c i dwó ch p o r z e d n i c h wyraz ów c i a̧gu ∗ )
x0 = x1 ;
x1 = x2 ;
Print [ { k , NumberForm[ x2 , 1 6 ] } ] ,
{n}
];
]
 
Listing 2.7: Przykład ciągu pozornie zbieżnego w języku Mathematica.

jako przybliżenie liczby π z dokładnościa˛ do 1000 cyfr.

˛ 2n -katy
Ćwiczenie komputerowe 2.4.1 Zmodyfikuj program z listingu 2.6 tak by przybliżał π wykorzystujac ˛ foremne opisane na okr˛egu (patrz cw. 1.2.7
). Wykorzystaj ten program do prześledzenia zachowania tego ciagu
˛ przybliżeń.

2.4.2 Granice pozorne


W poprzednim podrozdziale zaobserwowaliśmy, że wyciaganie ˛ wniosków na temat granicy ciagu
˛ z samego numerycznego eksperymentu może być niebezpieczne.
Okazuje si˛e, że ciag
˛ może robić wrażenie zbieżnego, a mimo wszystko zbieżnym nie być. Rozważmy ciag
˛ dany wzorem rekurencyjnym

x0 = 136.462554878752 (2.15)
x1 = 5.39650717129623 (2.16)
xn = 0.3xn−2 + 1 − 1.4x2n−1 (2.17)

Program w j˛ezyku Mathematica wyznaczajacy˛ wyrazy tego ciagu


˛ przedstawiony jest na listingu 2.7 . Wersja w C++ jest na listingu 2.8 .
Przejrzenie pierwszych 15-tu wyrazów tego ciagu
˛ może robić wrażenie, że ciag ˛ około 0.63135. Przejrzenie 50-ciu
˛ ten jest zbieżny do granicy wynoszacej
wyrazów zaciera to pierwsze wrażenie. Jednakże, po doświadczeniach z ciagiem przybliżajacym
˛ π możemy być skłonni podejrzewać, że przyczyna˛ niestabilnego
zachowania dalszych wyrazów tego ciagu˛ znów jest skończona arytmetyka komputera. Okazuje si˛e jednak, że obserwowana numerycznie zbieżność tego ciagu ˛
jest pozorna. Wykres pierwszych 100 wyrazów tego ciagu ˛ przedstawiono na rys. 2.4 . Przykłady tego typu zaobserwowane zostały przez matematyków po raz
pierwszy dopiero w XX wieku. Rozważany przez nas przykład wywodzi si˛e z tzw. odwzorowania Hénona.

2.4.3 Definicja Cauchy’ego granicy ciągu


W rozdziale tym zdefiniujemy granicę ciągu o wartościach rzeczywistych. Przypomnijmy, że od strony formalnej taki ciąg
to funkcja x : N → R, której zbiorem argumentów jest zbiór liczb naturalnych, przyjmująca wartości w zbiorze liczb
rzeczywistych. Tak więc x jest ciągiem, natomiast x(n) to wartość ciągu (funkcji) dla argumentu n ∈ N. W przypadku
ciągów zamiast oznaczenia x(n) jak dla dowolnej funkcji, zazwyczaj stosujemy tradycyjne oznaczenie xn i mówimy o n-tym
wyrazie ciągu zamiast o wartości funkcji x dla argumentu n. Tak więc zarówno x(n) jak i xn oznaczają to samo: wartość ciągu
x dla argumentu n lub rónoważnie n-ty wyraz ciągu. Gdy mówimy o ciągu, a nie o wartości ciągu w punkcie, powinniśmy
2.4. GRANICE CIĄGÓW W R 65

 
/∗ ∗∗∗∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ Henon . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ Przyk ł ad z zadanym r e k u r e n c y j n i e c i a̧ giem , p o z o r n i e z b i e żnym . ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <iomanip>
using namespace s t d ;

i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
/∗ Dla wi ȩ k s z e j c z y t e l n o s c i wynik ów narzucamy s t a ł opozycyjny ,
wyrównywany w prawo z a p i s l i c z b ∗/
c o u t << f i x e d << r i g h t ;

/∗ Pomocnicze parametry a i b ∗/
double a =1.4 , b = 0 . 3 ;
/∗ Dwa pocz a̧ tkowe wyrazy c i a̧ gu ∗/
double x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ;
double x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ;
/∗ I l o sć wyraz ów c i a̧ gu do p o l i c z e n i a ∗/
i n t nmax=15;
/∗ Inna forma p ȩ t l i . I n s t r u k c j e w bloku { . . . } wykonujemy d l a warto s c i n
od j e d e n do nmax zwi ȩ k s z a j a̧ c n za ka żdym razem o j e d e n ∗/
f o r ( i n t n=1;n<=nmax ; n=n+1){
/∗ K o l e j n y wyraz c i a̧ gu wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗/
double x2=b∗ x0+1−a ∗ x1 ∗ x1 ;
/∗ Wyprowadzamy w y n i k i na standardowe wyj s c i e . setw ( p ) u s t a l a i l o sć pó l
d l a wyprowadzanej k o l e j n e j z m i e n n e j . Pozwala t o na l e p s z e
f o r m a t o w a n i e wypisywanych danych ∗/
c o u t << "x[" << setw ( 2 ) << n << " ]= " ;
c o u t << setw ( 2 0 ) << x0 << e n d l ;
/∗ Nowe warto s c i dwó ch p o r z e d n i c h wyraz ów c i a̧gu ∗/
x0=x1 ;
x1=x2 ;
}
}
 
Listing 2.8: Przykład ciągu pozornie zbieżnego w C++.
66 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Rysunek 2.4: Wykres pierwszych 100 wyrazów ciągu danego wzorami (2.15)-(2.17)

stosować oznaczenie x. Ze względu na tradycję często mówimy o ciągu xn mając na myśli nie n-ty wyraz ciągu x, ale sam
ciąg x. Jest to nadużycie, które może prowadzić do nieporozumień. Aby ich uniknąć, formułujemy stwierdzenia tak, by z
kontekstu jednoznacznie wynikało co mamy na myśli: cały ciąg, czy jego n-ty wyraz.
˛ o wyrazach xn ma granic˛e g , jeśli dla dowolnej postulowanej dokładności ε > 0 znajdziemy wyraz o numerze N taki, że on i wszystkie
Mówimy, że ciag
nast˛epne wyrazy różnia˛ si˛e od g nie wi˛ecej niż o ε, czyli można je uważać za przybliżenie g z dokładnościa˛ do ε. Zilustrowano to na rysunku 2.5 .
Niech x : N → R będzie ciągiem liczb rzeczywistych.

Definicja 2.4.2 Mówimy, że ciąg x jest zbieżny do granicy g ∈ R jeżeli

∀ε > 0 ∃N ∈ N ∀n > N |xn − g| < ε.

Piszemy wtedy
lim xn = g.
n→∞

Mówimy, że ciąg x jest zbieżny, jeżeli istnieje g ∈ R takie, że x jest zbieżny do g.

Twierdzenie 2.4.3 Niech p ­ 1 będzie liczbą naturalną. Wtedy


1
lim = 0.
n→∞ np

Dowód: [•] Niech ε ∈ R+ . Weźmy N ∈ N takie, że N > √ p


1
ε
Niech n będzie większe od N . Wtedy n > 1

p
ε
i z
monotoniczności funkcji potęgowej n > ε i w konsekwencji np < ε. Zatem dla n > N mamy
p 1 1

1 1
| − 0| = p < ε.
np n

Mówimy, że ciąg a : N → R jest ograniczony, jeśli istnieje M ∈ R takie, że |an | ¬ M dla wszystkich n ∈ N.

Twierdzenie 2.4.4 Ciąg zbieżny w R jest ograniczony.


2.4. GRANICE CIĄGÓW W R 67

0.20

0.15

g+ϵ

g
0.10

g-ϵ

0.05

0 20 40
N 60 80 100

(−1)n
Rysunek 2.5: Dobór N do ε na wykresie ciągu o wyrazie xn := 1
10 + n .

Dowód: [•] Niech a∗ := limn→∞ an . Dla ε = 1 znajdziemy N ∈ N takie, że dla n > N mamy |an − a∗ | < 1. Zatem dla
takich n jest

|an | = |an − a∗ + a∗ | ¬ |an − a∗ | + |a∗ | < 1 + |a∗ |.

W zbiorze skończonym { |an | | n ∈ N i n ¬ N } jest element największy. Oznaczmy go M0 i weźmy

M := max(1 + |a∗ |, M0 ).

Wtedy dla wszystkich n ∈ N mamy |an | ¬ M . 

2.4.4 Granice nieskończone.

˛ takie jak n → n2 czy n → 2n , które, mówiac


Sa˛ ciagi ˛ potocznie, uciakaja˛ do nieskończoności. Wydaje si˛e naturalne przyjać,
˛ że rozważane w R̄ maja˛ granic˛e
nieskończoność.
68 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Definicja 2.4.5 Mówimy, że ciąg x jest rozbieżny do nieskończoności jeżeli

∀A > 0 ∃N ∈ N ∀n > N xn > A.

Piszemy wtedy
lim xn = ∞.
n→∞

Mówimy, że ciąg x jest rozbieżny do minus nieskończoności jeżeli

∀A > 0 ∃N ∈ N ∀n > N xn < −A.

Piszemy wtedy
lim xn = −∞.
n→∞

Byłoby wygodnie, gdyby jedna˛ definicja˛ dało si˛e objać


˛ tak granice skończone jak i nieskończone. W istocie da si˛e tak zrobić. Zajmiemy si˛e tym w rozdziale 3.3.1
.

2.5 Twierdzenia o granicach ciągów w R


2.5.1 Granica ciągu, a struktura ciała w R
Niech a, b : N → R będą ciągami liczb rzeczywistych. Niech  ∈ { +, −, · } będzie operatorem dodawania, odejmowania lub
mnożenia w R. Definiujemy nowy ciąg
a  b : N 3 n 7→ an  bn ∈ R.

Twierdzenie 2.5.1 (i) Jeśli ciągi a, b są zbieżne to ciąg a  b jest zbieżny oraz

lim (an  bn ) = lim an  lim bn .


n→∞ n→∞ n→∞

(ii) Jeśli ciągi a, b są zbieżne, a ciąg b ma tak wyrazy jak i granicę różne od zera, to ciąg a / b jest zbieżny
oraz
an limn→∞ an
lim = .
n→∞ bn limn→∞ bn
Dowód: [•] Najbardziej pouczajacy
˛ jest przypadek iloczynu. Zastanówmy si˛e jak skonstruować dowód w tym przypadku. Naszym celem jest oszacowanie
różnicy
|an bn − a∗ b∗ |
dla dużych n, przy wykorzystaniu oszacowań na różnice |an − a∗ | i |bn − b∗ |, które możemy uzyskać ze zbieżności ciagów
˛ a i b. Sztuczka˛ powszechnie
stosowana˛ przy takich oszacowaniach jest dodanie i odj˛ecie wyrazu pomocniczego i skorzystanie z własności wartości bezwzgl˛ednej.

|an bn − a∗ b∗ | = |an bn − a∗ bn + a∗ bn − a∗ b∗ | = |(an − a∗ )bn + a∗ (bn − b∗ )| ¬ |an − a∗ ||bn | + |a∗ ||bn − b∗ |


Aby suma dwóch ostatnich składników była mniejsza od ε wystarczy, by każdy z nich był mniejszy od 2ε . Rozwiazuj
˛ ac˛ nierówność
ε
|a∗ ||bn − b∗ | < ,
2
widzimy, że wystarczy, by |bn − b∗ | < 2|aε∗ | , a to mamy zagwarantowane dla n > N1 dobranego dla ciagu ˛ b do stałej 2|aε∗ | . Wyjatkiem
˛ jest |a∗ | = 0,
bo wtedy nie można dzielić przez |a∗ |, ale z tym nie ma problemu, bo przy |a∗ | = 0 lewa strona nierówności jest zero, wi˛ec nierówność jest spełniona dla
wszystkich n.
2.5. TWIERDZENIA O GRANICACH CIĄGÓW W R 69

Troch˛e bardziej kłopotliwy jest przypadek nierówności


ε
|an − a∗ ||bn | < ,
2
˛ zbieżny jest ograniczony (twierdzenie 2.4.4 ), wi˛ec możemy znaleźć stała˛ M > 0 taka,˛ że
bo tu n wyst˛epuje w dwóch miejscach. Jednak wiemy, że ciag
|bn | < M dla wszystkich n. Zatem wystarczy, by
ε
|an − a∗ | < ,
2M
ε
a to mamy zagwarantowane dla n > N2 dobranego dla ciagu ˛ a do stałej 2M .
˛ oddzielnego rozważania przypadku a∗ = 0 wystarczy zauważyć, że |a∗ | < |a∗ | + 1, a |a∗ | + 1 6= 0, wi˛ec można od razu dobrać N1 tak,
Aby uniknać
by |bn − b∗ | < 2(|a∗ε|+1) .
Analizujac˛ formuł˛e, która˛ ostatecznie chcemy udowodnić doszliśmy do tego jak należy dobrać do ε > 0 stosowne wielkości, by ostatecznie wskazać N > 0
tkaie, że dla n ­ N zachodzi |an bn − a∗ b∗ | < ε. Przejdziemy teraz do przedstawienia bardziej formalnego dowodu. Prezentujac ˛ dowód formalny nie
tłumaczymy si˛e jak go wymyśliliśmy. Po prostu po kolei dobieramy stosowne wielkości, by na końcu pokazać, że nierówność zachodzi. Przy sprawdzaniu formalnej
poprawności dowodu pomijanie informacji nieistotnych dla procesu sprawdzania jest wr˛ecz pożadane, ˛ bo im mniej tych informcji tym mniej sprawdzania. Trzeba
jednak pami˛etać, że dowód spisany formalnie nie pomaga w zrozumieniu jak dowód został wymyślony.
Rozważmy przypadek iloczyniu. Niech limn→∞ an = a∗ i limn→∞ bn = b∗ Weźmy ustalone ε > 0. Niech M będzie takie,
że |bn | < M dla wszystkich n ∈ N. Niech N1 ∈ N oraz N2 ∈ N będą takie, że
ε
n > N1 ⇒ |bn − b∗ | < ,
2(|a∗ | + 1)
ε
n > N2 ⇒ |an − a∗ | < .
2M

Niech N := max{N1 , N2 }. Ustalmy n > N . Wtedy


ε ε
|an bn − a∗ b∗ | ¬ |an − a∗ ||bn | + |a∗ ||bn − b∗ | ¬ |an − a∗ |M + (|a∗ | + 1)|bn − b∗ | < M + (|a∗ | + 1) = ε,
2M 2(|a∗ | + 1)

co dowodzi, że
lim an bn = a∗ b∗
n→∞

i kończy dowód w przypadku iloczynu. Wymyślenie i formalizację dowodu dla sumy i różnicy, jako łatwiejszego przypadku,
pozostawiamy czytelnikowi.
W przypadku ilorazu potrzebujemy oszacować | abnn − ab | = |bn1 b| |an b − abn |. Dochodzi zatem jeszcze problem oszacowania |bn1 b| . Tu korzystamy z
|b|
założenia, że b 6= 0. Wtedy δ := 2 > 0, zatem znajdziemy N3 takie, że dla n ­ N3 zachodzi |bn − b| < δ , bo limn→∞ bn = b. Tak wi˛ec dla n ­ N3
mamy też |bn | ­ |b| − |b − bn | > |b| − δ = δ i w konsekwencji |bn b| > 2δ 2 oraz |bn1 b| < 2δ12 .
Sformalizowanie dowodu dla przypadku ilorazu również pozostawiamy czytelnikowi. 

n2 −3n+1
Przykład 2.5.2 Rozważmy ciąg o wyrazach 3+5n+2n2 . Mamy

n2 − 3n + 1 1 − 3 n1 + n12
= .
3 + 5n + 2n2 3 n12 + 5 n1 + 2

Zatem wykorzystując twierdzenie 2.4.3 oraz twierdzenie 2.5.1 wnosimy, że

n2 − 3n + 1 1
lim = .
n→∞ 3 + 5n + 2n2 2
70 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

2.5.2 Granica ciągu, a struktura porządkowa w R

Twierdzenie 2.5.3 (o zachowywaniu nierówności w granicy) Niech a, b : N → R będą ciągami liczb rzeczywistych.
Załóżmy, że istnieje N ∈ N takie, że an ¬ bn dla n ­ N . Jeśli istnieją granice

a∗ = lim an oraz b∗ = lim bn ,


n→∞ n→∞

to a∗ ¬ b∗ .

Dowód: Dla dowodu nie wprost załóżmy, że a∗ > b∗ i połóżmy ε := a∗ −b 2 . Z definicji granicy ciągu znajdziemy N1 , N2 ∈ N

takie, że an ∈ (a∗ − ε, a∗ + ε) dla n ­ N1 oraz bn ∈ (b∗ − ε, b∗ + ε) dla n ­ N2 . Wybierzmy k ∈ N większe niż max(N, N1 , N2 ).
Wtedy bk < b∗ + ε = a∗ − ε < ak . Ale z przyjętego założenia mamy ak ¬ bk . Otrzymana sprzeczność dowodzi tezy. 
Niech a, b, c : N → R będą ciągami liczb rzeczywistych.

Twierdzenie 2.5.4 (o trzech ciągach) Jeśli istnieje liczba naturalna N taka. że dla wszystkich liczb naturalnych n > N
ciągi an , bn , cn spełniają nierówność
an ¬ bn ¬ cn
i ciągi an oraz cn są zbieżne do granicy g, to ciąg bn też jest zbieżny do granicy g.

Dowód:
Ustalmy ε > 0. Ze zbieżności ciągów a i c do g wynika, że możemy dobrać stałą N > 0 tak, by dla n > N zachodziły
nierówności

|an − g| < ε,
|cn − g| < ε.

Oznacza to, że dla n ∈ N zachodzi

−ε < an − g < ε,
−ε < cn − g < ε.

Zatem mamy dla n > N


−ε < an − g ¬ bn − g ¬ cn − g < ε,
co oznacza, że dla takich n
|bn − g| < ε
i dowodzi, że
lim bn = g.
n→∞

Przykład 2.5.5 Rozważmy ciąg n 7→ √ 1


1+n2
. Mamy

1 1
0< √ <
1 + n2 n

Oba ciągi skrajne dążą do granicy zero, zatem limn→∞ √ 1


1+n2
= 0.
2.5. TWIERDZENIA O GRANICACH CIĄGÓW W R 71

Twierdzenie 2.5.6 Niech a : N → R będzie ciągiem liczb rzeczywistych.


(i) Jeśli a jest ciągiem rosnącym i ograniczonym od góry, to ciąg ten jest zbieżny oraz

lim an = sup { an | n ∈ N }.
n→∞

(ii) Jeśli a jest ciągiem malejącym i ograniczonym od dołu, to ciąg ten jest zbieżny oraz

lim an = inf { an | n ∈ N }.
n→∞

Dowód: [•] Udowodnimy własność (i). Drugą własność dowodzi się analogicznie. Oznaczmy

a∗ := sup { an | n ∈ N }.

Ustalmy ε > 0. Z definicji kresu górnego wynika, że a∗ − ε nie jest majorantą zbioru { an | n ∈ N }, zatem istnieje takie
N ∈ N, że aN > a∗ − ε. Zatem dla n > N mamy

a∗ − ε < aN ¬ an ¬ a∗ < a∗ + ε.

Zatem, na mocy (2.10), dostajemy


|an − a∗ | < ε,
co dowodzi, że ciąg a jest zbieżny i jego granicą jest a∗ . 

Przykład 2.5.7 Rozważmy ciąg n 7→ n+1 n


. Mamy n+1 n n+1
< n+2 , zatem ciąg ten jest rosnący. Jest też ograniczony, bo
n
n+1 < 1. Zatem jest zbieżny do granicy sup { n
n+1 | n ∈ N } = 1.

2.5.3 Granice kilku ważnych ciągów

Twierdzenie 2.5.8

p ∈ R+ ⇒ lim n
p=1 (2.18)
n→∞

lim n
n=1 (2.19)
n→∞

α ∈ Q, a > 1 ⇒ lim =0 (2.20)
n→∞ an

1
 p=1
p∈R ⇒ lim pn = 0 p ∈ (−1, 1) (2.21)
n→∞
p ¬ −1 lub p > 1.

nie istn. w R


Dowód: [•] Dla pokazania własności (2.18) rozważmy najpierw przypadek p ­ 1. Niech xn := n p − 1. Wtedy xn ­ 0
oraz na mocy nierówności Bernoulliego mamy

1 + nxn ¬ (1 + xn )n = p.

Zatem dla wszystkich n ∈ N mamy


p−1
0 ¬ xn ¬ .
n
72 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Z twierdzenia o trzech ciągach wynika, że ciąg limn→∞ xn = 0. Tak więc własność (2.18) dla p ­ 1 otrzymujemy z twierdzenia
o granicy sumy ciągów. Gdy p ∈ (0, 1) wystarczy zauważyć, że dla q := p1 mamy z twierdzenia o granicy ilorazu ciągów

√ 1 1
lim n
p= √ = = 1.
n→∞ limn→∞ n q 1

Aby udowodnić (2.19) oznaczmy xn := n
n − 1. Wystarczy pokazać, że ciąg o wyrazach xn zmierza do zera. Z definicji
xn mamy
n = (1 + xn )n .
Podstawiając do wzoru (2.4) a := 1 i b := xn oraz pomijając wszystkie wyrazy z wyjątkiem tego, w którym b = xn występuje
w drugiej potędze dostajemy nierówność
1
(1 + xn )n ­ n(n − 1)x2n .
2
Zatem
1
n ­ n(n − 1)x2n ,
2
skąd wynika, że dla n ­ 2 mamy
2 2
r
0 < xn ¬ ¬√ ,
n−1 n
co na mocy twierdzenia 2.5.4 (za trzeci ciąg bieżemy ciąg stale równy zero) dowodzi, że limn→∞ xn = 0.
Dla dowodu (2.20) oznaczmy b := a − 1 wybierzmy k ∈ N, takie że k > α + 1. Rozważmy n > 2(k + 1). Łatwo sprawdzić,
że wtedy n − k + 1 > n2 . Zatem
n
n(n − 1) · · · (n − k + 1) > )k
2
i w konsekwencji
n(n − 1) · · · (n − k + 1) k ( n )k
 
n k
an = (1 + b)n > b = b > 2 bk ,
k 1 · 2···k k!
skąd dostajemy
2k k! nk
> .
bk (1 + b)n
Mnożąc obie strony powyższej nierówności przez nα−k > 0 otrzymujemy

nα−k 2k k! nα
> .
bk (1 + b)n

Ponieważ z wyboru k wiemy, że k − α > 1, więc nα−k = 1


nk−α
< n.
1
Zatem dla n > 2(k + 1) zachodzą nierówności

nα 2k k! α−k 2k k! 1
0< < n <
(1 + b)n bk bk n

i tezę znów dostajemy z twierdzenia o trzech ciągach.


Własność (2.21) jest prostym wnioskiem z (2.20) dla p ∈ (0, 1). Dla p ∈ {0, 1} własność jest oczywista. Dla p ∈ (−1, 0)
wynika z nierówności
−|p|n ¬ pn ¬ |p|n .
W pozostałym przypadku ciąg ma wartości dowolnie wielkie dla wykładników parzystych, jest więc nieograniczony, a więc
nie może być zbieżny. 
Aby policzyć granicę ciągu a : N → R w programie Mathematica należy użyć instrukcji
2.6. LICZBA E I RZECZYWISTA FUNKCJA WYKŁADNICZA 73

Limit[a[n], n -> Infinity, Assumptions -> Element[n, Integers]]

Na przykład pisząc

Limit[Sqrt[(1 + n)/(1 + 3 n)], n -> Infinity, Assumptions -> Element[n, Integers]]

otrzymujemy √1 .
3
Często ten sam wynik otrzymamy używając krótszej instrukcji

Limit[a[n], n -> Infinity]

która służy do liczenia granicy funkcji. Granica funkcji jest szerszym pojęciem, ale w przypadku argumentu zmierzającego
do nieskończoności często daje ten sam wynik. Jednak nie jest to dokładnie to samo, bo na przykład w przypadku ciągu

lim cos 2πn = 1,


n→∞

gdyż jest to ciąg stale równy jeden, ale granica funkcji

lim cos 2πx


x→∞

nie istnieje. Mathematica dla instrukcji

Limit[Cos[2 Pi n], n -> Infinity, Assumptions -> Element[n, Integers]]

zwraca liczbę 1, natomiast instrukcja

Limit[Cos[2 Pi n], n -> Infinity, Assumptions -> Element[n, Reals]]

zwraca

Interval[{-1, 1}]

co oznacza, że granica nie istnieje, a zbiór punktów granicznych, czyli granic wszystkich możliwych podciągów, to przedział
[−1, 1]. Pojęciem zbioru punktów granicznych zajmiemy się w rozdziale 4 .

2.6 Liczba e i rzeczywista funkcja wykładnicza


2.6.1 Procent składany
Matematyk szwajcarski, Jakob Bernoulli (rys. 2.6 ) rozważał problem procentu składanego, który przedstawić można skrótowo nast˛epujaco.
˛ Wpłacamy do banku
1zł oprocentowane na 100%. Po roku odbieramy 1 + 1 = 2 zł. Jeśli bank jest gotowy wypłacać proporcjonalne oprocentowanie za dowolnie krótki okres, to po
pół roku wypłacimy 1 + 12 = 1.5 zł. Wpłacajac
˛ t˛e kwot˛e na kolejne pół roku odbierzemy (1 + 12 )(1 + 21 ) = 2.25 zł. Zadajac
˛ sobie trud wpłat i wypłat n-krotnie
w ciagu
˛ roku na koniec roku wypłacimy kwot˛e
n
1

1+ zł.
n

Powstaje pytanie: czy możemy zyskać w ten sposób dowolnie wiele, jeśli n b˛edzie odpowiednio duże? Programy w j˛ezyku Mathematica oraz w C++ realizujace
˛
stosowny eksperyment numeryczny przedstawiono na listingach 2.9 i 2.10 .
74 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

 
( ∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e wed ł ug i d e i p r o c e n t u sk ł adanego
( ang . compound i n t e r e s t ) ∗ )
CompoundInterest [ d_ ] := Module [ { n } ,
n = 1;
Do[
Print [ "e[" , n , " ]= " , NumberForm [ ( 1 . + 1 . / n )^ n , 1 6 ] ] ;
n = n + 1,
{d}
];
]
 
Listing 2.9: Eksperyment numeryczny z procentem składanym w języku Mathematica

 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ CompoundInterest . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e wed ł ug i d e i p r o c e n t u ∗/
/∗ sk ł adanego ( ang . compound i n t e r e s t ) ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;

i n t main ( ) {

c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;

// Policzymy 1000 wyraz ów c i a̧ gu


i n t nmax=1000;
f o r ( i n t n=1;n<=nmax ; n=n+1){
// Czynnik , kt ó ry t r z e b a przemno ż y ć n r a z y p r z e z s i e b i e
// Piszemy 1 . 0 / n , a n i e 1/n , bo w a r y t m e t y c e
// ca ł k o w i t o l i c z b o w e j 1/n d a j e z e r o .
double x=1+1.0/n ;
// W C++ brak wbudowanego pot ȩ gowania ,
// wi ȩ c l i c z y m y pot ȩ g ȩ przy pomocy p ȩ t l i
double prod =1;
f o r ( i n t i =1; i<=n ; i=i +1) prod=prod ∗x ;
c o u t << " s[" << setw ( 3 ) << n << "] =" << setw ( 1 8 ) << prod ;
c o u t << e n d l ;
}
}
 
Listing 2.10: Eksperyment numeryczny z procentem składanym w C++
2.6. LICZBA E I RZECZYWISTA FUNKCJA WYKŁADNICZA 75

2.6.2 Liczba e

1 n
Twierdzenie 2.6.1 Ciąg 1 +

n jest rosnący i ograniczony, a więc ma skończoną granicę.

Dowód: [•] Pokażemy najpierw, że ciąg ten jest rosnący. Podstawiając w nierówności Bernoullego (tw. 2.1.8 ) − n12 za
x i przekształcając uzyskaną nierówność otrzymujemy dla n > 1
n
1 1

1− 2 ­ 1−
n n
n  n
1 1 1

1− 1+ ­ 1− .
n n n
 n−1
Z kolei dzieląc obustronnie przez 1 − n1 , mnożąc przez n
n−1 i przekształcając dostajemy
n−1  n
1 1

1− 1+ ­ 1
n n
n n−1
1
 
n
1+ ­
n n−1
n n−1
1 1
 
1+ ­ 1+
n n−1
co dowodzi, że rozważany ciąg jest rosnący.
Aby pokazać, że jest on ograniczony, najpierw zauważmy, że podstawiając 1 za b oraz 1
2 za a we wzorze (2.3) otrzymujemy

1 1 1 1
 
1− n = + + · · · + 1 . (2.22)
2 2 2n−1 2n−2

Zatem podstawiając we wzorze (2.4) 1 za a oraz n1 za b, przekształcając i na koniec wykorzystując (2.22) otrzymujemy
n
1 n 1 n 1 n 1 n 1
        
1+ = 1+ + + + · · · +
n 1 n 2 n2 3 n3 n nn
n1 n(n − 1) 1 n(n − 1)(n − 2) 1 n(n − 1) · · · 1 1
= 1+ + + + ··· +
1n 1·2 n 2 1·2·3 n 3 1 · 2 · · · n nn
1(1 − n ) 1(1 − n )(1 − n )
1 1 2
1(1 − n ) · · · (1 − n−1
1
n )
= 1+1+ + + ··· +
1·2 1·2·3 1 · 2···n
1 1 1
< 1+1+ + + ··· +
1·2 1·2·3 1 · 2···n
1 1 1
< 1 + 1 + + 2 + · · · + n−1
2 2 2
1
 
= 1 + 2 1 − n < 1 + 2 = 3.
2
n
Zatem na mocy twierdzenia 2.5.6 ciąg 1 + n1 jest zbieżny. 
n
Na mocy udowodnionego twierdzenia ciąg 1 + n1 ma granicę. Tradycyjnie nazywamy ją liczbą Eulera i oznaczamy
literą e. Tak więc n
1

e := lim 1 + . (2.23)
n→∞ n
76 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Rysunek 2.6: Jacob Bernoulli (1654 - 1705) i Leonard Euler (1707 - 1783)

n
˛ o wyrazach 1 + n1 jest zbieżny i podał interpretacj˛e tego faktu. Granic˛e t˛e nazywamy jednak liczba˛ Eulera
To Jakob Bernoulli pierwszy zauważył, że ciag
i oznaczamy litera˛ e, bo to Leonard Euler (rys. 2.6 ), inny szwajcarski matematyk, pokazał jak ważna jest ona w matematyce. On pierwszy oznaczał ja˛ litera˛ e i
tak pozostało do dziś.
Liczba e w przybliżeniu wynosi
e = 2.71828182845904523536 . . .
1 n
˛ 1+

Co ciekawe, ciag nadaje liczbie e ważna˛ interpretacj˛e, jednak zupełnie nie nadaje si˛e do obliczania jej przybliżeń, bo jest bardzo wolno zbieżny.
n
W rozdziale 5 poznamy nieporównanie szybsza˛ metod˛e wyznaczania liczby e.
W programie Mathematica liczba e jest oznaczana E.

2.6.3 Funkcja wykładnicza zmiennej rzeczywistej


˛ kwot˛e 1zł na rachunek z oprocentowaniem nie 100%, tylko x (potraktowane jako liczba, 100%=1) po roku wypłacamy kwot˛e
Wpłacajac
 x n
exp(x) := lim 1+ zł.
n→∞ n
Jest to przykład funkcji ciagłej,
˛ dla której pr˛edkość wzrostu (lub spadku) jest proporcjonalna do jej wartości. Można to zapisać w postaci równania różniczkowego

f 0 (x) = af (x).

Rozwiazaniem
˛ tego równania jest funkcja wykładnicza i jej wielokrotności. Bardzo wiele zjawisk w fizyce (np. rozpad pierwiastków promieniotwórczych), w biologii
(np. wzrost populacji przy nieograniczonych zasobach), w ekonomii (np. piramidy finansowe) i w wielu innych dziedzinach opisywanych jest przy pomocy funkcji
wykładniczej.
Można pokazać, że funkcja wykładnicza spełnia wzór
f (x + y) = f (x)f (y),
a stad,
˛ że jest postaci
R 3 x 7→ ax ∈ R+ .

W wyrażeniu tym a ∈ R+ , a ax jest rozszerzeniem wyrażenia an dla n ∈ N na dowolny wykładnik rzeczywisty. W szczególności łatwo stad
˛ wywnioskować,
że dla pq ∈ Q+
2.6. LICZBA E I RZECZYWISTA FUNKCJA WYKŁADNICZA 77

Rysunek 2.7: Wykres funkcji wykładniczej exp : R 3 x 7→ ex ∈ R+ .

p √
aq = q
ap ,
a0 = 1,
oraz dla r ∈ Q−

1
ar = .
a−r
˛ powyższe wzory jako definicje, można zdefiniować funkcj˛e wykładnicza˛ dla dowolnego x ∈ R wzorem
Przyjmujac

ax := sup { ar | r ∈ Q, r < x }

i pokazać, że
exp(x) = ex .

W programie Mathematica funkcja exp jest oznaczana Exp. Natomiast wyrażenie ax występujące w funkcji wykładniczej
o podstawie a w programie Mathematica zapisywane jest w postaci a^x.
Wykres funkcji wykładniczej przedstawiono na rys. 2.7
Od strony obliczeniowej wygodniejszy jest jednak wzór

X xn
exp(x) = ,
n=0
n!
który nam posłuży jako podstawa do formalnej definicji funkcji wykładniczej i wyprowadzenia jej własności. Zajmiemy si˛e tym w rozdziale 6.2 .
78 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

2.7 Ciało liczb zespolonych


2.7.1 Liczby zespolone
Chcemy rozszerzyć ciało liczb rzeczywistych tak, by pozostało ciałem, ale była w nim liczba i o własności i2 = −1. Widać, że jeśli ma to być ciało to musi w nim
też być liczba a + bi dla dowolnych rzeczywistych a, b. Jednak suma i iloczyn liczb tej postaci nie wymaga już dalszego rozszerzania, bo

(a + bi) + (c + di) = (a + c) + (b + d)i,


(a + bi)(c + di) = ac + adi + bci + bdi2 = (ac − bd) + (ad + bc)i.

Niestety nie ma szans, by ciało to było uporzadkowane,


˛ bo wtedy albo i > 0, albo −i > 0, co na mocy własności ciała uporzadkowanego
˛ prowadzi do i2 > 0
sprzecznego z i = −1.
2

Pozostaje jednak pytanie, czy sam pomysł liczby i jako elementu ciała rozszerzajacego ˛ ciało liczb rzeczywistych też nie prowadzi do jakiejś sprzeczności,
której jeszcze nie widzimy. Aby przekonać si˛e, że tak nie jest, trzeba zbudować formalny model liczb zespolonych.

2.7.2 Ciało C
W C := R2 wprowadzamy działania

(a, b) + (c, d) := (a + c, b + d), (2.24)


(a, b) · (c, d) := (ac − bd, ad + bc). (2.25)

Tak jak dla liczb rzeczywistych kropkę oznaczającą mnożenie w zapisie wzorów często pomijamy pod warunkiem, że nie
prowadzi to do niejednoznaczności w interpretacji wzoru.
Zapis a + bi można teraz odczarować. Traktujac
˛ par˛e (a, b) jako formalne kodowanie liczy a + bi widzimy, że liczba rzeczywista a = a + 0 · i, wi˛ec w
naszym kodowaniu odpowiada jej para (a, 0). Podobnie, jednostka urojona i = 0 + 1 · i, wi˛ec w naszym kodowaniu odpowiada jej para (0, 1). Pozwala to
traktować zapis a jako skrót zapisu (a, 0) oraz zapis i jako skrót zapisu (0, 1). Wtedy a + bi = (a, 0) + (b, 0) · (0, 1) = (a, 0) + (0, b) = (a, b) i
zapis a + bi staje si˛e równoważny formalnemu zapisowi (a, b).

Twierdzenie 2.7.1 Zbiór C := R2 z tak określonymi działaniami oraz parami (0, 0) i (1, 0) jako elementami neutral-
nymi odpowiednio dla dodawania i mnożenia jest ciałem.

Dowód: Dowód sprowadza się do przeprowadzenia długich i żmudnych, ale prostych rachunków. Szczegóły pominiemy.

Definicja 2.7.2 Ciało to nazywamy ciałem liczb zespolonych.

Dla dowolnych a, b ∈ R mamy (a, 0) + (b, 0) = (a + b, 0) oraz (a, 0)(b, 0) = (ab, 0), zatem parę (a, 0) możemy utożsamiać
z liczbą rzeczywistą a. Zwyczajowo kładziemy i := (0, 1). Jest to tak zwana jednostka urojona. Łatwo sprawdzamy, że
i2 = (−1, 0) = −1 oraz
(a, b) = (a, 0) + (b, 0)i = a + bi. (2.26)
Zapis po prawej to tradycyjny zapis liczby zespolonej i poza szczególnymi przypadkami właśnie ten zapis będziemy stosować.
W szczególności, w zapisie tym wzory (2.24) i (2.25) przyjmują postać

(a + bi) + (c + di) = (a + c) + (b + d)i,


(a + bi) · (c + di) = (ac − bd) + (ad + bc)i,

a więc dokładnie taką jak chcieliśmy w naszym nieformalnym wprowadzeniu.


2.6. LICZBA E I RZECZYWISTA FUNKCJA WYKŁADNICZA 79

W programie Mathematica jednostkę urojoną i oznaczamy I, a liczbę zespoloną a + bi zapisujemy jako a + b I.


Dla liczby zespolonej z = a+bi liczby a, b ∈ R nazywamy odpowiednio częścią rzeczywistą i częścią urojoną z i oznaczamy
re z i im z. Zatem
z = re z + i im z. (2.27)

Uwaga 2.7.3 Dla dowolnych z1 , z2 ∈ C mamy

z1 = z2 ⇔ re z1 = re z2 ∧ im z1 = im z2 .

Dowód: Ze wzoru (2.27) wynika natychmiast, że re z1 = re z2 ∧ im z1 = im z2 implikuje równość z1 = z2 . Aby


pokazać implikację przeciwną przyjmijmy, że z1 = z2 . Ze wzoru (2.27) i wzoru (2.26) mamy z1 = (re z1 , im z1 ). Podobnie
z2 = (re z2 , im z2 ). Zatem mamy równość par (re z1 , im z1 ) = (re z2 , im z2 ), która, jak wiemy z teorii mnogości, jest możliwa
tylko wtedy gdy re z1 = re z2 i im z1 = im z2 . Tak więc z (2.27) wnosimy, że z1 = z2 . 
Liczbę zespoloną z̄ := a − bi nazywamy sprzężeniem liczby zespolonej z.

Twierdzenie 2.7.4 Dla dowolnych z, z1 , z2 ∈ C mamy


(i) z = z,

(ii) z + z = 2 re z, z − z = 2i im z,
(iii) z1 + z2 = z1 + z2
(iv) z1 · z2 = z1 · z2

Dowód: [•] Niech z = a + bi. Mamy


z = a + bi = a − bi = a + bi = z
co dowodzi (i). Ponadto
z + z = a + bi + a − bi = 2a = 2 re z
oraz
z − z = a + bi − (a − bi) = 2bi = 2i im z
co dowodzi (ii). Niech z1 = a + bi oraz z2 = c + di. Mamy

z1 + z2 = (a + c) + (b + d)i = (a + c) − (b + d)i = (a − bi) + (c − di) = z1 + z2

co dowodzi (iii) oraz

z1 · z2 = (ac − bd) + (ad + bc)i = (ac − bd) − (ad + bc)i = (a − bi) · (c − di) = z1 · z2

co dowodzi (iv). 

2.7.3 Moduł liczby zespolonej.


Wyst˛epujaca
˛ w definicji Cauchy’ego granicy ciagu˛ wartość bezwzgl˛edna |a − b| dla a, b ∈ R może być interpretowana jako odległość pomi˛edzy liczbami
a i b. Uogólniajac
˛ poj˛ecie odległości możemy si˛e pokusić o uogólnienie poj˛ecia granicy. Abstrakcyjna˛ definicj˛e odległości wprowadzimy w rozdziale 3 . Na
razie ograniczymy si˛e do zauważenia, że dla liczb zespolonych można wprowadzić operacj˛e o własnościach podobnych do wartości bezwzgl˛ednej dla liczb
rzeczywysitych, co też daje możliwość mierzenia odległości mi˛edzy liczbami zespolonymi.
√ Moduł liczby zespolonej z definiujemy wzorem |z| := (re z) + (im z) . Innymi słowy, dla z := a + bi mamy |z| =
p
2 2

a + b . Własności modułu liczby zespolonej zbiera następujące twierdzenie


2 2
80 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Twierdzenie 2.7.5 Dla z, z1 , z2 ∈ C mamy


(i) re z ¬ |z| oraz im z ¬ |z|,

(ii) |z| = 0 ⇔ z = 0,
(iii) |z|2 = zz,
(iv) |z| = |z|,

(v) |z1 z2 | = |z1 ||z2 |,


(vi) |z1 + z2 | ¬ |z1 | + |z2 |.

Dowód: [•] Niech z = a + bi. Mamy


√ p
re z = a ¬ |a| = a2 ¬ a2 + b2 = |z|

oraz √ p
im z = b ¬ |b| = b2 ¬ a2 + b2 = |z|

co dowodzi (i). Jeśli z = 0, to a = b = 0, zatem |z| = a2 + b2 = 0. Na odwrót, jeśli |z| = 0, to a2 + b2 = 0. Jeśli suma
dwóch liczb nieujemnych wynosi zero, to obie te liczby są równe zero. Tak więc a2 = b2 = 0, a stąd dostajemy a = b = 0.
Dowodzi to własności (ii). Mamy też

zz = (a + bi)(a − bi) = a2 + b2 + abi − abi = a2 + b2 = |z|2

co dowodzi własności (iii) oraz


p
|z| = a2 + b2 = a2 + (−b)2 = |z|
p

co dowodzi własności (iv).


Aby pokazać (v) oraz (vi) rozważmy z1 = a + bi oraz z2 = c + di. Z (iii) oraz twierdzenia 2.7.4 mamy

|z1 z2 |2 = z1 z2 z1 z2 = z1 z2 z1 z2 = z1 z1 z2 z2 = |z1 |2 |z2 |2

co dowodzi (v).
Pozostaje pokazać (vi). Z własności (iv) oraz (i) twierdzenia 2.7.4 wnosimy, że

z1 z2 = z1 z2 = z1 z2

Zatem z własności (ii) twierdzenia 2.7.4 oraz z pokazanych już własności (i) dla z := z1 z2 , (iv) oraz (v) dostajemy

z1 z2 + z1 z2 = z1 z2 + z1 z2 = 2 re(z1 z2 ) ¬ 2|z1 z2 | = 2|z1 ||z2 |.

Dodając do obu stron tej nierówności wyrażenie z1 z1 + z2 z2 = |z1 |2 + |z2 |2 otrzymujemy nierówność

z1 z1 + z1 z2 + z1 z2 + z2 z2 ¬ |z1 |2 + 2|z1 ||z2 | + |z2 |2 = (|z1 | + |z2 |)2 .

Zatem, ponownie wykorzystując pokazaną już własność (iii), a także własność (iii) twierdzenia 2.7.4 , mamy

|z1 + z2 |2 = (z1 + z2 )(z1 + z2 ) = (z1 + z2 )(z1 + z2 ) = z1 z1 + z1 z2 + z1 z2 + z2 z2 ¬ (|z1 | + |z2 |)2 ,

co dowodzi własności (vi). 


2.6. LICZBA E I RZECZYWISTA FUNKCJA WYKŁADNICZA 81

Rysunek 2.8: Interpretacja geometryczna liczby zespolonej z := a + bi, jej modułu oraz sprzężenia.

Rysunek 2.9: Interpretacja geometryczna sumy liczb zespolonych. Wektor reprezentujący sumę z1 + z2 jest sumą wektorów
reprezentujących z1 i z2 .

2.7.4 Interpretacja geometryczna liczb zespolonych


Ponieważ liczba zespolona od strony formalnej jest po prostu para˛ liczb rzeczywistych, wi˛ec zbiór liczb zespolonych możemy traktować jako zbiór par liczb
rzeczywistych. Wybierajac ˛ na płaszczyźnie dwie prostopadłe osie liczbowe: jedna˛ pozioma,˛ druga˛ pionowa,˛ możemy utożsamiać punkty płaszczyzny z parami
liczb rzeczywistych, a wi˛ec i liczbami zespolonymi. Zwyczajowo oś pozioma odpowiada cz˛eści rzeczywistej liczby zespolonej, a oś pionowa cz˛eści urojonej liczby
zespolonej. Tak opisana płaszczyzna nazywana jest płaszczyzna˛ zespolona.˛ Jeszcze wi˛ecej korzyści odniesiemy idac ˛ krok dalej i interpretujac
˛ liczb˛e zespolona˛
z = a + bi nie tylko jako punkt płaszczyzny o współrz˛ednych (a, b), ale jako wektor łacz ˛ acy
˛ poczatek˛ układu, czyli punkt o współrz˛ednych (0, 0) z punktem
o współrz˛ednych (a, b). Tak zinterpretowana˛ liczb˛e zespolona˛ przedstawiono na rysunku 2.8 . Znane z geometrii twierdzenie Pitagorasa podpowiada nam, że
moduł liczby zespolonej z możemy interpretować jako długość odpowiadajacego˛ liczbie z wektora. Z kolei liczb˛e sprz˛eżona˛ interpretować możemy jako odbicie
symetryczne wektora w osi liczb rzeczywistych. Co wi˛ecej, dodawanie liczb zespolonych interpretować można jako dodawanie wektorów, co zilustrowano na
rysunku 2.9 .
Nieco bardziej delikatna jest interpretacja geometryczna mnożenia liczb zespolonych. Na razie ograniczymy si˛e do obserwacji, że mnożenie liczby zespolonej
z przez jednostk˛e urojona˛ i może być interpretowane jako obrót wektora wokół poczatku
˛ układu o kat˛ prosty w kierunku przeciwnym do ruchu wskazówek zegara.
Zilustrowano to na rysunku 2.10 .
Liczb˛e |z1 − z2 | można interpretować jako odległość pomi˛edzy liczbami zespolonymi z1 i z2 . Zilustrowano to na rys. 2.11 .
Liczby zespolone pozwalaja˛ zalgebraizować geometri˛e płaszczyzny poprzez nadanie jej struktury ciała. Powstaje naturalne pytanie, czy podobnie da si˛e
82 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Rysunek 2.10: Interpretacja geometryczna iloczynu liczby zespolonej przez liczbę i. Wektor reprezentujący iz powstaje z
wektora reprezentującego z przez obrót o kąt prosty wokół początku układu przeciwnie do ruchu wskazówek zegara.

Rysunek 2.11: Odległość liczb zespolonych z1 i z2 .


2.6. LICZBA E I RZECZYWISTA FUNKCJA WYKŁADNICZA 83

zrobić z geometria˛ przestrzeni trójwymiarowej. Wprowadzajac ˛ układ współrz˛ednych zbudowany z trzech wzajemnie prostopadłych prostych traktowanych jako
osi liczbowe możemy utożsamiać punkty trójwymiarowej przetrzeni (i wektory zaczepione w poczatku ˛ układu) jako trójki liczb, a sama˛ trójwymiarowa˛ przestrzeń
jako R3 . Trójki liczb i ogólnie układy d liczb postaci (x1 , x2 , . . . xd ) (d-wymiarowe wektory) można dodawać po współrz˛ednych podobnie jak w przypadku
liczb zespolonych. Jednak mnożenie nadajace ˛ struktur˛e ciała możliwe jest jedynie dla d równego jeden, dwa i cztery. Przypadki d = 1 i d = 2 znamy (ciało
uporzadkowane
˛ liczb rzeczywistych i ciało liczb zespolonych). Dla d = 4 można zdefiniować mnożenie, które nie jest przemienne i nadaje zbiorowi R4 struktur˛e
ciała nieprzemiennego, a wi˛ec ciała w którym prawo przemienności dla mnożenia nie obowiazuje. ˛ Ciało to zwane jest ciałem kwaternionów.
Dla każdego d ∈ N można jednak mnożyć wektor (x1 , x2 , . . . , xd ) przez liczb˛e. Uzyskuje si˛e w ten sposób struktur˛e algebraiczna˛ w zbiorze takich
wektorów oznaczanym Rd jako iloczyn kartezjański d kopii zbioru liczb rzeczywistych Rd . Otrzymana w ten sposób struktura zwana jest przestrzenia˛ wektorowa.˛
Strukturami takimi zajmiemy si˛e w rozdziale 7.1 .

2.7.5 Zespolona funkcja kwadratowa


Wiemy ze szkoły, że miejsca zerowe funkcji kwadratowej
x 7→ ax2 + bx + c

zależa˛ od tzw. wyróżnika ∆ := b2 −4ac, w szczególności miejsc zerowych nie ma, gdy wyróżnik jest ujemny. Sytuacja ulega zmianie, gdy w funkcji tej dopuścimy
argument zespolony.

Twierdzenie 2.7.6 Rozważmy zespoloną funkcją kwadratową o współczynnikach rzeczywistych tj. funkcję

Q : C 3 z 7→ az 2 + bz + c ∈ C,

gdzie a, b, c ∈ R są zadanymi współczynnikami rzeczywistymi i a 6= 0. Niech ∆ := b2 − 4ac. Jeśli ∆ > 0, to Q ma dwa


rzeczywiste miejsca zerowe √
−b ± ∆
z1,2 := .
2a
Gdy ∆ = 0 funkcja Q ma jeden pierwiatek rzeczywisty
−b
z := .
2a
Natomiast dla ∆ < 0 mamy dwa zespolone, wzajemnie sprzężone miejsca zerowe

−b ± i −∆
z1,2 := .
2a

2.7.6 Liczby zespolone o module jeden czyli okrąg jednostkowy.


Wśród liczb zespolonych szczególną rolę odgrywają te, których moduł wynosi jeden. Ponieważ w interpretacji geometrycznej
moduł liczby zespolonej mierzy jej odległość od początku układu, więc zbiór liczb zespolonych o module jeden tworzy okrąg
o środku w początku układu i promieniu jeden. Zwyczajowo oznaczamy go

S1 := { z ∈ C | |z| = 1 }.

Półprosta poprowadzona z poczatku


˛ układu współrz˛ednych pod katem
˛ ˛ jednostkowy S1 w punkcie zψ ∈ C o współrz˛ednych
ψ do osi X przecina okrag
(cos ψ, sin ψ). Zobrazowano to na rysunku rys. 2.12 .
˛ ϕ oraz ψ i odpowiednie liczby zespolone zϕ oraz zψ .
Rozważmy dwa katy
84 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE

Rysunek 2.12: Liczby zespolone o module jeden.

Wykorzystujac
˛ tożsamości trygonometryczne dla sumy katów
˛ można pokazać, że

zϕ+ψ = cos(ϕ + ψ) + i sin(ϕ + ψ)


= (cos ϕ cos ψ − sin ϕ sin ψ) + i(sin ϕ cos ψ + cos ϕ sin ψ)
= (cos ϕ + i sin ϕ)(cos ψ + i sin ψ)
= zϕ zψ .

To przypomina fundamentalna˛ własność funkcji wykładniczej. Matematyk szwajcarski Leonard Euler pokazał, że rzeczywista˛ funkcj˛e wykładnicza˛ można rozszerzyć
na argumenty zespolone

X zn
ez :=
n=0
n!
i przy takiej definicji dla x ∈ R zachodzi słynny wzór o nawijaniu prostej na okrag
˛

eix = cos x + i sin x,


który jest wygodna˛ podstawa˛ tak formalnej definicji jak i własności funkcji trygonometrycznych. Aby pójść ta˛ droga˛ potrzebujemy rozszerzyć poj˛ecie granicy
ciagu
˛ i zbieżności szeregu na liczby zespolone.
Rozdział 3

Własności topologiczne przestrzeni


metrycznych

3.1 Metryki i przestrzenie metryczne


3.1.1 Metryka
Jak widzieliśmy w poprzednim rozdziale jest potrzeba rozszerzenia poj˛ecia granicy tak, by przynajmniej obejmowało ono granice ciagów ˛ liczb zespolonych.
W rzeczywistości, jak już mówiliśmy, koncepcja granicy jest kluczowa dla całej analizy. Dlatego spróbujemy zastanowić si˛e co jest rzeczywiście niezb˛edne do
zdefiniowania granicy.
Intencja˛ nierówności |xn − g| < ε w definicji Cauchy’ego granicy ciagu ˛ jest stwierdzenie, że xn leży nie dalej niż ε od g . Jeśli wi˛ec w jakimś zbiorze
X potrafimy w sensowny sposób mierzyć odległość mi˛edzy punktami tego zbioru, to możemy też zdefiniować granic˛e ciagu
˛ punktów tego zbioru. Pytanie, co to
znaczy w sensowny sposób mierzyć odległość. Okazuje si˛e, że potrzebna jest funkcja % : X × X → R∗ o trzech elementarnych własnościach cechujacych ˛
każda˛ odległość.

Definicja 3.1.1 Odległością (metryką) w zbiorze X nazywamy odwzorowanie

% : X × X → R∗

spełniające własności
(i) %(x, y) = 0 ⇔ x = y,

(ii) %(x, y) = %(y, x),


(iii) %(x, z) ¬ %(x, y) + %(y, z).

Intuicyjne znaczenie tych trzech własności jest dość oczywiste. Własność (i) mówi, że w odległości zero od punktu x jest tylko on sam. Własność (ii) postuluje,
że odległość z punktu x do punktu y jest taka sama jak z x do y . Z kolei ostatnia własność, zwana nierównościa˛ trójkata ˛ stwierdza, że przejście z punktu x do
punktu z przez punkt y nie może zajać
˛ mniej niż bezpośrednie przejście z x do z . Może zajać ˛ tyle samo jeśli punkt y leży po drodze z x do z .

Definicja 3.1.2 Przestrzenią metryczną nazywamy parę (X, %) gdzie X jest zbiorem, a % metryką w X.
Często, aby wzbogacić język, mówić będziemy, że X jest przestrzenią metryczną z metryką % mając na myśli, że para
(X, %) jest przestrzenią metryczną. Co więcej, czasem powiemy jedynie, że X jest przestrzenią metryczną przyjmując, że
metryka jest dana domyślnie.

85
86 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH

3.1.2 Granica ciągu w przestrzeni metrycznej


Niech x : N → X będzie ciągiem o wartościach w przestrzeni metrycznej (X, %). Posługując się pojęciem metryki możemy
postawić definicję granicy takiego ciągu analogicznie do definicji 2.4.2

Definicja 3.1.3 Mówimy, że ciąg x jest zbieżny do granicy g ∈ X jeżeli

∀ε > 0 ∃N ∈ N ∀n > N %(xn , g) < ε.

Piszemy wtedy
lim xn = g.
n→∞

Twierdzenie 3.1.4 Jeśli limn→∞ xn = g1 i limn→∞ xn = g2 , to g1 = g2 . Innymi słowy, jeśli ciąg ma granicę, to jest
ona wyznaczona jednoznacznie.

Dowód: [•] Załóżmy, że istnieją dwie różne granice g1 6= g2 . Wtedy ε := %(g12,g2 ) > 0. Z definicji granicy znajdziemy N1
takie, że %(xn , g1 ) < ε dla n ­ N1 oraz N2 takie, że %(xn , g2 ) < ε dla n ­ N2 . Niech n ­ max(N1 , N2 ). Wtedy %(xn , g1 ) < ε
i %(xn , g2 ) < ε, zatem z własności (iii) oraz (ii) metryki dostajemy

%(g1 , g2 ) ¬ %(g1 , xn ) + %(xn , g2 ) < ε + ε = %(g1 , g2 ).

Otrzymana sprzeczność dowodzi, że g1 = g2 .




3.1.3 Metryka w zbiorze liczb rzeczywistych i zespolonych


Dla x, y ∈ R przyjmijmy oznaczenie
%R (x, y) := |x − y|. (3.1)

Twierdzenie 3.1.5 Odwzorowanie


% R : R × R → R∗
jest metryką w R.

Dowód: Jest to natychmiastowy wniosek z twierdzenia 2.1.10 . 


Podobnie dla u = x1 + x2 i oraz v = y1 + y2 i przyjmijmy oznaczenie

%C (u, v) := |u − v| = (x1 − y1 )2 + (x2 − y2 )2 . (3.2)


p

Twierdzenie 3.1.6 Funkcja %C : C2 → R∗ jest metryką w C.

Dowód: Jest to natychmiastowy wniosek z twierdzenia 2.7.5 . 


3.1. METRYKI I PRZESTRZENIE METRYCZNE 87

3.1.4 Metryka euklidesowa w Rd


Jak wiemy, liczby zespolone można utożsamiać z parami liczb rzeczywistych, a wi˛ec elementami R2 . Zatem metryk˛e dana˛ wzorem (3.2) można też traktować
jako metryk˛e na płaszczyźnie Naturalne jest pytanie, czy w podobny sposób da si˛e zdefiniować metryk˛e w zbiorze Rd składajacym
˛ si˛e z d-wymiarowych wektorów
czyli układów d liczb postaci (x1 , x2 , . . . xd ).
Dla x = (x1 , x2 , . . . , xd ) ∈ Rd oraz y = (y1 , y2 , . . . , yd ) ∈ Rd definiujmy
v
u d
uX
%e (x, y) := t (xi − yi )2 . (3.3)
i=1

Twierdzenie 3.1.7 Funkcja


%e : Rd × Rd 3 (x, y) 7→ %e (x, y) ∈ R∗
jest metryką w Rd .

Dowód: Własności (i) oraz (ii) definicji metryki są oczywiste. Dowód własności (iii) jest nieco bardziej skomplikowany.
Przeprowadzimy go w rozdziale 7.1 . 
Metryka zadana wzorem (3.3) nosi nazwę euklidesowej, bo odległość między dwoma punktami przestrzeni R3 mierzona w
tej metryce to odległość w geometrii otaczającej nas przestrzeni. Geometria ta zwana jest euklidesową, bo grecki matematyk
Euklides w III stuleciu p.n.e. pierwszy stworzył matematyczne podstawy do jej badania.
Jednak metryka euklidesowa nie jest jedynym sposobem mierzenia odległości w przestrzeni Rd . Istotnie różnych funkcji
spełniających wymogi definicji metryki jest nieskończenie wiele, a co najmniej kilka przydaje się w różnych zastosowaniach.

3.1.5 Inne przykłady metryk w Rd .


Dla x = (x1 , x2 , . . . , xd ) ∈ Rd oraz y = (y1 , y2 , . . . , yd ) ∈ Rd definiujemy

%max (x, y) := max { |xi − yi | | i = 1, 2, . . . d },


d
X
%1 (x, y) := |xi − yi |.
i=1

Twierdzenie 3.1.8 Funkcja %max jest metryką w Rd .

Dowód: [•] Własność (i) definicji metryki wynika z własności (2.9) wartości bezwzględnej, a własność (ii) z własności
(2.8) wartości bezwzględnej. Na mocy własności (2.11) wartości bezwzględnej dla dowolnego i = 1, 2, . . . d oraz punktów
x = (x1 , x2 , . . . , xd ), y = (y1 , y2 , . . . , yd ), z = (z1 , z2 , . . . , zd ) mamy

|xi − zi | = |(xi − yi ) + (yi − zi )| ¬ |xi − yi | + |yi − zi |. (3.4)

Połóżmy

a: = max { |xi − yi | | i = 1, 2, . . . d }
b: = max { |yi − zi | | i = 1, 2, . . . d }.

Ponieważ maksimum to wartość największa w zbiorze, więc dla i = 1, 2, . . . d zachodzą nierówności

|xi − yi | ¬ a

oraz
|yi − zi | ¬ b.
88 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH

Rysunek 3.1: Odległość punktów x, y ∈ R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony).

Dodając te nierówności stronami z nierówności (3.4) dostajemy

|xi − zi | ¬ |xi − yi | + |yi − zi | ¬ a + b. (3.5)

Nierówność (3.5) oznacza, że wyrażenie po jej prawej stronie jest majorantą zbioru

{ |xi − zi | | i = 1, 2, . . . d }.

Zatem wartość największa w tym zbiorze, jako najmniejsza majoranta, spełnia nierówność

max { |xi − zi | | i = 1, 2, . . . d } ¬ a + b = max { |xi − yi | | i = 1, 2, . . . d } + max { |yi − zi | | i = 1, 2, . . . d }

co dowodzi własności (iii) metryki. 

Twierdzenie 3.1.9 Funkcja %1 jest metryką w Rd .

Dowód: ćwiczenie.
Metrykę %max określa się mianem metryka maksimum, a metrykę %1 mianem metryka Manhattan. Nazwa tej drugiej na-
wiązuje do drogi jaką trzeba przebyć pomiędzy dwoma punktami w regularnej siatce wzajemnie prostopadłych ulic dzielnicy
Nowego Jorku na wyspie Manhattan (patrz rys. 3.1 ).
Łatwo sprawdzić, że dla d = 1 metryka euklidesowa, metryka maksimum i metryka Manhattan są sobie równe i dane
wzorem %(x, y) = |x − y| dla x, y ∈ R.
Przykład liczenia odległości w R2 w różnych metrykach przedstawiono na rys. 3.1 .
Różnorodność dost˛epnych w jednej przestrzeni metryk rodzi pytanie jak to ma si˛e do poj˛ecia granicy. Czyli jeśli ciag
˛ ma granic˛e wzgl˛edem jednej metryki to
ma ja˛ również wzgl˛edem innej metryki? Odpowiedź na to pytanie nie jest prosta. Wszystko zależy od generowanej przez metryk˛e topologii, czyli rodziny zbiorów
otwartych. Zbiory otwarte uogólniaja˛ ide˛e przedziału otwartego. Zbiory otwarte wzgl˛edem zadanej metryki zdefiniujemy w rozdziale 3.2 . Natomiast teraz podamy
przykład metryki wzgl˛edem której jedynie ciagi
˛ stałe od pewnego wyrazu poczynajac ˛ sa˛ zbieżne.
Niech X będzie dowolnym zbiorem. Dla x, y ∈ X połóżmy
(
0 gdy x = y,
%0 (x, y) := (3.6)
1 gdy x =
6 y.
3.1. METRYKI I PRZESTRZENIE METRYCZNE 89

Twierdzenie 3.1.10 Funkcja %0 jest metryką na zbiorze X.

Metryka zadana wzorem (3.6) zwana jest metryką dyskretną.

Ćwiczenie 3.1.11 Udowodnić, że ciąg a : N → X jest zbieżny w przestrzeni (X, %0 ), gdzie %0 oznacza metrykę
dyskretną, wtedy i tylko wtedy gdy istnieje m ∈ N takie, że dla n ­ m zachodzi an = an+1 .

Ćwiczenie 3.1.12 Pokazać, że funkcja % : R2 × R2 → R∗ dana wzorem


(
|y2 − x2 | gdy x1 = y1 ,
%((x1 , x2 ), (y1 , y2 )) := (3.7)
|y1 − x1 | + |x2 | + |y2 | gdy x1 =
6 y1 ,

jest metryką na R2 .

Wobec różnorodności dostępnych w Rd metryk przyjmujemy zasadę, że jeśli nie powiedziano wyraźnie inaczej, przestrzeń
R traktujemy jako przestrzeń metryczną z metryką euklidesową.
d

3.1.6 Metryka indukowana i podprzestrzenie przestrzeni metrycznej


Przypomnijmy, że metryka w przestrzeni X jest funkcją % : X × X → R∗ . Niech Y ⊂ X będzie podzbiorem. Ograniczając
się do mierzenia przy pomocy metryki % odległości pomiędzy punktami z Y rozważamy nową funkcję będącą zawężeniem %
do Y × Y ⊂ X × X. Zawężenie takie oznaczamy %|Y ×Y . Naturalne jest pytanie czy takie zawężenie zadaje metrykę w Y .
Jest tak w istocie, jak pokazuje poniższe twierdzenie.

Twierdzenie 3.1.13 Niech (X, %) będzie przestrzenią metryczną, a Y ⊂ X podzbiorem. Wtedy %Y := %|Y ×Y jest
metryką w Y .

Dowód: ćwiczenie.

Definicja 3.1.14 Metrykę %Y nazywamy metryką indukowaną z X w Y , a przestrzeń metryczną (Y, %Y ) nazywamy
podprzestrzenią przestrzeni (X, %).

Zatem każdy podzbiór przestrzeni metrycznej jest przestrzenią metryczną. Pokazuje to, że przestrzenie metryczne mogą
być bardzo różnorodne.

3.1.7 Kule
Krokiem pośrednim do zdefiniowania zbiorów otwartych wzgl˛edem danej metryki jest poj˛ecie kuli. Zaznaczmy, że chodzi o dość abstrakcyjne użycie słowa kula,
bo jedynie w przypadku metryki euklidesowej w R3 kula jaka˛ zdefiniujemy pokrywa si˛e z potocznym znaczeniem słowa kula.
90 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH

Rysunek 3.2: Kule w R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony). Odpowiednie
sfery zaznaczono ciemniejszym kolorem.

Definicja 3.1.15 Niech (X, %) będzie przestrzenią metryczną, x punktem w X, a r liczbą rzeczywistą dodatnią. Kulą
otwartą w X o środku w x i promieniu r nazywamy zbiór

K(x, r) := K% (x, r) := { y ∈ X | %(y, x) < r }.

Podobnie definiujemy kulę domkniętą jako zbiór

K̄(x, r) := K̄% (x, r) := { y ∈ X | %(y, x) ¬ r },

a sferę jako zbiór


S(x, r) := S% (x, r) := { y ∈ X | %(y, x) = r }.

Dla ustalonej przestrzeni metrycznej (X, %) oraz x ∈ X będziemy używać oznaczenia

Ball(x) := Ball(x, X) := Ball(x, X, %) := { K(x, r) | r ∈ R+ }

na rodzinę kul otwartych o środku w x.


Przykład kul domkniętych i sfer w R2 w różnych metrykach przedstawiono na rys. 3.2 .
Różnica mi˛edzy kula˛ domkni˛eta,˛ a otwarta˛ jest analogiczna do różnicy mi˛edzy przedziałem domkni˛etym, a przedziałem otwartym. Na rysunku można je
rozróżnić tylko umownie, na przykład zaznaczajac˛ sfer˛e ograniczajac
˛ a˛ kul˛e otwarta˛ linia˛ cienka,˛ a sfer˛e ograniczajac
˛ a˛ kul˛e domkni˛eta˛ linia˛ gruba˛ (rys. 3.3 ).

Ćwiczenie 3.1.16 Pokazać, że kula w metryce dyskretnej jest albo singletonem, albo całą przestrzenią. Jak wyglądają
kule w metryce danej wzorem (3.7)?
3.1. METRYKI I PRZESTRZENIE METRYCZNE 91

Rysunek 3.3: Umowne przedstawienie różnicy między kulą domknięta, sferą i kulą otwartą.

3.1.8 Zbiory i funkcje ograniczone


W dalszym ciągu przyjmujemy, że X jest przestrzenią metryczną z metryką %.

Definicja 3.1.17 Podzbiór A ⊂ X przestrzeni metrycznej (X, %) nazywamy ograniczonym względem metryki %, lub
krótko ograniczonym gdy metryka jest znana z kontekstu, jeśli istnieje kula K(x, r) względem metryki % o środku w
x i promieniu r taka, że A ⊂ K(x, r). Funkcja f : Z → X jest ograniczona, jeżeli jej obraz

im f := { f (x) | x ∈ X }

jest zbiorem ograniczonym.

Twierdzenie 3.1.18 Suma mnogościowa skończonej liczby zbiorów ograniczonych jest zbiorem ograniczonym.

Dowód: ćwiczenie.

Ćwiczenie 3.1.19 Pokazać, że w metryce dyskretnej każdy zbiór jest ograniczony.

3.1.9 Średnica zbioru

Definicja 3.1.20 Średnicę niepustego zbioru A ⊂ X definiujemy jako

%(A) := sup { %(x, y) | x, y ∈ A }

gdy A jest zbiorem niepustym, a jako zero w przeciwnym razie.


Zauważmy, że dla metryki euklidesowej %e w R oraz x, y ∈ R takich, że x ¬ y średnica przedziału otwartego (x, y) oraz
domkniętego [x, y] wynosi y − x.
92 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH

Uwaga 3.1.21 Średnica zbioru ma następujące własności.


(i) Kula K(x, r) ma średnicę 2r.
(ii) Jeśli A ⊂ B, to %(A) ¬ %(B).

(iii) Średnica zbioru A wynosi zero wtedy i tylko wtedy, gdy zbiór A ma dokładnie jeden element.
(iv) Zbiór A jest ograniczony wtedy i tylko wtedy, gdy jego średnica jest skończona.
T∞
(v) Jeśli A : N → P(X) jest ciągiem zbiorów takich, że %(An ) < n1 , to %( n=1 An ) = 0.

Dowód: Dowód własności (i), (ii) oraz (iii) pozostawiamy jako proste ćwiczenie. Aby pokazać własność (iv) zauważmy,
że jeśli A jest ograniczony, to daje się zawrzeć w pewnej kuli. A wtedy z (ii) wynika, że średnica zbioru A nie jest większa
niż średnica kuli. Na odwrót, jeśli średnica jest skończona i wynosi s, to wybierając dowolny punkt x ∈ A łatwo zauważyć,
że A ⊂ K̄(x, s). Zatem A jest ograniczony. T∞
Pozostaje pokazać Twłasność (v). Dla dowodu nie wprost załóżmy, że %( n=1 An ) 6= 0. Z własności (iii) wnosimy, że

istnieją punkty x, y ∈ n=1 An , takie, że %(x, y) > 0. Dobierzmy n0 ∈ N takie, że
1
< %(x, y). (3.8)
n0
Ponieważ punkty x i y należą do części wspólnej zbiorów An , więc w szczególności należą do zbioru An0 . Zatem %(x, y) ¬
%(An0 ) ¬ n10 , co przeczy (3.8). 
Niech a = (a1 , a2 , . . . , ad ) i b = (b1 , b2 , . . . , bd ) będą punktami w Rd takimi, że ai ¬ bi dla i = 1, 2, . . . , d. Kostką w Rd
nazywamy zbiór postaci
[a1 , b1 ] × [a2 , b2 ] × · · · × [ad , bd ]. (3.9)

Twierdzenie 3.1.22 Średnica kostki Q postaci (3.9) dana jest wzorem

%(Q) = (b1 − a1 )2 + (b2 − a2 )2 + · · · + (bd − ad )2 . (3.10)


p

Ponadto, dla każdego x ∈ Q mamy


Q ⊂ K(x, %(Q[a, b])) (3.11)

Dowód: ćwiczenie.

3.2 Zbiory otwarte i domknięte


Zdefiniujemy teraz zbiór otwarty wzgl˛edem danej metryki oraz wprowadzimy dualne poj˛ecie zbioru domkni˛etego. Wśród podzbiorów R pierwowzorem dla zbioru
otwartego jest przedział otwarty, a dla zbioru domkni˛etego jest przedział domkni˛ety. Bardziej ogólnie, poj˛ecia zbioru otwartego i domkni˛etego uogólniaja˛ odpowied-
nio poj˛ecia kuli otwartej i domkni˛etej. Intuicyjnie zbiór otwarty to taki, który jest rozłaczny
˛ ze swoim brzegiem, a zbiór domkni˛ety to taki, który zawiera swój brzeg.
Punkt x jest punktem brzegowym zbioru A jeżeli każda kula o środku w x zawiera tak punkty należace ˛ do A jak i nie należace
˛ do A. Ide˛e t˛e przedstawiono na
rys. 3.4 .

Definicja 3.2.1 Niech A ⊂ X. Mówimy, że punkt x ∈ X jest punktem brzegowym zbioru A, jeżeli w każdej kuli o
środku w punkcie x istnieje przynajmniej jeden punkt należący do zbioru A i przynajmniej jeden punkt nienależący
do zbioru A. Brzegiem zbioru A w X nazywamy zbiór punktów brzegowych zbioru A, a więc zbiór

bd A := { x ∈ X | ∀r > 0 K(x, r) ∩ A 6= ∅ i K(x, r) \ A 6= ∅ }.


3.2. ZBIORY OTWARTE I DOMKNIĘTE 93

Rysunek 3.4: Poszukiwanie punktów brzegowych (na górze po lewej) zbioru A, brzeg zbioru A (na górze po prawej),
domknięcie zbioru A jako przykład zbioru domkniętego (na dole po lewej) i wnętrze zbioru A jako przykład zbioru otwartego
(na dole po prawej).

Wprost z powyższej definicji wynika następująca uwaga.

Uwaga 3.2.2 Punkt x jest punktem brzegowym zbioru A wtedy i tylko wtedy gdy jest on punktem brzegowym uzupeł-
nienia zbioru A. W szczególności, dla dowolnego A ⊂ X mamy

bd A = bd \A. (3.12)

Jeśli punkt x nie jest punktem brzegowym, to albo istnieje r > 0 takie, że K(x, r) ⊂ A, albo istnieje r > 0 takie, że K(x, r) ∩ A = ∅. W
szczególności, jeśli żaden punkt zbioru A nie jest jego punktem brzegowym, to dla każdego x ∈ A istnieje r > 0 takie, że K(x, r) ⊂ A, bo jeśli x ∈ A, to
dla dowolnego r > 0 mamy x ∈ K(x, r) ∩ A, czyli K(x, r) ∩ A 6= ∅. Podsumujemy te obserwacje w poniższej definicji i twierdzeniu.

Definicja 3.2.3 Mówimy, że A jest otwarty, jeżeli żaden punkt brzegowy zbioru A do zbioru A nie należy. Innymi
słowy, A jest otwarty gdy A ∩ bd A = ∅.

Twierdzenie 3.2.4 A jest otwarty wtedy i tylko wtedy gdy

∀x ∈ A ∃r > 0 K(x, r) ⊂ A. (3.13)

Dowód: Załóżmy, że własność (3.13) nie zachodzi. Zatem istnieje x ∈ A takie, że K(x, r) \ A 6= ∅ dla każdego r > 0.
Ponieważ x ∈ A ∩ K(x, r), więc również A ∩ K(x, r) 6= ∅. Zatem x jest punktem brzegowym A, co przeczy otwartości
A. Zatem otwartość zbioru A implikuje własność (3.13). Załóżmy z kolei, że własność (3.13) zachodzi. Z własności tej
natychmiast wynika, że punkty zbioru A nie są punktami brzegowymi zbioru A. Zatem A jest otwarty. 

Definicja 3.2.5 Mówimy, że A jest domknięty, jeżeli każdy punkt brzegowy zbioru A do zbioru A należy. Tak więc
A jest domknięty gdy bd A ⊂ A.

Twierdzenie 3.2.6 A jest domknięty wtedy i tylko wtedy gdy

∀x 6∈ A ∃r > 0 K(x, r) ∩ A = ∅. (3.14)


94 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH

Dowód: ćwiczenie.
Z twierdzeń 3.2.4 i 3.2.6 wynika natychmiast następujący wniosek.

Wniosek 3.2.7 Zbiór A jest otwarty wtedy i tylko wtedy gdy jego uzupełnienie jest zbiorem domkniętym.

Ćwiczenie 3.2.8 Pokazać, że w metryce dyskretnej każdy zbiór jest równocześnie otwarty i domknięty.

Ćwiczenie 3.2.9 Podać przykład zbioru w R2 z metryką euklidesową, który nie jest otwarty i równocześnie nie jest
domknięty.

Twierdzenie 3.2.10 Kula otwarta K(x, r) jest zbiorem otwartym, a kula domknięta K̄(x, r)jest zbiorem domkniętym.

Dowód: [•] Aby pokazać, że K(x, r) jest zbiorem otwartym ustalmy x0 ∈ K(x, r). Wtedy %(x, x0 ) < r. Połóżmy
r := r − %(x, x0 ). Zatem r0 > 0. Pokażemy, że K(x0 , r0 ) ⊂ K(x, r). Rzeczywiście, jeśli y ∈ K(x0 , r0 ), to %(y, x0 ) < r0 . Zatem
0

%(y, x) ¬ %(y, x0 ) + %(x0 , x) < r0 + %(x0 , x) = r, co dowodzi, że y ∈ K(x, r). Udowodniliśmy zatem, że K(x, r) spełnia warunek
(3.13) twierdzenia (3.2.4). Tym samym K(x, r) jest zbiorem otwartym.
Aby pokazać, że K̄(x, r) jest zbiorem domkniętym ustalmy x0 6∈ K̄(x, r). Wtedy %(x, x0 ) > r. Połóżmy r0 := %(x, x0 ) − r.
Zatem r0 > 0. Pokażemy, że K(x0 , r0 ) ∩ K̄(x, r) = ∅. Rzeczywiście, jeśli y ∈ K̄(x, r) ∩ K(x0 , r0 ) to

%(x, x0 ) ¬ %(y, x) + %(x0 , y) < r + r0 = %(x, x0 )

co jest nierównością fałszywą. Zatem pokazaliśmy własność (3.14) twierdzenia 3.2.6 co dowodzi, że K̄(x, r) jest zbiorem
domkniętym. 

Twierdzenie 3.2.11 Niech (X, %) będzie przestrzenią metryczną. Zbiory otwarte w X mają następujące własności.

(i) Zbiór pusty i cała przestrzeń są zbiorami otwartymi.


(ii) Przecięcie dwóch zbiorów otwartych jest zbiorem otwartym.
(iii) Suma dowolnej rodziny zbiorów otwartych jest zbiorem otwartym.

Dowód: [•] Łatwo zauważyć, że tak zbiór pusty jak i cała przestrzeń nie posiadają punktów brzegowych skąd natychmiast
wynika, że są one otwarte. Dowodzi to (i). Niech U, V ⊂ X będą zbiorami otwartymi i niech x ∈ U ∩ V . Z twierdzenia 3.2.4
znajdziemy r1 > 0 takie, że K(x, r1 ) ⊂ U oraz r2 > 0 takie, że K(x, r2 ) ⊂ V . Niech r := min(r1 , r2 ). Wtedy r > 0 oraz

K(x, r) ⊂ K(x, r1 ) ∩ K(x, r2 ) ⊂ U ∩ V

co pokazuje, że U ∩ V jest zbiorem otwartym i zamyka dowód (ii).


Aby
S pokazać (iii) rozważmy rodzinę U ⊂ P(X) zbiorów otwarych. Aby pokazać, że U jest zbiorem otwartym Srozważmy
S
x ∈ U. Wtedy x ∈ U dla pewnego U ∈ U. Z twierdzenia 3.2.4 znajdziemy r > 0 takie, że K(x, r) ⊂ U ⊂ U. Zatem
U jest zbiorem otwartym.
S

3.2. ZBIORY OTWARTE I DOMKNIĘTE 95

Warto zauważyć, że choć własność (ii) zbiorów otwartych przenosi się na przecięcie dowolnej skończonej rodziny zbiorów
otwartych, to nie musi zachodzić gdy rodzina jest nieskończona. Na przykład, przecięcie rodziny przedziałów otwartych
{ (− n1 , n1 ) | n ∈ N1 } jest singletonem {0}, który nie jest zbiorem otwartym.
Podobnie do zbiorów otwartych zachowują się zbiory domknięte, ale w tym przypadku to suma nieskończonej rodziny
zbiorów domkniętych nie musi być domknięta.

Twierdzenie 3.2.12 Niech (X, %) będzie przestrzenią metryczną. Zbiory domknięte w X mają następujące własności.
(i) Zbiór pusty i cała przestrzeń są zbiorami domkniętymi.
(ii) Suma dwóch zbiorów domkniętych jest zbiorem domkniętym.
(iii) Przecięcie dowolnej rodziny zbiorów domkniętych jest zbiorem domkniętym.

Dowód: ćwiczenie.

Definicja 3.2.13 Rodzinę zbiorów otwartych przestrzeni metrycznej nazywamy topologią tej przestrzeni.

W pierwszej chwili może wydawać się zaskakujące, że zbiór pusty i cała przestrzeń są równocześnie otwarte i domknięte.
Okazuje się jednak, że takich zbiorów może być więcej niż tylko zbiór pusty i cała przestrzeń. Dzieje się tak w przestrzeniach,
które zbudowane są z kilku kawałków. Przypomnijmy, że każdy niepusty podzbiór przestrzeni metrycznej jest też przestrzenią
metryczną z metryką indukowaną. W szczególności, rozważmy X = [1, 2] ∪ [3, 4] z metryką indukowaną z przestrzeni R. W
takiej przestrzeni zbiór [1, 2] jest równocześnie domknięty i otwarty. By się o tym przekonać, wystarczy przeanalizować jak
wyglądają kule w tej przestrzeni.

Ćwiczenie 3.2.14 W przestrzeni X = [1, 2] ∪ [3, 4] z metryką indukowaną z przestrzeni R wyliczyć kulę otwartą o
środku w punkcie 2 i promieniu r = 12 , r = 1, oraz r = 32 .

3.3 Metryki równoważne


Metryka pozwala nam zdefiniować takie poj˛ecia jak zbiory otwarte i domkni˛ete, a także zbiory spójne i zwarte, które pojawia˛ si˛e w nast˛epnym rozdziale. Poj˛ecia
te można definiować nie tylko przy pomocy metryki. Zajmuje si˛e tym dziedzina zwana topologia.˛ W analizie matematycznej interesuje nas tylko czy otwartość
(albo domkni˛etość, spójność czy zwartość) jakiegoś zbioru zależy od wybranej metryki, czy nie. Okazuje si˛e, że czasem zależy, a czasem nie. Poj˛ecie metryk
równoważnych opiera si˛e na otwartości zbiorów, ale okazuje si˛e, że wszystkie własności topologiczne zbiorów nie ulegna˛ zmianie, gdy metryk˛e zmienimy na
metryk˛e równoważna.˛

Definicja 3.3.1 Niech %1 i %2 będą metrykami w zbiorze X. Mówimy, że %1 i %2 są równoważne jeżeli dla każdego
zbioru A ⊂ X zbiór A jest otwarty względem metryki %1 wtedy i tylko wtedy gdy jest otwarty względem metryki %2 .

Twierdzenie 3.3.2 Metryki euklidesowa, maksimum i Manhattan w Rd są wzajemnie równoważne.

Dowód: Dowód wykorzystuje twierdzenie 3.2.4 . Pozostawiamy go jako ćwiczenie. Wskazówką jest rysunek 3.2 
96 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH

1.0

0.5

-10 -5 5 10

-0.5

-1.0

Rysunek 3.5: Silnie rosnąca bijekcja zbioru R̄ w przedział [−1, 1]. Punkt −∞ przechodzi w punkt −1, a punkt ∞ w punkt
1.

Ćwiczenie 3.3.3 Pokazać, że metryka euklidesowa i metryka dyskretna nie są równoważne.


Widzimy, że różne metryki moga˛ prowadzić do tej samej rodziny zbiorów otwartych, czyli topologii. I właśnie topologia jest tym co nas w tym wykładzie
interesuje bardziej niż metryka. Topologi˛e można studiować bez metryki. Wtedy przyjmuje si˛e jako aksjomaty własności rodziny zbiorów otwartych zawarte w tezie
twierdzenia 3.2.11 . Przestrzeń z zadana˛ rodzina˛ takich zbiorów nazywa si˛e przestrzenia˛ topologiczna.˛ Okazuje si˛e, że istnieja˛ przestrzenie topologiczne, których
topologii nie da si˛e zadać przy pomocy metryki. Słowo ’topologia’ to również nazwa dziedziny matematyki, która zajmuje si˛e badaniem przestrzeni topologicznych.

3.3.1 Metryka w R̄
W prowadzenie przestrzeni R̄ w rozdziale 2.3 pozwoliło na traktowanie każdego zbioru jako ograniczonego i w konsekwencji posiadajacego ˛ kres dolny i górny.
Zbiór w R, który nie jest ograniczony od góry rozważany w R̄ ma kres górny +∞. Podobnie, zbiór w R, który nie jest ograniczony od dołu rozważany w R̄
ma kres dolny −∞. Dysponujać ˛ metryka˛ w R̄ moglibyśmy też ujednolicić definicj˛e granicy ciagu
˛ tak, by obok granic skończonych obejmowała również granice
nieskończone.

Twierdzenie 3.3.4 Istnieje silnie rosnąca bijekcja h : R̄ → [−1, 1]. W szczególności jest taką funkcja zadana wzorem

x = −∞,

−1

h(x) := 1+|x| x ∈ R,
x
(3.15)
1 x = ∞.

Jeśli h : R̄ → [−1, 1] jest silnie rosnącą bijekcją, to funkcja %h : R̄ × R̄ → R∗ dana wzorem

%h (x, y) := |h(x) − h(y)|

jest metryką w R̄. Co więcej, jeśli h1 , h2 : R̄ → [−1, 1] są dwoma silnie rosnącymi bijekcjami, to metryki %h1 i %h2 są
równoważne.
3.4. PUNKTY SKUPIENIA ZBIORU 97

Dowód: ćwiczenie.

Funkcję daną wzorem (3.15) zobrazowano na rysunku 3.5 . W dalszym ciągu zbiór R̄ traktować będziemy jako przestrzeń
metryczną z metryką %h .

Twierdzenie 3.3.5 Metryka indukowana z R̄ w R jest równoważna metryce euklidesowej w R.

Łatwo przeliczyć, że dla funkcji h danej wzorem (3.15) oraz dodatniego x ∈ R mamy %h (x, ∞) = 1+x
1
. Zatem dla r > 0
warunek %h (x, ∞) < r jest równoważny warunkowi x > r − 1 = r . Stąd dla r ∈ (0, 1) dostajemy wzór na kulę o środku
1 1−r

w nieskończoności i promieniu r
1−r
 
K%h (∞, r) = ,∞ . (3.16)
r
Dla r ∈ (0, 1) wyrażenie 1−r
r przyjmuje wszystkie wartości dodatnie. Pokazuje to, że definicja 2.4.5 granicy nieskończonej
w istocie podpada pod ogólną definicję granicy gdy zbieżność rozważać będziemy w przestrzeni R̄ z metryką %h .

3.4 Punkty skupienia zbioru


Zbiór liczb naturalnych N rozważany jako podzbiór zbioru liczb rzeczywistych R ma t˛e własność, że dla każdej liczby naturalnej można znaleźć kul˛e (na przykład
o promieniu 13 , w której nie ma już innych liczb naturalnych. Podobnie jest dla zbioru odwrotności liczb naturalnych, choć w tym przypadku promień kuli zależy
od punktu i wyznaczenie go jest mniej oczywiste. Co wi˛ecej, dla zbioru odwrotności liczb naturalnych można znaleźć punkt o tej własności, że w każdej kuli o
środku w tym punkcie znajduje si˛e co najmniej jedna odwrotność liczby naturalnej. Taki punkt jest dokładnie jeden i jest nim punkt zero. Obserwacje te prowadza˛
do zdefiniowania nast˛epujacych
˛ poj˛eć.

Definicja 3.4.1 Punkt x ∈ X nazywamy punktem skupienia zbioru A ⊂ X, jeżeli w każdej kuli K(x, r) znajdziemy
punkt y ∈ K(x, r) ∩ A różny od punktu x. Zbiór punktów skupienia zbioru A oznaczamy A0 .

Definicja 3.4.2 Mówimy, że x ∈ X jest punktem izolowanym zbioru A ⊂ X, jeżeli x ∈ A i x nie jest punktem
skupienia zbioru A.

Dla zbioru
A := { n1 | n ∈ N1 } ∪ { n+1
n
| n ∈ N1 }
jedynymi punktami skupienia są 0 i 1, z czego tylko 1 jest elementem A. Wszystkie pozostałe punkty zbioru A to jego punkty
izolowane.
Zbiór N̄ := N ∪ {∞} jest podzbiorem R̄, jest więc przestrzenią metryczną z metryką indukowaną z R̄. Łatwo sprawdzić,
że w przestrzeni tej wszystkie punkty są izolowane, z wyjątkiem punktu ∞, który jest punktem skupienia zbioru N ⊂ N̄, bo
na mocy wzoru (3.16) każda kula o środku w nieskończoności zawiera punkty z N̄ różne od nieskończoności.

Twierdzenie 3.4.3 Zbiór A ⊂ X jest domknięty wtedy i tylko wtedy gdy A0 ⊂ A.

Dowód:
Załóżmy najpierw, że A jest zbiorem domkniętym. Aby pokazać, że A0 ⊂ A, przypuśćmy, że tak nie jest. Wtedy znaj-
dziemy punkt x ∈ A0 \ A. Rozważmy dowolne r > 0. Wtedy x ∈ K(x, r) \ A, więc K(x, r) \ A 6= ∅. Równocześnie
K(x, r) ∩ A 6= ∅, bo x jest punktem skupienia zbioru A. Wnosimy więc, że x ∈ bd A, a zatem x ∈ A, bo A jest domknięty.
Otrzymana sprzeczność dowodzi, że domkniętość A implikuje A0 ⊂ A.
98 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH

Aby pokazać implikację przeciwną przyjmijmy, że A0 ⊂ A. Musimy pokazać, że bd A ⊂ A. Dla dowodu nie wprost
przypuśćmy, że tak nie jest i rozważmy punkt x ∈ bd A \ A. Wtedy dla dowolnego r > 0 znajdziemy punkt y ∈ K(x, r) ∩ A.
Co więcej, y 6= x, bo y ∈ A, a x 6∈ A. Zatem pokazaliśmy, że x jest punktem skupienia zbioru A, co, na mocy przyjętego
założenia, że A0 ⊂ A, dowodzi, że x ∈ A. Otrzymana sprzeczność kończy dowód. 

Twierdzenie 3.4.4 Punkt x ∈ X jest punktem skupienia zbioru A ⊂ X wtedy i tylko wtedy gdy istnieje ciąg a : N →
A \ {x} zbieżny do x.

Dowód: Załóżmy, że x ∈ X jest punktem skupienia zbioru A ⊂ X. Zatem dla każdego n ∈ N mamy K(x, n1 )∩A\{x} = 6 ∅.
Wybierzmy zatem an ∈ K(x, n1 ) ∩ A \ {x}. Nie jest trudno pokazać, że ciąg a : N 3 n 7→ an ∈ A \ {x} jest zbieżny do x. Dla
dowodu implikacji przeciwnej przyjmijmy, że a : N → A \ {x} jest zbieżny do x. Niech K = K(x, r) będzie kulą o środku
w x i promieniu r > 0. Ponieważ limn→∞ n1 = 0, możemy dobrać n ∈ N takie, że n1 < r. Wtedy an ∈ K(x, n1 ) ∩ A \ {x} ⊂
K(x, r) ∩ A \ {x}, co dowodzi, że x ∈ A0 . 

Twierdzenie 3.4.5 Zbiór A ⊂ X jest domknięty wtedy i tylko wtedy gdy dla każdego ciągu a : N → A jeśli a jest
zbieżny do x ∈ X to x ∈ A.

Dowód: Załóżmy, że A jest domknięty. Niech a : N → A będzie zbieżny do x ∈ X. Jeśli x jest wyrazem ciągu a, czyli
gdy x ∈ im a, to oczywiście x ∈ A. Jeśli x 6∈ im a, to z tw. 3.4.4 x ∈ A0 . Zatem z tw. 3.4.3 mamy x ∈ A.
Dla dowodu implikacji przeciwnej przyjmijmy, że dla każdego ciągu a : N → A jeśli a jest zbieżny do x ∈ X to x ∈ A.
Wystarczy pokazać, że A0 ⊂ A, bo wtedy z tw. 3.4.3 wynika, że A jest domknięty. Zatem weźmy x ∈ A0 . Z tw. 3.4.4
istnieje ciąg a : N → A \ {x} zbieżny do x. Zatem z przyjętego założenia x ∈ A, co pokazuje, że A0 ⊂ A i kończy dowód. 

3.5 Zbiory spójne.


Intuicja przestrzeni spójnej jest bardzo prosta. Jest to taka przestrzeń, która nie rozpada si˛e na dwa lub wi˛ecej kawałków. Formalna definicja jest jednak nieco
skomplikowana.

3.5.1 Zbiory niespójne i spójne


Niech X będzie przestrzenią metryczną.

Definicja 3.5.1 Mówimy, że zbiór E ⊂ X jest niespójny, jeżeli istnieją rozłączne zbiory otwarte A, B ⊂ X takie, że
A ∩ E 6= ∅ 6= B ∩ E oraz E ⊂ A ∪ B. Jeśli takie zbiory nie istnieją, mówimy, że E jest spójny.

3.5.2 Spójne podzbiory R.


W przypadku przestrzeni R z metryka˛ euklidesowa,˛ jeśli jakiś zbiór E ⊂ R ma t˛e właśność, że dwa punkty x, y do niego należa,˛ a punkt z leżacy
˛ pomi˛edzy nimi
do niego nie należy, to zbiór ten nie może być spójny. Intuicja tego faktu jest taka, że zbiór ten musi mieć co najmniej dwa kawałki. Jeden lub wi˛ecej leży poniżej
punktu z , a drugi (lub wi˛ecej) powyżej punktu z . Obserwacja ta prowadzi do nast˛epujacego˛ twierdzenia.

Twierdzenie 3.5.2 Podzbiór E ⊂ R jest zbiorem spójnym, wtedy i tylko wtedy gdy

∀x, y ∈ E∀z ∈ R x < z ∧ z < y ⇒ z ∈ E. (3.17)

Dowód: (*)Załóżmy, że E jest spójny, ale warunek (3.17) nie zachodzi. Wtedy istnieją x, y ∈ E oraz z 6∈ E takie, że
x < z < y. Połóżmy A := (−∞, z) oraz B := (z, ∞). Zbiory A i B są otwarte, rozłączne oraz E ⊂ A ∪ B. Zatem E nie jest
spójny. Otrzymana sprzeczność dowodzi, że spójność E implikuje warunek (3.17).
3.6. ZBIORY ZWARTE W PRZESTRZENIACH METRYCZNYCH 99

Dla dowodu implikacji przeciwnej przyjmijmy, że warunek (3.17) zachodzi, ale E nie jest spójny. Wtedy istnieją otwarte,
rozłączne podzbiory A, B ⊂ R takie, że E ⊂ A ∪ B oraz E ∩ A 6= ∅ 6= E ∩ B. Niech x ∈ E ∩ A oraz y ∈ E ∩ B. Dla
ustalenia uwagi przyjmijmy, że x < y (rozumowanie gdy y < x jest analogiczne). Z otwartości B znajdziemy s, t ∈ R takie,
że x < s < t < y oraz [x, s] ⊂ A i [t, y] ⊂ B. Połóżmy A0 := A∩(x, t). Zbiór A0 jest otwarty jako przecięcie zbiorów otwartych,
ograniczony, bo t jest majorantą, oraz niepusty, bo x ∈ A, a zbiór A jest otwarty. Niech p := sup A0 . Mamy x < s ¬ p < t.
Pokażemy, że p 6∈ A i p 6∈ B. Rzeczywiście, jeśli p ∈ A, to p ∈ A0 , bo p ∈ (x, t). Ale to oznacza, że nie może być p = sup A0 ,
bo A0 jest otwarty. Zatem p 6∈ A. Jeśli p ∈ B, to znajdziemy p0 < p takie, że [p0 , p] ⊂ B, bo B jest otwarty. Ale p = sup A0 ,
więc istnieje q ∈ A0 ∩ (p0 , p), co nie jest możliwe, bo zbiory A i B są rozłączne. Zatem również p 6∈ B. W szczególności p 6∈ E,
bo E ⊂ A ∪ B. Ale to jest sprzeczne z warunkiem (3.17) co dowodzi, że warunek (3.17) implikuje spójność zbioru E. 

Wniosek 3.5.3 Podzbiór E ⊂ R jest zbiorem spójnym wtedy i tylko wtedy gdy jest przedziałem.

Dowód: [•] Oczywiście każdy przedział spełnia warunek (3.17), zatem jest spójny na mocy twierdzenia 3.5.2 . Załóżmy
zatem, że podzbiór E ⊂ R jest spójny. Wtedy spełnia on warunek (3.17). Połóżmy
(
inf E gdy E ograniczony od dołu,
a := (3.18)
−∞ w przeciwnym razie,
(
sup E gdy E ograniczony od góry,
b := (3.19)
∞ w przeciwnym razie.
oraz
[a, b] gdy


 a, b ∈ R,
(a, b]

gdy a = −∞, b ∈ R,
Ia,b :=


 [a, b) gdy a ∈ R, b = ∞,
(a, b) gdy a = −∞, b = ∞.

Pokażemy, że (a, b) ⊂ E ⊂ Ia,b . Niech x ∈ (a, b). Bądź z definicji kresu dolnego bądź z faktu, że E jest nieograniczony
od dołu znajdziemy t ∈ E takie, że a < t < x. Podobnie znajdziemy s ∈ E, takie, że x < s < b. Zatem z warunku
(3.17) twierdzenia 3.5.2 wnosimy, że x ∈ E. Dowodzi to pierwszej inkluzji. Druga jest oczywista. Zatem E jest jednym z
przedziałów: (a, b), [a, b), (a, b] lub [a, b]. 

3.6 Zbiory zwarte w przestrzeniach metrycznych


W rozdziale tym zajmiemy si˛e zbiorami zwartymi. Sa˛ one ważne ze wzgl˛edu na szereg użytecznych własności. Niestety, w przeciwieństwie do zbioru otwartego
czy domkni˛etego powszechnie dziś przyj˛eta definicja zbioru zwartego jest mało intuicyjna i trudna do zwizualizowania. Poj˛ecie zbioru zwartego wyewolułowało z
˛ na przedziale domkni˛etym [a, b] osiaga
obserwacji, że funkcja ciagła ˛ swoje kresy. Pojawiło si˛e pytanie, czy własność ta obowiazuje
˛ dla innych niż przedział [a, b]
zbiorów. Oswojenie si˛e z poj˛eciem zbioru zwartego wymaga zaznajomienia si˛e z jego własnościami, a przede wszystkim poznania szeregu przykładów. Tu podamy
definicj˛e zbioru zwartego stosowalna˛ jedynie do przestrzeni metrycznych. T˛e najbardziej ogólna,˛ ale techniczna˛ i trudna˛ definicj˛e przedstawimy w ramach kursu
topologii.
Niech (X, %) będzie przestrzenią metryczną.

Definicja 3.6.1 Zbiór A ⊂ X nazywamy zwartym jeżeli każdy nieskończony podzbiór zbioru A posiada punkt sku-
pienia należący do A.

Uwaga 3.6.2 Każdy skończony podzbiór zbioru X jest zbiorem zwartym.


Dowód: Ponieważ zbiór skończony nie zawiera podzbiorów nieskończonych, postawiony w definicji wymóg jest pusto
spełniony. 
100 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH

3.6.1 Zwartość kostek w Rd


Jak już wspomnieliśmy, pojęcie zbioru zwartego wyewoluowało z przedziału domkniętego [a, b]. W rozdziale tym udowodnimy,
że przedziały takie są rzeczywiście zwarte. W istocie udowodnimy więcej, a mianowicie, że kostka dana wzorem (3.9) jest
zbiorem zwartym. Dla d = 1 kostka redukuje się do przedziału domkniętego.

Lemat 3.6.3 Niech [an , bn ] będzie ciągiem przedziałów domkniętych w R takim, że [an+1 , bn+1 ] ⊂ [an , bn ]. Wtedy

\
[an , bn ] 6= ∅.
n=1

Dowód: Zauważmy, że ciąg n 7→ an jest rosnący i ograniczony od góry, a ciąg n 7→ bn jest malejący i ograniczony od
dołu. Z twierdzenia 2.5.6 wnosimy, że ciągi te są zbieżne. Niech a := limn→∞ an oraz b := limn→∞ bn . Ponieważ
T∞ an ¬ bn , z
twierdzenia 2.5.3 o zachowywaniu słabej nierówności w granicy wnosimy, że a ¬ b. Zatem ∅ 6= [a, b] ⊂ n=1 [an , bn ]. 

Twierdzenie 3.6.4 Niech Qn będzie ciągiem kostek w Rd takim, że Qn+1 ⊂ Qn . Wtedy



\
Qn 6= ∅.
n=1

Dowód: ćwiczenie.

Twierdzenie 3.6.5 Każda kostka w Rd jest zbiorem zwartym.

Dowód: (*)Niech Q będzie kostką w Rd , a E ⊂ Q zbiorem nieskończonym. Skonstruujemy rekurencyjnie ciąg kostek
(Qn )∞
n=0 taki, że

Qn ⊂ Qn−1 dla n > 0, (3.20)


card E ∩ Qn = ∞, (3.21)
%e (Q0 )
%e (Qn ) = . (3.22)
2n
Zauważmy, że Q0 := Q spełnia własności (3.20)-(3.22). Przyjmijmy, że Qn zostało skonstruowane tak, że spełnione są
własności (3.20)-(3.22). Podzielmy kostkę

Qn = [an,1 , bn,1 ] × [an,2 , bn,2 ] × · · · × [an,d , bn,d ]


a +b a +b
na 2d kostek dzieląc każdy z przedziałów [an,i , bn,i ] na dwa równe przedziały [an,i , n,i 2 n,i ] oraz [ n,i 2 n,i , bn,i ]. Jako Qn+1
przyjmijmy jedną spośród tych 2d kostek, która zawiera nieskończenie wiele punktów zbioru E. Kostka taka musi istnieć, bo
w przeciwnym razie w kostce Qn byłaby skończona liczba punktów z E. Łatwo sprawdzić, że tak skonstruowana kostka Qn+1
spełnia
T∞ własności (3.20)-(3.22). W szczególności
T∞ własność (3.22) wynika ze wzoru (3.10). Zatem, na mocy twierdzenia 3.6.4
Q
n=0 n =
6 ∅. Ustalmy punkt x ∈ n=0 nQ . Oczywiście x ∈ Q. Pokażemy, że x jest punktem skupienia zbioru E. W tym
celu ustalmy r > 0 i dobierzmy n0 ∈ N tak, że %e (Qn0 ) < r. Jest to możliwe, bo na mocy (3.22) mamy limn→∞ %e (Qn ) = 0.
Zatem ze wzoru (3.11) wnosimy, że Qn0 ⊂ K(x, r). Ponieważ w Qn0 leży nieskończenie wiele punktów zbioru E, również w
kuli K(x, r) jest ich nieskończenie wiele. W szczególności jest tam punkt zbioru E różny od x. Ponieważ r > 0 ustaliliśmy
dowolnie, dowodzi to, że x jest punktem skupienia zbioru E leżącym w Q. A więc Q jest zbiorem zwartym. 
3.6. ZBIORY ZWARTE W PRZESTRZENIACH METRYCZNYCH 101

3.6.2 Własności zbiorów zwartych

Twierdzenie 3.6.6 Zbiór zwarty jest domknięty.

Dowód: [•] Załóżmy, że B ⊂ X jest zbiorem zwartym. Niech a : N → B będzie ciągiem zbieżnym do x ∈ X. Na mocy
twierdzenia 3.4.5 wystarczy pokazać, że x ∈ B. Niech E oznacza zbiór wyrazów ciągu a. Jeśli x ∈ E, to oczywiście x ∈ B,
bo z założenia E ⊂ B. Załóżmy zatem, że x 6∈ E. Twierdzimy, że wtedy E jest nieskończony. Rzeczywiście, gdyby E był
skończony, to jako zbieżny, musiałby być od pewnego miejsca stały. Wtedy ten powtarzający się wyraz byłby równocześnie
jego granicą, a tym samym granica należałaby do E. Zatem E jest zbiorem nieskończonym. Wtedy x, jako granica ciągu
a, jest punktem skupienia zbioru wyrazów tego ciągu, czyli E. Co więcej, jest to jedyny punkt skupienia zbioru E, bo w
przeciwnym razie ciąg a nie byłby zbieżny. Ale B jest zwarty, więc E musi mieć punkt skupienia w B. Ponieważ E ma tylko
jeden punkt skupienia, musi nim być x. Zatem i w tym przypadku x ∈ B. 
Łatwo podać przykład, że odwrotne twierdzenie nie jest prawdziwe. Rozważmy zbiór A = [0, ∞) w przestrzeni R. Jedynym
punktem brzegowym zbioru A jest punkt 0. Ponieważ 0 ∈ A< zbiór A jest domknięty. Ciąg kolejnych liczb naturalnych
ma wartości w zbiorze A, ale, jak łatwo sprawdzić, nie posiada punktu skupienia. Zatem A, pomimo, że domknięty, nie jest
zwarty.

Twierdzenie 3.6.7 Podzbiór domknięty zbioru zwartego jest zbiorem zwartym.


Dowód: Niech B będzie zbiorem zwartym, a A ⊂ B jego domkniętym podzbiorem. Załóżmy, że E ⊂ A jest zbiorem
nieskończonym. Wtedy E ⊂ B, a ponieważ B jest zwarty, istnieje x ∈ E 0 ∩ B. Na mocy twierdzenia 3.4.4 istnieje ciąg
a : N → E \ {x} zbieżny do x. Ponieważ E ⊂ A, punkt x jest granicą ciągu o wyrazach leżących w A. Ponieważ A jest
domknięty, z twierdzenia 3.4.5 wynika, że x ∈ A. Zatem E ma punkt skupienia w A. 

3.6.3 Kryterium zwartości w Rd .


W przypadku przestrzeni Rd zbiory zwarte mają bardzo prostą i intuicyjną charakteryzację. Trzeba jednak pamiętać, że
charakteryzacja ta odnosi się wyłącznie do przestrzeni Rd z metryką euklidesową.

Twierdzenie 3.6.8 Niepusty podzbiór B ⊂ Rd jest zwarty wtedy i tylko wtedy gdy jest domknięty i ograniczony w
metryce euklidesowej.

Dowód: [•] Załóżmy, że B ⊂ Rd jest zwarty. Na mocy twierdzenia 3.6.6 jest on domknięty. Załóżmy, że nie jest
ograniczony. Skonstruujemy rekurencyjnie ciąg a : N → B taki, że dla n > 0

an ∈ B \ K̄(0, max(n, %e (0, an−1 ))), (3.23)

gdzie symbolem 0 oznaczamy punkt w Rd , którego wszystkie współrzędne wynoszą zero. Wyraz a0 dobieramy jako dowolny
element zbioru B. Załóżmy, że wyraz an został już zdefiniowany tak, że własność (3.23) zachodzi. Ponieważ B jest nieograni-
czony, nie zawiera się w żadnej kuli, w szczególności nie jest podzbiorem kuli K̄(0, max(n, %e (0, an ))). Wyraz an+1 dobieramy
jako dowolny element różnicy B \ K̄(0, max(n, %e (0, an ))). Zatem (3.23) zachodzi. Niech E oznacza zbiór wartości ciągu a.
Oczywiście E ⊂ B, a ponieważ B jest zwarty, znajdziemy punkt x ∈ E 0 ∩ B. Dobierzmy n0 ∈ N tak, że n0 > %e (0, x) + 1. Z
(3.23) wynika, że jedynie skończona liczba wyrazów ciągu a leży w K(0, n0 ). W szczególności jedynie skończona liczba ele-
mentów zbioru E leży w kuli K(x, 1). Zatem x nie może być punktem skupienia zbioru E. Otrzymana sprzeczność dowodzi,
że zbiór B jest ograniczony względem metryki euklidesowej.
Z kolei przyjmijmy, że zbiór B ⊂ Rd jest domknięty i ograniczony w metryce euklidesowej. Zatem znajdziemy r > 0
takie, że B ⊂ K(0, r). Niech Q będzie iloczynem kartezjańskim d kopii przedziału [−r, r]. Oczywiście B ⊂ K(0, r) ⊂ Q Na
mocy twierdzenia 3.6.5 zbiór Q jest zwarty. Zatem z twierdzenia 3.6.7 wynika, że B jest zwarty. 
102 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH

3.7 Zupełność
Poj˛ecie przestrzeni zupełnej wiaże˛ si˛e z poj˛eciem ciagu
˛ Cauchy’ego. Łatwo zauważyć, że jeśli ciag
˛ jest zbieżny, to jego kolejne wyrazy, jako coraz bliższe granicy,
sa˛ również coraz bliższe siebie. Formalizuje t˛e obserwacj˛e poniższa definicja ciagu
˛ Cauchy’ego i zwiazane
˛ z nia˛ twierdzenie, które mówi, że każdy ciag
˛ zbieżny jest
ciagiem
˛ Cauchy’ego. Interesuje nas jednak odwrotne pytanie. Czy może istnieć ciag ˛ Cauchy’ego, który nie jest zbieżny? W pierwszej chwili może to wydawać si˛e
niemożliwe. Pami˛etajmy jednak, że √ pytanie stawiamy w dowolnej przestrzeni metrycznej. Jeśli przestrzeń jest dziurawa, tak jak przestrzeń Q liczb wymiernych, w
której
√ brak jest na przykład liczby 2, to przykład ciagu
˛ Cauchy’ego, który nie ma granicy
√ daje si˛e znaleźć. Wystarczy rozważyć ciag˛ liczb wymiernych przybliżajacy˛
2. Taki ciag
˛ b˛edzie również ciagiem
˛ w R i w R b˛edzie miał granic˛e, mianowicie 2. W szczególności b˛edzie wi˛ec ciagiem ˛ Cauchy’ego w R. Co wi˛ecej, b˛edzie
ciagiem
˛ Cauchy’ego również√ w Q, bo w definicji ciagu
˛ Cauchy’ego sama granica si˛e nie pojawia. Jednak w przestrzeni Q ciag ˛ ten nie b˛edzie zbieżny, bo jedynym
kandydatem na granic˛e jest 2, który do Q nie należy. Przestrzeń jest zupełna, jeśli każdy ciag ˛ Cauchy’ego jest w niej zbieżny. Przestrzeń R jest zupełna, ale
przestrzeń Q zupełna nie jest.

3.7.1 Warunek Cauchy’ego

Definicja 3.7.1 Niech (X, %) będzie przestrzenią metryczną. Mówimy, że ciąg x : N → X spełnia warunek Cauchy’ego
jeżeli
∀ε > 0∃N ∈ N∀n, m ­ N %(xn , xm ) < ε.
Ciąg spełniający warunek Cauchy’ego nazywamy ciągiem Cauchy’ego.

Twierdzenie 3.7.2 Każdy ciąg zbieżny jest ciągiem Cauchy’ego.

Dowód: Niech x : N → X będzie ciągiem zbieżnym do x∗ ∈ Rd . Ustalmy ε > 0 i dobierzmy N ∈ N takie, że %(xn , x∗ ) < ε
2
dla n ­ N . Niech m, n ­ N . Wtedy
ε ε
%(xn , xm ) ¬ %(xn , x∗ ) + %(x∗ , xm ) < + = ε.
2 2

Przypomnijmy, że podciągiem ciągu x : N → X nazywamy ciąg x ◦ k będący podstawieniem w ciągu x silnie rosnącego
ciągu k : N → N. Kluczowa jest następująca własność ciągów Cauchy’ego.

Twierdzenie 3.7.3 Jeśli ciąg Cauchy’ego posiada podciąg zbieżny to jest zbieżny.

Dowód: [•] Załóżmy, że x : N → X jest ustalonym ciągiem Cauchy’ego takim, że dla pewnego silnie rosnącego ciągu
k : N → N podciąg x ◦ k : N → Rd jest zbieżny do x∗ . Ustalmy ε > 0. Ze zbieżności ciągu x ◦ k do x∗ możemy dobrać N1 ∈ N
do 2ε tak, że
ε
n ­ N1 ⇒ %(xkn , x∗ ) < .
2
Z kolei założenia, że ciąg x jest ciągiem Cauchy’ego możemy dobrać N2 ∈ N takie, że
ε
m, n ­ N2 ⇒ %(xm , xn ) < .
2
Niech N := max(N1 , N2 ) i niech n ­ N . Ponieważ k jest silnie rosnący, możemy dobrać n0 ∈ N takie, że n0 ­ N1 i kn0 ­ N2 .
Zatem mamy
ε ε
%(xn , x∗ ) ¬ %(xn , xkn0 ) + %(xkn0 , x∗ ) < + = ε.
2 2

3.7. ZUPEŁNOŚĆ 103

Twierdzenie 3.7.4 Każdy ciąg Cauchy’ego jest ograniczony

Dowód: Niech x : N → Rd będzie ciągiem Cauchy’ego. Do ε := 1 dobierzmy N ∈ N takie, że %(xn , xm ) ¬ 1 dla


m, n ­ N . Połóżmy r := max { %(xi , xN ) | i < N }. Wtedy

{ xi | i ∈ N } ⊂ K(xN , r + 1),

bo %(xi , xN ) ¬ r < r + 1 dla i < N oraz %(xi , xN ) ¬ 1 < r + 1 dla i ­ N . 

Wniosek 3.7.5 Każdy ciąg Cauchy’ego o wartościach w Rd jest zbieżny.

Dowód: (*) Niech x : N → Rd będzie ciągiem Cauchy’ego. Na mocy tw. 3.7.4 znajdziemy kulę domkniętą K taką, że
{ xn | n ∈ N } ⊂ K. Zatem na mocy tw. 3.6.8 zbiór wartości ciągu ma punkt skupienia, a więc ciąg x ma podciąg zbieżny.
Teza wynika zatem z twierdzenia 3.7.3 . 

3.7.2 Przestrzenie zupełne

Definicja 3.7.6 Przestrzeń metryczną nazywamy zupełną, jeżeli każdy ciąg Cauchy’ego w tej przestrzeni jest zbieżny.

Wniosek 3.7.7 Rd jest przestrzenią metryczną zupełną. W szczególności ciała R i C są przestrzeniami metrycznymi
zupełnymi.

Dowód: Teza dla Rd wynika natychmiast z wniosku 3.7.5 . Zauważmy, że R = R1 , a ciało liczb zespolonych C rozważane
jako przestrzeń metryczna nie różni się od R2 , bo metryka w C i w R2 zadane są tym samym wzorem. Zatem również ciała
R i C są przestrzeniami metrycznymi zupełnymi. 

Ćwiczenie 3.7.8 Pokazać, że zbiór liczb wymiernych Q nie jest przestrzenią zupełną.

Twierdzenie 3.7.9 (*)Niech (X, %) będzie przestrzenią metryczną zupełną, a Y ⊂ X jej podprzestrzenią. Wtedy
zupełność podprzestrzeni Y jest równoważna domkniętości Y w X.

Dowód: Załóżmy, że Y jest podprzestrzenią zupełną. Niech y : N → Y będzie ciągiem punktów przestrzeni Y zbieżnym
do y∗ ∈ X. Jako ciąg zbieżny, y jest ciągiem Cauchy’ego. Zatem z zupełności przestrzeni Y wnosimy, że istnieje ȳ ∈ Y , taki
że limn→∞ yn = ȳ. Z twierdzenia 3.1.4 o jednoznaczonści granicy mamy y∗ = ȳ ∈ Y . Zatem z twierdzenia 3.4.5 wnosimy,
że Y jest domknięty w X.
Załóżmy z kolei, że Y jest domknięty w X. Niech y : N → Y będzie ciągiem Cauchy’ego. Ponieważ X jest przestrzenią
zupełną, znajdziemy ȳ ∈ X, taki że limn→∞ yn = ȳ. Z twierdzenia 3.4.5 i domkniętości Y w X wnosimy, że ȳ ∈ Y . 
104 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH
Rozdział 4

Granica i ciągłość funkcji

4.1 Granica funkcji w przestrzeniach metrycznych


W rozdziale tym pojęcie granicy przeniesiemy z ciągów, będących funkcjami określonymi na zbiorze liczb naturalnych, na
bardziej ogólną klasę funkcji określonych na przestrzeniach metrycznych. Przypomnijmy, że funkcja f : X → Y ze zbioru X
do zbioru Y to od strony formalnej relacja, czyli podzbiór f ⊂ X × Y taki, że

(i) dla każdego x ∈ X istnieje y ∈ Y takie, że (x, y) ∈ f , a ponadto

(ii) to y jest wyznaczone jednoznacznie, czyli jeśli (x, y) ∈ f oraz (x, y 0 ) ∈ f to y = y 0 .

Warunek (ii) pozwala nam oznaczać przez f (x) to jedyne y takie, że (x, y) ∈ f . Jeśli f ⊂ X × Y spełnia (ii), ale warunek
(i) nie zachodzi dla wszystkich x ∈ X to mówimy, że f jest funkcją częściową z X do Y i piszemy f : X 9 Y . Dziedzinę
funkcji częściowej f definiujemy jako
dom f := { x ∈ X | ∃y ∈ Y (x, y) ∈ f }.

Obraz funkcji częściowej f definiujemy jako

im f := { y ∈ Y | ∃x ∈ X (x, y) ∈ f }.

Zauważmy, że funkcja to funkcja częściowa dla której zachodzi dom f = X. Z kolei przyjmując X 0 := dom f dla funkcji
częściowej f : X 9 Y i zawężając f do X 0 dostajemy funkcję. W kontekście granic pojęcie funkcji częściowej jest wygodne,
bo pozwala rozważać funkcje częściowe określone jedynie w otoczeniu jakiegoś punktu co oznacza, że choć nie wiemy bądź
nie chcemy dokładnie analizować dla jakich argumentów funkcja jest określona, to wiemy, że jej dziedzina zawiera otoczenie
punktu.

4.1.1 Eksperymenty numeryczne


Przy obliczeniach numerycznych granicy limx→x0 f (x) nie możemy rozważyć wszystkich wartości argumentu x, wi˛ec w praktyce wybieramy ciag ˛ xn zmierza-
˛ do x0 i obserwujemy zachowanie f (xn ). Program w j˛ezyku Mathematica obliczajacy
jacy ˛ przybliżenie granicy funkcji poprzez obliczanie wartości funkcji w ciagu
˛
punktów przedstawiono na listingu 4.1 . Analogiczny przykład w C++ w odniesieniu do granicy limx→0 sinx x i ciagu
˛ xn := n1 przedstawiono w programie z
listingu 4.2 .

105
106 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI
 
( ∗ P r z y b l i ż a n i e g r a n i c y f u n k c j i f g r a n i c a̧ c i a̧ gu n warto s c i f u n k c j i
w punktach c i a̧ gu x ∗ )
F u n c t i o n L i m i t [ f_ , x_ , n_ ] :=
Module [ { k } ,
k = 1;
Do[
Print [ f [ x [ k ] ] ] ;
k = k + 1,
{n}
];
]

( ∗ Funkcja , kt ó r e j g r a n i c ȩ w z e r z e l i c z y m y ∗ )
g [ x_ ] := Sin [ x ] / x ;

( ∗ Ci a̧ g o wyrazach z m i e r z a j a̧ cych do z e r a ∗ )
x [ n_ ] := 1 . / n

( ∗ Test p r z y b l i ż a n i a warto s c i f u n k c j i ∗ )
FunctionLimit [ g , x , 100]
 
Listing 4.1: Przybliżanie granicy funkcji w języku Mathematica

Ćwiczenie komputerowe 4.1.1 • Sprawdź działanie programu z listingu 4.1 dla funkcji x 7→ sin x
x ˛ xn :=
i dla ciagu 1
np przy różnych wartosciach
p.
• Sprawdź działanie programu z listingu 4.1 dla funkcji x 7→ sin x1 i dla różnych ciagów.
˛

• W programie z listingu 4.2 zmień ciag


˛ xn na xn := 1
np dla różnych wartości p i zaobserwuj zachowanie si˛e programu.

• Zmodyfikuj program z listingu 4.2 zast˛epujac


˛ funkcj˛e x 7→ sin x
x funkcja˛ x 7→ sin 1
x i zaobserwuj zachowanie si˛e programu dla różnych ciagów.
˛

Eksperymenty numeryczne pokazuja,˛ że definicj˛e granicy funkcji lepiej byłoby postawić uniezależniajac
˛ si˛e od ciagów,
˛ bo zachowanie funkcji może być różne,
przy podstawieniu w miejsce argumentów różnych ciagów.
˛ Taka˛ definicj˛e rozważaliśmy już w rozdziale wst˛epnym.

4.1.2 Definicja granicy funkcji w przestrzeniach metrycznych


Niech X, Y będą przestrzeniami metrycznymi odpowiednio z metrykami %X i %Y . Rozważmy funkcję częściową f : X 9 Y
oraz punkt skupienia x0 dziedziny f i punkt y0 ∈ Y .

Definicja 4.1.2 Mówimy, że y0 ∈ Y jest granicą funkcji f w punkcie x0 i piszemy

lim f (x) = y0
x→x0

jeżeli
∀ε > 0 ∃δ > 0 ∀x ∈ dom f \ {x0 } %X (x, x0 ) < δ ⇒ %Y (f (x), y0 ) < ε. (4.1)

Zwróćmy uwag˛e, że punkt skupienia zbioru nie musi należeć do zbioru. W powyższej definicji nie zakładamy, że x0 ∈ dom f . To ma sens, bo liczenie
˛ również w punktach, w których funkcja f nie jest określona. Na przykład funkcja x 7→ sinx x nie jest określona w zerze, ale ma w
granicy może być interesujace
zerze granic˛e 1. Funkcja ta jest określona w zbiorze dom f = R \ {0}, a zero jest punktem skupienia zbioru dom f , który do dom f nie należy.
4.1. GRANICA FUNKCJI W PRZESTRZENIACH METRYCZNYCH 107

 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ F u n c t i o n L i m i t . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P r z y b l i ż a n i e g r a n i c y f u n k c j i g r a n i c a̧ c i a̧ gu warto s c i ∗/
/∗ f u n k c j i ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;

/∗ Funkcja , kt ó r e j g r a n i c ȩ w z e r z e l i c z y m y ∗/
double f ( double x ) {
return s i n ( x ) / x ;
}

/∗ Ci a̧ g o wyrazach z m i e r z a j a̧ cych do z e r a ∗/
double x ( i n t n ) {
return 1 . 0 / n ;
}

/∗ W p r o g r a m i e g ł ównym wypisujemy c i a̧ g warto s c i f u n k c j i


w zadanym c i a̧ gu punkt ów ∗/
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;

f o r ( i n t n=1;n<=20;n=n+1){
c o u t << "x[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << x ( n ) ;
c o u t << " f(x[" << setw ( 2 ) << n << " ]) =" ;
c o u t << setw ( 1 8 ) << f ( x ( n ) ) << e n d l ;
}
}
 
Listing 4.2: Przybliżanie granicy funkcji w C++
108 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI

4.1.3 Jednoznaczność granicy

Twierdzenie 4.1.3 (o jednoznaczności granicy) Niech X, Y będą przestrzeniami metrycznymi, f : X 9 Y funkcją


częściową, a x0 punktem skupienia dziedziny f . Jeśli dla pewnych y1 , y2 ∈ Y mamy

lim f (x) = y1 i lim f (x) = y2


x→x0 x→x0

to y1 = y2 .

Dowód: Dla dowodu nie wprost załóżmy, że y1 6= y2 . Wtedy r := %(y1 , y2 ) > 0. Z warunku (4.1) zastosowanego dla y1
i y2 do ε := r
2 znajdziemy odpowiednio δ1 i δ2 takie, że dla x ∈ dom f \ {x0 }

%(x, x0 ) < δ1 ⇒ %(f (x), y1 ) < ε (4.2)


%(x, x0 ) < δ2 ⇒ %(f (x), y2 ) < ε. (4.3)

Niech δ := min(δ1 , δ2 ). Ponieważ x0 jest punktem skupienia zbioru dom f w X, a K(x0 , δ) jest otoczeniem x0 w X, więc
znajdziemy punkt x∗ ∈ K(x0 , δ) ∩ dom f \ {x0 }. Ponieważ w szczególności %(x∗ , x0 ) < δ1 i %(x∗ , x0 ) < δ2 , więc na mocy
(4.2) i (4.3) mamy %(f (x∗ ), y1 ) < ε i %(f (x∗ ), y2 ) < ε. Zatem z nierówności trójkąta
r r
%(y1 , y2 ) ¬ %(y1 , f (x∗ )) + %(f (x∗ ), y2 ) < ε + ε = + = %(y1 , y2 ).
2 2
Otrzymana sprzeczność dowodzi tezy. 

4.1.4 Granice nieskończone i granice w nieskończoności


Dla funkcji o wartościach w R̄ podobnie jak dla ciagów możemy zdefiniować granice nieskończone. Rozważmy funkcję
f : X → R̄, gdzie X jest przestrzenią metryczną. Niech x0 ∈ X 0 będzie punktem skupienia.

Definicja 4.1.4 Mówimy, że f zmierza do nieskończoności (ma granicę nieskończoność) przy x zmierzającym do x0 i
piszemy
lim f (x) = ∞
x→x0

jeżeli
∀A > 0 ∃δ > 0 ∀x ∈ X \ {x0 } %X (x, x0 ) < δ ⇒ f (x) > A. (4.4)
Podobnie definiujemy granicę limx→x0 f (x) = −∞ zamieniając w (4.4) warunek f (x) > A na f (x) < −A.

W języku potocznym, w przypadku granic nieskończonych zamiast mówić o zbieżności do plus lub minus nieskończoności
często mówimy o rozbieżności.
Możemy też zdefiniować granice w nieskończoności. Niech Y będą przestrzenią metryczną i niech a ∈ R.

Definicja 4.1.5 Mówimy, że y0 ∈ Y jest granicą w nieskończoności funkcji f : [a, ∞) → Y i piszemy

lim f (x) = y0
x→∞

jeżeli
∀ε > 0 ∃A ­ a ∀x > A %Y (f (x), y0 ) < ε. (4.5)
Podobnie dla funkcji f : (−∞, a] → Y definiujemy granicę limx→−∞ f (x) zamieniając w (4.5) warunek A ­ a na
A ¬ a oraz x > A na x < A.
4.2. WŁASNOŚCI GRANICY FUNKCJI 109

Podobnie jak w przypadku ciągów, traktując R̄ jako przestrzeń metryczną z metryką %h (patrz rozdział 3.3.1 ) możemy
zauważyć, że tak granice nieskończone jak i granice w nieskończoności są szczególnymi przypadkami ogólnego pojęcia granicy
w definicji 4.1.2 . Wynika to ze wzoru (3.16), który, dla funkcji h danej wzorem (3.15), pozwala zastąpić warunek %h (x, ∞) < r
i warunek %h (f (x), ∞) < r odpowiednio warunkiem x > A i f (x) > A z A := 1−r r . Analogicznie dla granicy minus
nieskończoność i w minus nieskończoności. W szczególności, dokładnie na tej samej zasadzie, definicja granicy ciągu jest
szczególnym przypadkiem definicji 4.1.2 . Nieskończoność jest bowiem punktem skupienia dla N w N̄, a wzór (3.16) pozwala
zastąpić warunek %h (n, ∞) < δ warunkiem n > N z N ∈ N tak dobranym, by było większe niż 1−δ δ .

4.1.5 Granica złożenia funkcji

Twierdzenie 4.1.6 (O granicy złożenia funkcji) Niech X, Y, Z będą przestrzeniami metrycznymi, x0 ∈ X 0 , y0 ∈ Y 0 ,


z0 ∈ Z. Jeśli f : X → Y i g : Y → Z są takie, że y0 ∈ 6 im f oraz limx→x0 f (x) = y0 i limy→y0 g(y) = z0 to
limx→x0 (g ◦ f )(x) = z0 .
Dowód: Ustalmy ε > 0. Dobierzmy do niego δ > 0 takie, że
%Y (y, y0 ) < δ, y 6= y0 ⇒ %Z (g(y), z0 ) < ε. (4.6)
Z kolei do δ dobierzmy η > 0 takie, że
%X (x, x0 ) < η, x 6= x0 ⇒ %Y (f (x), y0 ) < δ. (4.7)
Niech x ∈ X będzie takie, że %X (x, x0 ) < η oraz x 6= x0 . Wtedy z (4.7) mamy %Y (f (x), y0 ) < δ. Ponieważ y0 6∈ im f , więc
f (x) 6= y0 . Zatem z (4.6) zastosowanego do y = f (x) wnosimy, że %Z (g(f (x)), z0 ) < ε. Pokazaliśmy zatem, że do dowolnego
ε > 0 można tak dobrać η > 0 iż zachodzi implikacja
%X (x, x0 ) < η, x 6= x0 ⇒ %Z (g(f (x)), z0 ) < ε.
Dowodzi to, że limx→x0 (g ◦ f )(x) = z0 . 
W programie Mathematica granicę limx→u f (x) dla funkcji f : A → R̄, gdzie A ⊂ R̄ i u ∈ R̄ liczymy przy pomocy
instrukcji
Limit[f[x], x -> u]
Na przykład
Limit[1/(1 + x), x -> Infinity]
zwraca 0.

4.2 Własności granicy funkcji


4.2.1 Suma, różnica, iloczyn i iloraz funkcji
Niech X będzie przestrzenią metryczną, a x0 punktem skupienia X. Niech F będzie ciałem R lub ciałem C. Ciało F rozważać
będziemy jako przestrzeń metryczną z metryką daną wzorem (3.1) dla F = R i wzorem (3.2) dla F = C.
Załóżmy, że dane są funkcje
f1 , f2 : X → F.
Niech  : F × F będzie działaniem w ciele F. Definiujemy funkcję
f1  f2 : X 3 x 7→ f1 (x)  f2 (x) ∈ F.
Dla  ∈ { +, −, ·, / } nazywamy ją odpowiednio sumą, różnicą, iloczynem i ilorazem funkcji f1 i f2 .
110 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI

4.2.2 Granica sumy, różnicy i iloczynu

Twierdzenie 4.2.1 Załóżmy, że f1 , f2 : X → F mają w x0 odpowiednio granice a1 , a2 ∈ F, tzn.

lim fi (x) = ai
x→x0

dla i ∈ {1, 2}. Wtedy istnieją granice sumy, różnicy i iloczynu funkcji f1 , f2 w x0 i wynoszą odpowiednio

lim (f1 (x) + f2 (x)) = a1 + a2 , (4.8)


x→x0
lim (f1 (x) − f2 (x)) = a1 − a2 , (4.9)
x→x0
lim (f1 (x)f2 (x)) = a1 a2 . (4.10)
x→x0

Dowód: (*) Ustalmy ε > 0 i dobierzmy δ1 , δ2 > 0 takie, że dla i = 1, 2 zachodzi


ε
%X (x, x0 ) < δi , x 6= x0 ⇒ |fi (x) − ai | < .
2

Weźmy δ := min(δ1 , δ2 ) oraz x ∈ X takie, że %X (x, x0 ) < δ i x 6= x0 . Wtedy


ε ε
|(f1 (x) ± f2 (x)) − (a1 ± a2 )| ¬ |f1 (x) − a1 | + |f2 (x) − a2 | < + = ε,
2 2

co dowodzi (4.8) oraz (4.9).


Aby pokazać (4.10) połóżmy M := max(|a1 |, |a2 |) + 1. Wtedy M − |a1 | > 0, więc możemy dobrać δ0 > 0 takie, że

%X (x, x0 ) < δ0 , x 6= x0 ⇒ |f1 (x) − a1 | ¬ M − |a1 |. (4.11)

Ponadto ε
2M > 0, więc dla i = 1, 2 możemy dobrać δi > 0 takie, że

ε
%X (x, x0 ) < δi , x 6= x0 ⇒ |fi (x) − ai | < . (4.12)
2M
Zauważmy najpierw, że
%X (x, x0 ) < δ0 , x 6= x0 ⇒ |f1 (x)| ¬ M. (4.13)

Rzeczywiście, jeśli %X (x, x0 ) < δ0 oraz x 6= x0 to z (4.11) mamy

|f1 (x)| ¬ |f1 (x) − a1 | + |a1 | ¬ M − |a1 | + |a1 | = M.

Weźmy δ := min(δ0 , δ1 , δ2 ) oraz x ∈ X takie, że %X (x, x0 ) < δ i x 6= x0 . Z (4.12) i (4.13) mamy

|f1 (x)f2 (x) − a1 a2 | ¬ |f1 (x)f2 (x) − f1 (x)a2 | + |f1 (x)a2 − a1 a2 |


= |f1 (x)||f2 (x) − a2 | + |a2 ||f1 (x) − a1 |
ε ε
< M +M
2M 2M
= ε.


4.2. WŁASNOŚCI GRANICY FUNKCJI 111

4.2.3 Granica ilorazu

Twierdzenie 4.2.2 Przy założeniach poprzedniego twierdzenia, jeśli ponadto funkcja f2 (x) dla x w pewnym otoczeniu
x0 oraz a2 6= 0, to istnieje też granica ilorazu i wynosi

f1 (x) a1
lim = . (4.14)
x→x0 f2 (x) a2
Dowód: [•] Rozważmy najpierw przypadek szczególny gdy f1 jest funkcją stale równą jeden. Zatem chcemy pokazać,
że limx→x0 f21(x) = a12 . Ustalmy c ∈ (0, |a2 |) i wybierzmy δ0 > 0 takie, że

%X (x, x0 ) < δ0 , x 6= x0 ⇒ |f2 (x) − a2 | < |a2 | − c.


Zauważmy, że jeśli %X (x, x0 ) < δ0 oraz x 6= x0 to |f2 (x)| > c. Rzeczywiście, mamy
|f2 (x)| = |a2 − (a2 − f2 (x))| ­ |a2 | − |a2 − f2 (x)| > |a2 | − (|a2 | − c) = c.
Ustalmy ε > 0 i dobierzmy δ1 > 0 takie, że
%X (x, x0 ) < δ1 , x 6= x0 ⇒ |f2 (x) − a2 | < εc2 .
Weźmy δ := min(δ0 , δ1 ) i rozważmy x ∈ X takie, że %X (x, x0 ) < δ i x 6= x0 . Wtedy
1 1 |a2 − f2 (x)| εc2
− = < 2 = ε.
f2 (x) a2 |a2 ||f2 (x)| c
Dowodzi to poprawności wzoru 4.14 w przypadku gdy f1 jest funkcją stale równą jeden. Przypadek ogólny dostajemy z
pokazanego przypadku szczególnego w oparciu o wzór ff21 (x)
(x)
= f1 (x) f21(x) , który sprowadza ten przypadek do twierdzenia o
granicy iloczynu. 
Powyższe twierdzenia zachodzą też w przypadku gdy zamiast F weźmiemy R̄, ale tylko wtedy, gdy odpowiednie działania
mają sens.

4.2.4 Zachowywanie nierówności w granicy

Twierdzenie 4.2.3 Niech f, g : X → R̄. Załóżmy, że dla x0 ∈ X 0 istnieją granice limx→x0 f (x) i limx→x0 g(x). Jeśli
istnieje δ > 0 takie, że
x ∈ K(x0 , δ) \ {x0 } ⇒ f (x) ¬ g(x), (4.15)
to
lim f (x) ¬ lim g(x). (4.16)
x→x0 x→x0

Dowód: [•] Oznaczmy a := limx→x0 f (x), b := limx→x0 g(x). Dla dowodu nie wprost przyjmijmy, że a > b. Dobierzmy
stałe c, d ∈ R̄ takie, że b < c < d < a oraz ε > 0 takie, że K(b, ε) ⊂ [−∞, c) i K(a, ε) ⊂ (d, ∞]. Znajdziemy δ1 > 0 takie, że
x ∈ K(x0 , δ1 ) \ {x0 } ⇒ f (x) ∈ K(a, ε)
i δ2 > 0 takie, że
x ∈ K(x0 , δ2 ) \ {x0 } ⇒ g(x) ∈ K(b, ε).
Ponieważ x0 jest punktem skupienia przestrzeni X, znajdziemy x1 ∈ K(x0 , min(δ, δ1 , δ2 )). Wtedy
g(x1 ) < c < d < f (x1 )
co przeczy (4.15). 
112 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI

4.2.5 Twierdzenie o trzech funkcjach

Twierdzenie 4.2.4 Niech f, g, h : X → R̄, x0 ∈ X 0 . Jeśli istnieje δ > 0 takie, że dla każdego x ∈ K(x0 , δ) \ {x0 }
mamy f (x) ¬ g(x) ¬ h(x) oraz istnieją granice

lim f (x), lim h(x)


x→x0 x→x0

i obie są równe pewnemu a ∈ R̄, to istnieje granica limx→x0 g(x) i też wynosi a.

Dowód: [•] Ustalmy ε > 0 i dobierzmy δ1 > 0 takie, że

x ∈ K(x0 , δ1 ) \ {x0 } ⇒ f (x) ∈ K(a, ε)

oraz δ2 > 0 takie, że


x ∈ K(x0 , δ2 ) \ {x0 } ⇒ h(x) ∈ K(a, ε).
Niech x ∈ K(x0 , min(δ, δ1 , δ2 )). Wtedy
g(x) ∈ [f (x), h(x)] ⊂ K(a, ε).


4.2.6 Granica funkcji monotonicznej

Twierdzenie 4.2.5 Niech A ⊂ R̄ i ω := sup A. Jeśli ω jest punktem skupienia zbioru A, a f : A → R̄ jest funkcją
rosnącą i ograniczoną od góry, to istnieje granica limx→ω f (x) i jest równa

sup { f (x) | x ∈ A, x < ω }.

Dowód: (*) Niech µ := sup { f (x) | x ∈ A \ {ω} }. Ustalmy ε > 0 i wybierzmy c ∈ K(µ, ε) ∩ (−∞, µ). Z definicji kresu
górnego znajdziemy x̄ ∈ A \ {ω} takie, że f (x̄) > c. Dobierzmy δ > 0 takie, że K(ω, δ) ⊂ (x̄, ∞]. Niech x ∈ A ∩ K(ω, δ) \ {ω}.
Ponieważ o f założyliśmy, że jest rosnąca, mamy

f (x) ­ f (x̄) > c.

Z kolei z definicji µ mamy


f (x) ¬ µ.
co oznacza, że f (x) ∈ (c, µ] ⊂ (µ − ε, µ + ε) = K(µ, ε). Zatem dla x ∈ A ∩ K(ω, δ) \ {ω} dostajemy f (x) ∈ K(µ, ε), co
dowodzi tezy. 

4.2.7 Granice w produkcie kartezjańskim


Niech X oraz Y1 , Y2 , . . . Yn będą przestrzeniami metrycznymi odpowiednio z metrykami %X oraz %Y1 , %Y2 , . . . %Yn . Rozważmy
Y1 × Y2 × · · · × Yn jako przestrzeń metryczną z metryką

%Y1 ,Y2 ,...Yn ((x1 , . . . , xn ), (y1 , . . . , yn )) := max { %Yi (xi , yi ) | i = 1, 2, . . . n }


4.3. GRANICE JEDNOSTRONNE 113

Twierdzenie 4.2.6 Niech f = (f1 , f2 , . . . fn ) : X → Y1 × Y2 × · · · × Yn niech będzie zestawieniem funkcji fi : X → Yi


dla i = 1, 2, . . . , n. Niech x0 będzie punktem skupienia przestrzeni X oraz niech y := (y1 , y2 , . . . , yn ) ∈ Y1 ×Y2 ×· · ·×Yn .
Wtedy
lim f (x) = y ⇔ lim fi (x) = yi dla i = 1, 2, . . . n.
x→x0 x→x0

Dowód: (**)Załóżmy, że granica limx→x0 f (x) = y istnieje. Zadajmy ε > 0. Niech δ > 0 będzie tak dobrane, że
x ∈ K(x0 , δ), x 6= x0 ⇒ f (x) ∈ K(y, ε).
Niech x ∈ K(x0 , δ). Ustalmy j ∈ { 1, 2, . . . n }. Wtedy
%Yj (fj (x), yj ) ¬ max { %Yi (fi (x), yi ) | i = 1, 2, . . . n } = %Y1 ×·×Yn (f (x), y) < ε.
Zatem, fj (x) ∈ K(yj , ε).
Aby udowodnić implikację przeciwną przyjmijmy, że granice limx→x0 fi (x) = yi dla i = 1, 2, . . . , n istnieją. Ustalmy ε > 0
i dla i = 1, 2, . . . n dobierzmy δi > 0 do ε tak, że
x ∈ K(x0 , δi ), x 6= x0 ⇒ fi (x) ∈ K(yi , ε).
Połóżmy δ := min { δi | i = 1, 2, . . . n }. Niech x ∈ K(x, δ) \ {x0 }. Wtedy
%Y1 ×···×Yn (f (x), y) = max { %Yi (fi (x), yi ) | i = 1, 2, . . . n } ¬ ε.


4.3 Granice jednostronne


Niech Y będzie przestrzenią metryczną. Rozważmy f : R → Y i punkt x0 ∈ R.
Definicja 4.3.1 Mówimy, że f ma w x0 granicę lewostronną równą y ∈ Y i piszemy

lim f (x) = y,
x→x−
0

jeżeli zawężęnie f do przedziału (−∞, x0 ], czyli funkcja f|(−∞,x0 ] : (−∞, x0 ] → Y ma w x0 granicę y. Analogicznie,
mówimy, że f ma w x0 granicę prawostronną równą y ∈ Y i piszemy

lim f (x) = y,
x→x+
0

jeżeli zawężęnie f do przedziału [x0 , ∞), czyli funkcja f|[x0 ,∞) : [x0 , ∞) → Y ma w x0 granicę y.

Twierdzenie 4.3.2 Funkcja f ma w x0 granicę wtedy i tylko wtedy gdy obie granice jednostronne istnieją i są sobie
równe.

W programie Mathematica granicę jednostronną limx→u− f (x) liczymy przy pomocy instrukcji
Limit[f[x], x -> u, Direction -> 1]
a granicę jednostronną limx→u+ f (x) liczymy przy pomocy instrukcji
Limit[f[x], x -> u, Direction -> -1]
Na przykład
Limit[1/x, x -> 0, Direction -> 1]
zwraca −∞.
114 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI

4.4 Punkty graniczne


4.4.1 Ciągowa charakterystyka granicy
Ustalmy dwie przestrzenie metryczne X, Y oraz funkcję f : X → Y i punkt x∗ ∈ X 0 .

Twierdzenie 4.4.1 Następujące dwa warunki są sobie równoważne

(i) istnieje granica


lim f (x) = y∗ ,
x→x∗

(ii) dla każdego ciągu x : N1 → X \ {x∗ } zachodzi

lim xn = x∗ ⇒ lim f (xn ) = y∗ .


n→∞ n→∞

Dowód: [•] Przypomnijmy, że ciąg x : N1 → X \ {x∗ } to funkcja, której przestrzenią argumentów jest zbiór liczb
naturanych, a xn to nic innego, tylko tradycyjne oznaczenie na wartość tej funkcji dla argumentu n, czyli x(n). Zatem f (xn )
to inaczej wartość złożenia f ◦ x dla argumentu n. Wnosimy stąd, że warunek (ii) wynika natychmiast z warunku (i) na mocy
twierdzenia 4.1.6 o granicy złożenia. Dla dowodu nie wprost implikacji odwrotnej załóżmy, że warunek (ii) zachodzi, ale
warunek (i) nie zachodzi. Wtedy istnieje ε > 0 takie, że dla każdego δ > 0 znajdziemy x ∈ X spełniające warunek x 6= x∗ ,
nierówność %X (x, x∗ ) < δ oraz nierówność %Y (f (x), y∗ ) ­ ε. W szczególności, do δ = n1 możemy dobrać xn ∈ X takie, że
%X (xn , x∗ ) < n1 , xn 6= x∗ oraz %Y (f (xn ), y∗ ) ­ ε. Zatem limn→∞ xn = x∗ . Jednak równocześnie limn→∞ f (xn ) 6= y∗ , co
przeczy założeniu (ii). 

4.4.2 Zbiór punktów granicznych

Definicja 4.4.2 Niech f : X → Y będzie funkcją odwzorowującą przestrzeń metryczną X w przestrzeń metryczną
Y . Niech x∗ ∈ X będzie punktem skupienia X w X. Definiujemy zbiór punktów granicznych funkcji f w x∗ jako

Lim f (x) := { y ∈ Y | ∃a : N → X limn→∞ an = x∗ i limn→∞ f (an ) = y }.


x→x∗

Twierdzenie 4.4.3 Zbiór Limx→x∗ f (x) jest domknięty.

W dowodzie tego twierdzenia pojawia si˛e sytuacja, w której dla każdej liczby naturalnej n ∈ N mamy ciag.
˛ Mamy zatem ciag ˛ ciagów.
˛ Powstaje problem
jak to zapisać. Indeks dolny tradycyjnie wykorzystywany jest do podania numeru wyrazu ciagu.˛ Nie możemy wi˛ec użyć go do numerowania ciagów.
˛ Z kolei indeks
górny oznacza pot˛eg˛e. Zatem używamy indeksu górnego ale z nawiasami piszac ˛ x(n) na oznaczenie n-tego ciagu.
˛ W ten sposób nie jesteśmy w kolizji z już
(n)
przyj˛etymi konwencjami. Indeks dolny pozostaje w swojej tradycyjnej roli, a wi˛ec pozwala nam zapisać m-ty wyraz ciagu˛ x(n) jako xm . Oczywiście równolegle
dopuszczalny jest zapis funkcyjny, a wi˛ec x(n) (m), który przydaje si˛e szczególnie wtedy, gdy indeksy zaczynaja˛ si˛e pi˛etrzyć.
Dowód: Oznaczmy Limx→x∗ f (x) przez A. Niech {yn } ⊂ A będzie ciągiem zbieżnym do y. Na mocy twierdzenia 3.4.5
wystarczy pokazać, że y ∈ A. Ponieważ yn ∈ A, na mocy definicji zbioru punktów granicznych znajdziemy ciąg x(n) : N → X
(n) (n)
zbieżny do x∗ taki, że limm→∞ xm = x∗ oraz limm→∞ f (xm ) = yn . Zatem dla każdego n ∈ N do ε = n1 znajdziemy kn ∈ N
(n) (n) (n)
takie, że dla m ­ kn mamy %X (xm , x∗ ) ¬ n1 oraz %Y (f (xm ), yn ) ¬ n1 . Niech wn := xkn . Wtedy limn→∞ wn = x∗ oraz
limn→∞ f (wn ) = y, co dowodzi, że y ∈ A. 

Uwaga 4.4.4 Zwróćmy uwagę, że Limx→x∗ f (x) = {y∗ } nie gwarantuje istnienia granicy. Na przykład dla ciągu
a : N 3 n 7→ (1 + (−1)n )n ∈ R mamy Limn→∞ an = {0}, ale ciąg ten nie jest zbieżny.
4.5. GRANICA DOLNA I GÓRNA 115

4.4.3 Ciągowa charakterystyka granicy ciągu

Twierdzenie 4.4.5 Niech a : N → Y będzie ciągiem w przestrzeni metrycznej Y , a y ∈ Y . Następujące warunki są


równoważne:
(i) limn→∞ an = y,

(ii) ∀k : N → N limn→∞ kn = ∞ ⇒ limn→∞ (a ◦ k)(n) = y,


(iii) ∀k : N → N k silnie rosnący ⇒ limn→∞ (a ◦ k)(n) = y,
(iv) jeśli a0 : N → Y jest podciągiem ciągu a, to limn→∞ a0n = y.

Dowód: Aby pokazać, że (ii) wynika z (i) ustalmy ε > 0 i dobierzmy do niego N ∈ N takie, że dla n ­ N zachodzi
nierówność %(xn , y) < ε. Z kolei z założenia, że limn→∞ kn = ∞ do naszego N możemy dobrać N 0 ∈ N takie, że dla n ­ N 0
zachodzi kn = k(n) > N . Zatem dla n ­ N 0 mamy też %(a(k(n)), y) < ε), co dowodzi (ii). Własność (iii) wynika natychmiast
z (ii), bo silnie rosnący ciąg liczb naturalnych zmierza do nieskończoności. Warunke (iv) jest jedynie przeformułowaniem
warunku (iii), bo podciąg ciągu a, to z definicji podstawienie w ciągu a silnie rosnącego ciągu liczb naturalnych k : N → N.
Pozostaje pokazać, że warunek (iv) implikuje warunek (i). Dla dowodu nie wprost przyjmijmy, że y nie jest granicą
ciągu a. Wtedy znajdziemy ε > 0 takie, że dla dowolnego N ∈ N znajdziemy N 0 ∈ N takie, że %(aN 0 , y) ­ ε. Rekurencyjnie
skonstruujemy silnie rosnący ciąg kN → N taki, że

%(akn , y) ­ ε dla n ∈ N. (4.17)

W tym celu przyjmijmy k1 := 1 i załóżmy, że kn jest już zdefiniowane tak, że warunek (4.17) zachodzi. Z wyboru ε > 0
wiemy, że znajdziemy N 0 > kn takie, że %(aN 0 , y) ­ ε. Wystarczy teraz przyjąć kn+1 := N 0 . Kończy to konstrukcję ciągu k
spełniającego (4.17). Oznacza to, że podciąg a ◦ k nie może być zbieżny do y, co przeczy warunkowi (iv) i kończy dowód.

Twierdzenie 4.4.6 Niech a : N → Y będzie ciągiem w przestrzeni metrycznej Y . Wtedy

Lim an = { y ∈ Y | ∃k : N → N silnie rosnący i taki, że limn→∞ akn = y }.


n→∞

4.5 Granica dolna i górna


4.5.1 Granica dolna i górna
Niech X będzie przestrzenią metryczną i niech x0 ∈ X 0 będzie punktem skupienia zbioru X. Rozważmy ograniczoną funkcję
f : X → R. Wtedy zbiór wartości f daje się zamknąć w zbiorze zwartym skąd wnosimy, że Limx→x0 f (x) jest niepusty.
Ponieważ funkcja jest ograniczona, zbiór ten jest ograniczony.

Definicja 4.5.1 Granicę górną funkcji f w x0 definiujemy wzorem

lim sup f (x) := sup Lim f (x),


x→x0 x→x0

a granicę dolną wzorem


lim inf f (x) := inf Lim f (x).
x→x0 x→x0
116 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI

Poj˛ecie granicy górnej i dolnej ma sens nawet dla funkcji, która nie jest ograniczona. Wymaga to jednak dopuszczenia −∞ oraz +∞ jako możliwych
punktów granicznych. Od strony formalnej oznacza to rozważanie R jako podzbioru R̄ o której to przestrzeni ze stosownie dobrana˛ metryka˛ da si˛e udowodnić, że
jest zwarta.

Twierdzenie 4.5.2 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = limx→x0 f (x) jest równoważne równości

lim inf f (x) = lim sup f (x).


x→x0 x→x0

4.5.2 Własności granicy dolnej i górnej

Twierdzenie 4.5.3 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = lim supx→x0 f (x) jest równoważne koniunkcji
następujących dwóch warunków.

a ∈ Lim f (x), (4.18)


x→x0

∀b > a ∃δ > 0 %(x, x0 ) < δ ⇒ f (x) < b. (4.19)

Dowód: (*) Załóżmy najpierw, że a = lim supx→x0 f (x). Niech A := Limx→x0 f (x). Pokażemy, że (4.18) zachodzi. Wprost
z definicji lim supx→x0 f (x) jako kresu górnego zbioru A wnosimy, że w każdym otoczeniu a znajdziemy punkt zbioru A.
Gdyby a ∈ Limx→x0 f (x) nie było prawdą, to w każdym otoczeniu a byłby punkt nie należący do A, a mianowicie punkt
a. Zatem A byłby punktem brzegowym zbioru A. Ponieważ na mocy tw. 4.4.3 zbiór A = Limx→x0 f (x) jest domknięty,
wnosimy, że wtedy a ∈ A, co przeczy przypuszczeniu, że a 6∈ A. Zatem (4.18) zachodzi. Rónież własność (4.19) pokażemy
nie wprost. Przypuśćmy, że istnieje b > a takie, że dla każdego δ > 0 istnieje xδ ∈ X spełniające warunek %(xδ , x0 ) < δ oraz
f (xδ ) ­ b. W szczególności oznacza to, że możemy wybrać ciąg {xn } ⊂ X taki, że lim xn = x0 oraz f (xn ) ­ b. Ponieważ
f jest ograniczona, ciąg o wyrazach f (xn ) przyjmuje wartości w pewnym przedziale domkniętym i ograniczonym, a więc w
zbiorze zwartym. Zatem z ciągu o wyrazach xn można wybrać podciąg taki, że również ciąg o wyrazach f (xn ) jest zbieżny
do pewnego a0 ­ b. Zatem a0 ∈ Limx→x0 f (x) i w konsekwencji a ­ a0 ­ b, co przeczy założeniu a < b.
Dla dowodu nie wprost przeciwnej implikacji załóżmy, że warunki (4.18) i (4.19) zachodzą oraz a 6= lim supx→x0 f (x).
Z (4.18) wynika, że a ¬ lim supx→x0 f (x), zatem a < lim supx→x0 f (x). Tak więc znajdziemy a0 > a, a0 ∈ Limx→x0 f (x).
0
Rozważmy ciąg o wyrazach xn ∈ X zbieżny do x0 i taki, że limn→∞ f (xn ) = a0 . Korzystając z (4.19) dobierzmy do b := a+a 2
liczbę δ > 0 tak, że
a + a0
%(x, x0 ) < δ ⇒ f (x) < .
2
0
Ustalmy N ∈ N takie, że %(xn , x0 ) < δ dla n ­ N . W szczególności dla n ­ N mamy f (xn ) < a+a 2 . Przechodząc do granicy
0
a+a0
dostajemy a0 ¬ a+a
2 . Ale 2 < a 0
, bo a < a0
. Otrzymana sprzeczność dowodzi, że a = lim supx→x0 f (x). 

Twierdzenie 4.5.4 Niech f, g : X → R̄ oraz x0 ∈ X 0 . Jeśli istnieje otoczenie V punktu x0 takie, że dla każdego
x ∈ V \ {x0 } mamy f (x) ¬ g(x) to

lim inf f (x) ¬ lim inf g(x),


x→x0 x→x0
lim sup f (x) ¬ lim sup g(x).
x→x0 x→x0

Dowód: [•] Pokażemy drugą nierówność. Pierwszą dowodzi się analogicznie. Oznaczmy a := lim supx→x0 f (x). Niech
n 7→ xn będzie ciągiem zbieżnym do x0 takim, że ciąg n 7→ f (xn ) zmierza do a. Rozważmy ciąg n 7→ g(xn ). Ponieważ g
jest ograniczona, ciąg ten posiada podciąg zbieżny. Dokładniej, znajdziemy silnie rosnący ciąg N 3 n →
7 kn ∈ N taki, że
4.6. CIĄGŁOŚĆ FUNKCJI 117

ciąg n 7→ g(xkn ) jest zbieżny do b ∈ Limx→x0 g(x). Oczywiście ciąg n 7→ f (xkn ) jako podciąg ciągu zbieżnego również jest
zbieżny. Zatem z twierdzenia 2.5.3 o zachowywaniu nierówności w granicy (dla ciągów) dostajemy

lim sup f (x) = a = lim f (xkn ) ¬ lim g(xkn ) = b ¬ lim sup g(x).
x→x0 n→∞ n→∞ x→x0

4.6 Ciągłość funkcji


Potrzeba zdefiniowania czym jest funkcja ciagła ˛ zrodziła si˛e wraz z doprecyzowaniem poj˛ecia funkcji. Pierwotnie interesowano si˛e wyłacznie
˛ funkcjami ciagłymi,
˛
wi˛ec ciagłość
˛ była własnościa,˛ która˛ uważano za oczywista.˛ Mówiono, że wykres funkcji daje si˛e narysować bez odrywania ołówka od papieru. Dziś powiedzieli-
byśmy, że wykres funkcji ciagłej
˛ określonej na przedziale o wartościach w R daje si˛e narysować bez odrywania ołówka od papieru. Jeśli jednak dziedzina funkcji
składa si˛e z dwóch lub wi˛ecej przedziałów, to mimo, że jest ona ciagła,
˛ nie da si˛e jej wykresu narysować bez odrywania ołówka od papieru. Tak jest na przykład
w przypadku funkcji R \ {0} 3 x 7→ x1 ∈ R. Funkcja ta jest ciagła, ˛ ale jej wykres składa si˛e z dwóch kawałków, a wi˛ec z tylu kawałków z ilu składa si˛e jej
dziedzina.
Współczesna definicja ciagłości
˛ pokrewna jest definicji granicy. Funkcja f w pewnych punktach może być ciagła, ˛ a w innych nie. Jest ciagła,
˛ jeśli jest
˛ w każdym punkcie swojej dziedziny. Z kolei f jest ciagła
ciagła ˛ w punkcie x dziedziny jeśli granica tej funkcji w tym punkcie istnieje i jest równa wartości
funkcji f (x). Przyjmuje si˛e też, że funkcja jest ciagła
˛ w izolowanym punkcie dziedziny, gdy poj˛ecie granicy nie ma sensu. Ta intuicja ciagłości
˛ doprecyzowana
jest w twierdzeniu 4.6.2 . Przyj˛eta poniżej definicja 4.6.1 to zwi˛ezły sposób zdefiniowania ciagłości,˛ który jest jednak równoważny warunkowi z granica˛ w
twierdzeniu 4.6.2 .

4.6.1 Definicja ciągłości


Niech f : X → Y będzie odwzorowaniem przestrzeni metrycznych.

Definicja 4.6.1 Mówimy, że f jest ciągła w punkcie x0 ∈ X jeżeli dla każdego ε > 0 istnieje δ > 0 takie, że

%(x, x0 ) < δ ⇒ %(f (x), f (x0 )) < ε. (4.20)

Mówimy, że f jest ciągła jeśli jest ciągła w każdym punkcie x ∈ X.

Twierdzenie 4.6.2 Funkcja f jest ciągła w x0 wtedy i tylko wtedy gdy zachodzi jeden z następujących dwóch warunków

x0 6∈ X 0 lub x0 ∈ X 0 i lim f (x) = f (x0 ). (4.21)


x→x0

Dowód: Załóżmy, że f jest ciągła w x0 . Jeśli x0 6∈ X 0 , to (4.21) oczywiście zachodzi. Jeśli x0 ∈ X 0 , to limx→x0 f (x) =
f (x0 ) wynika wprost z definicji ciągłości f w x0 . Dla dowodu implikacji przeciwnej załóżmy, że (4.21) zachodzi. Rozważmy
najpierw przypadek, gdy x0 6∈ X 0 . Wtedy istnieje δ0 > 0 takie, że K(x0 , δ0 ) = {x0 }. Jest ono dobre dla każdego ε > 0,
bo wtedy %(x, x0 ) < δ0 implikuje x = x0 skąd %(f (x), f (x0 )) = %(f (x0 ), f (x0 )) = 0 < ε. Rozważmy z kolei przypadek
gdy x0 ∈ X 0 . Ustalmy ε > 0. Z definicji granicy dobieramy do ε > 0 takie δ > 0, że %(x, x0 ) < δ, x 6= x0 implikuje
%(f (x), f (x0 )) < ε. Niech x ∈ X będzie takie, że %(x, x0 ) < δ. Jeśli x 6= x0 , to nierówność %(f (x), f (x0 )) < ε zachodzi na
mocy wyboru δ. Natomiast dla x = x0 mamy %(f (x), f (x0 )) = %(f (x0 ), f (x0 )) = 0 < ε. Zatem implikacja (4.20) zachodzi.


4.6.2 Kryteria ciągłości


118 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI

Twierdzenie 4.6.3 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru otwartego V w Y zbiór
f −1 (V ) jest otwarty w X.

Dowód: [•] Załóżmy najpierw, że f jest ciągła. Niech V będzie zbiorem otwartym w Y . Mamy pokazać, że f −1 (V )
jest zbiorem otwatym w X. Niech x0 ∈ f −1 (V ). Wtedy f (x0 ) ∈ V . Ponieważ V jest otwarty, znajdziemy ε > 0 takie, że
K(f (x0 ), ε) ⊂ V . Ponieważ f jest ciągła, więc jest w szczególności ciągła w punkcie x0 . Zatem dobierzmy δ > 0 takie, że
%(x, x0 ) < δ implikuje %(f (x), f (x0 )) < ε. Pokażemy, że

K(x0 , δ) ⊂ f −1 (V ). (4.22)

Rzeczywiście, jeśli x ∈ K(x0 , δ), to %(x, x0 ) < δ, zatem %(f (x), f (x0 )) < ε, skąd f (x) ∈ K(f (x0 ), ε) ⊂ V . Oznacza to, że
x ∈ f −1 (V ). Pokazaliśmy więc (4.22), co dowodzi, że f −1 (V ) jest otwarty.
Przejdźmy do dowodu implikacji w przeciwną stronę. Ustalmy x0 ∈ X oraz ε > 0. Na mocy tw. 3.2.10 K(f (x0 ), ε)
jest zbiorem otwartym. Zatem f −1 (K(f (x0 ), ε)) jest zbiorem otwartym. Ponieważ oczywiście x0 ∈ f −1 (K(f (x0 ), ε)), więc
znajdziemy δ > 0 takie, że K(x0 , δ) ⊂ f −1 (K(f (x0 ), ε)). Niech x ∈ X będzie takie, że %(x, x0 ) < δ. Wtedy x ∈ K(x0 , δ),
zatem f (x) ∈ K(f (x0 ), ε), skąd dostajemy %(f (x), f (x0 )) < ε. 

Twierdzenie 4.6.4 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru domkniętego K w Y
zbiór f −1 (K) jest domknięty w X.

Dowód: (*)Załóżmy, że f jest ciągła, a K ⊂ Y jest domknięty. Z wniosku 3.2.7 wnosimy, że Y \ K jest otwarty. Mamy
X \ f −1 (K) = f −1 (Y \ K), zatem na mocy tw. 4.6.3 zbiór X \ f −1 (K) jest otwarty. Zatem ponownie z wniosku 3.2.7
wnosimy, że f −1 (K) jest domknięty. Dla dowodu implikacji przeciwnej przyjmijmy, że dla każdego zbioru domkniętego K
w Y zbiór f −1 (K) jest domknięty w X. Na mocy tw. 4.6.3 wystarczy pokazać, że dla dowolnego zbioru otwartego V ⊂ Y
zbiór f −1 (V ) jest otwarty w X. Niech V ⊂ Y będzie zbiorem otwartym. Wtedy Y \ V jest domknięty, zatem f −1 (Y \ V )
jest domknięty. Ale f −1 (Y \ V ) = X \ f −1 (V ), zatem f −1 (V ) jest otwarty. 

4.6.3 Ciągłość złożenia

Twierdzenie 4.6.5 Niech X, Y, Z będą przestrzeniami metrycznymi, a f : X → Y i g : Y → Z odwzorowaniami.


Jeśli f jest ciągłe w x0 ∈ X, a g jest ciągłe w f (x0 ), to g ◦ f jest ciągłe w x0 . Zatem jeśli f i g są ciągłe, to g ◦ f jest
ciągłe.

Dowód: łatwe ćwiczenie.

Ćwiczenie 4.6.6 Wyprowadź twierdzenie 4.6.5 z twierdzenia 4.6.2 i z twierdzenia 4.1.6 o granicy złożenia.

4.6.4 Ciągłość operacji arytmetycznych


Niech X będzie przestrzenią metryczną, a F niech będzie ciałem liczb rzeczywistych lub ciałem liczb zespolonych.

Twierdzenie 4.6.7 Jeśli f, g : X → F są ciągłe w x0 ∈ X, to f + g, f − g, f · g są ciągłe w x0 . Jeśli dodatkowo


g(x0 ) 6= 0, to f /g jest ciągłe w x0 .

Dowód: łatwe ćwiczenie.

Ćwiczenie 4.6.8 Wyprowadź twierdzenie 4.6.7 z twierdzenia 4.6.2 i twierdzeń 4.2.1 oraz 4.2.2 .
4.6. CIĄGŁOŚĆ FUNKCJI 119

4.6.5 Twierdzenie o lokalnym zachowywaniu znaku

Twierdzenie 4.6.9 Niech f : X → R będzie funkcją ciągłą. Jeśli f (x0 ) > 0 dla pewnego x0 ∈ X, to istnieje δ > 0
takie, że dla każdego x ∈ K(x0 , δ) mamy f (x) > 0. Podobnie, jeśli f (x0 ) < 0 dla pewnego x0 ∈ X, to istnieje δ > 0
takie, że dla każdego x ∈ K(x0 , δ) mamy f (x) < 0.
Dowód: Rozważmy przypadek f (x0 ) > 0. Ponieważ V := (0, ∞) jest zbiorem otwartym w R, więc na mocy tw. 4.6.3
U := f −1 (V ) jest również zbiorem otwartym. Oczywiście x0 ∈ U , bo z założenia f (x0 ) > 0. Z otwartości U znajdziemy δ > 0
takie, że K(x0 , δ) ⊂ U . Zatem dla x ∈ K(x0 , δ) mamy f (x) ∈ V co z definicji V oznacza, że f (x) > 0. Dowód dla przypadku
f (x0 ) < 0 jest analogiczny. 

4.6.6 Przykłady funkcji ciągłych

Twierdzenie 4.6.10 Niech X, Y będą przestrzeniami metrycznymi.


(i) Niech c ∈ Y . Funkcja stała cX : X 3 x 7→ c ∈ Y jest ciągła.
(ii) Niech X ⊂ Y . Inkluzja j : X 3 x 7→ x ∈ Y jest ciągła.

(iii) Identyczność idX : X 3 x 7→ x ∈ X jest ciągła.


(iv) Odwzorowania rzutowania

pX : X × Y 3 (x, y) 7→ x ∈ X
qX : X × Y 3 (x, y) 7→ y ∈ Y

są ciągłe.

(v) Funkcje zmiennej zespolonej

C 3 z 7→ re z ∈ R
C 3 z 7→ im z ∈ R
C 3 z 7→ z ∈ C

są ciągłe.

(vi) Zawężenie f|A odwzorowania ciągłego f : X → Y do zbioru A ⊂ X jest ciągłe.


Dowód: łatwe ćwiczenie.

Twierdzenie 4.6.11 Niech P : C → C będzie wielomianem. Wtedy P jest ciągłe.


Dowód: łatwe ćwiczenie.
Niech P, Q : C → C będą wielomianami. Funkcją wymierną jest funkcja
P P (x)
: C \ Q−1 (0) 3 x 7→ ∈ C.
Q Q(x)

Twierdzenie 4.6.12 Funkcja wymierna jest ciągła.


Dowód: łatwe ćwiczenie.
120 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI

4.6.7 (*)Nieciągłości funkcji f : R → R


Niech f : (a, b) → R i niech x0 ∈ (a, b).

Definicja 4.6.13 Mówimy, że f ma w x0 nieciągłość pierwszego rodzaju, jeżeli f nie jest ciągła w x0 , ale istnieją
granice jednostronne limx→x− f (x) i limx→x+ f (x). W przeciwnym razie mówimy, że f ma w x0 nieciągłość drugiego
0 0
rodzaju.

Twierdzenie 4.6.14 Funkcja f ma w x0 nieciągłość pierwszego rodzaju wtedy i tylko wtedy gdy limx→x− f (x) 6=
0
limx→x+ f (x) lub limx→x− f (x) = limx→x+ f (x) 6= f (x0 ).
0 0 0

Twierdzenie 4.6.15 Jeśli f : (a, b) → R jest funkcją słabo rosnącą, to każdy jej punkt nieciągłości jest pierwszego
rodzaju. Ponadto

∀x0 ∈ (a, b) lim f (x) ¬ f (x0 ) ¬ lim+ f (x), (4.23)


x→x−
0
x→x0

∀x1 , x2 , x3 ∈ (a, b) x1 < x2 < x3 ⇒ lim+ f (x) ¬ f (x2 ) ¬ lim− f (x). (4.24)
x→x1 x→x3

Analogiczne własności ma funkcja słabo malejąca.

Dowód: Z tw. 4.2.5 o granicy funkcji monotonicznej wynika istnienie granic jednostronnych, zatem każdy punkt
nieciągłości jest pierwszego rodzaju. Wzory (4.23) i (4.24) wynikają z tw. 4.2.3 o zachowywaniu nierówności w granicy. 

4.6.8 Ciągłość bijekcji monotonicznej

Twierdzenie 4.6.16 Niech (a, b) i (c, d) będą otwartymi przedziałami w R i niech f : (a, b) → (c, d) będzie malejącą
lub rosnącą bijekcją. Wtedy tak f jak i bijekcja odwrotna f −1 są ciągłe.

Dowód: Rozważmy przypadek gdy f jest rosnąca. Pokażemy najpierw, że f jest ciągła. Dla dowodu nie wprost
przypuśćmy, że istnieje x0 ∈ (a, b) takie, że f nie jest ciągła w x0 . Z twierdzenia 4.6.15 wnosimy, że istnieją granice
α := limx→x− f (x), β := limx→x+ f (x) oraz α < β i (α, β) ⊂ (c, d). Wybierzmy γ ∈ (α, β). Ponieważ f jest bijekcją,
0 0
znajdziemy x1 ∈ (a, b) takie, że f (x1 ) = γ. Jeśli x1 < x0 , to możemy wybrać x̄ ∈ (x1 , x0 ), zatem

γ = f (x1 ) < f (x̄) ¬ lim f (x) = α,


x→x−
0

co przeczy wyborowi γ. Podobnie, gdy x1 > x0 . Zatem musi być x1 = x0 i γ = f (x0 ). Wybierając γ 0 ∈ (α, β), γ 0 6= γ
i rozumując analogicznie otrzymujemy γ 0 = f (x0 ). Dochodzimy zatem do sprzeczności z założeniem, że f jest funkcją.
Pokazaliśmy zatem, że f jest ciągła. Zauważmy, że f −1 : (c, d) → (a, b) jest również bijekcją. Pokażemy, że jest ona również
rosnąca. Rzeczywiście, gdyby tak nie było, znaleźlibyśmy y1 , y2 ∈ (c, d) takie, że y1 < y2 i f −1 (y1 ) > f −1 (y2 ). Połóżmy
x1 := f −1 (y1 ) oraz x2 := f −1 (y2 ). Wtedy f (x1 ) = y1 < y2 = f (x2 ) oraz x1 > x2 co przeczy założeniu, że f jest rosnąca.
Zatem f −1 spełnia te same założenia, co f . Oznacza to, że również jest ciągła.
Dowód dla f malejącej jest analogiczny, więc go pomijamy. 
4.7. CIĄGŁOŚĆ, A ZWARTOŚĆ 121

4.7 Ciągłość, a zwartość


4.7.1 Obraz zbioru zwartego przez odwzorowanie ciągłe.
Ustalmy przestrzenie metryczne X, Y oraz funkcję f : X → Y .

Twierdzenie 4.7.1 Jeśli f jest ciągła, a A ⊂ X jest zwarty, to f (A) jest zwarty.

Dowód: [•] Niech E ⊂ f (A) będzie podzbiorem nieskończonym. Do każdego e ∈ E ustalmy punkt ae ∈ A taki, że
f (ae ) = e. Niech E 0 := { ae | e ∈ E }. Zauważmy, że jeśli ae1 = ae2 , to e1 = f (ae1 ) = f (ae2 ) = e2 . Tak więc, e1 6= e2
implikuje ae1 6= ae2 . Jest tak dla dowolnych ae1 , ae2 ∈ E 0 . Zatem zawężenie f|E 0 : E 0 → E jest różnowartościowe. Oczywiście
E 0 jest również zbiorem nieskończonym. Ponieważ A jest zwarty, znajdziemy punkt skupienia x zbioru E 0 należący do A.
Ze względu na różnowartościowość f|E 0 bez utraty ogólności możemy przyjąć, że

f (x) 6= f (x0 ) dla x0 ∈ E 0 , (4.25)

bo jeśli nawet punkt x0 ∈ E 0 spełniający (4.25) istnieje, to co najwyżej jeden. Gdy go z E 0 usuniemy, zbiór E 0 nadal będzie
nieskończony i x nadal będzie jego punktem skupienia.
Pokażemy, że f (x) ∈ f (A) jest punktem skupienia zbioru E. W tym celu ustalmy ε > 0. Z ciągłości funkcji f znajdziemy
δ > 0 takie, że %(x0 , x) < δ implikuje %(f (x0 ), f (x)) < ε. Ponieważ x jest punktem skupienia zbioru E 0 znajdziemy x0 ∈
E 0 ∩K(x, δ)\{x}. Zatem f (x0 ) ∈ E ∩K(f (x), ε). Ponadto f (x0 ) 6= f (x) na mocy (4.25). Ponieważ ε > 0 ustaliliśmy dowolnie,
dowodzi to, że f (x) jest punktem skupienia zbioru E leżącym w f (A). 

Wniosek 4.7.2 Zachodzą następujące własności.


(i) Jeśli f : X → Rd jest ciągła, a K ⊂ X jest zwarty, to f (K) jest domknięty i ograniczony.
(ii) Jeśli przestrzeń X jest zwarta, a f : X → Rd jest ciągła, to f jest ograniczona.

(iii) Jeśli f : [a, b] → Rd jest ciągła, to jest ograniczona.

4.7.2 Funkcja ciągła na przedziale zwartym osiąga swoje kresy

Twierdzenie 4.7.3 Niech X będzie przestrzenią zwartą, a f : X → R funkcją ciągłą. Wtedy f (X) jest zbiorem
ograniczonym. W szczególności m := inf f (X) i M := sup f (X) są dobrze określone, a ponadto istnieją p, q ∈ X takie,
że f (p) = m i f (q) = M .

Dowód: [•] Niech A := f (X) ⊂ R. Zatem M = sup A. Z tw. 4.7.1 wnosimy, że A jest zwarty, zatem z tw. 3.6.6
dostajemy, że A jest domknięty. Z definicji kresu górnego wiemy, że istnieje ciąg a : N → A taki, że limn→∞ an = M . Zatem
z tw. 3.4.5 wnosimy, że M ∈ A. Z definicji zbioru A mamy więc, że M = f (q) dla pewnego q ∈ X. Dowód dla kresu dolnego
jest analogiczny. 

4.7.3 Funkcja odwrotna do funkcji ciągłej

Twierdzenie 4.7.4 Jeśli f : X → Y jest ciągłą bijekcją, a X jest zwarty, to f −1 jest ciągłe.
122 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI

Rysunek 4.1: Funkcja ciągła na przedziale zwartym osiąga swoje kresy

Dowód: [•] Niech A ⊂ X będzie zbiorem domkniętym. Wtedy, na mocy twierdzenia 3.6.7 zbiór A jest zwarty. Zatem
z tw. 4.7.1 zbiór f (A) jest zwarty, a więc z tw. 3.6.6 jest domknięty. Ale (f −1 )−1 (A) = f (A), zatem przeciwobraz w f −1
zbioru domkniętego jest zbiorem domkniętym. Tak więc na mocy tw. 4.6.4 odwzorowanie f −1 jest ciągłe. 

Twierdzenie 4.7.5 Dla dowolnego n ∈ N odwzorowanie



R∗ 3 x 7→ n
x ∈ R∗ (4.26)

jest ciągłe.

Dowód: Wiemy, że odwzorowanie f : R∗ 3 y 7→ y n ∈ R∗ jest ciągłe. Niech Ka := [0, a]. Z tw. 4.7.4 odwzorowanie
−1 −1
jest ciągłe. Mamy f −1 = a∈R∗ f|Ka , zatem f −1 jest ciągłe, bo jest ciągłe w otoczeniu każdego punktu. Ale f −1 to
S
f|K a
dokładnie odwzorowanie (4.26). 

4.8 Jednostajna ciągłość

Definicja 4.8.1 Funkcja f : X → Y jest jednostajnie ciągła wtedy i tylko wtedy gdy

∀ε > 0 ∃δ > 0 ∀x, y ∈ X %X (x, y) < δ ⇒ %Y (f (x), f (y)) < ε.


4.8. JEDNOSTAJNA CIĄGŁOŚĆ 123

1.0

0.8

0.6

0.4

0.2

0.2 0.4 0.6 0.8 1.0

Rysunek 4.2: Przy ustalonym ε > 0 (czerwone odcinki na osi pionowej) do zadanego punktu x ∈ R istnieje δx > 0 takie,
że (4.20) zachodzi. Jednak dla różnych x ∈ R nawet przy ustalonym ε > 0 wartości δx mogą być różne. Co więcej, może
się zdarzyć, tak jak w przypadku funkcji x 7→ x2 , że inf { δx | x ∈ R } = 0. Wtedy nie da się dobrać jednego uniwersalnego
δ > 0 dobrego dla wszystkich x ∈ R. O takiej funkcji mówimy, że nie jest jednostajnie ciągła.
124 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI
Przykład 4.8.2 Funkcja
R 3 x 7→ x2 ∈ R∗
jest ciągła, jednak nie jest jednostajnie ciągła. Aby√pokazać, że nie jest√jednostajnie ciągła weźmy ε := 1. Dla δ > 0
rozważmy n ∈ N takie, że √1n < δ. Połóżmy xn := n + √1n oraz yn := n. Mamy |xn − yn | = √1n < δ oraz

√ 1 √ 1 1
|x2n − yn2 | = ( n + √ )2 − ( n)2 = n + 2 + − n = 2 + > 1.
n n n

Zatem do ε = 1 nie da się dobrać δ > 0 tak, że

∀x, y ∈ R |x − y| < δ ⇒ |x2 − y 2 | < 1.

Twierdzenie 4.8.3 Jeśli f : X → Y jest jednostajnie ciągła, to f jest ciągła. 

Twierdzenie 4.8.4 Jeśli f : X → Y jest ciągła, a X jest przestrzenią zwartą, to f jest jednostajnie ciągła.

Dowód: [•] Dowód poprowadzimy nie wprost. Przypuśćmy, że f nie jest jednostajnie ciągła. Wtedy znajdziemy ε > 0
taki, że dla każdego δ > 0, w szczególności dla każdego n ∈ N i δn = n1 istnieją punkty xn , yn ∈ X takie, że

1
0 ¬ %X (xn , yn ) < (4.27)
n
oraz
%Y (f (xn ), f (yn )) ­ ε. (4.28)
Ponieważ X jest zwarta, ciągi o wyrazach xn , yn posiadają podciągi zbieżne. Aby nie mnożyć oznaczeń przyjmijmy, że są to
ciągi xn , yn zbieżne odpowiednio do x∗ i y∗ . Przechodząc w (4.27) do granicy z twierdzenia o trzech ciągach (twierdzenie 2.5.4
) dostajemy %X (x∗ , y∗ ) = 0. Zatem x∗ = y∗ z definicji metryki. Z twierdzenia 4.4.1 wnosimy, że ciągi f (xn ) i f (yn ) są
zbieżne do f (x∗ ). Zatem dla 2ε znajdziemy N ∈ N takie, że dla n ­ N
ε ε
%Y (f (xn ), f (yn )) ¬ %Y (f (xn ), f (x∗ )) + %Y (f (x∗ ), f (yn )) < + = ε,
2 2
co przeczy własności (4.28) i dowodzi twierdzenia. 

4.8.1 Funkcje Lipschitza

Definicja 4.8.5 f : X → Y jest funkcją Lipschitza jeżeli istnieje stała L > 0 taka, że

∀x1 , x2 ∈ X %Y (f (x1 ), f (x2 )) ¬ L%X (x1 , x2 ).

Twierdzenie 4.8.6 Jeśli f : X → Y jest funkcją Lipschitza, to jest funkcją jednostajnie ciągłą.

Dowód: ćwiczenie.
4.9. CIĄGŁOŚĆ, A SPÓJNOŚĆ 125

Rysunek 4.3: Funkcja jednostajnie ciągła, która nie jest funkcją Lipschitza

Przykład 4.8.7 Funkcja C 3 x 7→ |x| ∈ R∗ jest funkcją Lipschitza dla L = 1. Rzeczywiście, mamy

|x| = |(x − y) + y| ¬ |x − y| + |y| oraz |y| = |(y − x) + x| ¬ |x − y| + |x|,

skąd dostajemy
|x| − |y| ¬ |x − y| oraz |y| − |x| ¬ |x − y|.
Zatem
||x| − |y|| ¬ |x − y|.

4.9 Ciągłość, a spójność


4.9.1 Obraz zbioru spójnego przez odwzorowanie ciągłe.

Twierdzenie 4.9.1 Niech f : X → Y będzie odwzorowaniem ciągłym. Jeśli E ⊂ X jest spójny, to f (E) jest zbiorem
spójnym.

Dowód: [•] Dla dowodu nie wprost przyjmijmy, że A, B ⊂ Y są otwarte i rozłączne oraz f (E) ⊂ A ∪ B, f (E) ∩ A 6= ∅,
f (E) ∩ B 6= ∅. Połóżmy A0 := f −1 (A), B 0 := f −1 (B). Z ciągłości f i tw. 4.6.3 wynika, że A0 oraz B 0 są otwarte w X.
Mamy

A0 ∩ B 0 = f −1 (A) ∩ f −1 (B) = f −1 (A ∩ B) = ∅,
E ⊂ f −1 (f (E)) ⊂ f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B) = A0 ∪ B 0 .

Niech y ∈ f (E) ∩ A. Zatem y = f (x) dla pewnego x ∈ E takiego, że f (x) ∈ A. Zatem x ∈ E ∩ f −1 (A) = E ∩ A0 , co dowodzi,
że E ∩ A0 6= ∅. Podobnie dowodzimy, że E ∩ B 0 6= ∅. Zatem E nie jest spójny, co przeczy założeniu. 

Wniosek 4.9.2 Jeśli a, b ∈ R, a < b i f : [a, b] → R jest odwzorowaniem ciągłym, to f ([a, b]) jest przedziałem
domkniętym i ograniczonym.
126 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI

Rysunek 4.4: Własność Darboux.

Dowód: [•] Na mocy wniosku 3.5.3 i twierdzenia 4.9.1 f ([a, b]) jest zbiorem spójnym, a więc przedziałem. Na mocy
twierdzenia 3.6.8 przedział [a, b] jako zbiór domknięty i ograniczony jest zbiorem zwartym. Zatem z twierdzenia 4.7.1
zbiór f ([a, b]) jest również zwarty, a więc i domknięty i ograniczony. W takim razie f ([a, b]) jest domkniętym i ograniczonym
przedziałem. 

4.9.2 Własność Darboux.

Twierdzenie 4.9.3 (własność Darboux) Jeśli a, b ∈ R, a < b, f : [a, b] → R jest odwzorowaniem ciągłym oraz
f (a) < f (b) to dla każdego c ∈ [f (a), f (b)] istnieje ξ ∈ [a, b] takie, że f (ξ) = c.

Dowód: [•] Na mocy wniosku 4.9.2 mamy f ([a, b]) = [p, q] dla pewnych p, q ∈ R. Ponieważ f (a), f (b) ∈ f ([a, b]) = [p, q],
więc jeśli c ∈ [f (a), f (b)], to c ∈ [p, q] = f ([a, b]). Zatem istnieje ξ ∈ [a, b] takie, że f (ξ) = c. 
Własność Darboux zobrazowano na rys. 4.4
Rozdział 5

Szeregi

5.1 Pojęcie szeregu


5.1.1 Przybliżanie liczby π polami wielokątów wpisanych w koło.
W rozdziale 1.3.2 zaprezentowaliśmy metodę przybliżania liczby π poprzez pola wielokątów wpisanych w koło i zauważyli-
śmy, że stosowny ciąg (1.4) jest szeregiem. Przyjrzyjmy się teraz zachowaniu tego szeregu od strony numerycznej Program
wyznaczający wyrazy ciągu (1.4) w Mathematica jest przedstawiony na listingu 5.1 , a w języku C++ na listingu 5.2
Uruchamiając program łatwo sprawdzić, że metoda oparta o pola przy zastosowaniu tego samego typu double daje
znacznie dokładniejsze wyniki niż metoda poprzednia, bo już 26-ta suma częsciowa daje wartość

s26 = 3.141592653589793,

która jest poprawnym przybliżeniem liczby π do ostatniej cyfry włącznie.

5.1.2 Definicja szeregu.


Niech F oznacza albo ciało R albo ciało C.
Definicja 5.1.1 Dla k ∈ N parę ciągów x, s : Nk → F nazywamy szeregiem jeżeli
n
X
sn = xi .
i=k

Element xn nazywamy n-tym wyrazem szeregu, a element sn nazywamy n-tą sumą częściową szeregu. Mówimy, że
szereg jest zbieżny, jeżeli ciąg jego sum częściowych jest zbieżny. Jeśli ciąg sum częściowych jest zbieżny, to jego granicę
nazywamy sumą szeregu i oznaczamy
X∞
xi .
i=k

P∞
W praktyce symbolem i=k xi zazwyczaj oznaczamy nie tylko sumę szeregu, co jest sensowne tylko jeśli szereg jest
zbieżny, ale także sam szereg. To czy mamy na myśli szereg, czy jego sumę, rozstrzygamy na podstawie kontekstu.

127
128 ROZDZIAŁ 5. SZEREGI
 
( ∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k a̧ t ów foremnych
wpisanych w okr a̧ g o s r e d n i c y j e d e n ∗)
P i B y F i e l d [ d_ ] :=
Module [ { s , m, n , a } ,
n = 2;
m = 4 ; ( ∗ I l o sć bok ów w i e l o k a̧ ta , na pocz a̧ t e k kwadrat ∗ )
a = Sqrt [ 2 . ] / 2 ; ( ∗ Bok k o l e j n y c h w i e l o k a̧ t ów ∗ )
s = 2 ; ( ∗ c z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k a̧ t a ∗ )
Do[
Print [ "s[" , n , " ]= " , NumberForm[ s , 1 6 ] ] ;
s = s + m∗ a ∗ ( 1 − Sqrt [ 1 − a ∗ a ] ) ;
a = Sqrt [ 2 − Sqrt [ 4 − 4∗ a ∗ a ] ] / 2 ;
m = m∗ 2 ;
n = n + 1,
{d}
];
s
]
 
Listing 5.1: Wyznaczenie ciągu przybliżeń liczby π w języku Mathematica w oparciu o pola wielokątów

5.1.3 Szereg harmoniczny


P∞
Pokażemy, że jeśli szereg n=1 cn ˛ cn zmierza do zera. Nie jest to jednak warunek wystarczajacy,
jest zbieżny, to ciag ˛ bo na przykład o szeregu

X 1
n=1
n

zwanym szeregiem harmonicznym, można pokazać, że nie jest zbieżny w sensie definicji Cauchy’ego.
Wspomnijmy, że nazwa szeregu harmonicznego bierze si˛e z poj˛ecia składowej harmonicznej drgajacej
˛ struny. Struna drga wydajac
˛ dźwi˛ek zbudowany z fal o
długościach b˛edacych
˛ ułamkiem o liczniku jeden długości struny (patrz rys. 5.1 ).
Przyjrzymy si˛e bliżej szeregowi harmonicznemu. Pogrupujmy wyrazy szeregu harmonicznego w porcje kolejno po jeden, dwa, cztery itd.

1 1 1 1 1 1 1
X    
=1+ + + + + + + ...
n=1
n 2 3 4 5 6 7

Tak wi˛ec sumy kolejnych porcji to

T0 := 1
1 1
T1 := +
2 3
1 1 1 1
T2 := + + +
4 5 6 7
1 1 1 1 1 1 1 1
T3 := + + + + + + +
8 9 10 11 12 13 14 15
... ...
2k+1
X−1 1
Tk := .
k
n
n=2
5.1. POJĘCIE SZEREGU 129

 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ P i B y F i e l d . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k a̧ t ów foremnych ∗/
/∗ wpisanych w okr a̧ g o p r o m i e n i u j e d e n ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;

i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
i n t m=4; /∗ I l o sć bok ów w i e l o k a̧ ta , na pocz a̧ t e k kwadrat . ∗/
/∗ Bok k o l e j n y c h w i e l o k a̧ t ów wpisanych w ko ł o o s r e d n i c y j e d e n .
Na pocz a̧ t e k bok kwadratu ∗/
double a=s q r t ( 2 . 0 ) / 2 ;
/∗ Zmienna s z a w i e r a c z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k a̧ t a .
Zaczynamy od kwadratu , kt ó ry ma p o l e 1 / 2 . ∗/
double s =2;
i n t nmax=30;
f o r ( i n t n=2;n<nmax ; n=n+1){
c o u t << " s[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << s ;
c o u t << e n d l ;
/∗ C z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k a̧ t a
p r z y r a s t a o c z t e r o k r o t n e p o l e m t r ók a̧ t ów r ó wnobocznych ∗/
s=s+m∗ a∗(1− s q r t (1−a ∗ a ) ) ;
m=m∗ 2 ; /∗ Podwajamy i l o sć bok ów ∗/
a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ; /∗ I wyznaczamy k o l e j n y bok ∗/
}
}
 
Listing 5.2: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o pola wielokątów
130 ROZDZIAŁ 5. SZEREGI

Rysunek 5.1: Składowe harmoniczne drgającej struny. Źródło: Wikipedia

Na listingach 5.3 i 5.4 przedstawiono program odpowiednio w Mathematica i w C++, który liczy sumy kolejnych
porcji Tk dla szeregu harmonicznego.
Wynik działania programu sugeruje, że sumy te są większe od pewnej stałej c > 0.
Jest tak w istocie, bo
2k+1
X−1 2X−1k+1
1 1 1 1
Tk = ­ = 2k · k+1 = .
n 2k+1 2 2
n=2k k n=2

Konsekwencja˛ tego faktu jest


m
2X −1 m−1
1 X m
= Tk ­ .
n=1
n 2
k=0
P∞ 1
Zatem sumy cz˛eściowe szeregu harmonicznego moga˛ być wi˛eksze od dowolnie zadanej liczby. Oznacza to, że sumy cz˛eściowe szeregu n=1 n sa˛ rozbieżne
do nieskończoności. O takim szeregu mówimy, że jest rozbieżny.

Ćwiczenie komputerowe 5.1.2 Adaptuj program z listingu 5.3 i/lub listingu 5.4 do prześledzenia zachowania
szeregów
∞ ∞
X 1 X 1
√ i 2
.
n=1
n n=1
n
Co sądzisz na temat ich zbieżności?
5.1. POJĘCIE SZEREGU 131

 
( ∗ A n a l i z a zachowania s z e r e g u harmonicznego ∗ )
H a r m o n i c S e r i e s [ d_ ] := Module [ { s , n , k } ,
k = 0;
Do[
s = 0.;
n = 2^k ;
( ∗ Obliczamy sumȩ wyraz ów s z e r e g u od 2^k do 2^{ k+1}−1 ∗ )
Do[
s = s + 1./n ;
n = n + 1,
{2^ k}
];
Print [ "T[" , k , " ]= " , NumberForm[ s , 1 6 ] ] ;
k = k + 1,
{d}
];
]
 
P2k+1 −1
Listing 5.3: Obliczanie sumy n=2k
1
n w Mathematica

 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ H a r m o n i c S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ A n a l i z a zachowania s z e r e g u harmonicznego ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;

i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;

double m=1; /∗ Bȩ dziemy sumować w p o r c j a c h po m d l a m= 1 , 2 , 4 , . . . ∗/


f o r ( i n t k=0;k <25; k=k+1){
double s =0;
/∗ Obliczamy sumȩ wyraz ów s z e r e g u od m=2^k do 2m−1=2^{k+1}−1 ∗/
f o r ( double n=m; n<m∗2;++n ) {
s=s +1/n ;
}
c o u t << "T[" << k << " ]= " << s << e n d l ;
m=m∗ 2 ; /∗ K o l e j n a p o r c j a b ȩ d z i e mia ł a dwa r a z y wi ȩ c e j sk ł adnik ów ∗/
}
}
 
P2k+1 −1
Listing 5.4: Obliczanie sumy n=2k
1
n w C++
132 ROZDZIAŁ 5. SZEREGI

5.2 Własności podstawowe


5.2.1 Warunek konieczny zbieżności

P∞
Twierdzenie 5.2.1 Szereg i=k xi o wyrazach w ciele F jest zbieżny wtedy i tylko wtedy gdy
m
X
∀ε > 0∃N ∈ Nk ∀m ­ n ­ N | xi | < ε.
i=n

Dowód: [•] Własność ta oznacza, że ciąg sum częściowych szeregu spełnia warunek Cauchy’ego. Zatem teza wynika z
zupełności przestrzeni R lub C. 

P∞
Wniosek 5.2.2 Jeśli szereg n=1 xn jest zbieżny, to limn→∞ xn = 0. 

P∞
Przykład 5.2.3 Rozważmy szereg n=0 3n+2 .
2n−1
Mamy

2n − 1 2− 1
2
lim = lim n
=
n→∞ 3n + 2 n→∞ 3 + 2 3
n
P∞
Zatem warunek konieczny zbieżności nie jest spełniony, czyli szereg 2n−1
n=0 3n+2 nie jest zbieżny.

5.2.2 Bezwzględna zbieżność

P∞ P∞
Definicja 5.2.4 Szereg i=k xi nazywamy bezwzględnie zbieżnym, jeżeli szereg i=k |xi | jest zbieżny.

P∞
Twierdzenie 5.2.5 Jeśli szereg i=k xi jest bezwzględnie zbieżny to jest zbieżny oraz

X ∞
X
| xi | ¬ |xi |.
i=k i=k

Dowód: [•] Ponieważ ciąg sum częściowych dla szeregu wartości bezwzględnych spełnia warunek Cauchy’ego, więc, jak
łatwo sprawdzić, również ciąg sum częściowych wyjściowego szeregu spełnia ten warunek i teza wynika z zupełności R lub
C. 

5.2.3 Szereg geometryczny

P∞
Definicja 5.2.6 Niech a, q ∈ C, a 6= 0. Szereg n=0 aq n , nazywamy szeregiem geometrycznym.
5.1. POJĘCIE SZEREGU 133

Twierdzenie 5.2.7 Szereg geometryczny jest zbieżny gdy |q| < 1. W przeciwnym razie jest on rozbieżny.

Dowód: [•] Podstawiając b = 1, a = q we wzorze (2.3) i zastępując n przez n + 1 dodstajemy


n
X
1 − q n+1 = (1 − q)(1 + q + q 2 · · · + q n ) = (1 − q) qi ,
i=0

a stąd n-ta suma częściowa szeregu gemoetrycznego wynosi


n
X 1 − q n+1
sn = a qi = a .
i=0
1−q

Zatem, jeśli |q| < 1, to


a
lim sn = ,
n→∞ 1−q
czyli szereg jest zbieżny. Natomiast jeśli |q| ­ 1, to ciąg aq n na pewno nie jest zbieżny do zera, więc nie jest spełniony
warunek konieczny zbieżności. 

5.2.4 Szereg o wyrazach nieujemnych


P∞ Pm
Ustalmy szereg n=0 an i dla m ∈ N oznaczmy przez sm := n=0 an jego m-tą sumę częściową.

Uwaga 5.2.8 Ciąg sum częściowych jest słabo rosnący gdy jego wyrazy są nieujemne, a silnie rosnący gdy są dodatnie.
Co więcej, jeśli wyrazy są nieujemne, a szereg jest zbieżny, to

X
an = sup { sm | m ∈ N }.
n=0

Dowód: [•] Ponieważ sk+1 = sk + ak+1 dostajemy sk+1 ­ sk gdy ak ­ 0 oraz sk+1 > sk gdy ak > 0. Dowodzi to
pierwszej części uwagi. Druga wynika natychmiast z twierdzenia 2.5.6 . 
P∞
Uwaga 5.2.9 Jeśli n=0 an jest zbieżnym szeregiem o wyrazach dodatnich, to jego suma jest silnie większa od każdego
z jego wyrazów, czyli dla każdego k ∈ N mamy
X∞
an > ak .
n=0

P∞
Dowód: [•] Niech n=0 an będzie zbieżnym szeregiem o wyrazach dodatnich. Dla k ∈ N na mocy uwagi 5.2.8 mamy

X
ak ¬ sk < sk+1 ¬ an .
n=0

co kończy dowód. 

P∞
Twierdzenie 5.2.10 Niech a : N → R będzie ciągiem o wyrazach nieujemnych. Szereg n=1 an jest zbieżny wtedy i
tylko wtedy gdy jego ciąg sum częściowych jest ograniczony.
134 ROZDZIAŁ 5. SZEREGI
P∞
Dowód: [•] Z uwagi 5.2.8 wiemy, że ciąg sum częściowych szeregu n=1 an jest ciągiem słabo rosnącym. Jeśli jest
więc ograniczony, to na mocy twierdzenia 2.5.6 jest zbieżny. Na odwrót, załóżmy, że ciąg sum częściowych jest zbieżny do
liczby s ∈ R. Ustalmy k ∈ N i rozważmy m ∈ N takie, że k ¬ m. Wtedy, znów na mocy uwagi 5.2.8

sk ¬ sm . (5.1)

Lewa strona nierówności (5.1) nie zależy od m, zatem przechodząc w niej z m do nieskończoności przy ustalonym k dostajemy

sk ¬ s. (5.2)

Nierówność ta jest prawdziwa dla dowolnego k ∈ N. Dowodzi to, że ciąg sum częściowych jest ograniczony. 

5.2.5 Kryterium porównawcze.

Twierdzenie 5.2.11 (Kryterium porównawcze) Jeśli ciągi a, b : Nk → R mają wyrazy nieujemne i istnieje N ∈ N
takie, że an ¬ bn dla n ­ N , to:
P∞ P∞
(i) jeśli n=k bn jest zbieżny, to n=k an jest zbieżny,
P∞ P∞
(ii) jeśli n=k an jest rozbieżny, to n=k bn jest rozbieżny.

Dowód: [•] Zauważmy, że z założenia dla m ­ N mamy nierówność


m
X m
X
0¬ an ¬ bn . (5.3)
n=N n=N
PN −1 PN −1
Niech c := n=k an − n=k bn . Wykorzystując (5.3) dostajemy dla m ­ k
m
X m
X
an ¬ c + bn . (5.4)
n=k n=k
P∞
Dla dowodu (i) załóżmy, że n=k bn jest zbieżny. Z twierdzenia 5.2.10 wnosimy, że ciąg sum częściowych tego szeregu
jest ograniczony. Ponieważ wartość c nie zależy od m, z nierówności (5.4) Pwynika, że również ciąg sum częściowych szeregu
∞ ∞
jest ograniczony i ponownie z twierdzenia 5.2.10 , że szereg n=k an jest zbieżny. Własność (ii) dowodzimy
P
n=k an
analogicznie, również z nierówności (5.4) i twierdzenia 5.2.10 . 

P∞
Przykład 5.2.12 Rozważmy szereg n=0 n2 +1 .
2n
Mamy

2n 2
lim = lim n
= 0.
n→∞ n2 + 1 n→∞ 1 + 12
n
P∞
Zatem warunek konieczny zbieżności jest spełniony. Jednak szereg n=0 n22n
+1 nie jest zbieżny, bo jak łatwo sprawdzić
zachodzi n2 +1 ­ n dla n ­ 1. Ponieważ szereg harmoniczny jest rozbieżny, z kryterium porównawczego wynika, że
2n 1
P∞
szereg n=0 n22n+1 jest również rozbieżny.

P∞ P∞
Wniosek 5.2.13 Niech n=k zn będzie szeregiem liczb zespolonych, a n=k xn zbieżnym szeregiem liczb rzeczywi-
P∞
stych. Jeśli istnieje N ∈ N takie, że |zn | ¬ xn dla n ­ N , to szereg n=k zn jest bezwzględnie zbieżny. 
5.3. KRYTERIA ZBIEŻNOŚCI 135

5.3 Kryteria zbieżności


5.3.1 Szereg harmoniczny rzędu p.

Twierdzenie 5.3.1 Niech ciąg a : N1 → R+ będzie słabo malejący. Rozważmy ciąg

b : N0 3 n 7→ 2n a2n ∈ R+ .
P∞ P∞
Wtedy zbieżność szeregu n=1 an jest równoważna zbieżności szeregu n=0 bn .

Dowód: (*) Dla n ∈ N połóżmy

sn := a1 + a2 + a3 + · · · + an
tn := a1 + 2a2 + 22 a4 + · · · + 2n a2n .

Pokażemy nierówności

sn ¬ tn , (5.5)
tn ¬ 2s2n . (5.6)

Ponieważ ciąg an jest słabo malejący, mamy

sn ¬ a1 + a2 + a3 + · · · + a2n −1
= a1 + (a2 + a3 ) + (a4 + a5 + a6 + a7 ) + · · · + (a2n−1 + a2n−1 +1 + · · · + a2n −1 )
¬ a1 + 2a2 + 4a4 + · · · + 2n−1 a2n−1
< tn ,

co dowodzi (5.5). Mamy też

s2n = a1 + a2 + a3 + · · · + a2n
= a1 + a2 + (a3 + a4 ) + (a5 + a6 + a7 + a8 ) + · · · + (a2n−1 +1 + a2n−1 +2 + · · · + a2n )
a1
­ + a2 + 2a4 + · · · + 2n−1 a2n
2
tn
= ,
2
P∞
co dowodzi (5.6).
P∞Zatem ciąg sum częściowych szeregu n=1 an jest ograniczony wtedy i tylko wtedy gdy ciąg sum częścio-
wych szeregu n=0 bn jest ograniczony. Tak więc teza wynika z twierdzenia 5.2.10 . 
P∞
Wniosek 5.3.2 Szereg 1
n=1 np jest zbieżny dla p > 1, a rozbieżny dla p ¬ 1.
P∞
P∞ (*)Na mocy twierdzenia 5.3.1 zbieżność szeregu n=1 an o wyrazach an = jest równoważna zbieżności
1
Dowód: np
szeregu n=1 bn o wyrazach
n
1 1

bn = 2n
= ,
(2n )p 2p−1
a więc szeregu geometrycznego o ilorazie q = 2p−1
1
. Na mocy twierdzenia 5.2.7 szereg geometryczny o ilorazie q jest zbieżny
wtedy i tylko wtedy gdy |q| < 1 co dla naszego q jest spełnione gdy p > 1. 
136 ROZDZIAŁ 5. SZEREGI

5.3.2 Kryterium Leibniza

Twierdzenie 5.3.3 (Leibniza


P∞o szeregu naprzemiennym) Niech a : N0 → R+ będzie ciągiem słabo malejącym i zbież-
nym do zera. Wtedy szereg n=0 (−1) an jest zbieżny oraz dla dowolnego m ∈ N1
n

2m−1
X ∞
X 2m
X
(−1)n an ¬ (−1)n an ¬ (−1)n an . (5.7)
n=0 n=0 n=0
Pm P∞
Dowód: Dla n ∈ N niech sm := n=0 (−1)n an oznacza m-tą sumę częściową szeregu n=0 (−1)n an . Przeanalizujemy
oddzielnie zbieżność sum częściowych o parzystej i nieparzystej liczbie składników. Mamy s2n = s2n−2 −(a2n−1 −a2n ) ¬ s2n−2
oraz s2n−1 = s2n−3 + (a2n−2 − a2n−1 ) ­ s2n−3 zatem ciąg n 7→ s2n jest nierosnący, a ciąg ciąg n 7→ s2n−1 jest niemalejący.
Mamy też

s2n−1 = (a0 − a1 ) + (a2 − a3 ) + · · · + (a2n−2 − a2n−1 ) ­ 0,


s2n = a0 − (a1 − a2 ) − (a3 − a4 ) − · · · − (a2n−1 − a2n ) ¬ a0 .

oraz s2n = s2n−1 + a2n ­ s2n−1 . Zatem


0 ¬ s2n−1 ¬ s2n ¬ a0
co dowodzi, że ciągi n 7→ s2n−1 i n 7→ s2n są ograniczone. Na mocy twierdzenia 5.2.10 ciągi te są zbieżne. Przechodząc
w równości s2n = s2n−1 + a2n z n do nieskończoności i wykorzystująć zbieżność ciągu an do zera wnosimy, że ciągi te są
zbieżne do tej samej granicy.
P∞ Nietrudno zauważyć, że w tej sytuacji również pełny ciąg n 7→ sn sum częściowych jest zbieżny,
co oznacza, że szereg n=0 (−1)n an jest zbieżny. W szczególności mamy

X
s2m−1 ¬ (−1)n an ¬ s2m
n=0

co dowodzi wzoru (5.7) P∞ 


Z kryterium Leibniza natychmiast wynika, że szeregP∞ n=0 (−1) n1
n jest zbieżny. Jest to przykład szeregu, który jest
zbieżny, ale nie jest bezwzględnie zbieżny, bo szereg n=0 n1 jest rozbieżny.

5.3.3 Kryterium Cauchy’ego i kryterium d’Alemberta


Badaniem zbieżności szeregów zajmowali się w szczególności matematycy francuscy: najpierw Jean le Rond d’Alembert
(rys. 5.2 ), a następnie Augustin Louis Cauchy (rys. 1.5 ). Podali oni następujące kryteria zbieżności szeregów.

Twierdzenie 5.3.4 (Kryterium Cauchy’ego) Niech a : N → C będzie ciągiem oraz

α := lim sup n |an |,


p
n→∞

Wtedy:
P∞
(i) jeśli α < 1 to n=0 an jest zbieżny,
P∞
(ii) jeśli α > 1 to n=0 an jest rozbieżny,

Dowód: Aby pokazać (i) załóżmy, że α < 1 i ustalmy γ ∈ (α, 1). Z twierdzenia Pn 4.5.3 znajdziemy N ∈ N takie, że
|an | <Pγ dla n ­ N . Zatem również |an | < γ n dla n ­ N . Ponieważ γ < 1, szereg i=0 γ n jest zbieżny. Tak więc zbieżność
pn


szeregu n=0 an wynika z kryterium porównawczego (twierdzenia 5.2.11 ).
5.3. KRYTERIA ZBIEŻNOŚCI 137

Rysunek 5.2: Jean le Rond d’Alembert, 1717-1783, Źródło: Wikipedia

Przyjmijmy z kolei, że α > 1. Wtedy znajdziemy podciąg ciągu an zbieżny do granicy większej niż jeden. Oznacza to, że
ciąg an nie jest zbieżny do zera, a więc nie jest spełniony warunek konieczny zbieżności. Dowodzi to własności (ii). 
Zwróćmy uwagę, że twierdzenie 5.3.4 nic nie mówi w przypadku gdy α = 1. To dlatego, że w tym przypadku kryterium
to nie pozwala rozstrzygnąć czy szereg jest zbieżny, czy nie.

n7
P∞
Przykład 5.3.5 Rozważmy szereg n=0 7n . Stosując kryterium Cauchy’ego dostajemy
r √
n7 ( n n)7 1
lim = lim = < 1,
n

n→∞ 7n n→∞ 7 7
skąd wnosimy, że szereg jest zbieżny.

Twierdzenie 5.3.6 (Kryterium d’Alemberta) Niech a : N → C będzie ciągiem oraz

|an+1 |
β := lim sup .
n→∞ |an |

Wtedy:
P∞
(i) jeśli β < 1 to n=0 an jest zbieżny,
an+1 P∞
(ii) jeśli istnieje N ∈ N takie, że an > 1 dla n ­ N , to n=0 an jest rozbieżny.

Dowód: Dla dowodu (i) załóżmy, że β < 1 i ustalmy γ ∈ (β, 1). Z twierdzenia 4.5.3 znajdziemy N ∈ N takie, że
am+1
| | < γ dla m ­ N. (5.8)
am
138 ROZDZIAŁ 5. SZEREGI

Pokażemy indukcyjnie, że |an | ¬ γ n |aγN


N
|
dla n ­ N . Dla n = N mamy równość, a więc tym bardziej nierówność. Z kolei dla
n ­ N przy wykorzystaniu nierówności (5.8) oraz założenia indukcyjnego dostajemy
|aN | |aN |
|an+1 | ¬ γ|an | ¬ γγ n = γ n+1 N .
γN γ
P∞
Zatem zbieżność szeregu n=0 an ponownie wynika z twierdzenia 5.2.11 poprzez porównanie z szeregiem potęgowym
P∞ n |aN |
n=0 γ γ N .
an+1
Jeśli istnieje N ∈ N takie, że an > 1 dla n ­ N , to poczynając od n = N ciąg an jest silnie rosnący, a więc nie może
być zbieżny do zera. Zatem warunek konieczny zbieżności nie jest spełniony, co dowodzi (ii). 

zn
P∞
Przykład 5.3.7 Szereg n=0 n! jest zbieżny dla dowolnego z ∈ C. Wynika to natychmiast z kryterium d’Alamberta,
ponieważ
n+1
z
| (n+1)! | |z|
lim sup = lim sup = 0.
n+1
n
n→∞ | zn! | n→∞

P∞ 7n (n!)2
Przykład 5.3.8 Rozważmy szereg n=0 (2n)! . Stosując kryterium d’Alamberta dostajemy

7n+1 ((n+1)!)2
(2(n+1))! 7(n + 1)2 7n + 7 7
lim = lim = lim = > 1,
n→∞ 7n (n!)2 n→∞ (2n + 1)(2n + 2) n→∞ 4n + 2 4
(2n)!

skąd wnosimy, że szereg jest rozbieżny.

5.3.4 Szeregi potęgowe


P∞
Szereg potęgowy uogólnia pojęcie szeregu geometrycznego n=0 aq n poprzez zastąpienie stałej a ciągiem zmieniających się
współczynników cn .
P∞
Definicja 5.3.9 Szeregiem potęgowym nazywamy szereg postaci n=0 cn z n , gdzie z ∈ C jest ustalonym parametrem,
a ciąg c : N0 → C jest tzw. ciągiem współczynników szeregu potęgowego.

P∞
będzie szeregiem potęgowym, α := lim supn→∞
n
p
Twierdzenie 5.3.10 Niech n=0 cn z
n
|cn |, a

 α gdy 0 < α < ∞,
 1

R := 0 gdy α = ∞,
∞ gdy α = 0.

P∞ n
Wtedy szereg n=0 cn z jest zbieżny dla |z| < R, a rozbieżny dla |z| > R. Kryterium nie rozstrzyga zbieżności gdy
|z| = R.
P∞
Dowód: Do sprawdzenia zbieżności szeregu n=0 cn z n zastosujmy twierdzenie 5.3.4 (kryterium Cauchy’ego). Mamy
lim sup n |cn z n | = lim sup n |cn | · |z| = α|z|.
p p
n→∞ n→∞

Zatem szereg jest zbieżny gdy α|z| < 1 co jest równoważne |z| < R i rozzbieżny gdy α|z| > 1 co jest równoważne |z| > R.

5.4. OPERACJE NA SZEREGACH 139

Ćwiczenie 5.3.11 Sprawdź, że


P∞
(i) Dla n=0 nn z n promień zbieżności R = 0,

zn
P∞
(ii) Dla n=0 n! promień zbieżności R = ∞,

P∞
(iii) Dla n=0 z n promień zbieżności R = 1 i szereg rozbieżny gdy |z| = 1,

zn
P∞
(iv) Dla n=1 n promień zbieżności R = 1

zn
P∞
(v) Dla n=1 n2 promień zbieżności R = 1 i szereg zbieżny gdy |z| = 1.

5.4 Operacje na szeregach


P∞ P∞
Załóżmy, że n=0 an i n=0 bn są szeregami o wyrazach zespolonych. Niech c ∈ C będzie ustaloną liczbą zespoloną.

5.4.1 Suma i iloczyn szeregów

P∞ P∞ P∞ P∞
Twierdzenie 5.4.1 Jeśli n=0 an i n=0 bn są zbieżne, to zbieżne są też szeregi n=0 (an + bn ) i n=0 (can ) oraz
zachodzą wzory

X ∞
X ∞
X
(an + bn ) = an + bn ,
n=0 n=0 n=0

X X∞
can = c an .
n=0 n=0

Dowód: Stosowne równości zachodzą dla sum częściowych. Wystarczy więc zastosować do nich twierdzenie 2.5.1 o
granicy sumy i iloczynu ciągów. 

5.4.2 Iloczyn Cauchy’ego szeregów


Twierdzenie 5.4.1 pokazuje, że dwa zbieżne szeregi można dodawać wyraz po wyrazie otrzymujac ˛ zbieżny szereg, którego suma jest suma˛ sum szeregów
składowych. Naturalne jest wi˛ec pytanie, czy szeregi można przez siebie mnożyć tak by otrzymać zbieżny szereg, którego suma jest iloczynem sum mnożonych
szeregów. Okazuje si˛e, że pod pewnymi warunkami tak, ale sprawa jest bardziej delikatna niż dla dodawania szeregów. Szereg, który tak si˛e zachowuje zwany
jest iloczym Cauchy’ego, a wzór na jego n-ty wyraz przypomina nieco wzór na n-ty współczynnik iloczynu dwóch wielomianów.

P∞ P∞
Definicja 5.4.2 Iloczynem Cauchy’ego szeregów n=0 an i n=0 bn jest szereg
∞ n
!
X X
ak bn−k ,
n=0 k=0
P∞ Pn
a więc szereg n=0 cn , którego n-ty wyraz wynosi cn := k=0 ak bn−k .
140 ROZDZIAŁ 5. SZEREGI

Jak zobaczymy w rozdziale 6.1 , poniższe twierdzenie nie jest sztuka˛ dla sztuki, ale ma ważne konsekwencje w badaniu własności zespolonej funkcji
wykładniczej, a w konsekwencji również własności funkcji trygonometrycznych.

P∞ P∞
Twierdzenie 5.4.3 Jeśli szeregi n=0 an i n=0 bn są zbieżne i przynajmniej jeden z nich jest zbieżny bezwzględnie,
to iloczyn Cauchy’ego tych szeregów jest zbieżny i zachodzi wzór
∞ ∞
! ∞ !
X X X
cn = an bn . (5.9)
n=0 n=0 n=0

P∞ P∞
Dowód: Dla ustalenia uwagi przyjmijmy, że to szereg n=0 an jest bezwzględnie zbieżny i połóżmy α := n=0 |an |.
Ponadto przyjmijmy oznaczenia
m
X m
X m
X
Am := an , Bm := bn , Cm := cn
n=0 n=0 n=0

oraz
A := lim Am , B := lim Bm , βm := Bm − B.
m→∞ m→∞

Mamy

Cm = c0 + c1 + c2 + · · · + cm (5.10)
= a0 b0 + (a0 b1 + a1 b0 ) + (a0 b2 + a1 b1 + a2 b0 ) + · · · + (a0 bm + a1 bm−1 + · · · + am b0 ) (5.11)
= a0 Bm + a1 Bm−1 + · · · + am B0 (5.12)
= a0 (B + βm ) + a1 (B + βm−1 ) + · · · + am (B + β0 ) (5.13)
= Am B + a0 βm + a1 βm−1 + · · · + am β0 (5.14)
= Am B + γ m , (5.15)

gdzie
γm := a0 βm + a1 βm−1 + · · · + am β0 . (5.16)
Pokażemy, że limm→∞ γm = 0. W tym celu ustalmy ε > 0. Ponieważ limm→∞ βm = 0, więc znajdziemy N ∈ N takie, że dla
n ­ N jest |βn | < ε. Przy tak ustalonych ε > 0 oraz N ∈ N i przyjmując dla m ­ N oznaczenia

ξm := |am ||β0 | + |am−1 ||β1 | + · · · + |am−N ||βN |, (5.17)


ζm := |am−N −1 ||βN +1 | + |am−N −2 ||βN +2 | + · · · + |a0 ||βm | (5.18)

oraz wykorzystując nierówność trójkąta dostajemy ze wzoru (5.16)

|γm | ¬ ξm + ζm . (5.19)
P∞
Z założenia bezwzględnej zbieżności szeregu n=0 |an | i warunku koniecznego zbieżności szeregu mamy limk→∞ |ak | = 0.
Zatem dla każdego k ∈ {0, 1, 2, . . . , N }, czyli dla każdego składnika sumy we wzorze (5.17) mamy też limm→∞ |am−k |||βk | =
0. Zauważmy, że dla wszystkich m ­ N liczba składników we wzorze (5.17) pozostaje stała i wynosi N + 1. Zatem z
twierdzenia o granicy sumy ciągów mamy
N
X
lim ξm = lim |am−k ||βk | = 0. (5.20)
m→∞ m→∞
k=0
5.4. OPERACJE NA SZEREGACH 141

Do wyznaczenia granicy ciągu ζm nie możemy zastosować twierdzenia o granicy sumy ciągów, bo liczba składników we
wzorze (5.18) wynosi m P− N i przy m → ∞ rośnie do nieskończoności. Jednak, ponieważ |βm | < ε dla m ­ N , a każda

suma częsciowa szeregu n=0 |an | szacuje się przez sumę tego szeregu, którą oznaczyliśmy przez α, dla m ­ N dostajemy
ζm ¬ αε, co oznacza, że liczba αε jest majorantą zbioru punkktów granicznych ciągu o wyrazach ζm . Zatem z definicji
granicy górnej wnosimy, że dla każdego ε > 0 zachodzi

lim sup ζm ¬ αε. (5.21)


m→∞

W szczególności dla każdego n ∈ N mamy


1
0 ¬ lim sup ζm ¬ α .
m→∞ n
Przechodząc z n do granicy dostajemy lim supm→∞ ζm = 0, a w konsekwencji również limm→∞ ζm = 0, bo ciąg ζm ma
wyrazy nieujemne. W efekcie, ze wzoru (5.20) i wzoru (5.19) dostajemy

lim |γm | = 0,
m→∞

zatem również limm→∞ γm = 0. Tak więc ze wzoru (5.10) mamy

lim Cm = lim Am B = AB,


m→∞ m→∞

co dowodzi, że iloczyn Cauchy’ego jest zbieżny i zachodzi wzór (5.9). 

5.4.3 Zmiana kolejności sumowania.


Naturalne
P∞jest pytanie czy zmiana kolejności wyrazów szeregu wpływa na jego zbieżność i na wartość sumy. Rozważmy
szereg n=0 an o wyrazach zadanych ciągiem a : N → C oraz bijekcję k : N → N.
P∞ P∞
Definicja 5.4.4 Szereg
P∞ k=0 ank o wyrazach zadanych ciągiem a◦k : N → C nazywamy permutacją szeregu n=0 an .
Mówimy, że szereg n=0 an jest bezwarunkowo zbieżny, jeżeli każda jego permutacja jest zbieżna.

P∞
Twierdzenie 5.4.5 Załóżmy, że szereg i=0 ai jest zbieżny, ale nie jest bezwzględnie zbieżny. Wtedy dla dowolnych
P∞
α, β ∈ R spełniającyh α ¬ β istnieje bijekcja k : N → N taka, że dla ciągu sum częściowych sn permutacji j=0 aij
P∞
szeregu i=0 ai zachodzi lim inf i→∞ sn = α oraz lim supi→∞ sn = β.

Dowód: Dla i ∈ N połóżmy

|ai | + ai
pi := = max(0, ai ),
2
|ai | − ai
qi := = max(0, −ai )
2
P∞ P∞
i zauważmy, że pi ­ 0, qi ­ 0, pi − qi = ai , pi + qi = |ai |. Szeregi
P∞ i i
i=0 pP i=0 qiPnie mogą być oba zbieżne, bo w
∞ ∞
przeciwnym razie, na mocy twierdzenia 5.4.1 , również szereg i=0 |ai | = i=0 pi + i=0 qi byłby zbieżny, co przeczy
PN PN PN
założeniu.
P∞ PPonieważ dla sum częsciowych mamy równość, i=0 ai = pi + i=0 qi , więc gdyby jeden z szeregów
i=0 P
∞ ∞
pi ,
i=0 P i=0 P q i był zbieżny, to zbieżny byłby również ten drugi, bo szereg i=0 ai jest z założenia zbieżny. Zatem oba
∞ ∞
szeregi i=0 pi , i=0 qi są rozbieżne i to do nieskończoności, bo mają wyrazy nieujemne.
142 ROZDZIAŁ 5. SZEREGI
P∞ P∞
Rozważmy
P∞ teraz szeregi
P∞ i=0 Pi oraz i=0 Qi otrzymane poprzez opuszczenie wyrazów o wartości zero odpowiednio w
szeregach i=0 pi oraz i=0 qi . Oczywiście oba te szeregi są również rozbieżne do nieskończoności. Skonstruujemy rekuren-
cyjnie ciągi m, n : N → N przyjmując
Pj
m1 := min { j ∈ N | i=0 Pi > β },
Pm1 Pj
n1 := min { j ∈ N | i=0 Pi − i=0 Qi < α },
Pm1 Pn1 Pm2 Pn2 Pj
mk+1 := min { j ∈ N | i=0 Pi − i=0 Qi + i=m 1 +1
Pi − i=n 1 +1
Qi + . . . + i=mk +1 Pi > β },
Pm1 Pn1 Pm2 Pn2 Pj
nk+1 := min { j ∈ N | i=0 Pi − i=0 Qi + i=m 1 +1
Pi − i=n 1 +1
Qi + . . . − i=nk +1 Qi < α }.

Zwróćmy uwagę, że minima w powyższych wzorach są dobrze Pzdefiniowane, bo brane


P∞ są po niepustych podzbiorach zbioru

liczb naturalnych. Niepustość wynika z faktu, że tak szereg i=0 Pi jak i szereg i=0 Qi są rozbieżne do nieskończoności.
Łatwo zauważyć z konstrukcji Pi oraz Qi , że szereg

P1 + . . . + Pm1 − Q1 − . . . − Qn1 + Pm1 +1 + . . . + Pm2 − Qn1 +1 − . . . − Qn2 + . . . (5.22)


P∞
jest permutacją szeregu i=0 ai . Niech xk oraz yk oznaczają sumę częściową szeregu (5.22) o ostatnim wyrazie odpowiednio
Pmk i −Qnk . Wtedy
0 < xk − β ¬ Pmk oraz 0 < α − yk ¬ Qnk
skąd otrzymujemy β = limk→∞ xk oraz α = limk→∞ yk , co oznacza, że α i β są punktami granicznymi ciągu sum częsciowych
spermutowanego szeregu (5.22). Rozważmy teraz ciąg o wyrazach tn będący podciągiem ciągu sum częściowych szeregu (5.22)
zbieżnym do liczby t ∈ R. Łatwo zauważyć, że da się znaleźć podciągi x0n oraz yn0 ciągów xn , yn takie, że x0N ¬ tn ¬ yn0 ,
skąd w granicy dostajemy α ¬ t ¬ β. Dowodzi to, że α jest najmniejszym, a β największym punktem granicznym ciągu sum
częściowych szeregu (5.22), czyli lim inf i→∞ sn = α oraz lim supi→∞ sn = β. 
P∞
Twierdzenie 5.4.6 Jeśli szereg i=1 ai o wyrazach zespolonych zadanych ciągiem a : N → C jest bezwzględnie
zbieżny, to jest bezwarunkowo zbieżny.
P∞
Dowód:
Pn Niech k : N1P→ N1 będzie bijekcją i niech a0 := a ◦ k. Rozważmy szereg spermutowany i=1 a0i . Połóżmy
n
sn := i=1 ai oraz s0n := i=1 a0i i do ε > 0 dobierzmyN ∈ N takie, że
m
X
m­n­N ⇒ |ai | < ε.
i=n

Niech p := max k −1 (IN ). Wtedy IN ⊂ k(Ip ) i dla n > p mamy


n
X n
X n
X X
|s0n − sn | = ai − aki ¬ |ai | + |aki | ¬ 2ε
i=1 i=1 i=N +1 i6∈k−1 (IN )

ponieważ wyrazy ai dla i ∈ IN występują w obu sumach i w efekcie się redukują. Przechodząc w otrzymanej nierówności z n
do
P∞nieskończoności wnosimy, że każdy punkt graniczny ciągu sn leży nie dalej niż ε od P
0
granicy ciągu sn , czyli sumy szeregu

i=1 ai . Ponieważ ε > 0 P
jest dowolnie ustalone, oznacza to, że szereg spermutowany i=1 a0i jest również zbieżny i to do

tej samej sumy co szereg i=1 ai . 

5.4.4 Szeregi w programie Mathematica


Program Mathematica dość dobrze radzi sobie z liczeniem sum szeregów, a w przypadku braku zbieżności sygnalizuje ten
P∞
fakt. Do policzenia sumy szeregu i=p an używamy instrukcji
Sum[a[n],{n,p,Infinity}]
5.4. OPERACJE NA SZEREGACH 143

Na przykład
Sum[1/n!, {n, 2, Infinity}]
P∞ 1
zwraca n=2 n! = −2 + e. Oznacza to, że Mathematica, w miarę swoich umiejętności, stara się zwrócić wynik dokładny,
używając symbolicznych oznaczeń na stałe matematyczne.
144 ROZDZIAŁ 5. SZEREGI
Rozdział 6

Funkcje wykładnicza, logarytmiczna i


trygonometryczne

W rozdziale tym wracamy do tematu, który nieformalnie podj˛eliśmy w rozdziale 2.6.3 . Przypomnijmy, że naszkicowaliśmy tam jak rozszerzyć definicj˛e pot˛egi
an z przypadku wykładnika n ∈ N na przypadek wykładnika b˛edacego ˛ dowolna˛ liczba˛ rzeczywista.˛ Podejście bardziej intuicyjne, ale też bardziej żmudne w
szczegółach polega na stopniowym poszerzaniu definicji z przypadku wykładnika b˛edacego˛ liczba˛ naturalna˛ najpierw na wykładniki całkowite, potem na wymierne
i na końcu, metoda˛ aproksymacji, na wykładniki rzeczywiste. Teoria szeregów pozwala podać inna,˛ ale jak pokażemy równoważna˛ definicj˛e, która od razu obejmuje
˛ liczbami zespolonymi. Nie definiujemy jednak od razu funkcji wykładniczej x 7→ ax o dowolnej podstawie, lecz funkcj˛e wykładnicza˛ x 7→ ex o
wykładniki b˛edace
podstawie e zdefiniowanej wzorem (2.23). Nast˛enie definiujemy logarytm o podstawie e, a dopiero potem funkcj˛e wykładnicza˛ i logarytm o dowolnej podstawie.

6.1 Zespolona funkcja wykładnicza.


6.1.1 Liczba e jako suma szeregu.
Następujące twierdzenie pozwala przybliżać liczbę e za pomocą szeregu. Co więcej, można pokazać, że szereg ten zbiega do
liczby e znacznie szybciej niż ciąg (2.23) użyty do jej zdefiniowania.

Twierdzenie 6.1.1

X 1
= e.
n=0
n!

Dowód: (*) Dla n ∈ N przyjmijmy oznaczenia


n
1

tn := 1+ ,
n
n
X 1
sn := .
i=0
i!

P∞ 1
Z twierdzenia 2.6.1Pi wzoru (2.23) wiemy, że limn→∞ tn = e. Z kolei z twierdzenia 5.3.6 wnosimy, że szereg n=0 n! jest

zbieżny. Niech s := n=0 n!
1
oznacza jego sumę. Z definicji sumy szeregu wiemy, że s = limn→∞ sn = s. Naszym celem jest

145
146 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE

zatem pokazanie, że s = e. Zauważmy, że ze wzoru (2.4) w twierdzeniu 2.1.5 dostajemy


n n   n(n−1) n(n−1)(n−2) n(n−1)(n−2)·...·2·1
1 n 1 n
 X
tn = 1+ = = 1 + n
+ n·n
+ n·n·n
+ ··· + n·n·n...·n
= (6.1)
n k nk 1! 2! 3! n!
k=0
1(1 − n1 ) 1(1 − n1 )(1 − n2 ) 1(1 − n1 )(1 − n2 ) · . . . · (1 − n )
n−1
1+1+ + + ··· + . (6.2)
2! 3! n!
Zatem
1 1 1
tn ¬ 1 + 1 +
+ + ··· + = sn .
2! 3! n!
Na mocy twierdzenia 2.5.3 możemy w powyższej nierówności przejść do granicy i otrzymujemy e ¬ s. Aby udowodnić
nierówność przeciwną ustalmy liczbę naturalną m ∈ N. Dla n ­ m ze wzoru (6.1) dostajemy

1(1 − n1 ) 1(1 − n1 )(1 − n2 ) 1(1 − n1 )(1 − n2 ) · . . . · (1 − n )


m−1
tn ­ 1 + 1 + + + ··· + .
2! 3! m!
Ponownie korzystając z twierdzenia 2.5.3 przechodzimy w powyższym wzorze do granicy z n przy ustalonym m i dostajemy
1 1 1
e­1+1+ + + ··· + = sm .
2! 3! m!
Z kolei przechodząc z m do granicy dostajemy e ­ s. 

6.1.2 Funkcja E.
Dla z ∈ C rozważmy szereg

X zn
. (6.3)
n=0
n!

Jest on dobrze określony dla z 6= 0. Dla z = 0 wyrażenie z 0 nie jest dobrze określone, ale w kontekście tego szeregu
przyjmujemy, że wynosi 1, a więc tak samo jak dla z 6= 0. Możemy też uniknąć pytania co rozumiemy przez z 0 dla z = 0
zapisując powyższy szereg w postaci

X zn
1+ . (6.4)
n=1
n!

Łatwo sprawdzić za pomocą kryterium d’Alemberta, że szereg (6.3) jest zbieżny. Z wniosku 5.2.2 dostajemy zatem nastę-
pującą pożyteczną uwagę, która przyda się nam później.

Uwaga 6.1.2 Dla dowolnego z ∈ C mamy


zn
lim = 0.
n→∞ n!

Wracając do szeregu (6.3), jego zbieżność pozwala nam zdefiniować funkcję



X zn
E : C 3 z 7→ E(z) := ∈ C. (6.5)
n=0
n!

6.1.3 Własności funkcji E.


Własności tej funkcji zbiera następujące twierdzenie.
6.1. ZESPOLONA FUNKCJA WYKŁADNICZA. 147

Twierdzenie 6.1.3 Funkcja E ma następujące własności:


(i) E(0) = 1 oraz E(1) = e,

(ii) dla dowolnych z1 , z2 ∈ C


E(z1 + z2 ) = E(z1 )E(z2 ),

(iii) dla dowolnego z ∈ C mamy E(z) 6= 0 oraz


1
E(−z) = ,
E(z)

(iv) limz→0 E(z) = 1.


(v) E jest funkcją ciągłą,
(vi) dla dowolnego z ∈ C
E(z) = E(z).

(vii) jeśli x ∈ R to E(x) ∈ R+ , a E(x) > 1 dla x > 0.

Dowód: Wzór E(0) = 1 dostajemy podstawiając z = 0 w (6.4). Z kolei z twierdzenia 6.1.1 wynika, że E(1) = e.
Dowodzi to własności (i). Aby pokazać (ii) zauważmy, że z twierdzenia 5.4.3 o iloczynie Cauchy’ego szeregów oraz ze wzoru
(2.4) w twierdzeniu 2.1.5 mamy
∞ ∞ ∞ X n ∞ n   ∞
X z1n X z2n X z1k z2n−k X 1 X n k n−k X (z1 + z2 )n
E(z1 )E(z2 ) = = = z1 z2 = = E(z1 + z2 ).
n=0
n! n=0 n! n=0
k! (n − k)! n=0 n! k n=0
n!
k=0 k=0

Z udowodnionych już własności (i) oraz (ii) otrzymujemy dla dowolnego z ∈ C

1 = E(0) = E(z + (−z)) = E(z)E(−z)

skąd natychmiast wynika własność (iii). Dla dowodu (iv) skorzystamy bezpośrednio z definicji granicy funkcji. W tym celu
ustalmy ε > 0 i przyjmijmy δ := min(1, eε ). Z twierdzenia 5.2.5 , twierdzenia 5.4.1 oraz twierdzenia 6.1.1 dla z ∈ C
spełniającego |z| < δ dostajemy
∞ ∞ ∞ ∞ ∞ ∞
X zn X zn X |z|n X |z|n−1 X 1 X 1
|E(z) − 1| = −1 = ¬ = |z| ¬ |z| < |z| = |z|e ¬ ε.
n=0
n! n=1
n! n=1
n! n=1
n! n=1
n! n=0
n!

Zatem do ε > 0 znaleźliśmy δ > 0 takie, że |z| < δ implikuje |E(z) − 1| < ε, co kończy dowód (iv). Aby pokazać (v)
zauważmy, że z (ii) oraz (iv) mamy

lim E(z) = lim E(z0 )E(z − z0 ) = E(z0 ) lim E(z − z0 ) = E(z0 ) lim E(z − z0 ) = E(z0 ) · 1 = E(z0 )
z→z0 z→z0 z→z0 z−z0 →0

Z kolei twierdzenia 2.7.4 wnosimy, że dla dowolnego m ∈ N zachodzi równość sum częściowych
m m
X zn X zn
= .
n=0
n! n=0
n!

Przechodząc z m do granicy oraz wykorzystując ciągłość sprzężenia (twierdzenie 4.6.10 (v)) dostajemy własność (vi). Aby
n
pokazać (vii) załóżmy najpierw, że x > 0. Wtedy xn! ∈ R+ dla dowolnego n ∈ N, a więc

X xn
E(x) = 1 + > 1.
n=1
n!
148 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE

W szczególności E(x) ∈ R+ dla x > 0. Z własności (iii) mamy


1
E(−x) = > 0,
E(x)

Zatem E(x) ∈ R+ również dla x < 0. Z własności (i) wnosimy, że E(0) = 1 ∈ R+ . Zatem E(x) ∈ R+ dla wszystkich x ∈ R,
co kończy dowód (vii). 

6.1.4 Definicja zespolonej funkcji wykładniczej.


Z twierdzenia 6.1.3 łatwo jest wyciągnąć następujący wniosek.

Wniosek 6.1.4 Dla dowolnego n ∈ N mamy


n razy
= e · e · . . . · e = en , (6.6)
z }| {
E(n)
1
E(−n) = (6.7)
en
Dowód: Dowód przeprowadzimy indukcyjnie względem n ∈ N. Dla n = 0 wzór (6.6) wynika natychmiast z własności (i)
twierdzenia 6.1.3 . Załóżmy, że wzór ten zachodzi dla pewnego k ∈ N. Wtedy z własności (ii) twierdzenia 6.1.3 i założenia
indukcyjnego dostajemy
E(k + 1) = E(k)E(1) = ek · e = ek+1
co dowodzi (6.6) dla n = k + 1. Wzór (6.7) dowodzimy podobnie. 
Wniosek 6.1.4 pokazuje, że zdefiniowana przez nas funkcja E : C → C zmiennej zespolonej rozważana dla argumentu
będącego liczbą naturalną ma własności takie jak rozważana nieformalnie w rozdziale 2.6.3 rzeczywista funkcja wykładnicza.
Obserwacja ta motywuje do przyjęcie następującej definicji.

Definicja 6.1.5 Funkcję E nazywamy zespoloną funkcją wykładniczą. Stosujemy dla niej również tradycyjną notację

X zn
ez := E(z) := ∈ C. (6.8)
n=0
n!

6.2 Rzeczywista funkcja wykładnicza i logarytmiczna


6.2.1 Rzeczywista funkcja wykładnicza ex
Jak można się spodziewać, zawężając zespoloną funkcję wykładniczą do zbioru liczb rzeczywistych dostajemy rzeczywistą
funkcję wykładniczą. Dokładniej, mamy następujące twierdzenie.

Twierdzenie 6.2.1 Istnieje dokładnie jedna funkcja ciągła f : R → R+ taka, że

f (1) = e (6.9)
∀x,y∈R f (x + y) = f (x)f (y). (6.10)

Co więcej, dla dowolnego x ∈ R



X xn
f (x) = 1 + . (6.11)
n=1
n!
6.2. RZECZYWISTA FUNKCJA WYKŁADNICZA I LOGARYTMICZNA 149

Funkcja, o której mówi twierdzenie 6.2.1 zwana jest funkcją wykładniczą o podstawie e. Powszechnie stosowaną notacją
dla f (x) jest ex , a sama funkcja f jest oznaczana

exp : R 3 x 7→ ex ∈ R+ .

Wykres tej funkcji przedstawiono na rysunku 2.7 .


Zanim udowodnimy twierdzenie 6.2.1 pokażemy następujący lemat.

Lemat 6.2.2 Jeśli funkcja ciągła f : R → R+ spełnia własności (6.9) i (6.10) to dla każdego m ∈ Z i n ∈ N1 mamy
m √
f( ) = n em . (6.12)
n
Dowód: Zauważmy najpierw, że jeśli f spełnia (6.9) i (6.10) to spełnia też

f (nx) = f (x)n (6.13)

dla dowolnego n ∈ Z i x ∈ R. Rzeczywiście, z (6.9) i (6.10) mamy e = f (1) = f (1 + 0) = f (1)f (0) = ef (0), zatem f (0) = 1
oraz dla dowolnego x ∈ R mamy f (0 · x) = f (0) = 1 = f (x)0 co dowodzi (6.13) dla n = 0. Załóżmy zatem, że (6.13) zachodzi
dla n = k, gdzie k ∈ N. Z (6.10) i założenia indukcyjnego dostajemy

f ((k + 1)x) = f (kx + x) = f (kx)f (x) = f (x)k f (x) = f (x)k+1

co kończy dowód (6.13) dla n ∈ N. Jednak (6.13) zacohdzi dla n ∈ Z, bo dla −n przy n ∈ N mamy

1 = f (0) = f (nx + (−n)x) = f (nx)f (−nx) = f (x)n f (−nx)

skąd dostajemy f (−nx) = f (x)


1
n = f (x)
−n
.
Z (6.13) dostajemy dla dowolnego n ∈ N, że
1 1
e = f (1) = f (n · ) = f ( )n .
n n

Zatem f ( n1 ) = n
e. Ponownie korzystając z (6.13) dostajemy

m 1 1 √ m √
f( ) = f (m · ) = f ( )m = n e = n em .
n n n
co dowodzi (6.12). 
Dowód twierdzenia 6.2.1 Przypuśćmy, że f1 i f2 są dwoma takimi funkcjami. Wtedy obie spełniają założenia lema-
tu 6.2.2 , zatem z (6.12) wnosimy, że dla m ∈ Z i n ∈ N1 mamy
m √ m
f1 ( ) = n em = f2 ( ).
n n
Oznacza to, że f1 i f2 mają jednakowe wartości dla argumentów wymiernych, a więc muszą być równe, bo są ciągłe. Dowodzi
to jednoznaczności. Aby pokazać istnienie przypomnijmy, że zespolona funkcja wykładnicza, a więc funkcja dana wzorem
(6.5), ma wartości dodatnie dla argumentów rzeczywistych na mocy twierdzenia 6.1.3 (vii). Zatem możemy rozważyć funkcję

f : R 3 x 7→ E(x) ∈ R+ .

Na mocy własności (v) twierdzenia 6.1.3 funkcja ta, jako zawężenie funkcji ciągłej, jest ciągła. Z własności (i) oraz (ii)
twierdzenia 6.1.3 wynika, że f ma własności (6.9) i (6.10). Dowodzi to, że funkcja ciągła spełniająca własności (6.9) i (6.10)
istnieje. Co więcej, wprost z definicji funkcji E wynika, że funkcja f spełnia równanie (6.11), bo jest zawężeniem funkcji E
do zbioru liczb rzeczywistych. 
150 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE

6.2.2 Własności rzeczywistej funkcji wykładniczej.

Twierdzenie 6.2.3 Rzeczywista funkcja wykładnicza ma następujące własności:

(i) dla dowolnych p ∈ Z oraz q ∈ N1 √


p
eq = q
ep ,
w szczególności e0 = 1 i e1 = e,
(ii) ex > 1 dla x > 0,

(iii) exp : R 3 x 7→ ex ∈ R+ jest silnie rosnąca,


(iv) limx→∞ ex = ∞, limx→−∞ ex = 0,
(v) dla dowolnego n ∈ N mamy limx→∞ xn e−x = 0.

(vi) dla dowolnego n ∈ N mamy


1
e− x2
lim = 0.
x→0 xn

Dowód: Własność (i) wynika natychmiast z lematu 6.2.2 , a własność (ii) z własności (vii) twierdzenia 6.1.3 . Aby
pokazać (iii) rozważmy x1 , x2 ∈ R takie, że x1 < x2 . Niech h := x2 − x1 . Wtedy h > 0 i z własności (ii) mamy eh > 1.
Zatem z (6.10) dostajemy
ex2 = ex1 +h = ex1 eh > ex1
co dowodzi, że exp jest silnie rosnąca.
Ze wzoru (6.11) i uwagi 5.2.9 wynika natychmiast, że ex > x dla x > 0. Zatem
lim ex ­ lim x = ∞.
x→∞ x→∞

Niech α : R 3 x 7→ −x ∈ R. Oczywiście e = e x α(α(x))


, czyli exp = (exp ◦α) ◦ α. Tak więc z twierdzenia 4.1.6 o granicy
złożenia dostajemy
1
lim ex = lim ((exp ◦α) ◦ α)(x) = lim exp α(x) = lim e−x = lim = 0,
x→−∞ x→−∞ x→∞ x→∞ x→∞ ex
n+1
bo limx→−∞ α(x) = ∞. Dowodzi to własności (iv). Dla dowodu (v) zauważmy, że ze wzoru (6.11) dostajemy też ex > (n+1)!
x

dla n ∈ N i x > 0. Zatem


(n + 1)!
lim e−x xn ¬ lim = 0.
x→∞ x→∞ x
Oczywiście limx→∞ e−x xn ­ 0, bo e−x xn > 0 dla x > 0. Zatem limx→∞ e−x xn = 0.
Pozostaje pokazać (vi). Zauważmy, że podobnie jak w dowodzie (v) dla n ∈ N i x 6= 0 ze wzoru (6.11) i uwagi 5.2.9
dostajemy
1 n+1

1
x2
e x2 > ,
(n + 1)!
a w konsekwencji
1
e− x2
< (n + 1)!x2 .
x2n
Zatem 1 1
e − x2 e − x2
0 ¬ lim n
¬ lim 2n ¬ lim (n + 1)!x2 = 0.
x→0 x x→0 x x→0

6.2. RZECZYWISTA FUNKCJA WYKŁADNICZA I LOGARYTMICZNA 151

6.2.3 Logarytm naturalny


Funkcja exp, jako bijekcja silnie rosnąca z R do R+ , ma funkcję odwrotną, która jest bijekcją silnie rosnącą z R+ do R.
Definicja 6.2.4 Funkcję tę nazywamy logarytmem naturalnym i oznaczamy

ln : R+ 3 x 7→ ln x ∈ R.
Z definicji tej wynika w szczególności, że dla dowolnych x ∈ R+ i y ∈ R równość y = ln x jest równoważna równości
x = ey .
Twierdzenie 6.2.5 Funkcja ln ma następujące własności:
(i) jest silnie rosnącą, ciągłą bijekcją,
(ii) ln 1 = 0, ln e = 1,
(iii) dla dowolnych x, y ∈ R+ , n ∈ N, p ∈ N, q ∈ Z+
x √ p
ln(xy) = ln x + ln y, ln = ln x − ln y, ln xn = n ln x, ln q
xp = ln x,
y q

a gdy n 6= 0 to również ln n
x= ln x
n ,

(iv) limx→∞ ln x = ∞, limx→0 ln x = −∞,

(v) dla dowolnych p ∈ N, q ∈ Z+ , x ∈ R+ √


p p
e q ln x = q
xp = x q .
Dowód: Funkcja ln jako funkcja odwrotna do bijekcji jest również bijekcją, a jako odwrotna do funkcji silnie rosnącej jest
silnie rosnąca. Z kolei z twierdzenia 4.6.16 wynika, że ln jest funkcją ciągłą. Zatem własność (i) jest udowodniona. Własność
(ii) wynika natychmiast z własności (i) twierdzenia 6.2.1 . Aby pokazać własność (iii) połóżmy u := ln x i v := ln y. Wtedy
x = eu i y = ev , zatem xy = eu ev = eu+v , skąd ln x + ln y = u + v = ln(xy). Pozostałe wzory we własności (iii) dowodzimy
podobnie. Z twierdzenia 4.2.5 o granicy funkcji monotonicznej mamy
lim ln x = sup { ln x | x ∈ R+ }
x→∞
oraz
lim ln x = inf { ln x | x ∈ R+ }.
x→0

Wystarczy więc zauważyć, że sup { ln x | x ∈ R+ } = ∞ oraz inf { ln x | x ∈ R+ } = −∞. Jest tak rzeczywiście, bo dla
dowolnego A ∈ R+ mamy ln eA+1 = A + 1 > A oraz ln e−A−1 = −A − 1 < −A. Dowodzi to własności (iv). Z kolei z
własności (iii) dla p ∈ N, q ∈ Z+ , x ∈ R+ dostajemy
p √
q p √
e q ln x = eln x = q xp ,
co dowodzi (v) 
Własność (iii) twierdzenia 6.2.5 może zostać wykorzystana do przyspieszenia r˛ecznie wykonywanych obliczeń arytmetycznych takich jak mnożenie, dzielenie
czy wyciaganie
˛ pierwiastka. Wymaga to jednak metody wyznaczania logarytmu przy ustalonej podstawie (najcz˛eściej 10 lub e) ze stosunkowo dużego zbioru
liczb, co niekoniecznie jest szybkie. Jednak raz policzone moga˛ zostać stablicowane, opublikowane i potem używane przez wiele osób. Zysk polega na tym, że

tablicujemy funkcj˛e jednej zmiennej (x 7→ ln x), a nie dwóch zmiennych ((x, y) 7→ x · y , (x, y) 7→ xy , (x, n) 7→ n x). W roku 1516 jedne z pierwszych
tablic logarytmów opracował i opublikował szkocki matematyk John Napier of Merchiston (1550-1617). Niedługo potem wynaleziono suwak logarytmiczny (rys. 6.1
), który, choć mniej dokładny od tablic, pozwalał jeszcze szybciej przeprowadzać obliczenia. Tablice logarytmiczne i suwak logarytmiczny zrewolucjonizowały
obliczenia i istotnie przyczyniły si˛e do post˛epów naukowo-technicznych XVIII, XIX i XX wieku. Dopiero pojawienie si˛e elektronicznych kalkulatorów i komputerów
w drugiej połowie XX wieku spowodowało utrat˛e znaczenia tablic i suwaków.
W programie Mathematica logarytm naturalny z x obliczamy wywołując Log[x].
152 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE

Rysunek 6.1: Suwak logarytmiczny. Źródło: Wikipedia.

6.2.4 Funkcja wykładnicza x 7→ ax i logarytm x 7→ loga x


Przy pomocy logarytmu naturalnego możemy zdefiniować funkcję wykładniczą o dowolnej podstawie a ∈ R+ .

Definicja 6.2.6 Funkcję wykładniczą o podstawie a ∈ R+ definiujemy wzorem

R 3 x 7→ ax := ex ln a ∈ R+ .

Dowód poniższego twierdzenia zbierającego najważniejsze własności funkcji wykładniczej o podstawie a ∈ R+ jest
prostym ćwiczeniem.

Twierdzenie 6.2.7 Rzeczywista funkcja wykładnicza x 7→ ax o podstawie a ∈ R+ ma następujące własności:


(i) dla dowolnych p ∈ Z oraz q ∈ N1 √
p
aq = q
ap ,
w szczególności a0 = 1 i a1 = a,
(iii) R 3 x 7→ ax ∈ R+ jest silnie rosnąca gdy a > 1, silnie malejąca gdy a < 1 i stała gdy a = 1,

(iv) dla a > 1 zachodzi limx→∞ ax = ∞, limx→−∞ ax = 0, a dla a < 1 zachodzi limx→∞ ax = 0, limx→−∞ ax = ∞.

Dowód: ćwiczenie.

Definicja 6.2.8 Logarytm o podstawie a ∈ R+ \ {1} definiujemy wzorem

ln x
loga R+ 3 x 7→ loga x := ∈ R.
ln a

Dowód poniższego twierdzenia zbierającego najważniejsze własności funkcji logarytmicznej o podstawie a ∈ R+ jest
prostym ćwiczeniem.
6.3. FUNKCJE TRYGONOMETRYCZNE 153

Twierdzenie 6.2.9 Funkcja loga : R+ 3 x 7→ loga x ∈ R ma następujące własności:


(i) jest to funkcja odwrotna do funkcji wykładniczej R 3 x 7→ ax ∈ R+
(ii) loga 1 = 0, loga a = 1,

(iii) dla dowolnych x, y ∈ R+ , n ∈ N, p ∈ N, q ∈ Z+

x √ loga x √ p
loga (xy) = loga x+loga y, loga = loga x−loga y, loga xn = n loga x, loga n
x= , loga q
xp = loga x
y n q

(iv) dla a > 1 funkcja loga jest rosnąca oraz limx→∞ loga x = ∞, limx→0 loga x = −∞, a dla a < 1 funkcja loga jest
malejąca oraz limx→∞ loga x = −∞, limx→0 loga x = ∞,

Dowód: ćwiczenie.
W programie Mathematica funkcję wykładniczą o podstawie e z x obliczamy wywołując Exp[x], a logarytm naturalny z
x obliczamy wywołując Log[x]. Z kolei funkcję wykładniczą o podstawie a z x obliczamy wywołując Power[a,x] lub a^x,
a logarytm o podstawie a z x obliczamy wywołując Log[a,x].

6.3 Funkcje trygonometryczne


Jak już wspominaliśmy w rozdziale 2.7.6 liczby zespolone o module jeden tworzace
˛ okrag
˛ jednostkowy

S1 := { z ∈ C | |z| = 1 }

na płaszczyźnie zespolonej wykazuja˛ silne zwiazki


˛ z funkcjami trygonometrycznymi. Nie powinno wi˛ec być zaskakujace,
˛ że zespolona funkcja wykładnicza pozwoli
nam też podać formalna˛ i czysto analityczna˛ definicj˛e funkcji trygonometrycznych.

6.3.1 Nawijanie prostej na okrąg


Zacznijmy od następującego twierdzenia:

Twierdzenie 6.3.1 Funkcja


R 3 x 7→ eix ∈ S1 (6.14)
jest dobrze określona i ciągła.

Dowód: Pokażemy najpierw, że dla dowolnego x ∈ R mamy rzeczywiście eix ∈ S1 . Z własności (iii) twierdzenia 2.7.5
oraz własności (vi) i (ii) twierdzenia 6.1.3 mamy

|eix |2 = eix eix = eix eix = eix e−ix = eix+(−ix) = e0 = 1.

Zatem |eix | = 1, bo moduł jest liczbą nieujemną. Dowodzi to, że eix ∈ S1 . Pozostaje pokazać, że funkcja dana wzorem (6.14)
jest ciągła. Funkcja ta jest złożeniem funkcji
R 3 x 7→ i · x ∈ C
oraz funkcji
C 3 z 7→ ez ∈ C.
Jest więc ciągła jako złożenie funkcji ciągłych. 
154 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE

C'

B'

A'

O A B C
Rysunek 6.2: Rysunek obrazuje nawijanie prostej na okrąg.

Funkcj˛e dana˛ wzorem (6.14) określa si˛e cz˛esto mianem nawijania prostej na okrag.
˛ Rysunek 6.2 obrazuje jak to należy rozumieć. Prosta˛ (na rysunku
˛ w punkcie O ) przyklejono do okr˛egu tak, by była do niego styczna w punkcie O . Nast˛epnie rozpocz˛eto owijanie
przedstawiono tylko kawałek półprostej o poczatku
w kierunku przeciwnym do ruchu wskazówek zegara. Punkt A nakleił si˛e na punkt A0 , punkt B nakleił si˛e na punkt B 0 , natomiast punkt C na razie przesunał˛
si˛e do pozycji C 0 . Zostanie doklejony w trakcie dalszego nawijania. Podobnie post˛epujemy z reszta˛ prostej (nie wyrysowana) nawijajac˛ półprosta˛ na lewo od
punktu O w kierunku zgodnym z ruchem wskazówek zegara. Odwzorowanie R 3 x 7→ eix ∈ S1 realizuje analogiczny scenariusz z ta˛ różnica,˛ że punkt
x = 0 zostaje doklejony do punktu na okr˛egu jednostkowym o współrz˛ednych (1, 0), a wi˛ec punkt jednostkowy na osi rzeczywistej. Widać to na wykresie funkcji
R 3 x 7→ z = eix = cos x + i sin x ∈ S1 przedstawionym na rysunku 6.3 .

6.3.2 Funkcje sin i cos


Nawijanie prostej na okrag˛ odbywa si˛e z zachowaniem długości, a wi˛ec bez rozciagania
˛ badź
˛ ściskania prostej. Oznacza to, że na rysunku 6.2 długość odcinka
OA jest równa długości łuku OA0 . Udowodnić to ściśle b˛edziemy w stanie dopiero w rozdziale 10.7.1 . Wynika z tego, że liczba zespolona z ∈ S1 leżaca ˛
na okr˛egu jednostkowym może być przedstawiona w postaci z = eix , gdzie x jest długościa˛ łuku na tym okr˛egu pomi˛edzy punktem jednostkowym na osi
rzeczywistej, a liczba˛ z Zobrazowano to na rysunku 6.4 . Długość łuku mi˛edzy punktami 1 i z na okr˛egu jednostkowym płaszczyzny zespolonej wykorzystać
można jako alternatywna˛ do tradycyjnych stopni miar˛e kata˛ pomi˛edzy półprostymi poprowadzonymi ze środka okr˛egu przez punkty 1 i z , co pozwala traktować
funkcje trygonometryczne sin i cos jako funkcje kata ˛ mierzonego długościa˛ łuku. Rysunek 6.4 podpowiada, że analityczne wzory na funkcje sin i cos można
uzyskać przez rozłożenie liczby z = eix na cz˛eść rzeczywista˛ i urojona.˛ Pozwala to na odwrócenie kolejności i przyj˛ecie odpowiednio cz˛eści rzeczywistej i cz˛eści
urojonej z eix jako analitycznej definicji dla cos x i sin x.

Uwaga 6.3.2 Dla x ∈ R mamy re eix , im eix ∈ [−1, 1], a ponadto

eix + e−ix
re eix =
2
eix − e−ix
im eix = .
2i

Dowód: Niech a := re eix oraz b := im eix . Wtedy eix = a+bi. Z (6.14) mamy 1 = |eix |. Ale a2 +b2 = |a+bi|2 = |eix |2 = 1,
skąd wnosimy, że a2 ¬ 1 i b2 ¬ 1, czyli re eix = a ∈ [−1, 1] oraz im eix = b ∈ [−1, 1]. Z twierdzenia 2.7.4 (ii) oraz z
twierdzenia 6.1.3 (vi) mamy
eix + eix eix + e−ix
re eix = =
2 2
6.3. FUNKCJE TRYGONOMETRYCZNE 155

Rysunek 6.3: Wykres funkcji R 3 x 7→ z = eix = cos x + i sin x ∈ S1 . Oś oznaczona literą ’x’ to oś argumentów. Przestrzenią
wartości jest wyrysowany na fioletowo okrąg jednostkowy zawarty w płaszczyźnie zespolonej o osiach oznaczonych ’re z’ i
’im z’. W punkcie o współrzędnej x = 0 funkcja przyjmuje wartość (1, 0), a więc liczbę zespoloną o części rzeczywistej jeden
i części urojonej zero. Punkt na wykresie odpowiadający argumentowi x = 0 oznaczono czarną kropką.

Rysunek 6.4: Funkcje trygonometryczne cos i sin jako funkcje długości łuku x uzyskane przez rozłożenie liczby eix na część
rzeczywistą i urojoną.
156 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE

i podobnie
eix − eix eix − e−ix
im eix = =
2i 2i


Definicja 6.3.3 Funkcje cos i sin definiujemy wzorami

eix + e−ix
cos : R 3 x 7→ re eix = ∈ [−1, 1] (6.15)
2
eix − e−ix
sin : R 3 x 7→ im eix = ∈ [−1, 1]. (6.16)
2i

Na razie nie możemy jeszcze twierdzić, że tak zdefiniowane funkcje cos i sin pokrywaja˛ si˛e z tymi zdefiniowanymi geometrycznie. Jednakże analizujac ˛
własności tych funkcji stopniowo przekonamy si˛e, że sa˛ to te same funkcje. Cz˛eść własności jesteśmy w stanie wychwycić już teraz, ale kluczowa własność, że
długość łuku mi˛edzy punktami 1 i eix na okr˛egu jednostkowym płaszczyzny wynosi dokładnie x zostanie udowodniona dopiero w rozdziale 10.7.1 .
Tradycyjnie wyrażenie (cos x)2 zapisuje się zwięźle jako cos2 x co uwalnia nas od jednej pary nawiasów. Podobnie dla
innych funkcji trygonometrycznych i innych dodatnich potęg, na przykład sinn x oznacza (sin x)n . Będziemy stosować tę
n razy
z }| {
konwencję, choć jest to pewna kolizja oznaczeń, bo dla funkcji f : X → X przyjmuje się też konwencję f := f ◦ f ◦ . . . ◦ f
n

na oznaczenie n-krotnego złożenia funkcji f .

Twierdzenie 6.3.4 Funkcje sin i cos są ciągłe. Ponadto dla każdego x ∈ R zachodzą wzory:

eix = cos x + i sin x, (6.17)


cos x + sin x = 1,
2 2
(6.18)
∞ ∞
X x2k X x2k+1
cos x = (−1)k , sin x = (−1)k , (6.19)
(2k)! (2k + 1)!
k=0 k=0
cos(−x) = cos x, sin(−x) = − sin x. (6.20)

Dowód: Funkcja cos jest obłożeniem funkcji R 3 x 7→ z = eix = cos x + i sin x ∈ S1 przez funkcję C 3 z 7→ re z ∈ R.
Zatem jako złożenie funkcji ciągłych jest to funkcja ciągła. Podobnie wnosimy, że sin też jest funkcją ciągłą. Wzór (6.17)
uzyskujemy podstawiając we wzorze (2.27) liczbę eix za liczbę zespoloną z i wykorzystując definicję 6.3.3 . Wzór (6.18)
wynika wprost z faktu, że eix ∈ S1 oraz definicji 6.3.3 . Aby wyprowadzić pierwszy ze wzorów (6.19) zauważmy, że wyliczając
eix oraz e−ix ze wzoru (6.8) oraz korzystając z twierdzenia 5.4.1 mamy

∞ ∞ ∞ ∞ ∞
!
eix + e−ix 1 X (xi)n X (−xi)n 1 X n n 1 + (−1)n X x2k i2k X x2k
cos x = = + = x i = = (−1)k ,
2 2 n=0
n! n=0
n! 2 n=0 n! (2k)! (2k)!
k=0 k=0

bo 1 + (−1)n wynosi zero dla n nieparzystych i dwa dla n parzystych, a i2k = (i2 )k = (−1)k . Drugi z tych wzorów
wyprowadzamy analogicznie. Wzory (6.20) wynikają natychmiast ze wzorów (6.19). 
Program, który przybliża wartości funkcji sin w oparciu o szereg w twierdzeniu 6.3.4 przedstawiono na listingach 6.1
(Mathematica) i 6.2 (C++).
6.3. FUNKCJE TRYGONOMETRYCZNE 157

 
( ∗ O b l i c z a n i e f u n k c j i s i n u s za pomoc a̧ r o z w i n i ȩ c i a w s z e r e g ∗ )
S i n S e r i e s [ x_ , d_ ] :=
Module [ { s , znak , s i l n i a , y , n } ,
s = 0 ; znak = 1 ; s i l n i a = 1 ; y = x ; n = 0 ;
Do[
s = s + znak ∗y/ s i l n i a ;
znak = −znak ;
s i l n i a = s i l n i a ∗(2∗n + 2)∗(2∗ n + 3 ) ;
y = y∗x∗x ;
n = n + 1,
{d}
];
s
]
 
Listing 6.1: Wyznaczenie wartości funkcji sin w programie Mathematica w oparciu o rozwinięcie w szereg

 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ S i n S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e f u n k c j i s i n u s za pomoc a̧ r o z w i n i ȩ c i a w s z e r e g ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;

i n t main ( ) {

c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;

double p i = 3 . 1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 ;
double x=p i / 6 ;
double y=x ;

i n t nmax=10 , znak =1 , s i l n i a =1;


double s =0;
f o r ( i n t n=0;n<nmax ; n=n+1){
s=s+znak ∗y/ s i l n i a ;
c o u t << " s[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << s ;
c o u t << e n d l ;
s i l n i a = s i l n i a ∗ ( 2 ∗ n +2)∗(2∗ n +3);
y=y∗x∗x ;
znak=−znak ;
}
}
 
Listing 6.2: Wyznaczenie wartości funkcji sin w C++ w oparciu o rozwinięcie w szereg
158 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE

Ćwiczenie komputerowe 6.3.5 • Sprawdź zachowanie się programu z listingu 6.2 dla zmiennej x inicjalizo-
wanej wartościami π4 , π3 , π2 , π, 2π. Co obserwujesz w zachowaniu się ciągu przybliżeń? Jakie rodzą się pytania?
• Adaptuj program z listingów 6.1 i 6.2 do liczenia wartości funkcji cos wykorzystując fakt, że

x2 x4 X x2n
cos x = 1 − + − ... = (−1)n .
1·2 1·2·3·4 n=0
(2n)!

Oceń poprawność i przydatność implementacji wykorzystując argument, w którym wartość funkcji cos jest Ci
znana.

Lemat 6.3.6 Zachodzą następujące wzory

cos 0 = 1, sin 0 = 0, (6.21)


cos 2 < 0, (6.22)
x ∈ (0, 2] ⇒ sin x > 0. (6.23)

Dowód: (*) Mamy


1 = e0·i = cos 0 + i sin 0.
Z uwagi 2.7.3 wnosimy, że część rzeczywista lewej strony jest równa części rzeczywistej prawej strony oraz część urojona
lewej strony jest równa części urojonej prawej strony. Zatem 1 = cos 0 oraz 0 = sin 0, co dowodzi (6.21). Pokażemy teraz, że

xn xn+2
x ∈ [0, 2] ∧ n ­ 1 ⇒ ­ (6.24)
n! (n + 2)!

W tym celu rozważmy x ∈ [0, 2] oraz n ­ 1. Mamy

x2 ¬ 4 ¬ 2 · 3 ¬ (n + 1)(n + 2).
n
Mnożąc powyższą nierówność stronami przez (n+2)!
x
dostajemy nierówność (6.24). Wykorzystując własność (6.24) łatwo
sprawdzić, że do szeregów (6.19) możemy zastosować twierdzenie 5.3.3 o szeregach naprzemiennych. W szczególności ze
x2k
P∞
wzoru (5.7) zastosowanego do szeregu cos x = k=0 (−1)k (2k)! dla x = 2 i m = 2 dostajemy

16 1
cos 2 ¬ 1 − 2 + =− <0
24 3
k x2k+1
P∞
co dowodzi własności (6.22). Natomiast wzór (5.7) zastosowany do szeregu sin x = k=0 (−1) (2k+1)! oraz x ∈ (0, 2] i m = 2
daje
x3 x2
 
x
sin x ­ x − =x 1− ­ >0
3! 6 3
co dowodzi własności (6.23). 

6.3.3 Funkcje tangens i cotangens


Przydatne sa˛ jeszcze dwie funkcje: tangens i cotangens. Z geometrii wiemy, że wyrażaja˛ si˛e one przez funkcje sinus i cosinus. W naszej formalnej, niezależnej od
geometrii konstrukcji funkcji trygonometrycznych możemy wykorzystać ten fakt jako ich definicj˛e.
6.4. LICZBA π, OKRESOWOŚĆ, I WZORY TRYGONOMETRYCZNE 159

Definicja 6.3.7 Funkcja tangens to funkcja


sin x
tg : { x ∈ R | cos x 6= 0 } 3 x 7→ ∈ R.
cos x
Funkcja cotangens to funkcja
cos x
ctg : { x ∈ R | sin x 6= 0 } 3 x 7→ ∈ R.
sin x

Choć formalna˛ definicj˛e liczby π podamy w kolejnym rozdziale, warto już teraz wspomnieć, że funkcja tg jest określona w zbiorze
{ x ∈ R | cos x 6= 0 } = R \ { (2k + 1) π2 | k ∈ Z },
a funkcja ctg w zbiorze
{ x ∈ R | sin x 6= 0 } = R \ { kπ | k ∈ Z }.
Po zdefiniowaniu liczby π powyższe wzory otrzymamy jako wniosek z twierdzenia 6.4.10 .

6.4 Liczba π, okresowość, i wzory trygonometryczne


6.4.1 Liczba π
Dysponujemy teraz wystarczajac ˛ a˛ maszyneria,˛ by podać czysto analityczna˛ definicj˛e liczby π , bez odwoływania si˛e do geometrii. Jak to zrobić podpowiada
nam jednak wiedza z geometrii. Mianowicie wiemy, że najmniejszym dodatnim miejscem zerowym funkcji cosinus jest π2 . Wystarczy wi˛ec pokazać, że z naszej
analitycznej definicji funkcji cosinus wynika, że ma ona nieujemne miejsce zerowe i że najmniejsze takie jest dodatnie. Podwojona˛ wartość tego miejsca zerowego
możemy zatem przyjać ˛ jako analityczna˛ definicj˛e liczby π . Ciagle
˛ jednak nie jesteśmy w stanie udowodnić, że jest to rzeczywiście π znane z geometrii. To zrobimy
w rozdziale 10.7.1 .
Twierdzenie 6.4.1 Zbiór { x ∈ [0, 2] | cos x = 0 } jest niepusty, a jego kres dolny jest dodatni. Kres ten jest najmniej-
szym dodatnim miejscem zerowym funkcji cos.
Dowód: Niech A := { x ∈ [0, 2] | cos x = 0 }. Mamy A = Z ∩ [0, 2], gdzie Z := { x ∈ R | cos x = 0 }. Na mocy twier-
dzenia 4.6.4 zbiór Z jest domknięty, bo jest przeciwobrazem przez odwzorowanie ciągłe zbioru domkniętego, a konkretnie
jest to przeciwobraz singletona {0}, który jest zbiorem domkniętym. Zatem na mocy twierdzenia 3.2.12 również zbiór A
jest domknięty jako przecięcie dwóch zbiorów domkniętych. Niech f oznacza zawężenie funkcji cos do przedziału [0, 2]. Z
lematu 6.3.6 wiemy, że cos 0 > 0, a cos 2 < 0. Zatem f (0) > 0, f (2) < 0 i z własności Darboux (twierdzenie 4.9.3 )
zastosowanej do c = 0 wnosimy, że istnieje takie ξ ∈ [0, 2], że f (ξ) = 0. Ale f (ξ) = cos ξ, czyli pokazaliśmy, że ξ ∈ A.
Oznacza to, że zbiór A jest niepusty. Oczywiście zbiór A jest ograniczony od dołu, ma więc kres dolny. Oznaczmy go x0 . Z
domkniętości A wynika, że x0 ∈ A, a ponieważ cos 0 > 0 mamy x0 > 0. 
Definicja 6.4.2 Wykorzystując twierdzenie 6.4.1 liczbę π definiujemy jako podwojone najmniejsze dodatnie miejsce
zerowe funkcji cos. Innymi słowy
π := 2 inf { x ∈ R+ | cos x = 0 }.

Nast˛epujaca
˛ uwaga formalizuje kilka kolejnych faktów znanych z trygonometrii.
Uwaga 6.4.3 Zachodzą następujące wzory
π
0< <2 (6.25)
2
π
cos = 0 (6.26)
2
π
sin = 1 (6.27)
2
π
t ∈ [0, ) ⇒ cos t > 0. (6.28)
2
160 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE

Dowód: Wzór (6.26) i wzór (6.28) wynikają wprost z definicji π, a wzór (6.25) z definicji π oraz ze wzorów (6.21) i (6.22).
Ze wzoru (6.26) i wzoru (6.18) wynika, że sin2 π2 = 1, zatem (6.27) dostajemy z (6.23) i (6.25). 
Poniższe twierdzenie wiąże ze sobą liczby 0, 1, i, e, π w jednym wzorze zwanym wzorem Eulera.

Twierdzenie 6.4.4 Zachodzi równość


eπi + 1 = 0. (6.29)

Dowód: Ze wzoru (6.27) mamy sin π2 = 1. Zatem z (6.17) dostajemy


π π π
e 2 i = cos + i sin = i,
2 2
a z własności (ii) twierdzenia 6.1.3 otrzymujemy
π π π π
eπi + 1 = e 2 i+ 2 i + 1 = e 2 i e 2 i + 1 = i · i + 1 = 0.

6.4.2 Okresowość

Definicja 6.4.5 Niech F oznacza ciało liczb rzeczywistych R lub ciało liczb zespolonych C. Mówimy, że funkcja
f : F 9 F jest okresowa wtedy i tylko wtedy gdy istnieje takie t ∈ F \ {0}, że dla każdego x ∈ dom f mamy
x + t ∈ dom f oraz f (x + t) = f (x). Liczbę t nazywamy wtedy okresem funkcji f . Jeśli F = R i istnieje najmniejszy
okres dodatni funkcji f to nazywamy go okresem podstawowym funkcji f .

Twierdzenie 6.4.6 Mamy następujące własności:


(i) funkcja exp : C → C jest okresowa o okresie 2πi,
(ii) funkcje sin, cos : R → [−1, 1] są okresowe o okresie 2π,
(iii) x ∈ (0, 2π) ⇒ eix 6= 1,

(iv) dla każdego z ∈ S 1 istnieje dokładnie jedno x ∈ [0, 2π) takie, że eix = z.

Dowód: (*) Niech z ∈ C. Z własności (ii) twierdzenia 6.1.3 oraz (6.29) mamy

ez+2πi = ez e2πi = ez eπi eπi = ez (−1)(−1) = ez ,

co dowodzi własności (i). W szczególności dla x ∈ R, wykorzystując dwukrotnie tożsamość (6.17), dostajemy

cos(x + 2π) + i sin(x + 2π) = e(x+2π)i = exi e2πi = exi = cos x + i sin x.

Zatem z uwagi 2.7.3 mamy cos(x + 2π) = cos x oraz sin(x + 2π) = sin x, co dowodzi własności (ii). Aby pokazać (iii)
rozważmy x ∈ (0, 2π). Wtedy t := x4 ∈ (0, π2 ). Zatem z (6.28) wnosimy, że cos t > 0, a z (6.23), że sin t > 0. Równocześnie
korzystając ze wzoru (2.4) z dostajemy
4 4
exi = e4ti = eti = (cos t + i sin t) = cos4 t + 4i cos3 t sin t − 6 cos2 t sin2 t − 4i cos t sin3 t + sin4 t =
cos4 t − 6 cos2 t sin2 t + sin4 t + 4 sin t cos t(cos2 t − sin2 t) i.
 
6.4. LICZBA π, OKRESOWOŚĆ, I WZORY TRYGONOMETRYCZNE 161

Przypuśćmy, że exi = 1. Wtedy im exi = 0, a więc 4 sin t cos t(cos2 t − sin2 t) = 0. Ale wiemy, że sin t > 0 i cos t > 0. Oznacza
to, że cos2 t − sin2 t = 0, skąd mamy

exi = cos4 t − 6 cos2 t sin2 t + sin4 t = −4 cos4 t < 0.

Jest to sprzeczne z przypuszczeniem, że exi = 1, co dowodzi (iii). Dla dowodu (iv) rozważmy najpierw x1 , x2 ∈ [0, 2π) takie,
że x1 ¬ x2 oraz ex1 i = ex2 i . Wtedy e(x2 −x1 )i = 1 oraz x2 − x1 ∈ [0, 2π). Zatem z (iii) wynika, że x2 = x1 co dowodzi
jednoznaczności. Aby pokazać istnienie rozważmy z ∈ S1 . Niech z = a + bi. Wtedy a2 + b2 = |z|2 = 1, zatem a, b ∈ [−1, 1].
Załóżmy najpierw, że a ­ 0 oraz b ­ 0. Ponieważ cos 0 = 1, cos π2 = 0, z ciągłości funkcji cos i twierdzenia 4.9.3 znajdziemy
x ∈ [0, π2 ] takie, że cos x = a. Ze wzoru (6.18) dostajemy

b2 = 1 − a2 = 1 − cos2 x = sin2 x,

a ponieważ b ­ 0, a z (6.23) również sin x > 0, wnosimy, że sin x = b. Zatem

z = a + bi = cos x + i sin x = eix

co dowodzi istnienia gdy a ­ 0 i b ­ 0. Załóżmy z kolei, że a < 0, a b ­ 0. Przyjmijmy z 0 := −zi = b − ai. Do z 0 stosuje się
rozważony już przypadek, zatem znajdziemy x ∈ [0, π2 ] takie, że z 0 = eix . Tak więc
π π
z = iz 0 = e 2 i exi = e( 2 +x)i

co dowodzi istnienia gdy a < 0 i b ­ 0. Pozostaje do rozważenia przypadek b < 0. Przyjmijmy z 00 := −z. Do z 00 stosuje się
jeden z dwóch rozważonych już przypadków, zatem znajdziemy x ∈ [0, π] takie, że z 00 = exi . Wtedy

z = z 00 = eπi exi = e(π+x)i .

Wniosek 6.4.7 Okresem podstawowym funkcji sin i cos jest 2π.

Dowód: (*) Przyjmijmy dla dowodu nie wprost, że istnieje u ∈ (0, 2π) takie, że dla wszystkich x ∈ R mamy cos(x + u) =
cos x. W szczególności dostajemy cos u = cos 0 = 1 oraz sin2 u = 1 − cos2 u = 1 − 1 = 0. Tak więc sin u = 0 oraz
eui = cos u + i sin u = 1 co przeczy własności (iii) twierdzenia 6.4.6 . Zatem okresem podstawowym funkcji cos jest 2π.
Rozważmy z kolei funkcję sin i przyjmijmy dla dowodu nie wprost, że istnieje u ∈ (0, 2π) takie, że dla wszystkich x ∈ R
mamy sin(x + u) = sin x. W szczególności dostajemy sin( π2 + u) = sin π2 = 1 oraz cos2 ( π2 + u) = 1 − sin2 ( π2 + u) = 1 − 1 = 0.
Tak więc cos( π2 + u) = 0 oraz

π π π π π
 π π  π π π
eui = e(− 2 + 2 +u)i = e− 2 i e( 2 +u)i = e− 2 i cos( + u) + i sin( + u) = e− 2 i i = e− 2 i e 2 i = e0 = 1
2 2
co ponownie przeczy własności (iii) twierdzenia 6.4.6 . Zatem okresem podstawowym funkcji sin jest również 2π. 

Ćwiczenie 6.4.8 Wyznaczyć okresy podstawowe oraz zbiór miejsc zerowych funkcji tangens i funkcji cotangens.

6.4.3 Wzory trygonometryczne


162 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE

Twierdzenie 6.4.9 Dla dowolnych x, y ∈ R zachodzą wzory

sin(x + y) = sin x cos y + cos x sin y, (6.30)


cos(x + y) = cos x cos y − sin x sin y, (6.31)
π
sin(x + ) = cos x, (6.32)
2
π
cos(x + ) = − sin x. (6.33)
2
Dowód: Mamy

cos(x + y) + i sin(x + y) = e(x+y)i = exi eyi = (cos x + i sin x)(cos y + i sin y) =


(cos x cos y − sin x sin y) + i(sin x cos y + cos x sin y).

Zatem wzory (6.30) i (6.31) wynikają z uwagi 2.7.3 . Z (6.26), (6.18) i (6.23) mamy cos π2 = 0 i sin π2 = 1. Tak więc
podstawiając y = π2 we wzorach (6.30) i (6.31) dostajemy wzory (6.32) i (6.33). 

Twierdzenie 6.4.10 Zbiór miejsc zerowych funkcji sin to { kπ | k ∈ Z }, a zbiór miejsc zerowych funkcji cos to
{ (2k + 1) π2 | k ∈ Z }.

Ćwiczenie 6.4.11 Udowodnić twierdzenie 6.4.10

Twierdzenie 6.4.12 (wzór de Moivre’a) Dla dowolnego x ∈ R oraz n ∈ N zachodzi wzór


n
(cos x + i sin x) = cos nx + i sin nx.

Dowód: Mamy n
n
(cos x + i sin x) = exi = enxi = cos nx + i sin nx. (6.34)

Obliczając ze wzoru (2.4) lewą stronę równania (6.34) i porównując części rzeczywiste i urojone lewej i prawej strony
otrzymujemy wzory wyrażające cos nx i sin nx poprzez cos x i sin x.

Ćwiczenie 6.4.13 Wyprowadzić z (6.34) wzory na cos nx i sin nx dla n = 2, 3, 4.


Część III

Rachunek różniczkowy i całkowy

163
Rozdział 7

Przestrzenie wektorowe

7.1 Definicja przestrzeni wektorowej

W poprzednich rozdziałach przygotowaliśmy grunt do formalnego wprowadzenia kluczowych dla analizy matematycznej poj˛eć pochodnej, różniczki i całki funkcji.
Zazwyczaj najpierw wprowadza si˛e te poj˛ecia dla funkcji f : R → R a potem rozszerza si˛e je na przypadek funkcji f : Rn → Rm . My zaczniemy od
przypadku funkcji f : R → Rm , tak zwanych funkcji jednej zmiennej o wartościach wektorowych. Przypadek ten od strony szczegółów niewiele różni si˛e od
przypadku funkcji f : R → R funkcji jednej zmiennej rzeczywistej o wartościach rzeczywistych przy założeniu znajomości przestrzeni wektorowych. Przestrzeń
wektorowa to poj˛ecie znane z algebry liniowej, ale przypomnimy je w tym rozdziale. Przypadek rachunku różniczkowego funkcji wielu zmiennych jest ideowo
podobny, ale technicznie znacznie bardziej skomplikowany. Dlatego omawiany jest oddzielnie, jako rozszerzenie rachunku różniczkowego funkcji jednej zmiennej.
Wspomnijmy jeszcze, że zastapienie
˛ zmiennej rzeczywistej zmienna˛ zespolona˛ prowadzi do bardzo ciekawej i mocnej teorii znacznie odbiegajacej
˛ od przypadku
zmiennej rzeczywistej. Dział analizy matematycznej poświ˛econy badaniu własności funkcji zmiennej zespolonej zwany jest analiza˛ zespolona.˛

Wróćmy jednak do przestrzeni wektorowych. Zaproponowana przez Kartezjusza algebraizacja geometrii poprzez wprowadzenie układu współrz˛ednych na
płaszczyźnie oraz geometryczna interpretacja liczb zespolonych zaowocowały wprowadzeniem w XIXw. koncepcji wektorów jako zaczepionych w poczatku ˛ ukła-
du n-wymiarowej przestrzeni zorientowanych odcinków, które można dodawać podobnie jak dodaje si˛e liczby rzeczywiste i zespolone. Intuicyjne wyobrażenie
geometryczne wektora możliwe jest jedynie w przestrzeni dwu- i trójwymiarowej, bo jedynie z takimi przestrzeniami maja˛ do czynienia nasze zmysły. Od strony
algebraicznej wektor to po prostu układ n liczb zwanych współrz˛ednymi wektora. Dodawanie wektorów metoda˛ geometryczna˛ sprowadza si˛e do konstrukcji prze-
katnej
˛ rozpi˛etego na wektorach równoległoboku. W przypadu płaszczyzny pokrywa si˛e to z geometryczna˛ interpretacja˛ sumy liczb zespolonych przedstawiona˛ na
rysunku 2.9 . Wektory wraz z operacja˛ dodawania stanowia˛ grup˛e. Dla przestrzeni wymiaru wi˛ekszego niż dwa nie da si˛e jednak zdefiniować mnożenia wektorów
tak, by uzyskać struktur˛e ciała. W wymiarze cztery da si˛e uzyskać struktur˛e bliska˛ ciała, ale mnożenie nie jest przemienne. Sa˛ to tak zwane kwaterniony, które
rozszerzaja˛ ciało liczb zespolonych, ale za cen˛e utraty przemienności. Możliwe jest jednak mnożenie wektora przez liczb˛e, które sprowadza si˛e do stosownej
zmiany jego długości i, w przypadku mnożenia przez liczb˛e ujemna,˛ symetrycznego odbicia wzgl˛edem poczatku ˛ układu.

Powyższe idee prowadza˛ do koncepcji przestrzeni wektorowej nad zadanym ciałem.

7.1.1 Przestrzeń wektorowa

165
166 ROZDZIAŁ 7. PRZESTRZENIE WEKTOROWE

Definicja 7.1.1 Niech F będzie ciałem i niech 1 oznacza element neutralny względem mnożenia w ciele F . Przestrzenią
wektorową nad F nazywamy piątkę (X, F, +, ·, 0) taką, że (X, +, 0) jest grupą abelową, a

·:F ×X →X

jest działaniem (tzw. działaniem zewnętrznym) spełniającym dla dowolnych α, β ∈ F oraz x, y ∈ X warunki
(W1) (α + β)x = αx + βx,

(W2) α(x + y) = αx + αy,


(W3) α(βx) = (αβ)x,
(W4) 1 · x = x.
Elementy ciała F określa się często mianem skalarów, a o działaniu zewnętrznym mówi się, że jest to mnożenie przez
skalary.

Przykład 7.1.2 Klasycznym przykładem przestrzeni wektorowej jest Rd nad ciałem R. Elementami tej przestrzeni
są n-tki (zwane również krotkami lub po prostu wektorami) postaci x = (x1 , x2 , . . . xn ), gdzie xi ∈ R są liczbami
rzeczywistymi. Sumę x = (x1 , x2 , . . . xn ) i y = (y1 , y2 , . . . yn ) definiuje się wzorem

x + y := (x1 + y1 , x2 + y2 , . . . xn + yn ),

a mnożenie wektora x przez skalar α ∈ R wzorem

αx := (αx1 , αx2 , . . . αxn ).

Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. W podobny sposób konstruujemy przestrzeń wektorową
F n dla dowolnego ciała F , na przykład dla ciała liczb zespolonych.

Przykład 7.1.3 Niech X będzie dowolnym ustalonym zbiorem. Oznaczmy przez F (X, R) zbiór wszystkich funkcji
postaci f : X → R. Dla f, g ∈ F (X, R) definiujemy sumę f + g jako funkcję

f + g : X 3 x 7→ f (x) + g(x) ∈ R,

a mnożenie funkcji f przez skalar α ∈ R jako funkcję

αf : X 3 x 7→ αf (x) ∈ R.

Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. Jeśli X jest przestrzenią topologiczną, to w podobny
sposób konstruujemy przestrzeń funkcji ciągłych z X do R oznaczaną jako C(X, R)

Przykład z przestrzenia˛ wektorowa˛ funkcji ograniczonych sygnalizuje, że pożytki ze stosowania tego poj˛ecia moga˛ wykraczać poza wektory na płaszczyźnie
i ich uogólnienia na Rd . W istocie, można na przykład pokazać, że przestrzeń C([0, 1], R) nie jest izomorficzna z przestrzenia˛ Rd dla żadnego d. Jest wiele
ważnych i ciekawych przykładów przestrzeni wektorowych, w których rol˛e wektorów pełnia˛ funkcje. I choć przestrzenie te nie daja˛ si˛e wyobrazić tak jak R2
lub R3 , a struktura tych przestrzeni jest znacznie bardziej skomplikowana, to jednak formalne wyniki uzyskane na bazie intuicji zwiazanych˛ z R2 i R3 maja˛
zastosowanie dla wszystkich przestrzeni wektorowych co owocuje wartościowymi rezultatami dla wielu przestrzeni funkcyjnych. Pewne przykłady b˛edziemy mieli
okazj˛e zaobserwować w rozdziale| 11 . Badaniem przestrzeni funkcyjnych zajmuje si˛e dział analizy matematycznej zwany analiza˛ funkcjonalna.˛
7.2. PRZESTRZENIE WEKTOROWE Z ILOCZYNEM SKALARNYM 167

7.2 Przestrzenie wektorowe z iloczynem skalarnym


Poprzez interpretacj˛e wektorów na płaszczyźnie jako liczb zespolonych wiemy, że można je nie tylko dodawać, ale i mnożyć z zachowaniem własności ciała.
Uzyskanie struktury ciała dla wektorów w przestrzeni trówymiarowej i wyższych wymiarach nie jest możliwe. Natomiast bardzo pożyteczny jest iloczyn skalarny.
Jest to odwzorowanie, które parze wektorów (v, w) przyporzadkowuje
˛ liczb˛e v · w b˛edac˛ a˛ iloczynem długości wektora w przez długość rzutu prostopadłego
wektora v na prosta,˛ w której zawiera si˛e wektor w, wzi˛eta ze znakiem plus, jeśli kat˛ mi˛edzy wektorami jest ostry i znakiem minus w przeciwnym razie. Łatwo
sprawdzić, że tak zdefiniowany iloczyn skalarny jest przemienny i wyraża si˛e wzorem

v · w = |v||w| cos α

gdzie |v| i |w| oznaczaja˛ długości wektorów v i w, a α jest katem


˛ pomi˛edzy nimi. Ze wzoru tego wynikaja˛ od razu najważniejsze własności iloczynu skalarnego:
wektory v i w sa˛ prostopadłe wtedy i tylko wtedy gdy v · w = 0 oraz v · v = |v|2 .
W praktyce wygodne jest przyj˛ecie aksjomatycznej definicji iloczynu skalarnego.

7.2.1 Iloczyn skalarny

Definicja 7.2.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie ϕ : X × X → R nazywamy iloczynem
skalarnym jeżeli dla wszystkich x, y, z ∈ X oraz α ∈ R spełnione są następujące warunki:

(IS1) ϕ(x + y, z) = ϕ(x, z) + ϕ(y, z),


(IS2) ϕ(αx, y) = αϕ(x, y),
(IS3) ϕ(x, y) = ϕ(y, x),
(IS4) ϕ(x, x) ­ 0 i ϕ(x, x) = 0 ⇔ x = 0.

Ćwiczenie 7.2.2 Pokazać, że odwzorowanie ϕ : Rd × Rd → R dane dla x = (x1 , x2 , . . . , xd ) i y = (y1 , y2 , . . . , yd )


wzorem
d
X
ϕ(x, y) := xi yi
i=1

jest iloczynem skalarnym w R . d

˛ iloczyn skalarny z przykładu 7.2.2 w przypadku x = y dostajemy


Liczac
d
X
ϕ(x, x) = x2i .
i=1

Z twierdzeniap Pitagorasa wnosimy, że w tym przypadku ϕ(x, x) jest kwadratem długości wektora x. W przypadku dowolnego iloczynu skalarnego wyrażenie
||x|| := ϕ(x, x) możemy interpretować jako coś zbliżonego własnościami do długości wektora w Rd . W istocie, długość wektora ma wiele własności
analogicznych do modułu liczby zespolonej co prowadzi do abstrakcyjnej definicji normy wektora, która˛ podamy w kolejnym rozdziale. Teraz wspominijmy jeszcze,
że iloczyn skalarny z przykładu 7.2.2 daje si˛e wyrazić wzorem

ϕ(x, y) = ||x|| · ||y|| · cos α

gdzie α oznacza kat˛ pomi˛edzy wektorami x i y .


Wzór na iloczyn skalarny w Rd jest podstawa˛ definiowania ilocznu skalarnego w innych przestrzeniach. W szczególności w pewnych przestrzeniach ciagów
˛
P∞ Rb
iloczynem skalarnym jest i=1 xi yi , a w pewnych przestrzeniach funkcyjnych iloczynem skalarnym jest a f (x)g(x)dx.
168 ROZDZIAŁ 7. PRZESTRZENIE WEKTOROWE

7.2.2 Nierówność Cauchy-Schwartza


Jak zobaczymy w kolejnym rozdziale poniższa nierówność pozwala sprawdzić, że przy pomocy iloczynu skalarnego możemy zadać norm˛e, a w konsekwencji
również odległość, co pozwala nam traktować przestrzeń wektorowa˛ z iloczynem skalarnym jako przestrzeń metryczna.˛

Twierdzenie 7.2.3 (Nierówność Cauchy-Schwartza) Niech X będzie przestrzenią wektorową nad R z iloczynem
skalarnym ϕ. Dla dowolnych x, y ∈ X mamy
p p
|ϕ(x, y)| ¬ ϕ(x, x) ϕ(y, y).
Dowód: Rozważmy funkcję
µ : R 3 t 7→ ϕ(x + ty, x + ty) ∈ [0, ∞).
Wykorzystując własności iloczynu skalarnego dostajemy dla dowolnego t ∈ [0, ∞)
0 ¬ µ(t) = ϕ(x, x) + 2tϕ(x, y) + t2 ϕ(y, y).
Zatem wyróżnik w tej nierówności kwadratowej musi być niedodatni, tj.
4ϕ(x, y)2 − 4ϕ(x, x)ϕ(y, y) ¬ 0
co dowodzi tezy. 
Wniosek 7.2.4 Dla (x1 , x2 , . . . , xd ), (y1 , y2 , . . . , yd ) ∈ R mamyd

v v
X d u d
uX uX
u d
| xi yi | ¬ t x2i t yi2 .
i=1 i=1 i=1

7.3 Przestrzenie wektorowe unormowane


Jak zauważyliśmy, w przestrzeniach wektorowych, w których dysponujemy iloczynem skalarnym ϕ możemy oczekiwać, że dla wektora v wyrażenie ||v|| :=
ϕ(v, v) zachowywać si˛e b˛edzie podobnie do długości wektora w Rd . Sformalizujemy co mamy na myśli wprowadzajac
p
˛ poj˛ecie normy wektora. Jak już wspo-
mnieliśmy długość, a ogólnie norma wektora zachowuje si˛e podobnie do normy liczby zespolonej i wartości bezwzgl˛ednej liczby rzeczywistej. W szczególności, za
pomoca˛ normy w przestrzeni wektorowej można zadać odległość, co umożliwia traktowanie jej jako szczególnego przykładu przestrzeni metrycznej. W konsekwen-
cji, w przestrzeniach wektorowych z norma˛ możemy rozważać zbiory otwarte i domkni˛ete oraz granice. W kolejnych rozdziałach pozwoli nam to na zdefiniowanie
pochodnej i całki funkcji jednej zmiennej rzeczywistej o wartościach w przestrzeni wektorowej poprzez proste uogólnienie bardziej intuicyjnego przypadku funkcji
jednej zmiennej rzeczywistej o wartościach rzeczywistych.

7.3.1 Norma i przestrzeń wektorowa unormowana.

Definicja 7.3.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie X 3 x 7→ ||x|| ∈ R∗ nazywamy normą
w X jeżeli dla wszystkich x, y ∈ X oraz α ∈ R
(N1) ||x|| = 0 ⇔ x = 0,
(N2) ||αx|| = |α| ||x||,

(N3) ||x + y|| ¬ ||x|| + ||y||.


Zwyczajowo samo odwzorowanie oznaczamy || · ||, by odróżnić je w notacji od wartości odwzorowania dla wektora x,
czyli ||x||. Przestrzeń wektorową nad ciałem F z zadaną normą nazywamy przestrzenią wektorową unormowaną.
7.3. PRZESTRZENIE WEKTOROWE UNORMOWANE 169

Twierdzenie 7.3.2 Jeśli ϕ jest iloczynem skalarnym w przestrzeni wektorowej X, to

||x||ϕ := ϕ(x, x)
p

zadaje w tej przestrzeni normę.


Dowód: Własności (N1) i (N2) są oczywiste. Aby sprawdzić własność (N3) zauważmy, że wykorzystując nierówność
Cauchy-Schwartza (twierdzenie 7.2.3 ) mamy
||x + y||2ϕ = ϕ(x + y, x + y) = ϕ(x, x) + 2ϕ(x, y) + ϕ(y, y)
¬ ϕ(x, x) + 2|ϕ(x, y)| + ϕ(y, y)
ϕ(x, x) + 2 ϕ(x, x) ϕ(y, y) + ϕ(y, y)
p p
¬
= (||x||ϕ + ||y||ϕ )2 .

Jak już wspomnieliśmy, przy pomocy normy w przestrzeni wektorowej można zdefiniować odległość. Dokładniej, mamy
następujące twierdzenie, którego dowód zostawiamy jako proste ćwiczenie.

Twierdzenie 7.3.3 Niech X będzie przestrzenią wektorową nad R unormowaną normą || · ||. Wtedy odwzorowanie

X 2 3 (x, y) 7→ ||x − y|| ∈ R∗

jest metryką w X. Nazywamy ją metryką indukowaną przez normę || · ||.

Ćwiczenie 7.3.4 Udowodnić twierdzenie 7.3.3 .

7.3.2 Norma euklidesowa

Pd
Definicja 7.3.5 Normę w Rd pochodzącą od iloczynu skalarnego i=1 xi yi , tj. normę dla x ∈ Rd daną wzorem
v
u d
uX
||x||e := t x2i
i=1

nazywamy normą euklidesową.

W Rd zadać można również inne normy, na przykład normą są odwzorowania dane dla x ∈ Rd wzorem
d
X
||x||1 := |xi |
i=1

oraz
||x||max := max |xi |.
i=1,2,...,d

Łatwo sprawdzić, że metryki zadane przez normy || · ||e , || · ||1 , || · ||max indukują w Rd odpowiednio metrykę euklidesową,
metrykę Manhattan i metrykę maksimum. Dlatego normę || · ||1 nazywamy normą Manhattan, a normę || · ||max normą
maksimum.
170 ROZDZIAŁ 7. PRZESTRZENIE WEKTOROWE

Rysunek 7.1: Henri Lebesgue (1875 - 1941) i Stefan Banach (1892 - 1945). Źródło: Wikipedia

Naturalne jest pytanie czy każda norma musi pochodzić od jakiegoś iloczynu skalarnego. Negatywną odpowiedź na to
pytanie daje następujące ćwiczenie.

Ćwiczenie 7.3.6 Niech X będzie przestrzenią wektorową nad R i niech || · || będzie normą w X. Pokazać, że
• Jeśli || · || jest zadane przez iloczyn skalarny ϕ w X, to dla dowolnych x, y ∈ X zachodzi

||x + y||2 − ||x||2 − ||y||2


ϕ(x, y) = . (7.1)
2

• Funkcja dana wzorem (7.1) ma własności (IS3) oraz (IS4), ale niekoniecznie własności (IS1) oraz (IS2). W tym
celu rozważyć normę maksimum.

Z ćwiczenia 7.3.6 wnosimy, że iloczyn skalarny daje coś wi˛ecej niż norma. Rzeczywiście, w przestrzeni wektorowej z iloczynem skalarnym możemy zde-
finiować prostopadłość wektorów wykorzystujac ˛ obserwacj˛e, że dwa wektory w Rd sa˛ prostopadłe wtedy i tylko wtedy gdy ich iloczyn skalarny wynosi zero.
Przy pomocy normy nie da si˛e tego zrobić. W przestrzeni Rd nie ma to wielkiego znaczenia, bo iloczyn skalarny jest tam dost˛epny. Okazuje si˛e jednak, że ma
to znaczenie w przestrzeniach funkcyjnych, bo sa˛ przykłady takich przestrzeni, gdzie norm˛e wprowadzić łatwo, a iloczyn skalarny trudno. Oznacza to, że choć
prostopadłości zdefiniować si˛e nie da, to ciagle
˛ mamy metryk˛e, a wi˛ec zbiory otwarte, domkni˛ete i granice.

7.3.3 Przestrzenie Hilberta i Banacha


Wiemy z rozdziału o szeregach, że przestrzeń metryczna sama w sobie, choć pozwala zdefiniować poj˛ecie granicy, nie daje gwarancji, że coś co wyglada
˛ na zbieżne
(ciag
˛ Cauchy’ego) rzeczywiście jest zbieżne, bo kandydat na granic˛e może w danej przestrzeni nie istnieć. Dlatego z punktu widzenia analizy matematycznej
kluczowe jest poj˛ecie przestrzeni metrycznej zupełnej, a wi˛ec takiej, w której ciagi
˛ Cauchy’ego maja˛ granice. Zadanie iloczynu skalarnego czy normy w przestrzeni
wektorowej nie gwarantuje zupełności otrzymanej przestrzeni metrycznej. Ten warunek trzeba dorzucić. To prowadzi do nast˛epujacych˛ poj˛eć.
7.3. PRZESTRZENIE WEKTOROWE UNORMOWANE 171

Definicja 7.3.7 Przestrzeń wektorową z iloczynem skalarnym, zupełną nazywamy przestrzenią Hilberta. Przestrzeń
wektorową unormowaną, zupełną nazywamy przestrzenią Banacha.

Matematycy zainteresowali si˛e przestrzeniami z iloczynem skalarnym w pierwszej dekadzie XX wieku, kiedy to przy badaniu pewnych równań całkowych
zaobserwowano, że odwzorowanie
Z b
(f, g) 7→ f (x)g(x)dx (7.2)
a
ma pewne własności iloczynu skalarnego. Równolegle, a dokładniej w 1904 roku, francuski matematyk Henri Lebesgue (ryc. 7.1 ) uogólnił poj˛ecie całki Riemanna
co pozwoliło na całkowanie znacznie szerszej klasy funkcji i doprowadziło do obserwacji (w pewnym uproszczeniu), że rodzina funkcji na przedziale [a, b], których
kwadrat jest całkowalny w sensie Lebesgue’a, wraz z iloczynem skalarnym zadanym wzorem (7.2), jest przestrzenia˛ zupełna,˛ a wi˛ec przestrzenia˛ Hilberta.
Pozwoliło to na adoptowanie szeregu metod wypracowanych dla przestrzeni Rd do przypadku przestrzeni funkcyjnych. Znaczenie przestrzeni Hilberta zostało
ugruntowane, gdy okazało si˛e, że przestrzenie te nadaja˛ si˛e idealnie do formalizacji mechaniki kwantowej.
Przestrzenie Banacha pojawiły si˛e niewiele później, bo w latach 1920-22, kiedy to polski matematyk Strefan Banach (ryc. 7.1 ) zauważył, że przeniesienie
z Rd do przestrzeni funkcyjnych takich norm jak norma maksimum pozwala na wykorzystanie wielu technik wypracowanych dla przestrzeni Hilberta również
w takich przestrzeniach funkcyjnych, w których iloczynu skalarnego sensownie wprowadzić si˛e nie da. Przestrzenie Banacha pozwalaja˛ na adaptowanie do
przestrzeni funkcyjnych tych metod opracowanych dla przestrzeni Rd , dla których wystarcza poj˛ecie normy, ale nie musi to być norma euklidesowa. Oczywiście
w przestrzeniach Hilberta i Banacha dzieje si˛e dużo wi˛ecej i inaczej niż to co można zaobserwować w Rd , tym niemniej intuicje wypracowane dla Rd pozwalaja˛
wiele rzeczy prosto wykorzystać w dowolnych przestrzeniach funkcyjnych.
172 ROZDZIAŁ 7. PRZESTRZENIE WEKTOROWE
Rozdział 8

Pochodne i różniczki.

8.1 Pochodna funkcji

8.1.1 Definicja pochodnej

W rozdziale wst˛epnym wprowadziliśmy intuicyjna˛ koncepcj˛e pochodnej funkcji f : R → R w punkcie x0 jako współczynnika kierunkowego nachylenia stycznej
do wykresu poprowadzonej w punkcie (x0 , f (x0 )). Współczynnik kierunkowy prostej w układzie współrz˛ednych x i y to tangens kata ˛ jaki tworzy ta prosta z osia˛
x. Łatwo jest policzyć ten współczynnik dla siecznej poprowadzonej przez punkty (x0 , f (x0 )) i (x1 , f (x1 )). Z rysunku 8.1 wnosimy, że tangens ten to iloraz

f (x1 ) − f (x0 )
,
x1 − x0

zwany ilorazem różnicowym. Ustalajac ˛ x1 do x0 przybliżamy sieczna˛ do stycznej w (x0 , f (x0 )). Można zatem oczekiwać, że współczynnik
˛ x0 i przybliżajac
kierunkowy siecznej zmierza do współczynnika kierunkowego stycznej. Niech h := x1 − x0 b˛edzie przyrostem zmiennej x wzgl˛edem punktu x0 . Iloraz
różnicowy można wtedy zapisać jako

f (x0 + h) − f (x0 )
,
h

a współczynnik kierunkowy stycznej w (x0 , f (x0 )) jako granic˛e

f (x0 + h) − f (x0 )
lim (8.1)
h→0 h

co prowadzi do definicji pochodnej funkcji f w punkcie x0 . Zwróćmy uwag˛e, że mówimy tu nie o granicy funkcji f zmiennej x tylko o granicy ilorazu dwóch funkcji
zmiennej h. W mianowniku jest funkcja identycznościowa h 7→ h, natomiast w liczniku jest funkcja h 7→ f (x0 + h) − f (x0 ).
Choć powyższa interpretacja dotyczy funkcji o wartościach w zbiorze liczb rzeczywistych, granica (8.1) ma sens również wtedy, gdy funkcja f ma wartości
w przestrzeni wektorowej Rm , zatem nasza formalna definicja b˛edzie nieco ogólniejsza.
Niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm . Ustalmy punkt
x0 ∈ (a, b).

173
174 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Rysunek 8.1: Sieczna i styczna do krzywej. Tangens kąta nachylenia siecznej do osi x możemy wyliczyć z trójkąta prosto-
kątnego. Gdy przyrost h (dolna przyprostokątna) zmierza do zera, trójkąt robi się coraz mniejszy i w granicy znika. Jednak
sieczna nie znika, tylko zmienia się w styczną, a tangens kąta nachylenia siecznej w kąt nachylenia stycznej.

Definicja 8.1.1 Mówimy, że funkcja f jest różniczkowalna w punkcie x0 jeżeli w Rm istnieje granica

f (x0 + h) − f (x0 )
lim .
h→0 h
Granicę tę nazywamy pochodną funkcji f w punkcie x0 i oznaczamy f 0 (x0 ). Jeśli f ma pochodną w każdym punkcie
x ∈ (a, b) to mówimy, że f jest różniczkowalna na przedziale (a, b) i definiujemy również funkcję

f 0 : (a, b) 3 x 7→ f 0 (x) ∈ Rm ,

którą nazywamy funkcją pochodną funkcji f .

Wyjaśnijmy jeszcze skad ˛ wzi˛eło si˛e słowo różniczkowalność. W tym celu wprowadźmy tradycyjne oznaczenia na przyrost wartości argumentu i przyrost
wartości funkcji (różnice) w punkcie x0 :

∆x := x − x0 ,
∆y := f (x) − f (x0 ).

Wtedy iloraz różnicowy w punkcie x0 przyjmuje postać ilorazu różnic


∆y
∆x
i dla bardzo małych ∆x i ∆y może być uważany za przybliżenie pochodnej. Newton i Leibniz, wprowadzajac ˛ poj˛ecie pochodnej, nie używali poj˛ecia granicy.
Posługiwano si˛e wtedy nieprecyzyjnym poj˛eciem wielkości nieskończenie małej. Leibniz używał oznaczenia dy i dx na nieskończenie małe odpowiedniki różnic
∆y i ∆x. Zatem wzór na pochodna˛ przyjmował postać
dy
f 0 (x) = .
dx
8.1. POCHODNA FUNKCJI 175

Wzór ten rozumiano nie jako przybliżenie, ale jako równość. Proces wyznaczania pochodnej nazywano różniczkowaniem, bo polegał na wyznaczeniu ilorazu
dwóch maleńkich, najlepiej nieskończenie małych różnic, czyli różniczek. Wielkości nieskończenie małe, podobnie jak nieskończenie wielkie nie dały si˛e precyzyjnie
zdefiniować i prowadziły do wielu paradoksów. Dopiero wprowadzenie poj˛ecia granicy pozwoliło Cauchy’emu na postawienie precyzyjnych definicji pochodnej i
różniczki. Zdefiniował je w odwrotnej kolejności: najpierw pochodna˛ jako granic˛e ilorazów różnicowych, a nast˛epnie różniczki dx i dy jako zmienne układzie
współrz˛ednych o poczatku˛ w punkcie (x0 , y0 ) (tak zwanym lokalnym układzie współrz˛ednych) pozwalajace ˛ zapisać równanie stycznej do wykresu w postaci

dy = f 0 (x)dx.

Do równania stycznej i poj˛ecia różniczki wrócimy w rozdziale 8.12.4 .


Pomysłodawca˛ oznaczenia f 0 na pochodna˛ funkcji f jest francuski matematyk Joseph-Louis Lagrange (ryc. 8.10 ). Oznaczenie to jest formalnie poprawne
gdy jest stosowane do symbolu funkcji. Cz˛esto bywa jednak używane mniej precyzyjnie w wyrażeniach podajacych ˛ wartość funkcji dla danego argumentu. Na
przykład zapis (x2 + 1)0 należy rozumieć jako pochodna˛ funkcji x 7→ x2 + 1. Takie użycie znaku pochodnej może być jednak niejasne. Na przykład w zapisie
(x2 + y)0 nie wiadomo czy chodzi o pochodna˛ funkcji x 7→ x2 + y gdzie y jest traktowane jako tak zwany parametr czyli ustalona wartość, czy o pochodna˛
funkcji y 7→ x2 + y gdzie x jest traktowane jako parametr. Cz˛eściowym rozwiazaniem ˛ tego problemu jest stosowanie liter innych niż x, y, z na oznaczenie
parametrów. W oparciu o taka˛ konwencj˛e można si˛e domyślić, że w zapisie (x2 + a)0 chodzi o pochodna˛ funkcji x 7→ x2 + a. Alternatywnym rozwiazaniem ˛
tego problemu jest zapis dxd
f (x) na oznaczenie pochodnej. Podkreśla on, że chodzi o funkcj˛e zmiennej x wsz˛edzie tam gdzie zamiast symbolu funkcji użyto
dy
wyrażenia określajacego
˛ wartość funkcji. Zapis ten wywodzi si˛e z wprowadzonej przez Gottfrieda Leibniza (ryc. 1.22 ) notacji dx na oznaczenie pochodnej
jako ilorazu dwóch nieskończenie małych przyrostów. W przypadku funkcji dwóch lub wi˛ecej argumentów stosowany jest w postaci ∂xi f (x1 , x2 , . . . , xn ) na

oznaczenie pochodnej funkcji xi 7→ f (x1 , x2 , . . . , xn ) zwanej funkcja˛ cz˛eściowa˛ funkcji f . W takim przypadku pochodna określana jest mianem pochodna
czastkowa.
˛

8.1.2 Interpretacja fizyczna pochodnej.


Dla pochodnej funkcji podać można prostą interpretację fizyczną. Rozważmy punkt materialny poruszający się po prostej
w przedziale czasowym [a, b]. Dla ustalenia uwagi przyjmijmy, że czas mierzymy w sekundach. Niech f (t) określa położenie
punktu na prostej w chwili t ∈ [a, b]. Położenie to określamy mierząc odległość tego punktu od pewnego, arbitralnie ustalonego
punktu odniesienia. Położenie bierzemy ze znakiem plus gdy punkt jest na prawo od tego punktu, a ze znakiem minus gdy
jest na lewo. Wtedy iloraz różnicowy f (t+h)−f
h
(t)
mierzy średnią prędkość poruszania się punktu na odcinku pomiędzy t, a
t + h, wyrażoną w metrach na sekundę. Podobnie jak w przypadku t.zw. odcinkowego pomiaru prędkości samochodu, ale z
tą różnicą, że prędkość samochodu jest wyrażona w kilometrach na godzinę, a nie w metrach na sekundę. Gdy h zmierza do
zera, czyli gdy średnią prędkość mierzymy na coraz krótszych odcinkach czasu, w granicy dostajemy prędkość chwilową w
chwili t, podobnie jak w przypadku prędkości mierzonej policyjnym radarem. Tak więc fizyczną interpretacją pochodnej jest
w tym przypadku prędkość chwilowa. Ogólniej, gdy f (t) podaje jakąkowiek wielkość fizyczną zmierzoną w chwili t, pochodna
f 0 (t) podaje chwilową prędkość z jaką zmienia się ta wielkość w momencie t. Podobnie zinterpretować można pochodną w
przypadku funkcji, której wartości leżą w C = R2 , a nawet w dowolnej przestrzeni wektorowej (rysunek 8.2 ).

8.1.3 Pochodna funkcji stałej i identycznościowej.

Twierdzenie 8.1.2 (o pochodnej funkcji stałej) Niech c ∈ R będzie ustalone. Funkcja stała

cR : (−∞, ∞) 3 x 7→ c ∈ R.

ma pochodną w każdym punkcie oraz


(cR )0 = 0R
co czasami zapisujemy mniej formalnie, ale krócej, jako

c0 = 0.
176 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

f '(t) f(t+h)

f(t+h)-f(t)
f(t)
h

f(b)
f(a)

Rysunek 8.2: Interpretacja geometryczna pochodnej dla ruchu punktu na płaszczyźnie. Funkcja f : [a, b] → C = R2
odzwierciedla położenia punktu materialnego poruszającego się od punktu f (a) w chwili a do punktu f (b) w chwili b.
Róznica położeń punktu w chwili t i t + h jest wektorem łączącym f (t) z f (t + h). Gdy h zmierza do zera, sam ten wektor
skraca się do zera, ale po wydzieleniu przez h (utworzeniu ilorazu różnicowego), jego długość stabilizuje się i w granicy
dostajemy wykres styczny do trajektorii ruchu punktu, którego długość równa jest chwilowej prędkości ruchu w punkcie t.

Dowód: Rzeczywiście, dla funkcji stałej iloraz różnicowy wynosi

cR (x + h) − cR (x) c−c
= = 0,
h h

więc granica ilorazu różnicowego jako granica funkcji stale równej zero wynosi zero. Dowodzi to naszej tezy. 

Twierdzenie 8.1.3 (o pochodnej identyczności) Funkcja identycznościowa

idR : R 3 x 7→ x ∈ R.

ma pochodną w każdym punkcie równą jeden. Jej funkcja pochodna jest zatem funkcją stałą, stale równą jeden, czyli

(idR )0 = 1R

co czasami zapisujemy mniej formalnie, ale krócej jako

x0 = 1.

Dowód: Dla funkcji identycznościowej iloraz różnicowy wynosi

idR (x + h) − idR (x) (x + h) − x h


= = = 1,
h h h

więc granica ilorazu różnicowego jako granica funkcji stale równej jeden wynosi jeden. Dowodzi to naszej tezy. 
8.1. POCHODNA FUNKCJI 177
Przykład 8.1.4 Rozważmy funkcję
f : R 3 x 7→ |x| ∈ R.
Jeśli x jest dodatnie, to dla dostatecznie małych h również x + h jest dodatnie, zatem wtedy |x| = x, |x + h| = x + h
czyli w tym przypadku iloraz różnicowy wynosi

f (x + h) − f (x) |x + h| − |x| (x + h) − x h
= = = = 1.
h h h h
Jeśli x jest ujemne, to dla dostatecznie małych h również x + h jest ujemne, zatem wtedy |x| = −x, |x + h| = −x − h
czyli w tym przypadku iloraz różnicowy wynosi

f (x + h) − f (x) |x + h| − |x| (−x − h) − (−x) −h


= = = = −1.
h h h h
Dla x = 0 iloraz różnicowy może wynosić tak jeden jak i minus jeden, w zależności od znaku h, więc nie ma granicy.
Podsumowując, 
−1
 gdy x < 0,
f (x) = nie istnieje
0
gdy x = 0,
1 gdy x > 0.

8.1.4 Pochodna lewo- i prawostronna.


Ostatni przykład podpowiada, że, podobnie jak w przypadku granicy, warto też rozważać pochodne lewo- i prawostronne.
Niech f : [a, b] → Rm będzie funkcją określoną na przedziale domkniętym [a, b].

Definicja 8.1.5 Niech x0 ∈ (a, b]. Mówimy, że f ma pochodną lewostronną w x0 jeśli w Rm istnieje granica lewo-
stronna
f (x0 + h) − f (x0 )
lim− . (8.2)
h→0 h
Granicę tę nazywamy pochodną lewostronną funkcji f w x0 i oznaczamy f−
0
(x0 ). Podobnie, jeśli x0 ∈ [a, b) to mówimy,
że f ma pochodną prawostronną w x0 jeśli w R istnieje granica prawostronna
m

f (x0 + h) − f (x0 )
lim . (8.3)
h→0+ h
Granicę tę nazywamy pochodną prawostronną funkcji f w x0 i oznaczamy f+
0
(x0 ).

Przykład 8.1.6 Funkcja f w przykładzie 8.1.4 ma w zerze pochodną lewostronną równą -1 oraz pochodną prawo-
stronną równą 1.

Ćwiczenie 8.1.7 Pokaż, że funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną wtedy i tylko wtedy gdy ma
w tym punkcie tak pochodną lewostronną jak i prawostronną i są one sobie równe.

W dalszym ciągu wygodnie będzie również rozważać różniczkowalność funkcji określonej na przedziale domkniętym.
178 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Definicja 8.1.8 Mówimy, że funkcja f : [a, b] → Rm jest różniczkowalna jeśli ma pochodną w każdym punkcie
przedziału (a, b), pochodną prawostronną w a i pochodną lewostronną w b.

W przypadku funkcji różniczkowalnej f : [a, b] → Rm wygodnie jest mówić krótko o pochodnej f w a i w b rozumiejąc
przez to odpowiednio pochodną prawostronną w a i lewostronną w b.

8.1.5 Ciągłość funkcji różniczkowalnej


W dalszych rozdziałach podamy szereg twierdzeń gwarantujących istnienie pochodnej, co pozwoli nam konstruować znacznie
bardziej zaawansowane przykłady. Na koniec tego rozdziału podajmy następujące twierdzenie określające warunek konieczny
istnienia pochodnej.

Twierdzenie 8.1.9 Jeśli funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną to jest w tym punkcie ciągła.

Dowód: Aby pokazać ciągłość f w x0 ustalmy ε > 0. Na mocy definicji pochodnej istnieje granica

f (x0 + h) − f (x0 )
lim .
h→0 h

Z definicji granicy dla ε0 = 1 znajdziemy δ 0 > 0 takie, że jeśli h ∈ (−δ 0 , δ 0 ) to

f (x0 + h) − f (x0 )
− f 0 (x0 ) < 1.
h

W szczególności
f (x0 + h) − f (x0 ) f (x0 + h) − f (x0 )
¬ − f 0 (x0 ) + |f 0 (x0 )| < 1 + |f 0 (x0 )|. (8.4)
h h
Weźmy δ := min(δ 0 , 1+|fε0 (x0 )| ). Z (8.4) dla h ∈ (−δ, δ) mamy

|f (x0 + h) − f (x0 )| < (1 + |f 0 (x0 )|)|h| ¬ ε

co pokazuje, że limh→0 f (x + h) = f (x0 ) i dowodzi, że f jest ciągła w x0 . 

Ćwiczenie 8.1.10 Uogólnić twierdzenie 8.1.9 na przypadek funkcji f : [a, b] → Rm .

8.2 Pochodna sumy, różnicy, iloczynu i ilorazu


Naturalne jest pytanie czy znając pochodną dwóch funkcji możemy wyznaczyć pochodną sumy, różnicy, iloczynu i ilorazu
tych funkcji. Jest tak w istocie, jak pokazują następujące twierdzenia.

8.2.1 Pochodna sumy i różnicy

Twierdzenie 8.2.1 (o pochodnej sumy i różnicy) Niech f, g : (a, b) → Rm będą różniczkowalne w punkcie x0 ∈
(a, b). Wtedy funkcje f + g i f − g są różniczkowalne w x0 oraz

(f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ) i (f − g)0 (x0 ) = f 0 (x0 ) − g 0 (x0 ).


8.2. POCHODNA SUMY, RÓŻNICY, ILOCZYNU I ILORAZU 179

Dowód: Iloraz różnicowy dla sumy f + g to


(f + g)(x0 + h) − (f + g)(x0 ) f (x0 + h) − f (x0 ) g(x0 + h) − g(x0 )
= + . (8.5)
h h h
Ponieważ
f (x0 + h) − f (x0 ) g(x0 + h) − g(x0 )
lim = f 0 (x0 ) i lim = g 0 (x0 ),
h→0 h h→0 h
więc z (8.5) wnosimy, że
(f + g)(x0 + h) − (f + g)(x0 )
lim = f 0 (x0 ) + g 0 (x0 ),
h→0 h
co dowodzi tezy dla sumy. Dla różnicy dowód jest analogiczny. 

8.2.2 Pochodna iloczynu


Twierdzenie o pochodnej iloczynu przedstawimy dla funkcji o wartościach w zbiorze liczb zespolonych C. Oczywiście twier-
dzenie to obejmuje również przypadek funkcji o wartościach rzeczywistych, bo zbiór liczb rzeczywistych traktujemy jako
podzbiór zbioru liczb zespolonych. Jako ćwiczenie zostawimy przypadek, gdy jedna funkcja przyjmuje wartości skalarne, a
druga wektorowe, a iloczyn funkcji jest rozumiany jako mnożenie skalara przez wektor oraz przypadek, gdy obie funkcje są
wektorowe, a iloczyn jest rozumiany jako iloczyn skalarny wektorów.

Twierdzenie 8.2.2 (o pochodnej iloczynu) Niech f, g : (a, b) → C będą różniczkowalne w punkcie x0 ∈ (a, b).
Wtedy funkcja f g jest różniczkowalna w x0 oraz

(f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).


Dowód: Iloraz różnicowy dla iloczynu f g to
(f g)(x0 + h) − (f g)(x0 ) f (x0 + h)g(x0 + h) − f (x0 )g(x0 )
=
h h
f (x0 + h)g(x0 + h) − f (x0 + h)g(x0 ) + f (x0 + h)g(x0 ) − f (x0 )g(x0 )
=
h
g(x0 + h) − g(x0 ) f (x0 + h) − f (x0 )
= f (x0 + h) + g(x0 )
h h

Funkcja f jako różniczkowalna w x0 jest również ciągła w x0 , więc


g(x0 + h) − g(x0 ) f (x0 + h) − f (x0 )
 
lim f (x0 + h) + g(x0 ) = f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 ).
h→0 h h
Zatem z otrzymanego wyżej przedstawienia ilorazu różnicowego dla iloczynu również
(f g)(x0 + h) − (f g)(x0 )
(f g)0 (x0 ) = lim = f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 )
h→0 h
co dowodzi naszej tezy. 
Z twierdzenia o pochodnej iloczynu i z faktu, że pochodna funkcji stałej wynosi zero dostajemy natychmiast następujący
wniosek.
Wniosek 8.2.3 Niech f : (a, b) → C będzie różniczkowalne w punkcie x0 ∈ (a, b) i niech c ∈ C będzie stałą. Wtedy
funkcja cf jest różniczkowalna w x0 oraz
(cf )0 (x0 ) = cf 0 (x0 ).

180 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Z twierdzenia o pochodnej iloczynu wyprowadzimy też następujące twierdzenie

Twierdzenie 8.2.4 (o pochodnej funkcji potęgowej) Niech n ∈ N0 będzie ustaloną liczbą naturalną. Funkcja
potęgowa
R 3 x 7→ xn ∈ R
jest różniczkowalna. Jej pochodną jest funkcja

R 3 x 7→ nxn−1 ∈ R

co zapisujemy mniej formalnie, ale krócej jako


(xn )0 = nxn−1 .

Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n ∈ {0, 1} twierdzenie wynika natychmiast z twierdzeń 8.1.2
i 8.1.3 . Załóżmy, że n > 1 oraz że twierdzenie zachodzi dla k < n. Funkcja x 7→ xn jest wtedy iloczynem funkcji
identycznościowej oraz funkcji x 7→ xn−1 . Z założenia indukcyjnego mamy (xn−1 )0 = (n − 1)xn−2 , bo n − 1 < n. Zatem z
twierdzenia o pochodnej iloczynu mamy

(xn )0 = (xxn−1 )0 = x0 xn−1 + x(n − 1)xn−2 = nxn−1

co dowodzi tezy. 

Ćwiczenie 8.2.5 Niech α : (a, b) → R i f : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja

αf : (a, b) 3 x 7→ α(x)f (x) ∈ Rm

jest różniczkowalna w x0 oraz


(αf )0 (x0 ) = α0 (x0 )f (x0 ) + α(x0 )f 0 (x0 ).
Wyprowadź stosowny wniosek gdy funkcja α lub funkcja f jest stała.

Ćwiczenie 8.2.6 Niech f, g : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja

f · g : (a, b) 3 x 7→ f (x) · g(x) ∈ R

jest różniczkowalna w x0 oraz


(f · g)0 (x0 ) = f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ).
Wyprowadź stosowny wniosek gdy funkcja f lub funkcja g jest stała.
8.2. POCHODNA SUMY, RÓŻNICY, ILOCZYNU I ILORAZU 181

8.2.3 Pochodna ilorazu

Twierdzenie 8.2.7 (o pochodnej ilorazu) Niech f, g : (a, b) → C będą różniczkowalne w x0 ∈ (a, b) i niech
g(x0 ) 6= 0. Wtedy funkcja
f (x)
x 7→
g(x)
jest dobrze określona w pewnym otoczeniu x0 i różniczkowalna w x0 oraz
 0
f f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) = 2 .
g (g(x0 ))

Dowód: (*)Zauważmy, że funkcja g jako różniczkowalna w x0 jest ciągła w x0 , więc twierdzenie 4.6.9 implikuje, że
własność g(x0 ) 6= 0 przenosi się na pewne otoczenie x0 . Zatem iloraz funkcji f i g jest dobrze określony w pewnym otoczeniu
punktu x0 . Iloraz różnicowy dla ilorazu funkcji f i g to
   
g (x0 + h) − g (x0 )
f f f (x0 +h) f (x0 )
g(x0 +h) − g(x0 )
=
h h
f (x0 + h)g(x0 ) − f (x0 )g(x0 + h)
=
hg(x0 )g(x0 + h)
f (x0 + h)g(x0 ) − f (x0 )g(x0 ) + f (x0 )g(x0 ) − f (x0 )g(x0 + h)
=
hg(x0 )g(x0 + h)
(f (x0 + h) − f (x0 )) g(x0 ) − f (x0 ) (g(x0 + h) − g(x0 ))
=
hg(x0 )g(x0 + h)
f (x0 +h)−f (x0 )
− f (x0 ) g(x0 +h)−g(x
g(x0 ) 0)

= h h
g(x0 )g(x0 + h)

Przechodząc w otrzymanej równości z h do granicy w zerze dostajemy tezę. 

2
Przykład 8.2.8 Policzmy pochodną funkcji x 7→ xx+1 +1
. Zgodnie z twierdzeniami o pochodnej ilorazu, pochodnej
funkcji potęgowej, pochodnej sumy oraz pochodnej funkcji stałej mamy
0
x2 + 1 (x2 + 1)0 (x + 1) − (x2 + 1)(x + 1)0 2x(x + 1) − (x2 + 1) x2 + 2x − 1

= = = .
x+1 (x + 1)2 (x + 1)2 (x + 1)2

8.2.4 Symbole nieoznaczone


Naturalne jest pytanie, czy można coś powiedzieć o granicy sumy, różnicy, iloczynu oraz ilorazu funkcji f i g gdy zmierzają
one do nieskończoności lub gdy mianownik w ilorazie zmierza do zera. W pewnych przypadkach odpowiedź jest jednoznaczna:
granica istnieje i jest jednoznacznie wyznaczona przez granice funkcji f i g. Na przykład łatwo pokazać, że jeśli f i g zmierzają
do nieskończoności to ich suma też zmierza do nieskończoności. Na ogół jednak nic nie da się wywnioskować ze znajomości
samych granic funkcji f i g. Mówimy wtedy o tak zwanych symbolach nieoznaczonych. Symbolami nieoznaczonymi są na
przykład 0 · ∞, ∞ − ∞, 00 , ∞ ∞ . W przypadkach gdy wyznaczenie granicy sumy, różnicy, iloczynu lub ilorazu prowadzi do
182 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

symbolu nieoznaczonego musimy poszukiwać granicy wykorzystując bezpośrednio wzory, którymi zadane są funkcje f i g.
Pomocna bywa tu reguła de l’Hospitala, którą zajmiemy się w rozdziale 8.10 .

8.2.5 Pochodna zestawienia

Twierdzenie 8.2.9 (o pochodnej zestawienia) Niech fi : (a, b) → C będą funkcjami różniczkowalnymi w x0 ∈ (a, b)
dla i = 1, 2, . . . m. Wtedy zestawienie f := (f1 , f2 , . . . fm ) : (a, b) → Cm jest różniczkowalne w x0 oraz

f 0 (x0 ) = (f10 (x0 ), f20 (x0 ), . . . , fm


0
(x0 ))
Dowód: Teza wynika natychmiast z twierdzenia o granicy zestawienia funkcji (tw. 4.2.6 ), gdyż
m
f (x0 + h) − f (x0 ) fi (x0 + h) − fi (x0 )

=
h h i=1

8.3 Pochodna funkcji złożonej


Bardzo przydatna w liczeniu pochodnych jest informacja jak pochodna złożenia funkcji wyraża się poprzez pochodne funkcji
składanych. Nim przedstawimy stosowne twierdzenie, zajmiemy się twierdzeniem pomocniczym, które przyda się nam później
w dowodzie twierdzenia o pochodnej złożenia.
Niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm . Ustalmy punkt
x0 ∈ (a, b) i rozważmy przyrost funkcji f w punkcie x0 ∈ (a, b), t.j. funkcję ∆x0 f : (a − x0 , b − x0 ) → Rm określoną wzorem
∆x0 f (h) := f (x0 + h) − f (x0 ).
∆x0 f (h)
Zauważmy, że jeśli f : R 9 Rm jest różniczkowalna w x0 ∈ R, to funkcja h 7→ h − f 0 (x0 ) ma w zerze granic˛e zero, choć sama w zerze
∆x0 f (h)
nie jest zdefiniowana, bo ułamek h dla h = 0 nie ma sensu. Możemy jednak rozszerzyć t˛e funkcj˛e do funkcji r : R 9 Rm , która z definicji w zerze
przyjmuje wartość zero. B˛edzie to funkcja ciagła
˛ i b˛edzie spełniać wzór

∆x0 f (h) − hv = hr(h).


Okazuje si˛e, że implikacja odwrotna również zachodzi. Obserwacj˛e t˛e zbierzemy w postaci twierdzenia.

Twierdzenie 8.3.1 Różniczkowalność f w x0 jest równoważna istnieniu funkcji r : R 9 Rm określonej w otoczeniu


zera i ciągłej w zerze oraz wektora v ∈ Rm takich, że

r(0) = 0 (8.6)
∆x0 f (h) − hv = hr(h). (8.7)
Dowód: Załóżmy najpierw, że f jest różniczkowalna w x0 . Połóżmy v := f 0 (x0 ) oraz zdefiniujmy funkcję r wzorem
(
∆x0 f (h)
− v gdy h 6= 0
r(h) := h
0 w przeciwnym razie.

Oczywiście r jest określona w otoczeniu zera i spełnia wzory ( 8.6 - 8.7 ). Z twierdzeń o ciągłości złożenia, różnicy i ilorazu
funkcji ciągłych wynika, że tak określona funkcja r jest ciągła dla wszystkich h 6= 0. Ponieważ f 0 (x0 ) = v, więc
∆x0 f (h)
lim −v =0
h→0 h
8.3. POCHODNA FUNKCJI ZŁOŻONEJ 183

co oznacza, że r jest również ciągła w zerze. Na odwrót, jeśli funkcja o postulowanych własnościach istnieje, to z jej ciągłości
w zerze wynika, że istnieje granica
∆x0 f (h) hv + hr(h)
lim = lim = v + lim r(h) = v,
h→0 h h→0 h h→0

a tym samym f jest różniczkowalna w x0 .

Twierdzenie 8.3.2 (o pochodnej złożenia funkcji) Niech f : (a, b) → (c, d) będzie funkcją różniczkowalną w
x0 ∈ (a, b), a g : (c, d) → Rm funkcją różniczkowalną w f (x0 ). Wtedy złożenie g ◦ f jest różniczkowalne w x0 oraz

(g ◦ f )0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ).

W konsekwencji, jeśli f i g są różniczkowalne, to złożenie g ◦ f jest różniczkowalne oraz

(g ◦ f )0 = (g 0 ◦ f ) f 0 .

Dowód: Z założenia o różniczkowalności f w x0 i g w f (x0 ) oraz z twierdzenia 8.3.1 wnosimy, że istnieje V otoczenie
zera oraz ciągłe, zerujące się w zerze funkcje ϕ : V → R, ψ : V → Rm takie, że dla h, k ∈ V
∆x0 f (h) = f (x0 + h) − f (x0 ) = f 0 (x0 ) + ϕ(h) h (8.8)


∆f (x0 ) g(k) = g(f (x0 ) + k) − g(f (x0 )) = g (f (x0 )) + ψ(k) k.


0
(8.9)


W szczególności z (8.8) wnosimy, że dla h ∈ V


f (x0 + h) = f (x0 ) + f 0 (x0 ) + ϕ(h) h (8.10)


Ponieważ funkcja h 7→ f 0 (x0 ) + ϕ(h) h jest ciągła i zeruje się w zerze, więc istnieje W otoczenie zera takie, że dla h ∈ W


mamy
f 0 (x0 ) + ϕ(h) h ∈ V.


Zatem wzór (8.9) zachodzi również dla k = f 0 (x0 ) + ϕ(h) h przy h ∈ W . Tak więc dla h ∈ W mamy


  0 
g f (x0 ) + f 0 (x0 ) + ϕ(h) h − g(f (x0 )) = g 0 (f (x0 )) + ψ (f 0 (x0 ) + ϕ(h))h f (x0 ) + ϕ(h) h. (8.11)
 

Wykorzystując (8.10) oraz (8.11) otrzymujemy


  
∆x0 (g ◦ f )(h) = g f (x0 + h) − g(f (x0 )) = g f (x0 ) + f 0 (x0 ) + ϕ(h) h − g(f (x0 ))

  0
= g 0 (f (x0 )) + ψ (f 0 (x0 ) + ϕ(h))h f (x0 ) + ϕ(h) h.


Stąd
∆x0 (g ◦ f )(h)  0  0
= g (f (x0 )) + ψ (f 0 (x0 ) + ϕ(h))h f (x0 ) + ϕ(h) .

h
Ponieważ tak ψ jak i ϕ zmierzają do zera przy h zmierzającym do zera, prawa strona powyższej równości zmierza do
g 0 (f (x0 ))f 0 (x0 ). Zatem również lewa strona jest zbieżna do g 0 (f (x0 ))f 0 (x0 ). Dowodzi to tezy, bo lewa strona to iloraz
różnicowy dla funkcji g ◦ f w x0 . 

Przykład 8.3.3 Policzmy pochodną funkcji x 7→ (x2 +1)3 . Można ją przedstawić jako złożenie funkcji x 7→ u := x2 +1
oraz funkcji u 7→ u3 . Zatem
0
(x2 + 1)3 = (u3 )0u=x2 +1 (x2 + 1)0 = (3u2 )u=x2 +1 (2x) = 3(x2 + 1)2 · 2x = 6x(x2 + 1)2 .
184 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

8.4 Pochodna funkcji wykładniczej i funkcji trygonometrycznych


W rozdziale tym podamy wzory na pochodna˛ funkcji wykładniczej oraz funkcji trygonometrycznych. Wzory te uzyskamy badajac
˛ pochodna˛ funkcji

R 3 t 7→ etz ∈ C (8.12)

dla ustalonej liczby zespolonej z ∈ C. Stosowny wzór podamy dla dowolnego zespolonego z , ale interesować nas b˛eda˛ głównie przypadki gdy z jest liczba˛
˛ liczba˛ urojona˛ i.
rzeczywista˛ badź

8.4.1 Pochodna funkcji wykładniczej


Zauważmy, że iloraz róznicowy dla funkcji (8.12) ma postać

e(t+h)z − etz ehz − 1


= etz ,
h h
ehz −1
wi˛ec interesować nas b˛edzie granica limh→0 h .

Lemat 8.4.1 Funkcja


eu − 1
C \ {0} 3 u 7→ ∈C
u
ma w zerze granicę równą jeden.

Dowód: Przypomnijmy, że zgodnie z definicją 6.1.5 mamy



X un
eu = ,
n=0
n!

skąd

X un
eu − 1 = ,
n=1
n!

u0
bo 0! = 1. Zatem dla dowolnego u ∈ C \ {0} mamy

un un ∞
P∞ P∞
eu − 1 −1 X un−1
−1 = n=0 n!
−1 = n=1 n!
−1 = −1
u u u n=1
n!
∞ ∞ ∞
X un−1 |u|n−1
X X |u|n−2
= ¬ = |u|
n=2
n! n=2
n! n=2
n!

Ponieważ interesuje nas tylko otoczenie zera, możemy założyć, że |u| < 1. Dla takich u dostajemy

eu − 1 X 1
− 1 ¬ |u| ¬ |u|e.
u n=2
n!

Tak więc dla |u| < 1 mamy


eu − 1
0¬ − 1 ¬ |u|e.
u
8.4. POCHODNA FUNKCJI WYKŁADNICZEJ I FUNKCJI TRYGONOMETRYCZNYCH 185

Ponieważ prawa strona tej nierówności zmierza do zera przy u zmiarzającym do zera, z twierdzenia o trzech funkcjach
wnosimy, że
eu − 1
lim − 1 = 0,
u→0 u
co dowodzi tezy. 

Twierdzenie 8.4.2 Niech z ∈ C będzie ustalone. Funkcja

R 3 t 7→ etz ∈ C

jest różniczkowalna, a jej pochodną jest funkcja

R 3 t 7→ zetz ∈ C
Dowód: Dla z = 0 rozważana funkcja jest stale równa jeden, zatem jest różniczkowalna, a jej pochodną jest funkcja stale
równa zero, co jest zgodne z tezą twierdzenia. Załóżmy zatem, że z 6= 0. Pochodną rozważanej funkcji w punkcie t jest
e(t+h)z − etz ehz − 1 ehz − 1
lim = etz lim = zetz lim = zetz ,
h→0 h h→0 h h→0 hz
bo z lematu 8.4.1 wiemy, że
ehz − 1 eu − 1
lim = lim = 1.
h→0 hz u→0 u


Wniosek 8.4.3 (o pochodnej rzeczywistej funkcji wykładniczej) Rzeczywista funkcja wykładnicza

exp : R 3 x 7→ ex ∈ R+

jest różniczkowalna, a jej pochodną jest ona sama, czyli exp0 x = exp x co zwięźle zapisujemy w postaci

(ex )0 = ex .
Dowód: Tezę dostajemy natychmiast z twierdzenia 8.4.2 po podstawieniu za z stałej jeden. 

8.4.2 Pochodna funkcji trygonometrycznych

Twierdzenie 8.4.4 (o pochodnej funkcji trygonometrycznych) Funkcje trygonometryczne: sin, cos, tg, ctg są
różniczkowalne w swojej dziedzinie i zachodzą wzory
1 1
(sin t)0 = cos t, (cos t)0 = − sin t, (tg t)0 = , (ctg t)0 = − .
cos2 t sin2 t
Dowód: Ze wzorów ( 6.15 - 6.16 ) oraz z twierdzenia 8.4.2 dla z = i oraz dla z = −i mamy
0
e − e−it 1 1  eit + e−it
 it
(sin t)0 = = (eit )0 − (e−it )0 = ieit + ie−it = = cos t.

2i 2i 2i 2
Podobnie 0
eit + e−it 1  1 eit − e−it

(cos t) =
0
= (eit )0 + (e−it )0 = ieit − ie−it = − = − sin t.

2 2 2 2i
186 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Z twierdzenia o granicy ilorazu mamy


0
sin t (sin t)0 cos t − sin t(cos t)0 cos t cos t − sin t(− sin t) 1

(tg t) =
0
= = = .
cos t cos2 t cos2 t cos2 t

Podobnie 0
cos t (cos t)0 sin t − cos t(sin t)0 − sin t sin t − cos t(cos t) 1

(ctg t) =
0
= = =− 2 .
sin t sin t
2
sin t
2
sin t


8.5 Nieciągłości pochodnej i funkcje klasy C 1 .


W przykładzie 8.1.4 pokazaliśmy, że funkcja x 7→ |x| nie posiada w zerze pochodnej. Oczywiście poza zerem jest różniczko-
walna. Jej nieróżniczkowalność w zerze bierze się stąd, że pochodne lewostronna i prawostronna, choć istnieją, nie są sobie
równe. Poniższy przykład pokazuje, że nawet pochodne jednostronne mogą w pewnym punkcie nie istnieć.

Przykład 8.5.1 Rozważmy funkcję (


x sin x1 gdy x 6= 0,
R 3 x 7→
0 dla x = 0.
Funkcja ta jest ciągła, a dla x 6= 0 różniczkowalna na podstawie twierdzenia o pochodnej iloczynu, funkcji złożonej i
ilorazu. Dla x = 0 iloraz różnicowy ma postać
h sin h1 1
= sin .
h h
Wiemy, że granica limh→0 sin h1 nie istnieje. Nie istnieją nawet stosowne granice jednostronne. Zatem rozważana funkcja
nie jest różniczkowalna w zerze i nie posiada w zerze pochodnych jednostronnych.

Interesujące jest pytanie, czy jeśli funkcja jest różniczkowalna w każdym punkcie, to jej pochodna musi być funkcją
ciągłą. Okazuje się, że niekoniecznie, jak pokazuje poniższy przykład.

Przykład 8.5.2 Rozważmy funkcję (


x2 sin x1 gdy x 6= 0,
R 3 x 7→
0 dla x = 0.
Funkcja ta jest ciągła, a dla x 6= 0 różniczkowalna na podstawie twierdzenia o pochodnej iloczynu, funkcji złożonej i
ilorazu. Dla x = 0 iloraz różnicowy ma postać

h2 sin h1 1
= h sin .
h h
Granica limh→0 h sin h1 istnieje i wynosi zero. Zatem również w zerze nasza funkcja jest różniczkowalna. Jej pochodną
jest funkcja (
2x sin x1 − cos x1 gdy x =
6 0,
 
R 3 x 7→
0 dla x = 0.
Pokażemy, że pochodna ta nie jest ciągła w zerze. Gdyby była ciągła w zerze, to dla każdego ciągu xn zbieżnego do
zera ciąg wartości byłby zbieżny do pochodnej w zerze, czyli do zera. Ale ciąg xn = 2πn
1
jest zbieżny do zera, a ciąg
wartości pochodnej w punktach tego ciągu wynosi stale −1, więc jest zbieżny do −1, a nie do zera.
8.6. METODA NEWTONA 187

Definicja 8.5.3 Funkcję f : (a, b) → Rm , która jest różniczkowalna i ma ciągłą pochodną nazywamy funkcją klasy
C 1 . Zbiór takich funkcji oznaczamy C 1 ((a, b), Rm ).

Nazwa "klasa C 1 " wyjaśni si˛e później, gdy zdefiniujemy również funkcje klasy C n .
W programie Mathematica pochodną funkcji f zmiennej x obliczamy używając instrukcji

D[f[x],x]

Na przykład pochodną funkcji


1 x2 − 1
 
f (x) := log
4 x2 + 1
obliczymy pisząc

D[(1/4) Log[(x^2 - 1)/(x^2 + 1)], x]

Jako wynik program Mathematica zwraca


2x(x2 −1)
 
x2 + 1 2x

x2 +1 − (x2 +1)2
.
4 (x2 − 1)
Nie jest to czytelna postać pochodnej. Instrukcja Simplify pozwala uzyskać najbardziej zwartą postać wyrażenia. Jako
argumentu można użyć znaku %, który odnosi się do ostatniego wyrażenia obliczonego przez program Mathematica.

Simplify[%]

daje w wyniku
x
.
x4 − 1

8.6 Metoda Newtona


Rozwiazywanie
˛ równań interesowało matematyków już od starożytności. Pierwotnie stosowano głównie metody geometryczne, które pozwalały rozwiazywać˛
równania liniowe i wybrane równania wyższych stopni, głównie kwadratowe. Po raz pierwszy podejście algebraiczne w rozwiazywaniu
˛ równania kwadratowego
zastosowano w VII wieku w Indiach. W XVIw. metod˛e rozwiazywania
˛ równania trzeciego i czwartego stopnia znaleźli włoscy matematycy Niccolo Fontana Tartaglia
i Lodovico Ferrari. Liczne próby ogólnego rowiazania
˛ równań wyższych stopni spełzły na niczym, a na poczatku
˛ XIXw. norwerski matematyk Niels Henrik Abel
udowodnił, że nie da si˛e podać ogólnego algorytmu rozwiazania
˛ równania stopnia wi˛ekszego niż cztery za pomoca˛ skończonej ilości operacji arytmetycznych
+, −, ∗, / oraz pierwiastkowania.
Pozostały zatem metody przybliżone. Wsród nich prym wiedzie wywodzaca ˛ si˛e z prac Izaaka Newtona i nazywana jego imieniem metoda iteracyjna wykorzy-
stujaca
˛ przybliżanie funkcji styczna˛ do wykresu.
Załóżmy, że chcemy rozwiazać
˛ równanie postaci
f (x) = 0,
gdzie f : [a, b] → R jest funkcja˛ różniczkowalna.˛ Rozwiazania
˛ takiego równania nazywane sa˛ również miejscami zerowymi funkcji f . Załóżmy, że dany jest
punkt x0 ∈ [a, b], a y = cx + d jest równaniem prostej stycznej do wykresu f w punkcie x0 . Wiemy, że c, czyli współczynnik kierunkowy tej prostej jest równy
f 0 (x0 ). Ponieważ punkt (x0 , f (x0 )) należy do stycznej, wi˛ec f (x0 ) = f 0 (x0 )x0 + d, skad
˛ wyliczamy d co pozwala przepisać nam równanie stycznej w
postaci
y = f (x0 ) + f 0 (x0 ) (x − x0 ) .
188 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Rysunek 8.3: Interpretacja geometryczna metody Newtona. W oparciu o dane przybliżenie miejsca zerowego xn konstruuje-
my aproksymację liniową funkcji f w punkcie (xn , f (xn ) (styczną do wykresu w punkcie (xn , f (xn )) i bierzemy jako kolejne
przybliżenie

˛ y = 0 i rozwiazuj
Przyjmujac ˛ ac˛ wzgl˛edem x znajdujemy
f (x0 )
x = x0 − .
f 0 (x0 )
Jest to przybliżenie miejsca zerowego funkcji f tym lepsze im bliżej x0 było miejsca zerowego. Dlatego iterujac
˛ ten proces, to znaczy liczac
˛ wyrazy ciagu
˛ danego
rekurencyjnie wzorem
f (xn )
xn+1 := xn −
f 0 (xn )
możemy si˛e spodziewać, że b˛edzie on zbieżny do miejsca zerowego funkcji f w przedziale [a, b]. Nie zawsze tak jest, ale dzieje si˛e tak na tyle cz˛esto, że metoda
Newtona jest do dziś bardzo powszechnie stosowanym narz˛edziem. Interpretacja geometryczna zwiazku ˛ xn i xn+1 z pochodna˛ funkcji f jest przedstawiona na
rys. (8.3).
Program w C++ znajdujacy ˛ miejsca zerowe wielomianu przedstawiono na listingu 8.1 .
W programie Mathematica rozwiazanie˛ równania metoda˛ Newtona umożliwia insturkcja FindRoot. Ponieważ program Mathematica sam potrafi znaleźć
pochodna,˛ jedyne co musimy zrobić to zapisać równanie i podać wartość, od której należy rozpoczać
˛ poszukiwanie pierwiastka. Na przykład piszac ˛

FindRoot[Cos[x] == x^3, {x, 1}]


otrzymujemy jako rozwiazanie
˛

{x -> 0.865474}
Program Mathematica przekształca równanie cos x = x3 do postaci f (x) = 0, gdzie

f (x) := cos x − x3 ,

znajduje pochodna˛ f 0 (x) = − sin x − 3x2 i nast˛epnie liczy wyrazy ciagu


˛ danego wzorem rekurencyjnym

x0 := 1
cos xn − x3n
xn+1 := xn −
− sin xn − 3x2n
8.6. METODA NEWTONA 189

 
/∗ ∗∗∗∗∗∗∗∗∗∗ newton . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P i e r w i a s t e k wielomianu ∗/
/∗ metod a̧ Newtona ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
#include <i o s t r e a m >
using namespace s t d ;
/∗ S t o p i e ń wielomianu ∗/
const i n t d e g r e e =2;
/∗ T a b l i c a wspó ł c z y n n i k ów wielomianu ∗/
double c o e f [ d e g r e e + 1 ] ;
/∗ maksymalna l i c z b a i t e r a c j i ∗/
i n t l i m i t =30;
/∗ o c z e k i w a n a dok ł adno sć ∗/
double e p s i l o n = 0 . 0 0 1 ;
/∗ W y l i c z e n i e warto s c i wielomianu w x ∗/
double f ( double x ) {
double s=c o e f [ d e g r e e ] ;
f o r ( i n t i=d e g r e e −1; i >=0; i −−) s=c o e f [ i ]+x∗ s ;
return s ;
}
/∗ W y l i c z e n i e p o c h o d n e j wielomianu w x ∗/
double d e r f ( double x ) {
double s=d e g r e e ∗ c o e f [ d e g r e e ] ;
f o r ( i n t i=d e g r e e −1; i >=1; i −−) s=i ∗ c o e f [ i ]+x∗ s ;
return s ;
}
/∗ Program g ł ówny ∗/
i n t main ( ) {
/∗ Wczytujemy wspó ł c z y n n i k i wielomianu ∗/
f o r ( i n t i =0; i <d e g r e e +1;++ i ) {
c o u t << "c[" << i << " ]= " ; c i n >> c o e f [ i ] ;
}
/∗ o r a z wyj s c i o w e p r z y b l i ż e n i e p i e r w i a s t k a ∗/
double x ;
c o u t << " x0 =" ; c i n >> x ;
/∗ Pȩ t l a g ł ówna ∗/
f o r ( i n t i =0; i <l i m i t ;++ i ) {
double v a l=f ( x ) ;
c o u t << " x =" << x << "\n" ;
c o u t << " f(x )= " << v a l << "\n" ;
/∗ Je s l i o s i a̧ g n i ȩ t o ż a̧dan a̧ dok ł adno sć moż na przerwa ć p ȩ t l ȩ ∗/
i f ( v a l <e p s i l o n && v a l >−e p s i l o n ) break ;
/∗ Nowe p r z y b l i ż e n i e ∗/
x=x−v a l / d e r f ( x ) ;
}
}
 
Listing 8.1: Wyznaczanie miejsc zerowych wielomianu w C++.
190 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

aż do osiagni˛
˛ ecia przybliżenia granicy o domyślnie ustawionej dokładności.


Ćwiczenie 8.6.1 Pokaż, że zaprezentowana na listingu 2.3 metoda liczenia pierwiastka kwadratowego a jest w istocie metoda˛ Newtona zastosowana˛
do równania
x2 − a = 0.

8.7 Pochodna, a ekstrema lokalne.


8.7.1 Maksima i minima lokalne
Pochodna funkcji przydaje się przy poszukiwaniu lokalnych minimów i maksimów funkcji.

Definicja 8.7.1 Mówimy, że funkcja f : (a, b) → R ma w x0 ∈ (a, b) minimum lokalne jeżeli istnieje otoczenie
U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) ­ f (x0 ). Podobnie mówimy, że f ma w x0 ∈ (a, b)
maksimum lokalne jeżeli istnieje otoczenie U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) ¬ f (x0 ).
Mówimy, że f ma w x0 ∈ (a, b) ekstremum lokalne jeśli f ma w x0 minimum lokalne lub maksimum lokalne.

Twierdzenie 8.7.2 (o ekstremum lokalnym funkcji różniczkowalnej) Jeśli f : (a, b) → R jest różniczkowalna
w x0 ∈ (a, b) i ma w x0 ekstremum lokalne, to f 0 (x0 ) = 0.

Dowód: Załóżmy, że f ma w x0 maksimum lokalne. Zatem istnieje δ > 0 taka, że (x0 −δ, x0 +δ) ⊂ (a, b) oraz f (x) ¬ f (x0 )
dla x ∈ (x0 − δ, x0 + δ). W szczególności dla h ∈ (−δ, δ) mamy f (x0 + h) − f (x0 ) ¬ 0. Zatem dla h ∈ (−δ, 0) jest

f (x0 + h) − f (x0 )
­ 0,
h
skąd wnosimy, że pochodna lewostronna f w x0 jest nieujemna. Z drugiej strony dla h ∈ (0, δ) jest

f (x0 + h) − f (x0 )
¬ 0,
h
skąd wnosimy, że pochodna prawostronna f w x0 jest niedodatnia. Ale pochodna f w x0 istnieje, więc jest równa tak
pochodnej lewostronnej jak i prawostronnej. Zatem f 0 (x0 ) = 0. 

8.7.2 Twierdzenie Rolle’a.


Francuski matematyk Michel Rolle (1652-1719) uważany jest za autora pierwszego w miarę współczesnego dowodu nastę-
pującego twierdzenia.

Twierdzenie 8.7.3 (Rolle’a) Załóżmy, że f : [a, b] → R jest ciągła oraz, że jest różniczkowalna dla x ∈ (a, b). Jeśli
f (a) = f (b) to istnieje ξ ∈ (a, b) takie, że f 0 (ξ) = 0.

Dowód: Funkcja f , jako funkcja ciągła na przedziale zwartym, osiąga wartość największą oraz najmniejszą. Jeśli obie te
wartości są osiągane na końcach przedziału [a, b], to założenie f (a) = f (b) implikuje, że f jest stała, a więc ma pochodną
zero w każdym punkcie przedziału (a, b). Załóżmy zatem, że wartość największa lub wartość najmniejsza jest osiągnięta
w pewnym punkcie ξ ∈ (a, b). Wtedy f ma w ξ ekstremum lokalne, zatem z twierdzenia o ekstremum lokalnym funkcji
różniczkowalnej wynika, że f 0 (ξ) = 0. 
8.8. TWIERDZENIA O WARTOŚCI ŚREDNIEJ 191

f(b)
1.0

f(ξ)

0.8

0.6
f(a)

a ξ b

0.4 0.6 0.8 1.0 1.2 1.4 1.6

Rysunek 8.4: Twierdzenie o wartości średniej graficznie może być zinterpretowane jako istnienie stycznej do wykresu rów-
noległej do zadanej siecznej.

8.8 Twierdzenia o wartości średniej


8.8.1 Uogólnione twierdzenie o wartości średniej
W twierdzeniu Rolle’a sieczna do wykresu poprowadzona przez punkty (a, f (a)) i (b, f (b)) jest pozioma. Styczna do wykresu w punkcie osiagania ˛ ekstremum
˛ przedziału (a, b) taki, że styczna do wykresu w tym punkcie jest równoległa do siecznej
też jest pozioma. Zatem można stwierdzić, że istnieje punkt wewnatrz
przez punkty (a, f (a)) i (b, f (b)). Okazuje si˛e, że to stwierdzenie jest prawdziwe również wtedy gdy f (a) 6= f (b). Fakt ten, znany jako twierdzenie o wartości
średniej, ilustruje rysunek 8.4 . W polskiej literaturze z twierdzeniem tym kojarzony jest francuski matematyk Joseph Louis Lagrange (1736-1813), Udowodnimy
najpierw jeszcze ogólniejsze twierdzenie, pochodzace ˛ od Augustina Cauchy’ego, z którego twierdzenie o wartości średniej wyprowadzimy jako wniosek.

Twierdzenie 8.8.1 (uogólnione o wartości średniej) Niech f, g : [a, b] → R będą ciągłymi funkcjami, różniczko-
walnymi w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że

(f (b) − f (a)) g 0 (ξ) = (g(b) − g(a)) f 0 (ξ).


Dowód: Rozważmy funkcję ϕ : [a, b] → R daną wzorem ϕ(x) := (f (b) − f (a)) g(x) − (g(b) − g(a)) f (x). Funkcja ta jest
ciągła na przedziale [a, b] i różniczkowalna na przedziale (a, b). Co więcej, prostym rachunkiem sprawdzamy, że
ϕ(a) = f (b)g(a) − f (a)g(b) = ϕ(b),
zatem stosując do ϕ twierdzenie Rolle’a znajdziemy punkt ξ ∈ (a, b) taki, że ϕ0 (ξ) = 0. Ale ϕ0 (ξ) = (f (b) − f (a)) g 0 (ξ) −
(g(b) − g(a)) f 0 (ξ). Zatem (f (b) − f (a)) g 0 (ξ) − (g(b) − g(a)) f 0 (ξ) = 0, co dowodzi naszej tezy. 

8.8.2 Twierdzenie Lagrange’a o wartości średniej


Przyjmując w twierdzeniu 8.8.1 za funkcję g identyczność otrzymujemy jako wniosek następujące klasyczne twierdzenie o
wartości średniej.
192 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Wniosek 8.8.2 (Twierdzenie Lagrange’a o wartości średniej) Niech f : [a, b] → R będzie funkcją ciągłą, róż-
niczkowalną w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że

f (b) − f (a) = (b − a) f 0 (ξ).

8.8.3 Twierdzenie o przyrostach skończonych


Twierdzenia o wartości średniej nie dają się przenieść w dosłownej formie na przypadek funkcji o wartościach wektorowych,
na przykład zespolonych, jak pokazuje następujący przykład.
Przykład 8.8.3 Rozważmy funkcję
f : [0, 1] 3 t 7→ e2tπi ∈ C.
Mamy f (0) = f (1) = 1, zatem gdyby twierdzenie o wartości średniej zachodziło, to istniałby punkt ξ ∈ (0, 1) taki, że
f 0 (ξ) = 0. Taki punkt jednak nie istnieje, bo z twierdzenia 8.4.2 wiemy, że pochodną jest f 0 (t) = 2πie2tπi 6= 0.
Mamy jednak pokrewne twierdzenie.

Twierdzenie 8.8.4 (o przyrostach skończonych) Niech f : [a, b] → Rm będzie funkcją ciągłą, różniczkowalną na
(a, b). Wtedy istnieje ξ ∈ (a, b) takie, że

||f (b) − f (a)|| ¬ ||f 0 (ξ)||(b − a).

Dowód: Oznaczmy z := f (b) − f (a). Jeśli z = 0, to teza jest oczywista. Zatem załóżmy, że z 6= 0 i rozważmy funkcję

ϕ : [a, b] 3 t 7→ z · f (t) ∈ R.

Funkcja ϕ jest funkcją o wartościach rzeczywistych, jest ciągła, a na podstawie ćwiczenia 8.2.6 wiemy też, że jest różnicz-
kowalna i ϕ0 (t) = z · f 0 (t). Możemy więc do niej zastosować twierdzenie o wartości średniej. Zatem istnieje ξ ∈ (a, b) takie,
że
ϕ(b) − ϕ(a) = ϕ0 (ξ)(b − a) = (b − a)z · f 0 (ξ).
Z drugiej strony, na mocy twierdzenia 7.3.2 mamy

ϕ(b) − ϕ(a) = z · (f (b) − f (a)) = z · z = ||z||2 .

Zatem z nierówności Schwartza dostajemy

||z||2 = (b − a)z · f 0 (ξ) = |(b − a)z · f 0 (ξ)| ¬ (b − a)||z||||f 0 (ξ)||.

Dzieląc powyższą nierówność obustronnie przez ||z|| otrzymujemy tezę. 

8.9 Zastosowania twierdzenia o wartości średniej


8.9.1 Pochodna, a monotoniczność
Monotoniczność funkcji różniczkowalnej znajduje odwzierciedlenie w znaku jej pochodnej. Dokładniej, mamy następujące
twierdzenie.
8.10. REGUŁA DE L’HOSPITALA 193

Twierdzenie 8.9.1 Niech f : (a, b) → R będzie funkcją różniczkowalną. Mają miejsce następujące równoważności
(i) f 0 ­ 0 wtedy i tylko wtedy gdy f jest słabo rosnąca,
(ii) jeśli f 0 > 0 to f jest silnie rosnąca,

(iii) f 0 ¬ 0 wtedy i tylko wtedy gdy f jest słabo malejąca,


(iv) jeśli f 0 < 0 to f jest silnie malejąca.

Dowód: Załóżmy najpierw, że f 0 ­ 0. Niech x1 , x2 ∈ (a, b) oraz x1 < x2 . Z twierdzenia o wartości średniej wiemy,
że f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ) dla pewnego ξ ∈ (x1 , x2 ). Ale z założenia f 0 (ξ) ­ 0, skąd f (x2 ) − f (x1 ) ­ 0, a to
dowodzi, że f jest słabo rosnąca. Z kolei jeśli f jest słabo rosnąca, to iloraz różnicowy w każdym punkcie przedziału (a, b)
jest nieujemny. Zatem i pochodna jest nieujemna, jako granica ilorazu różnicowego. To dowodzi równoważności (i). Aby
pokazać (ii) załóżmy, że f 0 > 0 oraz x1 < x2 dla pewnych x1 , x2 ∈ (a, b). Podobnie jak poprzednio z twierdzenia o wartości
średniej dostajemy f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ) dla pewnego ξ ∈ (x1 , x2 ). Teraz jednak f 0 (ξ) > 0, skąd f (x2 ) − f (x1 ) > 0,
a to dowodzi, że f jest silnie rosnąca. Dowód (iii) oraz (iv) jest podobny, więc zostawiamy go jako ćwiczenie. 
Zwróćmy uwagę, że w punktach (ii) oraz (iv) twierdzenia 8.9.1 nie ma równoważności. Najprostszym przykładem jest
funkcja potęgowa R 3 x → x2k+1 ∈ R gdzie k ∈ N1 . Łatwo sprawdzić, że jest ona silnie rosnąca, ale jej pochodna w zerze
jest zero.

8.9.2 Twierdzenie o wartościach pośrednich dla pochodnej


Widzieliśmy w przykładzie 8.5.2 , że istnienie pochodnej w każdym punkcie dziedziny funkcji f nie gwarantuje ciągłości
pochodnej. Tym niemniej, pochodna, nawet jeśli jest nieciągła, ma własność przyjmowania wartości pośrednich, podobnie
jak funkcja ciągła.

Twierdzenie 8.9.2 Niech f : (a, b) → R będzie funkcją różniczkowalną. Niech c, d ∈ (a, b) będą takie, że c < d oraz
f 0 (c) < f 0 (d). Wtedy dla każdego λ ∈ (f 0 (c), f 0 (d)) istnieje ξ ∈ (c, d) takie, że f 0 (ξ) = λ.

Dowód: Rozważmy funkcję g : (a, b) → R daną wzorem g(t) := f (t) − λt. Jest ona ciągła, różniczkowalna oraz
g 0 (c) = f 0 (c) − λ < 0 i g 0 (d) = f 0 (d) − λ > 0. Zatem g(c) > g(c + h1 ) dla pewnego h1 ∈ (0, d − c), bo w przeciwnym
razie iloraz różnicowy g(c+h)−g(c)
h >= 0 dla h > 0 co prowadzi do sprzeczności z g 0 (c) < 0. Podobnie stwierdzamy, że
g(d) > g(d − h2 ) dla pewnego h2 ∈ (0, d − c). Na mocy tw. 4.7.3 funkcja g musi osiągać minimum na przedziale [c, d]. Ale
pokazaliśmy, że wartości g na końcach tego przedziału nie mogą realizować minimum. Zatem jest ono osiągnięte w pewnym
punkcie ξ ∈ (c, d) co oznacza, że jest to minimum lokalne. Z tw. 8.7.2 g 0 (ξ) = f 0 (ξ) − λ = 0, skąd f 0 (ξ) = λ. 
Z udowodnionego twierdzenia wynika następujący ważny wniosek.

Wniosek 8.9.3 Niech f : (a, b) → R będzie funkcją różniczkowalną. Jeśli f 0 (x) 6= 0 dla wszystkich x ∈ (a, b), to f 0
przyjmuje wyłącznie wartości dodatnie lub wyłącznie wartości ujemne. 

Ćwiczenie 8.9.4 Wywnioskuj z twierdzenia 8.9.2 , że jeśli f : (a, b) → R jest funkcją różniczkowalną, to f 0 nie
posiada punktów nieciągłości pierwszego rodzaju.

8.10 Reguła de l’Hospitala


Jeśli f : R → R zeruje si˛e w zerze, to
f (x) f (x) − f (0)
=
x x−0
194 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Rysunek 8.5: Guillaume de l’Hospital (1661 - 1704) i Johann Bernoulli (1667 - 1748) Źródło: Wikipedia

może być traktowane jako przybliżenie f 0 (0), oczywiście przy założeniu, że pochodna ta istnieje. Zatem jeśli mamy dwie takie funkcje, f, g : R → R i obie
zeruja˛ si˛e w zerze, to mamy

f (x)
f (x)
= x
g(x)
g(x)
x

f 0 (0) f (0)
Prawa˛ stron˛e tego wyrażenia można traktować jako przybliżenie g 0 (0) . Lewa strona nie jest przybliżeniem g(0) , bo jest to pozbawiony sensu ułamek o zerze
f (x)
w liczniku i mianowniku. Jest to jednak przybliżenie granicy ułamków g(x) przy x zmierzajacym ˛ do zera o ile ta granica istnieje. Zatem, przy odpowiednich
założeniach, możemy si˛e spodziewać wzoru

f (x) f 0 (0)
lim = 0 .
x→0 g(x) g (0)

Udowodnimy teraz nawet nieco ogólniejsze twierdzenie. Z twierdzeniem tym kojarzony jest francuski matematyk Guillaume de l’Hospital (rys. 8.5 ), który pierwszy
je opublikował. Jednak sa˛ argumenty za tym, że autorem twierdzenia jest szwajcarski matematyk Johann Bernoulli (rys. 8.5 ), brat Jacoba Bernoullego (rys. 2.6
). Okazuje si˛e ono bardzo pomocne przy wyznaczaniu granic ilorazów, do których nie możemy zastosować twierdzenia o granicy ilorazu. Przypomnijmy bowiem,
że twierdzenie o granicy ilorazu wymaga, by mianownik miał granic˛e różna˛ od zera.
8.10. REGUŁA DE L’HOSPITALA 195

Twierdzenie 8.10.1 (reguła de l’Hospitala). Rozważmy przedział otwarty (a, b) ⊂ R̄ (dopuszczamy końce nieskoń-
czone). Niech f, g : (a, b) → R będą różniczkowalne oraz g 0 (x) 6= 0 dla x ∈ (a, b). Oznaczmy przez c jeden z końców
przedziału (a, b) oraz załóżmy, że
lim f (x) = 0 = lim g(x) (8.13)
x→c x→c

lub
lim g(x) ∈ {−∞, ∞}. (8.14)
x→c

Jeśli istnieje granica


f 0 (x)
lim (8.15)
x→c g 0 (x)

to istnieje granica
f (x)
lim (8.16)
x→c g(x)
i obie te granice są sobie równe.

Twierdzenie 8.10.1 wyprowadzimy z następującego lematu

Lemat 8.10.2 Przy założeniach twierdzenia 8.10.1 mamy nierówności

f (x) f 0 (x)
lim sup ¬ lim sup 0 (8.17)
x→a g(x) x→a g (x)

oraz
f (x) f 0 (x)
lim inf ­ lim inf 0 (8.18)
x→a g(x) x→a g (x)

Dowód: (twierdzenia 8.10.1 ) Ponieważ granica dolna jest niewiększa od granicy górnej, z (8.17) i (8.18) mamy ciąg
nierówności
f 0 (x) f (x) f (x) f 0 (x)
lim inf 0 ¬ lim inf ¬ lim sup ¬ lim sup 0 . (8.19)
x→c g (x) x→c g(x) x→c g(x) x→c g (x)
W twierdzeniu 8.10.1 zakładamy istnienie granicy (8.15). Zatem stosowna granica dolna i granica górna są sobie równe.
Zatem pierwsze i ostatnie wyrażenie w ciągu nierówności (8.19) są sobie równe. Jest to możliwe tylko wtedy, gdy wszystkie
wyrażenia są sobie równe. W szczególności drugie i trzecie wyrażenie są sobie równe. Wynika stąd istnienie granicy (8.16) i
równość obu granic. 
Dowód: (lematu 8.10.2 ) (*)Dla ustalenia uwagi przyjmijmy, że c = a oraz, że jest to wartość skończona. W pozostałych
przypadkach dowód jest podobny. Rozważmy dowód wzoru (8.17). Oznaczmy

f 0 (x)
A := lim sup .
x→a g 0 (x)

Jeśli A = ∞, to wzór (8.17) oczywiście zachodzi, załóżmy więc, że A < ∞. Wystarczy pokazać, że

f (x)
∀q > A lim sup ¬ q. (8.20)
x→a g(x)

Ustalmy zatem liczbę q > A. Z definicji granicy znajdziemy c ∈ (a, b) takie, że

f 0 (x)
∀ x ∈ (a, c) < q. (8.21)
g 0 (x)
196 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Niech x, y ∈ (a, c) oraz x < y. Zwężenia f|[x,y] i g|[x,y] spełniają założenia uogólonionego twierdzenia o wartości średniej
(tw. 8.8.1 ) zatem znajdziemy ξ ∈ (x, y) takie, że

(f (y) − f (x)) g 0 (ξ) = (g(y) − g(x)) f 0 (ξ).

Wykorzystując założenie o niezerowaniu się pochodnej funkcji g przepisujemy powyższą równość w postaci
f (x) − f (y) f (y) − f (x) f 0 (ξ)
= = 0 .
g(x) − g(y) g(y) − g(x) g (ξ)

Zatem z (8.21) wnosimy, że dla x, y ∈ (a, c)

f (x) − f (y) f (y) − f (x)


= < q. (8.22)
g(x) − g(y) g(y) − g(x)

Rozważmy przypadek założenia (8.13). Przechodząc ze zmienną y w (8.22) do granicy w a dostajemy

f (x)
¬q
g(x)

dla x ∈ (a, c), skąd natychmiast wynika (8.20).


Przypadek (8.14) jest nieco bardziej zagmatwany. Dowód zaprezentujemy przy założeniu limx→a g(x) = ∞. Rozumowanie
dla limx→a g(x) = −∞ jest analogiczne. Zauważmy najpierw, że z limx→a g(x) = ∞ znajdziemy c0 ∈ (a, c) takie, że g(x) > 0
dla x < c0 . Założenie o niezerowaniu się pochodnej funkcji g implikuje, że g jest funkcją monotoniczną, a w konsekwencji,
ze względu na założenie limx→a g(x) = ∞, jest funkcją silnie malejącą. Zatem z przyjętego założenia, że x < y wnosimy, że
g(x) − g(y) > 0. Mnożąc (8.22) przez g(x) − g(y) i przenosząc f (y) na prawą stronę dostajemy

f (x) < f (y) + q (g(x) − g(y)) = qg(x) + f (y) − qg(y).

Dla x ∈ (a, c0 ) mamy g(x) > 0, więc dzieląc ostatnią nierówność przez g(x) dostajemy

f (x) f (y) g(y)


<q+ −q .
g(x) g(x) g(x)

Ze względu na założenie limx→a g(x) = ∞, dla zadanego ε > 0 i przy ustalonym y ∈ (a, c) znajdziemy c00 ∈ (a, c0 ) takie, że
dla x ∈ (a, c00 )
f (y) g(y)
−q < ε.
g(x) g(x)
Zatem z ostatnich dwóch nierówności dla x ∈ (a, c00 ) i dowolnego ε > 0 mamy

f (x)
< q + ε.
g(x)

Ze względu na dowolność ε > 0 dla x ∈ (a, c00 ) mamy

f (x)
¬ q,
g(x)

skąd wnosimy (8.20) również dla przypadku założenia (8.14).


Dowód własności (8.18) jest podobny. Pozostawiamy go jako ćwiczenie. 
Regułę de l’Hospitala zaprezentowaliśmy dla granicy w lewym końcu przedziału. Oczywiście analogiczna reguła obowią-
zuje również dla prawego końca przedziału, a tym samym dla granicy lewostronnej, prawostronnej i zwykłej granicy.
8.11. POCHODNA FUNKCJI ODWROTNEJ 197

Przykład 8.10.3 Granica limx→0 sinx x nie daje się policzyć z twierdzenia o granicy ilorazu, bo mianownik zmierza do
zera. Ponieważ jednak również licznik zmierza do zera oraz tak licznik jak i mianownik są różniczkowalne w otoczeniu
zera, a mianownik ma pochodną stale równą jeden, więc możemy zastosować regułę de l’Hospitala. Dostajemy

sin x (sin x)0 cos x cos 0


lim = lim = lim = = 1.
x→0 x x→0 x0 x→0 1 1

Przykład 8.10.4 Granica


x2 sin x1
lim
x→∞ 2x − 1

prowadzi do symbolu nieoznaczonego ∞·0 ∞ . Ponieważ funkcja w mianowniku zmierza do nieskończoności przy x → ∞,
możemy skorzystać z reguły de l’Hospitala. W tym celu musimy zbadać istnienie granicy

2x sin x1 + x2 cos x1 · (− x12 ) 1 1 1 1 sin 1


   
lim = lim 2x sin + lim cos = lim 2 1 x − 1 .
x→∞ 2 2 x→∞ x x→∞ x 2 x→∞ x

Granica
sin x1
lim 2 1
x→∞
x

też jest symbolem nieoznaczonym, tym razem postaci 00 , więc ponownie stosujemy regułę de l’Hospitala i dostajemy

sin x1 cos x1 · (− x12 ) 1


lim 2 1 = 2 lim = 2 lim cos = 2.
x→∞
x
x→∞ − x12 x→∞ x

Zatem ostatecznie stwierdzamy, że


x2 sin x1 1
lim = .
x→∞ 2x − 1 2

8.11 Pochodna funkcji odwrotnej


8.11.1 Wzór na pochodną funkcji odwrotnej

Twierdzenie 8.11.1 Załóżmy, że f : (a, b) → R jest funkcją różniczkowalną oraz f 0 (x) 6= 0 dla wszystkich x ∈ (a, b).
Wtedy f jest bijekcją przedziału (a, b) w pewien przedział (c, d). Co więcej, bijekcja odwrotna f −1 : (c, d) → (a, b) jest
różniczkowalna oraz
1
(f −1 )0 (f (x)) = 0 (8.23)
f (x)
dla wszystkich x ∈ (a, b).

Dowód: Z wniosku 8.9.3 wnosimy, że f 0 jest wszędzie dodatnia lub wszędzie ujemna, zatem z tw. 8.9.1 funkcja jest silnie
rosnąca lub silnie malejąca. W szczególności jest zatem injekcją. Niech Γ := im f będzie obrazem przedziału (a, b) w funkcji f .
Ponieważ zbiory spójne w R pokrywają się z przedziałami (wn. 3.5.3 ), z tw. 4.9.1 wnosimy, że Γ jest również przedziałem.
Pokażemy, że przedział ten jest otwarty. Rzeczywiście, jeśli d jest lewym lub prawym końcem przedziału Γ i d ∈ Γ, to d
jest elementem największym lub najmniejszym w Γ. Równocześnie d = f (t) dla pewnego t ∈ (a, b). Wybierzmy t0 , t00 ∈ (a, b)
takie, że t0 < t < t00 . Z monotoniczności f mamy f (t0 ) < d < f (t00 ) lub f (t0 ) > d > f (t00 ). Ponieważ f (t0 ), f (t00 ) ∈ Γ,
198 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

wykluczone jest by d było elementem największym lub najmniejszym w Γ. Zatem Γ jest przedziałem otwartym. Przyjmijmy,
że Γ = (c, d).
Ustalmy x ∈ (a, b) oraz połóżmy y := f (x). Wtedy x = f −1 (y). Rozważmy funkcję częściową h : R 9 R określoną
wzorem h := f −1 (y + k) − f −1 (y) dla k ∈ R takich, że y + k ∈ (c, d). Zauważmy, że jest ona w szczególności określona w
otoczeniu zera. Mamy

f −1 (y + k) − f −1 (y) f −1 (y + k) − f −1 (y) h(k) 1


= = = .
k (y + k) − y f (x + h(k)) − f (x) f (x+h(k))−f (x)
h(k)

Z twierdzenia 4.6.16 wiemy, że f −1 jest ciągła co implikuje, że również h jest ciągła i w szczególności limk→∞ h(k) =
h(0) = 0. Zatem przechodząc w powyższej równości z k do granicy w zerze dostajemy

f −1 (y + k) − f −1 (y) 1 1
lim = =
k→∞ k limk→∞ f (x+h(k))−f (x) f 0 (x)
h(k)

co oznacza, że f −1 ma w y = f (x) pochodną i zachodzi równość

1
(f −1 )0 (y) = .
f 0 (x)

Dowodzi to różniczkowalności f −1 oraz równości (8.23). 

8.11.2 Pochodna funkcji logarytmicznej


Stosując twierdzenie 8.11.1 do funkcji wykładniczej dostajemy twierdzenie o pochodnej funkcji logarytmicznej.

Twierdzenie 8.11.2 Funkcja ln : R+ → R jest funkcją różniczkowalną oraz


1
(ln x)0 = . (8.24)
x
Co więcej, różniczkowalna jest też funkcja R \ {0} 3 x 7→ ln |x| ∈ R oraz
1
(ln |x|)0 = . (8.25)
x

Dowód: Z wniosku 8.4.3 wiemy, że pochodną funkcji x → ex jest ona sama. Ponieważ funkcja wykładnicza nie
przyjmuje wartości zero, możemy do niej zastosować twierdzenie 8.11.1 . Funkcją odwrotną do funkcji wykładniczej jest
funkcja logarytmiczna x → ln x, zatem funkcja ta jest różniczkowalna oraz
1 1
(ln)0 (ex ) = = x.
(ex )0 e

Przyjmując y := ex dostajemy zatem


1
(ln y)0 =
y
co pokrywa się ze wzorem (8.24), gdyż w obu wzorach występujące w nich zmienne są związane. Aby pokazać drugą część
twierdzenia wystarczy zauważyć, że (
ln x gdy x > 0,
ln |x| =
ln(−x) gdy x < 0.
8.11. POCHODNA FUNKCJI ODWROTNEJ 199

Zatem różniczkowalność funkcji x 7→ ln |x| oraz wzór (8.25) wynikają wprost z różniczkowalności funkcji ln i wzoru (8.24)
dla x > 0. Natomiast dla x < 0 różniczkowalność jest konsekwencją twierdzenia 8.3.2 , z którego również dostajemy
1 1
(ln(−x))0 = (−1) =
−x x


8.11.3 Pochodna funkcji potęgowej i wykładniczej o dowolnej dodatniej podstawie.


Wiemy już, że dla n ∈ N1 mamy (xn )0 = nxn−1 . Wzór ten uogólnić można na przypadek funkcji x → xα dla dowolnego
α ∈ R.
Twierdzenie 8.11.3 Dla dowolnego α ∈ R funkcja potęgowa

R+ 3 x 7→ xα ∈ R+

jest różniczkowalna oraz


(xα )0 = αxα−1 .

Dowód: Ponieważ xα = eα ln x , więc funkcja x 7→ xα jest złożeniem funkcji x 7→ α ln x oraz funkcji u 7→ eu . Zatem z
twierdzenia o pochodnej złożenia funkcji mamy
α α
(xα )0 = eα ln x = xα = αxα−1 .
x x

Mamy też następujące twierdzenie o pochodnej funkcji wykładniczej.

Twierdzenie 8.11.4 Dla dowolnego a ∈ R+ funkcja wykładnicza

R 3 x 7→ ax ∈ R+

jest różniczkowalna oraz


(ax )0 = ax ln a.

Dowód: Ponieważ z definicji ax = ex ln a , więc funkcja x 7→ ax jest złożeniem funkcji x 7→ x ln a oraz funkcji u 7→ eu .
Zatem z twierdzenia o pochodnej złożenia funkcji mamy

(ax )0 = ex ln a ln a = ax ln a.

8.11.4 Funkcje kołowe (odwrotne do trygonometrycznych)


Funkcje sin, cos i tg nie są bijekcjami, więc nie mają funkcji odwrotnych. Jednak po zawężeniu do odpowiednio małego
przedziału stają się bijekcjami. Zwyczajowo rozważamy zawężenia sin|[−π/2,π/2] , cos|[0,π] , tg|(−π/2,π/2) . Pochodne tych funkcji
na wnętrzach tych przedziałów są niezerowe, zatem zawężenia do wnętrz są odwracalne. Łatwo pokazać, że w konsekwencji
odwracalne są również zawężenia do przedziałów domkniętych.

Definicja 8.11.5 Funkcje odwrotne do funkcji sin|[−π/2,π/2] , cos|[0,π] , tg|(−π/2,π/2) oznaczamy odpowiednio arc sin,
arc cos i arc tg. Nazywamy je funkcjami kołowymi lub cyklometrycznymi.
200 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Jako prosty wniosek z tw. 8.11.1 dostajemy następujące twierdzenie

Twierdzenie 8.11.6 Funkcja arc sin : [−1, 1] → [−π/2, π/2] jest różniczkowalna dla x ∈ (−1, 1) oraz
1
(arc sin x)0 = √ .
1 − x2
Funkcja arc cos : [−1, 1] → [0, π] jest różniczkowalna dla x ∈ (−1, 1) oraz
1
(arc cos x)0 = − √ .
1 − x2
Funkcja arc tg : R → (−π/2, π/2) jest różniczkowalna dla x ∈ R oraz
1
(arc tg x)0 = .
1 + x2
Dowód: Niech y = sin x. Wtedy x = arc sin y i z tw. 8.11.1 mamy
1 1 1 1
(arc sin y)0 = (sin−1 )0 (sin x) = = =p =p .
(sin x)0 cos x 1 − sin x
2 1 − y2

Podobnie dla y = cos x mamy x = arc cos y oraz


1 1 1 1
(arc cos y)0 = (cos−1 )0 (cos x) = = = −√ = −p .
(cos x)0 − sin x 1 − cos x
2 1 − y2

Z kolei dla y = tg x mamy x = arc tg y oraz


1 1 1 1 1
(arc tg y)0 = (tg−1 )0 (tg x) = = = cos2 x = = = .
(tg x)0 1
cos2 x
cos2 x+sin2 x
cos2 x
1 + tg x
2 1 + y2


Funkcje kołowe w programie Mathematica oznaczane są ArcSin, ArcCos, ArcTan.

8.12 Różniczka funkcji


8.12.1 Aproksymacja liniowa
Interpretacja pochodnej jako współczynnika kierunkowego nachylenia stycznej w danym punkcie do wykresu nie jest jedyna˛ użyteczna˛ intuicja˛ w tym kontekście.
Poj˛ecie pochodnej wiaże
˛ si˛e również z idea˛ przybliżania funkcji funkcja˛ liniowa.˛

Definicja 8.12.1 Funkcja liniowa R → Rd jednej zmiennej to funkcja postaci

R 3 t 7→ tv ∈ Rd

dla ustalonego v ∈ Rd . Wektor v (liczbę w przypadku d = 1) nazywać będziemy współczynnikiem funkcji liniowej
jednej zmiennej.

Funkcję taką oznaczać będziemy Lv , lub krótko L, jeśli współczynnik v jest nieistotny. Łatwo sprawdzić, że funkcja liniowa
jest ciągła i w zerze ma wartość zero.
8.12. RÓŻNICZKA FUNKCJI 201

Rysunek 8.6: Aproksymacja liniowa funkcji f w punkcie (x0 , f (x0 )) w lokalnym układzie współrzędnych (x̄, ȳ).

Uwaga 8.12.2 Jeśli L : R → Rm jest funkcją liniową, to L = Lv dla v = L(1). Innymi słowy wartość funkcji liniowej
dla argumentu jeden jest równa jej współczynnikowi. 

Funkcja liniowa daje si˛e bardzo prosto wyliczać, wi˛ec jest dobrym kandydatem na przybliżanie (lokalne) innych funkcji. Idea jest nast˛epujaca.˛ Wiemy, że
pewna funkcja f ma w punkcie x0 wartość y0 := f (x0 ). Interesuje nas wartość funkcji f w punkcie x1 bliskm x0 , czyli y1 := f (x1 ). Czy dysponujac ˛
przyrostem zmiennej x, czyli róznica˛ x1 − x0 , możemy przy pomocy pewnej funkcji liniowej wyliczyć przybliżenie przyrostu zmiennej y , czyli różnic˛e y1 − y0 =
f (x1 ) − f (x0 )? Podkreślmy, że chodzi nam o funkcj˛e liniowa˛ w układzie współrz˛ednych przesuni˛etym do punktu (x0 , y0 ), a wi˛ec w układzie (x̄, ȳ), gdzie
x̄ := x − x0 , ȳ := y − y0 , zwanym lokalnym układem współrz˛ednych wzgl˛edem punktu (x0 , y0 ). Zwróćmy uwag˛e, że punkt o współrz˛ednych (x0 , y0 ) w
lokalnym układzie współrz˛ednych ma współrz˛edne (0, 0). Nasze pytanie można wi˛ec sformułować nast˛epujaco ˛ (rys. 8.6 ):
Czy istnieje funkcja liniowa L w lokalnym układzie współrz˛ednych (x̄, ȳ), taka że

y − y0 ≈ ȳ = L(x̄) = L(x − x0 )?

Zwróćmy uwag˛e, że to pytanie należy uściślić. Jeśli przybliżenie rozumieć b˛edziemy jako wymóg, by w granicy, przy x → x0 , popełniony bład,
˛ czyli wyrażenie

y − y0 − L(x − x0 ) = f (x) − f (x0 ) − L(x − x0 )


zmierzało do zera, to wymóg ten spełni każda funkcja liniowa, bo jako ciagła
˛ ma w zerze granic˛e równa˛ wartości, czyli zero. Naturalne jest jednak oczekiwanie, że
im bliżej znajdziemy si˛e x0 , tym przybliżenie b˛edzie lepsze.
˛ wzgl˛edem przyrostu x̄ = x − x0 mierzony ilorazem
Miara˛ jakości przybliżenia jest bład
y − y0 − L(x − x0 ) f (x0 + x̄) − f (x0 ) − L(x̄)
= .
x − x0 x̄
˛ zmierzał do zera przy x̄ → 0. Niech L = Lv . Przy użyciu bardziej tradycyjnego oznaczenia h w miejsce x̄, nasz wymóg można zapisać
Chcemy, by ten bład
jako
f (x0 + h) − f (x0 ) − hv
lim = 0,
h→0 h
co jak łatwo sprawdzić, sprowadza si˛e do żadania,
˛ by
f (x0 + h) − f (x0 )
lim = v.
h→0 h
202 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Rysunek 8.7: Przykład funkcji płaskiej w zerze. Coraz mniejsze wartości ε w definicji o(x) wyznaczają coraz węższe stożki
wokół osi x. Płaskość funkcji objawia się tym, że jakkolwiek wąski jest stożek, wykres funkcji wpada w ten stożek po
zawężeniu do stosownie małego otocznia zera.

Tak wi˛ec, jeśli stosowne przybliżenie liniowe istnieje, to współczynnik v jest pochodna˛ funkcji w punkcie x0 .
Czasami wygodnie jest patrzeć na problem sprowadzony do zera. Jak widzieliśmy wygodnie jest przesunać ˛ układ współrz˛ednych tak, by interesujacy
˛ nas
punkt był w poczatku ˛ układu. Wygodnie jest też sprowadzić definiowania pochodnej do definiowania pochodnej równej zero. Z naszych wcześniejszych rozważań
wynika, że pochodna równa zero oznacza, że przybliżajaca ˛ funkcja liniowa ma współczynnik v równy zero. Funkcja liniowa z R do R o współczynniku zero ma
wykres b˛edacy˛ linia˛ pozioma˛ przechodzac ˛ a˛ przez poczatek
˛ układu współrz˛ednych. Z drugiej strony, jeśli pochodna wynosi zero, to mamy

f (x0 + h) − f (x0 )
lim = 0.
h→0 h

Zwrócmy uwag˛e, że funkcja,˛ której granic˛e tu rozważamy jest ϕ : h 7→ f (x0 + h) − f (x0 ), gdzie x0 traktujemy jako parametr. Przy tych oznaczeniach mamy

ϕ(h)
lim = 0.
h→0 h

Z definicji granicy wiemy, że wtedy dla dowolnego ε > 0 istnieje δ > 0 taka, że dla |h| < δ mamy

ϕ(h)

h

lub równoważnie
|ϕ(h)| < ε|h|.
Funkcj˛e o tej własności nazywamy płaska˛ w zerze. Poj˛ecie to wyjaśnia rysunek 8.7 .
Używajac˛ j˛ezyka funkcji płaskich w zerze możemy powiedzieć, że f 0 (x) = a wtedy i tylko wtedy gdy funkcja

h 7→ f (x + h) − f (x) − ah

jest płaska w zerze. Jest tak, bo dla h = 0 mamy


f (x + 0) − f (x) − a · 0 = 0,
a, jak niebawem b˛edziemy w stanie policzyć formlnie, pochodna tej funkcji w zerze wynosi f 0 (x) − a.
8.12. RÓŻNICZKA FUNKCJI 203

8.12.2 Relacja "o małe"


Aby sformalizować opisane w poprzednim podrozdziale intuicje zaczniemy od podania definicji relacji "o małe", która przyda
się nie tylko w podaniu formalnej definicji płaskości w zerze, ale również w następnych rozdziałach.
Rozważmy f : (a, b) → Rm i g : (a, b) → R. Załóżmy ponadto, że istnieje V otoczenie x0 takie, że g(x) 6= 0 dla
x ∈ V \ {x0 }. Stawiamy definicję ogólną, ale warto zaznaczyć, że na początku interesować nas będzie głównie przypadek
szczególny gdy g jest funkcją identycznościową, t.j. gdy g(x) = x.

Definicja 8.12.3 Mówimy, że funkcja f jest o małe od funkcji g w otoczeniu punktu x0 i piszemy

f (x) = o(g(x)) przy x → x0 ,

jeżeli
∀ε > 0 ∃δ > 0 |x − x0 | < δ ⇒ ||f (x)|| ¬ ε|g(x)|. (8.26)

Następującą uwagę wynika wprost z definicji granicy.

Uwaga 8.12.4 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy

||f (x)||
f (x0 ) = 0 i lim = 0. (8.27)
x→x0 |g(x)|


Dowód: Załóżmy najpierw, że funkcja f jest o małe od funkcji g i ustalmy ε > 0. Dobierając z (8.26) stosowne δ > 0
wnosimy, że ||f (x0 )|| < ε|g(x0 )|. Ponieważ zachodzi to dla dowolnego ε > 0, dostajemy f (x0 ) = 0. Drugą część warunku
(8.27) dostajemy wprost z (8.26) i definicji granicy. Na odwrót, jeśli (8.27) zachodzi, to własność (8.26) dla x 6= x0 dostajemy
wprost z drugiej części warunku (8.27), a dla x = x0 z f (x0 ) = 0. 
Z uwagi tej łatwo wyprowadzić następujący wniosek

Wniosek 8.12.5 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy istnieje funkcja ϕ : V → Rm
ciągła w x0 i taka, że ϕ(x0 ) = 0 oraz f (x) = ϕ(x)g(x) dla x ∈ V .

Dowód: Wystarczy przyjąć (


f (x)
dla x 6= x0 ,
ϕ(x) := g(x)
0 dla x = x0 .

Z kolei z twierdzenia o granicy sumy i różnicy natychmiast dostajemy następujący wniosek.

Wniosek 8.12.6 Jeśli istnieje V otoczenie x0 takie, że g(x) 6= 0 dla x ∈ V \ {x0 } oraz funkcje fi : R 9 R spełniają
fi (x) = o(g(x)) przy x → x0 to również (f1 + f2 )(x) = o(g(x)) i (f1 − f2 )(x) = o(g(x)) przy x → x0 

8.12.3 Płaskość w zerze


Podamy teraz formalną definicję płaskości funkcji w zerze. Niech f : (a, b) → Rm będzie funkcją o wartościach w Rm ,
określoną na przedziale otwartym (a, b) ⊂ R takim, że 0 ∈ (a, b).

Definicja 8.12.7 Mówimy, że f jest płaska w zerze jeżeli f (x) = o(x) przy x → 0.

Następująca uwaga wynika wprost z uwagi 8.12.4 .


204 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Uwaga 8.12.8 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy f (0) = 0 oraz

f (x)
lim = 0.
x→0 x

Jeśli f jest płaska w zerze, to funkcja ϕ : (a, b) → Rm zdefiniowana wzorem


(
f (x)
gdy x 6= 0,
ϕ(x) := x
0 dla x = 0.

jest ciągła w zerze oraz f (x) = xϕ(x). Łatwo sprawdzić, że również na odwrót, jeśli funkcja ϕ o takich własnościach istnieje,
to f jest płaska w zerze. Mamy zatem następującą uwagę.

Uwaga 8.12.9 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy istnieje funkcja ϕ : (a, b) → Rm ciągła w zerze
taka, że ϕ(0) = 0 oraz f (x) = xϕ(x) dla x ∈ (a, b). 

8.12.4 Różniczkowalność
Wróćmy teraz do idei przybliżania przyrostu funkcji funkcja˛ liniowa.˛ Przypomnijmy, że tradycyjne oznaczenia na przyrost wartości argumentu i przyrost wartości
funkcji (różnice) w punkcie x0 to:

∆x := x − x0 ,
∆y := f (x) − f (x0 ).

Niech L = Lf 0 (x0 ) b˛edzie funkcja˛ liniowa˛ przybliżajac


˛ a˛ w loklanym układzie współrz˛ednych przyrost funkcji f . Wtedy

∆y ≈ L(∆x) = f 0 (x0 )∆x, (8.28)

przy czym popełniony bład ˛ wzgl˛edny jest tym mniejszy im mniejsze jest ∆x. Jak już wspomnieliśmy, gdy powstawał rachunek różniczkowy nie dysponowano
poj˛eciem granicy. Leibniz mówił, że jeśli ∆x jest nieskończenie małe, to przybliżona równość (8.28) staje si˛e równościa.˛ Takie nieskończenie małe różnice ∆x
i ∆y nazywał różniczkami (malusieńkimi różnicami) i oznaczał dy i dx. Używajac ˛ jego j˛ezyka napisalibyśmy, że różniczki dx i dy spełniaja˛ równanie

dy = f 0 (x)dx. (8.29)

Problem w tym, że różniczki jako wielkości nieskończenie małe trudno jest precyzyjnie zdefiniować. Poj˛ecie różniczki odczarował A. Cauchy, traktujac ˛ równanie
(8.29) jako równanie odwzorowania liniowego przybliżajacego ˛ przyrost funkcji, a sama˛ różniczk˛e definiujac
˛ jako to przybliżajace
˛ odwzorowanie liniowe. I tak do
dziś rozumiemy różniczk˛e. Natomiast termin różniczkowalność, ze wzgl˛edu na bezpośredni zwiazek ˛ pomi˛edzy różniczka˛ i pochodna,˛ jest odnoszony zarówno do
istnienia pochodnej jak i różniczki, bo, jak zobaczymy, sa˛ to fakty równoważne.
Jak poprzednio, niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm .
Przypomnijmy, że przyrost funkcji f w punkcie x0 ∈ (a, b), t.j. funkcję ∆x0 f : (a − x0 , b − x0 ) → Rm definiujemy wzorem

∆x0 f (h) := f (x0 + h) − f (x0 ).

Wprowadzimy teraz inną definicję różniczkowalności funkcji, jednak równoważną podanej wcześniej definicji 8.1.1 co
zobaczymy dowodząc uwagę 8.12.11 .

Definicja 8.12.10 Funkcję f nazywamy różniczkowalną w punkcie x0 jeżeli istnieje funkcja liniowa L : R → Rm taka,
że funkcja ∆x0 f − L, czyli różnica funkcji ∆x0 f i funkcji L jest płaska w zerze. Odwzorowanie L nazywamy wtedy
różniczką funkcji f w punkcie x0 i oznaczamy dx0 f .
8.13. POCHODNE WYŻSZYCH RZĘDÓW 205

Aby powyższa definicja miała sens, musimy wiedzieć, że różniczka jest wyznaczona jednoznacznie. W istocie różniczka
jest wyznaczona przez pochodną, jak pokazuje następujące rozumowanie. Jeśli L jest różniczką fukcji f w punkcie x0 to z
płaskości w zerze funkcji ∆x0 f − L wnosimy, że
∆x0 f (h) − L(h)
lim = 0.
h→0 h
Ponieważ L(h) = L(1)h, jest to równoważne warunkowi
∆x0 f (h)
lim − L(1) = 0
h→0 h
oraz warunkowi
∆x0 f (h)
lim
= L(1).
h h→0

Ponieważ ∆x0 f (h) = f (x0 + h) − f (x0 ), powyższa granica pokrywa się z granicą (8.1). Pokazaliśmy zatem następującą
uwagę.

Uwaga 8.12.11 Funkcja liniowa L : R → Rm jest różniczką funkcji f w punkcie x0 wtedy i tylko wtedy gdy L(1) jest
pochodną tej funkcji w punkcie x0 . W szczególności f jest różniczkowalna w puncie x0 wtedy i tylko wtedy gdy f ma
pochodną w punkcie x0 . 

Tak więc, jeśli odwzorowanie liniowe L spełniające wymogi definicji 8.12.10 istnieje, to współczynnik L(1), a zatem i
samo odwzorowanie L są wyznaczone jednoznacznie.
Z uwagi 8.12.11 wynika, że stwierdzenia "f jest różniczkowalna" i "f ma pochodna"˛ moga˛ być używane zamiennie. Jednak poj˛ecia różniczki i pochodnej nie
sa˛ tożsame, choć sa˛ ściśle powiazane:
˛ wartość różniczki dla argumentu jeden jest pochodna.˛ Różniczka jest odwzorowaniem liniowym, które przemnaża argument
przez pochodna.˛ Koncepcja różniczki bazuje na aproksymacji liniowej funkcji w punkcie. Koncepcja pochodnej bazuje na stycznej do wykresu funkcji w punkcie.
Zwiazek
˛ mi˛edzy różniczka,˛ a pochodna˛ można wi˛ec też wyrazić stwierdzajac, ˛ że wykres aproksymacji liniowej funkcji f w zadanym punkcie jest prosta,˛ która
pokrywa si˛e ze styczna˛ do wykresu funkcji f w tym punkcie.
Rozważmy funkcję częściową f : R 9 Rm określoną w otoczeniu zera. Innymi słowy nie zakładamy, że dom f = R,
a jedynie, że dom f zawiera przedział otwarty (a, b) taki, że 0 ∈ (a, b). Zauważmy, że jeśli funkcja f jest płaska w zerze,
to ma pochodną w zerze równą zero. Rzeczywiście, na mocy uwagi 8.12.8 jeśli f jest płaska w zerze, to f (0) = 0 oraz
limx→0 f (x)
x = 0. Tę ostanią granicę można przepisać jako

f (x) f (0 + h) − f (0)
0 = lim = lim
x→0 x h→0 h
co oznacza, że f ma w zerze pochodną zero. Łatwo zauważyć, że można przeprowadzić również odwrotne wnioskowanie.
Prowadzi to do następującej uwagi.

Uwaga 8.12.12 Niech f : R 9 Rm będzie funkcją określoną w otoczeniu zera. Funkcja f jest płaska w zerze wtedy i
tylko wtedy gdy f (0) = 0 i f 0 (0) = 0. 

8.13 Pochodne wyższych rzędów


8.13.1 n-ta pochodna
Jeśli pochodna f 0 funkcji f sama ma pochodną, to nazywamy ją drugą pochodną funkcji f i oznaczamy f 00 . Proces brania
kolejnych pochodnych możemy kontynuować. Precyzyjniej, definicję różniczkowalności i pochodnej rozszerzamy rekurencyjnie
w następujący sposób.
206 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Definicja 8.13.1 Mówimy, że funkcja f : (a, b) → Rm jest 1-różniczkowalna jeśli jest różniczkowalna. Jej pochodną
f 0 nazywamy pierwszą pochodną i zapisujemy jako f (1) . Mówimy, że funkcja f jest n-różniczkowalna jeśli jej (n − 1)-sza
pochodna f (n−1) jest różniczkowalna. Pochodną f (n−1) nazywamy n-tą pochodną funkcji f i zapisujemy jako f (n) .

Dla małych n zamiast f (n) piszemy czasem f 00 , f 000 itd. Dodatkowo wygodnie jest samą funkcję nazywać zerową pochodną
i zapisywać jako f (0) := f .
Z twierdzenia 8.2.1 o pochodnej sumy i różnicy oraz wniosku 8.2.3 o pochodnej iloczynu funkcji przez stałą natychmiast
otrzymujemy następujący wniosek.

Wniosek 8.13.2 Niech f, g : (a, b) → Rm będą n-różniczkowalne w punkcie x0 ∈ (a, b), a c ∈ R stałą. Wtedy funkcje
f + g, f − g oraz cf są n-różniczkowalne w x0 oraz

(f + g)(n) (x0 ) = f (n) (x0 ) + g (n) (x0 ), (f − g)(n) (x0 ) = f (n) (x0 ) − g (n) (x0 ) i (cf )(n) (x0 ) = cf (n) (x0 ).

Definicja 8.13.3 Mówimy, że funkcja f : (a, b) → Rm jest klasy C n jeżeli jest n-różniczkowalna we wszystkich
punktach przedziału (a, b) oraz f (n) jest ciągła. Zbiór takich funkcji oznaczamy C n ((a, b), Rm ).

W programie Mathematica n-tą pochodną funkcji f zmiennej x obliczamy używając instrukcji


D[f[x],{x,n}]
Na przykład drugą pochodną funkcji
1 x2 − 1
 
f (x) := ln
4 x2 + 1
obliczymy pisząc
D[(1/4) Log[(x^2 - 1)/(x^2 + 1)], {x,2}]
Jako wynik program Mathematica zwraca skomplikowane wyrażenie, ale po zastosowaniu do niego Simplify dostajemy
−3x4 − 1
2.
(x4 − 1)

Aproksymacja liniowa poprzez różniczk˛e jest prosta, ale cz˛esto nie jest wystarczajaco
˛ dokładna. Możemy wtedy rozważać aproksymacj˛e krzywa˛ drugiego
stopnia (parabola)˛ zadana˛ wzorem y = a0 + a1 h + a2 h2 gdzie h = x − x0 jest przyrostem zmiennej niezależnej (rys. 8.8 ). Możemy też przybliżać
wielomianem n-ego stopnia postaci
W (h) := a0 + a1 h + a2 h2 + . . . + an hn .
Różnica
r(h) := f (x) − W (h) = f (x0 + h) − a0 + a1 h + a2 h2 + . . . + an hn


powinna być o(hn ), bo oczekujemy bł˛edu, który szybciej zmierza do zera niż wielomian aproksymacyjny. Pokażemy, że jeśli funkcja r jest n-różniczkowalna w
zerze, to własność r(h) = o(hn ) jest równoważna zerowaniu si˛e pochodnych r do n-tej włacznie,
˛ tzn. warunkowi

r(0) = r0 (0) = r00 (0) = . . . = r(n) (0) = 0.

W odniesieniu do naszego problemu aproksymacyjnego oznacza to, że funkcja

r : h 7→ f (x0 + h) − W (h)
8.13. POCHODNE WYŻSZYCH RZĘDÓW 207

Rysunek 8.8: Wykres funkcji f (niebieski), prostej stycznej do wykresu f w punkcie x0 (fioletowy) i paraboli stycznej do
wykresu w punkcie x0 (zielony).

powinna mieć zerowe pochodne w zerze do n-tej włacznie


˛ co jest równoważne postulatowi by funkcje h 7→ f (x0 + h) i h 7→ W (h) miały te same
pochodne do n-tej włacznie.
˛ Jak zobaczymy pochodne wielomianu jest stosunkowo łatwo policzyć: W (i) (0) = i!ai . Zatem tyle musza˛ wynosić pochodne
funkcji h 7→ f (x0 + h) w zerze. Sa˛ one równe pochodnym x 7→ f (x) w x0 , zatem poszukiwana aproksymacja ma postać

f 0 (x0 ) f 00 (x0 ) 2 f (n) (x0 ) n


f (x0 + h) = f (x0 ) + h+ h + ... + h + r(h)
1! 2! n!

gdzie r(h) = o(hn ). Otrzymany w ten sposób wielomian aproksymacyjny nazywany jest wielomianem Taylora funkcji f w x0 , bo pochodzi od angielskiego
matematyka Brooka Taylora (rys. 8.9 ).

Twierdzenie 8.13.4 Wielomian

W : R 3 h 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R. (8.30)

jest funkcją i-różniczkowalną dla wszystkich i ∈ N oraz

W (k) (0) = k!ak (8.31)

gdzie przyjmujemy ak = 0 dla k > n.

Dowód: Pokażemy indukcyjnie, że dla k ∈ N zachodzi ogólniejszy wzór

n
X i!
W (k) (x) = ai xi−k (8.32)
(i − k)!
i=k

gdzie, aby uniknąć rozpisywania przypadków, tylko na użytek tego wzoru, przyjmujemy konwencję, że 00 := 1. Rzeczywiście,
dla k = 0 wzór (8.32) pokrywa się z definicją (8.30) wielomianiu W . Natomiast jeśli (8.32) zachodzi dla pewnego k, to W (k)
208 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Rysunek 8.9: Brook Taylor, 1685-1731. Źródło: Wikipedia

jest funkcją różniczkowalną jako suma funkcji potęgowych. Zatem biorąc pochodną obu stron dostajemy

n
!0 n
 0 i! i!
0
X X
W (k+1)
(x) = W (k)
(x) = k!ak + ai xi−k = (k!ak ) + (ai xi−k )0
(i − k)! (i − k)!
i=k+1 i=k+1
n n
X i! X i!
= (i − k)ai xi−k−1 = ai xi−(k+1) .
(i − k)! (i − (k + 1))!
i=k+1 i=k+1

Podstawiając we wzorze (8.32) za x zero dostajemy (8.31). 

8.13.2 Wielomian Taylora


Niech f : (a, b) → R będzie n-różniczkowalna w x0 ∈ (a, b).

Definicja 8.13.5 Wielomianem Taylora funkcji f w punkcie x0 stopnia n nazywamy wielomian

f 0 (x0 ) f 00 (x0 ) 2 f (n) (x0 ) n


Txn0 f : R 3 h 7→ f (x0 ) + h+ h + ... + h ∈ R.
1! 2! n!

Z twierdzenia 8.13.4 łatwo wyprowadzamy następujący wniosek.

Wniosek 8.13.6 Funkcja f i jej wielomian Taylora Txn0 f mają takie same pochodne do n-tej włącznie odpowiednio w
zerze i w x0 , tzn. dla i = 0, 1, 2, . . . n zachodzi
(i)
Txn0 f (0) = f (i) (x0 ).


8.14. WZORY TAYLORA I SZEREG TAYLORA. 209

8.13.3 n-płaskość w zerze.


Uogólnieniem pojęcia płaskości w zerze jest n-płaskość w zerze.

Definicja 8.13.7 Mówimy, że funkcja r : R 9 R określona w otoczeniu zera jest n-płaska w zerze, jeżeli r(h) = o(hn )
przy h → 0.

Lemat 8.13.8 Jeśli W : R → R jest wielomianem stopnia co najwyżej n oraz

W (h)
lim =0 (8.33)
h→0 hn
to W = 0.

Dowód: Dowód poprowadzimy indukcyjnie względem n. Rozważmy najpierw przypadek n = 0. Wtedy W (h) = a0 jest
wtedy funkcją stałą. Z (8.33) mamy
W (h)
0 = lim = lim a0 = a0 ,
h→0 h0 h→0

skąd W = 0.
Przyjmijmy z kolei, że lemat jest spełniony dla m < n i rozważmy wielomian

W : R 3 h 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R

spełniający (8.33). Mamy


W (h) n W (h)
a0 = lim W (h) = lim h = lim lim hn = 0.
h→0 h→0 hn h→0 hn h→0

Zatem W (h) = a1 h + a2 h2 + . . . + an hn = hW1 (h), gdzie W1 (h) := a1 + a2 h + . . . + an hn−1 . Ale W1 jest wielomianem
stopnia co najwyżej (n − 1) oraz
W1 (h) hW1 (h) W (h)
lim n−1 = lim n
= lim = 0,
h→0 h h→0 h h→0 hn

zatem z założenia inducyjnego W1 = 0, skąd W = 0. 

8.14 Wzory Taylora i szereg Taylora.


8.14.1 Wzór Taylora z resztą Peano.
Przedstawimy teraz dwa, powiązane ze sobą twierdzenia. Pierwsze uogólnia uwagę 8.12.12 na przypadek n-płaskości w
zerze. Drugie precyzuje jak wielomian Talora funkcji n-różniczkowalnej przybliża samą funkcję. Pochodzą one od włoskiego
matematyka Giuseppe Peano (rys. 8.10 ).

Twierdzenie 8.14.1 (Peano o funkcji n-płaskiej) Niech r : R 9 R będzie funkcją n-różniczkowalną w zerze.
Funkcja ta jest n-płaska w zerze wtedy i tylko wtedy gdy

r(i) (0) = 0 dla i = 0, 1, 2, . . . n. (8.34)


210 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Rysunek 8.10: Joseph Louis Lagrange (1736 - 1813) i Giuseppe Peano (1858 - 1932). Źródło: Wikipedia

Twierdzenie 8.14.2 (wzór Taylora z resztą Peano) Niech f : (a, b) → R będzie funkcją (n − 1)-różniczkowalną
na przedziale (a, b) oraz n-różniczkowalną w x0 ∈ (a, b). Wtedy istnieje dokładnie jeden wielomian W : R → R stopnia
co najwyżej n taki, że dla h ∈ (a − x0 , b − x0 )

f (x0 + h) = W (h) + r(h)

dla pewnej n-płaskiej w zerze funkcji r : R 9 R. Co więcej, wielomianem tym jest Txn0 f , czyli wielomian Taylora
funkcji f w x0 stopnia n. W szczególności h 7→ f (x0 + h) − Txn0 f (h) jest funkcją n-płaską w zerze.

Dowód: (twierdzenia 8.14.1 i twierdzenia 8.14.2 ) (*)Najpierw pokażemy indukcyjnie, że warunek (8.34)
implikuje n-płaskość w zerze funkcji r. Dla n = 1 wynika to wprost z uwagi 8.12.12 . Załóżmy, że implikacja zachodzi dla
m < n oraz warunek (8.34) jest spełniony. Ponieważ r(0) = 0, z uwagi 8.12.4 wnosimy, że wystarczy pokazać, iż

r(h)
lim = 0. (8.35)
h→0 hn
Z założenia (8.34) dostajemy (r0 )(i) (0) = 0 dla i = 0, 1, 2, . . . n − 1, a zatem z założenia indukcyjnego zastosowanego do
funkcji r0 wnosimy, że r0 (h) = o(hn−1 ) przy h → 0. Zatem również z uwagi 8.12.4 wynika, iż

r0 (h)
lim = 0,
h→0 hn−1

a stąd, przy wykorzystaniu reguły de l’Hospitala


r(h) r0 (h) 1 r0 (h)
lim n
= lim n−1
= lim n−1 = 0,
h→0 h h→0 nh n h→0 h
co dowodzi (8.35).
Rozważmy z kolei funkcję f spełniającą założenia twierdzenia 8.14.2 oraz związaną z nią funkcję g : h 7→ f (x0 + h).
Z twierdzenia o pochodnej złożenia dostajemy g 0 (h) = f 0 (x0 + h), bo pochodna funkcji wewnętrzej h 7→ x0 + h wynosi
jeden. Kontynuując indukcyjnie dostajemy g (i) (h) = f (i) (x0 + h) dla i = 0, 1, 2, . . . n. Niech r(h) := f (x0 + h) − Txn0 f (h). Z
wniosku 8.13.2 i wniosku 8.13.6 dostajemy dla i = 0, 1, 2, . . . n

r(i) (0) = f (i) (x0 ) + Txn0 f 0 (0) = f (i) (x0 ) − f (i) (x0 ) = 0.
8.14. WZORY TAYLORA I SZEREG TAYLORA. 211

Zatem na mocy już udowodnionej części twierdzenia 8.14.1 funkcja r jest n-płaska w zerze. Dowodzi to, że za postulowany
w twierdzeniu 8.14.2 wielomian W można wziąć wielomian Taylora Txn0 f . W szczególności zatem taki wielomian W istnieje,
choć nie możemy jeszcze twierdzić, że jest wyznaczony jednoznacznie.
Aby pokazać jednoznaczność załóżmy, że istnieją wielomiany W1 i W2 stopnia co najwyżej n oraz n-płaskie w zerze
funkcje r1 i r2 takie, że
f (x0 + h) = Wi (h) + ri (h) przy h → 0.
W szczególności
W1 (h) + r1 (h) = W2 (h) + r2 (h).
Wielomian W (h) := W1 (h) − W2 (h) spełnia zatem W (h) = r2 (h) − r1 (h). Z wniosku 8.12.6 wynika, że W (h) = o(hn ) przy
h → 0. W szczególności z uwagi 8.12.4 wnosimy, że
W (h)
lim = 0,
h→0 hn
a więc lemat 8.13.8 implikuje, że W = 0.
Pozostaje jeszcze uzupełnić dowód twierdzenia 8.14.1 . Niech r : R 9 R będzie funkcją n-różniczkowalną i n-płaską w
zerze. Z udowodnionej już części twierdzenia 8.14.2 wiemy, że h 7→ r(h) − T0n r(h) jest funkcją n-płaską w zerze. Zatem z
wniosku 8.12.6 wnosimy, że wielomian T0n r = r − (r − T0n r) jest n-płaska w zerze. Z uwagi 8.12.4 dostajemy zatem

T0n r(h)
lim =0
h→0 |h|n

co pozwala wywnioskować z lematu 8.13.8 , że T0n r = 0. Zatem pokazaliśmy, że r = r − T0n r. Z wniosku 8.13.6 wiemy,
że funkcja r i jej wielomian Taylora T0n r mają te same pochodne do n-tej włącznie. Ale T0n r = 0, więc również wszystkie
pochodne T0n r się zerują i w efekcie zachodzi (8.34). 

8.14.2 Wzór Taylora z resztą Lagrange’a


˛ jest przypadek, gdy funkcja f : (a, b) → R jest n-różniczkowalna dla każdego n ∈ N. Wtedy możemy zbudować wielomian Taylora
Szczególnie interesujacy
Txn0 f dowolnie wysokiego stopnia. Kolejne wielomiany Taylora tworza˛ wi˛ec sumy cz˛eściowe szeregu

X f (i) (x0 )
hi . (8.36)
i=0
i!

Naturalne jest zatem pytanie czy i kiedy ten szereg jest zbieżny do f (x0 + h). W tym celu trzeba zbadać kiedy
n
X f (i) (x0 )
rn (h) := f (x0 + h) − hi = f (x0 + h) − Txn0 f (h),
i=0
i!

zwane n-ta˛ reszta,˛ zmierza do zera przy n zmierzajacym


˛ do nieskończoności. W pierwszej chwili może si˛e wydawać, że wzór Taylor z reszta˛ Peano pozwoli
odpowiedzieć na to pytanie, bo ze wzoru tego wiemy, że

rn (h) = f (x0 + h) − Txn0 f (h) = o(hn ) przy h → 0,

zatem na podstawie wniosku 8.12.5


rn (h) = f (x0 + h) − Txn0 f (h) = ϕ(h)hn (8.37)
dla pewnej ciagłej ˛ si˛e w zerze funkcji ϕ. Ponieważ dla |h| < 1 wyrażenie h zmierza do zera przy n zmierzajacym
˛ i zerujacej n
˛ do nieskończoności, może si˛e
wydawać, że dowodzi to iż n-ta reszta rn (h) zmierza do zera. Problem w tym, że funkcja ϕ we wzorze (8.37) zależy od n, zatem wzór ten powinien być
zapisany jako
rn (h) = f (x0 + h) − Txn0 f (h) = ϕn (h)hn .
212 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

Widać teraz, że chociaż hn zmierza do zera przy n daż


˛ acym
˛ do nieskończoności, to o granicy limn→∞ ϕn (h) nic nie potrafimy powiedzieć i nasze rozumowanie
si˛e rozsypuje. Aby je uratować musimy coś wi˛ecej wiedzieć o reszcie rn (h).
Niech f : (c, d) → R będzie funcją (n + 1)-różniczkowalną. Ustalmy a, b ∈ (c, d) takie, że a < b.
Zaczniemy od lematu, który uogólnia twierdzenie Rolle’a (tw. 8.7.3 ).

Lemat 8.14.3 Jeśli f jest n-płaska w a oraz f (b) = 0 to dla każdego i = 1, 2, . . . , n + 1 istnieje ξi ∈ (a, b) takie, że
f (i) (ξi ) = 0.

Dowód: Z twierdzenia Peano o funkcji płaskiej wnosimy, że f (i) (a) = 0 dla i = 1, 2, . . . n. Dowód poprowadzimy
indukcyjnie względem n. Dla n = 0 lemat wynika wprost z twierdzenia Rolle’a (tw. 8.7.3 ). Załóżmy zatem, że twierdzenie
zachodzi dla m ¬ n. Stosując je dla m = n otrzymujemy istnienie potrzebnych ξi dla i = 1, 2, . . . , n. W szczególności
f (n) (ξn ) = 0. Ponieważ również f (n) (a) = 0, więc stosując twierdzenie Rolle’a do f (n) na przedziale [a, ξn ] znajdziemy
0
ξn+1 ∈ (a, ξn ) takie, że f (n) (ξn+1 ) = 0. Zatem f (n+1) (ξn+1 ) = 0. 
Uogólnimy teraz twierdzenie o wartości średniej.

Twierdzenie 8.14.4 Jeśli f jest n-płaska w a to istnieje ξ ∈ (a, b) takie, że

f (n+1) (ξ)
f (b) = (b − a)n+1 .
(n + 1)!
f (b)
Dowód: Połóżmy M := (b−a)n+1 i rozważmy funkcję g : t 7→ f (t) − M (t − a)n+1 . Prostym rachunkiem sprawdzamy,
że g(a) = g(b) = 0 oraz g (a) = 0 dla i = 1, 2, . . . n. Zatem z twierdzenia Peano o funkcji płaskiej g spełnia założenia
(i)

lematu 8.14.3 . Istnieje więc ξ ∈ (a, b) takie, że g (n+1) (ξ) = 0. Ale g (n+1) (t) = f (n+1) (t) − (n + 1)!M , więc f (n+1) (ξ) =
(n + 1)!M , skąd wynika teza. 
Jesteśmy teraz gotowi podać wzór Taylora ze zmodyfikowaną resztą, zwaną resztą Lagrange’a. Twierdzenie to pochodzi
od francuskiego matematyka włoskiego pochodzenia, J.L. Lagrange’a (rys. 8.10 ).

Twierdzenie 8.14.5 (wzór Taylora z resztą Lagrange’a) Niech f : (c, d) → R będzie funkcją n+1-różniczkowalną.
Niech a, b ∈ (c, d) spełniają a < b. Wtedy istnieje ξ ∈ (a, b) takie, że

f (n+1) (ξ)
f (b) = Tan f (b − a) + (b − a)n+1 . (8.38)
(n + 1)!

Przyjmując oznaczenie h := b − a oraz rozpisując wielomian Taylora możemy też powyższą tezę zapisać jako

f 0 (a) f 00 (a) 2 f (n) (a) n f (n+1) (ξ) n+1


f (a + h) = f (a) + h+ h + ... + h + h .
1! 2! n! (n + 1)!

Dowód: Rozważmy funkcję r : x 7→ f (x) − Tan f (x − a). Funkcja ta jest n-płaska w a, bo jej pochodne w a do n-tej
włącznie się zerują. Zatem z twierdzenia 8.14.4 istnieje ξ ∈ (a, b) takie, że

r(n+1) (ξ)
r(b) = (b − a)n+1 .
(n + 1)!

Ale r(n+1) (x) = f (n+1) (x), bo (n + 1)-sza pochodna wielomianu stopnia co najwyżej n zeruje się, Zatem

f (n+1) (ξ)
(b − a)n+1 = r(b) = f (b) − Tan f (b − a),
(n + 1)!
skąd wynika (8.38). 
8.14. WZORY TAYLORA I SZEREG TAYLORA. 213

f(x0+h) Δx0 f (h)


2

f(x0) f ' (x0) h


1

-2 -1 1 2 3 4

x0 x0+h

-1

Rysunek 8.11: Wykres funkcji f (niebieski), prostej stycznej do wykresu f w punkcie x0 (pomarańczowy). Na prawo od
x0 wykres jest ponad styczną, a na lewo jest pod styczną. Gdy wykres funkcji jest pod styczną po jednej stronie, a ponad
styczną po drugiej stronie punktu x0 , w którym poprowadzono styczną, mówimy, że f ma w x0 punkt przegięcia. Wykres
nad styczną objawia się nierównością ∆x0 f (h) > f 0 (x0 )h, a wykres pod styczną nierównością przeciwną. W przypadku, gdy
po obu stronach x0 wykres jest nad styczną, mówimy, że funkcja jest wypukła w x0 . W przypadku, gdy po obu stronach
x0 wykres jest pod styczną, mówimy, że funkcja jest wklęsła w x0 . Punkt przegięcia to punkt, w którym funkcja zmienia
się z wypukłej na wklęsłą lub odwrotnie. Określenie wypukła i wklęsła dobrane jest umownie i niektórzy autorzy stosują je
odwrotnie.

W programie Mathematica n-ty wielomian Taylora funkcji f w punkcie u wyliczony dla argumentu (x − u) uzyskamy
instrukcją

Series[f[x],{x,u,n}]

Na przykład pisząc

Series[Exp[x], {x, 0, 6}]

otrzymujemy
x2 x3 x4 x5 x6 7
1+x+ + + + + + O [x]
2 6 24 120 720
7
Wyrażenie O [x] jest tutaj niezbyt fortunnym, choć dającym się wytłumaczyć, sposobem zapisania reszty Lagrange’a.
214 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.

8.14.3 Punkty przegięcia


Do zdefiniowania punktu przegięcia funkcji przyda nam się funkcja pomocnicza sgn : R → {−1, 0, 1}, która liczbie rzeczywi-
stej x ∈ R przypisuje jej znak dany wzorem 
−1 gdy x < 0,

sgn x := 0 gdy x = 0,
1 gdy x > 0.

Zauważmy, że funkcja ta ma własność


sgn(x · y) = sgn x · sgn y (8.39)
dla dowolnych x, y ∈ R.

Definicja 8.14.6 Mówimy, że funkcja f : (a, b) → R ma punkt przegięcia w x0 ∈ (a, b) jeżeli f jest różniczkowalna w
x0 oraz istnieje δ > 0 taka, że dla 0 < |h| < δ funkcja

h 7→ sgn [∆x0 f (h) − f 0 (x0 )h] sgn h

jest stała i różna od zera, to znaczy stale równa jeden lub stale równa minus jeden.

Aby zinterpretować wzór w definicji punktu przegięcia rozważmy układ współrzędnych z początkiem przesuniętym do
punktu (x0 , f (x0 )) (rys. 8.11 ). Jest to równoważne przyjęciu założenia, że x0 = 0 = f (x0 ). Wtedy ∆x0 f (h) = f (h), znak
wyrażenia f (h) − f 0 (x0 )h rozstrzyga czy wykres f jest nad czy pod styczną do wykresu w zerze, a stałość iloczynu znaków
h i f (h) − f 0 (x0 )h oznacza, że jeśli f (h) jest nad styczną dla h > 0, to jest pod styczną dla h < 0 i na odwrót, jeśli f (h) jest
pod styczną dla h > 0, to jest nad styczną dla h < 0. A więc wykres przegina się względem stycznej.

Twierdzenie 8.14.7 Niech f : (a, b) → R będzie klasy C n dla n ­ 2 oraz niech f (i) (x0 ) = 0 dla i = 1, 2, . . . n − 1
i f (n) (x0 ) 6= 0. Jeśli n jest parzyste, to f ma w x0 maksimum lokalne gdy f (n) (x0 ) < 0 bądź minimum lokalne gdy
f (n) (x0 ) > 0. Natomiast jeśli n jest nieparzyste, to f ma w x0 punkt przegięcia.

Dowód: Ponieważ f jest klasy C n , więc f (n) jest funkcją ciągłą, zatem w pewnym otoczeniu punktu x0 ma stały znak.
Wybierzmy δ > 0 tak, by sgn f (n) (x) było stale równe a ∈ {−1, 1} gdy 0 < |x − x0 | < δ i rozważmy h ∈ R takie, że
0 < |h| < δ. Ze wzoru Taylora z resztą Lagrange’a dostajemy

f (n) (x0 + θh) n


∆x0 f (h) = f (x0 + h) − f (x0 ) = h ,
n!
dla pewnego θ ∈ (0, 1). Zatem ze wzoru (8.39), uwzględniając, że sgn n!
1
= 1, dostajemy

sgn ∆x0 f (h) = a(sgn h)n .

Przy parzystej wartości n prawa strona powyższej równości ma wartość a dla h 6= 0 oraz zero dla h = 0. Dla a = 1 wnosimy
stąd, że lewa strona jest zawsze nieujemna, czyli ∆x0 f (h) ­ 0. W efekcie otrzymujemy f (x0 + h) ­ f (x0 ) gdy |h| < δ co
oznacza, że przy a = 1, czyli gdy f (n) (x0 ) > 0, funkcja f ma w x0 minimum lokalne. Gdy a = −1, czyli gdy f (n) (x0 ) < 0,
rozumując analogicznie, wnosimy, że funkcja f ma w x0 maksimum lokalne. Natomiast przy n nieparzystym n + 1 jest
parzyste, więc, pamiętając, że z założenia f 0 (x0 ) = 0, dostajemy

sgn [∆x0 f (h) − f 0 (x0 )h] sgn h = sgn [∆x0 f (h)] sgn h = a(sgn h)n+1 = a,

skąd wnosimy, że f ma w x0 punkt przegięcia. 


8.14. WZORY TAYLORA I SZEREG TAYLORA. 215

8.14.4 Szereg Taylora


Dysponujemy teraz narzędziami do badania zbieżności szeregu (8.36). Zacznijmy od formalnej definicji.

Definicja 8.14.8 Mówimy, że funkcja f : (a, b) → R jest klasy C ∞ jeżeli jest klasy C n dla każdego n ∈ N.

Definicja 8.14.9 Niech f : (a, b) → R będzie funkcją klasy C ∞ i niech x0 ∈ (a, b). Szereg formalny (bez pytania o
zbieżność)

X f (i) (x0 ) i
h
i=0
i!

nazywamy szeregiem Taylora funkcji f w punkcie x0 dla argumentu h i oznaczamy Tx0 f (h).

Przykład 8.14.10 Pochodną rzeczywistej funkcji wykładniczej exp : R 3 x → ex ∈ R jest ona sama. Zatem wszystkie
jej pochodne są jej równe. W szczególności funkcja wykładnicza jest klasy C ∞ oraz exp(n) (0) = exp(0) = 1. Zatem
łatwo sprawdzamy, że szeregiem Taylora rzeczywistej funkcji wykładniczej w zerze jest

X 1 i
h,
i=0
i!

a więc ten sam szereg, który posłużył nam do zdefiniowania funkcji wykładniczej. O szeregu tym wiemy, że jest zbieżny
do exp(h).

Wzór Taylora z resztą Lagrange’a podpowiada nam jak zagwarantować zbieżność szeregu Taylora.

Twierdzenie 8.14.11 Niech f : (a, b) → R będzie klasy C ∞ i niech x0 ∈ (a, b). Jeżeli istnieją stałe ε > 0 oraz M > 0
takie, że dla wszystkich n ∈ N oraz x ∈ (x0 − ε, x0 + ε) zachodzi |f (n) (x)| ¬ M to dla |h| < ε szereg Taylora Tx0 f (h)
jest zbieżny do f (x0 + h), co możemy też zapisać w postaci

X f (i) (x0 )
f (x0 + h) = hi .
i=0
i!

Dowód: Ustalmy h ∈ R takie, że |h| < ε i niech sn := Txn0 f (h) oraz rn := f (x0 + h) − sn . Ze wzoru Taylora z resztą
Lagrange’a (tw. 8.14.5 ) dla pewnego ξ ∈ (a, b) mamy

f (n+1) (ξ) n+1 M


|rn | = h ¬ |h|n+1 .
(n + 1)! (n + 1)!

Na mocy uwagi 6.1.2 prawa strona powyższej nierówności zmierza do zera przy n dążącym do nieskończoności. Zatem
limn→∞ rn = 0, skąd limn→∞ sn = f (x0 + h). 
Jeśli założenia powyższego twierdzenia nie są spełnione, nie oznacza to, że teza nie zachodzi. Uzasadnienie zbieżności
wymaga jednak oddzielnego rozumowania, tak jak w poniższym przykładzie.
216 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
Przykład 8.14.12 Skonstruujemy szereg Taylora funkcji ln w otoczeniu jedynki. Indukcyjnie sprawdzamy, że dla
n­1
(n − 1)!
ln(n) (x) = (−1)n−1 . (8.40)
xn
Zatem ln(n) (1) = (−1)n (n − 1)!. Stąd szereg Taylora dla funkcji ln w punkcie jeden ma postać.
∞ ∞
X (−1)i−1 (i − 1)! X (−1)i−1
(T1 ln)(h) = ln 1 + hi = hi .
i=1
i! i=1
i

Wypisanie szeregu oczywiście nie oznacza jego zbieżności. Ze wzoru (8.40) wnosimy, że nie da się oszacować | ln(n) (x)|
w otoczeniu jedynki niezależnie od n, bo z uwagi 6.1.2 wynika, że limn→∞ (n−1)!
xn = ∞. Zatem nie da się zastosować
twierdzenia 8.14.11 . Jednak poradzimy sobie inaczej. Ze wzoru Taylora z resztą Lagrange’a mamy dla h ∈ (0, 1) i
pewnego ξ ∈ (1, 1 + h)
n
X (−1)i−1 i (−1)n 1
ln(1 + h) − h = hn+1 ¬ .
i=1
i (n + 1)ξ n+1 n+1
Ponieważ prawa strona otrzymanej nierówności zmierza do zera przy n zmierzającym do nieskończoności otrzymujemy
n
X (−1)i−1
lim ln(1 + h) − hi = 0
n→∞
i=1
i

Zatem dla h ∈ (0, 1) szereg T1 ln(h) jest zbieżny oraz

h h2 h3
ln(1 + h) = − + − ....
1 2 3
Można pokazać, że zbieżność ma miejsce również dla h ∈ (−1, 0), ale dowód tego faktu pomijamy.
Rozdział 9

Całka oznaczona

9.1 Całka Riemanna funkcji jednej zmiennej


9.1.1 Pole obszaru.
Gdy potrzebujemy pokryć pewien obszar (na przykład plac lub podłog˛e łazienki) kwadratowymi płytkami o boku jednostkowej długości (na przykład 10cm), musimy
umieć policzyć ile płytek do tego celu potrzebujemy. Zakładajac, ˛ o bokach długości m, n ∈ N łatwo stwierdzamy, że potrzebujemy
˛ że obszar ma kształt prostokata
mn płytek. Jeśli boki prostokata ˛ nie sa˛ liczbami całkowitymi lub obszar ma kształt inny niż prostokatny,
˛ sprawa robi si˛e bardziej skommplikowana, bo bez ci˛ecia
płytek sobie nie poradzimy. Zawsze jednak możemy zapytać ile maksymalnie płytek daje si˛e ułożyć w granicach obszaru tak, by nie zachodziły one na siebie, a
także ile minimalnie potrzeba płytek, by pokryć cały obszar (rys. 9.1 ). Te dwie liczby stanowia˛ oszacowanie od dołu i od góry tego co intuicyjnie określamy jako
powierzchni˛e obszaru. Lepsze przybliżenia powierzchni dostaniemy posługujac ˛ si˛e płytkami o mniejszym boku. Kontynuujac˛ proces szacowania powierzchni
przy użyciu płytek o coraz krótszych bokach otrzymujemy dwa ciagi ˛ szacujace
˛ powierzchni˛e obszaru: jeden rosnacy˛ i szacujacy˛ powierzchni˛e od dołu, drugi
malejacy
˛ i szacujacy ˛ powierzchni˛e od góry. Wiemy, że takie ciagi,˛ jako monotoniczne i ograniczone, maja˛ granice. Intuicja podpowiada nam, że oba te ciagi˛ maja˛
t˛e sama˛ granic˛e i jest nia˛ pole powierzchni rozważanego obszaru. Intuicja jest tu zawodna, bo można podać przykład zbiorów, dla których granice te sa˛ różne, co
oznacza, że intuicyjne poj˛ecie powierzchni obszaru nie zawsze ma sens.
Do zagadnień zwiazanych
˛ z definicja˛ pola powierzchni podzbioru R2 (ogólniej miary podzbioru Rd ) jeszcze wrócimy, a na razie ograniczymy si˛e do szcze-
gólnego przypadku obszaru postaci
{ (x, y) ∈ R2 | a ¬ x ¬ b, 0 ¬ y ¬ f (x) },
gdzie a < b sa˛ liczbami rzeczywistymi, a f : [a, b] → R∗ jest pewna˛ funkcja.˛ Pole powierzchni takiego obszaru można oszacować dzielac
˛ przedział [a, b]
na mniejsze przedziały i sumujac
˛ pola prostokatów
˛ zbudowanych nad tymi przedziałami tak, by mieściły si˛e pod wykresem funkcji lub by pokrywały obszar.
Otrzymujemy w ten sposób odpowiednio przybliżenie pola powierzchini od dołu lub od góry (rys. 9.2 ).

9.1.2 Przedziały w R i ich podziały.


W niniejszym rozdziale rozważać będziemy przedziały zwarte w R, a więc przedziały postaci [a, b], gdzie a, b ∈ R i a < b. Zbiór
takich przedziałów oznaczać będziemy Przedz(R). Liczby a oraz b nazywamy końcami przedziału [a, b]. Długością przedziału
I = [a, b] ∈ Przedz(R) nazywamy liczbę b − a. Jest to liczba dodatnia, którą oznaczać będziemy len I. Przypomnijmy, że
wnętrzem przedziału [a, b] nazywamy przedział otwarty (a, b).
Mówimy, że dwa przedziały I, J ∈ Przedz(R) są rozgraniczone jeżeli mają rozłączne wnętrza. Skończony zbiór przedziałów
P ⊂S Przedz(R) nazywamy podziałem przedziału I ∈ Przedz(R), jeżeli dowolne dwa różne elementy P są rozgraniczone oraz
I = P. Średnicą podziału P nazywamy liczbę

δ(P) := max { len P | P ∈ P }. (9.1)

Zbiór wszystkich podziałów przedziału I oznaczać będziemy Podz(I).

217
218 ROZDZIAŁ 9. CAŁKA OZNACZONA

Rysunek 9.1: Przybliżanie pola figury poprzez zliczanie kwadratów wpisanych w figurę i pokrywających figurę w sieci
kwadratowej na płaszczyźnie.

Rysunek 9.2: Po lewej obszar pod wykresem funkcji. Po prawej aproksymacja pola powierzchni tego obszaru od dołu sumą
pól prostokątów zawartych w obszarze oraz aproksymacja od góry sumą pól prostokątów pokrywających obszar.
9.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ 219

Niech x : { 0, 1, 2, . . . n } → [a, b] będzie silnie rosnącym, skończonym ciągiem takim, że x0 = a i xn = b. Łatwo sprawdzić,
że wtedy rodzina
P x := { [xi−1 , xi ] | i = 1, 2, . . . n }
jest podziałem przedziału [a, b], zwanym podziałem zadanym ciągiem x.
Łatwo zauważyć, że każdy podział P ∈ Podz(I) przedziału I = [a, b] ∈ Przedz(R) jest zadany pewnym ciągiem x :
{ 0, 1, 2, . . . n } → [a, b]. W istocie ciąg x zadający podział P otrzymamy biorąc zbiór końców przedziałów w P ustawiony w
ciąg rosnący. Ciąg ten nazywać będziemy ciągiem zadającym podział P i oznaczać xP .
Zatem podziały przedziału I = [a, b] ∈ Przedz(R) możemy utożsamiać ze skończonymi, silnie rosnącymi ciągami liczb
rozpoczynającymi się od liczby a i kończącymi się na liczbie b.
Następująca uwaga jest oczywista.
Uwaga 9.1.1 Jeśli P jest podziałem przedziału I, to
X
len I = len P.
P ∈P

Definicja 9.1.2 Niech P 1 , P 2 ∈ Podz(I) będą podziałami przedziału I ∈ Przedz(R). Mówimy, że podział P 2 jest
podpodziałem podziału P 1 i piszemy P 2 @ P 1 jeżeli dla każdego przedziału P2 ∈ P 2 istnieje przedział P1 ∈ P 1 taki,
że P2 ⊂ P1 .

Łatwo zaobserwować, że podział P 2 ∈ Podz(I) jest podpodziałem podziału P 1 ∈ Podz(I) wtedy i tylko wtedy gdy ciąg
zadający podział P 1 jest podciągiem ciągu zadającego podział P 2 .

Uwaga 9.1.3 Niech P 1 , P 2 będą dwoma dowolnymi podziałami przedziału I ∈ Przedz(R). Istnieje podział P 3 prze-
działu I taki, że P 3 @ P 1 i P 3 @ P 2 .
Dowód: Jako podział P 3 wystarczy wziąć podział zadany przez zbiór końców przedziałów w P 1 ∪ P 2 posortowany w
ciąg rosnący. 

9.1.3 Całkowalność w sensie Riemanna


Niech I = [a, b] ∈ Przedz(R) będzie ustalonym przedziałem, a f : [a, b] → R niech będzie funkcją ograniczoną. Dla podzbioru
P ⊂ [a, b] przyjmujemy oznaczenia
m(f, P ) := inf { f (x) | x ∈ P },
M (f, P ) := sup { f (x) | x ∈ P }.
Zwróćmy uwagę, że ograniczoność funkcji f gwarantuje iż liczby m(f, P ) i M (f, P ) są dobrze określone.

Definicja 9.1.4 Niech P będzie podziałem przedziału [a, b]. Wyrażenia


X
L(f, P) := m(f, P ) len P,
P ∈P
X
U (f, P) := M (f, P ) len P
P ∈P

nazywamy odpowiednio dolną i górną sumą Darboux dla funkcji f i podziału P.


220 ROZDZIAŁ 9. CAŁKA OZNACZONA

Wprost z definicji sumy dolnej i górnej dostajemy następującą uwagę.

Uwaga 9.1.5 Dla dowolnego P ∈ Podz([a, b]) mamy

L(f, P) ¬ U (f, P).

Łatwo zauważyć, że jeżeli x : { 0, 1, 2, . . . n } → [a, b] jest ciągiem zadającym podział P, to mamy


n
X
L(f, P) = m(f, [xi−1 , xi ])(xi − xi−1 ),
i=1
Xn
U (f, P) = M (f, [xi−1 , xi ])(xi − xi−1 ).
i=1

Jeśli funkcja f ma wartości nieujemne, to iloczyny m(f, [xi−1 , xi ])(xi − xi−1 ) i M (f, [xi−1 , xi ])(xi − xi−1 ) odpowiadaja˛ polu prostokatów
˛ o
podstawie [xi−1 , xi ] i wysokości równej odpowiednio kresowi dolnemu i kresowi górnemu funkcji f na przedziale [xi−1 , xi ]. Zatem suma dolna Darboux i
suma górna Darboux daja˛ odpowiednio przybliżenie od dołu i od góry pola pod wykresem funkcji f .

Definicja 9.1.6 Wyrażenia

L(f ) := sup { L(f, P) | P ∈ Podz([a, b]) },


U (f ) := inf { U (f, P) | P ∈ Podz([a, b]) }.

nazywamy odpowiednio całką dolną i całką górną funkcji f . Jeżeli L(f ) = U (f ), to funkcję f nazywamy całkowalną w
R lub krótko całkowalną. W takim przypadku liczbę L(f ) = U (f ) nazywamy całką Riemanna funkcji
sensie Riemanna
f i oznaczamy f . Zbiór funkcji ograniczonych f : [a, b] → R, które są całkowalne w sensie Riemanna oznaczamy
Riem([a, b]).

Przykład 9.1.7 Najprostszym przykładem funkcji całkowalnej w sensie Riemanna jest funkcja stała c[a,b] . Rzeczy-
wiście, dla dowolnego przedziału P ⊂ [a, b] mamy m(c[a,b] , P ) = M (c[a,b] , P ) = c, zatem dla dowolnego podziału
P ∈ Podz([a, b]) jest X X
L(c[a,b] , P) = U (c[a,b] , P) = c len P = c len P = c(b − a).
P ∈P P ∈P

Zatem L(c[a,b] ) = U (c[a,b] ) = c(b − a) i w konsekwencji

c[a,b] = c(b − a). (9.2)


R

Przykład 9.1.8 Rozważmy funkcję Dirichleta


(
0 x ∈ Q,
fD : [0, 1] 3 x 7→
1 x 6∈ Q.

Jeśli P ⊂ [0, 1] jest przedziałem o niepustym wnętrzu, to m(fD , P ) = 0 i M (fD , P ) = 1. Stąd dla dowolnego P ∈
Podz([0, 1]) mamy L(fD , P) = 0 i U (fD , P) = 1. W konsekwencji L(fD ) = 0 6= 1 = U (fD ). Zatem funkcja Dirichleta
nie jest całkowalna w sensie Riemanna.
9.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ 221

Ćwiczenie 9.1.9 Udowodnij wprost z definicji, że funkcja


(
1 gdy x ∈ { n1 | n ∈ N1 },
f : [0, 1] 3 x 7→
0 w przeciwnym razie.

jest całkowalna w sensie Riemanna i jej całka wynosi zero.

Definicja całkowalności (definicja 9.1.6 ) jest intuicyjna, ale nie daje praktycznego kryterium rozstrzygania, które funkcje sa,˛ a które nie sa˛ całkowalne.
Ćwiczenie 9.1.9 pokazuje, że funkcja nie musi być ciagła,
˛ by być całkowalna.˛ Z drugiej strony z przykładu 9.1.8 wnosimy, że nie można oczekiwać, by każda
funkcja ograniczona była całkowalna. W kolejnych dwóch rozdziałach podamy bardziej praktyczne kryteria całkowalności.

9.1.4 Epsilonowe kryterium całkowalności

Lemat 9.1.10 Jeśli P 1 , P 2 ∈ Podz([a, b]) oraz P 2 @ P 1 , to

L(f, P 1 ) ¬ L(f, P 2 ) i U (f, P 2 ) ¬ U (f, P 1 ).

Dowód: Niech P ∈ P 1 . Z uwagi 9.1.1 mamy


X X X
m(f, P ) len P = m(f, P ) len P 0 = m(f, P ) len P 0 ¬ m(f, P 0 ) len P 0 .
P 0 ⊂P, P 0 ∈P 2 P 0 ⊂P, P 0 ∈P 2 P 0 ⊂P, P 0 ∈P 2

Sumując lewą i prawą stronę powyższych nierówności dla P ∈ P 1 dostajemy

L(f, P 1 ) ¬ L(f, P 2 ).

Dowód nierówności dla sum górnych jest analogiczny. 


Z lematu 9.1.10 i uwagi 9.1.3 dostajemy następujący wniosek

Wniosek 9.1.11 Dla dowolnych podziałów P 1 , P 2 ∈ Podz([a, b]) mamy

L(f, P 1 ) ¬ U (f, P 2 ).

Dowód: Niech P 1 , P 2 ∈ Podz([a, b]) będą ustalonymi podziałami przedziału [a, b]. Z Uwagi 9.1.3 znajdziemy podział
P 3 ∈ Podz([a, b]) taki, że P 3 @ P 1 oraz P 3 @ P 2 . Zatem z uwagi 9.1.5 i z lematu 9.1.10 dostajemy

L(f, P 1 ) ¬ L(f, P 3 ) ¬ U (f, P 3 ) ¬ U (f, P 2 ).


Z powyższgo wniosku dostajemy natychmiast następujący wniosek

Wniosek 9.1.12 Dla dowolnej funkcji ograniczonej f : [a, b] → R mamy

L(f ) ¬ U (f ).

Jesteśmy teraz przygotowani, by pokazać następującą charakteryzację funkcji całkowalnych w sensie Riemanna.
222 ROZDZIAŁ 9. CAŁKA OZNACZONA

Twierdzenie 9.1.13 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy
dla każdego ε > 0 istnieje podział P ∈ Podz([a, b]) przedziału [a, b] taki, że

U (f, P) − L(f, P) < ε. (9.3)

Dowód: Przyjmijmy najpierw, że f jest całkowalna w sensie Riemanna. Ustalmy ε > 0. Z definicji całki dolnej i górnej
do ε/2 znajdziemy podziały P 1 , P 2 ∈ Podz([a, b]) takie, że
ε ε
L(f, P 1 ) > L(f ) − oraz U (f, P 2 ) < U (f ) + .
2 2
Na mocy uwagi 9.1.3 możemy wybrać podział P 3 ∈ Podz([a, b]) taki, że P 3 @ P 1 oraz P 3 @ P 2 . Z lematu 9.1.10 oraz z
(9.1.4) dostajemy
ε  ε
U (f, P 3 ) − L(f, P 3 ) ¬ U (f, P 2 ) − L(f, P 1 ) < U (f ) + − L(f ) − = ε,
2 2
bo z założenia L(f ) = U (f ). Zatem podział P 3 spełnia wymóg (9.3).
Dla dowodu przeciwnej implikacji przyjmijmy nie wprost, że f nie jest całkowalna w sensie Riemanna. Wtedy L(f ) 6=
U (f ), zatem z wniosku 9.1.12 wynika, że L(f ) < U (f ). Z definicji sum dolnych i górnych wnosimy, że dla dowolnego
P ∈ Podz([a, b]) mamy
U (f, P) − L(f, P) ­ U (f ) − L(f ).
W szczególności wynika stąd, że dla ε := U (f )−L(f
2
)
, które na mocy przyjętego założenia jest dodatnie, nie znajdziemy
podziału P spełniającego warunek (9.3). A to dowodzi, że implikacja przeciwna również zachodzi. 

9.1.5 Miarowe kryterium całkowalności.

Definicja 9.1.14 Miarą zewnętrzną podzbiorów R nazywamy funkcję

µ∗ : P(R) 3 E 7→ inf { A∈A len A | A ⊂ Przedz(R) rodzina przeliczalna taka, że E ⊂ A }.


P S

Mówimy, że zbiór E ⊂ R jest miary zero jeżeli µ∗ (E) = 0.

Twierdzenie 9.1.15 Miara zewnętrzna ma następujące własności:


(i) µ∗ (∅) = 0,
(ii) E ⊂ F ⇒ µ∗ (E) ¬ µ∗ (F ),
S∞ P∞
(iii) µ∗ ( i=1 Ei ) ¬ i=1 µ∗ (Ei ),

Dowód: Własności (i) oraz (ii) miary zewnętrznej wynikają wprost z definicji. Aby pokazać własność (iii) ustalmy
Ei , a dokładniej z definicji kresu dolnego do 2εi znajdziemy przeliczalną rodzinę przedziałów
ε > 0. Z definicji µ∗ dla zbioru S
Ai ⊂ Przedz(R) taką, że Ei ⊂ Ai oraz
X ε
len A < µ∗ (Ei ) + i .
2
A∈Ai
S∞
Wtedy A := i=1 Ai ⊂ Przedz(R) jest również rodziną przeliczalną. Co więcej, mamy

[ ∞ [
[ [
Ei ⊂ Ai = A
i=1 i=1
9.2. WŁASNOŚCI CAŁKI RIEMANNA 223

oraz
∞ ∞ X ∞  ∞
[ X X X ε X ∗
µ∗ ( Ei ) ¬ len A ¬ len A ¬ µ∗ (Ei ) + = µ (Ei ) + ε
i=1 i=1 A∈Ai i=1
2i i=1
A∈A

co, wobec dowolności ε > 0, kończy dowód. 

Przykład 9.1.16 Zbiorem miary zero jest każdy skończony zbiór punktów.

Przykład 9.1.17 Zbiór Q liczb wymiernych jest zbiorem miary zero. Rzeczywiście, wiemy że zbiór liczb wymiernych
jest przeliczalny, więc istnieje ciąg x : N1 → Q, który jest bijekcją. Ustalmy dowolneS ε > 0 i dla nP∈ N1 połóżmy
An := [xn − 2n+1
ε
, xn + 2n+1
ε
]. Niech A := { An | n ∈ N1 } ⊂ Przedz(R). Oczywiście Q ⊂ A, a ponadto n∈N1 len An =
P∞ ε
n=1 2n = ε. Wobec dowolności ε > 0 dostajemy µ (Q) = 0.

Jako natychmiastowy wniosek z twierdzenia 9.1.15 dostajemy następujący wniosek.

Wniosek 9.1.18 Suma co najwyżej przeliczalnej rodziny zbiorów miary zero jest zbiorem miary zero.

Następujące twierdzenie daje charakteryzację funkcji całkowalnych w sensie Riemanna poprzez miarę zewnętrzną zbioru
punktów nieciągłości funkcji. W szczególności wynika z niego, że każda funkcja ciągła jest całkowalna w sensie Riemanna.
Dowód jest dość skomplikowany i go pomijamy.

Twierdzenie 9.1.19 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy
zbiór punktów, w których nie jest ciągła ma miarę zero. W szczególności, jeśli f jest ciągła, to jest całkowalna w sensie
Riemanna.

9.2 Własności całki Riemanna


9.2.1 Monotoniczność całki

Twierdzenie 9.2.1 Niech f, g : [a, b] → R będą funkcjami ograniczonymi. Jeśli f ¬ g to

L(f ) ¬ L(g) oraz U (f ) ¬ U (g).

W szczególności, jeśli tak f jak i g są całkowalne w sensie Riemanna, to


R R
f ¬ g.

Dowód: Niech P będzie podziałem przedziału [a, b] i niech P ∈ P będzie przedziałem tego podziału. Ponieważ założyliśmy,
że f ¬ g, z twierdzenia 2.3.11 dostajemy m(f, P ) ¬ m(g, P ), a w konsekwencji również L(f, P) ¬ L(g, P). Stosując ponownie
twierdzenie 2.3.11 , ale do funkcji
P 7→ L(f, P), P 7→ L(g, P)

dostajemy L(f ) ¬ L(g). Podobnie dostajemy U (f ) ¬ U (g). Dowodzi to pierwszej części twierdzenia. Część druga wynika
natychmiast z pierwszej i z definicji całkowalności w sensie Riemanna. 
224 ROZDZIAŁ 9. CAŁKA OZNACZONA

9.2.2 Przestrzeń wektorowa funkcji całkowalnych w sensie Riemanna.

Twierdzenie 9.2.2 Jeśli f, g : [a, b] → R są całkowalne w sensie Riemanna to f + g oraz f − g są całkowalne w sensie
Riemanna oraz
(f + g) = f + g (f − g) = f − g.
R R R R R R
i
Ponadto, dla dowolnego α ∈ R funkcja αf jest całkowalna w sensie Riemanna oraz

(αf ) = α f.
R R

Dowód: Niech P będzie podziałem przedziału [a, b] i niech P ∈ P będzie przedziałem tego podziału. Z twierdzenia 2.3.7
(ii) wnosimy, że
m(f + g, P ) ­ m(f, P ) + m(g, P ) oraz M (f + g, P ) ¬ M (f, P ) + M (g, P ).
Zatem X X X
L(f + g, P) = m(f + g, P ) len P ­ m(f, P ) len P + m(g, P ) len P = L(f, P) + L(g, P).
P ∈P P ∈P P ∈P

Podobnie sprawdzamy, że
U (f + g, P) ¬ U (f, P) + U (g, P).
Ustalmy ε > 0. Z założenia o całkowalności w sensie Riemanna funkcji f i g oraz z twierdzenia 9.1.13 znajdziemy podziały
P 1 , P 2 przedziału [a, b] takie, że
ε ε
U (f, P 1 ) − L(f, P 1 ) < oraz U (g, P 2 ) − L(g, P 2 ) < .
2 2
Z uwagi 9.1.3 znajdziemy podział P 3 przedziału [a, b] taki, że P 3 @ P 1 i P 3 @ P 2 . Wtedy, wykorzystując lemat 9.1.10 i
wcześniej pokazane nierówności, dostajemy
ε ε
U (f + g) ¬ U (f + g, P 3 ) ¬ U (f, P 3 ) + U (g, P 3 ) ¬ U (f, P 1 ) + U (g, P 2 ) < L(f, P 1 ) + + L(g, P 2 ) + ¬ L(f ) + L(g) + ε,
2 2
co, wobec dowolności ε > 0, pokazuje, że
U (f + g) ¬ L(f ) + L(g).
Podobnie dowodzimy, że
L(f + g) ­ U (f ) + U (g).
Zatem, wobec całkowalności w sensie Riemanna funkcji f i g, dostajemy

f + g ¬ U (f ) + U (g) ¬ L(f + g) ¬ U (f + g) ¬ L(f ) + L(g) ¬ f + g


R R R R

co dowodzi, że L(f + g) = U (f + g), czyli, że f + g jest całkowalna w sensie Riemanna, a ponadto pokazuje, że

(f + g) = f + g.
R R R

Dowód dla różnicy i iloczynu funkcji przez stałą jest podobny i zostawiamy go jako ćwiczenie. 
Jako prosty wniosek z przykładu 9.1.7 , twierdzenia 9.2.1 i twierdzenia 9.2.2 dostajemy następującą uwagę.

Uwaga 9.2.3 Jeśli f : [a, b] → R jest całkowalna w sensie Riemanna, to

f ¬ (b − a) sup |f (x)|.
R
x∈[a,b]
9.2. WŁASNOŚCI CAŁKI RIEMANNA 225

Dowód: Niech c := supx∈[a,b] |f (x)| Mamy −c ¬ f ¬ c, zatem


− c[a,b] = (−c[a,b] ) ¬ f ¬ c[a,b] ,
R R R R

skąd natychmiast dostajemy tezę. 


Własności całki Riemanna podane w twierdzeniu 9.2.1 , twierdzeniu 9.2.2 oraz uwadze 9.2.3 możemy zebrać w postaci
następującego twierdzenia.
Twierdzenie 9.2.4 Przestrzeń Riem([a, b]) funkcji całkowalnych w sensie Riemanna na przedziale zwartym [a, b] z
działaniem dodawania funkcji oraz mnożenia funkcji przez liczbę jest przestrzenią wektorową nad ciałem R. Ponadto,
odwzorowanie
Riem([a, b]) 3 f 7→ ||f || := sup |f (x)| ∈ R∗ (9.4)
x∈[a,b]

jest normą, która zadaje w Riem([a, b]) strukturę przestrzeni wektorowej unormowanej, a tym samym strukturę prze-
strzeni metrycznej. Co więcej, zachodzi wzór

f ¬ (b − a)||f ||, (9.5)


R

a odwzorowanie
Riem([a, b]) 3 f 7→ f ∈ R (9.6)
R

jest liniowe. Odwzorowanie to jest też funkcją Lipschitza ze stałą b − a = len[a, b], a więc w szczególności jest odwzo-
rowaniem ciągłym.
Dowód: Fakt, że Riem([a, b]) jest przestrzenią wektorową nad ciałem R wynika wprost z twierdzenia 9.2.2 . Sprawdzenie,
że odwzorowanie (9.4) jest normą w Riem([a, b]) zostawiamy jako proste ćwiczenie. Z kolei liniowość odwzorowania (9.6)
wynika również z twierdzenia 9.2.2 . Z uwagi 9.2.3 dostajemy wzór (9.5), a z niego dla f, g ∈ Riem([a, b]) wnioskujemy, że
f − g = (f − g) ¬ (b − a)||f − g||,
R R R

czyli, że odwzorowanie (9.6) jest funkcją Lipschitza ze stałą len[a, b]. 

9.2.3 Całkowalność złożenia i iloczynu


Wykorzystując twierdzenie 9.1.19 pokażemy następujące twierdzenie.
Twierdzenie 9.2.5 Całka Riemanna ma następujące własności:

(i) jeśli f ∈ Riem([a, b]), a ϕ : R → R jest ciągła, to ϕ ◦ f ∈ Riem([a, b]),


(ii) jeśli f, g ∈ Riem([a, b]), to ich iloczyn f · g ∈ Riem([a, b]),
(iii) jeśli f ∈ Riem([a, b]), to |f | ∈ Riem([a, b]) oraz f ¬ |f |.
R R

Dowód: Z ciągłości funkcji ϕ wnosimy, że w punktach w których f jest ciągła, ciągłe jest też złożenie ϕ ◦ f . Zatem
zbiór punktów nieciągłości ϕ ◦ f jest podzbiorem zbioru punktów nieciągłości funkcji f . Na mocy twierdzenia 9.1.19 zbiór
punktów nieciągłości funkcji f jest miary zero. Oznacza to, że zbiór punktów nieciągłości ϕ ◦ f jest również miary zero.
Stosując ponownie twierdzenie 9.1.19 dostajemy ϕ ◦ f ∈ Riem([a, b]), co dowodzi własności (i).
Aby pokazać własność (ii) zauważmy, że z twierdzenia 9.2.2 wiemy, iż f + g, f − g ∈ Riem([a, b]). Zatem na mocy (i)
(f + g)2 , (f − g)2 ∈ Riem([a, b]) i ponownie z twierdzenia 9.2.2 dostajemy
(f + g)2 − (f − g)2
f ·g = ∈ Riem([a, b]).
4
Pozostaje
R pokazać
R własność (iii). Z (i) wnosimy, że |f | ∈ Riem([a, b]), a z nierówności −|f | ¬ f ¬ |f | i z twierdzenia 9.2.1
dostajemy f ¬ |f |. 
226 ROZDZIAŁ 9. CAŁKA OZNACZONA

9.2.4 Addytywność całki względem podziału przedziału

Twierdzenie 9.2.6 Niech f : [a, b] → R będzie funkcją ograniczoną i niech P będzie ustalonym podziałem przedziału
[a, b] zadanym ciągiem x : { 0, 1, 2, . . . k } → [a, b]. Funkcja f jest całkowalna w sensie Riemanna wtedy i tylko wtedy
gdy zawężenia fi := f|[xi−1 ,xi ] są całkowalne w sensie Riemanna dla wszystkich i = 1, 2, . . . k. Co więcej, w takim
przypadku Pk R
f = i=1 fi . (9.7)
R

Dowód: Zauważmy, że zbiór punktów nieciągłości funkcji f jest sumą mnogościową zbiorów punktów nieciąglości funkcji
fi dla i = 1, 2, . . . k. Tak więc fakt, że f jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy zawężenia fi są
całkowalne w sensie Riemanna wynika bezpośrednio z twierdzenia 9.1.19 i twierdzenia 9.1.15 .
Aby pokazać (9.7) udowodnimy najpierw, że lewa strona jest nie większa niż prawa. W tym celu ustalmy ε > 0 i
dobierzmy podział P̄ @ P taki, że U (f, P̄) − L(f, P̄) < ε. Połóżmy P̄ i := { P ∈ P̄ | P ⊂ [xi−1 , xi ] }. Mamy
Pk Pk R
f ¬ U (f, P̄) ¬ L(f, P̄) + ε = L(fi , P̄ i ) + ε ¬ fi + ε
R
i=1 i=1

Pk R
i wobec dowolności ε > 0 dostajemy f ¬ i=1 fi .
R

Aby pokazać nierówność przeciwną ponownie ustalmy ε > 0. Dla i = 1, 2, . . . k do kε dobierzmy taki podział P i przedziału
Sk
[xi−1 , xi ], że U (fi , P i ) − L(fi , P i ) < kε . Wtedy P̄ := i=1 P i jest podziałem przedziału [a, b] i mamy

k
X Pk Pk
U (fi , P i ) ¬ L(fi , P i ) + ε
= L(f, P̄) + ε ¬ f + ε
R  R
fi ¬ i=1 i=1 k
i=1

Pk R
co wobec dowolności ε > 0 daje fi ¬ f .
R
i=1 

9.2.5 Całka Riemanna na podprzedziale. Całka oznaczona


Do tej pory, dla wygody, mówiąc o całce Riemanna rozważaliśmy funkcje zdefiniowane na przedziale [a, b]. Jeśli dziedzina
funkcji zawiera przedział [a, b], to zawsze można ją zawężyć do tego przedziału, co pozwala postawić następującą definicję.

Definicja 9.2.7 Niech f : R 9 R będzie funkcją ograniczoną. Załóżmy, że dla a < b zachodzi [a, b] ⊂ dom f .
Mówimy, że f jest całkowalna w sensie Riemanna na przedziale [a, b], jeżeli zwężenie f|[a,b] jest funkcją całkowalną w
sensie Riemanna. W takim przypadku całkę f|[a,b] nazywamy całką Riemanna funkcji f na przedziale [a, b] lub całką
R

oznaczoną funkcji f od a do b i piszemy


Z b
f := f|[a,b] . (9.8)
R
a
Często będziemy też stosować bardziej tradycyjne oznaczenie
Z b Z b
f (x)dx := f. (9.9)
a a

To tradycyjne oznaczenie nawiazuje


˛ do sposobu rozumienia całki nim Riemann sformalizował to poj˛ecie. Znak całki wywodzi si˛e od litery S oznaczajacej
˛
˛ o polu f (x)dx gdzie f (x) jest wysokościa˛ prostokata,
sum˛e, a sumujemy nieskończenie wiele prostokatów ˛ a dx jest nieskończenie mała˛ podstawa.˛
Następujący wniosek wynika natychmiast z twierdzenia 9.2.6 .
9.2. WŁASNOŚCI CAŁKI RIEMANNA 227

Wniosek 9.2.8 Jeśli f : R 9 R jest całkowalna w sensie Riemanna na przedziale [a, b] oraz c ∈ (a, b), to f jest
całkowalna w sensie Riemanna na przedziałach [a, c] i [c, b] oraz
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx. (9.10)
a a c

Gdy a = b przedział [a, b] jest singletonem. R a Wtedy jego długość wynosi zero i w konsekwencji sumy górne, sumy dolne,
całki górna i dolna, wynoszą zero. Zatem a f = 0 dla dowolnego a ∈ dom f . Wygodnie jest rozszerzyć oznaczenie na całkę
oznaczoną dopuszając przypadek a ­ b.
˛ a = b odstalibyśmy
Gdyby we wzorze 9.10 przyjać
Z a Z c Z a
0= f (x)dx = f (x)dx + f (x)dx
a a c

co sugeruje, że dobrze byłoby przyjać


˛ Z a Z c
f (x)dx = − f (x)dx.
c a

Rozszerzamy oznaczenia (9.8) i (9.9) przyjmując dla b ¬ a takich, że [b, a] ⊂ dom f oznaczenia
Z b Z b Z a
f (x)dx := f := − f
a a b

co pozwala nam przeformułować ostatni wniosek do następującej postaci.

Wniosek 9.2.9 Niech f : R 9 R będzie funkcją ograniczoną i niech a, b, c ∈ R. Jeśli f jest całkowalna w sensie
Riemanna na przedziałach o końcach a i b, a i c oraz b i c, to
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx.
a a c

W programie Mathematica całkę oznaczoną z funkcji f na przedziale [a, b] obliczamy używając instrukcji
Integrate[f[x], {x, a, b}]
W miarę swoich możliwości Mathematica stara się zwrócić dokładny wynik. Na przykład
Integrate[Sqrt[1 - x^2], {x, 0, 1}]
zwraca 4.
π

9.2.6 Twierdzenie Riemanna


Niech f : R 9 R będzie funkcją ograniczoną i niech [a, b] będzie przedziałem zwartym zawartym w dziedzinie funkcji f .
Niech P będzie podziałem przedziału [a, b] zadanym ciągiem x : { 0, 1, 2, . . . k } → [a, b].
Definicja 9.2.10 Niech Ξ := { ξ1 , ξ2 , . . . ξk } ⊂ [a, b] będzie zbiorem punktów takich, że ξi ∈ [xi−1 , xi ] dla i =
1, 2, . . . k. Parę (P, Ξ) nazywamy parą aproksymacyjną dla f na przedziale [a, b], a wyrażenie
k
X
S(f, P, Ξ) := f (ξi )(xi − xi−1 )
i=1

n=1 nazywamy ciągiem


nazywamy sumą aproksymacyjną dla f na przedziale [a, b]. Ciąg par aproksymacyjnych (P n , Ξn )∞
normalnym, jeżeli ciąg średnic podziałów P n zmierza do zera.
228 ROZDZIAŁ 9. CAŁKA OZNACZONA

Przypomnijmy, że dla podziału P przedziału [a, b] przez δ(P) rozumiemy średnicę P daną wzorem (9.1).

Twierdzenie 9.2.11 (Riemanna). Niech f : [a, b] → R będzie funkcją ograniczoną. Funkcja ta jest całkowalna w
sensie Riemanna wtedy i tylko wtedy gdy istnieje liczba g ∈ R taka, że dla każdego ε > 0 istnieje δ > 0 taka, że dla
każdej pary aproksymacyjnej (P, Ξ) dla f na przedziale [a, b] mamy

δ(P) < δ ⇒ |S(f, P, Ξ) − g| < ε.


Rb
Liczba g jest wyznaczona jednoznacznie i jest równa całce a
f.

Dowód pomijamy.
Program, który liczy przybliżenie całki Z x
f (t)dt
0
w oparciu o sumy Riemanna
n
X 1 i
sn := f ( x)
i=1
n n
przedstawia listing 9.1 . Podobny program w języku C++ przedstawia listing 9.2 .
Wyrazy ciągu sn powinny przybliżać pole ćwiartki koła, czyli
π
= 0.7853981633974483...,
4
natomiast 20-ty wyraz ciągu sn wyliczony przez program to

s20 = 0.785397208948704.

Widzimy więc, że z punktu widzenia liczenia liczby π ta technika jest gorsza niż zastosowana wcześniej technika szeregów.
Jednak pożytki z niej leżą gdzie indziej.

Ćwiczenie komputerowe 9.2.12 Adaptuj program z listingu 9.2 do policzenia przybliżenia pola soczewkowatej
figury na rys. 1.13 .
9.2. WŁASNOŚCI CAŁKI RIEMANNA 229

 
( ∗ P r z y b l i ż a n i e ca ł k i o z n a c z o n e j z f u n k c j i f od 0 do x p o p r z e z
p o l a m p r o s t o k a̧ t ów pod wykresem ∗ )
R i e m I n t e g r a l [ f_ , x_ , m_] :=
Module [ { s , k , y } ,
s = 0 . ; k = 0;
( ∗ Sumujemy w z m i e n n e j s warto s c i f u n k c j i w punktach x∗k/m ∗ )
Do[
y = x∗k/m;
s = s + f [y];
k = k + 1,
{m}
];
( ∗ Zwracamy sumȩ pomnoż on a̧ p r z e z wspó l n a̧ d ł ugo sć podstawy wynosz a̧ c a̧ 1/m ∗ )
s /m
]

( ∗ Wykres p o n i ż s z e j f u n k c j i nad p r z e d z i a ł em [ 0 , 1 ] t o ć w i a r t k a okr ȩ gu ∗ )


a r c [ x_ ] := Sqrt [ 1 − x ^ 2 ] ;

( ∗ P r z y b l i żymy p o l e pod ć w i a r t k a̧ okr ȩ gu danego f u n k c j a̧ a r c nad [ 0 , 1 ]


Wykonamy 20 pr ób za ka żdym razem podwajaj a̧ c i l o sć p r z e d z i a ł ów ∗ )
m = 1; d = 1;
Do[
p = R i e m I n t e g r a l [ arc , 1 . , m ] ;
( ∗ Wydruk k o n t r o l n y : ca ł ka powinna by ć b l i s k a p i /4 ∗ )
Print [ "s[" , d , " ]= " , NumberForm[ p , 1 6 ] ] ;
m = m∗ 2 ; d = d + 1 ,
{20}
]
 
Listing 9.1: Przybliżanie całki oznaczonej w języku Mathematica
230 ROZDZIAŁ 9. CAŁKA OZNACZONA

 
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ R i e m I n t e g r a l . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P r z y b l i ż a n i e ca ł k i o z n a c z o n e j p o p r z e z p o l a p r o s t o k a̧ t ów ∗/
/∗ pod wykresem ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;

/∗ Wykres p o n i ż s z e j f u n k c j i nad p r z e d z i a ł em [ 0 , 1 ] t o ć w i a r t k a okr ȩ gu ∗/


double a r c ( double x ) {
return s q r t (1−x∗x ) ;
}

/∗ P r z y b l i ż a n i e ca ł k i Riemanna f u n k c j i f od 0 do x suma̧ m p r o s t o k a̧ t ów
Z a p i s d o u b l e ( ∗ f ) ( d o u b l e ) oznacza , ż e argumentem f j e s t f u n k c j a ∗/
double R i e m I n t e g r a l ( double ( ∗ f ) ( double ) , double x , i n t m) {
double s =0;
/∗ Sumujemy w z m i e n n e j s warto s c i f u n k c j i w punktach x∗k/m ∗/
f o r ( i n t k=0;k<m; k=k+1){
double y=x∗k/m;
s=s+f ( y ) ;
}
/∗ Zwracamy sumȩ pomnoż on a̧ p r z e z wspó l n a̧ d ł ugo sć podstawy wynosz a̧ c a̧ 1/m ∗/
return s=s /m;
}

i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;

i n t m=1;
/∗ P r z y b l i żymy p o l e pod ć w i a r t k a̧ okr ȩ gu danego f u n k c j a̧ a r c nad [ 0 , 1 ]
Wykonamy 20 pr ób za ka żdym razem podwajaj a̧ c i l o sć p r z e d z i a ł ów ∗/
f o r ( i n t d=1;d<=20;d=d+1){
double p=R i e m I n t e g r a l ( arc , 1 . ,m) ;
/∗ Wydruk k o n t r o l n y : ca ł ka powinna by ć b l i s k a p i /4 ∗/
c o u t << "s[" << setw ( 2 ) << d << "] =" << setw ( 1 8 ) << p ;
c o u t << e n d l ;
m=m∗ 2 ;
}
}
 
Listing 9.2: Przybliżanie całki oznaczonej w C++
Rozdział 10

Funkcja pierwotna i całka nieoznaczona

Jak wspomnieliśmy w rozdziale wst˛epnym Newton i Leibniz odkryli, że poj˛ecie pochodnej i poj˛ecie całki sa˛ ze soba˛ powiazane.
˛ Wzi˛ecie całki z pochodnej oraz
pochodnej z całki prowadza˛ do wyjściowej funkcji. W niniejszym rozdziale doprecyzujemy co to oznacza oraz zajmiemy si˛e pożytkami jakie z tego faktu płyna.˛

10.1 Podstawowe twierdzenie rachunku różniczkowego i całkowego


10.1.1 Pochodna całki
Całk˛e Riemanna można traktować jako funkcj˛e
Z b
Riem(a, b) 3 f 7→ f ∈ R,
a

˛ a˛ pole pod wykresem funkcji. Ciekawsze jest nieco inne spojrzenie, w którym funkcj˛e f
która funkcji całkowalnej w sensie Riemanna przypisuje liczb˛e mierzac
ustalamy, natomiast zmieniamy jeden koniec przedziału, po którym całkujemy. Takie spojrzenie prowadzi do nast˛epujacego
˛ twierdzenia.

Twierdzenie 10.1.1 Niech f : [a, b] → R będzie funkcją całkowalną w sensie Riemanna. Rozważmy funkcję
Z x
F : [a, b] 3 x 7→ f (t)dt.
a

Wtedy
(i) funkcja F jest funkcją Lipschitza,
(ii) jeśli f jest ciągła w punkcie x0 ∈ [a, b] to F jest różniczkowalna w x0 oraz F 0 (x0 ) = f (x0 ).

Dowód: Aby pokazać własność (i) rozważmy x, y ∈ [a, b] spełniające x < y. Niech M := supx∈[a,b] |f (x)|. Podstawiając
y za b i x za c we wzorze (9.10) mamy Z y Z x Z y
f (t)dt = f (t)dt + f (t)dt.
a a x

Zatem Z y Z x Z x Z y Z x Z y
|F (y) − F (x)| = f (t)dt − f (t)dt = f (t)dt + f (t)dt − f (t)dt = f
a a a x a x

i z uwagi 9.2.3 dostajemy. Z y Z y


|F (y) − F (x)| = f ¬ |f | ¬ M (y − x) = M |y − x|
x x

231
232 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA

co dowodzi, że F rzeczywiście jest funkcją Lipschitza.


Dla dowodu własności (ii) ustalmy ε > 0. Z ciągłości f w x0 znajdziemy δ > 0 takie, że

|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε.

Zatem dla |h| < δ, wykorzystując twierdzenie 9.2.2 , wniosek 9.2.8 , wzór (9.2) na całkę Riemanna funkcji stałej oraz
uwagę 9.2.3 , mamy

F (x0 + h) − F (x0 ) F (x0 + h) − F (x0 ) − hf (x0 )


− f (x0 ) =
h h
1
Z x0 +h Z x0
= f (t)dt − f (t)dt − hf (x0 )
|h| a a

1
Z x0 +h Z x0 +h
= f (t)dt − f (x0 )dt
|h| x0 x0

1
Z x0 +h
= (f (t) − f (x0 ))dt
|h| x0
1
Z x0 +h
¬ |f (t) − f (x0 )| dt
|h| x0
1
Z x0 +h
¬ εdt
|h| x0

=
h
= ε,

co dowodzi, że F jest różniczkowalna w x0 oraz F 0 (x0 ) = f (x0 ). 

10.1.2 Funkcja pierwotna i całka nieoznaczona.

Definicja 10.1.2 Niech f : [a, b] → R. Mówimy, że F : [a, b] → R jest funkcją pierwotną funkcji f jeżeli F jest
różniczkowalna oraz F 0 (x) = f (x) dla każdego x ∈ [a, b].

Z twierdzenia 10.1.1 łatwo wyprowadzamy następujacy wniosek.

Wniosek 10.1.3 Jeśli f : [a, b] → R jest ciągła to funkcja


Z x
[a, b] 3 x 7→ f (t)dt ∈ R
a

jest funkcją pierwotną funkcji f .

Naturalne jest pytanie czy funkcja f może mieć więcej niż jedną pierwotną. Dodając do pierwotnej funkcję stałą dostajemy
inną pierwotną tej samej funkcji, bo pochodna funkcji stałej jest zero. Okazuje się, że więcej pierwotnych już nie ma jak
wynika z następującego twierdzenia.

Twierdzenie 10.1.4 Jeśli F1 i F2 są pierwotnymi funkcji f , to różnica F1 − F2 jest funkcja stałą.


10.1. PODSTAWOWE TWIERDZENIE RACHUNKU RÓŻNICZKOWEGO I CAŁKOWEGO 233

Dowód: Niech F := F1 − F2 . Funkcja F jest różniczkowalna oraz F 0 = F10 − F20 = 0. Niech x, y ∈ [a, b] i x < y. Z
twierdzenia o wartości średniej wiemy, że istnieje ξ ∈ (x, y) takie, że

F (x) − F (y) = F 0 (ξ)(x − y) = 0.

Zatem F (x) = F (y), a ponieważ x, y są dowolne, otrzymujemy tezę. 


Wygodnie jest zebrać wszystkie pierwotne razem.

Definicja 10.1.5 Niech f : [a, b] → R będzie funkcją całkowalną w sensie Riemanna.


R Zbiór wszystkich pierwotnych
funkcji f nazywamy całką nieoznaczoną f i oznaczamy f lub bardziej tradycyjnie f (x)dx.
R

W szczególności zapis F ∈ f oznacza, że F jest funkcją pierwotną f . Przyjmując oznaczenie Const([a, b]) na rodzinę
R

funkcji stałych na przedziale [a, b] oraz oznaczenie

F + Const([a, b]) := { F + c[a,b] | c[a,b] ∈ Const([a, b]) }

możemy przeformułować twierdzenie 10.1.4 do następującej postaci.

Wniosek 10.1.6 Jeśli F jest funkcją pierwotną funkcji f , to


Z
f = F + Const([a, b]).

Dowód: Jeśli F1 ∈ f jest inną pierwotną f , to na mocy twierdzenia 10.1.4 mamy F1 − F ∈ Const([a, b]), zatem
R

F1 ∈ F + Const([a, b]). Przeciwna inkluzja wynika natychmiast z twierdzenia o pochodnej sumy i funkcji stałej. 
Stosowany jest również tradycyjny, choć mniej precyzyjny zapis
Z
F (x) = f (x)dx + C,

który należy interpretować tak, że wybierając jakąś pierwotną z całki nieoznaczonej i dodając do niej stałą dostaniemy inną
pierwotną.

10.1.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego


Leibniz i Newton odkryli, że znajomość pierwotnej pozwala wygodnie obliczać pole pod wykresem funkcji. Jest to niepo-
równalnie łatwiejsze od liczenia sum aproksymacyjnych Riemanna. Natomiast maszynką dostarczające liczne (choć niestety
nie wszystkie potrzebne) wzory na funkcje pierwotne są wszelkie wzory na pochodne.

Twierdzenie 10.1.7 (podstawowe twierdzenie rachunku różniczkowego i całkowego) Niech f : [a, b] → R


będzie całkowalna w sensie Riemanna. Jeśli F jest pierwotną funkcji f to
Z x
F (x) = f (t)dt + F (a). (10.1)
a

W szczególności
Z b
f (t)dt = F (b) − F (a). (10.2)
a

Dla wygody w dalszym ciągu stosować będziemy zapis F |ba := F (b) − F (a).
Dowód: Pokażemy najpierw (10.2). Ustalmy ε > 0 i z twierdzenia 9.1.13 dobierzmy do tego ε podział P przedziału
[a, b] taki, że zachodzi nierówność U (f, P) − L(f, P) < ε. Niech podział P zadany będzie ciągiem x : { 0, 1, 2, . . . n } → [a, b].
234 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA

Z twierdzenia Lagrange’a o wartości średniej (wniosek 8.8.2 ) zastosowanego do F zawężonego do przedziałów [xi−1 , xi ] dla
i ∈ { 1, 2, . . . n } znajdziemy liczbę ti ∈ [xi−1 , xi ] taką, że
F (xi ) − F (xi−1 ) = F 0 (ti )(xi − xi−1 ) = f (ti )(xi − xi−1 ).
Sumując stronami te równości dostajemy
n
X n
X
F (b) − F (a) = (F (xi ) − F (xi−1 )) = f (ti )(xi − xi−1 ).
i=1 i=1

Wprost z definicji dolnej i górnej sumy Darboux wynikają nierówności


n
X
L(f, P) ¬ f (ti )(xi − xi−1 ) ¬ U (f, P),
i=1

z których dostajemy
n
X
−U (f, P) ¬ − f (ti )(xi − xi−1 ) ¬ −L(f, P).
i=1
Z definicji całki dolnej i górnej wiemy, że
Z b
L(f, P) ¬ f (t)dt ¬ U (f, P).
a
Dodając ostatnie dwie nierówności stronami dostajemy
Z b n
X
−(U (f, P) − L(f, P)) ¬ f (t)dt − f (ti )(xi − xi−1 ) ¬ U (f, P) − L(f, P)
a i=1

co daje
Z b n
X
f (t)dt − f (ti )(xi − xi−1 ) ¬ U (f, P) − L(f, P).
a i=1
Zatem Z b n
X Z b
F (b) − F (a) − f (t)dt = f (ti )(xi − xi−1 ) − f (t)dt ¬ U (f, P) − L(f, P) < ε
a i=1 a

co, wobec dowolności ε > 0, daje równość (10.2).


Aby pokazać (10.1) wystarczy zastosować pokazany już wzór (10.2) do zawężenia f|[a,x] . 

10.2 Podstawowe własności całki nieoznaczonej.


Podamy teraz kilka podstawowych wzorów dla całki nieoznaczonej. Pojawiające się w nich funkcje rozważać będziemy na
przedziale [a, b].

Twierdzenie 10.2.1 (liniowość całki nieoznaczonej). Niech f, g : [a, b] → R będą całkowalne w sensie Riemanna.
Wtedy f + g jest całkowalna w sensie Riemanna oraz
Z Z Z
(f + g) = f + g. (10.3)

Ponadto αf jest całkowalna w sensie Riemanna dla dowolnego α ∈ R oraz


Z Z
(αf ) = α f. (10.4)
10.3. CAŁKOWANIE PRZEZ CZĘŚCI 235

Zauważmy, że wzory (10.3) i (10.4) należy rozumieć jako równość zbiorów, ponieważ całka nieoznaczona jest zbiorem, a
dokładniej zbiorem funkcji pierwotnych.
Dowód: Całkowalność funkcji f + g i funkcji αf dostajemy wprost z twierdzenia 9.2.2 . Zauważmy, że jeżeli F jest
pierwotną f , a G jest pierwotną g, to F +G jest pierwotną f +g na podstawie twierdzenia o pochodnej sumy funkcji. Dowodzi
to zawieranie się strony prawej w lewej we wzorze (10.3). Aby pokazać inkluzję przeciwną załóżmy, że H jest elementem
lewej strony równości (10.3). Wtedy H jest pierwotną funkcji f + g. Niech F będzie dowolnie ustaloną pierwotną funkcji f .
Połóżmy G := H − F . Mamy G0 = H 0 − F 0 = (f + g) − f = g. Zatem G jest pierwotną funkcji g, a ponieważ H = F + G,
więc H jest sumą pierwotnej funkcji f i pierwotnej funkcji g. Zatem H należy do prawej strony (10.3).
Dowód (10.4) jest podobny i zostawiamy go jako ćwiczenie. 
Następujące twierdzenia są natychmiastową konsekwencją wniosku 10.1.6 oraz stosownych wzorów dla pochodnych.
Przyjmujemy w nich upraszczające oznaczenie Const na zbiór funkcji stałych na stosownie do wzoru dobranym zbiorze.

Twierdzenie 10.2.2 Zachodzą następujące wzory


Z Z
0[a,b] dx = Const, 1[a,b] dx = x + Const,

1 xα+1
Z Z
dx = ln |x| + Const, xα dx = + Const dla α 6= −1,
x α+1
Z
ex dx = ex + Const .

Dowód: Powyższe wzory wynikają kolejno z twierdzenia 8.1.2 , twierdzenia 8.1.3 , twierdzenia 8.11.2 , twierdzenia 8.11.3
oraz wniosku 8.4.3 . 

Twierdzenie 10.2.3 Zachodzą następujące wzory


Z Z
sin xdx = − cos x + Const, cos xdx = sin x + Const,
1 1
Z Z
dx = tg x + Const, √ dx = arc sin x + Const,
cos2 x 1 − x2
1
Z
dx = arc tg x + Const .
1 + x2
Dowód: Powyższe wzory wynikają z twierdzenia 8.4.4 i twierdzenia 8.11.6 . 

10.3 Całkowanie przez części


Widzieliśmy, że całkowanie sumy dwóch funkcji jest proste. Jest tak, bo pochodna sumy jest suma˛ pochodnych i w efekcie również całka sumy jest suma˛ całek.
Niestety pochodna iloczynu nie jest iloczynem pochodnych, a w efekcie całka iloczynu nie jest iloczynem całek. Dlatego nie jest oczywiste jak liczyć całki iloczynu
dwóch funkcji. Jednak wzór na pochodna˛ iloczynu jest w tym przypadku pomocny, chociaż nie bezpośrednio i nie automatycznie. Całkujac ˛ wzór na pochodna˛
iloczynu dostajemy Z Z Z
(f g)0 = f 0g + f g0 .

Ponieważ f g jest pierwotna˛ (f g)0 , dostajemy Z Z


f g + Const = f g+
0
f g0 .

Jeśli
R 0 jedna z dwóch całekR po prawej stronie jest łatwiejsza do policzenia niż druga, to wzór ten mozemy potraktować jako metod˛e sprowadzajac
˛ a˛ liczenie całki
f g do liczenia całki f g 0 . Jak zobaczymy, metoda ta może być użyteczna. Określana jest mianem całkowania przez cz˛eści.
236 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA

Twierdzenie 10.3.1 Załóżmy, że f, g : [a, b] → R są klasy C 1 . Wtedy


Z Z
f 0 g = f g − f g0 (10.5)

W szczególności mamy też wzór dla całek oznaczonych:


Z b Z b
f (x)g(x)dx =
0
f (x)g(x)|ba − f (x)g 0 (x)dx. (10.6)
a a

Dowód: Niech F będzie elementem lewej strony wzoru (10.5). Wtedy F 0 = f 0 g. Mamy

F = f g − (f g − F ).

Zatem aby pokazać, że F jest elementem prawej strony wzoru (10.5), wystarczy pokazać, że f g − F jest pierwotną funkcji
f g 0 . Jest tak w istocie, bo
(f g − F )0 = (f g)0 − F 0 = f 0 g + f g 0 − f 0 g = f g 0 .

Rozważmy teraz element prawej strony równości (10.5). Ma on postać f g − G, gdzie G jest pierwotną f g 0 . Musimy pokazać,
że f g − G jest pierwotną f 0 g. Rzeczywiście tak jest, bo

(f g − G)0 = f 0 g + f g 0 − f g 0 = f 0 g.

Aby pokazać (10.6) ustalmy funkcję pierwotną F dla f 0 g. Ze wzoru (10.5) wiemy, że F = f g − G, gdzie G jest pewną
pierwotną f g 0 . W szczególności

F (b) = f (b)g(b) − G(b)


F (a) = f (a)g(a) − G(a).

Odejmując te równości stronami dostajemy

F (b) − F (a) = f (b)g(b) − f (a)g(a) − (G(b) − G(a)). (10.7)

W oparciu o przyjętą konwencję zapisywania różnic mamy

f (b)g(b) − f (a)g(a) = f (x)g(x)|ba .

Z podstawowego twierdzenia rachunku różniczkowego i całkowego (tw. 10.1.7 ) oraz z definicji F i G jako funkcji pierwotnych
odpowiednio f 0 g oraz f g 0 otrzymujemy
Z b
F (b) − F (a) = f 0 (x)g(x)dx
a
Z b
G(b) − G(a) = f (x)g 0 (x)dx.
a

Wstawiając otrzymane trzy równości do (10.7) otrzymujemy (10.6). 


10.4. CAŁKOWANIE PRZEZ PODSTAWIENIE 237
Przykład 10.3.2 Metodę całkowania przez części zastosujemy do policzenia całki
Z
x sin xdx.

Musimy w tym celu przedstawić funkcję x 7→ x sin x jako iloczyn pewnej funkcji przez pochodną innej funkcji. Mamy
dwie możliwości:
x sin x = x(− cos x)0
lub 0
x2

x sin x = sin x
2
i nie jest oczywiste, z której lepiej skorzystać. Pierwsza sprowadzi problem do policzenia całki
Z
(x)0 (− cos x)dx,

a druga do całki
x2
Z  
(sin x)0 dx.
2
Z tych dwóch całek zdecydowanie łatwiejsza jest pierwsza, bo
Z Z
(x)0 (− cos x)dx = − cos xdx = − sin x + Const .

Zatem wstawiając do wzoru (10.5) za f funkcję x 7→ − cos x, a za g funkcję identycznościową x 7→ x dostajemy


Z Z Z Z
x sin xdx = (− cos x)0 xdx = −x cos x − (− cos x)x0 dx = −x cos x + cos xdx = −x cos x + sin x + Const .

10.4 Całkowanie przez podstawienie


Podobnie jak w przypadku iloczynu nie jest oczywiste jak całkować złożenie funkcji. Pochodna złożenia nie jest złożeniem pochodnych zatem i całka złożenia nie
jest złożeniem całek. Jednak całkujac
˛ wzór na pochodna˛ złożenia dostajemy wzór dostarczajacy˛ metod˛e liczenia całek przydatna˛ w przypadku złożeń i zwana˛
całkowaniem przez podstawienie.
Definiując całkę oznaczoną na przedziale [a, b] zakładaliśmy, że a ¬ b, bo w przeciwnym razie przedział ten jest pusty.
Przypomnijmy jednak przyjętą już konwencję, szczególnie przydatną ze względu na kolejne twierdzenie, że dla a > b
Z b Z a
f := − f.
a b

Twierdzenie 10.4.1 Załóżmy, że f : [a, b] → R jest funkcją ciągłą, a g : [α, β] → [a, b] jest klasy C 1 . Jeśli F jest
pierwotną funkcji f to F ◦ g jest pierwotną funkcji (f ◦ g)g 0 . W konsekwencji
Z Z 
(f ◦ g)g 0 = f ◦ g. (10.8)

W szczególności
Z β Z g(β)
f (g(t))g (t)dt =
0
f (x)dx. (10.9)
α g(α)
238 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA

Dowód: Jeśli F jest pierwotną funkcji f to z twierdzenia 8.3.2 o pochodnej złożenia wnosimy, że F ◦ g jest pierwotną
funkcji (f ◦ g) g 0 , zatem prawa strona zawiera się w lewej w (10.8). Aby pokazać, że lewa strona zawiera się w prawej
przyjmijmy, że G jest pierwotną funkcji (f ◦ g) g 0 . Wybierzmy też pewną pierwotną F funkcji f . Wiemy już, że wtedy F ◦ g
jest pierwotną (f ◦ g)g 0 , zatem na mocy twierdzenia 10.1.4 istnieje stała C taka, że G = F ◦ g + C. Mamy

G = F ◦ g + C = F ◦ g + C ◦ g = (F + C) ◦ g = F̄ ◦ g,

gdzie F̄ = F + C jest inną pierwotną f . Zatem G jako podstawienie g w pierwotnej F̄ funkcji f należy do prawej strony
równości (10.8).
Pozostaje pokazać (10.9). Wiemy, że jeśli F jest pierwotną f to F ◦ g jest pierwotną (f ◦ g)g 0 . Zatem z podstawowego
twierdzenia rachunku różniczkowego i całkowego (tw. 10.1.7 ) mamy
Z β
f (g(t))g 0 (t)dt = (F ◦ g)(β) − (F ◦ g)(α) = F (g(β)) − F (g(α)).
α

Zatem gdy g(α) ¬ g(β) dostajemy


Z β Z g(β)
f (g(t))g 0 (t)dt = F (g(β)) − F (g(α)) = f (x)dx.
α g(α)

Natomiast gdy g(α) > g(β) dzięki przyjętej konwencji mamy


Z β Z g(α) Z g(β)
f (g(t))g 0 (t)dt = F (g(β)) − F (g(α)) = − (F (g(α)) − F (g(β))) = − f (x)dx = f (x)dx
α g(β) g(α)

R x lnPoliczymy całkęR nieoznaczoną ax dx. Mamy ax dx = ex ln a dx. Chcielibyśmy sprowadzić po-


R R R
Przykład 10.4.2
liczenie całki e a
dx do całki e du. Funkcja x 7→ ex ln a jest podstawieniem funkcji g : x 7→ x ln a w funkcji
u

f : u 7→ e . Ponieważ pochodną g jest funkcja stała ln a, więc z twierdzenia 10.4.1 mamy


u

1 1 1
Z Z Z Z Z 
ax dx = ex ln a dx = ex ln a ln adx = (f ◦ g) g 0 = f ◦g =
ln a ln a ln a
1 1 1 x ln a ax
Z 
eu du ◦ (x 7→ x ln a) = (eu + Const) ◦ (x 7→ x ln a) = e + Const = + Const .
ln a ln a ln a ln a

R6
Przykład 10.4.3 Policzymy całkę oznaczoną 0
√ x
1+4x
dx sprowadzając ją do policzenia całki funkcji u → f (u), w
√ g 0 (x)
której chcemy podstawić u = g(x) gdzie g(x) = 1 + 4x. Wtedy mamy g 0 (x) = √ 2
1+4x
= 2
u skąd dostajemy 1
u = 2 .
u2 −1
Mamy też x = g −1 (u) = 4 . Zatem

x u2 − 1 1 1
√ = · = (g(x)2 − 1)g 0 (x).
1 + 4x 4 u 8

Ponieważ g(0) = 1 i g(6) = 5, ze wzoru (10.9) dostajemy


5
6
1 5
1 u3 14
Z Z  
x
√ dx = (u2 − 1)du = −u = .
0 1 + 4x 8 1 8 3 1 3
10.5. TWIERDZENIA O WARTOŚCI ŚREDNIEJ DLA CAŁEK 239

10.5 Twierdzenia o wartości średniej dla całek

Twierdzenie 10.5.1 (o wartości średniej dla całek) Niech f : [a, b] → R będzie funkcją klasy C 1 , a g : [a, b] → R
funkcją całkowalną w sensie Riemanna. Jeśli g ma stały znak na [a, b] to istnieje ξ ∈ [a, b] takie, że
Z b Z b
f g = f (ξ) g. (10.10)
a a

Dowód: Rozważmy przypadek g ­ 0. Połóżmy m := inf { f (x) | x ∈ [a, b] }, M := sup { f (x) | x ∈ [a, b] }. Z twierdze-
nia 4.7.3 wiemy, że m i M są dobrze określonymi, skończonymi liczbami rzeczywistymi, bo f jest określona na przedziale
[a, b], który na mocy twierdzenia 3.6.8 jest zbiorem zwartym. Ustalmy x ∈ [a, b]. Wtedy m ¬ f (x) ¬ M , a zatem również
mg(x) ¬ f (x)g(x) ¬ M g(x). Z twierdzenia 9.2.1 dostajemy
Z b Z b Z b
m g(t)dt ¬ f (t)g(t)dt ¬ M g(t)dt.
a a a
Rb Rb
Z otrzymanej nierówności wynika, że jeśli g = 0, to również a f g = 0 i w konsekwencji (10.10) zachodzi dla dowolnie
a
Rb
dobranego ξ. Pozostaje zatem rozważyć przypadek a g 6= 0. Wtedy
Rb
fg
m ¬ Ra b ¬ M.
a
g

Zatem z twierdzenia 4.7.3 i twierdzenia 4.9.3 znajdziemy ξ ∈ [a, b] takie, że


Rb
fg
f (ξ) = Ra b
a
g

co dowodzi (10.10) dla g ­ 0. Rozumowanie dla g ¬ 0 jest analogiczne. 


Przyjmując w twierdzeniu 10.5.1 za g funkcję stale równą jeden dostajemy następujący wniosek.

Wniosek 10.5.2 Jeśli f : [a, b] → R jest klasy C 1 , to istnieje ξ ∈ [a, b] takie, że


Z b
f = f (ξ)(b − a).
a

W programie Mathematica całkę nieoznaczoną (a dokładniej jedną z funkcji pierwotnych) funkcji f obliczamy używając
instrukcji

Integrate[f[x], x]

Na przykład

Integrate[Sin[3 x]^7, x]

zwraca
35 7 7 cos(21x)
− cos(3x) + cos(9x) − cos(15x) +
192 192 960 1344
240 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA

10.6 Całkowanie funkcji wektorowych


Rozważmy funkcję f : [a, b] → Rm . Funkcję taką określać będziemy mianem krzywej. Wtedy f = (f1 , f2 , . . . , fm ) gdzie
fi : [a, b] → R dla i = 1, 2, . . . , m.

Definicja 10.6.1 Mówimy, że f jest całkowalna w sensie Riemanna jeżeli funkcje fi są całkowalne w sensie Riemanna
dla wszystkich i = 1, 2, . . . , m. W takim przypadku jako całkę Riemanna f przyjmujemy
!
Z b Z Z b Z b b
f := f1 , f2 , . . . , fm .
a a a a

Twierdzenie 10.6.2 Niech f : [a, b] → Rm będzie całkowalna w sensie Riemanna. Wtedy funkcja

||f || : [a, b] 3 x 7→ ||f (x)|| ∈ R

jest całkowalna w sensie Riemanna oraz


Z b Z b
f ¬ ||f ||.
a a

Dowód: Niech f = (f1 , f2 , . . . fm ). Z założenia funkcje fi są całkowalne w sensie Riemanna. Ponieważ funkcja

Rm 3 x 7→ ||x|| ∈ R

jest ciągła, zbiór punktów nieciągłości funkcji ||f || zawiera się w sumie mnogościowej zbiorów punktów nieciągłości funkcji
fi . Na mocy twierdzenia 9.1.19 całkowalność funkcji fi implikuje, że zbiór punktów nieciągłości funkcji fi jest miary zero.
Zatem również zbiór punktów nieciągłości funkcji ||f || jest miary zero, a więc z twierdzenia 9.1.19 wnosimy, że funkcja ta
jest całkowalna w sensie Riemanna.
Rb
Połóżmy vi := a fi i v = (v1 , v2 , . . . vm ). Jeśli v = 0 to teza jest oczywista. Załóżmy zatem, że v 6= 0. Dla x ∈ [a, b]
mamy z nierówności Schwartza
|v · f (x)| ¬ ||v|| ||f (x)||.

Funkcja
m
X
[a, b] 3 x 7→ v · f (x) = vi fi (x) ∈ R
i=1

jest całkowalna w sensie Riemanna. Zatem


m
X m
X Z b ! Z b m
X
! Z b Z b Z b
||v|| =
2
vi vi = vi fi = vi f i = v · f (x)dx ¬ ||v|| ||f (x)||dx = ||v|| ||f (x)||dx.
i=1 i=1 a a i=1 a a a

Dzieląc otrzymaną nierówność obustronnie przez ||v|| otrzymujemy


Z b
||v|| ¬ ||f (x)||dx.
a

Rb
Ponieważ v = a
f , dowodzi to tezy. 
10.7. ZASTOSOWANIA GEOMETRYCZNE CAŁEK 241

10.7 Zastosowania geometryczne całek


10.7.1 Długość krzywej
Niech γ : [a, b] → Rm będzie krzywą i niech P będzie podziałem przedziału [a, b] zadanym ciągiem punktów (x0 , x1 , . . . xn ).
Liczba
n
X
Λ(γ, P) := ||γ(xi ) − γ(xi−1 )||
i=1

określa długość łamanej rozpiętej na punktach γ(xi ).

Definicja 10.7.1 Mówimy, że krzywa γ jest prostowalna jeżeli istnieje kres górny

Λ(γ) := sup { Λ(γ, P) | P podział przedziału [a,b] }.

Mówimy wtedy, że liczba Λ(γ) jest długością krzywej γ.

Twierdzenie 10.7.2 Niech γ : [a, b] → Rm będzie krzywą klasy C 1 . Wtedy γ jest prostowalna oraz
Z b
Λ(γ) = ||γ 0 (t)||dt. (10.11)
a

Dowód: Pokażemy najpierw, że w (10.11) lewa strona jest niewiększa od prawej. Niech P będzie podziałem przedziału
[a, b] wyznaczonym przez punkty x0 , x1 , . . . xn . Wtedy
Z xi Z xi
||γ(xi ) − γ(xi−1 )|| = || γ (t)||dt ¬
0
||γ 0 (t)||dt
xi−1 xi−1

dla i = 1, 2, . . . n. Sumując po i dostajemy


Z b
Λ(γ, P) ¬ ||γ 0 (t)||dt,
a

a ponieważ P jest dowolnym podziałem [a, b] otrzymujemy


Z b
Λ(γ) ¬ ||γ 0 (t)||dt.
a

Dla dowodu nierówności przeciwnej ustalmy ε > 0. Założyliśmy, że γ jest klasy C 1 , więc γ 0 jest funkcją ciągłą. Z
twierdzenia 4.8.4 wnosimy, że γ 0 jest jednostajnie ciągła jako funkcja ciągła określona na zbiorze zwartym. Zatem znajdziemy
δ > 0 takie, że dla s, t ∈ [a, b]
ε
|s − t| < δ ⇒ ||γ 0 (s) − γ 0 (t)|| < ε0 := . (10.12)
2(b − a)
Niech P będzie podziałem przedziału [a, b] wyznaczonym przez punkty x0 , x1 , . . . xn o średnicy nie przekraczającej δ. Z
(10.12) wnosimy, że dla t ∈ [xi−1 , xi ]

||γ 0 (t)|| ¬ ||γ 0 (t) − γ 0 (xi )|| + ||γ 0 (xi )|| ¬ ||γ 0 (xi )|| + ε0 . (10.13)
242 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA

Niech ∆xi := xi − xi−1 . Z (10.13) mamy

Z xi Z xi
||γ (t)||dt ¬
0
(||γ 0 (xi )|| + ε0 ) dt = (||γ 0 (xi )|| + ε0 ) ∆xi =
xi−1 xi−1
Z xi
||γ 0 (xi )||∆xi + ε0 ∆xi = || γ 0 (xi )dt|| + ε0 ∆xi =
xi−1
Z xi
|| (γ 0 (t) + γ 0 (xi ) − γ 0 (t)) dt|| + ε0 ∆xi ¬
xi−1
Z xi Z xi
|| γ 0 (t)dt|| + || (γ 0 (xi ) − γ 0 (t)) dt|| + ε0 ∆xi ¬
xi−1 xi−1
||γ(xi ) − γ(xi−1 )|| + 2ε0 ∆xi .

Sumując po i dostajemy
Z b
||γ 0 (t)||dt ¬ Λ(γ, P) + 2ε0 (b − a) = Λ(γ, P) + ε ¬ Λ(γ) + ε.
a

Ponieważ otrzymana nierówność zachodzi dla każdego ε > 0, otrzymujemy

Z b
||γ 0 (t)||dt ¬ Λ(γ).
a

Przykład 10.7.3 Rozważmy krzywą


γ : [0, 2π] 3 t 7→ eit ∈ R2 .
Krzywa ta jest klasy C 1 oraz γ 0 (t) = ieit . Zatem ||γ 0 (t)|| = 1. Stąd
Z 2π Z 2π
Λ(γ) = ||γ (t)||dt =
0
dt = 2π − 0 = 2π.
0 0

10.7.2 Objętość i pole powierzchni bocznej bryły obrotowej

Niech f : [a, b] → R+ będzie funkcją ciągłą. Rozważmy bryłę

V := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 ¬ f (x)2 }

Nazywamy ją bryłą obrotową zadaną przez funkcję f .


Obj˛etość takiej bryły oraz pole powierzchni bocznej można wyliczyć w oparciu o podane niżej twierdzenia. Nie wgł˛ebiamy si˛e w ich dowody, bo wymagałoby
to najpierw podania formalnej definicji co rozumiemy przez obj˛etość i pole powierzchni bocznej czego nie b˛edziemy tu robić.
10.7. ZASTOSOWANIA GEOMETRYCZNE CAŁEK 243

Bryła ta powstaje poprzez obrót trapezu krzywoliniowego pod wykresem funkcji f wokół osi x.

Twierdzenie 10.7.4 Objętość bryły obrotowej dana jest wzorem


Z b
π f (x)2 dx.
a

Powierzchnią boczną bryły obrotowej jest zbiór

S := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 = f (x)2 }

Twierdzenie 10.7.5 Jeśli funkcja f jest klasy C 1 , to pole powierzchni bocznej bryły obrotowej dane jest wzorem
Z b
2π f (x) 1 + f 0 (x)2 dx.
p
a
244 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Rozdział 11

Ciągi i szeregi funkcyjne

Tak jak badaliśmy zbieżność ciagów


˛ i szeregów liczbowych naturalne jest pytanie o zbieżność ciagów
˛ i szeregów funkcji. Pojawiaja si˛e tu jednak co najmniej dwie
możliwości zdefiniowania takiej zbieżności. Najprostsza definicja, tak zwana zbieżność punktowa, sprowadza si˛e do postulatu by dla każdego argumentu stosowny
ciag
˛ lub szereg wartości funkcji w tym argumencie był zbieżny. Niestety, jak zobaczymy, własności funkcji tworzacych˛ ciag
˛ lub szereg takie jak różniczkowalność
czy całkowalność, niekoniecznie przysługuja˛ funkcji w granicy. Dlatego rozważać b˛edziemy również inne rodzaje zbieżności, które gwarantuja˛ lepsze własności
funkcji granicznej.

11.1 Zbieżność punktowa i jednostajna


11.1.1 Zbieżność punktowa
Niech X będzie ustalonym zbiorem, a Y ustaloną przestrzenią metryczną. Rozważmy ciąg funkcji sn : X → Y .

Definicja 11.1.1 Mówimy, że ciąg sn jest zbieżny punktowo do funkcji s : X → Y , jeżeli dla każdego punktu x ∈ X
ciąg sn (x) jest zbieżny do s(x).

Rozpisując warunek na zbieżność ciągu możemy zatem zbieżność punktową zapisać

∀x ∈ X ∀ε > 0 ∃N ∈ N ∀n ­ N %(sn (x), s(x)) < ε.

Przykład 11.1.2 Rozważmy ciąg funkcji

fn : [0, 1] 3 x 7→ xn ∈ [0, 1]

którego pierwszych 20 wyrazów zobrazowano na rys. 11.1 . Łatwo policzyć, że ciąg ten jest zbieżny punktowo do
funkcji f : [0, 1] → [0, 1] danej wzorem (
0 gdy x ∈ [0, 1),
f (x) :=
1 gdy x = 1.
Choć funkcje fn są ciągłe, funkcja graniczna f nie jest ciągła. Widzimy zatem, że zbieżność punktowa funkcji ciągłych
nie gwarantuje, że funkcja graniczna będzie ciągła.

245
246 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

1.0

0.8

0.6

0.4

0.2

0.2 0.4 0.6 0.8 1.0

Rysunek 11.1: Wykresy ciągu funkcji x 7→ xn dla n od 1 do 20. Widać, że wartości zbiegają do zera dla wszystkich x z
wyjątkiem x = 1

1.0 1.0 1.0

0.8 0.8 0.8

0.6 0.6 0.6

0.4 0.4 0.4

0.2 0.2 0.2

0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0

Rysunek 11.2: Wykresy funkcji x 7→ cos2m (n!πx) dla m = 10 oraz n = 2, 3, 4. Przy m → ∞ funkcje graniczne f2 , f3 , f4
zerują się wszędzie z wyjątkiem odpowiednio zbioru punktów { n!
k
| k = 0, 1, . . . n! } dla n = 2, 3, 4.
11.1. ZBIEŻNOŚĆ PUNKTOWA I JEDNOSTAJNA 247
2

1.0 1

0.5

1 2 3 4 5 6 1 2 3 4 5 6
-0.5

-1.0 -1

-2

Rysunek 11.3: Po lewej wykresy ciągu funkcji x 7→ sin


√nx dla n od 1 do 4. Po prawej wykresy ich pochodnych. Widać, że dla
n
wielokrotności π wartości pochodnych rozbiegają do nieskończoności.

Przykład 11.1.3 Rozważmy ciąg funkcji

fn : [0, 1] 3 x 7→ lim cos2m (n!πx) ∈ [0, 1].


m→∞

Funkcje x 7→ cos(n!πx))2m dla m = 10 oraz n = 2, 3, 4 zobrazowano na rys. 11.2 . Funkcja cos przyjmuje wartości w
przedziale [−1, 1]. Zatem ciąg m 7→ cos2m (u) zmierza do zera dla wszystkich u ∈ R z wyjątkiem wielokrotności π kiedy
jest to ciąg stale równy jeden. Ponieważ w naszym przykładzie argument u ma postać n!πx, jest on wielokrotnością
π dla skończonej liczby punktów x = n! k
gdzie k = 0, 1, 2, . . . n!. W konsekwencji dla każdego n funkcja fn przyjmuje
wartość zero wszędzie poza skończoną liczbą punktów, gdzie przyjmuje wartość jeden. Zatem każda z funkcji fn jest
całkowalna w sensie Riemanna. Ponieważ każda liczba wymierna daje się przedstawić w postaci x = n! k
dla odpowiednio
dużych k oraz n, ciąg fn jest zbieżny punktowo do funkcji f : [0, 1] → [0, 1] danej wzorem
(
0 gdy x 6∈ [0, 1] ∩ Q,
f (x) :=
1 gdy x ∈ [0, 1] ∩ Q.

Nie jest to funkcja całkowalna w sensie Riemanna, zatem zbieżność punktowa nie gwarantuje również zachowania
całkowalności w sensie Riemanna.

Przykład 11.1.4 Rozważmy ciąg funkcji


sin nx
fn : R 3 x 7→ √ ∈ R,
n

którego pierwsze cztery wyrazy zobrazowano na rys. 11.3 . Łatwo sprawdzić, że ciąg ten jest punktowo zbieżny do
funkcji stale równej zero. Wszystkie funkcje fn są różniczkowalne, a ich pochodne tworzą ciąg

fn0 : R 3 x 7→ n cos nx ∈ R.

Ciąg pochodnych nie jest ciągiem punktowo zbieżnym. Na przykład dla x = π dostajemy ciąg

n 7→ (−1)n n,

który nie jest zbieżny. Zatem zbieżność punktowa funkcji różniczkowalnych nie gwarantuje, że ciąg pochodnych jest
punktowo zbieżny.
Przedstawione przykłady pokazują, że punktowa zbieżność ciągu funkcji nie gwarantuje naturalnych własności, które w
wielu sytuacjach byłyby przydatne. Pojawia się pytanie, czy nie ma jakiegoś bardziej użytecznego pojęcia zbieżności ciągu
248 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

funkcji. Jak zobaczymy odpowiedź na to pytanie jest pozytywna. W tym celu potraktujemy funkcje jako punkty stosownie
zdefiniowanej przestrzeni metrycznej.

11.1.2 Zbieżność jednostajna


Niech %, %0 będą dwoma metrykami w zbiorze Y .

Definicja 11.1.5 Mówimy, że metryki % i %0 są jednostajnie równoważne, jeżeli zachodzą następujące dwa symetryczne
warunki

∀ε > 0 ∃δ > 0 %(x, y) < δ ⇒ %0 (x, y) < ε,


∀ε > 0 ∃δ > 0 %0 (x, y) < δ ⇒ %(x, y) < ε.

Definicja 11.1.6 Niech (Y, %) będzie przestrzenią metryczną. Mówimy, że % jest metryką ograniczoną, jeżeli istnieje
stała M > 0 taka, że dla dowolnych x, y ∈ Y mamy %(x, y) < M .

Mamy następującą użyteczną własność:

Lemat 11.1.7 Dla dowolnej przestrzeni metrycznej (Y, %) istnieje metryka ograniczona %0 jednostajnie równoważna
metryce %.

Dowód: Ustalmy M > 0 i zdefiniujmy odwzorowanie %̄ : Y × Y → R∗ wzorem %̄(x, y) := min(M, %(x, y)). Łatwo
sprawdzić, że %̄ jest również metryką na Y i to jednostajnie równoważną metryce %. 
Przypomnijmy, że dla zbiorów X, Y przez

F (X, Y ) := { f : X → Y }

oznaczamy zbiór funkcji z X do Y .


Z jednej strony F (X, Y ) to po prostu jakiś tam kolejny zbiór. Okazuje si˛e jednak, że wiele użytecznych własności ciagów
˛ funkcji można uzyskać analizujac
˛
ciagi
˛ funkcji ogólnymi metodami wypracowanymi dla ciagów ˛ w przestrzeniach metrycznych. W tym celu trzeba jednak w zbiorze F (X, Y ) wprowadzić jakaś ˛
użyteczna˛ metryk˛e.

Twierdzenie 11.1.8 Niech X będzie dowolnym zbiorem, a (Y, %) przestrzenią metryczną z metryką ograniczoną. Funk-
cja %̄ : F (X, Y ) × F (X, Y ) → R∗ dana wzorem

%̄(f, g) := sup { %(f (x), g(x)) | x ∈ X } (11.1)

jest metryką w F (X, Y ).

Dowód: ćwiczenie.

Definicja 11.1.9 Metrykę daną wzorem (11.1) nazywamy metryką jednostajną na F (X, Y ) powiązaną z metryką %
na Y . Każdą zbieżność względem tej metryki nazywamy zbieżnością jednostajną.

Aby uprościć oznaczenia, będziemy też pisać %(f, g) w miejsce %̄(f, g), gdyż po typie argumentów można poznać, czy
chodzi o metrykę w Y czy o metrykę jednostajną w F (X, Y ).
Rozpisując bardziej szczegółowo definicję metryki jednostajnej, zbieżność jednostajną można wyrazić na wiele równo-
ważnych sposobów jak to zapisano w następującym oczywistym wniosku z twierdzenia 11.1.8 i definicji 11.1.9 .
11.1. ZBIEŻNOŚĆ PUNKTOWA I JEDNOSTAJNA 249

1.5

1.0

0.5

2 3 4 5

-0.5

-1.0

-1.5

Rysunek 11.4: Kulę wokół funkcji o czarnym wykresie można sobie wyobrażać jako zbiór funkcji, których wykresy mieszczą
się w pasie oznaczonym linią przerywaną. W szczególności są to funkcje o wykresie niebieskim i zielonym. Natomiast funkcja
o wykresie czerwonym nie mieści się w tej kuli, bo jej wykres wychodzi poza pas. Promień kuli to połowa szerokości pasa
mierzonej w pionie.

Wniosek 11.1.10 Niech fn : X → Y dla n = 1, 2, . . . oraz f : X → Y będą funkcjami. Następujące warunki są


równoważne

(i) ciąg funkcji fn zmierza jednostajnie do funkcji f ,


(ii) ∀ε > 0 ∃N ∈ N ∀n ­ N %(fn , f ) < ε,
(iii) ∀ε > 0 ∃N ∈ N ∀n ­ N sup { %(fn (x), f (x)) | x ∈ X } < ε,

(iv) ∀ε > 0 ∃N ∈ N ∀n ­ N ∀x ∈ X %(fn (x), f (x)) < ε,


(v) limn→∞ sup { %(fn (x), f (x)) | x ∈ X } = 0.


Łatwo jest wydedukować również następujący wniosek.

Wniosek 11.1.11 Jeśli ciąg funkcji fn jest zbieżny jednostajnie do funkcji f , to jest on również zbieżny punktowo do
f. 

Trudno jest wyobrazić sobie zbiór funkcji jako przestrzeń metryczna,˛ bo w przestrzeni metrycznej F (X, Y ) funkcja jest tylko punktem, a myślac ˛ o intuicji
funkcji zazwyczaj wyobrażamy sobie wykres funkcji, który nie jest punktem. W przypadku gdy X = Y = R można jednak zrobić rysunek, który troch˛e
˛ jak wyobrazić sobie funkcje, które leża˛ nie dalej niż r > 0 od danej funkcji f , czyli leża˛ w kuli o środku w funkcji f i
ukierunkowuje nasza˛ intuicj˛e pokazujac
promieniu r . Mianowicie przesuwajac˛ wykres funkcji f o r w gór˛e i w dół uzyskujemy pas o szerokości 2r . Kula w F (X, Y ) o środku w funkcji f i promieniu r
obejmuje wszystkie funkcje, których wykres mieści si˛e w tym pasie (rys. 11.4 ).
W rozważanym zbiorze funkcji F (X, Y ) zastąpmy teraz przestrzeń metryczną Y unormowaną przestrzenią wektorową
V nad ustalonym ciałem F. Norma zadaje w V metrykę, jest to więc uszczególnienie rozważanego już przypadku. W takim
przypadku w F (X, V ) możemy zadać strukturę przestrzeni wektorowej nad F przyjmując dla f, g ∈ F (X, V ) oraz α ∈ F, że
250 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

f + g oraz αf to funkcje w zbiorze F (X, V ) zadane odpowiednio wzorami

f +g : X 3 x 7→ f (x) + g(x) ∈ V, (11.2)


αf : X 3 x 7→ αf (x) ∈ V. (11.3)

Twierdzenie 11.1.12 Zbiór F (X, V ) z działaniami określonymi wzorami (11.2) i (11.3) jest przestrzenią wektorową
nad F.

Ćwiczenie 11.1.13 Udowodnić twierdzenie 11.1.12 .


Bardziej delikatne jest pytanie, czy w F (X, V ) możemy zadać normę. Można to zrobić przy dodatkowym założeniu, że
rozważać będziemy tylko funkcje ograniczone. Przypomnijmy, że funkcja f : X → Y o wartościach w przestrzeni metrycznej
jest ograniczona jeżeli zbiór wartości f (X) zawiera się w pewnej kuli w przestrzeni Y . W szczególności, funkcja f ∈ F (X, V )
o wartościach w przestrzeni wektorowej unormowanej jest ograniczona jeżeli istnieje R > 0 takie, że dla każdego x ∈ X
zachodzi ||f (x)|| ¬ R.

Twierdzenie 11.1.14 Przyjmijmy oznaczenie

B(X, V ) := { f ∈ F (X, V ) | f jest ograniczona. }

Wtedy B(X, V ) jest podprzestrzenią przestrzeni wektorowej F (X, V ). Co więcej, odwzorowanie

|| · || : B(X, V ) 3 f 7→ ||f || := sup { ||f (x)|| | x ∈ X }

jest normą w B(X, V ), więc B(X, V ) jest przestrzenią wektorową unormowaną.

Ćwiczenie 11.1.15 Udowodnić twierdzenie 11.1.14 .

Twierdzenie 11.1.16 Jeśli Y jest przestrzenią metryczną zupełną, to F (X, Y ) jest przestrzenią metryczną zupełną.

Dowód: Niech (fn )∞


n=1 ⊂ F (X, Y ) będzie ciągiem Cauchy’ego. Oznacza to, że

∀ε > 0 ∃N ∈ N ∀n, m ­ N %(fn , fm ) < ε.

Ustalmy x ∈ X. Wprost z definicji metryki jednostajnej dostajemy %(fn (x), fm (x)) ¬ %(fn , fm ) dla n, m ∈ N, a stąd
natychmiast wnosimy, że ciąg wartości (fn (x))∞
n=1 ⊂ Y jest również ciągiem Cauchy’ego. Ponieważ założyliśmy, że Y jest
zupełna, ciąg ten jest zbieżny. Mamy więc dobrze zdefiniowaną funkcję

f : X 3 x 7→ lim fn (x) ∈ Y,
n→∞

a ciąg funkcji(fn )∞
n=1 zmierza punktowo do funkcji f . Pokażemy, że ciąg ten zmierza do f jednostajnie. W tym celu ustalmy
ε > 0 i, wykorzystując założenie, że (fn )∞n=1 jest ciągiem Cauchy’ego, dobierzmy do niego N ∈ N takie, że dla n, m ­ N
zachodzi %(fn , fm ) < 2ε , a więc w szczególności %(fn (x), fm (x)) < 2ε dla wszystkich x ∈ X. Przechodząc w ostatniej
nierówności przy ustalonym n ­ N z m do granicy w nieskończoności dostajemy z twierdzenia o zachowaniu nierówności
w granicy, że %(fn (x), f (x)) ¬ 2ε dla wszystkich x ∈ X oraz n ­ N . Biorąc po lewej stronie kres górny względem x ∈ X
dostajemy %(fn , f ) ¬ 2ε < ε dla n ­ N , co dowodzi jednostajnej zbieżności. 
11.1. ZBIEŻNOŚĆ PUNKTOWA I JEDNOSTAJNA 251

11.1.3 Kryterium Cauchy’ego zbieżności jednostajnej


Warunek Cauchy’ego w przestrzeni F (X, Y ) może być przeformułowany następująco.

Twierdzenie 11.1.17 Niech X będzie dowolnym zbiorem, a Y przestrzenią metryczną zupełną. Ciąg funkcji N 3 n 7→
fn ∈ F (X, Y ) jest zbieżny jednostajnie wtedy i tylko wtedy gdy

∀ε > 0 ∃N ∈ N ∀n, m ­ N ∀x ∈ X %(fn (x), fm (x)) < ε. (11.4)

Dowód: Najpierw zauważmy, że warunek Cauchy’ego jest równoważny warunkowi Cauchy’ego, w którym silną nierówność
< ε zastąpiono słabą nierównością ¬ ε. Z nierówności silnej wynika słaba. Odwrotna implikacja dla ustalonego ε nie zachodzi,
ale warunek ma być dla każdego ε > 0, więc aby zagwarantować silną nierówność dla ε > 0 wystarczy zagwarantować słabą
nierówność dla 2ε . Rozpisując definicję warunku Cauchy’ego ze słabą nierównością w przestrzeni F (X, Y ) i zastępując w nim
warunek %(fn , fm ) ¬ ε równoważnym mu warunkiem %(fn (x), fm (x)) ¬ ε dla wszystkich x ∈ X dostajemy warunek (11.4).

Poniższa uwaga pokazuje pierwsze pożytki z pojęcia jednostajnej zbieżności.

Uwaga 11.1.18 Niech X będzie dowolnym zbiorem, a V przestrzenią wektorową unormowaną zupełną. Załóżmy, że
7 fn ∈ F (X, V ) jest jednostajnie zbieżny do funkcji f ∈ F (X, V ). Wtedy f też jest
ciąg funkcji ograniczonych N 3 n →
funkcją ograniczoną.

Dowód: Z jednostajnej zbieżności ciągu (fn )∞n=1 do f znajdziemy N ∈ N takie, że ||fn − f || ¬ 1 dla n ­ N . Ustalmy
n ­ N . Wtedy dla x ∈ X mamy
||f (x)|| ¬ ||f (x) − fn (x)|| + ||fn (x)|| ¬ 1 + ||fn ||,
co dowodzi, że f jest ograniczona. 
Z uwagi 11.1.18 dostajemy następujące twierdzenie.

Twierdzenie 11.1.19 Niech X będzie dowolnym zbiorem, a V przestrzenią wektorową unormowaną, zupełną. Wtedy
B(X, V ) jest przestrzenią metryczną zupełną.

Dowód: Na mocy twierdzenia 3.7.9 wystarczy pokazać, że przestrzeń B(X, V ) jest podprzestrzenią domkniętą przestrzeni
F (X, V ). Ale to wynika natychmiast z twierdzenia 3.4.5 i uwagi 11.1.18 . 
Mamy też następujące twierdzenie o jednostajnej zbieżności szeregu funkcji.

Twierdzenie 11.1.20 Niech X będzie dowolnym zbiorem, a V przestrzenią wektorową unormowaną zupełną. Niech
P0∞3 n 7→ fn ∈ B(X, V ) będzie ciągiem funkcji ograniczonych, a M : N0 → [0, ∞) ciągiem liczb
N P∞ takim, że szereg
n=0 M n jest zbieżny. Jeśli dla wszystkich x ∈ X i n ∈ N 0 zachodzi ||fn (x)|| ¬ M n , to szereg n=0 fn jest zbieżny
jednostajnie.
P∞
Dowód: Ponieważ szereg n=0 P Mn jest zbieżny, jego ciąg sum częściowych jest
Pn ciągiem Cauchy’ego. Zatem do ustalonego
n
εP> 0 dobierzemy N ∈ N takie, że i=m Mi < ε dla n ­ m ­ N . Niech sn := i=0 fi oznacza n-tą sumę częściową szeregu

n=0 fn . Mamy
Xn n
X
||(sn − sm )(x)|| ¬ ||fi (x)|| ¬ Mi < ε
i=m+1 i=m+1

co dowodzi, że ciąg sum częściowych sn jest ciągiem Cauchy’ego. Ale na mocy twierdzenia 11.1.19 przestrzeń P∞ B(X, V )
jest zupełna, więc ciąg sum częściowych jest ciągiem zbieżnym w przestrzeni B(X, V ), co oznacza, że szereg n=0 fn jest
zbieżny jednostajnie. 
Ponadto zachodzi następujące twierdzenie.
252 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

Twierdzenie 11.1.21 Niech X będzie dowolnym zbiorem, a V przestrzenią wektorową unormowaną zupełną. Załóżmy,
że ciągi funkcyjne N 3 n 7→ fn ∈ B(X, V ) i N 3 n 7→ gn ∈ B(X, V ) są zbieżne jednostajnie odpowiednio do funkcji
f ∈ B(X, V ) i funkcji g ∈ B(X, V ), a a, b ∈ R są ustalonymi liczbami rzeczywistymi. Wtedy ciąg funkcyjny afn + bgn
jest zbieżny jednostajnie do funkcji af + bg.
Dowód: Mamy dla wszystkich n ∈ N

||(afn + bgn ) − (af + bg)|| ¬ |a| ||fn − f || + |b| ||gn − g||.

Wnosimy stąd, że

0 ¬ lim ||(afn + bgn ) − (af + bg)|| ¬ |a| lim ||fn − f || + |b| lim ||gn − g|| = 0,
n→∞ n→∞ n→∞

co dowodzi żądanej jednostajnej zbieżności. 

11.2 Zbieżność jednostajna, a ciągłość, różniczka i całka


11.2.1 Granica, a zbieżność jednostajna

Twierdzenie 11.2.1 Niech X będzie przestrzenią topologiczną, a Z przestrzenią metryczną zupełną. Załóżmy, że ciąg
funkcyjny N 3 n 7→ fn ∈ F (X, Z) jest zbieżny jednostajnie do funkcji f ∈ F (X, Z), x0 ∈ X jest punktem skupienia
przestrzeni X oraz dla każdego n ∈ N istnieją granice limx→x0 fn (x) =: an . Wtedy ciąg N 3 n 7→ an jest zbieżny,
istnieje też granica limx→x0 f (x) i zachodzi równość limn→∞ an = limx→x0 f (x), którą możemy też rozpisać w postaci

lim lim fn (x) = lim lim fn (x). (11.5)


n→∞ x→x0 x→x0 n→∞

W szczególności, jeśli funkcje fn są ciągłe w x0 , to funkcja f jest ciągła w x0 .


Dowód: Ustalmy ε > 0 i z założonej jednostajnej zbieżności dobierzmy do tego ε takie N ∈ N, że

∀x ∈ X m, n ­ N ⇒ %(fn (x), fm (x)) < ε.

Przechodząc w tej nierówności z x do granicy w x0 dostajemy

m, n ­ N ⇒ %(an , am ) ¬ ε.

Ponieważ Z jest przestrzenią metryczną zupełną oznacza to, że istnieje a := limn→∞ an .


Dobierzmy teraz do ε > 0 takie N1 ∈ N, że
ε
n ­ N1 ⇒ ∀x ∈ X %(fn (x), f (x)) <
3
oraz N2 ∈ N, że
ε
n ­ N2 ⇒ %(an , a) <
3
Ponieważ w szczególności dla n0 := max(N1 , N2 ) istnieje granica limx→x0 fn0 (x) = an0 , możemy dobrać otoczenie U punktu
x0 takie, że
ε
x ∈ U \ {x0 } ⇒ %(fn0 (x), an0 ) < .
3
Zatem dla x ∈ U \ {x0 } mamy
ε ε ε
%(f (x), a) ¬ %(f (x), fn0 (x)) + %(fn0 (x), an0 ) + %(an0 , a) < + + = ε.
3 3 3
11.2. ZBIEŻNOŚĆ JEDNOSTAJNA, A CIĄGŁOŚĆ, RÓŻNICZKA I CAŁKA 253
1.2

1.0 ... f5 f4 f3 f2 f1

0.8

0.6

0.4

0.2

0.5 1.0 1.5 2.0

-0.2

Rysunek 11.5: Ciąg funkcji zbieżny punktowo, ale nie jednostajnie do funkcji ciągłej, a konkretnie do funkcji stałej zero.

Dowodzi to, że granica limx→x0 f (x) istnieje i jest równa limn→∞ an . W szczególności, jeśli funkcje fn są ciągłe w x0 , to
an = fn (x0 ) oraz
lim f (x) = lim fn (x0 ) = f (x0 )
x→x0 n→∞

co dowodzi ciągłości f w x0 . 
W szczególności, stosując twierdzenie 11.2.1 do funkcji ciągłych, dostajemy następujący wniosek.

Wniosek 11.2.2 Niech X będzie przestrzenią topologiczną, a Z przestrzenią metryczną zupełną. Jeśli ciąg funkcyjny
N 3 n 7→ fn ∈ F (X, Z) funkcji ciągłych jest zbieżny jednostajnie do funkcji f ∈ F (X, Z), to f jest funkcją ciągłą. 

Wniosek ten możemy przeformułować następująco.

Uwaga 11.2.3 Niech X będzie przestrzenią topologiczną, a Z przestrzenią metryczną zupełną. Przestrzeń funkcji
ciągłych C(X, Z) jest domkniętą podprzestrzenią przestrzeni F (X, Z). W szczególności jest to przestrzeń zupełna. 

Zauważmy, że zbieżność jednostajna ciągu funkcji ciągłych nie jest warunkiem koniecznym ciągłości granicy. Rozważmy
bowiem ciąg funkcji fn : R → R zadany wzorem

nx
 gdy x ∈ [0, n1 ],
fn (x) := −nx + 2 gdy x ∈ [ n1 , n2 ],
0 w pozostałych przypadkach.

Kilka pierwszych funkcji tego ciągu zobrazowano na rys. 11.5 . Łatwo sprawdzić, że ciąg ten jest punktowo zbieżny do
funkcji stałej, która oczywiście jest ciągła. Jednak nie jest to ciąg jednostajnie zbieżny, bo fn ( n1 ) = 1 dla wszystkich n ∈ N.

11.2.2 Całkowanie, a zbieżność jednostajna


Mamy następujące twierdzenie o przejściu do granicy przy całkowaniu ciągu funkcji.
254 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

Twierdzenie 11.2.4 Rozważmy ciąg funkcji N 3 n 7→ fn ∈ Riem([a, b], R) całkowalnych w sensie Riemanna na
przedziale zwartym [a, b] ⊂ R. Jeśli ciąg ten zmierza jednostajnie do funkcji f ∈ B([a, b], R) to f ∈ Riem([a, b], R) oraz

f = limn→∞ fn . (11.6)
R R

Dowód: Przyjmijmy εn := ||fn − f ||. Z założenia wiemy, że limn→∞ εn = 0. Mamy w szczególności fn − εn ¬ f ¬ fn + εn ,


zatem z twierdzenia 9.2.1 dostajemy

fn − εn (b − a) = (fn − εn ) ¬ L(f ) ¬ U (f ) ¬ (fn + εn ) = fn + εn (b − a). (11.7)


R R R R

Tak więc
0 ¬ U (f ) − L(f ) ¬ fn + εn (b − a) − fn − εn (b − a) = 2εn (b − a)
R  R 

co w granicy przy n → ∞ daje L(f ) = U (f ) i dowodzi, że f ∈ Riem([a, b], R). Zatem z (11.7) dostajemy

0¬ f − fn ¬ εn (b − a)
R R

dla dowolnego n ∈ N. Stąd, po przejściu z n do nieskończoności, otrzymujemy (11.6). 


Z twierdzenia 11.2.4 dostajemy następujący wniosek.

Wniosek 11.2.5 Rozważmy ciągP funkcji Nk 3 n 7→ fn ∈ Riem([a, b], R) całkowalnych w sensie Riemanna na przedziale

zwartym [a, b] ⊂ R. Jeśli szereg n=k fn jest jednostajnie zbieżny do funkcji f ∈ B([a, b], R) to f ∈ Riem([a, b], R)
oraz Z b X∞ Z b
f= fn .
a n=k a

11.2.3 Różniczkowanie, a zbieżność jednostajna

Twierdzenie 11.2.6 Rozważmy ciąg funkcji N 3 n 7→ fn ∈ F ([a, b], Rd ) różniczkowalnych taki, że dla pewnego
x0 ∈ [a, b] istnieje granica limn→∞ fn (x0 ), a ciąg pochodnych N 3 n 7→ fn0 jest zbieżny jednostajnie. Wtedy sam ciąg
n 7→ fn jest zbieżny jednostajnie do pewnej różniczkowalnej funkcji f : [a, b] → Rd oraz

f 0 (x) = lim fn0 (x)


n→∞

dla x ∈ [a, b].

Dowód: Ustalmy ε > 0. Wykorzystując zupełność R, zbieżność ciągu wartości funkcji w x0 oraz jednostajną zbieżność
ciągu pochodnych znajdziemy N ∈ N takie, że dla n, m ­ N zachodzą nierówności
ε ε
||fn (x0 ) − fm (x0 )|| < oraz ∀x ∈ X ||fn0 (x) − fm
0
(x)|| < .
2 2(b − a)

Z twierdzenia 8.8.4 o przyrostach skończonych zastosowanego do funkcji fn − fm dostajemy dla t, x ∈ [a, b], n, m ­ N i
pewnego ξ ∈ [a, b] dobranego do t, x i n, m
ε ε
||fn (x) − fm (x) − (fn (t) − fm (t))|| ¬ ||fn0 (ξ) − fm
0
(ξ)|| · |x − t| ¬ · |x − t| ¬ . (11.8)
2(b − a) 2
11.2. ZBIEŻNOŚĆ JEDNOSTAJNA, A CIĄGŁOŚĆ, RÓŻNICZKA I CAŁKA 255
1.0

0.8

0.6

0.4

0.2

-4 -2 2 4

Rysunek 11.6: Wykres zerowego (niebieski), pierwszego (żółty) i drugiego (zielony) wyrazu szeregu funkcyjnego (11.9).

Stąd, dla dowolnych t, x ∈ [a, b] i n, m ­ N dostajemy


ε ε
||fn (x) − fm (x)|| ¬ ||fn (x) − fm (x) − (fn (x0 ) − fm (x0 ))|| + ||fn (x0 ) − fm (x0 )|| < + = ε.
2 2
Zatem z zupełności F ([a, b], Rd ) wnosimy, że fn zmierza jednostajnie do pewnej funkcji f ∈ F ([a, b], Rd ). Ustalmy x̄ ∈ [a, b]
i zdefiniujmy funkcje częściowe ϕ, ϕn : [a, b] 9 Rd określone dla h ∈ R \ {0} takich, że x̄ + h ∈ [a, b] wzorami
fn (x̄ + h) − fn (x̄) f (x̄ + h) − f (x̄)
ϕn (h) := oraz ϕ(h) := .
h h
Zbieżność fn do f implikuje punktową zbieżność ϕn do ϕ. Podstawiając w (11.8) x := x̄ + h, t := x̄ dostajemy dla m, n ­ N
1 1 ε|h| ε
||ϕn (h) − ϕm (h)|| ¬ ||(fn − fm )(x̄ + h) + (fn − fm )(x̄)|| ¬ · = .
|h| |h| 2(b − a) 2(b − a)
Pokazana nierówność dowodzi, że ciąg funkcji ϕn spełnia warunek Cauchy’ego zbieżności jednostajnej, zatem zmierza jed-
nostajnie do ϕ. Z kolei z definicji różniczkowalności funkcji fn w x̄ wiemy, że limh→0 ϕn (h) = fn0 (x̄). Ze wzoru (11.5) w
twierdzeniu 11.2.1 ostatecznie dostajemy

lim fn0 (x̄) = lim lim ϕn (h) = lim lim ϕn (h) = lim ϕ(h) = f 0 (x̄).
n→∞ n→∞ h→0 h→0 n→∞ h→0

11.2.4 Funkcja ciągła nigdzie nieróżniczkowalna


W drugiej połowie XIX wieku toczyła si˛e dyskusja nad intuicyjnie przekonujac ˛ a˛ hipoteza,˛ że funkcja ciagła
˛ musi być różniczkowalna wsz˛edzie z wyjatkiem
˛ co
najwyżej zbioru izolowanych punktów w dziedzinie. W roku 1872 Karol Weierstrass (ryc. 1.18 ) jako pierwszy podał przykład funkcji ciagłej ˛ f : R → R,
nieróżniczkowalnej w żadnym punkcie. Przykład nie zamknał˛ dyskusji. Choć nie kwestionowano jego poprawności, funkcje tego rodzaju uznawano za przeczace ˛
intuicji monstra aż do czasu pojawienia si˛e komputerów, kiedy to po raz pierwszy przybliżenia takich funkcji dało si˛e łatwo zobrazować. Dziś wiemy, że wykresy
takich funkcji sa˛ przykładami tak zwanych fraktali. Sa˛ to figury geometryczne o nieintuicyjnych własnościach, a mimo to dobrze modelujace ˛ pewne zjawiska w
naturze.

Przykład 11.2.7 Niech ϕ : R → R będzie funkcją okresową o okresie 2 dla x ∈ [−1, 1] spełniającą równość ϕ(x) = |x|.
Łatwo sprawdzić, że ϕ jest funkcją Lipschitza ze stałą jeden. Co więcej, jeśli pomiędzy s, t ∈ R nie ma liczby całkowitej,
to |ϕ(s) − ϕ(t)| = |s − t|. Zdefiniujmy funkcję f : R → R dla x ∈ R jako sumę szeregu funkcyjnego
∞  n
X 3
f (x) := ϕ(4n x). (11.9)
n=0
4

Początkowe wyrazy tego szeregu zobrazowano na rysunku 11.6 , zerową, pierwszą i drugą sumę częściową na rysunku 11.7
n n
, a dwudziestą sumę częściową na rysunku 11.8 . Ponieważ |ϕ(x)| ¬ 1, więc 43 ϕ(4n x) ¬ 43 co na mocy twierdze-
nia 11.1.20 i twierdzenia 11.2.1 oznacza, że funkcja f jest ciągła. Niech x ∈ R. Pokażemy, że f nie jest różniczkowalna w
256 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

2.0

1.5

1.0

0.5

-4 -2 2 4

Rysunek 11.7: Wykres zerowej (niebieski), pierwszej (żółty) i drugiej (zielony) sumy częściowej szeregu funkcyjnego (11.9).

2.5

2.0

1.5

1.0

0.5

-4 -2 2 4

Rysunek 11.8: Wykres sumy 20tu pierwszych wyrazów szeregu funkcyjnego (11.9) zbieżnego do funkcji ciągłej nieróżnicz-
kowalnej w żadnym punkcie. Suma ta przybliża tę funkcją z błędem mniejszym od 100
1
.
11.3. APROKSYMACJA FUNKCJI CIĄGŁYCH 257

x. Ustalmy m ∈ N i pryjmijmy δm := ± 12 4−m gdzie znak jest tak dobrany, że pomiędzy 4m x, a 4m (x + δm ) = 4m x ± 1


2 nie
ma liczby całkowitej. Dla n ∈ N połóżmy
ϕ(4n (x + δm )) − ϕ(4n x)
γn :=
δm
Pokażemy, że
(
4n gdy n ¬ m,
|γn | =
0 gdy n > m.

Załóżmy najpierw, że n ¬ m. Wtedy pomiędzy 4n (x + δm ), a 4n x nie ma liczby całkowitej, bo gdyby k ∈ Z było taką liczbą,
to wtedy 4m−n k byłoby liczbą całkowitą pomiędzy 4m (x + δm ), a 4m x. Zatem

|ϕ(4n (x + δm )) − ϕ(4n x)| |(4n (x + δm ) − 4n x| 4n |δm |


|γn | = = = = 4n .
|δm | |δm | |δm |

Natomiast gdy n > m to 4n δm = ±2 · 4n−m−1 jest liczbą parzystą, więc γn = 0, bo ϕ jest okresowa o okresie 2. Dostajemy
więc
m  n  m m−1
X  3 n  m m−1
X  3 n m−1
f (x + δm ) − f (x) X 3 3 3 X 3m + 1
= γn ­ γm − γn ­ ·4m − ·4n = 3m − 3n = .
δm n=0
4 4 n=0
4 4 n=0
4 n=0
2

Tym samym
f (x + δm ) − f (x)
lim = ∞,
m→∞ δm
co dowodzi, że f nie jest różniczkowalna w punkcie x.

11.3 Aproksymacja funkcji ciągłych


Twierdzenie o szeregu Taylora (twierdzenie 8.14.11 ) pokazuje, że funkcj˛e klasy C ∞ o wspólnie ograniczonych wszystkich pochodnych w otoczeniu pewnego
punktu daje si˛e przedstawić jako sum˛e szeregu w tym otoczeniu. Oznacza to możliwość przybliżania wartości funkcji wielomianami. Karol Weierstrass pokazał, że
takie przybliżanie możliwe jest dla dowolnej funkcji ciagłej
˛ na przedziale zwartym. W szczególności da si˛e tak przybliżać funkcj˛e z przykładu 11.2.7 . W rozdziale
tym przedstawiamy jego twierdzenie. Twierdzenie to pokazuje, że do wyznaczania przybliżeń funkcji ciagłej
˛ powinny wystarczyć dwie operacje arytmetyczne: doda-
wanie i mnożenie. Ma to istotne znaczenie dla matematyki obliczeniowej choć oczywiście jest tylko wst˛epem do poszukiwań efektywnych metod algorytmicznego
przybliżania funkcji. Systematycznym badaniem mi˛edzy innymi tego typu zagadnień zajmuje si˛e analiza numeryczna.

Twierdzenie 11.3.1 Niech F oznacza ciało liczb rzeczywistych lub ciało liczb zespolonych i niech a, b ∈ R będą takie,
że a < b. Dla każdej funkcji ciągłej f : [a, b] → F istnieje ciąg wielomianów Pn : R → F taki, że ciąg zawężeń Pn|[a,b]
zmierza jednostajnie do f przy n → ∞.

Dowód: Rozważmy najpierw szczególny przypadek gdy [a, b] = [0, 1] oraz f (0) = f (1) = 0. Wtedy możemy rozszerzyć f
do funkcji ciągłej f : R → R przyjmując f (x) := 0 dla x 6∈ [0, 1]. Dla n ∈ N połóżmy

1
cn := R 1
−1
(1 − x2 )n dx

i rozważmy wielomian
Qn : R 3 x 7→ cn (1 − x2 )n ∈ R.
258 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

2.0

1.5

1.0

0.5

-1.0 -0.5 0.5 1.0

Rysunek 11.9: Wykresy funkcji Qi dla i = 1, 2, 4, 8, 16 w kolorach od czarnego dla i = 1 do czerwonego dla i = 16. Pole pod
wykresem pozostaje stale równe jeden, natomiast wykres wraz z rosnącym i coraz bardziej koncentruje się wokół zera.

Wykres kilku takich wielomianów zawężonych do interesującego nas przedziału [−1, 1] przedstawiono na rysunku 11.9 .
Zauważmy, że współczynnik cn dobraliśmy tak, iż
Z 1 Z 1
Qn (t)dt = cn (1 − t2 )n dt = 1. (11.10)
−1 −1

Wykorzystując nierówność Bernoullego (twierdzenie 2.1.8 ) dostajemy


Z √1 Z √1 √1
4 1 1
Z 1 Z 1
x3
  n
n n
(1 − x2 )n dx = 2 (1 − x2 )n dx ­ 2 (1 − x2 )n dx ­ 2 (1 − nx2 )dx = 2 x − n = √ >√ .
−1 0 0 0 3 0 3 n n

Wnosimy stąd, że cn < n, a także, że

∀δ > 0 ∀x ∈ R δ ¬ |x| ¬ 1 ⇒ Qn (x) ¬ n(1 − δ 2 )n . (11.11)
Dla n ∈ N rozważmy funkcję Z 1
Pn : [0, 1] 3 x 7→ f (x + t)Qn (t)dt ∈ R.
−1
Pokażemy, że Z 1
Pn (x) = f (s)Qn (s − x)ds. (11.12)
0
Rzeczywiście, podstawiając s := t + x w całce definiującej Pn , korzystając z twierdzenia 10.4.1 o całkowaniu przez
podstawienie, oraz wykorzystując fakt, że [0, 1] ⊂ [−1 + x, 1 + x], a funkcja f zeruje się poza przedziałem [0, 1], dostajemy
dla x ∈ [0, 1]
Z 1+x Z 1
Pn (x) = f (s)Qn (s − x)ds = f (s)Qn (s − x)ds,
−1+x 0
co dowodzi (11.12).
Pokażemy, że Pn jest wielomianem. Ponieważ Qn jest wielomianem stopnia 2n, rozwijając potęgi (s − x)j z dwumianu
Newtona i grupując wyrazy z potęgami xj dostajemy przedstawienie
2n
X
Qn (s − x) = αi (s)xi ,
i=0
11.3. APROKSYMACJA FUNKCJI CIĄGŁYCH 259

gdzie αi są wielomianami zmiennej s, niezależnymi od x. Podstawiając to przedstawienie Qn (s − x) do wzoru (11.12) na


Pn (x) dostajemy
Z 1X2n 2n Z 1
X 
Pn (x) = f (s)αi (s)x ds =
i
f (s)αi (s) xi
0 i=0 i=0 0

co pokazuje, że Pn jest wielomianem. Ponieważ f jako funkcja ciągła o dziedzinie zwartej jest jednostajnie ciągła, do ε > 0
znajdziemy δ > 0 takie, że
ε
|x − y| < δ ⇒ |f (x) − f (y)| < . (11.13)
2
Niech M := sup { |f (x)| | x ∈ [0, 1] }. Ze twierdzenia 2.5.8 , a konkretnie ze wzoru (2.20) dla α = 21 wnosimy, że

lim 4M n(1 − δ 2 )n = 0.
n→∞

Oznacza to, że znajdziemy N ∈ N takie, że


√ ε
n ­ N ⇒ 4M n(1 − δ 2 )n < (11.14)
2
ustalmy x ∈ [0, 1] oraz n ­ N . Wykorzystując definicję funkcji Pn , wzór (11.10) oraz własności całki Riemanna otrzymujemy
Z 1 Z 1
|Pn (x) − f (x)| = f (x + t)Qn (t)dt − f (x) Qn (t)dt
−1 −1
Z 1
= [f (x + t) − f (x)]Qn (t)dt
−1
Z 1
¬ |f (x + t) − f (x)|Qn (t)dt
−1
Z −δ Z δ Z 1
= |f (x + t) − f (x)|Qn (t)dt + |f (x + t) − f (x)|Qn (t)dt + |f (x + t) − f (x)|Qn (t)dt.
−1 −δ δ

Wyrażenie |f (x + t) − f (x)| szacuje się zawsze przez 2ε gdy √


|t| < δ na mocy (11.13) , a przez 2M dla wszystkich t ze względu
na definicję M . Ponadto z (11.11) wnosimy, że Qn (t) ¬ n(1 − δ 2 )n gdy t ∈ [−1, −δ] lub t ∈ [δ, 1]. Zatem kontynuując
szacowanie |Pn (x) − f (x)| oraz wykorzystując (11.14) i ponownie (11.10) ostatecznie otrzymujemy
√ ε δ √
Z
|Pn (x) − f (x)| ¬ 2M n(1 − δ 2 )n + Qn (t)dt + 2M n(1 − δ 2 )n
2 −δ
√ ε 1
Z
¬ 4M n(1 − δ 2 )n + Qn (t)dt
2 −1
ε ε
< + = ε.
2 2
Dowodzi to, że w rozważanym przypadku ciąg wielomianów Pn zmierza jednostajnie do f .
Przypadek, w którym [a, b] = [0, 1], ale założenie f (0) = f (1) = 0 nie jest spełnione możemy sprowadzić do udowodnio-
nego już przypadku następująco. Rozważmy funkcję f¯ : [0, 1] 3 x 7→ f (x) − (f (1) − f (0))x − f (0) ∈ F. Łatwo sprawdzić, że
f¯ jest ciągła oraz f¯(0) = f¯(1) = 0. Co więcej, f¯ = f − L, gdzie L : R 3 x 7→ (f (1) − f (0))x + f (0) ∈ F jest wielomianem
stopnia jeden. Ponieważ funkcja f¯ spełnia założenia udowodnionego już przypadku, znajdziemy ciąg wielomianów n 7→ P̄n
zbieżny jednostajnie do f¯. Łatwo sprawdzić, że wtedy n 7→ Pn := P̄n + L jest ciągiem wielomianów jednostajnie zbieżnym
do f .
Pozostaje do rozważenia przypadek dowolnego przedziału [a, b] ⊂ R. Sprowadzimy go do poprzedniego analizując bijekcję
ϕ : [0, 1] 3 t 7→ (b−a)t+a ∈ [a, b] będącą zawężeniem wielomianu zmiennej t do przedziału [0, 1]. Wtedy fˆ := f ◦ϕ : [0, 1] → F,
więc z poprzedniego przypadku znajdziemy ciąg wielomianów n 7→ P̂n zbieżny jednostajnie do fˆ na przedziale [0, 1]. Łatwo
sprawdzić, że bijekcja odwrotna ϕ−1 jest też wielomianem, a n 7→ P̂n ◦ ϕ−1 jest ciągiem wielomianów jednostajnie zbieżnym
do f na [a, b]. 
260 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

11.4 Szeregi potęgowe


P∞
W rozdziale 5.3.4 rozważaliśmy szeregi postaci n=0 cn z n , gdzie z ∈ C jest ustalonym parametrem. Teraz ograniczymy
się do przypadku gdy z = x ∈ R jest zmienną rzeczywistą ale rozważymy nieco ogólniejszy przypadek szeregu postaci

X
cn (x − x0 )n (11.15)
n=0

gdzie x0 , cn , x ∈ R oraz cn ∈ R . Następujące twierdzenie dowodzi się tak samo jak twierdzenie 5.3.10 w rozdziale 5.3.4 .

Twierdzenie 11.4.1 Dla szeregu (11.15) przyjmijmy α := lim supn→∞ n |cn | i rozważmy liczbę
p


 α gdy 0 < α < ∞,
 1

R := 0 gdy α = ∞,
∞ gdy α = 0.

Szereg (11.15) jest zbieżny dla |x − x0 | < R, a rozbieżny dla |x − x0 | > R. Kryterium nie rozstrzyga zbieżności gdy
|x − x0 | = R. Liczba R nosi nazwę promień zbieżności szeregu (11.15). 
P∞
Szereg (11.15) możemy potraktować jako szereg funkcyjny, czyli rozważyć n=0 fn gdzie fn : R → R jest funkcją daną
wzorem fn (x) := cn (x − x0 )n . gdzie x0 ∈ R oraz cn ∈ R traktujemy jako parametry. Jednak, by nie mnożyć oznaczeń, o
szeregu (11.15) mówić będziemy, że jest szeregiem funkcyjnym bez jawnego wypisywania funkcji fn . Jest to mało precyzyjna,
ale powszechnie stosowana konwencja.
W kontekście szeregów funkcyjnych interesuje nas co można powiedzieć o sumie szeregu potęgowego jako funkcji zmiennej
x. Mamy następujące twierdzenie.

Twierdzenie 11.4.2 Załóżmy, że promień zbieżności R szeregu (11.15) jest dodatni. Rozważmy funkcję

f : (x0 − R, x0 + R) → R

daną dla x ∈ (x0 − R, x0 + R) jako suma szeregu (11.15) o współczynnikach cn ∈ R:



X
f (x) := cn (x − x0 )n . (11.16)
n=0

Dla r ∈ (0, R) szereg ten jest zbieżny jednostajnie do funkcji f w przedziale [x0 − r, x0 + r]. Co więcej, funkcja f jest
funkcją klasy C ∞ ,

X n!
f (k) (x) = cn (x − x0 )n−k (11.17)
(n − k)!
n=k

dla x ∈ (x0 −R, x0 +R) i R jest promieniem zbieżności tego szeregu. W szczególności pochodna f dla x ∈ (x0 −R, x0 +R)
dana jest wzorem

X
f 0 (x) = ncn (x − x0 )n−1 , (11.18)
n=1

a dla n ∈ N współczynniki cn wyrażają się poprzez pochodne wzorem

f (n) (x0 )
cn = . (11.19)
n!
11.4. SZEREGI POTĘGOWE 261

Nim przejdziemy do dowodu, zauważmy, że podstawiając h := x − x0 oraz wykorzystując (11.19) możemy wzór (11.16)
zapisać w postaci

X f (n) (x0 ) n
f (x0 + h) = h dla h ∈ (−R, R).
n=0
n!

Pokazuje to, że szereg (11.15), którego użyliśmy do skonstruowania funkcji f staje się jej szeregiem Taylora, zgodnie z
definicją 8.14.9 .
P∞
Dowód: Ustalmy r ∈p(0, R) i rozważmy x ∈ [x0 − r, x0 + r]. Mamy |cn (x − x0 )n | ¬ |cn |rn . Szereg n=0 |cn |rn jest
zbieżny, bo lim supn→∞ n |cn |rn = Rr < 1. Zatem z twierdzenia 11.1.20 wnosimy, że zbieżność szeregu (11.16) jest
jednostajna na [x0 − r, x0 + r], a wniosek 11.2.2 implikuje, że zawężenie f|[x0 −r,x0 +r] jest funkcją ciągłą jako granica
jednostajnie zbieżnegoS ciągu sum częściowych, które, jako wielomiany, są ciągłe. Oznacza to, że f jest funkcją ciągłą, bo
(x0 − R, x0 + R) = 0<r<R [x0 − r, x0 + r]. Ponadto N -ta suma częściowa szeregu (11.16) jako wielomian jest funkcją
PN −1 P∞
różniczkowalną, a jej pochodna
P∞ wynosi n=1n ncn (x − x0 )
n−1
. Promień zbieżności szeregu potęgowego n=1 ncn (x − x0 )n−1
jest taki sam jak szeregu n=1 ncn (x − x0 ) , bo jeden powstaje z drugiego przez przemnożenie przez (x − x0 ), a na mocy
twierdzenia 5.4.1 szereg zbieżny przemnożony przez liczbę pozostaje zbieżny. Zatem z (2.19) wnosimy, że wynosi on

1 1
= = R.
lim supn→∞ lim supn→∞
p p
n
n|cn | n
|cn |

Oznacza to, że szereg ten jest zbieżny jednostajnie na każdym przedziale [x0 − r, x0 + r] dla r ∈ (0, R). Z twierdzenia 11.2.6
zastosowanego do sum częściowych szeregu (11.16) dostajemy więc, że f jest różniczkowalna na każdym przedziale [x0 −
r, x0 + r] dla r ∈ (0, R) i zachodzi wzór (11.18), a promień zbieżności występującego w tym wzorze szeregu wynosi R. Zatem
argumetując indukcyjnie wnosimy, że f jest funkcją klasy C ∞ oraz zachodzi wzór (11.17). W szczególności, podstawiając
x = x0 w (11.17) i wyliczając ck dostajemy (11.19). 

11.4.1 Twierdzenie o szeregu Taylora

Funkcję, która daje się przedstawić jako suma szeregu w otoczeniu (x0 − R, x0 + R) punktu x0 można również przedstawić
jako sumę szeregu w pewnym, stosownie mniejszym, otoczeniu dowolnego innego punktu z (x0 − R, x0 + R). Dokładniej,
mamy następujące twierdzenie.

Twierdzenie 11.4.3 (twierdzenie o szeregu Taylora) Załóżmy, że funkcja f : (x0 − R, x0 + R) → R dana jest jako
suma szeregu (11.16) zbieżnego dla x ∈ (x0 − R, x0 + R). Niech x1 ∈ (x0 − R, x0 + R). Wtedy

X f (n) (x1 )
f (x) = (x − x1 )n
n=0
n!

dla x ∈ (x1 − r, x1 + r) gdzie r := R − |x1 − x0 |.

Nim udowodnimy twierdzenie 11.4.3 potrzebujemy najpierw następujący lemat o zmianie kolejności sumowania szere-
gów.
262 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

Lemat 11.4.4 Niech a : P N0 × N0 → R będzie funkcją, dla której wartości będziemy pisaćP∞ aij := a(i, j). Załóżmy, że

dla każdego i ∈ N0 szereg j=0 |aij | jest zbieżny do pewnej liczby bi ∈ R. Jeżeli szereg i=0 bi jest zbieżny, to
P∞
(i) dla wszystkich i ∈ N0 zbieżny jest szereg j=0 aij ,
P∞
(ii) dla wszystkich j ∈ N0 zbieżny jest szereg i=0 aij .
P∞ P∞ 
(iii) zbieżny jest szereg i=0 j=0 a ij ,
P∞
P∞
(iv) zbieżny jest szereg ( i=0 aij )
j=0

P∞ P∞  P
∞ P∞
(v) oraz zachodzi wzór i=0 j=0 a ij = j=0 ( i=0 aij ) .
P∞
Dowód: Ustalmy i ∈ N0 . Na mocy twierdzenia 5.2.5 o zbieżności bezwzględnej zbieżność szeregu j=0 |aij | implikuje
P∞
zbieżność szeregu j=0 aij co dowodzi własności (i). Ustalmy z kolei j ∈ N. Dla dowolnego i ∈ N0 mamy 0 ¬ |aij | ¬
P∞
j=0 |aij | = bi . Zatem
P∞
z kryterium porównawczego (twierdzenie 5.2.11 ) dostajemy bezwzględną zbieżność, a więc i
zbieżność szeregu i=0 aij przy dowolnym j ∈ N0 , co dowodzi własności (ii).
Dla dowodu P pozostałych własności rozważmy zbiór E := {0} ∪ { n1 | n ∈ N1 }. Dla i ∈ N0 zdefiniujmy funkcję fi : E → R
∞ Pn
kładąc fi (0) := j=0 aij oraz fi ( n ) := j=0 aij . Mamy
1

n ∞
1 X X
lim fi ( ) = lim aij = aij = fi (0),
n→∞ n n→∞
j=0 j=0

co pokazuje, że fi jest funkcją ciągłą, bo pozostałe punkty dziedziny fi są izolowane. Sprawdzimy, że dla x ∈ E oraz i ∈ N
zachodzi |fi (x)| ¬ bi . Rzeczywiście, gdy x = 0 mamy

X ∞
X
|fi (0)| ¬ aij ¬ |aij | = bi ,
j=0 j=0

a gdy x = 1
n mamy
n n ∞
1 X X X
|fi ( )| ¬ aij ¬ |aij | ¬ |aij | = bi .
n j=0 j=0 j=0
P∞
Zatem z twierdzenia 11.1.20 wnosimy, że szereg funkcyjny i=0 fi (x) jest zbieżny do funkcji ciągłej

X
g : E 3 x 7→ g(x) := fi (x) ∈ R.
i=0
P∞ P∞  P∞
W szczególności szereg i=0 j=0 aij = i=0 fi (0) jest zbieżny, co dowodzi (iii). Ustalmy n ∈ N. Z dowiedzionej
P∞
własności (ii) wiemy, że każdy z szeregów i=0 aij dla j = 0, 1, 2, . . . n jest zbieżny. Twierdzenie 5.4.1 mówi w szczególności,
że suma dwóch szeregów zbieżnych jest szeregiem zbieżnym, ale indukcyjnie łatwo je uogólnić do sumy dowolnej skończonej
liczby szeregów. Wnosimy zatem, że  
∞ ∞
n n
!
X X X X
 aij  = aij . (11.20)
i=0 j=0 j=0 i=0

Równocześnie z definicji funkcji fi oraz funkcji g mamy


 
∞ n ∞
X X X 1 1
 aij  = fi ( ) = g( ) (11.21)
i=0 j=0 i=0
n n
11.4. SZEREGI POTĘGOWE 263

Przechodząc w (11.21) z n do granicy w nieskończoności i wykorzystując ciągłość funkcji g dostajemy


   
∞ n ∞ ∞ ∞
X X 1 X X X
lim  aij  = lim g( ) = g(0) = fi (0) =  aij  . (11.22)
n→∞
i=0 j=0
n→∞ n i=0 i=0 j=0

P∞ Pn  P∞ P∞
Z kolei ze wzoru (11.20) wiemy, że i=0 j=0 ij jest równe n-tej sumie częściowej szeregu
a j=0 ( i=0 aij ). Zatem wzór
P∞ P∞ 
(11.22) pokazuje, że szereg ten jest zbieżny, a jego sumą jest i=0 j=0 aij co dowodzi (iv) oraz (v). 
Dowód twierdzenia 11.4.3 : Jedyne co musimy pokazać, to to, że dla pewnego ciągu współczynników c̄n ∈ R
wartość
P∞ funkcji f w punkcie x ∈ (x1 − r, x1 + r) przedstawia się jako suma zbieżnego szeregu potęgowego postaci f (x) =
m=0 c̄m (x − x1 )m , bo oczekiwaną wartość współczynników c̄m otrzymamy jako wniosek z twierdzenia 11.4.2 o szeregu
potęgowym. Pod warunkiem uzasadnienia poprawności, potrzebne przedstawienie uzyskamy z wyliczenia

X n
f (x) = cn ((x − x1 ) + (x1 − x0 )) (11.23)
n=0
∞ n  
X X n
= cn (x − x1 )m (x1 − x0 )n−m (11.24)
n=0 m=0
m
∞ X ∞  
X n
= cn (x − x1 )m (x1 − x0 )n−m (11.25)
n=0 m=0
m
∞ X ∞  
X n
= cn (x − x1 )m (x1 − x0 )n−m (11.26)
m=0 n=0
m
∞ ∞   !
X X n
= cn (x1 − x0 ) n−m
(x − x1 )m (11.27)
m=0 n=m
m

X
= c̄m (x − x1 )m (11.28)
m=0

gdzie
∞ ∞
1 X
 
X n n!
c̄m := cn (x1 − x0 )n−m = cn (x1 − x0 )n−m
n=m
m m! n=m (n − m)!

jest dobrze zdefiniowane na mocy twierdzenia 11.4.2 , bo dla x1 ∈ (x0 − R, x0 + R) jest to przemnożona przez m! 1
suma
szeregu (11.17) przy x = x1 oraz k = m. Pozostaje
P∞ uzasadnić równości ( 11.23 - 11.28 ). Równość (11.23) wynika z rozpisania
x − x0 = (x − x1 ) + (x1 − x0 ) w f (x) = n=0 cn (x − x0 )n , równość (11.24) ze wzoru (2.4), równość (11.25) z przyjętej
konwencji, że nk = 0 dla k > n, a równości (11.27) oraz (11.28) to efekt zgrupowania wyrazów i wprowadzenia oznaczenia.
Mniej oczywista jest zmiana kolejności sumowania w równości (11.26). Uzasadnimy ją w oparciu o lemat 11.4.4 (v). Mamy
∞ X
∞   ∞ X n   ∞
X n X n X n
cn (x1 − x0 ) n−m
(x − x1 ) =
m
cn (x1 − x0 )n−m (x − x1 )m = |cn | (|x − x1 | + |x1 − x0 |)
n=0 m=0
m n=0 m=0
m n=0
(11.29)
Ponieważ x P∈ (x1 −r, x1 +r), dostajemy |x−x1 | < r = R−|x 1 −x 0 |. Zatem znajdziemy R 1 ∈ (0, R) takie, że |x−x 1 |+|x 1 −x 0| <

R1 . Szereg n=0 cn R1n jest zbieżny, bo lim supn→∞ n |cn |R1n = RR1 < 1. Z kryterium porównawczego również szereg po
p

prawej stronie równości (11.29) jest zbieżny. Zatem również szereg po lewej stronie tej równości jest zbieżny, co pozwala nam
na użycie lematu 11.4.4 do uzasadnienia zmiany kolejności sumowania. 
264 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

11.4.2 Funkcje analityczne


Twierdzenie 11.4.3 sugeruje następującą definicję.

Definicja 11.4.5 Mówimy, że funkcja f : (a, b) → R jest analityczna w punkcie x0 ∈ (a, b) jeżeli funkcja ta daje się
przedstawić jako suma szeregu potęgowego zbieżnego w pewnym otoczeniu punktu x0 . Mówimy, że funkcja f : (a, b) →
R jest analityczna jeżeli jest analityczna w każdym punkcie x0 ∈ (a, b).

Jako natychmiastowy wniosek z twierdzenia 11.4.2 dostajemy następujący wniosek.

Wniosek 11.4.6 Funkcja analityczna f : (a, b) → R jest funkcją klasy C ∞ . Co więcej, w pewnym otoczeniu x0 ∈ (a, b)
jest ona sumą swojego szeregu Taylora

X f (n)(x0 )
f (x) = (x − x0 )n ,
n=0
n!
zatem jest jednoznacznie wyznaczona w otoczeniu x0 przez ciąg swoich pochodnych w punkcie x0 .

Lokalna˛ jednoznaczność funkcji analitycznej wzgl˛edem pochodnych w zadanym punkcie można istotnie wzmocnić. Okazuje si˛e bowiem, że jeśli dwie funkcje
analityczne sa˛ równe w zbiorze majacym˛ punkt skupienia, to sa˛ równe w cz˛eści wspólnej swoich dziedzin. W szczególności dwie funkcje analityczne lokalnie
równe sa˛ równe w cz˛eści wspólnej swoich dziedzin. By to pokazać potrzebujemy nast˛epujace
˛ twierdzenie.
P∞ P∞
Twierdzenie 11.4.7 Niech szeregi n=0 an (x−x0 )n oraz n=0 bn (x−x0 )n będą zbieżne w przedziale (x0 −R, x0 +R)
i niech P∞ P∞
E := { x ∈ (x0 − R, x0 + R) | n=0 an (x − x0 )n = n=0 bn (x − x0 )n }.
Jeśli E ma punkt skupienia w (x0 − R, x0 + R), to an = bn dla wszystkich n ∈ N, czyli E = (x0 − R, x0 + R).
P∞
Dowód: Niech S := (x0 −R, x0 +R). Dla n ∈ N połóżmy cn := an −bn . Niech f (x) := n=0 cn (x−x0 )n dla x ∈ S. Szereg
ten jest zbieżny dla x ∈ S jako różnica szeregów zbieżnych. Z definicji zbioru E mamy f|E = 0. Rozważmy zbiory A := E 0 ∩S
gdzie E 0 to zbiór punktów skupienia zbioru E oraz B := S \ A. Z założenia, że E ma punkt skupienia w S wnosimy, że
A 6= ∅. Jeśli x ∈ B to x nie jest punktem skupienia zbioru E w S, a więc w pewnym jego otoczeniu albo w ogóle nie ma
punktów z E, albo jedynym takim punktem jest sam x. W szczególności w dostatecznie małym otoczeniu punktu x nie ma
już punktów
P∞ skupienia zbioru E, co oznacza, że B jest otwarty. Rozważmy x1 ∈ A ⊂ S. Z twierdzenia 11.4.3 wnosimy, że
f (x) = n=0 dn (x − x1 )n dla pewnych współczynników dn ∈ R oraz x ∈ (x1 − r, x1 + r) gdzie r := R − |x1 − x0 |. Twierdzimy,
że dn = 0 dla n ∈ N0 . W przeciwnym razie możemy rozważyć najmniejsze k ∈ N0 takie, że dk 6= 0. Z twierdzenia 11.4.2 i
dodatniości promienia zbieżności f w x1 łatwo wywnioskować, że
p
lim sup n dk+n = lim sup k+n dk+n = lim sup n dn < ∞
p p
n→∞ n→∞ n→∞
P∞
co oznacza, że szereg n=0 dk+n (x − x1 )n ∈ R maPrównież dodatni promień zbieżności, a więc mamy dobrze określoną i

ciągłą w pewnym otoczeniu x1 funkcję g : S 3 x 7→ n=0 dk+n (x − x1 )n ∈ R. Z twierdzenia o iloczynie szeregu przez liczbę
dostajemy równość f (x) = (x − x1 ) g(x). Mamy też g(x1 ) = dk 6= 0, a ponieważ g jest ciągła, znajdziemy δ > 0 takie, że
k

g(x) 6= 0 gdy |x−x1 | < δ. W konsekwencji f (x) = (x−x1 )k g(x) 6= 0 dla x ∈ (x1 −δ, x1 +δ)\{x1 } co przeczy x1 ∈ A = S ∩E 0 .
Zatem rzeczywiście dn = 0 dla n ∈ N0 . Oznacza to, że A jest zbiorem otwartym. Ponieważ S, jako przedział, jest spójny, a
A 6= ∅, zbiór B = ∅. To dowodzi, że E = S. 

Wniosek 11.4.8 Zbiór miejsc zerowych niezerowej funkcji analitycznej nie posiada punktów skupienia. Jeśli dwie
funkcje analityczne f, g : (a, b) → R są równe w pewnym zbiorze mającym punkt skupienia, to są równe.

Poniższy przykład pokazuje, że nie każda funkcja klasy C ∞ jest funkcją analityczną.
11.5. SZEREGI FOURIERA 265

Rysunek 11.10: Joseph Fourier (1768-1830)

Przykład 11.4.9 Rozważmy funkcję f : R → R daną wzorem


( 1
e− x2 gdy x 6= 0,
f (x) :=
0 gdy x = 0.

Można sprawdzić, że pochodna tej funkcji dowolnie wysokiego rzędu istnieje. Łatwo to stwierdzić dla x 6= 0 przy
wykorzystaniu twierdzeń o pochodnej złożenia, iloczynu, ilorazu i funkcji wykładniczej. Dla x = 0 sprawdzenie istnienia
i zerowania się pochodnych jest trudniejsze. Daje się to policzyć bezpośrednio z definicji pochodnej jako granicy ilorazu
różnicowego przy wykorzystaniu twierdzenia 6.2.3 (vi). Zatem funkcja ta jest funkcją klasy C ∞ . Z faktu, że jej
wszystkie pochodne w zerze są zerowe dostajemy, że jej szereg Taylora w zerze jest zerowy. Zatem funkcja ta nie jest
funkcją analityczną, bo gdyby była, w otoczeniu zera musiałaby być funkcją zerową, a nie jest.

Jako natychmiastową konsekwencję twierdzenia 11.4.3 dostajemy następujący wniosek.

Wniosek 11.4.10 Jeśli funkcja f : (a, b) → R daje się przedstawić jako suma zbieżnego szeregu potęgowego w pew-
nym przedziale to jest analityczna w tym przedziale. W szczególności funkcjami analitycznymi są wielomiany, funkcja
wykładnicza i logarytmiczna oraz funkcje trygonometryczne.

11.5 Szeregi Fouriera


Funkcje okresowe pojawiaja˛ si˛e w wielu dziedzinach fizyki, w szczególności akustyki i elektrotechniki. Zwiazane
˛ sa˛ z wszelkiego rodzaju wibracjami czy drganiami.
Zagadnienie rozkładu funkcji okresowej na sum˛e oscylacji prostych (składowe harmoniczne) interesowało już Leonharda Eulera i Daniela Bernoullego, ale jako
pierwszy pełne rozwiazanie
˛ tego problemu podał francuski matematyk i fizyk Joseph Fourier (ryc. 11.10 ).

11.5.1 Wielomiany trygonometryczne


266 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

6 3

2
4

1
2

-5 5
-5 5
-1

-2
-2

-4 -3

Rysunek 11.11: Po lewej: funkcja okresowa. Po prawej: rozkład tej funkcji na oscylacje proste.

Definicja 11.5.1 Wielomianem trygonometrycznym nazywamy funkcję T : R → C dającą się przedstawić w postaci
N
X
T : R 3 x 7→ a0 + (an cos nx + bn sin nx) ∈ C (11.30)
n=1

gdzie an , bn ∈ C.

Ponieważ tak funkcja stała x 7→ a0 jak również funkcje x 7→ an cos nx oraz x 7→ bn sin nx dla n ∈ N1 są okresowe o okresie
2π, wielomian trygonometryczny jest funkcją okresową o okresie 2π.

Poniższa uwaga przedstawia wykładniczą postać wielomianu trygonometrycznego, która często jest wygodniejsza w
obliczeniach.

Uwaga 11.5.2 Wielomian trygonometryczny można przedstawić w postaci


N
X
T (x) = cn einx (11.31)
n=−N

gdzie 
an −ibn
 2
 gdy n > 0,
cn := a0 gdy n = 0, (11.32)
 a−n +ib−n
gdy n < 0.

2

Na odwrót, gdy dany jest wielomian trygonometryczny w postaci (11.31) to równoważną postać (11.30) dostajemy
przyjmując

an := c−n + cn , (11.33)
c−n − cn
bn := . (11.34)
i
11.5. SZEREGI FOURIERA 267

Dowód: Podstawiając wzory (11.32) do (11.31) i wykorzystując (6.17) mamy


N
X N
X
cn einx = c0 + c−n e−inx + cn einx


n=−N n=1
N 
1 1
X 
= c0 + (an + ibn )(cos nx − i sin nx) + (an − ibn )(cos nx + i sin nx)
n=1
2 2
N
X
= a0 + (an cos nx + bn sin nx)
n=1

co dowodzi pierwszej części uwagi. Drugą część sprawdzamy podobnie podstawiając wzory ( 11.33 - 11.34 ) do (11.30). 

Uwaga 11.5.3 Współczynniki cm wielomianu trygonometrycznego w postaci (11.31) wyrażają się wzorem

1
Z π
cm := T (x)e−imx dx. (11.35)
2π −π

Dowód: Ponieważ funkcja x 7→ eikx ma okres 2π, dla k ∈ Z mamy


π

Z π  eikx = 0 gdy k =
6 0,
eikx dx = ik
−π
π
−π  1|−π = 2π. gdy k = 0.

Zatem z (11.31) dostajemy


N
! N
Z π Z π X X Z π
T (x)e −imx
dx = cn e i(n−m)x
dx = cn ei(n−m)x dx = 2πcm
−π −π n=−N n=−N −π

skąd otrzymujemy wzór (11.35). 

Uwaga 11.5.4 Wielomian T przyjmuje wartości rzeczywiste wtedy i tylko wtedy gdy dla każdego m ∈ {0, 1, 2, . . . , N }
zachodzi c−m = cm .

Dowód: Przy założeniu c−m = cm dla m ∈ {0, 1, 2, . . . , N } ze wzorów ( 11.33 - 11.34 ) mamy am = cm +c−m = cm +cm ∈ R
i podobnie bm := c−mi−cm = cm −c i
m
∈ R, zatem T ma wartości rzeczywiste. Na odwrót, jeśli T ma wartości rzeczywiste, to
T (x) = T (x), więc z (11.35) dostajemy

1 1 1 π
Z π Z π Z
c−m = T (x)eimx dx = T (x)e−imx dx = T (x)e−imx dx = cm .
2π −π 2π −π 2π −π

Wzór (11.35) można zastosować do dowolnej funkcji całkowalnej w sensie Riemanna, nie tylko do wielomianu. Otrzymujemy przeliczalna˛ rodzin˛e liczb, t.zw.
współczynniki Fouriera funkcji f , z których można w miejsce wielomianu utworzyć szereg

X
cn einx .
n=−∞

Naturalne jest pytanie kiedy ten szereg funkcyjny jest zbieżny i jeśli jest zbieżny do czy jest zbieżny do funkcji f . Aby odpowiedzieć na to pytanie warto najpierw
˛ si˛e analogii z przestrzeniami wektorowymi skończenie wymiarowymi. W Rd dysponujemy iloczynem skalarnym, który pozwala formalnie
wspomnieć o rysujacej
268 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

zdefiniować prostopadłość wektorów, a także norm˛e, która mierzy długość wektora. Oznaczmy przez (x|y) iloczyn skalarny wektorów x, y ∈ Rd . Niech e ∈ Rd
b˛edzie wektorem o długości jeden, czyli (e|e) = 1. Dowolny wektor x ∈ Rd posiada jednoznaczny rozkład x = x0 + λe, gdzie x0 jest prostopadły do e,
czyli (x0 |e) = 0. W tym celu wystarczy wziać ˛ λ := (x|e) oraz x0 := x − (x|e)e. Wektor λe zwany jest rzutem prostokatnym ˛ wektora x na kierunek
˛ baz˛e ortonormalna˛ E ⊂ Rd , a wi˛ec baz˛e złożona˛ ze wzajemnie prostopadłych wektorów ei ∈ E długości jeden dostajemy rozkład
wektora e. Biorac

d
X
x= (x|ei )ei
i=1

wektora x w bazie E .
˛ pokażemy jak t˛e prosta˛ ide˛e stosuje si˛e do funkcji okresowych. Rodzina funkcji zmiennej rzeczywistej okresowych o okresie 2π i wartościach
W dalszym ciagu
zespolonych, całkowalnych w sensie Riemanna na przedziale [−π, π] tworzy przestrzeń wektorowa.˛ Definiujemy odwzorowanie

1 π
Z
(f, g) 7→ f (x)g(x)dx.
2π −π

Tak określone odwzorowanie ma wiele własności iloczynu skalarnego. Odpowiednio modyfikujac


˛ definicj˛e i sama˛ rozważana˛ przestrzeń sprawimy, że b˛edzie to
iloczyn skalarny. Pokażemy, że rodzina funkcji
Em : R 3 x 7→ eimx ∈ C
stanowi odpowiednik bazy ortonormalnej w przestrzeni skończenie wymiarowej, a funkcja (f |Em )Em przyjmujaca
˛ postać

1 π
Z
R 3 x 7→ f (t)e−im(t−x) dt
2π −π

jest odpowiednikiem rzutu prostokatnego


˛ funkcji f na kierunek funkcji Em . Zatem przez analogi˛e do przypadku skończenie wymiarowego możemy oczekiwać
wzoru

X
f= (f |Em )
m=−∞

lub

X
f (x) = cm eimx
m=−∞

gdzie
1 π
Z
cm = f (t)e−imt dt.
2π −π

11.5.2 Zespolony iloczyn skalarny


Pojęcie iloczynu skalarnego można rozszerzyć na przypadek przestrzeni wektorowych nad ciałem C.

Definicja 11.5.5 Niech V będzie przestrzenią wektorową nad R. Odwzorowanie ϕ : V ×V → C nazywamy zespolonym
iloczynem skalarnym jeżeli dla wszystkich x, y, z ∈ V oraz α ∈ C spełnione są następujące warunki:
(ZIS1) ϕ(x + y, z) = ϕ(x, z) + ϕ(y, z),

(ZIS2) ϕ(αx, y) = αϕ(x, y),


(ZIS3) ϕ(x, y) = ϕ(y, x),
(ZIS4) ϕ(x, x) ­ 0 i ϕ(x, x) = 0 ⇔ x = 0.
11.5. SZEREGI FOURIERA 269

Jako prostą konsekwencję definicji otrzymujemy następującą uwagę.

Uwaga 11.5.6 Dla dowolnych x, y, z ∈ V oraz α ∈ C mamy

ϕ(z, x + y) = ϕ(z, x) + ϕ(z, y),


ϕ(x, αy) = αϕ(x, y)

Standardowym przykładem zespolonego iloczynu skalarnego jest przestrzeń Cn z odwzorowaniem ϕ : Cn × Cn → C dane


dla x = (x1 , x2 , . . . , xn ) ∈ Cn oraz y = (y1 , y2 , . . . , yn ) ∈ Cn wzorem

n
X
ϕ(x, y) := xi yi .
i=1

Następujące twierdzenie ugólnia nierówność Cauchy-Schwartza (twierdzenie 7.2.3 ) na przypadek zespolonego iloczynu
skalarnego.

Twierdzenie 11.5.7 Zespolony iloczyn skalarny ϕ : V × V → C spełnia nierówność

(11.36)
p p
|ϕ(x, y)| ¬ ϕ(x, x) ϕ(y, y)

dla dowolnych x, y ∈ V .

Dowód: Podstawiając x = y = 0 we własności (ZIS1) dostajemy ϕ(0, z) = 0 dla dowolnego z ∈ C. Zatem z własności
(ZIS3) wnosimy, że również ϕ(z, 0) = ϕ(0, z) = 0 dla dowolnego z ∈ C. Wynika stąd oraz z (ZIS4), że nierówność (11.36)
zachodzi gdy y = 0. Rozważmy zatem przypadek y 6= 0. Dla x, y ∈ C i dowolnego λ ∈ C dostajemy z definicji zespolonego
iloczynu skalarnego i uwagi 11.5.6

0 ¬ ϕ(x + λy, x + λy) = ϕ(x, x) + λϕ(x, y) + λϕ(x, y) + |λ|2 ϕ(y, y)

Podstawiając w tej nierówności λ := − ϕ(x,y)


ϕ(y,y) i przekształcając dostajemy (11.36). 

11.5.3 Przestrzeń wektorowa z zespolonym iloczynem skalarnym


Analogicznie jak w przypadku rzeczywistego iloczynu skalarnego (twierdzenie 7.3.2 ) dowodzimy następujące twierdzenie.

Wniosek 11.5.8 Przestrzeń wektorowa V z zespolonym iloczynem skalarnym ϕ jest przestrzenią wektorową unormo-
waną z normą ||.||ϕ : V → R daną wzorem
||x||ϕ := ϕ(x, x)
p

dla x ∈ V . 
270 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

Przykład 11.5.9 Podobnie jak w twierdzeniu 9.2.4 możemy sprawdzić, że Riem([a, b], C), z działaniami zdefinio-
wanymi analogicznie jak w tym twierdzeniu, jest przestrzenią wektorową nad ciałem C. Rozważmy odwzorowanie
Z b
ϕ : Riem([a, b], C) × Riem([a, b], C) 3 (f, g) 7→ β f ḡ,
a

gdzie β ∈ R+ jest ustaloną liczbą rzeczywistą dodatnią. Łatwo sprawdzić, że ϕ spełnia warunki (ZIS1)-(ZIS3) definicji
zespolonego iloczynu skalarnego. Odnośnie (ZIS4) oczywiste jest, że
Z b Z b
ϕ(f, f ) = β f f¯ = β |f |2 ­ 0
a a

oraz ϕ(0, 0) = 0 gdzie dwa pierwsze zera oznaczają funkcję stale równą zero. Niestety, implikacja ϕ(f, f ) = 0 ⇒ f = 0
nie zachodzi, bo na przykład funkcja f : [−1, 1] → R dana wzorem
(
0 gdy x 6= 0,
f (x) =
1 gdy x = 0.

jest różna od funkcji zero, ale, jak łatwo policzyć, ϕ(f, f ) = 0.

11.5.4 Równość prawie wszędzie.


Problemowi, który został przedstawiony w przykładzie 11.5.9 można zaradzić wprowadzając dla f, g ∈ Riem([a, b], C)
relację równoważności
f ∼ g ⇔ µ∗ ({ x ∈ [a, b] | f (x) 6= g(x) }) = 0 (11.37)
gdzie µ∗ : P(R) → R∗ jest miarą zewnętrzną (patrz def 9.1.14 ).

Uwaga 11.5.10 Relacja dana wzorem (11.37) jest relacją równoważności w zbiorze Riem([a, b], C).

Dowód: ćwiczenie.
O funkcjach, które są równoważne w sensie (11.37) mówimy, że są równe prawie wszędzie. Zbiór klas równoważności
relacji równości prawie wszędzie oznaczać będziemy Riem0 ([a, b], C). Mamy następujące twierdzenie.

Twierdzenie 11.5.11 Odwzorowania

Riem0 ([a, b], C)2 3 ([f ], [g]) 7→ [f ] + [g] := [f + g] ∈ Riem0 ([a, b], C),
C × Riem0 ([a, b], C) 3 (c, [f ]) 7→ c[f ] := [cf ] ∈ Riem0 ([a, b], C)

są dobrze określonymi działaniami w Riem0 ([a, b], C) i zadają w niej strukturę przestrzeni wektorowej nad ciałem C.
Ponadto, dla β ∈ R+ odwzorowanie
Z b
ϕ̃ : (Riem0 ([a, b], C)) 3 ([f ], [g]) 7→ β
2
f ḡ ∈ C (11.38)
a

jest dobrze określonym zespolonym iloczynem skalarnym w Riem0 ([a, b], C).
11.5. SZEREGI FOURIERA 271

Dowód: ćwiczenie.
W dalszym ciągu skoncentrujemy się na przestrzeni Riem0 ([−π, π], C). Aby uprościć terminologię i notację elementy
Riem0 ([−π, π], C) nazywać będziemy funkcjami i oznaczać będziemy tak jak zwykłe funkcje. Zespolony iloczyn skalarny
(11.38) przy β = 2π1
dla f, g ∈ Riem0 ([−π, π], C) oznaczać będziemy zwięźle (f |g). Tak więc

1 π
Z
(f |g) := f ḡ.
2π −π

Normę pochodzącą od tego iloczynu skalarnego oznaczać będziemy ||f ||2 , zatem

1
Z π
||f ||22 := f f¯
2π −π

11.5.5 Układ ortonormalny

Definicja 11.5.12 Przeliczalną rodzinę funkcji Ψ ⊂ Riem0 ([−π, π], C) nazywać będziemy układem ortonormalnym,
jeżeli dla ψ, ψ 0 ∈ Ψ zachodzi (
1 gdy ψ = ψ 0 ,
(ψ|ψ ) =
0
0 w przeciwnym razie.

Przykład 11.5.13 Układem ortonormalnym jest rodzina funkcji { En : [−π, π] → C | n ∈ Z } gdzie En (x) := einx .
Rzeczywiście, dla n, m, ∈ Z mamy

1 1
Z π Z π
(Em |En ) = einx e−imx dx = ei(n−m)x dx =
2π −π 2π −π
(
1 1 1 gdy m = n,
Z π Z π
= cos(n − m)xdx + i sin(n − m)xdx =
2π −π 2π −π 0 w przeciwnym razie.

W pojęciu układu ortonormalnego istotna jest przeliczalność rodziny funkcji. Natomiast w zależności od konkrentego
układu czasami wygodniej jest indeksować go liczbami naturalnymi, a czasami liczbami całkowitymi. Oba sposoby indekso-
wania są równoważne, bo oba gwarantują przeliczalność.

11.5.6 Szereg Fouriera


Niech Ψ = {ψn | n ∈ N} będzie ustalonym układem ortonormalnym w Riem0 ([−π, π], C) i niech f ∈ Riem0 ([−π, π], C).

Definicja 11.5.14 Liczbę zespoloną


1 π
Z
cn := (f |ψn ) = f ψn
2π −π

nazywamy n-tym współczynnikiem Fouriera funkcji f względem układu Ψ, a szereg funkcyjny


X
F (f ) := cn ψn
n∈N

nazywamy szeregiem Fouriera funkcji f względem Ψ.


272 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

Niech
n
X
Fn (f ) := cm ψm
m=0

oznacza n-tą sumę częściową szeregu Fouriera funkcji f .


Pn
Twierdzenie 11.5.15 Dla dowolnej sumy tn := m=0 γm ψm gdzie γm ∈ C zachodzi nierówność

1 1
Z π Z π
|f − Fn (f )| ¬ |f − tn | (11.39)
2π −π 2π −π

czyli
||f − Fn (f )||22 ¬ ||f − tn ||22 . (11.40)
Ponadto mamy nierówność

1 π
X Z
|cm |2 ¬ |f |2 = ||f ||22 , (11.41)
m=0
2π −π

zwaną nierównością Bessela. W szczególności limn→∞ cn = 0.

Dowód: (*)Mamy
n n n
1 π
1 π
1 π
Z Z X X Z X
(f |tn ) = f tn = f γ m ψm = γm f ψm = γ m cm
2π −π 2π −π m=0 m=0
2π −π m=0

oraz
n
! n
! n X
n n n
1 π
1 π
1 π
Z Z X X X  Z  X X
||tn ||22 = tn tn = γm ψm γ k ψk = γm γ k ψm ψ k = γm γ m = |γm |2 .
2π −π 2π −π m=0 m=0 k=0
2π −π m=0 m=0
k=0

Zatem
1
Z π
||f − tn ||22 = (f − tn ) (f − tn )
2π −π
1 1 1 1
Z π Z π Z π Z π
= 2
|f | − f tn − f tn + |tn |2
2π −π 2π −π 2π −π 2π −π
n n n
1
Z π X X X
= |f |2 − γ m cm − γm cm + γm γ m
2π −π m=0 m=0 m=0
n
! n n n n
!
1
Z π X X X X X
= |f |2 − |cm |2 + |cm |2 − γ m cm − γm cm + γm γ m
2π −π m=0 m=0 m=0 m=0 m=0
n n
1
Z π X X
= |f |2 − |cm |2 + |γm − cm |2
2π −π m=0 m=0

skąd wnosimy, że minimum jest osiągnięte przy γm = cm . Dowodzi to nierówności (11.40), a tym samym również nierówności
(11.39). Ostatnia otrzymana nierówność po podstawieniu γn := cn daje w szczególności dla każdego n ∈ N
n
1 π
Z X
0 ¬ ||f − Fn (f )||22 = |f |2 − |cm |2
2π −π m=0
11.5. SZEREGI FOURIERA 273

Rysunek 11.12: Interpretacja geometryczna twierdzenia 11.5.15 . Odległość f od rzutu prostokątnego f na płaszczyznę
ψ1 , ψ2 minimalizuje odległość f od punktów tej płaszczyzny. Kwadrat długości f nie jest pełną sumą kwadratów długości
rzutów prostokątnych f na osie wektorów ψ1 , ψ2 , bo do kompletu brakuje jeszcze kwadratów rzutów na pozostałe osie.
Dlatego nierówność Bessela jest tylko nierównością.
274 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

co po przejściu z n do nieskończoności i po przegrupwaniu daje (11.41). 


Nierówność Bessela można zinterpretować geometrycznie. Zerowanie si˛e iloczynu skalarnego niezerowych wektorów w Rd w j˛ezyku geometrii oznacza ich
prostopadłość. Wprawdzie nie potrafimy narysować nieskończenie wielu wzajemnie prostopadłych wektorów, ale możemy mówić o hiperpłaszczyźnie generowanej
przez funkcje ψ0 , ψ1 , . . . ψn . Suma cz˛eściowa szeregu Fouriera funkcji f może być interpretowana jako rzut tej funkcji traktowanej jako wektor na t˛e hiperpłasz-
czyzn˛e. Gdyby w nierówności Bessela była równość, mielibyśmy n-wymiarowy odpowiednik twierdzenia Pitagorasa. Kwadrat długości wektora jest równy sumie
kwadratów długości jego rzutów prostokatnych
˛ na wzajemnie prostopadłe osie układu współrz˛ednych. Mamy tylko nierówność, bo nie ma gwarancji, że układ
ortonormalny Ψ wypełnia wszystkie możliwe kierunki.Dla n = 2 sytuacj˛e zobrazowano na rys. 11.12 .
Funkcje okresowe są jednoznacznie wyznaczone poprzez swoje wartości na przedziale o długości równej długości okresu.
W szczególności funkcje okresowe o okresie 2π i całkowalne w sensie Riemanna na przedziale [−π, π] można utożsamiać z
funkcjami w Riem0 ([−π, π], C) zawężając je do przedziału [−π, π]. Tak więc n-ty współczynnik Fouriera funkcji okresowej
f : R → C o okresie 2π dany jest wzorem

1 1
Z π Z π Z π
i
cn (f ) := cn := f (x)e−inx dx = f (x) cos nxdx − f (x) sin nxdx.
2π −π 2π −π 2π −π

11.5.7 Rzut ortonormalny


Podobnie jak w przypadku skończenie wymiarowych przestrzeni wektorowych rzut prostokątny funkcji f w kierunku funkcji
En uzyskujemy mnożąc tę funkcję przez współczynnik cn (f ). Przyjmujemy oznaczenie Cn (f ) := cn (f )En . Zatem rzut ten
to funkcja
Cn (f ) : [−π, π] 3 x 7→ cn (f )einx ∈ C.

Następującą uwagę dowodzimy podobnie jak uwagę 11.5.4 .

Uwaga 11.5.16 Jeśli funkcja f przyjmuje wartości rzeczywiste, to

Cn# (f )(x) := Cn (f )(x) + C−n (f )(x) = an cos nx + bn sin nx

definiuje funkcją rzeczywistą Cn# (f ) : [−π, π] → R. Jest to rzut prostokątny f na płaszczyznę wyznaczoną przez funkcje
x 7→ sin nx, oraz x 7→ cos nx interpretowane jako wektory nieskończenie wymiarowej przestrzeni wektorowej. Wtedy

1 π 1 π
Z Z
an = f (x) cos nxdx bn = f (x) sin nxdx.
π −π π −π

Dokonując stosownej zmiany zmiennych we wzorze całkowym na cn (f ) dostajemy z kolei poniższą uwagę.

Uwaga 11.5.17 Dla f ∈ Riem([−π, π], C) zachodzi wzór

1
Z π
Cn (f )(x) = f (x − s)eins ds (11.42)
2π −π
1 π
Z
Cn# (f )(x) = f (x − s) cos nsds (11.43)
π −π

Dowód: Rozszerzmy f do funkcji okresowej f : R → R o okresie 2π. Dokonując podstawienia s := x−t z twierdzenia 10.4.1
mamy

1 π
1 x−π
1 x+π
1 π
Z Z Z Z
Cn (f )(x) = cn (f )e inx
= f (t)e in(x−t)
dt = − f (x−s)e
ins
ds = f (x−s)e ins
ds = f (x−s)eins ds
2π −π 2π x+π 2π x−π 2π −π
11.5. SZEREGI FOURIERA 275
1

x
π 2π 3π 4π 5π 6π 7π 8π

-1

s s s

C1 # (f)(3π/2)=0 C1 # (f)(4π)=1 C1 # (f)(7π)=-1

Rysunek 11.13: Interpretacja geometryczna wzoru (11.43). Wartość Cn# (f )(x) może być interpretowana jako średnia wartości
funkcji f w otoczeniu punktu x ważona funkcją cosinus przesuniętą do punktu x. Wartość ta jest duża i dodatnia, gdy wartości
funkcji f i wagi ze sobą współgrają, czyli f jest dodatnie tam gdzie cosinus jest dodatni, a ujemne gdy cosinus jest ujemny.
Dzieje się tak w punkcie 4π. W punkcie 7π jest na odwrót: f jest dodatnie tam gdzie cosinus jest ujemny, a ujemne gdy
cosinus jest dodatni. W efekcie Cn# (f )(x) ma wartość dużą ujemną. Tak jest w punkcie 7π. Z kolei w punkcie 3π/2 brak
współgrania: tam gdzie cosinus jest dodatni, f jest tak dodatnie jak i ujemne i w wyniku ważenia Cn# (f )(x) daje zero.

co daje (11.42). Stąd dostajemy


1 π
1 π
Z Z
Cn# (f )(x) = Cn (f )(x) + C−n (f )(x) = f (x − s) eins + e−ins ds = f (x − s) cos nsds,

2π −π π −π

czyli (11.43). 

11.5.8 Jądro Dirichleta


Zajmiemy się teraz wyznaczeniem sumy częściowej szeregu Fouriera funkcji f ∈ Riem0 ([−π, π], C) względem układu orto-
normalnego z przykładu 11.5.13 . Potrzebna do tego funkcji zwanej jądrem Dirichleta.

Definicja 11.5.18 N -tym jądrem Dirichleta nazywamy funkcję


N
X
DN : [−π, π] 3 x 7→ einx ∈ R
n=−N

Jądro Dirichleta pozwala wyliczyć N -tą sumę częściową szeregu Fouriera funkcji f . Dokładniej, przyjmując, że oznaczenia
FN (f ) i F (f ) na N -tą sumę częściową i szereg Fouriera funkcji f odnoszą się do układu ortonormalnego z przykładu 11.5.13
, mamy następujące twierdzenie.

Twierdzenie 11.5.19 Dla f ∈ Riem0 ([−π, π], C) zachodzi wzór

1
Z π
FN (f ) = f (x − s)DN (s)ds.
2π −π

Dowód: Mamy
N N N
1 π
1 π
1 π
X X Z Z X Z
FN (f )(x) = Cn (f )(x) = f (x − s)e ins
ds = f (x − s) e ins
ds = f (x − s)DN (s)ds.
2π −π 2π −π 2π −π
n=−N n=−N n=−N


Przydatna jest następująca uwaga, pozwalająca wyliczyć wartość jądra Dirichleta bez sumowania.
276 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

Uwaga 11.5.20 Dla x ∈ [−π, π] mamy wzór

 sin(N + 21 )x

gdy x 6= 0,
DN (x) = (11.44)
1
sin 2x
2N + 1 gdy x = 0.

Ponadto
1 π
Z
DN (x)dx = 1. (11.45)
2π −π

Dowód: (*)Wzór (11.44) dla x = 0 wynika wprost z definicji. Natomiast dla x 6= 0 mamy

N
X +1 N
X
(eix − 1)DN (x) = einx − einx = ei(N +1)x − e−iN x .
n=−N +1 n=−N

1 − ix
Stąd, po przemnożeniu obu stron przez 2i e
2 otrzymujemy

1  ix ix
 1  i(N + 1 )x 1

e 2 − e− 2 DN (x) = e 2 − e−i(N + 2 )x ,
2i 2i
a następnie wykorzystując definicję funkcji sin (definicja 6.3.3 ) dostajemy (11.44).
Aby otrzymać (11.45) zauważmy, że dla n 6= 0 namy
π
1 π
1 einx
Z
e inx
dx = = 0,
2π −π 2π in −π

a dla n = 0 mamy
1 π
1 π
1
Z Z
π
e i·0·x
dx = 1dx = x | = 1,
2π −π 2π −π 2π −π
skąd dostajemy (11.45). 

11.5.9 Zbieżność punktowa szeregu Fouriera


Mamy następujące twierdzenie o zbieżności punktowej szeregu Fouriera.

Twierdzenie 11.5.21 Niech f : R → C będzie funkcją okresową o okresie 2π i całkowalną w sensie Riemanna na
przedziale [−π, π]. Załóżmy ponadto, że dla każdego x ∈ R istnieje δ > 0 i stała M > 0 takie, że

|f (x + t) − f (x)| < M |t| dla t ∈ (−δ, δ).

Wtedy dla każdego x ∈ R


lim FN (f )(x) = f (x).
N →∞

Dowód: (*)Niech x ∈ R. Zdefiniujmy funkcję g : R → R wzorem


( f (x−t)−f (x)
1 dla t 6∈ { kπ
2 | k ∈ Z },
g(t) := sin 2t

0 dla t ∈ { kπ
2 | k ∈ Z }.
11.5. SZEREGI FOURIERA 277

f (x0 ) f (x0 ) f (x0 )

x0 x0 x0

Rysunek 11.14: Interpretacja geometryczna założenia twierdzenia 11.5.21 . W punkcie x0 na rysunku po lewej wykres
funkcji w okolicy x0 daje się zamknąć w dwustronnym stożku o wierzchołku w (x0 , f (x0 )). Na rysunku środkowym nie jest
to możliwe, bo funkcja nie jest ciągła w x0 . Na rysunku po prawej też nie jest to możliwe, bo funkcja w x0 ma pionową
styczną. Zatem tylko przypadek po lewej spełnia założenie twierdzenia 11.5.21 w punkcie x0 .

Twierdzimy, że funkcja g jest ograniczona w przedziale [−π, π]. Niech M 0 := sup { | sin|t|1 t| | t ∈ [−π, π] }. Mamy M 0 < ∞, bo
2
|t|
funkcja t 7→ | sin 12 t|
jest ciągła dla t 6= 0, a w t = 0 ma granicę 2 w zerze. Zatem

f (x − t) − f (x) |t|
¬M ¬ M M 0,
sin 12 t | sin 21 t|
co dowodzi ograniczoności g. Co więcej, zbiór punktów nieciągłości funkcji g w przedziale [−π, π] jest co najwyżej większy o
punkt zero od zbioru nieciągłości funkcji f w tym przedziale. Tak więc g jest całkowalna w sensie Riemanna na przedziale
[−π, π]. Podobnie całkowalne są zatem funkcje
1
g1 : R 3 t 7→ g(t) cos t ∈ R
2
1
g2 : R 3 t 7→ g(t) sin t ∈ R
2
Mamy więc
1 1
Z π Z π
FN (f )(x) − f (x) = f (x − t)Dn (t)dt − f (x)DN (t)dt
2π −π 2π −π
1
Z π
= (f (x − t) − f (x))DN (t)dt
2π −π
1 1
Z π
= g(t) sin(N + )tdt
2π −π 2
1 1 1 1
Z π Z π
= (g(t) cos t) sin N tdt + (g(t) sin t) cos N tdt
2π −π 2 2π −π 2
= im cN (g1 ) + re cN (g2 ).
Z nierówności Bessela wiemy, że limn→∞ cN (g1 ) = 0 i podobnie limn→∞ cN (g2 ) = 0. Ostatecznie więc dostajemy
lim (FN (f )(x) − f (x)) = 0.
n→∞
278 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE

Przykład 11.5.22 Rozwiniemy w szereg Fouriera w przedziale [−π, π] funkcję f : [−π, π] 3 x 7→ x ∈ R. Mamy

1
Z π
c0 = xdx = 0,
2π −π

a dla n 6= 0

1 π
1 π
1 π π
Z Z Z Z
i
cn = xe−inx dx = x(cos nx − i sin nx)dx = x cos nxdx − x sin nxdx.
2π −π 2π −π 2π −π 2π −π

Ale mamy
π
sin nx sin nx 1 1
Z π Z π Z π Z π
d(sin nx) π
x cos nxdx = x =x − dx = 0 − 2 sin nxd(nx) = cos nx|−π = 0
−π −π n n −π −π n n −π n2
oraz
π
− cos nx cos nx cos nx π cos nx + π cos nx sin nx
Z π Z π  
π
Z π
x sin nxdx = xd = −x + 2
d(nx) = − +− 2
−π −π n n −π −π n n n −π
2π cos nπ (−1) |n|
= − = −2π .
n n
Zatem
1 −2π(−1)|n| (−1)|n| i
cn = −i · = .
2π n n
Dostajemy więc
∞ ∞
X X (−1)|n| i
F (f )(x) = cn einx = (cos nx + i sin nx)
n=−∞ n=−∞
n
∞ 
(−1)n i (−1)n i
X 
= (cos nx + i sin nx) + (cos(−nx) + i sin(−nx))
n=1
n −n

2(−1)n+1 sin 2x sin 3x
X  
= sin nx = 2 sin x − + + ...
n=1
n 2 3

Z ostatniego twierdzenia wnosimy, że szereg ten jest zbieżny dla x ∈ (−π, π). Tak więc
x sin 2x sin 3x
= sin x − + + ....
2 2 3

W szczególności podstawiając x := π
2 dostajemy następujący wniosek.

Wniosek 11.5.23 Zachodzi równość



π X (−1)k 1 1 1 1
= = 1 − + − + − ....
4 2k + 1 3 5 7 9
k=0
Bibliografia

[1] F. Leja, Rachunek różniczkowy i całkowy, Państwowe Wydawnictwo Naukowe, Warszawa 1969.

[2] W. Rudin, Podstawy analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 1982.
[3] W. Rudnicki, Wykłady z analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 2001.
[4] G.M. Fichtenholz, Rachunek różniczkowy i całkowy, tom I, II i III. Państwowe Wydawnictwo Naukowe, Warszawa 1978.
[5] W. Krysicki, L. Włodarski, Analiza matematyczna w zadaniach, część I i II, Państwowe Wydawnictwo Naukowe, War-
szawa 1986.
[6] J. Banaś, S. Wędrychowicz, Zbiór zadań z analizy matematycznej, Wydawnictwo Naukowo-Techniczne, Warszawa 2001.

279

You might also like