Professional Documents
Culture Documents
Marian Mrozek
Uniwersytet Jagielloński
7 grudnia 2022
2
Spis treści
I Wprowadzenie 11
1 Wprowadzenie do analizy matematycznej 17
1.1 Rozwój pojęcia liczby . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.1 Liczby naturalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.2 Ułamki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.3 Liczby ujemne, całkowite i wymierne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.4 Liczby niewymierne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.1.5 Liczby rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1.6 Liczby urojone i zespolone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1.7 Liczby w komputerze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2 Ciągi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.2.1 Przybliżanie pierwiastka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.2.2 Ciągi przybliżeń . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.2.3 Granice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2.4 Obliczanie granic ciągu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.5 Liczba π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.1 Pole koła . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.2 Liczba π poprzez szereg. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.1 Koncepcja funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.2 Miejsca zerowe funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.3 Wykres funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.4.4 Geometryczne konstrukcje funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.4.5 Rozwijanie funkcji w szereg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.5 Pola figur i całkowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.5.1 Całka oznaczona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.5.2 Całka nieoznaczona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.6 Styczna do krzywej i granica funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.6.1 Styczna do krzywej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.6.2 Granica funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.6.3 Funkcje ciągłe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.6.4 Obliczanie granic. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.7 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.7.1 Lokalne maksima i minima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.7.2 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3
4 SPIS TREŚCI
II Granice 43
2 Liczby rzeczywiste i liczby zespolone 45
2.1 Ciało liczb rzeczywistych. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.1.1 Podzbiory R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.1.2 Geometryczna interpretacja zbioru liczb rzeczywistych . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.1.3 Liczby reprezentowalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.1.4 Zasada indukcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.1.5 Wzory skróconego mnożenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.1.6 Funkcja potęgowa w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.1.7 Nierówność Bernoullego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.1.8 Wartość bezwzględna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.2 Twierdzenie o istnieniu pierwiastka. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2.1 Własność Archimedesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2.2 Gęstość zbioru w zbiorze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.2.3 Pierwiastki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.3 Rozszerzony zbiór liczb rzeczywistych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.3.1 R uzupełniony o −∞ i +∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.3.2 Kresy funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.4 Granice ciągów w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.4.1 Eksperymenty numeryczne z liczbą π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.4.2 Granice pozorne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.4.3 Definicja Cauchy’ego granicy ciągu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.4.4 Granice nieskończone. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.5 Twierdzenia o granicach ciągów w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.5.1 Granica ciągu, a struktura ciała w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.5.2 Granica ciągu, a struktura porządkowa w R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2.5.3 Granice kilku ważnych ciągów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.6 Liczba e i rzeczywista funkcja wykładnicza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.6.1 Procent składany . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.6.2 Liczba e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.6.3 Funkcja wykładnicza zmiennej rzeczywistej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.7 Ciało liczb zespolonych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.7.1 Liczby zespolone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.7.2 Ciało C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.7.3 Moduł liczby zespolonej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.7.4 Interpretacja geometryczna liczb zespolonych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.7.5 Zespolona funkcja kwadratowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.7.6 Liczby zespolone o module jeden czyli okrąg jednostkowy. . . . . . . . . . . . . . . . . . . . . . . . . . 83
5 Szeregi 127
5.1 Pojęcie szeregu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.1.1 Przybliżanie liczby π polami wielokątów wpisanych w koło. . . . . . . . . . . . . . . . . . . . . . . . . 127
5.1.2 Definicja szeregu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.1.3 Szereg harmoniczny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.2 Własności podstawowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.1 Warunek konieczny zbieżności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.2 Bezwzględna zbieżność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.3 Szereg geometryczny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.4 Szereg o wyrazach nieujemnych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.2.5 Kryterium porównawcze. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.3 Kryteria zbieżności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.3.1 Szereg harmoniczny rzędu p. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.3.2 Kryterium Leibniza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.3.3 Kryterium Cauchy’ego i kryterium d’Alemberta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.3.4 Szeregi potęgowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.4 Operacje na szeregach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4.1 Suma i iloczyn szeregów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4.2 Iloczyn Cauchy’ego szeregów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4.3 Zmiana kolejności sumowania. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.4.4 Szeregi w programie Mathematica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
Wprowadzenie
11
13
Wstęp
Niniejsze notatki do kursu Analiza Matematyczna I przeznaczonego dla studentów kierunku Matematyka Komputerowa
stanowią roboczą wersję i w trakcie kursu mogą podlegać aktualizacji. Punktem wyjścia tych notatek jest rękopis moich
materiałów do wykładu z analizy matematycznej prowadzonego w latach 1984-1990 dla studentów informatyki UJ. W owym
czasie był to bardzo obszerny kurs obejmujący 240h wykładów i 240h ćwiczeń. Wykładało i studiowało się wtedy zupełnie
inaczej, bo wykładowca miał do dyspozycji tylko tablicę i kredę, a studenci to co zdołali w trakcie wykładu zanotować.
Dziś możliwości są zupełnie inne, stąd i te notatki są inne, choć w pewnym stopniu wykorzystują jeszcze mój dawny
rękopis. Już wtedy starałem się o to, by część odnosząca się do intuicji była obszerna i równocześnie wyraźnie oddzielona
od części formalnej. Wydaje się, że takie podejście jest szczególnie ważne dla studentów specjalności Matematyka Kompu-
terowa, dlatego planuję je kontynuować również w ramach obecnego wykładu. Część materiału poświęcona intuicjom ma
charakter całkowicie nieformalny. Dla wyraźnego odróżnienia od części formalnej jest złożona brązową, pochyloną czcionką.
W szczególności cały pierwszy rozdział jest nieformalny. Nieformalne mówienie o matematyce rodzi często więcej pytań niż
daje odpowiedzi. Ale takie właśnie jest jej zadanie: sprowokować do myślenia. Dociekliwy czytelnik, który czyta najpierw
nieformalny tekst matematyczny wyrabia sobie pewne idee, które wymagają dopracowania. W moim przekonaniu takie po-
dejście powoduje, że studiowanie tekstu formalnego, który to dopracowanie dostarcza, staje się w efekcie bardziej naturalne i
znacznie łatwiejsze. Najważniejsze pytania jakie rodzi tekst nieformalny zostały w tekście wyróżnione poprzez umieszczenie
w ramce o różowym tle. Pytań jest oczywiście dużo więcej niż tych, które w tekście zostały jawnie postawione.
Różne kolory tła tekstu oznaczają: blado pomarańczowy - twierdzenia, blado zielony - definicje, różowy - problemy, blado
niebieski (C++) i blado fioletowy (Mathematica) - listingi programów komputerowych, żółty - ćwiczenia tablicowe, niebieski
- ćwiczenia komputerowe.
Aspekty obliczeniowe analizy matematycznej, ilustrowane programami komputerowymi w języku C++ oraz instrukcjami
programu Mathematica złożone są czcionką w kolorze niebieskim.
Znajomość rozdziałów, podrozdziałów i dowodów oznaczonych (*) obowiązuje jedynie studentów mierzących w ocenę
bdb. Rozdziały i podrozdziały oznaczone (**) są nieobowiązkowe.
Życzę wszystkim uczestnikom kursu udanego studiowania matematyki komputerowej na Wydziale Matematyki i Infor-
matyki UJ.
14
T02: Ciało liczb rzeczywistych (rozdz. 2.1 - 2.3 ) w tym dowody tw. 2.1.10 oraz tw. 2.2.4 .
T03: Granice ciągów w zbiorze liczb rzeczywistych (rozdz. 2.4 ) w tym dowód tw. 2.4.3 oraz tw. 2.4.4 . Twierdzenia o
granicach (rozdz. 2.5 ) w tym dowód tw. 2.5.1 oraz tw. 2.5.6 . Granice wybranych ciągów (rozdz. 2.5.3 ) w tym
dowód tw. 2.5.8
T04: Liczba e i rzeczywista funkcja wykładnicza (rozdz. 2.6 ) w tym dowód tw. 2.6.1 . Ciało liczb zespolonych (rozdz. 2.7
) w tym dowód tw. 2.7.4 oraz tw. 2.7.5 .
T05: Metryki, przestrzenie metryczne, kule (rozdz. 3.1 ) w tym dowód tw. 3.1.4 oraz tw. 3.1.8 . Zbiory otwarte i
domknięte, wnętrze, domknięcie i brzeg zbioru (rozdz. 3.2 ) w tym dowód tw. 3.2.10 oraz tw. 3.2.11 . Punkty
skupienia. (rozdz. 3.4 )
T06: Zbiory spójne (rozdz. 3.4 - 3.5 ) w tym dowód wn. 3.5.3 . Zbiory zwarte. (rozdz. 3.6 ) w tym dowód tw. 3.6.6 oraz
tw. 3.6.8 . Przestrzenie zupełne. (rozdz. 3.7 ) w tym dowód tw. 3.7.3 .
T07: Granica funkcji. (rozdz. 4.1 - 4.2 ) w tym dowód tw. 4.2.2 , tw. 4.2.3 oraz tw. 4.2.4 .
T08: Granice jednostronne, punkty graniczne, granice dolne i górne (rozdz. 4.3 - 4.5 ) w tym dowód tw. 4.4.1 oraz tw. 4.5.4
. Ciągłość funkcji (rozdz. 4.6 ) w tym dowód tw. 4.6.3 .
T09: Ciągłość, a zwartość (rozdz. 4.7 ) w tym dowód tw. 4.7.1 , tw. 4.7.3 oraz tw. 4.7.4 . Jednostajna ciągłość w tym
dowód tw. 4.8.4 . Funkcje Lipschitza. Ciągłość, a spójność (rozdz. 4.8 - 4.9 ) w tym dowód tw. 4.9.1 , wn 4.9.2 oraz
tw. 4.9.3 .
T10: Szeregi: eksperymenty numeryczne (rozdz. 5.1 ), własności podstawowe (rozdz. 5.2 ) w tym wszystkie dowody
T11: Szeregi: kryteria zbieżności (rozdz. 5.3 ), w tym dowód tw. 5.3.3 oraz tw. 5.3.4 tw. 5.3.6
T12: Operacje na szeregach (rozdz. 5.4 ) w tym dowód tw. 5.4.1 oraz tw. 5.4.3 .
T13: Zespolona funkcja wykładnicza (rozdz. 6.1 ) w tym dowód tw. 6.1.3 , wn. 6.1.4
T14: Rzeczywista funkcja wykładnicza i logarytmiczna (rozdz. 6.2 ) w tym dowód tw. 6.2.1 wraz z lematem 6.2.2 ,
tw. 6.2.3 oraz tw. 6.2.5 .
T15: Funkcje trygonometryczne (rozdz. 6.3 ) w tym dowód tw. 6.3.1 , tw. 6.3.4 oraz lematu 6.3.6 . Liczba π, okresowość,
i wzory trygonometryczne (rozdz. 6.4 ) w tym dowód tw. 6.4.1 , tw. 6.4.4 , tw. 6.4.9 oraz tw. 6.4.12 .
T17: Pochodna funkcji (rozdz. 8.1 ). Pochodna sumy, różnicy, iloczynu, ilorazu (rozdz. 8.2 ).
T18: Pochodna złożenia funkcji (rozdz. 8.3 ). Pochodna funkcji wykładniczej i funkcji trygonometrycznych (rozdz. 8.4 ).
Nieciągłości pochodnej i funkcje klasy C 1 , (rozdz. 8.5 ). Metoda Newtona (rozdz. 8.6 ).
T19: Pochodna, a ekstrema lokalne (rozdz. 8.7 ). Twierdzenia o wartości średniej (rozdz. 8.8 ) z zastosowaniami (rozdz. 8.9
). Reguła de l’Hospitala, (rozdz. 8.10 ).
15
T20: Pochodna funkcji odwrotnej (rozdz. 8.11 ). Różniczka funkcji. (rozdz. 8.12 )
T21: Pochodne wyższych rzędów (rozdz. 8.13 ). Wzory Taylora i szereg Taylora. (rozdz. 8.14 )
T22: Całka Riemanna funkcji jednej zmiennej. (rozdz. 9.1 )
Nim zabierzemy si˛e do studiowania analizy matematycznej w szczegółach, warto sobie zadać pytanie czym analiza matematyczna si˛e zajmuje. Nie da si˛e na nie
dać dobrej odpowiedzi bez przyjrzenia si˛e jak koncepcje, które ukształtowały współczesna˛ analiz˛e matematyczna˛ stopniowo kształtowały si˛e na przestrzeniach
dziejów. Niniejszy rozdział wprowadzajacy
˛ stanowi krótki przeglad˛ podstawowych problemów analizy matematycznej oraz ich umiejscowienia w historii matematyki.
1.1.2 Ułamki
Pojawienie si˛e ułamków wiaże
˛ si˛e z rozwojem handlu, który wymagał doskonalenia umiej˛etności mierzenia. Do mierzenia używano miary. Na przykład w przypadku
płynów i materiałów sypkich mogła to być gliniana amfora o ustalonej obj˛etości. Poczatkowo
˛ zaniedbywano powstajace ˛ przy odmierzaniu cz˛eści ułamkowe, ale
gdy z biegiem czasu rosła potrzeba dokładności, wprowadzano miary pomocnicze b˛edace ˛ cz˛eścia˛ wyjściowej miary, na przykład połowa,˛ jedna˛ trzecia˛ czy jedna˛
czwarta.˛ Co charakterystyczne, były to tzw. ułamki proste, czyli ułamki o liczniku jeden. Gdy handel zaczał˛ przekraczać granice pojedynczych plemion pojawiła si˛e
konieczność wprowadzania przelicznika dla różnych systemów miar obowiazuj ˛ acych
˛ w różnych rejonach. To zapewne przyczyniło si˛e do powstania abstrakcyjnej
postaci ułamka.
17
18 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
jesteśmy w stanie radzić sobie bez liczb ujemnych. Najwi˛ekszy pożytek z liczb ujemnych jest przy ujednolicaniu algorytmów, gdyż dzi˛eki nim nie musimy rozważać
różnych przypadków, by zagwarantować, że wszystkie rozważane w trakcie pracy algorytmu liczby sa˛ dodatnie.
√ √
Rysunek 1.3: Przekątna kwadratu to 2. Ale ile to jest 2?
spostrzeżenie, z którym niełatwo było si˛e pogodzić. Tak pojawiły si˛e liczby niewymierne, a wraz nimi problem ich przybliżania ułamkami.
√
Ćwiczenie 1.1.2 • Rozkładajac
˛ na czynniki pierwsze licznik i mianownik ułamka spróbuj uzasadnić, dlaczego 2 nie może być ułamkiem.
√
• Czy podobne rozumowanie może być przeprowadzone dla 3 2? dla innych pierwiastków?
√
Problem 1.1.3 Czy wiemy czym naprawd˛e jest liczba 2? Czy ona rzeczywiście ma sens? Jakich liczb jeszcze brakuje wśród ułamków, by wszystkie
długości dało si˛e wymierzyć? W jaki sposób je zdefiniować?
Wraz ze zbudowaniem w połowie XX w. pierwszych komputerów stworzono też koncepcj˛e przechowywania i przetwarzania liczb w komputerze. Było to
konieczne, bo wszystko co przetwarza współczesny komputer na poziomie procesora sprowadza si˛e do wykonywania obliczeń na liczbach. Typowy użytkownik
komputera oglada˛ filmy, słucha muzyki, przeglada˛ strony internetowe albo po prostu gra na komputerze i nie uświadamia sobie, że wszystko to sprowadza si˛e do
przetwarzania liczb. Zazwyczaj sa˛ to liczby całkowite, ale wiele pozamatematycznych zastosowań wymaga też obliczeń na liczbach wymiernych.
Komputer jest oczywiście równie niezastapiony
˛ jeśli naszym celem jest przeprowadzenie mniej lub bardziej skomplikowanych obliczeń matematycznych, inży-
nierskich badź
˛ naukowych. Jeśli obliczenia sa˛ bardzo specjalistyczne, jest ich szczególnie dużo, a nam zależy na efektywności, piszemy własny lub zamawiamy
stosowny program w kompilowanym j˛ezyku wysokiego poziomu. Jeśli obliczenia sa˛ typowe, a ich ilość jest umiarkowana, si˛egamy po specjalistyczne oprogramo-
wanie takie jak Mathematica, Maple, Matlab czy Scilab.
W ramach niniejszego kursu aspekty numeryczne analizy matematycznej demonstrować b˛edziemy programami napisanymi dla środowiska Mathematica, a
także programami napisanymi w j˛ezyku C++.
Mathematica to bogaty pakiet oprogramowania bardzo ułatwiajacy ˛ wszelkie obliczenia matematyczne. Umożliwia on tak prosta˛ prac˛e interaktywna˛ jak i pisanie
własnego oprogramowania. Na przykład, aby pomnożyć przez siebie liczby 123 i 456 wystarczy napisać
123*456
i przycisnać
˛ rówcznocześnie klawisze ’Shift’ i ’Enter’. Przyciśni˛ecie ’Shift’ wraz ’Enter’ jest sygnałem, że oczekujemy przeprowadzenia obliczeń. Natychmiast
otrzymujemy wynik
56088
W programie Mathematica operacje arytmetyczne dodawania, odejmowania, mnożenia, dzielenia i pot˛egowania oznaczamy odpowiednio znakami +,-,*,/,^.
Tak wi˛ec piszac
˛
3^4
otrzymujemy
81
W podobny sposób przeprowadzamy obliczenia na ułamkach dziesi˛etnych. Na przykład
3.14 + 2.72
daje wynik 5.86. Trzeba jedynie pami˛etać, że zgodnie z anglosaskim zwyczajem używamy kropki dziesi˛etnej, a nie przecinka. Obliczenia na liczbach dziesi˛etnych
zwiazane
˛ sa˛ niestety z bł˛edami zaokragleń.
˛ Na przykład
1.0/3.0
1.2 Ciągi
1.2.1 Przybliżanie pierwiastka
˛ wszystkie ułamki o mianowniku m znajdziemy taki, postaci
Choć wśród ułamków brak jest takiego, który podniesiony do kwadratu daje liczb˛e dwa, to rozważajac
i
m , że
2 2
i+1
i
<2< .
m m
√
Dla danego m licznik taki jest dokładnie jeden. Sam pierwiastek z dwóch, czymkolwiek jest, leży gdzieś pomi˛edzy i
m, a i+1
m , zatem i
m jest przybliżeniem 2z
1
dokładnościa˛ co najmniej m . Na przykład, dla m = 5 mamy
2 2
7 49 64 8
= <2< =
5 25 25 5
√
zatem 7
5 jest przybliżeniem 2 z dokładnoscia˛ wi˛eksza˛ niż 15 . Aby dostać lepsza˛ dokładność wystarczy wziać
˛ odpowiednio duży mianownik m.
√ i ∗ i < 2 ∗ 100 dla kolejnych liczb naturalnych i i zwraca in jako ostatnie i, dla którego
n
Sugeruje to algorytm, który przy zadanym n sprawdza nierówność
nierówność ta zachodzi. Wtedy xn := 10n jest przybliżeniem 2, które, jak łatwo sprawdzić, spełnia
in
√ 1
|xn − 2| ¬ .
10n
Pojawiaja˛ si˛e tu zmienne i oraz n. Instrukcja While to instrukcja p˛etli. Jak długo spełniony jest warunek i^2 < 2*100^n wykonywana jest instrukcja
i = i + 1. Ponieważ przed wykonaniem instrukcji While ustawiliśmy zmienna˛ n na 3, a i na 1, p˛etl˛e wykonujemy dla kolejnych wartości i = 1, 2, . . . aż
zajdzie nierówność i^2 2000000. Mathematica wyprowadza jako wynik ostatnie obliczone wyrażenie, którym jest para ułamków {(i-1)/10^n,i/10^n}.
W rozważanym przypadku otrzymamy
707 283
{ , }.
500 200
√
jako oszacowanie od dołu i od góry 2 z dokładnościa˛ do 1000
1
.
√
Podstawiajac ˛ obliczenia otrzymamy przybliżenia 2 od dołu i od góry o coraz lepszej
˛ w powyższym listingu za n kolejne liczby naturalne i wykonujac
22 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
dokładności:
14 15
,
10 10
141 142
,
100 100
1414 1415
,
1000 1000
14142 14143
,
10000 10000
141421 141422
,
100000 100000
1414213 1414214
,
1000000 1000000
···
Obliczenia
√ te, przynajmniej teoretycznie, możemy kontynuować w nieskończoność. Otrzymujemy w ten sposób ciag ˛ przybliżeń od dołu i ciagu
˛ przybliżeń od
góry liczby 2.
W tym miejscu trzeba zrobić uwag˛e na temat stosowanej w programie Mathematica notacji. Mathematica używa nawiasów wasiastych ˛ {, } do oznaczania list.
Zwyczajowo w matematyce nawiasów wasiastych˛ używa si˛e do oznaczania zbiorów. Różnica ta ma znaczenie, bo przy wypisywaniu elementów listy kolejność jest
istotna, a przy wypisywaniu elementów zbioru nie jest. Innymi słowy, dwie listy, które różnia˛ si˛e tylko kolejnościa˛ elementów sa˛ różne, a dwa zbiory, które różnia˛ si˛e
tylko kolejnościa˛ w jakiej wymieniono ich elementy sa˛ traktowane jako identyczne. Korzystajac ˛ z programu Mathematica musimu o tej różnicy pami˛etać.
Zaproponowana tu metoda liczenia pierwiastka należy do najprostszych, ale oczywiście jest daleka od doskonałości. Mathematica radzi sobie doskonale
nie tylko z liczeniem pierwiastków, ale również innych funkcji elementarnych, w szczególności funkcji trygonometrycznych i funkcji logarytmicznej. Trzeba jednak
pami˛etać, że jeśli jako argument podamy liczb˛e dokładna,˛ na przykład naturalna˛ lub ułamek, a wynik nie jest liczba˛ naturalna˛ badź ˛ ułamkiem, aby zachować
dokładność Mathematica nie przeprowadzi obliczeń. Na przykład piszac ˛
Sqrt [ 2 ]
√
otrzymamy jako wynik 2. Ale piszac
˛
Sqrt [ 2 . ]
otrzymamy 1.41421.
Do zagadnienia obliczania pierwiastka b˛edziemy jeszcze wracać w dalszych rozdziałach.
Oczywiście ciagi
˛ nie musza˛ być zadawane w tak skomplikowany sposób jak nasz ciag ˛ przybliżeń. Najprościej zadać ciag ˛ wzór na jego n-ty wyraz.
˛ podajac
Na przykład ciag
˛ dany wzorem
1
xn = (1.1)
n
to tak zwany ciag
˛ harmoniczny.
{1., 0.5, 0.333333, 0.25, 0.2, 0.166667, 0.142857, 0.125, 0.111111, 0.1}
1.2. CIĄGI 23
(−1)n
Rysunek 1.4: Wykres początkowych wyrazów ciągu 1 + n .
(−1)n
un = 1 +
n
uzyskamy piszac
˛
D i s c r e t e P l o t [1 + ( −1)^ n / n , { n , 1 , 50}]
1.2.3 Granice
√ √
Obrazowo mówimy, że ciag ˛ ten osiaga˛ liczb˛e 2 w granicy, albo krócej, że zmierza do 2. Właśnie
√ w tym celu go skonstruowaliśmy. Ale czy możemy mieć
˛ dla dużych wartości n nie zmieni zdania i na przykład zamiast zmierzać do 2 zacznie uciekać do nieskończoności? Jesteśmy w stanie
pewność, że nasz ciag
policzyć tylko skończona˛ ilość wyrazów tego ciagu.
˛ Zawsze zostanie nieskończenie wiele wyrazów, których nie policzyliśmy. Czy możemy mieć pewność, że nasz
ciag
˛ przybliżeń nigdy nas nie zawiedzie?
Odpowiedź na te pytania to jedno z fundamantalnych zadań analizy matematycznej. Poj˛eciem granicy w takim badź ˛ innym sensie posługiwano si˛e już od
czasów starożytnych, jednak aż do wieku XIX matematycy nie umieli sobie poradzić z postawieniem precyzyjnej definicji. Dopiero czeski matematyk Bernard
Bolzano (rys. 1.5 ) oraz niezależnie francuski matematyk, Augustin-Louis Cauchy (rys. 1.5 ) pierwsi postawili precyzyjna˛ definicj˛e. Ponieważ prace Bolzano długo
pozostawały mało znane, przyj˛eło si˛e mówić o definicji Cauchy’ego.
Według definicji Cauchy’ego ciag ˛ liczb xn jest zbieżny do granicy g jeżeli dla każdego ε > 0 istnieje taka liczba naturalna N , że dla wszystkich liczb
naturalnych n N zachodzi nierówność
|xn − g| < ε.
24 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.5: Augustin Louis Cauchy (1789 - 1857) i Bernard Bolzano (1781 - 1844) Źródło: Wikipedia
Piszemy wtedy
lim xn = g.
n→∞
Ćwiczenie komputerowe 1.2.3 Dla każdego z poniższych ciagów˛ postaw hipotez˛e, czy ma on granic˛e. Jeśli uważasz, że ma granic˛e, spróbuj odgadnać
˛
jaka.˛ Wcześniej przeprowadź eksperymenty wykorzystujac
˛ instrukcj˛e Table w Mathematica.
n
1. n+1
2. 1 + (−1)n
(−1)n
3. 1 + n
4. (*) cos nπ
5. (*) sin n
sin n
6. (*) n
˛ an , bn sa˛ zbieżne odpowiednio do a i b to ich suma, różnica, iloczyn oraz iloraz sa˛ zbieżne odpowiednio do a + b, a − b,
Twierdzenie 1.2.4 Jeśli ciagi
ab, ab , przy czym w przypadku ilorazu trzeba dodatkowo założyć, że b 6= 0.
1.2. CIĄGI 25
Rysunek 1.6: Archimedes z Syrakuz (ok. 287–212 pne.) (medal Fieldsa). Źródło: Wikipedia
˛ an , bn , cn spełniaja˛ nierówność
Twierdzenie 1.2.5 Jeśli ciagi
an ¬ bn ¬ cn
1.2.5 Liczba π
Wśród ważnych problemów rozważanych już w starożytności było wyznaczanie obwodu i pola koła o zadanym promieniu. Kluczowy w tych obliczeniach jest
obwód koła o średnicy jeden, zwyczajowo oznaczany grecka˛ litera˛ π . Koło o innej średnicy ma proporcjonalnie wi˛ekszy badź˛ mniejszy obwód, w szególności koło
o promieniu r , a wi˛ec średnicy
√ 2r ma obwód 2πr .
Liczba π , podobnie jak 2, jest liczba˛ niewymierna,˛ ale o tym starożytni nie wiedzieli. Udowodniono to dopiero w XVIII w. Co wi˛ecej, w wieku XIX udowod-
niono, że π jest liczba˛ transcendentna,˛ to znaczy, że nie jest pierwiastkiem żadnego wielomianu o współczynnikach wymiernych. Oznacza to w szczególności, że
nawet jeśli zbiór ułamków rozszerzymy o wszystkie możliwe pierwiastki, to nadal nie wystarczy on do mierzenia wszelkich długości.
W starożytności przyjmowano różne liczby pomi˛edzy 3 i 3.16 jako przybliżenie liczby π bez przywiazywania
˛ szczególnej wagi do popełnianego bł˛edu. Dopiero
grecki matematyk Archimedes (rys. 1.6 ) zaproponował algorytmiczna˛ metod˛e wyznaczania π , która przez ponad 1000 lat dostarczała coraz lepszych przybliżeń.
Jest to metoda geometryczna, oparta o wpisywanie w okrag ˛ i opisywanie na okr˛egu wielokatów
˛ (rys. 1.7 ). Posługujac˛ si˛e 96-katem
˛ Archimedes oszacował, że
223/71 < π < 22/7 (3.1408 < π < 3.1429), co daje dobre przybliżenie π do dwóch miejsc po przecinku. Co ciekawe, w 1596 roku, ciagle ˛ w oparciu o
metod˛e metod˛e Archimedesa, holenderski matematyk Ludolph van Ceulen policzył π z dokładnościa˛ do 35 cyfr.
Oznaczmy przez an bok 2n -kata ˛ foremnego wpisanego w okrag ˛ o średnicy jeden. W oparciu o twierdzenie Pitagorasa można pokazać, że
√
2 1
q
a2 = = 2 − 4 − 4a2n . (1.2)
p
, an+1
2 2
Zatem obwód tego 2n -kata
˛ wynosi An := 2n an .
˛ An powinien zmierzać do liczby π , bo tyle wynosi obwód koła o średnicy jeden. W rozdziale 2.4.1 przyjrzymy si˛e bliżej
Można si˛e spodziewać, że ciag
˛ (1.2).
zachowaniu ciagu
26 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
1.3 Szeregi
1.3.1 Pole koła
Archimedesowi zawdzi˛eczamy również sposób liczenia pola koła. Zastosował on tu również metod˛e wielokatów.
˛ Najpierw zauważył, że pole n-kata
˛ foremnego
wpisanego w okrag ˛ pola n trójkatów
˛ można policzyć sumujac ˛ równoramiennych. Maja˛ one wszystkie jednakowa˛ podstaw˛e xn i jednakowa˛ wyskość hn , zatem
˛ wynosi Pn := nxn2 hn co równe jest Ln2hn , gdzie Ln := nxn jest obwodem wielokata.
pole wielokata ˛ Przy n zmierzajacym
˛ do nieskończoności wysokości
hn zmierzaja˛ do promienia r koła, a obwody Ln zmierzaja˛ do obwodu koła, o którym wiemy już, że wynosi 2πr. Zatem pola Pn zmierzaja˛ do 2πrr 2 skad˛
wnosimy, że pole koła o promieniu r to
P := πr2 . (1.3)
Pn+1 = Pn + An ,
czyli An+1 jest poprawka,˛ która dodana do pola 2n -kata
˛ daje pole 2n+1 -kata.
˛ Stad
˛
Pn = A1 + A2 + A3 + A4 + . . . + An−1 ,
a pole koła PK otrzymamy sumujac
˛ wszystkie poprawki:
PK = A 1 + A 2 + A 3 + A 4 + . . . .
Wartości Ai można wyliczyć. Aby wykorzystać wzory z podrozdziału 1.2.5 , zamiast koła o promieniu jeden rozważymy ponownie koło o średnicy jeden,
a wi˛ec o promieniu 1/2. Zatem ze wzoru (1.3) jego pole to π4 . Zatem jako przybliżenie π interesuje nas ciag
˛ sn := 4Pn . Niech Tn oznacza pole trójkata ˛
równoramiennego o podstawie równej bokowi 2n -kata,˛ a ramionach równych bokowi 2n+1 -kata. ˛ Mamy
An = 2n Tn
√
an (1− 1−a2n )
Można policzyć, że Tn = 4 , gdzie an , jak poprzednio, oznacza bok 2n -kata
˛ foremnego wpisanego w koło o średnicy jeden. Zatem
n an (1 1 − a2n )
p
−
Pn+1 = Pn + 2
4
oraz
sn+1 = sn + 2n an (1 − 1 − a2n ). (1.4)
p
1.3.3 Szeregi
˛ sn jest specyficzny. Jego m-ty wyraz może zostać zapisany w postaci
Warto zwrócić uwag˛e, że ciag
m
X
sm = cn , (1.5)
n=1
gdzie
0
dla n = 1,
cn = 2 dla n = 2,
2 an (1 − 1 − a2n ) dla n > 2.
n p
28 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
na oznaczenie szeregu o wyrazach cn , a sm dane wzorem (1.5) nazywamy m-ta˛ suma˛ cz˛eściowa˛ szeregu.
˛ sn jest zbieżny. W takim przypadku granic˛e ciagu
Mówimy, że szereg jest zbieżny, jeżeli ciag ˛ sn nazywamy suma˛ szeregu i oznaczamy tym samym symbolem
co sam szereg.
Szeregi odgrywaja˛ ważna˛ rol˛e w wielu zastosowaniach, dlatego badaniu ich zbieżności poświ˛eca si˛e w analizie matematycznej szczególna˛ uwag˛e. Szczególnie
ważne sa˛ narz˛edzia, które pozwalaja˛ określić, czy szereg jest zbieżny, czy nie. Jeśli nie wiemy czy szereg jest zbieżny, to nie możemy z pożytkiem wykorzystywać
w obliczeniach numerycznych.
1.4 Funkcje
1.4.1 Koncepcja funkcji
Koncepcja funkcji, jedna z fundamentalnych idei współczesnej matematyki, jako samodzielny obiekt badań pojawiła si˛e w drugiej połowie XVII w. W tym pierwotnym
uj˛eciu funkcja była rozumiana jako wartość, tzw. zmienna zależna, która˛ można obliczyć rachunkiem algebraicznym badź ˛ poprzez konstrukcje geometryczne w
oparciu o inna˛ wartość, tzw. zmienna˛ niezależna˛ oraz pewne stałe. Jako przykład pierwszej kategorii może tu posłużyć funkcja kwadratowa
x 7→ x2 ,
x1 := a,
y1 := b,
2 w przeciwnym razie,
(
yn jeżeli f (yn )f ( xn +yn
) < 0,
yn+1 := xn +yn
2
2 w przeciwnym razie.
Ćwiczenie komputerowe 1.4.1 (*) Zaimplementuj metod˛e bisekcji w j˛ezyku Mathematica. Przetestuj ja˛ dla funkcji
(1) x 7→ x2 − 3 dla a = 1 i b = 3
(2) x 7→ x+cos x
sin x − 1 dla a = −1 i b = 1.
P l o t [ −16+16 x ^2 −4 x ^3 −3 x ^4+ x ^ 5 , { x , − 2 . 5 , 3 . 5 } ]
x 7→ sin x.
30 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.10: Geometryczna definicja funkcji sin i cos: w wycinku koła o promieniu 1 i długości łuku x wartość sin x
definiuje się jako długość odcinka spuszczonego z końca łuku prostopadle do ramienia wycinka koła ze znakiem plus, gdy
koniec łuku jest ponad ramieniem, a znakiem minus, gdy koniec łuku jest poniżej ramienia.
Konstrukcj˛e geometryczna˛ sin x i cos x pokazano na rys. 1.10 . W konstrukcji tej |x| jest interpretowane jako długość łuku wycinka koła o promieniu jeden, a
znak x rozstrzyga o wzajemnym położeniu poczatku
˛ i końca łuku. Przyj˛ete jest, że znak plus oznacza iż poczatek
˛ łuku wyst˛epuje przed końcem łuku przy ruchu
przeciwnym do ruchu wskazówek zegara. Wykres funkcji sin przedstawiono na rys. 1.11 .
W wielu zastosowaniach bardziej od funkcji sin i cos przydaje si˛e funkcja tangens
sin x
tg : x 7→
cos x
oraz funkcja cotangens
cos x
ctg : x 7→ .
sin x
Ponieważ dzielenie przez zero nie ma sensu, funkcja tangens nie ma określonej wartości dla argumentów x, dla których funkcja cos przyjmuje wartość zero, a
funkcja cotangens dla argumentów, dla których funkcja sinus si˛e zeruje. Wykres funkcji tg przedstawiono na rys. 1.12 .
W programie Mathematica zwyczajowo nazwy funkcji rozpoczyna si˛e od dużej litery. Sin, Cos, Tan, Cot to nazwy funkcji sinus, cosinus, tangens i cotangens.
Wykres funkcji sinus na rys. 1.11 uzyskano instrukcja˛
P l o t [ S i n [ x ] , { x , −2 P i , 2 P i } ]
1.4. FUNKCJE 31
otrzymamy wartość 9.
Co ciekawe, możemy też definiować funkcje, które w różnych przypadkach zdefiniowane sa˛ różnymi wzorami. Na przykład
g [ x_ ] : = I f [ x ^2 >1 , x ^ 2 , −1]
definiuje funkcj˛e, która˛ przy zastosowaniu tradycyjnej matematycznej notacji zapisalibyśmy wzorem
(
x2 gdy x2 > 1,
x 7→
−1 w przeciwnym razie.
Instrukcja If j˛ezyka Mathematica to tak zwana instrukcja warunkowa. Ma ona trzy argumenty. Zwraca drugi, gdy pierwszy ewaluuje si˛e do prawdy. W przeciwnym
razie zwraca argument trzeci.
Rysunek 1.13: Pole soczewkowatej figury jest różnicą pól pod wykresami funkcji.
y = −x2 + 2x,
y = x2 .
Pole pod wykresem funkcji f na przedziale [a, b] określane jest mianem całki oznaczonej. Do policzenia całki oznaczonej z funkcji f na przedziale [a, b]
też możemy zastosować technik˛e przejścia granicznego. W tym celu dzielimy przedział [a, b] punktami a = x0 < x1 < x2 < . . . < xn = b na n
podprzedziałów, niekoniecznie równych, i nad każdym z nich budujemy prostokat˛ o wysokości równej wartości funkcji f w prawym końcu przedziału. Oznaczajac
˛
przez ∆xi := xi − xi−1 długość i-tego przedziału (i-ta˛ różnic˛e) i sumujac
˛ pola prostokatów
˛ otrzymujemy przybliżenie pola pod wykresem równe:
n
X
f (x1 )∆x1 + f (x2 )∆x2 + . . . f (xn )∆xn = f (xi )∆Xi . (1.6)
i=1
Biorac
˛ coraz wi˛ecej punktów i coraz krótsze przedziały, w granicy otrzymujemy poszukiwane pole. Oznaczamy je dość tajemniczym symbolem
Z b
f (x)dx,
a
w którym znak sumy przekształcił si˛e w wydłużona˛ liter˛e ’S’, a różnica ∆xi w "nieskończonie mała˛ różnic˛e", czyli różniczk˛e, oznaczona˛ symbolem dx.
1.5. POLA FIGUR I CAŁKOWANIE 33
Z b
f (x)dx = F (b) − F (a).
a
34 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Funkcja F spełniajaca
˛ powyższy wzór nosi nazw˛e całki nieoznaczonej funkcji f . Oznaczamy ja˛ (nieprecyzyjnie) symbolem
Z
f (x)dx
Jeśli potrafilibyśmy znaleźć analityczny sposób na znalezienie całki nieoznaczonej w oparciu o funkcj˛e f , liczenie pól znacznie ułatwiłoby si˛e. Żyjacy
˛ na
przełomie X i XI w. naukowiec arabski znany w Europie jako Alhacen potrafił pokazać (oczywiście w ówczesnym j˛ezyku matematyki), że jeśli f jest wielomianem
stopnia drugiego
f (x) := a0 + a1 x + a2 x2 ,
b
[F (u)]a := F (b) − F (u)
otrzymujemy
1
1
x3 1
Z
x2 dx = =
0 3 0 3
1
1
2x2 2
Z 3
x
(−x2 + 2x)dx = − + = .
0 3 2 0 3
Płyna˛ z tego dwa ważne wnioski. Po pierwsze, granica skomplikowanego ciagu ˛ wcale nie musi być trudna˛ w wyliczeniu liczba˛ niewymierna.˛ Po drugie i
ważniejsze, poj˛ecie granicy może być pomocne nie tylko w obliczeniach liczb niewymiernych. Nie mniej, a może nawet wi˛ecej, przydaje si˛e ono do definiowania
nowych poj˛eć, trudnych do zdefiniowania inaczej.
1.6. STYCZNA DO KRZYWEJ I GRANICA FUNKCJI 35
Zmierzajac˛ z h do zera zbliżamy sieczna˛ do stycznej, a wi˛ec w granicy dostać powinniśmy współczynnik nachylenia stycznej. I rzeczywiście dostajemy, jeśli
tylko funkcja jest odpowiednio porzadna.
˛
Należy zwrócić uwag˛e, że mamy tu do czynienia z innego typu granica˛ niż rozważane do tej pory, bo nie rozważamy ciagu,
˛ lecz funkcj˛e
f (x0 + h) − f (x0 )
h 7→ (1.7)
h
zmiennej h (x0 traktujemy jako parametr). Jak definiuje si˛e granic˛e ciagu
˛ już mniej wi˛ecej wiemy. A jak si˛e to robi w przypadku granicy funkcji?
Według Weierstrassa funkcja f ma w punkcie x0 granic˛e g jeżeli dla każdego ε > 0 istnieje δ > 0 takie, że dla wszystkich x 6= x0
2x + x2
f :x→
x
jest nieokreślona w zerze, ale określona dla wartości wi˛ekszych i mniejszych od zera. Dla wartości tych jest ona równa funkcji
x → 2 + x,
która jest ciagła
˛ i określona w zerze, a zatem ma w zerze granic˛e dwa. Zatem
lim f (x) = 2.
x→0
Przykład ten może wydawać si˛e sztuczny, ale docenimy jego wartość, gdy uświadomimy sobie, że dokładnie taka granica pojawia si˛e przy obliczaniu współczynnika
kierunkowego stycznej do wykresu funkcji x 7→ x2 w punkcie 1, bo zgodnie ze wzorem (1.7) jest to funkcja
Oczywiście granica funkcji nie musi istnieć. Jest tak na przykład w przypadku funkcji (rys. 1.19 )
1
x 7→ sin ,
x
˛ dla wszystkich x z wyjatkiem
która jest określona i ciagła ˛ zera, ale w zerze nie ma granicy.
Z kolei funkcja
sin x
x 7→ ,
x
˛ dla wszystkich x z wyjatkiem
która też jest określona i ciagła ˛ zera, w zerze ma granic˛e wynoszac
˛ a˛ jeden, ale nie jest oczywiste jak to pokazać. Jednak z z wykresu
(rys. 1.20 ) widać, że należy si˛e tego spodziewać.
38 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.19: Wykres funkcji x 7→ sin x1 . Granica tej funkcji w zerze nie istnieje
Rysunek 1.21: Wybrane styczne do wykresu funkcji. Na czerwono zaznaczono styczne w miejscach gdzie wykres się wznosi,
na zielono gdzie opada, a na żółto miejsca gdzie styczna jest pozioma.
∆x := (x + h) − x = h
∆y := f (x + h) − f (x)
dy
f 0 (x) =
dx
uczynić precyzyjnym.
Jeśli potrafimy ze wzoru na funkcj˛e f wyprowadzić wzór na funkcj˛e f 0 oraz potrafimy znaleźć miejsca zerowe funkcji f 0 , to potrafimy wskazać miejsca
podejrzane o wyst˛epowanie lokalnych minimów i lub maksimów. Okazuje si˛e, że choć w definicji pochodnej wyst˛epuje granica, to w wielu przypadkach jest to
granica, która˛ możemy policzyć czysto analitycznie bez konieczności stosowania przybliżeń. Na przykład dla funkcji x 7→ f (x) := x2 − 4x + 5 mamy
Q(x) := b0 + b1 x + b2 x2 + b3 x3
jest
Q0 (x) = b1 + 2b2 x + 3b3 x2 .
Przypomnijmy, że około 200 lat wcześniej, Alhacen policzył, że całka˛ nieoznaczona˛
f (x) := a0 + a1 x + a2 x2 ,
jest
a1 x2 a2 x3
Z
F (x) = f (x)dx = a0 x + + .
2 3
Podstawiajac
˛
b1 = a0
2b2 = a1
3b3 = a2
Rysunek 1.22: Isaac Newton (1643 - 1727) i Gottfried Leibniz (1646 - 1716). Źródło: Wikipedia
Twierdzenie 1.7.1 Jeśli f jest pochodna˛ funkcji F , to F jest całka˛ nieoznaczona˛ funkcji f . Jeśli F jest całka˛ nieoznaczona˛ funkcji f , to pochodna˛ funkcji
F jest f .
Twierdzenie to jest dzisiaj określane mianem podstawowego twierdzenia rachunku różniczkowego i całkowego. Do czasu odkrycia tego twierdzenia teorie
pochodnej i całki rozwijane były niezależnie, przy czym w liczeniu pochodnych notowano wi˛eksze post˛epy niż w liczeniu całek. Odkrycie Newtona i Leibniza
pokazało, że w istocie jest jedna teoria, a każdy wzór na pochodna˛ jest równocześnie wzorem na całk˛e. Umożliwiło to liczenie wielu nowych całek, dało impuls do
intensywnego rozwoju rachunku różniczkowego i całkowego i przyczyniło si˛e do szybkiego rozwoju nauk technicznych.
42 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Część II
Granice
43
Rozdział 2
Definicja 2.1.1 Ciało liczbowe F to zbiór liczb z dwuargumentowymi działaniami + (dodawanie), · (mnożenie) i
wyróżnionymi liczbami 0 (zero) i 1 (jeden) taki, że
• dla dowolnego x ∈ F zachodzi x + 0 = x oraz x · 1 = x,
• dla dowolnego x ∈ F istnieje x0 ∈ F , zwyczajowo oznaczane −x, takie że x + x0 = 0,
(x + y) + z = x + (y + z)
(x · y) · z = x · (y · z)
(x + y) · z = x · z + y · z
45
46 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Definicja 2.1.2 Ciało liczbowe uporządkowane to ciało liczbowe F dodatkowo z dwuargumentową relacją ¬ (mniejsze
lub równe) taką, że dla dowolnych x, y, z ∈ F zachodzą następujące własności
• (zwrotność) x ¬ x,
Piszemy x < y gdy x ¬ y oraz x 6= y. Dla wygody wprowadzamy też oznaczenie x y równoważne y ¬ x oraz x > y
równoważne y < x.
Ciało liczbowe uporzadkowane
˛ ciagle
˛ nie musi być ciałem liczb rzeczywistych, bo również liczby wymierne (ułamki ze znakiem) tworza˛ takie ciało. To, czym
ciało
√ liczb rzeczywistych wyróżnia si˛
e od innych ciał jest fakt, że nie ma w nim dziur, takich jak na przykład dziura w zbiorze liczb wymiernych spowodowana faktem,
że 2 nie jest liczba˛ wymierna.˛ Postulat braku dziur formalizuje si˛e poprzez wprowadzenie poj˛ecia kresu górnego zbioru.
Mówimy, że b ∈ F jest majorantą zbioru A ⊂ F jeśli dla każdego x ∈ A mamy x ¬ b. Mówimy, że zbiór A ⊂ F jest
ograniczony od góry, jeśli ma majorantę. Mówimy, że a ∈ F jest kresem górnym zbioru A i piszemy a = sup A jeżeli a jest
najmniejszą majorantą zbioru A. Innymi słowy dla każdej majoranty a0 zbioru A zachodzi nierówność a ¬ a0 . Analogicznie
definiujemy minorantę, zbiór ograniczony od dołu i kres dolny, który oznaczamy inf A. Warto zauważyć, że poj˛ecie majoranty
i kresu górnego zbioru definiuje si˛e nie tylko dla ciał uporzadkowanych.
˛ Wystarczy przestrzeń z zadanym cz˛eściowym porzadkiem,
˛ a wi˛ec relacja˛ zwrotna,˛
antysymetryczna˛ i przechodnia.˛ Szczególna sytuacja zachodzi dla porzadków˛ liniowych, a wi˛ec porzadków,
˛ które maja˛ dodatkowo własność spójności. Można
wtedy pokazać, że a jest kresem górnym zbioru A jeśli a jest majoranta˛ zbioru A i zbiór A nie posiada majoranty mniejszej. Ta równoważna definicja może być
w szczególności stosowana w ciałach uporzadkowanych,
˛ których porzadek
˛ zawsze jest spójny, a wi˛ec liniowy.
Możemy wreszcze podać definicj˛e ciała liczb rzeczywistych. Warto od razu dodać, że w przeciwieństwie do ciała liczbowego i ciała liczbowego uporzadkowa-
˛
nego ciało liczb rzeczywistych jest dokładnie jedno, a jego konstrukcj˛e można uzyskać z aksjomatów teorii mnogości.
Definicja 2.1.3 Ciało liczb rzeczywistych R to ciało liczbowe uporządkowane o tej własności, że każdy niepusty
ograniczony od góry podzbiór X ⊂ R posiada kres górny.
Warto pami˛etać, że istnienie kresu górnego zbiorów ograniczonych od góry (jak również kresu dolnego zbiorów ograniczonych od dołu) to jedyna, ale kluczowa
własność, która odróżnia zbiór liczb rzeczywistych od zbioru liczb wymiernych. Oczywiście w zbiorze liczb wymiernych sa˛ zbiory ograniczone od góry, które maja˛
kres górny, ale sa˛ też takie, które tego kresu nie maja.˛ Udowodnienie, że rozszerzenie zbioru liczb wymiernych do zbioru liczb rzeczywistych istnieje, a wi˛ec jest
sensowne, zazwyczaj oddelegowane jest do kursu teorii mnogości. Istnienie kresu górnego pozwala w szczególności na zdefiniowanie pierwiastków (tw. 2.2.5 )
oraz liczby e (tw. 2.6.1 ).
Szczególną sytuację mamy, gdy zbiór A jest skończony, na przykład A = {a1 , a2 , . . . ak }. Wtedy kres górny i kres dolny za-
wsze (nawet w ciele liczb wymiernych) istnieją i pokrywają się odpowiednio z największym i najmniejszym elementem zbioru
A. W takim przypadku stosujemy zwyczajowo oznaczenia max A oraz min A. Często stosujemy też oznaczenia skrótowe
2.1.1 Podzbiory R
Przyj˛eliśmy abstrakcyjna˛ definicj˛e zbioru R liczb rzeczywistych. Intuicyjnie oczekujemy, że w zbiorze tym znajda˛ si˛e w szczególności liczby naturalne, całkowie
oraz wymierne (ułamki). Ale trzeba je jakoś zlokalizować. Nie jest to trudne. Ponieważ z naszej formalnej definicji zbioru liczb rzeczywistych R w szczególności
2.1. CIAŁO LICZB RZECZYWISTYCH. 47
wiemy, że jest tam liczba 0 i liczba 1 o których zakładamy, że maja˛ takie własności jak intuicyjnie rozumiane zero oraz jeden, wystarczy si˛e nimi posłużyć, by krok
po kroku odtworzyć zbiór liczb naturalnych, a potem całkowitych i wymiernych,
Zbiór liczb naturalnych N definiujemy wzorem
n razy
z }| {
N := { x ∈ R | x = 0 lub x = 1 + 1 + . . . + 1 }
Np := { n ∈ N | n p }.
W szczególności N0 = N, a N1 to zbiór liczb naturalnych rozumiany bardziej konserwatywnie, a więc bez zera.
Zbiór liczb całkowitych Z definiujemy wzorem
Z := { x ∈ R | x ∈ N lub − x ∈ N }.
Q := { x ∈ R | ∃p ∈ Z ∃q ∈ N1 x = p · q −1 }.
Wprowadzamy oznaczenia
R+ := { x ∈ R | x > 0 },
−
R := { x ∈ R | x < 0 },
∗
R := { x ∈ R | x 0 }.
Rysunek 2.2: 32-bitowe słowo (4 bajty) używane do reprezentacji liczb typu int.
Rysunek 2.3: 64-bitowe słowo (8 bajtów) używane do reprezentacji liczb typu double.
W pamięci komputera możemy reprezentować jedynie pewien skończony podzbiór zbioru liczb. Używane są różne podzbiory.
W przypadku liczb, na których operuje procesor są to pewne podzbiory zbioru liczb całkowitych oraz pewne podzbiory
zbioru liczb wymiernych, najczęściej liczby całkowite typu int oraz wymierne typu double.
Do reprezentacji liczb typu int używa się zazwyczaj 32 cyfr dwójkowych, czyli inaczej bitów (rys. 2.2 ). Sama liczba
zapisana jest przy pomocy 31 bitów, a 32-gi bit używany jest do zapisania znaku. Pozwala to na zapisywanie liczb całkowitych
z zakresu −2147483648 do +2147483647.
Liczby typu double przechowywane są zazwyczaj na 64 bitach, z czego jeden bit reprezentuje znak s, 11 bitów cechę N ,
a pozostałe 52 mantysę m będącą ułamkiem o mianowniku 252 z przedziału [1, 2) (rys. 2.3 ). Umożliwa to zapisywanie liczb
w postaci
x = sm2N ,
a także, przy pomocy specjalnego kodu, liczby zero. Wykorzystanie cechy i mantysy pozwala na przybliżanie liczb o bardzo
dużym zakresie, od bardzo małych, rzędu 10−323 , do bardzo dużych, rzędu 10308 , przy zachowaniu w miarę stałej dokładności,
wynoszącej około 15 cyfr znaczących.
Większość języków programowania zadowala się takim systemem liczb reprezentowalnych jaki jest dostępny na poziomie
procesora. Tak jest na przykład w języku C++. Takie podejście jest wystarczające do większości zastosowań. Jeśli jednak
z jakiegoś powodu zachodzi potrzeba stosowania większej dokładności w obliczeniach, zawsze można skorzystać z biblioteki
udostępniającej liczby reprezentowalne reprezentowane na dowolnej ilości bitów, ograniczonej nie wielkością słowa maszy-
nowego ale jedynie całkowitą ilością wolnej pamięci. Jedyne co przy takim rozwiązaniu tracimy to czas obliczeń, który jest
istotnie wolniejszy niż w przypadku obliczeń wykonywanych na pojedynczych słowach maszynowych.
Specjalizowane programy do matematyki obliczeniowej, takie jak Mathematica mają tego typu biblioteki wbudowane.
Na przykład, aby pomnożyć przez siebie dwie liczby 25-cyfrowe wystarczy napisać
1234567890123456789012345∗1234567890123456789012345.
1524157875323883675049533479957338669120562399025
Pisząc
2^200
2.1. CIAŁO LICZB RZECZYWISTYCH. 49
otrzymujemy
1606938044258990275541962092341162602522202993782792835301376
Możliwa jest też zamiana ułamka na liczbę dziesiętną o dowolnie wysokiej dokładności. Na przykład pisząc
N[ 1 / 2 3 , 5 0 ]
otrzymujemy przybliżenie ułamka 1
23
0.043478260869565217391304347826086956521739130434783
z dokładnością do 50 cyfr.
Tam gdzie liczy się prędkość obliczeń (na przykład, gdy musimy policzyć nie jeden pierwiastek, ale miliony pierwiastków
jako część innego zadania) zamiast języków interpretowanych, takich jak Mathematica, używamy języków kompilowanych.
Współcześnie wszędzie tam, gdzie kluczowa jest szybkość obliczeń prym wiedzie język C++, choć na przykład fizycy preferują
jeszcze szybszy, ale nieco już sędziwy język Fortran. Najszybszy kod można uzyskać stosując bezpośrednio język maszynowy,
ale pisanie w nim programów jest wyjątkowo żmudne.
Listingi 2.1 i 2.2 prezentują nasz algorytm liczenia pierwiastka metodą brutalnej siły napisany w języku C++. Działa
on z dokładnością do 10−4 . Większej dokładności w oparciu o użyty w nim standardowy typ całkowitoliczbowy int nie da
się uzyskać, bo dla n >= 100000 wyrażnie p ∗ n ∗ n nie może być policzone poprawnie gdy reprezentowane jest jako typ int.
Odpowiednik programu z listingu 2.4 napisany w języku C++ przedstawono na listingu 2.3 .
Twierdzenie 2.1.4 (Zasada indukcji) Aby pokazać, że pewna własność ϕ(n) zachodzi dla wszystkich liczb naturalnych
od liczby p ∈ N poczynając wystarczy udowodnić, że
1. zachodzi własność ϕ(p),
2. jeśli dla pewnego k p zachodzi własność ϕ(k), to zachodzi również własność ϕ(k + 1).
Zasada indukcji jest bardzo wygodnym i szeroko stosowanym sposobem dowodzenia własności, które zależą od liczb
naturalnych.
n! n n! n! n! n
(a + b)n = a + an−1 b + an−2 b2 + · · · + b , (2.4)
0!n! 1!(n − 1)! 2!(n − 2)! n!0!
n n n n−1 n n−2 2 n n
(a + b) = n
a + a b+ a b + ··· + b .
0 1 2 n
50 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtTwoBf . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ Obliczanie przybli ż enia pierwiastka z 2 ∗/
/∗ metod a̧ b r u t a l n e j s i ł y ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗/
/∗ O s t a t n i a dobra warto sć z m i e n n e j i
by ł a m n i e j s z a o j e d e n . Poprawiamy ∗/
i=i −1;
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtBfQuick . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ S z y b k i s p o s ób l i c z e n i a p i e r w i a s t k a ∗/
/∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <iomanip>
using namespace s t d ;
/∗ Podprogram o b l i c z a j a̧ cy warto sć b e z w z g l ȩ dn a̧ ∗/
double abs ( double x ) {
i f ( x>=0) return x ;
e l s e return −x ;
}
/∗ Podprogram o b l i c z a j a̧ cy p i e r w i a s t e k z l i c z b y a ∗/
double SqrtBfQuick ( double a ) {
double x=a ;
/∗ Dopó k i warto sć b e z w z g l ȩ dna r ó ż n i c y kwadratu p r z e k r a c z a 10
w pot ȩ dze −15 z a p i s a n e w p o s t a c i wyk ł a d n i c z e j j a k o 1 e −15 ∗/
while ( abs ( x∗x−a)>1e −15){
x=(x∗x+a ) / ( 2 ∗ x ) ;
c o u t << x << e n d l ;
}
return x ;
}
/∗ Pocz a̧ t e k g ł ównego programu ∗/
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double a ;
c o u t << " Podaj liczbe dodatnia : " ;
c i n >> a ;
c o u t << " Pierwiastek z " << a << " wynosi " << SqrtBfQuick ( a ) << "\n" ;
}
Listing 2.3: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w C++.
( ∗ S z y b k i e o b l i c z a n i e p i e r w i a s t k a z l i c z b y a z d o k l a d n o s c i a do e p s i l o n ∗ )
SqrtQuick [ a_ , d_ ] := Module [ { x , e p s } ,
e p s = 10^(−d ) ; ( ∗ ż a̧ dana dok ł adno sć ∗ )
x = 1 ; ( ∗ warto sć pocz a̧ tkowa c i a̧gu r e k u r e n c y j n e g o ∗ )
While [ Abs [ x∗x − a ] / 2 > eps , ( ∗ j e s l i n i e o s i a̧ g n i ȩ t o ż a̧ d a n e j dok ł adno s c i ∗ )
x = ( x∗x + a ) / ( 2 ∗ x ) ; ( ∗ nowa warto sć c i a̧ gu r e k u r e n c y j n e g o ∗ )
Print [N[ { x − ( x∗x − a ) / 2 , x } , d + 1 ] ] ( ∗ wydruk k o n t r o l n y ∗ )
];
{x − ( x∗x − a ) / 2 , x} ( ∗ końcowy wynik ∗ )
]
Listing 2.4: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w języku Mathematica.
2.1. CIAŁO LICZB RZECZYWISTYCH. 53
Dowód: ćwiczenie.
Przypomnijmy, że funkcja f : R → R jest silnie rosnąca jeżeli dla dowolnych x, x0 ∈ R zachodzi implikacja
x < x0 ⇒ f (x) < f (x0 ),
a słabo rosnąca lub krótko rosnąca jeżeli dla dowolnych x, x0 ∈ R zachodzi implikacja
x < x0 ⇒ f (x) ¬ f (x0 ),
Odwracając w tej definicji znak nierówności przy wartościach funkcji dostajemy definicję funkcji silnie malejącej i słabo
malejącej. Analogiczne definicje stawiamy dla ciągów o wartościach w R.
Twierdzenie 2.1.7 Funkcja potęgowa na zbiorze R∗ jest silnie rosnąca.
Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 teza pokrywa się z założeniem, więc implikacja jest
oczywiście prawdziwa. Załóżmy zatem, że dla pewnego k ∈ N mamy
∀x, y ∈ R∗ x < y ⇒ xk < y k . (2.5)
Chcemy pokazać, że
∀x, y ∈ R∗ x < y ⇒ xk+1 < y k+1 . (2.6)
Rozważmy więc x, y ∈ R takie, że x < y. Z założenia indukcyjnego (2.5) wnosimy, że x < y . Stosując dwukrotnie własność
k k
Twierdzenie 2.1.8
∀n ∈ N1 ∀x ∈ R : x > −1 ⇒ (1 + x)n 1 + nx
Dowód: (*) Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 nierówność jest oczywista. Załóżmy, że zachodzi
ona dla pewnego k ∈ N i wszystkich x > −1. Ustalmy y > −1. Na mocy założenia
Możemy zatem powiedzieć, że odległość punktu na osi liczbowej o współrz˛ednej x od punktu o współrz˛ednej y to |x − y|.
Dowód: [•] Własności (2.8), (2.9), (2.10) i (2.12) są oczywiste gdy rozważy się oddzielnie przypadki x 0 i x < 0. Aby
pokazać (2.11) najpierw udowodnimy, że dla dowolnych x, y ∈ R mamy
Zatem z (2.10) dostajemy (2.13). Ponieważ (2.13) zachodzi dla dowolnych x, y ∈ R, więc w szczególności możemy podstawić
w (2.13) x − y za x. W efekcie dostajemy
Podobnie otrzymujemy
|y| ¬ |y − x| + |x|,
skąd wnosimy, że
|x| − |y| ¬ |x − y| i |y| − |x| ¬ |y − x| = |x − y|.
a także
| |x| − |y| | = | |x| − | − y| | ¬ |x − (−y)| = |x + y|,
∀a, b ∈ R+ ∃n ∈ N na > b.
Dowód: (*) Dowód poprowadzimy nie wprost. Załóżmy zatem, że istnieją liczby rzeczywiste dodatnie a, b takie, że
dla każdej liczby naturalnej n zachodzi na ¬ b. Oznacza to, że b jest majorantą zbioru
A := { x ∈ R | ∃n ∈ N x = na }.
Niech c := sup A będzie jego kresem górnym. Ponieważ c − a < c, więc c − a nie jest majorantą zbioru A. Zatem znajdziemy
n0 ∈ N takie, że n0 a > c − a. Ale wtedy (n0 + 1)a > c, a w konsekwencji c nie jest majorantą A, a tym bardziej kresem
górnym zbioru A. Otrzymana sprzeczność dowodzi twierdzenia.
Dowód: ćwiczenie.
56 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Definicja 2.2.3 Niech X będzie przestrzenią liniowo uporządkowaną, a A niech będzie podzbiorem X. Mówimy, że
A jest gęsty w X jeżeli
∀x, y ∈ X x < y ⇒ ∃z ∈ A x < z < y.
Gdy A = X, mówimy, że A jest gęsty w sobie.
Twierdzenie 2.2.4 Zbiór liczb wymiernych jest gęsty w zbiorze liczb rzeczywistych.
W pierwszym przypadku teza jest oczywista, bo zero jest liczbą wymierną. Rozważmy drugi przypadek. Niech a := y −x > 0.
Z własności Archimedesa znajdziemy liczbę naturalną n taką, że na > 1. Wtedy n1 < a. Również z własności Archimedesa
wnosimy, że zbiór
A := { k ∈ N | k n1 > x }
jest niepusty. Niech m := min A. Wtedy m − 1 6∈ A. W szczególności m−1
n ¬ x oraz
m m−1 1 1
= + ¬ x + < x + a = y.
n n n n
Zatem x < m n < y, a ponieważ oczywiście n ∈ Q, teza w tym przypadku zachodzi. Pozostaje rozważyć trzeci przypadek.
m
Wtedy 0 ¬ −y < −x, zatem z rozważonego już przypadku znajdziemy z ∈ Q takie, że −y < z < −x. Ale wtedy x < −z < y
i oczywiście −z ∈ Q co kończy dowód twierdzenia.
2.2.3 Pierwiastki
Teraz możemy już udowodnić twierdzenie o istnieniu n-tego pierwiastka
Twierdzenie 2.2.5 (o istnieniu n-tego pierwiastka) Dla każdej liczby naturalnej n > 1 i dla każdej nieujemnej liczby
rzeczywistej x istnieje dokładnie jedna nieujemna liczba rzeczywista y taka, że y n = x.
Dowód: (*)Pokażemy najpierw, że pierwiastek istnieje co najwyżej jeden. Dla dowodu nie wprost, przyjmijmy, że
istnieją y1 , y2 ∈ R∗ takie, że y1 6= y2 oraz y1n = y2n . Dla ustalenia uwagi możemy przyjąć, że y1 < y2 (dowód gdy y1 > y2 jest
analogiczny). Na mocy twierdzenia 2.1.7 mamy y1n < y2n co przeczy y1n = y2n i dowodzi jednoznaczności.
Dla dowodu istnienia zauważmy najpierw, że 0n = 0, zatem teza jest oczywista gdy x = 0. Możemy więc założyć, że
x > 0. Rozważmy zbiór
E := { u ∈ R∗ | un < x }.
Oczekujemy, że kres górny tego zbioru jest poszukiwanym pierwiastkiem. Musimy jednak najpierw pokazać, że E jest zbiorem niepustym i ograniczonym od
góry.
Pokażemy, że E 6= ∅. Niech t := x+1
x
. Mamy 0 < t < 1 oraz t < x. Mnożąc nierówności 0 < t < 1 obustronnie przez t > 0
z własności ciała uporządkowanego dostajemy 0 < t2 < t. Ale t < 1, zatem 0 < t2 < 1. Rozumując indukcyjnie stwierdzamy,
że również 0 < tn−1 < 1. Mnożąc tę nierówność obustronnie przez t > 0 dostajemy tn < t. Zatem tn < x co oznacza, że
t ∈ E. Tak więc E 6= ∅. Pokażemy z kolei, że 1 + x jest majorantą zbioru E. Gdyby tak nie było, znaleźlibyśmy s ∈ E,
takie, że s > 1 + x. Wtedy sn > s > x. Zatem s 6∈ E. Otrzymana sprzeczność pokazuje, że 1 + x rzeczywiście jest majorantą
zbioru E, zatem E jest ograniczony od góry. Zatem ma kres górny.
2.2. TWIERDZENIE O ISTNIENIU PIERWIASTKA. 57
Połóżmy y := sup E. Pokażemy, że rzeczywiście y n = x. Dla dowodu nie wprost załóżmy, że y n 6= x. Mamy do rozważenia
dwa przypadki: y n < x lub y n > x. Rozważmy najpierw przypadek y n < x.
Liczymy teraz, że da si˛e skonstruować y1 > y takie, że y1n < x, co przeczyłoby y = sup E . Naturalne jest poszukiwać y1 w postaci y1 = y + h.
Pytanie jak dobrać h? Mamy mieć (y + h)n < x co jest równoważne
Zatem (y + h) < x, czyli y + h ∈ E. Ale y + h > y = sup E, skąd y + h 6∈ E. Otrzymana sprzeczność wyklucza nierówność
y n < x.
Pozostaje pokazać, że nierówność y n > x też prowadzi do sprzeczności. Tym razem liczymy, że uda si˛e skonstruować y2 < y ,
˛ majoranta˛ zbioru E , co doprowadzi do sprzeczności z faktem, że y jako kres górny jest najmniejsza˛ majoranta.˛ Poszukujemy y2 w postaci y − k .
również b˛edace
Chcemy mieć (y − k)n > x co jest równoważne postulatowi
y n − (y − k)n < y n − x
Rozpisujac
˛ podobnie jak poprzednio mamy
Twierdzenie 2.2.6 √
√ √
∀n ∈ N1 ∀x, y ∈ R∗ : n
xy = n
xny
Dowód: ćwiczenie.
W programie Mathematica pierwiastek kwadratowy z√x zapisujemy jako Sqrt[x]. Nie ma natomiast podobnej notacji
dla pierwiastków stopnia wyższego niż dwa. Aby policzyć √
n
x piszemy x^(1/n). Notacja ta bierze si˛e stad,
˛ że, jak wkrótce zobaczymy,
1
funkcj˛e pot˛egowa˛ można rozszerzyć na wykładniki rzeczywiste i wtedy x = x n .
n
58 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
R̄ := R ∪ {−∞, ∞}.
Uwaga 2.3.4 Jeśli A ⊂ R̄ jest zbiorem niepustym, to A jest ograniczony od góry (od dołu) wtedy i tylko wtedy gdy
sup A < ∞ (inf A > −∞).
Definicja 2.3.5 Niech X będzie zbiorem, A ⊂ X jego niepustym podzbiorem, a f : X → R̄ funkcją. Definiujemy kres
górny funkcji f na zbiorze A jako
Mówimy, że f jest ograniczona od góry (od dołu) na zbiorze A gdy f (A) jest ograniczony od góry (od dołu) co jest
równoważne warunkowi supx∈A f (x) < ∞ (inf x∈A f (x) > −∞).
2.3. ROZSZERZONY ZBIÓR LICZB RZECZYWISTYCH 59
x2
Przykład 2.3.6 Rozważmy funkcję f : R 3 x 7→ x2 +1 ∈ R. Łatwo się przekonać, że supx∈A f (x) = 1. Rzeczywiście,
2
dla dowolnego x ∈ R zachodzi nierówność < 1, zatem liczba jeden jest majorantą zbioru f (R). Jest najmniejszą
x
x2 +1
majorantą, bo dla 0 < a < 1 łatwo policzyć, że
1 1
r
xa :=
2 1−a
x2a
spełnia nierówność a < x2a +1 , co pokazuje, że takie a nie jest już majorantą.
Dowód: (*)Aby udowodnić własność (i) połóżmy a := supx∈A f (x) oraz b := inf x∈A (−f (x)). Wystarczy pokazać, że
−a ¬ b i −a b. Niech x ∈ A. Wtedy z definicji kresu górnego f (x) ¬ a. Zatem −a ¬ −f (x) dla wszystkich elementów
x ∈ A. Zatem −a jest minorantą zbioru { −f (x) | x ∈ A }, skąd −a ¬ inf x∈A (−f (x)) = b. Potrzebujemy jeszcze pokazać,
że −a b. Ustalmy ponownie x ∈ A. Z definicji kresu dolnego mamy b ¬ −f (x), skąd f (x) ¬ −b. Zatem −b jest majorantą
zbioru { f (x) | x ∈ A }, co oznacza, że −b a, czyli −a b. Dowodzi to pierwszej równości własności (i). Drugą dowodzi
się analogicznie.
Dla dowodu pierwszej nierówności własności (ii) połóżmy a1 := supx∈A f1 (x), a2 := supx∈A f2 (x) oraz ustalmy x ∈ A. Z
definicji kresu górnego mamy
f1 (x) ¬ a1 f2 (x) ¬ a2 .
Zatem
f1 (x) + f2 (x) ¬ a1 + a2 .
Ponieważ x ∈ A jest dowolnie ustalone, wnosimy, że a1 + a2 jest majorantą zbioru { f1 (x) + f2 (x) | x ∈ A }. Ponieważ
supx∈A (f1 (x) + f2 (x)) jest najmniejszą majorantą tego zbioru, dostajemy
sup (f1 (x) + f2 (x)) ¬ a1 + a2 ,
x∈A
co dowodzi pierwszej nierówności we własności (ii). Drugą nierówność dowodzi się analogicznie.
W podobny sposób dowodzi się następujących twierdzeń.
Twierdzenie 2.3.8 Niech f : X1 × X2 → R̄ będzie funkcją, a Ai ⊂ Xi dla i ∈ {1, 2}. Wtedy
sup f (x1 , x2 ) = sup sup f (x1 , x2 ) ,
(x1 ,x2 )∈A1 ×A2 x1 ∈A1 x2 ∈A2
inf f (x1 , x2 ) = inf inf f (x1 , x2 ) .
(x1 ,x2 )∈A1 ×A2 x1 ∈A1 x2 ∈A2
60 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Twierdzenie 2.3.9 Niech fi : Xi → R̄ oraz Ai ⊂ Xi dla i ∈ {1, 2}. Jeśli inf xi ∈Ai fi (xi ) > −∞ oraz supxi ∈Ai fi (xi ) <
∞ to
Dowód: Połóżmy m := inf x∈A f (x) i ustalmy dowolne x ∈ X. Z definicji kresu dolnego mamy m ¬ f (x), a z założenia
mamy f (x) ¬ g(x)> Zatem dostajemy m ¬ g(x), a ponieważ x ∈ X jest dowolnie ustalone, oznacza to, że m jest minorantą
zbioru { g(x) | x ∈ X }. Wnosimy więc, że m ¬ inf x∈A g(x), bo kres dolny jest największą majorantą. Dowodzi to pierwszej
nierówności. Drugą dowodzimy analogicznie.
czternaście to:
A1 = 2.828427124746190
A2 = 3.061467458920719
A3 = 3.121445152258053
A4 = 3.136548490545940
A5 = 3.140331156954754
A6 = 3.141277250932759
A7 = 3.141513801144285
A8 = 3.141572940367515
A9 = 3.141587725275636
A10 = 3.141591421514008
A11 = 3.141592345563526
A12 = 3.141592576625775
A13 = 3.141592634298169
A14 = 3.141592650272843
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ PiByCircumference . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z obwody ∗/
/∗ w i e l o k a̧ t ów foremnych wpisanych w okr a̧ g o s r e d n i c y j e d e n ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <iomanip>
/∗ B i b l i o t e k a matematyczna , z a w i e r a standardowe i m p l e m e n t a c j e
w i e l u matematycznych f u n k c j i . My sko rzys tamy p o n i ż e j
z f u n k c j i s q r t l i c z a̧ c e j p i e r w i a s t e k kwadratowy ∗/
#include <cmath>
using namespace s t d ;
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
c o u t << f i x e d << r i g h t ;
/∗ Zaczynamy od wpisanego kwadratu , kt ó r e g o
bok a wynosi pó ł p i e r w i a s t k a z 2 . Do p o l i c z e n i a
p i e r w i a s t k a wykorzystujemy b i b l i o t e c z n y
podprogram s q r t ∗/
double a=s q r t ( 2 . 0 ) / 2 ;
/∗ I l o sc bok ów w i e l o k a̧ ta , na pocz a̧ t e k c z t e r y ∗/
i n t m=4;
/∗ Numer k o l e j n e g o wyrazu c i a̧gu , i l o sć wyraz ów do p o l i c z e n i a ∗/
i n t n=1 ,nmax=40;
/∗ Dla w s z y s t k i c h n od 1 do nmax ∗/
while ( n<nmax ) {
/∗ Obliczamy d ł ugo sć obwodu ∗/
double A=m∗ a ;
c o u t << " A[" << setw ( 2 ) << n << "] =" ;
c o u t << setw ( 1 8 ) << A << e n d l ;
/∗ K o l e j n y w i e l o k a̧ t b ȩ d z i e mia ł dwa r a z y wi ȩ c e j bok ów ∗/
m=m∗ 2 ;
/∗ A t y l e w y n i e s i e d ł ugo sć j e g o boku ∗/
a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ;
/∗ K o l e j n y wyraz c i a̧ gu ∗/
n=n+1;
}
}
Listing 2.6: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o obwody wielokątów
2.4. GRANICE CIĄGÓW W R 63
oczekiwania.
A15 = 3.141592648934190
A16 = 3.141592684156058
A17 = 3.141592607672169
A18 = 3.141592910939673
A19 = 3.141591696683685
A20 = 3.141596553704820
A21 = 3.141596553704820
A22 = 3.141518840465548
A23 = 3.141207968282266
A24 = 3.142451272494134
A25 = 3.142451272494134
A26 = 3.162277660168380
A27 = 3.162277660168380
A28 = 2.828427124746190
A29 = 0.000000000000000
π = 3.141592653589793 . . . .
Zatem przy zastosowaniu 64-bitowego typu double przedstawiona metoda pozwala policzyć π z dokładnościa˛ do około 8 cyfr znaczacych. ˛
Warto podkreślić, że sama obserwacja numeryczna zachowania tego ciagu ˛ może prowadzić do bł˛ednego wniosku iż ciag˛ ten jest zbieżny do zera. Aby mieć
praktyczny pożytek z ciagu
˛ jako narz˛edzia do przybliżania liczb, musimy umieć od strony teoretycznej przeanalizować jego zachowanie.
Mathematica radzi sobie łatwo z wyliczeniem π z duża˛ dokładnościa,˛ ale wymaga to obliczeń wysokiej precyzji, znacznie kosztowniejszych od obliczeń z
precyzja˛ maszynowa.˛ Na przykład piszac˛
N [ Pi , 1 0 0 0 ]
otrzymujemy
3.14159265358979323846264338327950288419716939937510582097494459230781\
6406286208998628034825342117067982148086513282306647093844609550582231\
7253594081284811174502841027019385211055596446229489549303819644288109\
7566593344612847564823378678316527120190914564856692346034861045432664\
8213393607260249141273724587006606315588174881520920962829254091715364\
3678925903600113305305488204665213841469519415116094330572703657595919\
5309218611738193261179310511854807446237996274956735188575272489122793\
8183011949129833673362440656643086021394946395224737190702179860943702\
7705392171762931767523846748184676694051320005681271452635608277857713\
4275778960917363717872146844090122495343014654958537105079227968925892\
3542019956112129021960864034418159813629774771309960518707211349999998\
3729780499510597317328160963185950244594553469083026425223082533446850\
3526193118817101000313783875288658753320838142061717766914730359825349\
0428755468731159562863882353787593751957781857780532171226806613001927\
876611195909216420199
64 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
( ∗ Przyk ł ad z c i a̧ giem p o z o r n i e z b i e żnym , zadanym r e k u r e n c y j n i e ∗ )
Henon [ n_ ] := Module [ { a , b , x0 , x1 , x2 , k } ,
a = 1 . 4 ; b = 0 . 3 ; ( ∗ Pomocnicze parametry a i b ∗ )
k = 0 ; ( ∗ L i c z n i k wyraz ów c i a̧ gu ∗ )
( ∗ Dwa pocz a̧ tkowe wyrazy c i a̧ gu ∗ )
x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ;
x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ;
Do[ k = k + 1 ;
( ∗ K o l e j n y wyraz c i a̧ gu wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗ )
x2 = b∗ x0 + 1 − a ∗ x1 ∗ x1 ;
( ∗ Nowe warto s c i dwó ch p o r z e d n i c h wyraz ów c i a̧gu ∗ )
x0 = x1 ;
x1 = x2 ;
Print [ { k , NumberForm[ x2 , 1 6 ] } ] ,
{n}
];
]
Listing 2.7: Przykład ciągu pozornie zbieżnego w języku Mathematica.
˛ 2n -katy
Ćwiczenie komputerowe 2.4.1 Zmodyfikuj program z listingu 2.6 tak by przybliżał π wykorzystujac ˛ foremne opisane na okr˛egu (patrz cw. 1.2.7
). Wykorzystaj ten program do prześledzenia zachowania tego ciagu
˛ przybliżeń.
x0 = 136.462554878752 (2.15)
x1 = 5.39650717129623 (2.16)
xn = 0.3xn−2 + 1 − 1.4x2n−1 (2.17)
/∗ ∗∗∗∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ Henon . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ Przyk ł ad z zadanym r e k u r e n c y j n i e c i a̧ giem , p o z o r n i e z b i e żnym . ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
/∗ Dla wi ȩ k s z e j c z y t e l n o s c i wynik ów narzucamy s t a ł opozycyjny ,
wyrównywany w prawo z a p i s l i c z b ∗/
c o u t << f i x e d << r i g h t ;
/∗ Pomocnicze parametry a i b ∗/
double a =1.4 , b = 0 . 3 ;
/∗ Dwa pocz a̧ tkowe wyrazy c i a̧ gu ∗/
double x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ;
double x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ;
/∗ I l o sć wyraz ów c i a̧ gu do p o l i c z e n i a ∗/
i n t nmax=15;
/∗ Inna forma p ȩ t l i . I n s t r u k c j e w bloku { . . . } wykonujemy d l a warto s c i n
od j e d e n do nmax zwi ȩ k s z a j a̧ c n za ka żdym razem o j e d e n ∗/
f o r ( i n t n=1;n<=nmax ; n=n+1){
/∗ K o l e j n y wyraz c i a̧ gu wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗/
double x2=b∗ x0+1−a ∗ x1 ∗ x1 ;
/∗ Wyprowadzamy w y n i k i na standardowe wyj s c i e . setw ( p ) u s t a l a i l o sć pó l
d l a wyprowadzanej k o l e j n e j z m i e n n e j . Pozwala t o na l e p s z e
f o r m a t o w a n i e wypisywanych danych ∗/
c o u t << "x[" << setw ( 2 ) << n << " ]= " ;
c o u t << setw ( 2 0 ) << x0 << e n d l ;
/∗ Nowe warto s c i dwó ch p o r z e d n i c h wyraz ów c i a̧gu ∗/
x0=x1 ;
x1=x2 ;
}
}
Listing 2.8: Przykład ciągu pozornie zbieżnego w C++.
66 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Rysunek 2.4: Wykres pierwszych 100 wyrazów ciągu danego wzorami (2.15)-(2.17)
stosować oznaczenie x. Ze względu na tradycję często mówimy o ciągu xn mając na myśli nie n-ty wyraz ciągu x, ale sam
ciąg x. Jest to nadużycie, które może prowadzić do nieporozumień. Aby ich uniknąć, formułujemy stwierdzenia tak, by z
kontekstu jednoznacznie wynikało co mamy na myśli: cały ciąg, czy jego n-ty wyraz.
˛ o wyrazach xn ma granic˛e g , jeśli dla dowolnej postulowanej dokładności ε > 0 znajdziemy wyraz o numerze N taki, że on i wszystkie
Mówimy, że ciag
nast˛epne wyrazy różnia˛ si˛e od g nie wi˛ecej niż o ε, czyli można je uważać za przybliżenie g z dokładnościa˛ do ε. Zilustrowano to na rysunku 2.5 .
Niech x : N → R będzie ciągiem liczb rzeczywistych.
Piszemy wtedy
lim xn = g.
n→∞
1 1
| − 0| = p < ε.
np n
Mówimy, że ciąg a : N → R jest ograniczony, jeśli istnieje M ∈ R takie, że |an | ¬ M dla wszystkich n ∈ N.
0.20
0.15
g+ϵ
g
0.10
g-ϵ
0.05
0 20 40
N 60 80 100
(−1)n
Rysunek 2.5: Dobór N do ε na wykresie ciągu o wyrazie xn := 1
10 + n .
Dowód: [•] Niech a∗ := limn→∞ an . Dla ε = 1 znajdziemy N ∈ N takie, że dla n > N mamy |an − a∗ | < 1. Zatem dla
takich n jest
M := max(1 + |a∗ |, M0 ).
Piszemy wtedy
lim xn = ∞.
n→∞
Piszemy wtedy
lim xn = −∞.
n→∞
Twierdzenie 2.5.1 (i) Jeśli ciągi a, b są zbieżne to ciąg a b jest zbieżny oraz
(ii) Jeśli ciągi a, b są zbieżne, a ciąg b ma tak wyrazy jak i granicę różne od zera, to ciąg a / b jest zbieżny
oraz
an limn→∞ an
lim = .
n→∞ bn limn→∞ bn
Dowód: [•] Najbardziej pouczajacy
˛ jest przypadek iloczynu. Zastanówmy si˛e jak skonstruować dowód w tym przypadku. Naszym celem jest oszacowanie
różnicy
|an bn − a∗ b∗ |
dla dużych n, przy wykorzystaniu oszacowań na różnice |an − a∗ | i |bn − b∗ |, które możemy uzyskać ze zbieżności ciagów
˛ a i b. Sztuczka˛ powszechnie
stosowana˛ przy takich oszacowaniach jest dodanie i odj˛ecie wyrazu pomocniczego i skorzystanie z własności wartości bezwzgl˛ednej.
co dowodzi, że
lim an bn = a∗ b∗
n→∞
i kończy dowód w przypadku iloczynu. Wymyślenie i formalizację dowodu dla sumy i różnicy, jako łatwiejszego przypadku,
pozostawiamy czytelnikowi.
W przypadku ilorazu potrzebujemy oszacować | abnn − ab | = |bn1 b| |an b − abn |. Dochodzi zatem jeszcze problem oszacowania |bn1 b| . Tu korzystamy z
|b|
założenia, że b 6= 0. Wtedy δ := 2 > 0, zatem znajdziemy N3 takie, że dla n N3 zachodzi |bn − b| < δ , bo limn→∞ bn = b. Tak wi˛ec dla n N3
mamy też |bn | |b| − |b − bn | > |b| − δ = δ i w konsekwencji |bn b| > 2δ 2 oraz |bn1 b| < 2δ12 .
Sformalizowanie dowodu dla przypadku ilorazu również pozostawiamy czytelnikowi.
n2 −3n+1
Przykład 2.5.2 Rozważmy ciąg o wyrazach 3+5n+2n2 . Mamy
n2 − 3n + 1 1 − 3 n1 + n12
= .
3 + 5n + 2n2 3 n12 + 5 n1 + 2
n2 − 3n + 1 1
lim = .
n→∞ 3 + 5n + 2n2 2
70 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Twierdzenie 2.5.3 (o zachowywaniu nierówności w granicy) Niech a, b : N → R będą ciągami liczb rzeczywistych.
Załóżmy, że istnieje N ∈ N takie, że an ¬ bn dla n N . Jeśli istnieją granice
to a∗ ¬ b∗ .
Dowód: Dla dowodu nie wprost załóżmy, że a∗ > b∗ i połóżmy ε := a∗ −b 2 . Z definicji granicy ciągu znajdziemy N1 , N2 ∈ N
∗
takie, że an ∈ (a∗ − ε, a∗ + ε) dla n N1 oraz bn ∈ (b∗ − ε, b∗ + ε) dla n N2 . Wybierzmy k ∈ N większe niż max(N, N1 , N2 ).
Wtedy bk < b∗ + ε = a∗ − ε < ak . Ale z przyjętego założenia mamy ak ¬ bk . Otrzymana sprzeczność dowodzi tezy.
Niech a, b, c : N → R będą ciągami liczb rzeczywistych.
Twierdzenie 2.5.4 (o trzech ciągach) Jeśli istnieje liczba naturalna N taka. że dla wszystkich liczb naturalnych n > N
ciągi an , bn , cn spełniają nierówność
an ¬ bn ¬ cn
i ciągi an oraz cn są zbieżne do granicy g, to ciąg bn też jest zbieżny do granicy g.
Dowód:
Ustalmy ε > 0. Ze zbieżności ciągów a i c do g wynika, że możemy dobrać stałą N > 0 tak, by dla n > N zachodziły
nierówności
|an − g| < ε,
|cn − g| < ε.
−ε < an − g < ε,
−ε < cn − g < ε.
1 1
0< √ <
1 + n2 n
lim an = sup { an | n ∈ N }.
n→∞
(ii) Jeśli a jest ciągiem malejącym i ograniczonym od dołu, to ciąg ten jest zbieżny oraz
lim an = inf { an | n ∈ N }.
n→∞
Dowód: [•] Udowodnimy własność (i). Drugą własność dowodzi się analogicznie. Oznaczmy
a∗ := sup { an | n ∈ N }.
Ustalmy ε > 0. Z definicji kresu górnego wynika, że a∗ − ε nie jest majorantą zbioru { an | n ∈ N }, zatem istnieje takie
N ∈ N, że aN > a∗ − ε. Zatem dla n > N mamy
a∗ − ε < aN ¬ an ¬ a∗ < a∗ + ε.
Twierdzenie 2.5.8
√
p ∈ R+ ⇒ lim n
p=1 (2.18)
n→∞
√
lim n
n=1 (2.19)
n→∞
nα
α ∈ Q, a > 1 ⇒ lim =0 (2.20)
n→∞ an
1
p=1
p∈R ⇒ lim pn = 0 p ∈ (−1, 1) (2.21)
n→∞
p ¬ −1 lub p > 1.
nie istn. w R
√
Dowód: [•] Dla pokazania własności (2.18) rozważmy najpierw przypadek p 1. Niech xn := n p − 1. Wtedy xn 0
oraz na mocy nierówności Bernoulliego mamy
1 + nxn ¬ (1 + xn )n = p.
Z twierdzenia o trzech ciągach wynika, że ciąg limn→∞ xn = 0. Tak więc własność (2.18) dla p 1 otrzymujemy z twierdzenia
o granicy sumy ciągów. Gdy p ∈ (0, 1) wystarczy zauważyć, że dla q := p1 mamy z twierdzenia o granicy ilorazu ciągów
√ 1 1
lim n
p= √ = = 1.
n→∞ limn→∞ n q 1
√
Aby udowodnić (2.19) oznaczmy xn := n
n − 1. Wystarczy pokazać, że ciąg o wyrazach xn zmierza do zera. Z definicji
xn mamy
n = (1 + xn )n .
Podstawiając do wzoru (2.4) a := 1 i b := xn oraz pomijając wszystkie wyrazy z wyjątkiem tego, w którym b = xn występuje
w drugiej potędze dostajemy nierówność
1
(1 + xn )n n(n − 1)x2n .
2
Zatem
1
n n(n − 1)x2n ,
2
skąd wynika, że dla n 2 mamy
2 2
r
0 < xn ¬ ¬√ ,
n−1 n
co na mocy twierdzenia 2.5.4 (za trzeci ciąg bieżemy ciąg stale równy zero) dowodzi, że limn→∞ xn = 0.
Dla dowodu (2.20) oznaczmy b := a − 1 wybierzmy k ∈ N, takie że k > α + 1. Rozważmy n > 2(k + 1). Łatwo sprawdzić,
że wtedy n − k + 1 > n2 . Zatem
n
n(n − 1) · · · (n − k + 1) > )k
2
i w konsekwencji
n(n − 1) · · · (n − k + 1) k ( n )k
n k
an = (1 + b)n > b = b > 2 bk ,
k 1 · 2···k k!
skąd dostajemy
2k k! nk
> .
bk (1 + b)n
Mnożąc obie strony powyższej nierówności przez nα−k > 0 otrzymujemy
nα−k 2k k! nα
> .
bk (1 + b)n
nα 2k k! α−k 2k k! 1
0< < n <
(1 + b)n bk bk n
Na przykład pisząc
otrzymujemy √1 .
3
Często ten sam wynik otrzymamy używając krótszej instrukcji
która służy do liczenia granicy funkcji. Granica funkcji jest szerszym pojęciem, ale w przypadku argumentu zmierzającego
do nieskończoności często daje ten sam wynik. Jednak nie jest to dokładnie to samo, bo na przykład w przypadku ciągu
zwraca
Interval[{-1, 1}]
co oznacza, że granica nie istnieje, a zbiór punktów granicznych, czyli granic wszystkich możliwych podciągów, to przedział
[−1, 1]. Pojęciem zbioru punktów granicznych zajmiemy się w rozdziale 4 .
Powstaje pytanie: czy możemy zyskać w ten sposób dowolnie wiele, jeśli n b˛edzie odpowiednio duże? Programy w j˛ezyku Mathematica oraz w C++ realizujace
˛
stosowny eksperyment numeryczny przedstawiono na listingach 2.9 i 2.10 .
74 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
( ∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e wed ł ug i d e i p r o c e n t u sk ł adanego
( ang . compound i n t e r e s t ) ∗ )
CompoundInterest [ d_ ] := Module [ { n } ,
n = 1;
Do[
Print [ "e[" , n , " ]= " , NumberForm [ ( 1 . + 1 . / n )^ n , 1 6 ] ] ;
n = n + 1,
{d}
];
]
Listing 2.9: Eksperyment numeryczny z procentem składanym w języku Mathematica
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ CompoundInterest . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e wed ł ug i d e i p r o c e n t u ∗/
/∗ sk ł adanego ( ang . compound i n t e r e s t ) ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
2.6.2 Liczba e
1 n
Twierdzenie 2.6.1 Ciąg 1 +
n jest rosnący i ograniczony, a więc ma skończoną granicę.
Dowód: [•] Pokażemy najpierw, że ciąg ten jest rosnący. Podstawiając w nierówności Bernoullego (tw. 2.1.8 ) − n12 za
x i przekształcając uzyskaną nierówność otrzymujemy dla n > 1
n
1 1
1− 2 1−
n n
n n
1 1 1
1− 1+ 1− .
n n n
n−1
Z kolei dzieląc obustronnie przez 1 − n1 , mnożąc przez n
n−1 i przekształcając dostajemy
n−1 n
1 1
1− 1+ 1
n n
n n−1
1
n
1+
n n−1
n n−1
1 1
1+ 1+
n n−1
co dowodzi, że rozważany ciąg jest rosnący.
Aby pokazać, że jest on ograniczony, najpierw zauważmy, że podstawiając 1 za b oraz 1
2 za a we wzorze (2.3) otrzymujemy
1 1 1 1
1− n = + + · · · + 1 . (2.22)
2 2 2n−1 2n−2
Zatem podstawiając we wzorze (2.4) 1 za a oraz n1 za b, przekształcając i na koniec wykorzystując (2.22) otrzymujemy
n
1 n 1 n 1 n 1 n 1
1+ = 1+ + + + · · · +
n 1 n 2 n2 3 n3 n nn
n1 n(n − 1) 1 n(n − 1)(n − 2) 1 n(n − 1) · · · 1 1
= 1+ + + + ··· +
1n 1·2 n 2 1·2·3 n 3 1 · 2 · · · n nn
1(1 − n ) 1(1 − n )(1 − n )
1 1 2
1(1 − n ) · · · (1 − n−1
1
n )
= 1+1+ + + ··· +
1·2 1·2·3 1 · 2···n
1 1 1
< 1+1+ + + ··· +
1·2 1·2·3 1 · 2···n
1 1 1
< 1 + 1 + + 2 + · · · + n−1
2 2 2
1
= 1 + 2 1 − n < 1 + 2 = 3.
2
n
Zatem na mocy twierdzenia 2.5.6 ciąg 1 + n1 jest zbieżny.
n
Na mocy udowodnionego twierdzenia ciąg 1 + n1 ma granicę. Tradycyjnie nazywamy ją liczbą Eulera i oznaczamy
literą e. Tak więc n
1
e := lim 1 + . (2.23)
n→∞ n
76 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Rysunek 2.6: Jacob Bernoulli (1654 - 1705) i Leonard Euler (1707 - 1783)
n
˛ o wyrazach 1 + n1 jest zbieżny i podał interpretacj˛e tego faktu. Granic˛e t˛e nazywamy jednak liczba˛ Eulera
To Jakob Bernoulli pierwszy zauważył, że ciag
i oznaczamy litera˛ e, bo to Leonard Euler (rys. 2.6 ), inny szwajcarski matematyk, pokazał jak ważna jest ona w matematyce. On pierwszy oznaczał ja˛ litera˛ e i
tak pozostało do dziś.
Liczba e w przybliżeniu wynosi
e = 2.71828182845904523536 . . .
1 n
˛ 1+
Co ciekawe, ciag nadaje liczbie e ważna˛ interpretacj˛e, jednak zupełnie nie nadaje si˛e do obliczania jej przybliżeń, bo jest bardzo wolno zbieżny.
n
W rozdziale 5 poznamy nieporównanie szybsza˛ metod˛e wyznaczania liczby e.
W programie Mathematica liczba e jest oznaczana E.
f 0 (x) = af (x).
Rozwiazaniem
˛ tego równania jest funkcja wykładnicza i jej wielokrotności. Bardzo wiele zjawisk w fizyce (np. rozpad pierwiastków promieniotwórczych), w biologii
(np. wzrost populacji przy nieograniczonych zasobach), w ekonomii (np. piramidy finansowe) i w wielu innych dziedzinach opisywanych jest przy pomocy funkcji
wykładniczej.
Można pokazać, że funkcja wykładnicza spełnia wzór
f (x + y) = f (x)f (y),
a stad,
˛ że jest postaci
R 3 x 7→ ax ∈ R+ .
W wyrażeniu tym a ∈ R+ , a ax jest rozszerzeniem wyrażenia an dla n ∈ N na dowolny wykładnik rzeczywisty. W szczególności łatwo stad
˛ wywnioskować,
że dla pq ∈ Q+
2.6. LICZBA E I RZECZYWISTA FUNKCJA WYKŁADNICZA 77
p √
aq = q
ap ,
a0 = 1,
oraz dla r ∈ Q−
1
ar = .
a−r
˛ powyższe wzory jako definicje, można zdefiniować funkcj˛e wykładnicza˛ dla dowolnego x ∈ R wzorem
Przyjmujac
ax := sup { ar | r ∈ Q, r < x }
i pokazać, że
exp(x) = ex .
W programie Mathematica funkcja exp jest oznaczana Exp. Natomiast wyrażenie ax występujące w funkcji wykładniczej
o podstawie a w programie Mathematica zapisywane jest w postaci a^x.
Wykres funkcji wykładniczej przedstawiono na rys. 2.7
Od strony obliczeniowej wygodniejszy jest jednak wzór
∞
X xn
exp(x) = ,
n=0
n!
który nam posłuży jako podstawa do formalnej definicji funkcji wykładniczej i wyprowadzenia jej własności. Zajmiemy si˛e tym w rozdziale 6.2 .
78 ROZDZIAŁ 2. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Pozostaje jednak pytanie, czy sam pomysł liczby i jako elementu ciała rozszerzajacego ˛ ciało liczb rzeczywistych też nie prowadzi do jakiejś sprzeczności,
której jeszcze nie widzimy. Aby przekonać si˛e, że tak nie jest, trzeba zbudować formalny model liczb zespolonych.
2.7.2 Ciało C
W C := R2 wprowadzamy działania
Tak jak dla liczb rzeczywistych kropkę oznaczającą mnożenie w zapisie wzorów często pomijamy pod warunkiem, że nie
prowadzi to do niejednoznaczności w interpretacji wzoru.
Zapis a + bi można teraz odczarować. Traktujac
˛ par˛e (a, b) jako formalne kodowanie liczy a + bi widzimy, że liczba rzeczywista a = a + 0 · i, wi˛ec w
naszym kodowaniu odpowiada jej para (a, 0). Podobnie, jednostka urojona i = 0 + 1 · i, wi˛ec w naszym kodowaniu odpowiada jej para (0, 1). Pozwala to
traktować zapis a jako skrót zapisu (a, 0) oraz zapis i jako skrót zapisu (0, 1). Wtedy a + bi = (a, 0) + (b, 0) · (0, 1) = (a, 0) + (0, b) = (a, b) i
zapis a + bi staje si˛e równoważny formalnemu zapisowi (a, b).
Twierdzenie 2.7.1 Zbiór C := R2 z tak określonymi działaniami oraz parami (0, 0) i (1, 0) jako elementami neutral-
nymi odpowiednio dla dodawania i mnożenia jest ciałem.
Dowód: Dowód sprowadza się do przeprowadzenia długich i żmudnych, ale prostych rachunków. Szczegóły pominiemy.
Definicja 2.7.2 Ciało to nazywamy ciałem liczb zespolonych.
Dla dowolnych a, b ∈ R mamy (a, 0) + (b, 0) = (a + b, 0) oraz (a, 0)(b, 0) = (ab, 0), zatem parę (a, 0) możemy utożsamiać
z liczbą rzeczywistą a. Zwyczajowo kładziemy i := (0, 1). Jest to tak zwana jednostka urojona. Łatwo sprawdzamy, że
i2 = (−1, 0) = −1 oraz
(a, b) = (a, 0) + (b, 0)i = a + bi. (2.26)
Zapis po prawej to tradycyjny zapis liczby zespolonej i poza szczególnymi przypadkami właśnie ten zapis będziemy stosować.
W szczególności, w zapisie tym wzory (2.24) i (2.25) przyjmują postać
z1 = z2 ⇔ re z1 = re z2 ∧ im z1 = im z2 .
(ii) z + z = 2 re z, z − z = 2i im z,
(iii) z1 + z2 = z1 + z2
(iv) z1 · z2 = z1 · z2
z1 · z2 = (ac − bd) + (ad + bc)i = (ac − bd) − (ad + bc)i = (a − bi) · (c − di) = z1 · z2
co dowodzi (iv).
(ii) |z| = 0 ⇔ z = 0,
(iii) |z|2 = zz,
(iv) |z| = |z|,
oraz √ p
im z = b ¬ |b| = b2 ¬ a2 + b2 = |z|
√
co dowodzi (i). Jeśli z = 0, to a = b = 0, zatem |z| = a2 + b2 = 0. Na odwrót, jeśli |z| = 0, to a2 + b2 = 0. Jeśli suma
dwóch liczb nieujemnych wynosi zero, to obie te liczby są równe zero. Tak więc a2 = b2 = 0, a stąd dostajemy a = b = 0.
Dowodzi to własności (ii). Mamy też
co dowodzi (v).
Pozostaje pokazać (vi). Z własności (iv) oraz (i) twierdzenia 2.7.4 wnosimy, że
z1 z2 = z1 z2 = z1 z2
Zatem z własności (ii) twierdzenia 2.7.4 oraz z pokazanych już własności (i) dla z := z1 z2 , (iv) oraz (v) dostajemy
Dodając do obu stron tej nierówności wyrażenie z1 z1 + z2 z2 = |z1 |2 + |z2 |2 otrzymujemy nierówność
Zatem, ponownie wykorzystując pokazaną już własność (iii), a także własność (iii) twierdzenia 2.7.4 , mamy
Rysunek 2.8: Interpretacja geometryczna liczby zespolonej z := a + bi, jej modułu oraz sprzężenia.
Rysunek 2.9: Interpretacja geometryczna sumy liczb zespolonych. Wektor reprezentujący sumę z1 + z2 jest sumą wektorów
reprezentujących z1 i z2 .
Rysunek 2.10: Interpretacja geometryczna iloczynu liczby zespolonej przez liczbę i. Wektor reprezentujący iz powstaje z
wektora reprezentującego z przez obrót o kąt prosty wokół początku układu przeciwnie do ruchu wskazówek zegara.
zrobić z geometria˛ przestrzeni trójwymiarowej. Wprowadzajac ˛ układ współrz˛ednych zbudowany z trzech wzajemnie prostopadłych prostych traktowanych jako
osi liczbowe możemy utożsamiać punkty trójwymiarowej przetrzeni (i wektory zaczepione w poczatku ˛ układu) jako trójki liczb, a sama˛ trójwymiarowa˛ przestrzeń
jako R3 . Trójki liczb i ogólnie układy d liczb postaci (x1 , x2 , . . . xd ) (d-wymiarowe wektory) można dodawać po współrz˛ednych podobnie jak w przypadku
liczb zespolonych. Jednak mnożenie nadajace ˛ struktur˛e ciała możliwe jest jedynie dla d równego jeden, dwa i cztery. Przypadki d = 1 i d = 2 znamy (ciało
uporzadkowane
˛ liczb rzeczywistych i ciało liczb zespolonych). Dla d = 4 można zdefiniować mnożenie, które nie jest przemienne i nadaje zbiorowi R4 struktur˛e
ciała nieprzemiennego, a wi˛ec ciała w którym prawo przemienności dla mnożenia nie obowiazuje. ˛ Ciało to zwane jest ciałem kwaternionów.
Dla każdego d ∈ N można jednak mnożyć wektor (x1 , x2 , . . . , xd ) przez liczb˛e. Uzyskuje si˛e w ten sposób struktur˛e algebraiczna˛ w zbiorze takich
wektorów oznaczanym Rd jako iloczyn kartezjański d kopii zbioru liczb rzeczywistych Rd . Otrzymana w ten sposób struktura zwana jest przestrzenia˛ wektorowa.˛
Strukturami takimi zajmiemy si˛e w rozdziale 7.1 .
zależa˛ od tzw. wyróżnika ∆ := b2 −4ac, w szczególności miejsc zerowych nie ma, gdy wyróżnik jest ujemny. Sytuacja ulega zmianie, gdy w funkcji tej dopuścimy
argument zespolony.
Twierdzenie 2.7.6 Rozważmy zespoloną funkcją kwadratową o współczynnikach rzeczywistych tj. funkcję
Q : C 3 z 7→ az 2 + bz + c ∈ C,
S1 := { z ∈ C | |z| = 1 }.
Wykorzystujac
˛ tożsamości trygonometryczne dla sumy katów
˛ można pokazać, że
To przypomina fundamentalna˛ własność funkcji wykładniczej. Matematyk szwajcarski Leonard Euler pokazał, że rzeczywista˛ funkcj˛e wykładnicza˛ można rozszerzyć
na argumenty zespolone
∞
X zn
ez :=
n=0
n!
i przy takiej definicji dla x ∈ R zachodzi słynny wzór o nawijaniu prostej na okrag
˛
% : X × X → R∗
spełniające własności
(i) %(x, y) = 0 ⇔ x = y,
Intuicyjne znaczenie tych trzech własności jest dość oczywiste. Własność (i) mówi, że w odległości zero od punktu x jest tylko on sam. Własność (ii) postuluje,
że odległość z punktu x do punktu y jest taka sama jak z x do y . Z kolei ostatnia własność, zwana nierównościa˛ trójkata ˛ stwierdza, że przejście z punktu x do
punktu z przez punkt y nie może zajać
˛ mniej niż bezpośrednie przejście z x do z . Może zajać ˛ tyle samo jeśli punkt y leży po drodze z x do z .
Definicja 3.1.2 Przestrzenią metryczną nazywamy parę (X, %) gdzie X jest zbiorem, a % metryką w X.
Często, aby wzbogacić język, mówić będziemy, że X jest przestrzenią metryczną z metryką % mając na myśli, że para
(X, %) jest przestrzenią metryczną. Co więcej, czasem powiemy jedynie, że X jest przestrzenią metryczną przyjmując, że
metryka jest dana domyślnie.
85
86 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH
Piszemy wtedy
lim xn = g.
n→∞
Twierdzenie 3.1.4 Jeśli limn→∞ xn = g1 i limn→∞ xn = g2 , to g1 = g2 . Innymi słowy, jeśli ciąg ma granicę, to jest
ona wyznaczona jednoznacznie.
Dowód: [•] Załóżmy, że istnieją dwie różne granice g1 6= g2 . Wtedy ε := %(g12,g2 ) > 0. Z definicji granicy znajdziemy N1
takie, że %(xn , g1 ) < ε dla n N1 oraz N2 takie, że %(xn , g2 ) < ε dla n N2 . Niech n max(N1 , N2 ). Wtedy %(xn , g1 ) < ε
i %(xn , g2 ) < ε, zatem z własności (iii) oraz (ii) metryki dostajemy
Dowód: Własności (i) oraz (ii) definicji metryki są oczywiste. Dowód własności (iii) jest nieco bardziej skomplikowany.
Przeprowadzimy go w rozdziale 7.1 .
Metryka zadana wzorem (3.3) nosi nazwę euklidesowej, bo odległość między dwoma punktami przestrzeni R3 mierzona w
tej metryce to odległość w geometrii otaczającej nas przestrzeni. Geometria ta zwana jest euklidesową, bo grecki matematyk
Euklides w III stuleciu p.n.e. pierwszy stworzył matematyczne podstawy do jej badania.
Jednak metryka euklidesowa nie jest jedynym sposobem mierzenia odległości w przestrzeni Rd . Istotnie różnych funkcji
spełniających wymogi definicji metryki jest nieskończenie wiele, a co najmniej kilka przydaje się w różnych zastosowaniach.
Dowód: [•] Własność (i) definicji metryki wynika z własności (2.9) wartości bezwzględnej, a własność (ii) z własności
(2.8) wartości bezwzględnej. Na mocy własności (2.11) wartości bezwzględnej dla dowolnego i = 1, 2, . . . d oraz punktów
x = (x1 , x2 , . . . , xd ), y = (y1 , y2 , . . . , yd ), z = (z1 , z2 , . . . , zd ) mamy
Połóżmy
a: = max { |xi − yi | | i = 1, 2, . . . d }
b: = max { |yi − zi | | i = 1, 2, . . . d }.
|xi − yi | ¬ a
oraz
|yi − zi | ¬ b.
88 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH
Rysunek 3.1: Odległość punktów x, y ∈ R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony).
Nierówność (3.5) oznacza, że wyrażenie po jej prawej stronie jest majorantą zbioru
{ |xi − zi | | i = 1, 2, . . . d }.
Zatem wartość największa w tym zbiorze, jako najmniejsza majoranta, spełnia nierówność
Dowód: ćwiczenie.
Metrykę %max określa się mianem metryka maksimum, a metrykę %1 mianem metryka Manhattan. Nazwa tej drugiej na-
wiązuje do drogi jaką trzeba przebyć pomiędzy dwoma punktami w regularnej siatce wzajemnie prostopadłych ulic dzielnicy
Nowego Jorku na wyspie Manhattan (patrz rys. 3.1 ).
Łatwo sprawdzić, że dla d = 1 metryka euklidesowa, metryka maksimum i metryka Manhattan są sobie równe i dane
wzorem %(x, y) = |x − y| dla x, y ∈ R.
Przykład liczenia odległości w R2 w różnych metrykach przedstawiono na rys. 3.1 .
Różnorodność dost˛epnych w jednej przestrzeni metryk rodzi pytanie jak to ma si˛e do poj˛ecia granicy. Czyli jeśli ciag
˛ ma granic˛e wzgl˛edem jednej metryki to
ma ja˛ również wzgl˛edem innej metryki? Odpowiedź na to pytanie nie jest prosta. Wszystko zależy od generowanej przez metryk˛e topologii, czyli rodziny zbiorów
otwartych. Zbiory otwarte uogólniaja˛ ide˛e przedziału otwartego. Zbiory otwarte wzgl˛edem zadanej metryki zdefiniujemy w rozdziale 3.2 . Natomiast teraz podamy
przykład metryki wzgl˛edem której jedynie ciagi
˛ stałe od pewnego wyrazu poczynajac ˛ sa˛ zbieżne.
Niech X będzie dowolnym zbiorem. Dla x, y ∈ X połóżmy
(
0 gdy x = y,
%0 (x, y) := (3.6)
1 gdy x =
6 y.
3.1. METRYKI I PRZESTRZENIE METRYCZNE 89
Ćwiczenie 3.1.11 Udowodnić, że ciąg a : N → X jest zbieżny w przestrzeni (X, %0 ), gdzie %0 oznacza metrykę
dyskretną, wtedy i tylko wtedy gdy istnieje m ∈ N takie, że dla n m zachodzi an = an+1 .
jest metryką na R2 .
Wobec różnorodności dostępnych w Rd metryk przyjmujemy zasadę, że jeśli nie powiedziano wyraźnie inaczej, przestrzeń
R traktujemy jako przestrzeń metryczną z metryką euklidesową.
d
Twierdzenie 3.1.13 Niech (X, %) będzie przestrzenią metryczną, a Y ⊂ X podzbiorem. Wtedy %Y := %|Y ×Y jest
metryką w Y .
Dowód: ćwiczenie.
Definicja 3.1.14 Metrykę %Y nazywamy metryką indukowaną z X w Y , a przestrzeń metryczną (Y, %Y ) nazywamy
podprzestrzenią przestrzeni (X, %).
Zatem każdy podzbiór przestrzeni metrycznej jest przestrzenią metryczną. Pokazuje to, że przestrzenie metryczne mogą
być bardzo różnorodne.
3.1.7 Kule
Krokiem pośrednim do zdefiniowania zbiorów otwartych wzgl˛edem danej metryki jest poj˛ecie kuli. Zaznaczmy, że chodzi o dość abstrakcyjne użycie słowa kula,
bo jedynie w przypadku metryki euklidesowej w R3 kula jaka˛ zdefiniujemy pokrywa si˛e z potocznym znaczeniem słowa kula.
90 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH
Rysunek 3.2: Kule w R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony). Odpowiednie
sfery zaznaczono ciemniejszym kolorem.
Definicja 3.1.15 Niech (X, %) będzie przestrzenią metryczną, x punktem w X, a r liczbą rzeczywistą dodatnią. Kulą
otwartą w X o środku w x i promieniu r nazywamy zbiór
Ćwiczenie 3.1.16 Pokazać, że kula w metryce dyskretnej jest albo singletonem, albo całą przestrzenią. Jak wyglądają
kule w metryce danej wzorem (3.7)?
3.1. METRYKI I PRZESTRZENIE METRYCZNE 91
Rysunek 3.3: Umowne przedstawienie różnicy między kulą domknięta, sferą i kulą otwartą.
Definicja 3.1.17 Podzbiór A ⊂ X przestrzeni metrycznej (X, %) nazywamy ograniczonym względem metryki %, lub
krótko ograniczonym gdy metryka jest znana z kontekstu, jeśli istnieje kula K(x, r) względem metryki % o środku w
x i promieniu r taka, że A ⊂ K(x, r). Funkcja f : Z → X jest ograniczona, jeżeli jej obraz
im f := { f (x) | x ∈ X }
Twierdzenie 3.1.18 Suma mnogościowa skończonej liczby zbiorów ograniczonych jest zbiorem ograniczonym.
Dowód: ćwiczenie.
(iii) Średnica zbioru A wynosi zero wtedy i tylko wtedy, gdy zbiór A ma dokładnie jeden element.
(iv) Zbiór A jest ograniczony wtedy i tylko wtedy, gdy jego średnica jest skończona.
T∞
(v) Jeśli A : N → P(X) jest ciągiem zbiorów takich, że %(An ) < n1 , to %( n=1 An ) = 0.
Dowód: Dowód własności (i), (ii) oraz (iii) pozostawiamy jako proste ćwiczenie. Aby pokazać własność (iv) zauważmy,
że jeśli A jest ograniczony, to daje się zawrzeć w pewnej kuli. A wtedy z (ii) wynika, że średnica zbioru A nie jest większa
niż średnica kuli. Na odwrót, jeśli średnica jest skończona i wynosi s, to wybierając dowolny punkt x ∈ A łatwo zauważyć,
że A ⊂ K̄(x, s). Zatem A jest ograniczony. T∞
Pozostaje pokazać Twłasność (v). Dla dowodu nie wprost załóżmy, że %( n=1 An ) 6= 0. Z własności (iii) wnosimy, że
∞
istnieją punkty x, y ∈ n=1 An , takie, że %(x, y) > 0. Dobierzmy n0 ∈ N takie, że
1
< %(x, y). (3.8)
n0
Ponieważ punkty x i y należą do części wspólnej zbiorów An , więc w szczególności należą do zbioru An0 . Zatem %(x, y) ¬
%(An0 ) ¬ n10 , co przeczy (3.8).
Niech a = (a1 , a2 , . . . , ad ) i b = (b1 , b2 , . . . , bd ) będą punktami w Rd takimi, że ai ¬ bi dla i = 1, 2, . . . , d. Kostką w Rd
nazywamy zbiór postaci
[a1 , b1 ] × [a2 , b2 ] × · · · × [ad , bd ]. (3.9)
Dowód: ćwiczenie.
Definicja 3.2.1 Niech A ⊂ X. Mówimy, że punkt x ∈ X jest punktem brzegowym zbioru A, jeżeli w każdej kuli o
środku w punkcie x istnieje przynajmniej jeden punkt należący do zbioru A i przynajmniej jeden punkt nienależący
do zbioru A. Brzegiem zbioru A w X nazywamy zbiór punktów brzegowych zbioru A, a więc zbiór
Rysunek 3.4: Poszukiwanie punktów brzegowych (na górze po lewej) zbioru A, brzeg zbioru A (na górze po prawej),
domknięcie zbioru A jako przykład zbioru domkniętego (na dole po lewej) i wnętrze zbioru A jako przykład zbioru otwartego
(na dole po prawej).
Uwaga 3.2.2 Punkt x jest punktem brzegowym zbioru A wtedy i tylko wtedy gdy jest on punktem brzegowym uzupeł-
nienia zbioru A. W szczególności, dla dowolnego A ⊂ X mamy
bd A = bd \A. (3.12)
Jeśli punkt x nie jest punktem brzegowym, to albo istnieje r > 0 takie, że K(x, r) ⊂ A, albo istnieje r > 0 takie, że K(x, r) ∩ A = ∅. W
szczególności, jeśli żaden punkt zbioru A nie jest jego punktem brzegowym, to dla każdego x ∈ A istnieje r > 0 takie, że K(x, r) ⊂ A, bo jeśli x ∈ A, to
dla dowolnego r > 0 mamy x ∈ K(x, r) ∩ A, czyli K(x, r) ∩ A 6= ∅. Podsumujemy te obserwacje w poniższej definicji i twierdzeniu.
Definicja 3.2.3 Mówimy, że A jest otwarty, jeżeli żaden punkt brzegowy zbioru A do zbioru A nie należy. Innymi
słowy, A jest otwarty gdy A ∩ bd A = ∅.
Dowód: Załóżmy, że własność (3.13) nie zachodzi. Zatem istnieje x ∈ A takie, że K(x, r) \ A 6= ∅ dla każdego r > 0.
Ponieważ x ∈ A ∩ K(x, r), więc również A ∩ K(x, r) 6= ∅. Zatem x jest punktem brzegowym A, co przeczy otwartości
A. Zatem otwartość zbioru A implikuje własność (3.13). Załóżmy z kolei, że własność (3.13) zachodzi. Z własności tej
natychmiast wynika, że punkty zbioru A nie są punktami brzegowymi zbioru A. Zatem A jest otwarty.
Definicja 3.2.5 Mówimy, że A jest domknięty, jeżeli każdy punkt brzegowy zbioru A do zbioru A należy. Tak więc
A jest domknięty gdy bd A ⊂ A.
Dowód: ćwiczenie.
Z twierdzeń 3.2.4 i 3.2.6 wynika natychmiast następujący wniosek.
Wniosek 3.2.7 Zbiór A jest otwarty wtedy i tylko wtedy gdy jego uzupełnienie jest zbiorem domkniętym.
Ćwiczenie 3.2.8 Pokazać, że w metryce dyskretnej każdy zbiór jest równocześnie otwarty i domknięty.
Ćwiczenie 3.2.9 Podać przykład zbioru w R2 z metryką euklidesową, który nie jest otwarty i równocześnie nie jest
domknięty.
Twierdzenie 3.2.10 Kula otwarta K(x, r) jest zbiorem otwartym, a kula domknięta K̄(x, r)jest zbiorem domkniętym.
Dowód: [•] Aby pokazać, że K(x, r) jest zbiorem otwartym ustalmy x0 ∈ K(x, r). Wtedy %(x, x0 ) < r. Połóżmy
r := r − %(x, x0 ). Zatem r0 > 0. Pokażemy, że K(x0 , r0 ) ⊂ K(x, r). Rzeczywiście, jeśli y ∈ K(x0 , r0 ), to %(y, x0 ) < r0 . Zatem
0
%(y, x) ¬ %(y, x0 ) + %(x0 , x) < r0 + %(x0 , x) = r, co dowodzi, że y ∈ K(x, r). Udowodniliśmy zatem, że K(x, r) spełnia warunek
(3.13) twierdzenia (3.2.4). Tym samym K(x, r) jest zbiorem otwartym.
Aby pokazać, że K̄(x, r) jest zbiorem domkniętym ustalmy x0 6∈ K̄(x, r). Wtedy %(x, x0 ) > r. Połóżmy r0 := %(x, x0 ) − r.
Zatem r0 > 0. Pokażemy, że K(x0 , r0 ) ∩ K̄(x, r) = ∅. Rzeczywiście, jeśli y ∈ K̄(x, r) ∩ K(x0 , r0 ) to
co jest nierównością fałszywą. Zatem pokazaliśmy własność (3.14) twierdzenia 3.2.6 co dowodzi, że K̄(x, r) jest zbiorem
domkniętym.
Twierdzenie 3.2.11 Niech (X, %) będzie przestrzenią metryczną. Zbiory otwarte w X mają następujące własności.
Dowód: [•] Łatwo zauważyć, że tak zbiór pusty jak i cała przestrzeń nie posiadają punktów brzegowych skąd natychmiast
wynika, że są one otwarte. Dowodzi to (i). Niech U, V ⊂ X będą zbiorami otwartymi i niech x ∈ U ∩ V . Z twierdzenia 3.2.4
znajdziemy r1 > 0 takie, że K(x, r1 ) ⊂ U oraz r2 > 0 takie, że K(x, r2 ) ⊂ V . Niech r := min(r1 , r2 ). Wtedy r > 0 oraz
Warto zauważyć, że choć własność (ii) zbiorów otwartych przenosi się na przecięcie dowolnej skończonej rodziny zbiorów
otwartych, to nie musi zachodzić gdy rodzina jest nieskończona. Na przykład, przecięcie rodziny przedziałów otwartych
{ (− n1 , n1 ) | n ∈ N1 } jest singletonem {0}, który nie jest zbiorem otwartym.
Podobnie do zbiorów otwartych zachowują się zbiory domknięte, ale w tym przypadku to suma nieskończonej rodziny
zbiorów domkniętych nie musi być domknięta.
Twierdzenie 3.2.12 Niech (X, %) będzie przestrzenią metryczną. Zbiory domknięte w X mają następujące własności.
(i) Zbiór pusty i cała przestrzeń są zbiorami domkniętymi.
(ii) Suma dwóch zbiorów domkniętych jest zbiorem domkniętym.
(iii) Przecięcie dowolnej rodziny zbiorów domkniętych jest zbiorem domkniętym.
Dowód: ćwiczenie.
Definicja 3.2.13 Rodzinę zbiorów otwartych przestrzeni metrycznej nazywamy topologią tej przestrzeni.
W pierwszej chwili może wydawać się zaskakujące, że zbiór pusty i cała przestrzeń są równocześnie otwarte i domknięte.
Okazuje się jednak, że takich zbiorów może być więcej niż tylko zbiór pusty i cała przestrzeń. Dzieje się tak w przestrzeniach,
które zbudowane są z kilku kawałków. Przypomnijmy, że każdy niepusty podzbiór przestrzeni metrycznej jest też przestrzenią
metryczną z metryką indukowaną. W szczególności, rozważmy X = [1, 2] ∪ [3, 4] z metryką indukowaną z przestrzeni R. W
takiej przestrzeni zbiór [1, 2] jest równocześnie domknięty i otwarty. By się o tym przekonać, wystarczy przeanalizować jak
wyglądają kule w tej przestrzeni.
Ćwiczenie 3.2.14 W przestrzeni X = [1, 2] ∪ [3, 4] z metryką indukowaną z przestrzeni R wyliczyć kulę otwartą o
środku w punkcie 2 i promieniu r = 12 , r = 1, oraz r = 32 .
Definicja 3.3.1 Niech %1 i %2 będą metrykami w zbiorze X. Mówimy, że %1 i %2 są równoważne jeżeli dla każdego
zbioru A ⊂ X zbiór A jest otwarty względem metryki %1 wtedy i tylko wtedy gdy jest otwarty względem metryki %2 .
Dowód: Dowód wykorzystuje twierdzenie 3.2.4 . Pozostawiamy go jako ćwiczenie. Wskazówką jest rysunek 3.2
96 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH
1.0
0.5
-10 -5 5 10
-0.5
-1.0
Rysunek 3.5: Silnie rosnąca bijekcja zbioru R̄ w przedział [−1, 1]. Punkt −∞ przechodzi w punkt −1, a punkt ∞ w punkt
1.
3.3.1 Metryka w R̄
W prowadzenie przestrzeni R̄ w rozdziale 2.3 pozwoliło na traktowanie każdego zbioru jako ograniczonego i w konsekwencji posiadajacego ˛ kres dolny i górny.
Zbiór w R, który nie jest ograniczony od góry rozważany w R̄ ma kres górny +∞. Podobnie, zbiór w R, który nie jest ograniczony od dołu rozważany w R̄
ma kres dolny −∞. Dysponujać ˛ metryka˛ w R̄ moglibyśmy też ujednolicić definicj˛e granicy ciagu
˛ tak, by obok granic skończonych obejmowała również granice
nieskończone.
Twierdzenie 3.3.4 Istnieje silnie rosnąca bijekcja h : R̄ → [−1, 1]. W szczególności jest taką funkcja zadana wzorem
x = −∞,
−1
h(x) := 1+|x| x ∈ R,
x
(3.15)
1 x = ∞.
jest metryką w R̄. Co więcej, jeśli h1 , h2 : R̄ → [−1, 1] są dwoma silnie rosnącymi bijekcjami, to metryki %h1 i %h2 są
równoważne.
3.4. PUNKTY SKUPIENIA ZBIORU 97
Dowód: ćwiczenie.
Funkcję daną wzorem (3.15) zobrazowano na rysunku 3.5 . W dalszym ciągu zbiór R̄ traktować będziemy jako przestrzeń
metryczną z metryką %h .
Łatwo przeliczyć, że dla funkcji h danej wzorem (3.15) oraz dodatniego x ∈ R mamy %h (x, ∞) = 1+x
1
. Zatem dla r > 0
warunek %h (x, ∞) < r jest równoważny warunkowi x > r − 1 = r . Stąd dla r ∈ (0, 1) dostajemy wzór na kulę o środku
1 1−r
w nieskończoności i promieniu r
1−r
K%h (∞, r) = ,∞ . (3.16)
r
Dla r ∈ (0, 1) wyrażenie 1−r
r przyjmuje wszystkie wartości dodatnie. Pokazuje to, że definicja 2.4.5 granicy nieskończonej
w istocie podpada pod ogólną definicję granicy gdy zbieżność rozważać będziemy w przestrzeni R̄ z metryką %h .
Definicja 3.4.1 Punkt x ∈ X nazywamy punktem skupienia zbioru A ⊂ X, jeżeli w każdej kuli K(x, r) znajdziemy
punkt y ∈ K(x, r) ∩ A różny od punktu x. Zbiór punktów skupienia zbioru A oznaczamy A0 .
Definicja 3.4.2 Mówimy, że x ∈ X jest punktem izolowanym zbioru A ⊂ X, jeżeli x ∈ A i x nie jest punktem
skupienia zbioru A.
Dla zbioru
A := { n1 | n ∈ N1 } ∪ { n+1
n
| n ∈ N1 }
jedynymi punktami skupienia są 0 i 1, z czego tylko 1 jest elementem A. Wszystkie pozostałe punkty zbioru A to jego punkty
izolowane.
Zbiór N̄ := N ∪ {∞} jest podzbiorem R̄, jest więc przestrzenią metryczną z metryką indukowaną z R̄. Łatwo sprawdzić,
że w przestrzeni tej wszystkie punkty są izolowane, z wyjątkiem punktu ∞, który jest punktem skupienia zbioru N ⊂ N̄, bo
na mocy wzoru (3.16) każda kula o środku w nieskończoności zawiera punkty z N̄ różne od nieskończoności.
Dowód:
Załóżmy najpierw, że A jest zbiorem domkniętym. Aby pokazać, że A0 ⊂ A, przypuśćmy, że tak nie jest. Wtedy znaj-
dziemy punkt x ∈ A0 \ A. Rozważmy dowolne r > 0. Wtedy x ∈ K(x, r) \ A, więc K(x, r) \ A 6= ∅. Równocześnie
K(x, r) ∩ A 6= ∅, bo x jest punktem skupienia zbioru A. Wnosimy więc, że x ∈ bd A, a zatem x ∈ A, bo A jest domknięty.
Otrzymana sprzeczność dowodzi, że domkniętość A implikuje A0 ⊂ A.
98 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH
Aby pokazać implikację przeciwną przyjmijmy, że A0 ⊂ A. Musimy pokazać, że bd A ⊂ A. Dla dowodu nie wprost
przypuśćmy, że tak nie jest i rozważmy punkt x ∈ bd A \ A. Wtedy dla dowolnego r > 0 znajdziemy punkt y ∈ K(x, r) ∩ A.
Co więcej, y 6= x, bo y ∈ A, a x 6∈ A. Zatem pokazaliśmy, że x jest punktem skupienia zbioru A, co, na mocy przyjętego
założenia, że A0 ⊂ A, dowodzi, że x ∈ A. Otrzymana sprzeczność kończy dowód.
Twierdzenie 3.4.4 Punkt x ∈ X jest punktem skupienia zbioru A ⊂ X wtedy i tylko wtedy gdy istnieje ciąg a : N →
A \ {x} zbieżny do x.
Dowód: Załóżmy, że x ∈ X jest punktem skupienia zbioru A ⊂ X. Zatem dla każdego n ∈ N mamy K(x, n1 )∩A\{x} = 6 ∅.
Wybierzmy zatem an ∈ K(x, n1 ) ∩ A \ {x}. Nie jest trudno pokazać, że ciąg a : N 3 n 7→ an ∈ A \ {x} jest zbieżny do x. Dla
dowodu implikacji przeciwnej przyjmijmy, że a : N → A \ {x} jest zbieżny do x. Niech K = K(x, r) będzie kulą o środku
w x i promieniu r > 0. Ponieważ limn→∞ n1 = 0, możemy dobrać n ∈ N takie, że n1 < r. Wtedy an ∈ K(x, n1 ) ∩ A \ {x} ⊂
K(x, r) ∩ A \ {x}, co dowodzi, że x ∈ A0 .
Twierdzenie 3.4.5 Zbiór A ⊂ X jest domknięty wtedy i tylko wtedy gdy dla każdego ciągu a : N → A jeśli a jest
zbieżny do x ∈ X to x ∈ A.
Dowód: Załóżmy, że A jest domknięty. Niech a : N → A będzie zbieżny do x ∈ X. Jeśli x jest wyrazem ciągu a, czyli
gdy x ∈ im a, to oczywiście x ∈ A. Jeśli x 6∈ im a, to z tw. 3.4.4 x ∈ A0 . Zatem z tw. 3.4.3 mamy x ∈ A.
Dla dowodu implikacji przeciwnej przyjmijmy, że dla każdego ciągu a : N → A jeśli a jest zbieżny do x ∈ X to x ∈ A.
Wystarczy pokazać, że A0 ⊂ A, bo wtedy z tw. 3.4.3 wynika, że A jest domknięty. Zatem weźmy x ∈ A0 . Z tw. 3.4.4
istnieje ciąg a : N → A \ {x} zbieżny do x. Zatem z przyjętego założenia x ∈ A, co pokazuje, że A0 ⊂ A i kończy dowód.
Definicja 3.5.1 Mówimy, że zbiór E ⊂ X jest niespójny, jeżeli istnieją rozłączne zbiory otwarte A, B ⊂ X takie, że
A ∩ E 6= ∅ 6= B ∩ E oraz E ⊂ A ∪ B. Jeśli takie zbiory nie istnieją, mówimy, że E jest spójny.
Twierdzenie 3.5.2 Podzbiór E ⊂ R jest zbiorem spójnym, wtedy i tylko wtedy gdy
Dowód: (*)Załóżmy, że E jest spójny, ale warunek (3.17) nie zachodzi. Wtedy istnieją x, y ∈ E oraz z 6∈ E takie, że
x < z < y. Połóżmy A := (−∞, z) oraz B := (z, ∞). Zbiory A i B są otwarte, rozłączne oraz E ⊂ A ∪ B. Zatem E nie jest
spójny. Otrzymana sprzeczność dowodzi, że spójność E implikuje warunek (3.17).
3.6. ZBIORY ZWARTE W PRZESTRZENIACH METRYCZNYCH 99
Dla dowodu implikacji przeciwnej przyjmijmy, że warunek (3.17) zachodzi, ale E nie jest spójny. Wtedy istnieją otwarte,
rozłączne podzbiory A, B ⊂ R takie, że E ⊂ A ∪ B oraz E ∩ A 6= ∅ 6= E ∩ B. Niech x ∈ E ∩ A oraz y ∈ E ∩ B. Dla
ustalenia uwagi przyjmijmy, że x < y (rozumowanie gdy y < x jest analogiczne). Z otwartości B znajdziemy s, t ∈ R takie,
że x < s < t < y oraz [x, s] ⊂ A i [t, y] ⊂ B. Połóżmy A0 := A∩(x, t). Zbiór A0 jest otwarty jako przecięcie zbiorów otwartych,
ograniczony, bo t jest majorantą, oraz niepusty, bo x ∈ A, a zbiór A jest otwarty. Niech p := sup A0 . Mamy x < s ¬ p < t.
Pokażemy, że p 6∈ A i p 6∈ B. Rzeczywiście, jeśli p ∈ A, to p ∈ A0 , bo p ∈ (x, t). Ale to oznacza, że nie może być p = sup A0 ,
bo A0 jest otwarty. Zatem p 6∈ A. Jeśli p ∈ B, to znajdziemy p0 < p takie, że [p0 , p] ⊂ B, bo B jest otwarty. Ale p = sup A0 ,
więc istnieje q ∈ A0 ∩ (p0 , p), co nie jest możliwe, bo zbiory A i B są rozłączne. Zatem również p 6∈ B. W szczególności p 6∈ E,
bo E ⊂ A ∪ B. Ale to jest sprzeczne z warunkiem (3.17) co dowodzi, że warunek (3.17) implikuje spójność zbioru E.
Wniosek 3.5.3 Podzbiór E ⊂ R jest zbiorem spójnym wtedy i tylko wtedy gdy jest przedziałem.
Dowód: [•] Oczywiście każdy przedział spełnia warunek (3.17), zatem jest spójny na mocy twierdzenia 3.5.2 . Załóżmy
zatem, że podzbiór E ⊂ R jest spójny. Wtedy spełnia on warunek (3.17). Połóżmy
(
inf E gdy E ograniczony od dołu,
a := (3.18)
−∞ w przeciwnym razie,
(
sup E gdy E ograniczony od góry,
b := (3.19)
∞ w przeciwnym razie.
oraz
[a, b] gdy
a, b ∈ R,
(a, b]
gdy a = −∞, b ∈ R,
Ia,b :=
[a, b) gdy a ∈ R, b = ∞,
(a, b) gdy a = −∞, b = ∞.
Pokażemy, że (a, b) ⊂ E ⊂ Ia,b . Niech x ∈ (a, b). Bądź z definicji kresu dolnego bądź z faktu, że E jest nieograniczony
od dołu znajdziemy t ∈ E takie, że a < t < x. Podobnie znajdziemy s ∈ E, takie, że x < s < b. Zatem z warunku
(3.17) twierdzenia 3.5.2 wnosimy, że x ∈ E. Dowodzi to pierwszej inkluzji. Druga jest oczywista. Zatem E jest jednym z
przedziałów: (a, b), [a, b), (a, b] lub [a, b].
Definicja 3.6.1 Zbiór A ⊂ X nazywamy zwartym jeżeli każdy nieskończony podzbiór zbioru A posiada punkt sku-
pienia należący do A.
Lemat 3.6.3 Niech [an , bn ] będzie ciągiem przedziałów domkniętych w R takim, że [an+1 , bn+1 ] ⊂ [an , bn ]. Wtedy
∞
\
[an , bn ] 6= ∅.
n=1
Dowód: Zauważmy, że ciąg n 7→ an jest rosnący i ograniczony od góry, a ciąg n 7→ bn jest malejący i ograniczony od
dołu. Z twierdzenia 2.5.6 wnosimy, że ciągi te są zbieżne. Niech a := limn→∞ an oraz b := limn→∞ bn . Ponieważ
T∞ an ¬ bn , z
twierdzenia 2.5.3 o zachowywaniu słabej nierówności w granicy wnosimy, że a ¬ b. Zatem ∅ 6= [a, b] ⊂ n=1 [an , bn ].
Dowód: ćwiczenie.
Dowód: (*)Niech Q będzie kostką w Rd , a E ⊂ Q zbiorem nieskończonym. Skonstruujemy rekurencyjnie ciąg kostek
(Qn )∞
n=0 taki, że
Dowód: [•] Załóżmy, że B ⊂ X jest zbiorem zwartym. Niech a : N → B będzie ciągiem zbieżnym do x ∈ X. Na mocy
twierdzenia 3.4.5 wystarczy pokazać, że x ∈ B. Niech E oznacza zbiór wyrazów ciągu a. Jeśli x ∈ E, to oczywiście x ∈ B,
bo z założenia E ⊂ B. Załóżmy zatem, że x 6∈ E. Twierdzimy, że wtedy E jest nieskończony. Rzeczywiście, gdyby E był
skończony, to jako zbieżny, musiałby być od pewnego miejsca stały. Wtedy ten powtarzający się wyraz byłby równocześnie
jego granicą, a tym samym granica należałaby do E. Zatem E jest zbiorem nieskończonym. Wtedy x, jako granica ciągu
a, jest punktem skupienia zbioru wyrazów tego ciągu, czyli E. Co więcej, jest to jedyny punkt skupienia zbioru E, bo w
przeciwnym razie ciąg a nie byłby zbieżny. Ale B jest zwarty, więc E musi mieć punkt skupienia w B. Ponieważ E ma tylko
jeden punkt skupienia, musi nim być x. Zatem i w tym przypadku x ∈ B.
Łatwo podać przykład, że odwrotne twierdzenie nie jest prawdziwe. Rozważmy zbiór A = [0, ∞) w przestrzeni R. Jedynym
punktem brzegowym zbioru A jest punkt 0. Ponieważ 0 ∈ A< zbiór A jest domknięty. Ciąg kolejnych liczb naturalnych
ma wartości w zbiorze A, ale, jak łatwo sprawdzić, nie posiada punktu skupienia. Zatem A, pomimo, że domknięty, nie jest
zwarty.
Twierdzenie 3.6.8 Niepusty podzbiór B ⊂ Rd jest zwarty wtedy i tylko wtedy gdy jest domknięty i ograniczony w
metryce euklidesowej.
Dowód: [•] Załóżmy, że B ⊂ Rd jest zwarty. Na mocy twierdzenia 3.6.6 jest on domknięty. Załóżmy, że nie jest
ograniczony. Skonstruujemy rekurencyjnie ciąg a : N → B taki, że dla n > 0
gdzie symbolem 0 oznaczamy punkt w Rd , którego wszystkie współrzędne wynoszą zero. Wyraz a0 dobieramy jako dowolny
element zbioru B. Załóżmy, że wyraz an został już zdefiniowany tak, że własność (3.23) zachodzi. Ponieważ B jest nieograni-
czony, nie zawiera się w żadnej kuli, w szczególności nie jest podzbiorem kuli K̄(0, max(n, %e (0, an ))). Wyraz an+1 dobieramy
jako dowolny element różnicy B \ K̄(0, max(n, %e (0, an ))). Zatem (3.23) zachodzi. Niech E oznacza zbiór wartości ciągu a.
Oczywiście E ⊂ B, a ponieważ B jest zwarty, znajdziemy punkt x ∈ E 0 ∩ B. Dobierzmy n0 ∈ N tak, że n0 > %e (0, x) + 1. Z
(3.23) wynika, że jedynie skończona liczba wyrazów ciągu a leży w K(0, n0 ). W szczególności jedynie skończona liczba ele-
mentów zbioru E leży w kuli K(x, 1). Zatem x nie może być punktem skupienia zbioru E. Otrzymana sprzeczność dowodzi,
że zbiór B jest ograniczony względem metryki euklidesowej.
Z kolei przyjmijmy, że zbiór B ⊂ Rd jest domknięty i ograniczony w metryce euklidesowej. Zatem znajdziemy r > 0
takie, że B ⊂ K(0, r). Niech Q będzie iloczynem kartezjańskim d kopii przedziału [−r, r]. Oczywiście B ⊂ K(0, r) ⊂ Q Na
mocy twierdzenia 3.6.5 zbiór Q jest zwarty. Zatem z twierdzenia 3.6.7 wynika, że B jest zwarty.
102 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH
3.7 Zupełność
Poj˛ecie przestrzeni zupełnej wiaże˛ si˛e z poj˛eciem ciagu
˛ Cauchy’ego. Łatwo zauważyć, że jeśli ciag
˛ jest zbieżny, to jego kolejne wyrazy, jako coraz bliższe granicy,
sa˛ również coraz bliższe siebie. Formalizuje t˛e obserwacj˛e poniższa definicja ciagu
˛ Cauchy’ego i zwiazane
˛ z nia˛ twierdzenie, które mówi, że każdy ciag
˛ zbieżny jest
ciagiem
˛ Cauchy’ego. Interesuje nas jednak odwrotne pytanie. Czy może istnieć ciag ˛ Cauchy’ego, który nie jest zbieżny? W pierwszej chwili może to wydawać si˛e
niemożliwe. Pami˛etajmy jednak, że √ pytanie stawiamy w dowolnej przestrzeni metrycznej. Jeśli przestrzeń jest dziurawa, tak jak przestrzeń Q liczb wymiernych, w
której
√ brak jest na przykład liczby 2, to przykład ciagu
˛ Cauchy’ego, który nie ma granicy
√ daje si˛e znaleźć. Wystarczy rozważyć ciag˛ liczb wymiernych przybliżajacy˛
2. Taki ciag
˛ b˛edzie również ciagiem
˛ w R i w R b˛edzie miał granic˛e, mianowicie 2. W szczególności b˛edzie wi˛ec ciagiem ˛ Cauchy’ego w R. Co wi˛ecej, b˛edzie
ciagiem
˛ Cauchy’ego również√ w Q, bo w definicji ciagu
˛ Cauchy’ego sama granica si˛e nie pojawia. Jednak w przestrzeni Q ciag ˛ ten nie b˛edzie zbieżny, bo jedynym
kandydatem na granic˛e jest 2, który do Q nie należy. Przestrzeń jest zupełna, jeśli każdy ciag ˛ Cauchy’ego jest w niej zbieżny. Przestrzeń R jest zupełna, ale
przestrzeń Q zupełna nie jest.
Definicja 3.7.1 Niech (X, %) będzie przestrzenią metryczną. Mówimy, że ciąg x : N → X spełnia warunek Cauchy’ego
jeżeli
∀ε > 0∃N ∈ N∀n, m N %(xn , xm ) < ε.
Ciąg spełniający warunek Cauchy’ego nazywamy ciągiem Cauchy’ego.
Dowód: Niech x : N → X będzie ciągiem zbieżnym do x∗ ∈ Rd . Ustalmy ε > 0 i dobierzmy N ∈ N takie, że %(xn , x∗ ) < ε
2
dla n N . Niech m, n N . Wtedy
ε ε
%(xn , xm ) ¬ %(xn , x∗ ) + %(x∗ , xm ) < + = ε.
2 2
Przypomnijmy, że podciągiem ciągu x : N → X nazywamy ciąg x ◦ k będący podstawieniem w ciągu x silnie rosnącego
ciągu k : N → N. Kluczowa jest następująca własność ciągów Cauchy’ego.
Twierdzenie 3.7.3 Jeśli ciąg Cauchy’ego posiada podciąg zbieżny to jest zbieżny.
Dowód: [•] Załóżmy, że x : N → X jest ustalonym ciągiem Cauchy’ego takim, że dla pewnego silnie rosnącego ciągu
k : N → N podciąg x ◦ k : N → Rd jest zbieżny do x∗ . Ustalmy ε > 0. Ze zbieżności ciągu x ◦ k do x∗ możemy dobrać N1 ∈ N
do 2ε tak, że
ε
n N1 ⇒ %(xkn , x∗ ) < .
2
Z kolei założenia, że ciąg x jest ciągiem Cauchy’ego możemy dobrać N2 ∈ N takie, że
ε
m, n N2 ⇒ %(xm , xn ) < .
2
Niech N := max(N1 , N2 ) i niech n N . Ponieważ k jest silnie rosnący, możemy dobrać n0 ∈ N takie, że n0 N1 i kn0 N2 .
Zatem mamy
ε ε
%(xn , x∗ ) ¬ %(xn , xkn0 ) + %(xkn0 , x∗ ) < + = ε.
2 2
3.7. ZUPEŁNOŚĆ 103
{ xi | i ∈ N } ⊂ K(xN , r + 1),
Dowód: (*) Niech x : N → Rd będzie ciągiem Cauchy’ego. Na mocy tw. 3.7.4 znajdziemy kulę domkniętą K taką, że
{ xn | n ∈ N } ⊂ K. Zatem na mocy tw. 3.6.8 zbiór wartości ciągu ma punkt skupienia, a więc ciąg x ma podciąg zbieżny.
Teza wynika zatem z twierdzenia 3.7.3 .
Definicja 3.7.6 Przestrzeń metryczną nazywamy zupełną, jeżeli każdy ciąg Cauchy’ego w tej przestrzeni jest zbieżny.
Wniosek 3.7.7 Rd jest przestrzenią metryczną zupełną. W szczególności ciała R i C są przestrzeniami metrycznymi
zupełnymi.
Dowód: Teza dla Rd wynika natychmiast z wniosku 3.7.5 . Zauważmy, że R = R1 , a ciało liczb zespolonych C rozważane
jako przestrzeń metryczna nie różni się od R2 , bo metryka w C i w R2 zadane są tym samym wzorem. Zatem również ciała
R i C są przestrzeniami metrycznymi zupełnymi.
Ćwiczenie 3.7.8 Pokazać, że zbiór liczb wymiernych Q nie jest przestrzenią zupełną.
Twierdzenie 3.7.9 (*)Niech (X, %) będzie przestrzenią metryczną zupełną, a Y ⊂ X jej podprzestrzenią. Wtedy
zupełność podprzestrzeni Y jest równoważna domkniętości Y w X.
Dowód: Załóżmy, że Y jest podprzestrzenią zupełną. Niech y : N → Y będzie ciągiem punktów przestrzeni Y zbieżnym
do y∗ ∈ X. Jako ciąg zbieżny, y jest ciągiem Cauchy’ego. Zatem z zupełności przestrzeni Y wnosimy, że istnieje ȳ ∈ Y , taki
że limn→∞ yn = ȳ. Z twierdzenia 3.1.4 o jednoznaczonści granicy mamy y∗ = ȳ ∈ Y . Zatem z twierdzenia 3.4.5 wnosimy,
że Y jest domknięty w X.
Załóżmy z kolei, że Y jest domknięty w X. Niech y : N → Y będzie ciągiem Cauchy’ego. Ponieważ X jest przestrzenią
zupełną, znajdziemy ȳ ∈ X, taki że limn→∞ yn = ȳ. Z twierdzenia 3.4.5 i domkniętości Y w X wnosimy, że ȳ ∈ Y .
104 ROZDZIAŁ 3. WŁASNOŚCI TOPOLOGICZNE PRZESTRZENI METRYCZNYCH
Rozdział 4
Warunek (ii) pozwala nam oznaczać przez f (x) to jedyne y takie, że (x, y) ∈ f . Jeśli f ⊂ X × Y spełnia (ii), ale warunek
(i) nie zachodzi dla wszystkich x ∈ X to mówimy, że f jest funkcją częściową z X do Y i piszemy f : X 9 Y . Dziedzinę
funkcji częściowej f definiujemy jako
dom f := { x ∈ X | ∃y ∈ Y (x, y) ∈ f }.
im f := { y ∈ Y | ∃x ∈ X (x, y) ∈ f }.
Zauważmy, że funkcja to funkcja częściowa dla której zachodzi dom f = X. Z kolei przyjmując X 0 := dom f dla funkcji
częściowej f : X 9 Y i zawężając f do X 0 dostajemy funkcję. W kontekście granic pojęcie funkcji częściowej jest wygodne,
bo pozwala rozważać funkcje częściowe określone jedynie w otoczeniu jakiegoś punktu co oznacza, że choć nie wiemy bądź
nie chcemy dokładnie analizować dla jakich argumentów funkcja jest określona, to wiemy, że jej dziedzina zawiera otoczenie
punktu.
105
106 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI
( ∗ P r z y b l i ż a n i e g r a n i c y f u n k c j i f g r a n i c a̧ c i a̧ gu n warto s c i f u n k c j i
w punktach c i a̧ gu x ∗ )
F u n c t i o n L i m i t [ f_ , x_ , n_ ] :=
Module [ { k } ,
k = 1;
Do[
Print [ f [ x [ k ] ] ] ;
k = k + 1,
{n}
];
]
( ∗ Funkcja , kt ó r e j g r a n i c ȩ w z e r z e l i c z y m y ∗ )
g [ x_ ] := Sin [ x ] / x ;
( ∗ Ci a̧ g o wyrazach z m i e r z a j a̧ cych do z e r a ∗ )
x [ n_ ] := 1 . / n
( ∗ Test p r z y b l i ż a n i a warto s c i f u n k c j i ∗ )
FunctionLimit [ g , x , 100]
Listing 4.1: Przybliżanie granicy funkcji w języku Mathematica
Ćwiczenie komputerowe 4.1.1 • Sprawdź działanie programu z listingu 4.1 dla funkcji x 7→ sin x
x ˛ xn :=
i dla ciagu 1
np przy różnych wartosciach
p.
• Sprawdź działanie programu z listingu 4.1 dla funkcji x 7→ sin x1 i dla różnych ciagów.
˛
Eksperymenty numeryczne pokazuja,˛ że definicj˛e granicy funkcji lepiej byłoby postawić uniezależniajac
˛ si˛e od ciagów,
˛ bo zachowanie funkcji może być różne,
przy podstawieniu w miejsce argumentów różnych ciagów.
˛ Taka˛ definicj˛e rozważaliśmy już w rozdziale wst˛epnym.
lim f (x) = y0
x→x0
jeżeli
∀ε > 0 ∃δ > 0 ∀x ∈ dom f \ {x0 } %X (x, x0 ) < δ ⇒ %Y (f (x), y0 ) < ε. (4.1)
Zwróćmy uwag˛e, że punkt skupienia zbioru nie musi należeć do zbioru. W powyższej definicji nie zakładamy, że x0 ∈ dom f . To ma sens, bo liczenie
˛ również w punktach, w których funkcja f nie jest określona. Na przykład funkcja x 7→ sinx x nie jest określona w zerze, ale ma w
granicy może być interesujace
zerze granic˛e 1. Funkcja ta jest określona w zbiorze dom f = R \ {0}, a zero jest punktem skupienia zbioru dom f , który do dom f nie należy.
4.1. GRANICA FUNKCJI W PRZESTRZENIACH METRYCZNYCH 107
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ F u n c t i o n L i m i t . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P r z y b l i ż a n i e g r a n i c y f u n k c j i g r a n i c a̧ c i a̧ gu warto s c i ∗/
/∗ f u n k c j i ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
/∗ Funkcja , kt ó r e j g r a n i c ȩ w z e r z e l i c z y m y ∗/
double f ( double x ) {
return s i n ( x ) / x ;
}
/∗ Ci a̧ g o wyrazach z m i e r z a j a̧ cych do z e r a ∗/
double x ( i n t n ) {
return 1 . 0 / n ;
}
f o r ( i n t n=1;n<=20;n=n+1){
c o u t << "x[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << x ( n ) ;
c o u t << " f(x[" << setw ( 2 ) << n << " ]) =" ;
c o u t << setw ( 1 8 ) << f ( x ( n ) ) << e n d l ;
}
}
Listing 4.2: Przybliżanie granicy funkcji w C++
108 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI
to y1 = y2 .
Dowód: Dla dowodu nie wprost załóżmy, że y1 6= y2 . Wtedy r := %(y1 , y2 ) > 0. Z warunku (4.1) zastosowanego dla y1
i y2 do ε := r
2 znajdziemy odpowiednio δ1 i δ2 takie, że dla x ∈ dom f \ {x0 }
Niech δ := min(δ1 , δ2 ). Ponieważ x0 jest punktem skupienia zbioru dom f w X, a K(x0 , δ) jest otoczeniem x0 w X, więc
znajdziemy punkt x∗ ∈ K(x0 , δ) ∩ dom f \ {x0 }. Ponieważ w szczególności %(x∗ , x0 ) < δ1 i %(x∗ , x0 ) < δ2 , więc na mocy
(4.2) i (4.3) mamy %(f (x∗ ), y1 ) < ε i %(f (x∗ ), y2 ) < ε. Zatem z nierówności trójkąta
r r
%(y1 , y2 ) ¬ %(y1 , f (x∗ )) + %(f (x∗ ), y2 ) < ε + ε = + = %(y1 , y2 ).
2 2
Otrzymana sprzeczność dowodzi tezy.
Definicja 4.1.4 Mówimy, że f zmierza do nieskończoności (ma granicę nieskończoność) przy x zmierzającym do x0 i
piszemy
lim f (x) = ∞
x→x0
jeżeli
∀A > 0 ∃δ > 0 ∀x ∈ X \ {x0 } %X (x, x0 ) < δ ⇒ f (x) > A. (4.4)
Podobnie definiujemy granicę limx→x0 f (x) = −∞ zamieniając w (4.4) warunek f (x) > A na f (x) < −A.
W języku potocznym, w przypadku granic nieskończonych zamiast mówić o zbieżności do plus lub minus nieskończoności
często mówimy o rozbieżności.
Możemy też zdefiniować granice w nieskończoności. Niech Y będą przestrzenią metryczną i niech a ∈ R.
lim f (x) = y0
x→∞
jeżeli
∀ε > 0 ∃A a ∀x > A %Y (f (x), y0 ) < ε. (4.5)
Podobnie dla funkcji f : (−∞, a] → Y definiujemy granicę limx→−∞ f (x) zamieniając w (4.5) warunek A a na
A ¬ a oraz x > A na x < A.
4.2. WŁASNOŚCI GRANICY FUNKCJI 109
Podobnie jak w przypadku ciągów, traktując R̄ jako przestrzeń metryczną z metryką %h (patrz rozdział 3.3.1 ) możemy
zauważyć, że tak granice nieskończone jak i granice w nieskończoności są szczególnymi przypadkami ogólnego pojęcia granicy
w definicji 4.1.2 . Wynika to ze wzoru (3.16), który, dla funkcji h danej wzorem (3.15), pozwala zastąpić warunek %h (x, ∞) < r
i warunek %h (f (x), ∞) < r odpowiednio warunkiem x > A i f (x) > A z A := 1−r r . Analogicznie dla granicy minus
nieskończoność i w minus nieskończoności. W szczególności, dokładnie na tej samej zasadzie, definicja granicy ciągu jest
szczególnym przypadkiem definicji 4.1.2 . Nieskończoność jest bowiem punktem skupienia dla N w N̄, a wzór (3.16) pozwala
zastąpić warunek %h (n, ∞) < δ warunkiem n > N z N ∈ N tak dobranym, by było większe niż 1−δ δ .
lim fi (x) = ai
x→x0
dla i ∈ {1, 2}. Wtedy istnieją granice sumy, różnicy i iloczynu funkcji f1 , f2 w x0 i wynoszą odpowiednio
Ponadto ε
2M > 0, więc dla i = 1, 2 możemy dobrać δi > 0 takie, że
ε
%X (x, x0 ) < δi , x 6= x0 ⇒ |fi (x) − ai | < . (4.12)
2M
Zauważmy najpierw, że
%X (x, x0 ) < δ0 , x 6= x0 ⇒ |f1 (x)| ¬ M. (4.13)
4.2. WŁASNOŚCI GRANICY FUNKCJI 111
Twierdzenie 4.2.2 Przy założeniach poprzedniego twierdzenia, jeśli ponadto funkcja f2 (x) dla x w pewnym otoczeniu
x0 oraz a2 6= 0, to istnieje też granica ilorazu i wynosi
f1 (x) a1
lim = . (4.14)
x→x0 f2 (x) a2
Dowód: [•] Rozważmy najpierw przypadek szczególny gdy f1 jest funkcją stale równą jeden. Zatem chcemy pokazać,
że limx→x0 f21(x) = a12 . Ustalmy c ∈ (0, |a2 |) i wybierzmy δ0 > 0 takie, że
Twierdzenie 4.2.3 Niech f, g : X → R̄. Załóżmy, że dla x0 ∈ X 0 istnieją granice limx→x0 f (x) i limx→x0 g(x). Jeśli
istnieje δ > 0 takie, że
x ∈ K(x0 , δ) \ {x0 } ⇒ f (x) ¬ g(x), (4.15)
to
lim f (x) ¬ lim g(x). (4.16)
x→x0 x→x0
Dowód: [•] Oznaczmy a := limx→x0 f (x), b := limx→x0 g(x). Dla dowodu nie wprost przyjmijmy, że a > b. Dobierzmy
stałe c, d ∈ R̄ takie, że b < c < d < a oraz ε > 0 takie, że K(b, ε) ⊂ [−∞, c) i K(a, ε) ⊂ (d, ∞]. Znajdziemy δ1 > 0 takie, że
x ∈ K(x0 , δ1 ) \ {x0 } ⇒ f (x) ∈ K(a, ε)
i δ2 > 0 takie, że
x ∈ K(x0 , δ2 ) \ {x0 } ⇒ g(x) ∈ K(b, ε).
Ponieważ x0 jest punktem skupienia przestrzeni X, znajdziemy x1 ∈ K(x0 , min(δ, δ1 , δ2 )). Wtedy
g(x1 ) < c < d < f (x1 )
co przeczy (4.15).
112 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI
Twierdzenie 4.2.4 Niech f, g, h : X → R̄, x0 ∈ X 0 . Jeśli istnieje δ > 0 takie, że dla każdego x ∈ K(x0 , δ) \ {x0 }
mamy f (x) ¬ g(x) ¬ h(x) oraz istnieją granice
i obie są równe pewnemu a ∈ R̄, to istnieje granica limx→x0 g(x) i też wynosi a.
Twierdzenie 4.2.5 Niech A ⊂ R̄ i ω := sup A. Jeśli ω jest punktem skupienia zbioru A, a f : A → R̄ jest funkcją
rosnącą i ograniczoną od góry, to istnieje granica limx→ω f (x) i jest równa
Dowód: (*) Niech µ := sup { f (x) | x ∈ A \ {ω} }. Ustalmy ε > 0 i wybierzmy c ∈ K(µ, ε) ∩ (−∞, µ). Z definicji kresu
górnego znajdziemy x̄ ∈ A \ {ω} takie, że f (x̄) > c. Dobierzmy δ > 0 takie, że K(ω, δ) ⊂ (x̄, ∞]. Niech x ∈ A ∩ K(ω, δ) \ {ω}.
Ponieważ o f założyliśmy, że jest rosnąca, mamy
Dowód: (**)Załóżmy, że granica limx→x0 f (x) = y istnieje. Zadajmy ε > 0. Niech δ > 0 będzie tak dobrane, że
x ∈ K(x0 , δ), x 6= x0 ⇒ f (x) ∈ K(y, ε).
Niech x ∈ K(x0 , δ). Ustalmy j ∈ { 1, 2, . . . n }. Wtedy
%Yj (fj (x), yj ) ¬ max { %Yi (fi (x), yi ) | i = 1, 2, . . . n } = %Y1 ×·×Yn (f (x), y) < ε.
Zatem, fj (x) ∈ K(yj , ε).
Aby udowodnić implikację przeciwną przyjmijmy, że granice limx→x0 fi (x) = yi dla i = 1, 2, . . . , n istnieją. Ustalmy ε > 0
i dla i = 1, 2, . . . n dobierzmy δi > 0 do ε tak, że
x ∈ K(x0 , δi ), x 6= x0 ⇒ fi (x) ∈ K(yi , ε).
Połóżmy δ := min { δi | i = 1, 2, . . . n }. Niech x ∈ K(x, δ) \ {x0 }. Wtedy
%Y1 ×···×Yn (f (x), y) = max { %Yi (fi (x), yi ) | i = 1, 2, . . . n } ¬ ε.
lim f (x) = y,
x→x−
0
jeżeli zawężęnie f do przedziału (−∞, x0 ], czyli funkcja f|(−∞,x0 ] : (−∞, x0 ] → Y ma w x0 granicę y. Analogicznie,
mówimy, że f ma w x0 granicę prawostronną równą y ∈ Y i piszemy
lim f (x) = y,
x→x+
0
jeżeli zawężęnie f do przedziału [x0 , ∞), czyli funkcja f|[x0 ,∞) : [x0 , ∞) → Y ma w x0 granicę y.
Twierdzenie 4.3.2 Funkcja f ma w x0 granicę wtedy i tylko wtedy gdy obie granice jednostronne istnieją i są sobie
równe.
W programie Mathematica granicę jednostronną limx→u− f (x) liczymy przy pomocy instrukcji
Limit[f[x], x -> u, Direction -> 1]
a granicę jednostronną limx→u+ f (x) liczymy przy pomocy instrukcji
Limit[f[x], x -> u, Direction -> -1]
Na przykład
Limit[1/x, x -> 0, Direction -> 1]
zwraca −∞.
114 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI
Dowód: [•] Przypomnijmy, że ciąg x : N1 → X \ {x∗ } to funkcja, której przestrzenią argumentów jest zbiór liczb
naturanych, a xn to nic innego, tylko tradycyjne oznaczenie na wartość tej funkcji dla argumentu n, czyli x(n). Zatem f (xn )
to inaczej wartość złożenia f ◦ x dla argumentu n. Wnosimy stąd, że warunek (ii) wynika natychmiast z warunku (i) na mocy
twierdzenia 4.1.6 o granicy złożenia. Dla dowodu nie wprost implikacji odwrotnej załóżmy, że warunek (ii) zachodzi, ale
warunek (i) nie zachodzi. Wtedy istnieje ε > 0 takie, że dla każdego δ > 0 znajdziemy x ∈ X spełniające warunek x 6= x∗ ,
nierówność %X (x, x∗ ) < δ oraz nierówność %Y (f (x), y∗ ) ε. W szczególności, do δ = n1 możemy dobrać xn ∈ X takie, że
%X (xn , x∗ ) < n1 , xn 6= x∗ oraz %Y (f (xn ), y∗ ) ε. Zatem limn→∞ xn = x∗ . Jednak równocześnie limn→∞ f (xn ) 6= y∗ , co
przeczy założeniu (ii).
Definicja 4.4.2 Niech f : X → Y będzie funkcją odwzorowującą przestrzeń metryczną X w przestrzeń metryczną
Y . Niech x∗ ∈ X będzie punktem skupienia X w X. Definiujemy zbiór punktów granicznych funkcji f w x∗ jako
W dowodzie tego twierdzenia pojawia si˛e sytuacja, w której dla każdej liczby naturalnej n ∈ N mamy ciag.
˛ Mamy zatem ciag ˛ ciagów.
˛ Powstaje problem
jak to zapisać. Indeks dolny tradycyjnie wykorzystywany jest do podania numeru wyrazu ciagu.˛ Nie możemy wi˛ec użyć go do numerowania ciagów.
˛ Z kolei indeks
górny oznacza pot˛eg˛e. Zatem używamy indeksu górnego ale z nawiasami piszac ˛ x(n) na oznaczenie n-tego ciagu.
˛ W ten sposób nie jesteśmy w kolizji z już
(n)
przyj˛etymi konwencjami. Indeks dolny pozostaje w swojej tradycyjnej roli, a wi˛ec pozwala nam zapisać m-ty wyraz ciagu˛ x(n) jako xm . Oczywiście równolegle
dopuszczalny jest zapis funkcyjny, a wi˛ec x(n) (m), który przydaje si˛e szczególnie wtedy, gdy indeksy zaczynaja˛ si˛e pi˛etrzyć.
Dowód: Oznaczmy Limx→x∗ f (x) przez A. Niech {yn } ⊂ A będzie ciągiem zbieżnym do y. Na mocy twierdzenia 3.4.5
wystarczy pokazać, że y ∈ A. Ponieważ yn ∈ A, na mocy definicji zbioru punktów granicznych znajdziemy ciąg x(n) : N → X
(n) (n)
zbieżny do x∗ taki, że limm→∞ xm = x∗ oraz limm→∞ f (xm ) = yn . Zatem dla każdego n ∈ N do ε = n1 znajdziemy kn ∈ N
(n) (n) (n)
takie, że dla m kn mamy %X (xm , x∗ ) ¬ n1 oraz %Y (f (xm ), yn ) ¬ n1 . Niech wn := xkn . Wtedy limn→∞ wn = x∗ oraz
limn→∞ f (wn ) = y, co dowodzi, że y ∈ A.
Uwaga 4.4.4 Zwróćmy uwagę, że Limx→x∗ f (x) = {y∗ } nie gwarantuje istnienia granicy. Na przykład dla ciągu
a : N 3 n 7→ (1 + (−1)n )n ∈ R mamy Limn→∞ an = {0}, ale ciąg ten nie jest zbieżny.
4.5. GRANICA DOLNA I GÓRNA 115
Dowód: Aby pokazać, że (ii) wynika z (i) ustalmy ε > 0 i dobierzmy do niego N ∈ N takie, że dla n N zachodzi
nierówność %(xn , y) < ε. Z kolei z założenia, że limn→∞ kn = ∞ do naszego N możemy dobrać N 0 ∈ N takie, że dla n N 0
zachodzi kn = k(n) > N . Zatem dla n N 0 mamy też %(a(k(n)), y) < ε), co dowodzi (ii). Własność (iii) wynika natychmiast
z (ii), bo silnie rosnący ciąg liczb naturalnych zmierza do nieskończoności. Warunke (iv) jest jedynie przeformułowaniem
warunku (iii), bo podciąg ciągu a, to z definicji podstawienie w ciągu a silnie rosnącego ciągu liczb naturalnych k : N → N.
Pozostaje pokazać, że warunek (iv) implikuje warunek (i). Dla dowodu nie wprost przyjmijmy, że y nie jest granicą
ciągu a. Wtedy znajdziemy ε > 0 takie, że dla dowolnego N ∈ N znajdziemy N 0 ∈ N takie, że %(aN 0 , y) ε. Rekurencyjnie
skonstruujemy silnie rosnący ciąg kN → N taki, że
W tym celu przyjmijmy k1 := 1 i załóżmy, że kn jest już zdefiniowane tak, że warunek (4.17) zachodzi. Z wyboru ε > 0
wiemy, że znajdziemy N 0 > kn takie, że %(aN 0 , y) ε. Wystarczy teraz przyjąć kn+1 := N 0 . Kończy to konstrukcję ciągu k
spełniającego (4.17). Oznacza to, że podciąg a ◦ k nie może być zbieżny do y, co przeczy warunkowi (iv) i kończy dowód.
Twierdzenie 4.4.6 Niech a : N → Y będzie ciągiem w przestrzeni metrycznej Y . Wtedy
Poj˛ecie granicy górnej i dolnej ma sens nawet dla funkcji, która nie jest ograniczona. Wymaga to jednak dopuszczenia −∞ oraz +∞ jako możliwych
punktów granicznych. Od strony formalnej oznacza to rozważanie R jako podzbioru R̄ o której to przestrzeni ze stosownie dobrana˛ metryka˛ da si˛e udowodnić, że
jest zwarta.
Twierdzenie 4.5.2 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = limx→x0 f (x) jest równoważne równości
Twierdzenie 4.5.3 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = lim supx→x0 f (x) jest równoważne koniunkcji
następujących dwóch warunków.
Dowód: (*) Załóżmy najpierw, że a = lim supx→x0 f (x). Niech A := Limx→x0 f (x). Pokażemy, że (4.18) zachodzi. Wprost
z definicji lim supx→x0 f (x) jako kresu górnego zbioru A wnosimy, że w każdym otoczeniu a znajdziemy punkt zbioru A.
Gdyby a ∈ Limx→x0 f (x) nie było prawdą, to w każdym otoczeniu a byłby punkt nie należący do A, a mianowicie punkt
a. Zatem A byłby punktem brzegowym zbioru A. Ponieważ na mocy tw. 4.4.3 zbiór A = Limx→x0 f (x) jest domknięty,
wnosimy, że wtedy a ∈ A, co przeczy przypuszczeniu, że a 6∈ A. Zatem (4.18) zachodzi. Rónież własność (4.19) pokażemy
nie wprost. Przypuśćmy, że istnieje b > a takie, że dla każdego δ > 0 istnieje xδ ∈ X spełniające warunek %(xδ , x0 ) < δ oraz
f (xδ ) b. W szczególności oznacza to, że możemy wybrać ciąg {xn } ⊂ X taki, że lim xn = x0 oraz f (xn ) b. Ponieważ
f jest ograniczona, ciąg o wyrazach f (xn ) przyjmuje wartości w pewnym przedziale domkniętym i ograniczonym, a więc w
zbiorze zwartym. Zatem z ciągu o wyrazach xn można wybrać podciąg taki, że również ciąg o wyrazach f (xn ) jest zbieżny
do pewnego a0 b. Zatem a0 ∈ Limx→x0 f (x) i w konsekwencji a a0 b, co przeczy założeniu a < b.
Dla dowodu nie wprost przeciwnej implikacji załóżmy, że warunki (4.18) i (4.19) zachodzą oraz a 6= lim supx→x0 f (x).
Z (4.18) wynika, że a ¬ lim supx→x0 f (x), zatem a < lim supx→x0 f (x). Tak więc znajdziemy a0 > a, a0 ∈ Limx→x0 f (x).
0
Rozważmy ciąg o wyrazach xn ∈ X zbieżny do x0 i taki, że limn→∞ f (xn ) = a0 . Korzystając z (4.19) dobierzmy do b := a+a 2
liczbę δ > 0 tak, że
a + a0
%(x, x0 ) < δ ⇒ f (x) < .
2
0
Ustalmy N ∈ N takie, że %(xn , x0 ) < δ dla n N . W szczególności dla n N mamy f (xn ) < a+a 2 . Przechodząc do granicy
0
a+a0
dostajemy a0 ¬ a+a
2 . Ale 2 < a 0
, bo a < a0
. Otrzymana sprzeczność dowodzi, że a = lim supx→x0 f (x).
Twierdzenie 4.5.4 Niech f, g : X → R̄ oraz x0 ∈ X 0 . Jeśli istnieje otoczenie V punktu x0 takie, że dla każdego
x ∈ V \ {x0 } mamy f (x) ¬ g(x) to
Dowód: [•] Pokażemy drugą nierówność. Pierwszą dowodzi się analogicznie. Oznaczmy a := lim supx→x0 f (x). Niech
n 7→ xn będzie ciągiem zbieżnym do x0 takim, że ciąg n 7→ f (xn ) zmierza do a. Rozważmy ciąg n 7→ g(xn ). Ponieważ g
jest ograniczona, ciąg ten posiada podciąg zbieżny. Dokładniej, znajdziemy silnie rosnący ciąg N 3 n →
7 kn ∈ N taki, że
4.6. CIĄGŁOŚĆ FUNKCJI 117
ciąg n 7→ g(xkn ) jest zbieżny do b ∈ Limx→x0 g(x). Oczywiście ciąg n 7→ f (xkn ) jako podciąg ciągu zbieżnego również jest
zbieżny. Zatem z twierdzenia 2.5.3 o zachowywaniu nierówności w granicy (dla ciągów) dostajemy
lim sup f (x) = a = lim f (xkn ) ¬ lim g(xkn ) = b ¬ lim sup g(x).
x→x0 n→∞ n→∞ x→x0
Definicja 4.6.1 Mówimy, że f jest ciągła w punkcie x0 ∈ X jeżeli dla każdego ε > 0 istnieje δ > 0 takie, że
Twierdzenie 4.6.2 Funkcja f jest ciągła w x0 wtedy i tylko wtedy gdy zachodzi jeden z następujących dwóch warunków
Dowód: Załóżmy, że f jest ciągła w x0 . Jeśli x0 6∈ X 0 , to (4.21) oczywiście zachodzi. Jeśli x0 ∈ X 0 , to limx→x0 f (x) =
f (x0 ) wynika wprost z definicji ciągłości f w x0 . Dla dowodu implikacji przeciwnej załóżmy, że (4.21) zachodzi. Rozważmy
najpierw przypadek, gdy x0 6∈ X 0 . Wtedy istnieje δ0 > 0 takie, że K(x0 , δ0 ) = {x0 }. Jest ono dobre dla każdego ε > 0,
bo wtedy %(x, x0 ) < δ0 implikuje x = x0 skąd %(f (x), f (x0 )) = %(f (x0 ), f (x0 )) = 0 < ε. Rozważmy z kolei przypadek
gdy x0 ∈ X 0 . Ustalmy ε > 0. Z definicji granicy dobieramy do ε > 0 takie δ > 0, że %(x, x0 ) < δ, x 6= x0 implikuje
%(f (x), f (x0 )) < ε. Niech x ∈ X będzie takie, że %(x, x0 ) < δ. Jeśli x 6= x0 , to nierówność %(f (x), f (x0 )) < ε zachodzi na
mocy wyboru δ. Natomiast dla x = x0 mamy %(f (x), f (x0 )) = %(f (x0 ), f (x0 )) = 0 < ε. Zatem implikacja (4.20) zachodzi.
Twierdzenie 4.6.3 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru otwartego V w Y zbiór
f −1 (V ) jest otwarty w X.
Dowód: [•] Załóżmy najpierw, że f jest ciągła. Niech V będzie zbiorem otwartym w Y . Mamy pokazać, że f −1 (V )
jest zbiorem otwatym w X. Niech x0 ∈ f −1 (V ). Wtedy f (x0 ) ∈ V . Ponieważ V jest otwarty, znajdziemy ε > 0 takie, że
K(f (x0 ), ε) ⊂ V . Ponieważ f jest ciągła, więc jest w szczególności ciągła w punkcie x0 . Zatem dobierzmy δ > 0 takie, że
%(x, x0 ) < δ implikuje %(f (x), f (x0 )) < ε. Pokażemy, że
K(x0 , δ) ⊂ f −1 (V ). (4.22)
Rzeczywiście, jeśli x ∈ K(x0 , δ), to %(x, x0 ) < δ, zatem %(f (x), f (x0 )) < ε, skąd f (x) ∈ K(f (x0 ), ε) ⊂ V . Oznacza to, że
x ∈ f −1 (V ). Pokazaliśmy więc (4.22), co dowodzi, że f −1 (V ) jest otwarty.
Przejdźmy do dowodu implikacji w przeciwną stronę. Ustalmy x0 ∈ X oraz ε > 0. Na mocy tw. 3.2.10 K(f (x0 ), ε)
jest zbiorem otwartym. Zatem f −1 (K(f (x0 ), ε)) jest zbiorem otwartym. Ponieważ oczywiście x0 ∈ f −1 (K(f (x0 ), ε)), więc
znajdziemy δ > 0 takie, że K(x0 , δ) ⊂ f −1 (K(f (x0 ), ε)). Niech x ∈ X będzie takie, że %(x, x0 ) < δ. Wtedy x ∈ K(x0 , δ),
zatem f (x) ∈ K(f (x0 ), ε), skąd dostajemy %(f (x), f (x0 )) < ε.
Twierdzenie 4.6.4 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru domkniętego K w Y
zbiór f −1 (K) jest domknięty w X.
Dowód: (*)Załóżmy, że f jest ciągła, a K ⊂ Y jest domknięty. Z wniosku 3.2.7 wnosimy, że Y \ K jest otwarty. Mamy
X \ f −1 (K) = f −1 (Y \ K), zatem na mocy tw. 4.6.3 zbiór X \ f −1 (K) jest otwarty. Zatem ponownie z wniosku 3.2.7
wnosimy, że f −1 (K) jest domknięty. Dla dowodu implikacji przeciwnej przyjmijmy, że dla każdego zbioru domkniętego K
w Y zbiór f −1 (K) jest domknięty w X. Na mocy tw. 4.6.3 wystarczy pokazać, że dla dowolnego zbioru otwartego V ⊂ Y
zbiór f −1 (V ) jest otwarty w X. Niech V ⊂ Y będzie zbiorem otwartym. Wtedy Y \ V jest domknięty, zatem f −1 (Y \ V )
jest domknięty. Ale f −1 (Y \ V ) = X \ f −1 (V ), zatem f −1 (V ) jest otwarty.
Ćwiczenie 4.6.6 Wyprowadź twierdzenie 4.6.5 z twierdzenia 4.6.2 i z twierdzenia 4.1.6 o granicy złożenia.
Ćwiczenie 4.6.8 Wyprowadź twierdzenie 4.6.7 z twierdzenia 4.6.2 i twierdzeń 4.2.1 oraz 4.2.2 .
4.6. CIĄGŁOŚĆ FUNKCJI 119
Twierdzenie 4.6.9 Niech f : X → R będzie funkcją ciągłą. Jeśli f (x0 ) > 0 dla pewnego x0 ∈ X, to istnieje δ > 0
takie, że dla każdego x ∈ K(x0 , δ) mamy f (x) > 0. Podobnie, jeśli f (x0 ) < 0 dla pewnego x0 ∈ X, to istnieje δ > 0
takie, że dla każdego x ∈ K(x0 , δ) mamy f (x) < 0.
Dowód: Rozważmy przypadek f (x0 ) > 0. Ponieważ V := (0, ∞) jest zbiorem otwartym w R, więc na mocy tw. 4.6.3
U := f −1 (V ) jest również zbiorem otwartym. Oczywiście x0 ∈ U , bo z założenia f (x0 ) > 0. Z otwartości U znajdziemy δ > 0
takie, że K(x0 , δ) ⊂ U . Zatem dla x ∈ K(x0 , δ) mamy f (x) ∈ V co z definicji V oznacza, że f (x) > 0. Dowód dla przypadku
f (x0 ) < 0 jest analogiczny.
pX : X × Y 3 (x, y) 7→ x ∈ X
qX : X × Y 3 (x, y) 7→ y ∈ Y
są ciągłe.
C 3 z 7→ re z ∈ R
C 3 z 7→ im z ∈ R
C 3 z 7→ z ∈ C
są ciągłe.
Definicja 4.6.13 Mówimy, że f ma w x0 nieciągłość pierwszego rodzaju, jeżeli f nie jest ciągła w x0 , ale istnieją
granice jednostronne limx→x− f (x) i limx→x+ f (x). W przeciwnym razie mówimy, że f ma w x0 nieciągłość drugiego
0 0
rodzaju.
Twierdzenie 4.6.14 Funkcja f ma w x0 nieciągłość pierwszego rodzaju wtedy i tylko wtedy gdy limx→x− f (x) 6=
0
limx→x+ f (x) lub limx→x− f (x) = limx→x+ f (x) 6= f (x0 ).
0 0 0
Twierdzenie 4.6.15 Jeśli f : (a, b) → R jest funkcją słabo rosnącą, to każdy jej punkt nieciągłości jest pierwszego
rodzaju. Ponadto
∀x1 , x2 , x3 ∈ (a, b) x1 < x2 < x3 ⇒ lim+ f (x) ¬ f (x2 ) ¬ lim− f (x). (4.24)
x→x1 x→x3
Dowód: Z tw. 4.2.5 o granicy funkcji monotonicznej wynika istnienie granic jednostronnych, zatem każdy punkt
nieciągłości jest pierwszego rodzaju. Wzory (4.23) i (4.24) wynikają z tw. 4.2.3 o zachowywaniu nierówności w granicy.
Twierdzenie 4.6.16 Niech (a, b) i (c, d) będą otwartymi przedziałami w R i niech f : (a, b) → (c, d) będzie malejącą
lub rosnącą bijekcją. Wtedy tak f jak i bijekcja odwrotna f −1 są ciągłe.
Dowód: Rozważmy przypadek gdy f jest rosnąca. Pokażemy najpierw, że f jest ciągła. Dla dowodu nie wprost
przypuśćmy, że istnieje x0 ∈ (a, b) takie, że f nie jest ciągła w x0 . Z twierdzenia 4.6.15 wnosimy, że istnieją granice
α := limx→x− f (x), β := limx→x+ f (x) oraz α < β i (α, β) ⊂ (c, d). Wybierzmy γ ∈ (α, β). Ponieważ f jest bijekcją,
0 0
znajdziemy x1 ∈ (a, b) takie, że f (x1 ) = γ. Jeśli x1 < x0 , to możemy wybrać x̄ ∈ (x1 , x0 ), zatem
co przeczy wyborowi γ. Podobnie, gdy x1 > x0 . Zatem musi być x1 = x0 i γ = f (x0 ). Wybierając γ 0 ∈ (α, β), γ 0 6= γ
i rozumując analogicznie otrzymujemy γ 0 = f (x0 ). Dochodzimy zatem do sprzeczności z założeniem, że f jest funkcją.
Pokazaliśmy zatem, że f jest ciągła. Zauważmy, że f −1 : (c, d) → (a, b) jest również bijekcją. Pokażemy, że jest ona również
rosnąca. Rzeczywiście, gdyby tak nie było, znaleźlibyśmy y1 , y2 ∈ (c, d) takie, że y1 < y2 i f −1 (y1 ) > f −1 (y2 ). Połóżmy
x1 := f −1 (y1 ) oraz x2 := f −1 (y2 ). Wtedy f (x1 ) = y1 < y2 = f (x2 ) oraz x1 > x2 co przeczy założeniu, że f jest rosnąca.
Zatem f −1 spełnia te same założenia, co f . Oznacza to, że również jest ciągła.
Dowód dla f malejącej jest analogiczny, więc go pomijamy.
4.7. CIĄGŁOŚĆ, A ZWARTOŚĆ 121
Twierdzenie 4.7.1 Jeśli f jest ciągła, a A ⊂ X jest zwarty, to f (A) jest zwarty.
Dowód: [•] Niech E ⊂ f (A) będzie podzbiorem nieskończonym. Do każdego e ∈ E ustalmy punkt ae ∈ A taki, że
f (ae ) = e. Niech E 0 := { ae | e ∈ E }. Zauważmy, że jeśli ae1 = ae2 , to e1 = f (ae1 ) = f (ae2 ) = e2 . Tak więc, e1 6= e2
implikuje ae1 6= ae2 . Jest tak dla dowolnych ae1 , ae2 ∈ E 0 . Zatem zawężenie f|E 0 : E 0 → E jest różnowartościowe. Oczywiście
E 0 jest również zbiorem nieskończonym. Ponieważ A jest zwarty, znajdziemy punkt skupienia x zbioru E 0 należący do A.
Ze względu na różnowartościowość f|E 0 bez utraty ogólności możemy przyjąć, że
bo jeśli nawet punkt x0 ∈ E 0 spełniający (4.25) istnieje, to co najwyżej jeden. Gdy go z E 0 usuniemy, zbiór E 0 nadal będzie
nieskończony i x nadal będzie jego punktem skupienia.
Pokażemy, że f (x) ∈ f (A) jest punktem skupienia zbioru E. W tym celu ustalmy ε > 0. Z ciągłości funkcji f znajdziemy
δ > 0 takie, że %(x0 , x) < δ implikuje %(f (x0 ), f (x)) < ε. Ponieważ x jest punktem skupienia zbioru E 0 znajdziemy x0 ∈
E 0 ∩K(x, δ)\{x}. Zatem f (x0 ) ∈ E ∩K(f (x), ε). Ponadto f (x0 ) 6= f (x) na mocy (4.25). Ponieważ ε > 0 ustaliliśmy dowolnie,
dowodzi to, że f (x) jest punktem skupienia zbioru E leżącym w f (A).
Twierdzenie 4.7.3 Niech X będzie przestrzenią zwartą, a f : X → R funkcją ciągłą. Wtedy f (X) jest zbiorem
ograniczonym. W szczególności m := inf f (X) i M := sup f (X) są dobrze określone, a ponadto istnieją p, q ∈ X takie,
że f (p) = m i f (q) = M .
Dowód: [•] Niech A := f (X) ⊂ R. Zatem M = sup A. Z tw. 4.7.1 wnosimy, że A jest zwarty, zatem z tw. 3.6.6
dostajemy, że A jest domknięty. Z definicji kresu górnego wiemy, że istnieje ciąg a : N → A taki, że limn→∞ an = M . Zatem
z tw. 3.4.5 wnosimy, że M ∈ A. Z definicji zbioru A mamy więc, że M = f (q) dla pewnego q ∈ X. Dowód dla kresu dolnego
jest analogiczny.
Twierdzenie 4.7.4 Jeśli f : X → Y jest ciągłą bijekcją, a X jest zwarty, to f −1 jest ciągłe.
122 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI
Dowód: [•] Niech A ⊂ X będzie zbiorem domkniętym. Wtedy, na mocy twierdzenia 3.6.7 zbiór A jest zwarty. Zatem
z tw. 4.7.1 zbiór f (A) jest zwarty, a więc z tw. 3.6.6 jest domknięty. Ale (f −1 )−1 (A) = f (A), zatem przeciwobraz w f −1
zbioru domkniętego jest zbiorem domkniętym. Tak więc na mocy tw. 4.6.4 odwzorowanie f −1 jest ciągłe.
jest ciągłe.
Dowód: Wiemy, że odwzorowanie f : R∗ 3 y 7→ y n ∈ R∗ jest ciągłe. Niech Ka := [0, a]. Z tw. 4.7.4 odwzorowanie
−1 −1
jest ciągłe. Mamy f −1 = a∈R∗ f|Ka , zatem f −1 jest ciągłe, bo jest ciągłe w otoczeniu każdego punktu. Ale f −1 to
S
f|K a
dokładnie odwzorowanie (4.26).
Definicja 4.8.1 Funkcja f : X → Y jest jednostajnie ciągła wtedy i tylko wtedy gdy
1.0
0.8
0.6
0.4
0.2
Rysunek 4.2: Przy ustalonym ε > 0 (czerwone odcinki na osi pionowej) do zadanego punktu x ∈ R istnieje δx > 0 takie,
że (4.20) zachodzi. Jednak dla różnych x ∈ R nawet przy ustalonym ε > 0 wartości δx mogą być różne. Co więcej, może
się zdarzyć, tak jak w przypadku funkcji x 7→ x2 , że inf { δx | x ∈ R } = 0. Wtedy nie da się dobrać jednego uniwersalnego
δ > 0 dobrego dla wszystkich x ∈ R. O takiej funkcji mówimy, że nie jest jednostajnie ciągła.
124 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI
Przykład 4.8.2 Funkcja
R 3 x 7→ x2 ∈ R∗
jest ciągła, jednak nie jest jednostajnie ciągła. Aby√pokazać, że nie jest√jednostajnie ciągła weźmy ε := 1. Dla δ > 0
rozważmy n ∈ N takie, że √1n < δ. Połóżmy xn := n + √1n oraz yn := n. Mamy |xn − yn | = √1n < δ oraz
√ 1 √ 1 1
|x2n − yn2 | = ( n + √ )2 − ( n)2 = n + 2 + − n = 2 + > 1.
n n n
Twierdzenie 4.8.4 Jeśli f : X → Y jest ciągła, a X jest przestrzenią zwartą, to f jest jednostajnie ciągła.
Dowód: [•] Dowód poprowadzimy nie wprost. Przypuśćmy, że f nie jest jednostajnie ciągła. Wtedy znajdziemy ε > 0
taki, że dla każdego δ > 0, w szczególności dla każdego n ∈ N i δn = n1 istnieją punkty xn , yn ∈ X takie, że
1
0 ¬ %X (xn , yn ) < (4.27)
n
oraz
%Y (f (xn ), f (yn )) ε. (4.28)
Ponieważ X jest zwarta, ciągi o wyrazach xn , yn posiadają podciągi zbieżne. Aby nie mnożyć oznaczeń przyjmijmy, że są to
ciągi xn , yn zbieżne odpowiednio do x∗ i y∗ . Przechodząc w (4.27) do granicy z twierdzenia o trzech ciągach (twierdzenie 2.5.4
) dostajemy %X (x∗ , y∗ ) = 0. Zatem x∗ = y∗ z definicji metryki. Z twierdzenia 4.4.1 wnosimy, że ciągi f (xn ) i f (yn ) są
zbieżne do f (x∗ ). Zatem dla 2ε znajdziemy N ∈ N takie, że dla n N
ε ε
%Y (f (xn ), f (yn )) ¬ %Y (f (xn ), f (x∗ )) + %Y (f (x∗ ), f (yn )) < + = ε,
2 2
co przeczy własności (4.28) i dowodzi twierdzenia.
Definicja 4.8.5 f : X → Y jest funkcją Lipschitza jeżeli istnieje stała L > 0 taka, że
Twierdzenie 4.8.6 Jeśli f : X → Y jest funkcją Lipschitza, to jest funkcją jednostajnie ciągłą.
Dowód: ćwiczenie.
4.9. CIĄGŁOŚĆ, A SPÓJNOŚĆ 125
Rysunek 4.3: Funkcja jednostajnie ciągła, która nie jest funkcją Lipschitza
Przykład 4.8.7 Funkcja C 3 x 7→ |x| ∈ R∗ jest funkcją Lipschitza dla L = 1. Rzeczywiście, mamy
skąd dostajemy
|x| − |y| ¬ |x − y| oraz |y| − |x| ¬ |x − y|.
Zatem
||x| − |y|| ¬ |x − y|.
Twierdzenie 4.9.1 Niech f : X → Y będzie odwzorowaniem ciągłym. Jeśli E ⊂ X jest spójny, to f (E) jest zbiorem
spójnym.
Dowód: [•] Dla dowodu nie wprost przyjmijmy, że A, B ⊂ Y są otwarte i rozłączne oraz f (E) ⊂ A ∪ B, f (E) ∩ A 6= ∅,
f (E) ∩ B 6= ∅. Połóżmy A0 := f −1 (A), B 0 := f −1 (B). Z ciągłości f i tw. 4.6.3 wynika, że A0 oraz B 0 są otwarte w X.
Mamy
A0 ∩ B 0 = f −1 (A) ∩ f −1 (B) = f −1 (A ∩ B) = ∅,
E ⊂ f −1 (f (E)) ⊂ f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B) = A0 ∪ B 0 .
Niech y ∈ f (E) ∩ A. Zatem y = f (x) dla pewnego x ∈ E takiego, że f (x) ∈ A. Zatem x ∈ E ∩ f −1 (A) = E ∩ A0 , co dowodzi,
że E ∩ A0 6= ∅. Podobnie dowodzimy, że E ∩ B 0 6= ∅. Zatem E nie jest spójny, co przeczy założeniu.
Wniosek 4.9.2 Jeśli a, b ∈ R, a < b i f : [a, b] → R jest odwzorowaniem ciągłym, to f ([a, b]) jest przedziałem
domkniętym i ograniczonym.
126 ROZDZIAŁ 4. GRANICA I CIĄGŁOŚĆ FUNKCJI
Dowód: [•] Na mocy wniosku 3.5.3 i twierdzenia 4.9.1 f ([a, b]) jest zbiorem spójnym, a więc przedziałem. Na mocy
twierdzenia 3.6.8 przedział [a, b] jako zbiór domknięty i ograniczony jest zbiorem zwartym. Zatem z twierdzenia 4.7.1
zbiór f ([a, b]) jest również zwarty, a więc i domknięty i ograniczony. W takim razie f ([a, b]) jest domkniętym i ograniczonym
przedziałem.
Twierdzenie 4.9.3 (własność Darboux) Jeśli a, b ∈ R, a < b, f : [a, b] → R jest odwzorowaniem ciągłym oraz
f (a) < f (b) to dla każdego c ∈ [f (a), f (b)] istnieje ξ ∈ [a, b] takie, że f (ξ) = c.
Dowód: [•] Na mocy wniosku 4.9.2 mamy f ([a, b]) = [p, q] dla pewnych p, q ∈ R. Ponieważ f (a), f (b) ∈ f ([a, b]) = [p, q],
więc jeśli c ∈ [f (a), f (b)], to c ∈ [p, q] = f ([a, b]). Zatem istnieje ξ ∈ [a, b] takie, że f (ξ) = c.
Własność Darboux zobrazowano na rys. 4.4
Rozdział 5
Szeregi
s26 = 3.141592653589793,
Element xn nazywamy n-tym wyrazem szeregu, a element sn nazywamy n-tą sumą częściową szeregu. Mówimy, że
szereg jest zbieżny, jeżeli ciąg jego sum częściowych jest zbieżny. Jeśli ciąg sum częściowych jest zbieżny, to jego granicę
nazywamy sumą szeregu i oznaczamy
X∞
xi .
i=k
P∞
W praktyce symbolem i=k xi zazwyczaj oznaczamy nie tylko sumę szeregu, co jest sensowne tylko jeśli szereg jest
zbieżny, ale także sam szereg. To czy mamy na myśli szereg, czy jego sumę, rozstrzygamy na podstawie kontekstu.
127
128 ROZDZIAŁ 5. SZEREGI
( ∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k a̧ t ów foremnych
wpisanych w okr a̧ g o s r e d n i c y j e d e n ∗)
P i B y F i e l d [ d_ ] :=
Module [ { s , m, n , a } ,
n = 2;
m = 4 ; ( ∗ I l o sć bok ów w i e l o k a̧ ta , na pocz a̧ t e k kwadrat ∗ )
a = Sqrt [ 2 . ] / 2 ; ( ∗ Bok k o l e j n y c h w i e l o k a̧ t ów ∗ )
s = 2 ; ( ∗ c z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k a̧ t a ∗ )
Do[
Print [ "s[" , n , " ]= " , NumberForm[ s , 1 6 ] ] ;
s = s + m∗ a ∗ ( 1 − Sqrt [ 1 − a ∗ a ] ) ;
a = Sqrt [ 2 − Sqrt [ 4 − 4∗ a ∗ a ] ] / 2 ;
m = m∗ 2 ;
n = n + 1,
{d}
];
s
]
Listing 5.1: Wyznaczenie ciągu przybliżeń liczby π w języku Mathematica w oparciu o pola wielokątów
zwanym szeregiem harmonicznym, można pokazać, że nie jest zbieżny w sensie definicji Cauchy’ego.
Wspomnijmy, że nazwa szeregu harmonicznego bierze si˛e z poj˛ecia składowej harmonicznej drgajacej
˛ struny. Struna drga wydajac
˛ dźwi˛ek zbudowany z fal o
długościach b˛edacych
˛ ułamkiem o liczniku jeden długości struny (patrz rys. 5.1 ).
Przyjrzymy si˛e bliżej szeregowi harmonicznemu. Pogrupujmy wyrazy szeregu harmonicznego w porcje kolejno po jeden, dwa, cztery itd.
∞
1 1 1 1 1 1 1
X
=1+ + + + + + + ...
n=1
n 2 3 4 5 6 7
T0 := 1
1 1
T1 := +
2 3
1 1 1 1
T2 := + + +
4 5 6 7
1 1 1 1 1 1 1 1
T3 := + + + + + + +
8 9 10 11 12 13 14 15
... ...
2k+1
X−1 1
Tk := .
k
n
n=2
5.1. POJĘCIE SZEREGU 129
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ P i B y F i e l d . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k a̧ t ów foremnych ∗/
/∗ wpisanych w okr a̧ g o p r o m i e n i u j e d e n ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
i n t m=4; /∗ I l o sć bok ów w i e l o k a̧ ta , na pocz a̧ t e k kwadrat . ∗/
/∗ Bok k o l e j n y c h w i e l o k a̧ t ów wpisanych w ko ł o o s r e d n i c y j e d e n .
Na pocz a̧ t e k bok kwadratu ∗/
double a=s q r t ( 2 . 0 ) / 2 ;
/∗ Zmienna s z a w i e r a c z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k a̧ t a .
Zaczynamy od kwadratu , kt ó ry ma p o l e 1 / 2 . ∗/
double s =2;
i n t nmax=30;
f o r ( i n t n=2;n<nmax ; n=n+1){
c o u t << " s[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << s ;
c o u t << e n d l ;
/∗ C z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k a̧ t a
p r z y r a s t a o c z t e r o k r o t n e p o l e m t r ók a̧ t ów r ó wnobocznych ∗/
s=s+m∗ a∗(1− s q r t (1−a ∗ a ) ) ;
m=m∗ 2 ; /∗ Podwajamy i l o sć bok ów ∗/
a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ; /∗ I wyznaczamy k o l e j n y bok ∗/
}
}
Listing 5.2: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o pola wielokątów
130 ROZDZIAŁ 5. SZEREGI
Na listingach 5.3 i 5.4 przedstawiono program odpowiednio w Mathematica i w C++, który liczy sumy kolejnych
porcji Tk dla szeregu harmonicznego.
Wynik działania programu sugeruje, że sumy te są większe od pewnej stałej c > 0.
Jest tak w istocie, bo
2k+1
X−1 2X−1k+1
1 1 1 1
Tk = = 2k · k+1 = .
n 2k+1 2 2
n=2k k n=2
Ćwiczenie komputerowe 5.1.2 Adaptuj program z listingu 5.3 i/lub listingu 5.4 do prześledzenia zachowania
szeregów
∞ ∞
X 1 X 1
√ i 2
.
n=1
n n=1
n
Co sądzisz na temat ich zbieżności?
5.1. POJĘCIE SZEREGU 131
( ∗ A n a l i z a zachowania s z e r e g u harmonicznego ∗ )
H a r m o n i c S e r i e s [ d_ ] := Module [ { s , n , k } ,
k = 0;
Do[
s = 0.;
n = 2^k ;
( ∗ Obliczamy sumȩ wyraz ów s z e r e g u od 2^k do 2^{ k+1}−1 ∗ )
Do[
s = s + 1./n ;
n = n + 1,
{2^ k}
];
Print [ "T[" , k , " ]= " , NumberForm[ s , 1 6 ] ] ;
k = k + 1,
{d}
];
]
P2k+1 −1
Listing 5.3: Obliczanie sumy n=2k
1
n w Mathematica
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ H a r m o n i c S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ A n a l i z a zachowania s z e r e g u harmonicznego ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
P∞
Twierdzenie 5.2.1 Szereg i=k xi o wyrazach w ciele F jest zbieżny wtedy i tylko wtedy gdy
m
X
∀ε > 0∃N ∈ Nk ∀m n N | xi | < ε.
i=n
Dowód: [•] Własność ta oznacza, że ciąg sum częściowych szeregu spełnia warunek Cauchy’ego. Zatem teza wynika z
zupełności przestrzeni R lub C.
P∞
Wniosek 5.2.2 Jeśli szereg n=1 xn jest zbieżny, to limn→∞ xn = 0.
P∞
Przykład 5.2.3 Rozważmy szereg n=0 3n+2 .
2n−1
Mamy
2n − 1 2− 1
2
lim = lim n
=
n→∞ 3n + 2 n→∞ 3 + 2 3
n
P∞
Zatem warunek konieczny zbieżności nie jest spełniony, czyli szereg 2n−1
n=0 3n+2 nie jest zbieżny.
P∞ P∞
Definicja 5.2.4 Szereg i=k xi nazywamy bezwzględnie zbieżnym, jeżeli szereg i=k |xi | jest zbieżny.
P∞
Twierdzenie 5.2.5 Jeśli szereg i=k xi jest bezwzględnie zbieżny to jest zbieżny oraz
∞
X ∞
X
| xi | ¬ |xi |.
i=k i=k
Dowód: [•] Ponieważ ciąg sum częściowych dla szeregu wartości bezwzględnych spełnia warunek Cauchy’ego, więc, jak
łatwo sprawdzić, również ciąg sum częściowych wyjściowego szeregu spełnia ten warunek i teza wynika z zupełności R lub
C.
P∞
Definicja 5.2.6 Niech a, q ∈ C, a 6= 0. Szereg n=0 aq n , nazywamy szeregiem geometrycznym.
5.1. POJĘCIE SZEREGU 133
Twierdzenie 5.2.7 Szereg geometryczny jest zbieżny gdy |q| < 1. W przeciwnym razie jest on rozbieżny.
Uwaga 5.2.8 Ciąg sum częściowych jest słabo rosnący gdy jego wyrazy są nieujemne, a silnie rosnący gdy są dodatnie.
Co więcej, jeśli wyrazy są nieujemne, a szereg jest zbieżny, to
∞
X
an = sup { sm | m ∈ N }.
n=0
Dowód: [•] Ponieważ sk+1 = sk + ak+1 dostajemy sk+1 sk gdy ak 0 oraz sk+1 > sk gdy ak > 0. Dowodzi to
pierwszej części uwagi. Druga wynika natychmiast z twierdzenia 2.5.6 .
P∞
Uwaga 5.2.9 Jeśli n=0 an jest zbieżnym szeregiem o wyrazach dodatnich, to jego suma jest silnie większa od każdego
z jego wyrazów, czyli dla każdego k ∈ N mamy
X∞
an > ak .
n=0
P∞
Dowód: [•] Niech n=0 an będzie zbieżnym szeregiem o wyrazach dodatnich. Dla k ∈ N na mocy uwagi 5.2.8 mamy
∞
X
ak ¬ sk < sk+1 ¬ an .
n=0
co kończy dowód.
P∞
Twierdzenie 5.2.10 Niech a : N → R będzie ciągiem o wyrazach nieujemnych. Szereg n=1 an jest zbieżny wtedy i
tylko wtedy gdy jego ciąg sum częściowych jest ograniczony.
134 ROZDZIAŁ 5. SZEREGI
P∞
Dowód: [•] Z uwagi 5.2.8 wiemy, że ciąg sum częściowych szeregu n=1 an jest ciągiem słabo rosnącym. Jeśli jest
więc ograniczony, to na mocy twierdzenia 2.5.6 jest zbieżny. Na odwrót, załóżmy, że ciąg sum częściowych jest zbieżny do
liczby s ∈ R. Ustalmy k ∈ N i rozważmy m ∈ N takie, że k ¬ m. Wtedy, znów na mocy uwagi 5.2.8
sk ¬ sm . (5.1)
Lewa strona nierówności (5.1) nie zależy od m, zatem przechodząc w niej z m do nieskończoności przy ustalonym k dostajemy
sk ¬ s. (5.2)
Nierówność ta jest prawdziwa dla dowolnego k ∈ N. Dowodzi to, że ciąg sum częściowych jest ograniczony.
Twierdzenie 5.2.11 (Kryterium porównawcze) Jeśli ciągi a, b : Nk → R mają wyrazy nieujemne i istnieje N ∈ N
takie, że an ¬ bn dla n N , to:
P∞ P∞
(i) jeśli n=k bn jest zbieżny, to n=k an jest zbieżny,
P∞ P∞
(ii) jeśli n=k an jest rozbieżny, to n=k bn jest rozbieżny.
P∞
Przykład 5.2.12 Rozważmy szereg n=0 n2 +1 .
2n
Mamy
2n 2
lim = lim n
= 0.
n→∞ n2 + 1 n→∞ 1 + 12
n
P∞
Zatem warunek konieczny zbieżności jest spełniony. Jednak szereg n=0 n22n
+1 nie jest zbieżny, bo jak łatwo sprawdzić
zachodzi n2 +1 n dla n 1. Ponieważ szereg harmoniczny jest rozbieżny, z kryterium porównawczego wynika, że
2n 1
P∞
szereg n=0 n22n+1 jest również rozbieżny.
P∞ P∞
Wniosek 5.2.13 Niech n=k zn będzie szeregiem liczb zespolonych, a n=k xn zbieżnym szeregiem liczb rzeczywi-
P∞
stych. Jeśli istnieje N ∈ N takie, że |zn | ¬ xn dla n N , to szereg n=k zn jest bezwzględnie zbieżny.
5.3. KRYTERIA ZBIEŻNOŚCI 135
b : N0 3 n 7→ 2n a2n ∈ R+ .
P∞ P∞
Wtedy zbieżność szeregu n=1 an jest równoważna zbieżności szeregu n=0 bn .
sn := a1 + a2 + a3 + · · · + an
tn := a1 + 2a2 + 22 a4 + · · · + 2n a2n .
Pokażemy nierówności
sn ¬ tn , (5.5)
tn ¬ 2s2n . (5.6)
sn ¬ a1 + a2 + a3 + · · · + a2n −1
= a1 + (a2 + a3 ) + (a4 + a5 + a6 + a7 ) + · · · + (a2n−1 + a2n−1 +1 + · · · + a2n −1 )
¬ a1 + 2a2 + 4a4 + · · · + 2n−1 a2n−1
< tn ,
s2n = a1 + a2 + a3 + · · · + a2n
= a1 + a2 + (a3 + a4 ) + (a5 + a6 + a7 + a8 ) + · · · + (a2n−1 +1 + a2n−1 +2 + · · · + a2n )
a1
+ a2 + 2a4 + · · · + 2n−1 a2n
2
tn
= ,
2
P∞
co dowodzi (5.6).
P∞Zatem ciąg sum częściowych szeregu n=1 an jest ograniczony wtedy i tylko wtedy gdy ciąg sum częścio-
wych szeregu n=0 bn jest ograniczony. Tak więc teza wynika z twierdzenia 5.2.10 .
P∞
Wniosek 5.3.2 Szereg 1
n=1 np jest zbieżny dla p > 1, a rozbieżny dla p ¬ 1.
P∞
P∞ (*)Na mocy twierdzenia 5.3.1 zbieżność szeregu n=1 an o wyrazach an = jest równoważna zbieżności
1
Dowód: np
szeregu n=1 bn o wyrazach
n
1 1
bn = 2n
= ,
(2n )p 2p−1
a więc szeregu geometrycznego o ilorazie q = 2p−1
1
. Na mocy twierdzenia 5.2.7 szereg geometryczny o ilorazie q jest zbieżny
wtedy i tylko wtedy gdy |q| < 1 co dla naszego q jest spełnione gdy p > 1.
136 ROZDZIAŁ 5. SZEREGI
2m−1
X ∞
X 2m
X
(−1)n an ¬ (−1)n an ¬ (−1)n an . (5.7)
n=0 n=0 n=0
Pm P∞
Dowód: Dla n ∈ N niech sm := n=0 (−1)n an oznacza m-tą sumę częściową szeregu n=0 (−1)n an . Przeanalizujemy
oddzielnie zbieżność sum częściowych o parzystej i nieparzystej liczbie składników. Mamy s2n = s2n−2 −(a2n−1 −a2n ) ¬ s2n−2
oraz s2n−1 = s2n−3 + (a2n−2 − a2n−1 ) s2n−3 zatem ciąg n 7→ s2n jest nierosnący, a ciąg ciąg n 7→ s2n−1 jest niemalejący.
Mamy też
Wtedy:
P∞
(i) jeśli α < 1 to n=0 an jest zbieżny,
P∞
(ii) jeśli α > 1 to n=0 an jest rozbieżny,
Dowód: Aby pokazać (i) załóżmy, że α < 1 i ustalmy γ ∈ (α, 1). Z twierdzenia Pn 4.5.3 znajdziemy N ∈ N takie, że
|an | <Pγ dla n N . Zatem również |an | < γ n dla n N . Ponieważ γ < 1, szereg i=0 γ n jest zbieżny. Tak więc zbieżność
pn
∞
szeregu n=0 an wynika z kryterium porównawczego (twierdzenia 5.2.11 ).
5.3. KRYTERIA ZBIEŻNOŚCI 137
Przyjmijmy z kolei, że α > 1. Wtedy znajdziemy podciąg ciągu an zbieżny do granicy większej niż jeden. Oznacza to, że
ciąg an nie jest zbieżny do zera, a więc nie jest spełniony warunek konieczny zbieżności. Dowodzi to własności (ii).
Zwróćmy uwagę, że twierdzenie 5.3.4 nic nie mówi w przypadku gdy α = 1. To dlatego, że w tym przypadku kryterium
to nie pozwala rozstrzygnąć czy szereg jest zbieżny, czy nie.
n7
P∞
Przykład 5.3.5 Rozważmy szereg n=0 7n . Stosując kryterium Cauchy’ego dostajemy
r √
n7 ( n n)7 1
lim = lim = < 1,
n
n→∞ 7n n→∞ 7 7
skąd wnosimy, że szereg jest zbieżny.
|an+1 |
β := lim sup .
n→∞ |an |
Wtedy:
P∞
(i) jeśli β < 1 to n=0 an jest zbieżny,
an+1 P∞
(ii) jeśli istnieje N ∈ N takie, że an > 1 dla n N , to n=0 an jest rozbieżny.
Dowód: Dla dowodu (i) załóżmy, że β < 1 i ustalmy γ ∈ (β, 1). Z twierdzenia 4.5.3 znajdziemy N ∈ N takie, że
am+1
| | < γ dla m N. (5.8)
am
138 ROZDZIAŁ 5. SZEREGI
zn
P∞
Przykład 5.3.7 Szereg n=0 n! jest zbieżny dla dowolnego z ∈ C. Wynika to natychmiast z kryterium d’Alamberta,
ponieważ
n+1
z
| (n+1)! | |z|
lim sup = lim sup = 0.
n+1
n
n→∞ | zn! | n→∞
P∞ 7n (n!)2
Przykład 5.3.8 Rozważmy szereg n=0 (2n)! . Stosując kryterium d’Alamberta dostajemy
7n+1 ((n+1)!)2
(2(n+1))! 7(n + 1)2 7n + 7 7
lim = lim = lim = > 1,
n→∞ 7n (n!)2 n→∞ (2n + 1)(2n + 2) n→∞ 4n + 2 4
(2n)!
P∞
będzie szeregiem potęgowym, α := lim supn→∞
n
p
Twierdzenie 5.3.10 Niech n=0 cn z
n
|cn |, a
α gdy 0 < α < ∞,
1
R := 0 gdy α = ∞,
∞ gdy α = 0.
P∞ n
Wtedy szereg n=0 cn z jest zbieżny dla |z| < R, a rozbieżny dla |z| > R. Kryterium nie rozstrzyga zbieżności gdy
|z| = R.
P∞
Dowód: Do sprawdzenia zbieżności szeregu n=0 cn z n zastosujmy twierdzenie 5.3.4 (kryterium Cauchy’ego). Mamy
lim sup n |cn z n | = lim sup n |cn | · |z| = α|z|.
p p
n→∞ n→∞
Zatem szereg jest zbieżny gdy α|z| < 1 co jest równoważne |z| < R i rozzbieżny gdy α|z| > 1 co jest równoważne |z| > R.
5.4. OPERACJE NA SZEREGACH 139
zn
P∞
(ii) Dla n=0 n! promień zbieżności R = ∞,
P∞
(iii) Dla n=0 z n promień zbieżności R = 1 i szereg rozbieżny gdy |z| = 1,
zn
P∞
(iv) Dla n=1 n promień zbieżności R = 1
zn
P∞
(v) Dla n=1 n2 promień zbieżności R = 1 i szereg zbieżny gdy |z| = 1.
P∞ P∞ P∞ P∞
Twierdzenie 5.4.1 Jeśli n=0 an i n=0 bn są zbieżne, to zbieżne są też szeregi n=0 (an + bn ) i n=0 (can ) oraz
zachodzą wzory
∞
X ∞
X ∞
X
(an + bn ) = an + bn ,
n=0 n=0 n=0
∞
X X∞
can = c an .
n=0 n=0
Dowód: Stosowne równości zachodzą dla sum częściowych. Wystarczy więc zastosować do nich twierdzenie 2.5.1 o
granicy sumy i iloczynu ciągów.
P∞ P∞
Definicja 5.4.2 Iloczynem Cauchy’ego szeregów n=0 an i n=0 bn jest szereg
∞ n
!
X X
ak bn−k ,
n=0 k=0
P∞ Pn
a więc szereg n=0 cn , którego n-ty wyraz wynosi cn := k=0 ak bn−k .
140 ROZDZIAŁ 5. SZEREGI
Jak zobaczymy w rozdziale 6.1 , poniższe twierdzenie nie jest sztuka˛ dla sztuki, ale ma ważne konsekwencje w badaniu własności zespolonej funkcji
wykładniczej, a w konsekwencji również własności funkcji trygonometrycznych.
P∞ P∞
Twierdzenie 5.4.3 Jeśli szeregi n=0 an i n=0 bn są zbieżne i przynajmniej jeden z nich jest zbieżny bezwzględnie,
to iloczyn Cauchy’ego tych szeregów jest zbieżny i zachodzi wzór
∞ ∞
! ∞ !
X X X
cn = an bn . (5.9)
n=0 n=0 n=0
P∞ P∞
Dowód: Dla ustalenia uwagi przyjmijmy, że to szereg n=0 an jest bezwzględnie zbieżny i połóżmy α := n=0 |an |.
Ponadto przyjmijmy oznaczenia
m
X m
X m
X
Am := an , Bm := bn , Cm := cn
n=0 n=0 n=0
oraz
A := lim Am , B := lim Bm , βm := Bm − B.
m→∞ m→∞
Mamy
Cm = c0 + c1 + c2 + · · · + cm (5.10)
= a0 b0 + (a0 b1 + a1 b0 ) + (a0 b2 + a1 b1 + a2 b0 ) + · · · + (a0 bm + a1 bm−1 + · · · + am b0 ) (5.11)
= a0 Bm + a1 Bm−1 + · · · + am B0 (5.12)
= a0 (B + βm ) + a1 (B + βm−1 ) + · · · + am (B + β0 ) (5.13)
= Am B + a0 βm + a1 βm−1 + · · · + am β0 (5.14)
= Am B + γ m , (5.15)
gdzie
γm := a0 βm + a1 βm−1 + · · · + am β0 . (5.16)
Pokażemy, że limm→∞ γm = 0. W tym celu ustalmy ε > 0. Ponieważ limm→∞ βm = 0, więc znajdziemy N ∈ N takie, że dla
n N jest |βn | < ε. Przy tak ustalonych ε > 0 oraz N ∈ N i przyjmując dla m N oznaczenia
|γm | ¬ ξm + ζm . (5.19)
P∞
Z założenia bezwzględnej zbieżności szeregu n=0 |an | i warunku koniecznego zbieżności szeregu mamy limk→∞ |ak | = 0.
Zatem dla każdego k ∈ {0, 1, 2, . . . , N }, czyli dla każdego składnika sumy we wzorze (5.17) mamy też limm→∞ |am−k |||βk | =
0. Zauważmy, że dla wszystkich m N liczba składników we wzorze (5.17) pozostaje stała i wynosi N + 1. Zatem z
twierdzenia o granicy sumy ciągów mamy
N
X
lim ξm = lim |am−k ||βk | = 0. (5.20)
m→∞ m→∞
k=0
5.4. OPERACJE NA SZEREGACH 141
Do wyznaczenia granicy ciągu ζm nie możemy zastosować twierdzenia o granicy sumy ciągów, bo liczba składników we
wzorze (5.18) wynosi m P− N i przy m → ∞ rośnie do nieskończoności. Jednak, ponieważ |βm | < ε dla m N , a każda
∞
suma częsciowa szeregu n=0 |an | szacuje się przez sumę tego szeregu, którą oznaczyliśmy przez α, dla m N dostajemy
ζm ¬ αε, co oznacza, że liczba αε jest majorantą zbioru punkktów granicznych ciągu o wyrazach ζm . Zatem z definicji
granicy górnej wnosimy, że dla każdego ε > 0 zachodzi
lim |γm | = 0,
m→∞
P∞
Twierdzenie 5.4.5 Załóżmy, że szereg i=0 ai jest zbieżny, ale nie jest bezwzględnie zbieżny. Wtedy dla dowolnych
P∞
α, β ∈ R spełniającyh α ¬ β istnieje bijekcja k : N → N taka, że dla ciągu sum częściowych sn permutacji j=0 aij
P∞
szeregu i=0 ai zachodzi lim inf i→∞ sn = α oraz lim supi→∞ sn = β.
|ai | + ai
pi := = max(0, ai ),
2
|ai | − ai
qi := = max(0, −ai )
2
P∞ P∞
i zauważmy, że pi 0, qi 0, pi − qi = ai , pi + qi = |ai |. Szeregi
P∞ i i
i=0 pP i=0 qiPnie mogą być oba zbieżne, bo w
∞ ∞
przeciwnym razie, na mocy twierdzenia 5.4.1 , również szereg i=0 |ai | = i=0 pi + i=0 qi byłby zbieżny, co przeczy
PN PN PN
założeniu.
P∞ PPonieważ dla sum częsciowych mamy równość, i=0 ai = pi + i=0 qi , więc gdyby jeden z szeregów
i=0 P
∞ ∞
pi ,
i=0 P i=0 P q i był zbieżny, to zbieżny byłby również ten drugi, bo szereg i=0 ai jest z założenia zbieżny. Zatem oba
∞ ∞
szeregi i=0 pi , i=0 qi są rozbieżne i to do nieskończoności, bo mają wyrazy nieujemne.
142 ROZDZIAŁ 5. SZEREGI
P∞ P∞
Rozważmy
P∞ teraz szeregi
P∞ i=0 Pi oraz i=0 Qi otrzymane poprzez opuszczenie wyrazów o wartości zero odpowiednio w
szeregach i=0 pi oraz i=0 qi . Oczywiście oba te szeregi są również rozbieżne do nieskończoności. Skonstruujemy rekuren-
cyjnie ciągi m, n : N → N przyjmując
Pj
m1 := min { j ∈ N | i=0 Pi > β },
Pm1 Pj
n1 := min { j ∈ N | i=0 Pi − i=0 Qi < α },
Pm1 Pn1 Pm2 Pn2 Pj
mk+1 := min { j ∈ N | i=0 Pi − i=0 Qi + i=m 1 +1
Pi − i=n 1 +1
Qi + . . . + i=mk +1 Pi > β },
Pm1 Pn1 Pm2 Pn2 Pj
nk+1 := min { j ∈ N | i=0 Pi − i=0 Qi + i=m 1 +1
Pi − i=n 1 +1
Qi + . . . − i=nk +1 Qi < α }.
ponieważ wyrazy ai dla i ∈ IN występują w obu sumach i w efekcie się redukują. Przechodząc w otrzymanej nierówności z n
do
P∞nieskończoności wnosimy, że każdy punkt graniczny ciągu sn leży nie dalej niż ε od P
0
granicy ciągu sn , czyli sumy szeregu
∞
i=1 ai . Ponieważ ε > 0 P
jest dowolnie ustalone, oznacza to, że szereg spermutowany i=1 a0i jest również zbieżny i to do
∞
tej samej sumy co szereg i=1 ai .
Na przykład
Sum[1/n!, {n, 2, Infinity}]
P∞ 1
zwraca n=2 n! = −2 + e. Oznacza to, że Mathematica, w miarę swoich umiejętności, stara się zwrócić wynik dokładny,
używając symbolicznych oznaczeń na stałe matematyczne.
144 ROZDZIAŁ 5. SZEREGI
Rozdział 6
W rozdziale tym wracamy do tematu, który nieformalnie podj˛eliśmy w rozdziale 2.6.3 . Przypomnijmy, że naszkicowaliśmy tam jak rozszerzyć definicj˛e pot˛egi
an z przypadku wykładnika n ∈ N na przypadek wykładnika b˛edacego ˛ dowolna˛ liczba˛ rzeczywista.˛ Podejście bardziej intuicyjne, ale też bardziej żmudne w
szczegółach polega na stopniowym poszerzaniu definicji z przypadku wykładnika b˛edacego˛ liczba˛ naturalna˛ najpierw na wykładniki całkowite, potem na wymierne
i na końcu, metoda˛ aproksymacji, na wykładniki rzeczywiste. Teoria szeregów pozwala podać inna,˛ ale jak pokażemy równoważna˛ definicj˛e, która od razu obejmuje
˛ liczbami zespolonymi. Nie definiujemy jednak od razu funkcji wykładniczej x 7→ ax o dowolnej podstawie, lecz funkcj˛e wykładnicza˛ x 7→ ex o
wykładniki b˛edace
podstawie e zdefiniowanej wzorem (2.23). Nast˛enie definiujemy logarytm o podstawie e, a dopiero potem funkcj˛e wykładnicza˛ i logarytm o dowolnej podstawie.
Twierdzenie 6.1.1
∞
X 1
= e.
n=0
n!
P∞ 1
Z twierdzenia 2.6.1Pi wzoru (2.23) wiemy, że limn→∞ tn = e. Z kolei z twierdzenia 5.3.6 wnosimy, że szereg n=0 n! jest
∞
zbieżny. Niech s := n=0 n!
1
oznacza jego sumę. Z definicji sumy szeregu wiemy, że s = limn→∞ sn = s. Naszym celem jest
145
146 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
6.1.2 Funkcja E.
Dla z ∈ C rozważmy szereg
∞
X zn
. (6.3)
n=0
n!
Jest on dobrze określony dla z 6= 0. Dla z = 0 wyrażenie z 0 nie jest dobrze określone, ale w kontekście tego szeregu
przyjmujemy, że wynosi 1, a więc tak samo jak dla z 6= 0. Możemy też uniknąć pytania co rozumiemy przez z 0 dla z = 0
zapisując powyższy szereg w postaci
∞
X zn
1+ . (6.4)
n=1
n!
Łatwo sprawdzić za pomocą kryterium d’Alemberta, że szereg (6.3) jest zbieżny. Z wniosku 5.2.2 dostajemy zatem nastę-
pującą pożyteczną uwagę, która przyda się nam później.
Dowód: Wzór E(0) = 1 dostajemy podstawiając z = 0 w (6.4). Z kolei z twierdzenia 6.1.1 wynika, że E(1) = e.
Dowodzi to własności (i). Aby pokazać (ii) zauważmy, że z twierdzenia 5.4.3 o iloczynie Cauchy’ego szeregów oraz ze wzoru
(2.4) w twierdzeniu 2.1.5 mamy
∞ ∞ ∞ X n ∞ n ∞
X z1n X z2n X z1k z2n−k X 1 X n k n−k X (z1 + z2 )n
E(z1 )E(z2 ) = = = z1 z2 = = E(z1 + z2 ).
n=0
n! n=0 n! n=0
k! (n − k)! n=0 n! k n=0
n!
k=0 k=0
skąd natychmiast wynika własność (iii). Dla dowodu (iv) skorzystamy bezpośrednio z definicji granicy funkcji. W tym celu
ustalmy ε > 0 i przyjmijmy δ := min(1, eε ). Z twierdzenia 5.2.5 , twierdzenia 5.4.1 oraz twierdzenia 6.1.1 dla z ∈ C
spełniającego |z| < δ dostajemy
∞ ∞ ∞ ∞ ∞ ∞
X zn X zn X |z|n X |z|n−1 X 1 X 1
|E(z) − 1| = −1 = ¬ = |z| ¬ |z| < |z| = |z|e ¬ ε.
n=0
n! n=1
n! n=1
n! n=1
n! n=1
n! n=0
n!
Zatem do ε > 0 znaleźliśmy δ > 0 takie, że |z| < δ implikuje |E(z) − 1| < ε, co kończy dowód (iv). Aby pokazać (v)
zauważmy, że z (ii) oraz (iv) mamy
lim E(z) = lim E(z0 )E(z − z0 ) = E(z0 ) lim E(z − z0 ) = E(z0 ) lim E(z − z0 ) = E(z0 ) · 1 = E(z0 )
z→z0 z→z0 z→z0 z−z0 →0
Z kolei twierdzenia 2.7.4 wnosimy, że dla dowolnego m ∈ N zachodzi równość sum częściowych
m m
X zn X zn
= .
n=0
n! n=0
n!
Przechodząc z m do granicy oraz wykorzystując ciągłość sprzężenia (twierdzenie 4.6.10 (v)) dostajemy własność (vi). Aby
n
pokazać (vii) załóżmy najpierw, że x > 0. Wtedy xn! ∈ R+ dla dowolnego n ∈ N, a więc
∞
X xn
E(x) = 1 + > 1.
n=1
n!
148 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Zatem E(x) ∈ R+ również dla x < 0. Z własności (i) wnosimy, że E(0) = 1 ∈ R+ . Zatem E(x) ∈ R+ dla wszystkich x ∈ R,
co kończy dowód (vii).
Definicja 6.1.5 Funkcję E nazywamy zespoloną funkcją wykładniczą. Stosujemy dla niej również tradycyjną notację
∞
X zn
ez := E(z) := ∈ C. (6.8)
n=0
n!
f (1) = e (6.9)
∀x,y∈R f (x + y) = f (x)f (y). (6.10)
Funkcja, o której mówi twierdzenie 6.2.1 zwana jest funkcją wykładniczą o podstawie e. Powszechnie stosowaną notacją
dla f (x) jest ex , a sama funkcja f jest oznaczana
exp : R 3 x 7→ ex ∈ R+ .
Lemat 6.2.2 Jeśli funkcja ciągła f : R → R+ spełnia własności (6.9) i (6.10) to dla każdego m ∈ Z i n ∈ N1 mamy
m √
f( ) = n em . (6.12)
n
Dowód: Zauważmy najpierw, że jeśli f spełnia (6.9) i (6.10) to spełnia też
dla dowolnego n ∈ Z i x ∈ R. Rzeczywiście, z (6.9) i (6.10) mamy e = f (1) = f (1 + 0) = f (1)f (0) = ef (0), zatem f (0) = 1
oraz dla dowolnego x ∈ R mamy f (0 · x) = f (0) = 1 = f (x)0 co dowodzi (6.13) dla n = 0. Załóżmy zatem, że (6.13) zachodzi
dla n = k, gdzie k ∈ N. Z (6.10) i założenia indukcyjnego dostajemy
co kończy dowód (6.13) dla n ∈ N. Jednak (6.13) zacohdzi dla n ∈ Z, bo dla −n przy n ∈ N mamy
m 1 1 √ m √
f( ) = f (m · ) = f ( )m = n e = n em .
n n n
co dowodzi (6.12).
Dowód twierdzenia 6.2.1 Przypuśćmy, że f1 i f2 są dwoma takimi funkcjami. Wtedy obie spełniają założenia lema-
tu 6.2.2 , zatem z (6.12) wnosimy, że dla m ∈ Z i n ∈ N1 mamy
m √ m
f1 ( ) = n em = f2 ( ).
n n
Oznacza to, że f1 i f2 mają jednakowe wartości dla argumentów wymiernych, a więc muszą być równe, bo są ciągłe. Dowodzi
to jednoznaczności. Aby pokazać istnienie przypomnijmy, że zespolona funkcja wykładnicza, a więc funkcja dana wzorem
(6.5), ma wartości dodatnie dla argumentów rzeczywistych na mocy twierdzenia 6.1.3 (vii). Zatem możemy rozważyć funkcję
f : R 3 x 7→ E(x) ∈ R+ .
Na mocy własności (v) twierdzenia 6.1.3 funkcja ta, jako zawężenie funkcji ciągłej, jest ciągła. Z własności (i) oraz (ii)
twierdzenia 6.1.3 wynika, że f ma własności (6.9) i (6.10). Dowodzi to, że funkcja ciągła spełniająca własności (6.9) i (6.10)
istnieje. Co więcej, wprost z definicji funkcji E wynika, że funkcja f spełnia równanie (6.11), bo jest zawężeniem funkcji E
do zbioru liczb rzeczywistych.
150 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Dowód: Własność (i) wynika natychmiast z lematu 6.2.2 , a własność (ii) z własności (vii) twierdzenia 6.1.3 . Aby
pokazać (iii) rozważmy x1 , x2 ∈ R takie, że x1 < x2 . Niech h := x2 − x1 . Wtedy h > 0 i z własności (ii) mamy eh > 1.
Zatem z (6.10) dostajemy
ex2 = ex1 +h = ex1 eh > ex1
co dowodzi, że exp jest silnie rosnąca.
Ze wzoru (6.11) i uwagi 5.2.9 wynika natychmiast, że ex > x dla x > 0. Zatem
lim ex lim x = ∞.
x→∞ x→∞
ln : R+ 3 x 7→ ln x ∈ R.
Z definicji tej wynika w szczególności, że dla dowolnych x ∈ R+ i y ∈ R równość y = ln x jest równoważna równości
x = ey .
Twierdzenie 6.2.5 Funkcja ln ma następujące własności:
(i) jest silnie rosnącą, ciągłą bijekcją,
(ii) ln 1 = 0, ln e = 1,
(iii) dla dowolnych x, y ∈ R+ , n ∈ N, p ∈ N, q ∈ Z+
x √ p
ln(xy) = ln x + ln y, ln = ln x − ln y, ln xn = n ln x, ln q
xp = ln x,
y q
√
a gdy n 6= 0 to również ln n
x= ln x
n ,
Wystarczy więc zauważyć, że sup { ln x | x ∈ R+ } = ∞ oraz inf { ln x | x ∈ R+ } = −∞. Jest tak rzeczywiście, bo dla
dowolnego A ∈ R+ mamy ln eA+1 = A + 1 > A oraz ln e−A−1 = −A − 1 < −A. Dowodzi to własności (iv). Z kolei z
własności (iii) dla p ∈ N, q ∈ Z+ , x ∈ R+ dostajemy
p √
q p √
e q ln x = eln x = q xp ,
co dowodzi (v)
Własność (iii) twierdzenia 6.2.5 może zostać wykorzystana do przyspieszenia r˛ecznie wykonywanych obliczeń arytmetycznych takich jak mnożenie, dzielenie
czy wyciaganie
˛ pierwiastka. Wymaga to jednak metody wyznaczania logarytmu przy ustalonej podstawie (najcz˛eściej 10 lub e) ze stosunkowo dużego zbioru
liczb, co niekoniecznie jest szybkie. Jednak raz policzone moga˛ zostać stablicowane, opublikowane i potem używane przez wiele osób. Zysk polega na tym, że
√
tablicujemy funkcj˛e jednej zmiennej (x 7→ ln x), a nie dwóch zmiennych ((x, y) 7→ x · y , (x, y) 7→ xy , (x, n) 7→ n x). W roku 1516 jedne z pierwszych
tablic logarytmów opracował i opublikował szkocki matematyk John Napier of Merchiston (1550-1617). Niedługo potem wynaleziono suwak logarytmiczny (rys. 6.1
), który, choć mniej dokładny od tablic, pozwalał jeszcze szybciej przeprowadzać obliczenia. Tablice logarytmiczne i suwak logarytmiczny zrewolucjonizowały
obliczenia i istotnie przyczyniły si˛e do post˛epów naukowo-technicznych XVIII, XIX i XX wieku. Dopiero pojawienie si˛e elektronicznych kalkulatorów i komputerów
w drugiej połowie XX wieku spowodowało utrat˛e znaczenia tablic i suwaków.
W programie Mathematica logarytm naturalny z x obliczamy wywołując Log[x].
152 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
R 3 x 7→ ax := ex ln a ∈ R+ .
Dowód poniższego twierdzenia zbierającego najważniejsze własności funkcji wykładniczej o podstawie a ∈ R+ jest
prostym ćwiczeniem.
(iv) dla a > 1 zachodzi limx→∞ ax = ∞, limx→−∞ ax = 0, a dla a < 1 zachodzi limx→∞ ax = 0, limx→−∞ ax = ∞.
Dowód: ćwiczenie.
ln x
loga R+ 3 x 7→ loga x := ∈ R.
ln a
Dowód poniższego twierdzenia zbierającego najważniejsze własności funkcji logarytmicznej o podstawie a ∈ R+ jest
prostym ćwiczeniem.
6.3. FUNKCJE TRYGONOMETRYCZNE 153
x √ loga x √ p
loga (xy) = loga x+loga y, loga = loga x−loga y, loga xn = n loga x, loga n
x= , loga q
xp = loga x
y n q
(iv) dla a > 1 funkcja loga jest rosnąca oraz limx→∞ loga x = ∞, limx→0 loga x = −∞, a dla a < 1 funkcja loga jest
malejąca oraz limx→∞ loga x = −∞, limx→0 loga x = ∞,
Dowód: ćwiczenie.
W programie Mathematica funkcję wykładniczą o podstawie e z x obliczamy wywołując Exp[x], a logarytm naturalny z
x obliczamy wywołując Log[x]. Z kolei funkcję wykładniczą o podstawie a z x obliczamy wywołując Power[a,x] lub a^x,
a logarytm o podstawie a z x obliczamy wywołując Log[a,x].
S1 := { z ∈ C | |z| = 1 }
Dowód: Pokażemy najpierw, że dla dowolnego x ∈ R mamy rzeczywiście eix ∈ S1 . Z własności (iii) twierdzenia 2.7.5
oraz własności (vi) i (ii) twierdzenia 6.1.3 mamy
Zatem |eix | = 1, bo moduł jest liczbą nieujemną. Dowodzi to, że eix ∈ S1 . Pozostaje pokazać, że funkcja dana wzorem (6.14)
jest ciągła. Funkcja ta jest złożeniem funkcji
R 3 x 7→ i · x ∈ C
oraz funkcji
C 3 z 7→ ez ∈ C.
Jest więc ciągła jako złożenie funkcji ciągłych.
154 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
C'
B'
A'
O A B C
Rysunek 6.2: Rysunek obrazuje nawijanie prostej na okrąg.
Funkcj˛e dana˛ wzorem (6.14) określa si˛e cz˛esto mianem nawijania prostej na okrag.
˛ Rysunek 6.2 obrazuje jak to należy rozumieć. Prosta˛ (na rysunku
˛ w punkcie O ) przyklejono do okr˛egu tak, by była do niego styczna w punkcie O . Nast˛epnie rozpocz˛eto owijanie
przedstawiono tylko kawałek półprostej o poczatku
w kierunku przeciwnym do ruchu wskazówek zegara. Punkt A nakleił si˛e na punkt A0 , punkt B nakleił si˛e na punkt B 0 , natomiast punkt C na razie przesunał˛
si˛e do pozycji C 0 . Zostanie doklejony w trakcie dalszego nawijania. Podobnie post˛epujemy z reszta˛ prostej (nie wyrysowana) nawijajac˛ półprosta˛ na lewo od
punktu O w kierunku zgodnym z ruchem wskazówek zegara. Odwzorowanie R 3 x 7→ eix ∈ S1 realizuje analogiczny scenariusz z ta˛ różnica,˛ że punkt
x = 0 zostaje doklejony do punktu na okr˛egu jednostkowym o współrz˛ednych (1, 0), a wi˛ec punkt jednostkowy na osi rzeczywistej. Widać to na wykresie funkcji
R 3 x 7→ z = eix = cos x + i sin x ∈ S1 przedstawionym na rysunku 6.3 .
eix + e−ix
re eix =
2
eix − e−ix
im eix = .
2i
Dowód: Niech a := re eix oraz b := im eix . Wtedy eix = a+bi. Z (6.14) mamy 1 = |eix |. Ale a2 +b2 = |a+bi|2 = |eix |2 = 1,
skąd wnosimy, że a2 ¬ 1 i b2 ¬ 1, czyli re eix = a ∈ [−1, 1] oraz im eix = b ∈ [−1, 1]. Z twierdzenia 2.7.4 (ii) oraz z
twierdzenia 6.1.3 (vi) mamy
eix + eix eix + e−ix
re eix = =
2 2
6.3. FUNKCJE TRYGONOMETRYCZNE 155
Rysunek 6.3: Wykres funkcji R 3 x 7→ z = eix = cos x + i sin x ∈ S1 . Oś oznaczona literą ’x’ to oś argumentów. Przestrzenią
wartości jest wyrysowany na fioletowo okrąg jednostkowy zawarty w płaszczyźnie zespolonej o osiach oznaczonych ’re z’ i
’im z’. W punkcie o współrzędnej x = 0 funkcja przyjmuje wartość (1, 0), a więc liczbę zespoloną o części rzeczywistej jeden
i części urojonej zero. Punkt na wykresie odpowiadający argumentowi x = 0 oznaczono czarną kropką.
Rysunek 6.4: Funkcje trygonometryczne cos i sin jako funkcje długości łuku x uzyskane przez rozłożenie liczby eix na część
rzeczywistą i urojoną.
156 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
i podobnie
eix − eix eix − e−ix
im eix = =
2i 2i
eix + e−ix
cos : R 3 x 7→ re eix = ∈ [−1, 1] (6.15)
2
eix − e−ix
sin : R 3 x 7→ im eix = ∈ [−1, 1]. (6.16)
2i
Na razie nie możemy jeszcze twierdzić, że tak zdefiniowane funkcje cos i sin pokrywaja˛ si˛e z tymi zdefiniowanymi geometrycznie. Jednakże analizujac ˛
własności tych funkcji stopniowo przekonamy si˛e, że sa˛ to te same funkcje. Cz˛eść własności jesteśmy w stanie wychwycić już teraz, ale kluczowa własność, że
długość łuku mi˛edzy punktami 1 i eix na okr˛egu jednostkowym płaszczyzny wynosi dokładnie x zostanie udowodniona dopiero w rozdziale 10.7.1 .
Tradycyjnie wyrażenie (cos x)2 zapisuje się zwięźle jako cos2 x co uwalnia nas od jednej pary nawiasów. Podobnie dla
innych funkcji trygonometrycznych i innych dodatnich potęg, na przykład sinn x oznacza (sin x)n . Będziemy stosować tę
n razy
z }| {
konwencję, choć jest to pewna kolizja oznaczeń, bo dla funkcji f : X → X przyjmuje się też konwencję f := f ◦ f ◦ . . . ◦ f
n
Twierdzenie 6.3.4 Funkcje sin i cos są ciągłe. Ponadto dla każdego x ∈ R zachodzą wzory:
Dowód: Funkcja cos jest obłożeniem funkcji R 3 x 7→ z = eix = cos x + i sin x ∈ S1 przez funkcję C 3 z 7→ re z ∈ R.
Zatem jako złożenie funkcji ciągłych jest to funkcja ciągła. Podobnie wnosimy, że sin też jest funkcją ciągłą. Wzór (6.17)
uzyskujemy podstawiając we wzorze (2.27) liczbę eix za liczbę zespoloną z i wykorzystując definicję 6.3.3 . Wzór (6.18)
wynika wprost z faktu, że eix ∈ S1 oraz definicji 6.3.3 . Aby wyprowadzić pierwszy ze wzorów (6.19) zauważmy, że wyliczając
eix oraz e−ix ze wzoru (6.8) oraz korzystając z twierdzenia 5.4.1 mamy
∞ ∞ ∞ ∞ ∞
!
eix + e−ix 1 X (xi)n X (−xi)n 1 X n n 1 + (−1)n X x2k i2k X x2k
cos x = = + = x i = = (−1)k ,
2 2 n=0
n! n=0
n! 2 n=0 n! (2k)! (2k)!
k=0 k=0
bo 1 + (−1)n wynosi zero dla n nieparzystych i dwa dla n parzystych, a i2k = (i2 )k = (−1)k . Drugi z tych wzorów
wyprowadzamy analogicznie. Wzory (6.20) wynikają natychmiast ze wzorów (6.19).
Program, który przybliża wartości funkcji sin w oparciu o szereg w twierdzeniu 6.3.4 przedstawiono na listingach 6.1
(Mathematica) i 6.2 (C++).
6.3. FUNKCJE TRYGONOMETRYCZNE 157
( ∗ O b l i c z a n i e f u n k c j i s i n u s za pomoc a̧ r o z w i n i ȩ c i a w s z e r e g ∗ )
S i n S e r i e s [ x_ , d_ ] :=
Module [ { s , znak , s i l n i a , y , n } ,
s = 0 ; znak = 1 ; s i l n i a = 1 ; y = x ; n = 0 ;
Do[
s = s + znak ∗y/ s i l n i a ;
znak = −znak ;
s i l n i a = s i l n i a ∗(2∗n + 2)∗(2∗ n + 3 ) ;
y = y∗x∗x ;
n = n + 1,
{d}
];
s
]
Listing 6.1: Wyznaczenie wartości funkcji sin w programie Mathematica w oparciu o rozwinięcie w szereg
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ S i n S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e f u n k c j i s i n u s za pomoc a̧ r o z w i n i ȩ c i a w s z e r e g ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double p i = 3 . 1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 ;
double x=p i / 6 ;
double y=x ;
Ćwiczenie komputerowe 6.3.5 • Sprawdź zachowanie się programu z listingu 6.2 dla zmiennej x inicjalizo-
wanej wartościami π4 , π3 , π2 , π, 2π. Co obserwujesz w zachowaniu się ciągu przybliżeń? Jakie rodzą się pytania?
• Adaptuj program z listingów 6.1 i 6.2 do liczenia wartości funkcji cos wykorzystując fakt, że
∞
x2 x4 X x2n
cos x = 1 − + − ... = (−1)n .
1·2 1·2·3·4 n=0
(2n)!
Oceń poprawność i przydatność implementacji wykorzystując argument, w którym wartość funkcji cos jest Ci
znana.
xn xn+2
x ∈ [0, 2] ∧ n 1 ⇒ (6.24)
n! (n + 2)!
x2 ¬ 4 ¬ 2 · 3 ¬ (n + 1)(n + 2).
n
Mnożąc powyższą nierówność stronami przez (n+2)!
x
dostajemy nierówność (6.24). Wykorzystując własność (6.24) łatwo
sprawdzić, że do szeregów (6.19) możemy zastosować twierdzenie 5.3.3 o szeregach naprzemiennych. W szczególności ze
x2k
P∞
wzoru (5.7) zastosowanego do szeregu cos x = k=0 (−1)k (2k)! dla x = 2 i m = 2 dostajemy
16 1
cos 2 ¬ 1 − 2 + =− <0
24 3
k x2k+1
P∞
co dowodzi własności (6.22). Natomiast wzór (5.7) zastosowany do szeregu sin x = k=0 (−1) (2k+1)! oraz x ∈ (0, 2] i m = 2
daje
x3 x2
x
sin x x − =x 1− >0
3! 6 3
co dowodzi własności (6.23).
Choć formalna˛ definicj˛e liczby π podamy w kolejnym rozdziale, warto już teraz wspomnieć, że funkcja tg jest określona w zbiorze
{ x ∈ R | cos x 6= 0 } = R \ { (2k + 1) π2 | k ∈ Z },
a funkcja ctg w zbiorze
{ x ∈ R | sin x 6= 0 } = R \ { kπ | k ∈ Z }.
Po zdefiniowaniu liczby π powyższe wzory otrzymamy jako wniosek z twierdzenia 6.4.10 .
Nast˛epujaca
˛ uwaga formalizuje kilka kolejnych faktów znanych z trygonometrii.
Uwaga 6.4.3 Zachodzą następujące wzory
π
0< <2 (6.25)
2
π
cos = 0 (6.26)
2
π
sin = 1 (6.27)
2
π
t ∈ [0, ) ⇒ cos t > 0. (6.28)
2
160 ROZDZIAŁ 6. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Dowód: Wzór (6.26) i wzór (6.28) wynikają wprost z definicji π, a wzór (6.25) z definicji π oraz ze wzorów (6.21) i (6.22).
Ze wzoru (6.26) i wzoru (6.18) wynika, że sin2 π2 = 1, zatem (6.27) dostajemy z (6.23) i (6.25).
Poniższe twierdzenie wiąże ze sobą liczby 0, 1, i, e, π w jednym wzorze zwanym wzorem Eulera.
6.4.2 Okresowość
Definicja 6.4.5 Niech F oznacza ciało liczb rzeczywistych R lub ciało liczb zespolonych C. Mówimy, że funkcja
f : F 9 F jest okresowa wtedy i tylko wtedy gdy istnieje takie t ∈ F \ {0}, że dla każdego x ∈ dom f mamy
x + t ∈ dom f oraz f (x + t) = f (x). Liczbę t nazywamy wtedy okresem funkcji f . Jeśli F = R i istnieje najmniejszy
okres dodatni funkcji f to nazywamy go okresem podstawowym funkcji f .
(iv) dla każdego z ∈ S 1 istnieje dokładnie jedno x ∈ [0, 2π) takie, że eix = z.
Dowód: (*) Niech z ∈ C. Z własności (ii) twierdzenia 6.1.3 oraz (6.29) mamy
co dowodzi własności (i). W szczególności dla x ∈ R, wykorzystując dwukrotnie tożsamość (6.17), dostajemy
cos(x + 2π) + i sin(x + 2π) = e(x+2π)i = exi e2πi = exi = cos x + i sin x.
Zatem z uwagi 2.7.3 mamy cos(x + 2π) = cos x oraz sin(x + 2π) = sin x, co dowodzi własności (ii). Aby pokazać (iii)
rozważmy x ∈ (0, 2π). Wtedy t := x4 ∈ (0, π2 ). Zatem z (6.28) wnosimy, że cos t > 0, a z (6.23), że sin t > 0. Równocześnie
korzystając ze wzoru (2.4) z dostajemy
4 4
exi = e4ti = eti = (cos t + i sin t) = cos4 t + 4i cos3 t sin t − 6 cos2 t sin2 t − 4i cos t sin3 t + sin4 t =
cos4 t − 6 cos2 t sin2 t + sin4 t + 4 sin t cos t(cos2 t − sin2 t) i.
6.4. LICZBA π, OKRESOWOŚĆ, I WZORY TRYGONOMETRYCZNE 161
Przypuśćmy, że exi = 1. Wtedy im exi = 0, a więc 4 sin t cos t(cos2 t − sin2 t) = 0. Ale wiemy, że sin t > 0 i cos t > 0. Oznacza
to, że cos2 t − sin2 t = 0, skąd mamy
Jest to sprzeczne z przypuszczeniem, że exi = 1, co dowodzi (iii). Dla dowodu (iv) rozważmy najpierw x1 , x2 ∈ [0, 2π) takie,
że x1 ¬ x2 oraz ex1 i = ex2 i . Wtedy e(x2 −x1 )i = 1 oraz x2 − x1 ∈ [0, 2π). Zatem z (iii) wynika, że x2 = x1 co dowodzi
jednoznaczności. Aby pokazać istnienie rozważmy z ∈ S1 . Niech z = a + bi. Wtedy a2 + b2 = |z|2 = 1, zatem a, b ∈ [−1, 1].
Załóżmy najpierw, że a 0 oraz b 0. Ponieważ cos 0 = 1, cos π2 = 0, z ciągłości funkcji cos i twierdzenia 4.9.3 znajdziemy
x ∈ [0, π2 ] takie, że cos x = a. Ze wzoru (6.18) dostajemy
b2 = 1 − a2 = 1 − cos2 x = sin2 x,
co dowodzi istnienia gdy a 0 i b 0. Załóżmy z kolei, że a < 0, a b 0. Przyjmijmy z 0 := −zi = b − ai. Do z 0 stosuje się
rozważony już przypadek, zatem znajdziemy x ∈ [0, π2 ] takie, że z 0 = eix . Tak więc
π π
z = iz 0 = e 2 i exi = e( 2 +x)i
co dowodzi istnienia gdy a < 0 i b 0. Pozostaje do rozważenia przypadek b < 0. Przyjmijmy z 00 := −z. Do z 00 stosuje się
jeden z dwóch rozważonych już przypadków, zatem znajdziemy x ∈ [0, π] takie, że z 00 = exi . Wtedy
Dowód: (*) Przyjmijmy dla dowodu nie wprost, że istnieje u ∈ (0, 2π) takie, że dla wszystkich x ∈ R mamy cos(x + u) =
cos x. W szczególności dostajemy cos u = cos 0 = 1 oraz sin2 u = 1 − cos2 u = 1 − 1 = 0. Tak więc sin u = 0 oraz
eui = cos u + i sin u = 1 co przeczy własności (iii) twierdzenia 6.4.6 . Zatem okresem podstawowym funkcji cos jest 2π.
Rozważmy z kolei funkcję sin i przyjmijmy dla dowodu nie wprost, że istnieje u ∈ (0, 2π) takie, że dla wszystkich x ∈ R
mamy sin(x + u) = sin x. W szczególności dostajemy sin( π2 + u) = sin π2 = 1 oraz cos2 ( π2 + u) = 1 − sin2 ( π2 + u) = 1 − 1 = 0.
Tak więc cos( π2 + u) = 0 oraz
π π π π π
π π π π π
eui = e(− 2 + 2 +u)i = e− 2 i e( 2 +u)i = e− 2 i cos( + u) + i sin( + u) = e− 2 i i = e− 2 i e 2 i = e0 = 1
2 2
co ponownie przeczy własności (iii) twierdzenia 6.4.6 . Zatem okresem podstawowym funkcji sin jest również 2π.
Ćwiczenie 6.4.8 Wyznaczyć okresy podstawowe oraz zbiór miejsc zerowych funkcji tangens i funkcji cotangens.
Zatem wzory (6.30) i (6.31) wynikają z uwagi 2.7.3 . Z (6.26), (6.18) i (6.23) mamy cos π2 = 0 i sin π2 = 1. Tak więc
podstawiając y = π2 we wzorach (6.30) i (6.31) dostajemy wzory (6.32) i (6.33).
Twierdzenie 6.4.10 Zbiór miejsc zerowych funkcji sin to { kπ | k ∈ Z }, a zbiór miejsc zerowych funkcji cos to
{ (2k + 1) π2 | k ∈ Z }.
Dowód: Mamy n
n
(cos x + i sin x) = exi = enxi = cos nx + i sin nx. (6.34)
Obliczając ze wzoru (2.4) lewą stronę równania (6.34) i porównując części rzeczywiste i urojone lewej i prawej strony
otrzymujemy wzory wyrażające cos nx i sin nx poprzez cos x i sin x.
163
Rozdział 7
Przestrzenie wektorowe
W poprzednich rozdziałach przygotowaliśmy grunt do formalnego wprowadzenia kluczowych dla analizy matematycznej poj˛eć pochodnej, różniczki i całki funkcji.
Zazwyczaj najpierw wprowadza si˛e te poj˛ecia dla funkcji f : R → R a potem rozszerza si˛e je na przypadek funkcji f : Rn → Rm . My zaczniemy od
przypadku funkcji f : R → Rm , tak zwanych funkcji jednej zmiennej o wartościach wektorowych. Przypadek ten od strony szczegółów niewiele różni si˛e od
przypadku funkcji f : R → R funkcji jednej zmiennej rzeczywistej o wartościach rzeczywistych przy założeniu znajomości przestrzeni wektorowych. Przestrzeń
wektorowa to poj˛ecie znane z algebry liniowej, ale przypomnimy je w tym rozdziale. Przypadek rachunku różniczkowego funkcji wielu zmiennych jest ideowo
podobny, ale technicznie znacznie bardziej skomplikowany. Dlatego omawiany jest oddzielnie, jako rozszerzenie rachunku różniczkowego funkcji jednej zmiennej.
Wspomnijmy jeszcze, że zastapienie
˛ zmiennej rzeczywistej zmienna˛ zespolona˛ prowadzi do bardzo ciekawej i mocnej teorii znacznie odbiegajacej
˛ od przypadku
zmiennej rzeczywistej. Dział analizy matematycznej poświ˛econy badaniu własności funkcji zmiennej zespolonej zwany jest analiza˛ zespolona.˛
Wróćmy jednak do przestrzeni wektorowych. Zaproponowana przez Kartezjusza algebraizacja geometrii poprzez wprowadzenie układu współrz˛ednych na
płaszczyźnie oraz geometryczna interpretacja liczb zespolonych zaowocowały wprowadzeniem w XIXw. koncepcji wektorów jako zaczepionych w poczatku ˛ ukła-
du n-wymiarowej przestrzeni zorientowanych odcinków, które można dodawać podobnie jak dodaje si˛e liczby rzeczywiste i zespolone. Intuicyjne wyobrażenie
geometryczne wektora możliwe jest jedynie w przestrzeni dwu- i trójwymiarowej, bo jedynie z takimi przestrzeniami maja˛ do czynienia nasze zmysły. Od strony
algebraicznej wektor to po prostu układ n liczb zwanych współrz˛ednymi wektora. Dodawanie wektorów metoda˛ geometryczna˛ sprowadza si˛e do konstrukcji prze-
katnej
˛ rozpi˛etego na wektorach równoległoboku. W przypadu płaszczyzny pokrywa si˛e to z geometryczna˛ interpretacja˛ sumy liczb zespolonych przedstawiona˛ na
rysunku 2.9 . Wektory wraz z operacja˛ dodawania stanowia˛ grup˛e. Dla przestrzeni wymiaru wi˛ekszego niż dwa nie da si˛e jednak zdefiniować mnożenia wektorów
tak, by uzyskać struktur˛e ciała. W wymiarze cztery da si˛e uzyskać struktur˛e bliska˛ ciała, ale mnożenie nie jest przemienne. Sa˛ to tak zwane kwaterniony, które
rozszerzaja˛ ciało liczb zespolonych, ale za cen˛e utraty przemienności. Możliwe jest jednak mnożenie wektora przez liczb˛e, które sprowadza si˛e do stosownej
zmiany jego długości i, w przypadku mnożenia przez liczb˛e ujemna,˛ symetrycznego odbicia wzgl˛edem poczatku ˛ układu.
165
166 ROZDZIAŁ 7. PRZESTRZENIE WEKTOROWE
Definicja 7.1.1 Niech F będzie ciałem i niech 1 oznacza element neutralny względem mnożenia w ciele F . Przestrzenią
wektorową nad F nazywamy piątkę (X, F, +, ·, 0) taką, że (X, +, 0) jest grupą abelową, a
·:F ×X →X
jest działaniem (tzw. działaniem zewnętrznym) spełniającym dla dowolnych α, β ∈ F oraz x, y ∈ X warunki
(W1) (α + β)x = αx + βx,
Przykład 7.1.2 Klasycznym przykładem przestrzeni wektorowej jest Rd nad ciałem R. Elementami tej przestrzeni
są n-tki (zwane również krotkami lub po prostu wektorami) postaci x = (x1 , x2 , . . . xn ), gdzie xi ∈ R są liczbami
rzeczywistymi. Sumę x = (x1 , x2 , . . . xn ) i y = (y1 , y2 , . . . yn ) definiuje się wzorem
x + y := (x1 + y1 , x2 + y2 , . . . xn + yn ),
Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. W podobny sposób konstruujemy przestrzeń wektorową
F n dla dowolnego ciała F , na przykład dla ciała liczb zespolonych.
Przykład 7.1.3 Niech X będzie dowolnym ustalonym zbiorem. Oznaczmy przez F (X, R) zbiór wszystkich funkcji
postaci f : X → R. Dla f, g ∈ F (X, R) definiujemy sumę f + g jako funkcję
f + g : X 3 x 7→ f (x) + g(x) ∈ R,
αf : X 3 x 7→ αf (x) ∈ R.
Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. Jeśli X jest przestrzenią topologiczną, to w podobny
sposób konstruujemy przestrzeń funkcji ciągłych z X do R oznaczaną jako C(X, R)
Przykład z przestrzenia˛ wektorowa˛ funkcji ograniczonych sygnalizuje, że pożytki ze stosowania tego poj˛ecia moga˛ wykraczać poza wektory na płaszczyźnie
i ich uogólnienia na Rd . W istocie, można na przykład pokazać, że przestrzeń C([0, 1], R) nie jest izomorficzna z przestrzenia˛ Rd dla żadnego d. Jest wiele
ważnych i ciekawych przykładów przestrzeni wektorowych, w których rol˛e wektorów pełnia˛ funkcje. I choć przestrzenie te nie daja˛ si˛e wyobrazić tak jak R2
lub R3 , a struktura tych przestrzeni jest znacznie bardziej skomplikowana, to jednak formalne wyniki uzyskane na bazie intuicji zwiazanych˛ z R2 i R3 maja˛
zastosowanie dla wszystkich przestrzeni wektorowych co owocuje wartościowymi rezultatami dla wielu przestrzeni funkcyjnych. Pewne przykłady b˛edziemy mieli
okazj˛e zaobserwować w rozdziale| 11 . Badaniem przestrzeni funkcyjnych zajmuje si˛e dział analizy matematycznej zwany analiza˛ funkcjonalna.˛
7.2. PRZESTRZENIE WEKTOROWE Z ILOCZYNEM SKALARNYM 167
v · w = |v||w| cos α
Definicja 7.2.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie ϕ : X × X → R nazywamy iloczynem
skalarnym jeżeli dla wszystkich x, y, z ∈ X oraz α ∈ R spełnione są następujące warunki:
Z twierdzeniap Pitagorasa wnosimy, że w tym przypadku ϕ(x, x) jest kwadratem długości wektora x. W przypadku dowolnego iloczynu skalarnego wyrażenie
||x|| := ϕ(x, x) możemy interpretować jako coś zbliżonego własnościami do długości wektora w Rd . W istocie, długość wektora ma wiele własności
analogicznych do modułu liczby zespolonej co prowadzi do abstrakcyjnej definicji normy wektora, która˛ podamy w kolejnym rozdziale. Teraz wspominijmy jeszcze,
że iloczyn skalarny z przykładu 7.2.2 daje si˛e wyrazić wzorem
Twierdzenie 7.2.3 (Nierówność Cauchy-Schwartza) Niech X będzie przestrzenią wektorową nad R z iloczynem
skalarnym ϕ. Dla dowolnych x, y ∈ X mamy
p p
|ϕ(x, y)| ¬ ϕ(x, x) ϕ(y, y).
Dowód: Rozważmy funkcję
µ : R 3 t 7→ ϕ(x + ty, x + ty) ∈ [0, ∞).
Wykorzystując własności iloczynu skalarnego dostajemy dla dowolnego t ∈ [0, ∞)
0 ¬ µ(t) = ϕ(x, x) + 2tϕ(x, y) + t2 ϕ(y, y).
Zatem wyróżnik w tej nierówności kwadratowej musi być niedodatni, tj.
4ϕ(x, y)2 − 4ϕ(x, x)ϕ(y, y) ¬ 0
co dowodzi tezy.
Wniosek 7.2.4 Dla (x1 , x2 , . . . , xd ), (y1 , y2 , . . . , yd ) ∈ R mamyd
v v
X d u d
uX uX
u d
| xi yi | ¬ t x2i t yi2 .
i=1 i=1 i=1
Definicja 7.3.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie X 3 x 7→ ||x|| ∈ R∗ nazywamy normą
w X jeżeli dla wszystkich x, y ∈ X oraz α ∈ R
(N1) ||x|| = 0 ⇔ x = 0,
(N2) ||αx|| = |α| ||x||,
||x||ϕ := ϕ(x, x)
p
Twierdzenie 7.3.3 Niech X będzie przestrzenią wektorową nad R unormowaną normą || · ||. Wtedy odwzorowanie
Pd
Definicja 7.3.5 Normę w Rd pochodzącą od iloczynu skalarnego i=1 xi yi , tj. normę dla x ∈ Rd daną wzorem
v
u d
uX
||x||e := t x2i
i=1
W Rd zadać można również inne normy, na przykład normą są odwzorowania dane dla x ∈ Rd wzorem
d
X
||x||1 := |xi |
i=1
oraz
||x||max := max |xi |.
i=1,2,...,d
Łatwo sprawdzić, że metryki zadane przez normy || · ||e , || · ||1 , || · ||max indukują w Rd odpowiednio metrykę euklidesową,
metrykę Manhattan i metrykę maksimum. Dlatego normę || · ||1 nazywamy normą Manhattan, a normę || · ||max normą
maksimum.
170 ROZDZIAŁ 7. PRZESTRZENIE WEKTOROWE
Rysunek 7.1: Henri Lebesgue (1875 - 1941) i Stefan Banach (1892 - 1945). Źródło: Wikipedia
Naturalne jest pytanie czy każda norma musi pochodzić od jakiegoś iloczynu skalarnego. Negatywną odpowiedź na to
pytanie daje następujące ćwiczenie.
Ćwiczenie 7.3.6 Niech X będzie przestrzenią wektorową nad R i niech || · || będzie normą w X. Pokazać, że
• Jeśli || · || jest zadane przez iloczyn skalarny ϕ w X, to dla dowolnych x, y ∈ X zachodzi
• Funkcja dana wzorem (7.1) ma własności (IS3) oraz (IS4), ale niekoniecznie własności (IS1) oraz (IS2). W tym
celu rozważyć normę maksimum.
Z ćwiczenia 7.3.6 wnosimy, że iloczyn skalarny daje coś wi˛ecej niż norma. Rzeczywiście, w przestrzeni wektorowej z iloczynem skalarnym możemy zde-
finiować prostopadłość wektorów wykorzystujac ˛ obserwacj˛e, że dwa wektory w Rd sa˛ prostopadłe wtedy i tylko wtedy gdy ich iloczyn skalarny wynosi zero.
Przy pomocy normy nie da si˛e tego zrobić. W przestrzeni Rd nie ma to wielkiego znaczenia, bo iloczyn skalarny jest tam dost˛epny. Okazuje si˛e jednak, że ma
to znaczenie w przestrzeniach funkcyjnych, bo sa˛ przykłady takich przestrzeni, gdzie norm˛e wprowadzić łatwo, a iloczyn skalarny trudno. Oznacza to, że choć
prostopadłości zdefiniować si˛e nie da, to ciagle
˛ mamy metryk˛e, a wi˛ec zbiory otwarte, domkni˛ete i granice.
Definicja 7.3.7 Przestrzeń wektorową z iloczynem skalarnym, zupełną nazywamy przestrzenią Hilberta. Przestrzeń
wektorową unormowaną, zupełną nazywamy przestrzenią Banacha.
Matematycy zainteresowali si˛e przestrzeniami z iloczynem skalarnym w pierwszej dekadzie XX wieku, kiedy to przy badaniu pewnych równań całkowych
zaobserwowano, że odwzorowanie
Z b
(f, g) 7→ f (x)g(x)dx (7.2)
a
ma pewne własności iloczynu skalarnego. Równolegle, a dokładniej w 1904 roku, francuski matematyk Henri Lebesgue (ryc. 7.1 ) uogólnił poj˛ecie całki Riemanna
co pozwoliło na całkowanie znacznie szerszej klasy funkcji i doprowadziło do obserwacji (w pewnym uproszczeniu), że rodzina funkcji na przedziale [a, b], których
kwadrat jest całkowalny w sensie Lebesgue’a, wraz z iloczynem skalarnym zadanym wzorem (7.2), jest przestrzenia˛ zupełna,˛ a wi˛ec przestrzenia˛ Hilberta.
Pozwoliło to na adoptowanie szeregu metod wypracowanych dla przestrzeni Rd do przypadku przestrzeni funkcyjnych. Znaczenie przestrzeni Hilberta zostało
ugruntowane, gdy okazało si˛e, że przestrzenie te nadaja˛ si˛e idealnie do formalizacji mechaniki kwantowej.
Przestrzenie Banacha pojawiły si˛e niewiele później, bo w latach 1920-22, kiedy to polski matematyk Strefan Banach (ryc. 7.1 ) zauważył, że przeniesienie
z Rd do przestrzeni funkcyjnych takich norm jak norma maksimum pozwala na wykorzystanie wielu technik wypracowanych dla przestrzeni Hilberta również
w takich przestrzeniach funkcyjnych, w których iloczynu skalarnego sensownie wprowadzić si˛e nie da. Przestrzenie Banacha pozwalaja˛ na adaptowanie do
przestrzeni funkcyjnych tych metod opracowanych dla przestrzeni Rd , dla których wystarcza poj˛ecie normy, ale nie musi to być norma euklidesowa. Oczywiście
w przestrzeniach Hilberta i Banacha dzieje si˛e dużo wi˛ecej i inaczej niż to co można zaobserwować w Rd , tym niemniej intuicje wypracowane dla Rd pozwalaja˛
wiele rzeczy prosto wykorzystać w dowolnych przestrzeniach funkcyjnych.
172 ROZDZIAŁ 7. PRZESTRZENIE WEKTOROWE
Rozdział 8
Pochodne i różniczki.
W rozdziale wst˛epnym wprowadziliśmy intuicyjna˛ koncepcj˛e pochodnej funkcji f : R → R w punkcie x0 jako współczynnika kierunkowego nachylenia stycznej
do wykresu poprowadzonej w punkcie (x0 , f (x0 )). Współczynnik kierunkowy prostej w układzie współrz˛ednych x i y to tangens kata ˛ jaki tworzy ta prosta z osia˛
x. Łatwo jest policzyć ten współczynnik dla siecznej poprowadzonej przez punkty (x0 , f (x0 )) i (x1 , f (x1 )). Z rysunku 8.1 wnosimy, że tangens ten to iloraz
f (x1 ) − f (x0 )
,
x1 − x0
zwany ilorazem różnicowym. Ustalajac ˛ x1 do x0 przybliżamy sieczna˛ do stycznej w (x0 , f (x0 )). Można zatem oczekiwać, że współczynnik
˛ x0 i przybliżajac
kierunkowy siecznej zmierza do współczynnika kierunkowego stycznej. Niech h := x1 − x0 b˛edzie przyrostem zmiennej x wzgl˛edem punktu x0 . Iloraz
różnicowy można wtedy zapisać jako
f (x0 + h) − f (x0 )
,
h
f (x0 + h) − f (x0 )
lim (8.1)
h→0 h
co prowadzi do definicji pochodnej funkcji f w punkcie x0 . Zwróćmy uwag˛e, że mówimy tu nie o granicy funkcji f zmiennej x tylko o granicy ilorazu dwóch funkcji
zmiennej h. W mianowniku jest funkcja identycznościowa h 7→ h, natomiast w liczniku jest funkcja h 7→ f (x0 + h) − f (x0 ).
Choć powyższa interpretacja dotyczy funkcji o wartościach w zbiorze liczb rzeczywistych, granica (8.1) ma sens również wtedy, gdy funkcja f ma wartości
w przestrzeni wektorowej Rm , zatem nasza formalna definicja b˛edzie nieco ogólniejsza.
Niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm . Ustalmy punkt
x0 ∈ (a, b).
173
174 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
Rysunek 8.1: Sieczna i styczna do krzywej. Tangens kąta nachylenia siecznej do osi x możemy wyliczyć z trójkąta prosto-
kątnego. Gdy przyrost h (dolna przyprostokątna) zmierza do zera, trójkąt robi się coraz mniejszy i w granicy znika. Jednak
sieczna nie znika, tylko zmienia się w styczną, a tangens kąta nachylenia siecznej w kąt nachylenia stycznej.
Definicja 8.1.1 Mówimy, że funkcja f jest różniczkowalna w punkcie x0 jeżeli w Rm istnieje granica
f (x0 + h) − f (x0 )
lim .
h→0 h
Granicę tę nazywamy pochodną funkcji f w punkcie x0 i oznaczamy f 0 (x0 ). Jeśli f ma pochodną w każdym punkcie
x ∈ (a, b) to mówimy, że f jest różniczkowalna na przedziale (a, b) i definiujemy również funkcję
f 0 : (a, b) 3 x 7→ f 0 (x) ∈ Rm ,
Wyjaśnijmy jeszcze skad ˛ wzi˛eło si˛e słowo różniczkowalność. W tym celu wprowadźmy tradycyjne oznaczenia na przyrost wartości argumentu i przyrost
wartości funkcji (różnice) w punkcie x0 :
∆x := x − x0 ,
∆y := f (x) − f (x0 ).
Wzór ten rozumiano nie jako przybliżenie, ale jako równość. Proces wyznaczania pochodnej nazywano różniczkowaniem, bo polegał na wyznaczeniu ilorazu
dwóch maleńkich, najlepiej nieskończenie małych różnic, czyli różniczek. Wielkości nieskończenie małe, podobnie jak nieskończenie wielkie nie dały si˛e precyzyjnie
zdefiniować i prowadziły do wielu paradoksów. Dopiero wprowadzenie poj˛ecia granicy pozwoliło Cauchy’emu na postawienie precyzyjnych definicji pochodnej i
różniczki. Zdefiniował je w odwrotnej kolejności: najpierw pochodna˛ jako granic˛e ilorazów różnicowych, a nast˛epnie różniczki dx i dy jako zmienne układzie
współrz˛ednych o poczatku˛ w punkcie (x0 , y0 ) (tak zwanym lokalnym układzie współrz˛ednych) pozwalajace ˛ zapisać równanie stycznej do wykresu w postaci
dy = f 0 (x)dx.
oznaczenie pochodnej funkcji xi 7→ f (x1 , x2 , . . . , xn ) zwanej funkcja˛ cz˛eściowa˛ funkcji f . W takim przypadku pochodna określana jest mianem pochodna
czastkowa.
˛
Twierdzenie 8.1.2 (o pochodnej funkcji stałej) Niech c ∈ R będzie ustalone. Funkcja stała
cR : (−∞, ∞) 3 x 7→ c ∈ R.
c0 = 0.
176 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
f '(t) f(t+h)
f(t+h)-f(t)
f(t)
h
f(b)
f(a)
Rysunek 8.2: Interpretacja geometryczna pochodnej dla ruchu punktu na płaszczyźnie. Funkcja f : [a, b] → C = R2
odzwierciedla położenia punktu materialnego poruszającego się od punktu f (a) w chwili a do punktu f (b) w chwili b.
Róznica położeń punktu w chwili t i t + h jest wektorem łączącym f (t) z f (t + h). Gdy h zmierza do zera, sam ten wektor
skraca się do zera, ale po wydzieleniu przez h (utworzeniu ilorazu różnicowego), jego długość stabilizuje się i w granicy
dostajemy wykres styczny do trajektorii ruchu punktu, którego długość równa jest chwilowej prędkości ruchu w punkcie t.
cR (x + h) − cR (x) c−c
= = 0,
h h
więc granica ilorazu różnicowego jako granica funkcji stale równej zero wynosi zero. Dowodzi to naszej tezy.
idR : R 3 x 7→ x ∈ R.
ma pochodną w każdym punkcie równą jeden. Jej funkcja pochodna jest zatem funkcją stałą, stale równą jeden, czyli
(idR )0 = 1R
x0 = 1.
więc granica ilorazu różnicowego jako granica funkcji stale równej jeden wynosi jeden. Dowodzi to naszej tezy.
8.1. POCHODNA FUNKCJI 177
Przykład 8.1.4 Rozważmy funkcję
f : R 3 x 7→ |x| ∈ R.
Jeśli x jest dodatnie, to dla dostatecznie małych h również x + h jest dodatnie, zatem wtedy |x| = x, |x + h| = x + h
czyli w tym przypadku iloraz różnicowy wynosi
f (x + h) − f (x) |x + h| − |x| (x + h) − x h
= = = = 1.
h h h h
Jeśli x jest ujemne, to dla dostatecznie małych h również x + h jest ujemne, zatem wtedy |x| = −x, |x + h| = −x − h
czyli w tym przypadku iloraz różnicowy wynosi
Definicja 8.1.5 Niech x0 ∈ (a, b]. Mówimy, że f ma pochodną lewostronną w x0 jeśli w Rm istnieje granica lewo-
stronna
f (x0 + h) − f (x0 )
lim− . (8.2)
h→0 h
Granicę tę nazywamy pochodną lewostronną funkcji f w x0 i oznaczamy f−
0
(x0 ). Podobnie, jeśli x0 ∈ [a, b) to mówimy,
że f ma pochodną prawostronną w x0 jeśli w R istnieje granica prawostronna
m
f (x0 + h) − f (x0 )
lim . (8.3)
h→0+ h
Granicę tę nazywamy pochodną prawostronną funkcji f w x0 i oznaczamy f+
0
(x0 ).
Przykład 8.1.6 Funkcja f w przykładzie 8.1.4 ma w zerze pochodną lewostronną równą -1 oraz pochodną prawo-
stronną równą 1.
Ćwiczenie 8.1.7 Pokaż, że funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną wtedy i tylko wtedy gdy ma
w tym punkcie tak pochodną lewostronną jak i prawostronną i są one sobie równe.
W dalszym ciągu wygodnie będzie również rozważać różniczkowalność funkcji określonej na przedziale domkniętym.
178 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
Definicja 8.1.8 Mówimy, że funkcja f : [a, b] → Rm jest różniczkowalna jeśli ma pochodną w każdym punkcie
przedziału (a, b), pochodną prawostronną w a i pochodną lewostronną w b.
W przypadku funkcji różniczkowalnej f : [a, b] → Rm wygodnie jest mówić krótko o pochodnej f w a i w b rozumiejąc
przez to odpowiednio pochodną prawostronną w a i lewostronną w b.
Twierdzenie 8.1.9 Jeśli funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną to jest w tym punkcie ciągła.
Dowód: Aby pokazać ciągłość f w x0 ustalmy ε > 0. Na mocy definicji pochodnej istnieje granica
f (x0 + h) − f (x0 )
lim .
h→0 h
f (x0 + h) − f (x0 )
− f 0 (x0 ) < 1.
h
W szczególności
f (x0 + h) − f (x0 ) f (x0 + h) − f (x0 )
¬ − f 0 (x0 ) + |f 0 (x0 )| < 1 + |f 0 (x0 )|. (8.4)
h h
Weźmy δ := min(δ 0 , 1+|fε0 (x0 )| ). Z (8.4) dla h ∈ (−δ, δ) mamy
Twierdzenie 8.2.1 (o pochodnej sumy i różnicy) Niech f, g : (a, b) → Rm będą różniczkowalne w punkcie x0 ∈
(a, b). Wtedy funkcje f + g i f − g są różniczkowalne w x0 oraz
Twierdzenie 8.2.2 (o pochodnej iloczynu) Niech f, g : (a, b) → C będą różniczkowalne w punkcie x0 ∈ (a, b).
Wtedy funkcja f g jest różniczkowalna w x0 oraz
Twierdzenie 8.2.4 (o pochodnej funkcji potęgowej) Niech n ∈ N0 będzie ustaloną liczbą naturalną. Funkcja
potęgowa
R 3 x 7→ xn ∈ R
jest różniczkowalna. Jej pochodną jest funkcja
R 3 x 7→ nxn−1 ∈ R
Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n ∈ {0, 1} twierdzenie wynika natychmiast z twierdzeń 8.1.2
i 8.1.3 . Załóżmy, że n > 1 oraz że twierdzenie zachodzi dla k < n. Funkcja x 7→ xn jest wtedy iloczynem funkcji
identycznościowej oraz funkcji x 7→ xn−1 . Z założenia indukcyjnego mamy (xn−1 )0 = (n − 1)xn−2 , bo n − 1 < n. Zatem z
twierdzenia o pochodnej iloczynu mamy
co dowodzi tezy.
Ćwiczenie 8.2.5 Niech α : (a, b) → R i f : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja
Ćwiczenie 8.2.6 Niech f, g : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja
Twierdzenie 8.2.7 (o pochodnej ilorazu) Niech f, g : (a, b) → C będą różniczkowalne w x0 ∈ (a, b) i niech
g(x0 ) 6= 0. Wtedy funkcja
f (x)
x 7→
g(x)
jest dobrze określona w pewnym otoczeniu x0 i różniczkowalna w x0 oraz
0
f f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) = 2 .
g (g(x0 ))
Dowód: (*)Zauważmy, że funkcja g jako różniczkowalna w x0 jest ciągła w x0 , więc twierdzenie 4.6.9 implikuje, że
własność g(x0 ) 6= 0 przenosi się na pewne otoczenie x0 . Zatem iloraz funkcji f i g jest dobrze określony w pewnym otoczeniu
punktu x0 . Iloraz różnicowy dla ilorazu funkcji f i g to
g (x0 + h) − g (x0 )
f f f (x0 +h) f (x0 )
g(x0 +h) − g(x0 )
=
h h
f (x0 + h)g(x0 ) − f (x0 )g(x0 + h)
=
hg(x0 )g(x0 + h)
f (x0 + h)g(x0 ) − f (x0 )g(x0 ) + f (x0 )g(x0 ) − f (x0 )g(x0 + h)
=
hg(x0 )g(x0 + h)
(f (x0 + h) − f (x0 )) g(x0 ) − f (x0 ) (g(x0 + h) − g(x0 ))
=
hg(x0 )g(x0 + h)
f (x0 +h)−f (x0 )
− f (x0 ) g(x0 +h)−g(x
g(x0 ) 0)
= h h
g(x0 )g(x0 + h)
2
Przykład 8.2.8 Policzmy pochodną funkcji x 7→ xx+1 +1
. Zgodnie z twierdzeniami o pochodnej ilorazu, pochodnej
funkcji potęgowej, pochodnej sumy oraz pochodnej funkcji stałej mamy
0
x2 + 1 (x2 + 1)0 (x + 1) − (x2 + 1)(x + 1)0 2x(x + 1) − (x2 + 1) x2 + 2x − 1
= = = .
x+1 (x + 1)2 (x + 1)2 (x + 1)2
symbolu nieoznaczonego musimy poszukiwać granicy wykorzystując bezpośrednio wzory, którymi zadane są funkcje f i g.
Pomocna bywa tu reguła de l’Hospitala, którą zajmiemy się w rozdziale 8.10 .
Twierdzenie 8.2.9 (o pochodnej zestawienia) Niech fi : (a, b) → C będą funkcjami różniczkowalnymi w x0 ∈ (a, b)
dla i = 1, 2, . . . m. Wtedy zestawienie f := (f1 , f2 , . . . fm ) : (a, b) → Cm jest różniczkowalne w x0 oraz
r(0) = 0 (8.6)
∆x0 f (h) − hv = hr(h). (8.7)
Dowód: Załóżmy najpierw, że f jest różniczkowalna w x0 . Połóżmy v := f 0 (x0 ) oraz zdefiniujmy funkcję r wzorem
(
∆x0 f (h)
− v gdy h 6= 0
r(h) := h
0 w przeciwnym razie.
Oczywiście r jest określona w otoczeniu zera i spełnia wzory ( 8.6 - 8.7 ). Z twierdzeń o ciągłości złożenia, różnicy i ilorazu
funkcji ciągłych wynika, że tak określona funkcja r jest ciągła dla wszystkich h 6= 0. Ponieważ f 0 (x0 ) = v, więc
∆x0 f (h)
lim −v =0
h→0 h
8.3. POCHODNA FUNKCJI ZŁOŻONEJ 183
co oznacza, że r jest również ciągła w zerze. Na odwrót, jeśli funkcja o postulowanych własnościach istnieje, to z jej ciągłości
w zerze wynika, że istnieje granica
∆x0 f (h) hv + hr(h)
lim = lim = v + lim r(h) = v,
h→0 h h→0 h h→0
Twierdzenie 8.3.2 (o pochodnej złożenia funkcji) Niech f : (a, b) → (c, d) będzie funkcją różniczkowalną w
x0 ∈ (a, b), a g : (c, d) → Rm funkcją różniczkowalną w f (x0 ). Wtedy złożenie g ◦ f jest różniczkowalne w x0 oraz
(g ◦ f )0 = (g 0 ◦ f ) f 0 .
Dowód: Z założenia o różniczkowalności f w x0 i g w f (x0 ) oraz z twierdzenia 8.3.1 wnosimy, że istnieje V otoczenie
zera oraz ciągłe, zerujące się w zerze funkcje ϕ : V → R, ψ : V → Rm takie, że dla h, k ∈ V
∆x0 f (h) = f (x0 + h) − f (x0 ) = f 0 (x0 ) + ϕ(h) h (8.8)
Ponieważ funkcja h 7→ f 0 (x0 ) + ϕ(h) h jest ciągła i zeruje się w zerze, więc istnieje W otoczenie zera takie, że dla h ∈ W
mamy
f 0 (x0 ) + ϕ(h) h ∈ V.
Zatem wzór (8.9) zachodzi również dla k = f 0 (x0 ) + ϕ(h) h przy h ∈ W . Tak więc dla h ∈ W mamy
0
g f (x0 ) + f 0 (x0 ) + ϕ(h) h − g(f (x0 )) = g 0 (f (x0 )) + ψ (f 0 (x0 ) + ϕ(h))h f (x0 ) + ϕ(h) h. (8.11)
Stąd
∆x0 (g ◦ f )(h) 0 0
= g (f (x0 )) + ψ (f 0 (x0 ) + ϕ(h))h f (x0 ) + ϕ(h) .
h
Ponieważ tak ψ jak i ϕ zmierzają do zera przy h zmierzającym do zera, prawa strona powyższej równości zmierza do
g 0 (f (x0 ))f 0 (x0 ). Zatem również lewa strona jest zbieżna do g 0 (f (x0 ))f 0 (x0 ). Dowodzi to tezy, bo lewa strona to iloraz
różnicowy dla funkcji g ◦ f w x0 .
Przykład 8.3.3 Policzmy pochodną funkcji x 7→ (x2 +1)3 . Można ją przedstawić jako złożenie funkcji x 7→ u := x2 +1
oraz funkcji u 7→ u3 . Zatem
0
(x2 + 1)3 = (u3 )0u=x2 +1 (x2 + 1)0 = (3u2 )u=x2 +1 (2x) = 3(x2 + 1)2 · 2x = 6x(x2 + 1)2 .
184 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
R 3 t 7→ etz ∈ C (8.12)
dla ustalonej liczby zespolonej z ∈ C. Stosowny wzór podamy dla dowolnego zespolonego z , ale interesować nas b˛eda˛ głównie przypadki gdy z jest liczba˛
˛ liczba˛ urojona˛ i.
rzeczywista˛ badź
skąd
∞
X un
eu − 1 = ,
n=1
n!
u0
bo 0! = 1. Zatem dla dowolnego u ∈ C \ {0} mamy
un un ∞
P∞ P∞
eu − 1 −1 X un−1
−1 = n=0 n!
−1 = n=1 n!
−1 = −1
u u u n=1
n!
∞ ∞ ∞
X un−1 |u|n−1
X X |u|n−2
= ¬ = |u|
n=2
n! n=2
n! n=2
n!
Ponieważ interesuje nas tylko otoczenie zera, możemy założyć, że |u| < 1. Dla takich u dostajemy
∞
eu − 1 X 1
− 1 ¬ |u| ¬ |u|e.
u n=2
n!
Ponieważ prawa strona tej nierówności zmierza do zera przy u zmiarzającym do zera, z twierdzenia o trzech funkcjach
wnosimy, że
eu − 1
lim − 1 = 0,
u→0 u
co dowodzi tezy.
R 3 t 7→ etz ∈ C
R 3 t 7→ zetz ∈ C
Dowód: Dla z = 0 rozważana funkcja jest stale równa jeden, zatem jest różniczkowalna, a jej pochodną jest funkcja stale
równa zero, co jest zgodne z tezą twierdzenia. Załóżmy zatem, że z 6= 0. Pochodną rozważanej funkcji w punkcie t jest
e(t+h)z − etz ehz − 1 ehz − 1
lim = etz lim = zetz lim = zetz ,
h→0 h h→0 h h→0 hz
bo z lematu 8.4.1 wiemy, że
ehz − 1 eu − 1
lim = lim = 1.
h→0 hz u→0 u
exp : R 3 x 7→ ex ∈ R+
jest różniczkowalna, a jej pochodną jest ona sama, czyli exp0 x = exp x co zwięźle zapisujemy w postaci
(ex )0 = ex .
Dowód: Tezę dostajemy natychmiast z twierdzenia 8.4.2 po podstawieniu za z stałej jeden.
Twierdzenie 8.4.4 (o pochodnej funkcji trygonometrycznych) Funkcje trygonometryczne: sin, cos, tg, ctg są
różniczkowalne w swojej dziedzinie i zachodzą wzory
1 1
(sin t)0 = cos t, (cos t)0 = − sin t, (tg t)0 = , (ctg t)0 = − .
cos2 t sin2 t
Dowód: Ze wzorów ( 6.15 - 6.16 ) oraz z twierdzenia 8.4.2 dla z = i oraz dla z = −i mamy
0
e − e−it 1 1 eit + e−it
it
(sin t)0 = = (eit )0 − (e−it )0 = ieit + ie−it = = cos t.
2i 2i 2i 2
Podobnie 0
eit + e−it 1 1 eit − e−it
(cos t) =
0
= (eit )0 + (e−it )0 = ieit − ie−it = − = − sin t.
2 2 2 2i
186 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
Podobnie 0
cos t (cos t)0 sin t − cos t(sin t)0 − sin t sin t − cos t(cos t) 1
(ctg t) =
0
= = =− 2 .
sin t sin t
2
sin t
2
sin t
Interesujące jest pytanie, czy jeśli funkcja jest różniczkowalna w każdym punkcie, to jej pochodna musi być funkcją
ciągłą. Okazuje się, że niekoniecznie, jak pokazuje poniższy przykład.
h2 sin h1 1
= h sin .
h h
Granica limh→0 h sin h1 istnieje i wynosi zero. Zatem również w zerze nasza funkcja jest różniczkowalna. Jej pochodną
jest funkcja (
2x sin x1 − cos x1 gdy x =
6 0,
R 3 x 7→
0 dla x = 0.
Pokażemy, że pochodna ta nie jest ciągła w zerze. Gdyby była ciągła w zerze, to dla każdego ciągu xn zbieżnego do
zera ciąg wartości byłby zbieżny do pochodnej w zerze, czyli do zera. Ale ciąg xn = 2πn
1
jest zbieżny do zera, a ciąg
wartości pochodnej w punktach tego ciągu wynosi stale −1, więc jest zbieżny do −1, a nie do zera.
8.6. METODA NEWTONA 187
Definicja 8.5.3 Funkcję f : (a, b) → Rm , która jest różniczkowalna i ma ciągłą pochodną nazywamy funkcją klasy
C 1 . Zbiór takich funkcji oznaczamy C 1 ((a, b), Rm ).
Nazwa "klasa C 1 " wyjaśni si˛e później, gdy zdefiniujemy również funkcje klasy C n .
W programie Mathematica pochodną funkcji f zmiennej x obliczamy używając instrukcji
D[f[x],x]
Simplify[%]
daje w wyniku
x
.
x4 − 1
Rysunek 8.3: Interpretacja geometryczna metody Newtona. W oparciu o dane przybliżenie miejsca zerowego xn konstruuje-
my aproksymację liniową funkcji f w punkcie (xn , f (xn ) (styczną do wykresu w punkcie (xn , f (xn )) i bierzemy jako kolejne
przybliżenie
˛ y = 0 i rozwiazuj
Przyjmujac ˛ ac˛ wzgl˛edem x znajdujemy
f (x0 )
x = x0 − .
f 0 (x0 )
Jest to przybliżenie miejsca zerowego funkcji f tym lepsze im bliżej x0 było miejsca zerowego. Dlatego iterujac
˛ ten proces, to znaczy liczac
˛ wyrazy ciagu
˛ danego
rekurencyjnie wzorem
f (xn )
xn+1 := xn −
f 0 (xn )
możemy si˛e spodziewać, że b˛edzie on zbieżny do miejsca zerowego funkcji f w przedziale [a, b]. Nie zawsze tak jest, ale dzieje si˛e tak na tyle cz˛esto, że metoda
Newtona jest do dziś bardzo powszechnie stosowanym narz˛edziem. Interpretacja geometryczna zwiazku ˛ xn i xn+1 z pochodna˛ funkcji f jest przedstawiona na
rys. (8.3).
Program w C++ znajdujacy ˛ miejsca zerowe wielomianu przedstawiono na listingu 8.1 .
W programie Mathematica rozwiazanie˛ równania metoda˛ Newtona umożliwia insturkcja FindRoot. Ponieważ program Mathematica sam potrafi znaleźć
pochodna,˛ jedyne co musimy zrobić to zapisać równanie i podać wartość, od której należy rozpoczać
˛ poszukiwanie pierwiastka. Na przykład piszac ˛
{x -> 0.865474}
Program Mathematica przekształca równanie cos x = x3 do postaci f (x) = 0, gdzie
f (x) := cos x − x3 ,
x0 := 1
cos xn − x3n
xn+1 := xn −
− sin xn − 3x2n
8.6. METODA NEWTONA 189
/∗ ∗∗∗∗∗∗∗∗∗∗ newton . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P i e r w i a s t e k wielomianu ∗/
/∗ metod a̧ Newtona ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
#include <i o s t r e a m >
using namespace s t d ;
/∗ S t o p i e ń wielomianu ∗/
const i n t d e g r e e =2;
/∗ T a b l i c a wspó ł c z y n n i k ów wielomianu ∗/
double c o e f [ d e g r e e + 1 ] ;
/∗ maksymalna l i c z b a i t e r a c j i ∗/
i n t l i m i t =30;
/∗ o c z e k i w a n a dok ł adno sć ∗/
double e p s i l o n = 0 . 0 0 1 ;
/∗ W y l i c z e n i e warto s c i wielomianu w x ∗/
double f ( double x ) {
double s=c o e f [ d e g r e e ] ;
f o r ( i n t i=d e g r e e −1; i >=0; i −−) s=c o e f [ i ]+x∗ s ;
return s ;
}
/∗ W y l i c z e n i e p o c h o d n e j wielomianu w x ∗/
double d e r f ( double x ) {
double s=d e g r e e ∗ c o e f [ d e g r e e ] ;
f o r ( i n t i=d e g r e e −1; i >=1; i −−) s=i ∗ c o e f [ i ]+x∗ s ;
return s ;
}
/∗ Program g ł ówny ∗/
i n t main ( ) {
/∗ Wczytujemy wspó ł c z y n n i k i wielomianu ∗/
f o r ( i n t i =0; i <d e g r e e +1;++ i ) {
c o u t << "c[" << i << " ]= " ; c i n >> c o e f [ i ] ;
}
/∗ o r a z wyj s c i o w e p r z y b l i ż e n i e p i e r w i a s t k a ∗/
double x ;
c o u t << " x0 =" ; c i n >> x ;
/∗ Pȩ t l a g ł ówna ∗/
f o r ( i n t i =0; i <l i m i t ;++ i ) {
double v a l=f ( x ) ;
c o u t << " x =" << x << "\n" ;
c o u t << " f(x )= " << v a l << "\n" ;
/∗ Je s l i o s i a̧ g n i ȩ t o ż a̧dan a̧ dok ł adno sć moż na przerwa ć p ȩ t l ȩ ∗/
i f ( v a l <e p s i l o n && v a l >−e p s i l o n ) break ;
/∗ Nowe p r z y b l i ż e n i e ∗/
x=x−v a l / d e r f ( x ) ;
}
}
Listing 8.1: Wyznaczanie miejsc zerowych wielomianu w C++.
190 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
aż do osiagni˛
˛ ecia przybliżenia granicy o domyślnie ustawionej dokładności.
√
Ćwiczenie 8.6.1 Pokaż, że zaprezentowana na listingu 2.3 metoda liczenia pierwiastka kwadratowego a jest w istocie metoda˛ Newtona zastosowana˛
do równania
x2 − a = 0.
Definicja 8.7.1 Mówimy, że funkcja f : (a, b) → R ma w x0 ∈ (a, b) minimum lokalne jeżeli istnieje otoczenie
U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) f (x0 ). Podobnie mówimy, że f ma w x0 ∈ (a, b)
maksimum lokalne jeżeli istnieje otoczenie U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) ¬ f (x0 ).
Mówimy, że f ma w x0 ∈ (a, b) ekstremum lokalne jeśli f ma w x0 minimum lokalne lub maksimum lokalne.
Twierdzenie 8.7.2 (o ekstremum lokalnym funkcji różniczkowalnej) Jeśli f : (a, b) → R jest różniczkowalna
w x0 ∈ (a, b) i ma w x0 ekstremum lokalne, to f 0 (x0 ) = 0.
Dowód: Załóżmy, że f ma w x0 maksimum lokalne. Zatem istnieje δ > 0 taka, że (x0 −δ, x0 +δ) ⊂ (a, b) oraz f (x) ¬ f (x0 )
dla x ∈ (x0 − δ, x0 + δ). W szczególności dla h ∈ (−δ, δ) mamy f (x0 + h) − f (x0 ) ¬ 0. Zatem dla h ∈ (−δ, 0) jest
f (x0 + h) − f (x0 )
0,
h
skąd wnosimy, że pochodna lewostronna f w x0 jest nieujemna. Z drugiej strony dla h ∈ (0, δ) jest
f (x0 + h) − f (x0 )
¬ 0,
h
skąd wnosimy, że pochodna prawostronna f w x0 jest niedodatnia. Ale pochodna f w x0 istnieje, więc jest równa tak
pochodnej lewostronnej jak i prawostronnej. Zatem f 0 (x0 ) = 0.
Twierdzenie 8.7.3 (Rolle’a) Załóżmy, że f : [a, b] → R jest ciągła oraz, że jest różniczkowalna dla x ∈ (a, b). Jeśli
f (a) = f (b) to istnieje ξ ∈ (a, b) takie, że f 0 (ξ) = 0.
Dowód: Funkcja f , jako funkcja ciągła na przedziale zwartym, osiąga wartość największą oraz najmniejszą. Jeśli obie te
wartości są osiągane na końcach przedziału [a, b], to założenie f (a) = f (b) implikuje, że f jest stała, a więc ma pochodną
zero w każdym punkcie przedziału (a, b). Załóżmy zatem, że wartość największa lub wartość najmniejsza jest osiągnięta
w pewnym punkcie ξ ∈ (a, b). Wtedy f ma w ξ ekstremum lokalne, zatem z twierdzenia o ekstremum lokalnym funkcji
różniczkowalnej wynika, że f 0 (ξ) = 0.
8.8. TWIERDZENIA O WARTOŚCI ŚREDNIEJ 191
f(b)
1.0
f(ξ)
0.8
0.6
f(a)
a ξ b
Rysunek 8.4: Twierdzenie o wartości średniej graficznie może być zinterpretowane jako istnienie stycznej do wykresu rów-
noległej do zadanej siecznej.
Twierdzenie 8.8.1 (uogólnione o wartości średniej) Niech f, g : [a, b] → R będą ciągłymi funkcjami, różniczko-
walnymi w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że
Wniosek 8.8.2 (Twierdzenie Lagrange’a o wartości średniej) Niech f : [a, b] → R będzie funkcją ciągłą, róż-
niczkowalną w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że
Twierdzenie 8.8.4 (o przyrostach skończonych) Niech f : [a, b] → Rm będzie funkcją ciągłą, różniczkowalną na
(a, b). Wtedy istnieje ξ ∈ (a, b) takie, że
Dowód: Oznaczmy z := f (b) − f (a). Jeśli z = 0, to teza jest oczywista. Zatem załóżmy, że z 6= 0 i rozważmy funkcję
ϕ : [a, b] 3 t 7→ z · f (t) ∈ R.
Funkcja ϕ jest funkcją o wartościach rzeczywistych, jest ciągła, a na podstawie ćwiczenia 8.2.6 wiemy też, że jest różnicz-
kowalna i ϕ0 (t) = z · f 0 (t). Możemy więc do niej zastosować twierdzenie o wartości średniej. Zatem istnieje ξ ∈ (a, b) takie,
że
ϕ(b) − ϕ(a) = ϕ0 (ξ)(b − a) = (b − a)z · f 0 (ξ).
Z drugiej strony, na mocy twierdzenia 7.3.2 mamy
Twierdzenie 8.9.1 Niech f : (a, b) → R będzie funkcją różniczkowalną. Mają miejsce następujące równoważności
(i) f 0 0 wtedy i tylko wtedy gdy f jest słabo rosnąca,
(ii) jeśli f 0 > 0 to f jest silnie rosnąca,
Dowód: Załóżmy najpierw, że f 0 0. Niech x1 , x2 ∈ (a, b) oraz x1 < x2 . Z twierdzenia o wartości średniej wiemy,
że f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ) dla pewnego ξ ∈ (x1 , x2 ). Ale z założenia f 0 (ξ) 0, skąd f (x2 ) − f (x1 ) 0, a to
dowodzi, że f jest słabo rosnąca. Z kolei jeśli f jest słabo rosnąca, to iloraz różnicowy w każdym punkcie przedziału (a, b)
jest nieujemny. Zatem i pochodna jest nieujemna, jako granica ilorazu różnicowego. To dowodzi równoważności (i). Aby
pokazać (ii) załóżmy, że f 0 > 0 oraz x1 < x2 dla pewnych x1 , x2 ∈ (a, b). Podobnie jak poprzednio z twierdzenia o wartości
średniej dostajemy f (x2 ) − f (x1 ) = f 0 (ξ)(x2 − x1 ) dla pewnego ξ ∈ (x1 , x2 ). Teraz jednak f 0 (ξ) > 0, skąd f (x2 ) − f (x1 ) > 0,
a to dowodzi, że f jest silnie rosnąca. Dowód (iii) oraz (iv) jest podobny, więc zostawiamy go jako ćwiczenie.
Zwróćmy uwagę, że w punktach (ii) oraz (iv) twierdzenia 8.9.1 nie ma równoważności. Najprostszym przykładem jest
funkcja potęgowa R 3 x → x2k+1 ∈ R gdzie k ∈ N1 . Łatwo sprawdzić, że jest ona silnie rosnąca, ale jej pochodna w zerze
jest zero.
Twierdzenie 8.9.2 Niech f : (a, b) → R będzie funkcją różniczkowalną. Niech c, d ∈ (a, b) będą takie, że c < d oraz
f 0 (c) < f 0 (d). Wtedy dla każdego λ ∈ (f 0 (c), f 0 (d)) istnieje ξ ∈ (c, d) takie, że f 0 (ξ) = λ.
Dowód: Rozważmy funkcję g : (a, b) → R daną wzorem g(t) := f (t) − λt. Jest ona ciągła, różniczkowalna oraz
g 0 (c) = f 0 (c) − λ < 0 i g 0 (d) = f 0 (d) − λ > 0. Zatem g(c) > g(c + h1 ) dla pewnego h1 ∈ (0, d − c), bo w przeciwnym
razie iloraz różnicowy g(c+h)−g(c)
h >= 0 dla h > 0 co prowadzi do sprzeczności z g 0 (c) < 0. Podobnie stwierdzamy, że
g(d) > g(d − h2 ) dla pewnego h2 ∈ (0, d − c). Na mocy tw. 4.7.3 funkcja g musi osiągać minimum na przedziale [c, d]. Ale
pokazaliśmy, że wartości g na końcach tego przedziału nie mogą realizować minimum. Zatem jest ono osiągnięte w pewnym
punkcie ξ ∈ (c, d) co oznacza, że jest to minimum lokalne. Z tw. 8.7.2 g 0 (ξ) = f 0 (ξ) − λ = 0, skąd f 0 (ξ) = λ.
Z udowodnionego twierdzenia wynika następujący ważny wniosek.
Wniosek 8.9.3 Niech f : (a, b) → R będzie funkcją różniczkowalną. Jeśli f 0 (x) 6= 0 dla wszystkich x ∈ (a, b), to f 0
przyjmuje wyłącznie wartości dodatnie lub wyłącznie wartości ujemne.
Ćwiczenie 8.9.4 Wywnioskuj z twierdzenia 8.9.2 , że jeśli f : (a, b) → R jest funkcją różniczkowalną, to f 0 nie
posiada punktów nieciągłości pierwszego rodzaju.
Rysunek 8.5: Guillaume de l’Hospital (1661 - 1704) i Johann Bernoulli (1667 - 1748) Źródło: Wikipedia
może być traktowane jako przybliżenie f 0 (0), oczywiście przy założeniu, że pochodna ta istnieje. Zatem jeśli mamy dwie takie funkcje, f, g : R → R i obie
zeruja˛ si˛e w zerze, to mamy
f (x)
f (x)
= x
g(x)
g(x)
x
f 0 (0) f (0)
Prawa˛ stron˛e tego wyrażenia można traktować jako przybliżenie g 0 (0) . Lewa strona nie jest przybliżeniem g(0) , bo jest to pozbawiony sensu ułamek o zerze
f (x)
w liczniku i mianowniku. Jest to jednak przybliżenie granicy ułamków g(x) przy x zmierzajacym ˛ do zera o ile ta granica istnieje. Zatem, przy odpowiednich
założeniach, możemy si˛e spodziewać wzoru
f (x) f 0 (0)
lim = 0 .
x→0 g(x) g (0)
Udowodnimy teraz nawet nieco ogólniejsze twierdzenie. Z twierdzeniem tym kojarzony jest francuski matematyk Guillaume de l’Hospital (rys. 8.5 ), który pierwszy
je opublikował. Jednak sa˛ argumenty za tym, że autorem twierdzenia jest szwajcarski matematyk Johann Bernoulli (rys. 8.5 ), brat Jacoba Bernoullego (rys. 2.6
). Okazuje si˛e ono bardzo pomocne przy wyznaczaniu granic ilorazów, do których nie możemy zastosować twierdzenia o granicy ilorazu. Przypomnijmy bowiem,
że twierdzenie o granicy ilorazu wymaga, by mianownik miał granic˛e różna˛ od zera.
8.10. REGUŁA DE L’HOSPITALA 195
Twierdzenie 8.10.1 (reguła de l’Hospitala). Rozważmy przedział otwarty (a, b) ⊂ R̄ (dopuszczamy końce nieskoń-
czone). Niech f, g : (a, b) → R będą różniczkowalne oraz g 0 (x) 6= 0 dla x ∈ (a, b). Oznaczmy przez c jeden z końców
przedziału (a, b) oraz załóżmy, że
lim f (x) = 0 = lim g(x) (8.13)
x→c x→c
lub
lim g(x) ∈ {−∞, ∞}. (8.14)
x→c
to istnieje granica
f (x)
lim (8.16)
x→c g(x)
i obie te granice są sobie równe.
f (x) f 0 (x)
lim sup ¬ lim sup 0 (8.17)
x→a g(x) x→a g (x)
oraz
f (x) f 0 (x)
lim inf lim inf 0 (8.18)
x→a g(x) x→a g (x)
Dowód: (twierdzenia 8.10.1 ) Ponieważ granica dolna jest niewiększa od granicy górnej, z (8.17) i (8.18) mamy ciąg
nierówności
f 0 (x) f (x) f (x) f 0 (x)
lim inf 0 ¬ lim inf ¬ lim sup ¬ lim sup 0 . (8.19)
x→c g (x) x→c g(x) x→c g(x) x→c g (x)
W twierdzeniu 8.10.1 zakładamy istnienie granicy (8.15). Zatem stosowna granica dolna i granica górna są sobie równe.
Zatem pierwsze i ostatnie wyrażenie w ciągu nierówności (8.19) są sobie równe. Jest to możliwe tylko wtedy, gdy wszystkie
wyrażenia są sobie równe. W szczególności drugie i trzecie wyrażenie są sobie równe. Wynika stąd istnienie granicy (8.16) i
równość obu granic.
Dowód: (lematu 8.10.2 ) (*)Dla ustalenia uwagi przyjmijmy, że c = a oraz, że jest to wartość skończona. W pozostałych
przypadkach dowód jest podobny. Rozważmy dowód wzoru (8.17). Oznaczmy
f 0 (x)
A := lim sup .
x→a g 0 (x)
Jeśli A = ∞, to wzór (8.17) oczywiście zachodzi, załóżmy więc, że A < ∞. Wystarczy pokazać, że
f (x)
∀q > A lim sup ¬ q. (8.20)
x→a g(x)
f 0 (x)
∀ x ∈ (a, c) < q. (8.21)
g 0 (x)
196 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
Niech x, y ∈ (a, c) oraz x < y. Zwężenia f|[x,y] i g|[x,y] spełniają założenia uogólonionego twierdzenia o wartości średniej
(tw. 8.8.1 ) zatem znajdziemy ξ ∈ (x, y) takie, że
Wykorzystując założenie o niezerowaniu się pochodnej funkcji g przepisujemy powyższą równość w postaci
f (x) − f (y) f (y) − f (x) f 0 (ξ)
= = 0 .
g(x) − g(y) g(y) − g(x) g (ξ)
f (x)
¬q
g(x)
Dla x ∈ (a, c0 ) mamy g(x) > 0, więc dzieląc ostatnią nierówność przez g(x) dostajemy
Ze względu na założenie limx→a g(x) = ∞, dla zadanego ε > 0 i przy ustalonym y ∈ (a, c) znajdziemy c00 ∈ (a, c0 ) takie, że
dla x ∈ (a, c00 )
f (y) g(y)
−q < ε.
g(x) g(x)
Zatem z ostatnich dwóch nierówności dla x ∈ (a, c00 ) i dowolnego ε > 0 mamy
f (x)
< q + ε.
g(x)
f (x)
¬ q,
g(x)
Przykład 8.10.3 Granica limx→0 sinx x nie daje się policzyć z twierdzenia o granicy ilorazu, bo mianownik zmierza do
zera. Ponieważ jednak również licznik zmierza do zera oraz tak licznik jak i mianownik są różniczkowalne w otoczeniu
zera, a mianownik ma pochodną stale równą jeden, więc możemy zastosować regułę de l’Hospitala. Dostajemy
prowadzi do symbolu nieoznaczonego ∞·0 ∞ . Ponieważ funkcja w mianowniku zmierza do nieskończoności przy x → ∞,
możemy skorzystać z reguły de l’Hospitala. W tym celu musimy zbadać istnienie granicy
Granica
sin x1
lim 2 1
x→∞
x
też jest symbolem nieoznaczonym, tym razem postaci 00 , więc ponownie stosujemy regułę de l’Hospitala i dostajemy
Twierdzenie 8.11.1 Załóżmy, że f : (a, b) → R jest funkcją różniczkowalną oraz f 0 (x) 6= 0 dla wszystkich x ∈ (a, b).
Wtedy f jest bijekcją przedziału (a, b) w pewien przedział (c, d). Co więcej, bijekcja odwrotna f −1 : (c, d) → (a, b) jest
różniczkowalna oraz
1
(f −1 )0 (f (x)) = 0 (8.23)
f (x)
dla wszystkich x ∈ (a, b).
Dowód: Z wniosku 8.9.3 wnosimy, że f 0 jest wszędzie dodatnia lub wszędzie ujemna, zatem z tw. 8.9.1 funkcja jest silnie
rosnąca lub silnie malejąca. W szczególności jest zatem injekcją. Niech Γ := im f będzie obrazem przedziału (a, b) w funkcji f .
Ponieważ zbiory spójne w R pokrywają się z przedziałami (wn. 3.5.3 ), z tw. 4.9.1 wnosimy, że Γ jest również przedziałem.
Pokażemy, że przedział ten jest otwarty. Rzeczywiście, jeśli d jest lewym lub prawym końcem przedziału Γ i d ∈ Γ, to d
jest elementem największym lub najmniejszym w Γ. Równocześnie d = f (t) dla pewnego t ∈ (a, b). Wybierzmy t0 , t00 ∈ (a, b)
takie, że t0 < t < t00 . Z monotoniczności f mamy f (t0 ) < d < f (t00 ) lub f (t0 ) > d > f (t00 ). Ponieważ f (t0 ), f (t00 ) ∈ Γ,
198 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
wykluczone jest by d było elementem największym lub najmniejszym w Γ. Zatem Γ jest przedziałem otwartym. Przyjmijmy,
że Γ = (c, d).
Ustalmy x ∈ (a, b) oraz połóżmy y := f (x). Wtedy x = f −1 (y). Rozważmy funkcję częściową h : R 9 R określoną
wzorem h := f −1 (y + k) − f −1 (y) dla k ∈ R takich, że y + k ∈ (c, d). Zauważmy, że jest ona w szczególności określona w
otoczeniu zera. Mamy
Z twierdzenia 4.6.16 wiemy, że f −1 jest ciągła co implikuje, że również h jest ciągła i w szczególności limk→∞ h(k) =
h(0) = 0. Zatem przechodząc w powyższej równości z k do granicy w zerze dostajemy
f −1 (y + k) − f −1 (y) 1 1
lim = =
k→∞ k limk→∞ f (x+h(k))−f (x) f 0 (x)
h(k)
1
(f −1 )0 (y) = .
f 0 (x)
Dowód: Z wniosku 8.4.3 wiemy, że pochodną funkcji x → ex jest ona sama. Ponieważ funkcja wykładnicza nie
przyjmuje wartości zero, możemy do niej zastosować twierdzenie 8.11.1 . Funkcją odwrotną do funkcji wykładniczej jest
funkcja logarytmiczna x → ln x, zatem funkcja ta jest różniczkowalna oraz
1 1
(ln)0 (ex ) = = x.
(ex )0 e
Zatem różniczkowalność funkcji x 7→ ln |x| oraz wzór (8.25) wynikają wprost z różniczkowalności funkcji ln i wzoru (8.24)
dla x > 0. Natomiast dla x < 0 różniczkowalność jest konsekwencją twierdzenia 8.3.2 , z którego również dostajemy
1 1
(ln(−x))0 = (−1) =
−x x
R+ 3 x 7→ xα ∈ R+
Dowód: Ponieważ xα = eα ln x , więc funkcja x 7→ xα jest złożeniem funkcji x 7→ α ln x oraz funkcji u 7→ eu . Zatem z
twierdzenia o pochodnej złożenia funkcji mamy
α α
(xα )0 = eα ln x = xα = αxα−1 .
x x
Mamy też następujące twierdzenie o pochodnej funkcji wykładniczej.
R 3 x 7→ ax ∈ R+
Dowód: Ponieważ z definicji ax = ex ln a , więc funkcja x 7→ ax jest złożeniem funkcji x 7→ x ln a oraz funkcji u 7→ eu .
Zatem z twierdzenia o pochodnej złożenia funkcji mamy
(ax )0 = ex ln a ln a = ax ln a.
Definicja 8.11.5 Funkcje odwrotne do funkcji sin|[−π/2,π/2] , cos|[0,π] , tg|(−π/2,π/2) oznaczamy odpowiednio arc sin,
arc cos i arc tg. Nazywamy je funkcjami kołowymi lub cyklometrycznymi.
200 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
Twierdzenie 8.11.6 Funkcja arc sin : [−1, 1] → [−π/2, π/2] jest różniczkowalna dla x ∈ (−1, 1) oraz
1
(arc sin x)0 = √ .
1 − x2
Funkcja arc cos : [−1, 1] → [0, π] jest różniczkowalna dla x ∈ (−1, 1) oraz
1
(arc cos x)0 = − √ .
1 − x2
Funkcja arc tg : R → (−π/2, π/2) jest różniczkowalna dla x ∈ R oraz
1
(arc tg x)0 = .
1 + x2
Dowód: Niech y = sin x. Wtedy x = arc sin y i z tw. 8.11.1 mamy
1 1 1 1
(arc sin y)0 = (sin−1 )0 (sin x) = = =p =p .
(sin x)0 cos x 1 − sin x
2 1 − y2
Funkcje kołowe w programie Mathematica oznaczane są ArcSin, ArcCos, ArcTan.
R 3 t 7→ tv ∈ Rd
dla ustalonego v ∈ Rd . Wektor v (liczbę w przypadku d = 1) nazywać będziemy współczynnikiem funkcji liniowej
jednej zmiennej.
Funkcję taką oznaczać będziemy Lv , lub krótko L, jeśli współczynnik v jest nieistotny. Łatwo sprawdzić, że funkcja liniowa
jest ciągła i w zerze ma wartość zero.
8.12. RÓŻNICZKA FUNKCJI 201
Rysunek 8.6: Aproksymacja liniowa funkcji f w punkcie (x0 , f (x0 )) w lokalnym układzie współrzędnych (x̄, ȳ).
Uwaga 8.12.2 Jeśli L : R → Rm jest funkcją liniową, to L = Lv dla v = L(1). Innymi słowy wartość funkcji liniowej
dla argumentu jeden jest równa jej współczynnikowi.
Funkcja liniowa daje si˛e bardzo prosto wyliczać, wi˛ec jest dobrym kandydatem na przybliżanie (lokalne) innych funkcji. Idea jest nast˛epujaca.˛ Wiemy, że
pewna funkcja f ma w punkcie x0 wartość y0 := f (x0 ). Interesuje nas wartość funkcji f w punkcie x1 bliskm x0 , czyli y1 := f (x1 ). Czy dysponujac ˛
przyrostem zmiennej x, czyli róznica˛ x1 − x0 , możemy przy pomocy pewnej funkcji liniowej wyliczyć przybliżenie przyrostu zmiennej y , czyli różnic˛e y1 − y0 =
f (x1 ) − f (x0 )? Podkreślmy, że chodzi nam o funkcj˛e liniowa˛ w układzie współrz˛ednych przesuni˛etym do punktu (x0 , y0 ), a wi˛ec w układzie (x̄, ȳ), gdzie
x̄ := x − x0 , ȳ := y − y0 , zwanym lokalnym układem współrz˛ednych wzgl˛edem punktu (x0 , y0 ). Zwróćmy uwag˛e, że punkt o współrz˛ednych (x0 , y0 ) w
lokalnym układzie współrz˛ednych ma współrz˛edne (0, 0). Nasze pytanie można wi˛ec sformułować nast˛epujaco ˛ (rys. 8.6 ):
Czy istnieje funkcja liniowa L w lokalnym układzie współrz˛ednych (x̄, ȳ), taka że
y − y0 ≈ ȳ = L(x̄) = L(x − x0 )?
Zwróćmy uwag˛e, że to pytanie należy uściślić. Jeśli przybliżenie rozumieć b˛edziemy jako wymóg, by w granicy, przy x → x0 , popełniony bład,
˛ czyli wyrażenie
Rysunek 8.7: Przykład funkcji płaskiej w zerze. Coraz mniejsze wartości ε w definicji o(x) wyznaczają coraz węższe stożki
wokół osi x. Płaskość funkcji objawia się tym, że jakkolwiek wąski jest stożek, wykres funkcji wpada w ten stożek po
zawężeniu do stosownie małego otocznia zera.
Tak wi˛ec, jeśli stosowne przybliżenie liniowe istnieje, to współczynnik v jest pochodna˛ funkcji w punkcie x0 .
Czasami wygodnie jest patrzeć na problem sprowadzony do zera. Jak widzieliśmy wygodnie jest przesunać ˛ układ współrz˛ednych tak, by interesujacy
˛ nas
punkt był w poczatku ˛ układu. Wygodnie jest też sprowadzić definiowania pochodnej do definiowania pochodnej równej zero. Z naszych wcześniejszych rozważań
wynika, że pochodna równa zero oznacza, że przybliżajaca ˛ funkcja liniowa ma współczynnik v równy zero. Funkcja liniowa z R do R o współczynniku zero ma
wykres b˛edacy˛ linia˛ pozioma˛ przechodzac ˛ a˛ przez poczatek
˛ układu współrz˛ednych. Z drugiej strony, jeśli pochodna wynosi zero, to mamy
f (x0 + h) − f (x0 )
lim = 0.
h→0 h
Zwrócmy uwag˛e, że funkcja,˛ której granic˛e tu rozważamy jest ϕ : h 7→ f (x0 + h) − f (x0 ), gdzie x0 traktujemy jako parametr. Przy tych oznaczeniach mamy
ϕ(h)
lim = 0.
h→0 h
Z definicji granicy wiemy, że wtedy dla dowolnego ε > 0 istnieje δ > 0 taka, że dla |h| < δ mamy
ϕ(h)
<ε
h
lub równoważnie
|ϕ(h)| < ε|h|.
Funkcj˛e o tej własności nazywamy płaska˛ w zerze. Poj˛ecie to wyjaśnia rysunek 8.7 .
Używajac˛ j˛ezyka funkcji płaskich w zerze możemy powiedzieć, że f 0 (x) = a wtedy i tylko wtedy gdy funkcja
h 7→ f (x + h) − f (x) − ah
Definicja 8.12.3 Mówimy, że funkcja f jest o małe od funkcji g w otoczeniu punktu x0 i piszemy
jeżeli
∀ε > 0 ∃δ > 0 |x − x0 | < δ ⇒ ||f (x)|| ¬ ε|g(x)|. (8.26)
Uwaga 8.12.4 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy
||f (x)||
f (x0 ) = 0 i lim = 0. (8.27)
x→x0 |g(x)|
Dowód: Załóżmy najpierw, że funkcja f jest o małe od funkcji g i ustalmy ε > 0. Dobierając z (8.26) stosowne δ > 0
wnosimy, że ||f (x0 )|| < ε|g(x0 )|. Ponieważ zachodzi to dla dowolnego ε > 0, dostajemy f (x0 ) = 0. Drugą część warunku
(8.27) dostajemy wprost z (8.26) i definicji granicy. Na odwrót, jeśli (8.27) zachodzi, to własność (8.26) dla x 6= x0 dostajemy
wprost z drugiej części warunku (8.27), a dla x = x0 z f (x0 ) = 0.
Z uwagi tej łatwo wyprowadzić następujący wniosek
Wniosek 8.12.5 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy istnieje funkcja ϕ : V → Rm
ciągła w x0 i taka, że ϕ(x0 ) = 0 oraz f (x) = ϕ(x)g(x) dla x ∈ V .
Wniosek 8.12.6 Jeśli istnieje V otoczenie x0 takie, że g(x) 6= 0 dla x ∈ V \ {x0 } oraz funkcje fi : R 9 R spełniają
fi (x) = o(g(x)) przy x → x0 to również (f1 + f2 )(x) = o(g(x)) i (f1 − f2 )(x) = o(g(x)) przy x → x0
Definicja 8.12.7 Mówimy, że f jest płaska w zerze jeżeli f (x) = o(x) przy x → 0.
Uwaga 8.12.8 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy f (0) = 0 oraz
f (x)
lim = 0.
x→0 x
jest ciągła w zerze oraz f (x) = xϕ(x). Łatwo sprawdzić, że również na odwrót, jeśli funkcja ϕ o takich własnościach istnieje,
to f jest płaska w zerze. Mamy zatem następującą uwagę.
Uwaga 8.12.9 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy istnieje funkcja ϕ : (a, b) → Rm ciągła w zerze
taka, że ϕ(0) = 0 oraz f (x) = xϕ(x) dla x ∈ (a, b).
8.12.4 Różniczkowalność
Wróćmy teraz do idei przybliżania przyrostu funkcji funkcja˛ liniowa.˛ Przypomnijmy, że tradycyjne oznaczenia na przyrost wartości argumentu i przyrost wartości
funkcji (różnice) w punkcie x0 to:
∆x := x − x0 ,
∆y := f (x) − f (x0 ).
przy czym popełniony bład ˛ wzgl˛edny jest tym mniejszy im mniejsze jest ∆x. Jak już wspomnieliśmy, gdy powstawał rachunek różniczkowy nie dysponowano
poj˛eciem granicy. Leibniz mówił, że jeśli ∆x jest nieskończenie małe, to przybliżona równość (8.28) staje si˛e równościa.˛ Takie nieskończenie małe różnice ∆x
i ∆y nazywał różniczkami (malusieńkimi różnicami) i oznaczał dy i dx. Używajac ˛ jego j˛ezyka napisalibyśmy, że różniczki dx i dy spełniaja˛ równanie
dy = f 0 (x)dx. (8.29)
Problem w tym, że różniczki jako wielkości nieskończenie małe trudno jest precyzyjnie zdefiniować. Poj˛ecie różniczki odczarował A. Cauchy, traktujac ˛ równanie
(8.29) jako równanie odwzorowania liniowego przybliżajacego ˛ przyrost funkcji, a sama˛ różniczk˛e definiujac
˛ jako to przybliżajace
˛ odwzorowanie liniowe. I tak do
dziś rozumiemy różniczk˛e. Natomiast termin różniczkowalność, ze wzgl˛edu na bezpośredni zwiazek ˛ pomi˛edzy różniczka˛ i pochodna,˛ jest odnoszony zarówno do
istnienia pochodnej jak i różniczki, bo, jak zobaczymy, sa˛ to fakty równoważne.
Jak poprzednio, niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm .
Przypomnijmy, że przyrost funkcji f w punkcie x0 ∈ (a, b), t.j. funkcję ∆x0 f : (a − x0 , b − x0 ) → Rm definiujemy wzorem
Wprowadzimy teraz inną definicję różniczkowalności funkcji, jednak równoważną podanej wcześniej definicji 8.1.1 co
zobaczymy dowodząc uwagę 8.12.11 .
Definicja 8.12.10 Funkcję f nazywamy różniczkowalną w punkcie x0 jeżeli istnieje funkcja liniowa L : R → Rm taka,
że funkcja ∆x0 f − L, czyli różnica funkcji ∆x0 f i funkcji L jest płaska w zerze. Odwzorowanie L nazywamy wtedy
różniczką funkcji f w punkcie x0 i oznaczamy dx0 f .
8.13. POCHODNE WYŻSZYCH RZĘDÓW 205
Aby powyższa definicja miała sens, musimy wiedzieć, że różniczka jest wyznaczona jednoznacznie. W istocie różniczka
jest wyznaczona przez pochodną, jak pokazuje następujące rozumowanie. Jeśli L jest różniczką fukcji f w punkcie x0 to z
płaskości w zerze funkcji ∆x0 f − L wnosimy, że
∆x0 f (h) − L(h)
lim = 0.
h→0 h
Ponieważ L(h) = L(1)h, jest to równoważne warunkowi
∆x0 f (h)
lim − L(1) = 0
h→0 h
oraz warunkowi
∆x0 f (h)
lim
= L(1).
h h→0
Ponieważ ∆x0 f (h) = f (x0 + h) − f (x0 ), powyższa granica pokrywa się z granicą (8.1). Pokazaliśmy zatem następującą
uwagę.
Uwaga 8.12.11 Funkcja liniowa L : R → Rm jest różniczką funkcji f w punkcie x0 wtedy i tylko wtedy gdy L(1) jest
pochodną tej funkcji w punkcie x0 . W szczególności f jest różniczkowalna w puncie x0 wtedy i tylko wtedy gdy f ma
pochodną w punkcie x0 .
Tak więc, jeśli odwzorowanie liniowe L spełniające wymogi definicji 8.12.10 istnieje, to współczynnik L(1), a zatem i
samo odwzorowanie L są wyznaczone jednoznacznie.
Z uwagi 8.12.11 wynika, że stwierdzenia "f jest różniczkowalna" i "f ma pochodna"˛ moga˛ być używane zamiennie. Jednak poj˛ecia różniczki i pochodnej nie
sa˛ tożsame, choć sa˛ ściśle powiazane:
˛ wartość różniczki dla argumentu jeden jest pochodna.˛ Różniczka jest odwzorowaniem liniowym, które przemnaża argument
przez pochodna.˛ Koncepcja różniczki bazuje na aproksymacji liniowej funkcji w punkcie. Koncepcja pochodnej bazuje na stycznej do wykresu funkcji w punkcie.
Zwiazek
˛ mi˛edzy różniczka,˛ a pochodna˛ można wi˛ec też wyrazić stwierdzajac, ˛ że wykres aproksymacji liniowej funkcji f w zadanym punkcie jest prosta,˛ która
pokrywa si˛e ze styczna˛ do wykresu funkcji f w tym punkcie.
Rozważmy funkcję częściową f : R 9 Rm określoną w otoczeniu zera. Innymi słowy nie zakładamy, że dom f = R,
a jedynie, że dom f zawiera przedział otwarty (a, b) taki, że 0 ∈ (a, b). Zauważmy, że jeśli funkcja f jest płaska w zerze,
to ma pochodną w zerze równą zero. Rzeczywiście, na mocy uwagi 8.12.8 jeśli f jest płaska w zerze, to f (0) = 0 oraz
limx→0 f (x)
x = 0. Tę ostanią granicę można przepisać jako
f (x) f (0 + h) − f (0)
0 = lim = lim
x→0 x h→0 h
co oznacza, że f ma w zerze pochodną zero. Łatwo zauważyć, że można przeprowadzić również odwrotne wnioskowanie.
Prowadzi to do następującej uwagi.
Uwaga 8.12.12 Niech f : R 9 Rm będzie funkcją określoną w otoczeniu zera. Funkcja f jest płaska w zerze wtedy i
tylko wtedy gdy f (0) = 0 i f 0 (0) = 0.
Definicja 8.13.1 Mówimy, że funkcja f : (a, b) → Rm jest 1-różniczkowalna jeśli jest różniczkowalna. Jej pochodną
f 0 nazywamy pierwszą pochodną i zapisujemy jako f (1) . Mówimy, że funkcja f jest n-różniczkowalna jeśli jej (n − 1)-sza
pochodna f (n−1) jest różniczkowalna. Pochodną f (n−1) nazywamy n-tą pochodną funkcji f i zapisujemy jako f (n) .
Dla małych n zamiast f (n) piszemy czasem f 00 , f 000 itd. Dodatkowo wygodnie jest samą funkcję nazywać zerową pochodną
i zapisywać jako f (0) := f .
Z twierdzenia 8.2.1 o pochodnej sumy i różnicy oraz wniosku 8.2.3 o pochodnej iloczynu funkcji przez stałą natychmiast
otrzymujemy następujący wniosek.
Wniosek 8.13.2 Niech f, g : (a, b) → Rm będą n-różniczkowalne w punkcie x0 ∈ (a, b), a c ∈ R stałą. Wtedy funkcje
f + g, f − g oraz cf są n-różniczkowalne w x0 oraz
(f + g)(n) (x0 ) = f (n) (x0 ) + g (n) (x0 ), (f − g)(n) (x0 ) = f (n) (x0 ) − g (n) (x0 ) i (cf )(n) (x0 ) = cf (n) (x0 ).
Definicja 8.13.3 Mówimy, że funkcja f : (a, b) → Rm jest klasy C n jeżeli jest n-różniczkowalna we wszystkich
punktach przedziału (a, b) oraz f (n) jest ciągła. Zbiór takich funkcji oznaczamy C n ((a, b), Rm ).
Aproksymacja liniowa poprzez różniczk˛e jest prosta, ale cz˛esto nie jest wystarczajaco
˛ dokładna. Możemy wtedy rozważać aproksymacj˛e krzywa˛ drugiego
stopnia (parabola)˛ zadana˛ wzorem y = a0 + a1 h + a2 h2 gdzie h = x − x0 jest przyrostem zmiennej niezależnej (rys. 8.8 ). Możemy też przybliżać
wielomianem n-ego stopnia postaci
W (h) := a0 + a1 h + a2 h2 + . . . + an hn .
Różnica
r(h) := f (x) − W (h) = f (x0 + h) − a0 + a1 h + a2 h2 + . . . + an hn
powinna być o(hn ), bo oczekujemy bł˛edu, który szybciej zmierza do zera niż wielomian aproksymacyjny. Pokażemy, że jeśli funkcja r jest n-różniczkowalna w
zerze, to własność r(h) = o(hn ) jest równoważna zerowaniu si˛e pochodnych r do n-tej włacznie,
˛ tzn. warunkowi
r : h 7→ f (x0 + h) − W (h)
8.13. POCHODNE WYŻSZYCH RZĘDÓW 207
Rysunek 8.8: Wykres funkcji f (niebieski), prostej stycznej do wykresu f w punkcie x0 (fioletowy) i paraboli stycznej do
wykresu w punkcie x0 (zielony).
gdzie r(h) = o(hn ). Otrzymany w ten sposób wielomian aproksymacyjny nazywany jest wielomianem Taylora funkcji f w x0 , bo pochodzi od angielskiego
matematyka Brooka Taylora (rys. 8.9 ).
W : R 3 h 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R. (8.30)
n
X i!
W (k) (x) = ai xi−k (8.32)
(i − k)!
i=k
gdzie, aby uniknąć rozpisywania przypadków, tylko na użytek tego wzoru, przyjmujemy konwencję, że 00 := 1. Rzeczywiście,
dla k = 0 wzór (8.32) pokrywa się z definicją (8.30) wielomianiu W . Natomiast jeśli (8.32) zachodzi dla pewnego k, to W (k)
208 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
jest funkcją różniczkowalną jako suma funkcji potęgowych. Zatem biorąc pochodną obu stron dostajemy
n
!0 n
0 i! i!
0
X X
W (k+1)
(x) = W (k)
(x) = k!ak + ai xi−k = (k!ak ) + (ai xi−k )0
(i − k)! (i − k)!
i=k+1 i=k+1
n n
X i! X i!
= (i − k)ai xi−k−1 = ai xi−(k+1) .
(i − k)! (i − (k + 1))!
i=k+1 i=k+1
Wniosek 8.13.6 Funkcja f i jej wielomian Taylora Txn0 f mają takie same pochodne do n-tej włącznie odpowiednio w
zerze i w x0 , tzn. dla i = 0, 1, 2, . . . n zachodzi
(i)
Txn0 f (0) = f (i) (x0 ).
8.14. WZORY TAYLORA I SZEREG TAYLORA. 209
Definicja 8.13.7 Mówimy, że funkcja r : R 9 R określona w otoczeniu zera jest n-płaska w zerze, jeżeli r(h) = o(hn )
przy h → 0.
W (h)
lim =0 (8.33)
h→0 hn
to W = 0.
Dowód: Dowód poprowadzimy indukcyjnie względem n. Rozważmy najpierw przypadek n = 0. Wtedy W (h) = a0 jest
wtedy funkcją stałą. Z (8.33) mamy
W (h)
0 = lim = lim a0 = a0 ,
h→0 h0 h→0
skąd W = 0.
Przyjmijmy z kolei, że lemat jest spełniony dla m < n i rozważmy wielomian
W : R 3 h 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R
Zatem W (h) = a1 h + a2 h2 + . . . + an hn = hW1 (h), gdzie W1 (h) := a1 + a2 h + . . . + an hn−1 . Ale W1 jest wielomianem
stopnia co najwyżej (n − 1) oraz
W1 (h) hW1 (h) W (h)
lim n−1 = lim n
= lim = 0,
h→0 h h→0 h h→0 hn
Twierdzenie 8.14.1 (Peano o funkcji n-płaskiej) Niech r : R 9 R będzie funkcją n-różniczkowalną w zerze.
Funkcja ta jest n-płaska w zerze wtedy i tylko wtedy gdy
Rysunek 8.10: Joseph Louis Lagrange (1736 - 1813) i Giuseppe Peano (1858 - 1932). Źródło: Wikipedia
Twierdzenie 8.14.2 (wzór Taylora z resztą Peano) Niech f : (a, b) → R będzie funkcją (n − 1)-różniczkowalną
na przedziale (a, b) oraz n-różniczkowalną w x0 ∈ (a, b). Wtedy istnieje dokładnie jeden wielomian W : R → R stopnia
co najwyżej n taki, że dla h ∈ (a − x0 , b − x0 )
dla pewnej n-płaskiej w zerze funkcji r : R 9 R. Co więcej, wielomianem tym jest Txn0 f , czyli wielomian Taylora
funkcji f w x0 stopnia n. W szczególności h 7→ f (x0 + h) − Txn0 f (h) jest funkcją n-płaską w zerze.
Dowód: (twierdzenia 8.14.1 i twierdzenia 8.14.2 ) (*)Najpierw pokażemy indukcyjnie, że warunek (8.34)
implikuje n-płaskość w zerze funkcji r. Dla n = 1 wynika to wprost z uwagi 8.12.12 . Załóżmy, że implikacja zachodzi dla
m < n oraz warunek (8.34) jest spełniony. Ponieważ r(0) = 0, z uwagi 8.12.4 wnosimy, że wystarczy pokazać, iż
r(h)
lim = 0. (8.35)
h→0 hn
Z założenia (8.34) dostajemy (r0 )(i) (0) = 0 dla i = 0, 1, 2, . . . n − 1, a zatem z założenia indukcyjnego zastosowanego do
funkcji r0 wnosimy, że r0 (h) = o(hn−1 ) przy h → 0. Zatem również z uwagi 8.12.4 wynika, iż
r0 (h)
lim = 0,
h→0 hn−1
r(i) (0) = f (i) (x0 ) + Txn0 f 0 (0) = f (i) (x0 ) − f (i) (x0 ) = 0.
8.14. WZORY TAYLORA I SZEREG TAYLORA. 211
Zatem na mocy już udowodnionej części twierdzenia 8.14.1 funkcja r jest n-płaska w zerze. Dowodzi to, że za postulowany
w twierdzeniu 8.14.2 wielomian W można wziąć wielomian Taylora Txn0 f . W szczególności zatem taki wielomian W istnieje,
choć nie możemy jeszcze twierdzić, że jest wyznaczony jednoznacznie.
Aby pokazać jednoznaczność załóżmy, że istnieją wielomiany W1 i W2 stopnia co najwyżej n oraz n-płaskie w zerze
funkcje r1 i r2 takie, że
f (x0 + h) = Wi (h) + ri (h) przy h → 0.
W szczególności
W1 (h) + r1 (h) = W2 (h) + r2 (h).
Wielomian W (h) := W1 (h) − W2 (h) spełnia zatem W (h) = r2 (h) − r1 (h). Z wniosku 8.12.6 wynika, że W (h) = o(hn ) przy
h → 0. W szczególności z uwagi 8.12.4 wnosimy, że
W (h)
lim = 0,
h→0 hn
a więc lemat 8.13.8 implikuje, że W = 0.
Pozostaje jeszcze uzupełnić dowód twierdzenia 8.14.1 . Niech r : R 9 R będzie funkcją n-różniczkowalną i n-płaską w
zerze. Z udowodnionej już części twierdzenia 8.14.2 wiemy, że h 7→ r(h) − T0n r(h) jest funkcją n-płaską w zerze. Zatem z
wniosku 8.12.6 wnosimy, że wielomian T0n r = r − (r − T0n r) jest n-płaska w zerze. Z uwagi 8.12.4 dostajemy zatem
T0n r(h)
lim =0
h→0 |h|n
co pozwala wywnioskować z lematu 8.13.8 , że T0n r = 0. Zatem pokazaliśmy, że r = r − T0n r. Z wniosku 8.13.6 wiemy,
że funkcja r i jej wielomian Taylora T0n r mają te same pochodne do n-tej włącznie. Ale T0n r = 0, więc również wszystkie
pochodne T0n r się zerują i w efekcie zachodzi (8.34).
Naturalne jest zatem pytanie czy i kiedy ten szereg jest zbieżny do f (x0 + h). W tym celu trzeba zbadać kiedy
n
X f (i) (x0 )
rn (h) := f (x0 + h) − hi = f (x0 + h) − Txn0 f (h),
i=0
i!
Lemat 8.14.3 Jeśli f jest n-płaska w a oraz f (b) = 0 to dla każdego i = 1, 2, . . . , n + 1 istnieje ξi ∈ (a, b) takie, że
f (i) (ξi ) = 0.
Dowód: Z twierdzenia Peano o funkcji płaskiej wnosimy, że f (i) (a) = 0 dla i = 1, 2, . . . n. Dowód poprowadzimy
indukcyjnie względem n. Dla n = 0 lemat wynika wprost z twierdzenia Rolle’a (tw. 8.7.3 ). Załóżmy zatem, że twierdzenie
zachodzi dla m ¬ n. Stosując je dla m = n otrzymujemy istnienie potrzebnych ξi dla i = 1, 2, . . . , n. W szczególności
f (n) (ξn ) = 0. Ponieważ również f (n) (a) = 0, więc stosując twierdzenie Rolle’a do f (n) na przedziale [a, ξn ] znajdziemy
0
ξn+1 ∈ (a, ξn ) takie, że f (n) (ξn+1 ) = 0. Zatem f (n+1) (ξn+1 ) = 0.
Uogólnimy teraz twierdzenie o wartości średniej.
f (n+1) (ξ)
f (b) = (b − a)n+1 .
(n + 1)!
f (b)
Dowód: Połóżmy M := (b−a)n+1 i rozważmy funkcję g : t 7→ f (t) − M (t − a)n+1 . Prostym rachunkiem sprawdzamy,
że g(a) = g(b) = 0 oraz g (a) = 0 dla i = 1, 2, . . . n. Zatem z twierdzenia Peano o funkcji płaskiej g spełnia założenia
(i)
lematu 8.14.3 . Istnieje więc ξ ∈ (a, b) takie, że g (n+1) (ξ) = 0. Ale g (n+1) (t) = f (n+1) (t) − (n + 1)!M , więc f (n+1) (ξ) =
(n + 1)!M , skąd wynika teza.
Jesteśmy teraz gotowi podać wzór Taylora ze zmodyfikowaną resztą, zwaną resztą Lagrange’a. Twierdzenie to pochodzi
od francuskiego matematyka włoskiego pochodzenia, J.L. Lagrange’a (rys. 8.10 ).
Twierdzenie 8.14.5 (wzór Taylora z resztą Lagrange’a) Niech f : (c, d) → R będzie funkcją n+1-różniczkowalną.
Niech a, b ∈ (c, d) spełniają a < b. Wtedy istnieje ξ ∈ (a, b) takie, że
f (n+1) (ξ)
f (b) = Tan f (b − a) + (b − a)n+1 . (8.38)
(n + 1)!
Przyjmując oznaczenie h := b − a oraz rozpisując wielomian Taylora możemy też powyższą tezę zapisać jako
Dowód: Rozważmy funkcję r : x 7→ f (x) − Tan f (x − a). Funkcja ta jest n-płaska w a, bo jej pochodne w a do n-tej
włącznie się zerują. Zatem z twierdzenia 8.14.4 istnieje ξ ∈ (a, b) takie, że
r(n+1) (ξ)
r(b) = (b − a)n+1 .
(n + 1)!
Ale r(n+1) (x) = f (n+1) (x), bo (n + 1)-sza pochodna wielomianu stopnia co najwyżej n zeruje się, Zatem
f (n+1) (ξ)
(b − a)n+1 = r(b) = f (b) − Tan f (b − a),
(n + 1)!
skąd wynika (8.38).
8.14. WZORY TAYLORA I SZEREG TAYLORA. 213
-2 -1 1 2 3 4
x0 x0+h
-1
Rysunek 8.11: Wykres funkcji f (niebieski), prostej stycznej do wykresu f w punkcie x0 (pomarańczowy). Na prawo od
x0 wykres jest ponad styczną, a na lewo jest pod styczną. Gdy wykres funkcji jest pod styczną po jednej stronie, a ponad
styczną po drugiej stronie punktu x0 , w którym poprowadzono styczną, mówimy, że f ma w x0 punkt przegięcia. Wykres
nad styczną objawia się nierównością ∆x0 f (h) > f 0 (x0 )h, a wykres pod styczną nierównością przeciwną. W przypadku, gdy
po obu stronach x0 wykres jest nad styczną, mówimy, że funkcja jest wypukła w x0 . W przypadku, gdy po obu stronach
x0 wykres jest pod styczną, mówimy, że funkcja jest wklęsła w x0 . Punkt przegięcia to punkt, w którym funkcja zmienia
się z wypukłej na wklęsłą lub odwrotnie. Określenie wypukła i wklęsła dobrane jest umownie i niektórzy autorzy stosują je
odwrotnie.
W programie Mathematica n-ty wielomian Taylora funkcji f w punkcie u wyliczony dla argumentu (x − u) uzyskamy
instrukcją
Series[f[x],{x,u,n}]
Na przykład pisząc
otrzymujemy
x2 x3 x4 x5 x6 7
1+x+ + + + + + O [x]
2 6 24 120 720
7
Wyrażenie O [x] jest tutaj niezbyt fortunnym, choć dającym się wytłumaczyć, sposobem zapisania reszty Lagrange’a.
214 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
Definicja 8.14.6 Mówimy, że funkcja f : (a, b) → R ma punkt przegięcia w x0 ∈ (a, b) jeżeli f jest różniczkowalna w
x0 oraz istnieje δ > 0 taka, że dla 0 < |h| < δ funkcja
jest stała i różna od zera, to znaczy stale równa jeden lub stale równa minus jeden.
Aby zinterpretować wzór w definicji punktu przegięcia rozważmy układ współrzędnych z początkiem przesuniętym do
punktu (x0 , f (x0 )) (rys. 8.11 ). Jest to równoważne przyjęciu założenia, że x0 = 0 = f (x0 ). Wtedy ∆x0 f (h) = f (h), znak
wyrażenia f (h) − f 0 (x0 )h rozstrzyga czy wykres f jest nad czy pod styczną do wykresu w zerze, a stałość iloczynu znaków
h i f (h) − f 0 (x0 )h oznacza, że jeśli f (h) jest nad styczną dla h > 0, to jest pod styczną dla h < 0 i na odwrót, jeśli f (h) jest
pod styczną dla h > 0, to jest nad styczną dla h < 0. A więc wykres przegina się względem stycznej.
Twierdzenie 8.14.7 Niech f : (a, b) → R będzie klasy C n dla n 2 oraz niech f (i) (x0 ) = 0 dla i = 1, 2, . . . n − 1
i f (n) (x0 ) 6= 0. Jeśli n jest parzyste, to f ma w x0 maksimum lokalne gdy f (n) (x0 ) < 0 bądź minimum lokalne gdy
f (n) (x0 ) > 0. Natomiast jeśli n jest nieparzyste, to f ma w x0 punkt przegięcia.
Dowód: Ponieważ f jest klasy C n , więc f (n) jest funkcją ciągłą, zatem w pewnym otoczeniu punktu x0 ma stały znak.
Wybierzmy δ > 0 tak, by sgn f (n) (x) było stale równe a ∈ {−1, 1} gdy 0 < |x − x0 | < δ i rozważmy h ∈ R takie, że
0 < |h| < δ. Ze wzoru Taylora z resztą Lagrange’a dostajemy
Przy parzystej wartości n prawa strona powyższej równości ma wartość a dla h 6= 0 oraz zero dla h = 0. Dla a = 1 wnosimy
stąd, że lewa strona jest zawsze nieujemna, czyli ∆x0 f (h) 0. W efekcie otrzymujemy f (x0 + h) f (x0 ) gdy |h| < δ co
oznacza, że przy a = 1, czyli gdy f (n) (x0 ) > 0, funkcja f ma w x0 minimum lokalne. Gdy a = −1, czyli gdy f (n) (x0 ) < 0,
rozumując analogicznie, wnosimy, że funkcja f ma w x0 maksimum lokalne. Natomiast przy n nieparzystym n + 1 jest
parzyste, więc, pamiętając, że z założenia f 0 (x0 ) = 0, dostajemy
sgn [∆x0 f (h) − f 0 (x0 )h] sgn h = sgn [∆x0 f (h)] sgn h = a(sgn h)n+1 = a,
Definicja 8.14.8 Mówimy, że funkcja f : (a, b) → R jest klasy C ∞ jeżeli jest klasy C n dla każdego n ∈ N.
Definicja 8.14.9 Niech f : (a, b) → R będzie funkcją klasy C ∞ i niech x0 ∈ (a, b). Szereg formalny (bez pytania o
zbieżność)
∞
X f (i) (x0 ) i
h
i=0
i!
nazywamy szeregiem Taylora funkcji f w punkcie x0 dla argumentu h i oznaczamy Tx0 f (h).
Przykład 8.14.10 Pochodną rzeczywistej funkcji wykładniczej exp : R 3 x → ex ∈ R jest ona sama. Zatem wszystkie
jej pochodne są jej równe. W szczególności funkcja wykładnicza jest klasy C ∞ oraz exp(n) (0) = exp(0) = 1. Zatem
łatwo sprawdzamy, że szeregiem Taylora rzeczywistej funkcji wykładniczej w zerze jest
∞
X 1 i
h,
i=0
i!
a więc ten sam szereg, który posłużył nam do zdefiniowania funkcji wykładniczej. O szeregu tym wiemy, że jest zbieżny
do exp(h).
Wzór Taylora z resztą Lagrange’a podpowiada nam jak zagwarantować zbieżność szeregu Taylora.
Twierdzenie 8.14.11 Niech f : (a, b) → R będzie klasy C ∞ i niech x0 ∈ (a, b). Jeżeli istnieją stałe ε > 0 oraz M > 0
takie, że dla wszystkich n ∈ N oraz x ∈ (x0 − ε, x0 + ε) zachodzi |f (n) (x)| ¬ M to dla |h| < ε szereg Taylora Tx0 f (h)
jest zbieżny do f (x0 + h), co możemy też zapisać w postaci
∞
X f (i) (x0 )
f (x0 + h) = hi .
i=0
i!
Dowód: Ustalmy h ∈ R takie, że |h| < ε i niech sn := Txn0 f (h) oraz rn := f (x0 + h) − sn . Ze wzoru Taylora z resztą
Lagrange’a (tw. 8.14.5 ) dla pewnego ξ ∈ (a, b) mamy
Na mocy uwagi 6.1.2 prawa strona powyższej nierówności zmierza do zera przy n dążącym do nieskończoności. Zatem
limn→∞ rn = 0, skąd limn→∞ sn = f (x0 + h).
Jeśli założenia powyższego twierdzenia nie są spełnione, nie oznacza to, że teza nie zachodzi. Uzasadnienie zbieżności
wymaga jednak oddzielnego rozumowania, tak jak w poniższym przykładzie.
216 ROZDZIAŁ 8. POCHODNE I RÓŻNICZKI.
Przykład 8.14.12 Skonstruujemy szereg Taylora funkcji ln w otoczeniu jedynki. Indukcyjnie sprawdzamy, że dla
n1
(n − 1)!
ln(n) (x) = (−1)n−1 . (8.40)
xn
Zatem ln(n) (1) = (−1)n (n − 1)!. Stąd szereg Taylora dla funkcji ln w punkcie jeden ma postać.
∞ ∞
X (−1)i−1 (i − 1)! X (−1)i−1
(T1 ln)(h) = ln 1 + hi = hi .
i=1
i! i=1
i
Wypisanie szeregu oczywiście nie oznacza jego zbieżności. Ze wzoru (8.40) wnosimy, że nie da się oszacować | ln(n) (x)|
w otoczeniu jedynki niezależnie od n, bo z uwagi 6.1.2 wynika, że limn→∞ (n−1)!
xn = ∞. Zatem nie da się zastosować
twierdzenia 8.14.11 . Jednak poradzimy sobie inaczej. Ze wzoru Taylora z resztą Lagrange’a mamy dla h ∈ (0, 1) i
pewnego ξ ∈ (1, 1 + h)
n
X (−1)i−1 i (−1)n 1
ln(1 + h) − h = hn+1 ¬ .
i=1
i (n + 1)ξ n+1 n+1
Ponieważ prawa strona otrzymanej nierówności zmierza do zera przy n zmierzającym do nieskończoności otrzymujemy
n
X (−1)i−1
lim ln(1 + h) − hi = 0
n→∞
i=1
i
h h2 h3
ln(1 + h) = − + − ....
1 2 3
Można pokazać, że zbieżność ma miejsce również dla h ∈ (−1, 0), ale dowód tego faktu pomijamy.
Rozdział 9
Całka oznaczona
217
218 ROZDZIAŁ 9. CAŁKA OZNACZONA
Rysunek 9.1: Przybliżanie pola figury poprzez zliczanie kwadratów wpisanych w figurę i pokrywających figurę w sieci
kwadratowej na płaszczyźnie.
Rysunek 9.2: Po lewej obszar pod wykresem funkcji. Po prawej aproksymacja pola powierzchni tego obszaru od dołu sumą
pól prostokątów zawartych w obszarze oraz aproksymacja od góry sumą pól prostokątów pokrywających obszar.
9.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ 219
Niech x : { 0, 1, 2, . . . n } → [a, b] będzie silnie rosnącym, skończonym ciągiem takim, że x0 = a i xn = b. Łatwo sprawdzić,
że wtedy rodzina
P x := { [xi−1 , xi ] | i = 1, 2, . . . n }
jest podziałem przedziału [a, b], zwanym podziałem zadanym ciągiem x.
Łatwo zauważyć, że każdy podział P ∈ Podz(I) przedziału I = [a, b] ∈ Przedz(R) jest zadany pewnym ciągiem x :
{ 0, 1, 2, . . . n } → [a, b]. W istocie ciąg x zadający podział P otrzymamy biorąc zbiór końców przedziałów w P ustawiony w
ciąg rosnący. Ciąg ten nazywać będziemy ciągiem zadającym podział P i oznaczać xP .
Zatem podziały przedziału I = [a, b] ∈ Przedz(R) możemy utożsamiać ze skończonymi, silnie rosnącymi ciągami liczb
rozpoczynającymi się od liczby a i kończącymi się na liczbie b.
Następująca uwaga jest oczywista.
Uwaga 9.1.1 Jeśli P jest podziałem przedziału I, to
X
len I = len P.
P ∈P
Definicja 9.1.2 Niech P 1 , P 2 ∈ Podz(I) będą podziałami przedziału I ∈ Przedz(R). Mówimy, że podział P 2 jest
podpodziałem podziału P 1 i piszemy P 2 @ P 1 jeżeli dla każdego przedziału P2 ∈ P 2 istnieje przedział P1 ∈ P 1 taki,
że P2 ⊂ P1 .
Łatwo zaobserwować, że podział P 2 ∈ Podz(I) jest podpodziałem podziału P 1 ∈ Podz(I) wtedy i tylko wtedy gdy ciąg
zadający podział P 1 jest podciągiem ciągu zadającego podział P 2 .
Uwaga 9.1.3 Niech P 1 , P 2 będą dwoma dowolnymi podziałami przedziału I ∈ Przedz(R). Istnieje podział P 3 prze-
działu I taki, że P 3 @ P 1 i P 3 @ P 2 .
Dowód: Jako podział P 3 wystarczy wziąć podział zadany przez zbiór końców przedziałów w P 1 ∪ P 2 posortowany w
ciąg rosnący.
Jeśli funkcja f ma wartości nieujemne, to iloczyny m(f, [xi−1 , xi ])(xi − xi−1 ) i M (f, [xi−1 , xi ])(xi − xi−1 ) odpowiadaja˛ polu prostokatów
˛ o
podstawie [xi−1 , xi ] i wysokości równej odpowiednio kresowi dolnemu i kresowi górnemu funkcji f na przedziale [xi−1 , xi ]. Zatem suma dolna Darboux i
suma górna Darboux daja˛ odpowiednio przybliżenie od dołu i od góry pola pod wykresem funkcji f .
nazywamy odpowiednio całką dolną i całką górną funkcji f . Jeżeli L(f ) = U (f ), to funkcję f nazywamy całkowalną w
R lub krótko całkowalną. W takim przypadku liczbę L(f ) = U (f ) nazywamy całką Riemanna funkcji
sensie Riemanna
f i oznaczamy f . Zbiór funkcji ograniczonych f : [a, b] → R, które są całkowalne w sensie Riemanna oznaczamy
Riem([a, b]).
Przykład 9.1.7 Najprostszym przykładem funkcji całkowalnej w sensie Riemanna jest funkcja stała c[a,b] . Rzeczy-
wiście, dla dowolnego przedziału P ⊂ [a, b] mamy m(c[a,b] , P ) = M (c[a,b] , P ) = c, zatem dla dowolnego podziału
P ∈ Podz([a, b]) jest X X
L(c[a,b] , P) = U (c[a,b] , P) = c len P = c len P = c(b − a).
P ∈P P ∈P
Jeśli P ⊂ [0, 1] jest przedziałem o niepustym wnętrzu, to m(fD , P ) = 0 i M (fD , P ) = 1. Stąd dla dowolnego P ∈
Podz([0, 1]) mamy L(fD , P) = 0 i U (fD , P) = 1. W konsekwencji L(fD ) = 0 6= 1 = U (fD ). Zatem funkcja Dirichleta
nie jest całkowalna w sensie Riemanna.
9.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ 221
Definicja całkowalności (definicja 9.1.6 ) jest intuicyjna, ale nie daje praktycznego kryterium rozstrzygania, które funkcje sa,˛ a które nie sa˛ całkowalne.
Ćwiczenie 9.1.9 pokazuje, że funkcja nie musi być ciagła,
˛ by być całkowalna.˛ Z drugiej strony z przykładu 9.1.8 wnosimy, że nie można oczekiwać, by każda
funkcja ograniczona była całkowalna. W kolejnych dwóch rozdziałach podamy bardziej praktyczne kryteria całkowalności.
L(f, P 1 ) ¬ L(f, P 2 ).
L(f, P 1 ) ¬ U (f, P 2 ).
Dowód: Niech P 1 , P 2 ∈ Podz([a, b]) będą ustalonymi podziałami przedziału [a, b]. Z Uwagi 9.1.3 znajdziemy podział
P 3 ∈ Podz([a, b]) taki, że P 3 @ P 1 oraz P 3 @ P 2 . Zatem z uwagi 9.1.5 i z lematu 9.1.10 dostajemy
Z powyższgo wniosku dostajemy natychmiast następujący wniosek
L(f ) ¬ U (f ).
Jesteśmy teraz przygotowani, by pokazać następującą charakteryzację funkcji całkowalnych w sensie Riemanna.
222 ROZDZIAŁ 9. CAŁKA OZNACZONA
Twierdzenie 9.1.13 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy
dla każdego ε > 0 istnieje podział P ∈ Podz([a, b]) przedziału [a, b] taki, że
Dowód: Przyjmijmy najpierw, że f jest całkowalna w sensie Riemanna. Ustalmy ε > 0. Z definicji całki dolnej i górnej
do ε/2 znajdziemy podziały P 1 , P 2 ∈ Podz([a, b]) takie, że
ε ε
L(f, P 1 ) > L(f ) − oraz U (f, P 2 ) < U (f ) + .
2 2
Na mocy uwagi 9.1.3 możemy wybrać podział P 3 ∈ Podz([a, b]) taki, że P 3 @ P 1 oraz P 3 @ P 2 . Z lematu 9.1.10 oraz z
(9.1.4) dostajemy
ε ε
U (f, P 3 ) − L(f, P 3 ) ¬ U (f, P 2 ) − L(f, P 1 ) < U (f ) + − L(f ) − = ε,
2 2
bo z założenia L(f ) = U (f ). Zatem podział P 3 spełnia wymóg (9.3).
Dla dowodu przeciwnej implikacji przyjmijmy nie wprost, że f nie jest całkowalna w sensie Riemanna. Wtedy L(f ) 6=
U (f ), zatem z wniosku 9.1.12 wynika, że L(f ) < U (f ). Z definicji sum dolnych i górnych wnosimy, że dla dowolnego
P ∈ Podz([a, b]) mamy
U (f, P) − L(f, P) U (f ) − L(f ).
W szczególności wynika stąd, że dla ε := U (f )−L(f
2
)
, które na mocy przyjętego założenia jest dodatnie, nie znajdziemy
podziału P spełniającego warunek (9.3). A to dowodzi, że implikacja przeciwna również zachodzi.
Dowód: Własności (i) oraz (ii) miary zewnętrznej wynikają wprost z definicji. Aby pokazać własność (iii) ustalmy
Ei , a dokładniej z definicji kresu dolnego do 2εi znajdziemy przeliczalną rodzinę przedziałów
ε > 0. Z definicji µ∗ dla zbioru S
Ai ⊂ Przedz(R) taką, że Ei ⊂ Ai oraz
X ε
len A < µ∗ (Ei ) + i .
2
A∈Ai
S∞
Wtedy A := i=1 Ai ⊂ Przedz(R) jest również rodziną przeliczalną. Co więcej, mamy
∞
[ ∞ [
[ [
Ei ⊂ Ai = A
i=1 i=1
9.2. WŁASNOŚCI CAŁKI RIEMANNA 223
oraz
∞ ∞ X ∞ ∞
[ X X X ε X ∗
µ∗ ( Ei ) ¬ len A ¬ len A ¬ µ∗ (Ei ) + = µ (Ei ) + ε
i=1 i=1 A∈Ai i=1
2i i=1
A∈A
Przykład 9.1.16 Zbiorem miary zero jest każdy skończony zbiór punktów.
Przykład 9.1.17 Zbiór Q liczb wymiernych jest zbiorem miary zero. Rzeczywiście, wiemy że zbiór liczb wymiernych
jest przeliczalny, więc istnieje ciąg x : N1 → Q, który jest bijekcją. Ustalmy dowolneS ε > 0 i dla nP∈ N1 połóżmy
An := [xn − 2n+1
ε
, xn + 2n+1
ε
]. Niech A := { An | n ∈ N1 } ⊂ Przedz(R). Oczywiście Q ⊂ A, a ponadto n∈N1 len An =
P∞ ε
n=1 2n = ε. Wobec dowolności ε > 0 dostajemy µ (Q) = 0.
∗
Wniosek 9.1.18 Suma co najwyżej przeliczalnej rodziny zbiorów miary zero jest zbiorem miary zero.
Następujące twierdzenie daje charakteryzację funkcji całkowalnych w sensie Riemanna poprzez miarę zewnętrzną zbioru
punktów nieciągłości funkcji. W szczególności wynika z niego, że każda funkcja ciągła jest całkowalna w sensie Riemanna.
Dowód jest dość skomplikowany i go pomijamy.
Twierdzenie 9.1.19 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy
zbiór punktów, w których nie jest ciągła ma miarę zero. W szczególności, jeśli f jest ciągła, to jest całkowalna w sensie
Riemanna.
Dowód: Niech P będzie podziałem przedziału [a, b] i niech P ∈ P będzie przedziałem tego podziału. Ponieważ założyliśmy,
że f ¬ g, z twierdzenia 2.3.11 dostajemy m(f, P ) ¬ m(g, P ), a w konsekwencji również L(f, P) ¬ L(g, P). Stosując ponownie
twierdzenie 2.3.11 , ale do funkcji
P 7→ L(f, P), P 7→ L(g, P)
dostajemy L(f ) ¬ L(g). Podobnie dostajemy U (f ) ¬ U (g). Dowodzi to pierwszej części twierdzenia. Część druga wynika
natychmiast z pierwszej i z definicji całkowalności w sensie Riemanna.
224 ROZDZIAŁ 9. CAŁKA OZNACZONA
Twierdzenie 9.2.2 Jeśli f, g : [a, b] → R są całkowalne w sensie Riemanna to f + g oraz f − g są całkowalne w sensie
Riemanna oraz
(f + g) = f + g (f − g) = f − g.
R R R R R R
i
Ponadto, dla dowolnego α ∈ R funkcja αf jest całkowalna w sensie Riemanna oraz
(αf ) = α f.
R R
Dowód: Niech P będzie podziałem przedziału [a, b] i niech P ∈ P będzie przedziałem tego podziału. Z twierdzenia 2.3.7
(ii) wnosimy, że
m(f + g, P ) m(f, P ) + m(g, P ) oraz M (f + g, P ) ¬ M (f, P ) + M (g, P ).
Zatem X X X
L(f + g, P) = m(f + g, P ) len P m(f, P ) len P + m(g, P ) len P = L(f, P) + L(g, P).
P ∈P P ∈P P ∈P
Podobnie sprawdzamy, że
U (f + g, P) ¬ U (f, P) + U (g, P).
Ustalmy ε > 0. Z założenia o całkowalności w sensie Riemanna funkcji f i g oraz z twierdzenia 9.1.13 znajdziemy podziały
P 1 , P 2 przedziału [a, b] takie, że
ε ε
U (f, P 1 ) − L(f, P 1 ) < oraz U (g, P 2 ) − L(g, P 2 ) < .
2 2
Z uwagi 9.1.3 znajdziemy podział P 3 przedziału [a, b] taki, że P 3 @ P 1 i P 3 @ P 2 . Wtedy, wykorzystując lemat 9.1.10 i
wcześniej pokazane nierówności, dostajemy
ε ε
U (f + g) ¬ U (f + g, P 3 ) ¬ U (f, P 3 ) + U (g, P 3 ) ¬ U (f, P 1 ) + U (g, P 2 ) < L(f, P 1 ) + + L(g, P 2 ) + ¬ L(f ) + L(g) + ε,
2 2
co, wobec dowolności ε > 0, pokazuje, że
U (f + g) ¬ L(f ) + L(g).
Podobnie dowodzimy, że
L(f + g) U (f ) + U (g).
Zatem, wobec całkowalności w sensie Riemanna funkcji f i g, dostajemy
co dowodzi, że L(f + g) = U (f + g), czyli, że f + g jest całkowalna w sensie Riemanna, a ponadto pokazuje, że
(f + g) = f + g.
R R R
Dowód dla różnicy i iloczynu funkcji przez stałą jest podobny i zostawiamy go jako ćwiczenie.
Jako prosty wniosek z przykładu 9.1.7 , twierdzenia 9.2.1 i twierdzenia 9.2.2 dostajemy następującą uwagę.
f ¬ (b − a) sup |f (x)|.
R
x∈[a,b]
9.2. WŁASNOŚCI CAŁKI RIEMANNA 225
jest normą, która zadaje w Riem([a, b]) strukturę przestrzeni wektorowej unormowanej, a tym samym strukturę prze-
strzeni metrycznej. Co więcej, zachodzi wzór
a odwzorowanie
Riem([a, b]) 3 f 7→ f ∈ R (9.6)
R
jest liniowe. Odwzorowanie to jest też funkcją Lipschitza ze stałą b − a = len[a, b], a więc w szczególności jest odwzo-
rowaniem ciągłym.
Dowód: Fakt, że Riem([a, b]) jest przestrzenią wektorową nad ciałem R wynika wprost z twierdzenia 9.2.2 . Sprawdzenie,
że odwzorowanie (9.4) jest normą w Riem([a, b]) zostawiamy jako proste ćwiczenie. Z kolei liniowość odwzorowania (9.6)
wynika również z twierdzenia 9.2.2 . Z uwagi 9.2.3 dostajemy wzór (9.5), a z niego dla f, g ∈ Riem([a, b]) wnioskujemy, że
f − g = (f − g) ¬ (b − a)||f − g||,
R R R
Dowód: Z ciągłości funkcji ϕ wnosimy, że w punktach w których f jest ciągła, ciągłe jest też złożenie ϕ ◦ f . Zatem
zbiór punktów nieciągłości ϕ ◦ f jest podzbiorem zbioru punktów nieciągłości funkcji f . Na mocy twierdzenia 9.1.19 zbiór
punktów nieciągłości funkcji f jest miary zero. Oznacza to, że zbiór punktów nieciągłości ϕ ◦ f jest również miary zero.
Stosując ponownie twierdzenie 9.1.19 dostajemy ϕ ◦ f ∈ Riem([a, b]), co dowodzi własności (i).
Aby pokazać własność (ii) zauważmy, że z twierdzenia 9.2.2 wiemy, iż f + g, f − g ∈ Riem([a, b]). Zatem na mocy (i)
(f + g)2 , (f − g)2 ∈ Riem([a, b]) i ponownie z twierdzenia 9.2.2 dostajemy
(f + g)2 − (f − g)2
f ·g = ∈ Riem([a, b]).
4
Pozostaje
R pokazać
R własność (iii). Z (i) wnosimy, że |f | ∈ Riem([a, b]), a z nierówności −|f | ¬ f ¬ |f | i z twierdzenia 9.2.1
dostajemy f ¬ |f |.
226 ROZDZIAŁ 9. CAŁKA OZNACZONA
Twierdzenie 9.2.6 Niech f : [a, b] → R będzie funkcją ograniczoną i niech P będzie ustalonym podziałem przedziału
[a, b] zadanym ciągiem x : { 0, 1, 2, . . . k } → [a, b]. Funkcja f jest całkowalna w sensie Riemanna wtedy i tylko wtedy
gdy zawężenia fi := f|[xi−1 ,xi ] są całkowalne w sensie Riemanna dla wszystkich i = 1, 2, . . . k. Co więcej, w takim
przypadku Pk R
f = i=1 fi . (9.7)
R
Dowód: Zauważmy, że zbiór punktów nieciągłości funkcji f jest sumą mnogościową zbiorów punktów nieciąglości funkcji
fi dla i = 1, 2, . . . k. Tak więc fakt, że f jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy zawężenia fi są
całkowalne w sensie Riemanna wynika bezpośrednio z twierdzenia 9.1.19 i twierdzenia 9.1.15 .
Aby pokazać (9.7) udowodnimy najpierw, że lewa strona jest nie większa niż prawa. W tym celu ustalmy ε > 0 i
dobierzmy podział P̄ @ P taki, że U (f, P̄) − L(f, P̄) < ε. Połóżmy P̄ i := { P ∈ P̄ | P ⊂ [xi−1 , xi ] }. Mamy
Pk Pk R
f ¬ U (f, P̄) ¬ L(f, P̄) + ε = L(fi , P̄ i ) + ε ¬ fi + ε
R
i=1 i=1
Pk R
i wobec dowolności ε > 0 dostajemy f ¬ i=1 fi .
R
Aby pokazać nierówność przeciwną ponownie ustalmy ε > 0. Dla i = 1, 2, . . . k do kε dobierzmy taki podział P i przedziału
Sk
[xi−1 , xi ], że U (fi , P i ) − L(fi , P i ) < kε . Wtedy P̄ := i=1 P i jest podziałem przedziału [a, b] i mamy
k
X Pk Pk
U (fi , P i ) ¬ L(fi , P i ) + ε
= L(f, P̄) + ε ¬ f + ε
R R
fi ¬ i=1 i=1 k
i=1
Pk R
co wobec dowolności ε > 0 daje fi ¬ f .
R
i=1
Definicja 9.2.7 Niech f : R 9 R będzie funkcją ograniczoną. Załóżmy, że dla a < b zachodzi [a, b] ⊂ dom f .
Mówimy, że f jest całkowalna w sensie Riemanna na przedziale [a, b], jeżeli zwężenie f|[a,b] jest funkcją całkowalną w
sensie Riemanna. W takim przypadku całkę f|[a,b] nazywamy całką Riemanna funkcji f na przedziale [a, b] lub całką
R
Wniosek 9.2.8 Jeśli f : R 9 R jest całkowalna w sensie Riemanna na przedziale [a, b] oraz c ∈ (a, b), to f jest
całkowalna w sensie Riemanna na przedziałach [a, c] i [c, b] oraz
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx. (9.10)
a a c
Gdy a = b przedział [a, b] jest singletonem. R a Wtedy jego długość wynosi zero i w konsekwencji sumy górne, sumy dolne,
całki górna i dolna, wynoszą zero. Zatem a f = 0 dla dowolnego a ∈ dom f . Wygodnie jest rozszerzyć oznaczenie na całkę
oznaczoną dopuszając przypadek a b.
˛ a = b odstalibyśmy
Gdyby we wzorze 9.10 przyjać
Z a Z c Z a
0= f (x)dx = f (x)dx + f (x)dx
a a c
Rozszerzamy oznaczenia (9.8) i (9.9) przyjmując dla b ¬ a takich, że [b, a] ⊂ dom f oznaczenia
Z b Z b Z a
f (x)dx := f := − f
a a b
Wniosek 9.2.9 Niech f : R 9 R będzie funkcją ograniczoną i niech a, b, c ∈ R. Jeśli f jest całkowalna w sensie
Riemanna na przedziałach o końcach a i b, a i c oraz b i c, to
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx.
a a c
W programie Mathematica całkę oznaczoną z funkcji f na przedziale [a, b] obliczamy używając instrukcji
Integrate[f[x], {x, a, b}]
W miarę swoich możliwości Mathematica stara się zwrócić dokładny wynik. Na przykład
Integrate[Sqrt[1 - x^2], {x, 0, 1}]
zwraca 4.
π
Przypomnijmy, że dla podziału P przedziału [a, b] przez δ(P) rozumiemy średnicę P daną wzorem (9.1).
Twierdzenie 9.2.11 (Riemanna). Niech f : [a, b] → R będzie funkcją ograniczoną. Funkcja ta jest całkowalna w
sensie Riemanna wtedy i tylko wtedy gdy istnieje liczba g ∈ R taka, że dla każdego ε > 0 istnieje δ > 0 taka, że dla
każdej pary aproksymacyjnej (P, Ξ) dla f na przedziale [a, b] mamy
Dowód pomijamy.
Program, który liczy przybliżenie całki Z x
f (t)dt
0
w oparciu o sumy Riemanna
n
X 1 i
sn := f ( x)
i=1
n n
przedstawia listing 9.1 . Podobny program w języku C++ przedstawia listing 9.2 .
Wyrazy ciągu sn powinny przybliżać pole ćwiartki koła, czyli
π
= 0.7853981633974483...,
4
natomiast 20-ty wyraz ciągu sn wyliczony przez program to
s20 = 0.785397208948704.
Widzimy więc, że z punktu widzenia liczenia liczby π ta technika jest gorsza niż zastosowana wcześniej technika szeregów.
Jednak pożytki z niej leżą gdzie indziej.
Ćwiczenie komputerowe 9.2.12 Adaptuj program z listingu 9.2 do policzenia przybliżenia pola soczewkowatej
figury na rys. 1.13 .
9.2. WŁASNOŚCI CAŁKI RIEMANNA 229
( ∗ P r z y b l i ż a n i e ca ł k i o z n a c z o n e j z f u n k c j i f od 0 do x p o p r z e z
p o l a m p r o s t o k a̧ t ów pod wykresem ∗ )
R i e m I n t e g r a l [ f_ , x_ , m_] :=
Module [ { s , k , y } ,
s = 0 . ; k = 0;
( ∗ Sumujemy w z m i e n n e j s warto s c i f u n k c j i w punktach x∗k/m ∗ )
Do[
y = x∗k/m;
s = s + f [y];
k = k + 1,
{m}
];
( ∗ Zwracamy sumȩ pomnoż on a̧ p r z e z wspó l n a̧ d ł ugo sć podstawy wynosz a̧ c a̧ 1/m ∗ )
s /m
]
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ R i e m I n t e g r a l . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P r z y b l i ż a n i e ca ł k i o z n a c z o n e j p o p r z e z p o l a p r o s t o k a̧ t ów ∗/
/∗ pod wykresem ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
/∗ P r z y b l i ż a n i e ca ł k i Riemanna f u n k c j i f od 0 do x suma̧ m p r o s t o k a̧ t ów
Z a p i s d o u b l e ( ∗ f ) ( d o u b l e ) oznacza , ż e argumentem f j e s t f u n k c j a ∗/
double R i e m I n t e g r a l ( double ( ∗ f ) ( double ) , double x , i n t m) {
double s =0;
/∗ Sumujemy w z m i e n n e j s warto s c i f u n k c j i w punktach x∗k/m ∗/
f o r ( i n t k=0;k<m; k=k+1){
double y=x∗k/m;
s=s+f ( y ) ;
}
/∗ Zwracamy sumȩ pomnoż on a̧ p r z e z wspó l n a̧ d ł ugo sć podstawy wynosz a̧ c a̧ 1/m ∗/
return s=s /m;
}
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
i n t m=1;
/∗ P r z y b l i żymy p o l e pod ć w i a r t k a̧ okr ȩ gu danego f u n k c j a̧ a r c nad [ 0 , 1 ]
Wykonamy 20 pr ób za ka żdym razem podwajaj a̧ c i l o sć p r z e d z i a ł ów ∗/
f o r ( i n t d=1;d<=20;d=d+1){
double p=R i e m I n t e g r a l ( arc , 1 . ,m) ;
/∗ Wydruk k o n t r o l n y : ca ł ka powinna by ć b l i s k a p i /4 ∗/
c o u t << "s[" << setw ( 2 ) << d << "] =" << setw ( 1 8 ) << p ;
c o u t << e n d l ;
m=m∗ 2 ;
}
}
Listing 9.2: Przybliżanie całki oznaczonej w C++
Rozdział 10
Jak wspomnieliśmy w rozdziale wst˛epnym Newton i Leibniz odkryli, że poj˛ecie pochodnej i poj˛ecie całki sa˛ ze soba˛ powiazane.
˛ Wzi˛ecie całki z pochodnej oraz
pochodnej z całki prowadza˛ do wyjściowej funkcji. W niniejszym rozdziale doprecyzujemy co to oznacza oraz zajmiemy si˛e pożytkami jakie z tego faktu płyna.˛
˛ a˛ pole pod wykresem funkcji. Ciekawsze jest nieco inne spojrzenie, w którym funkcj˛e f
która funkcji całkowalnej w sensie Riemanna przypisuje liczb˛e mierzac
ustalamy, natomiast zmieniamy jeden koniec przedziału, po którym całkujemy. Takie spojrzenie prowadzi do nast˛epujacego
˛ twierdzenia.
Twierdzenie 10.1.1 Niech f : [a, b] → R będzie funkcją całkowalną w sensie Riemanna. Rozważmy funkcję
Z x
F : [a, b] 3 x 7→ f (t)dt.
a
Wtedy
(i) funkcja F jest funkcją Lipschitza,
(ii) jeśli f jest ciągła w punkcie x0 ∈ [a, b] to F jest różniczkowalna w x0 oraz F 0 (x0 ) = f (x0 ).
Dowód: Aby pokazać własność (i) rozważmy x, y ∈ [a, b] spełniające x < y. Niech M := supx∈[a,b] |f (x)|. Podstawiając
y za b i x za c we wzorze (9.10) mamy Z y Z x Z y
f (t)dt = f (t)dt + f (t)dt.
a a x
Zatem Z y Z x Z x Z y Z x Z y
|F (y) − F (x)| = f (t)dt − f (t)dt = f (t)dt + f (t)dt − f (t)dt = f
a a a x a x
231
232 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Zatem dla |h| < δ, wykorzystując twierdzenie 9.2.2 , wniosek 9.2.8 , wzór (9.2) na całkę Riemanna funkcji stałej oraz
uwagę 9.2.3 , mamy
1
Z x0 +h Z x0 +h
= f (t)dt − f (x0 )dt
|h| x0 x0
1
Z x0 +h
= (f (t) − f (x0 ))dt
|h| x0
1
Z x0 +h
¬ |f (t) − f (x0 )| dt
|h| x0
1
Z x0 +h
¬ εdt
|h| x0
hε
=
h
= ε,
Definicja 10.1.2 Niech f : [a, b] → R. Mówimy, że F : [a, b] → R jest funkcją pierwotną funkcji f jeżeli F jest
różniczkowalna oraz F 0 (x) = f (x) dla każdego x ∈ [a, b].
Naturalne jest pytanie czy funkcja f może mieć więcej niż jedną pierwotną. Dodając do pierwotnej funkcję stałą dostajemy
inną pierwotną tej samej funkcji, bo pochodna funkcji stałej jest zero. Okazuje się, że więcej pierwotnych już nie ma jak
wynika z następującego twierdzenia.
Dowód: Niech F := F1 − F2 . Funkcja F jest różniczkowalna oraz F 0 = F10 − F20 = 0. Niech x, y ∈ [a, b] i x < y. Z
twierdzenia o wartości średniej wiemy, że istnieje ξ ∈ (x, y) takie, że
W szczególności zapis F ∈ f oznacza, że F jest funkcją pierwotną f . Przyjmując oznaczenie Const([a, b]) na rodzinę
R
Dowód: Jeśli F1 ∈ f jest inną pierwotną f , to na mocy twierdzenia 10.1.4 mamy F1 − F ∈ Const([a, b]), zatem
R
F1 ∈ F + Const([a, b]). Przeciwna inkluzja wynika natychmiast z twierdzenia o pochodnej sumy i funkcji stałej.
Stosowany jest również tradycyjny, choć mniej precyzyjny zapis
Z
F (x) = f (x)dx + C,
który należy interpretować tak, że wybierając jakąś pierwotną z całki nieoznaczonej i dodając do niej stałą dostaniemy inną
pierwotną.
W szczególności
Z b
f (t)dt = F (b) − F (a). (10.2)
a
Dla wygody w dalszym ciągu stosować będziemy zapis F |ba := F (b) − F (a).
Dowód: Pokażemy najpierw (10.2). Ustalmy ε > 0 i z twierdzenia 9.1.13 dobierzmy do tego ε podział P przedziału
[a, b] taki, że zachodzi nierówność U (f, P) − L(f, P) < ε. Niech podział P zadany będzie ciągiem x : { 0, 1, 2, . . . n } → [a, b].
234 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Z twierdzenia Lagrange’a o wartości średniej (wniosek 8.8.2 ) zastosowanego do F zawężonego do przedziałów [xi−1 , xi ] dla
i ∈ { 1, 2, . . . n } znajdziemy liczbę ti ∈ [xi−1 , xi ] taką, że
F (xi ) − F (xi−1 ) = F 0 (ti )(xi − xi−1 ) = f (ti )(xi − xi−1 ).
Sumując stronami te równości dostajemy
n
X n
X
F (b) − F (a) = (F (xi ) − F (xi−1 )) = f (ti )(xi − xi−1 ).
i=1 i=1
z których dostajemy
n
X
−U (f, P) ¬ − f (ti )(xi − xi−1 ) ¬ −L(f, P).
i=1
Z definicji całki dolnej i górnej wiemy, że
Z b
L(f, P) ¬ f (t)dt ¬ U (f, P).
a
Dodając ostatnie dwie nierówności stronami dostajemy
Z b n
X
−(U (f, P) − L(f, P)) ¬ f (t)dt − f (ti )(xi − xi−1 ) ¬ U (f, P) − L(f, P)
a i=1
co daje
Z b n
X
f (t)dt − f (ti )(xi − xi−1 ) ¬ U (f, P) − L(f, P).
a i=1
Zatem Z b n
X Z b
F (b) − F (a) − f (t)dt = f (ti )(xi − xi−1 ) − f (t)dt ¬ U (f, P) − L(f, P) < ε
a i=1 a
Twierdzenie 10.2.1 (liniowość całki nieoznaczonej). Niech f, g : [a, b] → R będą całkowalne w sensie Riemanna.
Wtedy f + g jest całkowalna w sensie Riemanna oraz
Z Z Z
(f + g) = f + g. (10.3)
Zauważmy, że wzory (10.3) i (10.4) należy rozumieć jako równość zbiorów, ponieważ całka nieoznaczona jest zbiorem, a
dokładniej zbiorem funkcji pierwotnych.
Dowód: Całkowalność funkcji f + g i funkcji αf dostajemy wprost z twierdzenia 9.2.2 . Zauważmy, że jeżeli F jest
pierwotną f , a G jest pierwotną g, to F +G jest pierwotną f +g na podstawie twierdzenia o pochodnej sumy funkcji. Dowodzi
to zawieranie się strony prawej w lewej we wzorze (10.3). Aby pokazać inkluzję przeciwną załóżmy, że H jest elementem
lewej strony równości (10.3). Wtedy H jest pierwotną funkcji f + g. Niech F będzie dowolnie ustaloną pierwotną funkcji f .
Połóżmy G := H − F . Mamy G0 = H 0 − F 0 = (f + g) − f = g. Zatem G jest pierwotną funkcji g, a ponieważ H = F + G,
więc H jest sumą pierwotnej funkcji f i pierwotnej funkcji g. Zatem H należy do prawej strony (10.3).
Dowód (10.4) jest podobny i zostawiamy go jako ćwiczenie.
Następujące twierdzenia są natychmiastową konsekwencją wniosku 10.1.6 oraz stosownych wzorów dla pochodnych.
Przyjmujemy w nich upraszczające oznaczenie Const na zbiór funkcji stałych na stosownie do wzoru dobranym zbiorze.
1 xα+1
Z Z
dx = ln |x| + Const, xα dx = + Const dla α 6= −1,
x α+1
Z
ex dx = ex + Const .
Dowód: Powyższe wzory wynikają kolejno z twierdzenia 8.1.2 , twierdzenia 8.1.3 , twierdzenia 8.11.2 , twierdzenia 8.11.3
oraz wniosku 8.4.3 .
Jeśli
R 0 jedna z dwóch całekR po prawej stronie jest łatwiejsza do policzenia niż druga, to wzór ten mozemy potraktować jako metod˛e sprowadzajac
˛ a˛ liczenie całki
f g do liczenia całki f g 0 . Jak zobaczymy, metoda ta może być użyteczna. Określana jest mianem całkowania przez cz˛eści.
236 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Dowód: Niech F będzie elementem lewej strony wzoru (10.5). Wtedy F 0 = f 0 g. Mamy
F = f g − (f g − F ).
Zatem aby pokazać, że F jest elementem prawej strony wzoru (10.5), wystarczy pokazać, że f g − F jest pierwotną funkcji
f g 0 . Jest tak w istocie, bo
(f g − F )0 = (f g)0 − F 0 = f 0 g + f g 0 − f 0 g = f g 0 .
Rozważmy teraz element prawej strony równości (10.5). Ma on postać f g − G, gdzie G jest pierwotną f g 0 . Musimy pokazać,
że f g − G jest pierwotną f 0 g. Rzeczywiście tak jest, bo
(f g − G)0 = f 0 g + f g 0 − f g 0 = f 0 g.
Aby pokazać (10.6) ustalmy funkcję pierwotną F dla f 0 g. Ze wzoru (10.5) wiemy, że F = f g − G, gdzie G jest pewną
pierwotną f g 0 . W szczególności
Z podstawowego twierdzenia rachunku różniczkowego i całkowego (tw. 10.1.7 ) oraz z definicji F i G jako funkcji pierwotnych
odpowiednio f 0 g oraz f g 0 otrzymujemy
Z b
F (b) − F (a) = f 0 (x)g(x)dx
a
Z b
G(b) − G(a) = f (x)g 0 (x)dx.
a
Musimy w tym celu przedstawić funkcję x 7→ x sin x jako iloczyn pewnej funkcji przez pochodną innej funkcji. Mamy
dwie możliwości:
x sin x = x(− cos x)0
lub 0
x2
x sin x = sin x
2
i nie jest oczywiste, z której lepiej skorzystać. Pierwsza sprowadzi problem do policzenia całki
Z
(x)0 (− cos x)dx,
a druga do całki
x2
Z
(sin x)0 dx.
2
Z tych dwóch całek zdecydowanie łatwiejsza jest pierwsza, bo
Z Z
(x)0 (− cos x)dx = − cos xdx = − sin x + Const .
Twierdzenie 10.4.1 Załóżmy, że f : [a, b] → R jest funkcją ciągłą, a g : [α, β] → [a, b] jest klasy C 1 . Jeśli F jest
pierwotną funkcji f to F ◦ g jest pierwotną funkcji (f ◦ g)g 0 . W konsekwencji
Z Z
(f ◦ g)g 0 = f ◦ g. (10.8)
W szczególności
Z β Z g(β)
f (g(t))g (t)dt =
0
f (x)dx. (10.9)
α g(α)
238 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Dowód: Jeśli F jest pierwotną funkcji f to z twierdzenia 8.3.2 o pochodnej złożenia wnosimy, że F ◦ g jest pierwotną
funkcji (f ◦ g) g 0 , zatem prawa strona zawiera się w lewej w (10.8). Aby pokazać, że lewa strona zawiera się w prawej
przyjmijmy, że G jest pierwotną funkcji (f ◦ g) g 0 . Wybierzmy też pewną pierwotną F funkcji f . Wiemy już, że wtedy F ◦ g
jest pierwotną (f ◦ g)g 0 , zatem na mocy twierdzenia 10.1.4 istnieje stała C taka, że G = F ◦ g + C. Mamy
G = F ◦ g + C = F ◦ g + C ◦ g = (F + C) ◦ g = F̄ ◦ g,
gdzie F̄ = F + C jest inną pierwotną f . Zatem G jako podstawienie g w pierwotnej F̄ funkcji f należy do prawej strony
równości (10.8).
Pozostaje pokazać (10.9). Wiemy, że jeśli F jest pierwotną f to F ◦ g jest pierwotną (f ◦ g)g 0 . Zatem z podstawowego
twierdzenia rachunku różniczkowego i całkowego (tw. 10.1.7 ) mamy
Z β
f (g(t))g 0 (t)dt = (F ◦ g)(β) − (F ◦ g)(α) = F (g(β)) − F (g(α)).
α
1 1 1
Z Z Z Z Z
ax dx = ex ln a dx = ex ln a ln adx = (f ◦ g) g 0 = f ◦g =
ln a ln a ln a
1 1 1 x ln a ax
Z
eu du ◦ (x 7→ x ln a) = (eu + Const) ◦ (x 7→ x ln a) = e + Const = + Const .
ln a ln a ln a ln a
R6
Przykład 10.4.3 Policzymy całkę oznaczoną 0
√ x
1+4x
dx sprowadzając ją do policzenia całki funkcji u → f (u), w
√ g 0 (x)
której chcemy podstawić u = g(x) gdzie g(x) = 1 + 4x. Wtedy mamy g 0 (x) = √ 2
1+4x
= 2
u skąd dostajemy 1
u = 2 .
u2 −1
Mamy też x = g −1 (u) = 4 . Zatem
x u2 − 1 1 1
√ = · = (g(x)2 − 1)g 0 (x).
1 + 4x 4 u 8
Twierdzenie 10.5.1 (o wartości średniej dla całek) Niech f : [a, b] → R będzie funkcją klasy C 1 , a g : [a, b] → R
funkcją całkowalną w sensie Riemanna. Jeśli g ma stały znak na [a, b] to istnieje ξ ∈ [a, b] takie, że
Z b Z b
f g = f (ξ) g. (10.10)
a a
Dowód: Rozważmy przypadek g 0. Połóżmy m := inf { f (x) | x ∈ [a, b] }, M := sup { f (x) | x ∈ [a, b] }. Z twierdze-
nia 4.7.3 wiemy, że m i M są dobrze określonymi, skończonymi liczbami rzeczywistymi, bo f jest określona na przedziale
[a, b], który na mocy twierdzenia 3.6.8 jest zbiorem zwartym. Ustalmy x ∈ [a, b]. Wtedy m ¬ f (x) ¬ M , a zatem również
mg(x) ¬ f (x)g(x) ¬ M g(x). Z twierdzenia 9.2.1 dostajemy
Z b Z b Z b
m g(t)dt ¬ f (t)g(t)dt ¬ M g(t)dt.
a a a
Rb Rb
Z otrzymanej nierówności wynika, że jeśli g = 0, to również a f g = 0 i w konsekwencji (10.10) zachodzi dla dowolnie
a
Rb
dobranego ξ. Pozostaje zatem rozważyć przypadek a g 6= 0. Wtedy
Rb
fg
m ¬ Ra b ¬ M.
a
g
W programie Mathematica całkę nieoznaczoną (a dokładniej jedną z funkcji pierwotnych) funkcji f obliczamy używając
instrukcji
Integrate[f[x], x]
Na przykład
Integrate[Sin[3 x]^7, x]
zwraca
35 7 7 cos(21x)
− cos(3x) + cos(9x) − cos(15x) +
192 192 960 1344
240 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Definicja 10.6.1 Mówimy, że f jest całkowalna w sensie Riemanna jeżeli funkcje fi są całkowalne w sensie Riemanna
dla wszystkich i = 1, 2, . . . , m. W takim przypadku jako całkę Riemanna f przyjmujemy
!
Z b Z Z b Z b b
f := f1 , f2 , . . . , fm .
a a a a
Twierdzenie 10.6.2 Niech f : [a, b] → Rm będzie całkowalna w sensie Riemanna. Wtedy funkcja
Dowód: Niech f = (f1 , f2 , . . . fm ). Z założenia funkcje fi są całkowalne w sensie Riemanna. Ponieważ funkcja
Rm 3 x 7→ ||x|| ∈ R
jest ciągła, zbiór punktów nieciągłości funkcji ||f || zawiera się w sumie mnogościowej zbiorów punktów nieciągłości funkcji
fi . Na mocy twierdzenia 9.1.19 całkowalność funkcji fi implikuje, że zbiór punktów nieciągłości funkcji fi jest miary zero.
Zatem również zbiór punktów nieciągłości funkcji ||f || jest miary zero, a więc z twierdzenia 9.1.19 wnosimy, że funkcja ta
jest całkowalna w sensie Riemanna.
Rb
Połóżmy vi := a fi i v = (v1 , v2 , . . . vm ). Jeśli v = 0 to teza jest oczywista. Załóżmy zatem, że v 6= 0. Dla x ∈ [a, b]
mamy z nierówności Schwartza
|v · f (x)| ¬ ||v|| ||f (x)||.
Funkcja
m
X
[a, b] 3 x 7→ v · f (x) = vi fi (x) ∈ R
i=1
Rb
Ponieważ v = a
f , dowodzi to tezy.
10.7. ZASTOSOWANIA GEOMETRYCZNE CAŁEK 241
Definicja 10.7.1 Mówimy, że krzywa γ jest prostowalna jeżeli istnieje kres górny
Twierdzenie 10.7.2 Niech γ : [a, b] → Rm będzie krzywą klasy C 1 . Wtedy γ jest prostowalna oraz
Z b
Λ(γ) = ||γ 0 (t)||dt. (10.11)
a
Dowód: Pokażemy najpierw, że w (10.11) lewa strona jest niewiększa od prawej. Niech P będzie podziałem przedziału
[a, b] wyznaczonym przez punkty x0 , x1 , . . . xn . Wtedy
Z xi Z xi
||γ(xi ) − γ(xi−1 )|| = || γ (t)||dt ¬
0
||γ 0 (t)||dt
xi−1 xi−1
Dla dowodu nierówności przeciwnej ustalmy ε > 0. Założyliśmy, że γ jest klasy C 1 , więc γ 0 jest funkcją ciągłą. Z
twierdzenia 4.8.4 wnosimy, że γ 0 jest jednostajnie ciągła jako funkcja ciągła określona na zbiorze zwartym. Zatem znajdziemy
δ > 0 takie, że dla s, t ∈ [a, b]
ε
|s − t| < δ ⇒ ||γ 0 (s) − γ 0 (t)|| < ε0 := . (10.12)
2(b − a)
Niech P będzie podziałem przedziału [a, b] wyznaczonym przez punkty x0 , x1 , . . . xn o średnicy nie przekraczającej δ. Z
(10.12) wnosimy, że dla t ∈ [xi−1 , xi ]
||γ 0 (t)|| ¬ ||γ 0 (t) − γ 0 (xi )|| + ||γ 0 (xi )|| ¬ ||γ 0 (xi )|| + ε0 . (10.13)
242 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Z xi Z xi
||γ (t)||dt ¬
0
(||γ 0 (xi )|| + ε0 ) dt = (||γ 0 (xi )|| + ε0 ) ∆xi =
xi−1 xi−1
Z xi
||γ 0 (xi )||∆xi + ε0 ∆xi = || γ 0 (xi )dt|| + ε0 ∆xi =
xi−1
Z xi
|| (γ 0 (t) + γ 0 (xi ) − γ 0 (t)) dt|| + ε0 ∆xi ¬
xi−1
Z xi Z xi
|| γ 0 (t)dt|| + || (γ 0 (xi ) − γ 0 (t)) dt|| + ε0 ∆xi ¬
xi−1 xi−1
||γ(xi ) − γ(xi−1 )|| + 2ε0 ∆xi .
Sumując po i dostajemy
Z b
||γ 0 (t)||dt ¬ Λ(γ, P) + 2ε0 (b − a) = Λ(γ, P) + ε ¬ Λ(γ) + ε.
a
Z b
||γ 0 (t)||dt ¬ Λ(γ).
a
V := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 ¬ f (x)2 }
Bryła ta powstaje poprzez obrót trapezu krzywoliniowego pod wykresem funkcji f wokół osi x.
S := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 = f (x)2 }
Twierdzenie 10.7.5 Jeśli funkcja f jest klasy C 1 , to pole powierzchni bocznej bryły obrotowej dane jest wzorem
Z b
2π f (x) 1 + f 0 (x)2 dx.
p
a
244 ROZDZIAŁ 10. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Rozdział 11
Definicja 11.1.1 Mówimy, że ciąg sn jest zbieżny punktowo do funkcji s : X → Y , jeżeli dla każdego punktu x ∈ X
ciąg sn (x) jest zbieżny do s(x).
fn : [0, 1] 3 x 7→ xn ∈ [0, 1]
którego pierwszych 20 wyrazów zobrazowano na rys. 11.1 . Łatwo policzyć, że ciąg ten jest zbieżny punktowo do
funkcji f : [0, 1] → [0, 1] danej wzorem (
0 gdy x ∈ [0, 1),
f (x) :=
1 gdy x = 1.
Choć funkcje fn są ciągłe, funkcja graniczna f nie jest ciągła. Widzimy zatem, że zbieżność punktowa funkcji ciągłych
nie gwarantuje, że funkcja graniczna będzie ciągła.
245
246 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
1.0
0.8
0.6
0.4
0.2
Rysunek 11.1: Wykresy ciągu funkcji x 7→ xn dla n od 1 do 20. Widać, że wartości zbiegają do zera dla wszystkich x z
wyjątkiem x = 1
0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0
Rysunek 11.2: Wykresy funkcji x 7→ cos2m (n!πx) dla m = 10 oraz n = 2, 3, 4. Przy m → ∞ funkcje graniczne f2 , f3 , f4
zerują się wszędzie z wyjątkiem odpowiednio zbioru punktów { n!
k
| k = 0, 1, . . . n! } dla n = 2, 3, 4.
11.1. ZBIEŻNOŚĆ PUNKTOWA I JEDNOSTAJNA 247
2
1.0 1
0.5
1 2 3 4 5 6 1 2 3 4 5 6
-0.5
-1.0 -1
-2
Funkcje x 7→ cos(n!πx))2m dla m = 10 oraz n = 2, 3, 4 zobrazowano na rys. 11.2 . Funkcja cos przyjmuje wartości w
przedziale [−1, 1]. Zatem ciąg m 7→ cos2m (u) zmierza do zera dla wszystkich u ∈ R z wyjątkiem wielokrotności π kiedy
jest to ciąg stale równy jeden. Ponieważ w naszym przykładzie argument u ma postać n!πx, jest on wielokrotnością
π dla skończonej liczby punktów x = n! k
gdzie k = 0, 1, 2, . . . n!. W konsekwencji dla każdego n funkcja fn przyjmuje
wartość zero wszędzie poza skończoną liczbą punktów, gdzie przyjmuje wartość jeden. Zatem każda z funkcji fn jest
całkowalna w sensie Riemanna. Ponieważ każda liczba wymierna daje się przedstawić w postaci x = n! k
dla odpowiednio
dużych k oraz n, ciąg fn jest zbieżny punktowo do funkcji f : [0, 1] → [0, 1] danej wzorem
(
0 gdy x 6∈ [0, 1] ∩ Q,
f (x) :=
1 gdy x ∈ [0, 1] ∩ Q.
Nie jest to funkcja całkowalna w sensie Riemanna, zatem zbieżność punktowa nie gwarantuje również zachowania
całkowalności w sensie Riemanna.
którego pierwsze cztery wyrazy zobrazowano na rys. 11.3 . Łatwo sprawdzić, że ciąg ten jest punktowo zbieżny do
funkcji stale równej zero. Wszystkie funkcje fn są różniczkowalne, a ich pochodne tworzą ciąg
√
fn0 : R 3 x 7→ n cos nx ∈ R.
Ciąg pochodnych nie jest ciągiem punktowo zbieżnym. Na przykład dla x = π dostajemy ciąg
√
n 7→ (−1)n n,
który nie jest zbieżny. Zatem zbieżność punktowa funkcji różniczkowalnych nie gwarantuje, że ciąg pochodnych jest
punktowo zbieżny.
Przedstawione przykłady pokazują, że punktowa zbieżność ciągu funkcji nie gwarantuje naturalnych własności, które w
wielu sytuacjach byłyby przydatne. Pojawia się pytanie, czy nie ma jakiegoś bardziej użytecznego pojęcia zbieżności ciągu
248 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
funkcji. Jak zobaczymy odpowiedź na to pytanie jest pozytywna. W tym celu potraktujemy funkcje jako punkty stosownie
zdefiniowanej przestrzeni metrycznej.
Definicja 11.1.5 Mówimy, że metryki % i %0 są jednostajnie równoważne, jeżeli zachodzą następujące dwa symetryczne
warunki
Definicja 11.1.6 Niech (Y, %) będzie przestrzenią metryczną. Mówimy, że % jest metryką ograniczoną, jeżeli istnieje
stała M > 0 taka, że dla dowolnych x, y ∈ Y mamy %(x, y) < M .
Lemat 11.1.7 Dla dowolnej przestrzeni metrycznej (Y, %) istnieje metryka ograniczona %0 jednostajnie równoważna
metryce %.
Dowód: Ustalmy M > 0 i zdefiniujmy odwzorowanie %̄ : Y × Y → R∗ wzorem %̄(x, y) := min(M, %(x, y)). Łatwo
sprawdzić, że %̄ jest również metryką na Y i to jednostajnie równoważną metryce %.
Przypomnijmy, że dla zbiorów X, Y przez
F (X, Y ) := { f : X → Y }
Twierdzenie 11.1.8 Niech X będzie dowolnym zbiorem, a (Y, %) przestrzenią metryczną z metryką ograniczoną. Funk-
cja %̄ : F (X, Y ) × F (X, Y ) → R∗ dana wzorem
Dowód: ćwiczenie.
Definicja 11.1.9 Metrykę daną wzorem (11.1) nazywamy metryką jednostajną na F (X, Y ) powiązaną z metryką %
na Y . Każdą zbieżność względem tej metryki nazywamy zbieżnością jednostajną.
Aby uprościć oznaczenia, będziemy też pisać %(f, g) w miejsce %̄(f, g), gdyż po typie argumentów można poznać, czy
chodzi o metrykę w Y czy o metrykę jednostajną w F (X, Y ).
Rozpisując bardziej szczegółowo definicję metryki jednostajnej, zbieżność jednostajną można wyrazić na wiele równo-
ważnych sposobów jak to zapisano w następującym oczywistym wniosku z twierdzenia 11.1.8 i definicji 11.1.9 .
11.1. ZBIEŻNOŚĆ PUNKTOWA I JEDNOSTAJNA 249
1.5
1.0
0.5
2 3 4 5
-0.5
-1.0
-1.5
Rysunek 11.4: Kulę wokół funkcji o czarnym wykresie można sobie wyobrażać jako zbiór funkcji, których wykresy mieszczą
się w pasie oznaczonym linią przerywaną. W szczególności są to funkcje o wykresie niebieskim i zielonym. Natomiast funkcja
o wykresie czerwonym nie mieści się w tej kuli, bo jej wykres wychodzi poza pas. Promień kuli to połowa szerokości pasa
mierzonej w pionie.
Wniosek 11.1.11 Jeśli ciąg funkcji fn jest zbieżny jednostajnie do funkcji f , to jest on również zbieżny punktowo do
f.
Trudno jest wyobrazić sobie zbiór funkcji jako przestrzeń metryczna,˛ bo w przestrzeni metrycznej F (X, Y ) funkcja jest tylko punktem, a myślac ˛ o intuicji
funkcji zazwyczaj wyobrażamy sobie wykres funkcji, który nie jest punktem. W przypadku gdy X = Y = R można jednak zrobić rysunek, który troch˛e
˛ jak wyobrazić sobie funkcje, które leża˛ nie dalej niż r > 0 od danej funkcji f , czyli leża˛ w kuli o środku w funkcji f i
ukierunkowuje nasza˛ intuicj˛e pokazujac
promieniu r . Mianowicie przesuwajac˛ wykres funkcji f o r w gór˛e i w dół uzyskujemy pas o szerokości 2r . Kula w F (X, Y ) o środku w funkcji f i promieniu r
obejmuje wszystkie funkcje, których wykres mieści si˛e w tym pasie (rys. 11.4 ).
W rozważanym zbiorze funkcji F (X, Y ) zastąpmy teraz przestrzeń metryczną Y unormowaną przestrzenią wektorową
V nad ustalonym ciałem F. Norma zadaje w V metrykę, jest to więc uszczególnienie rozważanego już przypadku. W takim
przypadku w F (X, V ) możemy zadać strukturę przestrzeni wektorowej nad F przyjmując dla f, g ∈ F (X, V ) oraz α ∈ F, że
250 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
Twierdzenie 11.1.12 Zbiór F (X, V ) z działaniami określonymi wzorami (11.2) i (11.3) jest przestrzenią wektorową
nad F.
Twierdzenie 11.1.16 Jeśli Y jest przestrzenią metryczną zupełną, to F (X, Y ) jest przestrzenią metryczną zupełną.
Ustalmy x ∈ X. Wprost z definicji metryki jednostajnej dostajemy %(fn (x), fm (x)) ¬ %(fn , fm ) dla n, m ∈ N, a stąd
natychmiast wnosimy, że ciąg wartości (fn (x))∞
n=1 ⊂ Y jest również ciągiem Cauchy’ego. Ponieważ założyliśmy, że Y jest
zupełna, ciąg ten jest zbieżny. Mamy więc dobrze zdefiniowaną funkcję
f : X 3 x 7→ lim fn (x) ∈ Y,
n→∞
a ciąg funkcji(fn )∞
n=1 zmierza punktowo do funkcji f . Pokażemy, że ciąg ten zmierza do f jednostajnie. W tym celu ustalmy
ε > 0 i, wykorzystując założenie, że (fn )∞n=1 jest ciągiem Cauchy’ego, dobierzmy do niego N ∈ N takie, że dla n, m N
zachodzi %(fn , fm ) < 2ε , a więc w szczególności %(fn (x), fm (x)) < 2ε dla wszystkich x ∈ X. Przechodząc w ostatniej
nierówności przy ustalonym n N z m do granicy w nieskończoności dostajemy z twierdzenia o zachowaniu nierówności
w granicy, że %(fn (x), f (x)) ¬ 2ε dla wszystkich x ∈ X oraz n N . Biorąc po lewej stronie kres górny względem x ∈ X
dostajemy %(fn , f ) ¬ 2ε < ε dla n N , co dowodzi jednostajnej zbieżności.
11.1. ZBIEŻNOŚĆ PUNKTOWA I JEDNOSTAJNA 251
Twierdzenie 11.1.17 Niech X będzie dowolnym zbiorem, a Y przestrzenią metryczną zupełną. Ciąg funkcji N 3 n 7→
fn ∈ F (X, Y ) jest zbieżny jednostajnie wtedy i tylko wtedy gdy
Dowód: Najpierw zauważmy, że warunek Cauchy’ego jest równoważny warunkowi Cauchy’ego, w którym silną nierówność
< ε zastąpiono słabą nierównością ¬ ε. Z nierówności silnej wynika słaba. Odwrotna implikacja dla ustalonego ε nie zachodzi,
ale warunek ma być dla każdego ε > 0, więc aby zagwarantować silną nierówność dla ε > 0 wystarczy zagwarantować słabą
nierówność dla 2ε . Rozpisując definicję warunku Cauchy’ego ze słabą nierównością w przestrzeni F (X, Y ) i zastępując w nim
warunek %(fn , fm ) ¬ ε równoważnym mu warunkiem %(fn (x), fm (x)) ¬ ε dla wszystkich x ∈ X dostajemy warunek (11.4).
Poniższa uwaga pokazuje pierwsze pożytki z pojęcia jednostajnej zbieżności.
Uwaga 11.1.18 Niech X będzie dowolnym zbiorem, a V przestrzenią wektorową unormowaną zupełną. Załóżmy, że
7 fn ∈ F (X, V ) jest jednostajnie zbieżny do funkcji f ∈ F (X, V ). Wtedy f też jest
ciąg funkcji ograniczonych N 3 n →
funkcją ograniczoną.
Dowód: Z jednostajnej zbieżności ciągu (fn )∞n=1 do f znajdziemy N ∈ N takie, że ||fn − f || ¬ 1 dla n N . Ustalmy
n N . Wtedy dla x ∈ X mamy
||f (x)|| ¬ ||f (x) − fn (x)|| + ||fn (x)|| ¬ 1 + ||fn ||,
co dowodzi, że f jest ograniczona.
Z uwagi 11.1.18 dostajemy następujące twierdzenie.
Twierdzenie 11.1.19 Niech X będzie dowolnym zbiorem, a V przestrzenią wektorową unormowaną, zupełną. Wtedy
B(X, V ) jest przestrzenią metryczną zupełną.
Dowód: Na mocy twierdzenia 3.7.9 wystarczy pokazać, że przestrzeń B(X, V ) jest podprzestrzenią domkniętą przestrzeni
F (X, V ). Ale to wynika natychmiast z twierdzenia 3.4.5 i uwagi 11.1.18 .
Mamy też następujące twierdzenie o jednostajnej zbieżności szeregu funkcji.
Twierdzenie 11.1.20 Niech X będzie dowolnym zbiorem, a V przestrzenią wektorową unormowaną zupełną. Niech
P0∞3 n 7→ fn ∈ B(X, V ) będzie ciągiem funkcji ograniczonych, a M : N0 → [0, ∞) ciągiem liczb
N P∞ takim, że szereg
n=0 M n jest zbieżny. Jeśli dla wszystkich x ∈ X i n ∈ N 0 zachodzi ||fn (x)|| ¬ M n , to szereg n=0 fn jest zbieżny
jednostajnie.
P∞
Dowód: Ponieważ szereg n=0 P Mn jest zbieżny, jego ciąg sum częściowych jest
Pn ciągiem Cauchy’ego. Zatem do ustalonego
n
εP> 0 dobierzemy N ∈ N takie, że i=m Mi < ε dla n m N . Niech sn := i=0 fi oznacza n-tą sumę częściową szeregu
∞
n=0 fn . Mamy
Xn n
X
||(sn − sm )(x)|| ¬ ||fi (x)|| ¬ Mi < ε
i=m+1 i=m+1
co dowodzi, że ciąg sum częściowych sn jest ciągiem Cauchy’ego. Ale na mocy twierdzenia 11.1.19 przestrzeń P∞ B(X, V )
jest zupełna, więc ciąg sum częściowych jest ciągiem zbieżnym w przestrzeni B(X, V ), co oznacza, że szereg n=0 fn jest
zbieżny jednostajnie.
Ponadto zachodzi następujące twierdzenie.
252 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
Twierdzenie 11.1.21 Niech X będzie dowolnym zbiorem, a V przestrzenią wektorową unormowaną zupełną. Załóżmy,
że ciągi funkcyjne N 3 n 7→ fn ∈ B(X, V ) i N 3 n 7→ gn ∈ B(X, V ) są zbieżne jednostajnie odpowiednio do funkcji
f ∈ B(X, V ) i funkcji g ∈ B(X, V ), a a, b ∈ R są ustalonymi liczbami rzeczywistymi. Wtedy ciąg funkcyjny afn + bgn
jest zbieżny jednostajnie do funkcji af + bg.
Dowód: Mamy dla wszystkich n ∈ N
Wnosimy stąd, że
0 ¬ lim ||(afn + bgn ) − (af + bg)|| ¬ |a| lim ||fn − f || + |b| lim ||gn − g|| = 0,
n→∞ n→∞ n→∞
Twierdzenie 11.2.1 Niech X będzie przestrzenią topologiczną, a Z przestrzenią metryczną zupełną. Załóżmy, że ciąg
funkcyjny N 3 n 7→ fn ∈ F (X, Z) jest zbieżny jednostajnie do funkcji f ∈ F (X, Z), x0 ∈ X jest punktem skupienia
przestrzeni X oraz dla każdego n ∈ N istnieją granice limx→x0 fn (x) =: an . Wtedy ciąg N 3 n 7→ an jest zbieżny,
istnieje też granica limx→x0 f (x) i zachodzi równość limn→∞ an = limx→x0 f (x), którą możemy też rozpisać w postaci
m, n N ⇒ %(an , am ) ¬ ε.
1.0 ... f5 f4 f3 f2 f1
0.8
0.6
0.4
0.2
-0.2
Rysunek 11.5: Ciąg funkcji zbieżny punktowo, ale nie jednostajnie do funkcji ciągłej, a konkretnie do funkcji stałej zero.
Dowodzi to, że granica limx→x0 f (x) istnieje i jest równa limn→∞ an . W szczególności, jeśli funkcje fn są ciągłe w x0 , to
an = fn (x0 ) oraz
lim f (x) = lim fn (x0 ) = f (x0 )
x→x0 n→∞
co dowodzi ciągłości f w x0 .
W szczególności, stosując twierdzenie 11.2.1 do funkcji ciągłych, dostajemy następujący wniosek.
Wniosek 11.2.2 Niech X będzie przestrzenią topologiczną, a Z przestrzenią metryczną zupełną. Jeśli ciąg funkcyjny
N 3 n 7→ fn ∈ F (X, Z) funkcji ciągłych jest zbieżny jednostajnie do funkcji f ∈ F (X, Z), to f jest funkcją ciągłą.
Uwaga 11.2.3 Niech X będzie przestrzenią topologiczną, a Z przestrzenią metryczną zupełną. Przestrzeń funkcji
ciągłych C(X, Z) jest domkniętą podprzestrzenią przestrzeni F (X, Z). W szczególności jest to przestrzeń zupełna.
Zauważmy, że zbieżność jednostajna ciągu funkcji ciągłych nie jest warunkiem koniecznym ciągłości granicy. Rozważmy
bowiem ciąg funkcji fn : R → R zadany wzorem
nx
gdy x ∈ [0, n1 ],
fn (x) := −nx + 2 gdy x ∈ [ n1 , n2 ],
0 w pozostałych przypadkach.
Kilka pierwszych funkcji tego ciągu zobrazowano na rys. 11.5 . Łatwo sprawdzić, że ciąg ten jest punktowo zbieżny do
funkcji stałej, która oczywiście jest ciągła. Jednak nie jest to ciąg jednostajnie zbieżny, bo fn ( n1 ) = 1 dla wszystkich n ∈ N.
Twierdzenie 11.2.4 Rozważmy ciąg funkcji N 3 n 7→ fn ∈ Riem([a, b], R) całkowalnych w sensie Riemanna na
przedziale zwartym [a, b] ⊂ R. Jeśli ciąg ten zmierza jednostajnie do funkcji f ∈ B([a, b], R) to f ∈ Riem([a, b], R) oraz
f = limn→∞ fn . (11.6)
R R
Tak więc
0 ¬ U (f ) − L(f ) ¬ fn + εn (b − a) − fn − εn (b − a) = 2εn (b − a)
R R
co w granicy przy n → ∞ daje L(f ) = U (f ) i dowodzi, że f ∈ Riem([a, b], R). Zatem z (11.7) dostajemy
0¬ f − fn ¬ εn (b − a)
R R
Wniosek 11.2.5 Rozważmy ciągP funkcji Nk 3 n 7→ fn ∈ Riem([a, b], R) całkowalnych w sensie Riemanna na przedziale
∞
zwartym [a, b] ⊂ R. Jeśli szereg n=k fn jest jednostajnie zbieżny do funkcji f ∈ B([a, b], R) to f ∈ Riem([a, b], R)
oraz Z b X∞ Z b
f= fn .
a n=k a
Twierdzenie 11.2.6 Rozważmy ciąg funkcji N 3 n 7→ fn ∈ F ([a, b], Rd ) różniczkowalnych taki, że dla pewnego
x0 ∈ [a, b] istnieje granica limn→∞ fn (x0 ), a ciąg pochodnych N 3 n 7→ fn0 jest zbieżny jednostajnie. Wtedy sam ciąg
n 7→ fn jest zbieżny jednostajnie do pewnej różniczkowalnej funkcji f : [a, b] → Rd oraz
Dowód: Ustalmy ε > 0. Wykorzystując zupełność R, zbieżność ciągu wartości funkcji w x0 oraz jednostajną zbieżność
ciągu pochodnych znajdziemy N ∈ N takie, że dla n, m N zachodzą nierówności
ε ε
||fn (x0 ) − fm (x0 )|| < oraz ∀x ∈ X ||fn0 (x) − fm
0
(x)|| < .
2 2(b − a)
Z twierdzenia 8.8.4 o przyrostach skończonych zastosowanego do funkcji fn − fm dostajemy dla t, x ∈ [a, b], n, m N i
pewnego ξ ∈ [a, b] dobranego do t, x i n, m
ε ε
||fn (x) − fm (x) − (fn (t) − fm (t))|| ¬ ||fn0 (ξ) − fm
0
(ξ)|| · |x − t| ¬ · |x − t| ¬ . (11.8)
2(b − a) 2
11.2. ZBIEŻNOŚĆ JEDNOSTAJNA, A CIĄGŁOŚĆ, RÓŻNICZKA I CAŁKA 255
1.0
0.8
0.6
0.4
0.2
-4 -2 2 4
Rysunek 11.6: Wykres zerowego (niebieski), pierwszego (żółty) i drugiego (zielony) wyrazu szeregu funkcyjnego (11.9).
lim fn0 (x̄) = lim lim ϕn (h) = lim lim ϕn (h) = lim ϕ(h) = f 0 (x̄).
n→∞ n→∞ h→0 h→0 n→∞ h→0
Przykład 11.2.7 Niech ϕ : R → R będzie funkcją okresową o okresie 2 dla x ∈ [−1, 1] spełniającą równość ϕ(x) = |x|.
Łatwo sprawdzić, że ϕ jest funkcją Lipschitza ze stałą jeden. Co więcej, jeśli pomiędzy s, t ∈ R nie ma liczby całkowitej,
to |ϕ(s) − ϕ(t)| = |s − t|. Zdefiniujmy funkcję f : R → R dla x ∈ R jako sumę szeregu funkcyjnego
∞ n
X 3
f (x) := ϕ(4n x). (11.9)
n=0
4
Początkowe wyrazy tego szeregu zobrazowano na rysunku 11.6 , zerową, pierwszą i drugą sumę częściową na rysunku 11.7
n n
, a dwudziestą sumę częściową na rysunku 11.8 . Ponieważ |ϕ(x)| ¬ 1, więc 43 ϕ(4n x) ¬ 43 co na mocy twierdze-
nia 11.1.20 i twierdzenia 11.2.1 oznacza, że funkcja f jest ciągła. Niech x ∈ R. Pokażemy, że f nie jest różniczkowalna w
256 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
2.0
1.5
1.0
0.5
-4 -2 2 4
Rysunek 11.7: Wykres zerowej (niebieski), pierwszej (żółty) i drugiej (zielony) sumy częściowej szeregu funkcyjnego (11.9).
2.5
2.0
1.5
1.0
0.5
-4 -2 2 4
Rysunek 11.8: Wykres sumy 20tu pierwszych wyrazów szeregu funkcyjnego (11.9) zbieżnego do funkcji ciągłej nieróżnicz-
kowalnej w żadnym punkcie. Suma ta przybliża tę funkcją z błędem mniejszym od 100
1
.
11.3. APROKSYMACJA FUNKCJI CIĄGŁYCH 257
Załóżmy najpierw, że n ¬ m. Wtedy pomiędzy 4n (x + δm ), a 4n x nie ma liczby całkowitej, bo gdyby k ∈ Z było taką liczbą,
to wtedy 4m−n k byłoby liczbą całkowitą pomiędzy 4m (x + δm ), a 4m x. Zatem
Natomiast gdy n > m to 4n δm = ±2 · 4n−m−1 jest liczbą parzystą, więc γn = 0, bo ϕ jest okresowa o okresie 2. Dostajemy
więc
m n m m−1
X 3 n m m−1
X 3 n m−1
f (x + δm ) − f (x) X 3 3 3 X 3m + 1
= γn γm − γn ·4m − ·4n = 3m − 3n = .
δm n=0
4 4 n=0
4 4 n=0
4 n=0
2
Tym samym
f (x + δm ) − f (x)
lim = ∞,
m→∞ δm
co dowodzi, że f nie jest różniczkowalna w punkcie x.
Twierdzenie 11.3.1 Niech F oznacza ciało liczb rzeczywistych lub ciało liczb zespolonych i niech a, b ∈ R będą takie,
że a < b. Dla każdej funkcji ciągłej f : [a, b] → F istnieje ciąg wielomianów Pn : R → F taki, że ciąg zawężeń Pn|[a,b]
zmierza jednostajnie do f przy n → ∞.
Dowód: Rozważmy najpierw szczególny przypadek gdy [a, b] = [0, 1] oraz f (0) = f (1) = 0. Wtedy możemy rozszerzyć f
do funkcji ciągłej f : R → R przyjmując f (x) := 0 dla x 6∈ [0, 1]. Dla n ∈ N połóżmy
1
cn := R 1
−1
(1 − x2 )n dx
i rozważmy wielomian
Qn : R 3 x 7→ cn (1 − x2 )n ∈ R.
258 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
2.0
1.5
1.0
0.5
Rysunek 11.9: Wykresy funkcji Qi dla i = 1, 2, 4, 8, 16 w kolorach od czarnego dla i = 1 do czerwonego dla i = 16. Pole pod
wykresem pozostaje stale równe jeden, natomiast wykres wraz z rosnącym i coraz bardziej koncentruje się wokół zera.
Wykres kilku takich wielomianów zawężonych do interesującego nas przedziału [−1, 1] przedstawiono na rysunku 11.9 .
Zauważmy, że współczynnik cn dobraliśmy tak, iż
Z 1 Z 1
Qn (t)dt = cn (1 − t2 )n dt = 1. (11.10)
−1 −1
co pokazuje, że Pn jest wielomianem. Ponieważ f jako funkcja ciągła o dziedzinie zwartej jest jednostajnie ciągła, do ε > 0
znajdziemy δ > 0 takie, że
ε
|x − y| < δ ⇒ |f (x) − f (y)| < . (11.13)
2
Niech M := sup { |f (x)| | x ∈ [0, 1] }. Ze twierdzenia 2.5.8 , a konkretnie ze wzoru (2.20) dla α = 21 wnosimy, że
√
lim 4M n(1 − δ 2 )n = 0.
n→∞
gdzie x0 , cn , x ∈ R oraz cn ∈ R . Następujące twierdzenie dowodzi się tak samo jak twierdzenie 5.3.10 w rozdziale 5.3.4 .
Twierdzenie 11.4.1 Dla szeregu (11.15) przyjmijmy α := lim supn→∞ n |cn | i rozważmy liczbę
p
α gdy 0 < α < ∞,
1
R := 0 gdy α = ∞,
∞ gdy α = 0.
Szereg (11.15) jest zbieżny dla |x − x0 | < R, a rozbieżny dla |x − x0 | > R. Kryterium nie rozstrzyga zbieżności gdy
|x − x0 | = R. Liczba R nosi nazwę promień zbieżności szeregu (11.15).
P∞
Szereg (11.15) możemy potraktować jako szereg funkcyjny, czyli rozważyć n=0 fn gdzie fn : R → R jest funkcją daną
wzorem fn (x) := cn (x − x0 )n . gdzie x0 ∈ R oraz cn ∈ R traktujemy jako parametry. Jednak, by nie mnożyć oznaczeń, o
szeregu (11.15) mówić będziemy, że jest szeregiem funkcyjnym bez jawnego wypisywania funkcji fn . Jest to mało precyzyjna,
ale powszechnie stosowana konwencja.
W kontekście szeregów funkcyjnych interesuje nas co można powiedzieć o sumie szeregu potęgowego jako funkcji zmiennej
x. Mamy następujące twierdzenie.
Twierdzenie 11.4.2 Załóżmy, że promień zbieżności R szeregu (11.15) jest dodatni. Rozważmy funkcję
f : (x0 − R, x0 + R) → R
Dla r ∈ (0, R) szereg ten jest zbieżny jednostajnie do funkcji f w przedziale [x0 − r, x0 + r]. Co więcej, funkcja f jest
funkcją klasy C ∞ ,
∞
X n!
f (k) (x) = cn (x − x0 )n−k (11.17)
(n − k)!
n=k
dla x ∈ (x0 −R, x0 +R) i R jest promieniem zbieżności tego szeregu. W szczególności pochodna f dla x ∈ (x0 −R, x0 +R)
dana jest wzorem
∞
X
f 0 (x) = ncn (x − x0 )n−1 , (11.18)
n=1
f (n) (x0 )
cn = . (11.19)
n!
11.4. SZEREGI POTĘGOWE 261
Nim przejdziemy do dowodu, zauważmy, że podstawiając h := x − x0 oraz wykorzystując (11.19) możemy wzór (11.16)
zapisać w postaci
∞
X f (n) (x0 ) n
f (x0 + h) = h dla h ∈ (−R, R).
n=0
n!
Pokazuje to, że szereg (11.15), którego użyliśmy do skonstruowania funkcji f staje się jej szeregiem Taylora, zgodnie z
definicją 8.14.9 .
P∞
Dowód: Ustalmy r ∈p(0, R) i rozważmy x ∈ [x0 − r, x0 + r]. Mamy |cn (x − x0 )n | ¬ |cn |rn . Szereg n=0 |cn |rn jest
zbieżny, bo lim supn→∞ n |cn |rn = Rr < 1. Zatem z twierdzenia 11.1.20 wnosimy, że zbieżność szeregu (11.16) jest
jednostajna na [x0 − r, x0 + r], a wniosek 11.2.2 implikuje, że zawężenie f|[x0 −r,x0 +r] jest funkcją ciągłą jako granica
jednostajnie zbieżnegoS ciągu sum częściowych, które, jako wielomiany, są ciągłe. Oznacza to, że f jest funkcją ciągłą, bo
(x0 − R, x0 + R) = 0<r<R [x0 − r, x0 + r]. Ponadto N -ta suma częściowa szeregu (11.16) jako wielomian jest funkcją
PN −1 P∞
różniczkowalną, a jej pochodna
P∞ wynosi n=1n ncn (x − x0 )
n−1
. Promień zbieżności szeregu potęgowego n=1 ncn (x − x0 )n−1
jest taki sam jak szeregu n=1 ncn (x − x0 ) , bo jeden powstaje z drugiego przez przemnożenie przez (x − x0 ), a na mocy
twierdzenia 5.4.1 szereg zbieżny przemnożony przez liczbę pozostaje zbieżny. Zatem z (2.19) wnosimy, że wynosi on
1 1
= = R.
lim supn→∞ lim supn→∞
p p
n
n|cn | n
|cn |
Oznacza to, że szereg ten jest zbieżny jednostajnie na każdym przedziale [x0 − r, x0 + r] dla r ∈ (0, R). Z twierdzenia 11.2.6
zastosowanego do sum częściowych szeregu (11.16) dostajemy więc, że f jest różniczkowalna na każdym przedziale [x0 −
r, x0 + r] dla r ∈ (0, R) i zachodzi wzór (11.18), a promień zbieżności występującego w tym wzorze szeregu wynosi R. Zatem
argumetując indukcyjnie wnosimy, że f jest funkcją klasy C ∞ oraz zachodzi wzór (11.17). W szczególności, podstawiając
x = x0 w (11.17) i wyliczając ck dostajemy (11.19).
Funkcję, która daje się przedstawić jako suma szeregu w otoczeniu (x0 − R, x0 + R) punktu x0 można również przedstawić
jako sumę szeregu w pewnym, stosownie mniejszym, otoczeniu dowolnego innego punktu z (x0 − R, x0 + R). Dokładniej,
mamy następujące twierdzenie.
Twierdzenie 11.4.3 (twierdzenie o szeregu Taylora) Załóżmy, że funkcja f : (x0 − R, x0 + R) → R dana jest jako
suma szeregu (11.16) zbieżnego dla x ∈ (x0 − R, x0 + R). Niech x1 ∈ (x0 − R, x0 + R). Wtedy
∞
X f (n) (x1 )
f (x) = (x − x1 )n
n=0
n!
Nim udowodnimy twierdzenie 11.4.3 potrzebujemy najpierw następujący lemat o zmianie kolejności sumowania szere-
gów.
262 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
Lemat 11.4.4 Niech a : P N0 × N0 → R będzie funkcją, dla której wartości będziemy pisaćP∞ aij := a(i, j). Załóżmy, że
∞
dla każdego i ∈ N0 szereg j=0 |aij | jest zbieżny do pewnej liczby bi ∈ R. Jeżeli szereg i=0 bi jest zbieżny, to
P∞
(i) dla wszystkich i ∈ N0 zbieżny jest szereg j=0 aij ,
P∞
(ii) dla wszystkich j ∈ N0 zbieżny jest szereg i=0 aij .
P∞ P∞
(iii) zbieżny jest szereg i=0 j=0 a ij ,
P∞
P∞
(iv) zbieżny jest szereg ( i=0 aij )
j=0
P∞ P∞ P
∞ P∞
(v) oraz zachodzi wzór i=0 j=0 a ij = j=0 ( i=0 aij ) .
P∞
Dowód: Ustalmy i ∈ N0 . Na mocy twierdzenia 5.2.5 o zbieżności bezwzględnej zbieżność szeregu j=0 |aij | implikuje
P∞
zbieżność szeregu j=0 aij co dowodzi własności (i). Ustalmy z kolei j ∈ N. Dla dowolnego i ∈ N0 mamy 0 ¬ |aij | ¬
P∞
j=0 |aij | = bi . Zatem
P∞
z kryterium porównawczego (twierdzenie 5.2.11 ) dostajemy bezwzględną zbieżność, a więc i
zbieżność szeregu i=0 aij przy dowolnym j ∈ N0 , co dowodzi własności (ii).
Dla dowodu P pozostałych własności rozważmy zbiór E := {0} ∪ { n1 | n ∈ N1 }. Dla i ∈ N0 zdefiniujmy funkcję fi : E → R
∞ Pn
kładąc fi (0) := j=0 aij oraz fi ( n ) := j=0 aij . Mamy
1
n ∞
1 X X
lim fi ( ) = lim aij = aij = fi (0),
n→∞ n n→∞
j=0 j=0
co pokazuje, że fi jest funkcją ciągłą, bo pozostałe punkty dziedziny fi są izolowane. Sprawdzimy, że dla x ∈ E oraz i ∈ N
zachodzi |fi (x)| ¬ bi . Rzeczywiście, gdy x = 0 mamy
∞
X ∞
X
|fi (0)| ¬ aij ¬ |aij | = bi ,
j=0 j=0
a gdy x = 1
n mamy
n n ∞
1 X X X
|fi ( )| ¬ aij ¬ |aij | ¬ |aij | = bi .
n j=0 j=0 j=0
P∞
Zatem z twierdzenia 11.1.20 wnosimy, że szereg funkcyjny i=0 fi (x) jest zbieżny do funkcji ciągłej
∞
X
g : E 3 x 7→ g(x) := fi (x) ∈ R.
i=0
P∞ P∞ P∞
W szczególności szereg i=0 j=0 aij = i=0 fi (0) jest zbieżny, co dowodzi (iii). Ustalmy n ∈ N. Z dowiedzionej
P∞
własności (ii) wiemy, że każdy z szeregów i=0 aij dla j = 0, 1, 2, . . . n jest zbieżny. Twierdzenie 5.4.1 mówi w szczególności,
że suma dwóch szeregów zbieżnych jest szeregiem zbieżnym, ale indukcyjnie łatwo je uogólnić do sumy dowolnej skończonej
liczby szeregów. Wnosimy zatem, że
∞ ∞
n n
!
X X X X
aij = aij . (11.20)
i=0 j=0 j=0 i=0
P∞ Pn P∞ P∞
Z kolei ze wzoru (11.20) wiemy, że i=0 j=0 ij jest równe n-tej sumie częściowej szeregu
a j=0 ( i=0 aij ). Zatem wzór
P∞ P∞
(11.22) pokazuje, że szereg ten jest zbieżny, a jego sumą jest i=0 j=0 aij co dowodzi (iv) oraz (v).
Dowód twierdzenia 11.4.3 : Jedyne co musimy pokazać, to to, że dla pewnego ciągu współczynników c̄n ∈ R
wartość
P∞ funkcji f w punkcie x ∈ (x1 − r, x1 + r) przedstawia się jako suma zbieżnego szeregu potęgowego postaci f (x) =
m=0 c̄m (x − x1 )m , bo oczekiwaną wartość współczynników c̄m otrzymamy jako wniosek z twierdzenia 11.4.2 o szeregu
potęgowym. Pod warunkiem uzasadnienia poprawności, potrzebne przedstawienie uzyskamy z wyliczenia
∞
X n
f (x) = cn ((x − x1 ) + (x1 − x0 )) (11.23)
n=0
∞ n
X X n
= cn (x − x1 )m (x1 − x0 )n−m (11.24)
n=0 m=0
m
∞ X ∞
X n
= cn (x − x1 )m (x1 − x0 )n−m (11.25)
n=0 m=0
m
∞ X ∞
X n
= cn (x − x1 )m (x1 − x0 )n−m (11.26)
m=0 n=0
m
∞ ∞ !
X X n
= cn (x1 − x0 ) n−m
(x − x1 )m (11.27)
m=0 n=m
m
∞
X
= c̄m (x − x1 )m (11.28)
m=0
gdzie
∞ ∞
1 X
X n n!
c̄m := cn (x1 − x0 )n−m = cn (x1 − x0 )n−m
n=m
m m! n=m (n − m)!
jest dobrze zdefiniowane na mocy twierdzenia 11.4.2 , bo dla x1 ∈ (x0 − R, x0 + R) jest to przemnożona przez m! 1
suma
szeregu (11.17) przy x = x1 oraz k = m. Pozostaje
P∞ uzasadnić równości ( 11.23 - 11.28 ). Równość (11.23) wynika z rozpisania
x − x0 = (x − x1 ) + (x1 − x0 ) w f (x) = n=0 cn (x − x0 )n , równość (11.24) ze wzoru (2.4), równość (11.25) z przyjętej
konwencji, że nk = 0 dla k > n, a równości (11.27) oraz (11.28) to efekt zgrupowania wyrazów i wprowadzenia oznaczenia.
Mniej oczywista jest zmiana kolejności sumowania w równości (11.26). Uzasadnimy ją w oparciu o lemat 11.4.4 (v). Mamy
∞ X
∞ ∞ X n ∞
X n X n X n
cn (x1 − x0 ) n−m
(x − x1 ) =
m
cn (x1 − x0 )n−m (x − x1 )m = |cn | (|x − x1 | + |x1 − x0 |)
n=0 m=0
m n=0 m=0
m n=0
(11.29)
Ponieważ x P∈ (x1 −r, x1 +r), dostajemy |x−x1 | < r = R−|x 1 −x 0 |. Zatem znajdziemy R 1 ∈ (0, R) takie, że |x−x 1 |+|x 1 −x 0| <
∞
R1 . Szereg n=0 cn R1n jest zbieżny, bo lim supn→∞ n |cn |R1n = RR1 < 1. Z kryterium porównawczego również szereg po
p
prawej stronie równości (11.29) jest zbieżny. Zatem również szereg po lewej stronie tej równości jest zbieżny, co pozwala nam
na użycie lematu 11.4.4 do uzasadnienia zmiany kolejności sumowania.
264 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
Definicja 11.4.5 Mówimy, że funkcja f : (a, b) → R jest analityczna w punkcie x0 ∈ (a, b) jeżeli funkcja ta daje się
przedstawić jako suma szeregu potęgowego zbieżnego w pewnym otoczeniu punktu x0 . Mówimy, że funkcja f : (a, b) →
R jest analityczna jeżeli jest analityczna w każdym punkcie x0 ∈ (a, b).
Wniosek 11.4.6 Funkcja analityczna f : (a, b) → R jest funkcją klasy C ∞ . Co więcej, w pewnym otoczeniu x0 ∈ (a, b)
jest ona sumą swojego szeregu Taylora
∞
X f (n)(x0 )
f (x) = (x − x0 )n ,
n=0
n!
zatem jest jednoznacznie wyznaczona w otoczeniu x0 przez ciąg swoich pochodnych w punkcie x0 .
Lokalna˛ jednoznaczność funkcji analitycznej wzgl˛edem pochodnych w zadanym punkcie można istotnie wzmocnić. Okazuje si˛e bowiem, że jeśli dwie funkcje
analityczne sa˛ równe w zbiorze majacym˛ punkt skupienia, to sa˛ równe w cz˛eści wspólnej swoich dziedzin. W szczególności dwie funkcje analityczne lokalnie
równe sa˛ równe w cz˛eści wspólnej swoich dziedzin. By to pokazać potrzebujemy nast˛epujace
˛ twierdzenie.
P∞ P∞
Twierdzenie 11.4.7 Niech szeregi n=0 an (x−x0 )n oraz n=0 bn (x−x0 )n będą zbieżne w przedziale (x0 −R, x0 +R)
i niech P∞ P∞
E := { x ∈ (x0 − R, x0 + R) | n=0 an (x − x0 )n = n=0 bn (x − x0 )n }.
Jeśli E ma punkt skupienia w (x0 − R, x0 + R), to an = bn dla wszystkich n ∈ N, czyli E = (x0 − R, x0 + R).
P∞
Dowód: Niech S := (x0 −R, x0 +R). Dla n ∈ N połóżmy cn := an −bn . Niech f (x) := n=0 cn (x−x0 )n dla x ∈ S. Szereg
ten jest zbieżny dla x ∈ S jako różnica szeregów zbieżnych. Z definicji zbioru E mamy f|E = 0. Rozważmy zbiory A := E 0 ∩S
gdzie E 0 to zbiór punktów skupienia zbioru E oraz B := S \ A. Z założenia, że E ma punkt skupienia w S wnosimy, że
A 6= ∅. Jeśli x ∈ B to x nie jest punktem skupienia zbioru E w S, a więc w pewnym jego otoczeniu albo w ogóle nie ma
punktów z E, albo jedynym takim punktem jest sam x. W szczególności w dostatecznie małym otoczeniu punktu x nie ma
już punktów
P∞ skupienia zbioru E, co oznacza, że B jest otwarty. Rozważmy x1 ∈ A ⊂ S. Z twierdzenia 11.4.3 wnosimy, że
f (x) = n=0 dn (x − x1 )n dla pewnych współczynników dn ∈ R oraz x ∈ (x1 − r, x1 + r) gdzie r := R − |x1 − x0 |. Twierdzimy,
że dn = 0 dla n ∈ N0 . W przeciwnym razie możemy rozważyć najmniejsze k ∈ N0 takie, że dk 6= 0. Z twierdzenia 11.4.2 i
dodatniości promienia zbieżności f w x1 łatwo wywnioskować, że
p
lim sup n dk+n = lim sup k+n dk+n = lim sup n dn < ∞
p p
n→∞ n→∞ n→∞
P∞
co oznacza, że szereg n=0 dk+n (x − x1 )n ∈ R maPrównież dodatni promień zbieżności, a więc mamy dobrze określoną i
∞
ciągłą w pewnym otoczeniu x1 funkcję g : S 3 x 7→ n=0 dk+n (x − x1 )n ∈ R. Z twierdzenia o iloczynie szeregu przez liczbę
dostajemy równość f (x) = (x − x1 ) g(x). Mamy też g(x1 ) = dk 6= 0, a ponieważ g jest ciągła, znajdziemy δ > 0 takie, że
k
g(x) 6= 0 gdy |x−x1 | < δ. W konsekwencji f (x) = (x−x1 )k g(x) 6= 0 dla x ∈ (x1 −δ, x1 +δ)\{x1 } co przeczy x1 ∈ A = S ∩E 0 .
Zatem rzeczywiście dn = 0 dla n ∈ N0 . Oznacza to, że A jest zbiorem otwartym. Ponieważ S, jako przedział, jest spójny, a
A 6= ∅, zbiór B = ∅. To dowodzi, że E = S.
Wniosek 11.4.8 Zbiór miejsc zerowych niezerowej funkcji analitycznej nie posiada punktów skupienia. Jeśli dwie
funkcje analityczne f, g : (a, b) → R są równe w pewnym zbiorze mającym punkt skupienia, to są równe.
Poniższy przykład pokazuje, że nie każda funkcja klasy C ∞ jest funkcją analityczną.
11.5. SZEREGI FOURIERA 265
Można sprawdzić, że pochodna tej funkcji dowolnie wysokiego rzędu istnieje. Łatwo to stwierdzić dla x 6= 0 przy
wykorzystaniu twierdzeń o pochodnej złożenia, iloczynu, ilorazu i funkcji wykładniczej. Dla x = 0 sprawdzenie istnienia
i zerowania się pochodnych jest trudniejsze. Daje się to policzyć bezpośrednio z definicji pochodnej jako granicy ilorazu
różnicowego przy wykorzystaniu twierdzenia 6.2.3 (vi). Zatem funkcja ta jest funkcją klasy C ∞ . Z faktu, że jej
wszystkie pochodne w zerze są zerowe dostajemy, że jej szereg Taylora w zerze jest zerowy. Zatem funkcja ta nie jest
funkcją analityczną, bo gdyby była, w otoczeniu zera musiałaby być funkcją zerową, a nie jest.
Wniosek 11.4.10 Jeśli funkcja f : (a, b) → R daje się przedstawić jako suma zbieżnego szeregu potęgowego w pew-
nym przedziale to jest analityczna w tym przedziale. W szczególności funkcjami analitycznymi są wielomiany, funkcja
wykładnicza i logarytmiczna oraz funkcje trygonometryczne.
6 3
2
4
1
2
-5 5
-5 5
-1
-2
-2
-4 -3
Rysunek 11.11: Po lewej: funkcja okresowa. Po prawej: rozkład tej funkcji na oscylacje proste.
Definicja 11.5.1 Wielomianem trygonometrycznym nazywamy funkcję T : R → C dającą się przedstawić w postaci
N
X
T : R 3 x 7→ a0 + (an cos nx + bn sin nx) ∈ C (11.30)
n=1
gdzie an , bn ∈ C.
Ponieważ tak funkcja stała x 7→ a0 jak również funkcje x 7→ an cos nx oraz x 7→ bn sin nx dla n ∈ N1 są okresowe o okresie
2π, wielomian trygonometryczny jest funkcją okresową o okresie 2π.
Poniższa uwaga przedstawia wykładniczą postać wielomianu trygonometrycznego, która często jest wygodniejsza w
obliczeniach.
gdzie
an −ibn
2
gdy n > 0,
cn := a0 gdy n = 0, (11.32)
a−n +ib−n
gdy n < 0.
2
Na odwrót, gdy dany jest wielomian trygonometryczny w postaci (11.31) to równoważną postać (11.30) dostajemy
przyjmując
an := c−n + cn , (11.33)
c−n − cn
bn := . (11.34)
i
11.5. SZEREGI FOURIERA 267
n=−N n=1
N
1 1
X
= c0 + (an + ibn )(cos nx − i sin nx) + (an − ibn )(cos nx + i sin nx)
n=1
2 2
N
X
= a0 + (an cos nx + bn sin nx)
n=1
co dowodzi pierwszej części uwagi. Drugą część sprawdzamy podobnie podstawiając wzory ( 11.33 - 11.34 ) do (11.30).
Uwaga 11.5.3 Współczynniki cm wielomianu trygonometrycznego w postaci (11.31) wyrażają się wzorem
1
Z π
cm := T (x)e−imx dx. (11.35)
2π −π
Uwaga 11.5.4 Wielomian T przyjmuje wartości rzeczywiste wtedy i tylko wtedy gdy dla każdego m ∈ {0, 1, 2, . . . , N }
zachodzi c−m = cm .
Dowód: Przy założeniu c−m = cm dla m ∈ {0, 1, 2, . . . , N } ze wzorów ( 11.33 - 11.34 ) mamy am = cm +c−m = cm +cm ∈ R
i podobnie bm := c−mi−cm = cm −c i
m
∈ R, zatem T ma wartości rzeczywiste. Na odwrót, jeśli T ma wartości rzeczywiste, to
T (x) = T (x), więc z (11.35) dostajemy
1 1 1 π
Z π Z π Z
c−m = T (x)eimx dx = T (x)e−imx dx = T (x)e−imx dx = cm .
2π −π 2π −π 2π −π
Wzór (11.35) można zastosować do dowolnej funkcji całkowalnej w sensie Riemanna, nie tylko do wielomianu. Otrzymujemy przeliczalna˛ rodzin˛e liczb, t.zw.
współczynniki Fouriera funkcji f , z których można w miejsce wielomianu utworzyć szereg
∞
X
cn einx .
n=−∞
Naturalne jest pytanie kiedy ten szereg funkcyjny jest zbieżny i jeśli jest zbieżny do czy jest zbieżny do funkcji f . Aby odpowiedzieć na to pytanie warto najpierw
˛ si˛e analogii z przestrzeniami wektorowymi skończenie wymiarowymi. W Rd dysponujemy iloczynem skalarnym, który pozwala formalnie
wspomnieć o rysujacej
268 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
zdefiniować prostopadłość wektorów, a także norm˛e, która mierzy długość wektora. Oznaczmy przez (x|y) iloczyn skalarny wektorów x, y ∈ Rd . Niech e ∈ Rd
b˛edzie wektorem o długości jeden, czyli (e|e) = 1. Dowolny wektor x ∈ Rd posiada jednoznaczny rozkład x = x0 + λe, gdzie x0 jest prostopadły do e,
czyli (x0 |e) = 0. W tym celu wystarczy wziać ˛ λ := (x|e) oraz x0 := x − (x|e)e. Wektor λe zwany jest rzutem prostokatnym ˛ wektora x na kierunek
˛ baz˛e ortonormalna˛ E ⊂ Rd , a wi˛ec baz˛e złożona˛ ze wzajemnie prostopadłych wektorów ei ∈ E długości jeden dostajemy rozkład
wektora e. Biorac
d
X
x= (x|ei )ei
i=1
wektora x w bazie E .
˛ pokażemy jak t˛e prosta˛ ide˛e stosuje si˛e do funkcji okresowych. Rodzina funkcji zmiennej rzeczywistej okresowych o okresie 2π i wartościach
W dalszym ciagu
zespolonych, całkowalnych w sensie Riemanna na przedziale [−π, π] tworzy przestrzeń wektorowa.˛ Definiujemy odwzorowanie
1 π
Z
(f, g) 7→ f (x)g(x)dx.
2π −π
1 π
Z
R 3 x 7→ f (t)e−im(t−x) dt
2π −π
lub
∞
X
f (x) = cm eimx
m=−∞
gdzie
1 π
Z
cm = f (t)e−imt dt.
2π −π
Definicja 11.5.5 Niech V będzie przestrzenią wektorową nad R. Odwzorowanie ϕ : V ×V → C nazywamy zespolonym
iloczynem skalarnym jeżeli dla wszystkich x, y, z ∈ V oraz α ∈ C spełnione są następujące warunki:
(ZIS1) ϕ(x + y, z) = ϕ(x, z) + ϕ(y, z),
n
X
ϕ(x, y) := xi yi .
i=1
Następujące twierdzenie ugólnia nierówność Cauchy-Schwartza (twierdzenie 7.2.3 ) na przypadek zespolonego iloczynu
skalarnego.
(11.36)
p p
|ϕ(x, y)| ¬ ϕ(x, x) ϕ(y, y)
dla dowolnych x, y ∈ V .
Dowód: Podstawiając x = y = 0 we własności (ZIS1) dostajemy ϕ(0, z) = 0 dla dowolnego z ∈ C. Zatem z własności
(ZIS3) wnosimy, że również ϕ(z, 0) = ϕ(0, z) = 0 dla dowolnego z ∈ C. Wynika stąd oraz z (ZIS4), że nierówność (11.36)
zachodzi gdy y = 0. Rozważmy zatem przypadek y 6= 0. Dla x, y ∈ C i dowolnego λ ∈ C dostajemy z definicji zespolonego
iloczynu skalarnego i uwagi 11.5.6
Wniosek 11.5.8 Przestrzeń wektorowa V z zespolonym iloczynem skalarnym ϕ jest przestrzenią wektorową unormo-
waną z normą ||.||ϕ : V → R daną wzorem
||x||ϕ := ϕ(x, x)
p
dla x ∈ V .
270 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
Przykład 11.5.9 Podobnie jak w twierdzeniu 9.2.4 możemy sprawdzić, że Riem([a, b], C), z działaniami zdefinio-
wanymi analogicznie jak w tym twierdzeniu, jest przestrzenią wektorową nad ciałem C. Rozważmy odwzorowanie
Z b
ϕ : Riem([a, b], C) × Riem([a, b], C) 3 (f, g) 7→ β f ḡ,
a
gdzie β ∈ R+ jest ustaloną liczbą rzeczywistą dodatnią. Łatwo sprawdzić, że ϕ spełnia warunki (ZIS1)-(ZIS3) definicji
zespolonego iloczynu skalarnego. Odnośnie (ZIS4) oczywiste jest, że
Z b Z b
ϕ(f, f ) = β f f¯ = β |f |2 0
a a
oraz ϕ(0, 0) = 0 gdzie dwa pierwsze zera oznaczają funkcję stale równą zero. Niestety, implikacja ϕ(f, f ) = 0 ⇒ f = 0
nie zachodzi, bo na przykład funkcja f : [−1, 1] → R dana wzorem
(
0 gdy x 6= 0,
f (x) =
1 gdy x = 0.
Uwaga 11.5.10 Relacja dana wzorem (11.37) jest relacją równoważności w zbiorze Riem([a, b], C).
Dowód: ćwiczenie.
O funkcjach, które są równoważne w sensie (11.37) mówimy, że są równe prawie wszędzie. Zbiór klas równoważności
relacji równości prawie wszędzie oznaczać będziemy Riem0 ([a, b], C). Mamy następujące twierdzenie.
Riem0 ([a, b], C)2 3 ([f ], [g]) 7→ [f ] + [g] := [f + g] ∈ Riem0 ([a, b], C),
C × Riem0 ([a, b], C) 3 (c, [f ]) 7→ c[f ] := [cf ] ∈ Riem0 ([a, b], C)
są dobrze określonymi działaniami w Riem0 ([a, b], C) i zadają w niej strukturę przestrzeni wektorowej nad ciałem C.
Ponadto, dla β ∈ R+ odwzorowanie
Z b
ϕ̃ : (Riem0 ([a, b], C)) 3 ([f ], [g]) 7→ β
2
f ḡ ∈ C (11.38)
a
jest dobrze określonym zespolonym iloczynem skalarnym w Riem0 ([a, b], C).
11.5. SZEREGI FOURIERA 271
Dowód: ćwiczenie.
W dalszym ciągu skoncentrujemy się na przestrzeni Riem0 ([−π, π], C). Aby uprościć terminologię i notację elementy
Riem0 ([−π, π], C) nazywać będziemy funkcjami i oznaczać będziemy tak jak zwykłe funkcje. Zespolony iloczyn skalarny
(11.38) przy β = 2π1
dla f, g ∈ Riem0 ([−π, π], C) oznaczać będziemy zwięźle (f |g). Tak więc
1 π
Z
(f |g) := f ḡ.
2π −π
Normę pochodzącą od tego iloczynu skalarnego oznaczać będziemy ||f ||2 , zatem
1
Z π
||f ||22 := f f¯
2π −π
Definicja 11.5.12 Przeliczalną rodzinę funkcji Ψ ⊂ Riem0 ([−π, π], C) nazywać będziemy układem ortonormalnym,
jeżeli dla ψ, ψ 0 ∈ Ψ zachodzi (
1 gdy ψ = ψ 0 ,
(ψ|ψ ) =
0
0 w przeciwnym razie.
Przykład 11.5.13 Układem ortonormalnym jest rodzina funkcji { En : [−π, π] → C | n ∈ Z } gdzie En (x) := einx .
Rzeczywiście, dla n, m, ∈ Z mamy
1 1
Z π Z π
(Em |En ) = einx e−imx dx = ei(n−m)x dx =
2π −π 2π −π
(
1 1 1 gdy m = n,
Z π Z π
= cos(n − m)xdx + i sin(n − m)xdx =
2π −π 2π −π 0 w przeciwnym razie.
W pojęciu układu ortonormalnego istotna jest przeliczalność rodziny funkcji. Natomiast w zależności od konkrentego
układu czasami wygodniej jest indeksować go liczbami naturalnymi, a czasami liczbami całkowitymi. Oba sposoby indekso-
wania są równoważne, bo oba gwarantują przeliczalność.
Niech
n
X
Fn (f ) := cm ψm
m=0
1 1
Z π Z π
|f − Fn (f )| ¬ |f − tn | (11.39)
2π −π 2π −π
czyli
||f − Fn (f )||22 ¬ ||f − tn ||22 . (11.40)
Ponadto mamy nierówność
∞
1 π
X Z
|cm |2 ¬ |f |2 = ||f ||22 , (11.41)
m=0
2π −π
Dowód: (*)Mamy
n n n
1 π
1 π
1 π
Z Z X X Z X
(f |tn ) = f tn = f γ m ψm = γm f ψm = γ m cm
2π −π 2π −π m=0 m=0
2π −π m=0
oraz
n
! n
! n X
n n n
1 π
1 π
1 π
Z Z X X X Z X X
||tn ||22 = tn tn = γm ψm γ k ψk = γm γ k ψm ψ k = γm γ m = |γm |2 .
2π −π 2π −π m=0 m=0 k=0
2π −π m=0 m=0
k=0
Zatem
1
Z π
||f − tn ||22 = (f − tn ) (f − tn )
2π −π
1 1 1 1
Z π Z π Z π Z π
= 2
|f | − f tn − f tn + |tn |2
2π −π 2π −π 2π −π 2π −π
n n n
1
Z π X X X
= |f |2 − γ m cm − γm cm + γm γ m
2π −π m=0 m=0 m=0
n
! n n n n
!
1
Z π X X X X X
= |f |2 − |cm |2 + |cm |2 − γ m cm − γm cm + γm γ m
2π −π m=0 m=0 m=0 m=0 m=0
n n
1
Z π X X
= |f |2 − |cm |2 + |γm − cm |2
2π −π m=0 m=0
skąd wnosimy, że minimum jest osiągnięte przy γm = cm . Dowodzi to nierówności (11.40), a tym samym również nierówności
(11.39). Ostatnia otrzymana nierówność po podstawieniu γn := cn daje w szczególności dla każdego n ∈ N
n
1 π
Z X
0 ¬ ||f − Fn (f )||22 = |f |2 − |cm |2
2π −π m=0
11.5. SZEREGI FOURIERA 273
Rysunek 11.12: Interpretacja geometryczna twierdzenia 11.5.15 . Odległość f od rzutu prostokątnego f na płaszczyznę
ψ1 , ψ2 minimalizuje odległość f od punktów tej płaszczyzny. Kwadrat długości f nie jest pełną sumą kwadratów długości
rzutów prostokątnych f na osie wektorów ψ1 , ψ2 , bo do kompletu brakuje jeszcze kwadratów rzutów na pozostałe osie.
Dlatego nierówność Bessela jest tylko nierównością.
274 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
1 1
Z π Z π Z π
i
cn (f ) := cn := f (x)e−inx dx = f (x) cos nxdx − f (x) sin nxdx.
2π −π 2π −π 2π −π
definiuje funkcją rzeczywistą Cn# (f ) : [−π, π] → R. Jest to rzut prostokątny f na płaszczyznę wyznaczoną przez funkcje
x 7→ sin nx, oraz x 7→ cos nx interpretowane jako wektory nieskończenie wymiarowej przestrzeni wektorowej. Wtedy
1 π 1 π
Z Z
an = f (x) cos nxdx bn = f (x) sin nxdx.
π −π π −π
Dokonując stosownej zmiany zmiennych we wzorze całkowym na cn (f ) dostajemy z kolei poniższą uwagę.
1
Z π
Cn (f )(x) = f (x − s)eins ds (11.42)
2π −π
1 π
Z
Cn# (f )(x) = f (x − s) cos nsds (11.43)
π −π
Dowód: Rozszerzmy f do funkcji okresowej f : R → R o okresie 2π. Dokonując podstawienia s := x−t z twierdzenia 10.4.1
mamy
1 π
1 x−π
1 x+π
1 π
Z Z Z Z
Cn (f )(x) = cn (f )e inx
= f (t)e in(x−t)
dt = − f (x−s)e
ins
ds = f (x−s)e ins
ds = f (x−s)eins ds
2π −π 2π x+π 2π x−π 2π −π
11.5. SZEREGI FOURIERA 275
1
x
π 2π 3π 4π 5π 6π 7π 8π
-1
s s s
Rysunek 11.13: Interpretacja geometryczna wzoru (11.43). Wartość Cn# (f )(x) może być interpretowana jako średnia wartości
funkcji f w otoczeniu punktu x ważona funkcją cosinus przesuniętą do punktu x. Wartość ta jest duża i dodatnia, gdy wartości
funkcji f i wagi ze sobą współgrają, czyli f jest dodatnie tam gdzie cosinus jest dodatni, a ujemne gdy cosinus jest ujemny.
Dzieje się tak w punkcie 4π. W punkcie 7π jest na odwrót: f jest dodatnie tam gdzie cosinus jest ujemny, a ujemne gdy
cosinus jest dodatni. W efekcie Cn# (f )(x) ma wartość dużą ujemną. Tak jest w punkcie 7π. Z kolei w punkcie 3π/2 brak
współgrania: tam gdzie cosinus jest dodatni, f jest tak dodatnie jak i ujemne i w wyniku ważenia Cn# (f )(x) daje zero.
czyli (11.43).
Jądro Dirichleta pozwala wyliczyć N -tą sumę częściową szeregu Fouriera funkcji f . Dokładniej, przyjmując, że oznaczenia
FN (f ) i F (f ) na N -tą sumę częściową i szereg Fouriera funkcji f odnoszą się do układu ortonormalnego z przykładu 11.5.13
, mamy następujące twierdzenie.
1
Z π
FN (f ) = f (x − s)DN (s)ds.
2π −π
Dowód: Mamy
N N N
1 π
1 π
1 π
X X Z Z X Z
FN (f )(x) = Cn (f )(x) = f (x − s)e ins
ds = f (x − s) e ins
ds = f (x − s)DN (s)ds.
2π −π 2π −π 2π −π
n=−N n=−N n=−N
Przydatna jest następująca uwaga, pozwalająca wyliczyć wartość jądra Dirichleta bez sumowania.
276 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
sin(N + 21 )x
gdy x 6= 0,
DN (x) = (11.44)
1
sin 2x
2N + 1 gdy x = 0.
Ponadto
1 π
Z
DN (x)dx = 1. (11.45)
2π −π
Dowód: (*)Wzór (11.44) dla x = 0 wynika wprost z definicji. Natomiast dla x 6= 0 mamy
N
X +1 N
X
(eix − 1)DN (x) = einx − einx = ei(N +1)x − e−iN x .
n=−N +1 n=−N
1 − ix
Stąd, po przemnożeniu obu stron przez 2i e
2 otrzymujemy
1 ix ix
1 i(N + 1 )x 1
e 2 − e− 2 DN (x) = e 2 − e−i(N + 2 )x ,
2i 2i
a następnie wykorzystując definicję funkcji sin (definicja 6.3.3 ) dostajemy (11.44).
Aby otrzymać (11.45) zauważmy, że dla n 6= 0 namy
π
1 π
1 einx
Z
e inx
dx = = 0,
2π −π 2π in −π
a dla n = 0 mamy
1 π
1 π
1
Z Z
π
e i·0·x
dx = 1dx = x | = 1,
2π −π 2π −π 2π −π
skąd dostajemy (11.45).
Twierdzenie 11.5.21 Niech f : R → C będzie funkcją okresową o okresie 2π i całkowalną w sensie Riemanna na
przedziale [−π, π]. Załóżmy ponadto, że dla każdego x ∈ R istnieje δ > 0 i stała M > 0 takie, że
0 dla t ∈ { kπ
2 | k ∈ Z }.
11.5. SZEREGI FOURIERA 277
x0 x0 x0
Rysunek 11.14: Interpretacja geometryczna założenia twierdzenia 11.5.21 . W punkcie x0 na rysunku po lewej wykres
funkcji w okolicy x0 daje się zamknąć w dwustronnym stożku o wierzchołku w (x0 , f (x0 )). Na rysunku środkowym nie jest
to możliwe, bo funkcja nie jest ciągła w x0 . Na rysunku po prawej też nie jest to możliwe, bo funkcja w x0 ma pionową
styczną. Zatem tylko przypadek po lewej spełnia założenie twierdzenia 11.5.21 w punkcie x0 .
Twierdzimy, że funkcja g jest ograniczona w przedziale [−π, π]. Niech M 0 := sup { | sin|t|1 t| | t ∈ [−π, π] }. Mamy M 0 < ∞, bo
2
|t|
funkcja t 7→ | sin 12 t|
jest ciągła dla t 6= 0, a w t = 0 ma granicę 2 w zerze. Zatem
f (x − t) − f (x) |t|
¬M ¬ M M 0,
sin 12 t | sin 21 t|
co dowodzi ograniczoności g. Co więcej, zbiór punktów nieciągłości funkcji g w przedziale [−π, π] jest co najwyżej większy o
punkt zero od zbioru nieciągłości funkcji f w tym przedziale. Tak więc g jest całkowalna w sensie Riemanna na przedziale
[−π, π]. Podobnie całkowalne są zatem funkcje
1
g1 : R 3 t 7→ g(t) cos t ∈ R
2
1
g2 : R 3 t 7→ g(t) sin t ∈ R
2
Mamy więc
1 1
Z π Z π
FN (f )(x) − f (x) = f (x − t)Dn (t)dt − f (x)DN (t)dt
2π −π 2π −π
1
Z π
= (f (x − t) − f (x))DN (t)dt
2π −π
1 1
Z π
= g(t) sin(N + )tdt
2π −π 2
1 1 1 1
Z π Z π
= (g(t) cos t) sin N tdt + (g(t) sin t) cos N tdt
2π −π 2 2π −π 2
= im cN (g1 ) + re cN (g2 ).
Z nierówności Bessela wiemy, że limn→∞ cN (g1 ) = 0 i podobnie limn→∞ cN (g2 ) = 0. Ostatecznie więc dostajemy
lim (FN (f )(x) − f (x)) = 0.
n→∞
278 ROZDZIAŁ 11. CIĄGI I SZEREGI FUNKCYJNE
Przykład 11.5.22 Rozwiniemy w szereg Fouriera w przedziale [−π, π] funkcję f : [−π, π] 3 x 7→ x ∈ R. Mamy
1
Z π
c0 = xdx = 0,
2π −π
a dla n 6= 0
1 π
1 π
1 π π
Z Z Z Z
i
cn = xe−inx dx = x(cos nx − i sin nx)dx = x cos nxdx − x sin nxdx.
2π −π 2π −π 2π −π 2π −π
Ale mamy
π
sin nx sin nx 1 1
Z π Z π Z π Z π
d(sin nx) π
x cos nxdx = x =x − dx = 0 − 2 sin nxd(nx) = cos nx|−π = 0
−π −π n n −π −π n n −π n2
oraz
π
− cos nx cos nx cos nx π cos nx + π cos nx sin nx
Z π Z π
π
Z π
x sin nxdx = xd = −x + 2
d(nx) = − +− 2
−π −π n n −π −π n n n −π
2π cos nπ (−1) |n|
= − = −2π .
n n
Zatem
1 −2π(−1)|n| (−1)|n| i
cn = −i · = .
2π n n
Dostajemy więc
∞ ∞
X X (−1)|n| i
F (f )(x) = cn einx = (cos nx + i sin nx)
n=−∞ n=−∞
n
∞
(−1)n i (−1)n i
X
= (cos nx + i sin nx) + (cos(−nx) + i sin(−nx))
n=1
n −n
∞
2(−1)n+1 sin 2x sin 3x
X
= sin nx = 2 sin x − + + ...
n=1
n 2 3
Z ostatniego twierdzenia wnosimy, że szereg ten jest zbieżny dla x ∈ (−π, π). Tak więc
x sin 2x sin 3x
= sin x − + + ....
2 2 3
W szczególności podstawiając x := π
2 dostajemy następujący wniosek.
[1] F. Leja, Rachunek różniczkowy i całkowy, Państwowe Wydawnictwo Naukowe, Warszawa 1969.
[2] W. Rudin, Podstawy analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 1982.
[3] W. Rudnicki, Wykłady z analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 2001.
[4] G.M. Fichtenholz, Rachunek różniczkowy i całkowy, tom I, II i III. Państwowe Wydawnictwo Naukowe, Warszawa 1978.
[5] W. Krysicki, L. Włodarski, Analiza matematyczna w zadaniach, część I i II, Państwowe Wydawnictwo Naukowe, War-
szawa 1986.
[6] J. Banaś, S. Wędrychowicz, Zbiór zadań z analizy matematycznej, Wydawnictwo Naukowo-Techniczne, Warszawa 2001.
279