Professional Documents
Culture Documents
43 CHATZIPANTELIDIS Numerical Analysis
43 CHATZIPANTELIDIS Numerical Analysis
Πλεξουσάκης
Π. Χατζηπαντελίδης
ΑΡΙΘΜΗΤΙΚΗ
ΑΝΑΛΥΣΗ
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ
Αριθμητική Ανάλυση
Μιχάλης Πλεξουσάκης
Επίκουρος Καθηγητής
Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών
Πανεπιστήμιο Κρήτης
Ηράκλειο
Παναγιώτης Χατζηπαντελίδης
Αναπληρωτής Καθηγητής
Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών
Πανεπιστήμιο Κρήτης
Ηράκλειο
ΚΑΛΛΙΠΟΣ
ΑΝΟΙΚΤΕΣ ΑΚΑΔΗΜΑΪΚΕΣ ΕΚΔΟΣΕΙΣ
www.kallipos.gr
Copyright © 2023, ΣΕΑΒ/ ΕΛΚΕ ΕΜΠ - ΚΑΛΛΙΠΟΣ,
ΑΝΟΙΚΤΕΣ ΑΚΑΔΗΜΑΪΚΕΣ ΕΚΔΟΣΕΙΣ
Το παρόν έργο διατίθεται με τους όρους της άδειας Creative Commons Αναφορά Δημιουργού – Μη Εμπο-
ρική Χρήση – Παρόμοια Διανομή 4.0. Για να δείτε τους όρους της άδειας αυτής επισκεφτείτε τον ιστότοπο
https://creativecommons.org/licenses/by‐nc‐sa/4.0/legalcode.el
Αν τυχόν κάποιο τμήμα του έργου διατίθεται με διαφορετικό καθεστώς αδειοδότησης, αυτό αναφέρεται ρητά
και ειδικώς στην οικεία θέση.
Συντελεστές έκδοσης
Γλωσσική επιμέλεια: Κυριακή Ευαγγελία Ασλάνη
Γραφιστική επιμέλεια: Μιχάλης Πλεξουσάκης, Παναγιώτης Χατζηπαντελίδης
Τεχνική επεξεργασία: Μιχάλης Πλεξουσάκης, Παναγιώτης Χατζηπαντελίδης
Κεντρική Ομάδα Υποστήριξης
Γλωσσικός Έλεγχος: Γεωργία Τριανταφυλλίδου
Γραφιστικός Έλεγχος: Χρήστος Κεντρωτής
Βιβλιοθηκονομική Επεξεργασία: Αλέξανδρος Ηλιάκης
ΚΑΛΛΙΠΟΣ
Εθνικό Μετσόβιο Πολυτεχνείο
Ηρώων Πολυτεχνείου 9
15780 Ζωγράφου
www.kallipos.gr
2.1 Γενικά . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Ανάλυση LU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3 Δείκτης κατάστασης . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Ανάλυση Cholesky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5 Ανάλυση QR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.6 Ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Βιβλιογραφία . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
i
ii ΠΕΡΙΕΧΟΜΕΝΑ
4 Ελάχιστα τετράγωνα 63
Μιχάλης Πλεξουσάκης, Παναγιώτης Χατζηπαντελίδης
5 Προβλήματα ιδιοτιμών 71
Μιχάλης Πλεξουσάκης, Παναγιώτης Χατζηπαντελίδης
7.1 Βήματα της μεθόδου Newton-Raphson με αρχική τιμή x0 = (1, 5)T , x0 = (−4, 3)T και
x0 = (2, −4)T , αντίστοιχα, πάνω από τις ισοϋψείς καμπύλες της kF k2 του Παραδείγμα-
τος 7.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
8.1 Εφαρμογή του θεωρήματος Picard-Lindelöf στο πρόβλημα αρχικών τιμών του Παραδείγ-
ματος 8.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
9.1 Η ακριβής λύση του προβλήματος στο Παράδειγμα 9.1 για διάφορες αρχικές τιμές c, καθώς
και η προσεγγιστική λύση για αρχική τιμή c = 5/2, με τη μέθοδο Euler, με βήμα h = 1/5.
Με τις τελείες είναι οι προσεγγίσεις που δίνει η μέθοδος. . . . . . . . . . . . . . . . . . 131
9.2 Τοπικό σφάλμα διακριτοποίησης. Το σημείο P1 προκύπτει κάνοντας ένα βήμα μεγέθους h
με τη μέθοδο Euler, αν ξεκινήσουμε από το σημείο (t, y(t)). Το σημείο P2 είναι το σημείο
του γραφήματος για την ακριβή τιμή y(t + h). Η διαφορά των δύο σημείων δίνει το τοπικό
σφάλμα διακριτοποίησης. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
9.3 Παράδειγμα 9.2. Πάνω αριστερά: Η καμπύλη x(t)2 + y(t)2 της ακριβούς λύσης. Υπόλοι-
πες: Οι αντίστοιχες καμπύλες που δημιουργούν οι προσεγγίσεις με την άμεση μέθοδο Euler
για N = 50, 100, 200, 400. Καθώς αυξάνεται το πλήθος των σημείων N δηλαδή μειώνε-
ται η παράμετρος διαμέρισης h, η καμπύλη των προσεγγίσεων πλησιάζει την καμπύλη της
ακριβούς λύσης. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
9.4 Η ακριβής λύση του προβλήματος στο Παράδειγμα 9.3 καθώς και οι προσεγγιστικές λύσεις
με τη μέθοδο Euler, την πεπλεγμένη μεθόδο Εuler, τη μέθοδο του τραπεζίου και τη μέθοδο
του μέσου, με βήμα h = 1/25. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
9.5 Η ακριβής λύση του προβλήματος στο Παράδειγμα 9.4 καθώς και οι προσεγγιστικές λύσεις
με τη μέθοδο Euler, την πεπλεγμένη μεθόδο Εuler, τη μέθοδο του τραπεζίου και τη μέθοδο
του μέσου, με βήμα h = 1/10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
v
vi ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ
12.1 Η μέθοδος Euler με h = 1/50 για την αριθμητική λύση του Παραδείγματος 12.1. . . . . 184
12.2 Η μέθοδος Euler με h = 1/50, 1/80, 1/100, 1/120, για την αριθμητική λύση του Πα-
ραδείγματος 12.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
12.3 Η πεπλεγμένη μέθοδος Euler με h = 1/50 για την αριθμητική λύση του Παραδείγματος
(12.2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
12.4 Η μέθοδος Euler με h = 1/16 για την αριθμητική λύση του προβλήματος (12.12). . . . . 189
12.5 Το χωρίο Sθ στο μιγαδικό επίπεδο. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
12.6 Περιοχές απόλυτης ευστάθειας των άμεσων μεθόδων Runge-Kutta με τάξεις ακρίβειας p =
1, 2, 3, 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
12.7 Αριστερά: Περιοχές απόλυτης ευστάθειας των k βηματικών μεθόδων Adams-Bashforth με
k = 2, 3, 4. Δεξιά: Περιοχές απόλυτης ευστάθειας των k βηματικών μεθόδων Adams-
Moulton με k = 2, 3, 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
12.8 Περιοχές απόλυτης ευστάθειας των k βηματικών μεθόδων BDF με k = 2, 3, 4, 5, 6. Η
BDF με k = 2 είναι A-ευσταθής. Οι μέθοδοι BDF με k = 3, 4, 5, 6 είναι A(θ)-ευσταθείς,
επειδή περιέχουν τον κώνο Sθ με θ ≈ 86◦ , θ ≈ 73◦ , θ ≈ 52◦ , θ ≈ 18◦ . . . . . . . . . 194
ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ
9.1 Η ακριβής λύση του προβλήματος στο Παράδειγμα 9.1 και η προσεγγιστική λύση για αρ-
χική τιμή c = 5/2, με τη μέθοδο Euler, με βήμα h = 1/5. . . . . . . . . . . . . . . . . 131
9.2 Παράδειγμα 9.1. Η ακριβής λύση του προβλήματος και η προσεγγιστική λύση για αρχική
τιμή c = 5/2, με τη μέθοδο Euler, με βήμα h = 1/5, h = 1/10 και h = 1/20. . . . . . 132
9.3 Τα σφάλματα |y(tN ) − y N | στο σημείο tN = N h = 10 των μεθόδων Εuler, πεπλεγμένης
Εuler, τραπεζίου και μέσου, υπολογισμένα για N = 100, 200, 300, 400 και οι αντίστοιχες
προσεγγίσεις της τάξης ακρίβειας p για το Παράδειγμα 9.3. . . . . . . . . . . . . . . . . 142
9.4 Τα σφάλματα |y(tN ) − y N | στο σημείο tN = N h = 1 των μεθόδων Εuler, πεπλεγμένης
Εuler, τραπεζίου και μέσου υπολογισμένα για N = 50, 100, 150, 200 και οι αντίστοιχες
προσεγγίσεις της τάξης ακρίβειας p για το Παράδειγμα 9.4. . . . . . . . . . . . . . . . . 143
10.1 Σφάλματα μεθόδων Runge-Kutta, για N h = 10 και αντίστοιχες προσεγγίσεις της τάξης
ακρίβειας p. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
11.1 Σφάλματα της μεθόδου του Παραδείγματος 11.4 για t = 0.5, 1, 1.5, 2 και N = 20, 40,
80, 160. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
12.1 Η μέθοδος Euler στο πρόβλημα (12.7) με λ = −1000, f (t) = t2 , y(0) = 0 και h =
1/400. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
13.1 Άσκηση 6.6.4: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 = 2. 223
13.2 Άσκηση 6.6.4: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 = 1. 224
13.3 Άσκηση 6.6.7: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 =
0.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
13.4 Άσκηση 6.6.8: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 = 1. 225
vii
viii ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ
13.5 Άσκηση 6.6.8: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 = 2. 225
13.6 Άσκηση 6.6.10: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή
x0 = 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
ΠΙΝΑΚΑΣ ΣΥΝΤΟΜΕΥΣΕΩΝ - ΑΚΡΩΝΥΜΙΩΝ
ix
x ΠΙΝΑΚΑΣ ΣΥΝΤΟΜΕΥΣΕΩΝ - ΑΚΡΩΝΥΜΙΩΝ
Μέρος I
Περίληψη
Ξεκινάμε ανακαλώντας μερικές βασικές έννοιες από τη γραμμική άλγεβρα, καθώς αυτές αποτελούν τη βάση
αυτών που θα εξετάσουμε στο πρώτο μέρος αυτού του βιβλίου, δηλαδή την αριθμητική γραμμική άλγεβρα.
Για αυτόν τον λόγο πολλές προτάσεις δίνονται χωρίς αποδείξεις. Επίσης εισάγουμε τον συμβολισμό και την
ορολογία που θα χρησιμοποιήσουμε στη συνέχεια. Το βιβλίο των Horn και Johnson [2] ή το βιβλίο του Strang
[4], αποτελούν καλές βιβλιογραφικές αναφορές για τη γραμμική άλγεβρα και την ανάλυση πινάκων.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Γραμμικής Άλγεβρας.
Ορισμός 1.1. Έστω K ένα σώμα (συνήθως το R ή το C). Το σύνολο X ονομάζεται διανυσματικός χώρος πάνω
από το K αν υπάρχουν πράξεις + : X × X → X και · : K × X → X τέτοιες ώστε η τριάδα (X, + , · ) να
ικανοποιεί τα ακόλουθα:
1. Υπάρχει στοιχείο 0 ∈ X τέτοιο ώστε για κάθε x ∈ X
x + 0 = 0 + x = x.
x + y = y + x.
α · (β · x) = (αβ) · x.
1 · x = x.
(α + β) · x = α · x + β · x.
α · (x + y) = α · x + α · y.
Για παράδειγμα, ο C είναι διανυσματικός χώρος πάνω από το R. Ακόμα, ο χώρος Pn (K) των πολυωνύμων
βαθμού το πολύ n με συντελεστές από το σώμα K είναι διανυσματικός χώρος πάνω από το K.
Ορισμός 1.2. Έστω K σώμα και n ∈ N. Θα γράφουμε
Kn = {v = (v1 , . . . , vn )T | vi ∈ K, i = 1, . . . , n}.
Για x, y ∈ Kn και α ∈ K ορίζουμε τις πράξεις της πρόσθεσης και του πολλαπλασιασμού ως
Εύκολα διαπιστώνει κανείς ότι με αυτές τις πράξεις της πρόσθεσης και του πολλαπλασιασμού, ο Kn είναι
διανυσματικός χώρος πάνω από το K.
Ορισμός 1.3. Έστω V διανυσματικός χώρος πάνω από το σώμα K και
S = {x1 , . . . , xn } ⊆ V.
Ορισμός 1.5. Έστω V διανυσματικός χώρος πάνω από το σώμα K με τις πράξεις της πρόσθεσης ‘+’ και του
πολλαπλασιασμού ‘ · ’. Θα λέμε ότι το μη κενό σύνολο W ⊆ V είναι υπόχωρος του V αν (W, +, ·) είναι
διανυσματικός χώρος πάνω από το K.
Εύκολα διαπιστώνει κανείς ότι αν V είναι διανυσματικός χώρος πάνω από το K και S = {x1 , . . . , xn } ⊆ V,
τότε span(S) είναι υπόχωρος του V.
Ορισμός 1.6. Έστω V διανυσματικός χώρος πάνω από το σώμα K και
J = {|S| : S ⊆ V, S γραμμικά ανεξάρτητο, |S| < ∞},
όπου |S| είναι η πληθικότητα του S. Αν το J είναι φραγμένο, θα λέμε ότι ο χώρος V έχει πεπερασμένη διάσταση
και θα γράφουμε dim(V) = max J, διαφορετικά, θα λέμε ότι ο V είναι απειροδιάστατος. Αν dim(V) = k,
τότε το σύνολο B ⊆ V θα λέγεται βάση του V αν και μόνο αν τα στοιχεία του B είναι γραμμικά ανεξάρτητα
και |B| = k.
Για παράδειγμα, τα στοιχεία του απειροσύνολου S = {1, x, x2 , . . .} είναι γραμμικά ανεξάρτητα, συνεπώς ο
χώρος των πολυώνυμων P είναι απειροδιάστατος. Το ίδιο ισχύει για τον διανυσματικό χώρο C([−1, 1]; C)
των συνεχών συναρτήσεων στο [−1, 1] με τιμές στο C. Το σύνολο B = {e(1) , . . . , e(n) }, όπου
(
(i) 1 αν i = j,
ej = δij = 1 ≤ i, j ≤ n,
0 διαφορετικά,
εύκολα αποδεικνύεται ότι αποτελεί βάση του Cn . Θα αναφερόμαστε σε αυτήν ως την κανονική βάση του Cn .
Ορισμός 1.7. Έστω V ένας διανυσματικός χώρος πάνω από τους μιγαδικούς αριθμούς. Η απεικόνιση (·, ·) :
V × V → C ονομάζεται εσωτερικό γινόμενο αν ισχύουν οι ακόλουθες ιδιότητες:
(i.) Για κάθε x, y ∈ V (x, y) = (y, x).
(ii.) Για κάθε x, y ∈ V και λ ∈ C (λx, y) = λ(x, y).
(iii.) Για κάθε x, y, z ∈ V (x + y, z) = (x, z) + (y, z).
(iv.) Για κάθε x ∈ V 0 ≤ (x, x) ∈ R και αν (x, x) = 0 τότε x = 0.
Παρατήρηση 1.1 (Παραδείγματα χωρών με εσωτερικό γινόμενο.). Το εσωτερικό γινόμενο των x ∈ Rn και
y ∈ Rn είναι ο πραγματικός αριθμός
X
n
(x, y) = xT y = xi yi = y T x = (y, x).
i=1
Ορισμός 1.8. Έστω V ένας διανυσματικός χώρος με εσωτερικό γινόμενο (·, ·). Λέμε ότι τα x, y ∈ V είναι
ορθογώνια και γράφουμε x⊥y αν (x, y) = 0. Το σύνολο S ⊂ V λέγεται ορθογώνιο αν για κάθε x, y ∈ S
με x 6= y έχουμε x⊥y. Δύο σύνολα S1 , S2 ⊂ V λέγονται ορθογώνια μεταξύ τους αν για κάθε x ∈ S1 και
κάθε y ∈ S2 με x 6= y έχουμε x⊥y. Αν S1 , S2 είναι ορθογώνια μεταξύ τους, γράφουμε S1 ⊥S2 . Αν S1 , S2
είναι επιπλέον και υπόχωροι του V λέγονται ορθογώνιοι χώροι.
6 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΓΡΑΜΜΙΚΗΣ ΑΛΓΕΒΡΑΣ
Ορισμός 1.9. Έστω V ένας διανυσματικός χώρος πάνω από τους μιγαδικούς αριθμούς. Η συνάρτηση k · k :
V → R ονομάζεται νόρμα στον V αν ικανοποιούνται οι ακόλουθες ιδιότητες:
(i) kvk = 0 αν και μόνο αν v = 0.
(ii) kλvk = |λ|kvk για κάθε λ ∈ C, v ∈ V.
(iii) (τριγωνική ανισότητα) kv + wk ≤ kvk + kwk για κάθε v, w ∈ V.
Λήμμα 1.1. Έστω V ένας διανυσματικός χώρος πάνω από τους μιγαδικούς αριθμούς, με νόρμα k · k. Τότε
(i) kvk ≥ 0, για κάθε v ∈ V.
(ii) kv − wk ≥ |kvk − kwk|, για κάθε v, w ∈ V .
Απόδειξη. Η πρώτη σχέση προκύπτει εύκολα από τις ιδιότητες του Ορισμού 1.9,
0 = kv + (−v)k ≤ kvk + k − vk = 2kvk.
Στη συνέχεια, επειδή
kvk = k(v − w) + wk ≤ kv − wk + kwk,
kwk = k(w − v) + vk ≤ kv − wk + kvk,
παίρνουμε και τη δεύτερη σχέση.
Παρατήρηση 1.2. Εύκολα διαπιστώνουμε ότι αν V είναι διανυσματικός χώρος με εσωτερικό γινόμενο (·, ·),
τότε η σχέση p
kxk = (x, x), (1.1)
ορίζει μια νόρμα στον V.
Ορισμός 1.10. Έστω V ένας διανυσματικός χώρος με εσωτερικό γινόμενο (·, ·) και S ⊂ V. Το S θα λέγεται
ορθοκανονικό αν είναι ορθογώνιο και επιπλέον για κάθε x ∈ S, kxk = 1, όπου k · k είναι η νόρμα που
παράγεται από το εσωτερικό γινόμενο (·, ·). Αν το S είναι και βάση του V θα λέγεται ορθοκανονική βάση.
Λήμμα 1.2 (Ανισότητα Cauchy-Schwarz). Έστω V ένας διανυσματικός χώρος πάνω από τους μιγαδικούς αριθ-
μούς με εσωτερικό γινόμενο (·, ·). Τότε, για κάθε x, y ∈ V έχουμε
|(x, y)| ≤ kxkkyk, (1.2)
με ισότητα αν και μόνο αν x, y είναι γραμμικά εξαρτημένα.
Απόδειξη. Η ανισότητα Cauchy-Schwarz ισχύει τετριμμένα αν y = 0. Υποθέτουμε ότι y 6= 0 και παρατη-
ρούμε ότι για λ = (x, y)/(y, y) και z = x − λy, έχουμε (z, y) = 0. Επομένως,
(x, x) = (z + λy, x + λy) = (z, z) + |λ|2 (y, y) ≥ |λ|2 (y, y),
από όπου προκύπτει η ζητούμενη ανισότητα. Αν τώρα x, y είναι γραμμικά εξαρτημένα, δηλαδή υπάρχει λ ∈ C
τέτοιο ώστε x = λy, έχουμε
|(x, y)|2 = |(λy, y)|2 = |λ|2 (y, y)2 = λλ̄(y, y)(y, y) = (λy, λy)(y, y) = (x, x)(y, y),
δηλαδή η ανισότητα Cauchy-Schwarz ισχύει ως ισότητα. Αν τώρα ισχύει η ισότητα |(x, y)|2 = kxk2 kyk2 ,
τότε παρατηρούμε ότι για λ = (x, y)/(y, y) έχουμε
|(x, y)|2
(x − λy, x − λy) = (x, x) − λ̄(x, y) − λ(y, x) + |λ|2 (y, y) = (x, x) − = 0.
(y, y)
Επομένως x − λy = 0, δηλαδή τα x, y είναι γραμμικώς εξαρτημένα.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 7
Παρατήρηση 1.3 (Παραδείγματα χώρων με νόρμα). Έστω x ∈ Cn . Οι λεγόμενες p-νόρμες ή νόρμες Hölder
ορίζονται ως
!1/p
X n
kxkp = |xi |p , p ≥ 1, (1.3)
i=1
όπου xi , i = 1, . . . , n, οι συνιστώσες του x. Από αυτές, οι
kxk1 = |x1 | + · · · + |xn |,
1/2
kxk2 = |x1 |2 + · · · + |xn |2 ,
kxk∞ = max |xi |,
1≤i≤n
Ορισμός 1.11. Έστω V, W διανυσματικοί χώροι πάνω από τους μιγαδικούς αριθμούς. Μια απεικόνιση T :
V → W ονομάζεται γραμμικός τελεστής αν
T (αx + βy) = α T x + β T y, ∀x, y ∈ V, ∀α, β ∈ C. (1.9)
Το σύνολο όλων των γραμμικών τελεστών από τον V στον W θα συμβολίζεται με L(V, W). Αν T, S ∈
L(V, W) και α, β ∈ C, τότε ορίζουμε τον τελεστή α T + β S από τη σχέση
(α T + β S)(x) = α T x + β Sx, ∀x ∈ V. (1.10)
Ο α T + β S είναι, προφανώς, γραμμικός τελεστής και έχουμε το ακόλουθο αποτέλεσμα:
Πρόταση 1.1. Έστω V, W διανυσματικοί χώροι πάνω από τους μιγαδικούς αριθμούς. Τότε το σύνολο L(V, W)
είναι διανυσματικός χώρος με τις πράξεις της πρόσθεσης και του πολλαπλασιασμού, όπως ορίστηκαν στην (1.10).
Αν dim(V) = m και dim(W) = n τότε, dim(L(V, W)) = mn.
Η σχέση (1.9) εκφράζει το γεγονός ότι ένας γραμμικός τελεστής T είναι ένας ομοιομορφισμός μεταξύ των
χώρων V και W, με την έννοια ότι διατηρεί τις δύο πράξεις των διανυσματικών χώρων: Στη σχέση (1.9) στο
αριστερό μέλος, πρώτα εφαρμόζουμε τις πράξεις του διανυσματικού χώρου και μετά απεικονίζουμε στον χώρο
W, ενώ στο δεξί μέλος πρώτα απεικονίζουμε στον χώρο W και μετά εφαρμόζουμε τις αντίστοιχες πράξεις,
λαμβάνοντας το ίδιο αποτέλεσμα.
8 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΓΡΑΜΜΙΚΗΣ ΑΛΓΕΒΡΑΣ
Ορισμός 1.12. Αν T ∈ L(V, W), καλούμε πυρήνα του T και συμβολίζουμε με N (T ), το υποσύνολο του
V που αποτελειται από όλα τα διανύσματα τέτοια ώστε ο T τα απεικονίζει στο μηδενικό στοιχείο του W,
N (T ) = {v ∈ V : T v = 0}.
Ορισμός 1.13. Αν T ∈ L(V, W), καλούμε εικόνα του T και το συμβολίζουμε με R(T ), το υποσύνολο του
W που αποτελείται από όλα τα διανύσματα της μορφής T v, για κάποιο v ∈ V,
R(T ) = {T v ∈ W : v ∈ V}.
Μπορούμε να δούμε ότι τα N (T ) και R(T ) είναι υπόχωροι των V και W. Το επόμενο θεώρημα είναι
πολύ σημαντικό και συνδέει τις διαστάσεις των υποχώρων N (T ) και R(T ) ενός γραμμικού τελεστή. Για την
απόδειξη βλ. π.χ. [3], [4].
Θεώρημα 1.1 (Θεμελιώδες Θεώρημα Γραμμικών Τελεστών). Έστω V ένας πεπερασμένης διάστασης διανυ-
σματικός χώρος και T ∈ L(V, W). Τότε R(T ) είναι διανυσματικός χώρος πεπερασμένης διάστασης και
Ορισμός 1.14. Ένας m × n πίνακας είναι μια διάταξη αριθμών σε m γραμμές και n στήλες. Αν ο A είναι ένας
m × n πίνακας θα συμβολίζουμε το στοιχείο του στη γραμμή i, στήλη j με aij . Θα γράφουμε A ∈ Rm×n αν
τα στοιχεία του A είναι πραγματικοί αριθμοί και A ∈ Cm×n αν τα στοιχεία του A είναι μιγαδικοί αριθμοί.¹
Οι n × n πίνακες λέγονται τετραγωνικοί.
a11 ··· a1n
.. .. .
A = (aij ) = . .
am1 · · · amn
Θα γράφουμε Rm αντί για Rm×1 και Cm αντί για Cm×1 και θα αναφερόμαστε στα στοιχεία τους ως δια-
νύσματα-στήλες ή απλά διανύσματα. Το στοιχείο του διανύσματος x στη γραμμή i θα συμβολίζεται με xi . Θα
χρησιμοποιούμε, συνήθως, κεφαλαία γράμματα για τους πίνακες και πεζά γράμματα για τα διανύσματα.
Ο n × n ταυτοτικός πίνακας θα συμβολίζεται με In και η k-στή στήλη του, το λεγόμενο k-στό κανονικό
διάνυσμα, με e(k) :
1 0 ··· 0 0 0
0 1 0 ··· 0 ..
.
.. . ..
In = . .. . e(k) = 1 ← k-θέση
.
0 . . . 0 1 0 ..
0 0 ... 0 1 0
a11 · · · am1
T .. .. .
A = (aji ) = . .
a1n · · · amn
¹Τα περισσότερα αποτελέσματα που ακολουθούν αφορούν πραγματικούς πίνακες, αλλά η θεώρηση μιγαδικών πινάκων δεν
προσθέτει επιπλέον δυσκολίες.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 9
Αν A ∈ Cm×n , ο συμβολισμός A = (c(1) , . . . , c(n) ) δηλώνει ότι c(k) ∈ Cm είναι η k-στή στήλη του A.
Για παράδειγμα In = (e(1) , . . . , e(n) ). Όμοια, ο συμβολισμός
T
r(1)
A = ...
T
r(m)
T
δηλώνει ότι r(k) είναι η k-στή γραμμή του A.
΄Εστω A ∈ Cm×n . Αν 1 ≤ i1 < i2 < · · · < ir ≤ m και 1 ≤ j1 < j2 < · · · < js ≤ n, τότε ο
πίνακας B ∈ Cr×s με bpq = aip jq ονομάζεται υποπίνακας του A. Κύριος υποπίνακας είναι ένας υποπίνακας
για τον οποίο r = s και i1 = j1 , i2 = j2 , . . . , ir = jr .
Ορισμός 1.16 (Συζυγής ανάστροφος). Ο συζυγής ανάστροφος του A ∈ Cm×n συμβολίζεται με AH και
ορίζεται ως
(AH )ij = aji .
Προφανώς, αν A ∈ Rm×n τότε AH = AT . Οι ακόλουθες ιδιότητες του ανάστροφου και συζυγούς
ανάστροφου είναι εύκολο να ελεγχθούν. Για λ ∈ C και A ∈ Cm×n έχουμε:
(AT )T = A, (AH )H = A,
(λA)T = λAT , (λA)H = λ̄AH ,
(A + B)T = AT + B T , (A + B)H = AH + B H .
Θα λέμε ότι ο A είναι συμμετρικός αν AT = A και ερμιτιανός (Hermitian) αν AH = A. Θα λέμε ότι ο A
είναι αντισυμμετρικός αν AT = −A και αντι-ερμιτιανός (skew-Hermitian) αν AH = −A.
Ορισμός 1.17 (Θετικά ορισμένοι πίνακες). Ένας ερμιτιανός πίνακας A ∈ Cn×n λέγεται θετικά ορισμένος
αν xH Ax > 0 για κάθε x ∈ Cn με x 6= 0. Ένας συμμετρικός πίνακας A ∈ Rn×n λέγεται θετικά ορισμένος
αν xT Ax > 0 για κάθε x ∈ Rn με x 6= 0.
Ορισμός 1.18 (Γινόμενο πινάκων). Αν A ∈ Cm×n και B ∈ Cn×p τότε το γινόμενο AB ∈ Cm×p ορίζεται
από τη σχέση
X n
(AB)ij = aik bkj , 1 ≤ i ≤ m, 1 ≤ j ≤ p.
k=1
To εξωτερικό γινόμενο των x ∈ R και y ∈ Rn είναι ο m × n πίνακας
m
x1 y1 · · · x1 yn
.. .
xy T = ... .
xm y1 · · · xm yn
Ορισμός 1.19 (Αντίστροφος πίνακας). Έστω A ∈ Cn×n . Θα λέμε ότι ο πίνακας A είναι αντιστρέψιμος αν
υπάρχει πίνακας B ∈ Cn×n τέτοιος ώστε² AB = I = BA, ο οποίος καλείται αντίστροφος του A. Αν ο A
είναι αντιστρέψιμος, ο αντίστροφός του συμβολίζεται με A−1 ∈ Cn×n .
Εύκολα βλέπει κανείς ότι ο αντίστροφος είναι μοναδικός. Πράγματι, αν B, C ∈ Cn×n ικανοποιούν AB =
BA = I και AC = CA = I τότε
B = BI = B(AC) = (BA)C = IC = C.
Από τον ορισμό του αντίστροφου πίνακα προκύπτει εύκολα το γεγονός ότι (AB)−1 = B −1 A−1 , καθώς και
οι σχέσεις
A−T ≡ (AT )−1 = (A−1 )T , A−H ≡ (AH )−1 = (A−1 )H .
²Στην πραγματικότητα, αρκεί να υποθέσουμε την υπάρξη ενός πίνακα B ∈ Cn×n με AB = I.
10 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΓΡΑΜΜΙΚΗΣ ΑΛΓΕΒΡΑΣ
Ορισμός 1.20 (Κανονικοί, Ορθογώνιοι και Μοναδιαίοι πίνακες). Ο πίνακας A ∈ Cn×n λέγεται κανονικός
αν AAH = AH A. Ο πίνακας A ∈ Rn×n λέγεται ορθογώνιος αν AAT = AT A = I. Ο πίνακας A ∈ Cn×n
λέγεται μοναδιαίος (unitary) αν AAH = AH A = I.
Παράδειγμα 1.1. Για παράδειγμα, αν c, s ∈ C είναι τέτοιοι ώστε |c|2 + |s|2 = 1, τότε οι πίνακες
c s c s
, , (1.11)
−s̄ c̄ s̄ −c̄
είναι μοναδιαίοι. Ο πρώτος πίνακας παραπάνω ονομάζεται μετασχηματισμός ή στροφή Givens. Αν c, s είναι
πραγματικοί αριθμοί τότε ο μετασχηματισμός Givens είναι ορθογώνιος πίνακας.
Ορισμός 1.21 (Προβολή). Ένας τετραγωνικός πίνακας P ∈ Cn×n , ο οποίος έχει την ιδιότητα P 2 = P θα
καλείται προβολή.
1. v ∈ R(P ), τότε P v = v.
2. v 6∈ R(P ), τότε P v 6= v.
3. P v − v ∈ N (P ).
4. I − P είναι προβολή.
P (P v − v) = P 2 v − P v = P v − P v = 0, ∀v ∈ Cn .
Ακόμα επειδή
(I − P )2 = (I − P )(I − P ) = I − 2P + P 2 = I − 2P + P = I − P,
ο I − P είναι προβολή.
Ορισμός 1.22. Αν P είναι προβολή τότε η I − P καλείται συμπληρωματική προβολή της προβολής P .
2. R(P ) ∩ N (P ) = {0}.
Ορισμός 1.23. Μια προβολή P καλείται ορθογώνια αν οι χώροι R(P ), N (P ) είναι ορθογώνιοι μεταξύ τους,
R(P )⊥N (P ).
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 11
1 0
Παράδειγμα 1.2. Ο πίνακας P = είναι ορθογώνια προβολή. Μπορούμε να δούμε ότι P 2 = P ,
0 0
N (P ) = span{(0, 1)T }, R(P ) = span{(1, 0)T } και R(P )⊥N (P ).
(P x)H (I − P )y = xH P H (I − P )y = xH (P − P 2 )y = xH 0 = 0.
Παράδειγμα 1.3. Έστω q ∈ Cn με kqk2 = 1. Ο πίνακας P = qq H είναι μια ορθογώνια προβολή, διότι
P H = (qq H )H = qq H = P . Επίσης έχουμε ότι dim(N (P )) = n − 1 και R(P ) = 1. Η συμπληρωμα-
τική προβολή του P είναι I − P = I − qq H .
1.4 Ιδιοτιμές-Ιδιοδιανύσματα
Ορισμός 1.24. Έστω A ∈ Cn×n . Λέμε ότι λ ∈ C είναι ιδιοτιμή του A αν υπάρχει μη μηδενικό διάνυσμα
x ∈ Cn τέτοιο ώστε
Ax = λx. (1.12)
Το διάνυσμα x ονομάζεται ιδιοδιάνυσμα που αντιστοιχεί στην ιδιοτιμή λ. Το σύνολο των ιδιοτιμών ενός
πίνακα ονομάζεται φάσμα του A και συμβολίζεται με σ(A). H μέγιστη κατ’ απόλυτο τιμή του φάσματος σ(A)
ονομάζεται φασματική ακτίνα και συμβολίζεται ρ(A),
Απόδειξη. Για την απόδειξη των ιδιοτήτων του φάσματος παραπέμπουμε στο βιβλίο [2].
Θεώρημα 1.4 (Ανάλυση Schur). Για κάθε πίνακα A ∈ Cn×n υπάρχει ένας μοναδιαίος πίνακας U ∈ Cn×n
τέτοιος ώστε o U −1 AU = U H AU να είναι άνω τριγωνικός.
Απόδειξη. Για n = 1 αρκεί να πάρουμε U = [1]. Υποθέτουμε ότι το θεώρημα ισχύει για πίνακες τάξης
n ≤ k −1. Έστω A ∈ Ck×k και λ1 ιδιοτιμή του A με αντίστοιχο ιδιοδιάνυσμα u(1) με ku(1) k2 = 1, δηλαδή
Au(1) = λ1 u(1) . Συμπληρώνουμε το σύνολο {u(1) } σε μια ορθοκανονική βάση {u(1) , . . . , u(k) } του Cn
και ορίζουμε τον πίνακα P1 = [u(1) , . . . , u(k) ]. Προφανώς, ισχύει P1H P1 = I. Έστω τώρα B1 = P1H AP1 .
Έχουμε
B1 = P1H AP1 = P1H [Au(1) , Au(2) , . . . , Au(k) ] = P1H [λ1 u(1) , Au(2) , . . . , Au(k) ]
= [λ1 e(1) , P1H Au(2) , . . . , P1H Au(k) ],
δηλαδή,
λ1 α 2 · · · α k
0
B1 = .. ,
. A2
0
για κάποια α2 , . . . , αk ∈ C και πίνακα A2 τάξης (k − 1) × (k − 1). Από την επαγωγική υπόθεση υπάρχει
μοναδιαίος πίνακας P̂2 τάξης (k − 1) × (k − 1) τέτοιος ώστε P̂2H A2 P̂2 = T̂ , όπου T̂ άνω τριγωνικός.
Θέτουμε τώρα
1 0 ··· 0
0
P2 = .. .
. P̂2
0
Εύκολα διαπιστώνει κανείς ότι ο P2 είναι μοναδιαίος και
λ1 γ 2 ··· γk λ1 γ 2 · · · γk
0 0
P̂2H B1 P2 = .. = .. = T,
. H
P̂2 A2 P̂2 . T̂2
0 0
για κάποια γ2 , . . . , γk ∈ C και T άνω τριγωνικό πίνακα. Τέλος,
T = P2H B1 P2 = P2H P1 AP1 P2 = (P1 P2 )H A(P1 P2 ) = U H AU = U −1 AU,
με U = P1 P2 μοναδιαίο πίνακα. Αυτό ολοκληρώνει την απόδειξη.
Ορισμός 1.25. Οι πίνακες A, B ∈ Cn×n λέγονται όμοιοι αν υπάρχει αντιστρέψιμος πίνακας S τέτοιος ώστε
A = S −1 BS. (1.15)
Αν ένας πίνακας είναι όμοιος με έναν διαγώνιο πίνακα, λέμε ότι είναι διαγωνοποιήσιμος.
Είναι εύκολο να δειχτεί ότι αν A, B ∈ Cn×n είναι όμοιοι πίνακες, τότε σ(A) = σ(B). Πράγματι, αν για
τους πίνακες A, B ∈ Cn υπάρχει αντιστρέψιμος πίνακας S τέτοιος ώστε A = S −1 BS, τότε
det(A − λI) = det(A − λSS −1 ) = det(S(S −1 AS − λI)S) = det(S(B − λI)S −1 )
= det(S) det(B − λI) det(S −1 ) = det(B − λI),
δηλαδή οι πίνακες A και B έχουν το ίδιο χαρακτηριστικό πολυώνυμο και συνεπώς σ(A) = σ(B).
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 13
S −1 AS = J = diag(J1 , . . . , Jq ), (1.16)
όπου
λi 1 0 . . . 0 0
0 λi 1 ... 0 0
X
q
.. . .. .. .. .. ∈ Cni ×ni ,
Ji = . .
. . . . . i = 1, . . . , q, ni = n, (1.17)
0 0 0 ... λi 1 i=1
0 0 0 ... 0 λi
Συνεχίζοντας με τον ίδιο τρόπο συμπεραίνουμε ότι όλα τα στοιχεία του T στο αυστηρά άνω τρίγωνο είναι ίσα
με το μηδέν και επομένως ο T είναι διαγώνιος πίνακας τέτοιος ώστε U H AU = T με U μοναδιαίο. Συνεπώς,
σ(A) = σ(T ), άρα T = diag(λ1 , . . . , λn ) με λ1 , . . . , λn τις ιδιοτιμές του A.
Αντίστροφα, αν A = U T U H , όπου U μοναδιαίος και T = diag(λ1 , . . . , λn ), με λ1 , . . . , λn τις ιδιοτι-
μές του A, τότε
AH A = U T H T U = U diag(|λ1 |2 , . . . , |λn |2 )U H ,
AAH = U T T H U H = U diag(|λ1 |2 , . . . , |λn |2 )U H ,
Θεώρημα 1.7. Έστω A ∈ Cn×n ερμιτιανός πίνακας. Τότε ο A έχει n πραγματικές ιδιοτιμές λ1 , . . . , λn και
n ιδιοδιανύσματα u(1) , . . . , u(n) τα οποία αποτελούν ορθοκανονική βάση του Cn . Επιπλέον, υπάρχει ένας μονα-
διαίος πίνακας U τέτοιος ώστε
U H AU = D = diag(λ1 , . . . , λn ). (1.19)
Απόδειξη. Από το θεώρημα της ανάλυσης Schur υπάρχει μοναδιαίος πίνακας U τέτοιος ώστε U H AU = T με
T άνω τριγωνικό πίνακα. Η σχέση AH = A συνεπάγεται τώρα ότι T H = T . Επειδή ο T είναι άνω τριγωνικός
θα πρέπει αναγκαστικά ο T να είναι διαγώνιος πίνακας και τα διαγώνια στοιχεία του να είναι πραγματικοί
αριθμοί. Γράφουμε T = diag(λ1 , . . . , λn ) με λi ∈ R, i = 1, . . . , n και U = [u(1) , . . . , u(n) ]. Από τη
σχέση AU = U T έχουμε
λ1
...
AU = [Au(1) , . . . , Au(n) ] = U T = [u(1) , . . . , u(n) ] (1) (n)
= [λ1 u , . . . , λn u ],
λn
δηλαδή Au(j) = λj u(j) , j = 1, . . . , n. Οι στήλες του U είναι ορθοκανονικές και αποτελούν μια ορθοκα-
νονική βάση του Cn .
(Ax, x)
RA (x) = , (1.20)
(x, x)
Παρατήρηση 1.5. Προφανώς αν A είναι ένας ερμιτιανός πίνακας, τo πηλίκο Rayleigh του A είναι πραγμα-
τικός αριθμός. Πράγματι, έχουμε ότι για x ∈ Cn , (Ax, x) = (x, AH x) = (x, Ax) = (Ax, x), οπότε
(Ax, x) ∈ R.
Θεώρημα 1.8. Έστω A ∈ Cn×n ερμιτιανός. Αν συμβολίσουμε με λ1 τη μικρότερη ιδιοτιμή του, τότε
Απόδειξη. Αφού ο A είναι ερμιτιανός, τότε σύμφωνα με το Θεώρημα 1.7 έχει n πραγματικές ιδιοτιμές και
μια ορθοκανονική βάση ιδιοδιανυσμάτων {u(1) , . . . , u(n) }. Αν θέσουμε τις ιδιοτιμές του σε αύξουσα σειρά
λ1 ≤ λ2 ≤ · · · ≤ λn και θεωρήσουμε το διάνυσμα x ∈ Cn με συνιστώσες (x1 , . . . , xn ) ως προς την
ορθοκανονική βάση {u(1) , . . . , u(n) }, τότε
X
n X
n
(Ax, x) = λi |xi |2 ≥ λ1 |xi |2 = λ1 (x, x).
i=1 i=1
Προφανώς
λ1 ≤ min RA (x) και λ1 ≤ min (Ax, x).
x∈Cn ,x̸=0 x∈Cn ,∥x∥=1
Επίσης έχουμε ότι (Au(1) , u(1) ) = λ1 (u(1) , u(1) ), οπότε παίρνουμε το ζητούμενο.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 15
Μπορούμε να επεκτείνουμε την έννοια της νόρμας διανυσμάτων στους πίνακες χρησιμοποιώντας το γεγονός
ότι ο χώρος Cm×n είναι ισομορφικός με τον χώρο Cmn . Αν περιοριστούμε στους τετραγωνικούς πίνακες,
μπορούμε να ορίσουμε μια απεικόνιση η οποία καλείται νόρμα πίνακα.
Ορισμός 1.27. Η απεικόνιση k · k : Cn×n → R θα λέγεται νόρμα πίνακα αν ικανοποιεί τις τρεις ιδιότητες
που θεωρήσαμε για μια νόρμα σε έναν διανυσματικό χώρο και επιπλέον για κάθε A, B ∈ Cn×n
Παράδειγμα 1.4. Γενικεύοντας τη 2-νόρμα στους πίνακες βλέπουμε αμέσως ότι η απεικόνιση
!1/2
n X
X n
kAkF = |aij |2 , A ∈ Cn×n ,
i=1 j=1
ορίζει μια νόρμα πίνακα στον χώρο Cn×n . Η νόρμα αυτή ονομάζεται νόρμα Frobenius. Οι τρεις ιδιότητες μιας
νόρμας ενός διανυσματικού αποδεικνύονται εύκολα. Η ιδιότητα (1.22) του ορισμού της νόρμας πίνακα προ-
κύπτει εφαρμόζοντας την ανισότητα Cauchy-Schwarz.
Μια κατηγορία νορμών πίνακα οι οποίες χρησιμοποιούνται πολύ συχνά είναι οι νόρμες που παράγονται από
μια νόρμα του Cn ή όπως αλλιώς αποκαλούνται φυσικές νόρμες.
Ορισμός 1.28. Έστω k · k μια νόρμα στον Cn , τότε η παραγόμενη νόρμα πίνακα από την k · k ή φυσική νόρμα
ορίζεται ως
kAxk
kAk = sup . (1.23)
x∈Cn kxk
x̸=0
Είναι απλό να δούμε ότι μια φυσική νόρμα είναι μια νόρμα πίνακα, δηλαδή ικανοποιεί τις ιδιότητες του
Ορισμού 1.27. Επίσης ισχύει η σημαντική ιδιότητα
Η απόδειξη του παρακάτω λήμματος προκύπτει εύκολα από τον ορισμό της φυσικής νόρμας και το γεγονός
ότι το σύνολο {x ∈ Cn : kxk ≤ 1} είναι κλειστό και φραγμένο.
Λήμμα 1.5. Έστω k · k μια νόρμα στον Cn και η παραγόμενη από αυτή νόρμα πίνακα k · k. Για κάθε πίνακα A
kAx⋆ k
Επίσης για κάθε A ∈ Cn×n υπάρχει x⋆ τέτοιο kAk = .
kx⋆ k
Παρατήρηση 1.6. Μπορούμε εύκολα να διαπιστώσουμε ότι δεν έχουν όλες οι νόρμες στον Cn×n την ιδιότητα
(1.22). Αν, για παράδειγμα, θεωρήσουμε τη νόρμα kAkmax = maxi,j |aij | και τους πίνακες
1 1
A=B= ,
1 1
Χρησιμοποιώντας τον Ορισμό 1.28 είναι συνήθως δύσκολο να υπολογίσουμε τη νόρμα ενός πίνακα. Όμως
για τις συνηθισμένες φυσικές νόρμες k · k1 , k · k∞ και k · k2 μπορούμε να τις υπολογίσουμε εύκολα, όπως
δείχνουν τα ακόλουθα λήμματα.
Λήμμα 1.6. Έστω A ∈ Rm×n . Τότε
X
m
kAk1 = max |aij |.
1≤j≤n
i=1
Επομένως
X
m
kAk1 ≥ max kAe(j) k = max |aij |.
1≤j≤n 1≤j≤n
i=1
Έστω τώρα y ∈ R με kyk1 = 1 και τέτοιο ώστε kAk1 = kAyk1 . Χρησιμοποιώντας την τριγωνική
n
ανισότητα έχουμε
δηλαδή
kAk1 ≤ (|y1 | + · · · + |yn |) max kAe(j) k1 = max kAe(j) k1 ,
1≤j≤n 1≤j≤n
Πράγματι,
X
m
(i)
X
m
(i)
T (i)
(A e )j = (A T
)jk ek = akj ek = aij , 1 ≤ j ≤ n,
k=1 k=1
άρα
X
n
max kAT e(i) k1 = max |aij |.
1≤i≤m 1≤i≤m
j=1
T T
Έστω τώρα r(i) = e(i) A οι γραμμές του A και δείκτης k ∈ {1, . . . , m} τέτοιος ώστε kr(k) k1 =
T
max1≤i≤m kr(i) k1 . Αν y ∈ Rn είναι τέτοιο ώστε kyk∞ = 1, τότε kAk∞ ≥ kAyk∞ ≥ |r(k) y|. Αν
(k) (k)
r(k) = [r1 , . . . , rn ]T , θέτουμε
(
(k)
0 rj = 0,
yj = (k) (k) 1 ≤ j ≤ n.
rj /|rj | διαφορετικά,
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 17
T Pn (k) Pn (k)
Από κατασκευή, kyk∞ = 1 και |r(k) y| = j=1 rj yj = j=1 |rj | = krk k1 . Επομένως
X
n
(k) T
kAk∞ ≥ |r y| = kr (k)
k1 = max kr k1 = max
(i)
|aij |.
1≤i≤m 1≤i≤m
j=1
Αντίστροφα, έστω y ∈ Rn με kAk∞ = kAyk∞ και kyk∞ = 1. Έχουμε, χρησιμοποιώντας την ανισότητα
του Hölder, ότι
T
kAk∞ = kAyk∞ = max |r(i) y| ≤ max kr(i) k1 kyk∞ = max kr(i) k1 ,
1≤i≤m 1≤i≤m 1≤i≤m
Απόδειξη. Από τον ορισμό της νόρμας k · k2 έχουμε ότι kAk2 = kAxk2 για κάποιο x ∈ Cn με kxk2 = 1.
Χρησιμοποιώντας τον ορισμό της νόρμας διανυσμάτων k · k2 και την ανισότητα Cauchy-Schwarz έχουμε
Το γεγονός ότι kxk2 = 1 και οι σχέσεις (1.22) και (1.24) δίνουν τώρα
δηλαδή kAk2 ≤ kAH k2 . Εφαρμόζοντας το ίδιο επιχείρημα στον πίνακα AH έχουμε τις σχέσεις
δηλαδή kAH k2 ≤ kAk2 . Η σχέση kAH k2 = kAk2 και η (1.26) δίνουν τότε kAH Ak2 = kAk2 .
Τώρα, ο πίνακας AH A είναι ερμιτιανός και θετικά ημι-ορισμένος. Σύμφωνα με το Θεώρημα 1.7 οι ιδιοτιμές
του είναι πραγματικές και τα αντίστοιχα ιδιοδιανύσματα u(i) , iP= 1, . . . , n, αποτελούν ορθοκανονική βάση
του C . Επομένως, για x ∈ C μπορούμε να γράψουμε x = ni=1 ci u(i) , με ci ∈ C, i = 1, . . . , n, οπότε
n n
δηλαδή
kAk22 ≤ ρ(AH A). (1.27)
Είναι απλό να δούμε ότι αν λk = ρ(AH A), τότε
kAu(k) k22 = (AH Au(k) , u(k) ) = λk ku(k) k22 = ρ(AH A)ku(k) k22 , (1.28)
οπότε
kAk22 ≥ ρ(AH A), (1.29)
το οποίο ολοκληρώνει την απόδειξη.
Λήμμα 1.9. Έστω A ∈ Cm×n και Q ∈ Cm×m μοναδιαίος πίνακας. Τότε
Απόδειξη. Από το προηγούμενο λήμμα και το γεγονός ότι ο Q είναι μοναδιαίος έχουμε
οπότε kQAk2 = kAk2 . Ακόμα kAk22 = ρ(AH A) = ρ(A2 ) = ρ(A)2 , αφού οι ιδιοτιμές του A2 είναι τα
τετράγωνα των ιδιοτιμών του A.
Η φασματική ακτίνα ενός πίνακα δεν ορίζει μια νόρμα πινάκων. Όμως, όπως δείχνουμε στα δύο επόμενα
λήμματα, μπορεί να προσεγγιστεί από μια φυσική νόρμα πινάκων όσο καλά επιθυμούμε.
Λήμμα 1.10. Έστω k · k μια φυσική νόρμα και A ∈ Cn×n . Τότε ισχύει ρ(A) ≤ kAk.
Απόδειξη. Έστω λ ∈ C και x το αντίστοιχο ιδιοδιάνυσμα. Τότε από τη σχέση Ax = λx και την (1.24)
προκύπτει εύκολα
|λ|kxk = kλxk = kAxk ≤ kAkkxk. (1.31)
Επομένως για κάθε λ ∈ σ(A) ισχύει ότι |λ| ≤ kAk, οπότε ισχύει και η ζητούμενη ανισότητα ρ(A) ≤
kAk.
Λήμμα 1.11. Έστω A ∈ Cn×n και ϵ > 0. Τότε υπάρχει μια φυσική νόρμα k · k τέτοια ώστε kAk ≤ ρ(A) + ϵ.
Απόδειξη. Θεωρούμε τον πίνακα J που αποτελεί την κανονική μορφή Jordan του πίνακα A και δίνεται από
το Θεώρημα 1.5. Ορίζουμε τον πίνακα Je
Μπορούμε να δείξουμε ότι ο Je έχει μια ανάλογη μορφή με τον J, όπου οι μονάδες στους πίνακες Ji έχουν
αντικατασταθεί από ϵ. Δηλαδή
λi ϵ 0 . . . 0 0
0 λi ϵ . . . 0 0
0 0 λi . . . 0 0
n ×n
Ji = .. .. .. . . .. .. ∈ C i i , i = 1, . . . , q.
. . . . . .
0 0 0 . . . λi ϵ
0 0 0 . . . 0 λi
Θεωρούμε τώρα την απεικόνιση k · k := kT −1 · k∞ η οποία μπορούμε εύκολα να δείξουμε οτι ορίζει μια
νόρμα στον Cn και την αντίστοιχη παραγόμενη από αυτήν φυσική νόρμα πινάκων στον Cn×n , k · k. Για τη
φυσική αυτή νόρμα πινάκων έχουμε
Λήμμα 1.12. Έστω k·k μια νόρμα στον Rn και η παραγόμενη από αυτή φυσική νόρμα πινάκων. Έστω A ∈ Rn×n
με kAk < 1. Τότε ο I + A είναι αντιστρέψιμος και
1 1
≤ k(I + A)−1 k ≤ . (1.35)
1 + kAk 1 − kAk
ενώ από τη σχέση I = (I + A)(I + A)−1 = (I + A)−1 + A(I + A)−1 με χρήση της τριγωνικής
ανισότητας προς κάτω παίρνουμε
Λήμμα 1.13. Έστω A ∈ Rn×n αντιστρέψιμος πίνακας και E ∈ Rn×n τέτοιος ώστε kA−1 Ek < 1. Τότε ο
A + E είναι αντιστρέψιμος και
−1 kA−1 k
k(A + E) k ≤ .
1 − kA−1 Ek
Απόδειξη. Επειδή ο A είναι αντιστρέψιμος, μπορούμε να γράψουμε A + E = A(I + A−1 E). Η συνέχεια
της απόδειξης είναι εντελώς ανάλογη με αυτήν του Λήμματος 1.12.
Τα εργαλεία που αναπτύξαμε σε αυτήν την παράγραφο μπορεί να χρησιμοποιηθούν στην απόδειξη του
σημαντικού αποτελέσματος της ανάλυσης ιδιαζουσών τιμών (singular value decomposition, SVD).
Ορισμός 1.29. Γνωρίζουμε ότι για κάθε πίνακα A ∈ Cm×n o AH A είναι ερμιτιανός και έχει πραγματικές και
μη αρνητικές ιδιοτιμές. Έστω A ∈ Cm×n . Οι θετικές τετραγωνικές ρίζες των ιδιοτιμών του AH A καλούνται
ιδιάζουσες τιμές του A.
Θεώρημα 1.9 (Ανάλυση SVD). ΄Εστω A ∈ Rm×n . Τότε υπάρχουν ορθογώνιοι πίνακες
U = u(1) , . . . , u(m) ∈ Rm×m ,
και
V = v (1) , . . . , v (n) ∈ Rn×n ,
τέτοιοι ώστε
U T AV = diag(σ1 , . . . , σp ), p = min{m, n},
όπου
σ1 ≥ σ2 ≥ · · · ≥ σp ≥ 0,
οι ιδιάζουσες τιμές του πίνακα A.
20 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΓΡΑΜΜΙΚΗΣ ΑΛΓΕΒΡΑΣ
Απόδειξη. Έστω σ = kAk2 και x ∈ Rn με kxk2 = 1 και τέτοιο ώστε kAk2 = kAxk2 . Αν y = Ax
∥A∥2
τότε,
προφανώς y ∈ Rm , kyk2 = 1, και Ax = kAk2 y = σy. Έστω τώρα
Λήμμα 1.14. Έστω ότι ο A ∈ Rm×n έχει ιδιάζουσες τιμές σ1 ≥ · · · ≥ σp , p = min{m, n}. Τότε
kAxk2 kAxk2
kAk2 = maxn = σ1 , min n = σp .
0̸=x∈R kxk2 0̸=x∈R kxk2
Απόδειξη. Από την Άσκηση 1.7.28 γνωρίζουμε ότι kAk2 = kΣk2 . Αφού ο πίνακας Σ είναι διαγώνιος, συ-
μπεραίνουμε ότι kΣk2 = maxj |σj | = σ1 , το οποίο αποδεικνύει τον πρώτο ισχυρισμό του λήμματος.
Έστω τώρα m ≥ n. Τότε p = n και ο A έχει ανάλυση SVD της μορφής A = U [ Σ0 ] V T . Αν z ∈ Rn
είναι τέτοιο ώστε kzk2 = 1 και kAzk2 = min∥x∥2 =1 kAxk2 τότε με y = V T z έχουμε
!1/2
X
n
min kAxk2 = kAzk2 = kΣV T zk2 = kΣyk2 = |σi |2 |yi |2 ,
∥x∥2 =1
i=1
με
!1/2 !1/2
X
n X
n
|σi |2 |yi |2 ≥ σn |yi |2 = σn kyk2 = σn ,
i=1 i=1
• Αν ο A ∈ Rm×n έχει rank(A) = m τότε m ≤ min{m, n} ≤ n, άρα έχει ανάλυση SVD της
μορφής A = U (Σ, 0) V T με Σ ∈ Rm×m αντιστρέψιμο. Αυτό σημαίνει ότι όλες οι ιδιάζουσες τιμές
είναι μη μηδενικές.
rank(A) = rank(AT ),
rank(A) = rank(AT A) = rank(AAT ),
rank(A) = n αν και μόνο αν ο AT A είναι αντιστρέψιμος,
rank(A) = m αν και μόνο αν ο AAT είναι αντιστρέψιμος.
1.7 Ασκήσεις
1.7.1 Έστω A ∈ Cm×n και e(k) ∈ Cn το k-στό κανονικό διάνυσμα. Δείξτε ότι Ae(k) είναι η k-στή στήλη
του A.
1.7.2 Έστω A ∈ Cm×n , B ∈ Cn×p, B = b(1) , . . . , b(p) , με b(k) ∈ Cn τις στήλες του πίνακα B. Δείξτε
ότι AB = Ab(1) , . . . , Ab(p) .
T
1.7.3 Έστω A ∈ Cm×n , B ∈ Cn×p και a(k) ∈ C1×n οι γραμμές του A. Δείξτε ότι
T
a(1) B
AB = ...
T
a(m) B
T
1.7.4 Έστω c(i) οι στήλες του A ∈ Cn×n και r(i) οι γραμμές του B ∈ Cn×n . Δείξτε ότι
T T
AB = c1 r(1) + · · · + cn r(n) .
1.7.8 Δείξτε ότι αν A ∈ Cn×n είναι ερμιτιανός πίνακας, τότε A = P + iQ, όπου P T = P ∈ Rn×n και
−QT = Q ∈ Rn×n .
1.7.10 Αποδείξτε ότι αν A, B ∈ Cn×n είναι αντιστρέψιμοι πίνακες τότε B −1 = A−1 − B −1 (B − A)A−1 .
A−1 uv T A−1
(A + uv T )−1 = A−1 − .
1 + v T A−1 u
1.7.14 (Μετασχηματισμός Cayley.) Δείξτε ότι αν ο A ∈ Cn×n είναι ένας αντισυμμετρικός πίνακας, τότε ο
I − A είναι αντιστρέψιμος και ο (I − A)−1 (I + A) είναι μοναδιαίος.
1.7.18 Αποδείξτε τις ισοδυναμίες νορμών στις σχέσεις (1.5)–(1.7). Δώστε παραδείγματα διανυσμάτων για
τα οποία οι σχέσεις αυτές ισχύουν ως ισότητες.
p
1.7.19 Αποδείξτε ότι kxk2 ≤ kxk1 kxk∞ .
1.7.20 Έστω A ∈ Cn×n αντιστρέψιμος πίνακας. Δείξτε ότι το συναρτησιακό kxkA = kAxkp , p ≥ 1 είναι
νόρμα διανυσμάτων.
1.7.21 Αποδείξτε ότι κάθε νόρμα στον Cn είναι ομοιόμορφα συνεχής χρησιμοποιώντας την ανισότητα
1.7.24 Έστω A ∈ Cm×n και B υποπίνακας του A. Δείξτε ότι kBkp ≤ kAkp .
1.7.26 Έστω kAk ∈ Cn×n ένας αντιστρέψιμος πίνακας. Αποδείξτε ότι kAkp kA−1 kp ≥ 1.
1.7.28 Έστω U ∈ Cm×m και V ∈ Cn×n μοναδιαίοι πίνακες. Δείξτε ότι kU k2 = kV k2 = 1 και
kU AV k2 = kAk2 για οποιοδήποτε A ∈ Cm×n .
1.7.31 Έστω A ∈ Rm×n . Δείξτε ότι οι ιδιάζουσες τιμές του AT A είναι τα τετράγωνα των ιδιαζουσών τιμών
του πίνακα A.
1.7.32 ΄Εστω A ∈ Rn×n ένας αντιστρέψιμος πίνακας με ιδιάζουσες τιμές σ1 ≥ . . . ≥ σn > 0. Δείξτε ότι
kA−1 k2 = 1/σn .
1 1
1.7.33 Βρείτε την ανάλυση SVD του πίνακα A = . (Υπόδειξη: Αν A = U ΣV T είναι η ανάλυση
2 2
SVD του A τότε AT A = V ΣT ΣV . Ποια είναι η σχέση μεταξύ των ιδιοτιμών του AT A και των
ιδιαζουσών τιμών του A;)
1.7.34 Έστω P ∈ Cn×n , P 6= 0, προβολή. Δείξτε ότι kP k2 ≥ 1. H P είναι ορθογώνια αν και μόνο αν
kP k2 = 1.
Βιβλιογραφία
[1] S. Boyd και L. Vandenberghe. Introduction to Applied Linear Algebra. English. Cambridge University
Press, 2018.
[2] R. A. Horn και C. R. Johnson. Matix Analysis. English. Cambridge, United Kingdom: Cambridge
University Press, 1985.
[3] P. Petersen. Linear Algebra. English. New York: Springer, 2012.
[4] G. Strang. Introduction to Linear Algebra. English. Wellesley, MA: Wellesley-Cambridge Press, 2016,
σσ. x + 574. isbn: 978-0-9802327-7-6.
[5] Γ. Δ. Ακρίβης και B. A. Δουγαλής. Εισαγωγή στην Αριθμητική Ανάλυση. Πανεπιστημιακές Εκδόσεις
Κρήτης, 2017.
[6] Δ. Βάρσος κ.ά. Μια Εισαγωγή στη Γραμμική Άλγεβρα. Greek. Εκδόσεις “Σοφία”, 2012.
ΚΕΦΑΛΑΙΟ 2
Περίληψη
Θεωρούμε το γραμμικό σύστημα με πίνακα A ∈ Rn×n και δεξιό μέλος b ∈ Rn και ζητούμε x ∈ Rn τέτοιο
ώστε
Ax = b.
Θα ασχοληθούμε με την αριθμητική επίλυση ενός γραμμικού συστήματος της παραπάνω μορφής χρησιμο-
ποιώντας άμεσες μεθόδους, οι οποίες υπολογίζουν την ακριβή λύση σε έναν προκαθορισμένο αριθμό βημάτων,
τον οποίο γνωρίζουμε εκ των προτέρων, όπως παραδείγματος χάριν είναι η μέθοδος της απαλοιφής Gauss. Κύ-
ριο χαρακτηριστικό αυτών των μεθόδων είναι η παραγοντοποίηση του πίνακα A σε γινόμενο πινάκων. Η
επίλυση ενός γραμμικού συστήματος με κάθε πίνακα αυτής της παραγοντοποίησης του A, είναι απλούστερο
να επιλυθεί από ότι το αρχικό γραμμικό σύστημα. Έτσι αν A = BC, τότε η λύση του Ax = b υπολογίζεται
λύνοντας τα γραμμικά συστήματα By = b και Cx = y.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Γραμμικής Άλγεβρας. Επίλυση τετραγωνικών γραμμικών συστη-
μάτων με τη μέθοδο απαλοιφής Gauss χωρίς οδήγηση, με μερική ή ολική οδήγηση. Επίλυση τετραγωνικών
γραμμικών συστημάτων με τη μέθοδο Cholesky. Nόρμες πινάκων και διανυσμάτων.
2.1 Γενικά
Θεωρούμε το γραμμικό σύστημα με δοσμένο πίνακα A ∈ Rn×n και δεξιό μέλος b ∈ Rn και ζητούμε x ∈ Rn
τέτοιο ώστε
Ax = b. (2.1)
Άμεσες μέθοδοι για την επίλυση του γραμμικού συστήματος (2.1) καλούνται εκείνες οι μέθοδοι κατά τις
οποίες, αν χρησιμοποιήσουμε «ακριβή αριθμητική», χωρίς σφάλματα αναπαράστασης των αριθμών στον
υπολογιστή, υπολογίζουν την ακριβή λύση σε ένα προκαθορισμένο αριθμό βημάτων τον οποίο γνωρίζουμε
εκ των προτέρων όπως παραδείγματος χάριν η μέθοδος της απαλοιφής Gauss.
Σε επόμενο κεφάλαιο θα εξετάσουμε επαναληπτικές μεθόδους για τη επίλυση του γραμμικού συστήματος
(2.1) για τις οποίες δεν γνωρίζουμε από την αρχή τον αριθμό των πράξεων που πρέπει να πραγματοποιή-
σουμε, και η ολοκλήρωση του αλγορίθμου πραγματοποιείται όταν ικανοποιούνται τα κριτήρια τερματισμού
που έχουμε θέσει.
Έστω A ∈ Rn×n με
a11 · · · a1n
a21 . . . a2n
A = .. . ..
. . . .
an1 · · · ann
και τα διανύσματα b, x ∈ Rn με
x1 b1
x2 b2
x= .. , b= .. ,
. .
xn bn
τέτοια ώστε να ισχύει το γραμμικό σύστημα Ax = b. Τα γραμμικά συστήματα που θα ασχοληθούμε σε αυτό
το κεφάλαιο έχουν ακριβώς μια λύση. Είναι γνωστές ικανές και αναγκαίες συνθήκες για να έχει το γραμμικό
σύστημα Ax = b ακριβώς μια λύση, όπως περιγράφονται στο ακόλουθο Θεώρημα 2.1.
Θεώρημα 2.1. Έστω A ∈ Rn×n , b ∈ Rn . Το γραμμικό σύστημα (2.1) έχει μοναδική λύση αν και μόνο αν
ισχύουν οι παρακάτω ισοδύναμες προτάσεις:
1. det(A) 6= 0
4. Ο A είναι αντιστρέψιμος.
Απόδειξη. Την απόδειξη μπορούμε να τη βρούμε σε βιβλία Γραμμικής Άλγεβρας, παραδείγματος χάριν στα
[5], [6], [9].
Γνωστοί τρόποι για να βρούμε τη λύση του γραμμικού συστήματος Ax = b είναι o κανόνας του Crammer,
βλέπε π.χ. [6] και ο υπολογισμός του αντίστροφου του A και ο πολλαπλασιασμός του επί b, έτσι ώστε x =
A−1 b.
Ο κανόνας του Cramer είναι μια διαδικασία για να βρούμε το διάνυσμα της λύσης x ενός γραμμικού συστή-
ματος η οποία βασίζεται στον υπολογισμό οριζουσών. Όμως αυτός ο τρόπος επίλυσης δεν είναι κατάλληλος
για να τον χρησιμοποιήσουμε σε έναν υπολογιστή. Ο υπολογισμός οριζουσών είναι χρονοβόρος γιατί απαι-
τεί μεγάλο πλήθος πράξεων. Παραδείγματος χάριν, για τον υπολογισμό μιας ορίζουσας ενός πίνακα n × n
απαιτούνται περισσότερες από (n + 1)! πράξεις.
Επίσης ο υπολογισμός του αντίστροφου ενός πίνακα A ∈ Rn×n αντιστοιχεί στην επίλυση n γραμμικών
συστημάτων με τον ίδιο πίνακα A, βλ. π.χ. [8]. Για αυτόν τον λόγο ο υπολογισμός της λύσης x μέσω του
πολλαπλασιασμού του A−1 με το διάνυσμα b απαιτεί μεγάλο πλήθος πράξεων και χώρο μνήμης, σε σύγκριση
με τη γνωστή διαδικασία της απαλοιφής Gauss, βλ. π.χ. [8].
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 27
Αν ο πίνακας A έχει μια συγκεκριμένη δομή, μπορούμε να την εκμεταλλευτούμε και να υπολογίσουμε εύ-
κολα τη λύση x ∈ Rn του γραμμικού συστήματος (2.1). Έτσι αν ο A είναι διαγώνιος με μη-μηδενικά διαγώ-
νια στοιχεία, εύκολα μπορούμε να βρούμε το διάνυσμα της λύσης x, το οποίο θα έχει συνιστώσες xi = bi /aii ,
i = 1, . . . , n. Εύκολα μπορούμε να δούμε ότι, αν ο A είναι διαγώνιος, για τον υπολογισμό του x απαιτούνται
n πράξεις (διαιρέσεις).
Μια άλλη περίπτωση που μπορούμε εύκολα να εκμεταλλευτούμε τη μορφή του A είναι αν ο A είναι ορθο-
κανονικός, δηλαδή AAT = AT A = I, οπότε A−1 = AT . Σε αυτήν την περίπτωση η λύση x ∈ Rn του
γραμμικού συστήματος (2.1) προκύπτει, ως x = AT b, το οποίο απαιτεί n2 πράξεις (πολλαπλασιασμοί) για
τον υπολογισμό του διανύσματος AT b.
Αν ο A ∈ Rn×n είναι ένας κάτω τριγωνικός πίνακας, τότε για να λύσουμε το γραμμικό σύστημα (2.1)
Ax = b μπορούμε να εφαρμόζουμε τον ακόλουθο Αλγόριθμο 1, ο οποίος καλείται αλγόριθμος της οπισθο-
δρόμησης, βλ. π.χ. [8]. Για να υπολογίσουμε το διάνυσμα της λύσης x χρειαζόμαστε n2 /2 − n/2 πράξεις.
Στην περίπτωση που ο A ∈ Rn×n είναι άνω τριγωνικός, μπορούμε να εφαρμόσουμε έναν ανάλογο αλγό-
ριθμο με αυτόν της οπισθοδρόμησης. Αν ο A δεν έχει μια συγκεκριμένη δομή που μπορούμε να εκμεταλλευ-
τούμε για να υπολογίσουμε τη λύση του γραμμικού συστήματος (2.1), εφαρμόζουμε τη γνωστή διαδικασία
της απαλοιφής Gauss, βλ. π.χ. [6].
2.2 Ανάλυση LU
Δεν θα παρουσιάσουμε την περιγραφή αλγορίθμου της απαλοιφής Gauss και παραπέμπουμε για αυτό σε
γνωστά συγγράμματα της Γραμμικής Άλγεβρας, όπως π.χ. [6]. Με τη διαδικασία της απαλοιφής Gauss με-
τασχηματίζουμε το γραμμικό σύστημα Ax = b σε ένα άλλο ισοδύναμο γραμμικό σύστημα T x = b̃ του
οποίου ο πίνακας T είναι άνω τριγωνικός, βλ. π.χ. [6], [8]. Στη συνέχεια για να υπολογίσουμε το διάνυσμα x,
εφαρμόζουμε τον αλγόριθμο της οπισθοδρόμησης, βλ. Αλγόριθμο 1. Το συνολικό κόστος σε αριθμό πράξεων
1
(πολλαπλασιασμοί και διαιρέσεις) είναι n3 + O(n2 ), βλ. π.χ. [8].
3
Η διαδικασία της απαλοιφής Gauss μπορεί να ερμηνευθεί και ως παραγοντοποίηση του A σε γινόμενο
πινάκων. Αν ο αλγόριθμος της απαλοιφής Gauss ολοκληρώνεται χωρίς να χρειαστεί να πραγματοποιηθούν
εναλλαγές γραμμών του A, τότε ο A μπορεί να παραγοντοποιηθεί σε γινόμενο δύο πινάκων L και U , A =
LU , όπου ο L είναι κάτω τριγωνικός με μονάδες στη διαγώνιο και ο U είναι άνω τριγωνικός.
Διαφορετικά, αν χρειάζεται να γίνουν εναλλαγές γραμμών για να ολοκληρωθεί ο αλγόριθμος της απαλοι-
φής Gauss, η εναλλαγή των γραμμών αντιστοιχεί με τον πολλαπλασιασμό του πίνακα A με έναν πίνακα μετά-
θεσης P . Οι πίνακες μετάθεσης προκύπτουν με εναλλαγές γραμμών του μοναδιαίου πίνακα I ∈ Rn×n και
ισχύει P T P = I. Αν λοιπόν θεωρήσουμε τον πίνακα μετάθεσης P με τις αντίστοιχες εναλλαγές γραμμών που
χρειάζεται να πραγματοποιήσουμε στον πίνακα A ώστε να ολοκληρωθεί ο αλγόριθμος της απαλοιφής Gauss,
τότε για τον P A ο αλγόριθμος της απαλοιφής Gauss ολοκληρώνεται χωρίς εναλλαγές γραμμών. Επομένως,
υπάρχουν τότε αντίστοιχοι πίνακες L και U , τέτοιοι ώστε P A = LU .
Ας υποθέσουμε για ευκολία ότι δεν χρειάζεται να κάνουμε εναλλαγές γραμμών του πίνακα A και υπάρχουν
L και U όπως τους περιγράψαμε παραπάνω, τέτοιοι ώστε A = LU . Αυτή η παραγοντοποίηση του A σε
28 ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
Μπορούμε εύκολα να υπολογίσουμε τα στοιχεία των πινάκων L = (lij )ni,j=1 και U = (uij )ni,j=1 , χρησι-
μοποιώντας π.χ. τον Αλγόριθμο 2, βλ. και [8].
Αλγόριθμος 2 Αλγόριθμος LU
for i = 1 to n do
for j = 1to i − 1 do
P
lij = aij − j−1 l u
k=1 ik kj /ujj
end for
lii = 1
for j = i to n do
P
uij = aij − i−1
k=1 lik ukj
end for
end for
Παρατήρηση 2.1. Αν γνωρίζουμε την ανάλυση LU ενός πίνακα A, η επίλυση του γραμμικού συστήματος
Ax = b πραγματοποιείται σε δύο βήματα:
1. Λύνουμε πρώτα ένα ενδιάμεσο γραμμικό σύστημα
Ly = b,
από την ακριβή λύση. Αυτό μπορεί να διορθωθεί, σε κάποιες περιπτώσεις, αν πραγματοποιήσουμε κάποιες
εναλλαγές γραμμών ή και στηλών του πίνακα A και έτσι να οδηγηθούμε σε λύσεις που δεν απέχουν πολύ από
την ακριβή λύση. Αυτοί οι αλγόριθμοι περιγράφουν την απαλοιφή Gauss με (μερική ή ολική) οδήγηση. Για
μια διεξοδική παρουσίαση παραπέμπουμε στα [4], [8].
Στην προηγούμενη παράγραφο αναφερθήκαμε στη δυνατότητα να τροποποιήσουμε τον αλγόριθμο της απα-
λοιφής Gauss και χρησιμοποιώντας μερική ή ολική οδήγηση να βελτιώσουμε την ακρίβεια των πράξεων ώστε
να βρούμε καλύτερη προσέγγιση της ακριβούς λύσης. Όμως υπάρχουν και πάλι προβλήματα που οι σχετικά
μικρές μεταβολές του πίνακα A ή και του διανύσματος b σε ένα γραμμικό σύστημα Ax = b, οδηγούν σε
μεγάλα σφάλματα.
Για να εκτιμήσουμε την ευαισθησία της λύσης ενός γραμμικού συστήματος Ax = b, δηλαδή πόσο «μεγάλη»
είναι η μεταβολή της λύσης x, αν τα δεδομένα του γραμμικού συστήματος, ο πίνακας A ή το δεξιό μέλος b με-
ταβληθούν «λίγο», χρειάζεται να ορίσουμε μια ποσότητα που καλείται δείκτης κατάστασης του A.
Ορισμός 2.1. Για δοσμένη νόρμα πινάκων k · k, ο δείκτης κατάστασης κ(A) ενός αντιστρέψιμου πίνακα
A ∈ Rn×n ως προς τη νόρμα k · k καλείται η ποσότητα
κ(A) = kAkkA−1 k
Παρατήρηση 2.3. Εύκολα μπορούμε να δούμε ορισμένες ιδιότητες για τον δείκτη κατάστασης:
1. Αν A ∈ Rn×n τότε κ(A) = κ(A−1 ).
2. κ(A) ≥ 1.
3. κ(λA) = κ(A), ∀λ 6= 0.
4. Αν ο A είναι κανονικός, δηλαδή AAT = AT A, τότε
λmax (A)
κ2 (A) = = ρ(A)ρ(A−1 ),
λmin (A)
όπου κ2 ο δείκτης κατάστασης ως προς τη νόρμα k · k2 .
5. κ(A) ≥ ρ(A)ρ(A−1 ).
Αν υποθέσουμε ότι αντί να λύσουμε το γραμμικό σύστημα Ax = b προσπαθούμε να λύσουμε το γραμμικό
σύστημα με τον ίδιο πίνακα A αλλά έχουμε διαταράξει το αρχικό δεξιό μέλος b ∈ Rn κατά ∆b ∈ Rn . Τότε,
αντί για τη λύση x, θα προκύψει η λύση x̃ του γραμμικού συστήματος
Ax̃ = b + ∆b.
Προφανώς x̃ = x + ∆x, ∆x ∈ Rn . Στο παρακάτω Θεώρημα 2.2 βρίσκουμε ένα άνω φράγμα για
k∆xk
το σχετικό σφάλμα της μεταβολής της λύσης σε σχέση με μεταβολή των δεδομένων του γραμμικού
kxk
συστήματος. Για την απόδειξή του θα χρειαστούμε το ακόλουθο βοηθητικό λήμμα.
Λήμμα 2.1. Έστω B ∈ Rn×n , k · k μια φυσική νόρμα στον Rn×n και c > 0 τέτοιο ώστε
kBxk ≥ ckxk, ∀x ∈ Rn
τότε ο B είναι αντιστρέψιμος και
1
kB −1 k ≤
c
30 ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
Θεώρημα 2.2. Έστω A ∈ Rn×n αντιστρέψιμος πίνακας, b ∈ Rn , b 6= 0 και k · k μια νόρμα στον Rn , τότε
ισχύουν οι ακόλουθες εκτιμήσεις σφαλμάτων:
kδxk kδbk
≤ κ(A) (2.3)
kxk kbk
Απόδειξη. Αφαιρώντας κατά μέλη τις Ax = b και A(x + δx) = b + δb έχουμε Aδx = δb, οπότε δx =
A−1 δb. Συνεπώς
kδxk ≤ kA−1 kkδbk
Στη συνέχεια λόγω της σχέσης kbk = kAxk ≤ kAkkxk λαμβάνουμε τη ζητούμενη πρώτη σχέση (2.3)
kδxk kδbk
≤ κ(A)
kxk kbk
Για να δείξουμε τις επόμενες δύο σχέσεις, παρατηρούμε ότι λόγω της υπόθεσης kA−1 kkδAk < 1 ισχύει
ότι ο A + δA είναι αντιστρέψιμος. Πράγματι, έχουμε ότι για y ∈ Rn , λόγω της κάτω τριγωνικής ανισότητας
και της kA−1 Ayk = kyk ≤ kA−1 kkyk εύκολα προκύπτει ότι
kyk
k(A + δA)yk ≥ kAyk − kδAkkyk ≥ − kδAkkyk
kA−1 k
(2.6)
1
≥ (1 − kA−1 kkδAk)kyk.
kA−1 k
Συνεπώς χρησιμοποιώντας το γεγονός ότι kA−1 kδAk < 1 και το λήμμα 2.1 λαμβάνουμε ότι ο A + δA είναι
αντιστρέψιμος και
kA−1 k
k(A + δA)−1 k ≤ (2.7)
1 − kA−1 kkδAk
Στη συνέχεια από τις Ax = b, (A+δA)(x+δx) = b εύκολα προκύπτει ότι (A+δA)(δx) = −(δA)x.
Οπότε
δx = −(A + δA)−1 (δA)x, (2.8)
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 31
kδxk
≤ k(A + δA)−1 kkδAk
kxk
(2.10)
kA−1 k kAkkA−1 k kδAk
≤ kδAk ≤
1 − kA−1 kkδAk 1 − kA−1 kkδAk kAk
Για να δείξουμε την τελευταία σχέση (2.5) θα ακολουθήσουμε παρόμοια βήματα όπως στην απόδειξη των
δυο προηγούμενων (2.3) και (2.4).
Από τις Ax = b, (A + δA)(x + δx) = b + δb προκύπτει ότι (A + δA)(δx) = δb − (δA)x. Οπότε
δx = (A + δA)−1 (δb − (δA)x)
Χρησιμοποιώντας τώρα την (2.7) εύκολα λαμβάνουμε τη ζητούμενη τελευταία σχέση (2.5).
Ο δείκτης κατάστασης ενός πίνακα A, εκτός από το να προσδιορίζει ένα άνω φράγμα για το σχετικό σφάλμα
της μεταβολής της λύσης του γραμμικού συστήματος Ax = b, αν υπάρχουν μικρές μεταβολές στα στοιχεία
του A και του b, έχει μια γεωμετρική ερμηνεία. Η τιμή κ(A) δίνει μια εκτίμηση «πόσο απέχει» o A από το
σύνολο των μη αντιστρέψιμων πινάκων. Αυτό προκύπτει από το ακόλουθο Θεώρημα 2.3.
Θεώρημα 2.3. Έστω A ∈ Rn×n ένας αντιστρέψιμος πίνακας και k · k μια φυσική νόρμα πινάκων, τότε
1 kA − Bk
= inf , (2.12)
κ(A) B∈Sn kAk
Απόδειξη. Πρώτα θα δείξουμε την ακόλουθη σχέση για κάθε B ∈ Rn×n μη-αντιστρέψιμο πίνακα
1
≤ kA − Bk, (2.13)
kA−1 k
από την οποία εύκολα έπεται η ζητούμενη (2.12). Αν δεν ισχύει η (2.13), τότε θα υπάρχει B ∈ Rn×n μη-
αντιστρέψιμος πίνακας τέτοιος ώστε kA − BkkA−1 k < 1. Επομένως kI − A−1 Bk = kA−1 (A − B)k <
1. Συνεπώς, λόγω του Λήμματος 1.12, o I − (I − A−1 B) = A−1 B είναι αντιστρέψιμος το οποίο είναι
άτοπο. Επομένως ισχύει η (2.13).
Μπορούμε εύκολα να δούμε ότι ο δείκτης κατάστασης έχει τις ακόλουθες ιδιότητες που αναφέρουμε στο
Θεώρημα 2.4.
λmax (A)
κ2 (A) = = ρ(A)ρ(A−1 ). (2.14)
λmin (A)
Παρατήρηση 2.4. Εύκολα μπορούμε να δούμε ότι αν A ∈ Rn×n είναι ένας αντιστρέψιμος πίνακας, τότε
κ(A) ≥ ρ(A)ρ(A−1 ). Πράγματι, κ(A) = kAk kA−1 k ≥ ρ(A)ρ(A−1 ). Συνεπώς, αν ο πίνακας A είναι
κανονικός, τότε κ(A) ≥ κ2 (A).
Επίσης οι δείκτες κατάστασης ενός αντιστρέψιμου πίνακα A, ως προς τις φυσικές νόρμες k · k1 , k · k2 και
k · k∞ είναι ισοδύναμοι και ικανοποιούν τις ακόλουθες σχέσεις:
Θεώρημα 2.5. Αν A ∈ Rn×n και κ1 (A), κ2 (A), κ∞ (A) ο δείκτης κατάστασης του A ως προς τις νόρμες
k · k1 , k · k2 , k · k∞ , αντίστοιχα, τότε
1
(i) κ2 (A) ≤ κ1 (A) ≤ nκ2 (A)
n
1
(ii) κ∞ (A) ≤ κ2 (A) ≤ nκ∞ (A)
n
1
(iii) κ∞ (A) ≤ κ2 (A) ≤ n2 κ∞ (A)
n2
Απόδειξη. Η απόδειξη αφήνεται ως άσκηση, βλέπε Άσκηση 2.6.1.
Όπως είδαμε και προηγουμένως, αν ο πίνακας A έχει ορισμένες ιδιότητες, π.χ. αν είναι διαγώνιος ή ορθο-
κανονικός, τότε μπορούμε να τις εκμεταλλευτούμε και να κατασκευάσουμε μεθόδους που απαιτούν λιγότερο
αριθμό πράξεων από ότι η ανάλυση LU. Μια τέτοια μέθοδος είναι η μέθοδος Cholesky η οποία εφαρμόζεται
για να λύσουμε γραμμικά συστήματα με συμμετρικούς και θετικά ορισμένους πίνακες.
Ορισμός 2.2. Ένας πίνακας A ∈ Rn×n καλείται θετικά ορισμένος αν xT Ax = (x, Ax) > 0, για κάθε
x 6= 0.
Παρατήρηση 2.5. Πολύ συχνά συναντούμε την υπόθεση ότι ένας πίνακας είναι συμμετρικός (ή ερμιτιανός)
και θετικά ορισμένος. Ένας πίνακας μπορεί να είναι θετικά ορισμένος χωρίς να είναι συμμετρικός, βλ. π.χ.
1 λ
A= , λ > 0, (2.15)
−λ 1
Θεώρημα 2.6 (Ανάλυση Cholesky). Αν A ∈ Rn×n , συμμετρικός και θετικά ορισμένος πίνακας, τότε υπάρχει
μοναδικά οριζόμενος κάτω τριγωνικός πίνακας L με θετικά διαγώνια στοιχεία τέτοιος ώστε
A = LLT (2.16)
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 33
Απόδειξη. Η απόδειξη γίνεται επαγωγικά ως προς τη διάσταση του πίνακα A. Για την απόδειξη βλέπε π.χ.
[8].
Ένας αλγόριθμος για την κατασκευή των στοιχείων Lij του πίνακα L προκύπτει αν εξισώσουμε ένα προς
ένα τα στοιχεία του A που βρίσκονται από τη διαγώνιο και κάτω με τα αντίστοιχα του LLT , αρχίζοντας από
την πρώτη γραμμή μέχρι τη n−οστή γραμμή. Με αυτόν τον τρόπο προκύπτει ο αλγόριθμος του Cholesky
κατά γραμμές, ο Αλγόριθμος 3, βλ. π.χ. [8]. Με αντίστοιχο τρόπο μπορούμε να οδηγηθούμε και στον αλγό-
ριθμο του Cholesky κατά στήλες, βλ. π.χ. [8].
for j = 1to i − 1 do
Pj−1
Lij = Aij − k=1 Lik Ljk /Ljj
end for 1/2
P
Lii = Aii − i−1 L
k=1 ik
2
end for
n3
Παρατήρηση 2.6. Για την κατασκευή του πίνακα L της ανάλυσης Cholesky του A απαιτούνται +O(n2 )
6
πράξεις (πολλαπλασιασμοί και διαιρέσεις), βλ. π.χ. [8], δηλαδή περίπου οι μισές από ότι στην ανάλυση LU.
Παρατήρηση 2.7. Αν έχουμε έναν συμμετρικό πίνακα A ∈ Rn×n , εκτελούμε τον αλγόριθμο του Cholesky,
π.χ. τον Αλγόριθμο 3. Αν αυτός ολοκληρωθεί, δηλαδή Lii > 0, 1 ≤ i ≤ n, τότε κατασκευάσαμε έναν κάτω
τριγωνικό L, A = LLT . Συνεπώς ο A είναι θετικά ορισμένος (βλ. Άσκηση 2.6.10).
2.5 Ανάλυση QR
Θεώρημα 2.7 (Gram-Schmidt). Αν x(1) , . . . , x(n) γραμμικώς ανεξάρτητα διανύσματα του Rn τότε υπάρχουν
q (1) , . . . , q (n) ανά δύο κάθετα διανύσματα του Rn , (q (i) , q (j) ) = 0, i 6= j και kq (i) k2 = 1, i = 1, . . . , n και
Τα q (1) , . . . , q (n) είναι μοναδικά, με την έννοια ότι σε κάθε άλλη οικογένεια διανυσμάτων που ικανοποιεί την ίδια
ιδιότητα, τα διανύσματά της διαφέρουν από τα αντίστοιχα q (i) , 1 ≤ i ≤ n, το πολύ ως προς το πρόσημο.
Απόδειξη. Η απόδειξη γίνεται με επαγωγή ως προς n. Για n = 1 ορίζουμε q (1) = x(1) /kx(1) k. Τo q (1)
παράγει τον ίδιο χώρο με τον χώρο με τo x(1) και έχει νόρμα kq (1) k = 1. Το ίδιο συμβαίνει και με το −q (1) .
Επομένως κάθε άλλο διάνυσμα που έχει την ίδια ιδιότητα με το q (1) , διαφέρει το πολύ ως προς το πρόσημο. Ας
θεωρήσουμε ότι έχουμε βρει ορθοκανονικά διανύσματα q (1) , . . . , q (n−1) τα οποία ικανοποιούν την ιδιότητα
Τα q (1) , . . . , q (n−1) είναι μοναδικά, με την έννοια ότι σε κάθε άλλη οικογένεια διανυσμάτων που ικανοποιεί
την ίδια ιδιότητα, τα διανύσματά της διαφέρουν από τα αντίστοιχα q (i) , 1 ≤ i ≤ n, το πολύ ως προς το
πρόσημο. P
Εύκολα μπορούμε να δούμε ότι το qb(n) = x(n) − n−1 i=1 (x
(n) (i) (i)
, q )q είναι ορθογώνιο ως προς τα q (i) ,
i = 1, . . . , n − 1. Αφού τα {x , . . . , x } είναι γραμμικώς ανεξάρτητα και
(1) (n)
και κάθε άλλο διάνυσμα που έχει την ίδια ιδιότητα με το q (n) , διαφέρει το πολύ ως προς το πρόσημο. Επομένως
έχουμε δείξει το ζητούμενο.
Αλγόριθμος 4 Αλγόριθμος QR
for i = 1 to n do
vi = xi
for j = 1 to i − 1 do
rij = (xi , qj )
vi = vi − rij qj
end for
vi
qi =
kvi k
end for
Θεώρημα 2.8 (Ανάλυση QR). Έστω A ∈ Rn×n ένας αντιστρέψιμος πίνακας. Υπάρχει ένα μοναδικό ζεύγος
πινάκων Q, R ∈ Rn×n με Q ορθομοναδιαίο και R άνω τριγωνικό, με θετικά διαγώνια στοιχεία τέτοια ώστε
A = QR (2.17)
Παρατήρηση 2.8. Σε επόμενο κεφάλαιο θα γενικεύσουμε την ανάλυση QR ενός πίνακα A σε μη-τετραγω-
νικούς πίνακες.
Απόδειξη. Έστω α(1) , . . . , α(n) οι στήλες του πίνακα A. Θα κατασκευάσουμε επαγωγικά τις στήλες του πί-
(1) (n)
νακα Q = (q1 , . . . , qn ) με q (i) ∈ Rn από τις στήλες του A ως εξής:
1. Αφού rank(A) = n ξέρουμε ότι οι στήλες του A είναι γραμμικά ανεξάρτητες. Ειδικότερα, a(1) 6= 0.
Ορίζουμε (
1 ka(1) k2 > 0, j = 1,
q (1) = (1) a(1) , rj,1 =
ka k2 0, j = 2, . . . , n.
2. Υποθέτουμε τώρα ότι για k ≤ n−1 έχουμε βρεί ορθοκανονικά διανύσματα q (1) . . . , q (k) τέτοια ώστε
X
n
v (k+1)
=a (k+1)
− (a(k+1) , q (j) )q (j) 6= 0.
j=1
Ορίζουμε
(a
(k+1) (j)
, q ), j = 1, . . . , k,
1
q (k+1) = v (k+1) , rj,k+1 = kv (k+1) k2 > 0, j = k + 1,
kv (k+1) k 2
0, j = k + 2, . . . , n.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 35
Επιπλέον, ο πίνακας R είναι άνω τριγωνικός με θετικά διαγώνια στοιχεία. Συνεπώς κατασκευάζουμε τα στοι-
χεία των Q και R σύμφωνα με τον Αλγόριθμο 4.
Παρατήρηση 2.9. Η κλασική διαδικασία Gram-Schimdt πάνω στην οποία βασίζεται η απόδειξη της ανάλυ-
σης QR στο προηγούμενο θεώρημα είναι αριθμητικά ασταθής και δεν χρησιμοποιείται στην πράξη. Η τρο-
ποποιημένη διαδικασία Gram-Schmidt την οποία περιγράφουμε πιο κάτω είναι αριθμητικά ευσταθής και αυτή
χρησιμοποιείται σε πρακτικούς υπολογισμούς. Εύκολα διαπιστώνουμε ότι ο αριθμός πράξεων που απαιτού-
νται για τον υπολογισμό της ανάλυσης QR μέσω της (τροποποιημένης) διαδικασίας Gram-Schmidt είναι
O(n3 ), γιατί ο υπολογισμός των εσωτερικών γινομένων (a(k+1) , q (j) ) απαιτεί n πολλαπλασιασμούς και n−1
προσθέσεις, ενώ ο υπολογισμός του διανύσματος v (k+1) απαιτεί επιπλέον n πολλαπλασιασμούς και n προσθέ-
σεις για ένα σύνολο 4n2 πράξεων για κάθε στήλη του πίνακα Q.
2. Για j = 1, . . . , n υπολογίζουμε
(j)q (j)
q = (j) ,
kq k2
q (i) = q − (q , q )q , i = j + 1, . . . , n.
(i) (j) (i) (j)
Θεώρημα 2.9. Κάθε αντιστρέψιμος πίνακας A ∈ Rn×n έχει μοναδική ανάλυση A = QR, όπου Q είναι
ορθογώνιος και R άνω τριγωνικός με θετικά διαγώνια στοιχεία.
Απόδειξη. Αφού ο A είναι αντιστρέψιμος, ο πίνακας M = AT A είναι συμμετρικός θετικά ορισμένος. Έστω
M = LLT η ανάλυση Cholesky του M , όπου ο L είναι κάτω τριγωνικός με θετικά διαγώνια στοιχεία. Τότε
η σχέση M = AT A = LLT δίνει A = QR, με Q = A−T L και R = LT . Το ότι ο Q είναι ορθογώνιος
προκύπτει από τις σχέσεις
και
QT Q = LT A−1 A−T L = LT (AT A)−1 L = LT (LLT )−1 L = I.
Ας υποθέσουμε τώρα ότι A = Q1 R1 = Q2 R2 με Q1 , Q2 ορθογώνιους και R1 , R2 άνω τριγωνικούς πί-
νακες με θετικά διαγώνια στοιχεία. Τότε R1 R2−1 = QT1 Q2 . Ο πίνακας R1 R2−1 είναι άνω τριγωνικός, ενώ
εύκολα διαπιστώνουμε ότι ο QT1 Q2 είναι ορθογώνιος. Όμως, ένας άνω τριγωνικός, ορθογώνιος πίνακας R
είναι διαγώνιος, γιατί
(
Xn
0 i 6= j,
δij = (RT R)ij = Rki Rkj = 2
k=1
Rii i = j.
με τον εξής τρόπο: Αν x = y = 0, τότε c = 1 και s = 0. Διαφορετικά, c = x/d και s = y/d. Προφανώς,
d ≥ 0 και c2 + s2 = 1.
Αν x ∈ R4 , μπορούμε να μηδενίσουμε τα στοιχεία x2 , x3 και x4 εφαρμόζοντας διαδοχικά τρεις μετασχη-
ματισμούς Givens:
1. Εφαρμόζουμε έναν μετασχηματισμό Givens στις γραμμές 3 και 4 για να μηδενίσουμε το στοιχείο x4
1 0 0 0 x1 x1
0 1
0 0 x 2 x 2
=
0 0 c4 s4 x3 y3
0 0 −s4 c4 x4 0
p
όπου y3 = x23 + x24 . Αν x3 = x4 = 0 τότε c4 = 1, s4 = 0, διαφορετικά c4 = x3 /y3 και
s4 = x4 /y3 .
2. Εφαρμόζουμε έναν μετασχηματισμό Givens στις γραμμές 2 και 3 για να μηδενίσουμε το τρίτο στοιχείο
1 0 0 0 x1 x1
0 c s 0
3 3 x
2 = y2
0 −s3 c3 0 y3 0
0 0 0 1 0 0
p
όπου y2 = x22 + y32 . Αν y3 = x2 = 0 τότε c3 = 1, s3 = 0, διαφορετικά c3 = x2 /y2 και
s3 = y3 /y2 .
3. Εφαρμόζουμε έναν μετασχηματισμό Givens στις γραμμές 1 και 2 για να μηδενίσουμε το δεύτερο στοι-
χείο
c 2 s2 0 0 x1 y1
−s2 c2 s3 0 y2 0
0 0 1 0 0 = 0
0 0 0 1 0 0
p
όπου y1 = x21 + y22 . Αν y2 = x1 = 0 τότε c2 = 1, s2 = 0, διαφορετικά c2 = x1 /y1 και
s2 = y2 /y1 .
Το πρόβλημα της μετατροπής ενός πίνακα σε άνω τριγωνική μορφή χρησιμοποιώντας μετασχηματισμούς
Givens μπορεί να υλοποιηθεί εισάγοντας μηδενικά σε κάθε στήλη του πίνακα, από αριστερά προς τα δεξιά
και από κάτω προς τα πάνω. Παρακάτω έχουμε απεικονίσει την ανάλυση QR για έναν 4 × 4 πίνακα. Με
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 37
τον δείκτη i σημειώνονται τα στοιχεία τα οποία αλλάζουν κατά την εφαρμογή του i-στού μετασχηματισμού
Givens.
∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ 3 3 3 3
∗ ∗ ∗ ∗ 1 ∗ ∗ ∗ ∗ 2 2 2 2 2 3 0 3 3 3
∗ ∗ ∗ ∗ → 1 1 1 1 → 0 2 2 2 → 0 2 2 2
∗ ∗ ∗ ∗ 0 1 1 1 0 1 1 1 0 1 1 1
3 3 3 3 3 3 3 3 3 3 3 3
0 3 3 3
4 0 3 3 3
5 0 5 5 5
→ →
0 2 2 2 0 4 4 4 0 0 5 5
0 1 1 1 0 0 4 4 0 0 4 4
3 3 3 3 3 3 3 3
0 5 5 5 0 5 5 5
→
6 .
0 0 5 5 0 0 6 6
0 0 4 4 0 0 0 6
Μπορούμε τώρα να δώσουμε τον αλγόριθμο για τον υπολογισμό της ανάλυσης QR για έναν αντιστρέψιμο
πίνακα A ∈ Rn×n :
Βήμα 1. Αν n = 1 τότε Q = A/|A| και R = A.
Βήμα 2. Αν n > 1 μηδενίζουμε τα στοιχεία στις γραμμές n, n − 1, . . . , 2, της στήλης 1 του A ως εξής:
(i) Θέτουμε bni = ani , i = 1, . . . , n.
(ii) Για i = n, n − 1, . . . , 2, μηδενίζουμε το στοιχείο στη θέση (i, 1) εφαρμόζοντας έναν μετασχηματισμό
Givens στις γραμμές i και i − 1
c i si ai−1,i ai−1,2 · · · ai−1,n bi−1,1 bi−1,2 · · · bi−1,n
=
−si ci bi1 bi2 . . . bin 0 âi2 · · · âin
q
με bi−1,1 = b2i1 + a2i−1,1 . Αν bi1 = ai−1,1 = 0, τότε ci = 1 και si = 0, διαφορετικά ci = ai−1,1 /bi−1,1
και si = bi /bi−1,1 .
(iii) Πολλαπλασιάζουμε τους n − 1 μετασχηματισμούς Givens
c 2 s2 0 In−2 0 0
QTn = −s2 c2 0 · · · 0 c n sn
0 0 In−2 0 −sn cn
(iv) Διαμερίζουμε τον μετασχηματισμένο πίνακα στη μορφή
â22 · · · â2n
T
r11 r .. .. ,
QTn A = όπου Â = . .
0 Â
ân2 · · · ânn
r11 = b11 > 0 και rT = b12 · · · b1n .
Βήμα 3. Υπολογίζουμε την ανάλυση QR του Â = Qn−1 Rn−1 , με Qn−1 μοναδιαίο και Rn−1 άνω τριγωνικό
με θετικά διαγώνια στοιχεία.
Βήμα 4. Θέτουμε
1 0 r11 rT
Q = Qn , R= .
0 Qn−1 0 Rn−1
Ένα μοντέρνο και διεξοδικό σύγγραμμα για αριθμητικές μεθόδους για την επίλυση γραμμικών συστημάτων
είναι το βιβλίο των [4]. Επίσης ο αναγνώστης μπορεί να συμβουλευτεί: [1], [2], [3], [7], [8], [10].
38 ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
2.6 Ασκήσεις
2.6.1 Αν A ∈ Rn×n και κ1 (A), κ2 (A), κ∞ (A) ο δείκτης κατάστασης του A ως προς τις νόρμες k · k1 ,
k · k2 , k · k∞ , αντίστοιχα, τότε δείξτε ότι
1
1. κ2 (A) ≤ κ1 (A) ≤ nκ2 (A)
n
1
2. κ∞ (A) ≤ κ2 (A) ≤ nκ∞ (A)
n
1
3. 2 κ∞ (A) ≤ κ2 (A) ≤ n2 κ∞ (A)
n
p
2.6.2 Δείξτε ότι kAk2 ≤ kAk∞ kAk1
p
2.6.3 Έστω A ∈ Rn×n . Η απεικόνιση k · k : Rn → R, kxk = (Ax, x) ορίζει μια νόρμα; Βρείτε
κατάλληλες συνθήκες για τον πίνακα A.
2.6.6 Έστω A ∈ Rn×n για τον οποίο η απαλοιφή Gauss ολοκληρώνεται χωρίς εναλλαγές γραμμών. Πώς
μπορούμε να υπολογίσουμε την ορίζουσα του A χρησιμοποιώντας την ανάλυση LU του A;
Να βρείτε ένα άνω φράγμα για το σχετικό απόλυτο σφάλμα και να γίνει η επαλήθευση λύνοντας το
διαταραγμένο σύστημα. Δίνεται ότι η λύση του αρχικού συστήματος είναι x = (1, 1, 1)T και ότι η
απόλυτα μεγαλύτερη και η απόλυτα μικρότερη ιδιοτιμή του A είναι 4 και 1, αντίστοιχα.
2.6.9 Έστω A ∈ Rn×n ένας συμμετρικός και θετικά ορισμένος πίνακας με στοιχεία aij , 1 ≤ i, j ≤ n.
Δείξτε ότι
2. Κάθε τετραγωνικός υποπίνακας του A του οποίου η κύρια διαγώνιος βρίσκεται πάνω στην κύρια
διαγώνιο του A, (δηλαδή οι πίνακες με στοιχεία aij , k ≤ i, j ≤ m, 1 ≤ k ≤ m ≤ n) είναι
θετικά ορισμένοι.
3. Για κάθε 1 ≤ k ≤ n ισχύει
max aii = max |aij |
1≤i≤k 1≤i,j≤k
2.6.10 Έστω L ∈ Rn×n κάτω τριγωνικός με θετικά διαγώνια στοιχεία, τότε ο πίνακας A = LLT είναι
συμμετρικός και θετικά ορισμένος.
2.6.11 Έστω A ∈ Rn×n με AT = A. Δείξτε ότι ο A είναι θετικά ορισμένος αν και μόνο αν (Ax, x) > 0 για
κάθε x 6= 0.
2.6.12 Έστω A ∈ Rn×n συμμετρικός και θετικά ορισμένος. Πώς μπορούμε να υπολογίσουμε την ορίζουσα
του A χρησιμοποιώντας την ανάλυση Cholesky του A;
Βιβλιογραφία
[1] G. Allaire και S. M. Kaber. Numerical Linear Algebra. English. Τόμ. 55. Texts Appl. Math. New York,
NY: Springer, 2008. isbn: 978-0-387-34159-0. doi: 10.1007/978‐0‐387‐68918‐0.
[2] Å. Björck. Numerical Methods in Matrix Computations. English. Τόμ. 59. Texts Appl. Math. Cham:
Springer, 2015. isbn: 978-3-319-05088-1. doi: 10.1007/978‐3‐319‐05089‐8.
[3] P. G. Ciarlet. Introduction to Numerical Linear Algebra and Optimization. English. Camb. Texts Appl.
Math. Cambridge etc.: Cambridge University Press, 1988. isbn: 0-521-33984-7.
[4] G. H. Golub και C. F. Van Loan. Matrix computations. English. Baltimore, MD: The Johns Hopkins
University Press, 2013, σσ. xxi + 756. isbn: 978-1-4214-0794-4.
[5] P. Petersen. Linear Algebra. English. New York: Springer, 2012.
[6] G. Strang. Introduction to Linear Algebra. English. Wellesley, MA: Wellesley-Cambridge Press, 2016,
σσ. x + 574. isbn: 978-0-9802327-7-6.
[7] L. N. Trefethen και D. Bau. Numerical Linear Algebra. English. Philadelphia, PA: SIAM, 2000. isbn:
0-89871-487-7.
40 ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
[8] Γ. Δ. Ακρίβης και B. A. Δουγαλής. Εισαγωγή στην Αριθμητική Ανάλυση. Greek. Πανεπιστημιακές Εκ-
δόσεις Κρήτης, 2017.
[9] Δ. Βάρσος κ.ά. Μια Εισαγωγή στη Γραμμική Άλγεβρα. Greek. Εκδόσεις “Σοφία”, 2012.
[10] B. A. Δουγαλής, Δ. Νούτσος και Α. Χατζηδήμος. Αριθμητική Γραμμική Άλγεβρα. Ιωάννινα: Τμήμα
Μαθηματικών, Πανεπιστήμιο Ιωαννίνων, 2016.
ΚΕΦΑΛΑΙΟ 3
Περίληψη
Θα ασχοληθούμε με την αριθμητική επίλυση ενός γραμμικού συστήματος της μορφής
Ax = b
χρησιμοποιώντας επαναληπτικές μεθόδους. Μια αριθμητική μέθοδος για την επίλυση ενός γραμμικού συστή-
ματος Ax = b καλείται επαναληπτική, αν με αυτή κατασκευάζουμε μια ακολουθία διανυσμάτων (x(k) )k≥0 η
οποία συγκλίνει στη λύση x του γραμμικού συστήματος.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Γραμμικής Άλγεβρας. Διανυσματικοί χώροι. Εσωτερικό γινόμενο
σε διανυσματικούς χώρους. Νόρμες πινάκων και διανυσμάτων. Ιδιοτιμές και ιδιοδιανύσματα πινάκων. Μέγι-
στο και ελάχιστο διανυσματικών συναρτήσεων.
Ax = b (3.1)
καλείτε επαναληπτική, αν κατασκευάζει μια ακολουθία διανυσμάτων (x(k) )k≥0 . Η μέθοδος λέμε ότι συγκλίνει,
αν η ακολουθία (x(k) )k≥0 συγκλίνει στη λύση x του γραμμικού συστήματος (3.1).
Ορισμός 3.1. Έστω A ∈ Rn×n ένας αντιστρέψιμος πίνακας. Ένα ζευγάρι πινάκων (M, N ) με M αντιστρέ-
Συνεπώς Ak x = 0. Στη συνέχεια θα δείξουμε ότι από την (ii.) παίρνουμε την (iii.). Αν υπάρχει ιδιοτιμή λ
τέτοια ώστε |λ| ≥ 1 και x 6= 0 ένα ιδιοδιάνυσμα Ax = λx, θα έχουμε Ak x = λk x. Οπότε
kAk xk = |λ|k kxk 6→ 0, (3.8)
το οποίο είναι άτοπο.
Σύμφωνα με το Λήμμα 1.11 έχουμε ότι για κάθε ϵ > 0 υπάρχει μια φυσική νόρμα πινάκων k · k τέτοια
ώστε
kAk ≤ ρ(A) + ϵ. (3.9)
1 − ρ(A)
Επομένως, αν ισχύει η (iii.), για ϵ = , υπάρχει φυσική νόρμα k · k τέτοια ώστε
2
1 − ρ(A)
kAk ≤ ρ(A) + < 1. (3.10)
2
Τέλος, θα δείξουμε ότι από την (iv.) έπεται η (i.). Αν για κάποια φυσική νόρμα kAk < 1 τότε θα έχουμε
kAk k ≤ (kAk)k → 0, k → ∞. (3.11)
Συνεπώς limk→∞ Ak = 0.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 43
Ορισμός 3.2. Μια επαναληπτική μέθοδος λέμε ότι συγκλίνει αν για κάθε επιλογή αρχικού διανύσματος x(0) ∈
Rn η ακολουθία (x(k) ) που προκύπτει από τη μέθοδο συγκλίνει στην ακριβή λύση x του γραμμικού συστήματος
Ax = b.
Ορισμός 3.3. Το διάνυσμα r(k) = b − Ax(k) καλείται υπόλοιπο κατά την k επανάληψη. Αντίστοιχα, το
e(k) = x − x(k) καλείται σφάλμα κατά την k επανάληψη.
Παρατήρηση 3.2. Είναι απλό να δούμε ότι μια επαναληπτική μέθοδος συγκλίνει αν και μόνο αν το σφάλμα
e(k) → 0, το οποίο είναι ισοδύναμο με το r(k) = Ae(k) συγκλίνει στο 0. Αυτή η παρατήρηση είναι πολύ
χρήσιμη, διότι το σφάλμα e(k) περιέχει την άγνωστη ποσότητα x, ενώ το υπόλοιπο r(k) μπορεί να υπολογιστεί
σε κάθε βήμα.
Θεώρημα 3.2. Μια επαναληπτική μέθοδος της μορφής (3.4) συγκλίνει αν και μόνο αν η φασματική ακτίνα του
πίνακα επαναληψης T = M −1 N ικανοποιεί
Για έναν δοσμένο πίνακα A θεωρούμε τους ακόλουθους τρεις πίνακες που δημιουργούνται από τον A. Τον
διαγώνιο πίνακα D ο οποίος περιέχει τα διαγώνια στοιχεία του A, τον κάτω τριγωνικό πίνακα L που περιέχει
τα στοιχεία του A που βρίσκονται κάτω από τη διαγώνιο του A με αντίθετο πρόσημο και τον άνω τριγωνικό
πίνακα U που περιέχει τα στοιχεία του A που βρίσκονται πάνω από τη διαγώνιο του A με αντίθετο πρόσημο.
Έτσι A = D − L − U με
a11 0 · · · 0
0 a22 0 . . .
D = .. ... ..
. .
0 ··· ann
0 0 ··· 0
−a21 0 ... 0
L = .. . . .. (3.14)
. . . . . .
−an1 · · · −an(n−1) 0
0 −a12 · · · −a1n
.. ... ... ..
. .
U =
0 0
..
. −a(n−1)n
0 ··· 0 0
Ορισμός 3.4. Η επαναληπτική μέθοδος Jacobi ορίζεται ως η επαναληπτική μέθοδος με πίνακα M = D και
N = L + U . Οπότε ο πίνακας επανάληψης είναι TJ = D−1 (L + U ) = D−1 (D − A).
44 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ
Παρατήρηση 3.3. Εύκολα μπορούμε να δούμε από τον ορισμό (3.15) της μεθόδου Jacobi ότι για κάθε
γραμμή i, i = 1, . . . , n, έχουμε
( i−1 )
(k+1) 1 X (k)
Xn
(k)
xi = aij xi + aij xi + bi , (3.17)
aii j=1 j=i+1
όπου b = (b1 , . . . , bn )T ∈ Rn και αντίστοιχα για τα x(k) , x(k+1) ∈ Rn . Οπότε κάθε συνιστώσα του νέου
διανύσματος x(k) μπορεί να υπολογιστεί ανεξάρτητα από τις υπόλοιπες.
Παρατήρηση 3.4. Αντίστοιχα για τη μέθοδο Gauss-Seidel έχουμε από τον ορισμό (3.16) ότι για κάθε γραμ-
μή i, i = 1, . . . , n ισχύει
( i−1 )
1 X Xn
(k+1) (k+1) (k)
xi = aij xi + aij xi + bi , (3.18)
aii j=1 j=i+1
όπου b = (b1 , . . . , bn )T ∈ Rn και αντίστοιχα για τα x(k) , x(k+1) ∈ Rn . Οπότε κάθε συνιστώσα του νέου
διανύσματος x(k+1) δεν μπορεί να υπολογιστεί ανεξάρτητα από τις υπόλοιπες. Για να υπολογίσουμε την i
συνιστώσα του x(k+1) πρέπει να γνωρίζουμε τις προηγούμενες 1, . . . , i − 1 συνιστώσες του.
Ορισμός 3.6. Λέμε ότι o A ∈ Rn×n έχει αυστηρά κυριαρχική διαγώνιο (κατά γραμμές) αν
X
n
|aij | < |aii |, i = 1, . . . , n. (3.19)
j=1,i̸=j
Αντίστοιχα, λέμε ότι o A ∈ Rn×n έχει αυστηρά κυριαρχική διαγώνιο (κατά στήλες) αν
X
n
|aij | < |ajj |, j = 1, . . . , n. (3.20)
i=1,i̸=j
Λήμμα 3.1. Αν ο A ∈ Rn×n έχει αυστηρά κυριαρχική διαγώνιο κατά γραμμές ή στήλες, τότε αντιστρέφεται.
Απόδειξη. Ας υποθέσουμε ότι ο A έχει αυστηρά κυριαρχική διαγώνιο κατά γραμμές και ότι ο A δεν αντι-
στρέφεται. Τότε θα υπάρχει x 6= 0 τέτοιο ώστε Ax = 0. Αφού x 6= 0, έστω k ∈ {1, Pn. . . , n} για το
οποίο kxk∞ = |xk | 6= 0. Συνεπώς
Pn η k−συνιστώσα του Ax θα μηδενίζεται, (Ax) k = j=1 akj xj = 0.
Προκύπτει λοιπόν akk xk = − j=1,j̸=k akj xj . Χρησιμοποιώντας τώρα το γεγονός ότι ο A έχει αυστηρά
κυριαρχική διαγώνιο παίρνουμε
!
X n
|akk ||xk | ≤ |akj | kxk∞ < |akk |kxk∞ . (3.21)
j=1,j̸=k
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 45
Συνεπώς λόγω της επιλογής του δείκτη k ώστε kxk∞ = |xk | λαμβάνουμε |akk | < |akk | το οποίο είναι
άτοπο.
Αν ο A έχει αυστηρά κυριαρχική διαγώνιο κατά στήλες, τότε εξετάζουμε τον πίνακα AT ο οποίος έχει αυ-
στηρά κυριαρχική διαγώνιο κατά γραμμές.
Θεώρημα 3.3. Αν ο A έχει αυστηρά κυριαρχική διαγώνιο, τότε οι μέθοδοι Jacobi και Gauss-Seidel συγκλίνουν.
X
n
|aij | < |aii |, i = 1, . . . , n. (3.22)
j=1,j̸=i
Είναι απλό να δούμε ότι τότε |aii | > 0 και άρα aii 6= 0. Συνεπώς οι D και D − L της ανάλυσης του
A = D − L − U αντιστρέφονται και οι μέθοδοι Jacobi και Gauss–Seidel είναι καλά ορισμένες.
Ο πίνακας επανάληψης της μεθόδου του Jacobi δίνεται από
a12 a1n
0 − ··· −
a11 a11
a21 .. a2n
− 0 . −
−1 a
TJ = D (L + U ) = 22 a 22 . (3.23)
.. .. .. ..
.
. . .
an1 an(n−1)
− ··· − 0
ann ann
Επειδή ! Pn
X n
|aij | j=1,j̸=i |aij |
kTJ k∞ = max = max < 1, (3.24)
1≤i≤n
j=1,j̸=i
|aii | 1≤i≤n |aii |
η μέθοδος συγκλίνει.
Για την περίπτωση της μεθόδου Gauss–Seidel ο πίνακας επανάληψης είναι ο TGS = (D − L)−1 U . Ας
υποθέσουμε ότι ρ(TGS ) ≥ 1. Τότε θα υπάρχει μια ιδιοτιμή λ του TGS με |λ| ≥ 1. Επομένως
X
n X
i−1
1 X
n X n
|aλij | = |aij | + |aij | ≤ |aij | < |aii | = |aλii |, i = 1, . . . n. (3.26)
j=1,j̸=i j=1
|λ| j=i+1 j=1,j̸=i
Επομένως ο Aλ έχει αυστηρά κυριαρχική διαγώνιο κατά γραμμές και σύμφωνα με το Λήμμα 3.1 αντιστρέ-
φεται, το οποίο είναι άτοπο. Συνεπώς συμπεραίνουμε ότι ρ(TGS ) < 1 και άρα η μέθοδος Gauss–Seidel
συγκλίνει.
Αν τώρα ο A έχει αυστηρά κυριαρχική διαγώνιο κατά στήλες, η απόδειξη γίνεται παρόμοια.
Τότε η τιμή της ορίζουσας του A(µ) είναι ανεξάρτητη του µ και άρα A(µ) = A(1).
τότε εύκολα βλέπουμε ότι Q(µ)−1 A(µ)Q(µ) = A(1). Συνεπώς det(A(1)) = det(A(µ)).
Αν ο A είναι ένας τριδιαγώνιος πίνακας, τότε μπορούμε να συγκρίνουμε τη φασματική ακτίνα των πινάκων
επανάληψης των μεθόδων Jacobi και Gauss–Seidel, όπως διατυπώνεται στο ακόλουθο θεώρημα.
Θεώρημα 3.4. Αν A είναι ένας τριδιαγώνιος πίνακας και TJ , TGS είναι οι πίνακες επανάληψης των μεθόδων
Jacobi και Gauss–Seidel, τότε
ρ(TGS ) = ρ2 (TJ ) (3.29)
Απόδειξη. Οι ιδιοτιμές ενός πίνακα A είναι οι ρίζες του χαρακτηριστικού πολυωνύμου pA (λ) = det(A −
λI). Αν θεωρήσουμε τη διάσπαση της μεθόδου Jacobi A = D − L − U , ο πίνακας επανάληψης είναι
TJ = D−1 (L + U ), οπότε
Αντίστοιχα, για τον πίνακα επανάληψης της μεθόδου Gauss–Seidel, TGS = (D − L)−1 U έχουμε
1 1
Θεωρούμε τώρα τον πίνακα A(µ) = λ2 D − µλ2 L − U . Από το Λήμμα 3.2 έχουμε det(A( )) =
µ λ
det(A(1)), λ 6= 0. Συνεπώς
Άρα αν λ, λ 6= 0, ιδιοτιμή του πίνακα επανάληψης TJ τότε η λ2 θα είναι και ιδιοτιμή του TGS , και αντιστρό-
φως. Δηλαδή αν λ2 ιδιοτιμή του TGS τότε λ, −λ ιδιοτιμές του TJ . Συνεπώς ρ(TGS ) = ρ2 (TJ ).
Παρατήρηση 3.5. Αν A είναι ένας τριδιαγώνιος πίνακας, τότε αν η μέθοδος Jacobi συγκλίνει, θα συγκλίνει
και η μέθοδος Gauss-Seidel και αντιστρόφως, αν συγκλίνει η Gauss-Seidel, θα συγκλίνει και η Jacobi.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 47
Στην περίπτωση που ο A είναι συμμετρικός και θετικά ορισμένος πίνακας μπορεί να αποδειχθεί ότι η ικανή
συνθήκη του Θεωρήματος 3.5 είναι και αναγκαία.
Θεώρημα 3.7. Αν A ∈ Rn×n συμμετρικός και θετικά ορισμένος, τότε η συνθήκη ω ∈ (0, 2) είναι μια αναγκαία
και ικανή συνθήκη για τη σύγκλιση της μεθόδου SOR.
Απόδειξη. Αποδεικνύουμε το θεώρημα ακολουθώντας επιχειρήματα παρόμοια με αυτά των [1], [4] και [8].
Αφού ο A είναι θετικά ορισμένος το ίδιο θα ισχύει και για τον D. Επομένως θα έχει μη-μηδενικά διαγώνια
στοιχεία. Άρα ο πίνακας ω1 D − L, ω 6= 0, θα αντιστρέφεται, επειδή θα ισχύει det( ω1 D − L) 6= 0. Επιπλέον
έχουμε ότι
1 1−ω
M = D − L και N = D + U,
ω ω
και LT = U , οπότε
1 1−ω 2−ω
MT + N = D − LT + D+U = D. (3.38)
ω ω ω
Συνεπώς ο M T + N είναι θετικά ορισμένος αν και μόνο αν ω ∈ (0, 2). Χρησιμοποιώντας τώρα το Θεωρήμα
3.6 παίρνουμε το ζητούμενο.
Στην περίπτωση που ο A είναι συμμετρικός και θετικά ορισμένος πίνακας μπορεί να βρεθεί η βέλτιστη πα-
ράμετρος ω για την οποία ο πίνακας επανάληψης Tω της μεθόδου SOR έχει τη μικρότερη φασματική ακτίνα.
Θεώρημα 3.8. Αν A είναι ένας τριδιαγώνιος, συμμετρικός και θετικά ορισμένος πίνακας, τότε οι μέθοδοι Jacobi,
Gauss–Seidel και SOR συγκλίνουν. Επίσης υπάρχει μια βέλτιστη παράμετρος ωopt τέτοια ώστε
Ο πίνακας επανάληψης Tω της μεθόδου SOR με παράμετρο ω δίνεται από Tω = (D − ωL)−1 [(1 − ω)D +
ωU ]. Χρησιμοποιώντας την (3.30) έχουμε
1 −1 λ2 + ω − 1
pTω (λ2 ) = det(Tω − λ2 I) = det((L − D) ) det( D − λ2 L − U )
ω ω
1 λ2 + ω − 1
= λn det((L − D)−1 ) det( D − L − U) (3.43)
ω λω
det((L − ω1 D)−1 ) λ2 + ω − 1
= λn p TJ ( ).
det(−D−1 ) λω
λ2 + ω − 1
Συνεπώς αν λ 6= 0, τότε το λ2 είναι ιδιοτιμή του Tω αν και μόνο αν το είναι ιδιοτιμή του TJ .
λω
Επειδή ρ(TJ ) < 1, για κάθε ιδιοτιμή α του πίνακα επανάληψης TJ ισχύει |α| < 1. Θέτουμε
λ2 + ω − 1
= α. (3.44)
λω
Προκύπτουν δύο τιμές λ1 (α) και λ2 (α) ως λύσεις της εξίσωσης (3.44)
p p
αω + α2 ω 2 − 4(ω − 1) αω − α2 ω 2 − 4(ω − 1)
λ1 (α) = και λ2 (α) = . (3.45)
2 2
Στη συνέχεια θέτουμε µ1 (α) = λ21 (α) και µ2 (α) = λ22 (α) τις αντίστοιχες ιδιοτιμές του Tω . Μπορούμε να
δούμε ότι οι ιδιοτιμές του TJ είναι πραγματικές. Πράγματι, αν α ∈ σ(TJ ) και v ένα ιδιοδιάνυσμα ως προς α
θα έχουμε TJ v = αv. Οπότε
(L + U )v = αDv ή Av = (1 − α)Dv,
από όπου προκύπτει ότι
(Av, v) = (1 − α)(Dv, v).
Συνεπώς 1 − α > 0, επειδή οι A, D είναι θετικά ορισμένοι πίνακες.
Μπορούμε να δούμε εύκολα, βλ. Θεώρημα 3.4, ότι αν α ιδιοτιμή του TJ τότε και −α είναι επίσης ιδιοτιμή
του TJ . Επομένως, ισχύει ότι λ1 (α) = −λ2 (−α). Συνεπώς
ρ(Tω ) = max {|µ1 (α)|, |µ2 (α)|} = max {|µ1 (α)|},
α∈σ(TJ ) α∈σ(TJ )
με
1 2 2 αω p 2 2
|µ1 (α)| = (α ω − 2(ω − 1)) + α ω − 4(ω − 1) . (3.46)
2 2
Θέλουμε τώρα να υπολογίσουμε την τιμή |µ1 (α)| ώστε να βρούμε για ποιο α μεγιστοποιείται. Η ποσότητα
α ω 2 − 4(ω − 1) είναι πραγματική και αν είναι αρνητική τότε, λόγω της (3.45), το µ1 (α) είναι μιγαδικός
2
Άρα θα έχουμε σε αυτήν την περίπτωση |µ1 (α)| = ω − 1. Στην περίπτωση τώρα που ω ∈ (0, ω1 (α)] το
µ1 (α) είναι πραγματικός. Άρα
(
ω − 1, αν ω ∈ [ω1 (α), 2)
|µ1 (α)| = (3.50)
|λ1 (α)|, αν ω ∈ (0, ω1 (α)].
2
Αν µ1 (α) είναι πραγματικός, λόγω της (3.45), έχουμε για α > 0 ότι λ1 (α) ≥ λ1 (−α). Επιπλέον από την
(3.47) παίρνουμε ω1 (α) = ω1 (−α). Οπότε
Συνεπώς μπορούμε να μεγιστοποιήσουμε την ποσότητα |µ1 (α)| για θετικά α. Ακόμα, για α > 0 η µ1 (α)
είναι αύξουσα συνάρτηση ως προς α, επειδή
!
2
d ω α
(λ1 (α)2 ) = λ1 (α) ω + p > 0. (3.52)
dα α2 ω 2 − 4(ω − 1)
Στη συνέχεια θα βρούμε το ελάχιστο ως προς ω ∈ (0, 2) της ρ(Tω ). Στη λ1 (α)2 αντικαθιστούμε το α με το
ρ(TJ ) και θεωρούμε τη παράγωγο ως προς ω
d d
(λ1 (ρ(TJ )2 ) = 2λ1 (ρ(TJ )) (λ1 (ρ(TJ )))
dω dω !
d ρ(TJ ) 2ρ(TJ )2 ω − 4
= 2λ1 (ρ(TJ )) + p (3.54)
dω 2 4 ρ(TJ )2 ω 2 − 4(ω − 1)
2(ρ(TJ )λ1 (ρ(TJ )) − 1)
= λ1 (ρ(TJ )) p .
4 ρ(TJ )2 ω 2 − 4(ω − 1)
d
(λ1 (ρ(TJ )2 ) < 0.
dω
Άρα η µ1 (ρ(TJ )) είναι φθίνουσα ως προς ω και το ελάχιστο της µ1 (ρ(TJ )) στο [0, ω1 (ρ(TJ ))] λαμβάνε-
ται στο ω1 (ρ(TJ )). Αντίστοιχα, το ελάχιστο της ω − 1 στο [ω1 (ρ(TJ )), 2] λαμβάνεται στο ω1 (ρ(TJ )).
Επομένως, αν ω ∈ (0, 2), το ελάχιστο της ρ(Tω ) λαμβάνεται στο ω1 (ρ(TJ )) και παίρνουμε λοιπόν ότι
min0<ω<2 ρ(Tω ) = ωopt − 1 και ωopt = ω1 (ρ(TJ )).
1 1
Ορισμός 3.8. Για A ∈ Rn×n θεωρούμε τη διάσπαση M = I και N = I − A, α ∈ R, α 6= 0.
α α
Η επαναληπτική μέθοδος που προκύπτει καλείται μέθοδος των κλίσεων (με σταθερό α). Η ακολουθία των
προσεγγίσεων {x(k) }k≥0 ορίζεται τότε ως
(i.) Αν λ1 < 0 < λn τότε η μέθοδος των κλίσεων αποκλίνει για κάθε α.
(ii.) Αν 0 < λ1 τότε η μέθοδος συγκλίνει αν και μόνο αν 0 < α < 2/λn . Η βέλτιστη παράμετρος α η οποία
ελαχιστοποιεί τη φασματική ακτίνα του πίνακα επανάληψης είναι
2
αopt = ,
λ1 + λn
και
λn − λ 1 κ2 (A) − 1
min ρ(M −1 N ) = = .
α λn + λ 1 κ2 (A) + 1
Απόδειξη. Αρκεί να εξετάσουμε πότε ρ(M −1 N ) = ρ(I − αA) < 1 ή αλλιώς −1 < 1 − αλi < 1,
i = 1, . . . , n. Είναι φανερό ότι αυτό συμβαίνει αν αλi > 0, i = 1, . . . , n. Συνεπώς όλες οι ιδιοτιμές πρέπει
να είναι διαφορετικές του μηδενός και ομόσημες του α, οπότε έχουμε δείξει το (i.).
Για να να δείξουμε την (ii.) παρατηρούμε ότι από τις σχέσεις −1 < 1 − αλi < 1, i = 1, . . . , n,
2
προκύπτει α < και επειδή 0 < λ1 έχουμε ότι αν η μέθοδος συγκλίνει, τότε 0 < α < 2/λn . Αν τώρα
λn
0 < α < 2/λn είναι προφανές ότι θα οδηγηθούμε στις σχέσεις −1 < 1 − αλi < 1, i = 1, . . . , n, οπότε
ρ(M −1 N ) = ρ(I − αA) < 1, δηλαδή η μέθοδος θα συγκλίνει.
Στη συνέχεια θα βρούμε τη βέλτιστη παράμετρο α η οποία ελαχιστοποιεί τη ρ(M −1 N ) = ρ(I − αA).
1 1
Παρατηρούμε ότι η συνάρτηση f (λ) = |1 − αλ| είναι φθίνουσα στο (−∞, ) και αύξουσα στο ( , ∞).
α α
Εύκολα βλέπουμε ότι επειδή α > 0 και λ1 > 0,
επομένως ρ(M −1 N ) = max(|1 − αλ1 |, |1 − αλn |). Για να βρούμε ποια από τις 2 τιμές είναι μεγαλύτερη
αρκεί να βρούμε το πρόσημο της διαφοράς |1 − αλ1 | − |1 − αλn | το οποίο είναι το ίδιο με αυτό της (1 −
αλ1 )2 − (1 − αλn )2 . Εύκολα βλέπουμε ότι
οπότε για να βρούμε το max(|1 − αλ1 |, |1 − αλn |) αρκεί να εξετάσουμε το πρόσημο της 2 − α(λ1 + λ2 ).
Συμπεραίνουμε λοιπόν ότι
2
1 − αλ1 , αν 0 < α < ,
ρ(M −1 N ) = λ1 + λn (3.58)
αλn − 1, αν
2
<α<
2
.
λ1 + λn λn
2
Είναι προφανές λοιπόν ότι η μικρότερη τιμή ρ(M −1 N ) λαμβάνεται για αopt = και
λ1 + λn
λ1 + λn − 2λ1 λ n − λ1
min ρ(M −1 N ) = 1 − αopt λ1 = = . (3.59)
α λ1 + λn λ 1 + λn
52 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ
1X X
n n
1
f (x) = (Ax, x) − (b, x) = aij xi xj − bi x i , (3.60)
2 2 i,j=1 i=1
1 X 1 X
n n
∂f (x)
= akk xk + aik xi + aki xi − bk
∂xk 2 i=1,i̸=k 2 i=1,i̸=k
(3.63)
X
n
= aik xi − bk = (Ax − b)k .
i=1
Επομένως ∇f (x) = Ax − b. Αφού ο A είναι συμμετρικός και πραγματικός, υπάρχουν P n ιδιοτιμές και
έστω u(i) , i = 1, . . . , n, τα αντίστοιχα ορθοκανονικά ιδιοδιανύσματα. Θέτουμε x = ni=1 x̂i u(i) και b =
Pn (i)
i=1 b̂i u έτσι ώστε
!
1X X X
n n n 2
1 b̂ i b̂
f (x) = λi x̂2i − b̂i x̂i = λi (x̂i − )2 − i . (3.64)
2 i=1 i=1
2 i=1
λi λi
Αν ο A είναι θετικά ορισμένος, λi > 0, τότε η f ελαχιστοποιείται αν ελαχιστοποιήσουμε κάθε όρο της
b̂i
τετραγωνικής μορφής. Οπότε το ελάχιστο λαμβάνεται για x̂i = και αυτό δίνει τη μοναδική λύση του
λi
Ax = b.
Παρατήρηση 3.7. Χρησιμοποιώντας το Θεώρημα 3.10 μπορούμε να δείξουμε ότι αν A θετικά ορισμένος και
1
συμμετρικός πίνακας και f (x) = (Ax, x) − (b, x) και V είναι ένας υπόχωρος του Rn , υπάρχει x⋆ ∈ V
2
τέτοιο ώστε
f (x⋆ ) ≤ f (x), ∀x ∈ V.
Επίσης, το x⋆ είναι το μοναδικό στοιχείο του V τέτοιο ώστε
(Ax⋆ − b, y) = 0, ∀y ∈ V.
Για την απόδειξη αυτής της παρατήρησης βλ. π.χ. [1].
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 53
1
Θεώρημα 3.11. Έστω A ∈ Rn×n συμμετρικός και θετικά ορισμένος, b ∈ Rn και f (x) = (Ax, x)−(b, x).
2
Αν ∇f (x) 6= 0 τότε
2
f (x − a∇f (x)) ≤ f (x), ∀α ∈ (0, ). (3.65)
ρ(A)
Απόδειξη. Γνωρίζουμε ότι η f λαμβάνει το ελάχιστό της σε ένα μοναδικό σημείο x ∈ Rn τέτοιο ώστε Ax = b
και σε αυτό το σημείο ∇f (x) = 0. Έστω τώρα x ∈ Rn , ∇f (x) 6= 0. Θέτουμε δ = −α(Ax − b). Αφού ο
A είναι συμμετρικός έχουμε
1
f (x + δ) = (A(x + δ), x + δ) − (b, x + δ)
2
1 1
= (Ax, x) − (b, x) + (Aδ, δ) + (Ax, δ) − (b, δ) (3.66)
2 2
1
= f (x) + (Aδ, δ) + (Ax − b, δ).
2
Επίσης ισχύει
(Aδ, δ) ≤ kAk2 kδk22 = ρ(A)kδk22 = α2 ρ(A)kAx − b)k22 , (3.67)
και
(Ax − b, δ) = −αkAx − bk22 . (3.68)
Συνεπώς έχουμε
ρ(A)
f (x + δ) ≤ f (x) + (α2 − α)kAx − b)k22 . (3.69)
2
2
Οπότε f (x + δ) < f (x) αν 0 < α < .
ρ(A)
με αk να δίνεται από
kr(k) k22
αk = , όπου r(k) = b − Ax(k) , (3.71)
(Ar(k) , r(k) )
καλείται μέθοδος απότομης καθόδου.
Παρατήρηση 3.8. Το αk της παραπάνω μεθόδου πάντα ορίζονται καλά εκτός εάν r(k) = 0. Τότε όμως
έχουμε ήδη βρει τη λύση του γραμμικού συστήματος Ax = b.
Λήμμα 3.3. Έστω A ∈ Rn×n ένας θετικά ορισμένος και συμμετρικός πίνακας. Για τη μέθοδο κλίσεων (3.70) το
αk το οποίο δίνεται από την (3.71) ορίζει το μοναδικό βέλτιστο βήμα κατά την κατεύθυνση της κλίσης ∇f (x(k) ).
Απόδειξη. Θα θεωρήσουμε τη συνάρτηση g(α) = f (xk − α∇f (x(k) )) η οποία είναι πολυώνυμο 2ου βαθ-
μού ως προς α και θα βρούμε την ελάχιστη τιμή του. Η απόδειξη αυτού του λήμματος αφήνεται ως άσκηση,
βλ. Άσκηση 3.5.17.
Ορισμός 3.12. Έστω A ∈ Rn×n και r ∈ Rn . Καλούμε χώρο Krylov Kk , που παράγεται από τα A, r τον
υπόχωρο του Rn που παράγεται από τα k + 1 διανύσματα {r, Ar, A2 r, . . . , Ak r}.
54 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ
Λήμμα 3.4. Η ακολουθία των χώρων Krylov (Kk )k≥0 είναι μια αύξουσα ακολουθία χώρων
Kk ⊆ Kk+1 , ∀k ≥ 0. (3.72)
Απόδειξη. Είναι φανερό ότι dim Kk ≤ k + 1 και dim K0 = 1. Αφού dim Kk ≤ n, για κάθε k ≥ 0,
υπάρχει k0 τέτοιο ώστε να είναι ο μεγαλύτερος ακέραιος τέτοιος ώστε
dim Kk = k + 1, ∀k ≤ k0 . (3.74)
Από τον ορισμό του k0 έχουμε dim Kk0 +1 < k0 + 2. Επειδή Kk0 ⊂ Kk0 +1 , έπεται ότι dim Kk0 +1 = k0 +
1. Συνεπώς το Ak0 +1 r είναι γραμμικός συνδυασμός των {r, Ar, . . . , Ak0 r}. Εύκολα συμπεραίνουμε λοιπόν
ότι τα Ak r με k ≥ k0 + 1 είναι γραμμικώς εξαρτημένα από τα {r, Ar, . . . , Ak0 r}, δηλαδή Kk = Kk0 , για
κάθε k ≥ k0 .
Ορισμός 3.13. Για x(0) ∈ Rn και X ένα διανυσματικό υπόχωρο του Rn θα γράφουμε
Θεώρημα 3.12. Θεωρούμε τη μέθοδο των κλίσεων (3.70) και τους χώρους Krylov Kk που παράγονται με το
διάνυσμα r(0) . Το r(k) = b − Ax(k) ικανοποιεί τις ακόλουθες ιδιότητες:
2. x(k+1) ∈ [x(0) + Kk ].
Απόδειξη. Σύμφωνα με τον ορισμό της μεθόδου (3.70), x(k+1) = x(k) + ak r(k) , οπότε εύκολα βλέπουμε
ότι Ax(k+1) = Ax(k) + ak Ar(k) και
Επίσης εύκολα βλέπουμε ότι x(1) − x(0) ∈ K0 , οπότε χρησιμοποιώντας και πάλι επαγωγή συμπεραίνουμε
ότι x(k+1) − x(0) ∈ Kk .
Λήμμα 3.5. Έστω (x(k) )k≥0 ⊂ Rn και Kk ο χώρος Krylov που παράγεται από το r(0) = b − Ax(0) . Αν
x(k+1) ∈ [x(0) + Kk ], τότε r(k+1) = b − Ax(k+1) ∈ Kk+1 .
X
k
(k+1) (0)
x =x + ai Ai r(0) , (3.76)
i=0
Pk
οπότε Ax(k+1) − b = Ax(0) − b + i=0 ai Ai+1 r(0) , δηλαδή r(k+1) ∈ Kk+1 .
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 55
Θα υποθέσουμε ότι ο πίνακας A είναι συμμετρικός και θετικά ορισμένος και θα βελτιώσουμε τη μέθοδο των
κλίσεων κατασκευάζοντας μια νέα μέθοδο που μοιάζει με τη μέθοδο των κλίσεων (3.70) και θα ολοκληρώνεται
πάντα σε πεπερασμένο αριθμό επαναλήψεων. Αρχικά δεν θα θεωρήσουμε μια επαναληπτική διαδικασία για
να ορίσουμε το x(k+1) όπως αυτή που θεωρήσαμε στη μέθοδο (3.70) αλλά θα την ορίσουμε σύμφωνα με την
ιδιότητα του Θεωρήματος 3.12, δηλαδή με x(k+1) ∈ [x(0) + Kk ], όπου Kk ο χώρος Krylov που παράγεται
από το r(0) = b − Ax(0) . Φυσικά αυτό δεν αρκεί για να μπορέσουμε να ορίσουμε το x(k+1) μοναδικά. Θα
πρέπει να απαιτήσουμε κάποια επιπλέον ιδιότητα από το x(k+1) . Μπορούμε να θεωρήσουμε παραδείγματος
χάριν κάποια από τις ακόλουθες δύο:
1. Επιλέγουμε x(k+1) ∈ [x(0) + Kk ] τέτοιο ώστε r(k+1) ⊥Kk .
1
2. Επιλέγουμε x(k+1) ∈ [x(0) + Kk ] το οποίο να ελαχιστοποιεί τη f (x) = (Ax, x) − (b, x) στο
2
[x(0) + Kk ].
Στο ακόλουθο Θεώρημα 3.13 θα δείξουμε ότι η διαδικασία που προσδιορίζει το x(k+1) ∈ [x(0) + Kk ]
συγκλίνει στο x = A−1 b σε n το πολύ βήματα και θα την καλούμε μέθοδο συζυγών κλίσεων. Στη συνέχεια,
στο Θεωρήμα 3.15, θα προσδιορίσουμε τον ακριβή αλγόριθμο της μεθόδου των συζυγών κλίσεων.
Θεώρημα 3.13. Έστω A ∈ Rn×n συμμετρικός και θετικά ορισμένος. Υπάρχει μοναδικό x(k+1) ∈ [x(0) + Kk ]
που ικανοποιεί τα δύο παραπάνω κριτήρια. Επίσης x(k) συγκλίνει στο x = A−1 b σε n το πολύ βήματα.
Απόδειξη. Θα δείξουμε καταρχάς ότι οι δύο παραπάνω ιδιότητες 1-2 είναι ισοδύναμες και ορίζουν με μοναδικό
τρόπο το x(k+1) . Για κάθε y ∈ Kk , θέτουμε
1
g(y) = f (x(0) + y) = (Ay, y) − (r(0) , y) + f (x(0) ).
2
Το να ελαχιστοποιήσουμε τη f (x) στο [x(0) + Kk ] είναι ισοδύναμο με το ελαχιστοποιήσουμε την g στο Kk .
Σύμφωνα με την Παρατήρηση 3.7, η g λαμβάνει ένα μοναδικό ελάχιστο στο Kk το οποίο συμβολίζουμε με
x(k+1) − x(0) . Συνεπώς η δεύτερη ιδιότητα ορίζει με μοναδικό τρόπο το x(k+1) .
Επιπλέον, από την Παρατήρηση 3.7 έχουμε ότι
(Ax(k+1) − b, y) = 0, ∀y ∈ Kk ,
οπότε r(k+1) ⊥ Kk . Άρα οι ιδιότητες 1-2 είναι ισοδύναμες.
Θέλουμε ακόμα να δείξουμε ότι ολοκληρώνεται σε n το πολύ βήματα. Αν η κρίσιμη διάσταση του χώρου
Kk , k0 είναι ίση με n − 1, τότε dim Kk0 = n και ο χώρος [x(0) + Kk0 ] ταυτίζεται με τον Rn . Επιπλέον
x(k0 +1) = x(n) είναι το ελάχιστο της f στο Rn και σύμφωνα με τo Θεώρημα 3.10, Ax(n) = b. Συνεπώς η
μέθοδος θα έχει ολοκληρωθεί σε n βήματα.
Αν τώρα k0 < n − 1, τότε για κάθε k ≥ k0 , dim Kk = k0 + 1. Οπότε Ak0 +1 r(0) ∈ Kk0 και άρα
υπάρχουν σταθερές ai , i = 0, . . . , k0 , τέτοιες ώστε
X
k0
k0 +1 (0)
A r = ai Ai r(0)
i=0
Είναι απλό να δούμε ότι η σταθερά a0 6= 0, γιατί διαφορετικά θα είχαμε ότι Ak0 r(0) ∈ Kk0 −1 , οπότε
Kk0 = Kk0 −1 το οποίο είναι άτοπο, σύμφωνα με τον ορισμό της κρίσιμης διάστασης k0 . Χρησιμοποιώντας
τώρα το γεγονός ότι r(0) = b − Ax(0) έχουμε
1 k0 (0) X 0 k
ai i−1 (0)
A( A r − A r + x(0) ) = b.
a0 a
i=1 0
56 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ
Οπότε βλέπουμε ότι η λύση του Ax = b ανήκει στον χώρο [x(0) + Kk0 ]. Συνεπώς με την k0 + 1 επανάληψη,
όπου παίρνουμε το ελάχιστο της f στο [x(0) + Kk0 ], παίρνουμε και το ελάχιστο στο Rn , δηλαδή τη λύση του
Ax = b. Οπότε η μέθοδος έχει ολοκληρωθεί σε k0 + 1 ≤ n βήματα.
Θεώρημα 3.14. Έστω A ∈ Rn×n συμμετρικός και θετικά ορισμένος και (x(k) )k≥0 ⊂ Rn οι προσεγγίσεις με τη
μέθοδο των συζυγών κλίσεων και (r(k) )k≥0 ⊂ Rn η ακολουθία των αντίστοιχων υπολοίπων, r(k) = b − Ax(k)
και d(k) = x(k+1) − x(k) . Τότε
1. Ο χώρος Krylov Kk ο οποίος ορίζεται Kk = span{r(0) , Ar(0) , . . . , Ak r(0) } ικανοποιεί
Απόδειξη. Εξετάζουμε πρώτα την περίπτωση όπου k ≥ k0 + 1, οπότε θα έχουμε r(k) = 0 και x(k) =
x(k0 +1) , δηλαδή d(k) = 0. Οπότε r(k) είναι ορθογώνια ως προς το εσωτερικό γινόμενο (·, ·) και τα d(k) είναι
ορθογώνια ως προς (A·, ·), δηλαδήA-ορθογώνια για k ≥ k0 + 1.
Αν k ≤ k0 , από τον ορισμό της ακολουθίας των συζυγών κλίσεων, r(k+1) ∈ Kk+1 και r(k+1) ⊥Kk .
Επίσης Kk ⊂ Kk+1 , dim Kk = k + 1 για k ≤ k0 . Άρα η οικογένεια (r(k) )0≤k≤k0 είναι ορθογώνια. Οπότε
Kk = span{r(0) , r(1) , . . . , r (k) }, k ≥ 0. Επίσης αφού d(k) = x(k+1) − x(k) , με x(k+1) ∈ [x(0) + Kk ],
x(k) ∈ [x(0) + Kk−1 ], έχουμε d(k) ∈ Kk , k ≥ 1. Άρα span{d(0) , d(1) , . . . , d(k) } ⊂ Kk .
Για να δείξουμε ότι τα d(k) είναι A-ορθογώνια, παρατηρούμε
Αυτό γιατί d(j) ∈ Kj = span{r(0) , r(1) , . . . , r (j) } και τα r(0) , . . . , r (k+1) είναι ορθογώνια. Επίσης d(k) 6=
0 για k ≤ k0 , διαφορετικά θα έχουμε x(k+1) = x(k) και αντίστοιχα r(k+1) = r(k) 6= 0 το οποίο ισχύει γιατί
r(k+1) ∈ Kk+1 και r(k+1) ⊥Kk . Μια ορθογώνια οικογένεια μη μηδενικών διανυσμάτων θα είναι γραμμικά
ανεξάρτητη, άρα Kk = span{d(0) , d(1) , . . . , d(k) }.
Λήμμα 3.6. Έστω (a(i) ), 1 ≤ i ≤ p, μια οικογένεια γραμμικών ανεξάρτητων διανυσμάτων του Rn , (b(i) ) και
(c(i) ), 1 ≤ i ≤ p, δύο ορθογώνιες οικογένειες ως προς το ίδιο εσωτερικό γινόμενο του Rn τέτοιες ώστε για κάθε
1 ≤ i ≤ p,
Αφού τα {a(1) , . . . , a(p) } είναι γραμμικώς ανεξάρτητα, τα (b(i) ) και (c(i) ), 1 ≤ i ≤ p, δεν μπορεί να είναι
μηδέν. Οπότε θεωρούμε τις ορθοκανονικές οικογένειες (b(i) /kb(i) k) και (c(i) /kc(i) k), 1 ≤ i ≤ p. Αυτές
σύμφωνα με το Θεώρημα 2.7 θα διαφέρουν το πολύ ως προς το πρόσημο κάθε στοιχείου, δηλαδή b(i) /kb(i) k =
±c(i) /kc(i) k. Συνεπώς τα b(i) και c(i) είναι παράλληλα.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 57
Θεώρημα 3.15. Έστω A ∈ Rn×n συμμετρικός και θετικά ορισμένος και (x(k) )k≥0 ⊂ Rn οι προσεγγίσεις με τη
μέθοδο των συζυγών κλίσεων και (r(k) )k≥0 ⊂ Rn η ακολουθία των αντίστοιχων υπολοίπων, r(k) = b − Ax(k) .
Τότε υπάρχει μια ακολουθία (p(k) )k≥0 ⊂ Rn τα οποία είναι A-ορθογώνια ανά δύο και ορίζονται σύμφωνα με τον
ακόλουθο αναδρομικό τύπο
x
(k+1)
= x(k) + αk p(k) ,
p(0) = r(0) = b − Ax(0) , r(k+1) = r(k) − αk Ap(k) , για 0 ≤ k ≤ k0 , (3.81)
(k+1)
p = r(k+1) + βk p(k) ,
με
kr(k) k22 kr(k+1) k22
αk = και βk = .
(Ap(k) , p(k) ) kr(k) k2
Αν τώρα (x(k) , r(k) , p(k) ) οι τρεις ακολουθίες που ορίζονται από τις παραπάνω σχέσεις, τότε η (x(k) )k≥0 ⊂ Rn
είναι η ακολουθία των προσεγγίσεων με τη μέθοδο των συζυγών κλίσεων.
Απόδειξη. Αν η ακολουθία (x(k) ) που ορίζεται αναδρομικά από τις (3.81) είναι η ακολουθία των συζυγών
κλίσεων που δίνεται από το Θεώρημα 3.13, τότε x(k) = x(k0 +1) και r(k) = 0, για κάθε k ≥ k0 + 1.
Θέτουμε k0 να είναι ο μικρότερος δείκτης για τον οποίο r(k0 +1) = 0 και εύκολα παρατηρούμε ότι για
k ≥ k0 + 1, x(k) = x(k0 +1) και p(k) = r(k) = 0. Επομένως στην απόδειξη περιοριζόμαστε για k ≤ k0 .
Έστω τώρα (x(k) ) η ακολουθία των προσεγγίσεων με τη μέθοδο των συζυγών κλίσεων του Θεωρήματος
3.13. Θα δείξουμε επαγωγικά ότι ικανοποιεί τις σχέσεις της εκφώνησης.
Κατασκευάζουμε μια ακολουθία γραμμικών ανεξάρτητων διανυσμάτων, ορθογώνιων ως προς το εσωτερικό
γινόμενο (A·, ·) εφαρμόζοντας τον αλγόριθμο Gramm-Schmidt για τα διανύσματα r(k) . Επομένως
X
k−1
p(k) = r(k) + βj,k p(j) , (3.82)
j=0
με
(Ar(k) , p(j) )
βj,k = − . (3.83)
(Ap(j) , p(j) )
Σύμφωνα με το Θεώρημα 3.14, η ακολουθία d(k) = x(k+1) − x(k) είναι A− ορθογώνια. Από το Λήμμα 3.6
έχουμε ότι εφόσον οι ακολουθίες p(k) και d(k) = x(k+1) − x(k) είναι A− ορθογώνιες για 0 ≤ k ≤ k0 θα
υπάρχει μια σταθερά αk τέτοια ώστε
Επειδή η ακολουθία r(k) είναι ορθογώνια, και χρησιμοποιώντας τις (3.83) και (3.85) παίρνουμε
0, για 0 ≤ j ≤ k − 2,
βj,k = kr k2
(k) 2
, για j = k − 1.
αk−1 (Ap(k−1) , p(k−1) )
Επομένως ισχύει
p(k) = r(k) + βk−1 p(k−1) , (3.86)
58 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ
Άρα έχουμε δείξει επαγωγικά τις σχέσεις (3.81). Για να ολοκληρώσουμε την απόδειξη του θεωρήματος χρειά-
ζεται να βρούμε την τιμή του αk .
Επειδή το r(k+1) είναι ορθογώνιο ως προς το r(k) έχουμε ότι
Οπότε λόγω της (3.86), και της A-ορθογωνιότητας των p(k) , p(k−1) ,
Επομένως
kr(k) k2
αk = , (3.90)
(Ap(k) , r(k) )
και παρόμοια
kr(k) k2
βk = . (3.91)
kr(k−1) k2
Μένει να δείξουμε το αντίστροφο. Υποθέτουμε ότι υπάρχουν οι τρεις ακολουθίες (x(k) , r(k) , p(k) ) που
ορίζονται από τις σχέσεις (3.81). Χρησιμοποιώντας επαγωγή εύκολα βλέπουμε ότι r(k+1) = b − Ax(k+1) .
Πράγματι, λόγω των (3.81) έχουμε ότι r(0) = b − Ax(0) . Επιπλέον, αν υποθέσουμε ότι r(k) = b − Ax(k) ,
τότε λόγω των (3.81) ισχύει ότι
Επίσης μπορούμε να δείξουμε επαγωγικά ότι p(k) , r(k) ∈ Kk . Από τις (3.81) έχουμε ότι x(k+1) = x(k) +
αk p(k) οπότε εύκολα προκύπτει ότι x(k+1) ∈ [x(0) + Kk ]. Για να δείξουμε τέλος οτι η ακολουθία (xk ) είναι
αυτή που δίνεται από τη μέθοδο συζυγών κλίσεων αρκεί να δείξουμε ότι r(k+1) είναι ορθογώνιο ως προς το
Kk , σύμφωνα με τον ορισμό της μεθόδου, βλέπε Θεώρημα 3.13.
Θα δείξουμε επαγωγικά ότι r(k+1) είναι ορθογώνιο στα r(j) , j = 0, . . . , k και ότι (Ap(k+1) , p(j) ) = 0,
kr(0) k2
j = 0, . . . , k. Από τις (3.81) έχουμε ότι α0 = οπότε
(Ap(0) , p(0) )
kr(1) k2
Επίσης, επειδή r(1) = r(0) − α0 Ap(0) , (r(1) , r(0) ) = 0 και β0 = , παίρνουμε
kr(0) k2
1
(Ap(1) , p(0) ) = ((r(1) + β0 p(0) , Ap(0) ) = ((r(1) + β0 p(0) , r(1) − r(0) ) = 0.
α0
Υποθέτουμε τώρα ότι
Θα δείξουμε ότι
(r(k+1) , r(j) ) = 0 και (Ap(k+1) , p(j) ) = 0, j = 0, . . . , k.
Λόγω των (3.81) έχουμε r(j) = p(j) − βj−1 p(j−1) οπότε
(r(k+1) , r(j) ) = (r(k) , r(j) )−αk (Ap(k) , r(j) ) = (r(k) , r(j) )−αk (Ap(k) , p(j) )+αk βj−1 (Ap(k) , p(j−1) ).
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 59
Συνεπώς από την επαγωγική υπόθεση έχουμε ότι (r(k+1) , r(j) ) = 0, για j = 0, . . . , k − 1. Επίσης λόγω
του ορισμού του αk
(r(k+1) , r(k) ) = (r(k) , r(k) ) − αk (Ap(k) , p(k) ) + αk βj−1 (Ap(k) , p(k−1) )
= (r(k) , r(k) ) − αk (Ap(k) , p(k) ) = 0.
Ακόμα, έχουμε ότι
(Ap(k+1) , p(j) ) = (p(k+1) , Ap(j) ) = (r(k+1) + βk p(k) , Ap(j) ),
και επειδή Ap(j) = (r(j) − r(j+1) )/αj παίρνουμε
1 (k+1) (j)
(Ap(k+1) , p(j) ) = (r , r − r(j+1) ) + bek (p(k) , Ap(j) ).
αj
Επομένως λόγω της επαγωγικής υπόθεσης για j = 0, . . . , k − 1, έχουμε (Ap(k+1) , p(j) ) = 0. Επίσης
εύκολα βλέπουμε ότι (Ap(k+1) , p(k) ) = 0. Συνεπώς έχουμε ολοκληρώσει την επαγωγή.
Τέλος, αφού τα r(k) είναι ορθογώνια, είναι και γραμμικά ανεξάρτητα, και παίρνουμε ότι x(k+1) ∈ [x(0) +
Kk ] και r(k+1) ⊥ Kk , δηλαδή ότι η ακολουθία x(k) είναι αυτή που δίνει η μέθοδος συζυγών κλίσεων.
Το αντικείμενο αυτού του κεφαλαίου υπάρχει πιο αναλυτικά σε πολλά βιβλία Αριθμητικής Γραμμικής Άλ-
γεβρας. Παραθέτουμε κάποιες αναφορές τις οποίες ο αναγνώστης μπορεί να συμβουλευτεί: [1], [2], [3], [4],
[5], [6], [8].
3.5 Ασκήσεις
x = B(θ)x + g(θ).
2. Βρείτε για ποιες τιμές του θ η μέθοδος συγκλίνει καθώς και τη βέλτιστη τιμή θ για την οποία
έχουμε την ταχύτερη σύγκλιση.
3.5.4 Έστω
1 α α
A = α 1 α .
α α 1
Δείξτε ότι για 1 ≤ 2α < 2 η μέθοδος Gauss-Seidel συγκλίνει ενώ η Jacobi αποκλίνει.
Να εξεταστούν ως προς τη σύγκλιση οι αντίστοιχες μέθοδοι Jacobi και Gauss-Seidel και να εκτελε-
στούν δύο επαναλήψεις καθεμιάς με αρχικό διάνυσμα x(0) = (1, 1, 1)T .
3.5.11 1. Να αποδειχθεί ότι ο επαναληπτικός πίνακας της μεθόδου Gauss-Seidel έχει τουλάχιστον μια
ιδιοτιμή ίση με το μηδέν.
2. Να αποδειχθεί ότι αν ο επαναληπτικός πίνακας της μεθόδου Gauss-Seidel έχει μια ιδιοτιμή ίση
με τη μονάδα, τότε ο αρχικός πίνακας A του γραμμικού συστήματος είναι μ h αντιστρέψιμος.
1. Δείξτε ότι η μέθοδος Jacobi συγκλίνει χωρίς να βρείτε τις ιδιοτιμές του πίνακα επανάληψης.
2. Να εκτελέσετε μια επανάληψη της μεθόδου SOR με ω = 1.25 και x(0) = (1, 1, 1)T .
62 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ
3.5.17 Έστω A ∈ Rn×n ένας θετικά ορισμένος και συμμετρικός πίνακας και f (x) = 12 (Ax, x) − (b, x),
x ∈ Rn . Αν x(0) ∈ Rn και r = b − Ax(0) , τότε δείξτε η συνάρτηση g : R → R, με g(α) =
krk2
f (x(0) + αr) λαμβάνει ελάχιστη τιμή στο α0 = .
(Ar, r)
3.5.18 Δείξτε ότι δύο διαδοχικά υπόλοιπα της μεθόδου απότομης καθόδου για τη λύση του Ax = b είναι
ορθογώνια, δηλαδή (r(k) , r(k+1) ) = 0, k ≥ 0. Επίσης ότι τα διανύσματα x(k+1) −x(k) , x(k) −x(k−1)
είναι ορθογώνια.
Βιβλιογραφία
[1] G. Allaire και S. M. Kaber. Numerical Linear Algebra. English. Τόμ. 55. Texts Appl. Math. New York,
NY: Springer, 2008. isbn: 978-0-387-34159-0. doi: 10.1007/978‐0‐387‐68918‐0.
[2] Å. Björck. Numerical Methods in Matrix Computations. English. Τόμ. 59. Texts Appl. Math. Cham:
Springer, 2015. isbn: 978-3-319-05088-1. doi: 10.1007/978‐3‐319‐05089‐8.
[3] P. G. Ciarlet. Introduction to Numerical Linear Algebra and Optimization. English. Camb. Texts Appl.
Math. Cambridge etc.: Cambridge University Press, 1988. isbn: 0-521-33984-7.
[4] G. H. Golub και C. F. Van Loan. Matrix computations. English. Baltimore, MD: The Johns Hopkins
University Press, 2013, σσ. xxi + 756. isbn: 978-1-4214-0794-4.
[5] L. N. Trefethen και D. Bau. Numerical Linear Algebra. English. Philadelphia, PA: SIAM, 2000. isbn:
0-89871-487-7.
[6] Γ. Δ. Ακρίβης και B. A. Δουγαλής. Εισαγωγή στην Αριθμητική Ανάλυση. Πανεπιστημιακές Εκδόσεις
Κρήτης, 2017.
[7] Δ. Βάρσος κ.ά. Μια Εισαγωγή στη Γραμμική Άλγεβρα. Greek. Εκδόσεις “Σοφία”, 2012.
[8] B. A. Δουγαλής, Δ. Νούτσος και Α. Χατζηδήμος. Αριθμητική Γραμμική Άλγεβρα. Ιωάννινα: Τμήμα Μα-
θηματικών, Πανεπιστήμιο Ιωαννίνων, 2016.
ΚΕΦΑΛΑΙΟ 4
ΕΛΑΧΙΣΤΑ ΤΕΤΡΑΓΩΝΑ
Περίληψη
Αν A ∈ Rm×n με m > n, το γραμμικό σύστημα Ax = b με b ∈ Rm δεν έχει λύση εκτός και αν το b
ανήκει στο πεδίο τιμών του τελεστή A το οποίο είναι γνήσιο υποσύνολο του Rm . Έτσι αναζητούμε εκείνα τα
x για τα οποία το Ax είναι όσο το δυνατόν «πιο κοντά» στο b. Εξετάζουμε δηλαδή τη λύση του προβλήματος
ελαχιστοποίησης
kb − Axk = minn kb − Azk,
z∈R
Προαπαιτούμενη γνώση: Βασικές γνώσεις Γραμμικής Άλγεβρας. Διανυσματικοί χώροι. Εσωτερικό γινόμενο
σε διανυσματικούς χώρους. Νόρμες πινάκων και διανυσμάτων. Ιδιοτιμές και ιδιοδιανύσματα πινάκων. Μέγι-
στο και ελάχιστο διανυσματικών συναρτήσεων.
x ∈ X ⇐⇒ AT (b − Ax) = 0. (4.1)
To Xείναι κυρτό σύνολο. (4.2)
Υπάρχει μοναδικό xLS στοιχείο του Xμε ελάχιστη 2-νόρμα. (4.3)
X = {xLS } ⇐⇒ rank(A) = n. (4.4)
από την οποία προκύπτει εύκολα ο πρώτος ισχυρισμός του θεωρήματος. Πράγματι, αν x ∈ Rn είναι λύση
του προβλήματος ελαχίστων τετραγώνων, τότε αναγκαστικά AT (Ax − b) = 0. Διαφορετικά, αν w =
−AT (Ax − b) 6= 0 και α αρκετά μικρό παίρνουμε την αντιφατική ανισότητα kA(x + αw) − bk2 <
kAx − bk2 .
Ορίζουμε τώρα την απεικόνιση ϕ : X → R με ϕ(x) = kAx − bk22 . Δείχνουμε ότι η ϕ είναι κυρτή,
δηλαδή ότι ϕ(tx + (1 − t)y) ≤ tϕ(x) + (1 − t)ϕ(y) για κάθε t ∈ [0, 1] και x, y ∈ X. Γράφουμε
ϕ(tx + (1 − t)y) = kt(Ax − b) + (1 − t)(Ay − b)k22 έτσι ώστε μετά από λίγες πράξεις
x+y
2
1 1 1 1
= kxk22 + kyk22 + xT y = kxk22 + xT y.
2 2 4 2 2 2
Από την ανισότητα Cauchy–Schwartz και το γεγονός ότι x, y είναι γραμμικά ανεξάρτητα έχουμε
2
x+y 1 1
< kxk22 + kxk2 k yk2 = kxk22 ,
2 2 2 2
δηλαδή k(x + y)/2k2 < minz∈X kzk2 , το οποίο είναι προφανώς αδύνατο. Συνεπώς υπάρχει μοναδικό
στοιχείο του X με ελάχιστη 2-νόρμα. Τέλος η σχέση (4.4) προκύπτει εύκολα από το Λήμμα 1.15.
Παρατήρηση. Από το Θεώρημα 4.1 συμπεραίνουμε ότι το x ∈ Rn είναι λύση του προβλήματος ελαχίστων
τετραγώνων αν και μόνο αν
AT (b − Ax) = 0. (4.5)
Το σύστημα (4.5) ονομάζεται σύστημα των κανονικών εξισώσεων. Ο πίνακας του συστήματος των κανονικών
εξισώσεων AT A ∈ Rn×n είναι συμμετρικός και θετικά ημι-ορισμένος γιατί
Ακόμα, AT b ∈ R(AT ) = R(AT A), όπου R(A) είναι η εικόνα του πίνακα A, άρα το σύστημα των κανο-
νικών εξισώσεων έχει τουλάχιστον μία λύση. Αν rank(A) = n, τότε ο πίνακας AT A είναι θετικά ορισμένος
όπως εύκολα βλέπουμε χρησιμοποιώντας το Λήμμα 1.15. Σε αυτήν την περίπτωση η λύση του προβλήματος
των ελαχίστων τετραγώνων είναι x = (AT A)−1 AT b.
¹Υποθέτουμε ότι 0 6∈ X, διαφορετικά αυτό είναι το στοιχείο με την ελάχιστη 2-νόρμα.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 65
Θα γράψουμε τη λύση του προβλήματος ελαχίστων τετραγώνων χρησιμοποιώντας την ανάλυση SVD του
πίνακα A. Αν rank(A) = r έχουμε, εξ’ ορισμού, ότι σ1 ≥ · · · ≥ σr > 0. Αν τώρα Σr = diag(σ1 , . . . , σr ),
Σr 0
A=U VT
0 0
με Ur = [u1 , . . . , ur ] ∈ Rm×r και Vr = [v1 , . . . , vr ] ∈ Rn×r . Αν x είναι λύση του προβλήματος ελαχί-
στων τετραγώνων τότε
Σr 0 Σr VrT x − UrT b
Ax − b = U V x−b=U
T
.
0 0 −Um−rT
b
Ο δεύτερος όρος στο παραπάνω άθροισμα είναι ανεξάρτητος του x και επομένως το άθροισμα ελαχιστοποιεί-
ται όταν ο πρώτος όρος είναι ίσος με μηδέν. Αν γράψουμε
T
T Vr x y
V x= T = ,
Vn−r x z
βλέπουμε ότι μπορούμε να εκφράσουμε τη λύση του προβλήματος ελαχίστων τετραγώνων στη μορφή x =
Vr Σ−1
r Ur b + Vn−r z. Όμως Vn−r z ∈ N (A) για κάθε z ∈ R
T n−r
, συνεπώς οι λύσεις του προβλήματος
ελαχίστων τετραγώνων είναι της μορφής
−1
−1 T Σr 0
x = Vr Σr Ur b + Vn−r z = V U T b + Vn−r z, z ∈ Rn−r .
0 0
ονομάζεται ψευδο-αντίστροφος ή αντίστροφος κατά Moore-Penrose του A, δείτε, π.χ. [5], [6].
• Αν A ∈ Rm×n με rank(A) = m, τότε A† = AT (AAT )−1 . Αυτό σημαίνει ότι AA† = Im , άρα ο
A† είναι δεξιός αντίστροφος του A.
66 ΕΛΑΧΙΣΤΑ ΤΕΤΡΑΓΩΝΑ
Μπορούμε τώρα να εκφράσουμε τη λύση του προβλήματος ελαχίστων τετραγώνων χρησιμοποιώντας τον
ψευδο-αντίστροφο.
1. Οι λύσεις του προβλήματος ελαχίστων τετραγώνων είναι της μορφής x = A† b + q, όπου q ∈ N (A).
2. Όλες οι λύσεις του προβλήματος ελαχίστων τετραγώνων έχουν το ίδιο υπόλοιπο Ay − b = (I − AA† )b.
Έστω τώρα A ∈ Rm×n με m ≥ n. Αν b ∈ Rm το σύστημα Ax = b μπορεί να μην έχει πάντοτε λύση και
ακόμα όταν υπάρχει λύση αυτή μπορεί να μην είναι μοναδική. Για παράδειγμα, το σύστημα Ax = b με
1 b1
A = 1 , b = b 2 ,
1 b3
Ορισμός 4.2. Έστω A ∈ Rm×n . Οι στήλες του A είναι γραμμικά ανεξάρτητες αν Ax = 0 συνεπάγεται
x = 0. Αν το σύστημα Ax = 0 έχει άπειρες λύσεις, τότε οι στήλες του A είναι γραμμικά εξαρτημένες.
• Το μηδενικό διάνυσμα είναι γραμμικά εξαρτημένο, ενώ κάθε μη μηδενικό διάνυσμα x ∈ Rn είναι
γραμμικά ανεξάρτητο.
Βήμα 1. Αν n = 1, τότε Q είναι ένας ορθογώνιος πίνακας (γινόμενο μετασχηματισμών Givens) που μηδε-
νίζουν τα στοιχεία στις θέσεις 2, . . . , m, του πίνακα A και R = kAk2 .
Βήμα 2. Αν n > 1 τότε, όπως στην ανάλυση QR για τετραγωνικούς πίνακες, προσδιορίζουμε Qm ∈ Rm×m
ορθογώνιο ο οποίος μηδενίζει τα στοιχεία στις γραμμές 2, . . . , m, της πρώτης στήλης του A, δηλαδή
T r11 rT
Qm A = ,
0 Â
Βήμα 4. Τότε,
1 0 r11 rT
Q = Qm , R= .
0 Qm−1 0 Rn−1
Μπορούμε τώρα να αποδείξουμε:
R
Λήμμα 4.2. ΄Εστω A ∈ R m×n
, m ≥ n και A = Q με Q ∈ Rm×m ορθογώνιο και R ∈ Rn×n άνω
0
τριγωνικό. Τότε, ο A έχει γραμμικά ανεξάρτητες στήλες αν και μόνο αν ο R έχει μη μηδενικά διαγώνια στοιχεία.
R
Απόδειξη. Αφού ο Q είναι αντιστρέψιμος, Ax = Q x = 0 συνεπάγεται ότι x = 0 αν και μόνο αν η
0
σχέση Rx = 0 συνεπάγεται ότι x = 0. Επειδή ο R είναι άνω τριγωνικός, αυτό συμβαίνει αν και μόνο αν τα
διαγώνια στοιχεία του είναι μη μηδενικά.
Λήμμα 4.3. («Οικονομική» ανάλυση QR) ΄Εστω A ∈ Rm×n , m ≥ n. Υπάρχει Q1 ∈ Rm×n με QT1 Q = In
και άνω τριγωνικός πίνακας R ∈ Rn×n με μη αρνητικά διαγώνια στοιχεία τέτοιοι ώστε A = Q1 R.
R
Απόδειξη. Έστω A = Q η ανάλυση QR του A από το Λήμμα 4.2. Γράφουμε Q = Q1 Q2 με
0
Q1 ∈ R m×n
. Τότε προφανώς A = Q1 R.
Λύση του προβλήματος ελαχίστων τετραγώνων με την ανάλυση QR.
΄Εστω A ∈ Rm×nκαι b ∈ Rm . Ξέρουμε από το Λήμμα 4.2 ότι αν A ∈ Rm×n με m ≥ n, τότε μπορούμε
R
να γράψουμε A = Q με Q ∈ Rm×m ορθογώνιο και R ∈ Rn×n άνω τριγωνικό. Χρησιμοποιώντας το
0
T c
γεγονός ότι η 2-νόρμα είναι αναλλοίωτη κάτω από ορθογώνιους μετασχηματισμούς έχουμε, με Q b = ,
d
για οποιοδήποτε x ∈ Rn . Αν rank(A) = rank(R) = n, τότε η μοναδική λύση του προβλήματος ελαχίστων
τετραγώνων είναι η λύση του άνω τριγωνικού συστήματος Rx = c με υπόλοιπο kAx−bk22 = kdk22 . Έχουμε
ήδη δει ότι ο υπολογισμός της ανάλυσης QR μπορεί να γίνει με χρήση των μετασχηματισμών Givens. Άλλοι
τρόποι υπολογισμού της ανάλυσης QR, βλ. π.χ. [5], περιλαμβάνουν τους μετασχηματισμούς Householder,
τους οποίους περιγράφουμε παρακάτω.
Μετασχηματισμοί Householder.
Έστω v ∈ Rn ένα μη μηδενικό διάνυσμα. Ένας n × n πίνακας της μορφής
P = I − 2vv T /v T v, (4.6)
ονομάζεται μετασχηματισμός Householder. Όπως και οι μετασχηματισμοί Givens, βρίσκουν χρησιμότητα
στην εισαγωγή μηδενικών στοιχείων σε συγκεκριμένες θέσεις διανυσμάτων ή πινάκων. Αν, για παράδειγμα,
θέλουμε το διάνυσμα P x να είναι πολλαπλάσιο του μοναδιαίου διανύσματος e1 τότε επειδή
2v T x
Px = x − v,
vT v
είναι αρκετό να επιλέξουμε v = x + αe1 για κατάλληλο α ∈ R. Με αυτήν την επιλογή έχουμε
xT x + αx1 vT x
Px 1 − 2 T x − 2α T e1 ,
x x + 2αx1 + α2 v v
συνεπώς διαλέγουμε α ∈ R έτσι ώστε ο συντελεστής του x να είναι μηδέν. Αρκεί να πάρουμε α = ±kxk2 ,
έτσι ώστε v = x ± kxk2 e1 στη σχέση (4.6) και P x = ±kxk2 e1 . Για την επιλογή του προσήμου σκεφτόμα-
στε ως εξής: Αν το x είναι σχεδόν πολλαπλάσιο του e1 τότε το διάνυσμα v = x − sign(x1 )kxk2 e1 έχει μικρή
νόρμα και επομένως περιμένουμε μεγάλα σχετικά σφάλματα στον υπολογισμό του όρου 2/v T v. Επιλέγουμε
λοιπόν
v = x + sign(x1 )kxk2 e1 ,
δηλαδή το πρόσημο του α να είναι αυτό του όρου x1 .
Παράδειγμα 4.1. Έστω x = (1, 7, 2, 3, −1)T . Έχουμε kxk2 = 8, συνεπώς με
v = x + 8e1 = (9, 7, 2, 3, −1)T
παίρνουμε
−9 −63 −18 −27 9
−63 13 −14 −21 7
1
P = I − 2vv T /v T v = −18 −14 68 −6 2
72
−27 −21 −6
63 3
9 7 2 3 71
και, βέβαια, P x = (−7, 0, 0, 0, 0)T .
Είναι φανερό ότι ο πίνακας P στη σχέση (4.6) είναι συμμετρικός και ορθογώνιος. Επειδή
2 2
PA = I − T A = A − T v(AT v)T , A ∈ Rn×n ,
v v v v
δεν είναι ποτέ απαραίτητο να υπολογίσουμε τον πίνακα P αν, βέβαια, το διάνυσμα v και ο πραγματικός αριθ-
μός 2/v T v είναι διαθέσιμοι. Είμαστε τώρα σε θέση να περιγράψουμε τον αλγόριθμο υπολογισμού της ανά-
λυσης QR: Για k = 1, . . . , n, προσδιορίζουμε έναν πίνακα Householder Pk τάξης m − k + 1 τέτοιον ώστε
Pk [akk , . . . , amk ]T = [rkk , . . . , 0]T και θέτουμε A = diag(Ik−1 , Pk )A. Έτσι, οι στήλες του άνω τρι-
γώνου του A περιέχουν τις στήλες του πίνακα R. Για να λύσουμε το πρόβλημα των ελαχίστων τετραγώνων
εφαρμόζουμε διαδοχικά τους πίνακες Householder στο δεξιό μέλος b και λύνουμε ένα άνω τριγωνικό σύστημα
με πίνακα R και δεξί μέλος b (τις πρώτες n συνιστώσες του).
Το αντικείμενο αυτού του κεφαλαίου υπάρχει πιο αναλυτικά σε πολλά βιβλία Αριθμητικής Βελτιστοποίη-
σης. Παραθέτουμε κάποιες αναφορές τις οποίες ο αναγνώστης μπορεί να συμβουλευτεί: [1], [2], [3], [4],
[5], [7].
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 69
4.3 Ασκήσεις
4.3.1 Έστω x = (1, 2, 3, 4)T . Βρείτε τον μετασχηματισμό Givens Q έτσι ώστε η τελευταία συνιστώσα του
Qx να είναι ίση με μηδέν.
4.3.2 Βρείτε την ανάλυση QR του πίνακα
5 9
.
12 7
4.3.3 Έστω A = QR η «οικονομική» ανάλυση QR του πίνακα A ∈ Rm×n με m ≥ n. Αποδείξτε ότι
kAk2 = kRk2 .
4.3.4 Έστω ϕ : Rn → R με ϕ(x) = 12 kAx − bk22 . Αποδείξτε ότι ∇ϕ(x) = AT (Ax − b).
4.3.5 Έστω A ένας m × n πίνακας της μορφής
A1
A=
A2
όπου A1 είναι ένας αντιστρέψιμος πίνακας n × n και A2 ένας πίνακας (m − n) × n. Δείξτε ότι
kA† k2 ≤ kA−11 k2 .
Βιβλιογραφία
[1] G. Allaire και S. M. Kaber. Numerical Linear Algebra. English. Τόμ. 55. Texts Appl. Math. New York,
NY: Springer, 2008. isbn: 978-0-387-34159-0. doi: 10.1007/978‐0‐387‐68918‐0.
[2] Å. Björck. Numerical Methods in Matrix Computations. English. Τόμ. 59. Texts Appl. Math. Cham:
Springer, 2015. isbn: 978-3-319-05088-1. doi: 10.1007/978‐3‐319‐05089‐8.
[3] P. G. Ciarlet. Introduction to Numerical Linear Algebra and Optimization. English. Camb. Texts Appl.
Math. Cambridge etc.: Cambridge University Press, 1988. isbn: 0-521-33984-7.
[4] J. E. Dennis και R. B. Schnabel. Numerical Methods for Unconstrained Optimization and Nonlinear
Equations. English. Τόμ. 16. Philadelphia, PA: SIAM, 1996, σσ. xv + 378.
[5] G. H. Golub και C. F. Van Loan. Matrix computations. English. Baltimore, MD: The Johns Hopkins
University Press, 2013, σσ. xxi + 756. isbn: 978-1-4214-0794-4.
[6] Γ. Δ. Ακρίβης και B. A. Δουγαλής. Εισαγωγή στην Αριθμητική Ανάλυση. Πανεπιστημιακές Εκδόσεις
Κρήτης, 2017.
[7] B. A. Δουγαλής, Δ. Νούτσος και Α. Χατζηδήμος. Αριθμητική Γραμμική Άλγεβρα. Ιωάννινα: Τμήμα Μα-
θηματικών, Πανεπιστήμιο Ιωαννίνων, 2016.
ΚΕΦΑΛΑΙΟ 5
ΠΡΟΒΛΗΜΑΤΑ ΙΔΙΟΤΙΜΩΝ
Περίληψη
Ασχολούμαστε με το πρόβλημα των ιδιοτιμών για γενικούς, μιγαδικούς πίνακες. Συζητάμε τον εντοπισμό
των ιδιοτιμών μέσω των δίσκων του Gershgorin και την ευστάθεια του υπολογισμού τους ως προς μικρές
διαταραχές των στοιχείων τους. Παρουσιάζουμε τη μέθοδο των δυνάμεων και αναλύουμε τη σύγκλισή της.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Γραμμικής Άλγεβρας. Ιδιοτιμές και ιδιοδιανύσματα. Νόρμες δια-
νυσμάτων και πινάκων. Το θεώρημα Schur.
Έστω A ∈ Cn×n . Θυμόμαστε ότι λ ∈ C είναι ιδιοτιμή του πίνακα A αν υπάρχει μη μηδενικό διάνυσμα
x ∈ Cn τέτοιο ώστε Ax = λx. Θα συμβολίζουμε με σ(A) το σύνολο των ιδιοτιμών του πίνακα A. Αφού
(A − λI)x = 0 έχουμε ότι det(A − λI) = 0. Αν
είναι το χαρακτηριστικό πολυώνυμο του A, είναι προφανές ότι λ ∈ σ(A) αν και μόνο αν χA (λ) = 0. Συ-
νεπώς για να βρούμε τις ιδιοτιμές ενός πίνακα αρκεί να βρούμε τις ρίζες του χαρακτηριστικού πολυωνύμου
του. Η εύρεση όμως των ριζών ενός πολυωνύμου είναι, βέβαια, μια μη γραμμική διαδικασία και συνεπώς μπορεί
να γίνει μόνο με επαναληπτικές μεθόδους (εξαιρούμε τα πολυώνυμα μικρού βαθμού για τα οποία υπάρχουν
αναλυτικές εκφράσεις των ριζών τους). Εξαιτίας αυτού του γεγονότος, η εύρεση των ριζών του χαρακτηρι-
στικού πολυωνύμου ποτέ δεν αποτελεί τη βάση πρακτικών μεθόδων για την προσέγγιση των ιδιοτιμών ενός
πίνακα. Ένα δεύτερο πρόβλημα αποτελεί η ευαισθησία των ιδιοτιμών ενός πίνακα ως προς τις μεταβολές των
τότε είναι προφανές ότι σ(A) = {1, 2, . . . , 10}. Αν τώρα θεωρήσουμε τη διαταραχή Aϵ , 0 < ϵ 1, του
πίνακα A
1 20
2 20
... ...
Aϵ =
9 20
ϵ 10
τότε εύκολα βλέπουμε ότι kAϵ k ≈ kAk για όλες τις p-νόρμες που ορίσαμε στο Κεφάλαιο 1. Όμως,
2 20 20
.. .. 2 20
. .
det(Aϵ ) = det − ϵ det .. .. = 10! − 209 ϵ.
9 20 . .
10 9 20
Αυτό σημαίνει ότι για ϵ = 10!/209 ≈ 7 × 10−6 ο πίνακας Aϵ έχει μια μηδενική ιδιοτιμή! Θεωρούμε τέλος
τον πίνακα
c1 c2 · · · cn−1 cn
1 0 ... 0 0
..
.. .. ..
M = 0 . . . .
. .
.. .. 1 0 0
0 ··· 0 1 0
Βλέπουμε μέσω του πίνακα M ότι για κάθε πολυώνυμο μπορούμε να συσχετίσουμε ένα πρόβλημα ιδιοτιμών
και αντίστροφα. Αφού δεν υπάρχει άμεση μέθοδος για την εύρεση των ριζών πολυωνύμων τάξης μεγαλύτερης
του πέντε, δεν υπάρχει άμεση μέθοδος για τον υπολογισμό των ιδιοτιμών ενός πίνακα.
Υπάρχουν, βέβαια, πίνακες για τους οποίους οι ιδιοτιμές είναι εύκολο να υπολογιστούν, για παράδειγμα,
οι διαγώνιοι ή οι τριγωνικοί πίνακες. Γνωρίζουμε ακόμα, από το Θεώρημα 1.4, το θεώρημα Schur, ότι για
κάθε πίνακα A ∈ Cn×n υπάρχει μοναδιαίος πίνακας U ∈ Cn×n τέτοιος ώστε A = U T U H , όπου T εί-
ναι (άνω) τριγωνικός. Αν υπήρχε άμεση μέθοδος για τον υπολογισμό του πίνακα U , τότε θα μπορούσαμε
να βρούμε τις ιδιοτιμές του A (από τα διαγώνια στοιχεία του T ) σε πεπερασμένο αριθμό βημάτων, το οποίο
γνωρίζουμε ότι δεν είναι δυνατόν. Προτού αναφερθούμε σε πρακτικές, επαναληπτικές μεθόδους για την προ-
σέγγιση των ιδιοτιμών ενός πίνακα παρουσιάζουμε την ανισότητα του Gershgorin, ένα αποτέλεσμα αδρού
εντοπισμού ιδιοτιμών.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 73
Η ανισότητα του Gershgorin αποτελεί ένα αποτέλεσμα εντοπισμού των ιδιοτιμών ενός πίνακα στο μιγαδικό
επίπεδο. Αν A ∈ Cn×n γράφουμε
X
n
Di = {z ∈ C |z − aij | ≤ Ri }, Ri = |aij |, i = 1, . . . , n.
j=1
j̸=i
[
n
σ(A) ⊂ Di (5.1)
i=1
Απόδειξη. Έστω λ ιδιοτιμή του A και w ένα αντίστοιχο ιδιοδιάνυσμα. Έστω δείκτης k, 1 ≤ k ≤ n, τέτοιος
ώστε |wk | = max1≤i≤n |wi |. Προφανώς wk 6= 0, αφού w 6= 0 ως ιδιοδιάνυσμα που αντιστοιχεί στην
ιδιοτιμή λ. Από τη σχέση (A − λI)w = 0 έχουμε
X
n
0 = [(A − λI)w]k = (akk − λ)wk + akj wj ,
j=1
j̸=k
επομένως
X
n X
n
|akk − λ| |wk | ≤ |akj | |wj | ≤ |wk | |akj | = Rk |wk |.
j=1 j=1
j̸=k j̸=k
φαίνονται στο Σχήμα 5.1. Οι ιδιοτιμές του πίνακα σημειώνονται με μαύρες κουκίδες.
Έχουμε ήδη αναφέρει ότι οι μέθοδοι προσδιορισμού των ιδιοτιμών ενός πίνακα είναι επαναληπτικές. Έχοντας
υπ’ όψιν το θεώρημα του Schur, θα εξετάσουμε μεθόδους που βασίζονται σε μετασχηματισμούς του πίνακα με
κατάλληλους μετασχηματισμούς ομοιότητας: Ανάγουμε έναν αρχικό πίνακα A σ’ έναν «απλούστερο» πίνακα
B μέσω των μετασχηματισμών ομοιότητας:
A = A0 → A1 → · · · → Am = B,
74 ΠΡΟΒΛΗΜΑΤΑ ΙΔΙΟΤΙΜΩΝ
ℑz
−2 −1 0 1 2 4 ℜz
Η σχέση (5.3) λέει ότι μια μικρή μεταβολή k∆Bk/kBk στον B μπορεί να μεταβάλλει τις ιδιοτιμές τόσο όσο
και μια μεγάλη μεταβολή (κ(A))2 k∆Bk/kBk στον A, όταν ο δείκτης κατάστασης κ(P ) είναι μεγάλος.
Συνεπώς, επιδιώκουμε να επιλέγουμε τους πίνακες Pi , i = 1, . . . , m, των μετασχηματισμών ομοιότητας
έτσι ώστε να μην έχουν μεγάλο δείκτη κατάστασης, γιατί τότε
δεν θα είναι πολύ μεγάλος. Αν, για παράδειγμα, οι πίνακες Pi είναι ορθογώνιοι, τότε κ(Pi ) = 1, όπου κ(·)
είναι ο δείκτης κατάστασης ως προς τη νόρμα k · k2 , γιατί
τότε
1 0
..
.
1
Pi−1 =
... ,
−mi+1,i
.. ..
. .
0 −mn,i 0 1
και για τη νόρμα k · k∞ έχουμε κ(Pi ) ≤ 4.
Θεώρημα 5.2. Υποθέτουμε ότι ο A ∈ Cn×n είναι διαγωνοποιήσιμος, δηλαδή υπάρχει αντιστρέψιμος πίνακας
P ∈ Cn×n και διαγώνιος πίνακας D = diag(λ1 , . . . , λn ) τέτοιοι ώστε A = P DP −1 . Υποθέτουμε ότι
λ 6∈ σ(A) = {λ1 , . . . , λn } είναι ιδιοτιμή του διαταραγμένου πίνακα πίνακα A + ∆A, με ∆A ∈ Cn×n . Τότε
όπου k · k είναι μια φυσική νόρμα πινάκων και κ(·) είναι ο αντίστοιχος δείκτης κατάστασης.
Απόδειξη. Έστω x ∈ Cn m x 6= 0, ένα ιδιοδιάνυσμα που αντιστοιχεί στην ιδιοτιμή λ του πίνακα A + ∆A.
Από τη σχέση (A + ∆A)x = λx την οποία γράφουμε ισοδύναμα ως (λI − A)x = ∆Ax, έχουμε
P (λI − D) P −1 x = ∆A P P −1 x .
Παρατήρηση 5.1. Αν ο πίνακας A ∈ Cn×n είναι ερμιτιανός, τότε υπάρχει μοναδιαίος πίνακας P τέτοιος
ώστε A = P DP −1 με D = diag(λ1 , . . . , λn ), δείτε, για παράδειγμα, [3]. Όπως έχουμε δει, kP k2 = 1
και το προηγούμενο θεώρημα δίνει
min |λ − λi | ≤ k∆Ak2 .
1≤i≤n
76 ΠΡΟΒΛΗΜΑΤΑ ΙΔΙΟΤΙΜΩΝ
Το θεώρημα που ακολουθεί δείχνει ότι ο υπολογισμός ιδιοτιμών ερμιτιανών πινάκων είναι ευσταθής διαδι-
κασία ως προς διαταραχές των αντίστοιχων ιδιοδιανυσμάτων.
Θεώρημα 5.3. Έστω A ∈ Cn×n ερμιτιανός και σ(A) = {λ1 , . . . , λn }. Για δεδομένα x ∈ Cn , x 6= 0, και
λ ∈ C, θέτουμε w = Ax − λx. Τότε
kwk2
min |λ − λi | ≤ . (5.5)
1≤i≤n kxk2
και
Xn X
n
w = (A − λI)x = ci (A − λI)wi = ci (λi − λ)wi .
i=1 i=1
Επομένως Pn
kwk22 |c |2 |λi − λ|2
= Pni
i=1
≥ min |λ − λi |2 ,
kxk22 i=1 |ci |
2 1≤i≤n
Υπενθυμίζουμε τα πηλίκα Rayleigh από το Κεφάλαιο 1 και συνοψίζουμε τις ιδιότητές τους στην πρόταση που
ακολουθεί:
Ορισμός 5.1. Έστω A ∈ Cn×n ερμιτιανός πίνακας. Το πηλίκο Rayleigh του x ∈ Cn , x 6= 0, είναι
(Ax, x)
R(x) = .
(x, x)
λ 1 ≤ λ 2 ≤ · · · ≤ λn .
2. Για κάθε x ∈ Cn , x 6= 0
Απόδειξη. Οι ισχυρισμοί 1 και 3 αφήνονται ως ασκήσεις, δείτε, επίσης το Κεφάλαιο 1. Για τον δεύτερο ισχυ-
ρισμό της πρότασης παρατηρούμε ότι αν x1 , xn είναι ιδιοδιανύσματα του A ως προς τις ιδιοτιμές λ1 , λn ,
αντίστοιχα, τότε
(Ax1 , x1 ) (λ1 , x1 )
R(x1 ) = = = λ1 ,
(x1 , x1 ) (x1 , x1 )
και όμοια
(Axn , xn ) (λn , xn )
R(xn ) = = = λn .
(xn , xn ) (xn , xn )
Συνεπώς για να ολοκληρωθεί η απόδειξη, αρκεί να δείξουμε ότι για κάθε x ∈ Cn , x 6= 0,
λ1 ≤ R(x) ≤ λn . (5.6)
Για να αποδείξουμε την (5.6) θεωρούμε μια ορθομοναδιαία βάση {x1 , . . . , xn } του Cn αποτελούμενη από
ιδιοδιανύσματα του A, Axi = λi xi , i = 1, . . . , n. Γράφουμε x = c1 x1 + · · · cn xn για κάποια ci ∈ C,
i = 1, . . . , n, έτσι ώστε
X
n X
n X
n X
n
(Ax, x) = ci (Axi , x) = ci (λi xi , x) = ci (λi xi , c1 x1 + · · · cn xn ) = λi c2i
i=1 i=1 i=1 i=1
Pn 2
και βέβαια, (x, x) = i=1 ci . Τότε
Pn
λi c2i
λ1 ≤ Pi=1
n 2
≤ λn ,
i=1 ci
το οποίο αποδεικνύει την (5.6). Για τον τέταρτο ισχυρισμό της πρότασης υποθέτουμε χωρίς περιορισμό της
γενικότητας ότι kxk2 = 1. Τότε R(x) = (Ax, x) και
kAx − αxk22 = (Ax − αx, Ax − αx) = kAxk22 − 2(Ax, x)α + α2 = kAxk22 − 2R(x)α + α2 .
Συνεπώς
kAx − αxk22 = kAxk22 − [R(x)]2 + [α − R(x)]2 ,
το οποίο αποδεικνύει αμέσως τον τέταρτο ισχυρισμό της πρότασης.
Θεώρημα 5.4. Έστω A ∈ Cn×n ερμιτιανός πίνακας και σ(A) = {λ1 , . . . , λn } ⊂ R. Έστω ακόμα S =
{w1 , . . . , wn } μια ορθομοναδιαία βάση του Cn αποτελούμενη από ιδιοδιανύσματα του A, Awi = λi wi , i =
1, . . . , n. Αν x ∈ Cn , x 6= 0, έχει την ιδιότητα
kx − wk k2 < ϵ, kxk2 = 1,
για κάποιο ϵ > 0, τότε
|R(x) − λk | ≤ 2ρ(A)ϵ2 . (5.7)
Pn P
Απόδειξη. Έστω x 6= wk . Γράφουμε x = j=1 αj wj έτσι ώστε kxk2 =
2
j=1 |αj | = 1. Από την
n 2
Τέλος
Pn Xn
i=1 λi |αi
2
R(x) = P = λk |αk | +
2
λj |αj |2 ,
i=1 |αi |
n 2
j=1
j̸=k
έτσι ώστε
X
n
|R(x) − λk | ≤ λk (|αk | − 1) + 2
λj |αj |2
j=1
j̸=k
X
n
≤ |λk |(1 − |αk |2 ) + |λj | αj |2
j=1
j̸=k
X
n
≤ max |λj |(1 − |αk |2 ) + max |λj | |αj |2
1≤j≤n 1≤j≤n
j=1
j̸=k
Έστω A ∈ Cn×n και q ∈ Cn , q 6= 0. Η μέθοδος των δυνάμεων παράγει μια ακολουθία μη μηδενικών
διανυσμάτων vk , k ≥ 0, ως εξής:
1. v0 = q/kqk2 .
3. Αν qk = 0 η μέθοδος τερματίζεται.
Το γεγονός ότι
1 1
vk = qk = Avk−1 = · · · = ck Ak v0 ,
kqk k2 kqk k2
δικαιολογεί το όνομα αυτής της επαναληπτικής διαδικασίας. Για τη σύγκλισή της, στην περίπτωση ενός πί-
νακα για τον οποίο η μέγιστη κατ’ απόλυτο τιμή είναι πραγματική και απλή, έχουμε το ακόλουθο αποτέλεσμα:
Θεώρημα 5.5. Έστω A ∈ Cn×n και q ∈ Cn , q 6= 0. Διατάσσουμε τις ιδιοτιμές λ1 , . . . , λn του A έτσι ώστε
Έστω ακόμα S = {w1 , . . . , wn } μια ορθομοναδιαία βάση του Cn αποτελούμενη από ιδιοδιανύσματα του A,
Awi = λi wi , i = 1, . . . , n. Αν q ∈ Cn είναι τέτοιο ώστε (q, wn ) 6= 0, τότε υπάρχει σταθερά C > 0 και
k0 > 0 τέτοια ώστε για k ≥ k0
k 2k
λn−1 λn−1
kvk − sk wn k2 ≤ C , |R(vk ) − λn | ≤ 2C 2 |λn | , (5.8)
λn λn
Pn
Απόδειξη. Γράφουμε v0 = α w για αj ∈ C, j = 1, . . . , n, τα οποία λόγω των υποθέσεών μας
Pn j=1 2j j
ικανοποιούν αn 6= 0 και j=1 |αj | = 1. Έχουμε
X
n
q1 = Av0 = λj α j w j ,
j=1
επομένως
1 X
n
v1 = qP λj α j w j .
j=1 |αj | λj
n 2 2
j=1
1 X
n
vk = qP λjk αj wj (5.9)
j=1 |αj | λj
n 2 2k
j=1
!
1 X
n−1
= qP λkn αn wn + λkj αj wj (5.10)
j=1 |αj | λj
n 2 2k
j=1
X
n−1 k !
αn λkn 1 α j λj
= s 2k wn + wj . (5.11)
|αn λkn | P αj
2
λj α
j=1 n
λn
1 + n−1
j=1
αn λn
Θέτουμε sk = αn λkn /|αn λkn |. Από τις υποθέσεις μας για τις ιδιοτιμές του A έχουμε για j = 1, . . . , n − 1,
ότι k
λj
→ 0 καθώς k → ∞.
λn
Εύκολα βλέπουμε από τη σχέση (5.9) ότι
1
vk − w n → 0 καθώς k → ∞,
sk
και
k
λn−1
kvk − sn wn k2 ≤ C ,
λn
για κάποια σταθερά C > 0 και k αρκετά μεγάλο. Η τετραγωνική σύγκλιση των R(vk ) στην ιδιοτιμή λn
προκύπτει τώρα από το Θεώρημα 5.4.
Αν µ ∈ C είναι κοντά σε μια ιδιοτιμή λr του πίνακα A, τότε |(λr − µ)−1 | |(λj − µ)−1 | για δείκτες
j 6= r. Επομένως θα μπορούσαμε να εφαρμόσουμε τη μέθοδο των δυνάμεων στον πίνακα (A − µI)−1 για
να προσεγγίσουμε την ιδιοτιμή λr (ο πίνακας A − µI είναι αντιστρέψιμος, δείτε την Άσκηση 5.7.4). Αυτή
είναι η ιδέα της μεθόδου της αντίστροφης επανάληψης: Έστω A ∈ Cn×n και q ∈ Cn , q 6= 0. Υποθέτουμε
ακόμα ότι µ ∈ C είναι τέτοιο ώστε ο πίνακας A − µI να είναι αντιστρέψιμος. Η μέθοδος της αντίστροφης
επανάληψης παράγει μια ακολουθία μη μηδενικών διανυσμάτων vk , k ≥ 0, ως εξής:
1. v0 = q/kqk2 .
3. Αν qk = 0 η μέθοδος τερματίζεται.
80 ΠΡΟΒΛΗΜΑΤΑ ΙΔΙΟΤΙΜΩΝ
Οι ιδιότητες σύγκλισης της μεθόδου της αντίστροφης επανάληψης συνοψίζονται στο παρακάτω θεώρημα, η
απόδειξη του οποίου ακολουθεί αυτή του Θεωρήματος 5.5 και γι’ αυτό παραλείπεται.
Θεώρημα 5.6. Έστω A ∈ Cn×n ερμιτιανός και σ(A) = {λ1 , . . . , λn } ⊂ R. Έστω ακόμα S = {w1 , . . . ,
wn } μια ορθομοναδιαία βάση του Cn αποτελούμενη από ιδιοδιανύσματα του A, Awi = λi wi , i = 1, . . . , n.
Υποθέτουμε ότι µ ∈ C είναι τέτοιο ώστε µ 6∈ σ(A) και ορίζουμε
λr = arg min |λj − µ|, λs = arg min |λj − µ|.
1≤j≤n 1≤j≤n
j̸=r
Τότε
Pn−1
j=1 |αj | λj (λj − λn )2
H 2 2k−1
yk+1 yk
= Pn−1
ykH yk 2 2(k−1) (λ − λ )2
j=1 |αj | λj j n
2(k−1) 2
Pn−1 αj 2
λj λj − λ n
λj
j=1
αn−1 λn−1 λn−1 − λn
2 2(k−1) 2
=
Pn−1 αj λj λ j − λn
j=1
αn−1 λn−1 λn−1 − λn
2(k−1) 2
Pn−2 αj 2 λj λ j − λn
λn−1 + j=1 λj
αn−1 λn−1 λn−1 − λn
= 2 2(k−1) 2 → λn−1
Pn−1 αj λj λ j − λn
1 + j=1
αn−2 λn−1 λn−1 − λn
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 81
Έχουμε ήδη δει ότι, εν γένει, δεν είναι δυνατόν να μετασχηματίσουμε έναν τετραγωνικό πίνακα σε τριγω-
νική ή διαγώνια μορφή με μετασχηματισμούς ομοιότητας χρησιμοποιώντας άμεσες μεθόδους. Σε αυτήν την
ενότητα περιγράφουμε τον μετασχηματισμό ενός πίνακα A ∈ Cn×n σε πίνακα άνω Hessenberg χρησιμο-
ποιώντας ερμιτιανούς μετασχηματισμούς ομοιότητας. Δείχνουμε επίσης ότι, αν ο πίνακας A είναι ερμιτιανός,
το αποτέλεσμα είναι ένας τριδιαγώνιος πίνακας.
Ένας πίνακας A ∈ Cn×n λέγεται άνω Hessenberg αν aij = 0 για όλα τα i ≥ j + 2, 1 ≤ i, j, ≤ n.
Θα δείξουμε ότι είναι δυνατόν να βρούμε έναν μετασχηματισμό ομοιότητας ο οποίος μετασχηματίζει τον A
σε μορφή άνω Hessenberg, δηλαδή,
× × × ··· ×
. .
× × × . . ..
A → QH AQ = 0 × ×
..
. × .
. .
.. . . . . . . . . ×
0 ··· 0 × ×
Η απόδειξη γίνεται επαγωγικά. Ας υποθέσουμε ότι Hn−1 είναι μοναδιαίος πίνακας, γινόμενο πινάκων Givens
ή πινάκων Householder (δείτε το Κεφ. 5) ο οποίος αφήνει αναλλοίωτη την πρώτη γραμμή του A αλλά μηδε-
νίζει τα στοιχεία ai,1 , i = 3, . . . , n.
× × × ··· ×
⊗ ⊗ ⊗ · · · ⊗
.
.
A → Hn−1
H
A = 0 ⊗ ⊗ . . .. ,
. . . .
.. .. .. . . ⊗
0 ⊗ ⊗ ··· ⊗
όπου ⊗ συμβολίζει στοιχεία του A τα οποία άλλαξαν λόγω του πολλαπλασιασμού με τον Hn−1
H
. Τώρα ο πολ-
H H H
λαπλασιασμός του Hn−1 A από δεξιά με τον H αφήνει αναλλοίωτη την πρώτη στήλη του Hn−1 A, αλλάζει
όμως τα στοιχεία της πρώτης γραμμής, εκτός του a11 :
× ⊗ ⊗ ··· ⊗
⊗ ⊕ ⊕ · · · ⊕
. . . ..
Hn−1 AHn−1 = 0 ⊕ ⊕
H
. ,
. . . .
.. .. .. . . ⊕
0 ⊕ ⊕ ··· ⊕
όπου το σύμβολο ⊕ συμβολίζει τα στοιχεία του A τα οποία άλλαξαν δύο φορές. Χρησιμοποιώντας επανει-
λημμένα αυτήν την ιδέα μπορούμε να μετασχηματίσουμε τον πίνακα A σε πίνακα με μορφή άνω Hessenberg
χρησιμοποιώντας τον παρακάτω αλγόριθμο:
για k = 1, . . . , n − 2
x = Ak+1:n,k
vk = x + sgn(x1 )kxk2 e1
vk = vk /kvk k2
Ak+1:n,k:n = Ak+1:n,k:n − 2vk (vkH Ak+1:n,k:n )
A1:n,k+1:n = A1:n,k+1:n − 2(A1:n,k+1:n vk )vkH
82 ΠΡΟΒΛΗΜΑΤΑ ΙΔΙΟΤΙΜΩΝ
Θεώρημα 5.8. Έστω A ∈ Cn×n ερμιτιανός. Τότε υπάρχει μοναδιαίος πίνακας Q ∈ Cnn, γινόμενο n − 2
πινάκων Householder, Q = Hn−1 · · · H2 , όπου Hk ∈ Cn×n είναι πίνακας Householder τέτοιος ώστε
QH AQ = T,
Απόδειξη. Γράφουμε
α bH
A= ,
b C
όπου α ∈ C, b ∈ C n−1 και C(n−1)×(n−1) ερμιτιανός πίνακας. Έστω
Hn−1 b ∈ E1n−1 .
είναι ήδη τριδιαγώνιος, γιατί H3,2 b = d ∈ E12 . Αρκεί λοιπόν να πάρουμε Q3 = H3,2 . Υποθέτουμε τώρα ότι
για οποιονδήποτε ερμιτιανό πίνακα B ∈ C(l−1)×(l−1) υπάρχει μοναδιαίος πίνακας Ql−1 ∈ C(l−1)×(l−1) ,
γινόμενο πινάκων Householder,
Ql−1 = Hl−1,l−2 · · · Hl−1,2 ,
τέτοιος ώστε το γινόμενο
l−1 BQl−1 = Tl−1 ∈ C
QH (l−1)×(l−1)
,
είναι ερμιτιανός τριδιαγώνιος. Αν A ∈ Cl×l είναι ερμιτιανός, τριδιαγώνιος θέτουμε
1 0
Hl,k = ∈ Cl×l ,
0 Hl−1,k
για k = 2, . . . , l − 2 και ορίζουμε τον πίνακα Hl,l−1 όπως στην (5.14). Θέτουμε
α1 − λ β̄2 0
β2 α2 − λ β̄3
pi = −β̄i .. .. .. + (αi − λ) + det(Ai−1 − λI),
. . .
βi−2 αi−2 − λ β̄i−1
0 0 βi
δηλαδή
pi (λ) = −|βi |2 det(Ai−2 − λI) + (αi − λ) det(Ai−1 − λI).
Συνεπώς
pi (λ) = (αi − λ)pi−1 (λ) − |βi |2 pi−2 (λ), i = 3, . . . , n.
Η σχέση αυτή ισχύει και για i = 2 αν ορίσουμε p0 (λ) = 1. Έχουμε λοιπόν
(
p1 (λ) = α1 − λ,
(5.15)
pi (λ) = (αi − λ)pi−1 (λ) − |βi |2 pi−2 (λ), i = 2, . . . , n.
Από την (5.15) προκύπτει ότι τα πολυώνυμα pi έχουν πραγματικούς συντελεστές. Ορίζουμε τώρα
1
q0 (λ) = 1, qi (λ) = (−1)i pi (λ), i = 1, . . . , n,
β̄2 · · · β̄i+1
84 ΠΡΟΒΛΗΜΑΤΑ ΙΔΙΟΤΙΜΩΝ
5.6 Ο αλγόριθμος QR
Η επανάληψη QR είναι μια επαναληπτική διαδικασία για τον υπολογισμό του τριγωνικού πίνακα T της ανά-
λυσης Schur για τον πίνακα A ∈ Cn×n
A = QH T Q,
για κάποιον μοναδιαίo πίνακα Q ∈ Cn×n . Η επαναληπτική αυτή διαδικασία έχει τη μορφή
A0 = A
για k = 1, 2, . . . ,
Qk Rk = Ak−1
Ak = Rk Qk
Για την ελαχιστοποίηση του κόστους της αλγόριθμου QR, πρώτα μετασχηματίζουμε τον πίνακα A σε μορφή
Hessenberg. Η πρόταση που ακολουθεί δείχνει ότι η ανάλυση QR διατηρεί τη μορφή Hessenberg.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 85
Πρόταση 5.2. Έστω A ∈ Cn×n . Στον αλγόρθμο QR ο πίνακας Ak είναι όμοιος με τον Ak−1 . Αν ο Ak−1 είναι
ερμιτιανός, το ίδιο ισχύει για τον Ak . Αν ο Ak−1 είναι Hessenberg, το ίδιο ισχύει για τον Ak . Τέλος, αν Ak−1 είναι
τριδιαγώνιος, το ίδιο ισχύει για τον Ak .
Απόδειξη. Αφού Rk = QH
k Ak−1 και Ak = Rk Qk έχουμε
Ak = Rk Qk = QH
k Ak−1 Qk .
Qk Ak = Qk Rk Qk = Ak−1 Qk ,
από την οποία προκύπτει ότι Ak = QH k Ak−1 Qk . Συνεπώς, αν Ak−1 είναι ερμιτιανός το ίδιο ισχύει για τον
Ak . Οι υπόλοιποι ισχυρισμοί της πρότασης αποδεικνύονται όμοια.
Το θεώρημα που ακολουθεί δείχνει ότι η ακολουθία πινάκων Ak , k ≥ 1, συγκλίνει υπό προϋποθέσεις, σε
άνω τριγωνική μορφή.
A = P DP −1 ,
και
lim [Ak ]ij = 0, 1 ≤ j < i ≤ n. (5.20)
k→∞
Απόδειξη. Γράφουμε P = QR με Q ∈ Cn×n μοναδιαίο και R ∈ Cn×n άνω τριγωνικό με θετικά διαγώνια
στοιχεία. Τότε,
Ak = P Dk P −1 = QR(Dk LD−k )Dk U.
Τώρα ο L είναι κάτω τριγωνικός με μονάδες στη διαγώνιο, συνεπώς
0 αν i < j,
1 αν i = j,
[Dk LD−k ]i,j = k
λi
αν i > j.
λj
Επομένως
lim (Dk LD−k ) = I.
k→∞
Γράφουμε Dk LD−k = I + Fk , όπου limk→∞ Fk = 0. Τότε R(Dl LD−k ) = (I + RFk R−1 )R. Επειδή
Fk → 0, υπάρχει k0 ≥ 1 τέτοιο ώστε για k ≥ k0 , ο I + RFk R−1 είναι αντιστρέψιμος και γράφεται
μοναδικά στη μορφή
I + RFk R−1 = Q̃k R̃k ,
86 ΠΡΟΒΛΗΜΑΤΑ ΙΔΙΟΤΙΜΩΝ
όπου Q̃k ∈ Cn×n μοναδιαίος και R̃k ∈ Cn×n άνω τριγωνικός με θετικά διαγώνια στοιχεία. Αφού η ακολου-
θία (Q̃k )k≥1 είναι φραγμένη (kQ̃k2 = 1), υπάρχει συγκλίνουσα υπακολουθία (Q̃kl )l≥1 . Έστω
Q̃ = lim Q̃kl .
l→∞
με R̃ άνω τριγωνικό με μη αρνητικά διαγώνια στοιχεία. Παίρνοντας το όριο όταν l → ∞ συμπεραίνουμε ότι
Q̃R̃ = I, σχέση από την οποία έχουμε ότι τα διαγώνια στοιχεία του R̃ είναι θετικά. Από τη μοναδικότητα
της διάσπασης QR συμπεραίνουμε ότι Q̃ = R̃ = I. Θέτουμε τώρα
Q k = Q1 · · · Qk , R k = R1 · · · Rk . (5.21)
Ak+1 = QH
k AQk , Ak = (QQ̃k )(R̃k RDk U ) = Qk Rk ,
με QQ̃k μοναδιαίο και R̃k RDk U άνω τριγωνικό. Έστω τώρα Sk = diag(s1 , . . . , sn ) με |si | = 1, i =
1, . . . , n, και τέτοιος ώστε
Qk = QQ̃k Sk .
Από τη σχέση αυτή και την (5.21) έχουμε
Ak+1 = QH H H
k AQk = Sk Q̃K RD Q̃k Sk .
Με Dk = Q̃H
k RD Q̃k και χρησιμοποιώντας το γεγονός ότι ο Sk είναι διαγώνιος πίνακας έχουμε
Συνεπώς
[Ak+1 ]i,i = [Dk ]i,i → λi καθώς k → ∞,
το οποίο ολοκληρώνει την απόδειξη.
Παρατήρηση 5.2. Αν ο πίνακας A είναι ερμιτιανός τότε είναι διαγωνοποιήσιμος και υπάρχει Q ∈ Cn×n
μοναδιαίος τέτοιος ώστε A = QΛQH με Λ = diag(λ1 , . . . , λn ). Ακολουθώντας τα βήματα της απόδειξης
του θεωρήματος 5.10 είναι δυνατόν να αποδείξουμε ότι οι πίνακες Ak συγκλίνουν γραμμικά σε άνω τριγωνική
μορφή και το ίδιο ισχύει για τους πίνακες Qk , [5], [6].
Το αντικείμενο αυτού του κεφαλαίου υπάρχει πιο αναλυτικά σε πολλά βιβλία Αριθμητικής Γραμμικής Άλ-
γεβρας. Παραθέτουμε κάποιες αναφορές τις οποίες ο αναγνώστης μπορεί να συμβουλευτεί: [1], [2], [3], [5],
[6], [7], [8].
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 87
5.7 Ασκήσεις
ονομάζεται συνοδός πίνακας Frobenius (companion Frobenius matrix). Βρείτε το χαρακτηριστικό πο-
λυώνυμο χF του πίνακα F .
5.7.4 Έστω A ∈ Cn×n . Δείξτε ότι αν µ 6∈ σ(A), τότε ο (A − µI)−1 υπάρχει και αν λ ∈ σ(A) τότε
(λ − µ)−1 ∈ σ ((A − µI)−1 ). Ποιο είναι το αντίστοιχο ιδιοδιάνυσμα;
5.7.5 Ak , k ≥ 1, οι πίνακες που υπολογίζει η διαδικασία QR. Δείξτε ότι αν ο Ak−1 είναι Hessenberg, το
ίδιο ισχύει και για τον Ak−1 . Δείξτε επίσης ότι αν ο Ak−1 είναι τριδιαγώνιος, το ίδιο ισχύει για τον Ak .
5.7.6 Έστω
1 1 0 0
A = 1 0 1 και x(0) = 1
0 1 1 0
Κάντε 3 επαναλήψεις με τον αλγόριθμο των δυνάμεων για να προσεγγίσετε τη μεγαλύτερη κατ’ από-
λυτο τιμή του πίνακα A.
5.7.7 Έστω
0 0 1 1
A = 1 0 −1 και x(0) = 1
1 −1 0 1
Κάντε 3 επαναλήψεις με τον αλγόριθμο των αντιστρόφων δυνάμεων για να προσεγγίσετε τη μικρότερη
κατ’ απόλυτο τιμή του πίνακα A.
Βιβλιογραφία
[1] G. Allaire και S. M. Kaber. Numerical Linear Algebra. English. Τόμ. 55. Texts Appl. Math. New York,
NY: Springer, 2008. isbn: 978-0-387-34159-0. doi: 10.1007/978‐0‐387‐68918‐0.
[2] Å. Björck. Numerical Methods in Matrix Computations. English. Τόμ. 59. Texts Appl. Math. Cham:
Springer, 2015. isbn: 978-3-319-05088-1. doi: 10.1007/978‐3‐319‐05089‐8.
[3] G. H. Golub και C. F. Van Loan. Matrix computations. English. Baltimore, MD: The Johns Hopkins
University Press, 2013, σσ. xxi + 756. isbn: 978-1-4214-0794-4.
88 ΠΡΟΒΛΗΜΑΤΑ ΙΔΙΟΤΙΜΩΝ
[4] G. H. Golub και C. F. Van Loan. Matrix computations. English. Baltimore, MD: The Johns Hopkins
University Press, 2013, σσ. xxi + 756. isbn: 978-1-4214-0794-4.
[5] B. N. Parlett. The Symmetric Eigenvalue Problem. Society for Industrial και Applied Mathematics,
1998. doi: 10.1137/1.9781611971163.
[6] G. W. Stewart. Introduction to Matrix Computations. Computer science and applied mathematics.
New York: Academic Press, 1973. isbn: 0-126-70350-7.
[7] L. N. Trefethen και D. Bau. Numerical Linear Algebra. English. Philadelphia, PA: SIAM, 2000. isbn:
0-89871-487-7.
[8] B. A. Δουγαλής, Δ. Νούτσος και Α. Χατζηδήμος. Αριθμητική Γραμμική Άλγεβρα. Ιωάννινα: Τμήμα Μα-
θηματικών, Πανεπιστήμιο Ιωαννίνων, 2016.
ΚΕΦΑΛΑΙΟ 6
Περίληψη
Στο κεφάλαιο αυτό ασχολούμαστε με μεθόδους για την επίλυση μη γραμμικών εξισώσεων. Ξεκινάμε με τα
κλασικά θεωρήματα ύπαρξης ριζών μη γραμμικών εξισώσεων και το θεώρημα της συστολής. Στη συνέχεια
ορίζουμε και αναλύουμε τη μέθοδο Newton-Raphson και τις παραλλαγές της. Ο λόγος για τον οποίο μελε-
τάμε προβλήματα στη μία διάσταση χωριστά είναι ότι μας επιτρέπουν να δούμε τις αρχές για την κατασκευή
καλών τοπικών και ολικών μεθόδων προσέγγισης ριζών, οι οποίες θα χρησιμεύουν ως βάση για αντίστοιχες
μεθόδους σε περισσότερες διαστάσεις.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Απειροστικού λογισμού σε μία διάσταση. Συνέχεια και παραγώ-
γιση πραγματικών συναρτήσεων. Μέγιστη και ελάχιστη τιμή πραγματικών συναρτήσεων.
Έστω f : [a, b] → R συνεχής συνάρτηση. Αναζητούμε έναν πραγματικό αριθμό ξ ∈ [a, b] έτσι ώστε
f (ξ) = 0. Ένας τέτοιος αριθμός, αν υπάρχει, ονομάζεται λύση της εξίσωσης f (x) = 0. Μια ικανή συνθήκη
για την ύπαρξη λύσης αυτής της εξίσωσης στο [a, b] παρέχει το θεώρημα της ενδιάμεσης τιμής ¹, το οποίο με
τη σειρά του οδηγεί στη μέθοδο της διχοτόμησης για την προσέγγισή της.
Μια εναλλακτική ικανή συνθήκη για την ύπαρξη λύσης της εξίσωσης f (x) = 0 προκύπτει γράφοντάς την
ισοδύναμα στη μορφή x − g(x) = 0, για κατάλληλη συνάρτηση g ορισμένη και συνεχής στο [a, b]. Έτσι η
λύση της εξίσωσης f (x) = 0 ανάγεται στην εύρεση κάποιου πραγματικού αριθμού ξ ∈ [a, b] τέτοιου ώστε
ξ − g(ξ) = 0.
¹Αν f : [a, b] → R είναι συνεχής με f (a)f (b) ≤ 0, τότε υπάρχει ξ ∈ [a, b] τέτοιο ώστε f (ξ) = 0.
Έστω g πραγματική συνάρτηση ορισμένη και συνεχής στο [a, b] και τέτοια ώστε g(x) ∈ [a, b] για κάθε
x ∈ [a, b]. Τότε υπάρχει ξ ∈ [a, b] τέτοιο ώστε ξ = g(ξ). Ο πραγματικός αριθμός ξ ονομάζεται σταθερό σημείο
της g.
Απόδειξη. Έστω f (x) = x − g(x). H f είναι συνεχής στο [a, b] και f (a) = a − g(a) ≤ 0, f (b) =
b − g(b) ≥ 0, γιατί g(x) ∈ [a, b] για κάθε x ∈ [a, b]. Από το θεώρημα της ενδιάμεσης τιμής προκύπτει ότι
υπάρχει ξ ∈ [a, b] τέτοιο ώστε 0 = f (ξ) = ξ − g(ξ).
Αν και το θεώρημα του σταθερού σημείου του Brouwer είναι σημαντικό εργαλείο για την απόδειξη της
ύπαρξης μιας λύσης της εξίσωσης f (x) = 0 δεν παρέχει πληροφορίες για τον υπολογισμό της. Προς αυτήν
την κατεύθυνση παρατηρούμε ότι αν μια συνάρτηση g ικανοποιεί τις υποθέσεις του θεωρήματος του Brouwer
και x0 ∈ [a, b], τότε η ακολουθία (xk ), k ≥ 0, με xk+1 = g(xk ), k ≥ 0, είναι καλά ορισμένη και xk ∈ [a, b]
για κάθε k ≥ 0. Αν η ακολουθία (xk ) συγκλίνει, τότε το όριό της είναι σταθερό σημείο της g. Πράγματι, αν
ξ = limk→∞ xk , η συνέχεια της g στο κλειστό διάστημα [a, b] δίνει
ξ = lim xk+1 = lim g(xk ) = g lim xk = g(ξ).
k→∞ k→∞ k→∞
Το θεώρημα της συστολής το οποίο αποδεικνύουμε παρακάτω, παρέχει ικανές συνθήκες για τη σύγκλιση της
ακολουθίας (xk ) υπό την επιπλέον υπόθεση ότι η g είναι συστολή.
Ορισμός 6.1. Έστω g μια πραγματική συνάρτηση, ορισμένη και συνεχής στο κλειστό διάστημα [a, b]. Λέμε
ότι η g είναι συστολή στο [a, b] αν υπάρχει σταθερά 0 < L < 1 τέτοια ώστε
|g(x) − g(y)| ≤ L |x − y|, ∀ x, y ∈ [a, b]. (6.1)
Γενικότερα, αν L είναι οποιοσδήποτε θετικός αριθμός, η (6.1) ονομάζεται συνθήκη Lipschitz.
Θεώρημα 6.2 (Θεώρημα της συστολής). Έστω g : [a, b] → [a, b] συστολή. Τότε η g έχει μοναδικό σταθερό
σημείο στο [a, b]. Επιπλέον η ακολουθία (xk ) με xk+1 = g(xk ), k ≥ 0, συγκλίνει στο ξ για κάθε x0 ∈ [a, b].
Απόδειξη. Η ύπαρξη σταθερού σημείου έπεται από το θεώρημα σταθερού σημείου. Αν υποθέσουμε ότι η g έχει
ένα ακόμα σταθερό σημείο η ∈ [a, b] τότε
|ξ − η| = |g(ξ) − g(η)| ≤ L |ξ − η|,
οπότε (1 − L)|ξ − η| ≤ 0. Επειδή 1 − L > 0 έχουμε αναγκαστικά ξ = η. Έστω τώρα x0 ∈ [a, b] και
xk+1 = g(xk ), k ≥ 0. Από τη σχέση (6.1) έχουμε
|xk − ξ| = |g(xk−1 ) − g(ξ)| ≤ L |xk−1 − ξ|, k ≥ 1,
από την οποία προκύπτει επαγωγικά ότι
|xk − ξ| ≤ Lk |x0 − ξ|, k ≥ 1. (6.2)
Αφού 0 < L < 1 έχουμε limk→∞ Lk = 0, οπότε limk→∞ |xk − ξ| = 0.
Παράδειγμα 6.1. Έστω f (x) = 1 + 2x − ex . Εύκολα βλέπουμε ότι η εξίσωση f (x) = 0 έχει τη λύση
x = 0, αλλά και κάποια λύση ξ ∈ [1, 2]. Η συνάρτηση g(x) = ln(1 + 2x) είναι συνεχής στο [1, 2]. Από το
θεώρημα της μέσης τιμής, για κάθε x, y ∈ [1, 2] έχουμε
|g(x) − g(y)| = |g ′ (η)(x − y)|
για κάποιο η μεταξύ των x και y. Όμως g ′ (x) = 2/(1 + 2x) και g ′′ (x) = −4/(1 + 2x)2 άρα η g ′ φθίνει
μονότονα στο [1, 2]. Έχουμε λοιπόν g ′ (1) ≥ g ′ (η) ≥ g ′ (2), δηλαδή g ′ (η) ∈ [2/5, 2/3]. Επομένως
|g(x) − g(y)| ≤ L |x − y|, ∀x, y ∈ [1, 2]
με L = 2/3. Από το θεώρημα της συστολής προκύπτει ότι η ακολουθία (xk ) με xk+1 = g(xk ), k ≥ 0,
συγκλίνει στο ξ για οποιαδήποτε αρχική τιμή x0 ∈ [1, 2].
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 91
M = max |f ′ (x)|,
x∈Iδ
τότε α2 ≤ M ≤ 3α
2
. Για λ > 0 έχουμε τότε
λα
∀x ∈ Iδ , 1 − λM ≤ 1 − λf ′ (x) ≤ 1 − .
2
Επιλέγουμε τώρα λ > 0 έτσι ώστε
λα
1 − λM = −θ, 1− = θ.
2
Εύκολα διαπιστώνει κανείς ότι οι παραπάνω σχέσεις ικανοποιούνται αν
4 2M − α
λ= , θ= .
2M + α 2M + α
Ορίζουμε τώρα
4f (x)
g(x) = x − λf (x) = x − .
2M + α
Από το θεώρημα της συστολής προκύπτει εύκολα ότι η ακολουθία xk+1 = g(xk ) συγκλίνει στο ξ για x0
αρκετά κοντά στο ξ.
Ας υποθέσουμε ότι θέλουμε να βρούμε μια ρίζα της εξίσωσης f (x) = x2 −3, δείτε το Σχήμα 6.1. Αν η αρχική
πρόβλεψη της ρίζας της f (x) = 0 είναι η xc = 2, τότε μπορούμε να πάρουμε μια βελτιωμένη εκτίμηση ως
το σημείο που η εφαπτομένη της f (x) στο (xc , f (xc )) = (2, 1) τέμνει τον x-άξονα. Εύκολα βλέπουμε ότι
η εξίσωση της εφαπτομένης στο σημείο (xc , f (xc )) είναι η
και η οποία τέμνει τον άξονα στο σημείο 0 − f (xc ) = f ′ (xc )(x − x+ ), δηλαδή όταν
f (xc )
x+ = xc − . (6.3)
f ′ (xc )
Στην περίπτωσή μας έχουμε x+ = 2 − 14 = 1.75. Είναι λογικό ότι μπορούμε να επαναλάβουμε την ίδια
διαδικασία ξεκινώντας αυτήν τη φορά με την εκτίμηση xc = 1.75. Χρησιμοποιώντας πάλι τη σχέση (6.3)
92 ΑΡΙΘΜΗΤΙΚΗ ΛΥΣΗ ΜΗ ΓΡΑΜΜΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
(2, 1)
x∗
xc x
x+
−3
Σχήμα 6.1: Ένα βήμα της μεθόδου Newton-Raphson για την f (x) = x2 − 3.
√
παίρνουνε τώρα x+ = 9956
= 1.7321428571 . . ., η οποία συμφωνεί με την 3 σε τέσσερα ψηφία. Μια ακόμα
επανάληψη της ίδιας διαδικασίας δίνει x+ = 1.73205081001472 . . ., η οποία έχει οκτώ σωστά ψηφία!
Η μέθοδος (6.3) ονομάζεται μέθοδος Newton-Raphson ή μέθοδος Newton-Raphson². Για να δικαιολογή-
σουμε την αποτελεσματικότητά της, τουλάχιστον στο προηγούμενο παράδειγμα, είναι χρήσιμο να υιοθετή-
σουμε μια διαφορετική οπτική. Σε κάθε βήμα της μεθόδου Newton-Raphson κατασκευάζουμε ένα τοπικό
μοντέλο της f (x) χρησιμοποιώντας την εφαπτομένη στο γράφημα της f (x) στο σημείο (xc , f (xc )) και βρί-
σκουμε τη ρίζα αυτού του τοπικού μοντέλου. Πράγματι αν
τότε η ρίζα της εξίσωσης Mc (x) = 0 είναι η x+ της σχέσης (6.3). Θα μπορούσαμε ακόμα να πούμε ότι
αντλήσαμε τη μέθοδο Newton-Raphson προσεγγίζοντας την f (x) σε μια γειτονιά του xc από το ανάπτυγμα
Taylor
X∞
f (k) (xc )
f (x) = (x − xc )k = f (xc ) + f ′ (xc )(x − xc ) + · · ·
k=0
k!
και διατηρώντας τους δύο πρώτους όρους. Είναι όμως απαραίτητο σε αυτήν την περίπτωση να υποθέσουμε
ότι η f (x) έχει παραγώγους τάξης μεγαλύτερης του ένα, πράγμα το οποίο δεν χρησιμοποιείται στη μέθοδο.
Θα μπορούσαμε ακόμα να χρησιμοποιήσουμε το θεμελιώδες θεώρημα του απειροστικού λογισμού
Z x
f (x) = f (xc ) + f ′ (s) ds
xc
xk f (xk )
2.000000000000 1.000000000000
1.750000000000 0.062500000000
1.732142857143 0.000318877551
1.732050810015 0.000000008473
1.732050807569 0.000000000000
Πίνακας 6.1: Η μέθοδος Newton-Raphson για τη λύση της εξίσωσης x2 − 3 = 0. Με έντονο χρώμα τα
σωστά ψηφία της κάθε προσέγγισης.
α > 0, μπορούμε εύκολα να δούμε τη συμπεριφορά του σφάλματος της μεθόδου Newton-Raphson. Αν η αρ-
χική εκτίμηση της ρίζας της f (x) = 0 είναι η xc 6= 0 τότε, από τη σχέση (6.3) έχουμε
f (xc ) x2c − α xc α
x+ = xc − ′
= x c − = + ,
f (xc ) 2xc 2 2xc
από το οποίο προκύπτει ότι
√
√ xc α √ (xc − α)2
x+ − α= + − α= .
2 2xc 2xc
Επιπλέον για το σχετικό σφάλμα εύκολα προκύπτει από την προηγούμενη σχέση ότι
√ √ 2 √
x+ − α xc − α α
√ = √ · .
α α 2xc
√
Επομένως, αν το αρχικό σφάλμα |xc − α| είναι μικρότερο από την ποσότητα |2xc | το σφάλμα της προ-
σέγγισης x+ θα είναι μικρότερο από αρχικό σφάλμα. Μάλιστα το σφάλμα της προσέγγισης x+ φαίνεται να
είναι ανάλογο με το τετράγωνο του σφάλματος της προσέγγισης xc . Προτού αποδείξουμε ένα γενικό θεώρημα
σύγκλισης της μεθόδου Newton-Raphson, υπενθυμίζουμε την έννοια της ταχύτητας σύγκλισης:
Ορισμός 6.2. Έστω x∗ ∈ R. Λέμε ότι η ακολουθία {xk }k≥0 συγκλίνει στο x∗ αν
lim |xk − x∗ | = 0.
k→∞
Αν επιπλέον υπάρχει σταθερά c ∈ [0, 1) και ακέραιος k0 ≥ 0 τέτοιοι ώστε για k ≥ k0 να ισχύει
τότε λέμε ότι η ακολουθία {xk } συγκλίνει γραμμικά στο x∗ . Αν για κάποια ακολουθία {ck } η οποία συγκλίνει
στο μηδέν ισχύει
|xk+1 − x∗ | ≤ ck |xk − x∗ |, (6.6)
τότε λέμε ότι η ακολουθία {xk } συγκλίνει υπεργραμμικά στο x∗ . Τέλος αν υπάρχουν σταθερές c > 0, p > 1
και k0 ≥ 0 τέτοιες ώστε για k ≥ k0 να ισχύει
τότε λέμε ότι η ακολουθία {xk } συγκλίνει στο x∗ με τάξη τουλάχιστον p. Αν p = 2 ή p = 3, τότε λέμε ότι η
σύγκλιση είναι τετραγωνική, αντίστοιχα, κυβική.
94 ΑΡΙΘΜΗΤΙΚΗ ΛΥΣΗ ΜΗ ΓΡΑΜΜΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
Για να εκτιμήσει κανείς τη διαφορά στην ταχύτητα σύγκλισης, σημειώνουμε ότι σε ένα υπολογιστικό σύστημα
το οποίο εκτελεί υπολογισμούς με διπλή ακρίβεια, κατά το πρότυπο IEEE 754, έχουμε fl(xk ) = 1 όταν
k = 53 και fl(zk ) = 1 όταν k = 7. Εδώ, με fl(x) συμβολίζουμε τον αριθμό μηχανής που αντιστοιχεί στον
πραγματικό αριθμό x.
Θα δείξουμε ότι η μέθοδος Newton-Raphson συγκλίνει τετραγωνικά στη ρίζα της μη γραμμικής εξίσωσης
f (x) = 0 αν η αρχική εκτίμηση είναι «αρκετά κοντά». Η απόδειξη στηρίζεται στην εκτίμηση του σφάλματος
μεταξύ της f (x) και του τοπικού μοντέλου Mc (x) της σχέσης (6.4)
Z x
f (x) − Mc (x) = [f ′ (s) − f ′ (xc )] ds.
xc
Ορισμός 6.3. Λέμε ότι η συνάρτηση g είναι Lipschitz συνεχής με σταθερά γ σε ένα σύνολο X και θα γρά-
φουμε g ∈ Lipγ (X) αν για κάθε x, y ∈ X
Λήμμα 6.1. Έστω D ένα ανοιχτό σύνολο και f : D → R με f ′ ∈ Lipγ (D). Τότε για κάθε x, y ∈ D,
γ(y − x)2
|f (y) − f (x) − f ′ (x)(y − x)| ≤ . (6.8)
2
Απόδειξη. Από το θεμελιώδες θεώρημα του απειροστικού λογισμού έχουμε
Z y
′
f (y) − f (x) − f (x)(y − x) = [f ′ (s) − f ′ (x)] ds (6.9)
x
και με χρήση της τριγωνικής ανισότητας και της υπόθεσης f ′ ∈ Lipγ (D) έχουμε
Z
′
1
γ(y − x)2
|f (y) − f (x) − f (x)(y − x)| ≤ |y − x| γ|t(y − x)| dt = ,
0 2
Πίνακας 6.2: Η μέθοδος Newton-Raphson για το σύστημα f (x) = x2 −1 = 0 και g(x) = x2 −2x+1 =
0.
f (x) g(x)
2.000000000000 x0 2.000000000000
1.250000000000 x1 1.500000000000
1.025000000000 x2 1.250000000000
1.000304878049 x3 1.125000000000
1.000000046461 x4 1.062500000000
1.000000000000 x5 1.031250000000
Θεώρημα 6.4. Έστω D ένα ανοιχτό διάστημα και f : D → R για την οποία ισχύει f ′ ∈ Lipγ (D). Υποθέ-
τουμε ότι για κάποιο ρ > 0, |f ′ (x)| ≥ ρ για κάθε x ∈ D. Αν η εξίσωση f (x) = 0 έχει λύση x∗ ∈ D, τότε
υπάρχει η > 0 τέτοιο ώστε αν |x0 − x∗ | < η, η ακολουθία που παράγει η μέθοδος Newton-Raphson είναι καλά
ορισμένη και συγκλίνει στο x∗ . Επιπλέον
γ
|xk+1 − x∗ | ≤ |xk − x∗ |2 , k = 0, 1, . . . . (6.10)
2ρ
Απόδειξη. ’Εστω 2η̂ το μήκος του μεγαλύτερου ανοιχτού διαστήματος με κέντρο το x∗ το οποίο περιέχεται
στο D και τ ∈ (0, 1). Θέτουμε η = min{η̂, τ (2ρ/γ)}. Θα αποδείξουμε επαγωγικά ότι για k ≥ 0 ισχύει η
σχέση (6.10) και επιπλέον
|xk+1 − x∗ | ≤ τ |xk − x∗ | < η.
Πράγματι, για k = 0 έχουμε
Από τη σχέση (6.8) και τις υποθέσεις μας για την f ′ έχουμε τότε
γ γ
|x1 − x∗ | ≤ |x0 − x∗ |2 ≤ |x0 − x∗ |2 .
2|f ′ (x 0 )| 2ρ
Παρατήρηση. Στην απόδειξη του Θεωρήματος 6.4 χρησιμοποιήθηκε ουσιαστικά το γεγονός ότι η f ′ έχει ένα
μη μηδενικό κάτω φράγμα στο D και ειδικότερα ότι f ′ (x∗ ) 6= 0. Μπορεί να δειχθεί ότι αν f ′ (x∗ ) = 0,
δηλαδή αν το x∗ είναι ρίζα πολλαπλότητας μεγαλύτερης του ένα, τότε η ταχύτητα σύγκλισης της μεθόδου
Newton-Raphson είναι γραμμική.
Παράδειγμα 6.3. Η διαφορά μεταξύ της γραμμικής και της τετραγωνικής σύγκλισης είναι φανερή στον Πί-
νακα 6.2 όπου η μέθοδος Newton-Raphson εφαρμόζεται στις συναρτήσεις f (x) = x2 − 1 και g(x) =
x2 − 2x + 1 χρησιμοποιώντας την αρχική εκτίμηση x0 = 2.
96 ΑΡΙΘΜΗΤΙΚΗ ΛΥΣΗ ΜΗ ΓΡΑΜΜΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
Παρατήρηση. Το Θεώρημα 6.4 εγγυάται τη σύγκλιση της μεθόδου Newton-Raphson μόνο όταν η αρχική
εκτίμηση x0 της ρίζας είναι αρκετά καλή. Αν η ποσότητα |x∗ − x0 | είναι μεγάλη, τότε η μέθοδος Newton-
Raphson μπορεί να μην συγκλίνει. Για παράδειγμα, η εξίσωση f (x) = arctan x = 0 έχει την προφανή ρίζα
x = 0. Εύκολα βλέπουμε ότι για κάποιο xc ∈ [1.39, 1.40] η μέθοδος των Newton-Raphson παράγει την
ακολουθία xc , −xc , xc , −xc , . . .. Αν |x0 | < xc η μέθοδος συγκλίνει στη ρίζα x∗ = 0, ενώ αποκλίνει αν
|x0 | > xc .
Η υπόθεση του τοπικού θεωρήματος σύγκλισης 6.4, ότι η αρχική εκτίμηση x0 της λύσης της εξίσωσης f (x) =
0 είναι αρκετά κοντά σε αυτή, είναι περισσότερο από μαθηματική αναγκαιότητα. Είναι απαραίτητη και στην
πράξη. Ας δούμε, για παράδειγμα, τη λύση της εξίσωσης f (x) = arctan x = 0 με αρχική εκτίμηση της
λύσης την x0 = 10. Η αρχική εκτίμηση «διορθώνεται» στο πρώτο βήμα από την ποσότητα
f (x0 ) 1.5
s=− ′
≈− = −150.
f (x0 ) 0.01
Αν και η διόρθωση είναι προς τη σωστή κατεύθυνση, το μέτρο της είναι εξαιρετικά μεγάλο. Μάλιστα, οι πρώτες
τέσσερις προσεγγίσεις της ρίζας x∗ = 0 τις οποίες παράγει η μέθοδος Newton-Raphson είναι
10, −138.6, 29892.3, −1.41 × 109 , 3.09 × 1018 .
Παρατηρούμε ότι σε κάθε επανάληψη η μέθοδος διορθώνει προς τη σωστή κατεύθυνση αλλά υπερβαίνει όλο
και περισσότερο τον στόχο. Η απλή ιδέα του υποδιπλασιασμού της διόρθωσης μέχρι να μειωθεί η ποσότητα
|f (x)| συνήθως δουλεύει. Για παράδειγμα, σε κάθε βήμα της μεθόδου Newton-Raphson βρίσκουμε τον μι-
κρότερο ακέραιο m ≥ 0 για τον οποίο
|f (xc + 2−m d)| < (1 − α2−m )|f (xc )|. (6.11)
Εδώ d = −f ′ (xc )−1 f (xc ) είναι η διόρθωση και α ∈ (0, 1) μια μικρή παράμετρος με σκοπό την ευκολότερη
ικανοποίηση της σχέσης (6.11). Τυπικά, α = 10−4 .
Στο Σχήμα 6.2 έχουμε απεικονίσει την ποσότητα log |f (xn )| για κάθε επανάληψη της μεθόδου Newton-
Raphson για τη λύση της εξίσωσης f (x) = arctan x = 0 με αρχική εκτίμηση την x0 = 10. Οι ακέραιοι
που εμφανίζονται κάτω από τα κόκκινα σημεία είναι οι τιμές της μεταβλητής m, δηλαδή ο αριθμός των υπο-
διπλασιασμών της διόρθωσης σε κάθε βήμα.
Η μέθοδος Newton-Raphson για τη λύση της εξίσωσης f (x) = 0 μπορεί να τροποποιηθεί έτσι ώστε να
απαιτεί μόνο υπολογισμούς τιμών της συνάρτησης f . Αντικαθιστούμε την ποσότητα f ′ (xc ) από την κλίση
της ευθείας η οποία διέρχεται από τα σημεία (xc , f (xc )) και (xc + hc , f (xc + hc )) για κάποιο |hc | 1,
δηλαδή από την ποσότητα
f (xc + hc ) − f (xc )
ac = .
hc
Με άλλα λόγια χρησιμοποιούμε τώρα το τοπικό μοντέλο (συγκρίνετε με τη σχέση (6.4))
cc (x) = f (xc ) + ac (x − xc ),
M
οπότε το βήμα της τροποποιημένης μεθόδου Newton-Raphson είναι
f (xc )
x+ = xc − . (6.12)
ac
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 97
Σχήμα 6.2: Η μέθοδος Newton-Raphson για τη λύση της f (x) = arctan x = 0 με αρχική εκτίμηση
x0 = 10.
Τα ερωτήματα που προκύπτουν αμέσως έχουν να κάνουν τόσο με την επιλογή της ποσότητας hc όσο και με
τη σύγκλιση της νέας αυτής μεθόδου. Γνωρίζουμε βέβαια από τον απειροστικό λογισμό ότι όταν hc → 0
τότε η ποσότητα ac συγκλίνει στην τιμή f ′ (xc ) και έχουμε βάσιμους λόγους να πιστεύουμε ότι η μέθοδος
συγκλίνει. Σημειώνουμε, όμως ότι απαιτεί έναν επιπλέον υπολογισμό της f (x) σε σύγκριση με τη μέθοδο
Newton-Raphson και αυτό μπορεί να είναι ακριβό υπολογιστικά. Αν αυτό όντως συμβαίνει, μπορούμε να
θέσουμε hc = x− − xc όπου x− είναι η προηγούμενη εκτίμηση της ρίζας έτσι ώστε
f (x− ) − f (xc )
ac = .
x− − xc
Με αυτόν τον τρόπο αποφεύγουμε τον επιπλέον υπολογισμό της f (x). Για προφανείς λόγους, η μέθοδος
αυτή ονομάζεται μέθοδος της τέμνουσας (secant method). Μπορεί να δειχθεί, κάτω από κατάλληλες υποθέσεις,
ότι η μέθοδος της τέμνουσας συγκλίνει αλλά η ταχύτητα σύγκλισης είναι μικρότερη από αυτήν της μεθόδου
Newton-Raphson, βλέπε [6], [7].
Για την εκτίμηση του σφάλματος της τροποποιημένης μεθόδου Newton-Raphson, ξεκινώντας από τη σχέ-
ση (6.12) έχουμε διαδοχικά
f (xc )
x+ − x∗ = xc − x∗ −
ac
−1
= ac [f (x∗ ) − f (xc ) − ac (x∗ − xc )]
= a−1 ′
c [f (x∗ ) − f (xc ) − f (xc )(x∗ − xc )
+ (f ′ (xc ) − ac )(x∗ − xc )]
Z x∗
−1 ′ ′ ′
= ac (f (s) − f (xc )) ds + (f (xc ) − ac )(x∗ − xc ) .
xc
Θέτοντας ec = |xc − x∗ | και e+ = |x+ − x∗ | και υποθέτοντας όπως στη μέθοδο Newton-Raphson ότι
f ′ ∈ Lipγ (D) για κάποιο ανοιχτό διάστημα D τέτοιο ώστε x∗ ∈ D, έχουμε, όπως στο Λήμμα 6.1 ότι
γ
e+ ≤ |a−1c | e 2
+ |f ′
(x c ) − a c |e c . (6.13)
2 c
Πάλι από το Λήμμα 6.1 έχουμε
γ
|f (xc + hc ) − f (xc ) − hc f ′ (xc )| ≤ |hc |2 ,
2
98 ΑΡΙΘΜΗΤΙΚΗ ΛΥΣΗ ΜΗ ΓΡΑΜΜΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
δηλαδή
γ
|ac − f ′ (xc )| ≤ |hc |. (6.14)
2
Χρησιμοποιώντας την (6.14) στην (6.13) παίρνουμε την εκτίμηση
γ
e+ ≤ (ec + |hc |)ec .
2|ac |
Όπως στο Θεώρημα 6.4 μπορούμε να δείξουμε ότι για |hc | αρκετά μικρό έχουμε |a−1 −1
c | ≤ 2ρ , οπότε η
προηγούμενη εκτίμηση δίνει τελικά
γ
e+ ≤ (ec + |hc |)ec . (6.15)
ρ
Πίνακας 6.3: Η Newton-Raphson, η τροποποιημένη Newton-Raphson και η μέθοδος της τέμνουσας για τη
λύση της f (x) = x2 − 1 = 0.
Η σύγκλιση της μεθόδου της τέμνουσας φαίνεται, για το συγκεκριμένο παράδειγμα, να είναι ελάχιστα πιο
αργή από αυτήν της τροποποιημένης μεθόδου Newton-Raphson αλλά, από την άλλη, πιο οικονομική σε
σχέση με τον αριθμό των υπολογισμών της συνάρτησης f (x) για την εξασφάλιση της ίδιας ακρίβειας προσέγ-
γισης της ρίζας. Η μάλλον απλοϊκή τεχνική επιλογής της διόρθωσης (6.11) μπορεί να βελτιωθεί με πολλούς
τρόπους. Παραπέμπουμε τον ενδιαφερόμενο αναγνώστη στο βιβλίο του Kelley [3] για περισσότερες πληρο-
φορίες.
Το αντικείμενο αυτού του κεφαλαίου υπάρχει πιο αναλυτικά σε πολλά βιβλία Αριθμητικής Ανάλυσης. Πα-
ραθέτουμε κάποιες αναφορές τις οποίες ο αναγνώστης μπορεί να συμβουλευτεί: [1], [2], [3], [4], [5], [6],
[7].
6.6 Ασκήσεις
6.6.1 Αποδείξτε ότι αν f (x∗ ) = f ′ (x∗ ) = 0, f ′′ (x∗ ) 6= 0 και f, f, f ′′ είναι συνεχής και φραγμένη γύρω
από το x∗ , τότε η μέθοδος Newton-Raphson συγκλίνει γραμμικά με limk→∞ ek+1 /ek = 1/2, όπου
ek = |xk − x∗ |, (xk )k≥0 η ακολουθία των προσεγγίσεων με τη μέθοδο Newton-Raphson.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 99
6.6.2 Αποδείξτε ότι αν f (x∗ ) = f ′ (x∗ ) = f ′′ (x∗ ) = 0, f ′′′ (x∗ ) 6= 0 και f, f, f ′′ , f ′′′ είναι συνεχής και
φραγμένη γύρω από το x∗ , τότε η μέθοδος Newton-Raphson συγκλίνει γραμμικά με
6.6.3 Ποια είναι η ταχύτητα σύγκλισης της μεθόδου Newton-Raphson για τη λύση της εξίσωσης x3 = 0;
Για την εξίσωση x + x4 = 0;
6.6.4 Εκτελέστε μερικά βήματα της μεθόδου Newton-Raphson για τη συνάρτηση f (x) = x4 − 12x3 +
47x2 −60x με x0 = 2. Σε ποια ρίζα φαίνεται να συγκλίνει η μέθοδος Newton-Raphson; Τι συμβαίνει
αν x0 = 1;
6.6.5 Βρείτε την ταχύτητα σύγκλισης της ακολουθίας xk = 1 + (0.9)k , k = 0, 1, . . .. Είναι η σύγκλιση
γραμμική;
6.6.7 Χρησιμοποιήστε τη μέθοδο Newton-Raphson για να υπολογίσετε τον αριθμό 1/a, για δεδομένο a >
0. Εκτελέστε μερικά βήματα της μεθόδου για a = 9, ξεκινώντας με x0 = 0.1. Ποια βλέπετε να είναι
η ταχύτητα σύγκλισης; Υπόδειξη: Σκεφτείτε τη συνάρτηση f (x) = ax − 1.
6.6.8 Υλοποιήστε τη μέθοδο Newton-Raphson σε ένα υπολογιστικό σύστημα που εκτελεί αριθμητική δι-
πλής ακρίβειας και δοκιμάστε το πρόγραμμά σας στις παρακάτω συναρτήσεις με τις δεδομένες αρχικές
τιμές:
6.6.9 Βρείτε (υπολογιστικά) μια αρχική τιμή x0 για την οποία η μέθοδος Newton-Raphson για τη συνάρ-
τηση f (x) = arctan x παράγει την ακολουθία προσεγγίσεων x1 = −x0 , x2 = x0 , x3 = −x0 , . . ..
6.6.10 Έστω f (x) = (x − 3)3 για x ∈ [1, 5]. Χρησιμοποιήστε τη μέθοδο Newton-Raphson με αρχική τιμή
x0 = 4 για να προσεγγίσετε την προφανή ρίζα ξ = 3. Δείξτε ότι η σύγκλιση είναι γραμμική.
√
6.6.11 Βρείτε μια προσέγγιση του a, a > 0, χρησιμοποιώντας τη μέθοδο Newton-Raphson. Δείξτε ότι
συγκλίνει για οποιαδήποτε αρχική τιμή x0 > 0.
6.6.12 Για a > 0 και δεδομένες αρχικές τιμές x0 , x1 ορίζουμε την ακολουθία
a + xk−1 xk
xk+1 = , k = 1, 2, . . .
xk−1 + xk
√
Χρησιμοποιήστε τη μέθοδο της τέμνουσας για να δείξετε ότι η ακολουθία αυτή συγκλίνει στο a.
6.6.13 Έστω f ∈ C 2 (R) με f ′ (x) > 0 και f ′′ (x) > 0 για κάθε x ∈ R. Βρείτε μια συνάρτηση με τις
συγκεκριμένες ιδιότητες η οποία δεν έχει ρίζα στο R. Δείξτε ότι αν η f έχει μια ρίζα ξ, τότε αυτή είναι
μοναδική. Τέλος, δείξτε ότι για κάθε x0 ∈ R η μέθοδος Newton-Raphson συγκλίνει και η σύγκλιση
είναι τετραγωνική.
100 ΑΡΙΘΜΗΤΙΚΗ ΛΥΣΗ ΜΗ ΓΡΑΜΜΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
6.6.14 Υποθέστε ότι η f ′ είναι μονότονη και δεν αλλάζει πρόσημο. Δείξτε ότι η ακολουθία της μεθόδου New-
ton-Raphson για την προσέγγιση της ρίζας ξ είναι είτε μονότονα φθίνουσα, δηλαδή ξ < xk+1 < xk ,
είτε μονότονα αύξουσα, δηλαδή xk < xk+1 < ξ.
6.6.15 Η μέθοδος Steffensen. Έστω I ⊂ R ένα διάστημα και f : I → R τέτοια ώστε f (ξ) = 0 για
κάποιο ξ ∈ I. Υποθέστε ότι η f είναι δύο φορές συνεχώς παραγωγίσιμη σε μια γειτονιά Iδ ⊂ I και
f ′ (ξ) 6= 0, f ′′ (ξ) 6= 0. Αποδείξτε ότι αν η αρχική τιμή x0 της μεθόδου
είναι αρκετά κοντά στη ρίζα ξ τότε η ακολουθία {xk } συγκλίνει τετραγωνικά στη ρίζα ξ.
Βιβλιογραφία
[1] K. Atkinson και W. Han. Theoretical Numerical Analysis. A Functional Analysis Framework. English.
3rd ed. Τόμ. 39. Texts Appl. Math. Berlin: Springer, 2009. isbn: 978-1-4419-0457-7. doi: 10 .
1007/978‐1‐4419‐0458‐4.
[2] W. Gautschi. Numerical Analysis. English. 2nd ed. Boston, MA: Birkhäuser, 2012. isbn: 978-0-
8176-8258-3. doi: 10.1007/978‐0‐8176‐8259‐0.
[3] T. Kelley. Iterative Methods for Solving Linear and Nonlinear Equations. Vol. 16, Frontiers in Applied
Mathematics, SIAM, 1995.
[4] L. R. Scott. Numerical Analysis. English. Princeton, NJ: Princeton University Press, 2011. isbn:
978-0-691-14686-7.
[5] J. Stoer και R. Bulirsch. Introduction to Numerical Analysis. English. 3rd ed. Τόμ. 12. Texts Appl.
Math. New York, NY: Springer, 2002. isbn: 0-387-95452-X.
[6] E. Süli και D. F. Mayers. An Introduction to Numerical Analysis. Cambridge University Press, 2003.
isbn: 0-521-00794-1.
[7] Γ. Δ. Ακρίβης και B. A. Δουγαλής. Εισαγωγή στην Αριθμητική Ανάλυση. Πανεπιστημιακές Εκδόσεις
Κρήτης, 2017.
ΚΕΦΑΛΑΙΟ 7
Περίληψη
Στο κεφάλαιο αυτό μελετούμε αριθμητικές μεθόδους για τη λύση ενός μη γραμμικού συστήματος n εξισώσεων
σε n αγνώστους. Προβλήματα που οδηγούν στην επίλυση μη γραμμικών συστημάτων εμφανίζονται πολύ συ-
χνά στις εφαρμογές. Σημαντική πηγή προβλημάτων αποτελούν, για παράδειγμα ο υπολογισμός ακροτάτων
κάποιου συναρτησιακού ή η βελτιστοποίηση, θέματα τα οποία εξετάζουμε αλλού. Η παράθεση των αποτελε-
σμάτων ακολουθεί το κλασικό βιβλίο των [5], ενώ η απόδειξη του θεωρήματος του Kantorovich τις σημειώ-
σεις [8].
Προαπαιτούμενη γνώση: Βασικές γνώσεις Απειροστικού λογισμού σε πολλές διάστασεις. Συνέχεια και πα-
ραγώγιση πραγματικών συναρτήσεων. Μέγιστη και ελάχιστη τιμή πραγματικών συναρτήσεων. Νόρμες δια-
νυσμάτων και πινάκων.
Εξετάζουμε μεθόδους για την αριθμητική επίλυση μη γραμμικών συστημάτων εξισώσεων της μορφής
fi (x1 , . . . , xn ) = 0, i = 1, . . . , n, (7.1)
τα οποία συνήθως γράφουμε στη μορφή F (x) = 0, όπου F είναι μια μη γραμμική, εν γένει, απεικόνιση
ενός συνόλου D του Rn στον Rn , με συνιστώσες F (x) = (f1 (x), f2 (x), . . . , fn (x))T και, ως συνήθως,
x = (x1 , x2 , . . . , xn )T .
Ορισμός 7.1. Λέμε ότι η απεικόνιση F : D ⊂ Rn → Rn είναι παραγωγίσιμη σ’ ένα σημείο x ∈ Int(D)
αν υπάρχει γραμμικός τελεστής A(x) : Rn → Rn τέτοιος ώστε για κάποια νόρμα k · k του Rn να ισχύει
kF (x + h) − F (x) − A(x)hk
lim = 0. (7.2)
h→0 khk
Λόγω της ισοδυναμίας των νορμών στον Rn , η ύπαρξη του A(x) είναι ανεξάρτητη της νόρμας k·k. Εύκολα
βλέπουμε ότι αν η F είναι παραγωγίσιμη στο σημείο x, τότε ο τελεστής A(x) είναι μοναδικός. Πράγματι, αν
A1 (x) και A2 (x) είναι τέτοιοι ώστε για τον κάθε ένα να ισχύει η (7.2), τότε για 0 6= y ∈ Rn έχουμε
k(A1 (x) − A2 (x))yk kF (x + ty) − F (x) − tA1 (x)yk
≤
kyk ktyk
kF (x + ty) − F (x) − tA2 (x)yk
+ .
ktyk
Θέτοντας h = ty και παίρνοτας t → 0 έχουμε, λόγω της (7.2), ότι A1 (x)y = A2 (x)y για κάθε y ∈ Rn ,
δηλαδή ότι A1 (x) = A2 (x). Αν λοιπόν η F είναι παραγωγίσιμη στο x, θα λέμε ότι ο τελεστής A(x) είναι η
παράγωγος της F (ακριβέστερα η παράγωγος της F με της έννοια του Fréchet στο σημείο x) και θα γράφουμε
A(x) = F ′ (x).
Γενικά λέμε ότι F : D ⊂ Rn → Rn είναι παραγωγίσιμη σ’ ένα σύνολο D0 ⊂ D αν D0 ⊂ Int(D) και
η F είναι παραγωγίσιμη για κάθε x ∈ D0 . Τότε η F ′ μπορεί να θεωρηθεί ως απεικόνιση του D0 στο σύνολο
L(Rn ) των γραμμικών τελεστών από τον Rn στον εαυτό του. Η γραμμικότητα της πράξης της παραγώγισης
είναι εύκολο να αποδειχθεί: Αν οι απεικονίσεις F1 , F2 : D ⊂ Rn → Rn είναι παραγωγίσιμες στο x ∈
Int(D), τότε για α, β ∈ R η απεικόνιση αF1 + βF2 είναι παραγωγίσιμη στο x και (αF1 + βF2 )′ (x) =
αF1′ (x) + βF2′ (x).
Αν η παράγωγος F ′ (x) υπάρχει στο σημείο x ∈ Int(D) τότε υπάρχουν όλες οι μερικές παράγωγοι ∂x ∂fi
j
,
′
1 ≤ i, j ≤ n, και ο n × n πίνακας που παριστάνει τον γραμμικό τελεστή F (x) ως προς την κανονική
βάση {ej }, 1 ≤ j ≤ n, του Rn είναι ο Ιακωβιανός πίνακας J(x), Jij (x) = ∂x∂fi
j
, 1 ≤ i, j ≤ n. Πράγματι,
θέτοντας h = tej στην (7.2) με k · k = k · k2 και υποθέτοντας ότι στο σημείο x η F ′ (x) παριστάνεται από
τον πίνακα A = (aij ), έχουμε για 1 ≤ i, j ≤ n,
fi (x + tej ) − fi (x)
lim − aij (x) = 0,
t→0 t
∂fi
δηλαδή aij = ∂x j
= Jij (x). Η ύπαρξη όμως των μερικών παραγώγων δεν εγγυάται ότι η F είναι παραγω-
γίσιμη στο x και αυτό φαίνεται από το ακόλουθο αποτέλεσμα:
Λήμμα 7.1. Έστω ότι η F : D ⊂ Rn → Rn είναι παραγωγίσιμη στο σημείο x ∈ Int(D). Τότε η F είναι
συνεχής στο x.
Απόδειξη. Επειδή x ∈ Int(D), υπάρχει δ1 > 0 τέτοιο ώστε x+h ∈ D αν khk < δ1 . Η παραγωγισιμότητα
της F στο x συνεπάγεται τώρα ότι για δεδομένο ϵ > 0 υπάρχει δ > 0, το οποίο μπορούμε να πάρουμε
μικρότερο από δ1 , τέτοιο ώστε kF (x + h) − F (x) − F ′ (x)hk ≤ ϵkhk αν khk < δ. Συνεπώς kF (x +
h) − F (x)k ≤ (kF ′ (x)k + ϵ)khk αν khk < δ, ένα αποτέλεσμα ισχυρότερο μάλιστα από τη συνέχεια της
F στο x.
Παρατήρηση 7.1. Ο ορισμός της παραγώγου γενικεύεται εύκολα σε απεικονίσεις F : D ⊂ Rn → Rm . Η
παράγωγος F ′ είναι ένας γραμμικός τελεστής από τον Rn στον Rm , δηλαδή ′
F ∈ L(R , R ) και παριστά-
n m
νεται πάλι από τον m × n Ιακωβιανό πίνακα¹ J(x) = (Jij (x)) = ∂x ∂fi
j
, 1 ≤ i ≤ m, 1 ≤ j ≤ n. Στην
περίπτωση που m = 1, δηλαδή μιας απεικόνισης f : D ⊂ Rn → R, η παράγωγος f ′ (x) παριστάνεται
από το διάνυσμα ∇f (x) = ( ∂x∂f
, ∂f , . . . , ∂x
1 ∂x2
∂f T
n
) .
¹Ο πίνακας J(x) ονομάζεται Ιακωβιανός πίνακας από το όνομα του Γερμανού μαθηματικού Carl Gustav Jacob Jacobi (1804–
1851) με θεμελειώδεις συνεισφορές στις ελλειπτικές εξισώσεις, στις διαφορικές εξισώσεις και στη θεωρία αριθμών.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 103
Ορισμός 7.2. Μια συνεχής συνάρτηση f : Rn → R λέγεται συνεχώς παραγωγίσιμη στο σημείο x ∈ Rn αν
∂f
οι μερικές παράγωγοι ∂x i
(x), i = 1, . . . , n, υπάρχουν και είναι συνεχείς συναρτήσεις. Θα γράφουμε
∂f ∂f ∂f
∇f (x) = ( (x), (x), . . . , (x))T . (7.3)
∂x1 ∂x2 ∂xn
Λήμμα 7.2. Έστω f : Rn → R συνεχώς παραγωγίσιμη σε ένα κυρτό σύνολο D ⊂ Rn . Τότε για x ∈ D και
οποιοδήποτε μη μηδενικό διάνυσμα p ∈ Rn η παράγωγος της f στο x στην κατεύθυνση του p,
∂f f (x + ϵp) − f (x)
(x) = lim ,
∂p ϵ→0 ϵ
Απόδειξη. Ορίζουμε τη συνάρτηση g(t) = f (x + tp), t ∈ [0, 1] και γράφουμε x(t) = x + tp. Από τον
κανόνα της αλυσίδας έχουμε για 0 ≤ α ≤ 1,
Xn
∂f dx(t)i Xn
∂f
′
g (α) = (x(α)) (α) = (x(α)) · pi = ∇f (x + αp)T p,
i=1
∂x i dt i=1
∂x i
δηλαδή, τη σχέση (7.4). Τέλος από το θεώρημα της μέσης τιμής έχουμε g(1) = g(0) + g ′ (ξ) για κάποιο
ξ ∈ (0, 1), ισοδύναμα,
Ορισμός 7.3. Έστω f : Rn → R μια συνεχώς παραγωγίσιμη συνάρτηση. Θα λέμε ότι η f είναι δύο φορές
2f
συνεχώς παραγωγίσιμη στο x ∈ Rn αν οι μερικές παράγωγοι δεύτερης τάξης ∂x∂i ∂x j
(x), 1 ≤ i, j ≤ n,
υπάρχουν και είναι συνεχείς συναρτήσεις. Η εσσιανή³ (Hessian) της f στο x είναι ο n × n πίνακας
∂ 2 f (x)
∇2 f (x)ij = , 1 ≤ i, j ≤ n. (7.6)
∂xi ∂xj
Θα λέμε ότι f είναι δύο φορές συνεχώς παραγωγίσιμη σε κάποιο ανοιχτό σύνολο D ⊂ Rn και θα γράφουμε
f ∈ C 2 (D) αν η f είναι δύο φορές συνεχώς παραγωγίσιμη σε κάθε σημείο του συνόλου D.
Η απόδειξη του παρακάτω αποτελέσματος είναι ανάλογη με αυτή του Λήμματος 7.2.
Λήμμα 7.3. Έστω f : Rn → R δύο φορές συνεχώς παραγωγίσιμη στο ανοιχτό και κυρτό σύνολο D ⊂ Rn . Για
κάθε x ∈ D και για κάθε μη μηδενικό διάνυσμα p ∈ Rn η δεύτερη παράγωγος της f στο x στη κατεύθυνση του
p,
∂ 2f
∂f
∂p
(x + ϵp) − ∂f
∂p
(x)
(x) = lim ,
∂p2 ϵ→0 ϵ
υπάρχει και ισούται με pT ∇2 f (x)p. Επιπλέον για κάθε x, x + p ∈ D υπάρχει σημείο z στο ευθύγραμμο τμήμα
που συνδέει τα x και x + p τέτοιο ώστε
1
f (x + p) = f (x) + ∇f (x)T p + pT ∇2 f (z)p. (7.7)
2
Παρατήρηση. Η εσσιανή είναι πάντα συμμετρικός πίνακας εφόσον, βέβαια, η f είναι δύο φορές συνεχώς πα-
ραγωγίσιμη.
1 !
και
6x1 x42 + 2x2
x21
12x21 x32 − x21
∇2 f (x) = .
12x21 x32 − 1
x21
12x31 x22
Η δεύτερη παράγωγος της f στο σημείο xc = (1, 0)T στην κατεύθυνση του διανύσματος p = (−1, 1)T
ισούται με
0 −1 −1
p ∇ f (xc )p = −1 1
T 2
= 2.
−1 0 1
∂fi
F ′ (x)ij = (x), 1 ≤ i, j ≤ n.
∂xj
Θα λέμε ότι η F είναι συνεχώς παραγωγίσιμη στο D και θα γράφουμε F ∈ C 1 (D) αν η F είναι συνεχώς
παραγωγίσιμη σε κάθε x ∈ D.
³Από το όνομα του Γερμανού μαθηματικού Ludwig Otto Hesse (1811–1874).
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 105
τότε
2x1 3x22 −4x33
F ′ (x) = x2 x3 x1 x3 x1 x2
2x2 + x3 2x1 − 3x3 −3x2 + x1
Μια σημαντική διαφορά με την περίπτωση των βαθμωτών συναρτήσεων είναι η απώλεια του θεωρήματος
της μέσης τιμής με την έννοια ότι εν γένει, δεν υπάρχει z ∈ Rn τέτοιο ώστε F (x+p) = F (x)+F ′ (z)p για
δεδομένο μη μηδενικό διάνυσμα p ∈ Rn . Για παράδειγμα, αν F : R2 → R2 έχει συνιστώσες f1 (x1 , x2 ) =
ex1 − 1 και f (x2 ) = x21 − 2x2 , τότε η σχέση F (1, 1) = F (0, 0) + F ′ (z)(1, 1)T είναι ισοδύναμη με τις
z
e−1 0 e1 0 1
= + ,
−1 0 2z1 −2 1
Λήμμα 7.4. Υποθέτουμε ότι η F : Rn → Rn είναι συνεχώς παραγωγίσιμη σε ένα κυρτό σύνολο D. Τότε, αν
x, y ∈ D Z 1
F (y) = F (x) + F ′ (x + t(y − x))(y − x) dt. (7.8)
0
Απόδειξη. Επειδή η F ′ είναι συνεχής στο D, η απεικόνιση t 7→ F ′ (x + t(y − x)) είναι συνεχής στο [0, 1].
Τότε, οι διανυσματικές συναρτήσεις ∇fi (x + t(y − x)), i = 1, . . . , n, είναι συνεχείς συναρτήσεις του t για
t ∈ [0, 1] και συνεπώς Riemann ολοκληρώσιμες. Τώρα για x, y ∈ D έχουμε από τον κανόνα της αλυσίδας
d
fi (x + t(y − x)) = ∇fi (x + t(y − x))T (y − x), i = 1, . . . , n,
dt
και ολοκληρώνοντας ως προς t από 0 έως 1 έχουμε
Z 1
fi (y) − fi (x) = ∇fi (x + t(y − x))T (y − x) dt, i = 1, . . . , n,
0
Απόδειξη. Λόγω της συνέχειας της x 7→ kxk και της συνέχειας της G, η απεικόνιση t 7→ kG(t)k είναι συ-
νεχής και επομένως ολοκληρώσιμη κατά Riemann στο [a, b]. Από την ολοκληρωσιμότητα των απεικονίσεων
t 7→ G(t) και t 7→ kG(t)k έχουμε ότι για οποιοδήποτε ϵ > 0 υπάρχει διαμερισμός a ≤ t0 < t1 < · · · <
ts ≤ b τέτοιος ώστε
Z b X
s
G(t) − G(tj )(tj − tj−1 ) ≤ ϵ,
a j=1
Z b X
s
kG(t)k dt − kG(tj )k (tj − tj−1 ) ≤ ϵ.
a j=1
Από την τριγωνική ανισότητα και τις δύο αυτές σχέσεις έχουμε
Z b X
s
G(t) dt ≤ G(tj )(tj − tj−1 ) + ϵ
a j=1
X
s
≤ kG(tj )k (tj − tj−1 ) + ϵ
j=1
Z b
≤ kG(t)k dt + 2ϵ.
a
Ορισμός 7.4. Έστω k · k μια νόρμα στον Rn και G : Rn → Rn×n . Λέμε ότι η G είναι Lipschitz συνεχής
στο σημείο x ∈ Rn αν υπάρχει ανοιχτό σύνολο D ⊂ Rn με x ∈ D και σταθερά γ τέτοια ώστε
Λήμμα 7.6. Υποθέτουμε ότι η F : Rn → Rn είναι συνεχώς παραγωγίσιμη σε ένα κυρτό σύνολο D και ότι
F ′ ∈ Lipγ (D). Τότε αν x, y ∈ D έχουμε
γkx − yk2
′
kF (y) − F (x) − F (x)(y − x)k ≤ . (7.11)
2
Απόδειξη. Για x, y ∈ D έχουμε από το Λήμμα 7.4 ότι
Z 1
′
F (y) − F (x) − F (x)(y − x) = F ′ (x + t(y − x))(y − x) dt
0
Z 1
− F ′ (x)(y − x) dt.
0
Ορισμός 7.7. Λέμε ότι η απεικόνιση G : D ⊂ Rn → Rn είναι συστολή σ’ ένα σύνολο D0 ⊂ D αν υπάρχει
νόρμα k · k του Rn και a < 1 τέτοια ώστε
από την οποία παίρνουμε για οποιοδήποτε m ≥ 1 και για κάθε k = 1, 2, . . . ότι
X
m
kxk+m − xk k ≤ kxk+i − xk+i−1 k (7.17)
i=1
≤ (a m−1
+ · · · + a + 1)kxk+1 − xk k
1
≤ kxk+1 − xk k
1−a
a
≤ kxk − xk−1 k
1−a
ak
≤ kx1 − x0 k.
1−a
Η (7.17) δείχνει ότι η ακολουθία {xk } είναι Cauchy στο κλειστό διάστημα D0 και συνεπώς υπάρχει x∗ ∈ D0
τέτοιο ώστε xk → x∗ καθώς k → ∞. Το όριο αυτό είναι σταθερό σημείο της G γιατί
με το δεξί μέλος της παραπάνω σχέσης να συγκλίνει στο μηδέν καθώς k → ∞. Ακόμα το x∗ είναι το μοναδικό
σταθερό σημείο της G στο D0 , γιατί αν υπήρχε και ένα δεύτερο σταθερό σημείο x∗∗ θα είχαμε
το οποίο είναι προφανώς άτοπο. Οι εκτιμήσεις (7.15) και (7.16) προκύπτουν από την (7.17) παίρνοντας το
όριο m → ∞.
Μελετάμε τώρα εξειδικεύσεις της γενικής επαναληπτικής μεθόδου (7.12) στην περίπτωση που η απεικόνιση
G είναι της μορφής
G(x) = x − A(x)−1 F (x), (7.18)
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 109
Σχήμα 7.1: Βήματα της μεθόδου Newton-Raphson με αρχική τιμή x0 = (1, 5)T , x0 = (−4, 3)T και
x0 = (2, −4)T , αντίστοιχα, πάνω από τις ισοϋψείς καμπύλες της kF k2 του Παραδείγματος 7.3.
όπου A(x) ∈ L(Rn ) είναι ένας αντιστρέψιμος γραμμικός τελεστής. Μελετάμε δηλαδή, επαναληπτικές με-
θόδους της μορφής
Η σημαντικότερη ειδική περίπτωση των (7.18) και (7.19) είναι η μέθοδος Newton-Raphson για την οποία
A(x) = F ′ (x). Για x0 ∈ Rn ορίζουμε την ακολουθία προσεγγίσεων (xk ) της x∗ από τις σχέσεις
έχει τις προφανείς ρίζες (3, 0)T και (0, 3)T . Αν θέσουμε x0 = (1, 5)T , τότε οι δύο πρώτες επαναλήψεις της
μεθόδου Newton-Raphson δίνουν
1 1 3 −1.625
s =− , s0 =
2 10 0 17 −1.375
x1 = x0 + s0 = (−0.625, 3.625)T
145
1 1 0 272
s1 = 145 , s1 = ,
− 45 29
4 32
− 145
272
x2 = x1 + s1 ≈ (−0.092, 3.092)T
Στο Σχήμα 7.1 φαίνεται η σύγκλιση της ακολουθίας προσεγγίσεωv της μεθόδου Newton-Raphson με αρχικές
τιμές x0 = (1, 5)T , x0 = (−4, 3)T και x0 = (2, −4)T πάνω από τις ισοϋψείς καμπύλες της kF k2 . Τα
σημεία που σημειώνονται με κόκκινα άστρα είναι οι ρίζες (3, 0)T και (0, 3)T της εξίσωσης F (x) = 0.
Η απόδειξη της τοπικά τετραγωνικής σύγκλισης της μεθόδου Newton-Raphson για συστήματα εξισώ-
σεων ακολουθεί την ιδέα της απόδειξης στην περίπτωση μιας μη γραμμικής εξίσωσης.
Θεώρημα 7.3. Υποθέτουμε ότι η απεικόνιση F : D ⊂ Rn → Rn είναι παραγωγίσιμη σ’ ένα σημείο x∗ ∈
Int(D) όπου F (x∗ ) = 0. Για x ∈ S0 , όπου S0 ⊂ D είναι μια ανοιχτή περιοχή του x∗ , θεωρούμε μια οικογένεια
110 ΑΡΙΘΜΗΤΙΚΗ ΛΥΣΗ ΜΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
γραμμικών τελεστών A(x) ∈ L(Rn ). Υποθέτουμε ότι η απεικόνιση x 7→ A(x) είναι συνεχής στο x∗ και
ότι ο A(x∗ ) είναι αντιστρέψιμος. Τότε υπάρχει κλειστή μπάλα S(x∗ , δ) ⊂ S0 στην οποία η απεικόνιση G :
S(x∗ , δ) → Rn που ορίζεται από την (7.18) είναι καλά ορισμένη. Επιπλέον η G είναι παραγωγίσιμη στο x∗ και
η παράγωγός της εκει είναι
G′ (x∗ ) = I − A(x∗ )−1 F ′ (x∗ ). (7.22)
Απόδειξη. Θα δείξουμε πρώτα ότι ο τελεστής A(x) είναι αντιστρέψιμος για x ∈ S(x∗ , δ) εξασφαλίζοντας
έτσι ότι η G είναι καλά ορισμένη στο S(x∗ , δ). Έστω β = kA(x∗ )−1 k και ϵ > 0 τέτοιο ώστε 0 < ϵ <
1/2β. Από τη συνέχεια της απεικόνισης x 7→ A(x) υπάρχει δ > 0 τέτοιο ώστε S(x∗ , δ) ⊂ S0 και
Χρησιμοποιούμε τώρα την (1.35) με A = A(x∗ ), B = A(x) − A(x∗ ). Αφού υπάρχει ο A(x∗ )−1 και
kA(x∗ )−1 k kA(x) − A(x∗ )k ≤ ϵβ < 1/2 για x ∈ S(x∗ , δ), συμπεραίνουμε ότι o A(x) είναι αντιστρέ-
ψιμος για x ∈ S(x∗ , δ) και
Δείχνουμε τώρα ότι η G είναι παραγωγίσιμη στο x∗ και η παράγωγός της δίνεται από την (7.22). Υποθέτω-
ντας τώρα ότι η ακτίνα της μπάλας S(x∗ , δ) είναι αρκετά μικρή έχουμε για κάθε x ∈ S(x∗ , δ),
Επειδή F (x∗ ) = 0, δηλαδή G(x∗ ) = x∗ , το δεξί μέλος της παραπάνω σχέσης μπορεί να γραφεί ως
Χρησιμοποιώντας τώρα την τριγωνική ανισότητα και τις (7.24), (7.25) και (7.23) έχουμε
Συμπεραίνουμε λοιπόν ότι η G είναι παραγωγίσιμη στο x∗ και ότι όντως η παράγωγός της G′ (x∗ ) δίνεται
από την (7.22).
Χρησιμοποιώντας το Θεώρημα του Οstrowski και το Θεώρημα 7.3 έχουμε το ακόλουθο αποτέλεσμα το-
πικής σύγκλισης για την επαναληπτική μέθοδο (7.19).
Λήμμα 7.8. Έστω ότι ισχύουν οι υποθέσεις του Θεωρήματος 7.3. Επιπλέον υποθέτουμε ότι
Για τη μέθοδο Newton-Raphson όπου A(x) = F ′ (x) έχουμε το ακόλουθο θεώρημα τοπικής σύγκλισης:
Θεώρημα 7.4. Έστω F : D ⊂ Rn → Rn παραγωγίσιμη σε μια ανοιχτή περιοχή S0 ⊂ D του σημείου x∗
όπου F (x∗ ) = 0. Υποθέτουμε επίσης ότι η F ′ είναι συνεχής στο x∗ και ότι ο F ′ (x∗ ) είναι αντιστρέψιμος. Τότε
το x∗ είναι σημείο έλξης της μεθόδου Newton-Raphson.
Απόδειξη. Από το Θεώρημα 7.3 με A(x) = F ′ (x) συμπεραίνουμε ότι η απεικόνιση επανάληψης G(x) =
x − F ′ (x)−1 F (x) της μεθόδου Newton-Raphson είναι καλά ορισμένη σε μια μπάλα S(x∗ , δ) ⊂ S0 . Επι-
πλέον G′ (x∗ ) = I − F ′ (x∗ )−1 F ′ (x∗ )) = 0, οπότε ρ(G′ (x∗ )) = 0 και το Λήμμα 7.8 δίνει ότι το x∗ είναι
σημείο έλξης της ακολουθίας της μεθόδου Newton-Raphson.
Μπορούμε τώρα να αποδείξουμε ότι, κάτω από ορισμένες συνθήκες, η σύγκλιση της ακολουθίας προσεγ-
γίσεων της μεθόδου Newton-Raphson προς το σημείο έλξης x∗ είναι τετραγωνική.
Θεώρημα 7.5. Υποθέτουμε ότι ισχύουν όλες οι προϋποθέσεις του Θεωρήματος 7.4. Τότε για το σημείο έλξης x∗
ισχύει ότι
kxk+1 − x∗ k
lim = 0. (7.27)
k→∞ kxk − x∗ k
Παρατήρηση 7.2. Συνέπεια του γεγονότος ότι G′ (x∗ ) = 0 είναι η (7.27) για τη μέθοδο Newton-Raphson.
Στην περίπτωση μιας γενικής επαναληπτικής μεθόδου, αν η G είναι συστολή έχουμε απλώς ότι kxk+1 −
x∗ k ≤ akxk − x∗ k, k ≥ 0 για μια σταθερά 0 < a < 1, δηλαδή γραμμική σύγκλιση. Αντίθετα στην
περίπτωση της μεθόδου Newton-Raphson, αν ισχύει η (7.28), η σύγκλιση είναι τετραγωνική.
Παρατήρηση 7.3. Η εφαρμογή της μεθόδου Newton-Raphson στην πράξη απαιτεί, για κάθε k, τον υπολο-
γισμό του n × n Ιακωβιανού πίνακα J(xk ), του διανύσματος F (xk ) και την επίλυση ενός n × n γραμμικού
συστήματος, δείτε το παράδειγμα (7.20)–(7.21). Επειδή σε πολλές περιπτώσεις αυτό το κόστος μπορεί να
είναι απαγορευτικό, καταφεύγουμε συχνά σε απλουστεύσεις της μεθόδου Newton-Raphson όπου ο γραμμι-
κός τελεστής A(xk ) αποτελεί προσέγγιση της F ′ (xk ). Μια προφανής τέτοια απλούστευση είναι η λεγόμενη
μέθοδος της χορδής
xk+1 = xk − F ′ (x0 )−1 F (xk ), k ≥ 0, x0 δεδομένο, (7.31)
η οποία σε κάθε βήμα απαιτεί τη λύση ενός γραμμικού συστήματος με σταθερό πίνακα J(x0 ), ο οποίος μπορεί
να υπολογισθεί και να αναλυθεί πριν αρχίσει η επανάληψη (7.31). Μπορεί να αποδειχθεί ότι αυτή η μέθοδος,
γενικά, συγκλίνει γραμμικά.
Σε μια άλλη στρατηγική απλούστευσης, μπορούμε να γράψουμε τον Ιακωβιανό πίνακα J(x) στη μορφή
με Lij = Jij για i > j, Lij = 0, αν i ≤ j, και Uij = Jij , αν i < j, Uij = 0 αν i ≥ j, και Dii = Jii , σε
αναλογία με τις κλασικές επαναληπτικές μεθόδους. Θεώρουμε τότε, αν βέβαια, Jii 6= 0, την επαναλήπτική
μέθοδο
xk+1 = xk − (D(xk ) + L(xk ))−1 F (xk ), k ≥ 0, x0 δεδομένο,
η οποία απαιτεί τη λύση ενός τριγωνικού συστήματος για κάθε k. Για προφανείς λόγους, η μέθοδος αυτή
ονομάζεται μέθοδος Newton/Gauss-Seidel. Μια πιο ακραία επιλογή θα ήταν η μέθοδος Newton-Jacobi,
δηλαδή,
xk+1 = xk − D(xk )−1 F (xk ), k ≥ 0, x0 δεδομένο.
Για τις δύο αυτές μεθόδους μπορούν να αποδειχθούν τοπικά θεωρήματα σύγκλισης, όπου βέβαια η ταχύτητα
σύγκλισης είναι, γενικά, γραμμική.
Στην πράξη πολλές φορές οι μερικές παράγωγοι των συνιστωσών fi της απεικόνισης F δεν είναι γνω-
στές ή είναι δύσκολο να υπολογισθούν αναλυτικά. Μπορούμε να καταφύγουμε σε προσεγγίσεις των μερικών
παραγώγων ∂fi (xk )/∂xj με πεπερασμένες διαφορες (fi (xk + hej ) − fi (xk ))/h. Αν το h είναι αρκετά
μικρό, μπορεί να δειχθεί ότι αυτή η υπολογιστική τεχνική διατηρεί πολλά από τα χαρακτηριστικά της με-
θόδου Newton-Raphson. Ειδικότερα, αν η F ικανοποιεί τις συνθήκες του Θεωρήματος 7.4 και την (7.28),
τότε υπάρχει σ > 0 και περιοχή S του σημείου x∗ τέτοια ώστε αν διαλέξουμε μια ακολουθία πραγματικών
αριθμών {hk } με 0 < |hk | ≤ σ, k ≥ 0, τότε η ακολουθία {xk } που παράγει η μέθοδος (7.19) με
fi (xk + hk ej ) − fi (xk )
Aij (xk ) = , 1 ≤ i, j ≤ n, k ≥ 0,
hk
είναι καλά ορισμένη για x0 ∈ S και έχει το x∗ ως σημείο έλξης. Επιπλέον η σύγκλιση στο x∗ είναι, γενικά,
γραμμική. Αν διαλέξουμε την ακολουθία {hk } έτσι ώστε |hk | → 0 καθώς k → ∞, τότε η σύγκλιση είναι
υπεργραμμική. Αυτή η μέθοδος, σε μια διάσταση, είναι γνωστή ως η μέθοδος της τέμνουσας. Οι γενικεύσεις
αυτής της μεθόδου σε συστήματα καθώς και παρεμφερείς προσεγγίσεις A(x) της F ′ (x) οδηγούν σε μια με-
γάλη κλάση μεθόδων, τις λεγόμες μεθόδους τύπου Newton (quasi-Newton methods), δείτε για παράδειγμα,
[2]. Στο εξής, αν k · k είναι μια νόρμα στον Rn , θα γράφουμε N (x, r) = {y ∈ Rn : kx − yk < r} για να
συμβολίσουμε μια ανοιχτή γειτονιά του σημείου x ακτίνας r.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 113
Θεώρημα 7.6. Έστω F : Rn → Rn μια συνεχώς παραγωγίσιμη συνάρτηση στο ανοιχτό κυρτό σύνολο D ⊂
Rn . Υποθέτουμε ότι υπάρχει x∗ ∈ Rn και r, β > 0 τέτοια ώστε F (x∗ ) = 0, N (x∗ , r) ⊂ D, F ′ ∈
Lipγ (N (x∗ , r)), και τέλος ο πίνακας F ′ (x∗ )−1 υπάρχει και ικανοποιεί kF ′ (x∗ )−1 k ≤ β. Τότε υπάρχει ϵ > 0
τέτοιο ώστε για x0 ∈ N (x∗ , ϵ) η ακολουθία (xk ) με
xk+1 = xk − F ′ (xk )−1 F (xk ), k = 0, 1, . . . ,
είναι καλά ορισμένη, συγκλίνει στο x∗ και ικανοποιεί
kxk+1 − x∗ k ≤ βγ kxk − x∗ k2 , k = 0, 1, . . . . (7.32)
1
Απόδειξη. Θέτουμε ϵ = min{r, 2βγ }. Θα δείξουμε επαγωγικά ότι ισχύει η (7.32) για κάθε k και ότι
1
kxk+1 − x∗ k ≤ kxk − x∗ k,
2
δηλαδή ότι xk+1 ∈ N (x∗ , ϵ). Ξεκινάμε δείχοντας ότι ο πίνακας F ′ (x0 ) αντιστρέφεται. Από το γεγονός ότι
kx0 − x∗ k ≤ ϵ και τη συνέχεια κατά Lipschitz της F ′ στο x∗ έχουμε από τη σχέση
kF ′ (x∗ )−1 [F ′ (x0 ) − F ′ (x∗ )]k ≤ kF ′ (x∗ )−1 k kF ′ (x0 ) − F ′ (x∗ )k,
ότι
kF ′ (x∗ )−1 [F ′ (x0 ) − F ′ (x∗ )]k ≤ βγ kx0 − x∗ k, ≤ βγϵ, (7.33)
και συνέπως kF ′ (x∗ )−1 [F ′ (x0 ) − F ′ (x∗ )]k ≤ 12 . Χρησιμοποιώντας το Λήμμα 1.12 βλέπουμε ότι ο F ′ (x0 )
είναι αντιστρέψιμος και από τις σχέσεις (1.35) και (7.33) ότι ισχύει η εκτίμηση
kF ′ (x∗ )−1 k
kF ′ (x0 )−1 k ≤ (7.34)
1 − kF ′ (x∗ )−1 [F ′ (x0 ) − F ′ (x∗ )]k
≤ 2kF ′ (x∗ )−1 k
≤ 2β.
Επομένως το x1 είναι καλά ορισμένο και μπορούμε να γράψουμε
x1 − x∗ = x0 − x∗ − F ′ (x0 )−1 F (x0 ) (7.35)
= x0 − x∗ − F ′ (x0 )−1 [F (x0 ) − F (x∗ )]
= F ′ (x0 )−1 [F (x∗ ) − F (x0 ) − F ′ (x0 )(x∗ − x0 )] .
Τώρα από το Λήμμα 7.4 έχουμε
Z 1
F (x∗ ) − F (x0 ) = F ′ (x0 + t(x∗ − x0 ))(x∗ − x0 ) dt
0
οπότε
F (x∗ ) − F (x0 ) − F ′ (x0 )(x∗ − x0 ) =
Z 1
[F ′ (x0 + t(x∗ − x0 )) − F ′ (x0 )] (x∗ − x0 ) dt.
0
′
Χρησιμοποιώντας τώρα τη συνέχεια Lipschitz της F στο x∗ , το Λήμμα 7.5 και το Λήμμα 7.6 έχουμε
γ
kF (x∗ ) − F (x0 ) − F ′ (x0 )(x∗ − x0 )k ≤ kx∗ − x0 k2 . (7.36)
2
Χρησιμοποιώντας την (7.36) στην (7.35) και την (7.34) έχουμε
γ
kx1 − x∗ k ≤ 2β · kx∗ − x0 k2 = βγ kx∗ − x0 k2 ,
2
το οποίο αποδεικνύει την (7.32). Αφού kx∗ − x0 k ≤ 1/(2βγ) έχουμε από την προηγούμενη σχέση ότι
kx0 − x∗ k ≤ 21 kx0 − x∗ k δηλαδή τη σχέση xk+1 ∈ N (x∗ , ϵ) για k = 0. Η απόδειξη του επαγωγικού
βήματος γίνεται με ανάλογο τρόπο.
114 ΑΡΙΘΜΗΤΙΚΗ ΛΥΣΗ ΜΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
Το θεώρημα του Kantorovich⁵ παρέχει μια ακόμα απόδειξη της σύγκλισης της μεθόδου Newton-Raphson
η οποία δεν υποθέτει εκ των προτέρων την ύπαρξη λύσης της εξίσωσης F (x) = 0. Ακόμα το θεώρημα του
Kantorovich ισχύει για γενικότερες απεικονίσεις μεταξύ χώρων Banach. Για τους λόγους αυτούς χρησιμεύει
στην απόδειξη θεωρημάτων ύπαρξης και μοναδικότητας λύσεων συστημάτων μη γραμμικών εξισώσεων αλλά
και διαφορικών και ολοκληρωτικών εξισώσεων.
Θα υποθέσουμε ότι F : Rn → Rn είναι παραγωγίσιμη σ’ ένα κυρτό σύνολο D ⊂ Rn και F ′ ∈ Lipγ (D).
Έστω ακόμα ότι o πίνακας F ′ (x0 ) είναι αντιστρέψιμος σε κάποιο σημείο x0 ∈ D και ότι για κάποιες σταθερές
β, ζ έχουμε ότι
και υποθέτουμε ότι S(x0 , t∗ ) ⊂ D. Θα δείξουμε ότι οι όροι της ακολουθίας Newton-Raphson
είναι καλά ορισμένοι, παραμένουν μέσα στην κλειστή σφαίρα S(x0 , t∗ ) και συγκλίνουν για k → ∞ στη
μοναδική λύση x∗ της F (x) = 0 στο σύνολο S(x0 , t∗ ). Επιπλέον έχουμε την εκτίμηση του σφάλματος
k
(2a)2
kxk − x∗ k ≤ k , k = 0, 1, 2, . . . . (7.41)
2 βγ
Δείχνουμε καταρχάς ότι οι όροι της ακολουθίας Newton-Raphson (7.40) είναι καλά ορισμένοι και παρα-
μένουν μέσα στην κλειστή σφαίρα S(x0 , t∗ ). Θέτουμε D0 = S(x0 , (βγ)−1 ) ∩ D. Για x ∈ D0 έχουμε,
χρησιμοποιώντας το γεγονός ότι F ′ ∈ Lipγ (D), ότι
1
kF ′ (x) − F ′ (x0 )k ≤ γkx − x0 k < .
β
Η (7.37) δίνει τότε
kF ′ (x0 )−1 k kF ′ (x) − F ′ (x0 )k < 1, x ∈ D0 .
Από το Λήμμα 1.12 συμπεραίνουμε ότι ο F ′ (x) για x ∈ D0 είναι αντιστρέψιμος και
kF ′ (x0 )−1 k
kF ′ (x)−1 k ≤ (7.42)
1 − kF ′ (x0 )−1 k kF ′ (x) − F ′ (x0 )k
β
≤ .
1 − βγkx − x0 k
Τώρα επειδή a < 1/2, από την (7.39) έχουμε ότι t∗ < (βγ)−1 δηλαδή ότι S(x0 , t∗ ) ⊂ D0 έτσι ώστε η
απεικόνιση επανάληψης της μεθόδου Newton-Raphson
Επειδή F ′ ∈ Lipγ (D), έχουμε χρησιμοποιώντας το Λήμμα 7.6 για x, G(x) ∈ N (x0 , t∗ ) ότι
βγkG(x) − xk2
kG2 (x) − G(x)k ≤ . (7.45)
2(1 − βγkG(x) − x0 k)
Ορίζουμε τώρα την ακολουθία πραγματικών αριθμών {tk }, k ≥ 0, από τις σχέσεις t0 = 0 και
βγt2k /2 − tk + ζ
tk+1 = tk − , k ≥ 0. (7.46)
βγtk − 1
Αν
βγ 2
p(t) = t − t + ζ, (7.47)
2
τότε, επειδή a = βγζ < 1/2, το p(t) έχει ρίζες τους αριθμούς t∗ και t∗∗ της σχέσης (7.39). Επιπλέον η
(7.46) δεν είναι τίποτε άλλο από την ακολουθία της μεθόδου Newton-Raphson για την προσέγγιση της ρίζας
t∗ της εξίσωσης p(t) = 0 με αρχική τιμή t0 = 0. Η κυρτότητα της p(t) δίνει τώρα ότι 0 < tk < tk+1 για
k ≥ 1, και ότι tk → t∗ καθώς k → ∞. Επομένως η ακολουθία πραγματικών αριθμών {tk } είναι καλά
ορισμένη, μονοτονικά αύξουσα και συγκλίνει στον αριθμό t∗ .
Δείχνουμε τώρα ότι οι όροι {xk }, k ≥ 0, της ακολουθίας (7.40) της μεθόδου Newton-Raphson είναι
καλά ορισμένοι, ανήκουν στην κλειστή σφαίρα S(x0 , t∗ ) και ικανοποιούν
Είδαμε ήδη, επειδή η G(x) είναι καλά ορισμένη στη S(x0 , t∗ ), ότι το x1 = G(x0 ) υπάρχει. Επιπλέον από
τις σχέσεις (7.40), (7.38) και (7.46) έχουμε
Συνεπώς ισχύει η (7.48) για k = 1. Επιπλέον, επειδή ζ = t1 < t∗ έχουμε ότι x1 ∈ S(x0 , t∗ ). Υποθέτουμε
τώρα ότι για κάποιο k ≥ 1 τα x0 , . . . , xk είναι στην S(x0 , t∗ ) και ικανοποιούν τις σχέσεις
Επειδή η G είναι καλά ορισμένη στην S(x0 , t∗ ), το xk+1 = G(xk ) υπάρχει. Επιπλέον, επειδή από την
επαγωγική υπόθεση (7.49) έχουμε
X
k X
k
kxk − x0 k ≤ kxi − xi−1 k ≤ (ti − ti−1 ) = tk , (7.50)
i=1 i=1
116 ΑΡΙΘΜΗΤΙΚΗ ΛΥΣΗ ΜΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
Συμπεραίνουμε λοιπόν ότι xk+1 ∈ S(x0 , t∗ ). Τελικά έχουμε δείξει ότι όλοι οι όροι της ακολουθίας {xk }
υπάρχουν και παραμένουν στην S(x0 , t∗ ). Επιπλέον ικανοποιούν για i ≤ j την (7.49).
Πάλι από την (7.49) έχουμε
και, επειδή tk → t∗ καθώς k → ∞, συμπεραίνουμε ότι η {xk }, k ≥ 0, είναι Cauchy στην S(x0 , t∗ ).
Συνεπώς υπάρχει x∗ ∈ S(x0 , t∗ ) τέτοιο ώστε xk → x∗ καθώς k → ∞.
Δείχνουμε τώρα ότι το x∗ είναι όντως λύση του συστήματος F (x) = 0. Καταρχάς, η ύπαρξη της F ′ στο
D0 συνεπάγεται τη συνέχεια της F στο D0 . Ακόμα, χρησιμοποιώντας το γεγονός ότι F ′ ∈ Lip(D0 ) και την
(7.50) έχουμε
ky∗ − xk k ≤ t∗ − tk , k ≥ 0. (7.53)
Πράγματι η (7.53) ισχύει για k = 0 γιατί kya st − x0 k ≤ t∗ = t∗ − t0 . Υποθέτουμε ότι η (7.53) ισχύει
για 0 ≤ k ≤ i. Τότε επειδή y∗ = G(y∗ ) = G2 (y∗ ) έχουμε από τις (7.45) και (7.51) ότι
Άρα στην (7.56), λόγω του γεγονότος ότι a = βγζ < 1/2, έχουμε
ati+1
1 − βγti+1 = 1 − ≥ 1 − 2a(1 − 2−(i+1) ) ≥ 2−(i+1) . (7.57)
ζ
Συνεπώς, ti+2 − ti+1 ≤ βγζ 2 2−i = ζa2−i ≤ ζ2−(i+1) . Αυτό δείχνει ότι ισχύει η (7.55) για κάθε k ≥ 0,
πράγμα που συνεπάγεται επίσης την ισχύ της (7.57) για κάθε i ≥ 0. Αποδεικνύουμε τώρα ότι
(2a)2
t∗ − tk ≤ , k ≥ 0. (7.58)
βγ2k
Πράγματι, για k = 0 έχουμε t∗ − t0 = t∗ = (1 − (1 − 2a)1/2 )/(βγ) ≤ 2a/(βγ), γιατί 0 ≤ a < 1/2.
Αφού η (7.56) ισχύει για 0 ≤ k ≤ i, έχουμε από την (7.53), την (7.57) και την επαγωγική υπόθεση ότι
βγ(t∗ − ti )2
i+1 i+1
βγ(2a)2 2i−1 (2a)2
t∗ − ti+1 = ≤ = .
2(1 − βγti ) β 2 γ 2 22i βγ2i+1
Αποδείξαμε δηλαδή την (7.58). Τέλος η (7.52) με m → ∞ δίνει kx∗ − xk k ≤ t∗ − tk . Συνεπώς από την
(7.58) έπεται το ζητούμενο φράγμα (7.41).
Το αντικείμενο αυτού του κεφαλαίου υπάρχει πιο αναλυτικά σε πολλά βιβλία Αριθμητικής Ανάλυσης. Πα-
ραθέτουμε κάποιες αναφορές τις οποίες ο αναγνώστης μπορεί να συμβουλευτεί: [1], [3], [4], [6], [7], [8].
7.3 Ασκήσεις
7.3.2 Έστω f (x) = x + x1+a , όπου 0 < a < 1. Δείξτε ότι το σημείο x∗ = 0 είναι σημείο έλξης της
ακολουθίας της μεθόδου Newton-Raphson, αλλά ότι η σύγκλιση δεν είναι τετραγωνική.
2(x1 + x2 )2 + (x1 − x2 )2 − 8 = 0,
5x21 + (x2 − 3)2 − 9 = 0,
είναι η x∗ = (1, 1)T . Εκτελέστε μερικά βήματα της μεθόδου Newton-Raphson με αρχική τιμή x0 =
(2, 0)T .
7.3.4 Εκτελέστε δύο βήματα της μεθόδου Newton-Raphson για το σύστημα F (x1 , x2 ) = (ex1 −1, ex2 −
1) = 0, ξεκινώντας με x0 = (−10, −10)T . Τι γίνεται στο τρίτο βήμα της μεθόδου;
Αποδείξτε ότι η ακολουθία προσεγγίσεων που παράγει αυτή η επαναληπτική διαδικασία συγκλίνει στη
ρίζα (1, 1)T . Ποια είναι η ταχύτητα σύγκλισης; Ποια θα ήταν η μέθοδος Newton-Raphson για τη
λύση του συστήματος F (x1 , x2 ) = 0;
7.3.6 Θεωρήστε την απεικόνιση f (x) = kF (x)k22 , όπου F : Rn → Rn και το διάνυσμα y k = xk+1 −xk ,
όπου (xk ) είναι η ακολουθία που παράγεται από τη μέθοδο του Νευτωνα για το σύστημα F (x) = 0.
Υποθέτουμε ότι η ακολουθία (xk ) είναι καλά ορισμένη. Δείξτε ότι το f (x) ελαττώνεται τοπικά κατά
μήκος της ακτίνας με αρχή xk και κατεύθυνση y k .
Βιβλιογραφία
[1] K. Atkinson και W. Han. Theoretical Numerical Analysis. A Functional Analysis Framework. English.
3rd ed. Τόμ. 39. Texts Appl. Math. Berlin: Springer, 2009. isbn: 978-1-4419-0457-7. doi: 10 .
1007/978‐1‐4419‐0458‐4.
[2] J. E. Dennis και R. B. Schnabel. Numerical Methods for Unconstrained Optimization and Nonlinear
Equations. English. Τόμ. 16. Philadelphia, PA: SIAM, 1996, σσ. xv + 378.
[3] W. Gautschi. Numerical Analysis. English. 2nd ed. Boston, MA: Birkhäuser, 2012. isbn: 978-0-
8176-8258-3. doi: 10.1007/978‐0‐8176‐8259‐0.
[4] C. T. Kelley. “Numerical Methods for Nonlinear Equations”. Στο: Acta Numerica 27 (2018), σσ. 207–
287. issn: 0962-4929. doi: 10.1017/S0962492917000113.
[5] J. M. Ortega και W. C. Rheinboldt. Iterative Solution of Nonlinear Equations in Several Variables. Aca-
demic Press, 1970.
[6] L. R. Scott. Numerical Analysis. English. Princeton, NJ: Princeton University Press, 2011. isbn:
978-0-691-14686-7.
[7] J. Stoer και R. Bulirsch. Introduction to Numerical Analysis. English. 3rd ed. Τόμ. 12. Texts Appl.
Math. New York, NY: Springer, 2002. isbn: 0-387-95452-X.
[8] Β. Α. Δουγαλής. Διδακτικές σημειώσεις για το μεταπτυχιακό μάθημα 350 Αριθμητική Ανάλυση. Ηρά-
κλειο Κρήτης: Ινστιτούτο Υπολογιστικών Μαθηματικών, Ερευνητικό Κέντρο Κρήτης, 1987.
Μέρος II
Περίληψη
Στο κεφάλαιο αυτό παρουσιάζουμε το πρόβλημα αρχικών τιμών για συστήματα πρώτης τάξης συνήθων δια-
φορικών εξισώσεων της μορφής: Ζητείται y : [a, b] → Rn τέτοια ώστε
όπου f : [a, b] × Rn → Rn μια συνεχής συνάρτηση. Υποθέτοντας συνθήκες για τη συνάρτηση f μπορούμε
να εξασφαλίσουμε την ύπαρξη (ή και τη μοναδικότητα) της λύσης.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Συνήθων Διαφορικών Εξισώσεων και Απειροστικού Λογισμού σε
πολλές διαστάσεις. Διανυσματικοί χώροι με νόρμα.
Θεώρημα 8.1 (Picard-Lindelöf). Θεωρούμε το πρόβλημα αρχικών τιμών (8.1) όπου f : [a, b] × Rn → Rn
είναι συνεχής συνάρτηση. Υποθέτουμε ότι η f (t, y) ικανοποιεί μια συνθήκη Lipschitz ως προς y ομοιόμορφα ως
προς t ∈ [a, b], δηλαδή για κάποια νόρμα k · k του Rn και σταθερά L ≥ 0 ισχύει
Τότε για κάθε u0 ∈ Rn το πρόβλημα (8.1) έχει μοναδική λύση, δηλαδή υπάρχει μοναδική συνάρτηση y :
[a, b] → Rn παραγωγίσιμη στο [a, b] που ικανοποιεί το σύστημα y ′ (t) = f (t, y(t)) για a ≤ t ≤ b και
την αρχική συνθήκη y(a) = y0 .
Η απόδειξη του παραπάνω θεωρήματος μπορεί να βρεθεί σε πολλά βιβλία συνήθων διαφορικών εξισώσεων,
όπως π.χ. [1], [2]. Εδώ παραθέτουμε μια απόδειξη για την περίπτωση m = 1, η οποία βασίζεται στο θεώρημα
του σταθερού σημείου του Banach. Πρώτα μερικές παρατηρήσεις:
Παρατήρηση 8.1. Η παράγωγος y ′ (t) νοείται ως πλευρική παράγωγος στα άκρα a και b. Μια ικανή συν-
θήκη για την ισχύ της (8.2) είναι να είναι οι παράγωγοι ∂fi /∂yj , 1 ≤ i, j ≤ m συνεχείς και φραγμένες
συναρτήσεις για (t, y) ∈ [a, b] × Rn . Τότε από το θεώρημα μέσης τιμής έχουμε ότι για κάθε i, 1 ≤ i ≤ m,
u, v ∈ Rn υπάρχει ξ = ξ(i, t, u, v) ∈ Rn στο ευθύγραμμο τμήμα [u, v] τέτοιο ώστε
Xm
∂fi
fi (t, u) − fi (t, v) = (t, ξ)(uj − vj ), 1 ≤ i ≤ m.
j=1
∂yj
∂fi
M = max sup <∞
1≤i,j≤m [a,b]×Rn ∂yj
Παρατήρηση 8.2. Έστω m = 1. Ας υποθέσουμε ότι στο διάστημα [a, b] υπάρχει μια συνεχώς παραγωγί-
σιμη συνάρτηση u τέτοια ώστε y ′ (t) = f (t, y(t)) και y(a) = y0 . Τότε από το θεμελιώδες θεώρημα του
απειροστικού λογισμού έχουμε
Z t Z t
′
y(t) = y(a) + y (s) ds = y0 + f (s, y(s)) ds, (8.3)
a a
για t ∈ [a, b]. Αντίστροφα, αν υπάρχει συνεχής συνάρτηση y η οποία ικανοποιεί την παραπάνω ολοκλη-
ρωτική εξίσωση, τότε αναγκαστικά y(a) = y0 και η απεικόνιση s 7→ f (t, y(s)) είναι συνεχής. Πάλι από
το θεμελιώδες θεώρημα του απειροστικού λογισμού, το δεξιό μέλος της ολοκληρωτικής εξίσωσης ορίζει μια
παραγωγίσιμη συνάρτηση για την οποία y(t) = f (t, y(t)).
Παρατήρηση 8.3. Η συνθήκη Lipschitz (8.2) στο Θεώρημαp Picard-Lindelöf είναι απαραίτητη για τη μο-
ναδικότητα της λύσης. Πράγματι, αν m = 1 και f (t, y) = |y|, εύκολα βλέπουμε ότι η f είναι συνεχής
συνάρτηση στο R2 αλλά δεν ικανοποιεί κάποια συνθήκη Lipschitz ως προς y σε οποιοδήποτε παραλληλό-
γραμμο το οποίο περιέχει το σημείο (0, 0). Αν θεωρήσουμε το πρόβλημα αρχικών τιμών
p
y ′ (t) = |y(t)|, y(0) = 0,
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 123
Θεώρημα 8.2 (Σταθερού σημείου του Banach). Έστω X χώρος Banach και T : X → X συστολή με σταθερά
L. Τότε η T έχει μοναδικό σταθερό σημείο x∗ . Επιπλέον, αν x0 ∈ X, η ακολουθία {xk } όπου xk+1 = T xk ,
k ≥ 0 συγκλίνει στο x∗ .
Απόδειξη. Επειδή T : X → X, η ακολουθία {xk } είναι καλά ορισμένη. Αφού η T είναι συστολή, έχουμε
kxk+1 − xk kX = kT xk − T xk−1 kX
≤ L kxk − xk−1 kX
···
≤ Lk kx1 − x0 kX .
≤ Lk (1 + L + · · · + Lm−1 )kx1 − x0 kX
Lk
≤ kx1 − x0 kX .
1−L
Επειδή L ∈ (0, 1) αυτό δείχνει ότι η ακολουθία {xk } είναι Cauchy και συνεπώς συγκλίνει σε κάποιο x∗ ∈
X. Αφού η T είναι συστολή είναι επίσης συνεχής, συνεπώς
x∗ = lim xk+1 = lim T xk = T lim xk = T x∗ ,
k→∞ k→∞ k→∞
δηλαδή το x∗ είναι σταθερό σημείο. Αν x∗∗ ήταν ένα ακόμα σταθερό σημείο, η ιδιότητα συστολής της T θα
έδινε
kx∗ − x∗∗ kX = kT x∗ − T x∗∗ kX ≤ Lkx∗ − x∗∗ kX ,
δηλαδή (1 − L)kx∗ − x∗∗ kx ≤ 0. Αναγκαστικά x∗ = x∗∗ .
124 ΠΡΟΒΛΗΜΑΤΑ ΑΡΧΙΚΩΝ ΤΙΜΩΝ
Απόδειξη του Θεωρήματος Picard–Lindelöf. Λαμβάνοντας υπ’ όψιν τις προηγούμενες παρατηρήσεις είναι αρ-
κετό να δείξουμε ότι υπάρχει συνεχής συνάρτηση στο διάστημα I = [a, b] έτσι ώστε η ολοκληρωτική εξίσωση
Z t
u(t) = u0 + f (s, u(s)) ds (8.4)
a
να έχει μοναδική λύση. Έστω X το σύνολο των συνεχών συναρτήσεων t 7→ u(t) ορισμένες στο I. Aν u ∈ X,
θεωρούμε την απεικόνιση Z t
T u(t) = u0 + f (s, u(s)) ds.
a
Προφανώς T u είναι συνεχής συνάρτηση στο I. Δείχνουμε ότι T : X → X είναι συστολή. Ορίζουμε τη
μετρική
Z b
d(g1 , g2 ) = e−2L|t−a| |g1 (t) − g2 (t)|,
a
και δείχνουμε ότι
1
d(T u1 , T u2 ) ≤ d(u1 , u2 ). (8.5)
2
Για να δείξουμε την (8.5) παρατηρούμε ότι για t ≥ a
Z t
T g2 (t) − T g1 (t) = [f (s, g2 (s)) − f (s, g1 (s))] ds,
a
έτσι ώστε
Z t
|T g2 (t) − T g1 (t)| ≤ L |g2 (s) − g1 (s)| ds
Z a
t
=L e2L(s−a) e−2L(s−a) |g2 (s) − g1 (s)| ds
Za t
≤L e2L(s−a) d(g1 , g2 ) ds
a
e2L(t−a) − 1
= L d(g1 , g2 )
2L
1 2L|t−a|
≤ e d(g1 , g2 ).
2
Συνεπώς
1
e−2L|t−a| |T g2 (t) − T g1 (t)| ≤ d(g1 , g2 ).
2
Από τη σχέση αυτή προκύπτει η (8.5) και αυτό ολοκληρώνει την απόδειξη.
Υπάρχουν και τοπικές μορφές του Θεωρήματος Picard-Lindelöf, όπως το ακόλουθο:
Θεώρημα 8.3. Υποθέστε ότι η f είναι συνεχής στο σύνολο
R = {(t, u) ∈ Rm+1 : |t − a| ≤ A, ku − u0 k ≤ B},
και M = max(t,u)∈R kf (t, u)k. Υποθέτουμε ακόμα ότι η f ικανοποιεί τη συνθήκη Lipschitz
kf (t, u) − f (t, v)k ≤ Lku − vk, ∀(t, u), (t, v) ∈ R. (8.6)
Τότε υπάρχει μοναδική λύση του προβλήματος αρχικών τιμών (8.1) τοπικά, δηλαδή υπάρχει μοναδική συνάρτηση
u(t) ορισμένη για |t − a| ≤ δ = min{A, B/M } που ικανοποιεί την u′ = f (t, u) για |t − a| ≤ δ και την
αρχική συνθήκη u(a) = u0 .
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 125
R
1
1 + tu = 0
−2 t
Σχήμα 8.1: Εφαρμογή του θεωρήματος Picard-Lindelöf στο πρόβλημα αρχικών τιμών του Παραδείγματος
8.1.
Σημειώνουμε ότι η συνθήκη συνέχειας της f εγγυάται μόνη της την ύπαρξη αλλά όχι τη μοναδικότητα
λύσεων του προβλήματος για |t − a| ≤ δ = min{A, B/M }. Αυτό είναι το λεγόμενο Θεώρημα του Peano .
Για μοναδικότητα χρειαζόμαστε κάτι παραπάνω από τη συνέχεια της f . Η συνθήκη Lipschitz (8.6) είναι πολύ
κοντά στο να είναι αναγκαία για μοναδικότητα. Συγκεκριμένα μπορεί να αποδειχθεί ότι αν ισχύει η
όπου Φ(u) μη αρνητική, συνεχής, αύξουσα συνάρτηση ορισμένη στο [0, 2B] τέτοια ώστε Φ(0) = 0 και
Z 2B
du
= +∞
0 Φ(u)
τότε υπάρχει μοναδική συνάρτηση u(t) ορισμένη για |t − a| ≤ δ = min{A, B/M } που ικανοποιεί την
u′ = f (t, u) για |t − a| ≤ δ και την αρχική συνθήκη u(a) = u0 .
Παράδειγμα 8.1. Θεωρούμε το πρόβλημα αρχικών τιμών
eu −1
2
′
u (t) = , u(−2) = 1. (8.7)
1 − t 2 u2
Ακολουθώντας τον συμβολισμό του θεωρήματος Picard-Lindelöf έχουμε a = −2, u0 = 1 και f (t, u) =
eu −1 (1 − t2 u2 )−1 . Θα βρούμε ένα διάστημα της μορφής [a, a + δ] στο οποίο το πρόβλημα αυτό έχει μο-
2
έτσι ώστε να αποφύγουμε σημεία για τα οποία 1 + tu = 0μ δείτε το Σχήμα 8.1. Τότε, για (t, u) ∈ R έχουμε
t2 ≥ 9/4 και u2 ≥ 9/16 έτσι ώστε t2 u2 ≥ 81/64 και |1 − t2 u2 | ≥ 81/64 − 1 = 17/64 > 1/4. Ακόμα
eu −1 ≤ e25/16−1 = e9/16 < 3 έτσι ώστε
2
Από τη σχέση
Z t
u(t) = u0 + f (s, u(s)) ds
a
έχουμε
Z t
|u(t) − u0 | = f (s, u(s)) ds ≤ 12|a − t| ≤ 12δ.
a
126 ΠΡΟΒΛΗΜΑΤΑ ΑΡΧΙΚΩΝ ΤΙΜΩΝ
Μπορούμε τότε να έχουμε |u(t) − u0 | < 1/4 αν διαλέξουμε δ < 1/48. Για να επαληθεύσουμε τη συνθήκη
Lipschitz παρατηρούμε ότι
eu −1 eu −1
2 2
∂f 2
(t, u) = 2u + 2t u ,
∂u 1 − t 2 u2 (1 − t2 u2 )2
οπότε χρησιμοποιώντας τα προηγούμενα φράγματα έχουμε
2
∂f 5 5
(t, u) ≤ · 12 + · 3 · 42 = 780.
∂u 2 2
Μπορούμε επομένως να πάρουμε L = 780 και να εξασφαλίσουμε ότι το πρόβλημα αρχικών τιμών (8.7) έχει
μοναδική λύση στο διάστημα [−2, −2 + δ] με δ = 1/48.
Μονόπλευρη Lipschitz.
Λέμε ότι μια συνάρτηση f : [a, b] × Rn → Rn ικανοποιεί τη μονόπλευρη συνθήκη του Lipschitz ως
προς u ομοιόμορφα ως προς t ∈ [a, b], αν ισχύει
όπου (·, ·) είναι το εσωτερικό γινόμενο στον Rn . Θα δούμε στη συνέχεια ότι η συνθήκη (8.8) εξασφαλίζει τη
μοναδικότητα της λύσης.
Παράδειγμα 8.2. Ας θεωρήσουμε το πρόβλημα αρχικών τιμών (8.1) με f (t, y) = A(t)y + g(t) όπου
A(t) ∈ Rn×n , t ∈ [a, b] είναι μη θετικά ορισμένοι πίνακες, δηλαδή
Εύκολα μπορούμε να δούμε ότι η f ικανοποιεί τη μόνοπλευρη συνθήκη του Lipschitz (8.8). Ένα παράδειγμα
πίνακα A που δεν είναι θετικά ορισμένος είναι
α −β
A= (8.10)
β α
με α, β ∈ R και α αρνητικό.
Για να αποφύγουμε τεχνικές δυσκολίες θα υποθέσουμε από δω κι εμπρός ότι ισχύουν οι υποθέσεις του Θεω-
ρήματος Picard-Lindelöf έτσι ώστε το πρόβλημα αρχικών τιμών (8.1) να έχει μοναδική λύση u(t) με συνεχή
παράγωγο στο [a, b]. Συνήθως θα υποθέτουμε επιπλέον ότι η λύση είναι αρκετά ομαλή, δηλαδή έχει έναν
αρκετά μεγάλο αριθμό συνεχών παραγώγων u(i) .
8.2 Ευστάθεια
Υποθέτουμε ότι η συνάρτηση f είναι συνεχής και θα εξετάσουμε της ιδιότητες ευστάθειας του προβήματος
αρχικών τιμών (8.1).
Για δεδομένες αρχικές τιμές y0 , z0 ∈ Rn θεωρούμε τα προβλήματα αρχικών τιμών
( (
y ′ (t) = f (t, y(t)), a ≤ t ≤ b, z ′ (t) = f (t, z(t)), a ≤ t ≤ b,
και (8.11)
y(a) = y0 z(a) = z0
Υποθέτουμε ότι η f ικανοποιεί την ολική συνθήκη του Lipschitz (8.2). Τα προβλήματα (8.11) έχουν τότε
μοναδικές λύσεις y, z, αντίστοιχα.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 127
Θέτουμε ε(t) = y(t) − z(t), t ∈ [a, b] και έχουμε ότι ε′ (t) = f (t, y(t)) − f (t, z(t)). Θέλουμε να
εκτιμήσουμε την ποσότητα kε(t)k όπου k · k είναι μια νόρμα στον Rn ή λόγω της ισοδυναμίας των νορμών,
την ποσότητα kε(t)k2 όπου η k · k2 είναι η ευκλείδεια νόρμα στon Rn .
Παίρνουμε το εσωτερικό γινόμενο της ε′ (t) με τη ε(t) και έχουμε
(ε′ (t), ε(t)) = (f (t, y(t)) − f (t, z(t)), ε(t)), (8.13)
η οποία εύκολα δίνει
1d
kε(t)k22 = (ε′ (t), ε(t)) ≤ kf (t, y(t)) − f (t, z(t))k2 kε(t)k2 ≤ Lkε(t)k22 . (8.14)
2 dt
Αν θέσουμε τώρα φ(t) = kε(t)k22 έχουμε
φ′ (t) − 2Lϕ(t) ≤ 0, t ∈ [a, b] (8.15)
από όπου εύκολα παίρνουμε
d −2Lt
(e ϕ(t)) ≤ 0, t ∈ [a, b]. (8.16)
dt
Συνεπώς η e−2Lt ϕ(t) είναι φθίνουσα συνάρτηση στο [a, b], οπότε
e−2Lt ϕ(t) ≤ e−2La ϕ(a), t ∈ [a, b] (8.17)
ή ισοδύναμα
kε(t)k22 ≤ e2L(t−a) kε(a)k22 , t ∈ [a, b]. (8.18)
Επίσης λόγω της ισοδυναμίας νορμών στον R για μια νόρμα k · k του R έχουμε ότι υπάρχει θετική σταθερά
n n
Αυτή η σχέση εκφράζει τη συνεχή εξάρτηση των λύσεων του προβλήματος αρχικών τιμών (9.1) από τα
δεδομένα y0 .
Ας υποθέσουμε τώρα ότι η f ικανοποιεί τη μονόπλευρη συνθήκη του Lipschitz (8.8), δηλαδή
(f (t, y1 ) − f (t, y2 ), y1 − y2 ) ≤ 0 (8.22)
Αν τώρα επαναλάβουμε τα προηγούμενα για την απόδειξη της ευστάθειας, προκύπτει ότι
(ε′ (t), ε(t)) = (f (t, y(t)) − f (t, z(t)), ε(t)), (8.23)
η οποία εύκολα δίνει
1d
kε(t)k22 = (ε′ (t), ε(t)) ≤ 0. (8.24)
2 dt
Συνεπώς η kε(t)k22 είναι φθίνουσα συνάρτηση στο [a, b], οπότε
kε(t)k22 ≤ kε(a)k22 , t ∈ [a, b] (8.25)
ή ισοδύναμα
ky(t) − z(t)k2 ≤ ky0 − z0 k2 , t ∈ [a, b]. (8.26)
Tο αντικείμενο αυτού του κεφαλαίου υπάρχει πιο αναλυτικά σε βιβλία με αντικείμενο την αριθμητική λύση
συνήθων διαφορικών εξισώσεων. Παραθέτουμε κάποιες αναφορές τις οποίες ο αναγνώστης μπορεί να συμ-
βουλευτεί: ο αναγνώστης μπορεί να συμβουλευτεί: [1], [3], [4], [5], [6].
128 ΠΡΟΒΛΗΜΑΤΑ ΑΡΧΙΚΩΝ ΤΙΜΩΝ
8.3 Ασκήσεις
2(u(t) − 1)
u′ (t) = , u(0) = 1,
t
έχει μια συνεχώς παραγωγίσιμη λύση που δίνεται από την
(
at2 + 1, t < 0,
u(t) =
bt2 + 1, t > 0,
για όλες τις σταθερές a και b. Δείξτε ακόμα ότι δεν υπάρχει λύση, αν u(0) 6= 1. Έρχονται αυτά σε
αντίθεση με το Θεώρημα 8.3;
Δείξτε ότι το πρόβλημα δεν έχει λύση, αν b ≥ ϵ−1 . Γιατί δεν ισχύει το Θεώρημα Picard-Lindelöf;
Πάρτε ϵ = 1 και βρείτε το μέγιστο διάστημα [0, δ] ύπαρξης λύσης που δίνει το Θεώρημα 8.3.
i.) Γιατί πρέπει να περιμένουμε ότι το πρόβλημα αυτό δεν έχει μοναδική λύση;
ii.) Δείξτε ότι οι συναρτήσεις u(t) = 1 και u(t) = cosh(t) είναι λύσεις του προβλήματος σε κάθε
διάστημα [0, b], b > 0.
iii.) Ποιο είναι το μεγαλύτερο διάστημα της μορφής [b, 0] στο οποίο η u(t) = cos(t) είναι λύση;
Βιβλιογραφία
[1] E.A. Coddington και N. Levinson. Theory of Ordinary Differential Equations. New York: McGraw–
Hill, 1955.
[2] C. Corduneanu. Principles of Differential and Integral Equations. Second. Providence, Rhode Island:
American Mathematical Society, 2008.
[3] J. D. Logan. A First Course in Differential Equations. English. 3rd ed. Undergraduate Texts Math.
Springer, 2015. isbn: 978-3-319-17851-6. doi: 10.1007/978‐3‐319‐17852‐3.
[4] W. Wolfgang. Ordinary Differential Equations. Transl. from the German by Russell Thompson. English.
Τόμ. 182. New York NY: Springer-Verlag, 1998, σσ. x + 380. isbn: 0-387-98459-3.
[5] Ν. Αλικάκος και Γ. Καλογερόπουλος. Συνήθεις Διαφορικές Εξισώσεις. Σύγχρονη Εκδοτική, 2003.
[6] Γ.-Σ. Σμυρλής. Συνήθεις Διαφορικές Εξισώσεις. Πανεπιστημιακες Εκδόσεις Κύπρου, 2013.
ΚΕΦΑΛΑΙΟ 9
Περίληψη
Η πιο απλή αριθμητική μέθοδος για την επίλυση του προβλήματος αρχικών τιμών (Π.Α.Τ.) της μορφής:
Ζητείται y : [a, b] → Rn τέτοια ώστε
όπου f μια συνεχής συνάρτηση και y0 ∈ Rn δοσμένη τιμή είναι η μέθοδος Euler. Εισάγουμε την έννοια
του τοπικού σφάλματος διακριτοποίησης, της ευστάθειας και δείχνουμε τη σύγκλιση της μεθόδου. Επίσης
θεωρούμε και άλλες μονοβηματικές μεθόδους, όπως την πεπλεγμένη μέθοδο Euler, τη μέθοδο του τραπεζίου,
τη μέθοδο του μέσου.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Συνήθων Διαφορικών Εξισώσεων και Απειροστικού Λογισμού σε
πολλές διαστάσεις. Διανυσματικοί χώροι με νόρμα. Αριθμητική επίλυση μη γραμμικών συστημάτων.
Όλες οι μέθοδοι που θα μελετήσουμε αποσκοπούν στο να λύσουμε προβλήματα αρχικών τιμών (Π.Α.Τ.) της
μορφής: Ζητείται y : [a, b] → Rn τέτοια ώστε
(
y ′ (t) = f (t, y(t)), a ≤ t ≤ b,
(9.1)
y(a) = y0 ,
όπου f : [a, b] × Rn → Rn είναι μια δοσμένη συνεχής συνάρτηση και y0 ∈ Rn είναι δοσμένη τιμή.
Υποθέτουμε ότι το πρόβλημα (9.1) έχει μοναδική λύση σε ένα διάστημα [a, b].
Θεωρούμε έναν διαμερισμό του [a, b], a = t0 < t1 < · · · < tN = b. Με τις μεθόδους που θα μελε-
τήσουμε θα κατασκευάσουμε προσεγγίσεις των τιμών y(ti ) της ακριβούς λύσης y του προβλήματος αρχικών
τιμών (9.1). Δηλαδή θα κατασκευάσουμε προσεγγίσεις των τιμών {y(t0 ), . . . , y(tN )} και όχι της καμπύλης
του γραφήματος της λύσης y για το διάστημα [a, b].
Συνήθως χρησιμοποιούμε έναν ομοιόμορφο διαμερισμό του [a, b], δηλαδή θέτουμε h = (b − a)/N για
κάποιον φυσικό αριθμό N ∈ N. Θα καλούμε το h βήμα του διαμερισμού. Τότε τα σημεία του διαμερισμού θα
ικανοποιούν tn = a + nh, n = 0, . . . , N . Είναι δυνατόν να θεωρήσουμε και μη-ομοιόμορφους διαμερισμούς
όπου το βήμα δεν είναι σταθερό.
Η πρώτη μέθοδος που θα μελετήσουμε καλείται μέθοδος του Euler και μπορεί να εφαρμοστεί τόσο σε βαθ-
μωτές όσο και σε συστήματα ΣΔΕ. Με τη μέθοδο Euler κατασκευάζουμε προσεγγίσεις y n ∈ Rn , n =
0, . . . , N των τιμών y(tn ), σύμφωνα με τον αναδρομικό τύπο
Η (9.4) ορίζει έναν κανόνα αριθμητικής ολοκλήρωσης. Για μια πιο αναλυτική παρουσίαση κανόνων αριθμητικής
ολοκλήρωσης παραπέπουμε π.χ. στα [3], [8], [9].
Αν χρησιμοποιήσουμε τον κανόνα αριθμητικής ολοκλήρωσης (9.4) στη σχέση (9.3), ισχύει ότι
Αυτή η παραπάνω σχέση αιτιολογεί τον ορισμό της μεθόδου Euler, (9.2).
Παράδειγμα 9.1. Ας εφαρμόσουμε τώρα τη μέθοδο του Euler για να κατασκευάσουμε προσεγγίσεις για τη
λύση του ακόλουθου προβλήματος αρχικών τιμών: Έστω y : [0, 1] → R, τέτοια ώστε
y − 2ty 2 (t) 2
y ′ (t) = , y(0) = . (9.6)
1+t 5
Η ακριβής λύση του προβλήματος (9.6) είναι y(t) = (1 + t)/( 52 + t2 ).
Αν θεωρήσουμε μια διαμέριση του [0, 1] με βήμα h = 0.2 = 1/5, tn = nh, n = 0, . . . , 6, σύμφωνα με
τη μέθοδο του Euler, (9.2), θα προκύψουν οι προσεγγίσεις y n , των y(tn ), n = 0, . . . , 6. Στον Πίνακα 9.1
βλέπουμε τις τιμές y n που θα προκύψουν, καθώς και τις αντίστοιχες τιμές της ακριβούς λύσης.
Αν τώρα χρησιμοποιήσουμε μικρότερο βήμα h = 0.1, h = 0.05, θα προκύψουν προφανώς περισσό-
τερα σημεία για τα οποία θα κατασκευάσουμε προσεγγίσεις. Μπορούμε όμως να παρατηρήσουμε ότι για τα
κοινά σημεία των διαμερισμών κατασκευάζουμε προσεγγίσεις που πλησιάζουν καλύτερα την ακριβή τιμή, βλ.
Πίνακα 9.2.
Μπορούμε να παρατηρήσουμε ότι για διαφορετικούς διαμερισμούς, π.χ. h = 0.2 = 1/5 και h = 0.1 =
1/10 τα σημεία t1 , των αντίστοιχων διαμερισμών δεν είναι τα ίδια. Προφανώς και οι αντίστοιχες προσεγγίσεις
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 131
1+t
y(t) =
0.70
c + t2
0.65
0.60
0.55
0.50
0.45
0.40
0.35
Προσέγγιστική λύση ύc=5/2)
0.30
Ακ ιβής λύση
Σχήμα 9.1: Η ακριβής λύση του προβλήματος στο Παράδειγμα 9.1 για διάφορες αρχικές τιμές c, καθώς και
η προσεγγιστική λύση για αρχική τιμή c = 5/2, με τη μέθοδο Euler, με βήμα h = 1/5. Με τις τελείες είναι
οι προσεγγίσεις που δίνει η μέθοδος.
tn y(tn ) yn
0.0 0.40000, 0.40000
0.2 0.47244, 0.48000
0.4 0.52632, 0.54464
0.6 0.55944, 0.58854
0.8 0.57325, 0.61016
1.0 0.57143, 0.61177
Πίνακας 9.1: Η ακριβής λύση του προβλήματος στο Παράδειγμα 9.1 και η προσεγγιστική λύση για αρχική
τιμή c = 5/2, με τη μέθοδο Euler, με βήμα h = 1/5.
y1 που λαμβάνουμε δεν θα προσεγγίσουν την ίδια τιμή της ακριβούς λύσης. Επομένως για h = 0.2 παίρνουμε
t1 = 0.2, ενώ για h = 0.1 παίρνουμε t1 = 0.2. Αντίστοιχα και οι προσεγγίσεις που δίνει η μέθοδος του
Euler για h = 0.2 είναι y1 = 0.44, ενώ για h = 0.1, είναι y1 = 0.48. Για να μπορέσουμε να συγκρίνουμε
τα αποτελέσματα για διαφορετικούς διαμερισμούς θα πρέπει να συγκρίνουμε προσεγγίσεις για το ίδιο σημείο.
Έτσι το σημείο t = 0.2 για τον διαμερισμό με βήμα h = 0.2 αντιστοιχεί στο σημείο t1 = 0.2, ενώ για τους
διαμερισμούς με βήμα h = 0.1 και h = 0.05 αντιστοιχεί στα σημεία t2 = 0.2 και t4 = 0.2, αντίστοιχα.
Επομένως, αν θέλουμε να συγκρίνουμε τις προσεγγίσεις που παίρνουμε με τη μέθοδο του Euler για τους δια-
μερισμούς με βήμα h = 0.2, h = 0.1 και h = 0.05 για το σημείο t = 0.2, χρειάζεται να συγκρίνουμε,
για τον διαμερισμό με h = 0.2 την προσέγγιση y1 , για τον διαμερισμό με h = 0.1 την προσέγγιση y2 και
για τον διαμερισμό με h = 0.05 την προσέγγιση y4 . Παρατηρούμε λοιπόν ότι η ακριβής τιμή της λύσης στο
σημείο t = 0.2 είναι y(0.2) ≈ 0.47244 και για τους διαμερισμούς με h = 0.2, 0.1, 0.05 παίρνουμε για
h = 0.2, y1 = 0.48000, για h = 0.1, y2 = 0.47648 και για h = 0.05, y4 = 0.47648, βλ. Πίνακα 9.2.
Έστω k·k μια νόρμα στον Rn , για την εκτίμηση των σφαλμάτων ky n −y(tn )k, 0 ≤ n ≤ N θα χρειαστούμε
το παρακάτω βοηθητικό αποτέλεσμα, μια διακριτή ανισότητα Grönwall:
132 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ Ι. ΜΕΘΟΔΟΣ EULER
Πίνακας 9.2: Παράδειγμα 9.1. Η ακριβής λύση του προβλήματος και η προσεγγιστική λύση για αρχική τιμή
c = 5/2, με τη μέθοδο Euler, με βήμα h = 1/5, h = 1/10 και h = 1/20.
Λήμμα 9.1 (Λήμμα Grönwall). Έστω ότι υπάρχουν σταθερές δ > 0 και K ≥ 0 τέτοιες ώστε η ακολουθία μη
αρνητικών αριθμών {dk }, k ≥ 0 να ικανοποιεί τις σχέσεις
dj+1 ≤ dj (1 + δ) + K, j = 0, 1, . . . . (9.7)
Τότε για κάθε n ≥ 0 έχουμε
enδ − 1
dn ≤ d0 enδ + K . (9.8)
δ
Απόδειξη. Από την (9.7) έχουμε επαγωγικά ότι
dn ≤ (1 + δ)n d0 + K[1 + (1 + δ) + · · · + (1 + δ)n−1 ]
(1 + δ)n − 1
= (1 + δ)n d0 + K ,
δ
από την οποία προκύπτει η (9.8) λόγω της 1 + δ ≤ eδ .
Θεώρημα 9.1. Έστω y(t) η λύση του (9.1) και k · k μια νόρμα στον Rn . Υποθέτουμε επιπλέον των υποθέσεων
του Θεωρήματος Picard–Lindelöf ότι η y ′′ (t) είναι συνεχής στο [a, b]. Έστω {y n }, 0 ≤ n ≤ N , οι προσεγγίσεις
που παράγει η μέθοδος του Euler (9.2). Τότε υπάρχει σταθερά C1 τέτοια ώστε ¹ για 0 ≤ n ≤ N ,
n −a)
eL(t −1
ky − y(t )k ≤ C1 h
n n
maxn ky ′′ (t)k∞ , (9.9)
2L t∈[a,t ]
h2 (2)
όπου pij = 2
yi (ξij ), 1 ≤ i ≤ m, για κάποια ξij ∈ [tj , tj+1 ]. Συνεπώς,
h2
kpj k ≤ C max kpji k ≤ Kj := C1 max ky ′′ (t)k∞ . (9.11)
1≤i≤m 2 t∈[a,tj+1 ]
Αφαιρώντας κατά μέλη την (9.10) από την αναδρομική σχέση της (9.2) και χρησιμοποιώντας την (9.1)
έχουμε
ϵj+1 = ϵj + h f (tj , y j ) − f (tj , y(tj )) − pj .
Τώρα από τις σχέσεις (8.2) και (9.11) έχουμε για 0 ≤ j ≤ n − 1,
Παρατήρηση 9.1. Το Θεώρημα 9.1 δίνει μια εκτίμηση σφάλματος της μορφής
για μια σταθερά C ανεξάρτητη του h που εξαρτάται όμως από τα δεδομένα του προβλήματος a, b, f και τη
λύση u(t). Το φράγμα στην (9.12) είναι γραμμικό προς το h και αυτό είναι το καλύτερο δυνατό που μπορούμε
να πετύχουμε, ανεξάρτητα της ομαλότητας της λύσης. Πράγματι, ας θεωρήσουμε το πρόβλημα αρχικών τιμών
y ′ (t) = 2t, 0 ≤ t ≤ 1, y(0) = 0 το οποίο έχει τη μοναδική λύση y(t) = t2 , t ∈ [0, 1]. Η μέθοδος του Euler
με ομοιόμορφο διαμερισμό στο [0, 1] δίνει y n = n(n−1)h2 . Συνεπώς για N h = 1 έχουμε y(1)−y N = h.
Σημειώνουμε, τέλος, ότι η (9.12) συνεπάγεται ότι η μέθοδος του Euler συγκλίνει με την έννοια ότι αν
n → ∞ και h → 0 έτσι ώστε nh + a = t, τότε un → y(t). Όμως είμαστε αναγκασμένοι να υπολογίζουμε
με πολύ μικρό βήμα για να πάρουμε μικρό σφάλμα max0≤n≤N ky n − y(tn )k. Αυτό έχει ως αποτέλεσμα
μεγάλο αριθμό πράξεων και αύξηση των σφαλμάτων στρογγύλευσης.
Ορισμός 9.1. Λέμε ότι μια αριθμητική μέθοδος συγκλίνει στην ακριβή λύση ενός προβλήματος αρχικών τι-
μών της μορφής (9.1) στο [a, b] αν για κάθε t⋆ ∈ [a, b] τέτοιο ώστε tn → t⋆ καθώς h → 0 και n → ∞,
y n → y(t⋆ ).
Παρατηρούμε ότι λόγω του Θεώρηματος 9.1 η μέθοδος Euler είναι μια αριθμητική μέθοδος η οποία συ-
γκλίνει στην ακριβή λύση ενός προβλήματος αρχικών τιμών, γιατί το σφάλμα εn = y(tn ) − y n για tn = t⋆
ικανοποιεί
kεn k → 0, καθώς h → 0 και tn = t⋆ ,
όπου k·k μια νόρμα στον Rn . Επίσης επειδή το σφάλμα στην (9.12) φράσσεται από το γινόμενο μιας σταθεράς
επί h, στην πρώτη δύναμη. Για αυτόν τον λόγο λέμε ότι η μέθοδος Euler έχει τάξη ακρίβειας (τουλάχιστον)
ένα.
134 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ Ι. ΜΕΘΟΔΟΣ EULER
Θα πρέπει να διακρίνουμε το σφάλμα της μεθόδου Euler στο τοπικό σφάλμα διακριτοποίησης και στο ολικό
σφάλμα.
Ας υποθέσoυμε ότι η λύση είναι γνωστή στο σημείο t. Κάνοντας με τη μέθοδο Euler ένα βήμα μεγέθους
h, ξεκινώντας από το (t, y(t)) παίρνουμε μια προσέγγιση για την τιμή y(t + h). Η διαφορά αυτής της προ-
σέγγισης μείον την ακριβή τιμή y(t + h) είναι ίση με το τοπικό σφάλμα διακριτοποίησης, βλέπε Σχήμα 9.2.
Σχήμα 9.2: Τοπικό σφάλμα διακριτοποίησης. Το σημείο P1 προκύπτει κάνοντας ένα βήμα μεγέθους h με τη
μέθοδο Euler, αν ξεκινήσουμε από το σημείο (t, y(t)). Το σημείο P2 είναι το σημείο του γραφήματος για την
ακριβή τιμή y(t + h). Η διαφορά των δύο σημείων δίνει το τοπικό σφάλμα διακριτοποίησης.
Ορισμός 9.2. Το τοπικό σφάλμα διακριτοποίησης της μεθόδου Euler (9.2) για την προσέγγιση της λύσης y(t)
του προβλήματος αρχικών τιμών (9.1) ορίζεται ως
Παρατήρηση 9.2. Το τοπικό σφάλμα διακριτοποίησης πολλές φορές αναφέρεται και ως σφάλμα συνέπειας .
Ορισμός 9.3 (Συμβολισμός Landau). Για μια ποσότητα z ∈ Rn θα γράφουμε ότι z = O(hp ), p > 0, αν
υπάρχουν θετικές σταθερές h0 και C τέτοιες ώστε
όπου k · k μια νόρμα στον Rn . Είναι προφανές ότι η ποσότητα z θα συγκλίνει στο 0, καθώς h → 0 και η τάξη
(ή ρυθμός) σύγκλισης στο 0 είναι p.
με ξ = O(h2 ). Συνεπώς για τη μέθοδο Euler, εύκολα βλέπουμε ότι δ[y](t, h) = O(h2 ).
Παρατήρηση 9.3. Παρατηρούμε λοιπόν ότι το τοπικό σφάλμα διακριτοποίησης της μεθόδου Euler είναι
O(h2 ), δηλαδή συγκλίνει στο 0 με τάξη σύγκλισης 2, κατά ένα μεγαλύτερη από ότι το ολικό σφάλμα, βλέπε
Θεώρημα 9.1. Μια απλοϊκή εξήγηση για αυτήν τη διαφορά ανάμεσα στο ολικό και το τοπικό σφάλμα, εί-
ναι ότι πραγματοποιούμε την αριθμητική μέθοδο N βήματα για να φτάσουμε από το σημείο a στο b, όπου
N = (b − a)/h. Τα τοπικά σφάλματα συσσωρεύονται και έτσι το ολικό σφάλμα έχει τάξη ως προς h, κατά
ένα μικρότερη.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 135
τα οποία έχουν μοναδικές λύσεις y(t), z(t), αντίστοιχα. Αν υποθέσουμε ότι η f ικανοποιεί την ολική συνθήκη
του Lipschitz, τότε είδαμε ότι ισχύει, βλέπε (8.12)
Χρησιμοποιώντας τώρα την τριγωνική ανισότητα και την ολική συνθήκη του Lipschitz λαμβάνουμε
οπότε
ky n − z n k ≤ (1 + hL)n ky 0 − z 0 k ≤ enhL ky 0 − z 0 k, 0 ≤ n ≤ N. (9.20)
Συνεπώς
n −a)
ky n − z n k ≤ eL(t ky 0 − z 0 k, 0 ≤ n ≤ N. (9.21)
Ολοκληρώνουμε την ανάλυση της μεθόδου Euler εξετάζοντας τη συμπεριφορά της στην περίπτωση f (t, y(t)) =
Ay(t), όπου A ∈ Rn×n είναι ένας συμμετρικός πίνακας.
Θεώρημα 9.2. Έστω A ∈ Rn×n ένας συμμετρικός πίνακας και y : [a, b] → Rn η λύση του προβλήματος
y ′ (t) = Ay(t), t ∈ [a, b], με y(a) = y0 ∈ Rn . Έστω {y n } η ακολουθία προσεγγίσεων που παράγει η
μέθοδος Euler. Τότε,
ky(tn ) − y n k2 ≤ ky0 k2 max |enhλ − (1 + hλ)n |, (9.22)
λ∈σ(A)
Απόδειξη. Αφού A ∈ Rn×n είναι συμμετρικός έχουμε σ(A) ⊂ R. Ακόμα υπάρχει ορθογώνιος πίνακας Q
τέτοιος ώστε A = QDQT , όπου D διαγώνιος πίνακας με Dii = λi , 1 ≤ i ≤ m, οι ιδιοτιμές του A. Η
ακριβής λύση του προβλήματος αρχικών τιμών y ′ (t) = Ay(t), y(a) = y0 , είναι
y(t) = Qe(t−a)D QT y0 ,
όπου e(t−a)D είναι ο διαγώνιος πίνακας με στοιχεία e(t−a)D ii = e(t−a)λi . Για τη μέθοδο Euler εύκολα
βλέπουμε ότι
y n = (I + hA)n y0 = Q(I + hD)n QT y0 , n = 0, 1, . . . , N.
136 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ Ι. ΜΕΘΟΔΟΣ EULER
Συνεπώς,
y(tn ) − y n = Q(enhD − (I + hD)n )QT y0 .
Χρησιμοποιώντας το γεγονός ότι η k · k2 είναι αναλλοίωτη υπό ορθογώνιους μετασχηματισμούς ομοιότητας
έχουμε
ky(tn ) − y n k2 ≤ enhD − (I + hD)n 2 ky0 k2 .
Το συμπέρασμα του θεωρήματος προκύπτει λαμβάνοντας υπ’ όψιν το γεγονός ότι η k · k2 νόρμα ενός διαγώ-
νιου πίνακα είναι το κατ’ απόλυτο τιμή μέγιστο στοιχείο του.
Σημειώνουμε εδώ ότι αν, για παράδειγμα, λi < 0, 1 ≤ i ≤ m, τότε ky(t)k2 → 0 για κάθε y0 ∈ Rn . Η
μέθοδος Euler έχει την ίδια συμπεριφορά μόνο αν
|1 + hλmax | < 1,
συνθήκη η οποία επιβάλλει πιθανώς σοβαρούς περιορισμούς στο μέγεθος του βήματος της μεθόδου. Για μια
πιο αναλυτική μελέτη αυτού του φαινομένου, παραπέμπουμε στο Κεφάλαιο 12.
Παράδειγμα 9.2. Θεωρούμε το πρόβλημα αρχικών τιμών: Ζητείται x(t), y(t) : [0, 2π] → R
(
x′ (t) = −y(t), x(0) = 1,
0 ≤ t ≤ 2π, (9.23)
y ′ (t) = x(t), y(0) = 0,
με Y0 = (1, 0)T και f (Z) = (−ζ2 , ζ1 )T , Z = (ζ1 , ζ2 )T . Η ακριβής λύση του συστήματος είναι Y (t) =
(x(t), y(t)) = (cos(t), sin(t)), t ∈ [0, 2π], η οποία περιγράφεται και από την παραμετρική καμπύλη
x2 (t) + y 2 (t) = 1, βλ. Σχήμα 9.3. Για ακέραιο N > 0 θεωρούμε μια διαμέριση του [0, 2π], tn = hn,
h = 2π/N και τις προσεγγίσεις Y n = (xn , y n ), n = 0, . . . , N , που δίνει η άμεση μέθοδος Euler Y n+1 =
Y n + hf (Y n ), Y 0 = Y0 , για n = 0, . . . , N − 1 ή διαφορετικά
(
xn+1 = xn − hy n , x0 = 1,
n = 0, . . . , N − 1 (9.25)
y n+1 = y n + hxn , y 0 = 0,
Στο Σχήμα 9.3 για N = 50, 100, 200, 400, εμφανίζεται η γραφική παράσταση των (xn )2 +(y n )2 και παρα-
τηρούμε ότι καθώς το N αυξάνεται, δηλαδή μειώνεται η ποσότητα h = 2π/N , οι προσεγγίσεις πλησιάζουν
τη γραφική παράσταση της ακριβούς λύσης.
N = 50 N = 100
1.00 1.0 1.0
0.75
0.25
0.0 0.0
0.00
0.25 0.5
0.5
0.50
0.75 1.0
1.0
1.00
1.00 0.75 0.50 0.25 0.00 0.25 0.50 0.75 1.00 1.0 0.5 0.0 0.5 1.0 1.5 1.0 0.5 0.0 0.5 1.0
N = 200 N = 400
1.0 1.0
0.5 0.5
0.0 0.0
0.5 0.5
1.0 1.0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Σχήμα 9.3: Παράδειγμα 9.2. Πάνω αριστερά: Η καμπύλη x(t)2 + y(t)2 της ακριβούς λύσης. Υπόλοι-
πες: Οι αντίστοιχες καμπύλες που δημιουργούν οι προσεγγίσεις με την άμεση μέθοδο Euler για N =
50, 100, 200, 400. Καθώς αυξάνεται το πλήθος των σημείων N δηλαδή μειώνεται η παράμετρος διαμέρι-
σης h, η καμπύλη των προσεγγίσεων πλησιάζει την καμπύλη της ακριβούς λύσης.
Θεώρημα του Απειροστικού Λογισμού γνωρίζουμε ότι αν y ′ (t) = f (t, y(t)) και y(a) = y0 , τότε μπορούμε
να προσεγγίσουμε την y(t) χρησιμοποιώντας
Z t
y(t) = y0 + f (s, y(s)) ds ≈ y0 + Q[f (·, y(·)); a, t],
a
όπου Q είναι ένας κανόνας αριθμητικής ολοκλήρωσης. Αν, για παράδειγμα, χρησιμοποιήσουμε τον (αριστερό)
κανόνα του ορθογωνίου δηλαδή,
Προκύπτει επομένως η ακόλουθη μέθοδος που καλείται πεπλεγμένη μέθοδος Euler όπου κατασκευάζουμε
προσεγγίσεις y n ∈ Rn , n = 0, . . . , N των τιμών y(tn ), σύμφωνα με τον αναδρομικό τύπο
με y0 δοσμένο όπως στο (9.1). Επειδή δεν παίρνουμε τις τιμές y n , n = 0, . . . , N , στην (9.27) με άμεσο
τρόπο αλλά πεπλεγμένα, λύνοντας μια μη γραμμική εξίσωση ή ένα μη γραμμικό σύστημα, καλούμε αυτήν τη
μέθοδο πεπλεγμένη.
Μια άλλη μέθοδος, η οποία είναι και εκείνη πεπλεγμένη, προκύπτει αν χρησιμοποιήσουμε τον κανόνα αριθ-
μητικής ολοκλήρωσης του τραπεζίου για να προσεγγίσουμε την τιμή του ολοκληρώματος στο δεξιό μέλος της
(9.3). Οπότε παίρνουμε
1
y(tn+1 ) ≈ y(tn ) + f (tn , y(tn )) + f (tn+1 , y(tn+1 )) . (9.28)
2
Επομένως έχουμε την ακόλουθη μέθοδο που καλείται μέθοδος του τραπεζίου όπου κατασκευάζουμε προ-
σεγγίσεις y n ∈ Rn , n = 0, . . . , N , των τιμών y(tn ), σύμφωνα με τον αναδρομικό τύπο
1
y n+1 = y n + f (tn , y n ) + f (tn+1 , y n+1 ) , n = 0, . . . , N − 1, (9.29)
2
με y0 δοσμένο όπως στο (9.1).
Αυτές οι μέθοδοι που θεωρήσαμε προηγουμένως ανήκουν σε μια κατηγορία μεθόδων που καλούνται μονο-
βηματικές μέθοδοι.
Ορισμός 9.4. Έστω y : [a, b] → Rn η λύση του προβλήματος αρχικών τιμών (9.1)
όπου G συνεχής συνάρτηση με G(t, 0, y, y) = f (t, y). Η μονοβηματική μέθοδος θα λέγεται άμεση αν η
G είναι ανεξάρτητη της τελευταίας μεταβλητής της, διαφορετικά θα λέγεται έμμεση ή πεπλεγμένη. Το ολικό
σφάλμα της προσέγγισης, {εn }, 0 ≤ n ≤ N , ορίζεται ως
εn = y(tn ) − y n .
G(t, h, y1 , y2 ) = f (t, y1 ).
G(t, h, y1 , y2 ) = f (t + h, y2 ).
Απόδειξη. Σύμφωνα με την (9.32) η μέθοδος του μέσου για το πρόβλημα αρχικών τιμών (9.1) είναι
h y n + y n+1
y n+1 n
= y + hf t + , n
, n = 0, . . . , N − 1,
2 2
και το σφάλμα διακριτοποίησης το
h y(t) + y(t + h)
δ[y](t, h) = y(t + h) − y(t) − hf t+ , .
2 2
Με ϵn = y(tn ) − y n , εύκολα βλέπουμε ότι
n+1 n n h y(tn ) + y(tn+1 )
ϵ =ϵ +h f t + , (9.38)
2 2
h y + y n+1
n
−f t + ,n
+ δ[y](tn , h),
2 2
h h3 (3) n,1
y(tn+1 ) − y(tn ) = hy ′ (tn + ) + y (ξ ) + y (3) (ξ n,2 ) ,
2 48
και
y(tn+1 ) + y(tn ) h h2 (2) n,3
= y(tn + ) + y (ξ ) + y (2) (ξ n,4 ) ,
2 2 16
για κάποια ξ n,j ∈ Rn , 1 ≤ j ≤ 4, με ξi ∈ [tn , tn+1 ], 1 ≤ i ≤ m. Συνεπώς
n,j
h h h h
δ[y](t , h) = h f (t + , y(t + )) − f (t + , y(t + ) + ζ )
n n n n n n
2 2 2 2
3
h
+ y (3) (ξ n,1 ) + y (3) (ξ n,2 ) ,
48
h2 (2) n,3
όπου ζ n = 16
[y (ξ ) + y (2) (ξ n,4 )]. Από το Λήμμα 7.4, το Λήμμα 7.5 και την τριγωνική ανισότητα
έχουμε
kδ[y](tn , h)k ≤ Ch3 max ky (3) (t)k∞ = Kn h3 . (9.39)
t∈[tn ,tn+1 ]
Παίρνοντας νόρμες στην (9.38), χρησιμοποιώντας την τριγωνική ανισότητα και την (8.2) έχουμε
ϵn + ϵn+1
kϵn+1 k ≤ kϵn k + hL + kδ[y](tn , h)k.
2
Επειδή 1 − hL
2
> 0, χρησιμοποιώντας την (9.39) παίρνουμε
hL
1+ Kn 3
kϵn+1 k ≤ 2
kϵn k + h.
1− hL
2
1 − hL
2
Ένα επιχείρημα² ανάλογο της απόδειξης του Λήμματος 9.1 μας δίνει
" !n #
2 hL
K n h 1 +
kϵn k ≤ 2
− 1 , n = 0, . . . , N.
L 1− 2hL
²Δείξτε ότι αν η ακολουθία μη αρνητικών ακεραίων {dk } ικανοποιεί d0 = 0 και dk+1 ≤ bdk + c, k ≥ 0, για κάποιες
σταθερές b > 1, c ≥ 0, τότε dk ≤ b−1
c
[bk − 1], k ≥ 0.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 141
συνεπώς
Kn 2L(tn −a)
kϵn k ≤e − 1 h2 ,
L
το οποίο ολοκληρώνει την απόδειξη του θεωρήματος.
Παρατήρηση 9.4. Μπορούμε να παρατηρήσουμε ότι από τη σχέση (9.39) το τοπικό σφάλμα διακριτοποίη-
σης για τη μέθοδο του μέσου είναι O(h3 ), δηλαδή έχει τάξη ακρίβειας 2. Με ανάλογο τρόπο (το αφήνουμε ως
άσκηση) μπορούμε να δούμε ότι για τη μέθοδο της πεπλεγμένης Euler, το τοπικό σφάλμα διακριτοποίησης
Με ανάλογο τρόπο (το αφήνουμε ως άσκηση) μπορούμε να δούμε ότι για τη μέθοδο του τραπεζίου, το τοπικό
σφάλμα διακριτοποίησης
h
δ[y](t, h) = y(t + h) − [y(t) + (f (t + h, y(t + h)) + f (t, y(t)))] = O(h3 ). (9.41)
2
Παρατήρηση 9.5. Στις παραπάνω μεθόδους, εκτός από την απλή μέθοδο Euler που ήδη εξετάσαμε, το y n+1
στην (9.31) δίνεται πεπλεγμένα. Για να προσδιορίσουμε δηλαδή το y n+1 στην πεπλεγμένη μέθοδο Euler, στη
μέθοδο του τραπεζίου ή στη μέθοδο του μέσου, πρέπει να λύσουμε ένα μη γραμμικό σύστημα ή εξίσωση.
Στην περίπτωση όμως που η f είναι γραμμική ως προς τη μεταβλητή y, τότε μπορούμε να προσδιορίσουμε
το y n+1 άμεσα. Αν λοιπόν f (t, y) = g(t)y με g μια συνεχή συνάρτηση, τότε οι παραπάνω πεπλεγμένες
μέθοδοι γίνονται ως εξής:
1. Η πεπλεγμένη μέθοδος Euler,
yn
y n+1 = , εφόσον 1 − hg(tn+1 ) 6= 0.
1 − hg(tn+1 )
1 + h2 g(tn ) n h
y n+1
= y , εφόσον 1 − g(tn+1 ) 6= 0.
1 − 2 g(t )
h n+1 2
1 + h2 g(tn + h2 )) n h h
y n+1
= y , εφόσον 1 − g(tn + )) 6= 0.
1 − 2 g(t + 2 )
h n h 2 2
Παράδειγμα 9.3. Ας εφαρμόσουμε τώρα την πεπλεγμένη μέθοδο Euler, τη μέθοδο του τραπεζίου και τη
μέθοδο του μέσου για να κατασκευάσουμε προσεγγίσεις για τη λύση του ακόλουθου προβλήματος αρχικών
τιμών: Έστω y : [0, 10] → R τέτοια ώστε
Η ακριβής λύση του προβλήματος (9.42) είναι y(t) = esin(t) . Επειδή η διαφορική εξίσωση (9.42) είναι
γραμμική ως προς y, η πεπλεγμένη μέθοδος Euler, μέθοδος του τραπεζίου και η μέθοδος του μέσου μπο-
ρούν να υλοποιηθούν με άμεσο τρόπο. Θεωρούμε διαμερισμούς του διαστήματος [0, 10] με h = 1/N ,
142 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ Ι. ΜΕΘΟΔΟΣ EULER
N = 100, 200, 300, 400. Στον Πίνακα 9.3 αναφέρουμε τα σφάλματα |y(tN ) − y N | αν χρησιμοποιήσουμε
τη μεθόδο του Εuler, την πεπλεγμένη μεθόδο του Εuler, τη μέθοδο του τραπεζίου και τη μέθοδο του μέσου.
Επίσης αναφέρουμε και τις αντίστοιχες προσεγγίσεις της τάξης ακρίβειας της μεθόδου. Επίσης αναφέρεται
και η προσεγγιστική τάξη ακρίβειας p κάθε μεθόδου. Αυτή ορίζεται ως εξής: Για δύο διαφορετικές διαμερί-
σεις με βήματα h1 και h2 , (h1 > h2 ) υπολογίζουμε τα αντίστοιχα σφάλματα ϵ1 = |y(10) − y N1 | και
ϵ2 = |y(10) − y N2 |, όπου N1 h1 = N2 h2 = 10, στη συνέχεια υπολογίζουμε τον αριθμό p,
ln(ϵ1 /ϵ2 )
p= ,
ln(h1 /h2 )
ο οποίος αποτελεί μια εκτίμηση της τάξης ακρίβειας της μεθόδου.
Σχήμα 9.4: Η ακριβής λύση του προβλήματος στο Παράδειγμα 9.3 καθώς και οι προσεγγιστικές λύσεις με
τη μέθοδο Euler, την πεπλεγμένη μεθόδο Εuler, τη μέθοδο του τραπεζίου και τη μέθοδο του μέσου, με βήμα
h = 1/25.
Πίνακας 9.3: Τα σφάλματα |y(tN ) − y N | στο σημείο tN = N h = 10 των μεθόδων Εuler, πεπλεγμένης
Εuler, τραπεζίου και μέσου, υπολογισμένα για N = 100, 200, 300, 400 και οι αντίστοιχες προσεγγίσεις της
τάξης ακρίβειας p για το Παράδειγμα 9.3.
Αν η f δεν είναι γραμμική ως προς τη μεταβλητή y, τότε για να προσδιορίσουμε το y n+1 στην πεπλεγμένη
μέθοδο Euler, στη μέθοδο του τραπεζίου ή στη μέθοδο του μέσου πρέπει να λύσουμε ένα μη γραμμικό σύστημα
ή εξίσωση. Επομένως θέλουμε να δείξουμε ότι μπορούμε να ορίσουμε το y n+1 μονοσήμαντα.
Θα εξετάσουμε για ευκολία την περίπτωση της πεπλεγμένης μεθόδου Euler,
y n+1 = y n + hf (tn+1 , y n+1 ), n = 0, . . . , N − 1. (9.43)
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 143
Οι άλλες δύο μέθοδοι προκύπτουν ανάλογα. Έστω ότι η f ικανοποιεί τη ολική συνθήκη του Lipschitz (8.2) με
σταθερά Lipschitz L. Υποθέτουμε οτι το βήμα h είναι κατάλληλα μικρό ωστε hL < 1. Στη συνέχεια ορίζουμε
τη συνάρτηση g : Rn → Rn
g(x) := y n + hf (tn+1 , x)
η οποία είναι συστολή στο Rn , βλέπε Θεώρημα 7.2 και άρα έχει μοναδικό σταθερό σημείο y n+1 , αφού η (9.43)
γράφεται
y n+1 = g(y n+1 ).
Για να μπορέσουμε να προσεγγίσουμε τo σταθερό σημείο y n+1 , δημιουργούμε μια ακολουθία σημείων xk ∈
Rn , τέτοια ώστε
xk+1 = y n + hf (tn+1 , xk ), k = 0, 1, . . . , με x0 = y n . (9.44)
To x0 = y n είναι μια καλή αρχική προσέγγιση του σταθερού σημείου y n+1 . Στην πράξη για να προσεγγί-
σουμε το y n+1 εκτελούμε μερικές επαναλήψεις της (9.44). Μπορούμε να θεωρήσουμε κάποιο κριτήριο για
να σταματήσουμε τις επαναλήψεις, όπως να θεωρήσουμε ότι πάντα θα εκτελούμε π.χ. kmax = 5 επαναλή-
ψεις ή να ελέγχουμε αν η διαφορά, ανάμεσα σε συνεχόμενες προσεγγίσεις γίνει μικρότερη από μια επιθυμητή
ακρίβεια, π.χ. T OL = 10−8 .
Παράδειγμα 9.4. Ας εφαρμόσουμε τώρα την πεπλεγμένη μέθοδο Euler, τη μέθοδο του τραπεζίου και τη
μέθοδο του μέσου για να κατασκευάσουμε προσεγγίσεις για τη λύση του ακόλουθου προβλήματος αρχικών
τιμών: Έστω y : [0, 1] → R τέτοια ώστε
y(t)
y ′ (t) = 10y(t)(1 − ), t ∈ [0, 1], με y(0) = 10. (9.45)
100
100
Το πρόβλημα (9.45) έχει μοναδική λύση στο [0, 1] και η ακριβής λύση του είναι y(t) = 1+9e −10t . Επειδή
η διαφορική εξίσωση δεν είναι γραμμική ως προς y, η πεπλεγμένη μέθοδος Euler, η μέθοδος του τραπεζίου
και η μέθοδος του μέσου δεν μπορούν να υλοποιηθούν με άμεσο τρόπο. Επομένως σε κάθε βήμα πρέπει να
λύνουμε και από μια μη γραμμική εξίσωση. Τα κριτήρια τερματισμού των επαναλήψεων είναι T OL = 10−8
και kmax = 50. Θεωρούμε διαμερισμούς του διαστήματος [0, 1] με h = 1/N , N = 50, 100, 150, 200.
Στον Πίνακα 9.4 αναφέρουμε τα σφάλματα |y(tN ) − y N | αν χρησιμοποιήσουμε τη μεθόδο του Εuler, την
πεπλεγμένη μεθόδο του Εuler, τη μέθοδο του τραπεζίου και τη μέθοδο του μέσου. Επίσης αναφέρουμε και τις
αντίστοιχες προσεγγίσεις της τάξης ακρίβειας της μεθόδου.
Πίνακας 9.4: Τα σφάλματα |y(tN ) − y N | στο σημείο tN = N h = 1 των μεθόδων Εuler, πεπλεγμένης
Εuler, τραπεζίου και μέσου υπολογισμένα για N = 50, 100, 150, 200 και οι αντίστοιχες προσεγγίσεις της
τάξης ακρίβειας p για το Παράδειγμα 9.4.
Tο αντικείμενο αυτού του κεφαλαίου υπάρχει πιο αναλυτικά σε βιβλία με αντικείμενο την αριθμητική λύση
συνήθων διαφορικών εξισώσεων. Παραθέτουμε κάποιες αναφορές τις οποίες ο αναγνώστης μπορεί να συμ-
βουλευτεί: [1], [2], [4], [5], [6], [7], [10], [11].
144 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ Ι. ΜΕΘΟΔΟΣ EULER
Σχήμα 9.5: Η ακριβής λύση του προβλήματος στο Παράδειγμα 9.4 καθώς και οι προσεγγιστικές λύσεις με
τη μέθοδο Euler, την πεπλεγμένη μεθόδο Εuler, τη μέθοδο του τραπεζίου και τη μέθοδο του μέσου, με βήμα
h = 1/10.
9.6 Ασκήσεις
9.6.1 Θεωρήστε έναν μη ομοιόμορφο διαμερισμό του διαστήματος [a, b], a = t0 < t1 < · · · < tN = b
και υποθέστε ότι αν hn = tn+1 − tn , 0 ≤ n ≤ N − 1, είναι το μεταβλητό βήμα, τότε minn hn ≥
λ maxn hn , για κάποια σταθερά λ > 0 ανεξάρτητη του n. Δείξτε ένα φράγμα για το σφάλμα της
μεθόδου Euler ανάλογο του (9.9) με h = maxn hn .
με την προφανή μοναδική λύση x(t) = cos t, y(t) = sin t, η οποία ικανοποιεί τον νόμο διατήρησης
Θεωρήστε τη μέθοδο Euler για το σύστημα (9.46) με σταθερό h > 0. Δείξτε ότι δεν ικανοποιεί το
διακριτό ανάλογο της (9.47), δηλαδή ότι (xn )2 + (y n )2 6= 1 αν n > 1. Μάλιστα δείξτε ότι για
σταθερό h, limn→∞ [(xn )2 + (y n )2 ] = ∞.
9.6.3 Εξετάστε αν υπάρχει διακριτό ανάλογο της (9.47) για την προσεγγιστική λύση του συστήματος (9.46)
με τη μέθοδο
x
n+1
− xn = −hy n , n ≥ 0,
y n+1 − y n = hxn+1 , n ≥ 0,
0
x = 1, y 0 = 0.
9.6.4 Εξετάστε αν υπάρχει διακριτό ανάλογο της (9.47) για την προσεγγιστική λύση του συστήματος (9.46)
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 145
9.6.5 Εξετάστε αν υπάρχει διακριτό ανάλογο της (9.47) για την προσεγγιστική λύση του συστήματος (9.46)
με τη μέθοδο του τραπεζίου
x
n+1
− xn = − h2 (y n + y n+1 ), n ≥ 0,
y n+1 − y n = h2 (xn + xn+1 ), n ≥ 0,
0
x = 1, y 0 = 0.
9.6.6 Αποδείξτε τη σύγκλιση της πεπλεγμένης μεθόδου Euler για το πρόβλημα αρχικών τιμών (9.1) ακο-
λουθώντας την απόδειξη του θεωρήματος 9.3.
9.6.7 Αποδείξτε τη σύγκλιση της μεθόδου του τραπεζίου για το πρόβλημα αρχικών τιμών (9.1) ακολουθώ-
ντας την απόδειξη του θεωρήματος 9.3.
Βιβλιογραφία
[1] K. E. Atkinson, W. Han και D. E. Stewart. Numerical Solution of Ordinary Differential Equations.
English. Hoboken, NJ: John Wiley & Sons, 2009, σσ. xii + 252. isbn: 978-0-470-04294-6.
[2] J.C. Butcher. The Numerical Analysis of Ordinary Differential Equations. Hoboken, New Jersey: John
Wiley & Sons, 1987.
[3] P. J. Davis και P. Rabinowitz. Methods of Numerical Integration. English. 2nd. Orlando: Academic
Press, Inc., 1984.
[4] D. F. Griffiths και D. J. Higham. Numerical Methods for Ordinary Differential Equations. Initial Value
Problems. English. London: Springer, 2010, σσ. xiv + 271. isbn: 978-0-85729-147-9. doi: 10 .
1007/978‐0‐85729‐148‐6.
[5] E. Hairer, S. P. Nørsett και G. Wanner. Solving Ordinary Differential Equations. I: Nonstiff Problems.
English. Τόμ. 8. Berlin: Springer, 2010, σσ. xv + 528. isbn: 978-3-642-05163-0.
[6] A. Iserles. A First Course in the Numerical Analysis of Differential Equations. English. 2nd ed. Camb.
Texts Appl. Math. Cambridge: Cambridge University Press, 2009. isbn: 978-0-521-73490-5. doi:
10.1017/CBO9780511995569.
[7] J. D. Lambert. Numerical Methods for Ordinary Differential Dystems: The Initial Value Problem. En-
glish. Chichester etc.: John Wiley &| Sons, 1991, σσ. x + 293. isbn: 0-471-92990-5.
[8] E. Süli και D. F. Mayers. An Introduction to Numerical Analysis. Cambridge University Press, 2003.
isbn: 0-521-00794-1.
[9] Γ. Δ. Ακρίβης και B. A. Δουγαλής. Εισαγωγή στην Αριθμητική Ανάλυση. Πανεπιστημιακές Εκδόσεις
Κρήτης, 2017.
[10] Γ. Δ. Ακρίβης και Β.Α. Δουγαλής. Αριθμητικές Μέθοδοι για Συνήθεις Διαφορικές Εξισώσεις. Πανεπι-
στημιακές Εκδόσεις Κρήτης, 2015.
[11] Μ. Ν. Βραχάτης. Αριθμητική Ανάλυση: Συνήθεις Διαφορικές Εξισώσεις. Εκδόσεις Κλειδάριθμος, 2012.
146 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ Ι. ΜΕΘΟΔΟΣ EULER
ΚΕΦΑΛΑΙΟ 10
Περίληψη
Οι μέθοδοι Runge-Kutta είναι μια κατηγορία αριθμητικών μεθόδων για την επίλυση προβλημάτων αρχικών
τιμών
y ′ (t) = f (t, y(t)), a ≤ t ≤ b,
y(a) = y0 .
Οι μέθοδοι Runge-Kutta είναι μονοβηματικές μέθοδοι, απαιτούν όμως τον υπολογισμό διάφορων ενδιάμε-
σων τιμών οι οποίες όμως δεν ξαναχρησιμοποιούνται. Θα ορίσουμε αυτές τις μεθόδους οι οποίες χωρίζονται
σε άμεσες και πεπλεγμένες μεθόδους. Θα μελετήσουμε την ευστάθεια, τη συνέπεια, την τάξη ακρίβειας και
τη σύγκλιση αυτών των μεθόδων. Επίσης θα δείξουμε ικανές συνθήκες για τον προσδιορισμό της τάξης ακρί-
βειάς τους. Οι πεπλεγμένες μέθοδοι Runge-Kutta είναι πιο απαιτητικές στην υλοποίησή τους από τις άμεσες
μεθόδους Runge-Kutta, όμως έχουν υψηλή τάξη ακρίβειας και εξαιρετικές ιδιότητες ευστάθειας.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Συνήθων Διαφορικών Εξισώσεων και Απειροστικού Λογισμού σε
πολλές διαστάσεις. Διανυσματικοί χώροι με νόρμα. Αριθμητική επίλυση μη γραμμικών συστημάτων. Αριθμη-
τική ολοκλήρωση.
όπου οι κόμβοι sj είναι σημεία στο διάστημα ολοκλήρωσης και τα βάρη wj είναι πραγματικοί αριθμοί. Υπάρ-
χουν και κανόνες ολοκλήρωσης στους οποίους χρησιμοποιούνται και κόμβοι εκτός του διαστήματος ολοκλή-
ρωσης. Για μια πιο αναλυτική παρουσίαση κανόνων αριθμητικής ολοκλήρωσης παραπέπουμε στα [3], [8],
[9].
Θεωρούμε μια διαμέριση του διαστήματος [a, b], tn = a + nh, n = 0, . . . , N , h = b−a N
, N ∈ N.
n n+1
Ολοκληρώντας τη διαφορική εξίσωση (10.1) στο διάστημα [t , t ] προκύπτει η σχέση
Z tn+1 Z 1
n+1 n n
y(t ) = y(t ) + f (τ, y(τ )) dτ = y(t ) + h f (tn + hτ, y(tn + hτ )) dτ.
tn 0
επομένως έχουμε
X
q
y(t n+1
) ≈ y(t ) + h n
bi f (tn + hτi , y(tn + hτi )). (10.4)
i=1
Για να μπορέσουμε να υπολογίσουμε τις τιμές της f στο τελευταίο άθροισμα θα χρειαστεί να κατασκευάσουμε
προσεγγίσεις για τις y(tn + hτi ), i = 1, . . . , q. Αυτό μπορούμε να το υλοποιήσουμε με παρόμοιο τρόπο
όπως κάναμε προηγουμένως για την προσέγγιση της y(tn+1 ). Ολοκληρώνουμε τώρα τη διαφορική εξίσωση
(10.1) στο διάστημα [tn , tn + hτi ], οπότε προκύπτει
Z tn +hτi Z τi
n n n
y(t + hτi ) = y(t ) + f (τ, y(τ )) dτ = y(t ) + h f (tn + hτ, y(tn + hτ )) dτ.
tn 0
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 149
Στη συνέχεια θεωρούμε προσέγγισεις των ολοκληρωμάτων μιας συνάρτησης στο [0, τi ], i = 1, . . . , q, με
κανόνες αριθμητικής ολοκλήρωσης με βάρη aij και τους ίδιους κόμβους τj ∈ [0, 1], j = 1, . . . , q, δηλαδή
Z τi X
q
g(s) ds ≈ aij g(τj ), i = 1, . . . , q. (10.5)
0 j=1
Οπότε έχουμε
X
q
y(t + hτi ) ≈ y(t ) + h
n n
aij f (tn + hτj , y(tn + hτj )), i = 1, . . . , q. (10.6)
j=1
Θα συμβολίζουμε με y n την τιμή που παράγει μια μέθοδος Runge-Kutta για την προσέγγιση της λύσης
στο σημείο tn . Η κατασκευή της επόμενης προσέγγισης y n+1 πραγματοποιείται με τον ακόλουθο τρόπο.
Χρησιμοποιούμε την τιμή y n για να κατασκευάσουμε q ∈ N προσεγγίσεις της λύσης στα ενδιάμεσα σημεία ή
στάδια tn,i = tn + τi h, i = 1, . . . , q, σύμφωνα με την προσέγγιση (10.6). Στη συνέχεια χρησιμοποιώντας
αυτές τις q ενδιάμεσες προσεγγίσεις της λύσης υπολογίζουμε την επόμενη προσέγγιση y n+1 σύμφωνα με την
(10.4). Ο αριθμός q ∈ N καθορίζει τον αριθμό των σταδίων μιας μεθόδου Runge-Kutta.
Ορισμός 10.1. Μια μέθοδος Runge-Kutta με q στάδια για τον υπολογισμό της προσεγγιστικής λύσης {y n },
n = 0, . . . , N , της διαφορικής εξίσωσης (10.1), ορίζεται από τις σχέσεις y 0 = y0 και
X
q
y n,i = y n + h aij f (tn,j , y n,j ), i = 1, . . . , q, (10.7)
j=1
X q
y n+1 = y n + h bi f (tn,i , y n,i ), n = 0, . . . , N − 1, (10.8)
i=1
a11 · · · a1q τ1
A τ .. ... .. ..
= . . . (10.9)
bT aq1 · · · aqq τq
b1 · · · bq
Ο φορμαλισμός των μεθόδων Runge-Kutta οφείλεται στον J. C. Butcher, [2] και το παραπάνω μητρώο κα-
λείται και μητρώο Butcher μιας μεθόδου Runge-Kutta.
Μια μέθοδος Runge–Kutta θα λέγεται άμεση αν aij = 0 για i ≤ j, διαφορετικά θα λέγεται πεπλεγμένη.
Αν aij = 0 για i < j, η μέθοδος θα λέγεται ημιπεπλεγμένη ή διαγώνια πεπλεγμένη.
Παρατήρηση 10.1. Ένας ισοδύναμος τρόπος ορισμού της γενικής μεθόδου Runge-Kutta με q στάδια είναι ο
ακόλουθος: Θέτουμε k n,i = f (tn,i , y n,i ), i = 1, . . . , q, οπότε οι σχέσεις (10.7) και (10.8) γράφονται ως
X
q
k n,i = f (tn,i , y n + h aij k n,j ), i = 1, . . . , q, (10.10)
j=1
X
q
n+1 n
y =y +h bi k n,i . (10.11)
i=1
150 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ. ΜΕΘΟΔΟΙ RUNGE-KUTTA
y n,1 = y n ,
h
y n,2 = y n + f (tn , y n ),
2
h h
y n+1 = y n + hf (tn + , y n + f (tn , y n )),
2 2
και καλείται βελτιωμένη μέθοδος του Euler. Το μητρώο
0 0 0
1/2 1/2 1
1/2 1/2
περιγράφει τη μέθοδο του τραπεζίου, γιατί από τις σχέσεις
y n,1 = y n ,
h h
y n,2 = y n + f (tn , y n ) + f (tn+1 , y n,2 ),
2 2
h h
y n+1 = y n + f (tn , y n ) + f (tn+1 , y n,2 ),
2 2
έχουμε y n+1 = y n,2 και συνεπώς
h h
y n+1 = y n + f (tn , y n ) + f (tn+1 , y n+1 ).
2 2
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 151
Παράδειγμα 10.3. Μια ενδιαφέρουσα οικογένεια ημιπεπλεγμένων μεθόδων με q = 2 στάδια δίνεται από το
μονοπαραμετρικό μητρώο με λ ∈ R
λ 0 λ
1 − 2λ λ 1 − λ . (10.12)
1/2 1/2
√
3± 3
Οι τιμές λ = 6
δίνουν τις λεγόμενες μεθόδους “(2,3)-DIRK” (Diagonally Implicit Runge-Kutta).
Παράδειγμα 10.4. H μέθοδος που δίνεται από το μητρώο
1/4 1/4 − µ 1/2 − µ
1/4 + µ 1/4 1/2 + µ (10.13)
1/2 1/2
√
με µ = 3/6 είναι η λεγόμενη μέθοδος Gauss-Legendre δύο σημείων. Τα τi = 1/2 ± µ είναι οι κόμβοι και
τα bi = 1/2 τα βάρη του κανόνα ολοκλήρωσης Gauss με δύο σημεία με συνάρτηση βάρους w(x) = 1 στο
[0, 1].
Παράδειγμα 10.5. Γνωστές μέθοδοι Runge-Kutta 3-σταδίων περιγράφονται από τα μητρώα
0 0 0 0 0 0 0 0
1/2 0 0 1/2 1/3 0 0 1/3
(10.14)
−1 2 0 1 0 2/3 0 2/3
1/6 2/3 1/6 1/4 0 3/4
H πρώτη καλείται άμεση μέθοδος Runge-Kutta 3ης τάξεως και η δεύτερη μέθοδος του Heun 3ης τάξεως .
Παράδειγμα 10.6. Γνωστές πεπλεγμένες μέθοδοι Runge-Kutta 3-σταδίων περιγράφονται από τα μητρώα
0 0 0 0 1/6 −1/3 1/6 0
5/24 1/3 −1/24 1/2 1/6 5/12 −1/12 1/2
(10.15)
1/6 2/3 1/6 1 1/6 2/3 1/6 1
1/6 2/3 1/6 1/6 2/3 1/6
η πρώτη καλείται μέθοδος Lobatto IIIA και η δεύτερη Lobatto IIIC.
Παράδειγμα 10.7. Οι κλασικές μέθοδοι Runge-Kutta περιγράφονται από τα μητρώα
0 0 0 0 0 0 0 0 0 0
1/2 0 0 0 1/2 1/3 0 0 0 1/3
0 1/2 0 0 1/2 −1/3 1 0 0 2/3 (10.16)
0 0 1 0 1 1 −1 1 0 1
1/6 1/3 1/3 1/6 1/8 3/8 3/8 1/8
Πολλά παραδείγματα μεθόδων Runge-Kutta υπάρχουν στα βιβλία [2] και [5].
Στην περίπτωση μιας άμεσης μεθόδου Runge-Kutta είναι προφανές ότι οι τιμές y n,i στα ενδιάμεσα στάδια
είναι καλώς ορισμένες και άρα και η επόμενη προσέγγιση y n+1 . Στην περίπτωση πεπλεγμένων μεθόδων
Runge–Kutta θα χρειαστεί να δείξουμε ότι το μη γραμμικό σύστημα (10.7) που ορίζει τα {y n,i } συναρ-
τήσει του y n λύνεται μονοσήμαντα. Υποθέτουμε, βέβαια, ότι ισχύουν οι υποθέσεις του θεωρήματος Picard-
Lindelöf, δηλαδή η f ικανοποιεί την ολική συνθήκη Lipschitz,
kf (t, u) − f (t, v)k ≤ Lku − vk, ∀u, v ∈ Rn , t ∈ [a, b]. (10.17)
152 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ. ΜΕΘΟΔΟΙ RUNGE-KUTTA
Θεώρημα 10.1. Θεωρούμε μια πεπλεγμένη μέθοδο Runge-Kutta της μορφής (10.7)–(10.8). Έστω |A| ο πίνα-
κας των απολύτων τιμών των στοιχείων aij του πίνακα A και ρ(|A|) η φασματική του ακτίνα. Τότε για κάθε h
τέτοιο ώστε
h ≤ h0 < (Lρ(|A|))−1 , (10.18)
το σύστημα (10.7) έχει μοναδική λύση y n,i , i = 1, . . . , q.
X
q
|F (ζ)i − F (ξ)i | ≤ Lh |aij | |ζj − ξj |, 1 ≤ i ≤ q.
j=1
Αν συμβολίσουμε [x] = (|x1 |, . . . , |xq |)T τότε οι προηγούμενες σχέσεις γράφονται ως¹
Αν τώρα F 2 (ζ) = F (F (ζ)) και γενικά F k (ζ) = F (F k−1 (ζ)), η παραπάνω σχέση εφαρμοζόμενη κατ’
επανάληψη δίνει
[F k (ζ) − F k (ξ)] ≤ (Lh|A|)k [ζ − ξ], ∀ ζ, ξ ∈ Rq . (10.19)
Από την υπόθεση (10.18) έχουμε hLρ(|A|) = ρ(hL|A|) < 1. Επειδή khL|A|k ≤ ρ(hL|A|), η ακολου-
θία πινάκων (hL|A|)k τείνει στο μηδέν καθώς k → ∞. Άρα, για κάποιο k0 αρκετά μεγάλο όλα τα στοιχεία
του πίνακα (hL|A|)k0 θα γίνουν μικρότερα από a/q, όπου a = a(k0 ) < 1. Συνεπώς από την (10.19)
έχουμε
Xq
|F (ζ)i − F (ξ)i | ≤ (a/q)
k0 k0
|ζj − ξj |, 1 ≤ i ≤ q.
j=1
X
q
X
q
|F (ζ)i − F (ξ)i | ≤ a
k0 k0
|ζj − ξj |,
i=1 j=1
η οποία δείχνει ότι η απεικόνιση F k0 είναι συστολή σ’ όλο το Rq . Έπεται ότι η απεικόνιση ζ 7→ F (ζ) έχει
μοναδικό σταθερό σημείο σ’ όλο το Rq , δηλαδή το σύστημα (10.7) έχει μοναδική λύση {y n,i }, 1 ≤ i ≤
q.
Το επόμενο αποτέλεσμα ερμηνεύεται ως ευστάθεια των μεθόδων Runge-Kutta. Είναι ένα από τα δύο απο-
τελέσματα που χρειαζόμαστε για την απόδειξη ενός θεωρήματος σύγκλισης για τις μεθόδους Runge-Kutta.
Το δεύτερο αποτέλεσμα αφορά την τάξη ακρίβειας των μεθόδων, δείτε την προηγούμενη παράγραφο.
Θεώρημα 10.2. Έστω ότι ισχύουν οι υποθέσεις του Θεωρήματος 10.1. Για δεδομένο y 0 ∈ R θεωρούμε τις
προσεγγίσεις {y n }, 0 ≤ n ≤ N , που παράγει η μέθοδος Runge–Kutta (10.7)–(10.8). Θεωρούμε επίσης τους
αριθμούς z n,i , 0 ≤ n ≤ N − 1, 1 ≤ i ≤ q, και z n , 0 ≤ n ≤ N , που ορίζουν οι εξισώσεις
X
q
z n,i
=z +h n
aij f (tn,j , z n,j ), 1 ≤ i ≤ q, (10.20)
j=1
X
q
n+1 n
z =z +h bj f (tn,j , z n,j ) + ρn , (10.21)
j=1
Θέτοντας Y n = (y n,1 , . . . , y n,q )T και Z n = (z n,1 , . . . , z n,q )T και χρησιμοποιώντας τον συμβολισμό του
Θεωρήματος 10.1 η παραπάνω σχέση γράφεται ως
[Y n − Z n ] ≤ |y n − z n |e + hL|A| [Y n − Z n ], (10.23)
όπου e = (1, . . . , 1)T ∈ Rq . Εφαρμόζοντας αυτήν τη σχέση κατ’ επανάληψη έχουμε
[U n − Z n ] ≤ |y n − z n | (Iq + hL|A| + · · · (hL|A|)k ) e
+ (hL|A|)k+1 [Y n − Z n ].
Χρησιμοποιώντας την υπόθεση h ≤ h0 και παίρνοντας το όριο καθώς k → ∞ έχουμε
[Y n − Z n ] ≤ |y n − z n | (Iq − h0 L|A|)−1 e,
από την οποία συμπεραίνουμε ότι υπάρχει σταθερά C ανεξάρτητη των h, n, τέτοια ώστε
|y n,i − z n,i | ≤ C |y n − z n |, 1 ≤ i ≤ q, 0 ≤ n ≤ N − 1. (10.24)
Αφαιρώντας, τώρα, τις (10.8), (10.21) κατά μέλη έχουμε για 0 ≤ n ≤ N − 1
X
q
|y n+1
−z n+1
| ≤ |y − z | + hL
n n
|bj | |y n,j − z n,j | + |ρn |. (10.25)
j=1
Θα πρέπει να διακρίνουμε και πάλι το σφάλμα μιας μεθόδου Runge-Kutta σε τοπικό σφάλμα διακριτοποίησης
και σε ολικό σφάλμα. Θα ορίσουμε το τοπικό σφάλμα διακριτοποίησης μιας μεθόδου Runge-Kutta με ανά-
λογο τρόπο όπως στις μονοβηματικές μεθόδους που είδαμε στο Κεφάλαιο 9, βλ. Ορισμό 9.5. Θεωρούμε τις
ποσότητες δ n ως εξής:
X
q
n,i n
ζ = y(t ) + h aij f (tn,j , ζ n,j ), i = 1, . . . , q, (10.26)
j=1
X
q
n n
δ[y](t , h) = (y(t ) + h bi f (tn,i , ζ n,i )) − y(tn+1 ), n = 0, . . . , N − 1. (10.27)
i=1
Ορισμός 10.2 (τοπικό σφάλμα διακριτοποίησης). Το τοπικό σφάλμα διακριτοποίησης της μεθόδου Runge-
Kutta (10.7)-(10.8) για την προσέγγιση της λύσης y(t) του προβλήματος αρχικών τιμών (9.30) ορίζεται
από τις σχέσεις (10.26)-(10.27). Λέμε ότι η τάξη ακρίβειας της μεθόδου Runge-Kutta (10.7)-(10.8) είναι
p, αν p είναι ο μεγαλύτερος ακέραιος για τον οποίο υπάρχει θετική σταθερά C ανεξάρτητη των h, N τέτοια
ώστε
max |δ[y](tn , h)| ≤ Chp+1 . (10.28)
0≤n≤N −1
Παρατήρηση 10.2. Δεδομένου του προηγούμενου θεωρήματος σύγκλισης για τις μεθόδους Runge-Kutta,
χρειάζεται να διερευνήσουμε την τάξη ακρίβειας μιας δεδομένης μεθόδου, δηλαδή να αποδείξουμε μια ανισό-
τητα της μορφής (10.28). Αν η μέθοδος είναι άμεση, τότε με απλή αντικατάσταση μπορούμε να απαλείψουμε
τους όρους ζ n,i από τις (10.37)–(10.38) και να εκφράσουμε το τοπικό σφάλμα διακριτοποίησης στη μορφή
όπου Φ είναι μια, πολύπλοκη γενικά, συνάρτηση (συγκρίνετε τη συνάρτηση Φ με τη συνάρτηση G του Ορι-
σμού 9.5). Αναπτύσσοντας κατά Taylor την y(tn+1 ) − y(tn ) γύρω από το σημείο tn παίρνουμε μια σειρά
δυνάμεων του h επί παραγώγους y (j) (tn ). Οι όροι αυτοί μέχρι τάξης hp θα πρέπει να απαλειφούν από ανάλο-
γους όρους του αναπτύγματος της συνάρτησης Φ γύρω από το σημείο (tn , y(tn )). Για τις έμμεσες μεθόδους
Runge-Kutta δεν είναι δυνατός ο προσδιορισμός της συνάρτησης Φ. Μπορούμε όμως να υπολογίσουμε με
διαδοχικές συνθέσεις δυναμοσειρών ενδιάμεσων ποσοτήτων, συνήθως των k n,i , δείτε την (10.10). Αυτήν
την τακτική ακολουθήσαμε στο Θεώρημα 9.3 για τον υπολογισμό του τοπικού σφάλματος διακριτοποίησης
της μεθόδου του μέσου. Η δυσκολία, φυσικά, αυξάνει εκθετικά με τον αριθμό των σταδίων.
Παράδειγμα 10.8. Για τον προσδιορισμό της τάξης ακρίβειας της βελτιωμένης μεθόδου του Euler η οποία
δίνεται από το ακόλουθο μητρώο
0 0 0
1/2 0 1/2
0 1
θα έχουμε ζ n,1 = y(tn ) και ζ n,2 = y(tn ) + (h/2)f (tn,1 , ζ n,1 ) = y(tn ) + (h/2)f (tn , y(tn )). Επομένως
δ[y](tn , h) = y(tn ) + hf (tn,2 , ζ n,2 ) − y(tn+1 ) = y(tn ) + hf (tn + h/2, ζ n,2 ) − y(tn+1 ).
Υποθέτουμε ότι η y είναι τρεις φορές συνεχώς παραγωγίσιμη και θα αναπτύξουμε το τοπικό σφάλμα δ n σε
σειρά δυνάμεων του h χρησιμοποιώντας το Θεωρήμα του Taylor με κέντρο το tn . Έχουμε
h2 ′′ n h3 h4
y(tn+1 ) = y(tn ) + hy ′ (tn ) + y (t ) + y ′′′ (tn ) + y ′′′ (ξ n ) (10.30)
2 6 24
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 155
με ξ n ∈ (tn , tn+1 ). Λόγω της διαφορικής εξίσωσης του προβλήματος αρχικών τιμών ισχύει ότι y ′ (t) =
f (t, y(t)), y ′′ (t) = ft (t, y(t)) + fy (t, y(t))y ′ (t) = ft (t, y(t)) + fy (t, y(t))f (t, y(t)) και
d
y ′′′ (t) = (ft (t, y(t)) + fy (t, y(t))f (t, y(t))) = ftt (t, y(t)) + fty (t, y(t))f (t, y(t))
dt
+ {fty (t, y(t)) + fyy (t, y(t))f (t, y(t))}f (t, y(t))
+ fy (t, y(t)){ft (t, y(t)) + fy (t, y(t))f (t, y(t))}.
Για ευκολία στον συμβολισμό θα θέσουμε f n = f (tn , y(tn ), ftn = ft (tn , y(tn ), fyn = fy (tn , y(tn ) και
παρόμοια για τις υπόλοιπες παραγώγους. Συνεπώς
h2 n
y(tn+1 ) = y(tn ) + hf n + (f + fyn f n )
2 t (10.31)
h3 n
+ ftt + ftyn f n + ftyn + fyy
n n
f f n + fyn ftn + fyn f n + O(h4 ).
6
Επίσης αναπτύσσοντας κατά Taylor ως προς την πρώτη μεταβλητή της f , έχουμε
h h h2 h3
f (tn + , ζ n,2 ) = f (tn , ζ n,2 ) + ft (tn , ζ n,2 ) + ftt (tn , ζ n,2 ) + ftt (ξ˜n , ζ n,2 ) (10.32)
2 2 8 48
Στη συνέχεια αναπτύσσοντας ως προς τη δεύτερη μεταβλητή της f παίρνουμε
h h 1 n
f (tn , ζ n,2 ) = f n + f n fyn + ( f n )2 fyy + O(h3 )
2 2 2
h n n (10.33)
ft (t , ζ ) = ft + f fty + O(h )
n n,2 n 2
2
ftt (tn , ζ n,2 ) = fttn + O(h).
Οπότε
h h h 1 n h h h2
f (tn + , ζ n,2 ) = f n + f n fyn + ( f n )2 fyy + (ftn + f n ftyn ) + fttn + O(h3 ).
2 2 2 2 2 2 8
(10.34)
Επομένως συνδυάζοντας τις παραπάνω σχέσεις παίρνουμε
h h 1 n h h h2
δ[y](tn , h) = y(tn ) + h{f n + f n fyn + ( f n )2 fyy + (ftn + f n ftyn ) + fttn }
2 2 2 2 2 8
2
h
− {y(tn ) + hf n + (ftn + fyn f n )
2
h3 n
+ ftt + ftyn f n + ftyn + fyy f f n + fyn ftn + fyn f n } + O(h4 )
n n
6 (10.35)
h3 n 2 n
= ((f ) fyy + 2f n ftyn + fttn )
8
h3
− {fttn + ftyn f n + ftyn + fyy f f n + fyn ftn + fyn f n } + O(h4 )
n n
6
= O(h3 ).
Συνεπώς η βελτιωμένη μέθοδος του Euler έχει τάξη δύο, γιατί αναγκαστικά παραμένουν όροι τάξεως h3 στο
ανάπτυγμα δ[y](tn , h).
Προφανώς μας ενδιαφέρει με όσο το δυνατό μικρότερο αριθμό σταδίων q να επιτύχουμε όσο το δυνατό
μεγαλύτερη τάξη ακρίβειας p. Θα δούμε αργότερα ότι υπάρχει περιορισμός: η τάξη ακρίβειας μιας μεθόδου
με q στάδια είναι το πολύ p = 2q.
156 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ. ΜΕΘΟΔΟΙ RUNGE-KUTTA
Παράδειγμα 10.9. Θεωρούμε το πρόβλημα αρχικών τιμών: Έστω y : [0, 10] → R τέτοια ώστε
Πίνακας 10.1: Σφάλματα μεθόδων Runge-Kutta, για N h = 10 και αντίστοιχες προσεγγίσεις της τάξης
ακρίβειας p.
Για την τάξη ακρίβειας των μεθόδων Runge-Kutta χρειαζόμαστε το τοπικό σφάλμα διακριτοποίησης. Από
τον Ορισμό 9.5 έχουμε
X
q
n
δ[y](t , h) = y(t n+1
) − y(t ) − h
n
bj f (tn,j , ζ n,j ), (10.37)
j=1
όπου
X
q
ζ n,i n
= y(t ) + h aij f (tn,j , ζ n,j ), 1 ≤ i ≤ q. (10.38)
j=1
Υποθέτουμε, βέβαια, ότι h ≤ h0 ≤ (Lρ(|A|))−1 έτσι ώστε το σύστημα (10.37)–(10.38) να έχει μονα-
δική λύση. Το επόμενο θεώρημα εκφράζει ποιοτικά τη γενική αρχή ότι ευστάθεια και συνέπεια συνεπάγονται
σύγκλιση.
Θεώρημα 10.3. Έστω ότι ισχύουν οι υποθέσεις του Θεωρήματος 10.1. Για y 0 ∈ R θεωρούμε τη μέθοδο (10.7)–
(10.8) για την οποία υποθέτουμε ότι ισχύει η (10.28). Τότε αν η λύση y(t) του (9.30) είναι αρκετά ομαλή, έχουμε
′
όπου C = D(eC (b−a) − 1)/C ′ με C ′ η σταθερά στο Θεώρημα 10.2.
Απόδειξη. Γράφουμε την εξίσωση (10.37) στη μορφή
X
q
n+1 n
y(t ) = y(t ) + h bj f (tn,j , ζ n,j ) + δ[y](tn , h), (10.40)
j=1
έτσι ώστε οι εξισώσεις (10.38) και (10.40) να είναι της μορφής (10.20)–(10.21). Συνεπώς η (10.22) και το
γεγονός ότι y 0 = y(t0 ) = z 0 δίνουν
Το πρόβλημα της κατασκευής όλων των μεθόδων Runge-Kutta με q στάδια και δεδομένη τάξη ακρίβειας
p γίνεται δύσκολο και πολύπλοκο όσο αυξάνει το q. Γενικά, για οποιοδήποτε q είναι πολύ δύσκολο να δια-
τυπωθούν εύκολα ελέγξιμες ικανές και αναγκαίες συνθήκες πάνω στους συντελεστές aij , bi , τi έτσι ώστε η
μέθοδος να έχει δεδομένη τάξη ακρίβειας p. Ένα θεώρημα το οποίο δίνει ικανές μόνο συνθήκες πάνω στους
συντελεστές της μεθόδου για δεδομένη τάξη ακρίβειας είναι το ακόλουθο, για την απόδειξη του οποίου πα-
ραπέμπουμε στο [12]:
Θεώρημα 10.4 (Butcher-Crouzeix). Υποθέτουμε ότι υπάρχουν ακέραιοι p, s, r ≥ 0 τέτοιοι ώστε
X
q
1
bi τiq = , 0 ≤ k ≤ p − 1,
i=1
k+1
X
q
τik+1
aij τjk = , 1 ≤ i ≤ q, 0 ≤ k ≤ s − 1,
j=1
k+1
X
q
bi (1 − τjk+1 )
bi τik aij = , 1 ≤ j ≤ q, 0 ≤ k ≤ r − 1,
i=1
k+1
p ≤ r + s + 1 και p ≤ 2s + 2.
Τότε η μέθοδος (10.7)-(10.8) έχει τάξη ακρίβειας p όταν εφαρμοσθεί στο πρόβλημα (9.30).
Παρατήρηση 10.3. Οι δύο πρώτες συνθήκες του Θεωρήματος 10.4 εκφράζουν, αντίστοιχα ότι οι κανόνες
ολοκλήρωσης (10.3) και (10.5) είναι ακριβείς για πολυώνυμα βαθμού το πολύ p − 1 και s − 1, αντίστοιχα.
Το θεώρημα του ακολουθεί διατυπώνει ικανές συνθήκες για να έχει η μέθοδος (10.7)–(10.8) τάξη ακρίβειας
p μόνο μέσω αυτών των κανόνων ολοκλήρωσης.
Θεώρημα 10.5. (α). Αν ο κανόνας ολοκλήρωσης (10.3) είναι τάξης p−1 και όλοι οι κανόνες ολοκλήρωσης (10.5)
είναι τάξης p − 2, τότε η μέθοδος (10.7)–(10.8) έχει τάξη p. (β) Έστω q ′ ο αριθμός των {τj }, 1 ≤ j ≤ q, που
είναι διαφορετικά μεταξύ τους. Αν όλοι οι κανόνες (10.5) είναι τάξης q ′ −1 και ο κανόνας (10.3) είναι τάξης p−1,
τότε η μέθοδος (10.7)–(10.8) έχει τάξη p. (γ) Υπάρχει μια μόνο μέθοδος Runge–Kutta με q στάδια που έχει τάξη
2q. Είναι η μέθοδος για την οποία τα τi και bi είναι, αντίστοιχα, οι κόμβοι και τα βάρη του κανόνα ολοκλήρωσης
Gauss-Legendre με συνάρτηση βάρους w(x) = 1 στο διάστημα [0, 1] (Τα aij κατασκευάζονται έτσι ώστε οι
κανόνες ολοκλήρωσης (10.5) να είναι ακριβείς για πολυώνυμα βαθμού το πολύ q − 1).
Tο αντικείμενο αυτού του κεφαλαίου υπάρχει πιο αναλυτικά σε βιβλία με αντικείμενο την αριθμητική λύση
συνήθων διαφορικών εξισώσεων. Παραθέτουμε κάποιες αναφορές τις οποίες ο αναγνώστης μπορεί να συμ-
βουλευτεί: [1], [2], [6], [5], [4], [7], [10], [11].
10.4 Ασκήσεις
0 0 0
1 0 1
1/2 1/2
είναι συνεπής.
0 0 0
a 0 τ
b1 b2
10.4.6 Προσδιορίστε ποιες σχέσεις πρέπει να ικανοποιούν οι σταθερές a21 , a31 , a32 , τ2 , τ3 , b1 , b2 , b3 , τέτοιες
ώστε η μεθόδος Runge-Kutta
0 0 0 0
a21 0 0 τ2
a31 a32 0 τ3
b1 b2 b3
να έχει τάξη ακρίβειας p = 3.
10.4.7 Δείξτε ότι αν y ′ (t) = y(t), t ∈ [0, T ], με y(0) = 1, τότε η μεθόδος Runge-Kutta με μητρώο
10.4.9 Δείξτε ότι αν y ′ (t) = y(t), t ∈ [0, T ], με y(0) = 1, τότε η μεθόδος Runge-Kutta
0 0 0 0 0
1/2 0 0 0 1/2
0 1/2 0 0 1/2
0 0 1 0 1
1/6 1/3 1/3 1/6
10.4.10 Δείξτε ότι αν y ′ (t) = y(t), t ∈ [0, T ], με y(0) = 1, τότε η μεθόδος Runge-Kutta
µ 0 µ
1 − 2µ µ 1 − µ
1/2 1/2
√
1 3
έχει τάξη ακρίβειας τουλάχιστον p = 3 αν και μόνο αν µ = ± .
2 6
10.4.11 Δείξτε ότι η μεθόδος Runge-Kutta
µ 0 µ
1 − 2µ µ 1 − µ
1/2 1/2
√
1 3
έχει τάξη ακρίβειας τουλάχιστον p = 3 αν και μόνο αν µ = ± .
2 6
10.4.12 Δείξτε ότι αν y ′ (t) = y(t) + t, t ∈ [0, T ], με y(0) = 2 τότε η μεθόδος Runge-Kutta
0 0 0 0
1/2 0 0 1/2
0 3/4 0 3/4
2/9 1/3 4/9
έχει τάξη ακρίβειας τουλάχιστον p = 3.
Βιβλιογραφία
[1] K. E. Atkinson, W. Han και D. E. Stewart. Numerical Solution of Ordinary Differential Equations.
English. Hoboken, NJ: John Wiley & Sons, 2009, σσ. xii + 252. isbn: 978-0-470-04294-6.
[2] J.C. Butcher. The Numerical Analysis of Ordinary Differential Equations. Hoboken, New Jersey: John
Wiley & Sons, 1987.
[3] P. J. Davis και P. Rabinowitz. Methods of Numerical Integration. English. 2nd. Orlando: Academic
Press, Inc., 1984.
[4] D. F. Griffiths και D. J. Higham. Numerical Methods for Ordinary Differential Equations. Initial Value
Problems. English. London: Springer, 2010, σσ. xiv + 271. isbn: 978-0-85729-147-9. doi: 10 .
1007/978‐0‐85729‐148‐6.
[5] E. Hairer, S. P. Nørsett και G. Wanner. Solving Ordinary Differential Equations. I: Nonstiff Problems.
English. Τόμ. 8. Berlin: Springer, 2010, σσ. xv + 528. isbn: 978-3-642-05163-0.
[6] A. Iserles. A First Course in the Numerical Analysis of Differential Equations. English. 2nd ed. Camb.
Texts Appl. Math. Cambridge: Cambridge University Press, 2009. isbn: 978-0-521-73490-5. doi:
10.1017/CBO9780511995569.
[7] J. D. Lambert. Numerical Methods for Ordinary Differential Dystems: The Initial Value Problem. En-
glish. Chichester etc.: John Wiley &| Sons, 1991, σσ. x + 293. isbn: 0-471-92990-5.
[8] E. Süli και D. F. Mayers. An Introduction to Numerical Analysis. Cambridge University Press, 2003.
isbn: 0-521-00794-1.
[9] Γ. Δ. Ακρίβης και B. A. Δουγαλής. Εισαγωγή στην Αριθμητική Ανάλυση. Πανεπιστημιακές Εκδόσεις
Κρήτης, 2017.
160 ΜΟΝΟΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ. ΜΕΘΟΔΟΙ RUNGE-KUTTA
[10] Γ. Δ. Ακρίβης και Β.Α. Δουγαλής. Αριθμητικές Μέθοδοι για Συνήθεις Διαφορικές Εξισώσεις. Πανεπι-
στημιακές Εκδόσεις Κρήτης, 2015.
[11] Μ. Ν. Βραχάτης. Αριθμητική Ανάλυση: Συνήθεις Διαφορικές Εξισώσεις. Εκδόσεις Κλειδάριθμος, 2012.
[12] Β. Α. Δουγαλής. Διδακτικές σημειώσεις για το μεταπτυχιακό μάθημα 350 Αριθμητική Ανάλυση. Ηρά-
κλειο Κρήτης: Ινστιτούτο Υπολογιστικών Μαθηματικών, Ερευνητικό Κέντρο Κρήτης, 1987.
ΚΕΦΑΛΑΙΟ 11
ΠΟΛΥΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ
Περίληψη
Οι πολυβηματικές μέθοδοι είναι μια σημαντική κατηγορία αριθμητικών μεθόδων για την προσέγγιση της
λύσης προβλημάτων αρχικών τιμών
Η υλοποίησή τους είναι οικονομική και για αυτόν το λόγο εμφανίστηκαν και εφαρμόστηκαν πριν την εμφά-
νιση των υπολογιστών. Δείχνουμε τρόπους κατασκευή τους και ορίζουμε την ευστάθειά τους. Η ευστάθεια
των μεθόδων είναι ισοδύναμη με μια ιδιότητα ενός χαρακτηριστικού πολυωνύμου της μεθόδου που καλείται
συνθήκη των ριζών. Ορίζουμε τη συνέπεια και την τάξη ακρίβειας αυτών των μεθόδων. Θα δείξουμε ότι η συ-
νέπεια και η ευστάθεια μιας πολυβηματικής μεθόδου είναι ισοδύναμη με τη σύγκλιση της μεθόδου. Επίσης θα
αναφερθούμε σε ζητήματα πρακτικής εφαρμογής των πολυβηματικών μεθόδων.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Συνήθων Διαφορικών Εξισώσεων και Απειροστικού Λογισμού
σε πολλές διαστάσεις. Διανυσματικοί χώροι με νόρμα. Αριθμητική επίλυση μη γραμμικών συστημάτων.
Σε αυτό το κεφάλαιο θα θεωρήσουμε μια κατηγορία μεθόδων για την αριθμητική προσέγγιση της λύσης του
προβλήματος αρχικών τιμών (9.1),
(
y ′ (t) = f (t, y(t)), t ∈ [a, b],
(11.1)
y(a) = y0 ,
Η παραπάνω μέθοδος, επειδή βασίζεται στις δύο προηγούμενες προσεγγίσεις y n−1 , y n , για την κατασκευή
της y n+1 είναι μια 2-βηματική μέθοδος η οποία καλείται και (άμεση) μέθοδος του μέσου .
Μια πολυβηματική μέθοδος απαιτεί γνώση των τιμών y n , y n−1 , . . . , για τον προσδιορισμό της προσέγγι-
σης y n+1 . Για παράδειγμα, από το θεώρημα του Taylor και κάνοντας χρήση της διαφορικής εξίσωσης (11.1)
έχουμε
y(t + h) − y(t − h) = 2hy ′ (t) + O(h3 ) = 2hf (t, y(t)) + O(h3 ),
σχέση που δικαιολογεί τη μέθοδο
Αλλάζοντας τους δείκτες στην (11.3) θα γράφουμε τη μέθοδο στη μορφή (11.2). Χρησιμοποιώντας ανα-
πτύγματα Taylor των τιμών y(t + kh) για k = 1, 2, . . ., γύρω από το t είναι δυνατό να ορίσουμε και άλλες
πολυβηματικές μεθόδους. Μπορούμε όμως να χρησιμοποιήσουμε και αριθμητική ολοκλήρωση. Με την αριθ-
μητική ολοκληρώση προσεγγίζουμε το άγνωστο ολοκλήρωμα μιας συνάρτησης με ένα κατάλληλο άθροισμα.
Για μια πιο αναλυτική παρουσίαση κανόνων αριθμητικής ολοκλήρωσης παραπέμπουμε στα [11], [10], [3].
Για παράδειγμα, από τη σχέση
Z tn+2
y(t n+2
) − y(t ) =
n
f (s, y(s)) ds,
tn
και προσεγγίζοντας το ολοκλήρωμα στο δεξί μέλος με τον κανόνα του Simpson
Z tn+2
2h n+2
g(s) ds ≈ g(t ) + 4g(tn+1 ) + g(tn ) ,
tn 6
παίρνουμε τη διβηματική μέθοδο του Simpson
h n+2
y n+2 − y n = f + 4f n+1 + f n , n = 0, . . . , N − 2. (11.4)
3
Η μέθοδος αυτή είναι πεπλεγμένη, διότι απαιτεί τη λύση ενός μη γραμμικού συστήματος σε κάθε βήμα.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 163
όπου α0 , . . . , αk , β0 , . . . , βk είναι δοσμένες πραγματικές σταθερές, ανεξάρτητες του h και του n. Θα υπο-
θέτουμε αk 6= 0, (συνήθως αk = 1) και ότι |α0 | + |β0 | > 0 ώστε να έχουμε πράγματι μια k-βηματική
μέθοδο.
Αν βk = 0 η k-βηματική μέθοδος (11.5) θα λέγεται άμεση, γιατί ο υπολογισμός του y n+k γίνεται με απλή
αντικατάσταση των γνωστών τιμών y n+j , 0 ≤ j ≤ k − 1. Αν βk 6= 0 ο προσδιορισμός του y n+k απαιτεί
τη λύση ενός μη γραμμικού συστήματος της μορφής
y n+k = hβk f (tn+k , y n+k ) + g n , (11.6)
όπου g n γνωστό διάνυσμα και θα καλείται πεπλεγμένη. Το σύστημα (11.6) έχει μοναδική λύση αν h|βk |L <
1, όπου L είναι η σταθερά Lipschitz της f ως προς y. Η απόδειξη γίνεται με ανάλογο τρόπο όπως παραδείγ-
ματος χάριν για την πεπλεγμένη μέθοδο του Euler στο Κεφάλαιο 9. Επομένως οι πεπλεγμένες πολυβηματικές
μέθοδοι έχουν πολύ μικρότερο κόστος ανά βήμα απ’ ότι οι πεπλεγμένες μέθοδοι Runge–Kutta. Οι μονοβη-
ματικές μέθοδοι
α1 y n+1 + α0 y n = h(β1 f n+1 + β0 f n ), n = 0, . . . , N − 1, (11.7)
με α1 = 1 και |α0 | + |β0 | > 0 αποτελούν την τομή των πολυβηματικών μεθόδων με τις μεθόδους Runge–
Kutta.
Υπάρχουν διάφοροι τρόποι για να κατασκευάσουμε μια πολυβηματική μέθοδο. Πολύ γνωστές είναι οι οικογέ-
νειες των μεθόδων Adams-Bashforth και Adams-Moulton. Η κατασκευή τους βασίζεται στη χρήση κατάλλη-
λων πολυωνύμων παρεμβολής. Για μια αναλυτική παρουσιάση της πολυωνυμικής παρεμβολής συναρτήσεων
παρεπέμπουμε στα [11], [10], [9].
Ολοκληρώνοντας το πρόβλημα αρχικών τιμών (11.1) στο διάστημα [tn+k , tn+k−1 ] έχουμε
Z tn+k
y(t ) − y(t
n+k n+k−1
)= f (t, y(t)) dt. (11.8)
tn+k−1
Μια k-βηματική μέθοδος που ανήκει στην οικογένεια Adams-Bashforth προκύπτει αν προσεγγίσουμε το
ολοκλήρωμα της f στο [tn+k , tn+k−1 ] χρησιμοποιώντας το ολοκλήρωμα ενός κατάλληλου πολυωνύμου. Θε-
ωρούμε λοιπόν το πολυώνυμο P , βαθμού k − 1 το οποίο παρεμβάλλει την f (·, y(·)) στα k σημεία tn , . . . ,
tn+k−1 . Οπότε Z n+k Z n+k
t t
f (t, y(t)) dt ≈ P (t) dt. (11.9)
tn+k−1 tn+k−1
Για παράδειγμα για την κατασκευή μιας διβηματικής μεθόδου Adams-Bashforth, θεωρούμε το γραμμικό
πολυώνυμο παρεμβολής της f (·, y(·)), στα σημεία tn , tn+1 , το οποίο είναι το
s − tn tn+1 − s
P (s) = f (tn+1 , y(tn+1 )) + f (tn , y(tn )) , (11.10)
h h
164 ΠΟΛΥΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ
Μια άλλη γνωστή κατηγορία πολυβηματικών μεθόδων είναι οι μέθοδοι ανάδρομων διαφορών (Backward Dif-
ference Formula ή BDF), οι οποίες προκύπτουν με τον ακόλουθο τρόπο. Θεωρούμε το πολυώνυμο παρεμβολής
P , βαθμού το πολύ k, της y στα k + 1 σημεία tn , . . . , tn+k , δηλαδή
Οπότε
P ′ (tn+k ) ≈ y ′ (tn+k ) = f (tn+k , y(tn+k )). (11.16)
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 165
1 X 1 j n+k
k
′
P (t n+k
)= ∇ y(t ). (11.17)
h j=1 j
Θεωρούμε μια ακολουθία αριθμών y n , n ≥ 0, η οποία ικανοποιεί την ακόλουθη εξίσωση διαφορών k + 1
όρων, k ≥ 1,
αk y n+k + αk−1 yy+k−1 + · · · + α1 y n+1 + α0 y n = 0, n ≥ 0, (11.21)
όπου α0 , . . . , αk ∈ R, δοσμένοι αριθμοί και υποθέτουμε ότι α0 και αk είναι διαφορετικοί του 0. Κάθε ακο-
λουθία (y n )n∈N0 ⊂ C η οποία πληροί την (11.21) είναι λύση της γραμμικής εξίσωσης.
Εύκολα μπορούμε να δούμε ότι ο χώρος των λύσεων της (11.21) είναι γραμμικός χώρος. Πράγματι, αν
θεωρήσουμε (y n )n∈N0 , (wn )n∈N0 ⊂ C δύο λύσεις της (11.21) και c1 , c2 ∈ C, τότε (c1 y n + c2 wn )n∈N0
είναι λύση της. Επίσης μπορούμε να προσδιορίσουμε τη διάσταση του χώρου των λύσεων της (11.21). Για
οποιαδήποτε αρχικά δεδομένα y 0 , . . . , y k−1 , υπάρχει μοναδική ακολουθία (y n )n∈N0 ⊂ C η είναι λύση της
(11.21).
Έστω (yjn )n∈N0 ⊂ C, j = 1, . . . , m, λύσεις της (11.21). Θα λέμε ότι οι (yjn )n∈N0 ⊂ C είναι γραμμικώς
εξαρτημένες αν υπάρχουν σταθερές c1 , . . . cm , όχι όλες μηδέν, τέτοιες ώστε
c1 y1n + c2 y2n + · · · + cm ym
n
= 0, n ∈ N0 .
Αν οι (yjn )n∈N0 ⊂ C, j = 1, . . . , m, δεν είναι γραμμικά εξαρτημένες, τις καλούμε γραμμικά ανεξάρτητες.
Λήμμα 11.1. Η διάσταση του χώρου των λύσεων της εξίσωσης διαφορών k + 1 όρων (11.21) είναι k.
Απόδειξη. Ας θεωρήσουμε τις k ακολουθίες (wjn )n∈N0 ⊂ R, j = 0, . . . , k − 1, οι οποίες είναι λύσεις της
(11.21) και οι πρώτοι k όροι κάθε μίας δίνονται ως εξής:
(
1, j = m,
wjm = j, m = 0, . . . , k − 1. (11.22)
0, διαφορετικά,
166 ΠΟΛΥΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ
Είναι εύκολο να δούμε ότι αυτές οι k ακολουθίες (wjn )n∈N0 είναι γραμμικά ανεξάρτητες.
Ας θεωρήσουμε τώρα μια λύση (y n )n∈N0 της (11.21). Μπορούμε να δούμε τότε ότι γράφεται ως γραμμικός
συνδυασμός των (wjn )n∈N0 με συντελεστές τις k αρχικές τιμές y 0 , . . . , y k−1 ,
y n = y 0 w0n + · · · + y k−1 wk−1
n
. (11.23)
Επομένως καταλήγουμε στο γεγονός ότι η διάσταση του χώρου των λύσεων είναι k.
Κάθε βάση του χώρου των λύσεων λέγεται θεμελιώδες σύστημα της (11.21). Υπάρχουν διάφοροι τρόποι
για να προσδιορίσουμε μια βάση του χώρου των λύσεων της (11.21). Ένας τρόπος, ο οποίος θα δειχθεί στη
συνέχεια ότι είναι αρκετά χρήσιμος είναι ο ακόλουθος.
Χρησιμοποιούμε τους συντελεστές α0 , . . . , αk της (11.21) για να ορίσουμε το πολυώνυμο
ϱ(z) = αk z k + · · · + α1 z + α0 . (11.24)
Είναι προφανές ότι το ϱ δεν έχει ρίζα το 0, γιατί ο σταθερός όρος α0 6= 0. Έστω z ∈ C και ορίζουμε την
ακολουθία (y n )n∈N0 τέτοια ώστε y n = z n . Είναι προφανές ότι z = 0, η (y n )n∈N0 είναι λύση της (11.21).
Θέλουμε να βρούμε z 6= 0, τέτοιο ώστε η ακολουθία (z n )n∈N0 να είναι μια μη τετριμμένη (διαφορετική από
τη μηδενική) λύση της (11.21). Τότε όμως επειδή
αk z n+k + · · · + α1 z 1+k + α0 z n = z n ϱ(z) = 0,
και z n 6= 0 θα έχουμε ϱ(z) = 0. Συνεπώς, αναζητούμε ρίζες του πολυωνύμου ϱ. Αν όλες οι ρίζες του ϱ
είναι απλές, zj ∈ C, j = 1, . . . , k, ϱ(zj ) = 0, τότε ορίζουμε τις ακολουθίες (yjn )n∈N0 , με yjn = zjn ,
j = 1, . . . , k. Αυτές θα αποτελούν ένα θεμελιώδες σύστημα της (11.21).
Έστω τώρα ότι η z είναι ρίζα της ϱ, πολλαπλότητας μεγαλύτερης του 1. Για ευκολία ας υποθέσουμε ότι
η z είναι ρίζα της ϱ, πολλαπλότητας 2. Τότε μπορούμε να ορίσουμε, όπως προηγουμένως, την ακολουθία
(y1n )n∈N0 με y1n = z n η οποία είναι προφανώς λύση της (11.21) και την ακολουθία (y2n )n∈N0 με y2n = nz n
η οποία εύκολα βλέπουμε ότι ειναι γραμμικώς ανέξαρτητη της y1n . Μπορούμε να δούμε ότι και y2n είναι λύση
της (11.21). Το z εκτός του ϱ είναι και ρίζα του πολυωνύμου r(x) = xϱ(x), πολλαπλότητας 2. Πράγματι,
r(z) = r′ (z) = zϱ′ (z) + ϱ(z) = 0. Επομένως
zϱ′ (z) + ϱ(z) = z(αk kz k−1 + · · · + α2 z + α1 ) + αk z k + · · · + α0
(11.25)
= αk kz k + · · · + α2 2z 2 + α1 z + α0 = 0.
Οπότε προκύπτει ότι η y2n είναι λύση της (11.21). Με ανάλογο τρόπο, αν η z είναι ρίζα πολλαπλότητας m ≥
3, του ϱ, μπορούμε να ορίσουμε m γραμμικώς ανεξάρτητες λύσεις της (11.21), (yjn )n∈N0 ως εξής: y1n = z n ,
y2n = nz n , yjn = n(n − 1) . . . (n − j + 2)z n , j = 3, . . . , m.
Ορισμός 11.2 (Ευστάθεια πολυβηματικών μεθόδων). Μια k−βηματική μέθοδος η οποία περιγράφεται από
τις σταθερές α0 , . . . , αk , β0 , . . . , βk , λέγεται ευσταθής αν υπάρχει μια σταθερά C που εξαρτάται από την f
αλλά είναι ανεξάρτητη του N τέτοια ώστε για τις ακολουθίες (y n ), (z n ), τέτοιες ώστε να ισχύει
0 k−1
y , . . . , y , δεδομένα,
αk y n+k + · · · + α0 y n = (11.26)
h[βk f (t , y ) + · · · + β0 f (t , y )], n = 0, . . . , N − k,
n+k n+k n n
και 0 k−1
z , . . . , z , δεδομένα,
αk z n+k + · · · + α0 z n = (11.27)
h[βk f (t , z ) + · · · + β0 f (t , z )], n = 0, . . . , N − k,
n+k n+k n n
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 167
να ισχύει
max |y n − z n | ≤ C max |y j − z j |. (11.28)
0≤n≤N 0≤j≤k−1
ϱ(z) = αk z k + · · · + α0 , (11.29)
ισχύει ότι (
|z| ≤ 1, αν z απλή ρίζα,
αν z ρίζα του ϱ τοτε (11.30)
|z| < 1, αν ϱ(z) = ϱ′ (z) = 0,
δηλαδή όλες οι ρίζες του ϱ δεν έχουν απόλυτη τιμή μεγαλύτερη του ένα και όσες έχουν απόλυτη τιμή ίση με
ένα είναι απλές ρίζες.
Θα δείξουμε ότι αν μια πολυβηματική μέθοδος ικανοποιεί τη συνθήκη των ριζών αν και μόνο αν είναι ευ-
σταθής. Πρώτα δείχνουμε ότι αν μια πολυβηματική μέθοδος είναι ευσταθής, τότε αυτή ικανοποιεί τη συνθήκη
των ριζών.
Θεώρημα 11.1. Αν η k−βηματική μέθοδος (11.5) είναι ευσταθής, τότε αυτή ικανοποιεί τη συνθήκη των ριζών
(βλ. Ορισμό 11.3).
Απόδειξη. Εφόσον η k−βηματική μέθοδος είναι ευσταθής, θα ικανοποιείται η (11.28) και για το πρόβλημα
αρχικών τιμών με f = 0 οι (11.26) και (11.27) . Επίσης μπορούμε να επιλέξουμε z j = 0, j = 0, . . . , k −1,
οπότε θα έχουμε z n = 0, n = 0, . . . , N . Επομένως σύμφωνα με την (11.28) έχουμε
αk y n+k + · · · + α0 y n = 0. (11.32)
Θεωρούμε τώρα μια ρίζα του χαρακτηριστικού πολυωνύμου ϱ της πολυβηματικής μεθόδου (11.5). Αν θε-
ωρήσουμε τώρα την ακολουθία z n , n ∈ N0 , αυτή θα είναι λύση της εξίσωσης διαφορών (11.32) και άρα, θα
έχουμε
max |z n | ≤ C max |z j |. (11.33)
0≤n≤N 0≤j≤k−1
Αυτή η σχέση όμως δεν μπορεί να ισχύει αν |z| > 1, γιατί τότε |z|N → ∞, N → ∞. Συνεπώς αν η μέθοδος
είναι ευσταθής, θα πρέπει |z| ≤ 1.
Στη συνέχεια θα εξετάσουμε την περίπτωση η ρίζα z να είναι πολλαπλή, δηλαδή ϱ(z) = ϱ′ (z) = 0. Σε
αυτή τη περίπτωση έχουμε δεί ότι η ακολουθία nz n , n ∈ N0 είναι λύση της εξίσωσης διαφορών (11.32) και
επομένως λόγω ευστάθειας της k-βηματικής μεθόδου
Αν υποθέσουμε ότι |z| = 1, τότε αυτή η σχέση δεν μπορεί να ισχύει για καμιά σταθερά C και άρα θα πρέπει
να ισχύει |z| < 1. Συνεπώς έχουμε δείξει ότι αν μια k-βηματική μέθοδος είναι ευσταθής, τότε αυτή θα πρέπει
να ικανοποιεί τη συνθήκη των ριζών.
168 ΠΟΛΥΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ
Στη συνέχεια θέλουμε να δείξουμε το αντίστροφο του Θεωρήματος 11.28, δηλαδή ότι αν μια k−βηματική
μέθοδος (11.5) ικανοποιεί τη συνθήκη των ριζών, τότε αυτή είναι ευσταθής. Για να το δείξουμε θα χρεια-
στούμε 2 βοηθητικά λήμματα (τα οποία οφείλονται στον Butcher).
Τότε υπάρχει νόρμα k · k στον Ck τέτοια ώστε για την επαγόμενη φυσική νόρμα πινάκων να ισχύει
kAk ≤ 1. (11.36)
Απόδειξη. Γνωρίζουμε ότι αν ϱ πολυώνυμο βαθμού k με πραγματικούς συντελεστές, τότε αυτό έχει k ρίζες
όχι απαραίτητα διαφορετικές μεταξύ τους. Έστω λ1 , . . . , λm , m ≥ 1, οι απλές ρίζες του πολυωνύμου και
λm+1 , . . . , λk , οι ρίζες που δεν είναι απλές. Σύμφωνα με τη συνθήκη των ριζών θα έχουμε ότι
Μπορούμε να δούμε ότι αναπτύσσοντας την ορίζουσα det(A − λI) ως προς την τελευταία της στήλη
−αk−1 − λ −αk−2 . . . −α1
1 −λ 0
det(A − λI) = (−1)k α0 − λ det . .
. . . .
0 1 −λ
−αk−1 − λ −αk−2 . . . −α2
1 −λ 0
= (−1)k α0 − λ(−1)k−1 α1 − λ det .. ..
. .
0 1 −λ
= · · · = (−1)k ϱ(λ).
Επομένως κάθε ρίζα του ϱ είναι ιδιοτιμή του A και αντιστρόφως. Συνεπώς υπάρχει αντιστρέψιμος πίνακας
T ∈ Ck×k τέτοιος ώστε T −1 AT = J, όπου J είναι η κανονική μορφή Jordan του A
λ1 0 ... 0
..
.
..
0 λm .
J =
λm+1 σm+1
.. .. ..
. . . 0
σk−1
0 0 λk
και όπου οι αριθμοί σi , i = m + 1, . . . , k − 1, είναι ίσοι με μηδέν ή ένα. Θεωρούμε τώρα τον πίνακα
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 169
D = diag(1, ε, ε2 , . . . , εk−1 ), όπου ε ένας θετικός αριθμός. Τότε ο πίνακας Je = D−1 JD είναι της μορφής
λ1 0 ... 0
..
.
..
0 λm .
Je =
em+1
λm+1 σ
.. ... ...
. 0
ek−1
σ
0 0 λk
Συνεπώς, επειδή ικανοποιείται η συνθήκη των ριζών, αν επιλέξουμε ε > 0 τέτοιο ώστε maxm+1≤i≤k {|λi | +
ε} ≤ 1 θα έχουμε
e ∞ ≤ 1.
kJk (11.37)
Αν τώρα ορίσουμε Q = T D θα έχουμε Je = Q−1 AQ. Επίσης, θεωρούμε την ακόλουθη νόρμα στον Ck ,
Θεώρημα 11.2. Έστω ότι η k-βηματική μέθοδος (11.5) ικανοποιεί τη συνθήκη των ριζών. Έστω λn , n =
0, . . . , N − k, δεδομένες σταθερές και έστω βin , i = 0, . . . , k, n = 0, . . . , N − k, δεδομένοι αριθμοί με
|βin | ≤ B < ∞. Για h = b−a N
θεωρούμε την εξίσωση διαφορών
όπου η σταθερά C εξαρτάται από τα b − a, h0 , B, αλλά είναι ανεξάρτητη των h, λn , ψ n , N και βin .
Απόδειξη. Μπορούμε να υποθέσουμε χωρίς περιορισμό της γενικότητας ότι αk = 1, οπότε η (11.39) παίρνει
τη μορφή
και τον πίνακα A του λήμματος 11.2. Τότε η (11.41) μπορεί να γραφεί ισοδύναμα ως
Y n+1 = AY n + Gn , 0 ≤ n ≤ N − k. (11.43)
Λόγω της ισοδυναμίας των νορμών στον Ck υπάρχουν θετικές σταθερές C1 και C2 τέτοιες ώστε
1 + C2 h n C1
kY n+1 k ≤ kY k + |λn |, 0 ≤ n ≤ N − k. (11.45)
1 − C2 h 1 − C2 h
Μπορούμε τώρα να παρατηρήσουμε ότι
1 + C2 h 2C2 h 2C2
≤1+ ≤1+ h,
1 − C2 h 1 − C2 h 1 − C2 h0
καθώς και ότι
C1 C1
≤ .
1 − C2 h 1 − C2 h0
2C2 C1
Συνεπώς αν θέσουμε C3 = max{ , } από την (11.45) προκύπτει
1 − C2 h0 1 − C2 h0
Χρησιμοποιώντας τώρα το Λήμμα 9.1 έχουμε ότι υπάρχει σταθερά C4 τέτοια ώστε
Στη συνέχεια, λόγω και πάλι της ισοδυναμίας των νορμών στο Ck υπάρχουν σταθερές C5 , C6 τέτοιες ώστε
Θεώρημα 11.3. Αν η k−βηματική μέθοδος (11.5) ικανοποιεί τη συνθήκη των ριζών, τότε η k-βηματική μέθοδος
είναι ευσταθής.
Απόδειξη. Σύμφωνα με τον ορισμό της ευστάθειας πολυβηματικών μεθόδων, αν έχουμε δύο ακολουθίες (y n ),
(z n ), τέτοιες ώστε να ικανοποιούν τις (11.26), (11.27), τότε θέλουμε να δείξουμε ότι θα ισχύει η (11.28).
Θέτοντας ψ j = y j − z j , j = 0, . . . , N με y j , z j και αφαιρώντας κατά μέλη τις (11.26), (11.27) λαμβά-
νουμε
αk ψ n+k + · · · + α0 ψ n = h[βk [f (tn+k , y n+k ) − f (tn+k , z n+k )] + . . .
(11.48)
+ β0 [f (tn , y n ) − f (tn , z n )]], n = 0, . . . , N − k.
Θέτοντας τώρα για m = 0, . . . , N ,
m m
f (t , y ) − f (t , z ) ,
m m
αν y m 6= z m ,
gm = ym − zm (11.49)
m m
0, αν y = z ,
έχουμε προφανώς |g m | ≤ L, όπου L η σταθερά Lipschitz της f ως προς τη δεύτερη μεταβλητή. Με βin =
βi g n+i , i = 0, . . . , k, n = 0, . . . , N − k η (11.48) γράφεται ως
αk ψ n+k + · · · + α0 ψ n = h(βkn ψ n+k + · · · + β0n ψ n ), n = 0, . . . , N − k. (11.50)
Παρατηρούμε λοιπόν ότι η (11.50) ικανοποιεί την (11.39) με λn = 0 και, επειδή η k−βηματική μέθοδος
(11.5) ικανοποιεί τη συνθήκη των ριζών, μπορούμε να χρησιμοποιήσουμε το Θεώρημα 11.2. Συνεπώς
max |ψ n | ≤ C max |ψ j |,
0≤n≤N 0≤j≤k−1
Παρατήρηση 11.1. Αν το χαρακτηριστικό πολυώνυμο ϱ(z) είναι δευτέρου βαθμού, μπορούμε εύκολα να
προσδιορίσουμε τις ρίζες του και να ελέγξουμε αν ικανοποιείται η συνθήκη των ριζών. Αν το ϱ είναι πολυώ-
νυμο βαθμού k > 2, τότε δεν είναι εύκολο να προσδιορίσουμε ακριβώς τις ρίζες του. Αλλά για να ελέγξουμε
αν ικανοποιείται η συνθήκη των ριζών δεν χρειάζεται να τις προσδιορίσουμε ακριβώς. Υπάρχουν αναλυτικές
συνθήκες που αν ικανοποιούν οι συντελεστές του πολυωνύμου ϱ, τότε αυτό πληροί τη συνθήκη των ριζών,
όπως π.χ. αυτές που ορίζονται από τη λεγόμενη θεωρία του Schur, βλ. π.χ. [12].
Λέμε ότι ένα πολυώνυμο π, βαθμού το πολύ k με συντελεστές αj ∈ C, j = 0, . . . , k, π(z) = αk z k · · ·+
α1 z + α0 με α0 αk 6= 0 είναι πολυώνυμο Schur αν όλες οι ρίζες του είναι στον D = {z ∈ C : |z| < 1}. Ένα
πολυώνυμο π που πληροί τη συνθήκη των ριζών λέγεται απλό πολυώνυμο von Neumann . Για ένα πολυώνυμο
π θεωρούμε το πολυώνυμο π ⋆ ,
Xk
⋆
π (z) = ᾱk−j z j ,
j=0
όπου ᾱj είναι ο συζυγής του αj , j = 0, . . . , k. Είναι απλό να δούμε ότι π ⋆ (z) = z k π̄( z1 ). Ακόμα θεωρούμε
το πολυώνυμο π1 ,
1
π1 (z) = [π ⋆ (0)π(z) − π(0)π ⋆ (z)],
z
το οποίο έχει βαθμό το πολύ k − 1. Τότε ισχύει ότι,
i) Το π είναι πολυώνυμο Schur αν και μόνο αν |π ⋆ (0)| > |π(0)| και το π1 είναι πολυώνυμο Schur
a.) είτε |π ⋆ (0)| > |π(0)| και το π1 είναι απλό πολυώνυμο von Neumann,
b.) είτε π1 = 0 και π ′ (z) είναι πολυώνυμο Schur.
Με βάση αυτήν τη θεωρία μπορούμε να ανάγουμε το ερώτημα αν ένα πολυώνυμο είναι τύπου Schur ή von
Neumann σε ανάλογο ερώτημα για ένα πολυώνυμο βαθμού κατά ένα μικρότερο και προχωρούμε τη διερεύ-
νηση με αυτόν τον τρόπο. Αυτή η μεθοδολογία είναι εύχρηστη για να αποφανθούμε αν ένα πολυώνυμο ικα-
νοποιεί τη συνθήκη των ριζών όταν k = 3 ή k = 4.
Σημαντικό ρόλο στη μελέτης της σύγκλισης των πολυβηματικών μεθόδων εκτός από την έννοια της ευ-
στάθειας έχει και η έννοια της συνέπειας. Τον ορισμό των εννοιών αυτών και τα θεωρήματα που τις συνδέουν
έδωσε ο Dahlquist (1956).
Θεωρούμε ότι η λύση του y του προβλήματος αρχικών τιμών είναι αρκετά ομαλή και για t ∈ [a, b − kh]
ορίζουμε την ποσότητα
X
k
δ[y(t); h] = [αj y(t + jh) − hβj y ′ (t + jh)] , (11.51)
j=0
που παίζει τον ρόλο του τοπικού σφάλματος διακριτοποίησης στην περίπτωση των μεθόδων Runge–Kutta.
Ορισμός 11.4. Έστω y μια τυχαία αρκετά ομαλή συνάρτηση. Αν p είναι ο μεγαλύτερος ακέραιος για τον
οποίο ισχύει
∃C = C(y), ∀t ∈ [a, b − kh], |δ[y(t); h]| ≤ Chp+1 , (11.52)
με δ[y(t); h] όπως ορίστηκε στην (11.51), τότε λέμε ότι η τάξη ακρίβειας της πολυβηματικής μεθόδου (11.5)
είναι p.
Ορισμός 11.5. Λέμε ότι η μέθοδος (11.5) είναι συνεπής αν η τάξη ακρίβειάς της είναι τουλάχιστον ένα.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 173
C0 = α 0 + α 1 + · · · + α k (11.53)
C1 = α1 + 2α2 + · · · + kαk − (β0 + · · · + βk ) (11.54)
και για j ≥ 2,
1
Cj = (α1 + 2j α2 + 3j αj + · · · + k j αk )
j!
(11.55)
1
− (β1 + 2j−1 β2 + 3j−1 β3 + · · · + k j−1 β k ).
(j − 1)!
Σύμφωνα με το Θεώρημα 11.4, υπολογίζοντας τις παραπάνω σταθερές C0 , C1 , C2 , . . . , μπορούμε εύκολα
να βρούμε αν μια πολυβηματική μέθοδος είναι συνεπής και ποια η τάξη ακρίβειάς της.
Θεώρημα 11.4. Μια πολυβηματική μέθοδος (11.5) είναι συνεπής ακριβώς τότε αν C0 = C1 = 0. Επιπλέον
έχει τάξη ακρίβειας p ακριβώς τότε αν C0 = C1 = · · · = Cp = 0 αλλά Cp+1 6= 0.
Απόδειξη. Έστω y μια αρκετά ομαλή συνάρτηση. Θεωρούμε το ανάπτυγμα Taylor των y(t + jh), y ′ (t + jh)
με κέντρο t, οπότε
X
k
δ[y(t); h] = [αj y(t + jh) − hβj y ′ (t + jh)]
j=0
X
k
(jh)2 ′′ (jh)p+2 (p+2)
= αj (y(t) + (jh)y ′ (t) + y (t) + ... + y (ξj ))
j=0
2 (p + 2)!
X
k
(jh)2 ′′′ (jh)p+1 (p+2) e
−h βj (y ′ (t) + (jh)y ′′ (t) + y (t) + ... + y (ξj ))
j=0
2 (p + 1)! (11.56)
X
k X
k X
k
j2
= αj y(t) + h (jαj − βj )y ′ (t) + h2 αj − jβj )y ′′ (t)
j=0 j=1 j=1
2
X
k
j p+2 (p+2) (j)p+1 (p+2) e
+ · · · + hp+1 ( αj y (ξj ) − y (ξj ))
j=0
(p + 2)! (p + 1)!
= C0 y(t) + C1 hy ′ (t) + · · · + Cp hp y (p) + Cp+1 hp+1 y (p) .
Συνεπώς, αν και μόνο αν C0 = C1 = · · · = Cp = 0 και Cp+1 6= 0, θα ισχύει ότι |δ[y(t); h]| ≤ Chp+1 ,
δηλαδή ότι η τάξη ακρίβειας είναι p. Επίσης είναι προφανές ότι αν και μόνο αν C0 = C1 = 0, η μέθοδος είναι
συνεπής.
Όπως θα δούμε παρακάτω, η συνέπεια και η ευστάθεια είναι ικανές και αναγκαίες συνθήκες για τη σύγκλιση
μια πολυβηματικής μεθόδου. Το επόμενο θεώρημα όμως, περιορίζει τη δυνατή τάξη ακρίβειας μιας ευσταθούς
μεθόδου.
Θεώρημα 11.5 (Dahlquist, 1956). Η μέγιστη τάξη ακρίβειας μια ευσταθούς k-βηματικής μεθόδου της μορφής
(11.5) είναι p = k + 1 αν k περιττός και p = k + 2 αν k άρτιος.
Παράδειγμα 11.3. Για τη μέθοδο του Simpson (11.4) έχουμε α2 = 1, α1 = 0, α0 = −1 και β2 = 1/3,
174 ΠΟΛΥΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ
C0 = α0 + α1 + α2 = 0 − 1 + 1 = 0,
1 4 1 6
C1 = α1 + 2α2 − (β0 + β1 + β2 ) = 2 − ( + + ) = 2 − = 0,
3 3 3 3
1 1 1 4 2
C2 = (α1 + 4α2 ) − (β1 + 2β2 ) = (4) − ( + ) = 0,
2 1 2 3 3
1 1 1 1 8
C3 = (α1 + 8α2 ) − (β1 + 4β2 ) = (8) − ( ) = 0,
6 2 6 2 3
1 1 1 1
C4 = (α1 + 16α2 ) − (β1 + 8β2 ) = (16) − (4) = 0,
24 6 24 6
1 1 1 1 20 1
C5 = (α1 + 32α2 ) − (β1 + 16β2 ) = (32) − ( ) = − ,
120 24 120 24 3 90
συνεπώς η τάξη ακρίβειας της μεθόδου του Simpson είναι p = 4.
Από τη σχέση (11.54) βλέπουμε ότι η μέθοδος (11.5) είναι συνεπής αν C0 = C1 = 0, δηλαδή αν
X
k X
k X
k
αj = 0, jαj = βj. (11.57)
j=0 j=1 j=0
Εισάγοντας το πολυώνυμο
σ(z) = βk z k + βk−1 z k−1 + · · · + β0 , (11.58)
βλέπουμε ότι οι σχέσεις (11.57) γράφονται ισοδύναμα ως
11.5 Σύγκλιση
Ορισμός 11.6. Θα λέμε ότι η μέθοδος (11.5) συγκλίνει αν για κάθε πραγματική συνάρτηση f (t, y) που
ικανοποιεί τις υποθέσεις του Θεωρήματος 8.1 έχουμε για κάθε t ∈ [a, b] ότι ισχύει
για κάθε λύση της (11.5) με αρχικές τιμές y 0 , . . . , y k−1 τέτοιες ώστε
lim y j = y0 , 0 ≤ j ≤ k − 1. (11.61)
h→0
αk y n+k + · · · + α0 y n = 0, n = 0, . . . , N − k. (11.63)
Επειδή έχουμε υποθέσει ότι η k-βηματική μέθοδος είναι συγκλίνουσα, έχουμε ότι αν
lim y j = 0, j = 0, . . . , k − 1, (11.64)
h→0
τότε
T
lim y n = 0, h=
. (11.65)
n→∞ n
Έστω λοιπόν μια ρίζα z του χαρακτηριστικού πολυωνύμου. Μπορούμε να γράψουμε το z στη μορφή z =
re με r ≥ 0, 0 ≤ ϕ < 2π. Θεωρούμε τώρα την ακολουθία (y j )j∈N0 με y j = hRe(z j ) = hrj cos(jϕ),
iϕ
j ∈ N0 , η οποία ικανοποιεί την (11.63). Επίσης εύκολα βλέπουμε ότι οι πρώτοι k-όροι ικανοποιούν την
(11.64) και άρα θα ισχύει η (11.65).
T
Αν z ∈ R, δηλαδή ϕ = 0 ή ϕ = π τότε, επειδή |y n | = hrn = rn → 0, n → ∞ θα πρέπει r ≤ 1.
n
Δηλαδή ισχύει η ζητούμενη σχέση |z| ≤ 1. Αν τώρα ϕ 6= 0, ϕ 6= π, τότε χρησιμοποιώντας μια γνωστή
τριγωνομετρική ταυτότητα έχουμε
(y n )2 − y n+1 y n−1 = h2 r2n [cos2 (nϕ) − cos((n + 1)ϕ) cos((n − 1)ϕ)] = h2 r2n sin2 (ϕ).
Επομένως
(y n )2 − y n+1 y n−1
= h2 r2n . (11.66)
sin2 (ϕ)
Συνεπώς λόγω της (11.65) (y n )2 − y n+1 y n−1 → 0, n → ∞, οπότε λόγω της (11.66),
rn 2
h2 r2n = T 2 ( ) → 0, n → ∞.
n
Άρα |r| ≤ 1. Δείξαμε λοιπόν ότι αν z ρίζα του χαρακτηριστικού πολυωνύμου ϱ, τότε |z| ≤ 1.
Θέλουμε να δείξουμε τώρα ότι αν z είναι πολλαπλή ρίζα, δηλαδή ϱ(z) = ϱ′ (z) = 0, τότε |z| < 1. Είδαμε
στην Παράγραφο 11.3 ότι τότε η ακολουθία (y j )(j∈N0 ) με y j = hjRe(z j ) = hjrj cos(jϕ) είναι λύση της
εξίσωσης διαφορών (11.21). Επίσης ικανοποιεί την (11.64) και επομένως ισχύει η (11.65). Αν τώρα z ∈ R,
δηλαδή ϕ = 0 ή ϕ = π, τότε
|y n | = hnrn = T rn → 0, n → ∞,
Θεώρημα 11.7 (Dahlquist). Αν η πολυβηματική μέθοδος (11.5) συγκλίνει, τότε είναι συνεπής.
176 ΠΟΛΥΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ
Απόδειξη. Θεωρούμε ότι η μέθοδος (11.5) συγκλίνει. Αρκεί να δείξουμε ότι ϱ(1) = 0 και ϱ′ (1) = σ(1). Για
τον έλεγχο αυτών των ιδιοτήτων αρκεί να βρούμε κατάλληλα προβλήματα αρχικών τιμών που να μας βοηθούν
ώστε να καταλήξουμε στο ζητούμενο.
Πρώτα θα δείξουμε ότι ϱ(1) = 0. Επειδή για τον έλεγχο αυτής της ιδιότητας δεν λαμβάνουμε καθόλου
υπόψη μας τους συντελεστές β0 , . . . , βk , μπορούμε να θεωρήσουμε ένα πρόβλημα αρχικών τιμών f = 0.
Έστω λοιπόν το ακόλουθο πρόβλημα
(
y ′ (t) =0, 0 ≤ t ≤ T,
y(0) =1.
Εύκολα μπορούμε να δούμε ότι η y(t) = 1, t ∈ [0, T ], είναι λύση αυτού του προβλήματος αρχικών τιμών.
Επομένως η πολυβηματική μέθοδος (11.5) για αυτό το πρόβλημα διατυπώνεται ως εξής:
(
y 0 , y 1 , . . . , y k−1 , δεδομένα
αk y n+k + αk−1 y n+k−1 + · · · + α0 y n = 0, 0 ≤ n ≤ N − k.
Έστω λοιπόν y 0 = y 1 = · · · = y k−1 = 1. Επειδή η μέθοδος συγκλίνει θα πρέπει y k = 1. Επομένως
αk + αk−1 + · · · + α0 = 0, δηλαδή ϱ(1) = 0.
Στη συνέχεια θέλουμε να δείξουμε ότι ϱ′ (1) = σ(1). Επειδή για τον έλεγχο αυτής της ιδιότητας λαμβά-
νουμε υπόψη μας τους συντελεστές β0 , . . . , βk , τώρα θα πρέπει θεωρήσουμε ένα πρόβλημα αρχικών τιμών
με f 6= 0. Μια τέτοια επιλογή είναι f = 1. Έστω λοιπόν το ακόλουθο πρόβλημα
(
y ′ (t) =1, 0 ≤ t ≤ T,
y(0) =0.
Εύκολα μπορούμε να δούμε ότι η y(t) = t, t ∈ [0, T ], είναι λύση αυτού του προβλήματος αρχικών τιμών.
Επομένως η πολυβηματική μέθοδος (11.5) για αυτό το πρόβλημα διατυπώνεται ως εξής:
(
y 0 , y 1 , . . . , y k−1 , δεδομένα
(11.68)
αk y n+k + αk−1 y n+k−1 + · · · + α0 y n = h(βk + · · · + β0 ), 0 ≤ n ≤ N − k.
Επειδή η πολυβηματική μέθοδος είναι συγκλίνουσα, κάθε λύση της (11.68) για την οποία έχουμε ότι
lim y j = 0, j = 0, . . . , k − 1, (11.69)
h→0
X
k X
k X
k
= hM (n αj + jαj ) = hM jαj (11.72)
j=0 j=0 j=0
X
k
′
= hM ϱ (1) = hσ(1) = h βj ,
j=0
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 177
δηλαδή ικανοποιείται η (11.68). Επίσης εύκολα βλέπουμε ότι ισχύει η (11.69). Επομένως, λόγω της σύγκλι-
σης της μεθόδου, από την (11.70) έχουμε
T = lim hN M = T M.
N →∞
Θεώρημα 11.8. Υποθέτουμε ότι η k-βηματική μέθοδος (11.5) είναι ευσταθής και έχει τάξη ακρίβειας p ≥ 1.
Έστω ότι η λύση y του προβλήματος αρχικών τιμών (11.1) ανήκει στον χώρο C p+1 [a, b]. Τότε υπάρχει h0 > 0
τέτοιο ώστε για 0 ≤ h ≤ h0 να ισχύει
max |y − y(t )| ≤ C
n n
max |y − y(t )| + h max |y
j j p (p+1)
(t)| , (11.73)
0≤n≤N 0≤j≤k−1 a≤t≤b
Απόδειξη. Αφού η τάξη ακρίβειας της πολυβηματικής μεθόδου είναι p, τότε αναπτύσσοντας κατά Taylor με
κέντρο το tn , εύκολα βλέπουμε ότι για την ποσότητα
X
k
n
ρ = [αj y(tn + jh) − hβj y ′ (tn + jh)], n = 0, . . . , N − k. (11.74)
j=0
Ισχύει ότι
max |ρn | ≤ Chp+1 ky (p+1) k∞ . (11.75)
0≤n≤N −k
Θέτουμε τώρα εn = y(tn ) − y n . Οπότε χρησιμοποιώντας την (11.5) και την (11.74) έχουμε
X
k X
k X
k
αj ε n+j
= αj y(t n+j
)− αj y n+j
j=0 j=0 j=0
X
k X
k
′
= h( βj y (t n+j
)− βj f n+j ) + ρn (11.76)
j=0 j=0
X
k
=h βj (f (tn+j , y(tn+j )) − f n+j ) + ρn .
j=0
X
k X
k
αj εn+j = h βj g n+j εn+j + ρn , n = 0, . . . , N − k. (11.77)
j=0 j=0
όπου L είναι η σταθερά Lipschitz της f ως προς τη δεύτερη μεταβλητή της. Επίσης θέτουμε βin = βi g n+i ,
i = 0, . . . , k, n = 0, . . . , N − k. Οπότε η (11.77) γράφεται ως εξής
X
k X
k
αj ε n+j
=h βjn εn+j + ρn , n = 0, . . . , N − k. (11.78)
j=0 j=0
Επομένως, λόγω της (11.75) και επειδή N h = b − a, η (11.80) δίνει τη ζητούμενη ανισότητα (11.73).
Παράδειγμα 11.4. Θεωρούμε το πρόβλημα αρχικών τιμών: Έστω y : [0, 2] → R, τέτοια ώστε
p
y ′ (t) = 4t y(t), t ∈ [0, 2], y(0) = 1. (11.81)
Η ακριβής λύση του προβλήματος (11.81) είναι y(t) = (t2 +1)2 . Θεωρήστε τη μέθοδο: Για δοσμένα y0 , y1 ,
h
y n+2 − y n+1 = (4f (tn+2 , y n+2 ) + 8f (tn+1 , y n+1 ) − f (tn , y n )), n = 0, . . . , N − 2.
12
Εύκολα μπορούμε να δούμε ότι αυτή η μέθοδος ικανοποιεί τη συνθήκη των ριζών, αλλά δεν είναι συνεπής.
Πράγματι, έχουμε ϱ(z) = z 2 − z, που έχει ρίζες z = 0 και z = 1 και άρα ικανοποιεί τη συνθήκη των
ριζών. Επίσης έχουμε ότι η σταθερά C0 = ϱ(1) = 0. Τώρα, ϱ′ (z) = 2z − 1, οπότε ϱ′ (1) = 1. Όμως
σ(z) = (4z + 8z − 1)/12 και σ(1) = 11/12 6= 1, άρα C1 = ϱ′ (1) − σ(1) 6= 0. Συνεπώς η μέθοδος
δεν είναι συνεπής.
Θεωρούμε τώρα διαμερίσεις του [0, 2] με N = 20, 40, 80, 160 και αρχικές τιμές y0 = 1 και y1 που να
δίνεται από την άμεση μέθοδο του Euler και υλοποιούμε τη μέθοδο. Στον Πίνακα 11.1 αναφέρουμε τα σφάλ-
ματα |y(tn ) − y n |. Παρατηρήστε ότι καθώς το N αυξάνεται ή το h ελαττώνεται οι τιμές |y(tn ) − y n | τείνουν
να σταθεροποιηθούν, χωρίς όμως το σφάλμα να μειώνεται. Αυτό δηλώνει ότι οι τιμές y n που υπολογίζουμε με
τη μέθοδο προσεγγίζουν μια συνάρτηση, όχι όμως τη λύση του προβλήματος (11.81).
Πίνακας 11.1: Σφάλματα της μεθόδου του Παραδείγματος 11.4 για t = 0.5, 1, 1.5, 2 και N = 20, 40, 80,
160.
Στην περίπτωση μιας πεπλεγμένης πολυβηματικής μεθόδου πρέπει να λύσουμε σε κάθε βήμα μια μη γραμμική
εξίσωση για τον υπολογισμό του αγνώστου y n+k . Στην πράξη είναι πολύ συνηθισμένο να γίνεται μια αρκετά
ακριβής πρόβλεψη y0n+k του y n+k με μια βοηθητική άμεση πολυβηματική μέθοδο και να χρησιμοποιείται η
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 179
κύρια, πεπλεγμένη μέθοδος για τον υπολογισμό διορθώσεων yin+k , i ≥ 1, με απλή επανάληψη. Προκύπτουν
έτσι ζευγάρια μεθόδων, οι λεγόμενες μέθοδοι πρόβλεψης-διόρθωσης (Π/Δ) που μπορούν να γραφούν γενικά
στη μορφή
X
k−1 X
k−1
(Π): y0n+k + α̃j y n+j = h β̃j f n+j ,
j=0 j=0
X
k−1 X
k−1
n+k
(Δ): yi+1 + αj y n+j
= hβk f (t n+k
, yin+k ) +h βj f n+j , i = 0, 1, . . .
j=0 j=0
Η μέθοδος πρόβλεψης είναι μια άμεση k-βηματική μέθοδος που παράγει μια αρχική τιμή y0n+k για τη μέθοδο
διόρθωσης. Η μέθοδος διόρθωσης χρησιμοποιείται είτε ως απλή επαναληπτική μέθοδος για τη λύση της μη
γραμμικής εξίσωσης, οπότε η διόρθωση επαναλαμβάνεται μέχρις ότου, π.χ., |yi+1
n+k
− yin+k | < ϵ, για κάποιο
δεδομένο ϵ > 0 της τάξης του σφάλματος στρογγύλευσης είτε για να παράγει ένα yin+k για μικρό i, συνήθως
i = 1 ή i = 2, το οποίο ορίζουμε ως y n+k και προχωρούμε στο επόμενο βήμα. Δυο γνωστά ζευγάρια μεθόδων
διόρθωσης-πρόβλεψης είναι το ζεύγος Euler-τραπεζίου
(Π): y n+1 − y n = hf n ,
(Δ): y n+1 − y n = h(f n+1 + f n )/2,
11.7 Ασκήσεις
11.7.1 Έστω σ(z) = z 2 . Βρείτε πολυώνυμο ϱ(z) δευτέρου βαθμού έτσι ώστε η αντίστοιχη πολυβηματική
μέθοδος να έχει τάξη ακρίβειας 2. Είναι ευσταθής;
11.7.2 Έστω σ(z) = z 2 . Βρείτε πολυώνυμο ϱ(z) τρίτου βαθμού έτσι ώστε η αντίστοιχη πολυβηματική μέ-
θοδος να έχει τάξη ακρίβειας 3. Είναι ευσταθής;
11.7.3 Δείξτε ότι η μονοβηματική μέθοδος y n+1 = y n +2hf n δεν είναι συνεπής και όταν τη χρησιμοποιούμε
για να λύσουμε το πρόβλημα αρχικών τιμών y ′ (t) = 1, t ∈ [0, 1], με y(0) = 0 και βήμα h, το ολικό
σφάλμα για t = 1 είναι πάντα σταθερό.
180 ΠΟΛΥΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ
11.7.4 Έστω ϱ(z) = z 4 −1. Βρείτε πολυώνυμο σ(z) τέταρτου βαθμού έτσι ώστε η αντίστοιχη πολυβηματική
μέθοδος να έχει μέγιστη τάξη ακρίβειας. Ποια είναι η τάξη ακρίβειας;
11.7.5 Εξετάστε αν η μέθοδος
h
y n+2 − y n = (3f (tn+1 , y n+1 ) − f (tn , y n ))
4
είναι συνεπής.
11.7.6 Τι τιμές πρέπει να έχουν οι παράμετροι a και b ώστε οι ακόλουθες μέθοδοι να είναι συνεπείς;
i.) y n+2 − ay n+1 − 2y n = hbf (tn , y n ).
ii.) y n+2 + y n+1 + ay n = h(f (tn+2 , y n+2 ) + bf (tn , y n )).
11.7.7 Θεωρούμε τις διβηματικές μεθόδους της μορφής
y n+2 + a1 y n+1 − ay n = hb2 f (tn+2 , y n+2 ), με a1 , a, b2 ∈ R.
Βρείτε τα a1 , b2 ώστε για οποιοδήποτε a ∈ R να έχουμε τη μέγιστη τάξη συνέπειας. Στη συνέχεια
βρείτε για ποια a έχουμε τη μέγιστη δυνατή τάξη συνέπειας.
11.7.8 Μια ενδιαφέρουσα κατηγορία πολυβηματικών μεθόδων προκύπτει με τεχνικές παρεμβολής και αριθ-
μητικής παραγώγισης. Θεωρώντας το πολυώνυμο παρεμβολής Pn,k (t) βαθμού μικρότερου ή ίσου του
k που παρεμβάλλεται στα σημεία tn+k , tn+k−1 , . . . , tn , στις τιμές y(tn+k ), y(tn+k−1 ), . . . , y(tn ),
αντίστοιχα και υπολογίζοντας την παράγωγό του στο σημείο tn+k , παίρνουμε τις μεθόδους ανάδρομων
διαφορών
′
Pn,k (tn+k ) ≈ y ′ (tn+k ) = f (tn+k , y(tn+k ).
Αντικαθιστώντας τα y(tn+k ) με τα y n+k παίρνουμε
X
k
j −1 ∇j y n+k = hf n+k , 0 ≤ n ≤ N − k,
j=1
Βιβλιογραφία
[1] K. E. Atkinson, W. Han και D. E. Stewart. Numerical Solution of Ordinary Differential Equations.
English. Hoboken, NJ: John Wiley & Sons, 2009, σσ. xii + 252. isbn: 978-0-470-04294-6.
[2] J.C. Butcher. The Numerical Analysis of Ordinary Differential Equations. Hoboken, New Jersey: John
Wiley & Sons, 1987.
[3] P. J. Davis και P. Rabinowitz. Methods of Numerical Integration. English. 2nd. Orlando: Academic
Press, Inc., 1984.
[4] D. F. Griffiths και D. J. Higham. Numerical Methods for Ordinary Differential Equations. Initial Value
Problems. English. London: Springer, 2010, σσ. xiv + 271. isbn: 978-0-85729-147-9. doi: 10 .
1007/978‐0‐85729‐148‐6.
[5] E. Hairer, S. P. Nørsett και G. Wanner. Solving Ordinary Differential Equations. I: Nonstiff Problems.
English. Τόμ. 8. Berlin: Springer, 2010, σσ. xv + 528. isbn: 978-3-642-05163-0.
[6] P. Henrici. Discrete Variable Methods in Ordinary Differential Equations. New York: Wiley, 1962.
[7] A. Iserles. A First Course in the Numerical Analysis of Differential Equations. English. 2nd ed. Camb.
Texts Appl. Math. Cambridge: Cambridge University Press, 2009. isbn: 978-0-521-73490-5. doi:
10.1017/CBO9780511995569.
[8] J. D. Lambert. Numerical Methods for Ordinary Differential Dystems: The Initial Value Problem. En-
glish. Chichester etc.: John Wiley &| Sons, 1991, σσ. x + 293. isbn: 0-471-92990-5.
[9] J. Stoer και R. Bulirsch. Introduction to Numerical Analysis. English. 3rd ed. Τόμ. 12. Texts Appl.
Math. New York, NY: Springer, 2002. isbn: 0-387-95452-X.
[10] E. Süli και D. F. Mayers. An Introduction to Numerical Analysis. Cambridge University Press, 2003.
isbn: 0-521-00794-1.
[11] Γ. Δ. Ακρίβης και B. A. Δουγαλής. Εισαγωγή στην Αριθμητική Ανάλυση. Πανεπιστημιακές Εκδόσεις
Κρήτης, 2017.
[12] Γ. Δ. Ακρίβης και Β.Α. Δουγαλής. Αριθμητικές Μέθοδοι για Συνήθεις Διαφορικές Εξισώσεις. Πανεπι-
στημιακές Εκδόσεις Κρήτης, 2015.
[13] Μ. Ν. Βραχάτης. Αριθμητική Ανάλυση: Συνήθεις Διαφορικές Εξισώσεις. Εκδόσεις Κλειδάριθμος, 2012.
182 ΠΟΛΥΒΗΜΑΤΙΚΕΣ ΜΕΘΟΔΟΙ
ΚΕΦΑΛΑΙΟ 12
Περίληψη
Άκαμπτες γραμμικές διαφορικές εξισώσεις είναι αυτές για τις οποίες η ακριβής λύση είναι γενικά μια ομαλή
συνάρτηση και μεταβάλλεται αργά ως τη μεταβλητή της t, όταν το t δεν ειναι κοντά σε κάποια τιμή t∗ . Ορισμέ-
νες αριθμητικές μέθοδοι είναι ασταθείς, χρειάζονται μικρό σχετικό βήμα για να μπορέσουν να προσεγγίσουν
την ακριβή λύση αυτών των προβλημάτων. Αυτή η ιδιότητα ευστάθειας που σχετίζεται με την προσεγγιστική
λύση μιας μεθόδου για ένα άκαμπτο πρόβλημα διαφορικών εξισώσεων ονομάζεται απόλυτη ευστάθεια. Η από-
λυτη ευστάθεια είναι μια πολύ σημαντική ιδιότητα των αριθμητικών μεθόδων και θα τη μελετήσουμε για τις
μεθόδους που παρουσιάσαμε στα προηγούμενα κεφάλαια. Η περιοχή απόλυτης ευστάθειας δηλώνει την πε-
ριοχή που πρέπει να ανήκει το σχετικό μέγεθος του βήματος ώστε η αριθμητική μέθοδος να προσεγγίζει την
ακριβή λύση. Όσο μεγαλύτερη είναι η περιοχή απόλυτης ευστάθειας τόσο λιγότερους περιορισμούς έχουμε
στην επιλογή του βήματος. Αν δεν υπάρχει κανένας περιορισμός για το βήμα, η αριθμητική μέθοδος θα κα-
λείται A-ευσταθής.
Επίσης θα μελετήσουμε την ευστάθεια αριθμητικών μεθόδων για άκαμπτα μη γραμμικά προβλήματα, όπου
για ένα πρόβλημα αρχικών τιμών που δίνεται από ένα σύστημα διαφορικών εξισώσων πρώτης τάξεως της
μορφής y ′ (t) = f (t, y), η συνάρτηση f ικανοποιεί μια μονόπλευρη συνθήκη του Lipschitz. Γενικότερα, η
B-ευστάθεια είναι μια επέκταση της απόλυτης ευστάθειας. Αν μια μέθοδος Runge-Kutta είναι B-ευσταθής,
τότε θα είναι και A-ευσταθής. Στις πολυβηματικές μεθόδους η αντίστοιχη έννοια καλείται G-ευστάθεια.
Προαπαιτούμενη γνώση: Βασικές γνώσεις Συνήθων Διαφορικών Εξισώσεων και Απειροστικού Λογισμού
σε πολλές διαστάσεις. Διανυσματικοί χώροι με νόρμα. Αριθμητική επίλυση μη γραμμικών συστημάτων. Μο-
νοβηματικές και πολυβηματικές μέθοδοι για την αριθμητική επίλυση διαφορικών εξισώσεων.
με λ < 0 και |λ| 1. Η λύση του (12.1) είναι η y(t) = eλt η οποία τείνει πολύ γρήγορα στο μηδέν καθώς
t → ∞.
Παράδειγμα 12.1. Ας θεωρήσουμε λ = −20, −40, −80, −100 στο πρόβλημα (12.1). Τότε για h = 1/50
μπορούμε να δούμε στο Σχήμα 12.1 ότι οι προσεγγίσεις με τη μέθοδο Euler, καθώς η παράμετρος λ ελαττώ-
νεται, χειροτερεύουν. Αν τώρα, θεωρήσουμε σταθερό π.χ. λ = −105 και χρησιμοποιήσουμε διαμερίσεις για
τις οποίες το h ελαττώνεται, h = 1/80, 1/100, 1/120, παρατηρούμε ότι οι προσεγγίσεις πλησιάζουν την
ακριβή λύση, βλ. Σχήμα 12.2.
Σχήμα 12.1: Η μέθοδος Euler με h = 1/50 για την αριθμητική λύση του Παραδείγματος 12.1.
Είναι προφανές ότι για οποιοδήποτε βήμα h, όσο μικρό και να είναι, μπορούμε να βρούμε, κατάλληλα με-
γάλο κατ’ απόλυτο τιμή λ < 0, ώστε να παρατηρήσουμε ένα ανάλογο φαινόμενο αστάθειας όπως στο Πα-
ράδειγμα 12.1. Αυτή η συμπεριφορά αστάθειας της μεθόδου δηλώνει μια ακαμψία η οποία σχετίζεται με την
έννοια της απόλυτης ευστάθειας μιας αριθμητικής μεθόδου, που θα ορίσουμε παρακάτω.
Στη συνέχεια θα δούμε τη σημασία που έχει η ιδιότητα ακαμψίας που παρουσιάσαμε στο Παράδειγμα 12.1
στους αριθμητικούς υπολογισμούς. Η ακολουθία προσεγγίσεων που παράγει η μέθοδος Euler με σταθερό
βήμα h είναι
y n = (1 + hλ)n , n ≥ 0. (12.2)
Αν σε κάποιο βήμα k της μεθόδου υπολογίζουμε π.χ., λόγω σφαλμάτων στρογγύλευσης τον αριθμό z k αντί
του y k και στη συνέχεια υπολογίζουμε τους όρους z n , n > k ακριβώς, τότε
zn = yn, 0 ≤ n ≤ k − 1, z n+1 = (1 + hλ)z n , n ≥ k, z k 6= y k .
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 185
Σχήμα 12.2: Η μέθοδος Euler με h = 1/50, 1/80, 1/100, 1/120, για την αριθμητική λύση του Παραδείγ-
ματος 12.1.
Συνεπώς
|y n − z n | ≤ |1 + hλ|n−k |y k − z k |, n ≥ k, (12.3)
από την οποία βλέπουμε ότι αν |1 + hλ| < 1, δηλαδή αν 0 < h < −2/λ, η διαταραχή |y k − z k | δεν θα
έχει σοβαρές επιπτώσεις. Αν |1 + hλ| = 1 τότε το σφάλμα διατηρείται, δηλαδή |y n − z n | = |y k − z k |,
n ≥ k. Αν |1 + hλ| > 1 τότε |y n − z n | → ∞ εκθετικά με το n. Για παράδειγμα, αν υπολογίζουμε τη λύση
στο διάστημα [0, T ] με h = T /N , τότε
max |y n − z n | ≤ |1 + hλ|N −k |y k − z k |
0≤n≤N
≤ (1 + h|λ|)N |y k − z k |
≤ e|λ|T |y k − z k |.
Αν η σταθερά Lipschitz L = |λ| του προβλήματος (12.1) είναι μεγάλη, το παραπάνω σφάλμα δεν έχει πρα-
κτική σημασία. Το παράδειγμα αυτό όμως δείχνει ότι η συνθήκη |1 + hλ| < 1 εξασφαλίζει μια πραγματική
ευστάθεια της μεθόδου με την έννοια ότι καταστέλλει τυχόν σφάλματα, όπως το |y k −z k | και δεν τους επιτρέ-
πει να επηρεάσουν σημαντικά τους υπολογισμούς για n ≥ k. Επιπλέον, η συνθήκη |1+hλ| < 1 εξασφαλίζει
ότι y n → 0 καθώς n → ∞ (για σταθερό h), δείτε την (12.2). Με άλλα λόγια, είναι ικανή και αναγκαία συν-
θήκη έτσι ώστε η λύση {y n } του διακριτού προβλήματος να μιμείται τη συμπεριφορά της λύσης του συνεχούς
προβλήματος (12.1), την y(t) = eλt , η οποία προφανώς τείνει στο μηδέν καθώς t → ∞.
Παράδειγμα 12.2. Ας θεωρήσουμε λ = −20, −100, −200, −400, στο πρόβλημα (12.1). Τότε, στο Σχήμα
12.3 μπορούμε να δούμε για h = 1/50 ότι οι προσεγγίσεις με την πεπλεγμένη μέθοδο Euler παραμένουν
κοντά στην ακριβή λύση, καθώς η παράμετρος λ ελαττώνεται. Αυτό είναι σε αντίθεση με τη συμπεριφορά των
λύσεων με την άμεση μέθοδο Euler που είδαμε στο Παράδειγμα 12.1.
Στο Παράδειγμα 12.2 δεν παρατηρούμε για την πεπλεγμένη μέθοδο Euler την ανάλογη αστάθεια που
186 ΕΥΣΤΑΘΕΙΑ ΑΚΑΜΠΤΩΝ ΔΙΑΦΟΡΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
Σχήμα 12.3: Η πεπλεγμένη μέθοδος Euler με h = 1/50 για την αριθμητική λύση του Παραδείγματος (12.2).
είδαμε στο Παράδειγμα 12.1. Για να εξηγήσουμε γιατί συμβαίνει αυτό το φαινόμενο, ας θεωρήσουμε την ακο-
λουθία προσεγγίσεων που παράγει η πεπλεγμένη μέθοδος Euler για το ίδιο πρόβλημα (12.1) είναι
y n = (1 − hλ)−n , n ≥ 0, (12.4)
|y n − z n | = |1 − hλ|−(n−k) |y k − z k |, n ≥ k. (12.5)
Επειδή λ < 0 συμπεραίνουμε ότι |1 − hλ|−1 < 1 για κάθε h > 0, δηλαδή ότι η (12.5) δίνει |y n − z n |
|y k −z k | για n k και συνεπώς η πεπλεγμένη μέθοδος Euler δεν επηρεάζεται από σφάλματα |y k −z k | 6= 0.
Ισοδύναμα, η ακολουθία (12.4) ικανοποιεί y n → 0 καθώς n → ∞, μιμείται δηλαδή τη συμπεριφορά της
λύσης του συνεχούς προβλήματος (12.1).
Ο ακόλουθος ορισμός της έννοιας της ευστάθειας οφείλεται στον Dahlquist (1963).
Ορισμός 12.1. Λέμε ότι μια μέθοδος (με συγκεκριμένο βήμα h) είναι απόλυτα ευσταθής για απλές διαφορικές
εξισώσεις αν όταν εφαρμοσθεί στο πρόβλημα (12.1) με λ < 0, έχει την ιδιότητα να δίνει προσεγγίσεις {y n },
n ≥ 0, τέτοιες ώστε y n → 0 καθώς n → ∞. Οι τιμές του γινομένου λh για τις οποίες η μέθοδος έχει
αυτήν την ιδιότητα αποτελούν το διάστημα απόλυτης ευστάθειας της μεθόδου και είναι συνεπώς υποσύνολο
του αρνητικού πραγματικού ημιάξονα.
Είδαμε ότι για τη μέθοδο Euler το διάστημα απόλυτης ευστάθειας είναι το (−2, 0), ενώ για την πεπλεγ-
μένη μέθοδο Euler το (−∞, 0). Συμπεραίνουμε λοιπόν ότι για τη μέθοδο Euler, αν το λ είναι μεγάλο κατ’
απόλυτο τιμή, η συνθήκη λh ∈ (−2, 0) αποτελεί σοβαρό περιορισμό για το μέγιστο βήμα h που μπορούμε
να χρησιμοποιήσουμε για να υπολογίσουμε τις προσεγγίσεις y n και να έχουμε αποδεκτά αποτελέσματα.
Ένα πρόβλημα αρχικών τιμών,
(
y ′ (t) = f (t, y(t)), t ≥ 0,
(12.6)
y(0) = y0 ,
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 187
θεωρείται άκαμπτο, αν η λύση του είναι βασικά ομαλή και μεταβάλλεται αργά με τον χρόνο για t > ϵ, ϵ
μικρό, αλλά περιέχει μια συνιστώσα η οποία αποσβένεται εκθετικά καθώς αυξάνεται το t και πρακτικά παύει
να συνεισφέρει στη λύση για t > ϵ. Ας θεωρήσουμε το πρόβλημα
Θεωρούμε τώρα το πρόβλημα
(
y ′ (t) = λy(t) + f ′ (t) − λf (t), t ≥ 0,
(12.7)
y(0) = y0 ,
βλέπουμε ότι η (12.10) είναι όντως προσέγγιση της (12.9) για t = tn . Ενώ όμως στην (12.9) η «διαταραχή»
y(t) − f (t) πολλαπλασιάζεται επί eλh 1 και δεν διαταράσσει σχεδόν καθόλου τη σχέση y(t + h) ≈
f (t + h), αντίθετα στη σχέση (12.10), αν |1 + hλ| ≥ 1, η διαφορά y n − f (tn ) επηρεάζει σημαντικά τη
σχέση f (tn+1 ) ≈ f (tn )+hf ′ (tn ). Και πάλι βλέπουμε εδώ τον σημαντικό ρόλο της συνθήκης |1+hλ| < 1.
Η πεπλεγμένη μέθοδος Euler για το συγκεκριμένο πρόβλημα δίνει τη σχέση
Ο πρώτος όρος είναι μια O(h2 ) προσέγγιση της ποσότητας f (tn+1 ), ενώ η «διαταραχή» y n −f (tn ) δεν είναι
ικανή να διαταράξει τη σχέση y n+1 ≈ f (tn+1 ), επειδή πολλαπλασιάζεται επί τον παράγοντα (1 − hλ)−1
1.
Από την (12.9) βλέπουμε όμως ότι η σχέση y(t + h) ≈ f (t + h) διαταράσσεται από μια μικρή μεταβολή,
την eλh (y(t) − f (t)), που προκύπτει από το γεγονός ότι y(t) 6= f (t) αλλά αποσβένεται γρήγορα από τον
παράγοντα eλh . Αν η αριθμητική μέθοδος προσεγγίζει το εκθετικό eλh με όχι καλό τρόπο για hλ 0, όπως
συμβαίνει με τη μέθοδο Euler όπου η προσέγγιση 1 + hλ είναι μεν αποδεκτή για |hλ| 1 αλλά τελείως
λανθασμένη για hλ 0, τότε περιμένουμε σοβαρή διαταραχή της λύσης y n , που θα προέλθει, φυσικά, από
τον όρο (1 + hλ)(y n − f (tn )). Πρέπει επομένως να επιβάλουμε στο βήμα της μεθόδου την περιοριστική
συνθήκη |1 + hλ| < 1, ισοδύναμα 0 < h < −2/λ, σε όλη τη διάρκεια των υπολογισμών έστω και αν ο
παράγοντας eλt (y 0 − f (0) δεν συνεισφέρει πρακτικά τίποτε στη λύση για t > ϵ. Αντίθετα η πεπλεγμένη
μέθοδος Euler προσεγγίζει το εκθετικό eλh με την ποιοτικά σωστή για λh 0 ρητή προσέγγιση (1−hλ)−1
και η οποία μιμείται την ιδιότητα eλh 1 για λh 0.
Παράδειγμα 12.3. Εφαρμόζουμε τη μέθοδο Euler στο πρόβλημα (12.7) με λ = −1000, f (t) = t2 και
y(0) = 0. Επειδή y0 − f (0) = 0, ο παράγοντας eλt (y0 − f (0)) δεν υπάρχει καθόλου στη λύση y(t) = t2 ,
αλλά η σχέση (12.10) εξακολουθεί να ισχύει. Ο Πίνακας 12.1 δείχνει την καταστροφικά αυξανόμενη αστάθεια
αν για το βήμα της μεθόδου επιλέξουμε h = 1/400 > 0.002 = −2/λ.
Παρατήρηση 12.1. Ο λόγος για τον οποίο εξετάζουμε το πρόβλημα (12.7) με λ < 0 είναι γιατί το αντί-
στοιχο πρόβλημα με λ > 0 έχει εκθετικά αυξανόμενες λύσεις για τις οποίες είναι δύσκολο να διακρίνει κανείς
τη λύση από την ασταθή διαταραχή της.
188 ΕΥΣΤΑΘΕΙΑ ΑΚΑΜΠΤΩΝ ΔΙΑΦΟΡΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
Πίνακας 12.1: Η μέθοδος Euler στο πρόβλημα (12.7) με λ = −1000, f (t) = t2 , y(0) = 0 και h = 1/400.
tn y(t) yn
0.0 0.00 0.0000
0.1 0.01 23.353
0.2 0.04 2.1850 × 108
0.3 0.09 2.0453 × 1015
0.4 0.16 1.9145 × 1022
0.5 0.25 1.7920 × 1029
0.6 0.36 1.6774 × 1036
0.7 0.49 1.5702 × 1043
0.8 0.64 1.4697 × 1050
0.9 0.81 1.3757 × 1057
1.0 1.00 1.2878 × 1064
Μπορούμε να επεκτείνουμε τον ορισμό της απόλυτης ευστάθειας για να μελετήσουμε την ευστάθεια μιας
μεθόδου όταν εφαρμοσθεί σε γραμμικά συστήματα διαφορικών εξισώσεων με σταθερούς συντελεστές, δηλαδή
σε συστήματα της μορφής y ′ (t) = Ay(t) + F (t), όπου A = (aij )m
i,j=1 ∈ R
m×m
, aij σταθερές.
Λέμε ότι ένα πρόβλημα της μορφής
(
y ′ (t) = Ay(t) + F (t), t ≥ 0
(12.11)
y(0) = y0 ,
όπου οι ιδιοτιμές λi του A ικανοποιούν Reλi < 0 είναι άκαμπτο αν max |λi | min |λi |. Για ένα τέτοιο
πρόβλημα υπάρχουν συνιστώσες της λύσης, αυτές που αντιστοιχούν σε ιδιοτιμές με μεγάλο |Reλi |, που τεί-
νουν στο μηδέν πολύ γρήγορα σε σχέση με άλλες συνιστώσες που τείνουν πιο αργά στο μηδέν ή μεταβάλλονται
σε χρονικές κλίμακες που εξαρτώνται από το F (t).
Για να είναι μια μέθοδος ευσταθής για το πρόβλημα (12.11) πρέπει να έχει μια μη κενή περιοχή απόλυτης
ευστάθειας S στο ημιεπίπεδο Rez < 0 και το βήμα h να είναι τέτοιο ώστε hλi ∈ S, για κάθε ιδιοτιμή λi .
Αν η περιοχή S είναι πολύ μικρή, θα πρέπει να πάρουμε πολύ μικρό βήμα έτσι ώστε όλες τις ιδιοτιμές λi —
ακόμα και εκείνες για τις οποίες |Reλi | 1 και που δεν συμβάλλουν καθόλου σχεδόν στη λύση—να έχουμε
hλi ∈ S.
Παράδειγμα 12.4. Θεωρούμε το σύστημα συνήθων διαφορικών εξισώσεων
d u1 9 24 u1 5 cos t + 31 sin t
= + , (12.12)
dt u2 −24 −51 u2 −9 cos t + 31 sin t
με αρχικές συνθήκες (u1 (0), u2 (0))T = (4/3, 2/3)T . Οι ιδιοτιμές του πίνακα ( −24 −51 ) είναι −3 και −39.
9 24
Οι ακριβείς λύσεις u1 (t), u2 (t) του συστήματος (12.12) περιέχουν τις συναρτήσεις e και e−39t , οι οποίες
−3t
φθίνουν με διαφορετική ταχύτητα. Αν προσεγγίσουμε τη λύση του συστήματος με τη μέθοδο Euler, τότε θα
πρέπει να διαλέξουμε το βήμα της έτσι ώστε −39h ∈ {z ∈ C : |1 + z| < 1}, δηλαδή h < 2/39 ≈ 0.051
για να μην δημιουργηθούν προβλήματα αστάθειας. Στο Σχήμα 12.4 βλέπουμε την «έκρηξη» της αριθμητικής
λύσης un καθώς αυξάνεται το n, με σταθερό βήμα h = 1/16 > 2/29.
Θεωρούμε το πρόβλημα αρχικών τιμών για το ομογενές γραμμικό σύστημα διαφορικών εξισώσεων
(
x′ = Ax, t ≥ 0,
(12.13)
x(0) = x0 ,
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 189
Σχήμα 12.4: Η μέθοδος Euler με h = 1/16 για την αριθμητική λύση του προβλήματος (12.12).
και υποθέτουμε για ευκολία, ότι ο A διαγωνοποιείται, δηλαδή ότι υπάρχει αντιστρέψιμος πίνακας S τέτοιος
ώστε S −1 AS = Λ = diag(λ1 , . . . , λm ), όπου λi , 1 ≤ i ≤ m, οι εν γένει μιγαδικές ιδιοτιμές του A. Η
αλλαγή των μεταβλητών y = Sx δίνει το ισοδύναμο σύστημα
(
y ′ = Λy, t ≥ 0,
(12.14)
y(0) = y0 = S −1 x0 ,
του οποίου η λύση είναι yi = y0,i eλi t , 1 ≤ i ≤ m. Συμπεραίνουμε ότι η λύση του (12.13) έχει την ιδιότητα¹
y(t) → 0, καθώς t → ∞ για κάθε y0 ∈ Rn αν και μόνο αν Reλi < 0, 1 ≤ i ≤ m. Επειδή στο σύστημα
(12.14) οι διαφορικές εξισώσεις έχουν αποσυνδεθεί σε m ανεξάρτητες απλές διαφορικές εξισώσεις της μορφής
yi′ = λi yi , φαίνεται λογικό ότι για να επεκτείνουμε την έννοια της απόλυτης ευστάθειας έτσι ώστε να έχει
εφαρμογή σε συστήματα της μορφής (12.13), θα πρέπει να μελετήσουμε τη συμπεριφορά των λύσεων της
αριθμητικής μεθόδου όταν εφαρμοσθεί σε απλή διαφορική εξίσωση της μορφής (12.1), αλλά με μιγαδικό λ
με Reλ < 0.
Θα λέμε ότι μια αριθμητική μέθοδος για τη λύση προβλημάτων αρχικών τιμών για συστήματα διαφορικών
εξισώσεων είναι απόλυτα ευσταθής(για συγκεκριμένο βήμα h) αν, όταν εφαρμοσθεί στο πρόβλημα
(
y ′ = λy, t ≥ 0, λ ∈ C, Reλ < 0,
(12.15)
y(0) = 1,
δίνει προσεγγίσεςι y n , n ≥ 0, τέτοιες ώστε y n → 0 καθώς n → ∞ (για σταθερό h). Οι τιμές του γινομένου
hλ ∈ C για τις οποίες μια μέθοδος έχει αυτήν την ιδιότητα αποτελούν την περιοχή S ⊂ C απόλυτης ευστά-
θειας της μεθόδου . Η περιοχή S απόλυτης ευστάθειας είναι, προφανώς, υποσύνολο του αριστερού ανοιχτού
μιγαδικού ημιεπιπέδου Rez < 0.
Για παράδειγμα, η μέθοδος Euler εφαρμοζόμενη στο πρόβλημα (12.15) δίνει την ακολουθία y n = (1 +
hλ)n , n ≥ 0, για την οποία y n → 0 καθώς n → ∞ αν και μόνο αν |1 + hλ| < 1. Θέτοντας z = λh
βλέπουμε ότι η περιοχή απόλυτης ευστάθειας είναι ο ανοιχτός δίσκος S = {z ∈ C : |1 + z| < 1}.
Η πεπλεγμένη μέθοδος Euler δίνει την ακολουθία προσεγγίσεων y n = (1 − hλ)−n , n ≥ 0, δηλαδή
ικανοποιεί y n → 0 καθώς n → ∞ αν και μόνο αν |(1 − z)−1 | < 1 με z = hλ. Η σχέση αυτή προφανώς
ισχύει για κάθε z ∈ C με Rez < 0, άρα S = C. Τέτοιες μέθοδοι ονομάζονται A-ευσταθείς.
Οι A-ευσταθείς μέθοδοι είναι ιδιαίτερα κατάλληλες για άκαμπτα προβλήματα διαφορικών εξισώσεων που
έχουν ιδιοτιμές λi οπουδήποτε στο Rez < 0.
¹Το ίδιο ισχύει, όπως εύκολα μπορούμε να δούμε χρησιμοποιώντας τη μορφή Jordan A και στη γενική περίπτωση ενός
οποιουδήποτε, όχι αναγκαστικά διαγωνοποιήσιμου πίνακα A ∈ Rm×m .
190 ΕΥΣΤΑΘΕΙΑ ΑΚΑΜΠΤΩΝ ΔΙΑΦΟΡΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
Πολλά άκαμπτα προβλήματα προκύπτουν από την αριθμητική επίλυση μερικών διαφορικών εξισώσεων.
Θεωρούμε, για παράδειγμα, το εξής πρόβλημα αρχικών και συνοριακών τιμών για την εξίσωση της θερμότη-
τας: Ζητάμε u(x, t) πραγματική συνάρτηση ορισμένη για x ∈ [0, 1] και t ∈ [0, T ] τέτοια ώστε
ut = uxx , x ∈ [0, 1] × [0, T ]
u(x, 0) = v(x), x ∈ [0, 1] (12.16)
u(0, t) = u(1, t) = 0, t ∈ [0, T ]
όπου v(x) δοσμένη πραγματική συνάρτηση στο [0, 1] με v(0) = v(1) = 0. Έστω xj = jh, j =
0, 1, . . . , J + 1 ένας ομοιόμορφος διαμερισμός του [0, 1] με βήμα (J + 1)h = 1. Προσεγγίζοντας την
παράγωγο uxx (x, t) με την κεντρική διαφορά (u(x + h, t) − 2u(x, t) + u(x − h, t))/h2 παίρνουμε το
εξής σύστημα συνήθων διαφορικών εξισώσεων για τις προσεγγίσεις uj (t) των τιμών u(xj , t) της λύσης του
(12.16):
′
uj (t) = h2 (uj+1 (t) − 2uj (t) + uj−1 (t)), 1 ≤ j ≤ J, t ∈ [0, T ]
1
Θα εξετάσουμε τώρα την απόλυτη ευστάθεια των μεθόδων Runge-Kutta. Όπως είδαμε, η άμεση μέθοδος Eu-
ler και η πεπλεγμένη μέθοδος Euler μπορούν να θεωρηθούν ως μέθοδοι Runge-Kutta ενός σταδίου. Επίσης η
μέθοδος του τραπεζίου και η άμεση μέθοδος του μέσου είναι και αυτές μέθοδοι που μπορούν να διατυπωθούν
ως μέθοδοι Runge-Kutta.
Δεν είναι δύσκολο να δούμε ότι η μέθοδος του τραπεζίου έχει διάστημα απόλυτης ευστάθειας επίσης το
(−∞, 0), ενώ η άμεση μέθοδος του μέσου² είναι απόλυτα ευσταθής για hλ ∈ (−2, 0).
²Για το πρόβλημα y ′ (t) = f (t) η άμεση μέθοδος του μέσου δίνεται, βέβαια, από τη σχέση y n+1 = y n + f (tn + h2 , y n +
h n n
2 f (t , y )).
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 191
από την οποία προκύπτει ότι |y n | ≤ 1 για κάθε z ∈ C με Rez < 0, βλέπε Άσκηση 12.6.3. Συμπεραίνουμε
ότι και η μέθοδος του τραπεζίου είναι A-ευσταθής.
Θα εξετάσουμε τώρα την απόλυτη ευστάθεια μιας γενικής μεθόδου Runge-Kutta. Αν εφαρμόσουμε τη μέ-
θοδο (10.7)–(10.8) στο πρόβλημα (12.15) έχουμε
X
q
y n,i n
= y + hλ aij y n,j , 1 ≤ i ≤ q, (12.17)
j=1
X
q
n+1 n
y = y + hλ bi y n,i . (12.18)
i=1
από q. Ορίζουμε λοιπόν την r για κάθε μιγαδικό αριθμό z εκτός από το πολύ q σημεία. Χρησιμοποιώντας
παραδείγματος χάριν τον κανόνα του Cramer για να διατυπώσουμε τη λύση ενός γραμμικού συστήματος με
χρήση οριζουσών και αντικαθιστώντας στην (12.19), προκύπτει εύκολα ότι η r(z) είναι ρητή συνάρτηση του
z με βαθμούς αριθμητή και παρονομαστή το πολύ q.
Είναι προφανές από την (12.20) ότι μια μέθοδος Runge-Kutta είναι απόλυτα ευσταθής για κάποιο h αν το
z = hλ είναι τέτοιο ώστε η r(z) να είναι καλά ορισμένη και να ικανοποιεί |r(z)| < 1. Συνεπώς η περιοχή
απόλυτης ευστάθειας S μιας μεθόδου Runge-Kutta μπορεί να ορισθεί ως το σύνολο
Εύκολα μπορούμε να δούμε ότι η ακριβής λύση του προβλήματος (12.15) είναι y(t) = eλt y0 και ότι
Συνεπώς η (12.20) αποτελεί το διακριτό ανάλογο της (12.22) και άρα η συνάρτηση r(z) είναι μια ρητή
προσέγγιση του εκθετικού ez για Rez < 0. Επομένως οι ιδιότητες απόλυτης ευστάθειας της μεθόδου μετα-
φράζονται σε κατάλληλες ιδιότητες της r(z).
Από τον ορισμό της τάξης ακρίβειας μιας μεθόδου Runge-Kutta συμπεραίνουμε ότι αν η μέθοδος (10.7)–
(10.8) έχει τάξη ακρίβειας p, τότε η ποσότητα y(tn+1 ) − r(z)y(tn ) = (ez − r(z))y(tn ) θα πρέπει να είναι
τάξης hp+1 για κάθε n, λ. Θα ικανοποιεί επομένως την αναγκαία συνθήκη
Προφανώς η r(z) είναι αναλυτική σε μια περιοχή του μηδενός. Δεν είναι όμως σωστό ότι η τάξη ακρίβειας
μιας μεθόδου Runge-Kutta που αντιστοιχεί στη ρητή συνάρτηση r(z) είναι p. Η (12.23) είναι ικανή συνθήκη
ώστε η τάξη ακρίβειας της μεθόδου για γραμμικά προβλήματα με σταθερούς συντελεστές να είναι p.
Για τη μέθοδο Euler έχουμε r(z) = 1 + z, ενώ για την πεπλεγμένη μέθοδο Euler r(z) = (1 + z)−1 .
Και για τις δύο μεθόδους έχουμε ez = r(z) + O(z 2 ) σε συμφωνία με τις γνωστές τάξεις ακρίβειας των δύο
μεθόδων. Για τη μέθοδο του τραπεζίου έχουμε r(z) = (1+z/2)/(1−z/2) και βέβαια, ez = r(z)+O(z 2 ).
Τόσο η πεπλεγμένη μέθοδος Euler όσο και η μέθοδος του τραπεζίου είναι A-ευσταθείς μέθοδοι.
Όλες οι άμεσες μέθοδοι Runge-Kutta έχουν πολυωνυμικές συναρτήσεις r(z) με r(0) = 1. Αν μια άμεση
μέθοδος έχει τάξη ακρίβειας p η (12.23) συνεπάγεται ότι η αντίστοιχη r(z) θα είναι αναγκαστικά
Οι περιοχές όπου |r(z)| < 1 για άμεσες μεθόδους με p = 1, 2, 3, 4 φαίνονται στο Σχήμα 12.6. Είναι
φανερό ότι δεν υπάρχει άμεση A-ευσταθής μέθοδος Runge-Kutta. Για τις ημιπεπλεγμένες μεθόδους (10.12)
με q = 2, p = 3, δηλαδή με λ = (1 ± 3−1/2 )/2 έχουμε
1 + (1 − 2λ)z + (1/2 − 2λ + λ2 )z 2
r(z) = .
(1 − λz)2
Οι μέθοδοι αυτοί είναι A-ευσταθείς. Το ίδιο ισχύει για τις μεθόδους Gauss-Legendre. Για τη μέθοδο με q = 2,
δηλαδή την (10.13) έχουμε
1 + z/2 + z 2 /12
r(z) = .
1 − z/2 + z 2 /12
Μπορούμε ακόμα να πούμε ότι μια μέθοδος είναι A-ευσταθής αν S = {z : Rez < 0} και A0 -ευσταθής αν
S ⊃ {z : Rez < 0, Imz = 0}.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 193
Σχήμα 12.6: Περιοχές απόλυτης ευστάθειας των άμεσων μεθόδων Runge-Kutta με τάξεις ακρίβειας p =
1, 2, 3, 4.
Προχωράμε τώρα στη μελέτη της απόλυτης ευστάθειας των γραμμικών πολυβηματικών μεθόδων. Αν εφαρ-
μόσουμε την (11.5) στην εξίσωση (12.15) παίρνουμε την ομογενή εξίσωση διαφορών
X
k
(aj − hλβj )y n+j = 0, n ≥ 0. (12.25)
j=0
Για να ισχύει y n → 0 καθώς n → ∞ για κάποιο h για κάθε λύση της (12.25) με y 0 = 1 πρέπει οι ρίζες
ζi = ζi (hλ), 1 ≤ i ≤ k, του πολυωνύμου
να ικανοποιούν
|ζi | < i, 1 ≤ i ≤ k. (12.27)
Συνεπώς το πρόβλημα του προσδιορισμού της απόλυτης ευστάθειας της μεθόδου (11.5) ανάγεται στη με-
λέτη των ριζών ζi του πολυωνύμου π ως συναρτήσεων της μιγαδικής παραμέτρου hλ, Reλ < 0, και στη
διατύπωση συνθηκών έτσι ώστε να ισχύει η συνθήκη (12.27). Για παράδειγμα, για τη μέθοδο (11.2) έχουμε
p(ζ) = ζ 2 −1, σ(ζ) = 2ζ. Συνεπώς, π(ζ, hλ) = ζ 2 −2hλζ −1 με ρίζες ζ1 , ζ2 τέτοιες ώστε |ζ1 | |ζ2 | = 1
για κάθε hλ ∈ C. Συνεπώς δεν είναι δυνατόν να ισχύει η (12.27) για καμία τιμή του hλ, επομένως η μέθο-
δος (11.2) δεν είναι ποτέ απόλυτα ευσταθής. Το ίδιο συμβαίνει για τη μέθοδο του Simpson (11.4). Αντίθετα,
έχουμε ήδη δει ότι η πεπλεγμένη μέθοδος Euler και η μέθοδος του τραπεζίου είναι A-ευσταθείς.
Οι μέθοδοι Adams-Bashforth και Adams-Moulton έχουν φραγμένες περιοχές απόλυτης ευστάθειας, βλέ-
πε Σχήμα 12.7 και άρα δεν είναι A0 -ευσταθείς. Αντίθετα, μπορούμε να δείξουμε ότι οι μεθόδοι ανάδρομων
διαφορών (BDF) για 1 ≤ k ≤ 6 δεν έχουν φραγμένες περιοχές απόλυτης ευστάθειας. Πιο συγκεκριμένα, η
μέθοδος για k = 2 είναι A-ευσταθής και για 3 ≤ k ≤ 6 είναι A(θ)-ευσταθείς με γωνίες θk , 3 ≤ k ≤ 6 τις
εξής: θ3 ≈ 88◦ , θ4 ≈ 73◦ , θ5 ≈ 51◦ και θ6 ≈ 19◦ , βλέπε Σχήμα 12.8.
Θεώρημα 12.1 (Dahlquist). Δεν υπάρχουν άμεσες A-ευσταθείς πολυβηματικές μέθοδοι. Αν μια πολυβηματική
μέθοδος είναι A-ευσταθής τότε η τάξη ακρίβειας της p είναι το πολύ 2.
Παρατήρηση 12.2. Λόγω του Θεωρήματος 12.1 δεν υπάρχουν A-ευσταθείς πολυβηματικές μέθοδοι μεγα-
λύτερης τάξης του 2, αλλά υπάρχουν A-ευσταθείς μέθοδοι Runge-Kutta οποιασδήποτε τάξης ακρίβειας (π.χ.
οι μέθοδοι Gauss-Legendre με q-στάδια και τάξη ακρίβειας p = 2q.
194 ΕΥΣΤΑΘΕΙΑ ΑΚΑΜΠΤΩΝ ΔΙΑΦΟΡΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
Σχήμα 12.7: Αριστερά: Περιοχές απόλυτης ευστάθειας των k βηματικών μεθόδων Adams-Bashforth με k =
2, 3, 4. Δεξιά: Περιοχές απόλυτης ευστάθειας των k βηματικών μεθόδων Adams-Moulton με k = 2, 3, 4.
Σχήμα 12.8: Περιοχές απόλυτης ευστάθειας των k βηματικών μεθόδων BDF με k = 2, 3, 4, 5, 6. Η BDF
με k = 2 είναι A-ευσταθής. Οι μέθοδοι BDF με k = 3, 4, 5, 6 είναι A(θ)-ευσταθείς, επειδή περιέχουν τον
κώνο Sθ με θ ≈ 86◦ , θ ≈ 73◦ , θ ≈ 52◦ , θ ≈ 18◦ .
Για να δείξουμε ότι μια πολυβηματική μέθοδος είναι A0 -ευσταθής αρκεί να δείξουμε ότι το χαρακτηριστικό
πολυωνύμο π ικανοποιεί τη συνθήκη των ριζών αν οι συντελεστές του είναι πραγματικοί αριθμοί. Ένα αποτέ-
λεσμα που βοηθάει είναι το ακόλουθο Λήμμα 12.1.
i.) b < 1,
ii.) 1 + b + a > 0,
iii.) 1 + b − a > 0.
12.4 B -ευστάθεια
Τα τελευταία χρόνια οι προσπάθειες στην περιοχή της απόλυτης ευστάθειας έχουν στραφεί σε γενικεύσεις της
έννοιας σε άκαμπτα μη γραμμικά προβλήματα ή σε γραμμικά άκαμπτα προβλήματα με μεταβλητούς συντελε-
στές. Τα προβλήματα αυτά έχουν γενικά λύσεις που φθίνουν καθώς αυξάνεται το t αλλά έχουν πολύ μεγάλες
σταθερές Lipschitz έτσι ώστε η θεωρία ευστάθειας που αναπτύχθηκε στις προηγούμενες παραγράφους να
είναι πρακτικά ανεφάρμοστη. Θεωρούμε το μιγαδικό σύστημα μη γραμμικών διαφορικών εξισώσεων
(
y ′ = f (t, y), t ≥ 0,
(12.28)
y(0) = y0
όπου u(t) και f έχουν τιμές στον Cm . Υποθέτουμε ότι το πρόβλημα αρχικών τιμών (12.28) έχει μοναδική
λύση τουλάχιστον τοπικά σε ένα διάστημα [0, T ] και ότι ισχύει
όπου με (·, ·) συμβολίζουμε το ευκλείδειο εσωτερικό γινόμενο στον Cm (και με k · k την παραγόμενη από
αυτό νόρμα). Για δύο λύσεις y(t), v(t) σε ένα διάστημα [t− , t+ ] έχουμε
επομένως παίρνοντας το εσωτερικό γινόμενο με την y(t) − v(t) έχουμε λόγω της (12.29) ότι
d
ky − vk2 = 2Re(y ′ − v ′ , y − v)
dt
= 2Re(f (t, y(t)) − f (t, v(t)), y − v) ≤ 0, t − ≤ t ≤ t+ .
Συνεπώς
ky(t+ ) − v(t+ )k ≤ ky(t− ) − v(t− )k, t − ≤ t+ .
Αξίζει να σημειωθεί ότι η σταθερά Lipschitz της f (αν η f είναι Lipschitz) δεν εμφανίζεται καν στην προη-
γούμενη ανισότητα!
Ορισμός 12.2. Λέμε ότι η μέθοδος (10.7)–(10.8) είναι B-ευσταθής αν, όταν εφαρμοσθεί στο πρόβλημα
(12.28) με την ιδιότητα (12.29), ικανοποιεί
Σημειώνουμε ότι μια B-ευσταθής μέθοδος εφαρμοζόμενη σε μια μιγαδική εξίσωση της μορφής y ′ = λy,
Reλ < 0 δίνει, επειδή ισχύει η (12.29), |y n+1 −v n+1 | ≤ |y n −v n |, οπότε με v n = 0 έχουμε |y n+1 | ≤ |y n |
και επομένως |r(hλ)| ≤ 1 για κάθε h > 0 και λ ∈ C με Reλ < 0. Άρα η μέθοδος είναι A-ευσταθής.
Αποδείξαμε λοιπόν ότι η B-ευστάθεια συνεπάγεται την A-ευστάθεια.
Ορισμός 12.3 (Αλγεβρική ευστάθεια). Μια μέθοδος Runge-Kutta (10.7)–(10.8) λέγεται αλγεβρικά ευστα-
θής αν πληροί τις συνθήκες:
bi ≥ 0, 1 ≤ i ≤ q,
ο πίνακας M με mij = bi aij + bj aji − bi bj , 1 ≤ i, j ≤ q, (12.31)
ικανοποιεί z M z ≥ 0, ∀z ∈ C .
H q
196 ΕΥΣΤΑΘΕΙΑ ΑΚΑΜΠΤΩΝ ΔΙΑΦΟΡΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
Το επόμενο θεώρημα διατυπώνει ικανές και αναγκαίες συνθήκες ώστε η μέθοδος Runge-Kutta που αντι-
στοιχεί στο μητρώο (10.9) να είναι B-ευσταθής.
Θεώρημα 12.2. Aν η μέθοδος Runge-Kutta (10.7)–(10.8) είναι αλγεβρικά ευσταθής, τότε είναι και B-ευσταθής.
Αν επιπλέον υποθέσουμε ότι οι αριθμοί τi , 1 ≤ i ≤ q, είναι διαφορετικοί μεταξύ τους, τότε η μέθοδος Runge-
Kutta (10.7)-(10.8) είναι B-ευσταθής αν και μόνο αν είναι αλγεβρικά ευσταθής.
Απόδειξη. Θα αποδείξουμε μόνο το ικανό για οποιαδήποτε τi , 1 ≤ i ≤ q. Για την απλούστευση της απόδει-
ξης υποθέτουμε ότι το πρόβλημα (12.28) είναι πραγματικό, ότι ισχύει η (12.29), ότι τα (·, ·), k · k είναι το
ευκλείδειο εσωτερικό γινόμενο, αντίστοιχα, νόρμα στον Rn , και ότι xT M x ≥ 0 για κάθε x ∈ Rq .
Θεωρούμε δύο λύσεις y n , y n,i , v n , v n,i των (10.7)-(10.8). Αφαιρώντας έχουμε
X
q
y n,i
−v n,i
=y −v +
n n
aij ϕj , 1 ≤ i ≤ q, (12.32)
j=1
X
q
y n+1
−v n+1
=y −v + n n
bi ϕ i , (12.33)
i=1
όπου θέσαμε
ϕj = h f (tn,j , y n,j ) − f (tn.j , v n.j ) , 1 ≤ j ≤ q. (12.34)
Από την (12.33) έχουμε
X
q
ky n+1
−v n+1 2
k = ky − v k + 2
n n 2
bi (ϕi , y n − v n )
i=1
2
Xq
+ bi ϕi .
i=1
X
q
X
q
X
q
bi (ϕ , y − v ) =
i n n
bi (ϕ , yi n.i
−v )− n,i
bi aij (ϕi , ϕj ),
i=1 i=1 i,j=1
συνεπώς
X
q
ku n+1
−v n+1 2
k = ky − v k + 2n n 2
bi (ϕi , y n,i − v n,i ) (12.35)
i=1
X
q
X
q
+ bi bj (ϕi , ϕj ) − 2 bi aij (ϕi , ϕj ).
i,j=1 i,j=1
X
q
X
q
X
q
i j i j
2 bi aij (ϕ , ϕ ) = bi aij (ϕ , ϕ ) + 2 bj aji (ϕi , ϕj ),
i,j=1 i,j=1 i,j=1
λόγω της συμμετρίας του εσωτερικού γινομένου. Άρα η (12.35), λόγω της υπόθεσης bi ≥ 0 δίνει
X
q
ky n+1
−v n+1 2
k ≤ ky − v k −n n 2
mij (ϕi , ϕj ). (12.36)
i,j=1
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 197
Έστω {ξk }, 1 ≤ k ≤ m, μια ορθοκανονική βάση του Rn ως προς το εσωτερικό γινόμενο (·, ·). Γράφουμε
X
m
(i)
X
m
(j)
i j
ϕ = ck ξ k , ϕ = ck ,
k=1 k=1
έτσι ώστε
X
q
X
q
X
m
(i) (j)
mij (ϕi , ϕj ) = mij ck ck
i,j=1 i,j=1 k=1
XXm q
= (i)
c mij c(j) ≥ 0,
k=1 i,j=1
επειδή xT M x ≥ 0 για κάθε x ∈ Rq . Η προηγούμενη σχέση και η (12.36) συνεπάγονται την (12.30).
λ λ
1
0 0 0
1/2 1/2 1
1/2 1/2
−1/4 0
δεν είναι B-ευσταθής, γιατί M = 0 1/4 για τον οποίο φυσικά υπάρχει 0 6= x ∈ R2 τέτοιο ώστε
xT M x < 0. Οι διαγώνια πεπλεγμένες μέθοδοι (10.12) με q = 2 είναι B-ευσταθείς για λ ≥ 1/4. Ειδι-
κότερα η μέθοδος με λ = (1 + 3−1/2 )/2 είναι B-ευσταθής και έχει τάξη p = 3. Όλες οι μέθοδοι Gauss-
Legendre με q σημεία είναι B-ευσταθείς και έχουν τάξη ακρίβειας p = 2q. Μάλιστα, γι’ αυτές τις μεθόδους
M = 0. Συνεπώς, όλες αυτές οι μέθοδοι είναι κατάλληλες για μη γραμμικά άκαμπτα συστήματα όπως τα
(12.28)–(12.29).
12.5 G-ευστάθεια
Όπως και στην περίπτωση των μεθόδων Runge-Kutta, θεωρούμε το μιγαδικό σύστημα μη γραμμικών διαφο-
ρικών εξισώσεων (
y ′ = f (t, y), t ≥ 0,
(12.37)
y(0) = y0
όπου y(t) και f έχουν τιμές στον Cm . Υποθέτουμε ότι το πρόβλημα αρχικών τιμών (12.37) έχει μοναδική
λύση τουλάχιστον τοπικά σε ένα διάστημα [0, T ] και ότι ισχύει
όπου με (·, ·) συμβολίζουμε το ευκλείδειο εσωτερικό γινόμενο στον Cm (και με k · k την παραγόμενη από
αυτό νόρμα).
198 ΕΥΣΤΑΘΕΙΑ ΑΚΑΜΠΤΩΝ ΔΙΑΦΟΡΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
Στις μεθόδους Runge-Kutta για να ικανοποιείται η B-ευστάθεια ζητούμε οι δύο λύσεις y n , v n ενός προ-
βλήματος που ικανοποιεί τη μονόπλευρη συνθήκη του Lipschitz (12.38) να ικανοποιούν την ανισότητα
ky n+1 − v n+1 k ≤ ky n − v n k, n ≥ 0.
Για τις πολυβηματικές μεθόδους δεν έχει νόημα να απαιτήσουμε να ικανοποιούν μια τέτοια ανισότητα, γιατί η
προσέγγιση y n+1 εξαρτάται και από άλλες προσεγγίσεις εκτός από την προηγούμενη y n .
Θεωρούμε μια k-βηματική μέθοδο (11.5) που περιγράφεται από τις σταθερές αk , . . . , α0 , βk , . . . , β0 και
υποθέτουμε ότι οι σταθερές έχουν κανονικοποιηθεί έτσι ώστε βk + · · · + β0 = 1, το οποίο είναι εφικτό
για όλες τις ευσταθείς και συνεπείς πολυβηματικές μεθόδους. Ακόμα θεωρούμε ότι τα πολυώνυμα ρ και σ
δεν έχουν κοινές ρίζες, είναι δηλαδή ανάγωγα μεταξύ τους. Τότε για k-βηματική μέθοδο (11.5) αντιστοιχεί η
ακόλουθη πολυβηματική μέθοδος
X
k X
k
GX = ( g1j xj , . . . , gkj xj )T .
j=1 j=1
Επίσης συμβολίζουμε με (·, ·), h·, ·i τα ευκλείδεια εσωτερικά γινόμενα στον Rn και (Rn )k , οπότε
X
k
hGX, Y i = gij (xi , y j ).
i,j=1
Αν ο πίνακας G είναι συμμετρικός και θετικά ορισμένος, τότε το < G·, · > ορίζει ένα εσωτερικό γινόμενο
στον (Rn )k με παραγόμενη νόρμα k · kG ,
Ορισμός 12.4. Η μονοσκελής μέθοδος (12.39) λέγεται G-ευσταθής, αν υπάρχει συμμετρικός και θετικά
ορισμένος πίνακας G ∈ Rk×k τέτοιος ώστε
kY n+1 − Z n+1 kG ≤ kY n − Z n kG ,
για κάθε h > 0 και για όλα τα προβλήματα αρχικών τιμών (12.37) για τα οποία ικανοποιείται η (12.38).
είναι συμμετρικός και θετικά ορισμένος και αν y n , z n δύο λύσεις για το πρόβλημα (12.37) με τη διβηματική
μέθοδο BDF, τότε μπορούμε να δείξουμε ότι
kY n+1 − Z n+1 kG ≤ kY n − Z n kG .
Το αντικείμενο αυτού του κεφαλαίου υπάρχει πιο αναλυτικά σε βιβλία με αντικείμενο την αριθμητική λύση
συνήθων διαφορικών εξισώσεων. Παραθέτουμε κάποιες αναφορές τις οποίες ο αναγνώστης μπορεί να συμ-
βουλευτεί: [1], [2], [3], [4], [5], [6], [7], [8].
12.6 Ασκήσεις
12.6.1 Βρείτε τα διαστήματα απόλυτης ευστάθειας για τις άμεσες μεθόδους Runge-Kutta τάξης p = 2, 3 και
4.
0 0 0 0 0 0 0 0
1/3 0 0 1/3 1/2 0 0 1/2
0 2/3 0 2/3 −1 2 0 1
1/4 0 3/4 1/6 2/3 1/6
12.6.4 Για τις παρακάτω μεθόδους Runge-Kutta βρείτε την αντίστοιχη συνάρτηση ευστάθειας r και προσδιο-
ρίστε τα διαστήματα απόλυτης ευστάθειάς τους
0 0 0 0
0 0 0 1/6 0 0
1/4 1/4 0 1/2
1/3 1/3 2/3 2/3 1/6 5/6 .
0 1 0 1
1/4 3/4 1/2 1/2
1/6 2/3 1/6
i.) b < 1,
ii.) 1 + b + a > 0,
iii.) 1 + b − a > 0.
h
y n+2 − y n+1 = 5f n+2 + 8f n+1 − f n .
12
12.6.7 Δείξτε για τη μέθοδο ανάδρομων διαφορών με k βήματα της Άσκησης 11.7.8 ότι: (α) Για k = 2 είναι
A-ευσταθής. (β) Για k = 3 είναι A0 -ευσταθής αλλά όχι A-ευσταθής.
12.6.8 Δείξτε ότι η μια άμεση πολυβηματική μέθοδος δεν μπορεί να είναι A0 -ευσταθής.
200 ΕΥΣΤΑΘΕΙΑ ΑΚΑΜΠΤΩΝ ΔΙΑΦΟΡΙΚΩΝ ΕΞΙΣΩΣΕΩΝ
h n+2
y n+2 − y n+1 = (f + 2f n+1 + f n )
4
είναι A0 -ευσταθής.
12.6.10 Δείξτε ότι όλες οι συγκλίνουσες πολυβηματικές μέθοδοι που ανήκουν στην οικογένεια μεθόδων
h
y n+2 + (θ − 2)y n+1 + (1 − θ)y n = ((6 + θ)f n+2 + 3(θ − 2)f n ), θ ∈ R,
4
είναι A0 -ευσταθείς.
12.6.11 Δείξτε ότι για μια k−βηματική μέθοδο είναι αναγκαίο βk /αk > 0 ώστε να είναι A(θ)-ευσταθής.
12.6.13 Δείξτε ότι οι διαγώνια πεπλεγμένες μέθοδοι που ορίσαμε στην (10.12) με q = 2 είναι B-ευσταθείς
για λ ≥ 1/4.
Βιβλιογραφία
[1] K. E. Atkinson, W. Han και D. E. Stewart. Numerical Solution of Ordinary Differential Equations.
English. Hoboken, NJ: John Wiley & Sons, 2009, σσ. xii + 252. isbn: 978-0-470-04294-6.
[2] J.C. Butcher. The Numerical Analysis of Ordinary Differential Equations. Hoboken, New Jersey: John
Wiley & Sons, 1987.
[3] K. Dekker και J. G. Verwer. Stability of Runge-Kutta Methods for Stiff Nonlinear Differential Equations.
English. 1984.
[4] C. W. Gear. Numerical Initial Value Problems in Ordinary Differential Equations. English. Englewood
Cliffs, NJ: Prentice-Hall, 1971.
[5] E. Hairer και G. Wanner. Solving Ordinary Differential Equations. II: Stiff and Differential-Algebraic
Problems. English. Τόμ. 14. Berlin: Springer, 2010, σσ. xvi + 614. isbn: 978-3-642-05220-0. doi:
10.1007/978‐3‐642‐05221‐7.
[6] A. Iserles. A First Course in the Numerical Analysis of Differential Equations. English. 2nd ed. Camb.
Texts Appl. Math. Cambridge: Cambridge University Press, 2009. isbn: 978-0-521-73490-5. doi:
10.1017/CBO9780511995569.
[7] J. D. Lambert. Numerical Methods for Ordinary Differential Dystems: The Initial Value Problem. En-
glish. Chichester etc.: John Wiley &| Sons, 1991, σσ. x + 293. isbn: 0-471-92990-5.
[8] Γ. Δ. Ακρίβης και Β.Α. Δουγαλής. Αριθμητικές Μέθοδοι για Συνήθεις Διαφορικές Εξισώσεις. Πανεπι-
στημιακές Εκδόσεις Κρήτης, 2015.
Μέρος III
ΠΑΡΑΡΤΗΜΑ
ΚΕΦΑΛΑΙΟ 13
X
n
(k)
X
n
(k)
(Ae )i = aij ej = aij δkj = aik , i = 1, . . . , m,
j=1 j=1
X
n
(aTi B)j = Aik Bkj , j = 1, . . . , p,
k=1
X
n
(AB)ij = Aik Bkj , 1 ≤ i ≤ m, 1 ≤ j ≤ p,
k=1
δηλαδή, ο AAH είναι ερμιτιανός. Η απόδειξη ότι ο AH A είναι ερμιτιανός είναι εξίσου εύκολη.
1.7.7 (σελ. 22): Αρκεί να πάρουμε A1 = (A + AH )/2 και A2 = (A − AH )/2.
1.7.8 (σελ. 22): Το αποτέλεσμα προκύπτει από το γεγονός ότι αν A = P + iQ με P, Q ∈ Rn×n τότε
AH = P T + īQT = P T − iQT . Αν AH = A, τότε αναγκαστικά P = P T και QT = −Q.
1.7.9 (σελ. 23): Όλες οι ζητούμενες σχέσεις αποδεικνύονται εύκολα με χρήση του ορισμού του αντίστρο-
φου πίνακα.
1.7.10 (σελ. 23): Παρατηρούμε ότι
−1 A−1 uv T A−1
T
(A + uv ) A −
1 + v T A−1 u
A−1 uv T A−1 T −1
−1
T A uv A
T −1
=I −A + uv A − uv
1 + v T A−1 u 1 + v T A−1 u
uv T A−1 T −1 T −1 uv T A−1
=I− + uv A − v A u
1 + v T A−1 u 1 + v T A−1 u
uv T A−1
= I − (1 + v T A−1 u) + uv T A−1
1 + v T A−1 u
= I.
1.7.12 (σελ. 23): Με τον ίδιο τρόπο όπως και στην απόδειξη του τύπου των Sherman-Morrison.
1.7.13 (σελ. 23): Η απόδειξη γίνεται επαγωγικά. Η προς απόδειξη σχέση είναι προφανής για k = 1. Αν
αυτή ισχύει για κάποιο m ≥ 1 τότε
(uv T )m+1 = (uv T )m (uv T ) = (uT v)m−1 uv T (uv T ) = (uT v)m−1 (v T u)uv T = (uT v)m uv T .
1.7.14 (σελ. 23): Έστω ότι ο πίνακας I − A δεν είναι αντιστρέψιμος. Τότε υπάρχει x ∈ Cn , x 6= 0,
τέτοιο ώστε (I − A)x = 0, δηλαδή x = Ax. Τότε,
σχέση από την οποία προκύπτει η αντίφαση x = 0. Συνεπώς, ο πίνακας I − A είναι αντιστρέψιμος. Θέτουμε
B = (I − A)−1 (I + A). Τότε,
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 205
από την οποία προκύπτει ότι kxk2 ≤ kxk1 . Ακόμα, χρησιμοποιώντας την ανισότητα Cauchy-Schwarz για
αθροίσματα έχουμε
!2 ! !
Xm Xn Xn
kxk21 = |xi | ≤ 12 |xi |2 = nkxk22 ,
i=1 i=1 i=1
√
το οποίο δείχνει ότι kxk1 ≤ nkxk2 και ολοκληρώνει την απόδειξη της (1.5). Ακόμα, για το διάνυσμα
x = [1, 0, . . . , 0]T ∈ Cn έχουμε
√ kxk1 = kxk2 = √
1, ενώ για το διάνυσμα x = [1, 1, . . . , 1]T ∈ Cn
έχουμε kxk1 = n και kxk2 = n, δηλαδή kxk1 = nkxk2 . Οι άλλες δύο σχέσεις ισοδυναμίας νορμών
αποδεικνύονται παρόμοια.
1.7.19 (σελ. 23): Για x ∈ Cn έχουμε
X
n X
n X
n
kxk22 = |xi |2 ≤ kxk∞ |xi | = kxk∞ |xi | = kxk∞ kxk1 ,
i=1 i=1 i=1
(I − 2P )H (I − 2P ) = I − 2P H − 2P + 4P H P = I − 4P + 4P = I.
1.7.24 (σελ. 23): Αν A ∈ Cm×n και 1 ≤ i1 < · · · < ir ≤ m, 1 ≤ j1 < · · · < js ≤ n, τότε ο
πίνακας B ∈ Cr×s με στοιχεία Bpq = Aip jq είναι υποπίνακας του A. Για τη νόρμα k · k2 και για z ∈ Cs ,
z 6= 0, έχουμε
2 2
X
r X
r X
s X
r X
s
kBzk22 = (Bz)2p = Bpq zq = Aip jq zq .
p=1 p=1 q=1 p=1 q=1
Αν z̃ ∈ Cn είναι το διάνυσμα το οποίο συμφωνεί με το z για τους δείκτες {j1 , . . . , js } και τα στοιχεία του
είναι ίσα με μηδέν για τους υπόλοιπους δείκτες, τότε μπορούμε να γράψουμε
X
s X
n
Ai p j q z q = Aip j z̃j ,
q=1 j=1
και επομένως,
2 2
X
r X
n X
m X
n
kBzk22 = Aip j z̃j ≤ Aij z̃j = kAz̃k22 .
p=1 j=1 i=1 j=1
Μια και kzk2 = kz̃k2 έχουμε αμέσως ότι kBk2 ≤ kAk2 . Οι αντίστοιχες σχέσεις για άλλες νόρμες Hölder
προκύπτουν με ανάλογο τρόπο.
1.7.25 (σελ. 23): Έστω 1 ≤ p < ∞. Έχουμε
!1/p !1/p
X
n X
n
kDkp = maxn kDxkp = maxn |dii xi | p
≤ max |dii | maxn |xi | p
x∈C x∈C 1≤i≤n x∈C
∥x∥p =1 ∥x∥p =1 i=1 ∥x∥p =1 i=1
= max |dii |.
1≤i≤n
Αν τώρα s ∈ {1, . . . , n} είναι τέτοιο ώστε |dss | = max1≤i≤n |dii | τότε για το διάνυσμα es ∈ Cn
με es,j = δsj , 1 ≤ j ≤ n, τότε kes kp = 1 και kDes kp = |dss | = max1≤i≤n |dii |. Συνεπώς
kDkp ≥ max1≤i≤n |dii |. Η απόδειξη για την περίπτωση p = ∞ γίνεται με παρόμοιο τρόπο.
1.7.26 (σελ. 23): Προκύπτει άμεσα από τη σχέση I = AA−1 , την πολλαπλασιαστική ιδιότητα των νορ-
μών Ηölder και το γεγονός ότι kIkp = 1.
1.7.27 (σελ. 23): Για A ∈ Cm×n έχουμε
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 207
X
n X
n X
n
kA k1 = max
H
|(A )ij | = max
H
|aji | = max |aji | = kAk∞ .
1≤j≤m 1≤j≤m 1≤j≤m
i=1 i=1 i=1
1.7.28 (σελ. 23): Από το Λήμμα 1.9 έχουμε kU Ak2 = kAk2 . Τώρα, χρησιμοποιώντας το γεγονός ότι
αν V είναι μοναδιαίος πίνακας, τότε για z ∈ Cn ισχύει kV zk2 = kzk2 , λαμβάνουμε
Η δεύτερη προς απόδειξη σχέση είναι προφανής αν x = 0 ή/και y = 0. Υποθέτουμε λοιπόν ότι x, y 6= 0.
Η διάσταση του ορθογώνιου συμπληρώματος του χώρου που παράγεται από το διάνυσμα y είναι n − 1. Αν
v1 , . . . , vn−1 είναι μια βάση του, τότε xy T vi = (y T vi )x = 0, i = 1, . . . , n − 1. Συνεπώς η ιδιοτιμή 0 έχει
πολλαπλότητα n−1 και δεν υπάρχουν άλλες ιδιοτιμές εκτός από αυτή και την y T x, γιατί (xy T )x = (y T x)x.
Συνεπώς kxy T k2 ≤ |xT y| ≤ kxk2 kyk2 . Αν το x είναι πολλαπλάσιο του y τότε η ανισότητα Cauchy-
Schwarz ισχύει ως ισότητα, επομένως kxy T k2 = kxk2 kyk2 .
2
X
m X
m X
n
kAxk22 = (Ax)2i = aij xj
i=1 i=1 j=1
! !
X
m X
n X
n
≤ |aij |2 |xj |2
i=1 j=1 j=1
X
m 2
≤ n max |aij | kxk22
j
i=1
2
≤ nm max |aij | kxk22 ,
i,j
√
από την οποία προκύπτει ότι kAk2 ≤ nm maxi,j |aij |. Τώρα, αν a(l) είναι η l στήλη του A, τότε ka(l) k2 ≤
(l)
kAk2 . Πράγματι, αν e(l) ∈ Cn είναι τέτοιο ώστε ei = δil , i = 1, . . . , n, τότε kAk2 ≥ kAe(l) k2 =
208 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
Έστω τώρα kP k2 = 1 και P δεν είναι ορθογώνιος. Τότε θα έχουμε ότι R(I − P ) και R(P ) δεν είναι
ορθογώνια μεταξύ τους. Επομένως υπάρχει kak2 = 1, a ∈ R(P ) και a⊥R(I − P ) και
kAxk1 nkAxk∞
kAk1 = sup ≤ sup = nkAk∞ .
x∈Rn kxk1 x∈Rn kxk∞
Παρόμοια παίρνουμε
kAxk1 kAxk∞ 1
kAk1 = sup ≥ sup = kAk∞ .
x∈Rn kxk1 x∈Rn nkxk∞ n
και
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 209
1 √
√ kAk2 ≤ kAk1 ≤ nkAk2 .
n
2.6.3 (σελ. 38): Αν ο πίνακας A είναι θετικά ορισμένος τότε xT Ax > 0 για κάθε μη μηδενικό x ∈ Rn .
Επιπλέον xT Ax = 0 μόνο αν x = 0. Ικανοποιείται λοιπόν το πρώτο από τα αξιώματα της νόρμας. Μια και
για λ ∈ R έχουμε kλxk2 = (λx)T A(λx) = λ2 xT Ax, δηλαδή kxk = |λ|kxk ισχύει το δεύτερο από τα
αξιώματα της νόρμας. Επίσης επειδή
= (kxk + kyk)2 ,
ισχύει το τρίτο από τα αξιώματα της νόρμας. Συμπεραίνουμε λοιπόν ότι η απεικόνιση k · k είναι νόρμα στον
Rn .
2.6.4 (σελ. 38): Παρατηρούμε ότι
Τώρα, ο πίνακας A είναι συμμετρικός και επομένως kAk2 = 4, η μεγαλύτερη ιδιοτιμή. Ακόμα,
5/8 1/4 1/8
A−1
=
1/4 1/2 1/4
1/8 1/4 5/8
210 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
με kA−1 k2 = 1 και
0 0 0
δA =
0
0 −0.1
0 −0.1 0
√ √
επομένως kδAk2 = 0.1. Τέλος kδbk2 = 641/100 και kbk2 = 3 οπότε
√
kδbk2 641
= √ .
kbk2 100 3
Τότε,
( √ )
κ(A) kδAk kδbk 4 0.1 641
+ = + √ ≈ 0.76,
1 − kA−1 kkδAk kAk kbk 1 − 1 · 0.1 4 100 3
kδxk2 kδbk2
≤ κ2 (A) .
kxk2 kbk2
Αφού ο A είναι συμμετρικός, έχουμε kAk2 = ρ(A) = 10 και kA−1 k2 = ρ(A−1 ) = 1. Τώρα κ2 (A) =
kAk2 kA−1 k2 = 10, επομένως
kδxk2 kδbk2
≤ 10 .
kxk2 kbk2
2.6.9 (σελ. 39): Έστω x ∈ Rn , x 6= 0. Θέτουμε y = A−1 x. Τότε y 6= 0 και επειδή ο A−1 είναι επίσης
συμμετρικός έχουμε
το οποίο δείχνει ότι ο A−1 είναι θετικά ορισμένος. Έστω τώρα B ένας (m − k + 1) × (m − k + 1) πίνακας
με στοιχεία
bij = ai+k−1,j+k−1 , 1 ≤ i, j ≤ m − k + 1.
Επειδή x 6= 0 έχουμε e 6= 0 και επομένως eT Ae > 0, γιατί ο A είναι θετικά ορισμένος. Αυτό δείχνει
ότι και ο B είναι θετικά ορισμένος.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 211
Για το τελευταίο ερώτημα της άσκησης γνωρίζουμε ότι αν ο A ∈ Rn×n είναι θετικά ορισμένος τότε aii > 0,
i = 1, . . . , n. Η προς απόδειξη πρόταση ισχύει προφανώς για k = 1. Υποθέτουμε τώρα ότι 1 < k ≤ n.
Ο υποπίνακας του A που αποτελείται από τα στοιχεία με δείκτες 1 ≤ i, j ≤ k είναι συμμετρικός και θετικά
ορισμένος. Αν το μέγιστο στοιχείο του είναι το |apq | = |aqp | για κάποιους δείκτες 1 ≤ p < q ≤ k θεωρούμε
το διάνυσμα e ∈ Rk με στοιχεία
1 j=p
ej =
−1 j = q
0 διαφορετικά
τότε eT Ae = app + aqq − 2apq < 0, το οποίο είναι σε αντίφαση με το γεγονός ότι ο A είναι θετικά ορισμέ-
νος. (Σε περίπτωση που apq < 0 το ίδιο αποτέλεσμα ισχύει με −e στη θέση του διανύσματος e).
2.6.10 (σελ. 39): Αν x ∈ Rn τότε
και xT Ax = 0 αν και μόνο αν Lx = 0. Όμως ο L, ως τριγωνικός πίνακας με θετικά διαγώνια στοιχεία, είναι
αντιστρέψιμος. Επομένως x = 0.
Αυτό δείχνει ότι xT Ax > 0 για κάθε x ∈ Rn , x 6= 0, δηλαδή ότι ο A είναι θετικά ορισμένος.
2.6.11 (σελ. 39): Προκύπτει άμεσα από τον Ορισμό 2.2 και τις ιδιότητες του εσωτερικού γινομένου.
2.6.12 (σελ. 39): Επειδή A = LLT , τότε det(A) = det(L) det(LT ) = det(L)2 . Αφού L και
U είναι τριγωνικοί πίνακες
Q τότε η ορίζουσά τους ειναι το γινόμενο των διαγώνιων στοιχείων τους. Συνεπώς
det(A) = det(L)2 = ni=1 (lii )2 .
2.6.13 (σελ. 39): Για x ∈ Rn εύκολα βλέπουμε ότι
Συνεπώς, αν a ≥ 2 ο πίνακας A είναι θετικά ορισμένος. Εφαρμόζοντας τον αλγόριθμο της ανάλυσης Chole-
sky στον πίνακα A έχουμε διαδοχικά
L11 = 1, L21 = −1, L22 = (a − 1)1/2 , L31 = 0, L32 = −(a − 1)−1/2 και L33 = (a − (a − 1)−1 )1/2 ,
δηλαδή
1 0 0
L=
−1 (a − 1) 1/2
.
0
−1/2 −1 1/2
0 −(a − 1) (a − (a − 1) )
Λύνουμε τώρα τα γραμμικά συστήματα Au(i) = e(i) , i = 1, 2, 3, όπου {e(1) , e(2) , e(3) } είναι η κανονική
βάση του R3 χρησιμοποιώντας την ανάλυση Cholesky, δηλαδή
έτσι ώστε
a2 − 1 a 1
1
A−1 = 2 .
a −a−1
a a 1
−1 1 a−1
2.6.14 (σελ. 39): Είναι εύκολο να δείξουμε (επαγωγικά) ότι A = LLT όπου L είναι ο κάτω τριγωνικός
πίνακας
1 0 0 ··· 0
1 1 0 ··· 0
L = 1 1 1 ··· 0 .
.. .. .. ... ..
. . . .
1 1 1 ··· 1
Αφού ο L είναι κάτω τριγωνικός με θετικά διαγώνια στοιχεία, ο πίνακας A = LLT είναι θετικά ορισμένος
και L είναι ο πίνακας της ανάλυσης Cholesky.
3.5.1 (σελ. 59): Έστω µ ιδιοτιμή του P −1 N , τότε υπάρχει ιδιοδιάνυσμα v 6= 0 τέτοιο ώστε
P −1 N v = µv,
επομένως
N v = P v = (A + N )v ή Av = 0,
Επομένως
−1 + µ < 2µ < 1 − µ
Οπότε αφού βρήκαμε μια φυσική νόρμα πινάκων για την οποία kT k∞ < 1 και επειδή ρ(T ) < kT k∞ < 1,
έχουμε ότι η επαναληπτική μέθοδος θα συγκλίνει.
Για τον δεύτερο πίνακα έχουμε kT k∞ = max{5/3 + 4/3, 7/6 + 5/6} = max{9/3, 12/6} = 3 > 1.
Aφού για τη φυσική νόρμα πινάκων έχουμε kT k∞ > 1 και επειδή ρ(T ) < kT k∞ δεν γνωρίζουμε αν
ρ(T ) < 1, οπότε δεν γνωρίζουμε με βάση αυτήν την πληροφορία αν η επαναληπτική μέθοδος θα συγκλίνει.
3.5.4 (σελ. 60): Έχουμε τη διάσπαση A = D − L − U με
0 −α −α
D = I, L + U = −α 0 −α .
−α −α 0
Το χαρακτηριστικό πολυώνυμο του TJ είναι det(TJ − λI) = −(λ − α)(λ2 + α − 2α2 ), το οποίο έχει
ρίζες λ = α και λ = −2α. Επομένως για 1 ≤ 2α < 2 η μέθοδος Jacobi αποκλίνει.
Ο πίνακας επανάληψης της μεθόδου Gauss-Seidel είναι TGS = (D − L)−1 U . Έχουμε ότι
1 0 0
(D − L)−1 = −α 1 0 .
α(α − 1) −α 1
Οπότε
214 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
1 0 0 0 −α −α
TGS = (D − L)−1 U = −α 1 0 0 0 −α
α(α − 1) −α 1 0 0 0
0 −α −α
= 0 α2 α(α − 1) .
0 −α (α − 1) −α2 (α − 2)
2
Το χαρακτηριστικό πολυώνυμο του TGS είναι det(TGS − λI) = −λ(α3 + α2 (α − 3)λ + λ2 ). Άρα
οι ιδιοτιμές του TGS είναι λ = 0 και οι ρίζες του α3 + α2 (α − 3)λ + λ2 . Μπορούμε να δούμε ότι η δια-
κρίνουσα ∆ του α3 + α2 (α − 3)λ + λ2 είναι αρνητική, οπότε έχει 2 μιγαδικές ρίζες λ1 , λ2 τέτοιες ώστε
|λ1 | = |λ2 |, με λ1 λ2 = |λ1 |2 = α3 .
Συνεπώς για 1 ≤ 2α < 2 έχουμε ότι |λ1 | < 1, η μέθοδος Gauss-Seidel συγκλίνει.
3.5.12 (σελ. 61): Εύκολα βλέπουμε ότι ο πίνακας επανάληψής της είναι
−1 0 −4
TJ = D (L + U ) = .
−4 0
Συνεπώς, λόγω του Θεωρήματος 3.7 η μέθοδος SOR συγκλίνει για κάθε ω ∈ (0, 2). Oπότε, επειδή για
ω = 1 οι μέθοδοι SOR και Gauss-Seidel ταυτίζονται, θα συγκλίνει και η μέθοδος Gauss-Seidel. Στη συ-
νέχεια χρησιμοποιώντας το Θεώρημα 3.4, επειδή ο A είναι τριδιαγώνιος και η Gauss-Seidel συγκλίνει θα
συγκλίνει και η Jacobi.
Στη συνέχεια σχηματίζουμε τον πίνακα επανάληψης της μεθόδου SOR. Ξεκινώντας από τη διάσπαση του
A = D − L − U έχουμε ότι Tω = (D − ωL)−1 ((1 − ω)D + ωU ).
2 0 0 2(1 − ω) ω 0
D − ωL =
και (1 − ω)D + ωU = .
−ω 2 0 0 2(1 − ω) ω
0 −ω 2 0 0 2(1 − ω)
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 215
Για να εκτελέσουμε μια επανάληψη της μεθόδου SOR πρέπει να υπολογίζουμε το x(1) ,
− 1 5 0
2 4
1 3
((1 − ω)D + ωU )x(0)
= 4
5 = 3 .
0 − 1
2 4
1 4
1 − 21
0 0 − 21
Επομένως
2x1 = 13
x1 =
13
4 8
ή
− 54 x1 + 2x2 = 84
x2 = 13
4
5
− 4 x2 + 2x3 = − 21 x3 = 13
8
.
(r(k−1) , r(k−1) )
3.5.18 (σελ. 61): Έχουμε ότι r (k)
=r (k−1)
− ak Ar (k−1)
με ak = . Επομένως
(Ar(k−1) , r(k−1) )
(r(k−1) , r(k−1) )
= (r(k−1) , r(k−1) ) − (Ar(k) , r(k−1) ) = 0.
(Ar(k−1) , r(k−1) )
216 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
Επίσης x(k+1) − x(k) = ak+1 r(k) και x(k) − x(k−1) = ak r(k−1) , οπότε
√ √ √ √
4.3.1 (σελ. 68): Παίρνουμε d = 12 + 2 2 = 5 και c = cos θ = 1/ 5, s = sin θ = 2/ 5.
Ορίζουμε
1 0 0 0
0 c 0 s
Q=
0 0 1 0
0 −s 0 s
√
έτσι ώστε Qx = (1, 2 5, 3, 0)T .
4.3.2 (σελ. 69): Έστω x = (5, 12)T η πρώτη στήλη του πίνακα
5 9
.
12 7
Υπολογίζουμε έναν μετασχηματισμό Householder P τέτοιον ώστε P x να είναι πολλαπλάσιο του e1 . Γνωρί-
ζουμε ότι αρκεί να πάρουμε v = x + kxk2 e1 , δηλαδή v = (18, 12)T έτσι ώστε
18 12
2 1 .
P =I− vv T = I −
vT v 13
12 8
Τότε
5 9
P = R = 1 −169 −129
13
12 7
0 −73
έτσι ώστε
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 217
!
∂ϕ Xn Xn X
n
∂xj X X ∂xj
n n
= aij xj aij − bi aij
∂xk i=1 j=1 j=1
∂xk i=1 j=1
∂xk
X
n X
n X
n
= aik aij xj − aik bi
i=1 j=1 i=1
X
n X
n
= (A )ki (Ax)i −
T
(AT )ki bi
i=1 i=1
Η λύση του συστήματος των κανονικών εξισώσεων AT Ax = AT b είναι τώρα x = (−1, 1)T .
4.3.7 (σελ. 69): Ο πίνακας AT A είναι
1 0 1
2 0 0
1 1 0 0 1 0 −1
T
A A= = .
0 0 1 1 0 2 0
1 −1 1 1 0 1 1
0 0 4
0 1 −1
Επίσης
1
2
1 1 0 0 1
T
A b= = .
0 0 1 1
2
1 −1 1 1
1
0
1
Για χρησιμοποιήσουμε τον αλγοριθμο QR κατασκευάζουμε τους πίνακες Q και R ακολουθώντας τον αλ-
γόριθμο Gram-Schmidt. Θέτουμε τις στήλες του πίνακα A ως τα διανύσματα a1 , a2 , a3 , αντίστοιχα.
Στο πρώτο βήμα του αλγορίθμου υπολογίζουμε τα r11 και q1 . Έχουμε r11 = ka1 k2 = k(1, 1, 0, 0)T k2 =
√
2, οπότε q1 = √12 (1, 1, 0, 0)T .
Στο επόμενο βήμα έχουμε√r12 = (a2 , q1 ) = 0. Στη συνέχεια θέτουμε v = a2 − r12 q1 = a2 , και
r22 = kvk2 = ka2 k2 = 2. Οπότε q2 = √12 (0, 0, 1, 1)T .
Τέλος στο 3ο βήμα έχουμε r13 = (a3 , q1 ) = 0 και r23 = 0. Οπότε v = a3 − r13 q1 − r23 q2 = a3
και r33 = kvk2 = ka3 k2 = 2. Οπότε q3 = 12 (1, −1, 1, −1)T . Συνεπώς έχουμε
√
1 2 0 0
0 √12
Q = 1 0 − √12
, R= √ .
0 2 0
0 1 √2
1
0 1 − √12
0 0 2
T T
√ √
Στη συνέχεια λύνουμε το γραμμικό
√ √ σύστημα Rx = Q b. Επειδή Q b = ( 2, 2, 0)T , εύκολα λαμβά-
T T
νουμε από Rx = Q b = ( 2, 2, 0) ότι x1 = 1, x2 = 1, x3 = 0.
4.3.8 (σελ. 69): Το σύστημα των κανονικών εξισώσεων είναι το
2 2 2 x1 2
T T
A Ax = A b =⇒ = ,
2 3 3 x 2 3
2 3 4 x3 4
με λύση x = (0, 0, 1)T . Εκτελώντας τα βήματα της ανάλυσης QR όπως στην προηγούμενη άσκηση παίρ-
νουμε
√
− 2/2 0 0
√ √ √
2 − 2 2
√
2/2 0 0
Q=
, R=
0
.
1 1
0 1 0
0 0 1
0 0 1
Επιλύοντας το σύστημα Rx = QT b λαμβάνουμε ξανά την ίδια λύση όπως στο σύστημα των κανονικών εξι-
σώσεων.
4.3.9 (σελ. 70): Το σύστημα των κανονικών εξισώσεων είναι το
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 219
4 8 4 x1 2
A Ax = A b =⇒
T T
8 20 16 x2 = 6 ,
4 16 24 x3 8
με λύση x = (1, −1/2, 1/2)T . Εκτελώντας τα βήματα της ανάλυσης QR όπως στην προηγούμενη άσκηση
παίρνουμε
−1/2 −1/2 −1/2
−2 −4 −2
−1/2 −1/2 1/2
Q=
,
R =
0 −2 −4 .
−1/2 1/2 −1/2
0 0 −2
1/2 −1/2 −1/2
Επιλύοντας το σύστημα Rx = QT b λαμβάνουμε ξανά την ίδια λύση όπως στο σύστημα των κανονικών εξι-
σώσεων.
4.3.10 (σελ. 70): Ο πρώτος ισχυρισμός του λήμματος έπεται αμέσως, κάνοντας χρήση του γεγονότος
ότι q = Vn−r z ∈ N (A). Αν y1 , y2 είναι δύο λύσεις του προβλήματος ελαχίστων τετραγώνων, τότε από το
πρώτο αποτέλεσμα έχουμε ότι y1 = A† b + q1 και y2 = A† b + q2 για κάποια q1 , q2 ∈ N (A).
Επομένως Ay1 = AA† b = Ay2 και οι δύο λύσεις έχουν το ίδιο υπόλοιπο
Από το γεγονός ότι το υπόλοιπο κάθε λύσης του προβλήματος ελαχίστων τετραγώνων έχει υπόλοιπο r =
(I − AA† )b και θεωρώντας την ανάλυση SVD του A
Σr 0
A=U V H
0 0
Αυτό δίνει ότι AH (I − AA† ) = 0 και AH r = 0, δηλαδή το σύστημα των κανονικών εξισώσεων. Τέλος
θυμόμαστε ότι κάθε λύση του προβλήματος ελαχίστων τετραγώνων έχει τη μορφή
−1 H
Σr Ur b
y=V ,
z
220 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
kyk22 = kΣ−1 H 2 2 −1 H 2 −1 H 2 † 2
r Ur bk2 + kzk2 ≥ kΣr Ur bk2 = kVr Σr Ur bk2 = kA bk2 .
Συνεπώς, κάθε λύση του προβλήματος ελαχίστων τετραγώνων y ικανοποιεί kyk2 ≥ kA† bk2 . Αυτό σημαίνει
ότι η y = A† b είναι η λύση του προβλήματος ελαχίστων τετραγώνων με την ελάχιστη νόρμα.
5.7.1 (σελ. 86): Αφού (A − λI)T = AT − λI και
οι πίνακες A και AT έχουν τις ίδιες ιδιοτιμές. Έστω λ ιδιοτιμή του AT και z ∈ Cn αντίστοιχο ιδιοδιάνυσμα.
Έστω ακόμα δείκτης k, 1 ≤ k ≤ n, τέτοιος ώστε |zk | = max1≤i≤n |zi |. Προφανώς zk 6= 0, αφού z 6= 0
ως ιδιοδιάνυσμα που αντιστοιχεί στην ιδιοτιμή λ. Από τη σχέση AT z = λz έχουμε
X
0 = (AT − λI)z k = (akk − λ)zk + aik zi .
i=1
i̸=k
Επομένως,
X X
|akk − λ||zk | ≤ |aik | |zi | ≤ |zk | |aik |.
i=1 i=1
i̸=k i̸=k
Επειδή zk 6= 0 έχουμε
X
|akk − λ| ≤ |aik |,
i=1
i̸=k
X
n X
n
H
(x, x) = x x = xi xi = |xi |2 .
i=1 i=1
συνεπώς xH Ax ∈ R. Άρα R(x) είναι πραγματικός αριθμός. Έστω τώρα λ ∈ R ιδιοτιμή του A και x ∈ Cn
αντίστοιχο ιδιοδιάνυσμα. Τότε
(Ax, x) λ(x, x)
R(x) = = = λ.
(x, x) (x, x)
λ − pn−1 −pn−2 · · · −p1 −p0
−1 λ ··· 0 0
..
λI − F = .. .. .
0 −1 . . .
..
... ...
0
. λ
0 ··· 0 −1 λ
Αν αναπτύξουμε την ορίζουσα ως προς την πρώτη στήλη του πίνακα λI − F βλέπουμε ότι
0 ··· −1 λ 0 ··· −1 λ
με την πρώτη ορίζουσα να είναι ίση με λn−1 ενώ η δεύτερη είναι η ορίζουσα ενός συνοδού πίνακα Frobenius
τάξης n − 1. Μια επαγωγική απόδειξη δίνει εύκολα το ζητούμενο αποτέλεσμα.
5.7.4 (σελ. 87): Έστω ότι ο A − µI είναι μη αντιστρέψιμος. Τότε υπάρχει μη μηδενικό x ∈ Cn τέτοιο
ώστε (A − µI)x = 0, δηλαδή Ax = µx. Αυτό σημαίνει ότι µ είναι ιδιοτιμή του A με αντίστοιχο ιδιο-
διάνυσμα x το οποίο είναι άτοπο. Συνεπώς, αν µ 6∈ σ(A) ο πίνακας A − µI είναι αντιστρέψιμος. Έστω
τώρα x ∈ Cn , x 6= 0, ιδιοδιάνυσμα που αντιστοιχεί στην ιδιοτιμή λ. Από τη σχέση Ax = λx έχουμε
(A − µI)x = (λ − µ)x, δηλαδή
(λ − µ)−1 x = (A − µI)−1 x.
Από τη σχέση αυτή συμπεραίνουμε ότι (λ − µ)−1 είναι ιδιοτιμή του (A − µI)−1 με αντίστοιχο ιδιοδιάνυσμα
το διάνυσμα x.
5.7.5 (σελ. 87): Από την Πρόταση 5.2 έχουμε ότι Ak = QH k Ak−1 Qk . Στο πρώτο βήμα της ανάλυσης QR
επιλέγουμε έναν πίνακα Q1 ο οποίος, όταν πολλαπλασιάσουμε από αριστερά θα αφήσει ανέπαφη την πρώτη
γραμμή του πίνακα A, θα εισάγει μηδενικά στην πρώτη στήλη στις γραμμές 3 εως n και αλλάξει βέβαια, τα
στοιχεία του πίνακα στις θέσεις 2 ≤ i, j ≤ n. Όταν θα πολλαπλασιάσουμε με τον Q1 από τα δεξιά, η πρώτη
στήλη θα μείνει ανέπαφη και συνεπώς θα διατηρηθεί η μορφή Hessenberg του πίνακα A. Το ίδιο θα συμβεί
και στα επόμενα βήματα της ανάλυσης QR.
5.7.6 (σελ. 87): Θέλουμε να βρούμε τις λi , i = 0, 1, 2, 3 προσεγγίσεις της μεγαλύτερης κατ’ απόλυτο
τιμής του πίνακα A. Εύκολα μπορούμε να δούμε ότι λ = 2.
√
Έχουμε y (1) = Ax(0) = (1, 0, 1)T και ky (1) k2 = 2, οπότε λ0 = (x(0) )T y (1) = 0.
1 √
Στη συνέχεια θέτουμε x(1) = y (1) = ( √12 , 0, √12 )T , y (2) = Ax(1) = ( √12 , 2, √12 )T και
ky (1) k 2
222 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
√
ky (2) k2 = 3, οπότε λ1 = (x(1) )T y (2) = 1.
1 √
Στο επόμενο βήμα θέτουμε x(2) = y (2) = √1 ( √1 , 2, √12 )T , y (3) = Ax(2) = √1 (3, 2, 3)T
√
ky (2) k
2
3 2 6
και ky k2 =
(3) √22 , οπότε λ2
6
= (x ) y (2) T (3)
= 10
6
= 2 − 13 .
1
Στο 3o βήμα θέτουμε x(3) = y (3) = √122 (3, 2, 3)T και y (4) = Ax(3) = √122 (5, 6, 5)T , οπότε
ky (3) k2
λ3 = (x(2) )T y (3) = 48
22
2
= 2 + 11 .
6.6.1 (σελ. 98): Υποθέτουμε ότι οι προσεγγίσεις (xk ) με τη μέθοδο Newton-Raphson συγκλίνουν στο
x∗ . Θεωρούμε το ανάπτυγμα Taylor με κέντρο το x∗ . Οπότε
1
f (xk ) = f (x∗ ) + (xk − x∗ )f ′ (x∗ ) + (xk − x∗ )2 f ′′ (ξk ) με ξk ανάμεσα στα xk , x∗
2
και
Αφού f ′′ (x∗ ) 6= 0 και f ′′ είναι συνεχής και φραγμένη κοντά στο x∗ έχουμε ότι υπάρχουν σταθερές c1 , c2
τέτοιες ώστε |f ′′ (ξk )| < c1 , 0 < c2 < |f ′′ (ξ¯k )| και άρα
|xk+1 − x∗ | 1
→ .
|xk − x∗ | 2
6.6.2 (σελ. 98): Υποθέτουμε ότι οι προσεγγίσεις (xk ) με τη μέθοδο Newton-Raphson συγκλίνουν στο
x∗ . Θεωρούμε το ανάπτυγμα Taylor με κέντρο το x∗ . Οπότε
1 1
f (xk ) = f (x∗ )+(xk −x∗ )f ′ (x∗ )+ (xk −x∗ )2 f ′′ (x∗ )+ (xk −x∗ )3 f ′′′ (ξk ) με ξk ανάμεσα στα xk , x∗ ,
2 6
και
1
f ′ (xk ) = f ′ (x∗ ) + (xk − x∗ )f ′′ (x∗ ) + (xk − x∗ )2 f ′′′ (ξ¯k ) με ξ¯k ανάμεσα στα xk , x∗ .
2
Αφού f ′′′ (x∗ ) 6= 0 και f ′′′ είναι συνεχής και φραγμένη κοντά στο x∗ έχουμε ότι υπάρχουν σταθερές c1 , c2
τέτοιες ώστε |f ′′′ (ξk )| < c1 , 0 < c2 < |f ′′′ (ξ¯k )| και άρα
|xk+1 − x∗ | 2
→ .
|xk − x∗ | 3
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 223
x3k 1 2
xk+1 = xk − 2 = xk − xk = xk .
3xk 3 3
Άρα η σύγκλιση είναι γραμμική. Για την εξίσωση x + x4 = 0 η μέθοδος Newton-Raphson είναι
xn + x4n 3x4n
xn+1 = xn − = , n = 0, 1, . . .
1 + 4x3n 1 + 4x3n
Αν x0 ∈ [−4−1/3 , 0) τότε x1 > 0. Επειδή xn+1 − xn = −(xn + x4n )/(1 + 4x3n ) < 0, αν xn > 0, η
ακολουθία {xn } είναι γνήσια φθίνουσα και φραγμένη κάτω από το μηδέν. Συνεπώς xn → 0 καθώς n → ∞
(γιατί;). Η σύγκλιση στη ρίζα x = 0 είναι τουλάχιστον τετραγωνική, γιατί
xn+1 − 0 3x2n
lim = lim = 0.
n→∞ (xn − 0)2 n→∞ 1 + 4x3n
Όμοια, αν x0 ∈ (−1, −4−1/3 ) τότε x1 < −1 και η ακολουθία {xn } είναι γνήσια αύξουσα και φραγμένη
πάνω από το -1. Συνεπώς xn → −1 καθώς n → ∞ (γιατί;). Λίγες πράξεις δείχνουν ότι
k xk
0 2.000000
1 2.750000
2 2.954884
3 2.997853
4 2.999995
5 3.000000
6 3.000000
Πίνακας 13.1: Άσκηση 6.6.4: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 = 2.
k xk
0 1.000000
1 13.000000
2 10.578893
3 8.785883
4 7.469644
5 6.517932
6 5.848419
7 5.402334
8 5.139173
9 5.024562
10 5.000967
11 5.000002
12 5.000000
13 5.000000
Πίνακας 13.2: Άσκηση 6.6.4: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 = 1.
|xk+1 − 1|
= 0.9.
|xk − 1|
1
|xk+1 − 1| = |xk − 1|,
k
k xk
0 0.100000
1 0.111111
2 0.111111
Πίνακας 13.3: Άσκηση 6.6.7: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 =
0.1.
9xk − 1 1
xk+1 = xk − = , k ≥ 0.
9 9
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 225
6.6.8 (σελ. 99): Στον Πίνακα 13.4 παρουσιάζονται όροι της ακολουθίας Newton-Raphson για την προ-
σέγγιση της ρίζας της εξίσωσης f (x) = sin x − cos 2x = 0 με αρχική τιμή x0 = 1.
k xk
0 1.000000
1 0.466862
2 0.524750
3 0.523599
4 0.523599
Πίνακας 13.4: Άσκηση 6.6.8: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 = 1.
Για τη ρίζα της εξίσωσης f (x) = x3 − 7x2 + 11x − 5 = 0 η μέθοδος Newton-Raphson με αρχική τιμή
x0 = 2 παράγει τις προσεγγίσεις που δείχνει ο Πίνακας 13.5.
k xk
0 2.000000
1 1.400000
2 1.188235
3 1.091735
4 1.045323
5 1.022531
6 1.011233
7 1.005609
8 1.002802
9 1.001401
10 1.000700
11 1.000350
12 1.000175
13 1.000088
14 1.000044
15 1.000022
16 1.000011
17 1.000005
18 1.000003
19 1.000001
20 1.000001
21 1.000000
Πίνακας 13.5: Άσκηση 6.6.8: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 = 2.
6.6.9 (σελ. 99): Η μέθοδος Newton-Raphson για τη συνάρτηση f (x) = arctan x είναι
(xk − 3)3 xk − 3
xk+1 = xk − = xk − , k = 0, 1, . . . .
3(xk − 3) 2 3
Τότε,
xk − 3 2
xk+1 − 3 = xk − 3 − = (xk − 3),
3 3
σχέση η οποία επιβεβαιώνει ότι η ακολουθία (xk ) συγκλίνει γραμμικά στη ρίζα x∗ = 3. Οι προσεγγίσεις που
παράγει η μέθοδος Newton-Raphson φαίνονται στον Πίνακα 13.6.
k xk
0 4.000000
1 3.666667
2 3.444444
3 3.296296
4 3.197531
5 3.131687
.. ..
. .
31 3.000003
32 3.000002
33 3.000002
34 3.000001
35 3.000001
Πίνακας 13.6: Άσκηση 6.6.10: Επαναλήψεις της μεθόδου Newton-Raphson για την f με αρχική τιμή x0 =
4.
√
6.6.11 (σελ. 99): Η εξίσωση f (x) = x2 − a, a > 0 έχει την προφανή ρίζα x∗ = a. Η μέθοδος
Newton-Raphson με αρχική τιμή x0 > 0 παράγει τις προσεγγίσεις
x2k − a 1 a
xk+1 = xk − = xk + , k = 0, 1, . . . .
2xk 2 xk
Είναι προφανές ότι οι όροι της ακολουθίας Newton-Raphson ικανοποιούν xk > 0, για k ≥ 0. Από τη σχέση
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 227
√
√ (xk − a)2
xk+1 − a= , k = 0, 1, . . . ,
2xk
√
βλέπουμε ότι xk+1 − a ≥ 0 ενώ xk+1 −xk < 0. Συνεπώς, ηακολουθία (xk ) είναι φθίνουσα και φραγμένη
√
από κάτω, άρα συγκλίνει. Από τη σχέση xk+1 = 2 xk + xak εύκολα φαίνεται ότι το όριό της είναι το a.
1
6.6.12 (σελ. 99): Εφαρμόζουμε τη μέθοδο της τέμνουσας για τη συνάρτηση f (x) = x2 −a με δεδομένες
αρχικές τιμές x0 , x1 . Τότε,
x2k − a
xk+1 = xk −
x2k − a − x2k−1 + a
xk − xk−1
x2k − a
= xk −
xk−1 + xk
a + xk−1 xk
= , k = 2, 3, . . . ,
xk−1 + xk
f (xk )
xk+1 = xk − , k = 0, 1, . . . .
f ′ (xk )
Αν xk < ξ και f ′ (xk ) < 0 τότε η εφαπτομένη στο γράφημα της f στο (xk , f (xk )) τέμνει τον άξονα των x
σ’ ένα σημείο, το xk+1 , μεταξύ των xk και ξ. Επομένως,
Αν τώρα xk > ξ και f ′ (xk ) < 0 τότε η εφαπτομένη στο γράφημα της f στο (xk , f (xk )) τέμνει τον άξονα
των x σ’ ένα σημείο, το xk+1 , μικρότερο από το ξ. Επομένως,
Τώρα όμως είμαστε ξανά στην πρώτη περίπτωση και η ακολουθία αυξάνει μονότονα.
6.6.15 (σελ. 100): Θα γράψουμε
[f (x)]2
F (x) = x − ,
f (x + f (x)) − f (x)
έτσι ώστε η μέθοδος του Steffensen να γράφεται ως xn+1 = F (xn ). Επειδή
1
xn1 − ξ ≈ (xn − ξ)F ′ (ξ) + (xn − ξ)2 F ′′ (ξ),
2
228 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
f (x) f (ξ)
lim = F (x) = ξ − lim f (x) lim =ξ− ′ = ξ.
x→ξ x→ξ x→ξ f (x + f (x)) − f (x) f (ξ)
Σημειώνουμε ότι αν και η F δεν ορίζεται στο ξ ο παραπάνω υπολογισμός δείχνει ότι θα μπορούσαμε, από
συνέχεια, να ορίσουμε F (ξ) = ξ. Χρησιμοποιούμε τώρα τον τύπο του Taylor για να γράψουμε
1
f (xk + f (xk )) = f (xk ) + f ′ (xk )f (xk ) + f ′′ (ηk )[f (xk )]2 ,
2
Επομένως
f (xk )
F (xk ) = xk − ,
′
1 ′′
f (xk ) + (ηk )f (xk )
2
και
F (x) − F (ξ) 1
F ′ (ξ) = lim = 1 − f ′ (ξ) ′ = 0,
x→ξ x−ξ f (ξ)
xk + x1+a axak
xk+1 = xk − k
= xk .
1 + (1 + a)xak 1 + (1 + a)xak
Είναι απλό να δούμε ότι για x0 > 0, η ακολουθία που παράγει η μέθοδος είναι θετική. Επίσης ο παράγοντας
axak axa∗
< 1. Συνεπώς x k+1 < x k , άρα x k → x ∗ ≥ 0. Αν x ∗ 6
= 0 τότε = 1, το
1 + (1 + a)xak 1 + (1 + a)xa∗
οποίο είναι άτοπο. Συνεπώς x∗ = 0.
Θέτουμε g(a) = f (xk + ay k ) και y k = xk+1 − xk = −[F ′ (xk )]−1 F (xk ) οπότε βρίσκουμε ότι
Με αντικατάσταση παίρνουμε
Συνεπώς
1 1
xn+1 = 2
(xn − hy n ), και y n+1 = 2
(y n + hxn ).
1+h 1+h
n
1
Δείχνουμε με επαγωγή ότι (xn )2 + (y n )2 = , n ≥ 1, οπότε εύκολα μετά παίρνουμε το ζητού-
1 + h2
μενο.
10.4.1 (σελ. 157): Εφαρμόζοντας μια μέθοδο Runge-Kutta q−σταδίων με βήμα h = T /N παίρνουμε
προσεγγίσεις y n , n = 0, . . . , N της ακριβής τιμής y(tn ), tn = nh, τέτοιες ώστε
X
q
n+1 n
y =y +h bi .
i=1
P
Έστω s = qi=1 bi , τότε για y 0 = 0 θα έχουμε y 1 = y 0 + hs = hs, y 2 = y 1 + hs = 2hs και εύκολα
βλέπουμε ότι y N = N hs = s. Αν η μέθοδος συγκλίνει τότε y N → y(tN ) = y(1) = 1. Συνεπώς s = 1.
λύση.
10.4.4 (σελ. 158): Για να είναι συνεπής θα πρέπει το τοπικό σφάλμα διακριτοποίησης δn = O(h2 ). Αν
γνωρίζουμε την ακριβή λύση y(tn ), εφαρμόζοντας τότε τη μέθοδο θα έχουμε
και
h
ζ n+1 = y(tn ) + (f (tn , ζ n,1 ) + f (tn + h, ζ n,2 )).
2
Τότε το τοπικό σφάλμα διακριτοποίησης είναι δn = y(tn+1 ) − ζ n+1 . Θέτουμε για συντομία fˆ = f (tn , y n ),
fˆt = ft (tn , y n ), fˆy = fy (tn , y n ). Οπότε f (tn , ζ n,1 ) = fˆ και ζ n,2 = y(tn ) + hfˆ. Αναπτύσσοντας κατά
Taylor ως προς την πρώτη και στη συνέχεια ως προς τη δεύτερη μεταβλητή έχουμε
f (tn + h, ζ n,2 ) = f (tn , ζ n,2 ) + hft (tn , ζ n,2 ) + O(h2 ) = f (tn , ζ n,2 ) + O(h)
= fˆ + hfˆfˆy + O(h).
Επίσης
Συνεπώς
h
δn = y(tn+1 ) − {y(tn ) + (fˆ + f (tn + h, ζ n,2 ))} = hy ′ (tn ) − hfˆ + O(h2 ) = O(h2 ).
2
10.4.6 (σελ. 158): Για να έχει τάξη ακρίβειας 3 θα πρέπει το τοπικό σφάλμα διακριτοποίησης δn = O(h4 ).
Αν γνωρίζουμε την ακριβή λύση y(tn ), εφαρμόζοντας τότε τη μέθοδο θα έχουμε
ζ n,1 = y(tn ),
και
ζ n+1 = y(tn ) + h(b1 f (tn , ζ n,1 ) + b2 f (tn + hτ2 , ζ n,2 ) + b3 f (tn + hτ3 , ζ n,3 )). (13.1)
Τότε το τοπικό σφάλμα διακριτοποίησης είναι δn = y(tn+1 ) − ζ n+1 . Θέτουμε για συντομία fˆ = f (tn , y n ),
fˆt = ft (tn , y n ), fˆy = fy (tn , y n ) και παρόμοια για άλλες τάξεως παραγωγίσεις.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 231
Στη συνέχεια θα αναπτύξουμε κατά Taylor, ως προς την πρώτη και στη συνέχεια ως προς τη δεύτερη με-
ταβλητή των k2 = f (tn + hτ2 , ζ n,2 ) και k3 = f (tn + hτ3 , ζ n,3 )
1
k2 = f (tn , ζ n,2 ) + hτ2 ft (tn , ζ n,2 ) + (hτ2 )2 ftt (tn , ζ n,2 ) + O(h3 )
2
1
= (fˆ + ha21 fˆfˆy + (a21 fˆ)2 fˆyy + O(h3 )
2
1
+ hτ2 (fˆt + ha21 fˆfˆty + O(h2 )) + (hτ2 )2 (fˆtt + O(h))
2
1
= fˆ + h(τ2 fˆt + a21 fˆfˆy ) + h2 (τ22 fˆtt + 2τ2 a21 fˆfˆty + (a21 fˆ)2 fˆyy ) + O(h3 ).
2
1
k3 = f (tn , ζ n,3 ) + hτ3 ft (tn , ζ n,3 ) + (hτ3 )2 ftt (tn , ζ n,3 ) + O(h3 )
2
1
= (fˆ + h(a31 fˆ + a32 k2 )fˆy + h2 (a31 fˆ + a32 k2 )2 fˆyy + O(h3 ))
2
1
+ hτ3 (fˆt + h(a31 fˆ + a32 k2 )fˆty + O(h2 )) + (hτ3 )2 (fˆtt + O(h))
2
= fˆ + h(a31 fˆ + a32 (fˆ + h(τ2 fˆt + a21 fˆfˆy ) + O(h2 )))fˆy
1
+ h2 (a31 fˆ + a32 (fˆ + O(h)))2 fˆyy + O(h3 )
2
1
+ hτ3 fˆt + h(a31 fˆ + a32 (fˆ + O(h)))fˆty + O(h2 ) + (hτ3 )2 (fˆtt + O(h))
2
1
+ h2 τ32 fˆtt + 2τ3 (a31 + a32 )fˆfˆty + (a31 + a32 )2 fˆ2 fˆyy + 2a32 (τ2 fˆt + a21 fˆfˆy )fy + O(h3 ).
2
Στη συνέχεια, αν αντικαταστήσουμε τις εκφράσεις για τα k2 και k3 στην (13.1) και συγκεντρώσουμε τους
συντελεστές για κάθε παράγοντα h0 , h, h2 , h3 έχουμε
232 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
h0 :y(tn )
h1 :(b1 + b2 + b3 )fˆ
h2 :b2 (τ2 fˆt + a21 fˆfˆy ) + b3 (τ3 fˆt + (a31 + a32 )fˆfˆy )
b2 2 ˆ
h3 : ((τ ftt + 2τ2 a21 fˆfˆty + (a21 fˆ)2 fˆyy ))
2 2
b3 2 ˆ
+ τ3 ftt + 2τ3 (a31 + a32 )fˆfˆty + (a31 + a32 )2 fˆ2 fˆyy + 2a32 (τ2 fˆt + a21 fˆfˆy )fy .
2
h2 ′′ n h3
y(tn+1 ) = y(tn ) + hy ′ (tn ) + y (t ) + y ′′′ (tn ) + O(h4 )
2 6
h2 h3
= y(tn ) + hfˆ + (fˆt + fˆfˆy ) + (fˆtt + 2fˆfˆty + fˆ2 fˆyy + (fˆt + fˆfˆy )fy ) + O(h4 )
2 6
h0 :0
1
h2 : (fˆt + fˆfˆy ) − b2 (τ2 fˆt + a21 fˆfˆy ) − b3 (τ3 fˆt + (a31 + a32 )fˆfˆy )
2
1 b2
h3 : (fˆtt + 2fˆfˆty + fˆ2 fˆyy + (fˆt + fˆfˆy )fy ) − ((τ22 fˆtt + 2τ2 a21 fˆfˆty + (a21 fˆ)2 fˆyy ))
6 2
b3 2 ˆ
− τ ftt + 2τ3 (a31 + a32 )fˆfˆty + (a31 + a32 )2 fˆ2 fˆyy + 2a32 (τ2 fˆt + a21 fˆfˆy )fy .
2 3
Επομένως για να έχουμε τάξη σύγκλισης p = 3 θα πρέπει να μηδενίζονται οι συντελεστές των παραγό-
ντων για h0 , h1 , h2 , h3 . Άρα θα πρέπει να ισχύουν οι παρακάτω εξισώσεις για τους συντελεστές του πίνακα
Butcher της μεθόδου,
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 233
b1 + b2 + b3 = 1,
1 1
b2 τ2 + b3 τ3 = , b2 a21 + b3 (a31 + a32 ) = ,
2 2
1 1
b2 τ22 + b3 τ32 = , b2 a221 + b3 (a31 + a32 )2 = ,
3 3
1 1 1
b2 τ2 a21 + b3 τ3 (a31 + a32 ) = , b3 a32 τ2 = , b3 a32 a21 =
3 6 6
Χρησιμοποιώντας τις δύο τελευταιές σχέσεις προκύπτει ότι a21 = τ2 και στη συνέχεια εύκολα παρατηρούμε
ότι θα πρέπει a31 + a32 = τ3 . Συνεπώς θα πρέπει να ισχύουν οι παρακάτω εξισώσεις για τους συντελεστές
του πίνακα Butcher της μεθόδου,
b1 + b2 + b3 = 1,
1 1
b2 a21 + b3 (a31 + a32 ) = , b2 a221 + b3 (a31 + a32 )2 = ,
2 3
1
b3 a32 a21 = .
6
10.4.7 (σελ. 158): Αν γνωρίζουμε την ακριβή λύση y(tn ), εφαρμόζοντας τότε τη μέθοδο για το πρόβλημα
′
y (t) = y(t) θα έχουμε
5 n,1 1
ζ n,1 = y(tn ) + hζ − hζ n,2 ,
12 12 (13.2)
3 1
ζ n,2 = y(tn ) + hζ n,1 + hζ n,2
4 4
και
3 1
ζ n+1 = y(tn ) + h( ζ n,1 + ζ n,2 ).
4 4
Τότε το τοπικό σφάλμα διακριτοποίησης είναι δn = y(tn+1 ) − ζ n+1 . Αντικαθιστώντας τις εκφράσεις για
ζ n,1 , ζ n,2 που δίνει η μέθοδος, βλ. (13.2), προκύπτει
234 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
5 5 1 1 3 1
ζ n,1 = y(tn ) + h(y(tn ) + hζ n,1 − hζ n,2 ) − h(y(tn ) + hζ n,1 + hζ n,2 )
12 12 12 12 4 4
1 1 1
= y(tn ) + hy(tn ) + h2 ζ n,1 − h2 ζ n,2 .
3 9 18
Επίσης από τη (13.2), μπορούμε να θεωρήσουμε ότι ζ n,1 = y(tn ) + O(h) και ζ n,2 = y(tn ) + O(h),
οπότε αντικαθιστώντας άλλη μια φορά στη (13.3) παίρνουμε
1 1 1
ζ n,1 = y(tn ) + hy(tn ) + h2 (y(tn ) + O(h)) − h2 (y(tn ) + O(h))
3 9 18
1 1 1 (13.4)
= y(tn ) + hy(tn ) + ( − )h2 y(tn ) + O(h3 )
3 9 18
1 1
= y(tn ) + hy(tn ) + h2 y(tn ) + O(h3 ).
3 18
1 (13.5)
ζ n,2 = y(tn ) + hy(tn ) + h2 y(tn ) + O(h3 ).
2
3 1
δn = y(tn+1 ) − {y(tn ) + h( ζ n,1 + ζ n,2 )}
4 4
3 1 1 1 1
= y(tn+1 ) − {y(tn ) + h y(tn )(1 + h + h2 ) + h y(tn )(1 + h + h2 ) + O(h4 )}
4 3 18 4 2
1 1 11 11
= y(tn+1 ) − {y(tn ) + hy(tn ) + h2 y(tn )( + ) + h3 y(tn )( + ) + O(h4 )}
4 4 46 42
1 1
= y(tn+1 ) − {y(tn ) + hy(tn ) + h2 y(tn ) + h3 y(tn ) + O(h4 )}.
2 6
Εύκολα βλέπουμε ότι y ′′′ (tn ) = y ′′ (tn ) = y ′ (tn ) = y(tn ), οπότε αναπτύσσοντας κατά Taylor
h2 n h3
y(tn+1 ) = y(tn ) + hy(tn ) + y(t ) + y(tn ) + O(h4 ).
2 6
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 235
και
h
ζ n+1 = y(tn ) + (ζ n,1 + ζ n,2 ).
2
Τότε το τοπικό σφάλμα διακριτοποίησης είναι δn = y(tn+1 ) − ζ n+1 . Αντικαθιστώντας τις εκφράσεις για
ζ n,1 , ζ n,2 που δίνει η μέθοδος, βλ. (13.6) προκύπτει
h
ζ n+1 = y(tn ) + (y(tn ) + µhζ n,1 + y(tn ) + (1 − 2µ)hζ n,1 + µhζ n,2 )
2 (13.7)
h2 h2
= y(tn ) + hy(tn ) + (1 − µ)ζ n,1 + µζ n,2 .
2 2
Στη συνέχεια αντικαθιστούμε άλλη μια φορά στη (13.7) τις εκφράσεις για ζ n,1 , ζ n,2 που δίνει η μέθοδος, βλ.
(13.6) και παίρνουμε
h2 h2
ζ n+1 = y(tn ) + hy(tn ) + (1 − µ)[y(tn ) + µhζ n,1 ] + µ[y(tn ) + (1 − 2µ)hζ n,1 + µhζ n,2 ]
2 2
h2 n h3 h3 2 n,2
= y(t ) + hy(t ) + y(t ) + µ(2 − 3µ)ζ + µ ζ .
n n n,1
2 2 2
Με ανάλογο τρόπο έχουμε
h2 n h3
ζ n+1 = y(tn ) + hy(tn ) + y(t ) + µ(2 − 3µ)[y(tn ) + µhζ n,1 ]
2 2
h3 2
+ µ [y(tn ) + (1 − 2µ)hζ n,1 + µhζ n,2 ]
2
h2 n h3
= y(tn ) + hy(tn ) + y(t ) + [2µ − 2µ2 ]y(tn ) + O(h4 ).
2 2
Εύκολα βλέπουμε ότι y ′′′ (tn ) = y ′′ (tn ) = y ′ (tn ) = y(tn ), οπότε αναπτύσσοντας κατά Taylor
236 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
h2 n h3
y(tn+1 ) = y(tn ) + hy(tn ) + y(t ) + y(tn ) + O(h4 ).
2 6
1
Συνεπώς προκύπτει δn = O(h4 ) αν µ2 − µ + = 0.
6
Δεύτερος τρόπος επίλυσης: Έχουμε από τις (13.6)
1
ζ n,1 = y(tn ),
1 − µh
1 1 1 − 2µ
ζ n,2 = (y(tn ) + (1 − 2µ)hζ n,1 ) = (1 + h)y(tn ),
1 − µh 1 − µh 1 − µh
και
h
ζ n+1 = y(tn ) + (ζ n,1 + ζ n,2 )
2
h 1 1 1 − 2µ
= {1 + ( + (1 + h))}y(tn ).
2 1 − µh 1 − µh 1 − µh
1 1
Το ανάπτυγμα Taylor της , x > 0, είναι = 1 − x + x2 − x3 + ξ 4 , με ξ ∈ (0, x) οπότε
1−x 1−x
1
= 1 − (µh) + (µh)2 − (µh)3 + O(h4 ).
1 − µh
Αντικαθιστούμε αυτήν την έκφραση στον παραπάνω υπολογισμό για το ζ n+1 και παρόμοια όπως στον Α’
τρόπο επίλυσης οδηγούμαστε στο επιθυμητό αποτέλεσμα.
10.4.11 (σελ. 159): Για να έχει τάξη ακρίβειας 3 θα πρέπει το τοπικό σφάλμα διακριτοποίησης δn =
O(h4 ). Αν γνωρίζουμε την ακριβή λύση y(tn ), εφαρμόζοντας τότε τη μέθοδο θα έχουμε
h
ζ n+1 = y(tn ) + (f (tn,1 , ζ n,1 ) + f (tn,2 , ζ n,2 )). (13.8)
2
Τότε το τοπικό σφάλμα διακριτοποίησης είναι δn = y(tn+1 ) − ζ n+1 . Θέτουμε για συντομία fˆ = f (tn , y n ),
fˆt = ft (tn , y n ), fˆy = fy (tn , y n ) και παρόμοια για άλλες τάξεως παραγωγίσεις.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 237
Στη συνέχεια θα αναπτύξουμε κατά Taylor ως προς την πρώτη και στη συνέχεια ως προς τη δεύτερη μετα-
βλητή των k1 = f (tn,1 , ζ n,1 ) και k2 = f (tn,2 , ζ n,2 )
1
k1 = f (tn , ζ n,1 ) + hµft (tn , ζ n,1 ) + (hµ)2 ftt (tn , ζ n,1 ) + O(h3 )
2
1 (13.9)
= (fˆ + hµk1 fˆy + (hµk1 )2 fˆyy + O(h3 ))
2
1
+ hµ(fˆt + hµk1 fˆty + O(h2 )) + (hµ)2 (fˆtt + O(h)) + O(h3 ).
2
Επομένως k1 = fˆ + hµ(fˆt + k1 fˆy ) + O(h2 ) και k1 = fˆ + O(h). Στη συνέχεια αντικαθιστούμε την
κατάλληλη έκφραση για το k1 , ώστε να προκύπτουν όροι το πολύ τάξεως O(h2 ) στο δεξιό μέλος της (13.9)
που έχουμε βρει. Οπότε
ˆ ˆ ˆ ˆ 2 ˆ h 2 µ2 ˆ
k1 = f + hµ[f + hµ(ft + k1 fy ) + O(h )]fy + (f + O(h))2 fˆyy
2
1
+ hµ(fˆt + hµ(fˆ + O(h))fˆty + O(h2 )) + (hµ)2 fˆtt + O(h3 )
2
h2 µ2 ˆ2 ˆ (13.10)
= fˆ + hµ[fˆ + hµ(fˆt + fˆfˆy )]fˆy + f fyy + hµ(fˆt + hµfˆfˆty )
2
1
+ (hµ)2 fˆtt + O(h3 )
2
1
= fˆ + hµ(fˆt + fˆfˆy ) + (hµ)2 (fˆtt + fˆ2 fˆyy + 2(fˆt + fˆfˆy )fˆy + 2fˆfˆty ) + O(h3 ).
2
Από την (13.10) παρατηρούμε ότι προκύπτει k1 = fˆ + hµ(fˆt + fˆfˆy ) + O(h2 ). Με ανάλογο τρόπο όπως
στην (13.9) έχουμε για το k2
1
k2 = f (tn , ζ n,2 ) + h(1 − µ)ft (tn , ζ n,2 ) + (h(1 − µ))2 ftt (tn , ζ n,2 ) + O(h3 )
2
h2
= (fˆ + h((1 − 2µ)k1 + µk2 )fˆy + ((1 − 2µ)k1 + µk2 )2 fˆyy + O(h3 ))
2 (13.11)
1
+ (h(1 − µ))2 (fˆtt + O(h)) + O(h3 ).
2
238 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
h2
k2 = (fˆ + h((1 − 2µ)(fˆ + hµ(fˆt + fˆfˆy )) + µk2 )fˆy + ((1 − 2µ)fˆ + µk2 )2 fˆyy )
2 (13.12)
1
+ h(1 − µ)(fˆt + h((1 − 2µ)fˆ + µk2 )fˆty ) + (h(1 − µ))2 (fˆtt ) + O(h3 ).
2
Στη συνέχεια αντικαθιστούμε στην (13.12) την κατάλληλη έκφραση για το k2 , ώστε να προκύπτουν όροι το
πολύ τάξεως O(h2 ). Οπότε
k2 = fˆ + h (1 − 2µ)(fˆ + hµ(fˆt + fˆfˆy )) + µ(fˆ + h(1 − µ)(fˆt + fˆfˆy )) fˆy
h2
+ ((1 − 2µ)fˆ + µfˆ)2 fˆyy + h(1 − µ)(fˆt + h((1 − 2µ)fˆ + µfˆ)fˆty )
2
1 (13.13)
+ (h(1 − µ))2 fˆtt + O(h3 )
2
h2
= fˆ + h(1 − µ)(fˆt + fˆfˆy ) + (1 − µ)2 (fˆtt + fˆfˆyy + 2fˆfˆty )
2
Στη συνέχεια, αν αντικαταστήσουμε τις εκφράσεις για τα k1 και k2 , (13.10) και (13.13), αντίστοιχα, στην
(13.8) και συγκεντρώσουμε τους συντελεστές για κάθε παράγοντα h0 , h, h2 , h3 έχουμε
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 239
h0 :y(tn )
h1 :fˆ
1
h2 : (fˆt + fˆfˆy )
2
µ2 ˆ
h3 : (ftt + fˆ2 fˆyy + 2(fˆt + fˆfˆy )fˆy + 2fˆfˆty )
4
(1 − µ)2 ˆ (2 − 3µ)µ ˆ ˆ ˆ ˆ
+ (ftt + fˆfˆyy + 2fˆfˆty ) + (ft + f fy )fy .
4 2
h2 ′′ n h3
y(tn+1 ) = y(tn ) + hy ′ (tn ) + y (t ) + y ′′′ (tn ) + O(h4 )
2 6
h2 h3
= y(tn ) + hfˆ + (fˆt + fˆfˆy ) + (fˆtt + 2fˆfˆty + fˆ2 fˆyy + (fˆt + fˆfˆy )fy ) + O(h4 ).
2 6
h0 :0
h1 :0
h2 :0
1
h3 : (fˆtt + 2fˆfˆty + fˆ2 fˆyy + (fˆt + fˆfˆy )fy )
6
µ2 ˆ
− (ftt + fˆ2 fˆyy + 2(fˆt + fˆfˆy )fˆy + 2fˆfˆty )
4
(1 − µ)2 ˆ (2 − 3µ)µ ˆ ˆ ˆ ˆ
− (ftt + fˆfˆyy + 2fˆfˆty ) + (ft + f fy )fy .
4 2
Επομένως για κάθε τιμή του µ έχουμε ότι μηδενίζονται οι συντελεστές των παραγόντων για h0 , h1 , h2 , οπότε
240 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
έχουμε πάντα τάξη σύγκλισης p = 2. Για να έχουμε τάξη σύγκλισης p = 3, θα πρέπει να βρούμε για ποια µ
μηδενίζεται ο συντελεστής του παραγόντα για h3 . Εύκολα βλέπουμε ότι αυτό συμβαίνει για εκείνα τα µ που
ικανοποιούν την εξίσωση
1
µ2 − µ + = 0,
6
√
1 3
δηλαδή για µ = ± .
2 6
10.4.12 (σελ. 159): Για να έχει τάξη ακρίβειας 3 θα πρέπει το τοπικό σφάλμα διακριτοποίησης δn =
O(h4 ). Αν γνωρίζουμε την ακριβή λύση y(tn ), εφαρμόζοντας τότε τη μέθοδο θα έχουμε
ζ n,1 = y(tn )
1 h h
ζ n,2 = y(tn ) + h( (tn + ζ n,1 )) = y(tn )(1 + ) + tn
2 2 2
3 h 3h h 3h h 3h2
ζ n,3 = y(tn ) + h( (tn + + ζ n,2 )) = y(tn )(1 + (1 + )) + (1 + )tn +
4 2 4 2 4 2 8
και
h h 3h
ζ n+1 = y(tn ) + (2(tn + ζ n,1 ) + 3(tn + + ζ n,2 ) + 4(tn + + ζ n,3 ))
9 2 4
h h h h
= y(tn ) + 2(tn + y(tn )) + 3(tn (1 + ) + + y(tn )(1 + ))
9 2 2 2
(13.14)
3h h 3h 3h2 3h h
+ 4(tn (1 + (1 + )) + + + y(tn )(1 + (1 + )))
4 2 4 8 4 2
h2 h3 h2 h3 h2 h3
= y(tn )(1 + h + + ) + tn (h + + )+ + .
2 6 2 6 2 6
Εύκολα βλέπουμε ότι y ′′ (tn ) = y ′ (tn ) + 1 = y(tn ) + tn + 1 και y ′′′ (tn ) = y ′ (tn ) + 1 = y(tn ) + tn + 1,
οπότε αναπτύσσοντας κατά Taylor
h2 h3
y(tn+1 ) = y(tn ) + h(y(tn ) + tn ) + (y(tn ) + tn + 1) + (y(tn ) + tn + 1) + O(h4 ).
2 6
Τότε το τοπικό σφάλμα διακριτοποίησης είναι δn = y(tn+1 ) − ζ n+1 . Άρα αντικαθιστώντας προκύπτει
δn = O(h4 ).
11.7.1 (σελ. 179): Θεωρούμε το ϱ(z) = α2 z 2 + α1 z + α0 . Για να έχει τάξη ακρίβειας 2 θα πρέπει
C0 = C1 = C2 = 0 και C3 6= 0. Έχουμε ότι
C0 = ϱ(1) = α2 + α1 + α0 = 0.
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 241
Επίσης
και
1
C2 = (4α2 + α1 ) − 2 = 0.
2
Συνεπώς χρησιμοποιώντας τις δύο τελευταίες εξισώσεις έχουμε ότι α1 = −2. Στη συνέχεια αντικαθιστώντας
στην τελευταία παίρνουμε α2 = 3/2, οπότε α0 = 1/2. Άρα έχουμε τελικά ότι ϱ(z) = (3/2)z 2 − 2z +
(1/2). Ακόμα, επειδή C3 = 61 (8α2 + α1 ) − 12 (4) = 16 6= 0 έχουμε το ζητούμενο.
11.7.3 (σελ. 179): Το τοπικό σφάλμα διακριτοποίησης είναι δ n = y(tn+1 ) − y(tn ) − 2hf (tn , y(tn )),
Η ακριβής λύση του προβλήματος είναι y(t) = t. Εύκολα βλέπουμε ότι y 1 = 2h, y 2 = 4h και επαγω-
γικά ότι y n = 2nh. Συνεπώς το ολικό σφάλμα για t = 1 = tN είναι
y(1) − y N = 1 − 2N h = 1 − 2 = −1.
C0 = ϱ(1) = 1 − 1 = 0.
Επίσης
3 1 1
C1 = ϱ′ (1) − σ(1) = 2 − + = 2 − 6= 0,
4 4 2
Επίσης
ii.) Έχουμε ότι ϱ(z) = z 2 + z + a και σ(z) = z 2 + b. Για να είναι συνεπής, πρέπει C0 = C1 = 0.
Αντικαθιστούμε τις τιμές για το C0 και C1 , οπότε
Επίσης
11.7.7 (σελ. 180): Έχουμε ότι ϱ(z) = z 2 + a1 z − a και σ(z) = b2 z 2 , ϱ′ (z) = 2z + a1 . Οπότε από
ϱ(1) = 1+a1 −a = 0 προκύπτει a1 = a−1. Επίσης από ϱ′ (1)−σ(1) = 2+a1 −b2 = 2+a−1−b2 = 0
παίρνουμε b2 = a + 1. Συνεπώς για οποιοδήποτε a για να είναι συνεπής η μέθοδος θα πρέπει a1 = a − 1
και b2 = a + 1.
C0 = α 0 + α 1 + · · · + α k
και για j ≥ 2,
1
Cj = (α1 + 2j α2 + 3j αj + · · · + k j αk )
j!
1
− (β1 + 2j−1 β2 + 3j−1 β3 + · · · + k j−1 β k ).
(j − 1)!
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 243
Έχουμε C0 = 1 − 1 = 0,
3 9 9 3 24
C1 = 3 − ( + + + ) = 3 − = 0,
8 8 8 8 3
1 3 9 9 9 36
C2 = (32 ) − ( 3 + 2 + ) = − = 0,
2 8 8 8 2 8
1 1 3 9 9 27 1 72
C3 = (33 ) − ( 32 + 22 + ) = − = 0,
6 2 8 8 8 6 2 8
1 4 1 3 9 9 81 1 72
C4 = (3 ) − ( 33 + 23 + ) = − = 0,
24 6 8 8 8 24 2 8
1 5 1 3 9 9 81 33
C5 = (3 ) − ( 34 + 24 + ) = − 6= 0.
5! 4! 8 8 8 40 2
Συνεπώς η τάξη ακρίβειας είναι 4. Για να είναι συγκλίνουσα θα πρέπει η μέθοδος να είναι και ευσταθής, δη-
√ η συνθήκη των ριζών. Εύκολα βλέπουμε ότι ρ(z) = z − 1 έχει 3 μιγαδικές ρίζες, z =
3
λαδή να ισχύει
−1 ± i 3
1, με απόλυτη τιμή ίση με 1. Οπότε ισχύει η συνθήκη των ριζών και άρα η μέθοδος είναι συγκλί-
2
νουσα.
11.7.11 (σελ. 180): Για h = 1/N και tn = nh, n = 0, . . . , N η μέθοδος για το πρόβλημα y ′ (t) = t
δίνει
h h
y n+2 − y n+1 = (4tn+2 + 8tn+1 − tn ) = (4(n + 2)h + 8(n + 1)h − nh)
12 12
h2
= (11n + 16).
12
h2
Οπότε y 0 = 0, y 1 = ,
2
h2
y2 = y1 + 16
12
h2 h2 h2 h2
y3 = y2 + (11 + 16) = y 1 + 16 + (11 + 16) = y 1 + (11 + 2 · 16)
12 12 12 12
h2 h2
y4 = y3 + (11 · 2 + 16) = y 1 + (11(0 + 1 + 2) + 3 · 16).
12 12
Κάνουμε λοιπόν την επαγωγική υπόθεση
244 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
h2
y = y + (11(0 + 1 + 2 + . . . k − 2) + 16(k − 1)).
k 1
12
Τότε
h2 h2
y k+1 = y k + (11(k − 1) + 16) = y 1 + (11(0 + 1 + 2 + . . . k − 1) + 16k).
12 12
h2
yn = y1 + (11(0 + 1 + 2 + . . . n − 2) + 16(n − 1))
12
h2 (n − 2)(n − 1)
= y1 + (11 + 16(n − 1))
12 2
h2 11 2
= y1 + ( (n − 3n + 2) + 16(n − 1))
12 2
h2 11 2 16 · 2 − 33 22
= ( n − n+ − 16 + 6)
12 2 2 2
h2
= (11n2 − n + 2).
24
11 2 1 2 2 h2
Συνεπώς y n = An2 + Bn + C με A = h , B = − h2 , C = h . Οπότε y N = (11N 2 −
24 24 24 24
11 1 2 11
N + 2) = − h + h2 → , καθώς h → 0.
24 24 24 24
1 11
Η ακριβής λύση y ικανοποιεί y(1) = 6= , άρα η μέθοδος δεν θα συγκλίνει.
2 24
12.6.2 (σελ. 199): Για το πρόβλημα y ′ (t) = λy(t), y(0) = 1 έχουμε για την πρώτη μέθοδο ότι
y n,1 = y n
1 hλ
y n,2 = y n + hλy n,1 = y n (1 + )
3 3
2 2 hλ 2hλ 2(hλ)2 )
y n,3 = y n + hλy n,2 = y n + hλy n (1 + ) = y n (1 + + )
3 3 3 3 9
(z)2 (z)3
Θέτουμε ρ1 (z) = 1 + z + + , οπότε έχουμε y n+1 = r1 (hλ)y n . Η περιοχή απόλυτης ευστάθειας
2 6
της πρώτης μεθόδου ορίζεται από εκείνα τα z ∈ C, Re(z) < 0, για τα οποία |r1 (z)| ≤ 1.
y n,1 = y n
1 hλ
y n,2 = y n + hλy n,1 = y n (1 + )
2 2
hλ n,1
y n+1 = y n + (y + 4y n,2 + y n,3 )
6
hλ n hλ
= yn + (y + 4y n (1 + ) + y n (1 + hλ + (hλ)2 ))
6 2
1 4 1 1 1 1
= y n (1 + hλ( + + ) + (hλ)2 ( + ) + (hλ)3 )
6 6 6 3 6 6
1 1
= y n (1 + hλ + (hλ)2 + (hλ)3 ).
2 6
2 3
(z) (z)
Θέτουμε ρ2 (z) = 1 + z + + , οπότε έχουμε y n+1 = r2 (hλ)y n . Η περιοχή απόλυτης ευστάθειας
2 6
της δεύτερης μεθόδου ορίζεται από εκείνα τα z ∈ C, Re(z) < 0, για τα οποία |r2 (z)| ≤ 1.
Παρατηρούμε ότι ρ1 ≡ ρ2 . Άρα θα έχουν την ίδια περιοχή απόλυτης ευστάθειας.
1+z hλ
12.6.3 (σελ. 199): Αρκεί να δείξουμε ότι | | ≤ 1 με z = , Re(z) < 0. Εύκολα βλέπουμε ότι
1−z 2
|1 + z| ≤ |1 − z| είναι ισοδύναμο με |1 + z|2 ≤ |1 − z|2 .
Επομένως θέλουμε
(1 + z)(1 + z) ≤ (1 − z)(1 − z)
ή 1 + z + z + zz ≤ 1 − z − z + zz
ή z + z ≤ −(z + z),
Άρα θα έχουμε ότι −1 < b < 1. Είναι γνωστό ότι αν δύο ρίζες z1 , z2 του p, τότε z1 z2 = b. Συνεπώς
|z1 ||z2 | < 1 από όπου έπεται ότι καθεμία από τις ρίζες είναι κατ’ απόλυτο τιμή γνήσια μικρότερη του 1 και
άρα το p ικανοποιεί τη συνθήκη των ριζών.
12.6.10 (σελ. 200): Πρώτα θα βρούμε για ποιες τιμές του θ έχουμε συγκλίνουσα μέθοδο. Έχουμε ότι τα
1
χαρακτηριστικά πολυώνυμα ρ και σ είναι ρ(z) = z 2 + (θ − 2)z + (1 − θ) και σ(z) = ((6 + θ)z 2 +
4
3(θ − 2)). Παρατηρούμε ότι ρ(1) = 1 + θ − 2 + 1 − θ = 0 για κάθε θ. Ακόμα ρ′ (z) = 2z + (θ − 2),
άρα ρ′ (1) = θ. Επίσης σ(1) = θ. Συνεπώς για κάθε θ έχουμε μια συνεπή μέθοδο.
Για να έχουμε συγκλίνουσα μέθοδο αρκεί να βρούμε για ποια θ ισχύει η συνθήκη των ριζών. Εύκολα βλέ-
πουμε ότι ρ(z) = 0, αν z = 1 ή z = 1 − θ. Συνεπώς η συνθήκη των ριζών θα ισχύει για −1 ≤ 1 − θ < 1,
δηλαδή αν 0 < θ ≤ 2. Άρα για 0 < θ ≤ 2 η μέθοδος είναι συγκλίνουσα. Στη συνέχεια θα εξετάσουμε πότε
είναι A0 -ευσταθής.
z 3z
π(ζ; z) = (1 − (6 + θ))ζ 2 + (θ − 2)ζ + (1 − θ) − (θ − 2).
4 4
Αναζητούμε τώρα για ποια θ ∈ (0, 2] το π ικανοποιεί τη συνθήκη των ριζών για κάθε z < 0. Σύμφωνα με
το Λήμμα 12.1, βλ. και την Άσκηση 12.6.5, αρκεί να εξετάσουμε τους συντελεστές του π,
3z
θ−2 (1 − θ) − (θ − 2)
a= και b= 4 .
z z
1 − (6 + θ) 1 − (6 + θ)
4 4
z
Καταρχήν θέλουμε να διευρευνήσουμε πότε b < 1. Παρατηρούμε ότι για z < 0, 1 − (6 + θ) > 0 για
4
κάθε θ ∈ (0, 2]. Ακόμα
3z z
(1 − θ) − (θ − 2) < 1 − (6 + θ)
4 4
z
ή (6 + θ − 3(θ − 2)) < θ
4
z
ή (12 − 2θ) < θ,
4
το οποίο είναι αληθές για κάθε θ ∈ (0, 2] και z < 0. Στη συνέχεια θέλουμε να ελέγξουμε πότε θα ισχύει η
επόμενη συνθήκη, δηλαδή 1 + b + a > 0, το οποίο ισοδύναμα γράφεται
ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ 247
3z
(1 − θ) − (θ − 2) θ−2
1+ 4 + >0
z z
1 − (6 + θ) 1 − (6 + θ)
4 4
z 3ζ
ή 1 − (6 + θ) + (1 − θ) − (θ − 2) + θ − 2 > 0
4 4
z 3ζ
ή − (6 + θ) − (θ − 2) > 0
4 4
z
ή − (4θ) > 0,
4
το οποίο είναι αληθές για κάθε θ ∈ (0, 2] και z < 0. Ανάλογα έχουμε 1 + b − a > 0, γιατί
3z
(1 − θ) − (θ − 2) θ−2
1+ 4 − >0
z z
1 − (6 + θ) 1 − (6 + θ)
4 4
z 3ζ
ή 1 − (6 + θ) + (1 − θ) − (θ − 2) − θ + 2 > 0
4 4
z 3ζ
ή 4 − 2θ − (6 + θ) − (θ − 2) > 0
4 4
z
ή 4 − 2θ − (4θ) > 0,
4
το οποίο είναι αληθές για κάθε θ ∈ (0, 2] και z < 0.
Συνεπώς για κάθε θ ∈ (0, 2] έχουμε μια συγκλίνουσα μέθοδο η οποία είναι και A0 ευσταθής.
1
12.6.15 (σελ. 200): Σχηματίζουμε την αντίστοιχη μονοσκελή μέθοδο. Έπειδή λοιπόν σ(z) = (z + 1)
2
για τη μέθοδο του τραπεζίου, θα έχουμε ότι η αντίστοιχη μονοσκελή μέθοδος είναι
1 1
y n+1 − y n = hf ( (tn+1 + tn ), (y n+1 + y n )
2 2
η οποία είναι η πεπλεγμένη μέθοδος του μέσου. Επειδή η μέθοδος είναι μονοβηματική k = 1, τότε ο πίνακας
G που πρέπει να βρούμε είναι G ∈ R1,1 . Εύκολα έχουμε ότι για το σφάλμα ϵn = y n = z n , για δύο λύσεις
(y n ), (z n ), ικανοποιεί
1 1 1 1
ϵn+1 − ϵn = h f ( (tn+1 + tn ), (y n+1 + y n ) − f ( (tn+1 + tn ), (z n+1 + z n ) .
2 2 2 2
1
Αν πάρουμε το εσωτερικό γινόμενο με το (ϵn+1 + ϵn ) έχουμε
2
248 ΛΥΣΕΙΣ ΕΠΙΛΕΓΜΕΝΩΝ ΑΣΚΗΣΕΩΝ
1 1
(ϵn+1 − ϵn , (ϵn+1 + ϵn ) = kϵn+1 k2 + (ϵn+1 , ϵn ) − (ϵn+1 , ϵn ) − kϵn k2
2 2
Τότε
1 1 1
Re(ϵn+1 − ϵn , (ϵn+1 + ϵn ) = kϵn+1 k2 − kϵn k2 .
2 2 2
Συνεπώς
kϵn+1 k2 ≤ kϵn k2 ,
G κατά Moore-Penrose, 65
Gershgorin, ανισότητα, 73 αντίστροφος πίνακας, 9
Grönwall, λήμμα, 131 αριθμητική ολοκλήρωση
L (αριστερό) κανόνα του ορθογωνίου, 137
Landau, συμβολισμός, 134 (δεξιό) κανόνα του ορθογωνίου, 137
Lipschitz κανόνα του τραπεζίου, 138
μονόπλευρη συνθήκη, 126, 195, 197 κανόνας, 130, 148
ολική συνθήκη, 123, 151 αυστηρά κυριαρχική διαγώνιος, 44
συνθήκη, 90, 106 Β
τοπική συνθήκη, 123, 124 βάση
Α διανυσματικού χώρου, 5
άκαμπτη διαφορική εξίσωση, 187 κανονική, 5
αλγόριθμος ορθοκανονική, 6
Cholesky, 33 Γ
Gram-Schmidt, 33 γραμμικά ανεξάρτητα στοιχεία, 4
LU, 28 γραμμικός συνδυασμός στοιχείων, 4
QR, 34 γραμμικός τελεστής, 7
οπισθοδρόμησης, 27 εικόνα, 8
ανάλυση πυρήνας, 8
Cholesky, 32 Δ
LU, 28 διάσπαση (M, N ), 42
QR, 34 διαμερισμός
Schur, 12 μη-ομοιόμορφος, 130
SVD, 19 ομοιόμορφος, 130
SVD, οικονομική, 21 διανυσματικός υπόχωρος, 5
ιδιαζουσών τιμών, 19 διανυσματικός χώρος, 3
ανισότητα απειροδιάστατος, 5
Cauchy-Schwarz, 6, 7 πεπερασμένης διάστασης, 5
Hölder, 7 Ε
τριγωνική, 6 εξωτερικό γινόμενο, 9
αντίστροφος εσωτερικό γινόμενο, 5
αριστερός αντίστροφος, 65 ευστάθεια
249
250 ΕΥΡΕΤΗΡΙΟ
κύριος υποπίνακας, 9
μοναδιαίος, 10
ορθογώνιος, 10
στροφή Givens, 10
συζυγής ανάστροφος, 9
συμμετρικός, 9
ταυτοτικός, 8
υποπίνακας, 9
φασματική ακτίνα, 107
χαρακτηριστικό πολυώνυμο, 11, 71
παράγωγος Fréchet, 102
πηλίκο Rayleigh, 14
πολυώνυμο Schur, 172
πολυώνυμο von Neumann, 172
προβολή, 10
ορθογώνια, 10
συμπληρωματική, 10
πρόβλημα
Cauchy, 121
αρχικών τιμών, 121
ελαχίστων τετραγώνων, 63
Σ
σημείο έλξης, 107
σταθερό σημείο, 90
συνεπεία μεθόδου, 172
συνθήκη των ριζών, 167
συστολή, 90, 123
σφάλμα διακριτοποίησης
μέθοδος Euler, 134
μέθοδος Runge-Kutta, 154
μονοβηματικής μεθόδου, 139
πολυβηματικές μέθοδοι, 172
σφάλμα επαναληπτικής μεθόδου, 43
σφάλμα συνέπειας, 134
σύγκλιση μεθόδου, 174
Τ
τάξη ακρίβειας μεθόδου, 133, 139, 172
Υ
υπόλοιπο επαναληπτικής μεθόδου, 43
Φ
φάσμα πίνακα, 11
φασματική ακτίνα, 11
Χ
χώρος Krylov, 53
κρίσιμη διάσταση, 54
Ψ
ψευδο-αντίστροφος, 65
Το βιβλίο αποτελείται από δύο μέρη. Στο Α΄ μέρος αναφέρουμε μερικές βασικές έννοιες από τη γραμμική άλγεβρα,
καθώς αυτές αποτελούν τη βάση αυτών που θα εξετάσουμε. Μελετούμε την αριθμητική επίλυση ενός γραμμικού
συστήματος με τετραγωνικό πίνακα χρησιμοποιώντας άμεσες μεθόδους, οι οποίες υπολογίζουν την ακριβή λύση σε
ένα προκαθορισμένο αριθμό βημάτων, τον οποίο γνωρίζουμε εκ των προτέρων. Επίσης, μελετούμε επαναληπτικές
μεθόδους, όπου κατασκευάζουμε μια ακολουθία διανυσμάτων, η οποία συγκλίνει στη λύση του γραμμικού
συστήματος. Επιπλέον, εξετάζουμε γραμμικά συστήματα με μη τετραγωνικό πίνακα, τα οποία δεν έχουν λύση, όπου
αναζητούμε διανύσματα που ελαχιστοποιούν μια κατάλληλη απόσταση. Στη συνέχεια ασχολούμαστε με το πρόβλημα
εντοπισμού των ιδιοτιμών ενός πίνακα και εξετάζουμε μεθόδους για την επίλυση μη γραμμικών εξισώσεων και
συστημάτων.
Στο Β΄ μέρος ασχολούμαστε με την αριθμητική επίλυση προβλημάτων αρχικών τιμών (Π.Α.Τ.) για συστήματα πρώτης
τάξης συνήθων διαφορικών εξισώσεων. Η πιο απλή αριθμητική μέθοδος για την επίλυση του προβλήματος αρχικών
τιμών (Π.Α.Τ.) είναι η μέθοδος του Euler. Επίσης, θεωρούμε και άλλες μονοβηματικές μεθόδους, και γενικότερα τις
μεθόδους Runge-Kutta. Επιπρόσθετα, μελετούμε τις γραμμικές πολυβηματικές μεθόδους. Η υλοποίησή τους είναι
οικονομική και για αυτόν τον λόγο εμφανίστηκαν και εφαρμόστηκαν πριν την εμφάνιση των υπολογιστών. Μελετούμε
την ευστάθεια, τη συνέπεια, την τάξη ακρίβειας και τη σύγκλιση αυτών των μεθόδων. Οι πεπλεγμένες μέθοδοι Runge-
Kutta είναι πιο απαιτητικές στην υλοποίησή τους από τις άμεσες μεθόδους Runge-Kutta και από τις πολυβηματικές
μεθόδους. Όμως, έχουν υψηλή τάξη ακρίβειας και εξαιρετικές ιδιότητες ευστάθειας. Ακόμα, θεωρούμε άκαμπτες
γραμμικές διαφορικές εξισώσεις. Ορισμένες αριθμητικές μέθοδοι είναι ασταθείς και χρειάζονται μικρό σχετικό βήμα
για να μπορέσουν να προσεγγίσουν την ακριβή λύση αυτών των προβλημάτων. Αυτή η ιδιότητα ευστάθειας, που
σχετίζεται με την προσεγγιστική λύση μιας μεθόδου για ένα άκαμπτο πρόβλημα διαφορικών εξισώσεων, ονομάζεται
απόλυτη ευστάθεια.
Το παρόν σύγγραμμα χρηματοδοτήθηκε από το Πρόγραμμα Δημοσίων Επενδύσεων του Υπουργείου Παιδείας
ΤΙΤΛΟΣ ΣΥΓΓΡΑΜΜΑΤΟΣ 1