Professional Documents
Culture Documents
Επίκουρη Καθηγήτρια
Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχ. Υπολογιστών
∆ηµοκρίτειο Πανεπιστήµιο Θράκης
Ξάνθη 2007
Πρόλογος
Ωστόσο, ένα και µόνο µαθηµατικό µοντέλο δεν είναι δυνατόν να περιγράψει
τη συµπεριφορά του συστήµατος, όποια και να είναι η φύση του. Άρα ένας νόµος
ελέγχου που υπολογίζεται µε βάση ένα οποιοδήποτε µοντέλο είναι πολύ πιθανό ότι δε
θα επιφέρει τα προσδοκώµενα αποτελέσµατα, όταν εφαρµοστεί στο πραγµατικό
σύστηµα. Αυτό συµβαίνει αν για παράδειγµα το µαθηµατικό µοντέλο του
συστήµατος δε λαµβάνει υπόψη, για λόγους απλότητας, ορισµένα φαινόµενα όπως
διαταραχές, µεταβολές παραµέτρων, γρήγορες δυναµικές, µη γραµµικότητες κλπ.
Ένας τρόπος για την αποφυγή αυτής της απόκλισης συµπεριφοράς είναι ο
υπολογισµός του ελέγχου για µια οικογένεια µοντέλων, στην οποία ανήκει το
σύστηµα. Η οικογένεια αυτή αποτελείται συνήθως από ένα ονοµαστικό µοντέλο και
από µεταβολές γύρω από αυτό, που ονοµάζονται αβεβαιότητες, αλλά θεωρείται
επίσης ότι είναι ένα αβέβαιο µοντέλο. Έτσι ο ελεγκτής σχεδιάζεται ώστε να
ικανοποιεί τις προδιαγραφές ελέγχου για όλα τα µοντέλα που ανήκουν στην
οικογένεια µοντέλων ή διαφορετικά για όλες τις αβεβαιότητες µοντέλου. Ο ελεγκτής
αυτός τότε λέγεται εύρωστος.
2
διαταραχής. Ιδιαίτερο ρόλο στην επίλυση των προβληµάτων αυτών κατέχουν οι
σύγχρονες τεχνικές βελτιστοποίησης, µε τη χρήση γραµµικών ανισοτήτων πινάκων,
που βασίζονται σε πολύ αποτελεσµατικούς υπολογιστικούς αλγορίθµους, όπως οι
αλγόριθµοι εσωτερικού σηµείου, καθώς και στα ταχύτατα αναπτυσσόµενα λογισµικά
επίλυσης.
Όλγα Κοσµίδου
Ξάνθη, Σεπτέµβριος 2007
3
Περιεχόµενα Σελ.
4
Σελ.
5
Σύµβολα
6
Κεφάλαιο 1
Το πρώτο βήµα για την επιτυχή σχεδίαση ενός συστήµατος ελέγχου είναι η
µοντελοποίηση. Πράγµατι, είναι αναγκαία η κατάλληλη µαθηµατική περιγραφή που
παριστά, κατά το δυνατόν πιστά, τη συµπεριφορά του συστήµατος µέσα σ’ ένα
δεδοµένο πλαίσιο. Τα µαθηµατικά πρότυπα ή µοντέλα των δυναµικών συστηµάτων
µπορούν να ταξινοµηθούν σε πολλές κατηγορίες:
• γραµµικά / µη – γραµµικά
• αιτιοκρατικά / στοχαστικά
7
παρουσιαστούν, µπορούν να επεκταθούν και σε συστήµατα διακριτού χρόνου. Αν και
τα περισσότερα φυσικά συστήµατα είναι κυρίως µη–γραµµικά, χρονικά
µεταβαλλόµενα, µη πεπερασµένης διάστασης και κατά συνέπεια περιγράφονται µε
µη-γραµµικές µερικές διαφορικές εξισώσεις, εν τούτοις η θεωρούµενη κλάση
συστηµάτων επιτρέπει τη µελέτη των περισσότερων συστηµάτων που συναντώνται
στην πράξη. Πράγµατι υπάρχουν πολλές τεχνικές που επιτρέπουν την προσέγγιση της
συµπεριφοράς συστηµάτων από γραµµικά, χρονικά αµετάβλητα, πεπερασµένα
µοντέλα. Για παράδειγµα, ένας τρόπος είναι η γραµµικοποίηση ενός µη-γραµµικού
συστήµατος στην περιοχή ενός ή περισσοτέρων σηµείων λειτουργίας, µε αποτέλεσµα
την περιγραφή του από µια οικογένεια γραµµικών µοντέλων. Ένας άλλος τρόπος
είναι η µοντελοποίηση εισόδων – εξόδων του φυσικού συστήµατος (Landau 1993,
Ljung 1986). Οι τεχνικές αυτές έχουν ιδιαίτερο ενδιαφέρον τόσο σε θεωρητικά όσο
και σε πρακτικά προβλήµατα.
Πίνακας µεταφοράς
Y ( s ) = G ( s )U ( s) (1.1)
Εξίσωση κατάστασης
8
ηλεκτρισµού, χηµείας,…), που διέπουν το σύστηµα. Για την κλάση των γραµµικών
και χρονικά αµετάβλητων συστηµάτων παίρνει τη µορφή,
x(t ) = Ax(t ) + Bu (t )
(1.2)
y (t ) = Cx(t ) + Du (t )
Αν κάθε στοιχείο gij ( s) του πίνακα µεταφοράς G ( s) είναι µια κανονική ρητή
συνάρτηση (proper rational function), δηλαδή είναι φραγµένη για s → ∞ , τότε οι
πίνακες A, B, C , D, σχετίζονται µε τον πίνακα µεταφοράς G ( s) µέσω της ακόλουθης
σχέσης,
G ( s ) = C ( sI − A) −1 B + D (1.3)
Ορισµός 1.1
Μια πραγµάτωση ( A, B, C , D) ονοµάζεται ελάχιστη, αν κάθε άλλη πραγµάτωση
( A, B , C , D) είναι τέτοια ώστε η διάσταση του A να είναι µεγαλύτερη ή ίση από τη
διάσταση του A .
9
t
x(t ) = e A ( t − t0 )
x0 + ∫ e A(t −τ ) Bu (τ )dτ
t0 (1.4)
y (t ) = Cx(t ) + Cu (t )
Η συνάρτηση πινάκων,
Φ (t , t0 ) = e A( t −t0 ) (1.6)
g (t ) = L−1{G ( s )} = Ce At BI + (t ) + Dδ (t ) (1.7)
⎧1, t ≥ 0
I + (t ) := ⎨ (1.8)
⎩0, t < 0
1.2 Ευστάθεια
Η πρώτη προδιαγραφή ελέγχου που πρέπει να ικανοποιεί ένα δυναµικό
σύστηµα είναι η ευστάθεια. Από φυσική άποψη, η «ευσταθής ισορροπία είναι η
κατάσταση ενός σώµατος, στην οποία αυτό επανέρχεται κάθε φορά που η θέση του
αλλάζει κάτω από εξωτερικά αίτια». Προκειµένου για ένα σύστηµα ελέγχου, ο
ορισµός αυτός δεν είναι ιδιαίτερα πρακτικά αξιοποιήσιµος. Για το λόγο αυτό, έχουν
διατυπωθεί αυστηροί µαθηµατικοί ορισµοί. Στην περίπτωση των µη-γραµµικών και
των χρονικά µεταβαλλόµενων συστηµάτων η έννοια της ευστάθειας είναι αρκετά
πολύπλοκη και απαιτεί ένα σηµαντικό αριθµό ορισµών και ειδικών περιπτώσεων
(Vidyasagar 1978). Αντίθετα, η ευστάθεια των γραµµικών και χρονικά αµετάβλητων
συστηµάτων είναι πολύ πιο εύκολο να µελετηθεί. Επειδή για τα συστήµατα αυτά όλες
οι ιδιότητες της ευστάθειας είναι οµοιόµορφες ως προς το χρόνο και σφαιρικές ως
10
προς το χώρο, απαιτείται µόνο η έννοια της ασυµπτωτικής ευστάθειας. Ικανές και
αναγκαίες συνθήκες ευστάθειας των γραµµικών και χρονικά αµετάβλητων
συστηµάτων υπάρχουν εδώ και πάνω από έναν αιώνα: οι πιο γνωστές είναι αυτές που
διατυπώθηκαν από τον Routh (1817) και τον Hurwitz (1895). Στη συνέχεια
αναφέρονται κάποια χρήσιµα εργαλεία για την ανάλυση της ευστάθειας των
συστηµάτων αυτών.
Ορισµός 1.2
Κάθε x = xe που ικανοποιεί τη σχέση
Ορισµός 1.3
Η κατάσταση ισορροπίας xe λέγεται ευσταθής, αν ∀t0 > 0 και θετικό βαθµωτό ε ,
υπάρχει ένα θετικό βαθµωτό δ (ε , t0 ) , τέτοιο ώστε:
Η ευστάθεια κατά Lyapunov σηµαίνει ότι αν η αρχική κατάσταση είναι αρκετά κοντά
στο σηµείο ισορροπίας xe , τότε η τροχιά του διανύσµατος κατάστασης µπορεί να
διατηρηθεί αυθαίρετα κοντά στο xe .
Ορισµός 1.4
Η κατάσταση ισορροπίας xe λέγεται ότι συγκλίνει, αν ∀t0 > 0 υπάρχει ένα δ1 (t0 ) ,
τέτοιο ώστε:
11
x0 − xe < δ1 ⇒ x(t , x0 , t0 ) − xe < ε1 , ∀t > t0 + T (1.14)
Ορισµός 1.5
Η κατάσταση ισορροπίας xe λέγεται ασυµπτωτικά ευσταθής, αν συγκλίνει και είναι
ευσταθής.
Θεώρηµα 1.1
Η αρχή των αξόνων είναι ένα σηµείο ισορροπίας σφαιρικά ασυµπτωτικά ευσταθές, αν
υπάρχει µια συνάρτηση V ( x) , τέτοια ώστε,
2. V ( x) < 0 , ∀x ≠ 0
3. V ( x) → ∞ , όταν x → ∞
12
Μια συνάρτηση V ( x) που ικανοποιεί τις συνθήκες του Θεωρήµατος 1.1
ονοµάζεται συνάρτηση Lyapunov για το σύστηµα (1.10). Η συνάρτηση αυτή δεν είναι
µοναδική. Επίσης, η µη εύρεση µιας τέτοιας συνάρτησης δεν συνεπάγεται ότι το
σύστηµα είναι ασταθές. Μια κλάση συναρτήσεων Lyapunov που διαδραµατίζουν
σηµαντικό ρόλο στην ανάλυση της ευστάθειας των δυναµικών συστηµάτων µε την
άµεση µέθοδο Lyapunov είναι η κλάση των τετραγωνικών συναρτήσεων της µορφής
V ( x) = xT Px (1.15)
V ( x) = xT ( AT P + PA) x (1.17)
AT P + PA < 0 (1.18)
Η συνθήκη αυτή δεν προϋποθέτει την αναλυτική λύση της διαφορικής εξίσωσης,
προκειµένου ν’ αποφανθούµε για την ασυµπτωτική ευστάθεια του συστήµατος (1.16).
Η ανισότητα (1.18) είναι η πρώτη γραµµική ανισότητα πινάκων (LMI), που
χρησιµοποιήθηκε για την ανάλυση της ευστάθειας ενός δυναµικού συστήµατος (Boyd
et al. 1994) το οποίο, επιπλέον, επιδέχεται αναλυτική λύση. Για τον υπολογισµό της
αρκεί να επιλεγεί ένας οποιοσδήποτε συµµετρικός και θετικά ορισµένος πίνακας Q
και να επιλυθεί η εξίσωση
AT P + PA + Q = 0 (1.19)
υπάρχει, είναι θετικά ορισµένος και ικανοποιεί την εξίσωση Lyapunov (1.19).
Η ευστάθεια εισόδου – εξόδου είναι µια έννοια που συναντάται συχνά κατά
την ανάλυση ενός συστήµατος ελέγχου.
13
Ορισµός 1.6
Ένα σύστηµα λέγεται ευσταθές κατά την έννοια «εισόδου – εξόδου», αν η έξοδός του,
ως απόκριση σε µια φραγµένη είσοδο, είναι κι αυτή φραγµένη.
Από µαθηµατική άποψη, η έννοια αυτή είναι αυστηρά ορισµένη µέσω της
θεωρίας των χώρων Lebesgue και ειδικότερα των χώρων L p (Vidyasagar 1978).
Ορισµός 1.7
Η νόρµα . p ενός διανύσµατος v ∈ C n ορίζεται ως εξής:
1/ p
⎛ n p ⎞
v p
= ⎜ ∑ vi ⎟ , για 1 ≤ p < ∞ και v ∞
= sup vi (1.21)
⎝ i =1 ⎠ 1≤i ≤ n
1/ p
⎛ ⎞
f p := ⎜ ∫ f (t )
p
p
dt ⎟ < ∞ , για 1 ≤ p < ∞ και f ∞
:= sup f (t ) ∞
<∞ (1.22)
⎝I ⎠ t∈I
Ορισµός 1.8
Ένα σύστηµα µε είσοδο u , έξοδο y , πίνακα µεταφοράς G ( s) και περιγραφή
κατάστασης ( A, B, C , D) λέγεται ευσταθές κατά L p (ή L p - ευσταθές), αν υπάρχει µια
σταθερά γ τέτοια ώστε για κάθε είσοδο u (t ) ∈ L p , η έξοδος y (t ) ∈ Lp ικανοποιεί τη
σχέση,
y p
≤γ u p
(1.23)
14
• Υποθέτοντας τη σταθεροποιησιµότητα και την ανιχνευσιµότητα του
συστήµατος, το σύστηµα είναι L∞ - ευσταθές αν και µόνο αν το αντίστοιχο
αυτόνοµο σύστηµα x = Ax είναι ασυµπτωτικά ευσταθές.
Στην περιγραφή αυτή, r είναι η είσοδος αναφοράς που πρέπει να ακολουθεί η έξοδος
y του συστήµατος, u είναι το διάνυσµα ελέγχου, v είναι το διάνυσµα εισόδου του
συστήµατος, du , d y , είναι διαταραχές που επηρεάζουν την είσοδο και την έξοδο του
συστήµατος, αντίστοιχα και b είναι ο θόρυβος µέτρησης. Μια ισοδύναµη περιγραφή
µπορεί να ληφθεί οµαδοποιώντας τα εξωγενή σήµατα (είσοδοι αναφοράς,
διαταραχές,…) ως ( w1 , w2 ) και τα ενδογενή σήµατα ως (e1 , e2 ) (Zhou et al. 1996).
15
Η ανάδραση είναι υλοποιήσιµη στην πράξη, αν το σύστηµα κλειστού βρόχου
αντιστοιχεί σ’ ένα πρόβληµα καλά διατυπωµένο.
Ορισµός 1.9
Ένα σύστηµα κλειστού βρόχου αντιστοιχεί σ’ ένα πρόβληµα καλά διατυπωµένο, αν
όλες οι συναρτήσεις µεταφοράς υπολογιζόµενες σε κάθε σηµείο του βρόχου
ανάδρασης είναι καλά ορισµένες καθαρά ρητές συναρτήσεις.
Για την υλοποίηση στο χώρο κατάστασης, η συνθήκη του λήµµατος 1.1 είναι
ˆ
ισοδύναµη µε: I − DD αντιστρέψιµος, όπου ( A, B, C , D) είναι η περιγραφή
κατάστασης του συστήµατος µε πίνακα µεταφοράς G ( s ) και ( Aˆ , Bˆ , Cˆ , Dˆ ) είναι η
περιγραφή κατάστασης του αντισταθµιστή Kˆ ( s ) . ∆εδοµένου ότι τα περισσότερα
συστήµατα είναι αυστηρά κανονικά (proper), δηλαδή έχουν D = 0 , η παραπάνω
συνθήκη ικανοποιείται.
Εσωτερική ευστάθεια
Η εσωτερική ευστάθεια αποτελεί µια πιο απαιτητική έννοια από την ευστάθεια
εισόδου – εξόδου, εφόσον αποκλείει κάθε δυνατότητα ύπαρξης µη φραγµένων
σηµάτων στο σύστηµα κλειστού βρόχου.
Ορισµός 1.10
Το κλειστό σύστηµα του σχήµατος 1.3 είναι εσωτερικά ευσταθές, αν κάθε φραγµένο
σήµα διέγερσης σε οποιοδήποτε σηµείο του βρόχου δηµιουργεί φραγµένο σήµα
απόκρισης, σε κάθε άλλο σηµείο.
Ας θεωρήσουµε και πάλι το σύστηµα του σχήµατος 1.3. Έστω ότι το κλειστό
σύστηµα αντιστοιχεί σ’ ένα πρόβληµα καλά διατυπωµένο και ότι οι υλοποιήσεις
χώρου κατάστασης των G ( s) και Kˆ ( s ) είναι σταθεροποιήσιµες και ανιχνεύσιµες.
Όταν δεν υπάρχουν οι εξωγενείς είσοδοι w1 και w2 , οι εξισώσεις κατάστασης είναι:
• Για το σύστηµα:
x = Ax + Be1
(1.9)
e2 = Cx + De1
16
⎛ x ⎞ ⎡⎛ A 0 ⎞ ⎛ B 0 ⎞ ⎛ I − Dˆ ⎞ ⎛ 0 Cˆ ⎞ ⎤ ⎛ x ⎞
−1
⎛ x⎞
⎜ ⎟ = ⎢⎜ ⎟+⎜ ⎟⎜ ⎟ ⎜ ⎟⎥ ⎜ ⎟ = A⎜ ⎟ (1.11)
⎝η ⎠ ⎢⎣⎝ 0 Aˆ ⎠ ⎝ 0 Bˆ ⎠ ⎝ − D I ⎠ ⎝ C 0 ⎠ ⎥⎦ ⎝η ⎠ ⎝η ⎠
Ορισµός 1.11
Το κλειστό σύστηµα του σχήµατος 1.3 είναι εσωτερικά ευσταθές, αν το σηµείο
( x,η ) = (0, 0) είναι ασυµπτωτικά ευσταθές.
Λήµµα 1.2
Το κλειστό σύστηµα του σχήµατος 1.3 είναι εσωτερικά ευσταθές, αν και µόνο αν οι
ιδιοτιµές του A έχουν αρνητικά πραγµατικά µέρη.
σ (G ( jω )).σ ( Kˆ ( jω )) < 1, ∀ω ∈ R
Η παραπάνω είναι µόνο ικανή συνθήκη ευστάθειας και σηµαίνει ότι το κέρδος
ανοικτού βρόχου (ή συνάρτηση µεταφοράς βρόχου) είναι µικρότερο της µονάδας σε
κάθε συχνότητα.
Η γενίκευση του κριτηρίου Nyquist στα πολυµεταβλητά συστήµατα έγινε από τον
Rosenbrock (1972) και αναφέρεται στη γενική περίπτωση συστηµάτων πολλών
εισόδων – πολλών εξόδων.
17
• περικλείει την αρχή των αξόνων ng + nk φορές
1.3 Επιδόσεις
Ο βασικός σκοπός ενός νόµου ελέγχου είναι να εξασφαλίζει την ευστάθεια
του κλειστού συστήµατος, καθώς και έναν αριθµό προδιαγραφών συµπεριφοράς.
Αυτές συχνά διατυπώνονται µαθηµατικά µε τη µορφή ενός κριτηρίου επιδόσεων, το
οποίο πρέπει να ελαχιστοποιείται. Ένα τέτοιο κριτήριο µπορεί να είναι, για
παράδειγµα, η µεταφορά µεταξύ µιας διαταραχής που δρα σε κάποιο δεδοµένο
σηµείο του βρόχου και µιας ελεγχόµενης εισόδου. Προκειµένου να ποσοτικοποιηθεί
η µεταφορά αυτή, πολλές µέθοδοι ελέγχου χρησιµοποιούν νόρµες, βασιζόµενες στη
συναρτησιακή ανάλυση. Περισσότερο χρησιµοποιούµενες είναι οι νόρµες H 2 και
H ∞ . Άλλες µέθοδοι χρησιµοποιούν τις συναρτήσεις ευαισθησίας και συνεπώς
επιτρέπουν την ικανοποίηση προδιαγραφών συµπεριφοράς µόνιµης κατάστασης,
όπως:
• απόρριψη διαταραχών
Στην περίπτωση αυτή, οι µέθοδοι ελέγχου βασίζονται στην τοποθέτηση των ιδιοτιµών
του κλειστού συστήµατος σε κατάλληλες περιοχές του µιγαδικού επιπέδου.
18
• S y = ( I + GK ) −1 : συνάρτηση ευαισθησίας, παριστά τη συνάρτηση µεταφοράς
µεταξύ της διαταραχής d y και της εξόδου y
y = Ty (r − b) + S y Gdu + S y d y (1.12)
e = r − y = S y (r − d y ) + Ty b − S y Gdu (1.13)
u = KS y (r − b) − KS y d y − Tu du (1.14)
v = KS y (r − b) − KS y d y + Su du (1.15)
19
Ωστόσο, επειδή οι συναρτήσεις ευαισθησίας δεν είναι ανεξάρτητες µεταξύ τους
( S y + Ty = I , Su + Tu = I ), καθίσταται φανερό ότι οι παραπάνω περιορισµοί δεν
µπορούν να ικανοποιούνται συγχρόνως. Συνεπώς, η σύνθεση του αντισταθµιστή θα
πρέπει να βασίζεται σ’ ένα συµβιβασµό µεταξύ των προδιαγραφών, εξασφαλίζοντας
µικρές τιµές των διαφόρων συναρτήσεων ευαισθησίας σε διαφορετικές περιοχές
συχνοτήτων (Zhou et al. 1996). Σηµειώνεται, ότι ένας τρόπος να κρίνουµε, αν ένας
πίνακας µεταφοράς G ( s ) παίρνει µικρές τιµές, συνίσταται στο να εξετάσουµε, αν η
τιµή του µέγιστου κέρδους του είναι µικρή ( σ (G ) < 1 ) σ’ εκείνη την περιοχή
συχνοτήτων, όπου η θεωρούµενη διαταραχή έχει σηµαντική (µεγάλη) τιµή.
1.3.2 Επιδόσεις H ∞
G ∞
= sup σ (G ( jω ))
ω
Στην περίπτωση µιας εισόδου – µιας εξόδου, αντιστοιχεί στη µέγιστη τιµή του
πλάτους της συνάρτησης µεταφοράς. Η πρωταρχική ιδιότητα της νόρµας αυτής είναι
ότι παριστά τη µέγιστη ενέργεια ενός σήµατος εξόδου, ως απόκριση σ’ ένα
οποιοδήποτε σήµα εισόδου µοναδιαίας ενέργειας. Για τα συστήµατα κλειστού
βρόχου, η ιδιότητα αυτή µπορεί να αξιοποιηθεί προκειµένου να επιτευχθούν
επιδόσεις όπως η απόρριψη διαταραχής ή η ελαχιστοποίηση του σφάλµατος εξόδου.
Για παράδειγµα, ένας αντισταθµιστής K ( s ) που επιλέγεται ώστε να σταθεροποιεί το
σύστηµα και να ελαχιστοποιεί τη Sy ∞
, επιτρέπει την ελαχιστοποίηση της ενέργειας
του σήµατος εξόδου υπό την επίδραση διαταραχών πεπερασµένης ενέργειας που
ενεργούν στην έξοδο του συστήµατος. Ακόµη, η µέγιστη ενέργεια µιας εξόδου z υπό
την επίδραση της χειρότερης διαταραχής w θα ελαχιστοποιείται, αν ο
αντισταθµιστής K ( s) υπολογιστεί, έτσι ώστε να ελαχιστοποιείται η νόρµα H ∞ της
µεταφοράς µεταξύ z και w , που συµβολίζεται Fzw . Το αντίστοιχο πρόβληµα
βελτιστοποίησης διατυπώνεται ως εξής:
min Fzw ∞
K
20
1.3.3 Επιδόσεις H 2
∞
1
∫ Trace(G( jω )
2
G2= H
G ( jω ))d ω
2π −∞
2
G 2 = Trace(CLc C T ) = Trace( BT Lo B)
όπου
∞
Lc = ∫ e At BBT e A t dt
T
ALc + Lc AT + BBT = 0
και
∞
Lo = ∫ e A t C T Ce At dt
T
AT Lo + Lo A + C T C = 0
21
γεγονός ότι βασίζεται στην υπόθεση, ότι το µοντέλο του συστήµατος είναι επακριβώς
γνωστό, πράγµα που δεν συµβαίνει στην πράξη και έτσι ο νόµος ελέγχου που
προκύπτει είναι εξαιρετικά ευαίσθητος απέναντι σε σφάλµατα µοντελοποίησης
(Doyle 1978).
max( y (t ) − y (∞))
• Μέγιστη υπερύψωση: M =
y (∞ )
τ
• Χρόνος αποκατάστασης: t f = inf{t1 ≥ 0, ∀t ≥ t1 y (t ) − y (∞) ≤y (∞) } είναι
100
ο χρόνος που απαιτείται για να φτάσει και να παραµείνει η χρονική απόκριση
στο τ % (συνήθως τ = 5 ) της τελικής τιµής της.
p( s ) = ( s − α − j β )( s − α + j β ) = s 2 + 2ζωn s + ωn2
όπου,
22
• ωn = α 2 + β 2 : είναι η κυκλική ιδιοσυχνότητα και παριστά την απόσταση
µεταξύ της ιδιοτιµής και της αρχής των αξόνων
α
• ζ =− : είναι ο συντελεστής απόσβεσης και παριστά τη γωνία ως προς τον
ωn
άξονα των φανταστικών αριθµών (ζ = sin(φ ))
Είναι προφανές ότι το πραγµατικό και το φανταστικό µέρος των ιδιοτιµών είναι,
αντίστοιχα,
• α = −ζωn και
• β = ωn 1 − ζ 2
Στην περίπτωση ενός συστήµατος 2ης τάξης µε µια είσοδο και µια έξοδο, µε
περιγραφή εισόδου – εξόδου,
ωn2
Y ( s ) = G ( s)U ( s) , G ( s) =
s 2 + 2ζωn s + ωn2
e−ζωnt
• y (t ) = 1 − cos(ωn 1 − ζ 2 t − θ ), για 0 < ζ < 1, t ≥ 0
1− ζ 2
• y (t ) = 0, για t < 0
όπου
ζ
• θ = Arctg ( )
1− ζ 2
Άρα, η δυναµική ενός γραµµικού συστήµατος εξαρτάται από τις θέσεις των πόλων
του επάνω στο µιγαδικό επίπεδο. Γενικά, η τοποθέτησή τους σε κατάλληλες περιοχές
αρκεί, προκειµένου να ικανοποιηθούν προδιαγραφές επιδόσεων, σαν αυτές που
αναφέρθηκαν στην προηγούµενη παράγραφο.
23
1.3.5 Γραµµικό τετραγωνικό κριτήριο επιδόσεων
x(t ) = Ax(t ) + Bu (t )
u (t ) = Kx(t )
προσδιορίζεται από την επίλυση µιας εξίσωσης Riccati και εξασφαλίζει πολύ καλές
ιδιότητες ευρωστίας, όπως άπειρο περιθώριο κέρδους, περιθώριο φάσης τουλάχιστον
60 , περιθώριο καθυστέρησης και ανοχή σε µη γραµµικότητες, µέχρις ενός
ορισµένου µεγέθους (Anderson and Moore 1990). Οι πίνακες βάρους Q και R που
υπεισέρχονται στο κριτήριο επιδόσεων, παίζουν θεµελιώδη ρόλο στη συµπεριφορά
του κλειστού συστήµατος. Ειδικότερα, η κατάλληλη επιλογή τους είναι δυνατόν να
επιφέρει ένα συµβιβασµό µεταξύ των επιδόσεων του κλειστού συστήµατος και της
προσπάθειας ελέγχου. Ακόµη, αποτελούν ένα µέσο για την επίτευξη επιθυµητής
συµπεριφοράς στη µεταβατική κατάσταση. Αν και ο προσδιορισµός τους δεν
υπόκειται σε µια συστηµατική µέθοδο, εντούτοις η επιλογή τους αφήνει στο
σχεδιαστή πολλούς βαθµούς ελευθερίας και µεταξύ αυτών τη δυνατότητα
τοποθέτησης των πόλων του κλειστού συστήµατος σε επιθυµητές θέσεις (Graupe
1972, Kawasaki and Shimemura 1983, Saif 1989).
Επιδόσεις L1
24
Σύνθεση πολλαπλών στόχων
1.4 Συµπεράσµατα
Ένα φυσικό σύστηµα αυτοµάτου ελέγχου περιγράφεται συνήθως από ένα
µαθηµατικό µοντέλο στο οποίο βασίζεται, κατ’ επέκταση, η ανάλυση και η σύνθεση
ενός αντισταθµιστή (ή ελεγκτή). Στο βαθµό που το µοντέλο περιγράφει µε ακρίβεια
τη συµπεριφορά του πραγµατικού συστήµατος, ο κλασικός αυτόµατος έλεγχος δίνει
εξαιρετικά αποτελέσµατα. Έτσι, µπορεί να βρεθεί µια βέλτιστη λύση που εξασφαλίζει
στο σύστηµα εσωτερική ευστάθεια και επιθυµητές επιδόσεις. Για παράδειγµα, στην
περίπτωση που το µοντέλο είναι ακριβές και οι διαταραχές είναι σήµατα γκαουσιανού
λευκού θορύβου µε γνωστές στατιστικές ιδιότητες, η βέλτιστη λύση δίνεται από έναν
ελεγκτή LQG.
25
Κεφάλαιο 2
26
• ανακριβής γνώση των τιµών των παραµέτρων του µοντέλου η / και
φυσιολογική µεταβολή των τιµών τους κατά τη διάρκεια της λειτουργίας του
συστήµατος
Επειδή τόσο η φύση όσο και η προέλευση των αβεβαιοτήτων ποικίλλουν σε κάθε
σύστηµα, είναι φανερό ότι δεν υπάρχει ένας σφαιρικός τρόπος περιγραφής. Έτσι
ανάλογα µε την περιγραφή του φυσικού συστήµατος ακολουθείται κάθε φορά η
κατάλληλη περιγραφή αβεβαιοτήτων.
G ( s ) = G ( s) + ∆Ga ( s ) , σ [∆Ga ( jω )] ≤ la ( jω ) , ∀ω ≥ 0
27
G ( s ) = G ( s )[ I + ∆Ge ( s )] , σ [∆Ge ( jω )] ≤ le ( jω ) , ∀ω ≥ 0
28
G ( s ) = [ I + ∆Gis ( s )]−1 G ( s ) , σ [∆Gis ( jω )] ≤ lis ( jω ) , ∀ω ≥ 0
⎡ ∆G1 ( s ) 0 ⎤
⎢ . ⎥
∆G ( s ) = ⎢ ⎥
⎢ . ⎥
⎢ ⎥
⎢⎣ 0 ∆Gn ( s ) ⎥⎦
29
2.1.2 Περιγραφή στο χώρο κατάστασης
∆A ≤ a (2.2)
όπου a είναι ένας θετικός αριθµός και . είναι µια νόρµα του τύπου . 2 ή . ∞ .
∆A = ∑ xi Gi wi = G ( x) w (2.3)
i
30
k
∆A = ∑ Ai pi , όπου pi ∈ [ pi , pi ] (2.4)
i =1
k k
A ∈ DA = { A : A = ∑ Ai ai , ai ≥ 0 , ∑a i = 1} (2.5)
i =1 i =1
∆A = DFE (2.6)
31
όπου D ∈ R n×r , E ∈ R l×n είναι γνωστοί πίνακες µε χρονικά αµετάβλητα στοιχεία που
προσδιορίζουν τη δοµή της αβεβαιότητας στον πίνακα κατάστασης. Ο πίνακας
αβεβαιότητας F ανήκει στο πεδίο,
F = {F ∈ R r ×l : F T F ≤ I }
k
∆A = ∑ ∆Ai , όπου ∆Ai = Di Fi Ei , Fi Fi ≤ I
T
i =1
∆A = − DF ( I + D0 F ) −1 E (2.7)
όπου D ∈ R n×r , E ∈ R r×n είναι γνωστοί πίνακες µε χρονικά αµετάβλητα στοιχεία που
προσδιορίζουν τη δοµή της αβεβαιότητας στον πίνακα κατάστασης. Ο πίνακας
αβεβαιότητας F ανήκει στο πεδίο,
Fp = {F ∈ R r ×r : F T + F ≥ 0}
32
Μια περισσότερο δοµηµένη µορφή από την προηγούµενη γράφεται:
k ⎧⎪ F : F T + Fi ≥ 0
∆A = ∑ ∆Ai , όπου ∆Ai = − Di Fi ( I + D0i Fi ) −1 Ei και ⎨ i T i
i =1 ⎪⎩ D0i + D0i > 0
T T T
A + ∆A = A − D( D0 + D0 ) −1 E + D( D0 + D0 ) −1/ 2 Fd ( D0 + D0 ) −1/ 2 E = Ad + Dd Fd Ed
όπου
T T T
Fd = I − ( D0 + D0 )1/ 2 F ( I + D0 F ) −1 ( D0 + D0 )1/ 2 και Fd Fd ≤ I
και
T T T
Ad = A − D( D0 + D0 ) −1 E , Dd = D( D0 + D0 ) −1/ 2 , Ed = ( D0 + D0 ) −1/ 2 E
∆A = DF ( I − D0 F ) −1 E (2.8)
όπου D ∈ R n×r , E ∈ R l×n είναι γνωστοί πίνακες µε χρονικά αµετάβλητα στοιχεία που
προσδιορίζουν τη δοµή της αβεβαιότητας στον πίνακα κατάστασης. Ο πίνακας
αβεβαιότητας F ανήκει στο πεδίο,
F = {F ∈ R r ×l : F T F ≤ I }
T
και ο σταθερός πίνακας D0 ικανοποιεί την ανισότητα I − D0 D0 > 0 . Αυτός ο τύπος
αβεβαιότητας µπορεί να θεωρηθεί ότι επιδρά στο βρόχο ανάδρασης όπως στο
ακόλουθο σχήµα:
33
Σχήµα 2.9 Πραγµατική φραγµένη αβεβαιότητα
Όπως και για την αβεβαιότητα µε φραγµένη νόρµα, µια περισσότερο δοµηµένη
µορφή είναι
⎪⎧ Fi : Fi Fi ≤ I
k T
Υπάρχει ακόµη η ισοδυναµία µε την αβεβαιότητα µε φραγµένη νόρµα και αυτή είναι,
T T T T
A + ∆A = A + D( I − D0 D0 ) −1 D0 E + D( I − D0 D0 ) −1/ 2 Fd ( I − D0 D0 ) −1/ 2 E
= Ad + Dd Fd Ed
όπου
T T T T T
Fd = [( I − D0 D0 )1/ 2 F ( I − D0 F ) −1 − ( I − D0 D0 ) −1/ 2 D0 ]( I − D0 D0 )1/ 2 , Fd Fd ≤ I
και
T T T T
Ad = A + D( I − D0 D0 ) −1 D0 E , Dd = D( I − D0 D0 ) −1/ 2 , Ed = ( I − D0 D0 ) −1/ 2 E
Γενικά δεν υπάρχει µοντελοποίηση της αβεβαιότητας που να µην είναι συντηρητική.
Προκειµένου να µειωθεί ο συντηρητισµός της περιγραφής, πρέπει να επιλέγεται η
κατάλληλη περιγραφή για το εκάστοτε θεωρούµενο πρόβληµα.
34
⎡ 0 1 0 . . . 0 ⎤
⎢ 0 0 1 . . . 0 ⎥⎥
⎢
x(t ) = ⎢ . . . . . . . ⎥ x(t ) + Bu (t )
⎢ ⎥
⎢ 0 0 0 . . . 1 ⎥
⎢⎣ − an −an −1 − an − 2 . . . − a1 ⎥⎦
όπου
0 < ai ≤ ai ≤ ai , i = 1,..., n
p( s ) = s n + a1s n −1 + ... + an
an + an −1s + an − 2 s 2 + an −3 s 3 + an − 4 s 4 + an −5 s 5 + ...
an + an −1s + an − 2 s 2 + an −3 s 3 + an − 4 s 4 + an −5 s 5 + ...
an + an −1s + an − 2 s 2 + an −3 s 3 + an − 4 s 4 + an −5 s 5 + ...
an + an −1s + an − 2 s 2 + an −3 s 3 + an − 4 s 4 + an −5 s 5 + ...
Το αποτέλεσµα αυτό (Yeung and Wang 1987) δίνει µια αναγκαία και ικανή
συνθήκη εύρωστης ευστάθειας. Με την έννοια αυτή, αποτελεί ένα αποτέλεσµα
ανάλυσης. ∆υστυχώς όµως δεν είναι εποικοδοµητικό, επειδή δεν προκύπτουν από
αυτό τεχνικές σύνθεσης εύρωστων ελεγκτών.
2.3 Προσέγγιση H ∞
35
H προσέγγιση H ∞ βασίζεται κυρίως στο θεώρηµα του µικρού κέρδους. Στόχος
είναι η εύρεση ενός αντισταθµιστή K ( s) που σταθεροποιεί το σύστηµα G ( s) και
ικανοποιεί τη συνθήκη µικρού κέρδους, η οποία εκφράζεται ως η τιµή της νόρµας
H ∞ της µεταφοράς Tzw µεταξύ της εξόδου z και της εξωγενούς εισόδου w .
36
Riccati ή µε τη µορφή γραµµικών ανισοτήτων πινάκων, για τις οποίες είναι
διαθέσιµοι αλγόριθµοι και λογισµικά επίλυσης ιδιαίτερα αποτελεσµατικοί. Επιπλέον,
οι συνθήκες εύρωστης ευστάθειας που λαµβάνονται είναι εποικοδοµητικές δηλαδή
οδηγούν άµεσα στη σύνθεση εύρωστων νόµων ελέγχου, που βασίζονται στις εν λόγω
συναρτήσεις Lyapunov.
2
L( x, t ) = xT (t )[ AT (r (t )) P + PA(r (t ))]x(t ) + 2 xT (t ) PB( p(t ))u ( x) ≤ −θ x (2.10)
37
Κάποιες ερευνητικές εργασίες αναφέρονται σε επιµέρους περιπτώσεις
συστηµάτων, των οποίων επιδιώκεται η τετραγωνική ευστάθεια, όπως τα συστήµατα
µε γραµµική παραµετρική αβεβαιότητα (Petersen and Hollot 1986, Schmitendorf
1988) ή αβεβαιότητα µε φραγµένη νόρµα που επιδρά αποκλειστικά στον πίνακα
κατάστασης, οπότε είναι δυνατόν να εξαχθεί µια αναγκαία και ικανή συνθήκη
(Petersen 1987). Αυξάνοντας την τάξη του συστήµατος µε την ενσωµάτωση του
δυναµικού ελεγκτή, είναι δυνατόν να συµπεριληφθεί όλη η αβεβαιότητα στον πίνακα
κατάστασης. Η τετραγωνική ευστάθεια για αυτή την κλάση συστηµάτων µελετήθηκε
τόσο για συνεχή (Zhou and Khargonekar 1988) όσο και για διακριτό χρόνο (Garcia et
al. 1994). Η περίπτωση της πολυτοπικής αβεβαιότητας αντιµετωπίστηκε στην
εργασία (Bernussou et al. 1989), όπου δίνονται συνθήκες τετραγωνικής ευστάθειας
µε τη χρήση µιας κυρτής παραµετροποίησης του συνόλου των κερδών που
σταθεροποιούν το σύστηµα. Η κυρτότητα επιτρέπει την αναγωγή των συνθηκών
τετραγωνικής ευστάθειας σ’ ένα πρόβληµα βελτιστοποίησης για τον προσδιορισµό
κατάλληλων νόµων ελέγχου µε ανάδραση κατάστασης.
Πολυτοπική αβεβαιότητα
k k
DA = { A ∈ R n×n , A = ∑ Ai ai , ai ≥ 0 , ∑a i = 1}
i =1 i =1
l l
DB = {B ∈ R n×m , B = ∑ Bi β i , β i ≥ 0 , ∑β i = 1}
i =1 i =1
38
Θεώρηµα 2.2 (Bernussou et al. 1989)
Το σύστηµα (2.11) είναι τετραγωνικά σταθεροποιήσιµο µε γραµµική ανάδραση
κατάστασης, αν και µόνον αν υπάρχουν δύο πίνακες S = S T > 0 ∈ R n×n και R ∈ R m×n ,
τέτοιοι ώστε,
T ⎧i = 1, 2,..., k
Ai S + SAi + B j R + RT B j < 0 ⎨
⎩ j = 1, 2,..., l
u (t ) = RS −1 x(t )
⎛ AS + SAT + BR + RT BT + DDT SE T ⎞
⎜ ⎟<0
⎝ ES −I ⎠
u (t ) = RS −1 x(t )
όπου
(∆A ∆B) = DF ( E1 E2 ) , FT F ≤ I
39
⎛ AS + SAT + BR + RT BT + DDT SE1 + RT E2 ⎞
T T
⎜ ⎟<0
⎝ E1S + E2 R −I ⎠
u (t ) = RS −1 x(t )
1
AT P + PA − PBR −1 BT P + µ PDT DP + ET E + Q = 0 (2.14)
µ
έχει µία συµµετρική και θετικά ορισµένη λύση P . Στην περίπτωση αυτή ο νόµος
ελέγχου που σταθεροποιεί το σύστηµα είναι
u (t ) = − R −1 BT Px(t )
Στο θεώρηµα αυτό έχει σηµασία το γεγονός ότι η λύση της εξίσωσης Riccati (2.14)
είναι ανεξάρτητη από την επιλογή των πινάκων Q και R . Η επίλυση της (2.14)
βασίζεται στην ιδιότητα ότι, αν υπάρχει ένα βαθµωτό µ * για το οποίο αυτή έχει
λύση, τότε για κάθε πραγµατικό αριθµό στο διάστηµα (0, µ * ] , η (2.14) έχει µια
συµµετρική θετικά ορισµένη λύση. Έτσι, ο υπολογισµός της λύσης µπορεί να γίνει µε
τον παρακάτω αλγόριθµο ο οποίος αποτελεί και µια δοκιµή τετραγωνικής
σταθεροποιησιµότητας του συστήµατος (2.12).
40
Αλγόριθµος
Πρέπει να σηµειωθεί ότι η παραπάνω µέθοδος δοκιµής και σφάλµατος δεν αποτελεί
συστηµατικό τρόπο επίλυσης της (2.14). Εξισώσεις Riccati µε πρόσθετους όρους της
µορφής αυτής είναι γνωστές ως τροποποιηµένες ή γενικευµένες εξισώσεις Riccati. Στα
επόµενα κεφάλαια θα περιγραφούν συστηµατικοί τρόποι επίλυσής τους µε τη χρήση
LMI.
Στην περίπτωση που τόσο ο πίνακας κατάστασης όσο και ο πίνακας εισόδου
είναι αβέβαιοι, είναι δυνατόν να θεωρηθεί το µοντέλο αυξηµένης διάστασης (Zhou
and Khargonekar 1988), οπότε όλη η αβεβαιότητα ενσωµατώνεται στον πίνακα
κατάστασης και µεταπίπτει στην προηγούµενη περίπτωση. Είναι όµως επίσης
δυνατόν να εφαρµοστεί µια άµεση προσέγγιση θεωρώντας και τους δύο πίνακες
αβέβαιους. Μια αναγκαία και ικανή συνθήκη δίνεται από το ακόλουθο θεώρηµα.
1 1
AT P + PA − PBR −1 BT P + µ PDT DP +
T T
E1 ( I − E2 R −1 E2 ) E1 + Q = 0 (2.15)
µ µ
όπου
1 T 1 T
A = A− BR −1 E2 E1 και R = R + E2 E1
µ µ
έχει µία συµµετρική και θετικά ορισµένη λύση P . Στην περίπτωση αυτή ο νόµος
ελέγχου που σταθεροποιεί το σύστηµα είναι
41
1 T
u (t ) = − R −1 ( BT P + E2 E1 ) x(t )
µ
• E ( sI − A) −1 D <1
∞
Πόρισµα 2.1
Για το σύστηµα (2.16) υπάρχει µία τετραγωνική συνάρτηση Lyapunov
V ( x) = xT (t ) Px(t ) τέτοια ώστε,
42
είναι ισοδύναµο µε το ακόλουθο πρόβληµα H ∞ :
Ζητείται να βρεθεί ένας νόµος ελέγχου που να εξασφαλίζει την εσωτερική ευστάθεια
του συστήµατος
Tzw ∞
<1
2.5 Συµπεράσµατα
Στο κεφάλαιο αυτό παρουσιάστηκαν διαφορετικές µαθηµατικές περιγραφές
της αβεβαιότητας που χρησιµοποιούνται συχνά στις µεθόδους εύρωστης ανάλυσης
και σύνθεσης. Μελετήθηκε επίσης η ευστάθεια συστηµάτων µε αβεβαιότητες µε
ιδιαίτερη έµφαση στο πρόβληµα της τετραγωνικής ευστάθειας. Η επίλυση του
τελευταίου γίνεται τόσο µε γενικευµένες εξισώσεις Riccati όσο και µε γραµµικές
ανισότητες πινάκων.
43
Κεφάλαιο 3
44
k
∆ A = ∑ Ai ri (3.2)
i =1
l
∆ B = ∑ Bi pi
i =1 (3.3)
V ( x, t ) = xT (t ) Px(t ) , (3.6)
⋅
η παράγωγος Lyapunov V ( x, t ) που αντιστοιχεί στο κλειστό σύστηµα ικανοποιεί την
ανισότητα,
⋅
2
V ( x, t ) ≤ −θ x (3.7)
για κάθε µη µηδενικό x(t ) ∈ R n και κάθε t ∈ [0, ∞) . Το κλειστό σύστηµα που
προκύπτει είναι ασυµπτωτικά ευσταθές, για όλες τις αποδεκτές αβεβαιότητες.
45
∞
J ( x0 , ∆Α, ∆ B, t ) = ∫ [ xT (t )Qx(t ) + u T (t ) Ru (t )]dt , (3.8)
0
T
J ( x0 ) = x0 Px0 (3.11)
είναι ένα εγγυηµένο κόστος, αν υπάρχει ένας θετικά ορισµένος συµµετρικός πίνακας
P που ικανοποιεί τη γενικευµένη αλγεβρική εξίσωση Riccati (generalized algebraic
Riccati equation GARE),
PA + AT P − PBR −1 BT P + Q + A ( P ) = 0 (3.12)
46
όπου A ( P) είναι µια συνάρτηση άνω φράγµατος που εξαρτάται από τις αβεβαιότητες
και που ικανοποιεί τη σχέση,
για κάθε x(t ) ∈ R n , t ∈ [0, ∞) και για όλες τις αποδεκτές αβεβαιότητες. Επιπλέον, το
κλειστό σύστηµα είναι τετραγωνικά ευσταθές.
V ( x, t ) ≤ − xT (t )Qx(t ) − u T (t ) Ru (t )
Από τον ορισµό (3.1) προκύπτει ότι το κλειστό σύστηµα είναι τετραγωνικά ευσταθές,
θεωρώντας θ = λmin (Q + K T RK ) και εποµένως x(t ) → 0, όταν t → ∞ .
Ολοκληρώνοντας και τα δύο µέλη της παραπάνω ανισότητας, προκύπτει
T
J ( x0 , u , ∆A, ∆B, t ) ≤ x0 Px0
47
3.2 Συστήµατα µε αβεβαιότητα µόνο στον πίνακα κατάστασης
Εφόσον ο πίνακας
k
P∆A + ∆AT P = ∑ ri [ PAi + AiT P] (3.15)
i =0
T T
M i [ PAi + Ai P ]M i = Λ i (3.16)
k
A( P) = ∑ M i Λi M i .
T
(3.17)
i =1
48
χρήση γραµµικών συναρτήσεων φραγµάτων έχει ιδιαίτερο ενδιαφέρον διότι στις
περιπτώσεις αυτές υπάρχουν αναλυτικές λύσεις των GARE και µπορούν να
υπολογιστούν µε τη χρήση επαναληπτικών αλγορίθµων (Kosmidou and Bertrand
1987, Kosmidou 1987). Ακόµη, έχει αποδειχθεί (Gilman and Rhodes 1976) ότι ένας
νόµος ελέγχου της µορφής (3.10) δίνει το ελάχιστο άνω φράγµα της (3.8), δηλαδή το
ελάχιστο εγγυηµένο κόστος, µεταξύ όλων των νόµων ελέγχου από ένα κυρτό σύνολο.
hT y + yT h ≤ hT Γh + yT Γ −1 y (3.18)
k
P∆A + ∆AT P ≤ kPΓP + ∑ Ai Γ −1 Ai
T
(3.19)
i =1
k
A ( P) = kε P + ε −1 ∑ Ai PAi .
T
(3.20)
i =1
µεγέθους της αβεβαιότητας. Ένα άλλο γραµµικό φράγµα είναι της µορφής
A( P) = θ P + θ tr ( P) I (3.21)
Θεώρηµα 3.4
Έστω ότι η GARE (3.12) έχει µια µοναδική θετικά ορισµένη λύση P . Έστω Pj ,
j = 0,1,..., µια ακολουθία µοναδικών θετικά ορισµένων λύσεων των αλγεβρικών
εξισώσεων Lyapunov
T T
Pj Aj + Aj Pj + Q j + K j RK j = 0 (3.22)
49
όπου Aj = A + BK j , K j +1 = − R −1 BT Pj , Q j +1 = Q + A ( Pj ) , Q0 = Q , j = 0,1,... , όπου
οι A ( Pj ) προσδιορίζονται από την (3.20) (ή την (3.21)) και K 0 επιλέγεται, έτσι ώστε
A0 = A + BK 0 να είναι ένας ευσταθής πίνακας. Τότε,
(i) Po ≥ P1 ≥ ... ≥ Pj ≥ ..., j = 0,1,...
(ii) lim Pj = P
j →∞
P ( A + α I ) + ( A + α I )T P − PBR −1 BT P + Q = 0 (3.23)
µε τη χρήση του φράγµατος (3.21). Η εξίσωση (3.23) έχει τη µορφή µιας κανονικής
εξίσωσης Riccati. Επιπλέον, το γεγονός ότι P > 0 συνεπάγεται Q ≥ 0 . Άρα, η (3.23)
έχει µια µοναδική θετικά ορισµένη λύση, εάν (i) το ζεύγος ( A + α I , B) είναι ελέγξιµο
και (ii) το ζεύγος ( A + α I , Q1/ 2 ) είναι παρατηρήσιµο (Anderson and Moore 1990).
Στην περίπτωση αυτή, ο νόµος ελέγχου εγγυηµένου κόστους µπορεί να ερµηνευτεί ως
ένας βέλτιστος νόµος ελέγχου για το σύστηµα ( A + α I , B) , ως προς ένα
τροποποιηµένο τετραγωνικό κριτήριο κόστους µε πίνακες βάρους (Q, R) . Κατά
συνέπεια, το σύστηµα κλειστού βρόχου έχει περιθώρια ευστάθειας και εγγενείς
ιδιότητες ευρωστίας που εξασφαλίζονται από τον βέλτιστο γραµµικό τετραγωνικό
ρυθµιστή (LQR) (Safonov and Athans 1977), για όλες τις αποδεκτές αβεβαιότητες.
Επιπλέον, µια κατάλληλη επιλογή του ε µπορεί να εξασφαλίσει τον επιθυµητό
βαθµό σχετικής ευστάθειας (Anderson and Moore 1990).
50
3.3 Συστήµατα µε αβεβαιότητα στον πίνακα κατάστασης και στον πίνακα
εισόδου
Όταν τόσο ο πίνακας κατάστασης όσο και ο πίνακας εισόδου είναι αβέβαιοι,
δηλαδή ∆A ≠ 0 , ∆B ≠ 0 , προκύπτουν µη γραµµικές συναρτήσεις άνω φραγµάτων.
Ειδικότερα, κάποιοι από τους όρους της A ( P) είναι τετραγωνικοί ως προς P . Θα
θεωρήσουµε δύο περιπτώσεις:
−2
Θi := ai I m , i = 1,..., k
2 T
Ξ i := ai Ai Ai , i = 1,..., k
−2
Φ i := bi I m , i = 1,..., l
2 T
Ψ i := bi R −1 Bi Bi R −1 , i = 1,..., l (3.25)
k l
A ( P ) = ∑ Ξ i + PBΘi BT P + ∑ PB(Φ i + Ψ i ) BT P (3.26)
i =1 i =1
PA + AT P − PBRˆ −1 BT P + Qˆ = 0 (3.27)
εξίσωση αυτή έχει µια µοναδική θετικά ορισµένη λύση, όταν ο πίνακας R̂ είναι
θετικά ορισµένος και εφόσον ικανοποιούνται οι γνωστές συνθήκες ελεγξιµότητας και
παρατηρησιµότητας. Επίσης, το κλειστό σύστηµα έχει τις ιδιότητες εγγενούς
ευρωστίας που συνδέονται µε τη σχεδίαση LQR.
51
3.3.2 Γενική περίπτωση
T
Ai = di ei , i = 1, 2,..., k , (3.28)
T
Bi = f i gi , i = 1, 2,..., l . (3.29)
k k
T := ∑ di diT , U := ∑ ei eiT ,
i =1 i =1
k k
V := ∑ gi giT , W := ∑ f i fi T . (3.30)
i =1 i =1
είναι ένα άνω φράγµα της µορφής (3.13) (Petersen and Hollot 1986, Schmitendorf
1988), που οδηγεί στην GARE,
PA + AT P − P( BR −1 BT − BR −1VR −1 B − W − T ) P + Q + U = 0 (3.32)
Η εξίσωση αυτή δεν έχει γενικά αναλυτική λύση. Είναι γνωστό από τη θεωρία του
LQR ότι εξισώσεις της µορφής (3.32) έχουν µια θετικά ορισµένη λύση P , αν οι
αντίστοιχοι τετραγωνικοί όροι είναι θετικά ορισµένοι. Λόγω της ύπαρξης των
αβεβαιοτήτων, η συνθήκη αυτή δεν ικανοποιείται πάντα. Πράγµατι, η θετικότητα του
τετραγωνικού όρου της (3.32) εξαρτάται από τα σχετικά µεγέθη των πινάκων που
εµφανίζονται σ’ αυτόν και που εξαρτώνται από τις αβεβαιότητες. Ωστόσο, επειδή η
συνθήκη αυτή είναι µόνο ικανή, µια θετικά ορισµένη λύση P µπορεί να υπάρχει,
ακόµη και αν ο τετραγωνικός όρος της (3.32) δεν είναι θετικά ορισµένος. Εξάλλου,
εφόσον ο πίνακας βάρους ελέγχου R επιλέγεται από το σχεδιαστή, µπορούµε να
έχουµε πολλούς βαθµούς ελευθερίας αντικαθιστώντας το R µε ε R , όπου ε είναι µια
αυθαίρετη θετική σταθερά µε τιµές 0 < ε ≤ 1 . Έτσι, ο νόµος ελέγχου εγγυηµένου
κόστους γίνεται,
52
PA + AT P − P[(1/ ε ) BR −1 BT − (1/ ε 2 ) BR −1VR −1 B − W − T ]P + Q + U = 0 (3.34)
Τώρα, αναζητείται µια θετικά ορισµένη λύση της (3.34), για µια κατάλληλη τιµή του
ε . Προφανώς, στην περίπτωση αυτή η GARE επιλύεται µε «δοκιµή και σφάλµα». Η
µέθοδος αυτή χρησιµοποιήθηκε για την επίλυση προβληµάτων εύρωστης ευστάθειας
και εύρωστου ελέγχου (Petersen and Hollot 1986, Schmitendorf 1988).
Μια ικανή και αναγκαία συνθήκη για την ύπαρξη λύσης της γενικευµένης
αλγεβρικής εξίσωσης Riccati µπορεί να διατυπωθεί ερµηνεύοντάς την στο πλαίσιο
της θεωρίας των γραµµικών τετραγωνικών παιγνίων (Kosmidou et al. 1991).
Ειδικότερα, έχει αποδειχθεί ότι η εξίσωση (3.34) έχει µια θετικά ορισµένη λύση για
κάποιο ε , 0 < ε ≤ 1 , εάν και µόνον εάν ο 2n × 2n Hamiltonian πίνακας
⎡ A − M (ε ) ⎤
H =⎢ (3.35)
⎣ −Q − U − AT ⎥⎦
όπου
−1 −1
M (ε ) = (1/ ε ) BR −1 BT − (1/ ε 2 ) BR VR BT − W − T (3.36)
δεν έχει καθαρά φανταστικές ιδιοτιµές. Επιπλέον, είναι γνωστό ότι οι κανονικές
εξισώσεις Riccati επιλύονται χρησιµοποιώντας το διαχωρισµό κατά Shur του
αντίστοιχου Hamiltonian πίνακα. Επεκτείνοντας τη µέθοδο αυτή, µπορούµε να
επιλύσουµε τις συζευγµένες εξισώσεις Riccati που προκύπτουν στα γραµµικά
τετραγωνικά διαφορικά παίγνια (Abou-Kandil and Bertrand 1986, Abou-Kandil et al.
2003). Με τον ίδιο αλγόριθµο µπορεί να επιλυθεί και η (3.34), έχοντας εξασφαλίσει
ότι υπάρχει µια θετικά ορισµένη λύση, για κάποιο ε , 0 < ε ≤ 1 .
53
Ai = σ i1/ 2 diσ i −1/ 2 eiT , i = 1,..., k (3.37)
όπου σ i ,τ i είναι θετικές βαθµωτές ποσότητες που πρέπει να επιλεγούν µέσω της
σχεδίασης. Για το λόγο αυτό ορίζονται οι παρακάτω πίνακες:
D := [d1...d k ] , F := [ f1... f l ]
E := [e1...ek ] , G := [ g1...gl ] (3.39)
S := diag (σ 1...σ k ) , T := diag (τ 1...τ l ) .
Θεώρηµα 3.5
Έστω το αβέβαιο σύστηµα (3.1) και το αντίστοιχο τετραγωνικό κριτήριο (3.8). Αν
υπάρχουν συµµετρικοί και θετικά ορισµένοι πίνακες M , P , διαγώνιοι και θετικά
ορισµένοι πίνακες S , T και ένας θετικός αριθµός δ , τέτοιοι ώστε το ακόλουθο
πρόβληµα ελαχιστοποίησης
min[tr ( M )] (3.40)
( M , P , S ,T ,δ )
µε περιορισµούς LMI
⎡M I⎤
⎢ ⎥>0 (3.41)
⎣I P⎦
και
u * (t ) = −δ R −1 BT Px(t ) (3.43)
J * = tr ( P) (3.44)
54
είναι το εγγυηµένο κόστος για το σύστηµα (3.1) µε τυχαίες αρχικές συνθήκες, όπου
P = P −1 και δ = 1/ ε .
3.5 Παράδειγµα
⎡ 0 1⎤ ⎡0 0⎤ ⎡0 0 ⎤ ⎡0 ⎤
A=⎢ ⎥ , A1 = ⎢ ⎥ , A2 = ⎢ ⎥ , B=⎢ ⎥
⎣ −2 1⎦ ⎣1 0 ⎦ ⎣ 0 1.5⎦ ⎣1 ⎦
55
Μέθοδος σχεδίασης Εγγυηµένο κόστος tr ( P) Βέλτιστο κόστος
Γραµµικό φράγµα 317.2 62.4
(3.20)
Γραµµικό φράγµα 347.8 62.4
(3.21)
Τετραγων. φράγµα 233.1 62.4
(3.26)
LMI 211.6 62.4
Πίνακας 3.2. Τιµές εγγυηµένου κόστους και βέλτιστη τιµή της συνάρτησης κόστους
για το ονοµαστικό σύστηµα
Ας σηµειωθεί, ότι η τιµή του εγγυηµένου κόστους που λαµβάνεται µε τη µέθοδο LMI
είναι ελάχιστη. Ο βέλτιστος διαχωρισµός µοναδιαίας τάξης επιτυγχάνεται για
σ 1 = 0.0143 , σ 2 = 0.0215 .
Έστω τώρα η περίπτωση, κατά την οποία και ο πίνακας εισόδου επηρεάζεται από
αβεβαιότητες, δηλαδή ∆B = B1 p1 . Για τους πίνακες αβεβαιοτήτων λαµβάνονται κατ’
αρχάς αυθαίρετοι διαχωρισµοί µοναδιαίας τάξης,
⎡0 0⎤ ⎡0⎤ ⎡0 0 ⎤ ⎡0 ⎤
A1 = ⎢ ⎥ = ⎢ ⎥ [1 0] = d1e1T , A2 = ⎢ ⎥ = ⎢1 ⎥ [ 0 1.5] = d 2 e2 ,
T
⎣ 1 0 ⎦ ⎣ ⎦1 ⎣ 0 1.5 ⎦ ⎣ ⎦
⎡ 0 ⎤ ⎡0⎤
B1 = ⎢ ⎥ = ⎢ ⎥ 0.1 = f1 g1T
⎣0.1⎦ ⎣1 ⎦
r1 = r2 = s1 = 0 r1 = r2 = 1, p1 = 1 r1 = r2 = −1, p1 = −1
−0.3 , −7.5 −0.1 , −7.0 −0.25 ± j1.71
Πρέπει να σηµειωθεί, ότι, όταν και οι δύο πίνακες, κατάστασης και εισόδου, είναι
αβέβαιοι, απαιτείται µεγαλύτερος έλεγχος πράγµα που εκφράζεται µε µεγαλύτερο
κέρδος ανάδρασης και συνεπώς µεγαλύτερη τιµή του εγγυηµένου κόστους.
3.6 Συµπεράσµατα
56
1. Όταν οι αβεβαιότητες επηρεάζουν µόνο τον πίνακα κατάστασης, µπορούν
να χρησιµοποιηθούν γραµµικές συναρτήσεις φράγµατος. Στην περίπτωση αυτή
υπάρχει αναλυτική λύση της GARE, εφόσον πληρούνται οι απαιτούµενες
προϋποθέσεις ελεγξιµότητας, παρατηρησιµότητας και θετικότητας. Η λύση
υπολογίζεται µε τη χρήση επαναληπτικών αλγορίθµων των οποίων η σύγκλιση έχει
αποδειχθεί. Το εγγυηµένο κόστος είναι το ελάχιστο λόγω της δοµής του νόµου
ελέγχου. Το κλειστό σύστηµα έχει τις εγγενείς ιδιότητες ευρωστίας που
χαρακτηρίζουν το βέλτιστο έλεγχο LQR, δηλαδή περιθώρια ενίσχυσης και φάσης,
ανοχή σε µη γραµµικότητες, µείωση του κέρδους και, σε µερικές περιπτώσεις, βαθµό
σχετικής ευστάθειας.
57
Κεφάλαιο 4
58
k1 k2 l1 l2
∆A1 = ∑ A1i r1i , ∆A2 = ∑ A2i r2i , ∆B1 = ∑ B1i p1i , ∆B2 = ∑ B2i p2i (4.2)
i =1 i =1 i =1 i =1
όπου A1i , A2i , B1i , B2i είναι δοθέντες σταθεροί πίνακες κατάλληλων διαστάσεων, που
προσδιορίζουν τη δοµή της αβεβαιότητας στους όρους κατάστασης, εισόδου και
καθυστέρησης. Οι βαθµωτές ποσότητες r1i , r2i , p1i , p2i είναι αβέβαιες παράµετροι,
που ανήκουν σε γνωστά σύνολα και είναι φραγµένες από θετικές ποσότητες, έτσι
ώστε r1i ≤ r1i , r2i ≤ r2i , p1i ≤ p1i , p2i ≤ p2i . Όπως αναφέρθηκε και στην παράγραφο
3.1, σε µια κανονικοποιηµένη περιγραφή, οι αβέβαιες παράµετροι µπορούν να
θεωρηθούν φραγµένες από τη µονάδα, χωρίς να µειώνεται η γενικότητα του
προβλήµατος. Το πλεονέκτηµα της γραµµικής περιγραφής της αβεβαιότητας είναι η
δυνατότητα διαχωρισµού µοναδιαίας τάξης που τώρα είναι της µορφής
T
A1i = d1i e1i , i = 1,..., k1
T
A2i = d 2i e2i , i = 1,..., k2
T
B1i = f1i g1i , i = 1,..., l1
T
B2i = f 2i g 2i , i = 1,..., l2 (4.3)
D1 := [d11...d1k1 ] , D2 := [d 21...d 2 k2 ]
E1 := [e11...e1k1 ] , E2 := [e21...e2 k2 ]
59
Με το σύστηµα (4.1) συνδέεται η τετραγωνική συνάρτηση κόστους
∞
J ( x0 , t ) = ∫ [ xT (t )Qx(t ) + u T (t ) Ru (t )]dt , (4.6)
0
u (t ) = Kx(t ) (4.7)
ικανοποιεί τη συνθήκη
⋅
2
L( x, t ) ≤ −θ x (4.9)
κατά µήκος των λύσεων x(t ) της (4.1), για το νόµο ελέγχου (4.7), για κάθε x(t ) και
για κάθε αποδεκτή αβεβαιότητα και χρονική καθυστέρηση, δηλαδή τέτοιες ώστε να
ικανοποιούν τις σχέσεις (4.2), (4.3) και (4.5), αντίστοιχα.
Ορισµός 4.2
Για το σύστηµα (4.1)-(4.5) µε τετραγωνικό κριτήριο κόστους (4.6), ένας γραµµικός
νόµος ελέγχου ανάδρασης κατάστασης της µορφής (4.7) είναι ένας νόµος ελέγχου
εγγυηµένου κόστους, αν υπάρχει ένας θετικός αριθµός V ( x0 , φ (− d1 ), φ (−d 2 )) , που
λέγεται εγγυηµένο κόστος, έτσι ώστε,
J ( x0 , t ) ≤ V ( x0 , φ (− d1 ), φ (− d 2 )) (4.10)
60
για κάθε x(t ) και για κάθε αποδεκτή αβεβαιότητα και χρονική καθυστέρηση.
Θεώρηµα 4.3
Έστω το σύστηµα (4.1)-(4.5) µε τετραγωνικό κριτήριο κόστους (4.6) νόµο ελέγχου
της µορφής (4.7) που ικανοποιεί τη συνθήκη
⋅
L( x, t ) ≤ − xT (t )[Q + K T RK ]x(t ) (4.11)
για κάθε x(t ) και για κάθε αποδεκτή αβεβαιότητα και χρονική καθυστέρηση. Τότε, ο
(4.7) είναι ένας νόµος ελέγχου εγγυηµένου κόστους και
0 0
V ( x0 , φ (− d1 ), φ (−d 2 )) = x0 Px0 + ∫ φ (τ ) R1φ (τ )dτ + ∫φ (τ ) K T R2 Kφ (τ )dτ (4.12)
T T T
− d1 − d2
είναι ένα εγγυηµένο κόστος της (4.6). Επιπλέον, το κλειστό σύστηµα είναι
τετραγωνικά ευσταθές.
T T
L( x(T ), T ) − L( x0 , 0) = x (T ) Px(T ) + ∫ x (τ ) R1 x(τ )dτ + ∫ xT (τ ) K T R2 Kx(τ )dτ
T T
T − d1 T − d2
0 0 T
− d1 − d2 0
Επειδή η (4.11) ικανοποιείται για L > 0 , έπεται από τον Ορισµό 4.1 ότι και η (4.9)
ικανοποιείται για θ = λmin (Q + K T RK ) . Συνεπώς, ο (4.7) εξασφαλίζει την
τετραγωνική ευστάθεια του κλειστού συστήµατος, πράγµα που σηµαίνει ότι
L( x, t ) → 0 , καθώς T → ∞ , κατά µήκος των λύσεων x(t ) του συστήµατος. Άρα η
παραπάνω σχέση γίνεται
∞ 0 0
0 − d1 − d2
61
4.2 Λύση στο πλαίσιο των LMI
−1/ 2
A1i = σ 1i d1iσ 1i
1/ 2 T
e1i , i = 1,..., k1
−1/ 2
A2i = σ 2i d 2iσ 2i
1/ 2 T
e2i , i = 1,..., k2
−1/ 2
B1i = τ 1i f1iτ 1i
1/ 2 T
g1i , i = 1,..., l1
−1/ 2
B2i = τ 2i f 2iτ 2i
1/ 2 T
g 2i , i = 1,..., l2 (4.13)
Τότε, µια λύση στο πρόβληµα του εύρωστου ελέγχου εγγυηµένου κόστους για το
αβέβαιο σύστηµα µε χρονικές καθυστερήσεις µπορεί να υπολογιστεί από την επίλυση
ενός προβλήµατος εφικτότητας LMI.
Θεώρηµα 4.4
Έστω το αβέβαιο σύστηµα µε χρονικές καθυστερήσεις (4.1)-(4.5) µε τετραγωνική
συνάρτηση κόστους (4.6). Υποθέτουµε ότι υπάρχουν θετικά ορισµένοι πίνακες
S1 , S 2 , T1 , T2 ,W , R1 , R2 , έτσι ώστε το LMI,
όπου
62
T T T T
Λ (.) = AW
1 + WA1 − B1R −1B1 + A2W + WA2 + B2 R −1B2
T T T T
+ D1S1D1 + D2 S 2 D2 + FT
1 1 F1 + F2T2 F2
και
Q = Qˆ −1 , R1 = R1
−1 −1
, R2 = R2
T
u (t ) = − R −1 B1 Px(t ) (4.16)
όπου
P := W −1 (4.17)
− d1 − d2
(4.18)
T
L( x, t ) = 2 xT (t ) P{[ A1 + ∆A1 ]x(t ) + [ A2 + ∆A2 ] x(t − d1 ) − [ B1 + ∆B1 ]R −1 B1 Px(t ) −
T T
[ B2 + ∆B2 ]R −1 B1 Px(t − d 2 )} + xT (t ) R1 x(t ) + xT (t ) PB1 R −1 R2 R −1 B1 Px(t )
k1
2 xT (t ) P∆A1 x(t ) ≤ 2 xT (t ) P∆A1 x(t ) ≤ ∑ 2 xT (t ) PA1r1 x(t ) ≤
i =1
k1
∑ 2x
−1/ 2
(t ) P(d1iσ 1i )(e1i σ 1i
1/ 2 T
T
) x(t ) ≤
i =1
k1 k1
xT (t ) P ∑ σ 1i d1i d1i Px(t ) + xT (t )∑ σ 1i e1i e1i x(t ) =
T −1 T
i =1 i =1
T −1 T
x (t ) PD1S1 D Px(t ) + x (t ) E1S1 E1 x(t )
T
1
T
T −1 T
2 xT (t ) P∆A2 x(t − d1 ) ≤ xT (t ) PD2 S2 D2 Px(t ) + xT (t − d1 ) E2 S2 E2 x(t − d1 )
63
T T −1 T T
−2 xT (t ) P∆B1 R −1 B1 Px(t ) ≤ xT (t ) PFT −1 −1
1 1 F1 Px (t ) + x (t ) PB1 R G1T1 G1 R B1 Px (t )
T
T T
−2 xT (t ) P∆B2 R −1 B1 Px(t − d 2 ) ≤ xT (t ) PF2T2 F2 Px(t ) +
−1 T T
xT (t − d 2 ) PB1 R −1G2T2 G2 R −1 B1 Px(t − d 2 )
Θεώρηµα 4.5
Έστω το αβέβαιο σύστηµα µε χρονικές καθυστερήσεις (4.1)-(4.5) µε τετραγωνική
συνάρτηση κόστους (4.6). Υποθέτουµε ότι υπάρχουν θετικά ορισµένοι πίνακες
S1 , S 2 , T1 , T2 ,W , R1 , R2 , M 1 , M 2 , M 3 , έτσι ώστε το ακόλουθο πρόβληµα
ελαχιστοποίησης,
⎡−M1 In ⎤
⎢ I <0 (4.20)
⎣ n −W ⎥⎦
⎡−M 2 In ⎤
⎢ I <0 (4.21)
⎣ n − R1 ⎥⎦
⎡−M 3 Im ⎤
⎢ I <0 (4.22)
⎣ m − R2 ⎥⎦
T
u (t ) = − R −1 B1 Px(t ) (4.23)
όπου
64
P := W −1 (4.24)
− d1 − d2
(4.25)
4.3 Παράδειγµα
⎡0 0⎤ ⎡ 0 0 ⎤ ⎡0⎤ ⎡ 0 ⎤
∆A1 = ⎢ ⎥ , ∆A2 = ⎢ ⎥ , ∆B1 = ⎢ ⎥ , ∆B2 = ⎢ ⎥
⎣0.1 0.1⎦ ⎣ 0.03 0.03⎦ ⎣ 0.1⎦ ⎣0.03⎦
Θεωρούµε κατ’ αρχάς έναν αυθαίρετο διαχωρισµό µοναδιαίας τάξης, για τον οποίο,
65
⎡0⎤ ⎡ 0 ⎤ ⎡1⎤ ⎡0⎤ ⎡ 0 ⎤
D1 = ⎢ ⎥ , D2 = ⎢ ⎥ , E1 = E2 = ⎢ ⎥ , F1 = ⎢ ⎥ , F2 = ⎢ ⎥ , G1 = G2 = 1
⎣0.1⎦ ⎣ 0.03⎦ ⎣1⎦ ⎣0.1⎦ ⎣ 0.03⎦
4.4 Συµπεράσµατα
66
Κεφάλαιο 5
67
Στη συνέχεια, θα παρουσιαστεί ο εύρωστος έλεγχος εγγυηµένου κόστους µε
ταυτόχρονη τοποθέτηση των πόλων του κλειστού συστήµατος.
k
∆A = ∑ Ai ri (5.2)
i =0
Ai = δ iε i , i = 1, 2,..., k
T
(5.4)
k k
T := ∑ δ iδ i , U := ∑ ε iε i
T T
(5.5)
i =1 i =1
68
Λόγω της ύπαρξης των αβεβαιοτήτων, το παραπάνω πρόβληµα
βελτιστοποίησης θα θεωρηθεί στο πλαίσιο του ελέγχου εγγυηµένου κόστους. Στη
συνέχεια, γνωστά αποτελέσµατα σχετικά µε το εγγυηµένο κόστος παρουσιάζονται
αναπροσαρµοσµένα για το θεωρούµενο σύστηµα.
Ορισµός 5.1
Έστω το σύστηµα (5.1)-(5.3) µε τετραγωνική συνάρτηση κόστους (5.6). Ένας νόµος
ελέγχου u (t ) : R n → R m , t ∈ [t0 , ∞) είναι ένας νόµος ελέγχου εγγυηµένου κόστους
(guaranteed cost control GCC), αν υπάρχει ένας θετικός αριθµός J , που λέγεται
εγγυηµένο κόστος, τέτοιος ώστε J ( x0 , u (.), t0 , ∆A) ≤ J , για κάθε αποδεκτή αβεβαιότητα
δηλαδή που πληροί τις (5.2), (5.3).
Θεώρηµα 5.2
Έστω το σύστηµα (5.1)-(5.3) µε τετραγωνική συνάρτηση κόστους (5.6). Ο
γραµµικός νόµος ελέγχου ανάδρασης κατάστασης
u (t ) = − R −1 BT Px(t ) (5.7)
T
J = x0 Px0 (5.8)
είναι ένα εγγυηµένο κόστος, αν υπάρχει ένας θετικά ορισµένος συµµετρικός πίνακας
P που ικανοποιεί τη γενικευµένη αλγεβρική εξίσωση Riccati
PA + AT P − P( BR −1 BT − T ) P + Q + U = 0 . (5.9)
Το κλειστό σύστηµα που προκύπτει είναι ασυµπτωτικά ευσταθές, για κάθε αποδεκτή
αβεβαιότητα.
69
∞
Jα ( x0 , u (.), t0 , ∆A) = ∫ e 2α t [ xT (t )Qx(t ) + uT (t ) Ru (t )]dt (5.10)
t0
xˆ (t ) = ( A + ∆A + α I ) xˆ (t ) + Buˆ (t )
xˆ (t0 ) = xˆ0 = eα t0 x0 (5.11)
∞
Jˆ ( xˆ0 , uˆ (.), t0 , ∆A) = ∫ [ xˆ T (t )Qxˆ (t ) + uˆ T (t ) Ruˆ (t )]dt (5.12)
t0
Θεώρηµα 5.3
Έστω το αβέβαιο σύστηµα (5.1)-(5.3) µε τετραγωνική συνάρτηση κόστους (5.10). Ο
νόµος ελέγχου
u * (t ) = − R −1 BT P* x(t ) (5.13)
είναι ένας νόµος ελέγχου εγγυηµένου κόστους που εξασφαλίζει βαθµό σχετικής
ευστάθειας α , για όλες τις αποδεκτές αβεβαιότητες, αν υπάρχει ένας θετικά
ορισµένος συµµετρικός πίνακας P* που ικανοποιεί τη γενικευµένη αλγεβρική
εξίσωση Riccati,
P* ( A + α I ) + ( A + α I )T P* − P* ( BR −1 BT − T ) P* + Q + U = 0 . (5.14)
J * = x0 e 2α t0 P* x0
T
(5.15)
Απόδειξη: Η απόδειξη προκύπτει από την επέκταση του Θεωρήµατος 5.2 στο
µετασχηµατισµένο σύστηµα (5.11) µε τετραγωνική συνάρτηση κόστους (5.12).
70
D := [δ1 ,..., δ k ] , E := [ε1 ,..., ε k ] , S := diag (σ 1 ,..., σ k ) (5.17)
Θεώρηµα 5.4
Έστω το αβέβαιο σύστηµα (5.1)-(5.3) µε τυχαίες αρχικές συνθήκες και µε
τετραγωνική συνάρτηση κόστους (5.10). Αν το ακόλουθο πρόβληµα
βελτιστοποίησης,
min Tr ( M ) (5.18)
M ,W , S
µε περιορισµούς LMI
⎡M I⎤
⎢I >0 (5.19)
⎣ W ⎥⎦
⎡ −W ( A + α I )T − ( A + α I )W + BR −1 BT − DSDT WE T W ⎤
⎢ ⎥
⎢ EW S 0 ⎥ > 0 (5.20)
⎢ W 0 Q0 ⎥⎦
−1
⎣
έχει ένα µη κενό σύνολο εφικτών λύσεων (M, W, S), µε Μ και W συµµετρικούς και
θετικά ορισµένους πίνακες, S διαγώνιο και θετικά ορισµένο πίνακα και Q0 θετικά
ορισµένο πίνακα, έτσι ώστε Q0 < Q , τότε ο νόµος ελέγχου,
u * (t ) = − R −1 BT W −1 x(t ) (5.21)
είναι ένας νόµος ελέγχου εγγυηµένου κόστους, που εξασφαλίζει ένα προκαθορισµένο
βαθµό σχετικής ευστάθειας α , για όλες τις αποδεκτές αβεβαιότητες. Το αντίστοιχο
εγγυηµένο κόστος,
J * = Tr ( P* ) (5.22)
P* = W −1 (5.23)
είναι ελάχιστο.
71
( A + α I )T P* + P* ( A + α I ) − P* ( BR −1 BT − DSDT ) P* + E T S −1 E + Q0 < 0 (5.24)
( A + α I )T P* + P* ( A + α I ) − P* ( BR −1 BT − DSDT ) P* + E T S −1 E + Q = 0 (5.25)
( A + α I )T P* + P* ( A + α I ) − P* ( BR −1 BT − T ) P* + U + Q = 0 (5.26)
η οποία είναι της ίδιας µορφής µε την (5.14). Άρα, λόγω του Θεωρήµατος (5.3), ο
νόµος ελέγχου (5.21) είναι ο νόµος ελέγχου εγγυηµένου κόστους µε προκαθορισµένο
βαθµό σχετικής ευστάθειας α . Το αντίστοιχο εγγυηµένο κόστος είναι το (5.22).
5.3 Μετατόπιση πόλων µε την τροποποίηση του πίνακα βάρους (Kosmidou and
Mitroglou 2006)
PA + AT P − PBRˆ −1 BT P + Qˆ = 0 (5.27)
u (t ) = − Rˆ −1 BT Px(t ) (5.28)
72
x(t ) = ( A − BRˆ −1 BT P) x(t ) = Fx(t ) (5.29)
Στη συνέχεια, θα µελετηθεί η σχέση µεταξύ του P και της ιδιο-δοµής του F µε την
ιδιο-δοµή και το φάσµα του Hamiltonian πίνακα
⎡ A − BR −1 BT + T ⎤
H =⎢ ⎥ (5.31)
⎣ −Q − U − AT ⎦
⎡ A − BR −1 BT + T ⎤ ⎡ X 0 W0 ⎤ ⎡ X 0 W0 ⎤ ⎡ Λ s 0⎤
⎢ ⎥⎢ ⎥=⎢ ⎥⎢ Λ u ⎥⎦
(5.32)
⎣ −Q − U − AT ⎦ ⎣ Y0 Z 0 ⎦ ⎣ Y0 Z 0 ⎦ ⎣ 0
όπου Λ s και Λ u είναι οι διαγώνιοι πίνακες των ευσταθών και ασταθών ιδιοτιµών του
H , αντίστοιχα. Είναι γνωστό, ότι, αν το ζεύγος ( A, B) είναι σταθεροποιήσιµο, τότε
−1
P = Y0 X 0 και FX 0 = X 0 Λ s (Martenson 1971, Medanic 1982). Επιπλέον, αν το
ζεύγος ( A, B) είναι πλήρως ελέγξιµο, τότε ο συµµετρικός και αρνητικά ορισµένος
−1
πίνακας Pu = Z 0W0 υπάρχει και είναι επίσης λύση της (5.9). Με βάση τα παραπάνω,
θα αποδειχθεί στη συνέχεια, ότι εισάγοντας ένα βαθµό σχετικής ευστάθειας α και
αντικαθιστώντας τον πίνακα βάρους κατάστασης Q µε Q + ∆Q , όπου ∆Q = −2α Pu ,
στη συνάρτηση κόστους, οι ιδιοτιµές του κλειστού ονοµαστικού συστήµατος
µετατοπίζονται κατά −2α . Πράγµατι, σύµφωνα µε το αποτέλεσµα της παραγράφου
5.2, η γενικευµένη εξίσωση Riccati για το αβέβαιο σύστηµα (5.1)-(5.3) µε βαθµό
σχετικής ευστάθειας α και µε τροποποιηµένο πίνακα βάρους κατάστασης, γίνεται,
P ( A + α I ) + ( A + α I )T P − P ( BR −1 BT − T ) P + Q + U − 2α Pu = 0 (5.33)
⎡ A+αI − BR −1 BT + T ⎤
H =⎢ ⎥ (5.34)
⎣ −Q − U + 2α Pu −( A + α I )T ⎦
Λήµµα 5.5
Έστω Pu η αρνητικά ορισµένη λύση της (5.33) που συνδέεται µε τις ασταθείς
ιδιοτιµές του H . Τότε,
Pu = Pu (5.35)
73
Λήµµα 5.6
Οι ασταθείς ιδιοτιµές των H και H συνδέονται µε τη σχέση,
Λu = Λu + α I (5.36)
⎪⎧ ⎡W ⎤ ⎫⎪ ⎪⎧ ⎡W ⎤ ⎪⎫
R ⎨⎢ 0 ⎥ ⎬ = R ⎨⎢ 0 ⎥ ⎬ (5.37)
⎪⎩ ⎣ Z 0 ⎦ ⎪⎭ ⎩⎪ ⎣ Z 0 ⎦ ⎭⎪
Θεώρηµα 5.7
Έστω Λ s το φάσµα του κλειστού συστήµατος (5.29) για κάποιους δεδοµένους
πίνακες βάρους Q και R . Ακόµη, έστω ότι (i) εισάγεται βαθµός σχετικής ευστάθειας
α και (ii) ο πίνακας βάρους κατάστασης Q τροποποιείται κατά
∆Q = −2α Pu (5.38)
όπου Pu είναι η αρνητικά ορισµένη λύση της (5.9). Τότε, το φάσµα Λ ( Fs ) του
ονοµαστικού κλειστού συστήµατος µε βαθµό σχετικής ευστάθειας α και
τροποποιηµένο δείκτη επιδόσεων είναι,
Λ ( Fs ) = Λ s − 2α I (5.39)
Εξάλλου, από την (5.34) έπεται ότι οι ευσταθείς ιδιοτιµές του H είναι και οι
ιδιοτιµές του
Fs = A + α I − BRˆ −1 BT Ps (5.41)
Fs = Fs − α I (5.42)
και άρα,
Λ ( Fs ) = Λ ( Fs ) − α I (5.43)
74
Επειδή οι ασταθείς ιδιοτιµές του H µετατοπίζονται κατά α , ως προς τις ασταθείς
ιδιοτιµές του H (Λήµµα 5.6) και επειδή ο H είναι συµπλεκτικός πίνακας, οι
ευσταθείς ιδιοτιµές του H µετατοπίζονται κατά −α , ως προς τις ευσταθείς ιδιοτιµές
του H , δηλαδή,
Λ s = Λ ( Fs ) = Λ s − α I (5.44)
Παρατήρηση 5.8
Το Θεώρηµα 5.7 συνεπάγεται ότι εφαρµόζοντας το νόµο ελέγχου
u (t ) = − Rˆ −1 BT Ps x(t ) (5.45)
όπου Ps είναι η θετικά ορισµένη λύση της (5.33), στο αβέβαιο σύστηµα (5.1)-(5.3), οι
ιδιοτιµές του ονοµαστικού κλειστού συστήµατος µετατοπίζονται κατά −2α . Ακόµη,
σύµφωνα µε τα αποτελέσµατα της παραγράφου 5.2, οι ιδιοτιµές του αβέβαιου
συστήµατος βρίσκονται αριστερά του −α , για όλες τις αποδεκτές αβεβαιότητες.
Αλγόριθµος 5.9
min Tr ( M )
M ,W , S
µε περιορισµούς LMI
⎡M I⎤
(i) ⎢ >0
⎣I W ⎥⎦
⎡ −WAT − AW + BR −1 BT − DSDT WE T W ⎤
⎢ ⎥
(ii) ⎢ EW S 0 ⎥>0
⎢ W 0 Q0 ⎥⎦
−1
⎣
75
για έναν αυθαίρετο διαχωρισµό της αβεβαιότητας και για κάποιο Q0 < Q . Αν υπάρχει
µια εφικτή λύση, τότε ο S προσδιορίζει τον κατάλληλο διαχωρισµό µοναδιαίας
τάξης της µορφής (5.4), σύµφωνα µε την (5.16), για τον οποίο µια θετικά ορισµένη
λύση της (5.9) P = W −1 υπάρχει και ελαχιστοποιεί το αντίστοιχο εγγυηµένο κόστος.
Οι πίνακες T και U προσδιορίζονται σύµφωνα µε την (5.5) και παραµένουν
σταθεροί.
min Tr ( M )
M ,W
µε περιορισµούς LMI
⎡M I⎤
(i) ⎢ ⎥>0
⎣I W⎦
⎡ −W ( A + α I )T − ( A + α I )W + BR −1 B − T W ⎤
(ii) ⎢ −1 ⎥
>0
⎢⎣ W Q0 ⎥⎦
για κάποιο Q0 < Q + U − 2α Pu . Αν υπάρχει µια εφικτή λύση, τότε η θετικά ορισµένη
λύση της (5.33) είναι η P = W −1 και ελαχιστοποιεί το αντίστοιχο εγγυηµένο κόστος.
5.4 Παράδειγµα
⎡ 0 1⎤ ⎡ 0 1 ⎤ ⎡0 ⎤
A=⎢ ⎥ , A + ∆A = ⎢ ⎥ , B=⎢ ⎥
⎣ −1 2 ⎦ ⎣ −1 + r1 2 + r2 ⎦ ⎣1 ⎦
⎡0 0⎤ ⎡0⎤ ⎡0 0⎤ ⎡0 ⎤
= ⎢ ⎥ [1 0] = δ1ε1 , A2 = ⎢ = ⎢ ⎥ [ 0 1] = δ 2ε 2 .
T T
A1 = ⎢ ⎥ ⎥
⎣1 0 ⎦ ⎣1 ⎦ ⎣ 0 1 ⎦ ⎣1 ⎦
Είναι προφανές, ότι το ανοικτό ονοµαστικό σύστηµα είναι ασταθές. Οι ιδιοτιµές του
ανοικτού συστήµατος για όλες τις τιµές των αβέβαιων παραµέτρων του φαίνονται στο
76
Σχήµα 5.1. Παρατηρούµε ότι το ανοικτό σύστηµα είναι ασταθές για το σύνολο των
τιµών των αβέβαιων παραµέτρων του.
Το κέρδος ανάδρασης του ελεγκτή εγγυηµένου κόστους, όπως προκύπτει από την
εφαρµογή του Θεωρήµατος 5.5, είναι K = [1.90 6.73] και το αντίστοιχο εγγυηµένο
κόστος είναι J = 14.47 . Οι ιδιοτιµές του κλειστού συστήµατος σε διάφορα σηµεία
της περιοχής αβεβαιότητας έχουν πραγµατικά µέρη που φαίνονται στον Πίνακα 5.1.
r1 = r2 = 0 r1 = r2 = −1 r1 = r2 = 1 r1 = 1, r2 = −1 r1 = 0, r2 = −1 r1 = 1, r2 = 0
λ1 -0.72 -0.78 -0.60 -0.35 -0.56 -0.44
λ2 -4.01 -4.94 -3.12 -5.38 -5.17 -4.29
Πίνακας 5.1 Πραγµατικά µέρη των ιδιοτιµών κλειστού βρόχου που λαµβάνεται µε
τον έλεγχο εγγυηµένου κόστους, σε διάφορα σηµεία της περιοχής αβεβαιότητας
Είναι φανερό ότι µε την εφαρµογή του εύρωστου ελεγκτή εγγυηµένου κόστους, το
κλειστό σύστηµα έχει σταθεροποιηθεί. Οι ιδιοτιµές του κλειστού συστήµατος για
όλες τις τιµές των αβέβαιων παραµέτρων του φαίνονται στο Σχήµα 5.2 από το οποίο
καταδεικνύεται η σταθεροποίηση του αβέβαιου συστήµατος στο πεδίο αβεβαιοτήτων.
Ωστόσο, σε κάποια σηµεία της περιοχής αβεβαιότητας οι αντίστοιχες ιδιοτιµές
βρίσκονται σχετικά κοντά στον άξονα των φανταστικών αριθµών.
77
Σχήµα 5.2 Θέσεις των ιδιοτιµών του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο εγγυηµένου κόστους
r1 = r2 = 0 r1 = r2 = −1 r1 = r2 = 1 r1 = 1, r2 = −1 r1 = 0, r2 = −1 r1 = 1, r2 = 0
λ1 -2.23 -2.03 -2.57 -1.73 -1.88 -2.03
λ2 -6.82 -8.41 -5.88 -8.71 -8.57 -7.41
Πίνακας 5.2 Πραγµατικά µέρη των ιδιοτιµών κλειστού βρόχου που λαµβάνεται από
τον έλεγχο εγγυηµένου κόστους µε βαθµό σχετικής ευστάθειας και τροποποίηση του
πίνακα βάρους, σε διάφορα σηµεία της περιοχής αβεβαιότητας
78
Σχήµα 5.3 Θέσεις των µετατοπισµένων ιδιοτιµών του κλειστού συστήµατος
5.5 Συµπεράσµατα
79
Κεφάλαιο 6
Στο κεφάλαιο αυτό θα µελετηθεί το πρόβληµα του εύρωστου ελέγχου για την
κλάση των γραµµικών αβέβαιων συστηµάτων, όταν υπάρχουν πολλαπλές
προδιαγραφές ελέγχου. Σε κάποια προβλήµατα, µια από τις προδιαγραφές είναι και η
απόρριψη σήµατος εξωτερικής διαταραχής. Θα χρησιµοποιηθούν τόσο τεχνικές
ελέγχου H ∞ / H 2 , όσο και τεχνικές LMI βελτιστοποίησης, προκειµένου, παράλληλα,
να ελαχιστοποιείται το εγγυηµένο κόστος, το οποίο αποτελεί ένα άνω φράγµα όλων
των θεωρούµενων αντικειµενικών συναρτήσεων.
80
όπου x(t ) ∈ R n είναι το διάνυσµα κατάστασης, u (t ) ∈ R m είναι το διάνυσµα ελέγχου,
A ∈ R n×n και B ∈ R n×m είναι οι πίνακες κατάστασης και ελέγχου, αντίστοιχα. Οι
αβεβαιότητες του συστήµατος περιγράφονται µε τη µορφή γραµµικών συναρτήσεων,
k
∆ A = ∑ Ai ri
i =1
l
(6.2)
∆ B = ∑ Bi pi
i =1
T
Ai = di ei , i = 1, 2,..., k , (6.5)
T
Bi = f i gi , i = 1, 2,..., l . (6.6)
D := [d1...d k ] , F := [ f1... f l ]
E := [e1...ek ] , G := [ g1...gl ] (6.7)
S := diag (σ 1...σ k ) , T := diag (τ 1...τ l ) .
όπου σ i ,τ i είναι θετικές βαθµωτές ποσότητες που πρέπει να επιλεγούν µέσω της
σχεδίασης.
81
όπου Qi > 0 , Ri > 0 , i = 1,..., ρ .
u (t ) = Kx(t ) (6.9)
έτσι ώστε οι αντίστοιχες τιµές όλων των δεικτών επιδόσεων (6.8) να γίνονται όσο το
δυνατόν µικρότερες και να παραµένουν άνω φραγµένες, για κάθε αποδεκτή
αβεβαιότητα, δηλαδή σύµφωνα µε τις (6.3), (6.4).
−1 −1 −1 −1
PA + AT P − P (δ i BRi BT − δ i BRi GTi GT Ri BT − FTi F T − DSi DT ) P + ESi E T + Qi = 0
2
(6.11)
για i = 1,..., ρ . Τότε, ο νόµος ελέγχου εγγυηµένου κόστους είναι της µορφής
−1
u (t ) = −δ i Ri BT Px(t ) (6.12)
J i ≤ tr ( P) , ∀i = 1,..., ρ . (6.13)
Είναι γνωστό, ότι οι (6.11) δεν έχουν (κοινή) αναλυτική λύση. Ωστόσο, µια θετικά
ορισµένη λύση µπορεί να βρεθεί υπολογιστικά, εφόσον υπάρχει, µε κατάλληλη
επιλογή των παραµέτρων δ i , η οποία γίνεται µε δοκιµή και σφάλµα. Ακόµη,
εναλλακτικοί διαχωρισµοί µοναδιαίας τάξης µέσω των παραµέτρων των Si , Ti δίνουν
περισσότερους βαθµούς ελευθερίας σχεδιασµού, έτσι ώστε να επιτυγχάνεται και η
82
ελαχιστοποίηση του εγγυηµένου κόστους. Όµως, µε όλες αυτές τις δυνατές επιλογές
ο υπολογισµός της λύσης P καθίσταται εξαιρετικά πολύπλοκος. Αντίθετα, η
θεώρηση του παραπάνω προβλήµατος στο πλαίσιο της βελτιστοποίησης µε
περιορισµούς LMI οδηγεί στην υπολογιστικά εύκολη επίλυσή του µε τη βοήθεια των
αλγορίθµων κυρτής βελτιστοποίησης (Boyd et al. 1994).
min tr ( M ) (6.14)
( M ,W ,δ i , Si ,Ti )
µε περιορισµούς LMI
⎡M I⎤
⎢I >0 (6.15)
⎣ W ⎥⎦
και
(6.16)
⎢ 0 Tρ 0 ⎥
⎢ W 0 0 Qρ ⎥⎦
−1
⎣
P = W −1 (6.17)
και οι τιµές των δ i ικανοποιούν τις γενικευµένες αλγεβρικές εξισώσεις Riccati (6.11).
Ο νόµος ελέγχου εγγυηµένου κόστους είναι
−1
u * (t ) = −δ i Ri BTW −1 x(t ) (6.18)
83
και ελαχιστοποιεί το εγγυηµένο κόστος
J * = tr ( P) (6.19)
για κάθε αποδεκτή αβεβαιότητα.
Απόδειξη: Εφαρµόζοντας το συµπλήρωµα του Schur στα πολλαπλά LMI (6.16) και
πολλαπλασιάζοντας επί P = W −1 από αριστερά και δεξιά και τα δύο µέλη των
ανισοτήτων που προκύπτουν, παίρνουµε,
−1 −1 −1 −1
PA + AT P − P (δ i BRi BT − δ i BRi GTi GT Ri BT − FTi F T − DSi DT ) P + ESi E T + Qi < 0
2
(6.20)
για i = 1,..., ρ . Οι ανισότητες αυτές ικανοποιούνται για Qi < Qi , αν ικανοποιούνται οι
εξισώσεις (6.11). Οι τιµές των Si , Ti προσδιορίζονται από τον αλγόριθµο LMI.
Επιπλέον, η εφαρµογή του συµπληρώµατος Schur στην (6.15) δίνει M > W −1 = P .
Κατά συνέπεια, η ελαχιστοποίηση του tr ( M ) συνεπάγεται ελαχιστοποίηση του
tr ( P) . Επειδή P είναι η κοινή λύση των εξισώσεων (6.11), το tr ( P) είναι το
ελάχιστο εγγυηµένο κόστος των πολλαπλών δεικτών επιδόσεων.
6.2.1 Παράδειγµα
Έστω το αβέβαιο σύστηµα 3ης τάξης (Dorato et al. 1988) σε περιγραφή χώρου
κατάστασης µε πίνακες,
⎡0 1 0⎤ ⎡0 ⎤ ⎡0 0 0 ⎤
⎢ ⎥
A = ⎢0 0 1 ⎥ , B = ⎢0 ⎥ , A1 = ⎢⎢ 0 0 0 ⎥⎥
⎢ ⎥
⎢⎣0 0 0 ⎥⎦ ⎢⎣1 ⎥⎦ ⎢⎣ 0 0 1.6 ⎥⎦
Ένας κατ΄ αρχάς αυθαίρετος διαχωρισµός µοναδιαίας τάξης του πίνακα αβεβαιότητας
µπορεί να είναι ο εξής:
⎡0⎤ ⎡0⎤
D = ⎢ 0 ⎥ , E = ⎢⎢ 0 ⎥⎥
⎢ ⎥
⎢⎣1.6 ⎥⎦ ⎢⎣1 ⎥⎦
⎡1 0 0⎤ ⎡ 0.1 0 0 ⎤
⎢ ⎥
Q1 = ⎢0 0.1 0 ⎥ , Q2 = ⎢⎢ 0 1 0 ⎥⎥ , R1 = R2 = 1
⎢⎣0 0 0.1⎥⎦ ⎢⎣ 0 0 0.1⎥⎦
84
Εφαρµόζοντας το Θεώρηµα 6.1 στο σύστηµα αυτό, παίρνουµε το εγγυηµένο κόστος
J * = tr ( P ) = 17.13 για δ1 = δ 2 = 1 και S1 = S2 = 0.185 . Σηµειώνεται, ότι στο
παράδειγµα αυτό θεωρήθηκε, ότι οι µεταβλητές δ i , καθώς και οι Si , i = 1, 2 , είναι
κοινές στα δύο LMI, γι’ αυτό και προέκυψε η ίδια τιµή. Υπολογίζοντας τις βέλτιστες
τιµές των συναρτήσεων κόστους για σύστηµα χωρίς αβεβαιότητες, δηλαδή
επιλύοντας δύο προβλήµατα LQR, παίρνουµε ( J1 ) min = 7.29 και ( J 2 ) min = 4.37 ,
αντίστοιχα. Εξάλλου, επιλύοντας δύο ανεξάρτητα προβλήµατα GCC, παίρνουµε τις
* *
αντίστοιχες τιµές εγγυηµένου κόστους J1 = 16.00 και J 2 = 10.12 . Προφανώς, το
*
κοινό εγγυηµένο κόστος είναι λίγο µεγαλύτερο από το J1 , που είναι το µεγαλύτερο
από τα δύο χωριστά, χωρίς, ωστόσο, να χαρακτηρίζεται ως συντηρητικό.
85
φύσης προβληµάτων. Μια σύνθεση µε πολλαπλούς στόχους θα µπορούσε να είναι η
παρακάτω:
86
Η παραπάνω σύνθεση περικλείει περιπτώσεις από πολλά πρακτικά προβλήµατα.
Έστω η περίπτωση του προβλήµατος συντονισµού µε διαταραχή d, λευκό µετρήσιµο
⎛d ⎞ ⎛ x⎞
θόρυβο n και σφάλµα συντονισµού e. Θεωρώντας ότι w = ⎜ ⎟ , z∞ = e και z2 = ⎜ ⎟ ,
⎝n⎠ ⎝u ⎠
το µικτό H ∞ / H 2 κριτήριο λαµβάνει υπόψη του, τόσο την απόρριψη των διαταραχών
(RMS κέρδος µεταξύ d και e) όσο και τους LQG όρους (νόρµα H 2 µεταξύ του n και
του z2 ). Μαζί µε όλους τους παραπάνω περιορισµούς, θα πρέπει και οι πόλοι του
κλειστού συστήµατος να τοποθετηθούν σε µια ευσταθή περιοχή του αριστερού
µιγαδικού ηµι-επιπέδου, κατά τρόπο ώστε να εξασφαλίζεται ικανοποιητική απόσβεση
στη µεταβατική κατάσταση.
D = {z ∈ C : L + Mz + M T z < 0} (6.21)
f D ( z ) := L + Mz + M T z (6.22)
Η κατηγορία των LMI περιοχών είναι αρκετά γενική, απ’ τη στιγµή που είναι
ένα σύνολο από µιγαδικές περιοχές, συµµετρικές ως προς τον άξονα των
πραγµατικών αριθµών. Από πρακτικής πλευράς, οι LMI περιοχές περιλαµβάνουν
κατάλληλες περιοχές, όπως για παράδειγµα κύκλους, κωνικές περιοχές, ταινίες κ.α.,
καθώς επίσης και τοµές των περιοχών αυτών. Ένα ακόµα πλεονέκτηµα των LMI
περιοχών είναι ότι σε τέτοιου είδους περιοχές, βρίσκει εφαρµογή το θεώρηµα του
87
Lyapunov. Πιο συγκεκριµένα, εάν {λij }1≤ i , j ≤ m και {µ ij }1≤ i , j ≤ m είναι τα στοιχεία των
πινάκων L και Μ, τότε ένας πίνακας Α έχει όλες του τις ιδιοτιµές στην περιοχή D,
εάν και µόνον εάν υπάρχει ένας θετικά ορισµένος πίνακας P τέτοιος ώστε:
Σηµειώνεται ότι η παραπάνω ανισότητα είναι µια γραµµική ανισότητα του πίνακα P
(LMI) και ότι το κλασικό θεώρηµα του Lyapunov αντιστοιχεί στην ειδική περίπτωση
όπου f D ( z ) = z + z .
• Κωνική περιοχή µε κέντρο την αρχή των αξόνων και εσωτερική γωνία θ:
Ο λόγος απόσβεσης των πόλων, που βρίσκονται σε αυτή την περιοχή, είναι
θ
τουλάχιστον cos .
2
88
• Οριζόντια ταινία όπου h1 < x < h2 :
Έστω το σύστηµα,
x = Ax + B1w + B2u
z∞ = C1 x + D11w + D12u (6.24)
z2 = C2 x + D22u
x = ( A + B2 K ) x + B1w
z∞ = (C1 + D12 K ) x + D11w (6.25)
z2 = (C2 + D22 K ) x
⎛ ( A + B2 K ) X ∞ + X ∞ ( A + B2 K )T B1 X ∞ ( C1 + D12 K )
T
⎞
⎜ ⎟
⎜ B1T −I D11T ⎟<0
⎜ ( C1 + D12 K ) X ∞ D11 −γ 2 I ⎟
⎝ ⎠
και (6.26)
X∞ > 0
89
⎛ ( A + B2 K ) X 2 + X 2 ( A + B2 K )T B1 ⎞
⎜⎜ ⎟<0
⎝ B1T − I ⎟⎠
(6.27)
⎛ Q ( C2 + D22 K ) X 2 ⎞
⎜ ⎟>0
⎜ X ( C + D K )T X2 ⎟
⎝ 2 2 22 ⎠
και
Trace(Q ) < ν 2
(6.28)
X pol > 0
Αυτό το σύνολο των τριών συνθηκών (6.26) – (6.28) περιγράφουν ένα πρόβληµα
βελτιστοποίησης µε µεταβλητές τις Q, K , X ∞ , X 2 και X pol . Επειδή βρισκόµαστε στο
πλαίσιο LMI, ψάχνουµε έναν πίνακα Lyapunov X := X ∞ = X 2 = X pol , τέτοιον ώστε
να ικανοποιούνται και οι τρεις παραπάνω απαιτήσεις.
⎛ Q C2 X + D22Y ⎞
⎜ ⎟>0
⎝ XC2 + Y D22
T T T
X ⎠
90
⎡λij + µij ( AX + B2Y ) + µij ( XAT + Y T B2T ) ⎤
⎣ ⎦1≤i , j ≤ m < 0
Trace(Q) < ν 0 2
(6.29)
γ 2 < γ 02
K ∗ = Y ∗ ( X ∗ ) −1
T∞ ∞
≤ γ ∗ , T2 2 ≤ Trace(Q∗ ) (6.30)
( )
⎧θ1 + f θ1 − θ 2 + k (θ1 − θ 2 ) = T + w
⎪
⎨ (6.32)
( )
⎪⎩ θ 2 + f θ 2 − θ1 + k (θ 2 − θ1 ) = 0
91
όπου θ1 και θ 2 είναι η κίνηση των γωνιών του κυρίως σώµατος και του αισθητήρα, Τ
είναι ο έλεγχος της ροπής και w είναι η διαταραχή που επηρεάζει τη ροπή του κυρίως
σώµατος.
92
Σχήµα 6.3 LMI ευσταθής περιοχή που ορίζεται από την ανισότητα x < −0.1 και µε
γωνία 5π / 6 .
• Θα πρέπει να επιτευχθούν όλοι οι παραπάνω στόχοι για όλες τις πιθανές τιµές
των παραµέτρων k και f. Από τη στιγµή που αυτές οι παράµετροι είναι στενά
συνδεδεµένες µε τον πίνακα κατάστασης του συστήµατος, είναι δυνατόν να
µοντελοποιήσουµε την παραµετρική αυτή αβεβαιότητα σαν ένα πολυτοπικό
σύστηµα µε τέσσερα διανύσµατα τα οποία αντιστοιχούν στους τέσσερις
συνδυασµούς που αντιστοιχούν στις ακραίες τιµές των παραµέτρων.
( )
⎧θ1 = − f θ1 − θ 2 − k (θ1 − θ 2 ) + T + w
⎪
⎨ ⇒
( )
⎪⎩ θ 2 = − f θ 2 − θ1 − k (θ 2 − θ1 )
⎧θ1 = − f θ1 + f θ 2 − kθ1 + kθ 2 + T + w
⎨ ⇒
⎩ θ 2 = − f θ 2 + f θ1 − kθ 2 + kθ1
93
⎡0 1 0 0 ⎤ ⎡θ1 ⎤ ⎡0 0⎤
⎡z ⎤ 1
⎢ 0 0 0 ⎥⎥ ⎢⎢θ 2 ⎥⎥ ⎢⎢0 0 ⎥⎥ ⎡ w⎤
y = ⎢ ∞⎥ = ⎢ + (6.34)
⎣ z2 ⎦ ⎢ 0 1 0 0 ⎥ ⎢θ1 ⎥ ⎢0 0 ⎥ ⎢⎣T ⎥⎦
⎢ ⎥⎢ ⎥ ⎢ ⎥
⎣0 0 0 0 ⎦ ⎣θ 2 ⎦ ⎣0 1⎦
z∞ = θ 2
και (6.35)
⎡θ1 ⎤
⎡1 0 0 0 ⎤ ⎢ ⎥ ⎡0 ⎤
θ
z2 = ⎢⎢0 1 0 0 ⎥⎥ ⎢ 2 ⎥ + ⎢⎢0 ⎥⎥ Τ
⎢θ ⎥
⎢⎣0 0 0 0 ⎥⎦ ⎢ 1 ⎥ ⎢⎣1 ⎥⎦
⎢⎣θ 2 ⎥⎦
94
5. Προσδιορίζεται το κλειστό σύστηµα και εξετάζεται η ευστάθειά του. Η
µελέτη της ευστάθειας γίνεται µε βάση τις θέσεις των πόλων του κλειστού
συστήµατος. Θα πρέπει να διασφαλίζεται ότι οι πόλοι βρίσκονται µέσα στην
LMI περιοχή που έχει οριστεί. Τέλος, η συµπεριφορά του συστήµατος
αξιολογείται µε βάση τη βηµατική του απόκριση.
Παρατηρούµε ότι το σύστηµα είναι πρακτικά ασταθές γιατί οι δύο από τους τέσσερις
πόλους του βρίσκονται πολύ κοντά στο µηδέν, ενώ οι άλλοι δύο είναι ακριβώς πάνω
στο µηδέν. Αστάθεια του συστήµατος επιβεβαιώνεται και από τη βηµατική απόκρισή
του.
95
Σχήµα 6.5 Βηµατική απόκριση του ονοµαστικού συστήµατος.
Τυχαία επιλέξαµε τέσσερις τιµές του H ∞ (από τις τιµές που προέκυψαν από
την επαναληπτική µέθοδο προσδιορισµού της νόρµας αυτής) και οι αντίστοιχες τιµές
της νόρµας H 2 φαίνονται παρακάτω:
96
Σχήµα 6.6 Καµπύλη κριτηρίου ανταλλαγής H ∞ / H 2
Σύµφωνα µε τον παραπάνω πίνακα τιµών και την απεικόνισή του στο αντίστοιχο
διάγραµµα, βλέπουµε ότι ο καλύτερος συµβιβασµός των νορµών H ∞ / H 2
επιτυγχάνεται για την τιµή 0.09 της νόρµας H ∞ , επειδή έχουµε ζεύγος τιµών µε όσο
το δυνατόν µικρότερες τιµές και για τις δύο νόρµες.
και έτσι ο πίνακας κατάστασης του κλειστού συστήµατος που προκύπτει είναι,
Acl = A + B × K ⇒
⎡ 0 0 1 0 ⎤
⎢ 0 0 0 1 ⎥
Acl = ⎢ ⎥
⎢-7.1444 -6.5498 -3.9705 -25.5372 ⎥
⎢ ⎥
⎣ 0.2450 -0.2450 0.0188 -0.0188 ⎦
97
Σχήµα 6.7 Πόλοι του κλειστού ονοµαστικού συστήµατος.
98
Σχήµα 6.8 Βηµατική απόκριση του κλειστού ονοµαστικού συστήµατος.
99
Σχήµα 6.9 Απεικόνιση των πόλων του αβέβαιου συστήµατος για όλους τους
πιθανούς συνδυασµούς των παραµέτρων του
Η παραπάνω απεικόνιση των πόλων έχει προκύψει από όλους τους δυνατούς
συνδυασµούς των παραµέτρων k και f του συστήµατος. Όπως µπορούµε να
παρατηρήσουµε, το αρχικό ανοικτό σύστηµα είναι «οριακά ευσταθές» επειδή όλοι οι
πόλοι είναι πολύ κοντά στο µηδέν, µια και, όπως µπορούµε να διαπιστώσουµε,
βρίσκονται µέσα στην περιοχή [−0.1 , 0] . Έτσι µε την παραµικρή επιπρόσθετη
διαταραχή w που θα µπορούσε να επηρεάσει το σύστηµα, κάποιοι από αυτούς τους
πόλους θα µπορούσαν να µετατοπιστούν στο δεξιό (θετικό) µιγαδικό ηµι-επίπεδο και
έτσι το σύστηµα να γίνει ασταθές. Αυτό µπορεί να επιβεβαιωθεί και από τη βηµατική
απόκρισή του, όπως φαίνεται στο παρακάτω σχήµα:
100
Σχήµα 6.10 Βηµατική απόκριση του αβέβαιου ανοικτού συστήµατος
Επειδή το αβέβαιο σύστηµα είναι ασταθές για κάποιο σύνολο τιµών των
αβέβαιων παραµέτρων, θα εφαρµόσουµε το µικτό σχεδιασµό H ∞ / H 2 για τον
προσδιορισµό ενός εύρωστου ελεγκτή ο οποίος να σταθεροποιεί το αβέβαιο σύστηµα.
Συνεπώς, σκοπός του ελεγκτή ανάδρασης θα πρέπει να είναι, εκτός των άλλων, και η
µετατόπιση των πόλων του συστήµατος σε µια πιο ευσταθή περιοχή του αρνητικού
µιγαδικού ηµι-επιπέδου.
Όπως έγινε και στην περίπτωση του ονοµαστικού συστήµατος, έτσι και εδώ
για τις τιµές που είχαµε επιλέξει από τη νόρµα H ∞ , θα υπολογίσουµε τις αντίστοιχες
τιµές της νόρµας H 2 και στη συνέχεια θα επιλέξουµε το ζεύγος τιµών που δίνει τον
καλύτερο συµβιβασµό µεταξύ τους. ∆εν πρέπει να ξεχνάµε ότι οι τιµές για αυτές τις
νόρµες, υπολογίζονται πάντα µε τους LMI περιορισµούς που έχουµε θέσει εξαρχής.
Έτσι λοιπόν βρίσκουµε τα παρακάτω ζεύγη τιµών:
101
Τα ζεύγη τιµών αυτά απεικονίζονται στο παρακάτω γράφηµα, έτσι ώστε να είναι πιο
εύκολη η επιλογή του πιο κατάλληλου.
Από το γράφηµα µπορούµε να δούµε ότι ο καλύτερος συµβιβασµός ανάµεσα στις δύο
νόρµες πετυχαίνεται για την τιµή 0.09 της νόρµας H ∞ που αντιστοιχεί στην τιµή
2.5918 για τη νόρµα H 2 . Ο τρόπος που επιλέξαµε το ζεύγος αυτό είναι ίδιος µε πριν,
καθώς δε θέλουµε τις ακραίες περιπτώσεις τιµών, που παίρνουν οι νόρµες αυτές.
από τον οποίο προκύπτει το αντίστοιχο κλειστό σύστηµα. Επειδή το σύστηµα έχει τις
δύο αβέβαιες παραµέτρους k και f, θα πρέπει να υπολογίσουµε όλους τους πιθανούς
πίνακες κατάστασης του εύρωστου κλειστού συστήµατος, για να βρούµε τους πόλους
του και τη βηµατική του απόκριση. Έτσι οι εξισώσεις που περιγράφουν τους πίνακες
κατάστασης του κλειστού συστήµατος είναι οι παρακάτω:
A = A0 + kAk + fAf
Acl = A + BK
102
όπου k και f είναι ο παράµετροι του συστήµατος και Κ είναι ο πίνακας του εύρωστου
ελεγκτή.
Οι περιπτώσεις όπου οι παράµετροι του συστήµατος παίρνουν τις ακραίες τους τιµές
είναι και οι πιο «επικίνδυνες» για την ευστάθεια του κλειστού συστήµατος. Οι
περιπτώσεις αυτές είναι εκείνες που χαρακτηρίζονται από τα παρακάτω ζεύγη
παραµέτρων:
Σχήµα 6.12 Βηµατική απόκριση του εύρωστου κλειστού συστήµατος, για τις 4
ακραίες καταστάσεις του συστήµατος
103
Παρατηρούµε ότι η σύγκλιση επιτυγχάνεται και στις τέσσερις περιπτώσεις γρήγορα
(σχεδόν στα πρώτα 20 δευτερόλεπτα) αλλά και ότι οι διακυµάνσεις, που υπάρχουν
πριν τη σύγκλιση έχουν ικανοποιητική απόσβεση.
Σε αυτό το σηµείο θα πρέπει να σηµειώσουµε ότι οι τέσσερις διαφορετικές καµπύλες
που υπάρχουν στις γραφικές παραστάσεις αντιπροσωπεύουν τις τέσσερις
διαφορετικές καταστάσεις του συστήµατος και ότι για λόγους απλότητας δείχνουν
την απόκριση της πρώτης εξόδου του συστήµατος ως προς την πρώτη είσοδό του. Οι
θέσεις των πόλων του κλειστού συστήµατος επάνω στο µιγαδικό επίπεδο, για τους
τέσσερις συνδυασµούς των αβέβαιων παραµέτρων, δίνονται στο παρακάτω σχήµα:
Σχήµα 6.13 ∆ιευθέτηση πόλων του εύρωστου κλειστού συστήµατος, για τις 4
ακραίες καταστάσεις του συστήµατος
104
Σχήµα 6.14 Βηµατική απόκριση του συστήµατος για όλους τους πιθανούς
συνδυασµούς των παραµέτρων k και f
Οι παραπάνω βηµατικές αποκρίσεις του συστήµατος δείχνουν ότι για όλες τις τιµές
των παραµέτρων το σύστηµα µπορεί να ανταποκρίνεται µε ευστάθεια. Συγκρίνοντας
δε τις αποκρίσεις αυτές, µε τις αντίστοιχες αποκρίσεις του ανοικτού συστήµατος,
µπορούµε να ισχυριστούµε µε ασφάλεια ότι ο µικτός σχεδιασµός, που
χρησιµοποιήσαµε για τη σχεδίαση του ελεγκτή ανάδρασης, είναι ιδιαίτερα
αποδοτικός. Τόσο η βηµατική απόκριση, όσο και η διευθέτηση των πόλων µέσα στην
ευσταθή LMI περιοχή, δείχνουν ότι το ασταθές σύστηµα έχει σταθεροποιηθεί και
κατά αυτό τον τρόπο η επίδραση της εξωτερικής διαταραχής w πάνω στη γωνία θ 2
έχει περιοριστεί. Σηµειώνεται ότι οι συγκεκριµένες γραφικές παραστάσεις
απεικονίζουν τις αποκρίσεις όλων των εξόδων του συστήµατος ως προς και τις δύο
εισόδους του και δεν περιορίζονται στη µία έξοδο, όπως έγινε προηγουµένως χάριν
απλότητας.
Οι πόλοι του ανοικτού συστήµατος που απεικονίζονται στο σχήµα 6.9 είναι
όλοι συγκεντρωµένοι στην περιοχή κοντά στο µηδέν, πράγµα που δείχνει ότι το
σύστηµα είναι πρακτικά ασταθές. Το σχήµα που ακολουθεί επιβεβαιώνει την
ευστάθεια του κλειστού συστήµατος και δείχνει ότι η LMI ευσταθής περιοχή που
επιλέχθηκε περικλείει το σύνολο των πόλων του.
105
Σχήµα 6.15 Θέσεις των πόλων του κλειστού συστήµατος για όλους τους πιθανούς
συνδυασµούς των αβέβαιων παραµέτρων
6.4 Συµπεράσµατα
106
Κεφάλαιο 7
xi (t ) = Ai xi (t ) + Bi ui (t )
(7.1)
yi (t ) = Ci xi (t )
- ( Ai , Bi ) είναι σταθεροποιήσιµο
- (Ci , Ai ) είναι ανιχνεύσιµο και
- Ci είναι πλήρους τάξης
107
Οι επιδόσεις του συστήµατος περιγράφονται από την τετραγωνική συνάρτηση
κόστους,
M ⎧∞ T ⎫
J ( K ) = ∑ γ i E ⎨ ∫ ⎡⎣ xi (t )Qi xi (t ) + ui (t ) Ri ui (t ) ⎤⎦ dt ⎬
T
(7.2)
i =1 ⎩0 ⎭
όπου γ i είναι βαθµωτά µεγέθη και Qi , Ri είναι πίνακες βαρών που ικανοποιούν τις
συνθήκες Qi > 0 και Ri > 0 για κάθε i = 1, 2,..., M . Το E είναι η µαθηµατική
προσδοκία. Τα διανύσµατα αρχικής κατάστασης xi 0 είναι τυχαία διανύσµατα µε
µηδενική µέση τιµή και µε θετική διασπορά,
{
Vi = E xi 0 xi 0
T
} > 0, i = 1, 2,..., M (7.3)
Έστω ότι για το παραπάνω σύστηµα πρέπει να βρεθεί ένας νόµος ελέγχου
ανάδρασης κατάστασης,
ui (t ) = − Kxi (t ) (7.4)
M
J ( K ) = ∑ γ i tr (PV
i i) (7.5)
i =1
όπου οι πίνακες Pi είναι οι θετικά ηµι- ορισµένες λύσεις των εξισώσεων Lyapunov,
( Ai − Bi K )T Pi + Pi ( Ai − Bi K ) + Qi + K T Ri K = 0 (7.6)
108
Έστω ότι το K δεν είναι κενό. Σηµειώνεται ότι η υπόθεση αυτή δεν είναι
τετριµµένη, µε την έννοια ότι η ιδιότητα της σταθεροποίησης για κάθε i = 1, 2,..., M
δεν είναι δεδοµένη.
Για K ∈ K ορίζονται τα
∞
X i := E{∫ xi (t ) xi (t )dt}
T
(7.8)
0
M
J ( K ) = ∑ tr{(Qi + K T Ri K ) X i } (7.9)
i =1
( Ai − Bi K ) X i + X i ( Ai − Bi K )T + Vi = 0 , i = 1, 2,..., M (7.10)
M
∇J ( K ) = ∑ {Ri KX i − Bi Pi X i }
T
(7.11)
i =1
( Ai − Bi K ) X i + X i ( Ai − Bi K )T + Vi = 0
(7.12)
( Ai − Bi K ) Pi + Pi ( Ai − Bi K ) + Qi + K Ri K = 0
T T
Η δυσκολία του προβλήµατος έγκειται στην εύρεση µιας αρχικής τιµής για το
K ∈ K , προκειµένου να εφαρµοστεί ένας καθοδικός αλγόριθµος. Έτσι, ο
προσδιορισµός µιας τέτοιας τιµής του K είναι συχνά πολύ δύσκολος, πράγµα που
περιορίζει την εφαρµογή της µεθόδου. Σε ανάλογα προβλήµατα µαθηµατικού
προγραµµατισµού ή ιεραρχικού ελέγχου χρησιµοποιείται συνήθως µια τεχνική που
109
συνίσταται στο διαχωρισµό του αρχικού προβλήµατος βελτιστοποίησης σε M
ανεξάρτητα υπο- προβλήµατα. Η ιδέα είναι τότε η εύρεση M διαφορετικών κερδών
ανάδρασης, ένα για κάθε υπο- σύστηµα, µε τον περιορισµό αυτά να είναι µεταξύ τους
ίσα. Η τεχνική αυτή όµως εισάγει δευτερεύοντα θεωρητικά προβλήµατα όπως η
διατήρηση της κυρτότητας και της διαχωρισιµότητας του αρχικού προβλήµατος. Στη
συνέχεια θα παρουσιαστεί µια τεχνική επίλυσης µε πολλαπλασιαστές Lagrange που
καταλήγει στην υλοποίηση ενός αλγορίθµου τριών επιπέδων (Looze 1983).
M
J ( K1 ,..., K M ) = ∑ tr[(Qi + K i Ri K i ) X i ]
T
(7.14)
i =1
( Ai − Bi K i ) X i + X i ( Ai − Bi K i )T + Vi = 0 (7.15)
Αν K i ∉ K , τότε
J ( K1 ,..., K M ) = +∞ (7.16)
K i = K i +1 , i = 1, 2,..., M − 1 (7.17)
Επειδή το πρόβληµα αυτό γενικά δεν ικανοποιεί τις συνθήκες κυρτότητας που
απαιτούνται για την άµεση εφαρµογή της θεωρίας Lagrange, προστίθενται στην
(7.14) τετραγωνικοί όροι συναρτήσει των K i οπότε λαµβάνεται η µορφή,
M
1
J ( K1 ,..., K M ; K ) = J ( K1 ,..., K M ) + ∑ tr[( K i − K )( K i − K )T ] (7.18)
i =1 2c
Έτσι, για προκαθορισµένο K και για ικανοποιητικά µικρή τιµή του c , το πρόβληµα
ελαχιστοποίησης της (7.18) υπό τους περιορισµούς (7.15) και (7.17) ικανοποιεί τους
περιορισµούς κυρτότητας της θεωρίας Lagrange. Επιπλέον, για προκαθορισµένο K
το πρόβληµα παραµένει διαχωρίσιµο. Τέλος, αν K = K ∗ στη λύση της (7.10), τότε το
ζητούµενο κέρδος ανάδρασης είναι K1 = ... = K M = K ∗ .
110
ϕc ( K ) = min {J ( K1 ,..., K M ; K ) : ικανοποιούνται οι (7.15), (7.17)} (7.19)
( K1 ,..., K M )∈K
Αποδεικνύεται ότι το κέρδος K ∗ αποτελεί ένα τοπικό ελάχιστο της ϕc και ότι
1
∇ϕc ( K ) = [ K − Kˆ ( K , c)] (7.20)
c
όπου Kˆ ( K , c) είναι η λύση στην ελαχιστοποίηση που απαιτεί η (7.19). Άρα, µπορεί
να χρησιµοποιηθεί ένας καθοδικός αλγόριθµος µε τη µορφή,
K k +1 = K k − α k ∇ϕc ( K k ) (7.21)
M −1
L(Λ1 ,..., Λ M −1 , K1 ,..., K M ; K ) = J ( K1 ,..., K M ; K ) + ∑ tr[Λ i ( K i − K i +1 )]
T
(7.22)
i =1
Τότε, για ικανοποιητικά µικρή τιµή του c , ισχύει η θεωρία Lagrange σύµφωνα µε την
οποία,
⎧1 T 1 ⎫
min tr ⎨ (Qi + K i Ri K i ) X i + (Λ i − Λ i −1 )T K i + ( K i − K )T ( K i − K ) ⎬ (7.24)
Ki
⎩2 2c ⎭
µε τους περιορισµούς,
( Ai − Bi K i ) X i + X i ( Ai − Bi K i )T + Vi = 0 (7.25)
T 1
Ri K i X i − Bi Pi X i + (Λ i − Λ i −1 ) + ( K i − K ) (7.26)
c
111
T
( Ai − Bi K i )T Pi + Pi ( Ai − Bi K i ) + Qi + K i Ri K i = 0 (7.27)
Αλγόριθµος 7.2.1
0 −1 T
K i = Ri Bi M i (7.29)
T −1 T
Ai M i + M i Ai + Qi − M i Bi Ri Bi M i = 0 (7.30)
για i = 1, 2,..., M .
112
7.3 Μέθοδος µη- γραµµικής βελτιστοποίησης
Έστω και πάλι το σύστηµα (7.1) µε τετραγωνική συνάρτηση κόστους (7.2) και
για το οποίο αναζητείται ένας νόµος ελέγχου της µορφής (7.4). Για ευκολία στους
συµβολισµούς ορίζονται τα διανύσµατα,
⎡ x1 ⎤ ⎡ u1 ⎤ ⎡ y1 ⎤
X = ⎢⎢ ⎥⎥ , U = ⎢⎢ ⎥⎥ , Y = ⎢⎢ ⎥⎥
⎢⎣ xM ⎥⎦ ⎢⎣uM ⎥⎦ ⎢⎣ yM ⎥⎦
(7.31)
Ακόµη, ορίζεται το σύνολο κερδών ανάδρασης που εξασφαλίζουν ευστάθεια
κλειστού βρόχου µε βαθµό σχετικής ευστάθειας α σε όλα τα µοντέλα, δηλαδή για
i = 1, 2,..., M , ως εξής:
Αν K ∈ K α , τότε
⎧∞ ⎫
Jα ( K ) = E ⎨ ∫ ⎡⎣ X T (t )QX (t ) + U T (t ) RU (t ) ⎤⎦ dt ⎬ (7.33)
⎩0 ⎭
Αν K ∉ K α , τότε Jα ( K ) = +∞
X (t ) = ( A + α I ) X (t ) + BU (t )
(7.34)
Y (t ) = CX (t )
U (t ) = − KX (t ) (7.35)
113
Jα ( K ) = tr ( PV ) (7.36)
( A − BK + α I )T P + P( A − BK + α I ) = −Q − K T RK (7.37)
Έτσι, το αρχικό πρόβληµα σχεδιασµού ανάγεται στην εύρεση ενός νόµου ελέγχου της
µορφής (7.35) (τότε K = K opt ) που σταθεροποιεί ασυµπτωτικά το µοντέλο (7.34) για
α = 0 και ελαχιστοποιεί την (7.33).
Για την εύρεση αυτών των κερδών ανάδρασης ακολουθείται η ακόλουθη διαδικασία
(Aioun et al. 1996).
Αλγόριθµος 7.3.1
114
Με τη µετατόπιση των ιδιοτιµών επιτυγχάνεται η σταθεροποίηση του
κλειστού συστήµατος. Ο παραπάνω αλγόριθµος συγκλίνει πάντα σε µια τιµή K opt ,
όταν υπάρχει ένας αρχικός ρυθµιστής.
xi (t ) = Ai xi (t ) + Bi ui (t ) (7.38)
M ⎧∞ T ⎫
J ( K ) = ∑ E ⎨ ∫ ⎡⎣ xi (t )Qi xi (t ) + ui (t ) Ri ui (t ) ⎤⎦ dt ⎬
T
(7.39)
i =1 ⎩0 ⎭
( Ai − Bi K )T Pi + Pi ( Ai − Bi K ) + Qi + K T Ri K = 0 (7.40)
για i = 1, 2,..., M
M ⎧∞ T ⎫ M
J ( K ) = ∑ E ⎨ ∫ ⎡⎣ xi (t )Qxi (t ) + ui (t ) Rui (t ) ⎤⎦ dt ⎬ = ∑ tr (P)
T
(7.41)
i =1 ⎩0 ⎭ i =1
( Ai − Bi K )T P + P( Ai − Bi K ) + Q + K T RK = 0 (7.42)
115
Θεώρηµα 7.4.1
Αν το ακόλουθο πρόβληµα ελαχιστοποίησης,
min[tr ( M )] (7.43)
M ,W
µε περιορισµούς LMI
⎡M I⎤
⎢I >0 (7.44)
⎣ W ⎥⎦
και
⎡ −WAi − AW
i + Bi R −1 Bi
T
W⎤
⎢ ⎥>0 (7.45)
⎢⎣ W Qˆ ⎥⎦
T
K = R −1 Bi P (7.46)
7.5 Παράδειγµα
116
Μοντέλο Ταχύτητα αεροσκάφους προς ταχύτητα ήχου Ύψος (ft)
(α) 0.5 5000
(β) 0.85 5000
(γ) 0.9 35000
(δ) 1.5 35000
x(t ) = Ai x(t ) + Bi u (t )
για i = 1,..., 4 . Οι πίνακες κατάστασης και εισόδου των µοντέλων αυτών είναι,
Για τον έλεγχο του συστήµατος αυτού θα εφαρµοστούν οι µέθοδοι που αναπτύχθηκαν
παραπάνω, δηλαδή η µέθοδος διπλής βελτιστοποίησης, η µέθοδος µη-γραµµικής
βελτιστοποίησης και η µέθοδος µε τη χρήση γραµµικών ανισοτήτων πινάκων (LMIs).
Στους πίνακες που ακολουθούν δίνονται οι τιµές των κερδών ανάδρασης K και οι
χρόνοι απόκρισης (αποκατάστασης ts ) του κλειστού συστήµατος που λαµβάνονται
από κάθε µέθοδο για τα τέσσερα σηµεία λειτουργίας.
117
Μέθοδος Πίνακας κέρδους Κ Χρόνος απόκρισης
(sec)
∆ιπλή βελτιστοποίηση [-0.0285 -0.3120 0.1816] 5.6
Μη-γραµµική βελτιστοποίηση [-1.0241 -1.1758 -0.4344] 4.1
LMI [-0.0250 -0.2563 -0.5235] 2.7
118
Step Response
0
-20
To: Out(1)
-40
-60
0
To: Out(2)
Amplitude
-2
-4
1
0.5
To: Out(3)
-0.5
-1
0 1 2 3 4 5 6
Time (sec)
Σχήµα 7.1 Χρονικές αποκρίσεις των τριών µεταβλητών κατάστασης του πρώτου
µοντέλου µε τις τρεις µεθόδους (µπλε, πράσινο και κόκκινο, αντίστοιχα).
Step Response
0
-10
To: Out(1)
-20
-30
-40
0
To: Out(2)
Amplitude
-2
-4
1
0.5
To: Out(3)
-0.5
0 0.5 1 1.5 2 2.5 3 3.5
Time (sec)
Σχήµα 7.2 Χρονικές αποκρίσεις των τριών µεταβλητών κατάστασης του δεύτερου
µοντέλου µε τις τρεις µεθόδους (µπλε, πράσινο και κόκκινο, αντίστοιχα).
119
Step Response
0
-10
To: Out(1)
-20
-30
-40
0
To: Out(2)
Amplitude
-2
-4
2
1
To: Out(3)
-1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
Time (sec)
Σχήµα 7.3 Χρονικές αποκρίσεις των τριών µεταβλητών κατάστασης του τρίτου
µοντέλου µε τις τρεις µεθόδους (µπλε, πράσινο και κόκκινο, αντίστοιχα).
Step Response
0
-10
To: Out(1)
-20
-30
0
To: Out(2)
Amplitude
-2
-4
1
0.5
To: Out(3)
-0.5
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
Time (sec)
Σχήµα 7.4 Χρονικές αποκρίσεις των τριών µεταβλητών κατάστασης του τέταρτου
µοντέλου µε τις τρεις µεθόδους (µπλε, πράσινο και κόκκινο, αντίστοιχα).
120
7.6 Συµπεράσµατα
121
Κεφάλαιο 8
122
υλοποίησης ενός ελέγχου µε βάση τις εκτιµώµενες τιµές των µεταβλητών
κατάστασης του συστήµατος, µε δεδοµένες τις εισόδους και τις εξόδους του. Στην
περίπτωση αυτή χρησιµοποιείται ένας παρατηρητής κατάστασης για να εκτιµήσει τις
µη-µετρήσιµες καταστάσεις µε βάση τις µετρούµενες πληροφορίες κατάστασης και
τις πληροφορίες εισόδου. Η διαδικασία σχεδιασµού παρατηρητών κατάστασης
συγκρίνει το σφάλµα µεταξύ των µετρηµένων και των εκτιµώµενων καταστάσεων.
Για το σκοπό αυτό χρησιµοποιείται µια συνεχής ανατροφοδότηση προκειµένου να
αναγκάσει το σφάλµα να τείνει στο µηδέν. Έτσι λαµβάνεται ένα σύνολο εκτιµώµενων
καταστάσεων που συσχετίζονται ακριβώς µε τα µετρηµένα σήµατα των εκάστοτε
µοντέλων.
x(t ) = Ax(t ) + Bu (t )
(8.1)
y (t ) = Cx(t )
όπου x(t ) , u (t ) και y (t ) είναι τα διανύσµατα κατάστασης, εισόδου και εξόδου και
όπου τα y (t ) , u (t ) , καθώς και οι πίνακες A, B, C , είναι δεδοµένα. Θεωρώντας ότι
u (t ) = 0 για t ≤ 0− , από την (8.1) προκύπτει ότι η αρχική συνθήκη προσδιορίζεται
από την εξίσωση,
123
T
Π 0 x(0− ) = ⎡⎣ y (0− ) … y ( n −1) (0− ) ⎤⎦ (8.2)
⎡ C ⎤
⎢ CA ⎥
Π 0 = Π 0 ( A, C ) = ⎢ ⎥ = ⎡C T T
AT C T … ( AT ) n −1 C T ⎤⎦ (8.3)
⎢ ⎥ ⎣
⎢ n −1 ⎥
⎣CA ⎦
z0 = x0 + e , e << x0 (8.4)
z (t ) = Az (t ) + Bu (t ) , z (0− ) = z0 = x0 + e (8.5)
όπου e(0− ) είναι η αρχική συνθήκη για το σφάλµα. Η λύση της (8.6) είναι της
µορφής (O’Reilly 1983),
όπου λi είναι οι ιδιοτιµές του A . Από την (8.7) φαίνεται πως, αν έστω και µια ιδιοτιµή
είναι θετική, τότε x(t ) → ∞ για t → ∞ , δηλαδή το σύστηµα είναι ασταθές. Όµως
ακόµη και όταν το σύστηµα είναι ευσταθές, αλλά ορισµένες ιδιοτιµές του έχουν
µικρό πραγµατικό µέρος, τότε η επίδραση του αρχικού σφάλµατος αποσβένεται πολύ
αργά. Προκειµένου να ξεπεραστούν τα προβλήµατα αυτά, χρησιµοποιείται ένα
σύστηµα κλειστού βρόχου.
124
8.1.3 Παρατηρητής κλειστού βρόχου
z (t ) = Az (t ) + Bu (t ) + K [ y (t ) − Cz (t ) ] (8.9)
και είναι φανερό ότι η κατάλληλη εκλογή του K µπορεί να οδηγήσει σε ένα σφάλµα
που αποσβένεται ασυµπτωτικά, οπότε το σύστηµα (8.9) είναι ένας ασυµπτωτικός
παρατηρητής. Η υλοποίηση του συστήµατος µε παρατηρητή κατάστασης δίνεται στο
Σχήµα 8.1.
125
Θεώρηµα 8.1
Αν το ζεύγος ( A, C ) είναι παρατηρήσιµο, τότε µπορούµε να προσδιορίσουµε ένα
πίνακα K έτσι ώστε ο A − KC να έχει τις επιθυµητές ιδιοτιµές, δηλαδή:
y (t ) = Cx(t ) = xn (t ) (8.12)
Από την (8.12) φαίνεται ότι η κατάσταση xn (t ) είναι παρατηρήσιµη. Τότε, η (8.1)
γράφεται µε τη µορφή,
⎡ xr (t ) ⎤ ⎡ a11 a12 ⎤ ⎡ xr (t ) ⎤ ⎡ b1 ⎤
⎢ x (t ) ⎥ = ⎢ a +
a22 ⎥⎦ ⎢⎣ xn (t ) ⎥⎦ ⎢⎣b2 ⎥⎦
u (t )
⎣ n ⎦ ⎣ 21
(8.13)
y (t ) = Cxn (t )
126
Ο όρος της ανάδρασης [o.a.] στην (8.14) προέρχεται από το σφάλµα εκτίµησης
xr (t ) − zr (t ) , το οποίο όµως δεν είναι µετρήσιµο. Ακόµη, επειδή θεωρείται ότι
zn (t ) = y (t ) , η µετρήσιµη ποσότητα y (t ) − Cz (t ) είναι µηδενική και εποµένως δεν
µπορεί να ανατροφοδοτηθεί, όπως συνέβαινε στην (8.9). Στη συνέχεια
κατασκευάζεται µια κατάλληλη ανάδραση για την εκτίµηση z (t ) .
er (t ) = xr (t ) − zr (t ) = a11er (t )
όπου (8.15)
er (0) = xr (0) − zr (0)
Έχει αποδειχθεί (Luenberger 1966) ότι για ένα παρατηρήσιµο αρχικό σύστηµα
υπάρχουν γραµµικοί µετασχηµατισµοί του διανύσµατος κατάστασης της µορφής
z (t ) = Tx(t ) , έτσι ώστε ένας υπο-πίνακας του πίνακα κατάστασης να έχει τυχαίες
ιδιοτιµές. Η τεχνική του Luenberger χρησιµοποιεί διάφορες πραγµατώσεις του
µοντέλου κατάστασης. Σκοπός είναι ο προσδιορισµός κατάλληλων νόµων ελέγχου
ανάδρασης κατάστασης για το αρχικό σύστηµα, µε χρήση των εκτιµήσεων των
καταστάσεων, όπου αυτές δεν είναι διαθέσιµες. Μια µέθοδος επίλυσης του
προβλήµατος κατασκευής παρατηρητών µειωµένης τάξης συνίσταται στο να
χρησιµοποιείται και η τελευταία εξίσωση κατάστασης της (8.13) που περιέχει κάποια
πρόσθετη πληροφορία για το xr (t ) και έχει τη µορφή,
η οποία είναι πλήρως παρατηρήσιµη από τις u (t ) και y (t ) . Το µόνο πρόβληµα στον
υπολογισµό της yr (t ) είναι η ανάγκη χρησιµοποίησης διαφοριστή για τον
υπολογισµό της παραγώγου y (t ) . Η (8.17) προέκυψε από την επίλυση της (8.16) ως
προς yr (t ) = cr xr (t ) και λαµβάνοντας υπόψη ότι y (t ) = xn (t ) . Από τα παραπάνω
προκύπτει η περιγραφή του συστήµατος µειωµένης τάξης,
127
zr (t ) = a11 zr (t ) + a12 y (t ) + b1u (t ) + K r [ yr (t ) − a21 zr (t ) ] (8.19)
Όπως και στο Θεώρηµα 8.1, προκύπτει ότι, αν το ζεύγος ( a11 , a21 ) είναι
παρατηρήσιµο, τότε υπάρχει K r τέτοιο ώστε το er (t ) να τείνει ασυµπτωτικά
εκθετικά στο µηδέν. Η παρατηρησιµότητα του ζεύγους ( a11 , a21 ) προκύπτει από την
παρατηρησιµότητα του ζεύγους ( A, C ) . Ο παρατηρητής κατάστασης (8.18) µπορεί
να υλοποιηθεί είτε µε τη χρήση διαφοριστή, είτε χωρίς διαφοριστή. Στη δεύτερη
περίπτωση, η είσοδος στον ολοκληρωτή είναι η,
θ (t ) = zr (t ) − K r y (t ) (8.21)
αντί του zr (t ) που υπάρχει στην υλοποίηση µε διαφοριστή. Εποµένως για να πάρουµε
την εκτίµηση zr πρέπει να προστεθεί η ποσότητα K r y (t ) στην έξοδο του
ολοκληρωτή. Οι εξισώσεις κατάστασης για την υλοποίηση χωρίς διαφοριστή είναι,
zr (t ) = θ (t ) + K r y (t )
zn (t ) = xn (t ) = y (t )
και (8.22)
θ (t ) = (a11 − K r a21 )θ (t ) + (a12 − K r a22 + a11 K r − a21 K r ) y (t )
+ (b1 − K r b2 )u (t ) + K r [ yr (t ) − a21 zr (t ) ]
όπου,
θ (t ) = zr (t ) − K r y (t ) (8.23)
x(t ) = Ax(t ) + Bu (t )
(8.24)
y (t ) = Cx(t )
128
πίνακες κατάστασης, ελέγχου και εξόδου. Έστω επίσης ότι απαιτείται ένας νόµος
ανάδρασης κατάστασης της µορφής:
u (t ) = Kx(t ) (8.25)
z (t ) = Dz (t ) + Gy (t ) + Ru (t ) (8.26)
LA − CL = GC (8.28)
R = LB (8.29)
129
τότε η (8.27) παίρνει τη µορφή:
z (t ) − Lx(t ) = Dz (t ) + Gy (t ) − LAx(t )
(8.30)
= Dz (t ) + GCx(t ) − LAx(t )
130
είναι Γκαουσιανή, το µέσο τετραγωνικό σφάλµα δεν είναι δυνατόν να λάβει όλες τις
πληροφορίες στις ακολουθίες σφάλµατος. Προκειµένου να επεκταθεί ο παρατηρητής
Luenberger σε µη-γραµµικά δυναµικά συστήµατα µε τον µη-Γκαουσσιανό θόρυβο,
απαιτείται ένα εναλλακτικό κριτήριο βελτιστοποίησης.
xk +1 = Axk + Buk
(8.33)
yk = Cxk + Duk
zk +1 = Azk + Buk + L( yk − yˆ k )
(8.34)
yˆ k = Czk + Duk
Εάν το διάνυσµα κέρδους του παρατηρητή L καθοριστεί να παίρνει µια τιµή έτσι
ώστε η δυναµική του σφάλµατος εκτίµησης να δίνεται από τη σχέση,
ek +1 = xk +1 − zk +1 = ( A − LC )ek (8.35)
και επιπλέον έχει ευσταθείς ιδιοτιµές, τότε η ολική ασυµπτωτική ευστάθεια του
παρατηρητή είναι εγγυηµένη.
xk +1 = f ( xk ,uk , k )
(8.36)
yk = g ( xk ,uk , k )
zk +1 = f ( zk ,uk , k ) + L( yk − yˆ k )
(8.37)
yˆ k = g ( zk ,uk , k )
131
διαταραχή που επηρεάζει τις εξισώσεις µετάβασης και τις µετρήσεις είναι ιδιαίτεροι
και δεν µπορούν να αντιµετωπιστούν ικανοποιητικά µε το φιλτράρισµα.
xk +1 = f ( xk ,uk , k ) + vk
(8.38)
yk = g ( xk ,uk , k ) + wk
Για τον παρατηρητή Luenberger (8.34), υπάρχει µια αναλυτική µέθοδος ώστε
να επιλεγεί το κέρδος L έτσι ώστε ο παρατηρητής να συµπεριφερθεί σύµφωνα µε τις
απαιτήσεις του σχεδιασµού ελέγχου. Αλλά µια τέτοια µέθοδος δεν είναι ακόµα
διαθέσιµη για τον εκτεταµένο παρατηρητή Luenberger (8.37). Αντί να
προκαθορίζεται το κέρδος παρατηρητή, εφαρµόζουµε τις θεωρητικές τεχνικές
εκµάθησης πληροφοριών για να ενηµερωθεί το κέρδος παρατηρητή κατά τη διάρκεια
της πορείας εκτίµησης κατάστασης έτσι ώστε η εντροπία του σφάλµατος µεταξύ της
µέτρησης και της εκτιµώµενης εξόδου να ελαχιστοποιείται σε κάθε βήµα (Kailath
1980, O’Reilly 1983).
y (t ) = (C + ∆C ) x(t ) (8.39)
x(0) = x0 , t ∈ [0, ∞)
132
πίνακες κατάστασης, ελέγχου και εξόδου. Οι αβεβαιότητες του µοντέλου
περιγράφονται ως παραµετρικές µεταβολές της µορφής,
kr kp kq
∆A = ∑ Ai ri , ∆B = ∑ Bi pi , ∆C = ∑ Ci qi (8.40)
i =1 i =1 i =1
ℜ = {r ∈ R k : ri ≤ r , i = 1, 2,..., k r }; r > 0
r
P ={p∈R
kp
: pi ≤ p , i = 1, 2,..., k p }; p > 0 (8.41)
kq
Q = {q ∈ R : qi ≤ q , i = 1, 2,..., k q }; q > 0
T
Ai = di ei , i = 1, 2,..., kr
T
Bi = fi gi , i = 1, 2,..., k p (8.42)
T
Ci = hi wi , i = 1, 2,..., kq
kr kr
Dˆ := ∑ di di , Eˆ := ∑ ei ei
T T
i =1 i =1
kp kp
Fˆ := ∑ f i f i , Gˆ := ∑ gi gi
T T
(8.43)
i =1 i =1
kq kq
Hˆ := ∑ hi hi , Wˆ := ∑ wi wi
T T
i =1 i =1
133
που συνδέεται µε το σύστηµα (8.39) και που πρέπει να ελαχιστοποιηθεί για
κατάλληλες τιµές των µεταβλητών ελέγχου υπό τις εξής προϋποθέσεις: (i) Q > 0 ,
(ii) R > 0 , (iii) ( A, B) ελέγξιµο και (iv) ( A, Q1/ 2 ) παρατηρήσιµο.
Ορισµός 8.2
Έστω ότι για το αβέβαιο σύστηµα (8.39)-(8.41) µε τετραγωνική συνάρτηση κόστους
(8.44), το πλήρες διάνυσµα κατάστασης είναι µετρήσιµο. Ένας νόµος ελέγχου της
µορφής u (t ) : R n → R m , t ∈ [0, ∞) λέγεται έλεγχος εγγυηµένου κόστους, αν υπάρχει
ένας θετικός αριθµός J , που λέγεται εγγυηµένο κόστος, έτσι ώστε
J ( x0 , u (.), ∆A, ∆B, ∆C ) ≤ J , για όλες τις επιτρεπτές αβεβαιότητες.
Το παρακάτω θεώρηµα δίνει µια ικανή συνθήκη για τον έλεγχο εγγυηµένου κόστους.
Θεώρηµα 8.3
Έστω το αβέβαιο σύστηµα (8.39) µε τετραγωνική συνάρτηση κόστους (8.44). Ο
νόµος ελέγχου ανάδρασης κατάστασης
u (t ) = − R −1 BT Px(t ) (8.45)
T
J = x0 Px0 (8.46)
ˆ −1 BT − Fˆ − Dˆ ) P + Q + Eˆ = 0 .
PA + AT P − P( BR −1 BT − BR −1GR (8.47)
134
u (t ) = K c z (t ) (8.48)
z (t ) = Az (t ) + Bu (t ) − K o [Cz (t ) − y (t )] (8.49)
⎡P 0 ⎤ ⎡ x(t ) ⎤
V ( x, e, t ) = ⎡⎣ xT (t ) eT (t ) ⎤⎦ ⎢ c (8.54)
⎣0 Po ⎦⎥ ⎢⎣ e(t ) ⎥⎦
135
⎡ P [ A + ∆A + ( B + ∆B ) K c ] − Pc ( B + ∆B) K c ⎤ ⎡ x(t ) ⎤
V ( x, e) = 2 ⎣⎡ xT (t ) eT (t ) ⎦⎤ ⎢ c ⎥⎢ ⎥
⎣ Po [∆A − K o ∆C + ∆BK c ] Po [ A − K o C − ∆BK c ]⎦ ⎣ e(t ) ⎦
(8.55)
V ( x, e, t ) = Vc ( x, t ) + Vo (e, t ) (8.56)
όπου
Vc ( x, t ) = xT (t ) Pc x(t ) (8.57)
και
Vo (e, t ) = eT (t ) Po e(t ) (8.58)
Όπως είναι γνωστό, µια ικανή συνθήκη για τον έλεγχο εγγυηµένου κόστους είναι,
Vc ( x, t ) ≤ − xT (t )Qx(t ) − u T (t ) Ru (t ) (8.59)
Επιπλέον, η συνθήκη,
T
V ( x, e) = Vc ( x, e) + Vo ( x, e) ≤ − xT Qx − ( xT − eT ) K c RK c ( x − e) − eT Qo e (8.61)
⎡Q + K cT RK c − K c RK c ⎤ ⎡ x ⎤
T
V ( x, e) ≤ − ⎡⎣ x T
e ⎤⎦ ⎢
T
⎥⎢ ⎥ (8.62)
Qo + K c RK c ⎥⎦ ⎣ e ⎦
T T
⎢⎣ − K c RK c
⎡ 2 P [ A + ∆A + ( B + ∆ B ) K c ] −2 Pc ( B + ∆B) K c ⎤ ⎡ x ⎤
⎡⎣ xT eT ⎤⎦ ⎢ c ⎥⎢ ⎥+
⎣ 2 Po (∆A − K o ∆C + ∆BK c ) 2 Po [ A − K o C − ∆BK c ]⎦ ⎣ e ⎦
(8.63)
⎡Q + K cT RK c − K c RK c ⎤ ⎡ x ⎤
T
⎣⎡ x e ⎦⎤ ⎢ ⎥⎢ ⎥ ≤0
T T
Qo + K c RK c ⎥⎦ ⎣ e ⎦
T T
⎢⎣ − K c RK c
ˆ x + xT Ex
2 xT Pc ∆Ax ≤ xT Pc DP ˆ (8.64)
c
136
2 xT Pc ∆BK c x ≤ xT Pc FP ˆ x
ˆ x + xT K T GK (8.65)
c c c
−2eT Po ∆BK c e ≤ eT Po FP ˆ e
ˆ e + eT K T GK (8.66)
o c c
ˆ
−2eT Po K o ∆Cx ≤ eT Po K o HK
T T ˆ
o Po e + x Wx (8.67)
K c := − R −1 BT Pc (8.68)
και
K o := γ Po −1C T (8.69)
αντίστοιχα, όπου γ είναι µια θετική σταθερά που πρέπει να προσδιοριστεί κατά τη
διάρκεια του σχεδιασµού, προκύπτει από την (8.68) ότι,
−2 xT Pc BK c e ≤ xT Pc BK c x + eT Pc BK c e (8.70)
⎡V 0 ⎤ ⎡ x(t ) ⎤
⎡⎣ xT (t ) eT (t ) ⎦⎤ ⎢ 1 ⎥⎢ ⎥<0 (8.71)
⎣ 0 V2 ⎦ ⎣ e(t ) ⎦
όπου
T ˆ + 2 P FP
V1 = Pc A + AT Pc + 2 Pc BK c + K c RK c + Pc DP ˆ + Q + 2 Eˆ + Wˆ (8.72)
ˆ + 2 K T GK
c c c c c
και
ˆ + 2 P FP
V2 = Po A + AT Po − 2 Po K oC + Po DP ˆ + P K HK
ˆ T T
o o o o o o Po + Qo + K c RK c +
T ˆ
2 K GKc c
(8.73)
Αντικαθιστώντας τα κέρδη K c και K o από τις (8.68) και (8.69), αντίστοιχα, η (8.71)
ικανοποιείται εάν οι ακόλουθες γενικευµένες ανισότητες Riccati,
ˆ + 2 P FP
Pc A + AT Pc − Pc BR −1 BT Pc + Pc DP ˆ −1 BT P + Q + 2 Eˆ + Wˆ < 0
ˆ + 2 P BR −1GR
c c c c c
(8.74)
και
ˆ + 2 P FP
Po A + AT Po − 2γ C T C + Po DP ˆ + γ 2C T HC
ˆ + Q + P BR −1 BT P +
o o o o c c
(8.75)
−1 ˆ −1 T
2 P BR GR B P < 0
c c
137
Θεωρώντας τυχαίες αρχικές συνθήκες µε µηδενική µέση τιµή και µοναδιαία
συσχέτιση και θεωρώντας επίσης την προσδοκία της τετραγωνικής συνάρτησης
κόστους, το εγγυηµένο κόστος ισούται µε το ίχνος του πίνακα Pc (βλ. Κεφ. 3).
Προκειµένου να µειωθεί ο συντηρητισµός που χαρακτηρίζει συνήθως τις µεθόδους
ελέγχου εγγυηµένου κόστους, είναι επιθυµητό να ελαχιστοποιηθεί το εγγυηµένο
κόστος. Από την άλλη µεριά, το ίχνος του πίνακα Po παρέχει ένα µέτρο του κέρδους
παρατηρητή το οποίο θα πρέπει να γίνεται αρκετά µεγάλο, προκειµένου να καλύψει
όλη την περιοχή επιτρεπτών αβεβαιοτήτων. Έτσι, οι προδιαγραφές ελέγχου
ικανοποιούνται λύνοντας δύο χωριστά προβλήµατα, το πρόβληµα ελέγχου
εγγυηµένου κόστους και το πρόβληµα σχεδιασµού εύρωστου παρατηρητή.
d i ei = σ i d i (1/ σ i )ei ,
T T
i = 1, 2,..., kr
fi g i = τ i fi (1/ τ i ) gi ,
T T
i = 1, 2,..., k p
(8.76)
hi wi = ϕi hi (1/ ϕi ) wi ,
T T
i = 1, 2,..., kq
Το παρακάτω θεώρηµα δίνει µια αριθµητική λύση στο πρόβληµα του ελέγχου
εγγυηµένου κόστους µε βάση τις εκτιµώµενες τιµές των καταστάσεων.
Θεώρηµα 8.4
Έστω το αβέβαιο σύστηµα (8.39) µε τετραγωνική συνάρτηση κόστους (8.44). Αν το
ακόλουθο πρόβληµα βελτιστοποίησης:
min Tr ( M c ) (8.78)
M c , Pc , S ,T , Φ
µε περιορισµούς LMI
⎡M c I⎤
⎢ I >0 (8.79)
⎣ Pc ⎥⎦
και
138
⎡ − Pc AT − APc + BR −1 BT − DSDT − 2 FTF T Pc E BR −1G PW
c Pc ⎤
⎢ ⎥
⎢ 1
E T Pc S 0 0 0⎥
⎢ 2 ⎥
⎢ 1 ⎥>0
⎢ G T R −1 B T 0 T 0 0⎥
⎢ 2 ⎥
⎢ W T Pc 0 0 Φ 0⎥
⎢ ⎥
⎣⎢ Pc 0 0 0 Q ⎦⎥
(8.80)
όπου
Pc = Pc −1 (8.81)
και
Q = Q −1 (8.82)
u (t ) = − R −1 BT Pc z (t ) (8.83)
Pc A + AT Pc − Pc BR −1 BT Pc + Pc DSDT Pc + 2 Pc FTF T Pc +
(8.84)
2 Pc BR −1GT −1GT R −1 BT Pc + Q + 2 ES −1 E T + W Φ −1W T < 0
139
Θεώρηµα 8.5
Έστω το αβέβαιο σύστηµα (8.39) µε τετραγωνική συνάρτηση κόστους (8.44). Αν το
ακόλουθο πρόβληµα βελτιστοποίησης:
min Tr ( M o ) (8.85)
M o , Po
µε περιορισµούς LMI,
⎡M o I⎤
⎢ I >0 (8.86)
⎣ Po ⎥⎦
και
−1
Po = Po (8.88)
QΛ = (Qo + Λ ) −1 (8.89)
έχει ένα µη-κενό σύνολο εφικτών λύσεων ( M o , Po ) για κάποιο θετικά ορισµένο
πίνακα βάρους Qo και για κάποια θετική σταθερά γ > 0 µε M o , Po θετικά
ορισµένους συµµετρικούς πίνακες, τότε ο γραµµικός παρατηρητής (8.49) µε κέρδος,
K o = γ Po −1C T (8.91)
Po A + AT Po − 2γ C T C + Po DSDT Po + 2 Po FTF T Po + γ 2C T H ΦH T C +
(8.92)
+Qo + Pc BR −1 BT Pc + 2 Pc BR −1GT −1G T R −1 BT Pc < 0
Χρησιµοποιώντας τις (8.76), (8.77), η (8.92) είναι ισοδύναµη µε την (8.75). Άρα,
ικανοποιείται (8.60) και συνεπώς ο παρατηρητής που σχεδιάζεται µε κέρδος (8.91)
παρέχει την εκτίµηση των καταστάσεων του κλειστού συστήµατος µε ελάχιστο
σφάλµα παρατήρησης, για κάθε επιτρεπτή αβεβαιότητα. Ακόµη, η εφαρµογή του
συµπληρώµατος Schur στην (8.86) δίνει M o > Po . Άρα, η ελαχιστοποίηση του
140
Tr ( M o ) συνεπάγεται την ελαχιστοποίηση του Tr ( Po ) . Αυτό δίνει ένα κέρδος
παρατηρητή όσο το δυνατόν µεγαλύτερο. Τα ανωτέρω αποτελέσµατα είναι βέλτιστα
λόγω της κυρτότητας της αντικειµενικής συνάρτησης (8.85) και των περιορισµών
(8.86) και (8.87).
Αλγόριθµος 8.6
• Βήµα 1: Επιλύεται το πρόβληµα ελαχιστοποίησης αντικειµενικής συνάρτησης
(8.78) µε περιορισµούς LMI (8.79), (8.80). Αν υπάρχει µια εφικτή λύση, τότε
ένας νόµος ελέγχου εγγυηµένου κόστους της µορφής (8.83) µπορεί να
σχεδιαστεί µε βάση τις εκτιµώµενες καταστάσεις του συστήµατος. Ο
αντίστοιχος «βέλτιστος» διαχωρισµός των αβεβαιοτήτων προσδιορίζεται από
τους πίνακες S , T και Φ .
8.2.4. Παραδείγµατα
⎡ −1 −1⎤ ⎡ −1 0 ⎤ ⎡1⎤
A=⎢ ⎥ , ∆A = ⎢ ⎥ r , B = ⎢ ⎥ , C = [ 0 1] ,
⎣ 0 −2 ⎦ ⎣ 0 0⎦ ⎣1⎦
141
Σχήµα 8.3 Μετρούµενη έξοδος
142
Σχήµα 8.5 ∆υναµική σφάλµατος παρατήρησης
(ιι) Κινητήρας DC
Στο παράδειγµα αυτό θεωρούµε το µοντέλο δεύτερης τάξης ενός DC κινητήρα
(Kosmidou and Vrochidou 2007). Οι πίνακες κατάστασης, ελέγχου και εξόδου είναι,
αντίστοιχα,
⎡ −10 1⎤ ⎡0⎤
A=⎢ ⎥ , B = ⎢ ⎥ , C = [1 0]
⎣ −0.02 −2 ⎦ ⎣2⎦
⎡ 0 ⎤
∆B = ⎢ ⎥ p , ∆C = [ 0.1 0] q
⎣0.01⎦
143
Σχήµα 8.6 Μετρούµενη έξοδος
144
Σχήµα 8.8 ∆υναµική σφάλµατος παρατήρησης
8.3 Συµπεράσµατα
145
Κεφάλαιο 9
Μέθοδοι H - infinity
146
τετραγωνικά προβλήµατα για γραµµικά συστήµατα παίζει σηµαντικό ρόλο στην
περίπτωση που θέλουµε να µετατρέψουµε τον ελεγκτή στο πεδίο του χρόνου. Τα
αποτελέσµατα αυτά επιτάχυναν την έρευνα κυρίως στο πεδίο του χρόνου και
οδήγησαν σε πιο γενικές διατυπώσεις, συµπεριλαµβανοµένων και χρονικά
µεταβλητών συστηµάτων.
Αρκετές φορές, οι H ∞ - ελεγκτές δεν είναι βέλτιστοι, ενώ µπορεί να είναι και
σχετικά αργοί στη λειτουργία τους. Ο όρος «βέλτιστος» εδώ θα πρέπει να
χρησιµοποιείται µε την αυστηρά µαθηµατική έννοια, διότι ο ελεγκτής που προκύπτει
από τη µέθοδο αυτή, ελαχιστοποιεί την επίδραση των εισόδων στις εξόδους, πράγµα
το οποίο µπορεί να µην θεωρείται πάντα βέλτιστο για τους χειριστές των
συστηµάτων. Τέλος, ας σηµειωθεί ότι στο µαθηµατικό σύµβολο της θεωρίας αυτής το
γράµµα H προκύπτει από τον χώρο Hardy, ενώ το «infinity» αντιστοιχεί στο γεγονός
ότι ο ελεγκτής είναι σχεδιασµένος έτσι ώστε να ικανοποιεί τους minimax
περιορισµούς στο πεδίο της συχνότητας. Όπως αναφέρθηκε και στο Κεφάλαιο 1, η
πρωταρχική ιδιότητα της νόρµας H ∞ είναι ότι παριστά τη µέγιστη ενέργεια ενός
σήµατος εξόδου, ως απόκριση σ’ ένα οποιοδήποτε σήµα εισόδου µοναδιαίας
ενέργειας. Στην περίπτωση που έχουµε πολλαπλές εισόδους και πολλαπλές εξόδους
(ΜΙΜΟ), είναι ισοδύναµη µε τη µέγιστη ιδιόρρυθµη τιµή (singular value) της
συνάρτησης µεταφοράς του συστήµατος, ενώ στην περίπτωση µιας εισόδου – µιας
εξόδου (SISO), αντιστοιχεί στη µέγιστη τιµή του πλάτους της συνάρτησης µεταφοράς
(µέγιστο κέρδος µεταξύ εισόδου και εξόδου του κλειστού συστήµατος).
Η ανάπτυξη της όλης σηµαντικής θεωρίας H ∞ είναι πέρα από τους σκοπούς
του συγγράµµατος αυτού. Έτσι, σ’ αυτό το κεφάλαιο θα παρουσιαστεί µια
ανασκόπηση των κυριοτέρων αποτελεσµάτων και της εφαρµογής τους στο γραµµικό
τετραγωνικό πρόβληµα εύρωστου ελέγχου. Ειδικότερα, θα γίνει φανερό πώς η
εύρωστη σταθεροποίηση για µη δοµηµένες αβεβαιότητες στο πεδίο της συχνότητας
συνδέεται µε τη θεωρία H ∞ και στη συνέχεια θα παρουσιαστούν δύο τεχνικές
σχεδιασµού συστηµάτων που εξασφαλίζουν την εύρωστη ευστάθεια και τη βέλτιστη
συµπεριφορά του κλειστού συστήµατος.
Μερικές από τις παρακάτω έννοιες έχουν ήδη παρουσιαστεί στο Κεφάλαιο 1.
Ωστόσο, επαναλαµβάνονται εδώ για λόγους πληρότητας.
Ορισµός 9.1
Η H ∞ - νόρµα ενός ευσταθούς πίνακα H ( s ) είναι,
H ( s) ∞
= sup σ ( H ( jω )) (9.1)
ω
147
όπου σ ( M ) συµβολίζει τη µέγιστη ιδιόρρυθµη τιµή του µιγαδικού πίνακα M . Ας
σηµειωθεί ότι από τον ορισµό των ιδιόρρυθµων τιµών ενός µιγαδικού πίνακα είναι
γνωστό ότι σ ( M ) = M , όπου M συµβολίζει τη συνήθη Ευκλείδεια νόρµα του
µιγαδικού πίνακα M (ή φασµατική νόρµα).
Το σύστηµα P έχει δύο εισόδους: την είσοδο ελέγχου u της οποίας οι µεταβλητές
µπορούν να καθοριστούν από το σχεδιαστή και την εξωτερική είσοδο w η οποία
περιλαµβάνει το σήµα αναφοράς και τις διαταραχές. Επίσης, υπάρχουν δύο έξοδοι: το
σήµα z που παριστά το σφάλµα και πρέπει να ελαχιστοποιηθεί, και η µετρήσιµη
µεταβλητή v που χρησιµοποιείται για τον έλεγχο του συστήµατος. Τόσο οι είσοδοι
όσο και οι έξοδοι γενικά είναι διανύσµατα ενώ οι P και K είναι πίνακες. Το σύστηµα
περιγράφεται από τις εξισώσεις,
u = K ( s )v (9.3)
z = Fl ( P , K ) w (9.4)
όπου
148
ίδιος ορισµός ισχύει και για τη µέθοδο ελέγχου H 2 ). Η H ∞ - νόρµα του πίνακα
µεταφοράς Fl ( P, K ) είναι,
Fl ( P, K ) ∞
= sup σ ( Fl ( P, K ) ( jω ) ) (9.6)
ω
µεταφοράς µεταξύ της διαταραχής dy και της εξόδου y), επιτρέπει την
ελαχιστοποίηση της ενέργειας του σήµατος εξόδου, υπό την επίδραση διαταραχών
πεπερασµένης ενέργειας που ενεργούν στην έξοδο του συστήµατος. Ακόµη, η
µέγιστη ενέργεια µιας εξόδου z, υπό την επίδραση της χειρότερης διαταραχής w, θα
ελαχιστοποιείται, αν ο αντισταθµιστής K ( s ) υπολογιστεί έτσι ώστε να
ελαχιστοποιείται η H ∞ - νόρµα της µεταφοράς µεταξύ z και w που συµβολίζεται
Fzw . Το αντίστοιχο πρόβληµα βελτιστοποίησης διατυπώνεται ως εξής:
min Fzw ∞
(9.7)
K
Fl ( P, K ) ∞
<γ (9.8)
149
Το ζητούµενο, µε αυτό τον τρόπο, δεν είναι να ελαχιστοποιηθεί η νόρµα H ∞ , αλλά
να γίνει µικρότερη από µια τιµή γ. Αυτό είναι γνωστό σαν το υπο-βέλτιστο H ∞
πρόβληµα ελέγχου και η µεταβλητή γ καλείται ορισµένη H ∞ απόδοση.
P ( s ) = C ( sI − A) −1 B (9.9)
P ( s )( I + R( s )) (9.10)
ενώ υποτίθεται ότι η αβεβαιότητα έχει ένα άνω φράγµα της µορφής
σ ( R( jω )) < r ( jω ) , ∀ω (9.11)
( I + F ( s ) P ( s )) −1 F ( s ) P ( s )r ( s ) ≤1 (9.12)
∞
150
Απόδειξη
Η πλήρης απόδειξη δίνεται στην αναφορά (Vidyasagar 1985). Εδώ θα αρκεστούµε σε
µερικά κύρια σηµεία της που αφορούν την ικανή συνθήκη. Είναι γνωστό ότι η
ευστάθεια του παραπάνω κλειστού συστήµατος καθορίζεται από τον αριθµό των
περιστροφών περί την αρχή των αξόνων της ορίζουσας του,
I + F ( jω ) P( jω )( I + R( jω )) (9.13)
( I + F ( jω ) P( jω ))( I + ( I + F ( jω ) P( jω )) −1 F ( jω ) P( jω ) R( jω )) (9.14)
Αν το ονοµαστικό κλειστό σύστηµα είναι ευσταθές, τότε ο όρος ( I + FP) έχει τον
κατάλληλο αριθµό περιστροφών. Εφόσον ικανοποιείται η (9.12), η µέγιστη
ιδιόρρυθµη τιµή του όρου ( I + FP) −1 FPR είναι µικρότερη από τη µονάδα για όλες τις
συχνότητες, έτσι ώστε ο όρος ( I + ( I + FP) −1 FPR) δεν έχει ποτέ µηδενική ορίζουσα.
Άρα, ο πίνακας της (9.13) έχει τον κατάλληλο αριθµό περιστροφών περί την αρχή
των αξόνων. Αυτή είναι µια άλλη έκφραση του Θεωρήµατος Μικρού Κέρδους. Το
γεγονός ότι το ονοµαστικό και το αβέβαιο σύστηµα πρέπει να έχουν τον ίδιο αριθµό
ασταθών πόλων είναι κρίσιµο στην παραπάνω απόδειξη, αφού αυτή βασίζεται στο ότι
το αβέβαιο σύστηµα έχει τον ίδιο αριθµό περιστροφών περί την αρχή των αξόνων µε
το ονοµαστικό σύστηµα.
r ( jω ) ≤ σ ( I + [ F ( jω ) P ( jω )]−1 ) , ∀ω (9.15)
και
σ ( M −1 ) = σ ( M ) (9.17)
F ( s ) = K ( sI − A) −1 B (9.18)
σ ( I + H LQR ( jω )) ≥ 1/ 2 (9.19)
όπου
H LQR ( jω ) = F ( jω ) P( jω ) (9.20)
151
Αυτό σηµαίνει ότι η βέλτιστη LQR λύση που λαµβάνεται µε ανάδραση κατάστασης
εξασφαλίζει εύρωστη ευστάθεια για κάθε πολλαπλασιαστική αβεβαιότητα εισόδου,
της οποίας το φράγµα (9.11) ικανοποιεί τη σχέση
r ( jω ) ≤ 1/ 2 (9.21)
( I + H −1 ) −1 = I − ( I + H ) −1 (9.22)
( I + H −1 ) −1 ≤ 1 + ( I + H ) −1 (9.23)
1 1
≤ 1+ ≤2 (9.24)
σ (I + H )
−1
σ (I + H )
Η τελευταία ανισότητα προκύπτει από το γεγονός ότι για το βέλτιστο H LQR ( s ) ισχύει
ότι
σ ( I + H LQR ( jω )) ≥ 1 (9.25)
ικανοποιώντας το H ∞ φράγµα,
Θεώρηµα 9.3
Αν η λύση της εξίσωσης Riccati
PA + AT P + PBBT P + C T C = 0 (9.28)
152
C ( sI − A) −1 B ≤1 (9.29)
∞
Απόδειξη
Έστω η συνάρτηση Lyapunov V = xT Px . Εφόσον P > 0 και το ζεύγος ( A, C ) είναι
παρατηρήσιµο, έπεται ότι ο πίνακας A είναι ευσταθής, έτσι ώστε η H ∞ - νόρµα είναι
καλώς ορισµένη. Η απόδειξη της (9.29) ισοδυναµεί µε το να αποδειχθεί ότι
I − G*G ≥ 0 (9.30)
όπου
G = C ( jω I − A) −1 B (9.31)
Φ ( s ) = ( sI − A) −1 (9.32)
− PA − AT P = PBBT P + C T C (9.33)
I − GT (− s )G ( s ) = M T (− s ) M ( s ) (9.36)
όπου
M ( s ) = ( I − BT PΦ ( s ) B) (9.37)
Η εξίσωση (9.35) προκύπτει πολλαπλασιάζοντας την (9.34) από δεξιά επί Φ ( s ) B και
από αριστερά επί BT ΦT (− s ) . Η (9.36) προκύπτει προσθέτοντας το µοναδιαίο πίνακα
I και στα δύο µέλη της (9.35), αναστρέφοντας κατάλληλα τους όρους της και
παραγοντοποιώντας το δεξιό µέλος της I − GT (− s )G ( s ) . Επειδή M T ( jω ) M ( jω ) ≥ 0 ,
η απόδειξη ολοκληρώνεται.
1/ 2
⎛1 ∞ ⎞
H ( s ) 2 = ⎜ π ∫ tr[ H T (− jω ) H ( jω )]dω ⎟ (9.38)
⎝ 2 −∞ ⎠
153
Έστω ότι η H ( s ) έχει µια πραγµάτωση χώρου κατάστασης H ( s ) = C ( sI − A) −1 B µε
κρουστική απόκριση h(t ) = Ce At B . Μπορεί να αποδειχθεί το εξής:
Θεώρηµα 9.4
Αν ο πίνακας A είναι ευσταθής, τότε
Απόδειξη
Από το Θεώρηµα του Parseval η H 2 - νόρµα γράφεται και µε τη µορφή,
1/ 2 1/ 2
⎛∞ ⎞ ⎛∞ ⎞
H ( s ) 2 = ⎜ ∫ tr[hT (t )h(t )]dt ⎟ = ⎜ ∫ tr[ BT e A t C T Ce At B]dt ⎟
T
= (trPBBT )1/ 2
⎝0 ⎠ ⎝0 ⎠
(9.41)
όπου ο P ικανοποιεί την εξίσωση Lyapunov
AT P + PA + CC T = 0 (9.42)
Από τη στοχαστική – αιτιοκρατική δυαδικότητα είναι γνωστό ότι το ίχνος στην (9.41)
µπορεί να γραφεί και µε τη µορφή tr (QC T C ) , όπου ο πίνακας Q δίνεται από την
(9.40). Έτσι, ολοκληρώνεται η απόδειξη.
154
9.3.1 Q – παραµετροποίηση / Σχεδιασµός κυρτού προγραµµατισµού
F ( s ) = [Y ( s ) − Q( s ) N ( s )]−1[ X ( s ) + Q( s ) D( s )] (9.44)
όπου X ( s ) και Y ( s) είναι πίνακες H ∞ που ικανοποιούν την ταυτότητα του Bezout
X ( s ) N ( s ) + Y ( s ) D( s ) = I (9.45)
S = ( I + FP) −1
(9.46)
T = ( I + FP) −1 FP
S = DY − DQN
(9.47)
T = ( I − DY ) + DQN
που είναι και οι δύο της µορφής T1 + T2QT3 . Οι σχέσεις αυτές προκύπτουν
αντικαθιστώντας την F ( s ) από την (9.44) στις εκφράσεις της (9.46) και
χρησιµοποιώντας την ταυτότητα Bezout.
155
Προκειµένου να εξασφαλιστεί η εύρωστη ευστάθεια του συστήµατος ως προς
πολλαπλασιαστικές αβεβαιότητες, µπορεί να χρησιµοποιηθεί ένα φράγµα της H ∞ -
νόρµας του T . Έτσι, αν
T ( s) ∞
≤ 1/ α (9.48)
σ ( R( jω )) < α (9.49)
W1 ( s ) S ( s ) 2
(9.50)
T ( s) ∞
≤γ (9.51)
Επειδή κάθε νόρµα µιας αφφινικής ως προς Q συνάρτησης είναι κυρτή ως προς Q ,
το παραπάνω πρόβληµα βελτιστοποίησης ανάγεται σ’ ένα πρόβληµα κυρτής
βελτιστοποίησης, το οποίο έχει πάντοτε µια µοναδική ελάχιστη τιµή. Άρα, όλες οι
συγκλίνουσες τεχνικές εξεύρεσης ελαχίστου πρέπει να συγκλίνουν σ’ ένα σφαιρικό
ελάχιστο.
f [λ x1 + (1 − λ ) x2 ] ≤ λ f ( x1 ) + (1 − λ ) f ( x2 ) (9.52)
ισχύει για 0 ≤ λ ≤ 1 και για κάθε x1 και x2 που ανήκουν στο S (Luenberger 1984,
Boyd and Barratt 1991). Στις αναφορές αυτές δίνονται επίσης οι κατάλληλοι
αλγόριθµοι κυρτού προγραµµατισµού.
156
ακόλουθη παραµετροποίηση διατηρεί τη γραµµικότητα (αφφινικότητα) ως προς το
διάνυσµα q
N
Q( s ) = ∑ qi Qi ( s ) (9.53)
i =1
2. Επιλογή των πινάκων Qi ( s ) και µιας τιµής του N για την αναγωγή του
προβλήµατος κυρτού προγραµµατισµού σ’ ένα πρόβληµα πεπερασµένης
διάστασης. Το βήµα αυτό είναι δύσκολο καθώς η επιλογή των παραµέτρων
αυτών δεν είναι προφανής. Επίσης, στο βήµα αυτό εισάγεται µια προσέγγιση
της πραγµατικά βέλτιστης τιµής, µε αποτέλεσµα η εύρεση µιας εφικτής λύσης
να είναι πρόβληµα.
157
(bounded -real). Ένα απλό παράδειγµα είναι U ( s ) = S T ΛS , όπου S είναι ένας
προκαθορισµένος ορθογώνιος πίνακας και Λ είναι ένας διαγώνιος πίνακας µε
στοιχεία ki , τις συνιστώσες του διανύσµατος k . Τότε, η U ( s ) παραµένει πραγµατική
– φραγµένη, εφόσον ki ≤ 1 . Αφού η U ( s ) παραµετροποιείται µέσω ενός
διανύσµατος k πεπερασµένης διάστασης, µπορεί να χρησιµοποιηθεί η γνωστή
µέθοδος σχεδιασµού αντισταθµιστών προκαθορισµένης τάξης, προκειµένου να
ελαχιστοποιείται ένας δείκτης επιδόσεων LQG. Τότε, το πρόβληµα ανάγεται σ’ ένα
πρόβληµα µη – γραµµικής βελτιστοποίησης ως προς το διάνυσµα k . Τα βήµατα που
απαιτούνται για το σχεδιασµό µε U – παραµετροποίηση, συνοψίζονται ως εξής:
158
C2 ( sI − A) −1 B ≤γ (9.56)
∞
και
T
C1 ( sI − A) −1 B ≤ (tr[QC1 C1 ])1/ 2 (9.57)
2
Στη συνέχεια παρατίθενται κάποιες απλές σχέσεις για τον προσδιορισµό ενός
ελεγκτή F ( s ) , ο οποίος εγγυάται στο κλειστό σύστηµα ένα φράγµα H ∞ - νόρµας και
έστω γ το φράγµα αυτό. Ειδικότερα, µπορεί να αποδειχθεί (Doyle et al. 1989) ότι το
πρόβληµα σχεδίασης ανάγεται στην επίλυση δύο αποσυζευγµένων εξισώσεων
Riccati. Έστω ότι το σύστηµα περιγράφεται από τις δυναµικές εξισώσεις
όπου
Tzw ( s ) ∞
<γ (9.59)
159
όπου Tzw ( s ) είναι η συνάρτηση µεταφοράς κλειστού βρόχου από το w(t ) στο z (t ) . Η
συνάρτηση µεταφοράς του συστήµατος (9.58) µπορεί να γραφεί µε τη µορφή
⎡A B1 B2 ⎤
G ( s ) = ⎢⎢ C1 D11 D12 ⎥⎥ (9.60)
⎢⎣C2 D21 D22 ⎥⎦
Όπως αποδεικνύεται στην αναφορά (Doyle et al. 1989), στην ειδική περίπτωση όπου
⎡ B1 ⎤ T ⎡ 0 ⎤
⎢ D ⎥ D21 = ⎢ I ⎥ (9.62)
⎣ 21 ⎦ ⎣ ⎦
υπάρχει ένας ελεγκτής για τον οποίο το κλειστό σύστηµα έχει συνάρτηση µεταφοράς
Tzw ( s ) που ικανοποιεί την (9.59), αν υπάρχουν θετικά ηµι-ορισµένες λύσεις των δύο
εξισώσεων Riccati,
AT X + XA + X (γ −2 B1 B1 − B2 B2 ) X + C1 C1 = 0
T T T
(9.63)
AY + YAT + Y (γ −2C1 C1 − C2 C2 )Y + B1 B1 = 0
T T T
⎡ Aˆ − ZL ⎤
F ( s ) := ⎢ ⎥ (9.64)
⎣F 0 ⎦
όπου
Aˆ = A + γ −2 B1 B1 X + B2 F + ZLG2
T
T
F = − B2 X
(9.65)
T
L = −YC2
Z = ( I − γ −2YX ) −1
⎡ Aˆ − ZL ZB2 ⎤
⎢ ⎥
K ( s) = ⎢ F 0 I ⎥ (9.66)
⎢ −C I 0 ⎥⎦
⎣ 2
160
Τα K ij ( s ) που απαιτούνται στην (9.54) από τα επί µέρους µπλοκ της (9.66)
καταλλήλων διαστάσεων και θεωρώντας ότι το K11 ( s ) έχει τη διάσταση του F ( s ) .
9.4 Συµπεράσµατα
161
Κεφάλαιο 10
x1 = x2
b 1
x2 = − x2 + u
m m
⎡0 1 ⎤ ⎡0⎤
⎡ x1 ⎤ ⎢ ⎥ ⎡ x1 ⎤ ⎢ ⎥
⎢x ⎥ = ⎢ b ⎢ ⎥+ 1 u
⎣ 2 ⎦ 0 − ⎥ ⎣ x2 ⎦ ⎢ ⎥
⎣ m⎦ ⎣m⎦
⎡x ⎤
y = [1 0] ⎢ 1 ⎥
⎣ x2 ⎦
162
b 1
Οι τιµές των παραµέτρων είναι, = 0.05 και = 0.001 . Επίσης, το σύστηµα
m m
υπόκειται σε µια εξωτερική διαταραχή που επηρεάζει τη συµπεριφορά του. Έτσι, το
µαθηµατικό του πρότυπο παίρνει τη µορφή
⎡ x1 ⎤ ⎡0 1 ⎤ ⎡ x1 ⎤ ⎡ 0 ⎤ ⎡0⎤
⎢ x ⎥ = ⎢0 −0.05⎥ ⎢ x ⎥ + ⎢0.001⎥ u + ⎢1 ⎥ w
⎣ 2⎦ ⎣ ⎦⎣ 2⎦ ⎣ ⎦ ⎣ ⎦
Σχήµα 10.1 Κρουστική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞
163
Σχήµα 10.2 Βηµατική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞
Σχήµα 10.3 Πόλοι του κλειστού συστήµατος που λαµβάνεται µε τον έλεγχο H ∞
164
Στη συνέχεια εφαρµόζεται στο σύστηµα έλεγχος πολλαπλών στόχων H ∞ / H 2
µε ταυτόχρονη τοποθέτηση των πόλων στην ίδια περιοχή. Ο ελεγκτής που προκύπτει
έχει σηµαντικά µικρότερο κέρδος K = 104 [ -2.0667 -0.6372] και εξασφαλίζει
βελτιωµένες χρονικές αποκρίσεις.
Σχήµα 10.4 Κρουστική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞ / H 2
165
Σχήµα 10.5 Βηµατική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞ / H 2
Σχήµα 10.6 Πόλοι του κλειστού συστήµατος που λαµβάνεται µε τον έλεγχο H ∞ / H 2
166
10.2 Έλεγχος συστήµατος µεταφοράς ταινίας
T0 : δύναµη της τάσης της ταινίας, όταν βρίσκεται στην κεφαλή ανάγνωσης /
εγγραφής, στην κατάσταση ισορροπίας
F : σταθερή δύναµη
Τα µεγέθη αυτά και συγκεκριµένα οι αποκλίσεις τους από το σηµείο ισορροπίας είναι
οι µεταβλητές κατάστασης του συστήµατος. Υποθέτουµε ακόµη ότι υπάρχει µια
διαταραχή w , η οποία επιδρά στο σύστηµα και πρέπει να ελαχιστοποιηθεί. Έτσι, το
µοντέλο κατάστασης του συστήµατος είναι,
⎡ 0 2 0 0 0 ⎤ ⎡0⎤ ⎡0⎤
⎢ −0.1 −0.35 0.1 0.1 0.75⎥ ⎢0⎥ ⎢0⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
x=⎢ 0 0 0 2 0 ⎥ x + ⎢0⎥ u + ⎢0⎥ w
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ 0.4 0.4 −0.4 −1.4 0 ⎥ ⎢0⎥ ⎢0⎥
⎢⎣ 0 −0.03 0 0 −1 ⎥⎦ ⎢⎣1 ⎥⎦ ⎢⎣1 ⎥⎦
όπου
x = [ x1 ω1 i]
T
x2 ω2
⎡ 0 0 0 0 0⎤
⎢ 0 0 1 0 0 ⎥⎥
⎢
y = ⎢ 0.5 0 0.5 0 0⎥ x
⎢ ⎥
⎢ 0 0 0 0 0⎥
⎢⎣ −0.2 −0.2 0.2 0.2 0 ⎥⎦
167
Στο σύστηµα αυτό εφαρµόζεται αρχικά ο ελέγχος H ∞ µε ταυτόχρονη
τοποθέτηση πόλων στην περιοχή x < −1 . Ο ελεγκτής που προκύπτει έχει κέρδος
ανάδρασης K = 109 [ -0.7154 -0.0114 -4.4175 -4.0478 0] . Η τιµή αυτή είναι
πολύ υψηλή, πράγµα που αντανακλάται και στις χρονικές αποκρίσεις του
συστήµατος.
Σχήµα 10.7 Κρουστική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞
Σχήµα 10.8 Βηµατική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞
168
Οι πόλοι του κλειστού συστήµατος είναι κατανεµηµένοι σ’ ένα πολύ ευρύ πεδίο του
αρνητικού µιγαδικού ηµι-επιπέδου. Ο µικρότερος πόλος έχει µια πολύ γρήγορη
δυναµική στη χρονική απόκριση.
Σχήµα 10.9 Πόλοι του κλειστού συστήµατος που λαµβάνεται µε τον έλεγχο H ∞
169
Σχήµα 10.10 Κρουστική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞ / H 2
Σχήµα 10.11 Βηµατική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞ / H 2
170
Σχήµα 10.12 Πόλοι του κλειστού συστήµατος που λαµβάνεται µε τον έλεγχο
H∞ / H2
Ας σηµειωθεί ότι και από το παράδειγµα αυτό γίνεται φανερό ότι η µικτή
µέθοδος H ∞ / H 2 εξασφαλίζει µικρότερα κέρδη και καλύτερες χρονικές αποκρίσεις
από τη µέθοδο H ∞ και για το λόγο αυτό πλεονεκτεί έναντι αυτής.
171
Σχήµα 10.13 Αρχιτεκτονική του ελεγκτή
172
ms , mus : µάζες συµπίεσης και εκτόνωσης
k s , kus : σταθερές ελατηρίων
cs : βαθµός απόσβεσης των στοιχείων συµπίεσης
cus :βαθµός απόσβεσης των στοιχείων εκτόνωσης
xc , xw : µετατοπίσεις των µαζών
xr : µετατόπιση του τροχού
ms xc = k s ( xw − xc ) + cs ( xw − xc ) + Fa
mus xw = kus ( xr − xw ) + cus ( xr − xw ) −
k s ( xw − xc ) − cs ( xw − xc ) − Fa
X = A1 X + B1u
όπου
X = [ xr − xw xc ]
T
xw xw − xc
u = [ Fa xr ]
T
Fa = θ1[k1 ( xw − xc ) − k2 Fa + k3u ] + d
u = u1a + u1s
173
Το προσαρµοστικό µέρος θα είναι:
1 1
u1a = [− k1 ( xw − xc ) + k2 Fa + ( Fd + p1e1 )]
k3 θˆ1π
όπου,
Fd : η επιθυµητή δύναµη
e1 : το σφάλµα ανίχνευσης Fa − Fd
θˆ1π : µία φραγµένη εκτίµηση του θ1
p1 : µία παράµετρος ρύθµισης
1 1 1
u1s = −e1 [ π 1M 2 (k1 ( xw − xc ) − k2 Fa + k3u1a ) 2 + 2
dM ]
4θ1m k3 ε11 ε12
όπου,
π 1M : θετικός αριθµός τέτοιος ώστε π 1M ≥ θˆ1π ∀t
ε11 , ε12 : προσαρµόσιµοι µικροί αριθµοί
174
Σχήµα 10.15 Προσοµοίωση ανίχνευσης δύναµης
175
Σχήµα 10.16 Πειραµατικό µοντέλο
Το µοντέλο αυτό βασίζεται στο µοντέλο του ποδηλάτου (Σχήµα 10.17). Η θέση
αναπαρίσταται από το ζεύγος ( x, s ) , τις καρτεσιανές συντεταγµένες του κέντρου P
του τροχού σε ένα πλαίσιο αναφοράς [0, Χ, S], του οποίου ο δεύτερος άξονας
συµπίπτει µε την ευθεία γραµµή που ακολουθείται από το όχηµα. Ο
προσανατολισµός του καθορίζεται από την παράµετρο ψ (γωνία µεταξύ του άξονα
του οχήµατος και 0S), θετική αντίθετα από τη φορά του ρολογιού.
x = −V sinψ
s = V cosψ
Σε ότι αφορά τη σχέση της γραµµικής ταχύτητας στο σηµείο P και αυτής στο
στιγµιαίο κέντρο περιστροφής (Instantaneous Center of Rotation ICR) , η οποία είναι
µηδέν, αποδεικνύεται ότι,
V
ψ= tan δ
L
176
Σχήµα 10.17 Μοντέλο ποδηλάτου
Το ζητούµενο δεν είναι να εντοπιστεί ένα σηµείο της γραµµής αναφοράς, αλλά απλά
να ακολουθήσουµε τη γραµµή. Ενδιαφερόµαστε εποµένως να ρυθµίσουµε τα x και
ψ . Από τις προηγούµενες σχέσεις και χρησιµοποιώντας µία προσέγγιση για πολύ
µικρές γωνίες, οδηγούµαστε στις παρακάτω εξισώσεις του οχήµατος:
x = −ψ
δ
ψ=
L
Το ύψος της κάµερας ως προς το έδαφος και η κλίση της γωνίας της ως προς την
κατακόρυφο θα αναφέρονται ως h και a , αντίστοιχα. Η τρισδιάστατη λευκή γραµµή
προβάλλεται ως δισδιάστατη στο πλαίσιο της κάµερας. Η εξίσωσή της είναι,
px = ap y + b
όπου
1
a= x
ξ1
ξ2 1
b=− x+ ψ
ξ1ξ3 ξa
και
fψ fψ 1
ξ1 = h , ξ2 = − a , ξ3 =
fx fx fx
177
Θεωρώντας ως διάνυσµα κατάστασης το Z = [ a b ] και απαλείφοντας το ψ από τις
T
Z = AZ + Bδ
y = CZ
όπου
⎡ ξ2 ξ3 ⎤
⎢− ξ −
ξ1 ⎥ ⎡ 0 ⎤
A=⎢ 2
1
⎥, B=⎢ 1 ⎥
⎢ ξ2 ξ2 ⎥ ⎢ ⎥
⎢ ⎥ ⎢ Lξ
⎣ a ⎥⎦
⎣⎢ ξ1ξ3 ξ1 ⎦⎥
Στο σχήµα αυτό C ( p) είναι η διάταξη του ελεγκτή. Το ανοικτό αβέβαιο σύστηµα
είναι,
F ( p) = F0 ( p) + ∆F0 ( p)
C ( p)
q( p) =
1 + F0 ( p)C ( p)
1 + F ( jω )C ( jω ) ≠ 0 , ∀ω
178
ενώ η εύρωστη ευστάθεια εξασφαλίζεται για
q( p )r ( p ) ∞
<1
όταν
∆F0 ( jω ) ≤ r ( jω ) , ∀ω
και
r ( jω )
≤ 1 , ∀ω
F0 ( jω )
Υπό αυτές τις συνθήκες, ο εύρωστος ελεγκτής µπορεί να εκφραστεί τελικά ως,
q( p)
C ( p) =
1 − F0 ( p)q( p)
και είναι αυτός που εξασφαλίζει εύρωστη ευστάθεια και απόρριψη της διαταραχής.
Η εφαρµογή αυτή αναφέρεται στο σχεδιασµό ενός εύρωστου ελεγκτή για τον
έλεγχο «αρχηγού-ακολούθου» µίας διµοιρίας αυτόνοµων υποβρυχίων οχηµάτων
(Okamoto et al. 2004). Υποθέτουµε ότι ο αρχηγός γνωρίζει τη θέση του και οι
ακόλουθοι ξέρουν µόνο µία εµβέλεια και µία κατεύθυνση προς τον αρχηγό. Ο
αρχηγός πλοηγεί χρησιµοποιώντας ένα σύστηµα οδηγού πλοήγησης και οι ακόλουθοι
διατηρούν καθορισµένες αποστάσεις από τον αρχηγό. Ο ελεγκτής τόσο για τον
αρχηγό όσο και για τους ακολούθους βασίζεται στη θεωρία του γραµµικού
τετραγωνικού ρυθµιστή µε γκαουσιανό θόρυβο (Linear Quadratic Gaussian LQG και
Loop Transfer Recovery LTR).
Το υπό έλεγχο σύστηµα είναι ένα αυτόνοµο υποβρύχιο όχηµα το οποίο έχει
έξι βαθµούς ελευθερίας. Εφόσον η µελέτη της κίνησης του οχήµατος θα γίνει στο
οριζόντιο επίπεδο µόνο, οι έξι βαθµοί ελευθερίας µπορούν να µειωθούν στους τρεις,
διευκολύνοντας έτσι τη µελέτη µας. Το γραµµικό µοντέλο του συστήµατος είναι:
x = Ax + Buin
y = Cx + Duin
όπου
x = [u v r ψ ] , uin = ⎡⎣u prop
T T
δ r ⎤⎦
179
r : ο ρυθµός περιστροφής σε rad/sec
ψ : η γωνία περιστροφής σε rad
u prop : η ώθηση της προπέλας σε m
δ r : η γωνία του πηδαλίου σε rad
Οι δύο επόµενες εξισώσεις είναι απαραίτητες για τον προσδιορισµό της θέσης του
οχήµατος:
X = u cosψ + v sinψ
Y = −u sinψ + v cosψ
⎡ ui ⎤ ⎡ −0.372 0 0 0 0 ⎤ ⎡ ui ⎤
⎢v ⎥ ⎢ ⎢ ⎥
⎢ i ⎥ ⎢ 0 −2.7815 −0.6315 0 0 ⎥⎥ ⎢ vi ⎥
⎢ ri ⎥ = ⎢ 0 −5.0016 −1.9732 0 0 ⎥ ⎢ ri ⎥
⎢ ⎥ ⎢ ⎥⎢ ⎥
⎢ψ i ⎥ ⎢ 0 0 1 0 0 ⎥ ⎢ψ i ⎥
⎢ ex ,i ⎥ ⎢⎣ −1 0 0 0 0 ⎥⎦ ⎢⎣ ex ,i ⎥⎦
⎣ ⎦
⎡0.032 0 ⎤ ⎡0 ⎤
⎢ 0 ⎥
0.2831 ⎥ ⎢0 ⎥
⎢ ⎡u prop ,i ⎤ ⎢ ⎥
+⎢ 0 −1.5952 ⎥ ⎢ ⎥ + ⎢ 0 ⎥ u0
⎢ ⎥ ⎣ δ r ,i ⎦ ⎢ ⎥
⎢ 0 0 ⎥ ⎢0 ⎥
⎢⎣ 0 0 ⎥⎦ ⎣⎢1 ⎥⎦
180
Υποθέτοντας ότι ο ακόλουθος γνωρίζει την κατάσταση από τον αρχηγό, η εξίσωση
εξόδου θα είναι,
⎡ ui ⎤
⎢ ⎥
⎡1 0 0 0 0 ⎤ ⎢ vi ⎥
yi = ⎢⎢0 0 0 1 0 ⎥⎥ ⎢ ri ⎥
⎢ ⎥
⎢⎣0 0 0 0 1 ⎥⎦ ⎢ψ i ⎥
⎢ ex ,i ⎥
⎣ ⎦
⎡ u0 ⎤ ⎡ −0.372 0 0 0 0 ⎤ ⎡ u0 ⎤
⎢v ⎥ ⎢ ⎢ ⎥
⎢ 0⎥ ⎢ 0 −2.7815 −0.6315 0 0 ⎥⎥ ⎢ v0 ⎥
⎢ r0 ⎥ = ⎢ 0 −5.0016 −1.9732 0 0 ⎥ ⎢ r0 ⎥
⎢ ⎥ ⎢ ⎥⎢ ⎥
⎢ψ 0 ⎥ ⎢ 0 0 1 0 0 ⎥ ⎢ψ 0 ⎥
⎢ ex ,0 ⎥ ⎢⎣ −1 0 0 0 0 ⎥⎦ ⎢⎣ ex ,0 ⎥⎦
⎣ ⎦
⎡0.032 0 ⎤ ⎡0 ⎤
⎢ 0 ⎥
0.2831 ⎥ ⎢0 ⎥
⎢ ⎡u prop ,0 ⎤ ⎢ ⎥
+⎢ 0 −1.5952 ⎥ ⎢ ⎥ + ⎢0 ⎥ uref
⎢ ⎥ ⎣ δ r ,0 ⎦ ⎢ ⎥
⎢ 0 0 ⎥ ⎢0 ⎥
⎢⎣ 0 0 ⎥⎦ ⎣⎢1 ⎥⎦
⎡ u0 ⎤
⎢ ⎥
⎡1 0 0 0 0 ⎤ ⎢ v0 ⎥
yi = ⎢⎢0 0 0 1 0 ⎥⎥ ⎢ r0 ⎥
⎢ ⎥
⎢⎣0 0 0 0 1 ⎥⎦ ⎢ψ 0 ⎥
⎢ ex ,0 ⎥
⎣ ⎦
Ο ελεγκτής αποτελείται από δύο τµήµατα: έναν ελεγκτή πλοήγησης και έναν
ελεγκτή ταχύτητας. Τόσο ο αρχηγός όσο και οι ακόλουθοι χρησιµοποιούν τον ίδιο
ελεγκτή πλοήγησης. Σκοπός του είναι να επικεντρώνεται σε ένα επιθυµητό σηµείο.
Το σηµείο αυτό είναι µία συγκεκριµένη διαδροµή για τον αρχηγό και ένας
επιθυµητός σχηµατισµός για τους ακολούθους. Το παρακάτω σχήµα δείχνει τις
απαιτούµενες µεταβλητές για τον έλεγχο του σχηµατισµού. Τα X και Y παριστούν
το σύστηµα συντεταγµένων, ενώ τα xi και yi παριστούν συντεταγµένες, του i
ακολούθου. Στο σχεδιασµό των ελεγκτών θεωρούµε ότι όλοι οι ακόλουθοι µπορούν
να υπολογίζουν την εµβέλεια και την κατεύθυνση από τον αρχηγό. Υποθέτουµε
181
επίσης ότι δεν υπάρχουν καθυστερήσεις στις µετρήσεις και ότι οι µετρήσεις είναι
συνεχείς.
θ LOS ,i = ψ di −ψ i
⎛ Ydi′ − Yi′ ⎞
ψ i = tan −1 ⎜ ⎟
⎝ X di′ − X i′ ⎠
όπου xi είναι η θέση του i οχήµατος και xd′ 0i είναι ο επιθυµητός διαχωρισµός του
οχήµατος στην xi κατεύθυνση. Στην προηγούµενη σχέση η σταθερά k προστέθηκε
προκειµένου να εξασφαλιστεί ότι οι ακόλουθοι να κυνηγούν πάντα το κατάλληλο
σηµείο.
182
Όπως ήδη αναφέρθηκε, ο νόµος εύρωστου ελέγχου προσδιορίζεται µε τη
µέθοδο LQG-LQR, η οποία εξασφαλίζει τις προδιαγραφές ελέγχου τόσο στο πεδίο
του χρόνου, όσο και στο πεδίο της συχνότητας.
Σκοπός του ελέγχου είναι η αποφυγή ασταθειών στη θέση και τον
προσανατολισµό του ελικοπτέρου.
183
∆ιατύπωση του προβλήµατος
tk +1 − tk = T + ε k
όπου ε k είναι µια µικρή µεταβολή της διάρκειας του χρόνου ανάµεσα σε δύο
δειγµατοληψίες.
h(t ) = dT + ε (t )
όπου d είναι ένας ακέραιος αριθµός και ε (t ) είναι µια µικρή αβεβαιότητα της
χρονικής καθυστέρησης h(t ) . Και οι δύο µεταβλητές µπορούν να παίρνουν θετικές ή
αρνητικές τιµές, αλλά θα πρέπει να είναι φραγµένες ως προς τη νόρµα τους. Στη
συνέχεια λαµβάνεται το διακριτοποιηµένο µοντέλο του συστήµατος. Θέτοντας
xk = x(tk ) προκύπτει
tk +1
xk +1 = A1 xk + ∫ e Ac (tk +1 −τ ) Bcu (τ − h(τ ))dτ
tk
όπου
A1 = e Ac ( tk +1 −tk ) = e Ac (T +ε k )
Τεχνική ελέγχου
όπου xkp+ d είναι η προβλεπόµενη τιµή της κατάστασης σε µελλοντική χρονική στιγµή
k +d .
184
Η εύρωστη ευστάθεια µελετήθηκε µε τη χρήση τεχνικών Lyapunov για
αβέβαια συστήµατα µε χρονικές καθυστερήσεις (Κεφάλαιο 4). Ας σηµειωθεί ότι οι
αβεβαιότητες του συστήµατος θεωρήθηκαν αρκετά µικρές.
Πειραµατική εφαρµογή
185
Αποτελέσµατα του πειράµατος
200
G(s) =
s ( s + 4)
έχει µια συµπεριφορά η οποία είναι κοντά στην συµπεριφορά του πραγµατικού
συστήµατος.
uk = 0.08( y ∗ − yk )
186
όπου το y ∗ είναι το σήµα αναφοράς, µπορεί να σταθεροποιήσει το µοντέλο αυτό.
Ωστόσο, όπου υπάρχουν καθυστερήσεις τριών περιόδων δειγµατοληψίας στην
µέτρηση της θέσης γωνιακής τροχιάς ο ελεγκτής γίνεται,
uk = 0.08( y ∗ − yk −3 )
και η συµπεριφορά του κλειστού συστήµατος είναι ασταθής όπως φαίνεται στο
παρακάτω σχήµα:
⎡ x1k ⎤
yk = [ 0 6.25] ⎢ 2 ⎥
⎣ xk ⎦
187
⎡ xˆ1k +1 ⎤ ⎡ 0.7261 −2.7940 ⎤ ⎡ xˆ1k ⎤ ⎡0.4470 ⎤ ⎡ 0.5477 ⎤
⎢ 2 ⎥=⎢ ⎥ ⎢ 2⎥ + ⎢ ⎥ yk + ⎢ ⎥ uk −3
⎣ xˆk +1 ⎦ ⎣ 0.2739 −1.0261⎦ ⎣ xˆk ⎦ ⎣0.3242 ⎦ ⎣ 0.0923⎦
⎡ xˆ1k ⎤
⎢ 2 ⎥
xˆk ⎥
⎡0.3829 0 0.2888 0.3977 0.5477 ⎤ ⎢
x p (k ) = ⎢ ⎥ ⎢ uk −3 ⎥
⎣ 0.6171 1 0.3512 0.2423 0.0923⎦ ⎢ ⎥
⎢ uk − 2 ⎥
⎢u ⎥
⎣ k −1 ⎦
uk = 0.08( y ∗ − [ 0 6.25] x p (k ))
Στο σύστηµα του ελικοπτέρου που µελετήθηκε στην εφαρµογή αυτή, είναι
ενδιαφέρον να εξεταστεί η χρησιµοποίηση οπτικού σερβο-ελεγκτή. Είναι γνωστό
βέβαια ότι η επεξεργασία εικόνας θα παρουσιάσει σηµαντικές καθυστερήσεις. Ένα
από τα αντικείµενα αυτής της εφαρµογής ήταν να δείξει ότι ο αλγόριθµος ελέγχου
που βασίζεται στην πρόβλεψη µπορεί να χρησιµοποιηθεί για την αποφυγή ασταθειών
στον έλεγχο της θέσης και του προσανατολισµού του ιπτάµενου οχήµατος.
188
Παράρτηµα Ι
N
F ( x) = F0 + ∑ xi Fi > 0 (Π1.1)
i =1
T
Fi = Fi ∈ R N × N , i = 1, 2,..., N (Π1.2)
είναι δεδοµένοι συµµετρικοί πίνακες. Σηµειώνεται ότι η (Π1.1) είναι µια ανισότητα
πινάκων που δηλώνει ότι ο πίνακας F ( x) είναι θετικά ορισµένος.
{x : F ( x) > 0}
189
Μία αξιοσηµείωτη ιδιότητα των LMI είναι η δυνατότητα οµαδοποίησης
πολλών LMI σε ένα, αφού το πλήθος των περιορισµών
⎡ Q ( x) S ( x) ⎤ ⎧ R( x) > 0
⎢ T ⎥ > 0 ⇔ ⎨ −1
(Π1.5)
⎩Q( x) − S ( x) R ( x) S ( x) > 0
T
⎣ S ( x) R( x) ⎦
⎧ Q( x) > 0
⇔⎨ −1
(Π1.6)
⎩ R( x) − S ( x)Q ( x) S ( x) > 0
T
⎡ Q ( x) S ( x) R −1 ( x) ⎤
⎢ −1 ⎥ (Π1.7)
T
⎣ R ( x) S ( x) R −1 ( x) ⎦
Με τις πράξεις αυτές διατηρείται η ανισότητα της (Π1.5). Κατόπιν, στην πρώτη
γραµµή της (Π1.7) προσθέτουµε τη δεύτερη γραµµή πολλαπλασιασµένη από
αριστερά επί − S ( x) και παίρνουµε
⎡Q( x) − S ( x) R −1S T ( x) 0 ⎤
⎢ ⎥ (Π1.8)
⎣ R −1 ( x) S T ( x) R −1 ( x) ⎦
⎡Q( x) − S ( x) R −1S T ( x) 0 ⎤
⎢ −1 ⎥ (Π1.9)
⎣ 0 R ( x) ⎦
ενώ διατηρείται και πάλι η ανισότητα της (Π1.5). Ο διαγώνιος κατά µπλοκ πίνακας
(Π1.9) θα είναι θετικά ορισµένος αν και µόνον εάν
190
⎧ R −1 ( x) > 0
⎨ −1
(Π1.10)
⎩Q( x) − S ( x) R ( x) S ( x) > 0
T
Ας σηµειωθεί ότι η ανισότητα της (Π1.5) είναι ένα LMI ως προς S , ενώ η
δεύτερη ανισότητα της (Π1.10) δεν είναι. Συγκεκριµένα, αυτή είναι τετραγωνική ως
προς S .
( A + BK )T P + P( A + BK ) + Q < 0 (Π1.11)
όπου οι A , B και W > 0 είναι δεδοµένοι πίνακες. Είναι φανερό ότι αν ικανοποιείται
η (Π1.11), τότε υπάρχει ένας νόµος ελέγχου της µορφής
u (t ) = Kx(t )
για το σύστηµα
x(t ) = Ax(t ) + Bu (t )
x(t ) = ( A + BK ) x(t )
V ( x, t ) = xT (t ) Px(t )
V ( x, t ) < 0
191
Η ανισότητα (Π1.11) δεν είναι κυρτή ως προς P και K . Ωστόσο, αντικαθιστώντας,
P = Y −1
(Π1.12)
K = XY −1
η (Π1.11) γράφεται,
⎡ −YAT − X T BT − AY − BX Y ⎤
⎢ ⎥>0 (Π1.15)
⎣ Y Q −1 ⎦
Η επιτυχία των LMI στον Αυτόµατο Έλεγχο οφείλεται στο γεγονός ότι ένα
πλήθος προβληµάτων που δεν έχουν αναλυτική λύση επιλύονται αριθµητικά µε τη
χρήση αλγορίθµων του τύπου «εσωτερικού σηµείου» (interior point algorithm) οι
οποίοι ενσωµατώνονται εύκολα στον πυρήνα του λογισµικού MATLAB. Επίσης,
επειδή οι µεταβλητές µπορούν να είναι και πίνακες, πολλά προβλήµατα ανάλυσης και
σύνθεσης συστηµάτων επαναδιατυπώνονται και επιλύονται εύκολα.
192
Βιβλιογραφία
Akpan, E., “Robust observers for uncertain linear systems”, in Proc. of American
Control Conference, 6, 2001, pp. 4220-4221.
Anderson, B.D.O. and J.B. Moore, Optimal Control: Linear Quadratic Methods,
Englewood Cliffs, NJ: Prentice Hall, 1990.
Barmish, B.R., New tools for robustness of linear systems, Macmillan, NY., 1994.
Bernstein, D.S. and W.M. Haddad, “LQG control with H ∞ performance bound: a
Riccati equation approach”, IEEE Trans. Autom. Control, 34, pp. 293-305, 1989.
Bernstein, D.S. and W.M. Haddad, “Robust stability and performance via fixed order
dynamic compensation with guaranteed cost bounds”, Math. of Control Signals and
Systems, 3, pp. 139-163, 1990.
193
Bernussou, J., P.L.D. Peres and J.C. Geromel, “A linear programming oriented
procedure for quadratic stabilization of uncertain systems”, Systems and Control
Letters, 13, pp. 65-72, 1989.
Bhattacharya, S.P., “The structure of robust observers”, IEEE Trans. Autom. Control,
21 pp. 581-588, 1976.
Boyd, S., V. Balakrishnan and P. Kabamba, “A bisection method for computing the
h∞ norm of a transfer matrix and related problems”, Math. Control Signals and
Systems, 2, pp. 207-220, 1989.
Boyd, S. and C.H. Barrat, Linear controller design limits of performance, N.J.
Prentice –Hall, 1991.
Chang, S.S.L. and T.K.C. Peng, “Adaptive guaranteed cost control of systems with
uncertain parameters”, IEEE Transactions on Automatic Control, 17, pp. 474-483,
1972.
Chilali, M., P. Gahinet and P. Apkarian, “Robust pole placement in LMI regions”,
IEEE Trans. Autom. Control, 44, pp. 2257-2269, 1999.
Daafouz, J., G. Millerioux, and L. Rosier, “Observer design with guaranteed bound
for LPV systems”, in Proc. of the 16th IFAC World Congress, 2005.
194
Dorato, P., W. Yang and C. Abdallah, “Application of Quantifier Elimination Theory
to Robust Multi-objective Feedback Design”, J. Symbolic Computation, 11, pp. 1-5,
1996.
Dorato, P., L. Menini and C.A. Treml, “Robust Multi-Objective Feedback Design
with Linear Guaranteed-Cost Bounds”, Automatica, 14, pp. 1239-1243, 1998.
Doyle, J.C., “Guaranteed margins for LQG regulators”, IEEE Trans. Automatic
Control, 23, pp. 756-757, 1978.
Doyle, J.C. and G. Stein, “Multivariable feedback design: concepts for a classical /
modern synthesis”, IEEE Trans. Automatic Control, 26, pp. 4-16, 1981.
Duan, G.-R., N.K. Nichols and G.-P. Liu, “Robust pole assignment in descriptor
linear systems via state feedback”, European Journal of Control, vol. 8, pp. 136-149,
2002.
Elia, N. and M. Dahleh, “Controller Design with Multiple Objectives”, IEEE Trans.
Automatic Control, 42, pp. 596-613, 1997.
Fischman, A., J.M. Dion, L. Dugard and A. Trofino Neto, “A linear matrix inequality
approach for guaranteed cost control”, in Proceedings of the 13th IFAC World
Congress, San Francisco, USA, 1996, pp. 197-202.
Francis, B.A. and G. Zames, “On H ∞ optimal sensitivity theory for SISO feedback
systems”, IEEE Transactions on Automatic Control, 29, pp. 9-16, 1984.
Franklin, S.N. and J. Ackermann, “Robust flight control – A design example” Journal
of Guidance and Control, vol. 4, 1980, pp. 597-606.
195
Garcia, G. and J. Bernussou, “Pole assignment for uncertain systems in a specified
disk by state feedback”, IEEE Transactions on Automatic Control, 40, pp. 184-190,
1995.
Garcia, G., J. Bernussou and D. Arzelier, “An LMI Solution for disk pole location
with H 2 guaranteed cost control”, European Journal of Control, 1, pp. 54-61, 1995.
Garcia, G., “Quadratic guaranteed cost and disk pole location control for discrete-time
uncertain systems”, IEE Proc. – Control Theory and Applications, 144, pp. 545-548,
1997.
Glover, K. and J.C. Doyle, “State space formulae for all stabilizing controllers that
satisfy an H ∞ -norm bound and relations to risk sensitivity”, Systems and Control
Letters, 11, pp. 167-172, 1988.
Hui, S. and S.H. Żak, “Control and observation of uncertain systems: a variable
structure approach”, in Control and Dynamic Systems; Advances in Theory and
Applications 34 (1990) 175-204. Advances in Control Mechanics Part 1 and 2 (C.T.
Leondes Ed.), San Diego: Academic Press, 1990.
196
Καλτσά, Β., Έλεγχος αβέβαιων συστηµάτων µε πολλαπλά µοντέλα, Μεταπτυχιακή
∆ιατριβή, Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών,
∆ηµοκρίτειο Πανεπιστήµιο Θράκης, Ξάνθη, 2006.
Kailath, T., Linear Systems, Information & Syst. Sci. Series, Prentice Hall, 1980.
Khargonekar, P.P., I.R. Petersen and M.A. Rotea, “ H ∞ optimal control with state
feedback”, IEEE Transactions on Automatic Control, 33, pp. 786-788, 1988.
Kleinman, D.L., “On an iterative technique for Riccati equation computations”, IEEE
Transactions on Automatic Control, 13, pp. 114-115, 1968.
Kose, E.I. and F. Jabbari, “Control of lpv systems with partly measured parameters”,
in Proc. of the 36th IEEE Conf. on Decision and Control, pp. 972-977, 1997.
Koshkouei, A.J. and A.S.I. Zinober, “Sliding mode state observation for non-linear
systems”, Intern. J. of Control, 77, pp. 118-127, 2004.
Kosmidou, O.I. and P. Bertrand, “Robust Controller Design for Systems with Large
Parameter Variations”, International Journal of Control, 45, pp. 927-938, 1987.
Kosmidou, O.I., A. Nanos and G. Papageorgiou, “Expected cost design method for a
class of systems with model uncertainties”, International Journal of Systems Science,
20, pp. 1753-1762, 1989.
197
Kosmidou, O.I., “Robust stability and performance of systems with structured and
bounded uncertainties: an extension of the guaranteed cost control”, International
Journal of Control, 52, pp. 627-640, 1990.
Kosmidou, O.I. and H. Bourlès, “Gain and phase margins of the guaranteed cost
regulator”, International Journal of Control, 60, pp. 1-15, 1994.
Kosmidou, O.I. and K. Mitroglou, “Guaranteed cost control with simultaneous pole
shifting for linear uncertain systems”, 13th IFAC Workshop on Control Applications of
Optimization, Paris, France, 2006, pp. 197-202.
Kosmidou, O.I. and Vrochidou, E. “Robust controller and observer design for linear
systems with parametric uncertainties”, Applied Mathematics and Computation, 2007.
Landau, I.D., Identification et commande des procédés, Editions Hermès, Paris, 1993.
Ljung, L.L., System Identification – Theory for the user, Prentice Hall, NY, 1986.
Li, H., S.I. Niculescu, L. Dugard and J.-M. Dion, “Robust guaranteed cost control for
uncertain linear time-delay systems”, in “Stability and control of time-delay systems”,
London: Springer, pp. 283-301, 1998.
Looze, D.P., “A dual optimization procedure for linear quadratic robust control
problems”, Automatica, 19, pp. 299-302, 1983.
Lozano, R., P. Castillo, P. Garcia, and A. Dzul, “Robust prediction-based control for
unstable delay systems: Application to the yaw control of a mini-helicopter”,
Automatica, vol. 40, pp. 603-612, 2004.
Mahmoud, M.S., Robust control and filtering for time-delay systems, NY: Marcel
Dekker, 2000.
198
Malek-Zavarei, M. and M. Jamshidi, Time-delay systems: analysis, optimization and
applications, (Systems and Control Series, 9), North Holland: Amsterdam, 1987.
Martenson, Κ., “On the matrix Riccati equation”, Informat. Sci., 3, pp. 17-50, 1971.
Martin, J.M., “State space measures of robustness of pole locations for structured and
unstructured perturbations”, Systems and Control Letters, 16, pp. 423-433, 1991.
Medanic, J., “Geometric Properties and Invariant Manifolds of the Riccati Equation”,
IEEE Trans. Autom. Control, 27, pp. 670-676, 1982.
Medanic, J., H.S. Tharp and W.R Perkins, “Pole Placement by Performance Criterion
Modification”, IEEE Trans. Autom. Control, 33, pp. 469-472, 1988.
Moheimani, O.R. and I.R. Petersen, “Quadratic guaranteed cost control with robust
pole placement in a disk”, IEE Proc. – Control Theory and Applications, 143, pp. 37-
43, 1996.
Mustafa, D., “ H ∞ / LQG control via the optimal projection equations: on minimizing
the LQG cost bound”, Intern. Journal of Robust and Nonlinear Control, 1, pp.99-110,
1991.
Nesterov, Y. and A. Nemirovsky, “The projective method for solving linear matrix
inequalities”, Mathematical Programming Series B, 1996.
Niculescu, S.I., E.I. Verriest, L. Dugard, and J.-M. Dion, Stability and control of time-
delay systems, London: Springer, pp. 1-71, 1998.
O’Reilly, J., Observers for linear systems, N.Y.: Academic Press, 1983.
199
Petersen, I.R., “A Riccati equation approach to the design of stabilizing controllers
and observers for a class of uncertain linear systems”, IEEE Trans. Autom. Control,
30, pp. 904-907, 1985.
Richard, J.-P., “Time-delay systems: an overview of some recent advances and open
problems”, Automatica, 39, pp. 1667-1694, 2003.
Safonov, M.G. and M. Athans, “Gain and phase margins of multiloop LQG
regulators”, IEEE Transactions on Automatic Control, 22, pp. 173-179, 1977.
Saif, M., “Optimal linear regulator pole placement by weight selection”, International
Journal of Control, 50, pp. 399-414, 1989.
Scherer, C., P. Gahinet and M. Chilali, “Multi-objective Output Feedback Control via
LMI Optimization”, IEEE Trans. Automatic Control, 42, pp. 896-910, 1997.
Shamma, J.S. and Kuang-Yang Tu, “Set-valued observers and optimal disturbance
rejection”, IEEE Trans. Autom. Control, 44, pp. 253-264, 1999.
Shieh, L.S., H.M. Dib and B.C. McInnis, “Linear quadratic regulators with eigenvalue
placement in a vertical strip”, IEEE Trans. Autom. Control, 31, pp. 241-243, 1986.
Stein, G., “Generalized quadratic weights for asymptotic regulator properties”, IEEE
Trans. Autom. Control, 24, pp. 559-566, 1979.
Vidyasagar, M., Control system synthesis: a factorization approach, MA: MIT Press,
1985.
Winkler, A. and I.J. Wood, “Multistep guaranteed cost control of linear systems with
uncertain parameters”, A.I.A.A. Journal of Guidance and Control, 18, pp. 449-456,
1979.
200
Wittenmark, B., R.J. Evans and Y.C. Soh, “Constrained pole-placement using
transformation and LQ-design”, Automatica, 23, pp. 767-769, 1987.
Yeung, K.S. and S.S. Wang, “A simple proof of Kharitonov’s theorem”, IEEE Trans.
Autom. Control, 32, pp. 577-579, 1987.
Zames, G., “On the input – output stability of time varying non linear feedback
systems, part I: condition derived using concepts of loop gain, conicity and
positivity”, IEEE Trans. Autom. Control, 11, pp. 228-238, 1966.
Zhou, K. and P.P. Khargonekar, “Robust stabilization of linear systems with norm
bounded time varying uncertainty”, Systems and Control Letters, 10, pp. 17-20, 1988.
Zhou, K., J.C. Doyle and K. Glover, Robust and Optimal Control, NY Prentice –
Hall, 1996.
Κατάλογος εννοιών
Α
Αβεβαιότητα
Αεροδιαστηµικά συστήµατα
Αθροιστική αβεβαιότητα
Αλγόριθµος
επαναληπτικός
εσωτερικού σηµείου
Αντικειµενική συνάρτηση
Ανιχνεύσιµο σύστηµα
Απόρριψη διαταρραχής
Αφφινική συνάρτηση
201
Β
Βάρη, πίνακας βαρών
Βελτιστοποίηση
Bezout ταυτότητα
Bode διάγραµµα
Γ
Γραµµική ανισότητα πινάκων (LMI)
Γραµµικό τετραγωνικό γκαουσιανό (LQG) πρόβληµα
Γραµµικός ρητός µετασχηµατισµός (LFT)
Γραµµικός τετραγωνικός ρυθµιστής (LQR)
∆
∆οµηµένη αβεβαιότητα
∆υναµικός προγραµµατισµός
Ε
Εγγυηµένο κόστος
Εκτιµητής
Ελέγξιµο σύστηµα
Ευαισθησία
συνάρτηση
πίνακας
Ευρωστία
Εύρωστη ευστάθεια
Εύρωστες επιδόσεις
Ευστάθεια
ασυµπτωτική
βαθµός
εσωτερική
σχετική
περιθώρια
Εφικτότητα
Εφικτή λύση
Η
Hamiltonian πίνακας
H – infinity
έλεγχος
νόρµα
H–2
έλεγχος
νόρµα
Θ
Θεωρία
Θόρυβος
202
Ι
Ιδιοτιµές
Κ
Kalman
ταυτότητα
ανισότητα
Κυρτός προγραµµατισµός
Λ
Lyapunov
εξίσωση
συνάρτηση
Μ
Μαθηµατικό πρότυπο
MATLAB®
Μετασχηµατισµός
γραµµικός ρητός (LFT)
Μικρού κέρδους, θεώρηµα
Μοντέλο
Ν
Νόρµα
Π
Παίγνια
διαφορικά
θεωρία
Παραµετροποίηση
Παρατηρητής κατάστασης
Parseval θεώρηµα
Περιθώριο
ενίσχυσης
φάσης
Πολλαπλά µοντέλα
Πολλαπλασιαστική αβεβαιότητα
Προσδοκία
Ρ
Riccati
αλγεβρική εξίσωση
γενικευµένη εξίσωση
επίλυση
203
Σ
Σταθεροποιήσιµο σύστηµα
Στοχαστικός έλεγχος
Συµπληρωµατική ευαισθησία
Συνάρτηση µεταφοράς
Συσχέτισης, πίνακας
Σχεδιασµός
Τ
Τετραγωνική µορφή
Τετραγωνικό κριτήριο
Φ
Φάσµα
Φίλτρο
Φράγµα
γραµµικό
τετραγωνικό
204