You are on page 1of 204

Όλγα Κοσµίδου

Επίκουρη Καθηγήτρια
Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχ. Υπολογιστών
∆ηµοκρίτειο Πανεπιστήµιο Θράκης

Εύρωστος Έλεγχος ∆υναµικών Συστηµάτων

Ξάνθη 2007
Πρόλογος

Οι ουσιώδεις διεργασίες κατά τη µελέτη των συστηµάτων αυτοµάτου ελέγχου


είναι η ανάλυση και ο έλεγχος. Η ανάλυση βασίζεται κυρίως στη µαθηµατική
περιγραφή των συστηµάτων, ή µοντελοποίηση, που συνίσταται στην καταγραφή της
σχέσης µεταξύ αιτίου (εισόδου) και αποτελέσµατος (εξόδου) του συστήµατος. Ο
έλεγχος, από τη µεριά του, βασίζεται στην έννοια της ανάδρασης, που είναι
πρωταρχική στον αυτόµατο έλεγχο. Συνίσταται στη σύνθεση αντισταθµιστών ή
ελεγκτών που εξασφαλίζουν την επιθυµητή συµπεριφορά του συστήµατος. Η
επιθυµητή συµπεριφορά µεταφράζεται ως η εξασφάλιση προδιαγραφών ελέγχου,
πρώτη από τις οποίες είναι η ευστάθεια του κλειστού συστήµατος.

Ωστόσο, ένα και µόνο µαθηµατικό µοντέλο δεν είναι δυνατόν να περιγράψει
τη συµπεριφορά του συστήµατος, όποια και να είναι η φύση του. Άρα ένας νόµος
ελέγχου που υπολογίζεται µε βάση ένα οποιοδήποτε µοντέλο είναι πολύ πιθανό ότι δε
θα επιφέρει τα προσδοκώµενα αποτελέσµατα, όταν εφαρµοστεί στο πραγµατικό
σύστηµα. Αυτό συµβαίνει αν για παράδειγµα το µαθηµατικό µοντέλο του
συστήµατος δε λαµβάνει υπόψη, για λόγους απλότητας, ορισµένα φαινόµενα όπως
διαταραχές, µεταβολές παραµέτρων, γρήγορες δυναµικές, µη γραµµικότητες κλπ.
Ένας τρόπος για την αποφυγή αυτής της απόκλισης συµπεριφοράς είναι ο
υπολογισµός του ελέγχου για µια οικογένεια µοντέλων, στην οποία ανήκει το
σύστηµα. Η οικογένεια αυτή αποτελείται συνήθως από ένα ονοµαστικό µοντέλο και
από µεταβολές γύρω από αυτό, που ονοµάζονται αβεβαιότητες, αλλά θεωρείται
επίσης ότι είναι ένα αβέβαιο µοντέλο. Έτσι ο ελεγκτής σχεδιάζεται ώστε να
ικανοποιεί τις προδιαγραφές ελέγχου για όλα τα µοντέλα που ανήκουν στην
οικογένεια µοντέλων ή διαφορετικά για όλες τις αβεβαιότητες µοντέλου. Ο ελεγκτής
αυτός τότε λέγεται εύρωστος.

Το πεδίο του εύρωστου ελέγχου γνώρισε σηµαντική ανάπτυξη κατά τα


τελευταία χρόνια. Οι προτεινόµενες µέθοδοι διακρίνονται σε αυτές που αναφέρονται
στο πεδίο του χρόνου και σε αυτές που αναφέρονται στο πεδίο της συχνότητας.
Ανάλογα µε την πληροφορία που παρέχουν, οι θεωρούµενες αβεβαιότητες
διακρίνονται σε δοµηµένες και µη δοµηµένες. Πρέπει να σηµειωθεί ότι οι µέθοδοι
εύρωστου ελέγχου βασίζονται σε ήδη υπάρχουσες τεχνικές όπως οι LQR – LQG,
H 2 / H ∞ , µείωση ευαισθησίας κλπ.

Στα κεφάλαια που ακολουθούν παρουσιάζονται διεξοδικά οι σηµαντικότερες


από τις τεχνικές αυτές που αφορούν την εξασφάλιση τόσο της εύρωστης ευστάθειας
όσο και των εύρωστων προδιαγραφών. Ειδικότερα αναφέρονται προβλήµατα ελέγχου
εγγυηµένου κόστους, διευθέτησης πόλων, πολλαπλών αντικειµενικών συναρτήσεων,
πολλαπλών µοντέλων, σχεδίασης µε παρατηρητές κατάστασης, απόρριψης

2
διαταραχής. Ιδιαίτερο ρόλο στην επίλυση των προβληµάτων αυτών κατέχουν οι
σύγχρονες τεχνικές βελτιστοποίησης, µε τη χρήση γραµµικών ανισοτήτων πινάκων,
που βασίζονται σε πολύ αποτελεσµατικούς υπολογιστικούς αλγορίθµους, όπως οι
αλγόριθµοι εσωτερικού σηµείου, καθώς και στα ταχύτατα αναπτυσσόµενα λογισµικά
επίλυσης.

Όλγα Κοσµίδου
Ξάνθη, Σεπτέµβριος 2007

3
Περιεχόµενα Σελ.

Κεφάλαιο 1: Μοντελοποίηση, ευστάθεια και επιδόσεις γραµµικών συστηµάτων


1.1 ∆υναµικά γραµµικά συστήµατα …………………………………………….. 7
1.2 Ευστάθεια …………………………………………………………………… 10
1.3 Επιδόσεις ……………………………………………………………………. 18
1.4 Συµπεράσµατα ………………………………………………………………. 25

Κεφάλαιο 2: Αβεβαιότητα και ευρωστία


2.1 Μοντελοποίηση της αβεβαιότητας ………………………………………….. 26
2.2 Αλγεβρική προσέγγιση του Kharitonov …………………………………....... 34
2.3 Προσέγγιση H ∞ ……………………………………………………………… 35
2.4 Τετραγωνική προσέγγιση ……………………………………………………. 36
2.5 Συµπεράσµατα ………………………………………………………………..43

Κεφάλαιο 3: Μέθοδοι LQG εγγυηµένου κόστους


3.1 ∆ιατύπωση του προβλήµατος και βασικές έννοιες …………………………. 44
3.2 Συστήµατα µε αβεβαιότητα µόνο στον πίνακα κατάστασης ……………….. 48
3.3 Συστήµατα µε αβεβαιότητα στον πίνακα κατάστασης και εισόδου ………… 51
3.4 Ελαχιστοποίηση του εγγυηµένου κόστους ………………………………….. 53
3.5 Παράδειγµα ………………………………………………………………….. 55
3.6 Συµπεράσµατα ………………………………………………………………..56

Κεφάλαιο 4: Εύρωστος έλεγχος συστηµάτων µε χρονικές καθυστερήσεις


4.1 ∆ιατύπωση του προβλήµατος και βασικές έννοιες ………………………..... 58
4.2 Λύση στο πλαίσιο των LMI ……………………………………………….... 62
4.3 Παράδειγµα …………………………………………………………………. 65
4.4 Συµπεράσµατα ………………………………………………………………. 66

Κεφάλαιο 5: Εύρωστη διευθέτηση πόλων


5.1 ∆ιατύπωση του προβλήµατος και βασικές έννοιες ………………………… 68
5.2 Έλεγχος εγγυηµένου κόστους µε προκαθορισµένο βαθµό ευστάθειας ……. 69
5.3 Μετατόπιση πόλων µε την τροποποίηση του πίνακα βάρους ……………… 72
5.4 Παράδειγµα ………………………………………………………………… 76
5.5 Συµπεράσµατα ……………………………………………………………… 79

Κεφάλαιο 6: Έλεγχος µε πολλαπλές αντικειµενικές συναρτήσεις


6.1 ∆ιατύπωση του προβλήµατος και βασικές έννοιες ………………………… 80
6.2 Βελτιστοποίηση LMI πολλαπλών αντικειµενικών συναρτήσεων …………. 82
6.3 Σύνθεση πολλαπλών στόχων µε ταυτόχρονη διευθέτηση πόλων ………….. 85
6.4 Συµπεράσµατα ………………………………………………………………106

Κεφάλαιο 7: Έλεγχος πολλαπλών µοντέλων


7.1 ∆ιατύπωση του προβλήµατος ……………………………………………… 107
7.2 Μέθοδος διπλής βελτιστοποίησης ………………………………………..... 108

4
Σελ.

7.3 Μέθοδος µη- γραµµικής βελτιστοποίησης ………………………………… 113


7.4 Μέθοδος µε γραµµικές ανισότητες πινάκων ………………………………. 115
7.5 Παραδείγµατα ……………………………………………………………… 116
7.6 Συµπεράσµατα ……………………………………………………………... 121

Κεφάλαιο 8: Σχεδιασµός εύρωστων παρατηρητών κατάστασης


8.1 Γενικά για τους παρατηρητές κατάστασης ………………………………… 122
8.2 Μεθοδολογία σχεδιασµού παρατηρητών για αβέβαια γραµµικά συστήµατα 132
8.3 Συµπεράσµατα ……………………………………………………………… 145

Κεφάλαιο 9: Μέθοδοι H - infinity


9.1 Βασικές έννοιες …………………………………………………………….. 147
9.2 Εύρωστη ευστάθεια ………………………………………………………… 150
9.3 Τεχνικές σχεδιασµού ……………………………………………………….. 154
9.4 Συµπεράσµατα ……………………………………………………………… 161

Κεφάλαιο 10: Εφαρµογές σύνθεσης εύρωστων ελεγκτών


10.1 Έλεγχος της πορείας οχήµατος ……………………………………………. 162
10.2 Έλεγχος συστήµατος µεταφοράς ταινίας ………………………………….. 167
10.3 Πρακτικοί εύρωστοι προσαρµοστικοί ελεγκτές για ενεργές αναρτήσεις … 171
10.4 Σύνθεση εύρωστου ελεγκτή οχηµάτων αυτόµατης πλοήγησης …………… 175
10.5 Εύρωστος ελεγκτής διµοιρίας αυτόνοµων υποβρυχίων οχηµάτων ……….. 179
10.6 Έλεγχος απόκλισης τροχιάς πειραµατικού ελικοπτέρου ………………….. 183

Παράρτηµα 1: Γραµµικές ανισότητες πινάκων ……………………………… 189

Βιβλιογραφία …………………………………………………………………… 193

Κατάλογος εννοιών ……………………………………………………………... 201

5
Σύµβολα

R Σώµα πραγµατικών αριθµών


C Σώµα µιγαδικών αριθµών
I Μοναδιαίος πίνακας
O Μηδενικός πίνακας
∅ Κενό σύνολο
MT Ανάστροφος του πίνακα M
M* Συζυγής του πίνακα M
MH Ανάστροφος του πίνακα M *
λi ( M ) i − οστή ιδιοτιµή του πίνακα M
λmax ( M ) Μέγιστη ιδιοτιµή του πίνακα M
ρ (M ) Φασµατική ακτίνα του πίνακα M
λmin ( M ) Ελάχιστη ιδιοτιµή του πίνακα M
T
σ ( M ) = λmax ( M * M * ) Μέγιστη ιδιόρρυθµη τιµή του πίνακα M
T
σ ( M ) = λmin ( M * M * ) Ελάχιστη ιδιόρρυθµη τιµή του πίνακα M
ker( M ) Πυρήνας του πίνακα M
diag ( M 1 ,..., M n ) ∆ιαγώνιος πίνακας κατά µπλοκ
rank ( M ) Τάξη του πίνακα M
tr ( M ) Ίχνος του πίνακα M
svd ( M ) ∆ιαχωρισµός σε ιδιόρρυθµες τιµές του M
E (.) Προσδοκία της συνάρτησης (.)
M > (≥) N Ο πίνακας ( M − N ) είναι θετικά ορισµένος (ηµι-ορισµένος)
M < (≤) N Ο πίνακας ( M − N ) είναι αρνητικά ορισµένος (ηµι-ορισµένος)

6
Κεφάλαιο 1

Μοντελοποίηση, ευστάθεια και επιδόσεις γραµµικών


συστηµάτων

Στο κεφάλαιο αυτό παρουσιάζονται οι γενικές έννοιες που χαρακτηρίζουν τα


γραµµικά και χρονικά αµετάβλητα συστήµατα καθώς και οι έννοιες της ευστάθειας
και των επιδόσεων. Σκοπός της παρουσίασης αυτής είναι ν’ αποτελέσει τη βάση για
την περαιτέρω µελέτη ειδικών προβληµάτων. Καθώς είναι αναπόφευκτα συνοπτική,
οι λεπτοµέρειες δίνονται στις αναφερόµενες βιβλιογραφικές παραποµπές.

1.1 ∆υναµικά γραµµικά συστήµατα

Το πρώτο βήµα για την επιτυχή σχεδίαση ενός συστήµατος ελέγχου είναι η
µοντελοποίηση. Πράγµατι, είναι αναγκαία η κατάλληλη µαθηµατική περιγραφή που
παριστά, κατά το δυνατόν πιστά, τη συµπεριφορά του συστήµατος µέσα σ’ ένα
δεδοµένο πλαίσιο. Τα µαθηµατικά πρότυπα ή µοντέλα των δυναµικών συστηµάτων
µπορούν να ταξινοµηθούν σε πολλές κατηγορίες:

• γραµµικά / µη – γραµµικά

• χρονικά αµετάβλητα / χρονικά µεταβαλλόµενα

• αιτιοκρατικά / στοχαστικά

• µε συγκεντρωµένες παραµέτρους / µε κατανεµηµένες παραµέτρους

• µιας µεταβλητής / πολλών µεταβλητών

• συνεχούς χρόνου / διακριτού χρόνου

Τα συστήµατα που θα µελετηθούν εδώ ανήκουν στην κλάση των γραµµικών,


χρονικά αµετάβλητων, αιτιοκρατικών συστηµάτων πολλών µεταβλητών, συνεχούς
χρόνου και πεπερασµένης διάστασης. Τα περισσότερα από τα αποτελέσµατα που θα

7
παρουσιαστούν, µπορούν να επεκταθούν και σε συστήµατα διακριτού χρόνου. Αν και
τα περισσότερα φυσικά συστήµατα είναι κυρίως µη–γραµµικά, χρονικά
µεταβαλλόµενα, µη πεπερασµένης διάστασης και κατά συνέπεια περιγράφονται µε
µη-γραµµικές µερικές διαφορικές εξισώσεις, εν τούτοις η θεωρούµενη κλάση
συστηµάτων επιτρέπει τη µελέτη των περισσότερων συστηµάτων που συναντώνται
στην πράξη. Πράγµατι υπάρχουν πολλές τεχνικές που επιτρέπουν την προσέγγιση της
συµπεριφοράς συστηµάτων από γραµµικά, χρονικά αµετάβλητα, πεπερασµένα
µοντέλα. Για παράδειγµα, ένας τρόπος είναι η γραµµικοποίηση ενός µη-γραµµικού
συστήµατος στην περιοχή ενός ή περισσοτέρων σηµείων λειτουργίας, µε αποτέλεσµα
την περιγραφή του από µια οικογένεια γραµµικών µοντέλων. Ένας άλλος τρόπος
είναι η µοντελοποίηση εισόδων – εξόδων του φυσικού συστήµατος (Landau 1993,
Ljung 1986). Οι τεχνικές αυτές έχουν ιδιαίτερο ενδιαφέρον τόσο σε θεωρητικά όσο
και σε πρακτικά προβλήµατα.

1.1.1 Περιγραφή συστηµάτων

Η συµπεριφορά ενός δυναµικού συστήµατος µπορεί να περιγραφεί από ένα


µαθηµατικό πρότυπο (ή µοντέλο) στο πεδίο της συχνότητας και στο πεδίο του
χρόνου. Στην πρώτη περίπτωση η περιγραφή χρησιµοποιεί τον πίνακα µεταφοράς και
βασίζεται στις ιδιότητες που απορρέουν από τη γραµµικότητα του συστήµατος. Ο
πίνακας µεταφοράς χαρακτηρίζει τη συµπεριφορά εισόδου – εξόδου του συστήµατος
και προκύπτει από τους µετασχηµατισµούς Fourier και Laplace των σηµάτων που
επιδρούν σ’ αυτό. Αν και η πληροφορία που παρέχει είναι περιορισµένη σε σχέση µε
την περιγραφή στο πεδίο του χρόνου, εντούτοις είναι ακόµη ευρύτατα
χρησιµοποιούµενη σε βιοµηχανικές εφαρµογές. Η χρονική περιγραφή είναι
πληρέστερη και βασίζεται στη µαθηµατική έκφραση µε διαφορικές εξισώσεις
κατάστασης, των φυσικών φαινοµένων που διέπουν το σύστηµα. Μπορεί επίσης να
περιγράψει µη-γραµµικά ή / και χρονικά µεταβαλλόµενα συστήµατα.

Πίνακας µεταφοράς

Το µαθηµατικό πρότυπο ενός γραµµικού δυναµικού συστήµατος στο πεδίο


της συχνότητας είναι,

Y ( s ) = G ( s )U ( s) (1.1)

όπου Y ( s) και U ( s ) είναι, αντίστοιχα, οι µετασχηµατισµοί Laplace των σηµάτων


εξόδου y (t ) ∈ R p και εισόδου u (t ) ∈ R m . Είναι φανερό ότι ο πίνακας µεταφοράς
αποτελεί µια σχέση εισόδου – εξόδου του συστήµατος. Πρόκειται για ένα πίνακα
συναρτήσεων µεταφοράς, στον οποίο το (i, j ) στοιχείο gij ( s ) , περιγράφει τη
µεταφορά µεταξύ της j - οστής εισόδου και της i - οστής εξόδου του συστήµατος.

Εξίσωση κατάστασης

Η περιγραφή κατάστασης είναι µια διανυσµατική διαφορική εξίσωση πρώτης


τάξης, που προκύπτει από την εφαρµογή των γενικών φυσικών νόµων (µηχανικής,

8
ηλεκτρισµού, χηµείας,…), που διέπουν το σύστηµα. Για την κλάση των γραµµικών
και χρονικά αµετάβλητων συστηµάτων παίρνει τη µορφή,

x(t ) = Ax(t ) + Bu (t )
(1.2)
y (t ) = Cx(t ) + Du (t )

όπου x(t ) ∈ R n είναι το διάνυσµα κατάστασης του συστήµατος, u (t ) ∈ R m είναι το


διάνυσµα εισόδου και y (t ) ∈ R p είναι το διάνυσµα εξόδου. Οι πίνακες A, B, C , D,
που ονοµάζονται, αντίστοιχα, πίνακας κατάστασης, πίνακας εισόδου, πίνακας εξόδου
και απ’ ευθείας πίνακας, έχουν πραγµατικά και χρονικά αµετάβλητα στοιχεία καθώς
και κατάλληλη διάσταση.

1.1.2 Σχέση µεταξύ πίνακα µεταφοράς και εξίσωσης κατάστασης

Αν κάθε στοιχείο gij ( s) του πίνακα µεταφοράς G ( s) είναι µια κανονική ρητή
συνάρτηση (proper rational function), δηλαδή είναι φραγµένη για s → ∞ , τότε οι
πίνακες A, B, C , D, σχετίζονται µε τον πίνακα µεταφοράς G ( s) µέσω της ακόλουθης
σχέσης,

G ( s ) = C ( sI − A) −1 B + D (1.3)

και η ( A, B, C , D) ονοµάζεται µια πραγµάτωση ή πραγµατοποίηση (realization) του


G ( s) . Σηµειώνεται, ότι αυτή δεν είναι µοναδική, εφόσον για οποιοδήποτε
αντιστρέψιµο πίνακα T και A := T −1 AT , B := T −1 B , C := CT , D := D η ( A, B, C , D)
είναι και αυτή µια πραγµάτωση του G ( s) .

Ορισµός 1.1
Μια πραγµάτωση ( A, B, C , D) ονοµάζεται ελάχιστη, αν κάθε άλλη πραγµάτωση
( A, B , C , D) είναι τέτοια ώστε η διάσταση του A να είναι µεγαλύτερη ή ίση από τη
διάσταση του A .

Μια ικανή και αναγκαία συνθήκη ώστε η ( A, B, C , D) να είναι µια ελάχιστη


πραγµάτωση του G ( s) είναι, το ζεύγος ( A, B) να είναι ελέγξιµο και το ζεύγος ( A, C )
να είναι παρατηρήσιµο. Στην περίπτωση αυτή, οι ιδιοτιµές του A ταυτίζονται µε τους
πόλους του G ( s) .

1.1.3 Χρονική απόκριση γραµµικού συστήµατος

Με δεδοµένη την αρχική κατάσταση x(t0 ) = x0 και ένα σήµα εισόδου u (t ) , οι


χρονικές αποκρίσεις κατάστασης x(t ) και εξόδου y (t ) , t ≥ t0 , του δυναµικού
συστήµατος δίνονται από τις σχέσεις,

9
t
x(t ) = e A ( t − t0 )
x0 + ∫ e A(t −τ ) Bu (τ )dτ
t0 (1.4)
y (t ) = Cx(t ) + Cu (t )

Στην περίπτωση των αυτόνοµων συστηµάτων, δηλαδή αυτών µε u (t ) = 0 , ∀t ≥ t0 , η


λύση της εξίσωσης κατάστασης γίνεται,

x(t ) = e A(t −t0 ) x0 (1.5)

Η συνάρτηση πινάκων,

Φ (t , t0 ) = e A( t −t0 ) (1.6)

ονοµάζεται µεταβατικός πίνακας κατάστασης.

Η κρουστική απόκριση ενός γραµµικού συστήµατος είναι,

g (t ) = L−1{G ( s )} = Ce At BI + (t ) + Dδ (t ) (1.7)

όπου L−1 είναι ο αντίστροφος µετασχηµατισµός Laplace, δ (t ) είναι η κρουστική


συνάρτηση Dirac, και η συνάρτηση I + (t ) είναι,

⎧1, t ≥ 0
I + (t ) := ⎨ (1.8)
⎩0, t < 0

Η σχέση εισόδου – εξόδου, για µηδενική αρχική κατάσταση x0 = 0 , δίνεται από τη


συνέλιξη,
t
y (t ) = ( g * u )(t ) =
−∞
∫ g (t − τ )u (τ )dτ (1.9)

1.2 Ευστάθεια
Η πρώτη προδιαγραφή ελέγχου που πρέπει να ικανοποιεί ένα δυναµικό
σύστηµα είναι η ευστάθεια. Από φυσική άποψη, η «ευσταθής ισορροπία είναι η
κατάσταση ενός σώµατος, στην οποία αυτό επανέρχεται κάθε φορά που η θέση του
αλλάζει κάτω από εξωτερικά αίτια». Προκειµένου για ένα σύστηµα ελέγχου, ο
ορισµός αυτός δεν είναι ιδιαίτερα πρακτικά αξιοποιήσιµος. Για το λόγο αυτό, έχουν
διατυπωθεί αυστηροί µαθηµατικοί ορισµοί. Στην περίπτωση των µη-γραµµικών και
των χρονικά µεταβαλλόµενων συστηµάτων η έννοια της ευστάθειας είναι αρκετά
πολύπλοκη και απαιτεί ένα σηµαντικό αριθµό ορισµών και ειδικών περιπτώσεων
(Vidyasagar 1978). Αντίθετα, η ευστάθεια των γραµµικών και χρονικά αµετάβλητων
συστηµάτων είναι πολύ πιο εύκολο να µελετηθεί. Επειδή για τα συστήµατα αυτά όλες
οι ιδιότητες της ευστάθειας είναι οµοιόµορφες ως προς το χρόνο και σφαιρικές ως

10
προς το χώρο, απαιτείται µόνο η έννοια της ασυµπτωτικής ευστάθειας. Ικανές και
αναγκαίες συνθήκες ευστάθειας των γραµµικών και χρονικά αµετάβλητων
συστηµάτων υπάρχουν εδώ και πάνω από έναν αιώνα: οι πιο γνωστές είναι αυτές που
διατυπώθηκαν από τον Routh (1817) και τον Hurwitz (1895). Στη συνέχεια
αναφέρονται κάποια χρήσιµα εργαλεία για την ανάλυση της ευστάθειας των
συστηµάτων αυτών.

1.2.1 Ευστάθεια αυτόνοµων συστηµάτων

Ευστάθεια κατά Lyapunov

Έστω το αυτόνοµο σύστηµα

x(t ) = f ( x(t )) , x(t ) ∈ R n , x(t0 ) = x0 (1.10)

Ορισµός 1.2
Κάθε x = xe που ικανοποιεί τη σχέση

f ( xe ) = 0 , x(t1 ) = xe ⇒ x(t ≥ t1 ) = xe (1.11)

ονοµάζεται κατάσταση ισορροπίας.

Η ευστάθεια κατά Lyapunov βασίζεται σε µια ανάλυση της σύγκλισης της


λύσης (της εξίσωσης κατάστασης) x(t , x0 , t0 ) στην κατάσταση ισορροπίας xe . Από
µαθηµατική άποψη, η ασυµπτωτική ευστάθεια µπορεί να οριστεί ως εξής:

Ορισµός 1.3
Η κατάσταση ισορροπίας xe λέγεται ευσταθής, αν ∀t0 > 0 και θετικό βαθµωτό ε ,
υπάρχει ένα θετικό βαθµωτό δ (ε , t0 ) , τέτοιο ώστε:

x0 − xe < δ ⇒ x(t , x0 , t0 ) − xe < ε , ∀t ≥ t0 (1.12)

Η ευστάθεια κατά Lyapunov σηµαίνει ότι αν η αρχική κατάσταση είναι αρκετά κοντά
στο σηµείο ισορροπίας xe , τότε η τροχιά του διανύσµατος κατάστασης µπορεί να
διατηρηθεί αυθαίρετα κοντά στο xe .

Ορισµός 1.4
Η κατάσταση ισορροπίας xe λέγεται ότι συγκλίνει, αν ∀t0 > 0 υπάρχει ένα δ1 (t0 ) ,
τέτοιο ώστε:

x0 − xe < δ1 ⇒ lim x(t , x0 , t0 ) = xe , ∀t0 (1.13)


t →∞

ή ακόµη αν, ∀ε1 > 0, ∃T (ε1 , x0 , t0 ) , τέτοιο ώστε

11
x0 − xe < δ1 ⇒ x(t , x0 , t0 ) − xe < ε1 , ∀t > t0 + T (1.14)

Ορισµός 1.5
Η κατάσταση ισορροπίας xe λέγεται ασυµπτωτικά ευσταθής, αν συγκλίνει και είναι
ευσταθής.

Η ασυµπτωτική ευστάθεια σηµαίνει ότι πέραν της ευστάθειας του σηµείου


ισορροπίας µπορεί να προσδιοριστεί µια περιοχή γύρω από αυτό, τέτοια ώστε
οποιαδήποτε τροχιά µε αρχική κατάσταση x0 , κοντά στο xe τείνει στην κατάσταση
ισορροπίας xe , όταν t → +∞ . Εάν η ιδιότητα αυτή ισχύει για οποιαδήποτε αρχική
κατάσταση x0 , τότε η ασυµπτωτική ευστάθεια λέγεται σφαιρική.

1.2.2 Μέθοδος Lyapunov (Άµεση µέθοδος ή 2η µέθοδος Lyapunov)

Η βασική αρχή της 2ης µεθόδου Lyapunov αποδίδεται στον Lagrange, ο


οποίος απέδειξε ότι απουσία εξωτερικής δύναµης ένα µηχανικό σύστηµα είναι
ευσταθές, αν έχει την ιδιότητα, εφόσον µετατοπιστεί από τη θέση ισορροπίας του, η
ενέργεια του συστήµατος να µειώνεται κατά συνεχή τρόπο µέχρις ότου φτάσει την
ελάχιστη τιµή της στην κατάσταση ισορροπίας. Ξεκινώντας από αυτή την ποιοτική
διαπίστωση σχετικά µε τη συµπεριφορά και την ευστάθεια των µηχανικών
συστηµάτων, ο Lyapunov απέδειξε το 1892 µια γενική µαθηµατική θεωρία που
εφαρµόζεται σε κάθε διαφορική εξίσωση. Η άµεση µέθοδος του Lyapunov επιτρέπει
να αποφανθούµε για την ευστάθεια ενός σηµείου ισορροπίας χωρίς να χρειάζεται η
επίλυση της εξίσωσης κατάστασης. Ειδικότερα, το πρόσηµο µιας συνάρτησης V ( x)
( V (0) = 0 , V (∞) = ∞ ) που ονοµάζεται συνάρτηση Lyapunov καθώς και της
παραγώγου της δίνουν µια πληροφορία σχετικά µε την ευστάθεια του συστήµατος. Η
συνάρτηση V ( x) εδώ παίζει το ρόλο µιας πλασµατικής συνάρτησης «ενέργειας» για
το θεωρούµενο σύστηµα. Στη συνέχεια παρατίθεται το κύριο θεώρηµα ευστάθειας
που απορρέει από τη θεωρία αυτή. Υποτίθεται, χωρίς να µειώνεται η γενικότητα, ότι
η αρχή των αξόνων είναι σηµείο ισορροπίας για το σύστηµα (1.10).

Θεώρηµα 1.1
Η αρχή των αξόνων είναι ένα σηµείο ισορροπίας σφαιρικά ασυµπτωτικά ευσταθές, αν
υπάρχει µια συνάρτηση V ( x) , τέτοια ώστε,

1. V ( x) > 0 , ∀x ≠ 0 και V (0) = 0

2. V ( x) < 0 , ∀x ≠ 0

3. V ( x) → ∞ , όταν x → ∞

δηλαδή, αν υπάρχει µια συνάρτηση Lyapunov V ( x) θετικά ορισµένη, τέτοια ώστε η


παράγωγός της να είναι αρνητικά ορισµένη.

12
Μια συνάρτηση V ( x) που ικανοποιεί τις συνθήκες του Θεωρήµατος 1.1
ονοµάζεται συνάρτηση Lyapunov για το σύστηµα (1.10). Η συνάρτηση αυτή δεν είναι
µοναδική. Επίσης, η µη εύρεση µιας τέτοιας συνάρτησης δεν συνεπάγεται ότι το
σύστηµα είναι ασταθές. Μια κλάση συναρτήσεων Lyapunov που διαδραµατίζουν
σηµαντικό ρόλο στην ανάλυση της ευστάθειας των δυναµικών συστηµάτων µε την
άµεση µέθοδο Lyapunov είναι η κλάση των τετραγωνικών συναρτήσεων της µορφής

V ( x) = xT Px (1.15)

Η συνάρτηση αυτή είναι θετικά ορισµένη, αν ο P είναι θετικά ορισµένος πίνακας.


Στην περίπτωση ενός γραµµικού, αυτόνοµου συστήµατος της µορφής

x(t ) = Ax(t ) , x(t0 ) = x0 (1.16)

µια ικανή και αναγκαία συνθήκη προκειµένου η παράγωγος

V ( x) = xT ( AT P + PA) x (1.17)

να είναι αρνητικά ορισµένη, συνίσταται στην εύρεση ενός συµµετρικού πίνακα


P = PT > 0 τέτοιου ώστε

AT P + PA < 0 (1.18)

Η συνθήκη αυτή δεν προϋποθέτει την αναλυτική λύση της διαφορικής εξίσωσης,
προκειµένου ν’ αποφανθούµε για την ασυµπτωτική ευστάθεια του συστήµατος (1.16).
Η ανισότητα (1.18) είναι η πρώτη γραµµική ανισότητα πινάκων (LMI), που
χρησιµοποιήθηκε για την ανάλυση της ευστάθειας ενός δυναµικού συστήµατος (Boyd
et al. 1994) το οποίο, επιπλέον, επιδέχεται αναλυτική λύση. Για τον υπολογισµό της
αρκεί να επιλεγεί ένας οποιοσδήποτε συµµετρικός και θετικά ορισµένος πίνακας Q
και να επιλυθεί η εξίσωση

AT P + PA + Q = 0 (1.19)

Η εξίσωση αυτή ονοµάζεται εξίσωση Lyapunov. Αν το σύστηµα είναι ασυµπτωτικά


ευσταθές, ο πίνακας

P = ∫ e A t Qe At dt
T
(1.20)
0

υπάρχει, είναι θετικά ορισµένος και ικανοποιεί την εξίσωση Lyapunov (1.19).

Ευστάθεια εισόδου – εξόδου

Η ευστάθεια εισόδου – εξόδου είναι µια έννοια που συναντάται συχνά κατά
την ανάλυση ενός συστήµατος ελέγχου.

13
Ορισµός 1.6
Ένα σύστηµα λέγεται ευσταθές κατά την έννοια «εισόδου – εξόδου», αν η έξοδός του,
ως απόκριση σε µια φραγµένη είσοδο, είναι κι αυτή φραγµένη.

Από µαθηµατική άποψη, η έννοια αυτή είναι αυστηρά ορισµένη µέσω της
θεωρίας των χώρων Lebesgue και ειδικότερα των χώρων L p (Vidyasagar 1978).

Ορισµός 1.7
Η νόρµα . p ενός διανύσµατος v ∈ C n ορίζεται ως εξής:

1/ p
⎛ n p ⎞
v p
= ⎜ ∑ vi ⎟ , για 1 ≤ p < ∞ και v ∞
= sup vi (1.21)
⎝ i =1 ⎠ 1≤i ≤ n

Για κάθε 1 ≤ p < +∞ , L p ( I ) παριστά το σύνολο των διανυσµατικών συναρτήσεων


f (t ) , που ορίζονται σ’ ένα διάστηµα I ⊂ R + , τέτοιο ώστε

1/ p
⎛ ⎞
f p := ⎜ ∫ f (t )
p
p
dt ⎟ < ∞ , για 1 ≤ p < ∞ και f ∞
:= sup f (t ) ∞
<∞ (1.22)
⎝I ⎠ t∈I

Έστω το ακόλουθο γραµµικό σύστηµα:

Σχήµα 1.1 – Σύστηµα ανοικτού βρόχου

Ορισµός 1.8
Ένα σύστηµα µε είσοδο u , έξοδο y , πίνακα µεταφοράς G ( s) και περιγραφή
κατάστασης ( A, B, C , D) λέγεται ευσταθές κατά L p (ή L p - ευσταθές), αν υπάρχει µια
σταθερά γ τέτοια ώστε για κάθε είσοδο u (t ) ∈ L p , η έξοδος y (t ) ∈ Lp ικανοποιεί τη
σχέση,

y p
≤γ u p
(1.23)

Για p = ∞ , η L∞ - ευστάθεια ονοµάζεται ευστάθεια φραγµένης εισόδου –


φραγµένης εξόδου. Για τα γραµµικά και χρονικά αµετάβλητα συστήµατα, η ευστάθεια
φραγµένης εισόδου – φραγµένης εξόδου συνδέεται µε την ευστάθεια κατά Lyapunov,
ως εξής (Kailath 1980, Vidyasagar 1978):

14
• Υποθέτοντας τη σταθεροποιησιµότητα και την ανιχνευσιµότητα του
συστήµατος, το σύστηµα είναι L∞ - ευσταθές αν και µόνο αν το αντίστοιχο
αυτόνοµο σύστηµα x = Ax είναι ασυµπτωτικά ευσταθές.

• Αν το αυτόνοµο σύστηµα (1.16) είναι ασυµπτωτικά ευσταθές, τότε το


σύστηµα µε είσοδο u , έξοδο y , πίνακα µεταφοράς G ( s) και περιγραφή
κατάστασης ( A, B, C , D) είναι L p - ευσταθές για 1 ≤ p < ∞ .

1.2.3 Ευστάθεια κλειστών συστηµάτων

Έστω το σύστηµα του παρακάτω σχήµατος:

Σχήµα 1.2 – Σύστηµα κλειστού βρόχου

Στην περιγραφή αυτή, r είναι η είσοδος αναφοράς που πρέπει να ακολουθεί η έξοδος
y του συστήµατος, u είναι το διάνυσµα ελέγχου, v είναι το διάνυσµα εισόδου του
συστήµατος, du , d y , είναι διαταραχές που επηρεάζουν την είσοδο και την έξοδο του
συστήµατος, αντίστοιχα και b είναι ο θόρυβος µέτρησης. Μια ισοδύναµη περιγραφή
µπορεί να ληφθεί οµαδοποιώντας τα εξωγενή σήµατα (είσοδοι αναφοράς,
διαταραχές,…) ως ( w1 , w2 ) και τα ενδογενή σήµατα ως (e1 , e2 ) (Zhou et al. 1996).

Σχήµα 1.3 – Ισοδύναµη περιγραφή κλειστού συστήµατος

15
Η ανάδραση είναι υλοποιήσιµη στην πράξη, αν το σύστηµα κλειστού βρόχου
αντιστοιχεί σ’ ένα πρόβληµα καλά διατυπωµένο.

Ορισµός 1.9
Ένα σύστηµα κλειστού βρόχου αντιστοιχεί σ’ ένα πρόβληµα καλά διατυπωµένο, αν
όλες οι συναρτήσεις µεταφοράς υπολογιζόµενες σε κάθε σηµείο του βρόχου
ανάδρασης είναι καλά ορισµένες καθαρά ρητές συναρτήσεις.

Λήµµα 1.1 (Zhou et al. 1996)


Το κλειστό σύστηµα του σχήµατος 1.3 αντιστοιχεί σ’ ένα πρόβληµα καλά
διατυπωµένο, αν και µόνο αν ο πίνακας [ I − Kˆ (∞)G (∞)] είναι αντιστρέψιµος.

Για την υλοποίηση στο χώρο κατάστασης, η συνθήκη του λήµµατος 1.1 είναι
ˆ
ισοδύναµη µε: I − DD αντιστρέψιµος, όπου ( A, B, C , D) είναι η περιγραφή
κατάστασης του συστήµατος µε πίνακα µεταφοράς G ( s ) και ( Aˆ , Bˆ , Cˆ , Dˆ ) είναι η
περιγραφή κατάστασης του αντισταθµιστή Kˆ ( s ) . ∆εδοµένου ότι τα περισσότερα
συστήµατα είναι αυστηρά κανονικά (proper), δηλαδή έχουν D = 0 , η παραπάνω
συνθήκη ικανοποιείται.

Εσωτερική ευστάθεια

Η εσωτερική ευστάθεια αποτελεί µια πιο απαιτητική έννοια από την ευστάθεια
εισόδου – εξόδου, εφόσον αποκλείει κάθε δυνατότητα ύπαρξης µη φραγµένων
σηµάτων στο σύστηµα κλειστού βρόχου.

Ορισµός 1.10
Το κλειστό σύστηµα του σχήµατος 1.3 είναι εσωτερικά ευσταθές, αν κάθε φραγµένο
σήµα διέγερσης σε οποιοδήποτε σηµείο του βρόχου δηµιουργεί φραγµένο σήµα
απόκρισης, σε κάθε άλλο σηµείο.

Ας θεωρήσουµε και πάλι το σύστηµα του σχήµατος 1.3. Έστω ότι το κλειστό
σύστηµα αντιστοιχεί σ’ ένα πρόβληµα καλά διατυπωµένο και ότι οι υλοποιήσεις
χώρου κατάστασης των G ( s) και Kˆ ( s ) είναι σταθεροποιήσιµες και ανιχνεύσιµες.
Όταν δεν υπάρχουν οι εξωγενείς είσοδοι w1 και w2 , οι εξισώσεις κατάστασης είναι:

• Για το σύστηµα:
x = Ax + Be1
(1.9)
e2 = Cx + De1

• Για τον ελεγκτή:


η = Aˆη + Be
ˆ
2
(1.10)
e1 = Cˆη + De
ˆ
2

Το κλειστό σύστηµα γράφεται:

16
⎛ x ⎞ ⎡⎛ A 0 ⎞ ⎛ B 0 ⎞ ⎛ I − Dˆ ⎞ ⎛ 0 Cˆ ⎞ ⎤ ⎛ x ⎞
−1
⎛ x⎞
⎜ ⎟ = ⎢⎜ ⎟+⎜ ⎟⎜ ⎟ ⎜ ⎟⎥ ⎜ ⎟ = A⎜ ⎟ (1.11)
⎝η ⎠ ⎢⎣⎝ 0 Aˆ ⎠ ⎝ 0 Bˆ ⎠ ⎝ − D I ⎠ ⎝ C 0 ⎠ ⎥⎦ ⎝η ⎠ ⎝η ⎠

Ορισµός 1.11
Το κλειστό σύστηµα του σχήµατος 1.3 είναι εσωτερικά ευσταθές, αν το σηµείο
( x,η ) = (0, 0) είναι ασυµπτωτικά ευσταθές.

Λήµµα 1.2
Το κλειστό σύστηµα του σχήµατος 1.3 είναι εσωτερικά ευσταθές, αν και µόνο αν οι
ιδιοτιµές του A έχουν αρνητικά πραγµατικά µέρη.

Η εσωτερική ευστάθεια είναι ισοδύναµη µε την ασυµπτωτική ευστάθεια του πίνακα


A , της δυναµικής του κλειστού συστήµατος και αποτελεί προϋπόθεση για τη
σύνθεση ενός νόµου ελέγχου.

Θεώρηµα µικρού κέρδους

Το παρακάτω αποτέλεσµα είναι χρήσιµο στην περίπτωση που το κλειστό σύστηµα


υπόκειται σε σφάλµατα µοντελοποίησης.

Θεώρηµα 1.2 (Zames 1966)


Το κλειστό σύστηµα του σχήµατος 1.3 είναι εσωτερικά ευσταθές, αν G ( s) και Kˆ ( s )
είναι ευσταθείς συναρτήσεις µεταφοράς και

σ (G ( jω )).σ ( Kˆ ( jω )) < 1, ∀ω ∈ R

Η παραπάνω είναι µόνο ικανή συνθήκη ευστάθειας και σηµαίνει ότι το κέρδος
ανοικτού βρόχου (ή συνάρτηση µεταφοράς βρόχου) είναι µικρότερο της µονάδας σε
κάθε συχνότητα.

Γενικευµένο κριτήριο Nyquist

Η γενίκευση του κριτηρίου Nyquist στα πολυµεταβλητά συστήµατα έγινε από τον
Rosenbrock (1972) και αναφέρεται στη γενική περίπτωση συστηµάτων πολλών
εισόδων – πολλών εξόδων.

Θεώρηµα 1.3 (Maciejowski 1989)


Αν ng και nk είναι οι αριθµοί των ασταθών πόλων των G ( s ) και Kˆ ( s ) , αντίστοιχα,
το κλειστό σύστηµα του σχήµατος 1.3 είναι εσωτερικά ευσταθές, αν και µόνο αν το
διάγραµµα Nyquist του κλειστού συστήµατος, δηλαδή της φ ( s ) = det( I − G ( s ) Kˆ ( s )) ,

• δεν περνάει από την αρχή των αξόνων, δηλαδή det( I − G ( jω ) Kˆ ( jω )) ≠ 0,


∀ω ∈ R

17
• περικλείει την αρχή των αξόνων ng + nk φορές

Για τον προσδιορισµό της ευστάθειας κλειστού βρόχου χρησιµοποιήθηκε επίσης η


έννοια της παθητικότητας (passivity) η οποία εισήχθη από τον Popov στις αρχές της
δεκαετίας του’60. Τα αποτελέσµατα αυτά δίνονται λεπτοµερώς από τους Dessoer and
Vidyasagar (1975) και για την περίπτωση των γραµµικών και χρονικά αµετάβλητων
συστηµάτων από τον Anderson (1968).

1.3 Επιδόσεις
Ο βασικός σκοπός ενός νόµου ελέγχου είναι να εξασφαλίζει την ευστάθεια
του κλειστού συστήµατος, καθώς και έναν αριθµό προδιαγραφών συµπεριφοράς.
Αυτές συχνά διατυπώνονται µαθηµατικά µε τη µορφή ενός κριτηρίου επιδόσεων, το
οποίο πρέπει να ελαχιστοποιείται. Ένα τέτοιο κριτήριο µπορεί να είναι, για
παράδειγµα, η µεταφορά µεταξύ µιας διαταραχής που δρα σε κάποιο δεδοµένο
σηµείο του βρόχου και µιας ελεγχόµενης εισόδου. Προκειµένου να ποσοτικοποιηθεί
η µεταφορά αυτή, πολλές µέθοδοι ελέγχου χρησιµοποιούν νόρµες, βασιζόµενες στη
συναρτησιακή ανάλυση. Περισσότερο χρησιµοποιούµενες είναι οι νόρµες H 2 και
H ∞ . Άλλες µέθοδοι χρησιµοποιούν τις συναρτήσεις ευαισθησίας και συνεπώς
επιτρέπουν την ικανοποίηση προδιαγραφών συµπεριφοράς µόνιµης κατάστασης,
όπως:

• απόρριψη διαταραχών

• απόρριψη θορύβων µέτρησης

• χαµηλή προσπάθεια ελέγχου

• η έξοδος ν’ ακολουθεί την επιθυµητή τιµή (ή είσοδο αναφοράς) µε µικρό


ή µηδενικό σφάλµα, …

Όσον αφορά τις προδιαγραφές µεταβατικής κατάστασης, τις περισσότερες φορές


είναι
• η ταχύτητα της χρονικής απόκρισης και

• η τιµή της απόσβεσης.

Στην περίπτωση αυτή, οι µέθοδοι ελέγχου βασίζονται στην τοποθέτηση των ιδιοτιµών
του κλειστού συστήµατος σε κατάλληλες περιοχές του µιγαδικού επιπέδου.

1.3.1 Συναρτήσεις ευαισθησίας

Οι ακόλουθες συναρτήσεις ευαισθησίας ορίζονται για το κλειστό σύστηµα


του σχήµατος 1.2 και παίζουν βασικό ρόλο στην ανάλυση των κριτηρίων επιδόσεων
που αναφέρθηκαν παραπάνω.

18
• S y = ( I + GK ) −1 : συνάρτηση ευαισθησίας, παριστά τη συνάρτηση µεταφοράς
µεταξύ της διαταραχής d y και της εξόδου y

• Ty = GK ( I + GK ) −1 : συµπληρωµατική συνάρτηση ευαισθησίας εξόδου,


συνδέεται µε τη συνάρτηση ευαισθησίας µε τη σχέση S y + Ty = I .

• Su = ( I + KG ) −1 : συνάρτηση ευαισθησίας εισόδου, παριστά τη συνάρτηση


µεταφοράς µεταξύ της διαταραχής du και της εισόδου του συστήµατος

• Tu = KG ( I + KG ) −1 : συµπληρωµατική συνάρτηση ευαισθησίας εισόδου,


συνδέεται µε τη συνάρτηση ευαισθησίας εισόδου µε τη σχέση Su + Tu = I .

Οι συναρτήσεις αυτές χαρακτηρίζουν τη συµπεριφορά του κλειστού συστήµατος,


αφού οι προδιαγραφές επιδόσεων που προαναφέρθηκαν µπορούν να εκφραστούν ως
περιορισµοί επί των συναρτήσεων ευαισθησίας.

Η συµπεριφορά ενός ευσταθούς κλειστού συστήµατος που παρίσταται µε το


σχήµα 1.2, διέπεται από τις ακόλουθες εξισώσεις:

y = Ty (r − b) + S y Gdu + S y d y (1.12)

e = r − y = S y (r − d y ) + Ty b − S y Gdu (1.13)

u = KS y (r − b) − KS y d y − Tu du (1.14)

v = KS y (r − b) − KS y d y + Su du (1.15)

Με δεδοµένες τις σχέσεις αυτές, κατά τη σύνθεση ενός αντισταθµιστή K ( s ) πρέπει


να λαµβάνονται υπόψη οι ακόλουθοι περιορισµοί, προκειµένου να ικανοποιούνται οι
προδιαγραφές επιδόσεων:

• S y και S y G µε µικρές τιµές, ώστε η έξοδος ν’ ακολουθεί την επιθυµητή τιµή


(ή είσοδο αναφοράς) µε µικρό ή µηδενικό σφάλµα, δηλαδή e → 0 , καθώς και
να εξασφαλίζεται απόρριψη των διαταραχών εξόδου

• Tu και KS y µε µικρές τιµές, ώστε να απαιτείται χαµηλή προσπάθεια ελέγχου

• Su και KS y µε µικρές τιµές, ώστε να απαιτείται χαµηλή προσπάθεια ελέγχου


και να εξασφαλίζεται απόρριψη των διαταραχών εισόδου

• Ty µε µικρές τιµές, ώστε να εξασφαλίζεται απόρριψη του θορύβου µέτρησης

19
Ωστόσο, επειδή οι συναρτήσεις ευαισθησίας δεν είναι ανεξάρτητες µεταξύ τους
( S y + Ty = I , Su + Tu = I ), καθίσταται φανερό ότι οι παραπάνω περιορισµοί δεν
µπορούν να ικανοποιούνται συγχρόνως. Συνεπώς, η σύνθεση του αντισταθµιστή θα
πρέπει να βασίζεται σ’ ένα συµβιβασµό µεταξύ των προδιαγραφών, εξασφαλίζοντας
µικρές τιµές των διαφόρων συναρτήσεων ευαισθησίας σε διαφορετικές περιοχές
συχνοτήτων (Zhou et al. 1996). Σηµειώνεται, ότι ένας τρόπος να κρίνουµε, αν ένας
πίνακας µεταφοράς G ( s ) παίρνει µικρές τιµές, συνίσταται στο να εξετάσουµε, αν η
τιµή του µέγιστου κέρδους του είναι µικρή ( σ (G ) < 1 ) σ’ εκείνη την περιοχή
συχνοτήτων, όπου η θεωρούµενη διαταραχή έχει σηµαντική (µεγάλη) τιµή.

1.3.2 Επιδόσεις H ∞

Η ελαχιστοποίηση της νόρµας H ∞ µιας συνάρτησης µεταφοράς κλειστού


βρόχου έχει ιδιαίτερο ενδιαφέρον. Για µια κανονική ρητή και ευσταθή (proper and
stable) συνάρτηση µεταφοράς G ( s ) , η νόρµα H ∞ ορίζεται από τη σχέση,

G ∞
= sup σ (G ( jω ))
ω

Στην περίπτωση µιας εισόδου – µιας εξόδου, αντιστοιχεί στη µέγιστη τιµή του
πλάτους της συνάρτησης µεταφοράς. Η πρωταρχική ιδιότητα της νόρµας αυτής είναι
ότι παριστά τη µέγιστη ενέργεια ενός σήµατος εξόδου, ως απόκριση σ’ ένα
οποιοδήποτε σήµα εισόδου µοναδιαίας ενέργειας. Για τα συστήµατα κλειστού
βρόχου, η ιδιότητα αυτή µπορεί να αξιοποιηθεί προκειµένου να επιτευχθούν
επιδόσεις όπως η απόρριψη διαταραχής ή η ελαχιστοποίηση του σφάλµατος εξόδου.
Για παράδειγµα, ένας αντισταθµιστής K ( s ) που επιλέγεται ώστε να σταθεροποιεί το
σύστηµα και να ελαχιστοποιεί τη Sy ∞
, επιτρέπει την ελαχιστοποίηση της ενέργειας
του σήµατος εξόδου υπό την επίδραση διαταραχών πεπερασµένης ενέργειας που
ενεργούν στην έξοδο του συστήµατος. Ακόµη, η µέγιστη ενέργεια µιας εξόδου z υπό
την επίδραση της χειρότερης διαταραχής w θα ελαχιστοποιείται, αν ο
αντισταθµιστής K ( s) υπολογιστεί, έτσι ώστε να ελαχιστοποιείται η νόρµα H ∞ της
µεταφοράς µεταξύ z και w , που συµβολίζεται Fzw . Το αντίστοιχο πρόβληµα
βελτιστοποίησης διατυπώνεται ως εξής:

min Fzw ∞
K

Συνοψίζοντας, η ελαχιστοποίηση της νόρµας H ∞ της συνάρτησης µεταφοράς του


κλειστού συστήµατος εξασφαλίζει ένα επίπεδο επιδόσεων στο ονοµαστικό σύστηµα.
Μέχρι στιγµής, δεν υπάρχει άµεση µέθοδος υπολογισµού της νόρµας H ∞ . Μπορεί
όµως να εξεταστεί κατά πόσον αυτή είναι µικρότερη (ή µεγαλύτερη) από µια
δεδοµένη τιµή. Για το σκοπό αυτό έχουν αναπτυχθεί επαναληπτικοί αλγόριθµοι που
δίνουν µια καλή προσέγγιση της ποσότητας αυτής (Boyd et al. 1989, Doyle et al.
1989).

20
1.3.3 Επιδόσεις H 2

Έστω ένας πίνακας µεταφοράς G ( s) , αυστηρά κανονικός και ευσταθής


(strictly proper and stable), καθώς και η περιγραφή κατάστασής του ( A, B, C , 0) . Η
νόρµα H 2 ορίζεται ως εξής:


1
∫ Trace(G( jω )
2
G2= H
G ( jω ))d ω
2π −∞

Σε αντίθεση προς τη νόρµα H ∞ , η νόρµα H 2 υπολογίζεται εύκολα. Ο πιο άµεσος και


απλός τρόπος είναι να χρησιµοποιηθεί η περιγραφή κατάστασης του συστήµατος.
Έτσι έχουµε,

2
G 2 = Trace(CLc C T ) = Trace( BT Lo B)
όπου

Lc = ∫ e At BBT e A t dt
T

είναι συµµετρικός θετικά ηµι-ορισµένος πίνακας που ικανοποιεί την εξίσωση


Lyapunov

ALc + Lc AT + BBT = 0
και

Lo = ∫ e A t C T Ce At dt
T

είναι συµµετρικός θετικά ηµι-ορισµένος πίνακας που ικανοποιεί την εξίσωση


Lyapunov

AT Lo + Lo A + C T C = 0

Οι Lc και Lo ονοµάζονται, αντίστοιχα, πίνακας ελεγξιµότητας και πίνακας


παρατηρησιµότητας.

Η νόρµα H 2 ενός γραµµικού ευσταθούς συστήµατος παριστά τη συνολική ενέργεια


του σήµατος εξόδου, όταν η είσοδος είναι η µια συνάρτηση Dirac (παλµός). Άρα, η
ελαχιστοποίηση της νόρµας H 2 της µεταφοράς Fzw µεταξύ µιας εξόδου z και µιας
διαταραχής w , επιτρέπει την ελαχιστοποίηση της συνολικής ενέργειας του σήµατος
εξόδου z υπό την επίδραση της διαταραχής w . Από στοχαστική άποψη, η νόρµα H 2
είναι η συσχέτιση του σήµατος εξόδου, όταν η είσοδος είναι ένα σήµα λευκού
θορύβου µε µοναδιαία γκαουσιανή κατανοµή. Το πρόβληµα της εύρεσης ενός νόµου
ελέγχου που ελαχιστοποιεί αυτή τη νόρµα είναι περισσότερο γνωστό ως έλεγχος LQG
(Linear Quadratic Gaussian). Η λύση του επέφερε σηµαντικά αποτελέσµατα, κυρίως
στο πεδίο της εκτίµησης κατάστασης. Η κύρια αδυναµία του, ωστόσο, είναι το

21
γεγονός ότι βασίζεται στην υπόθεση, ότι το µοντέλο του συστήµατος είναι επακριβώς
γνωστό, πράγµα που δεν συµβαίνει στην πράξη και έτσι ο νόµος ελέγχου που
προκύπτει είναι εξαιρετικά ευαίσθητος απέναντι σε σφάλµατα µοντελοποίησης
(Doyle 1978).

1.3.4 Επιδόσεις στη µεταβατική κατάσταση

Η σύνθεση ενός αντισταθµιστή K ( s ) , εκτός από τη σταθεροποίηση του


κλειστού συστήµατος, θα πρέπει να εξασφαλίζει και την ικανοποίηση κάποιων
προδιαγραφών επιδόσεων στη µεταβατική κατάσταση. Οι προδιαγραφές αυτές
συνδέονται άµεσα µε τις θέσεις των ιδιοτιµών του συστήµατος. Για παράδειγµα, η
ύπαρξη ενός ζεύγους µιγαδικών ιδιοτιµών µε µικρή απόσβεση, έχει ως συνέπεια µια
χρονική απόκριση µε µεγάλη µέγιστη υπερύψωση και ισχυρές ταλαντώσεις. Η
ποιότητα µιας χρονικής απόκρισης y (t ) αξιολογείται συνήθως από κάποια
χαρακτηριστικά της, θεωρώντας ειδικές εισόδους, όπως η µοναδιαία βηµατική
συνάρτηση. Έτσι, στην περίπτωση συστήµατος µιας εισόδου – µιας εξόδου, η
χρονική απόκριση σε µοναδιαία βηµατική είσοδο u (t ) έχει τα εξής χαρακτηριστικά:

max( y (t ) − y (∞))
• Μέγιστη υπερύψωση: M =
y (∞ )

• Χρόνος ανύψωσης: tm = t90 − t10 , όπου t x συµβολίζει το χρόνο που απαιτείται


για να ώστε να φτάσει η έξοδος y (t ) στο x% της τελικής τιµής της.

τ
• Χρόνος αποκατάστασης: t f = inf{t1 ≥ 0, ∀t ≥ t1 y (t ) − y (∞) ≤y (∞) } είναι
100
ο χρόνος που απαιτείται για να φτάσει και να παραµείνει η χρονική απόκριση
στο τ % (συνήθως τ = 5 ) της τελικής τιµής της.

Με βάση τα χαρακτηριστικά αυτά η χρονική απόκριση y (t ) θεωρείται


ικανοποιητική, εφόσον η µέγιστη υπερύψωση είναι ελάχιστη, ή και µηδενική, ο
χρόνος ανύψωσης πολύ µικρός και ο χρόνος αποκατάστασης κατά το δυνατόν
ελάχιστος. Επειδή, δεν είναι εφικτός ο υπολογισµός ενός νόµου ελέγχου που να
εξασφαλίζει µια χρονική απόκριση µε ακριβή χαρακτηριστικά, συνήθως επιδιώκεται
οι προδιαγραφές της µεταβατικής χρονικής απόκρισης να βρίσκονται στο εσωτερικό
µιας επιθυµητής περιοχής.

Σχέση µεταξύ ιδιοτιµών και επιδόσεων στη µεταβατική κατάσταση

Ένα ζεύγος ιδιοτιµών (α ± j β ) αντιστοιχεί στις ρίζες ενός χαρακτηριστικού


πολυωνύµου δευτέρου βαθµού

p( s ) = ( s − α − j β )( s − α + j β ) = s 2 + 2ζωn s + ωn2
όπου,

22
• ωn = α 2 + β 2 : είναι η κυκλική ιδιοσυχνότητα και παριστά την απόσταση
µεταξύ της ιδιοτιµής και της αρχής των αξόνων

α
• ζ =− : είναι ο συντελεστής απόσβεσης και παριστά τη γωνία ως προς τον
ωn
άξονα των φανταστικών αριθµών (ζ = sin(φ ))

Είναι προφανές ότι το πραγµατικό και το φανταστικό µέρος των ιδιοτιµών είναι,
αντίστοιχα,

• α = −ζωn και

• β = ωn 1 − ζ 2

Στην περίπτωση ενός συστήµατος 2ης τάξης µε µια είσοδο και µια έξοδο, µε
περιγραφή εισόδου – εξόδου,

ωn2
Y ( s ) = G ( s)U ( s) , G ( s) =
s 2 + 2ζωn s + ωn2

η χρονική απόκριση σε µια µοναδιαία βηµατική είσοδο γράφεται,

e−ζωnt
• y (t ) = 1 − cos(ωn 1 − ζ 2 t − θ ), για 0 < ζ < 1, t ≥ 0
1− ζ 2

• y (t ) = 0, για t < 0

όπου
ζ
• θ = Arctg ( )
1− ζ 2

Οι παρακάτω σχέσεις χρησιµοποιούνται συχνά για να προσδιορίσουν τις θέσεις των


ιδιοτιµών του συστήµατος που συνεπάγονται επιθυµητές προδιαγραφές επιδόσεων.
Έτσι, έχουµε,
πζ

1−ζ 2 0.8 + 2.5ζ Ln(0.05 1 − ζ 2 4
D = max( y (t ) − 1) = e , tm ≅ , tf = − ≅
ωn ζωn ζωn

Άρα, η δυναµική ενός γραµµικού συστήµατος εξαρτάται από τις θέσεις των πόλων
του επάνω στο µιγαδικό επίπεδο. Γενικά, η τοποθέτησή τους σε κατάλληλες περιοχές
αρκεί, προκειµένου να ικανοποιηθούν προδιαγραφές επιδόσεων, σαν αυτές που
αναφέρθηκαν στην προηγούµενη παράγραφο.

23
1.3.5 Γραµµικό τετραγωνικό κριτήριο επιδόσεων

Για ένα γραµµικό και χρονικά αµετάβλητο σύστηµα µε περιγραφή χώρου


κατάστασης,

x(t ) = Ax(t ) + Bu (t )

οι προδιαγραφές των επιδόσεων µπορούν επίσης να διατυπωθούν µε τη µορφή ενός


ολοκληρώµατος τετραγωνικών όρων όπως,

J = ∫ ( xT (t )Qx(t ) +uT (t ) Ru (t ))dt
0

Ο νόµος ελέγχου ανάδρασης που αναζητείται πρέπει να ελαχιστοποιεί το παραπάνω


γραµµικό τετραγωνικό κριτήριο (ή δείκτη) επιδόσεων ενώ συγχρόνως να εγγυάται την
ευστάθεια του κλειστού συστήµατος. Με την προϋπόθεση ότι οι µεταβλητές
κατάστασης του συστήµατος είναι µετρήσιµες, ο βέλτιστος νόµος ελέγχου

u (t ) = Kx(t )

προσδιορίζεται από την επίλυση µιας εξίσωσης Riccati και εξασφαλίζει πολύ καλές
ιδιότητες ευρωστίας, όπως άπειρο περιθώριο κέρδους, περιθώριο φάσης τουλάχιστον
60 , περιθώριο καθυστέρησης και ανοχή σε µη γραµµικότητες, µέχρις ενός
ορισµένου µεγέθους (Anderson and Moore 1990). Οι πίνακες βάρους Q και R που
υπεισέρχονται στο κριτήριο επιδόσεων, παίζουν θεµελιώδη ρόλο στη συµπεριφορά
του κλειστού συστήµατος. Ειδικότερα, η κατάλληλη επιλογή τους είναι δυνατόν να
επιφέρει ένα συµβιβασµό µεταξύ των επιδόσεων του κλειστού συστήµατος και της
προσπάθειας ελέγχου. Ακόµη, αποτελούν ένα µέσο για την επίτευξη επιθυµητής
συµπεριφοράς στη µεταβατική κατάσταση. Αν και ο προσδιορισµός τους δεν
υπόκειται σε µια συστηµατική µέθοδο, εντούτοις η επιλογή τους αφήνει στο
σχεδιαστή πολλούς βαθµούς ελευθερίας και µεταξύ αυτών τη δυνατότητα
τοποθέτησης των πόλων του κλειστού συστήµατος σε επιθυµητές θέσεις (Graupe
1972, Kawasaki and Shimemura 1983, Saif 1989).

1.3.6 Άλλοι τύποι επιδόσεων

Επιδόσεις L1

Η βασική ιδέα της συµπεριφοράς L1 είναι να θεωρηθεί ότι οι εξωγενείς


διαταραχές είναι άγνωστες, αλλά οµοιόµορφα φραγµένες και να αναζητηθεί η
ελαχιστοποίηση του µέγιστου πλάτους της ελεγχόµενης εξόδου, στο πεδίο του
χρόνου. Σε προβλήµατα αυτού του τύπου, χρησιµοποιείται η νόρµα L1 προκειµένου
να µετρηθεί το πλάτος των σηµάτων εισόδου, καθώς και η νόρµα L∞ προκειµένου να
µετρηθεί το πλάτος των σηµάτων εισόδου ή εξόδου του συστήµατος (Dahleh and
Diaz-Bobillo 1995).

24
Σύνθεση πολλαπλών στόχων

Σε αντίθεση µε τις περιπτώσεις που προαναφέρθηκαν, σε ορισµένα


προβλήµατα υπεισέρχονται πολλά κριτήρια επιδόσεων. Επειδή δεν είναι δυνατόν να
ελαχιστοποιηθούν όλα τα κριτήρια, ο σκοπός του νόµου ελέγχου είναι να καταστήσει
το κάθε κριτήριο επιδόσεων όσο το δυνατόν µικρότερο. Έτσι, διατυπώνονται τα εξής
προβλήµατα:

• Το µικτό πρόβληµα H 2 / H ∞ , το οποίο µπορεί να ερµηνευθεί ως ένα


πρόβληµα ονοµαστικών επιδόσεων H 2 υπό περιορισµό εύρωστης ευστάθειας
H ∞ (Khargonekar and Rotea 1991, Zhou et al. 1994).

• Το πρόβληµα H ∞ / H ∞ , που αντιστοιχεί στη βελτιστοποίηση των


ονοµαστικών επιδόσεων µε τη χρήση της νόρµας H ∞ και µε περιορισµό
εύρωστης ευστάθειας.

1.4 Συµπεράσµατα
Ένα φυσικό σύστηµα αυτοµάτου ελέγχου περιγράφεται συνήθως από ένα
µαθηµατικό µοντέλο στο οποίο βασίζεται, κατ’ επέκταση, η ανάλυση και η σύνθεση
ενός αντισταθµιστή (ή ελεγκτή). Στο βαθµό που το µοντέλο περιγράφει µε ακρίβεια
τη συµπεριφορά του πραγµατικού συστήµατος, ο κλασικός αυτόµατος έλεγχος δίνει
εξαιρετικά αποτελέσµατα. Έτσι, µπορεί να βρεθεί µια βέλτιστη λύση που εξασφαλίζει
στο σύστηµα εσωτερική ευστάθεια και επιθυµητές επιδόσεις. Για παράδειγµα, στην
περίπτωση που το µοντέλο είναι ακριβές και οι διαταραχές είναι σήµατα γκαουσιανού
λευκού θορύβου µε γνωστές στατιστικές ιδιότητες, η βέλτιστη λύση δίνεται από έναν
ελεγκτή LQG.

Εντούτοις, στην πράξη είναι αδύνατο να περιγράψουµε µε ακρίβεια τη


συµπεριφορά ενός δεδοµένου φυσικού συστήµατος. Επίσης, σε ότι αφορά τις
διαταραχές, συνήθως είναι διαθέσιµες ανεπαρκείς πληροφορίες, όπως ότι είναι
διαταραχή φραγµένης ενέργειας, διαταραχή που επιδρά σε δεδοµένο εύρος
συχνοτήτων κ.λ.π. Για τους παραπάνω λόγους, είναι αναγκαίο να ληφθούν υπόψη τα
σφάλµατα µοντελοποίησης ή αβεβαιότητες και να περιγραφούν µ’ ένα κατάλληλο
µαθηµατικό τρόπο. Η µορφή της περιγραφής ποικίλλει ανάλογα µε τη φύση και την
προέλευση των αβεβαιοτήτων.

Τα αποτελέσµατα που παρουσιάστηκαν στο κεφάλαιο αυτό, αν και βασίζονται


στην υπόθεση ότι είναι διαθέσιµο ένα ακριβές µοντέλο του φυσικού συστήµατος,
µπορούν να επεκταθούν και στην περίπτωση αβέβαιων συστηµάτων: Ο νόµος
ελέγχου προσδιορίζεται έτσι ώστε να εξασφαλίζει µια ορισµένη ευρωστία, τόσο ως
προς την ευστάθεια όσο και ως προς τις επιδόσεις, για ένα πλήθος µοντέλων που
παριστούν το αβέβαιο σύστηµα.

25
Κεφάλαιο 2

Αβεβαιότητα και ευρωστία

Το κεφάλαιο αυτό αναφέρεται στα συστήµατα µε αβεβαιότητες ή αβέβαια


συστήµατα και σε κατάλληλες µεθόδους για τον έλεγχό τους που ονοµάζονται µέθοδοι
εύρωστου ελέγχου. Ειδικότερα, αναφέρεται στην προέλευση και τη φύση της
αβεβαιότητας, στην περιγραφή της και τη µοντελοποίηση αβέβαιων συστηµάτων, σε
τεχνικές ανάλυσης και ελέγχου. ∆εδοµένου ότι οι τεχνικές αυτές είναι πολλές και
ποικίλλουν ανάλογα µε το είδος της αβεβαιότητας, στα επόµενα κεφάλαια εστιάζουµε
στη λεγόµενη τετραγωνική προσέγγιση. Ωστόσο, παρουσιάζεται και µια από τις
σπάνιες αναγκαίες και ικανές συνθήκες εύρωστης ευστάθειες που προτάθηκε από τον
Kharitonov (1978) και που ανήκει στις λεγόµενες αλγεβρικές µεθόδους, καθώς και η
πολύ δηµοφιλής προσέγγιση H ∞ , τόσο για ιστορικούς λόγους όσο και για το
πρόβληµα που προτίθεται να επιλύσει. Πάντως, εξέχουσα θέση δίνεται στην
προσέγγιση που βασίζεται στη µέθοδο Lyapunov και στις µεθόδους εύρωστου
ελέγχου που απορρέουν από αυτή.

2.1 Μοντελοποίηση της αβεβαιότητας


Όπως έχει ήδη αναφερθεί, ένα µαθηµατικό πρότυπο ή µοντέλο που
χρησιµοποιείται για την ανάλυση ενός πραγµατικού συστήµατος και τη σύνθεση
αντισταθµιστών για τον έλεγχό του αποτελεί µια προσέγγιση της συµπεριφοράς του
συστήµατος και µάλιστα σε ιδιαίτερες συνθήκες λειτουργίας. Προκειµένου να
σχεδιαστούν νόµοι ελέγχου που να έχουν ισχύ στο πραγµατικό σύστηµα θα πρέπει
κατά το σχεδιασµό να ληφθούν υπόψη και να περιγραφούν ανάλογα οι αβεβαιότητες
µοντελοποίησης. Οι λόγοι για τους οποίους εµφανίζονται αβεβαιότητες είναι κυρίως
οι εξής:

• µη γραµµικότητες ή / και δυναµικές του συστήµατος που παραλείπονται κατά


τη µοντελοποίηση

26
• ανακριβής γνώση των τιµών των παραµέτρων του µοντέλου η / και
φυσιολογική µεταβολή των τιµών τους κατά τη διάρκεια της λειτουργίας του
συστήµατος

• επίδραση που προέρχεται από το περιβάλλον του συστήµατος µε τη µορφή


διαταραχών

Γενικά διακρίνουµε δύο µεγάλες κατηγορίες αβεβαιοτήτων:

• τις δοµηµένες αβεβαιότητες που η µαθηµατική περιγραφή τους είναι τέτοια


ώστε να δίνει πληροφορία σχετικά µε το πώς αυτές επηρεάζουν το σύστηµα.
Περιγράφονται κυρίως στο πεδίο του χρόνου.

• τις µη δοµηµένες αβεβαιότητες για τις οποίες καµία πληροφορία σχετικά µε το


πώς αυτές επηρεάζουν το σύστηµα, δεν είναι διαθέσιµη. Συνήθως
περιγράφονται στο πεδίο της συχνότητας και το µόνο γνωστό είναι κάποιο
άνω φράγµα των αποκλίσεων µεταξύ µιας ονοµαστικής απόκρισης
συχνότητας του συστήµατος και των πραγµατικών τιµών των αποκρίσεων
συχνότητας που λαµβάνονται.

Επειδή τόσο η φύση όσο και η προέλευση των αβεβαιοτήτων ποικίλλουν σε κάθε
σύστηµα, είναι φανερό ότι δεν υπάρχει ένας σφαιρικός τρόπος περιγραφής. Έτσι
ανάλογα µε την περιγραφή του φυσικού συστήµατος ακολουθείται κάθε φορά η
κατάλληλη περιγραφή αβεβαιοτήτων.

2.1.1 Περιγραφή στο πεδίο της συχνότητας

Σε περιγραφές στο πεδίο της συχνότητας οι αβεβαιότητες είναι συνήθως µη


παραµετρικές και µη δοµηµένες. Οι αβεβαιότητες µοντελοποίησης περιγράφονται µε
µια σφαιρική µορφή, θεωρώντας ότι η συνάρτηση µεταφοράς του ονοµαστικού
συστήµατος είναι η G ( s ) και υπόκειται σε µεταβολές ∆G ( s ) . Ο τρόπος που η ∆G ( s )
επηρεάζει την G ( s ) διαφέρει ανάλογα µε το αν αυτή είναι αθροιστική ή
πολλαπλασιαστική και αν επιδρά στην είσοδο ή στην έξοδο του συστήµατος. Έτσι
παίρνουµε τις ακόλουθες περιγραφές που θεωρούνται πλέον κλασικές

G ( s ) = G ( s) + ∆Ga ( s ) , σ [∆Ga ( jω )] ≤ la ( jω ) , ∀ω ≥ 0

Σχήµα 2.1 Περιγραφή µε αθροιστική αβεβαιότητα

27
G ( s ) = G ( s )[ I + ∆Ge ( s )] , σ [∆Ge ( jω )] ≤ le ( jω ) , ∀ω ≥ 0

Σχήµα 2.2 Περιγραφή µε πολλαπλασιαστική αβεβαιότητα στην είσοδο

G ( s ) = [ I + ∆Gs ( s )]G ( s ) , σ [∆Gs ( jω )] ≤ ls ( jω ) , ∀ω ≥ 0

Σχήµα 2.3 Περιγραφή µε πολλαπλασιαστική αβεβαιότητα στην έξοδο

G ( s ) = G ( s )[ I + ∆Gie ( s )]−1 , σ [∆Gie ( jω )] ≤ lie ( jω ) , ∀ω ≥ 0

Σχήµα 2.4 Περιγραφή µε αντίστροφη πολλαπλασιαστική αβεβαιότητα στην είσοδο

28
G ( s ) = [ I + ∆Gis ( s )]−1 G ( s ) , σ [∆Gis ( jω )] ≤ lis ( jω ) , ∀ω ≥ 0

Σχήµα 2.5 Περιγραφή µε αντίστροφη πολλαπλασιαστική αβεβαιότητα στην έξοδο

Σε όλες τις παραπάνω περιγραφές οι αβεβαιότητες είναι µη δοµηµένες, αλλά είναι


γνωστό ένα άνω φράγµα τους στο πεδίο της συχνότητας. Επιπλέον, οι
πολλαπλασιαστικές µορφές επιτρέπουν τη γενίκευση των εννοιών των περιθωρίων
κέρδους και φάσης στα πολυµεταβλητά συστήµατα (Doyle and Stein 1981). Στο
πεδίο της συχνότητας είναι επίσης δυνατή και µια δοµηµένη περιγραφή της
αβεβαιότητας. Αυτή λαµβάνεται θεωρώντας ένα διαγώνιο κατά µπλοκ πίνακα ∆G ( s ) .

⎡ ∆G1 ( s ) 0 ⎤
⎢ . ⎥
∆G ( s ) = ⎢ ⎥
⎢ . ⎥
⎢ ⎥
⎢⎣ 0 ∆Gn ( s ) ⎥⎦

Σχήµα 2.6 ∆οµηµένη αβεβαιότητα

29
2.1.2 Περιγραφή στο χώρο κατάστασης

Η γενική περιγραφή ενός αβέβαιου συστήµατος στο χώρο κατάστασης είναι,

x(t ) = ( A + ∆A) x(t ) + ( B + ∆B)u (t )


(2.1)
y (t ) = (C + ∆C ) x(t ) + ( D + ∆D)u (t )

όπου οι πίνακες ∆A, ∆B, ∆C , ∆D περιγράφουν τις αβεβαιότητες που στη


συγκεκριµένη περίπτωση είναι κυρίως µεταβολές των παραµέτρων του µοντέλου. Στη
συνέχεια θεωρούµε για λόγους απλότητας την περίπτωση κατά την οποία µόνο ο
πίνακας κατάστασης είναι αβέβαιος. ∆ιακρίνουµε τις παρακάτω µορφές
αβεβαιότητας:

Μη δοµηµένη παραµετρική αβεβαιότητα

Στην περίπτωση αυτή ο ∆A περιέχει όλες τις µεταβολές των παραµέτρων,


χωρίς όµως να είναι διαθέσιµη καµία πληροφορία σχετικά µε τη δοµή του. Είναι
γνωστό µόνο ένα άνω φράγµα της νόρµας του,

∆A ≤ a (2.2)

όπου a είναι ένας θετικός αριθµός και . είναι µια νόρµα του τύπου . 2 ή . ∞ .

Παραµετρική στοχαστική αβεβαιότητα

Στην περιγραφή αυτή είναι αναγκαία µια στατιστική πληροφορία σχετικά µε


την αβεβαιότητα που έχει τη µορφή

∆A = ∑ xi Gi wi = G ( x) w (2.3)
i

όπου wi είναι µεταβλητές γκαουσιανού λευκού θορύβου. Τα στοιχεία του πίνακα G


θεωρούνται γραµµικά ως προς x . Η αβεβαιότητα αυτής της µορφής είναι µη
δοµηµένη, διότι οι στατιστικές υποθέσεις σχετικά µε την αβεβαιότητα δε δίνουν
καµιά πληροφορία για τον τρόπο που αυτή επηρεάζει το µοντέλο του συστήµατος.

∆οµηµένη παραµετρική αβεβαιότητα

Η περιγραφή αυτή είναι ευρύτερα χρησιµοποιούµενη από τις δύο


προηγούµενες και προϋποθέτει κάποια γνώση του τρόπου µε τον οποίο η
αβεβαιότητα επηρεάζει τα στοιχεία των πινάκων του συστήµατος. Οι συνηθέστεροι
τύποι δοµηµένης παραµετρικής αβεβαιότητας είναι οι εξής:

Γραµµική παραµετρική αβεβαιότητα: Οι αβέβαιες παράµετροι


υπεισέρχονται στο µοντέλο µε τη µορφή,

30
k
∆A = ∑ Ai pi , όπου pi ∈ [ pi , pi ] (2.4)
i =1

Οι πίνακες Ai προσδιορίζουν τη δοµή της αβεβαιότητας στον πίνακα κατάστασης.


Από γεωµετρική άποψη το πεδίο µεταβολής των αβέβαιων παραµέτρων είναι ένα
υπερ – ορθογώνιο διάστασης k του οποίου οι κορυφές αντιστοιχούν στις ακρότατες
τιµές του διανύσµατος p = [ p1... pk ]T . Αυτός ο τύπος µοντέλου προκύπτει από τις
εξισώσεις της φυσικής που περιγράφουν ένα σύστηµα, κάθε φορά που οι αριθµητικές
τιµές κάποιων παραµέτρων περιλαµβάνονται µεταξύ µιας κατώτερης και µιας
ανώτερης τιµής.

Πολυτοπική αβεβαιότητα: Για αυτό τον τύπο αβεβαιότητας ο


πίνακας κατάστασης ανήκει σ’ ένα πολύτοπο που ορίζεται από τις σχέσεις,

k k
A ∈ DA = { A : A = ∑ Ai ai , ai ≥ 0 , ∑a i = 1} (2.5)
i =1 i =1

όπου k είναι ο αριθµός των κορυφών του πολυέδρου DA . Αυτή η µορφή


αβεβαιότητας συναντάται συχνά σε πρακτικές εφαρµογές µε πολλαπλά µοντέλα όπου
κάθε µοντέλο λαµβάνεται για ιδιαίτερες συνθήκες λειτουργίας. Είναι εύκολο να
δούµε ότι µοιάζει µε τη γραµµική παραµετρική αβεβαιότητα, αφού το πολύτοπο που
αντιστοιχεί σε µία δεδοµένη γραµµική περιγραφή είναι το κυρτό σύνολο των
απεικονίσεων ( A + ∑ i Ai pi ) των κορυφών του υπερ – ορθογώνιου.

Σχήµα 2.7 Γραµµική – πολυτοπική αβεβαιότητα

Αβεβαιότητα µε φραγµένη νόρµα: Η περιγραφή αυτή είναι λιγότερο


δοµηµένη από τις προηγούµενες καθώς ορίζεται από τη σχέση,

∆A = DFE (2.6)

31
όπου D ∈ R n×r , E ∈ R l×n είναι γνωστοί πίνακες µε χρονικά αµετάβλητα στοιχεία που
προσδιορίζουν τη δοµή της αβεβαιότητας στον πίνακα κατάστασης. Ο πίνακας
αβεβαιότητας F ανήκει στο πεδίο,

F = {F ∈ R r ×l : F T F ≤ I }

το οποίο είναι ένα ελλειψοειδές µε κέντρο τον ονοµαστικό πίνακα A . Μια


περισσότερο δοµηµένη µορφή είναι η ακόλουθη:

k
∆A = ∑ ∆Ai , όπου ∆Ai = Di Fi Ei , Fi Fi ≤ I
T

i =1

Πραγµατική θετική αβεβαιότητα: Η πραγµατική θετική


αβεβαιότητα (positive real uncertainty) ορίζεται από τη σχέση,

∆A = − DF ( I + D0 F ) −1 E (2.7)

όπου D ∈ R n×r , E ∈ R r×n είναι γνωστοί πίνακες µε χρονικά αµετάβλητα στοιχεία που
προσδιορίζουν τη δοµή της αβεβαιότητας στον πίνακα κατάστασης. Ο πίνακας
αβεβαιότητας F ανήκει στο πεδίο,

Fp = {F ∈ R r ×r : F T + F ≥ 0}

Επιπλέον, υπάρχει ένας σταθερός πίνακας D0 καταλλήλων διαστάσεων που


T
ικανοποιεί την ανισότητα D0 + D0 > 0 . Η συνθήκη αυτή εξασφαλίζει ότι ο όρος
I + D0 F είναι αντιστρέψιµος, για κάθε F ∈ Fp . Αυτός ο τύπος αβεβαιότητας µπορεί
να ερµηνευθεί ως ένα σύστηµα στο οποίο η αβεβαιότητα F επιδρά όπως µια
αρνητική ανάδραση µιας εξόδου z σε µια είσοδο w .

Σχήµα 2.8 Πραγµατική θετική αβεβαιότητα

32
Μια περισσότερο δοµηµένη µορφή από την προηγούµενη γράφεται:

k ⎧⎪ F : F T + Fi ≥ 0
∆A = ∑ ∆Ai , όπου ∆Ai = − Di Fi ( I + D0i Fi ) −1 Ei και ⎨ i T i
i =1 ⎪⎩ D0i + D0i > 0

Μπορεί να αποδειχθεί ότι η περιγραφή αυτή είναι ισοδύναµη µε την αβεβαιότητα µε


φραγµένη νόρµα. Το ισοδύναµο µοντέλο αβεβαιότητας µε φραγµένη νόρµα είναι

T T T
A + ∆A = A − D( D0 + D0 ) −1 E + D( D0 + D0 ) −1/ 2 Fd ( D0 + D0 ) −1/ 2 E = Ad + Dd Fd Ed

όπου

T T T
Fd = I − ( D0 + D0 )1/ 2 F ( I + D0 F ) −1 ( D0 + D0 )1/ 2 και Fd Fd ≤ I

και

T T T
Ad = A − D( D0 + D0 ) −1 E , Dd = D( D0 + D0 ) −1/ 2 , Ed = ( D0 + D0 ) −1/ 2 E

Η πραγµατική θετική αβεβαιότητα µπορεί να είναι µια εναλλακτική περιγραφή


λιγότερο συντηρητική από την αβεβαιότητα µε φραγµένη νόρµα. Αυτό προκύπτει από
συγκρίσεις που έχουν µελετηθεί στη βιβλιογραφία.

Πραγµατική φραγµένη αβεβαιότητα: Η περιγραφή αυτή είναι της


µορφής

∆A = DF ( I − D0 F ) −1 E (2.8)

όπου D ∈ R n×r , E ∈ R l×n είναι γνωστοί πίνακες µε χρονικά αµετάβλητα στοιχεία που
προσδιορίζουν τη δοµή της αβεβαιότητας στον πίνακα κατάστασης. Ο πίνακας
αβεβαιότητας F ανήκει στο πεδίο,

F = {F ∈ R r ×l : F T F ≤ I }

T
και ο σταθερός πίνακας D0 ικανοποιεί την ανισότητα I − D0 D0 > 0 . Αυτός ο τύπος
αβεβαιότητας µπορεί να θεωρηθεί ότι επιδρά στο βρόχο ανάδρασης όπως στο
ακόλουθο σχήµα:

33
Σχήµα 2.9 Πραγµατική φραγµένη αβεβαιότητα

Όπως και για την αβεβαιότητα µε φραγµένη νόρµα, µια περισσότερο δοµηµένη
µορφή είναι

⎪⎧ Fi : Fi Fi ≤ I
k T

∆A = ∑ ∆Ai , όπου ∆Ai = Di Fi ( I − D0i Fi ) Ei και ⎨


−1
T
i =1 ⎪⎩ I − D0i D0i > 0

Υπάρχει ακόµη η ισοδυναµία µε την αβεβαιότητα µε φραγµένη νόρµα και αυτή είναι,

T T T T
A + ∆A = A + D( I − D0 D0 ) −1 D0 E + D( I − D0 D0 ) −1/ 2 Fd ( I − D0 D0 ) −1/ 2 E
= Ad + Dd Fd Ed

όπου

T T T T T
Fd = [( I − D0 D0 )1/ 2 F ( I − D0 F ) −1 − ( I − D0 D0 ) −1/ 2 D0 ]( I − D0 D0 )1/ 2 , Fd Fd ≤ I

και

T T T T
Ad = A + D( I − D0 D0 ) −1 D0 E , Dd = D( I − D0 D0 ) −1/ 2 , Ed = ( I − D0 D0 ) −1/ 2 E

Γενικά δεν υπάρχει µοντελοποίηση της αβεβαιότητας που να µην είναι συντηρητική.
Προκειµένου να µειωθεί ο συντηρητισµός της περιγραφής, πρέπει να επιλέγεται η
κατάλληλη περιγραφή για το εκάστοτε θεωρούµενο πρόβληµα.

2.2 Αλγεβρική προσέγγιση του Kharitonov


Η µέθοδος αυτή βασίζεται σε µια γενίκευση του κριτηρίου ευστάθειας των
Routh – Hurwitz στην περίπτωση χαρακτηριστικών πολυωνύµων µε αβέβαιους
συντελεστές που ανήκουν σε γνωστά διαστήµατα. Έστω το δυναµικό σύστηµα µε
περιγραφή κατάστασης κανονικής µορφής φάσης,

34
⎡ 0 1 0 . . . 0 ⎤
⎢ 0 0 1 . . . 0 ⎥⎥

x(t ) = ⎢ . . . . . . . ⎥ x(t ) + Bu (t )
⎢ ⎥
⎢ 0 0 0 . . . 1 ⎥
⎢⎣ − an −an −1 − an − 2 . . . − a1 ⎥⎦

όπου

0 < ai ≤ ai ≤ ai , i = 1,..., n

Οι ρίζες του χαρακτηριστικού πολυωνύµου

p( s ) = s n + a1s n −1 + ... + an

έχουν αρνητικό πραγµατικό µέρος, αν και µόνο αν τα ακόλουθα τέσσερα πολυώνυµα


είναι ευσταθή,

an + an −1s + an − 2 s 2 + an −3 s 3 + an − 4 s 4 + an −5 s 5 + ...

an + an −1s + an − 2 s 2 + an −3 s 3 + an − 4 s 4 + an −5 s 5 + ...

an + an −1s + an − 2 s 2 + an −3 s 3 + an − 4 s 4 + an −5 s 5 + ...

an + an −1s + an − 2 s 2 + an −3 s 3 + an − 4 s 4 + an −5 s 5 + ...

Το αποτέλεσµα αυτό (Yeung and Wang 1987) δίνει µια αναγκαία και ικανή
συνθήκη εύρωστης ευστάθειας. Με την έννοια αυτή, αποτελεί ένα αποτέλεσµα
ανάλυσης. ∆υστυχώς όµως δεν είναι εποικοδοµητικό, επειδή δεν προκύπτουν από
αυτό τεχνικές σύνθεσης εύρωστων ελεγκτών.

2.3 Προσέγγιση H ∞

Οι µέθοδοι υπολογισµού νόµων εύρωστου ελέγχου που θεωρούν µη


παραµετρικές και µη δοµηµένες αβεβαιότητες, εκµεταλλεύονται τις ιδιότητες της
νόρµας H ∞ και αποτελούν τη λεγόµενη προσέγγιση H ∞ . Ένας µεγάλος αριθµός
ερευνητικών εργασιών αναφέρονται σ’ αυτή ήδη από τις αρχές της δεκαετίας του ’80
µε πρώτες αυτές του Zames (1981, 1983), που χρησιµοποιούν την ελαχιστοποίηση
της νόρµας H ∞ της συνάρτησης ευαισθησίας ενός γραµµικού κλειστού συστήµατος.
Με τον τρόπο αυτό επιλύονται προβλήµατα εύρωστης ευστάθειας και απόρριψης
διαταραχών (Francis and Zames 1984). Στη συνέχεια, διατυπώθηκαν και επιλύθηκαν
προβλήµατα εύρωστου ελέγχου τόσο στο πεδίο της συχνότητας (Francis 1987) όσο
και στο πεδίο του χρόνου (Kimura 1984, Doyle et al 1989). Στο θέµα αυτό
αναφέρεται εκτενώς το Κεφάλαιο 9 του παρόντος συγγράµµατος.

35
H προσέγγιση H ∞ βασίζεται κυρίως στο θεώρηµα του µικρού κέρδους. Στόχος
είναι η εύρεση ενός αντισταθµιστή K ( s) που σταθεροποιεί το σύστηµα G ( s) και
ικανοποιεί τη συνθήκη µικρού κέρδους, η οποία εκφράζεται ως η τιµή της νόρµας
H ∞ της µεταφοράς Tzw µεταξύ της εξόδου z και της εξωγενούς εισόδου w .

Το βασικό πρόβληµα διατυπώνεται ως εξής: Να βρεθεί η κλάση των


αντισταθµιστών που εξασφαλίζουν την εσωτερική ευστάθεια του κλειστού
συστήµατος 2.10 και ικανοποιούν τη συνθήκη Tzw ∞ < γ , όπου γ είναι µια δεδοµένη
θετική βαθµωτή ποσότητα.

Το πρόβληµα αυτό είναι υπο – βέλτιστο, επειδή το ζητούµενο δεν είναι να


ελαχιστοποιηθεί η νόρµα H ∞ της µεταφοράς Tzw , αλλά να γίνει µικρότερη από µια
δεδοµένη τιµή γ . Η λύση του χρησιµοποιεί συνήθως την παραµετροποίηση της
κλάσης των αντισταθµιστών και έχει προταθεί από αρκετές µεθόδους. Μεταξύ αυτών
η µέθοδος στο χώρο κατάστασης είναι περισσότερο εφαρµόσιµη από αριθµητική
άποψη, επειδή καταλήγει είτε σε εξισώσεις Riccati (Doyle et al. 1989, Sampei et al
1990), είτε σε γραµµικές ανισότητες πινάκων (Gahinet and Apkarian 1994).

Σχήµα 2.10 Βασικό πρόβληµα

2.4 Τετραγωνική προσέγγιση


Η προσέγγιση αυτή αποτελεί επέκταση της άµεσης µεθόδου Lyapunov στα
αβέβαια συστήµατα. Οι συναρτήσεις Lyapunov που χρησιµοποιούνται είναι και πάλι
τετραγωνικές µορφές. Η τετραγωνική προσέγγιση έχει το µειονέκτηµα ότι οι
συνθήκες που λαµβάνονται για την εύρωστη ευστάθεια των αβέβαιων συστηµάτων
είναι µόνο ικανές, εφόσον απαιτείται µία και µόνη συνάρτηση Lyapunov που να
εξετάζει την ευστάθεια κάθε περιγραφής του συστήµατος στο πεδίο αβεβαιότητας.
Έχει όµως το πλεονέκτηµα ότι οι συνθήκες αυτές επαληθεύονται εύκολα, από
αριθµητική άποψη, καθόσον εκφράζονται µε τη µορφή αλγεβρικών εξισώσεων

36
Riccati ή µε τη µορφή γραµµικών ανισοτήτων πινάκων, για τις οποίες είναι
διαθέσιµοι αλγόριθµοι και λογισµικά επίλυσης ιδιαίτερα αποτελεσµατικοί. Επιπλέον,
οι συνθήκες εύρωστης ευστάθειας που λαµβάνονται είναι εποικοδοµητικές δηλαδή
οδηγούν άµεσα στη σύνθεση εύρωστων νόµων ελέγχου, που βασίζονται στις εν λόγω
συναρτήσεις Lyapunov.

2.4.1 Τετραγωνική ευστάθεια

Η έννοια της τετραγωνικής ευστάθειας εισήχθη από τον Barmish (1985)


προκειµένου να διατυπωθεί το πρόβληµα της σταθεροποιησιµότητας ενός αβέβαιου
συστήµατος της µορφής

x(t ) = A(r (t )) x(t ) + B ( p (t ))u (t ) , x ∈ R n , u ∈ R m (2.9)

όπου r (t ) ∈ℜ ⊂ R k και p(t ) ∈ ℑ ⊂ R l , είναι διανύσµατα αβέβαιων παραµέτρων που


ανήκουν σε συµπαγή σύνολα ℜ και ℑ .

Ορισµός 2.1 (Barmish 1985)


Το σύστηµα (2.9) λέγεται τετραγωνικά σταθεροποιήσιµο αν υπάρχει ένας συνεχής
νόµος ελέγχου u ( x) από το R n → R m , µε u (0) = 0 , ένας συµµετρικός θετικά
ορισµένος πίνακας P και µια πραγµατική σταθερά θ > 0 έτσι ώστε να ικανοποιείται
η συνθήκη,

2
L( x, t ) = xT (t )[ AT (r (t )) P + PA(r (t ))]x(t ) + 2 xT (t ) PB( p(t ))u ( x) ≤ −θ x (2.10)

για όλα τα ζεύγη ( x, t ) ∈ R n +1 .

Αν ικανοποιείται η (2.10), τότε η συνάρτηση V ( x, t ) = xT (t ) Px(t ) , που έχει ως


παράγωγο την L( x, t ) , είναι µια συνάρτηση Lyapunov του κλειστού συστήµατος.
Άρα το σηµείο ισορροπίας x = 0 είναι ασυµπτωτικά ευσταθές. Το ακόλουθο
θεώρηµα δίνει µια αναγκαία και ικανή συνθήκη για την τετραγωνική
σταθεροποιησιµότητα, αλλά µόνο ικανή για τη σταθεροποιησιµότητα µε την κλασική
έννοια.

Θεώρηµα 2.1 (Barmish 1985)


Το αβέβαιο σύστηµα (2.9) είναι τετραγωνικά σταθεροποιήσιµο, αν και µόνον αν
υπάρχει ένας συµµετρικός και θετικά ορισµένος πίνακας P τέτοιος ώστε,

xT (t )[ A(r (t )) P + PAT (r (t ))]x(t ) < 0

∀r (t ) ∈ℜ και ∀x ≠ 0 ∈ R n : BT x = 0 , όπου B είναι οποιοσδήποτε πίνακας που


ανήκει στο κυρτό σύνολο B( p (t )) .

Το παραπάνω θεώρηµα δε δίνει καµία πληροφορία σχετικά µε το πώς να


κατασκευαστεί η συνάρτηση Lyapunov που αναζητείται. Το θέµα αυτό µελετάται
εκτενώς στα επόµενα κεφάλαια.

37
Κάποιες ερευνητικές εργασίες αναφέρονται σε επιµέρους περιπτώσεις
συστηµάτων, των οποίων επιδιώκεται η τετραγωνική ευστάθεια, όπως τα συστήµατα
µε γραµµική παραµετρική αβεβαιότητα (Petersen and Hollot 1986, Schmitendorf
1988) ή αβεβαιότητα µε φραγµένη νόρµα που επιδρά αποκλειστικά στον πίνακα
κατάστασης, οπότε είναι δυνατόν να εξαχθεί µια αναγκαία και ικανή συνθήκη
(Petersen 1987). Αυξάνοντας την τάξη του συστήµατος µε την ενσωµάτωση του
δυναµικού ελεγκτή, είναι δυνατόν να συµπεριληφθεί όλη η αβεβαιότητα στον πίνακα
κατάστασης. Η τετραγωνική ευστάθεια για αυτή την κλάση συστηµάτων µελετήθηκε
τόσο για συνεχή (Zhou and Khargonekar 1988) όσο και για διακριτό χρόνο (Garcia et
al. 1994). Η περίπτωση της πολυτοπικής αβεβαιότητας αντιµετωπίστηκε στην
εργασία (Bernussou et al. 1989), όπου δίνονται συνθήκες τετραγωνικής ευστάθειας
µε τη χρήση µιας κυρτής παραµετροποίησης του συνόλου των κερδών που
σταθεροποιούν το σύστηµα. Η κυρτότητα επιτρέπει την αναγωγή των συνθηκών
τετραγωνικής ευστάθειας σ’ ένα πρόβληµα βελτιστοποίησης για τον προσδιορισµό
κατάλληλων νόµων ελέγχου µε ανάδραση κατάστασης.

Όλες οι προηγούµενες µέθοδοι προϋποθέτουν τη γνώση του διανύσµατος


κατάστασης. Σε περίπτωση που αυτό δεν είναι πλήρως µετρήσιµο, χρησιµοποιείται
ανάδραση εξόδου. Η περίπτωση αυτή µελετήθηκε σε πρόσφατες µεθόδους τόσο για
πολυτοπικές αβεβαιότητες όσο και για αβεβαιότητες µε φραγµένη νόρµα και οδήγησε
σε ένα αποτέλεσµα ανάλογο µε αυτό της προσέγγισης H ∞ (Garcia et al. 1996).

Οι µέθοδοι που παρουσιάζονται στη συνέχεια του κεφαλαίου αυτού αφορούν


στην περίπτωση του ελέγχου µε ανάδραση κατάστασης.

2.4.2 Τετραγωνική ευστάθεια και γραµµικές ανισότητες πινάκων (LMI)

Πολυτοπική αβεβαιότητα

Έστω το αβέβαιο σύστηµα,

x(t ) = Ax(t ) + Bu (t ) (2.11)

όπου x(t ) ∈ R n , u (t ) ∈ R m και η αβεβαιότητα είναι πολυτοπικού τύπου A ∈ DA και


B ∈ DB , µε

k k
DA = { A ∈ R n×n , A = ∑ Ai ai , ai ≥ 0 , ∑a i = 1}
i =1 i =1

l l
DB = {B ∈ R n×m , B = ∑ Bi β i , β i ≥ 0 , ∑β i = 1}
i =1 i =1

Το παρακάτω θεώρηµα δίνει τη συνθήκη τετραγωνικής ευστάθειας για ένα αβέβαιο


σύστηµα µε αβεβαιότητες πολυτοπικού τύπου στον πίνακα κατάστασης και στον
πίνακα εισόδου.

38
Θεώρηµα 2.2 (Bernussou et al. 1989)
Το σύστηµα (2.11) είναι τετραγωνικά σταθεροποιήσιµο µε γραµµική ανάδραση
κατάστασης, αν και µόνον αν υπάρχουν δύο πίνακες S = S T > 0 ∈ R n×n και R ∈ R m×n ,
τέτοιοι ώστε,

T ⎧i = 1, 2,..., k
Ai S + SAi + B j R + RT B j < 0 ⎨
⎩ j = 1, 2,..., l

Ο νόµος ελέγχου που σταθεροποιεί το σύστηµα είναι τότε,

u (t ) = RS −1 x(t )

Αβεβαιότητα µε φραγµένη νόρµα

• Αβεβαιότητα στον πίνακα κατάστασης

Έστω το αβέβαιο σύστηµα,

x(t ) = ( A + DFE ) x(t ) + Bu (t ) , FT F ≤ I (2.12)

Θεώρηµα 2.3 (Petersen 1987)


Το σύστηµα (2.12) είναι τετραγωνικά σταθεροποιήσιµο µε γραµµική ανάδραση
κατάστασης, αν και µόνον αν υπάρχουν δύο πίνακες S = S T > 0 ∈ R n×n και R ∈ R m×n ,
τέτοιοι ώστε,

⎛ AS + SAT + BR + RT BT + DDT SE T ⎞
⎜ ⎟<0
⎝ ES −I ⎠

Ο νόµος ελέγχου που σταθεροποιεί το σύστηµα είναι τότε,

u (t ) = RS −1 x(t )

• Αβεβαιότητα στους πίνακες κατάστασης και εισόδου

Έστω το αβέβαιο σύστηµα,

x(t ) = ( A + ∆A) x(t ) + ( B + ∆B)u (t ) (2.13)

όπου

(∆A ∆B) = DF ( E1 E2 ) , FT F ≤ I

Θεώρηµα 2.4 (Petersen 1987)


Το σύστηµα (2.13) είναι τετραγωνικά σταθεροποιήσιµο µε γραµµική ανάδραση
κατάστασης, αν και µόνον αν υπάρχουν δύο πίνακες S = S T > 0 ∈ R n×n και R ∈ R m×n ,
τέτοιοι ώστε,

39
⎛ AS + SAT + BR + RT BT + DDT SE1 + RT E2 ⎞
T T

⎜ ⎟<0
⎝ E1S + E2 R −I ⎠

Ο νόµος ελέγχου που σταθεροποιεί το σύστηµα είναι τότε,

u (t ) = RS −1 x(t )

2.4.3 Τετραγωνική ευστάθεια και εξισώσεις Riccati

Η τετραγωνική ευστάθεια αβέβαιων συστηµάτων που εξασφαλίζεται µε


νόµους ελέγχου, οι οποίοι απορρέουν από την επίλυση εξισώσεων Riccati, αφορά τις
περιπτώσεις όπου είναι διαθέσιµο ένα µοντέλο του ονοµαστικού συστήµατος. Έτσι,
αποκλείονται περιπτώσεις όπως των συστηµάτων µε πολυτοπική αβεβαιότητα. Η
παράγραφος αυτή αναφέρεται εκτενώς σε συστήµατα µε αβεβαιότητα µε φραγµένη
νόρµα. Τα αποτελέσµατα που παρουσιάζονται στη συνέχεια µπορούν εύκολα να
επεκταθούν και σε συστήµατα µε γραµµική αβεβαιότητα.

Το ακόλουθο θεώρηµα δίνει µια αναγκαία και ικανή συνθήκη τετραγωνικής


σταθεροποιησιµότητας για συστήµατα µε αβεβαιότητα µε φραγµένη νόρµα της
περίπτωσης όπου µόνο ο πίνακας κατάστασης είναι αβέβαιος.

Θεώρηµα 2.5 (Petersen 1987)


Το αβέβαιο σύστηµα (2.12) είναι τετραγωνικά σταθεροποιήσιµο µε γραµµική
ανάδραση κατάστασης, αν και µόνον αν ∀Q και R , συµµετρικούς και θετικά
ορισµένους πίνακες, υπάρχει µία βαθµωτή ποσότητα µ > 0 τέτοια ώστε η εξίσωση
Riccati

1
AT P + PA − PBR −1 BT P + µ PDT DP + ET E + Q = 0 (2.14)
µ

έχει µία συµµετρική και θετικά ορισµένη λύση P . Στην περίπτωση αυτή ο νόµος
ελέγχου που σταθεροποιεί το σύστηµα είναι

u (t ) = − R −1 BT Px(t )

Στο θεώρηµα αυτό έχει σηµασία το γεγονός ότι η λύση της εξίσωσης Riccati (2.14)
είναι ανεξάρτητη από την επιλογή των πινάκων Q και R . Η επίλυση της (2.14)
βασίζεται στην ιδιότητα ότι, αν υπάρχει ένα βαθµωτό µ * για το οποίο αυτή έχει
λύση, τότε για κάθε πραγµατικό αριθµό στο διάστηµα (0, µ * ] , η (2.14) έχει µια
συµµετρική θετικά ορισµένη λύση. Έτσι, ο υπολογισµός της λύσης µπορεί να γίνει µε
τον παρακάτω αλγόριθµο ο οποίος αποτελεί και µια δοκιµή τετραγωνικής
σταθεροποιησιµότητας του συστήµατος (2.12).

40
Αλγόριθµος

Βήµα 1: Επιλέγονται δύο συµµετρικοί και θετικά ορισµένοι πίνακες Q και R


καταλλήλων διαστάσεων καθώς και µία αρχική τιµή του µ , για παράδειγµα,
Q = I , R = I και µ > 0 .

Βήµα 2: Εξετάζεται αν η εξίσωση Riccati (2.14) έχει µια συµµετρική θετικά


ορισµένη λύση. Αυτό µπορεί να γίνει εφαρµόζοντας κλασικούς αλγορίθµους
επίλυσης εξισώσεων Riccati. Αν υπάρχει λύση, τότε το αβέβαιο σύστηµα
(2.12) είναι τετραγωνικά σταθεροποιήσιµο µε τη γραµµική ανάδραση
κατάστασης u (t ) = − R −1 BT Px(t ) . Αν όχι, εφαρµόζεται το επόµενο βήµα.

Βήµα 3: Αντικαθίσταται το µ από το µ / 2 και επαναλαµβάνεται ο


αλγόριθµος. Η διαδικασία σταµατά όταν βρεθεί λύση ή όταν το µ γίνει
µικρότερο από την επιθυµητή ακρίβεια. Στην τελευταία περίπτωση το
σύστηµα δεν είναι τετραγωνικά σταθεροποιήσιµο.

Πρέπει να σηµειωθεί ότι η παραπάνω µέθοδος δοκιµής και σφάλµατος δεν αποτελεί
συστηµατικό τρόπο επίλυσης της (2.14). Εξισώσεις Riccati µε πρόσθετους όρους της
µορφής αυτής είναι γνωστές ως τροποποιηµένες ή γενικευµένες εξισώσεις Riccati. Στα
επόµενα κεφάλαια θα περιγραφούν συστηµατικοί τρόποι επίλυσής τους µε τη χρήση
LMI.

Στην περίπτωση που τόσο ο πίνακας κατάστασης όσο και ο πίνακας εισόδου
είναι αβέβαιοι, είναι δυνατόν να θεωρηθεί το µοντέλο αυξηµένης διάστασης (Zhou
and Khargonekar 1988), οπότε όλη η αβεβαιότητα ενσωµατώνεται στον πίνακα
κατάστασης και µεταπίπτει στην προηγούµενη περίπτωση. Είναι όµως επίσης
δυνατόν να εφαρµοστεί µια άµεση προσέγγιση θεωρώντας και τους δύο πίνακες
αβέβαιους. Μια αναγκαία και ικανή συνθήκη δίνεται από το ακόλουθο θεώρηµα.

Θεώρηµα 2.6 (Khargonekar et al. 1990)


Το αβέβαιο σύστηµα (2.13) είναι τετραγωνικά σταθεροποιήσιµο µε γραµµική
ανάδραση κατάστασης, αν και µόνον αν ∀Q και R , συµµετρικούς και θετικά
ορισµένους πίνακες, υπάρχει µία βαθµωτή ποσότητα µ > 0 τέτοια ώστε η εξίσωση
Riccati

1 1
AT P + PA − PBR −1 BT P + µ PDT DP +
T T
E1 ( I − E2 R −1 E2 ) E1 + Q = 0 (2.15)
µ µ

όπου

1 T 1 T
A = A− BR −1 E2 E1 και R = R + E2 E1
µ µ

έχει µία συµµετρική και θετικά ορισµένη λύση P . Στην περίπτωση αυτή ο νόµος
ελέγχου που σταθεροποιεί το σύστηµα είναι

41
1 T
u (t ) = − R −1 ( BT P + E2 E1 ) x(t )
µ

Η απόδειξη του θεωρήµατος αυτού συνίσταται στο να δειχθεί ότι η V ( x) = xT (t ) Px(t )


είναι µια συνάρτηση Lyapunov για το κλειστό αβέβαιο σύστηµα που λαµβάνεται µε
τον παραπάνω νόµο ελέγχου ανάδρασης κατάστασης.

2.4.4 Τετραγωνική ευστάθεια και προσέγγιση H ∞

Στη συνέχεια αποδεικνύεται ότι η ύπαρξη µιας συνάρτησης Lyapunov για το


αβέβαιο σύστηµα

x(t ) = ( A + DFE ) x(t ) , FT F ≤ I (2.16)

είναι ισοδύναµη µε µία συνθήκη µικρού κέρδους.

Θεώρηµα 2.7 (Khargonekar et al. 1990)


Το σύστηµα (2.16) είναι τετραγωνικά ευσταθές, αν και µόνον αν ικανοποιούνται οι
ακόλουθες συνθήκες:

• ο πίνακας A είναι ευσταθής

• E ( sI − A) −1 D <1

Επειδή η τετραγωνική σταθεροποιησιµότητα όλων των περιγραφών του αβέβαιου


συστήµατος (2.16) συνδέεται µε την ύπαρξη µιας και µόνο συνάρτησης Lyapunov,
έχουµε το εξής πόρισµα:

Πόρισµα 2.1
Για το σύστηµα (2.16) υπάρχει µία τετραγωνική συνάρτηση Lyapunov
V ( x) = xT (t ) Px(t ) τέτοια ώστε,

( A + DFE )T P + P( A + DFE ) < 0 ∀F T F ≤ I

αν και µόνον αν ικανοποιούνται οι συνθήκες του θεωρήµατος 2.7.

Μια συνέπεια των παραπάνω αποτελεσµάτων είναι ότι η εφαρµογή του


θεωρήµατος του µικρού κέρδους στο κλειστό σύστηµα µε συνάρτηση µεταφοράς
ανοικτού βρόχου E ( sI − A) −1 D και κέρδος ανάδρασης F , µπορεί να ερµηνευθεί ως
µία αναγκαία και ικανή συνθήκη τετραγωνικής σταθεροποιησιµότητας του
συστήµατος (2.16). Επιπλέον, το πρόβληµα της εύρεσης ενός νόµου ελέγχου που
εξασφαλίζει την τετραγωνική ευστάθεια του αβέβαιου συστήµατος

x(t ) = ( A + DFE ) x(t ) + Bu (t ) , FT F ≤ I (2.17)

42
είναι ισοδύναµο µε το ακόλουθο πρόβληµα H ∞ :

Ζητείται να βρεθεί ένας νόµος ελέγχου που να εξασφαλίζει την εσωτερική ευστάθεια
του συστήµατος

x(t ) = Ax(t ) + Dw(t ) + Bu (t )


z (t ) = Ex(t )

και να ικανοποιεί τη συνθήκη

Tzw ∞
<1

Με το αποτέλεσµα αυτό εγκαθιδρύεται µια σχέση ανάµεσα στην προσέγγιση


εύρωστου ελέγχου µε τετραγωνική ευστάθεια, που εκφράζεται στο πεδίο του χρόνου
και στην προσέγγιση H ∞ , που εκφράζεται στο πεδίο της συχνότητας. Έτσι, πολλά
προβλήµατα εύρωστου ελέγχου µε τετραγωνική ευστάθεια µπορούν να
αντιµετωπιστούν ως ειδικές περιπτώσεις προβληµάτων σύνθεσης H ∞ . Η επίλυσή
τους προκύπτει από τις ίδιες εξισώσεις Riccati.

2.5 Συµπεράσµατα
Στο κεφάλαιο αυτό παρουσιάστηκαν διαφορετικές µαθηµατικές περιγραφές
της αβεβαιότητας που χρησιµοποιούνται συχνά στις µεθόδους εύρωστης ανάλυσης
και σύνθεσης. Μελετήθηκε επίσης η ευστάθεια συστηµάτων µε αβεβαιότητες µε
ιδιαίτερη έµφαση στο πρόβληµα της τετραγωνικής ευστάθειας. Η επίλυση του
τελευταίου γίνεται τόσο µε γενικευµένες εξισώσεις Riccati όσο και µε γραµµικές
ανισότητες πινάκων.

Στα επόµενα κεφάλαια θα µελετηθούν µέθοδοι εύρωστου ελέγχου για


συγκεκριµένες περιγραφές αβεβαιότητας και µε συγκεκριµένες προδιαγραφές
ελέγχου. Ειδικότερα θα εφαρµοστούν νόµοι ελέγχου µε ανάδραση κατάστασης
προκειµένου να επιτευχθεί:

• η τετραγωνική ευστάθεια του κλειστού συστήµατος

• ένα ορισµένο επίπεδο συµπεριφοράς που εκφράζεται από ένα δείκτη


επιδόσεων

43
Κεφάλαιο 3

Μέθοδοι LQG εγγυηµένου κόστους

Ο εύρωστος έλεγχος των γραµµικών αβέβαιων συστηµάτων µε τετραγωνικό


δείκτη συµπεριφοράς µελετάται τις περισσότερες φορές στο πλαίσιο του ελέγχου
εγγυηµένου κόστους (Chang and Peng 1972, Kosmidou and Bertrand 1987, Bernstein
and Haddad 1990). Στη µέθοδο αυτή σχεδιάζονται γραµµικοί ελεγκτές σταθερού
κέρδους, έτσι ώστε να εξασφαλίζεται η ασυµπτωτική ευστάθεια του κλειστού
συστήµατος καθώς και ένα επιθυµητό επίπεδο επιδόσεων, για όλες τις αβεβαιότητες
µιας ορισµένης κλάσης. Η ύπαρξη ελεγκτών εγγυηµένου κόστους σχετίζεται µε την
επίλυση γενικευµένων εξισώσεων Riccati δηλαδή εξισώσεων Riccati µε πρόσθετους
όρους που περιγράφουν την επίδραση των αβεβαιοτήτων στη σχεδίαση του κλειστού
συστήµατος. Οι διάφορες µορφές γενικευµένων εξισώσεων Riccati προκύπτουν
ανάλογα µε τις επί µέρους περιγραφές των αβεβαιοτήτων, καθώς και µε την επιλογή
ειδικών µορφών συναρτήσεων φραγµάτων που θα περιγραφούν στη συνέχεια.
Επιπλέον, οι γενικευµένες εξισώσεις Riccati µπορούν να είναι διαφορικές ή
αλγεβρικές, εφόσον ο θεωρούµενος χρονικός ορίζοντας είναι πεπερασµένου ή
απείρου χρόνου, αντίστοιχα. Στο κεφάλαιο αυτό παρουσιάζονται θεωρητικά και
υπολογιστικά προβλήµατα που ανακύπτουν κατά τον εύρωστο έλεγχο εγγυηµένου
κόστους και τεχνικές επίλυσής τους.

3.1 ∆ιατύπωση του προβλήµατος και βασικές έννοιες

Θεωρούµε το γραµµικό αβέβαιο σύστηµα,

x(t ) = ( A + ∆ A) x(t ) + ( B + ∆ B)u (t ) , t ∈ [0, ∞)


x(0) = x0 (3.1)

όπου x(t ) ∈ R n είναι το διάνυσµα κατάστασης, u (t ) ∈ R m είναι το διάνυσµα ελέγχου,


A ∈ R n×n και B ∈ R n×m είναι οι πίνακες κατάστασης και ελέγχου, αντίστοιχα. Οι
αβεβαιότητες του συστήµατος περιγράφονται µε τη µορφή γραµµικών συναρτήσεων,

44
k
∆ A = ∑ Ai ri (3.2)
i =1
l
∆ B = ∑ Bi pi
i =1 (3.3)

όπου Ai , i = 1, 2,..., k και Bi , i = 1, 2,..., l είναι σταθεροί πίνακες κατάλληλων


διαστάσεων και ri , pi είναι βαθµωτές αβέβαιες παράµετροι που µπορούν να είναι και
χρονικά µεταβαλλόµενες. Με αυτές ορίζονται διανύσµατα αβέβαιων παραµέτρων,
που υποθέτουµε ότι ανήκουν σε γνωστά και φραγµένα σύνολα, ως εξής,

ℜ := {r ∈ R k : ri ≤ r , i = 1, 2,..., k}; r > 0 (3.4)

ℑ := { p ∈ R l : pi ≤ p, i = 1, 2,..., l}; p > 0 . (3.5)

Λόγω της γραµµικότητας, η περιγραφή (3.2), (3.3) µπορεί να


κανονικοποιηθεί, έτσι ώστε να ισχύει r = p = 1 , χωρίς να µειώνεται η γενικότητα του
προβλήµατος.

Για το παραπάνω σύστηµα τίθεται το εξής πρόβληµα: Ζητείται να βρεθεί ένας


γραµµικός νόµος ελέγχου µε ανάδραση κατάστασης σταθερού κέρδους, έτσι ώστε το
κλειστό σύστηµα να διατηρεί την ασυµπτωτική ευστάθεια και ένα επιθυµητό επίπεδο
επιδόσεων, για κάθε αποδεκτή αβεβαιότητα, δηλαδή που ικανοποιεί τις (3.2)-(3.5). Ο
παρακάτω ορισµός επεκτείνει την έννοια της ασυµπτωτικής ευστάθειας στην κλάση
των αβέβαιων συστηµάτων. Ο ορισµός της τετραγωνικής ευστάθειας που δόθηκε στο
προηγούµενο κεφάλαιο επαναδιατυπώνεται στη συνέχεια για το αβέβαιο σύστηµα της
µορφής 3.1.

Ορισµός 3.1 (Barmish 1985)


Το αβέβαιο σύστηµα (3.1) είναι τετραγωνικά σταθεροποιήσιµο, αν υπάρχει ένας νόµος
ελέγχου ανάδρασης u (.) : R n → R m µε u (0) = 0 , ένας n × n θετικά ορισµένος
συµµετρικός πίνακας P και µια σταθερά θ > 0 , έτσι ώστε να ικανοποιείται η
ακόλουθη συνθήκη: για δεδοµένες αποδεκτές αβεβαιότητες και συνάρτηση
Lyapunov

V ( x, t ) = xT (t ) Px(t ) , (3.6)

η παράγωγος Lyapunov V ( x, t ) που αντιστοιχεί στο κλειστό σύστηµα ικανοποιεί την
ανισότητα,


2
V ( x, t ) ≤ −θ x (3.7)

για κάθε µη µηδενικό x(t ) ∈ R n και κάθε t ∈ [0, ∞) . Το κλειστό σύστηµα που
προκύπτει είναι ασυµπτωτικά ευσταθές, για όλες τις αποδεκτές αβεβαιότητες.

Ας θεωρήσουµε τώρα τις επιδόσεις του συστήµατος που περιγράφονται από


την τετραγωνική συνάρτηση κόστους ή δείκτη επιδόσεων,

45

J ( x0 , ∆Α, ∆ B, t ) = ∫ [ xT (t )Qx(t ) + u T (t ) Ru (t )]dt , (3.8)
0

Q ≥ 0, R > 0 , η οποία πρέπει να ελαχιστοποιηθεί για µια κατάλληλη είσοδο ελέγχου.


Επιπλέον, υποθέτουµε ότι το ζεύγος ( A, B ) είναι ελέγξιµο και το ζεύγος (Q1/ 2 , A)
είναι παρατηρήσιµο. Υποθέτουµε ακόµη ότι το πλήρες διάνυσµα κατάστασης x(t )
είναι µετρήσιµο.

Όταν δεν υπάρχουν αβεβαιότητες, η ελαχιστοποίηση της (3.8) µε τις


προϋποθέσεις ελεγξιµότητας, παρατηρησιµότητας και θετικότητας που
προαναφέρθηκαν, ανάγεται στο πρόβληµα του βέλτιστου γραµµικού τετραγωνικού
ρυθµιστή (linear quadratic regulator LQR). Εφόσον όµως οι αβεβαιότητες πρέπει να
ληφθούν υπόψη, η συµπεριφορά του κλειστού συστήµατος θα θεωρηθεί στο πλαίσιο
του ελέγχου εγγυηµένου κόστους (guaranteed cost control GCC).

Ορισµός 3.2 (Chang and Peng 1972, Kosmidou et al. 1991)


Για το σύστηµα (3.1) µε τετραγωνικό κριτήριο κόστους (3.8) ένας νόµος ελέγχου
u (t ) : R n → R m , t ∈ [0, ∞) είναι ένας νόµος ελέγχου εγγυηµένου κόστους, αν υπάρχει
ένας θετικός αριθµός J , που λέγεται εγγυηµένο κόστος, τέτοιος ώστε

J ( x0 , u, ∆A, ∆B, t ) ≤ J , (3.9)

για όλες τις αποδεκτές αβεβαιότητες.

Η φυσική σηµασία του παραπάνω ορισµού είναι ότι η υποβάθµιση των


επιδόσεων του συστήµατος που οφείλεται στις αβεβαιότητες είναι εγγυηµένα
µικρότερη από το άνω φράγµα της (3.9). Το ακόλουθο θεώρηµα δίνει µια ικανή
συνθήκη για GCC.

Θεώρηµα 3.3 (Chang and Peng 1972, Kosmidou et al. 1991).


Έστω το σύστηµα (3.1) και το αντίστοιχο τετραγωνικό κριτήριο (3.8). Ο γραµµικός
νόµος ελέγχου ανάδρασης κατάστασης

u (t ) = Kx(t ) = − R −1 BT Px(t ) (3.10)

είναι ένας νόµος ελέγχου εγγυηµένου κόστους και

T
J ( x0 ) = x0 Px0 (3.11)

είναι ένα εγγυηµένο κόστος, αν υπάρχει ένας θετικά ορισµένος συµµετρικός πίνακας
P που ικανοποιεί τη γενικευµένη αλγεβρική εξίσωση Riccati (generalized algebraic
Riccati equation GARE),

PA + AT P − PBR −1 BT P + Q + A ( P ) = 0 (3.12)

46
όπου A ( P) είναι µια συνάρτηση άνω φράγµατος που εξαρτάται από τις αβεβαιότητες
και που ικανοποιεί τη σχέση,

2 xT (t ) P∆Ax(t ) + 2 xT (t ) P∆BKx(t ) ≤ xT (t )A ( P) x(t ) (3.13)

για κάθε x(t ) ∈ R n , t ∈ [0, ∞) και για όλες τις αποδεκτές αβεβαιότητες. Επιπλέον, το
κλειστό σύστηµα είναι τετραγωνικά ευσταθές.

Απόδειξη: Έστω η συνάρτηση Lyapunov (3.6) για το κλειστό σύστηµα µε νόµο


ελέγχου (3.10). Παραγωγίζοντας και τα δύο µέλη της παίρνουµε

V ( x, t ) = xT (t )[2 PA + 2 P∆A + 2 PBK + 2 P∆BK ]x(t )

Από τις (3.12), (3.13) προκύπτει ότι

V ( x, t ) ≤ − xT (t )Qx(t ) − u T (t ) Ru (t )

Από τον ορισµό (3.1) προκύπτει ότι το κλειστό σύστηµα είναι τετραγωνικά ευσταθές,
θεωρώντας θ = λmin (Q + K T RK ) και εποµένως x(t ) → 0, όταν t → ∞ .
Ολοκληρώνοντας και τα δύο µέλη της παραπάνω ανισότητας, προκύπτει

V ( x(∞)) − V ( x(0)) ≤ − J ( x0 , u, ∆A, ∆B, t )

και λόγω της τετραγωνικής ευστάθειας είναι

T
J ( x0 , u , ∆A, ∆B, t ) ≤ x0 Px0

Προκειµένου να αποφευχθεί η εξάρτηση της συνάρτησης κόστους από τις


αρχικές συνθήκες, µπορεί να υποτεθεί ότι αυτές είναι οµοιόµορφα κατανεµηµένες
στην επιφάνεια σφαίρας µοναδιαίας ακτίνας και άρα θεωρούνται ως τυχαίες
µεταβλητές µε µηδενική µέση τιµή, Ε[ x(0)] = 0 και µοναδιαία συσχέτιση,
Ε[ x(0) xT (0)] = I . Τότε, θεωρώντας και την προσδοκία της συνάρτησης κόστους
(3.8), το εγγυηµένο κόστος γίνεται J = tr ( P) .

Για διαφορετικές συναρτήσεις A( P) , λαµβάνονται ειδικές µορφές της (12).


Γενικά, η επιλογή της A( P) εξαρτάται από τη φύση των αβεβαιοτήτων ∆A , ∆B
καθώς και πόσο «σφιχτό» θέλουµε να είναι το άνω φράγµα του αριστερού µέλους της
(13). Επίσης, συνήθως επιδιώκεται ένας συµβιβασµός µεταξύ της πολυπλοκότητας
της A( P) και των αναλυτικών ιδιοτήτων της. Στη συνέχεια θα µελετηθούν διάφορες
δυνατές επιλογές της A( P) και των αντίστοιχων GARE.

47
3.2 Συστήµατα µε αβεβαιότητα µόνο στον πίνακα κατάστασης

Ας θεωρήσουµε την περίπτωση κατά την οποία µόνο ο πίνακας κατάστασης


του συστήµατος (3.1) είναι αβέβαιος, δηλαδή ∆A ≠ 0 , ∆B = 0 . Τότε, το άνω φράγµα
A ( P) πρέπει να ικανοποιεί τη σχέση

P∆A + ∆AT P ≤ A ( P) (3.14)

µε την έννοια τετραγωνικής µορφής. Θα παρουσιάσουµε δύο διαφορετικές επιλογές


συναρτήσεων άνω φραγµάτων:

3.2.1 Φράγµα µε βάση ιδιοτιµές

Εφόσον ο πίνακας

k
P∆A + ∆AT P = ∑ ri [ PAi + AiT P] (3.15)
i =0

είναι συµµετρικός, υπάρχουν πάντοτε ορθογώνιοι πίνακες µετασχηµατισµού M i


τέτοιοι ώστε,

T T
M i [ PAi + Ai P ]M i = Λ i (3.16)

όπου Λi είναι διαγώνιοι πίνακες. Έστω Λi οι πίνακες που προκύπτουν, αν όλα τα


διαγώνια στοιχεία των Λi αντικατασταθούν από τις απόλυτες τιµές τους.
Υπενθυµίζεται ότι µπορεί να υποτεθεί ότι ri ≤ 1, i = 1,..., k . Άρα, µια συνάρτηση άνω
φράγµατος της (3.15) είναι η εξής:

k
A( P) = ∑ M i Λi M i .
T
(3.17)
i =1

Προφανώς, η A ( P) εξαρτάται έµµεσα από το P κατά µη γραµµικό τρόπο, δια µέσου


των πινάκων M i και Λ i . Στην εργασία (Chang and Peng 1972), όπου και προτάθηκε
η µορφή αυτή, γενικευµένες αλγεβρικές εξισώσεις Riccati (GARE) µε A ( P) της
µορφής (3.17) λύνονται επαναληπτικά µέχρις ότου επιτευχθεί µια λύση µόνιµης
κατάστασης, ξεκινώντας από µια κατάλληλη αρχική συνθήκη. Μια άλλη πιο
αποτελεσµατική τεχνική επίλυσης προτάθηκε στην εργασία (Vinkler and Wood
1979). Και στις δύο αυτές µεθόδους δεν υπάρχει απόδειξη σύγκλισης ούτε και
συνθήκη ύπαρξης θετικά ορισµένης λύσης P .

3.2.2 Γραµµικό φράγµα

Εφόσον το αριστερό µέλος της (3.14) είναι γραµµική συνάρτηση του P ,


αναζητείται µια συνάρτηση άνω φράγµατος A ( P) που να είναι κι αυτή γραµµική. Η

48
χρήση γραµµικών συναρτήσεων φραγµάτων έχει ιδιαίτερο ενδιαφέρον διότι στις
περιπτώσεις αυτές υπάρχουν αναλυτικές λύσεις των GARE και µπορούν να
υπολογιστούν µε τη χρήση επαναληπτικών αλγορίθµων (Kosmidou and Bertrand
1987, Kosmidou 1987). Ακόµη, έχει αποδειχθεί (Gilman and Rhodes 1976) ότι ένας
νόµος ελέγχου της µορφής (3.10) δίνει το ελάχιστο άνω φράγµα της (3.8), δηλαδή το
ελάχιστο εγγυηµένο κόστος, µεταξύ όλων των νόµων ελέγχου από ένα κυρτό σύνολο.

Μια συνάρτηση φράγµατος, γραµµική ως προς P , µπορεί να ληφθεί


χρησιµοποιώντας την ανισότητα,

hT y + yT h ≤ hT Γh + yT Γ −1 y (3.18)

η οποία ισχύει για κάθε h, y ∈ R n , Γ ≥ 0,∈ R n×n . Αποδεικνύεται ότι η ανισότητα

k
P∆A + ∆AT P ≤ kPΓP + ∑ Ai Γ −1 Ai
T
(3.19)
i =1

ισχύει, µε την έννοια τετραγωνικής µορφής. Ο θετικά ορισµένος πίνακας Γ πρέπει να


επιλεγεί έτσι ώστε (i) η A ( P) να είναι γραµµική ως προς P και (ii) να µηδενίζεται
όταν µηδενίζονται οι αβεβαιότητες. Μια λογική επιλογή είναι Γ = ε P −1 όπου ε είναι
µια θετική παράµετρος, που µπορεί να επιλεγεί, ώστε να ικανοποιεί περαιτέρω
προδιαγραφές σχεδίασης. Έτσι, λαµβάνεται η ακόλουθη συνάρτηση φράγµατος
(Kosmidou and Bertrand 1987):

k
A ( P) = kε P + ε −1 ∑ Ai PAi .
T
(3.20)
i =1

Μπορεί επίσης να ληφθεί ε = ∑ i =1 Ai ≥ 0 , έτσι ώστε να εισαχθεί ένα µέτρο του


k

µεγέθους της αβεβαιότητας. Ένα άλλο γραµµικό φράγµα είναι της µορφής

A( P) = θ P + θ tr ( P) I (3.21)

(Kosmidou 1987) και λαµβάνεται για αβεβαιότητες µε φραγµένη νόρµα ∆A ≤ θ ,


θ > 0.
Για A( P) γραµµική ως προς P , η GARE (3.12) επιλύεται επαναληπτικά,
επεκτείνοντας τη µέθοδο του Kleinman (1968).

Θεώρηµα 3.4
Έστω ότι η GARE (3.12) έχει µια µοναδική θετικά ορισµένη λύση P . Έστω Pj ,
j = 0,1,..., µια ακολουθία µοναδικών θετικά ορισµένων λύσεων των αλγεβρικών
εξισώσεων Lyapunov

T T
Pj Aj + Aj Pj + Q j + K j RK j = 0 (3.22)

49
όπου Aj = A + BK j , K j +1 = − R −1 BT Pj , Q j +1 = Q + A ( Pj ) , Q0 = Q , j = 0,1,... , όπου
οι A ( Pj ) προσδιορίζονται από την (3.20) (ή την (3.21)) και K 0 επιλέγεται, έτσι ώστε
A0 = A + BK 0 να είναι ένας ευσταθής πίνακας. Τότε,
(i) Po ≥ P1 ≥ ... ≥ Pj ≥ ..., j = 0,1,...
(ii) lim Pj = P
j →∞

Απόδειξη: Βλ. εργασία (Kosmidou and Bertrand 1987).

Το παραπάνω θεώρηµα αποδεικνύει ότι, αν υπάρχει µια θετικά ορισµένη λύση


της GARE, µπορεί να βρεθεί επαναληπτικά, επιλύοντας µια εξίσωση Lyapunov,
σύµφωνα µε την (3.22). Επειδή ο αριθµός των απαιτούµενων επαναλήψεων είναι
πεπερασµένος, υποτίθεται ότι ο αλγόριθµος επίλυσης αρχικοποιείται στη στενή
περιοχή της υπό αναζήτηση λύσης, λύνοντας την (3.12) µε A ( P) = 0 .

Χρησιµοποιώντας το φράγµα (3.20), η GARE (3.12) παίρνει τη µορφή,

P ( A + α I ) + ( A + α I )T P − PBR −1 BT P + Q = 0 (3.23)

όπου α = kε / 2 και Q = Q + ε −1 ∑ i =1 Ai PAi . Μια ανάλογη µορφή µπορεί να ληφθεί


k T

µε τη χρήση του φράγµατος (3.21). Η εξίσωση (3.23) έχει τη µορφή µιας κανονικής
εξίσωσης Riccati. Επιπλέον, το γεγονός ότι P > 0 συνεπάγεται Q ≥ 0 . Άρα, η (3.23)
έχει µια µοναδική θετικά ορισµένη λύση, εάν (i) το ζεύγος ( A + α I , B) είναι ελέγξιµο
και (ii) το ζεύγος ( A + α I , Q1/ 2 ) είναι παρατηρήσιµο (Anderson and Moore 1990).
Στην περίπτωση αυτή, ο νόµος ελέγχου εγγυηµένου κόστους µπορεί να ερµηνευτεί ως
ένας βέλτιστος νόµος ελέγχου για το σύστηµα ( A + α I , B) , ως προς ένα
τροποποιηµένο τετραγωνικό κριτήριο κόστους µε πίνακες βάρους (Q, R) . Κατά
συνέπεια, το σύστηµα κλειστού βρόχου έχει περιθώρια ευστάθειας και εγγενείς
ιδιότητες ευρωστίας που εξασφαλίζονται από τον βέλτιστο γραµµικό τετραγωνικό
ρυθµιστή (LQR) (Safonov and Athans 1977), για όλες τις αποδεκτές αβεβαιότητες.
Επιπλέον, µια κατάλληλη επιλογή του ε µπορεί να εξασφαλίσει τον επιθυµητό
βαθµό σχετικής ευστάθειας (Anderson and Moore 1990).

Συγκρίνοντας τις συναρτήσεις άνω φράγµατος (3.20) και (3.21) γίνεται


φανερό ότι στη δεύτερη περίπτωση η περιγραφή της αβεβαιότητας µε τη µορφή
προσθετικής διαταραχής, µε φραγµένη νόρµα, στον πίνακα κατάστασης A είναι
λιγότερο δοµηµένη, απ’ ότι οι παραµετρικές αβεβαιότητες του A µέσα σε µια
φραγµένη περιοχή, όπως θεωρούνται στην (3.20). Το γεγονός αυτό οδηγεί σε
συντηρητικές λύσεις που συνδέονται µε το φράγµα (3.21) και ο συντηρητισµός
εκφράζεται µε σχετικά µεγάλες τιµές στα κέρδη ανάδρασης και στο εγγυηµένο
κόστος.

50
3.3 Συστήµατα µε αβεβαιότητα στον πίνακα κατάστασης και στον πίνακα
εισόδου

Όταν τόσο ο πίνακας κατάστασης όσο και ο πίνακας εισόδου είναι αβέβαιοι,
δηλαδή ∆A ≠ 0 , ∆B ≠ 0 , προκύπτουν µη γραµµικές συναρτήσεις άνω φραγµάτων.
Ειδικότερα, κάποιοι από τους όρους της A ( P) είναι τετραγωνικοί ως προς P . Θα
θεωρήσουµε δύο περιπτώσεις:

3.3.1 Οι αβεβαιότητες ικανοποιούν τις συνθήκες προσαρµογής

Έστω ότι η περιγραφή των αβεβαιοτήτων ικανοποιεί τις συνθήκες


προσαρµογής (matching conditions) (Barmish et al. 1983), δηλαδή
k
∆ A = ∑ BAi ri
0
l
(3.24)
∆ B = ∑ BBi pi
0

όπου B είναι ο πίνακας εισόδου και Ai , Bi είναι σταθεροί πίνακες κατάλληλων


διαστάσεων. Ορίζονται,

−2
Θi := ai I m , i = 1,..., k

2 T
Ξ i := ai Ai Ai , i = 1,..., k

−2
Φ i := bi I m , i = 1,..., l

2 T
Ψ i := bi R −1 Bi Bi R −1 , i = 1,..., l (3.25)

όπου ai , bi είναι αυθαίρετες θετικές βαθµωτές ποσότητες. Τότε,

k l
A ( P ) = ∑ Ξ i + PBΘi BT P + ∑ PB(Φ i + Ψ i ) BT P (3.26)
i =1 i =1

είναι µια συνάρτηση φράγµατος, η οποία επιτρέπει να γράψουµε την GARE µε τη


µορφή µιας κανονικής εξίσωσης Riccati,

PA + AT P − PBRˆ −1 BT P + Qˆ = 0 (3.27)

όπου Qˆ = Q + ∑ i =1 Ξ i και Rˆ −1 = R −1 − ∑ i =1 Θi −∑ i =1 Ξ i + Ψ i (Kosmidou 1990). Η


k k l

εξίσωση αυτή έχει µια µοναδική θετικά ορισµένη λύση, όταν ο πίνακας R̂ είναι
θετικά ορισµένος και εφόσον ικανοποιούνται οι γνωστές συνθήκες ελεγξιµότητας και
παρατηρησιµότητας. Επίσης, το κλειστό σύστηµα έχει τις ιδιότητες εγγενούς
ευρωστίας που συνδέονται µε τη σχεδίαση LQR.

51
3.3.2 Γενική περίπτωση

Η περιγραφή (3.2), (3.3) επιτρέπει στους πίνακες αβεβαιότητας να έχουν


µοναδιαία τάξη και κατά συνέπεια να γραφούν µε τη µορφή γινοµένων διανυσµάτων
καταλλήλων διαστάσεων,

T
Ai = di ei , i = 1, 2,..., k , (3.28)

T
Bi = f i gi , i = 1, 2,..., l . (3.29)

Ας σηµειωθεί, ότι ο παραπάνω διαχωρισµός δεν είναι µοναδικός. Χρησιµοποιώντας


τα διανύσµατα αυτά, ορίζονται οι παρακάτω συµµετρικοί, θετικά ορισµένοι πίνακες,

k k
T := ∑ di diT , U := ∑ ei eiT ,
i =1 i =1

k k
V := ∑ gi giT , W := ∑ f i fi T . (3.30)
i =1 i =1

Αποδεικνύεται ότι η τετραγωνική συνάρτηση

A ( P ) = PTP + U + PWP + PBR −1VR −1 BT P (3.31)

είναι ένα άνω φράγµα της µορφής (3.13) (Petersen and Hollot 1986, Schmitendorf
1988), που οδηγεί στην GARE,

PA + AT P − P( BR −1 BT − BR −1VR −1 B − W − T ) P + Q + U = 0 (3.32)

Η εξίσωση αυτή δεν έχει γενικά αναλυτική λύση. Είναι γνωστό από τη θεωρία του
LQR ότι εξισώσεις της µορφής (3.32) έχουν µια θετικά ορισµένη λύση P , αν οι
αντίστοιχοι τετραγωνικοί όροι είναι θετικά ορισµένοι. Λόγω της ύπαρξης των
αβεβαιοτήτων, η συνθήκη αυτή δεν ικανοποιείται πάντα. Πράγµατι, η θετικότητα του
τετραγωνικού όρου της (3.32) εξαρτάται από τα σχετικά µεγέθη των πινάκων που
εµφανίζονται σ’ αυτόν και που εξαρτώνται από τις αβεβαιότητες. Ωστόσο, επειδή η
συνθήκη αυτή είναι µόνο ικανή, µια θετικά ορισµένη λύση P µπορεί να υπάρχει,
ακόµη και αν ο τετραγωνικός όρος της (3.32) δεν είναι θετικά ορισµένος. Εξάλλου,
εφόσον ο πίνακας βάρους ελέγχου R επιλέγεται από το σχεδιαστή, µπορούµε να
έχουµε πολλούς βαθµούς ελευθερίας αντικαθιστώντας το R µε ε R , όπου ε είναι µια
αυθαίρετη θετική σταθερά µε τιµές 0 < ε ≤ 1 . Έτσι, ο νόµος ελέγχου εγγυηµένου
κόστους γίνεται,

u (t ) = −(1/ ε ) R −1 BT Px(t ) (3.33)

και η αντίστοιχη GARE παίρνει τη µορφή

52
PA + AT P − P[(1/ ε ) BR −1 BT − (1/ ε 2 ) BR −1VR −1 B − W − T ]P + Q + U = 0 (3.34)

Τώρα, αναζητείται µια θετικά ορισµένη λύση της (3.34), για µια κατάλληλη τιµή του
ε . Προφανώς, στην περίπτωση αυτή η GARE επιλύεται µε «δοκιµή και σφάλµα». Η
µέθοδος αυτή χρησιµοποιήθηκε για την επίλυση προβληµάτων εύρωστης ευστάθειας
και εύρωστου ελέγχου (Petersen and Hollot 1986, Schmitendorf 1988).

Μια ικανή και αναγκαία συνθήκη για την ύπαρξη λύσης της γενικευµένης
αλγεβρικής εξίσωσης Riccati µπορεί να διατυπωθεί ερµηνεύοντάς την στο πλαίσιο
της θεωρίας των γραµµικών τετραγωνικών παιγνίων (Kosmidou et al. 1991).
Ειδικότερα, έχει αποδειχθεί ότι η εξίσωση (3.34) έχει µια θετικά ορισµένη λύση για
κάποιο ε , 0 < ε ≤ 1 , εάν και µόνον εάν ο 2n × 2n Hamiltonian πίνακας

⎡ A − M (ε ) ⎤
H =⎢ (3.35)
⎣ −Q − U − AT ⎥⎦

όπου
−1 −1
M (ε ) = (1/ ε ) BR −1 BT − (1/ ε 2 ) BR VR BT − W − T (3.36)

δεν έχει καθαρά φανταστικές ιδιοτιµές. Επιπλέον, είναι γνωστό ότι οι κανονικές
εξισώσεις Riccati επιλύονται χρησιµοποιώντας το διαχωρισµό κατά Shur του
αντίστοιχου Hamiltonian πίνακα. Επεκτείνοντας τη µέθοδο αυτή, µπορούµε να
επιλύσουµε τις συζευγµένες εξισώσεις Riccati που προκύπτουν στα γραµµικά
τετραγωνικά διαφορικά παίγνια (Abou-Kandil and Bertrand 1986, Abou-Kandil et al.
2003). Με τον ίδιο αλγόριθµο µπορεί να επιλυθεί και η (3.34), έχοντας εξασφαλίσει
ότι υπάρχει µια θετικά ορισµένη λύση, για κάποιο ε , 0 < ε ≤ 1 .

3.4 Ελαχιστοποίηση του εγγυηµένου κόστους

Οι γενικευµένες αλγεβρικές εξισώσεις Riccati που προκύπτουν σε


προβλήµατα εύρωστης ευστάθειας και ελέγχου οδηγούν συνήθως σε συντηρητικά
σχέδια ελέγχου, που, όπως προαναφέρθηκε, χαρακτηρίζονται από σχετικά µεγάλα
κέρδη ανάδρασης. Αυτό συµβαίνει, διότι οι χρησιµοποιούµενες τεχνικές σχεδίασης
βασίζονται στις µεθόδους Lyaponov. Κατά συνέπεια, οι τιµές που λαµβάνονται για το
εγγυηµένο κόστος είναι κι αυτές µεγάλες, σε σχέση µε τις τιµές που στην
πραγµατικότητα παίρνει η συνάρτηση κόστους. Προκειµένου να βρεθούν λιγότερο
συντηρητικές λύσεις, θα πρέπει να ελαχιστοποιηθεί το εγγυηµένο κόστος, λύνοντας
παράλληλα µε τον αλγόριθµο εύρωστου ελέγχου και ένα δευτερεύον πρόβληµα
παραµετρικής βελτιστοποίησης (εν προκειµένω ελαχιστοποίησης). Ένα τέτοιο
πρόβληµα, όµως, είναι υπολογιστικά δυσεπίλυτο. Ωστόσο, αν διατυπωθεί ως ένα
πρόβληµα κυρτής βελτιστοποίησης, µπορεί να επιλυθεί εύκολα µε τη χρήση
κατάλληλων αλγορίθµων, στα πλαίσια των τεχνικών γραµµικών ανισοτήτων πινάκων
(LMI).

Εφόσον οι διαχωρισµοί (3.28)-(3.29) δεν είναι µοναδικοί, µπορεί να βρεθεί


µια κατάλληλη επιλογή, µε τη χρήση παραµετροποίησης (Fischman 1996),

53
Ai = σ i1/ 2 diσ i −1/ 2 eiT , i = 1,..., k (3.37)

Bi = τ i1/ 2 f iτ i −1/ 2 giT , i = 1,..., l (3.38)

όπου σ i ,τ i είναι θετικές βαθµωτές ποσότητες που πρέπει να επιλεγούν µέσω της
σχεδίασης. Για το λόγο αυτό ορίζονται οι παρακάτω πίνακες:

D := [d1...d k ] , F := [ f1... f l ]
E := [e1...ek ] , G := [ g1...gl ] (3.39)
S := diag (σ 1...σ k ) , T := diag (τ 1...τ l ) .

Επιλύοντας ένα πρόβληµα ελαχιστοποίησης αντικειµενικής συνάρτησης µε


περιορισµούς LMI, µπορεί να βρεθεί το σύνολο βέλτιστων τιµών σ i ,τ i , για το οποίο
η GARE (3.34) έχει µια θετικά ορισµένη λύση τέτοια ώστε το αντίστοιχο εγγυηµένο
κόστος γίνεται ελάχιστο.

Θεώρηµα 3.5
Έστω το αβέβαιο σύστηµα (3.1) και το αντίστοιχο τετραγωνικό κριτήριο (3.8). Αν
υπάρχουν συµµετρικοί και θετικά ορισµένοι πίνακες M , P , διαγώνιοι και θετικά
ορισµένοι πίνακες S , T και ένας θετικός αριθµός δ , τέτοιοι ώστε το ακόλουθο
πρόβληµα ελαχιστοποίησης

min[tr ( M )] (3.40)
( M , P , S ,T ,δ )

µε περιορισµούς LMI

⎡M I⎤
⎢ ⎥>0 (3.41)
⎣I P⎦

και

⎡ − PAT − AP + δ BR −1 BT − DSDT − FTF T PE T δ BR −1GT P ⎤


⎢ ⎥
⎢ EP S 0 0 ⎥>0 (3.42)
⎢ δ GR −1 BT 0 T 0 ⎥
⎢ −1

⎢⎣ P 0 0 Q0 ⎥⎦

έχει ένα µη κενό σύνολο εφικτών λύσεων ( M , P, S , T , δ ) , τότε ο νόµος ελέγχου

u * (t ) = −δ R −1 BT Px(t ) (3.43)

είναι ένας νόµος ελέγχου εγγυηµένου κόστους

J * = tr ( P) (3.44)

54
είναι το εγγυηµένο κόστος για το σύστηµα (3.1) µε τυχαίες αρχικές συνθήκες, όπου
P = P −1 και δ = 1/ ε .

Απόδειξη: Επεκτείνοντας τα αποτελέσµατα των (Kosmidou et al. 1991, Fischman et


al. 1996), αποδεικνύεται ότι για οποιοδήποτε Q0 < Q , η επίλυση του LMI (3.42)
ισοδυναµεί µε την επίλυση της GARE (3.34). Επιπλέον, το LMI (3.41) εξασφαλίζει,
ότι, αν ικανοποιείται η (3.40), το εγγυηµένο κόστος (3.44) ελαχιστοποιείται. Η λύση
που προκύπτει είναι η βέλτιστη, λόγω της κυρτότητας της αντικειµενικής συνάρτησης
και των περιορισµών.

3.5 Παράδειγµα

Έστω το αβέβαιο σύστηµα µε

⎡ 0 1⎤ ⎡0 0⎤ ⎡0 0 ⎤ ⎡0 ⎤
A=⎢ ⎥ , A1 = ⎢ ⎥ , A2 = ⎢ ⎥ , B=⎢ ⎥
⎣ −2 1⎦ ⎣1 0 ⎦ ⎣ 0 1.5⎦ ⎣1 ⎦

όπου A1 , A2 είναι οι πίνακες αβεβαιότητας. Οι πίνακες βάρους της συνάρτησης


κόστους είναι
⎡1 0 ⎤
Q=⎢ ⎥ , R = 10 .
⎣0 1⎦

Επειδή µόνο ο πίνακας κατάστασης επηρεάζεται από αβεβαιότητες, θα


χρησιµοποιήσουµε γραµµικές συναρτήσεις φραγµάτων και ειδικότερα τις (3.20) και
(3.21). Ας σηµειωθεί, ότι στο παράδειγµα αυτό οι πίνακες αβεβαιότητας A1 , A2
ικανοποιούν τις συνθήκες προσαρµογής. Άρα µπορεί να χρησιµοποιηθεί επίσης ένα
τετραγωνικό φράγµα της µορφής (3.26). Τα κέρδη ανάδρασης, οι ιδιοτιµές κλειστού
βρόχου σε διάφορα σηµεία της περιοχής αβεβαιότητας, καθώς και οι τιµές του
εγγυηµένου κόστους δίνονται στους πίνακες 3.1 και 3.2.

Μέθοδος Κέρδη Ιδιοτιµές Ιδιοτιµές Ιδιοτιµές


σχεδίασης ανάδρασης r1 = r2 = 0 r1 = r2 = 1 r1 = r2 = −1
Γραµµικό [ −2.60 −4.4 0] −1.8 ± j1.2 −1.1 ± j1.6 −2.2 ± j 0.7
φράγµα
(3.20)
Γραµµικό [ −5.14 −5.66] −2.3 ± j1.3 −1.6 ± j1.9 −2.8 ± j 0.3
φράγµα
(3.21)
Τετραγωνικό [ −1.12 −6.86] −0.6 , −5.3 −0.7 , −6.2 −0.5 , −4.4
φράγµα
(3.26)
LMI [ −0.03 −7.02] −0.3 , −5.6 −0.2 , −4.3 −0.4 , −7.1

Πίνακας 3.1. Κέρδη ανάδρασης και ιδιοτιµές κλειστού συστήµατος σε διάφορα


σηµεία της περιοχής αβεβαιότητας

55
Μέθοδος σχεδίασης Εγγυηµένο κόστος tr ( P) Βέλτιστο κόστος
Γραµµικό φράγµα 317.2 62.4
(3.20)
Γραµµικό φράγµα 347.8 62.4
(3.21)
Τετραγων. φράγµα 233.1 62.4
(3.26)
LMI 211.6 62.4

Πίνακας 3.2. Τιµές εγγυηµένου κόστους και βέλτιστη τιµή της συνάρτησης κόστους
για το ονοµαστικό σύστηµα

Ας σηµειωθεί, ότι η τιµή του εγγυηµένου κόστους που λαµβάνεται µε τη µέθοδο LMI
είναι ελάχιστη. Ο βέλτιστος διαχωρισµός µοναδιαίας τάξης επιτυγχάνεται για
σ 1 = 0.0143 , σ 2 = 0.0215 .

Έστω τώρα η περίπτωση, κατά την οποία και ο πίνακας εισόδου επηρεάζεται από
αβεβαιότητες, δηλαδή ∆B = B1 p1 . Για τους πίνακες αβεβαιοτήτων λαµβάνονται κατ’
αρχάς αυθαίρετοι διαχωρισµοί µοναδιαίας τάξης,

⎡0 0⎤ ⎡0⎤ ⎡0 0 ⎤ ⎡0 ⎤
A1 = ⎢ ⎥ = ⎢ ⎥ [1 0] = d1e1T , A2 = ⎢ ⎥ = ⎢1 ⎥ [ 0 1.5] = d 2 e2 ,
T

⎣ 1 0 ⎦ ⎣ ⎦1 ⎣ 0 1.5 ⎦ ⎣ ⎦

⎡ 0 ⎤ ⎡0⎤
B1 = ⎢ ⎥ = ⎢ ⎥ 0.1 = f1 g1T
⎣0.1⎦ ⎣1 ⎦

Εφαρµόζοντας την τεχνική LMI, οι βέλτιστοι διαχωρισµοί µοναδιαίας τάξης


λαµβάνονται για σ 1 = 0.0115 , σ 2 = 0.0172 και τ = 0.010 . Έτσι προκύπτει ο έλεγχος
εγγυηµένου κόστους µε κέρδος ανάδρασης K = [ −0.03 −8.78] , που δίνει το
ελάχιστο εγγυηµένο κόστος tr ( P) = 264.3 . Οι ιδιοτιµές του κλειστού συστήµατος σε
διάφορα σηµεία της περιοχής αβεβαιότητας είναι,

r1 = r2 = s1 = 0 r1 = r2 = 1, p1 = 1 r1 = r2 = −1, p1 = −1
−0.3 , −7.5 −0.1 , −7.0 −0.25 ± j1.71

Πίνακας 3.3. Ιδιοτιµές κλειστού συστήµατος

Πρέπει να σηµειωθεί, ότι, όταν και οι δύο πίνακες, κατάστασης και εισόδου, είναι
αβέβαιοι, απαιτείται µεγαλύτερος έλεγχος πράγµα που εκφράζεται µε µεγαλύτερο
κέρδος ανάδρασης και συνεπώς µεγαλύτερη τιµή του εγγυηµένου κόστους.

3.6 Συµπεράσµατα

Τα αποτελέσµατα που παρουσιάστηκαν στο κεφάλαιο αυτό µπορούν να


συνοψιστούν ως εξής:

56
1. Όταν οι αβεβαιότητες επηρεάζουν µόνο τον πίνακα κατάστασης, µπορούν
να χρησιµοποιηθούν γραµµικές συναρτήσεις φράγµατος. Στην περίπτωση αυτή
υπάρχει αναλυτική λύση της GARE, εφόσον πληρούνται οι απαιτούµενες
προϋποθέσεις ελεγξιµότητας, παρατηρησιµότητας και θετικότητας. Η λύση
υπολογίζεται µε τη χρήση επαναληπτικών αλγορίθµων των οποίων η σύγκλιση έχει
αποδειχθεί. Το εγγυηµένο κόστος είναι το ελάχιστο λόγω της δοµής του νόµου
ελέγχου. Το κλειστό σύστηµα έχει τις εγγενείς ιδιότητες ευρωστίας που
χαρακτηρίζουν το βέλτιστο έλεγχο LQR, δηλαδή περιθώρια ενίσχυσης και φάσης,
ανοχή σε µη γραµµικότητες, µείωση του κέρδους και, σε µερικές περιπτώσεις, βαθµό
σχετικής ευστάθειας.

2. Όταν οι αβεβαιότητες επηρεάζουν τόσο τον πίνακα κατάστασης όσο και


τον πίνακα εισόδου, χρησιµοποιούνται τετραγωνικές συναρτήσεις φράγµατος. Στην
περίπτωση αυτή δεν αποδεικνύεται η ύπαρξη αναλυτικής λύσης της GARE. Μπορεί
όµως να βρεθεί υπολογιστική λύση, µε ταυτόχρονη ελαχιστοποίηση του εγγυηµένου
κόστους, LMI. Επειδή, γενικά, η GARE µε τετραγωνικούς όρους φράγµατος δεν
µπορεί να ερµηνευτεί σαν κανονική εξίσωση Riccati, δεν εξασφαλίζονται ούτε οι
ιδιότητες εγγενούς ευρωστίας του κλειστού συστήµατος.

3. Το ενδιαφέρον στη χρησιµοποίηση περιγραφής αβεβαιοτήτων γραµµικού


τύπου (3.2) έγκειται στο γεγονός, ότι επιτρέπει τη βελτιστοποίηση του διαχωρισµού
µοναδιαίας τάξης µέσω του αλγορίθµου LMI. Επιπλέον, η περιγραφή αυτή είναι η
µόνη, που επιτρέπει την εύρεση εύρωστων περιθωρίων ευστάθειας για το κλειστό
σύστηµα, ακόµη και όταν στην είσοδο του αβέβαιου συστήµατος επιδρά µια
πρόσθετη µη δοµηµένη διαταραχή (Kosmidou and Bourlès 1994).

4. Οι ελεγκτές εγγυηµένου κόστους υλοποιούνται εύκολα, διότι είναι


γραµµικοί και προκύπτουν από την επίλυση της GARE. Ακόµη, η ειδική δοµή τους
(3.10) προσδίδει στο πρόβληµα GCC την ιδιότητα να µεταπίπτει στο κανονικό
πρόβληµα LQR, όταν µηδενίζονται οι αβεβαιότητες.

5. Γενικευµένες αλγεβρικές εξισώσεις Riccati διαφόρων µορφών προκύπτουν


επίσης σε αρκετές µεθόδους εύρωστης ευστάθειας και ελέγχου H ∞ (Schmitendorf
1988, Khargonekar et al. 1988), καθώς επίσης και στον GCC συστηµάτων µε
χρονικές καθυστερήσεις (Li et al. 1998) και στον GCC µε ταυτόχρονη τοποθέτηση
των πόλων του συστήµατος σε προεπιλεγµένες περιοχές του µιγαδικού επιπέδου
(Garcia et al. 1995). Στις περιπτώσεις αυτές, προκύπτουν συνθετότερες µορφές
GARE και αναζητούνται λύσεις κατά περίπτωση.

57
Κεφάλαιο 4

Εύρωστος έλεγχος συστηµάτων µε χρονικές καθυστερήσεις

Πολλά γραµµικά συστήµατα χαρακτηρίζονται όχι µόνο από αβεβαιότητες


αλλά και από χρονικές καθυστερήσεις. Αυτές πρέπει να ληφθούν υπόψη κατά τη
σχεδίαση εύρωστων νόµων ελέγχου, προκειµένου να αποφύγουµε τόσο τις
υποβαθµισµένες επιδόσεις όσο και την προκαλούµενη αστάθεια του συστήµατος
(Malek-Zavarei and Jamshidi 1987, Mahmoud 2000, Niculescu 2001). Προβλήµατα
ανάλυσης της ευστάθειας και εύρωστου ελέγχου αβέβαιων συστηµάτων µε χρονικές
καθυστερήσεις έχουν µελετηθεί ευρέως στη διεθνή βιβλιογραφία κατά τα τελευταία
έτη (Niculescu et al. 1998, Richard 2003). Επειδή πρακτικοί λόγοι επιβάλλουν την
ύπαρξη χρονικών καθυστερήσεων τόσο στις καταστάσεις όσο και στις εισόδους του
συστήµατος, όπως π.χ. σε γραµµές µεταφοράς υδραυλικών ή ηλεκτρικών δικτύων,
στο κεφάλαιο αυτό θα µελετηθούν συστήµατα µε αβεβαιότητες και χρονικές
καθυστερήσεις και στα δύο αυτά τµήµατα. Επιπλέον, όταν οι χρονικές καθυστερήσεις
δεν είναι επακριβώς γνωστές, πρέπει να θεωρηθούν αβεβαιότητες και στους όρους
καθυστέρησης.

4.1 ∆ιατύπωση του προβλήµατος και βασικές έννοιες

Θεωρούµε το γραµµικό αβέβαιο σύστηµα µε χρονικές καθυστερήσεις σε


περιγραφή χώρου κατάστασης,

x(t ) = ( A1 + ∆A1 ) x(t ) + ( A2 + ∆A2 ) x(t − d1 ) + ( B1 + ∆B1 )u (t ) + ( B2 + ∆B2 )u (t − d 2 )


t ∈ [0, ∞) , x(0) = x0 , x(t ) = φ (t ) για t < 0 (4.1)

όπου x(t ) ∈ R n είναι το διάνυσµα κατάστασης, u (t ) ∈ R m είναι το διάνυσµα ελέγχου,


A1 , A2 ∈ R n×n και B1 , B2 ∈ R n×m είναι οι πίνακες κατάστασης και ελέγχου, αντίστοιχα.
Οι αβεβαιότητες του συστήµατος περιγράφονται µε τη µορφή γραµµικών
συναρτήσεων της µορφής,

58
k1 k2 l1 l2
∆A1 = ∑ A1i r1i , ∆A2 = ∑ A2i r2i , ∆B1 = ∑ B1i p1i , ∆B2 = ∑ B2i p2i (4.2)
i =1 i =1 i =1 i =1

όπου A1i , A2i , B1i , B2i είναι δοθέντες σταθεροί πίνακες κατάλληλων διαστάσεων, που
προσδιορίζουν τη δοµή της αβεβαιότητας στους όρους κατάστασης, εισόδου και
καθυστέρησης. Οι βαθµωτές ποσότητες r1i , r2i , p1i , p2i είναι αβέβαιες παράµετροι,
που ανήκουν σε γνωστά σύνολα και είναι φραγµένες από θετικές ποσότητες, έτσι
ώστε r1i ≤ r1i , r2i ≤ r2i , p1i ≤ p1i , p2i ≤ p2i . Όπως αναφέρθηκε και στην παράγραφο
3.1, σε µια κανονικοποιηµένη περιγραφή, οι αβέβαιες παράµετροι µπορούν να
θεωρηθούν φραγµένες από τη µονάδα, χωρίς να µειώνεται η γενικότητα του
προβλήµατος. Το πλεονέκτηµα της γραµµικής περιγραφής της αβεβαιότητας είναι η
δυνατότητα διαχωρισµού µοναδιαίας τάξης που τώρα είναι της µορφής

T
A1i = d1i e1i , i = 1,..., k1

T
A2i = d 2i e2i , i = 1,..., k2

T
B1i = f1i g1i , i = 1,..., l1

T
B2i = f 2i g 2i , i = 1,..., l2 (4.3)

όπου d ji , e ji , f ji , g ji , j = 1, 2 , είναι διανύσµατα κατάλληλων διαστάσεων. Προφανώς


ο διαχωρισµός (4.3) δεν είναι µοναδικός. Το γεγονός αυτό προσδίδει αρκετούς
βαθµούς ελευθερίας κατά τη σχεδίαση εύρωστων ελεγκτών, προκειµένου να
ικανοποιηθούν διάφορες προδιαγραφές κλειστού βρόχου.

Χρησιµοποιώντας τα διανύσµατα του διαχωρισµού (4.3), ορίζονται οι


παρακάτω πίνακες, οι οποίοι θα χρησιµοποιηθούν κατά τη διαδικασία σχεδίασης.

D1 := [d11...d1k1 ] , D2 := [d 21...d 2 k2 ]

E1 := [e11...e1k1 ] , E2 := [e21...e2 k2 ]

F1 := [ f11... f1l1 ] , F2 := [ f 21... f 2l2 ]

G1 := [ g11...g1l1 ] , G2 := [ g 21...g 2l2 ] (4.4)

Οι χρονικές καθυστερήσεις της περιγραφής κατάστασης (4.1) ικανοποιούν τις


σχέσεις,

0 ≤ d1 ≤ d1 < ∞ , 0 ≤ d2 ≤ d2 < ∞ (4.5)

59
Με το σύστηµα (4.1) συνδέεται η τετραγωνική συνάρτηση κόστους

J ( x0 , t ) = ∫ [ xT (t )Qx(t ) + u T (t ) Ru (t )]dt , (4.6)
0

Q ≥ 0, R > 0 , η οποία πρέπει να ελαχιστοποιηθεί για µια κατάλληλη είσοδο ελέγχου


της µορφής

u (t ) = Kx(t ) (4.7)

Επιπλέον, υποθέτουµε ότι το ζεύγος ( A1 , B1 ) είναι ελέγξιµο και το ζεύγος (Q1/ 2 , A1 )


είναι παρατηρήσιµο. Υποθέτουµε ακόµη ότι το πλήρες διάνυσµα κατάστασης x(t )
είναι µετρήσιµο.

Λόγω της παρουσίας των αβεβαιοτήτων, το παραπάνω πρόβληµα


βελτιστοποίησης θα µελετηθεί στο πλαίσιο του εύρωστου ελέγχου εγγυηµένου
κόστους. Οι έννοιες της τετραγωνικής ευστάθειας και του εγγυηµένου κόστους για τα
συστήµατα µε χρονικές καθυστερήσεις διατυπώνονται ως εξής:

Ορισµός 4.1 (Makek-Zavarei and Jamshidi 1987)


Το αβέβαιο σύστηµα µε χρονικές καθυστερήσεις (4.1) είναι τετραγωνικά
σταθεροποιήσιµο ανεξαρτήτως καθυστερήσεων, αν υπάρχει ένας γραµµικός νόµος
ελέγχου ανάδρασης της µορφής (4.7), µια σταθερά θ > 0 και θετικά ορισµένοι
πίνακες P, R1 ∈ R n×n , R2 ∈ R m×m , έτσι ώστε η παράγωγος ως προς το χρόνο της
συνάρτησης Lyapunov-Krasovskii,
t t
L( x, t ) = x (t ) Px(t ) + ∫ x (τ ) R1 x(τ )dτ + ∫ u T (τ ) R2u (τ )dτ
T T
(4.8)
t − d1 t − d2

ικανοποιεί τη συνθήκη


2
L( x, t ) ≤ −θ x (4.9)

κατά µήκος των λύσεων x(t ) της (4.1), για το νόµο ελέγχου (4.7), για κάθε x(t ) και
για κάθε αποδεκτή αβεβαιότητα και χρονική καθυστέρηση, δηλαδή τέτοιες ώστε να
ικανοποιούν τις σχέσεις (4.2), (4.3) και (4.5), αντίστοιχα.

Ορισµός 4.2
Για το σύστηµα (4.1)-(4.5) µε τετραγωνικό κριτήριο κόστους (4.6), ένας γραµµικός
νόµος ελέγχου ανάδρασης κατάστασης της µορφής (4.7) είναι ένας νόµος ελέγχου
εγγυηµένου κόστους, αν υπάρχει ένας θετικός αριθµός V ( x0 , φ (− d1 ), φ (−d 2 )) , που
λέγεται εγγυηµένο κόστος, έτσι ώστε,

J ( x0 , t ) ≤ V ( x0 , φ (− d1 ), φ (− d 2 )) (4.10)

60
για κάθε x(t ) και για κάθε αποδεκτή αβεβαιότητα και χρονική καθυστέρηση.

Θεώρηµα 4.3
Έστω το σύστηµα (4.1)-(4.5) µε τετραγωνικό κριτήριο κόστους (4.6) νόµο ελέγχου
της µορφής (4.7) που ικανοποιεί τη συνθήκη


L( x, t ) ≤ − xT (t )[Q + K T RK ]x(t ) (4.11)

για κάθε x(t ) και για κάθε αποδεκτή αβεβαιότητα και χρονική καθυστέρηση. Τότε, ο
(4.7) είναι ένας νόµος ελέγχου εγγυηµένου κόστους και
0 0
V ( x0 , φ (− d1 ), φ (−d 2 )) = x0 Px0 + ∫ φ (τ ) R1φ (τ )dτ + ∫φ (τ ) K T R2 Kφ (τ )dτ (4.12)
T T T

− d1 − d2

είναι ένα εγγυηµένο κόστος της (4.6). Επιπλέον, το κλειστό σύστηµα είναι
τετραγωνικά ευσταθές.

Απόδειξη: Ολοκληρώνοντας και τα δύο µέλη της (4.11), παίρνουµε

T T
L( x(T ), T ) − L( x0 , 0) = x (T ) Px(T ) + ∫ x (τ ) R1 x(τ )dτ + ∫ xT (τ ) K T R2 Kx(τ )dτ
T T

T − d1 T − d2
0 0 T

∫x (τ ) R1 x(τ )dτ − ∫ xT (τ ) K T R2 Kx(τ )dτ ≤ − ∫ [ xT (t )Qx(t ) + uT (t ) Ru (t )]dt


T
− x0 Px0 − T

− d1 − d2 0

Επειδή η (4.11) ικανοποιείται για L > 0 , έπεται από τον Ορισµό 4.1 ότι και η (4.9)
ικανοποιείται για θ = λmin (Q + K T RK ) . Συνεπώς, ο (4.7) εξασφαλίζει την
τετραγωνική ευστάθεια του κλειστού συστήµατος, πράγµα που σηµαίνει ότι
L( x, t ) → 0 , καθώς T → ∞ , κατά µήκος των λύσεων x(t ) του συστήµατος. Άρα η
παραπάνω σχέση γίνεται

∞ 0 0

∫ [ x (t )Qx(t ) + u (t ) Ru(t )]dt ≤ x0 Px0 + ∫ φ (τ ) R1φ (τ )dτ + ∫φ (τ ) K T R2 Kφ (τ )dτ


T T T T T

0 − d1 − d2

και άρα ικανοποιείται η συνθήκη εγγυηµένου κόστους (4.10) µε εγγυηµένο κόστος


(4.12).

Η συνθήκη εγγυηµένου κόστους που απορρέει από το Θεώρηµα 4.3 οδηγεί


συνήθως σε συντηρητικές λύσεις λόγω του ότι βασίζεται στην ευστάθεια κατά
Lyapunov, αλλά και επειδή είναι ανεξάρτητη της καθυστέρησης. Στη συνέχεια θα
προταθεί µια λύση µε LMI, που επιτρέπει την ελαχιστοποίηση του εγγυηµένου
κόστους.

61
4.2 Λύση στο πλαίσιο των LMI

Ο βέλτιστος διαχωρισµός µοναδιαίας τάξης θα βρεθεί επιλύοντας ένα


πρόβληµα ελαχιστοποίησης αντικειµενικής συνάρτησης µε περιορισµούς LMI.
Χρησιµοποιούµε την εξής παραµετροποίηση:

−1/ 2
A1i = σ 1i d1iσ 1i
1/ 2 T
e1i , i = 1,..., k1

−1/ 2
A2i = σ 2i d 2iσ 2i
1/ 2 T
e2i , i = 1,..., k2

−1/ 2
B1i = τ 1i f1iτ 1i
1/ 2 T
g1i , i = 1,..., l1

−1/ 2
B2i = τ 2i f 2iτ 2i
1/ 2 T
g 2i , i = 1,..., l2 (4.13)

όπου σ ji ,τ ji , j = 1, 2 , είναι θετικές βαθµωτές ποσότητες που πρέπει να επιλεγούν


µέσω της σχεδίασης. Για το λόγο αυτό ορίζονται οι παρακάτω πίνακες:

S1 := diag (σ 11...σ k1 ) , S 2 := diag (σ 21...σ k2 )

T1 := diag (τ 11...τ l1 ) , T2 := diag (τ 21...τ l2 ) (4.14)

Τότε, µια λύση στο πρόβληµα του εύρωστου ελέγχου εγγυηµένου κόστους για το
αβέβαιο σύστηµα µε χρονικές καθυστερήσεις µπορεί να υπολογιστεί από την επίλυση
ενός προβλήµατος εφικτότητας LMI.

Θεώρηµα 4.4
Έστω το αβέβαιο σύστηµα µε χρονικές καθυστερήσεις (4.1)-(4.5) µε τετραγωνική
συνάρτηση κόστους (4.6). Υποθέτουµε ότι υπάρχουν θετικά ορισµένοι πίνακες
S1 , S 2 , T1 , T2 ,W , R1 , R2 , έτσι ώστε το LMI,

⎡ Λ (.) WE1 WE2 B1 R −1G1 B1 R −1G2 B1 R −1 W W⎤


⎢ T ⎥
⎢ E1 W − S1 0 0 0 0 0 0 ⎥
⎢ T ⎥
⎢ E2 W 0 − S2 0 0 0 0 0 ⎥
⎢ G T R −1 B T 0 0 −T1 0 0 0 0 ⎥
⎢ 1 1
⎥ < 0 (4.15)
⎢G2 R B1
T −1 T
0 0 0 −T2 0 0 0 ⎥
⎢ −1 T ⎥
⎢ R B1 0 0 0 0 − R2 0 0 ⎥
⎢ W 0 0 0 0 0 − R1 0 ⎥
⎢ ⎥
⎢⎣ W 0 0 0 0 0 0 −Q ⎥⎦

όπου

62
T T T T
Λ (.) = AW
1 + WA1 − B1R −1B1 + A2W + WA2 + B2 R −1B2
T T T T
+ D1S1D1 + D2 S 2 D2 + FT
1 1 F1 + F2T2 F2

και

Q = Qˆ −1 , R1 = R1
−1 −1
, R2 = R2

να έχει µια εφικτή λύση ( S1 , S 2 , T1 , T2 ,W , R1 , R2 ) . Τότε, ο νόµος ελέγχου

T
u (t ) = − R −1 B1 Px(t ) (4.16)

όπου

P := W −1 (4.17)

είναι ένας νόµος ελέγχου εγγυηµένου κόστους. Το αντίστοιχο εγγυηµένο κόστος


είναι,
0 0
V ( x0 , φ (−d1 ), φ (−d 2 )) = x0 Px0 + ∫ φ (τ ) R1φ (τ )dτ + ∫φ (τ ) PB1 R −1 R2 R −1 B1 Pφ (τ )dτ
T T T T

− d1 − d2

(4.18)

Απόδειξη: Παραγωγίζοντας τη συνάρτηση Lyapunov-Krasovskii (4.8) για το


σύστηµα (4.1) µε νόµο ελέγχου (4.16) παίρνουµε,

T
L( x, t ) = 2 xT (t ) P{[ A1 + ∆A1 ]x(t ) + [ A2 + ∆A2 ] x(t − d1 ) − [ B1 + ∆B1 ]R −1 B1 Px(t ) −
T T
[ B2 + ∆B2 ]R −1 B1 Px(t − d 2 )} + xT (t ) R1 x(t ) + xT (t ) PB1 R −1 R2 R −1 B1 Px(t )

Η σχέση αυτή πρέπει να ικανοποιείται για κάθε x(t ) ∈ R n . Επιπλέον,


χρησιµοποιώντας την ταυτότητα 2 aT b ≤ aT a + bT b , ∀a, b, ∈ R n , καθώς και τις
σχέσεις (4.2)-(4.4) και (4.13), (4.14), λαµβάνονται τα ακόλουθα άνω φράγµατα:

k1
2 xT (t ) P∆A1 x(t ) ≤ 2 xT (t ) P∆A1 x(t ) ≤ ∑ 2 xT (t ) PA1r1 x(t ) ≤
i =1
k1

∑ 2x
−1/ 2
(t ) P(d1iσ 1i )(e1i σ 1i
1/ 2 T
T
) x(t ) ≤
i =1
k1 k1
xT (t ) P ∑ σ 1i d1i d1i Px(t ) + xT (t )∑ σ 1i e1i e1i x(t ) =
T −1 T

i =1 i =1
T −1 T
x (t ) PD1S1 D Px(t ) + x (t ) E1S1 E1 x(t )
T
1
T

Με τον ίδιο τρόπο παίρνουµε,

T −1 T
2 xT (t ) P∆A2 x(t − d1 ) ≤ xT (t ) PD2 S2 D2 Px(t ) + xT (t − d1 ) E2 S2 E2 x(t − d1 )

63
T T −1 T T
−2 xT (t ) P∆B1 R −1 B1 Px(t ) ≤ xT (t ) PFT −1 −1
1 1 F1 Px (t ) + x (t ) PB1 R G1T1 G1 R B1 Px (t )
T

T T
−2 xT (t ) P∆B2 R −1 B1 Px(t − d 2 ) ≤ xT (t ) PF2T2 F2 Px(t ) +
−1 T T
xT (t − d 2 ) PB1 R −1G2T2 G2 R −1 B1 Px(t − d 2 )

που ισχύουν για κάθε x(t ) ∈ R n . Χρησιµοποιώντας τις παραπάνω συναρτήσεις


φράγµατος, αποδεικνύεται, ότι η συνθήκη εγγυηµένου κόστους (4.11) ικανοποιείται,
όταν ισχύει το LMI (4.15), για οποιοδήποτε θετικά ορισµένο πίνακα Q̂ < Q .

Στη συνέχεια, αναζητείται µια λύση, αν υπάρχει, που να ελαχιστοποιεί το


εγγυηµένο κόστος. Προφανώς, η (4.18) είναι µη κυρτή συνάρτηση, ως προς τις
µεταβλητές βελτιστοποίησης. Ωστόσο, ένα µέτρο του εγγυηµένου κόστους µπορεί να
εκφραστεί συναρτήσει των ιχνών των πινάκων P , R1 και R2 . Για το λόγο αυτό, θα
ελαχιστοποιηθεί µια συνάρτηση των ιχνών των πινάκων αυτών µε περιορισµούς LMI.

Θεώρηµα 4.5
Έστω το αβέβαιο σύστηµα µε χρονικές καθυστερήσεις (4.1)-(4.5) µε τετραγωνική
συνάρτηση κόστους (4.6). Υποθέτουµε ότι υπάρχουν θετικά ορισµένοι πίνακες
S1 , S 2 , T1 , T2 ,W , R1 , R2 , M 1 , M 2 , M 3 , έτσι ώστε το ακόλουθο πρόβληµα
ελαχιστοποίησης,

min J = min[tr ( M 1 ) + tr ( M 2 ) + tr ( M 3 )] (4.19)


ℵ ℵ

ℵ = ( S1 , S2 , T1 , T2 ,W , R1 , R2 , M 1 , M 2 , M 3 ) , µε περιορισµούς LMI (4.15) και

⎡−M1 In ⎤
⎢ I <0 (4.20)
⎣ n −W ⎥⎦

⎡−M 2 In ⎤
⎢ I <0 (4.21)
⎣ n − R1 ⎥⎦

⎡−M 3 Im ⎤
⎢ I <0 (4.22)
⎣ m − R2 ⎥⎦

έχει µια εφικτή λύση ℵ = (.) . Τότε, ο νόµος ελέγχου

T
u (t ) = − R −1 B1 Px(t ) (4.23)

όπου

64
P := W −1 (4.24)

είναι ένας νόµος ελέγχου εγγυηµένου κόστους. Το αντίστοιχο εγγυηµένο κόστος,


0 0
V ( x0 , φ (−d1 ), φ (−d 2 )) = x0 Px0 + ∫ φ (τ ) R1φ (τ )dτ + ∫φ (τ ) PB1 R −1 R2 R −1 B1 Pφ (τ )dτ
T T T T

− d1 − d2

(4.25)

είναι το ελάχιστο, σε σχέση µε όλες τις δυνατές λύσεις.

Απόδειξη: Σύµφωνα µε το Θεώρηµα 4.4, κάθε εφικτή λύση ( S1 , S 2 , T1 , T2 ,W , R1 , R2 )


του LMI (4.15) εξασφαλίζει το εγγυηµένο κόστος (4.25) για το σύστηµα (4.1)-(4.5).
Επιπλέον, το συµπλήρωµα του Schur για την (4.20) δίνει,
−1
− M 1 + W < 0 ⇒ M 1 > P ⇒ tr ( M 1 ) > tr ( P) . Συνεπώς, η ελαχιστοποίηση του tr ( M 1 )
συνεπάγεται την ελαχιστοποίηση του tr ( P) . Κατά παρόµοιο τρόπο, αποδεικνύεται,
ότι η ελαχιστοποίηση των tr ( M 2 ) και tr ( M 3 ) συνεπάγεται την ελαχιστοποίηση των
tr ( R1 ) και tr ( R2 ) , αντίστοιχα. Άρα, η ελαχιστοποίηση του J στην (4.19)
συνεπάγεται την ελαχιστοποίηση ενός µέτρου του εγγυηµένου κόστους για το
αβέβαιο σύστηµα µε χρονικές καθυστερήσεις (4.1)-(4.5) µε δείκτη επιδόσεων (4.6). Η
βελτιστοποίηση της λύσης προκύπτει από την κυρτότητα τόσο της αντικειµενικής
συνάρτησης (4.19), όσο και των περιορισµών (4.15), (4.20)-(4.22).

Ο νόµος ελέγχου (4.23) έχει τη δοµή του βέλτιστου τετραγωνικού ρυθµιστή


και προκύπτει από την επίλυση µιας γενικευµένης αλγεβρικής εξίσωσης Riccati.
Όπως ήδη αναφέρθηκε στο προηγούµενο κεφάλαιο, η εξίσωση αυτή δεν έχει γενικά
αναλυτική λύση. Ωστόσο, αν υπάρχει µια θετικά ορισµένη λύση, αυτή υπολογίζεται
αριθµητικά, µε τη χρήση LMI, όπως αποδείχθηκε στα Θεωρήµατα 4.4 και 4.5.
Ακόµη, όπως µπορεί εύκολα να αποδειχθεί, η εξίσωση αυτή µεταπίπτει στην
κανονική εξίσωση Riccati, αν µηδενιστούν οι αβεβαιότητες και οι χρονικές
καθυστερήσεις. Στην περίπτωση αυτή, το πρόβληµα που διατυπώθηκε στην
παράγραφο 4.1, µεταπίπτει σ΄ ένα κανονικό πρόβληµα βέλτιστου ελέγχου, γραµµικού
τετραγωνικού ρυθµιστή.

4.3 Παράδειγµα

Έστω το σύστηµα 2ης τάξης της µορφής (4.1) µε ονοµαστικούς πίνακες

⎡ −2 1⎤ ⎡ −0.2 0.1⎤ ⎡0⎤ ⎡0⎤


A1 = ⎢ ⎥ , A2 = ⎢ ⎥ , B1 = ⎢ ⎥ , B2 = ⎢ ⎥
⎣ 0 1⎦ ⎣ 0 0.1⎦ ⎣1 ⎦ ⎣ 0.1⎦

και πίνακες αβεβαιότητας

⎡0 0⎤ ⎡ 0 0 ⎤ ⎡0⎤ ⎡ 0 ⎤
∆A1 = ⎢ ⎥ , ∆A2 = ⎢ ⎥ , ∆B1 = ⎢ ⎥ , ∆B2 = ⎢ ⎥
⎣0.1 0.1⎦ ⎣ 0.03 0.03⎦ ⎣ 0.1⎦ ⎣0.03⎦

Θεωρούµε κατ’ αρχάς έναν αυθαίρετο διαχωρισµό µοναδιαίας τάξης, για τον οποίο,

65
⎡0⎤ ⎡ 0 ⎤ ⎡1⎤ ⎡0⎤ ⎡ 0 ⎤
D1 = ⎢ ⎥ , D2 = ⎢ ⎥ , E1 = E2 = ⎢ ⎥ , F1 = ⎢ ⎥ , F2 = ⎢ ⎥ , G1 = G2 = 1
⎣0.1⎦ ⎣ 0.03⎦ ⎣1⎦ ⎣0.1⎦ ⎣ 0.03⎦

Οι πίνακες βάρους κατάστασης και ελέγχου του τετραγωνικού κριτηρίου επιδόσεων


είναι, αντίστοιχα, Q = I 2 , R = 4 . Από την επίλυση του προβλήµατος
ελαχιστοποίησης µε περιορισµούς LMI, όπως περιγράφεται στο Θεώρηµα 4.5,
προέκυψε η τιµή του εγγυηµένου κόστους J = 25.14 για βέλτιστο διαχωρισµό
µοναδιαίας τάξης, που αντιστοιχεί σε S1 = 0.66 , S 2 = 2.22 , T1 = 2.50 , T2 = 8.33 και
κέρδος ανάδρασης K = [ −0.24 −6.04] .

4.4 Συµπεράσµατα

Στο κεφάλαιο αυτό παρουσιάστηκε το πρόβληµα του εύρωστου ελέγχου


εγγυηµένου κόστους για την κλάση των γραµµικών συστηµάτων µε αβέβαιες
παραµέτρους και χρονικές καθυστερήσεις, που επηρεάζουν τόσο τον πίνακα
κατάστασης, όσο και τον πίνακα εξόδου του γραµµικού µοντέλου του συστήµατος.
Αποδείχθηκε ότι ένας γραµµικός νόµος ελέγχου ανάδρασης κατάστασης µε σταθερό
κέρδος εξασφαλίζει την τετραγωνική ευστάθεια, καθώς και ένα εγγυηµένο κόστος
του κλειστού συστήµατος, για κάθε αποδεκτή αβεβαιότητα και χρονική
καθυστέρηση. Ο έλεγχος αυτός προκύπτει από την επίλυση ενός προβλήµατος
εφικτότητας LMI. Οι επιδόσεις του συστήµατος αποκλίνουν από τη βέλτιστη
συµπεριφορά, µε την έννοια της σχεδίασης LQR, λόγω των αβεβαιοτήτων και των
χρονικών καθυστερήσεων. Ωστόσο, η υποβάθµιση των επιδόσεων είναι περιορισµένη
και αυτό εκφράζεται µε την τιµή του εγγυηµένου κόστους. Προκειµένου να
περιοριστεί η τιµή αυτή, επιλύεται ένα πρόβληµα LMI ελαχιστοποίησης. Ειδικότερα,
υπολογίζεται ο βέλτιστος διαχωρισµός µοναδιαίας τάξης των πινάκων αβεβαιότητας,
που οδηγεί στο ελάχιστο εγγυηµένο κόστος.

Λόγω της ύπαρξης αβέβαιων παραµέτρων και χρονικών καθυστερήσεων και


στους δύο πίνακες, κατάστασης και εισόδου, στη θεωρούµενη κλάση συστηµάτων, η
αντικειµενική συνάρτηση, που πρέπει να ελαχιστοποιηθεί, µέσω της µεθόδου LMI,
είναι µη κυρτή. Για το λόγο αυτό, στη µέθοδο, που ακολουθήθηκε στο Θεώρηµα 4.5,
ελαχιστοποιήθηκε ένα µέτρο της αντικειµενικής συνάρτησης, το οποίο εκφράζεται
από τα ίχνη κάποιων µεταβλητών βελτιστοποίησης. Εναλλακτικά, µπορούν να
χρησιµοποιηθούν τεχνικές στοχαστικής βελτιστοποίησης σε συνδυασµό µε τον
αλγόριθµο LMI, προκειµένου να βελτιστοποιηθεί ο µη γραµµικός όρος της
αντικειµενικής συνάρτησης. Τέλος, ας σηµειωθεί, ότι η µέθοδος, που παρουσιάστηκε
στο κεφάλαιο αυτό, µπορεί να επεκταθεί εύκολα σε συστήµατα µε πολλαπλές
χρονικές καθυστερήσεις.

66
Κεφάλαιο 5

Εύρωστη διευθέτηση πόλων

Όπως ήδη αναφέρθηκε στα προηγούµενα κεφάλαια, ο εύρωστος έλεγχος


γραµµικών αβέβαιων συστηµάτων µε τετραγωνικό δείκτη επιδόσεων εξετάζεται
συχνά στο πλαίσιο του ελέγχου εγγυηµένου κόστους. Έτσι, εξασφαλίζεται η
ασυµπτωτική ευστάθεια και ένα επιθυµητό επίπεδο επιδόσεων του κλειστού
συστήµατος, για όλες τις αβεβαιότητες µιας ορισµένης κλάσης. Ωστόσο, είναι
δυνατόν κάποιες από τις ιδιοτιµές του κλειστού συστήµατος να βρίσκονται σε τέτοιες
θέσεις, επάνω στο µιγαδικό επίπεδο, ώστε να προκαλούν ανεπιθύµητες χρονικές
αποκρίσεις και µικρά περιθώρια ευστάθειας. Αυτό συµβαίνει, όταν οι ιδιοτιµές
βρίσκονται σχετικά κοντά στον άξονα των φανταστικών αριθµών, δηλαδή έχουν
σχετικά µικρό πραγµατικό µέρος.

Προκειµένου να εξασφαλιστούν επιθυµητά χαρακτηριστικά της µεταβατικής


απόκρισης (όπως χρόνοι ανύψωσης και αποκατάστασης, ποσοστό µέγιστης
υπερύψωσης, απόσβεση) παρουσία αβεβαιοτήτων, πρέπει να σχεδιαστούν νόµοι
ελέγχου µε εύρωστη διευθέτηση πόλων, δηλαδή τέτοιοι ώστε οι ιδιοτιµές του κλειστού
συστήµατος να βρίσκονται σε προ-καθορισµένες περιοχές του µιγαδικού επιπέδου,
για όλες τις αβέβαιες παραµέτρους µιας ορισµένης κλάσης. Τα θέµατα αυτά
µελετήθηκαν στις εργασίες (Martin 1991, Duan et al. 2002) και θίγουν µόνο θέµατα
εύρωστης ανάλυσης. Το πρόβληµα της σύνθεσης νόµων ελέγχου για την εύρωστη
τοποθέτηση πόλων σε προ-επιλεγµένες περιοχές του µιγαδικού επιπέδου έχει επίσης
µελετηθεί στην πρόσφατη βιβλιογραφία (Arzelier et al. 1993, Garcia and Bernussou
1995, 1996, Chilali et al. 1999). Οι µέθοδοι αυτές βασίζονται στην έννοια της
τετραγωνικής d-ευστάθειας (Garcia and Bernussou 1995). Εξάλλου, µερικές µέθοδοι
εξετάζουν την εύρωστη τοποθέτηση πόλων σε συνδυασµό µε πρόσθετες
προδιαγραφές ελέγχου, όπως H 2 , H ∞ επιδόσεις (Garcia et al. 1995, Chilali and
Gahinet 1996, Moheimani and Petersen 1996, Garcia 1997, Garcia and Tarbouriech
1999). Οι µέθοδοι αυτές δίνουν ικανές και αναγκαίες συνθήκες για την ύπαρξη νόµων
ελέγχου που εξασφαλίζουν την εύρωστη τοποθέτηση πόλων. Στις περισσότερες
περιπτώσεις ο ελεγκτής προϋποθέτει την επίλυση µιας γενικευµένης εξίσωσης
Riccati. Τόσο η ύπαρξη λύσης όσο και οι συνθήκες που πρέπει να πληρούνται γι’
αυτή, είναι θέµατα προς µελέτη.

67
Στη συνέχεια, θα παρουσιαστεί ο εύρωστος έλεγχος εγγυηµένου κόστους µε
ταυτόχρονη τοποθέτηση των πόλων του κλειστού συστήµατος.

5.1 ∆ιατύπωση του προβλήµατος και βασικές έννοιες

Θεωρούµε το γραµµικό αβέβαιο σύστηµα σε περιγραφή χώρου κατάστασης,

x(t ) = ( A + ∆A) x(t ) + Bu (t )


x(t0 ) = x0 , t ∈ [t0 , ∞) (5.1)

όπου x (t ) ∈ R n είναι το διάνυσµα κατάστασης, u (t ) ∈ R m είναι το διάνυσµα ελέγχου,


A ∈ R n× n and B ∈ R n× m είναι οι πίνακες κατάστασης και ελέγχου, αντίστοιχα. Οι
αβεβαιότητες του συστήµατος ∆A περιγράφονται µε τη µορφή,

k
∆A = ∑ Ai ri (5.2)
i =0

όπου Ai ∈ R n× n , i = 1, 2,..., k είναι σταθεροί πίνακες και ri είναι βαθµωτές αβέβαιες


παράµετροι, που ανήκουν σ΄ ένα γνωστό και φραγµένο σύνολο,

ℜ = {r ∈ R k : ri ≤ r , i = 1, 2,..., k }; r > 0 (5.3)

Μια ισοδύναµη κανονικοποιηµένη περιγραφή µε r = 1 µπορεί επίσης να


χρησιµοποιηθεί, χωρίς να µειώνεται η γενικότητα του προβλήµατος. Ας σηµειωθεί,
ότι το θεωρούµενο µοντέλο (5.1) παρουσιάζει αβεβαιότητες µόνο στον πίνακα
κατάστασης. Η περιγραφή (5.2), (5.3) επιτρέπει το διαχωρισµό µοναδιαίας τάξης των
πινάκων αβεβαιότητας Ai ως εξής:

Ai = δ iε i , i = 1, 2,..., k
T
(5.4)

όπου δ i , ε i ∈ R n . Σηµειώνεται ότι ο διαχωρισµός (5.4) δεν είναι µοναδικός.


Ορίζονται οι ακόλουθοι συµµετρικοί και θετικά ορισµένοι πίνακες:

k k
T := ∑ δ iδ i , U := ∑ ε iε i
T T
(5.5)
i =1 i =1

Ο τετραγωνικός δείκτης επιδόσεων ή συνάρτηση κόστους



J ( x0 , u (.), t0 , ∆A) = ∫ [ xT (t )Qx(t ) + u T (t ) Ru (t )]dt (5.6)
t0

που συνδέεται µε το σύστηµα (5.1), πρέπει να ελαχιστοποιηθεί για µια κατάλληλη


τιµή της εισόδου ελέγχου. Υποθέτουµε ότι, (i) Q > 0 , (ii) R > 0 , (iii) το ζεύγος
( A, B) είναι ελέγξιµο και, (iv) το ζεύγος ( A, Q1/ 2 ) είναι παρατηρήσιµο.

68
Λόγω της ύπαρξης των αβεβαιοτήτων, το παραπάνω πρόβληµα
βελτιστοποίησης θα θεωρηθεί στο πλαίσιο του ελέγχου εγγυηµένου κόστους. Στη
συνέχεια, γνωστά αποτελέσµατα σχετικά µε το εγγυηµένο κόστος παρουσιάζονται
αναπροσαρµοσµένα για το θεωρούµενο σύστηµα.

Ορισµός 5.1
Έστω το σύστηµα (5.1)-(5.3) µε τετραγωνική συνάρτηση κόστους (5.6). Ένας νόµος
ελέγχου u (t ) : R n → R m , t ∈ [t0 , ∞) είναι ένας νόµος ελέγχου εγγυηµένου κόστους
(guaranteed cost control GCC), αν υπάρχει ένας θετικός αριθµός J , που λέγεται
εγγυηµένο κόστος, τέτοιος ώστε J ( x0 , u (.), t0 , ∆A) ≤ J , για κάθε αποδεκτή αβεβαιότητα
δηλαδή που πληροί τις (5.2), (5.3).

Θεώρηµα 5.2
Έστω το σύστηµα (5.1)-(5.3) µε τετραγωνική συνάρτηση κόστους (5.6). Ο
γραµµικός νόµος ελέγχου ανάδρασης κατάστασης

u (t ) = − R −1 BT Px(t ) (5.7)

είναι ένας νόµος ελέγχου εγγυηµένου κόστους και

T
J = x0 Px0 (5.8)

είναι ένα εγγυηµένο κόστος, αν υπάρχει ένας θετικά ορισµένος συµµετρικός πίνακας
P που ικανοποιεί τη γενικευµένη αλγεβρική εξίσωση Riccati

PA + AT P − P( BR −1 BT − T ) P + Q + U = 0 . (5.9)

Το κλειστό σύστηµα που προκύπτει είναι ασυµπτωτικά ευσταθές, για κάθε αποδεκτή
αβεβαιότητα.

Τώρα µπορεί να τεθεί το ακόλουθο πρόβληµα: Για το αβέβαιο σύστηµα (5.1)-


(5.3) µε τετραγωνικό κριτήριο επιδόσεων (5.6), ζητείται να βρεθεί ένας νόµος
ελέγχου εγγυηµένου κόστους, έτσι ώστε οι πόλοι του κλειστού συστήµατος να
βρίσκονται µέσα σε µια προκαθορισµένη περιοχή του αριστερού µιγαδικού ηµι-
επιπέδου, για όλες τις αποδεκτές αβεβαιότητες.

5.2 Έλεγχος εγγυηµένου κόστους µε προκαθορισµένο βαθµό ευστάθειας

Έστω το αβέβαιο σύστηµα (5.1)-(5.3). Είναι επιθυµητό οι καταστάσεις x(t ) να


τείνουν στο µηδέν εκθετικά, δηλαδή, όπως ο όρος e−α t , για κάποιο δεδοµένο α > 0
και για κάθε αποδεκτή αβεβαιότητα. Κατά συνέπεια, όλες οι ιδιοτιµές κλειστού
βρόχου του αβέβαιου συστήµατος θα βρίσκονται αριστερά του −α στο µιγαδικό
επίπεδο, δηλαδή το κλειστό αβέβαιο σύστηµα θα έχει βαθµό σχετικής ευστάθειας α .
Στην περίπτωση αυτή, ο δείκτης επιδόσεων παίρνει τη µορφή,

69

Jα ( x0 , u (.), t0 , ∆A) = ∫ e 2α t [ xT (t )Qx(t ) + uT (t ) Ru (t )]dt (5.10)
t0

Θεωρώντας τους µετασχηµατισµούς xˆ (t ) := eα t x(t ) και uˆ (t ) := eα t u (t ) των


διανυσµάτων κατάστασης και ελέγχου, αντίστοιχα, η περιγραφή κατάστασης του
µετασχηµατισµένου αβέβαιου συστήµατος γίνεται,

xˆ (t ) = ( A + ∆A + α I ) xˆ (t ) + Buˆ (t )
xˆ (t0 ) = xˆ0 = eα t0 x0 (5.11)

και ο αντίστοιχος δείκτης επιδόσεων είναι,


Jˆ ( xˆ0 , uˆ (.), t0 , ∆A) = ∫ [ xˆ T (t )Qxˆ (t ) + uˆ T (t ) Ruˆ (t )]dt (5.12)
t0

Θεώρηµα 5.3
Έστω το αβέβαιο σύστηµα (5.1)-(5.3) µε τετραγωνική συνάρτηση κόστους (5.10). Ο
νόµος ελέγχου

u * (t ) = − R −1 BT P* x(t ) (5.13)

είναι ένας νόµος ελέγχου εγγυηµένου κόστους που εξασφαλίζει βαθµό σχετικής
ευστάθειας α , για όλες τις αποδεκτές αβεβαιότητες, αν υπάρχει ένας θετικά
ορισµένος συµµετρικός πίνακας P* που ικανοποιεί τη γενικευµένη αλγεβρική
εξίσωση Riccati,

P* ( A + α I ) + ( A + α I )T P* − P* ( BR −1 BT − T ) P* + Q + U = 0 . (5.14)

Το αντίστοιχο εγγυηµένο κόστος είναι,

J * = x0 e 2α t0 P* x0
T
(5.15)

Απόδειξη: Η απόδειξη προκύπτει από την επέκταση του Θεωρήµατος 5.2 στο
µετασχηµατισµένο σύστηµα (5.11) µε τετραγωνική συνάρτηση κόστους (5.12).

Στη συνέχεια, θα προσδιοριστεί µια λύση της (5.14), που να ελαχιστοποιεί το


εγγυηµένο κόστος (5.15), µε τη χρήση LMI. Επειδή ο διαχωρισµός (5.4) δεν είναι
µοναδικός, αναζητείται ο βέλτιστος, για τον οποίο µπορεί να υπάρχει µια θετικά
ορισµένη λύση της (5.14), που να ελαχιστοποιεί την (5.15). Για το σκοπό αυτό, το
γινόµενο της (5.4) παραµετροποιείται ως εξής:

δ iε iT = σ iδ i (1/ σ i )ε iT , i = 1, 2,..., k (5.16)

όπου σ i είναι θετικές βαθµωτές ποσότητες. Ορίζονται οι πίνακες,

70
D := [δ1 ,..., δ k ] , E := [ε1 ,..., ε k ] , S := diag (σ 1 ,..., σ k ) (5.17)

Ακόµη, οι αρχικές συνθήκες θεωρούνται τυχαίες µεταβλητές µε µηδενική µέση τιµή


και µοναδιαία συσχέτιση και θεωρείται ακόµη η προσδοκία της συνάρτησης κόστους.
Είναι γνωστό ότι στην περίπτωση αυτή το εγγυηµένο κόστος (5.15) ισοδυναµεί µε το
ίχνος του P* . Μια ικανή συνθήκη για τον έλεγχο εγγυηµένου κόστους που
εξασφαλίζει ένα προκαθορισµένο βαθµό σχετικής ευστάθειας και ελαχιστοποιεί το
εγγυηµένο κόστος, δίνεται από το παρακάτω θεώρηµα.

Θεώρηµα 5.4
Έστω το αβέβαιο σύστηµα (5.1)-(5.3) µε τυχαίες αρχικές συνθήκες και µε
τετραγωνική συνάρτηση κόστους (5.10). Αν το ακόλουθο πρόβληµα
βελτιστοποίησης,

min Tr ( M ) (5.18)
M ,W , S

µε περιορισµούς LMI

⎡M I⎤
⎢I >0 (5.19)
⎣ W ⎥⎦

⎡ −W ( A + α I )T − ( A + α I )W + BR −1 BT − DSDT WE T W ⎤
⎢ ⎥
⎢ EW S 0 ⎥ > 0 (5.20)
⎢ W 0 Q0 ⎥⎦
−1

έχει ένα µη κενό σύνολο εφικτών λύσεων (M, W, S), µε Μ και W συµµετρικούς και
θετικά ορισµένους πίνακες, S διαγώνιο και θετικά ορισµένο πίνακα και Q0 θετικά
ορισµένο πίνακα, έτσι ώστε Q0 < Q , τότε ο νόµος ελέγχου,

u * (t ) = − R −1 BT W −1 x(t ) (5.21)

είναι ένας νόµος ελέγχου εγγυηµένου κόστους, που εξασφαλίζει ένα προκαθορισµένο
βαθµό σχετικής ευστάθειας α , για όλες τις αποδεκτές αβεβαιότητες. Το αντίστοιχο
εγγυηµένο κόστος,

J * = Tr ( P* ) (5.22)

P* = W −1 (5.23)

είναι ελάχιστο.

Απόδειξη: Εφαρµόζοντας το συµπλήρωµα του Schur στην (5.20) και


πολλαπλασιάζοντας επί W −1 , από αριστερά και δεξιά, και τα δύο µέλη της
ανισότητας που προκύπτει, παίρνουµε,

71
( A + α I )T P* + P* ( A + α I ) − P* ( BR −1 BT − DSDT ) P* + E T S −1 E + Q0 < 0 (5.24)

Η ανισότητα αυτή ικανοποιείται για οποιοδήποτε Q0 < Q , αν

( A + α I )T P* + P* ( A + α I ) − P* ( BR −1 BT − DSDT ) P* + E T S −1 E + Q = 0 (5.25)

Χρησιµοποιώντας την (5.5) και την (5.17), η (5.25) γίνεται,

( A + α I )T P* + P* ( A + α I ) − P* ( BR −1 BT − T ) P* + U + Q = 0 (5.26)

η οποία είναι της ίδιας µορφής µε την (5.14). Άρα, λόγω του Θεωρήµατος (5.3), ο
νόµος ελέγχου (5.21) είναι ο νόµος ελέγχου εγγυηµένου κόστους µε προκαθορισµένο
βαθµό σχετικής ευστάθειας α . Το αντίστοιχο εγγυηµένο κόστος είναι το (5.22).

Επιπλέον, η εφαρµογή του συµπληρώµατος Schur στην (5.19) δίνει M > P* .


Άρα, η ελαχιστοποίηση του tr ( M ) συνεπάγεται την ελαχιστοποίηση του tr ( P* ) . Το
αποτέλεσµα αυτό είναι βέλτιστο λόγω της κυρτότητας, τόσο της αντικειµενικής
συνάρτησης (5.18), όσο και των περιορισµών (5.19) και (5.20).

5.3 Μετατόπιση πόλων µε την τροποποίηση του πίνακα βάρους (Kosmidou and
Mitroglou 2006)

Κατά το σχεδιασµό συστηµάτων χωρίς αβεβαιότητες, η επιλογή των πινάκων


βάρους του δείκτη επιδόσεων µπορεί να θεωρηθεί ως ένα σχεδιαστικό εργαλείο, που
επιτρέπει τη βελτίωση κάποιων χαρακτηριστικών του κλειστού συστήµατος, όπως
απαιτούµενη ενέργεια ελέγχου και περιθώρια ευρωστίας του ελέγχου LQR (Safonov
and Athans 1977). Σε µερικές περιπτώσεις, οι θέσεις των πόλων του κλειστού
συστήµατος σχετίζονται µε την επιλογή των πινάκων βάρους (Stein 1979, Shieh et al.
1986, Wittenmark et al. 1987). Τα θέµατα αυτά εξετάζονται εδώ και για την
περίπτωση των αβέβαιων συστηµάτων.

Έστω το σύστηµα (5.1)-(5.3) µε τετραγωνική συνάρτηση κόστους (5.6).


Όπως είναι γνωστό, ο νόµος ελέγχου εγγυηµένου κόστους προκύπτει από την επίλυση
της γενικευµένης αλγεβρικής εξίσωσης Riccati (5.9). Υποθέτουµε, ότι ο συµµετρικός
και θετικά ορισµένος πίνακας T µπορεί να γραφεί µε τη µορφή T = BTB ˆ T . Αυτό
ισχύει, όταν οι αβεβαιότητες ικανοποιούν τις συνθήκες προσαρµογής. Τότε, η (5.9)
γίνεται,

PA + AT P − PBRˆ −1 BT P + Qˆ = 0 (5.27)

όπου Rˆ −1 = R −1 − Tˆ and Q̂ = Q + U . Ο νόµος ελέγχου,

u (t ) = − Rˆ −1 BT Px(t ) (5.28)

δίνει το κλειστό ονοµαστικό σύστηµα,

72
x(t ) = ( A − BRˆ −1 BT P) x(t ) = Fx(t ) (5.29)

Το αντίστοιχο αβέβαιο σύστηµα είναι

x(t ) = ( F + ∆A) x(t ) . (5.30)

Στη συνέχεια, θα µελετηθεί η σχέση µεταξύ του P και της ιδιο-δοµής του F µε την
ιδιο-δοµή και το φάσµα του Hamiltonian πίνακα

⎡ A − BR −1 BT + T ⎤
H =⎢ ⎥ (5.31)
⎣ −Q − U − AT ⎦

που συνδέεται µε την (5.9). Έστω ο H σε µορφή Jordan,

⎡ A − BR −1 BT + T ⎤ ⎡ X 0 W0 ⎤ ⎡ X 0 W0 ⎤ ⎡ Λ s 0⎤
⎢ ⎥⎢ ⎥=⎢ ⎥⎢ Λ u ⎥⎦
(5.32)
⎣ −Q − U − AT ⎦ ⎣ Y0 Z 0 ⎦ ⎣ Y0 Z 0 ⎦ ⎣ 0

όπου Λ s και Λ u είναι οι διαγώνιοι πίνακες των ευσταθών και ασταθών ιδιοτιµών του
H , αντίστοιχα. Είναι γνωστό, ότι, αν το ζεύγος ( A, B) είναι σταθεροποιήσιµο, τότε
−1
P = Y0 X 0 και FX 0 = X 0 Λ s (Martenson 1971, Medanic 1982). Επιπλέον, αν το
ζεύγος ( A, B) είναι πλήρως ελέγξιµο, τότε ο συµµετρικός και αρνητικά ορισµένος
−1
πίνακας Pu = Z 0W0 υπάρχει και είναι επίσης λύση της (5.9). Με βάση τα παραπάνω,
θα αποδειχθεί στη συνέχεια, ότι εισάγοντας ένα βαθµό σχετικής ευστάθειας α και
αντικαθιστώντας τον πίνακα βάρους κατάστασης Q µε Q + ∆Q , όπου ∆Q = −2α Pu ,
στη συνάρτηση κόστους, οι ιδιοτιµές του κλειστού ονοµαστικού συστήµατος
µετατοπίζονται κατά −2α . Πράγµατι, σύµφωνα µε το αποτέλεσµα της παραγράφου
5.2, η γενικευµένη εξίσωση Riccati για το αβέβαιο σύστηµα (5.1)-(5.3) µε βαθµό
σχετικής ευστάθειας α και µε τροποποιηµένο πίνακα βάρους κατάστασης, γίνεται,

P ( A + α I ) + ( A + α I )T P − P ( BR −1 BT − T ) P + Q + U − 2α Pu = 0 (5.33)

Ο αντίστοιχος Hamiltonian πίνακας είναι,

⎡ A+αI − BR −1 BT + T ⎤
H =⎢ ⎥ (5.34)
⎣ −Q − U + 2α Pu −( A + α I )T ⎦

Επεκτείνοντας γνωστά αποτελέσµατα (Medanic 1988), προκύπτουν σηµαντικές


ιδιότητες της (5.33).

Λήµµα 5.5
Έστω Pu η αρνητικά ορισµένη λύση της (5.33) που συνδέεται µε τις ασταθείς
ιδιοτιµές του H . Τότε,

Pu = Pu (5.35)

73
Λήµµα 5.6
Οι ασταθείς ιδιοτιµές των H και H συνδέονται µε τη σχέση,

Λu = Λu + α I (5.36)

και οι αντίστοιχοι αµετάβλητοι υπο-χώροι ικανοποιούν τη σχέση,

⎪⎧ ⎡W ⎤ ⎫⎪ ⎪⎧ ⎡W ⎤ ⎪⎫
R ⎨⎢ 0 ⎥ ⎬ = R ⎨⎢ 0 ⎥ ⎬ (5.37)
⎪⎩ ⎣ Z 0 ⎦ ⎪⎭ ⎩⎪ ⎣ Z 0 ⎦ ⎭⎪

όπου R{.} συµβολίζει την τάξη του χώρου.

Τώρα µπορεί να αποδειχθεί το παρακάτω θεώρηµα.

Θεώρηµα 5.7
Έστω Λ s το φάσµα του κλειστού συστήµατος (5.29) για κάποιους δεδοµένους
πίνακες βάρους Q και R . Ακόµη, έστω ότι (i) εισάγεται βαθµός σχετικής ευστάθειας
α και (ii) ο πίνακας βάρους κατάστασης Q τροποποιείται κατά

∆Q = −2α Pu (5.38)

όπου Pu είναι η αρνητικά ορισµένη λύση της (5.9). Τότε, το φάσµα Λ ( Fs ) του
ονοµαστικού κλειστού συστήµατος µε βαθµό σχετικής ευστάθειας α και
τροποποιηµένο δείκτη επιδόσεων είναι,

Λ ( Fs ) = Λ s − 2α I (5.39)

Απόδειξη: Το ονοµαστικό κλειστό σύστηµα µε βαθµό σχετικής ευστάθειας α και


τροποποιηµένο δείκτη επιδόσεων προκύπτει από τη θετικά ορισµένη λύση Ps της
(5.33) και άρα,

x(t ) = ( A − BRˆ −1 BT Ps ) x(t ) = Fs x(t ) (5.40)

Εξάλλου, από την (5.34) έπεται ότι οι ευσταθείς ιδιοτιµές του H είναι και οι
ιδιοτιµές του
Fs = A + α I − BRˆ −1 BT Ps (5.41)

Είναι προφανές, ότι

Fs = Fs − α I (5.42)

και άρα,

Λ ( Fs ) = Λ ( Fs ) − α I (5.43)

74
Επειδή οι ασταθείς ιδιοτιµές του H µετατοπίζονται κατά α , ως προς τις ασταθείς
ιδιοτιµές του H (Λήµµα 5.6) και επειδή ο H είναι συµπλεκτικός πίνακας, οι
ευσταθείς ιδιοτιµές του H µετατοπίζονται κατά −α , ως προς τις ευσταθείς ιδιοτιµές
του H , δηλαδή,

Λ s = Λ ( Fs ) = Λ s − α I (5.44)

Τώρα, η (5.39) έπεται από τις (5.43) και (5.44).

Παρατήρηση 5.8
Το Θεώρηµα 5.7 συνεπάγεται ότι εφαρµόζοντας το νόµο ελέγχου

u (t ) = − Rˆ −1 BT Ps x(t ) (5.45)

όπου Ps είναι η θετικά ορισµένη λύση της (5.33), στο αβέβαιο σύστηµα (5.1)-(5.3), οι
ιδιοτιµές του ονοµαστικού κλειστού συστήµατος µετατοπίζονται κατά −2α . Ακόµη,
σύµφωνα µε τα αποτελέσµατα της παραγράφου 5.2, οι ιδιοτιµές του αβέβαιου
συστήµατος βρίσκονται αριστερά του −α , για όλες τις αποδεκτές αβεβαιότητες.

Ο νόµος ελέγχου (5.45) προϋποθέτει την ύπαρξη λύσεων των εξισώσεων


(5.9) και (5.33). Ας σηµειωθεί, ότι οι σταθεροί όροι των εξισώσεων αυτών είναι
θετικά ορισµένοι. Οι αντίστοιχοι τετραγωνικοί όροι πρέπει να είναι επίσης θετικοί.
Ωστόσο, αυτή η συνθήκη είναι απλά ικανή: στην πραγµατικότητα, είναι δυνατόν να
υπάρχουν λύσεις των (5.9) και (5.33), ακόµη και όταν οι τετραγωνικοί όροι δεν είναι
θετικά ορισµένοι. Επιπλέον, επειδή ο διαχωρισµός των πινάκων αβεβαιότητας στην
(5.4) δεν είναι µοναδικός, είναι δυνατόν να µη χρειάζεται να ισχύουν οι συνθήκες
προσαρµογής, για κάποια κατάλληλη επιλογή του διαχωρισµού αυτού. Για τους
λόγους αυτούς και, προκειµένου το εγγυηµένο κόστος να είναι ελάχιστο, προτείνεται
µια λύση µε LMI, που περιγράφεται στον παρακάτω αλγόριθµο.

Αλγόριθµος 5.9

Βήµα 1: Για το σύστηµα (5.1)-(5.3) µε τετραγωνικό κριτήριο κόστους (5.6), επιλύεται


το πρόβληµα ελαχιστοποίησης αντικειµενικής συνάρτησης,

min Tr ( M )
M ,W , S

µε περιορισµούς LMI

⎡M I⎤
(i) ⎢ >0
⎣I W ⎥⎦

⎡ −WAT − AW + BR −1 BT − DSDT WE T W ⎤
⎢ ⎥
(ii) ⎢ EW S 0 ⎥>0
⎢ W 0 Q0 ⎥⎦
−1

75
για έναν αυθαίρετο διαχωρισµό της αβεβαιότητας και για κάποιο Q0 < Q . Αν υπάρχει
µια εφικτή λύση, τότε ο S προσδιορίζει τον κατάλληλο διαχωρισµό µοναδιαίας
τάξης της µορφής (5.4), σύµφωνα µε την (5.16), για τον οποίο µια θετικά ορισµένη
λύση της (5.9) P = W −1 υπάρχει και ελαχιστοποιεί το αντίστοιχο εγγυηµένο κόστος.
Οι πίνακες T και U προσδιορίζονται σύµφωνα µε την (5.5) και παραµένουν
σταθεροί.

Βήµα 2: Υπολογίζεται η αρνητικά ορισµένη λύση Pu που συσχετίζεται µε την P .


Προσδιορίζεται το ∆Q = −2α Pu για µια δεδοµένη τιµή του α .

Βήµα 3: Επιλύεται το LMI πρόβληµα ελαχιστοποίησης

min Tr ( M )
M ,W

µε περιορισµούς LMI

⎡M I⎤
(i) ⎢ ⎥>0
⎣I W⎦

⎡ −W ( A + α I )T − ( A + α I )W + BR −1 B − T W ⎤
(ii) ⎢ −1 ⎥
>0
⎢⎣ W Q0 ⎥⎦

για κάποιο Q0 < Q + U − 2α Pu . Αν υπάρχει µια εφικτή λύση, τότε η θετικά ορισµένη
λύση της (5.33) είναι η P = W −1 και ελαχιστοποιεί το αντίστοιχο εγγυηµένο κόστος.

5.4 Παράδειγµα

Έστω το αβέβαιο σύστηµα 2ης τάξης µε περιγραφή κατάστασης,

⎡ 0 1⎤ ⎡ 0 1 ⎤ ⎡0 ⎤
A=⎢ ⎥ , A + ∆A = ⎢ ⎥ , B=⎢ ⎥
⎣ −1 2 ⎦ ⎣ −1 + r1 2 + r2 ⎦ ⎣1 ⎦

όπου r1 ≤ 1 , r2 ≤ 1 . Οι πίνακες βάρους του δείκτη επιδόσεων είναι Q = I 2 , R = 1 . Η


αβεβαιότητα του συστήµατος περιγράφεται από τη σχέση ∆A = A1r1 + A2 r2 . Έστω
ένας αυθαίρετος διαχωρισµός της µορφής,

⎡0 0⎤ ⎡0⎤ ⎡0 0⎤ ⎡0 ⎤
= ⎢ ⎥ [1 0] = δ1ε1 , A2 = ⎢ = ⎢ ⎥ [ 0 1] = δ 2ε 2 .
T T
A1 = ⎢ ⎥ ⎥
⎣1 0 ⎦ ⎣1 ⎦ ⎣ 0 1 ⎦ ⎣1 ⎦

Είναι προφανές, ότι το ανοικτό ονοµαστικό σύστηµα είναι ασταθές. Οι ιδιοτιµές του
ανοικτού συστήµατος για όλες τις τιµές των αβέβαιων παραµέτρων του φαίνονται στο

76
Σχήµα 5.1. Παρατηρούµε ότι το ανοικτό σύστηµα είναι ασταθές για το σύνολο των
τιµών των αβέβαιων παραµέτρων του.

Σχήµα 5.1 Θέσεις των ιδιοτιµών του αβέβαιου ανοικτού συστήµατος

Το κέρδος ανάδρασης του ελεγκτή εγγυηµένου κόστους, όπως προκύπτει από την
εφαρµογή του Θεωρήµατος 5.5, είναι K = [1.90 6.73] και το αντίστοιχο εγγυηµένο
κόστος είναι J = 14.47 . Οι ιδιοτιµές του κλειστού συστήµατος σε διάφορα σηµεία
της περιοχής αβεβαιότητας έχουν πραγµατικά µέρη που φαίνονται στον Πίνακα 5.1.

r1 = r2 = 0 r1 = r2 = −1 r1 = r2 = 1 r1 = 1, r2 = −1 r1 = 0, r2 = −1 r1 = 1, r2 = 0
λ1 -0.72 -0.78 -0.60 -0.35 -0.56 -0.44
λ2 -4.01 -4.94 -3.12 -5.38 -5.17 -4.29

Πίνακας 5.1 Πραγµατικά µέρη των ιδιοτιµών κλειστού βρόχου που λαµβάνεται µε
τον έλεγχο εγγυηµένου κόστους, σε διάφορα σηµεία της περιοχής αβεβαιότητας

Είναι φανερό ότι µε την εφαρµογή του εύρωστου ελεγκτή εγγυηµένου κόστους, το
κλειστό σύστηµα έχει σταθεροποιηθεί. Οι ιδιοτιµές του κλειστού συστήµατος για
όλες τις τιµές των αβέβαιων παραµέτρων του φαίνονται στο Σχήµα 5.2 από το οποίο
καταδεικνύεται η σταθεροποίηση του αβέβαιου συστήµατος στο πεδίο αβεβαιοτήτων.
Ωστόσο, σε κάποια σηµεία της περιοχής αβεβαιότητας οι αντίστοιχες ιδιοτιµές
βρίσκονται σχετικά κοντά στον άξονα των φανταστικών αριθµών.

77
Σχήµα 5.2 Θέσεις των ιδιοτιµών του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο εγγυηµένου κόστους

Προκειµένου να ικανοποιηθούν οι προδιαγραφές της µεταβατικής απόκρισης,


εισάγεται βαθµός σχετικής ευστάθειας α = 1 . Εφαρµόζοντας τον Αλγόριθµο 5.9,
προκύπτει το κέρδος ελέγχου εγγυηµένου κόστους K = [15.11 11.45] για S = 0.17
και ελάχιστο εγγυηµένο κόστος J = 103.74 . Τα πραγµατικά µέρη των αντίστοιχων
ιδιοτιµών κλειστού βρόχου σε διάφορα σηµεία της περιοχής αβεβαιότητας δίνονται
στον Πίνακα 5.2.

r1 = r2 = 0 r1 = r2 = −1 r1 = r2 = 1 r1 = 1, r2 = −1 r1 = 0, r2 = −1 r1 = 1, r2 = 0
λ1 -2.23 -2.03 -2.57 -1.73 -1.88 -2.03
λ2 -6.82 -8.41 -5.88 -8.71 -8.57 -7.41

Πίνακας 5.2 Πραγµατικά µέρη των ιδιοτιµών κλειστού βρόχου που λαµβάνεται από
τον έλεγχο εγγυηµένου κόστους µε βαθµό σχετικής ευστάθειας και τροποποίηση του
πίνακα βάρους, σε διάφορα σηµεία της περιοχής αβεβαιότητας

Οι µετατοπισµένες ιδιοτιµές του κλειστού συστήµατος για διάφορες τιµές των


αβέβαιων παραµέτρων του φαίνονται στο Σχήµα 5.3.

78
Σχήµα 5.3 Θέσεις των µετατοπισµένων ιδιοτιµών του κλειστού συστήµατος

Σηµειώνεται ότι οι ιδιοτιµές του ονοµαστικού κλειστού συστήµατος (δηλ. για


r1 = r2 = 0 ) πρέπει να µετατοπιστούν κατά −2α = −2 . Στο παράδειγµα αυτό, η
µετατόπιση είναι λίγο διαφορετική από -2, λόγω του προσεγγιστικού χαρακτήρα του
αλγορίθµου LMI. Οι ιδιοτιµές κλειστού βρόχου σε διάφορα σηµεία της περιοχής
αβεβαιότητας είναι κι αυτές µετατοπισµένες και βρίσκονται όλες αριστερά του -1.
Τέλος, σηµειώνεται ότι η µέθοδος αυτή απαιτεί µεγαλύτερη προσπάθεια ελέγχου και
αυτό εκφράζεται µε µεγαλύτερες τιµές, τόσο του κέρδους ελέγχου, όσο και του
εγγυηµένου κόστους.

5.5 Συµπεράσµατα

Η µέθοδος εύρωστου ελέγχου, που περιγράφηκε στο κεφάλαιο αυτό,


συνδυάζει τα πλεονεκτήµατα τόσο του ελέγχου εγγυηµένου κόστους, όσο και της
τοποθέτησης των πόλων του κλειστού συστήµατος σε προεπιλεγµένη περιοχή. Αυτό
επιτυγχάνεται µε την τροποποίηση του πίνακα βάρους κατάστασης του δείκτη
επιδόσεων και µε την εισαγωγή ενός κατάλληλου βαθµού σχετικής ευστάθειας α .
Τότε, οι ιδιοτιµές του κλειστού ονοµαστικού συστήµατος µετατοπίζονται κατά −2α ,
ενώ αυτές του αβέβαιου συστήµατος τοποθετούνται αριστερά του −α , επάνω στο
µιγαδικό επίπεδο, για όλες τις αποδεκτές αβεβαιότητες. Οι επιθυµητές προδιαγραφές
της χρονικής απόκρισης εξασφαλίζονται µε την κατάλληλη επιλογή του α . Το
κλειστό σύστηµα, που προκύπτει µε τον έλεγχο αυτό, έχει ιδιότητες ευρωστίας όµοιες
µε αυτές που χαρακτηρίζουν τον έλεγχο LQR. Εξάλλου, η ιδιότητα εγγυηµένου
κόστους εξακολουθεί να ισχύει, ως προς τον τροποποιηµένο δείκτη επιδόσεων. Η
µέθοδος αυτή µπορεί να επεκταθεί και στην περίπτωση που απαιτείται η µετατόπιση
όχι του συνόλου των ιδιοτιµών, αλλά ενός µέρους αυτών.

79
Κεφάλαιο 6

Έλεγχος µε πολλαπλές αντικειµενικές συναρτήσεις

Σε πολλά πρακτικά προβλήµατα σχεδιασµού συστηµάτων πρέπει να


αντιµετωπιστούν, όχι µόνο οι αβεβαιότητες του συστήµατος, αλλά και πολλαπλές
προδιαγραφές ελέγχου, οι οποίες εκφράζονται µε τη µορφή πολλαπλών
αντικειµενικών συναρτήσεων. Έτσι, οδηγούµαστε στη διατύπωση ενός προβλήµατος
βελτιστοποίησης πολλαπλών αντικειµενικών συναρτήσεων. Το πρόβληµα αυτό έχει
µελετηθεί στη βιβλιογραφία στο πλαίσιο του ελέγχου H ∞ / H 2 ή µε τη µορφή µικτών
προδιαγραφών, δηλαδή τόσο προδιαγραφών στο πεδίο του χρόνου, όσο και στο
πεδίο της συχνότητας (Elia and Dahleh 1997, Scherer et al. 1997, Dorato et al. 1996,
1997). Ειδικότερα, στην εργασία (Dorato et al. 1998) προτείνεται ένας νόµος ελέγχου
εγγυηµένου κόστους µε πολλαπλές αντικειµενικές συναρτήσεις για την κλάση των
γραµµικών συστηµάτων µε αβέβαιες παραµέτρους στον πίνακα κατάστασης. Η
µεθοδολογία που προτείνεται βασίζεται στη βελτιστοποίηση κατά Pareto.

Στο κεφάλαιο αυτό θα µελετηθεί το πρόβληµα του εύρωστου ελέγχου για την
κλάση των γραµµικών αβέβαιων συστηµάτων, όταν υπάρχουν πολλαπλές
προδιαγραφές ελέγχου. Σε κάποια προβλήµατα, µια από τις προδιαγραφές είναι και η
απόρριψη σήµατος εξωτερικής διαταραχής. Θα χρησιµοποιηθούν τόσο τεχνικές
ελέγχου H ∞ / H 2 , όσο και τεχνικές LMI βελτιστοποίησης, προκειµένου, παράλληλα,
να ελαχιστοποιείται το εγγυηµένο κόστος, το οποίο αποτελεί ένα άνω φράγµα όλων
των θεωρούµενων αντικειµενικών συναρτήσεων.

6.1 ∆ιατύπωση του προβλήµατος και βασικές έννοιες

Θεωρούµε το γραµµικό αβέβαιο σύστηµα, όπως περιγράφηκε στο κεφάλαιο 3,

x(t ) = ( A + ∆ A) x(t ) + ( B + ∆ B)u (t ) , t ∈ [0, ∞) (6.1)


x(0) = x0

80
όπου x(t ) ∈ R n είναι το διάνυσµα κατάστασης, u (t ) ∈ R m είναι το διάνυσµα ελέγχου,
A ∈ R n×n και B ∈ R n×m είναι οι πίνακες κατάστασης και ελέγχου, αντίστοιχα. Οι
αβεβαιότητες του συστήµατος περιγράφονται µε τη µορφή γραµµικών συναρτήσεων,
k
∆ A = ∑ Ai ri
i =1
l
(6.2)
∆ B = ∑ Bi pi
i =1

όπου Ai , i = 1, 2,..., k και Bi , i = 1, 2,..., l είναι σταθεροί πίνακες κατάλληλων


διαστάσεων και ri , pi είναι βαθµωτές αβέβαιες παράµετροι που µπορούν να είναι και
χρονικά µεταβαλλόµενες. Με αυτές ορίζονται διανύσµατα αβέβαιων παραµέτρων που
υποθέτουµε ότι ανήκουν σε γνωστά και φραγµένα σύνολα, ως εξής,

ℜ := {r ∈ R k : ri ≤ r , i = 1, 2,..., k}; r > 0 (6.3)

ℑ := { p ∈ R l : pi ≤ p, i = 1, 2,..., l}; p > 0 . (6.4)

Λόγω της γραµµικότητας, η περιγραφή (6.2) µπορεί να κανονικοποιηθεί, έτσι


ώστε να ισχύει r = p = 1 , χωρίς να µειώνεται η γενικότητα του προβλήµατος.
Επιπλέον, επιτρέπει στους πίνακες αβεβαιότητας Ai , Bi να έχουν µοναδιαία τάξη και
κατά συνέπεια να γραφούν µε τη µορφή γινοµένων διανυσµάτων καταλλήλων
διαστάσεων,

T
Ai = di ei , i = 1, 2,..., k , (6.5)

T
Bi = f i gi , i = 1, 2,..., l . (6.6)

Ας σηµειωθεί, ότι ο παραπάνω διαχωρισµός δεν είναι µοναδικός. Χρησιµοποιώντας


τα διανύσµατα αυτά, ορίζονται οι παρακάτω συµµετρικοί, θετικά ορισµένοι πίνακες,

D := [d1...d k ] , F := [ f1... f l ]
E := [e1...ek ] , G := [ g1...gl ] (6.7)
S := diag (σ 1...σ k ) , T := diag (τ 1...τ l ) .

όπου σ i ,τ i είναι θετικές βαθµωτές ποσότητες που πρέπει να επιλεγούν µέσω της
σχεδίασης.

Θεωρούµε επίσης πολλαπλές αντικειµενικές συναρτήσεις µε τη µορφή


τετραγωνικών δεικτών επιδόσεων,

J i ( x0 , ∆Α, ∆ B, t ) = ∫ [ xT (t )Qi x(t ) + u T (t ) Ri u (t )]dt (6.8)
0

81
όπου Qi > 0 , Ri > 0 , i = 1,..., ρ .

Το πρόβληµα του εύρωστου ελέγχου εγγυηµένου κόστους µε πολλαπλές


αντικειµενικές συναρτήσεις συνίσταται στην εύρεση ενός γραµµικού νόµου ελέγχου
ανάδρασης κατάστασης της µορφής

u (t ) = Kx(t ) (6.9)

έτσι ώστε οι αντίστοιχες τιµές όλων των δεικτών επιδόσεων (6.8) να γίνονται όσο το
δυνατόν µικρότερες και να παραµένουν άνω φραγµένες, για κάθε αποδεκτή
αβεβαιότητα, δηλαδή σύµφωνα µε τις (6.3), (6.4).

Είναι προφανές, ότι για ρ = 1 το πρόβληµα µεταπίπτει στην περίπτωση του


εύρωστου ελέγχου εγγυηµένου κόστους µε µια αντικειµενική συνάρτηση, που έχει
µελετηθεί διεξοδικά στο κεφάλαιο 3.

6.2 Βελτιστοποίηση LMI πολλαπλών αντικειµενικών συναρτήσεων

Υποθέτοντας ότι οι αρχικές τιµές των µεταβλητών κατάστασης είναι τυχαίες


µεταβλητές µε µηδενική µέση τιµή και µοναδιαίο πίνακα συσχέτισης, οι δείκτες
επιδόσεων (6.8) περιγράφονται από τις αντίστοιχες προσδοκίες,

J i ( x0 , ∆Α, ∆ B, t ) = E{∫ [ xT (t )Qi x(t ) + uT (t ) Ri u (t )]dt} (6.10)
0

Σύµφωνα µε τα αποτελέσµατα του κεφαλαίου 3, ένα άνω φράγµα όλων των


παραπάνω δεικτών επιδόσεων προϋποθέτει την ύπαρξη ενός θετικά ορισµένου πίνακα
P και θετικών βαθµωτών ποσοτήτων δ i , που να ικανοποιούν τις ακόλουθες
γενικευµένες αλγεβρικές εξισώσεις Riccati,

−1 −1 −1 −1
PA + AT P − P (δ i BRi BT − δ i BRi GTi GT Ri BT − FTi F T − DSi DT ) P + ESi E T + Qi = 0
2

(6.11)
για i = 1,..., ρ . Τότε, ο νόµος ελέγχου εγγυηµένου κόστους είναι της µορφής

−1
u (t ) = −δ i Ri BT Px(t ) (6.12)

και εξασφαλίζει ότι,

J i ≤ tr ( P) , ∀i = 1,..., ρ . (6.13)

Είναι γνωστό, ότι οι (6.11) δεν έχουν (κοινή) αναλυτική λύση. Ωστόσο, µια θετικά
ορισµένη λύση µπορεί να βρεθεί υπολογιστικά, εφόσον υπάρχει, µε κατάλληλη
επιλογή των παραµέτρων δ i , η οποία γίνεται µε δοκιµή και σφάλµα. Ακόµη,
εναλλακτικοί διαχωρισµοί µοναδιαίας τάξης µέσω των παραµέτρων των Si , Ti δίνουν
περισσότερους βαθµούς ελευθερίας σχεδιασµού, έτσι ώστε να επιτυγχάνεται και η

82
ελαχιστοποίηση του εγγυηµένου κόστους. Όµως, µε όλες αυτές τις δυνατές επιλογές
ο υπολογισµός της λύσης P καθίσταται εξαιρετικά πολύπλοκος. Αντίθετα, η
θεώρηση του παραπάνω προβλήµατος στο πλαίσιο της βελτιστοποίησης µε
περιορισµούς LMI οδηγεί στην υπολογιστικά εύκολη επίλυσή του µε τη βοήθεια των
αλγορίθµων κυρτής βελτιστοποίησης (Boyd et al. 1994).

Θεώρηµα 6.1 (Kosmidou et al. 2001)


Έστω το γραµµικό αβέβαιο σύστηµα (6.1)-(6.4) µε τυχαίες µεταβλητές αρχικών
συνθηκών και µε πολλαπλούς δείκτες επιδόσεων (6.10). Αν το πρόβληµα
ελαχιστοποίησης

min tr ( M ) (6.14)
( M ,W ,δ i , Si ,Ti )

µε περιορισµούς LMI

⎡M I⎤
⎢I >0 (6.15)
⎣ W ⎥⎦

και

⎡ − AW − WAT + δ1 BR1−1 BT − DS1 DT − FT1 F T WE δ1 BR1 G


−1
W ⎤
⎢ ⎥
⎢ E TW S1 0 0 ⎥
⎢ −1 T ⎥>0
⎢ δ 1G T
R1 B 0 T1 0 ⎥
⎢ W 0 0 Q1 ⎥⎦
−1

(6.16)

⎡ − AW − WAT + δ ρ BRρ −1 BT − DS ρ DT − FTρ F T WE δ ρ BRρ G


−1
W ⎤
⎢ ⎥
⎢ E TW Sρ 0 0 ⎥
⎢ ⎥>0
δ ρ GT Rρ −1 B
T

⎢ 0 Tρ 0 ⎥
⎢ W 0 0 Qρ ⎥⎦
−1

έχει ένα µη κενό σύνολο εφικτών λύσεων ( M ,W , δ i , Si , Ti ) , για i = 1,..., ρ , όπου M ,


W είναι συµµετρικοί και θετικά ορισµένοι πίνακες, Si , Ti είναι διαγώνιοι θετικά
ορισµένοι πίνακες, δ i είναι θετικές βαθµωτές ποσότητες και Qi < Qi , i = 1,..., ρ , τότε
ο θετικά ορισµένος πίνακας

P = W −1 (6.17)

και οι τιµές των δ i ικανοποιούν τις γενικευµένες αλγεβρικές εξισώσεις Riccati (6.11).
Ο νόµος ελέγχου εγγυηµένου κόστους είναι

−1
u * (t ) = −δ i Ri BTW −1 x(t ) (6.18)

83
και ελαχιστοποιεί το εγγυηµένο κόστος

J * = tr ( P) (6.19)
για κάθε αποδεκτή αβεβαιότητα.

Απόδειξη: Εφαρµόζοντας το συµπλήρωµα του Schur στα πολλαπλά LMI (6.16) και
πολλαπλασιάζοντας επί P = W −1 από αριστερά και δεξιά και τα δύο µέλη των
ανισοτήτων που προκύπτουν, παίρνουµε,

−1 −1 −1 −1
PA + AT P − P (δ i BRi BT − δ i BRi GTi GT Ri BT − FTi F T − DSi DT ) P + ESi E T + Qi < 0
2

(6.20)
για i = 1,..., ρ . Οι ανισότητες αυτές ικανοποιούνται για Qi < Qi , αν ικανοποιούνται οι
εξισώσεις (6.11). Οι τιµές των Si , Ti προσδιορίζονται από τον αλγόριθµο LMI.
Επιπλέον, η εφαρµογή του συµπληρώµατος Schur στην (6.15) δίνει M > W −1 = P .
Κατά συνέπεια, η ελαχιστοποίηση του tr ( M ) συνεπάγεται ελαχιστοποίηση του
tr ( P) . Επειδή P είναι η κοινή λύση των εξισώσεων (6.11), το tr ( P) είναι το
ελάχιστο εγγυηµένο κόστος των πολλαπλών δεικτών επιδόσεων.

6.2.1 Παράδειγµα

Έστω το αβέβαιο σύστηµα 3ης τάξης (Dorato et al. 1988) σε περιγραφή χώρου
κατάστασης µε πίνακες,

⎡0 1 0⎤ ⎡0 ⎤ ⎡0 0 0 ⎤
⎢ ⎥
A = ⎢0 0 1 ⎥ , B = ⎢0 ⎥ , A1 = ⎢⎢ 0 0 0 ⎥⎥
⎢ ⎥
⎢⎣0 0 0 ⎥⎦ ⎢⎣1 ⎥⎦ ⎢⎣ 0 0 1.6 ⎥⎦

Ένας κατ΄ αρχάς αυθαίρετος διαχωρισµός µοναδιαίας τάξης του πίνακα αβεβαιότητας
µπορεί να είναι ο εξής:

⎡0⎤ ⎡0⎤
D = ⎢ 0 ⎥ , E = ⎢⎢ 0 ⎥⎥
⎢ ⎥
⎢⎣1.6 ⎥⎦ ⎢⎣1 ⎥⎦

Έστω ότι πρέπει να ελαχιστοποιηθούν δύο συναρτήσεις κόστους µε πίνακες βάρους,

⎡1 0 0⎤ ⎡ 0.1 0 0 ⎤
⎢ ⎥
Q1 = ⎢0 0.1 0 ⎥ , Q2 = ⎢⎢ 0 1 0 ⎥⎥ , R1 = R2 = 1
⎢⎣0 0 0.1⎥⎦ ⎢⎣ 0 0 0.1⎥⎦

84
Εφαρµόζοντας το Θεώρηµα 6.1 στο σύστηµα αυτό, παίρνουµε το εγγυηµένο κόστος
J * = tr ( P ) = 17.13 για δ1 = δ 2 = 1 και S1 = S2 = 0.185 . Σηµειώνεται, ότι στο
παράδειγµα αυτό θεωρήθηκε, ότι οι µεταβλητές δ i , καθώς και οι Si , i = 1, 2 , είναι
κοινές στα δύο LMI, γι’ αυτό και προέκυψε η ίδια τιµή. Υπολογίζοντας τις βέλτιστες
τιµές των συναρτήσεων κόστους για σύστηµα χωρίς αβεβαιότητες, δηλαδή
επιλύοντας δύο προβλήµατα LQR, παίρνουµε ( J1 ) min = 7.29 και ( J 2 ) min = 4.37 ,
αντίστοιχα. Εξάλλου, επιλύοντας δύο ανεξάρτητα προβλήµατα GCC, παίρνουµε τις
* *
αντίστοιχες τιµές εγγυηµένου κόστους J1 = 16.00 και J 2 = 10.12 . Προφανώς, το
*
κοινό εγγυηµένο κόστος είναι λίγο µεγαλύτερο από το J1 , που είναι το µεγαλύτερο
από τα δύο χωριστά, χωρίς, ωστόσο, να χαρακτηρίζεται ως συντηρητικό.

Εφαρµόζοντας τη µέθοδο βελτιστοποίησης κατά Pareto (Dorato et al. 1988)


στο παραπάνω σύστηµα, βρίσκουµε, ότι το εγγυηµένο κόστος κυµαίνεται µεταξύ των
τιµών 65 και 75, ανάλογα µε τις τιµές που παίρνουν κάποιες ειδικές σχεδιαστικές
παράµετροι. Είναι φανερό, ότι η προτεινόµενη µέθοδος οδηγεί σ’ ένα, κατά πολύ
µικρότερο, άνω φράγµα.

Ας σηµειωθεί ότι στο παράδειγµα αυτό οι θεωρούµενοι δείκτες επιδόσεων


έχουν τον ίδιο πίνακα βάρους εισόδου. Άρα, παίρνοντας την ίδια τιµή της
παραµέτρου δ , βρίσκουµε µια τιµή για το κέρδος ανάδρασης. Όµως, η περίπτωση
αυτή δεν είναι γενική: στη γενική περίπτωση έχουµε διαφορετικές τιµές των Ri και
δ i , i = 1,..., ρ , που αντιστοιχούν σε κάθε επί µέρους δείκτη επιδόσεων. Από τις τιµές
αυτές, προκύπτουν i διαφορετικές τιµές κερδών ανάδρασης, για το ίδιο P , πράγµα
που φαίνεται, ότι αποκλίνει από την αρχική διατύπωση του προβλήµατος, που ήταν η
εύρεση ενός κοινού νόµου ελέγχου. Στην πραγµατικότητα, για οποιαδήποτε επιλογή
των Ri και δ i , i = 1,..., ρ , ο νόµος ελέγχου (6.12) εξασφαλίζει ένα κοινό άνω φράγµα
(6.13), για όλους τους δείκτες επιδόσεων. Επιπλέον, έχοντας ρ βαθµούς ελευθερίας
στην επιλογή του κέρδους, µπορούν να ικανοποιηθούν πρόσθετες προδιαγραφές
σχεδιασµού.

6.3 Σύνθεση πολλαπλών στόχων µε ταυτόχρονη διευθέτηση πόλων

Σε πολλά προβλήµατα ελέγχου οι προδιαγραφές σχεδιασµού είναι ένας


συνδυασµός διαφορετικών επιδόσεων και στόχων βελτιστοποίησης, οι οποίοι µπορεί
να εκφράζονται τόσο στο πεδίο της συχνότητας, όσο και στο πεδίο του χρόνου. Όµως,
σε πολλές πρακτικές εφαρµογές η κλασσική H ∞ σύνθεση δεν µπορεί να εγγυηθεί ότι
θα ικανοποιήσει όλες τις απαιτήσεις σχεδίασης. Για παράδειγµα, η εξασθένηση του
θορύβου ή η επιθυµητή ευσταθής απόκριση των συστηµάτων σε τυχαίες διαταραχές
συνήθως επιτυγχάνονται µε έλεγχο LQG. Η H ∞ σύνθεση εγγυάται την ευστάθεια του
κλειστού συστήµατος, αλλά ωστόσο δεν επιτρέπει τη διευθέτηση των πόλων του
κλειστού συστήµατος σε µια συγκεκριµένη περιοχή του αριστερού µιγαδικού ηµι-
επιπέδου. Επειδή η διευθέτηση των πόλων σχετίζεται µε τη χρονική απόκριση και τη
µεταβατική συµπεριφορά του κλειστού συστήµατος, είναι συχνά επιθυµητό να
θέτουµε επιπλέον περιορισµούς απόσβεσης στις προδιαγραφές ελέγχου. Το γεγονός
αυτό καθιστά τα προβλήµατα σύνθεσης πολλαπλών στόχων ιδιαίτερα επιθυµητά στην
πράξη. Επιπλέον, η θεωρία των LMI διευκολύνει την αριθµητική επίλυση τέτοιας

85
φύσης προβληµάτων. Μια σύνθεση µε πολλαπλούς στόχους θα µπορούσε να είναι η
παρακάτω:

• Επιδόσεις H ∞ (για επιθυµητή απόκριση, απόρριψη διαταραχών, ή για


εύρωστη ευστάθεια).
• Επιδόσεις H 2 (για ευσταθή απόκριση σε τυχαίες διαταραχές - LQG όροι).
• Εύρωστη διευθέτηση πόλων (για να διασφαλιστεί επιθυµητή σχετική
ευστάθεια, γρήγορη και καλά αποσβενόµενη µεταβατική απόκριση, λογικό
κέρδος ανάδρασης).

Οι παραπάνω στόχοι συνθέτουν ένα πρόβληµα πολλαπλών στόχων του τύπου


H ∞ / H 2 . Πιο συγκεκριµένα, ας θεωρήσουµε το σύστηµα του παρακάτω σχήµατος:

Σχήµα 6.1 Έλεγχος µε ανάδραση κατάστασης

Πρόκειται για ένα γραµµικό και χρονικά αµετάβλητο σύστηµα µε συνάρτηση


µεταφοράς P( s ) , για το οποίο υποθέτουµε ότι το διάνυσµα κατάστασης είναι πλήρως
µετρήσιµο και µπορεί να χρησιµοποιηθεί για ανατροφοδότηση. Ορίζοντας µε τα
σύµβολα T∞ ( s ) και T2 ( s ) τις συναρτήσεις µεταφοράς του κλειστού συστήµατος από
το w στο z∞ και z2 αντίστοιχα, ζητείται ο σχεδιασµός ενός νόµου ελέγχου ανάδρασης
κατάστασης της µορφής u = Kx , έτσι ώστε:

• Να διατηρείται το RMS κέρδος ( H ∞ -νόρµα) της συνάρτησης µεταφοράς


T∞ ( s ) του κλειστού συστήµατος από το w στο z∞ , κάτω από συγκεκριµένη
τιµή γ 0 > 0 .
• Να διατηρείται η H 2 -νόρµα της συνάρτησης µεταφοράς T2 ( s ) του κλειστού
συστήµατος από το w στο z2 (LQG κόστος), κάτω από µια συγκεκριµένη
τιµή ν 0 > 0 .
• Να ελαχιστοποιείται το κριτήριο ανταλλαγής (trade-off criterion) H ∞ / H 2 ,
2 2
που είναι της µορφής: a T∞ ∞
+ β T2 2 .
• Να τοποθετούνται οι πόλοι του κλειστού συστήµατος σε µια προκαθορισµένη
ευσταθή περιοχή D, του ανοικτού αριστερού µιγαδικού ηµι-επιπέδου.

86
Η παραπάνω σύνθεση περικλείει περιπτώσεις από πολλά πρακτικά προβλήµατα.
Έστω η περίπτωση του προβλήµατος συντονισµού µε διαταραχή d, λευκό µετρήσιµο
⎛d ⎞ ⎛ x⎞
θόρυβο n και σφάλµα συντονισµού e. Θεωρώντας ότι w = ⎜ ⎟ , z∞ = e και z2 = ⎜ ⎟ ,
⎝n⎠ ⎝u ⎠
το µικτό H ∞ / H 2 κριτήριο λαµβάνει υπόψη του, τόσο την απόρριψη των διαταραχών
(RMS κέρδος µεταξύ d και e) όσο και τους LQG όρους (νόρµα H 2 µεταξύ του n και
του z2 ). Μαζί µε όλους τους παραπάνω περιορισµούς, θα πρέπει και οι πόλοι του
κλειστού συστήµατος να τοποθετηθούν σε µια ευσταθή περιοχή του αριστερού
µιγαδικού ηµι-επιπέδου, κατά τρόπο ώστε να εξασφαλίζεται ικανοποιητική απόσβεση
στη µεταβατική κατάσταση.

6.3.1 Τοποθέτηση πόλων σε LMI περιοχές

Προκειµένου να ελαχιστοποιηθεί η επίδραση των διαταραχών στην έξοδο του


συστήµατος, η καλύτερη µέθοδος είναι η αποσύζευξη της διαταραχής από την έξοδο.
∆εδοµένου ότι η αποσύζευξη των διαταραχών απαιτεί γενικά πολύ αυστηρές
συνθήκες για το ανοικτό σύστηµα, είναι συχνά µη-πραγµατοποιήσιµη. Στις
περιπτώσεις αυτές, επιδιώκεται η εξασθένηση της επίδρασης των διαταραχών στην
έξοδο του συστήµατος µέσω ενός ελεγκτή, έτσι ώστε η συνάρτηση µεταφοράς της
διαταραχής ως προς την έξοδο, η οποία εκφράζεται από τη νόρµα H 2 , να είναι όσο το
δυνατόν µικρότερη. Αυτό το γεγονός αποτελεί ένα από τα κίνητρα του ελέγχου H 2 .
Όπως έχει ήδη αναφερθεί σε προηγούµενα κεφάλαια, αυτό το είδος ελέγχου µπορεί
να διατυπωθεί σαν ένα σύνθετο πρόβληµα βελτιστοποίησης, το οποίο
συµπεριλαµβάνει γραµµικές ανισότητες πινάκων (LMI). Με βάση αυτό το σηµαντικό
πλεονέκτηµα, ο έλεγχος µπορεί να επιτευχθεί µε περισσότερους περιορισµούς οι
οποίοι µπορούν να µεταφραστούν σε LMI. Έτσι, ο σχεδιασµός των συστηµάτων
εξασφαλίζει την τοποθέτηση των πόλων του κλειστού συστήµατος µέσα σε ειδικές
περιοχές του µιγαδικού επιπέδου, αποκαλούµενες LMI περιοχές.

Οι LMI περιοχές είναι κυρτά υποσύνολα D του µιγαδικού επιπέδου που


χαρακτηρίζονται από την ανισότητα,

D = {z ∈ C : L + Mz + M T z < 0} (6.21)

όπου οι Μ και L = LT είναι καθορισµένοι πραγµατικοί πίνακες. Η συνάρτηση πινάκων

f D ( z ) := L + Mz + M T z (6.22)

καλείται χαρακτηριστική συνάρτηση της περιοχής D.

Η κατηγορία των LMI περιοχών είναι αρκετά γενική, απ’ τη στιγµή που είναι
ένα σύνολο από µιγαδικές περιοχές, συµµετρικές ως προς τον άξονα των
πραγµατικών αριθµών. Από πρακτικής πλευράς, οι LMI περιοχές περιλαµβάνουν
κατάλληλες περιοχές, όπως για παράδειγµα κύκλους, κωνικές περιοχές, ταινίες κ.α.,
καθώς επίσης και τοµές των περιοχών αυτών. Ένα ακόµα πλεονέκτηµα των LMI
περιοχών είναι ότι σε τέτοιου είδους περιοχές, βρίσκει εφαρµογή το θεώρηµα του

87
Lyapunov. Πιο συγκεκριµένα, εάν {λij }1≤ i , j ≤ m και {µ ij }1≤ i , j ≤ m είναι τα στοιχεία των
πινάκων L και Μ, τότε ένας πίνακας Α έχει όλες του τις ιδιοτιµές στην περιοχή D,
εάν και µόνον εάν υπάρχει ένας θετικά ορισµένος πίνακας P τέτοιος ώστε:

⎡⎣ λij P + µ ij ΑP + µ ji PAT ⎤⎦ <0 (6.23)


1≤ i , j ≤ m

Σηµειώνεται ότι η παραπάνω ανισότητα είναι µια γραµµική ανισότητα του πίνακα P
(LMI) και ότι το κλασικό θεώρηµα του Lyapunov αντιστοιχεί στην ειδική περίπτωση
όπου f D ( z ) = z + z .

Στη συνέχεια παρατίθενται κάποιες χρήσιµες LMI περιοχές µαζί µε τις


χαρακτηριστικές εξισώσεις τους f D :

• Κύκλος µε κέντρο το (−q, 0) και ακτίνα r:

• Κωνική περιοχή µε κέντρο την αρχή των αξόνων και εσωτερική γωνία θ:

Ο λόγος απόσβεσης των πόλων, που βρίσκονται σε αυτή την περιοχή, είναι
θ
τουλάχιστον cos .
2

88
• Οριζόντια ταινία όπου h1 < x < h2 :

Έστω το σύστηµα,

x = Ax + B1w + B2u
z∞ = C1 x + D11w + D12u (6.24)
z2 = C2 x + D22u

Οι εξισώσεις του κλειστού συστήµατος είναι,

x = ( A + B2 K ) x + B1w
z∞ = (C1 + D12 K ) x + D11w (6.25)
z2 = (C2 + D22 K ) x

Εξετάζοντας ξεχωριστά τους τρεις στόχους ελέγχου που αναπτύχθηκαν στην


προηγούµενη παράγραφο, προκύπτει η ακόλουθη διατύπωση του προβλήµατος
βελτιστοποίησης LMI:

• H ∞ απόδοση: Το RMS κέρδος του κλειστού συστήµατος, από το w στο z∞ ,


δεν θα υπερβαίνει την τιµή γ, εάν και µόνο εάν υπάρχει ένας συµµετρικός
πίνακας X ∞ , τέτοιος ώστε,

⎛ ( A + B2 K ) X ∞ + X ∞ ( A + B2 K )T B1 X ∞ ( C1 + D12 K )
T

⎜ ⎟
⎜ B1T −I D11T ⎟<0
⎜ ( C1 + D12 K ) X ∞ D11 −γ 2 I ⎟
⎝ ⎠

και (6.26)

X∞ > 0

• H 2 απόδοση: Η H 2 - νόρµα του κλειστού συστήµατος T2 δεν υπερβαίνει µια


συγκεκριµένη τιµή v, εάν υπάρχουν δύο συµµετρικοί πίνακες X 2 και Q,
τέτοιοι ώστε:

89
⎛ ( A + B2 K ) X 2 + X 2 ( A + B2 K )T B1 ⎞
⎜⎜ ⎟<0
⎝ B1T − I ⎟⎠

(6.27)

⎛ Q ( C2 + D22 K ) X 2 ⎞
⎜ ⎟>0
⎜ X ( C + D K )T X2 ⎟
⎝ 2 2 22 ⎠

και

Trace(Q ) < ν 2

• ∆ιευθέτηση πόλων: Οι πόλοι του κλειστού συστήµατος βρίσκονται µέσα σε


µια LMI περιοχή D = {z ∈ C : L + Mz + M T z < 0} , όπου L = LT = {λij }1≤i , j ≤m και
Μ = {µij }1≤i , j ≤ m , εάν και µόνο εάν υπάρχει ένας συµµετρικός πίνακας X pol ,
τέτοιος ώστε να ικανοποιείται η παρακάτω σχέση:

⎡ λij X pol + µij ( A + B2 K ) X pol + µij X pol + µij X pol ( A + B2 K )T ⎤ <0


⎣ ⎦1≤i , j ≤ m

(6.28)
X pol > 0

Αυτό το σύνολο των τριών συνθηκών (6.26) – (6.28) περιγράφουν ένα πρόβληµα
βελτιστοποίησης µε µεταβλητές τις Q, K , X ∞ , X 2 και X pol . Επειδή βρισκόµαστε στο
πλαίσιο LMI, ψάχνουµε έναν πίνακα Lyapunov X := X ∞ = X 2 = X pol , τέτοιον ώστε
να ικανοποιούνται και οι τρεις παραπάνω απαιτήσεις.

Με αλλαγή της µεταβλητής Y := KX , οδηγούµαστε στην ακόλουθη υπο-βέλτιστη


διατύπωση του προβλήµατος LMI πολλαπλών στόχων: αντικαθιστώντας στις
παραπάνω σχέσεις όπου X ∞ = X 2 = X pol := X , προκύπτουν οι ανισότητες,

⎛ AX + XAT + B2Y + Y T B2T B1 XC1T + Y T D12T ⎞


⎜ ⎟
⎜ B1T −I D11T ⎟<0
⎜ C1 X + D12Y D11 −γ 2 I ⎟
⎝ ⎠

⎛ Q C2 X + D22Y ⎞
⎜ ⎟>0
⎝ XC2 + Y D22
T T T
X ⎠

90
⎡λij + µij ( AX + B2Y ) + µij ( XAT + Y T B2T ) ⎤
⎣ ⎦1≤i , j ≤ m < 0

Trace(Q) < ν 0 2
(6.29)

γ 2 < γ 02

Σκοπός είναι η ελαχιστοποίηση της σχέσης aγ 2 + β Trace(Q) , όπου τα Y , X , Q και γ 2


ικανοποιούν τις παραπάνω ανισότητες.

Η βέλτιστη λύση του προβλήµατος ορίζεται από τα ( X ∗ , Y ∗ , Q ∗ , γ ∗ ) και το αντίστοιχο


κέρδος ανάδρασης-κατάστασης δίνεται από τη σχέση:

K ∗ = Y ∗ ( X ∗ ) −1

κέρδος το οποίο διασφαλίζει ικανοποιητική συµπεριφορά στη χειρότερη κατάσταση,


η οποία αντιστοιχεί σε,

T∞ ∞
≤ γ ∗ , T2 2 ≤ Trace(Q∗ ) (6.30)

6.3.2 Εφαρµογή του µικτού σχεδιασµού H ∞ / H 2 µε ταυτόχρονη διευθέτηση


πόλων σε LMI περιοχές

∆ιατύπωση του προβλήµατος

Στην παράγραφο αυτή, ο µικτός σχεδιασµός H ∞ / H 2 εφαρµόζεται σ’ ένα


δορυφόρο ο οποίος επηρεάζεται από µια διαταραχή w και στο µοντέλο του υπάρχουν
αβέβαιες παράµετροι (Franklin et al. 1994). Το σύστηµα του δορυφόρου αποτελείται
από δυο άκαµπτα µέρη που είναι το κυρίως σώµα και το µέρος που αποτελείται από
τα υπόλοιπα εξαρτήµατα του δορυφόρου. Αυτά τα δύο µέρη συνδέονται µε ένα
ελαστικό σύνδεσµο που είναι κατασκευασµένος σαν ένα ελατήριο µε σταθερά ροπής
k και απόσβεση ιξώδους f. Η ανάλυση των παραµέτρων αυτών έδειξε ότι έχουν µια
διακύµανση τιµών της τάξεως,

0.09 < k < 0.4


(6.31)
0.0038 < f < 0.04

Οι δυναµικές εξισώσεις του δορυφόρου είναι οι εξής:

( )
⎧θ1 + f θ1 − θ 2 + k (θ1 − θ 2 ) = T + w

⎨ (6.32)
( )
⎪⎩ θ 2 + f θ 2 − θ1 + k (θ 2 − θ1 ) = 0

91
όπου θ1 και θ 2 είναι η κίνηση των γωνιών του κυρίως σώµατος και του αισθητήρα, Τ
είναι ο έλεγχος της ροπής και w είναι η διαταραχή που επηρεάζει τη ροπή του κυρίως
σώµατος.

Σχήµα 6.2 Απεικόνιση του συστήµατος του δορυφόρου.

Ο στόχος που πρέπει να επιτευχθεί είναι η ελαχιστοποίηση της επίδρασης της


διαταραχής w, στη γωνιακή θέση θ 2 , πράγµα το οποίο µπορεί να γίνει αν
πραγµατοποιηθούν τα παρακάτω:

• Θα πρέπει να εξασφαλιστεί µια καλή ανταλλαγή (trade-off) ανάµεσα στο


RMS κέρδος, από το θ 2 στο w, και στην H 2 -νόρµα της συνάρτησης
⎛ θ1 ⎞
µεταφοράς από το w στο ⎜⎜ θ 2 ⎟⎟ (κριτήριο κόστους LQG).
⎜Τ⎟
⎝ ⎠

• Θα πρέπει να διευθετηθούν οι πόλοι του κλειστού συστήµατος στην περιοχή,


που φαίνεται στο Σχήµα 6.3, έτσι ώστε να εξασφαλιστεί ικανοποιητική
απόσβεση του κλειστού συστήµατος.

92
Σχήµα 6.3 LMI ευσταθής περιοχή που ορίζεται από την ανισότητα x < −0.1 και µε
γωνία 5π / 6 .

• Θα πρέπει να επιτευχθούν όλοι οι παραπάνω στόχοι για όλες τις πιθανές τιµές
των παραµέτρων k και f. Από τη στιγµή που αυτές οι παράµετροι είναι στενά
συνδεδεµένες µε τον πίνακα κατάστασης του συστήµατος, είναι δυνατόν να
µοντελοποιήσουµε την παραµετρική αυτή αβεβαιότητα σαν ένα πολυτοπικό
σύστηµα µε τέσσερα διανύσµατα τα οποία αντιστοιχούν στους τέσσερις
συνδυασµούς που αντιστοιχούν στις ακραίες τιµές των παραµέτρων.

Προκειµένου να σχεδιαστεί ένας ελεγκτής για το σύστηµα αυτό εφαρµόζοντας το


µικτό σχεδιασµό H ∞ / H 2 , θα πρέπει πρώτα να περιγραφεί µε την κατάλληλη µορφή.

Από τις αρχικές δυναµικές εξισώσεις (6.32) προκύπτει,

( )
⎧θ1 = − f θ1 − θ 2 − k (θ1 − θ 2 ) + T + w

⎨ ⇒
( )
⎪⎩ θ 2 = − f θ 2 − θ1 − k (θ 2 − θ1 )

⎧θ1 = − f θ1 + f θ 2 − kθ1 + kθ 2 + T + w
⎨ ⇒
⎩ θ 2 = − f θ 2 + f θ1 − kθ 2 + kθ1

από όπου βρίσκουµε ότι:

⎡θ1 ⎤ ⎡ 0 0 1 0 ⎤ ⎡θ1 ⎤ ⎡0⎤


⎢ ⎥ ⎢
⎢θ 2 ⎥ = ⎢ 0 0 0 1 ⎥⎥ ⎢⎢θ 2 ⎥⎥ ⎢⎢0⎥⎥
⎢θ1 ⎥ ⎢ −k
+ (w +T ) (6.33)
k −f f ⎥ ⎢θ1 ⎥ ⎢1 ⎥
⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥
⎢⎣θ 2 ⎥⎦ ⎣ k −k f − f ⎦ ⎢⎣θ 2 ⎥⎦ ⎣0⎦
και

93
⎡0 1 0 0 ⎤ ⎡θ1 ⎤ ⎡0 0⎤
⎡z ⎤ 1
⎢ 0 0 0 ⎥⎥ ⎢⎢θ 2 ⎥⎥ ⎢⎢0 0 ⎥⎥ ⎡ w⎤
y = ⎢ ∞⎥ = ⎢ + (6.34)
⎣ z2 ⎦ ⎢ 0 1 0 0 ⎥ ⎢θ1 ⎥ ⎢0 0 ⎥ ⎢⎣T ⎥⎦
⎢ ⎥⎢ ⎥ ⎢ ⎥
⎣0 0 0 0 ⎦ ⎣θ 2 ⎦ ⎣0 1⎦

οπότε σύµφωνα µε τη µορφή του σχήµατος 6.1 θα είναι,

z∞ = θ 2

και (6.35)

⎡θ1 ⎤
⎡1 0 0 0 ⎤ ⎢ ⎥ ⎡0 ⎤
θ
z2 = ⎢⎢0 1 0 0 ⎥⎥ ⎢ 2 ⎥ + ⎢⎢0 ⎥⎥ Τ
⎢θ ⎥
⎢⎣0 0 0 0 ⎥⎦ ⎢ 1 ⎥ ⎢⎣1 ⎥⎦
⎢⎣θ 2 ⎥⎦

Στη συνέχεια, ορίζεται η LMI περιοχή µέσα στην οποία θα διευθετηθούν οι


πόλοι του κλειστού συστήµατος. Μια τέτοια περιοχή µπορεί να είναι η LMI περιοχή
που προκύπτει από την τοµή του ηµι-επιπέδου, που ορίζεται από την ανισότητα
x < −0.1 και του τοµέα που ξεκινάει από την αρχή των αξόνων µε γωνία 5π / 6 .

Η διαδικασία που θα ακολουθηθεί για την εφαρµογή του µικτού σχεδιασµού


H ∞ / H 2 , είναι, συνοπτικά, η εξής:

1. Μελετάται το ανοικτό ονοµαστικό σύστηµα (για τις ονοµαστικές τιµές των


παραµέτρων k και f ) και προσδιορίζεται η τιµή της H ∞ - νόρµας,
εξασφαλίζοντας ότι παίρνει την ελάχιστη δυνατή τιµή, όσο πιο κοντά στο
µηδέν.

2. Προσδιορίζονται οι πόλοι του ανοικτού αβέβαιου συστήµατος για όλους τους


δυνατούς συνδυασµούς των αβέβαιων παραµέτρων του και κατασκευάζεται
ένα γράφηµά τους, έτσι ώστε να συγκριθούν αργότερα µε τους πόλους του
κλειστού συστήµατος.

3. Προσδιορίζεται το κριτήριο ανταλλαγής (trade-off) µεταξύ των επιδόσεων


H ∞ και H 2 , υπολογίζοντας ζεύγη τιµών που αντιστοιχούν σε αυτές τις νόρµες,
µε τους παραπάνω LMI περιορισµούς. Από αυτά τα ζεύγη τιµών επιλέγεται
εκείνο που αντιστοιχεί στον καλύτερο συµβιβασµό ανάµεσα στις δυο νόρµες.

4. Προσδιορίζεται ο εύρωστος ελεγκτής K που προκύπτει από το παραπάνω


κριτήριο ανταλλαγής.

94
5. Προσδιορίζεται το κλειστό σύστηµα και εξετάζεται η ευστάθειά του. Η
µελέτη της ευστάθειας γίνεται µε βάση τις θέσεις των πόλων του κλειστού
συστήµατος. Θα πρέπει να διασφαλίζεται ότι οι πόλοι βρίσκονται µέσα στην
LMI περιοχή που έχει οριστεί. Τέλος, η συµπεριφορά του συστήµατος
αξιολογείται µε βάση τη βηµατική του απόκριση.

Σηµειώνεται ότι η παραπάνω διαδικασία µπορεί να εκτελεστεί µε τη βοήθεια


του Matlab, χρησιµοποιώντας τις εντολές της βιβλιοθήκης LMI Control Toolbox. Στο
σύστηµα του δορυφόρου που περιγράφηκε παραπάνω, η διαδικασία εφαρµόζεται ως
εξής (Μ. ∆ούρου 2006):

(ι) Μελέτη του ανοικτού ονοµαστικού συστήµατος

Αρχικά θα εξετάσουµε το ονοµαστικό ανοικτό σύστηµα (6.33) – (6.35) οπότε


οι παράµετροι k και f παίρνουν τις ονοµαστικές τους τιµές, οι οποίες είναι
k = 0.245 και f = 0.0188 . Για το ονοµαστικό ανοικτό σύστηµα θα εξετάσουµε τη
νόρµα H ∞ µε τους LMI περιορισµούς, καθώς επίσης και τους πόλους του για να
µπορέσουµε να έχουµε µια σαφή εικόνα, τόσο για το εάν υπάρχει εφικτή λύση για
την ελαχιστοποίηση της νόρµας αυτής, µε τους LMI περιορισµούς, όσο και για την
ευστάθειά του.

Σχήµα 6.4 Πόλοι του ανοικτού ονοµαστικού συστήµατος.

Παρατηρούµε ότι το σύστηµα είναι πρακτικά ασταθές γιατί οι δύο από τους τέσσερις
πόλους του βρίσκονται πολύ κοντά στο µηδέν, ενώ οι άλλοι δύο είναι ακριβώς πάνω
στο µηδέν. Αστάθεια του συστήµατος επιβεβαιώνεται και από τη βηµατική απόκρισή
του.

95
Σχήµα 6.5 Βηµατική απόκριση του ονοµαστικού συστήµατος.

Κριτήριο ανταλλαγής H ∞ / H 2 για το ονοµαστικό σύστηµα

Εξετάζοντας τη νόρµα H ∞ , υπό τους περιορισµούς που ορίζονται από την


LMI περιοχή, βρίσκουµε ότι η νόρµα αυτή ελαχιστοποιείται λαµβάνοντας τη σχεδόν
µηδενική τιµή 9.4066 ×10-4 . Η τιµή αυτή προκύπτει από επαναληπτική µέθοδο, η
οποία προσπαθεί να πετύχει όσο το δυνατόν µικρότερη τιµή για την H ∞ - νόρµα υπό
τους περιορισµούς που επιβάλει η ευσταθής LMI περιοχή που έχουµε επιλέξει. Στη
συνέχεια, επιλέγουµε κάποιες από τις τιµές της H ∞ - νόρµας και υπολογίζουµε τις
αντίστοιχες τιµές της νόρµας H 2 . Τα ζεύγη τιµών που προκύπτουν απεικονίζονται σε
ένα διάγραµµα, έτσι ώστε να µπορούµε να βρούµε το ζεύγος εκείνο που προσφέρει
τον καλύτερο συµβιβασµό.

Τυχαία επιλέξαµε τέσσερις τιµές του H ∞ (από τις τιµές που προέκυψαν από
την επαναληπτική µέθοδο προσδιορισµού της νόρµας αυτής) και οι αντίστοιχες τιµές
της νόρµας H 2 φαίνονται παρακάτω:

H∞ 0.01 0.09 0.2 0.6


H2 2.4203 1.8642 1.7148 1.5792

96
Σχήµα 6.6 Καµπύλη κριτηρίου ανταλλαγής H ∞ / H 2

Σύµφωνα µε τον παραπάνω πίνακα τιµών και την απεικόνισή του στο αντίστοιχο
διάγραµµα, βλέπουµε ότι ο καλύτερος συµβιβασµός των νορµών H ∞ / H 2
επιτυγχάνεται για την τιµή 0.09 της νόρµας H ∞ , επειδή έχουµε ζεύγος τιµών µε όσο
το δυνατόν µικρότερες τιµές και για τις δύο νόρµες.

Στη συνέχεια, βρίσκουµε τον ελεγκτή Κ, που αντιστοιχεί σε αυτό το ζεύγος


τιµών. Ο πίνακας κέρδους του ελεγκτή αυτού είναι ο:

K = [ -6.8994 -6.7948 -3.9517 -25.5560]

και έτσι ο πίνακας κατάστασης του κλειστού συστήµατος που προκύπτει είναι,

Acl = A + B × K ⇒
⎡ 0 0 1 0 ⎤
⎢ 0 0 0 1 ⎥
Acl = ⎢ ⎥
⎢-7.1444 -6.5498 -3.9705 -25.5372 ⎥
⎢ ⎥
⎣ 0.2450 -0.2450 0.0188 -0.0188 ⎦

Έτσι προκύπτει το κλειστό ονοµαστικό σύστηµα. Οι πόλοι του κλειστού συστήµατος,


φαίνονται στο παρακάτω σχήµα:

97
Σχήµα 6.7 Πόλοι του κλειστού ονοµαστικού συστήµατος.

Παρατηρούµε ότι οι πόλοι του κλειστού συστήµατος βρίσκονται στο αρνητικό


µιγαδικό ηµι-επίπεδο, µε αποτέλεσµα το σύστηµα να είναι ευσταθές. Συγκρίνοντας δε
τις θέσεις των πόλων αυτών µε τις αντίστοιχες θέσεις των πόλων του ανοικτού
συστήµατος, η µετατόπισή τους προς πιο ευσταθείς θέσεις, είναι εµφανής.

Η ευστάθεια του κλειστού ονοµαστικού συστήµατος µπορεί να πιστοποιηθεί


και από τη βηµατική απόκρισή του. Παρατηρείται επίσης γρήγορη σύγκλιση µε
µικρές διακυµάνσεις.

98
Σχήµα 6.8 Βηµατική απόκριση του κλειστού ονοµαστικού συστήµατος.

(ιι) Μελέτη του αβέβαιου συστήµατος

Μέχρι εδώ εξετάσαµε το ονοµαστικό σύστηµα του δορυφόρου. Ωστόσο το


σύστηµα αφενός έχει αβέβαιες παραµέτρους αφετέρου επηρεάζεται από µια εξωγενή
διαταραχή w, η οποία επιδρά πάνω στη γωνία θ 2 . Στόχος του µικτού σχεδιασµού
H ∞ / H 2 είναι να κάνει το αβέβαιο σύστηµα ευσταθές, βρίσκοντας τον κατάλληλο
ελεγκτή που περιορίζει την επίδραση της διαταραχής w πάνω στη γωνία θ 2 και
επιπλέον τοποθετεί τους πόλους του στην επιθυµητή LMI περιοχή.

Η πρώτη ενέργεια που πρέπει να γίνει για το αβέβαιο σύστηµα είναι να


περιγραφεί µε πολυτοπική µορφή, µια και περιλαµβάνει αβέβαιες παραµέτρους
(Κεφάλαιο 2). Όπως έγινε και µε το ονοµαστικό σύστηµα, έτσι και µε το αβέβαιο,
πρώτα θα εξεταστεί η ευστάθεια του ανοικτού συστήµατος, βρίσκοντας τους πόλους
του, για όλους τους πιθανούς συνδυασµούς των παραµέτρων του και στη συνέχεια θα
εξεταστεί η βηµατική απόκρισή του.

Οι πόλοι του ανοικτού συστήµατος του δορυφόρου φαίνονται στο παρακάτω


σχήµα:

99
Σχήµα 6.9 Απεικόνιση των πόλων του αβέβαιου συστήµατος για όλους τους
πιθανούς συνδυασµούς των παραµέτρων του

Η παραπάνω απεικόνιση των πόλων έχει προκύψει από όλους τους δυνατούς
συνδυασµούς των παραµέτρων k και f του συστήµατος. Όπως µπορούµε να
παρατηρήσουµε, το αρχικό ανοικτό σύστηµα είναι «οριακά ευσταθές» επειδή όλοι οι
πόλοι είναι πολύ κοντά στο µηδέν, µια και, όπως µπορούµε να διαπιστώσουµε,
βρίσκονται µέσα στην περιοχή [−0.1 , 0] . Έτσι µε την παραµικρή επιπρόσθετη
διαταραχή w που θα µπορούσε να επηρεάσει το σύστηµα, κάποιοι από αυτούς τους
πόλους θα µπορούσαν να µετατοπιστούν στο δεξιό (θετικό) µιγαδικό ηµι-επίπεδο και
έτσι το σύστηµα να γίνει ασταθές. Αυτό µπορεί να επιβεβαιωθεί και από τη βηµατική
απόκρισή του, όπως φαίνεται στο παρακάτω σχήµα:

100
Σχήµα 6.10 Βηµατική απόκριση του αβέβαιου ανοικτού συστήµατος

Όπως είναι αναµενόµενο, οι αποκρίσεις του συστήµατος απειρίζοναι και δεν


συγκλίνουν σε κάποια τιµή, λόγω του ότι το σύστηµα είναι ασταθές.

Επειδή το αβέβαιο σύστηµα είναι ασταθές για κάποιο σύνολο τιµών των
αβέβαιων παραµέτρων, θα εφαρµόσουµε το µικτό σχεδιασµό H ∞ / H 2 για τον
προσδιορισµό ενός εύρωστου ελεγκτή ο οποίος να σταθεροποιεί το αβέβαιο σύστηµα.
Συνεπώς, σκοπός του ελεγκτή ανάδρασης θα πρέπει να είναι, εκτός των άλλων, και η
µετατόπιση των πόλων του συστήµατος σε µια πιο ευσταθή περιοχή του αρνητικού
µιγαδικού ηµι-επιπέδου.

Κριτήριο ανταλλαγής H ∞ / H 2 για το αβέβαιο σύστηµα

Όπως έγινε και στην περίπτωση του ονοµαστικού συστήµατος, έτσι και εδώ
για τις τιµές που είχαµε επιλέξει από τη νόρµα H ∞ , θα υπολογίσουµε τις αντίστοιχες
τιµές της νόρµας H 2 και στη συνέχεια θα επιλέξουµε το ζεύγος τιµών που δίνει τον
καλύτερο συµβιβασµό µεταξύ τους. ∆εν πρέπει να ξεχνάµε ότι οι τιµές για αυτές τις
νόρµες, υπολογίζονται πάντα µε τους LMI περιορισµούς που έχουµε θέσει εξαρχής.
Έτσι λοιπόν βρίσκουµε τα παρακάτω ζεύγη τιµών:

H∞ 0.01 0.09 0.2 0.6


H2 3.5266 2.5918 2.3468 2.1117

101
Τα ζεύγη τιµών αυτά απεικονίζονται στο παρακάτω γράφηµα, έτσι ώστε να είναι πιο
εύκολη η επιλογή του πιο κατάλληλου.

Σχήµα 6.11 Καµπύλη κριτηρίου ανταλλαγής H ∞ / H 2

Από το γράφηµα µπορούµε να δούµε ότι ο καλύτερος συµβιβασµός ανάµεσα στις δύο
νόρµες πετυχαίνεται για την τιµή 0.09 της νόρµας H ∞ που αντιστοιχεί στην τιµή
2.5918 για τη νόρµα H 2 . Ο τρόπος που επιλέξαµε το ζεύγος αυτό είναι ίδιος µε πριν,
καθώς δε θέλουµε τις ακραίες περιπτώσεις τιµών, που παίρνουν οι νόρµες αυτές.

Ο πίνακας του ελεγκτή-ανάδρασης που αντιστοιχεί σε αυτό το ζεύγος τιµών είναι,

K = [ -23.3744 -7.1842 -7.8583 -113.151]

από τον οποίο προκύπτει το αντίστοιχο κλειστό σύστηµα. Επειδή το σύστηµα έχει τις
δύο αβέβαιες παραµέτρους k και f, θα πρέπει να υπολογίσουµε όλους τους πιθανούς
πίνακες κατάστασης του εύρωστου κλειστού συστήµατος, για να βρούµε τους πόλους
του και τη βηµατική του απόκριση. Έτσι οι εξισώσεις που περιγράφουν τους πίνακες
κατάστασης του κλειστού συστήµατος είναι οι παρακάτω:

A = A0 + kAk + fAf
Acl = A + BK

102
όπου k και f είναι ο παράµετροι του συστήµατος και Κ είναι ο πίνακας του εύρωστου
ελεγκτή.

Μελέτη των τεσσάρων ακραίων καταστάσεων του συστήµατος

Οι περιπτώσεις όπου οι παράµετροι του συστήµατος παίρνουν τις ακραίες τους τιµές
είναι και οι πιο «επικίνδυνες» για την ευστάθεια του κλειστού συστήµατος. Οι
περιπτώσεις αυτές είναι εκείνες που χαρακτηρίζονται από τα παρακάτω ζεύγη
παραµέτρων:

( k = 0.09 f = 0.0038 ) , ( k = 0.09 f = 0.04 ) ,

( k = 0.4 f = 0.0038) , ( k = 0.4 f = 0.04 ) .

Θα πρέπει να εξεταστεί ξεχωριστά η απόκριση και η διευθέτηση των πόλων του


εύρωστου κλειστού συστήµατος, για αυτές τις 4 περιπτώσεις.

Ο ελεγκτής Κ που βρήκαµε παραπάνω ανταποκρίνεται µε τον καλύτερο τρόπο σε


αυτές τις 4 καταστάσεις και αυτό φαίνεται στο παρακάτω στα διαγράµµατα
βηµατικής απόκρισης.

Σχήµα 6.12 Βηµατική απόκριση του εύρωστου κλειστού συστήµατος, για τις 4
ακραίες καταστάσεις του συστήµατος

103
Παρατηρούµε ότι η σύγκλιση επιτυγχάνεται και στις τέσσερις περιπτώσεις γρήγορα
(σχεδόν στα πρώτα 20 δευτερόλεπτα) αλλά και ότι οι διακυµάνσεις, που υπάρχουν
πριν τη σύγκλιση έχουν ικανοποιητική απόσβεση.
Σε αυτό το σηµείο θα πρέπει να σηµειώσουµε ότι οι τέσσερις διαφορετικές καµπύλες
που υπάρχουν στις γραφικές παραστάσεις αντιπροσωπεύουν τις τέσσερις
διαφορετικές καταστάσεις του συστήµατος και ότι για λόγους απλότητας δείχνουν
την απόκριση της πρώτης εξόδου του συστήµατος ως προς την πρώτη είσοδό του. Οι
θέσεις των πόλων του κλειστού συστήµατος επάνω στο µιγαδικό επίπεδο, για τους
τέσσερις συνδυασµούς των αβέβαιων παραµέτρων, δίνονται στο παρακάτω σχήµα:

Σχήµα 6.13 ∆ιευθέτηση πόλων του εύρωστου κλειστού συστήµατος, για τις 4
ακραίες καταστάσεις του συστήµατος

Παρατηρούµε ότι οι πόλοι του εύρωστου κλειστού συστήµατος είναι τοποθετηµένοι


σε ευσταθή περιοχή, αλλά βρίσκονται και εντός των ορίων της LMI περιοχής που
έχουµε καθορίσει εξαρχής. Οι ευθείες γραµµές που απεικονίζονται στην παραπάνω
γραφική παράσταση, οριοθετούν την LMI περιοχή.

Ωστόσο, το σύστηµα δεν περιορίζεται µόνο σε αυτές τις τέσσερις καταστάσεις


και για αυτό το λόγο θα πρέπει να έχουµε µια πιο σφαιρική άποψη, όσον αφορά την
ευστάθειά του. Έτσι εξετάζοντας τα εκάστοτε συστήµατα, που προκύπτουν από
όλους τους πιθανούς συνδυασµούς των παραµέτρων k και f, παίρνουµε τα παρακάτω
αποτελέσµατα.

104
Σχήµα 6.14 Βηµατική απόκριση του συστήµατος για όλους τους πιθανούς
συνδυασµούς των παραµέτρων k και f

Οι παραπάνω βηµατικές αποκρίσεις του συστήµατος δείχνουν ότι για όλες τις τιµές
των παραµέτρων το σύστηµα µπορεί να ανταποκρίνεται µε ευστάθεια. Συγκρίνοντας
δε τις αποκρίσεις αυτές, µε τις αντίστοιχες αποκρίσεις του ανοικτού συστήµατος,
µπορούµε να ισχυριστούµε µε ασφάλεια ότι ο µικτός σχεδιασµός, που
χρησιµοποιήσαµε για τη σχεδίαση του ελεγκτή ανάδρασης, είναι ιδιαίτερα
αποδοτικός. Τόσο η βηµατική απόκριση, όσο και η διευθέτηση των πόλων µέσα στην
ευσταθή LMI περιοχή, δείχνουν ότι το ασταθές σύστηµα έχει σταθεροποιηθεί και
κατά αυτό τον τρόπο η επίδραση της εξωτερικής διαταραχής w πάνω στη γωνία θ 2
έχει περιοριστεί. Σηµειώνεται ότι οι συγκεκριµένες γραφικές παραστάσεις
απεικονίζουν τις αποκρίσεις όλων των εξόδων του συστήµατος ως προς και τις δύο
εισόδους του και δεν περιορίζονται στη µία έξοδο, όπως έγινε προηγουµένως χάριν
απλότητας.

Οι πόλοι του ανοικτού συστήµατος που απεικονίζονται στο σχήµα 6.9 είναι
όλοι συγκεντρωµένοι στην περιοχή κοντά στο µηδέν, πράγµα που δείχνει ότι το
σύστηµα είναι πρακτικά ασταθές. Το σχήµα που ακολουθεί επιβεβαιώνει την
ευστάθεια του κλειστού συστήµατος και δείχνει ότι η LMI ευσταθής περιοχή που
επιλέχθηκε περικλείει το σύνολο των πόλων του.

105
Σχήµα 6.15 Θέσεις των πόλων του κλειστού συστήµατος για όλους τους πιθανούς
συνδυασµούς των αβέβαιων παραµέτρων

Τέλος, ας σηµειωθεί ότι ανάλογα αποτελέσµατα είναι δυνατόν να προκύψουν


και µε επιλογή άλλης ευσταθούς LMI περιοχής.

6.4 Συµπεράσµατα

Για να γίνει αποδεκτή η εύρωστη συµπεριφορά ενός συστήµατος, θα πρέπει


να ικανοποιηθούν πολλές απαιτήσεις, ταυτόχρονα. ∆εν αρκεί µια απλή διευθέτηση
πόλων, αλλά ούτε και είναι ικανοποιητική µια καλή απόκριση του συστήµατος. Η
ευρωστία πετυχαίνεται µε συνδυασµό στόχων και απαιτήσεων. Έτσι ένα απλό
κριτήριο ευστάθειας δεν µπορεί να αντεπεξέλθει µε πολλές και διαφορετικές
προδιαγραφές και να εγγυηθεί για την ικανοποίησή τους. Σύµφωνα όσα αναφέρθηκαν
στο κεφάλαιο αυτό και µε όσα προέκυψαν από την εφαρµογή στο σύστηµα του
δορυφόρου, µπορούµε να ισχυριστούµε ότι ο µικτός σχεδιασµός H ∞ / H 2 , µπορεί να
ικανοποιήσει πολλούς διαφορετικούς στόχους. Ο ελεγκτής ανάδρασης, που προκύπτει
από το σχεδιασµό αυτό, σταθεροποιεί ένα αρχικά ασταθές σύστηµα και ελαχιστοποιεί
την επίδραση εξωτερικής διαταραχής w, η οποία επηρεάζει µια από τις µεταβλητές
κατάστασής του συστήµατος.

Σε ότι αφορά τον έλεγχο εγγυηµένου κόστους για πολλαπλές αντικειµενικές


συναρτήσεις (ή δείκτες επιδόσεων), αυτός συνίσταται στην εύρεση ενός κοινού άνω
φράγµατος για όλους τους δείκτες επιδόσεων, µε την έννοια του εγγυηµένου κόστους.
Όπως αναφέρθηκε και στο Παράδειγµα 6.2.1, όταν οι θεωρούµενοι δείκτες
επιδόσεων έχουν τον ίδιο πίνακα βάρους εισόδου, είναι δυνατόν να εξασφαλιστούν
περισσότεροι βαθµοί ελευθερίας στην επιλογή του κέρδους και συνεπώς µπορούν να
ικανοποιηθούν πρόσθετες προδιαγραφές σχεδιασµού.

106
Κεφάλαιο 7

Έλεγχος πολλαπλών µοντέλων

Για την περιγραφή αβέβαιων συστηµάτων είναι δυνατόν να χρησιµοποιηθεί


ένας πεπερασµένος αριθµός επί µέρους γραµµικών µοντέλων µε γνωστές
παραµέτρους. Η περιγραφή αυτή προσφέρεται σε περιπτώσεις όπου ένα σύστηµα
λειτουργεί συνήθως σε γνωστές περιοχές λειτουργίας, οι οποίες θεωρούνται
γραµµικές και αντιστοιχούν στα επί µέρους γραµµικά µοντέλα. Το ζητούµενο τότε
είναι η εύρεση ενός νόµου ελέγχου που να εξασφαλίζει την ευστάθεια κλειστού
βρόχου καθώς και ένα αποδεκτό επίπεδο επιδόσεων σε κάθε ένα από τα επί µέρους
µοντέλα του συστήµατος.

Το κεφάλαιο αυτό εξετάζει το παραπάνω πρόβληµα και παρουσιάζει τις


προτεινόµενες λύσεις όπως αυτές προκύπτουν από κατάλληλες µεθοδολογίες.

7.1 ∆ιατύπωση του προβλήµατος

Έστω ότι το αβέβαιο σύστηµα περιγράφεται από M γραµµικά και χρονικά


αµετάβλητα µοντέλα κατάστασης,

xi (t ) = Ai xi (t ) + Bi ui (t )
(7.1)
yi (t ) = Ci xi (t )

όπου i = 1, 2,..., M . Επίσης, έστω ότι,

- ( Ai , Bi ) είναι σταθεροποιήσιµο
- (Ci , Ai ) είναι ανιχνεύσιµο και
- Ci είναι πλήρους τάξης

για κάθε i = 1, 2,..., M .

107
Οι επιδόσεις του συστήµατος περιγράφονται από την τετραγωνική συνάρτηση
κόστους,

M ⎧∞ T ⎫
J ( K ) = ∑ γ i E ⎨ ∫ ⎡⎣ xi (t )Qi xi (t ) + ui (t ) Ri ui (t ) ⎤⎦ dt ⎬
T
(7.2)
i =1 ⎩0 ⎭

όπου γ i είναι βαθµωτά µεγέθη και Qi , Ri είναι πίνακες βαρών που ικανοποιούν τις
συνθήκες Qi > 0 και Ri > 0 για κάθε i = 1, 2,..., M . Το E είναι η µαθηµατική
προσδοκία. Τα διανύσµατα αρχικής κατάστασης xi 0 είναι τυχαία διανύσµατα µε
µηδενική µέση τιµή και µε θετική διασπορά,

{
Vi = E xi 0 xi 0
T
} > 0, i = 1, 2,..., M (7.3)

Έστω ότι για το παραπάνω σύστηµα πρέπει να βρεθεί ένας νόµος ελέγχου
ανάδρασης κατάστασης,

ui (t ) = − Kxi (t ) (7.4)

για i = 1, 2,..., M ο οποίος να σταθεροποιεί ασυµπτωτικά τα M µοντέλα της (7.1) και


να ελαχιστοποιεί τη συνάρτηση κόστους (7.2). Είναι γνωστό ότι για τυχαίες αρχικές
καταστάσεις η (7.2) παίρνει τη µορφή,

M
J ( K ) = ∑ γ i tr (PV
i i) (7.5)
i =1

όπου οι πίνακες Pi είναι οι θετικά ηµι- ορισµένες λύσεις των εξισώσεων Lyapunov,

( Ai − Bi K )T Pi + Pi ( Ai − Bi K ) + Qi + K T Ri K = 0 (7.6)

Στη συνέχεια του κεφαλαίου αυτού θα αναπτυχθούν τεχνικές εύρεσης εύρωστων


ελεγκτών για τον έλεγχο πολλαπλών µοντέλων.

7.2 Μέθοδος διπλής βελτιστοποίησης

Έστω το σύστηµα (7.1) µε τετραγωνική συνάρτηση κόστους (7.2) και για το


οποίο αναζητείται ένας νόµος ελέγχου της µορφής (7.4). Έστω ακόµη ότι το ζεύγος
( Ai , Qi ) είναι παρατηρήσιµο για κάθε i = 1, 2,..., M . Το πρόβληµα του γραµµικού
τετραγωνικού εύρωστου ελέγχου (7.1) – (7.6) µπορεί να αναδιατυπωθεί ως ένα
πρόβληµα στατικής βελτιστοποίησης ως προς το κέρδος K (Looze 1983).

Αρχικά ορίζεται ένα σύνολο κερδών ανάδρασης K για τα οποία το κλειστό


σύστηµα είναι ασυµπτωτικά ευσταθές για κάθε i = 1, 2,..., M . ∆ηλαδή,

K = {K : ( Ai − Bi K ) είναι ασυµπτωτικά ευσταθές ∀ i = 1, 2,..., M } (7.7)

108
Έστω ότι το K δεν είναι κενό. Σηµειώνεται ότι η υπόθεση αυτή δεν είναι
τετριµµένη, µε την έννοια ότι η ιδιότητα της σταθεροποίησης για κάθε i = 1, 2,..., M
δεν είναι δεδοµένη.

Για K ∈ K ορίζονται τα


X i := E{∫ xi (t ) xi (t )dt}
T
(7.8)
0

και αποδεικνύεται ότι,

M
J ( K ) = ∑ tr{(Qi + K T Ri K ) X i } (7.9)
i =1

ενώ τα X i υπολογίζονται επίσης από M εξισώσεις Lyapunov,

( Ai − Bi K ) X i + X i ( Ai − Bi K )T + Vi = 0 , i = 1, 2,..., M (7.10)

Για K ∉ K ορίζεται, J ( K ) = +∞ και προσδιορίζεται από τις (7.9), (7.10) για


κάθε τιµή του K .

Η παραπάνω αναδιατύπωση του προβλήµατος ελέγχου χρησιµοποιείται σε


πολλών ειδών προβλήµατα. Οι αναγκαίες συνθήκες είναι πρώτης τάξης και
υπολογίζονται εύκολα από τη σχέση,

M
∇J ( K ) = ∑ {Ri KX i − Bi Pi X i }
T
(7.11)
i =1

όπου τα X i και Pi προσδιορίζονται από τις 2M εξισώσεις Lyapunov,

( Ai − Bi K ) X i + X i ( Ai − Bi K )T + Vi = 0
(7.12)
( Ai − Bi K ) Pi + Pi ( Ai − Bi K ) + Qi + K Ri K = 0
T T

για i = 1, 2,..., M . Στις παραπάνω εξισώσεις, ο αριθµός των ανεξάρτητων µεταβλητών


είναι ανεξάρτητος του αριθµού των σηµείων λειτουργίας M . Επίσης, επειδή οι (7.12)
είναι αποσυζευγµένες για δεδοµένο K , ο υπολογισµός του ∇J ( K ) εξαρτάται
γραµµικά από το M . Οπότε το επιπλέον υπολογιστικό κόστος από την προσθήκη και
άλλων µοντέλων διαφορετικών σηµείων λειτουργίας, είναι µικρό.

Η δυσκολία του προβλήµατος έγκειται στην εύρεση µιας αρχικής τιµής για το
K ∈ K , προκειµένου να εφαρµοστεί ένας καθοδικός αλγόριθµος. Έτσι, ο
προσδιορισµός µιας τέτοιας τιµής του K είναι συχνά πολύ δύσκολος, πράγµα που
περιορίζει την εφαρµογή της µεθόδου. Σε ανάλογα προβλήµατα µαθηµατικού
προγραµµατισµού ή ιεραρχικού ελέγχου χρησιµοποιείται συνήθως µια τεχνική που

109
συνίσταται στο διαχωρισµό του αρχικού προβλήµατος βελτιστοποίησης σε M
ανεξάρτητα υπο- προβλήµατα. Η ιδέα είναι τότε η εύρεση M διαφορετικών κερδών
ανάδρασης, ένα για κάθε υπο- σύστηµα, µε τον περιορισµό αυτά να είναι µεταξύ τους
ίσα. Η τεχνική αυτή όµως εισάγει δευτερεύοντα θεωρητικά προβλήµατα όπως η
διατήρηση της κυρτότητας και της διαχωρισιµότητας του αρχικού προβλήµατος. Στη
συνέχεια θα παρουσιαστεί µια τεχνική επίλυσης µε πολλαπλασιαστές Lagrange που
καταλήγει στην υλοποίηση ενός αλγορίθµου τριών επιπέδων (Looze 1983).

Ορίζονται τα σύνολα κερδών,

K i := {K i : ( Ai − Bi K i ) είναι ασυµπτωτικά ευσταθές }


(7.13)
K = K1 × K 2 × ... × K M

Αν K i ∈ K , i = 1, 2,..., M , τότε έστω,

M
J ( K1 ,..., K M ) = ∑ tr[(Qi + K i Ri K i ) X i ]
T
(7.14)
i =1

όπου το X i προσδιορίζεται από την

( Ai − Bi K i ) X i + X i ( Ai − Bi K i )T + Vi = 0 (7.15)

Αν K i ∉ K , τότε

J ( K1 ,..., K M ) = +∞ (7.16)

Το πρόβληµα τότε ανάγεται στην ελαχιστοποίηση του J ( K1 ,..., K M ) µε τους


περιορισµούς (7.15) και

K i = K i +1 , i = 1, 2,..., M − 1 (7.17)

Επειδή το πρόβληµα αυτό γενικά δεν ικανοποιεί τις συνθήκες κυρτότητας που
απαιτούνται για την άµεση εφαρµογή της θεωρίας Lagrange, προστίθενται στην
(7.14) τετραγωνικοί όροι συναρτήσει των K i οπότε λαµβάνεται η µορφή,

M
1
J ( K1 ,..., K M ; K ) = J ( K1 ,..., K M ) + ∑ tr[( K i − K )( K i − K )T ] (7.18)
i =1 2c

Έτσι, για προκαθορισµένο K και για ικανοποιητικά µικρή τιµή του c , το πρόβληµα
ελαχιστοποίησης της (7.18) υπό τους περιορισµούς (7.15) και (7.17) ικανοποιεί τους
περιορισµούς κυρτότητας της θεωρίας Lagrange. Επιπλέον, για προκαθορισµένο K
το πρόβληµα παραµένει διαχωρίσιµο. Τέλος, αν K = K ∗ στη λύση της (7.10), τότε το
ζητούµενο κέρδος ανάδρασης είναι K1 = ... = K M = K ∗ .

Για προκαθορισµένο K , ορίζεται η συνάρτηση,

110
ϕc ( K ) = min {J ( K1 ,..., K M ; K ) : ικανοποιούνται οι (7.15), (7.17)} (7.19)
( K1 ,..., K M )∈K

Αποδεικνύεται ότι το κέρδος K ∗ αποτελεί ένα τοπικό ελάχιστο της ϕc και ότι

1
∇ϕc ( K ) = [ K − Kˆ ( K , c)] (7.20)
c

όπου Kˆ ( K , c) είναι η λύση στην ελαχιστοποίηση που απαιτεί η (7.19). Άρα, µπορεί
να χρησιµοποιηθεί ένας καθοδικός αλγόριθµος µε τη µορφή,

K k +1 = K k − α k ∇ϕc ( K k ) (7.21)

όπου α k είναι µία βαθµωτή παράµετρος. Για α k = c η (7.21) γίνεται K k +1 = Kˆ ( K k , c) .


Έχει αποδειχθεί ότι ο αλγόριθµος αυτός συγκλίνει σφαιρικά µε κατάλληλη επιλογή
του c . Εξάλλου, προκειµένου να επιτευχθεί η ελαχιστοποίηση του δεξιού µέλους της
(7.19), χρησιµοποιούνται πολλαπλασιαστές Lagrange, ως διπλές εκφράσεις των
περιορισµών (7.17). Ειδικότερα, ορίζεται η συνάρτηση,

M −1
L(Λ1 ,..., Λ M −1 , K1 ,..., K M ; K ) = J ( K1 ,..., K M ; K ) + ∑ tr[Λ i ( K i − K i +1 )]
T
(7.22)
i =1

Τότε, για ικανοποιητικά µικρή τιµή του c , ισχύει η θεωρία Lagrange σύµφωνα µε την
οποία,

ϕc ( K ) = max { min L(Λ1 ,..., Λ M −1 , K1 ,..., K M ; K )} (7.23)


( Λ1 ,..., Λ M −1 ) ( K1 ,..., K M )

Η ελαχιστοποίηση µέσα στις αγκύλες µπορεί να διαχωριστεί σε M ανεξάρτητες


ελαχιστοποιήσεις της µορφής,

⎧1 T 1 ⎫
min tr ⎨ (Qi + K i Ri K i ) X i + (Λ i − Λ i −1 )T K i + ( K i − K )T ( K i − K ) ⎬ (7.24)
Ki
⎩2 2c ⎭

µε τους περιορισµούς,

( Ai − Bi K i ) X i + X i ( Ai − Bi K i )T + Vi = 0 (7.25)

για i = 1, 2,..., M . Ισχύει ότι Λ 0 = Λ M := 0 . Το πρόβληµα (7.24), (7.25) µπορεί να


λυθεί χρησιµοποιώντας ένα καθοδικό αλγόριθµο και όπου η παράγωγος της (7.25)
δίνεται από τη σχέση,

T 1
Ri K i X i − Bi Pi X i + (Λ i − Λ i −1 ) + ( K i − K ) (7.26)
c

όπου τα X i προσδιορίζονται από την (7.25) και τα Pi προσδιορίζονται από τη σχέση,

111
T
( Ai − Bi K i )T Pi + Pi ( Ai − Bi K i ) + Qi + K i Ri K i = 0 (7.27)

Αντίστοιχα, η µεγιστοποίηση που απαιτεί η (7.23) µπορεί να λυθεί χρησιµοποιώντας


έναν ανοδικό αλγόριθµο χωρίς περιορισµούς. Η παράγωγος ως προς Λ i του όρου που
βρίσκεται µέσα σε αγκύλες στην (7.23) είναι,

∇ Λi { min L(Λ1 ,..., Λ M −1 , K1 ,..., K M ; K )} = K i − K i +1 (7.28)


( K1 ,..., K M )

για i = 1, 2,..., M − 1 , και όπου K i και K i +1 είναι οι λύσεις του προβλήµατος


ελαχιστοποίησης που βρίσκεται µέσα σε αγκύλες στην (7.23). Με βάση τα
αποτελέσµατα αυτά, αναπτύσσεται ένας αλγόριθµος τριών βηµάτων ο οποίος έχει την
ιδιότητα ότι διατηρεί τη διαχωρισιµότητα στο πρώτο βήµα.

Αλγόριθµος 7.2.1

Βήµα 1: Για προκαθορισµένες τιµές των K , Λ1 ,..., Λ M −1 και c , επιλύεται το


πρόβληµα ελαχιστοποίησης (7.24) µε τους περιορισµούς (7.25) χρησιµοποιώντας ένα
καθοδικό αλγόριθµο. Η παράγωγος δίνεται από τις σχέσεις (7.26) και (7.27).
Σηµειώνεται ότι για την αρχικοποίηση του αλγορίθµου µπορεί να χρησιµοποιηθεί το
κέρδος

0 −1 T
K i = Ri Bi M i (7.29)

που προκύπτει από την επίλυση της εξίσωσης Riccati,

T −1 T
Ai M i + M i Ai + Qi − M i Bi Ri Bi M i = 0 (7.30)

για i = 1, 2,..., M .

Βήµα 2: Για προκαθορισµένες τιµές των K και c , επιλύεται το πρόβληµα


µεγιστοποίησης (7.23) χρησιµοποιώντας έναν ανοδικό αλγόριθµο. Η παράγωγος
δίνεται από τη σχέση (7.28) και χρησιµοποιεί τα αποτελέσµατα του προηγούµενου
βήµατος.

Βήµα 3: Ελαχιστοποιείται η ϕc ( K ) χρησιµοποιώντας την επαναληπτική σχέση (7.21),


σε οποιαδήποτε από τις δύο µορφές της, καθώς και τα αποτελέσµατα του
προηγούµενου βήµατος. Σηµειώνεται ότι σε περίπτωση που το Βήµα 2 δεν έχει λύση,
µπορεί να µειωθεί η τιµή του c και να επαναληφθεί η διαδικασία.

Ο παραπάνω αλγόριθµος λύνει το πρόβληµα του γραµµικού τετραγωνικού


εύρωστου ελέγχου χωρίς να απαιτείται ένα αρχικό κέρδος ανάδρασης K ∈ K . Το
µειονέκτηµα της µεθόδου έγκειται στο µεγάλο υπολογιστικό φόρτο.

112
7.3 Μέθοδος µη- γραµµικής βελτιστοποίησης

Έστω και πάλι το σύστηµα (7.1) µε τετραγωνική συνάρτηση κόστους (7.2) και
για το οποίο αναζητείται ένας νόµος ελέγχου της µορφής (7.4). Για ευκολία στους
συµβολισµούς ορίζονται τα διανύσµατα,

⎡ x1 ⎤ ⎡ u1 ⎤ ⎡ y1 ⎤
X = ⎢⎢ ⎥⎥ , U = ⎢⎢ ⎥⎥ , Y = ⎢⎢ ⎥⎥
⎢⎣ xM ⎥⎦ ⎢⎣uM ⎥⎦ ⎢⎣ yM ⎥⎦

για i = 1, 2,..., M , καθώς και οι πίνακες,

A = diag M ( A1 ,..., AM ) , B = diag M ( B1 ,..., BM ) , C = diag M (C1 ,..., CM )

V = diag M (V1 ,..., VM ) , K = diag M ( K1 ,..., K M )

Q = diag M (γ 1Q1 ,..., γ M QM ) , R = diag M (γ 1 R1 ,..., γ M RM )

(7.31)
Ακόµη, ορίζεται το σύνολο κερδών ανάδρασης που εξασφαλίζουν ευστάθεια
κλειστού βρόχου µε βαθµό σχετικής ευστάθειας α σε όλα τα µοντέλα, δηλαδή για
i = 1, 2,..., M , ως εξής:

K α = {K : ( A − BK + α I ) είναι ασυµπτωτικά ευσταθές } (7.32)

Τότε, η τετραγωνική συνάρτηση κόστους ορίζεται συναρτήσει του K , ως εξής:

Αν K ∈ K α , τότε
⎧∞ ⎫
Jα ( K ) = E ⎨ ∫ ⎡⎣ X T (t )QX (t ) + U T (t ) RU (t ) ⎤⎦ dt ⎬ (7.33)
⎩0 ⎭

Αν K ∉ K α , τότε Jα ( K ) = +∞

Επίσης, θεωρούµε το µοντέλο µε µετατοπισµένες τις ιδιοτιµές του πίνακα


κατάστασης,

X (t ) = ( A + α I ) X (t ) + BU (t )
(7.34)
Y (t ) = CX (t )

για το οποίο ο νόµος ελέγχου δίνεται από τη σχέση,

U (t ) = − KX (t ) (7.35)

Αποδεικνύεται ότι η συνάρτηση κόστους δίνεται επίσης από τη σχέση,

113
Jα ( K ) = tr ( PV ) (7.36)

όπου P είναι η λύση της εξίσωσης Lyapunov,

( A − BK + α I )T P + P( A − BK + α I ) = −Q − K T RK (7.37)

Έτσι, το αρχικό πρόβληµα σχεδιασµού ανάγεται στην εύρεση ενός νόµου ελέγχου της
µορφής (7.35) (τότε K = K opt ) που σταθεροποιεί ασυµπτωτικά το µοντέλο (7.34) για
α = 0 και ελαχιστοποιεί την (7.33).

Για την εύρεση αυτών των κερδών ανάδρασης ακολουθείται η ακόλουθη διαδικασία
(Aioun et al. 1996).

Αλγόριθµος 7.3.1

Βήµα 1: Θέτουµε k = 0 , K 0 = 0 , α 0 = − max(Re(λ j ( A)) , όπου Re(λ j ( A) συµβολίζει


το πραγµατικό µέρος των j ιδιοτιµών του πίνακα A .

Βήµα 2: Αν α k > 0 , τότε ο ρυθµιστής µε κέρδος K k σταθεροποιεί ασυµπτωτικά τον


πίνακα A − BK k . Άρα, αρχικοποιώντας µε τον K k µπορεί να βρεθεί µια βέλτιστη
λύση K opt που σταθεροποιεί τα M γραµµικά µοντέλα και ελαχιστοποιεί την (7.2).
Έτσι το πρόβληµα λύνεται και ο αλγόριθµος τελειώνει.

Βήµα 3: Αν α k ≤ 0 , τότε ο ρυθµιστής µε κέρδος K k σταθεροποιεί ασυµπτωτικά τον


πίνακα A − BK k + α I , όπου α = α k − ε k , για ε k > 0 αρκετά µικρό, τότε τα M
µοντέλα σταθεροποιούνται µε τον K k για α = α k − ε k , δηλαδή οι ιδιοτιµές του
A − BK k που βρίσκονται στο θετικό µιγαδικό ηµι- επίπεδο µετατοπίζονται κατά ε k
προς τα αριστερά, ώστε να τεθούν στο αριστερό µιγαδικό ηµι- επίπεδο.
Έτσι, βρίσκοντας έναν αρχικό ρυθµιστή K k , µπορούµε να υπολογίσουµε ένα
ρυθµιστή K k +1 που σταθεροποιεί ασυµπτωτικά τον πίνακα A − BK k +1 + (α k − ε k ) I και
ελαχιστοποιεί τη συνάρτηση κόστους Jα k −ε k ( K ) .
Ορίζεται το α k +1 = − max(Re(λ j ( A − BK k +1 ))) . Θεωρώντας ότι το ε k > 0 έχει επιλεγεί
ώστε να είναι αρκετά µικρό, υπάρχουν οι εξής περιπτώσεις:

Βήµα 4: Αν α k +1 ≤ α k , τότε το πρόβληµα δεν έχει λύση και η διαδικασία τελειώνει


εδώ.

Βήµα 5: Αν α k +1 > α k , τότε οι ιδιοτιµές του A − BK k +1 βρίσκονται στο αριστερό


µιγαδικό ηµι- επίπεδο και αριστερά του κάθετου άξονα που περνάει από το σηµείο
−α k . Στην περίπτωση αυτή, θέτουµε k = k + 1 και επαναλαµβάνουµε τον αλγόριθµο
από το Βήµα 2.

114
Με τη µετατόπιση των ιδιοτιµών επιτυγχάνεται η σταθεροποίηση του
κλειστού συστήµατος. Ο παραπάνω αλγόριθµος συγκλίνει πάντα σε µια τιµή K opt ,
όταν υπάρχει ένας αρχικός ρυθµιστής.

7.4 Μέθοδος µε γραµµικές ανισότητες πινάκων

Το πρόβληµα του εύρωστου ελέγχου πολλαπλών µοντέλων µπορεί να λυθεί


πολύ ευκολότερα υπολογιστικά, εφόσον µετατρέπεται σε ένα πρόβληµα κυρτής
βελτιστοποίησης, οπότε η λύση του υπολογίζεται µε τη χρήση LMIs.

Θεωρούµε και πάλι τα M γραµµικά µοντέλα,

xi (t ) = Ai xi (t ) + Bi ui (t ) (7.38)

και τις συναρτήσεις κόστους

M ⎧∞ T ⎫
J ( K ) = ∑ E ⎨ ∫ ⎡⎣ xi (t )Qi xi (t ) + ui (t ) Ri ui (t ) ⎤⎦ dt ⎬
T
(7.39)
i =1 ⎩0 ⎭

i = 1, 2,..., M . Όπως ήδη αναφέρθηκε, για τυχαίες αρχικές συνθήκες µε E xi 0 xi 0 { T


} =1
M
η βέλτιστη τιµή της συνάρτησης κόστους είναι J ( K ) = ∑ tr (Pi ) ενώ οι θετικά
i =1

ορισµένοι πίνακες Pi ικανοποιούν τις εξισώσεις Riccati

( Ai − Bi K )T Pi + Pi ( Ai − Bi K ) + Qi + K T Ri K = 0 (7.40)

για i = 1, 2,..., M

Εφόσον τα M γραµµικά µοντέλα πρέπει να ικανοποιούν τις ίδιες


προδιαγραφές ελέγχου, µπορεί να θεωρηθεί ότι Qi = Q και Ri = R για όλα τα
i = 1, 2,..., M . Στην περίπτωση αυτή είναι επιθυµητό να υπάρχει µια κοινή λύση για
όλες τις εξισώσεις της (7.40) δηλαδή Pi = P για όλα τα i = 1, 2,..., M . Τότε, το
πρόβληµα σχεδιασµού ανάγεται στην εύρεση ενός νόµου ελέγχου της µορφής, (7.4)
που να ελαχιστοποιεί την

M ⎧∞ T ⎫ M
J ( K ) = ∑ E ⎨ ∫ ⎡⎣ xi (t )Qxi (t ) + ui (t ) Rui (t ) ⎤⎦ dt ⎬ = ∑ tr (P)
T
(7.41)
i =1 ⎩0 ⎭ i =1

ενώ ο P ικανοποιεί τις εξισώσεις Riccati

( Ai − Bi K )T P + P( Ai − Bi K ) + Q + K T RK = 0 (7.42)

Το πρόβληµα αυτό µπορεί να διατυπωθεί σαν ένα πρόβληµα κυρτής βελτιστοποίησης


και να επιλυθεί µε τη χρήση LMIs ως εξής:

115
Θεώρηµα 7.4.1
Αν το ακόλουθο πρόβληµα ελαχιστοποίησης,

min[tr ( M )] (7.43)
M ,W

µε περιορισµούς LMI

⎡M I⎤
⎢I >0 (7.44)
⎣ W ⎥⎦

και

⎡ −WAi − AW
i + Bi R −1 Bi
T
W⎤
⎢ ⎥>0 (7.45)
⎢⎣ W Qˆ ⎥⎦

όπου M , W θετικά ορισµένοι πίνακες, W = P −1 και Q̂ = Q −1 , επιδέχεται µια εφικτή


λύση για κάποιο Q < Q και για i = 1, 2,..., M , τότε ο νόµος ελέγχου της µορφής (7.4)
µε κέρδος ανάδρασης

T
K = R −1 Bi P (7.46)

ελαχιστοποιεί τη συνάρτηση κόστους (7.41).

Απόδειξη: (βλ. Κεφάλαιο 3 και Dorato et al. 1995)

Παρατηρούµε ότι ο νόµος ελέγχου (7.46) προκύπτει ως συνάρτηση του


πίνακα εισόδου του i -στού µοντέλου. Το γεγονός αυτό φαίνεται κατ’ αρχάς, να
έρχεται σε αντίθεση µε την αρχική υπόθεση ότι η παρούσα τεχνική ελέγχου οδηγεί σ’
ένα κοινό νόµο ελέγχου που είναι ανεξάρτητος από τα επί µέρους µοντέλα. Ωστόσο,
είναι γεγονός ότι η έκφραση του (7.46) παρέχει στο σχεδιασµό περισσότερους
βαθµούς ελευθερίας και επιτρέπει την ικανοποίηση περαιτέρω απαιτήσεων επιδόσεων
µε την κατάλληλη επιλογή Bi .

7.5 Παράδειγµα

Οι µέθοδοι εύρωστου ελέγχου πολλαπλών µοντέλων που αναπτύχθηκαν στις


προηγούµενες παραγράφους θα εφαρµοστούν στο πρόβληµα του αεροσκάφους F4E
το οποίο έχει µελετηθεί πολλές φορές στη βιβλιογραφία (Franklin and Ackerman
1980, Looze 1983). Το σύστηµα έχει τρεις µεταβλητές κατάστασης (την επιτάχυνση
N z , το ρυθµό περιστροφής έλικας q και την απόκλιση του ενεργοποιητή δ e ) και µια
είσοδο (την ταχύτητα περιστροφής του κινητήρα). Θεωρούνται τέσσερις καταστάσεις
πτήσης που αντιστοιχούν στα χαρακτηριστικά του Πίνακα 7.1:

116
Μοντέλο Ταχύτητα αεροσκάφους προς ταχύτητα ήχου Ύψος (ft)
(α) 0.5 5000
(β) 0.85 5000
(γ) 0.9 35000
(δ) 1.5 35000

Πίνακας 7.1 Χαρακτηριστικά πτήσης από τα οποία προκύπτουν τα µοντέλα


κατάστασης

Σε κάθε κατάσταση πτήσης αντιστοιχεί ένα σηµείο λειτουργίας του συστήµατος.


Έτσι, προκύπτουν τέσσερα µοντέλα κατάστασης για το σύστηµα, µε τη µορφή,

x(t ) = Ai x(t ) + Bi u (t )

για i = 1,..., 4 . Οι πίνακες κατάστασης και εισόδου των µοντέλων αυτών είναι,

⎡ −0.9896 17.41 96.15 ⎤ ⎡ −97.78⎤


⎢ ⎥
A1 = ⎢ 0.2648 −0.8512 −11.39 ⎥ , B1 = ⎢⎢ 0 ⎥⎥
⎢⎣ 0 0 −14 ⎥⎦ ⎢⎣ 14 ⎥⎦

⎡ −1.702 50.72 263.5 ⎤ ⎡ −272.2 ⎤


⎢ ⎥
A2 = ⎢ 0.2201 −1.418 −31.99 ⎥ , B2 = ⎢⎢ 0 ⎥⎥
⎢⎣ 0 0 −14 ⎥⎦ ⎢⎣ 14 ⎥⎦

⎡ −0.6607 18.11 84.34 ⎤ ⎡ −85.09 ⎤


⎢ ⎥
A3 = ⎢ 0.08201 −0.6587 −10.81⎥ , B3 = ⎢⎢ 0 ⎥⎥
⎢⎣ 0 0 −14 ⎥⎦ ⎢⎣ 14 ⎥⎦

⎡ −0.5162 26.96 178.9 ⎤ ⎡ −175.6 ⎤


⎢ ⎥
A4 = ⎢ −0.6896 −1.225 −30.38⎥ , B4 = ⎢⎢ 0 ⎥⎥
⎢⎣ 0 0 −14 ⎥⎦ ⎢⎣ 14 ⎥⎦

Για τον έλεγχο του συστήµατος αυτού θα εφαρµοστούν οι µέθοδοι που αναπτύχθηκαν
παραπάνω, δηλαδή η µέθοδος διπλής βελτιστοποίησης, η µέθοδος µη-γραµµικής
βελτιστοποίησης και η µέθοδος µε τη χρήση γραµµικών ανισοτήτων πινάκων (LMIs).
Στους πίνακες που ακολουθούν δίνονται οι τιµές των κερδών ανάδρασης K και οι
χρόνοι απόκρισης (αποκατάστασης ts ) του κλειστού συστήµατος που λαµβάνονται
από κάθε µέθοδο για τα τέσσερα σηµεία λειτουργίας.

117
Μέθοδος Πίνακας κέρδους Κ Χρόνος απόκρισης
(sec)
∆ιπλή βελτιστοποίηση [-0.0285 -0.3120 0.1816] 5.6
Μη-γραµµική βελτιστοποίηση [-1.0241 -1.1758 -0.4344] 4.1
LMI [-0.0250 -0.2563 -0.5235] 2.7

Πίνακας 7.2 Συγκριτικά αποτελέσµατα για το µοντέλο ( A1 , B1 )

Μέθοδος Πίνακας κέρδους Κ Χρόνος απόκρισης


(sec)
∆ιπλή βελτιστοποίηση [-0.0285 -0.3120 0.1816] 1.8
Μη-γραµµική βελτιστοποίηση [-1.0241 -1.1758 -0.4344] 3.1
LMI [-0.0250 -0.2563 -0.5235] 1.3

Πίνακας 7.3 Συγκριτικά αποτελέσµατα για το µοντέλο ( A2 , B2 )

Μέθοδος Πίνακας κέρδους Κ Χρόνος απόκρισης


(sec)
∆ιπλή βελτιστοποίηση [-0.0285 -0.3120 0.1816] 3.3
Μη-γραµµική βελτιστοποίηση [-1.0241 -1.1758 -0.4344] 3.7
LMI [-0.0250 -0.2563 -0.5235] 2.1

Πίνακας 7.4 Συγκριτικά αποτελέσµατα για το µοντέλο ( A3 , B3 )

Μέθοδος Πίνακας κέρδους Κ Χρόνος απόκρισης


(sec)
∆ιπλή βελτιστοποίηση [-0.0285 -0.3120 0.1816] 2.2
Μη-γραµµική βελτιστοποίηση [-1.0241 -1.1758 -0.4344] 3.8
LMI [-0.0250 -0.2563 -0.5235] 2.1

Πίνακας 7.5 Συγκριτικά αποτελέσµατα για το µοντέλο ( A4 , B4 )

Οι χρονικές αποκρίσεις (βηµατικές) των τεσσάρων µοντέλων κλειστών συστηµάτων


που λαµβάνονται µε τον κοινό ελεγκτή κέρδους K για κάθε µια από τις
προτεινόµενες µεθόδους ελέγχου δίνονται στα παρακάτω σχήµατα. Είναι φανερό ότι
η µέθοδος που χρησιµοποιεί LMIs υπερέχει ως προς τα χαρακτηριστικά της
µεταβατικής απόκρισης.

118
Step Response
0

-20

To: Out(1)
-40

-60

0
To: Out(2)
Amplitude

-2

-4
1

0.5
To: Out(3)

-0.5

-1
0 1 2 3 4 5 6
Time (sec)

Σχήµα 7.1 Χρονικές αποκρίσεις των τριών µεταβλητών κατάστασης του πρώτου
µοντέλου µε τις τρεις µεθόδους (µπλε, πράσινο και κόκκινο, αντίστοιχα).

Step Response
0

-10
To: Out(1)

-20

-30

-40

0
To: Out(2)
Amplitude

-2

-4
1

0.5
To: Out(3)

-0.5
0 0.5 1 1.5 2 2.5 3 3.5
Time (sec)

Σχήµα 7.2 Χρονικές αποκρίσεις των τριών µεταβλητών κατάστασης του δεύτερου
µοντέλου µε τις τρεις µεθόδους (µπλε, πράσινο και κόκκινο, αντίστοιχα).

119
Step Response
0

-10

To: Out(1)
-20

-30

-40

0
To: Out(2)
Amplitude

-2

-4
2

1
To: Out(3)

-1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
Time (sec)

Σχήµα 7.3 Χρονικές αποκρίσεις των τριών µεταβλητών κατάστασης του τρίτου
µοντέλου µε τις τρεις µεθόδους (µπλε, πράσινο και κόκκινο, αντίστοιχα).

Step Response
0

-10
To: Out(1)

-20

-30

0
To: Out(2)
Amplitude

-2

-4
1

0.5
To: Out(3)

-0.5
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
Time (sec)

Σχήµα 7.4 Χρονικές αποκρίσεις των τριών µεταβλητών κατάστασης του τέταρτου
µοντέλου µε τις τρεις µεθόδους (µπλε, πράσινο και κόκκινο, αντίστοιχα).

120
7.6 Συµπεράσµατα

Ο έλεγχος αβέβαιων συστηµάτων µε περιγραφή πολλαπλών µοντέλων


βασίζεται στο διαχωρισµό της λειτουργίας του συστήµατος σε ξεχωριστές περιοχές,
κάθε µία από τις οποίες περιγράφεται από ένα τοπικό µοντέλο. Έτσι εξασφαλίζεται η
αναπαράσταση του συστήµατος µε διαφορετικά µοντέλα που ανταποκρίνονται
καλύτερα στη λειτουργία του στις επί µέρους περιοχές. Η περιγραφή αυτή
προσφέρεται ακόµη για πολλά φυσικά συστήµατα, των οποίων η συµπεριφορά δεν
επιτρέπει την αναπαράσταση µε ένα µόνο µοντέλο.

Στο κεφάλαιο αυτό µελετήθηκαν τεχνικές ελέγχου, όπως η διπλή


βελτιστοποίηση, η µη-γραµµική βελτιστοποίηση και η τεχνική µε γραµµικές
ανισότητες πινάκων, για το πρόβληµα του ελέγχου αβέβαιων συστηµάτων µε
περιγραφή πολλαπλών µοντέλων. Σκοπός όλων των παραπάνω µεθόδων είναι η
εύρεση ενός κοινού ελεγκτή για όλα τα µοντέλα του συστήµατος. Οι λύσεις που
απορρέουν από τις τεχνικές αυτές είναι υπολογιστικές, δεδοµένου ότι δεν το
πρόβληµα αυτό δεν έχει αναλυτική λύση. Από τη σύγκριση των µεθόδων που
παρουσιάστηκαν µε τη βοήθεια προσοµοίωσης προκύπτει η µέθοδος που
χρησιµοποιεί γραµµικές ανισότητες πινάκων εξασφαλίζει καλύτερη χρονική
συµπεριφορά του κλειστού συστήµατος στη µεταβατική κατάσταση.

121
Κεφάλαιο 8

Σχεδιασµός εύρωστων παρατηρητών κατάστασης

Το κεφάλαιο αυτό αναφέρεται στο σχεδιασµό εύρωστων ελεγκτών


ανάδρασης κατάστασης µε βάση τις εκτιµώµενες τιµές των καταστάσεων που
προκύπτουν µε τη χρήση παρατηρητών. Σε πολλά πρακτικά προβλήµατα ελέγχου
είναι συχνά επιθυµητό να υπάρχει πληροφορία για το πλήρες διάνυσµα κατάστασης.
Όταν αυτό δεν είναι δυνατόν, σχεδιάζονται παρατηρητές κατάστασης οι οποίοι
ανακατασκευάζουν ασυµπτωτικά το διάνυσµα κατάστασης του συστήµατος,
χρησιµοποιώντας τη διαθέσιµη πληροφορία από την ακριβή γνώση των εισόδων και
των εξόδων (Luenberger 1966, 1979, O’Reilly 1983). Επειδή κάθε πραγµατικό
σύστηµα στην πραγµατικότητα επηρεάζεται από αβεβαιότητες µοντέλου, διαταραχές
και θόρυβο, προκύπτει η ανάγκη σχεδιασµού εύρωστων παρατηρητών κατάστασης
(Kose and Jabbari 1997, Millerioux et al. 2004, Daafouz et al. 2005). Στο πλαίσιο του
εύρωστου ελέγχου, η βέλτιστη εκτίµηση κατάστασης επιτυγχάνεται µέσω της
ελαχιστοποίησης της H ∞ νόρµας της συνάρτησης µεταφοράς µεταξύ σηµάτων
εξωτερικών θορύβων και σφαλµάτων εκτίµησης (Shamma and Tu 1999). Για τα µη-
γραµµικά αβέβαια συστήµατα χρησιµοποιούνται αρχιτεκτονικές παρατηρητών µε
ολισθαίνουσες καταστάσεις (sliding modes) (Hui and Żak 1990, Koshkouei and
Zinober 2004). Σε ότι αφορά τα γραµµικά αβέβαια συστήµατα, η µέχρι τώρα έρευνα
εστιάζεται στο σχεδιασµό παρατηρητών πλήρους κατάστασης έτσι ώστε να
διασφαλίζεται η ευστάθεια του κλειστού συστήµατος για κάθε επιτρεπτή
αβεβαιότητα µιας δεδοµένης κλάσης (Bhattacharya 1976, Petersen 1985, Barmish and
Galimidi 1986, Akpan 2001, Jabbari and Schmitendorf 1993). Η παράγραφος 8.2
αναφέρεται εκτενώς σε µια µέθοδο που θεωρεί τόσο προδιαγραφές εύρωστης
ευστάθειας, όσο και εύρωστων επιδόσεων.

8.1 Γενικά για τους παρατηρητές κατάστασης

Πολλά προβλήµατα ελέγχου λύνονται µε την υπόθεση ότι η πληροφορία της


πλήρους κατάστασης είναι διαθέσιµη στο νόµο ελέγχου. Αυτό είναι συχνά µια
περιοριστική υπόθεση στην πράξη, δεδοµένου ότι µερικές φυσικές ποσότητες είναι
δύσκολο ή κοστίζει ακριβά, να µετρηθούν. Τότε δηµιουργείται το πρόβληµα της

122
υλοποίησης ενός ελέγχου µε βάση τις εκτιµώµενες τιµές των µεταβλητών
κατάστασης του συστήµατος, µε δεδοµένες τις εισόδους και τις εξόδους του. Στην
περίπτωση αυτή χρησιµοποιείται ένας παρατηρητής κατάστασης για να εκτιµήσει τις
µη-µετρήσιµες καταστάσεις µε βάση τις µετρούµενες πληροφορίες κατάστασης και
τις πληροφορίες εισόδου. Η διαδικασία σχεδιασµού παρατηρητών κατάστασης
συγκρίνει το σφάλµα µεταξύ των µετρηµένων και των εκτιµώµενων καταστάσεων.
Για το σκοπό αυτό χρησιµοποιείται µια συνεχής ανατροφοδότηση προκειµένου να
αναγκάσει το σφάλµα να τείνει στο µηδέν. Έτσι λαµβάνεται ένα σύνολο εκτιµώµενων
καταστάσεων που συσχετίζονται ακριβώς µε τα µετρηµένα σήµατα των εκάστοτε
µοντέλων.

Η ευρωστία των ελεγκτών και παρατηρητών κατάστασης επιτυγχάνεται από


το γεγονός ότι το εφαρµοζόµενο σήµα ανατροφοδότησης δίνει τη δυνατότητα στον
παρατηρητή να δοκιµάσει ένα σήµα που ακυρώνει ακριβώς την δράση οποιωνδήποτε
µεταβολών των παραµέτρων ή εξωτερικών σηµάτων διαταραχής, όπως είναι οι
αβεβαιότητες. Αυτή η ανατροφοδότηση είναι µια χρήσιµη πηγή πληροφοριών.
Παραδείγµατος χάριν, εάν το µοντέλο του παρατηρητή αντιπροσωπεύει τη
φυσιολογική λειτουργία ενός συστήµατος, οποιαδήποτε απόκλιση στη µέση τιµή του
συνεχούς σήµατος ανατροφοδότησης που εφαρµόζεται µπορεί να ερµηνευθεί ως
ένδειξη ανώµαλων συνθηκών λειτουργίας. Κατόπιν, η κατάλληλη ανάλυση του
εφαρµοζόµενου σήµατος ανατροφοδότησης µπορεί να επιτρέψει να πάρουµε
ακριβείς πληροφορίες σχετικά µε τη φύση της απόκλισης αυτής ή των µεταβολών
στις παραµέτρους.

8.1.1 Σχεδιασµός παρατηρητών κατάστασης

Ο παρατηρητής είναι ένας εκτιµητής των µεταβλητών κατάστασης και συχνά


ονοµάζεται ασυµπτωτικός παρατηρητής, επειδή εισάγει ένα σφάλµα εκτίµησης που
τείνει εκθετικά ασυµπτωτικά στο µηδέν. Όταν σε προβλήµατα σχεδιασµού αντί των
πραγµατικών καταστάσεων χρησιµοποιούνται οι εκτιµήσεις τους, τότε αποδεικνύεται
ότι ουσιαστικά δεν αλλάζει η συµπεριφορά του νόµου ελέγχου, όµως η χρήση
εκτιµήσεων οδηγεί σε χειροτέρευση της µεταβατικής απόκρισης. Για συνεχή
συστήµατα έχουν σχεδιαστεί παρατηρητές από τους Luenberger, Kalman, Liberzon
Hespanha και Morse, ενώ για διακριτά συστήµατα από τους Ramadge, Caines,
Ozveren και Willsky.

Το πρόβληµα του σχεδιασµού ενός παρατηρητή κατάστασης συνίσταται στον


προσδιορισµό του διανύσµατος κατάστασης x(t ) της περιγραφής κατάστασης,

x(t ) = Ax(t ) + Bu (t )
(8.1)
y (t ) = Cx(t )

όπου x(t ) , u (t ) και y (t ) είναι τα διανύσµατα κατάστασης, εισόδου και εξόδου και
όπου τα y (t ) , u (t ) , καθώς και οι πίνακες A, B, C , είναι δεδοµένα. Θεωρώντας ότι
u (t ) = 0 για t ≤ 0− , από την (8.1) προκύπτει ότι η αρχική συνθήκη προσδιορίζεται
από την εξίσωση,

123
T
Π 0 x(0− ) = ⎡⎣ y (0− ) … y ( n −1) (0− ) ⎤⎦ (8.2)

όπου Π 0 είναι ο πίνακας παρατηρησιµότητας,

⎡ C ⎤
⎢ CA ⎥
Π 0 = Π 0 ( A, C ) = ⎢ ⎥ = ⎡C T T
AT C T … ( AT ) n −1 C T ⎤⎦ (8.3)
⎢ ⎥ ⎣
⎢ n −1 ⎥
⎣CA ⎦

ενώ οι τιµές { y (0− ), … , y ( n −1) (0− )} είναι συνήθως γνωστές.

8.1.2 Παρατηρητής ανοικτού βρόχου

Για την ανακατασκευή του x(t ) µε τη βοήθεια ενός παρατηρητή ανοικτού


βρόχου, χρησιµοποιείται µόνο η (8.1) δηλαδή µε δεδοµένα τις εισόδους u (t ) , τους
πίνακες A και B και µια αρχική συνθήκη x0 υπολογίζεται το x(t ) . Έστω z0 η
εκτίµηση της αρχικής συνθήκης µε ένα µικρό σφάλµα, δηλαδή,

z0 = x0 + e , e << x0 (8.4)

Τότε η εκτιµώµενη κατάσταση z (t ) θα ικανοποιεί την εξίσωση,

z (t ) = Az (t ) + Bu (t ) , z (0− ) = z0 = x0 + e (8.5)

Προφανώς το σφάλµα e(t ) = x(t ) − z (t ) ικανοποιεί την εξίσωση,

e(t ) = Ae(t ) , e(0− ) = e (8.6)

όπου e(0− ) είναι η αρχική συνθήκη για το σφάλµα. Η λύση της (8.6) είναι της
µορφής (O’Reilly 1983),

e(t ) = f ⎡⎣eλit , t j eλk t , …⎤⎦ (8.7)

όπου λi είναι οι ιδιοτιµές του A . Από την (8.7) φαίνεται πως, αν έστω και µια ιδιοτιµή
είναι θετική, τότε x(t ) → ∞ για t → ∞ , δηλαδή το σύστηµα είναι ασταθές. Όµως
ακόµη και όταν το σύστηµα είναι ευσταθές, αλλά ορισµένες ιδιοτιµές του έχουν
µικρό πραγµατικό µέρος, τότε η επίδραση του αρχικού σφάλµατος αποσβένεται πολύ
αργά. Προκειµένου να ξεπεραστούν τα προβλήµατα αυτά, χρησιµοποιείται ένα
σύστηµα κλειστού βρόχου.

124
8.1.3 Παρατηρητής κλειστού βρόχου

Ο παρατηρητής κλειστού βρόχου προσπαθεί να µηδενίσει το σφάλµα


εκτίµησης e(t ) χρησιµοποιώντας ανάδραση που είναι ανάλογη του σφάλµατος.
Επειδή όµως το σφάλµα είναι e(t ) = x(t ) − z (t ) και το x(t ) δεν είναι γνωστό,
χρησιµοποιείται το σφάλµα εξόδου y (t ) = y (t ) − yˆ (t ) . Υπενθυµίζεται ότι το y (t )
είναι µετρήσιµο και συνδέεται γραµµικά µε το x(t ) µέσω της (8.1). Έτσι ισχύει,

y (t ) = y (t ) − yˆ (t ) = C [ x(t ) − z (t )] = Ce(t ) (8.8)

Η εξισώσεις κατάστασης του παρατηρητή λαµβάνουν τη µορφή,

z (t ) = Az (t ) + Bu (t ) + K [ y (t ) − Cz (t ) ] (8.9)

όπου K είναι ένας σταθερός n ×1 πίνακας ανάδρασης που πρέπει να προσδιοριστεί


κατάλληλα. Η δυναµική του σφάλµατος ικανοποιεί την εξίσωση,

e(t ) = x(t ) − z (t ) = ( A − KC )e(t ) , e(0) = x0 − z0 (8.10)

και είναι φανερό ότι η κατάλληλη εκλογή του K µπορεί να οδηγήσει σε ένα σφάλµα
που αποσβένεται ασυµπτωτικά, οπότε το σύστηµα (8.9) είναι ένας ασυµπτωτικός
παρατηρητής. Η υλοποίηση του συστήµατος µε παρατηρητή κατάστασης δίνεται στο
Σχήµα 8.1.

Σχήµα 8.1. ∆ιάγραµµα βαθµίδων ασυµπτωτικού παρατηρητή

Στη συνέχεια δίνονται οι συνθήκες ύπαρξης ενός ασυµπτωτικού παρατηρητή µέσω


του κλασικού Θεωρήµατος 8.1. (Luenberger 1966).

125
Θεώρηµα 8.1
Αν το ζεύγος ( A, C ) είναι παρατηρήσιµο, τότε µπορούµε να προσδιορίσουµε ένα
πίνακα K έτσι ώστε ο A − KC να έχει τις επιθυµητές ιδιοτιµές, δηλαδή:

det [ sI n − A + KC ] = s n + a1s n −1 + ... + an (8.11)

όπου οι συντελεστές ai , i = 1, 2,..., n είναι τυχαίοι αριθµοί.

Εποµένως ένας ασυµπτωτικός παρατηρητής µπορεί να σχεδιαστεί αν το ζεύγος


( A, C ) είναι παρατηρήσιµο, ανεξάρτητα από το αν συνδυαστεί ή όχι µε το αρχικό
σύστηµα ανάδρασης.

8.1.4 Παρατηρητής µειωµένης τάξης ή παρατηρητής Luenberger

Μία διαφορετική µέθοδος αναπτύχθηκε από τον Luenberger ο οποίος


διατύπωσε ένα γενικότερο πρόβληµα εκτίµησης. Ο παρατηρητής κατάστασης που
προκύπτει έχει µικρότερο βαθµό από την τάξη του συστήµατος και για το λόγο αυτό
ονοµάζεται παρατηρητής µειωµένης τάξης ή παρατηρητής Luenberger.

(α) Γραµµικά συστήµατα µιας εξόδου

Στα συστήµατα µιας εξόδου αρκεί να παρατηρήσουµε n − 1 καταστάσεις και


στη συνέχεια να προσδιορίσουµε τη n -οστή κατάσταση από τη σχέση y (t ) = Cx(t ) .
Συγκεκριµένα, αν µε κάποιο µετασχηµατισµό οµοιότητας το διάνυσµα C πάρει τη
µορφή C T = [ 0 … 0 1] , τότε,

y (t ) = Cx(t ) = xn (t ) (8.12)

Από την (8.12) φαίνεται ότι η κατάσταση xn (t ) είναι παρατηρήσιµη. Τότε, η (8.1)
γράφεται µε τη µορφή,

⎡ xr (t ) ⎤ ⎡ a11 a12 ⎤ ⎡ xr (t ) ⎤ ⎡ b1 ⎤
⎢ x (t ) ⎥ = ⎢ a +
a22 ⎥⎦ ⎢⎣ xn (t ) ⎥⎦ ⎢⎣b2 ⎥⎦
u (t )
⎣ n ⎦ ⎣ 21
(8.13)
y (t ) = Cxn (t )

όπου xr = [ x1 x2 … xn −1 ] είναι το διάνυσµα που περιλαµβάνει τις µεταβλητές


T

κατάστασης που πρέπει να εκτιµηθούν. Για το σκοπό αυτό θα χρησιµοποιηθεί ένας


παρατηρητής κατάστασης n − 1 τάξης. Ένα βοηθητικό σύστηµα που περιγράφει την
εκτίµηση z (t ) δίνεται από τη σχέση,

zr (t ) = a11 zr (t ) + a12 y (t ) + b1u (t ) + [o.α .] (8.14)

126
Ο όρος της ανάδρασης [o.a.] στην (8.14) προέρχεται από το σφάλµα εκτίµησης
xr (t ) − zr (t ) , το οποίο όµως δεν είναι µετρήσιµο. Ακόµη, επειδή θεωρείται ότι
zn (t ) = y (t ) , η µετρήσιµη ποσότητα y (t ) − Cz (t ) είναι µηδενική και εποµένως δεν
µπορεί να ανατροφοδοτηθεί, όπως συνέβαινε στην (8.9). Στη συνέχεια
κατασκευάζεται µια κατάλληλη ανάδραση για την εκτίµηση z (t ) .

Χωρίς όρο ανάδρασης στην (8.14), η εξίσωση του σφάλµατος εκτίµησης


είναι,

er (t ) = xr (t ) − zr (t ) = a11er (t )
όπου (8.15)
er (0) = xr (0) − zr (0)

Έχει αποδειχθεί (Luenberger 1966) ότι για ένα παρατηρήσιµο αρχικό σύστηµα
υπάρχουν γραµµικοί µετασχηµατισµοί του διανύσµατος κατάστασης της µορφής
z (t ) = Tx(t ) , έτσι ώστε ένας υπο-πίνακας του πίνακα κατάστασης να έχει τυχαίες
ιδιοτιµές. Η τεχνική του Luenberger χρησιµοποιεί διάφορες πραγµατώσεις του
µοντέλου κατάστασης. Σκοπός είναι ο προσδιορισµός κατάλληλων νόµων ελέγχου
ανάδρασης κατάστασης για το αρχικό σύστηµα, µε χρήση των εκτιµήσεων των
καταστάσεων, όπου αυτές δεν είναι διαθέσιµες. Μια µέθοδος επίλυσης του
προβλήµατος κατασκευής παρατηρητών µειωµένης τάξης συνίσταται στο να
χρησιµοποιείται και η τελευταία εξίσωση κατάστασης της (8.13) που περιέχει κάποια
πρόσθετη πληροφορία για το xr (t ) και έχει τη µορφή,

xn (t ) = y (t ) = a22 xn (t ) + a21 xr (t ) + b2u (t ) (8.16)

Κατόπιν ορίζεται µια βοηθητική έξοδος yr (t ) = a21 xr (t ) ,

yr (t ) = y (t ) − a22 y (t ) − b2u (t ) (8.17)

η οποία είναι πλήρως παρατηρήσιµη από τις u (t ) και y (t ) . Το µόνο πρόβληµα στον
υπολογισµό της yr (t ) είναι η ανάγκη χρησιµοποίησης διαφοριστή για τον
υπολογισµό της παραγώγου y (t ) . Η (8.17) προέκυψε από την επίλυση της (8.16) ως
προς yr (t ) = cr xr (t ) και λαµβάνοντας υπόψη ότι y (t ) = xn (t ) . Από τα παραπάνω
προκύπτει η περιγραφή του συστήµατος µειωµένης τάξης,

xr (t ) = a11 xr (t ) + a12 y (t ) + b1u (t )


(8.18)
yr (t ) = a21 xr (t ) = y (t ) − a22 y (t ) − b2u (t )

όπου µπορεί να εφαρµοστεί η τεχνική σχεδιασµού του παρατηρητή που


παρουσιάστηκε στην παράγραφο 8.1.3.

Ένας παρατηρητής κατάστασης του συστήµατος (8.14) που είναι ανάλογος µε


τον παρατηρητή κατάστασης (8.9) για το σύστηµα (8.1), είναι της µορφής,

127
zr (t ) = a11 zr (t ) + a12 y (t ) + b1u (t ) + K r [ yr (t ) − a21 zr (t ) ] (8.19)

όπου το K r είναι ένα σταθερό (n − 1) × 1 διάνυσµα κέρδους. Η εξίσωση του


σφάλµατος er (t ) προκύπτει αν αφαιρέσουµε κατά µέλη την (8.19) από την (8.18) ως
εξής:

er (t ) = (a11 − K r a21 )er (t )


(8.20)
er (0) = xr (0) − zr (0)

Όπως και στο Θεώρηµα 8.1, προκύπτει ότι, αν το ζεύγος ( a11 , a21 ) είναι
παρατηρήσιµο, τότε υπάρχει K r τέτοιο ώστε το er (t ) να τείνει ασυµπτωτικά
εκθετικά στο µηδέν. Η παρατηρησιµότητα του ζεύγους ( a11 , a21 ) προκύπτει από την
παρατηρησιµότητα του ζεύγους ( A, C ) . Ο παρατηρητής κατάστασης (8.18) µπορεί
να υλοποιηθεί είτε µε τη χρήση διαφοριστή, είτε χωρίς διαφοριστή. Στη δεύτερη
περίπτωση, η είσοδος στον ολοκληρωτή είναι η,

θ (t ) = zr (t ) − K r y (t ) (8.21)

αντί του zr (t ) που υπάρχει στην υλοποίηση µε διαφοριστή. Εποµένως για να πάρουµε
την εκτίµηση zr πρέπει να προστεθεί η ποσότητα K r y (t ) στην έξοδο του
ολοκληρωτή. Οι εξισώσεις κατάστασης για την υλοποίηση χωρίς διαφοριστή είναι,

zr (t ) = θ (t ) + K r y (t )
zn (t ) = xn (t ) = y (t )
και (8.22)
θ (t ) = (a11 − K r a21 )θ (t ) + (a12 − K r a22 + a11 K r − a21 K r ) y (t )
+ (b1 − K r b2 )u (t ) + K r [ yr (t ) − a21 zr (t ) ]

όπου,

θ (t ) = zr (t ) − K r y (t ) (8.23)

(β) Γραµµικά συστήµατα πολλών εξόδων

Έστω το σύστηµα πολλών εξόδων της µορφής,

x(t ) = Ax(t ) + Bu (t )
(8.24)
y (t ) = Cx(t )

όπου x (t ) ∈ R n , u (t ) ∈ R m και y (t ) ∈ R ρ είναι αντίστοιχα τα διανύσµατα


κατάστασης, ελέγχου και εξόδου, ενώ, A ∈ R n× n , B ∈ R n× m και C ∈ R ρ × n είναι οι

128
πίνακες κατάστασης, ελέγχου και εξόδου. Έστω επίσης ότι απαιτείται ένας νόµος
ανάδρασης κατάστασης της µορφής:

u (t ) = Kx(t ) (8.25)

για να επιτευχθεί µια επιθυµητή συµπεριφορά του κλειστού συστήµατος που θα


προκύψει. Έχει αποδειχθεί ότι αν το σύστηµα (8.24) είναι παρατηρήσιµο, µπορεί να
κατασκευαστεί ένας παρατηρητής κατάστασης n − 1 τάξης µε κατάσταση z (t )
τέτοιος ώστε να προσεγγίζει ένα γραµµικό συνδυασµό των καταστάσεων x(t ) του
συστήµατος που δίνεται από το διάνυσµα Lx(t ) , L ∈ R ( n − ρ )× n . Ο παρατηρητής
αυτός έχει τη µορφή,

z (t ) = Dz (t ) + Gy (t ) + Ru (t ) (8.26)

όπου D , G και R είναι σταθεροί πίνακες κατάλληλων διαστάσεων. Το διάγραµµα


βαθµίδων του παρατηρητή κατάστασης µειωµένης τάξης δίνεται στο Σχήµα 8.2.

Σχήµα 8.2. Παρατηρητής κατάστασης µειωµένης τάξης.

Επειδή το διάνυσµα κατάστασης του παρατηρητή z (t ) θα πρέπει να προσεγγίζει το


Lx(t ) σχηµατίζουµε τη διαφορά,

z (t ) − Lx(t ) = Dz (t ) + Gy (t ) + Ru (t ) − L[ Ax(t ) + Bu (t )] (8.27)

Έστω ότι υπάρχει ένας πίνακας L που να ικανοποιεί την εξίσωση

LA − CL = GC (8.28)

Η (8.28) µπορεί να γραφεί ως ένα γραµµικό σύστηµα n(n − ρ ) εξισώσεων µε


n(n − ρ ) αγνώστους, που είναι τα στοιχεία του πίνακα L και υπάρχουν αρκετές
µέθοδοι για την επίλυσή της. Αν επιπλέον επιλέξουµε τον πίνακα R στην (8.26) από
τη σχέση,

R = LB (8.29)

129
τότε η (8.27) παίρνει τη µορφή:

z (t ) − Lx(t ) = Dz (t ) + Gy (t ) − LAx(t )
(8.30)
= Dz (t ) + GCx(t ) − LAx(t )

Αν αντικαταστήσουµε το LA από την (8.28) στην (8.30), έχουµε,

z (t ) − Lx(t ) = D[ z (t ) − Lx(t )] (8.31)

Η λύση της παραπάνω εξίσωσης είναι,

z (t ) = Lx(t ) + e Dt [ z (0) − Lx(0)] (8.32)

Τέλος, αν z (0) = Lx(0) , τότε z (t ) = Lx(t ) για όλα τα t ≥ 0 .

Ο σχεδιασµός του παρατηρητή κατάστασης (8.26) εξαρτάται από τη λύση της


εξίσωσης (8.28) έτσι ώστε ο πίνακας L που θα προκύψει να είναι πλήρους τάξης για
να εξασφαλιστεί η ανακατασκευή των µεταβλητών κατάστασης. Αν ο πίνακας D
επιλεγεί έτσι ώστε οι ιδιοτιµές του να είναι διακεκριµένες και διαφορετικές από τις
ιδιοτιµές του A , τότε η (8.28) έχει µοναδική λύση ως προς L . Αν επιπρόσθετα οι
ιδιοτιµές του D επιλεγούν έτσι ώστε να έχουν αρνητικό πραγµατικό µέρος µε
απόλυτες τιµές µεγαλύτερες από τις απόλυτες τιµές των πραγµατικών µερών των
ιδιοτιµών του πίνακα A , τότε η κατάσταση του παρατηρητή θα συγκλίνει στην
κατάσταση του παρατηρούµενου συστήµατος αρκετά γρήγορα, έτσι ώστε να
προσεγγίζεται ικανοποιητικά η δυναµική κατάσταση του συστήµατος (Luenberger
1979).

(γ) Μη-γραµµικά συστήµατα

Ο κλασικός παρατηρητής Luenberger εξετάζει τα γραµµικά συστήµατα. Η


επέκταση του σχεδιασµού παρατηρητών κατάστασης για µη-γραµµικά ή/και χρονικά
µεταβαλλόµενα συστήµατα βασίζεται σε αναλυτικές τεχνικές σχεδιασµού. Η βασική
µέθοδος συνίσταται στην εύρεση κέρδους παρατηρητή τέτοιου ώστε ο δυναµικός
πίνακας του γενικού γραµµικοποιηµένου σφάλµατος (που αποτελείται από το
διάνυσµα κέρδους, τις ιακωβιανές της δυναµικής κατάστασης και το διάνυσµα
εξόδου) να έχει ιδιοτιµές µέσα σε ένα κλειστό υποσύνολο του χώρου κατάστασης.
Μπορεί να αποδειχτεί η σύγκλιση καθώς και η εξασφάλιση της ευστάθειας για τις
τροχιές των καταστάσεων που βρίσκονται µέσα σ’ αυτό το υποσύνολο και κάτω από
τις συγκεκριµένες συνθήκες. Αυτός ο αναλυτικός εκτεταµένος παρατηρητής
Luenberger έχει εφαρµοστεί επιτυχώς σε πρακτικά µη-γραµµικά µοντέλα
συστηµάτων.

Πρόσφατα προτάθηκε ένας προσαρµοστικός εκτεταµένος παρατηρητής


Luenberger που χρησιµοποιεί το µέσο τετραγωνικό σφάλµα, όπου τα κέρδη του
παρατηρητή συνεχώς αλλάζουν κατά τη διάρκεια της εκτίµησης κατάστασης. Το
µέσο τετραγωνικό σφάλµα µπορεί να εξαγάγει όλες τις πληροφορίες στα στοιχεία υπό
τον όρο ότι το δυναµικό σύστηµα είναι γραµµικό και ο θόρυβος είναι Γκαουσιανός.
Ωστόσο, όταν το σύστηµα γίνεται µη-γραµµικό και η κατανοµή του θορύβου δεν

130
είναι Γκαουσιανή, το µέσο τετραγωνικό σφάλµα δεν είναι δυνατόν να λάβει όλες τις
πληροφορίες στις ακολουθίες σφάλµατος. Προκειµένου να επεκταθεί ο παρατηρητής
Luenberger σε µη-γραµµικά δυναµικά συστήµατα µε τον µη-Γκαουσσιανό θόρυβο,
απαιτείται ένα εναλλακτικό κριτήριο βελτιστοποίησης.

(δ) Εκτεταµένος παρατηρητής Luenberger

Ο παρατηρητής αυτός αναφέρεται σε συστήµατα διακριτού χρόνου. Έστω ένα


γραµµικό χρονικά αµετάβλητο δυναµικό σύστηµα που περιγράφεται από τις
εξισώσεις,

xk +1 = Axk + Buk
(8.33)
yk = Cxk + Duk

όπου xk ∈ R n , u k ∈ R m και y k ∈ R ρ είναι αντίστοιχα τα διανύσµατα κατάστασης,


ελέγχου και εξόδου.

Ο παρατηρητής Luenberger διακριτού χρόνου δίνεται από τις ακόλουθες σχέσεις:

zk +1 = Azk + Buk + L( yk − yˆ k )
(8.34)
yˆ k = Czk + Duk

Εάν το διάνυσµα κέρδους του παρατηρητή L καθοριστεί να παίρνει µια τιµή έτσι
ώστε η δυναµική του σφάλµατος εκτίµησης να δίνεται από τη σχέση,

ek +1 = xk +1 − zk +1 = ( A − LC )ek (8.35)

και επιπλέον έχει ευσταθείς ιδιοτιµές, τότε η ολική ασυµπτωτική ευστάθεια του
παρατηρητή είναι εγγυηµένη.

Ο παρατηρητής Luenberger επεκτείνεται εύκολα και σε µη-γραµµικά


συστήµατα. Έστω το µη-γραµµικό δυναµικό σύστηµα διακριτού χρόνου που δίνεται
από τις σχέσεις:

xk +1 = f ( xk ,uk , k )
(8.36)
yk = g ( xk ,uk , k )

Ο εκτεταµένος παρατηρητής Luenberger καθορίζεται από τις σχέσεις:

zk +1 = f ( zk ,uk , k ) + L( yk − yˆ k )
(8.37)
yˆ k = g ( zk ,uk , k )

Ο εκτεταµένος παρατηρητής Luenberger (8.37) αν και προορίζεται για µη-γραµµικά


δυναµικά συστήµατα, µπορεί επίσης να εφαρµοστεί και σε στοχαστικά συστήµατα.
Το ζήτηµα της στοχαστικής εκτίµησης κατάστασης προκύπτει όταν ο θόρυβος και η

131
διαταραχή που επηρεάζει τις εξισώσεις µετάβασης και τις µετρήσεις είναι ιδιαίτεροι
και δεν µπορούν να αντιµετωπιστούν ικανοποιητικά µε το φιλτράρισµα.

Έστω ένα µη-γραµµικό, χρονικά µεταβαλλόµενο, πιθανολογικό δυναµικό


σύστηµα διακριτού χρόνου που περιγράφεται από τις εξισώσεις,

xk +1 = f ( xk ,uk , k ) + vk
(8.38)
yk = g ( xk ,uk , k ) + wk

όπου τα vk , wk είναι λευκός θόρυβος µε µηδενική µέση τιµή για τη µετάβαση


κατάστασης και τη µέτρηση, αντίστοιχα. Ο περιορισµός στη µηδενική µέση τιµή του
θορύβου δεν αποτελεί απώλεια της γενικότητας. Μπορούµε πάντα να προσθέσουµε
µια παραπάνω διάσταση για να δηλώσουµε στην εξίσωση µετάβασης και µέτρησης
να περιγράψουν ένα θόρυβο µε διαφορετική µέση τιµή. Ένας ανάλογος εκτεταµένος
παρατηρητής Luenberger ορίζεται από τις εξισώσεις (8.37).

Για τον παρατηρητή Luenberger (8.34), υπάρχει µια αναλυτική µέθοδος ώστε
να επιλεγεί το κέρδος L έτσι ώστε ο παρατηρητής να συµπεριφερθεί σύµφωνα µε τις
απαιτήσεις του σχεδιασµού ελέγχου. Αλλά µια τέτοια µέθοδος δεν είναι ακόµα
διαθέσιµη για τον εκτεταµένο παρατηρητή Luenberger (8.37). Αντί να
προκαθορίζεται το κέρδος παρατηρητή, εφαρµόζουµε τις θεωρητικές τεχνικές
εκµάθησης πληροφοριών για να ενηµερωθεί το κέρδος παρατηρητή κατά τη διάρκεια
της πορείας εκτίµησης κατάστασης έτσι ώστε η εντροπία του σφάλµατος µεταξύ της
µέτρησης και της εκτιµώµενης εξόδου να ελαχιστοποιείται σε κάθε βήµα (Kailath
1980, O’Reilly 1983).

8.2 Μεθοδολογία σχεδιασµού παρατηρητών για αβέβαια γραµµικά συστήµατα

Όπως έχει ήδη αναφερθεί, σε ότι αφορά τα γραµµικά αβέβαια συστήµατα, η


µέχρι τώρα έρευνα εστιάζεται στο σχεδιασµό παρατηρητών πλήρους κατάστασης έτσι
ώστε να διασφαλίζεται η ευστάθεια του κλειστού συστήµατος για κάθε επιτρεπτή
αβεβαιότητα µιας δεδοµένης κλάσης. Στη συνέχεια θα αναφερθούµε σε µια µέθοδο
που θεωρεί τόσο προδιαγραφές εύρωστης ευστάθειας, όσο και εύρωστων επιδόσεων.

8.2.1 Περιγραφή του συστήµατος και γενικές έννοιες

Έστω το αβέβαιο γραµµικό σύστηµα µε περιγραφή κατάστασης,

x(t ) = ( A + ∆A) x(t ) + ( B + ∆B)u (t )

y (t ) = (C + ∆C ) x(t ) (8.39)

x(0) = x0 , t ∈ [0, ∞)

όπου x (t ) ∈ R n , u (t ) ∈ R m και y (t ) ∈ R ρ είναι αντίστοιχα τα διανύσµατα


κατάστασης, ελέγχου και εξόδου, ενώ, A ∈ R n× n , B ∈ R n× m και C ∈ R ρ × n είναι οι

132
πίνακες κατάστασης, ελέγχου και εξόδου. Οι αβεβαιότητες του µοντέλου
περιγράφονται ως παραµετρικές µεταβολές της µορφής,

kr kp kq

∆A = ∑ Ai ri , ∆B = ∑ Bi pi , ∆C = ∑ Ci qi (8.40)
i =1 i =1 i =1

όπου Ai ∈ R n× n , i = 1, 2,..., kr , Bi ∈ R n× m , i = 1, 2,..., k p και C i ∈ R ρ × n , i = 1, 2,..., kq


είναι σταθεροί πίνακες που προσδιορίζουν τη δοµή της αβεβαιότητας και ri , pi , qi
είναι βαθµωτές αβέβαιες παράµετροι που ανήκουν σε γνωστά συµπαγή σύνολα,

ℜ = {r ∈ R k : ri ≤ r , i = 1, 2,..., k r }; r > 0
r

P ={p∈R
kp
: pi ≤ p , i = 1, 2,..., k p }; p > 0 (8.41)
kq
Q = {q ∈ R : qi ≤ q , i = 1, 2,..., k q }; q > 0

Μια ισοδύναµη κανονικοποιηµένη περιγραφή µε r = p = q = 1 µπορεί πάντα να


χρησιµοποιηθεί, χωρίς να µειώνεται η γενικότητα του προβλήµατος. Η περιγραφή
(8.40), (8.41) συνεπάγεται ότι οι πίνακες Ai , Bi , Ci είναι µοναδιαίας τάξης και άρα
µπορούν να γραφούν µε τη µορφή γινοµένων διανυσµάτων,

T
Ai = di ei , i = 1, 2,..., kr

T
Bi = fi gi , i = 1, 2,..., k p (8.42)

T
Ci = hi wi , i = 1, 2,..., kq

όπου di , ei , wi , f i ∈ R n , g i ∈ R m και hi ∈ R ρ . Σηµειώνεται ότι ο διαχωρισµός (8.42)


δεν είναι µοναδικός. Με τη βοήθεια των διανυσµάτων της (8.42), ορίζονται οι
παρακάτω συµµετρικοί και θετικά ορισµένοι πίνακες:

kr kr
Dˆ := ∑ di di , Eˆ := ∑ ei ei
T T

i =1 i =1

kp kp

Fˆ := ∑ f i f i , Gˆ := ∑ gi gi
T T
(8.43)
i =1 i =1

kq kq

Hˆ := ∑ hi hi , Wˆ := ∑ wi wi
T T

i =1 i =1

Έστω η τετραγωνική συνάρτηση κόστους,



J ( x0 , u (.), ∆A, ∆B, ∆C ) = ∫ [ xT (t )Qx(t ) + u T (t ) Ru (t )]dt (8.44)
0

133
που συνδέεται µε το σύστηµα (8.39) και που πρέπει να ελαχιστοποιηθεί για
κατάλληλες τιµές των µεταβλητών ελέγχου υπό τις εξής προϋποθέσεις: (i) Q > 0 ,
(ii) R > 0 , (iii) ( A, B) ελέγξιµο και (iv) ( A, Q1/ 2 ) παρατηρήσιµο.

Λόγω της παρουσίας των αβεβαιοτήτων, το παραπάνω πρόβληµα


βελτιστοποίησης θα θεωρηθεί στο πλαίσιο του ελέγχου εγγυηµένου κόστους (βλ. Κεφ.
3). Ο ακόλουθος ορισµός επεκτείνει την έννοια του εύρωστου ελέγχου εγγυηµένου
κόστους για την κλάση συστηµάτων της µορφής (8.39).

Ορισµός 8.2
Έστω ότι για το αβέβαιο σύστηµα (8.39)-(8.41) µε τετραγωνική συνάρτηση κόστους
(8.44), το πλήρες διάνυσµα κατάστασης είναι µετρήσιµο. Ένας νόµος ελέγχου της
µορφής u (t ) : R n → R m , t ∈ [0, ∞) λέγεται έλεγχος εγγυηµένου κόστους, αν υπάρχει
ένας θετικός αριθµός J , που λέγεται εγγυηµένο κόστος, έτσι ώστε
J ( x0 , u (.), ∆A, ∆B, ∆C ) ≤ J , για όλες τις επιτρεπτές αβεβαιότητες.

Το παρακάτω θεώρηµα δίνει µια ικανή συνθήκη για τον έλεγχο εγγυηµένου κόστους.

Θεώρηµα 8.3
Έστω το αβέβαιο σύστηµα (8.39) µε τετραγωνική συνάρτηση κόστους (8.44). Ο
νόµος ελέγχου ανάδρασης κατάστασης

u (t ) = − R −1 BT Px(t ) (8.45)

είναι ένας νόµος ελέγχου εγγυηµένου κόστους και

T
J = x0 Px0 (8.46)

είναι το εγγυηµένο κόστος, αν υπάρχει ένας συµµετρικός και θετικά ορισµένος


πίνακας P που ικανοποιεί τη γενικευµένη εξίσωση Riccati,

ˆ −1 BT − Fˆ − Dˆ ) P + Q + Eˆ = 0 .
PA + AT P − P( BR −1 BT − BR −1GR (8.47)

Το ονοµαστικό σύστηµα κλειστού βρόχου που προκύπτει είναι ασυµπτωτικά


ευσταθές ενώ το αβέβαιο κλειστό σύστηµα είναι τετραγωνικά ευσταθές, για κάθε
επιτρεπτή αβεβαιότητα.

Απόδειξη: Η απόδειξη προκύπτει επεκτείνοντας τα αποτελέσµατα του Κεφ. 3 στην


κλάση συστηµάτων (8.39)-(8.41).

8.2.2 Έλεγχος εγγυηµένου κόστους µε παρατηρητή

Έστω ότι για το αβέβαιο σύστηµα (8.39)-(8.41) µε τετραγωνική


συνάρτηση κόστους (8.44), το πλήρες διάνυσµα κατάστασης δεν είναι µετρήσιµο και
κατά συνέπεια δεν µπορεί να χρησιµοποιηθεί για ανάδραση. Θα κατασκευάσουµε ένα
παρατηρητή πλήρους κατάστασης έτσι ώστε ο νόµος ελέγχου εγγυηµένου κόστους να
έχει τη µορφή,

134
u (t ) = K c z (t ) (8.48)

όπου z (t ) ∈ R n είναι το εκτιµώµενο διάνυσµα κατάστασης. Όπως ήδη αναφέρθηκε, η


δυναµική συµπεριφορά του παρατηρητή περιγράφεται από τη σχέση,

z (t ) = Az (t ) + Bu (t ) − K o [Cz (t ) − y (t )] (8.49)

όπου K 0 είναι το κέρδος του παρατηρητή. Για σφάλµα παρατήρησης,

e(t ) := x(t ) − z (t ) (8.50)

µετά από απλές αλγεβρικές πράξεις, λαµβάνεται η δυναµική συµπεριφορά του


σφάλµατος,

e(t ) = x(t ) − z (t ) = ( A − K oC − ∆BK c )e(t ) + (∆A − K o ∆C + ∆BK c ) x(t ) (8.51)

Χρησιµοποιώντας το νόµο ελέγχου (8.48), η περιγραφή του αβέβαιου συστήµατος


γίνεται,

x(t ) = [( A + ∆A) + ( B + ∆B) K c ]x(t ) − ( B + ∆B) K c e(t ) (8.52)

από την οποία προκύπτει η σχέση,

⎡ x(t ) ⎤ ⎡ A + ∆A + ( B + ∆B ) K c −( B + ∆B) K c ⎤ ⎡ x(t ) ⎤


⎢ e(t ) ⎥ = ⎢ ∆A − K ∆C + ∆BK A − K oC − ∆BK c ⎥⎦ ⎢⎣ e(t ) ⎥⎦
(8.53)
⎣ ⎦ ⎣ o c

Τώρα διατυπώνεται το εξής πρόβληµα: για το αβέβαιο σύστηµα (8.39)-(8.41) µε


τετραγωνική συνάρτηση κόστους (8.44), να βρεθεί το κέρδος ελεγκτή εγγυηµένου
κόστους K c και το κέρδος παρατηρητή K o έτσι ώστε (ι) το αντίστοιχο εγγυηµένο
κόστος να έχει κατά το δυνατόν τη µικρότερη τιµή και (ιι) να ελαχιστοποιείται το
σφάλµα παρατήρησης.

8.2.3 ∆ιαδικασία σχεδιασµού

Θεωρούµε τη ακόλουθη συνάρτηση Lyapunov,

⎡P 0 ⎤ ⎡ x(t ) ⎤
V ( x, e, t ) = ⎡⎣ xT (t ) eT (t ) ⎤⎦ ⎢ c (8.54)
⎣0 Po ⎦⎥ ⎢⎣ e(t ) ⎥⎦

όπου Pc , Po είναι (n × n) θετικά ορισµένοι πίνακες. Χρησιµοποιώντας την (8.53) η


παράγωγος της συνάρτησης Lyapunov λαµβάνει τη µορφή,

135
⎡ P [ A + ∆A + ( B + ∆B ) K c ] − Pc ( B + ∆B) K c ⎤ ⎡ x(t ) ⎤
V ( x, e) = 2 ⎣⎡ xT (t ) eT (t ) ⎦⎤ ⎢ c ⎥⎢ ⎥
⎣ Po [∆A − K o ∆C + ∆BK c ] Po [ A − K o C − ∆BK c ]⎦ ⎣ e(t ) ⎦
(8.55)

Η (8.54) µπορεί να γραφεί επίσης µε τη µορφή,

V ( x, e, t ) = Vc ( x, t ) + Vo (e, t ) (8.56)
όπου
Vc ( x, t ) = xT (t ) Pc x(t ) (8.57)
και
Vo (e, t ) = eT (t ) Po e(t ) (8.58)

Όπως είναι γνωστό, µια ικανή συνθήκη για τον έλεγχο εγγυηµένου κόστους είναι,

Vc ( x, t ) ≤ − xT (t )Qx(t ) − u T (t ) Ru (t ) (8.59)

Επιπλέον, η συνθήκη,

Vo (e, t ) ≤ −eT (t )Qo e(t ) (8.60)

για Qo > 0 , συνεπάγεται την ελαχιστοποίηση του σφάλµατος παρατήρησης. Συνεπώς,


µια ικανή συνθήκη για τον έλεγχο εγγυηµένου κόστους που βασίζεται σε εκτιµώµενες
τιµές των καταστάσεων µε ταυτόχρονη ελαχιστοποίηση του σφάλµατος παρατήρησης
είναι η εξής:

T
V ( x, e) = Vc ( x, e) + Vo ( x, e) ≤ − xT Qx − ( xT − eT ) K c RK c ( x − e) − eT Qo e (8.61)

η οποία µπορεί να γραφεί και µε τη µορφή,

⎡Q + K cT RK c − K c RK c ⎤ ⎡ x ⎤
T

V ( x, e) ≤ − ⎡⎣ x T
e ⎤⎦ ⎢
T
⎥⎢ ⎥ (8.62)
Qo + K c RK c ⎥⎦ ⎣ e ⎦
T T
⎢⎣ − K c RK c

ή ακόµη, χρησιµοποιώντας την (8.55),

⎡ 2 P [ A + ∆A + ( B + ∆ B ) K c ] −2 Pc ( B + ∆B) K c ⎤ ⎡ x ⎤
⎡⎣ xT eT ⎤⎦ ⎢ c ⎥⎢ ⎥+
⎣ 2 Po (∆A − K o ∆C + ∆BK c ) 2 Po [ A − K o C − ∆BK c ]⎦ ⎣ e ⎦
(8.63)
⎡Q + K cT RK c − K c RK c ⎤ ⎡ x ⎤
T

⎣⎡ x e ⎦⎤ ⎢ ⎥⎢ ⎥ ≤0
T T

Qo + K c RK c ⎥⎦ ⎣ e ⎦
T T
⎢⎣ − K c RK c

Είναι γνωστό ότι η ταυτότητα 2 α T β ≤ α T α + β T β ισχύει για κάθε α , β ∈ R n . Με


βάση αυτήν, είναι εύκολο να αποδειχθούν οι παρακάτω ανισότητες:

ˆ x + xT Ex
2 xT Pc ∆Ax ≤ xT Pc DP ˆ (8.64)
c

136
2 xT Pc ∆BK c x ≤ xT Pc FP ˆ x
ˆ x + xT K T GK (8.65)
c c c

−2eT Po ∆BK c e ≤ eT Po FP ˆ e
ˆ e + eT K T GK (8.66)
o c c

ˆ
−2eT Po K o ∆Cx ≤ eT Po K o HK
T T ˆ
o Po e + x Wx (8.67)

∀x, e ∈ R n . Ορίζοντας τα κέρδη ελεγκτή και παρατηρητή

K c := − R −1 BT Pc (8.68)
και
K o := γ Po −1C T (8.69)

αντίστοιχα, όπου γ είναι µια θετική σταθερά που πρέπει να προσδιοριστεί κατά τη
διάρκεια του σχεδιασµού, προκύπτει από την (8.68) ότι,

−2 xT Pc BK c e ≤ xT Pc BK c x + eT Pc BK c e (8.70)

∀x, e ∈ R n . Χρησιµοποιώντας τις παραπάνω ανισότητες, προκύπτει ότι η (8.63)


ικανοποιείται, αν,

⎡V 0 ⎤ ⎡ x(t ) ⎤
⎡⎣ xT (t ) eT (t ) ⎦⎤ ⎢ 1 ⎥⎢ ⎥<0 (8.71)
⎣ 0 V2 ⎦ ⎣ e(t ) ⎦
όπου

T ˆ + 2 P FP
V1 = Pc A + AT Pc + 2 Pc BK c + K c RK c + Pc DP ˆ + Q + 2 Eˆ + Wˆ (8.72)
ˆ + 2 K T GK
c c c c c

και

ˆ + 2 P FP
V2 = Po A + AT Po − 2 Po K oC + Po DP ˆ + P K HK
ˆ T T
o o o o o o Po + Qo + K c RK c +
T ˆ
2 K GKc c
(8.73)
Αντικαθιστώντας τα κέρδη K c και K o από τις (8.68) και (8.69), αντίστοιχα, η (8.71)
ικανοποιείται εάν οι ακόλουθες γενικευµένες ανισότητες Riccati,

ˆ + 2 P FP
Pc A + AT Pc − Pc BR −1 BT Pc + Pc DP ˆ −1 BT P + Q + 2 Eˆ + Wˆ < 0
ˆ + 2 P BR −1GR
c c c c c

(8.74)
και

ˆ + 2 P FP
Po A + AT Po − 2γ C T C + Po DP ˆ + γ 2C T HC
ˆ + Q + P BR −1 BT P +
o o o o c c
(8.75)
−1 ˆ −1 T
2 P BR GR B P < 0
c c

ισχύουν, µε την έννοια της τετραγωνικής µορφής.

137
Θεωρώντας τυχαίες αρχικές συνθήκες µε µηδενική µέση τιµή και µοναδιαία
συσχέτιση και θεωρώντας επίσης την προσδοκία της τετραγωνικής συνάρτησης
κόστους, το εγγυηµένο κόστος ισούται µε το ίχνος του πίνακα Pc (βλ. Κεφ. 3).
Προκειµένου να µειωθεί ο συντηρητισµός που χαρακτηρίζει συνήθως τις µεθόδους
ελέγχου εγγυηµένου κόστους, είναι επιθυµητό να ελαχιστοποιηθεί το εγγυηµένο
κόστος. Από την άλλη µεριά, το ίχνος του πίνακα Po παρέχει ένα µέτρο του κέρδους
παρατηρητή το οποίο θα πρέπει να γίνεται αρκετά µεγάλο, προκειµένου να καλύψει
όλη την περιοχή επιτρεπτών αβεβαιοτήτων. Έτσι, οι προδιαγραφές ελέγχου
ικανοποιούνται λύνοντας δύο χωριστά προβλήµατα, το πρόβληµα ελέγχου
εγγυηµένου κόστους και το πρόβληµα σχεδιασµού εύρωστου παρατηρητή.

Η παρακάτω µέθοδος σχεδιασµού βασίζεται στην κυρτή βελτιστοποίηση µε


LMIs. Ειδικότερα, το γεγονός ότι ο διαχωρισµός (8.42) είναι µη-µοναδικός
αξιοποιείται ώστε να δίνονται πολλαπλοί βαθµοί ελευθερίας για την εξεύρεση της
λύσης. Συγκεκριµένα, στην (8.42) εισάγονται βαθµωτές ποσότητες έτσι ώστε,

d i ei = σ i d i (1/ σ i )ei ,
T T
i = 1, 2,..., kr

fi g i = τ i fi (1/ τ i ) gi ,
T T
i = 1, 2,..., k p
(8.76)
hi wi = ϕi hi (1/ ϕi ) wi ,
T T
i = 1, 2,..., kq

όπου σ i , τ i , ϕi είναι θετικοί αριθµοί που µπορούν να χρησιµοποιηθούν σαν


µεταβλητές βελτιστοποίησης. Στη συνέχεια, ορίζονται οι πίνακες,

D := [d1 ,..., d kr ] , E := [e1 ,..., ekr ] , S := diag (σ 1 ,..., σ kr )

F := [ f1 ,..., f k p ] , G := [ g1 ,..., g k p ] , T := diag (τ 1 ,...,τ k p )


(8.77)
H := [h1 ,..., hkq ] , W := [ w1 ,..., wkq ] , Φ := diag (ϕ1 ,..., ϕ kq )

Το παρακάτω θεώρηµα δίνει µια αριθµητική λύση στο πρόβληµα του ελέγχου
εγγυηµένου κόστους µε βάση τις εκτιµώµενες τιµές των καταστάσεων.

Θεώρηµα 8.4
Έστω το αβέβαιο σύστηµα (8.39) µε τετραγωνική συνάρτηση κόστους (8.44). Αν το
ακόλουθο πρόβληµα βελτιστοποίησης:

min Tr ( M c ) (8.78)
M c , Pc , S ,T , Φ

µε περιορισµούς LMI

⎡M c I⎤
⎢ I >0 (8.79)
⎣ Pc ⎥⎦
και

138
⎡ − Pc AT − APc + BR −1 BT − DSDT − 2 FTF T Pc E BR −1G PW
c Pc ⎤
⎢ ⎥
⎢ 1
E T Pc S 0 0 0⎥
⎢ 2 ⎥
⎢ 1 ⎥>0
⎢ G T R −1 B T 0 T 0 0⎥
⎢ 2 ⎥
⎢ W T Pc 0 0 Φ 0⎥
⎢ ⎥
⎣⎢ Pc 0 0 0 Q ⎦⎥
(8.80)

όπου

Pc = Pc −1 (8.81)
και

Q = Q −1 (8.82)

έχει ένα µη-κενό σύνολο εφικτών λύσεων ( M c , Pc , S , T , Φ ) , µε M c και Pc θετικά


ορισµένους συµµετρικούς πίνακες και S , T , Φ διαγώνιους θετικά ορισµένους
πίνακες, τότε ο νόµος ελέγχου,

u (t ) = − R −1 BT Pc z (t ) (8.83)

είναι ένας νόµος ελέγχου εγγυηµένου κόστους. Το αντίστοιχο εγγυηµένο κόστος


Tr ( Pc ) είναι ελάχιστο.

Απόδειξη: Εφαρµόζοντας το συµπλήρωµα του Schur στην (8.80) και


πολλαπλασιάζοντας επί Pc από αριστερά και δεξιά τους όρους και των δύο µελών της
ανισότητας που προκύπτει, παίρνουµε,

Pc A + AT Pc − Pc BR −1 BT Pc + Pc DSDT Pc + 2 Pc FTF T Pc +
(8.84)
2 Pc BR −1GT −1GT R −1 BT Pc + Q + 2 ES −1 E T + W Φ −1W T < 0

Χρησιµοποιώντας τις (8.76), (8.77), η (8.84) είναι ισοδύναµη µε την (8.74).


Εποµένως ικανοποιείται η συνθήκη εγγυηµένου κόστους και άρα ο (8.83) είναι ένας
νόµος ελέγχου εγγυηµένου κόστους. Ακόµη, εφαρµόζοντας το συµπλήρωµα του
Schur στην (8.79), προκύπτει M c > Pc . Άρα, η ελαχιστοποίηση του Tr ( M c )
συνεπάγεται ελαχιστοποίηση του Tr ( Pc ) . Τα ανωτέρω αποτελέσµατα είναι βέλτιστα
λόγω της κυρτότητας της αντικειµενικής συνάρτησης (8.78) και των περιορισµών
(8.79) και (8.80).

Μια αριθµητική λύση στο πρόβληµα σχεδιασµού εύρωστου παρατηρητή


λαµβάνεται µέσω του παρακάτω θεωρήµατος.

139
Θεώρηµα 8.5
Έστω το αβέβαιο σύστηµα (8.39) µε τετραγωνική συνάρτηση κόστους (8.44). Αν το
ακόλουθο πρόβληµα βελτιστοποίησης:

min Tr ( M o ) (8.85)
M o , Po

µε περιορισµούς LMI,

⎡M o I⎤
⎢ I >0 (8.86)
⎣ Po ⎥⎦
και

⎡ − Po AT − APo − DSDT − 2 FTF T Po ⎤


⎢ ⎥>0 (8.87)
⎣ Po QΛ ⎦
όπου

−1
Po = Po (8.88)

QΛ = (Qo + Λ ) −1 (8.89)

Λ = −2γ C T C + γ 2C T H ΦH T C + Pc BR −1 BT Pc + 2 Pc BR −1GT −1GT R −1 BT Pc (8.90)

έχει ένα µη-κενό σύνολο εφικτών λύσεων ( M o , Po ) για κάποιο θετικά ορισµένο
πίνακα βάρους Qo και για κάποια θετική σταθερά γ > 0 µε M o , Po θετικά
ορισµένους συµµετρικούς πίνακες, τότε ο γραµµικός παρατηρητής (8.49) µε κέρδος,

K o = γ Po −1C T (8.91)

παρέχει τις εκτιµώµενες καταστάσεις του κλειστού συστήµατος µε ένα ελάχιστο


σφάλµα παρατήρησης, για κάθε επιτρεπτή αβεβαιότητα και µε κέρδος παρατηρητή
κατά το δυνατόν µεγάλο.

Απόδειξη: Εφαρµόζοντας το συµπλήρωµα του Schur στην (8.87) και


πολλαπλασιάζοντας επί Po από αριστερά και δεξιά τους όρους και των δύο µελών της
ανισότητας που προκύπτει, παίρνουµε,

Po A + AT Po − 2γ C T C + Po DSDT Po + 2 Po FTF T Po + γ 2C T H ΦH T C +
(8.92)
+Qo + Pc BR −1 BT Pc + 2 Pc BR −1GT −1G T R −1 BT Pc < 0

Χρησιµοποιώντας τις (8.76), (8.77), η (8.92) είναι ισοδύναµη µε την (8.75). Άρα,
ικανοποιείται (8.60) και συνεπώς ο παρατηρητής που σχεδιάζεται µε κέρδος (8.91)
παρέχει την εκτίµηση των καταστάσεων του κλειστού συστήµατος µε ελάχιστο
σφάλµα παρατήρησης, για κάθε επιτρεπτή αβεβαιότητα. Ακόµη, η εφαρµογή του
συµπληρώµατος Schur στην (8.86) δίνει M o > Po . Άρα, η ελαχιστοποίηση του

140
Tr ( M o ) συνεπάγεται την ελαχιστοποίηση του Tr ( Po ) . Αυτό δίνει ένα κέρδος
παρατηρητή όσο το δυνατόν µεγαλύτερο. Τα ανωτέρω αποτελέσµατα είναι βέλτιστα
λόγω της κυρτότητας της αντικειµενικής συνάρτησης (8.85) και των περιορισµών
(8.86) και (8.87).

Με βάση τα Θεωρήµατα 8.4 και 8.5, ο σχεδιασµός εύρωστων ελεγκτών και


παρατηρητών για το αβέβαιο σύστηµα (8.39) µε τετραγωνική συνάρτηση κόστους
(8.44) γίνεται σε δύο στάδια σύµφωνα µε τα βήµατα του παρακάτω αλγορίθµου.

Αλγόριθµος 8.6
• Βήµα 1: Επιλύεται το πρόβληµα ελαχιστοποίησης αντικειµενικής συνάρτησης
(8.78) µε περιορισµούς LMI (8.79), (8.80). Αν υπάρχει µια εφικτή λύση, τότε
ένας νόµος ελέγχου εγγυηµένου κόστους της µορφής (8.83) µπορεί να
σχεδιαστεί µε βάση τις εκτιµώµενες καταστάσεις του συστήµατος. Ο
αντίστοιχος «βέλτιστος» διαχωρισµός των αβεβαιοτήτων προσδιορίζεται από
τους πίνακες S , T και Φ .

• Βήµα 2: Για καθορισµένες τιµές των S , T και Φ , επιλύεται το πρόβληµα


ελαχιστοποίησης αντικειµενικής συνάρτησης (8.85) µε περιορισµούς LMI
(8.86), (8.87) για κάποια επιλογή των Qo και γ . Αν υπάρχει µια εφικτή λύση,
τότε ο παρατηρητής µε κέρδος (8.91) παρέχει τις εκτιµώµενες τιµές των
καταστάσεων του κλειστού συστήµατος ελαχιστοποιώντας το σφάλµα
παρατήρησης.

8.2.4. Παραδείγµατα

(ι) Ανάστροφο εκκρεµές


Η κίνηση του ανάστροφου εκκρεµούς περιγράφεται από ένα σύστηµα δεύτερης
τάξης. Στο παράδειγµα αυτό θεωρούµε ότι ο πίνακας κατάστασης επηρεάζεται από
µια αβέβαιη παράµετρο (Βροχίδου 2007). Οι πίνακες κατάστασης, ελέγχου και
εξόδου είναι, αντίστοιχα,

⎡ −1 −1⎤ ⎡ −1 0 ⎤ ⎡1⎤
A=⎢ ⎥ , ∆A = ⎢ ⎥ r , B = ⎢ ⎥ , C = [ 0 1] ,
⎣ 0 −2 ⎦ ⎣ 0 0⎦ ⎣1⎦

όπου r ≤ 1 . Οι πίνακες βάρους της τετραγωνικής συνάρτησης κόστους επιλέγονται


να είναι µοναδιαίοι πίνακες κατάλληλων διαστάσεων. Η εφαρµογή του Αλγορίθµου
8.6 δίνει τα ακόλουθα κέρδη ελεγκτή και παρατηρητή, K c = [ −2.1712 0.3390] ,
K o = [ 0.1726 7.4019] , αντίστοιχα, για Qo = I , γ = 1 , και S = 0.2697 . Το
T

εγγυηµένο κόστος είναι Tr ( Pc ) = 4.5838 . Οι χρονικές αποκρίσεις του κλειστού


συστήµατος δίνονται στα Σχήµατα 8.3 – 8.5.

141
Σχήµα 8.3 Μετρούµενη έξοδος

Σχήµα 8.4 Εκτιµώµενη έξοδος

142
Σχήµα 8.5 ∆υναµική σφάλµατος παρατήρησης

(ιι) Κινητήρας DC
Στο παράδειγµα αυτό θεωρούµε το µοντέλο δεύτερης τάξης ενός DC κινητήρα
(Kosmidou and Vrochidou 2007). Οι πίνακες κατάστασης, ελέγχου και εξόδου είναι,
αντίστοιχα,

⎡ −10 1⎤ ⎡0⎤
A=⎢ ⎥ , B = ⎢ ⎥ , C = [1 0]
⎣ −0.02 −2 ⎦ ⎣2⎦

και οι πίνακες αβεβαιοτήτων,

⎡ 0 ⎤
∆B = ⎢ ⎥ p , ∆C = [ 0.1 0] q
⎣0.01⎦

όπου p ≤ 1 , q ≤ 1 . Οι πίνακες βάρους της τετραγωνικής συνάρτησης κόστους


επιλέγονται να είναι µοναδιαίοι πίνακες κατάλληλων διαστάσεων. Η εφαρµογή του
Αλγορίθµου 8.6 δίνει τα ακόλουθα κέρδη ελεγκτή και παρατηρητή,
K c = [ −0.0072 −0.4297 ] , K o = [ 0.0048 1.1514] , αντίστοιχα, για Qo = I , γ = 1 ,
T

T = 0.2006 και Φ = 0.0435 . Το εγγυηµένο κόστος είναι Tr ( Pc ) = 0.2649 . Οι


χρονικές αποκρίσεις του κλειστού συστήµατος δίνονται στα Σχήµατα 8.6 – 8.8.

143
Σχήµα 8.6 Μετρούµενη έξοδος

Σχήµα 8.7 Εκτιµώµενη έξοδος

144
Σχήµα 8.8 ∆υναµική σφάλµατος παρατήρησης

Σηµειώνεται ότι και στα δύο παραδείγµατα το αβέβαιο σύστηµα


σταθεροποιείται γρήγορα ενώ το σφάλµα παρατήρησης τείνει στο µηδέν.

8.3 Συµπεράσµατα

Στο κεφάλαιο αυτό µελετήθηκε το πρόβληµα του σχεδιασµού εύρωστων


ελεγκτών για αβέβαια συστήµατα των οποίων οι καταστάσεις δεν είναι διαθέσιµες για
ανάδραση. Έτσι, ο έλεγχος βασίζεται σε εκτιµώµενες τιµές των καταστάσεων που
προκύπτουν από παρατηρητές κατάστασης. Τα κέρδη τόσο του ελεγκτή όσο και του
παρατηρητή προκύπτουν από την επίλυση δύο χωριστών προβληµάτων
βελτιστοποίησης µε περιορισµούς LMI. Επειδή οι αβεβαιότητες επηρεάζουν τις
δυναµικές τόσο του συστήµατος όσο και του σφάλµατος παρατήρησης, ο ελεγκτής
και ο παρατηρητής σχεδιάζονται έτσι ώστε να εξασφαλίζουν (ι) την ελαχιστοποίηση
του σφάλµατος παρατήρησης (ιι) την ευστάθεια του κλειστού συστήµατος και (ιιι)
την ελαχιστοποίηση του µέτρου επιδόσεων που εκφράζεται µε τη µορφή του
εγγυηµένου κόστους, για όλες τις αβεβαιότητες µιας δεδοµένης κλάσης.

145
Κεφάλαιο 9

Μέθοδοι H - infinity

Για συστήµατα µε µη δοµηµένες αβεβαιότητες που περιγράφονται στο πεδίο


της συχνότητας, οι µέθοδοι H–infinity ( H ∞ ) αποτελούν ένα ισχυρό σχεδιαστικό
εργαλείο εύρωστου ελέγχου (Vidyasagar 1985). Ειδικότερα, µια µέθοδος H ∞
αντιµετωπίζει το ζήτηµα του σχεδιασµού ενός ελεγκτή ο οποίος είναι ικανός να
ανταποκρίνεται µε τον καλύτερο τρόπο ακόµη και στη χειρότερη κατάσταση που θα
µπορούσε να βρεθεί ένα γραµµικό σύστηµα. Στο σύστηµα αυτό είναι δυνατόν να
επιδρούν εξωτερικές πρόσθετες διαταραχές, ενώ µπορεί να περιλαµβάνει και
αβεβαιότητες. Ο ελεγκτής, πέρα από το γεγονός ότι θα πρέπει να ανταποκρίνεται
«εύρωστα» στις όποιες διαταραχές και αβεβαιότητες του συστήµατος, θα πρέπει
επίσης να αντιµετωπίζει και το πρόβληµα της εξασθένησης των διαταραχών. Η
µέθοδος H ∞ ουσιαστικά είναι µια µέθοδος βελτιστοποίησης η οποία µετατρέπει τους
περιορισµούς και την ευστάθεια του κλειστού συστήµατος σε µαθηµατικές
εκφράσεις. Είναι γνωστή όχι µόνο για τις πολύπλοκες µαθηµατικές πράξεις και την
µαθηµατική έκφραση των τεχνικών περιορισµών, αλλά και για τη βελτιστοποίηση
των συστηµάτων και την ικανότητα που έχει να συνδυάζει, τόσο τον κλασσικό, όσο
και τον εύρωστο έλεγχο, σε ένα µόνο σχεδιασµό.

Προβλήµατα σχεδιασµού ελεγκτών όπου η H ∞ - νόρµα παίζει σηµαντικό


ρόλο, διατυπώθηκαν αρχικά από τον George Zames, στις αρχές της δεκαετίας του
‘80, στα πλαίσια της µείωσης της ευαισθησίας των γραµµικών συστηµάτων. Το
πρόβληµα του σχεδιασµού τέθηκε σαν ένα πρόβληµα µαθηµατικής βελτιστοποίησης
χρησιµοποιώντας τη νόρµα H ∞ . Έτσι, δουλεύοντας αρχικά στο πεδίο της
συχνότητας, οι βασικές τεχνικές που χρησιµοποιήθηκαν κατά τη διάρκεια των
πρώτων σταδίων της έρευνας πάνω σε τέτοιου είδους προβλήµατα, ήταν κυρίως η
φασµατική παραγοντοποίηση και παραµετροποίηση (Youla), τεχνικές οι οποίες
οδήγησαν αρχικά σε πολύπλοκους βέλτιστους ελεγκτές µε µεγάλη διάσταση πινάκων
ή σε «σχεδόν βέλτιστους» ελεγκτές µε τη βοήθεια της νόρµας H ∞ . Οι εργασίες που
ακολούθησαν, στα µέσα της δεκαετίας του ‘80, έδειξαν ότι ο µέγιστος McMillan
βαθµός αυτών των ελεγκτών είναι στην πραγµατικότητα της τάξεως του McMillan
βαθµού της συνάρτησης µεταφοράς ολόκληρου του συστήµατος. Επίσης, περαιτέρω
έρευνα έδειξε ότι η γενικευµένη εξίσωση Riccati που προκύπτει από γραµµικά

146
τετραγωνικά προβλήµατα για γραµµικά συστήµατα παίζει σηµαντικό ρόλο στην
περίπτωση που θέλουµε να µετατρέψουµε τον ελεγκτή στο πεδίο του χρόνου. Τα
αποτελέσµατα αυτά επιτάχυναν την έρευνα κυρίως στο πεδίο του χρόνου και
οδήγησαν σε πιο γενικές διατυπώσεις, συµπεριλαµβανοµένων και χρονικά
µεταβλητών συστηµάτων.

Αρκετές φορές, οι H ∞ - ελεγκτές δεν είναι βέλτιστοι, ενώ µπορεί να είναι και
σχετικά αργοί στη λειτουργία τους. Ο όρος «βέλτιστος» εδώ θα πρέπει να
χρησιµοποιείται µε την αυστηρά µαθηµατική έννοια, διότι ο ελεγκτής που προκύπτει
από τη µέθοδο αυτή, ελαχιστοποιεί την επίδραση των εισόδων στις εξόδους, πράγµα
το οποίο µπορεί να µην θεωρείται πάντα βέλτιστο για τους χειριστές των
συστηµάτων. Τέλος, ας σηµειωθεί ότι στο µαθηµατικό σύµβολο της θεωρίας αυτής το
γράµµα H προκύπτει από τον χώρο Hardy, ενώ το «infinity» αντιστοιχεί στο γεγονός
ότι ο ελεγκτής είναι σχεδιασµένος έτσι ώστε να ικανοποιεί τους minimax
περιορισµούς στο πεδίο της συχνότητας. Όπως αναφέρθηκε και στο Κεφάλαιο 1, η
πρωταρχική ιδιότητα της νόρµας H ∞ είναι ότι παριστά τη µέγιστη ενέργεια ενός
σήµατος εξόδου, ως απόκριση σ’ ένα οποιοδήποτε σήµα εισόδου µοναδιαίας
ενέργειας. Στην περίπτωση που έχουµε πολλαπλές εισόδους και πολλαπλές εξόδους
(ΜΙΜΟ), είναι ισοδύναµη µε τη µέγιστη ιδιόρρυθµη τιµή (singular value) της
συνάρτησης µεταφοράς του συστήµατος, ενώ στην περίπτωση µιας εισόδου – µιας
εξόδου (SISO), αντιστοιχεί στη µέγιστη τιµή του πλάτους της συνάρτησης µεταφοράς
(µέγιστο κέρδος µεταξύ εισόδου και εξόδου του κλειστού συστήµατος).

Η ανάπτυξη της όλης σηµαντικής θεωρίας H ∞ είναι πέρα από τους σκοπούς
του συγγράµµατος αυτού. Έτσι, σ’ αυτό το κεφάλαιο θα παρουσιαστεί µια
ανασκόπηση των κυριοτέρων αποτελεσµάτων και της εφαρµογής τους στο γραµµικό
τετραγωνικό πρόβληµα εύρωστου ελέγχου. Ειδικότερα, θα γίνει φανερό πώς η
εύρωστη σταθεροποίηση για µη δοµηµένες αβεβαιότητες στο πεδίο της συχνότητας
συνδέεται µε τη θεωρία H ∞ και στη συνέχεια θα παρουσιαστούν δύο τεχνικές
σχεδιασµού συστηµάτων που εξασφαλίζουν την εύρωστη ευστάθεια και τη βέλτιστη
συµπεριφορά του κλειστού συστήµατος.

9.1 Βασικές έννοιες

Μερικές από τις παρακάτω έννοιες έχουν ήδη παρουσιαστεί στο Κεφάλαιο 1.
Ωστόσο, επαναλαµβάνονται εδώ για λόγους πληρότητας.

9.1.1 Η νόρµα H-infinity

Η H ∞ - νόρµα ορίζεται ως εξής:

Ορισµός 9.1
Η H ∞ - νόρµα ενός ευσταθούς πίνακα H ( s ) είναι,

H ( s) ∞
= sup σ ( H ( jω )) (9.1)
ω

147
όπου σ ( M ) συµβολίζει τη µέγιστη ιδιόρρυθµη τιµή του µιγαδικού πίνακα M . Ας
σηµειωθεί ότι από τον ορισµό των ιδιόρρυθµων τιµών ενός µιγαδικού πίνακα είναι
γνωστό ότι σ ( M ) = M , όπου M συµβολίζει τη συνήθη Ευκλείδεια νόρµα του
µιγαδικού πίνακα M (ή φασµατική νόρµα).

9.1.2 Ελαχιστοποίηση της νόρµας H-infinity

Η ελαχιστοποίηση της νόρµας H ∞ µιας συνάρτησης µεταφοράς κλειστού


βρόχου έχει ιδιαίτερο ενδιαφέρον. Η διαδικασία θα πρέπει να παρουσιαστεί σύµφωνα
µε το παρακάτω σχήµα:

Σχήµα 9.1 Μοντέλο συστήµατος για παρουσίαση της µεθόδου H ∞

Το σύστηµα P έχει δύο εισόδους: την είσοδο ελέγχου u της οποίας οι µεταβλητές
µπορούν να καθοριστούν από το σχεδιαστή και την εξωτερική είσοδο w η οποία
περιλαµβάνει το σήµα αναφοράς και τις διαταραχές. Επίσης, υπάρχουν δύο έξοδοι: το
σήµα z που παριστά το σφάλµα και πρέπει να ελαχιστοποιηθεί, και η µετρήσιµη
µεταβλητή v που χρησιµοποιείται για τον έλεγχο του συστήµατος. Τόσο οι είσοδοι
όσο και οι έξοδοι γενικά είναι διανύσµατα ενώ οι P και K είναι πίνακες. Το σύστηµα
περιγράφεται από τις εξισώσεις,

⎡z⎤ ⎡ w⎤ ⎡ P11 ( s ) P12 ( s ) ⎤ ⎡ w⎤


⎢ v ⎥ = P( s) ⎢ u ⎥ = ⎢ P ( s) P ( s) ⎥ ⎢ u ⎥ (9.2)
⎣ ⎦ ⎣ ⎦ ⎣ 21 22 ⎦⎣ ⎦

u = K ( s )v (9.3)

Επίσης, είναι δυνατόν να εκφραστεί η εξάρτηση του z από το w ως εξής:

z = Fl ( P , K ) w (9.4)

όπου

Fl ( P , K ) = P11 + P12 K ( I − P22 K ) −1 P21 (9.5)

Σύµφωνα µε τα παραπάνω, ο σκοπός του ελέγχου H ∞ είναι να βρεθεί ένας ελεγκτής


Κ τέτοιος ώστε να ελαχιστοποιηθεί η H ∞ - νόρµα του Fl ( P, K ) . (Ας σηµειωθεί ότι ο

148
ίδιος ορισµός ισχύει και για τη µέθοδο ελέγχου H 2 ). Η H ∞ - νόρµα του πίνακα
µεταφοράς Fl ( P, K ) είναι,

Fl ( P, K ) ∞
= sup σ ( Fl ( P, K ) ( jω ) ) (9.6)
ω

Για τα συστήµατα κλειστού βρόχου, όπως το παραπάνω σύστηµα, η H ∞ -


νόρµα µπορεί να αξιοποιηθεί προκειµένου να επιτευχθούν διάφορες επιδόσεις, όπως
η απόρριψη διαταραχής ή η ελαχιστοποίηση του σφάλµατος εξόδου. Για παράδειγµα,
ένας αντισταθµιστής K ( s ) που επιλέγεται, έτσι ώστε να σταθεροποιεί το σύστηµα
και να ελαχιστοποιεί την S y (συνάρτηση ευαισθησίας που παριστά τη συνάρτηση

µεταφοράς µεταξύ της διαταραχής dy και της εξόδου y), επιτρέπει την
ελαχιστοποίηση της ενέργειας του σήµατος εξόδου, υπό την επίδραση διαταραχών
πεπερασµένης ενέργειας που ενεργούν στην έξοδο του συστήµατος. Ακόµη, η
µέγιστη ενέργεια µιας εξόδου z, υπό την επίδραση της χειρότερης διαταραχής w, θα
ελαχιστοποιείται, αν ο αντισταθµιστής K ( s ) υπολογιστεί έτσι ώστε να
ελαχιστοποιείται η H ∞ - νόρµα της µεταφοράς µεταξύ z και w που συµβολίζεται
Fzw . Το αντίστοιχο πρόβληµα βελτιστοποίησης διατυπώνεται ως εξής:

min Fzw ∞
(9.7)
K

Συνοψίζοντας, η ελαχιστοποίηση της H ∞ - νόρµας της συνάρτησης µεταφοράς του


κλειστού συστήµατος εξασφαλίζει ένα επίπεδο επιδόσεων στο ονοµαστικό σύστηµα.

9.1.3 Μέθοδοι υπολογισµού της νόρµας H ∞

Όπως ήδη αναφέρθηκε, µέχρι στιγµής δεν υπάρχει άµεση µέθοδος


υπολογισµού της νόρµας H ∞ . Μπορεί όµως να εξεταστεί κατά πόσον αυτή είναι
µικρότερη (ή µεγαλύτερη) από µια δεδοµένη τιµή. Για το σκοπό αυτό έχουν
αναπτυχθεί επαναληπτικοί αλγόριθµοι που δίνουν µια καλή προσέγγιση της
ποσότητας αυτής (Boyd et al. 1989, Doyle et al. 1989).

Επιστρέφοντας στο αρχικό παράδειγµα και σύµφωνα µε τη βέλτιστη θεωρία


του H ∞ ζητείται ένας ευσταθής ελεγκτής K(s), τέτοιος ώστε να ελαχιστοποιείται η
Fl ( P, K ) ∞
. Με άλλα λόγια, µπορούµε να ορίσουµε µια µέγιστη τιµή γ, για το
κέρδος του κλειστού συστήµατος και να θέσουµε το παρακάτω ερώτηµα:

Υπάρχει ευσταθής ελεγκτής K(s), ο οποίος να εγγυάται ότι:

Fl ( P, K ) ∞
<γ (9.8)

149
Το ζητούµενο, µε αυτό τον τρόπο, δεν είναι να ελαχιστοποιηθεί η νόρµα H ∞ , αλλά
να γίνει µικρότερη από µια τιµή γ. Αυτό είναι γνωστό σαν το υπο-βέλτιστο H ∞
πρόβληµα ελέγχου και η µεταβλητή γ καλείται ορισµένη H ∞ απόδοση.

Η λύση του παραπάνω προβλήµατος χρησιµοποιεί συνήθως την


παραµετροποίηση της κλάσης των αντισταθµιστών και έχει προταθεί από αρκετές
µεθόδους. Μεταξύ αυτών, η µέθοδος στο χώρο κατάστασης είναι περισσότερο
εφαρµόσιµη από αριθµητική άποψη, επειδή καταλήγει είτε σε εξισώσεις Riccati
(Doyle et al. 1989, Sampei et al 1990), είτε σε γραµµικές ανισότητες πινάκων, LMI
(Gahinet and Apkarian 1994).

9.2 Εύρωστη ευστάθεια

Στη συνέχεια παρουσιάζεται ένα αποτέλεσµα εύρωστης ευστάθειας για


πολλαπλασιαστικές αβεβαιότητες στην είσοδο του συστήµατος. Έστω το σύστηµα

P ( s ) = C ( sI − A) −1 B (9.9)

Υπό την επίδραση πολλαπλασιαστικής αβεβαιότητας η συνάρτηση µεταφοράς γίνεται

P ( s )( I + R( s )) (9.10)

ενώ υποτίθεται ότι η αβεβαιότητα έχει ένα άνω φράγµα της µορφής

σ ( R( jω )) < r ( jω ) , ∀ω (9.11)

Αβεβαιότητες της µορφής αυτής αναφέρονται ως µη δοµηµένες αβεβαιότητες, επειδή


όλα τα στοιχεία του πίνακα αβεβαιότητας R( s) είναι µεταβλητά, δηλαδή ο πίνακας
R( s) δεν έχει καµία ειδική δοµή. Το ακόλουθο αποτέλεσµα αναφέρεται στην
εύρωστη σταθεροποιησιµότητα.

Θεώρηµα 9.2 (Vidyasagar 1985)


Το κλειστό σύστηµα (9.10) µε αντιστάθµιση F ( s ) που σταθεροποιεί το ονοµαστικό
σύστηµα έχει εύρωστη σταθεροποιησιµότητα για κάθε πολλαπλασιαστική
αβεβαιότητα εισόδου που ικανοποιεί την (9.11) και που δεν εισάγει νέους πόλους στο
δεξιό µιγαδικό ηµι-επίπεδο, εάν και µόνον εάν ισχύει η ανισότητα

( I + F ( s ) P ( s )) −1 F ( s ) P ( s )r ( s ) ≤1 (9.12)

όπου r ( s ) είναι οποιαδήποτε ευσταθής ρητή συνάρτηση για την οποία η r ( s ) P ( s )


παραµένει καθαρά ρητή (proper), δεν έχει πόλους ή µηδενικά στο δεξιό µιγαδικό ηµι-
επίπεδο ( Re( s ) ≥ 0 ) και ικανοποιεί την (9.11).

150
Απόδειξη
Η πλήρης απόδειξη δίνεται στην αναφορά (Vidyasagar 1985). Εδώ θα αρκεστούµε σε
µερικά κύρια σηµεία της που αφορούν την ικανή συνθήκη. Είναι γνωστό ότι η
ευστάθεια του παραπάνω κλειστού συστήµατος καθορίζεται από τον αριθµό των
περιστροφών περί την αρχή των αξόνων της ορίζουσας του,

I + F ( jω ) P( jω )( I + R( jω )) (9.13)

Όµως, ο πίνακας αυτός µπορεί να γραφεί µε τη µορφή,

( I + F ( jω ) P( jω ))( I + ( I + F ( jω ) P( jω )) −1 F ( jω ) P( jω ) R( jω )) (9.14)

Αν το ονοµαστικό κλειστό σύστηµα είναι ευσταθές, τότε ο όρος ( I + FP) έχει τον
κατάλληλο αριθµό περιστροφών. Εφόσον ικανοποιείται η (9.12), η µέγιστη
ιδιόρρυθµη τιµή του όρου ( I + FP) −1 FPR είναι µικρότερη από τη µονάδα για όλες τις
συχνότητες, έτσι ώστε ο όρος ( I + ( I + FP) −1 FPR) δεν έχει ποτέ µηδενική ορίζουσα.
Άρα, ο πίνακας της (9.13) έχει τον κατάλληλο αριθµό περιστροφών περί την αρχή
των αξόνων. Αυτή είναι µια άλλη έκφραση του Θεωρήµατος Μικρού Κέρδους. Το
γεγονός ότι το ονοµαστικό και το αβέβαιο σύστηµα πρέπει να έχουν τον ίδιο αριθµό
ασταθών πόλων είναι κρίσιµο στην παραπάνω απόδειξη, αφού αυτή βασίζεται στο ότι
το αβέβαιο σύστηµα έχει τον ίδιο αριθµό περιστροφών περί την αρχή των αξόνων µε
το ονοµαστικό σύστηµα.

Η συνθήκη εύρωστης ευστάθειας (9.12) µπορεί να γραφεί και µε τη µορφή

r ( jω ) ≤ σ ( I + [ F ( jω ) P ( jω )]−1 ) , ∀ω (9.15)

Η σχέση αυτή προκύπτει από τις εξής σχέσεις:

[ I + F ( jω ) P( jω )]−1 F ( jω ) P( jω ) = {I + [ F ( jω ) P( jω )]−1}−1 (9.16)

και

σ ( M −1 ) = σ ( M ) (9.17)

όπου M είναι οποιοσδήποτε µιγαδικός πίνακας. Σηµειώνεται ότι, αν

F ( s ) = K ( sI − A) −1 B (9.18)

όπου K είναι το βέλτιστο LQR κέρδος ανάδρασης, τότε ισχύει,

σ ( I + H LQR ( jω )) ≥ 1/ 2 (9.19)

όπου

H LQR ( jω ) = F ( jω ) P( jω ) (9.20)

151
Αυτό σηµαίνει ότι η βέλτιστη LQR λύση που λαµβάνεται µε ανάδραση κατάστασης
εξασφαλίζει εύρωστη ευστάθεια για κάθε πολλαπλασιαστική αβεβαιότητα εισόδου,
της οποίας το φράγµα (9.11) ικανοποιεί τη σχέση

r ( jω ) ≤ 1/ 2 (9.21)

Η ανισότητα (9.19) προκύπτει από την ταυτότητα

( I + H −1 ) −1 = I − ( I + H ) −1 (9.22)

και από τις ανισότητες

( I + H −1 ) −1 ≤ 1 + ( I + H ) −1 (9.23)

1 1
≤ 1+ ≤2 (9.24)
σ (I + H )
−1
σ (I + H )

Η τελευταία ανισότητα προκύπτει από το γεγονός ότι για το βέλτιστο H LQR ( s ) ισχύει
ότι

σ ( I + H LQR ( jω )) ≥ 1 (9.25)

Φυσικά, ο βέλτιστος έλεγχος LQG δεν εγγυάται αυτό το επίπεδο εύρωστης


ευστάθειας (παρά µόνον ασυµπτωτικά, στην περίπτωση του σχεδιασµού LTR).
Ωστόσο, µπορεί να εξασφαλίσει την εύρωστη ευστάθεια για

r ( jω ) < α < 1/ 2 (9.26)

ικανοποιώντας το H ∞ φράγµα,

( I + H LQG ( jω )) −1 H LQG ( jω )α ≤1 (9.27)


όπου H LQG ( jω ) = F ( jω ) P( jω ) και F ( jω ) είναι ο βέλτιστος LQG αντισταθµιστής


συνδεδεµένος σε σειρά. Το αποτέλεσµα αυτό θα χρησιµεύσει σε τεχνικές ελέγχου που
θα παρουσιαστούν παρακάτω. Επίσης, κάποια αποτελέσµατα που αφορούν τον
έλεγχο H 2 και H ∞ είναι τα εξής:

Θεώρηµα 9.3
Αν η λύση της εξίσωσης Riccati

PA + AT P + PBBT P + C T C = 0 (9.28)

είναι θετικά ορισµένη και το ζεύγος ( A, C ) είναι παρατηρήσιµο, τότε ικανοποιείται


το ακόλουθο φράγµα H ∞ νόρµας,

152
C ( sI − A) −1 B ≤1 (9.29)

Απόδειξη
Έστω η συνάρτηση Lyapunov V = xT Px . Εφόσον P > 0 και το ζεύγος ( A, C ) είναι
παρατηρήσιµο, έπεται ότι ο πίνακας A είναι ευσταθής, έτσι ώστε η H ∞ - νόρµα είναι
καλώς ορισµένη. Η απόδειξη της (9.29) ισοδυναµεί µε το να αποδειχθεί ότι

I − G*G ≥ 0 (9.30)

όπου

G = C ( jω I − A) −1 B (9.31)

όπου G * συµβολίζει τον µιγαδικό συζυγή του G . Έστω

Φ ( s ) = ( sI − A) −1 (9.32)

τότε από την (9.28) προκύπτει,

− PA − AT P = PBBT P + C T C (9.33)

(− sI − A)T P + P( sI − A) = PBBT P + C T C (9.34)

BT PΦ ( s ) B + BT ΦT (− s ) PB = BT ΦT (− s) PBBT PΦ ( s ) B + GT (− s)G ( s) (9.35)

I − GT (− s )G ( s ) = M T (− s ) M ( s ) (9.36)

όπου

M ( s ) = ( I − BT PΦ ( s ) B) (9.37)

Η εξίσωση (9.35) προκύπτει πολλαπλασιάζοντας την (9.34) από δεξιά επί Φ ( s ) B και
από αριστερά επί BT ΦT (− s ) . Η (9.36) προκύπτει προσθέτοντας το µοναδιαίο πίνακα
I και στα δύο µέλη της (9.35), αναστρέφοντας κατάλληλα τους όρους της και
παραγοντοποιώντας το δεξιό µέλος της I − GT (− s )G ( s ) . Επειδή M T ( jω ) M ( jω ) ≥ 0 ,
η απόδειξη ολοκληρώνεται.

Το ακόλουθο αποτέλεσµα συνδέει την H 2 - νόρµα µιας ευσταθούς


συνάρτησης µεταφοράς µε τη λύση µιας εξίσωσης Lyapunov. Η H 2 - νόρµα µιας
συνάρτησης µεταφοράς H ( s ) συµβολίζεται H ( s ) 2 και ορίζεται ως εξής:

1/ 2
⎛1 ∞ ⎞
H ( s ) 2 = ⎜ π ∫ tr[ H T (− jω ) H ( jω )]dω ⎟ (9.38)
⎝ 2 −∞ ⎠

153
Έστω ότι η H ( s ) έχει µια πραγµάτωση χώρου κατάστασης H ( s ) = C ( sI − A) −1 B µε
κρουστική απόκριση h(t ) = Ce At B . Μπορεί να αποδειχθεί το εξής:

Θεώρηµα 9.4
Αν ο πίνακας A είναι ευσταθής, τότε

H ( s ) 2 = (tr[QC T C ])1/ 2 (9.39)

όπου ο πίνακας Q ικανοποιεί την εξίσωση Lyapunov

AQ + QAT + BBT = 0 (9.40)

Απόδειξη
Από το Θεώρηµα του Parseval η H 2 - νόρµα γράφεται και µε τη µορφή,

1/ 2 1/ 2
⎛∞ ⎞ ⎛∞ ⎞
H ( s ) 2 = ⎜ ∫ tr[hT (t )h(t )]dt ⎟ = ⎜ ∫ tr[ BT e A t C T Ce At B]dt ⎟
T
= (trPBBT )1/ 2
⎝0 ⎠ ⎝0 ⎠
(9.41)
όπου ο P ικανοποιεί την εξίσωση Lyapunov

AT P + PA + CC T = 0 (9.42)

Από τη στοχαστική – αιτιοκρατική δυαδικότητα είναι γνωστό ότι το ίχνος στην (9.41)
µπορεί να γραφεί και µε τη µορφή tr (QC T C ) , όπου ο πίνακας Q δίνεται από την
(9.40). Έτσι, ολοκληρώνεται η απόδειξη.

Τέλος, πρέπει να σηµειωθεί αν y = Cx και το x ικανοποιεί τη στοχαστική


διαφορική εξίσωση x = Ax + Bη , όπου η είναι ένα διάνυσµα λευκού θορύβου µε
µοναδιαία συσχέτιση, τότε ισχύει,

lim E{ yT (t ) y (t )} = 1/ 2π ∫ tr[ H (− jω ) H ( jω )]d ω
T
(9.43)
t →∞
−∞

Το αποτέλεσµα αυτό συµπληρώνει τη σχέση µεταξύ H 2 - νόρµας, επιδόσεων LQG


και επιδόσεων µέσων τετραγώνων.

9.3 Τεχνικές σχεδιασµού

Στην παράγραφο αυτή παρουσιάζονται κάποιες τεχνικές σχεδιασµού H ∞ που


εξασφαλίζουν εύρωστη ευστάθεια και επιδόσεις γραµµικού – τετραγωνικού τύπου για
το ονοµαστικό σύστηµα.

154
9.3.1 Q – παραµετροποίηση / Σχεδιασµός κυρτού προγραµµατισµού

Όπως είναι γνωστό, όλοι οι αντισταθµιστές που διατηρούν την εσωτερική


ευστάθεια του κλειστού συστήµατος µπορούν να παραµετροποιηθούν µε έναν
αυθαίρετο ευσταθή πίνακα Q( s ) . Ειδικότερα θέµατα σχετικά µε την Q –
παραµετροποίηση έχουν αναπτυχθεί από τον Vidyasagar (1985). Εδώ αναφέρεται πώς
η θεωρία αυτή µπορεί να χρησιµοποιηθεί στο σχεδιασµό αβέβαιων συστηµάτων που
έχουν ονοµαστικά βέλτιστες επιδόσεις και εύρωστη ευστάθεια.

Έστω και πάλι το σύστηµα µε συνάρτηση µεταφοράς ανοικτού βρόχου P και


αντισταθµιστή F . Είναι προφανές ότι το σύστηµα αυτό είναι εσωτερικά ευσταθές αν
όλες οι συναρτήσεις µεταφοράς ( I + FP) −1 , ( I + FP) −1 F , P ( I + FP) −1 και
P( I + FP) −1 F , είναι ευσταθείς. Αν η συνάρτηση µεταφοράς του κλειστού
συστήµατος γραφεί µε τη µορφή P ( s ) = N ( s ) D −1 ( s ) = D −1 ( s) N ( s ) , όπου ( N , D) και
( N , D) είναι παραµετροποιήσεις του P( s ) , τότε όλοι οι αντισταθµιστές που
διατηρούν την εσωτερική ευστάθεια του κλειστού συστήµατος παραµετροποιούνται
ως εξής:

F ( s ) = [Y ( s ) − Q( s ) N ( s )]−1[ X ( s ) + Q( s ) D( s )] (9.44)

όπου X ( s ) και Y ( s) είναι πίνακες H ∞ που ικανοποιούν την ταυτότητα του Bezout

X ( s ) N ( s ) + Y ( s ) D( s ) = I (9.45)

και Q( s) είναι οποιοσδήποτε ευσταθής πίνακας. Η παραµετροποίηση αυτή


ονοµάζεται Q – παραµετροποίηση (Q – parameterization) ή µερικές φορές
παραµετροποίηση κατά Youla (Youla parameterization). Ακόµη, µπορεί να δειχθεί ότι
µε την παραµετροποίηση αυτή βασικές συναρτήσεις µεταφοράς µπορούν να
περιγραφούν ως αφφινικές συναρτήσεις ως προς Q , δηλαδή σαν µια σταθερά συν µια
γραµµική συνάρτηση, µε τη µορφή T1 + T2QT3 . Έτσι, για παράδειγµα, µε τον
αντισταθµιστή της (9.44) οι πίνακες µεταφοράς

S = ( I + FP) −1
(9.46)
T = ( I + FP) −1 FP

που είναι γνωστοί ως πίνακας ευαισθησίας και συµπληρωµατικός πίνακας


ευαισθησίας, αντίστοιχα, µπορούν να γραφούν,

S = DY − DQN
(9.47)
T = ( I − DY ) + DQN

που είναι και οι δύο της µορφής T1 + T2QT3 . Οι σχέσεις αυτές προκύπτουν
αντικαθιστώντας την F ( s ) από την (9.44) στις εκφράσεις της (9.46) και
χρησιµοποιώντας την ταυτότητα Bezout.

155
Προκειµένου να εξασφαλιστεί η εύρωστη ευστάθεια του συστήµατος ως προς
πολλαπλασιαστικές αβεβαιότητες, µπορεί να χρησιµοποιηθεί ένα φράγµα της H ∞ -
νόρµας του T . Έτσι, αν

T ( s) ∞
≤ 1/ α (9.48)

τότε το κλειστό σύστηµα είναι εγγυηµένα ευσταθές για κάθε πολλαπλασιαστική


αβεβαιότητα που ικανοποιεί τον περιορισµό,

σ ( R( jω )) < α (9.49)

Εξάλλου, η H 2 - νόρµα του S παριστά το µέσο τετραγωνικό σφάλµα


παρακολούθησης τροχιάς (root-mean-square (RMS) tracking error). Έτσι, το
γραµµικό τετραγωνικό πρόβληµα βελτιστοποίησης που υπόκειται σε περιορισµό
εύρωστης ευστάθειας µπορεί να διατυπωθεί ως εξής:

Ζητείται να ελαχιστοποιηθεί η νόρµα της συνάρτησης ευαισθησίας µε πίνακα


βαρών W1 ( s )

W1 ( s ) S ( s ) 2
(9.50)

ως προς Q( s ) , όταν υπόκειται στον περιορισµό ανισότητας

T ( s) ∞
≤γ (9.51)

Επειδή κάθε νόρµα µιας αφφινικής ως προς Q συνάρτησης είναι κυρτή ως προς Q ,
το παραπάνω πρόβληµα βελτιστοποίησης ανάγεται σ’ ένα πρόβληµα κυρτής
βελτιστοποίησης, το οποίο έχει πάντοτε µια µοναδική ελάχιστη τιµή. Άρα, όλες οι
συγκλίνουσες τεχνικές εξεύρεσης ελαχίστου πρέπει να συγκλίνουν σ’ ένα σφαιρικό
ελάχιστο.

Υπενθυµίζεται ότι ένα υποσύνολο S ενός διανυσµατικού χώρου είναι κυρτό,


αν για οποιαδήποτε x1 και x2 που ανήκουν στο S , ο γραµµικός συνδυασµός
λ x1 + (1 − λ ) x2 , όπου 0 ≤ λ ≤ 1 ανήκει επίσης στο S . Ακόµη, υπενθυµίζεται ότι η
βαθµωτή συνάρτηση f ( x) είναι κυρτή σε µια περιοχή στο S , αν η ανισότητα

f [λ x1 + (1 − λ ) x2 ] ≤ λ f ( x1 ) + (1 − λ ) f ( x2 ) (9.52)

ισχύει για 0 ≤ λ ≤ 1 και για κάθε x1 και x2 που ανήκουν στο S (Luenberger 1984,
Boyd and Barratt 1991). Στις αναφορές αυτές δίνονται επίσης οι κατάλληλοι
αλγόριθµοι κυρτού προγραµµατισµού.

Ωστόσο, επειδή η Q( s) ανήκει σε χώρο άπειρης διάστασης, απαιτείται


περαιτέρω παραµετροποίηση προκειµένου να εξευρεθούν αριθµητικές λύσεις. Η

156
ακόλουθη παραµετροποίηση διατηρεί τη γραµµικότητα (αφφινικότητα) ως προς το
διάνυσµα q

N
Q( s ) = ∑ qi Qi ( s ) (9.53)
i =1

όπου Qi ( s ) είναι προκαθορισµένοι H ∞ - πίνακες και qi είναι οι συνιστώσες του


διανύσµατος q . Για τη µέθοδο κυρτού προγραµµατισµού µε Q – παραµετροποίηση
απαιτούνται τα ακόλουθα βήµατα:

1. Εύρεση των πινάκων N , D, X ... κ.λ.π. Ακριβείς εκφράσεις υπολογισµού των


πινάκων αυτών δίνονται στη (Vidyasagar 1985).

2. Επιλογή των πινάκων Qi ( s ) και µιας τιµής του N για την αναγωγή του
προβλήµατος κυρτού προγραµµατισµού σ’ ένα πρόβληµα πεπερασµένης
διάστασης. Το βήµα αυτό είναι δύσκολο καθώς η επιλογή των παραµέτρων
αυτών δεν είναι προφανής. Επίσης, στο βήµα αυτό εισάγεται µια προσέγγιση
της πραγµατικά βέλτιστης τιµής, µε αποτέλεσµα η εύρεση µιας εφικτής λύσης
να είναι πρόβληµα.

3. Χρησιµοποίηση κάποιου αλγορίθµου κυρτού προγραµµατισµού, όπως ο


αλγόριθµος τετµηµένου επιπέδου ή ο ελλειψοειδής αλγόριθµος (Boyd and
Barratt 1991), για την επίλυση του προβλήµατος βελτιστοποίησης υπό
περιορισµούς ως προς το διάνυσµα πεπερασµένης διάστασης q .

9.3.2 Σχεδιασµός µε U – παραµετροποίηση

Από τη θεωρία H ∞ είναι γνωστό ότι αντισταθµιστές F ( s ) ικανοποιούν την


(9.27) µπορούν να παραµετροποιηθούν από έναν αυθαίρετο πραγµατικό - φραγµένο
πίνακα U ( s ) (δηλαδή ένα πίνακα U ( s ) του οποίου τα στοιχεία είναι όλα συναρτήσεις
H ∞ και των οποίων η H ∞ - νόρµα είναι φραγµένη από τη µονάδα) µε τη µορφή,

F ( s ) = K11 ( s) + K12 ( s )U ( s )[ I − K 22 ( s)U ( s )]−1 K 21 ( s ) (9.54)

όπου τα K ij ( s ) µπορούν να υπολογιστούν από τα γνωστά δεδοµένα. Η θεωρία στην


οποία βασίζεται η µέθοδος αυτή είναι εκτενέστατη (Vidyasagar 1985, Francis 1987).
Η U – παράµετρος προκύπτει από την επίλυση δύο εξισώσεων Riccati και µπορεί να
χρησιµοποιηθεί στη συνέχεια προκειµένου να ελαχιστοποιηθεί ένας ονοµαστικός
δείκτης επιδόσεων LQG.

Η ελαχιστοποίηση ενός ονοµαστικού δείκτη επιδόσεων LQG µε τη χρήση της


παραµέτρου – U απαιτεί κάποια περαιτέρω παραµετροποίηση της συνάρτησης U ( s ) ,
επειδή δεν υπάρχει αναλυτική λύση του προβλήµατος βελτιστοποίησης ως προς
U ( s ) . Ένας τρόπος είναι η παραµετροποίηση της U ( s ) , ως προς κάποια παράµετρο
σχεδίασης k που επιτρέπει στην U ( s ) να παραµένει πραγµατική - φραγµένη

157
(bounded -real). Ένα απλό παράδειγµα είναι U ( s ) = S T ΛS , όπου S είναι ένας
προκαθορισµένος ορθογώνιος πίνακας και Λ είναι ένας διαγώνιος πίνακας µε
στοιχεία ki , τις συνιστώσες του διανύσµατος k . Τότε, η U ( s ) παραµένει πραγµατική
– φραγµένη, εφόσον ki ≤ 1 . Αφού η U ( s ) παραµετροποιείται µέσω ενός
διανύσµατος k πεπερασµένης διάστασης, µπορεί να χρησιµοποιηθεί η γνωστή
µέθοδος σχεδιασµού αντισταθµιστών προκαθορισµένης τάξης, προκειµένου να
ελαχιστοποιείται ένας δείκτης επιδόσεων LQG. Τότε, το πρόβληµα ανάγεται σ’ ένα
πρόβληµα µη – γραµµικής βελτιστοποίησης ως προς το διάνυσµα k . Τα βήµατα που
απαιτούνται για το σχεδιασµό µε U – παραµετροποίηση, συνοψίζονται ως εξής:

1. Χρησιµοποιείται η θεωρία H ∞ για τον υπολογισµό των πινάκων K ij ( s ) για


την U – παραµετροποίηση όλων των αντισταθµιστών F ( s ) που ικανοποιούν
τη συνθήκη εύρωστης ευστάθειας (9.27).

2. Επιλέγεται µια παραµετροποίηση της U ( s ) , που της επιτρέπει να παραµένει


πραγµατική - φραγµένη (bounded -real). Η πιο απλή επιλογή είναι ένας
σταθερός πίνακας τέτοιος ώστε U ( s ) = S T ΛS . Συνθετότερες
παραµετροποιήσεις µπορούν να κατασκευαστούν µε τη µορφή
p
U ( s ) = ∏ Bi ( s ) , όπου Bi ( s ) είναι απλοί παραµετροποιηµένοι πραγµατικοί –
i =1
φραγµένοι πίνακες. Επειδή τα γινόµενα πραγµατικών – φραγµένων πινάκων
είναι πραγµατικοί – φραγµένοι πίνακες, έπεται ότι η ιδιότητα αυτή
διατηρείται. Επίσης είναι γνωστό ότι η τάξη του αντισταθµιστή F ( s ) , για
U ( s ) = 0 , είναι ίδια µε την τάξη του συστήµατος. Θεωρώντας συνθετότερους
πίνακες U ( s ) , η τάξη του F ( s ) αυξάνει.

3. Χρησιµοποιείται µια µέθοδος µη – γραµµικής βελτιστοποίησης, όπως η


µέθοδος παραγώγου (gradient), για τον υπολογισµό του U –
παραµετροποιηµένου αντισταθµιστή F ( s ) . ∆υστυχώς, αντίθετα µε τη µέθοδο
της Q – παραµετροποίησης, εδώ η συνάρτηση που πρέπει να ελαχιστοποιηθεί
είναι µη κυρτή, γενικά, άρα ένας αλγόριθµος παραγώγου είναι δυνατόν να
συγκλίνει σ’ ένα τοπικό ελάχιστο, πράγµα που απέχει από το επιθυµητό
σφαιρικό ελάχιστο. Ωστόσο, η U – παραµετροποίηση εγγυάται πάντα ένα
εφικτό σηµείο εκκίνησης που έχει εύρωστη ευστάθεια.

9.3.3 Μικτός σχεδιασµός H 2 / H ∞

Ο µικτός H 2 / H ∞ σχεδιασµός αναφέρεται συχνά ως συνδυασµένος


H ∞ / LQG σχεδιασµός. Βασίζεται στο γεγονός ότι, αν η τροποποιηµένη εξίσωση
Riccati

QAT + AQ + BBT + γ −2QC2 C2Q = 0


T
(9.55)

έχει µια λύση Q ≥ 0 , τότε,

158
C2 ( sI − A) −1 B ≤γ (9.56)

και

T
C1 ( sI − A) −1 B ≤ (tr[QC1 C1 ])1/ 2 (9.57)
2

Το αποτέλεσµα αυτό δείχνει ότι η τροποποιηµένη εξίσωση Riccati µπορεί να


χρησιµοποιηθεί προκειµένου να εξασφαλιστεί ένα φράγµα H ∞ - νόρµας και
ταυτόχρονα ένα φράγµα H 2 - νόρµας. Το πρώτο φράγµα µπορεί να χρησιµοποιηθεί
προκειµένου να εξασφαλιστεί η εύρωστη ευστάθεια απέναντι σε µη δοµηµένες
αβεβαιότητες, ενώ το δεύτερο για να ελαχιστοποιηθεί ένα εγγυηµένο κόστος, στα
πλαίσια του ονοµαστικού προβλήµατος LQG. Προκειµένου να ελαχιστοποιηθεί το
T
tr[QC1 C1 ] υπό τον περιορισµό (9.55), χρησιµοποιούνται τεχνικές µε
πολλαπλασιαστές Lagrange. Οι εξισώσεις βελτιστοποίησης που προκύπτουν είναι
αρκετά σύνθετες. Η θεωρία αυτή αναπτύσσεται εκτενώς στη βιβλιογραφία (Bernstein
and Haddad 1989, Mustafa 1991).

Στη συνέχεια παρατίθενται κάποιες απλές σχέσεις για τον προσδιορισµό ενός
ελεγκτή F ( s ) , ο οποίος εγγυάται στο κλειστό σύστηµα ένα φράγµα H ∞ - νόρµας και
έστω γ το φράγµα αυτό. Ειδικότερα, µπορεί να αποδειχθεί (Doyle et al. 1989) ότι το
πρόβληµα σχεδίασης ανάγεται στην επίλυση δύο αποσυζευγµένων εξισώσεων
Riccati. Έστω ότι το σύστηµα περιγράφεται από τις δυναµικές εξισώσεις

x(t ) = Ax(t ) + B1w(t ) + B2u (t )


z (t ) = C1 x(t ) + D11w(t ) + D12u (t ) (9.58)
y (t ) = C2 x(t ) + D21w(t ) + D22u (t )

όπου

• x(t ) είναι η κατάσταση του συστήµατος

• w(t ) είναι το εξωγενές σήµα (σήµα αναφοράς, σήµα διαταραχής, κ.λ.π.)

• u (t ) είναι η είσοδος ελέγχου

• z (t ) είναι η ρυθµισµένη έξοδος

• y (t ) είναι η µετρούµενη έξοδος

Ο σκοπός του ελέγχου είναι πάντα η εύρεση ενός αντισταθµιστή µε συνάρτηση


µεταφοράς F ( s ) που εξάγει το σήµα u (t ) από το y (t ) , έτσι ώστε,

Tzw ( s ) ∞
<γ (9.59)

159
όπου Tzw ( s ) είναι η συνάρτηση µεταφοράς κλειστού βρόχου από το w(t ) στο z (t ) . Η
συνάρτηση µεταφοράς του συστήµατος (9.58) µπορεί να γραφεί µε τη µορφή

⎡A B1 B2 ⎤
G ( s ) = ⎢⎢ C1 D11 D12 ⎥⎥ (9.60)
⎢⎣C2 D21 D22 ⎥⎦

Όπως αποδεικνύεται στην αναφορά (Doyle et al. 1989), στην ειδική περίπτωση όπου

D12 [C1 D12 ] = [ 0 I ]


T
(9.61)
και

⎡ B1 ⎤ T ⎡ 0 ⎤
⎢ D ⎥ D21 = ⎢ I ⎥ (9.62)
⎣ 21 ⎦ ⎣ ⎦

υπάρχει ένας ελεγκτής για τον οποίο το κλειστό σύστηµα έχει συνάρτηση µεταφοράς
Tzw ( s ) που ικανοποιεί την (9.59), αν υπάρχουν θετικά ηµι-ορισµένες λύσεις των δύο
εξισώσεων Riccati,

AT X + XA + X (γ −2 B1 B1 − B2 B2 ) X + C1 C1 = 0
T T T

(9.63)
AY + YAT + Y (γ −2C1 C1 − C2 C2 )Y + B1 B1 = 0
T T T

δηλαδή X ≥ 0 και Y ≥ 0 , τέτοιες ώστε ρ ( XY ) < γ 2 , όπου ρ (W ) συµβολίζει τη


φασµατική ακτίνα του πίνακα W . Όταν ισχύουν οι παραπάνω συνθήκες ύπαρξης, ο
ελεγκτής που προκύπτει έχει συνάρτηση µεταφοράς

⎡ Aˆ − ZL ⎤
F ( s ) := ⎢ ⎥ (9.64)
⎣F 0 ⎦
όπου

Aˆ = A + γ −2 B1 B1 X + B2 F + ZLG2
T

T
F = − B2 X
(9.65)
T
L = −YC2
Z = ( I − γ −2YX ) −1

Επιπλέον, µια U – παραµετροποίηση του ελεγκτή F ( s ) , της µορφής (9.54), δίνεται


από τη σχέση

⎡ Aˆ − ZL ZB2 ⎤
⎢ ⎥
K ( s) = ⎢ F 0 I ⎥ (9.66)
⎢ −C I 0 ⎥⎦
⎣ 2

160
Τα K ij ( s ) που απαιτούνται στην (9.54) από τα επί µέρους µπλοκ της (9.66)
καταλλήλων διαστάσεων και θεωρώντας ότι το K11 ( s ) έχει τη διάσταση του F ( s ) .

Η (9.66) παίρνει διαφορετική µορφή στην περίπτωση που δεν ισχύουν οι


περιορισµοί (9.61)-(9.62). Οι αντίστοιχες σχέσεις για τo K ( s ) έχουν προταθεί από
τους Glover and Doyle (1988). Το λογισµικό που απαιτείται για τον υπολογισµό του
K ( s ) έχει αναπτυχθεί στο περιβάλλον MATLAB®. Σηµειώνεται ότι η επίλυση του
προβλήµατος ελέγχου H ∞ ανάγεται στην επίλυση δύο αποσυζευγµένων εξισώσεων
Riccati, όπως και στην περίπτωση του ελέγχου LQG.

9.4 Συµπεράσµατα

Στο κεφάλαιο αυτό παρατέθηκαν οι βασικές έννοιες και τα κύρια προβλήµατα


του ελέγχου H ∞ . Έγινε φανερό ότι η µεθοδολογία αυτή έχει ένα αυστηρό θεωρητικό
υπόβαθρο και όλα τα αποτελέσµατα που εξάγονται έχουν µαθηµατική απόδειξη. Αν
και αρχικά αναπτύχθηκε για συστήµατα µιας εισόδου – µιας εξόδου, εντούτοις η
χρησιµότητά της είναι σπουδαία στις περιπτώσεις που το ζητούµενο είναι η εύρωστη
ευστάθεια και η απόρριψη διαταραχής, καθώς και σ’ εκείνες που οι προδιαγραφές
αυτές χρειάζεται να συνδυαστούν µε προδιαγραφές ελέγχου LQG.

161
Κεφάλαιο 10

Εφαρµογές σύνθεσης εύρωστων ελεγκτών

Στο κεφάλαιο αυτό παρουσιάζονται εφαρµογές του εύρωστου ελέγχου σε


τεχνολογικά συστήµατα και αξιολογούνται οι αντίστοιχες τεχνικές σχεδιασµού.

10.1 Έλεγχος της πορείας οχήµατος

Το σύστηµα περιγράφεται από το µοντέλο κατάστασης,

x1 = x2

b 1
x2 = − x2 + u
m m

στο οποίο οι µεταβλητές κατάστασης x1 και x2 παριστούν αντίστοιχα τη θέση και


την ταχύτητα του οχήµατος (Franklin et al. 1994). Με τη µορφή πινάκων το µοντέλο
αυτό γράφεται,

⎡0 1 ⎤ ⎡0⎤
⎡ x1 ⎤ ⎢ ⎥ ⎡ x1 ⎤ ⎢ ⎥
⎢x ⎥ = ⎢ b ⎢ ⎥+ 1 u
⎣ 2 ⎦ 0 − ⎥ ⎣ x2 ⎦ ⎢ ⎥
⎣ m⎦ ⎣m⎦

Έτσι, αν x1 = x είναι η θέση, η ταχύτητα είναι προφανώς η x2 = x = x1 . Η


µετρούµενη έξοδος του συστήµατος είναι η θέση, οπότε y = x1 = x και µε τη µορφή
πινάκων η εξίσωση εξόδου είναι,

⎡x ⎤
y = [1 0] ⎢ 1 ⎥
⎣ x2 ⎦

162
b 1
Οι τιµές των παραµέτρων είναι, = 0.05 και = 0.001 . Επίσης, το σύστηµα
m m
υπόκειται σε µια εξωτερική διαταραχή που επηρεάζει τη συµπεριφορά του. Έτσι, το
µαθηµατικό του πρότυπο παίρνει τη µορφή

⎡ x1 ⎤ ⎡0 1 ⎤ ⎡ x1 ⎤ ⎡ 0 ⎤ ⎡0⎤
⎢ x ⎥ = ⎢0 −0.05⎥ ⎢ x ⎥ + ⎢0.001⎥ u + ⎢1 ⎥ w
⎣ 2⎦ ⎣ ⎦⎣ 2⎦ ⎣ ⎦ ⎣ ⎦

Στο σύστηµα αυτό εφαρµόζεται κατ’ αρχάς έλεγχος H ∞ µε ταυτόχρονη


τοποθέτηση των πόλων στην περιοχή x < −1 . Το κέρδος ανάδρασης που προκύπτει
έχει την εξαιρετικά υψηλή τιµή K = 1010 [ -1.8185 0] , η οποία προκαλεί
ταλαντώσεις στη µεταβατική απόκριση.

Σχήµα 10.1 Κρουστική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞

163
Σχήµα 10.2 Βηµατική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞

Όπως είναι αναµενόµενο, οι πόλοι του κλειστού συστήµατος που αντιστοιχούν σε


τόσο γρήγορες δυναµικές έχουν πολύ µικρό πραγµατικό µέρος.

Σχήµα 10.3 Πόλοι του κλειστού συστήµατος που λαµβάνεται µε τον έλεγχο H ∞

164
Στη συνέχεια εφαρµόζεται στο σύστηµα έλεγχος πολλαπλών στόχων H ∞ / H 2
µε ταυτόχρονη τοποθέτηση των πόλων στην ίδια περιοχή. Ο ελεγκτής που προκύπτει
έχει σηµαντικά µικρότερο κέρδος K = 104 [ -2.0667 -0.6372] και εξασφαλίζει
βελτιωµένες χρονικές αποκρίσεις.

Επίσης, οι πόλοι του κλειστού συστήµατος έγιναν λιγότερο αρνητικοί, πράγµα


που αντιστοιχεί σε λιγότερο γρήγορες δυναµικές. Οι συµπεριφορές αυτές φαίνονται
στα ακόλουθα σχήµατα.

Σχήµα 10.4 Κρουστική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞ / H 2

165
Σχήµα 10.5 Βηµατική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞ / H 2

Σχήµα 10.6 Πόλοι του κλειστού συστήµατος που λαµβάνεται µε τον έλεγχο H ∞ / H 2

166
10.2 Έλεγχος συστήµατος µεταφοράς ταινίας

Σε µερικά συστήµατα µεταφοράς ταινίας, όπου απαιτούνται υψηλές επιδόσεις,


σχεδιάζεται µια µικρή περιστροφική διάταξη που σπρώχνει την ταινία µπροστά από
τις κεφαλές ανάγνωσης / εγγραφής. Η διάταξη αυτή περιλαµβάνει τροχούς που
περιστρέφονται µε τη βοήθεια κινητήρων DC. Ο έλεγχος της περιστροφικής διάταξης
συνίσταται στον έλεγχο της ταχύτητας της ταινίας και της δύναµης της τάσης που
ασκείται σ’ αυτή, όταν βρίσκεται στην κεφαλή ανάγνωσης / εγγραφής. Ειδικότερα, το
σύστηµα βρίσκεται σε στατική ισορροπία, όταν (ι) η δύναµη της τάσης έχει µια
επιθυµητή τιµή ( T0 = F ) και (ιι) η ροπή στρέψης του κινητήρα ισούται µε τη ροπή
της περιστροφικής διάταξης ( K t i0 = rT
1 0 ) (Franklin et al. 1994). Τα µεγέθη που

χαρακτηρίζουν τις προδιαγραφές αυτές είναι:

T0 : δύναµη της τάσης της ταινίας, όταν βρίσκεται στην κεφαλή ανάγνωσης /
εγγραφής, στην κατάσταση ισορροπίας

F : σταθερή δύναµη

K t : σταθερά ροπής του κινητήρα

i0 : ρεύµα του κινητήρα στην κατάσταση ισορροπίας

r1 : ακτίνα του τροχού της περιστροφικής διάταξης

Τα µεγέθη αυτά και συγκεκριµένα οι αποκλίσεις τους από το σηµείο ισορροπίας είναι
οι µεταβλητές κατάστασης του συστήµατος. Υποθέτουµε ακόµη ότι υπάρχει µια
διαταραχή w , η οποία επιδρά στο σύστηµα και πρέπει να ελαχιστοποιηθεί. Έτσι, το
µοντέλο κατάστασης του συστήµατος είναι,

⎡ 0 2 0 0 0 ⎤ ⎡0⎤ ⎡0⎤
⎢ −0.1 −0.35 0.1 0.1 0.75⎥ ⎢0⎥ ⎢0⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
x=⎢ 0 0 0 2 0 ⎥ x + ⎢0⎥ u + ⎢0⎥ w
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ 0.4 0.4 −0.4 −1.4 0 ⎥ ⎢0⎥ ⎢0⎥
⎢⎣ 0 −0.03 0 0 −1 ⎥⎦ ⎢⎣1 ⎥⎦ ⎢⎣1 ⎥⎦
όπου
x = [ x1 ω1 i]
T
x2 ω2

και οι µετρούµενες έξοδοι περιγράφονται από την εξίσωση,

⎡ 0 0 0 0 0⎤
⎢ 0 0 1 0 0 ⎥⎥

y = ⎢ 0.5 0 0.5 0 0⎥ x
⎢ ⎥
⎢ 0 0 0 0 0⎥
⎢⎣ −0.2 −0.2 0.2 0.2 0 ⎥⎦

167
Στο σύστηµα αυτό εφαρµόζεται αρχικά ο ελέγχος H ∞ µε ταυτόχρονη
τοποθέτηση πόλων στην περιοχή x < −1 . Ο ελεγκτής που προκύπτει έχει κέρδος
ανάδρασης K = 109 [ -0.7154 -0.0114 -4.4175 -4.0478 0] . Η τιµή αυτή είναι
πολύ υψηλή, πράγµα που αντανακλάται και στις χρονικές αποκρίσεις του
συστήµατος.

Σχήµα 10.7 Κρουστική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞

Σχήµα 10.8 Βηµατική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞

168
Οι πόλοι του κλειστού συστήµατος είναι κατανεµηµένοι σ’ ένα πολύ ευρύ πεδίο του
αρνητικού µιγαδικού ηµι-επιπέδου. Ο µικρότερος πόλος έχει µια πολύ γρήγορη
δυναµική στη χρονική απόκριση.

Σχήµα 10.9 Πόλοι του κλειστού συστήµατος που λαµβάνεται µε τον έλεγχο H ∞

Στη συνέχεια εφαρµόζεται η µέθοδος πολλαπλών στόχων H ∞ / H 2 µε τοποθέτηση


πόλων στην ίδια περιοχή. Ο ελεγκτής που προκύπτει έχει µικρότερο κέρδος
K = [ -15.0375 -26.5927 -20.3087 -36.1116 -5.4236] και χρονικές αποκρίσεις µε
καλή απόσβεση.

169
Σχήµα 10.10 Κρουστική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞ / H 2

Σχήµα 10.11 Βηµατική απόκριση του κλειστού συστήµατος που λαµβάνεται µε τον
έλεγχο H ∞ / H 2

170
Σχήµα 10.12 Πόλοι του κλειστού συστήµατος που λαµβάνεται µε τον έλεγχο
H∞ / H2

Ας σηµειωθεί ότι και από το παράδειγµα αυτό γίνεται φανερό ότι η µικτή
µέθοδος H ∞ / H 2 εξασφαλίζει µικρότερα κέρδη και καλύτερες χρονικές αποκρίσεις
από τη µέθοδο H ∞ και για το λόγο αυτό πλεονεκτεί έναντι αυτής.

10.3 Πρακτικοί εύρωστοι προσαρµοστικοί ελεγκτές για ενεργές αναρτήσεις

Το σύστηµα της ενεργού ανάρτησης διαχωρίζεται σε δύο βρόχους, όπως στο


ακόλουθο σχήµα (Chantranuwathana and Peng 1999) . Στον εξωτερικό βρόχο γίνεται
ο υπολογισµός της επιθυµητής δύναµης, ενώ στον εσωτερικό ο ελεγκτής ανίχνευσης
δύναµης προσπαθεί να κρατήσει το µέτρο της πραγµατικής δύναµης κοντά στο
επιθυµητό. Προκειµένου να είναι ικανοποιητική η ανίχνευση της δύναµης,
προτείνεται η χρήση ενός προσαρµοστικού εύρωστου ελεγκτή στον εσωτερικό
βρόγχο, δεδοµένων και των αβεβαιοτήτων που υπάρχουν στο σύστηµα. Με τον τρόπο
αυτό µπορεί να επιτευχθεί ανίχνευση δύναµης µε ρυθµό µεγαλύτερο των 5Hz.

171
Σχήµα 10.13 Αρχιτεκτονική του ελεγκτή

Στο ακόλουθο σχήµα απεικονίζεται το σύστηµα των ανάρτησης που µελετάται.

Σχήµα 10.14 Σύστηµα ανάρτησης

Οι µεταβλητές που το χαρακτηρίζουν είναι,

172
ms , mus : µάζες συµπίεσης και εκτόνωσης
k s , kus : σταθερές ελατηρίων
cs : βαθµός απόσβεσης των στοιχείων συµπίεσης
cus :βαθµός απόσβεσης των στοιχείων εκτόνωσης
xc , xw : µετατοπίσεις των µαζών
xr : µετατόπιση του τροχού

Θεωρούµε έναν ενεργοποιητή (actuator) ανάµεσα στις µάζες συµπίεσης και


εκτόνωσης, ο οποίος έχει τη δυνατότητα να ασκεί µία δύναµη Fa µεταξύ των ms και
mus .

Οι γραµµικές δυναµικές εξισώσεις γι’ αυτό το σύστηµα αναρτήσεων είναι:

ms xc = k s ( xw − xc ) + cs ( xw − xc ) + Fa
mus xw = kus ( xr − xw ) + cus ( xr − xw ) −
k s ( xw − xc ) − cs ( xw − xc ) − Fa

που µπορούν να γραφούν υπό τη µορφή εξισώσεων κατάστασης

X = A1 X + B1u
όπου
X = [ xr − xw xc ]
T
xw xw − xc
u = [ Fa xr ]
T

ενώ Fa είναι η είσοδος ελέγχου και xr η διαταραχή του συστήµατος ανάρτησης.

Στην περίπτωση του προσαρµοστικού εύρωστου ελεγκτή η εξίσωση της


δύναµης γράφεται:

Fa = θ1[k1 ( xw − xc ) − k2 Fa + k3u ] + d

όπου οι παράµετροι k1 , k2 , k3 είναι γνωστές, ενώ η παράµετρος θ1 = β /V είναι µία


άγνωστη παράµετρος που αλλάζει κυρίως λόγω των αλλαγών του β . Η διαταραχή d
υποδηλώνει τις αβεβαιότητες που προέρχονται κυρίως από µη-µοντελοποιηµένες
δυναµικές και αναταράξεις του δρόµου.

Ο προσαρµοστικός εύρωστος ελεγκτής σχεδιάζεται ώστε να αποτελείται από


δύο µέρη, το προσαρµοστικό και το εύρωστο. Έτσι,

u = u1a + u1s

173
Το προσαρµοστικό µέρος θα είναι:

1 1
u1a = [− k1 ( xw − xc ) + k2 Fa + ( Fd + p1e1 )]
k3 θˆ1π
όπου,

Fd : η επιθυµητή δύναµη
e1 : το σφάλµα ανίχνευσης Fa − Fd
θˆ1π : µία φραγµένη εκτίµηση του θ1
p1 : µία παράµετρος ρύθµισης

και όπου ο κανόνας προσαρµογής επιλέγεται να είναι:

θˆ1 = γ 1e1[k1 ( xw − xc ) − k2 Fa + k3u1a ]

µε κέρδος προσαρµογής γ 1 > 0 .

Το εύρωστο µέρος επιλέγεται να είναι:

1 1 1
u1s = −e1 [ π 1M 2 (k1 ( xw − xc ) − k2 Fa + k3u1a ) 2 + 2
dM ]
4θ1m k3 ε11 ε12
όπου,
π 1M : θετικός αριθµός τέτοιος ώστε π 1M ≥ θˆ1π ∀t
ε11 , ε12 : προσαρµόσιµοι µικροί αριθµοί

Πειραµατικές δοκιµές του παραπάνω ελεγκτή έδειξαν ικανοποιητικά αποτελέσµατα


(Σχήµα 10.15). Ωστόσο, όπως φαίνεται και από τα αποτελέσµατα της προσοµοίωσης,
η χρήση του προσαρµοστικού εύρωστου ελεγκτή (ΠΕΕ) αντιµετωπίζει αρκετά καλά
το πρόβληµα αλλά όχι ιδανικά. Αυτό οφείλεται στο ότι υπάρχουν µη
µοντελοποιηµένες δυναµικές και χρειάζεται περαιτέρω υποστήριξη του ελεγκτή µε
έναν ΠΕΕ δύο φάσεων ή τη χρήση άλλων παρόµοιων τεχνικών.

174
Σχήµα 10.15 Προσοµοίωση ανίχνευσης δύναµης

10.4 Σύνθεση εύρωστου ελεγκτή για εφαρµογές οχηµάτων αυτόµατης πλοήγησης

Το ενδιαφέρον για τα οχήµατα αυτόµατης πλοήγησης (AGV-Automatic


Guided Vehicles) υπάρχει εδώ και πολύ καιρό, ιδιαίτερα στον τοµέα των
αυτοκινήτων και των γεωργικών µηχανηµάτων (Martinet et al. 1998). Η παρούσα
εφαρµογή αναφέρεται στο σχεδιασµό εύρωστων ελεγκτών που χρησιµοποιούνται
στους αισθητήρες. Συνήθως χρησιµοποιείται µία κάµερα για να προσδιορίζεται µέσω
της εικόνας ο προσανατολισµός και η θέση του οχήµατος σε σχέση µε τη λευκή
λωρίδα του δρόµου. Το κινηµατικό µοντέλο του οχήµατος βασίζεται σε µία
κανονικοποίηση ως προς την ταχύτητα του οχήµατος. Λαµβάνονται ιδιαίτερα υπόψη
οι διαταραχές στη γωνία κλίσης της κάµερας, καθώς και το ύψος της. Λόγω των
ταλαντώσεων και της σχετικής αστάθειας αυτής της προσέγγισης, ερευνάται η χρήση
µίας τεχνικής εύρωστου ελέγχου H ∞ .

Το ακόλουθο σχήµα παριστά το διάγραµµα βαθµίδων του πειραµατικού


µοντέλου που χρησιµοποιείται για την προσοµοίωση του συστήµατος. Από αυτό
φαίνεται ότι σκοπός του ελεγκτή είναι να ελέγχει την παρούσα θέση της κάµερας και
να την αναπροσαρµόζει αφού τη συγκρίνει πρώτα µε την επιθυµητή.

175
Σχήµα 10.16 Πειραµατικό µοντέλο

Το µοντέλο αυτό βασίζεται στο µοντέλο του ποδηλάτου (Σχήµα 10.17). Η θέση
αναπαρίσταται από το ζεύγος ( x, s ) , τις καρτεσιανές συντεταγµένες του κέντρου P
του τροχού σε ένα πλαίσιο αναφοράς [0, Χ, S], του οποίου ο δεύτερος άξονας
συµπίπτει µε την ευθεία γραµµή που ακολουθείται από το όχηµα. Ο
προσανατολισµός του καθορίζεται από την παράµετρο ψ (γωνία µεταξύ του άξονα
του οχήµατος και 0S), θετική αντίθετα από τη φορά του ρολογιού.

Το διάνυσµα V , της γραµµικής ταχύτητας στο σηµείο P έχει την κατεύθυνση


του άξονα του οχήµατος. Η παράγωγος ως προς το χρόνο των x και s δίνονται από
τις σχέσεις,

x = −V sinψ
s = V cosψ

Σε ότι αφορά τη σχέση της γραµµικής ταχύτητας στο σηµείο P και αυτής στο
στιγµιαίο κέντρο περιστροφής (Instantaneous Center of Rotation ICR) , η οποία είναι
µηδέν, αποδεικνύεται ότι,

V
ψ= tan δ
L

176
Σχήµα 10.17 Μοντέλο ποδηλάτου

Το ζητούµενο δεν είναι να εντοπιστεί ένα σηµείο της γραµµής αναφοράς, αλλά απλά
να ακολουθήσουµε τη γραµµή. Ενδιαφερόµαστε εποµένως να ρυθµίσουµε τα x και
ψ . Από τις προηγούµενες σχέσεις και χρησιµοποιώντας µία προσέγγιση για πολύ
µικρές γωνίες, οδηγούµαστε στις παρακάτω εξισώσεις του οχήµατος:

x = −ψ
δ
ψ=
L

Το ύψος της κάµερας ως προς το έδαφος και η κλίση της γωνίας της ως προς την
κατακόρυφο θα αναφέρονται ως h και a , αντίστοιχα. Η τρισδιάστατη λευκή γραµµή
προβάλλεται ως δισδιάστατη στο πλαίσιο της κάµερας. Η εξίσωσή της είναι,

px = ap y + b
όπου
1
a= x
ξ1
ξ2 1
b=− x+ ψ
ξ1ξ3 ξa
και

fψ fψ 1
ξ1 = h , ξ2 = − a , ξ3 =
fx fx fx

ενώ f x , fψ είναι εσωτερικές εγγενείς παράµετροι της κάµερας.

177
Θεωρώντας ως διάνυσµα κατάστασης το Z = [ a b ] και απαλείφοντας το ψ από τις
T

παραπάνω εξισώσεις, προκύπτει το παρακάτω µοντέλο χώρου κατάστασης,

Z = AZ + Bδ
y = CZ
όπου

⎡ ξ2 ξ3 ⎤
⎢− ξ −
ξ1 ⎥ ⎡ 0 ⎤
A=⎢ 2
1
⎥, B=⎢ 1 ⎥
⎢ ξ2 ξ2 ⎥ ⎢ ⎥
⎢ ⎥ ⎢ Lξ
⎣ a ⎥⎦
⎣⎢ ξ1ξ3 ξ1 ⎦⎥

Σκοπός του ελέγχου είναι η ρύθµιση των παραµέτρων a και b . Επιλέγεται η


µέθοδος H ∞ , επειδή το σύστηµα χαρακτηρίζεται από εγγενείς αβεβαιότητες, οι
οποίες είναι µη δοµηµένες προσθετικές διαταραχές στο πεδίο της συχνότητας. Το
διάγραµµα βαθµίδων του κλειστού αβέβαιου συστήµατος είναι,

Σχήµα 10.18 Μοντέλο κλειστού συστήµατος

Στο σχήµα αυτό C ( p) είναι η διάταξη του ελεγκτή. Το ανοικτό αβέβαιο σύστηµα
είναι,

F ( p) = F0 ( p) + ∆F0 ( p)

όπου F0 ( p) είναι το ονοµαστικό σύστηµα και ∆F0 ( p) είναι η αβεβαιότητα. Έτσι, το


χαρακτηριστικό πολυώνυµο του κλειστού συστήµατος θα είναι,

1 + F ( p)C ( p ) = [1 + F0 ( p)C ( p)][1 + q( p)∆F0 ( p)

C ( p)
q( p) =
1 + F0 ( p)C ( p)

Η συνθήκη ευστάθειας του κλειστού συστήµατος απαιτεί

1 + F ( jω )C ( jω ) ≠ 0 , ∀ω

178
ενώ η εύρωστη ευστάθεια εξασφαλίζεται για

q( p )r ( p ) ∞
<1

όταν

∆F0 ( jω ) ≤ r ( jω ) , ∀ω
και

r ( jω )
≤ 1 , ∀ω
F0 ( jω )

Υπό αυτές τις συνθήκες, ο εύρωστος ελεγκτής µπορεί να εκφραστεί τελικά ως,

q( p)
C ( p) =
1 − F0 ( p)q( p)

και είναι αυτός που εξασφαλίζει εύρωστη ευστάθεια και απόρριψη της διαταραχής.

10.5 Εύρωστος ελεγκτής για διµοιρία αυτόνοµων υποβρυχίων οχηµάτων

Η εφαρµογή αυτή αναφέρεται στο σχεδιασµό ενός εύρωστου ελεγκτή για τον
έλεγχο «αρχηγού-ακολούθου» µίας διµοιρίας αυτόνοµων υποβρυχίων οχηµάτων
(Okamoto et al. 2004). Υποθέτουµε ότι ο αρχηγός γνωρίζει τη θέση του και οι
ακόλουθοι ξέρουν µόνο µία εµβέλεια και µία κατεύθυνση προς τον αρχηγό. Ο
αρχηγός πλοηγεί χρησιµοποιώντας ένα σύστηµα οδηγού πλοήγησης και οι ακόλουθοι
διατηρούν καθορισµένες αποστάσεις από τον αρχηγό. Ο ελεγκτής τόσο για τον
αρχηγό όσο και για τους ακολούθους βασίζεται στη θεωρία του γραµµικού
τετραγωνικού ρυθµιστή µε γκαουσιανό θόρυβο (Linear Quadratic Gaussian LQG και
Loop Transfer Recovery LTR).

Το υπό έλεγχο σύστηµα είναι ένα αυτόνοµο υποβρύχιο όχηµα το οποίο έχει
έξι βαθµούς ελευθερίας. Εφόσον η µελέτη της κίνησης του οχήµατος θα γίνει στο
οριζόντιο επίπεδο µόνο, οι έξι βαθµοί ελευθερίας µπορούν να µειωθούν στους τρεις,
διευκολύνοντας έτσι τη µελέτη µας. Το γραµµικό µοντέλο του συστήµατος είναι:

x = Ax + Buin
y = Cx + Duin
όπου
x = [u v r ψ ] , uin = ⎡⎣u prop
T T
δ r ⎤⎦

u : η πρόσθια ταχύτητα σε m/sec


v : η πλευρική ταχύτητα σε m/sec

179
r : ο ρυθµός περιστροφής σε rad/sec
ψ : η γωνία περιστροφής σε rad
u prop : η ώθηση της προπέλας σε m
δ r : η γωνία του πηδαλίου σε rad

Οι δύο επόµενες εξισώσεις είναι απαραίτητες για τον προσδιορισµό της θέσης του
οχήµατος:

X = u cosψ + v sinψ
Y = −u sinψ + v cosψ

Οι συντεταγµένες Χ και Υ και οι µεταβλητές για το µοντέλο των τριών βαθµών


ελευθερίας παριστάνονται γραφικά στο παρακάτω σχήµα.

Σχήµα 10.19 Σύστηµα συντεταγµένων και µεταβλητές οχήµατος

Το µοντέλο κατάστασης του συστήµατος του ακολούθου είναι,

⎡ ui ⎤ ⎡ −0.372 0 0 0 0 ⎤ ⎡ ui ⎤
⎢v ⎥ ⎢ ⎢ ⎥
⎢ i ⎥ ⎢ 0 −2.7815 −0.6315 0 0 ⎥⎥ ⎢ vi ⎥
⎢ ri ⎥ = ⎢ 0 −5.0016 −1.9732 0 0 ⎥ ⎢ ri ⎥
⎢ ⎥ ⎢ ⎥⎢ ⎥
⎢ψ i ⎥ ⎢ 0 0 1 0 0 ⎥ ⎢ψ i ⎥
⎢ ex ,i ⎥ ⎢⎣ −1 0 0 0 0 ⎥⎦ ⎢⎣ ex ,i ⎥⎦
⎣ ⎦
⎡0.032 0 ⎤ ⎡0 ⎤
⎢ 0 ⎥
0.2831 ⎥ ⎢0 ⎥
⎢ ⎡u prop ,i ⎤ ⎢ ⎥
+⎢ 0 −1.5952 ⎥ ⎢ ⎥ + ⎢ 0 ⎥ u0
⎢ ⎥ ⎣ δ r ,i ⎦ ⎢ ⎥
⎢ 0 0 ⎥ ⎢0 ⎥
⎢⎣ 0 0 ⎥⎦ ⎣⎢1 ⎥⎦

180
Υποθέτοντας ότι ο ακόλουθος γνωρίζει την κατάσταση από τον αρχηγό, η εξίσωση
εξόδου θα είναι,

⎡ ui ⎤
⎢ ⎥
⎡1 0 0 0 0 ⎤ ⎢ vi ⎥
yi = ⎢⎢0 0 0 1 0 ⎥⎥ ⎢ ri ⎥
⎢ ⎥
⎢⎣0 0 0 0 1 ⎥⎦ ⎢ψ i ⎥
⎢ ex ,i ⎥
⎣ ⎦

Το µοντέλο κατάστασης του συστήµατος του αρχηγού είναι,

⎡ u0 ⎤ ⎡ −0.372 0 0 0 0 ⎤ ⎡ u0 ⎤
⎢v ⎥ ⎢ ⎢ ⎥
⎢ 0⎥ ⎢ 0 −2.7815 −0.6315 0 0 ⎥⎥ ⎢ v0 ⎥
⎢ r0 ⎥ = ⎢ 0 −5.0016 −1.9732 0 0 ⎥ ⎢ r0 ⎥
⎢ ⎥ ⎢ ⎥⎢ ⎥
⎢ψ 0 ⎥ ⎢ 0 0 1 0 0 ⎥ ⎢ψ 0 ⎥
⎢ ex ,0 ⎥ ⎢⎣ −1 0 0 0 0 ⎥⎦ ⎢⎣ ex ,0 ⎥⎦
⎣ ⎦
⎡0.032 0 ⎤ ⎡0 ⎤
⎢ 0 ⎥
0.2831 ⎥ ⎢0 ⎥
⎢ ⎡u prop ,0 ⎤ ⎢ ⎥
+⎢ 0 −1.5952 ⎥ ⎢ ⎥ + ⎢0 ⎥ uref
⎢ ⎥ ⎣ δ r ,0 ⎦ ⎢ ⎥
⎢ 0 0 ⎥ ⎢0 ⎥
⎢⎣ 0 0 ⎥⎦ ⎣⎢1 ⎥⎦

⎡ u0 ⎤
⎢ ⎥
⎡1 0 0 0 0 ⎤ ⎢ v0 ⎥
yi = ⎢⎢0 0 0 1 0 ⎥⎥ ⎢ r0 ⎥
⎢ ⎥
⎢⎣0 0 0 0 1 ⎥⎦ ⎢ψ 0 ⎥
⎢ ex ,0 ⎥
⎣ ⎦

που είναι σχεδόν ίδια µε την εξίσωση του ακολούθου.

Ο ελεγκτής αποτελείται από δύο τµήµατα: έναν ελεγκτή πλοήγησης και έναν
ελεγκτή ταχύτητας. Τόσο ο αρχηγός όσο και οι ακόλουθοι χρησιµοποιούν τον ίδιο
ελεγκτή πλοήγησης. Σκοπός του είναι να επικεντρώνεται σε ένα επιθυµητό σηµείο.
Το σηµείο αυτό είναι µία συγκεκριµένη διαδροµή για τον αρχηγό και ένας
επιθυµητός σχηµατισµός για τους ακολούθους. Το παρακάτω σχήµα δείχνει τις
απαιτούµενες µεταβλητές για τον έλεγχο του σχηµατισµού. Τα X και Y παριστούν
το σύστηµα συντεταγµένων, ενώ τα xi και yi παριστούν συντεταγµένες, του i
ακολούθου. Στο σχεδιασµό των ελεγκτών θεωρούµε ότι όλοι οι ακόλουθοι µπορούν
να υπολογίζουν την εµβέλεια και την κατεύθυνση από τον αρχηγό. Υποθέτουµε

181
επίσης ότι δεν υπάρχουν καθυστερήσεις στις µετρήσεις και ότι οι µετρήσεις είναι
συνεχείς.

Ο ελεγκτής πλοήγησης προσπαθεί να θέσει την κατεύθυνση σε µία ορισµένη


επιθυµητή τιµή ψ di ελαχιστοποιώντας τη γωνία απόκλισης θ LOS ,i που ορίζεται ως
εξής:

θ LOS ,i = ψ di −ψ i
⎛ Ydi′ − Yi′ ⎞
ψ i = tan −1 ⎜ ⎟
⎝ X di′ − X i′ ⎠

Ο ελεγκτής ταχύτητας του αρχηγού ρυθµίζει την ταχύτητα στην τιµή


λειτουργίας ενώ ο ελεγκτής των ακολούθων προσαρµόζει την ταχύτητα µε σκοπό να
ελαχιστοποιηθεί η απόσταση ex ,i . Ας σηµειωθεί ότι η πρόσθια απόσταση είναι
διαφορετική από την εµβέλεια και δίνεται από τη σχέση,

ex ,i = x0′ − xi′ − xd′ 0i − k

όπου xi είναι η θέση του i οχήµατος και xd′ 0i είναι ο επιθυµητός διαχωρισµός του
οχήµατος στην xi κατεύθυνση. Στην προηγούµενη σχέση η σταθερά k προστέθηκε
προκειµένου να εξασφαλιστεί ότι οι ακόλουθοι να κυνηγούν πάντα το κατάλληλο
σηµείο.

Σχήµα 10.20 Μεταβλητές ελέγχου πλοήγησης και σχηµατισµού

182
Όπως ήδη αναφέρθηκε, ο νόµος εύρωστου ελέγχου προσδιορίζεται µε τη
µέθοδο LQG-LQR, η οποία εξασφαλίζει τις προδιαγραφές ελέγχου τόσο στο πεδίο
του χρόνου, όσο και στο πεδίο της συχνότητας.

10.6 Έλεγχος απόκλισης τροχιάς πειραµατικού ελικοπτέρου

Το πειραµατικό ελικόπτερο του παρακάτω σχήµατος έχει τέσσερα στροφεία.


Η κίνησή του χαρακτηρίζεται από αβεβαιότητες και χρονικές καθυστερήσεις. Για τον
έλεγχό του χρησιµοποιείται µια τεχνική προβλεπτικού ελέγχου µε ανάδραση
κατάστασης.

Σχήµα 10. 21 Πειραµατικό ελικόπτερο

Σε ελικόπτερα αυτού του τύπου, οι µπρος και πίσω κινητήρες περιστρέφονται µε τη


φορά των δεικτών του ρολογιού, ενώ οι άλλοι δύο µε αντίθετη φορά µειώνοντας έτσι
τα γυροσκοπικά φαινόµενα. Το ελικόπτερο τεσσάρων στροφείων δεν έχει κεντρικό
στροφείο. Η κύρια ώθηση του δίνεται από το άθροισµα των ωθήσεων του κάθε
κινητήρα. Η κατακόρυφη κίνηση επιτυγχάνεται µε την αύξηση (µείωση) της
ταχύτητας του πίσω κινητήρα και αντίστοιχη µείωση (αύξηση) της ταχύτητας του
εµπρός κινητήρα. Η περιστροφική κίνηση επιτυγχάνεται µε παρόµοιο τρόπο
χρησιµοποιώντας τους πλευρικούς κινητήρες. Η κίνηση σε τροχιά κατορθώνεται
αυξάνοντας (µειώνοντας) την ταχύτητα του εµπρός και του πίσω κινητήρα ενώ
αντίστοιχα µειώνεται (αυξάνεται) η ταχύτητα των πλευρικών κινητήρων. Συγχρόνως
η συνολική ώθηση διατηρείται σταθερή. Στο σύστηµα παρουσιάζονται χρονικές
καθυστερήσεις οφειλόµενες στην θέση / προσανατολισµό του συστήµατος µέτρησης
και επίσης στον υπολογισµό της εισόδου ελέγχου.

Σκοπός του ελέγχου είναι η αποφυγή ασταθειών στη θέση και τον
προσανατολισµό του ελικοπτέρου.

183
∆ιατύπωση του προβλήµατος

Η περιγραφή χώρου κατάστασης συνεχούς χρόνου µε χρονική καθυστέρηση


στην είσοδο δίνεται από την εξίσωση,

x(t ) = Ac x(t ) + Bcu (t − h(t ))

όπου η h(t ) είναι η µεταβλητή χρονική καθυστέρηση του συστήµατος.

Ορίζεται ο στιγµιαίος χρόνος δειγµατοληψίας tk = kT , όπου k είναι ένας


ακέραιος αριθµός και T είναι η περίοδος δειγµατοληψίας. Προκειµένου να
εξασφαλιστεί η ευρωστία του ελέγχου ανάµεσα στις δειγµατοληψίες, ορίζεται το

tk +1 − tk = T + ε k

όπου ε k είναι µια µικρή µεταβολή της διάρκειας του χρόνου ανάµεσα σε δύο
δειγµατοληψίες.

Επιπλέον υποθέτουµε ότι T και h ικανοποιούν την σχέση,

h(t ) = dT + ε (t )

όπου d είναι ένας ακέραιος αριθµός και ε (t ) είναι µια µικρή αβεβαιότητα της
χρονικής καθυστέρησης h(t ) . Και οι δύο µεταβλητές µπορούν να παίρνουν θετικές ή
αρνητικές τιµές, αλλά θα πρέπει να είναι φραγµένες ως προς τη νόρµα τους. Στη
συνέχεια λαµβάνεται το διακριτοποιηµένο µοντέλο του συστήµατος. Θέτοντας
xk = x(tk ) προκύπτει

tk +1
xk +1 = A1 xk + ∫ e Ac (tk +1 −τ ) Bcu (τ − h(τ ))dτ
tk

όπου
A1 = e Ac ( tk +1 −tk ) = e Ac (T +ε k )

Τεχνική ελέγχου

Για τον έλεγχο του συστήµατος χρησιµοποιείται µια τεχνική υβριδικού


προβλεπτικού ελέγχου (Lozano et al. 2004). Ειδικότερα, ενώ το σύστηµα
περιγράφεται σε συνεχή χρόνο, ο ελεγκτής δουλεύει σε διακριτό χρόνο. Ακόµη, στο
νόµο ελέγχου η πραγµατική κατάσταση αντικαθίσταται από την κατάσταση
πρόβλεψης. Έτσι, ο νόµος ελέγχου είναι,

uk = K T xkp+ d = K T ( Ad xk + Ad −1 Buk − d + ... + Buk −1 )

όπου xkp+ d είναι η προβλεπόµενη τιµή της κατάστασης σε µελλοντική χρονική στιγµή
k +d .

184
Η εύρωστη ευστάθεια µελετήθηκε µε τη χρήση τεχνικών Lyapunov για
αβέβαια συστήµατα µε χρονικές καθυστερήσεις (Κεφάλαιο 4). Ας σηµειωθεί ότι οι
αβεβαιότητες του συστήµατος θεωρήθηκαν αρκετά µικρές.

Πειραµατική εφαρµογή

Η παραπάνω τεχνική εύρωστου ελέγχου εφαρµόστηκε σε πραγµατικό χρόνο


σε πειραµατικό ελικόπτερο τύπου MaRTE OS. Στο ακόλουθο σχήµα παριστάνεται η
σύνδεση του συστήµατος µε τις εξωτερικές διατάξεις.

Σχήµα 10.22 Σχέδιο σύνδεσης του συστήµατος µε τις εξωτερικές διατάξεις.

Προκειµένου να σχεδιαστεί ο ελεγκτής σε πραγµατικό χρόνο, απαιτούνται οι


εξής εργασίες:

• Εργασία ελέγχου: εκτελείται περιοδικά παίρνοντας πληροφορία για την θέση


του ελικοπτέρου και υπολογίζει τις εντολές που πρέπει να αποσταλούν στους
κινητήρες.

• Αποστολή εντολών: εκτελείται περιοδικά µε σκοπό την εξαγωγή της


πληροφορίας από την κατάσταση ελέγχου και την αποστολή εντολών στον
κινητήρα χρησιµοποιώντας έναν D/A µετατροπέα. Η εργασία αυτή µπορεί να
παρουσιάσει καθυστερήσεις στην ενέργεια της αποστολής µε σκοπό να
δοκιµάσει διαφορετικούς αλγόριθµους ελέγχου.

• Συσκευή καταγραφής: καταγράφονται πληροφορίες από το εξεταζόµενο


αντικείµενο, µέσω µιας συσκευής RS232.

• Εντολές χρηστών: διαβιβάζονται οι εντολές του χρήστη από το


πληκτρολόγιο.

• Κατάσταση ελέγχου: οι εντολές παίρνουν ή δίνουν πληροφορία από την


διαδικασία.

185
Αποτελέσµατα του πειράµατος

Η συνάρτηση µεταφοράς από την είσοδο ελέγχου τροχιάς στην µετατόπιση


τροχιάς προσδιορίζεται εισάγοντας ένα παλµό εισόδου ενώ το ελικόπτερο αιωρείται.
Ο παλµός απόκρισης φαίνεται στο παρακάτω σχήµα. Είναι φανερό ότι το σύστηµα
έχει απρόβλεπτη και πιθανόν ασταθή συµπεριφορά.

Σχήµα 10.23 Απόκριση του ανοικτού συστήµατος

Το ελικόπτερο έχει εκ κατασκευής γυροσκόπιο που εισάγει µια ανάδραση


γωνιακής ταχύτητας. Η συνάρτηση µεταφοράς χωρίς το γυροσκόπιο είναι 2ης τάξης.
Ωστόσο, η συνάρτηση µεταφοράς, αν συµπεριλάβουµε την ανάδραση της γωνιακής
ταχύτητας, έχει ένα πόλο στην αρχή των αξόνων και έναν αρνητικό πραγµατικό πόλο.
Έστω ότι το σύστηµα περιγράφεται από ένα µοντέλο 2ης τάξης µε δύο παραµέτρους.
∆οκιµάζοντας διαφορετικές τιµές για τις παραµέτρους παρατηρούµε ότι το µοντέλο,

200
G(s) =
s ( s + 4)

έχει µια συµπεριφορά η οποία είναι κοντά στην συµπεριφορά του πραγµατικού
συστήµατος.

Ένας απλός ελεγκτής της µορφής

uk = 0.08( y ∗ − yk )

186
όπου το y ∗ είναι το σήµα αναφοράς, µπορεί να σταθεροποιήσει το µοντέλο αυτό.
Ωστόσο, όπου υπάρχουν καθυστερήσεις τριών περιόδων δειγµατοληψίας στην
µέτρηση της θέσης γωνιακής τροχιάς ο ελεγκτής γίνεται,

uk = 0.08( y ∗ − yk −3 )

και η συµπεριφορά του κλειστού συστήµατος είναι ασταθής όπως φαίνεται στο
παρακάτω σχήµα:

Σχήµα 10.24 Ασταθής συµπεριφορά οφειλόµενη στις χρονικές καθυστερήσεις

Ευστάθεια συστήµατος προβλεπτικού ελέγχου

Η περιγραφή του µοντέλου χώρου κατάστασης διακριτού χρόνου για


T = 0.08sec δίνεται από τις σχέσεις,

⎡ x1k +1 ⎤ ⎡ 0.7261 0 ⎤ ⎡ x1k ⎤ ⎡0.5477 ⎤


⎢ 2 ⎥=⎢ ⎥⎢ 2⎥ + ⎢ ⎥ uk
⎣ xk +1 ⎦ ⎣0.2739 1 ⎦ ⎣ xk ⎦ ⎣ 0.0923⎦

⎡ x1k ⎤
yk = [ 0 6.25] ⎢ 2 ⎥
⎣ xk ⎦

Επειδή η κατάσταση xk δεν είναι µετρήσιµη, χρησιµοποιείται ο παρατηρητής,

187
⎡ xˆ1k +1 ⎤ ⎡ 0.7261 −2.7940 ⎤ ⎡ xˆ1k ⎤ ⎡0.4470 ⎤ ⎡ 0.5477 ⎤
⎢ 2 ⎥=⎢ ⎥ ⎢ 2⎥ + ⎢ ⎥ yk + ⎢ ⎥ uk −3
⎣ xˆk +1 ⎦ ⎣ 0.2739 −1.0261⎦ ⎣ xˆk ⎦ ⎣0.3242 ⎦ ⎣ 0.0923⎦

Η πρόβλεψη της κατάστασης τριών βηµάτων εµπρός µπορεί να γίνει


χρησιµοποιώντας την ακόλουθη εξίσωση:

⎡ xˆ1k ⎤
⎢ 2 ⎥
xˆk ⎥
⎡0.3829 0 0.2888 0.3977 0.5477 ⎤ ⎢
x p (k ) = ⎢ ⎥ ⎢ uk −3 ⎥
⎣ 0.6171 1 0.3512 0.2423 0.0923⎦ ⎢ ⎥
⎢ uk − 2 ⎥
⎢u ⎥
⎣ k −1 ⎦

Ο νόµος ελέγχου γίνεται:

uk = 0.08( y ∗ − [ 0 6.25] x p (k ))

και σταθεροποιεί το σύστηµα, όπως φαίνεται και στο παρακάτω σχήµα.

Σχήµα 10.25 Σταθεροποιηµένο κλειστό σύστηµα που λαµβάνεται µε τον υβριδικό


προβλεπτικό έλεγχο

Στο σύστηµα του ελικοπτέρου που µελετήθηκε στην εφαρµογή αυτή, είναι
ενδιαφέρον να εξεταστεί η χρησιµοποίηση οπτικού σερβο-ελεγκτή. Είναι γνωστό
βέβαια ότι η επεξεργασία εικόνας θα παρουσιάσει σηµαντικές καθυστερήσεις. Ένα
από τα αντικείµενα αυτής της εφαρµογής ήταν να δείξει ότι ο αλγόριθµος ελέγχου
που βασίζεται στην πρόβλεψη µπορεί να χρησιµοποιηθεί για την αποφυγή ασταθειών
στον έλεγχο της θέσης και του προσανατολισµού του ιπτάµενου οχήµατος.

188
Παράρτηµα Ι

Γραµµικές Ανισότητες Πινάκων

Στην ενότητα αυτή γίνεται µια σύντοµη παρουσίαση των γραµµικών


ανισοτήτων πινάκων και της χρήσης τους σε προβλήµατα εύρωστου ελέγχου. Η
βασική µορφή µιας γραµµικής ανισότητας πινάκων (Linear Matrix Inequality LMI)
είναι (Boyd et al. 1994)

N
F ( x) = F0 + ∑ xi Fi > 0 (Π1.1)
i =1

όπου x ∈ R N είναι µια άγνωστη µεταβλητή (µε συνιστώσες xi ) ενώ οι πίνακες

T
Fi = Fi ∈ R N × N , i = 1, 2,..., N (Π1.2)

είναι δεδοµένοι συµµετρικοί πίνακες. Σηµειώνεται ότι η (Π1.1) είναι µια ανισότητα
πινάκων που δηλώνει ότι ο πίνακας F ( x) είναι θετικά ορισµένος.

Η γραµµική ανισότητα πινάκων (LMI) είναι ένας κυρτός περιορισµός της


µεταβλητής x και το σύνολο

{x : F ( x) > 0}

είναι κυρτό. Συνεπώς, κάθε πρόβληµα εύρωστου ελέγχου µε κυρτή συνάρτηση


κόστους ή δείκτη επιδόσεων (αντικειµενική συνάρτηση) και περιορισµούς της µορφής
(Π1.1) µπορεί να αναχθεί σ’ ένα πρόβληµα κυρτού προγραµµατισµού (ή κυρτής
βελτιστοποίησης). Τα προβλήµατα κυρτού προγραµµατισµού έχουν ιδιαίτερο
ενδιαφέρον στον αυτόµατο έλεγχο επειδή οι βέλτιστες λύσεις τους είναι σφαιρικές
λύσεις και υπολογίζονται µε τη χρήση αποτελεσµατικών αλγορίθµων και λογισµικών
που αναπτύχθηκαν κατά τα τελευταία χρόνια. Οι αλγόριθµοι αυτοί αναφέρονται ως
αλγόριθµοι εσωτερικού σηµείου (Nesterov and Nemirovsky 1993, 1996, Boyd and El
Ghaoui 1993, Vanderberghe and Boyd 1995) και είναι εξαιρετικά αποτελεσµατικοί
για την επίλυση προβληµάτων µε LMI.

189
Μία αξιοσηµείωτη ιδιότητα των LMI είναι η δυνατότητα οµαδοποίησης
πολλών LMI σε ένα, αφού το πλήθος των περιορισµών

F (1) ( x) > 0,..., F ( p ) ( x) > 0 (Π1.3)

είναι ισοδύναµο µε το LMI

diag ( F (1) ( x),..., F ( p ) ( x)) > 0 (Π1.4)

Μερικές µη – γραµµικές ανισότητες µπορούν να µετασχηµατιστούν σε LMI


µε το συµπλήρωµα του Schur

⎡ Q ( x) S ( x) ⎤ ⎧ R( x) > 0
⎢ T ⎥ > 0 ⇔ ⎨ −1
(Π1.5)
⎩Q( x) − S ( x) R ( x) S ( x) > 0
T
⎣ S ( x) R( x) ⎦

⎧ Q( x) > 0
⇔⎨ −1
(Π1.6)
⎩ R( x) − S ( x)Q ( x) S ( x) > 0
T

όπου Q( x) = QT ( x) , R ( x ) = RT ( x ) και S ( x) είναι γραµµικές (αφφινικές)


συναρτήσεις του x .

Απόδειξη: Πολλαπλασιάζουµε τη δεύτερη γραµµή του πίνακα της (Π1.5) από


αριστερά επί R −1 και τη δεύτερη στήλη από δεξιά επί R −1 . Έτσι προκύπτει ο πίνακας

⎡ Q ( x) S ( x) R −1 ( x) ⎤
⎢ −1 ⎥ (Π1.7)
T
⎣ R ( x) S ( x) R −1 ( x) ⎦

Με τις πράξεις αυτές διατηρείται η ανισότητα της (Π1.5). Κατόπιν, στην πρώτη
γραµµή της (Π1.7) προσθέτουµε τη δεύτερη γραµµή πολλαπλασιασµένη από
αριστερά επί − S ( x) και παίρνουµε

⎡Q( x) − S ( x) R −1S T ( x) 0 ⎤
⎢ ⎥ (Π1.8)
⎣ R −1 ( x) S T ( x) R −1 ( x) ⎦

Τέλος, στην πρώτη στήλη της (Π1.8) προσθέτουµε τη δεύτερη στήλη


πολλαπλασιασµένη από δεξιά επί − S T ( x) . Έτσι προκύπτει ο πίνακας

⎡Q( x) − S ( x) R −1S T ( x) 0 ⎤
⎢ −1 ⎥ (Π1.9)
⎣ 0 R ( x) ⎦

ενώ διατηρείται και πάλι η ανισότητα της (Π1.5). Ο διαγώνιος κατά µπλοκ πίνακας
(Π1.9) θα είναι θετικά ορισµένος αν και µόνον εάν

190
⎧ R −1 ( x) > 0
⎨ −1
(Π1.10)
⎩Q( x) − S ( x) R ( x) S ( x) > 0
T

Επειδή η σχέση R −1 ( x) > 0 είναι ισοδύναµη µε τη σχέση R( x) > 0 , η απόδειξη έχει


ολοκληρωθεί.

Ας σηµειωθεί ότι η ανισότητα της (Π1.5) είναι ένα LMI ως προς S , ενώ η
δεύτερη ανισότητα της (Π1.10) δεν είναι. Συγκεκριµένα, αυτή είναι τετραγωνική ως
προς S .

Στη συνέχεια παρουσιάζεται η σχέση που έχει ο εύρωστος έλεγχος


εγγυηµένου κόστους µε τα LMI. Ας θεωρήσουµε το πρόβληµα της εύρεσης ενός
συµµετρικού πίνακα P > 0 και ενός πίνακα K , έτσι ώστε

( A + BK )T P + P( A + BK ) + Q < 0 (Π1.11)

όπου οι A , B και W > 0 είναι δεδοµένοι πίνακες. Είναι φανερό ότι αν ικανοποιείται
η (Π1.11), τότε υπάρχει ένας νόµος ελέγχου της µορφής

u (t ) = Kx(t )

για το σύστηµα

x(t ) = Ax(t ) + Bu (t )

ο οποίος εγγυάται το άνω φράγµα


∫x (t )Qx(t )dt <xT (0) Px(0)


T

για κάθε x(0) ≠ 0 . (Εδώ χρησιµοποιούνται αυστηρές ανισότητες για την


απλούστευση της παρουσίασης). Ας σηµειωθεί επίσης ότι αν P > 0 και Q > 0 , τότε η
ανισότητα (Π1.11) εξασφαλίζει την ασυµπτωτική ευστάθεια του κλειστού
συστήµατος

x(t ) = ( A + BK ) x(t )

Αυτό µπορεί να δειχθεί χρησιµοποιώντας τη συνάρτηση Lyapunov

V ( x, t ) = xT (t ) Px(t )

και παρατηρώντας ότι η (Π1.11) συνεπάγεται ότι

V ( x, t ) < 0

191
Η ανισότητα (Π1.11) δεν είναι κυρτή ως προς P και K . Ωστόσο, αντικαθιστώντας,

P = Y −1
(Π1.12)
K = XY −1

η (Π1.11) γράφεται,

( A + BXY −1 )T Y −1 + Y −1 ( A + BXY −1 ) + Q < 0 (Π1.13)

η οποία πολλαπλασιαζόµενη από αριστερά και δεξιά επί Y , παίρνει τη µορφή,

YAT + X T BT + AY + BX + YQY < 0 (Π1.14)

Εφαρµόζοντας το συµπλήρωµα του Schur αυτή γράφεται µε τη µορφή,

⎡ −YAT − X T BT − AY − BX Y ⎤
⎢ ⎥>0 (Π1.15)
⎣ Y Q −1 ⎦

που είναι LMI ως προς X και Y .

Η παραπάνω τεχνική εφαρµόζεται και σε άλλα προβλήµατα εύρωστου


ελέγχου, µερικά από τα οποία παρουσιάζονται στα κεφάλαια του συγγράµµατος
αυτού.

Η επιτυχία των LMI στον Αυτόµατο Έλεγχο οφείλεται στο γεγονός ότι ένα
πλήθος προβληµάτων που δεν έχουν αναλυτική λύση επιλύονται αριθµητικά µε τη
χρήση αλγορίθµων του τύπου «εσωτερικού σηµείου» (interior point algorithm) οι
οποίοι ενσωµατώνονται εύκολα στον πυρήνα του λογισµικού MATLAB. Επίσης,
επειδή οι µεταβλητές µπορούν να είναι και πίνακες, πολλά προβλήµατα ανάλυσης και
σύνθεσης συστηµάτων επαναδιατυπώνονται και επιλύονται εύκολα.

192
Βιβλιογραφία

Abou-Kandil, H. and P. Bertrand, “Analytic solution for a class of linear quadratic


open-loop Nash games”, International Journal of Control, 43, pp. 997-1002, 1986.

Abou-Kandil, H., G. Freiling, V. Ionescu and G. Jank, Matrix Riccati Equations in


Control and Systems Theory, Basel, Switzerland: Birkhäuser, 2003.

Aioun, F., H. Bourlès and H. Abou-Kandil, “A mixed alpha-stabilization and non-


linear optimization procedure for the linear quadratic simultaneous control problem”,
Workshop on Developments in Industrial Control Problems: Tools and Applications,
Thessaloniki, Greece, 1996.

Akpan, E., “Robust observers for uncertain linear systems”, in Proc. of American
Control Conference, 6, 2001, pp. 4220-4221.

Anderson, B.D.O., “A simplified viewpoint of hyperstability”, IEEE Trans. Autom.


Control, 13, pp. 292-294, 1968.

Anderson, B.D.O. and J.B. Moore, Optimal Control: Linear Quadratic Methods,
Englewood Cliffs, NJ: Prentice Hall, 1990.

Arzelier, D., J. Bernussou and G. Garcia, “Pole assignment of linear uncertain


systems in a sector via a Lyapunov-type approach”, IEEE Trans. Autom. Control, 38,
pp. 1128-1131, 1993.

Barmish, B.R., M. Corless and G. Leitmann, “A new class of stabilizing controllers


for uncertain dynamical systems”, SIAM Journal of Control and Optimization, 21, pp.
329-338, 1983.

Barmish, B.R., “Necessary and Sufficient Conditions for Quadratic Stabilizability of


Uncertain Linear Systems”, Journal of Optimization Theory and Applications, 40, pp.
399-408, 1985.

Barmish, B.R., New tools for robustness of linear systems, Macmillan, NY., 1994.

Barmish, B.R., and A.R. Galimidi, “Robustness of Luenberger observers: linear


systems stabilized via nonlinear control”, Automatica, 22, pp. 413-423, 1986.

Bernstein, D.S. and W.M. Haddad, “LQG control with H ∞ performance bound: a
Riccati equation approach”, IEEE Trans. Autom. Control, 34, pp. 293-305, 1989.

Bernstein, D.S. and W.M. Haddad, “Robust stability and performance via fixed order
dynamic compensation with guaranteed cost bounds”, Math. of Control Signals and
Systems, 3, pp. 139-163, 1990.

193
Bernussou, J., P.L.D. Peres and J.C. Geromel, “A linear programming oriented
procedure for quadratic stabilization of uncertain systems”, Systems and Control
Letters, 13, pp. 65-72, 1989.

Bhattacharya, S.P., “The structure of robust observers”, IEEE Trans. Autom. Control,
21 pp. 581-588, 1976.

Boyd, S., V. Balakrishnan and P. Kabamba, “A bisection method for computing the
h∞ norm of a transfer matrix and related problems”, Math. Control Signals and
Systems, 2, pp. 207-220, 1989.

Boyd, S. and C.H. Barrat, Linear controller design limits of performance, N.J.
Prentice –Hall, 1991.

Boyd, S.and L. El Ghaoui, “Method of centers for minimizing generalized


eigenvalues”, Linear Algebra and Applications, pp.63-111, 1993.

Boyd, S., L. El Ghaoui, E. Feron and V. Balakrishnan, Linear Matrix Inequalities in


System and Control Theory, Philadelphia, USA: SIAM, 1994.

Βροχίδου, Ε., Σχεδιασµός εύρωστων παρατηρητών κατάστασης για τον έλεγχο


αβέβαιων συστηµάτων, Μεταπτυχιακή ∆ιατριβή, Τµήµα Ηλεκτρολόγων Μηχανικών
και Μηχανικών Υπολογιστών, ∆ηµοκρίτειο Πανεπιστήµιο Θράκης, Ξάνθη, 2007.

Chang, S.S.L. and T.K.C. Peng, “Adaptive guaranteed cost control of systems with
uncertain parameters”, IEEE Transactions on Automatic Control, 17, pp. 474-483,
1972.

Chantranuwathana, S. and H. Peng, “Practical adaptive robust controllers for active


suspensions”, Proc. of the American Control Conference, San Diego CA, U.S.A.,
1999, pp. 1702-1706.

Chilali, M. and P. Gahinet, “ H ∞ design with pole placement constraints: an LMI


approach”, IEEE Trans. Autom. Control, 41, pp. 358-367, 1996.

Chilali, M., P. Gahinet and P. Apkarian, “Robust pole placement in LMI regions”,
IEEE Trans. Autom. Control, 44, pp. 2257-2269, 1999.

Daafouz, J., G. Millerioux, and L. Rosier, “Observer design with guaranteed bound
for LPV systems”, in Proc. of the 16th IFAC World Congress, 2005.

Dahleh, M.A. and I.J. Diaz-Bobillo, Control of Uncertain Systems: A Linear


Programming Approach, Prentice Hall, 1995.

Desoer, C. and M. Vidyasagar, Feedback Systems: Input – Output Properties,


Academic Press, 1975.

Dorato, P., C. Abdellah and V. Cerone, Linear Quadratic Control: an Introduction,


Englewood Cliffs, NJ: Prentice Hall, 1995.

194
Dorato, P., W. Yang and C. Abdallah, “Application of Quantifier Elimination Theory
to Robust Multi-objective Feedback Design”, J. Symbolic Computation, 11, pp. 1-5,
1996.

Dorato, P., W. Yang and C. Abdallah, “Robust Multi-objective Feedback Design by


Quantifier Elimination”, J. Symbolic Computation, 24, pp. 153-159, 1997.

Dorato, P., L. Menini and C.A. Treml, “Robust Multi-Objective Feedback Design
with Linear Guaranteed-Cost Bounds”, Automatica, 14, pp. 1239-1243, 1998.

Doyle, J.C., “Guaranteed margins for LQG regulators”, IEEE Trans. Automatic
Control, 23, pp. 756-757, 1978.

Doyle, J.C. and G. Stein, “Multivariable feedback design: concepts for a classical /
modern synthesis”, IEEE Trans. Automatic Control, 26, pp. 4-16, 1981.

Doyle, J.C., K. Glover, P. Khargoneker and B. Francis, “State space solutions to


standard h2 and h∞ control problems”, IEEE Trans. Automatic Control, 34, pp. 831-
847, 1989.

∆ούρου, Μ., Εύρωστος έλεγχος µε ταυτόχρονη διευθέτηση πόλων γραµµικών


συστηµάτων, ∆ιπλωµατική Εργασία, Τµήµα Ηλεκτρολόγων Μηχανικών και
Μηχανικών Υπολογιστών, ∆ηµοκρίτειο Πανεπιστήµιο Θράκης, Ξάνθη, 2006.

Duan, G.-R., N.K. Nichols and G.-P. Liu, “Robust pole assignment in descriptor
linear systems via state feedback”, European Journal of Control, vol. 8, pp. 136-149,
2002.

Elia, N. and M. Dahleh, “Controller Design with Multiple Objectives”, IEEE Trans.
Automatic Control, 42, pp. 596-613, 1997.

Fischman, A., J.M. Dion, L. Dugard and A. Trofino Neto, “A linear matrix inequality
approach for guaranteed cost control”, in Proceedings of the 13th IFAC World
Congress, San Francisco, USA, 1996, pp. 197-202.

Francis, B.A. A course on H ∞ control theory, Springer – Verlag, 1987.

Francis, B.A. and G. Zames, “On H ∞ optimal sensitivity theory for SISO feedback
systems”, IEEE Transactions on Automatic Control, 29, pp. 9-16, 1984.

Franklin, S.N. and J. Ackermann, “Robust flight control – A design example” Journal
of Guidance and Control, vol. 4, 1980, pp. 597-606.

Franklin, G.F., J.D. Powell and A. Emami-Naeini, Feedback control of dynamic


systems, Addison-Wesley, N.Y.,1994.

Gahinet, P. and P. Apkarian, “A linear matrix inequality approach to H ∞ control”,


International Journal of Robust and Nonlinear Control, 4, pp.421-448, 1994.

195
Garcia, G. and J. Bernussou, “Pole assignment for uncertain systems in a specified
disk by state feedback”, IEEE Transactions on Automatic Control, 40, pp. 184-190,
1995.

Garcia, G., J. Bernussou and D. Arzelier, “Robust stabilization of discrete-time linear


systems with norm bounded time varying uncertainty”, System and Control Letters,
22, pp. 327-339, 1994.

Garcia, G., J. Bernussou and D. Arzelier, “An LMI Solution for disk pole location
with H 2 guaranteed cost control”, European Journal of Control, 1, pp. 54-61, 1995.

Garcia, G., J. Bernussou and D. Arzelier, “Stabilization of an uncertain linear


dynamic system by state and output feedback: a quadratic stabilizability approach”,
International Journal of Control, 64, pp. 839-858, 1996.

Garcia, G. and J. Bernussou, “Pole assignment for uncertain systems in a specified


disk by output feedback”, Mathematics of Control Signals and Systems, 9, pp. 152-
161, 1996.

Garcia, G., “Quadratic guaranteed cost and disk pole location control for discrete-time
uncertain systems”, IEE Proc. – Control Theory and Applications, 144, pp. 545-548,
1997.

Garcia, G. and S. Tarbouriech, “Stabilization with eigenvalues placement of a norm


bounded uncertain system by bounded inputs”, Intern. Journal of Robust and
Nonlinear Control, 9, pp. 599-615, 1999.

Gilman, A.S. and I.B. Rhodes, “Cone-bounded nonlinearities and mean-square


bounds – Quadratic regulation bounds”, IEEE Transactions on Automatic Control, 21,
pp. 472-483, 1976.

Glover, K. and J.C. Doyle, “State space formulae for all stabilizing controllers that
satisfy an H ∞ -norm bound and relations to risk sensitivity”, Systems and Control
Letters, 11, pp. 167-172, 1988.

Graupe, D., “Derivation of weighting matrices toward satisfying eigenvalues


requirement”, International Journal of Control, 16, pp. 881-888, 1972.

Hui, S. and S.H. Żak, “Control and observation of uncertain systems: a variable
structure approach”, in Control and Dynamic Systems; Advances in Theory and
Applications 34 (1990) 175-204. Advances in Control Mechanics Part 1 and 2 (C.T.
Leondes Ed.), San Diego: Academic Press, 1990.

Jabbari, F. and W.E. Schmitendorf, “Effects of using observers on stabilization of


uncertain linear systems”, IEEE Trans. Autom. Control, 38, pp. 266-271, 1993.

196
Καλτσά, Β., Έλεγχος αβέβαιων συστηµάτων µε πολλαπλά µοντέλα, Μεταπτυχιακή
∆ιατριβή, Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών,
∆ηµοκρίτειο Πανεπιστήµιο Θράκης, Ξάνθη, 2006.

Kailath, T., Linear Systems, Information & Syst. Sci. Series, Prentice Hall, 1980.

Καρακουλίδης, Κ., Εύρωστος έλεγχος βασιζόµενος στην πρόβλεψη, για ασταθή


συστήµατα καθυστέρησης: εφαρµογή σε έλεγχο απόκλισης τροχιάς ενός µικρού
ελικοπτέρου, Τεχνική Έκθεση, Εργαστήριο Συστηµάτων Αυτοµάτου Ελέγχου, Τµήµα
Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, ∆ηµοκρίτειο
Πανεπιστήµιο Θράκης, Ξάνθη, 2006.

Kawasaki, N. and E. Shimemura, “Determining weighting matrices to locate poles in


a specific region”, Automatica, 19, pp. 557-560, 1983.

Kimura, H. “Robust stability for a class of transfer functions”, IEEE Transactions on


Automatic Control, 29, pp. 788-793, 1984.

Khargonekar, P.P., I.R. Petersen and M.A. Rotea, “ H ∞ optimal control with state
feedback”, IEEE Transactions on Automatic Control, 33, pp. 786-788, 1988.

Khargonekar, P.P., I.R. Petersen and K. Zhou, “Robust stabilization of uncertain


linear systems: Quadratic stabilizability and H ∞ control theory”, IEEE Transactions
on Automatic Control, 35, pp. 356-361, 1990.

Khargonekar, P.P. and M.A. Rotea, “Mixed h2 / h∞ control: a convex optimization


approach”, IEEE Transactions on Automatic Control, 36, pp. 824-837, 1991.

Kleinman, D.L., “On an iterative technique for Riccati equation computations”, IEEE
Transactions on Automatic Control, 13, pp. 114-115, 1968.

Kose, E.I. and F. Jabbari, “Control of lpv systems with partly measured parameters”,
in Proc. of the 36th IEEE Conf. on Decision and Control, pp. 972-977, 1997.

Koshkouei, A.J. and A.S.I. Zinober, “Sliding mode state observation for non-linear
systems”, Intern. J. of Control, 77, pp. 118-127, 2004.

Kosmidou, O.I. and P. Bertrand, “Robust Controller Design for Systems with Large
Parameter Variations”, International Journal of Control, 45, pp. 927-938, 1987.

Kosmidou, O.I., “Guaranteed cost control of systems with norm-bounded


uncertainties”, International Journal of Systems Science, 18, pp. 1637-1644, 1987.

Kosmidou, O.I., A. Nanos and G. Papageorgiou, “Expected cost design method for a
class of systems with model uncertainties”, International Journal of Systems Science,
20, pp. 1753-1762, 1989.

197
Kosmidou, O.I., “Robust stability and performance of systems with structured and
bounded uncertainties: an extension of the guaranteed cost control”, International
Journal of Control, 52, pp. 627-640, 1990.

Kosmidou, O.I., H. Abou-Kandil and P. Bertrand, “A game theoretic approach for


guaranteed cost control”, Proc. of the European Control Conference, Grenoble,
France, 1991, pp. 2220-2225.

Kosmidou, O.I. and H. Bourlès, “Gain and phase margins of the guaranteed cost
regulator”, International Journal of Control, 60, pp. 1-15, 1994.

Kosmidou, O.I., G. Papakostas and G. Tampakis, “Robust multiple objective control


by using LMI optimization”, Proc. of the European Control Conference, Porto,
Portugal, 2001.

Kosmidou, O.I. and K. Mitroglou, “Guaranteed cost control with simultaneous pole
shifting for linear uncertain systems”, 13th IFAC Workshop on Control Applications of
Optimization, Paris, France, 2006, pp. 197-202.

Kosmidou, O.I. and Vrochidou, E. “Robust controller and observer design for linear
systems with parametric uncertainties”, Applied Mathematics and Computation, 2007.

Landau, I.D., Identification et commande des procédés, Editions Hermès, Paris, 1993.

Ljung, L.L., System Identification – Theory for the user, Prentice Hall, NY, 1986.

Li, H., S.I. Niculescu, L. Dugard and J.-M. Dion, “Robust guaranteed cost control for
uncertain linear time-delay systems”, in “Stability and control of time-delay systems”,
London: Springer, pp. 283-301, 1998.

Looze, D.P., “A dual optimization procedure for linear quadratic robust control
problems”, Automatica, 19, pp. 299-302, 1983.

Lozano, R., P. Castillo, P. Garcia, and A. Dzul, “Robust prediction-based control for
unstable delay systems: Application to the yaw control of a mini-helicopter”,
Automatica, vol. 40, pp. 603-612, 2004.

Luenberger, D.G., “Observers for multivariable systems”, IEEE Trans. Autom.


Control, 11, pp. 190-197, 1966.

Luenberger, D.G., Introduction to Dynamic Systems: Theory, Models, and


Applications, N.Y.: Willey, 1979.

Maciejowski, L.M., Multivariable Feedback Design, Addison-Wesley, 1989.

Mahmoud, M.S., Robust control and filtering for time-delay systems, NY: Marcel
Dekker, 2000.

198
Malek-Zavarei, M. and M. Jamshidi, Time-delay systems: analysis, optimization and
applications, (Systems and Control Series, 9), North Holland: Amsterdam, 1987.

Martenson, Κ., “On the matrix Riccati equation”, Informat. Sci., 3, pp. 17-50, 1971.

Martin, J.M., “State space measures of robustness of pole locations for structured and
unstructured perturbations”, Systems and Control Letters, 16, pp. 423-433, 1991.

Martinet, P., C. Thibaud, B. Thuilot and J. Gallice, «Robust controller synthesis in


automatic guided vehicles applications », Internal Report, Laboratoire des Sciences et
Materiaux pour l’Electronique et d’Automatique, Universite Blaise Pascal de
Clermont-Ferrand, France, 1998.

Medanic, J., “Geometric Properties and Invariant Manifolds of the Riccati Equation”,
IEEE Trans. Autom. Control, 27, pp. 670-676, 1982.

Medanic, J., H.S. Tharp and W.R Perkins, “Pole Placement by Performance Criterion
Modification”, IEEE Trans. Autom. Control, 33, pp. 469-472, 1988.

Millerioux, G., L. Rosier, G. Bloch and J. Daafouz, “Bounded state reconstruction


error for lpv systems with estimated parameters”, IEEE Trans. Autom. Control, 49,
pp. 1385-1389, 2004.

Moheimani, O.R. and I.R. Petersen, “Quadratic guaranteed cost control with robust
pole placement in a disk”, IEE Proc. – Control Theory and Applications, 143, pp. 37-
43, 1996.

Mustafa, D., “ H ∞ / LQG control via the optimal projection equations: on minimizing
the LQG cost bound”, Intern. Journal of Robust and Nonlinear Control, 1, pp.99-110,
1991.

Nesterov, Y. and A. Nemirovsky, Interior Point Polynomial Methods in Convex


Programming: Theory and Applications, PA: SIAM, 1993.

Nesterov, Y. and A. Nemirovsky, “The projective method for solving linear matrix
inequalities”, Mathematical Programming Series B, 1996.

Niculescu, S.I., E.I. Verriest, L. Dugard, and J.-M. Dion, Stability and control of time-
delay systems, London: Springer, pp. 1-71, 1998.

Niculescu, S.I., Delay effects on stability, London: Springer Verlag, 2001.

Okamoto, A., J. J. Feeley, D. B. Edwards and R. W. Wall, “Robust control of a


platoon of underwater autonomus vehicles”, Oceans ’04, MTS/IEEE TECHNO-
OCEAN ’04, Nov. 2004, pp. 505-510.

O’Reilly, J., Observers for linear systems, N.Y.: Academic Press, 1983.

199
Petersen, I.R., “A Riccati equation approach to the design of stabilizing controllers
and observers for a class of uncertain linear systems”, IEEE Trans. Autom. Control,
30, pp. 904-907, 1985.

Petersen, I.R. and C.V. Hollot, “A Riccati equation approach to stabilization of


uncertain linear systems”, Automatica, 22, pp. 397-411, 1986.

Petersen, I.R., “A stabilization algorithm for a class of uncertain linear systems”,


Systems and Control Letters, 8, pp. 351-356, 1987.

Richard, J.-P., “Time-delay systems: an overview of some recent advances and open
problems”, Automatica, 39, pp. 1667-1694, 2003.

Safonov, M.G. and M. Athans, “Gain and phase margins of multiloop LQG
regulators”, IEEE Transactions on Automatic Control, 22, pp. 173-179, 1977.

Saif, M., “Optimal linear regulator pole placement by weight selection”, International
Journal of Control, 50, pp. 399-414, 1989.

Sampei, M., T. Mita and M. Nakamichi, “An algebraic approach to H ∞ output


feedback control problems”, Systems and Control Letters, 14, pp.13-24, 1990.

Scherer, C., P. Gahinet and M. Chilali, “Multi-objective Output Feedback Control via
LMI Optimization”, IEEE Trans. Automatic Control, 42, pp. 896-910, 1997.

Schmitendorf, W.E., “Designing Stabilizing Controllers for Uncertain Systems Using


the Riccati Equation Approach”, IEEE Transactions on Automatic Control, 33, pp.
376-379, 1988.

Shamma, J.S. and Kuang-Yang Tu, “Set-valued observers and optimal disturbance
rejection”, IEEE Trans. Autom. Control, 44, pp. 253-264, 1999.

Shieh, L.S., H.M. Dib and B.C. McInnis, “Linear quadratic regulators with eigenvalue
placement in a vertical strip”, IEEE Trans. Autom. Control, 31, pp. 241-243, 1986.

Stein, G., “Generalized quadratic weights for asymptotic regulator properties”, IEEE
Trans. Autom. Control, 24, pp. 559-566, 1979.

Vanderberghe, L. and S. Boyd, “Primal-dual potential reduction method for problems


involving matrix inequalities”, Mathematical Programming Series B, vol. 69, pp. 205-
236, 1995.

Vidyasagar, M., Nonlinear systems analysis, NY Prentice – Hall, 1978.

Vidyasagar, M., Control system synthesis: a factorization approach, MA: MIT Press,
1985.

Winkler, A. and I.J. Wood, “Multistep guaranteed cost control of linear systems with
uncertain parameters”, A.I.A.A. Journal of Guidance and Control, 18, pp. 449-456,
1979.

200
Wittenmark, B., R.J. Evans and Y.C. Soh, “Constrained pole-placement using
transformation and LQ-design”, Automatica, 23, pp. 767-769, 1987.

Yeung, K.S. and S.S. Wang, “A simple proof of Kharitonov’s theorem”, IEEE Trans.
Autom. Control, 32, pp. 577-579, 1987.

Zames, G., “On the input – output stability of time varying non linear feedback
systems, part I: condition derived using concepts of loop gain, conicity and
positivity”, IEEE Trans. Autom. Control, 11, pp. 228-238, 1966.

Zames, G. “Feedback and optimal sensitivity: model reference transformations


multiplicative seminorms and approximate inverses”, IEEE Trans. Autom. Control,
26, pp. 301-320, 1981.

Zames, G. “Feedback minimax sensitivity and optimal robustness”, IEEE Trans.


Autom. Control, 28, pp. 585-601, 1983.

Zhou, K. and P.P. Khargonekar, “Robust stabilization of linear systems with norm
bounded time varying uncertainty”, Systems and Control Letters, 10, pp. 17-20, 1988.

Zhou, K., J.C. Doyle and K. Glover, Robust and Optimal Control, NY Prentice –
Hall, 1996.

Zhou, K., K. Glover, B. Bodenheimer and J. Doyle, “Mixed h2 / h∞ performance


objectives part i: Robust performance analysis, part ii: Optimal control”, IEEE Trans.
Automatic Control, 39, pp. 1564-1587, 1994.

Κατάλογος εννοιών

Α
Αβεβαιότητα
Αεροδιαστηµικά συστήµατα
Αθροιστική αβεβαιότητα
Αλγόριθµος
επαναληπτικός
εσωτερικού σηµείου
Αντικειµενική συνάρτηση
Ανιχνεύσιµο σύστηµα
Απόρριψη διαταρραχής
Αφφινική συνάρτηση

201
Β
Βάρη, πίνακας βαρών
Βελτιστοποίηση
Bezout ταυτότητα
Bode διάγραµµα

Γ
Γραµµική ανισότητα πινάκων (LMI)
Γραµµικό τετραγωνικό γκαουσιανό (LQG) πρόβληµα
Γραµµικός ρητός µετασχηµατισµός (LFT)
Γραµµικός τετραγωνικός ρυθµιστής (LQR)


∆οµηµένη αβεβαιότητα
∆υναµικός προγραµµατισµός

Ε
Εγγυηµένο κόστος
Εκτιµητής
Ελέγξιµο σύστηµα
Ευαισθησία
συνάρτηση
πίνακας
Ευρωστία
Εύρωστη ευστάθεια
Εύρωστες επιδόσεις
Ευστάθεια
ασυµπτωτική
βαθµός
εσωτερική
σχετική
περιθώρια
Εφικτότητα
Εφικτή λύση

Η
Hamiltonian πίνακας
H – infinity
έλεγχος
νόρµα
H–2
έλεγχος
νόρµα

Θ
Θεωρία
Θόρυβος

202
Ι
Ιδιοτιµές

Κ
Kalman
ταυτότητα
ανισότητα
Κυρτός προγραµµατισµός

Λ
Lyapunov
εξίσωση
συνάρτηση

Μ
Μαθηµατικό πρότυπο
MATLAB®
Μετασχηµατισµός
γραµµικός ρητός (LFT)
Μικρού κέρδους, θεώρηµα
Μοντέλο

Ν
Νόρµα

Π
Παίγνια
διαφορικά
θεωρία
Παραµετροποίηση
Παρατηρητής κατάστασης
Parseval θεώρηµα
Περιθώριο
ενίσχυσης
φάσης
Πολλαπλά µοντέλα
Πολλαπλασιαστική αβεβαιότητα
Προσδοκία

Ρ
Riccati
αλγεβρική εξίσωση
γενικευµένη εξίσωση
επίλυση

203
Σ
Σταθεροποιήσιµο σύστηµα
Στοχαστικός έλεγχος
Συµπληρωµατική ευαισθησία
Συνάρτηση µεταφοράς
Συσχέτισης, πίνακας
Σχεδιασµός

Τ
Τετραγωνική µορφή
Τετραγωνικό κριτήριο

Φ
Φάσµα
Φίλτρο
Φράγµα
γραµµικό
τετραγωνικό

204

You might also like