You are on page 1of 82

Lezione 1

• SISTEMA: qualsiasi oggetto di studio che pur essendo costituito da diversi elementi, reciprocamente interconnessi e interagenti
tra loro e con l’ambiente esterno, reagisce agli stimoli esterni come un tutto.

ï\ï\ï
=

>
-
-
Il sistema è considerato come un blocco in cui arrivano degli stimoli esterni (u) ed escono le grandezze misurate all’interno del sistema
(y).

• SISTEMA DINAMICO: è un sistema che reagisce agli stimoli esterni evolvendo nel tempo.
In questo caso u e y sono funzioni del tempo, ovvero u(t) e y(t).

La descrizione di un sistema dinamico può essere fatta attraverso una selezione dei suoi ATTRIBUTI che colgono gli aspetti di
interesse dell’evoluzione del sistema. Gli attributi possono essere rappresentati in forma astratta, come funzione del TEMPO (continuo
o discreto), dove:
• Il tempo continuo è il tempo analogico, ovvero é una variabile reale TER >
-

• Il tempo discreto sono le misure che intervengono ad ogni intervallo di tempo. R EZ >
-

Gli attributi che rimangono fissi nel tempo sono detti PARAMETRI DEL SISTEMA, ovvero valori numerici costanti secondo la scala
temporale.
Gli attributi, invece, che descrivono il sistema e che variano nel tempo prendono il nome di VARIABILI DI STATO.
Il vettore che contiene tutti gli attributi prende il nome di STATO DEL SISTEMA ed è denotato con x() Esso è un descrittore, ovvero
.

un modello e non il sistema stesso.


Gli attributi sono organizzati in un vettore: x(n *(
=
[ ) con x(t) E

Quindi, esso è un VETTORE DI FUNZIONE, dove “n” dipende dalla complessità, ovvero rappresenta l’indicatore del numero di
variabili del sistema.

Le interazioni del sistema con l’ambiente esterno si descrivono tramite due funzioni:
• INGRESSI DEL SISTEMA: è il vettore degli stimoli al sistema che provengono volontariamente o involontariamente dall’
ambiente esterno. Tali stimoli sono rappresentati da funzioni del tempo.
Sono indicati tramite u() , detto anche “vettore input”.

• USCITE DEL SISTEMA: è il vettore delle misure attraverso le quali il sistema viene monitorato nel tempo. Tali misure possono
riguardare attributi o combinazioni di attributi del sistema.
Si indicano con y() ,detto anche “vettore output”.

Tra le variabili descrittive c’è un rapporto causa (variabili di input) - effetto (variabili di output).
• DAL SISTEMA AL MODELLO:
Una volta codificato il sistema si crea il MODELLO.
Il modello di un sistema dinamico fornisce una rappresentazione astratta della sua dinamica e può essere dato nella forma di:
• MODELLO MATEMATICO: solitamente è un insieme di equazioni differenziali o alle differenze che spiega come evolve il
sistema in relazione a degli ingressi per avere delle uscite. È il più affidabile.
• SCHEMA A BLOCCHI FUNZIONALI: rappresentazioni di blocchi a cui sono associate funzioni logiche o matematiche, tramite
cui si rappresentano parti del sistema. È più intuitivo del precedente.
• MODELLI IN SCALA del sistema: utili per la comprensione dei comportamenti dei fenomeni e nella progettazione.

• ANALISI DEL SISTEMA E COSTRUZIONE DEL MODELLO:


1. Scelta delle variabili descrittive del sistema;
2. Definizione del rapporto di interdipendenza tra gli attributi e delle relazioni causa-effetto;
3. Generazione del modello matematico attraverso:
• Leggi costitutive, ovvero le relazioni tra le variabili;
• Leggi presunte, ovvero si tratta di analizzare il modello attraverso la sua capacità produttiva;
• Analisi dei dati storici disponibili;
4. Identificazione dei parametri del modello a partire dai dati storici;
5. Generazione delle soluzioni del modello mediante ANALISI o SIMULAZIONE, svolgendo il sistema di equazioni;
6. Validazione del modello matematico, ovvero capire se il modello creato é buono/utile.

Tra i possibili USI del modello troviamo:


• Studio delle proprietà strutturali del sistema (controllabilità, osservabilità, stabilità), che sono caratteristiche indipendenti dal valore
dei parametri
• Studio delle relazioni strutturali tra parametri e soluzioni (biforcazione: valore limite del parametro tra un comportamento e un altro;
chaos: il sistema si comporta un modo non periodico)
• Esplorazione di scenari attraverso predizione di comportamenti in risposta a stimoli esterni (what if)
• Studio della possibilità di modificare il comportamento dinamico del sistema attraverso forza enti esterni (controllo) o variazioni dei
suoi parametri, per ottenere un comportamento desiderato.

• MODELLI INGRESSO-STATO-USCITA
Sono modelli matematici che descrivono l’evoluzione di tutte le grandezze che caratterizzano il sistema.
In particolare, dall’ingresso allo stato e infine all’uscita.
Abbiamo:
• Il vettore degli ingressi: , rappresenta l’insieme degli stimoli esterni impressi al sistema, cioè le cause esterne della dinamica;
• Il vettore delle evoluzioni di tutte le variabili di stato selezionate:
• Il vettore delle evoluzioni delle uscite misurate dal sistema:

• MODELLI INGRESSO-USCITA
Sono modelli matematici che descrivono le relazioni tra le sole variabili di ingresso e quelle di uscita , tralasciando le variabili
interne del sistema, ovvero non si fa riferimento ai descrittori interni del sistema.

In termini astratti, indichiamo con U l’insieme di tutte le possibili funzioni di ingresso e con Y l’insieme di tutte le possibili funzioni di
uscita del sistema, e allora possiamo pensare i modelli come una applicazione tra questi due spazi di funzioni.

Quindi:
Nei modelli i-s-u, a partire dagli ingressi che stimolano il sistema, si avrà un’evoluzione delle variabili di stato che porterà ad una
determinata evoluzione delle uscite. Cioè, si introduce la mediazione delle variabili stato tra quelle di ingresso e quelle di uscita.
Invece, nei modelli i-u, si associano direttamente alle funzioni di ingresso quelle di uscita.
• DAI MODELLI AL SISTEMA
Un singolo modello può interpretare diverse realtà, ovvero uno stesso insieme di equazioni può rappresentare diversi sistemi dinamici
semplicemente attraverso una diversa interpretazione delle variabili e dei parametri.
Questo significa che, a livello matematico, lo studio elementare dei sistemi dinamici coincide con:
• La teoria delle equazioni differenziali per i sistemi che evolvono nel tempo continuo;
• La teoria delle equazioni alle differenze finire per i sistemi che evolvono nel tempo discreto.
che sono le forme comuni in cui si presentano i modelli dei sistemi dinamici.

ESEMPI DI DINAMICHE A TEMPO DISCRETO:


1. CRESCITA GEOMETRICA o MODELLO GEOMETRICO
È un modello che può rappresentare diversi sistemi, ad esempio la crescita di un capitale depositato in banca con un certo tasso di
interesse.
Vi è una sola variabile, non input e output.
Pertanto, il sistema discreto é:
dove: è il vettore di stato
è il parametro tramite cui si descrive nell’istante futuro discreto

Non si ha nè una decrescita nè una crescita, il sistema è in equilibrio: l’istante di tempo successivo è uguale a quello precedente o nel
caso del capitale, esso non cambia.

Si verifica una crescita esponenziale, dove è detto “growth rate”

Si verifica una decrescita, cioè una contrazione fino a diventare zero.

Ad esempio:

Quindi: se è il capitale, è il tasso di interesse +1, x1 è il valore del capitale incrementato.

Se esso può essere un deposito o un prelievo dal capitale, e avremmo:

Questo modello, inoltre, può rappresentare anche la dinamica di una popolazione, ipotizzando che tra k e k+1 non ci siano decessi e che
sia il tasso di natalità, però risulta un modello troppo semplice per tale sistema.

2. MODELLO DEMOGRAFICO A COORTI


È un modello che mi consente di dividere la popolazione per fasce di età (coorti).
Si rappresenta così: che è l’indice rappresentante le fasce di età
dove: è il tasso di sopravvivenza nella coorte i

L’evoluzione della coorte dei nuovi nati evolve


dove: è il tasso di procreazione della coorte i.

Questo è un esempio di sistema multivariabile.


ESEMPI DI DINAMICHE A TEMPO CONTINUO:

1. CRESCITA ESPONENZIALE
La derivata di x, cioè la sua variazione, è proporzionale a x secondo un fattore :
• se è positivo, x cresce
• se è negativi, x decresce
è un’equazione differenziale e se si fa il rapporto incrementale per un finito, avrò:

Lo posso pensare come k+1 e


quindi potrebbe essere
riconducibile a un modello di
tempo discreto, ma essi si
differenziano poiché in questo
caso, facendo tendere ,
si crea una continuità tra
un’istante e quello successivo.
Ma esprime lo stesso
contenuto informativo del
modello geometrico.

2. LEGGE DI NEWTON
Dove:
M rappresenta la massa di un grave che si può muovere senza attrito su una retta ed è soggetti a una forza esterna variabile nel tempo
Lezione 2
• FORMA IMPLICITA ED ESPLICITA DEL MODELLO
Il modello matematico del sistema, che molto spesso si rappresenta sotto forma di un sistema di equazioni (differenziali o alle
differenze), rappresenta la FORMA IMPLICITA.
La soluzione di queste equazioni del sistema fornisce, invece, la FORMA ESPLICITA del modello. Quest’ultima esprime ,
ovvero l’evoluzione dello stato, degli attributi, delle uscite del sistema a seguito dei forzamenti esterni. Al contrario, la forma implicita
esprime solo qual è la variazione dello stato del sistema rispetto a quello attuale, che ovviamente è diverso dalla conoscenza di
come varia la x nel tempo.
Inoltre, “risolvere il modello” significa passare dalla forma implicita a quella esplicita.

Per i sistemi dinamici descrivibili attraverso un modello lineare è sempre possibile avere l’espressione analitica della forma esplicita,
che è essenziale per perseguire le fasi e gli scopro dell’analisi dei sistemi. Invece, per il caso non lineare non esistono procedure
standard per il calcolo della soluzione esplicita.
N.B.: un sistema lineare è un sistema costituito da equazioni di primo grado in più incognite.

ESEMPIO DI MODELLO LINEARE A TEMPO DISCRETO

• SEQUENZA DI FIBONACCI: ogni numero è la somma dei due precedenti.

Chiamo il numero prodotto, il modello sarà:


Esso rappresenta la forma implicita, infatti non so che numero è ma so come si forma.

ESEMPIO DI SISTEMA DINAMICO NON LINEARE

• MODELLO PREDA-PREDATORE DI VOLTERRA:


Si ipotizzi un sistema pari ad un’isola con sole due persone, prede e predatori. L’habitat è influenzato dalla presenza di entrambe le
parti, in quanto le prede crescerebbero, in assenza di predatori, fino a saturazione delle risorse a disposizione sul territorio. Si ipotizzi
che le prede crescano illimitatamente.

Il modello è così rappresentato:

Dove:
x1= la numerosità delle prede;
x2 = la numerosità dei predatori;
x1(t) = l’evoluzione della numerosità delle prede
x2(t) = l’evoluzione della numerosità dei predatori

La derivata rappresenta una variazione, infatti:


L’equazione 1 rappresenta la variazione della numerosità delle prede che dipende da due fattori:
• “a” = tasso di crescita (esponenziale), con cui vi è un rapporto proporzionale. Cioè x1, in assenza di predatori,
crescerebbe con un tasso “a”;
• “b” = tasso di cattura con il segno negativo. Cioè, in presenza di predatori, x1 risente del tasso di cattura “b”.
L’equazione 2 rappresenta la variazione della numerosità dei predatori che dipende da due fattori:
• “c” = tasso di crescita con il segno negativo. Cioè, x2 decadrebbe con un tasso pari a “c” in assenza di prede, poiché
essi traggono cibo per il sostentamento solamente dalle azioni di caccia;
• “d” = tasso di cattura con il segno positivo. Cioè, x2 aumenta in presenza di prede.

Il prodotto x1x2 rappresenta la misura della probabilità di incontro tra prede e predatori ed i coefficienti “b” e “d” ne
rappresentano gli effetti sulla loro dinamica. Aumenta all’aumentare di x1 e x2.

Questo è un modello non lineare proprio per la presenza del prodotto x1x2.

Ricapitolando:
x1 e x2, che sono le consistenze di prede e predatori, rappresentano le variabili che descrivono lo stato del sistema (il
quale non interagisce con l’esterno, infatti non vi sono ingresso);
“a”, “b”, “c”, “d” rappresentano i parametri, ovvero i valori specifici che si adattano a ogni tipo di animale.
Inoltre, x1 e x2 devono essere diversi da 0.
Altrimenti se:
Cioè la numerosità delle prede cresce all’infinito

Cioè la numerosità dei predatori tende a 0

Fissato un valore di tempo t, l’equilibrio si raggiunge quando:


• si estinguono tutti i predatori e tutte le prede;
• si verifica un comportamento periodico con aumento e decrescita di x1 e x2 nel tempo.

• SISTEMI A STATO VETTORE


Def : Si definiscono sistemi a stato vettore quei sistemi in cui gli ingressi, gli stati e le uscite del relativo modello possono essere assunte
come variabili in R.
In particolare, assumiamo che:
• Lo stato del sistema è un vettore n-dimensionale , cioè caratterizzato da n componenti (vettore delle variabili di stato);
• Il vettore degli ingressi sia m-dimensionale (Vettore variabili di ingresso):
• Il vettore delle uscite sia p-dimensionale (Vettore variabili di uscita).

• FORMA GENERALE DI UN MODELLO IMPLICITO i-s-u


Le equazioni che descrivono un sistema a stato vettore si possono scrivere, in forma generica:

A TEMPO DISCRETO: f è un vettore di funzioni poiché x è un vettore.


Tale equazione esprime la transizione di stato.
Essa rappresenta il valore della variabile di stato all’istante successivo e dipende da k (istante precedente), dallo stato all’istante
precedente e dall’ingresso all’istante precedente. Quindi, questa equazione mi permette di passare dallo stato precedente x(k) a
quello successivo x(k+1) e per farlo mi serve, infatti, conoscere l’ingresso applicato e l’istante in cui lo abbiamo applicato.

La trasformazione di uscita dipende, invece, solo dallo stato x(k) e dall’istante di tempo k considerato. Quindi la variazione di
stato condiziona l’uscita.

A TEMPO CONTINUO: Transizione di stato

Trasformazione di uscita, collega l’uscita con lo stato.

Come prima, la prima dipende dall’istante di tempo precedente, dall’ingresso all’istante di tempo precedente e dallo stato all’istante
di tempo precedente; mentre, la seconda solo dall’istante di tempo precedente e dallo stato.

Il numero di variabili di stato “n” prende il nome di ORDINE DEL SISTEMA.

• FORMA GENERALE DI UN MODELLO IMPLICITO LINEARE i-s-u


Le equazioni dinamiche i-s-u che descrivono un sistema lineare e tempo variante, con m ingressi, n variabili di stato e o uscite (cioè
un modello Multi Input Multi Output MIMO), in forma generica, si possono scrivere:

A TEMPO DISCRETO: Transizione di stato

È una combinazione lineare di x all’istante precedente e di u all’istante precedente.

Trasformazione di uscita

È una combinazione lineare di x.


Se A, B, C fossero delle matrici indipendenti dal tempo, il modello non sarebbe solo lineare ma anche stazionario o tempo invariante
(LTI), cioè i coefficienti della combinazione lineare sono sempre gli stessi:

Essendo le dimensioni:

per far sì che sia rispettata la regola del prodotto matriciale, le dimensioni di A, B, C devono essere:
Infatti essi non sono scalari ma matrici.
Nel caso di un solo ingresso, B collassa in un vettore nx1; mentre, nel caso di una sola uscita, C collassa in un vettore 1xn.

Siccome, in generale, p e m sono minori di n, A è un matrice quadrata, B è una matrice rettangolare con base minore e C è una matrice
rettangolare con base maggiore.

A TEMPO CONTINUO: Transizione di stato


Trasformazione di uscita

• FORMA GENERALE DI UN MODELLO IMPLICITO i-u


Le equazioni dinamiche i-u che descrivono un sistema con m ingressi e o uscite, in forma generica, si possono scrivere:

A TEMPO DISCRETO:
La y dipende dagli istanti precedenti a (k+n), partendo da k+n-1 fino ad arrivare a k. Cioè, tiene conto della storia degli ingressi e delle
uscite precedenti.

A TEMPO CONTINUO:
È una sequenza di ordini di derivata, dove la derivata n-esima di y è funzione di y e u e delle loro derivate.
Infatti, l’apice indica l’ordine di derivazione.
Y compare all’istante k+n, invece u compare all’istante k+n-1: questo ha a che fare con la casualità del sistema, ovvero l’uscita non può
dipendere direttamente dall’ingresso in quel momento, ma solo negli istanti precedenti.
L’ordine massimo di derivazione “n” prende il nome di ORDINE DEL SISTEMA, ovvero la massima differenza tra gli istanti di
tempo considerati.

• FORMA GENERALE DI UN MODELLO IMPLICITO LINEARE i-u


Le equazioni dinamiche i-u che descrivono un sistema lineare con un ingresso e un’uscita (modello Single Input Single Output SISO),
in forma generica, si possono scrivere:

A TEMPO DISCRETO:
Dove y è una combinazione lineare delle y e u precedenti.

A TEMPO CONTINUO:

Quindi, ricapitolando, nei modelli i-s-u l’ordine del sistema è il numero delle variabili di stato, mentre modelli i-u l’ordine del sistema
è l’ordine di derivata (in tempo continuo) e k+n (in tempo discreto).
• CENNI SULLA SOLUZIONE ANALITICA DI EQUAZIONI ALLE DIFFERENZE FINITE
Def: la soluzione di un’equazione è il valore dell’incognita che, se sostituito nell’equazione, fa sì che il primo è il secondo membro
siano uguali, rendendo l’equazione un’identità.

Def: la soluzione di un’equazione alle differenze è la funzione (non il valore) che, se sostituita nell’equazione differenziale, fa sì che
essa diventi un’identità.

Def: Una famiglia di funzioni dipendente da un certo numero di parametri si dice “soluzione generale” se contiene tutte le soluzioni
dell’equazione differenziale. Invece, chiamiamo “soluzione particolare”, di un’equazione differenziale, un singolo elemento scelto
nella soluzione generale; in altri termini, una soluzione particolare è una soluzione dell’equazione che non dipende da parametri.

Data l’equazione omogenea, ovvero con termine noto u=0 (detto forzamento):
vale il teorema di esistenza e unicità che stabilisce che per una qualunque funzione definita su ogni finito o infinito, in
corrispondenza di ciascun insieme di condizioni iniziali
esiste ed è unica la soluzione dell’equazione per ogni
N.B. Tale teorema stabilisce l’esistenza della soluzione analitica, ma non fornisce indicazioni su come trovarla.

Un’equazione alle differenze lineare di ordine n (avrò bisogno di n condizioni iniziali) ha la seguente forma:
, è combinazione lineare delle y
dove il termine g(k), che compare al secondo membro, è un termine noto e prende il nome di forzamento.
Quando g(k) = 0 per ogni k, l’equazione diventa omogenea. Per risolvere l’equazione è, pertanto, necessario passare alla (2).

La proprietà di linearità ci consente di caratterizzare l’espressione analitica della soluzione dell’equazione alle differenze (cosa non
possibile per il caso non lineare).
Data la (1), è possibile ricercare la soluzione analitica tramite l’equazione
che prende il nome di equazione omogenea associata alla (1).
Vale un teorema secondo cui, se è soluzione particolare della (1), allora l’insieme di tutte le sue soluzioni è dato da:
dove z(k) è soluzione dell’omogenea associata alla (1).
Si ottiene così una molteplicità di soluzioni che possono essere particolarizzate tramite le condizioni iniziali.
Quindi, fissando le condizioni iniziali
come stabilito dal teorema di esistenza e unicità, si ottiene un’unica soluzione della (2).
In particolare, però, la (2) ha infinite soluzioni date dalla combinazione lineare delle generiche costanti c1,…,cm per i rispettivi zi:
.
Per semplificare, costruisco l’insieme fondamentale delle soluzioni della (2), imponendo condizioni iniziali virtuali, ed è pari a
con i = 1,…, n. Esso è ottenuto a partire da condizioni iniziali (ottenute imponendo le righe della matrice identità) che sono tutte nulle
ad eccezione della i-1 che è posta uguale a 1, cioè:
È chiamato INSIEME FONDAMENTALE DI SOLUZIONI.
Si devono generare tante soluzioni quanti sono i gradi di libertà della (2).
L’aggettivo “fondamentale” assegnato a questo insieme di soluzioni si giustifica col fatto che si può dimostrare che ogni soluzione
dell’equazione omogenea associata può ottenersi come combinazione lineare con opportuni coefficienti c1,…, cm dell’insieme
fondamentale di soluzioni. Ciò significa che sarà sempre possibile scrivere la sua soluzione come:
Pertanto, date le condizioni iniziali, la ricerca della soluzione di una equazione omogenea può ricondursi all’assegnazione dei pesi
alla combinazione lineare del sistema fondamentale di soluzioni talk da soddisfare le condizioni iniziali.

N.B. Un insieme di vettori si definiscono linearmente indipendenti se non esiste una combinazione lineare di essi che generi il vettore
nullo, dati coefficienti non nulli. Però, nel caso delle sequenze, un insieme di funzioni del tempo discreto
si dice linearmente indipendenti se non esiste una combinazione lineare di coefficienti che annulli la soluzione, ovvero:

Pertanto, l’insieme fondamentale di soluzioni (sequenze) è LINEARMENTE INDIPENDENTE, e può generare tutte le soluzioni del
sistema.

Per trovare questo sistema fondamentale di soluzioni, bisogna partire dall’equazione omogenea lineare a coefficienti costanti

a cui è associato il seguente polinomio caratteristico


Si trovano, poi, gli zeri del polinomio, ovvero impongo e vedo per quali valori di il polinomio è nullo.
Si assuma, inoltre, che il polinomio abbia n radice distinte e reali, indicate con . Si dimostra che le sequenze
costituiscono un insieme fondamentale di soluzioni:
(la soluzione si può scrivere in questa forma)
(significa che è soluzione del polinomio)
Inoltre, se impongo le condizioni iniziali, trovo un sistema di equazioni che definisce il valore dei coefficienti .
Le soluzioni particolari, quindi, sono le sequenze di .
ESEMPIO
-

2(k + 1)y(k + 1) -

Ky(k) =
1

E' un'Eq di .
Igrado - 1 condizione iniziale

j(k) = 1 VK -
è' una soluzione particolare poiché (K+ 1) 1-K 1 .
= 1 -D 1= 1 e infatti non dipende do parametei

Passo all'omogenea annoiata : (K+ 1(y(k + 1) -Hy/k) = 0 l'un'eglineare a coeff variabili nel tempo
. , quindi non el semplice da risolvere !

E(K) =
All dove A si ricava dalle c 1 . .

La soluzione e :
y(k) =
1+ Alk

27(k+ 2) -

27(k + 1) + 7(k) =
0

scrivo il polinomio adcenar associator :


p(x) = ( -
2) + 1 =
16 - 112

trovo le radici : (6-14 = 0

L = > X= 2

Essendo che le radici non sono distinte mar coincidono non si può applicare il teorema
.

NB : Su Matlab per Esprimere la ricorsività del calcolo ,


si usa il ciclo FOR
.
Equazione lineare tempo variante poiché i
coefficienti dipendono dal tempo.
• EQUAZIONI DIFFERENZIALI
Un’equazione differenziale lineare ha la seguente forma:
Anche in questo caso vale un teorema di esistenza e unicità della soluzione dell’equazione (3), assegnate le condizioni iniziali e il
forzamento esterno. In particolare, per il caso lineare, se i coefficienti e il termine di forzamento sono funzioni continue per
allora esiste un’unica soluzione della (3) che soddisfa un set di assegnate condizioni iniziali:
Se è una soluzione particolare dell’equazione (3), allora le soluzioni della stessa equazione le posso scrivere come ,
dove z(t) è una delle infinite soluzioni dell’equazione omogenea associata
in corrispondenza delle condizioni iniziali a cui può essere sottoposta.
Anche in questo caso combinazioni lineare arbitrarie di soluzioni dell’omogenea associata sono anch’esse soluzioni.

Si costruisce l’insieme fondamentale di soluzioni che può essere ottenuto a partire da condizioni iniziali nulle, tranne
che quella (i-1) dove la derivata è posta uguale ad 1, cioè: .
L’espressione dell’omogenea associata potrà porsi nella forma: .
L’insieme fondamentale di soluzioni è dunque un generatore, per combinazioni lineari, di tutte le soluzioni di un’equazione omogenea
lineare corrispondenti a differenti condizioni iniziali. Ancora una volta, ogni insieme di n soluzioni della (4), linearmente indipendenti tra
loro, può agire come sistema fondamentale di soluzioni.

Consideriamo l’equazione differenziale omogenea a coefficienti costanti


Associamo ad essa il suo polinomio caratteristico
Assumiamo che esso abbia n radici distinte, indicate con , allora si può dimostrare che le sequenze
costituiscono un insieme fondamentale di soluzioni.

N.B. Un’equazione differenziale di ordine n si può rendere equivalente a un sistema di n equazioni differenziali di ordine 1 e
viceversa.

+ Lezione 3: richiami di algebra lineare


• FORMA ESPLICITA DI UN SISTEMA DINAMICO Lezione 4
I sistemi dinamici, descritti da sistemi di equazioni differenziali o da equazioni alle differenze finite,
lineari e stazionari, sono sistemi LTI.
La forma esplicita di un sistema dinamico, a tempo discreto e casuale, è:

X(k + 1) = f(k X(k) ,


, u(k)) con u(K) NoTO

X(ko) Xo
g(k
=

y(k) =
, X(k))

Rappresenta la soluzione di un sistema di equazioni alle differenze di ordine n e, dunque, sarà dipendente dal tempo K , dall’istante
iniziale Ko , dalle condizioni iniziali X(ko) e dalla sequenza degli ingressi UTko k) , cioè X(k) Y (k Ko X(Ko) UTko k) = , , ,
,
,

d y(k) g(k X(k) =


,

Non dipende da k+1 perché, se così non


fosse, il sistema sarebbe anticipativo, ma i
sistemi che noi consideriamo sono casuali,
ovvero la causa precede l’effetto.

Un SISTEMA DINAMICO LINEARE E TEMPO INVARIANTE (LTI) presenta la seguente forma:

MODELLO MULTI INPUT MULTI OUTPUT (MIMO) MODELLO SINGLE INPUT SINGLE OUTPUT (SISO)
n variabili di stato, m ingressi e p uscite : n variabili di stato, 1 ingresso, 1 uscita :

A TEMPO DISCRETO: -
A TEMPO DISCRETO:
X(k+ 1)
Preced
Istante
Ax(k) + bu(k)
ISTANTE SUCCESSIVO

X(k+ )
=

(1) = Ax(k) + Bu(k)


y(k) =
cix(k)
X1(k+ 1) Ass dir Xe(k) bi ben U , (k)

I
...

...

i : : i
·
Xn(k + 1) An bne bnn Un(k)
...
Ann Xn(t) ...

- A TEMPO CONTINUO:
nxn

x(t) =
Ax(t) + bult) Nell
-
&
(2) y(k) (x(k) =
be RUx
I

y(t) = cx(t) 1xn

de Cen XICK)
Invece di scrivere l’espressione matriciale ce IR
Y , (k) ...

sarebbe possibile scrivere tante scalari, ma la


y/K ·.... Cpn
p
i
Xn(k)
forma matriciale serve per studiare l’evoluzione
del sistema al variare delle proprietà delle matrici
stesse.

- A TEMPO CONTINUO:
X(t) =
Ax(t) + Bult) faxn
/EM Matrice dinamica
nxM
BEIR Matrice di ingresso
y(t) =
(x(t)
CEIRPXN Matrice di uscita

Riferendomi al caso del tempo discreto, i termini delle due equazioni rappresentano:
• x(k) è lo stato del sistema al tempo k X(k)ER -

• u(k) è l’ingresso del sistema al tempo k 4(k)EIRM >


-

• y(k) è l’uscita del sistema al tempo k y(k)EIRP >


-

• A è la matrice dinamica
• B la matrice di ingresso
• C la matrice di uscita
Le matrici sono costanti al variare di k, cioè sono invarianti nel tempo.
Quindi, è un sistema ingresso-stato-uscita.

La prima equazione è dinamica e lineare, poiché x(k+1) è combinazione lineare dei termini al secondo membro, mentre la
seconda equazione è un collegamento istantaneo (e non dinamico) tra lo stato del sistema e l’uscita. Anche essa è lineare ma
particolare essendo: X(k) - 1RY U(k)ERN y(k) > IRP , ,
-

con m < n, cioè ho meno ingressi.


Il sistema può essere così rappresentato:
u(k) y(k)
A, B C ,
Ko = 0
4
Esso è tempo invariante poiché il tempo è stato discretizzato ed è per questo che compare la k. Infatti, a tempo continuo
compare la t.
(Per simulare un sistema a tempo continuo, esso viene discretizzato e viene trattato come un sistema a tempo discreto in cui le
variazioni di tempo sono piccolissime).
Inoltre, la (1) è un’equazione ricorsiva poiché mi consente, partendo dallo stato corrente, di ottenere quelli successivi. È data
dalla combinazione lineare dello stato all’ingresso precedente + combinazione lineare degli ingressi.
La forma esplicita di questi sistemi si calcola in maniera analitica dopo aver assegnato le condizioni iniziali sulle variabili di
stato e la sequenza dei forzamenti .
Quindi, a partire dallo stato iniziale x(k0) è possibile determinare ricorsivamente la soluzione (unica) del sistema dinamico:
questo significa determinare la sua EVOLUZIONE NEL TEMPO, cioè studiare la sua dinamica. Essendo il sistema LTI, è
possibile fissare l’istante iniziale , cioè come origine dell’asse dei tempi.

Se ho:

per capire come evolve nel tempo, si possono verificare 3 problemi:


1) DIRETTO: conosco le u, voglio le y. Esso è anche detto “di gestione” poiché sulla base di uno scostamento I’m uscita
modifico l’ingresso;
2) INVERSO: conosco le y, voglio sapere le u. È anche detto “di pianificazione” perché devo usare determinati ingressi,
avendo uno specifico obiettivo;
3) DI IDENTIFICAZIONE: grazie a dei campione storici si è a conoscenza sia degli ingressi che delle uscite, ma non dello
stato.

Problema diretto:
Dato un sistema caratterizzato dalle matrici A, B, C e data la sequenza di ingresso , bisogna determinare la
sequenza di uscita

Essendo un sistema i-s-u, per determinare la sequenza di uscita è necessario determinare la sequenza dello stato .
Quindi, la vera dinamica è la (1), mentre la (2) è un’equazione statica seppur vari nel tempo, specificamente:
• La (1) è detta equazione di transizione di stato
• La (2) è detta trasformazione di uscita.

ESEMPIO:
Supponiamo che la laurea in ingegneria gestionale duri 5 anni, con la possibilità che ci siano anche dei fuoricorso.
Gli anni vengono rappresentati tramite dei contenitori:

Voglio conoscere lo stato del sistema nel tempo, ovvero il numero di alunni per ciascun anno nel tempo.
Il modello viene descritto da un vettore a 6 componenti.
Supponiamo di osservare il sistema all’istante k per poi costruire lo stato del sistema all’istante k+1 (volendolo osservare
nel tempo):

k+1 è l’anno che sto considerando per la costruzione del


modello, k è l’anno precedente perché ovviamente prima di me ci
saranno altre persone iscrittesi l’anno prima

non ho il residuo per l’ultimo anno poiché ho supposto che finisce lì


Dove:
• x1 rappresenta il numero di iscritti al primo anno nel tempo, x2 al secondo anno e così via;
• rappresenta il tasso di successo di quelli del primo anno (sono diversi ma nel tempo restano pressoché gli stessi),
cioè solo una frazione riesce a superare il primo anno, gli altri (il residuo) sono rappresentati da ;
• w(k+1) rappresenta gli iscritti al primo anno all’istante k+1, ovvero l’ingresso corrisponde a u(k).

Tutte queste equazioni mi rappresentano un sistema dinamico


Se voglio sapere il numero di laureati:

Se supponiamo che nessuno più si iscriva all’università, ovvero u(k)=0, non vuol dire che non ci saranno più laureati,
essendoci gli studenti residui. Questo mi permette di capire che, anche se gli ingressi sono nulli, la dinamica del sistema
non si blocca e ci sarà ugualmente un’uscita (ma verosimilmente tale dinamica andrà a tendere a zero nel tempo poiché
gli studenti residui finiranno). Quindi, la dinamica del sistema non dipende per forza dagli ingressi, cioè della u(k).
In tal caso, per calcolare lo stato del sistema, devo conoscere lo stato all’istante zero che evidenza il numero di studenti
nel tempo in cui non se ne accettano più.
Esempio 2 - modello di obsolescenza degli smartphone:
Supponiamo di dividere gli smartphone in classi di età. All’inizio dell’anno k-esimo ci saranno x0(k) smartphone che hanno meno di
un anno, x1(k) che hanno un anno (e meno di due), …, xn(k) che hanno n anni (però nessuno avrà n+1 anni).
Indichiamo con la probabilità che uno smartphone di i anni sopravviva un altro anno e con u(k) il numero di smartphone che si
prevede saranno acquistati nell’anno k (u(k) quindi è un elemento di estensione, mentre di contrazione). Si delinea il seguente
sistema, al fine di prevedere il numero di smartphone presenti in ciascuna classe, a partire da una certa distribuzione iniziale:

La prima equazione indica gli smartphone che avranno meno di un anno sono quelli acquistati al massimo l’anno precedente; la
seconda, invece, indica che gli smartphone, all’istante k+1, che hanno tra 1 e 2 anni, sono quelli che avevano tra 0 e 1 anno l’anno
precedente, e così via.
L’ordine del sistema è dato dalle n+1 equazioni di primo ordine.

Supponiamo, quindi, di conoscere tutte le classi: di conseguenza, l’uscita del sistema coincide con lo stato
La forma matriciale avrà ha la seguente forma:

Conosco il tasso di sostituzione e gli acquisti, posso determinare la distribuzione.

Se, invece, non conoscessi tutte le classi ma solo


l’uscita sarebbe uno scalare, cioè p=1
Infatti, la matrice C sarebbe di dimensioni 1xn+1, cioè un vettore trasposto
dove
• EVOLUZIONE LIBERA DELLO STATO
Consideriamo un sistema dinamico lineare e tempo invariante, a tempo discreto:

Un sistema dinamico lineare si dice in EVOLUZIONE LIBERA in assenza di ingressi nella stessa equazione. Nel caso di un
sistema a tempo discreto, questo equivale che gli ingressi sono nulli nell’istante in cui u(k)=0 per ogni k, cioè allo stato iniziale.
L’equazione di stato diventa:

Esse rappresentano le equazioni implicite dell’evoluzione libera.


Inoltre, l’equazione (1) è anche definita omogenea poiché il termine noto è nullo.
Il sistema è di ordine 1 poiché la massima distanza tra k e k+1 è 1. Di conseguenza, ci sarà un’unica condizione iniziale, fissata e
pari a x(0).
Per trovare la soluzione, mi riconduco al problema diretto e la ottengo ricorsivamente a partire dalla condizione iniziale che ho
fissato. Quindi:

Da cui:

Dove ed è detta matrice di transizione di stato, permettendo di passare da uno stato all’altro. Essa non dipende dal
tempo iniziale ma solo dalla distribuzione tra i due tempi k.
Esse rappresentano le equazioni esplicite (ottengo delle soluzione a partire dai dati) dell’evoluzione libera.

Nel caso in cui , A è una matrice quadrata e ha dimensioni le stesse dimensioni dello stato (1x1), cioè è uno scalare (a)
, e quindi segue una crescenza geometrica:
• Se a<1 decresce all’aumentare di k e l’evoluzione libera del sistema tende a 0;
• Se a >1 cresce all’aumentare di k e il sistema reale va a infinito e si rompe.

Se la condizione iniziale fosse x(0)=0, lo stato rimarrebbe a un valore fisso e allora il sistema si dice che è in uno stato di
equilibrio.
Se, invece, la condizione iniziale fosse , avrei:

ma è ancora un’evoluzione libera poiché ho uno stato iniziale. O

• EVOLUZIONE FORZATA DELLO STATO


Un sistema dinamico si dice in EVOLUZIONE FORZATA o TOTALE se le condizioni iniziali sono nulle e il sistema dipende solo
dall’ingresso (cioè dal forzamento esterno).

Immaginiamo che lo stato del sistema sia nullo e che la dinamica evolva.
Il sistema forzato è:

con condizione iniziale:


Per trovare la soluzione della (1) si deve delineare una sequenza, che non si fa partire da perché la condizione iniziale è pari
a 0 e non si fa arrivare a perché lo stato k dipende solo dagli istanti precedenti k-1.
Prendiamo una sequenza u(k) particolare con un solo valore in 0 e gli altri nulli:

Negli istanti successivi sappiamo che l’ingresso è zero, mentre lo stato iniziale è x(1), cioè si è in uno stato di evoluzione libera e
perciò la forma è:
Prendiamo un’altra sequenza particolare che presenta un solo valore in 1:

Nasce un’evoluzione libera poiché dopo 1 non c’è nulla:


Essendo, però, garantita la linearità della sequenza, la soluzione può essere interpretata tramite il principio di sovrapposizione
degli effetti: l’evoluzione totale del sistema, in presenza di multipli ingressi, si può esprimere come la somma delle risposte ai
singoli ingressi + un termine legato alle condizioni iniziali.
Quindi:

Essa è detta SOMMA DI CONVULOZIONE e rappresenta la forma esplicita.


In definitiva, avrò:

Esse sono le “evoluzioni complessive dello stato x(k) e dell’uscita y(k)”.


Nella (2) ciascuno dei termini della sommatoria è legato all’effetto di un ingresso u(k) con k=1, …, n-1.
L’evoluzione di uscita si ottiene pre-moltiplicando l’evoluzione di stato per la matrice C.

• INGRESSO IMPULSIVO o IMPULSO DI KRONECKER

Detto anche IMPULSO, è un ingresso u(k) scalare

Supponiamo di essere in evoluzione forzata (condizioni nulle):

Che è la RISPOSTA ALL’IMPULSO.

Questo ingresso ha la funzione di modificare lo stato del sistema, innescando un processo dinamico.
La sommatoria degli ingressi può essere vista come la somma di più impulsi, ed essa prende il nome di somma di convolzione.
La risposta di un sistema dinamico tempo invariante ad una sequenza arbitraria di ingressi si può ottenere a partire dalla
risposta dell’impulso.
Lezione 5
• SISTEMA DINAMICO LINEARE E TEMPO INVARIANTE A TEMPO CONTINUO
Consideriamo un sistema dinamico lineare e tempo invariante a tempo continuo:
(2X(t) Ax(t) + Bult)
(y(t)
=

=
(x(t)
In assenza di ingresso u(t)=0, l’equazione di stato diventa:

Fissiamo la condizione iniziale x(0), la cui soluzione sarà: XH=AX i x


che può essere riscritta in un modo più semplice, andando a sostituire al posto della sommatoria l’espansione dell’
esponenziale, nel seguente modo: x(H e (2) =
x(0)
Infatti, la funzione esponenziale matriciale, in analogia con l’espansione in serie di McLaurin della funzione esponenziale
*
scalare, si definisce come: e +
Att =

# = ...

A
In MATRICE IDENTITA
At DI ORDINE N

E dove e =
(t) è detta matrice di transizione.

*5
Inoltre, sapendo che:
d = x(0)
den = Ae X(0) = Ax) (Cioè ho verificato la soluzione),

si dimostra che la (2) è l’evoluzione libera del sistema (1) per sostituzione.

(t -A(t 5) Bu(Y)
-

L’evoluzione forzata del sistema sarà: x(t) = d


che è un integrale di convoluzione.

Per ottenere l’evoluzione totale devo applicare il principio di sovrapposizione degli effetti (somma evoluzione libera e
-
evoluzione forzata): -Alt E'Bu(t) dY
*

)
-

x(t) =
e x0 +

• DIAGONALIZZAZIONE DI UN SISTEMA

Si consideri un sistema LTI a tempo discreto in evoluzione libera: X(k+ 1) Ax(k) =

Si supponga che ri sia un autovettore (destro) della matrice A associato all’autovalore di : Aritivi i ...
↳ AERUxN
Scegliendo come condizione iniziale X(0) Lv si avrà: =

=> X(1) = Ax(d) = dAr =


Ldiri = xix(0)
=> X(2) =
Ax(1) = Axix(0) =
XiAX(0) diAdri= = didAri = Lxifri = di x(0)

=> (k) =
xiFx(d)
Cioè, si può affermare che, una volta che lo stato diventa uguale a un multiplo di un autovettore, resterà sempre multiplo di
quell’autovettore.
Ari Moltiplicando Ari si ottiene ri con un fattore di proporzionalità Xi , cioè hanno la
- stessa direzione:
ri
Se X > 1 il vettore si espande
Se 64 il vettore di restringe

Supponiamo che la matrice A abbia un insieme di n autovettori (destri) linearmente indipendenti Va Un associati agli autovalori , ...,

As An e costruiamo la matrice V degli autovettori:


, ...,
[Vi , 22 Un 7 è l’insieme di tutte le combinazioni lineari di un vettore
, ...,

Essa è invertibile, cioè V V , essendo gli autovettori linearmente indipendenti e basi dello spazio in cui operiamo span (ve,..., Un) IRU
- 1
= =

La matrice V, inoltre, sarà di dimensioni nxn ed è chiamata MATRICE MODALE DE(RUXN, ottenuta raggruppando per colonna gli n
↳W
autovettori di A.
È possibile costruire anche la matrice degli autovalori: A
che è una matrice diagonale.
= =
.... x
=

(1 ...) =

[ )* =

.ch
Dopo aver definito tutto questo, è possibile scrivere x(k) come una combinazione lineare degli n autovettori:
X(k) =
Z1(k)V +...+ Zn(k) Un (1)
E sfruttando la definizione di autovettore e la proprietà , si ottiene: X(k+ 1) X2Za(k) V +... + In Zn(k) Un =

da cui segue Zi(k+ 1) XiZi(k)=


i 1 ...., =

dove z rappresenta la componente di x lungo i vari autovettori, e quindi zi è la componente lungo l’i-esimo autovettore.
In generale, per tutti gli autovettori: z(k + 1) Az(k) =
La (1) può essere riscritta come: X(k) Az(k) = => x(k+1) =
(z(k+ 1)
Essendo x(k+ 1) Ax(k) e x(k)
=
1z(A) = => X(k+ 1) =
Allz(k)
Uguaglio z(k + 1)
: I 2Alz(k) =

E ottengo: #Al A =

Poiché da L'AM =
A posso riscrivere: A = M A 1-1 (che è la forma diadica di A)
In forma generale: P
A = 1 A P1-1
K

dove è la matrice diagonale che dipende da k solo per gli autovalori, mentre la matrice AF dipende da k solo per questa X

matrice diagonale. Pertanto, Ak sarà composta da combinazioni lineari dei valori della diagonale principale di .

La forma esplicita dell’evoluzione libera X(k) AFx(d) si può esprimere come: =


X(K) =
1 -
El x(0) ottenuta sostituendo
l’espressione di Ax in X(K) AFx(0) =

[V1 : v2 :...: Vn][d" G [] Xo


.

Posso riscriverla come: X(k) = ...

faccio poi il prodotto riga per colonna:


X(K)
= N Vi . Kit. Jik o

K
dove vi sono gli autovettori, sono gli scalari e x0 è dato.
Lo svolgo e ottengo: X(K) = ditri .

A prodotto riga vi perr


Colonna Xo

In questa espressione ho due quantità scalari e una vettoriale, perciò la x(k) è somma di n vettori.
Inoltre, l’evoluzione libera é stata scritta come combinazione lineare dei modi di evoluzione titri del sistema.
L’insieme dei modi di evoluzione costituisce un generatore di soluzioni di x(k+1)=Ax(k).

• Se ti sono compresi nell’intervallo 3 1 il l’evoluzione del sistema tenderà a 0;


-

• Se ti 1 l’evoluzione sarebbe confinata ad un certo valore;


=

• Se xi > 1 l’evoluzione diverge, cioè tende a infinito e di conseguenza il sistema è instabile;


• Se xix1 l’evoluzione converge.

Si consideri ora un sistema LTI a tempo continuo in evoluzione libera x(t) Ax(t) la cui matrice dinamica A possieda n =

autovettori linearmente indipendenti, definendo la matrice modale M ed il cambio di variabili x(t) (z(t) => E AE(t) = =
.

Essendo A F I EM =
-

posso riscrivere: ( Re** +*


* BA't +
-1
In + (IntAt
t
= + =
...
...

xIt
dove:
-

At =...
- Ant
* **
Pertanto, la forma esplicita dell’evoluzione libera I/(t) e x(0) si può esprimere come =
x (t) =
1 M'x(0) , ovvero come
una combinazione lineare dei modi di evoluzione exitri del sistema.
I modi di evoluzione sono un generatore di soluzioni per x(t) Ax(t) =
.

• Se Xi 0 il sistema non si sta né espandendo né restringendo;


=

• Se Xi > O diverge in maniera esponenziale a infinito;


• Se XixO converge a 0 (l’ampiezza del vettore si riduce).
• LA RISPOSTA A REGIME PERMANENTE DI UN SISTEMA LTI

Come abbiamo visto la riposta totale di un sistema dinamico LTI MIMO é calcolabile così:
A TEMPO DISCRETO:
nello stato
nell’uscita

A TEMPO CONTINUO:
nello stato
nell’uscita

Abbiamo visto che l’insieme fondamentale delle soluzioni per il sistema in evoluzione libera nel caso del tempo discreto è .
A partire da esso si può generare qualsiasi soluzione, data qualsiasi condizioni iniziale.
Supponendo che sia reale:
• Se al crescere di k, diventa sempre più piccolo;
• Se al crescere di k, diventa sempre più grande.
Nel caso continuo, invece, l’insieme fondamentale é:
• Se è negativo, l’esponenziale è decrescente e va a 0;
• Se è positivo, l’esponenziale è crescente e va a infinito.

Ora vedremo un altro modo per esprimere l’evoluzione totale del sistema, ma solo per sistemi che non divergono mai in
evoluzione libera, cioè nel tempo discreto per sistemi che hanno autovalori in modulo minori di 1, e nel tempo continuo per
sistemi che hanno autovalori negativi.
Consideriamo prima il caso del sistema dinamico MIMO LTI a tempo discreto:
Le informazioni sugli ingressi al sistema, prima del tempo corrente, sono contenute nello stato; quindi, tutta la memoria del
sistema é contenuta nello stato del sistema stesso.
Se spostassimo l’istante iniziale all’indietro nel tempo:
avremmo la necessità di conoscere le sollecitazioni esterne subite dal sistema in un più lungo segmento rispetto al precedente
(poiché entra un valore in più), e di conoscere lo stato iniziale nell’istante arretrato . Per non avere la necessità di
conoscere uno stato iniziale per poter valutare l’evoluzione dello stato del sistema al generico istante k, dovremmo far arretrare
l’istante iniziale fino all’infinito, ma avremmo bisogno di conoscere tutte le sollecitazioni a cui è stato sottoposto il sistema, ovvero
dovremmo calcolare:

Per scrivere questo limite è necessario che la matrice A sia fatta in un certo modo, la serie deve convergere, e condizione
necessaria per l’esistenza del limite é che tutti gli autovalori (nel caso del tempo discreto) devono essere all’interno del cerchio
unitario, cioè devono essere in modulo minori di 1. L’esistenza del limite dipende anche dal tipo di ingresso.
Quando esiste, questo limite é detto RISPOSTA A REGIME PERMANENTE o STADY STATE:

È quindi la risposta che mi dà il sistema a partire da meno infinito, di conseguenza conosco tutta la storia (dinamica) passata del
sistema e non si necessita più delle condizioni iniziali, bensì solo degli ingressi.

• LA RISPOSTA TRANSITORIA (tempo discreto)


Quando esiste la risposta a regime permanente, si può definire la RISPOSTA TRANSITORIA di un sistema, che è data dalla differenza
tra la risposta totale (somma di evoluzione libera ed evoluzione forzata) e la risposta di regime permanente:

Ponendo possiamo scrivere:

dove lo posso scrivere come:

dove il primo termine è quello relativo agli ingressi che vanno da meno infinito a k0, mentre il secondo termine rappresenta la risposta
forzata a partire dall’istante k0. Cioè la risposta a regime permanente all’istante k é somma della risposta a regime permanente
all’istante k0 e l’evoluzione forzata a partire dall’istante k0.
Di conseguenza:

Da cui:

Sostituisco, semplifico e ottengo:

Cioè:
k
Quando la matrice A ha tutti gli autovalori nel raggio unitario, diagonalizzando il sistema avremo tutti i termini che dipendono da X, , e
-

k
se ↓ i è minore di 1 al crescere di k, ↓i diventano sempre più piccoli: la matrice A è detta contrattiva, ovvero diventa sempre più
piccola e converge a 0. Quando k diventa molto grande (e significa che è passato molto tempo) la risposta transitoria va a 0.
Quindi il transitorio rappresenta l’evoluzione del sistema che, estinguendosi nel tempo, porta la risposta totale del sistema ad
allinearsi alla risposta di regime permanente.

La risposta dinamica di un sistema, oltre a decomporsi in risposta libera e forzata, può essere decomponibile in risposta a regime
permanente e risposta transitoria:
+AR-h Buch)
*F -

X+ (k) =
Xw(k) + Xm(k) A=
(X(ko) Xm(ko))
-

Inoltre, se esiste la risposta a regime permanente nello stato, la risposta a regime nell’uscita, ottenuta premoltiplicando per C, sarà:
YR(k) = CAK-n-'Ble

Nell’ipotesi che la matrice A sia contrattiva, esistono alcuni regimi di particolare rilevanza, tra cui:
-

• REGIME COSTANTE, cioè la risposta permanente al segnale di ingresso è costante u

• REGIME SINUSOIDALE (armonico), cioè la risposta permanente ad un segnale di ingresso sinusoidale del tipo:
u(k) = Usin(Wk + E
dove:
• U è l’ampiezza

• · è lo sfasamento
• w è la frequenza

La risposta sarà sempre un segnale sinusoidale con la stessa frequenza, alterata in ampiezza e traslata in fase:
3m(k) Usin(WK= 4) +
Consideriamo ora il caso di un sistema dinamico LTI a tempo continuo.
Abbiamo detto che l’evoluzione totale del sistema è data da:
2A(t X(0) (* CeAlt
-
X + (t) Y'Bu(T)
-

=
+ d

Come nel caso del sistema a tempo discreto, però, posso anche scriverla considerando la risposta a regime e transitoria.
Per farlo, anche in questo caso, devo liberarmi del contributo di risposta forzata, quindi considero l’evoluzione libera e un
asse temporale to +

Suppongo di arretrare fino a meno infinito, in modo da eliminare le condizioni iniziali.


In questo modo ottengo che la risposta a regime permanente, se esiste, è:

)teAlt Y'Bu(Y)
-

Xr(t) = d

Affinché esista, gli autovalori della matrice A devono avere parte reale negativa.

La risposta transitoria, invece, è: Xtr(t) X + (t)


= -

Xr(t)

Nell’ipotesi che la matrice A sia contrattiva, esistono:


• REGIME COSTANTE, cioè la risposta permanente al segnale di ingresso è cotante u(t) = π
Innanzitutto pongo: d = t Y +
+0

-A c d6)
()
*
-

E la risposta a regime permanente diventa: XR(t) ( e Bult 6) da


=

T quantità
-
=
Be
(Ho invertito gli estremi di integrazione poiché ci sarebbe il meno) scalare

Il problema si riduce al calcolo dell’integrale, che posso scrivere come:


0

↓ (I + As +
d ...

(do = Is +
122 Add
+ ...

Avendo supposto che tutti gli autovalori sono negativi, quindi esistono, A è invertibile, e posso scrivere:

A-"[(e)
+ 0

=
-

A
-

Da cui, alla fine, si ottiene:


XR = -
A Bu

YR =
-
CA" BES-MATRICEDE STALIC

L’uscita diventa costante quando si estingue il transitivo, cioè a un tempo infinito.

• REGIME SINUSOIDALE (armonico), cioè la risposta permanente ad un segnale di ingresso sinusoidale del tipo
u(t) = Usin(ük + 1)

YR(t) = Usin(wt 4) +

che presenta oscillazioni di pari frequenza ma alternate in ampiezza e traslate in fase.


ATTENUAZIONE

E
C 1 DI

Il rapporto è detto GUADAGNO e se -

- Amplificazione
2
> DI
Lezione 6
• FORME OPERATORIALI DEI SISTEMI DINAMICI (tempo discreto)
Attraverso l’uso di opportuni operatori, detti trasformate funzionali, le equazioni alle differenze o differenziali, che descrivono un
sistema dinamico, possono essere trasformate in equazioni algebriche in un differente dominio e risolte come tali. In questo caso, il
sistema è rappresentano nel dominio del tempo, cioè la variabili indipendente è il tempo e le altre dipendono da esso.
Per ritrasformare la soluzione trovata in una funzione del dominio del tempo è necessaria l’antitrasformata, rappresentato dal
dominio delle variabili ausiliarie z.

Consideriamo un sistema SISO che genera una sequenza:

dove è una generica sequenza di variabili (se sono presenti apici o indici si parla di estensione della sequenza, ad esempio
da 0 a infinito), definita modello autoregressivo a media mobile o arma.
Introduciamo un OPERATORE DI RITARDO che opera sulla sequenza producendo la stessa sequenza ma “ritardata” di un passo
temporale.

Cioè il campione che arriva all’istante 1, se applico l’operatore di ritardo, arriverà all’istante 2, e così via.
Di conseguenza la sequenza risulta traslata verso destra.

Quindi, considerando la generica sequenza di variabili e applicando l’operatore di ritardo, essa verrà così rappresentata:

Applicandola due volte ho un ritardo di 2 passi

Generalizzando:

Allo stesso modo, possiamo introdurre un OPERATORE DI ANTICIPO q, che opera sulla sequenza producendo la stessa
sequenza ma “anticipata” di un passo temporale. La sequenza risulterà traslata verso sinistra.

Generalizzando:

k è l’istante corrente in cui guardo la sequenza.

L’operatore di ritardo fa riferimento al passato, quello di anticipo al futuro, e per questo motivo l’operatore di ritardo è compatibile
con l’analisi in tempo reale di una sequenza , mentre quello di anticipo no poiché riporta il valore della sequenza in un
istante futuro.

Consideriamo ora l’espressione di un modello SISO lineare e LTI nella forma:

dove le y e le u sono quantità scalari.


Portando al secondo membro, y può essere vista come una combinazione lineare delle y precedenti + una combinazione lineare
delle u precedenti. Questo modello è AUTOREGRESSIVO (a media mobile o ARMA), poiché y(k) si ottiene come regressione di se
stessa. Quando è presente anche il termine , il modello è detto autoregressivo con ingresso esogeno.

Consideriamo la (1) e applichiamo l’operatore di ritardo alle sequenza {y(k)} e {u(k)}, otteniamo:

mettiamo in evidenza:

e sono dei polinomi operatoriali di potenze negative che decrescono.


La (1) la posso anche scrivere come:
Che è detta “PRIMA FORMA OPERATORIALE DI UN MODELLO SISO LTI”.
L’ordine del sistema coincide con il grado del polinomio.
Consideriamo sempre un modello SISO LTI in una forma differente (ma è sempre lo stesso modello):

Applicando l’operatore si anticipo alle sequenze e , possiamo scrivere:

Mettendo in evidenza:

La (2) la possiamo riscrivere come:

Che è detta “SECONDA FORMA OPERATORIALE DI UN MODELLO SISO LTI”.

A e A’ non sono gli stessi polinomi (idem B e B’), ma sono reciproci e sono legati alle seguenti relazioni:

Il contenuto informativo delle due


equazione ottenute é lo stesso.

Inoltre, i polinomi A(q ) e A’(q) godono di un’altra proprietà: sono polinomi monici, cioè il coefficiente della potenza più alta è
unitario.

Il vantaggio di aver introdotto tali operatori è che:

La divisione tra polinomi è ancora un polinomio.


P rappresenta il “polinomio dei ritardi”.
Quindi, supponendo di saper fare questa divisione, possiamo scrivere il modello come:

Cioè il modello che avevamo definito autoregressivo con ingressi esogeni, in questa forma dipende solo dalle u. E in tal caso,
l’uscita è combinazione lineare degli ingressi precedenti (essendo q l’operatore dei ritardi).
Il grado del polinomio è l’ampiezza della memoria del sistema.
In termini di schemi a blocchi:

Questa sarà una risposta a regime permanente, infatti take rapporto presenta al numeratore un polinomio di grado
inferiore; il risultato è un polinomio che non finisce mai, di ordine infinito. Ciò significa che si sta andando a scavare nella
memoria del sistema è, per questo motivo, non si considerano le condizioni iniziali.
Abbiamo quindi scritto l’uscita come prodotto di due quantità, in forma algebrica.

Per ottenere, però, un’algebrizzazione completa è necessario introdurre:

• LA TRASFORMATA ZETA
Data una sequenza (Cioè nulla per k<0), la sua z-trasformata , spesso indicata con F(z) è data da:

dove z è una variabile complessa e si ottiene una serie di potenza negative con coefficienti i campioni della sequenza.
Attraverso questa trasformazione funzionale, si associa ad una sequenza una funzione di variabile complessa ,
operando così un cambio di dominio: dal dominio del tempo k al dominio della variabile complessa z.
L’esistenza della z-trasformata è legata alla convergenza della serie: la serie converge sol in quelle regione del piano complesso
dove il modello dell’esponenziale z va a zero per k che tende ad infinito più velocemente di f(k), cioè all’esterno di un raggio di
convergenza.

significa “uguale per definizione”


La z-trasformata gode di alcune proprietà, attraverso cui si possono calcolare le trasformate di altre funzioni da esse venerabili
tramite operazioni elementari:

- -
Prodotto di convulozione Prodotto di trasformazione
tra istanti di tempo diversi in (k-h) e h (semplificato)

-
ULTIMO VALORE
S equenza
della

N.B. Se consideriamo una sequenza (f(k)) non nulla per k<0, per annullarla utilizzo la SEQUENZA GRADINO UNITARIO 1(k),
che è nulla per k<0 e uguale a 1 per k>0, e la moltiplico per la sequenza, ottenendo:
- (f(k)1(K) Y

Consideriamo ora il modello SISO LTI nella forma:


(3)Y(k + n) + An - y(k+ n 1) -

+... +
Aoy(k) =
bn- ,
u(k +n -

2) + ...
+ bou(k)

Applicando la trasformata zeta alle sequenza (u(k)4(y(k)


e , nulle per k<0, ovvero assumendo il sistema a riposo,
cioè conoscendo (y(k)4 = (z)
Su(k)) E(t) =

e l’anticipo 3y(n 2)4


+ = z (z) -
d
:
(y(k + n)) =
zv (z)
possiamo scrivere:
=* (z) + An , z
"
" (t) +... 90 + (t) =
bn- z
,
(t) + ...
+ boV(z)
mettendo in evidenza:
(z+ An-z"
'

+... + a) (t) =
(bn z" W(t)
,
+ ...
+
bo) V(z)
A(z) B(z)
posso riscrivere la (3) come:
(ty(t) =
3(zW(z)
che rappresenta un sistema SISO LTI nel dominio Z.
Da cui: =
W
(
(espressione completamente algebrizzata).
Ci sono sequenze di segnali ingresso di cui sono note le z-trasformate. Parliamo di SEGNALI CANONICI, che hanno z-trasformate
che sono rapporti di polinomi in z e hanno la forma di funzioni razionali fratte con grado del numeratore più basso di quello del
denominatore.

Valgono le seguenti formule:

La doppia freccia sta ad indicare che è una trasformazione valida anche nel caso inverno, ovvero in anti-trasformazione.

Le trasformate di altri segnali possono essere ottenute da segnali con trasformate note per applicazione delle proprietà della z-
trasformata.
Per esempio, consideriamo il segnale a gradino 1(k):

• il segnale 1(k-a) è una traslazione a destra di ampiezza a;

• il segnale 1(k-b) con b>a è una traslazione a destra di ampiezza b.

Se faccio la differenza tra questi due segnali 1(k-a) - 1(k-b) avrò un segnale che ha valori diversi da 0 solo nell’intervallo
Applicando la proprietà di linearità, la sua z-trasformata sarà:
Lezione 7
• FUNZIONE DI TRASFERIMENTO
Avendo algebrizzato l’equazione del modello SISO LTI, on l’uso della z-trasformata, cioè siamo arrivati a ,
adesso possiamo risolvere l’equazione nel dominio delle z e quindi trovare la forma esplicita del modello come:

Dove W(z) è la FUNZIONE DI TRASFERIMENTO del sistema (fdt) che si presenta sotto forma di funzione razionale fratta, ovvero
come rapporto dei polinomi B(z) e A(z).
Le radici di A(z) prendono il nome di POLI della fdt, mentre le radici di B(z) son dette ZERI della fdt.
(Le lettere maiuscole indicano che siamo nel domini)

Supponiamo di avere due sistemi (blocchi) con fdt W1(z) e W2(z):

(Le singole uscite sono sommate


in un’unica nel nodo sommatore)

La funzione di trasferimento è la somma


delle funzioni di trasferimento
• ANTITRASFORMATA
La funzione di trasferimento è una funzione razionale fratta, ossia una divisione tra polinomi, che è a sua volta un polinomio:

Più precisamente, Y(z) è una funzione razionale fratta se si considera la risposta a segnali canonici, cioè nel caso in cui la U(z) è
una funzione fratta.

Supponiamo di avere una funzione razionale fratta:

e supponiamo che il denominatore sia fattorizzabile come:

con radici (poli) tutte distinte, allora si può sviluppare la F(z) in fratti semplici, cioè:

dove il valore dei coefficienti può ottenersi imponendo l’eguaglianza tra polinomi e risolvendo il relativo sistema lineare
di equazioni.
Vedo la tabella delle trasformate dei segnali canonici, per effettuare l’antitrasfrormata la osservo da destra verso sinistra e noto
che i termini della scomposizione in fratti semplici sono riconducibili a una sequenza geometrica , ma a meno
della z.
Il termine che ci interessa è:
Per renderlo totalmente riconducibile alla sequenza geometrica e far comparire la z, moltiplico per z e z :

L’antitrasformata sará:
Ma rimane che è l’operatore di ritardo e quindi scriverò:

In questo modo è facile antitrasformare la (1) con i fratti semplici:

e l’antitrasformata sarà:

se le radici del polinomio A(z) non fossero distinte ma avessero molteplicità maggiore di 1, consideriamo, ad esempio, z1 di
molteplicità m, comparirebbero i seguenti termini:

dove ciascuno corrisponde alle sequenze:

Questo mi permette di fare l’antitrasformata.

Se la funzione di trasferimento è un rapporto di polinomi e fattorizzo :

• RISPOSTA IMPULSIVA
La fdt W(z) è stata ottenuta, come sappiamo, z-trasformando le equazioni che descrivono il sistema, e sarà associabile ad una
sequenza nel dominio del tempo.
Consideriamo l’espressione , per applicazione della proprietà di convoluzione
si ottiene la risposta forzata del sistema SISO LTI nel dominio del tempo come:

(k-1 perché il sistema non è anticipativo rispetto l’ingresso).

Per comprendere il significato della sequenza applichiamo al sistema l’impulso di Kronecker, indicato con .
Essendo , si avrà:
da cui antitrasformando
Infatti:

Quindi, la sequenza è la risposta impulsiva del sistema: l’antitrasformata della funzione di trasferimento del sistema
è la risposta impulsiva del sistema.
La risposta impulsiva, per convulozione, può generare le risposte in evoluzione forzata ad ogni sequenza di ingresso.
• ESEMPIO:
Fare l’antitrasformata di:

Come già detto, quando si vede la tabella delle trasformate, troviamo: , per avere questo z che non ho nello sviluppo dei fratti

semplici, invece di considerare:

Considero:

Per calcolare più semplicemente, si utilizzano le FORMULE DI HEAVISIDE:

Nel nostro esempio:

Una volta calcolati i residui:

Lo porto nel dominio del tempo:

Per questo:
Lezione 8
• CALCOLO DELLA FDT A PARTIRE DALLA FORMA i-s-u
Consideriamo un sistema MIMO LTI in variabili di stato (cioè modello i-s-u) e di volerlo trattare nel dominio delle z trasformate
direttamente dal modello i-s-u e non da quello i-u:

Inoltre, supponiamo di conoscere:

Trasformiamo nel dominio delle z entrambi i membri dell’equazione:

Considerando la prima equazione, porto al primo membro e fattorizzo X(z):

Combino le due equazioni:

Dove W(z) è la matrice delle funzioni di trasferimento (mxp), poiché A, B e C non sono più scalari ma quantità di dimensioni:

Essa presenta tante righe quando sono le uscite e tante colonne quanti sono gli ingressi. Infatti, consideriamo un sistema:

Esso presenta 2 ingressi e 3 uscite, pertanto la matrice delle funzioni di trasferimento avrà 3 righe e 2 colonne:

Funzione di trasferimento dell’uscita 3, influenzata dall’ingresso 2

Sono tutte w (trasferenze), perché al denominatore hanno il polinomio caratteristico, e si differenziano per il numeratore poiché
dipendono da B e da C che fanno delle combinazioni lineari. Ogni uscita presenta 2 funzioni di trasferimento poiché legate ai due
ingressi.
Inoltre, considerando l’equazioni: essendoci l’inversa , data da , possiamo dire che è una matrice i cui
elementi sono rapporti di polinomi con grado del denominatore più grande di quello del numeratore; di conseguenza, si può dire
che W(z) è una matrice di funzioni razionali fratte.

Consideriamo ora un sistema SISO LTI in variabili di stato:

Trasformando nel dominio delle z:

Combinando le due equazioni:

In tal caso la matrice delle funzioni di trasferimento diventa una quantità scalare, con struttura di funzione razionale fratta con
grado del denominatore più grande del numeratore.

Altra considerazione: sistema MIMO LTI in variabili di stato e in evoluzione libera:

Trasformando nel dominio delle z:

Confrontando det(zI-A) e det( I-A), essi sono due polinomi uguali ma uno scritto in e uno in z. Essendoci e z, variabili
complesse, azzerando i due determinanti, si può dire che gli autovalori di A sono i poli della fdt. E possiamo dire che (zI-A) è la
trasformata della matrice di transizione .

Sviluppando in fratti semplici avrò:

Se faccio l’antitrasformata ottengo che sono i modi di evoluzione, mentre sono matrici di residui
(coefficienti) che rappresentano l’ampiezza dei modi di evoluzione. Quindi, attraverso l’analisi in Z e lo sviluppo in fratti semplici,
abbiamo ottenuto il concetto di evoluzione associato ad un autovalore con molteplicità maggiore di 1.
Ricapitolando:
• se partiamo dal modello i-u, i modi di evoluzione sono le radici del polinomio A, ovvero se le radici sono reali e distinte e li
indichiamo con
• se partiamo dal modello i-s-u, i modi di evoluzione sono le radici del polinomio caratteristico, ovvero se le radici hanno
molteplicità maggiore di 1 e li indichiamo con . In tal caso, essi nascono dallo sviluppo in fratti semplici dell’antitrasformata.

Ultima considerazione: la risposta del modello i-s-u in evoluzione forzata è:

Se , nel dominio del tempo scriviamo:

Per la proprietà di , tutti i pezzi dopo lo 0 sono nulli

Da cui ottengo:

Dove e sono gli equivalenti della funzione di trasferimento nel dominio del tempo.
• FORME OPERATORIALI DEI SISTEMI DINAMICI (TEMPO CONTINUO)
Data una funzione f( ), definita per t > 0, la sua TRASFORMATA DI LAPLACE è definita come:
Itf (1) F(de)g(t) ert = dt

dove s indica la variabile complessa.


Si passa dal dominio delle t al dominio delle s, tramite integrazione; infatti, essendo integrata in dt, la t scompare mentre la s
rimane. Per ritornare al dominio delle t, bisogna fare l’antitrasformata.
In generale, l’integrale converge solo in quelle regioni del piano complesso dove il modulo dell’esponenziale ebt va a zero per t
che tende ad infinito più velocemente di f(t), e dunque a destra di un’ascissa di convergenza.

La trasformata di Laplace gode di una serie di proprietà, attraverso cui è possibile calcolare le trasformate di altre funzioni da esse
venerabili attraverso operazioni elementari:

La proprietà di derivata è l’equivalente della proprietà di anticipo, e il fattore “s” nel dominio delle s diventa operatore di derivazione (ma
è come se fosse un operatore di anticipo).
Questa proprietà mi dice che: la trasformata di Laplace di una derivata si ottiene moltiplicando per s la trasformata della funzione non
derivata e sottraendovi il valore della funzione in 0.

Ed è l’operatore di integrazione

Quindi, la trasformata dell’integrale di convulozione si ottiene tramite il prodotto delle trasformate.


ŒÎŒÎŒ@Ğï

-
--

Inoltre, è possibile calcolare la trasformata di Laplace di alcuni segnali canonici:

YOLTIPLIC
.

PER 1(t)

I
Dove 1(t) è: t La sinusoide é definita tra &-
c , + co [ , ma
1(t) taglia la parte prima di 0

Io che se l’esponenziale è definita su tutto


l’asse del tempo, ma moltiplicato per 1(t) è
definita solo per t > 0
-
-

O t
Tornando al Delta di Dirac, esso è l’equivalente nel dominio del tempo del segnale Delta di Kroneker ed é definita su un punto (insieme
di misura nulla) dell’asse del dominio reale.
Abbiamo detto che gode della proprietà di campionamento, ovvero se prendo una funzione generica e ne faccio l’integrale tra meno
infinito e più infinito, moltiplicando per , che è l’impulso unitario in un generico punto , ottengo il valore della funzione in quel
punto.

Applico ora la formula di trasformazione per calcolare la trasformata:

Ed ottengo che la trasformata di Laplace, per la proprietà di campionamento, è uguale a 1.

N.B. Campionare una funzione significa passare dal dominio del tempo continuo a quello discreto, ovvero estrarre i valori dalla funzione
in certi istanti di tempo, detti periodi di campionamento.
Da tale operazione ne esce una sequenza (ha in ingresso una funzione continua).

Il campionatore è:

Il passaggio inverso, invece, consiste nel partire dai campioni e ricostruire il segnale iniziale. Ma in tal caso vi può essere perdita di
informazione.
Esiste un teorema, il teorema di Shannon, che dice che se ho un certo segnale con certe caratteristiche e lo voglio campionare,
mantenendo la possibilità di tornare indietro, esso mi indica il periodo massimo (o frequenza minima) a cui posso campionario senza
perdere informazioni.

• FORMA OPERATORIALE DEI SISTEMI SISO LTI A TEMOO CONTINUO


Consideriamo l’espressione di un modello lineare SISO LTI a riposo nella forma:

Derivata n-esima Segnale y Derivata della u


di y all’istante t non derivato
Applicando la trasformata di Laplace e la proprietà di derivazione, ovvero: e
E ottengo:

Cioè, la (1) si può riscrivere:

Dove: Y(s) è la trasformata dell’uscita, U(s) quella di ingresso (nota).


(Ho potuto applicare la proprietà di derivazione poiché supponiamo di conoscere la U(s), ovvero supponiamo che il nostro
sistema sia soggetto a un segnale canonico e che le condizioni iniziali siano nulle, cioè che il sistema sia a riposo).
A(s) e B(s) sono scritti come segnali e sono noti poiché conosco gradi e coefficienti.

Avendo tre quantità note, posso ricavare:

Con deg(B) < deg(A).


Anche in questo caso la funzione di trasferimento si esprime come rapporto di polinomi con grado del denominatore maggiore
di quello del numeratore.
Le radici di A sono i poli della fdt, le radici di B sono gli zeri della fdt.
Applicando l’impulso di Dirac:
E quindi W(s) é la funzione di trasferimento definita come la trasformata di Laplace della risposta impulsiva del mio sistema.

Se la U(s) non è la Delta di Dirac, non avrò W(s) bensì un rapporto di polinomi, e avrò:
• ANTITRASFORMAZIONE
Per calcolare trasformata di Laplace di Y(s), cioè per calcolare l’andamento temporale della risposta del sistema, considero che i segnali
in ingresso siano di tipo canonico, in modo che lo sviluppo in fratti semplici del prodotto W(s)U(s) renda facile l’operazione di anti
trasformazione, attraverso l’uso delle tabelle di trasformazione:
I(2) = Ric ris

La prima sommatoria indica quanti autovalori distinti ho (massimo l), mentre la seconda la molteplicità degli autovalori (massimo m).
E dove: Rij sono i residui e si sono le radici del polinomio.
-
Mi sono ricondotta a (8- 234

Per il calcolo dei residui Rij si procede come fatto nel caso della z-trasformata.
Le radici del denominatore generano i termini nel dominio del tempo, invece gli zeri vanno a contribuire alla definizione degli Ri: pertanto,
per calcolare i residui utilizzo gli zeri della fdt. Essi diventano i coefficienti di 1 in (-
234
. -

Applicando l’antitrasformata avrò: Ret 1(t)


di > 0

valori per t > 0: R di = 0

Si CO

Cioè va a infinito per si > 0 e va a 0 per si < 0.

Nel piano complesso posso collocare le radici del numeratore e del denominatore (gli zeri sono rappresentati tramite un cerchietto):
Tw

i
X

Se considero una radice a sx dell’asse immaginario, avrò:


• se molteplicità1, un esponenziale che tende a 0;
• Se molteplicità 2, un esponenziale che tende a 0 moltiplicato per t che cresce linearmente a infinito; il risultato sarà un qualcosa che
va a 0 poiché l’esponenziale va a 0 molto più velocemente di t che va a infinito. Quindi, all’inizio la funzione sale per effetto di t e poi
va a 0:
fat
~

Inoltre, si può far vedere che se polo e zero sono molto vicini, l’ampiezza del residuo è piccolo; se, invece, fossero coincidenti, si intuisce
che tra numeratore e denominatore si può semplificare e il polo mom si avrebbe:
Niee
Lis Zi =
pi

Se non coincidono ma sono molto vicini, l’evoluzione è presente con un fattore molto piccolo e perciò si potrebbe cancellare. Cancellare
significa abbassare l’ordine del sistema (da n radici ne ottengo n-1): di conseguenza, si perde di rappresentatività del modello rispetto
alla realtà ma ottengo modelli matematici semplici: modello di ordine ridotto.

RICAPITOLANDO:
I residui Rij determinano l’ampiezza dei modi di evoluzione del sistema nella risposta forzata. Essi dipendono non solo dalla collocazione
dei poli del sistema ma anche dalla posizione degli zeri.
In particolare, si dimostra che un modo avrà ampiezza molto piccola quanto il relativo polo è molto vicino a uno zero del sistema: questo
consente di individuare i modi con ampiezza (residuo) più grande. Parliamo di moti dominanti.
Se alcuni residui sono molto più piccoli degli altri, i modi ad essi associati possono essere trascurati al fine di costruire un “modello di
ordine ridotto”, approssimato, ultime in sistemi di ordine elevato.

• CALCOLO DELLA FDT DI UN SISTEMA MIMO i-s-u

Consideriamo un sistema MIMO LTI in variabili di stato:


Bu(t)
(y(H)
x(t) =
Ax(t) +

=
(x(t)
Assumendo il sistema a riposo, trasformo nel dominio delle s, secondo Laplace:
A) ((z) BE(w)
(ey
I (t) A(n) BÜ(z)
((I
-

= + =

* (x) =
C, (a)
>
-

<(2) =
(1, (e)

E ottengo:
Ice) =
AATBUCe) EW(IlT(e)

W(z)
Dove W(s) è la matrice delle funzioni di trasferimento: ha tante righe quante sono le uscite e tante colonne quanti sono gli ingressi.
Applicando il teorema del valore finale, si ha la formula della MATRICE DEI GUADAGNI STATICI: CA B
imy(t) = -
• CALCOLO DELLA RISPOSTA LIBERA ATTRAVERSO LA Z-TRASFORMATA Lezione 9
Finora abbiamo considerato che il sistema fosse a condizioni iniziali nulle e perciò abbiamo analizzato solo la risposta in evoluzione
forzata del sistema. Però, il metodo delle z-trasformate può essere utilizzato anche per l’analisi dell’ evoluzione libera.
Consideriamo, quindi, un sistema “autonomo”, cioè senza interruzioni con l’esterno, dotato di una condizione iniziale nota:

Immaginiamo di indicare con con X(z) la trasformata z della sequenza di x(k): X(z) = Z [x(k)]
Dalla tabella delle z-trasformate vedo che la trasformata di una sequenza é: Z[{f(k+1}] = zF(z) - zf(0) m
C . I FO

Se la applico a X(z) = Z [x(k)], ottengo:


z (z) EXo
,
-
= A , (e)
(I A)(z)
-
= EXo

da cui: ( (z) =(zl Al xo (1 [EN ,Cas ENE I -


- .
= >
- =
- Xo
(zz Al
-

↳ polinoni L Lo metto in evidenza perché i polinomi hanno tutti lo stesso denominatore


dove:
• X(z) é un vettore, le cui componenti sono le trasformate delle componenti di x;
• z è uno scalare;
• A é una matrice;
• x0 è un vettore

Posso riscriverla come: -(z) =


(7) Xo

La forma esplicita della risposta libera è: X(k) = Axo = q (k)Xo


E quindi possiamo dire che: & (z) [2(k)] =

-
I
Per tornare nel dominio del tempo, si fa lo sviluppo in fratti semplici dicendo z .

Sappiamo che i modi di evoluzione sono leggi temporali. Se voglio esaminare l’evoluzione libera bisogna esaminare i residui
e le anti trasformate delle z che possono essere di tre tipi:
• radici reali e distinte
• radici reali con molteplicità non unitaria
• radici complesse e coniugate.

• MODI APERIODICI
2(z) è una matrice di funzioni razionali fratte che condividono lo stesso denominatore, che è proprio il polinomio caratteristico della
matrice A. Se gli autovalori di A sono reali e distinti, nello sviluppo in fratti semplici di [(z), comparirebbero dei termini di tipo Ri Esi
dove le Ri sono matrici quadrate di dimensioni n.
Utilizzando le tabelle di trasformazione per ottenere l’antitrasformata, si ottengono modi di evoluzione del tipo: Rixik
ed, in corrispondenza di determinate condizioni iniziali, si ottiene una certa evoluzione libera.
Questi modi di evoluzione hanno un andamento crescente, decrescente o alternante in relazione a (il ed al segno di Xi .
Ovvero il modulo e il segno di ti definisce la convergenza e la divergenza dell’evoluzione:
• (il 0 diverge
>

• /il O converge
• 1 di l = 0 costante

Più precisamente:
• MODI OSCILLATORI PSEUDOPERIODICI
Se la matrice A possedesse, oltre ad autovalori reali e distinti , anche coppie di autovalori complessi e coniugati, rappresentabili in
modulo e fase come , allora le matrici dei residui sarebbero anch’esse complesse coniugate:
e nello sviluppo in fratti semplici comparirebbero termini del tipo:

a = parte reale, b = parte immaginaria, h = conta gli autovalori

Antitrasformando, otteniamo dei modi di evoluzione del tipo: Sono le parti che dipendono
dal tempo poiché k è una
variabile temporale

Non compare più la parte immaginaria, visto che nel dominio del tempo non posso trovarmi qualcosa di immaginario.
Tali modi di evoluzione hanno un andamento temporale oscillante con frequenza e ampiezza (che può essere smorzata o ampliata nel
tempo) .

Se o le oscillazione scompaiono.
L’ampiezza diminuisce se il modulo è minore di 1; si amplifica se il modulo è maggiore di 1; è costante se il modulo è uguale a 1.

EVOLUZIONE PSEUDOPERIODICA SMORZATA

EVOLUZIONE PSEUDOPERIODICA

In definitiva, se ho una coppia di valori complessi coniugati otterrò un’oscillazione che varia nel tempo.

• MODI PURAMENTE OSCILLATORI


Nel caso di autovalori complessi coniugati a modulo unitario , cioè che si trovano sul cerchio unitario nel piano complesso,
nascono modi di evoluzione del tipo:
che presentano un carattere di oscillazione pura (non smorzata) di periodo:

Si parla di MODI PURAMENTE OSCILLATORI ed EVOLUZIONE PERIODICA.


Inoltre, se gli autovalori sono sull’asse avrò un andamento costante se , alternante se
• MODI DI EVOLUZIONE E RISPOSTA FORZATA
• MODI DI EVOLUZIONE DEI SISTEMI DISCRETI

Al di fuori della circonferenza di raggio unitario, il modo di evoluzione è divergente come sappiamo, ma variano le caratteristiche a
seconda della collocazione degli autovalori nel piano complesso:

Tw

·...
... ·
I
(2) .. ·
·

I
·


*
(71 ·..

!
(5)

↑.
·.....
·
*
(9) (4) (1)

i ·
·
·
I
·.

· O
&

·
·
.
·
8 ·

15'

(7)
-
·

I
·

(2)

• (1): Xi1, asse reale, modo crescente e divergente

o
• (2) e (2’): sul piano complesso, al di fuori del cerchio di ratio unitari, quindi modi pseudoperiodici oscillanti divergenti
• (3): , asse reale, modo costante (non converge mai)
• (4): , asse reale, modo decrescente e convergente
• (5) e (5’): sul piano complesso, all’interno del cerchio di raggio unitario, quindi modi pseudoperiodici oscillanti, smorzati,
convergenti
• (6): , asse reale, modo decrescente e convergente ma alternato in base al segno
• (7) e (7’): sul piano complesso è sulla circonferenza di raggio unitario, quindi modi pseudoperiodici armonici
• (8): di = 1 , asse reale, modo costante ma alternato in segno
-

• (9): dic1 , asse reale, modo crescente e divergente ma alternato in base al segno

Un modo di evoluzione è “veloce” nel convergere quando più ci si avvicina allo zero da entrambe le parti perché un numero
piccolo, elevato a k, tende molto velocemente ad essere piccolo. Quindi più tende all’origine più è veloce. Altrimenti é lento
(esempio: transitorio).
Anche la divergenza può essere veloce o lenta.
• MODI DI EVOLUZIONE DEI SISTEMI CONTINUI
Nel caso continuo, il cerchio diventa l’asse immaginario; tutto ciò che a sta a sinistra diventa regione di divergenza, mentre tutto ciò
che sta a destra diventa regione di convergenza. Mentre proprio sull’asse immaginario si ha o un’oscillazione pura o un modo di
evoluzione costante.

• (1) e (1’): oscillazione pura


• (2): costante
• (3) e (3’): divergenza pseudoperiodica
• (4): divergenza di tipo esponenziale (asse reale)
• (5): convergenza di tipo esponenziale (asse reale)
• (6) e (6’): convergenza pseudoperiodica smorzata

A tempo continuo, un modo é veloce quando si trova molto lontano dall’origine, se è vicino all’origine, invece, è lento. Il moto
dominante sarà vicino all’origine.
• CAMBIAMENTO DEL SISTEMA DI RIFERIMENTO

In algebra lineare se ho uno spazio di vettori n-dimensionale x(k), posso effettuare un cambiamento di base, ovvero un cambiamento
del sistema di riferimento: associo alla x(k) una v(k).
Il cambiamento di base deve essere biunivoco per evitare la perdita di informazioni.

Consideriamo un sistema:

Che è rappresentato dalla terna (A, B, C).

Per effettuare la trasformazione di base, scrivo:


Essendo che deve essere biunivoca scrivo:
Rappresento il cambiamento di base tramite la matrice invertibile (nxn) per indicare che la trasformazione é biunivoca; il prodotto
matrice per vettore mi dà un vettore.
Essendo T sempre la stessa, è come se vedessi il vettore x(k) con una base differente.

Per rappresentare la dinamica di v(k) a seguito del cambiamento di base, essendo che conosco la dinamica di x(k), scrivo:

Essendo che x(k+1) non è cambiato, poiché è semplicemente visto da una base differente (la dinamica non cambia), il sistema non
cambia.
Quindi, se effettuo un cambiamento di base, la dinamica del mio sistema posso rappresentarla come:

Rappresentato dalla terna (T AT, T B, CT).


Le matrici per effettuare il cambiamento di base sono infinite, ovvero ne esistono infinite rappresentazioni.

Inoltre, vediamo se, cambiando base, cambia anche la funzione di trasferimento:

Effettuo una manipolazione algebrica e scrivo la matrice identità come T T:

Applico la regola per invertire un prodotto di matrici, possibile se ciascuna matrice è invertibile:
E ottengo:

Quindi, ho dimostrato che la funzione di trasferimento non cambia, ovvero è insensibile alla trasformazione della variabile di stato.

Da ciò deduco che se parto da un sistema di cui conosco la W(z), essendo essa insensibile al cambiamento di base, non esiste
un’unica rappresentazione di stato del sistema. Quindi, se ho una rappresentazione in termini di variabili di stato allora esiste un’unica
funzione di trasferimento; se, invece, ho una rappresentazione in termini di funzioni di trasferimento, allora ho infinite rappresentazioni
di stato del sistema.
Questo problema di passare da una funzione di trasferimento a una in termini di variabili di stato è detto problema di rappresentazione
che ha infinite soluzioni.
Infatti:
• PUNTI DI EQUILBRIO DI SISTEMI DINAMICI LTI Lezione 10
Sono stati in assenza di dinamica, ovvero quando l’istante successivo è uguale al precedente: X(k+ 1) = X(k) VK

Def: Un vettore x è punti di equilibrio di un sistema dinamico se, una volta che lo stato del sistema diventa uguale a x, permarrà uguale
a x in ogni istante di tempo successivo.

Per la definizione dei punti di equilibrio e della loro stabilità si tengono in considerazione gli autovalori della matrice A.

Partiamo dal caso del tempo discreto:


Supponiamo di avere un sistema in assenza di forzamento: X(k + 1) Ax(k) Vk =
,

Affinché x sia un punto di equilibrio deve verificarsi che: X Ax , cioè vogliamo trovare quel vettore che, trasformato secondo A,
-
-

restituisce il vettore stesso. Possiamo riscriverla anche come: (I A) x 0, e in tal caso non sarà più un’equazione alle differenze ma
-
=

algebrica.
Essa è verificata se:
• det(I-A)=0, ovvero x = 0, che è sempre un punto di equilibrio di un sistema LTI non forzato
• det(I-A)=0, ovvero , che è un autovalore di A. Qualsiasi autovettore destro di A, associato all’autovalore 1 sarà un punto di
equilibrio. In tal caso, il sistema avrà infiniti punti di equilibrio; più precisamente, li avrà nella direzione dell’autovettore associato
all’autovalore 1.
(Posso anche moltiplicare per un qualunque coefficiente, quello sarà comunque un punto di equilibrio)

Supponiamo ora di avere un sistema con forzamento costante u, l’equazione dinamica diventa: x(k 1) Ax(k) Be
+ = +

Affinché x sia un punto di equilibrio deve verificarsi: T Ax Bu


= +

anche riscritta come: (I A) x Bu (termine noto = 0)


-
=

In tal caso, invece di avere un sistema omogeneo di equazioni, ottengo un sistema con un termine noto u.
Essa è verificata se:
• det(I-A)=0, ovvero se 1 non è autovalore di A, allora la matrice (I-A) non è singolare né si può calcolare l’inversa, per cui l’unico
punto di equilibrio è: x (1 Al 2 Bü
-

-
=

• det(I-A)=0, ovvero se 1 è un autovalore di A, allora ci saranno zero o infiniti punti di equilibrio a seconda che il sistema sia o meno
compatibile.
La soluzione di tale sistema, lineare, che posso vederlo come Mx=n, è determinata dal teorema di Rouché-Capelli che mi dice che la
soluzione esiste solo se è verificato che rango[M] = rango[M|N] = k. Per sapere, poi, il numero delle soluzioni si confronta il numero k
con il numero delle incognite. Se n > k, il sistema è indeterminato, ossia ha infinite soluzioni che dipendono da n-k variabili libere (si
dice che il sistema ha -Ksoluzioni). Se, invece, n=k il sistema è determinato, ossia ha una sola soluzione.

Vediamo ora il caso del tempo continuo:


Supponiamo di avere un sistema in assenza di forzamento: x(t) Ax(t) =

Nel tempo continuo, dire che il punto non si deve spostare significa dire che la derivata deve essere nulla, cioè: 0 A =

Quindi x = 0 è sempre un punto di equilibrio di un sistema LTI in assenza di ingresso.


Inoltre, se O è un autovalore di A, ciascun autovettore (destro) associato all’autovalore nullo sarà un punto di equilibrio. Si hanno

infiniti punti di equilibrio che hanno la direzione dell’autovettore associato all’autovalore 0.

Supponiamo ora di avere un sistema con forzamento costante u: X(t) Ax(t) + Br =

Affinché x sia un punto di equilibrio, deve verificarsi che: 0 A + Bü =

Ed è verificata se:
• A è invertibile, ovvero se 0 special X A Bu ,
=
-

• Oespechay potranno esserci infiniti punti di equilibrio a seconda che il sistema sia o meno compatibile.

• STABILITÀ
È possibile che il sistema sia in prossimità dell’equilibrio, ovvero che i punti di equilibrio siano dotati di stabilità.

Def: Un punto di equilibrio di un sistema dinamico si dice STABILE se, quando lo stato del sistema viene spostato da quel punto,
esso tende a ritornarci o almeno a non allontanarsi ulteriormente.

Def: Un punto di equilibrio x di un sistema LTI forzato si dice ASINTOTICAMENTE STABILE se, per ciascuna condizione iniziale, il
vettore di stato tende a x al crescere del tempo: se per K - X(k)
+ 0 T ,
>
-

Def: Il punto x si dice INSTABILE se, per qualche condizione iniziale, il vettore di stato rende all’infinito: se per k- c ,
X(k) - + c

Def: Il punto x si dice MARGINALMENTE STABILE se il vettore di stato non torna perfettamente all’equilibrio ma molto vicino ad
*
esso: X(k) X FINITO # ER *
- .
Si noti, però, che il problema della stabilità di un sistema LTI con forzamento costante si può ricondurre a quello della stabilità
dell’origine di un sistema autonomo, introducendo la variabile: E(k) X(k) ↑ (Avendo rimosso il forzamento) = -

E avrò: E(k + 1) X(k 1) x Ax(k) x T


=
+ -
=
-
+

dove: E Ax I che è punto di equilibrio


=
-

Pertanto: E(k 1) Ax(k) u Ax u+ = + - -

c =>
A(X(k) -
x) = Az(k)

Quindi: t(k 1) AE(k) + =

X(k) x z(k)
Cioè quando x è in x, z è nell’origine: = += * = 0

Le proprietà di stabilità, come si evince, dipendono esclusivamente dalla struttura della matrice A e per questo motivo si parla
equivalentemente di stabilità di un punto di equilibrio, stabilità del sistema stesso e stabilità della matrice A.
Un’altra interpretazione di questo risultato è che la soluzione completa del sistema forzato è data dalla somma della soluzione
particolare x più la soluzione dell’omogenea. La stabilità asintotica si avrà quando ciascuna soluzione dell’omogenea tende a 0.
-

(evoluzione forzata TD)


Un punto di equilibrio del sistema lineare tempo-invariante a tempo discreto del tipo: X(k 1) Ax(k) Bu è: + = +

• ASINTOTICAMENTE INSTABILE se gli autovalori di A hanno tutti modulo minore di 1, ovvero se giacciono tutti all’interno del
cerchio di raggio unitario nel piano complesso: il sistema diverge linearmente a Co . 1Xik 1 Vi Il modo: Lk
• INSTABILE se anche un solo autovalore ha modulo maggiore di 1, cioè che diverge. (xi( 1 Vi Il modo: ↓- + per ka +
>
c c

Adesso mostriamo la validità di questo risultato nel caso di matrice A con autovalori reale e nel caso di autovalori complessi
coniugati.
(Per farlo si fa riferimento alla stabilità dell’origine del sistema in evoluzione libera: X(k+ 1) Ax(k) ). =

1) AUTOVALORI REALI - MATRICE A DIAGONALIZZABILE


Se la matrice A è diagonalizzabile, esiste una matrice M tale che: A MAM
-
2
=

dove A è una matrice diagonale con gli autovalori sulla diagonale principale: ↓
[b2 (n)
O =
-
...

Essendo: X(k+ 1) Ax(k) =

dove: X(k) Ax(0)=

e: AF M1M
*
MLL M-1
*
M12M <) MAM Kvolt
-
2 -

= =

Posso scrivere che: -


MdLM x (0) [di ynr] M x (0)
-*
x(k) M = =
.

E da ciò, richiedere che il sistema sia:


• asintoticamente stabile equivale a Hilad Vi 1, ... ,
= M

• instabile equivale alla presenza almeno di un autovalore 1xi) 1 Vi >


,

E applicando la matrice A all’autovettura, a seconda dell’ autovalore, il vettore si espande o contrae lungo la medesima direzione.

Considerando la condizione iniziale X(0) =


3 e Au3 1353 , avrò:
=

X(2) =
Ax(0) => Au3 = 1353
X(2) =
AX(2) = 13Au3 = 130z
x(n) = x3 23
*

E per K >
-
, il sistema diverge.
ca

L’autovettore identifica solo una direzione e il sistema diverge (cioè va all’infinito lungo la direzione dell’autovettore):
• se una qualunque condizione iniziale ha una componente lungo v3;
• se x(0) è pari a un multiplo di v3.
= La condizione iniziale deve essere ortogonale all’auto vettore per non avere instabilità.

2) AUTOVALORI REALI - MATRICE A NON DIAGONALIZZABILE


In questo caso non esiste la matrice M e quindi non elevo scalari alla k. Di conseguenza, non ottengo la matrice ma quella di
Jordan a blocchi. = [ 1 =
.

Un esempio di sistema con matrice A non diagonalizzabile è: X1(k 1) ax(k) X2(k) +


= +

SUPERIORE X2(k+ 1) = axz(k)


In tal caso A = 18a] ha una struttura triangolare ed ha un autovalore
(A)
multiplo X =
a , al quale è associato un unico autovettore
linearmente indipendente.
Prodo e per con
D
e
Posso fare: A 58] [8 E] Ja2& =
2 =

È la struttura triangolare si è mantenuta.


A 5220] 592]
= =
[a sae
:

[ P Kalk e
F
A =

K
Studiando A conosciamo i modi di evoluzione del sistema.
L’evoluzione libera so che ha questa espressione:
cioè:

E posso scrivere:
cioè:
Da ciò deduco che l’evoluzione libera sarà una combinazione lineare di due tipi di moti e .

Tali considerazioni si estendono al caso di autovalori multipli ai quali non è associato un insieme completo di autovettori
indipendenti. In tal caso, la risposta conterrà termini tipo
Infatti, essendo , per so cosa succede:
• il sistema converge, tende a 0
• il sistema diverge, va all’infinito
• termine costante

Questo lo posso dimostrare calcolando che


equivale a:

Da cui:

3) AUTOVALORI COMPLESSI CONIUGATI


Nella diagonalizzazione della matrice posso anche avere: se è un autovalore complesso di A, anche il suo
complesso coniugato è un autovalore di A.

Rappresentazione di come vettore


con modulo e fase

Da osservazione trigonometriche:

(Il coniugato avrà la stessa parte reale e la parte immaginaria cambiata di segno)
I modi associati a questi autovalori sono del tipo , da cui quindi:
La risposta del sistema associata alla coppia di autovalori complessi coniugati è:
In questo caso, però, diversamente dal caso degli autovalori reali, si parla di moti oscillanti:
• convergenti se (Oscillazioni smorzate)
• divergenti se
Basta un solo autovalore con modulo maggiore di 1 per avere instabilità.

• MARGINALE STABILITÀ
Nel caso in cui i modi non convergono e non divergono, cioè nel caso in cui gli autovalori giacciono all’interno del cerchio di raggio
unitario, tranne quelli che giacciono sul cerchio stesso, si parla di MARGINALE STABILITÀ.

Se ho autovalori reali con modulo unitario:


• se la molteplicità è 1, spostato l’equilibrio non ritorno in 0 ma non mi allontano neanche (moto costante)
• se la molteplicità è doppia, un modo mi fa rimanere vicino e l’altro mi allontana (linearmente) (moto alternante)

Se ho autovalori complessi, questo abbiamo detto che corrisponde a modi oscillanti.


Torniamo al caso degli autovalori complessi e coniugati.
Considero una coppia di autovalori, nel caso continuo:

Il risultato ottenuto rappresenta l’andamento del moto associato agli autovalori complessi e coniugati che, nel tempo reale, non hanno
più una parte immaginaria.
Si considerano 3 casi:

, a sinistra asse jw, convergenza pseudoperiodica che dipende dalla parte reale dell’autovalore, mentre la frequenza da w.

Modo convergente generato dai vettori va e vb

, a destra dell’asse jw, divergenza pseudoperiodica

Moto divergente

, su asse jw, moto periodico puro

Moto periodico (inviluppo non esponenziale)


Caso discreto, autovalori complessi e coniugati:
La differenza rispetto al caso del moto continuo ara nell’ampiezza di (al posto di inviluppo ) e nella frequenza (al posto di ).

In tal caso il moto si svolge lungo il piano formato dai vettori va e vb.
Distinguiamo 3 casi:

Convergenza pseudoperiodica smorzata

Divergenza pseudoperiodica amplificata

Periodico oscillatorio puro

La rappresentazione è la stessa del caso continuo, ma con linea tratteggiata poiché si lavora per istanti.

• COSTANTI DI TEMPO
Caso continuo:
L’inviluppo della risposta associata agli autovalori con molteplicità mi = 1 è del tipo:

dove é la costante di tempo.


In tal caso conviene studiare il moto in relazione a poiché consente di effettuare un’analisi qualitativa del tasso di decadimento
dell’evoluzione, infatti:
• per la condizione iniziale riduce la sua ampiezza del 95%
• per è ridotta del 99%
Quindi, dopo tre o quattro volte, il modo ha ridotto la sua ampiezza e si trova nell’intervallo tra [5%;1%], fino ad essere trascurabile.
Con grandi, le sono piccole e dominanti nell’evoluzione.

Caso discreto:
L’inviluppo è del tipo:

dove così da ottenere ancora


• MODELLO CORSA AGLI ARMAMENTI
Il "modello corsa agli armamenti" si riferisce a un fenomeno in cui due o più nazioni o gruppi competono nella produzione e
nell'accumulo di armi militari in un ciclo di escalation. Questo ciclo può essere motivato da timori di sicurezza, competizione geopolitica
o altre ragioni. Tuttavia, spesso può portare a tensioni internazionali e aumentare il rischio di conflitti.
In passato, la corsa agli armamenti è stata associata a periodi di tensione tra le nazioni, come durante la guerra fredda.

Con la teoria dei sistemi dinamici, la corsa agli armamenti può essere modellata come un processo dinamico in cui le variabili, come la
quantità di armamenti accumulate da ciascuna nazione, evolvono nel tempo in risposta alle decisioni e alle azioni delle altre nazioni,
descritte da equazioni differenziali.

Utilizziamo il modello di Volterra, comunemente usato per descrivere interazioni predatore-preda. Supponiamo di avere due nazioni,
con i rispettivi livelli di armamenti (potenze militari), x e y:

dove:
• a è il tasso di decadimento, ad esempio dovuto all’obsolescenza delle armi;
• k è il coefficiente di difesa, ovvero il coefficiente che indica quanto l’accumulo di potenza miliare di una nazione influenzi
l’accumulo di potenza miliare dell’altra (per difendersi appunto);
• g è la propensione al conflitto, ovvero il tasso di produzione di armamenti di quella nazione.

Per evitare conflitti si devono studiare gli equilibri e si deve verificare che essi siano asintoticamente stabili.
Per trovare le coordinate dell’equilibrio si deve quindi risolvere il sistema di equazioni differenziali che descrive l’evoluzione delle
potenze militari delle due nazioni. L’equilibrio si verifica quando le derivate delle potenze militari rispetto al tempo sono nulle per
entrambe le nazioni, quindi:

Le incognite sono x e y, mentre supponiamo noti a, g, k, a’, g’, k’.


Le coordinate dell’equilibrio sono:

Tali valori rappresentano, quindi, il punto in cui le forze che influenzano l’accumulo di potenza militare di entrambe le nazioni si
bilanciano ed esse non cambiano la propria produzione di armamenti.

Per verificare, poi, che l’equilibrio sia asintoticamente stabile, dopo aver trovato il punto di equilibrio del sistema, si deve calcolare la
matrice jacobiana del sistema, valutata in quel punto:

Poi si calcola il polinomio caratteristico della matrice jacobiana:

Successivamente, bisogna trovare gli autovalori del sistema, risolvendo il polinomio caratteristico, ponendo il determinante uguale a 0:

Ed infine, verificare la stabilità dell'equilibrio esaminando il segno della parte reale degli autovalori: se tutti gli autovalori hanno parte
reale negativa, l'equilibrio è asintoticamente stabile. Se almeno uno degli autovalori ha parte reale positiva, l'equilibrio è instabile.
In altri termini, se i coefficienti sono maggiori di 0, gli autovalori sono < 0 (convergenti), e quindi si parla di modi asintoticamente
stabili.
Lezione 11
• MODELLO DI MIGRAZIONE

La popolazione totale risulta (u(k)+r(k)).


Per sostenere questa popolazione è necessaria una frazione della popolazione che si dedichi all’attività di produzione agricola:

Essa, però, è una condizione ottimale, in quanto vi é uno sbilanciamento che determina i flussi migratori (a causa della crescita
della popolazione e del non aumento invece degli addetti alla produzione alimentare):
Questo sottolinea che, se non c’è sufficiente produzione agricola, la gente della popolazione urbana di sposta in quella rurale; se,
invece, lo sbilanciamento è negativo, ovvero vi è un eccesso, la popolazione rurale si sposta in quella urbana.

Un semplice modello di migrazione può essere:

dove il + e il - sono convenzionali:


• - si mette se c’è svuotamento
• + si mette se c’è incremento
è il tasso del flusso migratorio.
Sono opposti, sempre, perché quando una popolazione diminuisce l’altra aumenta (per via di flussi migratori), e viceversa.
(Se conoscessimo i valori di , sostituendoli nell equazioni scritte sopra, potremmo sapere, attraverso matlab, quando il
sistema raggiunge l’equilibrio, ovvero quando cessano i flussi migratori).

Attraverso la matrice dinamica del sistema:

È possibile fare un’analisi qualitativa del comportamento dinamico del sistema, senza effettuare alcun calcolo numerico. Per fare
ciò, riepiloghiamo tutte le proprietà degli autovalori in modo da poterle sfruttare adeguatamente.

1) Sappiamo che:
dove i ei sono gli autovettori destri, ovvero le direzioni privilegiate dell’operatore A.
Se consideriamo quest’altro vettore:
che è un vettore riga poiché ho dimensioni rispettivamente: (1xn)(nxn)= (1xn).
Possiamo chiederci quali sono gli autovettori sinistri della matrice, ma in realtà se traspongo, modificando non i valori ma la
posizione relativa ad ambo i membri, ottengo:
Da cui deduciamo che la prima proprietà è:
• gli autovettori sinistri sono quelli destri della matrice trasposta
• siccome gli autovalori di A e A sono uguali, essendo invarianti rispetto la trasposizione, allora:

2) Partiamo sempre da:


Moltiplico a sinistra per fj:
E poi a destra per ei:
I primi due membri di queste ultime due relazioni che ho scritto sono uguali, perciò sottraendo membro a membro ottengo:

Se la matrice A ha gli autovalori sono tutti distanti e reali, allora la differenza


E ottengo:
Ovvero sono tra loro ortogonali.

Quindi, per ogni ottengo una base ortogonale alla base degli autovettori.
3) Inoltre, posso normalizzare il sistema degli autovettori, facendo in modo che: e
Cioè, la direzione degli autovettori la posso individuare con un versore, ovver un vettore di modulo unitario.
Allora, se costruisco una matrice di autovettori sinistri, disponendoli uno sotto l’altro poiché sono vettori riga, e una matrice V di
autovettori destri, facendo il prodotto, ottengo la matrice I :

Allora, avendo ottenuto la matrice identità, la prima matrice non è altro che U, ovvero la matrice degli autovettori sinistri
normalizzata.
Per la proprietà di ortogonalità, se moltiplico la condizione iniziale per la riga di V ottengo una proiezione ortogonale
sill’autovettore corrispondente.

4) In relazione all’evoluzione libera x(k), per evidenziare i modi, si considera la composizione diadica della matrice, e si giunge
a questo risultato:
con autovalori reali e distinti.
Consideriamo la proiezione lungo l’autovettore (prodotto scalare):
possiamo scrivere:
dove x1(k) è il modo unidirezionale che si svolge lungo v1, e così via. Quindi abbiamo rappresentato una base in v1, … , vn è
come componenti x1, … , xn. Cioè, il modo di evoluzione del vettore stato lo vediamo lungo direzioni fisse e, componendo
queste evoluzioni, si riesce ad ottenere la traiettoria nello spazio di stato.

La freccia rossa é la traiettoria ottenuta, che evidenzia ad esempio il comportamento portando all’origine, dopo avere composto
le 2 dinamiche lungo i 2 autovettori.

Moltiplico ambo i membri dell’ultima relazione scritta sopra per fj ed ottengo xj(k), poiché gli altri membri vanno via essendo
tutti ortogonali tra loro. Da ciò deduco che, moltiplicando l’evoluzione per un autovettore sinistro, isolo il comportamento lungo i
corrispondenti autovettori.

Se si cambiasse base, passando a quella degli autovettori, si perderebbe il significato fisico delle variabili di stato, ma si
avrebbe una visibilità dei modi di evoluzione. Nello spazio cambiato, non si avrà più un movimento reciproco delle traiettorie,
ma si avrà che una dinamica evolve lungo la direzione v1 e una lungo v2, avendole disaccoppiate.

5) Consideriamo il sistema: x(k+1) = Ax(k).


Se considero: z(k) = f x(k), cioè una combinazione lineare delle variabili di stato attraverso i coefficienti dell’autovettore sinistro,
si ottiene una quantità scalare. La dinamica di questa combinazione di variabili di stato:

Prendendo uno degli autovettori sinistri, si determina una combinazione lineare delle variabili di stato che evolve secondo
l’autovalore .
Questo ci permette, quindi, di fare un’analisi qualitativa e non quantitativa del comportamento associato all’autovalore.

Torniamo ora al modello di migrazione:


1) Visto che la popolazione complessiva u(k)+r(k) cresce con un tasso pari a , l’autovettore sinistro associato all’autovalore è
[1 1]. Questo perché, come detto prima nella , si ha:
Cioè, in questo caso:
Ho creato una combinazione lineare scalare che evolve secondo il tasso di crescita , che sarà autovalore di A.

2) L’autovettore destro corrispondente all’autovalore è quello in corrispondenza del quale le singole popolazione u(k) e r(k)
crescono con uno stesso tasso . Questo avviene quando non c’è migrazione, ovvero quando
Cioè le popolazioni sono bilanciate nel rapporto
Quindi, l’autovettore sarà:

Nello spazio di stato, questa proporzione mi dice che sto su una retta e le variabili saranno sempre in quella direzione, crescendo
con un tasso pari a .
3) Considerando la proprietà di ortogonalità tra autovettori destri e sinistri, il secondo autovettore destro dovrà essere ortogonale
al primo autovettore sinistro e sarà del tipo [1 -1], poiché moltiplicato per u1 fa zero.
L’altra variabile la rappresento con 1 e —1:

Noto che lungo la nuova dinamica, v2, c’è una popolazione che diminuisce e l’altra che aumenta, a cui non posso dare un
significato fisico, perdendo l’interpretazione della seconda variabile di stato.
Per conoscere il valore di v2 effettuo il secondo prodotto:

Che è il secondo autovalore.

4) Dobbiamo trovare il valore di u2, secondo autovettore sinistro, e per farlo sfruttiamo l’ortogonalità con il primo autovettore
destro. Otteniamo che esso è: associato all’autovalore . Moltiplicandolo a destra per il vettore di stato otteniamo
la combinazione lineare di variabili di stato che sta lungo la direzione dell’autovettore destro corrispondente:
Esso rappresenta lo sbilanciamento della popolazione rurale rispetto alla condizione ottimale.

+ richiami algebra lineare


Lezione 12
• ANALISI DELLE PROPRIETÀ STRUTTURALI DEI SISTEMI
La RAGGIUNGIBILITÀ di un sistema dinamico è una proprietà che ha a che fare con la capacità di guidare il sistema dinamico ad
assumere configurazioni di stato desiderate attraverso il segnale di ingresso.
Consideriamo l’equazione di transizione di stato:
Se tutte le configurazioni sono raggiungibili, si parla di sistema completamente raggiungibile.
Guardiamo l’equazione come l’applicazione di due operatori descritti dalle matrici A e B che generano due vettori dello spazio di
stato R ; per la sovrapponibilità degli effetti, possiamo dire che il vettore di stato all’istante k+1 si ottiene come risultante di due
vettori:
• quello generato dall’applicazione della trasformazione A da R a R allo stato precedente
• quello generato dal vettore u(k) attraverso la trasformazione B che da R porta in R (con m < n)

Se consideriamo lo stato in evoluzione libera, u = 0, il grado di libertà consiste solo nella scelta dello stato iniziale, cioè qualunque
sia x(0) si ottiene l’immagine moltiplicando per A. Applico, poi, A all’immagine di A: im[A] è invariante e quindi le traiettorie
dell’evoluzione libera rimangono confinate in im[A]. Se A è di pieno rango, im[A] copre tutto lo spazio, cioè posso raggiungere tutti i
punti dello spazio. Anche se cambiassi condizione iniziale, ottengo sempre una configurazione contenuta in im[A].
Quindi, in altri termini: per ogni possibile stato iniziale, le configurazioni che possono essere raggiunte appartengono tutte a im[A].

Consideriamo, invece, il sistema in evoluzione forzata: in tal caso si parla di CONTROLLO.


Supponendo di avere libertà di scelta per u(k) in tutto R , decido di partire da x(0) = 0 (poiché abbandono l’evoluzione libera).
Di conseguenza il primo passo, partendo da zero, sarà: x(1) = Bu(0), che rappresenta una relazione tra lo stato del sistema al tempo
t = 1 e l'ingresso del sistema al tempo t = 0, e dove x(1) sarà un insieme dello spazio di stato, rappresentato dall’ im[B].
L’immagine di B é un sottospazio, essendo B una trasformazione, e quindi possiamo raggiungere uno dei qualsiasi punti di esso,
anche combinando i suoi elementi.
Stando ora nell’ im[B] non ho più condizioni iniziali nulle e posso ampliare il mio spazio, applicando la matrice A (matrice di stato del
sistema); ciò che sto cercando di fare è di invadere tutto lo spazio cosicché da raggiungere tutte le configurazioni possibili (senza
limiti di tempo).

Non avendo posto limiti di tempo, questa azione di ampliamento di S , sottospazio degli stati raggiungibili, si potrebbe continuare fino a
quando non diventa A-invariante, cioè nel momento in cui non ottengo più cose nuove da aggiungere al sottospazio: c’è un numero di
passi a partire dal quale il sottospazio diventa sicuramente A-invariante ed è inutile continuare a cercare di ampliarlo.
Infatti, per il teorema di HK, una matrice A si può esprimere come combinazione lineare delle potenze di ordine inferiore fino alla
potenza zero.
Quindi, i vettori di A B sono esprimibili come combinazione lineare delle colonne della matrice di raggiungibilità. Posso dimostrarlo:
Ho una matrice A e calcolo il polinomio caratteristico:
Sostituisco A a e ottengo zero:
cioè ogni matrice nullifica il proprio polinomio caratteristico.
Avendo sostituito A a , ho ottenuto una combinazione lineare di matrici:
Porto A al secondo membro e ottengo:
dove n è l’ordine di A.
Quindi, conoscendo il polinomio caratteristico posso calcolare le potenze di A: per calcolare la matrice n-esima di A ho bisogno di
conoscere le potenze precedenti e la matrice identità I. Dal punto di vista algebrico, significa che le sue colonne si ottengono come
combinazione lineare delle colonne della matrice I e di quella A , sono cioè linearmente indipendenti.
Quindi, partendo da im[B] e andando in tutte le altre immagini, arrivo a costruire la matrice di raggiungibilità, arrivando non all’infinito ma
a n-1 poiché voglio esprimere i vettori A B :
Gli stati verso cui si può pilotare lo stato del sistema, a partire dallo stato zero, coincidono con il sottospazio:
e le sue dimensioni sono date dal rango della matrice, di raggiungibilità R. L’insieme R rappresenta tutte le configurazioni che il
sistema può assumere nel tempo. L’istante n-1 è l’istante in cui S diventa A-invariante (n-1 passi poiché parto da zero).
• Se il rango della matrice di raggiungibilità è pari alla dimensione del sistema, cioè è pieno, allora la coppia (A, B) si dice
completamente raggiungibile e tutto lo spazio (cioè tutte le configurazioni) possono essere raggiunte in un tempo pari al
massimo in n-1:
• Se il rango non è pieno, il sistema non è completamente raggiungibile, ovvero ci sono configurazioni che non possono essere
raggiunte.

Lo spazio di un sistema non completamente raggiungibile, quindi, può decomporsi in un sottospazio di raggiungibilità X e nel suo
complemento ortogonale, detto sottospazio di non raggiungibilità X = X , in modo tale che possiamo ricostruire R come somma
diretta di X e di X :

Considerando che lo spazio sia non completamente raggiungibile, effettuo un cambiamento di base nello spazio di stato.
Per farlo, predispongo una base di X , nella quale vedrò che il vettore si stato x(k) si trasformerà tramite la trasformata T in un altro
vettore che avrà due componenti e riesco a riconoscere; in questa nuova base, il primo pezzo che è la parte raggiungibile del mio
spazio mentre nel secondo pezzo quella non raggiungibile:

Con il cambiamento avrò:

dove le F determinano le dinamiche delle x, precisamente F11 rappresenta la quota raggiungibile mentre F22 quella non raggiungibile.
La matrice B’ sarà rappresentata da due matrici:
• La matrice G che ha dimensioni n x p
• La matrice 0 che ha dimensioni n x p (se non vi fosse la matrice nulla allora significherebbe che ci sarebbe un ingresso che può
interagire).
Inoltre, devo avere che la quota raggiungibile e quella non raggiungibile non si influenzino a vicenda, pertanto nel terzo quadrante
aggiungo uno 0; mentre, nel secondo quadrante aggiungo l’interazione tra le due, o meglio l’influenza della parte non raggiungibile su
quella raggiungibile, poiché è un’influenza che non nuoce:

Si vede che la componente raggiungibile evolve per effetto di se stessa e di quella mom raggiungibile; mentre, la componente non
raggiungibile evolve solo in relazione a se stessa ed influenza il sottospazio raggiungibile.

Quindi, in conclusione, attraverso questo cambio di base, il sistema può essere rappresentato attraverso una coppia di matrici (F,G)
che mettono in evidenza la componente raggiungibile e quella non raggiungibile dello stato e le influenze esterne.
Possiamo scrivere:

La raggiungibilità del sistema è una proprietà strutturale del sistema, in quanto dipende solo dalla coppia di matrici (A,B), dalla loro
struttura e dai loro parametri.

Una volta definito quale sia lo spazio di raggiungibilità nasce il problema del controllo, cioè il progetto della sequenza di azioni di
controllo che possa portare il sistema in uno stato raggiungibile desiderato, nel tempo desiderato.
La CONTROLLABILITÀ è quella caratteristica del sistema dinamico che consente di portare a zero (equilibrio) lo stato del sistema,
a partire da qualunque stato iniziale x0:
• se l’origine dello spazio di stato è l’unico punto di equilibrio, allora esso potrebbe essere raggiunto in evoluzione libera (il
sistema sarebbe sempre controllabile), posto che i modi siano asintoticamente stabili.
• se così non fosse, è necessario che, partendo da:

questa somma di evoluzione libera e forzata deve essere uguale a 0:

Cioè:

Ciò significa che l’evoluzione forzata (l’azione di controllo) deve “cancellare” l’evoluzione libera divergente.
Se è possibile avere questa identità, per un generico x0, allora: im[A ] im[R], cioè il sistema è completamente controllabile.
Questo implica anche che il sistema è completamente raggiungibile.
Il contrario non è vero.

Consideriamo ora un sistema a tempo continuo (LTI): è possibile fare lo stesso ragionamento.
Il sistema di equazioni differenziali sappiamo che è:
e la matrice di raggiungibilità è:
il cui rango dà indicazioni sulla completa o parziale raggiungibilità del sistema:
• rango pieno: completamente raggiungibile
• rango non pieno: si crea uno sottospazio ortogonale che rappresenta i punti raggiungibili.

Le principali differenze con i sistemi a tempo discreto, analizzati sopra, sono:


• Le proprietà di raggiungibilità e controllabilità sono implicate l’una dall’altra nel caso di tempo continuo;
• Mentre per un sistema a tempo discreto il sottospazio degli spazi raggiungibili si incrementa passo dopo passo, in un sistema a
tempo continuo può espandersi alle sue dimensioni massime anche in tempi infinitesimi.

Adesso parliamo del PROBLEMA DI OSSERVABILITÀ.


Per introdurlo, consideriamo il sistema in evoluzione libera:

dove, per semplicità, omettiamo il termine di forzamento che, essendo una quantità nota, può essere omesso senza perdite di
generalità.
Come sappiamo, le variabili di ingresso sono accessibili, cioè hanno un significato fisico perché sono delle quantità misurabili,
menate le variabili di stato sono delle variabili interne, cioè potrebbero non avere un significato fisico.
In particolare, sappiamo di avere un’evoluzione libera poiché non compare la matrice B, ma sono la A e la C. Immaginiamo di
vedere l’evoluzione attraverso le uscite y (e non tramite le variabili di stato), le quali sono sicuramente meno delle variabili di stato
poiché altrimenti le uscite sarebbero liberamente dipendenti e conterrebbero tutte le stesse informazioni. Ciò vuol dire che non
monitoro tutte le variabili di stato ma solamente alcune combinazioni lineari di variabili di stato.
Ad esempio, se avessimo un sistema elementare con 2 uscite, y1 e y2, e 3 variabili di stato, x1, x2 e x3:

da ciò noto che si può monitorare solo x1 e x2, mentre il valore di x3 non si può conoscere (guardando il sistema attraverso la y).
Se, invece, avessi:

deduco di poter monitorare una combinazione lineare di x1 e x3 (la loro somma) e la x2.
Per avere, però, i loro valori isolati devo applicare il problema dell’osservabilità.

Conosciamo il modello (quello in evoluzione libera), cioè A, C e y(k) note, ma non conosciamo le variabili di stato.
Sappiamo che la matrice C ha dimensioni pxn con p<n, cioè è una matrice rettangolare (poiché se fosse quadrata, ed invertibile, si
avrebbe il numero di uscire uguale al numero di variabili di stato, quindi tutte le variabili di stato sarebbero monitorate):

Di conseguenza, non è invertibile.


Quindi, da una misura istantanea del vettore delle uscite non sarebbe possibile risalire al vettore di stato. Per ricostruire lo stato,
bisogna accumulare le misure di uscita in vari istanti di tempo, avendo come unica incognita lo stato iniziale del sistema. Infatti,
noto lo stato iniziale si può valutare lo stato attuale x(k) attraverso
Un sistema nel quale è possibile fare ciò è detto osservabile.
Osservare lo stato del sistema significa, quindi, ricostruirlo attraverso le misure di uscita.
Possiamo scrivere:

Arriviamo a y(n-1) poiché per il teorema di HK le successive misure sarebbero linearmente dipendenti dalle precedenti.
Inoltre, possiamo anche riscriverlo come un sistema lineare di equazioni nell’incognita x0:

In forma matriciale (rettangolare):

dove il primo termine è il termine noto di dimensioni pn, il secondo termine è la matrice dei coefficienti di dimensioni pnxn e x0 è
l’incognita. È possibile risalire alla x0, e quindi risolvere il sistema, quando il rango della matrice dei coefficienti è uguale a n, cioè
si deve poter estrarre una matrice quadrata e invertibile, e ciò si può fare poiché si ha una ridondanza di righe (aspetto l’accumulo
di informazioni finché non arrivo ad averne un numero per cui sono certo di poter invertire).
La matrice dei coefficienti si può scrivere in maniera orizzontale e viene detta matrice di osservabilità O:

Se il rango della matrice O è uguale a n, allora il sistema si dice completamente osservabile, cioè il Ker[O] è banale.
Se, invece, la matrice non ha rango pieno, allora il Ker[O] non è banale (cioè contiene più elementi che non il solo stato nullo) e
pertanto definisce il cosiddetto sottospazio di non osservabilità Xno, ovvero il sottspazio degli stati del sistema che non posso
essere ricostruiti. Il suo complemento ortogonale Xno = Xo sarà il sottospazio degli stati osservabili del sistema.
Infine, posso dire che:

Consideriamo ora il cambiamento di base: io so che si possono costruire tanti cambiamenti di base rappresentato dalla matrice di
trasformazione T . Mi interessa, però, quella trasformazione che mette in evidenza le componenti osservabili da quelle non
osservabili; pertanto, combino una base del sottospazio osservabile e una del sottospazio non osservabile. Costruisco, di
conseguenza, una nuova base fatta nel seguente modo:
Inoltre, in questa nuova base, vedrò una nuova matrice C.
In particolare, avrò:

dove H è una matrice qualsiasi, mentre 0 è la matrice nulla (perché la y che vedo non può dipendere dalla parte non osservabile).
Invece, la matrice A sarà così costituita:

Da cui, infatti, si nota che la parte non osservabile (2 e 3 quadrante) ha una sua evoluzione ma io non la vedo dall’uscita, mentre
la parte osservabile (1 e 4 quadrante) sì. Più precisamente: F21 significa che la parte non osservabile dipende da quella
osservabile ma non il viceversa (F12=0).
In generale avrò:

Quindi, la componente osservabile non dipende dalla componente non osservabile; mentre, la componente non osservabile
dipende sia da quella osservabile che non. E la trasformazione di uscita è generata solo da Xo.
Infatti, in termini di schemi a blocchi, tale situazione può essere così rappresentata:

(Si fa lo stesso ragionamento anche nel caso di sistemi a tempo continuo, visto che stiamo parlando delle matrici.)

Da ciò si deduce che anche l’osservabilità è una proprietà strutturale del sistema perché dipende dalla struttura e dalla forma
della coppia di matrici (A, C).
Essa è una proprietà indipendente dalla raggiungibilità, ma non è escluso che una componente sia osservabile ma non
raggiungibile oppure raggiungibile ma non osservabile.

La ricostruzione dello stato si fa attraverso un osservatore, cioè un sistema che ha in ingresso tutte le informazioni sul modello e
in uscita propone una stima dello stato, la cui incertezza si riduce nel tempo.
Inoltre, è possibile sezionare internamente lo spazio di stato del sistema: sottospazio di raggiungibilità e sottospazio di non
osservabilità. Tramite i complementi ortogonali mi trovo poi anche il sottospazio di non raggiungibilità e il sottospazio di
osservabilità.

Detto ciò, è possibile calcolare:


• Sottospazio intersezione che contiene tutti gli stati raggiungibili e osservabili: che rappresenta la parte viva del
sistema
• Sottospazio intersezione che contiene tutti gli raggiungibili e non osservabili:
• Sottospazio intersezione che contiene tutti gli stati non raggiungibili e osservabili:
• Sottospazio intersezione che contiene tutti gli stati non raggiungibili e non osservabili:

Dato un sistema, è possibile rappresentare tutte queste componenti:

Esisterà una trasformazione di base, detta di KALMAN, che decompone lo stato del sistema in una componente non
raggiungibile e non osservabile, una componente raggiungibile ma non osservabile, una componente osservabile ma non
raggiungibile.
Se in questa nuova base di rappresentazione andassimo a calcolare la funzione di trasferimento (descrizione i-u e non dello
spazio di stato del sistema), troveremo che il legame tra u e y è descritto SOLO dalla parte viva del sistema (quadrante rosso),
che è raggiungibile e osservabile. Pertanto, la funzione di trasferimento non dipende dalla parte cieca e, in particolare, gli
autovalori della parte cieca del sistema non sono poli di W(z). Quindi, in questa visione i-u perdo le quote nr e no, cioè perdo il
collegamento tra ingresso e stato e tra stato e uscita.
Se il sistema, invece, fosse completamente raggiungibile, la parte viva sarebbe tutto il sistema. Oppure se effettuassi una
descrizione attraverso lo spazio di stato, ciò mi permetterebbe di “vedere” anche la parte cieca.
Ora rifacciamo tutto il discorso delle proprietà strutturali facendo riferimento a un sistema a tempo continuo , anche se lo studio è
analogo a quello fatto finora per i sistemi a tempo discreto.

Consideriamo un sistema di tipo lineare LTI a tempo continuo: X(t Ax(t Bu(t) = +

con X(teR VER .

Si tratta di un vettore con origine in O che si sposta con continuità nello spazio di stato n-dimensionale (e non in modo “scattante” come
nel discreto) e in cui determina una traiettoria. Per vedere l’evoluzione di questa traiettoria nel tempo si impiega un sistema di
riferimento con asse temporale. Poiché, senza asse, invece, la traiettoria risulterebbe schiacciata su di un piano evolvendo per ogni t.

1) PROBLEMA DELLA RAGGIUNGIBILITÀ:


Supponendo x(0)=0, cioè la partenza dall’origine, è possibile scegliere un ingresso tale che sia possibile raggiungere tutti i punti dello
n n
spazio di stato R ? Il vettore che si genera #t può collocarsi in ogni punto di R ?
Il problema, pertanto, diventa il dover determinare M[0 ; c) (scelgo come grado di libertà la seguente funzione) tale che si possa
+
M
raggiungere tutto R , anche in un tempo infinito.
Applichiamo il teorema di HK alla matrice A:
R =
[B AB ...
AB]
È la matrice di raggiungibilità in cui il numero di colonne é maggiore di quello delle righe.
n
Le potenze di A si possono esprimere come combinazioni lineari delle potenze dalla 0-esima alla n-1esima di A.
M

Estraggo colonne indipendenti cercando il rango di R per effettuare il test:


R

• se rank[R] = n, cioè è pieno, il sistema è completamente raggiungibile in R


• se il rank[R] < n = m, si delinea un sottospazio di raggiungibilità: ottengo un’informazione sulla dimensione di tale sottospazio che
sarà m-dimensionale.
Quindi, si definisce:
• un sottospazio m-dimensionale che è il sottospazio dello spazio di stato raggiungibile: X R
• un sottospazio (n-m) dimensionale che è il sottospazio dello spazio di stato non raggiungibile: X NR , ottenuto come il complemento
ortogonale di X R
e pertanto, l’intero spazio di stato è ottenuto come somma diretta dei due sottospazi: XR XwR, ottenendo una visione dello spazio di +

stato con le parti raggiungibili e quelle non raggiungibili.

Inoltre, si può effettuare una trasformazione di base per osservare x(t) nella forma z(t) attraverso la trasformata T -1z(
: T 2x(t)
-

I
Essendo che esiste l’inversa T , la trasformazione è biunivoca e quindi è sempre possibile effettuare la trasformazione inversa da z a
-

x.
Quindi, è possibile vedere la x secondo le componenti che giacciono nella parte raggiungibile e in quella non raggiungibile:
z(t) =
[ERJrödim e-m
E queste componenti possono essere dedotte in base alla loro raggiungibilità:
• Quelle di ordine m che sono dette pilotabili, cioè controllabili
• Quelle di ordine (n-m), non controllabili.
Infatti, nel caso di base iniziale originaria x(t) non era possibile determinare quali componenti fossero raggiungibili e quali no, poiché
ottenute come combinazione lineare di componenti; mentre nelle z si, anche se si perde il significato della rappresentazione fisica.

Inoltre, la matrice A, per effetto della trasformazione di base, sarà: A T 2AT F


-

= =

Mentre la matrice B sarà: B T 2B G =


-

Tenendo conto di queste trasformazioni posso scrivere: ER(t) F21ZR(t) =

Evr(t) = - + Fa2Enr(t)
Queste due quantità sono dovute alla dinamica dovuta a se stessa, ma può accadere che, ad esempio, la variabile non raggiungibile
possa influenzare quella raggiungibile, ma non può accadere il contrario (altrimenti si potrebbe influenzare indirettamente anche la
variabile non raggiungibile). Pertanto, si può scrivere: Er(t) F2ER(t) G2zu(t)= +
F22Enr(t) ⑳
+

ENp(t) =. + Fe2 E NR(t)

EziF
F
. .

Da cui: =

,
G =. Ae

dove F è una matrice diagonale superiore.

2) PROBLEMA DELL’OSSERVABILITÀ:
Consideriamo: x(t) Ax(t) =

y(t) =
(x(t)

con: X(elR" VteIR


Supponiamo di partire da una situazione diversa da quella considerata per il problema della raggiungibilità, cioè supponiamo x(0)=0 e
cioè x(0)=x0. Si vuole osservare se è possibile conoscere lo stato iniziale, a partire da y=Cx(t). Possono esserci più soluzioni poiché ci
sono più traiettorie e, quindi, ci si pone il problema dell’ottimizzazione nella scelta di u(t), massimizzando o minimizzando l’obiettivo. Si
parla di CONTROLLO OTTIMO.
“Osservare” lo stato significa effettuare una “inferenza”, cioè le variabili di uscita misurabili ci consegnano il valore di quelle iniziali.
Vi sono, però, un numero superiore di variabili di stato rispetto a quelle di uscita, e quindi la trasformazione non è biunivoca.
Affinché lo sia C deve essere quadrata, di rango pieno e invertibile.
Da y(t) si vuole determinare x(t), stimandone il valore in base alle misure di y(t) accumulate nel tempo dinamicamente. Per
conoscere la x(t) esatta, bisogna utilizzare tante misure ottenute in tanti diversi istanti di tempo, e quindi si devono accumulare tante
misure di y(t) nel tempo, linearmente indipendenti, tale che esista la trasformazione che restituisce tutte le x(t) [stato deterministico].
Nella prima equazione non considero il termine +Bu(t) poiché se esistesse la u(t), essendo un ingresso che ho decido io, sarebbe
ovviamente nota e quindi, in ogni caso, l’unica incognita sarebbe sempre la x(t).

Per risolvere il problema, costruisco una matrice di osservabilità:

• Se il rango é pari a n, allora il sistema è osservabile;


• Se il rank[O] = m < n, allora si crea un sottospazio osservabile m-dimensionale e un sottospazio non osservabile (n-m)-
dimensionale.
Quindi, si ha:
• Il sottospazio non osservabile dello spazio di stato X che è non banale, poiché Ker[O]=0, cioè x(t)=0. Ciò significa che vedo
quali x0 si trasformano nell’uscita zero
• Il sottospazio osservabile dello spazio di stato X , ottenuto come complemento ortogonale di X , che invece è banale.

Da cui si ottiene che l’intero spazio di stato è dato dalla somma diretta di:

Effettuo poi un cambiamento di base da x(t) a z(t), costruendo una nuova trasformata T :
In questa nuova base avrò una componente osservabile e una non osservabile:

La matrice A diventa la matrice F, e la matrice C quella G.


Pertanto, la dinamica delle componenti sarà:

La componente osservabile, in questo caso, non deve essere influenzata dalla componente non osservabile, ma non può accadere
il viceversa.
E avrò, infine:

E:

3) PROBLEMA DELLA REALIZZAZIONE:


Dato un sistema LTI a tempo continuo SISO:

dove b è un vettore che suggerisce quali variabili influenza ogni ingresso, è possibile definire nel dominio delle Z, la sua funzione di
trasferimento:
che è una funzione razionale fratta, ovvero è il rapporto tra due polinomi:

Il problema inverso consiste nel partire da una funzione di trasferimento nella forma:

ed associarvi una rappresentazione in termini di variabili di stato dello stesso sistema. Questo problema è definito di realizzazione.
L’attribuzione delle variabili di stato non è unica nè arbitraria, ne scelgo una tra le infinite. Le rappresentazioni che impiego sono
dette canoniche, poiché una tra le infinite.
È possibile associare alla funzione di trasferimento la scrittura:
che sono equivalenti.

Il problema può essere risolto attraverso la cosiddetta FORMA CANONICA DI CONTROLLO che ha la forma che associa alla
funzione di trasferimento una tripla di matrici (A, b, c ), così fatta:
La matrice A, in questa forma, presenta all’ultima riga i coefficienti del polinomio caratteristico cambiati di segno e disposti a partire
dall’ultimo.
Se ora si calcola la funzione di trasferimento, utilizzando la forma canonica di controllo, si ottiene proprio la funzione di trasferimento
definita in precedenza, e cioè:
Questa rappresentazione é anche detta “rappresentazione a cascata”, poiché i poli non sono tutti distinti e reali, ma è generica poiché
si ha a che fare con i coefficienti del polinomio caratteristico.
A partire dalla nuova matrice A, è possibile scrivere:

Mentre la matrice C effettua una combinazione lineare con coefficienti “b” e si ottiene la y.

In termini di schema a blocchi, tale rappresentazione può essere così vista:

Quindi, dal nodo sommatore si genera x (k+1), che tramite un blocco ritardatore dà prima x (k) fino ad arrivare a x (k). Inoltre, nel
modo sommatore entrano le retroazioni, cioè le “a”, andando da x (k) fino alla fine. E quindi, si nota, anche dallo schema, che x (k+1)
sarà pari alla somma di tutte le frecce che convergono + l’ingresso.
Tutte le variabili di stato sono innestate nelle successive e quindi l’ultima dipende da tutte le precedenti.

Essa si dice forma canonica di controllo poiché, effettuando il test di controllabilità delle coppie di matrici (A, B), il sistema è
sicuramente controllabile, cioè completamente raggiungibile, poiché l’ingresso può arrivare su tutte le variabili di stato, sia
direttamente che indirettamente (ha rango pieno).

Posso generare infinite realizzazioni, ad esempio tramite i cambiamenti di base. Si parla della FORMA CANONICA DI
OSSERVAZIONE data dalla terna di matrici (A , c, b ), cioè trasponendo la terna (A, b, c ) . Essa ha le stesse caratteristiche della
precedente ma, in tal caso, ad essere verificato è il test di osservabilità, poiché l’ingresso arriva sull’uscita.

Infine, se i poli del sistema fossero tutti reali e distinti, è possibile effettuare la RAPPRESENTAZIONE DIAGONALE del sistema (se
non fossero distinti si avrebbe la rappresentazione di Jordan). In tal caso, si può decomporre in fratti semplici la funzione di
trasferimento e viene scritta come somma di tanti residui:

Inoltre, la somma di funzioni di trasferimento è un collegamento parallelo in cui ogni sottosistema è rappresentato da un polo, il quale
è autovalore di una matrice. Siccome, quindi, si ha questo collegamento, è come se si avesse una matrice del tipo:

La u è diramata su tutte le componenti in parallelo e pertanto la struttura è di tipo diagonale:

Il vettore b indica la distribuzione dell’ingresso su tutti i blocchi in parallelo tra loro.


Mentre:
Così facendo si è ottenuta la riproduzione in parallelo della struttura che riproduce lo sviluppo in fratti semplici nel dominio del tempo.
Lezione 13
• STABILITÀ ESTERNA
Def: Un sistema si dice ESTERNAMENTE STABILE, ovvero BIBO-STABILE (Bounded Input Bounded Output) se ad ogni ingresso
limitato corrisponde un’uscita limitata.

Data una qualunque sequenza di ingressi {u(k)} tale che |u(k)|<c , la sequenza di uscite che il sistema produce è tale che
|y(k)|<c . Una condizione necessaria e sufficiente per la stabilità esterna di un sistema SISO è che la sua risposta impulsiva sia
sommabile, cioè che:

Cioè che la risposta impulsiva tenderà ad affievolirsi, cioè andrà a 0, poiché per essere sommabile ci devono essere termini della
somma infinitesimali. Essa consente di vedere solo la parte raggiungibile e osservabile, poiché la trasformata coincide con la fdt.
Infatti, sapendo che: Y(z) = W(z)*U(z)
Ma Kronecker impone che U(z)=1, si ha: Y(z) = W(z).
Z antitrasformando, dalla proprietà di convoluzione , si ha che: , la risposta
impulsiva entra in quella forzata.
La stabilità esterna si riferisce alla rappresentazione i-u del sistema, mentre la stabilità trattata finora (stabilità interna) si riferisce alla
rappresentazione i-s-u.
Visto che nella risposta impulsiva di un sistema si ritrovano tutti i modi di evoluzione della parte viva del sistema, si può che dire:
• se la terna di matrici (A, B, C) è controllabile ed osservabile, allora la stabilità interna e quella esterna sono proprietà strutturali
equivalenti;
• se il sistema fosse controllabile ma non osservabile, allora il sistema potrebbe essere esternamente stabile ma non internamente
stabile. Questo accadrebbe nel caso in cui gli autovalori della parte non osservabile fossero associati a modi instabili.

• SISTEMI NON LINEARI


Un sistema non lineare a tempo discreto LTI nella forma i-s-u è:

dove, al solito, , che sono rispettivamente i vettori di stato, di ingresso e di uscita.


Se, invece, fosse tempo variante si avrebbe la dipendenza da k, cioè la funzione cambia in funzione del tempo, e si avrebbe:
f e g sono operatori nello spazio di stato
Per un sistema non lineare e non forzato LTI (si leva sia la k sia la u poiché viene dall’esterno) a tempo discreto si ha:
In questo caso il sistema è “autonomo”, cioè non è sollecitato da ingressi esterni.
Per trovare i punti di equilibrio si deve soddisfare l’equazione:
dove f è una funzione vettoriale del tipo:
Nel caso dei sistemi lineari 0 era sempre un punto di equilibrio, mentre ora lo è solo se f(0)=0:

Se, invece, f fosse un polinomio di ordine 2 si avrebbero 2 soluzione (o nessuna se le radici fossero complesse coniugate): quindi,
nel caso dei sistemi lineari, non so né quanti equilibri ho né se gli zeri sono soluzioni.

Mentre, a tempo continuo nella forma i-s-u:

Per un sistema non lineare e non forzato a tempo continuo si ha:


e i punti di equilibrio devono soddisfare l’equazione:

Per i sistemi non lineari non esiste un metodo generale per trovare la forma esplicita, ma bisogna effettuare un’analisi caso per
caso e la soluzione analitica è difficile da trovare. L’aspetto più interessante di tali sistemi è la ricchezza dei comportamenti
dinamici che essi possono mostrare, a differenza dei comportamenti dinamici limitati mostrati dai sistemi lineari.
La ricerca dei punti di equilibrio di un sistema non lineare è un problema non banale perché richiede la soluzione di un sistema
statico di equazioni non lineari, le cui soluzioni possono essere molteplici e non semplici da ottenere analiticamente.
Lo studio degli equilibri è importante nell’analisi del comportamento dei sistemi non lineari per due motivi:
• perché i punti di equilibrio sono in ogni caso soluzioni delle equazioni dinamiche non lineari;
• perché spesso ci si può accontentare di descrivere in maniera approssimata le dinamiche nei pressi dei punti di equilibrio
invece che comportamenti globali.
Per studiare piccole perturbazioni dell’equilibrio, ovvero quando si effettua un’approssimazione che è molto vicina all’equilibrio, del
sistema non lineare e non forzato: , si può usare la tecnica della LINEARIZZAZIONE. Essa è basata
sull’approssimazione al primo ordine dello sviluppo di Taylor della funzione intorno al punto di equilibrio considerato x.
La funzione considerata è una funzione vettoriale di variabile vettoriale, poiché trasforma x(k) in x(k+1) e lo spazio non è più
lineare.
Lo sviluppo in serie intorno a x, arrestato al primo ordine, per questa funzione, si scrive come:
è il raggio dell’intorno del punto di equilibrio x,
dove
rappresenta una piccola variazione

Quella cerchiata in blu è la matrice Jacobiana (quadrata).


Si può scrivere:
Da cui è possibile scrivere la matrice Jacobiana come:

Si calcolano le derivate parziali e poi si


impone x per avere un coefficiente

di dimensioni nxn.

[Se si volesse effettuare lo sviluppo in serie di Taylor di una funzione scalare, cioè una funzione del tipo ,
intorno a x, si scriverebbe come: ].

• MODELLO DI EQUAZIONE LOGISTICA


Consideriamo l’equazione della crescita esponenziale:
possiamo considerarlo come il modello lineare di crescita di una popolazione, ipotizzando che r sia il tasso di crescita, cioè il
numero di individui che nascono nell’intervallo [k;k+1], e che l’andamento dipenda da esso:



Mentre in una prima fase la popolazione ha una crescita esponenziale, quando le risorse iniziano a scarseggiare e la competizione
aumenta, il tasso di crescita non può considerarsi costante e indipendente dal numero di individui.
L’equazione logistica assume che il tasso di crescita sia una funzione lineare decrescente della dimensione della popolazione,
dipendente quindi dalla competizione e da x(k). Matematicamente:

E il modello diventa:

dove c è la capacità portante (critica), cioè il numero massimo di individui che compongono la popolazione prima di estinguersi.
Se c=1, x(k) diventa la percentuale di popolazione presente all’istante k rispetto alla capacità portante del sistema:
• x=0 e si ha: r=r’
• x=c e si ha: r’=0.
Da ciò è possibile dire che:
Quindi, quando la popolazione raggiunge C, essendo che si tratta di un modello per sostituzione, nell’istante successivo la
popolazione sarà completamente sostituita, poiché il tasso r’ si é completamente azzerato.
Il modello si dice MODELLO DELLA CRESCITA LOGISTICA.
Esso diventa non lineare, poiché:

con c=1.
I punti di equilibrio si ottengono ponendo x = f(x), ottenendo:
Da cui:
Cioè:
I punti di equilibrio sono 2:

Graficamente, invece, parto da:

E disegno:
Precisamente, al variare di r, disegno l’equazione 2 che è una parabola rovesciata e l’equazione 1 che è la retta x(k+1)=x, che è
diagonale al quadrante.
Trovo i punti di equilibrio nell’ intersezione tra la retta e le parabole.

Per studiare il comportamento all’equilibrio intorno a x, effettuo la linearizzazione di Taylor:

dove le componenti di J sono:

da cui:

1) Il comportamento intorno all’equilibrio x=0 è dato da:


Esso è:
• Localmente asintoticamente stabile se |r|<1
• Instabile se |r|>1
• Non si hanno info dopo la linearizzazione se |r|=1

2) Il comportamento intorno all’equilibrio è dato da:


Esso è:
• Localmente asintoticamente stabile se 1 < r < 3, tende a decrescere indefinitivamente
• Instabile se r < 1 e r > 3, tende a crescere indefinitivamente
• Non si hanno info dopo la linearizzazione se r = 1 e r = 3, poiché si ottiene

• COBWEBBING
È una tecnica per trovare in forma grafica la soluzione di equazioni alle differenze non lineari scalari. Essa consiste nel
rappresentare sul piano la funzione di transizione di stato f in funzione dello stato corrente (x(k)), trovando così x(k+1), impiegando
il seguente algoritmo:
1) a partire dalla condizione iniziale x0 trovare sulla sulla curva il punto di coordinate (x0, f(x0)), e disegnare la diagonale del
quadrante;
2) tracciare una linea orizzontale sino ad incontrare la retta diagonale individuando il punto (f(x0), f(x0))
3) tracciare verticalmente da questo punto una retta che intercetta il punto sulla curva di coordinate (f(x0), f(f(x0)))
4) ripetere a partire dal passo 2 fino a convergenza o fino al massimo numero di iterazioni.
Lezione 14
• IL PIANO DELLE FASI
Nel caso di sistemi bidimensionali, ovvero i sistemi caratterizzati da 2 variabili di stato, la tecnica grafica del cosiddetto “Piano delle
fasi” può essere utile per comprendere, in maniera qualitativa, gli andamenti delle traiettorie di un sistema non-lineare nel tempo.
Esso viene, generalmente, rappresentato tramite un sistema di coordinate bidimensionali, con 2 assi, uno per ciascuna delle due
variabili di stato del sistema. Le linee o le curve tracciate indicano l'evoluzione delle variabili nel tempo.
Questo piano bidimensionale offre, quindi, una visualizzazione chiara del comportamento a lungo termine di un sistema dinamico.

Consideriamo un sistema del secondo ordine, cioè con 2 equazioni non lineari, del tipo:

(In questo caso parliamo di sistemi a tempo continuo, ma si può estendere anche a quelli a tempo discreto).
Per trovare i punti di equilibrio, si valuta l’equazione: f(x)=0, cioè si devono valutare i punti che la annullano, e si delinea il seguente
sistema di equazioni:

Esso può avere o meno soluzioni che possono essere nulle, isolate o meno. Se gli equilibri non sono isolati, si parla di proprietà di
stabilità locali (ogni equilibrio avrà un bacino di attrazione che delimita una regione in cui se ci sono perturbazioni, il punto torna in
quel determinato equilibrio).
Ad esempio, supponiamo che x sia un punto di equilibrio, di conseguenza la sua traiettoria sarà una retta. Supponiamo, poi, di
partire da un punto x0 (punto iniziale), cioè supponiamo che ci sia una variazione (perturbazione piccola) del punto di equilibrio.
Supponiamo che inizi un’evoluzione a partire da x0, il quale si trova in un intorno di x; di conseguenza, la sua traiettoria converge
verso quella di x. Se la convergenza si limita solo ad un intorno, si parla di locale asintotica stabilità; se invece la convergenza
riguarda qualsiasi intorno, si parla si globale asintotica stabilità.

In termini matematici, effettuo una linearizzazione attorno al punto di equilibrio e la variazione di x la esprimo come:
dove è un vettore piccolo nello spazio bidimensionale, la cui ampiezza la valuto introducendo la norma:
Derivo la variazione rispetto al tempo:
che può essere rappresentata graficamente come:
Approssimo poi con Taylor:

Ma essendo f(x)=0 per definizione, si ottiene:


Cioè la linearizzazione attorno al punto di equilibrio genera un sistema lineare tempo invariante.

Immaginiamo di proiettare le curve in un piano (x1,x2):


• La linea retta la vedo come punto punto;
• La traiettoria, che parte da x0, la vedo come una curva che arriva a x.
Questo piano bidimensionale è il cosiddetto piano delle fasi, in cui ogni punto della curva è caratterizzato da un istante di tempo.
• IL RITRATTO DI FASE
Il ritratto di fase è una rappresentazione grafica che mostra il comportamento di un sistema dinamico nel piano delle fasi. Si tratta di
una visualizzazione delle traiettorie seguite dalle variabili di stato del sistema nel tempo, indipendentemente dalle condizioni iniziali.
In sostanza, il ritratto di fase fornisce un'immagine completa delle possibili soluzioni di un sistema di equazioni differenziali o
differenziali ordinarie nel piano delle fasi. Le traiettorie nel ritratto di fase aiutano a comprendere come il sistema evolve nel tempo,
individuare punti di equilibrio, cicli limite e altre caratteristiche interessanti del sistema.

Per rappresentarlo si parte da un punto individuato nel piano delle fasi. Questi punti iniziali rappresentano le condizioni iniziali del
sistema, cioè lo stato del sistema in un dato istante di tempo. Dopo aver scelto i punti iniziali nel piano delle fasi, si utilizzano le
equazioni differenziali che descrivono il sistema per calcolare le derivate delle variabili di stato rispetto al tempo in ciascun punto
iniziale. Queste derivate indicano la direzione e il tasso di variazione delle variabili di stato in quel punto.
Quindi, utilizzando le informazioni sulle derivate, è possibile disegnare le traiettorie nel piano delle fasi che rappresentano
l'evoluzione del sistema nel tempo partendo da ciascun punto iniziale.

Dopo aver disegnato il punto iniziale, traccio il vettore, che è una derivata, per cui è la tangente alla traiettoria in quel punto.

Se per ogni punto dello spazio di stato disegno la derivata (la direzione della freccia), ottengo il CAMPO VETTORIALE, associato
alla coppia di equazioni iniziale.

Tutte queste frecce sono tangenti alla traiettoria e mi indirizzano verso l’equilibrio.
Per calcolare, adesso, il ritratto di fase, bisogna fare una griglia nel piano delle fasi e nei punti della griglia si calcolano i vettori
tramite derivata (la prima equazione mi dà la componente sulla x, mentre la seconda su y). Ottengo così il campo vettoriale.
Consideriamo le due equazioni:

Se poniamo simultaneamente:

Stiamo trovando i punti di equilibrio, che non dipenderanno dal tempo ma saranno fissi:

Se azzeriamo solo (l’altra no), otteniamo che il luogo dei punti che azzera questa equazione è detta NULLOCLINA O
ISOCLINA rispetto x (di valore zero).
Def: L’isoclina di equilibrio o nulloclina rispetto a x (o x-nulloclina) è l’insieme dei punti nel piano delle fasi tali che:
Similmente si definisce la y-nulloclina.
Geometricamente, le x-nullocline sono l’insieme dei punti del piano associati ad un campo vettoriale verticale orientato verso il
basso o verso l’alto. Cioè il campo vettoriale può variare solo in maniera verticale, poiché non ha componenti lungo x.

Similmente le y-nullocline sono l’insieme dei punti del piano associati ad un campo vettoriale orizzontale, orientato a sinistra o
verso destra.

• ESEMPIO: COMPETIZIONE INTERSPECIFICA


Considero una coppia di equazioni non lineari:

La prima equazione rappresenta la crescita della popolazione con una capacità limitata per via di x2 e di se stessa; più
precisamente, è il tasso di crescita che però diventa sempre più piccolo a causa della sottrazione, inserendo poi x2(t) il tasso
r diminuisce anche per la presenza di un’altra specie.
La seconda equazione rappresenta la “sofferenza” della popolazione 2 a causa della dimensione di stessa e della popolazione
1, poi entrambe le specie insistono sullo stesso ambiente sfruttandone le risorse, seppur in maniera diversa.
Questo caso è detto COMPETIZIONE INTERSPECIFICA, che è quella che può portare a varie situazioni di equilibrio; mentre,
se una delle due popolazioni prende il sopravvento portando a zero l’altra, si parla di ESCLUSIONE COMPETITIVA.
L’obiettivo è capire se queste due popolazioni trovano un equilibrio oppure se sono destinate a estinguersi.

Scriviamo la x1-nulloclina:
Essa si annulla se:
• la quantità x1 si azzera:
• c’è una relazione x1 e x2 del tipo:
Possiamo rappresentarlo nel piano delle fasi:

Al di sopra della retta 2 si ha un campo vettoriale con una direzione, mentre al di sotto si ha un campo vettoriale con direzione
opposta; questo accade poiché, essendo la retta il punto di attraversamento, avrò un semipiano positivo e uno negativo.

Scriviamo ora la x2 nulloclina:


Essa si annulla se:

Disegniamo nel piano delle fasi:


Per trovare i punti di equilibrio bisogna incrociare le due nullocline:
• se prendiamo x1=0 e x2=0, cioè le nullocline , si ottiene l’origine come punto di equilibrio;
• se incrociamo , otteniamo il punto
• se incrociamo , otteniamo il punto

Possiamo avere 4 casi:


1) Esclusione competitiva: non ci sono intersezioni nella regione interessata e quindi non esiste un equilibrio in cui le due
popolazioni possano condividere l’ambiente.

Qui prevale la specie 2.

Se supponiamo avremo che le componenti del campo saranno:

In ogni punto avrò queste componenti, che possono essere di intensità differente, poiché può accadere che si ha:

Quindi, in dipendenza all’intensità delle due componenti è possibile andare in un punto di equilibrio piuttosto che in un altro, che
possono essere uno di quelli sugli assi (punti di esclusione competitiva).

2) Le due popolazioni coesistono:

Il campo vettoriale punta o verso l’equilibrio (asintoticamente stabile), detta anche coesistenza stabile:

O instabile, detta anche coesistenza instabile:


3) Le due popolazioni coesistono ma vedo convergenza lungo un asse e divergenza lungo un altro, si parla di instabilità.
Ottengo cioè delle traiettorie che si avvicinano ma poi si allontanano lungo l’altro asse.

4) ESCLUSIONE COMPETITVA, dove prevale la specie 1:

• PIANO DELLE FASI PER UN SISTEMA LINEARE STAZIONARIO DEL 2 ORDINE (LTI)
Consideriamo un sistema lineare del secondo ordine LTI:

Consideriamo i due autovalori associati, che sono entrambi maggiori di zero; essendo questi tipi di sistemi diagonalizzablili,
possiamo scrivere:

Vogliamo rappresentare nel piano delle fasi le possibili traiettorie che è possibile avere, sapendo che 0 è un punto di equilibrio, e il
tipo di equilibrio dipende dai .
Ci troviamo nel tempo continuo.
Distinguiamo i seguenti casi:

1) Se gli autovalori sono reali e distinti ma si trovano a destra dell’asse immaginario, i modi di evoluzione sono divertenti e le
traiettorie dei rami uscenti saranno:

La concavità o la convessità di queste curve dipende da quale ramo diverge prima.


In questo caso, le traiettorie vanno all’infinito lungo l’asintoto rappresentato dall’autovettore associato a quell’autovalore: lungo
l’asse delle ordinate vanno all’infinito più velocemente anziché lungo l’asse delle ascisse.
Il punto di equilibrio (0) si dice FUOCO INSTABILE o NODO INSTABILE.

2) Se gli autovalori sono reali e distinti e si trovano a sinistra dell’asse immaginario, i modi di evoluzione sono convergenti e le
traiettorie convergono verso l’origine. Considerando , di conseguenza si trova più vicino l’origine e quindi x1 associato a
diminuisce più in fretta di x2.

Il punto di equilibrio (0) si dice FUOCO STABILE.


3) Se gli autovalori sono reali e distinti ma si trovano uno a destra e uno a sinistra dell’asse immaginario, si generano delle
traiettorie che si avvicinano al punto di equilibrio e poi si allontanano perché, supponendo , è dominante e quindi se ne
vanno all’infinito lungo il secondo autovettore.
Il punto di equilibrio è detto A SELLA.

4) Se gli autovalori sono complessi e coniugati, si avranno nel piano delle fasi delle traiettorie che pseudoscillano intorno all’auto
vettore, cioè oscillano con ampiezza sempre più ridotta. Si genera così una spirale.
• Se gli autovalori sono a sinistra dell’asse immaginario, i modi di evoluzione sono asintoticamenre stabili e il punto di equilibrio
(0) è detto FUOCO CONVERGENTE. La spirale parte da x0 e finisce nel punto di equilibrio:

• Se gli autovalori sono a destra dell’asse immaginario, i modi di evoluzione sono instabili e la spirale sarà divergente. Il punto di
equilibrio (0) è detto FUOCO DIVERGENTE:

• Se gli autovalori sono sull’asse immaginario siamo in una condizione di marginale stabilità. Le traiettorie sono dei cerchi è il
punto di equilibrio (0) è detto CENTRO.

5) Se gli autovalori sono reali e coincidenti e si trovano a sinistra dell’asse immaginario, le traiettorie sono delle rette e convergono
sempre a 0. Il punto di equilibrio (0) è detto FUOCO STABILE.

6) Se gli autovalori sono reali e coincidenti e si trovano a destra dell’asse immaginario, i modi di evoluzione sono divergenti e le
traiettorie sono delle rette uscenti dall’origine. Il punto di equilibrio (0) è detto FUOCO INSTABILE.
Se gli autovettori non sono ortogonali tra loro, ovvero non consideriamo la matrice diagonale, invece di vedere il piano delle fasi nel
piano (x1, x2) lo vediamo nel piano degli autovettori (rappresentati dalle linee blu):

Se gli autovalori sono anche complessi coniugati:


• STABILITÀ E FUNZIONI DI LYAPUNON
È noto che in fisica, ed in molte altre discipline scientifiche, il comportamento macroscopico di un sistema può studiarsi attraverso
una funzione energia.
L’energia di un sistema è una quantità scalare e positiva, dipendente dalla configurazione del sistema, che rappresenta l’attitudine
del sistema a compiere LAVORO. Essa può presentarsi in forme diverse e convertibili l’una nell’altra, in relazione ai processi e ai
fenomeni cui il sistema partecipa, e può essere scambiata tra sistemi diversi, essendo in ogni caso rispettato un principio generale
di conservazione dell’energia, secondo il quale l’energia totale di un insieme isolato di sistemi rimane costante nel tempo.
Se, nella dinamica del sistema, il sistema cede energia, esso si dirigerà verso una condizione di equilibrio, se acquisisce energia, il
sistema si allontanerà dal possibile equilibrio.

Il comportamento dinamico di un sistema meccanico è descrivibile dalla seconda LEGGE DI NEWTON.


In particolare, per una particella di massa m si può scrivere:

dove F è la risultante delle forze applicate e v la sua velocità.


In meccanica si introduce il concetto di lavoro fatto da una forza da un punto 1 ad un punto 2 calcolabile come:

cioè come integrale del prodotto scalare tra la forza e lo spostamento incrementale.
Per una particella questo significa che:

La quantità prende il nome di ENERGIA CINETICA e la sua variazione tiene conto del lavoro fatto dalla forza. Se la
forza è conservativa, il lavoro su una linea chiusa è nullo.
Per le forze conservative è possibile definire un’altra forma di energia, detta ENERGIA POTENZIALE V di un punto delle spazio.
Se si assume che l’energia potenziale sia nulla in un punto arbitrariamente scelto, il potenziale V di un punto è il lavoro negativo
per portare una particella nel punto a potenziale nullo. Il lavoro è indipendente dalla traiettoria scelta per portare la particella nel
punto a potenziale nullo. Dalla definizione di potenziale discende che:

per cui è possibile risalire alla forza attraverso il gradiente di una funzione scalare.

Per le forze conservative, possiamo dire da un lato che:


e dall’altro che:
Da cui deduciamo che:
che rappresenta la formulazione del principio di conservazione dell’energia.
Il semplice ragionamento fatto per una particella si può estendere ad un sistema di corpi. Se le forze sono conservative, vale il
principio di conservazione dell’energia. Se le forze non sono conservative c’è dissipazione e l’energia è destinata a decrescere nel
tempo.

Il primo principio della termodinamica stabilisce che il calore è una forma di energia e come tale, se il sistema è isolato,
l’energia del sistema si conserva. Un altro principio fondamentale è rappresentato dalla seconda legge della termodinamica
secondo la quale l’entropia di un sistema termodinamico non può decrescere. Per un processo termodinamico irreversibile che
porta il sistema da uno stato 1 ad uno stato 2, la variazione di entropia soddisfa la disuguaglianza:

dove Q e la quantità di calore entrante e T la temperatura. Il segno di uguaglianza vale solo per le trasformazioni reversibili.
Dunque, i processi termodinamici possono essere descritti in termini di una funzione scalare, l’entropia, che nelle trasformazioni
termodinamiche può solo rimanere costante o crescere.

Definizione di stabilità all’equilibrio:


Sia x un punto di equilibrio. Per una definizione precisa di stabilità, è conveniente introdurre la notazione S(x, R) per indicare la
regione sferica nello spazio di stato con centro in x e raggio R. Utilizzando questa notazione possiamo poi enunciare la definizione
rigorosa dei differenti tipi di stabilità dell’equilibrio x.

• Il punto di equilibrio x è stabile se esiste un R0 tale che per ogni R < R0, esiste un r, 0 < r < R, tale che se x(0) è dentro S(x,r),
allora x(t) rimane dentro S(x,R) per tutti i t > 0.
• Il punto di equilibrio x è asintoticamente stabile ogni volta che è stabile e inoltre esiste un R0 > O tale che per x(0) ∈ S(x, R0),
tende a x all’aumentare del tempo.
• Il punto di equilibrio x è marginalmente stabile se è stabile ma non asintoticamente stabile.
• Il punto di equilibrio x è instabile se non è stabile. Equivalentemente, x è instabile se per qualche R > 0 e qualsiasi r > 0 esiste
un punto nella regione sferica S(x, r) tale che, partendo da tale sfera, la traiettoria finirà per spostarsi al di fuori di S(x, R).
Interpretazione geometrica:

Costruisco 3 cilindri concentrici nello spazio e li proietto nello spazio di stato,


Una volta definito il cerchio tratteggiato di tipo esterno, esiste un cerchio piccolo dal quale
partono le traiettorie:
• Posso “bucare” la circonferenza e tornarvi dentro, andando nel punto centrale:
equilibrio asintoticamente stabile;
• Posso “bucare” la circonferenza ma rimanere all’interno del cerchio tratteggiato:
equilibrio stabile;
• Posso uscire dal cerchio tratteggiato: equilibrio instabile.
Per ogni raggio considerato, deve esistere una regione da cui può partire la condizione
iniziale.

A questo punto, possiamo creare le funzioni di Lyapunov, rappresentate l’energia associata all’equazione.
Def: Una FUNZIONE DI LYAPUNOV è una generalizzazione del concetto di energia per lo studio dell’equilibrio di un sistema
dinamico.
Supponiamo di avere un sistema autonomo (evoluzione libera) non lineare:
che possiede un equilibrio in x tale che f(x) = x.
Una funzione candidata di Lyapunov é una funzione scalare dipendente dallo stato del sistema (energia generalizzata):
tale che:
• E(x) = 0
• E(x) > 0 per tutte le configurazioni di stato X del sistema, eccetto per la configurazione di equilibrio.
ciò significa che l’energia associata all’equilibrio sarà nulla ma positiva per tutte le altre configurazioni.
La variazione di energia generalizzata sarà calcolabile come:
ma è possibile porre:
da cui:
Se la funzione candidata di Lyapunov godesse della proprietà , allora lungo ogni possibile traiettoria del
sistema i “salti di energia” sarebbero sempre negativi e quindi questa E(·) sarebbe destinata a decrescere fino a diventare nulla.
Questo ci consentirebbe di concludere che il sistema, partendo da una qualunque condizione iniziale, si avvicinerebbe
asintoticamente all’equilibrio e quindi l’equilibrio x potrebbe qualificarsi come asintoticamente stabile.
Se esistesse una funzione di energia generalizzata con le proprietà appena viste, valide però solo in un intorno I(x) del punto di
equilibrio x, tale che:



possiamo dire che l’equilibrio x è solo localmente asintoticamente stabile.

(La difficoltà di tale approccio é che la funzione di energia dobbiamo trovarla noi perché non è detto che esista, ma le
considerazioni fatte finora valgono solo nel caso in cui esista.)

• SUMMARIZING FUNCTION
La teoria di Lyapunov e i suoi molteplici successivi sviluppi sono uno strumento fondamentale per lo studio della stabilit`a dei
sistemi non lineari.
Trovare una funzione di Lyapunov per un sistema dinamico generico è molto spesso non semplice e non esiste una procedura che
ci consenta di costruirla. Per questo la teoria di Lyapunov potrebbe sembrare poco utile. Ma si può , con una certa ragione,
sostenere che quando una funzione di Lyapunov viene trovata, essa fornisce una modalità descrittiva del sistema che ne riassume
il comportamento sopprimendo i dettagli (summarizing function) che può essere assai istruttiva (si pensi all’energia nei sistemi
meccanici o all’entropia nei sistemi termodinamici visti in precedenza).
Ci si potrebbe spingere a sostenere che un modello dinamico, in qualunque ambito venga sviluppato, raggiunge la sua maturit`a
quando è sufficientemente semplice ed elegante dal permettere di trovare una funzione di Lyapunov.
In queste note si è voluto soltanto accennare all’idea fondante di questo approccio.
• DISCRETIZZAZIONE
La DISCRETIZZAZIONE è il passaggio dal sistema a tempo continuo al sistema a tempo discreto.
Il CAMPIONAMENTO è la conversione di un segnale (analogico) continuo nel tempo S( ) in una successione dei suoi
valori , detti campioni, misurati ad intervalli temporali regolari di ampiezza T, dove T è il tempo che passa tra un campione e
l’altro, detto periodo di campionamento. Quindi, in seguito al campionamento si avrà una sequenza di numeri:

Il campionamento mi consente di digitalizzare il campione, a seguito del quale si avrà una stringa di bit, che rappresenta il numero
ottenuto.
Queste due operazioni (campionamento e digitalizzazione del campione) fanno parte della conversione analogico-digitale.
Per ricostruire il segnale analogico, a partire dal segnale campionato, bisogna utilizzare una frequenza di campionamento
maggiore del doppio della frequenza massima del segnale da campionare (teorema di Shannon).

Nella dimensione digitale, un sistema di monitoraggio e controllo di un sistema lineare a tempo continuo, descritto dalla terna di
matrici (A, B, C), viene comandato da un convertitore digitale-analogico D/A e poi tramite un convertitore analogico-digitale A/D.

Consideriamo un sistema a tempo continuo:

Grazie alla presenza del convertitore analogico/digitale, che campiona il sistema, in uscita si avrà un segnale digitale, ovvero una
serie di campioni. Cioè, nonostante all’interno della cornice il sistema è a tempo continuo, le uscite sono viste come in un sistema a
tempo discreto, in modo tale da comandare il sistema tramite campioni.
Viene aggiunto un clock che scandisce il tempo delle operazioni di campionamento.

Se il periodo di campionamento è piccolo, approssimando, il segnale di ingresso si mantiene costante fino al campione successivo.
Si considera un SISTEMA A DATI CAMPIONATI. Essi sono sistemi a tempo continuo aumentati attraverso opportuni dispositivi da
segnali campionati le cui uscite vengono campionate. Pur essendo sistemi continui possono essere visti come sistemi a tempo
discreto.
Considerando un sistema a tempo continuo, supponiamo di aumentarlo con una sequenza di campioni, mantenendo costante il
segnale di ingresso.
Secondo la formula di evoluzione del sistema:

Conoscendo il periodo di campionamento, lo stato e l’uscita del sistema nell’istante (k+1)T potranno calcolarsi come:

dove è l’istante iniziale, mentre è l’istante successivo (corrente).


Pongo:
quando si ha cioè
E allora:

Otteniamo:

Ho ottenuto il sistema a tempo discreto, che sarà rappresentato dalla terna di matrici (A , B , C)
Vediamo come si calcola l’integrale:
è la compressione di una serie:
Siccome l’integrale è un operatore lineare, posso procedere pezzo per pezzo:
Se moltiplico e divido tutto per A, ipotizzando sia invertibile:
Da cui:
E quindi:

Le equazioni che descrivono il sistema sono:


• a tempo discreto, cioè viste dall’esterno del sistema:
calcolabili sono se note T e le matrici

• a tempo continuo, cioè viste dall’interno del sistema:

Infine, il campionamento non distrugge la stabilità del sistema poiché è una sua proprietà strutturale.

È possibile trovare anche la soluzione numerica di equazioni differenziali non lineari. Quindi, si parla di DISCRETIZZAZIONE DI
SISTEMI NON LINEARI, che impiega il metodo di Eulero.
Consideriamo l’equazione vettoriale autonoma:
con x(t0) = x0.
Si vuole trovare la soluzione per t > t0.
Il metodo di Eulero consiste nell’ approssimare x(t) con il suo rapporto incrementale: per h piccolo.
Utilizzando l’approssimazione “in avanti” si ha
h è il tempo di campionamento ed è fisso.

Considerando una sequenza di istanti discreti t0, t0+h, t0+2h, … identificati nella loro successione con un generico k, possiamo
scrivere l’equazione ricorsiva: , come approssimazione dell’equazione differenziale
(cioè se h è costante).

[ h è detto anche “passo di integrazione” poiché mi fa ottenere la soluzione numerica delle equazioni differenziali mediante
integrazione].
Lezione 15
• SISTEMI A EVENTI DISCRETI
Sono sistemi in cui:
• Lo spazio di stato X è discreto, cioè è formato da un numero finito di stato: X = {x1, x2, … }
• Le transizioni di stato sono causate dagli eventi (e non con l’avanzata del tempo) che appartengono ad un insieme discreto E =
{e1, e2, …}

Un esempio sono i sistemi a code: i clienti arrivano e richiedono accesso al server. Se il server risulta occupato, allora i clienti
attendono in coda. Pertanto, un sistema a code è costituito da 3 elementi fondamentali:
• i server: che forniscono le risorse per cui si è formata la coda (cassieri di un supermercato)
• i clienti: cioè le entità che sono in attesa di accedere alle risorse
• la coda: cioè lo spazio in cui avviene l’attesa. Le code possono essere visibili (come l’area di attesa di una banca) o intangibili
(anche i task che deve eseguire un processore sono allocati in aree di attesa, dette buffer).
Graficamente un sistema a code è così rappresentato:

Dove un cerchio rappresentato il server, mentre la coda è rappresentata da una scatola aperta che precede il server: i gettoni
rappresentano il numero di clienti in attesa.
L’insieme degli eventi è E = {a, u} dove a è l’arrivo del cliente, u é l’uscita del cliente.
Lo spazio di stato è il numero di clienti in coda, cioè la lunghezza della cosa, X = {0, 1, 2, …}.
Una coda in attesa di un servizio si caratterizza con la notazione di Kendall A/S/c/K/N/D, dove:
• A è la distribuzione di probabilità dei tempi di arrivo dei clienti nel sistema
• S è la distribuzione di probabilità dei tempi di servizio
• c é il numero di canali di servizio
• K è il numero di posti nella cosa
• N è la dimensione della popolazione dei clienti ( se non indicata è infinita)
• D é l’ordine di servizio dei clienti (cioè può essere FFIO, LIFO, SIRO, PRI = a priorità assegnata (esempio pronto soccorso con i
codici bianco, verde e rosso) )
In relazione ai punti 3 e 4, se il numero dei clienti (o jobs) in servizio o in coda superano le dimensioni massime, ulteriori arrivi vengono
rifiutati.

Inoltre, dalla combinazione in serie o in parallelo di più code si generano le cosiddette reti di code:

Esempi di reti di code sono:


• COMPUTER:

I server sono la CPU, D1 e D2 (dischi). Ci sono un insieme di task che rappresentato i clienti in competizione per l’attenzione di diversi
server (ad esempio la CPU o periferiche tipo stampante o dischi); essi quindi sono richiesti dall’esterno o dal sistema stesso, e ognuno
dei quali arriva nella coda che precede la CPU, per poi essere servito da essa stessa. Una volta servito o esce o richiede l’accesso ad
uno dei due dischi, per poi richiedere un ulteriore servizio alla CPU.
Lo stato del sistema è descritto dal vettore: X = [Xcpu, Xd1, Xd2] dove le componenti sono le lunghezze delle code che precedono
CPU, D1 e D2.
L’insieme degli eventi che regolano le transizioni di stato sono E = {a, e, r1, r2, u1, u2} dove:
• a è l’arrivo di una richiesta di esecuzione di un task dall’esterno
• u rappresenta l’uscita dalla CPU verso il mondo esterno, cioè il completamento di un task
• r1 e r2 rappresentano l’instradamento della CPU verso D1 e D2
• u1 e u2 rappresentano le uscite dai dischi D1 e D2 che risulta in un intorno nella coda della CPU
• SISTEMI MANIFATTURIERI:

(I cerchi sono i macchinari, tra essi vi è il buffer)


I clienti sono rappresentati dalle parti in produzione; le parti per essere completate richiedono l’accesso ai vari server (macchinari o
strumenti per la movimentazione). Quando le parti non vengono lavorate sono accantonate in buffer (limitati) fino a che il server
richiesto non diviene nuovamente disponibile.
Ad esempio, supponiamo che un pezzo per essere completato debba passare attraverso due server; c’è un buffer limitato e il flusso
del materiale è vincolato. Allora si può verificare il blocking: quando ci sono 2 parti in coda al macchinario 2 e una in lavorazione in
esso, la macchina 1 potrebbe essere in blocking o stare ancora lavorando una parte.
Per descrivere tale situazione si aggiunge lo stato x2 = b. Cioè: X2 = {0, 1, 2, 3, b}, esso è vincolato ad assumere questi valori, mentre
x1 può assumere tutti i valori interi non negativi (per effetto del buffer limitato tra i due macchinari).
L’insieme degli eventi é dato da: E = {a, c, u}.
Lo stato del sistema è rappresentato dal vettore X = [x1, x2] dove x1 e x2 sono la lunghezza delle code per i rispettivi macchinari.

Un AUTOMA (deterministico) G è una 6-tupla , in cui:


• X è l’insieme degli stati
• E è l’insieme finito degli eventi associati a G
• f : X x E è la funzione di transizione o funzione prossimo stato: f(x, e) = y significa che se sto in uno stato x e c’è un evento e, il
sistema passa da uno stato x a uno stato y.
• è la funzione degli eventi possibili, dove è l’insieme di tutti gli eventi per cui f(x, e) è definita ed è chiamato insieme
degli eventi attivi di G da x.
• X0 è lo stato iniziale
• è l’insieme degli stati marcati, cioè stati speciali (la scelta degli stati da marcare dipende dal problema che si sta
modellando)
È detto deterministico perché da uno stesso stato non possono uscire due transizioni con la stessa etichetta.

Il diagramma di transizione di stato è un grafo orientato che rappresenta l’automa in cui:


• i nodi rappresentano gli stati del sistema, rappresentati quindi da cerchi;
• gli archi rappresentano le transizioni tra gli stati (con frecce); quando la transizione avviene sullo stesso nodo si parla di autoanello.
Ad esempio:

è la funzione di trasmissione

Un fenomeno indesiderato in un automa è il cosiddetto BLOCKING, che si ha quando si possono verificare una delle seguenti situazioni
(o entrambe):
• L’automa può trovarsi in deadlock, ovvero G può raggiungere uno stato x tale che Γ(x) = ∅, ma x ∈/ Xm. In tale situazione, si parla di
deadlock poiché nessun evento può accadere: il sistema è giunto in uno stato di stallo senza aver terminato il task (non ha raggiunto
uno stato marcato);
• L’automa può trovarsi in livelock, ovvero G può raggiungere un insieme di stati non marcati che formano una componente
fortemente connessa del grafo (ciascuno di questi stati è raggiungibile da uno degli altri), ma non ci sono transizioni uscenti da
questo insieme. Pertanto, sebbene il sistema sia vivo (live), nel senso che può sempre eseguire un evento, tuttavia non può mai
completare il task assegnato, poichè nessuno stato dell’insieme è marcato ed il sistema non può lasciare questo insieme di stati.
Proprietà notevoli
Lezione 17
• CATENE DI MARKOV
Le CATENE DI MARKOV sono automi a stati finiti in cui le transizioni di stato non avvengono in maniera deterministica ma probabilistica.
Esse possono essere sia a tempo continuo (gli eventi non sono più sincronizzate a un orologio comune) che a tempo discreto (gli eventi
sono vincolati ad accadere agli istante 0,1,2…).
La caratteristica principale delle catene è l’assenza di memoria (memoryless), cioè lo stato all’istante successivo dipende solo dallo stato
corrente e non dalla storia passata. È così definita:

Quindi, dato uno stato xk, il valore dello stato all’istante iniziale dipende solo da xk e non da quelli precedenti. Di conseguenza il tempo
passato nello stato corrente è indifferente per determine lo stato successivo.

In questa catena ci sono i vari possibili


stati del sistema, che sono temporizzati

In forma generale, la matrice di transizione di stato P è così rappresentata:

Ed è una matrice quadrata di dimensioni pari al numero di stati del sistema.


Inoltre, una matrice di transizione di stato in una catena di Markov è una matrice stocastica. Una matrice stocastica è una matrice
quadrata in cui ogni elemento è non negativo e la somma degli elementi in ogni riga è uguale a 1.
Nel contesto delle catene di Markov, una matrice di transizione di stato soddisfa queste condizioni perché:
- Ogni elemento della matrice rappresenta una probabilità di transizione da uno stato a un altro, e le probabilità sono sempre non
negative, cioè si verificano sicuramente;
- La somma delle probabilità di transizione da uno stato a tutti gli altri stati nello stesso passo di tempo deve essere uguale a 1, poiché il
sistema deve essere in uno stato dopo ogni passaggio. Cioè la somma di ogni riga e colonna é sempre pari a 1.
Una riga di questa matrice è detto vettore stocastico.

La variabile aleatoria X rappresenta la probabilità di occupare uno degli stati del sistema e può essere rappresentato con un vettore di
dimensione pari al numero di stati del sistema, le cui componenti corrispondono alla probabilità di occupazione di ogni stato del sistema.
X è quindi numerabile:
Nelle catene di Markov non si è interessati a determinare quale degli eventi in abbia generato la transizione da x a x’, quanto
piuttosto la probabilità totale di effettuare una transizione di stato da x a x’, ovvero:

dove p(i, x) rappresenta la probabilità che occorra l’evento i nello stato x.


In generale, si considera la possibilità che la probabilità della transizione dipenda dall’istante in cui avviene:

Per definire una catena di Markov a tempo discreto sono necessari:


• Uno spazio di stato numerabile X
• Una funzione di massa di probabilità dello stato iniziale
• La funzione di transizione di probabilità p(x’, x) tra ogni coppia di stati di X.
Essendo X numerabile, al posto di p(x’, x) possiamo scrivere:

con e dove i e j sono i nodi.


Essa rappresenta la regola di evoluzione nel tempo di una catena di Markov, che può essere rappresentata in forma più compatta
tramite vettore stocastici:

dove ogni elemento del vettore rappresenta la probabilità che la catena si trovi in un determinato stato al tempo n o n+1. Invece, P
rappresenta la matrice di transizione di stato.
Avendo supposto che la catena di Markov considerata abbia n stati.
Questa equazione indica che per ottenere il vettore delle probabilità di stato al tempo n+1, basta moltiplicare il vettore delle probabilità
di stato al tempo n per la matrice di transizione di stato.

Inoltre, una catena di Markov si definisce omogenea se


Essa si può descrivere con un diagramma di transizione di stato (in cui i nodi sono gli stati e gli archi le probabilità) o con la matrice
delle probabilità P=[pij], cioè la probabilità di transizione da uno stato i a uno stato j.
Se l’elemento di questa matrice ha un apice sopra, allora significa che la transizione avviene in n passi. Ad esempio:
indica la probabilità di transitare da i a j in 2 passi. Ciò implica, però, che è stata effettuata una transizione su un elemento k, e
pertanto:

dove però k indica un passo generico, poiché è possibile fare la somma su tutti i k esistenti (essendo che da i posso andare in
qualunque k). Cioè:

P rappresenta tutte le possibili transizioni in 2 passi (P in 3 passi, ecc).

La dinamica di una catena di Markov è data dalla matrice P, quindi posso scrivere:

Oppure in evoluzione libera:


dove evolvono le probabilità
di occupazione stati
Esempio 2:
Computer con due processori identici che funzionano in parallelo. Data una sequenza di slot temporali k = 0, 1, . . ., si ipotizza che:
• Si possa sottoporre al sistema al massimo un task per ogni slot (la richiesta). Tale evento occorre con probabilità
• Quando l’esecuzione del task viene richiesta, esso viene servito da uno dei processori disponibili.
• Se ambo i processori risultano disponibili, allora il task viene assegnato al processore 1
• Se ambo i processori risultano occupati, allora il task viene perso/respinto
• Quando un processore risulta occupato, c’è una probabilità β che processi il task nel corso dello slot temporale
• Se l’esecuzione di un task viene richiesta quando i due server sono occupati, ed uno dei due processori si libera nel corso dello slot,
allora il task viene processato.
Tutto ciò dipende da eventi esterni al sistema, cioè eventi aleatori che indicano la possibilità o meno che la richiesta venga accolta.
Lo stato del sistema é il numero di server impegnati; in tal caso il numero degli stati è 3:
- 0: sono libere entrambe le macchine, ci sono 0 task
- 1: è occupato un solo processore, c’è 1 task
- 2: sono occupati entrambi i processori, ci sono 2 task.
Scegliendo come variabile di stato il numero di task correttamente processati dal sistema, è possibile calcolare le probabilità di
transizione di stato:

• P12 rappresenta la probabilità che il task arrivi ma il processore 1 è occupato


• P10 rappresenta la probabilità che il task non arrivi e la macchina 1 è libera
• P11 rappresenta la probabilità che il task arrivi e il processore è libero (task completato) + la probabilità che il task non arriva e il
primo processore è occupato (task non completato)
• P20 rappresenta la probabilità che il task non arrivi ed entrambe le macchine sono libere
• P22 rappresenta la probabilità di dover rimanere là poiché o arriva il task e la prima macchina lo processa mentre la seconda è
occupata e quindi devo aspettare o il task non arriva e le macchine sono entrambe occupate o il task arriva ma le macchine sono
entrambe occupate
Esempio: la rovina del giocatore
Si supponga che un giocatore abbia un capitale iniziale di 3 euro e voglia giocare ad una ruota della fortuna. Sulla ruota ci sono 12
numeri. Il giocatore scommette un euro alla volta sull’uscita di uno dei numeri. Pertanto, la probabilità di vincere in un singolo giro
sarà 1/12. Se la ruota si ferma sul numero scelto, egli viene premiato con 3 euro, che corrispondono ad un guadagno netto di due
euro. Altrimenti, la puntata viene persa.

Lo spazio di stato è X = {0, 1, …}.


Lo stato Xk è la variabile aleatoria che rappresenta il capitale del giocatore dopo la k-esima puntata.
Lo stato iniziale è x0 = 3, cioè ha un capitale da investire pari a 3 euro.

Il diagramma si transizione è:

La matrice di transizione è:

Il diagramma mi dice che se sto nello zero, cioè se ho 0 euro, posso solo transitare da zero a zero, e ciò ci vede nella posizione
(1,1) della matrice di transizione poiché la somma della riga è pari a 1.
Se invece ho 1 euro, cioè sto nello stato 1 (nodo 1), posso arrivare in tale nodo (1) perdendo 1 euro (cioè provenendo dallo stato 2)
con una pr = 11/12. Ciò è rappresentato dalla posizione (2,1) della matrice di transizione. Oppure, dal nodo 1, vincendo, posso
arrivare direttamente al nodo 3, con probabilità pari a 1/12, cioè sono tornato nella condizione iniziale (3 euro). E così via.

Indicando con pij l’elemento (i,j) della matrice P , esso indica la probabilità di transitare da i a j in k passi. Quindi, supponiamo di
voler calcolare la probabilità di raddoppiare il capitale iniziale, dopo le prime tre puntate, scriviamo:
È una probabilità condizionata: cioè la probabilità di arrivare allo stato 6 condizionatamente al fatto di partire dallo stato 3.
E può essere riscritta come:

Cioè dalla figura noto che in 6 posso arrivare o partendo da 4 o partendo da 7:


• In 4 ci arrivo con 2 passi, partendo da 3 (che è la condizione iniziale) e arrivo in 2 (perdendo), per poi vincere e da 2 andare in
4.
• In 7 ci arrivo con 2 passi, partendo da 3 vincendo arrivo in 5, e vincendo di nuovo arrivo in 7.
Quindi la probabilità di andare da 3 a 4 in due passi è uguale alla probabilità di andare di andare da 3 a 5, vincendo, e poi
perdendo da 5 a 4, oppure andando da 3 a 2, perdendo, e poi vincendo da 2 a 4.
Allo stesso modo posso calcolare la probabilità di arrivare da 3 a 7, vincendo ambedue le volte :

Cioè la probabilità di raddoppio è di circa il 2%.


• CONSIDERAZIONI SU UNA CATENA DI MARKOV:
Uno stato j si dice RAGGIUNGIBILE da uno stato i se pij > 0 k = 1, 2, … .
La raggiungibilità si traduce sul diagramma di transizione di stato con l’esistenza di un percorso da i a j (si dice anche che i e j sono fra
loro comunicanti ).
Dato un sottoinsieme S di stati della catena X , se non è possibile alcuna transizione da uno stato di S ad uno stato che non appartiene
ad S (cioè se pij = 0 i ∈ S, j ∈ S), S costituisce una classe chiusa della catena di Markov. Quindi S è un sottoinsieme in cui le
evoluzioni sono tutte contenute in questo insieme di stato: è un insieme connesso è isolato dall’esterno.
Se la classe chiusa è costituita da un singolo elemento i, allora si dice che i è uno stato assorbente e si avrà pii = 1.
Una classe chiusa di stati S si dice IRRIDUCIBILE se , lo stato j è raggiungibile dallo stato i. Se tuti gli stati sono raggiungibili
tra di loro la catena si dice irriducibile, altrimenti riducibile.

Gli stati di una catena sono transitori o ricorrenti:


• Uno stato i di una catena di Markov si dice TRANSITORIO o TRANSIENTE se, con probabilità strettamente positiva, partendo
dallo stato i non si ritorna mai più in i.
• Uno stato i di una catena di Markov si dice RICORRENTE se con probabilità unitaria ritornerà in i.
Uno stato assorbente è ovviamente ricorrente.
(Si noti che nell’esempio della rovina del giocatore, lo stato 0 è assorbente, mentre tutti gli altri sono transitori. Pertanto, se il giocatore
giocherà sufficientemente a lungo, qualunque sia il capitale iniziale, finirà in bancarotta, da cui il nome del gioco.)

Il TEMPO DI RICORRENZA Tii di uno stato i è il primo istante di tempo in cui la catena ritornerà nello stato i nell’ipotesi che si trovi in i
nello stato corrente. Formalmente:

Indichiamo con:
Esempio: catena di nascita/morte a tempo discreto
Consideriamo come stato la numerosità di popolazione.
In questo modello, da ogni stato i > 0, lo stato aumenta di uno (nascita) con probabilità 1-p, mentre diminuisce di 1 (morte) con
probabilità pari a p.
Per i = 0 c’è una nascita con probabilità 1-p, mentre lo stato rimane invariato con probabilità p.
Il diagramma di transizione è così rappresentato:

Supponendo che la popolazione parte da 0, mi porto a 1 se c’è una nascita e aumento sempre di 1 ad ogni nascita. Se da zero ho
una morte rimango in zero, invece se sono in 1 e ho una morte vado in 0. A ogni morte si sottrae una unità.
Si osservi che:
• se p < 1/2 (cioè più nascite che morti) lo stato della catena tenderà a scivolare man mano verso destra, per cui lo stato 0 risulterà
essere uno stato transitorio.
• se p > 1/2, invece, la catena avrà una deriva verso 0, per cui 0 sarà uno stato ricorrente.
• se p = 1/2 lo stato 0 sarà ricorrente nullo, in quanto il tempo di ricorrenza tende a infinito.
Man mano che p si avvicinerà (da destra) ad 1/2, osserveremo che il il tempo di ricorrenza medio incrementerà, tendendo ad ∞
quando p tende ad 1/2.

Probabilità di ritornare in n con n passi

Probabilità di occupare lo stato j-esimo

You might also like