You are on page 1of 49

49

COMANDA ROBOŢILOR
6. ELEMENTE DE INTELIGENŢĂ ARTIFICIALĂ
UTILIZATE ÎN COMANDA ROBOŢILOR.
6.1. Comanda roboţilor utilizând teoria mulţimilor
fuzzy.
6.1.1. Noţiuni generale.
Noţiunea de mulţime vagă a fost introdusă în matematică şi teoria
sistemelor de Lotfi A. Zadeh în 1965 sub denumirea de mulţime “fuzzy”,
care în traducere înseamnă mulţime vagă, neclară şi se foloseşte cu sensul
de vag, imprecis. În prezent termenul “fuzzy” se foloseşte cu valoare de
adjectiv şi în limba română. Mulţimile fuzzy şi în general conceptele fuzzy
au apărut din necesitatea de a exprima cantitativ mărimi vagi, sau imprecise.
Deşi există numeroase ramuri ale matematicii mai vechi decât teoria
mulţimilor fuzzy, care se ocupă cu studiul proceselor de natură aleatoare:
teoria probabilităţilor, statistica matematică, teoria informaţiei şi altele, nu
se pot face substituţii între acestea şi teoria mulţimilor fuzzy.
Pornind de la concepţia clasică cu privire la mulţime şi element al unei
mulţimi, se poate susţine că noţiunea de mulţime fuzzy reprezintă o abordare
dintr-un unghi diferit a conceptului de mulţime, mai precis, între apartenenţa
unui element la o mulţime şi nonapartenenţă există o serie de situaţii
tranzitorii, de natură continuă, caracterizate de aşa-numitele grade de
apartenenţă.
Dacă X este o mulţime oarecare, se numeşte mulţime fuzzy (în X)
rezultatul unei aplicaţii
[ ] 1 , 0 X : F →
(6.1)
Mulţimea fuzzy F este caracterizată de funcţia de apartenenţă:
] 1 , 0 [ P X : m
F

(6.2)
Valorile 0 şi 1 reprezintă cel mai mic şi respectiv cel mai mare grad de
apartenenţă la F al unui element x∈ X. Se poate face observaţia că orice
mulţime fuzzy este inclusă în mulţimea [0,1]. Un concept interesant cu
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
50
privire la “geometria” mulţimilor fuzzy, considerând că vizualizarea grafică
furnizează o imagine mai clară a conceptului de fuzificare, este că mulţimile
fuzzy pot fi privite ca puncte într-un hipercub unitar, I
n
= [0, 1]
n
. Această
reprezentare este deosebit de utilă la definirea conceptelor fuzzy şi la
demonstrarea teoremelor fuzzy.
6.1.2. Funcţii de apartenenţă
Pentru descrierea fuzzy a unor fenomene şi procese, aplicaţiile m
F
(x)
pot admite diferite exprimări analitice. Câteva dintre acestea sunt consacrate
în aplicaţii datorită unor facilităţi legate de calculabilitate şi uşurinţa
implementării hardware/software. În figurile 6.1 şi 6.2 este prezentat
aspectul grafic al funcţiilor de apartenenţă considerate tipice, care au permis
obţinerea unor rezultate concludente în aplicaţii. Pentru exemplificare se
consideră că funcţiile sunt definite pe intervalul
[ ] b , a
şi mijlocul acestui
interval este
( ) 2 b a c + ·
.
a) Funcţia de apartenenţă triunghiulară
Expresia analitică a acestei funcţii de apartenenţă (figura 6.1) este
identică cu ecuaţia dreptei ce trece prin punctele de coordonate (a,0) şi (c,1),
pentru
[ ] c , a x ∈
şi cu ecuaţia dreptei ce trece prin punctele de coordonate
( ) 1 , c
şi
( ) 0 , b
, pentru
( ] b , c
i:
( )
¹
'
¹
≤ < − − −
≤ ≤ − −
·
b x c ) , c b / ( ) c x ( 1
c x a ) , a c / ( ) a x (
x m (6.3)
În cazul în care
( ) 2 b a c + ·
, relaţia se poate scrie compact sub
forma:
( )
a b
c x
2 1 x m


− · (6.4)
51
COMANDA ROBOŢILOR
Fig. 6.1. Funcţia de apartenenţă triunghiulară
b) Funcţia de apartenenţă trapezoidală
Expresia analitică a acestei funcţii de apartenenţă se obţine observând
că trapezul din figura 6.2.a rezultă prin intersecţia unui triunghi de forma
celui din figura 6.1 având înălţimea
1 h
t
>
, şi dreapta de ecuaţie
( ) 1 x m ·
.
Astfel:
( )
1
1
]
1

¸

,
_

¸
¸


− ·
a b
c x
2 1 h , 1 min x m
t , cu
1 h
t
>
(6.5)
Funcţiile de apartenenţă trapezoidale se pot defini şi prin adoptarea
unui anumit raport al bazelor trapezului,
( ) 1 B / A h < ·
rezultând:
( )
1
1
]
1

¸

,
_

¸
¸



η −
·
a b
c x
2 1
1
1
, 1 min x m
, cu
1 > η
(6.6)
Un caz particular de funcţie de apartenenţă este funcţia “singleton”
asimilată cu o formă ce derivă din impuls Dirac, cu lăţimea prestabilită,
având reprezentarea generală în figura 6.2.b.
a b
Fig. 6.2. Funcţii de apartenenţă:(a)-trapezoidală, (b)-singleton
6.1.3. Operaţii cu mulţimi fuzzy
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
52
Operaţiile uzuale din teoria clasică a mulţimilor se pot redefini în
cazul mulţimilor fuzzy în termenii funcţiei de apartenenţă:
- mulţimea vidă
X ⊆ ∅
este caracterizată de:
( ) 0 x m ·

; X x ∈ (6.7)
- mulţimea totală X de:
( ) X x , 1 x m
F
∈ · (6.8)
- două mulţimi fuzzy sunt egale, dacă funcţiile lor de
apartenenţă sunt egale :
; m m N M
N M
· ⇔ ·
(6.9)
- mulţimea fuzzy M este conţinută în mulţimea fuzzy N (relaţia
de ordine punctuală între funcţii), adică:
N M
m m N M ≤ ⇔ ⊆
(6.10)
- între mulţimile fuzzy M şi N se definesc operaţiile:
- reuniune:
N M∪ , cu
( ) ( ) ( ) x m x m x m
N M N M
∨ ·

, X x ∈ (6.11)
- intersecţie:
N M∩ , cu
) x ( m ) x ( m ) x ( m
N M N M
∧ ·

, X x ∈
(6.12)
- complementara
M
C
, cu
( ) ( ) x m x m
CM
·
, X x ∈ . (6.13)
Având în vedere relaţia de ordine punctuală între funcţiile de
apartenenţă, cele trei operaţii precedente devin:
( ) ( ) ( ) ( ) x m , x m max x m
N M N M
·

(6.14)
( ) ( ) ( ) ( ) x m , x m min x m
N M N M
·

(6.15)
( ) ( ) x m 1 x m
M CM
− ·
(6.16)
- produsul algebric al mulţimilor fuzzy M şi N, notat N M• , este
caracterizat de funcţia de apartenenţă
53
COMANDA ROBOŢILOR
N M N M
m m m • ·

(6.17)
- suma algebrică a mulţimilor fuzzy M şi N, notată N M+ , este
caracterizată de funcţia de apartenenţă
N M N M N M
m m m m m • − + ·
+
(6.18)
Operaţiile
+ • ,
sunt asociative, comutative, dar nu sunt distributive.
6.1.4. Logica fuzzy de tip lingvistic
Logica fuzzy este o generalizare a logicii clasice bivalente, înlocuind
caracterul discret al acesteia (în 0 şi 1) cu unul de natură continuă.
Fundamentul logicii fuzzy îl constituie aşa-numitele logici polivalente
introduse şi studiate de J. Lukasiewicz. Încă din 1940, Gr. C. Moisil
introduce algebrele Lukasiewicz n-valente ca modele algebrice pentru
logicile cu mai multe valori.
Presupunând că V
1
, V
2
, …, V
n
sunt variabile logice, în logica fuzzy
acestea iau valori în intervalul [0,1].
Definiţie.
Orice variabilă V
i
este o formulă fuzzy.
Dacă
... , Q , P
sunt formule în logica fuzzy, valorile logice (de
adevăr) ale compuselor
P , Q P , Q P ∧ ∨
se stabilesc astfel:
( ) ( ) ( ) ( ) Q A , P A max Q P A · ∨
(6.19)
( ) ( ) ( ) ( ) Q A , P A min Q P A · ∧
(6.20)
( ) ( ) P A 1 P A − ·
(6.21)
( ) ( ) ( ) ( ) 1 , Q A P A 1 min Q P A + − · →
(6.22)
Acest mod de tratare este similar cu cel din logica bivalentă, unde
( ) { } 1 , 0 P A ∈
, oricare ar fi propoziţia P .
Logica fuzzy este un tip de logică continuă, deoarece variabilele
logice iau valori de adevăr în intervalul [0, 1], ceea ce admite existenţa unor
elemente particulare cu privire la variabilele lingvistice: relaţia de
implicaţie fuzzy şi noţiunea de inferenţă fuzzy.
Un alt tip de logică continuă a fost propusă de H. Reichenbach şi se
defineşte astfel:
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
54
( ) ( ) ( ) ( ) ( ) Q A P A Q A P A Q P A ⋅ − + · ∨
(6.23)
( ) ( ) ( ) Q A P A Q P A ⋅ · ∧
(6.24)
( ) ( ) P A 1 P A − ·
(6.25)
( ) ( ) ( ) ( ) Q A P A P A 1 Q P A ⋅ + − · →
.
(6.26)
Variabilele fuzzy sunt mărimi fuzzy asociate celor deterministe.
Echivalentul valorii scalare în sens determinist este pentru o variabilă
fuzzy termenul lingvistic (eticheta, atributul) asociat acesteia. Astfel, aşa
cum pentru logica bivalentă, valorii deterministe “1” i se asociază atributul
ADEVĂRAT, iar lui “0” eticheta FALS, în logica fuzzy, pentru variabila
deterministă număr real pozitiv variabila lingvistică asociată poate fi, de
exemplu, distanţa dintre două puncte, care poate avea termeni lingvistici
MICĂ, MEDIE, MARE sau FOARTE MICĂ, MICĂ, MEDIE, MARE,
FOARTE MARE. Domeniul de valori ale mărimii deterministe
corespunzătoare se numeşte univers de discurs.
Fiecărui atribut al unei variabile lingvistice îi este asociată o funcţie de
apartenenţă, a cărei valoare (în sens determinist) indică nivelul de încredere
cu care unei valori deterministe i se poate asocia acel atribut al variabilei
lingvistice. De exemplu, considerând pentru variabila lingvistică “distanţă”
trei termeni lingvistici: MICĂ, MEDIE, MARE, se asociază acestora funcţii
de apartenenţă tipice, aşa cum se arată în figura 6.3
Se observă că funcţia de apartenenţă pentru termenul lingvistic MICĂ
este o dreaptă, care indică faptul că între 0 şi 10 distanţele sunt considerate
mici, cu diferite niveluri de încredere situate între 0 şi 1, cu cât valoarea
deterministă este mai aproape de 0, cu atât gradul de apartenenţă a acesteia
la eticheta respectivă fiind mai mare.
55
COMANDA ROBOŢILOR
Fig. 6.3. Funcţiile de apartenenţă ale termenilor lingvistici : MICĂ,MEDIE,MARE
Similar, pentru termenul lingvistic MEDIE se consideră nivelul
maxim de apartenenţă la această categorie, corespunzător valorii 10.
Valorile mai mici sau mai mari decât aceasta duc la scăderea nivelului de
încredere relativ la atributul MEDIE. Termenul lingvistic MARE se aplică
valorilor distanţei mai mari de 10, cu niveluri de încredere din ce în ce mai
ridicate, pe măsură ce valoarea creşte până la 20, iar pentru orice valoare
peste aceasta, distanţa este considerată MARE cu nivelul de încredere
maxim (egal cu 1).
Pentru funcţiile de apartenenţă din figura 6.3 se poate afirma, de
exemplu, că o distanţă având valoarea 5 este MICĂ cu nivelul de încredere
(valoarea funcţiei de apartenenţă) m
MICĂ
(5) = 0,50, este şi MEDIE cu nivelul
de încredere m
MEDIE
(5) = 0,44 şi este MARE cu nivelul de încredere zero.
Numărul atributelor unei variabile lingvistice şi funcţiile lor de apartenenţă
depind de natura aplicaţiei.
În logica fuzzy, implicaţia este o operaţie de compunere a formulelor
(variabilelor) fuzzy, în sensul corelării a două categorii de evenimente,
denumite premise, respectiv consecinţe. Implicaţia fuzzy este similară, dar
nu corespunde pe deplin compunerii funcţiilor din cazul determinist şi se
referă la evaluarea gradelor lingvistice ale unei submulţimi fuzzy
Q
, care
este consecinţa logică sau funcţională a unei submulţimi fuzzy P .
Rezultatul unei implicaţii fuzzy este, de asemenea, o submulţime fuzzy
notată cu:
Q P ' Q → ≡
(6.27)
care are aceeaşi termeni lingvistici ca şi
Q
, dar funcţiile ei de apartenenţă,
ce exprimă gradul de adevăr :
( ) ( ) Q P A ' Q A → ·
(6.28)
rezultă în urma unor calcule algebrice efectuate asupra valorilor funcţiilor
de apartenenţă corespunzătoare termenilor lingvistici ce compun implicaţia
fuzzy. Prin urmare, considerând formulele fuzzy:
x : P este MARE, (6.29)
y : Q
este MIC,
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
56
unde x, respectiv y, reprezintă variabila deterministă aparţinând universului
de discurs al submulţimii P, respectiv Q, se exprimă implicaţia fuzzy:
⇔ → ≡ Q P ' Q
DACĂ x este MARE, ATUNCI y este MIC
Considerând
( ) x m
P
, respectiv
( ) y m
Q , funcţiile de apartenenţă ce
caracterizează mulţimile fuzzy P şi Q, se pune problema determinării
funcţiei de apartenenţă:
( ) ( ) y , x m y , x m
Q P Q →
·
(6.30)
Cele mai utilizate definiţii ale implicaţiei fuzzy sunt:
a) implicaţia în sens Mamdani:
( ) ( ) ( ) [ ] y m , x m MIN y , x m
Q P Q P
·

(6.31)
b) implicaţia booleană:
( ) ( ) ( ) [ ] ( ) ( ) [ ] y m , x m MAX y m , x m 1 MAX y , x m
Q
P
Q P Q P
· − ·

(6.32)
c) implicaţia Zadeh I:
( ) ( ) ( ) [ ] y m x m 1 , 1 MIN y , x m
Q P Q P
+ − ·

(6.33)
d) implicaţia Zadeh II:
( ) ( ) ( ) [ ] ( ) { } x m 1 , y m , x m MAX MIN y , x m
P Q P Q P
− ·

(6.34)
e) implicaţia Larsen:
( ) ( ) ( ) y m x m y , x m
Q P Q P
× ·
→ .
(6.35)
Combinarea mai multor variabile fuzzy, în conformitate cu o anumită
logică, conduce la apariţia unor expresii fuzzy cu mai mulţi termeni, legaţi
prin operaţii logice elementare (ŞI, SAU, NU).
PREMISĂ CONSECINŢĂ
57
COMANDA ROBOŢILOR
Aşa cum s-a arătat deja, gradele de apartenenţă fuzzy pot fi combinate
cu ajutorul operatorilor de compunere fuzzy, (Zadeh):
A
m
Şi ( )
B A B
m , m min m · (6.36)
A
m
SAU ( )
B A B
m , m max m · (6.37)
NU
A A
m 1 m − ·
. (6.38)
Dezvoltarea aplicaţiilor practice în domeniul sistemelor fuzzy a
condus la găsirea altor operatori, similari celor utilizaţi la combinarea
probabilităţilor:
- operatorul “produs”:
A
m
ŞI
B A B
m m m • ·
(6.39)
- operatorul “sumă”:
A
m
SAU
B B B A B
m m m m m • − + ·
(6.40)
S-a propus (Ron Yager), de asemenea, o pereche de operatori, având
forma următoare:
A
m
Şi
( ) ( ) ( )
1
]
1

¸

− + − − ·
ω
ω ω
1
B A B
m 1 m 1 , 1 min 1 m
(6.41)
A
m
SAU
( )
1
]
1

¸

+ ·
ω
ω ω
1
B A B
m m , 1 min m
(6.42)
în care ∞ < ω < 0 .
Uzual, în aplicaţii se adoptă 2 · ω , obţinându-se perechea de
operatori tip Yager-2:
A
m
Şi
( ) ( ) ( )
1
]
1

¸

− + − − ·
2
1
2
B
2
A B
m 1 m 1 , 1 min 1 m

(6.43)
A
m
SAU
( )
1
]
1

¸

+ ·
2
1
2
B
2
A B
m m , 1 min m
(6.44)
Pentru a facilita modificările care se impun asupra funcţiilor de
apartenenţă în diferite aplicaţii, au fost creaţi, de asemenea, doi operatori
singulari, unici în logica fuzzy, denumiţi “concentrator”, respectiv
“dilatator”. Un operator de concentrare comprimă funcţia de apartenenţă, iar
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
58
un operator de dilatare realizează o expandare a acesteia. Majoritatea
lucrărilor în domeniu definesc principalii operatori de acest tip sub forma:
( )
2
m m CONC · (6.45)
( )
2
1
m m DIL ·
. (6.46)
Efectul acestor operatori asupra unei funcţii de apartenenţă
( ) x m
este
ilustrat în figura 6.4.
O altă serie de metode sunt folosite pentru obţinerea unor valori ferme
din valori fuzzy, Acestea poartă numele de metode de defuzzificare.
Fig. 6.4. Efectul operatorilor „concentrator” şi „dilatator”
Cele mai folosite metode de defuzzificare sunt [PREITL1]:
- metoda eşantionului maxim - în care din toate regulile activate se
selectează regula cu gradul de realizare maxim, ce va determina
prin valoarea funcţiei de activare de ieşire valoarea fermă;
- metoda maximelor mediate – este asemănătoare cu metoda
eşantionului maxim, dar se consideră două cazuri:
- grade de realizare diferite implică activarea termenului
lingvistic cu grad de realizare maxim;
- grade de realizare egale implică calculul mediei ieşirilor
ferme;
- metoda centrului de greutate – prin calculul centrului de greutate al
ariei funcţiei de apartenenţă.
6.1.5.Sinteza algoritmului fuzzy
59
COMANDA ROBOŢILOR
Majoritatea aplicaţiilor mulţimilor fuzzy, se bazează pe două tipuri de
algoritm: “Mamdani” (Mamdani, Assilian,1975) şi “Sugeno”
(Takagi,Sugeno,Kang 1985).
În mod sintetic aceşti algoritmi se pot reprezenta conform schemelor
din figurile 6.5 şi 6.6, sub forma unor “diagrame de inferenţă”. În cazul
considerat se presupune că sistemele fuzzy au câte două intrări şi o ieşire
(MISO). În aceste scheme cu x şi y s-au notat intrările ferme, iar cu z s-a
notat ieşirea fermă.
Diferenţa dintre cei doi algoritmi constă în :
- forma funcţiilor de apartenenţa de ieşire (treaptă -
singleton);
- modul în care se realizează agregarea (mulţimea tuturor
ieşirilor);
- metode de defuzificare (medie ponderată).
Fig.6.5.Diagrama de inferenţă fuzzy pentru algoritmul de tip Mamdani.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
60
Baza de reguli folosită în diagramele prezentate, este :
1. Dacă X este mică sau Y este mica atunci Z este mică;
2. Dacă X este medie atunci Z este mare;
3. Dacă X este mare sau Y este mare atunci Z este mare;
Se observă că regula 2 nu depinde de intrarea Y.
Fig.6.6. Diagrama de inferenţă fuzzy pentru algoritmul de tip Sugeno.
6.1.6. Structura regulatoarelor fuzzy [PREITL1]
61
COMANDA ROBOŢILOR
Reglajul „clasic”, liniar are la bază utilizarea unor regulatoare tipizate
fără sau cu dinamică . Un regulator tipizat asigură o dependenţă ieşire
funcţie de intrare de forma:
u(t) = f(e(t)) (6.47)
în care : ) ( ) ( ) ( t q t q t e
d
− · , este eroarea de reglare a deplasării pe o axă
(q
d
referinţa iar q reacţia) (figura 6.7.).
Regulatoarele tipizate cel mai frecvent utilizate sunt de tip
proporţional (P), proporţional – derivativ (PD) , proporţional – integrator
(PI) sau proporţional – integrator – derivativ (PID) şi pot fi realizate în
variante analogice sau numerice.
Fig. 6.7. Schema de principiu a unui regulator.
Există o mare varietate de metode de proiectare a sistemelor de
reglare automată liniare care, însă, toate au la bază o modelare matematică
mai mult sau mai puţin pretenţioasă şi exactă a procesului condus. Pe baza
cunoaşterii structurii procesului şi a modelului matematic acceptat, prin
proiectarea sistemului de reglare automată se rezolvă următoarele :
- alegerea structurii sistemului de reglare;
- alegerea tipului de regulator şi calculul valorilor parametrilor
acestuia;
- acordarea parametrilor regulatorului.
Adoptarea în final a unei anumite soluţii are la bază verificarea
comportării sistemului de reglare automată în diferite regimuri considerate
semnificative. În acest scop se pot utiliza metode ca:
- simularea pe calculator a comportamentului sistemului de
reglare în regimurile selectate;
- testarea pe modele de laborator, staţii pilot ş.a. .
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
62
Ultima fază în elaborarea unui dispozitiv de conducere o constituie
adoptarea soluţiei constructive şi implementarea ei practică .
Specifice conducerii bazate pe teoria mulţimilor fuzzy sunt :
- caracterizarea procesului condus (nu necesită elaborarea unui
model matematic explicit);
- proiectarea regulatorului fuzzy, şi modul în care proprietăţile
acestuia pot fi adaptate la cerinţele conducerii.
Structura principială a unui sistem de reglare cu regulator fuzzy cu o
mărime de comandă u este prezentată în figura 6.8.a. iar structura unui
sistem de reglare clasic (figura 6.8.b). Axa de robot se consideră că este
formată din (în cazul unui robot cu acţionare electrică): amplificator de
putere (sau chopper), motor de curent continuu, traductor de deplasare,
tahogenerator. Din punct de vedere al reacţiei, se observă că regulatorul
fuzzy are mai multe intrări (reacţie în poziţie şi viteză ), ceea ce ar
corespunde structuri unui sistem de reglare automată cu două regulatoare
clasice în cascadă (în general P pentru deplasare şi PI pentru viteză).
a. b.
Fig. 6.8. Schemele de reglare de principiu pentru o axă de robot :
a) cu regulator fuzzy, b) cu regulator clasic.
Considerând că schema din fig. 6.8. reprezintă o axă de robot cu
reglaj, notaţiile folosite au următoarea semnificaţie :
-
d
q
- poziţia de referinţă;
- q q e
d
− · - eroare de urmărire;
-
q q  ,
- poziţia şi viteza măsurată;
- v – perturbaţie;
- z – mărime de execuţie;
- u – mărime de comandă.
În locul mărimilor de intrare
q q  ,
, în regulatorul fuzzy, se pot folosi
şi mărimile : eroare de reglare (e), şi derivate ei.
Structura informaţională a regulatorului fuzzy. Configuraţia detaliată
a unui regulator fuzzy cu o ieşire este prezentată în figura 6.9 în care se
63
COMANDA ROBOŢILOR
evidenţiază mecanismul de acţiune a unui astfel de regulator. Notaţiile
folosite în figura 6.9. sunt similare cu cele din figura 6.9,a şi b.
Fig.6.9. Schema principială a unui sistem de reglare cu detalierea regulatorului fuzzy.
Etapele de procesare a informaţiei pentru regulatorul fuzzy, sunt :
- etapa de fuzzificare a informaţiei ferme disponibile, referitoare
la evoluţia şi tendinţele de evoluţie ale mărimilor procesului; ca
rezultat se obţine informaţia vagă sub forma variabilelor, a
termenilor lingvistici şi a funcţiilor de apartenenţă aferente;
- etapa de inferenţă, prin care informaţia sub formă vagă
referitoare la intrări este prelucrată pe baza setului de reguli de
forma: ...SAU R
i
: DACĂ (premiza) ATUNCI (concluzia) (5.1)
SAU ..., i = 1, 2, ... ca rezultat se obţine concluzia vagă sub
forma comenzii în caracterizarea vagă m
Rez
0
(u) ;
- etapa de defuzzificare, adică de conversie a caracterizării
vagi a comenzii într-o formulare fermă, sub forma comenzii
u; această valoare fermă este apoi aplicată elementului de
execuţie (amplificator de putere, chopper) din cadrul axei
robotului.
6.1.7. Metode de comandă a roboţilor utilizând logica fuzzy.
Roboţii pot fi consideraţi sisteme dinamice, neliniare, cu mai multe
intrări şi mai multe ieşiri (MIMO). Conducerea acestor sisteme, folosind
modele şi legi de reglare analitice este greu de realizat din cauza a mai
multor factori. Includerea în sistemul de conducere a unor module fuzzy,
poate să aibă două avantaje majore :
- o definire mai simplă şi mai apropiată de modul uman de
înţelegere a fenomenelor;
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
64
- realizarea unor sisteme de conducere robuste şi adaptive care să
elimine neajunsurile generate de incertitudini.
Există o mare diversitate de moduri în care se pot folosi sisteme de
inferenţă fuzzy în conducerea roboţilor, atât în privinţa locului în care se
aplică în schema de conducere. cât şi în privinţa formei sistemelor de
inferenţă. În continuare se prezintă câteva aspecte ale cercetării, publicate în
literatura de specialitate.
Din bibliografia prezentată se desprinde concluzia că sistemele de
inferenţă fuzzy sunt folosite, printre altele, la generarea traiectoriei
[JANG1], definirea modelului robotului [EMAMI1], înlocuirea
regulatoarelor clasice [NOVAK1] sau în combinaţie cu acestea [REZNIK1].
Bazele reglajului fuzzy pentru sisteme de reglare automată sunt
prezentate în [PREITL1]. În aceeaşi lucrare se arată că se pot realiza
regulatoare fuzzy cu funcţionare similară celor clasice (cvasi-PID). În alte
cercetări se subliniază importanţa ajustării parametrilor regulatorului, şi
faptul că faţă de regulatoarele clasice, regulatoarele fuzzy se pot ajusta într-
o manieră mult mai convenabilă [REZNIK1].
Din cauza faptului că o mare parte din sistemele de inferenţă fuzzy au
fost implementate pe baza cunoştinţelor formale, euristice (funcţiile de
apartenenţă şi setul de reguli sunt definite după bunul simţ tehnic al unor
specialişti), nu există garanţia unei funcţionări sigure sau a stabilităţii
sistemului în condiţii neprevăzute. O serie de cercetări în domeniu au ca
scop elaborarea unor metodologii de sinteză şi analiză a sistemelor de
inferenţă fuzzy, în domeniul roboticii [EMAMI1], [NOVAK1], sau în
domeniul mai larg, dar aplicabil în robotică, al sistemelor cu reglare
automată [PREITL1] (studiul stabilităţii sistemelor cu regulatoare fuzzy).
De asemenea există preocupări privind elaborarea unor modele fuzzy
a roboţilor (folosite în cinematica directă şi inversă [JANG1] sau în
dinamica inversă [BAPTISTA1]) care să înlocuiască modelele analitice,
care necesită calcule îndelungate.
Multe dintre cercetările în domeniu încearcă o abordare sistematică a
proiectării sistemelor de inferenţă fuzzy (elaborarea unei metodologii de
proiectare), care să elimine incertitudinile în alegerea funcţiilor de
apartenenţă şi a setului de reguli, ca de exemplu în [EMAMI1], în care se
pune problema stabilirii riguroase a parametrilor sistemelor de inferenţă
fuzzy, pe baza unei metodologii clare.
Sistemul de conducere fuzzy al unui robot cu 4 grade de mobilitate,
toate cuplele fiind de rotaţie, prezentat în [EMAMI1] este arătat în figura
6.10.
65
COMANDA ROBOŢILOR
În acest context robotul este considerat un sistem dinamic, neliniar,
MIMO. “Baza de cunoştinţe fuzzy”, reprezintă modelul fuzzy al robotului,
sau altfel spus modelează dinamica inversă a robotului, generând valoarea
forţelor şi momentelor de referinţă ca funcţie de traiectoria dată a
variabilelor de stare (deplasări, viteze, acceleraţii).
Modelul dinamicii inverse pentru un robot cu S grade de mobilitate
este dat de :
S s q q q Fs
s
.... 1 ), , , , ( · · ξ τ   
(6.48)
în care
-
q q q    , ,
sunt vectorii deplasărilor, vitezelor şi acceleraţiilor
cuplelor cinematice conducătoare;
-
s
τ
este momentul aplicat în cupla s ;
-
ξ
este vectorul parametrilor cinematici şi dinamici ai robotului.
Relaţia (6.48) se referă numai la momentul unei singure cuple “s”.
Funcţia F
s
este puternic neliniară şi modelează dinamica interacţiunii
dintre cuple, gravitaţia, frecările, rigiditatea şi jocul din cuple şi variaţia
sarcinii.
Din punctul de vedere al logicii fuzzy, cunoştinţele codificate despre
dinamica robotului pot fi interpretate ca un număr de S modele fuzzy.
Fiecare model s, exprimă variaţia momentului unei cuple cinematice
conducătoare ca rezultat al mişcării tuturor articulaţiilor, deci fiecare model
fuzzy are o bază de reguli Dacă-atunci , având ca premize valorile
deplasărilor, vitezelor şi acceleraţiilor şi o singură concluzie, valoarea
momentului.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
66
Fig.6.10. Schema structurii unui sistem de conducere cu logică fuzzy.
Baza de reguli a cuplei s poate fi exprimată în modul următor:
Dacă x
s1
este B
s11
şi ….şi x
sr
este B
s1r
atunci s
τ
este D
s1
Dacă x
s1
este B
s21
şi ….şi x
sr
este B
s2r
atunci s
τ
este D
s2
..............................................
Dacă x
s1
este B
sn1
şi ….şi x
sr
este B
snr
atunci s
τ
este D
sn
în care
- x
s1
, x
s2
, x
s2
….. x
sr
sunt variabilele de intrare pentru cupla s , ce
reprezintă elementele vectorilor
q q q    , ,
, cu r – numărul total de
elemente ale vectorilor
q q q    , ,
;
- s
τ
este momentul de ieşire pentru cupla s;
B
sij
şi D
sij
(i = 1….n,j = 1…r) sunt funcţiile de apartenenţă de intrare
respectiv de ieşire, cu n –numărul de reguli ai bazei de reguli ai modelului
fuzzy pentru cupla s.
Notaţiile din figura 6.10. sunt :
-
d d d
q q q    , , - sunt vectorii poziţiei, vitezei şi acceleraţiei de
referinţă;
-
r
q 
- este dat de relaţia
) ( ) ( q q K q q K q q
d
d
d
p
d
r
      − + − + ·
, în
care K
p
şi K
d
sunt parametrii factorilor proporţional şi derivativ;
-
e e  ,
vectorii erorilor de viteză şi poziţie;
-
n
s s s ,...., ,
2 1
valorile erorilor generalizate ce se definesc în
relaţia (5.2.);
-
n c c c
u u u ,...., ,
2 1
valori de corecţie a comenzilor în scopul
măririi robusteţei sistemului
- n
d d d
u u u ,...., , 2 1 valorile de comandă pentru fiecare c.c.c.;
- n
u u u ,...., ,
2 1 valorile robuste ale comenzilor;
-
q q  ,
vectorul valorilor reale (măsurate) ale deplasărilor şi
vitezelor în cuple.
Datorită numărului mare de modele fuzzy, reguli şi funcţii de
apartenenţă de intrare şi ieşire, determinarea acestora numai pe baze
intuitive este deosebit de greoaie. Din această cauză în [EMAMI1] se
propune o metodologie de generare a acestora prin identificare folosind
seturi de intrări şi ieşiri măsurate. Schema principială de identificare este
redată în figura 6.11. Setul de intrări - ieşiri folosit la identificarea
67
COMANDA ROBOŢILOR
modelului fuzzy, se obţin experimental folosind date obţinute cu ajutorul
unui sistem arătat în figura 6.12.
Fig.6.11. Schema modelării prin identificare a unui sistem de inferenţă fuzzy
Fig.6.12. Schema achiziţiei datelor pentru identificarea
structurii şi parametrilor sistemului de inferenţă fuzzy.
În figura 6.12. matricea diagonală (K
ij
) este matricea de comandă a
manipulatorului.
În scopul îmbunătăţirii robusteţei sistemului prezentat, acesta posedă
câte un modul numit “Robustificator” fuzzy, separat pentru fiecare axă.
Se consideră ca sarcină a conducerii, urmărirea vectorilor
q
şi
q
, în
condiţiile în care parametrii sistemului sunt variabili şi o serie de factori
incerţi acţionează asupra robotului. Pentru a duce la bun sfârşit această
sarcină, mărimile ce trebuiesc supravegheate de către sistemul de conducere
sunt eroarea de urmărire q q e
d
− · şi modificarea acesteia în timp
q q e
d
   − ·
. Se defineşte un vector al erorilor generalizate :

+ − ·
1
0
edt Q Pe e s 
(6.49.)
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
68
în care P>0 şi Q>0 sunt matrici diagonale n x n. Termenul integral se
introduce pentru a asigura un offset nul şi este calculat în modulul
“Procesare erori” (figura 6.10.).
Pe baza acestei definiţii, se demonstrează în [EMAMI1], că există un
domeniu în planul (s,u
c
) (unde u
c
reprezintă mărimea de comandă), în care
valorile u
c
pot corecta incertitudinile din sistem, acest domeniu numindu-se
“regiune de robusteţe”. În figura 6.13 se arată forma acestui domeniu.
“Regiunea de robusteţe” poate fi definită prin reguli fuzzy alese
adecvat. Funcţiile de apartenenţă folosite şi forma domeniului, obţinută prin
sistemul de inferenţă fuzzy, sunt arătate în figura 6.13. şi respectiv în figura
6.14.
Fig.6.13. “Regiunea de robusteţe”.
69
COMANDA ROBOŢILOR
Fig.6.14. Diagrama “regiunii de robusteţe” a comenzii
Se observă că sistemul de inferenţă fuzzy prezentat are un număr relativ
mare de reguli (3S , în cazul în care se consideră intrările menţionate). În
comparaţie cu sistemele de conducere ale unor sisteme cu puţine intrări şi
ieşiri şi o evoluţie lentă, în cazul roboţilor numărul de reguli şi complexitatea
acestora este mult mai mare, ducând la încetinirea funcţionării sistemului.
Pentru rezolvarea acestor probleme se propun metode de reducere a
numărului de reguli, (Chiu,1996),(William şi Andrews, 1998) sau chiar
eliminarea totală a regulilor exprimate sub formă explicită, prin definirea unei
funcţii analitice care să genereze centrul funcţiei de apartenenţă de ieşire în
cadrul fiecărui proces de inferenţă [NOVAK1].
Sistemul de inferenţă fuzzy prezentat în [NOVAK1], se bazează pe
idea modificării formei şi poziţiei centrului funcţiilor de apartenenţă.
Metoda foloseşte funcţii de apartenenţă definite analitic de tip “cosinus”
prezentate şi în [PREITL1], ca cele arătate în figura 6.15, din care se
observă că se pot obţine o familie de funcţii de apartenenţă prin ajustarea
unor parametrii.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
70
Fig.6.15. Reprezentarea grafică a funcţiilor de apartenenţă obţinute din aceeaşi
expresie analitică
prin modificarea unor parametrii (S(x) – mulţimi fuzzy de intrare, x –
variabile de intrare.
Se defineşte de asemenea un alt set de funcţii (arătate în figura 6.16)
care modifică poziţia centrului funcţiilor de apartenenţă de ieşire. Prin
modificarea poziţiei centrului funcţiilor de apartenenţă se ajunge practic la
acelaşi rezultat ca şi în cazul folosirii unui set de reguli “Dacă….. atunci” .
Fig.6.16. Reprezentarea grafică a poziţiilor centrelor mulţimilor fuzzy de ieşire pentru
diverse valori ale parametrilor (Yc(x) – poziţia centrului).
Parametri de ajustare sunt aleşi, în urma experimentărilor (în faza de
proiectare a sistemului de inferenţă fuzzy), în aşa fel încât funcţiile de
apartenenţă obţinute să reflecte caracteristicile dinamice ale robotului ce
urmează să fie condus. În figura 6.17. se arată schema de reglare a unei axe
a robotului, propusă în [NOVAK1].
71
COMANDA ROBOŢILOR
Fig.6.17.Schema reglării fuzzy a unei axe a robotului
folosit în [NOVAK1] (manipulator Stanford - RRTR).
Notaţiile utilizate în figura 6.17. sunt :
-
) 1 ( ), ( + t u t u
- tensiunea de comandă la momentul t respectiv
t+1;
-
) ( ), ( t q t q 
- poziţia şi viteza reală (măsurată);
-
) ( ), ( t q t q
w w

- poziţia şi viteza de referinţă;
-
) ( ), ( t e t e 
- eroarea de urmărire a poziţiei şi a vitezei.
Schema prezentată în figura 6.17. este aplicată la fiecare axă a
robotului. Problemele legate de funcţionarea simultană a axelor (cuplările
neliniare : centrifuge şi Coriolis), sunt rezolvate prin acordarea parametrilor
regulatoarelor fuzzy.
O analiză completă a regulatoarelor fuzzy este prezentată în
[PREITL1]. Aplicaţiile dezvoltate în această lucrare (de exemplu
servosistemul hidraulic cu reglare fuzzy), pot fi aplicate şi în cazul unor
roboţi industriali, cu observaţia că parametrii regulatorului vor trebui
acordaţi ţinând cont şi de cuplarea dinamică a axelor (la fel ca în
[NOVAK1]).
6.2. Comanda roboţilor utilizând reţele neuronale
artificiale.
6.2.1. Consideraţii generale.
O reţea neuronală artificială poate fi definită ca un sistem
informaţional compus din neuroni de acelaşi tip organizaţi într-o topologie
structurată, dotată cu algoritm de învăţare şi care este capabil să redea
informaţiile învăţate. Noţiuni de bază ale reţelelor neuronale sunt date în
[DUMIT1] şi [TODER1] iar aplicaţiile acestora în inginerie şi conducerea
proceselor sunt date în [LEVINE1], [REICH1] şi [REICH2].
În continuare, având în vedere tematica de ordin tehnic a acestei lucrări, nu
se va mai specifica atributul “artificial”, acesta fiind de la sine înţeles.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
72
Funcţionarea unei reţele neuronale poate fi defalcată în două faze
separate :
- faza de antrenare sau învăţare;
- faza de procesare a informaţiilor pe baza celor învăţate
Sistemele care îşi modifică parametrii şi în a doua fază, deci învaţă
când mediul e în continuă schimbare, se numesc adaptive.
Deosebirea faţă de structurile informaţionale clasice constă în faptul
că în acestea, într-un anume fel, în cadrul programării, se ţine seama de
natura problemei trebuie rezolvată, pe când reţelele neuronale ţin mult mai
puţin seama de problemele specifice ale aplicaţiei, structura reţelei fiind de
obicei general valabilă pentru un domeniu mult mai larg de aplicaţii. În
timpul învăţării se modifică doar parametrii structurii.
Din definiţia reţelelor neuronale se observă că acestea pot fi privite ca
memorii speciale în care se înscriu date prin învăţare şi se recitesc apoi în
timpul funcţionării. Şi în această viziune se observă o deosebire
fundamentală faţă de memoriile clasice, deoarece la acestea, informaţia se
înscrie la o anumită adresă şi se reciteşte conţinutul prin specificarea adresei
pe când în cazul reţelelor neuronale, acestea funcţionează ca memorii ce se
adresează prin conţinut (content addressable memory), deci sub acest aspect
reţelele neuronale pot fi considerate ca memorii asociative (există o
similaritate cu memoria umană). În acest caz se consideră ca intrări un set de
date de antrenare iar reţeaua neuronală încearcă să facă o conexiune între
datele de acelaşi fel grupând adresele acestora, în mod autonom sau
supravegheat. În faza de procesare sau funcţionare setul de date necunoscute
se asociază celor învăţate şi sistemul va returna adresele învăţate la faza
precedentă. Dacă două date de intrare aparţin aceleiaşi grupe se vor returna
adrese ce pot fi chiar îndepărtate una de alta.
Din punctul de vedere al naturii intrărilor reţelele neuronale pot fi:
- autoasociative – se memorează în reţea vectorii de intrare;
- heteroasociative – se memorează în reţea legătura dintre vectorii
de intrare şi ieşire.
Pe lângă cele definite mai sus, o reţea neuronală este definită de:
- topologie;
- modul de învăţare (algoritmul de antrenare).
În ceea ce priveşte modul de implementare al reţelei neuronale,
aceasta poate funcţiona în impulsuri (în timp discret) sau continuu, în
funcţie de sistemul hard digital, respectiv analogic pe care este
implementată reţeaua neuronală. Tot de sistemul hard depinde şi modul de
funcţionare paralel (în cazul sistemelor multi-procesor) sau succesiv (în
73
COMANDA ROBOŢILOR
cazul sistemelor cu un singur procesor). În al doilea caz se poate vorbi doar
de simularea funcţionării reţelei neuronale, pentru că modul de funcţionare
natural (intrinsec) este cel paralel. De asemenea, acesta este şi modul în care
funcţionează sistemele cu reţele neuronale în timp real.
6.2.2 Elementele de bază ale reţelelor neuronale
Structura generală a unui element de bază a unei reţele neuronale
(denumit neuron artificial), este arătată în schema din figura 6.18.
Fig. 6.18. Schema de principiu a unui neuron
În figura 6.18 intrarea de activare, există numai în cazul reţelelor cu
funcţionare discretă, această intrare are scopul de a da tactul reţelei
Expresia analitică ce leagă ieşirea de intrările neuronului este de forma :
y(k) = f (x
(k)
, x
(k-1)
, … x
(k-Mx)
, y
(k-1)
, y
(k-2)
,…, y
(k-My)
) (6.50)
în care : x(k) = [x
0
(k), x
1
(k),…,x
N
(k)]
T
În decursul dezvoltării reţelelor neuronale s-au definit mai multe tipuri
de structuri, dintre care se prezintă cele mai semnificative.
a.) Schema unui neuron simplu, fără memorie locală, este prezentată
în figura 6.19. Aceasta este baza din care s-au dezvoltat toate celelalte tipuri
de reţele neuronale.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
74
Expresia ieşirii perceptronului se calculează prin suma ponderată

·
·
N
i
i i
x w s
0
şi apoi rezultatul acesteia este y=f(s) , în care f(s) este o funcţie
neliniară.
Suma ponderată s poartă denumirea de excitaţie iar ieşirea y este
răspunsul la această excitaţie (în unele lucrări : “activation”, nu trebuie să se
confunde cu intrarea de activare).
Sunt cazuri în care : f(s) = s , atunci :

·
· ·
N
i
T
i i
x w x w y
0
şi y = s = w
T
x.
Fig.6.19. Schema de principiu a unui perceptron.
Acest tip de neuron, intră de obicei în componenţa reţelelor mai mari.
Neuronul prezentat în figura 6.19. mai poartă denumirea de perceptron
(Rosenblat, 1958). Când ieşirea de activare f(s) este o funcţie neliniară,
neuronul prezentat în figura 6.19. se numeşte ADALINE (ADAaptive
LInear NEuron - Widrow şi Hoff, 1960). În acest caz y=f(s)=f(w
T
x).
Funcţia neliniară de activare este tipic o funcţie
] , [ ); ( e d R s s sign y − → ∈ ·
, (figura 6.20.a). În afară de aceasta se mai
folosesc în mod uzual tipurile de funcţii de activare a căror reprezentare
grafică este dată în figurile 6.20.b, 6.20.c, 6.20.d.
75
COMANDA ROBOŢILOR
a. b. c. d.
Fig.6.20. Reprezentarea grafică a patru tipuri de funcţii de activare.
Funcţia reprezentată în 6.20.c se exprimă prin relaţia :
0 ;
1
1
>
+

·


k
e
e
y
ks
ks
, iar ce din 6.20.d. prin relaţia :
0 ;
1
1
>
+
·

k
e
y
ks
b.) De multe ori întrările se clasifică după faptul că întăresc (măresc
valoarea ieşirii) sau slăbesc (micşorează valoarea ieşirii) ieşirea, deci
intrările pot fi: excitatoare şi inhibatoare.
Schema neuronului dotat şi cu intrări excitatoare sau inhibatoare este
prezentat în figura 6.21.a. (Fukushima 1988) şi se foloseşte cu succes în
prelucrarea imaginilor.
a. b.
Fig.6.21. Schema neuronului dotat cu intrări de excitaţie şi inhibatoare
(a), reprezentarea grafică a funcţiei f2(u) (b).
În cazul acestui tip de neuron, funcţia f1 este definită prin relaţia:
M M
N
i
i i
M
x w
x w
x x f
+
+
·

·
1
1
) ,..., (
1
1 1
, iar funcţia f2 are forma prezentată în figura
6.21.b.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
76
c.) O altă variantă a neuronului este cea reprezentată în figura 6.22. în
care elementul sumator lipseşte şi cele N intrări ale neuronului reprezintă de
fapt variabile ale unei funcţii de tip distanţă sau normă
R u R x x x u x x x
N
N N
∈ ∈ → ; ) ,..., , ( ; ) ,..., , (
2 1 2 1
, având expresia :
i i
c x u − ·
, care în particular poate fi scrisă ca
2 2
1 1
) ( ... ) (
N N
c x c x u − + + − · . Ieşirea este o funcţie a distanţei dintre
vectorul intrărilor x = [x
1
, x
2
, …, x
N
]
T
şi c = [c
1
, c
2
,…, c
N
]
T
– vector specific
neuronului
În cazul folosirii unei funcţii de distribuţie normală cu rol de funcţie
de activare, f(u) are o simetrie radială în jurul mediei c, iar
σ
este dispersia
acestei funcţii.
a. b.
Fig.6.22. Schema unui neuron RBF (a) şi reprezentarea grafică a
funcţiei de activare (funcţie de distribuţie normală) (b)
Reţelele neuronale compuse cu astfel de neuroni se numesc tip RBF
(Radial Basis Function).
d.) Pentru a întări rolul valorilor intrărilor învăţate neuronii se dotează
cu memorii locale. În acest scop, de obicei, se introduce în schema generală
(figura 6.23.) un element de tip filtru liniar FIR (Finite Impulse Response)
sau IIR (Infinite Impulse Response) la ieşirea sau la intrarea neuronului.
Funcţia de memorie a neuronului se realizează în componenta de memorie a
filtrului. În figura 6.23. se prezintă schema unui neuron cu filtru pe ieşire,
iar în figura 6.24. o reţea cu M neuroni cu filtre pe intrări şi un filtru pe
ieşire.
77
COMANDA ROBOŢILOR
Fig.6.23. Schema unui neuron cu filtru pe ieşire.
Fig.6.24. Schema de principiu a unei reţele cu memorii (filtre)
pe intrări şi ieşire.
6.2.3. Topologia reţelelor neuronale.
Reţelele neuronale se reprezintă schematic prin grafuri orientate. Din
această cauză structura unei reţele neuronale se mai defineşte prin termenul
de topologie.
În aceste scheme nodurile reţelei sunt considerate memorii iar
muchiile sunt conexiunile dintre acestea. Ponderile şi filtrele se asociază
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
78
muchiilor. De obicei în cazul reţelelor neuronale, grafurile se pot împărţi în
straturi.
Se definesc trei tipuri de straturi:
- strat de intrare – neuronii acestui strat formează o clasă aparte;
- straturi ascunse – (hidden layers);
- strat de ieşire – neuronii nu se deosebesc de cei din straturile
ascunse.
Pot exista unul sau mai multe straturi ascunse. Se vorbeşte de mai
multe straturi ascunse atunci când neuronii care nu sunt conectaţi la mediu
pot fi împărţiţi în submulţimi disjuncte ce se conectează între ele prin ieşire
– intrare în aşa fel încât ieşirea stratului k să constituie intrarea stratului
k+1, k reprezentând indicele unui strat oarecare.
În figura 6.25. este prezentată o reţea neuronală cu un singur strat
ascuns.
Ponderile reţelei se notează w
ij
(w de la “weight” - pondere) ,în care
indicii reprezintă numerele nodurilor legate prin acea pondere. Topologia
reţelei neuronale se poate defini prin specificarea într-o anumită formă a
ponderile pentru fiecare legătură dintre neuroni. Ponderile w
ij
se pot înscrie
într-o matrice de dimensiune : N x (N+M+1) în care N este numărul de
neuroni şi M este numărul de intrări a reţelei
Un caz aparte îl constituie reţeaua total conectată care se poate
reprezenta printr-o matrice de dimensiune NxN.
Fig.6.25. Schema unei reţele multistrat,
79
COMANDA ROBOŢILOR
cu “I” s-a notat intrarea constantă.
În reprezentarea matricială se consideră că stratul de intrare are
ponderile 0.
În diferite lucrări apar interpretări diferite ale noţiunii de strat, astfel
incât unii autori consideră şi neuronii de intrare sau ieşire ca fiind câte un
strat. În cazul în care neuronii de intrare şi ieşire nu sunt consideraţi ca
făcând parte dintr-un strat aparte, numărul straturilor reţelei se consideră
egal cu numărul straturilor ascunse.
Matricea ponderilor W a reţelei neuronale din figura 6.25., se scrie :
1
1
1
1
]
1

¸

·
3 , 4 2 , 4 1 , 4 0 , 4
1 , 3 0 , 3
1 , 2 0 , 2
0 0
0 0
0 0 0 0
w w w w
w w
w w
W
(6.50)
Dacă se împarte în straturi, matricea ponderilor, pentru un strat va fi
minorul nenul al matricii ponderilor reţelei. În cadrul matricii din relaţia
(6.50), stratul 2 este reprezentat prin :
1
]
1

¸

·
1 , 3 0 , 3
1 , 2 0 , 2
2
w w
w w
W
(6.51)
iar stratul 3 prin :
[ ]
3 , 4 2 , 4 1 , 4 0 , 4
3
w w w w W ·
(6.52)
În cazul reţelei neuronale total conectate, reprezentate în schema din
figura 6.27., matricea ponderilor va avea următoarea expresie:
1
1
1
1
]
1

¸

·
4 , 4 3 , 4 2 , 4 1 , 4 0 , 4
4 , 3 3 , 3 2 , 3 1 , 3 0 , 3
4 , 2 3 , 2 2 , 2 1 , 2 0 , 2
0 0 0 0 0
w w w w w
w w w w w
w w w w w
W
(6.53)
Scrierea matricială a structurii reţelei are o importanţă deosebită în
realizarea programelor cu reţele neuronale deoarece calculul matricial este
uşor realizabil în orice limbaj de programare evoluat.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
80
cu “I” s-a notat intrarea constantă.
În reţeaua neuronală total conectată se deosebesc trei tipuri de
semnale:
- semnale de intrare;
- semnale dintre neuroni;
- semnalul constant x
io
= 1
În afară de punctul de vedere topologic, reţelele neuronale mai pot fi
clasificate în funcţie de modul de propagare a informaţiei, în două grupe.
- cu buclă de reacţie (feedback recall, recurrent network);
- cu propagare înainte (feedforward recall), figura 6.27.
Fig.6.26. Schema unei reţele total conectate,
Această clasificare se referă la faza de funcţionare a reţelei (recall).
Astfel pot exista reţele care funcţionează pe baza unei structuri cu propagare
înainte, dar care în faza de învăţare posedă bucle de reacţie. În acest caz
informaţia ce se propagă înapoi este eroarea, adică diferenţa dintre ieşirea
realizată şi ieşirea dorită, iar bucla de reacţie are ca scop ajustarea
ponderilor în vederea minimizării erorii.
Din punctul de vedere al scrierii matriciale, o reţea neuronală este fără
buclă de reacţie (feedforward recall) dacă se pot indexa neuronii în aşa fel
încât matricea ponderilor, W să fie o matrice triunghiulară şi să aibă toate
elementele de pe diagonala principală nule.
81
COMANDA ROBOŢILOR
Fig.6.27. Schema unei reţele neuronale cu propagare înainte.
Buclele de reacţie într-o reţea neuronală pot fi de trei categorii:
- conexiune recurentă (recurent connection)(figura 6.28.a);
- conexiune laterală (intra-layer connection)(figura 6.28.b.);
- conexiune între straturi (inter-layer connection)(figura 6.28.c.).
a. b. c.
Fig.6.28. Scheme ale conexiunilor cu buclă de reacţie :
a) recurentă, b) laterală, c) între straturi.
6.2.4. Aproximarea funcţiilor cu reţele neuronale. Precizia de
aproximare.
Există o mare varietate de probleme tehnice în care se folosesc metode
de aproximare a unor funcţii. În cazul reglării utilizate la roboţi industriali,
metodele de aproximare se folosesc pentru a genera legi de conducere care
nu pot fi deduse pe cale analitică, folosind perechi de seturi de intrări şi
ieşiri cunoscute (obţinute experimental). O altă grupă de aplicaţii ar fi
identificarea sistemului dinamic neliniar (robotul este un astfel de sistem), în
vederea realizării unui model al acestuia, folosit, de exemplu, în conducerea
predictivă după model. În acest caz modelul poate elabora, pe baza intrărilor
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
82
şi a variabilelor de stare, predicţii cu privire la valoarea mărimii de
comandă.
Problema aproximării funcţiilor poate fi enunţată astfel : fie R
N

spaţiul euclidian de vectori cu N elemente de numere reale şi C
N
mulţimea
funcţiilor continue ce realizează o aplicaţie R
N
→R, să se găsească o funcţie
f: A ⊂ R
N
→R cu A → f(A) când sunt date A, submulţime compactă
mărginită a lui R
N
şi f(A), submulţime compactă mărginită a lui R.
În practica inginerească problema de mai sus se formulează astfel:
Există un sistem necunoscut (figura 6.29.) a cărei intrare şi ieşire este
cunoscută (măsurabilă). Deoarece nu se cunoaşte sistemul şi nici f trebuie să
se realizeze un model ce îl aproximează. Dacă la intrarea x sistemul
generează ieşirea y iar modelul generează ieşirea y’ scopul este ca y’ să
tindă către y după un criteriu oarecare de aproximare (de exemplu medie
pătratică).
Fig. 6.29. Schema unui sistem elementar.
Problema prezentată se rezolvă în mod clasic prin metode de
identificare a sistemelor.
În acest sens intervin mai multe situaţii:
a) funcţia este cunoscută şi parametrii sunt necunoscuţi;
b) funcţia este necunoscută şi parametrii ei sunt necunoscuţi.
Pentru rezolvarea cazului a) există un număr mare de metode clasice
(de exemplu metoda celor mai mici pătrate). Cazul b) este mai dificil, şi
pentru rezolvarea acestuia se adoptă următoarea strategie :
- se alege o funcţie (pe baza experienţei unui specialist), care în
principiu să aibă natura funcţiei necunoscute;
- se determină parametrii acesteia cu ajutorul unor perechi de
seturi de intrări şi ieşiri de testare;
- se verifică, prin simulare, cu ajutorul unor seturi de intrări ieşiri
de validare, dacă ieşirile funcţiei obţinute sunt apropiate de cele
reale;
- în cazul în care rezultatele nu sunt satisfăcătoare se alege o altă
funcţie pentru model, şi se repetă paşii anteriori.
83
COMANDA ROBOŢILOR
Se observă că în cadrul metodelor clasice de identificare, pentru cazul
b), se caută forma unei funcţii ce ar aproxima cel mai bine sistemul. În cele
mai multe cazuri, aceasta poate fi o sarcină deosebit de dificilă.
Reţelele neuronale, într-un număr însemnat de aplicaţii, oferă o
alternativă viabilă la rezolvarea problemei prezentate, prin ajustarea
ponderilor (cu ajutorul unor algoritmi de învâţare) (Hecht şi Nielsen 1989).
Există două tipuri de reţele neuronale ce se folosesc în probleme de
aproximarea funcţiilor şi care se vor prezenta în continuare.
Reţelele neuronale pentru aproximarea funcţiilor, cu două straturi
neliniare.
Definirea acestui grup de probleme pleacă de la o aserţiune teoretică:
să se arate că există o funcţie continuă de trei variabile, care nu poate fi
scrisă cu ajutorul unui număr finit de funcţii continue cu două variabile (a
13-a problemă a lui Hilbert). În mod explicit se poate scrie :
f(x,y,z) = ∅
1

1
(x)
1
, Ψ
2
(x)
2
) + ∅
2
(c
1
Ψ
3
(y) + c
2
Ψ(z)z) (6.54)
Schema unei reţele neuronale care să corespundă acestei funcţii este
dată în figura 6.30.
Fig.6.30. Schema reţelei neuronale care modelează relaţia (6.54).
În 1957, Hilbert a fost contrazis de Kolmogorov care a demonstrat că
orice funcţie continuă de N variabile se poate scrie cu un număr finit de
funcţii de o variabilă.
Teorema Kolmogorov, 1957 (T1).
Pentru orice N ≥ 2, (N număr natural) există o funcţie continuă,
monoton crescătoare de variabilă Ψ
pq
cu ajutorul căreia se poate construi
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
84
orice funcţie continuă, reală cu N variabile f: R
N
→R. Funcţia f de N variabile
se poate construi cu ajutorul formulei:
f(
x1
, x
2
, x
3
, …, x
N
) = ∑ ∑
· ·
Ψ Φ
N
q
N
p
p pq
x q
2
0 1
) ) ( (
(6.55)
unde ∅
q
cu q = 1…N, este diferită pentru diferitele f, dar ψ
pq
(,) p = 1…N,
q = 0…2N depind numai de N.
Teorema (T1) nu se poate folosi nemijlocit în rezolvarea problemelor
inginereşti deoarece demonstraţia teoremei nu este constructivă, adică nu
generează algoritmi nici pentru construcţia lui ψ
pq
pentru N dat şi nici
pentru construcţia lui ∅
q
pentru N şi f date. Teorema a fost dezvoltată şi
reformulată de Sprecher (printre alţii), prin faptul că în loc de mulţimea de
funcţii folosită de Kolmogorov foloseşte numai două funcţii neliniare. Cele
două funcţii se folosesc în mod repetat pentru mărirea preciziei de
aproximare.
Teorema Sprecher, 1965 (T2).
∃ Ψ (x) : [0,1] → [0,1] monoton crescătoare care depinde numai de
N (N număr natural ; N≥ 2) pentru care se poate găsi ε > 0 astfel încât
orice funcţie continuă reală f(x) : [0,1]
N
→R se poate scrie sub forma:
) 1 )) 1 ( ( ( ) (
1 2
1 1
− + − + Ψ Φ ·
∑ ∑
+
· ·
p p x x f
q
N
q
N
p
q
ε λ
(6.56)
unde ∅ este o funcţie continuă de argument real şi λ o constantă.
Funcţia f(x) corespunde unei reţele cu două nivele ascunse primul cu
funcţia de activare Ψ iar al doilea cu funcţia ∅, Teorema (T2) se aplică
pentru reţelele cu învăţare prin propagarea înapoi a erori
(backpropagation).
Teorema Hecht – Nielsen, 1987 (T3)
∀ f(x): [0,1]
N
→R integrabilă (δ∈ L
2
), aceasta poate fi aproximată (cu
o eroare controlabilă) cu o reţea cu cel mult două nivele ascunse ce conţin
neuroni a căror activare este sigmoidală.
85
COMANDA ROBOŢILOR
Deşi o fost revăzută în ultima vreme, teorema Kolmogorov nu îşi
poate găsi încă aplicabilitate în rezolvarea problemelor tehnice (ca de
exemplu conducerea roboţilor) datorită lipsei algoritmilor de construcţie a
funcţiilor de aproximare.
Reţele neuronale pentru aproximarea funcţiilor, folosind un singur
strat neliniar.
Definiţia (D1). Fie ΣΠ
2
(g) – reţea neuronală cu n intrări şi o ieşire,
care foloseşte ca funcţie de activare g : R → R ce are ca ieşire o sumă
ponderată, cu forma exactă a funcţiei modelate.
)) ( ) ( | : ( ) (
1 1
, ,
2
∑ ∏ ∑∏
· ·
+ · → ·
M
i
qi
j
j i
T
j i i
N
b x a g c x f R R f g
(6.57.)
Pentru acest tip de reţea există următoarea teorema (T4).
Teorema Hornik (1), 1989 (T4)
Fie g o funcţie continuă (g ≠ c, în care c constantă arbitrară). Atunci
cu ajutorul mulţimii ΣΠ
2
(g) de reţele ce foloseşte neuroni cu n intrări şi l
ieşiri care au ca funcţie de activare pe g se poate aproxima cu eroare
controlabilă orice funcţie f: A ∈ R
N
→ R. Altfel spus ∀δ> 0 ∃ o reţea
neuronală ce aproximează funcţia căutată cu o eroare mai mică decât δ ,
după un anumit criteriu stabilit pe mulţimea compactă A. Dacă se notează cu
f(x) ieşirea şi cu |.. | norma de aproximare (eroarea) atunci ∀ x
i
∈A se poate
scrie : δ < − | ) (
ˆ
( |
i i
x f x f
Nici această teoremă nu generează algoritm de construcţie a funcţiilor
de activare g şi nici mărimea reţelei. Teoretic se poate folosi orice g dar
numărul neuronilor şi mărimea reţelei depinde de g. Deci dacă se alege
greşit g nu există şansa să se construiască reţeaua neuronală în mod adecvat
(vor fi necesari prea mulţi neuroni).
De exemplu pentru funcţia de aproximat f(x) = sin x, cu ajutorul
funcţiei g(x) = x
2
şi x ∈ [-Π /2, Π /2] va rezulta o reţea neuronală cu schema
din figura 6.31.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
86
Fig.6.31. Schema reţelei neuronale ce aproximează funcţia f(x)=sin(x) prin g(x)=x
2
.
Se demonstrează că în acest caz aproximarea are o eroarea mai mică
de 1%.
Definiţia (D2)
Acele reţele neuronale Σ Π
N
(g) cu funcţii de activare g:R→R la care
există un singur termen pentru înmulţire g
1
=1; j=1…M se numesc Σ
N
(g).
Formula reţelei neuronale va fi :
Σ
N
(g) = ( f:R
N
→R| f(x)=
) (
1
i
T
i
M
i
i
b x a g c +

·
)
(6.58)
Definiţia (D3)
Fie Φ : R→[0,1] o funcţie „fill” cu proprietăţile : Φ - monoton
crescătoare;
1 ) ( lim · Φ
∞ →
x
x
;
0 ) ( lim · Φ
−∞ →
x
x
;Φ are cel mult un
număr finit de puncte de discontinuitate.
Teorema Hornik (2), 1989 (T5)
Dacă g este o mulţime „fill”, ∀ f:A ⊂ R
N
→R, f se poate aproxima cu
precizia dorită cu o mulţime de reţele neuronale cu n intrări şi 1 ieşire, cu
un strat ascuns şi care au ca funcţie de activare funcţia g şi Σ
N
. Teorema nu
exclude folosirea mai multor straturi. Se folosesc mai multe straturi
deoarece sunt cazuri în care la reţelele neuronale cu un singur strat trebuiesc
folosiţi mai mulţi neuroni decât la cele cu mai multe straturi, sau învăţarea
la cele cu un singur strat este mai lungă.
87
COMANDA ROBOŢILOR
Pentru aplicaţii inginereşti problema este că nu există un algoritm
pentru calculul ponderilor şi a funcţiei de activare. Există cazuri când pentru
funcţii de activare se folosesc funcţii nemonotone sau discontinui.
Teorema Lesho 1993 (T6)
Funcţia f:R→R poate fi aproximată numai atunci când funcţia de
activare nu este un polinom
Teorema RBF (radial basis function) (T7)
Fie f:R
N
→R o funcţie de activare integrabilă continuă şi nenulă care
prezintă o simetrie circulară pe mulţimea vectorilor de intrare în număr de
N, conform unei norme euclidiene.
Atunci orice funcţie g ∈ C
N
(spaţiul funcţiilor N dimensionale) poate
fi aproximată cu o aproximaţie dorită sub forma:
g(x) =

·

M
i
i
i
Ti
c x
f w
1
) (
(6.59)
Unde c
i
∈ R
N
,T
i
şi w
i
, cu i = 1, … M – sunt parametri reţelei:
6.2.5 Elemente de analiză a stabilităţii reţelelor neuronale.
Studiul stabilităţii funcţionării poate oferi informaţii asupra
domeniului de intrări în care reţeaua neuronală poate genera ieşirile corecte.
Sunt importante în studiul stabilităţii mai ales sistemele dinamice, neliniare,
MIMO. Pentru acestea se dau următoarele definiţii.
Definiţia (D4) (definiţia cu ε , stabilitate în sens Lyapunov) .
Starea x=x
0
, de echilibru a unui sistem dinamic neliniar este stabilă
dacă ∀ t
0
pentru ∀ ε > 0 se poate găsi un număr δ (ε , t
0
) > 0 astfel încât
dacă ||x
0
- x
t
|| < δ unde x
0
= x(t
0
) atunci ||x(t, x
0
, t
0
)-x
t
||

< ε , ∀ t ≥ t
0
. Dacă
δ nu depinde de t
0
starea este uniform stabilă. Nu este necesar ca sistemul
să ajungă în exact aceeaşi stare stabilă.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
88
Fig. 6.32. Schema stabilităţii în sens Lyapunov (D4).
Definiţia (D5).
Stabilitatea este asimptotic uniformă dacă (D4) este adevărată şi:
∃ ε
1
> 0 la care ∀ ε
2
> 0, T(ε
1
, ε
2
) > 0 – dacă ||x
0
- x
t
|| < ε
1
atunci
||x(t, x
0
, t
0
)||

< ε
2
, ∀ t ≥ t
0
+ T.
Definiţia (D6).
Stabilitatea exponenţială dacă există două constante pozitive (a > 0 şi
b>0) astfel încât: ||x(t, x
0
, t
0
)-x
t
||

≤ a || x || exp {-b (t-t
0
)} ∀ t ≥ t
0
. Pentru
sisteme liniare (D5) este identică cu (D6).
Testarea existenţei proprietăţilor definite mai sus se face pe baza
criteriilor de stabilitate, o metodă importantă în acest sens este metoda
directă Lyapunov (D4).
6.2.6. Elemente de învăţare pentru reţele neuronale artificiale
Prin învăţare se ajustează ponderile reţelei neuronale în aşa fel ca la o
intrare dată, ieşirea generată de reţea să fie cât mai apropiată de ieşirea
dorită. În unele cazuri în timpul procesului de învăţare se poate modifica şi
structura reţelei, nu numai parametrii acesteia.
După modul în care se realizează învăţarea, pot exista următoarele
situaţii:
- învăţare supravegheată (sau dirijată), în care ieşirile dorite sunt
impuse de proiectantul reţelei, (exemplu : aproximarea
funcţiilor, realizarea unui model de proces) (supervised
learning);
- învăţarea nesupravegheată, în care nu sunt specificate explicit
ieşiri dorite, ci ieşirile sunt clasificate de către reţea pe baza unor
norme sau distanţe definite intrinsec în structura reţelei
89
COMANDA ROBOŢILOR
(clasificări ale unor seturi de date - clustering) (unsupervised
learning)..
Modul în care se realizează învăţarea este hotărâtor pentru succesul
aplicării acesteia în practică. Stabilirea structurii reţelei se poate realiza cu
puţine cunoştinţe despre procesul practic, dar contrar cu aceasta, învăţarea
este mult mai dependentă de natura aplicaţiei. Din această cauză, în cadrul
cercetărilor în domeniu, au fost elaborate diverse metode de învăţare.
Ca elemente esenţiale, generale în strategiile de învăţare se amintesc -
este foarte importantă selecţia setului de date de învăţare
- ca aceste date să reflecte cât mai exact situaţiile majoritare în
funcţionarea sistemului în care se aplică reţeaua neuronală (omiterea
unor date va duce la situaţii în care sistemul nu va corespunde
cerinţelor);
- procesul de învăţare trebuie urmărit cu ajutorul unui criteriu de
optimizare - pe măsura înaintării procesului de învăţare ieşirea
generată de reţeaua neuronală trebuie să conveargă către ieşirea dorită;
convergenţa se stabileşte prin minimizarea unei funcţii criteriale, ce se
elaborează dependent de aplicaţia practică; metodele de căutare a
minimului acestei funcţii trebuie să fie cât mai rapide deoarece de
multe ori învăţarea necesită timpi îndelungaţi.
6.2.7. Metode de comandă a roboţilor utilizând reţele neuronale
artificiale.
În domeniul conducerii roboţilor există cercetări ce vizează aplicarea
metodelor fuzzy şi neuronale în rezolvarea problemelor sistemului de
conducere care din diferite cauze sunt dificil de rezolvat prin metode
analitice. În mai multe lucrări, cum ar fi [PHAM1], [LAU1] sau [ZHANG1]
şi [JANG1], sunt prezentate soluţii ale unor probleme de comandă având la
bază metode combinate de logică fuzzy şi reţele neuronale, numite metode
neuro-fuzzy.
Domeniile ce intră cel mai des în atenţia specialiştilor sunt :
- soluţii privind rezolvarea problemelor de cinematică inversă ;
- realizarea unor regulatoare neuronale locale sau globale prin :
- reglare cu model predictiv;
- reglarea prin liniarizarea reacţiei;
- reglarea cu model de referinţă.
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
90
Structuri de conducere neuronale.
Abilitatea reţelelor neuronale de a modela sisteme neliniare, este
folosită, în diverse cercetări [WENMEI1], [ZHANG1], în vederea realizării
unor sisteme de reglare automată a unor procese industriale.
În cazul utilizării reţelelor neuronale în conducerea unor procese,
există două faze importante: identificarea sistemului (realizarea modelului
neuronal al procesului); proiectarea comenzii (realizarea sistemului de
reglare neuronal);
În faza de identificare a sistemului, se proiectează un model neuronal
al procesului condus iar în faza de proiectare a comenzii se foloseşte
modelul neuronal realizat anterior pentru a antrena reţeaua ce va regla
procesul.
Antrenarea modelului neuronal al procesului se realizează “offline”
(sau ”batch processing”), dar pentru optimizarea regulatorului neuronal sunt
totuşi necesare calcule şi în timpul procesului.
Comanda neuronală cu model predictiv
Acest tip de comandă foloseşte un model al procesului pentru a
observa modul în care va răspunde procesul la potenţiale semnale de
comandă. Se foloseşte apoi un regulator ce calculează mărimile de comandă
optime pentru un anumit orizont de timp.
1. Identificarea.
În figura 6.33. se prezintă schema structurală a procesului de
identificare a sistemului, în care erorile de predicţie, formate ca diferenţe
între ieşirile generate de proces şi cele generate de modelul neuronal, sunt
folosite ca semnale de antrenare a reţelei, iar în figura 6.34 este prezentată
reţeaua neuronală, ce modelează procesul, şi foloseşte intrările şi ieşirile
anterioare pentru a genera semnale de comandă.

91
COMANDA ROBOŢILOR
Fig.6.33. Schema de identificare a modelului neuronal al procesului.
Notaţiile din figura 6.33 sunt : u – mărime de comandă; y
p
– mărime
de ieşire proces; y
m
– mărime de ieşire model; e=y
p
- y
m
– eroarea de ieşire.
Fig.6.34 Structura modelului neuronal al procesului.
Notaţiile din figura 6.34 reprezintă : u(t) – mărime de comandă la
momentul t; y
p
(t)– mărime de ieşire proces la momentul t; y
m
(t+1) – mărime
de ieşire model pentru momentul t+1 (estimata mărimii de comandă; w
i,j

ponderea intrării j din stratul i; b
k
– ponderea intrării constante (bias) pentru
stratul k; TDL – întărziere (Time Delay); S
1
– funcţie de transfer sigmoidală
pentru stratul 1 ; l – funcţie de transfer liniară pe porţiuni.
2. Reglarea
Metoda reglării cu model predictiv se bazează pe ideea orizontului
regresiv (Soloway şi Haley, 1996). Modelul neuronal generează estimări ale
răspunsului procesului într-un anumit orizont de timp. Estimările sunt
folosite într-un algoritm numeric de optimizare, pentru a determina acea
valoare a mărimii de comandă care minimizează funcţia criterială :
( ) ( ) ( ) ( ) ( ) ( )
∑ ∑
· ·
− + − − + ρ + + − + ·
u 2
1
N
1 j
2
N
N j
2
m r
2 j t ' u 1 j t ' u j t y j t y J
(6.60)
în care :
- N
1
, N
2
şi N
u
definesc orizonturile de timp peste care sunt evaluate
mărimile erorii şi a paşilor (incrementelor) de comandă;
- u’ – este semnalul de comandă de încercare;
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
92
- y
r
- este răspunsul dorit;
- y
m
- este răspunsul modelului neuronal;
-
ρ
- defineşte contribuţia variaţiei valorilor mărimilor de
comandă încercate în timp anterior;
Schema structurală a sistemului este arătată în figura 6.35., în care se
observă că regulatorul este compus din modelul neuronal al procesului şi din
blocul de optimizare. Blocul de optimizare determină care dintre valorile u’
minimizează funcţia criterială J. Odată găsită valoarea optimă u este folosită
ca valoare de comandă în proces.
Datorită faptului că regulatorul execută calcule laborioase online (la
fiecare pas trebuie evaluată funcţia criterială de mai multe ori, pentru a
putea alege valoarea optimă a mărimii de comandă), se poate afirma că
aplicabilitatea în domeniul roboţilor a acestei metode este limitată. În
literatura de specialitate studiată nu s-au întâlnit exemple de aplicare decât
în procese mult mai lente cum ar fi de exemplu reglarea amestecului unor
substanţe în reactoare chimice.
Fig.6.35. Schema structurală a procesului.
Comanda neuronală cu linearizarea reacţiei
1. Identificarea.
La fel ca şi în cazul reglării cu model predictiv, mai întâi se va realiza
identificarea sistemul ce urmează să fie reglat. Va trebui, deci, antrenată o
reţea neuronală pentru a modela dinamica sistemului. Primul pas în
93
COMANDA ROBOŢILOR
procedura de identificare este acela de a găsi o structură convenabilă pentru
model. Un model standard pentru reprezentarea sistemelor neliniare discrete
este modelul NARMA, (Nonlinear AutoRegressive-Moving Average), dat
de relaţia :
( ) ( ) ( ) ( ) ( ) ( ) ( ) [ ] 1 1 1 1 + − − + − − · + n k u , ... , k u , k u , n k y , ... , k y , k y N d k y

(6.61)
în care : u(k) este intrarea sistemului şi y(k) este ieşirea. În scopul
identificării se antrenează reţeaua pentru a aproxima funcţia neliniară N.
Procedura de antrenare este identică cu cea folosită în cazul comenzii
cu model predictiv.
2. Reglarea
Dacă se defineşte ca scop urmărirea unei traiectorii de referinţă,
y(k+d)=y
r
(k+d), va trebui dezvoltat un regulator neliniar de forma:
( ) ( ) ( ) ( ) ( ) ( ) ( ) [ ] 1 1 1 1 + − − + + − − · m k u ,..., k u , d k y , n k y ,..., k y , k y G k u
r
(6.62)
Pentru a genera funcţia G care minimizează eroarea pătratică medie,
va trebui folosită, ca algoritm de învâţare, metoda dinamică de propagare
înapoi a erori, care este o metodă dificil de implementat şi este foarte lentă
(Hagan şi De Jesus, 1999). Din această cauză, pentru a reprezenta sistemul,
se folosesc modele aproximative (Narendra şi Mukhopadhyay, 1997). Un
astfel de model aproximativ, este dat de relaţia :
( ) ( ) ( ) ( ) ( ) ( ) [ ]
( ) ( ) ( ) ( ) ( ) [ ] ( ) k u m k u ,..., k u , n k y ,..., k y , k y g
m k u ,..., k u , n k y ,..., k y , k y f d k y
⋅ + − − + − − +
+ − − + − − · +
1 1 1 1
1 1 1 1
(6.63)
Acest model este într-o formă, în care intrarea u(k) nu este conţinută
în termenul neliniar, şi dacă y(k+d)=y
r
(k+d), se poate scrie sub forma :
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
94
( )
( ) ( ) ( ) ( ) ( ) ( ) [ ]
( ) ( ) ( ) ( ) ( ) [ ] 1 1 1 1
1 1 1 1
+ − − + − −
+ − − + − − − +
·
n k u ,..., k u , n k y ,..., k y , k y g
n k u ,..., k u , n k y ,..., k y , k y f d k y
k u
r
(6.64)
care însă ar necesita determinarea valorii intrării u(k), bazată pe ieşire la
acelaşi pas de calcul y(k), din care cauză se foloseşte modelul de forma :
( ) ( ) ( ) ( ) ( ) ( ) ( ) [ ]
( ) ( ) ( ) ( ) [ ] ( ) 1 1 1
1 1 1 1
+ ⋅ + − + − +
+ − − + − − · +
k u n k u , ... , k u , n k y ,..., k y g
n k u , ... , k u , k u , n k y , ... , k y , k y f d k y
(6.65)
în care d>=2.
Structura reţelei neuronale ce reprezintă modelul procesului, este dată
în figura 6.36.
Din relaţia 6.65, expresia structurii regulatorului va fi :
( )
( ) ( ) ( ) ( ) ( ) [ ]
( ) ( ) ( ) ( ) [ ] 1 1
1 1
1
+ − + −
+ − + − − +
· +
n k u , ... , k u , n k y , ... , k y g
n k u , ... , k u , n k y , ... , k y f d k y
k u
r
(6.66)
în care d>=2.
Fig.6.36. Structura modelului neuronal al procesului, construit pe baza relaţiei (6.65)
95
COMANDA ROBOŢILOR
În figura 6.37 este prezentată schema de principiu a sistemului de
reglare, în care mărimea y
r
este generată de modelul neuronal (“model de
referinţă”).
Fig.6.37. Schema sistemului de reglare, construit pe baza relaţiei 6.66.
Schema structurală a reţelei neuronale ce reprezintă regulatorul
prezentat în figura 6.37, este arătată în figura 6.38.
În cazul acestei metode, regulatorul execută un număr extrem de mic
de calcule (calculul realizat poate fi urmărit pe diagrama din figura 6.38), iar
modelul neuronal este antrenat offline. Din această cauză metoda poate fi
folosită cu succes în cadrul comenzii roboţilor industriali. O aplicaţie directă
poate fi realizarea unor regulatoare neuronale care să înlocuiască
regulatoarele clasice pentru comanda unei axe de robot.
Avantajul folosirii unor regulatoare neuronale pentru roboţi
industriali, pe lângă avantajele date de o stabilire mai simplă a parametrilor,
ar putea fi şi mai mare dacă acestea ar fi folosite în sisteme în care şi
generatorul de traiectorii ar funcţiona pe baze neuronale (sistem de calcul
paralel).
METODE AVANSATE DE REGLARE UTILIZATE ÎN COMANDA ROBOŢILOR.
96
Fig.6.38. Structura reţelei neuronale reprezentând regulatorul, bazat pe relaţia (6.66)
Comanda neuronală cu model de referinţă.
1.Identificarea.
Pasul de identificare este realizat în mod similar cu cel din celelalte
două metode prezentate.
2. Reglarea
După identificarea modelului, este antrenată reţeaua neuronală ce
realizează reglarea procesului. Antrenarea reţelei necesită folosirea pentru
învăţare a metodei dinamice de propagare înapoi a erori, dificil de realizat şi
cu o durată lungă de realizare, însă cu un domeniu mai larg de aplicare decât
metoda linerizării reacţiei (nu este necesară scrierea expresiei regulatorului
în forma dată de relaţia 6.66). Reţelele neuronale, atât ale modelului cât şi
ale regulatorului sunt realizate pe două straturi. Numărul de întârzieri se
selectează în funcţie de ordinul sistemului, şi anume cu cât sistemul este de
ordin mai mare cu atât numărul de întârzieri va trebui să crească.
Şi în acest caz (ca şi la metoda cu linearizarea reacţiei), volumul de
calcule online este mic. Ambele reţele, atât modelul cât şi regulatorul sunt
antrenate offline, aici însă volumul de calcule este mare.
Volumul mic de calcule necesare în timpul funcţionării, face ca
această metodă să poată fi folosită în cadrul unor sisteme de comandă a
roboţilor industriali, în mod similar cu metoda linearizării reacţiei.