You are on page 1of 207

Cristian Grava Vasile Buzuloiu

ELEMENTE DE PRELUCRAREA
ŞI ANALIZA IMAGINILOR









2007
2




EDITURA UNIVERSITĂŢII DIN ORADEA


Descrierea CIP a Bibliotecii Naţionale a României

GRAVA, CRISTIAN
Elemente de prelucrarea şi analiza imaginilor /
Cristian Grava, Vasile Buzuloiu.
Oradea : Editura Universităţii din Oradea, 2007
ISBN 978-973-759-377-1

I. Buzuloiu, Vasile

621.397.3 (075.8)


EDITURA UNIVERSITĂŢII DIN ORADEA ESTE ACREDITATĂ DE
CNCSIS, COD 149.
3

Cuprins:

Prefaţă ………………………………………………………… 7
1. Introducere ………………………………………………………. 9
2. Reprezentarea imaginilor ………………………………………... 12
2.1. Digitizarea imaginilor ………………………………………. 12
2.2. Eşantionarea imaginilor …………………………………….. 15
2.3. Reprezentarea spaţială a imaginilor ………………………… 20
2.4. Proprietăţi ale imaginilor digitale ……………………….….. 25
2.4.1. Proprietăţi metrice ale imaginilor digitale ……….…… 26
2.4.2. Proprietăţi topologice ale imaginilor digitale ………… 27
2.4.3. Relaţii de vecinătate între pixeli ……………………… 28
2.4.4. Paradoxuri de conexitate ..……………………………. 31
2.4.5. Alte proprietăţi topologice şi geometrice ……………... 33
2.5. Reprezentarea spectrală a imaginilor ………………………... 34
2.5.1. Transformata Fourier (TF) bidimensională …………... 36
2.5.2. Proprietăţile transformatei Fourier bidimensionale …... 36
2.5.3. Proprietăţi specifice TF bidimensionale ……………… 43
3. Îmbunătăţirea imaginilor ………………………………………… 52
3.1. Calitatea unei imagini ………………………………………. . 52
3.2. Tehnici de îmbunătăţire a imaginilor ………………………… 55
3.3. Operatori punctuali de îmbunătăţire a imaginilor …………… 57
3.3.1. Operatori punctuali de modificare a contrastului ……… 58
3.3.2. Decuparea intervalelor de niveluri de gri ……………… 62
3.3.3. Modificarea histogramei ………………………………. 64
3.4. Operatori liniari de vecinătate pentru îmbunătăţirea imaginilor.
Filtrarea liniară a imaginilor …………………………………. 68
3.5. Efectul în frecvenţă al operatorilor liniari de vecinătate …….. 73
3.6. Filtrarea neliniară a imaginilor ………………………………. 76
3.6.1. Filtre neliniare de ordine ………………………………. 77
3.6.2. Filtre de ordine multi-etaj ……………………………… 79
3.6.3. Proprietăţi ale filtrelor de ordine ………………………. 81
4
3.6.4. Filtre de ordine de domeniu …………………………… 83
3.6.5. L-filtre ………………………………………………… 85
4. Transformări integrale ale imaginilor ……………………………. 87
4.1. Transformări integrale unitare ………………………………. 87
4.2. Matrici unitare ………………………………………………. 93
4.3. Transformări unitare ale unor semnale unidimensionale …… 98
4.4. Transformări unitare ale unor semnale bidimensionale …….. 100
4.5. Transformata Fourier discretă unidimensională (DFT-1D) …. 104
4.6. Proprietăţi ale transformatei DFT-1D ……………………….. 105
4.7. Transformata Fourier discretă bidimensională (DFT-2D) ….... 108
4.8. Proprietăţi ale transformatei DFT-2D ……………………….. 111
4.9. Transformata Cosinus discretă unidimensională ……………. 113
4.10. Transformata Cosinus discretă bidimensională …………… 115
4.11. Transformata Sinus discretă unidimensională …………….. 120
4.12. Transformata Sinus discretă bidimensională ………………. 121
5. Restaurarea imaginilor …………………………………………… 122
5.1. Filtrarea inversă ……………………………………………… 123
5.2. Filtrul invers cu constrângeri ………………………………... 125
6. Morfologie matematică ………………………………..……. …... 130
6.1. Transformarea Hit or Miss ………………………………….. 130
6.2. Erodarea ……………………………………………………. 132
6.3. Dilatarea …………………………………………………….. 134
6.4. Proprietăţile operaţiilor morfologice ………………………... 136
6.5. Transformări morfologice derivate …………………………. 138
6.5.1. Operatori de extragere a conturului ……….…………. 138
6.5.2. Deschiderea şi închiderea …………………………….. 140
6.6. Trierea dimensională a obiectelor …………………………… 142
6.7. Caracterizarea morfologică a formelor ……………………… 143
6.7.1. Reconstrucţia după marker …………………………… 144
6.7.2. Distanţa Haussdorf …………………………………… 145
6.7.3. Extragerea skeletonului morfologic ………………….. 145
6.7.4. Skeletonul generalizat ………………………………… 149
6.8. Extinderea morfologiei matematice la imagini cu niveluri de gri.. 151
5
6.8.1. Trecerea de la mulţime la funcţie ……………………… 152
6.8.2. Trecerea de la funcţie la mulţime ……………………… 153
6.8.3. Operaţii cu funcţii …………………………………….. 154
7. Segmentarea imaginilor ….………………………………………. 157
7.1. Segmentarea orientată pe regiuni …………………………….. 157
7.1.1. Etichetarea componentelor ……………………………. 158
7.1.2. Metoda arborelui cuaternar (quad-tree) ………………. 159
7.2. Segmentarea imaginilor cu niveluri de gri …………………… 161
7.2.1. Segmentarea bazată pe histogramă ……………………. 161
7.2.2. Segmentarea bazată pe creşterea şi fuziunea regiunilor .. 165
7.3. Segmentarea orientată pe contururi …………………………. 168
7.3.1. Operatori de tip gradient ……………………………… 169
7.3.2. Operatori de tip compas ……………………………… 173
8. Compresia imaginilor ……………………………………………. 176
8.1. Compresia imaginilor binare ………………………………… 177
8.1.1. Codarea de nivel înalt …………………………………. 177
8.1.1.1. Aproximări poligonale …………………………. 177
8.1.1.2. Codul Freeman …………………………………. 178
8.1.1.3. Descriptori Fourier ……………………………… 181
8.1.2. Codarea la nivel de bloc ………………………………. 183
8.1.2.1. Metoda arborelui cuaternar (Quad-tree) ………… 183
8.1.2.2. Metoda WBS (White Block Skipping) …………. 184
8.1.3. Codarea la nivel de bit ………………………………… 185
8.1.3.1. Codarea RLE (Run Length Encoding) ………….. 185
8.1.3.2. Codarea entropică (Huffman) …………………… 186
8.2. Compresia imaginilor cu niveluri de gri ……………………… 188
8.2.1. Codarea pe plane ………………………………………. 188
8.2.2. Metode predictive de compresie ………………………. 190
8.2.3. Compresia cu transformate ……………………………. 194
Bibliografie ……………………………………………………….. 204

6
7
Prefaţă

Prelucrarea şi analiza imaginilor ajunge pe zi ce trece, tot mai mult, în
categoria „bunurilor de larg consum” ca urmare a aceleiaşi mutaţii suferită de
calculatoarele electronice care reprezintă suportul „hard şi soft” al acestui
domeniu relativ nou dar devenit indispensabil, al existenţei sociale
contemporane. Numai că, fără îndoială, nu se rezumă la „suport”: analiza şi
prelucrarea imaginilor – şi prin extensie, a secvenţelor video, a semnalelor
multimedia şi, mai general, a semnalelor multidimensionale – înseamnă în
primul rând algoritmi; algoritmi de prelucrări şi algoritmi de analiză. Şi,
ajungând aici, ne dăm seama că, în fapt, avem de-a face cu „modelare
matematică”. Cândva, pe vremea bunicilor bunicilor noştri, adică în zorii
epocii moderne din istoria omenirii, cu arta aceasta se ocupau doar genii de
prim rang – un Galilei, Newton, Leibnitz – dar numărul celor ocupaţi cu
modelarea matematică a crescut vertiginos în secolul XIX şi apoi al XX-lea
astfel încât astăzi, cum învăţământul universitar a ajuns „învăţământ de
masă”, modelarea matematică a ajuns şi ea în învăţământul de masă; adică
s-ar vrea un „bun de larg consum”. Numai că în matematică nu există „cale
regală” adică pe care să înaintezi fără efort (asta o ştim încă din antichitate:
i-a spus-o mentorul său împăratului Alexandru cel Mare!).
Cele de mai sus se vor o justificare a faptului că această carte, care
este şi un suport de curs pentru studenţii ingineri ai Universităţii din Oradea
dar poate fi şi o lectură utilă pentru toţi cei interesaţi de subiect, conţine
pagini întregi de matematică, constituind subiecte alese din nevoile
disciplinei. În mod ideal, o carte de prelucrarea şi analiza imaginilor de sine
stătătoare ar trebui să aibă un material imagistic ilustrativ, mult mai bogat.
Rabatul pe care îl facem de la acest deziderat este justificat prin faptul că
materia unui astfel de curs nu se rezumă la teorie ci are drept componentă
principală şi partea de aplicaţii, în faţa ecranului: în felul acesta studentul
„testează” pe viu ce influenţă au asupra rezultatelor modificările în algoritmi
şi vede cum se modifică imaginea.
De asemenea, ne-am decis să folosim în titlu un partitiv „Elemente de
…” fiindcă de fapt cartea este doar o uşoară introducere într-un domeniu
astăzi deja vast, care conţine printre multe altele, tehnicile de restaurare a
8
imaginilor (din care fac parte cele de reconstrucţie a imaginilor din proiecţii
care stau la baza imagisticii medicale, a defectoscopiei nedistructive şi a
teledetecţiei satelitare), ustensilele software pentru fotografia digitală (ne
mărginim la un singur exemplu: corecţia în „timp real” a ochilor roşii) şi tot
felul de sisteme de supraveghere a căror componentă principală trebuie să fie
una capabilă de recunoaştere a formelor (maşini, feţe etc).
În pofida faptului că „prelucrarea şi analiza imaginilor” este, cum se
zice azi, un „domeniu de vârf”, noi am fost activi în el de mai bine de 30 de
ani datorită cercetărilor de televiziune digitală şi prelucrare în timp real a
semnalului digital în colectivul de cercetare al Catedrei de Electronică
Aplicată de la Politehnica din Bucureşti; primul sistem digital de analiză a
imaginilor a fost terminat în 1981 iar în următorii ani a fost reprodus în
câteva exemplare la Fabrica de Calculatoare Electronice. Perioada anilor ’80
n-a fost, din păcate, propice dezvoltărilor tehnologice la noi şi astfel
întâietatea şi avantajul pe care apucaserăm să îl avem „în lagărul socialist”,
n-a dat roade. După 1990 ne-am trezit într-o lume care între timp progresase
mult în acest domeniu. Totuşi, experienţa pe care o avem ne-a permis să
reluăm ideile iar astăzi, Laboratorul de Analiza şi Prelucrarea Imaginilor
LAPI al Politehnicii din Bucureşti este destul de bine cunoscut şi peste
hotare; mai mult, transplantul cunoştinţelor l-am făcut şi spre alte universităţi
– Braşov, Oradea – şi aşa se face că astăzi, în Catedra de Electronică a
Universităţii din Oradea există un colectiv important de cadre tinere implicate
în acest domeniu, cu stagii în străinătate şi colaborări internaţionale. Avem
toate condiţiile preliminare pentru un învăţământ responsabil.
Cartea de faţă, scrisă aproape în totalitate de Cristian Grava, adună
elementele esenţiale ale unui curs introductiv dar presupune că studentul –
cititorul – a fost „expus” înainte unor cursuri pregătitoare printre care cel de
teoria statistică a semnalelor, cel de sisteme liniare şi cursurile fundamentale
de matematică pentru ingineri. Ar mai fi de remarcat că, pentru
compactizarea materialului s-a preferat o înşiruire neliniară a subiectelor,
care de exemplu în capitolul 2 trimite la capitolul 4 dar, fiind vorba de
subiecte reluate de la cursuri anterioare, suntem convinşi că cititorul va putea
parcurge textul fără dificultăţi, cel mult eventual cu reluări.

Prof. Vasile Buzuloiu
9

1. Introducere

Dezvoltarea spectaculoasă din ultimii ani a tehnologiei informaţiei
şi a componentelor electronice a condus la impunerea de soluţii
inimaginabile până nu demult pentru numeroase probleme tehnice, ca de
exemplu în industrie la conducerea proceselor de producţie sau la
controlul de calitate. Tehnicile de exploatare a informaţiei vizuale ocupă o
poziţie importantă şi de extremă actualitate. Domeniul prelucrării şi
analizei imaginilor grupează tehnicile de achiziţie, transformare şi
utilizare a informaţiei vizuale din imaginile reprezentate, transmise şi
exploatate în formă digitală, în sisteme de calcul de uz general sau
calculatoare specializate.
Printre aplicaţiile importante ale prelucrării şi analizei imaginilor se
pot aminti aplicaţiile în medicină (investigarea de organe ale corpului
uman), aplicaţii în industrie şi în tehnică (cartografierea solului,
prospecţiuni geologice, controlul tehnic automat al diverselor produse,
robotică etc.) precum şi aplicaţii dedicate unor domenii ca arta, aplicaţiile
militare etc.

Principalele probleme ale prelucrării şi analizei de imagini sunt:
1. Reprezentarea şi modelarea imaginilor:
• Eşantionarea şi cuantizarea imaginilor
• Reprezentarea spaţială a imaginilor
• Reprezentarea spectrală a imaginilor. Transformata Fourier

Transformare
Imagine
discretizată
Imagine
transformată
Prelucrarea se
face asupra
acestei imagini

Figura 1.1. Transformarea unei imagini.
10
• Modelele imaginilor pot fi:
stohastice;
deterministe.

2. Îmbunătăţirea imaginilor. Se face prin:
• prelucrări punctuale. Exemple:
modificarea contrastului şi luminanţei;
modificarea histogramei.
• prelucrări pe vecinătăţi. Exemple:
accentuarea contururilor;
reducerea zgomotului imaginilor;
pseudo-colorarea.
• prelucrări geometrice.
• prelucrări integrale.

3. Restaurarea imaginilor. Presupunem că f(x,y) este imaginea originală
care datorită procesului de captare a suferit o transformare
(degradare), liniară sau neliniară, obţinându-se imaginea degradată
f
d
(x,y).

f(x,y) f
d
(x,y)
transformare
transformare
-1

Figura 1.2. Transformarea inversă a unei imagini.

Imaginea originală se poate obţine din imaginea degradată prin
aplicarea unei transformări inverse celei suferite în procesul de
captare.
Apar probleme când în procesul de captare intervine şi zgomot, caz în
care se impune şi o etapă de restaurare a imaginii, pentru a se obţine o
aproximare a imaginii originale (x,y) f
ˆ
:
11

Transformare
+
Restaurare
f(x,y)
zg=zgomot
f
ˆ
(x,y)
f
d
(x,y)+zg

Figura 1.3. Restaurarea imaginilor.

• Reconstrucţia imaginilor din proiecţii.

4. Analiza imaginilor, care implică:
• măsurători automate pe imagini;
• segmentarea imaginilor (extragerea obiectelor).

5. Compresia imaginilor, care implică reducerea cantităţii de informaţie.
Exemplu: Pentru o imagine de 512×512 pixeli (2
9
×2
9
), în care fiecare
pixel este reprezentat pe 8 biţi, adică cu 2
8
=256 niveluri de gri,
cantitatea de informaţie este:
(2
9
×2
9
)pixeli×2
3
biţi/pixel=2
21
≈ 2 Mb
Prin compresia imaginilor se urmăreşte reducerea acestei cantităţi de
informaţie.

Schema bloc a unui lanţ de analiza şi prelucrarea imaginilor este
prezentată în figura 1.4.

senzor CAD
Compresie
Memorie
Îmbunătăţire
+ Restaurare


Măsurători
date
Segmentare
Listă de
obiecte
Măsurători
pe obiecte
Clasificare
Descrierea
scenei
Scenă
CAD = convertor analog-digital
Display
Display

Figura 1.4. Schema bloc a unui lanţ de analiza şi prelucrarea imaginilor.
12
2. Reprezentarea imaginilor

Sistemele vizuale ale organismelor vii percep mediul înconjurător
3-dimensional, prin intermediul unor latici de senzori de lumină
bidimensionale (de exemplu, retina din ochii mamiferelor) şi refac spaţiul
3D prin integrare temporală şi/sau vedere binoculară. În pofida faptului că
senzaţia este de câmp continuu al imaginilor percepute, laticea senzorilor
este discretă.
În sistemele tehnice imaginate de om, aceste proprietăţi se
păstrează: informaţia imagistică din mediul înconjurător se proiectează pe
latici bidimensionale de senzori de lumină şi astfel se discretizează spaţial,
iar semnalele de la fiecare senzor se discretizează în timp şi în valoare
astfel încât „imaginile” ajung în sistemele de calcul sub formă digitală,
pentru prelucrare şi analiză.


2.1. Digitizarea imaginilor

Imaginile pot fi descrise de distribuţia spaţială a intensităţii
luminoase într-un plan. Din punct de vedere matematic, distribuţia spaţială
a intensităţii luminoase (I) poate fi descrisă printr-o funcţie continuă de
două variabile spaţiale continue (x,y)=p:

I(x,y)=I(p)

Calculatoarele existente nu pot trata imaginile ca funcţii definite pe
un domeniu continuu ci doar ca matrici discrete de numere. Din acest
motiv este necesară transformarea şi reprezentarea imaginilor continue ca
matrici bi-dimensionale de puncte, prin discretizare. Un punct al unei
astfel de matrice se numeşte pixel (din engleză = picture element). Un
pixel reprezintă intensitatea luminoasă sau culoarea corespunzătoare unui
anumit punct din matrice. Prin urmare, un pixel este caracterizat prin
poziţia şi prin valoarea sa.
13
Pentru tratări teoretice, imaginea bidimensională poate fi
reprezentată ca o funcţie continuă (analogică) bidimensională I(x,y)=f(x,y),
unde x şi y sunt coordonatele spaţiale. Valoarea funcţiei într-un punct
oarecare (x,y) va reprezenta:
• luminanţa din punctul respectiv, în cazul în care funcţia f(x,y) este o
funcţie reală. În acest caz avem o imagine cu niveluri de gri, numită
impropriu şi imagine alb-negru;
• culoarea din punctul respectiv, în cazul în care funcţia f este o funcţie
vectorială, (f
1
(x,y),f
2
(x,y),f
3
(x,y)) = (R,G,B). În acest caz avem o
imagine color, cu componentele fundamentale (R, G, B).
Trecerea de la o imagine color la o imagine cu niveluri de gri se
face prin adunarea componentelor fundamentale ponderate cu anumiţi
coeficienţi, adică printr-o combinaţie liniară a acestor componente.
Pentru prelucrarea digitală a imaginilor analogice (de exemplu cu
ajutorul unui calculator) este nevoie de discretizarea imaginilor, proces în
urma căruia imaginea este transformată într-o matrice care conţine
elementele de imagine (pixel). În practică, camera video de tip CCD
(Charge Coupled Device) realizează discretizarea imaginilor chiar în
procesul de captare. Pentru afişare, imaginile se pot converti din nou în
formă analogică.
Discretizarea imaginilor analogice se realizează în doi paşi:
• discretizarea spaţială (eşantionarea), cu ajutorul unei reţele discrete
f(l·∆x,k·∆y), l,k∈Z. În urma acestei operaţii rezultă o imagine (matrice)
cu L linii şi K coloane: l≤L, k≤K. Prin urmare, se obţine L×K pixeli, iar
imaginea obţinută se va scrie printr-o expresie de forma:

A={a(l,k), 1≤l≤L, 1≤k≤K}, l,k,L,K∈Z;

a
11
a
12
… a
1,K

a
21
a
22
… a
2,K

… … … …
a
L,1
a
L,2
… a
L,K

14
• discretizarea în valoare (cuantizarea): f
q
(l·∆x,k·∆y) l,k∈Z, l≤L, k≤K, cu:
f
q
(l·∆x,k·∆y)∈{f
1
,…,f
n
}, unde n este numărul nivelurilor de cuantizare a
imaginii (numărul nivelurilor de gri). De exemplu, pentru n=2 avem o
imagine binară.
În acest caz, fiecare eşantion obţinut în pasul anterior (la
eşantionare) este cuantizat folosind un număr finit de biţi. Astfel,
fiecare pixel va avea un anumit nivel de gri (pentru imagini alb-negru)
sau o anumită culoare (pentru imagini color), codificată printr-un
număr constant de biţi.
În reprezentare binară, un pixel oarecare a
l,k
este codat:

(a
l,k
)
binar
=b
n-1
b
n-2
…b
1
b
0
căruia îi corespunde o valoare zecimală:

(a
l,k
)
zecimal
=b
n-1
·2
n-1
+b
n-2
·2
n-2
+…+b
1
·2
1
+b
0
·2
0
=q (2.1)

care reprezintă nivelul q din scara de 2
n
nivele de gri considerate. În
mod uzual, negrul este considerat ca având nivelul logic 0 (în binar
00 …00), iar albul ca având nivelul logic 1 (în binar 11…11).
De exemplu, în cazul unei imagini reprezentate pe 8 biţi avem un
număr de 2
8
=256 niveluri de gri, în care negrul este codat cu nivelul
q=0, iar albul este codat cu nivelul q=255. Pixelul a
34
având valoarea
codată binar cu octetul 00101001 este pixelul al 4-lea de pe rândul 3
şi are nivelul q=41 în scara de niveluri de gri amintită. În continuare,
când se va vorbi despre imagini digitale sau simplu despre “imagini”,
se va face referire la imagini eşantionate şi cuantizate, iar când se va
vorbi despre discretizarea imaginilor se va face referire la
discretizarea spaţială (eşantionarea) şi în valoare (cuantizarea)
imaginilor.




15
2.2. Eşantionarea imaginilor

Se consideră o matrice de eşantionare, cu pasul (∆x,∆y) care
transformă imaginea dintr-o funcţie (continuă) într-un şir:
( ) ( )
Z l,k
antionare e
∆y ∆x,k l f f(x,y)

⋅ ⋅ ÷ ÷ ÷ ÷ → ÷
s
(2.2)

x
y
∆x
∆y

Figura 2.1. Matricea de eşantionare a unei imagini.

Transformarea inversă (din şir în imagine) este posibilă în
condiţiile teoremei eşantionării.

Modelul matematic al semnalului eşantionat este:

¹
´
¦ ∆ ⋅ = ∆ ⋅ =
=
în rest
y k y x l x y x f
y x f
not
e


, 0
, ), , (
) , (
.
(2.3)

∑∑
⋅ = ∆ ⋅ − ∆ ⋅ − ⋅ =
m n
p e
y x y x f y n y x m x y x f y x f ) , ( ) , ( ) , ( ) , ( ) , ( δ δ ,
unde:

periodic
l k
p
y k y x l x y x δ δ δ = ∆ ⋅ − ∆ ⋅ − =
∑∑
) , ( ) , ( (2.4)
este impulsul Dirac δ periodic:

¹
´
¦ =
= δ
rest î , 0
0 pt. , 1
) (
n
x
x (2.5)

16
Transformata Fourier a semnalului eşantionat este:
{ } { } ) , ( ) , ( ) , ( ) , ( y x y x f y x f v u F
p e e
δ ⋅ ℑ = ℑ = (2.6)

Se ştie că dacă funcţia f(t) este periodică (cu perioada T), seria sa
Fourier este:


⋅ =
k
t k
T
j
k
e C t f
π 2
) ( , unde coeficienţii: (2.7)


⋅ −
⋅ =
T
t k
T
j
k
dt e t f
T
C
π 2
) (
1
(2.8)

Din acest motiv, deoarece funcţia δ
p
(x,y) este periodică cu perioada
∆x pe x, respectiv ∆y pe y:

∑∑
|
|
.
|

\
|


+ ⋅

⋅ =
k l
y l
y
x k
x
j
kl p
e C y x
π π
δ
2 2
) , ( , unde: (2.9)


∫ ∫
∆ ∆

|
|
.
|

\
|


+ ⋅

− ⋅
∆ ⋅ ∆
=
) ( ) (
2 2
exp ) , (
1
x y
p kl
dxdy y l
y
x k
x
j y x
y x
C
π π
δ (2.10)
Deoarece se integrează pe un interval ∆x =

∆ ∆

2
,
2
x x
, respectiv
∆y =

∆ ∆

2
,
2
y y
şi dacă se presupune că într-un dreptunghi cu laturile ∆x,
∆y cade un singur impuls δ
p
şi numai unul (cel din origine):

17



l·∆x
k·∆y
y
z
x
Figura 2.2. Eşantionarea imaginilor.

∫ ∫

∞ −

∞ −

|
|
.
|

\
|


+ ⋅

− ⋅
∆ ⋅ ∆
= ⇒ dxdy y l
y
x k
x
j y x
y x
C
p kl
π π
δ
2 2
exp ) , (
1
(2.11)
Deoarece: ) 0 ( ) ( ) ( f dt t f t = ⋅


∞ −
δ , iar în cazul de faţă: f(0)=1

y x
C
l k
∆ ⋅ ∆
= ⇒
1
,
(2.12)

∑∑
|
|
.
|

\
|


+ ⋅


∆ ⋅ ∆
= ⇒
k l
y l
y
x k
x
j
p
e
y x
y x
π π
δ
2 2
1
) , ( (2.13)

¦
)
¦
`
¹
¦
¹
¦
´
¦
⋅ ⋅
∆ ⋅ ∆
ℑ = ⇒
∑∑
|
|
.
|

\
|


+ ⋅

k l
y l
y
x k
x
j
e
e y x f
y x
v u F
π π 2 2
) , (
1
) , ( (2.14)

Pe baza proprietăţii de liniaritate a transformatei Fourier:

∑∑
¦
)
¦
`
¹
¦
¹
¦
´
¦
⋅ ℑ ⋅
∆ ⋅ ∆
= ⇒
|
|
.
|

\
|


+ ⋅

k l
y l
y
x k
x
j
e
e y x f
y x
v u F
π π 2 2
) , (
1
) , ( (2.15)

18
( )
∑∑ ∑∑
∆ ⋅ − ∆ ⋅ − ℑ ⋅
∆ ⋅ ∆
=
|
|
.
|

\
|



− ℑ ⋅
∆ ⋅ ∆
= ⇒
k l k l
e
v l v u k u
y x
l
y
v k
x
u
y x
v u F ,
1 2
,
2 1
) , (
π π

unde:
x
u
not

= ∆
π 2
.
,
y
v
not

= ∆
π 2
.
(2.16)

Spectrul semnalului eşantionat F(u,v) se obţine prin periodizarea
(repetarea) spectrului său F
e
(u,v):

v
F(u,v)
u
∆v
∆u
FTJ
v
u
Figura 2.3. Spectrul semnalului eşantionat.

Recuperarea semnalului original din semnalul eşantionat se poate
face cu un filtru trece-jos (FTJ) cu parametri adecvaţi (figura 2.4).
u
max
v
u
v
max
∆u
∆v ∆v-v
max
∆u-u
max

Figura 2.4. Parametrii FTJ.

19
Parametrii u
max
, respectiv v
max
reprezintă frecvenţele spaţiale
maxime din spectrul funcţiei f, în direcţia u, respectiv v (ce corespund
coordonatelor spaţiale x, respectiv y).
Pentru ca semnalul original să fie corect recuperat cu ajutorul unui
FTJ, trebuie ca parametrii acestuia să satisfacă condiţiile:

¹
´
¦
≥ − ∆
≥ − ∆
max max
max max
v v v
u u u

¹
´
¦
⋅ ≥ ∆
⋅ ≥ ∆

max
max
v v
u u
2
2
(2.17)

Prin urmare, frecvenţele de tăiere (ξ, η) a FTJ de recuperare a
semnalului original în cele două direcţii (u,v), trebuie să îndeplinească
condiţiile:

¹
´
¦
− ∆ ≤ ≤
− ∆ ≤ ≤
max max
max max
v v v
u u u
η
ξ
(2.18)

Astfel, în acest caz, teorema eşantionării se poate enunţa astfel:
dacă
x
u

= ∆
π 2
,
y
v

= ∆
π 2
adică frecvenţele de eşantionare pe x, respectiv
pe y, sunt mai mari sau cel puţin egale cu dublul frecvenţelor maxime din
spectrul lui f pe direcţia u, respectiv v, atunci recuperarea semnalului
original de imagine f(x,y) se poate face exact, din eşantioane, cu un filtru
ideal trece-jos cu funcţia de transfer:

H(u,v)
f
e
(x,y)
f(x,y)

Figura 2.5. FTJ necesar pentru extragerea semnalului original.

¹
´
¦ η ≤ ξ ≤
=
rest în 0,
si pentru , 1
) , (
v u
v u H (2.19)

unde frecvenţele de tăiere (ξ, η) sunt alese în mod corespunzător,
adică astfel încât:
20

¹
´
¦
− ∆ ≤ ≤
− ∆ ≤ ≤
max max
max max
v v v
u u u
η
ξ
(2.20)

Observaţie:
Condiţia de recuperare enunţată de teorema eşantionării este
suficientă dar nu şi necesară. Acest lucru este ilustrat de exemplul
următor:
∆u
∆v
u
v
v
max
u
max
F(u,v)
H(u,v)
∆v-v
max

∆u-u
max


Figura 2.6. Caz particular de extragere a semnalului original.

Se observă că deşi condiţia de recuperare nu este îndeplinită,
recuperarea se poate face cu un FTJ ideal corespunzător, care să extragă
doar zona corespunzătoare spectrului funcţiei.


2.3. Reprezentarea spaţială a imaginilor

Odată digitizate (eşantionate şi cuantizate), imaginile pot fi
prelucrate şi analizate cu sisteme de calcul uzuale sau dedicate.
Reprezentarea imaginilor se poate face sub diverse forme (spaţială,
spectrală etc.), adecvate diverselor aplicaţii.
În cazul cel mai simplu, pixelii sunt localizaţi pe o reţea
rectangulară. Poziţia unui pixel este dată în mod analog notaţiei utilizate
21
pentru elementele unei matrice. Primul indice (l) exprimă poziţia pe linie,
iar cel de-al doilea indice (k) exprimă poziţia pe coloană (figura 2.1).

C
l,k
0
0 1
1
k
l
K-1
L-1
x
y
coloane
l
i
n
i
i


Figura 2.7. Reprezentarea imaginilor digitale ca matrici de pixeli dispuşi
într-o reţea rectangulară bi-dimensională.

Dacă imaginea conţine L×K pixeli, aceasta poate fi reprezentată
printr-o matrice de dimensiune L×K, unde indicele l=0…L-1, iar
k=0…K-1. L reprezintă numărul de linii, iar K numărul de coloane. Ca şi
în cazul matricilor, sensul pozitiv al axei verticale (y) este de sus în jos şi
nu de jos în sus, cum este cazul reprezentărilor grafice bidimensionale
uzuale. Sensul pozitiv al axei orizontale (x) este cel uzual, de la stânga la
dreapta (figura 2.1).
Rezoluţia spaţială de reprezentare a unei imagini poate fi definită
ca reprezentând numărul total de pixeli (de exemplu L×K) sau poate fi
definită ca fiind egală cu numărul de pixeli pe unitatea de suprafaţă (în
pixeli/cm
2
sau în pixeli/inch
2
). Rezoluţia spaţială a unui sistem de achiziţie
de imagini se poate defini ca fiind egală cu numărul de pixeli pe unitatea
de lungime (pixeli/mm sau pixeli/cm). Pe baza acestor noţiuni, se mai
poate defini şi sensibilitatea unui sistem de vedere sau a unui sistem de
22
achiziţie de imagini, ca fiind unitatea minimă de lungime care poate fi
observată într-o imagine achiziţionată.
Fiecare pixel reprezintă nu numai un punct al unei imagini, ci o
regiune rectangulară a acesteia, care defineşte o celulă elementară a
imaginii. Valoarea asociată unui pixel reprezintă în mod adecvat media
intensităţii luminoase din celula corespunzătoare. În figura 2.8 este
ilustrată una şi aceeaşi imagine, reprezentată printr-un număr diferit de
pixeli.


(a) (b)


(c) (d)
Figura 2.8. Imagine digitală cu diferite rezoluţii:
(a) - 16×16 pixeli; (b) - 32×32 pixeli; (c) - 64×64 pixeli; (d) - 256×256
pixeli.

În cazul unor pixeli de dimensiune mare (figura 2.8.a şi 2.8.b), nu
numai că rezoluţia spaţială este mică, dar apar nişte artefacte (zgomote)
23
deranjante datorate discontinuităţilor de niveluri de gri de la marginile
pixelilor, care distrag atenţia privitorului de la conţinutul propriu-zis al
imaginii. Atunci când dimensiunea pixelilor devine mai mică, adică atunci
când creşte rezoluţia spaţială (figura 2.8.c şi 2.8.d), efectele descrise mai
sus devin mai puţin pronunţate, putându-se ajunge până la impresia de
continuitate spaţială a imaginii. Acest lucru de întâmplă când rezoluţia
spaţială a imaginii devine mai mare decât rezoluţia sistemului uman de
vedere, adică atunci când dimensiunea unui pixel al imaginii devine mai
mică decât dimensiunea minimă pe care o poate percepe ochiul uman.
Nu există un răspuns general valabil legat de numărul optim de
pixeli necesar pentru a crea senzaţia de continuitate spaţială a unei
imagini. În cazul observării vizuale a unei imagini, trebuie ca dimensiunea
unui pixel să fie mai mică decât dimensiunea corespunzătoare rezoluţiei
spaţiale a sistemului vizual, la o distanţă nominală a observatorului. În
cazul unei aplicaţii concrete, dimensiunea unui pixel trebuie să fie
obligatoriu mai mică decât dimensiunea celui mai mic obiect pe care
dorim să îl vizualizăm. În general, într-o aplicaţie dată, cel care impune o
limită a numărului de pixeli este sistemul de achiziţie a imaginilor. De
exemplu, chiar dacă se utilizează sisteme de achiziţie cu o rezoluţie
ridicată, de 1000×1000 = 1 milion de elemente, rezoluţia spaţială relativă
este de 10
-3
. Aceasta poate fi considerată o rezoluţie slabă, deoarece în
cazul măsurării unei lungimi, a unei tensiuni electrice sau a unei frecvenţe,
o rezoluţie sau o precizie satisfăcătoare începe de la 10
-6
. Însă, în cazul
măsurării unor astfel de mărimi uni-dimensionale, se efectuează
măsurători relativ la un singur punct, în timp ce o imagine de 1000×1000
conţine un milion de puncte. Prin urmare, o imagine poate oferi informaţii
referitoare la variaţia spaţială a unui semnal. În plus, dacă se
achiziţionează secvenţe temporale de imagini, se pot obţine informaţii care
nu sunt accesibile dintr-o imagine statică. Astfel se pot obţine informaţii
legate de variaţiile temporale ale unui semnal şi prin urmare se poate
studia cinematica şi dinamica temporală a acestuia.
24
O reţea rectangulară reprezintă cea mai simplă, dar şi cea mai
răspândită geometrie a unei imagini digitale. Pe lângă aceasta, mai există
şi alte aranjamente geometrice ale pixelilor sau alte forme ale celulelor
elementare. Aceste forme şi dispuneri geometrice sunt similare
configuraţiilor cristaline posibile în cazul corpurilor solide 3D în fizică,
chimie sau mineralogie. Dacă se iau în considerare doar poligoane
regulate, există doar trei forme de reţele regulate posibile: triunghiulare,
pătrate sau hexagonale (figura 2.9).



Figura 2.9. Forme de reţele regulate posibile în 2D:
(a) - reţea triunghiulară; (b) - reţea pătrată; (c) – reţea hexagonală.

În cazul imaginilor 3D, pixelul se transformă în voxel (din engleză
= volume element). Într-o reţea rectangulară, fiecare pixel reprezintă
valoarea medie a nivelului de gri (sau de culoare) dintr-un cub elementar.
Poziţia unui voxel este indicată prin trei indici: un indice de linie (l), un
indice de coloană (k) şi un indice (m) pentru ”adâncime” (figura 2.10).
25
y
x
z
l
k
m

Figura 2.10. Reprezentarea imaginilor digitale ca matrici de voxeli
dispuşi într-o reţea rectangulară tri-dimensională.


2.4. Proprietăţi ale imaginilor digitale

Imaginile digitale au unele proprietăţi, metrice sau topologice,
diferite de proprietăţile funcţiilor bidimensionale continue. Pe baza celor
prezentate până în acest punct, se pot trage următoarele concluzii:
• o imagine digitală este formată din elemente de imagine (pixeli) de
dimensiune finită;
• în mod uzual, pixelii sunt aranjaţi sub forma unei reţele rectangulare;
• o imagine digitală reprezintă o matrice bidimensională a cărui
elemente sunt numere întregi care corespund nivelurilor de cuantizare a
gamei de niveluri de gri.
• unele proprietăţi ale imaginilor continue nu au o analogie directă în
domeniul imaginilor digitale.




26

2.4.1. Proprietăţi metrice ale imaginilor digitale

Distanţa dintre doi pixeli dintr-o imagine digitală reprezintă o
mărime cantitativă. Distanţa dintre punctele de coordonate (i,j) şi (k,l)
poate fi definită în diferite moduri:
• distanţa euclidiană:
| | ( ) ( )
2 2
) , ( ), , ( l j k i l k j i d
E
− + − = (2.21)

Avantajul distanţei euclidiene este faptul că este intuitivă, dar are
dezavantajul unui cost mare de calcul datorită radicalului din formulă şi
datorită valorii neîntregi care rezultă şi deci a interpolării necesare.
Distanţa dintre două puncte poate fi exprimată şi prin numărul
minim de paşi elementari de pe reţeaua discretă, dintre punctul de start
şi punctul final.
• Dacă sunt permise doar deplasări orizontale şi verticale, se poate defini
distanţa d
4
sau distanţa interbloc:
| | l j k i l k j i d − + − = ) , ( ), , (
4
(2.22)

Această distanţă este similară distanţei dintre două locaţii dintr-un oraş
cu o reţea rectangulară de străzi şi blocuri închise de clădiri.
• Dacă sunt permise şi deplasări diagonale, se poate defini distanţa d
8

sau distanţa de tip şah:
| | { } l j k i l k j i d − − = , max ) , ( ), , (
8
(2.23)






27
2.4.2. Proprietăţi topologice ale imaginilor digitale

Adiacenţa pixelilor este un concept important în prelucrarea
imaginilor digitale. Oricare doi pixeli sunt vecini în sensul distanţei d
4

dacă există o distanţă d
4
=1 între cei doi pixeli. În mod analog, doi pixeli
sunt vecini în sensul distanţei d
8
dacă există o distanţă d
8
=1 între cei doi
pixeli. Cele două tipuri de vecinătăţi sunt ilustrate în figura de mai jos:

V4 V8


Figura 2.11. Vecinătatea V4 şi V8.

Pe baza adiacenţei pixelilor se pot defini regiunile, ca mulţimi
conexe de pixeli adiacenţi.
O cale dintre un pixel P şi Q este o secvenţă de puncte A
1
, A
2
, …,
A
n
, unde A
1
=P şi A
n
=Q, iar A
i+1
este vecin cu A
i
, i=1, …,n.
O regiune reprezintă o mulţime de pixeli în care există o cale între
oricare pereche de pixeli ai săi, iar pixelii acelei căi sunt incluşi şi ei în
mulţimea respectivă.
Dacă există o cale între doi pixeli ai unei imagini, aceşti pixeli sunt
conecşi. Relaţia de conexitate este reflexivă, simetrică şi tranzitivă şi
defineşte o descompunere a mulţimii (în cazul de faţă imaginea) în clase
echivalente (regiuni).
Să presupunem că R
i
sunt regiuni disjuncte din imagine şi că aceste
regiuni nu ating marginile imaginii (pentru a evita cazurile speciale). Fie R
reuniunea tuturor regiunilor R
i
. Fie R
C
complementara mulţimii R în raport
cu imaginea.
28
Submulţimea lui R
C
care este conexă în raport cu marginile
imaginii se numeşte fundal, iar restul mulţimii R
C
se numesc găuri. Dacă
nu avem găuri într-o regiune, aceasta se numeşte regiune simplu conexă.
O regiune cu găuri se numeşte regiune multi-conexă.
Trebuie observat faptul că noţiunea de regiune implică doar
proprietatea de conexitate. Regiunilor li se pot atribui proprietăţi
secundare care îşi au originea în interpretarea imaginilor. Astfel, unele
regiuni din imagine se numesc obiecte. Procesul prin care se determină
care regiuni dintr-o imagine corespund fiecărui obiect se numeşte
segmentarea imaginilor. De exemplu, nivelul de gri al unui pixel
reprezintă o proprietate simplă care poate fi utilizată pentru a defini
obiectele dintr-o imagine. Dacă un pixel are un nivel de gri mai mare
decât anumite praguri predefinite, el aparţine unui anumit obiect. Toate
punctele care satisfac această proprietate şi care sunt conexe, constituie un
obiect. O gaură constă din punctele care nu aparţin unui obiect şi sunt
înconjurate de obiecte. Toate celelalte obiecte constituie fundalul. Un
exemplu îl constituie un text negru pe o pagină albă, în care literele
reprezintă obiectele. Regiunile albe înconjurate de litere reprezintă găuri
(de exemplu în interiorul literei O). Toate celelalte regiuni ale hârtiei
reprezintă fundal.


2.4.3. Relaţii de vecinătate între pixeli

Una din proprietăţile importante ale imaginilor discrete este
reprezentată de relaţiile de vecinătate dintre pixeli, deoarece pe baza
acestora se pot defini regiunile conexe şi obiectele. Într-o reţea
rectangulară bidimensională se pot defini două tipuri de vecinătăţi ale
pixelilor (figura 2.12.a şi 2.12.b ).
29
l-1, k
l, k l, k+1
l+1, k
l, k-1
l-1, k
l, k l, k+1
l+1, k
l, k-1
l-1, k+1 l-1, k-1
l+1, k+1 l+1, k-1

Figura 2.12. Vecinătăţi definite pe o reţea rectangulară:
(a) - vecinătatea V4; (b) - vecinătatea V8.

Definirea acestor vecinătăţi se poate face şi pe baza unor relaţii
matematice, dar pentru moment vor fi definite într-un mod simplu, pentru
o mai bună înţelegere. Astfel, se poate spune despre doi pixeli că sunt
vecini dacă au cel puţin o latură comună. În acest caz un pixel va avea 4
vecini, obţinându-se vecinătatea V4 (figura 2.12.a). Se poate defini şi o
altă vecinătate, în cadrul căreia doi pixeli sunt vecini dacă au cel puţin un
colţ comun. În acest caz, un pixel va avea 8 vecini, obţinându-se
vecinătatea V8 (figura 2.12.b).
Ambele tipuri de vecinătate sunt necesare pentru a defini obiectele
şi regiunile conexe. Se spune despre o regiune (sau un obiect) că este
conexă atunci când se poate ajunge de la un pixel la oricare alt pixel al
regiunii, trecând doar de la un pixel vecin la altul. De exemplu, obiectul
gri din figura 2.13 reprezintă un obiect în sensul unei vecinătăţi V8, dar
este constituit din două obiecte în sensul unei vecinătăţi V4.

Figura 2.13. Regiunea gri reprezintă un obiect (sau regiune conexă) dacă
se utilizează o vecinătate V8 şi două obiecte dacă se utilizează o
vecinătate V4.
30

Acelaşi lucru se poate afirma şi despre fundalul alb din figura 2.13.
Pentru a se putea face o distincţie clară între fundal şi obiectele din figură
se poate defini o vecinătate V4 în cazul obiectelor şi o vecinătate V8 în
cazul fundalului sau invers.
Aceste complicaţii nu apar numai în cazul reţelelor rectangulare. În
cazul unei reţele triunghiulare se poate defini o vecinătate V3 pentru
pixelii care au în comun câte o latură şi o vecinătate V12 pentru pixelii
care au în comun câte un colţ (figura 2.9). În cazul unei reţele hexagonale
se poate defini numai o vecinătate V6 deoarece toţi pixelii care au în
comun un colţ, au în comun şi o latură, iar pixelii care au în comun o
latură, au în comun şi două colţuri. În ciuda acestor dezavantaje, reţelele
hexagonale sunt utilizate în mod curent în prelucrarea imaginilor deşi
sistemele de achiziţie a imaginilor generează, de regulă, imagini ai căror
pixeli sunt dispuşi într-o reţea rectangulară. Motivul îl reprezintă
dispunerea sub formă hexagonală a senzorilor din retina ochiului uman.
În cazul tri-dimensional, relaţiile de vecinătate sunt mai complexe.
În acest caz există trei moduri de definire a vecinătăţilor: voxeli cu feţe
comune, cu laturi comune sau cu colţuri comune. În cazul unei reţele
rectangulare, aceste enunţuri permit definirea unei vecinătăţi V6, V18,
respectiv V26 (figura 2.14).

l
l l
k
l+1
l-1
k
m-1
k+1 k-1
m

Figura 2.14. Cele trei tipuri de vecinătăţi posibile într-o reţea cubică 3D:
(a) - V6: voxeli cu feţe comune; (b) - V18: voxeli cu laturi comune;
(c) - V26: voxeli cu colţuri comune.

31
Şi în acest caz trebuie definite două tipuri de vecinătăţi pentru
obiecte şi pentru fundal, pentru a putea defini în mod corect regiunile
conexe. Astfel, în cazul obiectelor se poate utiliza o vecinătate V6, iar în
cazul fundalului se poate utiliza o vecinătate V26 sau invers.


2.4.4. Paradoxuri de conexitate

Definiţia vecinătăţii şi conexităţii pe o reţea rectangulară creează
unele paradoxuri.
Exemplul 1. În figura următoare sunt reprezentate trei linii digitale
cu pante de 45
o
, respectiv -45
o
.


Figura 2.15. Exemplu de paradox de conexitate a liniilor.

Dacă se utilizează vecinătatea V4, liniile nu sunt conexe în fiecare
punct al lor. Mai mult, apar şi conflicte în raport cu înţelegerea intuitivă a
proprietăţilor liniilor. Astfel, două linii perpendiculare se intersectează
într-un caz (stânga-jos), dar nu se intersectează în alt caz (dreapta-sus),
deoarece nu au un punct comun.






32
Exemplul 2. În figura următoare este prezentat un alt paradox.

A
B
C
D

Figura 2.15. Exemplu de paradox de conexitate a curbelor sau regiunilor.

Acest paradox este cunoscut în geometria euclidiană, unde fiecare
curbă (sau regiune) închisă divide planul în două regiuni neconexe. Dacă
imaginea este digitizată într-o reţea pătrată, utilizând vecinătatea V8, se
poate trasa o linie din partea internă a unei curbe închise până în partea
externă, care nu intersectează curba. Aceasta implică faptul că părţile
interne şi externe ale curbei constituie o singură regiune conexă.

Exemplul 3 (paradoxul conectivităţii).
Dacă se presupune vecinătatea (conexitatea) V4, figura de mai sus
conţine patru regiuni separate conexe A, B, C şi D. A ∪ B sunt neconexe,
la fel ca şi C ∪ D, ceea ce reprezintă o contradicţie topologică deoarece, în
mod intuitiv, dacă A ∪ B sunt neconexe, ar trebui ca C ∪ D să fie conexe.
Dacă se presupune vecinătatea V8, există două regiuni A ∪ B şi
C ∪ D. Cele două mulţimi conţin în întregime căile AB şi CD, dar acestea
se intersectează!
O soluţie de eliminare a paradoxului conexităţii este de a trata
obiectele utilizând vecinătatea V4 iar fundalul utilizând vecinătatea V8 sau
invers.

Problemele prezentate sunt tipice reţelelor rectangulare. Reţelele
hexagonale rezolvă o mare parte a acestor probleme dar au, la rândul lor,
numeroase dezavantaje. Astfel, din motive de simplitate, majoritatea
33
dispozitivelor de digitizare utilizează o reţea rectangulară, în ciuda
dezavantajelor şi paradoxurilor prezentate.
O alternativă pentru eliminarea problemelor de vecinătate sau
conexitate este de a utiliza topologia discretă, considerând familii de
mulţimi de diferite dimensiuni. De exemplu, punctele (0-dimensionale)
pot fi atribuite unor mulţimi care să conţină structuri de dimensiuni mai
mari (ca de exemplu, mulţimi de pixeli), care permit eliminarea
paradoxurilor expuse. Liniile (1-dimensionale) permit o definiţie precisă a
muchiilor şi contururilor etc.


2.4.5. Alte proprietăţi topologice şi geometrice

Frontiera unei regiuni R este o mulţime de pixeli din regiune,
care au unul sau mai mulţi vecini în exteriorul regiunii. Această definiţie
se referă la frontiera internă, pentru a o distinge de frontiera externă,
care reprezintă frontiera fundalului (complementarei) regiunii.
Muchia este o proprietate a unui pixel şi a vecinătăţii sale
imediate, caracterizată de o amplitudine şi o direcţie. Direcţia unei muchii
este perpendiculară pe direcţia gradientului care indică direcţia de variaţie
a nivelului de gri din imagine.
Frontiera este un concept global relativ la o regiune, în timp ce
muchia exprimă o proprietate locală a funcţiei de variaţie a nivelului de gri
dintr-o imagine. Cu toate acestea, între muchii şi frontiere există o
legătură. Astfel, o posibilitate de a determina frontierele este de a
concatena muchiile semnificative (punctele caracterizate de un gradient
mare al funcţiei de variaţie a nivelului de gri).
Proprietatea de a aparţine unei muchii este caracteristică unui pixel
şi vecinilor săi. Uneori este avantajos să se utilizeze proprietăţi ale unor
perechi de pixeli vecini. Astfel se poate introduce noţiunea de muchie
compusă, ataşată fiecărui pixel, care exprimă relaţia sa cu cei 4 vecini.
Direcţia muchiilor compuse este cea de creştere a nivelului de gri şi este
34
un multiplu de 90
o
, în timp ce amplitudinea sa reprezintă diferenţa
absolută dintre nivelurile de gri ale perechilor relevante de pixeli.
Pentru descrierea proprietăţilor geometrice ale obiectelor se
utilizează contururi convexe. Un contur convex este cea mai mică regiune
care conţine un obiect, astfel încât oricare două puncte ale regiunii pot fi
unite printr-o linie dreaptă, toate punctele liniei aparţinând regiunii.
Un obiect poate fi reprezentat printr-o colecţie a componentelor
sale topologice. Mulţimile de puncte din interiorul contururilor convexe,
care nu aparţin unui obiect, sunt numite deficit de convexitate.


2.5. Reprezentarea spectrală a imaginilor

Reprezentarea spectrală a imaginilor este utilă în analiza spectrală a
acestora. Analiza spectrală oferă informaţii despre modul de variaţie a
unui semnal. De exemplu, un semnal unidimensional (1D) lent variabil are
un spectru concentrat în jurul originii, în timp ce un semnal rapid variabil,
are un spectru mai larg.
t
f(t)
|F(ω)|
ω
ω
t
f(t)
|F(ω)|
Figura 2.16. Ilustrarea spectrului unui semnal lent şi a unuia rapid
variabil.

35
În cazul imaginilor (2D) se poate determina dacă are sau nu
contururi multe, prin inspecţia spectrului său, pornind de la constatarea că
variaţiile rapide (frecvenţele mari) corespund contururilor.
Spectrul unui semnal (sau al unei imagini) se obţine prin
transformata Fourier a acestuia.

Transformata Fourier unidimensională se defineşte astfel:
{ }


∞ −
⋅ ⋅ −
= ⋅ = ℑ ) ( ) ( ) (
.
ω
ω
F dt e t f t f
t j
def
, C R → : f (2.24)
Transformata Fourier { } ) ( ) (
.
ω F t f
not
= ℑ se defineşte pentru funcţiile
f(t)∈L
2
, unde L
2
este clasa semnalelor (funcţiilor) de energie finită, pentru
care există transformată Fourier directă şi inversă, adică:

)
`
¹
¹
´
¦
∞ < = = ∈


∞ −
dt t f E t f L t f
f
2
2
) ( | ) ( ) ( , (2.25)
unde E
f
este energia funcţiei f.
Dacă: f∈L
2
,
2 2
: ) ( L L F → ℑ ⇒ ∃ ⇒ ω este inversabilă.
Transformata Fourier inversă se defineşte ca fiind:
{ }


∞ −
⋅ ⋅ −
= ⋅ = ℑ ) ( ) (
2
1
) (
.
1
t f d e F F
t j
def
ω ω
π
ω
ω
(2.26)
În aceste relaţii: ω este pulsaţia, iar
π
ω
2
este frecvenţa.









36

2.5.1. Transformata Fourier bidimensională

Definiţie:
Se consideră funcţia bidimensională f(x,y), f: R→C, unde:

¦
)
¦
`
¹
¦
¹
¦
´
¦
∞ < = → = ∈
∫∫
2
2
.
2
2
) , ( | :
R
C R dxdy y x f E f L f
def
f
(2.27)
Transformata Fourier bidimensională a funcţiei f se defineşte ca
fiind:
{ } ( ) | | ) , ( exp ) , ( ) , (
.
v u F dxdy y v x u j y x f y x f
def
= ⋅ + ⋅ ⋅ − ⋅ = ℑ
∫ ∫

∞ −

∞ −
(2.28)

unde: x,y sunt coordonate spaţiale, iar u,v sunt frecvenţe spaţiale.

Dacă: f∈L
2
,
2 2
: ) ( L L F → ℑ ⇒ ω ∃ ⇒ este inversabilă.
Transformata Fourier bidimensională inversă se defineşte ca fiind:
{ } ( ) | | ) , ( exp ) , (
4
1
) , (
2
2
.
1
y x f dudv y v x u j v u F v u F
def
= ⋅ + ⋅ ⋅ ⋅ = ℑ
∫∫

R
π
(2.29)


2.5.2. Proprietăţile transformatei Fourier bidimensionale

1. Deplasarea semnalului:
Dacă funcţiei unidimensionale 1D f(t) îi corespunde transformata
Fourier F(ω) atunci funcţiei f(t-t
0
) îi corespunde:
0
1 1
) ( ) ( ) ( ) (
0
t j
F F
e F t t f F t f
D D
⋅ ⋅ ±
⋅ ↔ ± ⇒ ↔
ω
ω ω (2.30)

În cazul bidimensional (2D):
37
) (
0 0
0 0
2 2
) , ( ) , ( ) , ( ) , (
y v x u j
F F
e v u F y y x x f v u F y x f
D D
⋅ + ⋅ ⋅ ±
⋅ ↔ ± ± ⇒ ↔ (2.31)

Demonstraţie:
{ }
( )
∫∫
⋅ + ⋅ ⋅ −
⋅ − − = − − ℑ
2
) , ( ) , (
0 0 0 0
R
dxdy e y y x x f y y x x f
y v x u j
(2.32)
Făcând schimbările de variabile: x-x
0
=x’, respectiv y-y
0
=y’, iacobianul
corespunzător este:
1
' '
' '
det =
|
|
|
|
.
|

\
|








=
y
y
x
y
y
y
x
x
I (2.33)

{ } ( ) | | = ⋅ ⋅ + ⋅ + + ⋅ ⋅ − ⋅ = − − ℑ
∫∫
2
' ' ) ' ( ) ' ( exp ) ' , ' ( ) , (
0 0 0 0
R
dy dx I y y v x x u j y x f y y x x f
( ) | | ( ) | | = ⋅ ⋅ + ⋅ ⋅ − ⋅ ⋅ + ⋅ − =
∫∫
2
' ' ' ' exp ) ' , ' ( exp
0 0
R
dy dx y v x u j y x f y v x u j
( ) | |
0 0
exp ) , ( y v x u j v u F ⋅ + ⋅ − ⋅ = q.e.d.

2. Deplasarea spectrului:
Dacă funcţiei unidimensionale 1D f(t) îi corespunde spectrul
(transformata Fourier) F(ω), atunci funcţiei
t j
e t f
⋅ ω ⋅ ±

0
) ( îi
corespunde spectrul deplasat:
) ( ) ( ) ( ) (
0
1
0
1
ω ω ω
ω
m F e t f F t f
D D
F
t j
F
↔ ⋅ ⇒ ↔
⋅ ⋅ ±
(2.34)

În cazul bidimensional:
) , ( ) , ( ) , ( ) , (
0 0
) (
2
0 0
2
v v u u F e y x f v u F y x f
D D
F
y v x u j
F
m m ↔ ⋅ ⇒ ↔
⋅ + ⋅ ⋅ ±
(2.35)

Demonstraţia este lăsată ca exerciţiu, aceasta fiind similară
demonstraţiei proprietăţii 1, de deplasare a semnalului.
38

3. Scalarea semnalului:
Dacă funcţiei f(x,y) îi corespunde transformata Fourier F(u,v), atunci
funcţiei scalate ) , ( by ax f îi corespunde transformata Fourier:

|
.
|

\
|


↔ ⋅ ⋅ ⇒ ↔
b
v
a
u
F
b a
y b x a f v u F y x f
D D
F F
,
1
) , ( ) , ( ) , (
2 2
(2.36)

În cazul unidimensional, acest lucru poate fi ilustrat grafic astfel:
f(t)
t
f(a·t)
t
Pt. a<1
|F(ω)|
ω
|
.
|

\
| ω

a
F
a
1
ω
Figura 2.17. Ilustrarea grafică a scalării semnalului.

Demonstraţie:
{ }
( )
∫∫
⋅ + ⋅ ⋅ −
⋅ ⋅ ⋅ = ⋅ ⋅ ℑ
2
) , ( ) , (
R
dxdy e y b x a f y b x a f
y v x u j
(2.37)

Făcând schimbările de variabile: a·x=x’, respectiv b·y=y’, iacobianul
corespunzător este:

b a
y
y
x
y
y
y
x
x
I

=
|
|
|
|
.
|

\
|








=
1
' '
' '
det (2.38)
39

{ }
∫∫
|
.
|

\
|


= ⋅ ⋅

|
.
|

\
|
⋅ + ⋅ ⋅ − ⋅ = ⋅ ⋅ ℑ
2
,
1
' '
' '
exp ) ' , ' ( ) , (
R
b
v
a
u
F
b a
dy dx I
b
y
v
a
x
u j y x f y b x a f
q.e.d.

4. Liniaritatea:
Dacă funcţiilor f, respectiv g le corespunde transformatele Fourier F,
respectiv G, atunci funcţiei compuse g f ⋅ β + ⋅ α îi corespunde
transformata Fourier compusă:
C ∈ ∀ ⋅ + ⋅ ↔ ⋅ + ⋅ ⇒ ↔ β α β α β α , , , ,
2 2
G F g f G F g f
D D
F F
(2.39)

Demonstraţia este trivială şi se face similar proprietăţii de deplasare a
semnalului.

5. Proprietatea de simetrie:
Dacă funcţiei f(x,y) îi corespunde transformata Fourier F(u,v), atunci
funcţiei simetrice faţă de origine ) , ( y x f − − , îi corespunde un spectru
(transformata Fourier) simetric faţă de origine:
) , ( ) , ( ) , ( ) , (
2 2
v u F y x f v u F y x f
D D
F F
− − ↔ − − ⇒ ↔ (2.40)

Similar, dacă funcţiei f(x,y) îi corespunde transformata Fourier F(u,v),
atunci conjugatei funcţiei simetrice faţă de origine ) , ( y x f − − , îi
corespunde un spectru (transformata Fourier) simetric faţă de origine,
dar rotit cu 180
0
:
) , ( ) , ( ) , ( ) , (
* *
2 2
v u F y x f v u F y x f
D D
F F
↔ − − ⇒ ↔ (2.41)

Dacă funcţia f este reală (f∈R
2
):
) , ( ) , ( ) , ( ) , (
* *
v u F v u F y x f y x f = − − ⇒ − − = (2.42)


40
6. Teorema convoluţiei:
Fie funcţiile bidimensionale C R →
2
: , g f . Produsul de convoluţie al
funcţiilor f şi g se defineşte astfel:

∫∫
− − ⋅ = ∗
2
) , ( ) , ( ) , ( ) , (
.
R
η ξ η ξ η ξ d d y x g f y x g y x f
def
= (2.43)

∫∫
∗ = ⋅ − − =
2
) , ( ) , ( ) , ( ) , (
.
R
y x f y x g d d g y x f
def
η ξ η ξ η ξ (2.44)

Enunţul teoremei convoluţiei:
Dacă funcţiei f(x,y) îi corespunde transformata Fourier F(u,v), iar
funcţiei g(x,y) îi corespunde transformata Fourier G(u,v), atunci
produsului de convoluţie a celor două funcţii îi corespunde produsul
transformatelor Fourier ale celor două funcţii, iar produsului simplu a
celor două funcţii îi corespunde produsul de convoluţie a
transformatelor Fourier ale celor două funcţii:
) , ( ) , ( ) , ( ) , (
2
v u G v u F y x g y x f
D
F
⋅ ↔ ∗ (2.45)

) , ( ) , (
4
1
) , ( ) , (
2
2
v u G v u F y x g y x f
D
F
∗ ↔ ⋅
π
(2.46)

Demonstraţie:
{ }
∫∫
⋅ + ⋅ ⋅ −
⋅ ∗ = ∗ ℑ
2
) (
.
) , ( ) , ( ) , ( ) , (
R
dxdy e y x g y x f y x g y x f
y v x u j
def
=

∫∫ ∫∫
⋅ + ⋅ ⋅ −

− − ⋅ =
2 2
) (
) , ( ) , (
R R
dxdy e d d y x g f
y v x u j
η ξ η ξ η ξ =
η ξ η ξ η ξ
η ξ
d d dxdy e y x g f
v u j
e v u G
y v x u j
∫∫
⋅ + ⋅ ⋅ −

⋅ + ⋅ ⋅ −


∫∫
− − ⋅ =
2
) (
2
) , (
) (
) , ( ) , (
R R
4 4 4 4 4 4 4 3 4 4 4 4 4 4 4 2 1
=
41
) , ( ) , ( ) , ( ) , (
2
) (
v u G v u F d d e f v u G
v u j
⋅ = ⋅ ⋅ =
∫∫
⋅ + ⋅ ⋅ −
η ξ η ξ
η ξ
R
q.e.d.

7. Teorema lui Parceval:
Fie funcţiile bidimensionale C R →
2
: , g f . Dacă funcţiei f(x,y) îi
corespunde transformata Fourier F(u,v), iar funcţiei g(x,y) îi
corespunde transformata Fourier G(u,v), atunci produsului scalar a
celor două funcţii îi corespunde produsul scalar al transformatelor
Fourier a celor două funcţii, multiplicat cu o constantă
2
4
1
π
.
Deci, dacă:
) , ( ) , (
2
v u F y x f
D
F
↔ şi ) , ( ) , (
2
v u G y x g
D
F
↔ , (2.47)
atunci:
G F g f ,
4
1
,
2
π
= ⇒ (2.48)
adică:
G F dudv v u G v u F dxdy y x g y x f g f
def
,
4
1
) , ( ) , (
4
1
) , ( ) , ( ,
2
*
2
*
2 2 π
= ⋅
π
= ⋅ = ⇒
∫∫ ∫∫
R R

Demonstraţie:
∫∫
⋅ + ⋅
⋅ =
2
) (
2
) , (
4
1
) , (
R
dudv e v u G y x g
y v x u j
π

∫∫
⋅ + ⋅ −
⋅ =
2
) ( *
2
*
) , (
4
1
) , (
R
dudv e v u G y x g
y v x u j
π

dxdy dudv e v u G y x f g f
y v x u j
def
∫∫ ∫∫

⋅ ⋅ = ⇒
⋅ + ⋅ −
2 2
) ( *
2
) , (
4
1
) , ( ,
R R
π
=
42
dudv dxdy e y x f v u G
v u F
y v x u j
∫∫ ∫∫

⋅ ⋅ =
⋅ + ⋅ −
2 2
) , (
) (
2
*
) , (
4
1
) , (
R R
4 4 4 4 4 3 4 4 4 4 4 2 1
π
=
G F dudv v u G v u F ,
4
1
) , ( ) , (
4
1
2
*
2
2
π π
= ⋅ =
∫∫
R
q.e.d.

Dacă definim energia funcţiei f ca fiind:

∫∫
=
2
2
.
) , (
R
dxdy y x f E
def
f
(2.49)
Teorema energiei (consecinţă a teoremei lui Parceval):
Energia calculată în spaţiul original (primar) este egală cu
energia calculată în domeniul spectral, multiplicată cu o constantă
2
4
1
π
.
Această teoremă rezultă ca un caz particular din teorema lui
Parceval, pentru g=f:
(2.50)
F
F f
f
E dudv v u F v u F dxdy y x f y x f E ⋅
π
= ⋅
π
= ⋅ = ⇒
∫∫ ∫∫
2
*
2
*
4
1
) , ( ) , (
4
1
) , ( ) , (
2
2
2
2 R R
4 4 3 4 4 2 1 4 4 3 4 4 2 1


8. Teorema simetriei:
Dacă funcţiei unidimensionale f(t) îi corespunde transformata Fourier
F(ω), atunci transformatei Fourier privită ca funcţie de timp F(t) îi
corespunde transformata Fourier simetrică multiplicată cu constanta
2π:
) ( 2 ) ( ) ( ) (
1 1
ω π ω − ⋅ ↔ ⇒ ↔ f t F F t f
D D
F F
(2.51)
Un exemplu este prezentat în figura următoare:
43

f(t)
t
f(ω)
ω
F
1D

F(ω)
ω
F(t)
t
F
1D


Figura 2.18. Exemple ilustrative ale teoremei simetriei.

În cazul bidimensional, dacă funcţiei bidimensionale f(x,y) îi
corespunde transformata Fourier F(u,v), atunci transformatei Fourier
privită ca funcţie de spaţiu F(x,y) îi corespunde transformata Fourier
simetrică multiplicată cu constanta 4π
2
:
) , ( 4 ) , ( ) , ( ) , (
2
2 2
v u f y x F v u F y x f
D D
F F
− − ⋅ ↔ ⇒ ↔ π (2.52)


2.5.3. Proprietăţi specifice transformatei Fourier bidimensionale

9. Separabilitatea:
Transformata Fourier bidimensională este separabilă:
( ) | |
∫ ∫

∞ −

∞ −
⋅ + ⋅ ⋅ − ⋅ = dxdy y v x u j y x f v u F exp ) , ( ) , ( =
( ) dy y v j dx x u j y x f
y u F
x
) exp( exp ) , (
) , (
⋅ ⋅ − ⋅

⋅ ⋅ − ⋅ =
∫ ∫

∞ −

∞ −
4 4 4 4 3 4 4 4 4 2 1
=
44
) , ( ) , ( ) exp( ) , ( v u F v u F dy y v j y u F
xy x
= = ⋅ ⋅ − ⋅ =


∞ −
(2.53)

Din această proprietate rezultă că se poate face calculul
transformatei Fourier bidimensionale aplicând pe rând (pe cele
două direcţii x şi y) transformata Fourier unidimensională. Cu alte
cuvinte, se aplică transformata Fourier unidimensională pe direcţia
x, iar asupra rezultatului se aplică transformata Fourier
unidimensională pe direcţia y:

) , ( ) , ( ) , ( ) , (
pe pe
1 1
v u F v u F y u F y x f
xy
y F
x
x F
D D
= ÷ ÷ ÷ ÷ → ÷ ÷ ÷ ÷ ÷ → ÷

sau:
) , ( ) , ( ) , ( ) , (
pe pe
1 1
v u F v u F v x F y x f
yx
x F
y
y F
D D
= ÷ ÷ ÷ ÷ → ÷ ÷ ÷ ÷ ÷ → ÷

(2.54)

Proprietatea de separabilitate are următoarele consecinţe:
- Dacă se dispune de un algoritm rapid de calcul pentru cazul
unidimensional (iar pentru transformata Fourier există un astfel de
algoritm), atunci şi pentru transformata Fourier bidimensională
există un algoritm rapid de calcul.
- Dacă funcţia originală se poate scrie ca produsul a două funcţii,
transformata sa Fourier este egală cu produsul transformatelor
Fourier a celor două funcţii, adică:
Dacă: ) ( ) ( ) , (
2 1
y f x f y x f ⋅ =
{ }
{ }
¹
´
¦
ℑ =
ℑ =
⋅ = ⇒
) (
) (
: unde ), ( ) ( ) , (
2 2
1 1
2 1
y f (v) F
x f (u) F
v F u F v u F (2.55)

10. Derivarea spaţială:
Dacă funcţiei bidimensionale f(x,y) îi corespunde transformata
Fourier F(u,v), atunci derivatei funcţiei f în raport cu cele două
variabile, îi corespunde următoarele transformate Fourier:
45

¦
¦
¹
¦
¦
´
¦
⋅ ⋅ ÷ ÷ → ←


⋅ ⋅ ÷ ÷ → ←


⇒ ÷ ÷ → ←
) , (
) , (
) , ( ) , (
2
2
2
v u F v j
y
f
v u F u j
x
f
v u F y x f
D
D
D
F
F
F
(2.56)

Demonstraţie:
( ) | |
∫∫
⋅ + ⋅ ⋅ ⋅ =
2
exp ) , (
4
1
) , (
2
.
R
dudv y v x u j v u F y x f
def
π
(2.57)
( ) | | ) , ( exp ) , (
4
1
2
2
v u F u j dudv y v x u j u j v u F
x
f
⋅ ⋅ = ⋅ + ⋅ ⋅ ⋅ ⋅ ⋅ =



∫∫
R
π
q.e.d.

Această proprietate are aplicaţii în calculul diferenţial, de exemplu la
calculul laplaceanului:

2
2
2
2
.
) , (
y
f
x
f
y x f
def


+


= ∆ (2.58)
Deoarece:
F u v u F u j
x
f
v u F u j
x
f
D D
F F
⋅ − = ⋅ ⋅ ÷ ÷ → ←


⇒ ⋅ ⋅ ÷ ÷ → ←


2 2
2
2
) , ( ) ( ) , (
2 2


În mod similar: F v
y
f
D
F
⋅ − = ÷ ÷ → ←



2
2
2
2

) , ( ) ( ) , (
2 2
2
v u F v u y x f
D
F
⋅ + − = ÷ ÷ → ← ∆ ⇒ (2.59)

11. Integrarea spaţială:
Dacă funcţiei bidimensionale f(x,y) îi corespunde transformata
Fourier F(u,v), atunci integralei funcţiei f în raport cu cele două
variabile, îi corespunde următoarele transformate Fourier:

46
¦
¦
¹
¦
¦
´
¦
÷→ ←
÷→ ←
⇒ ÷ ÷ → ←


∞ −


∞ −


) 0 , ( ) , (
) , 0 ( ) , (
) , ( ) , (
2
u F dy y x f
v F dx y x f
v u F y x f
D
F
(2.60)
Demonstraţie:
( ) | |
∫ ∫

∞ −

∞ −
⋅ + ⋅ ⋅ − ⋅ = dxdy y v x u j y x f v u F
def
exp ) , ( ) , (
.


( ) ( )
4 4 4 4 4 4 3 4 4 4 4 4 4 2 1
4 43 4 42 1
y
y
dy y v j dx y x f dxdy y v j y x f v F
de functiei a Fourier ta transforma
de functie o
exp ) , ( exp ) , ( ) , 0 (
∫ ∫ ∫ ∫

∞ −

∞ −

∞ −

∞ −
⋅ ⋅ − ⋅

= ⋅ ⋅ − ⋅ = ⇒


)
`
¹
¹
´
¦
ℑ = ⇒


∞ −
dx y x f v F ) , ( ) , 0 ( (2.61)

12. Teorema rotaţiei:
Dacă funcţiei unidimensionale f îi corespunde transformata Fourier
F, atunci funcţiei rotite cu un unghi α, f
α
, îi corespunde o
transformată Fourier rotită în acelaşi sens şi cu acelaşi unghi α.
În cazul bidimensional (deci în cazul unei imagini 2D), dacă
funcţiei bidimensionale f(x,y) îi corespunde transformata Fourier
F(u,v), atunci funcţiei rotite cu un unghi α, f
α
(x,y), îi corespunde un
spectru rotit în acelaşi sens şi cu acelaşi unghi α.
Rotaţia (Rot
α
) conservă liniaritatea şi simetriile.
47
x
α
y
x'
y'
y
x

Figura 2.19. Rotaţia unui segment de dreaptă.

Rotaţia
2 2
: R R →
α
Rot se poate scrie:

|
|
.
|

\
|

|
|
.
|

\
|

=
|
|
.
|

\
|
y
x
y
x
α α
α α
cos sin
sin cos
'
'
(2.62)

Prin urmare, rotaţia se mai poate scrie:

¹
´
¦
⋅ + ⋅ − =
⋅ + ⋅ =
α α
α α
cos sin '
sin cos '
y x y
y x x
(2.63)

) cos sin , sin cos ( ) ' , ' ( ) , ( α α α α
α
⋅ + ⋅ − ⋅ + ⋅ = = ⇒ y x y x f y x f y x f


Demonstraţie:
{ }
∫∫
⋅ + ⋅ ⋅ −
α
⋅ α ⋅ + α ⋅ − α ⋅ + α ⋅ = ℑ
2
) (
) cos sin , sin cos ( ) , (
R
dxdy e y x y x f y x f
y v x u j

Se face schimbarea de variabile:
¹
´
¦
⋅ + ⋅ − =
⋅ + ⋅ =
α α
α α
cos sin '
sin cos '
y x y
y x x


48
|
|
.
|

\
|

|
|
.
|

\
| −
=
|
|
.
|

\
|

|
|
.
|

\
|
− − −
− −
=
|
|
.
|

\
|

'
'
cos sin
sin cos
'
'
) cos( ) sin(
) sin( ) cos(
y
x
y
x
y
x
α α
α α
α α
α α


¹
´
¦
⋅ + ⋅ =
⋅ − ⋅ =

α α
α α
cos ' sin ' '
sin ' cos '
y x y
y x x
(2.64)

Înlocuind:
{ } ( ) | |
∫∫
α ⋅ ⋅ + α ⋅ ⋅ + α ⋅ ⋅ − α ⋅ ⋅ − ⋅ = ℑ
α
2
' ' cos ' sin ' sin ' cos ' exp ) ' , ' ( ) , (
R
dy dx y v x v y u x u j y x f y x f

Iacobianul este:
1
cos sin
sin cos
det
' '
' '
det =
|
|
.
|

\
| −
=
|
|
|
|
.
|

\
|








α α
α α
y
y
x
y
y
x
x
x

{ }
∫∫
¦
)
¦
`
¹
¦
¹
¦
´
¦

⋅ α ⋅ + α ⋅ − + ⋅ α ⋅ + α ⋅ − ⋅ = ℑ ⇒
α
2
' ' ' ) cos sin ( ' ) sin cos ( exp ) ' , ' ( ) , (
' '
R
dy dx y v u x v u j y x f y x f
v u
4 4 4 3 4 4 4 2 1 4 4 4 3 4 4 4 2 1

{ } ) , ( ) ' , ' ( ) , ( v u F v u F y x f
α α
= = ℑ ⇒ , unde:

|
|
.
|

\
|

|
|
.
|

\
|

=
|
|
.
|

\
|
v
u
v
u
α α
α α
cos sin
sin cos
'
'
(2.65)

Prin urmare, dacă funcţia f(x,y) este cu simetrie circulară, atunci şi
transformata sa Fourier F(u,v) este cu simetrie circulară.

Demonstraţie:
Presupunem că f(x,y) este o funcţie cu simetrie circulară. În
coordonate polare (f
p
), această proprietate se scrie:
) , ( ) sin , cos ( ) , ( ϕ ρ ϕ ρ ϕ ρ
p
f f y x f = ⋅ ⋅ = , (2.66)
49
unde:
¹
´
¦
⋅ =
⋅ =
ϕ ρ
ϕ ρ
sin
cos
y
x


Deoarece funcţia f este cu simetrie circulară:
) ( ) , ( ) , (
simetrie
circularã
coordonate în
polare
ρ = ϕ ρ = ⇒
p p
f f y x f (2.67)

Pornim de la relaţia de definiţie:
( ) | |
∫ ∫

∞ −

∞ −
⋅ + ⋅ ⋅ − ⋅ = dxdy y v x u j y x f v u F
def
exp ) , ( ) , (
.
(2.68)

Se face schimbarea de variabile carteziene în coordonate polare:

¹
´
¦
⋅ =
⋅ =
ϕ ρ
ϕ ρ
sin
cos
y
x

¦
¹
¦
´
¦
=
+ =

x
y
arctg
y x
ϕ
ρ
2 2
(2.69)

Prin această schimbare de variabile, planul real se transformă în
coordonate polare într-o semibandă de înălţime 2π (pentru a se
acoperi tot planul φ trebuie să ia valori între 0…2π, iar ρ trebuie să
ia valori între 0…∞):

în coordonate
polare
y
x
R
2

φ
ρ
ρ=0…∞
φ=0…2π



Figura 2.20. Domeniile de valori în diferite sisteme de coordonate.
50

Iacobianul este:
ρ
ϕ ρ ϕ
ϕ ρ ϕ
ϕ ρ
ϕ ρ
=
|
|
.
|

\
|

⋅ −
=
|
|
|
|
.
|

\
|








cos sin
sin cos
det det
y y
x x
(2.70)
( ) | |
∫ ∫

∞ −

∞ −
⋅ ⋅ ⋅ ⋅ + ⋅ ⋅ ⋅ − ⋅ ⋅ = ⇒ ϕ ρ ϕ ρ ϕ ρ ϕ ρ ρ d d v u j f v u F
p
sin cos exp ) , ( ) , (

Se fac notaţiile:

¹
´
¦
⋅ =
⋅ =
θ
θ
sin
cos
r v
r u
) sin , cos ( ) , (
.
θ θ θ ⋅ ⋅ = ⇒ r r F r F
not
p
(2.71)

( ) | |
∫ ∫
∞ π
ϕ ⋅ ρ ⋅ ϕ ⋅ θ + ϕ ⋅ θ ρ ⋅ ⋅ − ⋅ ϕ ρ ⋅ ρ = θ ⇒
0
2
0
.
sin sin cos cos exp ) , ( ) , ( d d r j f r F
p
not
p

Dacă funcţia f este cu simetrie circulară:
) ( ) , ( ρ ϕ ρ
p p
f f = ⇒ (2.72)

| |
∫ ∫

⋅ = =

− ⋅ ⋅ ⋅ − ⋅ ⋅ ⋅ = ⇒

⋅ ⋅ ⋅ −
0
2
) (
2
0
0
2
0
cos
) cos( exp ) ( ) , ( ρ ϕ θ ϕ ρ ρ ρ θ
ϕ
ρ ϕ
π
π
ϕ ρ
d d r j f r F
π da cu perioa
, dic dupã este perio egrandul deoarece
r J d e
p p
r j
4 4 4 4 4 4 3 4 4 4 4 4 4 2 1
int


) ( ) ( ) , (
0
2
0
cos
r F d d e f r F
p
r j
p p
=


⋅ ⋅ = ⇒


⋅ ⋅ ⋅ −
ρ ϕ ρ ρ θ
π
ϕ ρ
(2.73)

Prin urmare, dacă funcţia f este cu simetrie circulară, atunci şi
transformata sa Fourier F este cu simetrie circulară (q.e.d).

51
În plus, se ştie că:


⋅ ⋅ − =
π
ϕ ϕ
2
0
0
) cos exp( ) ( d x j x J = funcţia Bessel de ordinul 0



⋅ ⋅ ⋅ = ⇒
0
0
) ( ) ( ) ( ρ ρ ρ ρ d r J f r F
p p
= transformata Henkel
{ } ) ( ) ( ) ( ) (
0
0
.
r F d r J f f H
p
def
= ⋅ ⋅ ⋅ =


ρ ρ ρ ρ ρ = transformata
Henkel a unei funcţii de o singură variabilă f(ρ).
52


3. Îmbunătăţirea imaginilor

La concepţia algoritmilor sau a dispozitivelor de prelucrare şi
îmbunătăţire a imaginilor trebuie luat în considerare principiul percepţiei
vizuale umane. Printre parametrii psiho-fizici ai percepţiei vizuale umane
pot fi amintiţi: contrastul, contururile, forma, textura, culoarea etc.
Percepţia umană a unei imagini poate provoca multe iluzii, înţelegerea lor
furnizând explicaţii referitoare la mecanismele vederii umane şi artificiale.


3.1. Calitatea unei imagini

O imagine poate fi degradată pe parcursul achiziţiei, transmisiei
sau prelucrării sale. Pentru a estima această degradare se pot utiliza măsuri
de calitate a imaginii. Calitatea necesară pentru o imagine depinde de
scopul în care este utilizată imaginea. Metodele de apreciere a calităţii
imaginii pot fi împărţite în două categorii: subiective şi obiective.
Calitatea imaginii f(x,y) este estimată prin compararea cu o imagine
de referinţă g(x,y). Imaginea de referinţă utilizată în acest scop este, de
regulă, o imagine de sinteză. Una din clasele de metode cele mai utilizate
se bazează pe diferenţa medie pătratică MSE:
( )


y x
y x f y x g
,
2
) , ( ) , ( (3.1)
Problema acestei măsuri este că nu este posibilă distincţia între
câteva diferenţe mari şi multe diferenţe mici. În locul diferenţei medii
pătratice se poate utiliza eroarea medie absolută. O altă alternativă este
corelaţia dintre imaginile f şi g.
O măsură a degradării imaginii este reprezentată de raportul
semnal-zgomot SNR. Fie f(x,y) imaginea originală şi f'(x,y)= f(x,y)+z(x,y)
53
imaginea degradată. Măsura degradării este estimată prin raportul dintre
energia semnalului şi energia zgomotului, care este estimat prin relaţia:
( )



⋅ =
y x
y x
y x f y x f
y x f
f f SNR
,
2
2 2
,
2
10
) , ( ' ) , (
) , (
log 10 ) , ' ( (dB) (3.2)
Se poate defini şi valoarea de vârf a raportului semnal-zgomot
PSNR:
( )



⋅ =
y x
y x
y x f y x f
y x f N
f f PSNR
,
2
2 2
2
,
10
) , ( ' ) , (
) , ( max
log 10 ) ' , ( (dB) (3.3)
unde N este numărul de pixeli. Un raport PSNR mai mare de 32 dB
corespunde unei degradări invizibile.
Zgomotul care poate să apară la achiziţia, transmiterea sau
prelucrarea imaginilor, poate fi dependent sau independent de conţinutul
imaginii. Zgomotul este descris, în general, de caracteristicile sale
probabilistice.
Zgomotul alb are un spectru de putere constant, iar intensitatea sa
nu se modifică odată cu frecvenţa. Acest tip de zgomot se utilizează în
majoritatea cazurilor ca aproximare brută a zgomotului dintr-o imagine.
Funcţia sa de auto-corelaţie este funcţia delta. Prin urmare, valorile
zgomotului în doi pixeli diferiţi sunt necorelate. Avantajul acestui model
de zgomot este că permite simplificarea calculelor.
Un caz special de zgomot îl reprezintă zgomotul Gaussian.
Zgomotul Gaussian reprezintă o aproximare foarte bună a zgomotului care
intervine în majoritatea cazurilor. Probabilitatea de densitate a variabilei
aleatoare ce descrie zgomotul Gaussian este dată de funcţia lui Gauss.
Zgomotul Gaussian unidimensional 1D este caracterizat de media sa u şi
de deviaţia standard σ a variabilei aleatoare:

2
2
2
) (
2
2
1
) (
σ
u
πσ


⋅ =
x
e x p (3.4)
54
Zgomotul poate fi:
• zgomot aditiv, în cazul în care zgomotul η şi semnalul de imagine f
sunt independente:
f’(x,y) = f(x,y) + η(x,y) (3.5)
În timpul transmisiei zgomotul este, în general, independent de
semnalul de imagine. Prin urmare, degradarea sa poate fi modelată ca
un zgomot aditiv.
• zgomotul multiplicativ este o funcţie descrisă de relaţia:
f'(x,y) ≈ f(x,y) · η(x,y) (3.6)
• zgomotul impulsiv (de tip impuls) corespunde unei degradări a
imaginii cu pixeli „zgomotoşi” a căror valoare diferă semnificativ de
cea a pixelilor din vecinătatea lor.
• zgomotul de tip „sare şi piper” este utilizat pentru a descrie zgomotul
impulsiv saturat, care corespunde unei imagini degradate cu pixeli albi
şi/sau negri, de exemplu.
Un parametru important în aprecierea calităţii unei imagini îl
constituie contrastul. Contrastul reprezintă variaţia locală a nivelului de gri
şi se defineşte ca raport între nivelul mediu de gri al unui obiect şi cel al
fundalului. Ochiul uman este logaritmic sensibil la iluminare şi la variaţii
ale nivelurilor de gri. Acesta este motivul pentru care majoritatea
monitoarelor au implementată o corecţie de tip gamma. Nivelul de gri
aparent depinde foarte mult de nivelul local de gri al fundalului. Acest
efect este numit contrast condiţional. Datorită acestui efect, percepţia
vizuală a unor obiecte cu acelaşi nivel de gri poate fi diferită dacă acestea
sunt plasate pe un fundal de culoare închisă sau deschisă.






55


3.2. Tehnici de îmbunătăţire a imaginilor

Îmbunătăţirea imaginilor constă dintr-un ansamblu de tehnici de
prelucrare care au ca scop scoaterea în evidenţă a anumitor caracteristici a
imaginilor (de exemplu muchii sau contururi) sau eliminarea zgomotului,
scopul final fiind obţinerea unei vizibilităţi superioare a componentelor
imaginii.
În general, termenul de îmbunătăţire este strâns legat de percepţia
vizuală subiectivă a unui expert uman, considerat utilizatorul final al
imaginii. Întrucât nu se pot defini standarde de calitate a imaginilor,
calitatea imaginii este un criteriu subiectiv. Cei care pot face afirmaţii cu
privire la calitatea unor imagini sunt experţii din domeniile din care provin
imaginile. În plus, se poate afirma că îmbunătăţirea imaginilor este bine să
fie interactivă şi iterativă deoarece utilizatorul poate interveni în
permanenţă asupra calităţii imaginii şi fiecare utilizator o va face într-un
mod caracteristic.
Tehnicile de îmbunătăţire a imaginilor nu generează informaţie
suplimentară despre imaginea originală, ci doar o pune pe cea existentă
sub o altă formă, mai uşor de interpretat de către utilizator. Chiar şi o
imagine originală, nedegradată, poate fi îmbunătăţită, obţinând o imagine
modificată, dar subiectiv preferabilă. De exemplu, într-o imagine
subexpusă sau supraexpusă, utilizatorul (uman sau dispozitivul tehnic)
poate să nu distingă între două niveluri de luminanţă care diferă cu o
cuantă; acestea sunt valori diferite în semnalul din calculator şi prin
tehnici de îmbunătăţire a imaginii pot fi făcute să difere mult mai mult,
astfel încât să fie depăşit pragul de sesizare a diferenţei.




56

Operatorii de îmbunătăţire a imaginilor pot fi împărţiţi în trei mari
categorii:
• operatori punctuali, prin care se realizează o relaţie de corespondenţă
punctuală între valoarea originală a fiecărui pixel şi valoarea sa după
transformare;
• operatori spaţiali (locali sau de vecinătate), la care noua valoare a
nivelului de gri a unui pixel se obţine din valoarea originală a
pixelului respectiv şi din valorile originale ale unor pixeli din
vecinătatea acestuia;
• operatori integrali, în cazul cărora valoarea nouă a unui pixel depinde
de valorile tuturor pixelilor din imaginea originală, obţinându-se
printr-o transformare integrală a acestora.
Pentru a exemplifica operaţiile de îmbunătăţire a imaginilor, se vor
considera imagini de dimensiuni L×K (cu L linii şi K coloane) şi se va
nota cu U imaginea iniţială şi cu V imaginea îmbunătăţită, rezultată în
urma aplicării unei operaţii sau transformări de îmbunătăţire (T) asupra
imaginii iniţiale:

{ } K k L l k l U U ≤ ≤ ≤ ≤ = 1 , 1 | ) , ( , (3.7)

{ } K k L l k l V V ≤ ≤ ≤ ≤ = 1 , 1 | ) , ( (3.8)

În figura 3.1 se observă că imaginea îmbunătăţită are aceleaşi
dimensiuni ca şi imaginea originală.

57
U
V
V=T(U)
L
K
L
K

Figura 3.1. Operaţia de îmbunătăţire a unei imagini.


3.3. Operatori punctuali de îmbunătăţire a imaginilor

Operatorii punctuali de îmbunătăţire a imaginilor sunt transformări
aplicate asupra nivelurilor de gri, a căror rezultat depinde doar de valoarea
din pixelul considerat. Operatorii punctuali sunt definiţi prin relaţii prin
care se realizează asocieri între valoarea originală a fiecărui pixel şi
valoarea sa după transformare.
u(l,k)
v (l,k)=T(u(l,k))
L
K
V
L
v(l,k)
U
K

Figura 3.2. Operaţia de îmbunătăţire a unei imagini, cu operatori punctuali.

Operatorii punctuali de îmbunătăţire a imaginilor pot fi împărţiţi în:
1) operatori de modificare a contrastului (engl. contrast streching);
2) transformări de decupare (engl. clipping, slicing, thresholding);
3) operatori de modificare a histogramei.
58

3.3.1. Operatori punctuali de modificare a contrastului

Operaţiile de modificare a contrastului urmăresc mărirea sau
micşorarea intervalului de niveluri de gri ocupat de anumite componente
ale imaginii, păstrând acelaşi număr total de niveluri de gri (N).


Negativarea imaginii

Cea mai simplă operaţie de modificare a contrastului este
negativarea imaginii, definită de ecuaţia:
) , ( ) , (
.
k l u N k l v
def
− = , (3.9)

unde N este numărul de niveluri de cuantizare (de gri).

Contrastul relativ perceput de un observator uman este modificat,
ca urmare a diferenţei de sensibilitate între percepţia nuanţelor întunecate
şi luminoase. Exemplul cel mai simplu de aplicare este percepţia unei
radiografii de către un observator nespecialist: contrastul va fi apreciat ca
mult mai bun pentru imaginea negativată, în care avem obiecte de interes
negre pe fond alb.


Diferenţa între imagini

Această operaţie poate fi definită prin relaţia:
) , ( ) , ( ) , (
1 2
.
k l u k l u k l v
def
− = (3.10)

59
Pentru obţinerea unui rezultat cât mai util, ar trebui ca imaginile U
1

şi U
2
să reprezinte aproximativ acelaşi lucru, dar în alte ipostaze (de
exemplu un obiect în mişcare).
Printre domeniile de aplicaţii se poate menţiona angiografia (grafia
vaselor de sânge). În acest scop se achiziţionează o radiografie a
pacientului în stare normală, după care se injectează în vasele sanguine o
substanţă contrastantă în raze X şi se achiziţionează o nouă radiografie.
Prin compararea şi diferenţa celor două radiografii se scot în evidenţă
zonele de interes, potenţial afectate de anumite boli.
Această operaţie poate fi utilizată şi pentru detecţia mişcării în
secvenţe de imagini.


Modificarea liniară a contrastului

Cea mai răspândită tehnică de modificare a contrastului (engl.
contrast streching) este transformarea liniară pe porţiuni. Expresia
analitică a acesteia este:

( )
( )
¦
¦
¦
¦
¹
¦
¦
¦
¦
´
¦
− ≤ ≤ − ⋅
− −
− −
+
≤ ≤ − ⋅


+
≤ ≤
= =
1 ,
1
1
,
0 ,
) (
2 2
2
2
2
2 1 1
1 2
1 2
1
1
1
1
N u u u u
u N
v N
v
u u u u u
u u
v v
v
u u u
u
v
u f v


(3.11)

unde pantele
1
1
u
v
= α ,
1 2
1 2
u u
v v


= β şi
2
2
1
1
u N
v N
− −
− −
= γ , vor determina
variaţiile relative de contrast (figura 3.3).
60
α
O

β
γ
u u
1
u
2
N-1
v
N-1
v
1

v
2


Figura 3.3. Modificarea contrastului.

Astfel se vor obţine niveluri de gri cuprinse între v
1
şi v
2
pentru
valori iniţiale cuprinse între u
1
şi u
2
. Dacă u
2
-u
1
< v
2
-v
1
, se va obţine o
imagine cu un contrast mai mare, iar dacă u
2
-u
1
> v
2
-v
1
se va obţine o
imagine cu un contrast mai slab pentru intervalul central al gamei de
niveluri de gri.
Trebuie avut în vedere faptul că prin modificarea contrastului
dintr-o regiune se modifică contrastul şi în celelalte regiuni. De exemplu,
prin mărirea contrastului în regiunea centrală (u
1
, u
2
), contrastul scade în
celelalte regiuni (0÷u
1
, u
2
÷(N-1)). Se poate realiza şi operaţia inversă,
adică dintr-o imagine cu contrast puternic să se obţină o imagine cu
contrast mai slab.
Din cazul general al modificării de contrast se pot obţine câteva
cazuri particulare de interes. Unul dintre acestea este determinat de
particularizarea v
1
=0 şi v
2
=N-1, şi constă în eliminarea extremelor şi
extinderea maximă a intervalului de niveluri de gri de interes (figura 3.4).
61
u
1
O
u
2
N-1 u

N-1

v


Figura 3.4. Extinderea nivelurilor de gri.

Expresia analitică corespunzătoare este:

( )
¦
¦
¹
¦
¦
´
¦
− ≤ ≤ −
≤ ≤ −


≤ ≤
= =
1 , 1
,
1
0 , 0
) (
2
2 1 1
1 2
1
N u u N
u u u u u
u u
N
u u
u f v



(3.12)

Tot din cazul general al modificării de contrast se mai pot obţine şi
alte cazuri particulare, cum ar fi transformările de decupare. De exemplu,
dacă intervalul central de niveluri de gri este eliminat (u
1
=u
2
), din cazul
prezentat anterior se obţine transformarea de binarizare a imaginilor sau
segmentarea cu prag ("tresholding", figura 3.5) .
u
O
u
N-1
N-1 u
1
= u
2
=T

Figura 3.5. Binarizarea imaginilor.

62
Variantele neliniare de modificare a contrastului sunt compresia (sau
compandarea) şi inversa acesteia, expandarea. Prin compresie se obţine o
variaţie maximă a contrastului în zona nivelurilor de gri apropiate de 0, iar
prin expandare, variaţia maximă a contrastului se obţine în zona
nivelurilor de gri apropiate de N-1. Compresia logaritmică (figura 3.6) este
descrisă de ecuaţia:
( ) ] 1 0 [ , 1 lg
lg
1
,N- u,v u
N
N
v ∈ + ⋅

= (3.13)

Expandarea este descrisă de ecuaţia:
( ) ] 1 0 [ 1
1
1
,N- u,v N
e
e
v
N
u
∈ −


= , (3.14)
v
u O
N-1
N-1

Figura 3.6. Expandarea şi compresia.


3.3.2. Decuparea intervalelor de niveluri de gri

Tehnicile de decupare a intervalelor de niveluri de gri urmăresc
punerea în evidenţă numai a unei porţiuni din gama totală a nivelurilor de
gri disponibile (sau ocupate efectiv de pixelii imaginii). Această punere în
evidenţă este realizată în principiu prin înlocuirea tuturor celorlalte
niveluri de gri cu o valoare constantă.
Transformarea de "clipping" păstrează nemodificat un interval de
niveluri de gri de interes (de exemplu u
1
…u
2
), restul nivelurilor de gri
63
fiind transformate într-o valoare unică, numită fundal (F). Expresia
analitică a acestui operator este:
¦
¹
¦
´
¦
− ≤ ≤
≤ ≤
≤ ≤
= =
1 ,
,
0 ,
) (
2
2 1
1
N u u F
u u u u
u u F
u f v



(3.15)
u N-1 u
2
u
1
N-1
v
v
2
v
1
F
O

Figura 3.7. Decuparea nivelurilor de gri.

Transformarea de decupare ("slicing") pune în evidenţă un interval
de niveluri de gri prin modificarea valorilor nivelurilor de gri la 0 sau N-1,
după cum acestea se situează în afara sau respectiv în interiorul
intervalului considerat (figura 3.8).
u
2
u
1
v
u
O
N-1
N-1

Figura 3.8. Slicing-ul nivelurilor de gri.


64
3.3.3. Modificarea histogramei

Histograma unei imagini este o funcţie ce pune în evidenţă
conţinutul de niveluri de gri al acesteia. Din punct de vedere matematic,
histograma se defineşte ca frecvenţa relativă de apariţie în imagine a
diferitelor niveluri de gri. Dacă considerăm o imagine f, de dimensiune
L×K pixeli şi notăm cu u un nivel de gri şi cu δ impulsul unitar,
histograma se exprimă ca:

( ) | | 1 , 0 , ) , (
1
) (
, 1
, 0
1
0
− ∈ −

=
∑ ∑

=

=
N u u k l f
K L
u h
L
l
K
k
δ (3.16)

Proprietăţile imaginii influenţează forma histogramei sale. O
imagine de tip tablă de şah, formată din pătrate luminoase şi întunecate, în
proporţie relativ egală, va avea o histogramă prezentând două maxime
puternice, localizate în jurul valorilor de 0 şi N-1, şi valori aproape nule în
zona nivelurilor de gri medii. O imagine fotografică subexpusă (şi deci
foarte întunecată) are o histogramă al cărei suport (interval ce corespunde
valorilor nenule) este concentrat spre valoarea 0. O imagine fotografică
supraexpusă (şi deci foarte luminoasă) are o histogramă al cărei suport
este situat în zona valorilor apropiat de N-1. O imagine bine contrastată, ce
prezintă numeroase nuanţe, va avea o histogramă al cărei suport va
acoperi aproape întreaga gamă de niveluri de gri posibile şi a cărei formă
va fi neregulată.
Reciproc, inspecţia formei unei histograme poate oferi informaţii
despre caracteristicile imaginii, dar nu o poate individualiza, deoarece mai
multe imagini pot avea aceeaşi histogramă.
Această comportare corespunde faptului că histograma se comportă
ca o funcţie de densitate de probabilitate a unei variabile aleatoare ale
cărei realizări particulare sunt valorile nivelurilor de gri din imagine.
65
Într-adevăr, h(u)>0, ∀u, şi 1 ) (
1
0
=


=
N
n
n h . Orice funcţie de densitate de
probabilitate are asociată o funcţie de repartiţie. În cazul histogramei
imaginilor, această funcţie de repartiţie este histograma cumulativă:

| | 1 ; 0 , ) ( ) ( − ∈ =

=
N u n h u H
u
o n
(3.17)

Imaginea ideală ar trebui să prezinte o distribuţie uniformă a
nivelurilor de gri şi un contrast repartizat regulat în întreaga gamă
dinamică. Pentru a obţine o asemenea imagine, operatorul de îmbunătăţire
trebuie să transforme histograma originală a imaginii într-o histogramă
uniformă, în care toate nivelurile de gri sunt egal probabile. Din punct de
vedere matematic, problema se reduce la a transforma o funcţie de
densitate de probabilitate oarecare într-o funcţie de densitate de
probabilitate uniformă (constantă pe intervalul de definiţie [0,N-1]).
Ţinând cont de teoria variabilelor aleatoare (funcţie de o variabilă
aleatoare) şi de faptul că variabila aleatoare “nivel de gri” este discretă,
formula de transformare a nivelului de gri u pentru egalizarea de
histogramă este:
( )

+ − ⋅


= 5 , 0 1
) 0 ( 1
) 0 ( ) (
int N
H
H u H
v (3.18)
unde ”int[ ]” este operatorul parte întreagă, iar H este histograma
cumulativă definită anterior.

Exemplu: Considerând o imagine de 64×64 pixeli, reprezentată cu
8 niveluri de gri (0…7), a cărei histogramă este dată în tabelul următor
(căruia îi corespunde figura 3.9), să se realizeze egalizarea de histogramă.
66
Nivelul
de gri
Nr. de pixeli
având acest
nivel de gri
0 796
1 1023
2 850
3 650
4 329
5 245
6 122
7 81

0
200
400
600
800
1000
1200
1 2 3 4 5 6 7 8
nivelul de gri
N
r
.

d
e

p
i
x
e
l
i


Figura 3.9. Histograma unei imagini.

Rezultatele obţinute în urma egalizării, pe baza relaţiilor de
definiţie sunt cumulate în următorul tabel:
Tabelul 3.1.
Imaginea iniţială Imaginea transformată
Nivel
de
gri
Nr. de
pixeli cu
nivelul
de gri i
h(i) Histograma
cumulativă
pt. nivelul
de gri i
Nivelul de
gri
transformat
conform
egalizării de
histogramă
Numărul de
pixeli
corespunzător
nivelului de
gri
transformat
Transformarea
nivelului de
gri
0 796 0,194 0,194 0 796 0-0
1 1023 0,249 0,443 2 0 1-2
2 850 0,208 0,651 4 1023 2-4
3 650 0,159 0,81 5 0 3-5
4 329 0,08 0,89 6 850 4-6
5 245 0,06 0,95 7 650 5-7
6 122 0,031 0,981 7 329 6-7
7 81 0,019 1 7 448 7-7
67

Histograma "egalizată" este deci (figura 3.10):

0
200
400
600
800
1000
1200
1 2 3 4 5 6 7 8
n
r

d
e

p
i
x
e
l
i
0 1 2 3 4 5 6 7

Figura 3.10. Histograma egalizată.

Din graficul prezentat se observă că histograma obţinută nu este
"uniformă" şi prezintă numeroase niveluri de gri lipsă ("găuri"). Aceste
efecte sunt datorate în general cuantizării nivelurilor de gri şi limitării prin
trunchiere a domeniului de variaţie a valorilor (formula de transformare
este dedusă pentru variabile aleatoare cu variaţie continuă). Pentru
corectare au fost propuse mai multe abordări: limitarea maximelor
histogramei, mutarea aleatoare a valorilor pixelilor situate pe niveluri de
gri mai bine reprezentate în histogramă pe niveluri de gri absente, etc.
Trebuie de asemenea remarcat faptul că egalizarea de histogramă nu
asigură în toate cazurile cea mai bună calitate vizuală a imaginii
transformate.
Egalizarea de histogramă şi tehnicile înrudite de specificare a
histogramei asigură mărirea contrastului imaginii prin redistribuirea
nivelurilor de gri în cadrul gamei dinamice fixate, [0,N-1]. Sensibilitatea
sistemului vizual uman este însă mult mai mare în gama color decât în cea
a nivelurilor de gri. De aceea una dintre tehnicile cele mai populare de
realizare a unei vizibilităţi maxime a anumitor componente dintr-o
imagine este colorarea lor cu culori puternic contrastante, adică prin
pseudocolorare.
În cazul aplicării tehnicii de pseudocolorare, imaginea va fi afişată
(vizualizată) cu o tabelă de culoare diferită de paleta originală de niveluri
68
de gri. Această nouă paletă de culoare poate fi construită după orice fel de
reguli care să corespundă problemei de rezolvat: de exemplu, toţi pixelii al
căror nivel de gri este 250 vor fi afişaţi cu roşu şi toţi pixelii al căror nivel
de gri este cuprins între 100 şi 120 vor fi afişaţi cu verde. Se pot introduce
şi condiţii relative la poziţia spaţială a pixelilor sau la alte caracteristici
locale ale acestora.
Schema generală a unei operaţii de pseudocolorare este detaliată în
figura 3.10.
index R G B
Paletă de culori
Display
Imagine
iniţială
Bloc de
extragere
caracteristici

Figura 3.10. Schema unui sistem de pseudocolorare.


3.4. Operatori liniari de vecinătate pentru îmbunătăţirea
imaginilor. Filtrarea liniară a imaginilor

Spre deosebire de operatorii punctuali, operatorii de vecinătate
(numiţi şi operatori spaţiali locali) determină valoarea nouă a unui pixel ca
o funcţie de valorile pixelilor dintr-o vecinătate a sa. Dacă această funcţie
(de mai multe variabile) este liniară, atunci operatorul se numeşte liniar.
Se va nota cu u(l,k) imaginea iniţială (de intrare), cu l=1,…,L,
k=1,…,K, cu v(l,k) imaginea rezultată (de ieşire) şi cu a(i,j), funcţia
pondere a sistemului, i=1,…L, j=1,…,K.
Operatorii liniari de vecinătate se implementează, în general, prin
convoluţia imaginii iniţiale cu funcţia pondere a unui filtru cu răspuns
finit, numit mască spaţială, adică prin aplicarea unui asemenea operator se
realizează practic o filtrare bidimensională. Această filtrare este obţinută
69
prin tehnica "ferestrei glisante" (moving-window), iar fereastra ce
culisează peste imagine se mai numeşte şi mască spaţială sau filtru
bidimensional şi are rolul de a selecta vecinătatea pixelului curent asupra
căruia operează filtrul respectiv.
Expresia analitică a acestei operaţii este:

∑∑

− − ⋅ =
W j i
k k i l u j i a k l v
) , (
) , ( ) , ( ) , ( (3.19)

unde u şi v sunt imaginile de intrare, respectiv de ieşire, iar a sunt
coeficienţii ferestrei (măştii) de filtrare W, care are dimensiuni mai mici
decât imaginile asupra cărora acţionează.
După cum se observă, aceasta este de fapt o convoluţie: v=a*u,
între funcţia pondere a unui filtru cu răspuns finit (a) şi imaginea de
intrare, iniţială (u). Aceasta se poate exprima ca un produs punct cu punct
între coeficienţii măştii şi o porţiune din imagine, de aceeaşi dimensiune.
Tehnica ferestrei glisante constă în efectuarea următoarelor
operaţii:
• Se defineşte fereastra de filtrare adică:
forma (relativ la o origine);
coeficienţii din fiecare punct;
• Fereastra glisează peste imaginea iniţială, adică se pune originea
ferestrei în fiecare punct al imaginii. Astfel va fi selectat de către
fereastră pixelul curent şi pixelii din vecinătatea acestuia.
• Se face produsul punct cu punct între valoarea pixelilor din imagine
selectaţi de fereastră şi coeficienţii ferestrei.
• Se înlocuieşte pixelul curent cu noua valoare obţinută, ca sumă a
produselor obţinute la punctul anterior.

De regulă, filtrele folosite sunt de ordin impar, rectangulare şi au
originea (0,0) în centrul suportului:

70
a
-1-1
a
-10
a
-11
a
0-1
a
00
a
01
a
1-1
a
10
a
11

Problemele care se ridică la aplicarea acestor operatori se referă la:
• Marginile imaginii, aici având 2 posibilităţi:
obţinerea unei imagini de dimensiuni mai mici, atunci
când glisarea începe din interiorul imaginii
bordarea imaginii de intrare pentru a păstra aceleaşi
dimensiuni pentru imaginea prelucrată
• Numărul de operaţii necesare pentru fiecare punct. Pentru o fereastră
pătrată cu latura n sunt necesare: n
2
înmulţiri şi n
2
-1 adunări. În
concluzie, din punct de vedere al volumului de calcule, este mai bine
să se lucreze cu ferestre cât mai mici.
Filtrele bidimensionale folosite uzual în prelucrarea imaginilor sunt
nuclee cu suporturi de dimensiuni mici: 3×3, 5×5. Filtrele de dimensiuni
mai mari se pot reduce adesea la aplicarea repetată asupra unei imagini a
unor nuclee de dimensiuni mai mici.
Nucleele pătrate de dimensiuni 3×3 sunt cele mai utilizate.
Exemple de astfel de nuclee sunt:


1 1 1
1 1 1
1 1 1
9
1


0 1 0
1 4 1
0 1 0
8
1
(3.20)
(a) (b)

Filtrul (a) realizează media între pixelul central şi vecinii săi, iar
filtrul (b) realizează media ponderată între pixelul central şi vecinii săi
verticali şi orizontali.
71
Forma şi coeficienţii ferestrei se aleg astfel încât să corespundă
aplicaţiei concrete. Singura constrângere în ceea ce priveşte coeficienţii
ferestrei, pentru filtrele de mediere (al căror efect este de FTJ) este:

∑ ∑

=
w j i
j i a
) , (
1 ) , ( , pentru a nu modifica regiunile uniforme. (3.21)

În cazul în care coeficienţii ferestrei îndeplinesc condiţia din relaţia
(3.21) efectul filtrului (ferestrei de filtrare) este un efect de netezire. În
cazul în care coeficienţii ferestrei îndeplinesc relaţia:

∑ ∑

=
w j i
j i a
) , (
0 ) , ( (3.22)

efectul filtrului (ferestrei de filtrare) este un efect de reliefare
(accentuare sau contrastare), respectiv de filtru trece-sus.
Exemple de filtre de reliefare sunt:

| |


− −

0 1 0
1 4 1
0 1 0
| |

− − −
− −
− − −
1 1 1
1 8 1
1 1 1
| |


− −

1 2 1
2 4 2
1 2 1
(3.23)

Medierea efectuată cu ajutorul operatorilor liniari de vecinătate
poate fi utilă la reducerea zgomotului aditiv gaussian şi mai puţin a
zgomotului impulsiv, de tip salt and pepper (engl.= "sare şi piper").
Aplicarea unui filtru de mediere asupra unei imagini afectată de zgomot
impulsiv sau gaussian are ca rezultat extinderea punctelor cu zgomot
(formarea de pete), respectiv apariţia efectului de bluring sau mânjeală
(neclar, ceţos), ca efect special dorit sau ca o consecinţă nedorită a
reducerii zgomotului. Aceste efecte au ca rezultat nedorit reducerea
clarităţii imaginii filtrate, ceea ce poate produce dificultăţi suplimentare în
72
etapele ulterioare de prelucrare a imaginii (segmentare, detecţie de contur,
recunoaştere de forme etc.).
O primă modalitate de reducere a efectului de bluring este
ponderarea pixelilor mediaţi în funcţie de distanţa faţă de centrul ferestrei:

∑ ∑

− − ⋅ =
W (i,j)
j) i,k u(l c(i,j) v(l,k) (3.24)

unde c(i,j) sunt coeficienţii cu care se face ponderarea pixelilor din
fereastra W. Valorile acestor coeficienţi c respectă în general o anumită
distribuţie spaţială, cel mai adesea fiind utilizată distribuţia gaussiană.
Filtrul este cunoscut în acest caz, sub denumirea de filtru gaussian.
O variantă îmbunătăţită pentru reducerea efectului de bluring o
constituie filtrul de netezire cu prag, care nu mai este liniar.
Particularitatea sa constă în faptul că înlocuirea valorii pixelului curent cu
media ponderată a vecinilor săi se face doar dacă este satisfăcută condiţia:

T k l u k l v < − ) , ( ) , ( (3.25)

unde T este un prag de decizie ales astfel încât să fie protejate
tranziţiile din imaginea iniţială faţă de efectul de bluring. Rezultatele
acestei metode sunt bune, dar apare problema selecţiei automate a
pragului T.








73
3.5. Efectul în frecvenţă al operatorilor liniari de vecinătate

După cum s-a arătat mai sus, aplicarea unui filtru de mediere se
face prin convoluţia între imaginea iniţială u şi funcţia pondere a filtrului
h:
v = h*u (3.26)

Coeficienţii ferestrei sunt egali şi se ştie că transformata Fourier a
unei constante este un sinc (figura 3.11):
y
x

Figura 3.11. Transformata Fourier a unei constante.

Dacă se notează cu U, V şi H transformatele Fourier ale imaginilor
de intrare, respectiv de ieşire şi a filtrului, din relaţia anterioară şi din
teorema convoluţiei rezultă că:

V=H⋅U (3.27)

iar caracterizarea în frecvenţă a acţiunii filtrului se poate face pe
baza lui H. Transformata Fourier a unui filtru de mediere cu coeficienţi
constanţi (figura 3.12.a) este un sinc bidimensional (figura 3.12.b):
74
F
z
y
x
z
y
x

(a) (b)
Figura 3.12. Transformata Fourier a unui filtru de mediere cu coeficienţi
constanţi.

Prin urmare, medierea spaţială este echivalentă cu o filtrare
trece-jos (figura 3.13):

Mediere
spaţială
u v
FTJ
u v


Figura 3.13. Medierea spaţială.

Celelalte tipuri de filtre (în frecvenţă) se pot obţine cu un FTJ.
Astfel, dacă h
TJ
(m,n) este funcţia de transfer a unui FTJ atunci un filtru
trece-sus FTS va avea o funcţie de transfer h
TS
(m,n):

) , ( ) , ( ) , ( k l h k l k l h
TJ TS
− = δ (3.28)

unde δ este impulsul Dirac.
Deci, un FTS se poate implementa prin scăderea din imaginea
iniţială a imaginii obţinute printr-un FTJ (figura 3.14):

75
FTS
u v

FTJ
u v
+
-

Figura 3.14. Obţinerea unui FTS cu ajutorul unui FTJ.

La fel, un filtru trece-bandă FTB poate fi caracterizat prin relaţia:

) , ( ) , ( ) , (
2 1
k l h k l h k l h
TJ TJ TB
− = (3.29)

unde h
TJ1
şi h
TJ2
sunt funcţii de transfer a două FTJ. Deci un FTB se
poate obţine din 2 FTJ astfel (figura 3.15):
u
FTB
v

FTJ
h
TJ1
(l,k)
FTJ
h
TJ2
(l,k)
u
v
+
-

Figura 3.15. Obţinerea unui FTB cu ajutorul a două FTJ.

Filtrarea trece-jos se utilizează pentru atenuarea zgomotului,
filtrarea trece-bandă se foloseşte pentru extragerea sau accentuarea
contururilor, iar filtrarea trece-sus este utilă pentru îmbunătăţirea
contururilor sau a altor caracteristici de tip trece-sus ale unei imagini, în
prezenţa zgomotului.
Pe baza acestor considerente, pentru îmbunătăţirea imaginilor se
pot defini şi operatori integrali (numiţi si transformări integrale) în cazul
cărora noua valoare într-un punct depinde de valoarea întregii imagini
76
iniţiale. Folosirea transformărilor integrale mută problema într-un plan
dual planului imaginii şi anume planul frecvenţelor spaţiale.
Repartiţia spaţială a spectrului diferă de la o transformare la alta:
FTJ FTJ
FTB FTB
FTS
FTB FTB

Figura 3.16. Exemplu de repartiţie spaţială a spectrului unei imagini.

Exemple de transformări (Fourier, Cosinus) vor fi prezentate în
capitolul referitor la transformări integrale ale imaginilor.


3.6. Filtrarea neliniară a imaginilor

Filtrele liniare (de netezire sau contrastare) produc la ieşire, în
fiecare punct al imaginii, o combinaţie liniară ponderată a setului de valori
selectate de fereastra de filtrare plasată cu originea în acel punct. Filtrele
liniare pot elimina zgomote care corespund acestui model de mediere, deci
zgomote aditive şi cu distribuţie normală (gaussiană). Din această
comportare de tip filtru trece-jos rezultă efecte secundare care se
manifestă prin reducerea sau eliminarea din imagine a componentelor de
frecvenţă înaltă (detalii, contururi). Imaginea îşi pierde claritatea şi devine
mai “ceţoasă” (efect de blur). În acelaşi timp, filtrarea liniară a unor
zgomote ne-aditive (de exemplu zgomotul impulsiv) produce rezultate
deranjante din punct de vedere al calităţii imaginii (în particular lăţirea şi
împrăştierea impulsurilor de zgomot).

77

3.6.1. Filtre neliniare de ordine

Pentru eliminarea dezavantajelor filtrelor liniare apare evidentă
necesitatea de a modifica structura de filtrare liniară, în care valoarea unui
pixel nu este luată în considerare, tocmai printr-o triere a valorilor extrase
de fereastra de filtrare, în funcţie de rangul sau importanţa lor. Evident,
operaţia devine neliniară, întrucât se va baza pe compararea şi ordonarea
valorilor. Acesta este modelul de filtrare de ordonare (rank-order filter),
fără a fi însă singurul tip de filtrare neliniară.
Dacă se notează cu: X={x
1
,x
2
,…, x
N
}, cele N valori extrase de o
fereastră de filtrare pentru o poziţie dată, setul de valori ordonate este:
X
()
={x
(1)
,x
(2)
,…,x
(N)
}, cu x
(1)
≤x
(2)
≤…≤x
(N)
. Scalarul x
(k)
se numeşte statistica
de ordine de ordinul k (sau pe scurt, statistica de ordin k) a secvenţei X.
Evident, statistica de ordinul 1 este minimul, iar statistica de ordinul N
este maximul:
x
(1)
= min X
()
= min X (echivalentul unei erodări morfologice) (3.30)
x
(N)
= max X
()
= max X (echivalentul unei dilatări morfologice)

Considerând ca exemplu setul de 5 valori: X={1, 10, 100, 10, 200},
rezultă: x
1
=1, x
2
=10, x
3
=100, x
4
=10, x
5
=200. Setul ordonat este:
X
()
={1,10,10,100,200}, iar statisticile de ordine sunt: x
(1)
=1, x
(2)
=10,
x
(3)
=10, x
(4)
=100, x
(5)
=200.
Ieşirea de ordinul k a filtrului de ordine este statistica de ordin k a
setului de valori selectate de fereastra de filtrare, k putând lua orice
valoare între 1 şi N:

rank
k
(X)=x
(k)
(3.31)

78
Cel mai utilizat filtru de ordine este filtrul median, caracterizat de:

+
=
2
1 N
k , (unde [x]= partea întreagă a lui x) adică ieşirea filtrului
median este statistica de ordine situată în centrul secvenţei ordonate.
Considerând, de exemplu, setul de 9 valori extrase de fereastra de
filtrare (N=9), X={70,200,201,75,75,198,199,255,80}, ieşirea filtrului
median va fi statistica de ordinul

+
=
2
1 9
k =[5]=5.
Setul de valori ordonate este:
X
()
={70,75,75,80,198,199,200,201,255}.
Ieşirea filtrului median este, în acest caz: x
(5)
=198.

Se presupune că valorile anterioare sunt nivelurile de gri dintr-o
imagine. Atunci pixelii de valori 70,75,79,80 sunt gri-închis, pixelii de
valori 198,199,200,201 au o culoare de tip alb-murdar, iar pixelul de
valoare 255 este alb-strălucitor (figura 3.17).





Figura 3.17. Exemplu de filtrare mediană.

Dacă acest punct ar fi centrul ferestrei de filtrare, după filtrare el
trebuie înlocuit cu ieşirea filtrului, deci cu 198. Rezultatul este deci
eliminarea punctului a cărui valoare este extremă faţă de celelalte (sau
eliminarea impulsului de zgomot). Spre comparaţie, rezultatul filtrului de
mediere pentru aceleaşi date este 150 (deci o valoare ce nu corespunde
nici unuia dintre valorile pixelilor imaginii).
La nivelul întregii imagini, aplicarea filtrului median nu modifică
în mod esenţial structura de contururi (frontiere) caracteristică obiectelor.
Este însă posibil ca anumite detalii fine (sau obiecte extrem de mici, de
79
dimensiune inferioară ferestrei de filtrare) să fie eliminate. Capacitatea
unui filtru de a nu modifica anumite structuri de semnal, constituie o
caracteristică deterministă a acestuia şi este exprimată de semnalele
rădăcină (semnalele care nu sunt modificate la trecerea prin filtru). Pentru
un filtru median, semnalele rădăcină sunt compuse din paliere constante şi
rampe monotone, de lungime mai mare decât dimensiunea ferestrei de
filtrare. Un semnal rădăcină se poate obţine prin filtrarea repetată (până la
obţinerea invarianţei) a unui semnal oarecare.


3.6.2. Filtre de ordine multi-etaj

Filtrele de ordine multietaj iterează mai multe etape de filtrare de
ordine, realizate eventual în ferestre de filtrare de formă şi orientare
diferită. Un asemenea filtru este filtrul MIN/MAX-Median. Acesta se
compune dintr-un prim etaj de 4 filtre mediane cu ferestre direcţionale, ale
căror ieşiri sunt preluate de un filtru de minim sau maxim. Dacă se
consideră o fereastră 3×3 în care valorile pixelilor sunt notate:

x
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9


ieşirea filtrului multietaj va fi:
max(med(x
4
,x
5
,x
6
),med(x
2
,x
5
,x
8
), med(x
1
,x
5
,x
9
), med(x
3
,x
5
,x
7
)) (3.32)
80
MAX
(sau MIN)

Figura 3.18. Filtru multi-etaj.

Efectul acestui filtru este mai bun decât a unui filtru median,
deoarece se obţine un contrast mai bun, datorită filtrului extrem (max sau
min), cu excepţia liniilor de zgomot, care trec prin filtrele mediane.
Se poate arăta că filtrele de ordine pentru prelucrarea imaginilor cu
niveluri de gri, pot fi dispuse sub forma unei stive, prelucrarea putându-se
face independent pe fiecare nivel al stivei, suma rezultatelor fiind egală cu
rezultatul filtrului compus obţinut prin însumarea filtrelor din stivă. Acest
fapt are avantajul posibilităţii de implementare paralelă a filtrelor de
ordine şi posibilitatea de implementare hardware a acestora, obţinându-se
o viteză mare de calcul şi o paralelizare a calculelor. Dezavantajul acestor
filtre îl constituie cantitatea mai mare de memorie necesară în procesul de
sortare.
La implementarea filtrelor de ordine, printre cele mai utilizate
tehnici de sortare se numără metoda bubble-sort şi divide et impera.






81

3.6.3. Proprietăţi ale filtrelor de ordine

1. Invarianţa la translaţie
Filtrarea de ordine a unui semnal x translatat cu b şi scalat cu a
este:
b x rank a b x a rank
k k
+ ⋅ → + ⋅ ) ( ) ( (3.33)
2. Filtrele de ordine păstrează caracteristicile semnalului, adică nu
prezintă overshoot sau undershoot. Prin urmare, valoarea obţinută
prin filtrare nu este în afara domeniului de intrare, fiind una din
valorile de intrare.
3. Filtrele de ordine admit semnale rădăcină.
Un semnal rădăcină este invariant la filtrarea de ordine (rămâne
nemodificat).
Teoremă: Orice secvenţă monotonă (crescătoare sau
descrescătoare) este un semnal rădăcină al filtrelor de ordine.
În practică, un semnal rădăcină se obţine prin filtrarea de ordine a
unui semnal oarecare, până se obţine un semnal care nu se mai
modifică.
Exemplu:
Prin aplicarea unui filtru median unidimensional de lungime
N=3 (figura 3.19.b), cu originea în centru, asupra semnalului
(figura 3.19.a):
2
1
3
N=3
(a) (b)

Figura 3.19. Exemplu de obţinere a unui semnal rădăcină.

după prima iteraţie se obţine semnalul:
82


Figura 3.20. Rezultatul după prima iteraţie a filtrării de ordine.

iar după a doua iteraţie se obţine semnalul:


Figura 3.20. Rezultatul după a doua iteraţie a filtrării de ordine.

După cum se observă, după a treia iteraţie se obţine un semnal
monoton pe porţiuni, care dacă mai este filtrat o dată, nu se modifică, deci
este un semnal rădăcină pentru un filtru median unidimensional de
lungime 3.

O limitare a structurilor de filtrare neliniară bazată pe ordonare este
relativa lor lipsă de flexibilitate: există doar N filtre de ordine diferite,
dintre care doar filtrul median este un filtru de netezire. O structură de
filtrare mai flexibilă trebuie să permită reglarea gradului de netezire (sau
respectiv de reliefare) între limite fixate. Astfel de filtre sunt filtrele de
domeniu LUM (Lower-Upper-Middle).






83

3.6.4. Filtre de ordine de domeniu

Filtrul de ordine LUM (Lower-Upper-Middle) de netezire, de ordin
k, se defineşte prin:
{ }
) 1 ( ) (
*, ,
+ −
=
k N k
x x x y med , (3.34)
unde
2
1
1
+
≤ ≤
N
k , iar x
*
reprezintă valoarea eşantionului central
(din originea ferestrei):


¦
¹
¦
´
¦
>
<
=
+ − + −
rest în *,
* ,
* ,
) 1 ( ) 1 (
) ( ) (
x
x x x
x x x
y
k N k N
k k
(3.35)

Netezirea este creată prin compararea eşantionului central x
*
cu
două statistici de ordin superior şi inferior (x
(k)
, x
(N-k+1)
) şi înlocuirea sa cu
un eşantion mai apropiat de mediană, dacă x* nu se încadrează în acest
interval de valori „normale” (figura 3.21).
x
(k)
x
(1)

x
(N)

x
(N-k+1)



Figura 3.21. Filtru LUM de netezire.

Gradul de netezire este variabil în funcţie de k.
Cazurile extreme ale acestui tip de filtru sunt:
• pentru:
2
1 +
=
N
k = filtru median
• pentru: k = 1 = filtru de tip trece-tot
84
Prin aplicarea unui filtru LUM de netezire se reduce contrastul
imaginii.
Perechea filtrului LUM de netezire este filtrul LUM de reliefare
(sau conturare), pentru care ieşirea filtrului este deplasată către una din
statisticile extreme (inferioară sau superioară).
Filtrul LUM de reliefare se defineşte prin:
¦
¦
¦
¹
¦
¦
¦
´
¦
≤ <
+
+
≤ <
=
+ −
+ −
+ −
+ −
rest în *,
*
2
,
2
* ,
) 1 (
) 1 ( ) (
) 1 (
) 1 ( ) (
) ( ) (
x
x x
x x
x
x x
x x x
y
r N
r N r
r N
r N r
r r
, (3.36)
unde:
2
1
1
+
≤ ≤
N
r .
Reliefarea apare ca urmare a deplasării eşantioanelor din intervalul
x
(r)
÷ x
(N-r+1)
(interpretat ca zonă de tranziţie) spre una din extremităţi
(figura 3.22):
x
(N-r+1)

x
(r) x
(1)

x
(N)
2
) 1 ( ) ( + −
+
r N r
x x


Figura 3.21. Filtru LUM de reliefare.

Gradul de reliefare poate varia în funcţie de parametrul r, de la:
2
1 +
=
N
r (filtrul identitate) până la reliefare maximă, pentru r=1.
Prin aplicarea unui filtru LUM de reliefare se obţine o mărire a
contrastului.


85

3.6.5. L-filtre

Un filtru a cărui ieşire este o medie ponderată a statisticilor din
fereastra filtrului se mai numeşte şi L–filtru şi este de forma:

=
⋅ =
N
k
k
x a y
k
1
) (
, (3.37)
unde y este ieşirea filtrului, x
(k)
sunt eşantioanele din fereastra de
filtrare ordonate crescător, iar a
k
sunt coeficienţii de ponderare.
Coeficienţii de ponderare îndeplinesc aceleaşi condiţii de
normalizare ca şi pentru un filtru liniar:
1
1
=

=
N
k
k
a , pentru netezire şi 0
1
=

=
N
k
k
a , pentru reliefare. (3.38)

Câteva cazuri particulare ale acestui tip de filtru sunt:
• filtrul de ordine de ordin k (inclusiv filtrul median):
¹
´
¦
≠ =
=
k , j a
a
k
k
0
1
. (3.39)
Elimină zgomotul impulsiv.

• filtrul de mediere, se obţine pentru:
N
a
k
1
= , pentru orice k = 1, 2, ..., N. (3.40)
Elimină zgomotul gaussian.

• extractor de contur:
¹
´
¦
=
− =
1
1
1
N
a
a
(3.41)


86
• filtrul de qvasi-mijloc:
¹
´
¦
=
=
− +
0
1
k
i N i
a
a a
,
2
1
1
+
÷ =
N
i . (3.42)
Elimină zgomote impulsive şi zgomotele uniforme.

• media α-reglabilă (α-trimmed mean):
¦
¹
¦
´
¦
=
⋅ − ⋅ =
− ⋅
=
rest în , 0
] , [ ,
) 2 1 (
1

k
i
a
N N N i
N
a α α
α , (3.43)
unde
|
.
|


2
1
, 0 α .
Elimină zgomote de tip impulsiv şi gaussian.
87

4. Transformări integrale ale imaginilor

În domeniul prelucrărilor de imagini, pe lângă operaţiile punctuale
şi de vecinătate prezentate anterior, se folosesc adesea şi transformări
integrale, al căror rezultat – o altă imagine sau o altă reprezentare a
imaginii originale – are în fiecare punct o valoare ce depinde de valorile
tuturor pixelilor din imagine originală. Transformata Fourier, de exemplu,
transformă o imagine reprezentată prin funcţia f(x,y) de cele două variabile
spaţiale x şi y, în „spectrul Fourier” al imaginii, F(u,v), care este o altă
reprezentare a imaginii originale f(x,y), în planul frecvenţelor spaţiale u şi
v. O filtrare (spaţială) liniară a imaginii f(x,y) cu un filtru a cărui funcţie
pondere h(x,y) este un clopot Gauss, are ca rezultat o altă imagine g(x,y)
obţinută prin convoluţie (bidimensională) din imaginea originală f(x,y):

∫∫
− − ⋅ =
2
) , ( ) , ( ) , (
R
η ξ η ξ η ξ d d y x h f y x g (4.1)
iar sensul fizic al variabilelor lui g este acelaşi cu cel al variabilelor
lui f; f şi g sunt funcţii definite pe acelaşi plan (x,y), spre deosebire de
primul exemplu cu transformata Fourier.


4.1. Transformări integrale unitare

În cazul imaginilor discretizate (definite pe latici de puncte), cum e
cazul imaginilor digitale, transformările integrale sunt transformări ale
unor matrici (tabele 2-dimensionale de scalari, de regulă dreptunghiulare
şi chiar mai mult, pătrate) în matrici de aceleaşi dimensiuni. S-a văzut că
transformările punctuale sunt practic transformări neliniare, iar
transformările spaţiale (de vecinătate) pot fi liniare sau neliniare.
Transformările integrale sunt transformări liniare pentru a avea
88
posibilitatea de a beneficia în modelarea matematică care trebuie făcută,
de aparatul algebrei liniare şi al analizei funcţionale liniare.
În cele de mai jos se vor revedea noţiunile de bază privind
transformările liniare pe spaţii vectoriale finit dimensionale. Se va face
referire la spaţii vectoriale peste mulţimea numerelor complexe C şi
transformări liniare corespunzătoare (reprezentate prin matrici pătrate cu
elemente complexe) fiindcă, chiar începând cu transformata Fourier
discretă, cadrul complex simplifică lucrurile. Din acest motiv se va face
referire la „matrici unitare” şi nu „ortogonale”.
Se va considera spaţiul C
N
al vectorilor N-dimensionali cu
componente din C (deci numere complexe) care reprezintă secvenţe de N
eşantioane ale unui semnal complex (cu o parte reală şi una imaginară).
Orice transformare liniară a lui C
N
în el însuşi se reprezintă printr-o
matrice pătrată A de dimensiune N×N:
) ( ) (
1 , 0 ,
C
N N
N k l
lk
M A a
×
− =
∈ = (4.2)
iar dacă se doreşte ca transformarea să fie inversabilă, atunci
matricea A trebuie să fie inversabilă, adică 0 det ≠ A .
O matrice A este unitară dacă are proprietatea că este inversabilă,
adică există A
-1
astfel încât A·A
-1
= A
-1
·A=I
N
, şi că A
-1
=A
*T
, adică:
N
T T
I A A A A = ⋅ = ⋅
* *
(4.3)
adică inversa ei este chiar transpusa conjugatei sale complexe. În
această relaţie indicele superior T indică operaţia de transpunere a
matricelor (a
lk
→a
kl
), iar indicele superior * indică operaţia de conjugare
complexă (a
lk
→a
kl
*). A*
T
=A
H
se mai numeşte şi transformata Hilbert a
matricii A.
O matrice unitară în spaţii vectoriale peste mulţimea numerelor
reale R (deoarece conjugatul unui număr real este el însuşi) se reduce la
ceea ce se numeşte matrice ortogonală, adică A
-1
=A
T
; matricile ortogonale
generalizează rotaţiile din plan.
89
Un vector
N
C u ∈ , ( )
|
|
|
|
|
|
.
|

\
|
= =

− =
1
0
1 , 0
.
.
.
N
N i
i
u
u
u u , devine prin
transformarea A, vectorul v, dat de relaţia v=A·u, adică:

|
|
|
|
|
|
.
|

\
|

|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
.
|

\
|
− − − −

− 1
0
1 , 1 0 , 1
1 , 0 0 , 0
1
0
.
.
.
. . .
.
.
.
. . .
.
.
.
N N N N
N
N
u
u
a a
a a
v
v
(4.4)
sau pe componente, în scriere scalară:



=
⋅ =
1
0
N
k
k jk j
u a v (4.5)
În cazul imaginilor, dacă se notează imaginea iniţială cu
{ } 1 ,..., 1 , 0 , ); , ( − = = N k l k l u U şi imaginea transformată cu:
{ } 1 ,..., 1 , 0 , ); , ( − = = N n m n m v V , expresiile matriceale ale transformării
sunt mai dificil de scris, deoarece transformarea A trebuie reprezentată
printr-un tablou 4-dimensional (2×2, semnalul de intrare fiind imaginea U
2-dimensională, iar ieşirea fiind V, tot 2-dimensională). În schimb,
scrierea scalară (pe componente) a transformării integrale unitare
bidimensionale directe, respectiv inverse, a imaginii U, se scrie imediat,
prin generalizarea celei precedente:

∑ ∑

=

=
⋅ =
1
0
1
0
) , ( ) , ( ) , (
N
l
N
k
k l
mn
k l n m a u v , respectiv

∑ ∑

=

=

⋅ =
1
0
1
0
) , ( ) , ( ) , (
N
m
N
n
k l
mn
n m k l a v u , (4.6)
unde { } ) , ( k l
mn
a este transformarea unitară.

90
În cazul imaginilor de dimensiuni N×N, numărul operaţiilor
(multiplicări şi adunări) necesare pentru a calcula coeficienţii v(m,n) este
foarte mare, fiind egal cu O(N
4
), adică de ordinul a N
4
. O reducere
substanţială a complexităţii algoritmului se obţine atunci când
transformarea unitară este separabilă, adică:
) ( ) ( ) , ( k
n
l
m
k l
mn
b a a ⋅ = (4.7)

unde: { } ) (l
m
a A = şi { } ) (k b B
n
= , sunt de asemenea matrici
unitare. În acest caz:


∑ ∑ ∑ ∑

=

=

=

=
⋅ = ⋅ ⋅ = ⇒
1
0
) , ( ) (
1
0
) (
1
0
1
0
) , ( ) ( ) ( ) , (
N
k
k l k
n
N
l
l
m
N
l
N
k
k l k
n
l
m
n m u b a u b a v (4.8)

După cum se observă, în cazul în care transformarea este
separabilă, algoritmul este mai simplu, complexitatea sa scăzând la O(N
3
).
În acest caz, relaţia transformării directe, respectiv inverse, se poate scrie
şi sub formă matricială:

T
B U A V ⋅ ⋅ = , respectiv
∗ ∗
⋅ ⋅ = B V A U
T
(4.9)

Dacă se defineşte energia unui semnal bidimensional u, ca fiind:
∑ ∑

=

=
=
1
0
1
0
2
) , (
N
l
N
k
k l
u
u E (4.10)
se poate arăta că principala proprietate a transformărilor integrale
unitare este aceea de conservare a energiei: E
u
=E
v
.

Transformările integrale unitare se pot folosi pentru filtrarea şi
pentru compresia imaginilor.
• Filtrarea: Se presupune că se doreşte o filtrare integrală liniară a unei
imagini, adică cu un filtru a cărui funcţie pondere liniară se extinde pe
91
toată imaginea. Operaţia de convoluţie spaţială a unei imagini N×N
(cu funcţia pondere tot de suport N×N) necesită N
4
operaţii de
înmulţire. Dacă, aşa cum este cazul transformării Fourier discrete,
transformarea are algoritm rapid şi este separabilă, iar echivalentul
convoluţiei este o operaţie punctuală (pentru fiecare pixel avem de
făcut o înmulţire), numărul de operaţii necesare este de ordinul a
N
2
·log
2
N. Pentru N=1000, adică pentru imagini de 1000×1000 pixeli,
raportul N
4
/N
2
·log
2
N devine 10
5
adică filtrarea care ar dura 24 ore în
mod normal, prin acest procedeu se realizează într-o secundă.
• Compresia: Spre deosebire de reprezentarea unei imagini prin
eşantioanele sale spaţiale (în număr de N
2
) care, în principiu, într-o
primă aproximaţie sunt variabile aleatoare independente şi uniform
distribuite pe intervalul valorilor posibile [0,M-1], M-1 fiind valoarea
maximă, reprezentarea imaginii prin valorile coeficienţilor
transformatei (tot în număr de N
2
) este o reprezentare prin mărimi cu
proprietăţi extrem de neuniforme: câţiva coeficienţi sunt foarte mari,
iar majoritatea sunt neglijabil de mici. Transmisiei lor li se poate aplica
o codare Huffman (pentru a obţine o codare fără pierderi), dar dacă
unii coeficienţi sunt foarte mici, ei se pot neglija, pur şi simplu. În
acest caz, etapele transmisiei sunt schiţate în figura 4.1.
T
-1

. . .
. …
U
ˆ
.
....

V
ˆ

T
.......

V
. .
. . .
U. .
canal
fără
pierderi
…V
ˆ


0
trunchiere

Figura 4.1. Compresia cu transformate.

În procesul de compresie cu transformate se porneşte de la o
imagine iniţială U. Acesteia i se aplică o transformare T în urma căreia
se obţine o imagine V la care informaţia este concentrată în mult mai
puţine componente decât în imaginea iniţială.
92
Canalul de transmisie poate fi presupus fără pierderi deoarece se
pot folosi coduri cu corecţie de erori. Câştigul (reducerea numărului de
eşantioane transmise) s-a obţinut prin trunchierea imaginii V prin
eliminarea componentelor cu coeficienţi foarte mici (sub un anumit
prag). La recepţie se obţine o imagine V
ˆ
care aproximează imaginea V.
Dacă acestei imagini i se aplică transformarea inversă lui T (T
-1
) se va
obţine o imagine U
ˆ
care este de dorit a fi cât mai apropiată de
imaginea iniţială U.

Un astfel de lanţ de compresie este cu atât mai bun cu cât:
• eroarea (diferenţa) dintre U
ˆ
şi U este mai mică, relativ la un anumit
criteriu, care de cele mai multe ori este eroarea medie pătratică:

∑ ∑

=

=

1
0
1
0
2
) , (
ˆ
) , (
L
l
K
k
k l U k l U =minimă (4.11)
• factorul de compresie este mai mare. Factorul de compresie (C) se
defineşte ca fiind raportul dintre numărul componentelor imaginii
iniţiale (L×K) şi numărul componentelor din u, reţinute în imaginea v:

u din retinute lor componente nr
K L
C
.
×
= (4.12)

Transformarea optimă din punct de vedere al compresiei este
transformarea K-L (Karhunen-Loeve). Aceasta realizează decorelarea
elementelor transformatei şi prin aceasta compactarea maximă a energiei
semnalului (imaginii) în primele componente. Cu toate aceste avantaje,
deoarece transformata K-L depinde de statistica imaginii şi datorită
volumului mare de calcule necesare (mai ales în cazul imaginilor de
dimensiuni mari), transformata K–L este dificil de implementat practic.
Totuşi, pentru imagini cu corelaţie mare, transformata K-L se poate
aproxima cu succes prin transformata Cosinus Discretă (DCT=Discrete
Cosine Transform) mult mai rapidă şi mai uşor de implementat şi care va
fi prezentată în continuare.
93



4.2. Matrici unitare

Implementarea transformărilor integrale unitare a imaginilor se
face utilizând matrici unitare.
Fie o matrice pătrată, cu elemente complexe: ( )
1 , 0
1 , 0
− =
− =
=
k k
l l
lk
a A ,
unde C ∈
lk
a .
Spunem că matricea ) (C
N N
A
×
∈M este unitară dacă:

¦
¹
¦
´
¦
= ⋅
= ⋅
N
T
N
T
I A A
I A A
*
*
, (4.13)
unde
H
not
T
A A
.
*
= este transformata Hilbert a matricii A.
Sistemul de mai sus este echivalent cu relaţia:
T
A A
* 1
=

. Notând
1 , 0 ,
) (
− =
=
N k l
lk
a A , condiţiile (4.9) se pot scrie:
¦
¦
¹
¦
¦
´
¦
¹
´
¦

=
= − = ⋅
¹
´
¦

=
= − = ⋅




=

=
1
0
*
'
1
0
*
'
' . , 0
' . , 1
) ' (
' . , 0
' . , 1
) ' (
N
k
k l lk
N
l
lk lk
k k pt
k k pt
k k a a
l l pt
l l pt
l l a a




δ
δ
(4.14)








94
Proprietăţile matricilor unitare

1.) O transformare liniară dată de o matrice (A) unitară (de la C
N
la C
N
)
lasă produsul scalar invariant.
N
C ∈ ∀ y x, , adică
|
|
|
|
|
|
.
|

\
|
=
N
x
x
.
.
.
1
x ,
|
|
|
|
|
|
.
|

\
|
=
N
y
y
.
.
.
1
y (4.15)
Se defineşte produsul scalar a doi vectori:

*
1
* *
1
*
.
, y x y x y x ⋅ = ⋅ = ⋅ = ⋅ =
∑ ∑
= =
T
N
i
i
T
i
T
N
i
i i
def
y x y x (4.16)
În aceste condiţii:
y x y A x A , , = ⋅ ⋅ , (4.17)
adică produsul scalar este invariant.

Demonstraţie:
( ) ) ( ,
*
y A x A y A x A ⋅ ⋅ ⋅ = ⋅ ⋅
T
.
Se ştie că:
T T T
U V V U ⋅ = ⋅ ) ( .
( ) ( ) y x y x y A A x y A A x y A x A
I
, ) (
* * *
*
*
= ⋅ = ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅
T T T T T T
43 42 1
q.e.d.
Consecinţă:
Transformarea dată de o matrice unitară lasă neschimbată energia.
Acest lucru rezultă din proprietatea anterioară, pentru cazul
particular în care x=y.
x A x A x x ⋅ ⋅ = , ,
( ) ( )
4 4 3 4 4 2 1
3 2 1
2
2
* *
x A
x
x A x A x x

⋅ ⋅ ⋅ = ⋅ ⇒
T T

95

∑ ∑
= =
⋅ = ⇒
N
i
i i
N
i
i
x a x
1
2
1
2

x A x ⋅
= ⇒ E E

2.) Toate valorile proprii ale unei matrice unitare au valorile egale cu 1.
Dacă x este un vector propriu al matricei A, atunci λ este valoarea
proprie a lui x dacă satisface relaţia: x x A ⋅ = ⋅ λ . (4.18)
Demonstraţie:
S-a arătat că: ( ) x x x A x A ⋅ = ⋅ ⋅ ⋅
T T * *
) ( . Înlocuind: x x A ⋅ = ⋅ λ
( ) x x x x ⋅ = ⋅ ⋅ ⋅ ⇒
T T * *
) (λ λ
x x x x ⋅ = ⋅ ⋅ ⋅ ⇒
T T * * *
λ λ
2 2 2
x x = ⋅ ⇒ λ . Deoarece: 0 ≠ x (vectorul propriu este nenul)
1 = ⇒ λ q.e.d.
În aceste relaţii, norma vectorului x indusă de produsul scalar este:


=
= = ⋅ =
N
i
i
T
def
E x
1
2
*
.
2
x
x x x = energia lui x (4.19)

3.) Vectorii proprii corespunzători unor valori proprii diferite sunt
ortogonali.
Fie x
1
, x
2
doi vectori proprii cu valori proprii asociate λ
1
, λ
2
.
Spunem că doi vectori sunt ortogonali dacă:
0 0 ,
2
*
1 2 1 2 1
= ⋅ ⇔ = ⇔ ⊥ x x x x x x
T
(4.20)
Demonstraţie:
Dacă x
1
, x
2
sunt vectori proprii cu valorile proprii asociate λ
1
, λ
2
:

1 1
x x A ⋅ = ⋅ ⇒ λ ,
2 2
x x A ⋅ = ⋅ λ
Deoarece matricea A este unitară, rezultă că lasă produsul scalar
invariant:
( )
2
*
1 2
*
1
) ( x x x A x A ⋅ = ⋅ ⋅ ⋅ ⇒
T T
(conform proprietăţii 1)
( )
2
*
1 2 2
*
1 1
) ( x x x x ⋅ = ⋅ ⋅ ⋅ ⇒
T T
λ λ
96

2
*
1 2
*
1 2
*
1
x x x x ⋅ = ⋅ ⋅ ⋅ ⇒
T T
λ λ
Dar: 1
2
*
1
≠ ⋅ λ λ , deoarece
2
1
λ λ ≠ .
0
2
*
1
≠ ⋅ ⇒ x x
T
q.e.d.
Rămâne de arătat că: 1
2
*
1
≠ ⋅ λ λ . Se poate demonstra prin reducere
la absurd.

4.) Teorema spectrală: Dacă A este o matrice unitară, atunci există cel
puţin o matrice B care diagonalizează matricea A.
Această teoremă poate fi descrisă astfel:
) (C A
Ν N
M
×
∈ ∀ o matrice unitară de dimensiune N×N, adică
N
H H
I A A A A = ⋅ = ⋅
) (C B
Ν N
M
×
∈ ∃ ⇒ o matrice unitară de dimensiune N×N,
adică
N
H H
I B B B B = ⋅ = ⋅ , care diagonalizează matricea A,
adică ) (C Λ
Ν N
M
×
∈ ∃ o matrice diagonală de dimensiune N×N,
care satisface relaţia: Λ B A B = ⋅ ⋅
−1
, (4.21)
adică matricea B diagonalizează matricea A, rezultatul fiind
matricea Λ.

Demonstraţie:
Dacă x
1
, …, x
N
sunt vectori proprii normaţi ai matricei A. Se va
construi matricea B astfel:

|
|
|
.
|

\
|
=
×
M M M M
M M M M
N N N
x x x B ...
2 1
, unde
M
M
i
x este o matrice
coloană.
Dar:
* 1 T H
B B B = =

, deoarece s-a demonstrat că vectorii proprii
ai unei matrice unitare sunt ortogonali.
97
|
|
|
|
|
.
|

\
|
= ⇒
L L
M M M
L L
L L
T
N
T
T
T
*
*
2
*
1
*
x
x
x
B , unde L L
T *
1
x este o
matrice linie.
N
T
I B B =
|
|
|
|
|
.
|

\
|
= ⋅ ⇒
1 0 0
0 1 0
0 0 1
*
K
M K M M
K
K
(conform proprietăţii 3),
deci matricea B astfel construită este unitară.
|
|
|
.
|

\
|
⋅ ⋅
|
|
|
|
|
.
|

\
|
= ⋅ ⋅ ⇒

M M M M
M M M M
L L
M M M
L L
L L
N
T
N
T
T
x x x A
x
x
x
B A B ...
2 1
*
*
2
*
1
1
=
|
|
|
|
|
.
|

\
|
=
|
|
|
.
|

\
|
⋅ ⋅ ⋅ ⋅
|
|
|
|
|
.
|

\
|
=
N
N N
T
N
T
T
λ
λ
λ
λ λ λ
K
M K M M
K
K
M M M M
M M M M
L L
M M M
L L
L L
0 0
0 0
0 0
...
2
1
2 2 1 1
*
*
2
*
1
x x x
x
x
x


( ) Λ B A B = = ⋅ ⋅ ⇒

N
diag λ λ ,...,
1
1


Prin urmare, alegând matricea B ca având pe coloane vectorii
proprii normaţi ai matricea A şi matricea Λ având pe diagonală valorile
proprii corespunzătoare, este verificată relaţia:
Λ B A B = ⋅ ⋅
H
(4.22)




98

4.3. Transformări unitare ale unor semnale unidimensionale

O transformare liniară de la
N N
C C → este unitară dacă este
reprezentată de o matrice unitară ) (C
N N×
∈M A .
Dacă notăm cu u(l) un semnal unidimensional discret, cu N
eşantioane ( N l , 1 = ) şi cu v(m) semnalul eşantionat transformat:

|
|
|
.
|

\
|
=
) (
) 1 (
N u
u
M U ,
|
|
|
.
|

\
|
=
) (
) 1 (
N v
v
M V
În scriere matriceală:
U A V ⋅ = , (4.23)
V A V A U ⋅ = ⋅ = ⇒
− T * 1
(4.24)

unde ( )
N m l
m
l a
, 1 ,
) (
=
= A . Indicele m semnifică indicele semnalului
din baza de semnale, iar argumentul l semnifică eşantionul m din baza de
semnale. Matricea A se scrie extins:

|
|
|
|
|
.
|

\
|
=
) ( ) 2 ( ) 1 (
) ( ) 2 ( ) 1 (
) ( ) 2 ( ) 1 (
2 2 2
1 1 1
N a a a
N a a a
N a a a
N N N
K
M M M M
K
K
A
Cu aceste notaţii, relaţiile (4.19) şi (4.20) se scriu, pe componente:


=
⋅ =
N
l
m
l u l a m v
1
) ( ) ( ) ( (4.25)


=
⋅ =
N
m
m
m v l a l u
1
*
) ( ) ( ) ( (4.26)

N m m m l a l a
N
l
m m N
T
, 1 ), ' ( ) ( ) (
1
*
'
*

=
= − = ⋅ ⇔ = ⋅ I A A δ (4.27)
99
N l l l l a l a
N
l
m m N
T
, 1 ), ' ( ) ' ( ) (
1
* *

=
= − = ⋅ ⇔ = ⋅ I A A δ (4.28)

unde:
¹
´
¦ =
=
în rest
x
x


, 0
0 , 1
) ( δ , adică
¹
´
¦

=
= −
' , , 0
' , 1
) ' (
l l în rest
l l
l l


δ
este impulsul Dirac.

Coloanele matricei unitare A formează o bază ortonormată în
spaţiul vectorial C
N
. Prima condiţie de mai sus (4.23) exprimă condiţia de
ortonormalitate, iar cea de-a doua condiţie (4.24) exprimă condiţia de
completitudine a bazei.
Transformata unitară directă a unei secvenţe este:


=
⋅ =
N
l
m
l u l a m v
1
) ( ) ( ) ( (4.29)
iar transformata unitară inversă este:


=
⋅ =
N
m
m
m v l a l u
1
*
) ( ) ( ) ( (4.30)
Condiţia ca transformata să fie unitară este:


=
− = ⋅
N
l
m m
m m l a l a
1
*
'
) ' ( ) ( ) ( δ (4.32)
care exprimă condiţia de completitudine.


=
− = ⋅
N
m
m m
l l l a l a
1
*
) ' ( ) ' ( ) ( δ (4.32)
exprimă condiţia de ortonormalitate.






100

4.4. Transformări unitare ale unor semnale bidimensionale

Se spune că un semnal ( ) ( )
1 , 0 ,
,
− = N n m
n m v se obţine prin aplicarea
unei transformări unitare asupra semnalului ( ) ( )
1 , 0 ,
,
− = N k l
k l u , dacă:

∑ ∑

=

=
⋅ =
1
0
1
0
,
) , ( ) , ( ) , (
N
l
N
k
n m
k l u k l a n m v este transformarea directă (4.33)

∑ ∑

=

=
⋅ =
1
0
1
0
*
,
) , ( ) , ( ) , (
N
m
N
n
n m
n m v k l a k l u este transformarea inversă (4.34)

Condiţia de completitudine se scrie în acest caz:

¦
¹
¦
´
¦
¹
´
¦
=
=
= − − = ⋅
∑ ∑

=

=
rest în , 0
'
'
, 1
) ' , ' ( ) ' , ' ( ) , (
.
1
0
1
0
*
, ,
k k
l l
k k l l k l a k l a
def
N
m
N
n
n m n m
δ (4.35)
Condiţia de ortonormare se scrie:

¦
¹
¦
´
¦
¹
´
¦
=
=
= − − = ⋅
∑ ∑

=

=
rest în , 0
'
'
, 1
) ' , ' ( ) , ( ) , (
.
1
0
1
0
*
' , ' ,
n n
m m
n n m m k l a k l a
def
N
l
N
k
n m n m
δ (4.36)

În ceea ce priveşte numărul de operaţii, un algoritm are
complexitatea O(N
P
) dacă numărul de numărul de operaţii (înmulţiri,
adunări etc) este proporţional cu N
p
, atunci când secvenţa de date are
lungimea N.
În cazul transformărilor unitare unidimensionale,


=
⋅ =
1
0
) ( ) ( ) (
N
l
m
l u l a m v , numărul de operaţii necesare N
x
pentru a calcula
v(m) este N
x
= N
2
. Prin urmare, complexitatea algoritmului de calcul a lui
v(m) este O(N
2
).
101
În cazul bidimensional, numărul de operaţii necesare pentru a
calcula
∑ ∑

=

=
⋅ =
1
0
1
0
,
) , ( ) , ( ) , (
N
k
N
l
n m
k l u k l a n m v este de ordinul a N
x
= N
4
, deci
complexitatea algoritmului este O(N
4
), însă adesea se încearcă reducerea
complexităţii algoritmului.
Se spune că o transformare unitară bidimensională este separabilă
dacă coeficienţii transformării se pot scrie:
) ( ) ( ) , ( k b l a k l a
n m mn
⋅ = (4.37)
În acest caz:

∑ ∑

=

=
⋅ ⋅ =
1
0
1
0
) , ( ) ( ) ( ) , (
N
l
N
k
n m
k l u k b l a n m v (4.38)
Se poate arăta că dacă o transformare unitară bidimensională este
separabilă, complexitatea algoritmului său de calcul se reduce la O(N
3
),
adică N
x
= N
3
, deoarece relaţia de mai sus se poate scrie şi:

∑ ∑

=

=
⋅ ⋅ =
1
0
1
0
) , ( ) ( ) ( ) , (
N
l
N
k
n m
k l u k b l a n m v (4.39)
Pentru a ilustra scrierea matriceală a unei transformări unitare
separabile (ultimul argument a lui b
n
(k) trebuie să coincidă cu primul
argument a lui u(l,k)), relaţia de mai sus se poate scrie şi:

∑ ∑

=

=
⋅ ⋅ =
1
0
1
0
) ( ) , ( ) ( ) , (
N
l
N
k
n m
l b k l u l a n m v (4.40)
În acest caz, transformarea unitară directă separabilă se poate scrie:

T
B u A v ⋅ ⋅ = , (4.41)
unde ( ) ( )
1 , 0 , − =
=
N l m
m
l a A , ( ) ( )
1 , 0 , − =
=
N l n
n
l b B sunt matricile
unitare în care se poate separa transformarea iniţială.
Transformarea inversă se poate scrie:
( )
1
1


⋅ ⋅ =
T
B v A u (4.42)
102
Deoarece A şi B sunt, la rândul lor, matrici unitare, adică
T
A A
* 1
=

şi
T
B B
* 1
=

, deci ( ) ( )
* 1
1
B B B
T
T
= =


, transformarea
inversă se mai poate scrie:

* *
B v A u
T
⋅ ⋅ = ⇒ (4.43)
Un caz particular, îl constituie cazul în care matricile unitare A şi B
sunt egale, A = B. În acest caz, transformarea directă este:

∑ ∑

=

=
⋅ ⋅ =
1
0
1
0
) , ( ) ( ) ( ) , (
N
l
N
k
n m
k l u k a l a n m v (4.44)
iar transformarea inversă este:

∑ ∑

=

=
⋅ ⋅ =
1
0
1
0
* *
) , ( ) ( ) ( ) , (
N
m
N
n
n m
n m v l a l a k l u (4.45)
Aceste relaţii trebuie însoţite de condiţiile de ortonormalitate şi
completitudine.

Spaţiul matricilor pătrate ) (C
N N×
M are dimensiunea N
2
. În spaţiul
matricilor pătrate de dimensiune N×N se poate defini o transformare
unitară bidimensională şi prin utilizarea produsului vectorial, după cum se
va arăta în continuare.
Dacă matricile ) ( , C
N N
Y X
×
∈M , unde
1 , 0 ,
) (
− =
=
N j i
ij
x X ,
1 , 0 ,
) (
− =
=
N j i
ij
y Y , produsul scalar al celor două matrici se defineşte prin
relaţia:

∑ ∑ =

=

=

1
0
*
1
0
.
,
N
i
ij
N
j
ij
def
y x Y X (4.46)
Prin urmare, produsul scalar dă spaţiului ) (C
N N×
M o structură de
spaţiu Hilbert (un spaţiu liniar cu un produs scalar). În acest spaţiu se va
fixa o matrice unitară A, care are elementele ( ) ( )
1 , 0 , − =
=
N l m
m
l a A , deci:
103

|
|
|
.
|

\
|
=

| | |
| | |
1 1 0
.
...
N
not
a a a A (4.47)
În acest spaţiu se poate construi o bază B în ) (C
N N×
M astfel:
{ }
1 , 0 ,
*
− =
=
N n m
mn
A B , unde
* * * T
n m mn
a a A ⋅ = , vectorii
*
m
a fiind vectori
coloană (N×1), iar vectorii
*
n
a sunt vectori linie (1×N).
Pentru a verifica dacă B este o bază în spaţiul ) (C
N N×
M se
procedează prin reducere la absurd, presupunând că B nu este o bază în
spaţiul ) (C
N N×
M . Prin urmare rezultă că există matricile:
C ∈ ∃ ⇒
mn
α , nu toate nule, a.î.
∑ ∑

=

=
×
= ⋅
1
0
1
0
*
0
N
m
N
n
N N mn mn
A α
l
a ⋅
Înmulţind relaţia de mai sus cu a
l
, se obţine relaţia:

∑ ∑

=

=
= ⋅ ⋅ ⋅ ⇒
1
0
1
0
* *
0
N
m
N
n
l
T
n m mn
a a a α (4.48)
în care:
¹
´
¦

=
= − = ⋅
l n
l n
l n a a
l
T
n
pt. , 0
pt. , 1
) (
*

δ ,
deoarece matricea A este unitară.
Prin urmare:


=
= ⋅ ⇒
1
0
*
0
N
m
m mnl
a α , (4.49)
adică componentele a
k
sunt liniar dependente, ceea ce este fals,
deoarece coloanele unei matrici unitare formează o bază în spaţiul
N×N, deci sunt liniar independente.

Deoarece { }
1 , 0 ,
*
− =
=
N n m
mn
A B , unde
* * * T
n m mn
a a A ⋅ = este o bază în
spaţiul ) (C
N N×
M :

∑ ∑

=

=
×
⋅ =
1
0
1
0
*
) , ( ) , (
N
m
N
n
mn N N
A n m v k l u (4.50)
104
Din algebra liniară se ştie că:
*
, ) , (
mn
A u n m v = . Astfel, rezultă:
( ) ( )
∑ ∑

=

=
⋅ = =
1
0
1
0
*
* *
, ) , ( , ) , (
N
l
N
k
mn mn
k l a k l u A u n m v (4.51)
Dar: ) ( ) ( ) , (
* * *
k a l a k l A
n m mn
⋅ = .

∑ ∑

=

=
⋅ ⋅ = ⇒
1
0
1
0
) ( ) ( ) , ( ) , (
N
l
N
k
n m
k a l a k l u n m v (4.52)


4.5. Transformata Fourier discretă unidimensională (DFT-1D)

Deoarece transformarea Fourier este una din transformările cel mai
des utilizate în domeniul prelucrărilor de imagini, în continuare va fi
prezentată transformata Fourier discretă unidimensională şi proprietăţile
acesteia.
Transformata Fourier discretă unidimensională DFT-1D directă a
unei secvenţe discrete u(k) este definită prin relaţia:



=
|
.
|

\
|
⋅ − ⋅ =
1
0
2
exp ) ( ) (
N
k
k m
N
j k u m v
π
, unde 1 , 0 − = N m (4.53)
Transformata Fourier discretă unidimensională DFT-1D inversă
este definită prin relaţia:



=
|
.
|

\
|
⋅ ⋅ =
1
0
2
exp ) (
1
) (
N
m
k m
N
j m v
N
k u
π
, unde 1 , 0 − = N k (4.54)
Matricea transformării DFT-1D este:
1 , 0 ,
2
exp
− =
|
|
.
|

\
|
|
.
|

\
|
⋅ −
N k m
k m
N
j
π
, unde m este indicele de linie şi k indicele
de coloană.
Se poate defini transformata DFT-1D unitară prin relaţiile:



=
|
.
|

\
|
⋅ − ⋅ =
1
0
2
exp ) (
1
) (
N
l
k m
N
j k u
N
m v
π
, (4.55)
105
pentru transformata DFT-1D directă



=
|
.
|

\
|
⋅ ⋅ =
1
0
2
exp ) (
1
) (
N
m
k m
N
j m v
N
k u
π
, (4.56)
pentru transformata DFT-1D inversă.
Se poate arăta că matricea transformării,
1 , 0 ,
2
exp
1
− =
|
|
.
|

\
|
|
.
|

\
|
⋅ − ⋅ =
N k m
k m
N
j
N
F
π
, este o matrice unitară, adică
N
T T
I F F F F = ⋅ = ⋅
* *
.


4.6. Proprietăţi ale transformatei DFT-1D

1. Inversa matricei DFT-1D este egală cu conjugata matricei DFT-1D:
1 , 0 ,
.
2
exp
1
− =
|
|
.
|

\
|
|
.
|

\
|
⋅ − ⋅ =
N k m
def
k m
N
j
N
F
π
(4.57)
¦
¹
¦
´
¦
=
=

− * 1
F F
F F
T
, deoarece
1 * * −
= = F F F
T
, unde: (4.58)
1 , 0 ,
* 1
2
exp
1
− =

|
|
.
|

\
|
|
.
|

\
|
⋅ ⋅ = =
N k m
k m
N
j
N
F F
π
(4.59)


2. Extensia vectorului transformat este periodică, ) ( ) ( m v N m v = + : (4.60)
( )


=
=

⋅ + − ⋅ = +
1
0
2
exp ) ( ) (
N
k
k N m
N
j k u N m v
π

=
|
.
|

\
|
⋅ − ⋅
|
.
|

\
|
⋅ − ⋅ =


=
1
0
2
exp
2
exp ) (
N
k
k N
N
j k m
N
j k u
π π

106


=
=
|
.
|

\
|
⋅ − ⋅ =
1
0
) (
2
exp ) (
N
k
m v k m
N
j k u
π
(4.61)
deoarece:
1 ) 2 sin( ) 2 cos(
2
exp = ⋅ ⋅ − ⋅ =
|
.
|

\
|
⋅ − k j k k N
N
j π π
π


3. În vectorul transformat v, componentele sunt conjugat simetrice:
|
.
|

\
|
=
|
.
|

\
|
± m
N
v m
N
v m
2 2
*
, unde 1
2
, 0 − =
N
m (4.62)
Grafic:
x
x*
0
N-1
N/2

Figura 4.2. Componentele vectorului transformat v sunt conjugat
simetrice.

4. DFT-1D este spectrul eşantionat al semnalului discret u(k) extins cu 0 în
afara intervalului [0,N-1].
Modelul matematic al semnalului eşantionat, extins cu 0 în rest
este:



=
− ⋅ =
1
0
) ( ) ( ) (
N
k
k t t u k u δ (4.63)
ω
A

Figura 4.3. Spectrul eşantionat al semnalului discret u(k) extins cu 0.

Spectrul semnalului este:
107

( ) = ⋅
|
|
.
|

\
|
− ⋅ = ⋅ =




∞ −
⋅ ⋅ −

=

∞ −
⋅ ⋅ −
dt e k t k u dt e t u U
t j
N
k
t j ω ω
δ ω
1
0
) ( ) ( ) (

∑ ∑


=
⋅ ⋅ −

=

∞ −
⋅ ⋅ −
⋅ = ⋅ − ⋅ =
1
0
1
0
) ( ) ( ) (
N
k
k j
N
k
t j
e k u dt e k t k u
ω ω
δ (4.64)
Comparând această relaţie cu transformata Fourier discretă:


=
⋅ ⋅ −
⋅ =
1
0
2
) ( ) (
N
k
k m
N
j
e k u m v
π


m
N
U m v π
ω
ω 2 ) ( ) (
=
= ⇒ (4.65)
v(0)
v(1)
v(2)
-2π -π π 2π
N
π 2
N
π 2
2
… …
ω
A

Figura 4.4. Spectrul semnalului.

5. Algoritmul rapid FFT al DFT (engl. FFT = Fast Fourier Transform)
reduce complexitatea algoritmului de calcul al DFT de la N
2
la
N N
2
log ⋅ operaţii, unde N=2
p
este par:
( ) ( ) N O N O
FFT
2
2
log → , dacă N=2
p
. (4.66)

6. Transformata DFT transformă convoluţia circulară în produs.
Convoluţia circulară este:
) ( ) ( ) (
.
l Z l Y l X
not
c
= ∗ , unde 1 , 0 − = N l
108
( ) ( )


=
⋅ − =
1
0
.
) ( mod ) (
N
i
def
i Y N i l X l Z (4.67)
Acest mod de a defini simetria circulară limitează lungimea secvenţei Z
la N.

Teorema convoluţiei circulare:
Dacă:

{ }
{ }
{ }
¦
¹
¦
´
¦
=
=
=
) ( ) (
) ( ) (
) ( ) (
l Z DFT m Z
l Y DFT m Y
l X DFT m X
şi ) ( ) ( ) ( l Y l X l Z
c
∗ = (4.68)
) ( ) ( ) ( m Y m X m Z ⋅ = ⇒


4.7. Transformata Fourier discretă bidimensională (DFT-2D)

Transformata Fourier discretă bidimensională (DFT – 2D) este una
din transformările cel mai des utilizate în domeniul prelucrărilor de
imagini. În mod similar cazului unidimensional, DFT – 2D este utilă la
analiza spectrală a imaginilor digitale.
Transformata Fourier discretă bidimensională directă a unei
imagini discrete { } 1 1 0 , ) , ( ,...,N- , l,k u U k l = = se defineşte astfel:

( ) =

⋅ + ⋅ − ⋅ =
∑ ∑

=

=
1
0
1
0
2
exp ) , ( ) , (
N
l
N
k
k n l m
N
j k l u n m v
π


∑ ∑

=

=
≤ ≤ ⋅ =
1
0
1
0
1 0 ), , ( ) , (
N
l
N
k
mn
N- m,n k l a k l u (4.69)

unde: ( )

⋅ + ⋅ − = k n l m
N
j k l a
mn
π 2
exp ) , ( .
109
După cum se observă, această relaţie se mai poate scrie:

=
|
.
|

\
|
⋅ ⋅ − ⋅
|
.
|

\
|
⋅ ⋅ − ⋅ =
∑ ∑

=

=
1
0
1
0
2
exp
2
exp ) , ( ) , (
N
l
N
k
k n
N
j l m
N
j k l u n m v
π π


∑ ∑

=

=
= ⋅ ⋅ =
1
0
1
0
) ( ) ( ) , (
N
l
N
k
n m
k c l b k l u

∑ ∑

=

=
⋅ ⋅
⋅ ⋅ =
1
0
1
0
) , (
N
l
N
k
k n
N
l m
N
W W k l u (4.70)

unde:
|
.
|

\
|
⋅ − = l m
N
j b l
m
π 2
exp ) (
|
.
|

\
|
⋅ − = k n
N
j c k
n
π 2
exp ) (
|
.
|

\
|
− =
N
j W
N
π 2
exp

Această rescriere a DFT – 2D directă, scoate în evidenţă
proprietatea sa de separabilitate.
Transformata DFT – 2D inversă este:
( )
∑ ∑

=

=
=

⋅ + ⋅ ⋅ =
1
0
1
0
2
2
exp ) , (
1
) , (
N
m
N
n
k n l m
N
j n m v
N
k l u
π


∑ ∑

=

=
= ⋅ ⋅ =
1
0
1
0
* *
2
) ( ) ( ) , (
1
N
m
N
n
n m
k c l b n m v
N


∑ ∑

=

=
⋅ − ⋅ −
⋅ ⋅ =
1
0
1
0
2
) , (
1
N
m
N
n
k n
N
l m
N
W W n m v
N
(4.71)

110
unde b
m
(l), c
n
(k) şi W
N
au aceleaşi semnificaţii ca mai sus.
Se poate arăta că transformarea astfel definită nu este o
transformare unitară. Transformata DFT – 2D unitară directă se defineşte
astfel:
( ) =

⋅ + ⋅ − ⋅ =
∑ ∑

=

=
1
0
1
0
2
exp ) , (
1
) , (
N
l
N
k
k n l m
N
j k l u
N
n m v
π


∑ ∑

=

=
⋅ ⋅
⋅ ⋅ =
1
0
1
0
) , (
1
N
l
N
k
k n
N
l m
N
W W k l u
N
(4.72)

DFT-2D unitară inversă este:

( ) =

⋅ + ⋅ − ⋅ =
∑ ∑

=

=
1
0
1
0
2
exp ) , (
1
) , (
N
m
N
n
k n l m
N
j n m v
N
k l u
π


∑ ∑

=

=
⋅ ⋅
⋅ ⋅ =
1
0
1
0
) , (
1
N
m
N
n
k n
N
l m
N
W W n m v
N
(4.73)

Se poate defini matricea transformării DFT-2D unitare:

1 , 0
1 , 0
1 , 0
1 , 0
2
exp
1 2
exp
1
− =
− =
− =
− =

|
.
|

\
|
⋅ − ⋅

|
.
|

\
|
⋅ − =
N k
N n
N l
N m
k n
N
j
N
l m
N
j
N
F
π π
(4.74)

care este o matrice unitară ( )
N
T T
I F F F F = ⋅ = ⋅
∗ ∗
.
Astfel, relaţiile ce definesc DFT – 2D unitară directă şi inversă se
pot scrie şi sub formă matricială:
• DFT – 2D unitară directă:
F U F F U F V
T
⋅ ⋅ = ⋅ ⋅ = , (4.75)
deoarece se observă mai sus că:
T
F F =
111
• DFT – 2D unitară inversă:
∗ ∗ − −
⋅ ⋅ = ⋅ ⋅ = F V F F V F U
1 1
, (4.76)
deoarece:
N
T T
I F F F F = ⋅ = ⋅
∗ ∗

∗ ∗
= = ⇒ F F F
T -1



4.8. Proprietăţi ale transformatei DFT-2D

1. Datorită separabilităţii sale, aplicarea DFT – 2D se poate face în 2 paşi:
• mai întâi se aplică DFT – 1D pe linii (sau pe coloane)
• rezultatului i se aplică DFT – 1D pe coloane (sau pe linii).
Datorită acestui fapt, se poate trage concluzia că DFT – 2D are
algoritm rapid de calcul, deoarece DFT – 1D are algoritm rapid de
calcul. Astfel, se poate arăta că algoritmul rapid necesar pentru
obţinerea DFT – 2D are complexitatea ( ) N N O log
2
⋅ , în loc de
( )
3
N O cât ar fi dacă nu ar fi separabilă.

2. Extensia DFT – 2D este periodică, adică:
N q p n m N q n N p m v v ∈ ∀ ⋅ + ⋅ + = , ) , ( ) , ( , (4.77)

3. Pentru o imagine u reală, elementele DFT – 2D sunt conjugat simetrice
faţă de jumătatea imaginii transformate v (figura 4.5), adică:
|
.
|

\
|
=
|
.
|

\
|
± ± n
N
m
N
v n
N
m
N
v m m
2
,
2
*
2
,
2
(4.78)
112
N
N

Figura 4.5. Elementele DFT – 2D sunt conjugat simetrice faţă de
jumătatea imaginii transformate.

De aici se poate trage concluzia că DFT – 2D este complet
determinată de N
2
numere reale şi nu de 2N
2
câte ar trebui să aibă
în mod normal (fiecare are parte reală şi imaginară).

4. Una dintre cele mai importante proprietăţi ale transformatei Fourier
rezultă din aşa-numita ”teoremă a convoluţiei”. Conform acesteia,
transformata DFT – 2D a produsului de convoluţie a două secvenţe
bidimensionale x
1
şi x
2
este egală cu produsul simplu a transformatelor
DFT – 2D a celor două secvenţe, adică:

{ } { } { } ) , ( ) , ( ) , ( ) , (
2 1 2 1
n m x F n m x F n m x n m x F ⋅ = ⊗ (4.79)

unde cu F{x} s-a notat DFT–2D a secvenţei bidimensionale x şi cu
2 1
x x ⊗ s-a notat produsul de convoluţie a lui x
1
cu x
2
, definit
anterior.
Această proprietate permite calculul convoluţiei a două secvenţe
bidimensionale prin următoarea metodă:
• se calculează DFT–2D directă a celor 2 secvenţe, printr-un
algoritm rapid de calcul (FFT=Fast Fourier Transform);
• se efectuează produsul celor 2 transformate;
• se calculează DFT–2D inversă a rezultatului.
113
Această metodă este frecvent aplicată la filtrarea digitală a imaginilor.
DFT-2D este de asemenea utilă pentru determinarea unor parametri
utilizaţi în procesele de analiză a imaginilor.

5. DFT-2D este spectrul eşantionat al semnalului eşantionat.
Semnalul eşantionat se poate scrie:

∑ ∑

=

=
− − ⋅ =
1
0
1
0
) , ( ) , ( ) , (
N
l
N
k
k y l x y x u k l u δ (4.80)
Spectrul semnalului este:

( )
dxdy e u(x,y) U
y x j ⋅ + ⋅ −
⋅ =
∫∫
η ξ
η ξ
R
) , ( (4.81)
Se poate arăta că:

n
N
m
N
U n m V π
η
π
ξ
η ξ 2
,
2 ) , ( ) , (
= =
= (4.82)


4.9. Transformata Cosinus discretă unidimensională

Matricea transformării Cosinus discretă unidimensională
(DCT-1D) este ( )
N l m
m
l c C
, 1 ,
) (
=
= care are elementele:

( )
¦
¦
¹
¦
¦
´
¦
=
|
.
|

\
| ⋅ +

= =
=
N l m
N
m l
N
N l m
N
l c
m
, 1 , ,
2
1 2
cos
2
, 1 , 0 ,
1
) (
π
(4.83)
Notând:

¦
¦
¹
¦
¦
´
¦
=
=
=
N m
N
m
N
m
, 1 ,
2
0 ,
1
) ( α (4.84)
DCT-1D directă se poate rescrie:
114

( )

=

⋅ +
⋅ ⋅ =
N
l
N
m l
m l u m v
1
2
1 2
cos ) ( ) ( ) (
π
α (4.85)
DCT-1D inversă este:

( )

=

⋅ +
⋅ ⋅ =
N
m
N
m l
m m v l u
1
2
1 2
cos ) ( ) ( ) (
π
α (4.86)
Se poate arăta că matricea C a transformării DCT-1D este unitară,
adică
N
T T
I C C C C = ⋅ = ⋅
* *
. Pe de altă parte, deoarece matricea C este
reală:

T T
C C C = = ⇒
− * 1
(4.87)

Observaţie:
Transformarea cosinus discretă DCT-1D se poate obţine din
DFT-1D a secvenţei simetrice de lungime 2N construită astfel:
) ( ) 1 ( ... ) 2 ( ) 1 ( ) 1 ( ) 2 ( ... ) 1 ( ) ( N u N u u u u N u N u − − (4.88)
… …
u(N) u(N-1) u(2) u(1) u(1)u(2) u(N-1) u(N)
u(m)

u(1) u(2) u(N-1) u(N)
u(m)
DFT-1D
DCT-1D

Figura 4.6. Obţinerea DCT-1D din DFT-1D de lungime 2N.

sau:
) 1 ( ) 2 ( ... ) 1 ( ) ( ) ( ) 1 ( ... ) 2 ( ) 1 ( u u N N u N u N u u u − − (4.89)
115


u(N) u(N-1)
u(2) u(1)
u(1) u(2) u(N-1) u(N)
u(m)

Figura 4.7. Obţinerea DCT-1D din DFT-1D de lungime 2N.

În acest fel, în cazul DCT-1D nu mai apar variaţii bruşte în spectru,
variaţii care au ca rezultat componente importante la frecvenţe
înalte, ca în cazul DFT-1D ) 2 ( ) 1 ( ... ) 2 ( ) 1 ( − − N u N u u u

Consecinţă:
Deoarece DCT-1D se poate construi din DFT-1D care are un
algoritm de calcul rapid, rezultă că şi DCT-1D are un algoritm de calcul
rapid, care reduce numărul de operaţii la ) 1 ( log ) 1 ( 2
2
+ ⋅ + ⋅ N N , adică
) log (
2
N N O ⋅ ⇒ .


4.10. Transformata Cosinus Discretă bidimensională DCT-2D

Transformata Cosinus discretă bidimensională (DCT-2D) a unei
imagini u(l,k) de dimensiune N×N (l,k= N , 1 ) se defineşte astfel:

( ) ( )
= |
.
|

\
|

+
⋅ |
.
|

\
|

+
⋅ ⋅ ⋅ =
∑ ∑
= =
n
N
k
m
N
l
k l u n m n m v
N
l
N
k
2
1 2
cos
2
1 2
cos ) , ( ) ( ) ( ) , (
1 1
π π
α α

∑ ∑
= =
⋅ =
N
l
N
k
mn
k l a k l u
1 1
) , ( ) , ( (4.90)

116
unde: m,n=1,2,...,N
¦
¦
¹
¦
¦
´
¦
=
=
=
,...,N , m
N
m
N
m
2 1 pentru ,
2
1 pentru ,
1
) (


α (4.91)

|
.
|

\
|

+

|
.
|

\
|

+
⋅ ⋅ = n
N
k
m
N
l
n m k l
a
mn
2
) 1 2 (
cos
2
) 1 2 (
cos ) ( ) ( ) , (
π π
α α (4.92)

În mod similar se defineşte şi DCT-2D inversă:

= |
.
|

\
|

+
⋅ |
.
|

\
|

+
⋅ ⋅ ⋅ =
∑ ∑
= =
n
N
k
m
N
l
n m v n m k l u
N
l
N
k
2
) 1 2 (
cos
2
) 1 2 (
cos ) , ( ) ( ) ( ) , (
1 1
π π
α α

∑ ∑
= =
⋅ =
N
l
N
k
mn
k l a k l u
1 1
) , ( ) , ( (4.93)

iar α(m) şi α(n) au fost definite mai sus.

Deoarece matricea transformării DCT-1D este:
( )
N m l
m
N
l
m m l C
, 1 ,
2
) 1 2 (
cos ) , (
=
|
|
.
|

\
|
|
.
|

\
|

+
⋅ =
π
α (4.94)
DCT-2D directă şi inversă se pot scrie şi sub formă matriceală:

V=C⋅U⋅C
T
= DCT-2D directă (4.95)
( ) C V C C V C U
T T
⋅ ⋅ = ⋅ ⋅ =


1
1
= DCT-2D inversă, (4.96)
deoarece
T
C C =
−1
.

Deoarece DCT-2D este separabilă, rezultă că obţinerea DCT-2D se
poate face în doi paşi:
117
• întâi se aplică DCT-1D pe linii (sau pe coloane):

=
|
.
|

\
|

+
⋅ ⋅ = ⇒
N
k
n
N
k
k l u n n l v
1
2
) 1 2 (
cos ) , ( ) ( ) , ( '
π
α (4.97)

• rezultatului i se aplică DCT-1D pe coloane (sau pe linii):


=
|
.
|

\
|

+
⋅ ⋅ = ⇒
1
0
2
) 1 2 (
cos ) , ( ' ) ( ) , (
N
l
m
N
l
n l v m n m v
π
α (4.98)

După cum s-a arătat, DCT-1D se poate obţine din DFT-1D a
secvenţei simetrice de lungime 2N, construită astfel:
) ( ) 1 ( ... ) 2 ( ) 1 ( ) 1 ( ) 2 ( ... ) 1 ( ) ( N u N u u u u N u N u − −
sau:
) 1 ( ) 2 ( ... ) 1 ( ) ( ) ( ) 1 ( ... ) 2 ( ) 1 ( u u N N u N u N u u u − −

Ca şi în cazul unidimensional, se poate arăta că DCT-2D se poate
obţine prin intermediul transformatei Fourier DFT. Astfel, DCT-2D se
poate calcula ca fiind transformata Fourier a unei imagini u’ extinse, de
dimensiune 2N×2N:
∑ ∑
= =
⋅ ⋅
⋅ ⋅ =
N
l
N
k
n k
N
m l
N
W W k l u n m F
2
1
2
1
2 2
) , ( ' ) , ( , (4.99)
unde:
|
.
|

\
|
− =
N
j W
N
π 2
exp .
unde, imaginea extinsă u’ se obţine din imaginea iniţială u, astfel:
118
¦
¦
¦
¦
¦
¹
¦
¦
¦
¦
¦
´
¦
¹
´
¦
≤ ≤
≤ ≤
− − − −
¹
´
¦
≤ ≤
≤ ≤
¹
´
¦
≤ ≤
≤ ≤
− −
¹
´
¦
≤ ≤
≤ ≤
=




1 2
1 2
pentru ), 1 2 , 1 2 (
1 2
1 0
pentru 1 2
1 0
1 2
pentru ), , 1 2 (
1 0
1 0
pentru ), , (
) , ( '
N- k N
N- l N
k N l N u
N- k N
N- l
), N-k- u(l,
N- k
N- l N
k l N u
N- k
N- l
k l u
k l u (4.100)
Relaţia care face legătura între cele două transformări este:

) , ( ) , (
2 /
2
2 /
2
n m F W W n m v
n
N
m
N
⋅ ⋅ = (4.101)

În concluzie, calculul DCT-2D se reduce practic la calculul
DFT-2D pe o imagine cu o arie de patru ori mai mare decât imaginea
iniţială (figura 4.8):
2N
2N
N
N


Figura 4.8. Obţinerea DCT-2D a unei imagini, din DFT-2D pentru o
imagine cu o arie de patru ori mai mare decât imaginea iniţială.

Această variantă de obţinere a DCT-2D are dezavantajul că
necesită un volum de calcul relativ mare datorită imaginii de dimensiuni
mari (2N×2N) asupra căreia se aplică DFT-2D.
O alta variantă de obţinere a DCT-2D prin intermediul DFT-2D şi
care elimină dezavantajul prezentat mai sus, constă în utilizarea unei
secvenţe (imagini) bidimensionale u’ obţinută din imaginea iniţială u,
astfel:
119

¦
¦
¦
¦
¦
¦
¦
¦
¦
¦
¦
¹
¦
¦
¦
¦
¦
¦
¦
¦
¦
¦
¦
´
¦
¦
¦
¹
¦
¦
´
¦
≤ ≤

+
≤ ≤

+
− − − −
¦
¦
¹
¦
¦
´
¦
≤ ≤

+

≤ ≤
¦
¦
¹
¦
¦
´
¦

≤ ≤
≤ ≤

+
− −
¦
¦
¹
¦
¦
´
¦

≤ ≤

≤ ≤
=




1
2
1
1
2
1
), 1 2 , 1 2 (
1
2
1
2
1
0
pentru 1 2
2
1
0
1
2
1
pentru ), , 1 2 (
2
1
0
2
1
0
pentru ), , (
) , ( '
N- k
N
N- l
N
k N l N u
N- k
N
N-
l
), N-k- u(l,
N-
k
N- l
N
k l N u
N-
k
N-
l
k l u
k l u
pentru
(4.102)

Astfel, secvenţa (imaginea) u’(l,k) păstrează dimensiunea N×N a
imaginii iniţiale. DCT –2D a imaginii iniţiale u se poate calcula în funcţie
de DFT –2D a secvenţei u’(l,k) (care se va nota cu F(m,n)) astfel :

| | { }= − ⋅ + ⋅ ⋅ ⋅ =

) , ( ) , ( Re 2 ) , (
4 4 4
n N m F W n m F W W n m V
n
N
n
N
m
N


| | { } ) , ( ) , ( Re 2
4 4 4
n N m F W n m F W W
n
N
m
N
n
N
− ⋅ + ⋅ ⋅ =

(4.103)

Prin urmare, au fost prezentate 2 metode de obţinere a DCT-2D
prin intermediul DFT-2D. În ambele cazuri, algoritmul de calcul al
DCT–2D este următorul:
• se obţine imaginea (secvenţa) u’(l,k) din imaginea iniţială u(l,k);
• se calculează DFT–2D a imaginii u’(l,k), care se notează cu F;
120
• se calculează DCT–2D, utilizând relaţia de legătură corespunzătoare,
între cele 2 transformate.
De aici se poate trage şi concluzia că, deoarece DCT–2D se poate
obţine prin intermediul DFT şi deoarece DFT are algoritm rapid de calcul,
rezultă că şi DCT–2D are algoritm rapid de calcul.


4.11. Transformata Sinus discretă unidimensională DST-1D

Matricea transformării este ( )
N m l
m
l s S
, 1 ,
) (
=
= care are elementele:

+
+ ⋅ + ⋅

+
=
1
) 1 ( ) 1 (
sin
1
2
) (
N
l m
N
l s
m
π
(4.104)
Pentru a arăta că transformarea S este unitară, trebuie verificate
condiţiile de completitudine şi ortonormalitate.
Se observă că S este o matrice reală şi simetrică, adică s
k
(m)=s
m
(k):
S S S = = ⇒
− T * 1
. (4.105)
Deoarece:
U S V ⋅ = este transformarea directă, rezultă că
transformarea inversă este:
V S V S U ⋅ = ⋅ = ⇒
−1
(4.106)

Observaţie:
Transformarea sinus unidimensională discretă DST-1D se poate
obţine din transformarea Fourier unidimensională discretă DFT-1D, prin
secvenţa antisimetrică de lungime 2·(N+1) construită astfel:
(4.107)
) ( ) 1 ( ) 2 ( ) 1 ( 0 ) 1 ( ) 2 ( ) 1 ( ) ( 0 N u N u u u u u N u N u − − − − − − K K
121


0 0
0
0
u(N) u(N-1) u(2) u(1)
u(1) u(2) u(N-1) u(N)
Figura 4.9. Obţinerea DST-1D din DFT-1D, prin secvenţa antisimetrică
de lungime 2·(N+1).

Consecinţă:
Deoarece DST-1D se poate construi din DFT-1D care are un
algoritm de calcul rapid, rezultă că şi DST-1D are un algoritm de calcul
rapid, care reduce numărul de operaţii la ) 1 ( log ) 1 ( 2
2
+ ⋅ + ⋅ N N , adică
) log (
2
N N O ⋅ ⇒ .


4.12. Transformata Sinus discretă bidimensională DST-2D

Transformata Sinus discretă bidimensională DST-2D este
transformarea bidimensională separabilă care are matricele A = B = S,
unde S este matricea DST-1D definită anterior.
Transformata Sinus directă bidimensională este definită prin
relaţia:
S U S S U S V ⋅ ⋅ = ⋅ ⋅ =
T
, deoarece S S =
T
(4.108)

iar transformata Sinus inversă este definită prin relaţia:
S V S S V S U ⋅ ⋅ = ⋅ ⋅ =
− − 1 1
, deoarece S S =
−1
(4.109)

Observaţie:
Calculul DST-2D se poate face în 2 paşi: se aplică DST-1D pe
linii, iar rezultatului i se aplică DST-1D pe coloane sau invers.
122

5. Restaurarea imaginilor

O imagine poate fi degradată pe parcursul achiziţiei, transmisiei,
prelucrării sau analizei sale. Problema restaurării unei imagini degradate se
pune astfel: având o imagine digitală originală f(l,k) care a suferit un
proces de degradare echivalent cu o filtrare h(l,k) se obţine o imagine
degradată f’(l,k), peste care se suprapune un zgomot z(l,k), rezultatul fiind
imaginea degradată f”(l,k).
Prin restaurare se doreşte determinarea unei metode de estimare
care pornind de la imaginea degradată f”(l,k) să conducă la un rezultat cât
mai apropiat de imaginea originală f(l,k), relativ la un anumit criteriu, care
poate fi, de exemplu, eroarea medie pătratică.
În general, în modelul degradării (figura 5.1) se acceptă o filtrare
liniară h(l,k).
+
f(l,k)
h(l,k)
f'(l,k)
z(l,k)
f"(l,k)

Figura 5.1. Modelul degradării unei imagini.

De exemplu, funcţiei h(l,k) îi poate corespunde nefocalizarea
obiectivului camerei sau mişcării aparatului foto în timpul expunerii.
Se doreşte ca pornind de la imaginea degradată f”(l,k) să se obţină
estimarea imaginii originale tot printr-o filtrare liniară g(l,k) deoarece în
acest caz sunt calcule mai puţine:
f"(l,k)
g(l,k)
) , (
ˆ
k l f
) , ( ) , (
ˆ
k l f k l f ≅

Criteriul de comparare va fi ales cel al erorii medii pătratice:
123

∑ ∑
= =
− =
L
l
K
k
k l f k l f
1 1
2
) , (
ˆ
) , ( ε , unde C ∈ ) , ( k l f (5.1)

∑ ∑
= =
⋅ − − = ∗ =
L
i
K
j
j i h j k i l f k l h k l f k l f
1 1
) , ( ) , ( ) , ( ) , ( ) , ( ' (5.2)
) , ( ) , ( ' ) , ( " k l z k l f k l f + = (5.3)


5.1. Filtrarea inversă

Dacă zgomotul ar fi inexistent (z=0) cea mai simplă metodă de
restaurare ar fi ca g să fie filtrul invers lui h.
Se va nota cu F(m,n) transformata Fourier discretă a funcţiei f(l,k):
{ } ) , ( ) , (
.
k l f DFT n m F
not
= (5.4)
) , ( ) , ( ) , ( ) , ( " n m Z n m H n m F n m F + ⋅ = (5.5)

Dacă: 0 ) , ( = k l z , 0 ) , ( = ⇒ n m Z (5.6)
) , ( ) , ( ) , ( " n m H n m F n m F ⋅ = (5.7)

Funcţia de transfer a filtrului de restaurare va fi, în acest caz:
) , ( ) , (
1
n m H n m G

= (5.8)

Transformata Fourier a estimării imaginii iniţiale va fi:
) , ( ) , ( " ) , (
ˆ
1
n m H n m F n m F

⋅ = (5.9)

Pentru z=0: ) , ( ) , ( ) , ( ) , (
ˆ
1
n m H n m H n m F n m F

⋅ ⋅ = ⇒ (5.10)
Dacă zgomotul este nenul: 0 ) , ( 0 ≠ ⇒ ≠ n m Z z .
În acest caz, se consideră că raportul semnal-zgomot (RSZ):
• pentru semnale audio, un RSZ bun este un RSZ >20 dB
• pentru imagini, un RSZ bun este un RSZ >30 dB
În prezenţa zgomotului, relaţiile anterioare se scriu:
124
| | ) , ( ) , ( ) , ( ) , ( ) , (
ˆ
1
n m H n m Z n m H n m F n m F

⋅ + ⋅ = (5.11)
1
ˆ

⋅ + = ⇒ H Z F F (5.12)
Dacă H are zerouri, rezultă că H
-1
are poli. Rezultă că
1 −
⋅ H Z are
valori mari în vecinătatea polilor.
Exemplu: în cazul unidimensional (1D):
H
-1

H
F
1
ˆ

⋅ + = H Z F F
Figura 5.2. Exemplu de filtrare inversă în cazul 1D.

Dacă zgomotul z este zgomot alb, rezultă că Z(m,n) este constant.
1 −
⋅ ⇒ H Z are valori mari în vecinătatea zerourilor lui H.
F
ˆ
⇒ este mult diferit de F f
ˆ
⇒ este mult diferit de f.
f
f
ˆ

Figura 5.3. Semnalul original şi semnalul restaurat prin filtrare inversă,
din semnalul original degradat cu zgomot alb.

125
În figura 5.3 f
ˆ
reprezintă rezultatul restaurării, adică a estimării
semnalului original f.


5.2. Filtrul invers cu constrângeri

Lanţul complet al procesului de degradare şi restaurare este
reprezentat în figura 5.4.
+
f
h
f'
z
f"
g
f
ˆ
degradare
restaurare

Figura 5.4. Lanţul degradare-restaurare al unei imagini.

Dacă s-ar filtra f
ˆ
cu h s-ar obţine ceva apropiat de f’. Dar
diferenţa dintre f
ˆ
filtrat cu h ( h f ∗
ˆ
) şi f” este zgomotul z.
Energia zgomotului este presupusă a fi cunoscută:

∑ ∑
= =
=
L
m
K
n
z
n m Z E
1 1
2
) , ( = cunoscută (5.13)
Prin urmare, energia diferenţei dintre h f ∗
ˆ
şi f” se doreşte a fi
egală cu energia zgomotului:

z
h f f
E E =
∗ −
ˆ
"
(5.14)
Dar:
∑ ∑
= =
⋅ − − = ∗
L
i
K
j
j i h j k i l f k l h k l f
1 1
) , ( ) , ( ) , ( ) , (
ˆ
(5.15)

z
L
l
K
K
E k l h k l f k l f = ∗ − ⇒
∑ ∑
= = 1 1
2
) , ( ) , (
ˆ
) , ( " (5.16)
126
Se presupune cunoscut filtrul de degradare h. În acest caz rezultă
un sistem de ecuaţii cu L×K necunoscute, pornind de la f(l,k), unde
L l , 1 = , K k , 1 = .
Se impune ca energia derivatei lui f
ˆ
să fie minimă, pentru ca
abaterile faţă de f să fie cât mai mici. Pentru aceasta se consideră un
nucleu de filtrare c=c(l,k) care să reprezinte o măsură a derivatei ( de ex.
un laplacean sau un gaussian). Operaţia de filtrare cu nucleul c este
echivalentă cu o convoluţie discretă, proporţională cu derivata:
) , ( ) , (
ˆ
k l c k l f ∗ , în domeniul spaţial (5.17)
) , ( ) , (
ˆ
n m C n m F ∗ , în domeniul spectral (5.18)

Se doreşte ca
c f
E

ˆ
să fie minimă, adică:

∑ ∑
= =

L
l
K
k
k l c k l f
1 1
2
) , ( ) , (
ˆ
să fie minimă. (5.19)
Prin urmare, trebuie minimizată relaţia (5.19) cu constrângerea
(5.16).
Din teorema lui Parceval, se ştie că:

∑ ∑
= =
=
L
l
K
k
f
l k f E
1 1
2
) , (
ˆ

D 1

∑ ∑
= =
L
m
K
n
n m F
1 1
2
) , (

Aplicând teorema lui Parceval relaţiei (5), după aplicarea prealabilă
a transformatei Fourier, se obţine:

z
L
m
K
n
E n m H n m F n m F
K L
= ⋅ −


∑ ∑
= = , 1 1
2
) , ( ) , (
ˆ
) , ( "
1
) 16 . 5 ( (5.20)

∑ ∑
= =



L
m
K
n
n m C n m F
K L
, 1 1
2
) , ( ) , (
ˆ
1
) 19 . 5 ( = minimă (5.21)
sau:
T E K L n m H n m F n m F
z
L
m
K
n
= ⋅ ⋅ = ⋅ − ⇔
∑ ∑
= = , 1 1
2
) , ( ) , (
ˆ
) , ( " (5.22)
127

∑ ∑
= =
⋅ ⇔
L
m
K
n
n m C n m F
, 1 1
2
) , ( ) , (
ˆ
= minimă (5.23)
Se ştie că atunci când trebuie minimizată o funcţie f(x
1
, …, x
n
) cu
constrângerile:

¦
¹
¦
´
¦
=
=
0 ) ,..., (
0 ) ,..., (
1
1 1
n m
n
x x g
x x g
M (5.24)
trebuie construită funcţia Lagrange:
) ,..., ( ... ) ,..., ( ) ,..., ( ) ,..., (
1 1 1 1 1 1 n m m n n n
x x g x x g x x f x x ⋅ λ − − ⋅ λ − = Ψ

după care se minimizează funcţia Lagrange, pornind de la relaţia
uzuală:
0 =

Ψ ∂
i
x
, (5.25)
unde n i , 1 = , iar λ
i
sunt coeficienţii Lagrange.

În cazul de faţă, constrângerea este constituită de relaţia (5.16) iar
funcţia de minimizat este dată de relaţia (5.19). Se construieşte funcţia
Lagrange:
∑ ∑
= =
)
`
¹
¹
´
¦

− ⋅ − ⋅ − ⋅ = Ψ
L
m
K
n
T n m H n m F n m F n m C n m F
, 1 1
2 2
) , ( ) , (
ˆ
) , ( " ) , ( ) , (
ˆ
λ
(5.26)
T n m H n m F n m F n m C n m F
L
m
K
n
⋅ +

⋅ − ⋅ − ⋅ = Ψ ⇒
∑ ∑
= =
λ λ
, 1 1
2 2
) , ( ) , (
ˆ
) , ( " ) , ( ) , (
ˆ

Funcţiile ) , (
ˆ
n m F sunt argumentele funcţiei Ψ, în număr de L×K.
) , ( ) , ( ) , (
ˆ
n m B j n m A n m F ⋅ + = (5.27)

Rezultă că sunt 2×L×K necunoscute, adică argumentele funcţiei Ψ.
128
Se obţine sistemul:

¦
¦
¹
¦
¦
´
¦
=

Ψ ∂
=

Ψ ∂
0
) , (
0
) , (
n m B
n m A
, K n L m , 1 , , 1 = = (5.28)

Sistemul are 2×L×K ecuaţii cu 2×L×K necunoscute.
( ) ( ) = ⋅ − ⋅ ⋅ − = ⋅ −
* * *
2
ˆ
"
ˆ
"
ˆ
" H F F H F F H F F
2
2
* * *
2
ˆ
"
ˆ ˆ
" " H F F H F H F F F ⋅ + ⋅ ⋅ − ⋅ ⋅ − = (5.29)

− ⋅ ⋅ =

Ψ ∂

2
) , ( ) , ( 2
) , (
n m C n m A
n m A
(5.30)
| | 0 ) , ( ) , ( 2 ) , ( ) , ( "
ˆ
) , ( ) , ( "
2
* *
= ⋅ ⋅ − ⋅ − ⋅ ⋅ − n m H n m A n m H n m F n m H n m F λ


− ⋅ ⋅ =

Ψ ∂

2
) , ( ) , ( 2
) , (
n m C n m B
n m B
(5.31)
| | 0 ) , ( ) , ( 2 ) , ( ) , ( " ) , ( ) , ( "
2
* *
= ⋅ ⋅ − ⋅ ⋅ + ⋅ ⋅ − ⋅ − n m H n m B n m H n m F j n m H n m F j λ

Rezultă:

{ }
2 2
*
) , ( ) , (
) , ( ) , ( " Re
) , (
n m H n m C
n m H n m F
n m A
⋅ +
⋅ ⋅
=
λ
λ
(5.32)

{ }
2 2
*
) , ( ) , (
) , ( ) , ( " Im
) , (
n m H n m C
n m H n m F
n m B
⋅ +
⋅ ⋅
=
λ
λ
(5.33)

= ⋅ + = ⇒ ) , ( ) , ( ) , (
ˆ
n m B j n m A n m F
129
) , ( " ) , (
) , ( ) , (
) , ( ) , ( "
2 2
*
n m F n m G
n m H n m C
n m H n m F
⋅ =
⋅ +
⋅ ⋅
=
λ
λ
(5.34)


2 2
*
) , ( ) , (
) , (
) , (
n m H n m C
n m H
n m G
⋅ +

= ⇒
λ
λ
(5.35)

G este funcţia de transfer a filtrului de restaurare, cu necunoscuta λ.
S-a arătat că:
T E K L n m H n m F n m F
z
L
m
K
n
= ⋅ ⋅ = ⋅ −
∑ ∑
= = , 1 1
2
) , ( ) , (
ˆ
) , ( " (5.36)

Relaţiile (5.35) şi (5.36) formează un sistem cu L×K+1 ecuaţii cu
L×K+1 necunoscute, constituite de λ plus necunoscutele lui ) , (
ˆ
n m F , în
număr de L×K.
Sistemul format din relaţiile (5.35) şi (5.36) este neliniar, iar
rezolvarea sa se poate face prin metode numerice, acesta fiind
dezavantajul filtrului invers cu constrângeri.
130

6. Morfologie matematică


Morfologia matematică (în limba greacă morphos = formă, logos =
ştiinţă, deci ştiinţa formelor) constă într-o abordare bazată pe formă, a
prelucrării imaginilor. Ideea de bază a unei prelucrări morfologice este
considerarea imaginii ca un ansamblu (mulţime, reuniune de puncte sau
obiecte) asupra căruia se aplică transformări a căror esenţă este comparaţia
cu mulţimi mai simple, numite elemente structurante.
Prin urmare, transformările morfologice (care sunt neliniare şi
neinversabile) se bazează pe compararea imaginii (sau a unui obiect
conţinut în imagine) cu un obiect mai mic, de formă cunoscută, numit
element structurant. În urma acestei comparaţii sunt extrase din imaginea
iniţială zonele ce corespund proprietăţilor (de formă şi dimensiune)
specifice elementului structurant folosit. De exemplu, recunoaşterea unei
forme implică identificarea locală a părţilor sale componente, deci o
simplă operaţie de potrivire de măşti ("pattern matching").


6.1. Transformarea Hit or Miss

Transformarea morfologică de bază este transformarea “Hit or
Miss”, ce ar putea fi numită şi “Totul sau Nimic” (sau “Ochit sau Ratat”,
într-o traducere cuvânt cu cuvânt, din limba engleză). Efectul aplicării
acestei transformări de identificare este extragerea din imagine a punctelor
a căror vecinătate este identică cu elementul structurant folosit.
Transformarea “Hit or Miss” a mulţimii A prin elementul
structurant B se defineşte ca fiind:
{ }
c
x x
A B A B x B A ⊂ ⊂ = ∗ ) ( & ) ( |
2 1
(6.1)
unde:
c
A este complementara mulţimii A;
131
1
B şi
2
B formează o partiţie netă a lui B, adică:
B B B = ∪
2 1
şi Φ = ∩
2 1
B B ; (6.2)
{ } B b x b B
x
∈ + = = translaţia mulţimii B cu vectorul x, sau
translaţia mulţimii B cu originea, în punctul x (figura 6.1).
B
x
B
y
x
x

Figura 6.1. Translaţia mulţimii B cu vectorul x.

Trebuie specificat faptul că oricărui element structurant trebuie să i
se ataşeze o origine.

Exemplu: Să se efectueze transformarea “Hit or Miss” a mulţimii
A prin elementul structurant B, unde:

originea lui B originea nu aparţine lui B
2

• • • • • • •
• • ⊗ •
• • •
• ⊗ • •
• • •
=
x x x
x x x x
x x x
x x x x
A ,
• • •

• •
= x x
x
B ,
x x
x
B =
1
,
x x x
x
x x
B • =
2


A este reprezentată de punctele marcate cu x, iar cu “•” au fost
marcate punctele care aparţin fundalului.
132
Rezultatul transformării este dat de cele 2 puncte marcate
(încercuite) pe mulţimea A (punctele peste care se suprapun perfect
1
B şi
2
B , adică B).
Transformarea “Hit or Miss” prezintă un interes mai mult teoretic,
dar datorită structurii sale stă la baza construcţiei teoretice a morfologiei
matematice. Pe baza acestei transformări se pot defini operaţiile
morfologice fundamentale (erodarea şi dilatarea).


6.2. Erodarea

Erodarea mulţimii A prin elementul structurant B se defineşte ca:
( ) { }
|
|
.
|

\
|
∗ = ⊂ = Θ
=
∅ =
B B
B
x
B A A B x B A
1
2
(6.3)

După cum se observă din definiţie, erodarea se poate obţine ca un
caz particular al transformării “Hit or Miss” şi anume pentru ∅ =
2
B şi
B B =
1
.
Erodarea unei mulţimi A prin elementul structurant B este
mulţimea punctelor, pentru care elementul structurant translatat cu
originea în punctul respectiv este inclus în mulţimea ce se erodează.
Rezultatul transformării se numeşte erodata (sau eroziunea) mulţimii A
prin elementul structurant B.
Efectul general al erodării este acela de subţiere a corpurilor,
subţiere care depinde de structura elementului structurant. Mulţimile
considerate pot fi continue sau discrete.

Exemplu:
- în cazul mulţimilor continue:
Dacă:
133

B=



A= ⇒ AΘB=





A= ⇒ AΘB=



- în cazul mulţimilor discrete:

• •
⊗ ⊗

• • • •
= Θ
x x
x x
x x x
B A
x
x x x
x
B =


• ⊗ •
⊗ ⊗ ⊗
⊗ ⊗ •
• • •
= Θ
x
x
x
x
B A x x B =

A este reprezentată de punctele marcate cu x, iar cu “•” au fost
marcate punctele care aparţin fundalului. Punctele încercuite sunt
rezultatele erodării AΘB.

134

6.3. Dilatarea

Dilatarea unei mulţimi A prin elementul structurant B se defineşte
prin relaţia:
{ }
C
B B
B x
B A A B x B A
|
|
.
|

\
|
= ∅ ≠ ∩ = ⊕
=
∅ =
2
1
| * ) ( | (6.4)

Dilatarea unei mulţimi A prin elementul structurant B este
mulţimea punctelor pentru care elementul structurant deplasat cu originea
în punctul respectiv are puncte comune (cel puţin unul) cu mulţimea A ce
se dilată. Rezultatul transformării se numeşte dilatată (sau dilatarea)
mulţimii A prin elementul structurant B.
Efectul general al operaţiei de dilatare este acela de îngroşare a
obiectelor. Transformarea poate fi aplicată atât pe mulţimi continue, cât şi
pe mulţimi discrete.

Exemplu:
- în cazul mulţimilor continue:

B =


A = B A ⊕ =




A = B A ⊕ =


135

- în cazul mulţimilor discrete:
x
x x x
x
B =
• • • Θ • •
• Θ Θ ⊗ Θ •
Θ ⊗ ⊗ ⊗ ⊗ Θ
Θ ⊗ ⊗ ⊗ Θ •
• Θ ⊗ Θ • •
• • Θ • • •
= ⊕ B A

x x B =
• • • ⊗ Θ •
• ⊗ ⊗ ⊗ ⊗ Θ
• ⊗ ⊗ ⊗ Θ •
• • ⊗ Θ • •
• • • • • •
= ⊕ B A
A este reprezentată de punctele marcate cu x, iar cu “•” au fost
marcate punctele care aparţin fundalului. Punctele încercuite reprezintă
rezultatele dilatării B A⊕ .
Dilatarea şi erodarea nu sunt transformări inverse una alteia (şi nici
nu admit inversă):
A B B A ≠ Θ ⊕ ) ( (6.5)
A B B A ≠ ⊕ Θ ) (

Dilatarea este o operaţie extensivă ( ) B A A ⊕ ⊆ , în timp ce
eroziunea este o operaţie antiextensivă (A⊇AΘB) numai în cazul folosirii
elementelor structurante ce îşi conţin originea. Elementele structurante
clasice sunt variantele discretizate ale discului unitar, vecinătatea
4
V şi
vecinătatea
8
V :

x
x x x
x
V =
4

x x x
x x x
x x x
V =
8

136

Dilatarea şi erodarea sunt operaţii intensive din punct de vedere
matematic, deoarece este evident că aplicarea transformărilor morfologice
implică verificarea condiţiilor de definiţie pentru fiecare punct al imaginii
(evitând evidentele efecte de margine), deci complexitatea algoritmică
este comparabilă cu a unei operaţii de filtrare în domeniul spaţial.
Pentru evitarea sau micşorarea complexităţii calculelor ar trebui
găsită o metodă care să nu implice verificarea fiecărui punct al imaginii, ci
eventual fiecare punct al structurantului. Aceasta se poate obţine prin
rescrierea operaţiei de erodare:
{ } a x b î a A a B b x B A = + ∈ ∃ ∈ ∀ = Θ . . , , =

{ }
b
B b
b
B b
A A b a x î a A a B b x
S



= = − = ∈ ∃ ∈ ∀ I I . . , , (6.6)

unde B
-S
=-B este simetrica mulţimii B faţă de origine, iar A
b
este
translaţia mulţimii A în punctul b.
Astfel, se fac operaţii mult mai puţine şi în plus se permite
implementarea paralelă deoarece fiecare translaţie se poate face pe unităţi
diferite, iar la sfârşit se face intersecţia rezultatelor acestora.
În mod similar, pentru dilatare se obţine:
{ }
b
B b
x
A A B x B A
S

= ∅ ≠ = ⊕ U I | (6.7)


6.4. Proprietăţile operaţiilor morfologice

1. Invarianţa la translaţie:
( )
t t
B A B A ⊕ = ⊕ (6.8)
( )
t t
B A B A Θ = Θ

137
( )
t t
B A B A

⊕ = ⊕ În acest caz intervine semnul ”-” deoarece în
definiţia erodării şi dilatării intervine mulţimea simetrică
( )
t t
B A B A

Θ = Θ

2. Invarianţa la scalare:
( ) B A B A ⊕ ⋅ = ⊕ λ
λ
1
(6.9)
( ) B A B A Θ ⋅ = Θ λ
λ
1
, | | 1 , 0 ∈ λ

3. Erodarea şi dilatarea sunt transformări duale una alteia:
( )
C
C
B A B A Θ = ⊕ (6.10)
( )
C
C
B A B A ⊕ = Θ
Această dualitate se manifestă faţă de operaţia de complementare a
mulţimilor.

4. Dilatarea şi erodarea nu sunt inverse una alteia şi nici nu admit inversă:
( ) A B B A ≠ ⊕ Θ (6.11)
( ) A B B A ≠ Θ ⊕

5. Descompunerea elementului structurant:
( ) ( ) ( ) C B A C A B A U U ⊕ = ⊕ ⊕ (6.12)
( ) ( ) ( ) C B A C A B A U I Θ = Θ Θ

6. Proprietatea de iterare:
( ) ( ) C B A C B A
S
⊕ ⊕ = ⊕ ⊕ (6.13)
( ) ( ) C B A C B A
S
Θ Θ = Θ Θ
Caz particular:
B=C ; B=B
S
( ) B A B B A 2 ⊕ = ⊕ ⊕ ⇒ , ( ) B A B B A 2 Θ = Θ Θ
138

6.5. Transformări morfologice derivate

Prin iterarea unor operaţii morfologice de bază se obţin
transformări morfologice mai complexe, numite şi transformări
morfologice derivate sau filtre morfologice.


6.5.1. Operatori de extragere a conturului

Dintre extractoarele morfologice de contur, cele mai utilizate sunt:
• conturul exterior:
( ) A B A A − ⊕ = ∆ , (6.14)
unde ”-” reprezintă diferenţa între mulţimi.

• conturul interior:
( ) B A A A Θ − = δ (6.15)

• gradientul morfologic:
( ) ( ) B A B A gradA Θ − ⊕ = (6.16)

Exemplul 1:

• • • • • •
• • • •
• ⊗ ⊗ •
• ⊗ • •
• • • • •
• • • • • •
=
x x
x x
x x
x
A
x
x x x
x
B =
B AΘ
δA = conturul interior
∆A = conturul exterior

139
În acest caz (structurant simetric), gradientul morfologic va fi
reuniunea celor două contururi.
Cu cât structurantul este mai mic, conturul va fi mai subţire.

Exemplul 2:

• • • • • •
• • • •
• •
• • •
• • • • •
• • • • • •
=
x x
x x x x
x x x
x
A x x x B =
δA = conturul interior
∆A = conturul exterior

În acest caz, structurantul este simetric după o singură direcţie.

Exemplul 3:

• • • • • •
• • • •
• •
• • •
• • • • •
• • • • • •
=
x x
x x x x
x x x
x
A x x B=
δA = conturul interior
∆A = conturul exterior


În acest caz, structurantul este asimetric şi se pierde conturul
exterior, corespunzător direcţiei de simetrie, din cazul anterior. Prin
urmare, pentru obţinerea de contururi direcţionale, trebuie utilizate
elemente structurante direcţionale.

140

6.5.2. Deschiderea şi închiderea

Deschiderea mulţimii A prin elementul structurant B se defineşte
ca fiind:
( )
S
B B A B A ⊕ Θ = o (6.17)

unde { } B x x B B
S
∈ − = − = , reprezintă mulţimea simetrică a
mulţimii B faţă de origine (se mai numeşte şi transpusa mulţimii B).
Mulţimea rezultată după o deschidere este diferită de mulţimea originală.
Din punct de vedere al acţiunii asupra obiectelor (figura 6.2), în
urma unei deschideri rezultă (efectul deschiderii este reprezentat cu linie
punctată) o lărgire a golurilor înglobate în obiect, eliminarea obiectelor
mici (mai mici decât elementul structurant folosit), netezirea contururilor
prin teşirea convexităţilor şi separarea obiectelor unite prin “istmuri”
(zone) mai mici decât dimensiunea elementului structurant.

deschidere
închidere
Figura 6.2. Ilustrarea efectului deschiderii şi închiderii morfologice.

Închiderea mulţimii A prin elementul structurant B este:
( )
S
B B A B A Θ ⊕ = • (6.18)
Închiderea este operaţia duală deschiderii faţă de complementarea
mulţimilor:
141
( ) ( ( ) ) ( ) ( ) ( ) B A B B A B B A B B A B A
S S C
C
S C
C
C
o = ⊕ Θ = Θ Θ = Θ ⊕ = •
(6.19)
( ) ( ( ) ) ( ) ( ) ( ) B A B B A B B A B B A B A
S S C
C
S C
C
C
• = Θ ⊕ = ⊕ ⊕ = ⊕ Θ = o

Datorită acestei proprietăţi de dualitate, închiderea va avea asupra
fundalului aceleaşi efecte pe care le are deschiderea asupra obiectelor.
Prin urmare, efectul închiderii asupra obiectelor (reprezentat cu linie
îngroşată în figura 6.2) poate fi găsit prin complementare, adică închiderea
va umple golurile înglobate în obiecte, va netezi contururile prin umplerea
concavităţilor şi va fuziona obiectele foarte apropiate (umplerea
strâmtorilor de dimensiuni mai mici decât a elementului structurant).
Deschiderea este o operaţie antiextensivă ( ) A B A ⊆ o , în timp ce
închiderea este o transformare extensivă ( ) A B A ⊇ • . În acelaşi timp,
deschiderea şi închiderea sunt transformări idempotente, adică iterarea
deschiderilor sau închiderilor succesive, cu acelaşi element structurant, nu
mai produc modificări:
( ) B A B B A o o o =
( ) B A B B A • = • • (6.20)

După cum s-a arătat, închiderea şi deschiderea sunt de fapt nişte
filtre deoarece au un efect de netezire a formelor. Pentru o netezire mai
puternică se foloseşte un structurant mai mare. Mărirea gradată a
elementului structurant folosit şi aplicarea alternativă a deschiderii şi
închiderii (pentru a beneficia de efectele lor complementare) a dus la
definirea filtrelor alternate secvenţial (FAS):
( ) ( ) ( ) ( ) ( ) ... 3 3 2 2 ) ( B B B B B B A A FAS • • • = o o o (6.21)

unde: B B B B B k ⊕ ⊕ ⊕ = ⋅ ... (de k ori).
Filtrele alternate secvenţial constau în deschideri şi închideri
alternate succesiv, cu elemente structurante de dimensiune crescătoare.
142
Aplicarea FAS poate fi oprită în orice moment, obţinându-se astfel o
netezire gradată, interactivă a imaginii.


6.6. Trierea dimensională a obiectelor

Cu ajutorul transformărilor morfologice se poate realiza şi trierea
dimensională a obiectelor. Aceasta se obţine prin utilizarea transformării
“Top Hat”. Transformarea de tip “Top Hat” (TH) a mulţimii A prin
elementul structurant B se defineşte ca:

( ) ( ) B A A A TH o − = (6.22)

Rezultatul aplicării acestei transformări este o imagine ce conţine
toate punctele eliminate de deschiderea imaginii prin elementul structurant
folosit. După cum se poate observa, transformarea “Top Hat” are efect
invers celui al unei site: păstrează obiectele mai mici. Dar, prin
deschidere, obiectele nu îşi mai păstrează forma iniţială, deci, pentru
extragerea formei exacte a obiectului trebuie realizată o operaţie de
reconstrucţie.
Există şi varianta transformării de tip “Top Hat” generalizată:

( ) ( ) ( ) B n A B n A A TH
g 2 1
o o − = ,
1 2
n n > (6.23)

Transformarea “Top Hat” simplă se obţine ca un caz particular:


1
0
2
1
) ( ) (
=
= =
n
n A THg A TH (6.24)



143
Exemplu:
~B (obiecte cu dimensiuni
mai mici decât B)
A=
~2B
~4B

TH(A)=
) ( B A A o −
= B Ao

TH(A)=
) 2 ( B A A o −
= B A 2 o


Se observă că transformarea “Top Hat” simplă se comportă ca un
filtru de tip trece-sus, iar “Top Hat” generalizat se comportă ca un filtru
de tip trece-bandă (ne permite să obţinem obiecte cu dimensiune cuprinsă
între B n
1
şi B n
2
).


6.7. Caracterizarea morfologică a formelor

Cu ajutorul transformărilor morfologice se poate realiza şi
caracterizarea morfologică a formelor, care poate implica două aspecte:
extragerea de informaţii asupra formei date sau compararea formei
respective cu o altă formă (etalon).
144


6.7.1. Reconstrucţia după marker

Reconstrucţia (φ) unei imagini (I) pe baza unor markeri (M), poate
fi descrisă prin următoarea relaţie:

U
I ∅ ≠
=
M I
j M
j
I I ) ( ϕ (6.25)

Reconstrucţia imaginii I după markerul M este egală cu intersecţia
elementelor I
j
ale elementelor conexe ale imaginii I cu proprietatea că
intersecţia lor cu markerul este nevidă.
I
1

I
k

I
N

I
1
I
N
Imaginea I Markerii M

Figura 6.3. Reconstrucţia după markeri.

O modalitate de determinare a unor markeri este de a utiliza
transformarea Top Hat. O problemă care se pune în cazul reconstrucţiei
după markeri este etichetarea imaginii, pentru a putea fi comparată cu
markerii. Metoda de etichetare trebuie să fie cât mai rapidă.






145

6.7.2. Distanţa Haussdorf

Pentru a se compara sau calcula asemănarea dintre două obiecte, se
compară obiectul dat cu un obiect martor, se defineşte o distanţă între
obiecte şi se impune ca distanţa să fie cât mai mică.
Distanţa Hausdorff dintre mulţimile K
1
şi K
2
, în domeniul continuu
se defineşte ca fiind:
{ } B K K & B K K K K d ⋅ ⊕ ⊆ ⋅ ⊕ ⊆ = ε ε ε
1 2 2 1 2 1
inf ) , ( (6.26)

În domeniul discret, distanţa Hausdorff dintre mulţimile K
1
şi K
2
este:
{ } B n K K & B n K K n K K d ⋅ ⊕ ⊆ ⋅ ⊕ ⊆ =
1 2 2 1 2 1
inf ) , ( (6.27)

Distanţa Hausdorff este o măsură bună a asemănării obiectelor doar
dacă acestea sunt centrate. În plus, este şi greu de calculat şi din acest
motiv se foloseşte mai rar în practică.


6.7.3. Extragerea skeletonului morfologic

Un concept important în prelucrarea şi analiza imaginilor,
îndeosebi la recunoaşterea formelor, îl constituie skeletonul morfologic,
cu aplicaţii la compresia imaginilor binare, recunoaşterea, aproximarea şi
reconstrucţia formelor.
Extragerea skeletonului morfologic se bazează pe conceptul de disc
maximal inclus într-o mulţime (A). Astfel, pentru o mulţime binară plană
închisă A, se defineşte discul maximal B
r
(x) de centru x şi rază r, prin
relaţia:

¹
´
¦
=
=
⇔ ⊆ ⊆
'
'
) ' ( ) (
'
r r
x x
A x B x B
r r
(6.28)
146
Aceasta însemnă că discul maximal este inclus în mulţimea A şi nu
există nici un alt disc inclus în A care să-l conţină
Skeletonul morfologic al unei forme este egal cu reuniunea
centrelor discurilor maximale incluse în forma respectivă. În practică se
foloseşte formularea echivalentă:
U
max
) ( ) (
N
n
n
A S A SK
∅ =
= , (6.29)
unde SK(A) este skeletonul mulţimii A, iar S
n
(A) se numesc seturi
skeleton de ordinul n:
( ) ( ) ( | ( ) ) | ( ) ( | ) | B nB A nB A B B n A nB A A S
n
o Θ − Θ = ⊕ + Θ − Θ = 1 (6.30)

Discul unitate, B, poate fi V4 sau V8, în funcţie de metrica utilizată
în spaţiul discret, astfel:
• dacă se utilizează distanţa euclidiană, discul unitar este V4;
• dacă se utilizează distanţa inter-bloc, discul unitar este V8. Distanţa
inter-bloc, pentru punctul de coordonate (i, j) este:
( )
y x y x i
j j i i y x d − − = , max ) , ( (6.31)

Exemplu:
Se dă mulţimea A şi elementul structurant B:


x x x x x x x x
x x x x x x x x
x x x x x x x x
x x x x
x x x x
x x x x
x x x x
A = ,
x
x x x
x
B =
Figura 6.4. Exemplul unei mulţimi A şi a uni element structurant B.

147
Setul skeleton de ordinul 0 este:
( ) ( | ) | B B A A A S ⊕ Θ − =
0
: (6.32)

x x
x x
x x

x x x x x x
x x
x x
x x
x x
x x
x x
A S
⊗ ⊗ ⊗ ⊗ ⊗ ⊗
⊗ ⊗ ⊗ ⊗
⊗ ⊗
⊗ ⊗
⊗ ⊗
= ) (
0

- punctele încercuite = B AΘ
- punctele încadrate = B B A ⊕ Θ ) (
- punctele îngroşate:
B B A A A S ⊕ Θ − = ) ( ) (
0


Figura 6.5. Setul skeleton de ordinul 0 al mulţimii A din figura 6.4.

În mod similar:
( ) ( ) ( | ) | B B A B A A S ⊕ Θ − Θ = 2
1
, unde B B A B A Θ Θ = Θ ) ( 2 (6.33)
( ) ( ) ( | ) | B B A B A A S ⊕ Θ − Θ = 3 2
2
(6.34)
( ) ( ) ( | ) | ∅ = ⊕ Θ − Θ = B B A B A A S 4 3
3
, (6.35)
2
max
= ⇒ N , pentru exemplul prezentat.
U
max
) ( ) (
N
n
n
A S A SK
∅ =
= ⇒ (6.36)

( )
x x
x x x x
x x x x
x x
x x
x x
A SK =
Figura 6.6. Setul skeleton de ordinul 3 al mulţimii A din figura 6.4.
148
Se observă că skeletonul unui obiect are mai puţine puncte decât
obiectul.
Skeletonul morfologic este o transformare reversibilă, adică se
poate obţine forma iniţială A, cunoscând skeletonul acesteia:
( ) ( )
U
max
0
N
n
n
nB A S A
=
⊕ = (6.37)
Se observă că pentru a putea reconstitui forma iniţială, pentru
fiecare punct al skeletonului, trebuie menţionat setul skeleton căruia îi
aparţine:

( )
0 0
1 1 1 1
0 2 2 0
1 1
1 1
0 0
= A SK
Figura 6.7. Seturile skeleton al mulţimii A din figura 6.4.

Dacă 2 obiecte au skeletoanele identice, atunci au aceeaşi formă.
Detaliile fine sunt conţinute în seturile skeleton de ordin mic, iar
cele grosiere în seturi skeleton de ordin mare. Deci, o reconstituire
aproximativă Ã a formei A se poate face eliminând detaliile fine, adică
seturile skeleton de ordin mic:
Ã= ( ) ( )
U
max N
k n
n
nB A S
=
⊕ (6.38)
În cazul continuu, skeletonul unui disc este centrul său, iar
skeletonul unui pătrat este format din diagonalele sale (figura 6.8).
149
x

Figura 6.8. Skeletoanele unor forme continue cunoscute.

Utilizarea skeletonului morfologic pentru recunoaşterea formelor
este restricţionată de puternica sa sensibilitate la zgomote, deoarece o
mică schimbare a formei duce la o modificare puternică a skeletonului
său. De exemplu, skeletonul unui disc lipsit de centru se transformă dintr-
un punct într-un cerc (figura 6.9).


Figura 6.9. Skeletonul unui disc lipsit de centru său.


6.7.4. Skeletonul generalizat

Skeletonul generalizat (GSK) este definit prin elemente
structurante generalizate. Fie { }
n
E un set de mulţimi având perioada T,
adică:
n kT n
E E =
+
, Ζ ∈ ∀ k n, . Pe baza acestui set generator (constructor)
se poate construi un set de elemente structurante generalizate, pe baza
relaţiilor:

{ }
¹
´
¦
= ⊕ =
= =

n t de ordin structuran elementul E B B
) (originea t de ordin structuran elementul B
n n n
n


1
0
0 0
(6.39)

150
Exemplu: Pentru: T=1 şi
x x
x x
E =
1

...
x x x x
x x x x
x x x x
x x x x
B
x x x
x x x
x x x
B
x x
x x
B x B = = = = ⇒
3 2 1 0
(6.40)
Pentru extragerea skeletonului morfologic trebuie construită o
hartă de distanţe a obiectului, adică fiecărui punct al obiectului (mulţimii)
i se ataşează ordinul elementului structurant generalizat maximal centrat
în punctul respectiv:
( )
( ) ( )
¹
´
¦
⊄ ⊂

=
A B A si B n , dacã
A , dacã x
x D
n
x
n-1
0
(6.41)
Exemplu:

x x x x x x x x
x x x x x x x x
x x x x x x x x
x x x x
x x x x
x x x x
x x x x
A =
1 1 1 1 1 1 1 1
1 2 2 2 2 2 2 2
1 2 3 3 3 3 3 3
1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
= D (6.42)

Skeletonul generalizat al unei forme este mulţimea centrelor
elementelor structurante maximale incluse în formă, adică:
( ) ( ) ( ) { } y x B B x A GSK
y
y D
x
x D
≠ ∀ ⊄ =
− −
, |
1 ) ( 1 ) (
(6.43)
151
( )
1 1 1 1 1 1 1 1
1 2 2 2 2 2 2 2
1 2 3 3 3 3 3 3
1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
= A GSK =
1 1 1 1 1 1 1 1
1 2 2 2 2 2 2 2
1 2 3 3 3 3 3 3
1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
(6.44)

După cum se observă, skeletonul generalizat conduce la obţinerea
unei rate de compresie mai bune decât în cazul skeletonului morfologic
(exemplele prezentate pun în evidenţă acest fapt: skeletonul morfologic e
alcătuit din 16 puncte în timp ce skeletonul generalizat conţine doar 7
puncte).
În ultima figură punctele încercuite reprezintă punctele suficiente
pe baza cărora se poate reconstitui forma iniţială, exemplificându-se astfel
că skeletonul generalizat nu este minimal din punct de vedere al ratei de
compresie.


6.8. Extinderea morfologiei matematice la imagini cu niveluri
de gri

Prin extinderea morfologiei matematice la imagini cu niveluri de
gri se realizează trecerea de la mulţimi la funcţii şi invers. Pentru aceasta
se consideră o mulţime A inclusă în mulţimea părţilor lui Z
n
. Un element
al acesteia este de forma:
= x
{
) , (
) , (
sup
1 1
1 2 1
n n A
rafata
n
) ,n A(
patial domeniu s
n
x ,...,x ,x x
4 43 4 42 1


(6.45)

152

6.7.1. Trecerea de la mulţime la funcţie

Transformarea prin care se realizează trecerea de la o mulţime A la
o funcţie f se numeşte vârf (în engleză Top):

f A T = ] [ , unde ) , ( ) 1 , 1 ( : n n A n A f → − (6.46)
{ } A y z y z f ∈ = ) , ( max ) ( , unde ) 1 , 1 ( − ∈ n A z (6.47)

Pentru n=2 avem o mulţime planară:
) , ( ) , (
2 1
j i x x = (6.48)

Dacă alegem i = domeniul spaţial, iar j = suprafaţa, topul s-ar
obţine prin fixarea ) 1 , 1 ( − ∈ n A z şi ar arăta ca în figura:

x
x x
x x x x
x x x x x x
j
i
Se fixează z∈A(1,n-1)

Figura 6.10. Topul unei mulţimi.




153
6.8.2. Trecerea de la funcţie la mulţime

Transformarea prin care se realizează trecerea de la o funcţie f la o
mulţime A se numeşte umbră:
A f U = ] [ , unde Z Z ⊂ → ⊂ −

) , ( ) 1 , 1 ( :
1
n n A n A f
n
(6.49)

)
`
¹
¹
´
¦

− ∈
= y z f
n n A y
n A z
y z f U ) ( ,
) , ( ,
) 1 , 1 (
) , ( ] [ (6.50)
Exemplu:
x
x x
x x x x
x x x x x x
x x x x x x
x x x x x x
x x x x x x
x x x x x x
x x x x x x
j
i
umbra unei funcţii este
semiinfinită


Figura 6.11. Umbra unei funcţii.

Deoarece umbra unei funcţii este o mulţime semiinfinită, se poate
introduce o limitare, la un nivel λ:

)
`
¹
¹
´
¦
≥ ≥
− ∈
= λ
λ
y z f
n n A y
n A z
y z f U ) ( ,
) , ( ,
) 1 , 1 (
) , ( ] [ (6.51)
] [ lim ] [ f U f U
λ
λ ∞ →
= ⇒ (6.52)

154
Proprietăţi:
1. | | | | f f U T = (6.53)
2. | | | | A A T U ⊇ , (6.54)
deoarece umbra unei funcţii este o mulţime semiinfinită


6.8.3. Lucrul cu funcţii

Dilatarea unei funcţii f cu un structurant (sau funcţie structurant) g:
| | ] [ ] [ g U f U T g f ⊕ = ⊕ (6.55)

În mod similar, se poate defini erodarea unei funcţii f cu un
structurant (sau funcţie structurant) g:
| | ] [ ] [ g U f U T g f Θ = Θ (6.56)

Acestea sunt:

) (
)) ( ) ( sup(
g supp y
y g y x f g f

+ − = ⊕ , (6.57)

) (
)) ( ) ( inf(
g supp y
y g y x f g f

− − = Θ (6.58)
unde { } −∞ > = ) ( ) ( y g y g supp , reprezintă suportul lui g.

Exemplu:
suppV4: toate punctele lui V4 dar şi cele de sub V4 (până la -∞)
aparţin suportului.
155


x
x x x
x

Figura 6.12. Suportul lui V4.

Suportul plat (engl. flat) a funcţiei g se defineşte astfel:
) ( , 0 ) ( g supp y y g ∈ ∀ = , (6.59)

adică nu mai avem punctele de sub V4, în cazul exemplului de mai
sus.
În acest caz:
)) ( ( max
) (
y x f g f
g supp y
− = ⊕

(6.60)
)) ( ( min
) (
y x f g f
g supp y
− = Θ

(6.61)

În cazul în care se utilizează un structurant non-flat, pot să apară
situaţii când valoarea minimă (min) şi maximă (max) nu sunt cuprinse în
gama de niveluri de gri, adică sunt mai mici decât 0 sau mai mari decât
N-1. În acest caz, pentru niveluri de gri cuprinse în intervalul [0,N-1],
există două alternative:
1. se rescalează domeniul, păstrându-se nivelul relativ de gri:
156
N-1
N-1+k
2
N-1+k
1

0

Figura 6.13. Rescalarea domeniului.

2. se limitează valorile negative la 0 şi cele mai mari ca N-1 la N-1, în
acest fel pierzându-se informaţie.

Astfel de elemente structurante pot fi utilizate la îmbunătăţirea
contrastului imaginilor. Pentru
2 1
f f f ≤ ≤ :
¹
´
¦
− + >
− + ≤
=
2 1 2
2 1 1
) 1 ( ) , ( ), , (
) 1 ( ) , ( ), , (
) , ( '
f k kf n m f n m f
f k kf n m f n m f
n m f


, k∈[0,1] (6.62)
t
f(t)
f
1

f
2

f
pentru
2
1
= k
pentru k=0 sau 1

Figura 6.14. Îmbunătăţirea contrastului imaginilor.

O îmbunătăţire a performanţelor se obţine luând:
g f f o =
1
şi g f f • =
2
sau (6.63)
g f f Θ =
1
şi g f f ⊕ =
2
(6.64)
157

7. Segmentarea imaginilor

Segmentarea reprezintă o categorie de tehnici de prelucrare care
permite descompunerea unei scene în componentele sale sau extragerea
din imagini a unor elemente constituente de interes (obiecte, fundal etc) în
scopul analizei lor ulterioare şi eventual al clasificării lor. În urma
procesului de segmentare, din imagine se extrag regiuni omogene închise
de puncte de frontieră (contur), obiecte distincte sau regiuni omogene care
satisfac anumite criterii de uniformitate.
Metodele de segmentare a imaginilor se pot clasifica în două mari
clase:
• segmentare orientată pe regiuni
• segmentare orientată pe contururi


7.1. Segmentarea orientată pe regiuni

Prin detecţia regiunilor omogene se înţelege gruparea pixelilor din
imagine în categorii distincte în funcţie de proprietăţile lor (de exemplu
nivelul de gri), astfel încât să se pună în evidenţă regiuni caracterizate de o
relativă uniformitate. Zonele astfel determinate permit în ultimă instanţă o
separare a obiectului ce trebuie analizat de fundalul imaginii şi de
eventuale alte obiecte aflate în scenă.
Tehnicile de segmentare orientate pe detecţia regiunilor omogene
se pot clasifica în:
• metode bazate pe etichetarea grupurilor conexe de pixeli cu
caracteristici similare;
• metode de segmentare bazate pe histograma imaginii;
• tehnici de creştere şi fuziune a regiunilor.

158

7.1.1. Etichetarea componentelor

Această metodă de segmentare a imaginilor binare constă în
asocierea unui acelaşi număr (numit etichetă), tuturor punctelor unui
obiect conex.
Metoda bazată pe etichetarea componentelor se implementează
prin succesiuni de baleieri normale (sus-jos, stânga-dreapta) şi inverse a
imaginii de segmentat.
1 1
1 1 1
2
2 2
2
2
2
1 1
1 1 1
2
2 2
2
2
3
Figura 7.1. Etichetarea componentelor.

La întâlnirea unui punct al unui obiect care nu are nici un punct
vecin deja etichetat, i se atribuie o nouă etichetă. Se continuă baleierea
până la întâlnirea unui alt punct, căruia i se atribuie eticheta vecinului (sus,
jos, stânga, dreapta, diagonală), dacă are. Dacă are doi (sau mai mulţi)
vecini cu etichete diferite i se atribuie eticheta cu valoarea cea mai mică.
Decizia cărui obiect îi aparţine se face la baleierea inversă, respectând
algoritmul de mai sus. Baleierea se repetă până nu se mai schimbă nimic.
Dezavantajul acestei tehnici este că nu asigură obţinerea etichetelor
în ordine (figura 7.2), iar numărul de baleieri depinde de conţinutul
imaginii.
159


1111
2222222
4444

Figura 7.2. Exemplu de rezultat al segmentării prin etichetarea
componentelor.

O altă tehnică de a implementa metoda de etichetare a
componentelor se bazează pe analiza conexităţii pe secvenţe.
Pentru a implementa această metodă, se analizează imaginea, linie
cu linie şi se etichetează punctele obiectelor, pe linii. În etapa următoare se
analizează adiacenţa secvenţelor pentru a defini obictele.
X X
X X X
X
X X
X
X
X X
X
X
I (2,3), (6,2) – pe linia I există un obiect pe poziţia 2, de lungime 3 X
II (1,3), (7,2) – pe linia II există un obiect pe poziţia 1, de lungime 3
III (5,3) – pe linia III există un obiect pe poziţia 5, de lungime 3
IV (5,2) – pe linia IV există un obiect pe poziţia 5, de lungime 2

Figura 7.3. Exemplu de segmentare prin analiza conexităţii pe secvenţe.


7.1.2. Metoda aborelui cuaternar (quad-tree)

Această metodă, care se mai numeşte şi "Divide şi contopeşte", se
bazează pe împărţirea recursivă a imaginii în câte 4 regiuni sau sferturi de
imagine până la obţinerea de regiuni uniforme sau regiuni formate
dintr-un singur pixel. Acestei împărţiri i se poate asocia un arbore
cuaternar, în care fiecare nod terminal are patru descendenţi.
160


Figura 7.4. Principiul segmentării prin metoda arborelui cuaternar.

Nodul principal este constituit de întreaga imagine, iar nodurile
secundare reprezintă câte un sfert de imagine. Împărţirea imaginii se
repetă până când se obţin numai careuri uniforme (care conţin aceeaşi
valoare).


Figura 7.5. Împărţirea imaginii la segmentarea prin metoda arborelui
cuaternar.

Pentru a implementa segmentarea prin metoda arborelui cuaternar,
imaginea trebuie să fie pătrată şi de dimensiune putere a lui 2.
Segmentarea se face prin împărţirea succesivă până se obţine zone
uniforme sau s-a ajuns la nivel de pixel. În continuare se concatenează
zonele ce conţin „1” logic, rezultând obiectele.
161

X
X
X
X
X
X
X X
X
X
X
X
X
X
X
X
X
X
X

Figura 7.6. Împărţirea imaginii la segmentarea prin metoda arborelui
cuaternar şi concatenarea zonelor cu aceeaşi valoare.


7.2. Segmentarea imaginilor cu niveluri de gri

7.2.1. Segmentarea bazată pe histogramă

Aceste metode se bazează pe histograma imaginilor, adică pe
numărul de apariţii a nivelurilor de gri. Tehnicile de segmentare bazate pe
prăguirea (“tresholding”) histogramelor sunt utile şi eficiente atunci când
există o separare relativ clară a nivelurilor de gri între obiectele analizate.
Valorile caracteristice de amplitudine corespunzătoare obiectelor sunt
alese astfel încât un interval dat de niveluri de gri să reprezinte o clasă
unică de obiecte.
Cea mai generală metodă de tresholding (multi-nivel) constă în
alegerea unui număr N de praguri T
1
, T
2, …
T
N
şi crearea unei imagini de
etichete v, pe baza imaginii iniţiale u, astfel:

¦
¦
¹
¦
¦
´
¦
≤ ≤
≤ ≤
≤ ≤
=
N N-
T u(i,j) T N,
T u(i,j) T ,
T u(i,j) T ,
j i v
1
3 2
2 1
daca
...
daca 2 eticheta
1 eticheta
) , (



eticheta
daca
(7.1)

162
α β γ T
1
T
2
T
3
N
u
m
ă
r
u
l

d
e

a
p
a
r
i
ţ
i
i

Nivelul
de gri

Figura 7.7. Segmentarea bazată pe prăguirea histogramei.

În exemplul prezentat, punctelor cu valori cuprinse între [0,T
1
] li se
va atribui eticheta α, punctelor cu valori cuprinse între [T
1
,T
2
] li se va
atribui eticheta β etc.
Etichetele alocate sunt, de regulă, numere întregi. Pragurile de
segmentare se aleg, în general ca fiind minimele histogramei, deci
nivelurile de gri cele mai slab reprezentate în imagine. Se porneşte de la
ideea că obiectele identice cu acelaşi nivel de gri, dacă sunt bine
reprezentate, au cam aceleaşi valori maxime în histogramă. Prin urmare,
pragurile filtrării (T
i
, unde i reprezintă numărul pragurilor luate în
considerare) vor corespunde minimelor histogramei (unde avem un număr
mic de pixeli cu valoarea respectivă), care trebuie detectate.
Dacă aceste minime nu sunt bine reliefate, se poate aplica fie o
filtrare a imaginii (înlăturarea zgomotului, mărirea contrastului), fie se
poate construi o histogramă ponderată, care să ia în considerare doar
pixelii care se află pe platouri de intensitate (şi nu în regiuni de tranziţie).
Această distincţie poate fi făcută pe baza laplacianului, iar histograma
ponderată sumează pentru fiecare pixel cu nivelul de gri, nu L, ci valoarea
1/(1+|L|), unde L este valoarea laplacianului calculat pe o vecinătate a
punctului respectiv. Pe histograma ponderată minimele apar mai bine
reliefate, deci pragurile de segmentare se pot alege mai uşor.
163
Dacă pentru imagine (şi obiectele conţinute în aceasta) se dispune
de informaţie suplimentară (de tipul unei caracterizări statistice a
conţinutului imaginii şi a modului de degradare a acesteia) este posibilă o
abordare derivată din teoria deciziilor optimale. În acest caz, pragul optim
de segmentare pentru o imagine cu două tipuri de obiecte (corpuri şi
fundal) depinde de caracteristicile statistice ale zgomotului şi ale
obiectelor, după formula:
f ob
ob
ob
f ob
n n
P
P
d
n n
T


⋅ −
+
=
1
ln
2
2
(7.2)
unde n
ob
este nivelul mediu de gri a obiectelor, n
f
este nivelul
mediu de gri al fundalului, P
ob
este suprafaţa relativă din imagine ocupată
de pixeli obiect, iar d
2
este varianţa zgomotului aditiv Gaussian de medie
nulă, aplicat imaginii.
Ca domeniu de aplicaţii s-ar putea aminti medicina, de exemplu
pentru numărarea nucleelor de un anumit tip dintr-o imagine, prin
numărarea etichetelor care ne interesează.


Figura 7.8. Exemplu din medicină, la numărarea nucleelor.

Dezavantajul metodei este că vor fi luate în considerare şi
zgomotele care au acelaşi nivel de gri.
164
Pentru segmentarea imaginilor binare se poate utiliza şi histograma
cumulativă,

×
=
=
K L
i
i i
h H
1
sau cu varianta sa normată

=
=
1
0 i
i i
h H . (7.3)
1
P
β
T N-1
α Nivel de gri
Număr de apariţii

Figura 7.9. Histograma cumulativă.

În acest caz, se stabileşte un procent de pixeli (p) sau un prag de
nivel de gri (T) cărora li se atribuie o anumită etichetă (α), iar la restul li
se atribuie o altă etichetă (β). Metoda se aplică cu succes la imagini cu
histograme bimodale.
Pentru aceste metode există şi varianta de prăguire adaptivă, adică
de a împărţi imaginea în zone în care se calculează histograma locală şi se
aplică una din metodele anterioare, obţinându-se un rezultat cu
caracteristici locale.
Există şi metode de segmentare bazate pe potrivirea sau căutarea de
măşti. Acestea se pot implementa de exemplu utilizând transformarea Hit
or Miss din morfologia matematică sau cu filtre adaptive la care funcţia de
transfer (funcţia de intercorelaţie dintre intrare şi ieşire) se poate
transforma în funcţie de autocorelaţie.
De exemplu, în cazul unui timbru cu ştampila poştei se poate
identifica numai ştampila şi caracteristicile ei:
165
timbru cu ştampila poştei
masca

Figura 7.10. Exemplu în cazul căutării timbrului poştal.


7.2.2. Segmentarea bazată pe creşterea şi fuziunea regiunilor

Aplicarea tehnicilor de segmentare pe histogramă este condiţionată
de posibilitatea reprezentării diferitelor clase de obiecte din imagine pe
intervale de niveluri de gri diferite care nu se suprapun (sau se suprapun
parţial pe porţiuni foarte mici). În plus este necesară cunoaşterea
numărului de tipuri de obiecte diferite. În fine, se presupune că valorile
prag corespunzătoare se pot determina cu o precizie corespunzătoare.
Chiar în cazurile în care toate aceste condiţii enunţate sunt îndeplinite, nu
se poate garanta condiţia de conexitate a regiunilor obţinute în urma
segmentării. Acest lucru este evident, atât timp cât la două obiecte de
acelaşi tip, neconexe, li se atribuie prin segmentarea pe histogramă o
aceeaşi etichetă, şi formează în imaginea de etichete o regiune neconexă.
O metodă care respectă toate condiţiile impuse prin definiţia matematică a
segmentării, este creşterea regiunilor.
Principiul pe care se bazează creşterea regiunilor este simplu: se
aleg în imagine puncte reprezentative pentru fiecare obiect individual şi
categorie de obiecte, pe baza cărora are loc un proces de aglomerare a
pixelilor vecini acestora, care au aceleaşi proprietăţi (în particular acelaşi
nivel de gri). În urma acestui proces de aglomerare sau adăugare de
puncte, se obţin zone (sau regiuni) de pixeli cu aceleaşi caracteristici, deci
obiecte individuale. Procesul se opreşte în momentul în care fiecare punct
166
al imaginii a fost alocat unei regiuni. Evident, metoda astfel descrisă pe
scurt, are două etape esenţiale:
• iniţializarea sau alegerea punctelor de start (puncte iniţiale), numite
germeni sau seminţe (engl. seed);
• creşterea propriu-zisă a regiunilor.
Numărul final de regiuni rezultate este egal cu numărul de germeni
aleşi iniţial pentru creştere, deci alegerea, respectiv granulaţia (densitatea)
acestor puncte este foarte importantă. În principiu, este de dorit ca fiecare
obiect individual aflat în imagine să fie marcat cu câte un germene. Dacă
în interiorul unui aceluiaşi obiect se găsesc mai mulţi germeni, pentru
fiecare dintre ei va fi crescută o regiune. Aceasta face ca obiectul iniţial să
fie împărţit artificial prin segmentare în mai multe regiuni. Parţial, acest
neajuns se poate corecta printr-o etapă ce urmează creşterii regiunilor, şi
anume fuziunea regiunilor adiacente ce au proprietăţi asemănătoare. Dacă
în interiorul unui obiect nu este ales nici un germene, obiectul respectiv va
fi înglobat de regiunile ce cresc pornind de la germeni din vecinătatea
spaţială. Astfel, respectivul obiect nu apare ca o regiune distinctă şi este
pierdut, rezultând o eroare gravă de segmentare.
Pornind de la germenii aleşi, regiunile sunt obţinute printr-un
proces de creştere aproape simultană, început de la aceştia, până când toţi
pixelii imaginii sunt repartizaţi unei regiuni (figura 7.11).

Figura 7.11. Principiul creşterii regiunilor.

167
Cvasi-simultaneitatea creşterii poate fi realizată cu un algoritm
serial, prin alocarea pixelilor ce sunt adiacenţi (vecini) zonelor deja
segmentate. Această alocare trebuie să ţină seama de criteriul ca regiunile
crescute să fie uniforme, adică nivelul de gri al pixelului ce se adaugă nu
trebuie să difere cu mai mult de un prag prestabilit faţă de nivelul de gri al
germenului regiunii la care se alocă. În acelaşi timp, la o singură trecere,
numărul de puncte ce se adaugă unei regiuni nu poate depăşi un număr
prestabilit (condiţia încearcă să asigure creşterea relativ uniformă şi
izotropă a tuturor regiunilor). Dacă adăugarea de noi pixeli se blochează
(criteriul de uniformitate nu mai este respectat), diferenţa maximă admisă
pentru nivelul de gri poate fi crescută în etape, până la epuizarea pixelilor
imaginii.
Avantajele pe care le are o asemenea tehnică de creştere a
regiunilor sunt acelea că nu mai este necesară nici o informaţie privind
conţinutul imaginii, regiunile crescute sunt conexe şi nu există puncte
neetichetate (nealocate vreunei regiuni), iar poziţia frontierelor percepute
subiectiv în imagine se conservă.
Fuziunea regiunilor deja determinate în etapa de creştere, are drept
scop reducerea numărului de regiuni în care a fost împărţită iniţial
imaginea, pentru a evita fenomenul de supra-segmentare. Regiunile
candidate la fuzionare trebuie să fie învecinate, iar decizia de fuzionare se
ia în funcţie de pixelii aflaţi pe frontiera comună. Astfel, punctele slabe (în
număr de n
s
) sunt punctele pentru care diferenţa nivelurilor de gri între
vecinii din regiunile adiacente este foarte mică (mai mică decât un anumit
prag fixat). Punctele tari (în număr de n
t
) sunt acele puncte pentru care
diferenţa nivelurilor de gri între vecinii din regiunile adiacente este foarte
mare (mai mare ca un anumit prag fixat). Cu aceste definiţii, se poate
afirma că regiunile R
i
şi R
j
vor fuziona dacă:
• numărul de puncte slabe (n
s
) raportat la perimetrul minim (P
m
) este
mare:
1
θ >
m
s
P
n
, (7.4)
unde P
m
=min(Perimetrul(R
i
), Perimetrul(R
j
));
168
• numărul de puncte slabe de pe frontiera comună e mare:
2
θ >
P
n
s
, (7.5)
unde P este numărul de puncte aflate pe frontiera comună a regiunilor
R
i
şi R
j
;
• numărul de puncte tari de pe frontiera comună este mic:
3
θ <
P
n
t
, (7.6)
Valori tipice ale pragurilor
3 2 1
, , θ θ θ sunt:
¦
¹
¦
´
¦
=
=
=
2 , 0
75 , 0
5 , 0
3
2
1
θ
θ
θ
(7.7)
• distanţa de similaritate dintre regiuni este mare.
Distanţa de similaritate este o măsură a asemănării. Aceasta poate fi o
distanţa euclidiană ponderată sau un produs vectorial sau scalar între
vectorii corespunzători.


7.3. Segmentarea orientată pe contururi

După cum s-a arătat, segmentarea reprezintă o categorie de tehnici
de prelucrare care permite extragerea din imagini a unor elemente de
interes în scopul analizei lor ulterioare şi eventual a clasificării lor, prin
două metode principale: detecţia muchiilor (contururilor) şi detecţia
regiunilor omogene.
Prin urmare, pentru analiza imaginilor (îndeosebi la segmentare) o
etapă esenţială constă în detecţia muchiilor şi liniilor (frontierelor) care
reprezintă grupuri de pixeli aflaţi în zona de tranziţie (de variaţie bruscă a
nivelului de gri) dintre două regiuni relativ uniforme ale imaginii iniţiale.
Muchiile sunt graniţa de separaţie fie între obiecte şi fundal, fie între două
zone omogene ale aceluiaşi obiect. O asemenea muchie poate fi formată
din puncte şi segmente de dreaptă.


169
7.3.1. Operatori de tip gradient

Din punct de vedere practic, un punct de contur dintr-o imagine
reprezintă un pixel (sau un grup mic şi omogen de pixeli conecşi) având o
valoare net diferită faţă de cea a vecinilor săi. Detecţia acestora se poate
face prin comparaţie (diferenţă) între nivelul de gri propriu şi media
nivelurilor de gri dintr-o vecinătate a sa. Măsura diferenţei de intensitate
(de nivel de gri) poate fi calculată printr-o filtrare liniară cu o mască de
forma:
| |

− − −
− −
− − −
1 1 1
1 8 1
1 1 1
(7.8)
Deoarece pixelii aparţinători muchiilor se caracterizează prin faptul
că se află la graniţa dintre două regiuni omogene între care există diferenţe
mari de niveluri de gri, detecţia lor se poate face cu operatori de tip
gradient (operatori de derivare locală).
Pentru o imagine iniţială u(l,k), putem scrie:
• gradientul pe direcţia orizontală: ) , 1 ( ) , 1 ( ) , ( k l u k l u k l g
x
− − + = (7.10)
• gradientul pe direcţia verticală: ) 1 , ( ) 1 , ( ) , ( − − + = k l u k l u k l g
y
(7.11)
• gradientul după o direcţie oarecare r (care face unghiul θ cu
orizontala):
θ θ
θ
sin cos ⋅ + ⋅ =





+





=


y
g g
r
y
y
u
r
x
x
u u
x
(7.12)
Direcţia în care se află muchia va fi dată de direcţia după care
gradientul are valoarea maximă:
0 =
|
.
|

\
|




r
u
θ
(7.13)
Rezultă vectorul gradient g(l,k) cu:
• modulul (amplitudinea): ) , ( ) , ( ) , (
2 2
k l g k l g k l g
y x
+ = (7.14)
170
• direcţia:
|
|
.
|

\
|
=
) , (
) , (
) , (
k l g
k l g
k l
x
y
tg α (7.15)
De multe ori, pentru simplificarea calculelor, amplitudinea
(modulul) gradientului se defineşte ca:
) , ( ) , ( ) , ( k l g k l g k l g
y x
+ = (7.16)
Implementarea operatorilor de derivare (tip gradient) se face prin
convoluţia imaginilor cu măşti (ferestre), care sunt deci, filtrări liniare.
Operatorii de tip gradient sunt reprezentaţi de o pereche de filtre (H
1
,H
2
)
care măsoară gradientul imaginii după două direcţii ortogonale. Spre
exemplu, gradienţii după direcţia orizontală respectiv verticală, definiţi
mai sus (g
x
, g
y
), se obţin prin convoluţia cu măştile:
| | | | 1 0 1 − | |

−1
0
1


(7.17)
orizontal vertical

Un pixel este declarat ca “punct de frontieră” dacă g(l,k) depăşeşte
un prag dat, t. Pixelilor care depăşesc acest prag li se alocă în imaginea
finală eticheta C (contur), iar celorlalţi, eticheta F (fundal). Un bloc care
implementează un astfel de extractor de contur poate fi reprezentat ca în
figura 7.12.
prag

t

O
u(l,k)

h
1
(-l,-k)
Amplitudine
g(l,k)
Direcţie
α
g
(l,k)
2
2
2
1
g g g + =






.
|

\
|
=
1
2
g
g
arctg
g
α
Harta
muchiilor

h
2
(-l,-k)
g
x

g
y


Figura 7.12. Principiul extragerii contururilor.
171

Prin binarizarea imaginii “amplitudine g(l,k)” cu pragul “t” se
obţine harta de muchii. Harta muchiilor oferă informaţiile necesare pentru
trasarea contururilor din imagine. În general, pragul “t” se alege
folosindu-se histograma cumulativă pentru g(l,k), 5-10% din pixelii
imaginii g(l,k) fiind declaraţi muchii.
În continuare sunt prezentaţi operatori de derivare clasici, care
determină diferenţe orizontale şi verticale şi realizează însumări locale,
reducându-se efectul zgomotului (elementul încadrat indică originea):

Prewitt:




=
1 0 1
1 ] 0 [ 1
1 0 1
1
H

− − −
=
1 1 1
0 ] 0 [ 0
1 1 1
2
H (7.18)
Sobel:




=
1 0 1
2 ] 0 [ 2
1 0 1
1
H

− − −
=
1 2 1
0 ] 0 [ 0
1 2 1
2
H (7.19)
Kirsch:




=
3 3 5
3 ] 0 [ 5
3 3 5
1
H

− − −
=
5 5 5
3 ] 0 [ 3
3 3 3
2
H (7.20)
Izotrop:




=
1 0 1
2 ] 0 [ 2
1 0 1
1
H

− − −
=
1 2 1
0 ] 0 [ 0
1 2 1
2
H (7.21)

Aceşti operatori au proprietatea de a avea un efect nul în cazul
regiunilor uniforme.
Operatorii definiţi anterior sunt performanţi în cazul unei tranziţii
bruşte a nivelurilor de gri din imagine. Când aceste tranziţii sunt mai lente,
este indicat să se folosească derivatele de ordin doi, combinate într-un
operator laplacian:

172
2
2
2
2
2
) , ( ) , (
) , (
y
y x f
x
y x f
y x f


+


= ∇ (7.22)
Operatorul de tip laplacian poate fi implementat în discret prin
convoluţia imaginii de prelucrat cu una dintre măştile:

| |


− −

0 1 0
1 4 1
0 1 0
| |

− − −
− −
− − −
1 1 1
1 8 1
1 1 1
| |


− −

1 2 1
2 4 2
1 2 1
(7.23)

Datorită derivatei de ordinul doi, operatorul laplacian este mai
sensibil la zgomot decât cei definiţi anterior. Amplitudinea binarizată
pentru f
2
∇ produce muchii duble, ceea ce duce la apariţia în harta de
muchii, a contururilor îngroşate. Acest dezavantaj se elimină dacă se
consideră ca fiind punct de contur nu cel corespunzător maximelor sau
minimelor laplacianului, ci trecerilor sale prin zero (figura 7.13).

f(x)
f'(x)
f''(x)
x x
x
O O
O

Figura 7.13. Graficele corespunzătoare laplaceanului.




173
7.3.2. Operatori de tip compas

Operatorii prezentaţi, cât şi topologia planului discret, favorizează
numai câteva direcţii: axele şi cele două bisectoare, fiecare cu câte două
sensuri. Pornind de la această observaţie, se pot construi măşti pentru
determinarea gradientului pe fiecare dintre aceste 3 direcţii. Operatorii
rezultaţi se numesc operatori compas. Aceştia se pot obţine din oricare din
operatorii prezentaţi anterior. De exemplu, operatorii compas derivaţi din
operatorii Prewitt, corespunzători celor 8 orientări sunt:

| |

− − − 1 1 1
0 0 0
1 1 1
| |

− −

1 1 0
1 0 1
0 1 1
| |




1 0 1
1 0 1
1 0 1
| |


− −
0 1 1
1 0 1
1 1 0

N NV V SV

| |

− − −
1 1 1
0 0 0
1 1 1
| |


− −
1 1 0
1 0 1
0 1 1
| |




1 0 1
1 0 1
1 0 1
| |

− −

0 1 1
1 0 1
1 1 0

S SE E NE

Măştile corespunzătoare diferitelor orientări se obţin prin rotirea
unei măşti de bază în jurul originii.
Pentru a obţine rezoluţii unghiulare mai bune (mai multe direcţii)
se pot utiliza operatori de tip compas de dimensiuni mai mari de 3×3.
Filtrele prezentate se pretează la obţinerea prin permutare a unui set de
patru, opt sau mai multe măşti, sensibile la orientarea muchiei, în funcţie
de dimensiunea operatorului.
Pentru determinarea punctelor de contur se consideră direcţia după
care gradientul este maxim. Operatorul compas este evident neliniar,
datorită operaţiei de maxim.
174
H
k
max{g
k
}
g
k

Figura 7.14. Determinarea punctelor de contur ca puncte de gradient
maxim.

Se poate utiliza şi varianta adaptivă a acestui operator (compas
adaptiv), utilizând aceleaşi măşti ca şi în cazul anterior, dar pentru fiecare
mască se va verifica şi situarea punctului curent pe mijlocul tranziţiei. În
acest scop, pentru nivelurile de gri din vecinătatea punctului curent se pot
utiliza notaţiile:
| |
9 8 7
6 5 4
3 2 1
P P P
P P P
P P P
| |
1 1 1
2 2 2
1 1 1
− − − (7.24)
Cu aceste notaţii, se verifică condiţiile:
( ) & &
7 4 1 4
P P P P > > ( ) & &
8 5 2 5
P P P P > > ( )
9 6 3 6
& P P P P > > (7.25)

adică se verifică faptul că valorile centrale sunt mai mari decât cele
laterale, deci dacă prin aceste puncte trece o linie, care determină un profil
de forma:


Gradientul după direcţia respectivă, care rezultă prin aplicarea unei
astfel de măşti, se ia în considerare doar dacă sunt îndeplinite condiţiile
(7.25).
Dezavantajul operatorilor de tip compas este că zgomotele
suprapuse, de exemplu peste o linie, au ca rezultat o tranziţie, respectiv un
contur fals. Acest dezavantaj se poate elimina printr-o prefiltrare a
imaginii. Astfel rezultă operatorii compas cu netezire.
Netezirea imaginii se face adaptiv, după o anumită direcţie,
rezultând o netezire adaptivă direcţional. În acest scop se alege un număr
175
de măşti de netezire direcţionale (S
1
, S
2
,..., S
k
). Pentru fiecare punct al
imaginii calculăm rezultatul netezirii (filtrării) cu aceste măşti. Rezultă
valorile netezirii, v
1
, v
2
,..., v
k
, care sunt nişte valori medii ponderate de
coeficienţii măştilor. Pentru fiecare din aceste măşti se calculează şi o
dispersie locală, σ
1
, σ
2
,..., σ
k
, care reprezintă dispersia valorilor de gri
ponderate cu coeficienţii măştii, faţă de media ponderată v
k
.
Se va folosi masca care are ca rezultat dispersia minimă
( )
k i
i j
,... 1
min
=
= σ σ . Prin urmare, valoarea pixelului curent se va înlocui cu
valoarea v
j
, care a avut ca rezultat ( )
k i
i j
,... 1
min
=
= σ σ .
Masca poate fi aleasă şi după alt criteriu cum ar fi, de exemplu,
obţinerea unei valori minime pentru diferenţa între valoarea punctului
curent (în care a fost centrată masca) şi valoarea rezultată în urma filtrării,
respectiv medierii: ( )
k i
i
v y x u
,... 1
) , ( min
=
− .
O altă variantă de operator extractor de contururi este gradientul
morfologic, definit ca diferenţă între imaginea dilatată şi imaginea
erodată, cu un acelaşi element structurant, aşa cum s-a arătat în capitolul
referitor la morfologie matematică. Dacă elementul structurant este V8-
flat (plat), această operaţie poate fi asimilată cu un operator compas.
Toate aceste tehnici se dovedesc a fi sensibile la zgomot şi prin
urmare, pentru imagini afectate de zgomot sunt necesare soluţii diferite. O
asemenea prelucrare este diferenţa de gaussieni (DOG) care reprezintă
diferenţa între două imagini netezite cu filtre gaussiene de dimensiuni
diferite.
176

8. Compresia imaginilor

O clasificare a metodelor de compresie a imaginilor este prezentată
în figura de mai jos:






Compresia
imaginilor
cu niveluri
de gri
pe plane (ca la imagini binare)
cu transformate (cu pierderi)
cu predicţie, bazate pe DPCM
(Differential Pulse Code Modulation)
etc.
DCT
KL (Karhunen Loeve)
wavelet
cu fractali
VQ (Vector Quantization)
binare
nivel înalt
nivel bloc
nivel bit
(pixel)
codarea conturului
skeleton morfologic
generalizat
quad-tree
WBS (White Block Skipping)
RLE (Run Length Encoding)
- cu cuvânt fix
- cu cuvânt trunchiat
- cu cuvânt modificat
Ziv-Lempel
entropică (Huffman)


Există şi metode combinate: RLE+Hufmann, skeleton+RLE (sau
WBS), DCE+Hufmann (utilizată în standardul JPEG Joint Picture Expert
Group) etc.



177

8.1. Compresia imaginilor binare

8.1.1. Codarea de nivel înalt

Pentru compresia de nivel înalt a imaginilor binare, pe lângă
compresia cu skeleton morfologic, se mai poate utiliza codarea
contururilor. Descriptorii de contur sunt coduri care înmagazinează şi
compactează într-un volum mic de memorie informaţiile esenţiale cu
privire la conturul unui obiect. Determinarea acestor descriptori trebuie
precedată de detecţia contururilor şi eventual de netezirea acestora.


8.1.1.1. Aproximări poligonale

Aproximarea poligonală a unui contur este un descriptor care
descinde direct din metoda de detecţie a conturului, cu acelaşi nume.
Procedura de determinare a aproximării poligonale a unui contur
constă în următoarele etape (figura 8.1):
• determinarea diagonalei principale (AB) a conturului;
• marcarea punctelor de pe contur (C şi D) având distanţa maximă faţă
de diagonala principală;
• rezultă prima aproximare: poligonul ABCD;
• marcarea punctelor maxim depărtate de laturile patrulaterului (EFGH);
• rezultă a doua aproximare: poligonul ABCDEFGH;
• se repetă ultimele etape până când distanţa maximă este mai mică
decât o valoare prestabilită.
178
B
A
D
C
B
A
G F
H E
D
C
B
A
G F
H E
D
C
B
A

Figura 8.1. Procedura de determinare a aproximării poligonale a unui
contur.

Codul rezultat conţine coordonatele colţurilor poligonului, ceea ce
practic defineşte laturile şi unghiurile acestuia şi implicit dă o informaţie
suficient de corectă asupra conturului obiectului studiat. Aplicaţiile acestei
metode sunt limitate, deoarece modelul obţinut nu este invariant la
transformările geometrice şi deci, o simplă scalare sau rotire duce la
schimbarea codului. Pentru a înlătura într-o oarecare măsură acest
dezavantaj, pentru codarea poligonului se poate utiliza codul Freeman.


8.1.1.2. Codul Freeman

Codul Freeman se mai numeşte şi “cod lanţ” şi este folosit pentru
codarea contururilor. Principiul acestuia constă în codificarea
(numerotarea) vectorilor de “direcţie” dintre pixelii succesivi de pe contur
prin numerotarea într-o anumită ordine a direcţiilor posibile de deplasare
de-a lungul unui contur. Această metodă de compresie se bazează pe ideea
că pentru un obiect „plin” este suficientă informaţia de contur, pentru a
putea reface obiectul, iar conturul este codificat reţinând poziţia relativă a
pixelilor de pe contur.
Codul Freeman de bază foloseşte 8 direcţii de mişcare (figura 8.2),
vectorii fiind codificaţi prin cuvinte de 3 biţi:
179
1 3
2
6
4
7
0
5
1
2
H
D
3
A
5
C
4
B
F
7
E
6
0
G

Figura 8.2. Codul Freeman.

Tipic, codul Freeman conţine adresa pixelului de start (în exemplul
prezentat, A), urmată de un şir de cuvinte cod, care codifică direcţia
vectorului spre pixelul următor şi adresa acestuia (A34567012).
Codul obţinut este invariant la translaţie şi este dependent de
alegerea punctului de start pentru parcurgerea conturului. Din acest motiv,
ca alternative la acest cod Freeman primar, se pot folosi şi alte variante ale
acestuia, cum ar fi:
• codul Freeman diferenţial, obţinut prin scrierea diferenţei modulo-8
între cifrele succesive. Practic se numără întotdeauna în acelaşi sens
numărul de direcţii care separă două orientări consecutive ale
conturului, adică două cifre din codul primar.
• “numărul de formă” este cifra minimă obţinută din permutarea
circulară a codului diferenţial. Acest descriptor de contur este
constant, independent de poziţia punctului de start.





180
Exemplu:
• codul Freeman primar = 60026442;
• codul Freeman diferenţial =
2 0 2 4 6 0 6 4
4-4=0
6-4=2
4-2=2
=se începe cu diferenţa ultimelor două cifre;

• numărul de formă: 02460642 (cel mai mic).
Această metodă de compresie se utilizează la comanda plotterelor,
pentru realizarea de hărţi, desene sau amprente digitale.
Compresia cu coduri Freeman permite şi o serie de prelucrări pe
contururi, fără a fi nevoie să fie memorată sau analizată întreaga imagine.
Astfel, se pot calcula sau realiza:
1. perimetrul unui obiect, pe baza informaţiei referitoare la conturul
său:
impar par
n n perimetrul ⋅ + = 2 , (8.1)
unde n
par
este numărul legăturilor pare, iar n
impar
este numărul
legăturilor impare din codul Freeman.
2. ariile închise de contururi.
3. netezirea frontierelor obiectelor.
Codul Freeman este folosit în mod frecvent în caracterizarea
formelor, putând fi folosit şi pentru determinarea altor parametri de formă.
Parametrii de formă reprezintă scalari sau funcţii asociate unei
forme, pe care o caracterizează. Astfel, formele asemănătoare sunt
caracterizate de parametri de formă de valori apropiate. Parametrii de
formă compun un fel de “fişă de identitate” a formei respective, pe baza
căreia această formă poate fi recunoscută în mod unic. În mod ideal aceşti
parametri trebuie să fie invarianţi la translaţie, rotaţie şi scalare.
Printre cei mai cunoscuţi parametri (descriptori) de formă sunt:
181
• descriptori primari (geometrici): lungimi, perimetre, arii etc.;
• descriptori de contur: Freeman, Fourier, aproximări poligonale:
• momente statistice (invariante): Hu, Zernike, afine etc.
Parametrii geometrici se bazează pe măsurarea unor atribute
geometrice simple (sau combinaţii ale acestora) cum ar fi:
• perimetrul (P):
dt t y t x P

+ = ) ( ) (
2 2
(8.2)
unde t este parametrul de contur, dar nu în mod necesar lungimea
acestuia.
• aria (A):

∫∫ ∫ ∫
∂ ∂
− = =
R R R
dt
dt
t dy
t y dt
dt
t dx
t y dxdy A
) (
) (
) (
) ( (8.3)
unde R şi ∂R reprezintă regiunea obiectului şi respectiv, conturul
acesteia.
• excentricitatea formei (sau circularitatea sa, adică măsura în care
forma se deosebeşte de un disc) se defineşte ca raport între raza
cercului circumscris (R) şi raza cercului înscris (r) în forma studiată:

r
R
c = (8.4)
• raportul de compactizare (sau rotunjimea formei) reprezintă raportul
dintre pătratul perimetrului şi suprafaţa formei:

2
2
4 A
P
K
π
= (8.5)


8.1.1.3. Descriptori Fourier

Descriptorii Fourier reprezintă o metodă utilă pentru reprezentarea
şi descrierea conturilor. Conturul poate fi descris cu o pereche de funcţii
x(n) şi y(n)

(periodice, cu perioada N, egală cu numărul punctelor de pe
182
contur sau cu un submultiplu al acestuia), în continuare putând fi utilizate
toate tehnicile de reprezentare unidimensională pentru semnale.
Astfel, pentru orice contur eşantionat, care conţine N puncte, se
poate scrie:
) ( ) ( ) ( n y j n x n u ⋅ + = , unde 1 ,..., 1 , 0 − = N n (8.6)
În cazul unui contur închis, semnalul u(n) va fi un semnal periodic
cu perioada N.
α
a(k)=x(k)+j⋅y(k)
x
y

Figura 8.3. Descriptori Fourier.

Descriptorii Fourier sunt chiar coeficienţii a(k) ai transformatei
Fourier ai funcţiei u(n), obţinuţi prin aplicarea transformatei Fourier
unidimensionale. Astfel, a(0) reprezintă centrul de greutate al curbei, iar
ceilalţi coeficienţi a(k) conţin informaţiile privind variaţiile locale ale
conturului descris:

|
.
|

\
| ⋅ ⋅
− ⋅ =


=
N
n k
j n u k a
N
n
π 2
exp ) ( ) (
1
0
, unde 1 0 − ≤ ≤ N k (8.7)
Descriptorii Fourier pot fi utilizaţi în recunoaşterea de forme de
acelaşi tip, chiar dacă acestea au dimensiuni şi orientări diferite. Se poate
arăta că vectorul descriptor Fourier al conturului unei forme:
{ } ) 1 ( ,..., ) 2 ( , ) 1 ( , ) 0 ( − = N a a a a V
F
(8.8)
este invariant la scalare şi translaţie. În plus, faza ( ) ) ( arg k a , unde
k=0,1,2,…,N-1, este invariantă la rotaţie.
183
Deci, anumite transformări geometrice ale unui contur sau forme se
reflectă, în cazul descriptorilor Fourier corespondenţi, în transformări
(operaţii) simple ale acestora. De exemplu, dacă un contur este translatat
cu:
0 0 0
v j x u ⋅ + = ,
0
) ( ) ( ' u n u n u + = ⇒ (8.9)
În acest caz, noii descriptori Fourier rămân identici, cu excepţia
celui pentru k=0, ) ( ) ( ) ( '
0
k u k a k a δ ⋅ + = . Efectul de scalare (mărire sau
micşorare a conturului) are ca efect o scalare a coeficienţilor a(k), deci
dacă:
) ( ) ( ' n u n u ⋅ = α ) ( ) ( ' k a k a ⋅ = ⇒ α (8.10)
Modificarea punctului de referinţă (de start) a conturului duce la o
modulare a coeficienţilor a(k). Deci, dacă:
0
) ( ) ( '
Φ −
⋅ =
j
e n u n u
N
n k
j
e k a k a
0
2
) ( ) ( '
⋅ ⋅

⋅ = ⇒
π
(8.11)
Rotaţia conturului cu un unghi
0
φ produce un defazaj suplimentar
constant
0
φ al descriptorilor:
0
) ( ) ( '
Φ −
⋅ =
j
e n u n u
0
) ( ) ( '
Φ −
⋅ = ⇒
j
e k a k a (8.12)


8.1.2. Codarea la nivel de bloc

8.1.2.1. Metoda arborelui cuaternar (Quad-tree)

Compresia bazată pe metoda arborelui cuaternar (quad-tree) se
implementează prin segmentarea succesivă a imaginii în sferturi
succesive, până se obţin doar zone omogene, ca şi în cazul segmentării
prin metoda quad-tree. Codarea se face apoi prin atribuirea pentru fiecare
„frunză” a arborelui a unei valori corespunzătoare valorii din zona
(pătratul) adresată de frunză.
184
convenţie
0
1
3 2
0
0
0
0
0
0
0
1
2
3
1
2
3
1
1
1
1

Figura 8.4. Compresia prin metoda arborelui cuaternar.

Conform acestei metode, pentru a reface imaginea din codul
acesteia, pentru fiecare „frunză” trebuie ştiut (memorat):
• valoarea: este conţinută în fiecare frunză;
• dimensiunea: poate fi dedusă din nivelul pe care se află frunza (de
exemplu, frunzele, deci pătratele de pe primul nivel au latura egală cu
½ din latura imaginii);
• poziţia: rezultă din calea pe care se ajunge la frunză.
Prin urmare codul obţinut prin metoda quad-tree trebuie să conţină
toate informaţiile de mai sus. Din aceste informaţii se poate elimina
informaţia referitoare la dimensiunea frunzei, deoarece aceasta rezultă în
mod implicit, deoarece din lungimea codului rezultă şi nivelul pe care se
află frunza şi deci dimensiunea acesteia. De exemplu, codul corespunzător
valorii pătratului negru din partea dreapta-jos a imaginii de mai sus este
111 (cel al poziţiei sale este 22), iar cel al valorii pătratului alb din stânga-
jos este 10 (cel al poziţiei sale este 3).


8.1.2.2. Metoda WBS (White Block Skipping)

Această metodă de codare la nivel de bloc se bazează pe omiterea
zonelor albe din imagine. Principiul implementării acestor metode constă
în:
185
• împărţirea şirului de biţi ce defineşte imaginea în blocuri de câte m
biţi;
• un bloc nul (toţi biţii sunt 0-logic) se înlocuieşte cu un singur bit de 0;
• blocurile nenule (în care cel puţin un bit este diferit de 0-logic) sunt
înlocuite cu un bit de 1-logic, urmat blocul respectiv.
De exemplu, pentru m=3 şi pentru secvenţa următoare:
000 110 000 101 000 011
codul corespunzător este:
0 1110 0 1101 0 1011
După cum se observă, acest tip de compresie este eficient doar în
cazul imaginilor cu mult alb, în caz contrar putându-se obţine chiar un
efect contrar compresiei.
Se poate arăta că:

|
.
|

\
|
− + =
nul
p
m
R
1
1 , unde (8.13)
R este inversul ratei de compresie (C), p
nul
este probabilitatea ca
blocul de m biţi să fie nul.

finala imaginea din biti de numarul
initiala imaginea din biti de numarul
= =
R
C
1
(8.14)


8.1.3. Codarea la nivel de bit

8.1.3.1. Codarea RLE (Run Length Encoding)

Principiul codării RLE (Run Length Encoding) constă în reţinerea
numărului de biţi succesivi care au aceeaşi valoare în secvenţa de biţi ce
descrie imaginea.
De exemplu, pentru secvenţa iniţială:
000111010111110000111111 care are 24 biţi
prin codarea conform principiului RLE se obţine secvenţa codată:
033111546
186
Adică primul bit este 0-logic, care se repetă de 3 ori, după care se
schimbă simbolul (în 1-logic, dar acesta nu se mai memorează, deoarece
în imaginile binare tranziţia din 0-logic se face doar în 1-logic), acesta se
repetă de 3 ori, după care se schimbă din nou simbolul, acesta apare o
singură dată, după care avem 2 schimbări succesive de simbol, acestea
apărând câte o singură dată, după care avem simbolul 1-logic care se
repetă de 5 ori, se schimbă simbolul (în 0-logic) care apare de 4 ori, iar
apoi ultimul simbol apare de 6 ori.
Se observă că în secvenţa codată cel mai mare număr care apare
este 6, deci pentru codarea binară a acestei secvenţe este nevoie de 8
coduri (apar 8 numere în secvenţa codată 33111546) de câte 3 biţi (pentru
codarea celui mai mare număr este nevoie de 3 biţi) plus bitul ce
reprezintă valoarea primului bit din secvenţa iniţială. Prin urmare, se poate
deduce că metoda este eficientă în codarea imaginilor care conţin zone
uniforme de dimensiuni mari.
Metoda RLE este utilizată la faxuri.


8.1.3.2. Codarea entropică (Huffman)

Deoarece codarea entropică se studiază în detaliu în teoria
informaţiei, nu se va insista pe detalii ale metodei, ci doar pe descrierea
principiului metodei, prin intermediul unui exemplu. Pentru
implementarea codării entropice se porneşte de la un număr de simboluri
disponibile, care au anumite probabilităţi de apariţie. Principiul codării
entropice (Huffman) constă în a coda cu un număr mic de biţi simbolurile
cu probabilitate de apariţie mare, iar simbolurile sau secvenţele rare (cu
probabilitate de apariţie mică) să fie codate cu un număr mai mare de biţi.
Pentru exemplificarea principiului metodei, se presupun şapte
simboluri cu probabilităţile de apariţie din tabelul 8.1.


187
Tabelul 8.1.
Simbolul Iniţial
PA CA
Etapa 1
PA CA
Etapa 2
PA CA
Etapa 3
PA CA
Etapa 4
PA CA
Etapa 5
PA CA
Etapa 6
CA
11 (G5) 0
7 (G4) 7 1
S1 6 6 6 6 6 00 00
5 (G3) 5 01
4 (G2) 4 10
S2 3 3 3 3 11 11
S3 3 3 3 010 010
2 (G1) 2 011
S4 2 2 100 100
S5 2 2 101 101
S6 1 0110 0110
S7 1 0111
PA = probabilitatea de apariţie
CA = codul alocat

În faza iniţială, se ordonează simbolurile în ordinea descrescătoare
a probabilităţilor, după care se grupează simbolurile două câte două.
Simbolurile cele mai puţin probabile sunt grupate şi alcătuiesc o grupă
restrânsă de probabilităţi (G1, în tabelul 8.1). Procesul se repetă (G2, ...,
G5) până când avem o grupă restrânsă cu doar două elemente (G5 şi G4),
cărora le alocăm câte un simbol diferit (0,1), după care se refac în sens
invers grupele, respectiv simbolurile iniţiale, prin alocarea unor biţi
corespunzători care se adaugă celor din grupele superioare (anterioare),
din care provin grupele sau simbolurile curente.
Prin codarea entropică se obţine codul cu lungimea medie minimă,
în raport cu alte coduri.







188

8.2. Compresia imaginilor cu niveluri de gri

8.2.1. Codarea pe plane

În cazul codării pe plane a imaginilor cu niveluri de gri se pot
aplica metode similare metodelor de codare a imaginilor binare, pe fiecare
plan ce codează informaţia din imagine.


b
0
b
1
b
7



Figura 8.5. Principiul codării pe plane.

În acest caz trebuie prevăzute metode de detecţie a erorilor la
nivelurile înalte pentru a nu avea salturi bruşte de valori deoarece, de
exemplu, o eroare a bitului cel mai semnificativ MSB (Most Significant
Bit) se poate traduce într-o eroare de ½ din valoarea iniţială. Pentru o
imagine codată pe 8 biţi, aceasta înseamnă un salt de la 255 la 127
(11111111 -> 01111111).
În cazul imaginilor color se poate reduce numărul de culori,
înlocuind componentele RGB cu coeficienţii cromatici r,g,b:

B G R
R
r
+ +
= ,
B G R
G
g
+ +
= ,
B G R
B
b
+ +
= 1 = + + ⇒ b g r (8.15)

Prin, această înlocuire se obţine un spaţiu bidimensional, deoarece
componentele r,g,b nu sunt independente (dacă cunoaştem două
componente, cea de-a treia rezultă dintr-o combinaţie liniară a primelor
189
două). Spaţiul bidimensional obţinut determină un spaţiu fizic
reprezentabil în planul celor două componente cunoscute:
b
r

Figura 8.6. Spaţiul bidimensional r-b.

Pentru a se obţine un spaţiu fizic reprezentabil extins, se poate
utiliza spaţiul cromatic modificat sau o reprezentare de tip JNC (Just
Noticeable Color) prin intermediul elipselor lui McAdam, care au
proprietatea că nu se poate deosebi culoarea din centrul elipselor de restul
culorilor din interiorul elipsei:
b
r




Figura 8.7. Elipsele lui McAdam.



190

8.2.2. Metode predictive de compresie

Transmisia digitală clasică a imaginilor constă în transmisia
secvenţială a eşantioanelor obţinute prin baleierea clasică, linie după linie.
Prin urmare, avem de transmis o secvenţă u(k) unidimensională, în care
fiecare eşantion u(k) este un eşantion cuantizat pe n biţi. Transmisia a n
biţi este însă redundantă: eşantioanele vecine sunt puternic corelate,
nefiind nici pe departe variabile aleatoare independente. Dacă se transmite
în loc de eşantioane diferenţele dintre ele, se obţine o decorelare
importantă, iar diferenţele pot fi transmise cu un număr mai mic de biţi
fiindcă nu sunt variabile aleatoare cu repartiţie uniformă pe domeniul de
valori [0, M-1], ci cu un maxim pronunţat în jurul lui 0 şi cu lungimea de
cod semnificativ mai mică decât n. De fapt, folosind acest procedeu nu
înseamnă decât să se facă ceea ce se numeşte predicţie de ordinul 0: se
estimează:
) 1 ( ) ( ˆ − = k u k u (8.16)
şi se transmite eroarea:
) 1 ( ) ( ) ( ˆ ) ( ) ( − − = − = ⇒ k u k u k u k u k e (8.17)
Evident procedeul se poate generaliza: dacă
( ) ) ( ) ( ),..., 1 ( ) ( ˆ k u l k u k u k u ≅ − − =ψ (8.18)
În acest exemplu, e este eroarea de predicţie, iar ψ este predictorul
sau regula de predicţie de ordinul l-1, R R →
l
: ψ (dacă secvenţa este
reală, R ∈ u(k) ), care se deduce pe baza unor considerente statistice.
Un caz particular este cazul predicţiei liniare, în care regula de
predicţie este o funcţie liniară:


=
− ⋅ =
l
i
i
i k u a k u
1
) ( ) ( ˆ (8.19)
Coeficienţii a
i
se determină pe baza unor considerente statistice.
191
Transmiterea eşantioanelor cuantizate şi folosind un cod (de
exemplu 8 biţi pentru 256 de niveluri, folosind convenţia de scriere
binară) se numeşte modulaţie de impulsuri în cod PCM (Pulse Code
Modulation, în engleză). Transmiterea diferenţelor între eşantioane se
numeşte DPCM (Differential Pulse Code Modulation).
Codarea diferenţei se poate face în diverse moduri. Cel mai simplu
caz din punct de vedere al biţilor de transmis este ca eroarea e(n) să fie
codată pe un singur bit (bitul de semn). În acest caz, se fixează o cuantă q
şi la transmisie:
• dacă e(k)>0 se transmite 1-logic;
• dacă e(k)<0 se transmite 0-logic.
La recepţie:
• dacă s-a recepţionat un 1-logic se adaugă cuanta q la eşantionul
anterior;
• dacă s-a recepţionat un 0-logic se scade cuanta q la eşantionul
anterior.
Această codare DPCM particulară se numeşte modulaţie delta. În
figura 8.8 se observă care este dezavantajul esenţial al modulaţiei delta:
eroarea de neurmărire, în momentele când semnalul se modifică rapid.
u(k)
) ( ˆ k u
t
eroare de
neurmărire
zgomot
granulat
q

Figura 8.8. Principiul modulaţiei delta.
192
În zonele cu pantă mare, deci cu variaţii bruşte, ale u(k) apar
distorsiuni (erori) de neurmărire, iar în zonele cu pantă mică, deci cu
variaţii lente, ale u(k) apare un zgomot granulat.
Modulaţia delta a fost îmbunătăţită mult în raport cu această
variantă iniţială prin procedee de modificare adaptivă a pantei de creştere
în funcţie de secvenţa de cifre binare transmise. Eliminarea distorsiunii de
urmărire se face prin modificarea adaptivă a cuantei de la un pas la altul,
adică (figura 8.9):
• creşterea cuantei pentru două creşteri succesive ale semnalului;
• scăderea cuantei pentru două scăderi consecutive;
• păstrarea valorii cuantei de la un pas la altul, pentru o creştere şi o
descreştere succesivă (sau o descreştere şi o creştere succesive).
u(k)
) ( ˆ k u
t
q
2q

Figura 8.9. Principiul modulaţiei delta adaptive.

Pentru implementarea compresiei cu predicţie,
( ) ) ( ) ( ),..., 1 ( ) ( ˆ k u l k u k u k u ≅ − − =ψ , se poate utiliza schema bloc din
figura 8.10.
193

Predictor cu
întârzieri
+
+
-
) ( ˆ k u
u(k)
cuantizor
e(k) e
q
(k)

Figura 8.10. Principiul compresiei cu predicţie.

Această metodă nu se foloseşte în practică deoarece în e(k) se vor
acumula erorile de cuantizare a lui u(k). Pentru a elimina acest dezavantaj
se foloseşte metoda:
( ) ) ( ˆ ),..., 1 ( ˆ ) ( ˆ l k u k u k u − − =ψ (8.20)



Predictor
(cu întârzieri)
-
+
-
) ( ˆ k u
u(k)
cuantizor
e(k) e
q
(k)= e(k)+∆e(k)
+
codor
canal de
comunicaţie
decodor

Predictor
(cu întârzieri)
+
+
+ e
q
(k)
) ( ˆ k u
u'(k)

Figura 8.11. Principiul predicţiei cu compresie modificat.

În această figură: ) ( ) ( ' k u k u ≅ +erori de cuantizare.
În cazul 2D al compresiei cu predicţie a imaginilor, în mod similar,
pentru o imagine u(m,n), imaginea prezisă va fi:
( ) { } ( )
n m
W j i
j i u n m u
,
) , (
, ) , ( ˆ

=ψ , (8.21)
unde W
m,n
este fereastra de predicţie, adică vecinătatea punctului
curent, în care se face predicţia.
Fereastra de predicţie trebuie aleasă astfel încât să fie cauzală. De
exemplu, pentru o baleiere normală a imaginii (sus-jos, stânga-dreapta),
194
pentru punctul curent, fereastra de predicţie trebuie aleasă ca în figura de
mai jos (W
m,n
şi nu W’
m,n
), pentru ca valorile ce intervin în predicţie să fie
deja calculate:

W
m,n
W’
m,n

Figura 8.12. Constrângerea de cauzalitate a ferestrei de predicţie.


8.2.3. Compresia cu transformate

După cum s-a arătat şi în capitolul de transformări ale imaginilor,
transformările integrale unitare se pot aplica cu succes şi la compresia
imaginilor. Într-un proces de compresie cu transformate se porneşte de la
o imagine iniţială I în care energia este repartizată relativ uniform.
Acesteia i se aplică o transformare T în urma căreia se obţine o imagine în
care energia este concentrată în mult mai puţine componente decât în
imaginea iniţială (de dorit în componentele cu indici mici).

T
-1

canal
T
....

) (
ˆ
I T
. .
. .
I
ˆ
.
.......

T(I)
. .
. . .
I. . .
codare
decodare

Figura 8.13. Principiul compresiei cu transformate.

La codare se reţin (respectiv se transmit) numai componentele în
care este concentrată majoritatea energiei. La decodare (la recepţie),
195
imaginii recepţionate, ce conţine informaţie doar în unele componente, i se
aplică transformarea inversă, obţinându-se imaginea iniţială I (în practică
se obţine de fapt o aproximaţie a acesteia).
Dacă transformarea este liniară şi unitară, deoarece transformările
unitare conservă energia ( ( ) ) ( ) ( I T E I E = ), se poate controla cât anume se
pierde din energia imaginii iniţiale prin netransmiterea (sau
nerecepţionarea) componentelor nesemnificative din imaginea
transformată.
Mărimile cantitative care definesc eficienţa compresiei sunt:
• raportul de compresie. Raportul de compresie se defineşte ca fiind
raportul dintre cantitatea de informaţie din imaginea iniţială şi
cantiatea de informaţie din imaginea transformată care se transmite. În
prezent, factorii de compresie uzuali sunt de 10...20.
• raportul semnal-zgomot. Raportul semnal-zgomot exprimă o măsură a
calităţii compresiei. Raportul semnal-zgomot al compresiei se
defineşte ca fiind raportul dintre energia imaginii iniţiale şi energia
erorii de compresie:



= =

j i
j i
I I
I
j i I j i I
j i I
E
E
RSZ
,
2
,
2
ˆ
) , (
ˆ
) , (
) , (
(8.22)
În decibeli: RSZ RSZ
dB 10
log 10⋅ = . Valori acceptabile ale RSZ
dB

sunt cele de peste 30 dB: RSZ
dB
>30. Pentru valori peste 30 dB, ochiul
uman nu mai poate distinge diferenţele între imaginea originală şi cea
transformată. Pot să apară şi zgomote cu RSZ
dB
>30 dB, de exemplu
pentru imagini cu multe contururi, prin aplicarea transformatei
Fourier discrete DFT. În acest caz, la aplicarea transformatei inverse,
contururile vor fi puternic afectate, deoarece componentele de
frecvenţă înaltă (contururile) vor fi eliminate.
196
Dintre transformările prezentate anterior, cea mai utilizată
transformare pentru compresie este transformata Cosinus discretă
DCT, care elimină dezavantajele transformatei Fourier DFT.
• numărul de operaţii sau complexitatea algoritmului de compresie. În
capitolul de transformări ale imaginilor, s-a arătat că pentru
transformările unitare bidimensionale, ale unor imagini de dimensiuni
N×N, care admit algoritm rapid de calcul, numărul de operaţii este:
N N n
x 2
2
log ⋅ ≈ (8.23)
Complexitatea algoritmului se poate reduce dacă nu se aplică
transformarea pe întreaga imagine, ci se împarte imaginea în blocuri
şi se face codarea fiecărui bloc transformat.

...
.
.
.

...
.
.
.

n
n
T T

Figura 8.14. Principiu de reducere a complexităţii compresiei cu
transformate.

Pentru blocuri de dimensiunea n×n, complexitatea algoritmului
este:
( )
2
2
2 '
log
|
.
|

\
|
⋅ ⋅ ≈
n
N
n n n
x
(8.24)
Prin urmare, câştigul în ce priveşte complexitatea algortimului
de compresie este:
197
N
n n N
N n N
n
n
n
x
x
log
log
log
2
2 2
2
2 2
'
=
⋅ ⋅
⋅ ⋅
= (8.25)
Pentru N=512 şi n=8 (n fiind standardizat în cadrul JPEG):
3
3
9
log
log
2
2
= =
n
N
(8.26)
⇒ se obţine un algoritm de 3 ori mai rapid.

Prin urmare, rămâne de stabilit transformarea optimă pentru
compresie, care să prezinte caracteristici optime, relativ la cele prezentate
anterior. Transformarea optimă va fi stabilită relativ la criteriul erorii
pătratice a mediei statistice.

Dacă se consideră o variabilă aleatoare, ξ, reală şi se fac multe
experimente, în care se măsoară ξ, se vor obţine diferite valori care pot fi
ordonate pe o axă, ca în figura 8.15.
xxxx x xx x x x

Figura 8.15. Ordonarea valorilor unei variabile aleatoare pe o axă.

Dacă aceste valori ar fi infinit de multe, densitatea lor pe axă ar
arăta ca funcţia de densitate de probabilitate ce caracterizează variabila ξ:


Figura 8.16. Densitatea valorilor unei variabile aleatoare.

Dacă ξ nu este o variabilă aleatoare reală scalară ci un vector cu N
componente(reale), la fiecare realizare se pune un punct în spaţiul
n-dimensional. ξ va putea fi scris:
198

|
|
|
|
|
|
.
|

\
|
=
−1
0
.
.
.
N
ξ
ξ
ξ sau
|
|
|
|
|
|
.
|

\
|
=
N
ξ
ξ
ξ
.
.
.
1
(8.27)
Prima numerotarea componentelor poate fi avantajoasă uneori, din
considerente practice (realizările lui ξ sunt notate cu majuscule):

|
|
|
|
|
|
.
|

\
|
=
−1
0
.
.
.
N
X
X
X , respectiv
|
|
|
|
|
|
.
|

\
|
=
N
X
X
X
.
.
.
1
(8.28)
Cel mai simplu caz este N=2, în care rezultatele pot fi reprezentate
ca nişte puncte în plan. Rezultatele unor experimente repetate poate arăta
ca în figura 8.17.a. Un alt exemplu este prezentat în figura 8.17.b.
X
1
X
2


X
1

X
2

(a) (b)
Figura 8.17. Exemple de reprezentare a realizărilor unei variabile
aleatoare.

În cazul din figura 8.17.b legătura între valoarea lui X
1
şi valoarea
lui X
2
este mai strânsă. În acest caz, dacă s-ar roti axele ca în figura 8.18,
199
adică dacă în loc de valorile calculate pentru X
1
şi X
2
s-ar face calcule cu
nişte combinaţii ale acestora, care se pot obţine ca noi coordonate ale
punctelor într-un sistem de axe rotit, pentru caracterizarea experimentului
ar fi aproape suficient y
1
, adică o singură variabilă şi nu două, deoarece y
2

este mic în comparaţie cu y
1
şi adesea neglijabil, în asemenea situaţii.
X
1
X
2
y
1
y
2


Figura 8.18. Exemplu de reprezentare a realizărilor unei variabile
aleatoare, într-un sistem de axe rotit.

Din astfel de motive, prezintă interes „transformări” ale vectorilor
aleatori (în general N-dimensionali) şi fiindcă cele mai simple sunt
transformările liniare, vor fi studiate doar acestea.
O transformare liniară de la R
N
se scrie cu ajutorul unei matrici A:
ξ η ⋅ = A ,
unde:
|
|
|
|
|
|
.
|

\
|
=
− − −

1 , 1 1 , 0
1 0 00
. . .
. .
. .
. .
. . .
N N N
N
a a
a a
A , (8.29)
200

|
|
|
|
|
|
.
|

\
|
=
−1
0
.
.
.
N
ξ
ξ
ξ şi
|
|
|
|
|
|
.
|

\
|
=
−1
0
.
.
.
N
η
η
η . (8.30)
Scopul este de a găsi o transformare care să fie optimă dintr-un
anumit punct de vedere, şi anume să facă cât mai mici cât mai multe
componente ale lui η astfel încât ξ să se poată aproxima cât mai bine prin
cât mai puţine numere. Bineînţeles, fiind vorba de variabile aleatoare,
minimizarea acestora trebuie înţeleasă în sensul de eroare medie. Mai
exact, instrumentul matematic adecvat este eroarea medie pătratică fiindcă
este o funcţie derivabilă: la eroarea medie ar trebui vorbit de modul, dar
modulul nu este o funcţie derivabilă.
Pentru calculele ce urmează se presupune, de asemenea, că toate
componentele lui ξ (ξ
0
, ξ
1
,…, ξ
N-1
) sunt variabile aleatoare de medie nulă.
Se presupune că se cunosc nişte informaţii minime despre aceste variabile
şi anume, se presupun cunoscute mediile şi corelaţia între componente,
respectiv dispersia fiecăreia, adică momentele de ordinul 1 (
k
ξ ) şi de
ordinul 2 (
j i
ξ ξ ). Dacă nu ar fi variabile aleatoare de medie nulă, s-ar
putea scade media (cunoscută), iar rezultatul ar fi variabile aleatoare de
medie nulă.
Se va limita căutarea optimului printre matricile unitare (care, de
fapt, sunt generalizări ale rotaţiilor din plan), deoarece ele păstrează
produsul scalar şi norma, adică dacă:
' ' ξ η ⋅ = A şi " " ξ η ⋅ = A (8.31)
atunci:
" ' ) " , ' ( ) " , ' ( " ' η η η η ξ ξ ξ ξ ⋅ = = = ⋅
T T
(8.32)
şi, în particular:

2 2
' ) ' , ' ( ) ' , ' ( ' η η η ξ ξ ξ = = = (8.33)
201
În aceste relaţii, vectorii sunt consideraţi ca fiind vectori coloană de
dimensiune N×1, ca în relaţia (8.30). Produsul scalar a doi vectori ξ şi η a
fost notat cu (ξ, η). În notaţie matriceală, acest produs se scrie ca un
produs ξ
T
·η, între o matrice (vector) 1×N şi o matrice N×1 şi are ca
rezultat o matrice (scalar) 1×1:


=
⋅ = ⋅
1
0
N
i
i i
T
η ξ η ξ .
Aceste matrici mai au proprietatea că
T
A A =
−1
(vezi capitolul 4,
paragrafele 4.1 şi 4.2), adică transformarea inversă se obţine foarte simplu,
şi că dacă se notează cu ) ,..., , (
1 1 0
T
N
T T
a a a

liniile lui A, respectiv cu
) ,..., , (
1 1 0 − N
a a a coloanele lui A
T
:
| |
1 1 0
,..., ,

=
N
T
a a a A , (8.34)
atunci vectorii a
i
sunt ortogonali doi câte doi şi de normă 1.
Prin urmare, se va căuta printre matricile unitare o matrice L cu
proprietăţile de optimalitate descrise. Cu alte cuvinte, se porneşte de la
relaţiile:
ξ η ⋅ = L şi η ξ ⋅ =
T
L , unde
|
|
|
|
|
|
.
|

\
|
=
−1
0
.
.
.
N
η
η
η . (8.35)
Primul pas ar fi să se determine cum ar trebui să fie L pentru ca
eroarea medie pătratică (asupra lui ξ) să fie minimă, dacă se înlocuieşte
η
N-1
cu zero, adică dacă se neglijează o componentă.
Fie:
|
|
|
|
|
|
.
|

\
|
=

0
.
.
~
2
0
N
η
η
η şi η ξ
~
~
⋅ =
T
L (8.36)
202
Este evident că:
2
2
~
~
η η ξ ξ − = − , deoarece:
( ) ( ) ( ) | | ( ) | | = − ⋅ ⋅ − ⋅ = − ⋅ − = − η η η η ξ ξ ξ ξ ξ ξ
~ ~
~ ~ ~
2
T
T
T
T
L L
( ) ( ) ( ) ( )
2
~ ~ ~ ~ ~
η η η η η η η η η η − = − ⋅ − = − ⋅ ⋅ ⋅ − =
T T T
L L (8.37)
Prin urmare:
( ) = ⋅ = = − = − =
− − −

=

1 1
2
1
1
0
2
2
2 ~ ~
N N N
N
k
k k
η η η η η η η ε

1 1 1 1 1 1 − − − − − −
⋅ ⋅ = ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅ =
N
T
N N
T T
N N
T T
N
l K l l l l l
ξ
ξ ξ ξ ξ (8.38)
unde K
ξ
este matricea de covariaţie (şi de corelaţie, deoarece este
de medie nulă) a vectorului ξ. Alegerea lui l
N-1
(l
k
fiind coloanele matricii
L
T
) trebuie făcută astfel încât acest ε
2
să fie minim, cu constrângerea că l
N-1

este un vector unitar:
1
1
1
= ⋅
− N
T
N-
l l (8.39)
Folosind metoda multiplicatorilor lui Lagrange, aceasta înseamnă
să minimizăm liber funcţia:
( ) 1
1 1 1 1
− ⋅ ⋅ − ⋅ ⋅ = Ψ
− − − − N
T
N N
T
N
l l l K l λ
ξ
(8.40)
Derivarea lui Ψ în raport cu componentele lui l
N-1
şi anularea ei, se
scrie mai compact ca anularea gradientului lui Ψ, iar:
( ) v A v A v
T
v
⋅ ⋅ = ⋅ ⋅ Ψ ∇ 2 (8.41)
pentru orice vector v şi orice matrice A, astfel că:
0 2 2
1 1
1
= ⋅ ⋅ − ⋅ ⋅ = Ψ ∇
− −

N N l
l l K
N
λ
ξ
(8.42)
adică l
N-1
trebuie să fie vector propriu al matricii de autocovariaţie a
lui ξ:

1 1 − −
⋅ = ⋅
N N
l l K λ
ξ
(8.43)
Cum în acest caz eroarea devine:
( ) λ λ λ λ ε
ξ
= ⋅ = ⋅ ⋅ = ⋅ ⋅ = ⋅ ⋅ =
− −
− − − − −
2
1 1
1 1 1 1 1
N N
T
N N
T
N N
T
N
l l l l l l K l
203
(deoarece l
N-1
este de modul 1) este clar că, pentru a avea un
minim, trebuie ca λ să fie cea mai mică valoare proprie a lui K
ξ
(se ştie că
K
ξ
este o matrice simetrică pozitiv definită şi prin urmare are N valori
proprii pozitive, iar vectorii proprii sunt ortogonali, de normă 1).
Vectorul
|
|
|
|
|
|
.
|

\
|
=
−1
0
.
.
.
N
η
η
η la care se doreşte ca ultima componentă să
fie minimă, are proprietatea interesantă că:
( ) = ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅ = ⋅
− − − − 1 1 1 1 N
T T
K N
T T
K
T
T
N
T
k N k
l l l l l l ξ ξ ξ ξ ξ ξ η η
= ( ) 0
1 min 1 min 1
= ⋅ ⋅ = ⋅ ⋅ = ⋅ ⋅
− − − N
T
k N
T
k N
T
k
l l l l l K l λ λ
ξ
(8.44)
pentru 1 − ≠ ∀ N k , deoarece L este o matrice ortogonală (unitară,
reală). Cu alte cuvinte η
N-1
este necorelată cu toate celelalte componente
ale lui η. Adică K
η
are forma:

⋅ ⋅
⋅ ⋅ ⋅
=


min
2 1 0 1
2 0 1 0 0 0
0 . . . 0 0
.
.
.
0
0 . . .
λ
η η η η
η η η η η η
η
N
N
K (8.45)
Dacă η
N-1
este necorelată cu toate celelalte componente η
k
ale lui η,
ea este necorelată şi cu orice combinaţie liniară a acestor componente.
Aceste lucruri permit să se spună că se poate repeta raţionamentul
precedent pentru vectorul:
204

|
|
|
|
|
|
.
|

\
|
=
−2
0
.
.
.
'
N
η
η
η
adică să se caute o transformare unitară care să minimizeze ultima
componentă (media ei pătratică) şi apoi tot aşa.
De fapt, deoarece η
N-1
este necorelată cu toate celelalte componente
η
k
, transformarea căutată se poate considera şi ea N-dimensională, cu
ultima linie
T
N
l
1 −
cunoscută.
Se ajunge la concluzia că matricea L care compactează cel mai bine
energia lui ξ adică pe
2
ξ în câteva componente, este cea pentru care
coloanele lui L
T
sunt vectorii proprii ai matricii K
ξ
în ordinea
descrescătoare a valorilor proprii, adică dacă:
| |
1 0
,...,

=
N
T
l l L ,
atunci l
k
satisface relaţia:

k k k
l l K ⋅ = ⋅ λ
ξ
(8.46)
unde:
1 2 1 0
...

≥ ≥ ≥ ≥
N
λ λ λ λ .

Transformarea unitară ( )
T
n
l l L ...
1
= , în care
k k k
l l K ⋅ = ⋅ λ
ξ
se
numeşte transformata Karhunen-Loeve (KL).
Eroarea ε dată de compresia cu transformata KL când se înlocuiesc
cu constante ultimele „N-m” componente ale lui Φ este:
∑ ∑ ∑
+ = + = + =
Φ ⋅
= Φ ⋅ Φ ⋅ = Φ ⋅ ⋅ Φ =
N
m k
k
N
m k
k
T
k
k
N
m k
k
x
T
k
k k
K
1 1 1
λ λ ε
λ
43 42 1
(8.55)
Construcţia matricii transformării KL se poate face astfel:
• se determină valorile proprii (λ
1
,..., λ
N
) ale lui K
ξ
;
• se ordonează descrescător: λ
(1)
>...> λ
(N)

205
• vectorii proprii corespunzători sunt ordonaţi în aceeaşi ordine:
( )
T
N
l l l L
) ( ) 2 ( ) 1 (
... = (8.56)
În acest mod, energia lui ξ η ⋅ = L va fi concentrată în primele
componente.

Exemplu:
În cazul unei transformări separabile, aplicată unei imagini I
N×N
, se
determină matricea de autocovariaţie a liniilor K
l
, matricea de
autocovariaţie a coloanelor K
c
(figura 8.19):
( ) ( )
T
c
c c c c K − ⋅ − = , ( ) ( )
T
l
l l l l K − ⋅ − = , (8.57)
unde mediile statistice pot fi estimate ca medii aritmetice pe mai
multe imagini.
c
1
c
2
c
N
l
1

l
2

l
N

I
... .
.
.


Figura 8.19. Calculul matricilor de autocovariaţie pe linii şi pe coloane.

Media statistică pe o singură imagine este:


=

N
i
i
l
N
l
1
1
,

=

N
i
i
c
N
c
1
1
(8.58)
( ) ( )

=
− ⋅ − ≅ ⇒
N
i
i
T
i l
l l l l
N
K
1
1
, ( ) ( )

=
− ⋅ − ≅
N
i
i
T
i c
c c c c
N
K
1
1
(8.59)
206
După determinarea matricelor K
l
şi K
c
, se determină vectorii proprii
şi valorile proprii:

l l l
L K λ → → ,
c c c
L K λ → → (8.60)
Cu aceste mărimi calculate, pentru o imagine dată U, imaginea V
obţinută prin transformarea KL bidimensională a imaginii iniţiale U, este:

T
l c
L U L V ⋅ ⋅ =
T
.......

V
. .
. . .
U. .

Figura 8.16. Principiul compresiei cu transformata T=KL.

În concluzie, transformarea optimă din punct de vedere al
compresiei este transformarea K-L (Karhunen-Loeve). Aceasta realizează
decorelarea elementelor imaginii şi transformatei şi prin aceasta
compactarea maximă a energiei semnalului (imaginii) în primele
componente. Cu toate aceste avantaje, deoarece transformata K-L depinde
de statistica imaginii şi datorită volumului mare de calcule necesare (mai
ales în cazul imaginilor de dimensiuni mari), transformata K–L este dificil
de implementat practic.
Totuşi, pentru imagini cu corelaţie mare, transformata K-L se poate
aproxima cu succes prin transformata Cosinus Discretă (DCT=Discrete
Cosine Transform) mult mai rapidă şi mai uşor de implementat.









207




Bibliografie


1. Buzuloiu V., Note de curs – Prelucrarea şi analiza imaginilor,
Universitatea din Oradea, 1996-2000.
2. Castleman K. R., “Digital Image Processing”, Editura Prentice-Hall,
1996.
3. Gonzales R.C., Woods R.E., “Digital Image Processing”, Editura
Prentice-Hall, 2002.
4. Jahne B., “Digital Image Processing”, Editura Springer, 2002.
5. Jain A. K., “Fundamentals of Digital Image Processing”, Editura
Prentice-Hall Inc., 1989.
6. Jiang M., “Digital Image Processing”, Curs, Peking University, 2001.
7. Pitas I., “Digital Image Processing. Algorithms and applications”,
Editura Wiley-Interscience, 2000.
8. Pratt W.K., “Digital Image Processing”, Editura John Wiley & Sons
2001.
9. Spătaru A., “Teoria transmiterii informaţiei”, Editura Didactică şi
Pedagogică, Bucureşti, 1984.
10. Vertan C., Ciuc M., “Tehnici fundamentale de prelucrarea şi analiza
imaginilor”, Editura MatrixRom, Bucureşti, 2007.
11. Wahl F., “Digital Image Signal Processing”, Editura Artech House,
1987.

EDITURA UNIVERSITĂŢII DIN ORADEA

Descrierea CIP a Bibliotecii Naţionale a României GRAVA, CRISTIAN Elemente de prelucrarea şi analiza imaginilor / Cristian Grava, Vasile Buzuloiu. Oradea : Editura Universităţii din Oradea, 2007 ISBN 978-973-759-377-1 I. Buzuloiu, Vasile 621.397.3 (075.8)

EDITURA UNIVERSITĂŢII DIN ORADEA ESTE ACREDITATĂ DE CNCSIS, COD 149.

2

Cuprins:
Prefaţă ………………………………………………………… 7 1. Introducere ………………………………………………………. 9 2. Reprezentarea imaginilor ………………………………………... 12 2.1. Digitizarea imaginilor ………………………………………. 12 2.2. Eşantionarea imaginilor …………………………………….. 15 2.3. Reprezentarea spaţială a imaginilor ………………………… 20 2.4. Proprietăţi ale imaginilor digitale ……………………….….. 25 2.4.1. Proprietăţi metrice ale imaginilor digitale ……….…… 26 2.4.2. Proprietăţi topologice ale imaginilor digitale ………… 27 2.4.3. Relaţii de vecinătate între pixeli ……………………… 28 2.4.4. Paradoxuri de conexitate ..……………………………. 31 2.4.5. Alte proprietăţi topologice şi geometrice ……………... 33 2.5. Reprezentarea spectrală a imaginilor ………………………... 34 2.5.1. Transformata Fourier (TF) bidimensională …………... 36 2.5.2. Proprietăţile transformatei Fourier bidimensionale …... 36 2.5.3. Proprietăţi specifice TF bidimensionale ……………… 43 3. Îmbunătăţirea imaginilor ………………………………………… 52 3.1. Calitatea unei imagini ………………………………………. . 52 3.2. Tehnici de îmbunătăţire a imaginilor ………………………… 55 3.3. Operatori punctuali de îmbunătăţire a imaginilor …………… 57 3.3.1. Operatori punctuali de modificare a contrastului ……… 58 3.3.2. Decuparea intervalelor de niveluri de gri ……………… 62 3.3.3. Modificarea histogramei ………………………………. 64 3.4. Operatori liniari de vecinătate pentru îmbunătăţirea imaginilor. Filtrarea liniară a imaginilor …………………………………. 68 3.5. Efectul în frecvenţă al operatorilor liniari de vecinătate …….. 73 3.6. Filtrarea neliniară a imaginilor ………………………………. 76 3.6.1. Filtre neliniare de ordine ………………………………. 77 3.6.2. Filtre de ordine multi-etaj ……………………………… 79 3.6.3. Proprietăţi ale filtrelor de ordine ………………………. 81
3

3.6.4. Filtre de ordine de domeniu …………………………… 83 3.6.5. L-filtre ………………………………………………… 85 4. Transformări integrale ale imaginilor ……………………………. 87 4.1. Transformări integrale unitare ………………………………. 87 4.2. Matrici unitare ………………………………………………. 93 4.3. Transformări unitare ale unor semnale unidimensionale …… 98 4.4. Transformări unitare ale unor semnale bidimensionale …….. 100 4.5. Transformata Fourier discretă unidimensională (DFT-1D) …. 104 4.6. Proprietăţi ale transformatei DFT-1D ……………………….. 105 4.7. Transformata Fourier discretă bidimensională (DFT-2D) ….... 108 4.8. Proprietăţi ale transformatei DFT-2D ……………………….. 111 4.9. Transformata Cosinus discretă unidimensională ……………. 113 4.10. Transformata Cosinus discretă bidimensională …………… 115 4.11. Transformata Sinus discretă unidimensională …………….. 120 4.12. Transformata Sinus discretă bidimensională ………………. 121 5. Restaurarea imaginilor …………………………………………… 122 5.1. Filtrarea inversă ……………………………………………… 123 5.2. Filtrul invers cu constrângeri ………………………………... 125 6. Morfologie matematică ………………………………..……. …... 130 6.1. Transformarea Hit or Miss ………………………………….. 130 6.2. Erodarea ……………………………………………………. 132 6.3. Dilatarea …………………………………………………….. 134 6.4. Proprietăţile operaţiilor morfologice ………………………... 136 6.5. Transformări morfologice derivate …………………………. 138 6.5.1. Operatori de extragere a conturului ……….…………. 138 6.5.2. Deschiderea şi închiderea …………………………….. 140 6.6. Trierea dimensională a obiectelor …………………………… 142 6.7. Caracterizarea morfologică a formelor ……………………… 143 6.7.1. Reconstrucţia după marker …………………………… 144 6.7.2. Distanţa Haussdorf …………………………………… 145 6.7.3. Extragerea skeletonului morfologic ………………….. 145 6.7.4. Skeletonul generalizat ………………………………… 149 6.8. Extinderea morfologiei matematice la imagini cu niveluri de gri.. 151
4

Compresia imaginilor binare ………………………………… 177 8. 204 5 .2.3.2.1.2. Metoda arborelui cuaternar (quad-tree) ………………. Codarea de nivel înalt ………………………………….1.1. Trecerea de la mulţime la funcţie ……………………… 152 6. Trecerea de la funcţie la mulţime ……………………… 153 6. Compresia cu transformate ……………………………. Segmentarea bazată pe creşterea şi fuziunea regiunilor .2.8.3.2. 184 8. Segmentarea bazată pe histogramă ……………………. Codarea la nivel de bloc ……………………………….. Segmentarea orientată pe contururi …………………………. 158 7.8.2.6. Segmentarea imaginilor …. Etichetarea componentelor ……………………………. 177 8.. Operatori de tip gradient ……………………………… 169 7. 161 7. Descriptori Fourier ……………………………… 181 8.1.3.2. Operaţii cu funcţii …………………………………….2. Codarea la nivel de bit ………………………………… 185 8. 176 8.1.1.2.1. Compresia imaginilor ……………………………………………. Compresia imaginilor cu niveluri de gri ……………………… 188 8. Aproximări poligonale ………………………….1.2.1.2.2. Metoda WBS (White Block Skipping) …………. Metoda arborelui cuaternar (Quad-tree) ………… 183 8. Segmentarea orientată pe regiuni …………………………….1. 177 8.1.2. 154 7. Operatori de tip compas ……………………………… 173 8.1.3.1.3..1.1. 188 8.1.3. 168 7.1. 178 8.2. 159 7.1.1.1. Codarea pe plane ………………………………………. 183 8. Codul Freeman ………………………………….2. 157 7..1.3. 165 7. Codarea RLE (Run Length Encoding) ………….……………………………………….1.. 157 7.1.2.8.1.2. 194 Bibliografie ………………………………………………………. Codarea entropică (Huffman) …………………… 186 8.1.3. 185 8.3. Segmentarea imaginilor cu niveluri de gri …………………… 161 7. Metode predictive de compresie ……………………….1.2. 190 8.

6 .

Prefaţă Prelucrarea şi analiza imaginilor ajunge pe zi ce trece. Newton. pe vremea bunicilor bunicilor noştri. tot mai mult. constituind subiecte alese din nevoile disciplinei. ajungând aici. Numai că. care este şi un suport de curs pentru studenţii ingineri ai Universităţii din Oradea dar poate fi şi o lectură utilă pentru toţi cei interesaţi de subiect. Cele de mai sus se vor o justificare a faptului că această carte. Numai că în matematică nu există „cale regală” adică pe care să înaintezi fără efort (asta o ştim încă din antichitate: i-a spus-o mentorul său împăratului Alexandru cel Mare!). al existenţei sociale contemporane. în fapt. conţine pagini întregi de matematică. tehnicile de restaurare a 7 . modelarea matematică a ajuns şi ea în învăţământul de masă. cum învăţământul universitar a ajuns „învăţământ de masă”. a semnalelor multimedia şi. care conţine printre multe altele. mai general. De asemenea. algoritmi de prelucrări şi algoritmi de analiză. Leibnitz – dar numărul celor ocupaţi cu modelarea matematică a crescut vertiginos în secolul XIX şi apoi al XX-lea astfel încât astăzi. adică în zorii epocii moderne din istoria omenirii. nu se rezumă la „suport”: analiza şi prelucrarea imaginilor – şi prin extensie. ne dăm seama că. a semnalelor multidimensionale – înseamnă în primul rând algoritmi. mult mai bogat. Rabatul pe care îl facem de la acest deziderat este justificat prin faptul că materia unui astfel de curs nu se rezumă la teorie ci are drept componentă principală şi partea de aplicaţii. cu arta aceasta se ocupau doar genii de prim rang – un Galilei. Cândva. adică s-ar vrea un „bun de larg consum”. în faţa ecranului: în felul acesta studentul „testează” pe viu ce influenţă au asupra rezultatelor modificările în algoritmi şi vede cum se modifică imaginea. avem de-a face cu „modelare matematică”. a secvenţelor video. în categoria „bunurilor de larg consum” ca urmare a aceleiaşi mutaţii suferită de calculatoarele electronice care reprezintă suportul „hard şi soft” al acestui domeniu relativ nou dar devenit indispensabil. fără îndoială. o carte de prelucrarea şi analiza imaginilor de sine stătătoare ar trebui să aibă un material imagistic ilustrativ. ne-am decis să folosim în titlu un partitiv „Elemente de …” fiindcă de fapt cartea este doar o uşoară introducere într-un domeniu astăzi deja vast. Şi. În mod ideal.

din păcate. în Catedra de Electronică a Universităţii din Oradea există un colectiv important de cadre tinere implicate în acest domeniu. Avem toate condiţiile preliminare pentru un învăţământ responsabil. adună elementele esenţiale ale unui curs introductiv dar presupune că studentul – cititorul – a fost „expus” înainte unor cursuri pregătitoare printre care cel de teoria statistică a semnalelor. suntem convinşi că cititorul va putea parcurge textul fără dificultăţi. un „domeniu de vârf”. noi am fost activi în el de mai bine de 30 de ani datorită cercetărilor de televiziune digitală şi prelucrare în timp real a semnalului digital în colectivul de cercetare al Catedrei de Electronică Aplicată de la Politehnica din Bucureşti. fiind vorba de subiecte reluate de la cursuri anterioare. După 1990 ne-am trezit într-o lume care între timp progresase mult în acest domeniu. cel de sisteme liniare şi cursurile fundamentale de matematică pentru ingineri. Cartea de faţă. feţe etc). a defectoscopiei nedistructive şi a teledetecţiei satelitare). cum se zice azi.imaginilor (din care fac parte cele de reconstrucţie a imaginilor din proiecţii care stau la baza imagisticii medicale. n-a dat roade. pentru compactizarea materialului s-a preferat o înşiruire neliniară a subiectelor. scrisă aproape în totalitate de Cristian Grava. cu stagii în străinătate şi colaborări internaţionale. ustensilele software pentru fotografia digitală (ne mărginim la un singur exemplu: corecţia în „timp real” a ochilor roşii) şi tot felul de sisteme de supraveghere a căror componentă principală trebuie să fie una capabilă de recunoaştere a formelor (maşini. propice dezvoltărilor tehnologice la noi şi astfel întâietatea şi avantajul pe care apucaserăm să îl avem „în lagărul socialist”. cel mult eventual cu reluări. mai mult. Perioada anilor ’80 n-a fost. Oradea – şi aşa se face că astăzi. Vasile Buzuloiu 8 . Prof. experienţa pe care o avem ne-a permis să reluăm ideile iar astăzi. primul sistem digital de analiză a imaginilor a fost terminat în 1981 iar în următorii ani a fost reprodus în câteva exemplare la Fabrica de Calculatoare Electronice. În pofida faptului că „prelucrarea şi analiza imaginilor” este. Ar mai fi de remarcat că. transplantul cunoştinţelor l-am făcut şi spre alte universităţi – Braşov. care de exemplu în capitolul 2 trimite la capitolul 4 dar. Laboratorul de Analiza şi Prelucrarea Imaginilor LAPI al Politehnicii din Bucureşti este destul de bine cunoscut şi peste hotare. Totuşi.

transformare şi utilizare a informaţiei vizuale din imaginile reprezentate. Reprezentarea şi modelarea imaginilor: • Eşantionarea şi cuantizarea imaginilor • Reprezentarea spaţială a imaginilor • Reprezentarea spectrală a imaginilor. Introducere Dezvoltarea spectaculoasă din ultimii ani a tehnologiei informaţiei şi a componentelor electronice a condus la impunerea de soluţii inimaginabile până nu demult pentru numeroase probleme tehnice. Printre aplicaţiile importante ale prelucrării şi analizei imaginilor se pot aminti aplicaţiile în medicină (investigarea de organe ale corpului uman). în sisteme de calcul de uz general sau calculatoare specializate. prospecţiuni geologice. aplicaţiile militare etc.) precum şi aplicaţii dedicate unor domenii ca arta. controlul tehnic automat al diverselor produse. Domeniul prelucrării şi analizei imaginilor grupează tehnicile de achiziţie. Transformarea unei imagini.1. ca de exemplu în industrie la conducerea proceselor de producţie sau la controlul de calitate.1. Transformata Fourier Prelucrarea se face asupra acestei imagini Imagine discretizată Transformare Imagine transformată Figura 1. Tehnicile de exploatare a informaţiei vizuale ocupă o poziţie importantă şi de extremă actualitate. transmise şi exploatate în formă digitală. 9 . Principalele probleme ale prelucrării şi analizei de imagini sunt: 1. robotică etc. aplicaţii în industrie şi în tehnică (cartografierea solului.

• prelucrări integrale.y) : 10 . reducerea zgomotului imaginilor. Exemple: accentuarea contururilor. caz în care se impune şi o etapă de restaurare a imaginii.y) Figura 1. pseudo-colorarea. • prelucrări pe vecinătăţi. Presupunem că f(x. Imaginea originală se poate obţine din imaginea degradată prin aplicarea unei transformări inverse celei suferite în procesul de captare. Apar probleme când în procesul de captare intervine şi zgomot. obţinându-se imaginea degradată fd(x. 2. Exemple: modificarea contrastului şi luminanţei.2. • prelucrări geometrice. liniară sau neliniară.y) transformare transformare-1 fd(x. Restaurarea imaginilor. pentru a se obţine o ˆ aproximare a imaginii originale f(x. f(x. modificarea histogramei. Îmbunătăţirea imaginilor.• Modelele imaginilor pot fi: stohastice. 3.y) este imaginea originală care datorită procesului de captare a suferit o transformare (degradare). deterministe. Se face prin: • prelucrări punctuale.y). Transformarea inversă a unei imagini.

f(x,y)

Transformare

+

fd(x,y)+zg

Restaurare

ˆ (x,y) f

zg=zgomot

Figura 1.3. Restaurarea imaginilor.
• Reconstrucţia imaginilor din proiecţii.

4. Analiza imaginilor, care implică:
• măsurători automate pe imagini; • segmentarea imaginilor (extragerea obiectelor).

5. Compresia imaginilor, care implică reducerea cantităţii de informaţie. Exemplu: Pentru o imagine de 512×512 pixeli (29×29), în care fiecare pixel este reprezentat pe 8 biţi, adică cu 28=256 niveluri de gri, cantitatea de informaţie este: (29×29)pixeli×23biţi/pixel=221 ≈ 2 Mb Prin compresia imaginilor se urmăreşte reducerea acestei cantităţi de informaţie. Schema bloc a unui lanţ de analiza şi prelucrarea imaginilor este prezentată în figura 1.4.
Scenă senzor CAD Îmbunătăţire + Restaurare Display Compresie CAD = convertor analog-digital Memorie Clasificare Măsurători Segmentare Display Listă de obiecte Măsurători pe obiecte Descrierea scenei date

Figura 1.4. Schema bloc a unui lanţ de analiza şi prelucrarea imaginilor.
11

2. Reprezentarea imaginilor
Sistemele vizuale ale organismelor vii percep mediul înconjurător 3-dimensional, prin intermediul unor latici de senzori de lumină bidimensionale (de exemplu, retina din ochii mamiferelor) şi refac spaţiul 3D prin integrare temporală şi/sau vedere binoculară. În pofida faptului că senzaţia este de câmp continuu al imaginilor percepute, laticea senzorilor este discretă. În sistemele tehnice imaginate de om, aceste proprietăţi se păstrează: informaţia imagistică din mediul înconjurător se proiectează pe latici bidimensionale de senzori de lumină şi astfel se discretizează spaţial, iar semnalele de la fiecare senzor se discretizează în timp şi în valoare astfel încât „imaginile” ajung în sistemele de calcul sub formă digitală, pentru prelucrare şi analiză.

2.1. Digitizarea imaginilor
Imaginile pot fi descrise de distribuţia spaţială a intensităţii luminoase într-un plan. Din punct de vedere matematic, distribuţia spaţială a intensităţii luminoase (I) poate fi descrisă printr-o funcţie continuă de două variabile spaţiale continue (x,y)=p: I(x,y)=I(p) Calculatoarele existente nu pot trata imaginile ca funcţii definite pe un domeniu continuu ci doar ca matrici discrete de numere. Din acest motiv este necesară transformarea şi reprezentarea imaginilor continue ca matrici bi-dimensionale de puncte, prin discretizare. Un punct al unei astfel de matrice se numeşte pixel (din engleză = picture element). Un pixel reprezintă intensitatea luminoasă sau culoarea corespunzătoare unui anumit punct din matrice. Prin urmare, un pixel este caracterizat prin poziţia şi prin valoarea sa.
12

Pentru tratări teoretice, imaginea bidimensională poate fi reprezentată ca o funcţie continuă (analogică) bidimensională I(x,y)=f(x,y), unde x şi y sunt coordonatele spaţiale. Valoarea funcţiei într-un punct oarecare (x,y) va reprezenta:
• luminanţa din punctul respectiv, în cazul în care funcţia f(x,y) este o funcţie reală. În acest caz avem o imagine cu niveluri de gri, numită impropriu şi imagine alb-negru; • culoarea din punctul respectiv, în cazul în care funcţia f este o funcţie vectorială, (f1(x,y),f2(x,y),f3(x,y)) = (R,G,B). În acest caz avem o imagine color, cu componentele fundamentale (R, G, B). Trecerea de la o imagine color la o imagine cu niveluri de gri se face prin adunarea componentelor fundamentale ponderate cu anumiţi coeficienţi, adică printr-o combinaţie liniară a acestor componente. Pentru prelucrarea digitală a imaginilor analogice (de exemplu cu ajutorul unui calculator) este nevoie de discretizarea imaginilor, proces în urma căruia imaginea este transformată într-o matrice care conţine elementele de imagine (pixel). În practică, camera video de tip CCD (Charge Coupled Device) realizează discretizarea imaginilor chiar în procesul de captare. Pentru afişare, imaginile se pot converti din nou în formă analogică. Discretizarea imaginilor analogice se realizează în doi paşi: • discretizarea spaţială (eşantionarea), cu ajutorul unei reţele discrete

f(l·∆x,k·∆y), l,k∈Z. În urma acestei operaţii rezultă o imagine (matrice) cu L linii şi K coloane: l≤L, k≤K. Prin urmare, se obţine L×K pixeli, iar imaginea obţinută se va scrie printr-o expresie de forma: A={a(l,k), 1≤l≤L, 1≤k≤K}, l,k,L,K∈Z; a11 a21 … aL,1 a12 a22 … aL,2
13

… … … …

a1,K a2,K … aL,K

• discretizarea în valoare (cuantizarea): fq(l·∆x,k·∆y) l,k∈Z, l≤L, k≤K, cu:

fq(l·∆x,k·∆y)∈{f1,…,fn}, unde n este numărul nivelurilor de cuantizare a imaginii (numărul nivelurilor de gri). De exemplu, pentru n=2 avem o imagine binară. În acest caz, fiecare eşantion obţinut în pasul anterior (la eşantionare) este cuantizat folosind un număr finit de biţi. Astfel, fiecare pixel va avea un anumit nivel de gri (pentru imagini alb-negru) sau o anumită culoare (pentru imagini color), codificată printr-un număr constant de biţi. În reprezentare binară, un pixel oarecare al,k este codat: (al,k)binar=bn-1bn-2…b1b0 căruia îi corespunde o valoare zecimală: (al,k)zecimal=bn-1·2n-1+bn-2·2n-2+…+b1·21+b0·20=q (2.1)

care reprezintă nivelul q din scara de 2n nivele de gri considerate. În mod uzual, negrul este considerat ca având nivelul logic 0 (în binar 00 …00), iar albul ca având nivelul logic 1 (în binar 11…11). De exemplu, în cazul unei imagini reprezentate pe 8 biţi avem un număr de 28 =256 niveluri de gri, în care negrul este codat cu nivelul q=0, iar albul este codat cu nivelul q=255. Pixelul a34 având valoarea codată binar cu octetul 00101001 este pixelul al 4-lea de pe rândul 3 şi are nivelul q=41 în scara de niveluri de gri amintită. În continuare, când se va vorbi despre imagini digitale sau simplu despre “imagini”, se va face referire la imagini eşantionate şi cuantizate, iar când se va vorbi despre discretizarea imaginilor se va face referire la discretizarea spaţială (eşantionarea) şi în valoare (cuantizarea) imaginilor.

14

2) y ∆y x ∆x Figura 2. cu pasul (∆x.1.k∈Z esantionare (2.5) 15 . x = l ⋅ ∆x. în rest (2.k ⋅ ∆y ))l. f ( x.y)   →( f (l ⋅ ∆x.2. Eşantionarea imaginilor Se consideră o matrice de eşantionare. m n unde: δ p ( x. y ) = ∑ ∑ δ ( x − l ⋅ ∆x.4) este impulsul Dirac δ periodic: 1. pt. în rest (2. y − n ⋅ ∆y ) = f ( x. y ). y ) ⋅ δ ( x − m ⋅ ∆x. y ) . Transformarea inversă (din şir în imagine) este posibilă în condiţiile teoremei eşantionării.2. y = k ⋅ ∆y f e ( x.3) f e ( x. x = 0 δ( x ) =  0. y ) = ∑ ∑ f ( x. y ) =  0. y − k ⋅ ∆y ) = δ periodic l k (2. Modelul matematic al semnalului eşantionat este: not .∆y) care transformă imaginea dintr-o funcţie (continuă) într-un şir: f(x. Matricea de eşantionare a unei imagini. y ) ⋅ δ p ( x.

y ) ⋅ exp − ∆x ⋅ ∆y ( ∆x ) ( ∆y )   2π  2π j  ∆x k ⋅ x + ∆y l ⋅ y  dxdy (2.  . respectiv ∆y pe y: δ p ( x.y) este periodică cu perioada ∆x pe x. seria sa Fourier este: f (t ) = ∑ C k ⋅ e k j 2π k ⋅t T .8) Din acest motiv.9) C kl =  1 ∫ ∫ δ p ( x.10)     ∆x ∆x  . y ) = ∑ ∑ C kl k l  2π 2π  j  k ⋅x + l⋅ y   ∆x ∆y   ⋅e  .Transformata Fourier a semnalului eşantionat este: Fe (u . y ) { } (2. unde: (2. respectiv Deoarece se integrează pe un interval ∆x = −  2 2  ∆y ∆y  . ∆y = −  2 2 ∆y cade un singur impuls δp şi numai unul (cel din origine): 16 . y )} = ℑ f ( x.7) −j 1 C k = ∫ f (t ) ⋅ e T TT 2π dt (2. unde coeficienţii: k ⋅t (2.  şi dacă se presupune că într-un dreptunghi cu laturile ∆x. deoarece funcţia δp(x.6) Se ştie că dacă funcţia f(t) este periodică (cu perioada T). y ) ⋅ δ p ( x. v) = ℑ{ f e ( x.

14) Pe baza proprietăţii de liniaritate a transformatei Fourier:  2π 2π    j  k ⋅x + l⋅ y   ∆x 1  ∆y    ⇒ Fe (u . v) = ℑ ⋅ ∑ ∑ f ( x.2. iar în cazul de faţă: f(0)=1 −∞ ⇒ C k .13) (2. y ) ⋅ e   ∆x ⋅ ∆y k l     (2.11)  ∆x  ∆y   Deoarece: ∫ δ (t ) ⋅ f (t )dt = f (0) . v) = ⋅ ∑ ∑ ℑ f ( x. y ) ⋅ e   ∆x ⋅ ∆y k l     (2. y ) ⋅ exp − ∆x ⋅ ∆y −∞ −∞  ∞ ⇒ C kl =  2π  2π j k⋅x+ l ⋅ y  dxdy (2.k·∆y z l·∆x y x Figura 2.12)   j  k ⋅x + l⋅ y  1 ∆x ∆y  ⇒ δ p ( x.15) 17 . ∞ ∞  1 ∫ ∫ δ p ( x. y ) = ∑ ∑ ⋅e  k l ∆x ⋅ ∆y  2π 2π    j  k ⋅x + l⋅ y   ∆x  1 ∆y    ⇒ Fe (u . Eşantionarea imaginilor.l = 1 ∆x ⋅ ∆y  2π  2π (2.

2π ∆y (2. v − l = ⋅ ∑ ∑ ℑ u −  ∆x ⋅ ∆y ⋅ ∑ ∑ ℑ(u − k ⋅ ∆u .v) FTJ v v ∆u u ∆v u Figura 2.v): F(u. Spectrul semnalului eşantionat.4). ∆v-vmax ∆v vmax umax ∆u ∆u-umax v u Figura 2.v) se obţine prin periodizarea (repetarea) spectrului său Fe(u. v − l ⋅ ∆v )  ∆x ⋅ ∆y k l  ∆x ∆y  k l unde: ∆u = not . 18 .⇒ Fe (u . Recuperarea semnalului original din semnalul eşantionat se poate face cu un filtru trece-jos (FTJ) cu parametri adecvaţi (figura 2.16) Spectrul semnalului eşantionat F(u.4. Parametrii FTJ. v) =  1 2π 2π  1 k.3. 2π ∆x . ∆v = not .

respectiv v.v) f(x. adică astfel încât: 19 . ∆v = adică frecvenţele de eşantionare pe x. cu un filtru ideal trece-jos cu funcţia de transfer: fe(x. din eşantioane. 1. respectiv v (ce corespund coordonatelor spaţiale x. η) a FTJ de recuperare a semnalului original în cele două direcţii (u. trebuie să îndeplinească condiţiile: u max ≤ ξ ≤ ∆u − u max  v max ≤ η ≤ ∆v − v max (2.5. sunt mai mari sau cel puţin egale cu dublul frecvenţelor maxime din spectrul lui f pe direcţia u. respectiv vmax reprezintă frecvenţele spaţiale maxime din spectrul funcţiei f.17) Prin urmare. η) sunt alese în mod corespunzător.Parametrii umax. FTJ necesar pentru extragerea semnalului original. trebuie ca parametrii acestuia să satisfacă condiţiile: ∆u − u max ≥ u max  ∆v − v max ≥ v max ∆u ≥ 2 ⋅ u max ⇒ ∆v ≥ 2 ⋅ v max (2.18) Astfel. respectiv y).y) Figura 2. teorema eşantionării se poate enunţa astfel: 2π 2π . în acest caz. frecvenţele de tăiere (ξ. v) =  0.v).y) H(u. atunci recuperarea semnalului original de imagine f(x. în direcţia u. Pentru ca semnalul original să fie corect recuperat cu ajutorul unui FTJ.19) unde frecvenţele de tăiere (ξ. respectiv dacă ∆u = ∆x ∆y pe y. pentru u ≤ ξ si v ≤ η H (u. în rest (2.y) se poate face exact.

Se observă că deşi condiţia de recuperare nu este îndeplinită.6. Poziţia unui pixel este dată în mod analog notaţiei utilizate 20 . imaginile pot fi prelucrate şi analizate cu sisteme de calcul uzuale sau dedicate. 2.3. adecvate diverselor aplicaţii.u max ≤ ξ ≤ ∆u − u max  v max ≤ η ≤ ∆v − v max (2.). spectrală etc. Reprezentarea spaţială a imaginilor Odată digitizate (eşantionate şi cuantizate).v) ∆u-umax H(u. recuperarea se poate face cu un FTJ ideal corespunzător.v) Figura 2. În cazul cel mai simplu.20) Observaţie: Condiţia de recuperare enunţată de teorema eşantionării este suficientă dar nu şi necesară. pixelii sunt localizaţi pe o reţea rectangulară. care să extragă doar zona corespunzătoare spectrului funcţiei. Reprezentarea imaginilor se poate face sub diverse forme (spaţială. Caz particular de extragere a semnalului original. Acest lucru este ilustrat de exemplul următor: v umax ∆u vmax ∆v-vmax ∆v u F(u.

de la stânga la dreapta (figura 2. Reprezentarea imaginilor digitale ca matrici de pixeli dispuşi într-o reţea rectangulară bi-dimensională. unde indicele l=0…L-1.1). iar k=0…K-1. L reprezintă numărul de linii. Primul indice (l) exprimă poziţia pe linie. Rezoluţia spaţială de reprezentare a unei imagini poate fi definită ca reprezentând numărul total de pixeli (de exemplu L×K) sau poate fi definită ca fiind egală cu numărul de pixeli pe unitatea de suprafaţă (în pixeli/cm2 sau în pixeli/inch2). se mai poate defini şi sensibilitatea unui sistem de vedere sau a unui sistem de 21 .7. Rezoluţia spaţială a unui sistem de achiziţie de imagini se poate defini ca fiind egală cu numărul de pixeli pe unitatea de lungime (pixeli/mm sau pixeli/cm). iar cel de-al doilea indice (k) exprimă poziţia pe coloană (figura 2.k L-1 y Figura 2. Dacă imaginea conţine L×K pixeli. Ca şi în cazul matricilor. Sensul pozitiv al axei orizontale (x) este cel uzual.pentru elementele unei matrice. Pe baza acestor noţiuni. aceasta poate fi reprezentată printr-o matrice de dimensiune L×K. iar K numărul de coloane. cum este cazul reprezentărilor grafice bidimensionale uzuale. sensul pozitiv al axei verticale (y) este de sus în jos şi nu de jos în sus. coloane 0 0 1 1 k K-1 x l linii Cl.1).

nu numai că rezoluţia spaţială este mică.8. (a) (b) (c) (d) Figura 2. În figura 2. (b) . (d) .8.a şi 2. ca fiind unitatea minimă de lungime care poate fi observată într-o imagine achiziţionată.achiziţie de imagini.16×16 pixeli.8 este ilustrată una şi aceeaşi imagine. reprezentată printr-un număr diferit de pixeli.64×64 pixeli. Valoarea asociată unui pixel reprezintă în mod adecvat media intensităţii luminoase din celula corespunzătoare. Fiecare pixel reprezintă nu numai un punct al unei imagini. dar apar nişte artefacte (zgomote) 22 . (c) .8.b). Imagine digitală cu diferite rezoluţii: (a) .256×256 pixeli. ci o regiune rectangulară a acesteia.32×32 pixeli. care defineşte o celulă elementară a imaginii. În cazul unor pixeli de dimensiune mare (figura 2.

trebuie ca dimensiunea unui pixel să fie mai mică decât dimensiunea corespunzătoare rezoluţiei spaţiale a sistemului vizual. adică atunci când dimensiunea unui pixel al imaginii devine mai mică decât dimensiunea minimă pe care o poate percepe ochiul uman. de 1000×1000 = 1 milion de elemente. chiar dacă se utilizează sisteme de achiziţie cu o rezoluţie ridicată. În general. Acest lucru de întâmplă când rezoluţia spaţială a imaginii devine mai mare decât rezoluţia sistemului uman de vedere. într-o aplicaţie dată.8. De exemplu. Astfel se pot obţine informaţii legate de variaţiile temporale ale unui semnal şi prin urmare se poate studia cinematica şi dinamica temporală a acestuia. Prin urmare. adică atunci când creşte rezoluţia spaţială (figura 2. o imagine poate oferi informaţii referitoare la variaţia spaţială a unui semnal. În cazul unei aplicaţii concrete. În cazul observării vizuale a unei imagini. la o distanţă nominală a observatorului.deranjante datorate discontinuităţilor de niveluri de gri de la marginile pixelilor. efectele descrise mai sus devin mai puţin pronunţate. se efectuează măsurători relativ la un singur punct. se pot obţine informaţii care nu sunt accesibile dintr-o imagine statică. în cazul măsurării unor astfel de mărimi uni-dimensionale. a unei tensiuni electrice sau a unei frecvenţe. Aceasta poate fi considerată o rezoluţie slabă. o rezoluţie sau o precizie satisfăcătoare începe de la 10-6. În plus.8. dimensiunea unui pixel trebuie să fie obligatoriu mai mică decât dimensiunea celui mai mic obiect pe care dorim să îl vizualizăm. 23 . Însă. Nu există un răspuns general valabil legat de numărul optim de pixeli necesar pentru a crea senzaţia de continuitate spaţială a unei imagini.c şi 2. putându-se ajunge până la impresia de continuitate spaţială a imaginii. rezoluţia spaţială relativă este de 10-3. care distrag atenţia privitorului de la conţinutul propriu-zis al imaginii.d). în timp ce o imagine de 1000×1000 conţine un milion de puncte. Atunci când dimensiunea pixelilor devine mai mică. deoarece în cazul măsurării unei lungimi. cel care impune o limită a numărului de pixeli este sistemul de achiziţie a imaginilor. dacă se achiziţionează secvenţe temporale de imagini.

dar şi cea mai răspândită geometrie a unei imagini digitale. (c) – reţea hexagonală.9). Într-o reţea rectangulară.10). Pe lângă aceasta.9. Poziţia unui voxel este indicată prin trei indici: un indice de linie (l). 24 .reţea triunghiulară. un indice de coloană (k) şi un indice (m) pentru ”adâncime” (figura 2. chimie sau mineralogie. există doar trei forme de reţele regulate posibile: triunghiulare. pătrate sau hexagonale (figura 2. Forme de reţele regulate posibile în 2D: (a) . Figura 2.O reţea rectangulară reprezintă cea mai simplă. Dacă se iau în considerare doar poligoane regulate. fiecare pixel reprezintă valoarea medie a nivelului de gri (sau de culoare) dintr-un cub elementar. Aceste forme şi dispuneri geometrice sunt similare configuraţiilor cristaline posibile în cazul corpurilor solide 3D în fizică. mai există şi alte aranjamente geometrice ale pixelilor sau alte forme ale celulelor elementare.reţea pătrată. pixelul se transformă în voxel (din engleză = volume element). (b) . În cazul imaginilor 3D.

• unele proprietăţi ale imaginilor continue nu au o analogie directă în domeniul imaginilor digitale.10. pixelii sunt aranjaţi sub forma unei reţele rectangulare.4. diferite de proprietăţile funcţiilor bidimensionale continue. Pe baza celor prezentate până în acest punct. metrice sau topologice. Proprietăţi ale imaginilor digitale Imaginile digitale au unele proprietăţi. • în mod uzual. Reprezentarea imaginilor digitale ca matrici de voxeli dispuşi într-o reţea rectangulară tri-dimensională.z m x l k y Figura 2. 2. se pot trage următoarele concluzii: • o imagine digitală este formată din elemente de imagine (pixeli) de dimensiune finită. 25 . • o imagine digitală reprezintă o matrice bidimensională a cărui elemente sunt numere întregi care corespund nivelurilor de cuantizare a gamei de niveluri de gri.

dar are dezavantajul unui cost mare de calcul datorită radicalului din formulă şi datorită valorii neîntregi care rezultă şi deci a interpolării necesare. l )] = (i − k )2 + ( j − l )2 (2.21) Avantajul distanţei euclidiene este faptul că este intuitivă. • Dacă sunt permise doar deplasări orizontale şi verticale.l) poate fi definită în diferite moduri: • distanţa euclidiană: d E [(i. l )] = max{i − k .j) şi (k. (k .23) 26 . dintre punctul de start şi punctul final. (k .4. j ). (k . Distanţa dintre punctele de coordonate (i. se poate defini distanţa d8 sau distanţa de tip şah: d 8 [(i. • Dacă sunt permise şi deplasări diagonale. l )] = i − k + j − l (2. se poate defini distanţa d4 sau distanţa interbloc: d 4 [(i. j − l } (2. Distanţa dintre două puncte poate fi exprimată şi prin numărul minim de paşi elementari de pe reţeaua discretă. j ).1. j ). Proprietăţi metrice ale imaginilor digitale Distanţa dintre doi pixeli dintr-o imagine digitală reprezintă o mărime cantitativă.22) Această distanţă este similară distanţei dintre două locaţii dintr-un oraş cu o reţea rectangulară de străzi şi blocuri închise de clădiri.2.

27 . …. O cale dintre un pixel P şi Q este o secvenţă de puncte A1. Proprietăţi topologice ale imaginilor digitale Adiacenţa pixelilor este un concept important în prelucrarea imaginilor digitale.4. A2.11. An. aceşti pixeli sunt conecşi. doi pixeli sunt vecini în sensul distanţei d8 dacă există o distanţă d8=1 între cei doi pixeli. Fie R reuniunea tuturor regiunilor Ri.2. simetrică şi tranzitivă şi defineşte o descompunere a mulţimii (în cazul de faţă imaginea) în clase echivalente (regiuni). unde A1=P şi An=Q. Relaţia de conexitate este reflexivă. ca mulţimi conexe de pixeli adiacenţi. i=1. iar Ai+1 este vecin cu Ai. iar pixelii acelei căi sunt incluşi şi ei în mulţimea respectivă.n. Cele două tipuri de vecinătăţi sunt ilustrate în figura de mai jos: V4 V8 Figura 2. Dacă există o cale între doi pixeli ai unei imagini. …. Să presupunem că Ri sunt regiuni disjuncte din imagine şi că aceste regiuni nu ating marginile imaginii (pentru a evita cazurile speciale). În mod analog. Vecinătatea V4 şi V8. Oricare doi pixeli sunt vecini în sensul distanţei d4 dacă există o distanţă d4 =1 între cei doi pixeli. Pe baza adiacenţei pixelilor se pot defini regiunile.2. Fie RC complementara mulţimii R în raport cu imaginea. O regiune reprezintă o mulţime de pixeli în care există o cale între oricare pereche de pixeli ai săi.

unele regiuni din imagine se numesc obiecte. Astfel.12. O regiune cu găuri se numeşte regiune multi-conexă.a şi 2. nivelul de gri al unui pixel reprezintă o proprietate simplă care poate fi utilizată pentru a defini obiectele dintr-o imagine. O gaură constă din punctele care nu aparţin unui obiect şi sunt înconjurate de obiecte. deoarece pe baza acestora se pot defini regiunile conexe şi obiectele.Submulţimea lui RC care este conexă în raport cu marginile imaginii se numeşte fundal.b ). 2.3. 28 . Toate celelalte obiecte constituie fundalul. în care literele reprezintă obiectele. constituie un obiect. Toate punctele care satisfac această proprietate şi care sunt conexe. el aparţine unui anumit obiect. Relaţii de vecinătate între pixeli Una din proprietăţile importante ale imaginilor discrete este reprezentată de relaţiile de vecinătate dintre pixeli. Un exemplu îl constituie un text negru pe o pagină albă. Într-o reţea rectangulară bidimensională se pot defini două tipuri de vecinătăţi ale pixelilor (figura 2. Dacă un pixel are un nivel de gri mai mare decât anumite praguri predefinite. Toate celelalte regiuni ale hârtiei reprezintă fundal. Regiunilor li se pot atribui proprietăţi secundare care îşi au originea în interpretarea imaginilor. De exemplu. Dacă nu avem găuri într-o regiune. iar restul mulţimii RC se numesc găuri. Procesul prin care se determină care regiuni dintr-o imagine corespund fiecărui obiect se numeşte segmentarea imaginilor.12.4. Regiunile albe înconjurate de litere reprezintă găuri (de exemplu în interiorul literei O). aceasta se numeşte regiune simplu conexă. Trebuie observat faptul că noţiunea de regiune implică doar proprietatea de conexitate.

k+1 l-1.l-1. k-1 l-1. (b) . Se poate defini şi o altă vecinătate. obţinându-se vecinătatea V8 (figura 2. dar este constituit din două obiecte în sensul unei vecinătăţi V4.12. Figura 2.vecinătatea V4. Ambele tipuri de vecinătate sunt necesare pentru a defini obiectele şi regiunile conexe. k-1 l. obţinându-se vecinătatea V4 (figura 2. k l-1. în cadrul căreia doi pixeli sunt vecini dacă au cel puţin un colţ comun. Vecinătăţi definite pe o reţea rectangulară: (a) . trecând doar de la un pixel vecin la altul. Astfel. k-1 l+1. În acest caz un pixel va avea 4 vecini. k l.b). Definirea acestor vecinătăţi se poate face şi pe baza unor relaţii matematice.12. k+1 l.12. se poate spune despre doi pixeli că sunt vecini dacă au cel puţin o latură comună. k l+1. În acest caz. k+1 Figura 2.13 reprezintă un obiect în sensul unei vecinătăţi V8. De exemplu. dar pentru moment vor fi definite într-un mod simplu. Se spune despre o regiune (sau un obiect) că este conexă atunci când se poate ajunge de la un pixel la oricare alt pixel al regiunii.13.vecinătatea V8.a). pentru o mai bună înţelegere. Regiunea gri reprezintă un obiect (sau regiune conexă) dacă se utilizează o vecinătate V8 şi două obiecte dacă se utilizează o vecinătate V4. un pixel va avea 8 vecini. k l. k+1 l+1. 29 . k l. k-1 l. k l+1. obiectul gri din figura 2.

de regulă. au în comun şi o latură. Cele trei tipuri de vecinătăţi posibile într-o reţea cubică 3D: (a) . Pentru a se putea face o distincţie clară între fundal şi obiectele din figură se poate defini o vecinătate V4 în cazul obiectelor şi o vecinătate V8 în cazul fundalului sau invers. În cazul unei reţele rectangulare. V18.Acelaşi lucru se poate afirma şi despre fundalul alb din figura 2. În cazul tri-dimensional. cu laturi comune sau cu colţuri comune. În cazul unei reţele hexagonale se poate defini numai o vecinătate V6 deoarece toţi pixelii care au în comun un colţ. Motivul îl reprezintă dispunerea sub formă hexagonală a senzorilor din retina ochiului uman.V18: voxeli cu laturi comune. (c) . În acest caz există trei moduri de definire a vecinătăţilor: voxeli cu feţe comune. aceste enunţuri permit definirea unei vecinătăţi V6. k l-1 k m-1 k+1 k-1 l l l+1 l m Figura 2.V26: voxeli cu colţuri comune.13. imagini ai căror pixeli sunt dispuşi într-o reţea rectangulară. reţelele hexagonale sunt utilizate în mod curent în prelucrarea imaginilor deşi sistemele de achiziţie a imaginilor generează.9). iar pixelii care au în comun o latură.14.14).V6: voxeli cu feţe comune. 30 . relaţiile de vecinătate sunt mai complexe. (b) . În ciuda acestor dezavantaje. au în comun şi două colţuri. În cazul unei reţele triunghiulare se poate defini o vecinătate V3 pentru pixelii care au în comun câte o latură şi o vecinătate V12 pentru pixelii care au în comun câte un colţ (figura 2. Aceste complicaţii nu apar numai în cazul reţelelor rectangulare. respectiv V26 (figura 2.

dar nu se intersectează în alt caz (dreapta-sus). Exemplul 1. deoarece nu au un punct comun. Mai mult. Dacă se utilizează vecinătatea V4.15. 2.4.4. Astfel. pentru a putea defini în mod corect regiunile conexe. apar şi conflicte în raport cu înţelegerea intuitivă a proprietăţilor liniilor. Astfel. liniile nu sunt conexe în fiecare punct al lor. Exemplu de paradox de conexitate a liniilor. respectiv -45o. iar în cazul fundalului se poate utiliza o vecinătate V26 sau invers. în cazul obiectelor se poate utiliza o vecinătate V6. Paradoxuri de conexitate Definiţia vecinătăţii şi conexităţii pe o reţea rectangulară creează unele paradoxuri. Figura 2. 31 . două linii perpendiculare se intersectează într-un caz (stânga-jos). În figura următoare sunt reprezentate trei linii digitale cu pante de 45o.Şi în acest caz trebuie definite două tipuri de vecinătăţi pentru obiecte şi pentru fundal.

Exemplu de paradox de conexitate a curbelor sau regiunilor. în mod intuitiv. la fel ca şi C ∪ D. majoritatea 32 . A ∪ B sunt neconexe. utilizând vecinătatea V8. Dacă se presupune vecinătatea V8. la rândul lor. Cele două mulţimi conţin în întregime căile AB şi CD. C şi D. din motive de simplitate. numeroase dezavantaje. figura de mai sus conţine patru regiuni separate conexe A. Dacă imaginea este digitizată într-o reţea pătrată. În figura următoare este prezentat un alt paradox. B. Acest paradox este cunoscut în geometria euclidiană. ceea ce reprezintă o contradicţie topologică deoarece. Dacă se presupune vecinătatea (conexitatea) V4. care nu intersectează curba. dacă A ∪ B sunt neconexe. se poate trasa o linie din partea internă a unei curbe închise până în partea externă. unde fiecare curbă (sau regiune) închisă divide planul în două regiuni neconexe. Reţelele hexagonale rezolvă o mare parte a acestor probleme dar au. există două regiuni A ∪ B şi C ∪ D. Exemplul 3 (paradoxul conectivităţii). ar trebui ca C ∪ D să fie conexe.15. A D C B Figura 2.Exemplul 2. Problemele prezentate sunt tipice reţelelor rectangulare. dar acestea se intersectează! O soluţie de eliminare a paradoxului conexităţii este de a trata obiectele utilizând vecinătatea V4 iar fundalul utilizând vecinătatea V8 sau invers. Astfel. Aceasta implică faptul că părţile interne şi externe ale curbei constituie o singură regiune conexă.

Cu toate acestea. care au unul sau mai mulţi vecini în exteriorul regiunii. care permit eliminarea paradoxurilor expuse. punctele (0-dimensionale) pot fi atribuite unor mulţimi care să conţină structuri de dimensiuni mai mari (ca de exemplu. Direcţia muchiilor compuse este cea de creştere a nivelului de gri şi este 33 . De exemplu. Direcţia unei muchii este perpendiculară pe direcţia gradientului care indică direcţia de variaţie a nivelului de gri din imagine. mulţimi de pixeli). O alternativă pentru eliminarea problemelor de vecinătate sau conexitate este de a utiliza topologia discretă.5. Frontiera este un concept global relativ la o regiune. Astfel se poate introduce noţiunea de muchie compusă. care reprezintă frontiera fundalului (complementarei) regiunii. între muchii şi frontiere există o legătură. considerând familii de mulţimi de diferite dimensiuni. care exprimă relaţia sa cu cei 4 vecini.4. o posibilitate de a determina frontierele este de a concatena muchiile semnificative (punctele caracterizate de un gradient mare al funcţiei de variaţie a nivelului de gri). în ciuda dezavantajelor şi paradoxurilor prezentate.dispozitivelor de digitizare utilizează o reţea rectangulară. 2. Liniile (1-dimensionale) permit o definiţie precisă a muchiilor şi contururilor etc. în timp ce muchia exprimă o proprietate locală a funcţiei de variaţie a nivelului de gri dintr-o imagine. Proprietatea de a aparţine unei muchii este caracteristică unui pixel şi vecinilor săi. Alte proprietăţi topologice şi geometrice Frontiera unei regiuni R este o mulţime de pixeli din regiune. ataşată fiecărui pixel. Această definiţie se referă la frontiera internă. caracterizată de o amplitudine şi o direcţie. Astfel. Muchia este o proprietate a unui pixel şi a vecinătăţii sale imediate. Uneori este avantajos să se utilizeze proprietăţi ale unor perechi de pixeli vecini. pentru a o distinge de frontiera externă.

toate punctele liniei aparţinând regiunii. Un contur convex este cea mai mică regiune care conţine un obiect. în timp ce amplitudinea sa reprezintă diferenţa absolută dintre nivelurile de gri ale perechilor relevante de pixeli. Reprezentarea spectrală a imaginilor Reprezentarea spectrală a imaginilor este utilă în analiza spectrală a acestora. Ilustrarea spectrului unui semnal lent şi a unuia rapid variabil. are un spectru mai larg. astfel încât oricare două puncte ale regiunii pot fi unite printr-o linie dreaptă. Un obiect poate fi reprezentat printr-o colecţie a componentelor sale topologice. care nu aparţin unui obiect.5. f(t) |F(ω)| t ω f(t) |F(ω)| t ω Figura 2. în timp ce un semnal rapid variabil. 2. De exemplu.un multiplu de 90o. sunt numite deficit de convexitate. un semnal unidimensional (1D) lent variabil are un spectru concentrat în jurul originii. Analiza spectrală oferă informaţii despre modul de variaţie a unui semnal. Pentru descrierea proprietăţilor geometrice ale obiectelor se utilizează contururi convexe.16. 34 . Mulţimile de puncte din interiorul contururilor convexe.

∞ (2. pentru care există transformată Fourier directă şi inversă. adică: ∞   2 f (t ) ∈ L2 =  f (t ) | E f = ∫ f (t ) dt < ∞  . prin inspecţia spectrului său. f : R → C −∞ not . Spectrul unui semnal (sau al unei imagini) se obţine prin transformata Fourier a acestuia. 1 ∞ j ⋅ω ⋅t ∫ F (ω ) ⋅ e dω = f (t ) 2π −∞ (2.În cazul imaginilor (2D) se poate determina dacă are sau nu contururi multe. ⇒ ∃F (ω ) ⇒ ℑ : L2 → L2 este inversabilă. def . −∞   unde Ef este energia funcţiei f. (2. iar ω este frecvenţa. Transformata Fourier unidimensională se defineşte astfel: ℑ{ f (t )} = ∫ f (t ) ⋅ e − j⋅ω⋅t dt = F (ω ) . 2π 35 .24) Transformata Fourier ℑ{ f (t )} = F (ω ) se defineşte pentru funcţiile f(t)∈L2. unde L2 este clasa semnalelor (funcţiilor) de energie finită. Transformata Fourier inversă se defineşte ca fiind: ℑ−1{F (ω )} = def .26) În aceste relaţii: ω este pulsaţia.25) Dacă: f∈L2. pornind de la constatarea că variaţiile rapide (frecvenţele mari) corespund contururilor.

2. 1 4π 2 R2 ∫∫ F (u. Transformata Fourier bidimensională inversă se defineşte ca fiind: ℑ −1 {F (u .5. Proprietăţile transformatei Fourier bidimensionale 1. Transformata Fourier bidimensională Definiţie: Se consideră funcţia bidimensională f(x.5. y ) ⋅ exp[− j ⋅ (u ⋅ x + v ⋅ y )]dxdy = F (u . f: R→C. v) ⋅ exp[ j ⋅ (u ⋅ x + v ⋅ y )]dudv = f ( x.y sunt coordonate spaţiale.27) Transformata Fourier bidimensională a funcţiei f se defineşte ca fiind: ℑ{ f ( x.v sunt frecvenţe spaţiale.28) unde: x. ⇒ ∃F (ω) ⇒ ℑ : L2 → L2 este inversabilă.1.y). y ) dxdy < ∞      R2 (2. ∞ ∞ (2.     2 f ∈ L2 =  f : R 2 → C | E f = ∫∫ f ( x. y )} = ∫ ∫ f ( x. unde: def . v) − ∞ −∞ def . Dacă: f∈L2.30) 36 .29) 2. Deplasarea semnalului: Dacă funcţiei unidimensionale 1D f(t) îi corespunde transformata Fourier F(ω) atunci funcţiei f(t-t0) îi corespunde: f (t ) ↔ F (ω ) ⇒ f (t ± t 0 ) ↔ F (ω ) ⋅ e ± j⋅ω⋅t0 În cazul bidimensional (2D): F1D F1D (2. v)} = def . y ) (2. iar u.2.

d. v) ⋅ e ± j⋅(u⋅x0 +v⋅ y0 ) (2. y − y 0 )} = ∫∫ f ( x − x0 . y ' ) ⋅ exp[− j ⋅ (u ⋅ x'+v ⋅ y ')] ⋅ dx' dy ' = = F (u . respectiv y-y0=y’. y − y 0 ) ⋅ e − j⋅(u⋅x +v⋅ y )dxdy R 2 F2 D F2 D (2.33) ℑ{ f ( x − x 0 . y ) ↔ F (u . y ) ⋅ e ± j⋅(u⋅x0 +v⋅ y0 ) ↔ F (u m u 0 .31) Demonstraţie: ℑ{ f ( x − x0 . v) ⇒ f ( x ± x0 . Deplasarea spectrului: Dacă funcţiei unidimensionale 1D f(t) îi corespunde spectrul (transformata Fourier) F(ω). 2. atunci funcţiei corespunde spectrul deplasat: f (t ) ↔ F (ω ) ⇒ f (t ) ⋅ e ± j⋅ω0 ⋅t ↔ F (ω m ω 0 ) În cazul bidimensional: f ( x.f ( x.e. y ± y 0 ) ↔ F (u . y ) ↔ F (u .32) Făcând schimbările de variabile: x-x0=x’. y ' ) ⋅ exp[− j ⋅ (u ⋅ ( x'+ x 0 ) + v ⋅ ( y '+ y 0 ) )]⋅ I ⋅ dx ' dy ' = R2 = exp[− j (u ⋅ x 0 + v ⋅ y 0 )] ∫∫ f ( x' .35) Demonstraţia este lăsată ca exerciţiu. y − y 0 )} = ∫∫ f ( x' . v) ⇒ f ( x. 37 F2 D F2 D F1D F1D R2 f (t ) ⋅ e ± j⋅ω0 ⋅t îi (2. aceasta fiind similară demonstraţiei proprietăţii 1. v m v0 ) (2. v) ⋅ exp[− j (u ⋅ x0 + v ⋅ y 0 )] q. iacobianul corespunzător este:  ∂x  ∂x' I = det   ∂y  ∂x'  ∂y   ∂y '  =1 ∂y  ∂y '   (2. de deplasare a semnalului.34) .

a<1 t 1  ω ⋅ F  a a ω ω Figura 2.y) îi corespunde transformata Fourier F(u. respectiv b·y=y’. y ) ↔ F (u . Scalarea semnalului: Dacă funcţiei f(x.37) Făcând schimbările de variabile: a·x=x’.36) În cazul unidimensional. v) ⇒ f (a ⋅ x.  a⋅b a b (2. Demonstraţie: ℑ{ f (a ⋅ x. b ⋅ y ) ⋅ e − j⋅(u⋅x +v⋅ y ) dxdy R 2 (2. Ilustrarea grafică a scalării semnalului. atunci funcţiei scalate f (ax. b ⋅ y )} = ∫∫ f (a ⋅ x. acest lucru poate fi ilustrat grafic astfel: f(t) |F(ω)| t f(a·t) Pt. iacobianul corespunzător este:  ∂x  ∂x' I = det   ∂y   ∂x' ∂y   1 ∂y '  = ∂y  a ⋅ b ∂y '   38 (2. by ) îi corespunde transformata Fourier: f ( x. b ⋅ y ) ↔ F2 D F2 D 1 u v ⋅ F .3.17.38) .v).

atunci conjugatei funcţiei simetrice faţă de origine f (− x.− y ) .  q. ℑ{ f ( a ⋅ x. îi corespunde un spectru (transformata Fourier) simetric faţă de origine.v). dacă funcţiei f(x.− y ) . 5.39) Demonstraţia este trivială şi se face similar proprietăţii de deplasare a semnalului. y ' ) ⋅ exp − j ⋅  u ⋅ + v ⋅  ⋅ I ⋅ dx ' dy ' = a b  a ⋅b 2  a b  R 4. y ) ↔ F (u . v) F F (2. g ↔ F.−v) F2 D F2 D (2. atunci funcţiei simetrice faţă de origine f (− x.y) îi corespunde transformata Fourier F(u.41) Dacă funcţia f este reală (f∈R2): f ( x. atunci funcţiei compuse α ⋅ f + β ⋅ g îi corespunde transformata Fourier compusă: F2 D F2 D f .− y ) ↔ F (−u .− y ) ↔ F * (u .y) îi corespunde transformata Fourier F(u. y ) ↔ F (u . b ⋅ y )} = ∫∫ f ( x ' . v) (2.42) 39 .d. v) ⇒ f * (− x.G ⇒ α ⋅ f + β ⋅ g ↔ α ⋅ F + β ⋅ G. ∀α . y ) = f * (− x. îi corespunde un spectru (transformata Fourier) simetric faţă de origine: f ( x.40) Similar. Proprietatea de simetrie: Dacă funcţiei f(x. Liniaritatea: Dacă funcţiilor f. respectiv g le corespunde transformatele Fourier F. respectiv G.− y ) ⇒ F (−u . y '  1  x' u v ⋅ F  .−v) = F * (u . β ∈ C (2.v). v) ⇒ f (− x. dar rotit cu 1800: 2D 2D f ( x.e.

y ) ∗ f ( x. g : R 2 → C . y − η )dξdη  ⋅ e − j⋅(u⋅x +v⋅ y ) dxdy =  R 2 R 2     = ∫∫ f (ξ . y ) ⋅ g ( x. y ) = ∫∫ f (ξ . v) ∗ G (u .   = ∫∫  ∫∫ f (ξ . y ) R 2 Enunţul teoremei convoluţiei: Dacă funcţiei f(x. v) ⋅ G (u . v) (2. y ) ∗ g ( x. y ) ↔ F (u . (2. Teorema convoluţiei: Fie funcţiile bidimensionale f .η ) ⋅ g ( x − ξ . = ∫∫ f ( x − ξ .η )dξdη = g ( x. y ) ∗ g ( x.v).η ) ⋅ g ( x − ξ . iar funcţiei g(x.6. v) F2 D F2 D (2. y − η ) ⋅ e − j⋅(u⋅ x +v⋅ y ) dxdy dξdη = R 2   444444 2444444 3 R2 1 4 4 G (u . y )} = ∫∫ f ( x. y − η )dξdη = R 2 def .46) Demonstraţie: ℑ{ f ( x. iar produsului simplu a celor două funcţii îi corespunde produsul de convoluţie a transformatelor Fourier ale celor două funcţii: f ( x. atunci produsului de convoluţie a celor două funcţii îi corespunde produsul transformatelor Fourier ale celor două funcţii. y ) ⋅ e − j⋅(u⋅x +v⋅ y ) dxdy = R2 def .45) f ( x.y) îi corespunde transformata Fourier F(u. y − η ) ⋅ g (ξ .v )⋅e − j ⋅(ξ ⋅u +η ⋅v ) 40 . y ) ↔ 1 4π 2 F (u . Produsul de convoluţie al funcţiilor f şi g se defineşte astfel: f ( x.v).44) def .η ) ⋅  ∫∫ g ( x − ξ .43) (2. y ) ∗ g ( x.y) îi corespunde transformata Fourier G(u. y ) ∗ g ( x.

Fourier a celor două funcţii.e.v). g : R 2 → C .d. y ) = def 1 4π 2 R2 * − j ( u ⋅ x + v⋅ y ) dudv ∫∫ G (u. y )dxdy = R2 def F2 D F2 D (2.η ) ⋅ e − j⋅(ξ ⋅u +η ⋅v ) dξdη = F (u . v) ⋅ G (u. y ) ↔ G (u .G (2. y ) ⋅ g * ( x. v)dudv = 1 4π 2 F. v) ⋅ G (u . dacă: f ( x. Teorema lui Parceval: Fie funcţiile bidimensionale f . v) q. v) ⋅ e j (u⋅ x + v⋅ y ) dudv g * ( x. g = ∫∫ f ( x.= ∫∫ G (u . v) ⋅ e ⇒ f .47) 1 4π 2 1 F.48) 4π 2 R 2 * ∫∫ F (u.v). g = ∫∫ f ( x.y) îi corespunde transformata Fourier G(u. atunci produsului scalar a celor două funcţii îi corespunde produsul scalar al transformatelor 1 .G Demonstraţie: g ( x.y) îi corespunde transformata Fourier F(u. multiplicat cu o constantă 4π 2 Deci. v) .g = adică: ⇒ f . R2 7. v) şi g ( x. v) ⋅ f (ξ . iar funcţiei g(x. y ) ⋅ R2  1  * − j (u⋅ x + v⋅ y ) dudv dxdy =  ∫∫ G (u . y ) ↔ F (u . y ) = 1 4π 2 R2 ∫∫ G (u. atunci: ⇒ f. v) ⋅ e 4π 2 R 2    41 . Dacă funcţiei f(x.

d.e. v) ⋅ G (u . v)dudv = R 2 1 4π 2 F. 4π 2 Această teoremă rezultă ca un caz particular din teorema lui Parceval. Teorema simetriei: Dacă funcţiei unidimensionale f(t) îi corespunde transformata Fourier F(ω). v ) ∫∫ 14424(43 dudv = 2 ⋅ E F 1442443 4π 2 R 2 4π R2 2 2 f F 8.51) Un exemplu este prezentat în figura următoare: 42 . v) ⋅ R2  1  − j (u⋅ x + v⋅ y ) dxdy dudv =  ∫∫ f ( x. 2 (2. y )dxdy = F (u .G q.50) 1 1 ⇒ E f = ∫∫ f ( x. multiplicată cu o constantă 1 . Dacă definim energia funcţiei f ca fiind: E f = ∫∫ f ( x. y ) ⋅ e 4π 2 R 2  4444 244444   1 4 3 F ( u . atunci transformatei Fourier privită ca funcţie de timp F(t) îi corespunde transformata Fourier simetrică multiplicată cu constanta 2π: f (t ) ↔ F (ω ) F1D F1D ⇒ F (t ) ↔ 2π ⋅ f (−ω ) (2. pentru g=f: (2. v ) ⋅ F * u . y ) ⋅ f * ( x. y ) dxdy R 2 def .= ∫∫ G * (u .49) Teorema energiei (consecinţă a teoremei lui Parceval): Energia calculată în spaţiul original (primar) este egală cu energia calculată în domeniul spectral.v ) = 1 4π 2 * ∫∫ F (u .

3. dacă funcţiei bidimensionale f(x. y )   ∞ 43 .y) îi corespunde transformata Fourier F(u.f(t) F1D t F(t) F1D t F(ω) ω f(ω) ω Figura 2.y) îi corespunde transformata Fourier simetrică multiplicată cu constanta 4π2: f ( x. Exemple ilustrative ale teoremei simetriei.52) 2. v) F2 D F2 D ⇒ F ( x. Proprietăţi specifice transformatei Fourier bidimensionale 9.18. În cazul bidimensional. v) = ∫ ∫ f ( x.−v) (2. Separabilitatea: Transformata Fourier bidimensională este separabilă: F (u . y ) ↔ 4π 2 ⋅ f (−u . y ) ⋅ exp[− j ⋅ (u ⋅ x + v ⋅ y )]dxdy = −∞ − ∞ ∞ ∞   ∞  = ∫  ∫ f ( x. y ) ⋅ exp(− j ⋅ u ⋅ x )dx  ⋅ exp(− j ⋅ v ⋅ y )dy =   −∞ −∞4444244443 1  Fx (u .5. y ) ↔ F (u . atunci transformatei Fourier privită ca funcţie de spaţiu F(x.v).

se aplică transformata Fourier unidimensională pe direcţia x. y )    → Fxy (u . v) (2. . transformata sa Fourier este egală cu produsul transformatelor Fourier a celor două funcţii. v) = F (u . Cu alte cuvinte. atunci derivatei funcţiei f în raport cu cele două variabile. îi corespunde următoarele transformate Fourier: 44 . Derivarea spaţială: Dacă funcţiei bidimensionale f(x.y) îi corespunde transformata Fourier F(u. v) = F (u . y ) ⋅ exp(− j ⋅ v ⋅ y )dy = Fxy (u . v) = F (u .55) 10. atunci şi pentru transformata Fourier bidimensională există un algoritm rapid de calcul.v). v) −∞ ∞ (2. v)   → F yx (u .53) Din această proprietate rezultă că se poate face calculul transformatei Fourier bidimensionale aplicând pe rând (pe cele două direcţii x şi y) transformata Fourier unidimensională. y ) = f1 ( x) ⋅ f 2 ( y ) ⇒ F (u . v) = F1 (u ) ⋅ F2 (v).= ∫ Fx (u .Dacă funcţia originală se poate scrie ca produsul a două funcţii.Dacă se dispune de un algoritm rapid de calcul pentru cazul unidimensional (iar pentru transformata Fourier există un astfel de algoritm). adică: Dacă: f ( x.54)   F pe x F pe y F pe y F pe x Proprietatea de separabilitate are următoarele consecinţe: . y )    → F y ( x. iar asupra rezultatului se aplică transformata Fourier unidimensională pe direcţia y: 1D 1D f ( x. v) sau:   1D 1D f ( x.  F1(u) = ℑ{ f1 ( x)} unde :   F2(v) = ℑ{ f 2 ( y )} (2. y )    → Fx (u .

Integrarea spaţială: Dacă funcţiei bidimensionale f(x. v)  F  ∂f F2 D   ∂x ← → j ⋅ u ⋅ F (u . ∂ 2 f 2 ∂x + ∂2 f ∂y 2 (2.y) îi corespunde transformata Fourier F(u.57) 1 ∂f = ∫∫ F (u. v) ⋅ j ⋅ u ⋅ exp[ j ⋅ (u ⋅ x + v ⋅ y )]dudv = j ⋅ u ⋅ F (u.e.58) ⇒ ∂2 f ∂x 2 2 ←D →( j ⋅ u ) 2 ⋅ F (u . 1 4π 2 R2 ∫∫ F (u .2 f ( x. de exemplu la calculul laplaceanului: ∆f ( x. atunci integralei funcţiei f în raport cu cele două variabile. îi corespunde următoarele transformate Fourier: 45 . y ) = Deoarece: ∂f F2 ←D → j ⋅ u ⋅ F (u .56) Demonstraţie: f ( x.v). y ) = ⇒ def . v)  ⇒ F2  ∂f ←D → j ⋅ v ⋅ F (u . y ) ←D → F (u .d. v) ⋅ exp[ j ⋅ (u ⋅ x + v ⋅ y )]dudv (2. v) = −u 2 ⋅ F  F În mod similar: ⇒ 2 ←D → = −v 2 ⋅ F  F 2 ⇒ ∆f ( x. v) q. v)  F (2. ∂x 4π 2 R 2 Această proprietate are aplicaţii în calculul diferenţial. y ) ←D → = −(u 2 + v 2 ) ⋅ F (u . v)   ∂y  (2. v)  ∂x ∂2 f ∂y 2 def .59) 11.

46 . îi corespunde un spectru rotit în acelaşi sens şi cu acelaşi unghi α.60) Demonstraţie: F (u . y ) ⋅ exp(− j ⋅ v ⋅ y )dxdy = ∫  ∫ f ( x. v) = ℑ ∫ f ( x. y )dy ← ℑ F (u .v). ∞ ∞ ∞ ∞ ∞ ∞  ⇒ F (0. y )dx  (2. îi corespunde o transformată Fourier rotită în acelaşi sens şi cu acelaşi unghi α. fα(x. În cazul bidimensional (deci în cazul unei imagini 2D). y ) ⋅ exp[− j ⋅ (u ⋅ x + v ⋅ y )]dxdy −∞ −∞ def . atunci funcţiei rotite cu un unghi α.0) → ∫ − ∞ (2. dacă funcţiei bidimensionale f(x. v) = ∫ ∫ f ( x. v)  ∫ f ( x. Rotaţia (Rotα) conservă liniaritatea şi simetriile. atunci funcţiei rotite cu un unghi α.y). fα.2  f ( x. y )dx  ⋅ exp(− j ⋅ v ⋅ y )dy − − ∞ −∞ −∞ 1∞4 44  42 3  o functie y 14444de 4 444444 4 2 3 transformata Fourier a functiei de y ∞  ⇒ F (0. y ) ←D → F (u . y )dx ← − ∞ ⇒ ∞  f ( x. v) F ∞ ℑ → F (0. Teorema rotaţiei: Dacă funcţiei unidimensionale f îi corespunde transformata Fourier F. v) = ∫ ∫ f ( x.61) − ∞  12.y) îi corespunde transformata Fourier F(u.

Rotaţia Rotα : R 2 → R 2 se poate scrie:  x'   cos α  =  y '   − sin α    sin α   x  ⋅  cos α   y     (2. y ) = f ( x' .y y' y α x' x x Figura 2.19.63) ⇒ fα ( x. Rotaţia unui segment de dreaptă. rotaţia se mai poate scrie:  x' = x ⋅ cos α + y ⋅ sin α   y ' = − x ⋅ sin α + y ⋅ cos α (2. y )} = ∫∫ f ( x ⋅ cos α + y ⋅ sin α.− x ⋅ sin α + y ⋅ cos α ) Demonstraţie: ℑ{ f α ( x.62) Prin urmare. y ' ) = f ( x ⋅ cos α + y ⋅ sin α .− x ⋅ sin α + y ⋅ cos α) ⋅ e − j⋅(u⋅ x +v⋅ y ) dxdy R2  x' = x ⋅ cos α + y ⋅ sin α Se face schimbarea de variabile:   y ' = − x ⋅ sin α + y ⋅ cos α 47 .

 x   cos(−α ) sin( −α )   x'   cos α ⇒ =      y   − sin( −α ) cos(−α )  ⋅  y '  =  sin α         x = x'⋅ cos α − y '⋅ sin α ⇒  y ' = x'⋅ sin α + y '⋅ cos α Înlocuind: R2 − sin α   x'  ⋅  cos α   y '     (2. ρ ⋅ sin ϕ ) = f p ( ρ . unde:  u '   cos α  =  v'   − sin α    sin α   u  ⋅  cos α   v     (2. y ) = f ( ρ ⋅ cos ϕ . v' ) = Fα (u . ϕ ) .65) Prin urmare. y ' ) ⋅ exp[− j (u ⋅ x'⋅ cos α − u ⋅ y '⋅ sin α + v ⋅ x'⋅ sin α + v ⋅ y '⋅ cos α )]dx' dy ' Iacobianul este:  ∂x  ∂x' det   ∂y   ∂x' ∂x    cos α ∂y '  = det   sin α ∂y   ∂y '   − sin α   =1 cos α     ⇒ ℑ{ f α ( x. y )} = ∫∫ f ( x' . această proprietate se scrie: f ( x. v) . atunci şi transformata sa Fourier F(u. (2. y ' ) ⋅ exp−  R2     j (u ⋅ cos α + v ⋅ sin α) ⋅ x'+(−u ⋅ sin α + v ⋅ cos α) ⋅ y ' dx' dy ' 4 3 1444 444 2 3   144 2444 u' v'    ⇒ ℑ{ fα ( x. dacă funcţia f(x.y) este cu simetrie circulară.v) este cu simetrie circulară.64) ℑ{ f α ( x. În coordonate polare (fp).66) 48 . Demonstraţie: Presupunem că f(x. y )} = ∫∫ f ( x' .y) este o funcţie cu simetrie circulară. y )} = F (u ' .

y ) în coordonate polare = f p (ρ. ϕ) simetrie circularã = f p (ρ) (2. ∞ ∞ (2.69) Prin această schimbare de variabile.68) Se face schimbarea de variabile carteziene în coordonate polare:  x = ρ ⋅ cos ϕ   y = ρ ⋅ sin ϕ ρ = x 2 + y 2  ⇒ y ϕ = arctg x  (2. Domeniile de valori în diferite sisteme de coordonate. y ) ⋅ exp[− j ⋅ (u ⋅ x + v ⋅ y )]dxdy −∞ −∞ def . 49 .20.67) Pornim de la relaţia de definiţie: F (u . iar ρ trebuie să ia valori între 0…∞): y R2 φ în coordonate polare x 2π … ρ ρ=0…∞ φ=0…2π Figura 2. x = ρ ⋅ cos ϕ unde:   y = ρ ⋅ sin ϕ Deoarece funcţia f este cu simetrie circulară: ⇒ f ( x. planul real se transformă în coordonate polare într-o semibandă de înălţime 2π (pentru a se acoperi tot planul φ trebuie să ia valori între 0…2π. v) = ∫ ∫ f ( x.

atunci şi transformata sa Fourier F este cu simetrie circulară (q.73) Prin urmare.ϕ ) = f p (ρ ) ∞  2π  ⇒ F p (r .e. (2. 50 .d).Iacobianul este:  ∂x  ∂ρ det   ∂y  ∂ρ  ∞ ∞ ∂x    cos ϕ ∂ϕ  = det  sin ϕ ∂y   ∂ϕ   − ρ ⋅ sin ϕ   =ρ ρ ⋅ cos ϕ   (2.71) ⇒ F p (r . cu perioada 2π ∞  2π ⇒ F p (r .70) ⇒ F (u . ϕ ) ⋅ exp[− j ⋅ (u ⋅ ρ ⋅ cos ϕ + v ⋅ ρ ⋅ sin ϕ )] ⋅ dρ ⋅ dϕ −∞ −∞ Se fac notaţiile: u = r ⋅ cos θ  v = r ⋅ sin θ not. v) = ∫ ∫ ρ ⋅ f p ( ρ . r ⋅ sin θ ) not .θ ) = ∫ ρ ⋅ f p ( ρ ) ⋅  ∫ ⋅ exp[− j ⋅ r ⋅ ρ ⋅ cos(ϕ − θ )]dϕ  ⋅ dρ 0  044444 2444444 1 4 3 = ∫ e − j⋅r ⋅ρ ⋅cos ϕ dϕ = J 0 ( ρ ⋅r ) deoarece integrandul este periodic dupã ϕ. θ ) = F (r ⋅ cos θ .θ ) = ∫ ρ ⋅ f p ( ρ ) ⋅  ∫ e − j⋅r⋅ρ ⋅cos ϕ dϕ 0 0 0 2π (2. dacă funcţia f este cu simetrie circulară.72)   dρ = F p (r )  (2. ∞ 2π 0 0 ⇒ F p (r . ϕ) ⋅ exp[− j ⋅ r ⋅ ρ(cos θ ⋅ cos ϕ + sin θ ⋅ sin ϕ)] ⋅ dρ ⋅ dϕ Dacă funcţia f este cu simetrie circulară: ⇒ f p (ρ . θ) = ∫ ∫ ρ ⋅ f p (ρ.

51 .În plus. ∞ Henkel a unei funcţii de o singură variabilă f(ρ). se ştie că: J 0 ( x) = ∫ exp(− j ⋅ x ⋅ cos ϕ )dϕ = funcţia Bessel de ordinul 0 0 2π ⇒ F p (r ) = ∫ ρ ⋅ f p ( ρ ) ⋅ J 0 ( ρ ⋅ r )dρ = transformata Henkel 0 ∞ H { f ( ρ )} = ∫ ρ ⋅ f p ( ρ ) ⋅ J 0 ( ρ ⋅ r )dρ = F (r ) = transformata 0 def .

y 2 ∑ ( g ( x. textura. Printre parametrii psiho-fizici ai percepţiei vizuale umane pot fi amintiţi: contrastul. Pentru a estima această degradare se pot utiliza măsuri de calitate a imaginii.y) imaginea originală şi f'(x. O altă alternativă este corelaţia dintre imaginile f şi g. Calitatea imaginii f(x. de regulă. Îmbunătăţirea imaginilor La concepţia algoritmilor sau a dispozitivelor de prelucrare şi îmbunătăţire a imaginilor trebuie luat în considerare principiul percepţiei vizuale umane.1. Metodele de apreciere a calităţii imaginii pot fi împărţite în două categorii: subiective şi obiective.y).3.y)= f(x. o imagine de sinteză. Calitatea unei imagini O imagine poate fi degradată pe parcursul achiziţiei. Fie f(x. y ) − f ( x. y ) ) (3.1) Problema acestei măsuri este că nu este posibilă distincţia între câteva diferenţe mari şi multe diferenţe mici. înţelegerea lor furnizând explicaţii referitoare la mecanismele vederii umane şi artificiale.y)+z(x. culoarea etc. În locul diferenţei medii pătratice se poate utiliza eroarea medie absolută. Percepţia umană a unei imagini poate provoca multe iluzii.y) 52 . transmisiei sau prelucrării sale. forma. Una din clasele de metode cele mai utilizate se bazează pe diferenţa medie pătratică MSE: x. Calitatea necesară pentru o imagine depinde de scopul în care este utilizată imaginea.y) este estimată prin compararea cu o imagine de referinţă g(x. contururile. O măsură a degradării imaginii este reprezentată de raportul semnal-zgomot SNR. 3. Imaginea de referinţă utilizată în acest scop este.

Zgomotul care poate să apară la achiziţia. iar intensitatea sa nu se modifică odată cu frecvenţa. Prin urmare. y ) ( 2 2 2 ) (dB) (3. y f ( x. Avantajul acestui model de zgomot este că permite simplificarea calculelor. Probabilitatea de densitate a variabilei aleatoare ce descrie zgomotul Gaussian este dată de funcţia lui Gauss. transmiterea sau prelucrarea imaginilor. f ) = 10 ⋅ log10 ∑ x . y ) − f ' ( x . y ) 2 ∑ x . poate fi dependent sau independent de conţinutul imaginii. Un raport PSNR mai mare de 32 dB corespunde unei degradări invizibile. care este estimat prin relaţia: SNR ( f ' . Măsura degradării este estimată prin raportul dintre energia semnalului şi energia zgomotului. f ' ) = 10 ⋅ log10 N ⋅ max x.3) unde N este numărul de pixeli.4) 53 . de caracteristicile sale probabilistice.imaginea degradată. y f ( x. y ) − f ' ( x. Un caz special de zgomot îl reprezintă zgomotul Gaussian. valorile zgomotului în doi pixeli diferiţi sunt necorelate. Zgomotul Gaussian reprezintă o aproximare foarte bună a zgomotului care intervine în majoritatea cazurilor. Acest tip de zgomot se utilizează în majoritatea cazurilor ca aproximare brută a zgomotului dintr-o imagine. y f ( x. Funcţia sa de auto-corelaţie este funcţia delta. y ) ( ∑ x . y f ( x. în general. y ) 2 2 2 2 ) (dB) (3. Zgomotul Gaussian unidimensional 1D este caracterizat de media sa µ şi de deviaţia standard σ a variabilei aleatoare: p( x) = 1 2πσ 2 ( x− µ )2 2σ 2 ⋅e − (3.2) Se poate defini şi valoarea de vârf a raportului semnal-zgomot PSNR: PSNR ( f . Zgomotul alb are un spectru de putere constant. Zgomotul este descris.

Nivelul de gri aparent depinde foarte mult de nivelul local de gri al fundalului. în cazul în care zgomotul η şi semnalul de imagine f sunt independente: (3. Acesta este motivul pentru care majoritatea monitoarelor au implementată o corecţie de tip gamma.y) · η(x. care corespunde unei imagini degradate cu pixeli albi şi/sau negri. 54 . Datorită acestui efect. percepţia vizuală a unor obiecte cu acelaşi nivel de gri poate fi diferită dacă acestea sunt plasate pe un fundal de culoare închisă sau deschisă.y) ≈ f(x.6) • zgomotul impulsiv (de tip impuls) corespunde unei degradări a imaginii cu pixeli „zgomotoşi” a căror valoare diferă semnificativ de cea a pixelilor din vecinătatea lor. Prin urmare.5) f’(x. • zgomotul multiplicativ este o funcţie descrisă de relaţia: f'(x. degradarea sa poate fi modelată ca un zgomot aditiv. Contrastul reprezintă variaţia locală a nivelului de gri şi se defineşte ca raport între nivelul mediu de gri al unui obiect şi cel al fundalului. Acest efect este numit contrast condiţional. în general.y) În timpul transmisiei zgomotul este.Zgomotul poate fi: • zgomot aditiv. independent de semnalul de imagine. de exemplu.y) (3. • zgomotul de tip „sare şi piper” este utilizat pentru a descrie zgomotul impulsiv saturat.y) = f(x. Un parametru important în aprecierea calităţii unei imagini îl constituie contrastul.y) + η(x. Ochiul uman este logaritmic sensibil la iluminare şi la variaţii ale nivelurilor de gri.

3.2. Tehnici de îmbunătăţire a imaginilor
Îmbunătăţirea imaginilor constă dintr-un ansamblu de tehnici de prelucrare care au ca scop scoaterea în evidenţă a anumitor caracteristici a imaginilor (de exemplu muchii sau contururi) sau eliminarea zgomotului, scopul final fiind obţinerea unei vizibilităţi superioare a componentelor imaginii. În general, termenul de îmbunătăţire este strâns legat de percepţia vizuală subiectivă a unui expert uman, considerat utilizatorul final al imaginii. Întrucât nu se pot defini standarde de calitate a imaginilor, calitatea imaginii este un criteriu subiectiv. Cei care pot face afirmaţii cu privire la calitatea unor imagini sunt experţii din domeniile din care provin imaginile. În plus, se poate afirma că îmbunătăţirea imaginilor este bine să fie interactivă şi iterativă deoarece utilizatorul poate interveni în permanenţă asupra calităţii imaginii şi fiecare utilizator o va face într-un mod caracteristic. Tehnicile de îmbunătăţire a imaginilor nu generează informaţie suplimentară despre imaginea originală, ci doar o pune pe cea existentă sub o altă formă, mai uşor de interpretat de către utilizator. Chiar şi o imagine originală, nedegradată, poate fi îmbunătăţită, obţinând o imagine modificată, dar subiectiv preferabilă. De exemplu, într-o imagine subexpusă sau supraexpusă, utilizatorul (uman sau dispozitivul tehnic) poate să nu distingă între două niveluri de luminanţă care diferă cu o cuantă; acestea sunt valori diferite în semnalul din calculator şi prin tehnici de îmbunătăţire a imaginii pot fi făcute să difere mult mai mult, astfel încât să fie depăşit pragul de sesizare a diferenţei.

55

Operatorii de îmbunătăţire a imaginilor pot fi împărţiţi în trei mari categorii: • operatori punctuali, prin care se realizează o relaţie de corespondenţă punctuală între valoarea originală a fiecărui pixel şi valoarea sa după transformare; • operatori spaţiali (locali sau de vecinătate), la care noua valoare a nivelului de gri a unui pixel se obţine din valoarea originală a pixelului respectiv şi din valorile originale ale unor pixeli din vecinătatea acestuia; • operatori integrali, în cazul cărora valoarea nouă a unui pixel depinde de valorile tuturor pixelilor din imaginea originală, obţinându-se printr-o transformare integrală a acestora. Pentru a exemplifica operaţiile de îmbunătăţire a imaginilor, se vor considera imagini de dimensiuni L×K (cu L linii şi K coloane) şi se va nota cu U imaginea iniţială şi cu V imaginea îmbunătăţită, rezultată în urma aplicării unei operaţii sau transformări de îmbunătăţire (T) asupra imaginii iniţiale:
U = { (l , k ) | 1 ≤ l ≤ L,1 ≤ k ≤ K } , U V = {V (l , k ) | 1 ≤ l ≤ L,1 ≤ k ≤ K } (3.7) (3.8)

În figura 3.1 se observă că imaginea îmbunătăţită are aceleaşi dimensiuni ca şi imaginea originală.

56

K

V=T(U)

K

U L

V

L

Figura 3.1. Operaţia de îmbunătăţire a unei imagini.

3.3. Operatori punctuali de îmbunătăţire a imaginilor
Operatorii punctuali de îmbunătăţire a imaginilor sunt transformări aplicate asupra nivelurilor de gri, a căror rezultat depinde doar de valoarea din pixelul considerat. Operatorii punctuali sunt definiţi prin relaţii prin care se realizează asocieri între valoarea originală a fiecărui pixel şi valoarea sa după transformare. K K
v (l,k)=T(u(l,k)) v(l,k) U L V

u(l,k) L

Figura 3.2. Operaţia de îmbunătăţire a unei imagini, cu operatori punctuali. Operatorii punctuali de îmbunătăţire a imaginilor pot fi împărţiţi în: 1) operatori de modificare a contrastului (engl. contrast streching); 2) transformări de decupare (engl. clipping, slicing, thresholding); 3) operatori de modificare a histogramei.
57

3.3.1. Operatori punctuali de modificare a contrastului
Operaţiile de modificare a contrastului urmăresc mărirea sau micşorarea intervalului de niveluri de gri ocupat de anumite componente ale imaginii, păstrând acelaşi număr total de niveluri de gri (N).

Negativarea imaginii
Cea mai simplă operaţie de modificare a contrastului este negativarea imaginii, definită de ecuaţia: v(l , k ) = N − u (l , k ) , unde N este numărul de niveluri de cuantizare (de gri). Contrastul relativ perceput de un observator uman este modificat, ca urmare a diferenţei de sensibilitate între percepţia nuanţelor întunecate şi luminoase. Exemplul cel mai simplu de aplicare este percepţia unei radiografii de către un observator nespecialist: contrastul va fi apreciat ca mult mai bun pentru imaginea negativată, în care avem obiecte de interes negre pe fond alb.
def .

(3.9)

Diferenţa între imagini
Această operaţie poate fi definită prin relaţia: v(l , k ) = u 2 (l , k ) − u1 (l , k )
def .

(3.10)

58

vor determina unde pantele α = 1 . după care se injectează în vasele sanguine o substanţă contrastantă în raze X şi se achiziţionează o nouă radiografie.11) v N − 1 − v2 v −v . 59 . Printre domeniile de aplicaţii se poate menţiona angiografia (grafia vaselor de sânge). ar trebui ca imaginile U1 şi U2 să reprezinte aproximativ acelaşi lucru.3). potenţial afectate de anumite boli.Pentru obţinerea unui rezultat cât mai util. β = 2 1 şi γ = u1 u 2 − u1 N − 1 − u2 variaţiile relative de contrast (figura 3. dar în alte ipostaze (de exemplu un obiect în mişcare). contrast streching) este transformarea liniară pe porţiuni. Această operaţie poate fi utilizată şi pentru detecţia mişcării în secvenţe de imagini. Prin compararea şi diferenţa celor două radiografii se scot în evidenţă zonele de interes. Modificarea liniară a contrastului Cea mai răspândită tehnică de modificare a contrastului (engl. În acest scop se achiziţionează o radiografie a pacientului în stare normală. u 2 ≤ u ≤ N − 1 v 2 +  N − 1 − u2  (3. u1 ≤ u ≤ u 2 u 2 − u1   N − 1 − v2 ⋅ (u − u 2 ). 0 ≤ u ≤ u1  u1  v − v1  v = f (u ) = v1 + 2 ⋅ (u − u1 ). Expresia analitică a acesteia este:  v1  u .

3. u2). iar dacă u2-u1 > v2-v1 se va obţine o imagine cu un contrast mai slab pentru intervalul central al gamei de niveluri de gri.4). u2÷(N-1)). 60 . De exemplu. Din cazul general al modificării de contrast se pot obţine câteva cazuri particulare de interes. se va obţine o imagine cu un contrast mai mare. adică dintr-o imagine cu contrast puternic să se obţină o imagine cu contrast mai slab. contrastul scade în celelalte regiuni (0÷u1. Astfel se vor obţine niveluri de gri cuprinse între v1 şi v2 pentru valori iniţiale cuprinse între u1 şi u2. Dacă u2-u1 < v2-v1. Modificarea contrastului. şi constă în eliminarea extremelor şi extinderea maximă a intervalului de niveluri de gri de interes (figura 3. Unul dintre acestea este determinat de particularizarea v1=0 şi v2=N-1. Trebuie avut în vedere faptul că prin modificarea contrastului dintr-o regiune se modifică contrastul şi în celelalte regiuni. Se poate realiza şi operaţia inversă.v N-1 v2 γ β v1 O α u1 u2 N-1 u Figura 3. prin mărirea contrastului în regiunea centrală (u1.

Extinderea nivelurilor de gri. 61 . u 2 ≤ u ≤ N − 1  (3. dacă intervalul central de niveluri de gri este eliminat (u1 =u2). 0 ≤ u ≤ u1   N −1 (u − u1 ). Binarizarea imaginilor. din cazul prezentat anterior se obţine transformarea de binarizare a imaginilor sau segmentarea cu prag ("tresholding". figura 3.12) Tot din cazul general al modificării de contrast se mai pot obţine şi alte cazuri particulare.5) .5. Expresia analitică corespunzătoare este: 0. cum ar fi transformările de decupare. u1 ≤ u ≤ u 2 v = f (u ) =   u 2 − u1  N − 1. u N-1 O u1= u2=T N-1 u Figura 3. De exemplu.v N-1 O u1 u2 N-1 u Figura 3.4.

variaţia maximă a contrastului se obţine în zona nivelurilor de gri apropiate de N-1.14) v N-1 O N-1 u Figura 3.3. Transformarea de "clipping" păstrează nemodificat un interval de niveluri de gri de interes (de exemplu u1…u2). 3.6) este descrisă de ecuaţia: N −1 v= ⋅ lg(1 + u ).13) lg N Expandarea este descrisă de ecuaţia: v= eu − 1 eN −1 (N − 1) .N-1] (3. Compresia logaritmică (figura 3.2.6. Expandarea şi compresia. restul nivelurilor de gri 62 .v ∈ [0 . Această punere în evidenţă este realizată în principiu prin înlocuirea tuturor celorlalte niveluri de gri cu o valoare constantă. expandarea. Decuparea intervalelor de niveluri de gri Tehnicile de decupare a intervalelor de niveluri de gri urmăresc punerea în evidenţă numai a unei porţiuni din gama totală a nivelurilor de gri disponibile (sau ocupate efectiv de pixelii imaginii).v ∈ [0 . iar prin expandare.N-1] (3.Variantele neliniare de modificare a contrastului sunt compresia (sau compandarea) şi inversa acesteia. Prin compresie se obţine o variaţie maximă a contrastului în zona nivelurilor de gri apropiate de 0. u. u.

7. v N-1 O u1 u2 N-1 u Figura 3.15) Figura 3. Transformarea de decupare ("slicing") pune în evidenţă un interval de niveluri de gri prin modificarea valorilor nivelurilor de gri la 0 sau N-1. Slicing-ul nivelurilor de gri. u ≤ u ≤ N − 1 2  v N-1 v2 v1 F O u1 u2 N-1 u (3. 63 .8.fiind transformate într-o valoare unică.8). numită fundal (F). Expresia analitică a acestui operator este:  F . u1 ≤ u ≤ u 2 F . 0 ≤ u ≤ u1  v = f (u ) = u . Decuparea nivelurilor de gri. după cum acestea se situează în afara sau respectiv în interiorul intervalului considerat (figura 3.

O imagine de tip tablă de şah. 64 . Reciproc. K −1 ∑ ∑ δ ( f (l . de dimensiune L×K pixeli şi notăm cu u un nivel de gri şi cu δ impulsul unitar. deoarece mai multe imagini pot avea aceeaşi histogramă. histograma se exprimă ca: h(u ) = 1 L −1. în proporţie relativ egală. k = 0 (3. Din punct de vedere matematic. dar nu o poate individualiza. k ) − u ).3. inspecţia formei unei histograme poate oferi informaţii despre caracteristicile imaginii. formată din pătrate luminoase şi întunecate. O imagine bine contrastată.16) Proprietăţile imaginii influenţează forma histogramei sale. va avea o histogramă al cărei suport va acoperi aproape întreaga gamă de niveluri de gri posibile şi a cărei formă va fi neregulată. şi valori aproape nule în zona nivelurilor de gri medii.3. u ∈ [0. O imagine fotografică supraexpusă (şi deci foarte luminoasă) are o histogramă al cărei suport este situat în zona valorilor apropiat de N-1. localizate în jurul valorilor de 0 şi N-1. va avea o histogramă prezentând două maxime puternice. Această comportare corespunde faptului că histograma se comportă ca o funcţie de densitate de probabilitate a unei variabile aleatoare ale cărei realizări particulare sunt valorile nivelurilor de gri din imagine. Modificarea histogramei Histograma unei imagini este o funcţie ce pune în evidenţă conţinutul de niveluri de gri al acesteia. histograma se defineşte ca frecvenţa relativă de apariţie în imagine a diferitelor niveluri de gri. Dacă considerăm o imagine f. N − 1] L ⋅ K l = 0. O imagine fotografică subexpusă (şi deci foarte întunecată) are o histogramă al cărei suport (interval ce corespunde valorilor nenule) este concentrat spre valoarea 0. ce prezintă numeroase nuanţe.3.

Din punct de vedere matematic.17) Imaginea ideală ar trebui să prezinte o distribuţie uniformă a nivelurilor de gri şi un contrast repartizat regulat în întreaga gamă dinamică. reprezentată cu 8 niveluri de gri (0…7). această funcţie de repartiţie este histograma cumulativă: H (u ) = ∑ h(n). În cazul histogramei imaginilor. formula de transformare a nivelului de gri u pentru egalizarea de histogramă este:  H (u ) − H (0)  (3. Orice funcţie de densitate de n =0 N −1 probabilitate are asociată o funcţie de repartiţie. problema se reduce la a transforma o funcţie de densitate de probabilitate oarecare într-o funcţie de densitate de probabilitate uniformă (constantă pe intervalul de definiţie [0. operatorul de îmbunătăţire trebuie să transforme histograma originală a imaginii într-o histogramă uniformă. Exemplu: Considerând o imagine de 64×64 pixeli.N-1]). să se realizeze egalizarea de histogramă. u ∈ [0. a cărei histogramă este dată în tabelul următor (căruia îi corespunde figura 3.18) v = int  ⋅ ( N − 1) + 0. în care toate nivelurile de gri sunt egal probabile. Pentru a obţine o asemenea imagine. 65 . iar H este histograma cumulativă definită anterior. h(u)>0.Într-adevăr.9). ∀u. N − 1] n =o u (3.5  1 − H (0)  unde ”int[ ]” este operatorul parte întreagă. şi ∑ h(n) = 1 . Ţinând cont de teoria variabilelor aleatoare (funcţie de o variabilă aleatoare) şi de faptul că variabila aleatoare “nivel de gri” este discretă.

nivelul transformat corespunzător gri nivelul nivelului de conform de gri i de gri i gri egalizării de histogramă transformat 0 796 0.194 0.194 0 796 0-0 1 1023 0.249 0. de h(i) Histograma Nivelul de Numărul de Transformarea nivelului de pixeli gri cumulativă de pixeli cu gri pt.06 0. Imaginea iniţială Imaginea transformată Nivel Nr.159 0.019 1 7 448 7-7 66 .981 7 329 6-7 7 81 0.651 4 1023 2-4 3 650 0. de pixeli de gri având acest nivel de gri 0 796 1 1023 2 850 3 650 4 329 5 245 6 122 7 81 Nr. de pixeli 1200 1000 800 600 400 200 0 1 2 3 4 5 6 7 8 nivelul de gri Figura 3. Histograma unei imagini.Nivelul Nr.81 5 0 3-5 4 329 0.031 0. Rezultatele obţinute în urma egalizării.08 0.443 2 0 1-2 2 850 0.208 0.9. pe baza relaţiilor de definiţie sunt cumulate în următorul tabel: Tabelul 3.1.95 7 650 5-7 6 122 0.89 6 850 4-6 5 245 0.

10.N-1]. Aceste efecte sunt datorate în general cuantizării nivelurilor de gri şi limitării prin trunchiere a domeniului de variaţie a valorilor (formula de transformare este dedusă pentru variabile aleatoare cu variaţie continuă). În cazul aplicării tehnicii de pseudocolorare. adică prin pseudocolorare. [0. Din graficul prezentat se observă că histograma obţinută nu este "uniformă" şi prezintă numeroase niveluri de gri lipsă ("găuri"). Sensibilitatea sistemului vizual uman este însă mult mai mare în gama color decât în cea a nivelurilor de gri. De aceea una dintre tehnicile cele mai populare de realizare a unei vizibilităţi maxime a anumitor componente dintr-o imagine este colorarea lor cu culori puternic contrastante. Pentru corectare au fost propuse mai multe abordări: limitarea maximelor histogramei. Egalizarea de histogramă şi tehnicile înrudite de specificare a histogramei asigură mărirea contrastului imaginii prin redistribuirea nivelurilor de gri în cadrul gamei dinamice fixate.Histograma "egalizată" este deci (figura 3. Histograma egalizată. etc. imaginea va fi afişată (vizualizată) cu o tabelă de culoare diferită de paleta originală de niveluri 67 . Trebuie de asemenea remarcat faptul că egalizarea de histogramă nu asigură în toate cazurile cea mai bună calitate vizuală a imaginii transformate. mutarea aleatoare a valorilor pixelilor situate pe niveluri de gri mai bine reprezentate în histogramă pe niveluri de gri absente.10): nr de pixeli 1200 1000 800 600 400 200 0 1 0 2 1 3 2 4 3 5 4 6 5 7 6 8 7 Figura 3.

10. cu l=1. 3. în general. Această filtrare este obţinută 68 .j). funcţia pondere a sistemului. Se va nota cu u(l.…. i=1. Dacă această funcţie (de mai multe variabile) este liniară.…. j=1. Filtrarea liniară a imaginilor Spre deosebire de operatorii punctuali. Această nouă paletă de culoare poate fi construită după orice fel de reguli care să corespundă problemei de rezolvat: de exemplu.…L.K. prin convoluţia imaginii iniţiale cu funcţia pondere a unui filtru cu răspuns finit.10. numit mască spaţială. Schema generală a unei operaţii de pseudocolorare este detaliată în figura 3. Schema unui sistem de pseudocolorare.k) imaginea iniţială (de intrare). Se pot introduce şi condiţii relative la poziţia spaţială a pixelilor sau la alte caracteristici locale ale acestora. atunci operatorul se numeşte liniar. adică prin aplicarea unui asemenea operator se realizează practic o filtrare bidimensională. k=1. cu v(l.L.…. index R G B Imagine iniţială Bloc de extragere caracteristici Paletă de culori Display Figura 3. toţi pixelii al căror nivel de gri este 250 vor fi afişaţi cu roşu şi toţi pixelii al căror nivel de gri este cuprins între 100 şi 120 vor fi afişaţi cu verde.4.K. operatorii de vecinătate (numiţi şi operatori spaţiali locali) determină valoarea nouă a unui pixel ca o funcţie de valorile pixelilor dintr-o vecinătate a sa.de gri. Operatorii liniari de vecinătate se implementează. Operatori liniari de vecinătate pentru îmbunătăţirea imaginilor.k) imaginea rezultată (de ieşire) şi cu a(i.

Expresia analitică a acestei operaţii este: v(l . De regulă.0) în centrul suportului: 69 . care are dimensiuni mai mici decât imaginile asupra cărora acţionează. k ) = (i . adică se pune originea ferestrei în fiecare punct al imaginii. • Fereastra glisează peste imaginea iniţială.19) unde u şi v sunt imaginile de intrare. respectiv de ieşire. de aceeaşi dimensiune. După cum se observă. coeficienţii din fiecare punct. ca sumă a produselor obţinute la punctul anterior. iniţială (u). aceasta este de fapt o convoluţie: v=a*u. • Se face produsul punct cu punct între valoarea pixelilor din imagine selectaţi de fereastră şi coeficienţii ferestrei. Tehnica ferestrei glisante constă în efectuarea următoarelor operaţii: • Se defineşte fereastra de filtrare adică: forma (relativ la o origine). iar fereastra ce culisează peste imagine se mai numeşte şi mască spaţială sau filtru bidimensional şi are rolul de a selecta vecinătatea pixelului curent asupra căruia operează filtrul respectiv. k − k ) (3. filtrele folosite sunt de ordin impar. Astfel va fi selectat de către fereastră pixelul curent şi pixelii din vecinătatea acestuia. • Se înlocuieşte pixelul curent cu noua valoare obţinută. rectangulare şi au originea (0. Aceasta se poate exprima ca un produs punct cu punct între coeficienţii măştii şi o porţiune din imagine. între funcţia pondere a unui filtru cu răspuns finit (a) şi imaginea de intrare. j )∈W ∑ ∑ a(i. j ) ⋅ u (l − i.prin tehnica "ferestrei glisante" (moving-window). iar a sunt coeficienţii ferestrei (măştii) de filtrare W.

70 . iar filtrul (b) realizează media ponderată între pixelul central şi vecinii săi verticali şi orizontali. Filtrele de dimensiuni mai mari se pot reduce adesea la aplicarea repetată asupra unei imagini a unor nuclee de dimensiuni mai mici. Filtrele bidimensionale folosite uzual în prelucrarea imaginilor sunt nuclee cu suporturi de dimensiuni mici: 3×3. este mai bine să se lucreze cu ferestre cât mai mici. Pentru o fereastră pătrată cu latura n sunt necesare: n2 înmulţiri şi n2-1 adunări.a-1-1 a0-1 a1-1 a-10 a00 a10 a-11 a01 a11 Problemele care se ridică la aplicarea acestor operatori se referă la: • Marginile imaginii. În concluzie. Nucleele pătrate de dimensiuni 3×3 sunt cele mai utilizate. 5×5.20) Filtrul (a) realizează media între pixelul central şi vecinii săi. aici având 2 posibilităţi: obţinerea unei imagini de dimensiuni mai mici. din punct de vedere al volumului de calcule. Exemple de astfel de nuclee sunt: 1 1 1 1  ⋅ 1 1 1  9 1 1 1   (a) 0 1 0  1  ⋅ 1 4 1   8 0 1 0    (b) (3. atunci când glisarea începe din interiorul imaginii bordarea imaginii de intrare pentru a păstra aceleaşi dimensiuni pentru imaginea prelucrată • Numărul de operaţii necesare pentru fiecare punct.

23) Medierea efectuată cu ajutorul operatorilor liniari de vecinătate poate fi utilă la reducerea zgomotului aditiv gaussian şi mai puţin a zgomotului impulsiv. ceţos). Aceste efecte au ca rezultat nedorit reducerea clarităţii imaginii filtrate. pentru a nu modifica regiunile uniforme. Singura constrângere în ceea ce priveşte coeficienţii ferestrei. Aplicarea unui filtru de mediere asupra unei imagini afectată de zgomot impulsiv sau gaussian are ca rezultat extinderea punctelor cu zgomot (formarea de pete). În cazul în care coeficienţii ferestrei îndeplinesc relaţia: ∑ ∑ a(i. ca efect special dorit sau ca o consecinţă nedorită a reducerii zgomotului. de tip salt and pepper (engl. ceea ce poate produce dificultăţi suplimentare în 71 .21) (i . Exemple de filtre de reliefare sunt:  0 −1 0  − 1 [4] − 1    0 −1 0    − 1 − 1 − 1 − 1 [8] − 1   − 1 − 1 − 1    1 −2 1  − 2 [4] − 2    1 −2 1    (3.21) efectul filtrului (ferestrei de filtrare) este un efect de netezire. j ) = 0 (i .= "sare şi piper").22) efectul filtrului (ferestrei de filtrare) este un efect de reliefare (accentuare sau contrastare). j ) = 1 . respectiv apariţia efectului de bluring sau mânjeală (neclar.Forma şi coeficienţii ferestrei se aleg astfel încât să corespundă aplicaţiei concrete. j )∈w (3. j )∈w În cazul în care coeficienţii ferestrei îndeplinesc condiţia din relaţia (3. pentru filtrele de mediere (al căror efect este de FTJ) este: ∑ ∑ a(i. (3. respectiv de filtru trece-sus.

Filtrul este cunoscut în acest caz. Valorile acestor coeficienţi c respectă în general o anumită distribuţie spaţială. O primă modalitate de reducere a efectului de bluring este ponderarea pixelilor mediaţi în funcţie de distanţa faţă de centrul ferestrei: v(l.j) sunt coeficienţii cu care se face ponderarea pixelilor din fereastra W.k − j) (i.j) W ∈ (3. recunoaştere de forme etc.24) unde c(i. detecţie de contur.). cel mai adesea fiind utilizată distribuţia gaussiană. k ) < T (3.etapele ulterioare de prelucrare a imaginii (segmentare. dar apare problema selecţiei automate a pragului T. Particularitatea sa constă în faptul că înlocuirea valorii pixelului curent cu media ponderată a vecinilor săi se face doar dacă este satisfăcută condiţia: v(l . Rezultatele acestei metode sunt bune. k ) − u (l . O variantă îmbunătăţită pentru reducerea efectului de bluring o constituie filtrul de netezire cu prag.j)⋅ u(l − i.25) unde T este un prag de decizie ales astfel încât să fie protejate tranziţiile din imaginea iniţială faţă de efectul de bluring. care nu mai este liniar.k)= ∑ ∑ c(i. 72 . sub denumirea de filtru gaussian.

3. Dacă se notează cu U. Transformata Fourier a unei constante.27) iar caracterizarea în frecvenţă a acţiunii filtrului se poate face pe baza lui H.11.11): y x Figura 3.b): 73 .5.a) este un sinc bidimensional (figura 3. Efectul în frecvenţă al operatorilor liniari de vecinătate După cum s-a arătat mai sus. aplicarea unui filtru de mediere se face prin convoluţia între imaginea iniţială u şi funcţia pondere a filtrului h: v = h*u (3. V şi H transformatele Fourier ale imaginilor de intrare.26) Coeficienţii ferestrei sunt egali şi se ştie că transformata Fourier a unei constante este un sinc (figura 3. respectiv de ieşire şi a filtrului.12.12. din relaţia anterioară şi din teorema convoluţiei rezultă că: V=H⋅U (3. Transformata Fourier a unui filtru de mediere cu coeficienţi constanţi (figura 3.

13.n) este funcţia de transfer a unui FTJ atunci un filtru trece-sus FTS va avea o funcţie de transfer hTS(m.n): hTS (l . Deci. Medierea spaţială. Prin urmare.13): u Mediere spaţială v ≡ u FTJ v Figura 3. k ) = δ (l . Astfel.12. k ) − hTJ (l . k ) (3. Celelalte tipuri de filtre (în frecvenţă) se pot obţine cu un FTJ.28) unde δ este impulsul Dirac. medierea spaţială este echivalentă cu o filtrare trece-jos (figura 3. dacă hTJ(m. Transformata Fourier a unui filtru de mediere cu coeficienţi constanţi.14): 74 .z z F y x y x (a) (b) Figura 3. un FTS se poate implementa prin scăderea din imaginea iniţială a imaginii obţinute printr-un FTJ (figura 3.

k) Figura 3. pentru îmbunătăţirea imaginilor se pot defini şi operatori integrali (numiţi si transformări integrale) în cazul cărora noua valoare într-un punct depinde de valoarea întregii imagini 75 . Obţinerea unui FTB cu ajutorul a două FTJ. Deci un FTB se poate obţine din 2 FTJ astfel (figura 3. La fel.15): u FTB v ≡ u FTJ hTJ1(l.15. k ) = hTJ 1 (l .29) unde hTJ1 şi hTJ2 sunt funcţii de transfer a două FTJ. Filtrarea trece-jos se utilizează pentru atenuarea zgomotului. filtrarea trece-bandă se foloseşte pentru extragerea sau accentuarea contururilor. un filtru trece-bandă FTB poate fi caracterizat prin relaţia: hTB (l . k ) (3. Pe baza acestor considerente. iar filtrarea trece-sus este utilă pentru îmbunătăţirea contururilor sau a altor caracteristici de tip trece-sus ale unei imagini.14.k) v + - FTJ hTJ2(l. în prezenţa zgomotului. Obţinerea unui FTS cu ajutorul unui FTJ. k ) − hTJ 2 (l .u FTS v ≡ u FTJ + - v Figura 3.

În acelaşi timp. în fiecare punct al imaginii. Exemple de transformări (Fourier.iniţiale. Din această comportare de tip filtru trece-jos rezultă efecte secundare care se manifestă prin reducerea sau eliminarea din imagine a componentelor de frecvenţă înaltă (detalii.6. Filtrarea neliniară a imaginilor Filtrele liniare (de netezire sau contrastare) produc la ieşire. Folosirea transformărilor integrale mută problema într-un plan dual planului imaginii şi anume planul frecvenţelor spaţiale. o combinaţie liniară ponderată a setului de valori selectate de fereastra de filtrare plasată cu originea în acel punct. Imaginea îşi pierde claritatea şi devine mai “ceţoasă” (efect de blur). filtrarea liniară a unor zgomote ne-aditive (de exemplu zgomotul impulsiv) produce rezultate deranjante din punct de vedere al calităţii imaginii (în particular lăţirea şi împrăştierea impulsurilor de zgomot). deci zgomote aditive şi cu distribuţie normală (gaussiană). Cosinus) vor fi prezentate în capitolul referitor la transformări integrale ale imaginilor. contururi). 3. Exemplu de repartiţie spaţială a spectrului unei imagini. Repartiţia spaţială a spectrului diferă de la o transformare la alta: FTJ FTB FTS FTB FTB FTB FTJ Figura 3. Filtrele liniare pot elimina zgomote care corespund acestui model de mediere.16. 76 .

în funcţie de rangul sau importanţa lor. operaţia devine neliniară. cele N valori extrase de o fereastră de filtrare pentru o poziţie dată.…. statistica de ordin k) a secvenţei X.31) 77 .…. iar statistica de ordinul N este maximul: x(1) = min X() = min X (echivalentul unei erodări morfologice) (3. statistica de ordinul 1 este minimul.x2. tocmai printr-o triere a valorilor extrase de fereastra de filtrare. x4=10. în care valoarea unui pixel nu este luată în considerare.3. Scalarul x(k) se numeşte statistica de ordine de ordinul k (sau pe scurt. Ieşirea de ordinul k a filtrului de ordine este statistica de ordin k a setului de valori selectate de fereastra de filtrare. xN}.1. setul de valori ordonate este: X()={x(1). Setul ordonat este: X()={1. 10. x(3)=10. întrucât se va baza pe compararea şi ordonarea valorilor. x5=200. k putând lua orice valoare între 1 şi N: rankk(X)=x(k) (3. rezultă: x1=1. Acesta este modelul de filtrare de ordonare (rank-order filter).200}. iar statisticile de ordine sunt: x(1)=1. x(5)=200.x(2). cu x(1) ≤x(2)≤…≤x(N). x3=100.30) x(N)= max X()= max X (echivalentul unei dilatări morfologice) Considerând ca exemplu setul de 5 valori: X={1. fără a fi însă singurul tip de filtrare neliniară.10. x(2)=10.6. Filtre neliniare de ordine Pentru eliminarea dezavantajelor filtrelor liniare apare evidentă necesitatea de a modifica structura de filtrare liniară. 100.100. Evident. x(4)=100. Evident. 10.10. 200}. x2=10. Dacă se notează cu: X={x1.x(N)}.

rezultatul filtrului de mediere pentru aceleaşi date este 150 (deci o valoare ce nu corespunde nici unuia dintre valorile pixelilor imaginii). setul de 9 valori extrase de fereastra de filtrare (N=9).199.201. ieşirea filtrului  9 + 1 median va fi statistica de ordinul k =   =[5]=5. Atunci pixelii de valori 70. Este însă posibil ca anumite detalii fine (sau obiecte extrem de mici.17).75.255.200. Exemplu de filtrare mediană.200. caracterizat de:  N + 1 k=  .199.75. în acest caz: x(5)=198. Se presupune că valorile anterioare sunt nivelurile de gri dintr-o imagine.80}.75.75. deci cu 198.200.199. X={70. Dacă acest punct ar fi centrul ferestrei de filtrare.198.198. de 78 . iar pixelul de valoare 255 este alb-strălucitor (figura 3. Rezultatul este deci eliminarea punctului a cărui valoare este extremă faţă de celelalte (sau eliminarea impulsului de zgomot). Ieşirea filtrului median este. pixelii de valori 198. Considerând. La nivelul întregii imagini.80. (unde [x]= partea întreagă a lui x) adică ieşirea filtrului  2  median este statistica de ordine situată în centrul secvenţei ordonate.75.17.Cel mai utilizat filtru de ordine este filtrul median.201 au o culoare de tip alb-murdar.201.79.  2  Setul de valori ordonate este: X()={70. aplicarea filtrului median nu modifică în mod esenţial structura de contururi (frontiere) caracteristică obiectelor. Spre comparaţie.80 sunt gri-închis. de exemplu. Figura 3. după filtrare el trebuie înlocuit cu ieşirea filtrului.255}.

semnalele rădăcină sunt compuse din paliere constante şi rampe monotone. Pentru un filtru median. ale căror ieşiri sunt preluate de un filtru de minim sau maxim. realizate eventual în ferestre de filtrare de formă şi orientare diferită. med(x3. Filtre de ordine multi-etaj Filtrele de ordine multietaj iterează mai multe etape de filtrare de ordine.32) 79 .x5. Capacitatea unui filtru de a nu modifica anumite structuri de semnal.x5. 3.med(x2.2. Acesta se compune dintr-un prim etaj de 4 filtre mediane cu ferestre direcţionale.x9).x8). Dacă se consideră o fereastră 3×3 în care valorile pixelilor sunt notate: x1 x4 x7 x2 x5 x8 x3 x6 x9 ieşirea filtrului multietaj va fi: max(med(x4.x7)) (3. Un asemenea filtru este filtrul MIN/MAX-Median. constituie o caracteristică deterministă a acestuia şi este exprimată de semnalele rădăcină (semnalele care nu sunt modificate la trecerea prin filtru). Un semnal rădăcină se poate obţine prin filtrarea repetată (până la obţinerea invarianţei) a unui semnal oarecare.x6).dimensiune inferioară ferestrei de filtrare) să fie eliminate. de lungime mai mare decât dimensiunea ferestrei de filtrare.6.x5.x5. med(x1.

80 . prelucrarea putându-se face independent pe fiecare nivel al stivei. Dezavantajul acestor filtre îl constituie cantitatea mai mare de memorie necesară în procesul de sortare.18.MAX (sau MIN) Figura 3. deoarece se obţine un contrast mai bun. Efectul acestui filtru este mai bun decât a unui filtru median. obţinându-se o viteză mare de calcul şi o paralelizare a calculelor. suma rezultatelor fiind egală cu rezultatul filtrului compus obţinut prin însumarea filtrelor din stivă. pot fi dispuse sub forma unei stive. Se poate arăta că filtrele de ordine pentru prelucrarea imaginilor cu niveluri de gri. Acest fapt are avantajul posibilităţii de implementare paralelă a filtrelor de ordine şi posibilitatea de implementare hardware a acestora. cu excepţia liniilor de zgomot. datorită filtrului extrem (max sau min). care trec prin filtrele mediane. La implementarea filtrelor de ordine. Filtru multi-etaj. printre cele mai utilizate tehnici de sortare se numără metoda bubble-sort şi divide et impera.

cu originea în centru. Invarianţa la translaţie Filtrarea de ordine a unui semnal x translatat cu b şi scalat cu a este: rank k (a ⋅ x + b) → a ⋅ rank k ( x) + b (3. Teoremă: Orice secvenţă monotonă (crescătoare sau descrescătoare) este un semnal rădăcină al filtrelor de ordine.19.6. Exemplu: Prin aplicarea unui filtru median unidimensional de lungime N=3 (figura 3.19. Proprietăţi ale filtrelor de ordine 1.19. Prin urmare. Exemplu de obţinere a unui semnal rădăcină. Filtrele de ordine păstrează caracteristicile semnalului. asupra semnalului (figura 3. În practică.3. valoarea obţinută prin filtrare nu este în afara domeniului de intrare. 3. după prima iteraţie se obţine semnalul: 81 .3.33) 2. Filtrele de ordine admit semnale rădăcină.a): 3 2 1 (a) N=3 (b) Figura 3. adică nu prezintă overshoot sau undershoot. fiind una din valorile de intrare. până se obţine un semnal care nu se mai modifică. un semnal rădăcină se obţine prin filtrarea de ordine a unui semnal oarecare. Un semnal rădăcină este invariant la filtrarea de ordine (rămâne nemodificat).b).

O limitare a structurilor de filtrare neliniară bazată pe ordonare este relativa lor lipsă de flexibilitate: există doar N filtre de ordine diferite.20. Rezultatul după a doua iteraţie a filtrării de ordine. Astfel de filtre sunt filtrele de domeniu LUM (Lower-Upper-Middle). 82 . după a treia iteraţie se obţine un semnal monoton pe porţiuni. După cum se observă. O structură de filtrare mai flexibilă trebuie să permită reglarea gradului de netezire (sau respectiv de reliefare) între limite fixate. nu se modifică. deci este un semnal rădăcină pentru un filtru median unidimensional de lungime 3. care dacă mai este filtrat o dată.20. dintre care doar filtrul median este un filtru de netezire. Rezultatul după prima iteraţie a filtrării de ordine.Figura 3. iar după a doua iteraţie se obţine semnalul: Figura 3.

x(N-k+1)) şi înlocuirea sa cu un eşantion mai apropiat de mediană. Filtru LUM de netezire. x* > x( N −k +1)   x*.21. x( N −k +1) . de ordin k. Cazurile extreme ale acestui tip de filtru sunt: N +1 • pentru: k = = filtru median 2 • pentru: k = 1 = filtru de tip trece-tot 83 . Filtre de ordine de domeniu Filtrul de ordine LUM (Lower-Upper-Middle) de netezire. (3.21). iar x* reprezintă valoarea eşantionului central 2 (din originea ferestrei): unde 1 ≤ k ≤  x( k ) .3. x* < x( k )  y =  x( N −k +1) .4.6. x(1) x(k) x(N-k+1) x(N) Figura 3.34) { } N +1 . x*. în rest (3. dacă x* nu se încadrează în acest interval de valori „normale” (figura 3.35) Netezirea este creată prin compararea eşantionului central x* cu două statistici de ordin superior şi inferior (x(k). Gradul de netezire este variabil în funcţie de k. se defineşte prin: y = med x( k ) .

21.36) N +1 . 84 . pentru r=1. în rest   unde: 1 ≤ r ≤ (3. < x* ≤ x( N −r +1) . 2 Reliefarea apare ca urmare a deplasării eşantioanelor din intervalul x(r) ÷ x(N-r+1) (interpretat ca zonă de tranziţie) spre una din extremităţi (figura 3.Prin aplicarea unui filtru LUM de netezire se reduce contrastul imaginii. Filtrul LUM de reliefare se defineşte prin: x( r ) + x( N −r +1)   x( r ) . Gradul de reliefare poate varia în funcţie de parametrul r. Filtru LUM de reliefare. Perechea filtrului LUM de netezire este filtrul LUM de reliefare (sau conturare). x( r ) < x* ≤ 2  x( r ) + x( N −r +1)  y =  x( N −r +1) . 2 Prin aplicarea unui filtru LUM de reliefare se obţine o mărire a contrastului. 2   x*. de la: N +1 r= (filtrul identitate) până la reliefare maximă. pentru care ieşirea filtrului este deplasată către una din statisticile extreme (inferioară sau superioară).22): x(1) x(r) x( r ) + x( N −r +1) x(N-r+1) 2 x(N) Figura 3.

 ak = 0.39) (3. pentru reliefare..41) (3. • filtrul de mediere.3. iar ak sunt coeficienţii de ponderare. se obţine pentru: 1 a k = . • extractor de contur: a1 = −1  a N = 1 (3.38) Câteva cazuri particulare ale acestui tip de filtru sunt: • filtrul de ordine de ordin k (inclusiv filtrul median): a k = 1 .6. k =1 N (3. pentru orice k = 1.. N. L-filtre Un filtru a cărui ieşire este o medie ponderată a statisticilor din fereastra filtrului se mai numeşte şi L–filtru şi este de forma: y = ∑ a k ⋅ x( k ) . pentru netezire şi ∑ a k = 0 .37) unde y este ieşirea filtrului. . k =1 N N (3.5. x(k) sunt eşantioanele din fereastra de filtrare ordonate crescător. Coeficienţii de ponderare îndeplinesc aceleaşi condiţii de normalizare ca şi pentru un filtru liniar: k =1 ∑ a k = 1 .. j ≠ k  Elimină zgomotul impulsiv. 2.40) 85 . N Elimină zgomotul gaussian.

 2 a k = 0 Elimină zgomote impulsive şi zgomotele uniforme. N − α ⋅ N ] a i = N ⋅ (1 − 2α ) .  a = 0. • media α-reglabilă (α-trimmed mean): 1  .• filtrul de qvasi-mijloc:  a i = a N +1 − i N +1 . i = 1÷ . în rest  k  1 unde α ∈ 0.  .43) (3.  2 Elimină zgomote de tip impulsiv şi gaussian.42) 86 . i = [α ⋅ N . (3.

y) este un clopot Gauss.y). are ca rezultat o altă imagine g(x. de regulă dreptunghiulare şi chiar mai mult.4. spre deosebire de primul exemplu cu transformata Fourier. care este o altă reprezentare a imaginii originale f(x. F(u. se folosesc adesea şi transformări integrale. f şi g sunt funcţii definite pe acelaşi plan (x. în „spectrul Fourier” al imaginii.y) obţinută prin convoluţie (bidimensională) din imaginea originală f(x. în planul frecvenţelor spaţiale u şi v.y) cu un filtru a cărui funcţie pondere h(x. transformările integrale sunt transformări ale unor matrici (tabele 2-dimensionale de scalari.1) iar sensul fizic al variabilelor lui g este acelaşi cu cel al variabilelor lui f. pătrate) în matrici de aceleaşi dimensiuni. transformă o imagine reprezentată prin funcţia f(x.1. O filtrare (spaţială) liniară a imaginii f(x. Transformări integrale ale imaginilor În domeniul prelucrărilor de imagini.y) de cele două variabile spaţiale x şi y. de exemplu. y ) = ∫∫ f (ξ . al căror rezultat – o altă imagine sau o altă reprezentare a imaginii originale – are în fiecare punct o valoare ce depinde de valorile tuturor pixelilor din imagine originală. cum e cazul imaginilor digitale. y − η )dξdη R 2 (4. iar transformările spaţiale (de vecinătate) pot fi liniare sau neliniare. Transformările integrale sunt transformări liniare pentru a avea 87 .y). 4.v).η ) ⋅ h( x − ξ . Transformări integrale unitare În cazul imaginilor discretizate (definite pe latici de puncte). Transformata Fourier.y): g ( x. pe lângă operaţiile punctuale şi de vecinătate prezentate anterior. S-a văzut că transformările punctuale sunt practic transformări neliniare.

88 . matricile ortogonale generalizează rotaţiile din plan. O matrice unitară în spaţii vectoriale peste mulţimea numerelor reale R (deoarece conjugatul unui număr real este el însuşi) se reduce la ceea ce se numeşte matrice ortogonală. de aparatul algebrei liniare şi al analizei funcţionale liniare. adică: A ⋅ A*T = A*T ⋅ A = I N (4. atunci matricea A trebuie să fie inversabilă. Se va face referire la spaţii vectoriale peste mulţimea numerelor complexe C şi transformări liniare corespunzătoare (reprezentate prin matrici pătrate cu elemente complexe) fiindcă. În cele de mai jos se vor revedea noţiunile de bază privind transformările liniare pe spaţii vectoriale finit dimensionale. adică există A-1 astfel încât A·A-1= A-1·A=IN. adică det A ≠ 0 . A*T=AH se mai numeşte şi transformata Hilbert a matricii A.k =0.posibilitatea de a beneficia în modelarea matematică care trebuie făcută.3) adică inversa ei este chiar transpusa conjugatei sale complexe. Orice transformare liniară a lui CN în el însuşi se reprezintă printr-o matrice pătrată A de dimensiune N×N: (alk ) l . şi că A-1=A*T. Se va considera spaţiul CN al vectorilor N-dimensionali cu componente din C (deci numere complexe) care reprezintă secvenţe de N eşantioane ale unui semnal complex (cu o parte reală şi una imaginară). chiar începând cu transformata Fourier discretă. N −1 = A ∈ M N × N (C ) (4. cadrul complex simplifică lucrurile. adică A-1=AT. iar indicele superior * indică operaţia de conjugare complexă (alk→akl*).2) iar dacă se doreşte ca transformarea să fie inversabilă. Din acest motiv se va face referire la „matrici unitare” şi nu „ortogonale”. În această relaţie indicele superior T indică operaţia de transpunere a matricelor (alk→akl). O matrice A este unitară dacă are proprietatea că este inversabilă.

. În schimb. a 0. tot 2-dimensională). dat de relaţia v=A·u.  . k ). iar ieşirea fiind V. scrierea scalară (pe componente) a transformării integrale unitare bidimensionale directe. în scriere scalară: v j = ∑ a jk ⋅ u k (4. . 0     .  .6) 89 .. . N −1 N −1 N −1 N −1 unde {a mn (l .   . n ) = ∑ ∑ u (l . N − 1}.1. k = 0.   u  N −1  transformarea A. . .. N −1 =  .   a N −1. n ) ⋅ a mn (l .4) sau pe componente.       . m = 0 n =0 (4. u = (u i )i =0.     . prin generalizarea celei precedente: v ( m. l . adică:  v 0   a 0.. a imaginii U. dacă se notează imaginea iniţială cu U = {u (l . N −1   u N −1    (4. = .0 N −1 k =0 . k ) ⋅ a mn (l . expresiile matriceale ale transformării sunt mai dificil de scris. u0     .     v N −1   a N −1. n = 0...   . deoarece transformarea A trebuie reprezentată printr-un tablou 4-dimensional (2×2.1.  ⋅ .  Un vector u ∈ C N .5) În cazul imaginilor. respectiv l =0 k = 0 ∗ u (l . . vectorul v. k )} este transformarea unitară. k ) = ∑ ∑ v ( m. k ) .. semnalul de intrare fiind imaginea U 2-dimensională. respectiv inverse. k ) . devine prin    . N −1   u 0       .. n). se scrie imediat. m. N − 1} şi imaginea transformată cu: V = {v(m.

sunt de asemenea matrici (4.n) este foarte mare. În acest caz. n) = ∑ ∑ a m (l ) ⋅ bn ( k ) ⋅ u (l . O reducere substanţială a complexităţii algoritmului se obţine atunci când transformarea unitară este separabilă. În acest caz: ⇒ v ( m. adică de ordinul a N4. complexitatea sa scăzând la O(N3).8) După cum se observă. numărul operaţiilor (multiplicări şi adunări) necesare pentru a calcula coeficienţii v(m. algoritmul este mai simplu.9) Dacă se defineşte energia unui semnal bidimensional u. adică: a mn (l . respectiv (4. relaţia transformării directe. • Filtrarea: Se presupune că se doreşte o filtrare integrală liniară a unei imagini. Transformările integrale unitare se pot folosi pentru filtrarea şi pentru compresia imaginilor. k ) = ∑ a m (l ) ∑ bn ( k ) ⋅ u (l . respectiv inverse.În cazul imaginilor de dimensiuni N×N. k ) = a m (l ) ⋅ bn ( k ) (4. k ) l =0 k =0 l =0 k =0 N −1 N −1 N −1 N −1 B = {bn (k )} .10) se poate arăta că principala proprietate a transformărilor integrale unitare este aceea de conservare a energiei: Eu=Ev. fiind egal cu O(N4). ca fiind: E u = ∑ ∑ u (l .7) unde: A = {a m (l )} şi unitare. adică cu un filtru a cărui funcţie pondere liniară se extinde pe 90 . se poate scrie şi sub formă matricială: V = A ⋅ U ⋅ BT U = A∗T ⋅ V ⋅ B ∗ . în cazul în care transformarea este separabilă. k ) l =0 k =0 N −1 N −1 2 (4.

. Acesteia i se aplică o transformare T în urma căreia se obţine o imagine V la care informaţia este concentrată în mult mai puţine componente decât în imaginea iniţială. . etapele transmisiei sunt schiţate în figura 4. în principiu. • Compresia: Spre deosebire de reprezentarea unei imagini prin eşantioanele sale spaţiale (în număr de N2) care. canal fără pierderi T-1 ˆ V .toată imaginea... iar majoritatea sunt neglijabil de mici. .. transformarea are algoritm rapid şi este separabilă. Pentru N=1000. U. dar dacă unii coeficienţi sunt foarte mici. .. În procesul de compresie cu transformate se porneşte de la o imagine iniţială U. În acest caz. Transmisiei lor li se poate aplica o codare Huffman (pentru a obţine o codare fără pierderi).1. raportul N4/N2·log2N devine 105 adică filtrarea care ar dura 24 ore în mod normal. Figura 4. . Operaţia de convoluţie spaţială a unei imagini N×N (cu funcţia pondere tot de suport N×N) necesită N4 operaţii de înmulţire.. T .. iar echivalentul convoluţiei este o operaţie punctuală (pentru fiecare pixel avem de făcut o înmulţire). aşa cum este cazul transformării Fourier discrete. … ˆ U. . Dacă. Compresia cu transformate. V trunchiere ˆ …V 0 .M-1]. pur şi simplu. . . ei se pot neglija. numărul de operaţii necesare este de ordinul a N2·log2N.. prin acest procedeu se realizează într-o secundă. adică pentru imagini de 1000×1000 pixeli. . reprezentarea imaginii prin valorile coeficienţilor transformatei (tot în număr de N2) este o reprezentare prin mărimi cu proprietăţi extrem de neuniforme: câţiva coeficienţi sunt foarte mari. M-1 fiind valoarea maximă.. 91 .1.. într-o primă aproximaţie sunt variabile aleatoare independente şi uniform distribuite pe intervalul valorilor posibile [0.

Aceasta realizează decorelarea elementelor transformatei şi prin aceasta compactarea maximă a energiei semnalului (imaginii) în primele componente. deoarece transformata K-L depinde de statistica imaginii şi datorită volumului mare de calcule necesare (mai ales în cazul imaginilor de dimensiuni mari). Un astfel de lanţ de compresie este cu atât mai bun cu cât: ˆ • eroarea (diferenţa) dintre U şi U este mai mică.11) • factorul de compresie este mai mare. transformata K-L se poate aproxima cu succes prin transformata Cosinus Discretă (DCT=Discrete Cosine Transform) mult mai rapidă şi mai uşor de implementat şi care va fi prezentată în continuare. k ) − U (l . care de cele mai multe ori este eroarea medie pătratică: ˆ ⇒ ∑ ∑ U (l . Totuşi. reţinute în imaginea v: L× K C= (4. relativ la un anumit criteriu.Canalul de transmisie poate fi presupus fără pierderi deoarece se pot folosi coduri cu corecţie de erori. Factorul de compresie (C) se defineşte ca fiind raportul dintre numărul componentelor imaginii iniţiale (L×K) şi numărul componentelor din u. k ) 2 =minimă l =0 k =0 L −1 K −1 (4. Cu toate aceste avantaje. Dacă acestei imagini i se aplică transformarea inversă lui T (T-1) se va ˆ obţine o imagine U care este de dorit a fi cât mai apropiată de imaginea iniţială U. 92 . componentelor retinute din u Transformarea optimă din punct de vedere al compresiei este transformarea K-L (Karhunen-Loeve). transformata K–L este dificil de implementat practic. La recepţie se obţine o imagine V care aproximează imaginea V.12) nr. Câştigul (reducerea numărului de eşantioane transmise) s-a obţinut prin trunchierea imaginii V prin eliminarea componentelor cu coeficienţi foarte mici (sub un anumit ˆ prag). pentru imagini cu corelaţie mare.

4. cu elemente complexe: A = (alk ) unde alk ∈ C . Notând A = (alk ) l .14) 93 . k ≠ k '  k =0 (4.2. pt. l = 0.13) Sistemul de mai sus este echivalent cu relaţia: A −1 = A*T . l = l ' *  ∑ alk ⋅ alk ' = δ (l − l ' ) =   l =0 0. k −1  A ⋅ A*T = I N  .k =0. N −1 . (4. pt. condiţiile (4. pt. k = k '   ∑ lk l 'k 0. Spunem că matricea A ∈ M N × N (C ) este unitară dacă: .  *T A ⋅ A = I N  unde A*T = A H este transformata Hilbert a matricii A. Matrici unitare Implementarea transformărilor integrale unitare a imaginilor se face utilizând matrici unitare. l ≠ l ' ⇒  N −1 a ⋅ a * = δ (k − k ' ) = 1.9) se pot scrie:  N −1 1. pt. Fie o matrice pătrată. not .l −1 k = 0 .

Proprietăţile matricilor unitare 1. Demonstraţie: A ⋅ x .    N  . A ⋅ y = x. adică x =      . ( A ⋅ x )*T ⋅ ( A ⋅ y ) = x T ⋅ AT ( )* ⋅ A ⋅ y = x T * ⋅ 1T24A ⋅ y = x T * ⋅ y = A * ⋅3 4 I x . ∀x. x y  N  N Se defineşte produsul scalar a doi vectori: def .   . (4. A ⋅ y = ( A ⋅ x )*T ⋅ ( A ⋅ y ) . Consecinţă: Transformarea dată de o matrice unitară lasă neschimbată energia. y = ∑ xi* ⋅ y i = x *T ⋅ y = ∑ xiT ⋅ y i* = x T ⋅ y * În aceste condiţii: A ⋅ x.d. N N i =1 i =1         (4. A ⋅ x ⇒ 123 = ( A ⋅ x )*T ⋅ ( A ⋅ x ) x *T ⋅ x 1442443 x 2 A⋅ x 2 94 .) O transformare liniară dată de o matrice (A) unitară (de la CN la CN) lasă produsul scalar invariant.17) adică produsul scalar este invariant. x. x = A ⋅ x.   . y q. .  x1   y1  . y =  . Acest lucru rezultă din proprietatea anterioară. Se ştie că: (U ⋅ V )T = V T ⋅ U T .16) (4. pentru cazul particular în care x=y.15) x . y ∈ C .e. y .

Dacă x este un vector propriu al matricei A.) Toate valorile proprii ale unei matrice unitare au valorile egale cu 1.e.⇒ ∑ xi i =1 N 2 = ∑ a i ⋅ xi i =1 N 2 ⇒ E x = E A⋅ x 2. Demonstraţie: S-a arătat că: ( A ⋅ x )*T ⋅ ( A ⋅ x ) = x *T ⋅ x .d. Fie x1. x 2 = 0 ⇔ x1 T ⋅ x 2 = 0 (4. N x 2 = x *T ⋅ x = ∑ xi i =1 2 = E x = energia lui x (4. rezultă că lasă produsul scalar invariant: * ⇒ ( A ⋅ x1 )*T ⋅ ( A ⋅ x 2 ) = x1T ⋅ x 2 (conform proprietăţii 1) * ⇒ (λ1 ⋅ x1 )*T ⋅ (λ2 ⋅ x 2 ) = x1 T ⋅ x 2 95 . λ2. În aceste relaţii. Spunem că doi vectori sunt ortogonali dacă: * x1 ⊥ x 2 ⇔ x1 . Deoarece: x ≠ 0 (vectorul propriu este nenul) ⇒ λ = 1 q.) Vectorii proprii corespunzători unor valori proprii diferite sunt ortogonali.20) Demonstraţie: Dacă x1. atunci λ este valoarea (4. λ2: ⇒ A ⋅ x1 = λ ⋅ x1 . Înlocuind: A ⋅ x = λ ⋅ x ⇒ (λ ⋅ x )*T ⋅ (λ ⋅ x ) = x *T ⋅ x ⇒ λ* ⋅ λ ⋅ x *T ⋅ x = x *T ⋅ x ⇒λ ⋅ x 2 2 2 = x . A ⋅ x 2 = λ ⋅ x 2 Deoarece matricea A este unitară. x2 doi vectori proprii cu valori proprii asociate λ1. x2 sunt vectori proprii cu valorile proprii asociate λ1. norma vectorului x indusă de produsul scalar este: def .18) proprie a lui x dacă satisface relaţia: A ⋅ x = λ ⋅ x .19) 3.

(4. care diagonalizează matricea A. * ⇒ x1 T ⋅ x 2 ≠ 0 q. atunci există cel puţin o matrice B care diagonalizează matricea A.e. Această teoremă poate fi descrisă astfel: ∀A ∈ M N × Ν (C ) o matrice unitară de dimensiune N×N. 4. unde x i M M M   M este o matrice 96 . adică ∃Λ ∈ M N × Ν (C ) o matrice diagonală de dimensiune N×N. Dar: B −1 = B H = B T * . Demonstraţie: Dacă x1. …. Se poate demonstra prin reducere la absurd. xN sunt vectori proprii normaţi ai matricei A. rezultatul fiind matricea Λ. adică A ⋅ AH = AH ⋅ A = I N ⇒ ∃B ∈ M N × Ν (C ) o matrice unitară de dimensiune N×N. Se va construi matricea B astfel:  M  B N × N =  x1  M  coloană.d. adică B ⋅ B H = B H ⋅ B = I N . x N  . deoarece s-a demonstrat că vectorii proprii ai unei matrice unitare sunt ortogonali. care satisface relaţia: B −1 ⋅ A ⋅ B = Λ .. * Rămâne de arătat că: λ1 ⋅ λ2 ≠ 1 ..* * * ⇒ λ1 ⋅ λ2 ⋅ x1 T ⋅ x 2 = x1 T ⋅ x 2 * Dar: λ1 ⋅ λ2 ≠ 1 .) Teorema spectrală: Dacă A este o matrice unitară.21) adică matricea B diagonalizează matricea A. M x2 M M  M  . deoarece λ1 ≠ λ 2 .

x N  = M M   M        L   M M L   ⋅  λ1 ⋅ x1 λ2 ⋅ x 2 M  M  M L   λ1 0 K 0     0 λ2 K 0 . unde M L  * L x1T L este o matrice linie....22) 97 ... este verificată relaţia: BH ⋅ A⋅ B = Λ (4.* L x1T  * L x 2T ⇒ BT* =  M M L x *T N  L  L  . 1  0 T* ⇒ B ⋅B = M  0  0 K 0  1 K 0 = I N (conform proprietăţii 3)... M K M  0 K 1  deci matricea B astfel construită este unitară. λ N ) = Λ Prin urmare.. λ N ⋅ x N  =  M K M   M M M  0 0 K λ N  M ⇒ B −1 ⋅ A ⋅ B = diag (λ1 . alegând matricea B ca având pe coloane vectorii proprii normaţi ai matricea A şi matricea Λ având pe diagonală valorile proprii corespunzătoare. *  L x1T  *  L x 2T −1 ⇒ B ⋅ A⋅ B =  M M  L x *T N  *  L x1T  *  L x 2T = M M  L x *T N  L   M  L  ⋅ A ⋅  x1 M   M  L M M x2 M M   .

Transformări unitare ale unor semnale unidimensionale O transformare liniară de la C N → C N este unitară dacă este reprezentată de o matrice unitară A ∈M N × N (C ) . V =  M   u( N )   v( N )      În scriere matriceală: V = A⋅U .m=1.24) unde A = (a m (l ) )l . pe componente: v(m) = ∑ a m (l ) ⋅ u (l ) l =1 N N (4. cu N eşantioane ( l = 1. Dacă notăm cu u(l) un semnal unidimensional discret.4. Indicele m semnifică indicele semnalului din baza de semnale.23) (4. ⇒ U = A −1 ⋅ V = A*T ⋅ V (4.20) se scriu. N l =1 N (4.19) şi (4.25) (4.27) 98 . N .26) * u (l ) = ∑ a m (l ) ⋅ v(m) m=1 * A ⋅ A*T = I N ⇔ ∑ a m (l ) ⋅ a m' (l ) = δ (m − m' ). relaţiile (4. iar argumentul l semnifică eşantionul m din baza de semnale. m =1. Matricea A se scrie extins:  a1 (1) a1 (2) K a1 ( N )     a 2 (1) a 2 (2) K a 2 ( N )  A= M M M M     a (1) a (2) K a ( N )  N N  N  Cu aceste notaţii. N ) şi cu v(m) semnalul eşantionat transformat:  u (1)   v(1)      U =  M .3.

l =1. l = l ' . Prima condiţie de mai sus (4.32) care exprimă condiţia de completitudine.28) 1. în rest . Transformata unitară directă a unei secvenţe este: v(m) = ∑ a m (l ) ⋅ u (l ) l =1 N N (4.32) exprimă condiţia de ortonormalitate. adică δ (l − l ' ) =  unde: δ ( x) =  0. N l =1 N (4.29) iar transformata unitară inversă este: * u (l ) = ∑ a m (l ) ⋅ v(m) m=1 (4. în rest 0.23) exprimă condiţia de ortonormalitate.24) exprimă condiţia de completitudine a bazei. l ≠ l ' este impulsul Dirac. x = 0 1.30) Condiţia ca transformata să fie unitară este: l =1 N * ∑ a m (l ) ⋅ a m' (l ) = δ (m − m' ) N (4.* A*T ⋅ A = I N ⇔ ∑ a m (l ) ⋅ a m (l ' ) = δ (l − l ' ). m=1 * ∑ a m (l ) ⋅ a m (l ' ) = δ (l − l ' ) (4. 99 . iar cea de-a doua condiţie (4. Coloanele matricei unitare A formează o bază ortonormată în spaţiul vectorial CN.

n (l ' .n (l . k ) = δ (m − m' . k ) ⋅ a m.4.n' (l . k − k ' ) =  k = k ' (4. k )) l . Transformări unitare ale unor semnale bidimensionale Se spune că un semnal (v(m. k ) ⋅ v(m.4. numărul de operaţii necesare Nx pentru a calcula l =0 N −1 v(m) este Nx= N2.  * ∑ ∑ a m.k =0.35) m =0 n = 0 0. atunci când secvenţa de date are lungimea N.n (l .n (l .n=0. un algoritm are complexitatea O(NP) dacă numărul de numărul de operaţii (înmulţiri. n )) m. în rest  def . k ) ⋅ a m'. complexitatea algoritmului de calcul a lui v(m) este O(N2). n) este transformarea inversă (4. N −1 se obţine prin aplicarea unei transformări unitare asupra semnalului (u (l .n (l . Prin urmare. n) = ∑ ∑ a m. Condiţia de ortonormare se scrie: N −1 N −1  m = m ' 1. k ' ) = δ (l − l ' .34) m =0 n =0 N −1 N −1 Condiţia de completitudine se scrie în acest caz:  l = l ' 1. k ) este transformarea directă (4. dacă: v(m.36) l =0 k =0 0. adunări etc) este proporţional cu Np. v(m) = ∑ a m (l ) ⋅ u (l ) . 100 . În cazul transformărilor unitare unidimensionale. n − n' ) =  n = n' (4. k ) ⋅ u (l .33) l =0 k =0 N −1 N −1 * u (l . k ) = ∑ ∑ a m.  * ∑ ∑ a m. în rest  N −1 N −1 def . N −1 . În ceea ce priveşte numărul de operaţii.

adică Nx= N3. N −1 . n) = ∑ a m (l ) ⋅ ∑ u (l . numărul de operaţii necesare pentru a calcula v(m. transformarea unitară directă separabilă se poate scrie: v = A ⋅ u ⋅ BT .n (l . însă adesea se încearcă reducerea complexităţii algoritmului. Transformarea inversă se poate scrie: u = A −1 ⋅ v ⋅ B T ( )−1 (4.l =0. deoarece relaţia de mai sus se poate scrie şi: v(m.38) Se poate arăta că dacă o transformare unitară bidimensională este separabilă.În cazul bidimensional.39) Pentru a ilustra scrierea matriceală a unei transformări unitare separabile (ultimul argument a lui bn(k) trebuie să coincidă cu primul argument a lui u(l. B = (bn (l )) n.41) unde A = (a m (l )) m. k ) l =0 k =0 N −1 N −1 (4. complexitatea algoritmului său de calcul se reduce la O(N3). k ) l =0 k =0 N −1 N −1 (4. deci k =0 l =0 N −1 N −1 complexitatea algoritmului este O(N4).l =0.40) În acest caz. N −1 sunt matricile unitare în care se poate separa transformarea iniţială. relaţia de mai sus se poate scrie şi: v(m. n) = ∑ a m (l ) ⋅ ∑ bn (k ) ⋅ u (l . k ) = a m (l ) ⋅ bn (k ) În acest caz: v(m. k ) ⋅ bn (l ) l =0 k =0 N −1 N −1 (4. k ) este de ordinul a Nx= N4. n) = ∑ ∑ a m. Se spune că o transformare unitară bidimensională este separabilă dacă coeficienţii transformării se pot scrie: (4. (4.k)).37) a mn (l .42) 101 . k ) ⋅ u (l . n) = ∑ ∑ a m (l ) ⋅ bn (k ) ⋅ u (l .

j =0. transformarea directă este: v(m. N −1 . n) m =0 n =0 N −1 N −1 (4. În spaţiul matricilor pătrate de dimensiune N×N se poate defini o transformare unitară bidimensională şi prin utilizarea produsului vectorial. Y ∈ M N × N (C ) . Dacă matricile X . N −1 .Deoarece A şi B sunt. care are elementele A = (a m (l )) m. În acest caz. j =0. după cum se va arăta în continuare. unde X = ( xij ) i . deci inversă se mai poate scrie: ⇒ u = A*T ⋅ v ⋅ B * (4. deci: 102 . Spaţiul matricilor pătrate M N × N (C ) are dimensiunea N2. N −1 .46) Prin urmare.45) Aceste relaţii trebuie însoţite de condiţiile de ortonormalitate şi completitudine. matrici unitare. Y = ∑ ∑ xij ⋅ yij i =0 j =0 def . În acest spaţiu se va fixa o matrice unitară A. produsul scalar al celor două matrici se defineşte prin relaţia: * X . îl constituie cazul în care matricile unitare A şi B sunt egale. k ) = ∑ ∑ a m (l ) ⋅ a n (l ) ⋅ v(m. transformarea (4.l =0. adică A −1 = A*T şi B −1 = B *T .43) Un caz particular. N −1 N −1 (4. Y = ( yij ) i . la rândul lor. produsul scalar dă spaţiului M N × N (C ) o structură de spaţiu Hilbert (un spaţiu liniar cu un produs scalar). n) = ∑ ∑ a m (l ) ⋅ a n (k ) ⋅ u (l . k ) l =0 k =0 N −1 N −1 (BT )−1 = (B −1 )T = B* . A = B.44) iar transformarea inversă este: * * u (l .

n = l * în care: a nT ⋅ al = δ (n − l ) =  . deoarece coloanele unei matrici unitare formează o bază în spaţiul N×N.48) 1. a. N −1 . n) ⋅ Amn N −1 N −1 m =0 n =0 (4.50) 103 . unde Amn = a m ⋅ a n * . { } În acest spaţiu se poate construi o bază B în M N × N (C ) astfel: Pentru a verifica dacă B este o bază în spaţiul M N × N (C ) se procedează prin reducere la absurd.47) * * T * * B = Amn m. * * T * Deoarece B = Amn m. ceea ce este fals. ∑ ∑ α mn ⋅ Amn = 0 N × N N −1 N −1 m = 0 n =0 ⋅ al Înmulţind relaţia de mai sus cu al.n=0. N −1 .î. n ≠ l deoarece matricea A este unitară. a N −1  | |   | | (4. deci sunt liniar independente. pt. pt. N −1 m =0 (4. 0. k ) = ∑ ∑ v(m. Prin urmare rezultă că există matricile: * ⇒ ∃α mn ∈ C .49) adică componentele ak sunt liniar dependente. se obţine relaţia: * * ⇒ ∑ ∑ α mn ⋅ a m ⋅ a nT ⋅ al = 0 N −1 N −1 m =0 n = 0 (4.n=0. iar vectorii a n sunt vectori linie (1×N). presupunând că B nu este o bază în spaţiul M N × N (C ) .. | A =  a0  |  not .   a1 . unde Amn = a m ⋅ a n * este o bază în { } spaţiul M N × N (C ) : * u N × N (l .. vectorii a m fiind vectori * coloană (N×1). nu toate nule. Prin urmare: * ⇒ ∑ α mnl ⋅ a m = 0 .

54) este: Matricea  2π   m ⋅ k  . k ) ⋅ a mn (l . Amn = ∑ ∑ u (l . N − 1 N m =0  N  transformării DFT-1D (4. N  (4. Transformata Fourier discretă unidimensională (DFT-1D) Deoarece transformarea Fourier este una din transformările cel mai des utilizate în domeniul prelucrărilor de imagini. unde m este indicele de linie şi k indicele  exp − j   N    m. n) = u .55) . n) = u . k ) = a m (l ) ⋅ a n (k ) . unde k = 0. n) = ∑ ∑ u (l .52) 4. Astfel.* Din algebra liniară se ştie că: v(m. Amn .51) * * * Dar: Amn (l . N −1  de coloană. rezultă: * * v(m. Se poate defini transformata DFT-1D unitară prin relaţiile: v ( m) = 1 N −1 N l =0  ∑ u (k ) ⋅ exp − j  104 2π  m⋅k. unde m = 0. Transformata Fourier discretă unidimensională DFT-1D directă a unei secvenţe discrete u(k) este definită prin relaţia: N −1 2π   v(m) = ∑ u (k ) ⋅ exp − j m ⋅ k  .53) Transformata Fourier discretă unidimensională DFT-1D inversă este definită prin relaţia: u (k ) = 1 N −1  2π  ∑ v(m) ⋅ exp j m ⋅ k  . în continuare va fi prezentată transformata Fourier discretă unidimensională şi proprietăţile acesteia. N − 1 N   k =0 (4. ⇒ v(m. k ) N −1 N −1 l =0 k =0 ( )* (4. k ) ⋅ a m (l ) ⋅ a n (k ) l =0 k = 0 N −1 N −1 (4.5.k =0.

56) transformării. Se poate arăta că matricea u (k ) = 1 N −1  ∑ v(m) ⋅ exp j 2π  m ⋅ k .  N  (4.57) F = F T  . 1 2π   ⋅ exp − j F = m ⋅ k    N    m.  1 2π   ⋅ exp − j F = m ⋅ k  .60) N −1 2π  (m + N ) ⋅ k  = v(m + N ) = ∑ u (k ) ⋅ exp − j  N   k =0 N −1 2π 2π     = ∑ u (k ) ⋅ exp − j m ⋅ k  ⋅ exp − j N ⋅k = N N     k =0 105 . deoarece F * = F T * = F −1 . Extensia vectorului transformat este periodică. N −1  N F ⋅ F *T = F *T ⋅ F = I N . unde: ⇒  F −1 = F *   1  2π  ⋅ exp j F −1 = F * =  m ⋅ k     N   m.59) 2.k =0. adică   N    m.k =0. N −1  N (4. N −1  N (4. este o matrice unitară. v(m + N ) = v(m) : (4.58) (4.pentru transformata DFT-1D directă N m =0 pentru transformata DFT-1D inversă. 4. Proprietăţi ale transformatei DFT-1D 1.6.k =0. Inversa matricei DFT-1D este egală cu conjugata matricei DFT-1D: def .

Spectrul semnalului este: 106 . − 1 2 2  2  Grafic: x x* (4.N-1]. Spectrul eşantionat al semnalului discret u(k) extins cu 0. 4. extins cu 0 în rest este: u (k ) = ∑ u (t ) ⋅ δ (t − k ) k =0 N −1 (4. În vectorul transformat v.2.62) 0 N/2 N-1 Figura 4.63) A ω Figura 4.61) deoarece: 2π   exp − j N ⋅ k  = cos(2π ⋅ k ) − j ⋅ sin( 2π ⋅ k ) = 1 N   3. componentele sunt conjugat simetrice: N N  N  v ± m  = v *  m m  . Modelul matematic al semnalului eşantionat. unde m = 0. DFT-1D este spectrul eşantionat al semnalului discret u(k) extins cu 0 în afara intervalului [0.N −1 2π   = ∑ u (k ) ⋅ exp − j m ⋅ k  = v ( m) N   k =0 (4.3. Componentele vectorului transformat v sunt conjugat simetrice.

5. Transformata DFT transformă convoluţia circulară în produs. . unde l = 0. Spectrul semnalului. N − 1 107 not .66) 6. ( )FFT (4. dacă N=2p.∞  N −1 ∞   U (ω ) = ∫ u (t ) ⋅ e − j⋅ω ⋅t dt = ∫  ∑ u (k ) ⋅ δ (t − k ) ⋅ e − j⋅ω⋅t dt =  k =0  −∞  −∞ = ∑ u (k ) ⋅ ∫ δ (t − k ) ⋅ e − j⋅ω⋅t dt = ∑ u (k ) ⋅ e − j⋅ω⋅k k =0 N −1 ∞ N −1 k =0 (4.4. FFT = Fast Fourier Transform) reduce complexitatea algoritmului de calcul al DFT de la N2 la N ⋅ log 2 N operaţii.65) v(1) v(2) A v(0) -2π -π 2π 2π … 2 N N π … 2π ω Figura 4.64) −∞ Comparând această relaţie cu transformata Fourier discretă: v ( m) = ∑ u ( k ) ⋅ e k =0 N −1 − j⋅ 2π m⋅k N ⇒ v(m) = U (ω ) ω = 2π m N (4. Algoritmul rapid FFT al DFT (engl. Convoluţia circulară este: X (l ) ∗c Y (l ) = Z (l ) . unde N=2p este par: O N 2 → O(log 2 N ) .

67) Acest mod de a defini simetria circulară limitează lungimea secvenţei Z la N.. k ) = exp − j  N   108 (4.68) 4.7. k ) ⋅ a mn (l . k ) ⋅ exp − j  N   l =0 k =0 N −1 N −1 l =0 k =0 = ∑ ∑ u (l ..69) . N −1 (4. Transformata Fourier discretă bidimensională directă a unei imagini discrete U = {u (l . DFT – 2D este utilă la analiza spectrală a imaginilor digitale.k = 0 .. k ). unde: a mn (l .N-1} se defineşte astfel: N −1 N −1  2π (m ⋅ l + n ⋅ k ) = v(m.. Teorema convoluţiei circulare: Dacă:  X (m) = DFT {X (l )}  Y (m) = DFT {Y (l )} şi Z (l ) = X (l ) ∗c Y (l ) Z (m) = DFT {Z (l )}  ⇒ Z ( m ) = X ( m) ⋅ Y ( m ) (4. 0 ≤ m. l. k ). n) = ∑ ∑ u (l .n ≤ N-1  2π (m ⋅ l + n ⋅ k ) . În mod similar cazului unidimensional. Transformata Fourier discretă bidimensională (DFT-2D) Transformata Fourier discretă bidimensională (DFT – 2D) este una din transformările cel mai des utilizate în domeniul prelucrărilor de imagini.1.Z (l ) = ∑ X ((l − i ) mod N ) ⋅ Y (i ) i =0 def .

k ) ⋅ exp − j ⋅ m ⋅ l  ⋅ exp − j ⋅n⋅k = N N     l =0 k =0 N −1 N −1 l =0 k =0 = ∑ ∑ u (l . k ) = 1 N 2 N −1 N −1 m = 0 n =0  ∑ ∑ v(m. n ) ⋅ W N ⋅ W N (4. k ) ⋅ bm (l ) ⋅ c n (k ) = m n = ∑ ∑ u (l .71) 109 . scoate în evidenţă proprietatea sa de separabilitate. n) ⋅ bm (l ) ⋅ c n (k ) = = 1 N 2 N −1 N −1 m =0 n = 0 − m⋅l − n⋅k ∑ ∑ v ( m. k ) ⋅ W N ⋅l ⋅ W N⋅k l =0 k =0 N −1 N −1 (4. Transformata DFT – 2D inversă este: u (l .După cum se observă.70) 2π   unde: bm (l ) = exp − j m⋅l N   2π   c n ( k ) = exp − j n⋅k N   2π   W N = exp − j  N   Această rescriere a DFT – 2D directă. n) = ∑ ∑ u (l . această relaţie se mai poate scrie: N −1 N −1 2π 2π     v(m. n) ⋅ exp  j 2π (m ⋅ l + n ⋅ k ) =   N  = 1 N 2 N −1 N −1 m =0 n = 0 * * ∑ ∑ v(m.

relaţiile ce definesc DFT – 2D unitară directă şi inversă se pot scrie şi sub formă matricială: • DFT – 2D unitară directă: V = F ⋅U ⋅ F T = F ⋅U ⋅ F . N −1 k =0. n) ⋅ exp − j (m ⋅ l + n ⋅ k ) = N m =0 n = 0 N   1 N −1 N −1 m⋅l n⋅k ∑ ∑ v ( m. Transformata DFT – 2D unitară directă se defineşte astfel: v ( m.73) Se poate defini matricea transformării DFT-2D unitare: 1 1 2π 2π     ⋅  exp − j F =  exp − j m ⋅ l  n ⋅ k  (4. cn(k) şi WN au aceleaşi semnificaţii ca mai sus. deoarece se observă mai sus că: F = F T 110 ( ) (4.unde bm(l). Astfel. k ) ⋅ W N ⋅l ⋅ W N⋅k N l =0 k = 0 = (4. N −1  N l =0.72) DFT-2D unitară inversă este: u (l . N −1  N  n =0. k ) = 1 N −1 N −1  2π  ∑ ∑ v(m.74) N N   m=0. Se poate arăta că transformarea astfel definită nu este o transformare unitară.75) . n ) = 1 N −1 N −1  2π  ∑ ∑ u (l . n ) ⋅ W N ⋅ W N N m =0 n =0 = (4. N −1 care este o matrice unitară F ∗T ⋅ F = F ⋅ F ∗T = I N . k ) ⋅ exp − j (m ⋅ l + n ⋅ k ) = N l =0 k =0 N   1 N −1 N −1 m n ∑ ∑ u (l .

∀p . deoarece: F ∗T ⋅ F = F ⋅ F ∗T = I N ⇒ F -1 = F ∗T = F ∗ (4. Proprietăţi ale transformatei DFT-2D 1. q ∈ N (4. aplicarea DFT – 2D se poate face în 2 paşi: • • mai întâi se aplică DFT – 1D pe linii (sau pe coloane) rezultatului i se aplică DFT – 1D pe coloane (sau pe linii).77) 3.• DFT – 2D unitară inversă: U = F −1 ⋅ V ⋅ F −1 = F ∗ ⋅ V ⋅ F ∗ . Datorită separabilităţii sale. se poate arăta că algoritmul rapid necesar pentru obţinerea DFT – 2D are complexitatea O N 2 ⋅ log N . Pentru o imagine u reală. Astfel. se poate trage concluzia că DFT – 2D are algoritm rapid de calcul. 2. deoarece DFT – 1D are algoritm rapid de calcul.5).8. n ) . adică: ( ) ( ) v ( m + p ⋅ N . Datorită acestui fapt. m n  2 2 2  2  (4. în loc de O N 3 cât ar fi dacă nu ar fi separabilă. Extensia DFT – 2D este periodică. elementele DFT – 2D sunt conjugat simetrice faţă de jumătatea imaginii transformate v (figura 4.76) 4. adică: N N N  N  v ± m.78) 111 . ± n  = v *  m m. n + q ⋅ N ) = v ( m .

Elementele DFT – 2D sunt conjugat simetrice faţă de jumătatea imaginii transformate. definit anterior. Conform acesteia. 112 . se calculează DFT–2D inversă a rezultatului. printr-un algoritm rapid de calcul (FFT=Fast Fourier Transform). transformata DFT – 2D a produsului de convoluţie a două secvenţe bidimensionale x1 şi x2 este egală cu produsul simplu a transformatelor DFT – 2D a celor două secvenţe. n)} (4. n)} = F {x1 (m.79) unde cu F{x} s-a notat DFT–2D a secvenţei bidimensionale x şi cu x1 ⊗ x 2 s-a notat produsul de convoluţie a lui x1 cu x2. n) ⊗ x 2 (m. Una dintre cele mai importante proprietăţi ale transformatei Fourier rezultă din aşa-numita ”teoremă a convoluţiei”. adică: F {x1 (m. n)} ⋅ F {x 2 (m. De aici se poate trage concluzia că DFT – 2D este complet determinată de N2 numere reale şi nu de 2N2 câte ar trebui să aibă în mod normal (fiecare are parte reală şi imaginară). Această proprietate permite calculul convoluţiei a două secvenţe bidimensionale prin următoarea metodă: • • • se calculează DFT–2D directă a celor 2 secvenţe. 4.5. se efectuează produsul celor 2 transformate.N N Figura 4.

y) ⋅ e − j (ξ ⋅ x +η ⋅ y )dxdy R (4. 5. m. Transformata Cosinus discretă unidimensională Matricea transformării Cosinus discretă (DCT-1D) este C = (c m (l ) )m. Semnalul eşantionat se poate scrie: u (l .m = 0 (4. DFT-2D este spectrul eşantionat al semnalului eşantionat.η ) = ∫∫ u(x. y ) ⋅ δ ( x − l . n) = U (ξ . DFT-2D este de asemenea utilă pentru determinarea unor parametri utilizaţi în procesele de analiză a imaginilor.83) unidimensională 2  π (2l + 1) ⋅ m  ⋅ cos . k ) = ∑ ∑ u ( x.82) 4. m = 1. l = 1.η = 2π n N N (4.Această metodă este frecvent aplicată la filtrarea digitală a imaginilor.l =1. N care are elementele:    c m (l ) =     Notând:    α ( m) =     1 N . m = 0.η ) ξ = 2π m. N N DCT-1D directă se poate rescrie: 113 .84) 2 . N N 2N   1 N . l = 1.9. y − k ) l = 0 k =0 N −1 N −1 (4. N (4.81) Se poate arăta că: V (m.80) Spectrul semnalului este: U (ξ .

.86) Se poate arăta că matricea C a transformării DCT-1D este unitară.N  π (2l + 1) ⋅ m  v(m) = ∑ u (l ) ⋅ α (m) ⋅ cos   2N   l =1 (4.88) DFT-1D u(m) … … DCT-1D u(m) … u(1) u(2) u(N-1) u(N) u(N) u(N-1) u(2) u(1) u(1)u(2) u(N-1) u(N) Figura 4..85) DCT-1D inversă este: N  π (2l + 1) ⋅ m  u (l ) = ∑ v(m) ⋅ α (m) ⋅ cos   2N   m=1 (4.. u ( N − 1) u ( N ) u ( N ) ( N − 1) . u ( N − 1) u ( N ) (4. Pe de altă parte...89) 114 .87) Observaţie: Transformarea cosinus discretă DCT-1D se poate obţine din DFT-1D a secvenţei simetrice de lungime 2N construită astfel: u ( N ) u ( N − 1) . deoarece matricea C este reală: ⇒ C −1 = C T * = C T (4. u (2) u (1) (4. Obţinerea DCT-1D din DFT-1D de lungime 2N.6.. u (2) u (1) u (1) (2) . adică C ⋅ C *T = C *T ⋅ C = I N . sau: u (1) u (2) ...

k) de dimensiune N×N (l. Obţinerea DCT-1D din DFT-1D de lungime 2N.u(m) … … u(1) u(2) u(N-1) u(N) u(N) u(N-1) u(2) u(1) Figura 4. În acest fel. Transformata Cosinus Discretă bidimensională DCT-2D Transformata Cosinus discretă bidimensională (DCT-2D) a unei imagini u(l. care reduce numărul de operaţii la 2 ⋅ ( N + 1) ⋅ log 2 ( N + 1) . variaţii care au ca rezultat componente importante la frecvenţe înalte. k ) ⋅ cos  2N   2N  l =1k =1 = ∑ ∑ u (l .90) 115 . în cazul DCT-1D nu mai apar variaţii bruşte în spectru. N ) se defineşte astfel: N N  (2l + 1)π   (2k + 1)π  ⋅ m  ⋅ cos ⋅ n = v(m.10. adică ⇒ O( N ⋅ log 2 N ) ... k ) l =1k =1 N N (4. 4.k= 1. n) = ∑ ∑ α (m) ⋅ α (n) ⋅ u(l .7. k ) ⋅ a mn (l . ca în cazul DFT-1D u (1) u (2) . rezultă că şi DCT-1D are un algoritm de calcul rapid. u ( N − 1) u ( N − 2) Consecinţă: Deoarece DCT-1D se poate construi din DFT-1D care are un algoritm de calcul rapid.

k ) ⋅ a mn (l ..2 ..N N  (2l + 1)π   (2k + 1)π  ⋅ m  ⋅ cos ⋅ n  2N   2N  amn (l . rezultă că obţinerea DCT-2D se poate face în doi paşi: 116 ( )−1 = C T ⋅ V ⋅ C = DCT-2D inversă..n=1.94) DCT-2D directă şi inversă se pot scrie şi sub formă matriceală: V=C⋅U⋅CT = DCT-2D directă U = C −1 ⋅ V ⋅ C T deoarece C −1 = C T . k ) = α (m) ⋅ α (n) ⋅ cos (4. m) =  α (m ) ⋅ cos    2N   l . Deoarece matricea transformării DCT-1D este:   (2l + 1)π  ⋅ m C (l . pentru m = 1 (4.96) (4. Deoarece DCT-2D este separabilă..91) 2 . k ) = ∑ ∑ α (m) ⋅ α (n) ⋅ v(m.2..93) iar α(m) şi α(n) au fost definite mai sus.92) În mod similar se defineşte şi DCT-2D inversă: N N  (2l + 1)π   (2k + 1)π  u(l .N    α ( m) =     1 N . pentru m = 1. n) ⋅ cos ⋅ m  ⋅ cos ⋅ n =  2N   2N  l =1k =1 = ∑ ∑ u (l .m=1. k ) l =1k =1 N N (4.95) ... (4. N  (4..unde: m.

n) = ∑ ∑ u ' (l . n) ⋅ cos ⋅ m  2N  l =0 (4..98) După cum s-a arătat. n) = ∑ α (n) ⋅ u (l .. DCT-1D se poate obţine din DFT-1D a secvenţei simetrice de lungime 2N.• întâi se aplică DCT-1D pe linii (sau pe coloane): N  (2k + 1)π  ⇒ v' (l . se poate arăta că DCT-2D se poate obţine prin intermediul transformatei Fourier DFT. construită astfel: u ( N ) u ( N − 1) . Astfel.97) • rezultatului i se aplică DCT-1D pe coloane (sau pe linii): N −1  (2l + 1)π  ⇒ v(m. N   unde. n) = ∑ α (m) ⋅ v' (l . u ( N − 1) u ( N ) u ( N ) ( N − 1) .99) 2π   unde: W N = exp − j . u (2) u (1) Ca şi în cazul unidimensional... u ( N − 1) u ( N ) sau: u (1) u (2) .. k ) ⋅ W2 ⋅N ⋅ W2kN ... u (2) u (1) u (1) (2) . imaginea extinsă u’ se obţine din imaginea iniţială u. k ) ⋅ cos ⋅ n  2N  k =1 (4. DCT-2D se poate calcula ca fiind transformata Fourier a unei imagini u’ extinse.. de dimensiune 2N×2N: lm ⋅n F (m. l =1 k =1 2N 2N (4. astfel: 117 .

 0 ≤ l ≤ N-1 pentru  u (l . calculul DCT-2D se reduce practic la calculul DFT-2D pe o imagine cu o arie de patru ori mai mare decât imaginea iniţială (figura 4.100) (4. k ).8): 2N N N 2N Figura 4. n) = W2m / 2 ⋅ W2nN 2 ⋅ F (m.2 N − k − 1). O alta variantă de obţinere a DCT-2D prin intermediul DFT-2D şi care elimină dezavantajul prezentat mai sus.2 N-k-1 ). 0 ≤ k ≤ N-1    N ≤ l ≤ 2 N-1 u (2 N − l − 1. n) N (4. k ) =  0 ≤ l ≤ N-1 u(l.101) În concluzie. pentru   N ≤ k ≤ 2 N-1  Relaţia care face legătura între cele două transformări este: / v(m. astfel: 118 .8. pentru    N ≤ k ≤ 2 N-1    N ≤ l ≤ 2 N-1 u (2 N − l − 1. din DFT-2D pentru o imagine cu o arie de patru ori mai mare decât imaginea iniţială. pentru   0 ≤ k ≤ N-1 u ' (l . Obţinerea DCT-2D a unei imagini. constă în utilizarea unei secvenţe (imagini) bidimensionale u’ obţinută din imaginea iniţială u. k ). Această variantă de obţinere a DCT-2D are dezavantajul că necesită un volum de calcul relativ mare datorită imaginii de dimensiuni mari (2N×2N) asupra căreia se aplică DFT-2D.

119 .k). care se notează cu F.103) Prin urmare.k). n) + W4−N ⋅ F (m.102) Astfel. n) = 2 ⋅ Re W4m ⋅ W4nN ⋅ F (m. pentru  2     N + 1 ≤ k ≤ N-1   2     (4. pentru    N + 1 ≤ k ≤ N-1   2       N + 1    ≤ l ≤ N-1 u (2 N − l − 1. pentru   0 ≤ k ≤  N-1   2          N + 1   2  ≤ l ≤ N-1    pentru  u (2 N − l − 1. În ambele cazuri. k ) =    N-1  0 ≤ l ≤  2      u(l.   N-1  0 ≤ l ≤  2     u (l . k ). 0 ≤ k ≤  N-1   2       u ' (l . k ). N − n) = N n = 2 ⋅ Re W4nN W4m ⋅ F (m.k) păstrează dimensiunea N×N a imaginii iniţiale.2 N − k − 1).k) din imaginea iniţială u(l. n) + W4−N ⋅ F (m.2 N-k-1 ). DCT –2D a imaginii iniţiale u se poate calcula în funcţie de DFT –2D a secvenţei u’(l. N − n) N { [ ]} { [ ]} (4. secvenţa (imaginea) u’(l. au fost prezentate 2 metode de obţinere a DCT-2D prin intermediul DFT-2D. se calculează DFT–2D a imaginii u’(l. algoritmul de calcul al DCT–2D este următorul: • • se obţine imaginea (secvenţa) u’(l.n)) astfel : n V (m.k) (care se va nota cu F(m.

trebuie verificate condiţiile de completitudine şi ortonormalitate. De aici se poate trage şi concluzia că. deoarece DCT–2D se poate obţine prin intermediul DFT şi deoarece DFT are algoritm rapid de calcul.107) 0 − u ( N ) − u ( N − 1) K − u ( 2) − u (1) 0 u (1) u ( 2) K u ( N − 1) u ( N ) 120 .• se calculează DCT–2D. utilizând relaţia de legătură corespunzătoare. Deoarece: V = S ⋅U este transformarea transformarea inversă este: ⇒ U = S −1 ⋅ V = S ⋅ V (4. N care are elementele: s m (l ) = 2  π ⋅ (m + 1) ⋅ (l + 1)  ⋅ sin   N +1 N +1   (4.11.104) Pentru a arăta că transformarea S este unitară. 4. Transformata Sinus discretă unidimensională DST-1D Matricea transformării este S = (s m (l ) )l . rezultă că şi DCT–2D are algoritm rapid de calcul. rezultă că (4.105) directă. adică sk(m)=sm(k): ⇒ S −1 = S *T = S . între cele 2 transformate.106) Observaţie: Transformarea sinus unidimensională discretă DST-1D se poate obţine din transformarea Fourier unidimensională discretă DFT-1D.m=1. Se observă că S este o matrice reală şi simetrică. prin secvenţa antisimetrică de lungime 2·(N+1) construită astfel: (4.

Obţinerea DST-1D din DFT-1D. 4. 121 . deoarece S T = S iar transformata Sinus inversă este definită prin relaţia: U = S −1 ⋅ V ⋅ S −1 = S ⋅ V ⋅ S . Transformata Sinus directă bidimensională este definită prin relaţia: V = S ⋅ U ⋅ S T = S ⋅ U ⋅ S . care reduce numărul de operaţii la 2 ⋅ ( N + 1) ⋅ log 2 ( N + 1) . Consecinţă: Deoarece DST-1D se poate construi din DFT-1D care are un algoritm de calcul rapid.109) (4.12. deoarece S −1 = S (4. iar rezultatului i se aplică DST-1D pe coloane sau invers. adică ⇒ O( N ⋅ log 2 N ) . rezultă că şi DST-1D are un algoritm de calcul rapid.0 u(N) u(N-1) u(2) u(1) 0 … … 0 u(1) u(2) u(N-1) u(N) 0 Figura 4. Transformata Sinus discretă bidimensională DST-2D Transformata Sinus discretă bidimensională DST-2D este transformarea bidimensională separabilă care are matricele A = B = S. unde S este matricea DST-1D definită anterior.108) Observaţie: Calculul DST-2D se poate face în 2 paşi: se aplică DST-1D pe linii.9. prin secvenţa antisimetrică de lungime 2·(N+1).

1. relativ la un anumit criteriu.k). transmisiei. Se doreşte ca pornind de la imaginea degradată f”(l.k). eroarea medie pătratică.k) Figura 5. prelucrării sau analizei sale. De exemplu. k ) ≅ f (l .k) se obţine o imagine degradată f’(l. care poate fi.k) h(l.1) se acceptă o filtrare liniară h(l.k) îi poate corespunde nefocalizarea obiectivului camerei sau mişcării aparatului foto în timpul expunerii. de exemplu. În general.k) care a suferit un proces de degradare echivalent cu o filtrare h(l.k) z(l. k ) Criteriul de comparare va fi ales cel al erorii medii pătratice: 122 .k) deoarece în acest caz sunt calcule mai puţine: f"(l. peste care se suprapune un zgomot z(l.k) f'(l.k). rezultatul fiind imaginea degradată f”(l. în modelul degradării (figura 5. k ) ˆ f (l . Modelul degradării unei imagini.5.k) + f"(l. Problema restaurării unei imagini degradate se pune astfel: având o imagine digitală originală f(l.k) să se obţină estimarea imaginii originale tot printr-o filtrare liniară g(l.k) să conducă la un rezultat cât mai apropiat de imaginea originală f(l.k) g(l.k). Prin restaurare se doreşte determinarea unei metode de estimare care pornind de la imaginea degradată f”(l. funcţiei h(l.k). Restaurarea imaginilor O imagine poate fi degradată pe parcursul achiziţiei. f(l.k) ˆ f (l .

n) Dacă zgomotul este nenul: z ≠ 0 ⇒ Z (m. n) ⋅ H −1 (m. k ) = f ' (l . n) = 0 F " (m. k ) ∈ C l =1k =1 L K L K (5.1) f ' (l .k): F (m. n) = F (m. Se va nota cu F(m. n) ⋅ H (m. se consideră că raportul semnal-zgomot (RSZ): • pentru semnale audio.9) (5.3) 5. k ) . n) = F " (m. k )} F " (m.10) . unde f (l . n) = DFT { f (l . n) Dacă: z (l . n) ≠ 0 . n) ⋅ H (m. n) = H −1 (m.7) (5. un RSZ bun este un RSZ >30 dB În prezenţa zgomotului. un RSZ bun este un RSZ >20 dB • pentru imagini. ⇒ Z (m.8) (5. k ) (5. relaţiile anterioare se scriu: 123 not . k ) − fˆ (l . k ) ∗ h(l . k ) = 0 .2 ε = ∑ ∑ f (l .5) (5. n) Funcţia de transfer a filtrului de restaurare va fi. k − j ) ⋅ h(i. n) ⋅ H −1 (m. Filtrarea inversă Dacă zgomotul ar fi inexistent (z=0) cea mai simplă metodă de restaurare ar fi ca g să fie filtrul invers lui h. n) = F (m. n) = F (m. n) ⋅ H (m. n) ˆ Pentru z=0: ⇒ F (m. k ) = f (l . n) Transformata Fourier a estimării imaginii iniţiale va fi: ˆ F (m. k ) + z (l . n) + Z (m. (5. În acest caz.6) (5.1.n) transformata Fourier discretă a funcţiei f(l. în acest caz: G (m. j ) (5.4) (5. k ) = ∑ ∑ f (l − i.2) i =1 j =1 f " (l .

124 . Dacă zgomotul z este zgomot alb. n) ⋅ H (m. din semnalul original degradat cu zgomot alb. rezultă că Z(m. Exemplu de filtrare inversă în cazul 1D. ˆ f f Figura 5. n) ˆ ⇒ F = F + Z ⋅ H −1 (5.n) este constant. Rezultă că Z ⋅ H −1 are valori mari în vecinătatea polilor.12) Dacă H are zerouri.2. rezultă că H-1 are poli.ˆ F (m. Exemplu: în cazul unidimensional (1D): H-1 ˆ F = F + Z ⋅ H −1 H F Figura 5. n)] ⋅ H −1 (m. n) = [F (m.11) (5.3. Semnalul original şi semnalul restaurat prin filtrare inversă. n) + Z (m. ⇒ Z ⋅ H −1 are valori mari în vecinătatea zerourilor lui H. ˆ ⇒ F este mult diferit de F ⇒ fˆ este mult diferit de f.

În figura 5. n) = cunoscută m =1 n =1 L K 2 (5.2. k ) − f (l .4. k ) = ∑ ∑ f (l − i.14) (5. Lanţul degradare-restaurare al unei imagini.16) 2 ˆ ⇒ ∑ ∑ f " (l . k ) ∗ h(l . adică a estimării semnalului original f. f h degradare f' + f" g restaurare ˆ f z Figura 5. 5. k − j ) ⋅ h(i. Dar ˆ diferenţa dintre fˆ filtrat cu h ( f ∗ h ) şi f” este zgomotul z. ˆ Dacă s-ar filtra f cu h s-ar obţine ceva apropiat de f’. Filtrul invers cu constrângeri Lanţul complet al procesului de degradare şi restaurare este reprezentat în figura 5. energia diferenţei dintre f ∗ h şi f” se doreşte a fi egală cu energia zgomotului: E f "− fˆ ∗h = E z ˆ Dar: f (l .15) (5.3 fˆ reprezintă rezultatul restaurării.4. Energia zgomotului este presupusă a fi cunoscută: E z = ∑ ∑ Z (m.13) ˆ Prin urmare. k ) ∗ h(l . k ) = E z l =1K =1 L K 125 . j ) i =1 j =1 L K (5.

după aplicarea prealabilă a transformatei Fourier.k). n=1 L K 2 1 ˆ ∑ ∑ F (m. Din teorema lui Parceval. L K (5.22) 126 . trebuie minimizată relaţia (5. n) = minimă (5.17) ˆ F (m. unde l = 1. Operaţia de filtrare cu nucleul c este echivalentă cu o convoluţie discretă.16). n) ⋅ H (m. k ) ∗ c(l .16) ⇔ L K 2 1 ˆ ∑ ∑ F " (m. k ) să fie minimă. pornind de la f(l.Se presupune cunoscut filtrul de degradare h.19) ⇔ sau: 2 ˆ ⇔ ∑ ∑ F " (m. n) − F (m. n) ∗ C (m. k = 1.19) Prin urmare. în domeniul spaţial (5. n) L K 2 Aplicând teorema lui Parceval relaţiei (5). proporţională cu derivata: ˆ f (l . se obţine: (5. un laplacean sau un gaussian). n) .19) cu constrângerea (5. adică: l =1k =1 (5.20) L ⋅ K m=1. n) ⋅ H (m.k) care să reprezinte o măsură a derivatei ( de ex. n=1 (5. k ) ∗ c(l .18) 2 ∑ ∑ fˆ (l . n =1 L K (5. Pentru aceasta se consideră un nucleu de filtrare c=c(l. l ) → l =1k =1 L K 1D m=1 n =1 ∑ ∑ F (m. n) − F (m. în domeniul spectral Se doreşte ca E fˆ ∗c să fie minimă. K . pentru ca abaterile faţă de f să fie cât mai mici. L . ˆ Se impune ca energia derivatei lui f să fie minimă. se ştie că: 2 ˆ E f = ∑ ∑ f (k . În acest caz rezultă un sistem de ecuaţii cu L×K necunoscute. n) = L ⋅ K ⋅ E z = T m=1. n) ⋅ C (m.21) L ⋅ K m=1. n) = E z (5. k ) .

n . n) = A(m... − λ m ⋅ g m ( x1 . x n ) = f ( x1 . n) ⋅ C (m.2 ˆ ⇔ ∑ ∑ F (m.23) Se ştie că atunci când trebuie minimizată o funcţie f(x1. n) ⋅ H (m..25) ∂xi unde i = 1.. n ) ⋅ H ( m. n) + j ⋅ B(m. n) = minimă m=1. adică argumentele funcţiei Ψ... x ) = 0 n  m 1 (5. x n ) = 0  M  g ( x .... n) − F (m.. (5. n) (5. n) − λ ⋅  F " (m. ˆ F (m...16) iar funcţia de minimizat este dată de relaţia (5... n =1 ˆ Funcţiile F (m... xn) cu constrângerile:  g1 ( x1 . n )  + λ ⋅ T  m =1. în număr de L×K..26) L K 2 2  ˆ ˆ ⇒ Ψ = ∑ ∑  F ( m . n ) ⋅ C ( m. n) sunt argumentele funcţiei Ψ.. x n ) − λ1 ⋅ g1 ( x1 .24) trebuie construită funcţia Lagrange: Ψ ( x1 .... n ) − F ( m . x n ) după care se minimizează funcţia Lagrange. Se construieşte funcţia Lagrange: L K 2 2   ˆ ˆ Ψ = ∑ ∑  F (m.. 127 . ….19). În cazul de faţă.. iar λi sunt coeficienţii Lagrange. constrângerea este constituită de relaţia (5..27) Rezultă că sunt 2×L×K necunoscute. n =1 (5.. n) − T     m=1. pornind de la relaţia uzuală: ∂Ψ = 0. x n ) − . n =1 L K (5. n) ⋅ C (m. n ) − λ ⋅ F " ( m ..

n = 1. n) ⋅ C (m. n) − ∂A(m.29) ⇒ (5. n) + j ⋅ B(m. n) 2 2 { (5. n) ⋅ H (m. n) − 2 ⋅ A(m. n) ⋅ H (m. n) = 0  . n) ⋅ H (m. n)  (5. n) + λ ⋅ H (m. n) = 0 [ ] ⇒ − λ ⋅ − j ⋅ F " (m. n) ⋅ H * (m. n ) = λ ⋅ Im F " (m. L.Se obţine sistemul:  ∂Ψ  ∂A(m. n) C (m. n) 2 2 { } } (5. n) C (m.28) Sistemul are 2×L×K ecuaţii cu 2×L×K necunoscute. n) ⋅ H (m. n) − F "* (m. n ) − ∂B ( m. n) [ ∂Ψ 2 = 2 ⋅ B ( m.30) 2 ˆ − λ ⋅ F " (m. n) = λ ⋅ Re F " (m. n ) = A(m. ˆ F "− F ⋅ H 2 ˆ ˆ = F "− F ⋅ H ⋅ F "* − F * ⋅ H * = 2 2 ( )( ) ˆ ˆ ˆ = F " − F "⋅F * ⋅ H * − F ⋅ H ⋅ F "* + F ∂Ψ 2 = 2 ⋅ A(m. n) = 128 . n) ⋅ H * (m. n ) ⋅ C ( m. m = 1. n) (5. n) ⋅H 2 (5. n) − 2 ⋅ B(m.31) 2 ]= 0 Rezultă: A(m. K   ∂Ψ = 0  ∂B (m.33) ˆ ⇒ F (m .32) B ( m. n) + λ ⋅ H (m. n) ⋅ H * (m. n) ⋅ H * (m. n) + j ⋅ F "* (m.

n ) ⋅ F " ( m.35) şi (5. iar rezolvarea sa se poate face prin metode numerice. Sistemul format din relaţiile (5. n) ⋅ H * (m. constituite de λ plus necunoscutele lui F (m.35) şi (5. n) − F (m. n) ⋅ H (m. n) 2 2 = G ( m.36) este neliniar. n) = L ⋅ K ⋅ E z = T L K 2 (5. n) + λ ⋅ H (m. n) . n) C (m. n) + λ ⋅ H (m. n ) (5.36) formează un sistem cu L×K+1 ecuaţii cu ˆ L×K+1 necunoscute. n =1 ˆ ∑ ∑ F " (m. S-a arătat că: m=1.= λ ⋅ F " (m. în număr de L×K. n) 2 2 (5. n ) C (m.34) ⇒ G (m. cu necunoscuta λ. n) = λ ⋅ H * ( m.36) Relaţiile (5. acesta fiind dezavantajul filtrului invers cu constrângeri. 129 .35) G este funcţia de transfer a filtrului de restaurare.

1. Transformarea Hit or Miss Transformarea morfologică de bază este transformarea “Hit or Miss”. 130 . transformările morfologice (care sunt neliniare şi neinversabile) se bazează pe compararea imaginii (sau a unui obiect conţinut în imagine) cu un obiect mai mic. ce ar putea fi numită şi “Totul sau Nimic” (sau “Ochit sau Ratat”. În urma acestei comparaţii sunt extrase din imaginea iniţială zonele ce corespund proprietăţilor (de formă şi dimensiune) specifice elementului structurant folosit. într-o traducere cuvânt cu cuvânt. Efectul aplicării acestei transformări de identificare este extragerea din imagine a punctelor a căror vecinătate este identică cu elementul structurant folosit. Transformarea “Hit or Miss” a mulţimii A prin elementul structurant B se defineşte ca fiind: A ∗ B = x | ( B1 ) x ⊂ A & ( B2 ) x ⊂ A c { } (6. Morfologie matematică Morfologia matematică (în limba greacă morphos = formă.1) unde: A c este complementara mulţimii A. recunoaşterea unei forme implică identificarea locală a părţilor sale componente. de formă cunoscută. deci o simplă operaţie de potrivire de măşti ("pattern matching"). numit element structurant. logos = ştiinţă. din limba engleză). deci ştiinţa formelor) constă într-o abordare bazată pe formă. numite elemente structurante.6. De exemplu. Ideea de bază a unei prelucrări morfologice este considerarea imaginii ca un ansamblu (mulţime. 6. reuniune de puncte sau obiecte) asupra căruia se aplică transformări a căror esenţă este comparaţia cu mulţimi mai simple. a prelucrării imaginilor. Prin urmare.

B1 = x x • • • x x x ⊗ • • • • • • A=• x x x x x x x • x x x • • • • • • • A este reprezentată de punctele marcate cu x.B1 şi B2 formează o partiţie netă a B1 ∪ B2 = B şi B1 ∩ B2 = Φ . x B Bx x Figura 6. Trebuie specificat faptul că oricărui element structurant trebuie să i se ataşeze o origine. lui B.2) B x = {b + x b ∈ B}= translaţia mulţimii B cu vectorul x. Translaţia mulţimii B cu vectorul x. 131 . iar cu “•” au fost marcate punctele care aparţin fundalului. sau y translaţia mulţimii B cu originea.1).1. Exemplu: Să se efectueze transformarea “Hit or Miss” a mulţimii A prin elementul structurant B. unde: originea lui B originea nu aparţine lui B2 x x • • x • x x x ⊗ • x • x . B2 = x • • . în punctul x (figura 6. B = x x • . adică: (6.

2. Mulţimile considerate pot fi continue sau discrete. adică B). Erodarea unei mulţimi A prin elementul structurant B este mulţimea punctelor. subţiere care depinde de structura elementului structurant. Efectul general al erodării este acela de subţiere a corpurilor. Pe baza acestei transformări se pot defini operaţiile morfologice fundamentale (erodarea şi dilatarea). Transformarea “Hit or Miss” prezintă un interes mai mult teoretic.3) După cum se observă din definiţie. Exemplu: .Rezultatul transformării este dat de cele 2 puncte marcate (încercuite) pe mulţimea A (punctele peste care se suprapun perfect B1 şi B2 . pentru care elementul structurant translatat cu originea în punctul respectiv este inclus în mulţimea ce se erodează. erodarea se poate obţine ca un caz particular al transformării “Hit or Miss” şi anume pentru B2 = ∅ şi B1 = B . Rezultatul transformării se numeşte erodata (sau eroziunea) mulţimii A prin elementul structurant B. 6.în cazul mulţimilor continue: Dacă: 132 . Erodarea Erodarea mulţimii A prin elementul structurant B se defineşte ca:   AΘB = x (B ) x ⊂ A =  A ∗ B B2 =∅    B1 = B   { } (6. dar datorită structurii sale stă la baza construcţiei teoretice a morfologiei matematice.

B= A= ⇒ AΘB= A= ⇒ AΘB= . 133 .în cazul mulţimilor discrete: • • AΘB = x • • • x x ⊗ ⊗ x x • x x • x B=x x x x • • x • • ⊗ ⊗ x AΘB = ⊗ ⊗ ⊗ x • ⊗ x • B= x x A este reprezentată de punctele marcate cu x. iar cu “•” au fost marcate punctele care aparţin fundalului. Punctele încercuite sunt rezultatele erodării AΘB.

în cazul mulţimilor continue: B= A= A ⊕ B= A= A ⊕ B= 134 .4) Dilatarea unei mulţimi A prin elementul structurant B este mulţimea punctelor pentru care elementul structurant deplasat cu originea în punctul respectiv are puncte comune (cel puţin unul) cu mulţimea A ce se dilată.6. Dilatarea Dilatarea unei mulţimi A prin elementul structurant B se defineşte prin relaţia:   A ⊕ B = {x | ( B ) x ∩ A ≠ ∅} =  A * B | B1 =∅    B2 = B   C (6.3. Exemplu: . Rezultatul transformării se numeşte dilatată (sau dilatarea) mulţimii A prin elementul structurant B. Transformarea poate fi aplicată atât pe mulţimi continue. Efectul general al operaţiei de dilatare este acela de îngroşare a obiectelor. cât şi pe mulţimi discrete.

5) ( AΘB ) ⊕ B ≠ A Dilatarea este o operaţie extensivă (A ⊆ A ⊕ B). Punctele încercuite reprezintă rezultatele dilatării A ⊕ B . iar cu “•” au fost marcate punctele care aparţin fundalului..în cazul mulţimilor discrete: • • x A⊕ B = • • • Θ • Θ ⊗ Θ • • x B=x x x • Θ ⊗ ⊗ ⊗ Θ Θ ⊗ ⊗ ⊗ ⊗ Θ • • • Θ ⊗ Θ Θ • Θ • • • • • • • • • B= x x • A⊕ B = • • Θ ⊗ • • Θ ⊗ ⊗ ⊗ • Θ ⊗ ⊗ ⊗ ⊗ • • Θ ⊗ • • • A este reprezentată de punctele marcate cu x. Dilatarea şi erodarea nu sunt transformări inverse una alteia (şi nici nu admit inversă): ( A ⊕ B )ΘB ≠ A (6. vecinătatea V4 şi vecinătatea V8 : x V4 = x x x x x V8 = x x 135 x x x x x x . Elementele structurante clasice sunt variantele discretizate ale discului unitar. în timp ce eroziunea este o operaţie antiextensivă (A ⊇ AΘB) numai în cazul folosirii elementelor structurante ce îşi conţin originea.

8) 136 . iar Ab este translaţia mulţimii A în punctul b.î . Proprietăţile operaţiilor morfologice 1.7) b∈B S 6. a. pentru dilatare se obţine: A ⊕ B = {x | B x I A ≠ ∅} = U Ab (6. ∃a ∈ A. deoarece este evident că aplicarea transformărilor morfologice implică verificarea condiţiilor de definiţie pentru fiecare punct al imaginii (evitând evidentele efecte de margine).î .4. Astfel. În mod similar. Aceasta se poate obţine prin rescrierea operaţiei de erodare: AΘB = {x ∀b ∈ B. Pentru evitarea sau micşorarea complexităţii calculelor ar trebui găsită o metodă care să nu implice verificarea fiecărui punct al imaginii. a.6) unde B-S=-B este simetrica mulţimii B faţă de origine. iar la sfârşit se face intersecţia rezultatelor acestora.Dilatarea şi erodarea sunt operaţii intensive din punct de vedere matematic. deci complexitatea algoritmică este comparabilă cu a unei operaţii de filtrare în domeniul spaţial. Invarianţa la translaţie: At ⊕ B = ( A ⊕ B )t At ΘB = ( AΘB )t (6. x = a − b} = I A−b = I Ab b∈B b∈B S (6. b + x = a}= {x ∀b ∈ B. ∃a ∈ A. ci eventual fiecare punct al structurantului. se fac operaţii mult mai puţine şi în plus se permite implementarea paralelă deoarece fiecare translaţie se poate face pe unităţi diferite.

λ ∈ [0.A ⊕ Bt = ( A ⊕ B )−t În acest caz intervine semnul ”-” deoarece în definiţia erodării şi dilatării intervine mulţimea simetrică AΘBt = ( AΘB )−t 2.11) ( A ⊕ B )ΘB ≠ A 5.10) Această dualitate se manifestă faţă de operaţia de complementare a mulţimilor. Invarianţa la scalare: 1 A ⊕ B = (λ ⋅ A ⊕ B ) λ (6. Descompunerea elementului structurant: ( A ⊕ B ) U ( A ⊕ C ) = A ⊕ (B U C ) (6.13) ( AΘB )ΘB = AΘ2 B . Proprietatea de iterare: ( A ⊕ B ) ⊕ C S = A ⊕ (B ⊕ C ) ( AΘB )ΘC S = AΘ(BΘC ) Caz particular: B=C . B=BS ⇒ ( A ⊕ B ) ⊕ B = A ⊕ 2B . 137 (6.1] 3. Erodarea şi dilatarea sunt transformări duale una alteia: A ⊕ B = AC ΘB )C C AΘB = (AC ⊕ B ) ( (6.9) AΘB = 1 λ (λ ⋅ AΘB ) . Dilatarea şi erodarea nu sunt inverse una alteia şi nici nu admit inversă: ( AΘB ) ⊕ B ≠ A (6.12) ( AΘB ) I ( AΘC ) = AΘ(B U C ) 6. 4.

Operatori de extragere a conturului Dintre extractoarele morfologice de contur.5.15) (6. (6.16) • • • • A= AΘB • • x x • • x • • • • B=x x x x x • • • • • • ⊗ x • x • • • • • • x ⊗ ⊗ x • δA = conturul interior ∆A = conturul exterior 138 . 6.14) unde ”-” reprezintă diferenţa între mulţimi. • conturul interior: δA = A − ( AΘB ) • gradientul morfologic: gradA = ( A ⊕ B ) − ( AΘB ) Exemplul 1: (6.1. cele mai utilizate sunt: • conturul exterior: ∆A = ( A ⊕ B ) − A . Transformări morfologice derivate Prin iterarea unor operaţii morfologice de bază se obţin transformări morfologice mai complexe.5. numite şi transformări morfologice derivate sau filtre morfologice.6.

gradientul morfologic va fi reuniunea celor două contururi. structurantul este simetric după o singură direcţie. din cazul anterior. trebuie utilizate elemente structurante direcţionale. corespunzător direcţiei de simetrie. Exemplul 3: • • • A= • • • • • • • • • x • • • x x x • B= x x x x x x • • x x • • δA = conturul interior • • • • • • ∆A = conturul exterior În acest caz. conturul va fi mai subţire. 139 . Exemplul 2: • • • • • • • • • A= • • x • x x x • • x x x • x • B=x x x • • x x • • • • • • • • ∆A = conturul exterior δA = conturul interior În acest caz.În acest caz (structurant simetric). Prin urmare. pentru obţinerea de contururi direcţionale. Cu cât structurantul este mai mic. structurantul este asimetric şi se pierde conturul exterior.

Din punct de vedere al acţiunii asupra obiectelor (figura 6. Ilustrarea efectului deschiderii şi închiderii morfologice.18) Închiderea este operaţia duală deschiderii faţă de complementarea mulţimilor: 140 . Închiderea mulţimii A prin elementul structurant B este: A • B = ( A ⊕ B )ΘB S (6. eliminarea obiectelor mici (mai mici decât elementul structurant folosit). netezirea contururilor prin teşirea convexităţilor şi separarea obiectelor unite prin “istmuri” (zone) mai mici decât dimensiunea elementului structurant.2).6. deschidere închidere Figura 6. Mulţimea rezultată după o deschidere este diferită de mulţimea originală.2.2.5. în urma unei deschideri rezultă (efectul deschiderii este reprezentat cu linie punctată) o lărgire a golurilor înglobate în obiect. reprezintă mulţimea simetrică a mulţimii B faţă de origine (se mai numeşte şi transpusa mulţimii B).17) B S = − B = {x − x ∈ B}. Deschiderea şi închiderea Deschiderea mulţimii A prin elementul structurant B se defineşte ca fiind: A o B = ( AΘB ) ⊕ B S unde (6.

.2) poate fi găsit prin complementare.19) Datorită acestei proprietăţi de dualitate.. Deschiderea este o operaţie antiextensivă ( A o B ⊆ A) .. deschiderea şi închiderea sunt transformări idempotente. 141 .20) După cum s-a arătat. Prin urmare. ⊕ B (de k ori). cu acelaşi element structurant. închiderea şi deschiderea sunt de fapt nişte filtre deoarece au un efect de netezire a formelor. nu mai produc modificări: (A o B) o B = A o B (A • B) • B = A • B (6. închiderea va avea asupra fundalului aceleaşi efecte pe care le are deschiderea asupra obiectelor. Filtrele alternate secvenţial constau în deschideri şi închideri alternate succesiv. în timp ce închiderea este o transformare extensivă ( A • B ⊇ A) . adică închiderea va umple golurile înglobate în obiecte.(AC • B )C = ((AC ⊕ B )ΘB S )C = (( AΘB )C ΘB S ) = ( AΘB ) ⊕ B S = A o B (AC o B)C = ((AC ΘB)⊕ B S )C = (( A ⊕ B)C ⊕ B S ) = ( A ⊕ B)ΘB S = A • B (6. Mărirea gradată a elementului structurant folosit şi aplicarea alternativă a deschiderii şi închiderii (pentru a beneficia de efectele lor complementare) a dus la definirea filtrelor alternate secvenţial (FAS): FAS ( A) = ((((( A o B ) • B ) o 2 B ) • 2 B ) o 3B ) • 3B.21) unde: k ⋅ B = B ⊕ B ⊕ B. Pentru o netezire mai puternică se foloseşte un structurant mai mare. (6. cu elemente structurante de dimensiune crescătoare. va netezi contururile prin umplerea concavităţilor şi va fuziona obiectele foarte apropiate (umplerea strâmtorilor de dimensiuni mai mici decât a elementului structurant). adică iterarea deschiderilor sau închiderilor succesive. În acelaşi timp.. efectul închiderii asupra obiectelor (reprezentat cu linie îngroşată în figura 6.

Trierea dimensională a obiectelor Cu ajutorul transformărilor morfologice se poate realiza şi trierea dimensională a obiectelor.22) Rezultatul aplicării acestei transformări este o imagine ce conţine toate punctele eliminate de deschiderea imaginii prin elementul structurant folosit.Aplicarea FAS poate fi oprită în orice moment. pentru extragerea formei exacte a obiectului trebuie realizată o operaţie de reconstrucţie.24) 142 . Există şi varianta transformării de tip “Top Hat” generalizată: TH g ( A) = ( A o n1 B ) − ( A o n2 B ) .6. După cum se poate observa. Transformarea de tip “Top Hat” (TH) a mulţimii A prin elementul structurant B se defineşte ca: TH ( A) = A − ( A o B ) (6. interactivă a imaginii. Dar. Aceasta se obţine prin utilizarea transformării “Top Hat”. transformarea “Top Hat” are efect invers celui al unei site: păstrează obiectele mai mici. deci. n 2 > n1 (6. obţinându-se astfel o netezire gradată. 6. prin deschidere. obiectele nu îşi mai păstrează forma iniţială.23) Transformarea “Top Hat” simplă se obţine ca un caz particular: TH ( A) = THg ( A) n1 =0 n2 =1 (6.

7. 143 . iar “Top Hat” generalizat se comportă ca un filtru de tip trece-bandă (ne permite să obţinem obiecte cu dimensiune cuprinsă între n1 B şi n2 B ). care poate implica două aspecte: extragerea de informaţii asupra formei date sau compararea formei respective cu o altă formă (etalon). Caracterizarea morfologică a formelor Cu ajutorul transformărilor morfologice se poate realiza şi caracterizarea morfologică a formelor. 6.Exemplu: ~4B ~2B A= ~B (obiecte cu dimensiuni mai mici decât B) TH(A)= A − ( A o B) Ao B = A o 2B = TH(A)= A − ( A o 2 B) Se observă că transformarea “Top Hat” simplă se comportă ca un filtru de tip trece-sus.

144 . Metoda de etichetare trebuie să fie cât mai rapidă. Reconstrucţia după markeri. poate fi descrisă prin următoarea relaţie: ϕ M (I ) = U I j (6.7. pentru a putea fi comparată cu markerii. O modalitate de determinare a unor markeri este de a utiliza transformarea Top Hat. Reconstrucţia după marker Reconstrucţia (φ) unei imagini (I) pe baza unor markeri (M).3.1. O problemă care se pune în cazul reconstrucţiei după markeri este etichetarea imaginii.25) I j I M ≠∅ Reconstrucţia imaginii I după markerul M este egală cu intersecţia elementelor Ij ale elementelor conexe ale imaginii I cu proprietatea că intersecţia lor cu markerul este nevidă.6. I1 Ik IN Imaginea I Markerii M IN I1 Figura 6.

Extragerea skeletonului morfologic se bazează pe conceptul de disc maximal inclus într-o mulţime (A).3. Extragerea skeletonului morfologic Un concept important în prelucrarea şi analiza imaginilor. este şi greu de calculat şi din acest motiv se foloseşte mai rar în practică. se defineşte o distanţă între obiecte şi se impune ca distanţa să fie cât mai mică.7. îl constituie skeletonul morfologic. se compară obiectul dat cu un obiect martor. cu aplicaţii la compresia imaginilor binare. În plus. Distanţa Hausdorff dintre mulţimile K1 şi K2.27) Distanţa Hausdorff este o măsură bună a asemănării obiectelor doar dacă acestea sunt centrate.7. aproximarea şi reconstrucţia formelor.2. în domeniul continuu se defineşte ca fiind: d ( K1 .26) În domeniul discret. K 2 ) = inf {n K1 ⊆ K 2 ⊕ n ⋅ B & K 2 ⊆ K1 ⊕ n ⋅ B} (6. Distanţa Haussdorf Pentru a se compara sau calcula asemănarea dintre două obiecte.28) . se defineşte discul maximal Br(x) de centru x şi rază r. pentru o mulţime binară plană închisă A. K 2 ) = inf {ε K1 ⊆ K 2 ⊕ ε ⋅ B & K 2 ⊆ K1 ⊕ ε ⋅ B} (6. 6. distanţa Hausdorff dintre mulţimile K1 şi K2 este: d ( K1 . prin relaţia:  x = x' B r ( x ) ⊆ Br ' ( x ' ) ⊆ A ⇔  r = r ' 145 (6.6. recunoaşterea. Astfel. îndeosebi la recunoaşterea formelor.

În practică se foloseşte formularea echivalentă: SK ( A) = U S n ( A) . y ) = max i x − i y . discul unitar este V8. j) este: d i ( x. discul unitar este V4. iar Sn(A) se numesc seturi skeleton de ordinul n: S n ( A) = ( AΘnB ) − [( AΘ(n + 1)B ) ⊕ B ] = ( AΘnB ) − [( AΘnB )o B ] (6. poate fi V4 sau V8.31) Exemplu: Se dă mulţimea A şi elementul structurant B: x x A= x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x . Exemplul unei mulţimi A şi a uni element structurant B.Aceasta însemnă că discul maximal este inclus în mulţimea A şi nu există nici un alt disc inclus în A care să-l conţină Skeletonul morfologic al unei forme este egal cu reuniunea centrelor discurilor maximale incluse în forma respectivă. în funcţie de metrica utilizată în spaţiul discret. pentru punctul de coordonate (i. B=x x x x Figura 6. n =∅ N max (6. j x − j y ( ) (6.30) Discul unitate. astfel: • dacă se utilizează distanţa euclidiană. Distanţa inter-bloc.4. 146 . B. • dacă se utilizează distanţa inter-bloc.29) unde SK(A) este skeletonul mulţimii A.

N max n =∅ ⇒ N max = 2 . În mod similar: S1 ( A) = ( AΘ B ) − [( AΘ2 B ) ⊕ B ].35) S 2 ( A) = ( AΘ2 B ) − [( AΘ3B ) ⊕ B ] S 3 ( A) = ( AΘ3B ) − [( AΘ4 B ) ⊕ B ] = ∅ . Setul skeleton de ordinul 3 al mulţimii A din figura 6.34) (6.5. Setul skeleton de ordinul 0 al mulţimii A din figura 6.punctele încadrate = ( AΘB ) ⊕ B Figura 6.33) (6.32) . pentru exemplul prezentat. ⇒ SK ( A) = U S n ( A) x x SK ( A) = x x x x x x x x x x x x x x (6.6.4.36) Figura 6.punctele îngroşate: S 0 ( A) = A − ( AΘB ) ⊕ B x x ⊗ ⊗ ⊗ ⊗ x x x ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ x x x x x x x x x ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ .4.Setul skeleton de ordinul 0 este: S 0 ( A) = A − [( AΘ B ) ⊕ B ] : x x x S 0 ( A) = x x x x x x x (6. 147 . unde AΘ2 B = ( AΘB )ΘB (6.punctele încercuite = AΘB .

7. skeletonul unui disc este centrul său.4. Seturile skeleton al mulţimii A din figura 6. o reconstituire aproximativă Ã a formei A se poate face eliminând detaliile fine. pentru fiecare punct al skeletonului. Detaliile fine sunt conţinute în seturile skeleton de ordin mic. iar skeletonul unui pătrat este format din diagonalele sale (figura 6. Skeletonul morfologic este o transformare reversibilă.Se observă că skeletonul unui obiect are mai puţine puncte decât obiectul.37) Se observă că pentru a putea reconstitui forma iniţială. atunci au aceeaşi formă. adică se poate obţine forma iniţială A.38) În cazul continuu. cunoscând skeletonul acesteia: A = U (S n ( A) ⊕ nB ) n =0 N max (6. Dacă 2 obiecte au skeletoanele identice. 148 . adică seturile skeleton de ordin mic: Ã= U (S n ( A) ⊕ nB ) n=k N max (6. iar cele grosiere în seturi skeleton de ordin mare.8). trebuie menţionat setul skeleton căruia îi aparţine: 0 1 1 SK ( A) = 0 1 1 0 1 1 2 2 0 0 1 1 0 Figura 6. Deci.

Fie {E n } un set de mulţimi având perioada T. Skeletonul unui disc lipsit de centru său.x Figura 6. Skeletoanele unor forme continue cunoscute. adică: E n+ kT = E n .7. De exemplu. Figura 6. Utilizarea skeletonului morfologic pentru recunoaşterea formelor este restricţionată de puternica sa sensibilitate la zgomote. 6. Skeletonul generalizat Skeletonul generalizat (GSK) este definit prin elemente structurante generalizate. deoarece o mică schimbare a formei duce la o modificare puternică a skeletonului său.9). pe baza relaţiilor: = elementul structurant de ordin 0 (originea)  B0 = {0 n } (6.39)   Bn = Bn −1 ⊕ E n = elementul structurant de ordin n 149 .4.9. Pe baza acestui set generator (constructor) se poate construi un set de elemente structurante generalizate.8. k ∈ Ζ . ∀n. skeletonul unui disc lipsit de centru se transformă dintrun punct într-un cerc (figura 6.

43) { ( )x ( )y } 150 ..42) A= x x x x x x x x x x x x x x x x x x x x x Skeletonul generalizat al unei forme este mulţimea centrelor elementelor structurante maximale incluse în formă. dacã x ∉ A D(x ) =  n . dacã (Bn-1 ) x ⊂ A si (Bn ) ⊄ A Exemplu: x x x x x x (6. ∀x ≠ y (6.Exemplu: Pentru: T=1 şi E1 = x x x x x x x x x x x x B3 = ..40) x x x x x x x x ⇒ B0 = x B1 = x x x x x x x B2 = x x x x x x Pentru extragerea skeletonului morfologic trebuie construită o hartă de distanţe a obiectului. adică: GSK ( A) = x | B D ( x )−1 ⊄ B D ( y )−1 . adică fiecărui punct al obiectului (mulţimii) i se ataşează ordinul elementului structurant generalizat maximal centrat în punctul respectiv: 0 . (6.41) x x x x x x x x x x x x x D= 4 3 2 1 4 3 2 1 4 3 2 1 4 3 2 1 3 3 3 3 3 3 2 1 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 (6.

8....4 3 2 1 4 3 2 1 GSK( A) = 3 2 1 3 2 1 4 3 2 1 4 3 2 1 3 3 3 3 2 1 2 2 2 2 2 1 1 1 1 1 1 1 4 3 2 1 4 3 2 1 4 3 2 1 = 4 3 2 1 3 3 3 3 3 3 2 1 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 (6. n ) A( 1.x 2 .45) { 14 24 3 4 4 domeniu spatial sup rafata A( n . Extinderea morfologiei matematice la imagini cu niveluri de gri Prin extinderea morfologiei matematice la imagini cu niveluri de gri se realizează trecerea de la mulţimi la funcţii şi invers.44) După cum se observă.x n−1 . x n ) (6. Pentru aceasta se consideră o mulţime A inclusă în mulţimea părţilor lui Zn. În ultima figură punctele încercuite reprezintă punctele suficiente pe baza cărora se poate reconstitui forma iniţială.n −1 ) 151 . skeletonul generalizat conduce la obţinerea unei rate de compresie mai bune decât în cazul skeletonului morfologic (exemplele prezentate pun în evidenţă acest fapt: skeletonul morfologic e alcătuit din 16 puncte în timp ce skeletonul generalizat conţine doar 7 puncte).. 6. exemplificându-se astfel că skeletonul generalizat nu este minimal din punct de vedere al ratei de compresie. Un element al acesteia este de forma: x = ( x1 .

7. x 2 ) = (i. Pentru n=2 avem o mulţime planară: ( x1 .10. iar j = suprafaţa. Trecerea de la mulţime la funcţie Transformarea prin care se realizează trecerea de la o mulţime A la o funcţie f se numeşte vârf (în engleză Top): T [ A] = f .46) (6.1. n − 1) → A(n. n) unde z ∈ A(1. unde f : A(1.48) Dacă alegem i = domeniul spaţial.47) f ( z ) = max{y ( z . y ) ∈ A} .6. 152 . Topul unei mulţimi. topul s-ar obţine prin fixarea z ∈ A(1.n-1) Figura 6. n − 1) şi ar arăta ca în figura: j x x x xxxx xxxxxx i Se fixează z∈A(1. n − 1) (6. j ) (6.

y ) . A(n. f ( z) ≥ y ≥ λ  y. n) ⊂ Z  y  (6. A(n. n − 1) U λ [ f ] = ( z .6.11. Umbra unei funcţii.2.49) (6. unde f : A(1. se poate introduce o limitare.8. n − 1) U [ f ] = ( z . n)  Exemplu: j x x x xxxx xxxxxx xxxxxx xxxxxx xxxxxx xxxxxx xxxxxx i umbra unei funcţii este semiinfinită Figura 6.52) 153 .50)  z ∈ A(1. la un nivel λ:   z ∈ A(1. Trecerea de la funcţie la mulţime Transformarea prin care se realizează trecerea de la o funcţie f la o mulţime A se numeşte umbră: U[ f ] = A. n − 1) ⊂ Z n−1 → A(n. n)   ⇒ U [ f ] = lim U λ [ f ] λ →∞ (6. f ( z) ≥ y .51) (6. y ) . Deoarece umbra unei funcţii este o mulţime semiinfinită.

Lucrul cu funcţii Dilatarea unei funcţii f cu un structurant (sau funcţie structurant) g: f ⊕ g = T [U [ f ] ⊕ U [ g ]] (6. deoarece umbra unei funcţii este o mulţime semiinfinită 6. Exemplu: y∈supp ( g ) suppV4: toate punctele lui V4 dar şi cele de sub V4 (până la -∞) aparţin suportului.Proprietăţi: 1. T [U [ f ]] = f (6.55) În mod similar.53) (6. 154 .58) fΘg = inf( f ( x − y ) − g ( y )) unde supp ( g ) = {y g ( y ) > −∞}. reprezintă suportul lui g.57) (6.54) 2.56) Acestea sunt: f ⊕ g = sup( f ( x − y ) + g ( y )) .8. y∈supp ( g ) (6. U [T [ A]] ⊇ A .3. se poate defini erodarea unei funcţii f cu un structurant (sau funcţie structurant) g: fΘg = T [U [ f ]ΘU [ g ]] (6.

pot să apară situaţii când valoarea minimă (min) şi maximă (max) nu sunt cuprinse în gama de niveluri de gri. Suportul plat (engl. pentru niveluri de gri cuprinse în intervalul [0.61) y∈supp ( g ) y∈supp ( g ) min În cazul în care se utilizează un structurant non-flat. se rescalează domeniul. Suportul lui V4.12.60) (6. flat) a funcţiei g se defineşte astfel: g ( y ) = 0. păstrându-se nivelul relativ de gri: 155 . În acest caz: f ⊕g = fΘg = max ( f ( x − y )) ( f ( x − y )) (6.N-1].x x x x x Figura 6. în cazul exemplului de mai sus. În acest caz. există două alternative: 1. ∀y ∈ supp ( g ) .59) adică nu mai avem punctele de sub V4. (6. adică sunt mai mici decât 0 sau mai mari decât N-1.

2. n). k∈[0.14.63) (6. în acest fel pierzându-se informaţie. n) =   f 2 (m. Astfel de elemente structurante pot fi utilizate la îmbunătăţirea contrastului imaginilor. Rescalarea domeniului. n).64) 156 . n) > kf1 + (1 − k ) f 2 f(t) f1 f2 t pentru k=0 sau 1 f (6. Pentru f1 ≤ f ≤ f 2 :  f1 (m. Îmbunătăţirea contrastului imaginilor. n) ≤ kf1 + (1 − k ) f 2 . O îmbunătăţire a performanţelor se obţine luând: f1 = f o g şi f 2 = f • g sau f1 = fΘg şi f 2 = f ⊕ g (6. f (m.1] f ' (m. se limitează valorile negative la 0 şi cele mai mari ca N-1 la N-1.13.0 N-1 N-1+k1 N-1+k2 Figura 6.62) pentru k = 1 2 Figura 6. f (m.

7. fundal etc) în scopul analizei lor ulterioare şi eventual al clasificării lor. astfel încât să se pună în evidenţă regiuni caracterizate de o relativă uniformitate. Zonele astfel determinate permit în ultimă instanţă o separare a obiectului ce trebuie analizat de fundalul imaginii şi de eventuale alte obiecte aflate în scenă. Metodele de segmentare a imaginilor se pot clasifica în două mari clase: • • segmentare orientată pe regiuni segmentare orientată pe contururi 7. În urma procesului de segmentare. metode de segmentare bazate pe histograma imaginii. 157 . Segmentarea orientată pe regiuni Prin detecţia regiunilor omogene se înţelege gruparea pixelilor din imagine în categorii distincte în funcţie de proprietăţile lor (de exemplu nivelul de gri). Tehnicile de segmentare orientate pe detecţia regiunilor omogene se pot clasifica în: • • • metode bazate pe etichetarea grupurilor conexe de pixeli cu caracteristici similare. obiecte distincte sau regiuni omogene care satisfac anumite criterii de uniformitate.1. Segmentarea imaginilor Segmentarea reprezintă o categorie de tehnici de prelucrare care permite descompunerea unei scene în componentele sale sau extragerea din imagini a unor elemente constituente de interes (obiecte. din imagine se extrag regiuni omogene închise de puncte de frontieră (contur). tehnici de creştere şi fuziune a regiunilor.

i se atribuie o nouă etichetă. stânga.1. tuturor punctelor unui obiect conex.1. Dacă are doi (sau mai mulţi) vecini cu etichete diferite i se atribuie eticheta cu valoarea cea mai mică. iar numărul de baleieri depinde de conţinutul imaginii. jos. Baleierea se repetă până nu se mai schimbă nimic. stânga-dreapta) şi inverse a imaginii de segmentat. 158 . dacă are. Se continuă baleierea până la întâlnirea unui alt punct.1. Metoda bazată pe etichetarea componentelor se implementează prin succesiuni de baleieri normale (sus-jos. dreapta. 1 1 1 1 1 3 2 2 2 2 2 1 1 1 1 1 2 2 2 2 2 2 Figura 7.7. respectând algoritmul de mai sus. Etichetarea componentelor. La întâlnirea unui punct al unui obiect care nu are nici un punct vecin deja etichetat. Decizia cărui obiect îi aparţine se face la baleierea inversă.2). căruia i se atribuie eticheta vecinului (sus. Dezavantajul acestei tehnici este că nu asigură obţinerea etichetelor în ordine (figura 7. diagonală). Etichetarea componentelor Această metodă de segmentare a imaginilor binare constă în asocierea unui acelaşi număr (numit etichetă).

de lungime 3 X X X X II (1. X X X X X X I (2. (7. se analizează imaginea. 159 . în care fiecare nod terminal are patru descendenţi.1111 4444 2222222 Figura 7. care se mai numeşte şi "Divide şi contopeşte".2) – pe linia II există un obiect pe poziţia 1. Exemplu de segmentare prin analiza conexităţii pe secvenţe. Pentru a implementa această metodă. de lungime 3 X X IV (5.2.2.3). (6. În etapa următoare se analizează adiacenţa secvenţelor pentru a defini obictele. de lungime 2 Figura 7. pe linii. Metoda aborelui cuaternar (quad-tree) Această metodă. Acestei împărţiri i se poate asocia un arbore cuaternar. Exemplu de rezultat al segmentării prin etichetarea componentelor.1. se bazează pe împărţirea recursivă a imaginii în câte 4 regiuni sau sferturi de imagine până la obţinerea de regiuni uniforme sau regiuni formate dintr-un singur pixel. 7.3. linie cu linie şi se etichetează punctele obiectelor.3) – pe linia III există un obiect pe poziţia 5.2) – pe linia IV există un obiect pe poziţia 5.3). de lungime 3 X X X III (5. O altă tehnică de a implementa metoda de etichetare a componentelor se bazează pe analiza conexităţii pe secvenţe.2) – pe linia I există un obiect pe poziţia 2.

În continuare se concatenează zonele ce conţin „1” logic. Împărţirea imaginii la segmentarea prin metoda arborelui cuaternar.Figura 7.5. 160 . Segmentarea se face prin împărţirea succesivă până se obţine zone uniforme sau s-a ajuns la nivel de pixel. imaginea trebuie să fie pătrată şi de dimensiune putere a lui 2. Nodul principal este constituit de întreaga imagine. rezultând obiectele.4. iar nodurile secundare reprezintă câte un sfert de imagine. Împărţirea imaginii se repetă până când se obţin numai careuri uniforme (care conţin aceeaşi valoare). Principiul segmentării prin metoda arborelui cuaternar. Figura 7. Pentru a implementa segmentarea prin metoda arborelui cuaternar.

daca T1 ≤ u(i. Cea mai generală metodă de tresholding (multi-nivel) constă în alegerea unui număr N de praguri T1. adică pe numărul de apariţii a nivelurilor de gri. pe baza imaginii iniţiale u. Împărţirea imaginii la segmentarea prin metoda arborelui cuaternar şi concatenarea zonelor cu aceeaşi valoare. daca T ≤ u(i. Segmentarea imaginilor cu niveluri de gri 7.j) ≤ T  2 3 v(i. Valorile caracteristice de amplitudine corespunzătoare obiectelor sunt alese astfel încât un interval dat de niveluri de gri să reprezinte o clasă unică de obiecte.X X X X X X X X X XX XX XX X X X X Figura 7. Segmentarea bazată pe histogramă Aceste metode se bazează pe histograma imaginilor. … TN şi crearea unei imagini de etichete v..1) 161 . daca TN-1 ≤ u(i.2.j) ≤ T2 eticheta 2 . 7. astfel: eticheta 1.j) ≤ TN  (7.2. j ) =  . Tehnicile de segmentare bazate pe prăguirea (“tresholding”) histogramelor sunt utile şi eficiente atunci când există o separare relativ clară a nivelurilor de gri între obiectele analizate. T2. eticheta N.1.6..

punctelor cu valori cuprinse între [T1. Dacă aceste minime nu sunt bine reliefate.Numărul de apariţii α T1 β T2 γ T3 Nivelul de gri Figura 7. unde i reprezintă numărul pragurilor luate în considerare) vor corespunde minimelor histogramei (unde avem un număr mic de pixeli cu valoarea respectivă). În exemplul prezentat. nu L. de regulă. deci pragurile de segmentare se pot alege mai uşor. Această distincţie poate fi făcută pe baza laplacianului. Etichetele alocate sunt.T2] li se va atribui eticheta β etc.T1] li se va atribui eticheta α. ci valoarea 1/(1+|L|).7. numere întregi. Se porneşte de la ideea că obiectele identice cu acelaşi nivel de gri. au cam aceleaşi valori maxime în histogramă. pragurile filtrării (Ti. Prin urmare. mărirea contrastului). se poate aplica fie o filtrare a imaginii (înlăturarea zgomotului. care să ia în considerare doar pixelii care se află pe platouri de intensitate (şi nu în regiuni de tranziţie). dacă sunt bine reprezentate. Pe histograma ponderată minimele apar mai bine reliefate. 162 . punctelor cu valori cuprinse între [0. care trebuie detectate. Segmentarea bazată pe prăguirea histogramei. unde L este valoarea laplacianului calculat pe o vecinătate a punctului respectiv. fie se poate construi o histogramă ponderată. Pragurile de segmentare se aleg. în general ca fiind minimele histogramei. deci nivelurile de gri cele mai slab reprezentate în imagine. iar histograma ponderată sumează pentru fiecare pixel cu nivelul de gri.

pragul optim de segmentare pentru o imagine cu două tipuri de obiecte (corpuri şi fundal) depinde de caracteristicile statistice ale zgomotului şi ale obiectelor. după formula: Pob nob + n f 1 − Pob T= − d 2 ⋅ ln (7. iar d2 este varianţa zgomotului aditiv Gaussian de medie nulă.2) 2 nob − n f unde nob este nivelul mediu de gri a obiectelor. prin numărarea etichetelor care ne interesează. la numărarea nucleelor. aplicat imaginii. de exemplu pentru numărarea nucleelor de un anumit tip dintr-o imagine. Dezavantajul metodei este că vor fi luate în considerare şi zgomotele care au acelaşi nivel de gri. Figura 7.8. Exemplu din medicină. În acest caz.Dacă pentru imagine (şi obiectele conţinute în aceasta) se dispune de informaţie suplimentară (de tipul unei caracterizări statistice a conţinutului imaginii şi a modului de degradare a acesteia) este posibilă o abordare derivată din teoria deciziilor optimale. Ca domeniu de aplicaţii s-ar putea aminti medicina. Pob este suprafaţa relativă din imagine ocupată de pixeli obiect. nf este nivelul mediu de gri al fundalului. 163 .

Pentru segmentarea imaginilor binare se poate utiliza şi histograma cumulativă. iar la restul li se atribuie o altă etichetă (β).9.3) Număr de apariţii 1 P α T β N-1 Nivel de gri Figura 7. De exemplu. În acest caz. se stabileşte un procent de pixeli (p) sau un prag de nivel de gri (T) cărora li se atribuie o anumită etichetă (α). Histograma cumulativă. Acestea se pot implementa de exemplu utilizând transformarea Hit or Miss din morfologia matematică sau cu filtre adaptive la care funcţia de transfer (funcţia de intercorelaţie dintre intrare şi ieşire) se poate transforma în funcţie de autocorelaţie. în cazul unui timbru cu ştampila poştei se poate identifica numai ştampila şi caracteristicile ei: 164 . adică de a împărţi imaginea în zone în care se calculează histograma locală şi se aplică una din metodele anterioare. Pentru aceste metode există şi varianta de prăguire adaptivă. i =1 i =0 L×K 1 (7. Metoda se aplică cu succes la imagini cu histograme bimodale. H i = ∑ hi sau cu varianta sa normată H i = ∑ hi . Există şi metode de segmentare bazate pe potrivirea sau căutarea de măşti. obţinându-se un rezultat cu caracteristici locale.

timbru cu ştampila poştei

masca

Figura 7.10. Exemplu în cazul căutării timbrului poştal.

7.2.2. Segmentarea bazată pe creşterea şi fuziunea regiunilor
Aplicarea tehnicilor de segmentare pe histogramă este condiţionată de posibilitatea reprezentării diferitelor clase de obiecte din imagine pe intervale de niveluri de gri diferite care nu se suprapun (sau se suprapun parţial pe porţiuni foarte mici). În plus este necesară cunoaşterea numărului de tipuri de obiecte diferite. În fine, se presupune că valorile prag corespunzătoare se pot determina cu o precizie corespunzătoare. Chiar în cazurile în care toate aceste condiţii enunţate sunt îndeplinite, nu se poate garanta condiţia de conexitate a regiunilor obţinute în urma segmentării. Acest lucru este evident, atât timp cât la două obiecte de acelaşi tip, neconexe, li se atribuie prin segmentarea pe histogramă o aceeaşi etichetă, şi formează în imaginea de etichete o regiune neconexă. O metodă care respectă toate condiţiile impuse prin definiţia matematică a segmentării, este creşterea regiunilor. Principiul pe care se bazează creşterea regiunilor este simplu: se aleg în imagine puncte reprezentative pentru fiecare obiect individual şi categorie de obiecte, pe baza cărora are loc un proces de aglomerare a pixelilor vecini acestora, care au aceleaşi proprietăţi (în particular acelaşi nivel de gri). În urma acestui proces de aglomerare sau adăugare de puncte, se obţin zone (sau regiuni) de pixeli cu aceleaşi caracteristici, deci obiecte individuale. Procesul se opreşte în momentul în care fiecare punct
165

al imaginii a fost alocat unei regiuni. Evident, metoda astfel descrisă pe scurt, are două etape esenţiale: • • iniţializarea sau alegerea punctelor de start (puncte iniţiale), numite germeni sau seminţe (engl. seed);

creşterea propriu-zisă a regiunilor. Numărul final de regiuni rezultate este egal cu numărul de germeni aleşi iniţial pentru creştere, deci alegerea, respectiv granulaţia (densitatea) acestor puncte este foarte importantă. În principiu, este de dorit ca fiecare obiect individual aflat în imagine să fie marcat cu câte un germene. Dacă în interiorul unui aceluiaşi obiect se găsesc mai mulţi germeni, pentru fiecare dintre ei va fi crescută o regiune. Aceasta face ca obiectul iniţial să fie împărţit artificial prin segmentare în mai multe regiuni. Parţial, acest neajuns se poate corecta printr-o etapă ce urmează creşterii regiunilor, şi anume fuziunea regiunilor adiacente ce au proprietăţi asemănătoare. Dacă în interiorul unui obiect nu este ales nici un germene, obiectul respectiv va fi înglobat de regiunile ce cresc pornind de la germeni din vecinătatea spaţială. Astfel, respectivul obiect nu apare ca o regiune distinctă şi este pierdut, rezultând o eroare gravă de segmentare. Pornind de la germenii aleşi, regiunile sunt obţinute printr-un proces de creştere aproape simultană, început de la aceştia, până când toţi pixelii imaginii sunt repartizaţi unei regiuni (figura 7.11).

Figura 7.11. Principiul creşterii regiunilor.

166

Cvasi-simultaneitatea creşterii poate fi realizată cu un algoritm serial, prin alocarea pixelilor ce sunt adiacenţi (vecini) zonelor deja segmentate. Această alocare trebuie să ţină seama de criteriul ca regiunile crescute să fie uniforme, adică nivelul de gri al pixelului ce se adaugă nu trebuie să difere cu mai mult de un prag prestabilit faţă de nivelul de gri al germenului regiunii la care se alocă. În acelaşi timp, la o singură trecere, numărul de puncte ce se adaugă unei regiuni nu poate depăşi un număr prestabilit (condiţia încearcă să asigure creşterea relativ uniformă şi izotropă a tuturor regiunilor). Dacă adăugarea de noi pixeli se blochează (criteriul de uniformitate nu mai este respectat), diferenţa maximă admisă pentru nivelul de gri poate fi crescută în etape, până la epuizarea pixelilor imaginii. Avantajele pe care le are o asemenea tehnică de creştere a regiunilor sunt acelea că nu mai este necesară nici o informaţie privind conţinutul imaginii, regiunile crescute sunt conexe şi nu există puncte neetichetate (nealocate vreunei regiuni), iar poziţia frontierelor percepute subiectiv în imagine se conservă. Fuziunea regiunilor deja determinate în etapa de creştere, are drept scop reducerea numărului de regiuni în care a fost împărţită iniţial imaginea, pentru a evita fenomenul de supra-segmentare. Regiunile candidate la fuzionare trebuie să fie învecinate, iar decizia de fuzionare se ia în funcţie de pixelii aflaţi pe frontiera comună. Astfel, punctele slabe (în număr de ns) sunt punctele pentru care diferenţa nivelurilor de gri între vecinii din regiunile adiacente este foarte mică (mai mică decât un anumit prag fixat). Punctele tari (în număr de nt) sunt acele puncte pentru care diferenţa nivelurilor de gri între vecinii din regiunile adiacente este foarte mare (mai mare ca un anumit prag fixat). Cu aceste definiţii, se poate afirma că regiunile Ri şi Rj vor fuziona dacă: • numărul de puncte slabe (ns) raportat la perimetrul minim (Pm) este n mare: s > θ1 , (7.4) Pm unde Pm=min(Perimetrul(Ri), Perimetrul(Rj));
167

numărul de puncte slabe de pe frontiera comună e mare: n s > θ 2 , (7.5) P unde P este numărul de puncte aflate pe frontiera comună a regiunilor Ri şi Rj; n numărul de puncte tari de pe frontiera comună este mic: t < θ 3 , (7.6) P θ1 = 0,5  Valori tipice ale pragurilor θ1 ,θ 2 ,θ 3 sunt: θ 2 = 0,75 θ = 0,2  3 (7.7)

distanţa de similaritate dintre regiuni este mare. Distanţa de similaritate este o măsură a asemănării. Aceasta poate fi o distanţa euclidiană ponderată sau un produs vectorial sau scalar între vectorii corespunzători.

7.3. Segmentarea orientată pe contururi
După cum s-a arătat, segmentarea reprezintă o categorie de tehnici de prelucrare care permite extragerea din imagini a unor elemente de interes în scopul analizei lor ulterioare şi eventual a clasificării lor, prin două metode principale: detecţia muchiilor (contururilor) şi detecţia regiunilor omogene. Prin urmare, pentru analiza imaginilor (îndeosebi la segmentare) o etapă esenţială constă în detecţia muchiilor şi liniilor (frontierelor) care reprezintă grupuri de pixeli aflaţi în zona de tranziţie (de variaţie bruscă a nivelului de gri) dintre două regiuni relativ uniforme ale imaginii iniţiale. Muchiile sunt graniţa de separaţie fie între obiecte şi fundal, fie între două zone omogene ale aceluiaşi obiect. O asemenea muchie poate fi formată din puncte şi segmente de dreaptă.

168

8) Deoarece pixelii aparţinători muchiilor se caracterizează prin faptul că se află la graniţa dintre două regiuni omogene între care există diferenţe mari de niveluri de gri.3. k − 1) (7.1. un punct de contur dintr-o imagine reprezintă un pixel (sau un grup mic şi omogen de pixeli conecşi) având o valoare net diferită faţă de cea a vecinilor săi. Operatori de tip gradient Din punct de vedere practic. Măsura diferenţei de intensitate (de nivel de gri) poate fi calculată printr-o filtrare liniară cu o mască de forma: − 1 − 1 − 1 − 1 [8] − 1   − 1 − 1 − 1   (7. Pentru o imagine iniţială u(l.7.k) cu: • 2 modulul (amplitudinea): g (l . k + 1) − u (l .11) gradientul după o direcţie oarecare r (care face unghiul θ cu orizontala): ∂u ∂u ∂x ∂u ∂y = ⋅ + ⋅ = g x ⋅ cos θ + g y ⋅ sin θ (7.13) (7. detecţia lor se poate face cu operatori de tip gradient (operatori de derivare locală).k). k ) = g x (l .14) 169 .10) gradientul pe direcţia verticală: g y (l . Detecţia acestora se poate face prin comparaţie (diferenţă) între nivelul de gri propriu şi media nivelurilor de gri dintr-o vecinătate a sa. k ) + g 2 (l .12) ∂θ ∂x ∂r ∂y ∂r Direcţia în care se află muchia va fi dată de direcţia după care gradientul are valoarea maximă: ∂  ∂u   =0 ∂θ  ∂r  Rezultă vectorul gradient g(l. k ) − u (l − 1. k ) y (7. k ) = u (l + 1. putem scrie: • • • gradientul pe direcţia orizontală: g x (l . k ) (7. k ) = u (l .

-k) u(l. k )  (7. Spre exemplu. k )     g x (l .12. eticheta F (fundal). Operatorii de tip gradient sunt reprezentaţi de o pereche de filtre (H1. gy).k) prag t O Harta muchiilor h2(-l. se obţin prin convoluţia cu măştile: [1 [0] − 1]  1  [0]    − 1   vertical (7.-k) gy α g = arctg    g2   g1  Figura 7.16) Implementarea operatorilor de derivare (tip gradient) se face prin convoluţia imaginilor cu măşti (ferestre). care sunt deci.15) De multe ori. iar celorlalţi.k) Direcţie αg(l. k ) = g x (l . k ) (7. k ) + g y (l . definiţi mai sus (gx. 170 . amplitudinea (modulul) gradientului se defineşte ca: g (l .12. pentru simplificarea calculelor.• direcţia: α (l . Pixelilor care depăşesc acest prag li se alocă în imaginea finală eticheta C (contur). t. filtrări liniare.k) depăşeşte un prag dat. Principiul extragerii contururilor.17) orizontal Un pixel este declarat ca “punct de frontieră” dacă g(l.k) gx 2 2 g = g1 + g 2 Amplitudine g(l.H2) care măsoară gradientul imaginii după două direcţii ortogonale. k ) = tg   g y (l . h1(-l. Un bloc care implementează un astfel de extractor de contur poate fi reprezentat ca în figura 7. gradienţii după direcţia orizontală respectiv verticală.

În general. Harta muchiilor oferă informaţiile necesare pentru trasarea contururilor din imagine.21) Aceşti operatori au proprietatea de a avea un efect nul în cazul regiunilor uniforme. Când aceste tranziţii sunt mai lente. În continuare sunt prezentaţi operatori de derivare clasici.k)” cu pragul “t” se obţine harta de muchii. 5-10% din pixelii imaginii g(l. care determină diferenţe orizontale şi verticale şi realizează însumări locale. pragul “t” se alege folosindu-se histograma cumulativă pentru g(l. reducându-se efectul zgomotului (elementul încadrat indică originea): − 1 0 1 Prewitt: H 1 = − 1 [0] 1   − 1 0 1   − 1 − 1 − 1 H 2 =  0 [ 0] 0    1 1 1   − 1 − 2 − 1 H 2 =  0 [ 0] 0    1 2 1   3 3 3  3 [ 0] 3  H2 =    − 5 − 5 − 5   (7.18) Sobel:  − 1 0 1 H 1 =  − 2 [ 0] 2     − 1 0 1   (7.20) − 1 − 2 1   [0] 2 H 2 =  0  1 1  2   − 1  0 1  (7.19) − 5 3 3 Kirsch: H 1 = − 5 [0] 3   − 5 3 3   0  −1 Izotrop: H 1 = − 2 [0]   −1 0  (7.Prin binarizarea imaginii “amplitudine g(l. este indicat să se folosească derivatele de ordin doi.k). combinate într-un operator laplacian: 171 . Operatorii definiţi anterior sunt performanţi în cazul unei tranziţii bruşte a nivelurilor de gri din imagine.k) fiind declaraţi muchii.

y ) = ∂ 2 f ( x. 172 . y ) ∂y 2 (7. ceea ce duce la apariţia în harta de muchii.13).22) Operatorul de tip laplacian poate fi implementat în discret prin convoluţia imaginii de prelucrat cu una dintre măştile:  0 −1 0  − 1 [4] − 1    0 −1 0    − 1 − 1 − 1 − 1 [8] − 1   − 1 − 1 − 1    1 −2 1  − 2 [4] − 2    1 −2 1    (7.23) Datorită derivatei de ordinul doi. Graficele corespunzătoare laplaceanului. a contururilor îngroşate.13. operatorul laplacian este mai sensibil la zgomot decât cei definiţi anterior.∇ 2 f ( x. Amplitudinea binarizată pentru ∇ 2 f produce muchii duble. y ) ∂x 2 + ∂ 2 f ( x. ci trecerilor sale prin zero (figura 7. Acest dezavantaj se elimină dacă se consideră ca fiind punct de contur nu cel corespunzător maximelor sau minimelor laplacianului. f(x) f'(x) O x f''(x) O O x x Figura 7.

cât şi topologia planului discret. datorită operaţiei de maxim. se pot construi măşti pentru determinarea gradientului pe fiecare dintre aceste 3 direcţii. De exemplu. Pentru determinarea punctelor de contur se consideră direcţia după care gradientul este maxim.2. favorizează numai câteva direcţii: axele şi cele două bisectoare. 173 .7. Filtrele prezentate se pretează la obţinerea prin permutare a unui set de patru. corespunzători celor 8 orientări sunt: 1 1 1  0 [0] 0    − 1 − 1 − 1   0 1 1 1 [0] − 1   0 − 1 − 1   1 1  1  [0] 0 0 − 1 − 1  − 1  0 − 1 − 1 1 [0] − 1   1 1 0   N − 1 − 1 − 1  0 [0] 0    1 1 1   NV  − 1 − 1 0 − 1 [0] 1   0 1 1   − 1 − 1  − 1  V 0 0 1 1  1  SV 1 1 0 − 1 [0] 1    − 1 − 1 0   [0] E S SE NE Măştile corespunzătoare diferitelor orientări se obţin prin rotirea unei măşti de bază în jurul originii. Pentru a obţine rezoluţii unghiulare mai bune (mai multe direcţii) se pot utiliza operatori de tip compas de dimensiuni mai mari de 3×3. Pornind de la această observaţie. Operatori de tip compas Operatorii prezentaţi. Operatorii rezultaţi se numesc operatori compas. fiecare cu câte două sensuri. operatorii compas derivaţi din operatorii Prewitt.3. Aceştia se pot obţine din oricare din operatorii prezentaţi anterior. sensibile la orientarea muchiei. în funcţie de dimensiunea operatorului. Operatorul compas este evident neliniar. opt sau mai multe măşti.

de exemplu peste o linie. Netezirea imaginii se face adaptiv. pentru nivelurile de gri din vecinătatea punctului curent se pot utiliza notaţiile: 1 1 1 P P2 P3 1 P4 P7 [P5 ] P8 P6 P9 −2 1 [− 2] 1 −2 1 (7. după o anumită direcţie. dar pentru fiecare mască se va verifica şi situarea punctului curent pe mijlocul tranziţiei. utilizând aceleaşi măşti ca şi în cazul anterior. Acest dezavantaj se poate elimina printr-o prefiltrare a imaginii. au ca rezultat o tranziţie.25) adică se verifică faptul că valorile centrale sunt mai mari decât cele laterale. În acest scop.25).Hk gk max{gk} Figura 7. În acest scop se alege un număr 174 . se ia în considerare doar dacă sunt îndeplinite condiţiile (7. respectiv un contur fals. Dezavantajul operatorilor de tip compas este că zgomotele suprapuse. Determinarea punctelor de contur ca puncte de gradient maxim. se verifică condiţiile: (P4 > P1 & P4 > P7 ) & (P5 > P2 & P5 > P8 ) & (P6 > P3 & P6 > P9 ) (7. care rezultă prin aplicarea unei astfel de măşti. rezultând o netezire adaptivă direcţional. Astfel rezultă operatorii compas cu netezire. care determină un profil de forma: Gradientul după direcţia respectivă. Se poate utiliza şi varianta adaptivă a acestui operator (compas adaptiv).14. deci dacă prin aceste puncte trece o linie.24) Cu aceste notaţii.

v1.. σk. σ1. valoarea pixelului curent se va înlocui cu i =1. σ2. i =1. Rezultă valorile netezirii. Pentru fiecare punct al imaginii calculăm rezultatul netezirii (filtrării) cu aceste măşti. Dacă elementul structurant este V8flat (plat). Se va folosi masca care are ca rezultat dispersia minimă σ j = min (σ i ) . definit ca diferenţă între imaginea dilatată şi imaginea erodată. cu un acelaşi element structurant... O altă variantă de operator extractor de contururi este gradientul morfologic. Prin urmare.. aşa cum s-a arătat în capitolul referitor la morfologie matematică.k respectiv medierii: min ( u ( x...... Sk). care sunt nişte valori medii ponderate de coeficienţii măştilor. Pentru fiecare din aceste măşti se calculează şi o dispersie locală. Toate aceste tehnici se dovedesc a fi sensibile la zgomot şi prin urmare. O asemenea prelucrare este diferenţa de gaussieni (DOG) care reprezintă diferenţa între două imagini netezite cu filtre gaussiene de dimensiuni diferite... de exemplu. faţă de media ponderată vk.de măşti de netezire direcţionale (S1.. vk. 175 ... v2.. S2. pentru imagini afectate de zgomot sunt necesare soluţii diferite.. i =1.. obţinerea unei valori minime pentru diferenţa între valoarea punctului curent (în care a fost centrată masca) şi valoarea rezultată în urma filtrării..k valoarea vj. această operaţie poate fi asimilată cu un operator compas.. care a avut ca rezultat σ j = min (σ i ) . care reprezintă dispersia valorilor de gri ponderate cu coeficienţii măştii.k Masca poate fi aleasă şi după alt criteriu cum ar fi.. y ) − vi ) ..

cu fractali VQ (Vector Quantization) .8.cu cuvânt fix . DCE+Hufmann (utilizată în standardul JPEG Joint Picture Expert Group) etc. Compresia imaginilor O clasificare a metodelor de compresie a imaginilor este prezentată în figura de mai jos: codarea conturului nivel înalt nivel bloc binare skeleton quad-tree morfologic generalizat WBS (White Block Skipping) RLE (Run Length Encoding) nivel bit (pixel) Ziv-Lempel entropică (Huffman) pe plane (ca la imagini binare) DCT cu transformate (cu pierderi) KL (Karhunen Loeve) cu predicţie. bazate pe DPCM wavelet (Differential Pulse Code Modulation) etc. 176 . skeleton+RLE (sau WBS).cu cuvânt trunchiat .cu cuvânt modificat Compresia imaginilor cu niveluri de gri Există şi metode combinate: RLE+Hufmann.

1. marcarea punctelor maxim depărtate de laturile patrulaterului (EFGH). Determinarea acestor descriptori trebuie precedată de detecţia contururilor şi eventual de netezirea acestora. pe lângă compresia cu skeleton morfologic.1): • • • • • • determinarea diagonalei principale (AB) a conturului.1. Procedura de determinare a aproximării poligonale a unui contur constă în următoarele etape (figura 8. se mai poate utiliza codarea contururilor. marcarea punctelor de pe contur (C şi D) având distanţa maximă faţă de diagonala principală.1. cu acelaşi nume.1.8. 177 . se repetă ultimele etape până când distanţa maximă este mai mică decât o valoare prestabilită.1. Codarea de nivel înalt Pentru compresia de nivel înalt a imaginilor binare. 8.1. Compresia imaginilor binare 8. Descriptorii de contur sunt coduri care înmagazinează şi compactează într-un volum mic de memorie informaţiile esenţiale cu privire la conturul unui obiect. rezultă a doua aproximare: poligonul ABCDEFGH. rezultă prima aproximare: poligonul ABCD. Aproximări poligonale Aproximarea poligonală a unui contur este un descriptor care descinde direct din metoda de detecţie a conturului.

Aplicaţiile acestei metode sunt limitate. Principiul acestuia constă în codificarea (numerotarea) vectorilor de “direcţie” dintre pixelii succesivi de pe contur prin numerotarea într-o anumită ordine a direcţiilor posibile de deplasare de-a lungul unui contur. iar conturul este codificat reţinând poziţia relativă a pixelilor de pe contur.2.1. deoarece modelul obţinut nu este invariant la transformările geometrice şi deci. pentru a putea reface obiectul. o simplă scalare sau rotire duce la schimbarea codului. Pentru a înlătura într-o oarecare măsură acest dezavantaj. Procedura de determinare a aproximării poligonale a unui contur. Codul rezultat conţine coordonatele colţurilor poligonului.2). pentru codarea poligonului se poate utiliza codul Freeman. ceea ce practic defineşte laturile şi unghiurile acestuia şi implicit dă o informaţie suficient de corectă asupra conturului obiectului studiat.1. Această metodă de compresie se bazează pe ideea că pentru un obiect „plin” este suficientă informaţia de contur. vectorii fiind codificaţi prin cuvinte de 3 biţi: 178 . 8. Codul Freeman de bază foloseşte 8 direcţii de mişcare (figura 8.1.A A E C A H D G B E C F A H D G B D B C F B Figura 8. Codul Freeman Codul Freeman se mai numeşte şi “cod lanţ” şi este folosit pentru codarea contururilor.

se pot folosi şi alte variante ale acestuia. Codul Freeman. Acest descriptor de contur este constant. “numărul de formă” este cifra minimă obţinută din permutarea circulară a codului diferenţial. urmată de un şir de cuvinte cod. obţinut prin scrierea diferenţei modulo-8 între cifrele succesive. ca alternative la acest cod Freeman primar. Din acest motiv. independent de poziţia punctului de start. Practic se numără întotdeauna în acelaşi sens numărul de direcţii care separă două orientări consecutive ale conturului. Codul obţinut este invariant la translaţie şi este dependent de alegerea punctului de start pentru parcurgerea conturului.2 3 1 D 4 0 6 E 5 6 7 7 5 C 4 B 3 A 2 H 1 F 0 G Figura 8. Tipic. • 179 . adică două cifre din codul primar. care codifică direcţia vectorului spre pixelul următor şi adresa acestuia (A34567012). A).2. codul Freeman conţine adresa pixelului de start (în exemplul prezentat. cum ar fi: • codul Freeman diferenţial.

Compresia cu coduri Freeman permite şi o serie de prelucrări pe contururi. iar nimpar este numărul legăturilor impare din codul Freeman.1) unde npar este numărul legăturilor pare. În mod ideal aceşti parametri trebuie să fie invarianţi la translaţie. Codul Freeman este folosit în mod frecvent în caracterizarea formelor. numărul de formă: 02460642 (cel mai mic). pentru realizarea de hărţi.Exemplu: • • codul Freeman primar = 60026442. codul Freeman diferenţial = 20246064 6-4=2 4-4=0 4-2=2 =se începe cu diferenţa ultimelor două cifre. Printre cei mai cunoscuţi parametri (descriptori) de formă sunt: 180 . Astfel. perimetrul unui obiect. 2. 3. pe baza căreia această formă poate fi recunoscută în mod unic. ariile închise de contururi. se pot calcula sau realiza: 1. rotaţie şi scalare. fără a fi nevoie să fie memorată sau analizată întreaga imagine. Parametrii de formă compun un fel de “fişă de identitate” a formei respective. Parametrii de formă reprezintă scalari sau funcţii asociate unei forme. desene sau amprente digitale. • (8. pe care o caracterizează. pe baza informaţiei referitoare la conturul său: perimetrul = n par + 2 ⋅ nimpar . Astfel. Această metodă de compresie se utilizează la comanda plotterelor. formele asemănătoare sunt caracterizate de parametri de formă de valori apropiate. putând fi folosit şi pentru determinarea altor parametri de formă. netezirea frontierelor obiectelor.

adică măsura în care forma se deosebeşte de un disc) se defineşte ca raport între raza cercului circumscris (R) şi raza cercului înscris (r) în forma studiată: R c= (8. conturul acesteia.. perimetre. egală cu numărul punctelor de pe 181 .4) r raportul de compactizare (sau rotunjimea formei) reprezintă raportul dintre pătratul perimetrului şi suprafaţa formei: K= P2 4πA 2 (8. Parametrii geometrici se bazează pe măsurarea unor atribute geometrice simple (sau combinaţii ale acestora) cum ar fi: • perimetrul (P): P = ∫ x 2 (t ) + y 2 (t )dt (8.2) unde t este parametrul de contur.3) unde R şi ∂R reprezintă regiunea obiectului şi respectiv. descriptori de contur: Freeman. • • excentricitatea formei (sau circularitatea sa.1. • aria (A): A = ∫∫ dxdy = ∫ y (t ) R ∂R dx(t ) dy (t ) dt − ∫ y (t ) dt dt dt ∂R (8. cu perioada N. Fourier. arii etc. afine etc. aproximări poligonale: momente statistice (invariante): Hu. Conturul poate fi descris cu o pereche de funcţii x(n) şi y(n) (periodice. dar nu în mod necesar lungimea acestuia.5) 8.1.3.• • • descriptori primari (geometrici): lungimi. Zernike. Descriptori Fourier Descriptorii Fourier reprezintă o metodă utilă pentru reprezentarea şi descrierea conturilor.

obţinuţi prin aplicarea transformatei Fourier unidimensionale. Se poate arăta că vectorul descriptor Fourier al conturului unei forme: V F = {a (0) .1. chiar dacă acestea au dimensiuni şi orientări diferite.…..7) Descriptorii Fourier pot fi utilizaţi în recunoaşterea de forme de acelaşi tip. Descriptori Fourier...contur sau cu un submultiplu al acestuia). Descriptorii Fourier sunt chiar coeficienţii a(k) ai transformatei Fourier ai funcţiei u(n).. Astfel. unde k=0.. a(0) reprezintă centrul de greutate al curbei.N-1. în continuare putând fi utilizate toate tehnicile de reprezentare unidimensională pentru semnale. 182 . se poate scrie: u (n) = x(n) + j ⋅ y (n) . unde 0 ≤ k ≤ N − 1 N   n =0 (8. faza arg(a (k ) ) . x α a(k)=x(k)+j⋅y(k) y Figura 8.2.. N − 1 (8. semnalul u(n) va fi un semnal periodic cu perioada N.1. pentru orice contur eşantionat. a (1) . este invariantă la rotaţie.8) este invariant la scalare şi translaţie.. a ( N − 1) } (8. a (2) ..3. unde n = 0. Astfel.6) În cazul unui contur închis. care conţine N puncte. În plus. iar ceilalţi coeficienţi a(k) conţin informaţiile privind variaţiile locale ale conturului descris: N −1 2π ⋅ k ⋅ n   a (k ) = ∑ u (n) ⋅ exp − j  .

deci dacă: u ' ( n) = α ⋅ u ( n) ⇒ a' (k ) = α ⋅ a(k ) (8. în cazul descriptorilor Fourier corespondenţi. ⇒ u ' ( n) = u ( n) + u 0 (8. 183 . Metoda arborelui cuaternar (Quad-tree) Compresia bazată pe metoda arborelui cuaternar (quad-tree) se implementează prin segmentarea succesivă a imaginii în sferturi succesive.11) Rotaţia conturului cu un unghi φ0 produce un defazaj suplimentar constant φ0 al descriptorilor: u ' ( n ) = u ( n ) ⋅ e − jΦ 0 ⇒ a ' ( k ) = a ( k ) ⋅ e − jΦ 0 (8. dacă: u ' ( n) = u ( n) ⋅ e − jΦ 0 ⇒ a' (k ) = a(k ) ⋅ e −j 2π ⋅k ⋅n0 N (8. De exemplu.10) Modificarea punctului de referinţă (de start) a conturului duce la o modulare a coeficienţilor a(k). Efectul de scalare (mărire sau micşorare a conturului) are ca efect o scalare a coeficienţilor a(k).1. Codarea se face apoi prin atribuirea pentru fiecare „frunză” a arborelui a unei valori corespunzătoare valorii din zona (pătratul) adresată de frunză.2.Deci.2.12) 8. a ' (k ) = a (k ) + u 0 ⋅ δ (k ) . dacă un contur este translatat cu: u 0 = x0 + j ⋅ v0 . anumite transformări geometrice ale unui contur sau forme se reflectă. în transformări (operaţii) simple ale acestora. până se obţin doar zone omogene. Deci.1. ca şi în cazul segmentării prin metoda quad-tree. Codarea la nivel de bloc 8. cu excepţia celui pentru k=0.1.9) În acest caz. noii descriptori Fourier rămân identici.

Compresia prin metoda arborelui cuaternar. deci pătratele de pe primul nivel au latura egală cu ½ din latura imaginii). Prin urmare codul obţinut prin metoda quad-tree trebuie să conţină toate informaţiile de mai sus. iar cel al valorii pătratului alb din stângajos este 10 (cel al poziţiei sale este 3). pentru a reface imaginea din codul acesteia. Principiul implementării acestor metode constă în: 184 . deoarece aceasta rezultă în mod implicit. Conform acestei metode.2. Din aceste informaţii se poate elimina informaţia referitoare la dimensiunea frunzei.2. De exemplu. • 8. deoarece din lungimea codului rezultă şi nivelul pe care se află frunza şi deci dimensiunea acesteia. frunzele.4. codul corespunzător valorii pătratului negru din partea dreapta-jos a imaginii de mai sus este 111 (cel al poziţiei sale este 22). pentru fiecare „frunză” trebuie ştiut (memorat): • • valoarea: este conţinută în fiecare frunză.1. poziţia: rezultă din calea pe care se ajunge la frunză. dimensiunea: poate fi dedusă din nivelul pe care se află frunza (de exemplu.1 1 0 0 1 0 0 0 1 1 2 1 2 0 3 0 3 0 3 1 2 convenţie Figura 8. Metoda WBS (White Block Skipping) Această metodă de codare la nivel de bloc se bazează pe omiterea zonelor albe din imagine.

De exemplu. Codarea RLE (Run Length Encoding) Principiul codării RLE (Run Length Encoding) constă în reţinerea numărului de biţi succesivi care au aceeaşi valoare în secvenţa de biţi ce descrie imaginea. în caz contrar putându-se obţine chiar un efect contrar compresiei. un bloc nul (toţi biţii sunt 0-logic) se înlocuieşte cu un singur bit de 0.1. urmat blocul respectiv.3. 1 numarul de biti din imaginea initiala (8. pentru secvenţa iniţială: 000111010111110000111111 care are 24 biţi prin codarea conform principiului RLE se obţine secvenţa codată: 033111546 185 .1.13) R este inversul ratei de compresie (C).1. De exemplu. pnul este probabilitatea ca blocul de m biţi să fie nul. Codarea la nivel de bit 8. blocurile nenule (în care cel puţin un bit este diferit de 0-logic) sunt înlocuite cu un bit de 1-logic.14) C= = R numarul de biti din imaginea finala 8.• • • împărţirea şirului de biţi ce defineşte imaginea în blocuri de câte m biţi. Se poate arăta că: 1   R = 1 + − p nul  . pentru m=3 şi pentru secvenţa următoare: 000 110 000 101 000 011 codul corespunzător este: 0 1110 0 1101 0 1011 După cum se observă. unde  m  (8.3. acest tip de compresie este eficient doar în cazul imaginilor cu mult alb.

Adică primul bit este 0-logic, care se repetă de 3 ori, după care se schimbă simbolul (în 1-logic, dar acesta nu se mai memorează, deoarece în imaginile binare tranziţia din 0-logic se face doar în 1-logic), acesta se repetă de 3 ori, după care se schimbă din nou simbolul, acesta apare o singură dată, după care avem 2 schimbări succesive de simbol, acestea apărând câte o singură dată, după care avem simbolul 1-logic care se repetă de 5 ori, se schimbă simbolul (în 0-logic) care apare de 4 ori, iar apoi ultimul simbol apare de 6 ori. Se observă că în secvenţa codată cel mai mare număr care apare este 6, deci pentru codarea binară a acestei secvenţe este nevoie de 8 coduri (apar 8 numere în secvenţa codată 33111546) de câte 3 biţi (pentru codarea celui mai mare număr este nevoie de 3 biţi) plus bitul ce reprezintă valoarea primului bit din secvenţa iniţială. Prin urmare, se poate deduce că metoda este eficientă în codarea imaginilor care conţin zone uniforme de dimensiuni mari. Metoda RLE este utilizată la faxuri.

8.1.3.2. Codarea entropică (Huffman)
Deoarece codarea entropică se studiază în detaliu în teoria informaţiei, nu se va insista pe detalii ale metodei, ci doar pe descrierea principiului metodei, prin intermediul unui exemplu. Pentru implementarea codării entropice se porneşte de la un număr de simboluri disponibile, care au anumite probabilităţi de apariţie. Principiul codării entropice (Huffman) constă în a coda cu un număr mic de biţi simbolurile cu probabilitate de apariţie mare, iar simbolurile sau secvenţele rare (cu probabilitate de apariţie mică) să fie codate cu un număr mai mare de biţi. Pentru exemplificarea principiului metodei, se presupun şapte simboluri cu probabilităţile de apariţie din tabelul 8.1.

186

Tabelul 8.1.
Simbolul PA Iniţial CA Etapa 1 PA CA Etapa 2 PA CA Etapa 3 PA CA Etapa 4 PA CA Etapa 5 PA CA 11 (G5) 0 7 1 Etapa 6 CA

S1 S2 S3 S4 S5 S6 S7

6 3 3 2 2 1 1

6

6

4 (G2) 3 3 3 3 010 2 (G1) 2 011 2 100 2 101 0110

7 (G4) 6 6 00 01 5 (G3) 5 4 10 3 11

00 11 010 100 101 0110 0111

PA = probabilitatea de apariţie CA = codul alocat În faza iniţială, se ordonează simbolurile în ordinea descrescătoare a probabilităţilor, după care se grupează simbolurile două câte două. Simbolurile cele mai puţin probabile sunt grupate şi alcătuiesc o grupă restrânsă de probabilităţi (G1, în tabelul 8.1). Procesul se repetă (G2, ..., G5) până când avem o grupă restrânsă cu doar două elemente (G5 şi G4), cărora le alocăm câte un simbol diferit (0,1), după care se refac în sens invers grupele, respectiv simbolurile iniţiale, prin alocarea unor biţi corespunzători care se adaugă celor din grupele superioare (anterioare), din care provin grupele sau simbolurile curente. Prin codarea entropică se obţine codul cu lungimea medie minimă, în raport cu alte coduri.

187

8.2. Compresia imaginilor cu niveluri de gri
8.2.1. Codarea pe plane
În cazul codării pe plane a imaginilor cu niveluri de gri se pot aplica metode similare metodelor de codare a imaginilor binare, pe fiecare plan ce codează informaţia din imagine.
b7


b1 b0

Figura 8.5. Principiul codării pe plane. În acest caz trebuie prevăzute metode de detecţie a erorilor la nivelurile înalte pentru a nu avea salturi bruşte de valori deoarece, de exemplu, o eroare a bitului cel mai semnificativ MSB (Most Significant Bit) se poate traduce într-o eroare de ½ din valoarea iniţială. Pentru o imagine codată pe 8 biţi, aceasta înseamnă un salt de la 255 la 127 (11111111 -> 01111111). În cazul imaginilor color se poate reduce numărul de culori, înlocuind componentele RGB cu coeficienţii cromatici r,g,b: R G B r= , g= , b= ⇒ r + g + b = 1 (8.15) R+G+B R+G+ B R+G+B Prin, această înlocuire se obţine un spaţiu bidimensional, deoarece componentele r,g,b nu sunt independente (dacă cunoaştem două componente, cea de-a treia rezultă dintr-o combinaţie liniară a primelor
188

două). Spaţiul bidimensional obţinut determină un spaţiu fizic reprezentabil în planul celor două componente cunoscute:

r

b

Figura 8.6. Spaţiul bidimensional r-b. Pentru a se obţine un spaţiu fizic reprezentabil extins, se poate utiliza spaţiul cromatic modificat sau o reprezentare de tip JNC (Just Noticeable Color) prin intermediul elipselor lui McAdam, care au proprietatea că nu se poate deosebi culoarea din centrul elipselor de restul culorilor din interiorul elipsei:

r

b
Figura 8.7. Elipsele lui McAdam.

189

avem de transmis o secvenţă u(k) unidimensională. u (k − l ) ) ≅ u (k ) (8. Dacă se transmite în loc de eşantioane diferenţele dintre ele. linie după linie. se obţine o decorelare importantă.16) şi se transmite eroarea: ˆ ⇒ e(k ) = u (k ) − u (k ) = u (k ) − u (k − 1) Evident procedeul se poate generaliza: dacă ˆ u (k ) = ψ (u (k − 1)..17) (8. nefiind nici pe departe variabile aleatoare independente. Un caz particular este cazul predicţiei liniare. 190 . Transmisia a n biţi este însă redundantă: eşantioanele vecine sunt puternic corelate. Metode predictive de compresie Transmisia digitală clasică a imaginilor constă în transmisia secvenţială a eşantioanelor obţinute prin baleierea clasică. e este eroarea de predicţie.2.. u(k) ∈ R ). iar diferenţele pot fi transmise cu un număr mai mic de biţi fiindcă nu sunt variabile aleatoare cu repartiţie uniformă pe domeniul de valori [0. M-1].18) În acest exemplu. care se deduce pe baza unor considerente statistice. folosind acest procedeu nu înseamnă decât să se facă ceea ce se numeşte predicţie de ordinul 0: se estimează: ˆ u (k ) = u (k − 1) (8.8. în care fiecare eşantion u(k) este un eşantion cuantizat pe n biţi. ψ : R l → R (dacă secvenţa este reală. Prin urmare..19) Coeficienţii ai se determină pe baza unor considerente statistice.. iar ψ este predictorul sau regula de predicţie de ordinul l-1.2. De fapt. în care regula de predicţie este o funcţie liniară: ˆ u ( k ) = ∑ ai ⋅ u ( k − i ) i =1 l (8. ci cu un maxim pronunţat în jurul lui 0 şi cu lungimea de cod semnificativ mai mică decât n.

În acest caz. folosind convenţia de scriere binară) se numeşte modulaţie de impulsuri în cod PCM (Pulse Code Modulation. în momentele când semnalul se modifică rapid.8. Codarea diferenţei se poate face în diverse moduri. În figura 8.Transmiterea eşantioanelor cuantizate şi folosind un cod (de exemplu 8 biţi pentru 256 de niveluri. se fixează o cuantă q şi la transmisie: • • • • dacă e(k)>0 se transmite 1-logic.8 se observă care este dezavantajul esenţial al modulaţiei delta: eroarea de neurmărire. Cel mai simplu caz din punct de vedere al biţilor de transmis este ca eroarea e(n) să fie codată pe un singur bit (bitul de semn). în engleză). Principiul modulaţiei delta. u(k) eroare de neurmărire q ˆ u (k ) zgomot granulat t Figura 8. Transmiterea diferenţelor între eşantioane se numeşte DPCM (Differential Pulse Code Modulation). Această codare DPCM particulară se numeşte modulaţie delta. 191 . dacă s-a recepţionat un 0-logic se scade cuanta q la eşantionul anterior. La recepţie: dacă s-a recepţionat un 1-logic se adaugă cuanta q la eşantionul anterior. dacă e(k)<0 se transmite 0-logic.

adică (figura 8. păstrarea valorii cuantei de la un pas la altul. pentru o creştere şi o descreştere succesivă (sau o descreştere şi o creştere succesive). Eliminarea distorsiunii de urmărire se face prin modificarea adaptivă a cuantei de la un pas la altul.10. Pentru implementarea compresiei cu predicţie.9. iar în zonele cu pantă mică..În zonele cu pantă mare. u (k − l ) ) ≅ u (k ) . deci cu variaţii lente. scăderea cuantei pentru două scăderi consecutive.. 192 . ale u(k) apare un zgomot granulat.. ale u(k) apar distorsiuni (erori) de neurmărire. u(k) ˆ u (k ) 2q q t Figura 8. deci cu variaţii bruşte. se poate utiliza schema bloc din figura 8. Modulaţia delta a fost îmbunătăţită mult în raport cu această variantă iniţială prin procedee de modificare adaptivă a pantei de creştere în funcţie de secvenţa de cifre binare transmise.9): • • • creşterea cuantei pentru două creşteri succesive ale semnalului. ˆ u (k ) = ψ (u (k − 1).. Principiul modulaţiei delta adaptive.

. adică vecinătatea punctului curent. n) = ψ u (i. j )∈Wm.20) e(k) u(k) + + eq(k)= e(k)+∆e(k) cuantizor codor eq(k) + + Predictor (cu întârzieri) u (k ) ˆ u'(k) canal de comunicaţie decodor + ˆ u (k ) Predictor (cu întârzieri) - Figura 8. u (k − l ) ) (8.n).n ... ({ }) (8.21) unde Wm.u(k) + - + e(k) cuantizor eq(k) Predictor cu întârzieri ˆ u (k ) Figura 8. în mod similar. pentru o imagine u(m. Pentru a elimina acest dezavantaj se foloseşte metoda: ˆ ˆ ˆ u (k ) = ψ (u (k − 1). imaginea prezisă va fi: ˆ u (m. Principiul predicţiei cu compresie modificat. în care se face predicţia.. În această figură: u ' (k ) ≅ u (k ) +erori de cuantizare. Fereastra de predicţie trebuie aleasă astfel încât să fie cauzală.11. De exemplu. j ) (i .n este fereastra de predicţie. Această metodă nu se foloseşte în practică deoarece în e(k) se vor acumula erorile de cuantizare a lui u(k). În cazul 2D al compresiei cu predicţie a imaginilor. stânga-dreapta).10. pentru o baleiere normală a imaginii (sus-jos. 193 . Principiul compresiei cu predicţie.

.3. fereastra de predicţie trebuie aleasă ca în figura de mai jos (Wm.. . 8... Figura 8. La decodare (la recepţie).pentru punctul curent.n W’m.2. . Într-un proces de compresie cu transformate se porneşte de la o imagine iniţială I în care energia este repartizată relativ uniform. Principiul compresiei cu transformate. La codare se reţin (respectiv se transmit) numai componentele în care este concentrată majoritatea energiei.. transformările integrale unitare se pot aplica cu succes şi la compresia imaginilor. ..n). 194 . ˆ I . Compresia cu transformate După cum s-a arătat şi în capitolul de transformări ale imaginilor. pentru ca valorile ce intervin în predicţie să fie deja calculate: Wm. T .12.. . Acesteia i se aplică o transformare T în urma căreia se obţine o imagine în care energia este concentrată în mult mai puţine componente decât în imaginea iniţială (de dorit în componentele cu indici mici). . T(I) codare canal . .n şi nu W’m.. .. I. .13.n Figura 8... Constrângerea de cauzalitate a ferestrei de predicţie. T-1 ˆ T (I ) decodare .

22) În decibeli: RSZ dB = 10 ⋅ log10 RSZ . deoarece transformările unitare conservă energia ( E ( I ) = E (T ( I ) ) ). j • ∑ I (i.. de exemplu pentru imagini cu multe contururi. j ) (8. i se aplică transformarea inversă. ce conţine informaţie doar în unele componente.imaginii recepţionate. Dacă transformarea este liniară şi unitară. Raportul semnal-zgomot al compresiei se defineşte ca fiind raportul dintre energia imaginii iniţiale şi energia erorii de compresie: RSZ = EI = E I − Iˆ i. factorii de compresie uzuali sunt de 10. În acest caz. Pot să apară şi zgomote cu RSZdB >30 dB. j ) − Iˆ(i.20. 195 . contururile vor fi puternic afectate. se poate controla cât anume se pierde din energia imaginii iniţiale prin netransmiterea (sau nerecepţionarea) componentelor nesemnificative din imaginea transformată. j i. ochiul uman nu mai poate distinge diferenţele între imaginea originală şi cea transformată. Raportul semnal-zgomot exprimă o măsură a calităţii compresiei. Pentru valori peste 30 dB. În prezent. deoarece componentele de frecvenţă înaltă (contururile) vor fi eliminate. la aplicarea transformatei inverse. raportul semnal-zgomot. j ) 2 2 ∑ I (i.. prin aplicarea transformatei Fourier discrete DFT. obţinându-se imaginea iniţială I (în practică se obţine de fapt o aproximaţie a acesteia). Valori acceptabile ale RSZdB sunt cele de peste 30 dB: RSZdB >30. Mărimile cantitative care definesc eficienţa compresiei sunt: • raportul de compresie. Raportul de compresie se defineşte ca fiind raportul dintre cantitatea de informaţie din imaginea iniţială şi cantiatea de informaţie din imaginea transformată care se transmite.

23) Complexitatea algoritmului se poate reduce dacă nu se aplică transformarea pe întreaga imagine... • numărul de operaţii sau complexitatea algoritmului de compresie. (8.. ci se împarte imaginea în blocuri şi se face codarea fiecărui bloc transformat. T T n n . s-a arătat că pentru transformările unitare bidimensionale. Pentru blocuri de dimensiunea n×n. care admit algoritm rapid de calcul. câştigul în ce priveşte complexitatea algortimului de compresie este: 196 .. care elimină dezavantajele transformatei Fourier DFT.Dintre transformările prezentate anterior. Principiu de reducere a complexităţii compresiei cu transformate.24) Prin urmare. numărul de operaţii este: n x ≈ N 2 ⋅ log 2 N (8. În capitolul de transformări ale imaginilor. ..14. complexitatea algoritmului este: ' nx N ≈ n ⋅ log 2 n ⋅   n 2 ( ) 2 . cea mai utilizată transformare pentru compresie este transformata Cosinus discretă DCT.. Figura 8. ale unor imagini de dimensiuni N×N. ...

Dacă ξ nu este o variabilă aleatoare reală scalară ci un vector cu N componente(reale).16. ca în figura 8. Transformarea optimă va fi stabilită relativ la criteriul erorii pătratice a mediei statistice. se vor obţine diferite valori care pot fi ordonate pe o axă. Dacă se consideră o variabilă aleatoare. reală şi se fac multe experimente. relativ la cele prezentate anterior.25) Pentru N=512 şi n=8 (n fiind standardizat în cadrul JPEG): log 2 N 9 = =3 (8.15. x x xx xxxx x x Figura 8.nx ' nx = N 2 ⋅ n 2 ⋅ log 2 N N 2 ⋅ n 2 ⋅ log 2 n = log n N (8. Ordonarea valorilor unei variabile aleatoare pe o axă. rămâne de stabilit transformarea optimă pentru compresie.15. la fiecare realizare se pune un punct în spaţiul n-dimensional. Dacă aceste valori ar fi infinit de multe. Prin urmare. în care se măsoară ξ. ξ.26) log 2 n 3 ⇒ se obţine un algoritm de 3 ori mai rapid. Densitatea valorilor unei variabile aleatoare. care să prezinte caracteristici optime. densitatea lor pe axă ar arăta ca funcţia de densitate de probabilitate ce caracterizează variabila ξ: Figura 8. ξ va putea fi scris: 197 .

b.17.  ξ ξ    N −1   N Prima numerotarea componentelor poate fi avantajoasă uneori.27)      .17. ξ0   ξ1       .       .  X X    N −1   N Cel mai simplu caz este N=2.  sau ξ =  .17.  (8.   .28) X =  .b legătura între valoarea lui X1 şi valoarea lui X2 este mai strânsă. dacă s-ar roti axele ca în figura 8. în care rezultatele pot fi reprezentate ca nişte puncte în plan.  ξ =  .a. Rezultatele unor experimente repetate poate arăta ca în figura 8. În acest caz.  . din considerente practice (realizările lui ξ sunt notate cu majuscule):  X0   X1       .   .18. Un alt exemplu este prezentat în figura 8.17. 198 .  (8. X2 X2 X1 X1 (a) (b) Figura 8.   . Exemple de reprezentare a realizărilor unei variabile aleatoare.   . respectiv X =  . În cazul din figura 8.

vor fi studiate doar acestea.  .  . care se pot obţine ca noi coordonate ale punctelor într-un sistem de axe rotit. adică o singură variabilă şi nu două. .18. . O transformare liniară de la RN se scrie cu ajutorul unei matrici A: η = A ⋅ξ . N −1  (8.  a 00   . unde: A =  . N −1 . . prezintă interes „transformări” ale vectorilor aleatori (în general N-dimensionali) şi fiindcă cele mai simple sunt transformările liniare.   . X2 y1 y2 X1 Figura 8.   a 0. pentru caracterizarea experimentului ar fi aproape suficient y1. . . deoarece y2 este mic în comparaţie cu y1 şi adesea neglijabil. Exemplu de reprezentare a realizărilor unei variabile aleatoare. într-un sistem de axe rotit.   a N −1. . Din astfel de motive.29) 199 . a 0 N −1   .adică dacă în loc de valorile calculate pentru X1 şi X2 s-ar face calcule cu nişte combinaţii ale acestora. în asemenea situaţii.

31) atunci: ξ 'T ⋅ξ " = (ξ ' . Se va limita căutarea optimului printre matricile unitare (care. Pentru calculele ce urmează se presupune. Mai exact. de fapt. şi anume să facă cât mai mici cât mai multe componente ale lui η astfel încât ξ să se poată aproxima cât mai bine prin cât mai puţine numere. adică momentele de ordinul 1 ( ξ k ) şi de ordinul 2 ( ξ i ξ j ). ξ1. Bineînţeles.η ' ) = η ' 2 200 . ξ ' ) = (η ' .….32) (8. dar modulul nu este o funcţie derivabilă.   .   .η " ) = η 'T ⋅η " şi. deoarece ele păstrează produsul scalar şi norma.30)      . Dacă nu ar fi variabile aleatoare de medie nulă. fiind vorba de variabile aleatoare. că toate componentele lui ξ (ξ0.  ξ =  . iar rezultatul ar fi variabile aleatoare de medie nulă. ξ " ) = (η ' . ξ0   η0       . s-ar putea scade media (cunoscută). adică dacă: η ' = A ⋅ ξ ' şi η " = A ⋅ ξ " (8. ξN-1) sunt variabile aleatoare de medie nulă. Se presupune că se cunosc nişte informaţii minime despre aceste variabile şi anume. se presupun cunoscute mediile şi corelaţia între componente. minimizarea acestora trebuie înţeleasă în sensul de eroare medie.  ξ η    N −1   N −1  Scopul este de a găsi o transformare care să fie optimă dintr-un anumit punct de vedere.33) ξ' 2 = (ξ ' . instrumentul matematic adecvat este eroarea medie pătratică fiindcă este o funcţie derivabilă: la eroarea medie ar trebui vorbit de modul.  şi η =  . (8. în particular: (8. de asemenea. sunt generalizări ale rotaţiilor din plan).  . respectiv dispersia fiecăreia.

adică dacă se neglijează o componentă. ca în relaţia (8.În aceste relaţii. Produsul scalar a doi vectori ξ şi η a fost notat cu (ξ. T T şi că dacă se notează cu (a 0 .. Cu alte cuvinte.  ~ ~ ~ Fie: η =  .1 şi 4..  η0     .. între o matrice (vector) 1×N şi o matrice N×1 şi are ca N −1 rezultat o matrice (scalar) 1×1: ξ T ⋅ η = ∑ ξ i ⋅ η i . (8. a N −1 ) coloanele lui AT: AT = a0 . se porneşte de la relaţiile: [ ]  η0     . Prin urmare. paragrafele 4.30). În notaţie matriceală. a T −1 ) liniile lui A. se va căuta printre matricile unitare o matrice L cu proprietăţile de optimalitate descrise.. a N −1 .  η = L ⋅ ξ şi ξ = LT ⋅ η . a1 ...36) 201 . vectorii sunt consideraţi ca fiind vectori coloană de dimensiune N×1. unde η =  .  η   N −1  Primul pas ar fi să se determine cum ar trebui să fie L pentru ca eroarea medie pătratică (asupra lui ξ) să fie minimă..  şi ξ = LT ⋅ η   η N −2   0    (8. a1 . η). a1 .34) atunci vectorii ai sunt ortogonali doi câte doi şi de normă 1. (8. acest produs se scrie ca un produs ξ T·η.. dacă se înlocuieşte ηN-1 cu zero. respectiv cu N (a0 . adică transformarea inversă se obţine foarte simplu.  ..2)...35)    . i =0 Aceste matrici mai au proprietatea că A −1 = AT (vezi capitolul 4..

Alegerea lui lN-1 (lk fiind coloanele matricii LT) trebuie făcută astfel încât acest ε2 să fie minim.42) adică lN-1 trebuie să fie vector propriu al matricii de autocovariaţie a ε = l T −1 ⋅ K ξ ⋅ l N −1 = l T −1 ⋅ (λ ⋅ l N −1 ) = λ ⋅ l T −1 ⋅ l N −1 = λ ⋅ l N −1 N N N 202 =λ .37) = l T −1 ⋅ ξ ⋅ ξ T ⋅ l N −1 = l T −1 ⋅ ξ ⋅ ξ T ⋅ l N −1 = l T −1 ⋅ K ξ ⋅ l N −1 (8. cu constrângerea că lN-1 este un vector unitar: l T 1 ⋅ l N −1 = 1 N- (8. deoarece: ξ −ξ ~2 ~T ~ ~ T ~ = ξ − ξ ⋅ ξ − ξ = LT ⋅ (η − η ) ⋅ LT ⋅ (η − η ) = 2 ( ) ( ) [ ] [ ] ~ ~ ~ ~ ~ = (η − η )T ⋅ L ⋅ LT ⋅ (η − η ) = (η − η )T ⋅ (η − η ) = η − η Prin urmare: ~ ε 2 = η −η 2 2 ~ = ∑ (η k − η k )2 = η N −1 = η N −1 ⋅ η N −1 = k =0 N −1 (8.38) N N N unde Kξ este matricea de covariaţie (şi de corelaţie.41) (8.~2 ~2 Este evident că: ξ − ξ = η − η . deoarece este de medie nulă) a vectorului ξ.43) 2 ( ) (8. se scrie mai compact ca anularea gradientului lui Ψ.40) Derivarea lui Ψ în raport cu componentele lui lN-1 şi anularea ei.39) Folosind metoda multiplicatorilor lui Lagrange. iar: ∇ v Ψ vT ⋅ A ⋅ v = 2 ⋅ A ⋅ v pentru orice vector v şi orice matrice A. aceasta înseamnă să minimizăm liber funcţia: Ψ = l T −1 ⋅ K ξ ⋅ l N −1 − λ ⋅ l T −1 ⋅ l N −1 − 1 N N ( ) (8. astfel că: ∇ lN −1 Ψ = 2 ⋅ K ξ ⋅ l N −1 − 2 ⋅ λ ⋅ l N −1 = 0 lui ξ: K ξ ⋅ l N −1 = λ ⋅ l N −1 Cum în acest caz eroarea devine: (8.

 . pentru a avea un minim.45) Dacă ηN-1 este necorelată cu toate celelalte componente ηk ale lui η.  la care se doreşte ca ultima componentă să    . 0 0   0       λ min   (8. . deoarece L este o matrice ortogonală (unitară.44) pentru ∀k ≠ N − 1 . Adică Kη are forma: η 0 ⋅ η 0 η 0 ⋅ η1  η1 ⋅ η 0  . de normă 1). η 0 ⋅ η N −2 η1 ⋅ η N −2 . are proprietatea interesantă că: T η k ⋅ η N −1 = l k ⋅ ξ ⋅ l T −1 ⋅ ξ N ( T T )T = l K ⋅ ξ ⋅ ξ T ⋅ l N −1 = l K ⋅ ξ ⋅ ξ T ⋅ l N −1 = T T T = l k ⋅ K ξ ⋅ l N −1 = l k ⋅ (λ min ⋅ l N −1 ) = λ min ⋅ l k ⋅ l N −1 = 0 (8. .  0  0  . . trebuie ca λ să fie cea mai mică valoare proprie a lui Kξ (se ştie că Kξ este o matrice simetrică pozitiv definită şi prin urmare are N valori proprii pozitive.  Vectorul η =  . . reală).   η  N −1  fie minimă. Kη =   .(deoarece lN-1 este de modul 1) este clar că.  η0     . Aceste lucruri permit să se spună că se poate repeta raţionamentul precedent pentru vectorul: 203 . iar vectorii proprii sunt ortogonali. Cu alte cuvinte ηN-1 este necorelată cu toate celelalte componente ale lui η. ea este necorelată şi cu orice combinaţie liniară a acestor componente.

atunci lk satisface relaţia: K ξ ⋅ l k = λk ⋅ l k unde: λ0 ≥ λ1 ≥ λ 2 ≥ ..46) ε = ∑ Φ T ⋅ K x ⋅ Φ k = ∑ λk ⋅ Φ T ⋅ Φ k = ∑ λk k k k = m +1 N N N 1 24 4 3 λk ⋅Φ k k =m +1 k = m+1 (8. De fapt.     . λN) ale lui Kξ.. ≥ λ N −1 .. este cea pentru care coloanele lui LT sunt vectorii proprii ai matricii Kξ în ordinea descrescătoare a valorilor proprii... transformarea căutată se poate considera şi ea N-dimensională. cu ultima linie l T −1 cunoscută.. Eroarea ε dată de compresia cu transformata KL când se înlocuiesc cu constante ultimele „N-m” componente ale lui Φ este: (8. η0     ...l n )T . în care K ξ ⋅ l k = λ k ⋅ l k se numeşte transformata Karhunen-Loeve (KL).... deoarece ηN-1 este necorelată cu toate celelalte componente ηk. • se ordonează descrescător: λ(1)>. l N −1 ].  η'=  .  η   N −2  adică să se caute o transformare unitară care să minimizeze ultima componentă (media ei pătratică) şi apoi tot aşa. N Se ajunge la concluzia că matricea L care compactează cel mai bine energia lui ξ adică pe ξ 2 în câteva componente.. Transformarea unitară L = (l1 .55) Construcţia matricii transformării KL se poate face astfel: • se determină valorile proprii (λ1.> λ(N) 204 ... adică dacă: LT = [l 0 .

(8. aplicată unei imagini IN×N.59) 205 . c1 c2 cN l1 l2 . K l = (l − l )⋅ (l − l )T .. lN Figura 8..56) În acest mod.57) unde mediile statistice pot fi estimate ca medii aritmetice pe mai multe imagini.. c ≅ ∑ ci ∑ N i =1 N i =1 (8. energia lui η = L ⋅ ξ va fi concentrată în primele componente..• vectorii proprii corespunzători sunt ordonaţi în aceeaşi ordine: L = l (1) l ( 2) .58) N 1 N ∑ li − l N i =1 ( 1 )T ⋅ (li − l ).l ( N ) T ( ) (8... Exemplu: În cazul unei transformări separabile. matricea de autocovariaţie a coloanelor Kc (figura 8. se determină matricea de autocovariaţie a liniilor Kl. I . Calculul matricilor de autocovariaţie pe linii şi pe coloane. Media statistică pe o singură imagine este: l≅ ⇒ Kl ≅ 1 N 1 N li .19): Kc = c − c ⋅ c − c ( )( )T .19. K c ≅ N ∑ (ci − c )T ⋅ (ci − c ) i =1 (8.

. pentru imagini cu corelaţie mare. V Figura 8.. deoarece transformata K-L depinde de statistica imaginii şi datorită volumului mare de calcule necesare (mai ales în cazul imaginilor de dimensiuni mari).. Aceasta realizează decorelarea elementelor imaginii şi transformatei şi prin aceasta compactarea maximă a energiei semnalului (imaginii) în primele componente. Principiul compresiei cu transformata T=KL. imaginea V obţinută prin transformarea KL bidimensională a imaginii iniţiale U.. se determină vectorii proprii şi valorile proprii: K l → Ll → λl .. transformata K–L este dificil de implementat practic. 206 . Cu toate aceste avantaje.16. . K c → Lc → λc (8. pentru o imagine dată U. transformata K-L se poate aproxima cu succes prin transformata Cosinus Discretă (DCT=Discrete Cosine Transform) mult mai rapidă şi mai uşor de implementat. . . Totuşi. T . transformarea optimă din punct de vedere al compresiei este transformarea K-L (Karhunen-Loeve). .. În concluzie. este: V = Lc ⋅ U ⋅ LT l . U.60) Cu aceste mărimi calculate.După determinarea matricelor Kl şi Kc..

Bucureşti..Bibliografie 1. Editura Prentice-Hall. 1996-2000. Spătaru A. Universitatea din Oradea. Editura Springer. “Digital Image Processing”. “Digital Image Processing”. Ciuc M. 7. Editura John Wiley & Sons 2001. “Digital Image Processing. 207 .. “Digital Image Signal Processing”.. 1987.. Vertan C. Pitas I. 6....E. K. 8. Editura Wiley-Interscience. 2007. “Digital Image Processing”. Note de curs – Prelucrarea şi analiza imaginilor. 1996. Curs. 2002. 4. “Tehnici fundamentale de prelucrarea şi analiza imaginilor”. “Teoria transmiterii informaţiei”. Peking University. Jahne B. Gonzales R. Wahl F. “Digital Image Processing”. Editura Artech House. 1984.. Pratt W. Bucureşti. 5.. 9.. Castleman K. 1989. R.. Woods R.. Editura Prentice-Hall Inc. Jain A. 11. 2000. 2001. Buzuloiu V. 2002. 3. 10. Editura MatrixRom.. Jiang M. Editura Didactică şi Pedagogică. Algorithms and applications”. “Fundamentals of Digital Image Processing”. Editura Prentice-Hall.C.K. 2. “Digital Image Processing”..