Professional Documents
Culture Documents
Normalizacija Podataka-Marko Masovic
Normalizacija Podataka-Marko Masovic
SEMINARSKI RAD
Profesor: Student:
Dr. Miroslav Medenica Marko Masovic
Broj indeksa: 20/14
1
SADRAJ:
1. NORMALIZACIJA PODATAKA 2
1.1. Definicija normalizacije.. 2
1.2. Funkcionalna zavisnost3
1.3. Metode normalizacije.. 4
1.3.1. Dekompozicija bez gubitka informacija 5
1.4. Vertikalna normalizacija dekompozicijom..7
1.4.1. Prva normalna forma.8
1.4.2. Druga normalna forma10
1.4.3. Trea normalna forma. 10
2. PRIMERI NORMALNIH FORMI.. 12
2.1. Primer 1 NARUDBINA... 12
2.2. Primer 2 NAJMOVI... 14
2.3. Primer 3 STUDENTI..17
LITERATURA 20
2
1. NORMALIZACIJA PODATAKA
3
Svaka od ovih anomalija manifestuje se na specifian nain, a njihov zajedniki uzrok je
povezivanje opisa svojstava razliitih objekata u jedan zapis u bazi podataka.
Anomalija dodavanja (unoenja) javlja se u onim sluajevima kada su informacije o
svojstvima jednog objekta memorisane u bazi podataka kao deo opisa nekog drugog objekta. Na
primer, u okviru opisa nastavnika memorisane su informacije o predmetu koji predaje ili katedre
na kojoj radi. Informacije o predmetu, odnosno katedri, nije mogue uneti u bazu podataka sve
dok ne postoji bar jedan nastavnik koji taj predmet predaje, odnosno, dok ne postoji najmanje
jedan nastavnik koji na toj katedri radi.
Anomalija brisanja je inverzija anomalije dodavanja. Neka su u okviru opisa svojstava
nastavnika memorisane informacije o predmetu koji predaje. Svakim brisanjem opisa nastavnika
brie se i jedna kopija podataka o predmetu koji predaje. Kada se obriu podaci o poslednjem
nastavniku koji predaje neki predmet, bie obrisana i poslednja kopija podataka o predmetu. S
obzirom na to da pri brisanju podataka o nastavniku se ne misli na druge posledice, na ovaj nain
mogue je unititi podatke o predmetu, koji su potrebni i vani.
Anomalija promene (auriranja) javlja se u sluaju kada promenu podataka o jednom objektu
treba izvriti na vie od jedne kopije podataka. Razmotrimo ponovo prethodni primer gde su
podaci o predmetu i katedri memorisani u okviru opisa nastavnika. U bazi podataka u jednom
trenutku postoji toliko opisa katedre koliko nastavnika radi na toj katedri. Ako treba promeniti
podatke o opisu katedre (na primer, naziv katedre), tada tu promenu treba izvriti na onoliko
mesta koliko nastavnika radi na toj katedri. Ako se promena ne izvri na svim kopijama nastaje
situacija u kojoj o istom svojstvu jednog objekta imamo vie razliitih tvrdnji od kojih bar jedna
nije istinita. Ovakvo stanje se smatra nekonzistentnom bazom podataka.
4
Ako u relaciji R vrednost atributa A jednoznano odreuje vrednost atributa B, onda je atribut B
funkcionalno zavistan od atributa A ali ne vai obrnuto pravilo.
Potpuna funkcionalna zavisnost atributa:
U tabeli R sa atributima X i Y koji mogu biti kompozitni tj. sloeni, Y je potpuno
funkcionalno zavistan od X ako vredi da je Y funkcionalno zavistan od X i nije
funkcionalno zavistan ni od jednog manjeg podskupa atributa X.
Odnosno, ako vredi X Y tada ne sme postojati nijedan podskup Z koji sadri samo deo
atributa od kojih se sastoji atribut X, za koji bi vredelo da je Z Y.
Tranzitivna funkcionalna zavisnost atributa:
Ako vredi X Y i Y-/ X (Y je funkcionalno zavistan od X, a X nije funkcionalno
zavistan od Y), i ako Y A (A je funkcionalno zavistan od Y) tada vredi da je A
funkcionalno zavistan i od X (X A).
Ako vredi A-/ Y tada je A potpuno tranzitivno zavistan od X.
Svaki (nehaotini) problemski domen kao deo realnog sveta ili neke apstrakcije opisan je
skupom (vie ili manje) oiglednih funkcionalnih zavisnosti F
Skup, korienjem odreenih pravila izvedenih FZ, zajedno sa izvornim skupom FZ ini
proireni skup funkcionalnih zavisnosti F+
Nove FZ izvodimo uz pomo Armstrongovih aksioma i pravila, izvedenih iz tih aksioma.
5
Od izdvojenih obeleja formira se nova ema relacije. Transformacija relacije zadate na
relacionoj emi neposredna je posledica normalizacije relacione eme. Vertikalna normalizacija
zasniva se na operacijama projekcije i prirodnog spajanja. Pomou operacije projekcije relacija se
vertikalno razbija na dve ili vie manjih relacija. Pri tome, dolazi do cepanja svake pojedine n-
torke u relaciji. Operacija prirodnog spajanja se koristi da bi se dokazala reverzibilnost, tj. da bi
se rekonstruisala polazna, nenormalizovana relacija.
2. Horizontalnom normalizacijom relacija se rastavlja na podskupove n-torki fragmente
relacije koji zadovoljavaju odreene uslove. Horizontalna normalizacija zasniva se na
operacijama selekcije i unije. Sama tehnika je jo uvek u razvoju a znaajnu ulogu mogla bi
odigrati kod distribuiranih baza podataka. Kod distribuiranih baza podataka relacija ne mora u
potpunosti biti memorisana na jednoj lokaciji. Fragmenti relacije memoriu se na pojedinim
lokacijama, to bi se moglo koristiti za samu normalizaciju.
6
Smatra se da je dekompozicija relacione eme R bez gubitka informacija, ako za bilo koju
relaciju r zadatu na R vredi da je rezultat prirodnog spajanja projekcija ri zadatih na Ri.
Reverzibilnost dekompozicije relacione eme dokazuje se reverzibilnou dekompozicije relacija
zadatih na toj relacionoj emi. Osnov vertikalne normalizacije su operacije projekcije i prirodnog
spajanja. Operacija projekcije koristi se da bi se relacija r(R) rastavila na dve ili vie manjih i
pravilnih relacija ri(Ri). Operacija prirodnog spajanja se koristi da bi polazei od projekcija neke
relacije bila rekonstruisana sama relacija. Problemi koji se javljaju imaju svoj uzrok u injenici da
operacije projekcije i prirodnog spajanja nisu meusobno inverzne. Samo pod odreenim
uslovima bie mogue prirodnim spajanjem projekcija neke relacije rekonstruisati samu relaciju.
Primer: Neka je p relacija zadata na relacionoj emi P(X,Y,Z). Neka su r(R) i s(S) projekcijom
relacije p zadate na relacionim emama R i S za koje vredi RS = P.
p(X Y Z)
x1 y1 z1
x2 y1 z2
x3 y2 z2
a)
XY(p)= r (X Y) XZ(p)= s (X Z) r > < s = p (X Y Z)
x1 y1 x1 z1 x1 y1 z1
x2 y1 x2 z2 x2 y1 z2
x3 y2 x3 z2 x3 y2 z2
b)
XY(p)= r (X Y) YZ(p) = s (Y Z) (r > < s) (X Y Z)
x1 y1 y1 z1 x1 y1 z1
x2 y1 y1 z2 x1 y1 z2
x3 y2 y2 z2 x2 y1 z1
x2 y1 z2
x3 y2 z2
c)
XY(p)= r (X Y) Z(p) = s (Z) (r >< s) (X Y Z)
x1 y1 z1 x1 y1 z1
x2 y1 z2 x1 y1 z2
x3 y2 x2 y1 z1
x2 y1 z2
x3 y2 z1
x3 y2 z2
7
Uslov koji mora biti ispunjen da bi dekompozicija bila reverzibilna glasi:
Dekompozicija relacione eme P na relacione eme R i S je reverzibilna ako su zajednika
obeleja u relacionim emama kandidat za klju u bar jednoj od ove dve eme. Drugim reima,
dekompozicija relacione eme P na relacione eme R i S je bez gubitka informacija ako je presek
skupova obeleja ema relacija R i S kandidat za klju u barem jednoj od tih ema relacija.
Prethodno iskazan uslov o dekompoziciji bez gubitka informacija pored primera kojim je
ilustrovan ima i strog matematiki dokaz.
8
Druga pravila kojih se treba pridravati u dizajnu baze podataka su dobra, konzistentna, logika,
puna imena za tabele i kolone, kao i upotreba punih rei u samoj bazi podataka.
Standardne normalne forme su aditivne, dakle ako je neki model sveden na treu normalnu
formu, automatski je u drugoj i prvoj normalnoj formi.
Prva normalna forma odnosi se na grupisanje slinih podataka u odvojene tabele i definisanje
primarnog kljua za svaku tabelu. Prva normalna forma (1NF) postavlja dva osnovna pravila za
organizovanu bazu podataka:
1. Eliminisanje duplih kolona iz iste tabele
2. Kreiranje posebne tabele za istu grupu povezanih podataka i identifikovanje svakog reda
jedinstvenom kolonom (primarni klju).
Definicija prve normalne forme: ema relacije R je u prvoj normalnoj formi (1NF) ako i samo
ako domeni relacije R sadre samo proste ("atomic") vrednosti, i nekljuni atributi funkcijski
zavise od kljua
Proste vrednosti su vrednosti koje se dalje ne mogu deliti ili ako u konkretnoj situaciji nisu
rastavljene na komponente;
U 1NF nisu dozvoljeni vievrednosni i kompozitni atributi i njihove kombinacije, tj. nisu
doputene relacije u relacijama ili relacije kao atributi n -torki.
1NF normalizacija: Ako ema relacije R(A1, A2,..., An) nije u 1NF, onda postoji takva
dekompozicija eme relacije R u skup ema relacija (R1, ..., Rk) koje su u 1NF, da se operacijom
prirodnog spajanja iz ovih ema relacija moe ponovo dobiti ema relacije R.
Za dekompoziciju se koriste sledea pravila:
1. Ako ema relacije R(A1, A2,..., Ak,..., An) ima vie vrednosni atribut Ai i primarni klju Ak,
tada se ema relacije R razlae u dve relacije R1(A1, A2,..., Ak,..., An) i R2(Ak,Ai). Treba uoiti
da je R1 formirana iz R iskljuivanjem vievrednosnog atributa, a da je R2 formirana od
primarnog kljua Ak i vievrednosnog atributa Ai;
2. Ako relacija R(A1, A2,..., Ak,..., An, Q(B1, B2,..., Bk,..., Bm)) ima ugnjezdenu relaciju Q,
tada se R razlae u dve relacije R1(A1, A2,..., Ak,..., An) i Q1(Ak, B1, B2,..., Bk,..., Bm). U
sluaju da relacija ima vie ugnjedenja, treba ovaj postupak ponoviti rekurzivno.
Primer (slika):
ema relacije SEKTOR<SNAZIV, SBR.SRUK, (SLOK)> nije u 1NF, jer je atribut SLOK vie
vrednosni. Posmatraemo jednu pojavu ove relacije:
SEKTOR
9
Da bi se ova relacija prevela u 1NF mogue je reenje da se ova relacija razloi u dve relacije
- SEKTOR<SNAZIV, SBR, SRUK> i
- SEKLOK<SBR, SLOK>.
Za gore navedeni primer, pojave ovih relacija bi imale sledei oblik:
Primer:
ema relacije RADPROJ (MBR, RIME, (PBR, SATI)) sadri ugnjedenu relaciju PROJEKTI
(PBR, SATI). Atribut PBR je parcijalni primarni klju ugnjedene relacije, dok je MBR primarni
klju relacije RADPROJ. Posmatraemo jednu pojavu ove relacije:
RADPROJ
10
1.4.2. Druga normalna forma
Definicija druge normalne forme je: ema relacije R je u drugoj normalnoj formi (2NF) ako i
samo ako je u 1NF i ako svaki njen sporedni atribut A potpuno funkcionalno zavisi od primarnog
kljua relacije R.
ema relacije R je u drugoj normalnoj formi (2NF) ako u 1NF i ako svaki njen sporedni atribut A
potpuno funkcionalno zavisi od svakog kljua relacije R.
Za 2NF normalizaciju se koristi sledei postupak:
1) U emi relacije R nai sve potpune funkcionalne zavisnosti sporednih atributa od pojedinih
kljunih atributa ili od skupa kljunih atributa.
2) Za svaku potpunu funkcionalnu zavisnost iz predhodnog koraka formirati po jednu novu emu
relacije. Klju ovih relacija je odgovarajui kljuni atribut ili odgovarajui skup kljunih atributa.
Primer:
U emi relacije RADPROJ(MBR, PBR, SATI, RIME, PNAZIV, PLOKACIJA) postoje
sledee funkcionalne zavisnosti sporednih od kljunih atributa:
F1:(MBR, PBR) -> SATI
F2: (MBR, PBR) -> RIME
F3: (MBR, PBR) -> (PNAZIV, PLOKACIJA)
F1 je potpuna funkcionalna zavisnost, jer MBR-> SATI i PBR-> SATI zadravaju potpunu
zavisnost F1.
F2 je parcijalna funkcionalna zavisnost jer MBR-> RIME, ali ne (MBR, PBR) -/-> RIME
F3 je takoe parcijalna funkcionalna zavisnost, jer PBR-> (PNAZIV, PLOKACIJA). Stoga u
relaciji RADPROJ postoje samo tri potpune funkcionalne zavisnosti sporednih kljunih atributa:
f1: (MBR, PBR) ->SATI
f2: MBR-> RIME
f3: PBR-> (PNAZIV, PLOKACIJA)
Relacija RADPROJ nije u 2NF jer sporedni atribut RIME nije potpuno funkcionalno zavistan od
kljua (MBR, PBR) zbog funkcionalne zavisnosti f2. Isto vai za sporedne atribute PNAZIV i
PLOKACIJA zbog f3. Stoga se ova relacija razlae na tri nove relacije:
R1(MBR, PBR, SATl)
R2(MBR, RIME)
R3(PBR, PNAZIV, PLOKACIJA)
1 - ema relacije R je u treoj normalnoj formi (3NF) ako i samo ako je u 2NF i ako kod nje ne
postoji tranzitivna zavisnost bilo kog sporednog atributa od primarnog kljua.
2 - ema relacije R je u treoj normalnoj formi (3NF) ako i samo ako je u 2NF i ako kod nje ne
postoji tranzitivna zavisnost bilo kog sporednog atributa od bilo kog kljua te relacije.
11
3 - Neka je X bilo koji skup atributa eme relacije R(A1,A2,...,An). ema relacije R je u treoj
normalnoj formi (3NF) ako uvek kada vai funkcionalna zavisnost X Ai takoe vai da je
a) X super klju relacije R ili da je
(b) Ai primarni atribut relacije R.
Ako je ema relacije R u 2NF, definicije (1) i (2) se mogu koristiti za proveru da li je ema
relacije R u 3NF.
Definicija (3) se moe direktno koristiti za proveru da li je ema relacije u 3NF.
Ako ema relacije R nije u 3NF onda postoji takva dekompozicija relacije R u skup eme relacija
koje su sve u 3NF, a operacijom prirodnog spoja se iz njih moe ponovo dobiti R.
Ako je neka ema relacije R u 2NF, a nije u 3NF tada se za 3NF normalizaciju koristi sledei
postupak baziran na definiciji (2):
U emi relacije R nai sve tranzitivne funkcionalne zavisnosti sporednih atributa relacije
od kljua relacije.
Ako u R(A) vai X -> Z, Z-> Y, tada se R(A) razlae na dve relacije R1(X,Z,W) i
R2(Z,Y), gde je W = A -(X Y Z).
Primer:
U emi relacije RADSEK<MBR,RIME, DATRODJ, ADRESA, SBR, SNAZIV,
SRUK>postoje sledee funkcionalne zavisnosti:
f1: MBR -> RIME . . . . . . . . . . . f2: MBR -> DATRODJ
f3: MBR -> ADRESA . . . . . . . . f4: MBR -> SBR
f5: SBR -> SNAZIV . . . . . . . . .f6: SBR -> SRUK
Koristei pravilo tranzitivnosti mogu se izvesti sledee zavisnosti:
f7: MBR -> SNAZIV . . . . . . . . . f8: MBR -> SRUK
Relacija RADSEK je u 2NF, jer svi sporedni atributi potpuno funkcionalno zavise od
primarnog kljua MBR. Funkcionalne zavisnosti f4, f5, f6 su tranzitivne preko SBR, a SBR nije
podskup kljua relacije RADSEK pa stoga relacija RADSEK nije u 3NF. Relacija RADSEK se
razlae na dve relacije koje su u 3NF:
RADSEK1<MBR, RIME, DATRODJ, ADRESA, SBR>
RADSEK2<SBR, SNAZIV, SRUK>
12
2. PRIMERI NORMALNIH FORMI
Izvor podataka je formular pomou kojeg nabavlja nekog hotela vri narudbine robe
potrebne za hotelsko poslovanje. Objekat NARUDBINA, koji treba da se modelira za potrebe
obrade podataka, ima kao to se to vidi iz priloenog primerka formulara narudbine, vei broj
atributa.
Formular za narudbinu
Druga normalna forma treba da eliminie redundansu podataka to drugim reima znai da:
podatke koji se ponavljaju treba izdvojiti iz relacije,
zatim formirati od svake izdvojene grupe koja se ponavlja novu relaciju, i
svakoj tako dobijenoj relaciji dodati novi klju.
U konkretnom primeru su podaci koji se ponavljaju u formularu narudbine oseneni, tako da od
relacije NARUDBINA dekompozicijom dobijamo dve relacije i to:
REL 1 (sadri podatke o kupcu)
REL 1 <brnar#, datnar, ifkp, nazkp, datis, prim, uknar, ukpop, ukvr >
Odnosno:
REL2 (sadri podatke o kupljenoj, to jest naruenoj robi)
REL2 <brnar#, ifpr#, nazpr, kol, jm, cenpr, vrpr, pop >
Relacija REL2 dobija ovom dekompozicijom sloeni klju brnar#iifpr#, i zato treba utvrditi
zavisnost svakog atributa od tog sloenog kljua. Ukoliko postoje zavisnosti meu atributima,
relaciju treba prevesti u viu, treu normalnu formu.
U relaciji REL2, koja ima sloeni klju, atributi nazpr, jm i cenprzavise samo od ifpr#; dakle od
dela kljua, pa ih zato treba ponovo izdvojiti u posebnu relaciju. Ovako dekomponovani sistem,
koji je u 2. normalnoj formi dobija slijedei izgled:
REL 1 <brnar#, datnar, ifkp, nazkp, datis, prim, uknar, ukpop, ukvr >
REL21 <brnar#, ifpr#, kol, vrpr, pop >
REL22 < ifpr#, nazpr, jm, cenpr >
Trea normalna forma je sledei korak kojim se uklanjanju i eventualne tranzitivne zavisnosti. U
relaciji REL 1 atributi ifkp i nazkp zavise tranzitivno od kljunog atributa relacije brnar#, pa e
se pojaviti redundansa podataka, to jest ponavljanje podataka o ifri, nazivu i adresi kupca
prilikom svake narudbine. Izdvajanjem ova dva atributa u zasebnu relaciju dolazi se do
optimalne, 3 normalne forme:
REL11<brnar#, datnar, ifkp, datis, prim, uknar, ukpop, ukvr >
REL12<ifkp#, nazkp >
REL21 <brnar#, ifpr#, kol, vrpr, pop >
REL22 <ifpr#, nazpr, jm, cenpr >
14
2.2. Primer 2 - NAJMOVI
Tabela se nalazi u prvoj normalnoj formi ako su svi nekljuni atributi funkcionalno zavisni od
kljua.
Definicija proizlazi iz definicije kljua. Naime, ako je neka vrednost atributa jedinstvena kroz
celu tabelu, trivijalno je da su svi ostali atributi funkcionalno zavisni od tog atributa.
Uklanjanje ponavljajuih atributa ili grupa atributa
15
1NF Problem:
Problem sa relacijom Najmovi je u tome to ona sadri previe informacija, tj. sadri informacije:
- i o klijentu,
- i o stanovima,
- o najmovima
- i najmodavcima.
Jedna od bitnih postavki normalizacije jeste ta,da je odvojene informacije potrebno stavljati u
odvojene tabele.
Tabela je u drugoj normalnoj formi ako i samo ako je u 1NF i ako su svi nekljuni atributi
potpuno funkcionalno zavisni od kljua ili svih kljueva.
Odnosno, vrimo uklanjanje atributa zavisnih samo od dela jedinstvenog identifikatorakljua.
16
Trea normalna forma
Tabela je u treoj normalnoj formi ako i samo ako je u 2NF i ako ni jedan nekljuni atribut nije
tranzitivno zavistan od kljua.
Odnosno, vrimo uklanjanje atributa zavisnih od atributa koji nisu deo jedinstvenog
identifikatora.
17
2.3. Primer 3 - STUDENTI
Normalizacija relacije STUDENTI:
18
Druga normalna forma
Relacija je u drugoj normalnoj formi ako je relacija u prvoj normalnoj formi i svi atributi
potpuno funkcionalno zavise od primarnog kljua, a ne od nekog njegovog dela.
2NF je uvek ispunjena kada je primarni klju prost atribut, odnosno kada se primarni klju
sastoji samo od jednog atributa.
Relacija Studenti moe da se prevede u 2NF dekompozicijom relacije Studenti na tri sledee
relacije:
Studenti1 (Broj Indeksa, Ime, Prezime, Semestar, ifra Smera, Smer)
Prijava (Broj Indeksa, ifra Predmeta, Ocena)
Predmeti (ifra Predmeta, Predmet, Profesor)
19
Trea normalna forma
Kae se da je relacija u treoj normalnoj formi ako je u prvoj i drugoj normalnoj formi i ako
svaki atribut koji nije deo primarnog kljua zavisi samo od primarnog kljua, odnosno ne postoji
zavisnost izmeu nekljunih atributa.
Moe se rei da je relacija u 3NF ako je u 2NF i ako svi njeni ne-kljuni atributi zavise od
primarnog kljua.
Za 3NF se zahteva da svaka tabela sadri podatke o samo jednom tipu entiteta.
Relacija Studenti1 ne zadovoljava uslove 3NF jer postoji zavisnost izmeu ne-kljunih atributa
ifra Smera i Smer.
Ova dva atributa su tranzitivno zavisna od primarnog kljua Broj Indeksa.
Dekompozicija
Studenti2 (Broj Indeksa, Ime, Prezime, Semestar)
Smerovi (ifra Smera, Smer)
20
LITERATURA:
[1] Veljovi A., (2005.), Praktikum iz projektovanja informacionih sistema, aak: Kompjuter
biblioteka
[2] Veljovi A., (2003.) Projektovanje informacionih sistema u praksi, aak: Kompjuter
biblioteka
[3] Veljovi A., Razvoj informacionih sistema i baze podataka, aak, Kompjuter biblioteka
[4] Veljovi A., Radojii M., Vesi J., (2008.), Menadment informacionih sistema, aak:
Tehniki fakultet aak
Materijal sa interneta:
www.vtsnis.edu.rs
https://sr.wikipedia.org/sr/
www.vps.ns.ac.rs/Materijal/mat517.pdf
www.razno.sveznadar.info/10-doc-PDF/Normalizacija.pdf
www.ekfak.kg.ac.rs/.../Baze%20Podataka/.../BP%208%20Normalizacija
21