Professional Documents
Culture Documents
Distribuirane Baze Podataka
Distribuirane Baze Podataka
Baze
Tema: Distribuirane baze podataka
*** SPECIJALISTIKE STUDIJE ***
OBRADA
LANSIRANJE
LI^NIH PRODAJA
PROIZVODNJE
ZARADA
OBRADA
LANSIRANJE
LI^NIH PRODAJA
PROIZVODNJE
ZARADA
SISTEM ZA
UPRAVLJANJE
BAZOM PODATAKA
(SUBP)
BAZA
PODATAKA
Eksterna
KONC/EKS PRESL. A KONC/EKS PRESL. B
ema
RE^NIK
PODATAKA
KONCEPTUALNI
EMA
[ E M A NIVO
Konceptualna
ema
KONCEPTUALNO/INTERNO PRESLIKAVANJE
INTERNI
ADMINISTRATOR NIVO
BAZE
PODATAKA
Interna
BAZA PODATAKA
ema
Opta arhitektura SUBP- 3 eme
ANSI/SPARC arhitektura
PODELA BAZA PODATAKA
Operacijske
Distribuirane baze podataka
Eksterne baze podataka
Data Warehouse
h i Data Mining
i i
Hipermedijalne baze podataka na
Web-u.
Operacijske ( transakcijske,
produkcijske ) baze podataka:
sva
procesiranja,
upravljanje
RDBMS,
upravljanje
aplikacijama
p j j komunikacijom
Upravljanje j
IInteligentni
t li t i
termilali
PC/File server
Obrada podataka PC/File serverom je podrazumevala pokretanje
aplikacije RDBMS-a na samom PC raunaru. Druga veoma vana
tehnologija je bila lokalna mrea (LAN) i njena integracija u firmama
irom sveta. Radilo se dakle o relacionojj bazi podataka
p u heterogenom
g
mrenom okruenju. Iako su korisnici bili naviknuti na terminalske
konekcije ka firminom mainframe-u , sada su fajlovi koji su se obraivali
mogli da sauvaju na lokalnom kompjuteru pa da im se pristupa i sa
nekog drugog kompjutera prikljuenog na istu lokalnu mreu.
DBMS samo na
serveru
PC/mini/mainframe
obezbeuje
j sve servise
Aplikaciona logika u Klijent-Server
sistemima
Presentation Logic
Input keyboard/mouse
GUI Interface
Output monitor/printer
Processing Logic
I/O processing Procedures, functions,
Business rules programs
Data management
Storage Logic
Data storage/retrieval DBMS activities
Fig 1 Arhitektura Klijent/Server sistema na NET_u
Glavne komponente korisnikog procesora su:
Transaction Manager.
g
Transaction Manager i
Core System.
j FragmentAction
Drugii je
D F tA ti stablo
t bl za svaki
ki nod,
d koje
k j opisuje
i j
proces fragmentacije za svakun relaciju. Ovim stablom moemo
lako oporaviti formular za rekonstrukciju.
Q
Query Tree
T j sredinja
je di j struktura
t kt podataka
d t k za d
dekompoziciju
k i ij i
lokalizaciju, i ima uticaja na optimizaciju i izvravanje upita.
SQL Parser
SQL parser je master modul jezgra sistema, koje je srce naeg
korisnikog procesora,
procesora jer jedino skup ulaznih SQL naredbi proputenih
kroz parser, mogu kao takve biti izvrene.
Parser se generie famoznim lex and yacc ( computer program yacc je
parser generator ) .
nPC
PC na strani
t i klij
klijenta
t
Servera aplikacija
Servera baze podataka
GUI iinterface
f Browser
Klijent (I/O processing)
Clijent
j
PC klijent je samo za korisniki interfejs ili procesiranje
jednostavnih aplikacija. Nekada nemaju svoje hard
di k !
diskove!
Delovi aplikacije koji su zadueni za poslovnu logiku instaliraju
se na posebnom serveru Business Logic,
Aplikacije
lk na srednjem
d nivou se lako
l k administriraju,
d a svaka
k
promena na serveru ne zahteva promenu na korisnikim
aplikacijama. Praktino, ostvaruje se nezavisnost u smislu:
U njima
j se razliite funkcije
j srednjeg
j g sloja
j (middleware)
raslojavaju, da bi se preko veeg broja slojeva, odnosno veeg
stepena indirekcije, omoguila vea modularnost, heterogenost i
elastinost sistema.
PEER to PEER Distribuirani DBMS
Service Oriented Architecture Protocol
SOA - Servce
Oriented
Architecture, kao
koncept za
povezivanje vie
sistema i
obezbeenje
potrebnih servisa.
ta je to distribuirani objekat?
Distribuirani objekat je objekat koji se definie na jednom
sistemu a moe se koristiti na drugom. U toj komunikaciji mogu
uestvovati jedan ili vie kompjutera. Cilj je da se obezbedi
integracija servisa sa razliitih platformi
platformi.
CORBA
EJB / RMI preko IIOP
EJB (Enterprise JavaBeans) je specifikacija
koju je izdao Sun Microsystems za Java
Platformu. EJB je nezavisna od platforme, ali ne i
od jezika. Svi EJB objekti moraju biti napisani u
j ik JJava. Z
jeziku Za k
komunikaciju
ik ij iizmeu
razliitih
liitih
sistema, EJB koristi varijantu IIOP nazvanu RMI
preko IIOP (Remote Method Invocation over
IIOP). RMI je protokol rezervisan samo za Javu.
SOAP
SOAP (Simple Object Access Protocol) je kompletno kreiran nad
postojeim, proverenim i iroko prihvaenim tehnologijama kao to su
HTTP i XML. SOAP koristi XML za prenos podataka izmeu aplikacija,
a poto je XML univerzalni standard, sve platforme mogu da pristupe i
obrade informaciju.
Poto koristi HTTP, jednostavno prolazi kroz port 80, tako da firewall-ovi
ne p
predstavljaju
j j p
problem. Pristup
p razliitim aplikacijama
p j na raznim
platformama sa SOAP-om postaje jednostavan:
Java aplikacija na Unix-u jednostavno moe da poziva metode COM objekta
na Windows serveru.
Klijentska aplikacija na Mac-u
Mac u pristupa objektu na mainframe raunaru
raunaru.
Programski
Nezavistan Nezavistan Java Nezavistan
jezik
CORBA HTTP/SSL,
Win NT
Si
Sigurnost
t security
it J
Java security
it XML
Security
service signature
Opis tipova
IDL XML Schemas
podataka
CORBA event
Dogaaji COM+ Events
service
Motivacija za uvoenje ovakvih
arhitektura:
distribucija podataka
raspodela delova BP na vie servera
(raunara) u mrei
omoguena uvoenjem
di ib i
distribuirane arhitekture
hi k BP
Distribucija podataka
Razlozi
podaci nastaju i koriste se na vie, meusobno udaljenih
lokacija realnog sistema
realni sistem je geografski razuen
prirodno oekivanje da arhitektura IS prati geografsku
strukturu realnog sistema
Ciljevi
Da ppotrebni podaci
p iz BP budu zadovoljavajue
j j brzo
raspoloivi na vie lokacija istovremeno
Efikasno auriranje BP sa vie lokacija, u isto vreme
Ouvanjej svih teoretskih principa
p p i praktinih
p
dostignua
na kojima su, generalno, zasnovani savremeni SUBP i modeli
podataka
u uslovima
l i distribucije
di ib ij BP na vie
i lokacija
l k ij
Distribuirana BP BP u kojoj su podaci
smeteni na barem dva servera BP
logiki jedinstvena BP
opisana putem jedinstvene logike eme BP
sa fiziki distribuiranim delovima
opis fizike strukture ukljuuje specifikaciju distribucije delova
BP
Preduslov
postojanje raunarske mree koja povezuje servere BP
na barem treem nivou ISO/OSI arhitekture
Distribuirana obrada podataka
obrada podataka nad distribuiranom BP, je takva
da:
Oekivani efekti:
via raspololoivost IS-a
vea verovatnoa da e sistem korektno funkcionisati, kada
je to korisnicima potrebno
otkaz jednog servera u sistemu ne znai i otkaz celog
sistema, to je sluaj kod centralizovane arhitekture
homogeni
na svim serverima BP je upotrebljen isti
SUBP za podrku distribuirane BP
heterogeni
upotrebljeno je najmanje dva, bitno
razliita SUBP za podrku distribuirane BP
Nivoi rada nad distribuiranom BP
Lokalni nivo podataka
opredeljen participiranjem tano jednog servera
distribuirane BP,
BP u obradi podataka
lokalna transakcija
lokalni upit
lokalno auriranje
lokalni korisnik
Globalni ((distribuirani)) nivo podataka
p
opredeljen participiranjem vie od jednog servera
distribuirane BP, u obradi podataka
globalna
l b l (distribuirana)
(di ib i ) transakcija
k ij
globalni (distribuirani) upit
globalno (distribuirano) auriranje
globalni korisnik
Definicija DISTIBUIRANIH BAZA
1
1. Lokalna autonomija lokalnim podacima se upravlja
nezavisno od ostalih mesta;
2. Nezavisnost od lokacije korisnici i programeri ne
moraju znati lokaciju ili put do podataka;
3. Nepostojanje centralnog mesta ni jedno mesto nije
vanije od drugog;
4. Neprekinuti rad ni jedna planirana aktivnost ne bi
trebala kao preduslov za svoje izvravanje traiti
"
"sputanje"
j " (engl.
( shutdown)
h d ) baze podataka;
5. Nezavisnost od deljenja tabelu (relaciju) koja je
fragmentirana (podeljena) korisnici i dalje vide kao
jedinstvenu tablicu;
Chris Date-ova 10 pravila
6. Nezavisnost
N i odd replikacije
lik ij transparentno upravljanje,
lj j
pristup i auriranje redundantnih podataka,
rekonstruisanje
j nakon ispada
p zbog
g razliitih g
greaka;;
7. Optimizaciju distribuiranih upita i nezavisnost od
performansi;
8. U
Upravljanje
lj j distribuiranim
di t ib i i transakcijama:
t k ij umetnute
t t
transakcije koje auriraju vie mesta izvravaju se sa
istovremenom kontrolom i oporavkom od konflikata;
9. Nezavisnost od hardvera, operativnog sistema, mree,
baze podataka;
10. P t j j distribuiranog
Postojanje di t ib i pristupa
it reniku
ik podataka.
d t k
Definicija
Distribuirana baza podataka fiziki delovi
baze se nalaze na razliitim vorovima mree
Predstavljaju federativne (viestruke) baze
podataka virtuelna integracija razliitih baza
Paralelne arhitekture podtipovi:
deljiva memorija
deljivi diskovi
nita deljivo nezavisni procesori sa sopstvenom
memorijom u mrei velike brzine (bus ili switch)
memorijom,
DBP predstavlja
d t lj
Kolekciju vorova sa lokalnim SUBP i
sposobnou kolaboracije sa bazama na
drugim vorovima
Karakteristike:
a a te st e:
lokalna autonomija (obrade, uvanja podataka)
logiki jedinstvena velika baza podataka
OSOBINE DDBMS
Skup logiki povezanih deljivih podataka
Podaci su razdvojeni na vie fragmenata
Fragmenti se mogu replicirati
Fragmenti/Replikacije pripadaju lokacijama
Lokacije su povezane komunikacijskom mreom
Podaci na svakoj lokaciji su pod nadzorom
DBMS-a
DBMS na svakoj lokaciji moe upravljati
lokalnim aplikacijama autonomno
Svaki DBMS uestvuje u najmanje jednoj
globalnoj aplikaciji.
Karakteristike DDB sistema
Na osnovu predhodnog, postoji est osnovnih
karakteristika distribuiranih sistema. To su:
Data
Tower box
Lokacija 4 Lokacija 2
RAUNALNA
MREA
Lokacija 3
Tower box
Osnovna struktura DDBMS
Disrtibuirani centri podataka
p
Distrubuirani klijent/server
j / model
Klijent/server model na Internetu
Osnovna klasifikacija DDBMS
Homogeni sistem
Sve lokacije koriste isti DBMS rezultat ( proizvod )
Mnogo je laki za projektovanje i upravljanje
Pristup prua inkrementalni rast i omoguava poveanje
performansi
Heterogeni sistem
Na lokacijama se mogu pokretati razliiti DBMS sistemi, uz
mogue razliite osnovne modele podataka
O se deava
Ovo d k
kada
d llokacije
k ij prvo iimplementiraju
l ti j svoju
j bazu
b
podataka a integracija se uzima u obzira kasnije
Translacija je potrebna kako bi se omoguila upotreba
razliitih hardvera i/ili razliitih DBMS proizvoda
Tipino reenje je korienje gateway-a
Homogene Database
Identical DBMSs
Non-identical DBMSs
Prednosti Nedostaci
Poboljana
j deljivost
j i lokalna Trokovi
autonomija
Poboljana raspoloivost Sigurnost
Local internal shema: predstavlja ugraeni lokalni DBMS sistem koji upravlja
fragmentiranjem baze podataka
Application Layer
USER INTERFACE MANAGER LOCAL DATABASE MANAGER
-analizira korisnike transakcije -upravlja pristupom lokalnoj
-determinie lokaciju podataka bazi
-prikazuje
prikazuje korisnike rezultate
PRESENTATION LAYER
USER INTERFACE MANAGER
Ovaj modul:
-prevodi
prevodi upite u glabalnu formu,
formu TRANSACTION PLAN GENERATOR
-determinie lokacije podataka
za traene upite -generie optimalni plan izuvrenja
-predaje kontrolu LTMS ako je da bi optimizirao performanse
transakcija lokalnog karaktera ili dolazeih transakcija
modulu za analiziranje globalne -obavllja dekompoziciju transakcije u
transakcije GTA ako transakcija subtransakciju koja se moe
trai pristup podacima na izvravati na razliitim nodovima kao
udaljenoj lokaciji lokalna transakcija
-prikazuje sve korisnike -translacija eme sa globalne na
rezultate generisane kroz lokalnu subtransakciju j
izvrenje
transakcije
GLOBAL TRANSACTION EXECUTION
MONITOR
- fragmentacija podataka
- distribuisana obrada upita
p
- distribuisano auriranje
- upravljanje katalogom
- distribuisano izvrenje skupa transakcija, to
ukljuuje konkurentnost, integritet, oporavak
i protokole kompletiranja transakcija
Fragmentacija podataka
Podaci u distribuiranom sistemu mogu biti
particionisani ili ponovljeni u fizikoj memoriji.
memoriji
Logiki
g skup
p podataka
p u relacionom sistemu jje
relacija, a prirodni fragment relacije je neki njen
podskup definisan uslovom projekcije i restrikcije.
U trokovima
t k i obrade
b d najveij i udeo
d imaju
i j trokovi
t k i mrene
komunikacije, tj. prenosa podataka kroz mreu, dok su trokovi
komunikacije sa ulazno/izlaznim uredajima i korienja
procesora manji za nekoliko reda veliine. Zbog toga je vrlo
znaajno,
j u zavisnosti
i ti od
d propusnosti
ti mree
( koliina
k lii podataka
d t k
koju moe primiti u sekundi ) i vremena kanjenja, pravilno
odabrati relacije i njihove fragmente koji e biti prenoeni sa
jedne lokacije na drugu sa ciljem obrade upita - globalna
optimizacija
ti i ij .
- slog kataloga za svaki objekat roden na toj lokaciji ( tj. ija je prva kopija
kreirana na toj lokaciji); ovaj slog sadri i informaciju o trenutnoj lokaciji objekta