You are on page 1of 12

ORGANIZAREA DATELOR N MEMORIA EXTERN

Organizarea datelor nseamn definirea i structurarea datelor n memoria intern sau n memoria extern (n colecii) i stabilirea legturilor ntre date, conform unui model de date.

Organizarea datelor n fiiere


Fisierul este o colecie organizat de date unite dup criteria comune calitative, de prelucrare i scop. 1. Caracteristici ale unui fiier: actualizarea se refer la trei operaii : adaugarea, modificarea, tergerea de nregistrri; natura datelor din fiier trebuie s fie omogen (s se refere la aceeai entitate din lumea real); prelucrarea datelor din fiier se refer la tipul i frecvena operaiilor efectuate pe nregistrri; volumul de date din fiier (se msoar n numr de octei). 2. Structura unui fiier: partea de identificare este dat de etichetele plasate la nceputul i sfritul fiierului; partea de date este colecia omogen de date ce aparin aceleai entiti din lumea real structurat astfel: fiier nregistrri cmpuri valori. 3. Modul de organizare reprezint modul de dispunere a nregistrrilor pe suportul fizic i presupune reguli de memorare a datelor. Categorii de moduri de organizare a fiierelor: a) Standard Este cea mai veche i exist pe toate tipurile de calculatoare. nregistrarea este format dintr-un ir de caractere dispus pe o linie acceptat de periferic. Toate limbajele recunosc fiiere standard de intrare i ieire. b) Clasic (elementar) Organizarea se face pe medii magnetice sau optice. Tipuri: SECVENIAL nregistrrile sunt dispuse n fiier una dup alta fr nici o ordine prestabilit. Localizarea unei nregistrri se face prin parcurgerea tuturor nregistrrilor anterioare ei (secvenial). Toate sistemele de operare i limbajele de programare accept organizarea secvenial. RELATIV nregistrrile sunt dispuse n fiier una dup alta i numerotate (de ctre sistem) de la 0 sau 1 la cte sunt (numr de realizare). Localizarea unei nregistrri se poate face secvenial sau direct prin numrul de realizare. INDEXAT-SECVENIAL nregistrrile sunt dispuse n fiier n ordine strict cresctoare dup o cheie (face parte din nregistrare).

Cheia este unul sau mai multe cmpuri care identific n mod unic o nregistrare. Fiierului i este ataat o tabel de indeci care face legtura ntre valoarea cheii i adresa fizic a nregistrrii. Localizarea unei nregistrri se poate face secvenial dar i direct prin cheie: se compar cheia nregistrrii cutate cu indecii din tabela de index i se localizeaz direct partea fizic a fiierului n care se afl nregistrarea cutat; n partea fizic localizat se face o cutare secvenial a nregistrrii dorite. c) Special (complex) Se bazeaz pe modurile de organizare clasice. Sunt utilizate n baze de date i n sisteme de fiiere. Tipuri (cteva): PARTIIONAREA nregistrrile din fiier sunt grupate n partiii sub un nume. n cadrul unei partiii nregistrrile sunt organizate secvenial. Se utilizeaz pentru bibliotecile de programe MULTIINDEXAREA Este o extindere a indexrii prin utilizarea mai multor chei alese de programator. Spaiul ocupat este mai mare. Se utilizeaz pentru fiiere care necesit regsiri intense multicriteriale. INVERS Presupune existena a dou fiiere: de baz i invers. Fiierul de baz conine datele propriu-zise i are organizare secvenial. El este fiierul n care se caut. Fiierul invers este construit din cel de baz (printr-o tehnic de inversare) i are organizare relativ. El este fiierul prin intermediul cruia se caut. Spaiul ocupat necesar este cam de 3,5 ori mai mare fa de ct ocup fiierul de baz. 4) Modul de acces reprezint modul n care se determin locul ocupat de o nregistrare ntr -un fiier i depinde de modul de organizare. Tipuri de moduri de acces pentru fiiere: SECVENIAL presupune c localizarea unei nregistrri se face prin parcurgerea tuturor nregistrrilor care o preced. Este permis accesul secvenial pentru toate tipurile de fiiere. Se recomand pentru fiierele din care sunt necesare, la o prelucrare, peste 50% din numrul total de nregistrri. Pentru optimizare se recomand ordonarea fiierului. DIRECT presupune c localizarea unei nregistrri se face cu ajutorul unei chei definite de programator. DINAMIC presupune c la o singur deschidere de fiier se pot localiza, alternativ i repetat, nregistrri n acces secvenial i direct.

Modele de structurare a datelor n BD


Modelul de date este compus din: concepte; un formalism pentru a descrie datele (structura de date); un ansamblu de operatori pentru a le manipula (datele).

n literatura de specialitate [RICC01], [RAGE00] sunt prezentate trei tipuri de modele de date pentru baze de date. Prezentm, pe scurt, aceste tipuri, mpreun cu cteva caracteristici pentru fiecare: modelul conceptual (la analiz) - descrie sistemul n termeni pe nelesul utilizatorului; - se folosete pentru specificaia iniial a datelor i pentru comunicarea cu utilizatorii; - este un mod de stabilire a unei legturi ntre dezvoltatori i utilizatori. modelul logic (la proiectare) - specific structura bazei de date (coleciile de date i legturile dintre ele); - se scrie ntr-o form care s poat fi folosit pentru crearea bazei de date; - se folosete pentru definirea i ntreinerea bazei de date de ctre SGBD i pentru formularea cerinelor de regsire de ctre utilizatori. modelul fizic (sarcina SGBD) - descrie modul n care modelul logic al datelor va fi reprezentat la stocare, n memoria extern (fiiere, indeci, discuri etc.); - de obicei, este generat automat, de ctre SGBD, pornind de la modelul logic. Schema [conceptual] reprezint descrierea fenomenelor din realitatea nconjurtoare prin entiti i atribute (tipurile de date), mpreun cu toate corelaiile (legturile) dintre ele (constrngerile). Definirea schemei este o activitate de modelare pentru c traduce n termeni abstraci entitile lumii reale. Schema BD se reprezint cu ajutorul unui model de date implementat prin intermediul unui SGBD adecvat. Trebuie s se fac distincie clar ntre structura bazei de date (schema, de exemplu: stud(cod:N,4; nume:C,15) ) i coninutul ei (instana, de exemplu: 22 Nedelcu Anda). Schema i instanele sunt stocate n baza de date, i anume prima n dicionar, iar cea de -a doua n datele propriu-zise. n cele ce urmeaz ne vom ocupa, n cea mai mare parte, de modelul logic de date pentru baze de date. Elementele (componentele) oricrui model de date pentru baze de date sunt: 1. Definirea structurii modelului (partea structural): - definirea entitilor i a atributelor asociate; - definirea legturilor (asociarea) dintre entiti. Asocierea poate fi de tipul : - unu la unu (1:1) - unu la muli (1:M) - muli la muli (M:N) - neprecizat explicit Definirea structurii de date se face cu un LDD (Limbaj de Descriere a Datelor) dintr-un SGBD. 2. Operatorii modelului (partea de manipulare) care acioneaz asupra structurilor de date, dar i asupra datelor, pentru operaii de prelucrare (compunere, actualizare etc.). Operatorii se implementeaz cu ajutorul unui LMD (Limbaj de Manipulare a Dat elor) dintr-un SGBD. 3. Regulile de integritate (partea de coeren) sunt restricii stabilite la descrierea datelor, care le asigur acestora meninerea corectitudinii i dau logica modelului. Restriciile se implementeaz cu un LDD din SGBD.

Tipuri de modele logice de date pentru BD: fundamentale: ierarhice, reea, relaionale, orientate obiect; derivate (extinse din cele fundamentale): distribuite, multimedia etc. Prezentm, n continuare, principalele caracteristici pentru modelele de date fundam entare (de baz) pentru baze de date. I. Modelul ierarhic 1. Definirea structurii modelului ierarhic. a) Definirea entitilor se face prin noiune de tip de nregistrare (clas de entiti), care este format din caracteristici (cmpuri). Realizarea (instana) unui tip de nregistrare este dat de ansamblul valorilor pentru cmpurile acesteia (nregistrarea). b) Definirea legturilor dintre entiti se face fizic i conduce la structura de tip ierarhic (arborescent) reprezenat sub forma unei diagrame Caracteristici ale structurii ierarhice (arborescente): Fiecare nod corespunde unui tip de nregistrare i fiecare drum corespunde unei legturi (asocieri). Orice acces la un nod se face prin vrful ierarhiei, numit rdcin, pe o singur cale. Un nod subordonat (copil) nu poate avea dect un singur superior (printe). Un superior poate avea unul sau mai muli subordonai. Legtura copil-printe este doar de tip 1:1 (la o realizare copil corespunde o singur realizare printe). Legtura printe-copil poate fi de tip 1:1 sau 1:M. n structur exist un singur nod rdcin i unul sau mai multe noduri dependente situate pe unul sau mai multe niveluri. - ierarhie de tipuri de nregistrri se numete tip arbore. - realizare a unui tip arbore este format dintr-o singur realizare a tipului de nregistrare rdcin mpreun cu o mulime ordonat format din una sau mai multe realizri ale fiecrui tip de nregistrare de pe nivelurile inferioare. Ordonarea realizrilor dintr-un arbore conduce la o secven ierarhic. 2. Operatorii modelului ierarhic Localizarea unui arbore n BD: se localizeaz o realizare a tipului de nregistrare rdcin. Trecerea de la un arbore la altul n BD: se trece de la o realizare a tipului nregistrare rdcin (secven ierarhic) la o alt realizare a aceluiai tip nregistrare rdcin. Trecerea de la o realizare (nregistrare) la alta ntr-un arbore (secven ierarhic) : se poate face trecerea pe acelai nivel sau pe niveluri diferite ntre tipuri de nregistrri legate ntre ele. Actualizarea ntr-un arbore : adugarea, modificarea sau tergerea unei nregistrri. Operaia este greoaie i consumatoare de resurse calculator (spaiu i timp) pentru c antreneaz automat toate nregistrrile din arbore care se nlnuie cu nregistrarea actualizat. Not. Operatorii de mai sus sunt la nivel de nregistrare; acioneaz pe o nregistrare i produc tot o nregistrare. Exist i operatori la nivel de mulime de nregistrri care se implementeaz n LMD mult mai

greu. 3. Restriciile de integritate ale modelului ierarhic. Realizarea subordonat este totdeauna asociat unei singure realizri superior. Dac un tip de nregistrare nu are realizri atunci nici tipurile nregistrri descendente nu au realizri. Not. Efectele restriciilor de integritate sunt: - complicarea operaiei de actualizare; - dac o realizare a unui nod subordonat trebuie s fie asociat cu mai multe realizri ale nodului printe atunci ea trebuie multiplicat (crete redundana); - dau logica i corena modelului arborescent. Caracterizarea general a modelului ierarhic. 1. Modelul a fost propus de ctre IBM i a fost primul utilizat pentru BD. 2. Structura modelului este simpl (graf orientat) familiar specialitilor n informatic. 3. Implementarea modelului se face fizic i condiioneaz performanele BD: - prin pointeri, utiliznd diferite metode (liste simplu nlnuite, vectori de pointeri, chei primare etc.); - secvenial, fiecare realizare a unui arbore corespunde unei nregistrri (logice) dintr-un fiier secvenial. 4. Aplicabilitatea modelului se regsete cu succes n tehnologia construciilor de maini, dar i n alte domenii. 5. Limitele modelului ierarhic: - numrul de ierarhii posibile crete combinatoric cu numrul nregistrrilor, n legtura printe-copil; - actualizarea datelor este groaie i consumatoare de resurse calculator; - nivelul logic nu este separat clar de cel fizic (exemplu: indecii pot fi structuri logice dar i fizice); - nu se poate realiza legtura de tip M:N 6. Exemplu de SGBD ierarhic este IMS (Information Management System) realizat de ctre IBM. 7. Baza de date ierarhic este o mulime ordonat de realizri ale unui tip arbore. II. Modelul reea 1. Definirea structurii modelului reea. a) Definirea entitilor se face prin noiunea de tip de nregistrare, care este format din caracteristici (cmpuri). Realizarea (instana) unui tip de nregistrare este dat de ansamblul valorilor pentru cmpurile acestuia (nregistrarea). b) Definirea legturilor dintre entiti se face fizic i conduce la o structur de tip reea, reprezentat sub forma unei diagrame (fig. 2.3.) numit i schema (conceptual). Caracteristici ale structurii reea : - Un nod poate avea orici superiori i orici subordonai. - Pot exista mai multe tip de nregistrare rdcin. - La un subordonat se poate ajunge pe mai multe ci. - Este o extensie a structurii arborescente n care graful nu mai este limitat. - Legturile n model pot fi 1:1, 1:M, M:N, ciclice. - Pentru exprimarea legturilor se folosete conceptul de tip set. Un tip set este format dintr-un singur tip de nod proprietar i unul sau mai multe tipuri de noduri membre dependente de cel proprietar.

- Realizarea tipului set este o colecie de nregistrri care are o realizare proprietar i un numr de realizri membre asociate. 2. Operatorii modelului reea. - Localizarea unui tip set: se identific o realizare a unui nod proprietar. - Trecerea de la o nregistrare la alta n cadrul unui set: proprietar-membru, membru-proprietar, membru-membru. - Actualizarea ntr-un set: adugarea, modificarea, tergerea unor membri. - Actualizarea ntr-o reea: adugarea, modificarea, tergerea unor seturi. Not. Operaiile de actualizare sunt greoaie i mari consumatoare de resurse calculator. Aceasta, deoarece sunt antrenate ntotdeauna nregistrrile dintr -unul sau mai multe seturi. - Localizarea unei nregistrri pe baza valorii unui cmp (cheie). 3. Restriciile de integritate ale modelului reea. - O nregistrare nu poate fi membr a dou realizri ale aceluiai tip set. nregistrarea se va multiplica. - O nregistrare poate s aparin mai multor tipuri set prin multiplicare. - Un tip de nregistrare poate fi nod proprietar ntr-un set i nod membru n alt set. - Un set poate avea un singur nod proprietar. Not. Efectele restriciilor de integritate sunt: - dau logica i coerena modelului reea; - complic operaia de actualizare; - introduce o redundan controlat. Caracterizarea general a modelului reea. 1. A fost propus de CODASYL ca soluie pentru a se elimina limitele modelului ierarhic. 2. Se poate utiliza pentru domenii variate din lumea real, deoarece permite reprezentarea unor structuri complexe. 3. Implementarea modelului se face fizic i condiioneaz performanele BD: - prin pointeri structurai n liste nlnuite, de diferite tipuri (owner, prior, next); - prin hart de bii (matrice cu nregistrri, iar la intersecie sunt legturile: 1 -da, 0nu). 4. Limitele modelului reea: - complexitatea modelului l face dificil de implementat; - legturile din model nu sunt ntotdeauna foarte clare; - prelucrarea nregistrrilor se face secvenial; - actualizarea este greoaie i consumatoare de resurse calculator ; - reproiectarea este dificil datorit complexitii ridicate. 5. Exemple de SGBD reea : IDMS (Integrated Database Management System), Socrate. 6. Baza de date reea este o mulime oarecare de tipuri de nregistrri structurate pe tipuri set. III. Modelul relaional 1. Definirea structurii modelului relaional. a) Definirea entitilor se face sub forma unor tablouri bidimensionale numite tabele sau relaii de date. Conceptele utilizate sunt: domeniu este un ansamblu de valori caracterizat printr-un nume.el poate fi explicit (se enumera valorile posibile, de exemplu D1:{m, f}) sau implicit (se precizeaza proprietatile valorilor, de exemplu D1:{a/aN}).

tabela/relaia este un subansamblu al produsului cartezian al mai multor domenii, caracterizat printr-un nume. atributul este coloana unei tabele, caracterizata printr-un nume. tuplul este linia dintr-o tabel i nu are nume. Not. ordinea liniilor (tupluri) i coloanelor (atribute) dintr-o tabel nu trebuie s prezinte nici-o importan. schema tabelei este numele tabelei, urmat intre paranteze rotunde de lista atributelor, iar pentru fiecare atribut se precizeaza domeniul asociat. cheia este un atribut sau un ansamblu de atribute care au rolul de a identifica un tuplu dintr-o tabela. tipuri de chei: primare/alternate, simple/comune, externe. schema relaional este schema tabelei + cheile + restrictiile de integritate. Exemplu. Fie tabela STUDENT cu atributele: NUME din domeniul D1 (numele de persoane), ANSTUDIU din domeniul D2(anii de studiu dintr-o facultate), ANNATERE din domeniul D3(anii calendaristici Definirea legturilor dintre entiti se face logic construind asocieri ntre tabele cu ajutorul unor atribute de legtur. Legturile se pot reprezenta sub forma unei diagrame de structur (fig. 2.4.) numit i schema BD. Exemplu. Fie o BD privind desfacerea n care am identificat tabelele: BENI, CONTR, PROD. Legturile dintre tabele sunt: un beneficiar poate ncheia mai multe contracte (1:M); un produs se poate livra prin mai multe contracte (1:M); un beneficiar poate cumpra mai multe produse i un produs se poate livra ctre mai muli beneficiari (M:N). Caracteristici ale structurii relaionale: Atributele implicate n realizarea legturilor se gsesc fie n tabelele asociate, fie n tabele distincte construite special pentru legturi. Atributul din tabela iniial se numete cheie extern iar cel din tabela final este cheie primar. Legturile posibile sunt 1:1, 1:M, M:N. Potenial, orice tabel se poate lega cu orice tabel, dup orice atribute. Legturile se stabilesc la momentul descrierii datelor (prin LDD) cu ajutorul restriciilor de integritate. Practic, se stabilesc i legturi dinamice la momentul execuiei. 1. Operatorii modelului relaional. a) Operatori din algebra relaional: standard: selecia proiecia, jonciunea, reuniunea, diferena, produsul cartezian, intersecia, diviziunea; extensii : complementarea, descompunerea (splitarea) etc. Not. Operatorii algebrei relaionale acioneaz la nivel de tabel n expresii relaionale. Operanzii sunt tabele iar rezultatul este ntotdeauna o tabel. b) Operatorii din calculul relaional: orientai pe tuplu: conectivele (conjuncia , disjuncia , negaia ), cuantificatorii (existenial , universal );

orientai pe domeniu: idem ca mai sus. Not. Pentru operatorii calcului relaional operandul poate fi tuplu sau domeniu. 2. Restriciile de integritate ale modelului relaional. a) Structurale sunt cele care se definesc prin compararea unor valori din tabele: cheie unic: ntr-o tabel nu trebuie s existe mai multe tupluri cu aceeai valoare pentru ansamblul cheie; referenial: ntr-o tabel T1 care refer o tabel T2, valorile cheii externe trebuie s figureze printre valorile cheii primare din T2 sau s ia valoarea NULL (neprecizat); entitii: ntr-o tabel, atributele din cheia primar nu trebuie s ia valoarea NULL. Not. Cele trei restricii de mai sus sunt minimale. Pe lng acestea, exist o serie de alte restricii structurale care se refer la dependenele dintre date: funcionale, multivaloare, jonciune etc. (sunt luate n considerare la tehnicile de proiectare BD relaionale). b) Semantice sunt cele care se definesc prin comportamentul datelor i in cont de valorile din BD: restricia de domeniu: domeniul corespunztor unui atribut dintr-o tabel trebuie s se ncadreze ntre anumite valori; restricii temporare: valorile anumitor atribute se compar cu nite valori temporare (rezultate din calcule etc.). Not. Restriciile semantice fiind foarte generale se gestioneaz fie la momentul descrierii datelor (de exemplu prin clauza CHECK), fie n afara modelului la momentul execuiei (de exemplu prin instruciunea IF) . Caracterizarea general a modelului relaional. 1. A fost propus de ctre IBM i a revoluionat reprezentarea datelor n BD fcnd trecerea la o nou generaie (a doua). 2. Modelul este simplu, are o solid fundamentare teoretic fiind bazat pe teoria seturilor (ansamblurilor) i pe logica matematic. 3. Pot fi reprezentate toate tipurile de structuri de date de mare complexitate, din diferite domenii de activitate. 4. Implementarea modelului se face logic prin atribute avnd rol de chei. 5. Limitele modelului relaional: prea marea simplitate a modelului l face dificil de aplicat pentru noile tipuri de aplicaii (multimedia, internet etc.); nu asigur o independen logic total a datelor de aplicaie; pentru aplicaii de volum i complexitate foarte mari nu mai face fa; poate introduce o redundan prea mare (la proiectare prin tehnica de normalizare). 6. Baza de date relaional este un ansamblu de tabele prin care se reprezint att datele ct i legturile dintre ele IV. Modelul orientat obiect 1. Definirea structurii modelului orientat obiect (OO). a) Definirea obiectelor se face cu ajutorul conceptului de clas de obiecte care este definit din entitatea regsit n lumea real. Se pune accentul att pe date ct i pe comportamentul acestora, ambele ncapsulate n obiect. Conceptele utilizate sunt: clasele (tipurile) de obiecte sunt un tip abstract de date prin care se defineste structura obiectelor (proprietatile) si comportamentul (metodele) acestora. obiectele reprezinta o colectie de proprietati care se refera la aceeasi entitate.

obiectul are: un nume prin care este referit ; un identificator unic atribuit de sistem; implementare care este privat; interfa care este public. metoda reprezint operaiile permise asupra obiectului, deci comportamentul (funcionalitatea) acestuia. mesajul reprezint cereri adresate obiectelor pentru a returna o valoare sau o stare. caracteristici (principii) fundamentale (de baza) ale obiectelor: incapsurarea : descrierea obiectelor se face astfel incat nu se poate avea acces din afara obiectului la datele sale; polimorfismul : diferite obiecte pot rspunde diferit la aceleai mesaje; motenirea : capacitatea unui obiect de a-i deriva datele i funcionalitatea din alt obiect. instana unei clase reprezint realizarea unei clase, dat de valorile variabilelor aferente. b) Definirea legturilor ntre obiecte se realizeaz implicit prin modul de construire (definire) al obiectelor. Tipurile de legturi n modelul OO sunt: ierarhice, caracterizate prin: clasa de obiecte este structura de baz a modelului; fiecare obiect are un identificator unic; toate obiectele sunt membri ai unei clase; clasele sunt structurate n ierarhii avnd caracteristica de motenire; prin obiecte se pot defini orice tip de date (text, grafic, imagine, sunet, video etc.); ansamblul claselor de obiecte structurate n ierarhii alctuiesc schema BD. de referin caracterizate prin: se realizeaz pe baza identificatorului unic de obiect; pot fi de urmtoarele feluri: simple de asociere : referirea unui obiect de ctre alt obiect; de compunere (tip parte-ntreg) : obiectele care reprezint componente ale unui ntreg sunt asociate cu obiectul ce reprezint ntregul; de agregare : obiectele independente sunt agregate succesiv pentru a forma un ntreg. permit definirea i manipularea de obiecte compuse din alte obiecte. Obiectele compuse rezultate au o structur ierarhic dar nu au caracteristic de motenire. 2. Operatorii modelului OO: La baza operaiilor din model stau mesajele ca unic mod de a comunica obiectele ntre ele Actualizarea metodelor : adaugare, modificare, tergere de metode. Actualizarea proprietilor : adaugare, modificare, tergere de date. Actualizarea claselor : adaugare, modificare, tergere de clase. Realizarea legturilor ntre clase : compunere, partiionare etc.. Actualizarea instanelor : prin metode care schimb starea intern a obiectului. 3. Restriciile de integritate ale modelului OO:

Orice obiect trebuie s respecte restriciile impuse la definirea clasei din care face parte (protocol de obiect). Identificatorul obiectului asigur integritatea referirii la el (se atribuie i se terge automat o dat cu obiectul). Accesul la obiecte este limitat la folosirea protocolului de mesaje definit pentru clasa din care face parte obiectul. Caracterizarea general a modelului OO. 1. Modelul OO marcheaz trecerea la o a treia generaie de BD. El aduce bazelor de date un plus de deschidere, independena logic a datelor de aplicaii, reutilizarea obiectelor etc. 2. Modelul OO d bune rezultate pentru probleme foarte mari i complexe (principiile complexitii sunt incluse n model). 3. n structur sunt acceptate toate tipurile de date cunoscute, deci se poate aplica pentru toate domeniile de activitate. 4. Limitele modelului OO: nu exist un model OO unanim acceptat de specialiti. Exist totui organisme internaionale de standardizare exemplu OMG (Object Management Group) precum i modele OO standardizate exemplu ODMG (Object Data Management Group); imaturitatea i naturaleea dezarmant a tehnologiei OO; elemente nc insuficient testate pentru SBDOO: controlul integritii, volume foarte mari, regsirea etc. 5. Exemple de SGBDOO: O2 (Frana), Jasmine (SUA) etc. 6. Baza de date orientat obiect este o mulime de clase de obiecte persistente (n memoria extern), organizat coerent i ordonat n ierarhii, partajat pentru utilizatorii concureni. Note 1) O comparaie ntre modelul relaional i orientat obiect vezi n Anexa 1. 2) Dup prezentarea de pn acum a primelor dou capitole, putem da o definiie complet i explicativ a noiunii de baz de date, ca fiind un ansamblu de colecii de date: organizat , pe niveluri de organizare a datelor (conceptual, logic, fizic), aa cum reiese din arhitectura unui SBD pe niveluri; coerent , conform restriciilor de integritate i a legturilor dintre date, care rezult din modelul logic de date aferent; structurat , conform unui model de date pentru baze de date (unul fundamental sau derivat); cu o redundan minim i controlat , care este asigurat prin modelul de date implementat i prin tehnicile de proiectare ale BD; accesibil mai multor utilizatori n timp util , adic mai muli utilizatori, concomitent, pot obine informaiile dorite atunci cnd are nevoie de ele.

Protecia BD
Activitatea de protecie a bazelor de date este deosebit de important att pentru modul de lucru pe calculatoare independente ct i pentru modul de lucru n reea de calculatoare.

o Asigurarea proteciei pentru o baz de date revine att n sarcina SGBD, prin funcia de administrare (tot mai mult), ct i n sarcina administratorului bazei de date. o Protecia bazei de date este un ansamblu de msuri necesare asigurrii securitii i integritii datelor. asigura protecia bazelor de date. Lucruri suplimentare vor fi prezentate n capitolele aferente SGBD-ului Oracle, iar exemplificarea se poate gsi, pe larg, n referina bibliografic [VELU02]. Securitatea datelor semnific interzicerea accesului la date pentru utilizatorii neautorizai. Integritatea datelor nseamn corectitudinea datelor ncrcate, precum i manipularea lor astfel nct s se respecte restriciile de integritate ale modelului de date implementat. n continuare, vom prezenta, pe scurt, cele dou aspecte care compun activitatea de protecie a unei baze de date. La fiecare aspect vom sintetiza activitile afere nte. INTEGRITATEA datelor. 1. Integritatea semantic const n prevenirea introducerii unor date incorecte n BD i n prevenirea realizrii unor prelucrri eronate. Acest lucru se asigur prin respectarea restriciilor de integritate. Acestea pot fi implicite (asigurate automat de SGBD) i explicite (asigurate prin proceduri incluse n programele de aplicaie). 2. Controlul concurenei la date const n garantarea coerenei (corectitudinii) i simultaneitii datelor n cazul prelucrrii tranzaciilor (unitatea logic de prelucrare) prin tehnici specifice (blocarea, interblocarea etc.). 3. Salvarea i restaurarea. Salvarea este operaia de stocare a datelor n copii de siguran prin tehnici specifice (copiere, jurnalizare etc.). Ea se poate face automat de ctre SGBD(cel mai des) sau manual de ctre administratorul BD. Restaurarea este operaia de refacere a consistenei BD, pornind de la datele salvate, minimiznd prelucrrile pierdute. Restaurarea se poate face automat de ctre SGBD (cel mai des) sau manual de ctre administratorul BD. SECURITATEA datelor. 1. Autorizarea i controlul accesului la date const n identificarea utilizatorilor i restricionarea accesului acestora, pentru diferite operaii de prelucrare. 2. Viziunile (views) sunt partiii logice ale BD definite pentru diferii utilizatori. 3. Procedurile speciale sunt rutine, oferite de SGBD, care efectueaz anumite operaii asupra datelor i care sunt accesibile anumitori utilizatori. 4. Criptarea este operaia de codificare a datelor n vederea stocrii sau transmiterii datelor. n acest sena, se folosesc o mulime de tehnici specifice: parole, algoritmi de criptare/decriptare, rutine speciale etc. Conceptul de baz de date Definirea noiunii de baz de date o putem face din mai multe puncte de vedere. Astfel vom avea, mai nti, n vedere componentele sale i apoi vom ine cont de organizarea datelor n memoria extern. Baza de date este un ansamblu de colecii de date aflate n interdependen, mpreun cu descrierea datelor i a legturilor dintre ele. Baza de date este un ansamblu de date n memoria extern cu urmtoarele caracteristici: organizat, pe trei niveluri (conceptual, logic, fizic); structurat, conform unui model de date; coerent, prin restriciile de integritate i protecia datelor; cu o redundan minim i controlat, prin implementarea unui model de date i prin

aplicarea unei tehnici de proiectare; accesibil mai multor utilizatori n timp util.

Administrarea bazelor de date


Administratorul BD este format din una sau mai multe persoane cu experien n analiz i proiectare, care se ocup de organizarea i ntreinerea BD. Nivelurile de administratori de baze de date, dup activitile desfurate, sunt: administrator global realizeaz: schema (conceptual) a BD, pornind de la cerinele aplcaiei; organizarea datelor la nivel logic (colaboreaz). administrator de aplicaie realizeaz: schema extern (logic) pentru o aplicaie, pornind de la cerinele de prelucrare ale plicaiei; organizarea datelor la nivel fizic (colaborare). administratorul bazei de date realizeaz: schema intern (fizic) a datelor; reorganizarea bazei de date; gestioneaz funcionarea BD. Sarcinile administratorului BD sunt structurate dup activitile de realizare a unei BD: la analiza i proiectarea BD: definete obiectivele BD; colaboreaz la formularea cerinelor aplicaiei; definete dicionarul BD(schema, restriciile de integritate etc.); colaboreaz la schema extern i la cea intern; concepe protecia datelor. la implementarea BD: elaboreaz documentaie; definete regulile de implementare i dare n folosin a BD; asigur ncrcarea BD din diferite surse de date. la exploatarea BD: monitorizeaz accesul la date; asigur protecia datelor; ntreine funcionarea BD la parametrii proiectai. Instrumente la dispoziia administratorului BD pentru a-i ndeplini sarcinile: instrumentele oferite de SGBD pentru: reorganizarea BD, refacerea BD, analize statistice, gestionarea dicionarului de date, protecia datelor. instrumente specifice create de administratori i programatori. Not. Un exemplu de administrare a unei baze de date relaionale se gsete n [VELU02], cu exemplificare pe sistemul Oracle. Ca o concluzie, se poate spune c n acest moment, activitatea de administrare a unei baze de date a fost mult automatizat. Acest lucru nseamn c multe dintre sarcinile de administrare au fost preluate de SGBD, degrevndu-l pe administrator.

You might also like