26.03.

2017

ACADEMIA DE STUDII ECONOMICE BUCUREŞTI
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ŞI INFORMATICĂ ECONOMICĂ

Big Data
Programul de masterat profesional
BAZE DE DATE – SUPORT PENTRU AFACERI
GESTIUNEA VOLUMELOR MARI DE DATE
 Desemnează una din cele mai noi evoluții în
CURS 2 domeniul sistemelor de baze de date evoluate,
GESTIUNEA VOLUMELOR Aspecte fundamentale privind integrării sistemelor și al Business Intelligence.
MARI DE DATE conceptul Big Data  Descrie colecţii de date de dimensiuni foarte mari și
care se află în creștere exponențială în timp.
 Pe scurt, astfel de date sunt atât de mari și de
complexe, încât niciunul dintre instrumentele
tradiționale de gestiune al datelor nu este în măsură
să le stocheze sau să le proceseze eficient.

BUCUREŞTI 3
2016-2017

Big Data Big Data Big Data
 Big Data se definește ca fiind tehnologia care permite
lucrul cu volume mari de date, care depășesc  „acele resurse informaționale de volum mare, viteză  “date care depăşesc capacitatea convenţională de
capacitatea uzuală de stocare și de procesare oferită crescută și varietate mare, care necesită noi forme procesare a sistemelor de baze de date. Datele sunt
de bazele de date, în scopul obţinerii de avantaje de prelucrare pentru a permite luarea unor decizii prea mari, se modifică cu viteză crescută şi nu
competitive. avansate, descoperirea de noi perspective de respectă stricteţea arhitecturilor de baze de date.”
 Se pot stoca şi analiza date provenite din fișiere de tip înțelegere a lucrurilor și optimizarea proceselor” (Forbes, 2012)
log sau chiar text scris de utilizatori (în urma activităţii (Gartner Group, 2012)
pe rețele sociale sau forumuri, articole etc.) pentru a le
face folositoare în procesul de asistare a deciziilor.

4 5 6

1
26.03.2017

Big Data - necesitate Big Data – sursele de date Big Data – sursele de date
 Din punctul de vedere al poziționării față de  Din punctul de vedere al dinamicii:
 prelucrarea unui volum mare de date aduce plus de
companie:  date statice;
valoare companiilor;
 date proprii (interne);  date de flux (streaming).
 se pune accentul pe completitudinea datelor, în  date provenind din exteriorul firmei (externe), dar care sunt
detrimentul acurateței lor; utile modelului de afaceri al firmei.
 ideea generală este de a aduna date cât mai multe  Din punctul de vedere al structurii interne:
și cât mai variate, chiar dacă uneori nu se  date structurate: respectă o anumită regulă sau model de
 Din punctul de vedere al modului de generare: organizare internă;
cunoaşte încă utilitatea acestora și nici nu se poate generate intenționat de om, prin evidențele în format digital
  date nestructurate: nu respectă un model predefinit de
garanta exactitatea lor. pe care le ține; organizare;
 generate automat de diverse device-uri: senzori, telefoane  date semi-structurate: prezintă o formă slabă de
mobile, tablete, aparate foto digitale, sateliți etc. structurare, pe care o respectă uneori doar aproximativ.
7 8 9

Big Data – caracteristici Big Data – caracteristici Big Data – caracteristici
1. Volumul. Este caracteristica esențială pentru Big
3. Viteza. Este legată de ritmul în care sursele 5. Validitatea. Se definește prin corectitudinea și
Data (de ordinul zettabytes).
furnizează fluxuri continue de date și de acuratețea datelor, în raport cu scopul în care sunt
2. Varietatea. Se referă la multitudinea surselor de capacitatea de preluare, prelucrare și valorificare utilizate.
generare și a tipurilor de date (date de tip text, (uneori în timp real) a acestor fluxuri. 6. Volatilitatea. Se referă la perioada de timp în care
numerice, imagini, audio, video, streaming, serii de 4. Veridicitatea. Big Data reflectă fapte reale în datele rămân relevante și merită să fie păstrate,
timp, date social media), precum şi la varietatea care se poate avea încredere, cu condiţia să fie ţinându-se cont de volumul necesar de stocat și de
formatelor de lucru, structurare și forme de luate în considerare eventualele abateri și dificultatea asigurării securității pe perioade mari de
prezentare a datelor. zgomotul informațional care caracterizează unele timp.
tipuri de date. 7. Valoarea. Exprimă potențialul de a genera valoare
de business pentru companii, conferind avantaje
10 11
competitive acelor firme care gestionează Big Data.12

2
26.03.2017

Big Data – aplicabilitate Evoluţia organizării datelor Baze de date NoSQL

 Optimizarea proceselor de afaceri  Au apărut în contextul Big Data, pentru a rezolva
 Publicitatea orientata catre client problema regăsirilor rapide pe aceste volume mari
 Imbunatatirea sanatatii si a serviciilor medicale
de date;
 Imbunatatirea performantelor sportive
Baze de  Permit lucrul eficient cu date nestructurate, precum
 Imbunatatirea domeniului stiintei si al cercetarii Fişiere de Baze de Depozite date
date date de date e-mail sau multimedia;
 Optimizarea peformantei dispozitivelor si a masinariilor NoSQL
 Imbunatatirea sistemelor de securitate si a eficientei politiei  Lucrează cu texte XML, CSV sau JSON,
 Imbunatatirea si optimizarea administrativa si de infrastructura a stochează documente întregi, obiecte, coloane cu
oraselor si tarilor
valori ale unor caracteristici etc.;
 Tranzactiile financiare
 Imbunatatirea domeniului energetic  Folosesc mai multe limbaje de interogare diferite
(NoSQL - “not only” SQL).
13 14 15

Caracteristici ale bazelor de date
Tipuri de baze de date NoSQL Limitări ale bazelor de date NoSQL
NoSQL
1. BD care stochează asocieri cheie-valoare  Nu există o structură fixă a datelor  Nu există o standardizare
(Cassandra, DyanmoDB, Azure Table Storage, Riak, BerkeleyDB)
 Pot memora volume mari de date  Nu se asigură o protecţie performantă a datelor
2. BD pe coloane  Nu se utilizează joncţiuni pentru interogarea datelor  Nu se asigură consistenţa datelor
(HBase, BigTable, HyperTable)  Datele pot fi partajate în cadrul reţelei de  Sunt oferite posibilităţi limitate de interogare
calculatoare sau pot fi replicate pe mai multe noduri  Sistemele existente sunt de tipul open-source
3. BD organizate pe document
(MongoDB, CouchDB)

4. BD organizate ca graf
(Neo4J, Polyglot)

16 17 18

3