You are on page 1of 8

Cap.

2 INTELIGENA AFACERII - IA
Aspecte fundamentale privind Inteligena afacerii
Tehnologii utilizate n sistemele pentru IA
Big Data

Domeniul Inteligenei Afacerii IA (Business Intelligence - BI) este o tehnologie


informatic ce privete organizarea i funcionarea ntreprinderii, precum i a conducerii
acesteia, avnd ca suport soluiile informatice.

Domeniul IA se ncadreaz n tendina de trecere de la societatea industrial la cea


informaional i a cunoaterii:
tranziie pune n centrul ateniei specialitii;
specialitii trebuie s asigure societii informaionale o dezvoltare durabil;
obiectivul propus poate fi atins prin decizii fundamentate tiinific cu un suport
informaional pe msur.

Se poate spune c n momentul de fa reuita afacerilor depinde ntr-o msura foarte


mare de calitatea i cantitatea de informaie pe care se bazeaz . Soluiile informatice nu
au ntrziat i n ultimii trei ani au fost create instrumente software performante pentru
Inteligena Afacerii.

Exist mai multe puncte de vedere n ceea ce privete definirea conceptului de Inteligena
Afacerii, dintre care dou sunt prezentate mai jos.

Inteligena Afacerii presupune utilizarea tuturor datelor de care dispune o firm, cu


ajutorul calculatorului, pentru a mbunti procesul decizional. Acest lucru
presupune accesul la date, analiza lor i descoperirea unor noi posibiliti de
utilizare a lor, adic un ansamblu de tehnologii informatice utilizate pentru
procesul de afaceri.

Inteligena Afacerii se refer la capacitatea de a transforma date existente n informaie


util care s furnizeze perspective bogate i mai ales noi asupra lumii afacerilor din
prezent i s ofere o idee spre ce se ndreapt acesta n viitor.

Soluiile IA dau posibilitatea:


de a nelege comportamentul consumatorului;
de a analiza vnzrile;
de a identifica oportunitile de ctig i de economisire a costurilor;
de a mbunti procesul decizional;
de a analiza cantiti mari de date istorice pentru a identifica abloanele i a nelege
tendinele ce pot influena afacerile.
Un sistem informatic pentru Inteligena Afacerii ofer o tehnologie, inclusiv produse
software, care livreaz utilizatorilor informaiile necesare pentru a rspunde la ntrebrile
ce apar n rezolvarea problemelor de afaceri.

Necesitatea unui sistem informatic pentru Inteligena Afacerii este dat de aspectele
prezentate n continuare.

Reducerea timpului de obinere al rspunsului


Sistemele pentru Inteligena Afacerii pun accentul pe accesul i livrarea rapid a
informaiilor la utilizatori.

Gestionarea i modelarea mediului de afaceri curent


Sistemele informatice pentru Inteligena Afacerii ofer mai mult dect mecanisme de
interogare i raportare, ele ofer instrumente de analiz a informaiilor complexe, de
stocare a volumelor uriae de date, de data mining.

Reducerea costurilor informatice


Investiia n sistemele informatice reprezint un procent semnificativ din cheltuielile
firmelor. De aceea, este necesar nu numai s se reduc aceste cheltuieli dar i s se obin
beneficii maxime din informaiile stocate i prelucrate de sistemele informatice, care
folosesc , n acest sens, noi tehnologii.

Dilema datelor este o problem pe care o au organizaiile i care ajut la nelegerea


tehnologiei IA. Aceasta const n aspectele prezentate n continuare.

Date diferite i incompatibile


Datele referitoare la afaceri sunt stocate n depozite separate i incompatibile.

Lipsa de integrare a datelor poate pune piedici serioase n nelegerea ntregii activitii a
companiei. Cnd aceste date separate vor fi integrate va rezulta o imagine mult mai
complet a activitii.

Proiectarea conflictual
Sistemele informatice tradiionale au fost proiectate n scopul de a procesa tranzacii
discrete, pentru a automatiza sarcini precum introducerea de comenzi sau facturi
contabile. BD relaionale s-au dovedit o soluie eficient pentru acest tip de sisteme de
procesare a tranzaciilor

IA necesit capacitatea de a procesa un numr mai mare de nregistrri, de a executa


calcule complexe i de a agrega datele n rezumate semnificative.

Bazele de date proiectate pentru IA trebuie s fie optimizate pentru rapoarte. Aceast baz
de date va stoca deseori cantiti foarte mari de date istorice i poate fi cu mult mai mare
dect un sistem tranzacional. Acest sistem s-ar putea s nu stocheze fiecare tranzacie
discret, ci mai degrab doar date la nivel de rezumat care sunt folosite pentru raportri.

Cerinele bazelor de date, comparativ, pentru procesarea de tranzacii i pentru IA.


Procesare de tranzacii IA
(BDR)
1. Scopul Automatizarea unui proces Raportare, analiz de date
repetitiv i descoperire
2. Proiectarea Redundan minim i Redundan introdus,
controlat, calcule structura de date
dinamice aplatizat, calcule
complexe
3. Stocarea datelor Tranzacii discrete, date Tranzacii la nivel de
curente, o aplicaie rezumat, date istorice,
aplicaii multiple i
integrate
4. Accesul la date Actualizri, regsiri rapide Doar regsiri i timpi de
rspuns moderai

Interogare flexibil
n sistemele IA, se pot pre-programa interogrile n serii de rapoarte pre-definite.

n sistemele tranzacionale, interogrile sunt cunoscute dinainte i proiectanii pot


optimiza timpii de rspuns.

Sistemele IA necesit explorri de date active i uneori pasive i nu se cunosc de la


nceput ntrebrile la care sistemul trebuie s rspund. Soluiile IA implic o abordare n
proiectare care duce la o flexibilitate a interogrilor fr a limita numrul de utilizatori.

Sistemele informatice pentru Inteligena Afacerii au o serie de avantaje (faciliti):


- includ n arhitectur cele mai avansate tehnologii informatice actuale (este un
sistem integrat) i sunt deschise spre noi tehnologii care pot s apar;
- pun accentul pe accesul i furnizarea de informaii ctre diferitele categorii de
utilizatori i ofer suport att pentru specialitii n informatic ct i pentru
alte categorii de utilizatori prin instrumentele specializate pe care le dein;
- permit accesul la toate tipurile de date descrise i manipulate pe diferite
calculatoare (n diferite tipuri de aplicaii), inclusiv tipurile noi de date i
depozitele de date.

Obiectivele unui sistem pentru Inteligena Afacerii sunt:


- s permit soluii avnd costuri sczute eficiente pentru firm;
- s permit accesul rapid i uor la informaiile firmei pentru un numr mare de
utilizatori (autorizai) de toate categoriile;
- s ofere suport pentru noi tehnologii (sisteme OLAP, depozite de date etc.);
- s ofere un mediu de lucru scalabil i deschis.
Pentru atingerea acestor obiective, multe firme prefer s construiasc un sistem separat
pentru Inteligena Afacerii, fie din motive de securitate fie din motive de performan ale
sistemelor operaionale.

Arhitectura unui sistem informatic pentru Inteligena Afacerii prezint grafic un


ansamblu de elemente intercorelate care contribuie la atingerea obiectivelor de mai sus:

rezultate

Aplicaii IA
Instrumente SSD

Interfee i servere
de aplicaii

Gestiunea datelor

Depozite de
date

Instrumente i
interfee

Sursa de date

Analiznd arhitectura de mai sus, observm c pornim de la o surs de date (externe i


operaionale) din care cu ajutorul unor instrumente i interfee se construiesc depozite de
date.
Depozitele de date sunt gestionate mpreun cu alte stocuri de date.
Pentru accesul la date se utilizeaz interfeele aplicaiilor i serverele de aplicaii.
Rezultatele accesului la date se utilizeaz n aplicaii pentru Inteligena Afacerii
(instrumente SSD Sisteme Suport de Decizie, sisteme OLAP On Line Analitycal
Processing, extragerea de date - Data Mining, depozite de date Data Warehouse etc).
La nivelul ntregului sistem informatic pentru Inteligena Afacerii se realizeaz gestiunea
metadatelor i administrarea sistemului.

Tehnologii utilizate n sistemele pentru IA

n momentul actual, puine dintre soluiile informatice pentru inteligena afacerii nu sunt
realizate cu sisteme de baze de date. Rezult c n acest domeniu bazele de date au o
importan covritoare. Marii productori de SGBD (IBM, Oracle, Microsoft, Informix)
sunt i marii furnizori de soluii software pentru inteligena afacerii.

DEPOZITE DE DATE (Data Warehouse)


Concentrrile de date (data marts) i depozitele de date (data warehouse) rezolv
problemele legate de sursele de date disparate i de scopurile incompatibile dintre
procesarea tranzaciilor i aplicaiile de IA.

Scopul unui depozit de date este de a furniza un stoc central unde datele din unul sau mai
multe sisteme tranzacionale pot fi consolidate ntr-o singur, integrat i consistent
surs de date. Depozitul de date este proiectat pentru a optimiza generarea de rapoarte pe
numr mare de nregistrri ale bazei de date. El presupune multe regsiri i foarte puine
actualizri sau deloc.

Deoarece procesul dezvoltrii unui depozit de date la nivel de ntreprindere a fost lung i
complex i de multe ori nu s-a ncheiat cu succes, practicienii acestuia au adoptat o
abordate alternativ : dezvoltarea unor depozite mai mici i cosolidate, cunoscute sub
numele de concentrri de date. Astfel, prin prin date stocate n volume mai mici, nevoia
de o raportare mai exact i imediat poate fi suplinit ntr-un ciclu de dezvoltare mai
scurt.

Aceste faciliti, dac sunt integrate n instrumente care aparin unui SGBD, rspund
optim tuturor cerinelor unei afaceri, deoarece se bazeaz pe un ansamblu mare i variat
de date, cu faciliti de regsire deosebite (exemple: Oracle Warehouse Tools, Oracle
Data Mart Suite).

INTELIGENA AFACERII PRIN INTERNET


O serie de instrumente destinate inteligenei afacerii unei ntreprinderi, care se gsesc
ntr-un SGBD sunt proiectate pentru a funciona n mediul Internet.

Interfeele pentru formularea cererilor de regsire (exemplu Oracle Discoverer) sunt


uor de utilizat i se pot formula cereri ad-hoc sau analize dintr-un depozit de date sau o
baz de date. Interfaa asist i direcioneaz utilizatorul pentru construirea cererilor sale,
totul fiind automatizat.
Instrumentele pentru obinerea rapoartelor (exemplu Oracle Reports) sunt destinate
ntreprinderilor care au nevoie de situaii de ieire complexe. Se pot construi, n mod
dinamic rapoarte sofisticate fr limitri de format. Datele necesare pot proveni, de
regul, din diferite surse, iar ieirea se poate face n multiple forme (ASCII, HTML etc.).

Instrumente pentru analiza datelor (exemplu Oracle OLAP) permit dezvoltarea


aplicaiilor de tip OLAP (OnLine Analytical Processing) ca platforme pentru Inteligena
Afacerii. Aceste instrumente suport analize matematice, financiare, statistice i serii-
timp pentru informaiile stocate n baze de date. Se pot simula scenarii de modelare i
construi aplicaii analitice.

EXTRAGERE, TRANSFORMARE, NCRCARE (ETI)


Tehnologia Extragere, Transformare, ncrcare (Extraction Transformation Load ETL)
se refer la crearea unui depozit de date din mai multe surse. Dezvoltarea unei viziuni
singulare i consistente a datelor ce exist n mai multe sisteme necesit curarea
datelor. De asemenea, datele de la surs s-ar putea s necesite transformarea spre un
format comun n depozit de date.

Un instrument de ETI permite definirea de reguli de afaceri utiliznd: o interfa grafic,


interfee standard de comunicaie (exemplu: ODBC, JDBC etc.).

OLAP (On Line Analytical Processing)


Pentru a atinge flexibilitatea i n acelai timp s menin performana, OLAP utilizeaz
analiza multidimensional. n aceast abordare datele sunt vzute la nivel de concept
ca un cub. Acest cub const din valori cantitative (cunoscute sub numele de msuri)
i categorii descriptive (cunoscute sub numele de dimensiuni).

Utilitatea pentru organizaii este dat de:


- abilitatea la nivelul conducerii de a-i analiza superior datele pe care le deine,
n scopul de a furniza viziunea necesar lurii deciziilor;
- ntotdeauna, la efectuarea analizei datelor, se tie ce se caut;
- se permite cutarea datelor ntr-un spaiu multidimensional, n care datele sunt
grupate pe nori;
- valorific experiena existent n analiza statistic clasic, adugnd noi
tehnici i metode superioare.

EXTRAGEREA DE DATE (DM - data mining)


Extragerea de date - DM duce IA cu un pas mai departe dect OLAP i se poate spune c
este complementar cu OLAP:
- n tehnologia OLAP utilizatorul este angajat n mod activ n explorarea
datelor, pe cnd n DM, informaia spune ceva despre ea fr s fie adresat
vreo ntrebare;
- n OLAP se tie ce se caut, pe cnd n DM nu aici se descoper;
- OLAP pleac de la statistica clasic pe care o dezvolt cu noi tehnici i
metode, pe cnd DM pleac de la inteligena artificial adugnd noi metode
de descoperire;
- ambele tehnologii caut n spaiul multidimensional, unde valorile sunt
grupate pe nori, dar cu abordri diferite.

Cteva caracteristici ale DM sunt:


- pleac de la experiena acumulat de produsele software utilizate pentru foile
de calcul (calculul tabelar) i dezvolt superior conceptul;
- realizeaz analiza datelor i nvarea folosind n acest sens un conglomerat de
tehnologii informatice: inteligena artificial, statistica, matematica etc.;
- trateaz excepiile de la regul;
- utilizeaz metode de cutare complexe spre a identifica modele i grupri ale
datelor;
- extrapoleaz i adaug la cazurile similare sau la cele mai apropiate ntlnite
deja;
- ntotdeauna poate s nvee i d o soluie, cu un anumit grad de garanie, nu
exist situaii de fr rspuns;
- utilizeaz o mulime de algoritmi de cutare i extragere: arbori de diferite
tipuri, reele neuronale, cutare aleatorie, probabiliti, predicii etc.;
- poate identifica tendine nesuspectate n comportamentul consumatorului,
care potenial pot fi utilizate s prevad comportamentul viitor;
- domeniile de utilizare sunt n special marketingul i publicitatea: campanii
pentru promovarea produselor i serviciilor, construirea strategiilor pentru
dezvoltarea firmei, stabilirea coului de cumprturi;
- extragerea de date se mbuntete cu ct crete cantitatea de date i necesit
depozite de date de nalt calitate pentru a putea da rezultate utile.
Not. Exemple de produse software pentru DM care sunt incluse n platformele pentru
baze de date sunt: Oracle Miner, DB2 Data Mining, SQL Server Data Mining etc.
[VELU10] M.Velicanu, Gh. Matei Tehnologia Inteligena Afacerii, ed. ASE, 2010.

BIG DATA
Big Data = diferite seturi de date de foarte mari dimensiuni, extrem de complexe,
nestructurate, organizate, stocate i procesate folosind metode i tehnici specifice (altele
dect cele pentru BDR i DD), utilizate pentru procesele de afaceri. Conceptul se refer la
mediul Internet unde volumul de date crete zilnic i unde dimensiunea coleciilor de date
necesare pentru regsiri este de ordinul ZettaBytes (21 de zerouri).

Caracteristicile/dimensiunile conceptului de Big Data (n viziunea IBM) sunt:


volumul = cantitatea de date colectate de ctre o companie. Aceste date trebuie s fie
utilizate n viitor pentru obinerea unor cunotine importante pentru procesele de afaceri.
Volumul de date la nivel global va fi uria, de ordinul ZettaBytes (21 de zerouri) i
provine din Internet;
viteza = timpul n care volumul uria de date poate fi prelucrat. Unele activiti din
procesul decizional sunt foarte importante, critice i de aceea au nevoie de rspunsuri
imediate, n timp real. Eficiena regsirii datelor necesare va fi asigurat prin procesarea
analitic a datelor, folosind metode i tehnici specifice;
diversitatea = tipul de date pe care conceptul de Big Data le poate cuprinde. Aceste
date pot fi structurate, precum i nestructurate: BD de diferite tipuri, mesaje din reelele
de socializare, multimedia, informaii de la senzori (GPS, telefoane, POS etc.);
veridicitatea = gradul n care un lider de companie are ncredere n informaiile
obinute i prelucrate analitic din Big Data, pentru a le putea utiliza n scopul lurii unor
decizii corecte, importante pentru procesele de afaceri.

Aspecte comparative ntre DD i Big Data:


nivel DD Grid Computer Big Data Cloud Computer
organizaie - date istorice, non-volatile - organizaia este surs de
- volum foarte mare (TB) date pentru Big Data
- organizarea, stocarea - procesarea analitic pentru
- regsirea i procesarea fundamentarea deciziei - BI
analitic pentru procesele de
afaceri - BI
mondial - DD poate fi surs de date - date de tipuri diferite,
nestructurate sau structurate
- volum uria (ZB)
- organizarea i stocarea
- regsirea i procesarea analitic
pentru procesele de afaceri - BI