You are on page 1of 35

BUSINESS INTELLIGENCE

CLASSE 2. ARQUITECTURA BI (PART 1): INTRODUCCIÓ AL


DATAWAREHOSUE & DATAMART

DATAWAREHOUSE I DATAMART

- Datawarehouse:
Magatzem de dades, amb l’objectiu de desenvolupar un sistema d’emmagatzematge de
dades que garanteixi la fluïdesa, l’ordre i fàcil maneig dels mateixos, que alhora, suposés
un estalvi en temps i pressupost per les empreses enfront sistemes utilitzats anteriorment.
Amb aquest sistema, les companyies aconsegueixen tenir integrats en un únic contenidor
totes les dades de les seves diferents processos de negoci, a punt per ser analitzats
mitjançant les eines d'explotació i reporting
- DataMart:
Mentre un DataWarehouse conté totes les dades d'una organització, un DataMart només
recull un subconjunt d'aquests, centrant-se en una àrea específica dins el negoci. El seu
objectiu és cobrir les necessitats d'un determinat departament dins de l'organització, de
manera que podria definir-se com un magatzem de dades departamental.
MODEL DIMENSIONAL
Tècnica de modelatge que facilita la compressió de la base de dades, fent-la intuïtiva per a usuaris
no experts, i és comunament utilitzada per implementar els DWH o DM.
- Alt rendiment en les recerques des de la capa de reporting

Dins Model Dimensional destaquen 2 conceptes claus:


- Fets: mètriques, normalment valors quantitatius (numèrics) susceptibles de ser agregats.
Ex: vendes cotxes d’un concessionari, rendiment d’€ d’una empresa, etc.
- Dimensions: valors qualitatius, proporcionen descripcions als fets, aportant un context als
mateixos. Ex: marca de cotxe, data, nom, etc.

Existeixen 2 tècniques per dur a terme el modelatge dimensional:


- Esquema d’estrella
Avantatges
● Queries simples. Les unions i cross joins són més
senzills, per la seva lògica, que els d'un esquema
normalitzat
● Lògica de reporting simplificada
● Millores en el rendiment de les consultes
● Agregacions més ràpides. Gràcies a les queries simplificades
Desavantatges
● Poc flexible. Els esquemes en estrella són construïts per a una vista de les dades en
particular

- Esquema en floc de neu


Avantatges
● Algunes eines de modelatge de bases de dades
multidimensional OLAP s'optimitzen
● La normalització dels atributs redueix
l'emmagatzematge de dades
Desavantatges
● Queries complexes a causa de la normalització
(implica un major nombre de cross joins)
● Baix rendiment a causa de la normalització
ARQUITECTURA BI: INMON vs KIMBALL

- Enfocament de Inmon: DataWarehouse s’entén com un magatzem de dades únic i global


per tota l’empresa a màxim nivell*. Persegueix integració de totes les dades de la
companyia, orientat a emmagatzematge de grans volums de dades. Requereix usuaris
finals especialitzats. Es invariable i no volàtil
- Enfocament de Kimball: es centra en que la majoria construeixen un datawarehouse per
interès d’un departament. En la seva primera versió és un datamart departamental. No
requereix usuaris finals especialitzats.

TENDÈNCIES MÉS ACTUALS?

- Data Vault: Basada en els fonaments del model normalitzat i el dimensional, els aglutina
prenent el millor d'ambdós enfocaments i solucionant les seves mancances.
- Data Lake: Un data lake no és altra cosa que un repositori central en què s'emmagatzema
tota la informació de l'organització sense importar el seu format o origen.
CLASSE 3. NORMALITZACIÓ

La normalització de base de dades és una tècnica de modelatge consistent en designar i aplicar


una sèrie de regles a les relacions obtingudes després del pas el model entitat-relació al model
relacional.
Els objectius són evitar redundància, simplificar l’actualització de dades i garantir la integritat
referencia.
Per a que una taula sigui considerada una relació ha de complir que cada taula ha de tenir un nom
únic, no poden haver dues files iguals (no duplicats), i que totes les dades en una columna han de
ser del mateix tipus.

Dependència Funcional: És una connexió entre un o més atributs


DNI → Nom i cognoms
Dependència Funcional Reflexiva: Si “Y" està inclòs en "X" llavors X → I
Si adreça i nom estan inclosos en DNI llavors amb el DNI es pot recuperar la direcció i el nom
Dependència Funcional Augmentativa: Si "X" → "I" llavors "XZ" → “YZ“
DNI → Nom
DNI, Adreça → Nom, Adreça
Dependència Funcional Transitiva: Si "X" → “Y" → “Z" llavors "X" → "Z“
Data de naixement → Edat
Edat → Conduir
Data de naixement → Edat → Conduir
ETL:
Extract-Transform-Load. Mitjançant la jerarquia del
coneixement es permet relacionar dades amb
informació, coneixement i saviesa.
Les ETL consumeixen 60-80% del temps de
desenvolupament i de testing d’un projecte BI.
PL-SQL es el llenguatge més assentat per aquests
processos.
A mesura que els Data Warehouse van anar guanyant
importància en les grans corporacions, la programació
dels processos ETL va començar a estar composta d’un nombre elevat de línies de codi que els fei
dificils de mantenir.
Així neixen ODI o SAS Data Integrator, que son programaris que destaquen per fiabilitat, però
amb un molt alt cost. El creixement dels sistemes de BI, va fer que companyies modestes
centressin en ETL.
Com a eines Open Source destaquen KETL, Clover, Pentaho, etc.

● Avantatges ETL:
○ Entorn visual i intuïtiu: a diferència de llenguatges tradicionals són les interficies
gràfiques.
○ Agilitat en la depuració d’errors de desenvolupament
○ Manteniment: interfície gràfica facilita manteniment per menys experimentats.
○ Operacions i capacitats d’administració: Admn. d’errors per logs i estadístiques
d’execució.
○ Connectivitat
○ Maneig de models i metadades
○ Planificació global de conjunt de processos

No obstant això, amb l'augment de les necessitats de les dades a temps real i l'aparició dels
sistemes 'Big Data', s'està començant a posar en dubte el futur de l'ETL tradicional.
CLASSE 4. MODERN DATA MANAGEMENT

Com les eines de dades de nova generació eliminen (part) del manteniment de dades.

ESTAT ACTUAL DE LES DADES

- El Big Data genera dades massa grans per a Excel


- La necessitat d'una visualització 360: per exemple, seguir el recorregut d’un client desde
primer click fins fidelització és il·luminador. Però fer un mapa d’aixó cal connectar les
dades de màrqueting, producte i servei d’atenció al client, un procés que requereix una
coordinació interdepartamental seriosa.
- Automatització estratègica: Des d’eines d’automatització de flux de treball fins a
plataformes de sincronització de dades, equips de totes les mides busquen maneres de fer
fluir les seves dades sense problemes ... i sense esforços manuals innecessaris.
- Tancament del bucle: tancar bucle de dades només com a lectura, per empenyer les dades
cap a les eines operatives.
- Sense eines de “low-code”: les eines de dades són cada vegada més accessibles per als
usuaris menys tècnics.

PROBLEMES DE DADES HABITUALS


1. Analítiques “Ad Hoc” sense “flux”
L’avantatge d’analítiques Ad-hoc és que els
usuaris finals entren a una app i
comencen a treballar amb les dades
immediatament. Configuració de poc
aprenentatge i generalitzada.
Fluxos de Ad-Hoc no son bona manera d’emmagatzemar dades a la llarga (fulls de càlcul
dificulten col·laboració i no están creats pel control de versions, i Dropbox o Google Drive
es poden convertir en piles d'escombraries de fitxers incerts).

2. L’anàlisi requereix temps, però no tot aquest temps està ben aprofitat
3. Una infraestructura de dades deficient és una barrera per a l’èxit
L’augment de la informàtica en núvol ha desplaçat la càrrega de la configuració i
manteniment de servidor, fora dels equips interns i cap a plataformes en núvol com
Amazon Web Services (AWS) (més barates i fiables) però amb marge de millora.
4. Visió general del “data stack”
En el seu nucli, una pila de dades “eficaç” permet realitzar 6 operacions bàsiques:
- Recollida
- Normalització
- Emmagatzematge
- Transformació
- Optimització

RECOLLIDA I TRANSFORMACIÓ
Tradicionalment, la transformació de dades es combinava estretament amb la transferència de
dades, ja que l’optimització de les dades es feia abans d’introduir-les al DataWarehouse (tenia
sentit optimitzar abans quan l’emmagatzematge suposava un cost molt important)
Avui en dia, l’emmagatzematge és significativament més econòmic, cosa que fa que sigui possible
—i sens dubte més intel·ligent— emmagatzemar dades en brut i aplicar transformacions després.
Aquest canvi ha donat lloc a dues maneres d’abordar el procès:
● ETL (extreure, transformar, carregar):
○ Gestiona l’extracció de dades estructurades i no estructurades de diverses fonts.
○ Dades s’extreuen de font, netegen/transformen i es carreguen a l’emmagatzematge.
● ELT (extreure, carregar, transformar):
○ Redueix temps desde l’extracció fins a la comprensió
○ L’anàlisi es més flexible, ja que les les transformacions noves o millorades es poden
aplicar instantàniament a les dades emmagatzemades.

EMMAGATZEMATGE
Tot i que l’emmagatzematge ad hoc pot funcionar durant un temps, les empreses finalment han
d’invertir en un data stack.
Les organitzacions solen arribar al punt d'inflexió quan s'adonen que necessiten emmagatzematge
de dades reals en forma de base de dades. Les bases de dades tenen molts gustos, però les bases de
dades relacionals basades en SQL han dominat durant molt de temps el camp, i per una bona raó:
la base per a construcció de codi / programari (codebase) és sòlida i les bases de dades resultants
són robustes i són relativament fàcils de configurar.
En el seu nucli principal, les bases de dades i els DatawareHouse s’assemblen en què tots dos
emmagatzemen dades. Però un DataWarehouse és un tipus d’emmagatzematge especialitzat
dissenyat per donar suport a les operacions d’anàlisi i que, mitjançant l’ús de la modelització i
transformació de dades, es converteix en un SSOT (Single Source of Truth) que proporciona un
accés fàcil a les dades i informes consistents a tota una organització
DATA STACK
Un Data Stack fa que les dades siguin comestibles. Un data stack és com una guia per obtenir
dades. Càrrega, Emmagatzematge, Transformació, Anàlisi i BI.

ERRORS D’ESTRATEGIA BI
- Pensar que l’analítica és una eina plug-play que portarà retorn de la inversió a curt termini
- Resol problemes que no mereixen ser resolts
- Confiar únicament en proveïdors o consultors per a l’anàlisi, especialment en la creació de
models. Treballar amb proveïdors i consultors pot funcionar, però cal pensar bé la
governança.
- No elaborar llista de prioritats

ERRORS DE GENT
- Organitzar l'anàlisi sota àrees que no impulsen el negoci diàriament, com ara la TI o
l'estratègia.
- Permetre que múltiples equips d'anàlisi floreixin amb sitges organitzacionals entre si.
- Atreure el talent només a través de la compensació base.
- Contractar un grup de doctors que s'esforcen per desenvolupar models altament
complexos en lloc de solucions rudimentàries direccionalment correctes.
- Contractació d’un director tècnic d’anàlisi de dades no tècnica.

ERRORS D’EXECUCIÓ
- No integrar l’analítica als models operatius i als fluxos de treball diaris.
- No es tracta d’ajuntar per ajuntar els científics de dades amb els equips de negocis.
- Gestió de projectes analítics en cascada.

ERRORS DE TECNOLOGIA
- Intentar crear models de ciència de dades sense refinar-ne la infraestructura d'enginyeria
de dades
- No utilitzar cap de les tecnologies bàsiques següents: Hadoop, Spark, R, Python
- Disposar de sitges tecnològics entre els repositoris de dades, cosa que dificulta la
integració de diferents tipus de dades en un model. El poder de l’analítica augmenta
exponencialment amb la diversitat de les dades.

ERRORS DE FINANCES
- No assignar suficient pressupost a les plataformes d’anàlisi
- No mesurar el ROI de les iniciatives d’anàlisi.
BAD DATA
Com ho reconeixem?
1. Et falten dades. No hi ha informació, on hauria d'haver-la
2. Les dades són incorrectes ('no quadra', segur que us sona)
3. Les dades no estan ben ubicades. De vegades, tenim les dades correctes en origen, però no
les ubiquem correctament
4. Errors d'entrada de dades: caràcters erronis, abreviatures, traduccions, etc...
5. Dades duplicades. No sempre ha de ser un error, de vegades és tan trivial com una
empresa que canvia de CIF i no actualitzes
6. Dades no revisades o aprovades. Molta informació requereix de la revisió i aprovació per
part dels responsables
7. Excés de dades. Sí, encara que no ho considereu, si teniu excés de dades, es converteixen
en 'Bad Data'. Voler analitzar canvis d'estat d'un moviment comptable realitzat en un dia
concret... no sol proporcionar 'decisions estratègiques'

PROBLEMES PER A PRENDRE DECISIONS SI TINC UN DASHBORAD?

Sovint les empreses tenen gran quantitat de dades al seu abast, però no són capaces de posar
ordre entre tants caos i com a conseqüència, no tenen una visió clara de la situació.

- El soroll: El volum de dades i la velocitat amb què es generen, provoquen més soroll que
senyal. Les dades arriben de diferents fonts, en diferents formats, des de diferents eines...

- Tàctica vs. estratègia: Tenir moltes dades no sempre vol dir tenir millor visió sobre la
situació. Les empreses prenen decisions sobre la base de dades cada dia, el problema és
que aquestes decisions són tàctiques ja que es prenen tipus 'silo' (per àrees).

- El context: és que les dades representades al dashboard no siguin rellevants, no siguin


accionables. Això passa quan no hem definit correctament el dashboard.
Els errors més comuns solen ser: Objectius i KPI mal definits, Dades irrellevants o no
accionables i Dades incompletes.

- Visualització de dades: el problema és que la persona que ha de prendre les decisions no


entengui les dades. Igual que hem de mostrar a cada stakeholder les dades que són
rellevants per a la seva feina (cas anterior), hem d'adaptar el llenguatge i la visualització
perquè el decisor entengui el que està veient.
CLASSE 5: ROLS EN BI

Quins rols intervenen en un projecte / servei de Business Intelligence en una empresa.


ELS USUARIS DE BI:
Els usuaris de BI es poden dividir en:
- Usuaris d'alt nivell amb la necessitat d'una visió àmplia i capacitats d'anàlisi limitades
- Usuaris especialitzats que realitzen anàlisis de dades detallades i necessiten eines potents
- Treballadors que necessiten informes bàsics amb possibles funcions analítiques
- Els treballadors que tenen el BI integrat als sistemes que utilitzen sense adonar-se que és
BI

ELS ENFOCAMENTS PEL CONSUM DE BI:


- šQuadres de comandament (Scorecards) → Vistes personalitzades d'alt nivell amb
capacitats analítiques limitades
- šInformes (Reports) → Informes estandarditzats dirigits a un públic nombrós, sense cap o
limitada capacitat Analítica
- Aplicacions d'Analítica (Analytics) → Aplicacions dissenyades per permetre anàlisis de
dades complexes
- Aplicacions personalitzades (Custom) → Insereix dades de BI a una aplicació
ELS COMPONENTS D’UN DATA WAREHOUSE:
šHi ha diversos elements que formen un magatzem de dades:
- Cubs (Cubes)
- Mesures (Measures)
- Indicadors Clau de Rendiment (KPI-Key Performance Indicators)
- Dimensions
a) Atributs
b) Jerarquies

NOTES: Hi ha diversos components que formen un “data warehouse". Un "data warehouse" i un


"data mart" es construeixen exactament de la mateixa manera; l'única diferència és l'abast (un
"data warehouse" és per a tota l'empresa, un “data mart" és per a una àrea funcional del negoci.) Els
termes que s'enumeren aquí es defineixen a les properes diapositives.

šJerarquies

FENT UNA PREGUNTA DE BI:


- šEls humans tendeixen a pensar de manera multidimensional, encara que no se n’adonin
- šSovint volem veure un valor concret en un context determinat → Mostra'm les vendes
per mes per producte a Amèrica del Nord
- šEl que voleu veure (vendes en aquest cas) s'anomena mesura
- Com es vol veure (mes, producte i Amèrica del Nord) s’anomena dimensió

NOTES: Per recuperar dades d’un magatzem, ajuda a conèixer els components d’una pregunta.
Normalment, els usuaris demanen veure "alguna cosa" (vendes, despeses, nombre d'unitats, etc.)
segmentat "per" determinades coses (hora, ubicació, venedor, etc.).
El que la gent vol veure sol ser numèric i s’anomenen mesures. Les mesures són la base dels KPI.
La forma de segmentar les dades s’anomena dimensions.
Aquestes mesures i dimensions s’emmagatzemen en cubs.

CUBS:
- Els cubs són les estructures en què s’emmagatzemen les dades
- Els usuaris accedeixen a les dades dels cubs navegant per diverses dimensions

NOTES: Un cub és el bloc bàsic d’un data warehouse. Un data warehouse pot contenir un o més
cubs. Un cub és una estructura multidimensional que conté dades basades en dimensions.
Penseu en un exemple de magatzem de dades per a una empresa o organització de transport
marítim com FedEx, UPS o SEUR. En aquest diagrama, es mostren tres dimensions: Temps,
Origen i Ruta. A cada intersecció de Temps, Origen i Ruta hi ha una cel·la. Dins d’aquesta cel·la hi
ha dues mesures: el nombre de paquets i la data d’enviament. Això és molt diferent d'una
configuració relacional: les bases de dades relacionals són bidimensionals (files i columnes) i cada
cel·la només pot tenir un valor únic.
MESURES:
- Les mesures són el que volem veure
- Gairebé sempre són numèriques
- Sovint són additives → Vendes en euros, vendes per unitats, beneficis, despeses i molt més
- Algunes mesures no són additives
→ Data de l'últim enviament
→ Recompte d’inventari i nombre de clients únics

NOTES: Les mesures són el "que" vol veure la gent. Gairebé sempre són numèriques. Sovint són
additius, però no sempre. Les mesures poden ser KPI o servir de base per a KPI. A diferència d'un
esquema relacional, en un cub normalment voleu emmagatzemar valors calculats per tal de fer la
recuperació més ràpida i la majoria de cubs inclouen el concepte de mesures calculades.

DIMENSIONS:
- Les dimensions són com volem veure les dades
- Normalment volem veure dades per temps, geografia, producte, compte, empleat, …
- Les dimensions es componen d'atributs i poden incloure o no jerarquies
→ Any - Semestre - Trimestre - Mes – Dia
→ Categoria de productes - Subcategoria de productes – Producte

NOTES: Les dimensions són com ens agrada a la gent segmentar o dividir les dades. Gairebé
sempre que algú fa una pregunta, descriu com vol veure-la. Per exemple, vendes per botiga per
mes. Els cubs poden contenir moltes dimensions, però com més dimensions estiguin disponibles,
més difícil serà explorar pels usuaris no tècnics.

ATRIBUTS:
- Els atributs són valors individuals que componen les dimensions
→ Una dimensió de temps pot tenir un atribut Mes, un atribut Any, etc.
→ Una dimensió de geografia pot tenir un atribut de país, un de regió, un de ciutat, etc.
→ Una dimensió de producte pot tenir un atribut de número de peça, un de mida, un de
color, un de fabricant i molt més

NOTES: Els atributs representen diferents maneres de veure alguna cosa en una dimensió. Per
exemple, en una dimensió de producte, és possible que l'usuari vulgui comparar les vendes d'un
producte per colors; el producte vermell es ven millor que el blau? Depèn de quina zona del país
s’examini?
Moltes de les columnes d’una taula relacional poden convertir-se en atributs d’un magatzem.
Quan analitzem els empleats, atributs com l’edat, el sexe, la raça, el codi postal i molt més, tenen
sentit per realitzar anàlisis.
JERARQUIES:
- Podem posar atributs en una estructura jeràrquica per ajudar a l'anàlisi de l'usuari
- Una de les funcions més comunes a BI és "aprofundir“ (drill down) fins a un nivell més
detallat
→ Per exemple, la jerarquia de temps pot ser anar d'un any a un trimestre a un mes a un
dia
→ Una altra jerarquia de temps pot anar d'un any a un mes a una setmana a un dia , fins a
l'hora

NOTES: La majoria de les dimensions contenen jerarquies que permeten als usuaris aprofundir
en les dades.
Per exemple, una dimensió de Temps sovint té un nivell d'Any que després es pot desglossar en
trimestres. Els trimestres es poden dividir en mesos i finalment en dies.
Els valors del cub s’emmagatzemen físicament al nivell de granularitat més baix, però els valors
resumits s’emmagatzemen a cada nivell superior de la dimensió, de manera que quan un usuari
demana veure dades trimestrals, el valor ja està emmagatzema i la recuperació és gairebé
instantània.

RESUM:
- El procés ETL extreu dades de sistemes d'origen, els transforma i els carrega a un data
warehouse o a un data mart.
- Mitjançant informes (reports) i taulers (dashboards), La BI considera les dades com una
col·lecció de mesures i KPI visualitzats per dimensions.

EL PROPÒSIT D’UN QUADRE DE COMANDAMENT:


- Un quadre de comandament hauria de donar a un executiu una representació visual de la
salut d'una organització en un sol cop d'ull
- El quadre de comandament té un nivell suficientment alt per representar les principals
operacions comercials i els seus objectius
- Les dades d’un quadre de comandament haurien de ser el més recents possibles per fer-les
més útils

NOTES: Quan un estudiant està a l’escola, probablement els seus pares no tenen l’oportunitat
d’examinar tots els treballs i totes les tasques que rebin una nota. En lloc d’això, els pares reben
informes periòdics sobre l’evolució del seu fill a través d’una butlleta d’informe. Aquesta butlleta
mostra un resum d’alt nivell de totes les tasques i proves realitzades durant un període de temps;
és un valor únic acumulat de totes les notes individuals.
De la mateixa manera, els executius empresarials no tenen temps de mirar tots els detalls;
necessiten una targeta d’informe que resumeixi la salut de l’empresa.
Això no vol dir que no necessitin conèixer els detalls a un nivell més granular si les coses estan
malament, però el propòsit del quadre de comandament és mostrar aquest resum ràpid i d’alt
nivell.
Generalment, els quadres de comandament s’actualitzen cada nit o setmanalment perquè estiguin
el més actualitzats possibles. Això vol dir que qualsevol indicador amb tendència a la baixa o que
passa a categories grogues o vermelles es pot veure ràpidament i actuar-hi.
AVANTATGES PER A L’EXECUTIU:
- En un sol cop d’ull, l’executiu pot veure una àmplia franja de negoci (finances, fabricació,
vendes, màrqueting i molt més)
- Es guanya valor immediat sense la necessitat que l’executiu realitzi anàlisis
- Els executius no només veuen valors reals, sinó comparacions amb plans o resultats
anteriors

NOTES: Els executius empresarials són persones ocupades i els quadres de comandaments els
proporcionen una única visió que mostra la salut general de tota l’empresa.
Els executius no tenen temps de recórrer un informe de 100 pàgines per decidir si les taxes de
defectes milloren o empitjoren. En lloc d'això, els quadres de comandament proporcionen a
l'executiu comentaris (feedback) immediats sense que primer hagi de realitzar anàlisis complexes.
Ara els executius poden identificar punts de problemes molt més ràpidament i treballar per actuar
en aquestes àrees.

EL CONTINGUT D’UN QUADRE DE COMANDAMENT:


- Els quadres de comandament solen contenir alguns o tots els elements següents:
→ Indicadors clau de rendiment (KPIs)
→ Valors reals de KPI en comparació amb els valors històrics (per a l'anàlisi de
tendències)
→ Valors reals de KPI en comparació amb una previsió o un import pressupostari
→ Classificacions de diferents departaments, ubicacions, productes, etc.

NOTES: Els quadres de comandament generalment informen dels indicadors clau de rendiment
(KPI) de l’empresa. Sovint es considera que els indicadors bàsics són indicadors financers com ara
vendes, despeses, marge de benefici, etc. Tanmateix, els KPI poden provenir d'altres àrees del
negoci, com ara taxes de defectes, rotació d'empleats, percentatge d'empleats amb una certificació
determinada, etc.
Els indicadors de qualitat gairebé sempre es comparen amb els números “previstos” o
“pressupostaris”, de manera que es pot determinar la salut de l’indicador. El grau d’aproximació
d’un número al pla indica la força i se sol utilitzar per determinar l’indicador que es mostrarà per
a aquest KPI.
Sovint es comparen els KPI amb els valors històrics perquè es puguin generar tendències. La
manera com es determina la tendència depèn de l'empresa, però un indicador "verd" que tendeix a
la baixa pot fer que un executiu investigui aquest valor particular.
EL PROPÒSIT D’UN TAULER DE CONTROL (DASHBOARD):
- Un tauler està dissenyat per permetre als responsables de la presa de decisions veure
diverses dades que afecten les seves divisions o departaments
- Aquestes dades poden tenir la forma de quadres de comandament, gràfics, taules, etc.
- Generalment, el tauler es personalitza per a cada Usuari
- Més orientat i detallat que un quadre de comandament
NOTES: Un tauler de control és una ubicació central que pot contenir més que només dades de
BI. Per exemple, pot incloure correu electrònic, notícies, cotitzacions de valors i molt més.
D’aquesta manera, els responsables de la presa de decisions poden veure dades d’una varietat de
fonts en una sola pantalla. Un dels punts forts d’un tauler és que es pot personalitzar per a cada
persona perquè només vegin les dades que els pertanyen.
Un tauler de control sol dirigir-se més a persones concretes. Si el responsable de la fabricació de
decisions empresarials és el cap de fabricació, els KPIs mostrats se centraran en la fabricació i no
inclouran els KPIs de vendes i màrqueting.

AVANTATGES PELS DECISORS (DECISION MAKERS):


- Els decisors veuen una gran varietat d’informació dirigida al seu departament → Això
permet als responsables de la presa de decisions centrar-se només en els elements sobre
els quals tenen control
- La informació és més detallada que la d’un quadre de comandament
- Les eines del tauler de control sovint tenen millors capacitats analítiques que un quadre
de comandament
NOTES: Mitjançant els taulers (dashboards), els responsables de la presa de decisions
empresarials obtenen informació orientada a ells i a la seva àrea funcional específica del negoci. La
informació sovint és més detallada que la que es mostra en un quadre de comandament
(scorecard), tot i que un tauler (dashboard) podria contenir elements del quadre de
comandament (scorecard).
Un tauler de control (dashboard) sovint barreja visualitzacions de quadres de comandament
(scorecards) juntament amb gràfics i taules més detallades. El tauler (dashboard) pot fins i tot
permetre una quantitat limitada d’interactivitat de manera que el que pren les decisions pugui
aprofundir en nivells de detall més baixos

EL CONTINGUT D’UN TAULER DE CONTROL (DASHBOARD):


- Un tauler de control (dashboard) conté generalment diverses visualitzacions de dades
- Les dades solen ser KPI i mostren tendències, desglossaments i comparacions amb una
previsió o dades històriques
- El tauler de control (dashboard) sovint consta de gràfics i taules, i també pot incloure
elements de quadre de comandament

NOTES: Els taulers de control (dashboards) sovint contenen informació dirigida a una àrea
funcional. Això vol dir que el tauler conté KPIs, gràfics i taules centrades en una àrea funcional.
Sovint hi ha informació històrica perquè l’executiu pugui conèixer el que realment ha passat al
llarg del temps. Els taulers de control (dashboards) també poden incorporar informació que no és
de BI, que conté enllaços al calendari d’una persona, al correu electrònic, a les fonts de notícies i
molt més.
EL PROPÒSIT DELS INFORMES (REPORTS):
- Els informes permeten a un públic molt més ampli beneficiar-se de les dades d’una
solució de BI
- Els informes poden ser estàtics i no requereixen formació
- Els informes també poden permetre una quantitat limitada d’interactivitat
- Els informes es poden presentar en diversos formats, cosa que permet una distribució més
fàcil
NOTES: Els informes solen ser el vehicle més fàcil de distribuir a un públic ampli. Els informes es
poden lliurar a tota l'organització i fins i tot a clients externs. Tot i que els informes solen ser
estàtics, poden permetre algunes capacitats analítiques limitades. Els informes tenen l’avantatge
d’estar disponibles en diversos formats. Tot i que el valor per defecte és sovint HTML, moltes
eines d'informes poden produir fitxers PDF Adobe Acrobat, fulls de càlcul del Microsoft Office
Excel, fitxers de text, etc.
Les eines d'informes varien àmpliament en la forma en què es concedeixen llicències. Alguns
requereixen una llicència per servidor o per visualització, mentre que d'altres no requereixen cap
cost addicional de llicència.

AVANTATGES PER A L’ORGANITZACIÓ:


- Les dades de BI estan disponibles per a gairebé totes les persones d’una Organització
- Els informes es poden enviar per correu electrònic, visualitzar-se al web o distribuir-se
d’altres maneres a un públic molt ampli
- Permeten proporcionar algunes funcions analítiques a alguns usuaris
- Els informes poden consolidar dades de diverses bases de dades de BI
NOTES: Els informes estan disponibles per a un públic ampli; en el cas d'informes publicats a
través d'un navegador, qualsevol persona de l'organització pot consumir els informes sempre que
tingui les credencials de seguretat necessàries. Això també proporciona a molts usuaris de
l'organització la possibilitat de respondre a moltes de les seves pròpies preguntes mitjançant
algunes funcions analítiques senzilles. Per exemple, els usuaris poden ampliar determinades
categories per examinar els números subjacents o fer seleccions de llistes desplegables per
examinar diversos productes, períodes de temps diferents i molt més.
Un dels avantatges dels informes és que un informe únic pot contenir dades de diverses fonts, tant
BI com altres. Això significa que els usuaris es beneficien de veure les dades consolidades de
moltes fonts en un informe únic i fàcil d'utilitzar.

EL CONTINGUT DELS INFORMES (REPORTS):


- Els informes poden incloure dades d’alt nivell, com ara els KPI
- Es pot presentar informació més detallada, especialment per a venedors específics, clients,
- Els informes poden mostrar els detalls d’una única transacció o un historial de dades
durant un període de temps
NOTES: Els informes poden incloure elements d’alt nivell com ara els KPI, però sovint se centren
en informació més detallada. Per exemple, els informes poden permetre a l'usuari seleccionar un
venedor i veure les seves vendes durant els darrers dotze mesos, dividits en diferents categories de
productes. Els informes poden ser tan detallats com mostrar una única transacció o mostrar valors
que evolucionen durant un llarg període de temps.
EL PROPÒSIT DE LA INTEGRACIÓ D’APLICACIONS PERSONALITZADES
(CUSTOM APPLICATION INTEGRATION):
- Una aplicació que utilitzen els treballadors de la línia pot incloure intel·ligència
empresarial sense que el treballador s’adoni del que està passant
→ Un empleat de vendes pot obtenir una llista de recomanacions específiques per fer en
funció del que el client estigui comprant
→ Es pot presentar a un agent de préstecs el nivell de risc associat a l’atorgament d’un
préstec a un client concret
NOTES: L’anàlisi de dades de BI ha estat sovint una fase diferent d’un procés de BI dedicat. La
integració de la BI amb les aplicacions existents proporciona avantatges reals mentre els
treballadors realitzen les seves tasques habituals. Les aplicacions personalitzades poden obrir
funcions analítiques d’una manera fàcil d’utilitzar, cosa que significa que els beneficis de la BI
flueixen al treball normal realitzat per les persones que utilitzen aquestes aplicacions. És possible
que aquests usuaris no siguin conscients que utilitzen BI en cap sentit.

AVANTATGES DE LA INTEGRACIÓ D’APLICACIONS PERSONALITZADES


(CUSTOM APPLICATION INTEGRATION):
- La Business Intelligence s’inclou a tots els nivells de l’organització sense necessitat de
Formació → (o fins i tot sense coneixement de què és la BI i com s'utilitza)
- El procés analític es pot simplificar i adaptar en funció de cada aplicació
- Els treballadors de la línia obtenen beneficis del capital BI de l’organització com a part de
la feina diària
NOTES: La BI es pot utilitzar en aplicacions personalitzades per a diversos propòsits. Pot ajudar a
identificar productes complementaris del que la persona compra. Pot utilitzar algoritmes de
mineria de dades per filtrar una bona entrada d’una entrada incorrecta. Pot ajudar a predir la
probabilitat que aquest client torni el préstec que busca.
Prendre la sortida de l’aplicació de BI i utilitzar-la per retroalimentar-se en els sistemes
operacionals quotidians augmenta considerablement el benefici que una empresa pot obtenir del
seu esforç de BI.

EL CONTINGUT DE LA INTEGRACIÓ D’APLICACIONS PERSONALITZADES


(CUSTOM APPLICATION INTEGRATION):
- Les aplicacions personalitzades poden incloure sortides predictives en base a models de
mineria de dades
- Les aplicacions personalitzades poden mostrar l'historial i les tendències del client,
proveïdor, etc.
- Les aplicacions personalitzades poden permetre als usuaris formes senzilles d’explorar les
dades per obtenir relacions

NOTES: Les aplicacions personalitzades solen utilitzar la sortida d’algoritmes de mineria de dades
per fer anàlisis predictives: predir quins altres productes pot agradar comprar a un client, predir la
seva probabilitat de pagar un préstec i molt més. Tanmateix, BI també es pot utilitzar per mostrar
tendències al llarg del temps per a un client de manera que un representant de vendes tingui una
imatge clara de les vendes, el marge i molt més per al client al qual està trucant.
TENDÈNCIES QUE AVALEN LES CUSTOM APPLICATION INTEGRATION:
EL PROPÒSIT DE LES APLICACIONS ANALÍTIQUES (ANALYTIC APPLICATIONS):
- Les aplicacions analítiques alliberen els analistes de crear models complexos i escriure
consultes complexes
- Els analistes poden centrar-se lliurement en les dades i descobrir relacions i causes
(drivers) darrere dels números
- Les visualitzacions riques permeten comprendre molt més fàcilment les tendències i les
relacions

NOTES: Els analistes de negocis solen realitzar anàlisis de dades complexes. Gran part d’aquesta
anàlisi és ad hoc i s’inclou en grans fulls de càlcul. Les aplicacions analítiques faciliten la
recuperació i l’anàlisi de dades i moltes aplicacions analítiques inclouen potents eines de
visualització per facilitar la comprensió de les dades. Les aplicacions analítiques permeten a un
analista construir models complexos segons sigui necessari. Aquestes aplicacions proporcionen
habilitats bàsicament il·limitades per aprofundir en les dades, seccionar-les i tallar-les a daus de
qualsevol manera.

AVANTATGES DE LES APLICACIONS ANALÍTIQUES (ANALYTIC APPLICATIONS):


- Les dades són significativament més fàcils d’analitzar
- Els analistes es poden centrar a analitzar les dades i no a escriure consultes complexes
- Els informes creats amb aplicacions analítiques es poden enviar a l'Organització
- Les eines gràfiques proporcionen als usuaris de tota l’organització informes i capacitats
analítiques potents

NOTES: Les aplicacions analítiques es construeixen per permetre una manipulació


extremadament complexa de grans quantitats de dades. Ho fan fàcil de fer i sovint tenen una
naturalesa gràfica, superant amb escreix les habilitats dels enfocaments tradicionals de fulls de
càlcul. Sovint, els informes integrats en una aplicació d’anàlisi es poden compartir amb altres
persones, fins i tot si aquestes persones no estan ben versades en la pròpia aplicació d’anàlisi.

CONTINGUT DE LES APLICACIONS ANALÍTIQUES (ANALYTIC APPLICATIONS):


- Les aplicacions analítiques normalment no tenen límits; els analistes ho poden veure tot
- Les aplicacions analítiques poden visualitzar i analitzar totes les dades d’una organització
de diverses maneres
- Les aplicacions analítiques són potents, però no són tan fàcils d’utilitzar com altres
mecanismes

NOTES: No hi ha res que no es pugui posar en les aplicacions analítiques més potents; van ser
dissenyats per utilitzar totes les funcions de la solució de BI creada per una organització. Això pot
incloure KPI o mesures més bàsiques. Molts poden crear les seves pròpies mesures calculades o
KPI. Per molt poderoses que siguin aquestes aplicacions, sovint hi ha associada una corba
d’aprenentatge; l'augment de potència també condueix a un augment de la complexitat.
RESUM:
- Business Intelligence és el procés de consolidació de dades dispars
- La informació de BI hauria de ser fàcilment accessible i hauria d’admetre diverses opcions
de visualització
- BI hauria d’admetre una àmplia varietat d’usuaris
- BI permet als usuaris explorar les dades, examinar relacions i molt més
- BI pot donar suport a operacions de mineria de dades
CLASSE 6: AUDIÈNCIES EN BI

Quins rols són els destinataris d’un projecte / servei de Business Intelligence en una empresa?

ESPAI TI-BI

AUDIÈNCIA DE BI

PROPOSTA DE VALOR DE BI
BI - MODELS TRADICIONALS

BI - PERSPECTIVA DE L’USUARI
● Informes: Difusió regular d'informació massiva en un format estàndard
● Analítica
○ Talls i tallat amb retroalimentació visual i interactivitat.
○ Principalment per a la Direcció Mitjana: per a decisions tàctiques i per orientar les
decisions estratègiques
● Taulers de control
○ Instantànies de destil·lació ràpida, que ressalten els índexs clau, per a la presa de
decisions instantània
● D.A.R. - Combinació perfecta de distribució de dades i comprensió de la Informació
○ D – Dashboard tells you what is good or bad
○ A – Analysis tells you how or why
○ R – Report tells you the actionable items

TEMES DE REPORTING ACTUALS (O D’AHIR)


- Informes estàndard limitats en aplicacions com ERP, CRM, SCM, etc. - Scripting que
requereix temps per obtenir informes addicionals
- Disponibilitat només d'informes estàtics: no es pot fer cap anàlisi
- Per a anàlisi i intel·ligència, s’exporta a Excel: possibilitats de corrupció i manipulació de
dades
- Diverses fonts de dades: no és possible la visualització única
- Intel·ligència empresarial tàctica i estratègica per a la direcció superior: informes i anàlisis
posteriors als fets
- Sol·licituds adhoc i de millora dels usuaris empresarials: pèrdua de productivitat dels
recursos informàtics
Solució : Operational Business Intelligence & Reporting

REPORTING - CONSIDERACIONS
- Tecnologies d'informes: Dissenyat per a la distribució d'Informació
- Ad-Hoc o predefinit?
- Durant el fet (en temps real) o després del fet : Dades transaccionals (o) anteriors
- Presentació: Gràfics o tabulars / textuals
- Navegabilitat als informes: Drill Through, Drill Across
BI - FLUX DE NOVA GENERACIÓ DE BI

REPORTS NAVEGABLES
- Interactius
- Slice (tallar data) & Dice (tallar en segments la data)

ANALÍTIQUES DISSENYADES PER A ENTENDRE

šL'anàlisi ha de facilitar:
- Inspecció
- Exploració
- Sondeig de preguntes / respostes que coincideixen amb el procés humà d'assimilació de
dades.
šExploreu lliurement
- Observar - Identificar noves relacions / dependències / patrons
- - Nova comprensió - Noves decisions / accions
Nadeu lliurement a l’espai de dades multidimensional:
- Client -> Productes -> Persona comercial -> Altres productes -> Altres clients -> Geografia
-> Producte més venut -> …
ANALÍTIQUES AVANÇADES - MINING AND MODELS

● Modelatge
○ Models descriptius i predictius
● šExemples famosos
○ Cervesa i bolquers: anàlisi de cistelles de mercat
○ Chrysler: identificació de nous patrons (CRISP-DM)
● Requisits típics
○ Model per predir el desgast
○ Model per decidir els límits de crèdit per a un sol·licitant de targeta de crèdit
● Necessari per a un petit percentatge d’usuaris de la investigació
● Els models desenvolupats aquí s’utilitzen en Control d’Operacions
○ Models de risc, Models de fluxos de caixa, Models de cua, Models estocàstics ... etc.

CRISP-DM
El procés estàndard de la indústria CRoss per a la mineria de dades (CRISP-DM) és un model de
procés amb sis fases que descriu de manera natural el cicle de vida de la ciència de dades. És com
un conjunt de baranes que us ajudaran a planificar, organitzar i implementar el vostre projecte de
ciència de dades (o aprenentatge automàtic).

● Comprensió empresarial: què necessita l'empresa?


○ Determinar objectius comercials
○ Avaluar la situació
○ Determinar els objectius de la mineria de dades
○ Elaborar un pla de projecte (seleccionar eines i definir fases de projecte)
● Comprensió de les dades: quines dades tenim/necessitem? Està net?
○ Recollida de dades inicials
○ Descriu, explora i verifica la qualitat les dades
● Preparació de dades: com organitzem les dades per a la modelització?
○ Selecció, neteja, construcció, integració i formata de dades
● Modelatge: quines tècniques de modelatge hem d'aplicar?
○ Seleccionar tècniques de modelització
○ Generar dissent de prova
○ Construir model
○ Avaluació del model
● Avaluació: quin model compleix millor els objectius empresarials?
○ Avaluar els resultats
○ Procés de revisió
○ Determinar passos següents
● Desplegament: com accedeixen les parts interessades als resultats?
○ Pot ser tan senzilla com generar un informe o tan complexa com implementar un
procés de mineria de dades repetible a tota l'empresa.
SEMMA
Les empreses utilitzen les dades per aconseguir un avantatge competitiu, millorar el rendiment i
oferir serveis més útils als clients. Les dades que recollim sobre el nostre entorn serveixen de base
per a hipòtesis i models del món en què vivim. En definitiva, les dades s'acumulen per ajudar a
recollir coneixement. Això vol dir que les dades no valen gaire fins que no s'estudien i analitzen.

Però acumular grans volums de dades no és equivalent a reunir coneixements valuosos. És només
quan les dades s'ordenen i s'avaluen que n'aprenem alguna cosa.Així, l'Institut SAS va
desenvolupar SEMMA com el procés de mineria de dades.

Té cinc passos:

● Mostrar (Sample): L'objectiu d'aquesta etapa inicial del procés és identificar variables o
factors (tant dependents com independents) que influeixen en el procés. A continuació, la
informació recollida s'ordena en categories de preparació i validació.

● Explorar (Explore): Durant aquest pas, es realitza una anàlisi univariant i multivariant per
estudiar les relacions interconnectades entre els elements de dades i identificar els buits
en les dades. Mentre que l'anàlisi multivariant estudia la relació entre variables, la
univariada mira cada factor individualment per entendre la seva part en l'esquema global.
S'analitzen tots els factors d'influència que poden influir en el resultat de l'estudi, amb una
gran confiança en la visualització de dades.

● Modificar (Modify): En aquest pas, les dades s'analitzen i es netegen, després es passen a
l'etapa de modelatge i s'exploren si les dades requereixen perfeccionament i transformació.

● Modelar (Model): Amb les variables refinades i netejades, el pas de modelització aplica
una varietat de tècniques de mineria de dades per tal de produir un model projectat de
com aquestes dades aconsegueixen el resultat final desitjat del procés.

● Avaluar (Assess): en aquesta etapa final del SEMMA, s'avalua el model de la utilitat i
fiabilitat que és per al tema estudiat. Les dades ara es poden provar i utilitzar per estimar
l'eficàcia del seu rendiment.
QUÈ ÉS UN BUSINESS INTELLIGENCE?
- Inclou de tot:
→ Informes visuals i interactius, Ad hoc
→ Anàlisi interactiu
→ Anàlisi “Què passa si “ (What-if)
→ Modelització descriptiva i predictiva
- Cal definir maneres d’introduir BI
- Totes les empreses necessiten un enfocament personalitzat

REPTES DEL NEGOCI:

PRESSIONS ACTUALS DELS NEGOCIS:


ANÀLISIS DE DADES I ROLS PROFESSIONALS:
Per a una empresa, no n'hi ha prou de tenir només dades. Ha de ser capaç d'actuar en funció d'ells
perquè tinguin efecte a l'empresa, per exemple, per reassignar recursos interns per donar cabuda a
una necessitat, o bé per poder identificar una campanya amb errors i saber quan modificar el
rumb. En aquestes situacions són on destaca la importància d’explicar una història amb les dades.

NOTES: Amb les dades i la informació com l'actiu més estratègic d'una empresa, el repte
subjacent que les organitzacions tenen avui dia és entendre i fer servir les dades per afectar de
manera positiva el canvi dins de l'empresa. Però les empreses continuen intentant fer servir les
seves dades de manera significativa i productiva, cosa que afecta la seva capacitat d'actuació. Una
empresa detallista ha de ser capaç d'usar les enormes quantitats de dades i informació d'una
manera que afecti el negoci, per exemple per al següent:
- Seguiment de l'inventari Identificació d’hàbits de compra
- Detecció de tendències i patrons d’usuaris
- Recomanació de compres
- Definició d'optimitzacions de preus
- Identificació i detenció del frau
A més, podeu cercar patrons de venda diaris o mensuals. Altres segments de dades comunes que
potser voleu examinar són dia a dia, setmana a setmana i mes a mes, perquè pugueu comparar les
vendes d'una setmana amb les de la mateixa setmana de l'any anterior, per exemple.
El procés d'explicar una història mitjançant dades també es vincula a la creació d'aquesta cultura
de dades dins de l'organització. Encara que la història és important, on s'explica també és
fonamental per garantir que es transmet a les persones adequades. A més, assegureu-vos que els
usuaris puguin detectar la història, que saben on trobar-la i integrar-la en les interaccions
habituals. L'anàlisi de dades existeix per facilitar la superació d'aquests desafiaments i obstacles,
cosa que en última instància ajuda les empreses a obtenir conclusions i revelar el valor ocult entre
la multitud de dades a través de la narrativa. A mesura que llegiu, obtindreu informació sobre com
utilitzar i aplicar aptituds analítiques per anar més enllà d'un únic informe i influir en
l'organització explicant històries amb les dades i impulsant aquesta cultura de dades.
ANÀLISIS DE DADES: CATEGORIES:
Encara que el procés d’anàlisi de dades se centra en les tasques de neteja, modelatge i visualització
de dades, el concepte d’anàlisi de dades i la seva importància per a les empreses no‘’sha de
subestimar. Per analitzar les dades, els components principals de l'anàlisi es divideixen en les
categories següents:
Anàlisi descriptiva → L'anàlisi descriptiva ajuda a respondre preguntes sobre què ha passat, en
funció de dades històriques. Mitjançant el desenvolupament d’indicadors clau de rendiment
(KPI), aquestes estratègies poden facilitar el seguiment de l’èxit o el fracàs dels objectius clau. Un
exemple d’anàlisi descriptiva és la generació d’informes per proporcionar una visió de les dades
financeres i de vendes d’una organització.
Anàlisi de diagnòstic → L'anàlisi de diagnòstic ajuda a respondre preguntes sobre per què hi ha
hagut un esdeveniment. Les tècniques d'anàlisi de diagnòstic complementen l'anàlisi descriptiva
bàsica i fan servir els resultats de l'anàlisi descriptiva per identificar la causa d'aquests
esdeveniments. Després, els indicadors de rendiment s'investiguen encara més per descobrir
perquè aquests esdeveniments han millorat o empitjorat. Aquest procés se sol fer en tres passos:
1.- Identificació d'anomalies a les dades: Aquestes anomalies poden ser canvis inesperats en una
mètrica o un mercat determinat.
2.- Recull de dades relacionades amb aquestes anomalies.
3.- Ús de tècniques estadístiques per detectar relacions i tendències que expliquin aquestes
anomalies.
Anàlisi predictiva → L'anàlisi predictiva ajuda a respondre preguntes sobre el que passarà en el
futur. Les tècniques d'anàlisi predictiva usen dades històriques per identificar tendències i
determinar la probabilitat que es repeteixin. Les eines d'anàlisi predictiva proporcionen valuoses
conclusions sobre el que podria passar en el futur.
Anàlisi prescriptiva → L'anàlisi prescriptiva ajuda a respondre preguntes sobre les accions que cal
dur a terme per assolir un objectiu. Mitjançant les conclusions de l'anàlisi predictiva, les
organitzacions poden prendre decisions basades en dades. Aquesta tècnica permet que, en cas
d'incertesa, les empreses prenguin decisions fonamentades. Les tècniques d'anàlisi prescriptiva
depenen d'estratègies d'aprenentatge automàtic per cercar patrons en conjunts de grans dades.
Mitjançant l’anàlisi d’esdeveniments i decisions anteriors, les organitzacions poden calcular la
probabilitat d’altres resultats.
Anàlisi cognitiva → L'anàlisi cognitiva ajuda a saber què podria passar si canviessin les
circumstàncies i a determinar com es podrien controlar aquestes situacions. Les inferències no són
consultes estructurades basades en una base de dades de regles, sinó supòsits no estructurats que
es recopilen de diversos orígens i s'expressen amb diferents graus de confiança. L'anàlisi cognitiva
eficaç depèn d'algorismes d'aprenentatge automàtic i utilitza diversos conceptes del processament
de llenguatge natural per entendre orígens de dades desaprofitades anteriorment, com ara els
registres de converses de centres de trucades i revisions de productes.

+
ANÀLISIS DE DADES: ROLS
Fa poc temps, els rols com els d'analistes de negocis i desenvolupadors d'intel·ligència empresarial
eren els habituals per al processament i la comprensió de les dades. Però l'augment excessiu de la
mida de les dades i els diferents tipus ha provocat que aquests rols evolucionin cap a conjunts
d'aptituds més especialitzades que modernitzen i simplifiquen els processos d'enginyeria i anàlisi
de dades.
Rols a les dades i la seva responsabilitat específica en tot l'espectre de la detecció i comprensió de
les dades:
1. Analista de negocis → Encara que hi ha algunes similituds entre un analista de dades i un
analista de negocis, el diferenciador clau entre tots dos és el que fan amb les dades. Un
analista de negocis és més a prop de l'empresa i és un especialista en la interpretació de les
dades que procedeixen de la visualització. Sovint, les tasques de l'analista de dades i
l'analista de negoci poden ser responsabilitat d'una mateixa persona.

2. Analista de dades → Un analista de dades permet a les empreses maximitzar el valor dels
seus recursos de dades mitjançant eines de visualització i creació d'informes com
Microsoft Power BI. L'analista de dades és responsable de la generació de perfils, la neteja i
la transformació de les dades. Les seves responsabilitats també inclouen el disseny i la
creació de models de dades escalables i eficaces, i l'habilitació i la implementació de les
funcions d'anàlisi avançat en informes per a la seva anàlisi. Un analista de dades treballa
amb les parts interessades pertinents per identificar els requisits de dades i de creació
d’informes necessaris i, després, s’encarrega de convertir les dades sense processar en
conclusions rellevants i significatives. A més, també és responsable d'administrar els
recursos de Power BI, inclosos els informes, panells, àrees de treball i els conjunts de dades
subjacents que es fan servir als informes. Se us encomana la implementació i configuració
dels procediments de seguretat adequats, juntament amb els requisits de les parts
interessades, per garantir la seguretat de tots els recursos de Power BI i les seves dades. Un
analista de dades treballa amb enginyers de dades per determinar i localitzar els orígens
de dades adequades que satisfan els requisits de les parts interessades. A més, treballa amb
enginyers de dades i administradors de bases de dades per assegurar-se de tenir l’accés
adequat als orígens de dades que necessita. L'analista de dades també treballa amb
enginyers de dades per identificar nous processos o millorar els ja existents per tal de
recopilar dades per analitzar-les.
3. Enginyer de dades → Els enginyers de dades aprovisionen i configuren les tecnologies de
plataforma de dades locals i al núvol. Administren i protegeixen el flux de dades
estructurades i no estructurades procedents de múltiples orígens. Entre les plataformes de
dades que usen hi ha les bases de dades relacionals, les bases de dades no relacionals, els
fluxos de dades i els magatzems de fitxers. Els enginyers de dades també s'asseguren que
els serveis de dades s'integrin de manera segura i sense problemes als serveis de dades.
Entre les seves principals responsabilitats s'inclou l'ús de serveis dades locals i al núvol, i
eines per a la ingesta, la sortida i la transformació de dades procedents de múltiples
orígens. Els enginyers de dades col·laboren amb les parts interessades de ‘lempresa per
identificar i complir els requisits de les dades. A més, dissenyen i implementen solucions.
Tot i que hi podria haver certa semblança entre les tasques i les responsabilitats d'un
enginyer de dades i un administrador de bases de dades, l'àmbit de treball d'un enginyer
de dades va més enllà del manteniment d'una base de dades i del servidor on s'allotja , i és
probable que no inclogui l'administració general de les dades operatives. L'enginyer de
dades afegeix un valor enorme als projectes de ciència de dades i intel·ligència
empresarial. Quan l'enginyer de dades aglutina les dades, cosa que se sol descriure com a
neteja i transformació de les dades, els projectes es mouen més ràpidament perquè els
científics de dades poden centrar-se en les seves àrees de treball específiques. Com a
analista de dades, treballareu juntament amb un enginyer de dades per assegurar-vos que
podeu accedir als diferents orígens de dades estructurades i no estructurades, ja que us
ajudaran a optimitzar els models de dades que normalment se serveixen des d'un
magatzem de dades o llac de dades modern. Tant els administradors de base de dades com
els professionals d'intel·ligència empresarial poden adoptar un rol d'enginyer de dades si es
familiaritzen amb les eines i les tecnologies usades per processar grans quantitats de
dades.
4. Científic de dades → Els científics de dades fan una anàlisi avançada per extreure valor de
les dades. El vostre treball pot variar de l'anàlisi descriptiva a l'anàlisi predictiva. L'anàlisi
descriptiva avalua les dades a través d'un procés conegut com a anàlisi de dades
exploratòria (EDA). L'anàlisi predictiva es fa servir en l'aprenentatge automàtic per aplicar
tècniques de modelatge que poden detectar anomalies o patrons. Aquestes anàlisis són
una part important dels models de previsió. L'anàlisi descriptiva i la predictiva només
representen aspectes parcials del treball dels científics de dades. Alguns científics de dades
poden endinsar-se en l'aprenentatge profund, fent experiments iteratius per resoldre un
problema de dades complicat mitjançant l'ús d'algoritmes personalitzats complexos. Les
proves anecdòtiques suggereixen que la major part del treball d'un projecte de ciència de
dades s'inverteix en la neteja i la transformació de dades i en l'enginyeria de
característiques. Els científics de dades poden accelerar el procés d’experimentació quan
els enginyers de dades usen els seus coneixements per netejar i transformar correctament
les dades. A simple vista, és possible que sembli que el treball d’un científic de dades i un
analista de dades són diferents, però no és així. Un científic de dades examina les dades
per determinar les preguntes que necessiten respostes i, sovint, dissenyarà una hipòtesi o
un experiment, i després recorrerà a l'analista de dades perquè us ajudi amb la
visualització de dades i la creació d'informes.
5. Administrador de base de dades → Un administrador de bases de dades implementa i
administra els aspectes operatius de les solucions de plataforma de dades híbrides i
natives del núvol que es basen en serveis de dades de Microsoft Azure i Microsoft SQL
Server. També és responsable de la disponibilitat general i de les optimitzacions i
rendiment coherents de les solucions de base de dades. Treballa amb les parts interessades
per identificar i implementar les directives, les eines i els processos per als plans de còpia
de seguretat i recuperació de dades. El rol d'un administrador de la base de dades és
diferent del d'un enginyer de dades. Un administrador de bases de dades supervisa i
administra l'estat general d'una base de dades i el maquinari on es troba, mentre que un
enginyer de dades està implicat en el procés de neteja i transformació de dades, és a dir, la
ingesta, transformació, validació i neteja de les dades per satisfer les necessitats i els
requisits empresarials. L'administrador de bases de dades també és responsable
d'administrar la seguretat general de les dades, i de concedir i restringir l'accés i els
privilegis dels usuaris a les dades segons les necessitats i els requisits empresarials.

ANÀLISIS DE DADES: ROL ANALISTA DE DADES:


1. Preparació → Com a analista de dades, probablement passarà la major part del temps
entre les tasques de preparació i modelatge. Les dades imprecisos o incorrectes poden
tenir un gran impacte i generar informes no vàlids, una pèrdua de confiança i un efecte
negatiu en les decisions empresarials, cosa que pot conduir a la pèrdua d'ingressos, un
impacte empresarial negatiu i molt més. Abans que es pugui crear un informe, cal
preparar les dades. La preparació de dades és el procés de generació de perfils i de neteja i
transformació de les dades per preparar-les per al modelatge i la visualització. La
preparació de dades consisteix a prendre dades sense processar-les i convertir-les en
informació de confiança i comprensible. Implica, entre altres coses, garantir la integritat
de les dades, corregir dades incorrectes o inexactes, identificar les dades que faltin,
convertir dades d'una estructura a una altra o d'un tipus a un altre, o fins i tot una tasca
tan senzilla com fer que les dades siguin més llegibles. La preparació de dades també
implica comprendre com obtindrà les dades i connectar-s'hi, i conèixer les implicacions de
rendiment de les decisions. En connectar-vos a les dades, heu de prendre decisions per
assegurar-vos que els models i els informes compleixen i duen a terme les expectatives i
els requisits confirmats. Les garanties de privadesa i seguretat també són importants.
Aquestes poden incloure l'anonimització de les dades per evitar que es comparteixin en
excés o impedir que els usuaris vegin informació d'identificació personal quan no calgui.
Ajudar a garantir que la privadesa i la seguretat també pot implicar l'eliminació completa
de les dades si no s'ajusten a la història que està intentant narrar. La preparació de dades
sovint pot ser un llarg procés. Els analistes de dades segueixen una sèrie de passos i
mètodes per preparar les dades per tal de col·locar-les en un context i un estat adequats
que eliminin la qualitat deficient de les dades i permetin convertir-les en conclusions
valuoses.
2. Modelat → Quan les dades estan en un estat correcte, estan a punt per modelar-se. El
modelatge de dades és el procés de determinar com es relacionen les taules entre si.
Aquest procés es realitza mitjançant la definició i la creació de relacions entre les taules. A
partir d'aquí, podeu millorar el model si definiu mètriques i afegiu càlculs personalitzats
per enriquir les dades. La creació d'un model de dades eficaç i adequat és un pas essencial
per ajudar les organitzacions a comprendre i obtenir conclusions valuoses sobre les dades.
Un model de dades eficaç fa que els informes siguin més precisos, permet que les dades
s'explorin de manera més ràpida i eficaç, redueix la durada del procés de creació
d'informes i simplifica el futur manteniment de l'informe. El model és un altre component
important que té un efecte directe en el rendiment de l’informe i l’anàlisi de dades global.
Un model mal dissenyat pot tenir un impacte dràsticament negatiu en la precisió general i
el rendiment de l’informe. Per contra, un model ben dissenyat amb dades ben preparades
garantirà un informe eficaç i de confiança. Això és fins i tot més important quan es
treballa amb dades a escala. Des d'una perspectiva de Power BI, si l'informe funciona amb
lentitud o les actualitzacions triguen molt de temps a completar-se, probablement haureu
de tornar a revisar les tasques de preparació i modelatge de dades per optimitzar l'informe.
El procés de preparació i modelatge de dades és iteratiu. La preparació de dades és la
primera tasca a l'anàlisi de dades. Comprendre i preparar les dades abans de modelar-les
farà que el pas de modelatge sigui molt més fàcil.
3. Visualització → A la tasca de visualització és on es fa que les dades cobrin vida. L’objectiu
final de la tasca de visualització és solucionar els problemes de l’empresa. Un informe ben
dissenyat ha de contar una història atractiva sobre aquestes dades, cosa que permet als
responsables de la presa de decisions empresarials obtenir ràpidament les conclusions que
necessiten. Amb les visualitzacions i interaccions adequades, podeu proporcionar un
informe eficient que guiï el lector a través del contingut de forma ràpida i eficaç, cosa que
us permetrà seguir una narrativa en les dades. Els informes que es creen durant la tasca de
visualització ajuden les empreses i els responsables de la presa de decisions a comprendre
el significat de les dades perquè es puguin prendre decisions encertades i precises. Els
informes impulsen les accions, les decisions i els comportaments generals d'una
organització que confia i depèn de la informació detectada a les dades. L'empresa pot
comunicar que necessiteu tots els punts de dades d'un informe concret per a la presa de
decisions. Com a analista de dades, heu de dedicar temps a comprendre per complet el
problema que l'empresa intenta resoldre. Determineu si tots els punts de dades són
necessaris, ja que un excés de dades pot dificultar la detecció dels punts clau. Una història
de dades petita i concisa pot ajudar a trobar la informació ràpidament. Amb les funcions
integrades d'intel·ligència artificial a Power BI, els analistes de dades poden crear informes
eficaços, sense necessitat d'escriure codi, cosa que permet als usuaris obtenir conclusions i
respostes, i trobar objectius assolibles. Les funcions d'intel·ligència artificial a Power BI,
com els objectes visuals d'IA integrats, permeten la detecció de dades mitjançant la
formulació de preguntes, l'ús de la característica Conclusions ràpides o la creació de
models de Machine Learning o directament a Power BI. Un aspecte important de la
visualització de dades és el disseny i la creació d’informes per a l’accessibilitat. A mesura
que crea informes, és important pensar en les persones que hi accediran i llegir-los. Els
informes s'han de dissenyar pensant en l'accessibilitat des del principi, de manera que no
calgui cap modificació especial en el futur.
4. Anàlisi → La tasca d'anàlisi és el pas important d'entendre i interpretar la informació que
es mostra a l'informe. En el seu rol com a analista de dades, ha de comprendre les funcions
analítiques de Power BI i fer-les servir per buscar conclusions, identificar patrons i
tendències, predir resultats i, després, comunicar aquestes conclusions d'una manera
comprensible per a tothom. L'anàlisi avançada permet a empreses i organitzacions
impulsar millors decisions a tota l'empresa i crear conclusions eficaces i resultats
significatius. Amb l'anàlisi avançada, les organitzacions poden aprofundir en les dades per
predir patrons i tendències futurs, identificar activitats i comportaments, i permetre a les
empreses formular les preguntes adequades sobre les dades. Anteriorment, l'anàlisi de les
dades era un procés difícil i complex que normalment feien enginyers de dades o científics
de dades. Actualment, Power BI el posa a l'abast de tothom, cosa que simplifica el procés
d'anàlisi de dades. Els usuaris poden obtenir amb rapidesa conclusions sobre les dades
mitjançant objectes visuals i mètriques directament des de l'escriptori i, després, poden
publicar-les en panells perquè altres puguin trobar la informació necessària. Aquesta
característica és una altra àrea on les integracions d'IA dins de Power BI permeten portar
l'anàlisi al nivell següent. Les integracions amb l'Azure Machine Learning, els serveis
cognitius i els objectes visuals d'IA integrats ajuden a enriquir les dades i l'anàlisi.
5. Administració → Power BI consta de molts components, com ara informes, panells, àrees
de treball, conjunts de dades i molt més. Com a analista de dades, és responsable
d'administrar aquests recursos de Power BI, de supervisar l'ús compartit i la distribució
d'elements com a informes i panells, i de garantir la seguretat dels recursos de Power BI.
Les aplicacions poden ser un mètode de distribució valuós per al contingut i permeten
una administració més senzilla per a públics de grans dimensions. Aquesta característica
també permet tenir experiències de navegació personalitzades i vincular altres recursos de
l'organització per complementar els informes. L’administració del contingut ajuda a
fomentar la col·laboració entre equips i usuaris. L’ús compartit i la detecció de contingut
és important perquè les persones adequades obtinguin les respostes que necessiten.
També és important assegurar-se que els elements siguin segurs. Voldrà assegurar-se que
les persones adequades hi tenen accés i que les dades no es perden més enllà de les parts
interessades correctes. L'administració adequada també pot ajudar a reduir les sitges de
dades dins de l'organització. La duplicació de les dades pot dificultar l'administració i la
introducció de latència de dades quan els recursos es fan servir en excés. Power BI ajuda a
reduir les sitges de dades mitjançant l'ús de conjunts de dades compartides, i permet
reutilitzar les dades que s'han preparat i modelat. En el cas de dades empresarials clau,
l'aprovació d'un conjunt de dades com a certificat pot ajudar a garantir la confiança en
aquestes dades. L'administració dels recursos de Power BI ajuda a reduir la duplicació
d'esforços i garantir la seguretat de les dades.

You might also like