You are on page 1of 115

BUSINESS INTELLIGENCE

UNIVERSIDAD CENTRAL DEL ECUADOR


FA C U LTA D D E I N G E N I E R Í A C I E N C I A S F Í S I C A S Y M AT E M Á T I C A S
ss
e
in
us
B
AL de
l

TU rn o

A C t o
en
N
Ó tua l y
I
C c
UA a
n ce
I T ac en
i ó
S itu llig
S te
In

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. EL FUTURO DEL BI ESTÁ AQUÍ.
En dónde estamos?
 Un sector de crecimiento cercano a los dos dígitos* y con una
continuación prevista en el tiempo.
 Ahora el BI es una de las principales prioridades de los
directivos (CEO’s, CIO’s).

• El crecimiento va a marcarse
con las nuevas tendencias:
• Real Time BI
• Big Data
• Mobile BI
• Social Media Integration

IDC. Worldwide Business Analytics Software 2012-2016 Ing. Mario R. Morales, MBA
INTRODUCCIÓN. EL BI SE HA DEMOCRATIZADO
1. El BI se ha democratizado.
 Cada vez más organizaciones usan BI para la toma de
decisiones.
 Tradicionalmente el BI fue usado por grandes corporaciones
(banca, gran consumo, telecomunicaciones).
 En la actualidad sectores productivos, comerciales,
administración pública usan BI para optimizar y mejorar el
servicio a clientes y ciudadanos.
 El BI se ha extendido de personal analista y de dirección hacia
todas aquellas personas que manejan información y toman
decisiones.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. SOLUCIONES FOCALIZADAS
2. Soluciones focalizadas:
 Las soluciones de “cajas cerradas” requieren ajustes y
desarrollos a medida, éstos pueden ser costosos para llegar a
proporcionar los beneficios esperados.
 La tendencia es hacia la “verticalización” de las soluciones
para permitir un aprovechamiento óptimo de cada tipo de
empresa.
 Ha permitido además la “internacionalización” de las soluciones
por sectores económicos, industrias o localizaciones
geográficas.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. CONSOLIDACIÓN DEL MERCADO BI
3. Consolidación de soluciones BI mediante compras y fusiones.
 Tendencia marcada en los últimos años.
 Antes, el mercado era muy fragmentado. Coexistían muchas
herramientas sin un predominio. Principalmente por dos motivos:
 Por una parte existían compañías y productos especializados (pure
players). Por otra los grandes fabricantes (Oracle, Microsoft, SAP,
IBM) que tenía al BI como una línea más de su portafolio.
 El BI se ha compuesto de una gran variedad de tecnologías que
aunque enfocadas todas en el manejo de datos y la toma de
decisiones se diferenciaban en soluciones ETL, reporting, análisis,
OLAP, dashboarding, minería de datos, etc.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. CONSOLIDACIÓN DEL MERCADO BI
Consolidación de soluciones BI mediante compras y fusiones
(…)
 En los últimos años se ha producido un proceso de compras y
adquisiciones de las herramientas más veteranas: Cognos,
Hyperion, Business Objects, ProClarity, Lumira, etc. … por
parte de los grandes fabricantes (Oracle, SAP, Microsoft..),
incluso de los provenientes del mundo del hardware como IBM
y HP que están enfocándose ahora en los servicios (el fierro deja
cada vez menos margen debido a la competencia de los
mercados emergentes orientales).
 Paralelamente la aparición y relevancia de las nuevas
tendencias que se están consolidando. Un ejemplo es QlikView,
Pentaho, Tableau, etc.
 Incluso Google está poniendo atención en el BI con sus
soluciones analytics, librerías gráficas, servidores de mapas,
etc.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. CONSOLIDACIÓN DEL MERCADO BI
BI Ecosystem

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. PLANIFICACIÓN, PRESUPUESTACIÓN
4. Planificación, presupuestación y forecast como necesidad
complementaria a un sistema de BI.
 El uso de módulos de presupuestación y forecasts en las
soluciones BI no es algo nuevo, herramientas como Hyperion o
Cognos lo facilitaban, así como módulos adicionales de los
grandes paquetes ERP.
 Sin embargo, en la actualidad se está necesitando que estas
capacidades de planificación y forecast se extiendan del ámbito
financiero al que tradicionalmente han pertenecido al de las
ventas, ecommerce, social media, etc… y además manejadas
por un gran número de diferentes perfiles de usuarios.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. PLANIFICACIÓN, PRESUPUESTACIÓN
Planificación, presupuestación y forecast como necesidad
complementaria a un sistema de BI (…)
 El segundo desafío proviene del gran aumento de datos que son
necesarios presupuestar, simular, planificar, etc.
 Tradicionalmente este tipo de análisis se ha venido realizando
a través de motores de BD multidimensionales (MOLAP) que
permiten recálculo de reglas de negocio y simulaciones.
 No obstante, el aumento del número de datos a presupuestar
supone un desafío. Se debe tener en cuenta bases de datos
orientadas a columnas y otros sistemas de almacenamiento
(big data).
 Finalmente, el objetivo final que tienen todas las organizaciones
es desterrar un problema muy extendido en las mismas, pero
difícil de gestionar, como es el del uso extensivo e
indiscriminado de hojas de cálculo tipo Excel, para
gestionar todo este proceso.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. USO DEL BI EN MODELO SAAS
5. Uso del BI en modelo SaaS o en la nube.
 El modelo SaaS (software as a service) está entrando también en el
campo del BI ya que ofrece ventajas que pueden suponer el ahorro de
costos de adquisición, mantenimiento e infraestructura y la
posibilidad de escalar a número de usuarios y funcionalidades en
forma sencilla.
 No obstante, debido a las necesidades de adaptación (customización)
propias que cada organización requiere y a la aún reticencia de dejar
sus datos fuera de la arquitectura interna, está haciendo que este
modelo se extienda en forma más lenta de lo previsto.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. USO DEL BI EN MODELO SAAS
Uso del BI en modelo SaaS o en la nube (..):
 Sin embargo, hay grandes ventajas que cierto tipo de compañías
pueden aprovecharla, tales como:
 Compañías medianas que hasta el momento no habían podido hacer
uso de herramientas BI por su alto coste y que tenían gran interés
en hacerlo. Gracias al modelo SaaS pueden realizarlo sin tener que
invertir grandes cantidades.
 Nuevas compañías que están surgiendo alrededor de negocios
basados en Internet o de rápido crecimiento en donde les es difícil
estimar su volumen de datos, usuarios y tipos de análisis, por su
rápido crecimiento y en donde una fórmula que les permita ir
escalando en servicios, capacidad y funcionalidades en base a sus
necesidades cambiantes, les supone un modelo altamente flexible y
efectivo.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. OPEN DATA
6. Open Data.
 Escenario que aparece principalmente impulsado por personas ajenas
a la organización que tienen un concepto distinto de usabilidad de los
datos.
 Muchas empresas han dispuesto APIs que permiten la creación de
aplicaciones con datos de la compañía.
 Un ejemplo son los gobiernos que tienen información que todos los
contribuyentes pueden acceder.
 Las soluciones Open Source están alcanzando cada vez mayor
madurez (desarrolladores, seguridades, comunidades, estabilidad).

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. BI 2.0
7. El BI 2.0.
 Las herramientas BI tradicionales tienen pantallas e interfaces muy
complicados, son muy caras de comprar y de mantener y las
actualizaciones de versiones son extremadamente complejas.
Además suelen incluir funcionalidades que muchas veces no se usan.
 Las nuevas tendencias prometen simplicidad, acceso universal,
análisis en tiempo real, colaboración, inteligencia operacional,
servicios conectados y un nivel de acceso a datos diferentes que
permitirá todo tipo de análisis antes dejados por imposibles.
 Los usuarios no contaban con una interacción recíproca, no eran
capaces de añadir contenido o “inteligencia”.
 La diferencia entre ambas será el de acortar el análisis y la acción.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. BI 2.0
El BI 2.0. (..)
 El BI 2.0 tendrá que crear aplicaciones visuales muy sencillas y
llamativas, que puedan ser usadas por cualquier persona de la
organización sin necesidad de conocimientos especializados. Deberá
estar escrito en su propio lenguaje.
 En lugar de partir de la información contenida en el tradicional
DataWarehouse, el BI 2.0 debe ser capaz de acceder y mostrar en
tiempo real toda la información que sea relevante para la toma de
decisiones allá donde esté y en el formato en el que esté.

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. BI 2.0
El BI 2.0. (..)
 Entre los factores más destacados tenemos:
 Convergencia dentro de la empresa. El BI deja de ser cerrado
solo para analistas y directores; ahora toda la organización será parte
de este nuevo enfoque de forma colaborativa, dependiendo solo de
los conocimientos y necesidades propios.
 Datawarehouse Online. La existencia de más participantes en el
sistema y las mejoras de las capacidades de hardware (procesadores,
memoria, etc.) harán que los procesos de carga y transformación se
tengan que realizar de forma simultánea al análisis.
 Cambios en las metodologías. Habrán nuevos debates sobre qué
enfoques metodológicos son mejores (quizá aparecerán nuevos
enfoques) .. Bases de datos orientadas a columnas en lugar de
relacionales (?).

Ing. Mario R. Morales, MBA


INTRODUCCIÓN. BI 2.0
El BI 2.0. (..)
 Entre los factores más destacados tenemos (..):
 Cambio de licenciamiento. Los modelos Open Source y On
Demand potenciarán los cambios en los esquemas de
licenciamiento debido a la masificación de usuarios.
 Acceso universal a los datos. Gracias al uso de metadatos y
semántica apropiada para el negocio, los DataWarehouse deberán
poder ser accedidos y creados sin necesidad de complicados, largos
y duros procesos ETL. De esta forma, se acortan los pasos desde el
dato de origen a la visualización final por parte de los usuarios.

Ing. Mario R. Morales, MBA


El Data Discovery debe ayudar a la
gente a gestionar su conocimiento

Datos

Lugare
s

Ing. Mario R. Morales, MBA


Sistema de
Información
I
N
T
E
L
I
G
Sistemas E
DASHBORDS
N
Estratégicos BI
C
(Índices) I
A
Información Herramient
Sistemas de Gestión as OLAP
(Datos estadísticos) (Cognos,
Discoverer)

Sistemas Operativos Standard


Transaccionales Query
(Operaciones diarias) Language

19
Ing. Mario R. Morales, MBA
BUSINESS INTELLIGENCE

ETL

Datamart Pentaho,
SQL*Forms, Cognos, Interfaz de
BD Store Discoverer, usuario
Transaccional Procedures Etc.
20
Ing. Mario R. Morales, MBA
CONCEPTO DE DATAWAREHOUSE

E S U N C O N J U N T O D E D AT O S I N T E G RA D O S ,
O R I E N TA D O S A U N A M AT E R I A Q U E VA R Í A N C O N
EL TIEMPO Y QUE NO SON TRANS ITORIOS, LOS
C U A L E S S O P O RTA N E L P R O C E S O D E T O M A D E
DECISIONES DE UNA ADMINISTRACIÓN.

L A E S E N C I A D E L D ATAWA R E H O U S E N O E S U N
PRODUCTO, ES UNA TÉCNICA DE ENSAMBLAR Y
G E S T I O N A R L O S D AT O S P R O C E D E N T E S D E
D I S T I N TA F U E N T E S D E F O R M A A D E C U A D A C O N
EL OBJETO DE TENER UN VISIÓN ÚNICA DE LOS
M I S M O S PA RA T O D A L A E M P R E S A .

21
POR QUE ES IMPORTANTE EL DATAWARE HOUSE
•S O P O R T E D E A C C I O N E S A U N C O S T O E F I C A Z .
LO S D ATAWA R E H O U S E P R O D U C E N R E P O RT E S Y C O N S U LT A S
EN EL NIVEL DE GESTIÓN.

•R E A R Q U I T E C T U R A DE UN SISTEMA DE
APLICACIONES.
L A SEPARAC IÓN DE LOS SISTEMAS DE PRODUCC IÓN (N IVEL
O P E RAT I V O ) C O N LO S D E L D ATAWA R E H O U S E , O F R E C E A L
ÁREA DE SISTEMAS UNA O P O RT U N I DA D ÚNICA PA RA
DEPURAR LOS SISTEMAS DE HERENCIA (ORIGINALES)
C O N F O R M E AVA N Z A L A A R Q U I T E C T U RA D E L S I ST E M A D E L A
EMPRESA

22
POR QUE ES IMPORTANTE EL DATAWARE
HOUSE

Reingeniería de procesos empresariales.


DatawareHouse proporcionan a la empresa y la organización las
medidas requeridas para medir la posición competitiva.

23
Ing. Mario R. Morales, MBA
BENEFICIOS
D ATAWA R E H O U S E N O E S N I U N P R O D U C T O D E S O FT WA R E
NI UNA MÁQUINA O TECNOLOGÍA DE BASE DE DAT O S
PA RT I C U L A R , E S U N A S E R I E D E C O M P O N E N T E S Y P R O C E S O
QUE DE UN CONJUNTO FORMAN LA ARQUITECTURA DEL
D ATAWA R E H O U S E , Y D E L A M A N E RA C O M O GENEREMOS
NUESTRO D ATAWA R E H O U S E , SERÁN LOS BENEFICIOS
OBTENIDOS.
LOS SISTEMAS OPERACIONALES DE LA CUAL SE
TRANSFIERE LA INFORMACIÓN SELECCIONADA PUEDE SER
MANEJADORES DE DAT O S RELACIONALES (MOD E-R),
JERÁRQUICOS, DE ARCHIVOS (COBOL), PLANOS O DE
OTROS GENERADORES.

24
BENEFICIOS
L A I D E A P R I N C I P A L E S E L S O P O RT E P A R A
TOMA DE DECISIONES, PODER ANALIZAR
L O S D AT O S R E L A C I O N A D O S Y A P O RTA R
ELEMENTOS VA L I O S O S PA RA TOMAR
D E C I S I O N E S P O R P A RT E D E P E R S O N A L
ENCA RGADO DE L AS MISMAS, LO S CUA LES
P U E D E N S E R A N A L I S TA S , D I R E C T O R E S . D E
F O R M A I N M E D I ATA O E N L Í N E A R E A L I Z A R
C O N S U LTA S S I N N E C E S I D A D D E E S P E R A R
UN PROCESO

U N D ATA W A R E H O U S E N O S E C O M P R A ,
D ATA W A R E H O U S E S E C O N S T R U Y E
PORQUE ES AHÍ DONDE SE COLOCA EL
CONOCIMIENTO DEL NEGOCIO. 25
JUSTIFICACION
Las razones fundamentales que permite
generar un DatawareHouse, son de dos
tipos:
 
EL NEGOCIO: Por calidad de servicio, por
mayor cultura y exigencia del cliente,
como consecuencia de la inadecuada
gestión de la información, por
competencia, por la globalización, por la
liberación.

TECNOLOGIA: Abaratamiento, madurez,


nueva generación de 26
Ing. Mario R. Morales, MBA
DIFERENCIAS ENTRE DATAWARE HOUSE Y
BASE DE DATOS

D ATA W A R E H O U S E OLAP
(PROCESAMIENTO ANALÍTICO
EN LÍNEA)

TA B L A S M/ER
O LT P ( P R O C E S A M I E N T O D E TRAN S AC C IONE S
EN LÍNEA)

27
DIFERENCIAS ENTRE BI Y
SISTEMAS
OPERACIONALES

28
CARACTERISTICAS DEL
DATAWAREHOUSE
Esta orientado a una materia ya que
organiza y orienta los datos desde la
perspectiva del usuario final.

Administra gran cantidad de información,


los datawarehouse contienen
información histórica que nacen de los
sistemas transaccionales. Guarda
información en diferentes medios de
almacenamiento.

Comprende múltiples versiones de un


29
esquema de base de datos Ing.
enMario R.que
Morales, MBA
CARACTERISTICAS DEL
DATAWAREHOUSE
Condensa y agrega información: con frecuencia
los sistemas operacionales o transaccionales
guardan mucha información, el datawarehouse
condensa la información y lo presenta amigable
al usuario.

Ingresa y acoge información de muchas fuentes ya


que la información se encuentra en múltiples
aplicaciones en múltiples bases de datos. Se
requiere que el datawarehouse recopile y
organice la información en un solo lugar.

30
Ing. Mario R. Morales, MBA
TECNICA PARA CONSTRUIR UN DWH

LA RAZ ÓN DE LA COMPLEJIDAD DEL


D ATAWA R E H O U S E E S E L RA N G O D E T É C N I C A S
QUE SE REQUIEREN PA RA FORMULAR
D E S A R R O L L A R I M P L E M E N TA R Y E X P L O TA R U N
D ATAWA R E H O U S E .
 
TECNICAS EMPRESARIALES. SE RELACIONAN
CON LA COMPRENSIÓN DE LOS D AT O S Q U E
CONTIENEN UN D ATAWA R E H O U S E , SE
RELACIONA CON DETERMINAR LOS
REQUERIMIENTOS C O R P O RAT I V O S Y
TRAD UCIRLOS A C O N S U LT A S QUE PUEDEN
S AT I S FA C E R E L D ATA WA R E H O U S E
.
31
TECNICAS RELACIONADAS CON LA
TECNOLOGIA. JUNTO CON LAS COMPLEJIDADES
D E I M P L E M E N TA R U N D ATAWA R E H O U S E E S TÁ L A
N E C E S I DA D D E Q U E E L P R O C E S O C O N S E RV E E L
M I S M O R I T M O D E L A C U RVA D E A P R E N D I Z A J E D E
LOS USUARIOS Y LA DEMANDA DE LA
O R G A N I Z A C I Ó N PA RA A B S O R B E R L A T E C N O LO G Í A .

TECNICAS DE ADMINISTRACION DEL


P R O G R A M A . LO S D AT O S E X T RA Í D O S D E B E N S E R
U N I F O R M E S PA R A P O D E R C O M B I N A R L O S D AT O S
DE DIFERENTES FUENTES DENTRO DEL
D ATAWA R E H O U S E ESTE PROCESO SE LLAMA
TRANSFORMACIÓN.
E L S O F T WA R E D E T RA N S F O R M A C I Ó N C O N V I E RT E
LOS D AT O S DURANTE EL T RAS L ADO PA RA
AS EGURAR QUE LA INFORMACIÓN SEA
C O M PAT I B L E C O N L A B A S E D E D AT O S Q U E L A
RECIBE.
32
ARQUITECTURA LOGICA DEL
DATAWARE HOUSE

33
OPERACIONES EN UN DATA
WAREHOUSE
EN L A FIG URA SE M UESTRA ALGUNOS DE LOS
TIPOS DE OPERACIONES QUE SE EFECTÚAN
D E N T R O D E U N A M B I E N T E D ATA WA R E H O U S I N G .

34
1.-SISTEMAS OPERACIONALES
L O S D AT O S A D M I N I S T R A D O S P O R L O S
SISTEMAS DE APLICACIÓN
O P E RAC IO N A L E S SON LA FUENTE
P R I N C I PA L DE D AT O S PA RA EL D ATA
WA R E H O U S E .

L A S B A S E S D E D AT O S O P E R A C I O N A L E S S E
O RGAN IZAN P O R LO GEN ERAL C OM O
SISTEMAS DE BASE DE D AT O S
R E L AC IO N A L E S ( D B 2 , O RAC L E , IN F O R M IX ,
S Q L S E RV E R , P O S T G R E S , E TC . ) .

HOJAS DE D AT O S ELECTRÓNICAS,
A RC H I VO S P L A N O S .
35
2.-EXTRACCIÓN, TRANSFORMACIÓN Y
C A R G A D E LO S D AT O S .
S E R E Q U I E R E N H E R RA M I E N TA S D E G E S T I Ó N D E
D AT O S PA RA E X T RA E R D AT O S D E S D E B A S E S D E
D AT O S Y / O A RC H I V O S O P E R A C I O N A L E S , LU E G O
ES NECES ARIO MANIPUL AR O TRANSFO RM AR
LOS D AT O S ANTES DE CARGAR LOS
R E S U LT A D O S E N E L D A T A W A R E H O U S E .

T O M A R L O S D AT O S D E S D E VA R I A S B A S E S D E
D AT O S O P E RA C I O N A L E S Y T RA N S F O R M A R L O S
E N D AT O S R E Q U E R I D O S PA R A E L D E P Ó S I T O , S E
REFIERE A LA TRANSFO RMACIÓ N O A LA
I N T E G R A C I Ó N D E D AT O S . L A S B A S E S D E D AT O S
OPERACIONALES, DISEÑADAS PA RA EL
S O P O RT E DE VA R I A S APLICACIONES DE
PRODUCCIÓN, FRECUENTEMENTE DIFIEREN EN
E L F O R M AT O .

36
3 . - M E TA D ATA

O T R O PA S O N E C E S A R I O E S C R E A R L A
M E TA D ATA . L A M E TA D ATA ( E S D E C I R ,
D AT O S A C E RC A D E D AT O S ) D E S C R I B E
LO S CONTENIDOS DEL D ATA
WA R E H O U S E . L A M E TA D ATA C O N S I S T E
DE DEFINICIONES DE LOS ELEMENTOS
D E D AT O S E N E L D E P Ó S I T O , S I S T E M A ( S )
DEL (OS) ELEMENTO(S) FUENTE. COMO
L A D ATA , S E I N T E G R A Y T R A N S F O R M A
ANTES DE SER ALMACENADA EN
IN FORMACIÓN S IMIL AR.

37
4.-ACCESO DE USUA RIO FIN AL.
LOS USUARIOS ACCESAN AL
D ATAWA R E H O U S E POR MEDIO DE
H E R R A M I E N TA S DE PRODUCTIVIDAD
BASADAS EN GUI (GRAPHICAL USER
I N T E R FA C E - I N T E R FA S E GRÁFICA DE
USUARIO). PUEDEN PROVEERSE A LOS
U S U A R I O S D E L D ATAWA R E H O U S E M U C H O S
D E E S T O S T I P O S D E H E R R A M I E N TA S .

ESTOS PUEDEN I N C LU I R S O FT WA R E DE
C O N S U LT A S , G E N E R A D O R E S D E R E P O R T E S ,
PROCESAMIENTO ANALÍTICO EN LÍNEA,
H E R R A M I E N TA S D ATA / V I S U A L M I N I N G , E TC . ,
DEPENDIENDO DE LOS TIPOS DE USUARIOS
Y S U S R E Q U E R I M I E N T O S PA RT I C U L A R E S .

38
5 . - P L ATA F O R M A D E L D ATA W A R E H O U S E .
L A P L ATA F O R M A PA R A E L D ATAWA R E H O U S E E S
C A S I S I E M P R E U N S E RV I D O R D E B A S E D E
D AT O S R E L A C I O N A L . C U A N D O S E M A N I P U L A N
V O LÚ M E N E S M U Y G R A N D E S D E D AT O S P U E D E
REQUERIRSE UNA CONFIGURACIÓN EN BLOQUE
D E S E RV I D O R E S

LOS EXTRACTOS DE LA D ATA


INTEGRADA/TRANSFORMADA SE CARGAN EN
EL D ATAWA R E H O U S E . UNO DE LOS MÁS
POPULARES RDBMSS DISPONIBLES PA RA
D ATAWA R E H O U S I N G S O B R E L A P L ATA F O R M A
UNIX (EJEMP LO: NETEZZA DE IBM) LA
E L E C C I Ó N D E L A P L ATA F O R M A E S C R Í T I C A . E L
D E P Ó S I T O C R E C E R Á Y H AY Q U E C O M P R E N D E R
LOS REQUERIMIENTOS D ESP UÉS DE 3 O 5
AÑOS. 39
6 . - D AT O S E X T E R N O S .
DEPENDIENDO DE LA APLICACIÓN, EL
A L C A N C E D E L D ATAWA R E H O U S E P U E D E
E X T E N D E R S E P O R L A C A PA C I D A D D E
A C C E D E R A L A D ATA E X T E R N A .

EVOLUCIÓN DEL DEPÓSITO .


CONSTRUIR UN D ATAWA R E H O U S E ES UNA
TA R E A GRANDE. NO ES RECOMENDABLE
EMPRENDER EL DES ARROLLO DEL
D ATA W A R E H O U S E D E L A E M P R E S A C O M O U N
P R OY E C T O CUALQUIERA. MÁS BIEN, SE
RECOMIENDA QUE LOS REQUERIMIENT OS DE
U N A S E R I E D E FA S E S S E D E S A R R O L L E N E
IMPLEMENTEN EN MODELOS CONSECUTIVOS
QUE P E R M I TA N UN PROCESO DE
I M P L E M E N TA C I Ó N M Á S G R A D U A L E I T E R AT I V O .
40
D ATA WA R E H O U S E . E S U N A B A S E D E D AT O S
Q U E I N C LU Y E D AT O S R E L E VA N T E S PA RA L A
TOMA DE DECISIONES EN UN ÁREA DE
NEGOCIOS.
LOS D AT O S ALMACENADOS EN EL
D ATAWA R E H O U S E SON F U N D A M E N TA L M E N T E
A G R U PA M I E N T O S Y T O TA L I Z A D O R E S D E L O S
D AT O S R E L E VA N T E S Q U E S E E N C U E N T R A N E N
LA BASE DE PRODUCCIÓN, UN
C O M P O RTA M I E N T O I M P O RTA N T E DEL
D ATAWA R E H O U S E ES EL DICCIONARIO DE
D AT O S LLAMADO TA M B I É N M E TA D AT O S
D E S C R I B E L O S D AT O S A L M A C E N A D O S C O N E L
O B J E T I V O D E FA C I L I TA R E L A C C E S O A L O S
M I S M O S A T R AV É S D E L A S H E R R A M I E N TA S
OLAP(PROCESAMIENTO ANALÍTICO EN LÍNEA).
 EJEMPLO:
O RAC L E D I S C OV E R E R , C O G N O S , Q L I C K V I E W ,
P E N TA H O . 41
INTERFACES ORIENTADAS A
USUARIOS
Extraen información para la toma de decisiones
las clásicas son:
Análisis multidimensional,
Consultas
Reportes
Datamining

42
Ing. Mario R. Morales, MBA
INTERFACES ORIENTADAS A
USUARIOS
EN LA ACTUALIDAD EXISTEN H E R R A M I E N TA S DE
DISEÑO CONSTRUCCIÓN Y E X P LO TA C I Ó N
ADMINISTRACIÓN DE REPOSITORIOS DE INFORMACIÓN
MEDIANTE BASE DE D AT O S M U LT I D I M E N S I O N A L E S
O R I E N TA D A S A LA I M P L E M E N TA C I Ó N DEL
D ATAWA R E H O U S E .
PA R A ESCOGER LAS H E R R A M I E N TA S DEBEMOS
T O M A R E N C U E N TA LO S I G U I E N T E :
T I E M P O Q U E T O M A E N C A R G A R E L D ATAWA R E H O U S E .
T I E M P O D E C O N S T R U C C I Ó N Y C U RVA D E A P R E N D I Z A J E .
DISPONIBILIDAD DE LAS H E R RA M I E N TA S
D I S C O V E R E R , C O G N O S , P E N T A H O , B O , C L I C K V I E W.
P O RTA B I L I D A D Y ESCALABILIDAD (SE MEJORA LAS
VERSIONES).
FA C I L I D A D PA R A L A A D M I N I S T R A C I Ó N .
ORGANIZACIÓN DE D ATAWA R H O U S E Y LOS
M E TA D AT O S .
 

43
LO S R E Q U E R I M I E N T O M Í N I M O S :
D E B E C O N T E M P L A R U N A H E R R A M I E N TA
D E C O N S U LTA P A R A D ATA W A R E H O U S E :

•FA C I L I D A D E S P A R A A C C E S O MANEJO Y
P R E S E N TA C I Ó N D E D AT O S .
•M A N E J O D E D I M E N S I O N E S .
•C A P A C I D A D D E M A N E J O D E D E TA L L E S E N
CASO DE ANÁLISIS
M U LT I D I M E N S I O N A L E S ( D R I L L D O W N ) .
•M A N E J O D E T O TA L E S E N E L C A S O D E
A N Á L I S I S M U LT I D I M E N S I O N A L
•R E P O RT E S G E R E N C I A L E S , E T C .
44
INFRAESTRUCTURA
L A F U N C I O N A L I D A D D E L D ATA W A R E H O U S E S E
D I V I D E E N 5 G RA N DE S G R U P O S , C A DA U N O
DE LOS CUALES ES RESPONS ABLE DE UN
PROCESO ESPECÍFICO:
*ACCESO A FUENTES
* C A R G A D E D AT O S
*ALMACENAMIENTO
* C O N S U LTA S
* M E TA D AT O S
LA FUNCIONALIDAD DE ACCESO A
FUENTES I N C LU Y E N PROCESO QUE SE
A P L I C A N E N L A S B A S E S D E D AT O S . L O S
D AT O S P U E D E N T R A N S F E R I R S E D E F U E N T E S
MUY DIVERSAS. 45
CARGA: LA FUNCIONALIDAD DE CARGA
COMPRENDE PROCESOS ASOCIADOS CON LA
L I B E RAC I Ó N DE D AT O S DESDE LO S
A P L I C AT I V O S FUENTES A LAS BASES DEL
D ATAWA R E H O U S E .

ALMACENAMIENTO: E S TA FUNCIONALIDAD
COMPRENDE LA AR Q U I T E C T U RA NECESARIA
PA RA I N T E GRAR VA R I A V I S TA S AL
D ATAWA R E H O U S E A U N Q U E P O R L O G E N E R A L
CUANDO HABLAMOS DE D ATAWA R E H O U S E
C O N S I D E RAM O S U N Ú N I CO ALM ACE N AM I E N T O
D E D AT O S P O T E N C I A L M E N T E S U S D AT O S
P U E D E N E S T A R D I S T R I B U I D O S E N M Ú LT I P L E S
BASES.
L L A M A M O S A L D ATAWA R E H O U S E A L A B A S E
I N T E GRADA Y D ATA M A RT A LAS V I S TA S
M U LT I D I M E N S I O N A L E S D E C A D A Á R E A . 46
C O N S U LT A S : E S T E A M B I E N T E P E R M I T E A L O S
USUARIOS CONDUCIR EL ANÁLISIS Y
P R O D U C I R R E P O RT E S A T RAV É S D E S U S
H E R R A M I E N T A S O L A Z O S M U LT I D I M E N S I O N A L .
EJEM PLO.

E L A R Q U I T E C T O D E L D ATA W A R H O U S E D E B E
D E T E R M I N A R C O M O T O TA L I Z A R L O S D AT O S .

M E TA D AT O S : EL CONOCIMIENTO DE LOS
M E TA D AT O S E S TA N I M P O RTA N T E C O M O E L
CONOCIMIENTO DE LO S D AT O S DE
D ATAWA R E H O U S E D E B E N I N C L U I R E L D O M I N I O ,
REGLAS DE VA L I D A C I Ó N D U RAC I Ó N Y
T R A N S F O R M A C I Ó N D E L O S D AT O S E X T R A Í D O S .

47
ANALISIS CONSTRUCCIÓN E
IMPLANTACIÓN DE UN
DATAWAREHOUSE

E L D ATAW A R E H O U S E T I E N E U N C I C L O
D E VI DA S I MI L AR A LOS SI ST EM AS D E
TIPO T RA N S AC C I Ó N A L . LAS FA S E S
QU E C OM PR E ND E EL C I C LO D E VI DA
DEL D ATAWA R E H O U S E SON LO S
SIGUIENTES.
48
ANALISIS CONSTRUCCIÓN E
IMPLANTACIÓN DE UN
DATAWAREHOUSE
•P L A N E A C I Ó N
•R E Q U E R I M I E N T O S
•A N Á L I S I S
•D I S E Ñ O
•C O N S T R U C C I Ó N
•D E S P L I E G U E O P R U E B A S
•E X PA N S I Ó N O D E S A R R O L L O
49
P L A N E A CION
E S E L P R O C E S O M Á S I M P O RTA N T E D O N D E
S E E S TA B L E C E R Á E L T I P O D E S O LU C I Ó N
D E L A E M P R E S A . E X I S T E N T R E S FA C T O R E S
A C O NSI DE RAR A LA H ORA DE
E S T A B L E C E R U N D AT A W A R E H O U S E :

1 . - A L C A N C E D E L D AT A W A R E H O U S E
2 . - R E D U N D A N C I A D E D AT O S
3.- USUARIO FINAL

50
1.- ALCANCE DEL D ATA
WA R E H O U S E

51
2 . - R E D U N D A N C I A D E D AT O S
E S U N A Ú N I C A B A S E D E D AT O S F Í S I C A , Q U E
C O N T I E N E T O D O S L O S D AT O S PA R A U N Á R E A
FUNCIONAL ESPECÍFICA, D E PA RTA M E N T O ,
DIVISIÓN O EMPRESA.

3.- USUARIO FINAL : EXISTEN TRES GRANDES


C AT E G O R Í A S :
•E J E C U T I V O S Y G E R E N T E S
•" P O W E R U S E R S " O " B U Z O D E I N F O R M A C I Ó N "
( A N A L I S TA S FINANCIEROS Y DE NEGOCIOS,
I N G E N I E R O S , E TC . ) .
•U S U A R I O S DE S O P O RT E (DE OFICINA,
A D M I N I S T RAT I V O S , E TC . ) .
C A D A U N A D E E S TA S C AT E G O R Í A S D I F E R E N T E S
DE USUARIO TIENEN SU PROPIO CONJUNTO DE
R E Q U E R I M I E N T O S PA R A L O S D AT O S , A C C E S O ,
F L E X I B I L I D A D Y FA C I L I D A D D E U S O . 52
Los paso para planear
un
DataWarehouse
1.-SELECCIÓN DE E S T R AT E G I A S DE
I M P L E M E N TA C I Ó N : T I E N E M U C H O Q U E V E R
C O N L A C U LT U R A D E L A O R G A N I Z A C I Ó N Y S E
B A S A N E N C O M O S E L L E VA N A C A B O L A S
TA R E A S D E N T R O D E L A O R G A N I Z A C I Ó N .

2.-SELECCIÓN DE METODOLOGÍAS DE
DESARROLLO: CONSISTE EN DES ARROLL AR
U N A L I S TA D E O B J E T I V O S E M P R E S A R I A L E S
Q U E L A E M P R E S A D E B E S A T I S FA C E R

53
Los paso para planear un
DataWarehouse
3.-SELECCIÓN DEL ÁMBITO DE
I M P L E M E N TA C I Ó N : UNA PRIMERA
I M P L E M E N TA C I Ó N ES LA M O T I VA C I Ó N DEL
P R OY E C T O , D E S P U É S D E D E F I N I R LO S O B J E T I VO S
S E H A C E N E C E S A R I O D E R I VA R C O N RA P I D E Z U N
ÁMBITO I L I M I TA D O , EL ÁMBITO PUEDE
R E S T R I N G I R S E E N D O S C AT E G O R Í A S :
A.- ÁMBITO DETERMINADO A PA RT I R DE LA
P E R S P E C T I VA D E L U S U A R I O Y
B.- DETERMINACIÓN DEL ÁMBITO CON BASE EN
CONSIDERACIONES TECNOLÓGICAS

54
LOS PASO PARA PLANEAR UN
DATAWAREHOUSE
4.-Selección de enfoque
arquitectónico: se dispone de las
siguientes opciones:

- Arquitectura cliente/servidor centralizado


- Arquitectura cliente/servidor descentralizado
- Arquitectura tres capas
- Uso CITRIX o similar.

55
Los paso para planear un
DataWarehouse
5.-Desarrollo del programa y
presupuesto del proyecto
determinando:
- ACTIVIDADES
- TIEMPO DE EJECUCIÓN
- RESPONSABLES
- P R E S U P U E S T O.

S E P U E D E U T I L I Z A R H E R R A M I E N TA S
T I P O P R OY E C T
56
Los paso para planear un
DataWarehouse
6.-Desarrollo de escenarios de uso
empresarial: Un factor de éxito es hacer que
los usuarios finales se involucren en el
establecimiento de las expectativas de lo que
ofrece el datawarehouse
7.-Recopilación de datos: los cuales se
utilizan para construir DataWarehouse,
proviene de muchas fuentes como:
- LOS M O D E LO S EMPRESARIALES
CONSTRUIDOS POR LA ORGANIZACIÓN.
- LO S D E P Ó S I T O S Y D I C C I O N A R I O S .
- L A S F U E N T E S E X T E R N A S D E D AT O S . 57
REQUERIMIEN TOS
DESCRIBIR CON CLARIDAD EL
A M B I E N T E O P E R AT I V O E N E L Q U E S E
E NT R E G ARA EL D ATAW A R E H O U S E .
L O S PA S O S S O N :
 
• REQUERIMIENTOS DEL
P R O P I E TA R I O : A L G U N A S D E LO S
CUESTIONAMIENTOS QUE REALIZA
E L U S U A R I O P R O P I E TA R I O :
• ¿Porqué construir?
•¿ Cuales son los objetivos?
•¿Cuantos costara? 58
•¿Cuando estará listo?
•R E Q U E R I M I E N T O S DEL ARQUITECTO: EL
ARQUITECTO ES LA PERSONA RESPONSABLE DE
DISEÑAR LOS DIFERENTES COMPONENTES, LA
CALIDAD EL ESFUERZO DETERMINA: EL RANGO DE
FUNCIONES Y CARACTERÍSTICAS A OFRECER, EL
RANGO DE P L ATA F O R M A S , EL USO DE
E S TÁ N D A R E S E I N T E R FA C E S L A F L E X I B I L I D A D .

•R E Q U E R I M I E N T O S D E L D E S A R R O L L A D O R : E L
DESARROLLADOR REQUIERE QUE LA
ARQUITECTURA DE D AT O S , D E A P L I C A C I Ó N Y
T E C N O LO G Í A S E S U B D I V I D A N Y N E C E S I TA N DE
LOS SIGUIENTES REQUERIMIENTOS: DE
T E C N O LO G Í A , D E S P L I E G U E , D E D I S P O S I C I Ó N PA RA
EL DESARROLLO Y DESPLIEGUE DEL PERSONAL Y
SUS HABILIDADES.

59
•R E Q U E R I M I E N T O S DEL US UA RI O
FINAL: PODRÍAN UBICARSE EN UNA O
M Á S D E L A S S I G U I E N T E S C AT E G O R Í A S :

- R E Q U E R I M I E N T O S D E C O N S U LTA S
- R E Q U E R I M I E N T O S D E R E P O RT E

60
ANÁLISIS
S I G N I F I C A C O N V E RT I R LOS REQUERIMIENTOS
R E C O P I L A D O S E N L A FA S E A N T E R I O R E N U N
CONJUNTO DE ESPECIFICACIONES QUE PUEDAN
A P OYA R AL DISEÑO Y H AY TRES
E S P E C I F I C A C I O N E S P R I N C I PA L E S D E E N T RA D A :
 
• ESPECIFICACIONES DE REQUERIMIENTOS
DE ENFOQUE EMPRESARIAL: EL ENFOQUE
EMPRES ARIAL DETERMINARA L A AUDIENCIA Y
SUS REQUERIMIENTOS DE INFORMACIÓN, LA
I N F O R M A C I Ó N S E C L A S I F I C A E N C AT E G O R Í A S
Q U E P E R M I T E N E S TA B L E C E R P R I O R I D A D E S Y
UN EJEMPLO SERIA CLASIFICAR LA
I N F O R M A C I Ó N E N C AT E G O R Í A D E C O S T O S E
INGRESOS

61
• ESPECIFICACIONES DE REQUERIMIENTOS DE
F U E N T E S D E D AT O S : E L D ATAWA R E H O U S E T O M A
I N F O R M A C I Ó N D E L O S D AT O S E X I S T E N T E S E N L A
EMPRESA LOS CUALES CONFORMAN LOS
CIMIENTOS DE UNA BASE DE CONOCIMIENTOS
Q U E S I RV E N PA RA D E T E R M I N A R L A U B I C A C I Ó N
DE LA EMPRESA.

• ESPECIFICACIONES DE REQUERIMIENTOS DE
USUARIO FINAL DE ACCESO: DEFINEN COMO
SE UTILIZARA LA INFORMACIÓN DEL D ATA
WA R E H O U S E Y JUNTO CON E S TA S SE
ENCUENTRAN L AS ESPECIFICACIONES DE LOS
T I P O S D E H E R RA M I E N TA S T É C N I C A S .
E L P R O C E S O D E A N Á L I S I S C O N S I S T E E N D E R I VA R
M O D E LO S F Í S I C O S Y LÓ G I C O S D E D AT O S PA RA E L
D ATA WA R E H O U S E Y L O S M E RC A D O S D E D AT O S Y
DEFINIR LOS PROCESOS NECESARIOS PA RA
C O N E C TA R L A F U E N T E D E D AT O S

62
DISEÑO

E N L A FA S E D E D I S E Ñ O L O S M O D E L O S
L Ó G I C O S S E C O N V I E RT E N E N M O D E L O S
FÍSICOS LOS PROCESOS IDENTIFICADOS
EN LA FA S E DE ANÁLISIS PA RA
C O N E C TA R L A S F U E N T E S D E D AT O S
C O N E L D ATA W A R E H O U S E Y E S T E C O N
LOS M E RC A D O S DE D AT O S Y ESTE
D AT A W A R E H O U S E / M E R C A D O S C O N L A S
H E R R A M I E N TA S DE TRA B AJ O DEL
U S U A R I O F I N A L , S E C O N V I E RT E N E N
DISEÑOS PA RA P RO G RAM AS QUE
R E A L I Z A R A N L A S TA R E A S R E Q U E R I D A S .

63
L A S FA S E S D E D I S E Ñ O S O N :

1.- DISEÑO D E TA L L A D O DE LA
ARQUITECTURA DE D AT O S . - SE
R E F I E R E A L D E S A R R O L LO D E LO S
M O D E L O S F Í S I C O S D E D AT O S D O N D E
S E A L M AC E N A RÁ E L D W H.

2.- DISEÑO D E TA L L A D O DE LA
ARQUITECTURA DE LA APLICACIÓN

64
ESTRATEGIAS PARA EL DISEÑO DE UN DATA
WAREHOUSE
EL DISEÑO DE LOS D ATAWA R E H O U S E S ES MUY
DIFERENTE AL DISEÑO DE LOS SISTEMAS
OPERACIONALES TRADICIONALES. SE PUEDEN
CONSIDERAR LOS SIGUIENTES PUNTOS:
1RA . : LOS USUARIOS SIN EXPERIENCIA DE LOS
D ATAWA R E H O U S E S U S U A L M E N T E N O C O N O C E N M U C H O
SOBRE SUS REQUERIMIENTOS Y NECESIDADES COMO
LOS USUARIOS OPERACIONALES.
2DA.: EL DISEÑO DE UN D ATAWA R E H O U S E , C O N
FRECUENCIA IN VOLUC RA LO QUE SE PIENSA EN
TÉRMINOS MÁS AMPLIOS Y CON CONCEPTOS DEL
NEGOCIO MÁS DIFÍCILES DE DEFINIR QUE EN EL
DISEÑO DE UN SISTEMA OPERACIONAL. AL
R E S P E C T O , U N D ATA WA R E H O U S E E S TÁ B A S TA N T E
C E RC A A REINGENIERÍA DE LOS PROCESOS DEL
NEGOCIO (BUSINESS PROCESS REENGINEERING).

65
3 R A . : F I N A L M E N T E , L A E S T RAT E G I A D E D I S E Ñ O
IDEAL PA RA UN D ATA WA R E H O U S E ES
GENERALMENTE DE AFUERA HACIA ADENTRO
(OUTSIDE-IN) A DIFERENCIA DE ARRIBA HACIA
ABAJO (TOP-DOWN).

A P E S A R Q U E E L D I S E Ñ O D E L D ATA WA R E H O U S E
ES DIFERENTE AL USADO EN LOS DISEÑOS
T RA D I C I O N A L E S , N O E S M E N O S I M P O RTA N T E . E L
HECHO QUE LOS USUARIOS FINALES TENGAN
D I F I C U LT A D EN DEFINIR LO QUE ELLOS
N E C E S I TA N , N O LO H A C E M E N O S N E C E S A R I O. E N
LA PRÁCTICA, LOS DISEÑADORES DE D ATA
WA R E H O U S E S TIENEN QUE USAR MUCHOS
" T R U C O S " PA RA AY U D A R A S U S U S U A R I O S A
"VISUALIZAR" SUS REQUERIMIENTOS. POR ELLO,
SON ESENCIALES LOS PROTOTIPOS DE TRABAJO.

66
ESQUEMA ESTRELLA
COMO EL NOMBRE SUGIERE, EL ESQUEMA
E S T R E L L A E S U N PA RA D I G M A D E M O D E L A D O
QUE TIENE UN SOLO OBJETO EN MEDIO
C O N E C TA D O CON VA R I O S OBJETOS DE
MAN ERA RA DIAL. EL ESQUEMA ESTRELLA
REFLEJA LA VISIÓN DEL USUARIO FINAL DE
UNA C O N S U LT A EMPRESARIAL: HECHOS
TA L E S C O M O V E N TA S , C O M P E N S A C I Ó N , PA G O
Y FA C T U R A S , S E C A L I F I C A N P O R U N A O M Á S
DIMENSIONES (POR MES, POR PRODUCTO,
POR REGIÓN GRÁFICA). EL OBJETO EN EL
CENTRO DE LA ESTRELLA SE DENOMINA
TA B L A DE HECHOS Y LOS OBJETOS
C O N E C TA D O S A E L L A S E D E N O M I N A TA B L A S
DE DIMENSIÓN.

67
ESQUEMA ESTRELLA

68
ESQUEMA COPO DE NIEVE
ESTE ES UNA EXTENSIÓN DEL ESQUEMA ESTRELLA
EN DONDE CADA UNO DE LOS PUNTOS DE L A
E S T R E L L A S E D I V I D E E N M Á S P U N T O S . E N E S TA
F O R M A D E E S Q U E M A , L A S TA B L A S D E D I M E N S I Ó N
DEL ESQUEMA ESTRELLA CONTIENEN MÁS NORMAS.
 
L A S V E N TA J A S Q U E P R O P O RC I O N A E L E S Q U E M A
COPO DE NIEVE SON MEJORAR EL DESEMPEÑO DE
C O N S U LT A S DEBIDO A UN MÍNIMO
A L M A C E N A M I E N T O E N D I S C O PA RA LO S D AT O S Y
MEJORAR EL DESEMPEÑO MEDIANTE L A UNIÓN DE
TA B L A S M Á S P E Q U E Ñ A S C O N N O R M A S , E N V E Z D E
L A S G RA N D E S TA B L A S S I N N O R M A S . A S I M I S M O , E L
ESQUEMA COPO DE NIEVE I N C R E M E N TA LA
FLEXIBILIDAD DE LAS APLICACIONES DEBIDO A LA
APLICACIÓN DE NORMAS Y, POR LO TA N T O ,
DISMINUYE LA GRANUL ARIDA D DE LAS
DIMENSIONES.
69
ESQUEMA COPO DE NIEVE

70
ESQUEMA MIXTO
EL ESQUEMA MIXTO ES UN CONVENIO ENTRE EL
E S Q U E M A E S T R E L L A , B A S A D O E N TA B L A S D E
H E C H O S Y TA B L A S D E D I M E N S I Ó N D E N O R M A S ,
Y EL ESQUEMA COPO DE NIEVE, EN DONDE
T O D A S L A S TA B L A S D E D I M E N S I Ó N T I E N E N
NORMAS. EN EL ESQUEMA MIXTO SOLO SE
A P L I C A N N O R M A S A L A S TA B L A S D E D I M E N S I Ó N
MÁS GRANDES.
APLICACIÓN P L A N E A C I Ó N D ATA M A R
M AT R I C U L A T É C N I C A S E M P R E S A R I A L E S
FA C T U R A C I Ó N R E Q U E R I M I E N T O S C O R P O R AT I V O S
R E C A U D A C I Ó N R E S U M E N C A RT E R A V E N C I D A
MENSUAL, TRIMESTRAL, SEMESTRAL, ANUAL.
POR SECTOR, POR ZONA, POR TIPO DE
S E RV I C I O.
71
CONSTRUCCIÓN
LA FA S E DE CONSTRUCCIÓN ES
RESPONSABLE DE I M P L E M E N TA R
FÍSICAMENTE LOS DISEÑOS DE LA FA S E
AN TERIO R.

L A C O N S T R U C C I Ó N D E L D ATAWA R E H O U S E E S
SIMILAR A LA CONSTRUCCIÓN DE UN
S I S T E M A D E B A S E D E D AT O S R E L A C I O N A L
G R A N D E , L A M AYO R Í A D E L A S A P L I C A C I O N E S
QUE SE N E C E S I TA CONSTRUIR SON LAS
SIGUIENTES:

•  P R O G R A M A S Q U E C R E E N Y M O D I F I Q U E N L A S
B A S E S D E D AT O S PA R A E L D ATA WA R E H O U S E .
  72
CONSTRUCCIÓN
•P R O G R A M A S Q U E E X T R A I G A N D AT O S
DE FUENTES DE BASE DE D AT O S
RELACIONALES Y NO RELACIONALES.

•P R O G R A M A S QUE REALICEN
T R A N S F O R M A C I O N E S D E D AT O S , TA L E S
COMO I N T E G RAC IÓ N , RESUMEN Y
ADICIÓN.

•P R O G R A M A S QUE EFECTÚEN
B Ú S Q U E D A S E N B A S E S D E D AT O S M U Y
G RA N D E S .

73
ESQUEMA ESTRELLA

74
ESQUEMA COPO DE NIEVE

75
EJEMPLO
PRESTAMOS
DE CD’S
DISEÑO DEL
DATA MART

76
META DATOS

77
META DATOS

78
META DATOS

79
DATAMART COMERCIAL EEQ

80
Ing. Mario R. Morales, MBA
USO ACTUAL: VENTAJAS Y
DEBILIDADES

UNA V E N TA J A ES LA FA C I L I D A D QUE
B R I N D A E L D ATAWA R E H O U S E E N L A T O M A
D E D E C I S I O N E S PA RA L A S E M P R E S A S ,
PUESTO QUE NO ES SIMPLEMENTE UNA
B A S E D E D AT O S E N D O N D E S E M U E S T R A
L A I N F O R M A C I Ó N , S I N O Q U E S E T R A TA D E
U N M O D E L O D E D AT O S D E TA L M A N E R A
Q U E S E V U E LV E Ú T I L Y A N A L I Z A B L E P A R A
EL USUARIO FINAL.

81
VENTAJAS
O T R A V E N TA J A P U E D E S E R E L H E C H O D E Q U E
E L D AT A W A R E H O U S E S I R V E P A R A T R A B A J A R
CON CAMBIOS EN LA INFORMACIÓN
PRODUCIDOS POR LAS D I S T I N TA S
T RANS AC CI O NE S QU E SE RE ALI ZAN E N U N
T I E M PO DE T E RM I NADO (T RANS AC CI O NE S DE L
DÍ A, ME S O A ÑO ) A G RAN E SCAL A. E S DE C I R,
EL D AT A W A R E H O U S E ES C A PA Z DE
A C T U A L I Z A R S E C O N L A S D I S T I N TA S B A S E S
D E D AT O S P A R A P O D E R A L M A C E N A R E S T A
N U E VA I N F O R M A C I Ó N , R E S U M I R L A , Y A S Í
POD E RL E DAR L AS CARAC T E R ÍST I CAS Q U E
E S TA T E C N O L O G Í A B R I N D A

82
DEBILIDAD
EL DISEÑO E I M P L E M E N TA C I Ó N DEL
D ATAWA R E H O U S E R E S U LT A COSTOSO Y
TOMA MUCHO TIEMPO SU
I M P L E M E N TA C I Ó N , PUESTO QUE SE
N E C E S I TA N O B T E N E R M U C H O S D AT O S , Y
ESTOS SE TIENEN QUE ORGANIZAR DE LA
MEJOR MA NERA PA RA QUE EL
D ATAWA R E H O U S E PUEDA REALMENTE
C U M P L I R C O N S U O B J E T I V O PA RA T O M A D E
D E C I S I O N E S D E L A A LT A G E R E N C I A .

83
Data Discovery.
La nueva generación
de BI

Ing. Mario R. Morales, MBA


DATA DISCOVERY. LA NUEVA GENERACIÓN
El BI 2.0. (..)
 Gartner ha redefinido el BI2.0 y ha creado una nueva denominación
llamada Data Discovery. Fundamentalmente son aquellas
herramientas que permiten a los usuarios el análisis de data
estructurada y no estructurada.
 Según Gartner, el Data Discovery* se caracteriza por lo siguiente:
1. Una estructura de datos propietaria para almacenar y modelar
datos recogidos de fuentes dispares las cuales minimizan la
dependencia en metadata predefinida del BI tradicional.
2. Una capa de rendimiento propia (built-in performance layer)
usando RAM o indexación que disminuya la necesidad de
agregación, sumarización y pre-cálculos.
3. Una interface intuitiva que posibilite a los usuarios explorar
data sin mucho entrenamiento

*http://www.gartner.com/it-glossary/search-based-data-discovery-tools Ing. Mario R. Morales, MBA


DATA DISCOVERY
El BI 2.0. (..)

Ing. Mario R. Morales, MBA


Ing. Mario R. Morales, MBA
Ing. Mario R. Morales, MBA
La innovación en un producto o proceso
agrega valor al negocio

Search Mobile Devices CRM BI

PageRank iPhone/iPad SAAS-based


Business
Search CRM
Discovery

SIMPLICITY SIMPLICITY SIMPLICITY SIMPLICITY

Ing. Mario R. Morales, MBA


DATA DISCOVERY. 1. LA EVOLUCIÓN DEL BI.
El modelo tradicional de BI

Entrega de Información

Cliente
Data Marts

ERP Business
Performance
Management
Portal

CRM Reportes & Análisis

AS 400 ETL Dispositivos

Empresarial Data
Análisis de Datos Data
Warehouse Visualization
(OLAP, Data Project
management
Mining)

Ing. Mario R. Morales, MBA


DATA DISCOVERY. 1. LA EVOLUCIÓN DEL BI.
El modelo tradicional de BI

Tiempo
Costo

Valor

Ing. Mario R. Morales, MBA


DATA DISCOVERY. 1. LA EVOLUCIÓN DEL BI.
El modelo Data Discovery

Valor
Tiempo
Costo

Ing. Mario R. Morales, MBA


DATA DISCOVERY
Hay algo diferente ???

Esquema Tradicional

END USER STACK IT DEPARTMENT


• Pre-calculated VENDOR BI
dashboards • Managed
IT ROLE
reporting
• Data preparation
and governance

+
• Responsible for
building all the
analyses

OPERATIONAL DATA SOURCES

Ing. Mario R. Morales, MBA


DATA DISCOVERY
Hay algo diferente ???

Antiguo Esquema Dinámica BUSINESS DISCOVERY

END USER STACK IT DEPARTMENT BUSINESS USER


• Pre-calculated VENDOR BI • Self-service
QLIKVIEW
dashboards • Managed analysis
IT ROLE IT ROLE • Dynamic
reporting
• Data preparation • Data dashboards • Create analysis
and governance preparation relevant to specific
• Search live data
and business problems
+ governance • Any device
• Change analysis
• Responsible for
building all the + on the fly
analyses • Enable
business users
to create their
own analyses

OPERATIONAL DATA SOURCES

Ing. Mario R. Morales, MBA


DATA DISCOVERY
2. Cubos vs In Memory

Ing. Mario R. Morales, MBA


Implementación de una
DATA DISCOVERY
9semana plataforma de análisis de datos
Al término de pocas
8semana semanas el resultado es
la implementación de
7semana una plataforma
CUBOS completa de B.I.
OLAP
6semana

5semana Data
Warehous
e
RR
RR
4semana Data GG
GG
HH
HH
Warehouse

3semana
P
P C
C
L
L II
ETL
ETL
2seman F
F V
V
a
ETL
1seman ETL ETL
ETL
ETL DATOS
a

B.I. Ing. Mario R. Morales, MBA


Implementación de una
9semana plataforma de análisis de datos
Plataform
a
8semana
BI

7semana
CUBOS
6semana
OLAP

5semana Data
Warehous
e
4semana RR
GG
HH

3semana P C
L I
ETL
2seman F V
a
1seman ETL DATOS
a

B.I. Ing. Mario R. Morales, MBA


DATA DISCOVERY. 3. MODELO JERÁRQUICO VS ASOCIATIVO

Traditional Associative

Region Region

State
Sales
State Person
Product

Sales
Person Product

IT Driven User Driven


• Linear, pre-defined thinking • User decides where to
• Insights missed in hidden start
data • All data, always visible
• Months to change • Minutes to change
• Data-centric • Insight driven

Ing. Mario R. Morales, MBA


4. BUSINESS DISCOVERY EN DISPOSITIVOS MÓVILES

Las herramientas de Business Discovery funcionan en cualquier


dispositivo móvil de cualquier marca sin requerir esfuerzo ni
costo adicional

Ing. Mario R. Morales, MBA


DATA DISCOVERY

5. Las personas son el factor más


importante para tomar
decisiones.

Ing. Mario R. Morales, MBA


La necesidad de la Información.

Cada año las empresas invierten más


y más recursos en mejorar sus
análisis e interpretación de la data
generada por el negocio.
 Asesoría de especialistas.
 Software de Inteligencia de
negocios.
 Hardware mas potente.
 Recurso humano, etc.
En un intento por
tomar mejores
decisiones de negocios.

Motivados por
necesidad de estar
enterados a tiempo y
correctamente sobre lo
que está pasando con
nuestra empresa y el
negocio.
Ing. Mario R. Morales, MBA
Cómo tomamos decisiones??

No
Personas
bas solo
tos ado tom
Da
s e
n “ amos
har d
d n ecisio
um nes
La data es una gran fuente ber
s”
de información.
Gestionar esta data y
entregarla al usuario
correcto es la esencia del Consideramos también
concepto de “Inteligencia de opiniones, ideas,
Negocios” experiencias, investigaciones
y perspectivas de otras
personas involucradas con
nuestra empresa.

Ing. Mario R. Morales, MBA


Cómo tomamos decisiones??

gan
lle bajo
s a
no tr
én e
bi s d
am re
t ga El conocimiento está en lugares y
ea s lu
s
momentos particulares, viene a
id l o
s e nosotros desde: la fábrica, la oficina
La esd
d de atención al cliente, o
directamente del comportamiento del
mercado.

Ing. Mario R. Morales, MBA


BIG DATA
UNIVERSIDAD CENTRAL DEL ECUADOR
FA C U LTA S D E I N G E N I E R Í A C I E N C I A S F Í S I C A S Y M A T E M Á T I C A S
CONTENIDO
INTRODUCCION
HISTORIA DEL BIG DATA
IMPORTANCIA
QUIEN UTILIZA BIG DATA
CALIDAD DE DATOS
COMO FUNCIONA BIG DATA
BIG DATA EN ECUADOR

Ing. Mario R. Morales, MBA


INTRODUCCIÓN
Big data es un término que describen:
• Volumen de datos estructurados y no estructurados
• Que hacen las organizaciones con los datos.
• izado para obtener percepciones que conlleven a
mejores decisiones y acciones de negocios estratégicas.

Ing. Mario R. Morales, MBA


HISTORIA DEL BIG DATA
• Recopilar y almacenar grandes cantidades
de información para su posterior análisis.
• El concepto cobró impulso a principios de la
década del 2000 cuando el analista de la
industria Doug Laney articuló la definición
ahora muy popular del big data como las
tres Vs.

Ing. Mario R. Morales, MBA


En los últimos años, han surgido otras "dos
V": valor y veracidad.
¿cuál es la veracidad de sus datos y cuánto
puede confiar en ellos?

Ing. Mario R. Morales, MBA


IMPORTANCIA DEL BIG DATA
1.Reducciones de costos.
2.Reducciones de tiempo.
3.Desarrollo de nuevos productos y soluciones
optimizadas.
4.Toma de decisiones inteligente. Cuando se
combina el big data con analítica , se pueden
realizar tareas relacionadas con negocios,

Ing. Mario R. Morales, MBA


VENTAJAS
• Velocidad en la toma de decisiones
• Planes estratégicos Inteligentes de
Marketing. Es posible analizar y predecir el
comportamiento que un usuario tendrá en la
red
• Mejora en la eficiencia y en costes
• Vinculación de clientes
• Variables del entorno
• Feedback y retroalimentación

Ing. Mario R. Morales, MBA


¿QUIÉN UTILIZA EL BIG DATA?
El big data afecta a las organizaciones de
prácticamente todas las industrias. Cada
industria se puede beneficiar con esta gran
cantidad de información.

• Bancos
• Educación
• Gobierno
• Atención a la salud
• Manufactura
• Políticos

Ing. Mario R. Morales, MBA


CALIDAD DE DATOS EN BIG DATA

Muchas fuentes y tipos de datos:


Datos de internet y móviles.
Datos de Internet de las Cosas.
Datos sectoriales recopilados por empresas
especializadas.
Datos experimentales.
volumen de datos
Volatilidad

Ing. Mario R. Morales, MBA


CÓMO FUNCIONA
El big data le aporta nuevas perspectivas que
abren paso a nuevas oportunidades y modelos
de negocio. Iniciarse en ello requiere de tres
acciones clave:
• Gestionar. Almacenamiento en la nube o
servidor local
• Integrar
• Analizar

Ing. Mario R. Morales, MBA


BIG DATA EN ECUADOR

Uso del Big Data en Ecuador: existen sectores


específicos donde el uso de Big Data va un paso
adelante que otros. Aquí vamos a mencionar los
principales
Banca y Finanzas.
Retail.
Telecomunicaciones.
Gobierno.
La Industria es uno de los principales candidatos para
el uso de Big Data. Existe una gran cantidad de
sensores que emiten algún tipo de señal que
pueden ser utilizados para descubrir patrones e
Ing. Mario R. Morales, MBA
BIG DATA EN ECUADOR
Las soluciones de Big Data y Analítica se brindan ya en el país con
soluciones tradicionales, el reto  hoy en día implica involucrar nuevas
fuentes de datos (no tradicionales, como redes sociales, logs de call
center,  pejem).

Ecuador  no se encuentra entre los países que lideran la adopción de estas
nuevas tecnologías, sin embargo esto nos permite poder usar
experiencias importantes, casos de uso ya definidos en los sectores
antes mencionados que se están manejando en mercados muy cercanos
como Colombia.

La adopción de tecnologías disruptivas de Big Data & Analítica en


momentos de Crisis se vuelve mucho más crítico, ya que cada acción y
campaña que realizamos debe ser más acertada y eficiente

Ing. Mario R. Morales, MBA

You might also like