You are on page 1of 44

BASES DE DATOS

APLICADAS I Y II

Prof. Ing. M. Roxana Martínez


DATA WAREHOUSE
TEMARIO

1. ¿Qué es Data Warehouse?


2. Conceptos básicos:
a. Características
b. Aplicaciones
c. Alternativas de Diseño
d. Herramientas Utilizadas
e. Datamining
f. Base de Datos Multidimensional
g. Metadatos
h. Procesos de Construcción
i. Técnicas Explotación
Data Warehouse

Es un repositorio estructurado, a
nivel Empresa, de datos orientados
hacia áreas de negocio, que
contiene datos históricos y que
está preparado para facilitar la
toma de decisiones.
Data Warehouse

Un datawarehouse es normalmente una plataforma


de hardware aislada.

• Sus datos se usan para la Toma de Decisiones


• Duplican datos
• Es una combinación de Hard, Soft y Datos.
• Repositorio de datos históricos
• Colección de Data Marts
Data Warehouse
Porqué un Data Warehouse?

• Aliviar la carga de los mainframes


• OLTP Vs OLAP
• Datos Sucios
• Seguridad
• Grandes volúmenes de datos
ociosos
• Personalización del cliente
Diferencias

Base de Datos Operacional Data Warehouse


Datos Operacionales Datos del negocio para Información

Orientado a la aplicación Orientado al sujeto

Actual Actual + histórico

Detallada Detallada + más resumida

Cambia continuamente Estable


Características

Entre las principales se tiene:


· Orientado al tema
· Integrado
· Variante en el Tiempo
· No volátil
Objetivos de un Data Warehouse
• Proveer una visión única
• Poner la información en muchas manos
• Informes más oportunos
• Monitorear comportamientos
• Predecir ventas productos
• Análisis estadísticos
• Mejorar capacidad de respuesta
• Calidad en las decisiones
• Productividad
• Distribuir responsabilidades
• Reducir costos
Orientado al Tema

Una primera característica


del data warehouse es que
la información se clasifica
en base a los aspectos que
son de interés para la
empresa.

Ejemplo: Para un fabricante


pueden ser cliente,
vendedor y producto.
Integrado

La base de datos contiene


los datos de todos los
sistemas operacionales de
la organización, y dichos
datos deben ser
consistentes.
Variante en el Tiempo

Como la información en el
data warehouse es
solicitada en cualquier
momento (es decir, no
"ahora mismo"), los datos
encontrados en el depósito
se llaman “variante en el
tiempo".
No volátil

La información no se
modifica ni se elimina, una
vez almacenado un dato,
éste se convierte en
información de sólo lectura,
y se mantiene para futuras
consultas.
Aplicaciones

- Sistemas de Marketing
- Análisis de Riesgo Financiero
- Análisis de Riesgo de Crédito
- Control de Gestión
- Logística
- Recursos Humanos
Alternativas de Diseño

1. Creación de varios Datamarts independientes, uno por


cada dominio o fuente de información, y definición de una
Capa Usuario por cada uno de estos Datamarts.
2. Creación de un único Datawarehouse que englobe
todos los datos, del que se extraigan diferentes Datamarts,
uno por cada dominio o fuente de información y
definición de una Capa Usuario por cada Datamart.
3. Creación de un único Datawarehouse con definición de
una única Capa Usuario.
4. Creación de un único Datawarehouse con definición de
varias Capas Usuario.
Alternativas de Diseño
Herramientas Utilizadas

- Herramientas para la inteligencia


empresarial.
- Herramientas para extraer,
transformar y cargar datos en el
almacén de datos.
- Herramientas para gestionar y
recuperar los metadatos.
Datamining (Minería de Datos)

Es el conjunto de técnicas y tecnologías que


permiten explorar grandes bases de datos, de
manera automática o semiautomática, con el
objetivo de encontrar patrones repetitivos,
tendencias o reglas que expliquen el
comportamiento de los datos en un determinado
contexto. Hace uso de prácticas estadísticas y, en
algunos casos, de algoritmos de búsqueda
próximos a la Inteligencia Artificial y a las redes
neuronales.
Base de Datos Multidimensionales

Se utilizan principalmente para crear aplicaciones OLAP y pueden


verse como bases de datos de una sola tabla, su peculiaridad es que
por cada dimensión tienen un campo (o columna), y otro campo por
cada métrica o hecho, es decir estas tablas almacenan registros cuyos
campos son de la forma:
(d1,d2,d3,...,f1,f2,f3,...)
Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y
los campos 'fi' a las métricas o hechos que se quiere almacenar,
estudiar o analizar.
Metadatos

Uno de los componentes más importantes de la


arquitectura de un almacén de datos son
los metadatos. Se define comúnmente como
"datos acerca de los datos", en el sentido de
que se trata de datos que describen cuál es la
estructura de los datos que se van a almacenar y
cómo se relacionan.
El Metadato documenta, entre otras cosas, qué
tablas existen en una base de datos, qué
columnas posee cada una de las tablas y qué
tipo de datos se pueden almacenar.
Procesos de Construcción

ETL (Extracción, Transformación y Carga).

Extracción: Obtención de información de las


distintas fuentes tanto internas como externas.

Transformación: Filtrado, limpieza, depuración,


homogeneización y agrupación de la
información.

Carga: Organización y actualización de los datos


y los metadatos en la base de datos.
Técnicas de Explotación

La explotación del Data Warehouse mediante información de gestión,


se fundamenta básicamente en los niveles agrupados o calculados de
información.

Carga de Base de datos

Extracción, Depuración, Filtro, Elaboración


Glosario

• Data Warehouse: Es un repositorio estructurado, a nivel Empresa,


de datos orientados hacia áreas de negocio, que contiene datos
históricos y que está preparado para facilitar la toma de decisiones.
• Datamart: Es una base de datos orientada a un tema específico. En
otras palabras es un subconjunto del Data Warehouse Corporativo.
• Capa Usuario: Es una vista usuario de la base de datos que permite
su aislamiento respecto de la complejidad física de la misma. No
incluye ningún dato físico. Es una agrupación lógica de los datos
adaptada a los conocimientos y filosofía del Usuario
• OLAP: Tecnología que permite la explotación de datos en diferentes
niveles organizacionales y periodos de tiempo.
Supuestos Validos
Proceso de Toma de Decisiones
Niveles de toma de decisiones en las organizaciones

E Decisiones estratégicas

T Decisiones tácticas

Decisiones operativas
O

EO Ejecución de la operación

Pirámide de Robert N. Anthony


Supuestos Validos
Tipos de Control

1 Operativo
Planeación 2 Administrativo o de
4 Gestión
E 2 3 Análisis
1 3
2 4 Estrategias
Análisis y
Control T 1
2
1
Control O

EO

Pirámide de Robert N. Anthony


Pirámide de DSS
(Sistema de Apoyo de Decisiones)
Para analizar los problemas, es donde se analiza todos los datos recopilados para el
mejoramiento continuo como aportes de nuevas ideas, toma de decisiones, y
aportes de todos los departamentos de la empresa.
Ad hoc:
Generalmente
refiere a una
solución
específicamen
elaborada par
un problema
fin preciso
Metodología de Desarrollo de DSS y DWH
Modelos de Arquitectura
Arquitectura e Infraestructura

Modelo de
Negocio

Planeación y Control
Modelo de
Información

Modelo de
Sistemas
Modelo de Negocio

 Misión
 Premisas de negocio.
 Objetivos y metas (corto, mediano y largo plazo).
 Estrategias.
 Problemas y factores críticos.
 Estructura de organización y distribución geográfica.
 Procesos de 1er. nivel
 Mercado (clientes y competencia).
 Productos y servicios.
 Medios de entrega.
Modelo de Información
 Tipos de Usuario y roles.
 Vistas de información y objetivo de la misma, nivel que soporta y nivel
de detalle.
 Arquitectura de Sistemas de Información Gerencial/Ejecutivo.
 Arquitectura de Bases de Datos de Interés (DWH)
 Fuentes de información.
 Frecuencia de la información y su historia.
 Relación de ejecutivos y analistas de información vs. vistas de
información, indicando los niveles de seguridad.
 Clasificación de la información: Pública, Privada y Confidencial.
 Matriz de indicadores de medición vs. unidades organizacionales vs.
productos vs. mercado vs. medios de entrega vs. procesos.
 Modelo conceptual de datos (general).
 Resumen de usos del DWH
Modelo de Sistemas
• Factibilidad y estrategia de inicio
– Costo beneficio
– Determinación de prioridades de construcción
– Determinación de capacitación
– Mercadotecnia de proyecto
• Selección de hardware y software base
• Selección de paquetes a integrar
• Selección de herramientas de desarrollo
BUSSINESS INTELLIGENCE
O
KNOWLEDGE MANAGEMENT
Development
Knowledge
Marketing con Base de Datos
• Gestión de Relaciones con los clientes (CRM)

SEGMENTACIÓN

CLUSTERING

CLIENTE INDIVIDUAL
Algunas iniciativas con BD
• Marketing Directo
• Venta cruzada
• Análisis y pronósticos de venta
• Análisis de la canasta de compras (MBA)
• Análisis de promociones (pre y postventa)
• Retención de clientes
• Análisis de rentabilidad
• Medición del valor del cliente
• Empaquetado de Productos
• Centros de atención telefónica
• Análisis de contratos de venta
Algunas lecciones

• Cualquier política que se aplique a todos por igual,


dañará la relación con algunos clientes.
• Meta: no se trata de vender más a más clientes,
sino de vender los productos correctos a los clientes
correctos en el primer intento y en todos los
intentos siguientes.
• Se deben conocer las dos partes, al cliente y al
producto. Sino muchas de las iniciativas citadas
quedarán sin respuestas.
CONCLUSIÓN
• No olvidemos que a nuestro cliente no le
importa la tecnología del Datawarehouse.
• Lo que necesita es mejorar su capacidad de
tomar decisiones para:

AUMENTAR LA
RENTABILIDAD
Fuentes aportadas por:

- Horacio Caballero
- Andrés Fabián Cortes Solano
- Roxana Martínez