Professional Documents
Culture Documents
Datawarehouse (Almacen de datos) se define como una coleccin de datos que verifican las siguientes propiedades:
Est orientado (a un tema) a objetos
Datos integrados No voltiles Variante en el tiempo
que surgieron como una herramienta de soporte para la toma de decisiones a nivel gerencial
2
Orientado hacia temas: los datos se almacenan y agrupan por temas de inters.
Datos integrados: el almacn de datos integra datos que provienen de varias fuentes. Partimos de una base de datos (operacional) y mediante un proceso de carga de datos hacemos el Datawarehouse. El proceso de carga es lo ms complicado por problemas de codificacin, medidas de los atributos de las bases de datos. BD
DW BD
CARGA
BD
No voltiles: son estables, una vez CARGA almacenados los datos no se modifican.
UPDATE
SELECT
INSERT
BD
DELETE
DW
DW
REPORTS
SELECT
Variante en el tiempo: los datos contienen informacin sobre la fecha de los mismos, porque se hacen cargas de datos continuamente. Cuando los datos van cambiando, se actualizan los histricos y se guardan en ficheros temporales. Siempre va haber una variable tiempo.
TIEMPO # id_tiempo * periodo
Orientado a un sujeto
Almacena datos actuales orientado a un
BD OPERACIONAL Datos operacionales Orientado a aplicaciones Datos Actuales Datos Detallados Datos en continuo cambio
DATAWAREHOUSE Datos de negocio Orientado al sujeto Actuales + Histrico Datos Resumidos Datos Estables
BD operacional
GESTOR CARGA
GESTOR ALMACENAMIEN TO
GESTOR CONSULTAS
10
Se encarga del almacenamiento, de la estructura,. Existe una tabla llamada FACT (Hecho) y unas tablas llamadas dimensiones o tablas dimensionales. Entre la tabla FACT y las tablas dimensionales suele haber relaciones 1:N Este modelo tiene forma de estrella por eso se denomina MODELO STAR
11
DIM_TIEMPO
# PK4
DIM_1
# PK1
FACT DIM_3
# PK3 # PK1 # PK2 # PK3 # PK4 *campoA *campoB
DIM_2
# PK2
12
Las consultas se hacen sobre la tabla FACT. Tambin se encarga de los perfiles, pues las consultas (reports) sern diferentes dependiendo del usuario y sus necesidades.
13
14
Por lo tanto ante la imperante necesidad de obtener informacin confiable casi en tiempo real la utilizacin de un sistema de Data Warehouse se considera hoy da como una herramienta primaria no solo en las empresas globales sino inclusive en las PYMES.
15
Las razones bsicas de porque una organizacin implementa Data Warehouse: a) Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y discos que no son utilizados por sistemas de proceso de transacciones. b) Para utilizar modelos de datos o tecnologas de servidores que agilizan los queries y reportes, y que no son apropiados para los procesos de transacciones. c) Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los aspectos tcnicos de tecnologa de bases de datos es requerida para escribir y mantener queries y reportes. d) Para proveer un almacn del sistema de proceso de transacciones limpio que puede ser reportado y que no necesariamente requiere que se arregle el sistema de proceso de transacciones. e) Para hacer los queries y reportes de datos bsicamente ms fcil de los mltiples procesos de transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el propsito de hacer queries y reportes.
16
Ventajas de Data Warehouse: a) Proporciona informacin clave para la toma de decisiones empresariales. Mejora la calidad de las decisiones tomadas. b) Especialmente til para el medio y largo plazo. c) Son sistemas relativamente sencillos de instalar si las fuentes de datos y los objetivos estn claros. d) Muy tiles para el almacenamiento de anlisis y consultas de histricos.
Desventajas: a) No es muy til para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir. En cualquier caso la tendencia de los productos actuales (junto con los avances del hardware) es la de solventar este problema convirtiendo la desventaja en una ventaja. b) Requiere de continua limpieza, transformacin e integracin de datos. c) En un proceso de implantacin puede encontrarse dificultades ante los diferentes objetivos que pretende una organizacin. d) Una vez implantado puede ser complicado aadir nuevas fuentes de datos.
17
Sectores donde se ha implantado Data Ware House Los sectores donde principalmente se ha implantado data warehouse son los siguientes: Empresas de telecomunicaciones. Disponen de datos de millones de clientes, llamadas, acciones de marketing, facturas, servicios, etc. Telefnica mviles es un claro ejemplo de este tipo de compaas adems de Jazztel, Vodafone, France Telecom... Empresas de transporte. Aerolneas, Transporte de Cargas, Transporte de Pasajeros... entre ellas British Airways, Union Pacific, Air France, etc. Turismo. Centrales de Reservas, Cadenas Hoteleras, Agencias de Viajes... Empresas de fabricacin de bienes de consumo masivo. Entre ellas Coca-Cola, Adidas, Nike, 3M, Bosh Siemens, prcticamente todas las empresas de fabricacin de automviles, etc. Entidades Financieras. BBVA, Caja Madrid, Caja Extremadura y en general la practica totalidad de las que conocemos. Comercio Minorista. Corte Ingls, Cortefiel, Eroski entre otros. - Administracin del Estado. Empresas Aseguradoras. Casi todas las importantes que todos conocemos. Organizaciones de Atencin Sanitaria. Sector en aumento. La caracterstica comn de todas ellas es el gran volumen de informacin que genera su operativa, fundamentalmente en lo relativo a clientes finales.
18