You are on page 1of 16

Existen muchas definiciones para el DW, la ms conocida fue propuesta por Inmon

(considerado el padre de las Bases de Datos) en 1992: Un DW es una coleccin de datos orientados a temas, integrados, no-voltiles y variante en el tiempo, organizados para soportar necesidades empresariales.

El nivel competitivo alcanzado en las empresas les ha exigido desarrollar nuevas estrategias de gestin. La necesidad de obtener informacin para una amplia variedad de individuos es la principal razn de negocios que conduce al concepto de Datawarehouse.

El DW puede verse como una bodega donde estn almacenados todos los datos necesarios para realizar las funciones de gestin de la empresa, de manera que puedan utilizarse fcilmente segn se necesiten. El contenido de los datos, la organizacin y estructura son dirigidos a satisfacer las necesidades de informacin de los analistas.

Temtico: . Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los

usuarios finales.
Histrico: El tiempo es parte implcita de la

informacin contenida en un DataWareHouse

Integrado: Los datos almacenados en el DataWareHouse deben integrarse en una

estructura consistente.
No voltil: El almacn de informacin de un

DataWareHouse existe para ser ledo, pero no modificado.

La estructura bsica de la arquitectura DW incluye:

1. Datos operacionales: un origen de datos para el componente de almacenamiento fsico DW. 2. Extraccin de Datos: seleccin sistemtica de datos operacionales usados para poblar el componente de almacenamiento fsico DW.

3. Transformacin de datos: Procesos para sumarizar y realizar otros cambios en los datos operacionales para reunir los objetivos de orientacin a temas e integracin principalmente.

4. Carga de Datos: insercin sistemtica de datos en el componente de almacenamiento fsico DW.


Los pasos 2, 3 y 4 considerados en la figura anterior, conforman el proceso conocido como ETT o ETL(Extraccin, Transformacin y Transporte).

5. Data Warehouse: almacenamiento fsico de datos de la arquitectura DW. 6. Herramientas de Acceso al componente de almacenamiento fsico DW: herramientas que proveen acceso a los datos.

Metadatos:permiten saber la procedencia de la informacin, su periodicidad de refresco, su fiabilidad, forma de clculo... etc.

Middleware es un trmino genrico que se utiliza para referirse a todo tipo de software de conectividad que ofrece servicios u operaciones que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas heterogneas Extraccin: obtencin de informacin de las distintas fuentes tanto internas como externas. Transformacin: filtrado, limpieza, depuracin, homogeneizacin y agrupacin de la informacin. Carga: organizacin y actualizacin de los datos y los metadatos en la base de datos.

Los sistemas tradicionales de transacciones y las aplicaciones de Data Warehousing son polos opuestos en cuanto a sus requerimientos de diseo y sus caractersticas de operacin.

DATA WAREHOUSE

PROCESAMIENTO TRANSACIONAL(OLTP)

Las aplicaciones de OLTP estn organizadas para ejecutar las un Data Warehouse est organizado en transacciones para los cuales fueron base a conceptos, como por ejemplo: hechos, como por ejemplo: mover dinero clientes, facturas, productos, etc. entre cuentas un cargo o abono, una devolucin de inventario, etc. los Data Warehouse slo son accesados los sistemas transaccionales son por decenas de usuarios accesados por cientos de usuarios simultaneamente simultneamente

Mayor tamao . un Data Warehouse puede estar formado por informacin de Menor tamao varios OLTPs.

Una sola consulta puede tomar minutos.

Realiza cientos de transacciones por segundo.

You might also like