You are on page 1of 6

Ao de la Inversin para el Desarrollo Rural y la Seguridad Alimentaria

UNIVERSIDAD NACIONAL DE UCAYALI


FACULTAD DE INGENIERA DE SISTEMAS Y DE INGENIERA CIVIL ESCUELA ACADMICA PROFESIONAL DE INGENIERA DE SISTEMAS

DATAWAREHOUSE

DOCENTE

Ing. Hiram Daz Arvalo

CURSO

SISTEMAS DISTRIBUIDOS

ALUMNO

Jorge Rodrigo BALDEON MARINO

CODIGO

2080622

CICLO

VIII

PUCALLPA-PER

2013

INTRODUCCIN
El Data Warehouse es una tecnologa para el manejo de la informacin construido sobre la base de optimizar el uso y anlisis de la misma utilizado por las organizaciones para adaptarse a los vertiginosos cambios en los mercados. Su funcin esencial es ser la base de un sistema de informacin gerencial, es decir, debe cumplir el rol de integrador de informacin proveniente de fuentes funcionalmente distintas (Bases Corporativas, Bases propias, de Sistemas Externos, etc.) y brindar una visin integrada de dicha informacin, especialmente enfocada hacia la toma de decisiones por parte del personal jerrquico de la organizacin

DATA WAREHOUSE
Es un repositorio o lugar de almacenamiento de informacin integrada, con la finalidad de que sta informacin pueda tomarse como punto de referencia en el tiempo, para la toma de decisiones en una organizacin o empresa. Generalmente la informacin y datos son provenientes de mltiples fuentes u orgenes. CARACTERSTICAS DEL DATA WAREHOUSE Integrado: Todos los datos almacenados deben integrarse en una estructura consistente, entre las distintas reas operacionales. La informacin puede estructurarse en distintos niveles o bloques de detalle, para adecuarse a las distintas necesidades de los usuarios. Temtico: Slo los datos necesarios para el proceso de generacin de conocimiento del negocio se integran desde el entorno operacional. Estos datos suelen ser organizados por temas para facilitar su comprensin y acceso por parte de los usuarios finales. Histrico: En los sistemas operacionales, los datos reflejan el estado del negocio en un momento presente. Sin embargo la informacin manejada en el datawarehouse sirve, para realizar anlisis de tendencias de acuerdo a las comparaciones que se hagan de una o muchas variables al cabo de un cierto tiempo o periodo en estudio. No Voltil: Toda la informacin existente dentro de la datawarehouse existe para ser leda, mas no para ser modificado. La informacin es por tanto permanente y no puede reemplazarse ni actualizarse los datos e informacin, solo agregarse o acumularse en otro lugar de almacenamiento dentro de la misma.

PROCESOS BSICOS DEL DATA WAREHOUSE Extraccin: Obtencin de informacin de las distintas fuentes tanto internas como externas. Elaboracin: Filtrado, limpieza, depuracin, homogeneizacin y agrupacin de la informacin. Carga: Organizacin y actualizacin de los datos y los metadatos en la base de datos. Explotacin: Extraccin y anlisis de la informacin en los distintos niveles de agrupacin.

ARQUITECTURA DE UN DATAWAREHOUSE En la parte inferior de la figura se pueden ver las fuentes conectadas a un extractor monitor. El extractor es un mdulo responsable de homogenizar la informacin. El monitor es el responsable de detectar los cambios que puedan ser realizados en las fuentes y reportarlos al integrador.

El integrador recibe los resultados de los extractores y despus de integrarlos, los carga al DataWarehouse. Para poder cargar la informacin, se debe disear una estructura, para almacenar los datos, el esquema multidimensional del DataWarehouse. El administrador de consultas se encarga de organizar las consultas y seleccionar los operadores para permitir su anlisis. Para explicar la actividad de un DW podemos identificar dos grandes fases: construccin y explotacin. La fase de construccin se refiere al diseo e implementacin de las herramientas encargadas de llevar los datos de las fuentes al repositorio. Tomando en cuenta que se debe integrar y homogenizar la informacin previamente. Un proceso posterior pero asociado a esta misma fase es el proceso de mantenimiento. Este se encarga de llevar los datos nuevos al DataWarehouse. En la fase de explotacin se lleva a cabo el anlisis de los datos almacenados dentro del DataWarehouse a travs de tcnicas que facilitan y hacen ms eficiente su consulta. Ya con el DataWarehouse poblado lo ltimo es disear e implementar una interfaz que le permita al usuario final interactuar con el repositorio, brindndole todas las ventajas del anlisis de la informacin.

FACTORES DE XITO DE UN DATAWAREHOUSE Integra datos de produccin con datos externos y gestiona historiales Contiene la informacin til Los datos son coherentes, actualizados y documentados (calidad)

Ofrece acceso directo a los usuarios Aumenta el nmero de accesos Da una flexibilidad que apoya el crecimiento De usuarios, herramientas y volumen

APOTACIONES DE UN DATAWAREHOUSE Proporciona una herramienta para la toma de decisiones en cualquier rea funcional, basndose en informacin integrada y global del negocio. Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para encontrar relaciones ocultas entre los datos del almacn; obteniendo un valor aadido para el negocio de dicha informacin. Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios. Simplifica dentro de la empresa la implantacin de sistemas de gestin integral de la relacin con el cliente. Supone una optimizacin tecnolgica y econmica en entornos de Centro de Informacin, estadstica o de generacin de informes con retornos de la inversin espectaculares.

VENTAJAS Y DESVENTAJAS DEL DATAWAREHOUSE Ventajas: Proceso de consultas muy rpido en preguntas predeterminadas, aprovechando las dimensiones definidas en la BD (tiempo, geogrficas, etc.). Alta oferta de productos. Independencia de plataforma. Permite todo tipo de consultas no predeterminadas. Alta escalabilidad. Altas prestaciones en los productos punteros.

Desventajas: El tratamiento de las consultas no previstas (fuera de sus dimensiones) es muy lento. Aumentar el nmero de dimensiones supone "explosionar" el tamao de la base de datos. Falta de estndares. Proceso lento en consultas complejas, en bases de datos muy grandes, si no se cuenta con plataforma paralela y capacidad de consultas paralelizadas.

CONCLUSIONES
El concepto de Datawarehouse est teniendo una gran aplicacin en la actualidad para el desarrollo de las empresas, como almacn de datos. Sus objetivos incluyen la reduccin de los costes de almacenamiento y una mayor velocidad de respuesta frente a las consultas de los usuarios. Estos pueden ahora analizar y realizar preguntas sobre aos, ms que sobre meses de informacin. Para disear una buena arquitectura de Datawarehouse es necesario como primer paso conocer bien los requerimientos del negocio y hacer un estudio profundo de las fuentes externas que nos van a suministrar los datos. Adems, hacer un buen diseo del rea de transformacin de datos, cules son las transformaciones que se van a realizar y cmo se va a implementar el modelo dimensional con sus tablas de hechos y de dimensiones es el segundo paso a seguir.

You might also like