Data Warehousing

Cesar Eduardo Crespo Rodríguez, Universidad Autónoma de Quito (UNAQ)

INTRODUCCION Desde que a principios de la década de 1980 comenzaron a desarrollarse bases de datos siguiendo el modelo relacional, la capacidad y velocidad de estos sistemas ha ido mejorando año tras año. La información almacenada en las bases de datos se orientó desde un primer momento al registro de transacciones, sistemas OLTP - On Line Transaction Processing - de un modo tal que los procesos se diseñaron fundamentalmente para introducir información en los sistemas, pero no para extraerla de ellos. A medida que ha ido creciendo el volumen de información almacenada, ha crecido también la dificultad de acceder a ella de un modo sencillo y eficiente. Es el sitio donde se almacena todos los datos con la finalidad de archivamiento, análisis de efecto y por la seguridad de los mismos. En una data warehouse las tablas que almacenan información se diseñan de una manera especial pensando en que almacenarán cantidades gigantescas de información. Esta información es almacenada de diferentes bases de datos, un Data Warehouse es un único equipo o varios ordenadores (servidores) atados juntos para crear un sistema gigante de computadoras como se puede observar en la Fig. 1 de abajo.

Fig. 1 Como trabaja un Data Warehouse

Un Data Warehouse se vale de una base de datos relacional diseñada para el acceso rápido y análisis y no al proceso transaccional. El Data Warehouse separa la carga del análisis y normalmente contiene datos históricos derivados de datos transaccionales. Ya que esta gran cantidad de información que se almacene solo nos servirá de consulta por lo tanto no es necesario tenerla relacionada, ya que los datos pueden ser primarios o con formato y pueden contener diferente tipos de temas tales como los salarios, datos de recursos humanos, operativos, salarios, etc. Y así tenemos una pequeña tabla de comparación de una base de datos operacional con una Data Warehouse

También es importante considerar los requerimientos futuros y las actualizaciones de software. A los sistemas fuentes también se le conoce como Legacy System. que tienen que ser compatibles con los anteriores. organizados para soportar necesidades empresariales". si los datos son accesibles a través de una red abierta como Internet. contabilidad. La seguridad puede ser de gran preocupación. Cabe señalar que hay algunos aspectos negativos de tener un Data Warehouse como el hecho de que consumen mucho tiempo y recursos al crearlos y mantenerlos en funcionamiento. informática. Debido a que la mayoría de los Data Warehouse están integrados. Diferentes tipos de información El ingreso de datos en el data warehouse viene desde el ambiente operacional en casi todos los casos.considerado el padre del Data Warehouse . El data warehouse es siempre un almacén de datos transformados y separados físicamente de la aplicación donde se encontraron los datos en el ambiente operacional. Los Data Warehouse también refuerzan la coherencia de los datos y le permite comprobar una y otra vez para determinar la relevancia de la información. se puede extraer datos de diferentes áreas de su negocio. . Usted no desea que sus datos sean vistos por su competidor o peor. integrados. por ejemplo. El primer punto seria para que todos los empleados o el usuario final pueda generar informes con los datos. finanzas. Los elementos básicos de un Data WareHouse • Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. realiza un análisis y el poder tomar alguna decisión. hackeados y destruidos. la más conocida fue propuesta por William Inmon . También podría tener un problema con que los sistemas actuales fueran incompatibles con él. ¿Por qué debería usted o su organización utilizar un Data Warehouse? Aquí tenemos algunos de los pros y los contras para utilizar este tipo de estructura de datos. no-volátiles y variante en el tiempo.en 1992: "Un DW es una colección de datos orientados a temas. recursos humanos.Base de Datos Operacional Datos Operacionales Orientado a la aplicación Actual Detallada Cambia continuamente Data Warehouse Datos del negocio para Información Orientado al sujeto Actual + histórico Detallada + más resumida Estable Existen muchas definiciones para el Data Warehouse. con lo cual le ayudara a conocer más a cerca del medio ambiente que su negocio opera. etc.

OLAP: actividad general de búsquedas para presentación de texto y números del Data WareHouse. Almacenamiento operacional de datos: es el punto de integración por los sistemas operacionales. aplicaciones y propietarios de tecnología de bases de datos que tienen un fuerte estilo dimensional. Data WareHouse: búsquedas fuentes de datos de la empresa. Ad Hoc Query Tool: un tipo especifico de herramientas de acceso a datos por usuarios finales que invita al usuario a formas sus propios queries manipulando directamente las tablas relacionales y sus uniones. también un estilo dimensional especifico de búsquedas y presentación de información y que es ejemplificada por vendedores de OLAP. analizan y presentan la información objetivo para el soporte de las necesidades del negocio.• Área de tráfico de datos: es un área de almacenamiento y grupo de procesos. ROLAP: un grupo de interfases de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional. Servidor de presentación: la maquina física objetivo en donde los datos del Data WareHouse son organizados y almacenados para queries directos por los usuarios finales. combinan. Data Mart: un subgrupo lógico del Data WareHouse completo. guardan. Herramientas de acceso a datos por usuarios finales: un cliente de Data WareHouse. reportes y otras aplicaciones. Procesos de negocios: un coherente grupo de actividades de negocio que hacen sentido a los usuarios del negocio del Data WareHouse. remover los duplicados. MOLAP: un grupo de interfases de usuarios. archivan y preparan los datos fuente para ser usados en el Data WareHouse. Aplicaciones para usuarios finales: una colección de herramientas que hacen los queries. Meta Data: toda la información en el ambiente del Data WareHouse que no son así mismo los datos actuales. Modelado de aplicaciones: un sofisticado tipo de cliente de Data WareHouse con capacidades analíticas que transforma o digiere las salidas del Data WareHouse. Modelo dimensional: una disciplina específica para el modelado de datos que es una alternativa para los modelos de entidad – relación. Es el acceso al soporte de decisiones por los ejecutivos. que limpian transforman. Y es la unión de todos los data marts que la constituyen. • • • • • • • • • • • • • • .

por ejemplo planificación de los recursos. pero una área que requiere atención especial por parte de la comunidad de investigación es de datos almacén de mantenimiento. Mucho se ha de hacer en este campo en relación con el diseño y la el desarrollo de almacenes de datos y mucho queda por hacer.CONCLUSIONES Data WareHouse son de una gran ayuda para poder obtener una información rápida. El almacenamiento de datos es la tecnología líder y más confiable usada hoy en día por las empresas para la planificación. Laudon Jane P.. Después de la evolución del concepto de almacenamiento de datos durante los primeros años 90 se pensaba que esta tecnología crecerá a un ritmo muy rápido. BIBLIOGRAFIA Laudon Keneth C. previsión y gestión para.) . . Sistemas de Información Gerencial (8ª ed. precisa y además que se la tiene como un respaldo ya que nos permite extraerla de manera más fácil. etc. la predicción y el control financieros. pero por desgracia es no la realidad.

. Pearson Educación.. Margy Ross.org/casefor. Warren . Laua Reeves.dwinfocenter.The Data WareHouse Lifecycle Toolkit Wiley Edition ..com/ Ralph Kimball.html http://datawarehouse.ittoolbox. (2004) http://www.México.

Sign up to vote on this title
UsefulNot useful