Data Warehouse ¿Qué es Data Warehousing?

En la actualidad hay una importante cantidad de confusión respecto a lo que es un Data Warehouse que, afortunadamente, está comenzando a despejarse. No obstante, parece que cada proveedor de un producto o servicio relacionado con tecnología informática tiene su definición y, lo que es peor, en su propia jerga no siempre comprensible. Algunos llaman a Datawahouse Business Intelligence or Decision Support en realidad es considerada la solución integral y oportuna para desarrollar negocio el Datawarehouse se caracteriza por ser: Integrado - Temático - Histórico - No volatil Definición : Es un proceso, no un producto. Es una técnica para consolidar y administrar datos de variadas fuentes con el propósito de responder preguntas de negocios y tomar decisiones, de una forma que no era posible hasta ahora. Consolidar datos desde una variedad de fuentes. Dentro del marco conceptual de Data Warehousing los agruparemos dentro del proceso de Transformación de Datos. Manejar grandes volúmenes de datos de una forma que no era posible, o no era costo efectiva. A estos medios los agruparemos en Procesamiento y Administración de Datos. Acceder a los datos de una forma más directa, en "el lenguaje del negocio", y analizarlos para obtener relaciones complejas entre los mismos. Estos procesos se engloban en dos categorías que serán explicadas más adelante: Acceso a los Datos y Descubrimiento o Data Mining. Estos desarrollos tecnológicos, correctamente organizados e interrelacionados, constituyen lo que se ha dado en llamar un Data Warehouse o Bodega de Datos. Veamos un poco más en detalle los grupos mencionados. Existen muchas definiciones para el DW, la más conocida fue propuesta por Inmon[MicroSt96] (considerado el padre de las Bases de Datos) en 1992: "Un DW es una colección de datos orientados a temas, integrados, novolátiles y variante en el tiempo, organizados para soportar necesidades empresariales". En 1993, Susan Osterfeldt[MicroSt96] publica una definición que sin duda acierta en la clave del DW: "Yo considero al DW como algo que provee dos beneficios empresariales reales: Integración y Acceso de datos. DW elimina una gran cantidad de datos inútiles y no deseados, como también el procesamiento desde el ambiente operacional clásico". Data Mining En este sentido un sistema Datamining es una tecnología de soporte para usuario final, cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas. Los objetivos de un sistema Datamining nos permitiría analizar factores de influencia en determinados procesos, predecir o estimar variables o comportamientos futuros, sementar o agrupar ítems similares, además de obtener secuencias de eventos que provocan comportamientos específicos. Los sistemas Datamining se desarrollan bajo lenguajes de ultima generación basados en la inteligencia artificial y utilizando métodos matemáticos, tales como:

Redes euronales

Su función es apoyar a otros sistemas para la toma de decisiones. Data Marts. sino en usarlo para mejorar procesos empresariales. Los procesos que conforma el datawarehouse son: 1-Extraccion 2-Elaboración 3-Carga 4-Explotacion Componentes del Data Warehouse Impactos DW El éxito de DW no está en su construcción. operaciones y decisiones. requiere entender los impactos de implementación en los siguientes ámbitos: Diagrama de Funcionamiento . También podemos definir que un Data Martes es un subconjunto de una bodega de datos para un propósito especifico. para un arrea funcional. Posesionar un DW para que sea usado efectivamente. especifica de la compañía. Es un pequeños Data Warehouse.   Introducción de reglas Arboles de decisión Conjunto de reglas por clase Soporta tambien sofisticadas operaciones de análisis tales como los sistemas Scoring y aplicaciones de detección de fraude. para un determinado numero de usuarios.

¿Cómo trabaja el Data Warehouse?    Extrae la información operacional. Transforma la operación a formatos consistentes. OLAP Es un sinónimo de base de datos multidimensional mediante las cuales se proveen una tecnología para el cálculo y análisis requerido por las aplicaciones analíticas para el "Bussines Intellingence". las bases de datos . Automatiza las tareas de la información para prepararla a un análisis eficiente. Análisis de rentabilidad. Reducción de costos. Busines Intelligence se ha vuelto una necesidad en el vertiginoso ritmo del ambiente de negocios actual. Los negocios necesitan aprovechar las posibilidades que les ofrece la actual tecnología para permanecer competitivos y rentables. ¿En quê podemos usarlo?    Manejo de relaciones de marketing.

ellos asumen una codificación consistente. Características De acuerdo con Bill Inmon.orientado al sujeto: Los datos se organizan de acuerdo al sujeto en vez de la aplicación.Datos históricos con referencias temporales no sujetos a modificaciones.relacionadas están formadas por un conjunto de registros. para poder ser usados en comparaciones. Su diseño también ha sido condicionado por los procesos operacionales que deberá soportar para la óptima actualización de sus datos. por ejemplo. 2. puede no ser adecuada para el Data Warehouse ya que ha sido diseñada para maximizar la capacidad transaccional de sus datos y tipicamente tiene cientos de tablas la gran mayoría normalizadas. Bases de datos multidimensionales. Perdurabilidad Los datos cambian constantemente. Por ejemplo. cuando los datos fluyen de un entorno operacional a un entorno de almaceén de datos o de data warehouse. El OLAP describe la tecnología asociada al acceso y análisis de datos en líneas. etc. OLTPData Warehouse Propósito Ejecuta operaciones transaccionales diariamente Consultas y análisis para la obtención de información Estructura Sistemas de bases de datos relacionales Normalmente sistemas de bases de datos relacionalesModelo de datos Normalizado Muchas de sus tablas pueden no estar normalizadas se admite redundancia en los datos. y reclamaciones. en lugar de por diferentes productos (automóviles. vida. la descodificación de los datos es a menudo inconsistente.Acceso SQL SQL más extensiones especiales dependientes de las herramientas de explotación de datos (Data Mining) No obstante. autor de Building the Data Warehouse Construyendo el almacén de datos. la palabra gender podría codificarse como "m" y "f" en otra como "0" y "1". o incluso más antiguos. 4. vistos globalmente en procesos de reporting sofisticados pueden perder consistencia.). Los sistemas Data Warehouse están orientados a procesos de consultas en contraposición con los procesos transaccionales.Tipo de datosLos datos están orientados a la gestión de los negociosLos datos están orientados al análisis de los negocios. 3. tendencias y previsiones. una compañia de seguros usando un almacén de datos podría organizar sus datos por cliente. No son inestables: . Sistemas De Data Warehouse Y Oltp Una base de datos para soportar procesos transaccionales en línea (OLTP). el SQL estándar puede ser suficiente en manos de personal experto. Estos datos no se modificarán. Transforman los datos en información para su análisis. normalmente muchas de sus tablas en constantes y continuos cambios. ampliamante reconocido como el gurú creador del concepto data warehousing. premios.variación-temporal: El almaceén de datos contiene un lugar para guardar datos con una antiguedad de 5 a diez años. para no perder consistencia deben imponerse mecanismos de bloqueo de datos con un elevado consumo de recursos globales del sistema.integrados: Cuando los datos residen en muchas aplicaciones separados por los distintos entornos operacionales. Los datos organizados por sujetos contienen solo la información necesaria para los procesos de soporte para la toma de decisiones. en una aplicación. por ejemplo gender siempre se transformaría a "m" y "f". Cada registro contiene la información organizada en campos. existen generalmente cuatro características que describen un almaceén de datos: 1. o bien.

como por ejemplo: mover dinero entre cuentas. Es común encontrar que los sistemas transaccionales son accesados por cientos de usuarios simultáneamente. Las aplicaciones de OLTP están organizadas para ejecutar las transacciones para los cuales fueron hechos. Los OLTP son continuamente actualizados por los sistemas operacionales del día con día. Otra diferencia radica en el número de usuarios. Por otro lado. facturas. mientras que en un Data Warehouse el número de tablas es menor. . mientras que los Data Warehouse son actualizados en batch de manera periódica. productos. etc. Otro factor es que frecuentemente los sistemas transaccionales son menores en tamaño a los Data Warehouses. Normalmente. Existen también diferencia en el diseño. como por ejemplo: clientes.Los datos no serán modificados o cambiados de ninguna manera una vez ellos han sido introducidos en el almacén de datos. solamente podrán ser cargados. Los sistemas de OLTP realizan cientos de transacciones por segundo mientras que una sola consulta de un Data Warehouse puede tomar minutos. mientras que el de un OLPT es extremadamente normalizado. una devolución de inventario. el número de usuarios de un Data Warehouse es menor al de un OLTP. mientras que los Data Warehouse sólo por decenas. un Data Warehouse está organizado en base a conceptos. El OLTP normalmente está formado por un número mayor de tablas. esto es debido a que un Data Warehouse puede estar formado por información de varios OLTP´s. un cargo o abono. Diferencias: Data Warehouse vs. etc. OLTP Los sistemas tradicionales de transacciones y las aplicaciones de Data Warehousing son polos opuestos en cuanto a sus requerimientos de diseño y sus características de operación. cada una con pocas columnas. el de un Data Warehouse tiende a ser desnormalizado. leidos y/o accedidos. pero cada una de éstas tiende a ser mayor en número de columnas. Es de suma importancia comprender perfectamente estas diferencias para evitar caer en el diseño de un Data Warehouse como si fuera una aplicación de transacciones en línea (OLTP).

RRHH: la gente necesita contar con un enfoque fuerte sobre el conocimiento del área de la empresa y de los procesos empresariales. compartiendo su conocimiento y destrezas en un espíritu de equipo de trabajo. un incremento en los tiempos de respuesta y de recuperación de datos. Esto se debe a que los tipos de consultas a los cuales están sujetos son muy variados y es imposible preverlos todos de antemano. lo cual conllevará a un incremento de los recursos necesarios como a la demanda de monitoreo.Las estructuras de los OLTP son muy estables. establecen un marco de referencia y un conjunto de estándares que son críticos para la eficacia del DW. del número de usuarios del DW. administración y sintonización del DW (evitando así. . Además es muy importante considerar las cualidades de la gente. principalmente). Tiempo: Se debe establecer el tiempo no tan solo para la construcción y entrega de resultados del DW. rara vez cambian. Crecimiento: Incrementos en el tiempo en volúmenes de datos. cambios producto del aprendizaje del RRHH del proyecto mediante su experiencia usando el DW. ya que el desarrollo del DW requiere participación de la gente de negocios como de los especialistas tecnológicos. como cambios de expectativas y. La planeación y la arquitectura. para enfrentar los desafíos de desarrollo del DW. Tecnología: Muchas tecnologías nuevas son introducidas por el DW. mientras las de los Data Warehouses sufren cambios constantes derivados de su evolución. El costo de la nueva tecnología puede ser tan sólo la inversión inicial del proyecto. sino también para la planeación del proyecto y la definición de la arquitectura. Evolutivos: ajustes continuos del DW a través del tiempo. estos dos grupos de gente deben trabajar juntos.

Información que la gente necesita. consistente. Resulta esencial para llevar a cabo un proyecto DW.  Mejorar la Entrega de Información: información completa. como en las necesidades de la información que éste soporta. se debe tener especial cuidado con los costos de operación por cambios. producto de aplicaciones mal diseñados o ya no utilizados. y logra un mayor entendimiento de los impactos de sus decisiones. Cambios en la tecnología: Un cambio en la tecnología puede afectar la manera que los datos operacionales son almacenados. sin embargo. inconsistente y/o no existente. la gente de negocios adquiere mayor confianza en sus propias decisiones y las del resto. son básicos en la mantención de cualquier sistema de información. así también. tener claridad en la forma que éste se ve afectado por medio de cambios a nivel de OLTP como del Ambiente Empresarial. por lo cual no nos resultan ajenos. por ello entonces. con el DW. estructura o significado de los datos operacionales usados como origen para el DW. Transporte y Carga para adaptar las variaciones presentadas. . Eliminar la producción y el procesamiento de datos que no son usados ni necesarios. ya que ellos consideran el impacto producto de la relación del OLTP y del Ambiente Empresarial.  Mejorar el Proceso de Toma de Decisiones: con un mayor soporte de información se obtienen decisiones más rápidas. Un cambio en el ambiente operacional puede cambiar el formato. De esta forma serían impactados los procesos de Extracción. Transformación y Carga de datos. Integrar y optimizar procesos empresariales a través del uso compartido e integrado de las fuentes de información. la empresa puede lograr por sí sola: Eliminar los retardos de los procesos empresariales que resultan de información incorrecta. a continuación se analiza más en detalle este tipo de costos de operación. oportuna y accesible. Un cambio de cualquiera de ellos impacta los sistemas operacionales.Cambios: El DW requiere soportar cambios que ocurren tanto en el origen de datos que éste usa. lo cual implicaría un ajuste en los procesos de Extracción. correcta. en el tiempo que la necesita y en el formato que la necesita. Los dos primeros tipos de costos de operación.  Impacto Positivo sobre los Procesos Empresariales: cuando a la gente se le da acceso a una mejor calidad de información.

701472.94!489..7J..O3804-90303/0..2.948  O047.3940304703/0/.2-48.307.2-48706:070845479..2-.30..47..O33.08 &3...7/.59.48.:.08. .84308..2-4030.4703903/20394/04825..:.807J.2.:32.0803.325..O3..:3.9.344J.0390/0304.31472./.O331472.:/.0...42403.3/4...3854790.2.438/07.9484507.3.O3/0..84507.5:0/047.478454790/031472.O3 .7..3970..0/0 %!.8.4393:./004825. .7.9486:0F890:8.2047.7.431.0390800/..0.94 90307.  O047.3.:..7.9:7..7.6:0048..84308 2E87E5/.43085708039.4888902.948/08:8/0.946:0.43:32..O3  .038:85745.43.84308  O25.089.00890954/0..7.438890390.O3 5474..2E803/09.6:0F89080..7.34348708:9..5..O380 .48948 /04507.3/031472..2-403./6:0702.43..8.90.6:0788902.0301472...8 30.9.03.424/02-039025708..438890390 45479:3..2-486:04./4/048/.:77039.5.0848025708.08:8.30.O3 %7./00.7.O3 843-E8..025708..9484507./03.O3.2-48 ././4.:3. .6:07..0848/097. 23.5470403943.O3 %7.4803.1472...8/0..-4:35740.:.4831..4348..484-7048!74..42447035.70!74.:./48 4.2-03904507.3025.086:0708:9.7./08/0..94 0897:.7../..42509. 030902546:0..9.0848/097.75478J84..:8900348574.O3/0 %!/0 2-039025708.O36:0F890845479.03488302-.O3547.3.25.O36:0. .94/0.084..7 .&3.8  &3..7./0 31472.084825708..2-4/0.748709..70.4770.90.084/0%42./ /031472.10.6:048/./4848574..430  #08:9..10.089.43.48948/04507..3903.1472.48948/04507.08-0  31472.089.84308./4547 20/4/0.94574/:.381472.8/0 70894 47.2-4803..7./031472.  48/4857207489548/0.08 .08/.9.7.74 80/0-0903070850.2-F3 .8J9.4770. 5:0/0.9./48./0/.039030.5:0/0..43.08 843.7.7/48/048574.0  0089.3.344J. 3.9.

08.97.43082..20394/0/..08.08../80N.O3  23.7..0848025708.81:03908/0 31472./4/0./48       ./484..F8/0:84.574/:.7574.94/0 .5.9486:034843:8.34:9.79/403907.74592./48330.748 574/:.425.4 340890390  3907.O30574.7.

Sign up to vote on this title
UsefulNot useful