INTEGRANTES: JESSICA JAMI PAMELA SUNTAXI ERIKA MAYA MONICA CISNEROS
GRUPO # 5 IV SEMESTRE AULA: 34
DATA WAREHOUSING INTRODUCCIN Un Data warehousing es el centro de la arquitectura para los sistemas de informacin en la dcada de los '90. Soporta el procesamiento informtico al proveer una plataforma slida, a partir de los datos histricos para hacer el anlisis. Facilita la integracin de sistemas de aplicacin no integrados. Organiza y almacena los datos que se necesitan para el procesamiento analtico, informtico sobre una amplia perspectiva de tiempo. DATA WAREHOUSE Es una coleccin de datos orientada a un determinado mbito (empresa, organizacin, etc.), integrado, no voltil y variable en el tiempo. Que ayuda a la toma de decisiones en la entidad en la que se utiliza. Su construccin se va haciendo por etapas que normalmente corresponden a las principales reas operativas de la empresa Se trata, sobre todo, de un expediente completo de una organizacin, ms all de la informacin transaccional y operacional, almacenado en una base de datos diseada para favorecer el anlisis y la divulgacin eficiente de datos (especialmente OLAP, procesamiento analtico en lnea). Un Data Warehouse o Depsito de Datos es una coleccin de datos orientado a temas, integrado, no voltil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales. Se puede caracterizar un data warehouse haciendo un contraste de cmo los datos de un negocio almacenados en un data warehouse, difieren de los datos operacionales usados por las aplicaciones de produccin.
CARACTERISTICAS DE UN DW Integrado: Los datos almacenados en el Data Warehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. Temtico: Slo los datos necesarios para el proceso de generacin del conocimiento del negocio se integran desde el entorno operacional. Se excluye la informacin que no ser usada por el proceso de sistemas de soporte de decisiones Histrico: La informacin almacenada en el Data Warehouse sirve, entre otras cosas, para realizar anlisis de tendencias. Por lo tanto, el Data Warehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones. No voltil: El almacn de informacin de un Data Warehouse existe para ser ledo, y no modificado. La informacin es por tanto permanente, significando la actualizacin del Data Warehouse la incorporacin de los ltimos valores que tomaron las distintas variables contenidas en l.
ARQUITECTURA DE UN DW
La arqui tectu ra se cons tituy e de un nm ero de part es inter conectadas: Base de datos operacional / Nivel de base de datos externo Nivel de acceso a la informacin Nivel de acceso a los datos Nivel de directorio de datos (Metadata) Nivel de gestin de proceso Nivel de mensaje de la aplicacin Nivel de Data Warehouse Nivel de organizacin de datos Base de datos operacional / Nivel de base de datos externo ESTRUCTURA DE UN DATA WAREHOUSE
Los data warehouses tienen una estructura distinta. Hay niveles diferentes de esquematizacin y detalle que delimitan el data warehouse. La estructura de un data warehouse . Detalle de datos actuales Detalle de datos antiguos Datos ligeramente resumidos Datos completamente resumidos Meta data
Detalle de datos actuales.- En gran parte, el inters ms importante radica en el detalle de los datos actuales, debido a que: Refleja las ocurrencias ms recientes, las cuales son de gran inters Es voluminoso, ya que se almacena al ms bajo nivel de granularidad. Casi siempre se almacena en disco, el cual es de fcil acceso, aunque su administracin sea costosa y compleja. Detalle de datos antiguos.- La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. Mientras no sea prioritario el almacenamiento en un medio de almacenaje alterno, a causa del gran volumen de datos unido al acceso no frecuente de los mismos, es poco usual utilizar el disco como medio de almacenamiento. Datos ligeramente resumidos.- La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel del data warehouse casi siempre se almacena en disco.
DATA WAREHOUSE Y BI La mayora de las organizaciones realiza labores con el fin de conseguir informacin adecuada, pero estas acciones no son suficientes, porque la calidad de la informacin tambin depende del software y del hardware. Con el objetivo de dar apoyo y solucin a estos problemas surge el DW, que rene y organiza grandes volmenes de datos provenientes de las diversas unidades que contienen todos los datos. Adems, asegura que los datos estn disponibles con la flexibilidad y velocidad necesarias. Con esto se puede decir que es una sper base de datos integrada. Ms adelante se comentarn las caractersticas, arquitectura, ventajas, etc. de los DW, pero antes se debe entender que la implantacin de ste, no resuelve problemas por s slo, simplemente proporciona, los datos necesarios para tomar las mejores decisiones
LAS PRINCIPALES APORTACIONES DE UN DATAWAREHOUSE SON: Proporciona una herramienta para la toma de decisiones en cualquier rea funcional, basndose en informacin integrada y global del negocio. Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para encontrar relaciones ocultas entre los datos del almacn; obteniendo un valor aadido para el negocio de dicha informacin. Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios. Simplifica dentro de la empresa la implantacin de sistemas de gestin integral de la relacin con el cliente. Supone una optimizacin tecnolgica y econmica en entornos de Centro de Informacin, estadstica o de generacin de informes con retornos de la inversin espectaculares
El xito de un data warehouse no est solo en su construccin, sino en usarlo para mejorar procesos empresariales, operaciones y decisiones. Posicionar un DW para que sea usado efectivamente, requiere entender los impactos de implementacin en los siguientes mbitos : A) IMPACTOS HUMANOS Efectos sobre la gente de la empresa: Construccin del DW: a diferencia del desarrollo de aplicaciones, donde los requerimientos de la empresa logran ser relativamente bien definidos producto de la estabilidad de las reglas de negocio a travs del tiempo, construir un DW depende de la realidad de la empresa como de las condiciones que en ese momento existan, las cules determinan qu debe contener el DW. Como se dijo anteriormente, la gente de negocios debe participar activamente durante el desarrollo del DW, desde una perspectiva de construccin y creacin. Accediendo al DW: el DW intenta proveer los datos que posibilitan a los usuarios acceder a su propia informacin cuando ellos la necesitan. Esta aproximacin para entregar informacin tiene varias implicancias: La gente de la empresa puede necesitar aprender nuevas destrezas. Anlisis extensos y demoras de programacin para obtener informacin ser eliminada. Como la informacin estar lista para ser utilizada, las expectativas probablemente aumentarn. Nuevas oportunidades pueden existir en la comunidad empresarial para los especialistas de informacin. La gran cantidad de reportes en papel sern reducidas o eliminadas. La madurez del DW depender del uso activo y retroalimentacin de sus usuarios. Usando aplicaciones DSS/EIS: usuarios de aplicaciones DSS y EIS necesitarn menos experiencia para construir su propia informacin y desarrollar nuevas destrezas. Es decir, que para los usuarios, el DW extiende el alcance de la informacin para que puedan acceder directamente en lnea, lo que a la vez contribuye en su capacidad para operar con mayor efectividad las tareas diarias relacionadas con la toma de decisiones. b) Impactos Empresariales Procesos Empresariales y Decisiones Empresariales. Se deben considerar los beneficios empresariales potenciales de los siguientes impactos: Los Procesos de Toma de Decisiones pueden ser mejorados mediante la disponibilidad de informacin. Decisiones empresariales se hacen ms rpidas por gente ms informada. Los procesos empresariales pueden ser optimizados. El tiempo perdido esperando por informacin que finalmente es incorrecta o no encontrada, es eliminado. Conexiones y dependencias entre procesos empresariales se vuelven ms claros y entendibles. Secuencias de procesos empresariales pueden ser optimizados para ganar eficiencia y reducir costos. Procesos y datos de los sistemas operacionales, as como los datos en el DW, son usados y examinados. Cuando los datos son organizados y estructurados para tener significado empresarial, la gente aprende mucho de los sistemas de informacin. Pueden quedar expuestos posibles defectos en aplicaciones actuales, siendo posible entonces mejorar la calidad de nuevas aplicaciones. B) COMUNICACIN E IMPACTOS ORGANIZACIONALES. Apenas el DW comienza a ser fuente primaria de informacin empresarial consistente, los siguientes impactos pueden comenzar a presentarse: La gente tiene mayor confianza en las decisiones empresariales que se toman. Ambos, quienes toman las decisiones como los afectados conocen que est basada en buena INFORMACIN. Las organizaciones empresariales y la gente de la cual ella se compone queda determinada por el acceso a la informacin. De esta manera, la gente queda mejor habilitada para entender su propio rol y responsabilidades como tambin los efectos de sus contribuciones; a la vez, desarrollan un mejor entendimiento y apreciacin con las contribuciones de otros. La informacin compartida conduce a un lenguaje comn, conocimiento comn, y mejoramiento de la comunicacin en la empresa. Se mejora la confianza y cooperacin entre distintos sectores de la empresa, vindose reducida la sectorizacin de funciones. Visibilidad, accesibilidad, y conocimiento de los datos producen mayor confianza en los sistemas operacionales y fomenta an ms su uso. C) IMPACTOS TCNICOS DEL DW Considerando las etapas de construccin, soporte del DW y soporte de sistemas operacionales, se tienen los siguientes impactos tcnicos: Nuevas destrezas de desarrollo: cuando se construye el DW, el impacto ms grande sobre la gente tcnica est dada por la curva de aprendizaje, muchas destrezas nuevas se deben aprender, incluyendo: conceptos y estructura DW. El DW introduce muchas tecnologas nuevas (ETT, Carga, Acceso de Datos, Catlogo de Metadatos, Implementacin de DSS/EIS), y cambia la manera que nosotros usamos la tecnologa existente. Nuevas responsabilidades de soporte, nuevas demandas de recursos y nuevas expectativas, son los efectos de estos cambios. Destrezas de diseo y anlisis donde los requerimientos empresariales no son posibles de definir de una forma estable a travs del tiempo. Tcnicas de desarrollo incremental y evolutivo. Trabajo en equipo cooperativo con gente de negocios como participantes activos en el desarrollo del proyecto. Nuevas responsabilidades de operacin: los cambios sobre los sistemas y datos operacionales deben ser examinados ms cuidadosamente para determinar el impacto que estos cambios tienen sobre ellos, y sobre el DW. Para la Direccin de Sistemas, el DW enriquece las capacidades del usuario autosuficiente y hace que la Direccin pueda ofrecer nuevos servicios a los usuarios, sin interferir con las aplicaciones cotidianas de produccin, aunque se requiere una asignacin de tiempo y personal tcnico para el mantenimiento y operacin del DW. EJEMPLO DE UN DATA WAREHOUSE
Un data warehouse estructurado para un centro de produccin industrial.
Se muestra slo el detalle actual, no as los niveles de esquematizacin ni los archivos de detalle ms antiguos. Adems, se observa que hay tablas del mismo tipo divididas a travs del tiempo. Por ejemplo, para el histrico de la fabricacin de las piezas, hay muchas tablas separadas fsicamente, representando cada una un trimestre diferente. La estructura de los datos es consistente con la tabla de la elaboracin de las piezas, aunque fsicamente hay muchas tablas que lgicamente incluyen el histrico. Para los diferentes tipos de tablas hay diferentes unidades de tiempo que fsicamente dividen las unidades de informacin. El histrico de fabricacin est dividido por trimestres, el histrico de la orden de piezas est dividido por aos y el histrico de cliente es un archivo nico, no dividido por el tiempo. As tambin, las diferentes tablas son vinculadas por medio de un identificador comn, piezas u rdenes de piezas (la representacin de la interrelacin en el ambiente de depsito toma una forma muy diferente al de otros ambientes, tal como el ambiente operacional).
Conclusiones El Data Warehouse se ha convertido en la herramienta idnea para ayudar a los ejecutivos a tomar las decisiones apropiadas, que les permitan seguir compitiendo en el mercado. El DWH organiza y orienta los datos desde la perspectiva del usuario final, mientras que los sistemas operacionales organizan sus datos desde la perspectiva de la aplicacin, para lograr eficiencia en el acceso de datos. Asegura que los datos sean precisos, correctos y confiables y que mantengan la consistencia monitoreando continuamente la precisin y exactitud de los datos y el contenido de los reportes generados. El uso de sistemas Data Warehouse es una poderosa estrategia para administrar empresas. Los resultados que arrojan los anlisis de los datos obtenidos y consolidados en el Data Warehouse pueden hacer que la directiva de la empresa corrija