You are on page 1of 131
MARIA ISABEL GUZMAN GARCIA “[MPLEMENTACION DE UN DATA WAREHOUSE PARA EL SOPORTE DE TOMA DE DECISIONES” universidad FRANCISCO MARROQUIN Dee FACULTAD DE INGENIER[A DE SISTEMAS, INFORMATICA Y CIENCIAS DE LA COMPUTACION GUATEMALA, 2001 Esta tesis fue elaborada por los autores, como requisito para obtener el grado académico de Licenciatura en Administracién de Sistemas de Informacion. Guatemala, Julio de 2001 Guatemala, 11 de Julio de 2001 Doctor Eduardo Suger Cofifio Decano de la Facultad de Ingenieria de Sistemas, Informatica y Ciencias de la Computacién. FISICC Universidad Francisco Marroquin ‘Ciudad Sefior Decano: Por este medio le comunico que he asesorado y revisado ef trabajo de tesis titulado “IMPLEMENTACION DE UN DATA WAREHOUSE, PARA EL SOPORTE DE TOMA DE DECISIONES”, presentado por los estudiantes Maria Isabel Guzman Garcia y Greivin Humberto Batz Caceres. Después de haber revisado el contenido del mismo, puedo asegurar que se trata de un buen trabajo de investigacion y que los estudiantes manejan el tema, haciendo un uso adecuado de los conceptos teéricos y aplicandolos correctamente en la informacion que se utiliz6. Las conclusiones alcanzadas por los estudiantes constituyen un aporte valioso al tema. Consecuentemente, considero que el trabajo de tesis “IMPLEMENTACION DE UN DATA WAREHOUSE, PARA EL SOPORTE DE DECISIONES", cumple con los requisitos académicos de fondo y forma requeridos para un trabajo profesional, y por lo tanto recomiendo su publicacién. Atentamente, RadAntohio Palma de Leon — Asesor de Tesis FRANCISCO. ie UNIVERSIDAD FRANCISCO MARROQUIN FACULTAD DE INGENIERIA DE SISTEMAS, INFORMATICA Y CIENCIAS DE LA COMPUTACION jCERSIPAD, CaiSONNTH. Guatemala, 09 de Agosto de 2001 Doctor Eduardo Suger Cofttto Decano de la Facultad de Ingenieria de Sistemas, Informdtica y Ciencias de la Computacion Doctor Suger: Por este medio, me permito comunicarle que lei lu tesis de los alumnos, MARIA ISABEL GUZMAN GARCIA, carné 1596161; GREIVIN HUMBERTO BATZ CACERES, carné 1596062; _titulada “IMPLEMENTACION DE UNA DATA WAREHOUSE PARA SOPORTE DE DECISIONES” asesorada por el Ingeniero Rail Antonio Palma de Leén. Después de revisarla detenidlamente y de hacer las recomendaciones pertinentes, en ‘mi calidad de revisora de redaccién, estilo y ortografia, le comunico que dicha tesis ens los requisitos que exige la Universidad. -Me suscribo del Sefior Decano, como su atenta y segura servidora. AlHiby ce Archivo 7a, avenida final (Calle Dr. Eduardo Suger Cofifio), Zona 10, Edificio Dr. Manuel F. Ayau, Guatemala, C.A. Planta FISICC: 331-4948 + 362-2725 + 331-4807 » 360-1893 + 332-2033 * Fax: 331-1645 are iz UNIVERSIDAD FRANCISCO MARROQUIN FACULTAD DE INGENIERIA DE SISTEMAS, INFORMATICA Y CIENCIAS DE LA COMPUTACION Guatemala, 10 de agosto de 2001 Seftorita Maria Isabel Guzmin Garcia Presente Estimada seftorita Guaman: ‘Tengo mucho gusto en informarle que, después de haber revisado su trabajo de Tesis, cuyo titulo es “IMPLEMENTACION DE UN DATA WAREHOUSE, PARA EL SOPORTE DE TOMA DE DECISIONES", y de haber obtenido ef dictamen del asesor especifico, autorizo la publicacién det mismo. Aprovecho la oportunidad para felicitarla por el magnifico trabajo realizado, el cual es de indiscutible beneficio para el desartollo de las Ciencias de Computacién en Guatemala. Atentamente, FACULTAD DE INGENIERIA DE SISTEMAS, INFORMATICA Y CIENCIAS DE LA COMPUTACION Dr. x4 ito Wfiger C. Decato FISICC ESC/edec.~ 7a, avenida final (Calle Dr. Eduardo Suger Cofifio), Zona 10, Edificio Dr. Manuel F. Aya, Guatemala, CA Planta FISICC: 331-4948 + 362-2725 + 331-4807 + 360-1893 + 332-2033 * Fax: 331-1645 ADios: Amis padres: ‘Amis hermanos: Amis amigos: Aminovio: Maria Isabel Guzmén Garcia AGRADECIMIENTOS Por darme la vida, salud e inteligencia para lograr las metas que me he propuesto en la vida. Carlos René y Ofelia Quienes siempre me han aconsejado, apoyado y han sido un ejemplo a seguir en lograr mis metas. René Alejandro, Ana Lucia y Sonia Patrica. Por su paciencia y compafiia en estos afios de estudio. Gracias por demostrarme ese amor de hermanos. Greivin Batz, Jorge Estrada y Andrés Sandoval. Por ser los compafieros y amigos incondicionales durante todos los arios de estudio. Gracias por su amistad, sus consejos, ensefianzas y paciencia. Gracias por darme tu amor y apoyo en lograr mis metas. Y a usted amigo lector. PREFACIO Desde que se inicia la era de la computadora, las organizaciones usan los datos desde los sistemas operacionales para atender sus necesidades de informacion. Algunas proporcionan acceso directo a la informacién contenida dentro de las aplicaciones operacionales. Otras, han extraido los datos desde sus bases de datos operacionales para combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus necesidades de informacién. ‘Ambos métodos han evolucionado a través del tiempo y ahora las organizaciones manejan datos no limpios e inconsistentes, sobre los cuales, en la mayoria de las veces, se toman decisiones importantes. La gestién administrativa reconoce que una manera de elevar 'u eficiencia esta en hacer el mejor uso de los recursos de informacion que ya existen dentro de la organizacién. Sin embargo, a pesar de que esto se viene intentando desde hace muchos affos, no se tiene un uso efectivo de los mismos. La razén principal es la manera en que han evolucionado las computadoras, basadas en las tecnologias de informacién y sistemas. La mayoria de las organizaciones hacen lo posible por conseguir buena informacién, pero el logro de ese objetivo depende fundamentaimente de su arquitectura actual, tanto de hardware como de software. Ei Data Warehouse, es actualmente, el centro de atencién de las grandes instituciones, Porque provee un ambiente para que las organizaciones hagan un mejor uso de la informacion, que es administrada por diversas aplicaciones operacionales. Un Data Warehouse es una coleccién de datos en la que se encuentra integrada a informacion de la Institucién y que se usa como soporte para el proceso de toma de decisiones gerenciales. Aunque diversas organizaciones y personas individuales logran comprender el enfoque de un Warehouse, la experiencia ha demostrado que existen muchas dificutades potenciales, Reunir los elementos de datos apropiados desde diversas fuentes de aplicacion en un ambiente integral centralizado, simplifica el problema de acceso a la informacién y en consecuencia, acelera el proceso de andlisis, consultas y el menor tiempo de uso de la informacion. Las aplicaciones para soporte de decisiones basadas en un Data Warehouse, pueden hacer mas practica y facil la explotacién de datos para una mayor eficacia del negocio, que no se logra cuando se usan s6lo los datos que provienen de las aplicaciones operacionales (que ayudan en la operacion de la empresa en sus operaciones cotidianas), en los que la informacion se obtiene realizando procesos independientes y muchas veces complejos. Un Data Warehouse se crea al extraer datos desde una o mas bases de datos de aplicaciones operacionales. Los datos extraidos son transformados para eliminar inconsistencias y resumir si es necesario y luego, cargados en el Data Warehouse. El proceso de transformar, crear el detalle de tiempo variante, resumir y combinar los extractos de datos, ayudan a crear el ambiente para el acceso a la informacién institucional. Este nuevo enfoque ayuda a las personas individuales, en todos los niveles de la empresa, a efectuar su toma de decisiones con mas responsabilidad. La innovacién de la tecnologia de informacién dentro de un ambiente Data Warehouse, Puede permitir a cualquier organizacién hacer un uso mas 6ptimo de los datos, como un ingrediente clave para un proceso de toma de decisiones mas efectivo. Las organizaciones tienen que aprovechar sus recursos de informacién para crear la informacién de la operacion del negocio, pero deben considerarse las estrategias tecnolégicas necesarias para la implementacion de una arquitectura completa de Data Warehouse, INDICE PAGINA PREFACIO INTRODUCCI CAPITULO 1 INTRODUCGION A DATA WAREHOUSE. 1.1 Antecedentes histéricos. 1.2. Aspectos tedricos. 1.3. Sistemas de Informacién. 1.3.1 Sistemas técnico-operacionales .. 1.32 Sistemas de Soporte de Decisiones. wom w CAPITULO 2 CONCEPTOS GENERALES DE DATA WAREHOUSE... 24. Definicién. 2.2. Caracteristica 22.4. Orientado a temas ... er eee 4 22.2. Integrado, ene 14 2.2.3. De Tiempo Variante : 7 2.2.4, NOVO oon eer 20 2.3. Estructura del Data Warehouse. 2.4, Arquitectura de un Data Warehouse. 2.4.1. Elementos constituyentes de una Arquitectura Data Warehouse... nnn BP 2.5, Operaciones en un Data Warehouse. 26. Transformacién de datos y metadata. 2.6.1. Transformacién de Datos. . 34 26.2. Metadata : & 35 2.7. Flujo de dato 2.8. Usos del Data Warehous: Ventajas y desventajas de un Data Warehouse, 2.10. Ejemplo de un Data Warehouse. 211. Consideraciones adicional 2.12, Excepclones en el Data Warehouse. CAPITULO 3 PROCESO DE ELABORACION AT 3.4. Organizacién 3.1.1. Recopilacién de informacién. 7 3.1.2. Factores en la planificacién de un Data Warehouse. 3.4.3. _Estrategias para el desarrollo de un Data Warehouse. ssn 3.1.4. Estrategia para el disevio de un Data Warehouse... . 51 3.1.5. Estrategias para la gestién de un Data Warehous: 3.2. 3.2.1. Por qué construr bloques de Data Warehouse ?........nsn 53 32.2. Consideraciones previas al desarrollo de un Data Warehouse nnn 3.2.3. Elementos claves para el desarrollo de un Data Warehouse 87 3.2.4. Confiabilidad de los datos..... : 68 3.25. Factores decisivos para decidir el desarrollo de un Data Warehouse 74 3.26. _Etapas para la construccién de un Data Warehouse. - 72 3.3. Implementacién. 83 3.3.1. Elementos a considerar en ia implementacién 83 3.3.2. _Estrategias para el proceso de implementacion, 84 3.3.3. Estrategias en la implementacién 85 3.4. Evaluacién. 3.4.1. Evaluaci6n de rendimiento de la inversién. 3.4.2. Beneficios a obtener: vii CAPITULO 4 ‘SOFTWARE EN UN DATA WAREHOUSE... 4.1. Herramientas de consulta y reporte. 4.2. Herramientas de base de datos multidimensionales / OLAP. 4.2.1. Limitaciones del enfoque de bases de datos multidimensionales:.. 4.3, Sistemas de apoyo a las decisione: 4.3.4. _ Sistemas de soporte para la toma de decisiones (DSS) co 4.3.2. _ Sistemas de informacién para ejecutivos (EIS)... nous nnnnnnnnnnnnnnnnnne 8S 4.3.3. _ Sistemas pera la toma de decisiones en grupo (GDSS). 7 96 43.4. Sistemas expertos de soporte para la tora de decisiones (EDSS) 97 44, = 45. CAPITULO 8 IMPACTOS EMPRESARIALES. y decisionos empresari 5.2. Impactos técnicos de Data Warehouse. 6.3. zQuiénes y para qué lo usan?.. GLOSARIO DE TERMINOS CONCLUSIONES BIBLIOGRAFIA. INTRODUCCION Mejores decisiones de negocios es la clave para el éxito en el mercado competitive de hoy. Las organizaciones buscan que sus tomas de decisiones sean entendibles por el volumen y complelidad de los datos disponibles, de la gran cantidad de sistemas operacionales y de produccién. Facilitar estos datos a una amplia audiencia de usuarios, es uno de fos cambios ‘mas significativos para los profesionales de la informacion. Muchas organizaciones escogen construir un Data Warehouse para liberar la informacion fen sus sistemas operativos y entender los verdaderos problemas del mundo de los negocios. E Data Warehouse es un almacenamiento integrado de informacién obtenido de otros sistemas, ‘que provee soporte de decisiones, disponibilidad y manipulacién de informacion para el analisis de datos Clientes desiumbrados, mejores rendimientos, mayor partcipacién en el mercado. Estas ‘son las bases de los negocios en una década competitiva como la actual. .Cémo puede una empresa deslumbrar a sus clientes, acrecentar sus dividendos e incrementar sus acciones de ‘mercado, todo al mismo tiempo? Una de las respuestas es el Data Warehouse. El Data Warehouse representa el proceso de reunir la informacién histérica de una organizaci6n en un depésito central, y se ha convertido en una tecnologia comin y fundamental, Es la tendencia més grande dentro de la administracién de informacién en los uitimos dias. Esta es la tecnologia que finalmente puede llevar al suefio que perseguian los teéricos del tema desde la década de los sesenta Dentro de los aspectos que un Data Warehouse persigue, se mencionan los siguientes: La informacién es organizada con base a los grandes objetivos de la empresa, reflejando manipulacion del disefio de datos. Los datos son obtenidos de una aplicacién no integrada, son depurados y resumidos, para posteriormente presentarlos con sentido a los usuarios de negocios. _ Basados en la retroalimentacién de los usuarios y administradores, la arquitectura del Data Warehouse puede cambiar cada vez que el tiempo natural interactivo del proceso lo refleje. El proceso Data Warehouse es complejo, y es un resultado historicamente costoso que consume tiempo. Sin embargo, con el paso de los afios se ha venido trabajando en ésta industria para crear una plataforma que sea consistente en los componentes tecnolégices y de liderazgo de productos, los cuales puedan ser utiizados para reducir los costos e impulsar a las, ‘empresas a crear, administrar y utiizar un Data Warehouse. Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones. E CAPITULO | 4. INTRODUCCION A DATA WAREHOUSE 1.1 Antecedentes historicos El concepto de Data Warehouse proviene de la combinacién de dos necesidades que generalmente no estén asociadas, sin embargo son tomadas en conjunto para obtener un mejor entendimiento de! problema y presentar una posible solucion, Estas necesidades son: ~ Requerimiento de! negocio, de una perspectiva amplia de la informacion de la compania. .._ La necesidad de! manejo de la informacion por parte def departamento de sistemas. Tomandolas separadas, la demanda de los negocios requiere una vista amplia de la formacién que pueda liderar soluciones basadas en permitir a cualquier usuario accesar cualquier informacion sin importar donde esté ubicado. Sin embargo, éstas soluciones son simples, porque ignoran fundamentalmente la distincién entre datos e informacién. De hecho, lo ue los usuarios del negocio requieren es informacién (algunas veces definida como datos, en €1 contexto de negocios). Debido a la forma en que las aplicaciones se encuentran y coma continiian creciendo, éstas no solamente contiene datos separados del contexio del negocio sino que algunas veces contienen datos consistentes en todo el ambito de la compafia. Entonces los datos son ‘simplemente no apropiados para el uso directo de usuarios finales. Sin embargo combinando las necesidades anteriormente mencionadas, se da una nueva Perspectiva. Si la necesidad del sistema de informacién de la administraci6n de datos fuera Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones 4 tomada en cuenta, la necesidad de los negocios de una consulta amplia de los datos de los negocios son mas facil de reunir. De igual manera la necesidad de obtener una consuita amplia de los datos y los obvios beneficios de! negocio que estos tienen, sor fa justificacién requerida para resolver el problema de administracién de datos. A mitad de los afios noventas el Data Warehouse se inicié como una moda en la industria de ta computacién, se ha anunciado el valor del concepto por mas de una década, se puede ver este desarrollo como una justificacién, tal popularidad trae sus propios problemas. Uno de estos e8 que en sus inicios, lleva a los vendedores a adaptar sus conceptos particulares para hacer tuna unién entre éste y los productos que ellos venden. Debe recordarse que e! Data Warehouse to puede ser manejado por si s6lo. Este se invent por las compafiias para satisfacer sus Propias necesidades, éstas continuan existiendo y siguen creciendo de acuerdo al ambiente tecnolégico en que los negocios se operen y sean mas complejos. Con el propésito de comprender la historia del Data Warehouse de una mejor manera, se muestra la figura N°. 1 (Antecedentes del Data Warehouse). Muchas de las claves del desarrollo de computacién son direccionadas a la evolucién de! Data Warehouse. Los aspectos histéricos on solamente aspectos generales, sin embargo, el progreso del desarrollo técni y de negocios es usado como un criterio en contra, el cual mide la situacién actual en cualquier Compatila o parte de ella para entender como mejor proceda, Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones. Herramientas de replicacién Herramientas IBM de Informacién Construccién del DW Compatias: relacionales Antecedentes del Data Warehouse Etapa 2000 Administracion basadaen Vendedor de areas de trabajo Conferencia sde OW Primer articulo de Dw IEtapa Antigua 11975 i1960 4.2. Aspectos tedricos Data Warehouse es el centro de la arquitectura para los sistemas de informacion en la década de los noventas. Soporta el procesamiento informético al proveer una plataforma sélida, @ partir de los datos histéricos para hacer el analisis. Facilita la integracién de sistemas de aplicacién no integrados. Organiza y almacena los datos que se necesitan para el Figura N°. 4 procesamiento analitico ¢ informatico sobre una amplia perspective del tiempo. Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones 6 Un Data Warehouse (0 depésito de dates) es una coleccién de informacion orientado a temas, integrado, no volatil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales. Se caracteriza, haciendo un contraste de los datos de un negocio almacenados en él, a diferencia de los operacionales usados por las aplicaciones de produccién. El ingreso deestos en el Data Warehouse viene desde el ambiente operational en casi todos los casos. Este es un almacén de datos transformados y separados fisicamente de la aplicacién donde se encuentran los mismos en el ambiente operacional. 13 stemas de informacion Los sistemas de informacin se han diviido de acuerdo al siguiente esquema: +<—_____ Estatégico |_| tatetico + Téenico-Operativo <— interinstitucional Sistemas Estratégicos: Estén orientados al apoyo en la toma de decisiones, facilitando la labor de la direccién y proporcionando un soporte basico, para la toma de decisiones. Se caracterizan porque son sistemas sin carga peri6dica de trabajo, es decir, su utiizacién no es predecible. Destacan entre ellos: Los Sistemas de Informacion Gerencial (MIS), Sistemas de Informacion Ejecutivos (EIS), Sistemas de Informacién Georeferencial (GIS), Sistemas de Simulacién de Negocios (BIS y que ‘en la préctica son sistemas expertos 0 de Inteligencia Artificial - Al Implementacién de un Data Warehouse para el Soporte de Toma de Decisions z Sistemas Tacticos: Disefiados para soportar la coordinacién de actividades y manejo de documentacién, definidos para facilitar consultas sobre informacién almacenada en el sistema y la gestion independiente de la informacion por parte de los niveles intermedios de la organizacién Destacan entre ellos: los Sistemas Ofimaticos (OA), Sistemas de Transmisi6n de Mensajeria (E- mail y Fax Server), coordinacién y control de tareas (Work Flow) y los sistemas de tratamiento de documentos (Imagen, Tramite y Bases de Datos). Sistemas Técnico-Operativos: Estos sistemas, cubren el niicleo de operaciones tradicionales de captura masiva de datos y servicios basicos de tratamiento de los mismos, con tareas predefinidas (contabilidad, facturaci6n, almacén, presupuesto, personal y otros sistemas administrativos). Estos, estén evolucionando con la introduccién de censores, autématas, multimedia, bases de datos relacionales mas avanzadas y el Data Warehouse. sistemas Int ional Este nivel de sistemas de informacion, es consecuencia del desarrollo organizacional orientado @ un mercado de carécter global, obliga a pensar e implementar estructuras de comunicaci6n més estrechas entre la organizacin y el mercado (Empresa Extendida, COrganizacién Inteligente e Integracién Organizacional), todo esto a partir de la generalizacion de las redes informaticas de alcance nacional y global (INTERNET), que se convierten en vehiculo de comunicacién entre la organizacién y el mercado, no importa dénde esté la organizacion (INTRANET), ef mercado de la institucién (EXTRANET) y el mercado (Red Global). ‘Sin embargo, la tecnologia Data Warehouse basa sus conceptos y diferencias entre dos tipos fundamentales de sistemas de informacién en todas las organizaciones: los sistemas Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones 8 técnico-operacionales y los sistemas de soporte de decisiones. Siendo este titimo la base de un Data Warehouse. 4.3.4 Sistemas técnico-operacionales Son los que ayudan a manejar las empresas en sus operaciones cotidianas, Estos operan sobre la columna vertebral de cualquier empresa o institucién, entre las que se tiene sistemas de ingreso de érdenes, inventario, fabricacién, planilla y contabilidad, entre otros. Debido a su volumen e importancia en la organizacién, los sistemas operacionales siempre son las primeras partes de la empresa a ser computarizados. A través de los afios, estos sistemas operacionales se han extendido, revisado, mejorado y mantenido al punto que hoy, son completamente integrados en la organizacién. Desde luego, la mayoria de las més grandes de éstas en todo el mundo, actualmente no pueden operar sin sistemas operacionales y los datos que estos sisternas mantienen. |-3.2 Sistemas de Soporte de Decisiones Hay funciones dentro de las empresas que tienen que ver con el planeamiento, prevision y administracién de la organizacién. Estas funciones son criticas para la supervivencia de las organizaciones, especialmente en nuestro mundo de rapidos ‘cambios. Las funciones como "planificacién de market ."planeamiento de ingenieria® y “andlisis financiero", requieren de sistemas de informacién que los soporte. Pero estas funciones son diferentes de las operacionales y los tipos de sistemas requeridos. Las funciones basadas en el conocimiento son los sistemas de soporte de decisiones. Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones 9 Estos sistemas estan relacionados con el anélisis de los datos y la toma de

You might also like