MARIA ISABEL GUZMAN GARCIA
“[MPLEMENTACION DE UN DATA WAREHOUSE
PARA EL SOPORTE DE TOMA DE DECISIONES”
universidad
FRANCISCO MARROQUIN
Dee
FACULTAD DE INGENIER[A DE SISTEMAS,
INFORMATICA Y CIENCIAS DE LA COMPUTACION
GUATEMALA, 2001Esta tesis fue elaborada por los autores, como requisito para obtener el
grado académico de Licenciatura en Administracién de Sistemas de
Informacion.
Guatemala, Julio de 2001Guatemala, 11 de Julio de 2001
Doctor
Eduardo Suger Cofifio
Decano de la Facultad de Ingenieria de Sistemas,
Informatica y Ciencias de la Computacién. FISICC
Universidad Francisco Marroquin
‘Ciudad
Sefior Decano:
Por este medio le comunico que he asesorado y revisado ef trabajo de tesis
titulado “IMPLEMENTACION DE UN DATA WAREHOUSE, PARA EL SOPORTE DE
TOMA DE DECISIONES”, presentado por los estudiantes Maria Isabel Guzman Garcia y
Greivin Humberto Batz Caceres.
Después de haber revisado el contenido del mismo, puedo asegurar que se trata
de un buen trabajo de investigacion y que los estudiantes manejan el tema, haciendo un
uso adecuado de los conceptos teéricos y aplicandolos correctamente en la informacion
que se utiliz6. Las conclusiones alcanzadas por los estudiantes constituyen un aporte
valioso al tema.
Consecuentemente, considero que el trabajo de tesis “IMPLEMENTACION DE UN
DATA WAREHOUSE, PARA EL SOPORTE DE DECISIONES", cumple con los requisitos
académicos de fondo y forma requeridos para un trabajo profesional, y por lo tanto
recomiendo su publicacién.
Atentamente,
RadAntohio Palma de Leon
— Asesor de TesisFRANCISCO.
ie
UNIVERSIDAD FRANCISCO MARROQUIN
FACULTAD DE INGENIERIA DE SISTEMAS,
INFORMATICA Y CIENCIAS DE LA COMPUTACION
jCERSIPAD,
CaiSONNTH.
Guatemala, 09 de Agosto de 2001
Doctor
Eduardo Suger Cofttto
Decano de la Facultad de Ingenieria
de Sistemas, Informdtica y Ciencias
de la Computacion
Doctor Suger:
Por este medio, me permito comunicarle que lei lu tesis de los alumnos, MARIA
ISABEL GUZMAN GARCIA, carné 1596161; GREIVIN HUMBERTO BATZ
CACERES, carné 1596062; _titulada “IMPLEMENTACION DE UNA DATA
WAREHOUSE PARA SOPORTE DE DECISIONES” asesorada por el Ingeniero Rail
Antonio Palma de Leén.
Después de revisarla detenidlamente y de hacer las recomendaciones pertinentes, en
‘mi calidad de revisora de redaccién, estilo y ortografia, le comunico que dicha tesis
ens los requisitos que exige la Universidad.
-Me suscribo del Sefior Decano, como su atenta y segura servidora.
AlHiby
ce Archivo
7a, avenida final (Calle Dr. Eduardo Suger Cofifio), Zona 10, Edificio Dr. Manuel F. Ayau, Guatemala, C.A.
Planta FISICC: 331-4948 + 362-2725 + 331-4807 » 360-1893 + 332-2033 * Fax: 331-1645are iz UNIVERSIDAD FRANCISCO MARROQUIN
FACULTAD DE INGENIERIA DE SISTEMAS,
INFORMATICA Y CIENCIAS DE LA COMPUTACION
Guatemala, 10 de agosto de 2001
Seftorita
Maria Isabel Guzmin Garcia
Presente
Estimada seftorita Guaman:
‘Tengo mucho gusto en informarle que, después de haber revisado su trabajo de Tesis, cuyo titulo
es “IMPLEMENTACION DE UN DATA WAREHOUSE, PARA EL SOPORTE DE
TOMA DE DECISIONES", y de haber obtenido ef dictamen del asesor especifico, autorizo la
publicacién det mismo.
Aprovecho la oportunidad para felicitarla por el magnifico trabajo realizado, el cual es de
indiscutible beneficio para el desartollo de las Ciencias de Computacién en Guatemala.
Atentamente,
FACULTAD DE INGENIERIA DE SISTEMAS,
INFORMATICA Y CIENCIAS DE LA COMPUTACION
Dr. x4 ito Wfiger C.
Decato FISICC
ESC/edec.~
7a, avenida final (Calle Dr. Eduardo Suger Cofifio), Zona 10, Edificio Dr. Manuel F. Aya, Guatemala, CA
Planta FISICC: 331-4948 + 362-2725 + 331-4807 + 360-1893 + 332-2033 * Fax: 331-1645ADios:
Amis padres:
‘Amis hermanos:
Amis amigos:
Aminovio:
Maria Isabel Guzmén Garcia
AGRADECIMIENTOS
Por darme la vida, salud e inteligencia para lograr
las metas que me he propuesto en la vida.
Carlos René y Ofelia
Quienes siempre me han aconsejado, apoyado y
han sido un ejemplo a seguir en lograr mis metas.
René Alejandro, Ana Lucia y Sonia Patrica.
Por su paciencia y compafiia en estos afios de
estudio. Gracias por demostrarme ese amor de
hermanos.
Greivin Batz, Jorge Estrada y Andrés Sandoval.
Por ser los compafieros y amigos incondicionales
durante todos los arios de estudio. Gracias por su
amistad, sus consejos, ensefianzas y paciencia.
Gracias por darme tu amor y apoyo en lograr mis
metas.
Y a usted amigo lector.PREFACIO
Desde que se inicia la era de la computadora, las organizaciones usan los datos desde
los sistemas operacionales para atender sus necesidades de informacion. Algunas
proporcionan acceso directo a la informacién contenida dentro de las aplicaciones
operacionales. Otras, han extraido los datos desde sus bases de datos operacionales para
combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus
necesidades de informacién.
‘Ambos métodos han evolucionado a través del tiempo y ahora las organizaciones
manejan datos no limpios e inconsistentes, sobre los cuales, en la mayoria de las veces, se
toman decisiones importantes. La gestién administrativa reconoce que una manera de elevar
'u eficiencia esta en hacer el mejor uso de los recursos de informacion que ya existen dentro de
la organizacién. Sin embargo, a pesar de que esto se viene intentando desde hace muchos
affos, no se tiene un uso efectivo de los mismos.
La razén principal es la manera en que han evolucionado las computadoras, basadas
en las tecnologias de informacién y sistemas. La mayoria de las organizaciones hacen lo
posible por conseguir buena informacién, pero el logro de ese objetivo depende
fundamentaimente de su arquitectura actual, tanto de hardware como de software.
Ei Data Warehouse, es actualmente, el centro de atencién de las grandes instituciones,
Porque provee un ambiente para que las organizaciones hagan un mejor uso de la informacion,
que es administrada por diversas aplicaciones operacionales. Un Data Warehouse es una
coleccién de datos en la que se encuentra integrada a informacion de la Institucién y que se
usa como soporte para el proceso de toma de decisiones gerenciales. Aunque diversasorganizaciones y personas individuales logran comprender el enfoque de un Warehouse, la
experiencia ha demostrado que existen muchas dificutades potenciales,
Reunir los elementos de datos apropiados desde diversas fuentes de aplicacion en un
ambiente integral centralizado, simplifica el problema de acceso a la informacién y en
consecuencia, acelera el proceso de andlisis, consultas y el menor tiempo de uso de la
informacion.
Las aplicaciones para soporte de decisiones basadas en un Data Warehouse, pueden
hacer mas practica y facil la explotacién de datos para una mayor eficacia del negocio, que no
se logra cuando se usan s6lo los datos que provienen de las aplicaciones operacionales (que
ayudan en la operacion de la empresa en sus operaciones cotidianas), en los que la informacion
se obtiene realizando procesos independientes y muchas veces complejos.
Un Data Warehouse se crea al extraer datos desde una o mas bases de datos de
aplicaciones operacionales. Los datos extraidos son transformados para eliminar
inconsistencias y resumir si es necesario y luego, cargados en el Data Warehouse. El proceso
de transformar, crear el detalle de tiempo variante, resumir y combinar los extractos de datos,
ayudan a crear el ambiente para el acceso a la informacién institucional. Este nuevo enfoque
ayuda a las personas individuales, en todos los niveles de la empresa, a efectuar su toma de
decisiones con mas responsabilidad.
La innovacién de la tecnologia de informacién dentro de un ambiente Data Warehouse,
Puede permitir a cualquier organizacién hacer un uso mas 6ptimo de los datos, como un
ingrediente clave para un proceso de toma de decisiones mas efectivo. Las organizaciones
tienen que aprovechar sus recursos de informacién para crear la informacién de la operaciondel negocio, pero deben considerarse las estrategias tecnolégicas necesarias para la
implementacion de una arquitectura completa de Data Warehouse,INDICE
PAGINA
PREFACIO
INTRODUCCI
CAPITULO 1
INTRODUCGION A DATA WAREHOUSE.
1.1 Antecedentes histéricos.
1.2. Aspectos tedricos.
1.3. Sistemas de Informacién.
1.3.1 Sistemas técnico-operacionales ..
1.32 Sistemas de Soporte de Decisiones.
wom w
CAPITULO 2
CONCEPTOS GENERALES DE DATA WAREHOUSE...
24. Definicién.
2.2. Caracteristica
22.4. Orientado a temas ... er eee 4
22.2. Integrado, ene 14
2.2.3. De Tiempo Variante : 7
2.2.4, NOVO oon eer 20
2.3. Estructura del Data Warehouse.
2.4, Arquitectura de un Data Warehouse.
2.4.1. Elementos constituyentes de una Arquitectura Data Warehouse... nnn BP
2.5, Operaciones en un Data Warehouse.
26. Transformacién de datos y metadata.
2.6.1. Transformacién de Datos. . 34
26.2. Metadata : & 35
2.7. Flujo de dato2.8. Usos del Data Warehous:
Ventajas y desventajas de un Data Warehouse,
2.10. Ejemplo de un Data Warehouse.
211. Consideraciones adicional
2.12, Excepclones en el Data Warehouse.
CAPITULO 3
PROCESO DE ELABORACION
AT
3.4. Organizacién
3.1.1. Recopilacién de informacién. 7
3.1.2. Factores en la planificacién de un Data Warehouse.
3.4.3. _Estrategias para el desarrollo de un Data Warehouse. ssn
3.1.4. Estrategia para el disevio de un Data Warehouse... . 51
3.1.5. Estrategias para la gestién de un Data Warehous:
3.2.
3.2.1. Por qué construr bloques de Data Warehouse ?........nsn 53
32.2. Consideraciones previas al desarrollo de un Data Warehouse nnn
3.2.3. Elementos claves para el desarrollo de un Data Warehouse 87
3.2.4. Confiabilidad de los datos..... : 68
3.25. Factores decisivos para decidir el desarrollo de un Data Warehouse 74
3.26. _Etapas para la construccién de un Data Warehouse. - 72
3.3. Implementacién. 83
3.3.1. Elementos a considerar en ia implementacién 83
3.3.2. _Estrategias para el proceso de implementacion, 84
3.3.3. Estrategias en la implementacién 85
3.4. Evaluacién.
3.4.1. Evaluaci6n de rendimiento de la inversién.
3.4.2. Beneficios a obtener:
viiCAPITULO 4
‘SOFTWARE EN UN DATA WAREHOUSE...
4.1. Herramientas de consulta y reporte.
4.2. Herramientas de base de datos multidimensionales / OLAP.
4.2.1. Limitaciones del enfoque de bases de datos multidimensionales:..
4.3, Sistemas de apoyo a las decisione:
4.3.4. _ Sistemas de soporte para la toma de decisiones (DSS) co
4.3.2. _ Sistemas de informacién para ejecutivos (EIS)... nous nnnnnnnnnnnnnnnnnne 8S
4.3.3. _ Sistemas pera la toma de decisiones en grupo (GDSS). 7 96
43.4. Sistemas expertos de soporte para la tora de decisiones (EDSS) 97
44, =
45.
CAPITULO 8
IMPACTOS EMPRESARIALES.
y decisionos empresari
5.2. Impactos técnicos de Data Warehouse.
6.3. zQuiénes y para qué lo usan?..
GLOSARIO DE TERMINOS
CONCLUSIONES
BIBLIOGRAFIA.INTRODUCCION
Mejores decisiones de negocios es la clave para el éxito en el mercado competitive de
hoy. Las organizaciones buscan que sus tomas de decisiones sean entendibles por el volumen
y complelidad de los datos disponibles, de la gran cantidad de sistemas operacionales y de
produccién. Facilitar estos datos a una amplia audiencia de usuarios, es uno de fos cambios
‘mas significativos para los profesionales de la informacion.
Muchas organizaciones escogen construir un Data Warehouse para liberar la informacion
fen sus sistemas operativos y entender los verdaderos problemas del mundo de los negocios. E
Data Warehouse es un almacenamiento integrado de informacién obtenido de otros sistemas,
‘que provee soporte de decisiones, disponibilidad y manipulacién de informacion para el analisis
de datos
Clientes desiumbrados, mejores rendimientos, mayor partcipacién en el mercado. Estas
‘son las bases de los negocios en una década competitiva como la actual. .Cémo puede una
empresa deslumbrar a sus clientes, acrecentar sus dividendos e incrementar sus acciones de
‘mercado, todo al mismo tiempo? Una de las respuestas es el Data Warehouse.
El Data Warehouse representa el proceso de reunir la informacién histérica de una
organizaci6n en un depésito central, y se ha convertido en una tecnologia comin y
fundamental, Es la tendencia més grande dentro de la administracién de informacién en los
uitimos dias. Esta es la tecnologia que finalmente puede llevar al suefio que perseguian los
teéricos del tema desde la década de los sesentaDentro de los aspectos que un Data Warehouse persigue, se mencionan los siguientes:
La informacién es organizada con base a los grandes objetivos de la empresa,
reflejando manipulacion del disefio de datos.
Los datos son obtenidos de una aplicacién no integrada, son depurados y
resumidos, para posteriormente presentarlos con sentido a los usuarios de
negocios.
_ Basados en la retroalimentacién de los usuarios y administradores, la arquitectura
del Data Warehouse puede cambiar cada vez que el tiempo natural interactivo del
proceso lo refleje.
El proceso Data Warehouse es complejo, y es un resultado historicamente costoso que
consume tiempo. Sin embargo, con el paso de los afios se ha venido trabajando en ésta
industria para crear una plataforma que sea consistente en los componentes tecnolégices y de
liderazgo de productos, los cuales puedan ser utiizados para reducir los costos e impulsar a las,
‘empresas a crear, administrar y utiizar un Data Warehouse.Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones. E
CAPITULO |
4. INTRODUCCION A DATA WAREHOUSE
1.1 Antecedentes historicos
El concepto de Data Warehouse proviene de la combinacién de dos necesidades que
generalmente no estén asociadas, sin embargo son tomadas en conjunto para obtener un mejor
entendimiento de! problema y presentar una posible solucion, Estas necesidades son:
~ Requerimiento de! negocio, de una perspectiva amplia de la informacion de la
compania.
.._ La necesidad de! manejo de la informacion por parte def departamento de sistemas.
Tomandolas separadas, la demanda de los negocios requiere una vista amplia de la
formacién que pueda liderar soluciones basadas en permitir a cualquier usuario accesar
cualquier informacion sin importar donde esté ubicado. Sin embargo, éstas soluciones son
simples, porque ignoran fundamentalmente la distincién entre datos e informacién. De hecho, lo
ue los usuarios del negocio requieren es informacién (algunas veces definida como datos, en
€1 contexto de negocios).
Debido a la forma en que las aplicaciones se encuentran y coma continiian creciendo,
éstas no solamente contiene datos separados del contexio del negocio sino que algunas veces
contienen datos consistentes en todo el ambito de la compafia. Entonces los datos son
‘simplemente no apropiados para el uso directo de usuarios finales.
Sin embargo combinando las necesidades anteriormente mencionadas, se da una nueva
Perspectiva. Si la necesidad del sistema de informacién de la administraci6n de datos fueraImplementacion de un Data Warehouse para el Soporte de Toma de Decisiones 4
tomada en cuenta, la necesidad de los negocios de una consulta amplia de los datos de los
negocios son mas facil de reunir.
De igual manera la necesidad de obtener una consuita amplia de los datos y los obvios
beneficios de! negocio que estos tienen, sor fa justificacién requerida para resolver el problema
de administracién de datos.
A mitad de los afios noventas el Data Warehouse se inicié como una moda en la industria
de ta computacién, se ha anunciado el valor del concepto por mas de una década, se puede ver
este desarrollo como una justificacién, tal popularidad trae sus propios problemas. Uno de estos
e8 que en sus inicios, lleva a los vendedores a adaptar sus conceptos particulares para hacer
tuna unién entre éste y los productos que ellos venden. Debe recordarse que e! Data Warehouse
to puede ser manejado por si s6lo. Este se invent por las compafiias para satisfacer sus
Propias necesidades, éstas continuan existiendo y siguen creciendo de acuerdo al ambiente
tecnolégico en que los negocios se operen y sean mas complejos.
Con el propésito de comprender la historia del Data Warehouse de una mejor manera, se
muestra la figura N°. 1 (Antecedentes del Data Warehouse). Muchas de las claves del desarrollo
de computacién son direccionadas a la evolucién de! Data Warehouse. Los aspectos histéricos
on solamente aspectos generales, sin embargo, el progreso del desarrollo técni
y de
negocios es usado como un criterio en contra, el cual mide la situacién actual en cualquier
Compatila o parte de ella para entender como mejor proceda,Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones.
Herramientas
de replicacién
Herramientas
IBM de
Informacién
Construccién
del DW
Compatias:
relacionales
Antecedentes del Data Warehouse
Etapa
2000
Administracion
basadaen
Vendedor
de areas
de trabajo
Conferencia
sde OW
Primer
articulo de
Dw
IEtapa Antigua
11975
i1960
4.2. Aspectos tedricos
Data Warehouse es el centro de la arquitectura para los sistemas de informacion en la
década de los noventas. Soporta el procesamiento informético al proveer una plataforma sélida,
@ partir de los datos histéricos para hacer el analisis. Facilita la integracién de sistemas de
aplicacién no integrados. Organiza y almacena los datos que se necesitan para el
Figura N°. 4
procesamiento analitico ¢ informatico sobre una amplia perspective del tiempo.Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones 6
Un Data Warehouse (0 depésito de dates) es una coleccién de informacion orientado a
temas, integrado, no volatil, de tiempo variante, que se usa para el soporte del proceso de toma
de decisiones gerenciales. Se caracteriza, haciendo un contraste de los datos de un negocio
almacenados en él, a diferencia de los operacionales usados por las aplicaciones de
produccién. El ingreso deestos en el Data Warehouse viene desde el ambiente operational en
casi todos los casos. Este es un almacén de datos transformados y separados fisicamente de la
aplicacién donde se encuentran los mismos en el ambiente operacional.
13
stemas de informacion
Los sistemas de informacin se han diviido de acuerdo al siguiente esquema:
+<—_____ Estatégico
|_| tatetico
+ Téenico-Operativo
<— interinstitucional
Sistemas Estratégicos:
Estén orientados al apoyo en la toma de decisiones, facilitando la labor de la direccién y
proporcionando un soporte basico, para la toma de decisiones. Se caracterizan porque son
sistemas sin carga peri6dica de trabajo, es decir, su utiizacién no es predecible. Destacan entre
ellos: Los Sistemas de Informacion Gerencial (MIS), Sistemas de Informacion Ejecutivos (EIS),
Sistemas de Informacién Georeferencial (GIS), Sistemas de Simulacién de Negocios (BIS y que
‘en la préctica son sistemas expertos 0 de Inteligencia Artificial - AlImplementacién de un Data Warehouse para el Soporte de Toma de Decisions z
Sistemas Tacticos:
Disefiados para soportar la coordinacién de actividades y manejo de documentacién,
definidos para facilitar consultas sobre informacién almacenada en el sistema y la gestion
independiente de la informacion por parte de los niveles intermedios de la organizacién
Destacan entre ellos: los Sistemas Ofimaticos (OA), Sistemas de Transmisi6n de Mensajeria (E-
mail y Fax Server), coordinacién y control de tareas (Work Flow) y los sistemas de tratamiento
de documentos (Imagen, Tramite y Bases de Datos).
Sistemas Técnico-Operativos:
Estos sistemas, cubren el niicleo de operaciones tradicionales de captura masiva de
datos y servicios basicos de tratamiento de los mismos, con tareas predefinidas (contabilidad,
facturaci6n, almacén, presupuesto, personal y otros sistemas administrativos). Estos, estén
evolucionando con la introduccién de censores, autématas, multimedia, bases de datos
relacionales mas avanzadas y el Data Warehouse.
sistemas Int ional
Este nivel de sistemas de informacion, es consecuencia del desarrollo organizacional
orientado @ un mercado de carécter global, obliga a pensar e implementar estructuras de
comunicaci6n més estrechas entre la organizacin y el mercado (Empresa Extendida,
COrganizacién Inteligente e Integracién Organizacional), todo esto a partir de la generalizacion de
las redes informaticas de alcance nacional y global (INTERNET), que se convierten en vehiculo
de comunicacién entre la organizacién y el mercado, no importa dénde esté la organizacion
(INTRANET), ef mercado de la institucién (EXTRANET) y el mercado (Red Global).
‘Sin embargo, la tecnologia Data Warehouse basa sus conceptos y diferencias entre dos
tipos fundamentales de sistemas de informacién en todas las organizaciones: los sistemasImplementacion de un Data Warehouse para el Soporte de Toma de Decisiones 8
técnico-operacionales y los sistemas de soporte de decisiones. Siendo este titimo la base de un
Data Warehouse.
4.3.4 Sistemas técnico-operacionales
Son los que ayudan a manejar las empresas en sus operaciones cotidianas, Estos
operan sobre la columna vertebral de cualquier empresa o institucién, entre las que se
tiene sistemas de ingreso de érdenes, inventario, fabricacién, planilla y contabilidad, entre
otros.
Debido a su volumen e importancia en la organizacién, los sistemas
operacionales siempre son las primeras partes de la empresa a ser computarizados. A
través de los afios, estos sistemas operacionales se han extendido, revisado, mejorado y
mantenido al punto que hoy, son completamente integrados en la organizacién. Desde
luego, la mayoria de las més grandes de éstas en todo el mundo, actualmente no pueden
operar sin sistemas operacionales y los datos que estos sisternas mantienen.
|-3.2 Sistemas de Soporte de Decisiones
Hay funciones dentro de las empresas que tienen que ver con el planeamiento,
prevision y administracién de la organizacién. Estas funciones son criticas para la
supervivencia de las organizaciones, especialmente en nuestro mundo de rapidos
‘cambios. Las funciones como "planificacién de market
."planeamiento de ingenieria® y
“andlisis financiero", requieren de sistemas de informacién que los soporte. Pero estas
funciones son diferentes de las operacionales y los tipos de sistemas requeridos. Las
funciones basadas en el conocimiento son los sistemas de soporte de decisiones.Implementacion de un Data Warehouse para el Soporte de Toma de Decisiones 9
Estos sistemas estan relacionados con el anélisis de los datos y la toma de