Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Save to My Library
Look up keyword
Like this
0Activity
0 of .
Results for:
No results containing your search query
P. 1
Molap Frente a Rolap

Molap Frente a Rolap

Ratings: (0)|Views: 4 |Likes:
Published by luisroms

More info:

Published by: luisroms on Jul 23, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

07/24/2013

pdf

text

original

 
135
REVISTA INGENIERÍA E INVESTIGACIÓN VOL. 26 No.3, DICIEMBRE DE 2006 (135-142)
Análisis del modelo de almacenamiento MOLAP frente
Análisis del modelo de almacenamiento MOLAP frente
al modelo de almacenamiento ROLAP
al modelo de almacenamiento ROLAP
Comparing the MOLAP the ROLAP storage models
Marysol Tamayo
1
y Francisco Javier Moreno
2
RESUMEN
En los últimos años los Data Warehouses (DW) en conjunto con OLAP se han constituido en elementos de ayudaen las organizaciones para la toma de decisiones. Con los tipos de almacenamiento de datos ROLAP y MOLAPse pueden crear los DW. El primero almacena los datos sobre una base de datos relacional. El tipo de alma-cenamiento MOLAP en matrices multidimensionales. En este artículo se presenta un ejemplo comparativo quepermite analizar el rendimiento, las ventajas y desventajas entre estos dos tipos de almacenamiento en un sistemade gestión de base de datos (SGBD) específico. Adicionalmente se ofrece un panorama que permite observar cómo los SGBDs están incorporando hoy en día estas tecnologías dentro de sus principales funcionalidades.
Palabras clave:
Palabras clave:
 
data warehouse, OLAP, MOLAP, ROLAP.
 ABSTRACT
Data Warehouses (DWs), supported by OLAP, have played a key role in helping company decision-making du-ring the last few years. DWs can be stored in ROLAP and/or MOLAP data storage systems. Data is stored in arelational database in ROLAP and in multidimensional matrices in MOLAP. This paper presents a comparativeexample, analysing the performance and advantages and disadvantages of ROLAP and MOLAP in a specificdatabase management system (DBMS). An overview of DBMS is also given to see how these technologies arebeing incorporated.
Keywords:
Keywords:
 
data warehouse, OLAP, MOLAP, ROLAP.
Recibido: noviembre 16 de 2005 Aceptado: octubre 9 de 2006
por medio de un cubo o hipercubo, el cual representa unconjunto de hechos y otro de dimensiones (véase sección demodelos multidimensionales). El cubo consta de una seriede celdas, cada una representa un hecho que surge a raízde la combinación de las diferentes dimensiones.Hoy en día se puede observar la evolución de los SGBDcomo consecuencia de la necesidad de analizar grandesvolúmenes de datos. Uno de estos cambios está enfocadohacia el almacenamiento multidimensional, con el objetivode recuperar y analizar información compleja rápidamente.En este artículo se presenta un caso de estudio con el fin deanalizar el rendimiento de ROLAP y MOLAP.El cuerpo del artículo es el siguiente: en la sección
“ 
El
DataWarehouse”
se define el concepto de DW las seccionessiguientes describen los modelos multidimensionales OLAP
1
Ingeniera de sistemas, Universidad San Buenaventura, Medellín, Colombia. Candidata a Especialista en Sistemas. Investigadora, Grupo deIngeniería de Software, Escuela de Sistemas, Universidad Nacional de Colombia, Medellín. mtamayoh@community.com.co
2
Ingeniero de sistemas, Universidad de Antioquia, Colombia. Especialista en Gestión y Sistemas, Universidad de Antioquia, Colom-bia. M.Sc. en ingeniería de sistemas, Universidad Nacional de Colombia. Profesor Asistente de Tiempo Completo, Escuela de SistemasUniversidad Nacional de Colombia, Medellín. fjmoreno@unalmed.edu.co
Introducción
En la actualidad muchas organizaciones poseen grandesvolúmenes de datos almacenados que requieren ser ana-lizados. El objetivo de crear un DW es el de que una grancantidad de datos sean transformados en información paraque en conjunto con herramientas OLAP, paquetes estadís-ticos profesionales y herramientas de minería de datos sirvapara la toma de decisiones (Elmasri, 2006). Por tal motivolas organizaciones han desarrollado DW.Un DW debe ir acompañado de un modelo de datos, losdos más utilizados son el relacional y el multidimensional. Elmodelo relacional es ampliamente soportado en diferentesSGBD. Típicamente un DW puede almacenarse de dosformas: ROLAP y MOLAP. El tipo de almacenamiento dedatos ROLAP guarda los datos en una base de datos (BD)relacional. El MOLAP guarda los datos en matrices multidi-mensionales. Los datos de un DW se pueden representar
 
 ANÁLISIS DEL MODELO DE ALMACENAMIENTO MOLAP FRENTE AL MODELO DE ALMACENAMIENTO ROLAP
136
REVISTA INGENIERÍA E INVESTIGACIÓN VOL. 26 No.3, DICIEMBRE DE 2006
y los tipos de almacenamiento para OLAP, respectivamente.La sección “SGBD con soporte para ROLAP y MOLAP”
 
pre-senta SGBD que soportan MOLAP. En la siguiente secciónse expone el caso de estudio, base para la comparaciónrealizada, y finalmente se presentan las conclusiones ytrabajos futuros.
El Data Warehouse
La mayoría de las decisiones en las organizaciones se basanen información de experiencias pasadas. Generalmente, lainformación que se quiere investigar sobre un cierto dominiode la organización se encuentra en fuentes internas, BDtransaccionales y fuentes externas (documentos de texto,archivos HTML, entre otras.)Muchas de estas fuentes se utilizan para el trabajo diario. Actualmente en muchas empresas, el análisis para la tomade decisiones se realiza sobre estas BD de trabajo o BDtransaccionales. La situación es esta:- Se realiza el trabajo diario en las BD transaccionales(proceso conocido como OLTP, On-Line TransactionalProcessing).- Se efectúa el análisis de los datos en tiempo real sobredichas BD (proceso conocido como OLAP, On-Line Analytical Processing).Tal situación provoca algunos problemas. En primer lugar,perturba el trabajo diario en las BD transaccionales, ya quese realizan consultas muy pesadas sobre ellas. En segundotérmino, dichas BD están diseñadas para el trabajo transac-cional, no para el análisis de los datos.Como consecuencia de lo anterior surgen los DW y toda sutecnología asociada (Data Warehousing). Los DW
 
recogenlos datos de los distintos entornos transaccionales de lacompañía, los filtran y procesan para su almacenamiento,proporcionando una plataforma sólida de datos consolida-dos e históricos para su posterior análisis.Un DW
 
se define como una colección de datos
orientada al tema, integrada, temporal
y
novolátil
, usada principalmente para la toma dedecisiones (Inmon, 1996).Los siguientes términos de la definición mere-cen ser aclarados (Inmon, 1996):- Orientación al tema: la información seclasifica en base a los temas o aspectos queson de interés para el analista o usuario fi-nal. Por ejemplo: venta, inventario, crimen,etc. Por cada uno de ellos hay sujetos deinterés como productos, clientes, provee-dores, etcétera.- La integración de los datos: se refiere a laintegración de datos recogidos de diferen-tes sistemas operacionales de la organiza-ción o fuentes externas. Se manifiesta en convencionesde nombres (estandarización), en la medida uniformede las variables, entre otros.- Temporal: los datos almacenados están referidos a unperíodo de tiempo específico.- No volátil: una vez almacenados los datos, estos no sonmodificados.
Modelos multidimensionales
En un modelo de datos multidimensional los datos seorganizan alrededor de los temas de la organización. Laestructura de datos manejada en este modelo son matricesmultidimensionales o hipercubos. Un hipercubo consisteen un conjunto de celdas, cada una se identifica por lacombinación de los miembros de las diferentes dimensio-nes y contiene el valor de la medida analizada para dichacombinación de dimensiones.
-
Hecho
:
es el objeto a analizar, posee atributos llama-dos de hechos o de síntesis, y son de tipo cuantitativo.Sus valores (
medidas
) se obtienen generalmente por laaplicación de una función estadística que resume unconjunto de valores en un único valor. Por ejemplo:ventas en dólares, cantidad de unidades en inventario,cantidad de unidades de producto vendidas, horas tra-bajadas, promedio de piezas producidas, consumo decombustible de un vehículo, etcétera.
-
Dimensiones
:
representan cada uno de los ejes en unespacio multidimensional. Suministran el contexto enel que se obtienen las medidas de un hecho. Algunosejemplos son: tiempo, producto, cliente, departamento,entre otras. Las dimensiones se utilizan para seleccionary agrupar los datos en un nivel de detalle deseado. Loscomponentes de una dimensión se denominan nivelesy se organizan en jerarquías, verbigracia, la dimensióntiempo puede tener niveles día, mes y año.Los hechos se guardan en tablas de hechos y las dimensionesen tablas de dimensiones.
Figura 1. Modelo multidimensional
 
TAMAYO, MORENO
137
REVISTA INGENIERÍA E INVESTIGACIÓN VOL. 26 No.3, DICIEMBRE DE 2006
En la Figura 1 se muestra un modelo multidimensional,donde de hechos es la tabla ventas y las dimensiones sonalmacén, producto y tiempo.Un modelo multidimensional se puede representar como unesquema en estrella, copo de nieve (
 snowflake
) o constela-ción de hechos (Chaudhuri, 1997; Kimball, 2002).- Esquema en estrella: está formado por una tabla dehechos y una tabla para cada dimensión.- Esquema copo de nieve: es una variante del esquemaen estrella que presenta las tablas de dimensión norma-lizadas.- Constelación de hechos: son varios esquemas en estrellao copo de nieve que comparten dimensiones.
Ejemplo de cubo:
En la Figura 2 se tiene una BD que manejatres dimensiones: países, productos y períodos de entrega(tiempo). Los datos pueden representarse como un cubode tres dimensiones; cada valor individual de una celdarepresenta la cantidad total de un producto vendido a unpaís en una fecha determinada.
Figura 2. Cubo de datos
OLAP (Procesamiento analítico en línea)
La tecnología OLAP facilita el análisis de datos en línea enun DW, proporcionando respuestas rápidas a consultasanalíticas complejas. OLAP es utilizado generalmente paraayuda en la toma de decisiones y presenta los datos a losusuarios a través de un modelo de datos intuitivo y natural.Con este estilo de presentación los usuarios finales puedenver y entender con mayor facilidad la información de susBD, lo que permite a las organizaciones reconocer el valorde sus datos.Generalmente los esquemas de las BD tienen cierta comple- jidad para el usuario final, debido a ello la concepción delas consultas puede ser una tarea ardua.OLAP ofrece un conjunto de operadores que facilitan laconcepción de consultas, algunos de ellos son Slice & Dice,Swap, Drill Down, Drill Up, Roll-Up, Drill-Across, Drill-Through (Chaudhuri, 1997).
Modos de almacenamiento de OLAP
OLAP puede trabajar con tres tipos de almacenamiento:
 Almacenamiento ROLAP (Relational OLAP)
En ROLAP se utiliza una arquitectura de tres niveles. La BDrelacional maneja el almacenamiento de datos, el motorOLAP proporciona la funcionalidad analítica, y algunaherramienta especializada es empleada para el nivel depresentación.El nivel de aplicación es el motor OLAP, que ejecuta lasconsultas de los usuarios.El motor OLAP se integra con el nivel de presentación através del cual los usuarios realizan los análisis OLAP.Después de que el modelo de datos para el DW se ha defini-do, los datos se cargan desde los sistemas transaccionales.Los usuarios finales ejecutan sus análisis multidimensiona-les, a través del motor OLAP, el cual transforma sus datosa consultas en SQL ejecutadas en las BD relacionales y susresultados son devueltos a los usuarios.La arquitectura ROLAP es capaz de usar datos precalculados(si estos están disponibles), o de generar dinámicamente losresultados desde la información elemental (menos resumi-da). Esta arquitectura accede directamente a los datos delDW y soporta técnicas de optimización para acelerar lasconsultas como tablas particionadas, soporte a la desnor-malización, soporte de múltiples reuniones, precalculadode datos, índices etcétera.
 Almacenamiento MOLAP (multidimensional OLAP)
Un sistema MOLAP usa una BD multidimensional (BDMD),en la que la información se almacena multidimensional-mente.El sistema MOLAP utiliza una arquitectura de dos niveles:la BDMD y el motor analítico.La BDMD es la encargada del manejo, acceso y obtenciónde los datos.El nivel de aplicación es el responsable de la ejecución delas consultas OLAP.El nivel de presentación se integra con el de aplicación yproporciona una interfaz a través de la cual los usuariosfinales visualizan los análisis OLAP.La información procedente de los sistemas transaccionalesse carga en el sistema MOLAP. Una vez cargados los datosen la BDMD, se realiza una serie de cálculos para obtenerdatos agregados a través de las dimensiones del negocio,poblando la estructura de la BDMD.Luego de llenar esta estructura, se generan índices y seemplean algoritmos de tablas
hash
para mejorar los tiemposde accesos de las consultas. Una vez que el proceso depoblado ha finalizado, la BDMD está lista para su uso. Los

You're Reading a Free Preview

Download
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->