You are on page 1of 4

27/5/2014 Cubo OLAP - Wikipedia, la enciclopedia libre

http://es.wikipedia.org/wiki/Cubo_OLAP 1/4
Cubo OLAP de tres dimensiones
(Ciudades, Productos y Tiempo).
Cubo OLAP
De Wikipedia, la enciclopedia libre
Un cubo OLAP, OnLine Analytical Processing o procesamiento
Analtico en Lnea, trmino acuado por Edgar Frank Codd de EF
Codd & Associates, encargado por Arbor Software (en la actualidad
Hyperion Solutions), es una base de datos multidimensional, en la cual
el almacenamiento fsico de los datos se realiza en un vector
multidimensional. Los cubos OLAP se pueden considerar como una
ampliacin de las dos dimensiones de una hoja de clculo.
A menudo se pensaba que todo lo que los usuarios pueden querer de
un sistema de informacin se podra hacer de una base de datos
relacional. No obstante Codd fue uno de los precursores de las bases
de datos relacionales, por lo que sus opiniones fueron y son
respetadas.
ndice
1 Introduccin
2 Un ejemplo
3 Dimensiones y jerarquas
4 Dispersin en cubos OLAP
5 Acceso y clculo de un cubo OLAP
6 Definicin tcnica
7 Vase tambin
Introduccin
La propuesta de Codd consista en realizar una disposicin de los datos en vectores para permitir un anlisis
rpido. Estos vectores son llamados cubos. Disponer los datos en cubos evita una limitacin de las bases de datos
relacionales, que no son muy adecuadas para el anlisis instantneo de grandes cantidades de datos. Las bases de
datos relacionales son ms adecuados para registrar datos provenientes de transacciones (conocido como OLTP o
procesamiento de transacciones en lnea). Aunque existen muchas herramientas de generacin de informes para
bases de datos relacionales, stas son lentas cuando debe explorarse toda la base de datos.
Por ejemplo, una empresa podra analizar algunos datos financieros por producto, por perodo, por ciudad, por
tipo de ingresos y de gastos, y mediante la comparacin de los datos reales con un presupuesto. Estos parmetros
en funcin de los cuales se analizan los datos se conocen como dimensiones. Para acceder a los datos slo es
necesario indexarlos a partir de los valores de las dimensiones o ejes.
El almacenar fsicamente los datos de esta forma tiene sus pros y sus contras. Por ejemplo, en estas bases de datos
las consultas de seleccin son muy rpidas (de hecho, casi instantneas). Pero uno de los problemas ms grandes
de esta forma de almacenamiento es que una vez poblada la base de datos sta no puede recibir cambios en su
27/5/2014 Cubo OLAP - Wikipedia, la enciclopedia libre
http://es.wikipedia.org/wiki/Cubo_OLAP 2/4
estructura. Para ello sera necesario redisear el cubo.
En un sistema OLAP puede haber ms de tres dimensiones, por lo que a los cubos OLAP tambin reciben el
nombre de hipercubos. Las herramientas comerciales OLAP tienen diferentes mtodos de creacin y vinculacin
de estos cubos o hipercubos (vase Tipos de OLAP en el artculo sobre OLAP).
Un ejemplo
Un analista financiero podra querer ver los datos de diversas formas, por ejemplo, visualizndolos en funcin de
todas las ciudades (que podran figurar en el eje de abscisas) y todos los productos (en el eje de ordenadas), y
esto podra ser para un perodo determinado, para la versin y el tipo de gastos. Despus de haber visto los datos
de esta forma particular el analista podra entonces querer ver los datos de otra manera y poder hacerlo de forma
inmediata. El cubo podra adoptar una nueva orientacin para que los datos aparezcan ahora en funcin de los
perodos y el tipo de coste. Debido a que esta reorientacin implica resumir una cantidad muy grande de datos,
esta nueva vista de los datos se debe generar de manera eficiente para no malgastar el tiempo del analista, es decir,
en cuestin de segundos, en lugar de las horas que seran necesarias en una base de datos relacional convencional.
Dimensiones y jerarquas
Cada una de las dimensiones de un cubo OLAP puede resumirse mediante una jerarqua. Por ejemplo si se
considera una escala (o dimensin) temporal "Mayo de 2005" se puede incluir en "Segundo Trimestre de 2005",
que a su vez se incluye en "Ao 2005". De igual manera, otra dimensin de un cubo que refleje una situacin
geogrfica, las ciudades se pueden incluir en regiones, pases o regiones mundiales; los productos podran
clasificarse por categoras, y las partidas de gastos podran agruparse en tipos de gastos. En cambio, el analista
podra comenzar en un nivel muy resumido, como por ejemplo el total de la diferencia entre los resultados reales y
lo presupuestado, para posteriormente descender en el cubo (en sus jerarquas) para poder observar con un mayor
nivel de detalle que le permita descubrir en el cubo los lugares en los que se ha producido esta diferencia, segn los
productos y perodos.
Dispersin en cubos OLAP
Vincular o enlazar cubos es un mecanismo para superar la dispersin. sta se produce cuando no todas las celdas
del cubo se rellenan con datos (escasez de datos o valores nulos). El tiempo de procesamiento es tan valioso que
se debe adoptar la manera ms efectiva de sumar ceros (los valores nulos o no existentes). Por ejemplo los
ingresos pueden estar disponibles para cada cliente y producto, pero los datos de los costos pueden no estar
disponibles con esta cantidad de anlisis. En lugar de crear un cubo disperso, a veces es mejor crear otro cubo
distinto, pero vinculado, en el que un subconjunto de los datos se pueden analizar con gran detalle. La vinculacin
asegura que los datos de los dos cubos mantengan una coherencia.
Acceso y clculo de un cubo OLAP
Los datos de los cubos pueden ser actualizados de vez en cuando, tal vez por personas diferentes de forma
concurrente. Para solventar este problema a menudo es necesario bloquear partes de un cubo mientras otro
usuario est escribiendo, para volver a calcular los totales en el cubo. Otras implementaciones aaden la posibilidad
27/5/2014 Cubo OLAP - Wikipedia, la enciclopedia libre
http://es.wikipedia.org/wiki/Cubo_OLAP 3/4
de mostrar una alerta que indique que los totales calculados previamente ya no son vlidos tras los nuevos datos.
Tambin hay algunos productos que calculan los totales cuando se les necesita con los ltimos datos producidos en
el sistema.
Definicin tcnica
En teora de bases de datos, un cubo OLAP es una representacin abstracta de la proyeccin de una relacin de
un RDBMS (Sistema administrador de bases de datos relacionales). Dada una relacin de orden N, se considera
la posibilidad de una proyeccin que dispone de los campos X, Y, Z como clave de la relacin y de W como
atributo residual. Categorizando esto como una funcin se tiene que:
W : (X,Y,Z) W
Los atributos X, Y, Z se corresponden con los ejes del cubo, mientras que el valor de W devuelto por cada tripleta
(X, Y, Z) se corresponde con el dato o elemento que se rellena en cada celda del cubo.
Debido a que los dispositivos de salida (monitores, impresoras, ...) slo cuentan con dos dimensiones, no pueden
caracterizar fcilmente cuatro dimensiones, es ms prctico proyectar "rebanadas" o secciones de los datos del
cubo (se dice proyectar en el sentido clsico vector analtico de reduccin dimensional, no en el sentido de SQL,
aunque los dos conceptos son claramente anlogos), tales como la expresin:
W : (X,Y) W
Aunque no se conserve la clave del cubo (al faltar el parmetro Z), puede tener algn significado semntico, sin
embargo, tambin puede que una seccin de la representacin funcional con tres parmetros para un determinado
valor de Z tambin resulte de inters.
La motivacin que hay tras OLAP vuelve a mostrar de nuevo el paradigma de los informes de tablas cruzadas de
los sistema de gestin de base de datos de los 80. Se puede desear una visualizacin al estilo de una hoja de
clculo, donde los valores de X se encuentran en la fila $1, los valores de Y aparecen en la columna $A, y los
valores de W: (X,Y) W se encuentran en las celdas individuales a partir de la celda $B2 y desde ah, hacia
abajo y hacia la derecha. Si bien se puede utilizar el Lenguaje de Manipulacin de Datos (o DML) de SQL
para mostrar las tuplas (X,Y,W), este formato de salida no es tan deseable como la alternativa de tablas
cruzadas. El primer mtodo requiere que se realice una bsqueda lineal para cada par (X,Y) dado, para
determinar el correspondiente valor de W, mientras que el segundo permite realizar una bsqueda ms
convenientemente permitiendo localizar el valor W en la interseccin de la columna X apropiada con la fila Y
correspondiente.
Se ha desarrollado el lenguaje MDX (MultiDimensional eXpressions o expresiones multidimensionales) para
poder expresar problemas OLAP de forma fcil. Aunque es posible traducir algunas sus sentencias a SQL
tradicional, con frecuencia se requieren expresiones SQL poco claras incluso para las sentencias ms simples del
MDX. Este lenguaje ha sido acogido por la gran mayora de los proveedores de OLAP y se ha convertido en
norma de hecho para estos sistemas.
Vase tambin
OLAP
OLTP
27/5/2014 Cubo OLAP - Wikipedia, la enciclopedia libre
http://es.wikipedia.org/wiki/Cubo_OLAP 4/4
Minera de datos
Inteligencia empresarial (Business Intelligence)
Almacn de datos (Data Warehousing)
Obtenido de http://es.wikipedia.org/w/index.php?title=Cubo_OLAP&oldid=71034697
Categora: Bases de datos
Esta pgina fue modificada por ltima vez el 27 nov 2013, a las 09:15.
El texto est disponible bajo la Licencia Creative Commons Atribucin Compartir Igual 3.0; podran ser
aplicables clusulas adicionales. Lanse los trminos de uso para ms informacin.
Wikipedia es una marca registrada de la Fundacin Wikimedia, Inc., una organizacin sin nimo de lucro.