You are on page 1of 3

DATAMART

1.- QUE ES UN DATAMART?

Un Data mart es una versin especial de almacn de datos (data warehouse). Son subconjuntos de
datos con el propsito de ayudar a que un rea especfica dentro del negocio pueda tomar mejores
decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados
de mltiples formas para que diversos grupos de usuarios realicen la explotacin de los mismos de la
forma ms conveniente segn sus necesidades.

En sntesis, se puede decir que los data marts son pequeos data warehouse centrados en un tema o
un rea de negocio especfico dentro de una organizacin.

2.- QUE ES UN CUBO ANALTICO?

Es una estructura propietaria que toma las medidas de los hechos y las jerarquas en las dimensiones
y genera agregaciones previas, las cuales hace disponibles a travs de un programa de lectura de
cubos. De la misma bodega de datos se pueden generar varios cubos.

Cubos Dimensionales OLAP es el acrnimo en ingls de procesamiento analtico en lnea (On-Line


Analytical Processing). Es una solucin utilizada en el campo de la llamada Inteligencia empresarial
(o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para
ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de
grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de
ventas, marketing, informes de direccin, minera de datos y reas similares.
3.- QUE ES UNA DIMENSIN?

Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de anlisis
de las variables (forman parte de la tabla de dimensiones). Son catlogos de informacin
complementaria necesaria para la presentacin de los datos a los usuarios, como por ejemplo:
descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la informacin general
complementaria a cada uno de los registros de la tabla de hechos. Se presentan dos tipos:

a) DIMENSIONES REGULARES:

Son aquellos datos que se quieren medir, por ejemplo, si desea seguir el control de sus ventas,
puede utilizar:
Clientes: Quienes son los mejores, donde se encuentran, Qu es lo que compran?
Productos: Con respecto a los clientes, Quien los compra? Qu productos se estn
vendiendo?
Tiempo: Cmo voy ahora con respecto al ltimo ao o ltimo mes?

En otro tipo de aplicaciones, por ejemplo cuentas por cobrar, se pueden utilizar dimensiones como
el Tiempo para llevar control del vencimiento de sus documentos. En contabilidad, una dimensin
podra ser su catlogo de cuentas, etc.

Estas dimensiones se conforman de elementos que estn dispuestos en niveles jerrquicos o


simplemente niveles. Los niveles pueden ser por ejemplo, pas, estado, ciudad. Se puede navegar
a travs de esta jerarqua a travs de los niveles o a travs de sus elementos.

b) DIMENSION DE MEDIDA:

Son los nmeros que aparecen en el anlisis dependiendo de los elementos seleccionados en las
dimensiones regulares. Por ejemplo, en un cubo de ventas, se podr escoger ver las ventas, el
nmero de artculos vendidos, ganancia, costo, etc.

4.- QUE ES GRANULARIDAD?

Una caracterstica importante que define a una tabla de hechos es el nivel de granularidad de los
datos que en ella se almacenan, entendindose por 'granularidad' el nivel de detalle de dichos datos,
es decir, la granularidad de la tabla de hechos representa el nivel ms atmico por el cual se definen
los datos. Por ejemplo, no es lo mismo contar el tiempo por horas (grano fino) que por semanas
(grano grueso); o en el caso de los productos, se puede considerar cada variante de un mismo
artculo como un producto (por ejemplo, en una empresa textil, cada talla y color de pantaln podra
ser un producto) o agrupar todos los artculos de una misma familia considerndolos como un nico
producto (por ejemplo, el producto pantaln genrico).

5.- QUE SON HECHOS O TABLAS HECHO?

Las medidas ms tiles para incluir en una tabla de hechos son los aditivos, es decir, aquellas
medidas que pueden ser sumadas como por ejemplo la cantidad de producto vendido, los costes de
produccin o el dinero obtenido por las ventas; son medidas numricas que pueden calcularse con la
suma de varias cantidades de la tabla. En consecuencia, por lo general los hechos a almacenar en
una tabla de hechos van a ser casi siempre valores numricos, enteros o reales.
6.- QUE ES UNA DATAWARE HOUSE?

Es una coleccin de datos orientada a un determinado mbito (empresa, organizacin, etc.),


integrado, no voltil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la
que se utiliza. Se trata, sobre todo, de un expediente completo de una organizacin, ms all de la
informacin transaccional y operacional, almacenado en una base de datos diseada para favorecer
el anlisis y la divulgacin eficiente de datos (especialmente OLAP, procesamiento analtico en lnea).

El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de datos
contienen a menudo grandes cantidades de informacin que se subdividen a veces en unidades
lgicas ms pequeas dependiendo del subsistema de la entidad del que procedan o para el que sea
necesario.

Segn el propio Bill Inmon, un datawarehouse se caracteriza por ser:

1.- Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura
consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales
deben ser eliminadas.

2.- Temtico: slo los datos necesarios para el proceso de generacin del conocimiento del negocio
se integran desde el entorno operacional.

3.- Histrico: el tiempo es parte implcita de la informacin contenida en un datawarehouse. En los


sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el
momento presente.

4.- No voltil: el almacn de informacin de un datawarehouse existe para ser ledo, pero no
modificado.