You are on page 1of 3

pueden almacenar.

Los dalos son de inters para el usuario final, el metadato


es de inters para los programas que tienen que manejar estos datos. Sin
embargo, el rol que cumple el metadato en un entorno de almacn de datos
es muy diferente al rol que cumple en los ambientes operacionalcs. En el
mbito de los data warehousc el metadato juega un papel fundamental, su
funcin consiste en recoger todas las definiciones de la organizacin y el
concepto de los datos en el almacn de datos, debe contener toda la
informacin concerniente a:
Tablas
Columnas de tablas
Relaciones entre tablas
J erarquas y Dimensiones de datos
Entidades y Relaciones
Funciones ETL (extraccin, transformacin y carga)
Los procesos de extraccin, transformacin y carga (ETL) son
importantes ya que son la forma en que los datos se guardan en un almacn
de datos (o en cualquier base de datos). Implican las siguientes operaciones:
Extraccin. Accin de obtener la informacin deseada a partir de los
datos almacenados en fuentes exlemas.
Transformacin. Cualquier operacin realizada sobre los datos para que
puedan ser cargados en el data warehousc o se puedan migrar de ste a
otra base de datos.
Carga. Consiste en almacenar los datos en la base de datos final, por
ejemplo el almacn de datos objetivo normal.
Middleware
Middleware es un termino genrico que se utiliza para referirse a todo tipo
de software de conectividad que ofrece servicios u operaciones que hacen
posible el funcionamiento de aplicaciones distribuidas sobre plataformas
heterogneas. Estos servicios funcionan como una capa de abstraccin de
software distribuida, que se sita entre las capas de aplicaciones y las capas
inferiores (sistema operativo y red). El middleware puede verse como una
capa API, que sirve como base a los programadores para que puedan
desarrollar aplicaciones que trabajen en diferentes entornos sin preocuparse
de los protocolos de red y comunicaciones en que se ejecutarn. De esta
manera se ofrece una mejor relacin costo/rendimiento que pasa por el
desarrollo de aplicaciones ms complejas, en menos tiempo.
La funcin del middleware en el contexto de los data warehouse es la de
asegurar la coneclividad entre todos los componentes de la arquitectura de un
almacn de datos.
DISEO DE UN ALMACN DE DATOS
Para construir un Data Warehouse se necesitan herramientas para ayudar a la
migracin y a la transformacin de los datos hacia el almacn. Una vez
construido, se requieren medios para manejar grandes volmenes de
informacin. Se disea su arquitectura dependiendo de la estructura interna de
ios datos del almacn y especialmente del tipo de consultas a realizar. Con este
criterio los datos deben ser repartidos entre numerosos data marts. Para abordar
un proyecto de data warehouse es necesario hacer un estudio de algunos temas
generales de la organizacin o empresa, los cuales se describen a continuacin:
Situacin actual de partida.- Cualquier solucin propuesta de data
warehouse debe estar muy orientada por las necesidades del negocio y
debe ser compatible con la arquitectura tcnica existente y planeada de la
compaa.
Tipo y caractersticas del negocio.- Es indispensable tener el
conocimiento exacto sobre el tipo de negocios de la organizacin y el
soporte que representa la informacin dentro de todo su proceso de toma
de decisiones.
Entorno tcnico.- Se debe incluir tanto el aspecto del hardware
(mainframes, servidores, redes,...) as como aplicaciones y herramientas.
Se dar nfasis a los Sistemas de soporte a decisiones (DSS), si existen
en la actualidad, cmo operan, etc.
Expectativas de los usuarios.- Un proyecto de data warehouse no es
nicamente un proyecto tecnolgico, es una forma de vida de las
organizaciones y como tal, tiene que contar con el apoyo de todos los
usuarios y su convencimiento sobre su bondad.
Etapas de desarrollo.- Con el conocimiento previo, ya se entra en el
desarrollo de un modelo conceptual para la construccin del data
warehouse.
Prototipo.- Un prototipo es un esfuerzo designado a simular tanto como
sea posible el producto final que ser entregado a los usuarios.
Piloto.- El piloto de un data warehouse es el primero, o cada uno de los
primeros resultados generados de forma iterativa que se harn para llegar
a la construccin del producto final deseado.
Prueba del concepto tecnolgico.- Es un paso opcional que se puede
necesitar para determinar si la arquitectura especificada del data
warehouse funcionar finalmente como se espera.
Almacn de datos especial
Almacn de datos especial es una coleccin de datos orientados al tema,
integrados, no voltiles, variantes en el tiempo y que aaden la geografa de los
datos, para la toma de decisiones. Sin embargo la componente geogrfica no es
un dato agregado, sino que es una dimensin o variable en la tecnologa de la
informacin, de tal manera que permita modelar todo el negocio como un
ente holstico, y que a travs de herramientas de procesamiento analtico en linca
(OLAP), no solamente se posea un alto desempeo en consultas
multidimensionales sino que adicionalmcntc se puedan visualizar espacialmente
los resultados.
El almacn de datos especial forma parte de un extensivo Sistema de
Informacin Geogrfica para la toma de decisiones, ste al igual que los SIG,
permiten que un gran nmero de usuarios accedan a informacin integrada, a
diferencia de un simple almacn de datos que est orientado al tema, el Data
warehouse especial adicionalmcntc es C3co-Relacional, es decir que en
estructuras relacinales combina e integra los datos espaciales con los datos
descriptivos. Actualmente es geo-objetos, esto es que los elementos geogrficos
se manifiestan como objetos con todas sus propiedades y comportamientos, y