You are on page 1of 14

0

Instituto Tecnolgico de San Juan del Ro Materia: Tpicos Avanzados de Bases de Datos

Tema: Mercados de Datos (DataMart) P RE S E N T AN:


1) 2) 3) 4) 5) Gustavo Guzmn Resndiz. Gerardo Gutirrez de Santiago. Ivn Herrera Evangelista. Rubn Jimnez Loredo. Joel Alberto Prez Rivera.
San Juan Del Ro, Qro. , Octubre de 2011.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

NDICE.
1.-MERDADO DE DATOS (DATAMART) ..................................................................................... 2

3.3.1. Definicin y conceptos. ........................................................................................ 2


2.-FASES DE CONSTRUCCION ...................................................................................................... 4 2.1.- Anlisis ....................................................................................................................................... 4 2.2.-Construccin ................................................................................................................................ 6 2.3.-Diseo .......................................................................................................................................... 7 3.-TECNOLOGIAS ............................................................................................................................ 9 3.1 Herramientas Front-End ................................................................................................................ 9 3.2 Herramientas de B.D. .................................................................................................................. 10 4.- PROCESO DE DISEO DE CONSULTAS ............................................................................... 11 3.-CONCLUSIN ............................................................................................................................. 12 3.-BIBLIOGRAFIA .......................................................................................................................... 13

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

1.-MERDADO DE DATOS (DATAMART)

3.3.1. Definicin y conceptos.


Para poder entender mejor el concepto de Data Mart se tendr que tener un conocimiento bsico de:

Modelado dimensional. Es una tcnica de diseo lgico que busca presentar


la informacin en un marco estndar e intuitivo que permita un acceso de alto rendimiento. Este tipo de modelado es independiente de las tecnologas y permite el empleo de cualquier base de datos, ya sea relacional.

BI (Business Intelligence). Se refiere principalmente al equipo basado en las


tcnicas utilizadas en la identificacin, extraccin, y el anlisis de los datos de negocio, tales como los ingresos por ventas de productos y / o departamentos, o por los costos asociados y los ingresos.

Cubos OLAP. Es una base de datos multidimensional, en la cual el


almacenamiento fsico de los datos se realiza en un vector multidimensional. Los cubos OLAP se pueden considerar como una ampliacin de las dos dimensiones de una hoja de clculo.

OLTP. Es la sigla en ingls de Procesamiento de


Transacciones En Lnea (OnLine Transaction Processing) es un tipo de sistemas que facilitan y administran aplicaciones transaccionales, usualmente para entrada de datos y recuperacin y procesamiento de transacciones (gestor transaccional).

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

ETL. Extract, Transform and Load (Extraer, transformar y cargar en ingls) es


el proceso que permite a las organizaciones mover datos desde mltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.

Una consulta MDX. Es muy similar a una consulta SQL, nos devuelve un
conjunto de celdas, que es resultado de tomar un subconjunto de las celdas del cubo original.

Data Mining o La minera de datos (DM). Consiste en la extraccin no


trivial de informacin que reside de manera implcita en los datos. Dicha informacin era previamente desconocida y podr resultar til para algn proceso. En otras palabras, la minera de datos prepara, sondea y explora los datos para sacar la informacin oculta en ellos.

Si una empresa u organizacin trabaja con grandes volmenes de datos sin explotar este tema ser de inters. Datamart: De manera sencilla se podr decir que es un gran almacn de datos al cual se puede consultar rpidamente. Si escuchaste antes DataWarehouse se define como lo mismo simplemente que el Datamart es a un nivel ms pequeo (reas, jefaturas, etc.) y el Datawarehouse es a nivel de toda la empresa. Datamart tiene como propsito de ayudar a que un rea especfica dentro del negocio pueda tomar mejores decisiones.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

4 Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de mltiples formas para que diversos grupos de usuarios realicen la explotacin de los mismos de la forma ms conveniente segn sus necesidades. Es consultado mediante herramientas OLAP (On line Analytical Processing - Procesamiento Analtico en Lnea) que ofrecen una visin multidimensional de la informacin. Sobre estas bases de datos se pueden construir EIS (Executive Information Systems, Sistemas de Informacin para Directivos) y DSS (Decision Support Systems, Sistemas de Ayuda a la toma de Decisiones). Por otra parte, se conoce como Data Mining al proceso no trivial de anlisis de grandes cantidades de datos con el objetivo de extraer informacin til, por ejemplo para realizar clasificaciones o predicciones. Se caracteriza por disponer la estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por s mismo un compendio de distintas fuentes de informacin.

2.-FASES DE CONSTRUCCION

2.1.- Anlisis 2.1.1 Ventajas de los Data mart.


Poco volumen de datos Mayor rapidez de consulta Consultas SQL y/o MDX sencillas Validacin directa de la informacin Facilidad para la historizacin de los datos

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

2.1.2 Razones para crear un data mart.


Fcil acceso a los datos que se necesitan frecuentemente. Crea vista colectiva para grupo de usuarios. Mejora el tiempo de respuesta del usuario final. Facilidad de creacin. Costo inferior al de la aplicacin de un completo almacn de datos. Los usuarios potenciales son ms claramente identificables que en un almacn de datos completo.

2.1.3 Para que me sirve.


Conocer a detalle la informacin de la empresa de manera rpida. Ejemplo: Si tienes una empresa que vende podrs saber quin te compra y sobre todo podrs averiguar qu puntos en comn tienen esos compradores y enfocarte. Si eres parte de la gerencia. Al conocer estos datos podrs tomar decisiones a tiempo. Si aplicas a un Datamart algo de Minera de datos podras encontrar nuevos clientes. Es un sistema orientado a la consulta.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

2.1.4 Tipos de datamarts. Datamart OLAP. Se basan en los populares cubos OLAP, que se construyen agregando,
segn los requisitos de cada rea o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creacin, explotacin y mantenimiento de los cubos OLAP es muy heterogneo, en funcin de la herramienta final que se utilice.

Datamart OLTP. Pueden basarse en un simple extracto


del datawarehouse, no obstante, lo comn es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones ms usuales) aprovechando las caractersticas particulares de cada rea de la empresa. Las estructuras ms comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura.

2.2.-Construccin 2.2.1 Construccin del Data Mart:


Esta actividad tiene el objetivo de construir el modelo de datos, la metadata de la herramienta de Explotacin y La Arquitectura del Modelo Multidimensional en la herramienta de explotacin.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

2.2.2 Construccin de los Procesos de Cargas:


En sta actividad es cuando se debe desarrollar los procesos de carga de datos, las rutinas de limpieza, los flujos de cargas de datos, las interfaz de acceso, los importadores e integradores de datos, los programas de entrada de datos, etc.

2.2.3 Construccin de los reportes analticos:


Consiste en construir los reportes, tableros de control, dashboard, scorecard, etc.

2.2.4 Construccin de los procesos de prueba:


Se debe construir los programas, reportes, informes que permita probar los procesos de cargas y los reportes entregados. Modelo Top Down.

2.3.-Diseo
2.3.1 El modelo Top Down
Est basado en la estructura de la Data warehouse, la cual se construye a partir de los datos que se puedan obtener de los diferentes sistemas operacionales o externos (datos aislados) a travs de un proceso de extraccin, transformacin y transportacin (ETT).

Top Down: tiene como base un sistema de Data warehouse para toda la empresa y a partir
de este se desarrollan los Data marts para las divisiones o departamentos.

Modelo Bottom up.


En este modelo los Data marts se construyen a partir de los datos dispersos y la Data warehouse se construye a partir de los Data marts existentes, esta construccin se realiza a travs de dos procesos diferentes de extraccin, transformacin y transportacin. En el primer proceso cada Data mart se construye con los datos aislados que son necesarios para satisfacer las funciones del departamento por medio de los procesos de extraccin, transformacin y transportacin. Un segundo proceso de tratamiento de datos (ETT) ocurre en el sentido de los Data marts hacia la Data warehouse.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

2.3.2 El Modelo Paralelo


El diseo del modelo paralelo se basa en dos alternativas, en la primera se tratan los Data marts con entidades independientes de los Data waehouse y en la segunda, esta independencia se trata de forma temporal. En el primer caso se enfoca la construccin de los Data marts como entidades independientes de la Data warehouse, utilizando el modelo de construccin de esta. Consiste en llevar una construccin paralela entre ambas estructuras, sin definir como padre la Data warehouse sobre el Datamart, ni viceversa.

Modelo Top down con Retroalimentacin. Este modelo incluye la posibilidad de


agregar datos que no estn presentes en la Data warehouse y que se requieran para cumplir con los requerimientos de un anlisis especfico.El uso de la retroalimentacin consiste en incluir nuevos datos a los Data marts de la empresa, como una primera fase y consecuentemente estos cambios ocurridos en el Data mart sean integrados a la Data warehouse como la segunda fase.

2.3.3 Modelo Bottom up con Retroalimentacin.


Permitir que la integracin de los datos e informacin dada en los Data marts se pueda implementar durante la construccin de la Data warehouse.

Modelo Paralelo con Retroalimentacin


El desarrollo principalmente trabaja con la retroalimentacin que tenga el Data mart, ya que su inicio depende de un perodo de ajuste entre ste y el modelo de datos de la Data warehouse. Mientras las entradas y salidas se estn dando en los Data marts, en la Data warehouse estos mismos se estn realizando, dado a las caractersticas de paralelismo que existe entre ellos.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

3.-TECNOLOGIAS
Este tipo de tecnologas, es una solucin completa de reportes para la empresa, que le proporciona un mayor entendimiento de las operaciones de sus negocios, y reduce el tiempo que consumen estas tareas. Esta solucin, consolida datos de mltiples fuentes para darle una perspectiva de las operaciones del centro de contacto de su empresa, y as poder identificar rpidamente los procesos de cambio necesarios.

3.1 Herramientas Front-End


Tambin conocidas como herramientas de acceso a los datos, o herramientas de presentacin. El Front-End, es la parte del software, que interacta con l, o los usuarios.

Algunas Herramientas son: Herramientas de consulta: usan consultas predefinidas, y las capacidades de
informacin incorporadas, para que los usuarios tengan accesos a los datos.

Aplicaciones de usuarios: Muchos programas de aplicacin comunes como Microsoft


Excel; pueden proporcionar acceso front-end, a bases de datos de apoyo.

Herramientas de desarrollo de programas: Muchas instalaciones cliente-servidor,


necesitan aplicaciones front-end especiales personalizados, para sus tareas de obtencin de datos.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

10

3.2 Herramientas de B.D. 3.2.1 Queries Bsicas y Reporting:


En este tipo de herramientas el usuario accede directamente a la estructura de las bases de datos relacionales para construir consultas e informes, va SQL (estndar para el acceso a las bases de datos relacionales). El SQL es un lenguaje muy extendido entre los programadores, pero no tanto entre los usuarios finales. Aunque estas herramientas escondan en cierta forma los comandos del SQL, sigue siendo necesario tener claro el modelo relacional en cuanto se quiere hacer algn informe complejo, por lo que su utilizacin directa no est recomendada a usuarios finales.

3.2.2 Queries y Reporting Avanzado:


Estas herramientas aportan una visin temtica de las bases de datos relacionales (visin de negocio), mediante la cual el usuario final tiene una visin menos tcnica del datamart. Este tipo de herramientas pone una capa de trminos que le son ms familiares a los usuarios finales y establece, las interrelaciones de las tablas del datamart, de forma que sea ms sencillo. Aun as, sigue siendo la estructura relacional bsica la que subyace en estas herramientas. A travs de su interfaz simple al estilo de asistente, Cognos integra bases de datos y aplicaciones de Lotus Notes, el nico producto de inteligencia de negocios que ofrece toda la gama de capacidades de inteligencia de negocios en una arquitectura nica y probada.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

11 4.- PROCESO DE DISEO DE CONSULTAS

El diseo de bases de datos es el proceso por el que se determina la organizacin de una base de datos, incluidos su estructura, contenido y las aplicaciones que se han de desarrollar.

4.1 Palo:
Es un motor orientado a celdas, multidimensional, que est especficamente diseado para mostrar informacin desde Excel, para todo tipo de anlisis.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

12

3.-CONCLUSIN
Una vez estudiado gran parte de lo que es un Data Mart, se lleg a la conclusin que al implementar uno de estos en alguna empresa se podr manejar de una manera casi ptima la informacin como por ejemplo: Si se tiene una empresa que vende se podr saber quin compra y sobre todo averiguar qu puntos en comn tienen esos compradores, al conocer estos datos se podr tomar

decisiones a tiempo, adems si se aplica a un Datamart algo de Minera de datos se podr encontrar nuevos clientes, en pocas palabras es un sistema orientado a la consulta.

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49

13

3.-BIBLIOGRAFIA

http://datamarting.org/info

http://opensourceanalytics.com/2006/03/14/data-mart-vs-data-warehouse-the-greatdebate/

http://www.information-management.com/infodirect/19991120/1675-1.html www.sinnexus.com/business_intelligence/datamart

http://www.cccco.edu/SystemOffice/Divisions/TechResearchInfo/MIS/DataMartandRe ports/tabid/282/Default.aspx

www.swgreenhouse.com

Av. Tecnolgico No. 2 Esq. Av. Paseo Central San Juan del Ro, Qro. Tel: (01.427) 272.4118, 272.4178, 272.8546 Fax: 272.4238 C.P. 76800, Apartado Postal 49