You are on page 1of 29

Isis Lay 12003204 Carlos Escobar 12003202

ndice

Introduccin Componentes de BI Fuentes de Informacin Calidad de datos ETL DWH Data Marts Herramientas de BI OLAP Datamining Visualizacin Preguntas Conclusin Recomendacin Bibliografa

Introduccin
Actualmente, gran nmero de compaas requieren una adecuada toma de decisiones, por lo que la informacin que se quiere investigar sobre los diferentes elementos de la organizacin se encuentran en bases de datos u otras fuentes que posee la empresa. Es por ello que nace la necesidad de un esquema de solucin de BI. Cul es la informacin requerida para gestionar y tomar decisiones? Cul debe ser el formato y composicin de los datos a utilizar? De dnde proceden esos datos y cual es la disponibilidad y periodicidad requerida?

Componentes de BI

Componentes de BI
Fuentes de informacin

Alimentan de informacin el DWH Extraccin, transformacin y carga de los datos en el DWH. Los datos se transforman, limpian, filtran y redefinen Almacena los datos logrando su flexibilidad, facilidad de acceso y administracin Herramientas de visualizacin, anlisis y navegacin

ETL

DWH

Herramientas

OLAP

Clculos, consultas, planeamiento, pronostico y anlisis de escenarios en big data

Fuentes de informacin
Departamentales

Operacionales

Externas

ETL

Fuentes de informacin
Sistemas operacionales Sistemas departamentales Fuentes externas

ERP CRM SCM


Legacy

Previsiones

Estudios de mercado ndices de la industria Estadsticas y censos

Presupuestos

Hojas de clculo Otros

WWW

Calidad de los datos


Totalidad Coherencia Validez

Integridad

Disponibilidad

Precisin

Calidad

Accesibilidad

Extraccin, transformacin y carga (ETL)


Extraccin
Recuperar los datos fsicamente de las fuentes de informacin. Datos en bruto

Limpieza
Transformacin Integracin

Corregir errores, eliminar duplicados, completar vacos.


Estructurar y sumariar los datos en modelos de anlisis de las reas. Validar la consistencia e integrar en distintos modelos de datos Aadir nuevos datos al DWH

Actualizacin

Proceso de limpieza de datos


Depurar
Identifica y asla elementos individuales: Separa nombre completo en nombre, primer apellido, segundo apellido. Corrige valores individuales usando algoritmos Comprueba direccin y cdigo postal correspondiente Transforma valores en formatos definidos y consistentes. Busca y relaciona los registros, corrigindolos y estandarizndolos. Elimina duplicados.

Corregir

Estandarizar

Relacionar

Consolidar

Analiza e identifica relaciones entre registros relacionados y los consolida

Herramientas de ETL
Transforma -cin Extraccin Carga

Gestin de Metadata

Servicios de transporte

Diseo grfico

ETL

Administracin y operacin

Datawarehouse (DWH)
Hugh J. Watson Un Datawarehouse es una coleccin de informacin creada para soportar las aplicaciones de toma de decisiones
Bill Inmon Es un conjunto no voltil de informacin que soporta la toma de decisiones, Orientado sobre un rea, integrado al tiempo. Ralph Kimbal El Datawarehouse da acceso a la informacin de la corporacin o rea funcional. El alcance del Datawarehouse puede ser bien un departamento o bien corporativo.

Datawarehouse (DWH)
Hugh J. Watson Datawarehousing es el proceso completo de extraer informacin, transformarla y cargarla en un Datawarehouse y el acceso a esta informacin por los usuarios finales y las aplicaciones Sharon Sibigthroth Descubres el valor real de un Datawarehouse cuando alguien puede encontrar los detalles importantes en la informacin, y te dice algo que puede generar la diferencia.

Data Marts Dependientes


Fuentes de datos

Datawarehouse

Data Marts

Data Marts Independientes


Fuentes de datos

Data Marts

Estrategias de construccin de un DWH


W.H Inmon Definir un DWH corporativo y a partir de l ir construyendo los modelos de anlisis para los distintos niveles y departamentos de la organizacin; es decir, una estrategia de arriba abajo, desde la estrategia a lo ms operativo. R. Kimball Construir distintos Data Marts que cubran las distintas necesidades de la organizacin, sin la necesidad de construir un Datawarehouse.

Componentes y factores de DWH


Metadata
Informacin de la informacin. Contiene el significado de los componentes que residen en el Datawarehouse (o Data Mart) y sus atributos. Es til para tecnologa y los usuarios funcionales.

Operational Data Store (ODS)

Consolidan datos de distintas fuentes y sistemas no integrados y facilitan un acceso online integrado sobre esa informacin. Proporciona informacin integrada con el fin de facilitar la toma de decisiones en entornos operacionales. Sus datos son voltiles (dos o tres meses) y se actualizan en tiempo real. Es una fuente de datos para el DWH. 1. Tamao y volumen de datos del Datawarehouse 2. Complejidad de los esquemas de datos. 3. Nmero de usuarios concurrente. 4. Complejidad de las consultas

Factores para implementar DHW

Gestin del Datawarehouse

Los usuarios de negocio necesitan tomar decisiones por lo que debemos asegurar: 1. Alta disponibilidad. 2. Rendimiento. 3. Copias de seguridad y recuperacin. 4. Recuperacin fsica en caliente.

Herramientas de BI
Herramienta Generadores de informes Herramientas de usuario final de consultas e informes Herramientas OLAP Descripcin Utilizadas por desarrolladores profesionales para crear informes estndar para grupos, departamentos o la organizacin. Empleadas por usuarios finales para crear informes para ellos mismos o para otros; no requieren programacin. Permiten tratar la informacin de forma multidimensional para explorarla desde distintas perspectivas y periodos de tiempo. Muestran informacin crtica de rendimiento utilizando iconos grficos pudiendo ver ms detalle e informes.

Herramientas de Dashboard y Scorecard

Herramientas de BI
Herramienta Herramientas de planificacin, modelizacin y consolidacin Herramientas Datamining Descripcin Permiten crear planes de negocio, simulaciones, planificacin, presupuestos, previsiones, etc. Proveen a los dashboards y Scorecard de objetivos y umbrales de las mtricas Permiten crear modelos estadsticos de las actividades de los negocios. Descubren e interpretan patrones desconocidos en la informacin para resolver problemas de negocio.

Procesamiento analtico en lnea (OLAP)


FAST

ANALYSIS

SHARED

MULTIDIMENSIONAL

Tipos de OLAP
Tipo Relational OLAP (ROLAP) Multimensional OLAP (MOLAP) Descripcin Acceden directamente a la base de datos relacional. No tiene limitaciones en cuanto al tamao, pero es ms lento que MOLAP. Accede directamente a una base de datos multidimensional. Es muy rpida en los tiempos de respuesta, pero si queremos cambiar las dimensiones, debemos cargar de nuevo el cubo

Hybrid OLAP (HOLAP)

Accede a los datos de alto nivel en una base de datos multidimensional y a los atmicos directamente sobre la base de datos relacional. Utiliza las ventajas del ROLAP y del MOLAP.

Desktop OLAP (DOLAP)

Crea un cubo en la memoria del ordenador y cuando finaliza lo elimina de memoria. El usuario slo recibe y analiza las dimensiones en los que est interesado y en forma local.

Datamining

Visualizacin

Usuarios de herramientas de BI

Preguntas captulo 04
Que entendemos por proceso ETL? Cul es la utilidad de los Datawarehouse o almacenes de datos? Qu son los Data Mart? En que consisten los cubos OLAP?

Conclusiones

BI se compone de diversos elementos, como lo son: Fuentes de informacin Herramientas de ETL Data Warehouse y Data Mart Herramientas de BI

Queries y reports OLAP Interfaz y visualizacin (Scorecards y Dashboards) Data Mining

Gracias a BI, podemos identificar lo que est pasando, entender por qu pasa, ayudar a predecir que va a pasar y tomar las medidas necesarias.

Recomendaciones

Adecuada planificacin Contemplar elementos como la informacin que se necesita Detallar el uso de la misma, Determinar a quien va dirigido Analizar minuciosamente los aspectos tcnicos como lo son
tiempo de respuesta, integracin, seguridad, navegacin, entorno grfico.

Bibliografa

Cano, Josep. 2007. Business Intelligence: Competir con Informacin. Espaa, Barcelona. Banesto, Fundacin Cultural.