You are on page 1of 52

Universidad Tecnológica Nacional

Facultad Regional Tucumán

2

pcigliuti@frba.utn.edu.ar
@pabcig
http://mundobi.com.ar (@mundo_bi)

3

Módulo Temas
Conceptos iniciales – Desafíos - Ventajas de BI en la
organización – Inteligencia de negocios y cultura
Módulo 1 empresarial - Los 5 estilos – Data Warehouse –
Introducción a BI Arquitectura de BI – Sistemas OLAP vs. OLTP – Modelo de
madurez – Etapas en un proyecto de BI – Equipos de BI
Toma de requerimientos – Hechos, Dimensiones, Atributo
– Modelado dimensional – Ventajas – Datamarts -
Dimensiones Conformadas - Método de la matriz –
Módulo 2 Introducción a la bases de datos -Tablas de Hechos –
Diseño de DW Tablas look up – Esquema estrella y copo de nieve -
Claves surrogadas – Granularidad - Técnicas de
modelado: SCD, Dimensiones gigantes , Junk Dimensions.
- Tunning

Módulo Temas
Revisión de requerimientos –Estructura de datos de un
ETL - Área de Staging – Flujo de datos: Extracción,
Módulo 3
Limpieza, Carga – Implementación y operación del ETL –
ETL
Responsabilidades – ETL en tiempo real – Conclusiones

Metadata – Creación de atributos, métricas - Jerarquías –
Drill – Creación de Reportes – Funciones de agregación –
Módulo 4
Consumo de información – Modelo de gobernanza – BI
Implementación
Framework - Tableros de comando

Herramientas en el mercado – Tendencias: GeoBI, Redes
Módulo 5 Sociales y BI, BI Saas, Bases de datos orientadas a
Actualidad columnas, Big Data

.

almacenar. y distribuir información para las operaciones y actividades de dirección y control (decisiones) de la organización en cuestión. procesar.” Decisiones Conocimiento Información Datos .”Conjunto de subsistemas relacionados entre sí encargados de recopilar.

 Las organizaciones actuales cuentan con múltiples Sistemas Operacionales.. algunos especializados en un aspecto en particular del Negocio o Foco y administran gran cantidad de datos y cierta información.  Los Organismos actulaes han visto aumentada su capacidad de generar y recolectar datos. 8 .

 Falta de confidencialidad / Acceso irrestricto 9 .  Duplicadas e inconsistentes entre los distintos sistemas.  Sin perspectivas temporales o que permitan deducir tendencias. Dispersa en distintas plataformas o sistemas.  Altos volúmenes de datos y baja capacidad de procesamiento y análisis.  Los plazos de entrega de información no son compatibles con las necesidades.

 ”En esta organización tenemos montañas de datos pero no podemos accederlos”  ”Necesitamos manejar libremente los datos”  ”Tienen que hacer esto mucho más fácil para la gente de negocio”  ”Sólo quiero ver lo que es importante”  ”No es posible que me reuna con dos personas que tienen el mismo indicador con distintos valores”  ”El área X tiene la información que necesito pero no me la brinda.” 10 .

” (TDWI) ”La transformación de los datos de la compañía en conocimiento para obtener una ventaja competitiva. tecnologías y herramientas necesarias para transformar datos en información. ”Procesos. información en conocimiento. y conocimientos en planes que nos lleven a tomar una acción de negocio rentable.” (Gartner) ”Conjunto de procesos y herramientas orientadas al análisis de información para la ayuda a la toma de decisiones ” Datos -> Información -> Conocimiento -> Decisiones .

12 . para investigación y análisis. Acceso directo a la info.  Consolidación de información interna y externa.  Acceso a grandes volúmenes de información.  Posibilidad de realizar comparaciones con la competencia.  Datos definidos y organizados según los términos de negocio.  Posibilidad de medir la calidad en algunos procesos.  Poder responder a cuestiones específicas sin necesidad de realizar aplicaciones especiales.

Lograr una visión integral del negocio 3. Poder acceder a la información que necesito en el momento adecuado . Ventas Tener una única verdad Marketing Ventas Marketing RRHH Finanzas RRHH Finanzas 2. Los 3 desafíos 1.

Advanced Reporting ANALYSIS Análisis más sofisticados Multidimensional Analysis (OLAP) Enterprise Reporting REPORTING Scorecards & MONITORING Dashboards Alertas & Notificaciones Proactivas Más Usuarios .

Tableros • Consumo facil de información con tacómetros • Vista integrada de los datos de toda la empresa Scorecards • Usando Metodologías formales • Drill Down para ver Performance Scorecards de Grupos/Empleados Managed Metrics • Permite a todos monitorear las métricas que a cada uno le interesa • Indicación Inmediata de cuando se requiere accionar .

Reportes Operacionales Print-perfect • Via Web e Impresión • Facil navegación a través de cientos de páginas de reportes • Prompts que permiten a los usuarios definir el contenido Reportes de Negocios Pixel-perfect • Creado por usuarios de negocio. no por el departamento de sistemas • Tablas y gráficos integrados Page-perfect Invoices and Statements • On-line Billing Applications • Statements • Other Page Forms .

Cortar y extraer con un análisis OLAP Ventas de computadoras portatiles Para todo el 2005 Todas las regiones Geografía Ventas de Electrodomésticos Productos Para todo el 2004 y Q1 2005 Todas las tiendas en la Región NE Ventas y Costos Totales Para Enero 2004 y Enero 2005 Las Top 10 tiendas con mayores ventas .

Eventos. Al dispositvo preferido Detalle abriendo los adjuntos o Reglas de Negocio De cada usuario Clickeando los Web links El Radar Personalizado de Información constantemente Revisa la Base de Datos . Radar Personalizado de Información Revisar los datos Las Alertas se disparan Reportes y Alertas son enviados Los usuarios pueden conocer más En la Base de Datos Basadas en Agendas.

Clustering Algoritmos Arbol de Algoritmos. Regresiones Multi- Variables Notar ambas Predicción Lineal y Lineas de Predicción Estacional . Análisis Predictivo Básico Análisis Predictivo Avanzado Basado en Técnicas de Regresión Basado en Técnicas de Data Mining Alcanzar las Ventas Mantenerse en el presupuesto DETERMINAR Responder QUIEN ES Comprar CAPAZ DE … Defraudar Ser Rentable Puntual Redes Neuronales.

Estratégico CEO BSC Directores Dashboard Táctico Gerentes de negocio Reportes Adhoc Tablero Analistas Reportes Operativo Consumidores de Alertas Información La cantidad de uso que se le de en las áreas dependerá de la cultura de la organización .

Tipo de Info / Características Deseable Contenido Estratégico Estratégica •Todas las áreas •Solo por •Poco detalle excepción. •En cualquier lugar Táctica / •Foco en su área. •Historia completa y Táctico Departamental •Reportes de evaluación de libre acceso •Análisis largo plazo •Consultas libres y complejas Operativo •Minuto a minuto •Casi on-line •Poca historia (algunos •Falencia de los Operativo meses) sistemas •Consultas pre operacionales determinadas 21 .

y Presentar la información. completos.  Publicar Datos (limpios. Analizar.. luego conocer.  Herramientas para Consultar. 22 .  Consistencia.)  Utilizar la información. integros. luego cambiar. Tener acceso a los datos corportativos / organizacionales..

Arquitectura BI Datos Entendimiento Acción A B C • ERP • Ventas • RRHH • POS DW • WEB • Mercado MD A Datos: Centralizar información de multiples fuentes en un Data Warehouse B Entendimiento: Herramientas de BI y DM para analizar y mejorar el entendimiento del negocio C Acción: Actuar sobre los hallazgos realizados en el análisis .

etc. facebook.  Excel / Archivo de Texto: Archivos como salida de otros sistemas. o archivos creados a mano. o porque aprovecho la info. como podría ser COPLAN. Fuentes de datos  OLTP: sistemas utilizados para la operatoria del negocio.0: aprovechar la información de redes sociales: twitter. . ya limpia.  Web 2.  Otros DW: porque se encuentran en otro lugar.

variable en el tiempo.“Es un repositorio de datos integrado. organizado de forma tal que facilita el análisis de grandes volúmenes de datos para la toma de decisiones” Etapas . orientado al negocio. no volátil.

archivos planos. • Los datos tienen el nivel de detalle y estructura necesarios para los que toman decisiones. • La fecha es un dato fundamental. (unificación de formatos. para poder analizar en el tiempo. Integrado • Información proveniente de sistemas heterogéneos. excels. etc. códigos.) • Procesos de integración de datos y limpieza de información. • El tiempo de conservación de los datos es mayor que en sistemas transaccionales. .  Orientado al negocio • Los datos están organizados y presentados como se manejan en el negocio. etc.  Variable en el tiempo • Es un repositorio de datos históricos.)  No volátil • Los datos perduran en el tiempo. (BD. Sólo inserts y updates.

Arquitectura BI • Tener una única verdad • Lograr una visión integral del negocio • Poder acceder a la información que necesito en el momento adecuado .

. modificaciones y procesos instantáneos). bajas.  Sistemas OLAP (On Line Analitical Process) Sistemas preparados para atender consultas complejas y de grandes volúmenes de datos.OLTP y OLAP  Sistemas OLTP (On Line Transactional Process) Sistemas preparados para realizar transacciones en tiempo real (altas.

.

OLTP vs OLAP OLTP OLAP Alineados por aplicación o Integrados y alineados en dimensiones que Alineación e funcionalidad dentro de la tienen sentido para el analisis que requiere Integración de aplicación. no integrados el negocio Datos Actualización online Actualización batch (ETL) Disponibilidad de datos Disponibilidad de datos históricos recientes o de períodos de tiempos cortos Mantenimiento El acceso a los datos es de tipo El acceso a los datos es de tipo analítico transaccional (read only) (read/write/update) Uso Información detallada y no redundante orientada a Información agregada y redundante favorecer la operación transaccional estructurada para favorecer el análisis .

Sistemas OLAP – ROLAP (OLAP Relacional): se implementan sobre base de datos relacionales. • ERP • Ventas • RRHH DW • POS • WEB • Mercado .

• ERP • Ventas • RRHH DW • POS • WEB • Mercado .Sistemas OLAP – MOLAP (OLAP Multidimensional): se implementan sobre estructuras de almacenamientos específicas orientadas a consultas y técnicas de compactación de datos.

Sistemas OLAP – HOLAP (OLAP Híbrido): utilizan combinación de las 2 tecnologías anteriores. • ERP • Ventas • RRHH DW • POS • WEB • Mercado .

 MOLAP usa técnicas de compresión para guardar datos en el servidor OLAP. Mayor velocidad de acceso a los datos. ocupando menos espacio que en una base relacional. los mismos son guardados en el servidor OLAP en un formato multidimensional y no se necesita acceder al DW  Todos los cálculos son pre generados en el servidor OLAP cuando el cubo es procesado. de esta forma los cálculos complejos que son parte del resultado se obtienen más rápido. (hoy las bases de datos utilizan técnicas de compresión) .

 Si el volumen de datos es grande. Esto se puede evitar realizando procesamiento incremental. el procesamiento de datos puedo tomar mucho tiempo. por lo que se necesita invertir en espacio adicional.  MOLAP guarda una copia de los datos relacionales en el servidor OLAP. . consumiendo recursos del sistema. Se necesita procesamiento extra para la actualización de datos.

 Permite ver datos casi en tiempo real  Debido a que no es necesario replicar los datos. . con lo cual no hay límites de crecimiento. se necesita menos espacio.  En una solución ROLAP todos los datos se almacenan en la base de datos.

.  Se debe mantener siempre conexión a la base de datos. La respuesta de las consultas es más lenta debido a que siempre tiene que ir a la base relacional a buscar los datos.

 Orientados a Focos analíticos específicos.  Muy común para áreas operativas.  Apunta a las necesidades de información de un grupo de personas Data Warehouse Data Marts Corporativo Departamental Visión Homogénea Visión Parcial 38 .

compartido •Departamental •Cruza toda la empresa •Orientado a proceso de negocio •Múltiples BD con datos redundantes Perspectiva de los •Detallados e históricos •Detallado (algo de historia) datos •Poca sumarización •Sumarizado •Suavemente desnormalizado •Fuertemente desnormalizado Temas •Múltiples áreas temáticas •Única y múltiples áreas temáticas parciales. Data Warehouse Data Marts Alcance •Neutral a las aplicaciones •Requerido por una aplicación específica. datos externos •Snapshot de BD OLTP 39 . •Centralizado. Fuente de datos •Muchas •Pocas •Operacionales. datos externos •Operacionales.

 Contienen una única área temática. Son pequeños  Son menos complejos de construir y más rápido de obtener que un DW.  Son más flexibles que los DW  Son un nuevo concepto 40 .  Son escalables a un DW  Pueden ser dinámicamente integrados para formar un DW.

Estratégico del DW)  Integrado  Volátil – No histórico  Con información reciente  Detallado 41 . Contiene información Operacional  De carácter Tático (vs.

Data Warehouse ODS Estática Dinámica Histórica Actual / Reciente Detalla / Sumarizada Detallada Estratégica Táctica 42 .

.

• Esto frustra a los usuarios y pierden credibilidad en IT ya que no les puede dar acceso a la información necesaria.Management Reporting • Reporter estáticos compartidos en la empresa. • IT no puede responder rápidamente a los pedidos. • IT termina sacando datos de las bases de datos y cargándole la información en planillas excels o bases locales. .

Spreadsheets • Bases y excels locales (de escritorio) • Cada uno contiene un conjunto de datos. . • Son difíciles de erradicar porque se tiene sobre ellos gran control a un costo muy bajo. • Como son fáciles de crear. • Los spreadmarts dificultan a los ejecutivos a tener una foto clara y consistente de la organización. Esto dificulta pasar a la próxima etapa. métricas y reglas y no está alineado con ningún otro excel o sistema. de bajo costo y fáciles de usar proliferan a lo largo de la empresa.

• Un datamart es una estructura de datos analítica y compartida que por lo general a una única área o proceso de negocio. • La información de estos datamart es consumida con alguna aplicación OLAP o reportes parametrizables. • Lo que se necesita es un mecanismo para integrar los datamarts sin poner en peligro la autonomía local.• Los departamentos reconocen la necesidad de proveer de información a todos los empleados. • Satisfacen muy bien las necesidades locales pero no puedo cruzar información de diferentes áreas. • Cada datamart soporta una única definición y regla de negocio y son nutridos directamente de los sistemas fuentes. .

. • Lo mas común es crear un DW con datamart dependientes lógicamente en la misma base. • Para monitorear la info se comienza a utilizar dashboards donde se puede ver información cruzada y alertas. reglas de negocio y dimensiones para poder integrar toda la info. • Ahora se puede realizar análisis cruzando información de diferentes departamentos. Data Warehouse • Los departamentos comienzan a reconocer la necesidad de estandarizar definiciones.

Entrprise Data Warehouse • Aunque el DW resuelva la mayoría de los problemas. Muchas compañías tienen varios DW. no soluciona el problema de los siles. • El ROI se empieza a repagar . • Así como pasaba con los spreadmars los diferentes dw son inconsistentes creando barreras para que la información fluya.

• Pero todavía hay muchas oportunidades. . • El trabajo ya está hecho. BI Services • El data warehouse se volvió una herramienta estratégica para el negocio.

50 .

Diseño Selección Arquitectura productos e instalación Definición de Integración Mantenimiento Planificación Modelo Diseño Diseño Requisitos Y del proyecto proyecto Dimensional Físico ETL del Despliegue Negocio Especificación Desarrollo Aplicación Aplicación Usuario Usuario .

utn.ar @pabcig http://mundobi.Ing.com.edu. Pablo Cigliuti pcigliuti@frba.ar (@mundo_bi) .