You are on page 1of 30

Que es Bussiness Intelligence

Podemos definir Business Intelligence como el conjunto de metodologas, aplicaciones y tecnologas que permiten reunir, depurar y transformar datos de los sistemas transaccionales e informacin desordenada en informacin estructurada para su explotacin directa, o para su anlisis y conversin en conocimiento como soporte a la toma de decisiones sobre el negocio.

Una vez defino Bussiness Inteligence a continuacin explicaremos los elementos y su aplicacin.

Datawarehouse
Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar informacin de una o ms fuentes distintas, para luego procesarla permitiendo su anlisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La creacin de un datawarehouse representa en la mayora de las ocasiones el primer paso, desde el punto de vista tcnico, para implantar una solucin completa y fiable de Business Intelligence. La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la informacin (modelos de tablas en estrella, en copo de nieve, cubos relacionales... etc). Este tipo de persistencia de la informacin es homognea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales). El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y se traduce literalmente como almacn de datos. No obstante, y como cabe suponer, es mucho ms que eso. Segn defini el propio Bill Inmon, un datawarehouse se caracteriza por ser: Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La informacin suele estructurarse tambin en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios. Temtico: slo los datos necesarios para el proceso de generacin del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una nica tabla del datawarehouse. De esta forma, las

peticiones de informacin sobre clientes sern ms fciles de responder dado que toda la informacin reside en el mismo lugar. Histrico: el tiempo es parte implcita de la informacin contenida en un datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la informacin almacenada en el datawarehouse sirve, entre otras cosas, para realizar anlisis de tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones. No voltil: el almacn de informacin de un datawarehouse existe para ser ledo, pero no modificado. La informacin es por tanto permanente, significando la actualizacin del datawarehouse la incorporacin de los ltimos valores que tomaron las distintas variables contenidas en l sin ningn tipo de accin sobre lo que ya exista. Otra caracterstica del datawarehouse es que contiene metadatos, es decir, datos sobre los datos. Los metadatos permiten saber la procedencia de la informacin, su periodicidad de refresco, su fiabilidad, forma de clculo... etc. Los metadatos sern los que permiten simplificar y automatizar la obtencin de la informacin desde los sistemas operacionales a los sistemas informacionales. Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido, son: Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su propio lenguaje de negocio, indicando qu informacin hay y qu significado tiene. Ayudar a construir consultas, informes y anlisis, mediante herramientas de Business Intelligence como DSS, EIS o CMI. Dar soporte a los responsables tcnicos del datawarehouse en aspectos de auditora, gestin de las de la informacin para la histrica, administracin a los del datawarehouse, elaboracin de programas de extraccin de la informacin, especificacin interfaces realimentacin sistemas operacionales de los resultados obtenidos... etc. Por ltimo, destacar que para comprender ntegramente el concepto de

datawarehouse, es importante entender cual es el proceso de construccin del mismo,

denominado ETL (Extraccin, Transformacin y Carga), a partir de los sistemas operaciones de una compaa: Extraccin: obtencin de informacin de las distintas fuentes tanto internas como externas. Transformacin: filtrado, limpieza, depuracin, homogeneizacin y agrupacin de la informacin. Carga: organizacin y actualizacin de los datos y los metadatos en la base de datos.

Una de las claves del xito en la construccin de un datawarehouse es el desarrollo de forma gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el almacn de datos a los dems usuarios. Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener y medir resultados a corto plazo.

Principales aportaciones de un datawarehouse


Proporciona una herramienta para la toma de decisiones en cualquier rea funcional, basndose en informacin integrada y global del negocio. Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para encontrar relaciones ocultas entre los datos del almacn; obteniendo un valor aadido para el negocio de dicha informacin.

Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios. Simplifica dentro de la empresa la implantacin de sistemas de gestin integral de la relacin con el cliente. Supone una optimizacin tecnolgica y econmica en entornos de Centro de Informacin, estadstica o de generacin de informes con retornos de la inversin espectaculares.

Datamart
Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por disponer la estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de informacin.

Por tanto, para crear el datamart de un rea funcional de la empresa es preciso encontrar la estructura ptima para el anlisis de su informacin, estructura que puede estar montada sobre una base de datos OLTP, como el propio datawarehouse, o sobre una base de datos OLAP. La designacin de una u otra depender de los datos, los requisitos y las caractersticas especficas de cada departamento. De esta forma se pueden plantear dos tipos de datamarts:

Datamart

OLAP

Se basan en los populares cubos OLAP, que se construyen agregando, segn los requisitos de cada rea o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creacin, explotacin y mantenimiento de los cubos OLAP es muy heterogneo, en funcin de la herramienta final que se utilice.

Datamart

OLTP

Pueden basarse en un simple extracto del datawarehouse, no obstante, lo comn es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones ms usuales) aprovechando las caractersticas particulares de cada rea de la empresa. Las estructuras ms comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de queries (aunque slo es posibles en algunos SGBD avanzados, como Oracle). Los datamarts que estn dotados con estas estructuras ptimas de anlisis presentan las siguientes ventajas: Poco volumen de datos Mayor rapidez de consulta Consultas SQL y/o MDX sencillas Validacin directa de la informacin Facilidad para la historizacin de los datos

OLAP - On-Line Analytical Processing


Los sistemas OLAP son bases de datos orientadas al procesamiento analtico. Este anlisis suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer algn tipo de informacin til: tendencias de ventas, patrones de comportamiento de los consumidores, elaboracin de informes complejos etc. Este sistema es tpico de los datamarts.

El acceso a los datos suele ser de slo lectura. La accin ms comn es la consulta, con muy pocas inserciones, actualizaciones o eliminaciones. Los datos se estructuran segn las reas de negocio, y los formatos de los datos estn integrados de manera uniforme en toda la organizacin. El historial de datos es a largo plazo, normalmente de dos a cinco aos. Las bases de datos OLAP se suelen alimentar de informacin procedente de los sistemas operacionales existentes, mediante un proceso de extraccin, transformacin y carga (ETL).

Datamining (Minera de datos)


El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos, de manera automtica o semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algn significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que surge entre la informacin y ese modelo represente un valor agregado, entonces nos referimos al conocimiento.

Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso comn a todos ellos se suele componer de cuatro etapas principales: Determinacin de los objetivos. Trata de la delimitacin de los objetivos que el cliente desea bajo la orientacin del especialista en data mining. Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining. Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para tener una primera aproximacin. Segn los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia Artificial. Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.

Carga de trabajo en las fases de un proyecto de datamining

En resumen, el datamining se presenta como una tecnologa emergente, con varias ventajas: por un lado, resulta un buen punto de encuentro entre los investigadores y las personas de negocios; por otro, ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios. Adems, no hay duda de que trabajar con esta tecnologa implica cuidar un sinnmero de detalles debido a que el producto final involucra "toma de decisiones".

los KPIs (Key Performance Indicators). Indicadores Claves de Negocio: Diramos que son aquellos indicadores, clculos, ratios, mtricas, etc... que nos permiten medir los factores y aspectos crticos de un negocio. Algunos ejemplos seran las ventas mensuales de las principales lineas de negocio, el coste de las materas primas principales, la evolucin de la masa salarial, el nivel de liquidez, etc... Estos indicadores deben observarse y analizarse dentro del conjunto de dimensiones o ejes representativos del negocio: tiempo, productos, centros de costes, etc... Por ello, los KPIs no son un trmino tecnolgico, generado por el Business Intelligence, si no que se trata de un concepto ligado a la Gestin Empresarial. No obstante, el desarrollo de la tecnologa y de especialidades como el Business Intelligence, han permitido que su medicin, control y respresentacin visual se haga de un modo mucho ms eficiente y rpido. Si pretendemos llevar una gestin eficiente de nuestro negocio, apoyndonos en el uso de herramientas Business Intelligence, y no usamos los KPIs, es como si estuviramos conduciendo por una carretera de montaa de noche sin luces. Normalmente, en la definicin de los KPIs se usa un acrnimo, SMART, que ayuda en el proceso de seleccin de los mismos: - eSpecificos (Specific)

Medibles (Measurable) Alcanzables (Achievable) Realista (Realistic) a Tiempo (Timely)

Datawarehouse.

Arquitectura del Datawarehouse

El siguiente grfico muestra la arquitectura clsica de un Datawarehouse, compuesto por:

Fuentes de Datos Motor del Datawarehouse


o o o o o o

Gestor de Carga Metadatos Agregaciones Gestor del Datawarehouse Gestor de Respaldos DW Repositorio

DataMart
o o

BDD Dimensional Gestor del DataMart

Herramientas de Acceso

En forma resumida la arquitectura puede verse expresada en la siguiente figura :


2

Fuentes de Datos

Cualquier origen de informacin que pueda ser considerado para el datawarehouse, aqu se incluyen los siguientes elementos:

Los sistemas OLTP`s que son los sistemas de Legacy que actualmente operan en la empresa. Datos antiguos provenientes de migraciones. Fuentes externas como otros sistemas de la compaa, sistemas de otras empresas, sistemas de gobierno, internet, etc. Datos de oficina, archivos en formato de Word, Excel, archivos planos, PDFs, mails, etc.

El motor del datawarehouse

Est integrado por los siguientes componentes

Gestor de Carga

Quiz sea uno de los elementos ms importantes para el datawarehouse, generalmente incluye las operaciones de

Extraccin: Es el proceso que accesa a los datos OLTP existentes, en cualquier forma que exista, desde cualquier DBMS en que exista. Tpicamente, extraccin y el siguiente paso, propagacin, son administrados por el mismo producto. No todas las herramientas de extraccin y propagacin soportan todas las plataformas, de tal manera que una faceta importante de la seleccin de herramientas es si la herramienta soporta los sistemas operativos y las bases de datos que se est usando para el datawarehouse.

Propagacin: Es el proceso de mover datos desde los sistemas fuente hacia el sistema objetivo que contendr el data warehouse. El proceso de propagacin toma lugar en tiempo real, o en un calendario predeterminado (batch), o sobre demanda, y puede efectuar un refresco total del warehouse o justo un cambio neto. Cuando se selecciona una herramienta de propagacin, se aspira que sta ofrezca la gestin de cambios netos como tambin refresco total y permitir tanto actualizaciones en tiempo real y calendarizadas (batch).

Depuracin (Limpieza): El nivel lgico cubre problemas de valores de datos que son inconsistentes dentro de la informacin importada (ejemplo, clientes con estado casado, pero con una edad de 3 aos). El nivel tcnico evala problemas de informacin tales como campos no inicializados o valores invlidos en los datos importados (ejemplo, valor de la fecha Febrero 31).

Transformacin: Convierte datos desde su formato OLTP al apropiado formato del datawarehouse ejecutando funciones tales como desnormalizacin de datos, traduciendo cdigos hacia texto significativo, convirtiendo una variedad de formatos de fechas hacia un formato estndar, convirtiendo texto tal como nombres de ciudades hacia texto estndar y renombrando campos desde nombres tcnicos no significativos hacia nombres significativos que un usuario final entender.

Carga: Los datos fuentes normalmente son extrados y almacenados en archivos temporales tipo texto, los mismos que deben ser cargados a la base de datos del

datawarehouse. La figura resume el proceso de carga, los archivos temporales finalmente son colocados en la base de datawarehouse de destino.

El mdulo de Gestor de Carga tambin es conocido como Integrador, y es muy importante tanto en la Fase de Construccin como en la Fase de Explotacin de un DataWarehouse.

Confiabilidad de los datos

La data "sucia" es peligrosa. Las herramientas de limpieza especializadas y las formas de programar de los clientes proporcionan redes de seguridad.

No importa cmo est diseado un programa o cun hbilmente se use. Si se alimenta mala informacin, se obtendr resultados incorrectos o falsos. Desafortunadamente, los datos que se usan satisfactoriamente en las aplicaciones de lnea comercial operacionales pueden ser basura en lo que concierne a la aplicacin data warehousing.

Los datos "sucios" pueden presentarse al ingresar informacin en una entrada de datos (por ejemplo, "Sistemas S. A." en lugar de "Sistemas S. A.") o de otras causas. Cualquiera que sea, la data sucia daa la credibilidad de la implementacin del depsito completo. A continuacin, en la Figura se muestra un ejemplo de formato de ventas en el que se pueden presentar errores.

Afortunadamente, las herramientas de limpieza de datos pueden ser de gran ayuda. En algunos casos, puede crearse un programa de limpieza efectivo. En el caso de bases de datos grandes, imprecisas e inconsistentes, el uso de las herramientas comerciales puede ser casi obligatorio.

Decidir qu herramienta usar es importante y no solamente para la integridad de los datos. Si se equivoca, se podra malgastar semanas en recursos de programacin o cientos de miles de dlares en costos de herramientas.

La limpieza de una data "sucia" es un proceso multifactico y complejo. Los pasos a seguir son los siguientes:

1. Analizar sus datos corporativos para descubrir inexactitudes, anomalas y otros


problemas.

2. Transformar los datos para asegurar que sean precisos y coherentes.

3. Asegurar la integridad referencial, que es la capacidad del data warehouse, para


identificar correctamente al instante cada objeto del negocio, tales como un producto, un cliente o un empleado. 4. Validar los datos que usa la aplicacin del data warehouse

Meta Datos

Esta rea del warehouse almacena todas las definiciones de los meta datos (datos acerca de los datos) usados por todos los procesos en el warehouse. Los meta datos son usados para una variedad de propsitos incluyendo:

Los procesos de extraccin, transformacin y carga (meta datos es usado para mapear las fuentes de datos a una vista comn de la informacin dentro del warehouse). Los procesos de gestin del warehouse (cada tabla es descrita incluyendo su estructura, ndices, vistas; meta datos es usado tambin para automatizar la produccin de tablas resumen). Como parte de los procesos de gestin de consulta (meta datos es usado para dirigir una consulta a la fuente de datos ms apropiada)

Agregaciones

Este componente del warehouse almacena todos los datos agregados, predefinidos y generados por el gestor del warehouse.

El propsito de informacin resumida es para mejorar el rendimiento de las consultas. Aunque hay costos operacionales incrementados asociados con la agregacin inicial de los datos, esto debera ser compensado eliminando el requerimiento para ejecutar continuamente operaciones de agregacin (tales como clasificacin o agrupacin) en las respuestas a las consultas de los usuarios. El dato agregado es actualizado continuamente en la medida que nuevos datos son cargados en al warehouse.

Gestor del Datawarehouse

En algunos casos el gestor del warehouse tambin genera perfiles de consultas para determinar qu ndices y agregaciones son apropiadas. Un perfil de consulta puede ser generado para cada usuario, grupo de usuario, o el data warehouse y est basada en la informacin que describe las caractersticas de las consultas tales como la frecuencia, tablas objetivo, y tamao de los results set.

Gestor de Respaldos

Es el componente que se encarga de respaldar constantemente la informacin del repositorio del datawarehouse.

Repositorio del Datawarehouse

Es el repositorio en si o la base de datos fsica donde se almacena la informacin del datawarehouse.

Un DBMS para trabajar con un sistema de Datawarehouse debe cumplir con los siguientes requerimientos

Rendimiento de carga

Datawarehouse requiere de carga incremental de nuevos datos en una base peridica dentro de ventanas de tiempo pequeas El rendimiento de procesos de carga debera ser medido en cientos de millones de filas o gigabytes de datos por hora y no debera haber un lmite mximo que restringa al negocio

Procesamiento de carga

Muchos pasos deben ser dados para cargar un dato nuevo o actualizado hacia el datawarehouse incluyendo conversin de datos, filtrado, reformateado, chequeos de integridad, almacenamiento fsico, indexacin y actualizacin de los meta datos Aunque cada paso en la prctica puede ser atmico, el proceso de carga debera parecer que se ejecuta como una unidad de trabajo nica.

Gestin de calidad de los datos

El datawarehouse debe asegurar consistencia local, consistencia global e integridad referencial a pesar de las fuentes "sucias" y tamaos masivos de bases de datos la preparacin y carga son pasos necesarios, ellos no son suficientes. La habilidad para responder a las consultas de los usuarios finales es la medida del xito para una aplicacin de datawarehouse.

Mientras ms preguntas son respondidas, los analistas tienden a solicitar preguntas ms complejas y creativas

Anlisis dimensional integrado

La potencia de vistas multidimensionales es ampliamente aceptada y soporte dimensional debe ser inherente en el RDBMS warehouse para proveer el ms alto rendimiento para herramientas OLAP relacional. El RDBMS debe soportar creacin rpida y fcil de resmenes comunes precalculados en grandes datawarehouses, y proveer herramientas de mantenimiento para automatizar la creacin de estos agregados precalculados

Cubos Dimensionales

Un modelo de datos multidimensional soporta el manejo de una basta cantidad de datos empresariales y temporales. De esta forma surge la instancia del modelo multidimensional, tambin conocido como cubo o hipercubo.

Para clarificarlo un poco se puede imaginar un cubo con tres dimensiones: producto, tiempo, regin; donde cada dimensin tiene diferentes niveles o hechos, para finalmente intersectar estos valores y obtener una medida.

La medida es el ndice de un producto como puede ser el huevo en el mes de mayo y en la zona centro del pas.

Herramientas de Acceso Herramientas de Usuario Final

Estas herramientas pueden reunirse en 4 grupos

Herramientas de Minera de Datos

Herramientas de Procesamiento Analtico en Lnea (OLAP) Herramientas de Desarrollo de Aplicaciones Herramientas de Reportes y Consultas

Establecer las reas de aplicacin de un Data Warehouse.


Cuando diseamos la arquitectura de un sistema de Data Warehouse nos hemos de plantear los diferentes entornos por los que han de pasar los datos en su camino hacia su Data mart o cubo de destino. Dada la cantidad de transformaciones que se han de realizar, y que normalmente el DWH, adems de cumplir su funcin de soporte a los requerimientos analticos, realiza una funcin de integracin de datos que van a conformar el Almacn Corporativo y que van a tener que ser consultados tambin de la manera tradicional por los sistemas operacionales, es muy recomendable crear diferentes reas de datos en el camino entre los sistemas origen y las herramientas OLAP. Cada una de estas reas se distinguir por las funciones que realiza, de qu manera se organizan los datos en la misma, y a qu tipo de necesidad puede dar servicio. El rea que se encuentra 'al final del camino' es importante, pero no va a ser la nica que almacene los datos que van a explotar las herramientas de reporting.

Tampoco hay una convencin estandar sobre lo que abarca exactamente cada rea, y la obligatoriedad de utilizar cada una de ellas. Cada proyecto es un mundo, e influyen muchos factores como la complejidad, el volumen de informacin del mismo, si realmente se quiere utilizar el Data Warehouse como almacn corporativo o Sistema Maestro de Datos, o si existen necesidades reales de soporte al reporting operacional. Visto esto, comentar a continuacin las reas de datos que se suelen utilizar, e ir perfilando una propuesta de arquitectura que cada uno ha de adaptar a sus necesidades o simplemente a su gusto en funcin de su experiencia.

Staging Area
Es un rea temporal donde se recogen los datos que se necesitan de los sistemas origen. Se recogen los datos estrictamente necesarios para las cargas, y se aplica el mnimo de transformaciones a los mismos. No se aplican restricciones de integridad ni se utilizan claves, los datos se tratan como si las tablas fueran ficheros planos. De esta manera se minimiza la afectacin a los sistemas origen, la carga es lo ms rpida posible para minimizar la ventana horaria necesaria, y se reduce tambin al mnimo la posibilidad de error. Una vez que los datos estn traspasados, el DWH se independiza de los sistemas origen hasta la siguiente carga. Lo nico que se suele aadir es algn campo que almacene la fecha de la carga. Obviamente estos datos no van a dar servicio a ninguna aplicacin de reporting, son datos temporales que una vez hayan cumplido su funcin sern eliminados, de hecho en el esquema lgico de la arquitectura muchas veces no aparece, ya que su funcin es meramente operativa.

Hay quien considera que la Staging Area abarca ms de lo que he comentado, o incluso que este area engloba todo el entorno donde se realizan los procesos de ETL, yo me decanto por su utilizacin slo como rea temporal.

ODS (Operational Data Store)


Como su nombre indica, este area es la que va a dar soporte a los sistemas operacionales. El modelo de datos del Almacn de Datos Operacional sigue una estructura relacional y normalizada, para que cualquier herramienta de reporting o sistema operacional pueda consultar sus datos. Est dentro del Data Warehouse porque se aprovecha el esfuerzo de integracin que supone la creacin del Almacn de Datos Corporativo para poder atender tambin a necesidades operacionales, pero no es obligatorio, y ni siquiera es algo especfico del Business Intelligence, los ODS ya existan antes de que empezramos a hablar de BI y de DWH. No almacena datos histricos, muestra la imagen del momento actual, aunque eso no significa que no se puedan registrar los cambios. Los datos del ODS se recogen de la Stage Area, y aqu s que se realizan transformaciones, limpieza de datos y controles de integridad referencial para que los datos estn perfectamente integrados en el modelo relacional normalizado. Hay que tener en cuenta que la actualizacin de los datos del ODS no va a ser instantnea, los cambios en los datos de los sistemas origen no se vern reflejados hasta que finalice la carga correspondiente. Es decir, que se irn actualizando los datos cada cierto tiempo, cosa que hay que explicar a los usuarios, porque los informes que se lancen contra el ODS casi nunca podrn estar tan 'al minuto' como los que existan en el sistema origen. Lo que s se puede hacer es definir una mayor frecuencia de carga para el ODS que para el Almacn Corporativo. Si es necesario, se puede refrescar el ODS cada 15 minutos, y el resto cada da, por ejemplo.

Almacn de Datos Corporativo


El Almacn de Datos Corporativo s que contiene datos histricos, y est orientado a la explotacin analtica de la informacin que recoge. Las herramientas DSS o de reporting analtico atacarn principalmente a los Data marts, pero tambin se pueden realizar consultas directamente contra el Almacn de Datos Corporativo, sobretodo cuando sea necesario mostrar a la vez informacin que se encuentre en diferentes Datamarts. En l se almacenan datos que pueden provenir tanto de la Staging Area como del ODS. Si ya hemos realizado procesos de transformacin e integracin en el ODS no los vamos a repetir para pasar los mismos datos al Almacn Corporativo. Lo que no se pueda recoger desde el ODS s que habr que ir a buscarlo a la Staging Area. El esquema se parece al de un modelo relacional normalizado, pero en l ya se aplican tcnicas de desnormalizacin. No debera contener un nmero excesivo de tablas ni de relaciones ya que, por ejemplo, muchas relaciones jerrquicas que en un modelo normalizado se implementaran con tablas separadas aqu ya deberan crearse en una misma tabla, que despus representar una dimensin. Otra particularidad es que la mayora de las tablas han de incorporar campos de fecha para controlar la fecha de carga, la fecha en que se produce un hecho, o el periodo de validez del registro.

Si el Data Warehouse no es demasiado grande, o el nivel de exigencia no es muy elevado en cuanto a los requerimientos 'operacionales', para simplificar la estructura se puede optar por prescindir del ODS, y si es necesario adecuar el Almacn de Datos Corporativo para servir a los dos tipos de reporting. En este caso, el rea resultante sera el DWH Corporativo, pero a veces tambin se le llama ODS.

Data marts
Y por fin llegamos a la ltima rea de datos, que es el lugar donde se crean los Data marts. stos se obtienen a partir de la informacin recopilada en el rea del Almacn Corporativo. Cada Data Mart es como un subconjunto de este almacn, pero orientado a un tema de anlisis, normalmente asociado a un departamento de la empresa. Los Data marts se disean con estructura multidimensional, cada objeto de anlisis es una tabla de hechos enlazada con diversas tablas de dimensiones. Si se disean siguiendo el Modelo en Estrella habr prcticamente una tabla para cada dimensin, es la versin ms desnormalizada. Si se sigue un modelo de Copo de Nieve las tablas de dimensiones estarn menos desnormalizadas y para cada dimensin se podrn utilizar varias tablas enlazadas jerrquicamente. Este rea puede residir en la misma base de datos que las dems si la herramienta de explotacin es de tipo ROLAP, o tambin puede crearse ya fuera de la BD, en la estructura de datos propia que generan las aplicaciones de tipo MOLAP, ms conocida como los cubos multidimensionales.

El paso del anterior rea de datos a esta ha de ser bastante simple, cosa que adems proporciona una cierta independencia sobre el software que se utiliza para el reporting analtico. Si por cualquier razn es necesario cambiar la herramienta de OLAP habra que hacer poco ms que redefinir los metadatos y regenerar los cubos, y si el cambio es entre dos de tipo ROLAP ni siquiera esto ltimo sera necesario. En cualquier caso, las reas anteriores no tienen porqu modificarse.
CONCLUSIONES Usos de Business Intelligence. Balanced Scorecard. Anlisis de ventas. Rentabilidad de productos, clientes. Rentabilidad de tiendas/ centros. Anlisis financieros.a Medicin del desempeo. Anlisis de inventarios. Anlisis de Produccin. Minera de Datos.
El uso del Business Intelligence no debera ser exclusivamente para las grandes corporaciones. Toda empresa, no importando el tamao de su estructura organizativa, con ambicin y deseos de ser lder, debera incorporar las tcnicas del BI en su gestin, mientras ms pronto incorpore el uso de cuadros de mando y otros herramientas del BI, como parte de su cultura y hbitos de sus colaboradores, ser mejor para su organizacin y evitar pasar por complejos perodos de adaptacin.

Explicar en extenso la aportacin de Business Intelligence a las empresas y/o negocios.

Ya que colabora con la toma de decisiones, por lo que en la actualidad representa una de las tcticas estratgicas ms importantes para lograr un verdadero potencial competitivo. Mediante la administracin de la informacin relevante a travs del mtodo utilizado por Business Intelligence es posible llevar a cabo diferentes actividades relacionadas con todos los sectores de la empresa, con el fin de mejorar el futuro de los negocios.Con BI es posible generar reportes, tanto independientes de secciones como globales, permite crear una base de datos de clientes con los datos necesarios para establecer el perfil de los mismos, y ofrece la importante posibilidad de desarrollar diferentes escenarios para efectuar una decisin.BI permite realizar pronsticos de ventas y devoluciones, compartir toda la informacin recabada entre los distintos departamentos de la empresa y llevar a cabo anlisis multidimensionales de los datos. La mayora de las grandes compaas, como as tambin un gran nmero de Pymes, han implementado con xito el uso de las soluciones de BI. Cmo saber si nuestra empresa necesita una solucin BI? Para saber si el caso de nuestra organizacin requiere de las soluciones que brinda el sistema de Business Intelligence, es necesario evaluar diversas operaciones diarias que se realizan en la compaa, con el fin de definir la necesidad real de la implementacin de BI en los procesos.Es imprescindible el uso de BI cuando frecuentemente invertimos ms tiempo en la recoleccin y administracin de la informacin, que el tiempo que utilizamos para analizarla, incluso cuando la evaluacin no es posible ya que no podemos hallar los datos requeridos para llevar a cabo un anlisis confiable. Un sistema BI nos brinda las soluciones adecuadas para evitar la recepcin de informacin retrasada, devolucin de mercancas, planificacin de pronsticos equivocados, trabajo extra para la produccin de reportes, y nos permite mantener una comunicacin estrecha con los diversos sectores de la empresa para ejecutar una estrategia comn. Costos de Implantacion de Bussiness Intelligence Cunto Cuesta? es la primer pregunta que hacen los interesados en implementar una solucin de Business Intelligence, de inicio es una pregunta muy difcil de contestar debido a la gran variedad de escenarios para implementar una solucin de BI.
Tambin aplica el costo de personal, el costo de capacitacin, el costo del cambio de implementar los sistemas. Sin embargo, se ha observado que el retorno de esta inversin puede ser hasta mil veces ms.

Ventajas y desventajas de Bussiness Intelligence VENTAJAS

La aplicacin de un modelo de Business Intelligence ayudara a la transformacin de los datos en informacin, y la informacin en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios de la organizacin.

-Aumento de ingreso y reduccin de gastos -Anlisis de la rentabilidad de clientes -Simulaciones y anlisis de tendencias -Para desarrollarlo con eficiencia y eficacia es necesario: -Realizar comparativos entre periodos. -Revisar los indicadores administrativos y de desempleo. -Avisos de puntos crticos -Alineamiento de lo tctico a lo operativo -Seguimiento estratgico. Los beneficios que se alcanzaran con base en la implementacin de Business Intellinge son de manera generalizada los siguientes: - Agilidad en el proceso de toma de decisiones. - Eliminacin de controles manuales - Centralizacin de informaciones de gestin - Rapidez en la recoleccin de informacin. - Transformacin de procesos reactivos en activos. - Seguimiento y administracin en la ejecucin de la estrategia.

DESVENTAJAS

Implementacin ms Funcionalidad menos analtica sencilla Poca facilidad de personalizacin Funcionalidad estndar.

1. Las empresas fallan en reconocer que los proyectos de BI son iniciativas de negocios nter organizacionales, y en entender dichas iniciativas difieren de las tpicas soluciones independientes. 2. Existe la falta de compromisos por parte de los sponsors (los cuales tienen autoridad en la empresa. 3. Se tiene poca disponibilidad de los representantes de negocios. 4. Hay ausencia de un personal disponible y habilidoso. 5. Existe un mal concepto del software de BI. 6. No trabajan bajo una estructura detallada. 7. No existe un anlisis del negocio o estandarizacin 8. No existe una apreciacin del impacto que causan los datos de mala calidad en la rentabilidad del negocio. 9. No se entiende la necesidad del uso de un meta datos. 10. Demasiada confianza mtodos y herramientas no alineadas.

Ventajas y desventajas de un Datawarehouse.

Ventajas:

1. 2. 3. 4.

5. 6. 7. 8. 9. 10.

11. 12.

13. 14. 15.

Proporciona informacin clave para la toma de decisiones empresariales. Mejora la calidad de las decisiones tomadas. Especialmente til para el medio y largo plazo. Son sistemas relativamente sencillos de instalar si las fuentes de datos y los objetivos estn claros. Muy tiles para el almacenamiento de anlisis y consultas de histricos. Proporciona un gran poder de procesamiento de informacin. Permite una mayor flexibilidad y rapidez en el acceso a la informacin. Facilita la toma de decisiones en los negocios. Las empresas obtienen un aumento de la productividad. Proporciona una comunicacin fiable entre todos los departamentos de la empresa. Mejora las relaciones con los proveedores y los clientes. Permite conocer qu est pasando en el negocio, es decir, estar siempre enterado de los buenos y malos resultados. Transforma los datos en informacin y la informacin en conocimiento Permite hacer planes de forma ms efectiva. Reduce los tiempos de respuesta y los costes de operacin.

Datawarehouse proporciona una informacin de gestin accesible, correcta, uniforme y actualizada. Proporciona un menor coste en la toma de decisiones, una mayor flexibilidad ante el entorno, un mejor servicio al cliente y permite el rediseo de los procesos.

Desventajas:

1.

2. 3. 4.

5.

6.

7. 8. 9. 10.

No es muy til para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir. En cualquier caso la tendencia de los productos actuales (junto con los avances del hardware) es la de solventar este problema convirtiendo la desventaja en una ventaja. Requiere de continua limpieza, transformacin e integracin de datos. Mantenimiento. En un proceso de implantacin puede encontrarse dificultades ante los diferentes objetivos que pretende una organizacin. Una vez implementado puede ser complicado aadir nuevas fuentes de datos. Requieren una revisin del modelo de datos, objetos, transacciones y adems del almacenamiento. Tienen un diseo complejo y multidisciplinar. Requieren una reestructuracin de los sistemas operacionales. Tienen un alto coste. Requieren sistemas, aplicaciones y almacenamiento especfico.

Las empresas que utilizan data warehouse son fundamentalmente aquellas que manejan grandes volmenes de datos relativos a clientes, compras, marketing, transacciones, operaciones. como lo son las empresas de telecomunicaciones, transporte, Turismo, fabricacin de bienes de consumo masivo etc.
Modelo de cubos dimensionales:

Funciones
El Modelo de Cubo dimensionales es una base de datos que posee diversas dimensiones, ampliando las posibilidades que hasta el momento ofrecan las conocidas hojas de clculo. Mediante la incorporacin de estos vectores o cubos, se han ampliado las posibilidades de las bases de datos relacionales, permitiendo el procesamiento de importantes volmenes de informacin, que de lo contrario sera imposible realizar. Cada una de las dimensiones que posee la base de datos incorpora un campo determinado para un tipo de dato especfico, que luego podr ser comparado con la informacin contenida en el resto de dimensiones, para hacer posible la evaluacin y posteriores informes de la informacin realmente relevante para una compaa. Una base de datos multidimensional puede contener varios cubos o vectores que extendern las posibilidades del sistema OLAP con el cual se trabaja. Para tener una idea ms simple de la funcin de los Cubos OLAP dentro de una base de datos multidimensional, cabe destacar que cada una de las dimensiones o escalas del cubo corresponde [3] bsicamente a una jerarqua de datos.

Caractersticas

En este modelo los datos son vistos como cubos los cuales consisten en categora descriptivas (dimensiones) y valores cuantitativos (medidas). Es un modelo multidimensional de datos, que simplifica a los usuarios realizar consultas complejas, arreglar datos en un reporte, cambiar de datos resumidos a datos detallados, etc. Los Cubos OLAP son vectores en los cuales se dispone la informacin, y gracias a esta ordenada jerarqua es posible llevar a cabo un anlisis rpido de los datos.

Cubos OLAP

Operaciones Analticas Bsicas


Consolidacin: este comprende el conjunto de datos. Esto puede involucrar acumulaciones simples o agrupaciones complejas que incluyen datos interrelacionados. Drill-Down: OLAP puede moverse en direccin contraria y presentar automticamente datos detallados que abarcan datos consolidados. Slicing-Dicing: se refiere a la capacidad de visualizar a la base de datos desde diferentes puntos de vistas.

Modelos de Datos
Existen tres tipos de modelos OLAP ellos son:

MOLAP: en estos sistemas se encuentran almacenados los datos en una estructura de datos multidimensional (OLAP Multidimensional)

ROLAP: son sistemas en los cuales los datos se encuentran almacenados en una base de datos relacional (OLAP Relacional)

HOLAP: estos sistemas mantienen los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada.

Beneficios
1. Es de fcil uso y acceso flexibles para los usuarios. 2. Los datos estn organizados en diferentes dimensiones lo que permite un mejor anlisis. 3. Ahorro generado por productividad de personas altamente profesionales. 4. Permite encontrar la historia en los datos. 5. Genera cierta ventaja competitiva.
[4]

Ventajas

Tiene acceso a grandes cantidades de informacin. Analiza las relaciones entre muchos tipos de elementos empresariales. Involucra datos agregados. Compara datos agregados a travs de periodos jerrquicos. Presentan los datos en diferentes perspectivas. Involucran clculos complejos entre elementos de datos. Pueden responder con rapidez a consultas de usuarios

Desventajas
A pesar de las grandes ventajas que presenta este tipo de base de datos multidimensional que incluye Cubos OLAP, la cual permite obtener mayor rapidez en las consultas y en el procesamiento de la informacin, lo cierto es que su gran falla reside en la imposibilidad de realizar cambios en su estructura. Debido a su forma de funcionamiento y almacenamiento de la informacin, cuando los usuarios requieren realizar modificaciones en la estructura de este tipo de base de datos, deben redisear el Cubo OLAP, sin posibilidades de poder utilizar la estructura en la que se trabaj hasta el momento.