DATAMINING

Por: Ivonne Rodríguez Dani Aldaz

CONTENIDO
1. FUNDAMENTOS  Problemas actuales en las empresas  Descubrimiento de Conocimiento en Bases de Datos  BI como una solución tecnológica empresarial  Tecnologías OLTP y OLAP  Solución Business Intelligence: Definición y Arquitectura

IMPLEMENTACION DE UNA SOLUCION BI  Arquitectura a implementarse  CASO PRACTICO.CONTENIDO 2. .

Clustering . Asociación. DATAMINING  El ciclo DataMining  Técnicas de DataMining: Clasificación Estimación.CONTENIDO 3.

Problemas actuales en las empresas El mundo de los negocios y los datos Los negocios Datos .

Problemas actuales en las empresas Problemas: • Sobrecarga de información • Mucha información genérica • Ausencia de información personalizada y/o relevante para los distintos perfiles que existen en un negocio • Falta de retroalimentación oportuna para la mejora de los negocios .

Problemas actuales en las empresas ERP Business Intelligence PROBLEMAS BMP (Workflows -cero papeles) .

procesamiento y salida de información. y los procesos que se realizan en el sistema de información que básicamente son cuatro: entrada. los recursos humanos que interactúan con el Sistema. almacenamiento. Los elementos que integran un sistema de información son el hardware necesario para que el sistema de información pueda operar.Problemas actuales en las empresas Sistema de Información   Un sistema de información es un conjunto de elementos que interactúan entre sí con el fin de apoyar las actividades de una empresa o negocio. .

definidos para facilitar consultas sobre información almacenada en el sistema. es consecuencia del desarrollo organizacional orientado a un mercado de carácter global. Con frecuencia son el primer tipo de Sistemas de Información que se implanta en las organizaciones. El INTERNET que se convierten en vehículo de comunicación entre la organización y el mercado. Sistemas de Información Ejecutivos (EIS).Sistema de Información SI Estratégico: orientados a soportar y apoyar la toma de decisiones Ejm: los Sistemas de Información Gerencial (MIS). en resumen. . SI Táctico: soportar las actividades de coordinación de actividades y manejo de documentación. Se empieza apoyando las tareas a nivel operativo de la organización. Trámite y Bases de Datos Documentarios). Son intensivos en entrada y salida de información SI Interinstitucionales : está surgiendo actualmente. Sistemas de Soporte de Decisiones (DSS) SI Técnicos Operativos: Llamados sistemas transaccionales u operacionales. coordinación y control de tareas (WorkFlow) y tratamiento de documentos (Imagen. facilitar la gestión independiente de la información por parte de los niveles intermedios de la organización Ejm: Sistemas Ofimáticos (OA). Sistemas de Transmisión de Mensajería (E-mail y Fax Server). proporcionar informes y.

Bussines Intelligence .

Problemas actuales en las empresas Nuevos requerimientos Sistema Inteligente Datos Son un activo valioso para los negocios Deben ser administrados de manera inteligente .

Problemas actuales en las empresas El mundo de los negocios y los datos Los negocios Datos CONOCIMIENTO .

Problemas actuales en las empresas Datos. Información y Conocimiento Conocimiento Bajo volumen Alto valor Información Dato Alto volumen Bajo valor .

comparaciones y otras actividades •Hechos objetivos •Fácilmente capturados y estructurados •Fácilmente transferidos Dato . sumarización.Problemas actuales en las empresas Datos. transferir y capturar en las Conocimiento máquinas •Frecuentemente tácita Información •Datos que tienen relevancia y un propósito •La intervención humana es necesaria •Es derivada de un conjunto de datos mediante agrupación de temas. Información y Conocimiento •Entendimiento que se da en la mente •Requiere reflexión y síntesis •Difícil estructurar.

.

.

Datos? .

Qué es Business Intelligence?  Business Intelligence es un sistema de información que se conforma de varias tecnologías utilizadas para implementar soluciones orientadas al usuario final que tienen la capacidad de convertir datos que cada empresa produce diariamente en información activa que permita conseguir el éxito. . describiendo ventajas y mejorando la toma de decisiones.

De manera que se ha convertido en un apoyo indispensable para la Toma de Decisiones. explotación. pronóstico y análisis. reporteo. .Qué es Business Intelligence?  Business Intelligence es un concepto que integra funciones tales como el acceso de datos.

Conclusión: .

Tecnología OLTP y OLAP OLTP (On Line Transactional Processing ) OLAP (On Line Analitical Processing) Usuario típico Uso del sistema Empleados Operación día a día Gerentes o analistas Análisis del negocio Ad-hoc Datos actuales + históricos Resumidos Lectura (excepto actualizaciones off-line) Query Interacción con el usuario Predeterminada Datos Características de los datos Datos actuales Atómicos Características del trabajo Lectura/escritura Unidad de trabajo Procesamiento Actualizaciones Transacción Orientado a procesos Orientado a requerimientos Un registro a la vez Varios registros a la vez .

Tecnología OLTP y OLAP Quién pregunta qué? OLTP Pregunta: Cuando Análisis Pregunta: Que se envió la orden? factores afectaron el tiempo de entrega de las órdenes? Como contribuyó cada línea (o producto) a las ganancias por distrito (o tienda) durante el último trimestre (o mes o año)? Cuales productos tienen el más bajo Margen Bruto de retorno en inventario? Cuántos fueron los ingresos el ultimo año? Cuánto fue el inventario total el último año? .

Tecnología OLTP y OLAP Operar el Negocio OLTP OLAP Administrar el Negocio .

BI es una solución modular con distintas fases de aproximación en función de cada necesidad (DSS) Planeación (BSC) .Componentes de una Solución BI Conceptualmente.

Una Arquitectura BI se divide en las siguientes capas: Sistemas Fuentes.Arquitectura de un BI    Un BI se compone de diferentes tecnologías que se integran para formar una solución empresarial Los componentes se orientan a transformar los datos en información oportuna y confiable para el usuario final. Capa DataWarehouse y la Capa BI .

Arquitectura Típica de Soluciones Business Intelligence .

. En muchas ocasiones también se requiere de datos externos para alimentar al sistema como hojas electrónicas. archivos de texto. Estos sistemas son los encargados de recolectar información diaria de las tareas operativas de la organización Estos datos operacionales constituyen la base de todo sistema business Intelligence ya que de estos dependen la calidad de información que se entregue al usuario final. debido a que algunas áreas de la institución no se encuentran automatizadas por lo que no cuentan con un sistema transaccional donde almacenar los datos.Arquitectura de un BI  Sistemas Fuentes Los datos administrados por los sistemas de aplicación operacionales son la fuente principal de datos para el data warehouse.

Arquitectura de un BI  Capa Data Warehouse La capa data warehouse es el centro de la arquitectura en un sistema business intelligence. Proporcionan toda la funcionalidad de análisis y creación de informes empresariales dirigidos a una amplia gama de posibles usuarios.  Capa BI Tenemos herramientas necesarias para comprender los datos y utilizarlos para tomar decisiones inteligentes. que se encarga de organizar y almacenar los datos para el análisis de los mismos.  Query and Reporting Herramientas  Cuadros de mando  OLAP  Datamining  Balanced Scorecard .

 ETL: Extraccion. transformacion y Carga .