Universidad Nacional de Ingeniería

Centro de Tecnologías de Información Y Comunicaciones

DataMining

Auspicia
www.bpc.com.pe

secuencias. es la extracción de información oculta y predecible de grandes bases de datos. • Las herramientas de Data Mining predicen futuras tendencias y comportamientos.com.bpc. tendencias y asociaciones que pueden generar algún modelo para ayudar en la toma de decisiones y a comprender mejor el dominio. permitiendo en los negocios tomar decisiones proactivas Auspicia www. • Es una poderosa tecnología con potencial para ayudar a las compañías a concentrarse en la información más importante de sus Bases de Información (Data Warehouse).Universidad Nacional de Ingeniería Centro de Tecnologías de Información Y Comunicaciones Conceptos • Data Mining. • Trabaja buscando patrones.pe . agrupaciones. comportamientos.

pe . para una etapa posterior de interpretación y análisis.Universidad Nacional de Ingeniería Centro de Tecnologías de Información Y Comunicaciones Conceptos Representa la actividad que genera patrones y relaciones mediante la aplicación de algoritmos.bpc. Data Mining como un Proceso Independiente de extracción de información oculta. que posee sus propias etapas: • Identificación del problema • Selección de los datos • Preparación de los datos • Construcción del modelo • Descubrimiento de patrones • Despliegue de Patrones • Monitoreo del modelo. Auspicia www. a partir de un conjunto de datos previamente limpiados y transformados.com.

Las bases de datos pueden ser grandes tanto en profundidad como en ancho : • Más columnas. • Preguntas que tradicionalmente requerían un intenso análisis manual. • Permite detectar fácilmente patrones en los datos. y permite a los usuarios hacer inferencias acerca de pequeños pero importantes segmentos de población Auspicia www. ahora pueden ser contestadas directa y rápidamente desde los datos.bpc.Universidad Nacional de Ingeniería Centro de Tecnologías de Información Y Comunicaciones Características • • Predicción automatizada de tendencias y comportamientos: • Data Mining automatiza el proceso de encontrar información predecible en grandes bases de datos. sin preseleccionar un subconjunto de variables. • Más filas. Un Data Mining de alto rendimiento permite a los usuarios explorar toda la base de datos.com.pe . Muestras mayores producen menos errores de estimación y desvíos.

Algoritmos Universidad Nacional de Ingeniería Centro de Tecnologías de Información Y Comunicaciones Las algoritmos mas usadas en Data Mining son: • Redes neuronales artificiales: modelos que aprenden a través del entrenamiento y semejan la estructura de una red neuronal biológica. Auspicia www. • Regla de inducción: La extracción de reglas if-then de datos basados en significado estadístico. Estas decisiones generan reglas para la clasificación de un conjunto de datos. • Método del vecino más cercano: técnica que clasifica cada registro en un conjunto de datos basado en una combinación de las clases del/de los k registro (s) más similar/es a él en un conjunto de datos históricos (donde k 1). • Algoritmos genéticos: técnicas de optimización que usan procesos tales como combinaciones genéticas.bpc.pe . mutaciones y selección natural en un diseño basado en los conceptos de evolución. • Árboles de decisión: estructuras de forma de árbol que representan conjuntos de decisiones.com.

bpc. independientemente de la técnica de extracción de conocimiento usada. El proceso de minería de datos pasa por las siguientes fases: • Filtrado de datos • Selección de Variables • Extracción de Conocimiento • Interpretación y Evaluación Auspicia www.pe .com.Universidad Nacional de Ingeniería Centro de Tecnologías de Información Y Comunicaciones Fases de Dataming Los pasos a seguir para la realización de un proyecto de minería de datos son siempre los mismos.

.. comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. Selección de variables: La selección de características reduce el tamaño de los datos eligiendo las variables más influyentes en el problema. se filtran los datos (de forma que se eliminan valores incorrectos.bpc. se obtiene un modelo de conocimiento.. se deben comparar los modelos en busca de aquel Auspicia que se ajuste mejor al problema. Si se obtienen varios modelos mediante el uso de distintas técnicas. Algoritmos de Extracción de Conocimiento: Mediante una técnica de minería de datos. También pueden usarse varias técnicas a la vez para generar distintos modelos..). www. aunque generalmente cada técnica obliga a un preprocesado diferente de los datos. no válidos.com. o se reducen el número de valores posibles (mediante redondeo. Interpretación y evaluación: Verifica si los resultados son coherentes. según las necesidades y el algoritmo a usar). clustering. que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. se debe proceder a su validación. se obtienen muestras de los mismos (en busca de una mayor velocidad de respuesta del proceso). El cliente es el que tiene la palabra final. desconocidos.. sin apenas sacrificar la calidad del modelo de conocimiento obtenido del proceso de minería.pe . Una vez obtenido el modelo.Universidad Nacional de Ingeniería Centro de Tecnologías de Información Y Comunicaciones Fases de Dataming Filtrado de datos: Mediante el preprocesado.

com.bpc. que tengan conocimientos básicos en áreas estadísticas que les permita entender y aplicar los resultados Auspicia www. • Existe gran diversidad de herramientas de Data Mining en el mercado. • La búsqueda de patrones la realiza en forma automatizada. • No requiere de personal experto en ciencias estadísticas o altamente entrenado.pe . lo que facilita la aplicación de este proceso y aumenta el nivel de confianza de sus resultados. Es suficiente un especialista en análisis de datos y un experto en las áreas de la organización.Universidad Nacional de Ingeniería Centro de Tecnologías de Información Y Comunicaciones Ventajas • Extrae información táctica y estratégica almacenada en sus Data Warehouse . generando modelos mediante la aplicación de diferentes técnicas.