You are on page 1of 32

INTERGRANTES :

 MAYUMI MAMANI TITO


CODIGO: 121341
 LENNIN ARIAS ARREDONDO
CODIGO: 093825
 OLIVER KEVIN FLORES
SENGA CODIGO: 110230
DATA MINING
(minería de datos)
INTRODUCCIÓN
Data Mining, es la extracción de
información oculta y predecible de grandes
bases de datos.
Trabaja buscando patrones,
comportamientos, agrupaciones,
secuencias, tendencias y asociaciones que
pueden generar algún modelo para ayudar
en la toma de decisiones y a comprender
mejor el dominio.

3
DEFINICIÓN (I)
La Minería de Datos es la extracción
automática de información predictiva
escondida desde bases de datos.
 La Minería de Datos estudia métodos
y algoritmos que permiten la extracción
automática de información sintetizada que
permite caracterizar las relaciones
escondidas.
DEFINICIÓN(II)
En las aplicaciones de la Minería de
Datos se hace sobre datos previamente
recolectados.
Los datos no cambian mientras están
siendo analizados.
 Por lo que los datos generados son
confiables y consistentes para éstos datos
DOS CONCEPTOS DE DATA
MINING:
1 => Data Mining como un paso => 2. Data Mining como un
dentro del proceso KDD (Knowledge Proceso Independiente de
Discovery in Databases), o extracción de información oculta,
descubrimiento de conocimiento de que posee sus propias etapas:
las bases de datos. Representa la Identificación del problema,
actividad que genera patrones y selección de los datos,
relaciones mediante la aplicación de preparación de los datos,
algoritmos, a partir de un conjunto construcción del modelo,
de datos previamente limpiados y descubrimiento de patrones,
transformados, para una etapa despliegue de Patrones y
posterior de interpretación y análisis. monitoreo del modelo.
Conocimiento en Bases de Datos Etapas de KDD
Qué es Minería de Datos Qué no es Minería de
Datos
- Es el proceso de exploración y -No es un producto que se
análisis –de manera automática compra enlatado sino una
o semiautomática –de los datos disciplina que debe ser
para obtener patrones dominada.
significativos y reglas de
negocio.
-No es una solución
instantánea los problemas de
-Es la aplicación de las técnicas negocio.
de la Inteligencia Artificial.
-No es un fin en sí mismo, sino
-Data Mining es un proceso. un proceso que ayuda a
encontrar soluciones a
problemas de negocio.
PERSPECTIVA HISTÓRICA
ETAPAS PRINCIPALES
• Determinación de los objetivos: Delimitación de los
objetivos que el cliente desea.
• Preprocesamiento de los datos(60%): Selección,
limpieza, enriquecimiento, reducción y
transformación de las bases de datos.
• Determinación del modelo: análisis estadísticos y
visualización grafica de los datos.
• Análisis de los resultados: Verifica si los resultados
son coherentes. El cliente es el que tiene la
palabra final.

10
PROCEDIMIENTOS
 Clasificación. Consiste en examinar las características
de una entidad nueva y asignarle una clase predefinida.
Por ejemplo: Clasificar a un nuevo cliente según su
riesgo de crédito (alto, medio, bajo).
 Estimación. Similar a lo anterior, pero aplicado a
variables continuas. Por ejemplo: ingresos, balance de
tarjetas de crédito, etc.
 Predicción. Predicción de fidelidad de clientes.
Ejemplo: predecir qué clientes nos abandonarán en
los próximos 6 meses.
 Grupos Afines o Reglas de Asociación. El objetivo de
los grupos afines es determinar que cosas van juntas.
Ejemplo: productos que debieran ir juntos en un
supermercado.

11
Características
principales
Predicción
automatizada de
tendencias y
comportamientos

Descubrimiento
automatizado de
modelos previamente
desconocidos

Las bases de datos


pueden ser grandes
tanto en profundidad
como en ancho
LAS TÉCNICAS MAS USADAS EN
DATA MINING SON:

Redes • modelos que aprenden a través


del entrenamiento y semejan la
neuronales estructura de una red neuronal
artificiales biológica

• estructuras de forma de
Árboles de árbol que representan
decisión conjuntos de decisiones

• técnicas de
optimización que
Algoritmos usan procesos
genéticos tales como
combinaciones
genéticas
• Una técnica que clasifica cada
Método del registro en un conjunto de datos
basado en una combinación de las
vecino más clases del/de los k registro (s) más
similar/es a él en un conjunto de
cercano: datos históricos (donde k 1).
Algunas veces se llama la técnica
del vecino k-más cercano.

• La extracción de
Regla de reglas if-then de
datos basados en
inducción: significado estadístico
FASES DE UN PROYECTO
DE MINERÍA DE DATOS

Los pasos a seguir para la realización de


un proyecto de minería de datos son
siempre los mismos, independientemente
de la técnica de extracción de
conocimiento usada. El proceso de minería
de datos pasa por las siguientes fases:
1.Filtrado de 2.Selección de
datos Variables

3.Extracción de
4.Interpretación Conocimiento
y Evaluación
EJEMPLOS DE AREAS DE
APLICACION DE DATA MINING:

1.Comercio/Marketing 2. Banca 3. Transportes

• a) Identificación de • a) Detección de • a) Determinación de


patrones de compra patrones de uso la planificación de la
de los clientes fraudulento de distribución entre
• b) Búsqueda de tarjetas de crédito. tiendas.
asociaciones entre • b) Identificación de • b) Análisis de
clientes y clientes leales. patrones de carga.
características • c) Predicción de
demográficas. clientes con
probabilidad de
• c) Predicción de cambiar su afiliación.
respuesta a
• d) Determinación del
campañas de gasto de tarjeta de
correo. crédito por grupos.
• e) Búsqueda de
correlaciones entre
indicadores
financieros.
4. Seguros y Salud Privada 5. Medicina

• a) Análisis de procedimientos • a) Identificación de terapias


médicos solicitados. médicas adecuadas para
• b) Predicción de qué clientes diferentes enfermedades.
compran nuevas pólizas. • b) Asociación de síntomas y
• c) Identificación patrones de clasificación diferencial de
comportamiento para clientes patologías
con riesgo. • c) Estudio de factores
• d) Identificación de (genéticos, precedentes,
comportamiento fraudulento. hábitos, alimenticios, etc.) de
riesgo
• d) Segmentación de pacientes
para una atención más
adecuada según su grupo.
• e) Predicciones temporales de
los centros asistenciales para el
mejor uso de recursos,
consultas, salas y habitaciones.
EJEMPLOS CON:
 Clustering.
 Asociación.
 Red neuronal como modelo predictivo.
CLUSTERING

Es la partición del conjunto de individuos en subconjuntos lo


más homogéneos posibles.
El objetivo es maximizar la similitud de individuos del cluster
y maximizar las diferencias entre clusters.
Se aplica para segmentación de bases de datos,
identificación de tipos de clientes, etc.
EJEMPLO DE CLUSTERING

¿Con qué criterio se agrupan estos rostros?


ASOCIACIÓN
Análisis de la canasta de mercado:

•Objetivo: generar reglas del tipo:


SI condición ENTONCES resultado
•Ejemplo:
SI producto A y producto CENTONCES producto B

¿Cuán buena es una regla?. Medidas que la califican:

•Soporte.
•Confianza.
•Mejora.
EJEMPLO DE ASOCIACIÓN
El dueño de una pizzería vende 3 gustos de pizzas:
pepperoni, queso y hongos, y quiere armar “combos
"con las combinaciones más convenientes.􀂾 Parte de
un conjunto de 2000 tickets con los correspondientes
ítems(gusto de pizza) incluido en
Cálculo de las medidas de Asociación:
RED NEURONAL

La Inteligencia Artificial trabaja con modelos


conexionistas.
El modelo conexionista imita el sistema más
complejo conocido hasta el momento: el
cerebro.
El cerebro está formado por millones de células
llamadas neuronas.
Estas neuronas son unos procesadores de
información muy sencillos con un canal de
entrada de información(dendrita), un órgano de
cómputo (soma) y un canal de salida de
información(axón).
EJEMPLO RED
NEURONAL
Valuación de propiedades
Datos
CONTRAS
Momento critico de la minería de datos:

• Que se requiere experiencia.


• Fáciles Equivocaciones. Fácil hallar patrones
equívocos, triviales o no interesantes.
• Relación coste/Beneficio improductiva.
• Uso indiscriminado de datos.
• Que no sea posible resolver los aspectos técnicos de
hallar patrones en tiempo o en espacio.
• Que exista una reacción del publico por el uso
indiscriminado de datos personales para ejercicios de
Minería de Datos, que obligue a los legisladores a
imponer restricciones exageradas (y tal vez absurdas)
al uso de la tecnología..

29
PROS
Extrae información táctica y estratégica almacenada en
sus Data Warehouse .
La búsqueda de patrones la realiza en forma
automatizada, generando modelos mediante la
aplicación de diferentes técnicas.
Existe gran diversidad de herramientas de Data Mining
en el mercado, lo que facilita la aplicación de este
proceso y aumenta el nivel de confianza de sus
resultados.
No requiere de personal experto en ciencias
estadísticas o altamente entrenado. Es suficiente un
especialista en análisis de datos y un experto en las
áreas de la organización, que tengan conocimientos
básicos en áreas estadísticas que les permita entender
y aplicar los resultados.

30
CONCLUSIONES
Nuestra capacidad para almacenar datos ha
crecido en los últimos años a velocidades
exponenciales. En contrapartida, nuestra
capacidad para procesarlos y utilizarlos no ha
ido a la par.
=> data mining se presenta como una
tecnología de apoyo para explorar, analizar,
comprender y aplicar el conocimiento obtenido
usando grandes volúmenes de datos.
Descubrir nuevos caminos que nos ayuden en
la identificación de estructuras en los datos es
una de las tareas fundamentales en el data
mining.

31
Fin de la Presentación

Muchas Gracias !!