Professional Documents
Culture Documents
Dia 5 Metodologia CRISP DM - Definicion de Problema
Dia 5 Metodologia CRISP DM - Definicion de Problema
problema
Conociendo a la persona
¿Qué es Ciencia de datos?
Una empresa desea conocer mejor a sus clientes
para mejorar su atención y generar mayores ingresos
¿Qué es Ciencia de datos?
Una empresa desea conocer mejor a sus clientes para
mejorar su atención y generar mayores ingresos
¿Qué es Ciencia de datos?
Se requiere de un
proceso que permita
agrupar los clientes de
tal manera que se pueda
ofrecer productos
acorde a sus
necesidades.
¿Qué es Ciencia de datos?
El proceso requiere de un elemento para generar la agrupación
¿Qué es Ciencia de datos?
El proceso requiere de un elemento para generar la agrupación
Patrón / modelo
Qué es un patrón
Un patrón es un conjunto de elementos que forman una unidad
diferenciada y que se repite a lo largo del tiempo, por lo que pueden
tomarse como modelo o punto de referencia
Qué es un patrón
Ej. El patrón para fabricar zapatos.
conjunto unidad diferenciada
se repite
modelo
¿Qué es Ciencia de datos?
método de Casado:
No-> 0,0 No-> 0,98 No-> 0,77
Si-> 1,0 Si-> 0,02 Si-> 0,23
Ciencia de
No-> 0,05 No-> 0,01 No-> 0,82
datos se Auto:
Si-> 0,95 Si-> 0,99 Si-> 0,18
podría obtener Hijos: 2,3 0,3 0,05
tres grupos. Alquiler-> 0,17 Alquiler-> 0,75 Alquiler-> 0,99
Alq./prop:
Propio-> 0,83 Propio-> 0,25 Propio-> 0,01
No-> 0,67 No-> 0,0 No-> 0,8
Sindicato:
Si-> 0,33 Si-> 1,0 Si-> 0,2
Bajas/año: 5,1 2,3 8,3
Antigüedad: 8,1 8 8,7
M-> 0,83 M-> 0,25 M-> 0,61
Sexo:
F-> 0,17 F-> 0,75 F-> 0,39
¿Qué es Ciencia de datos?
Ejemplo 2 Análisis de crédito bancario
22
RELACIÓN CON OTRAS CIENCIAS
INTELIGENCIA
ARTIFICIAL
23
Tipos de aprendizaje
Tipos de aprendizaje
• Aprendizaje No Supervisado.
https://www.youtube.com/watch?v=oT3arRRB2Cw
• Aprendizaje por reforzamiento
APRENDIZAJE SUPERVISADO
• Son técnicas que dado un conjunto de variables X, estas pueden
explicar una variable de salida Y.
Variable
Objetivo Y
APRENDIZAJE NO SUPERVISADO
Customer ID Target Probability to be target =1 Classification Value estimation Cluster membership Cluster center
1 1 0.9 C1 1000 G1 0.55
2 0 0.7 C2 905 G3 0.3
3 1 0.65 C1 1500 G2 0.01
4 1 0.65 C3 200 G5 1.6
Datos 5 0 0.6 C4 100 G2 0.01
. . . . . .
entrada . . . . . .
. . . . . .
150,000 0 0.0001 C1 90 G4 -0.01
Variable
Objetivo
ALGORITMOS DE APRENDIZAJE
ALGORITMOS DE APRENDIZAJE
Descripción
Clasificación
Estimación
Predicción
Clustering
Asociación
ALGORITMOS DE APRENDIZAJE
Descripción
• Clientes
• ¿Qué características demográficas tienen los clientes?
• ¿Cuánto consumen del producto Y?
• ¿En qué temporadas se compra mas el producto?
Identificar decisiones sobre las entidades
clave
¿Qué Decisiones clave identificó para las entidades del caso Telco?
Identificar los casos de uso
• Identificar los casos de uso
• Agrupar las decisiones en temas comunes.
• El resultado debe responder a la pregunta: “Como podemos hacer dinero”
• Ejemplo:
• Agrupación de clientes para incrementar el revenue del producto Y.
• Crear combos con productos complementarios para incrementar las ventas.
• Crear una predicción del producto para mejorar los canales de distribución.
Mapear los casos de uso a modelos analíticos
Caso de uso Modelo Analítico
Agrupación de clientes para incrementar el revenue Aprendizaje no supervisado – Clustering
del producto Y
Crear combos con productos complementarios para Modelo de afinidad
incrementar las ventas
Crear una predicción del producto para mejorar los Predicción de demanda con redes neuronales
canales de distribución.
Identificar los casos de uso
Para el caso TELCO que caso de uso pudo identificar