You are on page 1of 30

Taller Minera de datos aplicados

a la educacin
1 parte
Introduccin a la minera de datos
27 de junio de 2011
Mercedes Torrado
Departamento Mtodos de Investigacin y
Diagnstico en Educacin (MIDE)
Este trabajo cuenta con licencia de Creative Commons:
Minera de datos aplicados a la educacin est subjecta a una licencia de ReconocimientoNoComercial-SinObraDerivada 3.0 (CC BY-NC-ND 3.0)
Para citar la obra:
Torrado, M. (2011) Minera de datos aplicados a la educacin. Barcelona: Universidad de
Barcelona. Deposito Digital http://hdl.handle.net/2445/19862

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


INTRODUCCIN
CONCEPTO
PROCESO DE MINERA DE DATOS
EJEMPLOS
PROGRAMAS INFORMTICOS
OTRAS APLICACIONES

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


Los avances tecnolgicos en las ltimas
dcadas nos han facilitado enormemente el
acceso a grandes volmenes de datos.
La cantidad de informacin que manejamos hoy
en da nos obliga a abordar el estudio de los
datos/informacin desde una perspectiva
global y no parcelada
La preocupacin por disponer de
informacin suficiente para la toma de
decisiones.

Cmo podemos analizar tal cantidad de


informacin e identificar aquella que nos permita
tomar decisiones y mejorar?
Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


En los aos 90 apareci el concepto DATA MINING.
Esta tcnica se vincul estrechamente con la direccin de empresas y en
concreto al marketing.

La minera de datos o Data Mining puede definirse


como una extraccin de informacin desconocida
no trivial y potencialmente til de una gran cantidad
de informacin

Bajo este trmino se engloban un conjunto de tcnicas de anlisis cuyo


objetivo es extraer conocimiento implcito de la base de datos.
Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


DEFINICIN
El Data mining tambin es considerado como una tecnologa
emergente que parte, por un lado de las tcnicas estadsticas y por
otro de las tcnicas de inteligencia artificial Aluja, 2001 (1)
Estadstica se ha preocupado
ms por la posible
generalizacin de los resultados

Inteligencia artificial ofrece


soluciones algortmicas a los
datos

La Minera de datos comprende un conjunto de tcnicas para la


descripcin y prediccin a partir de grandes masas de datos
(Viera et al., 2009: 12)
[1]

Toms Aluja en su artculo La minera de datos, entre la estadstica y la inteligencia artificial publicado en el
2001 en la revista QESTIIO (vol 25, 3, p 479-498) hace todo un repaso de los orgenes de la Minera de datos
en cuanto a los elementos correspondientes de la Estadstica y de la inteligencia artificial

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Equivalencias de nomeclaturas entre la Estadstica y la


Inteligencia Artificial
(Aluja, 2001: 482)

Inteligencia artificial

Estadstica

Red (network)

Modelo

Ejemplos (patterns)

Observaciones, individuos

Inputs, outputs, features

Variables

Inputs

Variables explicativas

Outputs, targets

Variables de respuesta

Errores

Residuos

Training, learning

Estimacin

Funcin de error, coste

Criterio de ajuste

Pesos, coef. sinpticos

Parmetros

Aprendizaje supervisado

Regresin, discriminacin

Aprendizaje no supervisado

Clasificacin

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


Data mining se asocia a:
Minera predictiva
Usa principalmente
tcnicas estadsticas

Minera de datos para el


descubrimiento del
conocimiento
Usa principalmente tcnicas de inteligencia
artificial

Triangulacin
estadstica
(Torrado, 2007)

Knowedge Discovery in
Databases
(KDD)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


Proceso de Descubrimiento de Conocimiento de Bases de
Datos(KDD)
Las siglas KDD fue creada en 1995 para designar el conjunto de
procesos, tcnicas que propician el contexto en el cual la minera de
datos tendr lugar
Una posible definicin:

(Viera et al., 2009)

La integracin de un conjunto de reas que tienen como propsito la


identificacin de un conocimiento obtenido a partir de las bases de datos
que aporten informacin hacia la toma de decisiones
(Riquelme et al., 2006 )

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


La finalidad del KDD es:
Procesar automticamente grandes cantidades
DATO
de datos brutos
Identificar los patrones ms significativos y
relevantes
INFORMACIN
Presentarlos como conocimiento apropiado
para satisfacer las metas del usuario
CONOCIMIENTO
Torrado, M. (2011) La Minera de datos en educacin (MDE)

Exploracin y
Fuente de Datos Pre-procesamiento

Fuente de
datos

Muestreo
Seleccin

Bases de
datos
Limpieza de
datos
Datos que no existen
Datos no clasificados

transformacin

Reconocimiento Evaluacin e
interpretacin
de patrones

Transformacin
de datos
Reducir variables /
dimensionalidad

Modelado

Informes

Clasificacin
Regresin

Creacin de
caractersticas

Agrupamiento

Generacin de variables
nuevas

Asociacin

Identificacin de
extremos

PREPARACIN DE LOS DATOS


EXPLOTACIN
EVALUACIN

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)

Exploracin y
Fuente de Datos Pre-procesamiento

Fuente de
CLASIFICACIN
datos

transformacin

Transformacin
de datos

Bases
de
La
finalidad
es crear un modelo para poder
datos
Reducir variables /
predecir la pertenencia
grupo
Limpieza dea un determinado
dimensionalidad
datos

Creacin de
caractersticas

EJEMPLO:
Datos que no existen
Generacin de variables
Diagnosticar alumnos de xito acadmico
Datos no clasificados

Reconocimiento Evaluacin e
interpretacin
de patrones

Modelado

Informes

Clasificacin /
asociacin
Regresin
Agrupamiento

nuevas

Identificacin de

PRUEBAS:extremos
rboles de decisiones, anlisis discriminantes,
etc..
EXPLOTACIN

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)

Exploracin y
Fuente de Datos Pre-procesamiento

Fuente de
REGRESIN
datos

Muestreo
Seleccin

transformacin

Reconocimiento Evaluacin e
interpretacin
de patrones

Transformacin
de datos

de es crear un modelo para poder


LaBases
finalidad
datos el valor de una variable Reducir
variables / a
predecir
dependiente
Limpieza de
dimensionalidad
partir de otras independientes
datos
Creacin de
caractersticas

EJEMPLO: Datos que no existen


Generacin de variables
Datos
no
clasificados
nuevas
Estimar el rendimiento acadmico
del primer ao
de carrera Identificacin de

Modelado

Informes

Clasificacin
/asociacin

Regresin
Agrupamiento

extremos

PRUEBAS:
Regresin lineal, redes neuronales, regresin EXPLOTACIN
logstica, etc

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)

Exploracin y
Fuente de Datos Pre-procesamiento

transformacin

Reconocimiento Evaluacin e
interpretacin
de patrones

Fuente de
Muestreo
AGRUPAMIENTO
/ SEGMENTACIN
Transformacin
datos

Seleccin

EJEMPLO:
Datos que no existen
Identificar perfiles de alumnos
Datos no clasificados

Informes

de datos

Bases
de
La
finalidad
es crear un modelo para poder
datos
Reducir variables /
agrupar con caractersticas
similares
Limpieza de
dimensionalidad
datos

Modelado

Clasificacin /
asociacin

Creacin de
caractersticas

Regresin

Generacin de variables
nuevas

Agrupamiento

Identificacin de

PRUEBAS:extremos
K-medias, Bietpico, etc..
EXPLOTACIN

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)

Exploracin y
Fuente de Datos Pre-procesamiento

Fuente de
datos
Bases de
datos

transformacin

Reconocimiento Evaluacin e
interpretacin
de patrones

LOS
DATOS DEBEN SER (Viera et al., 2009)
Muestreo
Seleccin

Transformacin
de datos

Modelado

Informes

Precisin sin
errores de medicin
Reducir variables /
Clasificacin /
Limpieza
de
dimensionalidad
asociacin
Consistencia

datos
coherentes
datos
Creacin de
Regresin
Completos

sin
falta
de
atributos
caractersticas
Agrupamiento
Datos que no existen
Generacin de variables
Relevancia
al problema
Datos no clasificados Concernientes
nuevas
Identificacin
de
No
redundancia
Sin duplicar la misma
extremos
informacin

PROCESO KDD y de MINERA DE DATOS


Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


Algunas aplicaciones (Riquelme, 2006)
Comercio y banca
Segmentacin de clientes, previsin de ventas, anlisis de riesgos

Medicina y farmacia
Diagnstico de enfermedades y la efectividad de los tratamientos

Seguridad y deteccin de fraude


Reconocimiento facial, acceso a redes no permitidas,

Astronoma
Identificacin de nuevas estrellas y galaxias

Geologa, minera, agricultura y pesca


Identificacin de reas de uso para distintos cultivos o pesca, explotacin minera en base de datos
de imgenes de satlites

Ciencias ambientales
Identificacin de modelos de funcionamiento de ecosistemas naturales o artificiales

Ciencias sociales
Estudio de los flujos de opinin, identificar barrios con conflicto en funcin de valores sociodemogrgicos

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


Algunas aplicaciones en Educacin MDE
En el mbito educativo la aplicacin de la minera de datos como
tcnica de anlisis se ubica en el entorno del sistema educativo y
en concreto en Educacin superior. Las base de datos que se
utilizan en los sistemas educativos permiten disponer de una gran
cantidad de informacin, tanto de los estudiantes, trabajadores,
departamentos, universidades, etc., por ejemplo la base de datos
UNEIX
La MDE tiene como objetivo obtener una mejor comprensin del proceso
de aprendizaje de los estudiantes y de su participacin global en el proceso,
orientado a la mejora de la calidad y rentabilidad del sistema educativo
(Winters, T, 2006)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


Algunas aplicaciones en Educacin MDE
R. Alcover, J. Benlloch, P. Blesa, M. A. Calduch1, M. Celma, C. Ferri, J.
Hernndez-Orallo, L. Iniesta, J. Ms, M. J. Ramrez-Quintana, A. Robles,
J. M. Valiente, M. J. Vicent, L. R. Znica. (2007) Anlisis del
rendimiento acadmico en los estudios de informtica de la
Universidad Politcnica de Valencia aplicando tcnicas de minera de
datos. XIII Jornadas de enseanza universitaria de la informtica. Teruel.
Espaa (disponible internet)
Quiroga, E. (2008) Minera de datos en educacin superior aplicada a
un modelo de alerta acdmica. Chile
Valero, S. (2009) Aplicacin de la minera de datos para predecir la
desercin. Universidad tecnolgicva de Izcar
de Matamoros
Algunos
ejemplos visuales
Torrado, M. (2011) La Minera de datos en educacin (MDE)

EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

EJEMPLOS
Cern, M.A. y Gmez, H. (2010) Minera de datos
(http://www.slideshare.net/04071977/mineria-de-datos)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


PROGRAMAS INFORMTICOS

En esta ltima dcada han aparecido una


serie de programas informticos que nos han
permitido analizar un gran volumen de datos
Sus diferencias radican en la presentacin e
implementacin. Pasan por las mismas etapas:
colecta de datos, depuracin y anlisis
Torrado, M. (2011) La Minera de datos en educacin (MDE)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Torrado, M. (2011) La Minera de datos en educacin (MDE)

Introduccin a la Minera de datos


Text Mining
Si bien es cierto que existe una gran
cantidad de informacin almacenada en
bases de datos, la existencia de un gran
volumen de documentos hace necesario
aplicar algn tipo de sistema de
anlisis.
El anlisis presenta un mayor nivel de
complejidad y de dimensiones en cuanto a
la categorizacin de texto y procesamiento
de lenguaje natural. La minera de texto o
text mining permite la extraccin y
recuperacin de la informacin

Internet Web Mining


Otra de las aplicaciones de la
minera de datos consiste en
aplicar
sus
tcnicas
a
documentos y servicios Web
(minera de Web) en concreto, el
anlisis de datos por Internet
y on line.

cules son las pginas web


ms visitadas?

PASW Text Mining (2010)


Torrado, M. (2011) La Minera de datos en educacin (MDE)

Bibliografa

Aluja, T (2001) La minera de datos, entre la estadstica y la inteligencia


artificial. QESTII, vol 25,3, p 479-498
Han, J. y Kamber, M. (2006) Data mining, concepts and techniques. USA
Hernandez Orallo J.L. (2004) Introduccin a la minera de datos. New York:
Pearson Prentice Hall
Prez, C. Santn, D. (2007) Minera de datos: tcnicas y herramientas. Madrid:
Paraninfo
Riquelme, J.C.; Ruiz, R y Gilbert, K. (2006) Minera de datos: conceptos y
tendencias. Revista Iberoamericana de Inteligencia artificial, 29, pp 11-18
Vieira Braga, L.P.; Ortiz Valencia, L.I.; Ramrez Carvajal, S.S. (2009)
Introduccin a La Minera de Datos. Rio de Janeiro: E-papers servicios
editoriales
Winters, T (2006) Educational Data Mining: Collection and Analysis of Score
Matrices for Outcomes- Based Assessment .USA, University of California:
Riverside

Torrado, M. (2011) La Minera de datos en educacin (MDE)

PASAMOS A LA SEGUNDA
PARTE ?
O
HACEMOS DESCANSO?

Torrado, M. (2011) La Minera de datos en educacin (MDE)