You are on page 1of 10

qwertyuiopasdfghjklzxcvbnmqwe

rtyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopa
Instituto Tecnológico De
sdfghjklzxcvbnmqwertyuiopasdfg
Piedras Negras
Materia: Tópicos Avanzados de Bases de
hjklzxcvbnmqwertyuiopasdfghjklz
Datos

xcvbnmqwertyuiopasdfghjklzxcv
Imparte: M.I. Juan Ramón Olague Sánchez

TRABAJO FINAL—“WEKA”
bnmqwertyuiopasdfghjklzxcvbnm
Alumno: Pedro Cruz Vázquez

qwertyuiopasdfghjklzxcvbnmqwe
rtyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopa
sdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklz
xcvbnmqwertyuiopasdfghjklzxcv
bnmqwertyuiopasdfghjklzxcvbnm
qwertyuiopasdfghjklzxcvbnmqwe
rtyuiopasdfghjklzxcvbnmrtyuiopa
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

PARTE 1.
El Siguiente Trabajo tiene como fin Investigar una base de datos o tabla de datos
depurada, en este caso de la INGI, la cual muestra los usuarios y suscriptores de
servicios de telecomunicaciones en México, durante el periodo de 1998-2009,
la siguiente imagen muestra la tabla y su contenido:

PARTE 2
A continuación se busca realizar un análisis de minería de datos sobre un grupo de
registros en particular, a fin de obtener uno o varios patrones que indiquen el estado
general del grupo de registros estudiados, dicho análisis se desarrollara con el apoyo de
la herramienta weka, la cual es entorno para Análisis del Conocimiento, es un conocido
software para aprendizaje automático y minería de datos escrito en Java y desarrollado
Tópicos Avanzados de Bases de DatosPágina 2
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

en la Universidad de Waikato. WEKA es un software libre distribuido bajo licencia GNU-


GPL.
Weka, contiene una colección de herramientas de visualización y algoritmos para
análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para
acceder fácilmente a sus funcionalidades
Entorno de Trabajo Weka.

Weka cuanta con un entorno de trabajo grafico, el cual facilita la operación de


aplicación, a continuación detallare los pasos que seguí para desarrollar mi trabajo final.

1. Esta es la ventana principal de weka para iniciar damos clic en el botón Explorer.

2. Ya estando dentro de la ventana weka explorer nos ubicamos El panel


"Preprocess" el cual dispone de opciones para importar datos de una base de
datos, de un fichero CSV, etc., y para pre procesar estos datos utilizando los
denominados algoritmos de filtrado. Estos filtros se pueden utilizar para
transformar los datos (por ejemplo convirtiendo datos numéricos en valores
discretos) y para eliminar registros o atributos según ciertos criterios previamente
especificados.

3. Ahora Abrimos nuestro archivo, dando clic en el botón open file en la parte
superior izquierda de la ventana. Seleccionamos la ruta de nuestro archivo el cual
Tópicos Avanzados de Bases de DatosPágina 3
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

está en Excel con una extensión .csv (archivo delimitado por comas), para el mejor
tratamiento de la información.

4. Ya que contamos con la tabla dentro de weka procedemos a seleccionar los


campos con los que se va a trabajar para sacar el resultado.

Tópicos Avanzados de Bases de DatosPágina 4


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

5. Ya seleccionados los campos nos vamos a El panel "Cluster" el cual da acceso a las
técnicas de clustering o agrupamiento de Weka como por ejemplo el algoritmo K-
means. Este es sólo una implementación del algoritmo expectación-maximización
para aprender una mezcla de distribuciones normales.

Tópicos Avanzados de Bases de DatosPágina 5


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

6. Yo utilizare el algoritmo FarthestFirst, para seleccionarlo presionamos el botón


Choose y elegimos la opción del algoritmo FarthestFirst.

7. Ya seleccionado nuestro algoritmo presionamos en el cuadro de texto donde esta


el nombre de FarthestFrist, para seleccionar el numero de clustres que deseamos
en este caso 5 lo ponemos y damos clic en OK.

Tópicos Avanzados de Bases de DatosPágina 6


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

8. Ya contando con los campos seleccionados, el algoritmo y el numero de Clusters,


damos clic en el botón Start para hacer el análisis.

Tópicos Avanzados de Bases de DatosPágina 7


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

9. Ahora ya con el resultado que nos arrojo solo nos queda interpretar los datos.

Grafica de Tabla de Porcentaje

Tópicos Avanzados de Bases de DatosPágina 8


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

CONCLUSION

Los resultados obtenidos de la implementación de una herramienta como weka, en


una minería de datos, en este caso los usuarios y suscriptores de
telecomunicaciones, arrojan que en el año 2003 fue cuando se disparo el uso de
las telecomunicaciones, principalmente las de la telefonía móvil televisión por
satélite. Aunque también fue cuando algunas cosas fueron quedándose en el
camino como los radiolocalizadores personales.

La utilización de una herramienta como weka es de gran apoyo cuando se trata de


realizar trabajos con grandes cantidades de datos.

Tópicos Avanzados de Bases de DatosPágina 9


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

Tópicos Avanzados de Bases de DatosPágina 10

You might also like