You are on page 1of 9

qwertyuiopasdfghjklzxcvbnmqwertyui

opasdfghjklzxcvbnmqwertyuiopasdfgh
jklzxcvbnmqwertyuiopasdfghjklzxcvb
Instituto Tecnológico De Piedras Negras

nmqwertyuiopasdfghjklzxcvbnmqwer
Materia: Tópicos Avanzados de Bases de Datos

Imparte: M.I. Juan Ramón Olague Sánchez


tyuiopasdfghjklzxcvbnmqwertyuiopas
TRABAJO FINAL—“WEKA”
dfghjklzxcvbnmqwertyuiopasdfghjklzx
Alumno: Pedro Cruz Vázquez

cvbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyuio
pasdfghjklzxcvbnmqwertyuiopasdfghj
klzxcvbnmqwertyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmqwerty
uiopasdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmrty
uiopasdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghjklzxc
[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

PARTE 1.

El Siguiente Trabajo tiene como fin Investigar una base de datos o tabla de datos depurada, en este caso de la
INGI, la cual muestra los usuarios y suscriptores de servicios de telecomunicaciones en México, durante el
periodo de 1998-2009, la siguiente imagen muestra la tabla y su contenido:

Tópicos Avanzados de Bases de Datos Página 2


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

PARTE 2

A continuación se busca realizar un análisis de minería de datos sobre un grupo de registros en particular, a fin
de obtener uno o varios patrones que indiquen el estado general del grupo de registros estudiados, dicho
análisis se desarrollara con el apoyo de la herramienta weka, la cual es entorno para Análisis del Conocimiento,
es un conocido software para aprendizaje automático y minería de datos escrito en Java y desarrollado en la
Universidad de Waikato. WEKA es un software libre distribuido bajo licencia GNU-GPL.

Weka, contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado
predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades

Entorno de Trabajo Weka.

Weka cuanta con un entorno de trabajo grafico, el cual facilita la operación de aplicación, a continuación
detallare los pasos que seguí para desarrollar mi trabajo final.

1. Esta es la ventana principal de weka para iniciar damos clic en el botón Explorer.

2. Ya estando dentro de la ventana weka explorer nos ubicamos El panel "Preprocess" el cual dispone de
opciones para importar datos de una base de datos, de un fichero CSV, etc., y para pre procesar estos
datos utilizando los denominados algoritmos de filtrado. Estos filtros se pueden utilizar para
transformar los datos (por ejemplo convirtiendo datos numéricos en valores discretos) y para eliminar
registros o atributos según ciertos criterios previamente especificados.

Tópicos Avanzados de Bases de Datos Página 3


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

3. Ahora Abrimos nuestro archivo, dando clic en el botón open file en la parte superior izquierda de la
ventana. Seleccionamos la ruta de nuestro archivo el cual está en Excel con una extensión .csv (archivo
delimitado por comas), para el mejor tratamiento de la información.

4. Ya que contamos con la tabla dentro de weka procedemos a seleccionar los campos con los que se va a
trabajar para sacar el resultado.

Tópicos Avanzados de Bases de Datos Página 4


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

5. Ya seleccionados los campos nos vamos a El panel "Cluster" el cual da acceso a las técnicas de
clustering o agrupamiento de Weka como por ejemplo el algoritmo K-means. Este es sólo una
implementación del algoritmo expectación-maximización para aprender una mezcla de distribuciones
normales.

Tópicos Avanzados de Bases de Datos Página 5


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

6. Yo utilizare el algoritmo FarthestFirst, para seleccionarlo presionamos el botón Choose y elegimos la


opción del algoritmo FarthestFirst.

7. Ya seleccionado nuestro algoritmo presionamos en el cuadro de texto donde esta el nombre de


FarthestFrist, para seleccionar el numero de clustres que deseamos en este caso 5 lo ponemos y damos
clic en OK.

Tópicos Avanzados de Bases de Datos Página 6


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

8. Ya contando con los campos seleccionados, el algoritmo y el numero de Clusters, damos clic en el
botón Start para hacer el análisis.

Tópicos Avanzados de Bases de Datos Página 7


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

9. Ahora ya con el resultado que nos arrojo solo nos queda interpretar los datos.

Grafica de Tabla de Porcentaje

Tópicos Avanzados de Bases de Datos Página 8


[INSTITUTO TECNOLÓGICO DE PIEDRAS NEGRAS] ISC

CONCLUSION

Los resultados obtenidos de la implementación de una herramienta como weka, en una minería de
datos, en este caso los usuarios y suscriptores de telecomunicaciones, arrojan que en el año 2003 fue
cuando se disparo el uso de las telecomunicaciones, principalmente las de la telefonía móvil televisión
por satélite. Aunque también fue cuando algunas cosas fueron quedándose en el camino como los
radiolocalizadores personales.

La utilización de una herramienta como weka es de gran apoyo cuando se trata de realizar trabajos con
grandes cantidades de datos.

Tópicos Avanzados de Bases de Datos Página 9

You might also like