You are on page 1of 13

ESCUELA ACADEMICO PROFESIONAL DE INGENIERIA DE SISTEMAS

TEMA:

MINERIA DE DATOS EN SQL SERVER 2012.


DOCENTE:

Ing.Mg. SANCHEZ GUEVARA Omar Antonio.

INTEGRANTES:
FERNANDEZ ROMAN,Ismael
MINERA DE DATOS EN SQL SERVER 2012
Cuando trabajamos con grandes bases de datos, tipo datawarehouse, hay
veces que analizando distintos datos es posible predecir algunos patrones.
Por ejemplo, analizando las ventas de los ltimos 5 aos y analizando
distintos factores de nuestros clientes, es posible por ejemplo, descubrir
que los clientes que van en bicicleta y tienen 2 hijos son ms propensos a
comprar un coche, o que si vendemos el producto en los meses de
Febrero y Marzo las ventas de dicho producto subir un 30%. Dichos
patrones es lo que denominamos Minera de datos.
La minera de datos, es una tcnica en la que aplicamos a una gran base
de datos, algoritmos de bsqueda de patrones de comparacin. Para
poder trabajar con la minera de datos necesitamos 2 cosas: una base de
datos (la del datawarehouse) en una instancia de Analysis Services de SQL
Server con un modelo de minera y el complemento de minera de datos
de Office 2010.
PASOS PARA CREAR.
Primeramente necesitamos generar un modelo de datos para trabajar con
la minera. Para ello abrimos nuestra base de datos en Analysis Services
con SQL Data Tools y seleccionamos la opcin de generar un nuevo
modelo de datos de minera de datos.
Minera de datos en un proyecto de Analysis Services de SQL Data Tools
Nos aparecer un asistente para generar el modelo de minera. Primeramente
debemos indicar desde dnde vamos a obtener los datos:
Asistente de minera de datos: Donde obtener los datos
Despus debemos indicar el algoritmo de patrones que queremos utilizar
Algoritmo de minera
En este caso vamos a seleccionar la tcnica de rboles de decisin.
Seguidamente en el asistente debemos indicar qu tabla tiene los datos sobre los
que vamos a aplicar el algoritmo.
Tabla del datawarehouse que tiene los datos que queremos analizar
La columna Input, son los posibles factores que afectan a la columna
Predictable y que sirven para buscar un posible patrn . Por ejemplo la
edad, si est casado, si tiene hijos, si tiene coche, y si estos factores
afectan o no a la posible compra de bicicletas.
En el siguiente paso indicamos el tipo de los datos. Por ejemplo si son valores
discretos, continuos, ordenados, cclicos
En el ltimo paso del asistente indicamos el porcentaje de los datos reales que
queremos analizar
Porcentaje que queremos analiza
Una vez finalizado el asistente, publicamos el proyecto de SQL Data Tools en
Analysis Services y desde la pestaa del visor de minera de datos podemos ver el
anlisis. En este caso vemos en crculos ms grandes, los factores que ms
influyen en la compra de bicicletas.
Prediccin de ventas de bicicletas
Para comprobar que estos valores son coherentes a nuestras necesidades de
ventas, podemos intentar utilizar otro algoritmo de anlisis y ver los datos que
tenemos y compararlos. Para hacer esto, utilizaremos el complemento de
minera de datos de Office 2010. El complemento aadir una pestaa nueva a
Excel 2010 con todas las herramientas necesarias para la minera.
http://www.microsoft.com/es-es/download/details.aspx?id=29061
En el complemento podemos ver que tenemos la posibilidad de lanzar otros
algoritmos y compararlos. Por ejemplo, podemos analizar estos mismos datos con
la tcnica del modelo de Bayes y el modelo de rbol de decisin y el
complemento nos generara un grfico con la comparativa. Para ello usamos el
botn de Accuracy Chart.
Comparativa de modelos analticos

You might also like