Professional Documents
Culture Documents
Definicin
La minera de datos tiene como objetivo analizar los datos para extraer
conocimiento. Este conocimiento puede ser en forma de relaciones, patrones o
reglas inferidos de los datos y previamente desconocidos, o bien en forma de una
descripcin ms concisa es decir un resumen de los mismos
Buscar secuencias: analizar los artculos que los clientes han introducido en
el carrito de compra y predecir los posibles eventos.
3. Preparacin de datos
4. Modelamiento
5. Evaluacin
6. Despliegue funcional-comercial
Metodologa de la minera de datos
Un trabajo de minera de datos podramos decir que tpicamente consta de las
siguientes partes:
1. Entendimiento del problema: se trata de hablar con el cliente, conocer sus
necesidades, conocer su negocio o actividad, conocer qu datos relevantes tiene
disponibles y cules seran necesarios pero no estn disponibles, etc.
2. Entendimiento de los datos: hay que saber qu significan los datos, si son
continuos o discretos, qu tipo de valores toman, qu utilidad futura pueden tener
y saber si estn bien capturados o no.
3. Preparacin de datos: se trata de reflexionar sobre cmo guardar los datos.
Tpicamente hablaremos de tablas con filas y columnas, pero hay que ver cmo se
organizan las tablas, cmo se interrelacionan entre ellas, etc. En definitiva
organizar los datos para poder sacarles partido.
4. Modelamiento: una vez se tienen los datos organizados hay que definir los
algoritmos que se van a utilizar para tratar los datos. Una vez tratados, los datos
nos devolvern informacin til.
5. Evaluacin: los resultados obtenidos deben de ser sometidos a comprobacin,
verificar que estn libres de errores, ratificar que son tiles para los objetivos
perseguidos, etc.
6. Despliegue funcional-comercial: una vez se tiene automatizada la captura y
tratamiento de datos para obtener unos resultados, se desarrollan herramientas,
normalmente en forma de aplicaciones informticas que permiten generar alertas,
informes, estadsticas, etc. que tienen una utilidad directa para la toma de
decisiones y sistema de informacin del cliente.
En los ltimos aos, empresas como ORACLE y SQL Server han incorporado
algunos algoritmos o tcnicas para el anlisis de datos, buscando facilitar el
proceso de descubrimiento de conocimiento para la toma de decisiones.
SQL Server Data Mining: es una herramienta que contiene las caractersticas
necesarias para crear complejas soluciones de minera de datos, ya que permite:
Utilizar SQL Server Management Studio para acceder y proteger los objetos
de minera de datos.
rboles de decisin.
Bayes naive.
Clsteres.
Redes neuronales.
Serie temporal.
Regresin lineal.
Clsteres de secuencia.
Asociacin.
rboles de decisin.
Atributo relevante.
Caracterstica de seleccin.
-Naive Baye
El algoritmo Naive Baye predice la salida de una identidad basndose en los datos
de observaciones conocidas. Por ejemplo, si una persona tiene una altura de 6
pies y 6 pulgadas (1,97 m) y lleva una talla 14 de zapatos, el algoritmo Naive Baye
podra predecir con una determinada probabilidad que la persona es un hombre.
-Algoritmo CART
"CART" es una sigla en ingls que significa anlisis de rbol regresivo y de
clasificacin. Al igual que los anlisis de rboles de decisin, organiza los datos
segn opciones que compiten, como si una persona ha sobrevivido a un
terremoto. Al contrario que los algoritmos de rboles de decisin, que slo pueden
clasificar una salida o una salida numrica basada en la regresin, el algoritmo
CART puede usar los dos para predecir la probabilidad de un evento.
Bibliografa
Barreiro Fernandez, J. M., Diaz de Castro, J. A., Ruzo Sanmartin , E., & Losada
Perez, F. (2003). Gestion cientifica empresarial: temas de investigacion
actuales . Corua : NETBLILO , S.I.
Cesar, K. (2006). Aprende a programar . Obtenido de Aprende a programar :
http://aprenderaprogramar.com/index.php?
option=com_attachments&task=download&id=197
Copyriht. (2009). Obtenido de Copyriht: http://www.tecnologiasinformacion.com/mineria-de-datos.html
Daedalus-Data, Decisions and Language, S.A. (1998). Obtenido de Daedalus:
http://www.daedalus.es/que-tecnologias-nos-diferencian/inteligencia-denegocio/mineria-de-datos/
Day, G. (2006). ehowenespanol. Obtenido de ehowenespanol:
http://www.ehowenespanol.com/mejores-10-algoritmos-mineria-datosinfo_295108/
Hernandez Orallo, J., Ramirez Quintana , M. J., & Ferri Ramirez , C. (2004).
Introduccion a la mineria de datos . Barcelona: Alhambra, S.A .