You are on page 1of 3

SOFTWARES DE MINERIA DE DATOS

La minera de datos tiene varios significados dependiendo del el foque que le


de uno.
Por ejemplo, la minera de datos en forma general se podra definir como la
extraccin de patrones a partir de datos. Y desde el punto de vista de los
negocios o empresarial, es la integracin de reas que tienen como propsito
la identificacin de datos a partir de las base de datos que aporten el rumbo o
curso de un negocio y as tomar una buena decisin.
La minera de datos es una tecnologa compuesta por etapas que integran
varias reas y no se debe confundir con un gran software. Durante el desarrollo
de un proyecto de minera de datos se usan diferentes aplicaciones como
pueden ser de estadstica, de visualizacin de datos o de inteligencia artificial,
que es la que ms se usa principalmente.
Actualmente existen muchas aplicaciones de minera de datos muy poderosas
que contienen un sinfn de utileras que facilitan el desarrollo de un proyecto y
es ampliamente utilizado en prcticas de perfil como vigilancia,
comercializacin, descubrimientos cientficos y deteccin de fraudes.
Hay cuatro tipos de tareas que normalmente se involucran en la minera de
datos:
Clasificacin: generalizar una estructura familiar `para utilizarla en nuevos
datos.
Agrupamiento: encontrar grupos y estructuras en los datos que son lo mismo,
sin necesidad de utilizar las estructuras observadas en los datos.
Aprendizaje de reglas de asociacin: busca relaciones entre las variables
Regresin: encontrar una funcin que modele los datos con el menor error.
TIPOS DE SOFTWARE DE MINERIA DE DATOS

RAPIDMINER
Programa informtico para el anlisis y minera de datos.
Fue desarrollada en la universidad de Dortmund en 2001.
Tiene edicin gratuita (Community Edition) y edicin de paga (Enterprise
Edition, Big Data Edition, OEM Edition).

Por qu usarlo?
Posibilita la obtencin de valiosa informacin sobre el consumidor como sus
gustos e intereses, permitiendo personalizar la oferta de una empresa y lo que
hace posible aumentar la productividad a travs de modelos que solucionan los
problemas de prediccin, clasificacin y segmentacin de informacin.
sea que nos amoldamos a lo que el cliente quiere.
Se puede utilizar en:
Investigacin y educacin.
Creacin de un prototipo.
Aplicaciones empresariales.

KNIME
Es totalmente gratuito.
Fue desarrollado en la universidad de Constanza, Alemania.
Esta desarrollado sobre la plataforma eclipse y programado en java.
Es una herramienta grfica y dispone de una serie de nodos y flechas que se
despliegan y combinan de manera grfica e iterativa. Los nodos implementan
distintos tipos de acciones que pueden ejecutarse sobre una tabla de datos
como:
Manipulacin de filas, columnas, como muestreos, agrupaciones,
transformaciones.
Creacin de modelos estadsticos y de minera de datos, como rboles de
decisin, mquinas de vector soporte, regresiones.
Scoring o aplicacin de dichos modelos sobre conjuntos nuevos de datos.
Como es open-source hace posible su extensin mediante la creacin de
nuevos nodos que implementen algoritmos a la medida del usuario.
KNIME es utilizado desde el 2006 en la investigacin farmacutica pero
tambin se utiliza en otras reas como: anlisis de datos de clientes CRM
(Customer Relationship Management), inteligencia de negocios y anlisis de
datos financieros.

WEKA
Plataforma para el aprendizaje automtico y minera de datos.
Fue escrito en java y desarrollado en la universidad de Waikato.
Contiene una coleccin de herramientas de visualizacin y algoritmos para
anlisis de datos y modelado predictivo, unidos a una interfaz grfica de
usuario para acceder fcilmente a sus funcionalidades.
Puntos a favor de WEKA:
Est disponible libremente bajo la licencia pblica general de GNU.
Es muy portable porque est completamente implementado en Java y puede
correr en casi cualquier plataforma.
Contiene una extensa coleccin de tcnicas para pre-procesamiento de datos y
modelado.
Es fcil de utilizar por un principiante gracias a su interfaz grfica de usuario.
WEKA proporciona acceso a bases de datos va SQL gracias a la conexin
JDBC (Java Database Connectivity) y puede procesar el resultado devuelto por
una consulta hecha a la base de datos
COMO TRABAJAR CON WEKA
1.-Simple CLI: Intrprete de comandos o consola.
2. Explorer: Interfaz grfico principal Proporciona acceso a las distintas
funcionalidades a travs de mens y formularios de datos.
3. Experimenter: Automatiza el proceso de ejecucin de varios filtros y
clasificadores con diferentes parmetros sobre un conjunto de datos y
proporciona estadsticas de dicho proceso.
*Permite comparar rendimientos y distribuir la carga de trabajo entre varias
mquinas (experimentos grandes).
4. KnowledgeFlow: Similar al funcionamiento interno del programa, permite
crear una secuencia o circuito que recoge todo el experimento.