Instituto Tecnológico de Santo Domingo

Instituto Tecnológico de Santo Domingo
“INTEC”
 Asignatura:
Fundamentos de Tecnología de la Información.
 Tema:
“Datamining”.
 Profesor:
Natanael Gerónimo.
 Estudiante:
Edgar Alexander Santana Miranda.
 Matrícula:
09-0858.
 Sección:
04.
Datamining
 Objetivos Generales
 Recurrir al uso de esta tecnología para propiciar un desarrollo un desarrollo sostenible.
 Explicar sobre los conceptos fundamentales de la minería de datos, para motivar a los
estudiantes a utilizar esta innovadora tecnología.
 Incentivar a los usuarios que a través de las técnicas del Datamining (Minería de
Datos), para que hagan un buen uso de ellas.
 Objetivos Específicos
 Concienciar al usuario para que haga uso de esta tecnología.
 Analizar de que manera esta satisface las necesidades requeridas por el usuario.
 Conocer de que manera nos ayuda a administrar la energía.
 Conocer los beneficios que nos aporta esta tecnología.
 Métodos y Técnicas
Las técnicas de la minería de datos no son más que algoritmos, más o menos
sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados.
Las técnicas más representativas son:
 Redes neuronales: Son un paradigma de

aprendizaje y procesamiento automático inspirado
en la forma en que funciona el sistema nervioso
de los animales. Se trata de un sistema de
interconexión de neuronas en una red que
colabora para producir un estímulo de salida.
 Regresión lineal: Es la mas utilizada para formar relaciones

entre datos. Rápida y eficaz pero insuficiente en espacios
multidimensionales donde puedan relacionarse más de 2
variables.
 Árboles de decisión: Es un modelo de predicción utilizado

en el ámbito de la inteligencia artificial, dada una base de
datos se construyen estos diagramas de construcciones
lógicas, muy similares a los sistemas de predicción basados
en reglas, que sirven para representar y categorizar una
serie de condiciones que suceden de forma sucesiva, para
la resolución de un problema.
 Modelos estadísticos: Es una expresión simbólica
en forma de igualdad o ecuación que se emplea en
todos los diseños experimentales y en la regresión
para indicar los diferentes factores que modifican la
variable de respuesta.
 Agrupamiento o Clustering: Es un procedimiento

de agrupación de una serie de vectores según
criterios habitualmente de distancia; se tratará de
disponer los vectores de entrada de forma que
estén más cercanos aquellos que tengan
características comunes.
 Procedimiento
El Datamining (minería de datos), es el conjunto de técnicas y tecnologías que

permiten explorar grandes bases de datos, de manera automática o semiautomática,
con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado contexto.
Básicamente, el Datamining surge para intentar ayudar a comprender el

contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y,
en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las
redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el
usuario les atribuye algún significado especial pasan a convertirse en información.
Cuando los especialistas elaboran o encuentran un modelo, haciendo que la
interpretación que surge entre la información y ese modelo represente un valor
agregado, entonces nos referimos al conocimiento.
El procedimiento para aplicar este conjunto de técnicas suele componerse de

cuatro etapas principales:
 Determinación de los objetivos. Trata de la delimitación de los objetivos que

el cliente desea bajo la orientación del especialista en Datamining.
 Pre-procesamiento de los datos. Se refiere a la selección, la limpieza, el

enriquecimiento, la reducción y la transformación de las bases de datos. Esta
etapa consume generalmente alrededor del setenta por ciento del tiempo
total de un proyecto de Datamining.
 Determinación del modelo. Se comienza realizando unos análisis estadísticos

de los datos, y después se lleva a cabo una visualización gráfica de los
mismos para tener una primera visualización gráfica de los mismos para
tener una primera aproximación. Según los objetivos planteados y la tarea
que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en
diferentes áreas de la Inteligencia Artificial.
 Análisis de los resultados. Verifica si los resultados obtenidos son coherentes

y los coteja con los obtenidos por los análisis estadísticos y de visualización
gráfica. El cliente determina si son novedosos y si le aportan un nuevo
conocimiento que le permita novedosos y si le aportan un nuevo
conocimiento que le permita considerar sus decisiones.
En resumen, el Datamining se presenta como una tecnología emergente, con
varias ventajas: por un lado, resulta un buen punto de encuentro entre los
investigadores y las personas de negocios; por otro, ahorra grandes cantidades de
dinero a una empresa y abre nuevas oportunidades de negocios. Además, no hay duda
de que trabajar con esta tecnología implica cuidar un sinnúmero de detalles debido a
que el producto final involucra "toma de decisiones".
 Hipótesis
La Minería de Datos favorecerá a diversas áreas académicas, especialmente

en la administración empresarial basada en la relación con el cliente.
 Variables
La Minería de Datos se ha visto en la necesidad de adquirir innovaciones en

los últimos años con respecto a las estrategias de marketing, la extensión de los
modelos de compra en línea, a los cambios tecnológicos, etc. Entre las más
importantes que podríamos mencionar están: la necesidad de integrar los algoritmos y
resultados obtenidos en sistemas operacionales; la importancia que han cobrado los
datos no estructurados, ya sean textos, páginas de Internet, etc.; la exigencia de que
los procesos funcionen prácticamente en línea; los portales de Internet; y los tiempos
de respuesta, es decir, el gran volumen de datos que hay que procesar en muchos
casos para obtener un modelo válido es un inconveniente.
 Marco teórico
El Datamining se podría definir como la búsqueda de patrones dentro de grandes

bases de datos, utilizando para ello métodos estadísticos y de aprendizaje basado en
computadora. Élla está empezando a extenderse en nuestro país. Empresas que
trabajan con telecomunicaciones, financiamiento y autoservicio están gestionando el
adquirir alguna solución tecnológica procedente de este campo, razón por la cual brota
una demanda por recursos humanos con conocimientos en minería de datos.
Desde los años sesenta, los estadísticos manejaban términos como data fishing,
Datamining o data archaeology con la idea de encontrar correlaciones sin una hipótesis
previa en bases de datos con ruido. Esto quiere decir que la idea de Datamining no es
de ahora. A principios de los años ochenta, Rakesh Agrawal, Gio Wiederhold, Robert
Blum y Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los términos de
data mining y KDD. A finales de los años ochenta sólo existían un par de empresas
dedicadas a esta tecnología, y, desde el 2002, existen más de 100 empresas en el
mundo que ofrecen alrededor de 300 soluciones.
 Justificación y Alcances
La minería de datos puede contribuir significativamente en las aplicaciones de

administración empresarial basada en la relación con el cliente. En lugar de contactar
con el cliente de forma indiscriminada a través de un centro de llamadas o enviando
cartas, sólo se contactará con aquellos que se perciba que tienen una mayor
probabilidad de responder positivamente a una determinada oferta o promoción.
Por lo general, las empresas que emplean minería de datos ven rápidamente
el retorno de la inversión, pero también reconocen que el número de modelos
predictivos desarrollados puede crecer muy rápidamente.
En lugar de crear modelos para predecir qué clientes pueden cambiar, la
empresa podría construir modelos separados para cada región y/o para cada tipo de
cliente. También puede querer determinar qué clientes van a ser rentables durante una
ventana de tiempo (una quincena, un mes,...) y sólo enviar las ofertas a las personas
que es probable que sean rentables. Para mantener esta cantidad de modelos, es
necesario gestionar las versiones de cada modelo y pasar a una minería de datos lo
más automatizada posible.
Esta puede abarcar amplios campos de aplicación como son hábitos de

compra en supermercados, patrones de fuga, fraudes, recursos humanos,
comportamiento en Internet, terrorismo, juegos, ciencia e ingeniería, genética,
ingeniería eléctrica y análisis de gases.
 Bibliografía
 OICP, Historia de Dataminig, Publicado: 19 Septiembre 2007, Consulta: 20 Enero 2010,

desde <http://oicp.blogspot.es/>.
 Wikipedia: La Enciclopedia Libre, Minería de Datos, Modificado: 18 Enero 2010,

Consulta: 19 Enero 2010, obtenido desde
<http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#Ejemplos_de_uso_de_la_miner.C3.ADa_de_datos>.
 Sinnexus, Datamining (Minería de Datos), Publicado: 2007, Consulta: 15 Enero 2010,

obtenido desde <http://www.sinnexus.com/business_intelligence/datamining.aspx>.

Instituto Tecnológico de Santo Domingo

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Instituto Tecnológico de Santo Domingo

Uploaded by

Copyright:

Available Formats

Instituto Tecnológico de Santo Domingo

Las técnicas más representativas son:

 Redes neuronales: Son un paradigma de

 Regresión lineal: Es la mas utilizada para formar relaciones

 Árboles de decisión: Es un modelo de predicción utilizado

 Agrupamiento o Clustering: Es un procedimiento

El Datamining (minería de datos), es el conjunto de técnicas y tecnologías que

Básicamente, el Datamining surge para intentar ayudar a comprender el

El procedimiento para aplicar este conjunto de técnicas suele componerse de

 Determinación de los objetivos. Trata de la delimitación de los objetivos que

 Pre-procesamiento de los datos. Se refiere a la selección, la limpieza, el

 Determinación del modelo. Se comienza realizando unos análisis estadísticos

 Análisis de los resultados. Verifica si los resultados obtenidos son coherentes

La Minería de Datos favorecerá a diversas áreas académicas, especialmente

La Minería de Datos se ha visto en la necesidad de adquirir innovaciones en

El Datamining se podría definir como la búsqueda de patrones dentro de grandes

La minería de datos puede contribuir significativamente en las aplicaciones de

Esta puede abarcar amplios campos de aplicación como son hábitos de

 OICP, Historia de Dataminig, Publicado: 19 Septiembre 2007, Consulta: 20 Enero 2010,

 Wikipedia: La Enciclopedia Libre, Minería de Datos, Modificado: 18 Enero 2010,

 Sinnexus, Datamining (Minería de Datos), Publicado: 2007, Consulta: 15 Enero 2010,

You might also like