You are on page 1of 11

MINERIA

de D
ATOS
¿QUE ES?
La minería de datos es el proceso de extraer información útil de una acumulación de
datos, a menudo de un almacén o de la recopilación de conjuntos de datos vinculados.
Las herramientas de minería de datos incluyen potentes capacidades estadísticas,
matemáticas y analíticas cuyo objetivo principal es examinar grandes conjuntos de
datos para identificar tendencias, patrones y relaciones para dar soporte a la toma de
decisiones fundamentada y a la planificación.
¿CÓMO FUNCIONA DATA MINING?

Comprenda el problema, o el área de investigación. El responsable de la toma de decisiones


El enfoque depende del tipo de preguntas que empresarial, necesita una comprensión general del dominio en el que trabajarán: los tipos de datos
se hagan, del contenido y la organización de la internos y externos que formarán parte de esta exploración. Se supone que tienen un conocimiento
base de datos o conjuntos de datos que íntimo del negocio y de las áreas funcionales involucradas.
proporcionan la materia prima para la Recopilación de datos. Se inicia con sus sistemas y bases de datos internos, y que todos estén en
búsqueda y el análisis. un almacén, esto incluye cualquier dato de fuentes externas que formen parte de sus operaciones
Para esto, hay algunos pasos organizacionales y algunos datos externos
y preparatorios que deben completarse para
preparar los datos, las herramientas y los Preparación y comprensión de los datos. Para ayudar a definir, categorizar y organizar los datos.
usuarios: Esta parte del proceso a veces se llama disputa de datos o munging. Algunos de los datos pueden
necesitar limpieza para eliminar duplicados, inconsistencias, registros incompletos o formatos
obsoletos.
Formación de usuarios. Se brinda capacitación formal a sus futuros mineros de datos, así como
alguna práctica supervisada a medida que comienzan a familiarizarse con estas poderosas
herramientas.
1. El científico de datos o minero de datos comienza por identificar los objetivos y el alcance del proyecto. Trabajan
FASES DEL PROCESO conjuntamente con las partes interesadas de la empresa para identificar cierta información.
Problemas que se deben abordar
1 COMPRENSIÓN DEL NEGOCIO Restricciones o limitaciones del proyecto ¡Idea genial!
El impacto empresarial de las posibles soluciones
2. Una vez que comprenden el problema empresarial, los científicos de datos comienzan a realizar un análisis preliminar
2 COMPRENSIÓN DE DATOS de los datos. Recopilan conjuntos de datos de diversos orígenes, obtienen los derechos de acceso y elaboran un
informe de descripción de datos. El informe incluye los tipos de datos, la cantidad y los requisitos de hardware y
3 PREPARACIÓN DE LOS DATOS software para el procesamiento de datos
3. Los mineros de datos dedican la mayor parte del tiempo a esta fase porque el software de minería de datos requiere
datos de alta calidad. Los procesos empresariales recopilan y almacenan datos por razones distintas a la minería.
4 MODELO DE DATOS (LIMPIAR, INTEGRAR Y DAR FORMATO)
4. Los mineros de datos introducen los datos preparados en el software de minería de datos y estudian los resultados.
Para ello, pueden elegir entre múltiples técnicas y herramientas de minería de datos
5 EVALUACIÓN 5. Una vez creados los modelos, los mineros de datos comienzan a medirlos con respecto a los objetivos empresariales
originales. Comparten los resultados con los analistas de negocio y obtienen comentarios. Es posible que el modelo
responda adecuadamente a la pregunta original o que muestre patrones nuevos y desconocidos hasta el momento
6 IMPLEMENTACIÓN 6. Durante la implementación, otras partes interesadas utilizan el modelo de trabajo para generar inteligencia
empresarial. El científico de datos planifica el proceso de implementación, que incluye instruir a otros sobre las
funciones del modelo, realizar un seguimiento continuo y mantener la aplicación de minería de datos.
TÉCNICAS
3 Agrupación de clústeres
1 Mineria de reglas de asociación La agrupación en clústeres consiste en agrupar varios puntos
es el proceso de encontrar relaciones entre dos de datos en función de sus similitudes. Se diferencia de la
conjuntos de datos diferentes y aparentemente no clasificación porque no puede distinguir los datos por
relacionados. categorías específicas, pero sí es capaz de encontrar
patrones en sus similitudes
2 Análisis de secuencias y trayectorias
El software de minería de datos también puede buscar patrones 4 Clasificación
La clasificación es una técnica compleja de minería
en los que un conjunto particular de eventos o valores conduce a
de datos que entrena al algoritmo de ML para
otros posteriores. Es capaz de reconocer alguna variación en los
clasificar los datos en distintas categorías.
datos que se produce a intervalos regulares o en el flujo y reflujo
de los puntos de datos a lo largo del tiempo.
1 2
EJEMPLOS DE Comercio electrónico. Por sus Las redes sociales son el lugar donde más
posibilidades, el comercio electrónico datos se generan día con día. Actualmente
MINERÍA DE DATOS es una de las trincheras que mayor hay más de 2900 millones de usuarios de
provecho ha obtenido de la minería Facebook, 2500 millones de YouTube y
de datos 1478 millones de Instagram. Esto significa
que la información que se comparte a
través de publicaciones, fotos y videos es
4
realmente grande.
En el área médica la minería de datos ha 3
sido de primera importancia para la A menor escala las empresas pueden
resolución de algunos de los episodios también aprovechar la minería de
contemporáneos, como la pandemia de datos para mejorar las experiencias de
covid-19. Al aplicar algunas de estas compra de sus clientes. Para ello solo
técnicas, los hospitales, farmacéuticas y basta disponer de una base de datos
gobiernos pudieron, por ejemplo, detectar en donde esté integrada la información
el foco de infección y generar estrategias de relevancia de sus consumidores.
de contención inmediatas.
La minería
¡Idea genial!
de datos, por ejemplo, puede ser utilizada para analizar los
patrones de compra de los clientes y predecir qué productos pueden ser
más populares en el futuro. También puede ser usada para detectar Aplicaciones de
fraudes financieros o para optimizar los procesos de producción. la Minería de
Además, la minería de datos puede ser utilizada en el campo de la
medicina para identificar patrones en los datos de pacientes y hacer Datos
predicciones sobre enfermedades futuras. También puede ser utilizada
en la investigación científica para analizar grandes conjuntos de datos y
descubrir nuevas correlaciones y relaciones entre diferentes variables.
Ventajas Desventajas
Información de confianza. La información que se extrae con ella Herramientas complejas. La mayoría de las herramientas que se
es totalmente fiable. emplean para minería de datos son complejas y requieren que las
Mejoras y ajustes en los procesos empresariales. La ayuda que manejen profesionales formados y especializados. Esto hace que los
proporciona para realizar ajustes operativos en las empresas. profesionales sean escasos y muy demandados.
Esto sobresale, en todo lo que se refiere a la mejora de los No es infalible. Aunque se trata de un conjunto de técnicas fiable, la
procesos logísticos. minería de datos no es infalible y no siempre proporciona información
Una mejor toma de decisiones. Las decisiones basadas en datos totalmente precisa.
siempre van a ser mejores. La minería de datos da información Privacidad. Uno de los inconvenientes de la información, sobre todo
objetiva y fiable, por lo que las empresas y los analistas pueden en el ámbito de la empresa privada, es el tratamiento de datos
tomar decisiones mucho mejores. personales.
Analiza grandes cantidades de datos rápidamente. Se puede Bases de datos. Para extraer información de manera más precisa y
procesar una mayor cantidad de información en menos tiempo. eficaz se requieren grandes bases de datos, espacio de
Predicciones. Se pueden realizar predicciones de almacenamiento y capacidad de procesamiento para tratarla.
comportamiento basadas en patrones. También es útil, en este Costes. El punto anterior nos lleva a los costes de la minería de
sentido, para la creación de algoritmos para aprendizaje datos, que, si no se trabaja con las herramientas adecuadas, puede
automático y el diseño de aplicaciones y programas específicos ser muy elevado.
de IA.
EL FUTURO DE LA MINERÍA DE DATOS
A medida que la tecnología avanza, la minería de datos seguirá siendo una herramienta
importante para las empresas y organizaciones. Se espera que la cantidad de datos
disponibles siga aumentando, lo que significa que la minería de datos será cada vez más
importante para extraer información valiosa de estos datos.
Además, se espera que la inteligencia artificial y el aprendizaje automático continúen
evolucionando, lo que permitirá a las empresas realizar análisis más avanzados y precisos.
También se espera que la minería de datos sea utilizada cada vez más en campos como la
salud y la ciencia para hacer predicciones y descubrir nuevas correlaciones y relaciones entre
diferentes variables.
CONCLUSIÓN
La minería de datos es una herramienta poderosa que puede ayudar a las empresas
y organizaciones a tomar decisiones informadas y mejorar su eficiencia. Aunque
presenta algunos desafíos importantes, se espera que la minería de datos continúe
evolucionando y siendo utilizada en una amplia variedad de campos en el futuro.
Es importante recordar que la minería de datos debe ser utilizada de manera responsable y ética,
respetando la privacidad de los datos y garantizando que se utilicen técnicas precisas y confiables
para obtener resultados precisos y útiles.
MUCHAS
GRACIAS

You might also like