ENSAYO SOBRE LAS APLICACIONES DEL DATA MINING MINERA DE DATOS VELASCO LPEZ FREDI
INTRODUCCIN: Cada da se genera una gran cantidad de informacin, aunque no todas las veces somos conscientes de la informacin que generamos. Un claro ejemplo de la informacin que generamos conscientemente son los registros de entrada y salida de algn lugar que as lo requiera como en el trabajo o al ser internados en un hospital aunque tambin en lo tecnolgico tal como el acceso al correo electrnico y al hacer uso del mismo para enviar y recibir e-mails. Sin embargo como ya se mencion la informacin tambin se genera de forma inconsciente, es decir informacin que no sabemos que est siendo obtenida, como por ejemplo el conteo de visitas a una pgina de internet, el registro en video de las personas que visitan un lugar o el seguimiento que en ciertas empresas e instituciones se hacen a los usuarios para conocer el comportamiento de su navegacin por internet. Sin duda la informacin se encuentra presente en muchos mbitos de la vida cotidiana, si bien la informacin que se genera no siempre es til en primera instancia, el correcto manejo de la misma puede ser fundamental para la toma de decisiones, y una correcta decisin pue de significar el crecimiento o avance de un proyecto, empresa, organizacin, etc. Por lo anteriormente mencionado encontramos que extraer esa informacin y convertirla en conocimiento es sumamente importante y con mucha mayor razn en una sociedad que se encuentra constantemente generando grandes volmenes de informacin convirtiendo esta era en la Era de la informacin. DESARROLLO: La minera de datos es parte del proceso conocido como KDD (Knowledge Discovery in Databases o proceso de extraccin del conocimiento) consiste, precisamente, en analizar y extraer la informacin contenida en las bases de datos y convertirla en conocimiento, por ello la minera de datos es aplicada en diversas reas que a continuacin se exponen. Gobierno. En el mbito gubernamental se utiliza el data mining para conocer hbitos y costumbres de la poblacin y as poder determinar las caractersticas de la misma, pudiendo predecir conductas y acciones a travs de estos datos y as tomar acciones preventivas y decisiones que generen impacto en su objeto de estudio. Esto es importante porque en pases conocidos como de primer nivel es necesario poder predecir comportamientos agresivos e incluso de terrorismo y a partir de esa prediccin poder actuar para prevenir incidentes que atenten contra la poblacin, esto solo por ejemplificar una situacin. Empresarial. En este mbito es sumamente til poder conocer informacin acerca del cliente, uno de los casos ms importantes es el de poder detectar el fraude que se realiza al utilizar y/o clonar tarjetas de crdito, lo cual genera prdidas millonarias. Una clara aplicacin del data mining para el rea empresarial es la implementacin del sistema inteligente Falcon Fraud Manager, que examina las transacciones, propietarios de las tarjetas y datos financieros para intentar detectar y disminuir el nmero de fraudes. Otras aplicaciones en empresas pueden ser la migracin de clientes, como cuando un usuario decide cambiar de modelo de celular o de compaa telefnica, tambin en las compaas televisivas, para la prediccin de la audiencia de un programa a partir del anlisis de datos histricos, y por ltimo en las empresas transnacionales como los supermercados, que utilizan el data mining para analizar la venta de un producto en cierta poca o durante algn tiempo especfico, lo cual les ayuda para poder obtener un mejor resultado en sus ganancias. Universidades. Las instituciones educativas de nivel superior buscan poder llevar un seguimiento acerca de sus alumnos, pero esto no solo durante su estancia en la universidad, si no tambin cuando estos egresan y las actividades que desarrollan por lo cual es necesario indagar en los registros y bases de datos para determinar el xito o fracaso de un alumno en combinacin con los perfiles de los egresados y los planes de estudio que se implementaron y as poder contrarrestar los nmeros negativos de alumnos en el rea profesional. Investigacin espacial Sin duda la exploracin del espacio genera grandes cantidades de informacin debido a la inmensidad del mismo y a la gran cantidad de cuerpos que existen en l, por lo mismo es necesario analizar y clasificar toda esa informacin para su rpido acceso y su fcil manejo. Deporte. En la actualidad es necesario que el atleta tenga un buen rendimiento y adems poder prevenir las lesiones, por lo cual se utilizan sistemas para implementar dietas y/o tratamientos para los atletas pero tambin en el caso de deportes donde se realizan transacciones por jugadores se puede seleccionar el fichaje de un jugador o desistir del mismo en caso de que este sea propenso a lesiones y no represente una buena inversin. Otra gran aplicacin del data mining en el deporte es la simulacin de juegos o del rendimiento de un jugador en cierta posicin y aunque esta forma de ver el deporte es un tanto frvola puede representar una ventaja competitiva al poder obtener estadsticas y patrones que representen los comportamientos de un equipo. Textos: text mining Las compaas actualmente guardan casi toda su informacin en forma de documentos y esto hace que la informacin sea ms compleja de acceder y analizar, por ello se ha desarrollado tcnicas que permiten tomar esta informacin de enormes dimensiones y poder extraer y recuperar informacin y as apoyar al text mining. El text mining se refiere a examinar una coleccin de documentos y descubrir informacin no contenida en ningn documento individual de la coleccin. Tal es el caso de la medicina, en donde podemos observar que a partir del procesamiento del historial de un paciente, es decir las enfermedades que ha tenido, los medicamentos suministrados, los tratamientos que se han seguido, las dietas que se le han dado entre otros registros, se puede determinar si es propenso padecer alguna otra enfermedad o incluso que tipo de medicamento se le puede o no administrar. Otro aspecto importante es el estudio de enfermedades asociadas con las rutinas que se presentan en las sociedades, como los ndices de estrs y su relacin con los pacientes con migraa y como esto mismo puede llevar a padecer otras enfermedades, pero tambin como se pueden combatir estos padecimientos y poder as prevenir sus consecuencias. Internet web mining Sin duda el internet es la fuente de informacin de mayor inmensidad en la actualidad y es que ah se encuentra contenida mucha de la informacin mundial y por ende su acceso se ha hecho fundamental en la vida del ser humano, desde simples consultas de informacin hasta contenidos acadmicos de alto nivel, tambin se encuentran las pginas que permiten la interaccin entre los usuarios, tales como redes sociales, sitios de chat, etc. Toda esta actividad que el usuario realiza es almacenada automticamente por servidores y es aqu donde el web mining analiza y procesa esta abundante cantidad de datos en forma de textos, videos, imgenes e incluso los clics en los enlaces contenidos en las pginas. La web mining se encarga de extraer el conocimiento del contenido de documentos o de la descripcin de los mismos, pero tambin se encarga de estructurar las ligas de una pgina web relacionndolas con el conocimiento de la www, finalmente tambin extrae modelos a partir de los logs de usuarios al acceder a la web. Conclusin. Como ya se ha dicho la informacin generada es inmensa en todos los mbitos del ser humano y poder transformar esa informacin en conocimiento es todava ms importante. Sin embargo, pese a que la capacidad de almacenamiento ha crecido, la capacidad para procesar y analizar esa informacin almacenada no ha avanzado a la misma velocidad, es por esto que el data mining es una herramienta fundamental en esta era de informacin para poder extraer, analizar y as mismo poder aplicar el conocimiento obtenido, apoyar a la toma de decisiones y descubrir nuevos caminos que ayuden a identificar estructuras en los datos. El data mining ha encontrado aplicaciones en muchos aspectos, inclusive aun sin que el humano detecte su presencia, esto debido a que, actualmente, la informacin se genera en casi todo mbito donde una persona se desenvuelve y tomar esos datos para analizarlos y obtener conocimiento que representa ventajas, ahorro de recursos, apoyo en la toma de decisiones entre otros. El data mining, pues, se encuentra aplicado principalmente en lo comercial pues trae consigo oportunidades de negocio, ahorro en grandes cantidades de dinero y un punto de encuentro para los negocios, pero es tambin una tecnologa emergente que resulta un gran apoyo para los investigadores, la medicina, el deporte y las exploraciones de nuestro mundo y el espacio exterior. Por todo lo anterior expuesto, concluyo pues, que el data mining en la actualidad se encuentra presente prcticamente en todos lados, que es una herramienta que debe ser tratada a detalle pues su objetivo final es la toma de decisiones y que su buen uso significa poder tener xito o fracaso para quien busca beneficiarse de ello.
Referencias Artculo: Data mining: torturando a los datos hasta que Confiesen. Luis Carlos Molina Flix. Universidad Politcnica De Catalunya.