You are on page 1of 6
Mineria de datos: Concepto, caracteristicas, estructura y aplicaciones MARIA ISABEL ANGELES LARRIETA* y ANGELICA MARIA SANTILLAN GOMEZ” Introduccién interés de las personas que dentro de las empre ‘sas son responsables de tomar decisiones direc- tivas que permitan descubrir en los datos historicos informacién util para fundamentar mejor sus decisiones, con apoyo de la mineria de datos. Por ello se expondran las caracteristicas de estos programas, su estructura general y algunas de sus aplicaciones. E: objetivo del presente articulo es despertar el Alolargodela vidade una empresa seacumulan grandes cantidades de datos que son almacenados, algunos de ellos serén usados, otros se acumularén hasta perderse por falta de actualidad o por cambios en las politicas de manejo de datos. ‘Ahora con el desarrollo de los sistemas de cémputo, las ‘empresas tienen la capacidad de almacenar y accesar, en archivos o bases de datos, grandes cantidades de datos hist6ricos sobre las operaciones diarias de su ‘negocio; informacién que en su momento fue usada para satisfacerlas necesidades propias dela empresaycomo soporte de las decisiones. Todos esos archivos contie- nen normalmente gran cantidad de datos que serian de utilidadsifuera posible aprovecharlos mediante procesos que arrojarian informacién util La mayoria de las organizaciones no sufre por falta de datos, sino més bien por exceso, por lo que cada vez es més complicado buscar datos especificos yi que permitan tener una vision mas completa y clara dela situacién operacional de la empresa para mejorar la manera en que se toman las decisiones. Las dreas de sistemas han venido trabajando para crear extractos de informacion de las bases de datos operat nales y almacenar estos datos en archivos, tratando de respondera las peticiones de los usuarios que necesiten obtener informacin que les ayude a tomar mejores decisiones. Las necesidades de informacién han hecho que se disefien sistemas de informacién ejecutiva y de apoyo a la toma de decisiones ~"tienen como objetivo primordial proveer de toda la intormaciénnecesariaalos ejecutivos de alto nivel para apoyarlos en la toma de decisiones, ademas de que les permite tener acceso rapido y efectivo aa informacién compartida y critica del negocio’-"; sin embargo, las demandas de las empre- sas, conrelaciénala informacién, vanmds alld de simples consultas, tabulaciones cruzadas 0 reportes consolida- dos; lo que ha hecho que se creen nuevas formas de andlisis de la informacién, con ventajas respecto de las que se conocian porque incorporan hechos sistematicos, que relacionan mds de dos variables. Concepto La mineria de datos es el proceso que tiene como propésito descubrir, extraer y almacenar informacion “Maria Isabol Larriota, egresada de Ia Licenciatura en Informética de la FCA-UNAM, actualmente es jefa del Departamento de Estadistica de la Unidad de Sistemas de la Facultad de Medicina de la UNAM. “Angélica Maria Santillan Gémez, egresada de la Licen- ‘clatura en Informatica de la FCA-UNAM, en este momento labora como téenico administrativo en Ia Subdireccién de Sistemas de la Direccién General de Personal de la UNAM. "GONZALEZ BONILLA, Marisol, Introduccién a los sistemas de informacién ejecutiva y la evaluacién de herramientas para su desarrollo, Soluciones Avanzadas, Nim. 35, 15 de julio 1996. so G relevante de amplias bases de datos, a través de progra- mas de busqueda e identificacién de patrones y relacio- nes globales, tendencias, desviaciones y otros indicado- res aparentemente cadticos que tienen una explicacion que pueden descubrirse mediante diversas técnicas de esta herramienta. EI objetivo fundamental es aprovechar el valor de la informacién localizada y usar los patrones preestableci- dos para que los directivos tengan un mejorconocimiento de sunegocioy puedan tomar decisiones mas confiables. Ventajas sobre otras herramientas de manejo de datos Las caracteristicas que destacan la mayor parte de los fabricantes de estas herramientas son: © Lamineriade datos auxiliaa los usuarios empresaria- les en el procesamiento de reservas de datos para descubrir relaciones de las que, en algunos casos, anteriormente ni siquiera se sospechaba Lainformaci6n obtenida através dela mineriade datos ayuda a los usuarios a elegir cursos de accién y a definirestrategias competitivas, porque conoceninfor- ‘macién que sélo ellos pueden emplear. Los seres humanos tienen la capacidad para percibir ‘excepciones y anormalidades rapidamente pero no tienenla habilidad para inferirrelaciones que en gran- des volmenes de datos, por lo que la mineria de datos, mediante modelos avanzados y reglas de induccién, puede examinar gran cantidad de datos y encontrar patrones dificiles de identificar a simple vista. Puede trabajar siguiendo los mismos criterios con grandes cantidades de informacién histérica. El proceso de biisqueda puede ser realizado por herramientas que automaticamente buscan patrones porque asi estan programadas y despliegan los tépi- cos mas importantes. Mineria de datos: concepto, caracteristicas, estructura y aplicaciones Estructura © Algoritmos o programas de biisqueda mineros. Lamineriade datos hace usode programas de bisqueda para detectar desviaciones, tendencias ypatrones ocul- tos en los datos histdricos. Los mineros son programas pensados y creados por el usuario, en los que se emplean técnicas diferentes para laexplotaci6n de los datos, tales como cluster, asociacio- nes, clasificacién, visualizacién, redes neuronales, algo- ritmos genéticos, deteccién de desviaciones, entre otros. Todos ellos requieren bases de datos detamafio conside- rable para que puedan ser eficientes. Lafuncién delos programas mineros es correlacionarlos criterios de seleccién y bisqueda con los datos histéri- cos; si encuentran algo interesante lo presentan al usua- rio como un hallazgo. Los programas mineros trabajan con procesos automati- 08 principalmente sobre bases de datos relacionales para buscar datos extrafios,” patrones, tendencias 0 desviaciones; pueden ser ejecutados fuera de las horas pico, usando tiempos de maquina excedentes de noche © en horas de poco proceso, lo que los convierte en ayudantes importantes. Una ventaja de los mineros es que norequieren hardware especial 0 dedicado. Trabajan en las redes de oficinas nacionales 0 regionales, utilizando por las noches el servidor de la base de datos relacional, y las PC's 0 estaciones de trabajo ya existentes. Es decir trabajan sobre datos ya recolectados, en maquinas ya.existentes, realizando labores utiles mientras los usuarios no se encuentran trabajando. * Son datos desconocidos 0 poco comunes ena informacién que se ‘std manejando. Ma. Isabel Angeles. L. / Angélica M. Santillan © Datos histéricos (en dénde buscan). ‘Son datos estables y coherentes que se van acumulando allo largo de la vida operativa de una empresa. © Criterios de biisqueda (qué se busca). ‘Sona normas, tendencias y patrones desde los cuales los programas mineros realizarén el proceso de seleccién y biisqueda en los datos histéricos. La prioridad de biisqueda, los criterios de interés y las explicaciones de situaciones extrafias son definidas por el usuario. Una vez establecidos los criterios de seleccién y biisqueda. Seanalizan os datos hist6ricos reportando los haliazgos inmediatamente en unarchivo para su posterior revisiony © Almacenamiento de hallazgos (Cofre de tesoros). Los hallazgos son los datos resultantes de correlacionar los criterios de seleccién y busqueda con los datos hist6ricos. El ser humano desempefia un papel funda- mental, ya que sélo é! puede decidir si este patrén, tendencia 0 criterio, tiene importancia, pertinencia y utilidad para la empresa. Ciclo de la mineria de datos £Cémo funciona la mineria de datos? El proceso de la mineria de datos es un ciclo, debido a que los resultados obtenidos pueden alimentar nueva- mente dicho proceso; intervienen, principalmente, cuatro pasos que se decriben a continuacién:? 1. Los usuarios de la informacion deberén identificarlos problemas del negocio ylas areas en donde los datos pueden dar valoragregadoala empresa, estoes:araiz de un problema surge la necesidad de analizar a detalle los datos de la empresa para poder encontrar posibles soluciones al mismo, obien, informacién que haga que las decisiones tomadas sean lo mas certe- ras posibles. Asimismo, es importante identificar las reas en dondelainformaciénes muycambiante, pero G81 primordial para la competitividaddelaempresa. Para esto pueden manejarse diferentes criterios, no se puede decir especificamente cudles son|los corrects debidoa que esto depende de las caracteristicasdela ‘empresa, pero eloobjetivoaperseguir es determinarlos criterios, ideas, normas y cuestionamientos que fun- girdn como entrada para el proceso de mineria de datos. 2. Elusuario para analizar'ainformacién histérica selec cionard elalgoritmo oalgoritmos adecuados de mine- ria, Posteriormente, estos algoritmos son traducidos a programas mineros que realizardn las busquedas con|os criterios previamente definidos. Existen varias dificultades que pueden interferir con el resultado que se obtenga del analisis y esto es porque los datos se pueden encontraren diferentes formas, formatos yenmiltiples sistemas, aunado aque pueden provenir de fuentes internas o externas; para resolver este problema actualmente se ha hecho uso del data warehouse, que pretende reunirlos datos mésimportantes dela empresa en una especie de base de datos corporativa, la cual requiere una gran cantidad de gigabytes, no siempre disponible en|as organizaciones, sin embargo, es posible hacer mineria de datos sin necesidad de tener el data warehouse, pero es muy importante tener claro que la informacién deberd estar lo mas uniforme y congruent Posible, ya que mucho depende de estolacertidumbrede los resultados que arroje. 3. Incorporar'ainformacién obtenidaa través del proceso de mineria de datos al proceso de tomade decisions asi como presentar los hallazgos encontrados a los responsables de las operaciones de forma que la informacién obtenida pueda integrarse en los proce- sos dela empresa y pueda aplicarse ena solucinde los problemas. 2A. Berry, Michael, Gordon, Linoff, Data Mining Techniques, 2235

You might also like