• Embed Doc
  • Readcast
  • Collections
  • 2
    CommentGo Back
 
FUNDACIÓN UNIVERSITARIA KONRAD LORENZ FACULTAD DE MATEMÁTICAS E INGENIERÍAS INGENIERÍA DE SISTEMAS PROGRAMACIÓN GENÉTICAPor: Pervys Rengifo RengifoLeonardo Jiménez 
El rápido avance en sistemas de procesamiento de información en las décadasrecientes ha dirigido la investigación en ingeniería hacia el desarrollo desistemas inteligentes que puedan evolucionar modelos de fenómenos naturalesautomáticamente, “por ellos mismos”. Dentro del desarrollo de estos sistemasinteligentes, se aplican, sobre todo, técnicas del Aprendizaje de Máquina(ML),de Minería de Datos(DM) y de Inteligencia Computacional(IC), las cuales hanpermeado diferentes campos de la investigación científica y, junto con lainmensa cantidad de datos que se han registrado, han permitido el desarrollo yaplicación, en diferentes disciplinas, de algunos procedimientos clasificadoscomo modelos de cajas negras( o en ocasiones de caja gris), y que por sudependencia casi exclusiva de informacn histórica registrada, se handenominado modelos conducido por datos(data driven models). Dentro deestos modelos teóricos se pueden citar: Las Redes NeuronalesArtificiales(ANN), los Árboles de Decisión(AD), Support Vector Machine(SVM) yla Programación Genética(PG), que junto con diferentes métodos de búsquedaheurística y meta heurística como: Quimiotaxis, Búsqueda Tabú, SimulatedAnnealing(SA), Algoritmos genéticos( y otros relacionados como los algoritmosculturales y los algoritmos inmunológicos), GRASP, Ant ColonyOptimization(ACO), Particle Swarm Optimization(PSO) y con otras técnicasestadísticas y de teoría de sistemas de control tradicionales; han arrojadoresultados promisorios, lo que se evidencia por la creciente investigación enestos tópicos[ ver por ejemplo: Abbott, M.B., 1997 ; Babovic V.et al., 2001;Bailer-Jones et al., 2001; Dibique Y. B. Et al. 2001; Babovic, V., et al, 2001a;Lorrai, M. Et al.,1995; Minns, A. W et al., 1996; Muller, K.R., et al., 1997;Quinlan, J. R., 1986; Koza, J. R., 1992] y la reciente aparición de revistasespecializadas en temáticas, y la consolidación de “transdisciplinas” queinvolucran modelación convencional, modelación manejada por datos ymodelación soportada en conocimientos, aplicadas a contextos que requierenuna visión interdisciplinar, que enriquezca y permita una aproximación másefectiva a muchos problemas complejos, como es el caso de laHidroinformática, Bioinformática, Ecohidroinformática [Abbott, M.B., 1997]. Estoha facilitado la aplicación de técnicas combinadas en modelos híbridos y laintegración de Sistemas de Soporte de Decisión(DSS) para el manejo desistemas. En Colombia, la comunidad académica ya se está interesando enestas temáticas como puede apreciarse por algunas aplicaciones de RedesNeuronales Artificiales, de Árboles de Decisión y de Lógica Difusa reportadas,por algunos autores.Sin embargo, a pesar del éxito relativo en aplicaciones prácticas en muchoscampos de las ciencias y la ingeniería, estas técnicas han sido fuertementecriticadas, ya que, la mayoría de ellas, sólo proveen resultados operativos y no
 
obtienen explícitamente la función que transforma las entradas en salidas, esdecir la función de transformación que representa al sistema. Sin embargo, esinnegable que son un camino efectivo y eficiente para modelar los fenómenosen situaciones en donde el conocimiento explícito de los subprocesos internosno se requieren, como es el caso de muchas situaciones prácticas eningeniería.No obstante, en la minería de datos para propósitos científicos se debe hallar un equilibrio entre la interpretabilidad y la potencia predictiva de las solucionespropuestas o hipótesis. En este sentido algunas técnicas hacen énfasis en laparte de la interpretabilidad( por ejemplo Árboles de Decisión y SistemasBasados en Reglas), mientras que otras son capaces de ajustar datos hastacualquier grado de precisión deseado( por ejemplo las Redes NeuronalesArtificiales y la Programación Genética). En descubrimiento científico ambosaspectos deben ser abordados con sobriedad, ya que soluciones con altaprecisión, sin interpretación no conducen a nuevas ideas, asimismo quesoluciones fácilmente interpretables sin mucha precisión pueden proporcionar ideas que son erróneas o simplemente falsas.Dentro de las técnicas mencionadas tiene un especial interés, la ProgramaciónGenética, la cual consiste en la evolución automática de programas usandoideas basadas en la selección natural, permitiendo realizar regresión simbólica,esto es, permite obtener además de un dato numérico predictivo, una expresiónmatemática en función de las variables de entrada, que pretende identificar alsistema estudiado en lo que respecta al proceso modelado. Esto posibilita lainterpretación de los resultados, en cuanto a la dependencia entre las variablesy en cuanto a la plausibilidad física de la expresión obtenida. De todas lastécnicas de minería de datos, como se sugirió antes, la Programación Genéticaes la más promisoria en la inducción de expresiones interpretables, mostrandoademás precisión competitiva.
La aplicación de la programación genéticapara realizar regresión simbólica permitiría aumentar la expresividad de larelación entre variables independientes y dependientes en un problemadado, ya que lo que típicamente se hace es suponer una forma de relaciónfuncional entre las variables( que en la mayoría de los casos correspondea formas lineales o de alguna forma linealizables) y luego medianteregresión de mínimos cuadrados estimar los coeficientes. Esto a pesar dehaber permitido resolver muchos problemas a lo largo de muchos años,también ha limitado la aplicación de formas funcionales no lineales.
A la fecha, ya son muchos los investigadores que han desarrollado modelosinspirados en regresn simbólica, aplicados a diversos problemas eningeniería[ver IHE-Stowa, 2001; ASCE, 2002, Dibique Y. B. Et al, 2001;Obregón N.,1999; Obregón N., 2002; Obregón N., 2002ª, Obregón N., 2003,Tokar, A. S. Et al. , 2000; Cousin, N. Et al., 1997; Keijzer, M. Et al. 1999,Morshed, J. Et al. 1998; Solomatine D. P. Et al. 1996; Tsoukalas, L. H. Et al.,1997; Smith, J., et al. 1995; Abbot, M. B., 1997; Solomatine, D. P. 2002; Koza,1992],sin embargo en la literatura científica colombiana, hasta donde se harevisado, a pesar de la existencias de algunos trabajos desarrollados en eldepartamento de Ingeniería de Sistemas de la Universidad Nacional deColombia(Velasquez, J. D., 1997) y los presentados en algunos congresos, sonpocas las publicaciones que se han reportado sobre programación genética.
 
La actividad económica moderna, así como muchas otras, descansan en elmanejo de grandes volúmenes de información, la cual da lugar a las bases dedatos. En la actualidad tanto la cantidad como el tamaño de las bases de datoscrece rápidamente. Se desarrollan grandes bases de datos (medidas en giga yterabytes) sobre datos de los consumidores, historia de transacciones, registrosde ventas, etc... En 1990 se calculaba que existían más de medio millón deestas grandes bases de datos en el mundo. La cantidad total de datosalmacenados en las computadoras se duplica cada cinco años (aunque otrosestimados plantean que cada 20 meses) y se espera que el futuro se dupliquecada año.Este crecimiento de la cantidad de información almacenada ha sido mayor queel desarrollo de la potencia de procesamiento; las capacidades paracoleccionar y almacenar datos ha sobrepasado la habilidad para analizarlos,resumirlos y extraer conocimiento a partir de ellos. Esto ha conducido a uninterés creciente en desarrollar con fuerza la potencia de procesamiento paralograr una mejor utilización de los datos almacenados. Aunque uno de lospropósitos primarios del almacenamiento de información es su recuperacióneficiente posterior, cada vez más esta recuperación no es necesariamente unacopia fiel de los datos almacenados, sino de una nueva información que puedaser inferida a partir de estos. Es decir, desarrollar la capacidad de interpretar los datos y poder actuar basado en estas interpretaciones; de allí la fuerterelación entre la minería de datos y los sistemas de ayuda a la toma dedecisiones.Todo esto sugiere el uso de técnicas de minería de datos, con el fin de poder generar conocimiento a partir de la informacn disponible y mejorasustancialmente, aunque de forma indirecta, la comprensión de algunosprocesos y abordar modelos novedosos que hagan uso intensivo de los datos,y que permitan resolver problemas operativos a partir de la informacióndisponible. Sin embargo, dentro de los investigadores colombianos no es deconocimiento generalizado el uso de estas técnicas de minería de datos, sobretodo de Programación Genética y menos en su forma de regresión simbólica,por lo que es necesario iniciar un proceso de difusión e ilustración de laspotencialidades de las mismas, con el fin de estimular la investigación y laaplicación de estas técnicas que, lejos de ser difíciles, son muy sencillas yfáciles de usar. Además, hay una falta de bibliografía general sobre estostemas, y la poca que hay es de difícil consecución o esta muy dispersa parapropósitos prácticos; por lo tanto, se hace necesario la consolidación de unmarco conceptual amigable y disponible, que integre de forma inteligente labibliografía existentes y se constituya en una referencia de consulta básicapara las investigaciones posteriores sobre estas temáticas.En concordancia con todo lo expuesto anteriormente se propone:
Constituir un marco conceptual comprensible, que permita establecer claramente los procedimientos involucrados en las aplicaciones máscomunes, de la PG, en su forma de regresn simbólica, dandoelementos y sugerencias para potenciar e incrementar la aplicabilidadde la PG, a otros problemas, que represenndolos de maneraadecuada pudieran ser tratados exitosamente.
Identificar problemas, que al resolverlos con programación genética,permitan ilustrar los conceptos y procedimientos fundamentales de laregresión simbólica sugeridos en el marco conceptual.
of 00

Leave a Comment

You must be to leave a comment.
Submit
Characters: ...

Otra ves bloqueando la descarga??. La idea no es compartir?

You must be to leave a comment.
Submit
Characters: ...