obtienen explícitamente la función que transforma las entradas en salidas, esdecir la función de transformación que representa al sistema. Sin embargo, esinnegable que son un camino efectivo y eficiente para modelar los fenómenosen situaciones en donde el conocimiento explícito de los subprocesos internosno se requieren, como es el caso de muchas situaciones prácticas eningeniería.No obstante, en la minería de datos para propósitos científicos se debe hallar un equilibrio entre la interpretabilidad y la potencia predictiva de las solucionespropuestas o hipótesis. En este sentido algunas técnicas hacen énfasis en laparte de la interpretabilidad( por ejemplo Árboles de Decisión y SistemasBasados en Reglas), mientras que otras son capaces de ajustar datos hastacualquier grado de precisión deseado( por ejemplo las Redes NeuronalesArtificiales y la Programación Genética). En descubrimiento científico ambosaspectos deben ser abordados con sobriedad, ya que soluciones con altaprecisión, sin interpretación no conducen a nuevas ideas, asimismo quesoluciones fácilmente interpretables sin mucha precisión pueden proporcionar ideas que son erróneas o simplemente falsas.Dentro de las técnicas mencionadas tiene un especial interés, la ProgramaciónGenética, la cual consiste en la evolución automática de programas usandoideas basadas en la selección natural, permitiendo realizar regresión simbólica,esto es, permite obtener además de un dato numérico predictivo, una expresiónmatemática en función de las variables de entrada, que pretende identificar alsistema estudiado en lo que respecta al proceso modelado. Esto posibilita lainterpretación de los resultados, en cuanto a la dependencia entre las variablesy en cuanto a la plausibilidad física de la expresión obtenida. De todas lastécnicas de minería de datos, como se sugirió antes, la Programación Genéticaes la más promisoria en la inducción de expresiones interpretables, mostrandoademás precisión competitiva.
La aplicación de la programación genéticapara realizar regresión simbólica permitiría aumentar la expresividad de larelación entre variables independientes y dependientes en un problemadado, ya que lo que típicamente se hace es suponer una forma de relaciónfuncional entre las variables( que en la mayoría de los casos correspondea formas lineales o de alguna forma linealizables) y luego medianteregresión de mínimos cuadrados estimar los coeficientes. Esto a pesar dehaber permitido resolver muchos problemas a lo largo de muchos años,también ha limitado la aplicación de formas funcionales no lineales.
A la fecha, ya son muchos los investigadores que han desarrollado modelosinspirados en regresión simbólica, aplicados a diversos problemas eningeniería[ver IHE-Stowa, 2001; ASCE, 2002, Dibique Y. B. Et al, 2001;Obregón N.,1999; Obregón N., 2002; Obregón N., 2002ª, Obregón N., 2003,Tokar, A. S. Et al. , 2000; Cousin, N. Et al., 1997; Keijzer, M. Et al. 1999,Morshed, J. Et al. 1998; Solomatine D. P. Et al. 1996; Tsoukalas, L. H. Et al.,1997; Smith, J., et al. 1995; Abbot, M. B., 1997; Solomatine, D. P. 2002; Koza,1992],sin embargo en la literatura científica colombiana, hasta donde se harevisado, a pesar de la existencias de algunos trabajos desarrollados en eldepartamento de Ingeniería de Sistemas de la Universidad Nacional deColombia(Velasquez, J. D., 1997) y los presentados en algunos congresos, sonpocas las publicaciones que se han reportado sobre programación genética.
Leave a Comment
Otra ves bloqueando la descarga??. La idea no es compartir?
bueno