V JORNADAS ASEPUMA

APLICACIONES DE REDES NEURONALES EN ECONOMÍA
Aragón Torre, Alberto1 Calzada Arroyo, J.María García Güemes, Alfredo Pacheco Bonrostro, Joaquín

Resumen
La metodología de las Redes Neuronales Artificiales, está siendo usada con profusión, dentro del campo de la Economía, hasta tal punto que existe una publicación bimensual, que trata específicamente estas aplicaciones a los mercados financieros: Neurove$t Journal. En este trabajo, se presentan las principales líneas de investigación existentes, a continuación la que nosotros estamos siguiendo, con algunos resultados iniciales, para finalizar con las líneas a seguir y una selección bibliográfica.

1. PRINCIPALES LINEAS DE INVESTIGACIÓN EN LA LITERATURA Las Redes Neuronales se están utilizando, tanto de forma individual, como unidas a otros métodos2 en múltiples campos, como pueden ser la Ingeniería, Física, Biología, … Sin pretender, por motivos obvios, hacer un survey de las aplicaciones de las Redes Neuronales dentro del campo económico, sino solo un breve resumen, decir que se están utilizando fundamentalmente en una doble dirección: predicción y clasificación, siendo respectivamente el perceptrón multicapa y los mapas auto-organizativos, los tipos de Redes más utilizadas para estos propósitos. Comenzando con las cuestiones relativas a los problemas de predicción de magnitudes económicas, casi todos los trabajos, se centran en los mercados financieros: tipos de interés, tipos de cambio, índices bursátiles de distintos países,.. Creemos que existen al menos tres motivos, por los cuales, se están utilizando estos modelos frente a otro tipo de metodologías como pueden ser los modelos ARIMA.

1 2

Universidad de Burgos. Fundamentalmente: lógica borrosa, algoritmos genéticos y temple simulado.

1

Y. en los modelos de Redes se pueden introducir fácilmente indicadores tanto chartistas como fundamentales. se comprobó la imposibilidad de intervenir en el mercado a tan corto plazo. Mejores resultados. y como suele ser habitual. concretamente a un día. se han obtenido en la predicción de quiebra de empresas. Así mismo. como mapas autoorganizativos. en concreto en el IBEX-35. se pensó que eso mismo podría ocurrir con los mercados financieros. cuando estas series no tenían un fuerte componente estacionario. venimos trabajando en la Metodología de las Redes Neuronales. 2. para utilizarlas en la predicción dentro del mercado financiero. se ha recurrido a las Redes Neuronales. El caso más interesante que hemos visto para un caso español. ni tener la necesidad de especificar previamente el tipo de relación funcional entre variables.García Güemes. dudo mucho que el autor lo publique. comenzando con predicciones a muy corto plazo. y otros El primer motivo surge del hecho de que en las primeras simulaciones efectuadas. UNOS RESULTADOS PREVIOS Desde hace un par de años. Además existe una variable que no fué considerada y que posiblemente es la más importante: la evolución de la bolsa de N. la metodología de las Redes se mostraba superior a las series temporales clásicas. es una organización de todos los bancos. sin tener que preocuparse de problemas como la multicolinealidad . En nuestro país. de forma que se pudo prever la quiebra de alguno de ellos. en este caso utilizando tanto la red de propagación hacia atrás. en predicción de precios. durante los primeros 10 minutos. 2 . en principio parecían esperanzadores. Además de lograrse. sin embargo al hacer simulaciones considerando los costes de intermediación. predicción del paro… En cuanto a los problemas de clasificación. A. ni parece muy posible que se logre. ante el fracaso del análisis clásico de las series temporales para este tipo de predicciones. y se utilizan fundamentalmente los mapas autoorganizativos. se han utilizado las Redes Neuronales. demanda de turismo. en lugar de utilizar sus resultados para hacerse rico. Los resultados obtenidos. además de trabajos relativos a predicción en mercados financieros. También indicar que no se han obtenido buenos resultados en las predicciones a corto plazo en mercados financieros. En definitiva. las Redes representan una alternativa al análisis Cluster. Para terminar. las Redes Neuronales permiten trabajar en principio más cómodamente con modelos multiperiodo y multivariable .

aún cuando se penalice el tiempo de computación en el aprendizaje. los resultados son mejores manteniendo todas las variables. se pretendía. propugnan reducir el número de variables de entrada. como es el preceptrón multicapa y una máquina de Boltzmann de entrada y salida. Las pruebas que hemos realizado al respecto. para el mismo error cuadrático medio. indican que cuando existe multicolinealidad perfecta. que si la relación entre la entrada y la salida es lineal. podían dar lugar a distintos resultados y en que sentido.V JORNADAS ASEPUMA Usamos en un principio dos arquitecturas distintas: la clásica en este tipo de estudios. comprobar si la utilización de diferentes funciones de transferencia. el error cometido será más pequeño. se estudiaron dos cuestiones que resultaban importantes para nuestro estudio. al ser el tiempo de computación menor. es mejor eliminar variables. si bien el tiempo de computación puede aumentar. Por su parte otros. tanto cuando las relaciones entre ellas son 3 . la función identidad tiene un mejor comportamiento. cuando se presenten estas circunstancias. relativa a la multicolinealidad y en general a la relación entre los componentes de los vectores de entrada. estos autores. es mejor utilizar todas las variables disponibles. Algunos indican que se pueden presentar graves problemas. como era de esperar. En cuanto al segundo punto. predecir señales de compra y de venta. Volviendo a las bases de la metodología. fué de algo más del 60%. En lo que respecta a las funciones de transferencia se llegó a la conclusión. en virtud de la salida de un vector de componentes dicotómicas. bien utilizando la técnica de Componentes Principales. al utilizar un tiempo de computación menor. tratar de resolver la polémica acerca de las variables de entrada. o aproximadamente lineal. en cuanto a tiempo de computación y memorización de la Red. utilizando un tiempo de computación incluso mayor. además de la necesidad de disponer de series más largas. bien eliminando directamente una de cada dos que presentes una elevada correlación. Por una parte. La función identidad terminaba el aprendizaje en mínimos locales peores que la sigmoide. nuevamente los costes de intermediación impiden entrar en el mercado. Por otra. La proporción de aciertos en este caso. creen que los problemas son de índole menor y que en cualquier caso. en cuanto a su número y relación. el comportamiento de la sigmoide asimétrica resultó ser mejor. En todos los demás casos. Con esta última arquitectura. para todas las relaciones no lineales. existe una polémica entre distintos autores. pues al no perderse información. Ahora bien. sin embargo. con un error cuadrático medio ligeramente más pequeño. entre las entradas y las salidas.

de modo que los valores de estas funciones. para aprovechar estas dos circunstancias. Si existe esa cuasi-combinación lineal. Como quiera que se pueden introducir. 1 X1 I XI N XN 4 . El funcionamiento de este tipo de redes. Bien es cierto. aumente extraordinariamente. se puede eliminar la capa oculta de forma. la arquitectura de la red sería la siguiente: O1 1 K OK L OL 1 J M FUNCTIONAL EXPANSION. es muy posible. entre las entradas y las salidas. sean a su vez valores de entrada en la Red. A. con lo que se podían generar todos los que fueran precisos. es el siguiente: A partir de las variables de entrada. si se han utilizado las funciones adecuadas. Gráficamente. o de la necesidad de disponer de un número muy elevado de vectores de aprendizaje. que las pruebas se han realizado simulando vectores de entrada y salida. tantas variables de entrada como se desee. y otros lineales como cuando no lo son. creemos que si se dispone de un número pequeño de datos (en relación al número de variables explicativas). que exista prácticamente una combinación lineal. En este sentido. que se pueden atenuar significativamente los problemas derivados de la memorización. puede hacerse necesario eliminar alguna de ellas. hemos comenzado a utilizar Redes de Expansión. se muestra superior la función de transferencia identidad.García Güemes. y por otra parte. cuando las relaciones entre las entradas y las salidas son lineales. siempre que se disponga del número de vectores de entrenamiento necesarios. Sin embargo. se generan con ellas un importante número de funciones no lineales. Esto hace que el número de nodos de entrada.

xi cos (xj). MIRANDO AL FUTURO PRÓXIMO En estos momentos. xi sen (xj). que sea imposible realizar un aprendizaje. en función del número de variables originales que se tomen. sen (2xi). ampliando los estudios disponibles hasta ahora. con un pequeño número de valores. con la utilización de la máquina de Boltzmann. es la obtención de un índice que replique al IBEX-35.Y. cos (3xi). habida cuenta de que disponemos de series muy largas de datos. 5 . Optimización de Rutas de Transporte y Predicción de Ventas. y añadimos un nodo con entrada constante igual a 14. con el título: Aplicaciones de las Redes Neuronales Artificiales en la Predicción del IBEX-35. variables originales.…. con los resultados que se obtengan. (Hay autores que indican que lo que cotiza es la volatilidad). En efecto manejar 35 valores con sus proporciones correspondientes es 3 Las funciones que aparecen en la literatura. pues al aumentar su número. xi xj xk.. Más optimistas nos mostramos. son el sen (xi). el número de nodos de entrada debe de ser de 102. que al fin y al cabo es la principal variable en el mercado de derivados. Otro trabajo previsto. Por tal motivo. si bien no creemos que pueda intervenirse en el mercado. utilizando esta red. sen (3xi). Indicar que no hemos encontrado ninguna referencia bibliográfica. Por tanto. cos (xi). el número de nodos de entrada a la red será de: Tasa_de_reparto Nivel_de_inventario_farmacéutico Producción Ventas consumo_medio_enfermo tasa_real_consumo Productividad_empleado Diferencia inventario_deseado Empleados Contratación_despido tasa_de_gasto_ID Gastos_en_ID demanda N= TIEMPO_RETARDO tasa_mortandad_enfermedad infectados_por_contacto tiempo_de_incubación muertos_por_enfermedad incubados contagiados desarrollados enfermos recuperados tasa_de_contacto tasa_de_recuperación sanos población_total nacimientos muertos tasa_de_nacimientos tasa_mortandad_natural Para utilizar esta red. el trabajo fundamental se centrará en el estudio del IBEX-35 a corto plazo.V JORNADAS ASEPUMA 3. Otras Aplicaciones: subIbex. la cual creemos que puede ofrecer señales de compra o de venta a medio plazo. la red puede tener tantos nodos de entrada. Para este estudio. quizá sin capa oculta. hay que ser extraordinariamente cuidadoso en las variables que se elijan. en la predicción de alguna variable financiera. estamos trabajando en un proyecto subvencionado por la Junta de Castilla y León. x1 x2… xI. xi xj. lo que facilitaría también el trabajo de gestión de una cartera individual. con lo cual si los resultados son satisfactorios creemos que puede ser útil como una herramienta más para los analistas financieros. Consideremos I. nos centraremos en el estudio de la evolución de la volatilidad. En concreto para 5 variables originales. considerando más variables e introduciendo la variación de Dow-Jones durante los diez primeros minutos tras la apertura de N. utilizaremos una red de expansión. Si expandimos completamente la red con las funciones habituales3. cos (2xi).

BIBLIOGRAFÍA 1.Nonstationary Time-Series Forecasting Withing a Neural Network Framework. A. Deseamos que se pueda conocer a priori. ANTHONY M.L. de forma que obtengamos distintos conjuntos de valores de comportamiento parecido.. International Conference on intelligent Technologies. A.M. Y GARCÍA GÜEMES A. vol 4 nº 4. Como quiera que el establecimiento de franquicias. pp 9-16 2. Y GARCÍA GÜEMES A. el número de establecimientos que deben de explotarse en propiedad y cuantos en franquicia. 4. además de que los gastos de mantenimiento se elevan considerablemente.S. Para ello se dispone de 16 variables de las 221 empresas de franquicia existentes a finales de 1996. exige un tiempo. cuantos establecimientos deben de franquiciarse y cuantos deben de ser explotados directamente por la propia empresa. Chichester. concretamente en el estudio de franquicias con capital español. 444-449. (1996). Dado que el aprendizaje puede ser supervisado. AND LAPENTA E. XI Reunión Asepelt-España. Prediction of the Ibex-35 index using neural network methodology. Para la obtención de este sub-IBEX. Ed. vol. en función de las características de la franquicia. las dividiremos en función del número de años que lleva funcionando. parece en principio que una red de propagación puede ser la adecuada. John Wiley & Sons. 4 Se hará para considerar la posible existencia de un término independiente. que dividimos en 14 de entrada y dos de salida. y otros bastante complejo para carteras personales. con lo que el problema se simplificará considerablemente. para cada año. (1995). 3. ARAGÓN TORRE A. en la proporción adecuada. 6 . Proceeedings. Para finalizar y aún cuando la metodología de las Redes Neuronales. A computational learning theory view of economic forecasting whit neural networks. Una vez se disponga de estos conjuntos. 4. en problemas de Optimización. de forma que pueda establecerse si es posible. Bilbao. El problema de la relación entre variables de entrada en las redes neuronales.García Güemes. ARAGÓN TORRE. no parece que esté ofreciendo resultados especialmente eficaces.(1996). Y BIGGS N. Refenes A.P. I pp. está previsto utilizar un mapa autoorganizativo. es nuestra intención utilizarlas para optimizar rutas de transporte. Se pretende también aplicarlas en marketing. ABECASIS S. Neurove$t Journal. su número indicará cuantos valores tienen que pertenecer al sub-Ibex y habrá que elegir un valor de cada grupo. (1997).

pp 12-20 8. Tracking the Amsterdam stock index using neural networks. pp 27-29 15. John Wiley & Sons. Ed. (1993).M. Chichester. Design of Neural Network. LAJBCYGIER P. Redes neuronales. 5. 7. 437-442 14. Neurove$t Journal vol 5.T. Granada. CALDWELL R. Análisis comparativo de los métodos de previsión univariante.. Y TRUJILLO F. 11. Y SERRANO CINCA C. I pp. The Pricing and Trading of Options Using A Hybrid Neural Network Model with Historical Volatility. International Conference on intelligent Technologies. Box-Jenkins. SUAREZ C. Self-organisation in Kohonen's SOM. VICO F. (1994). Aplicación de redes neuronales a la predicción de ventas ante situaciones fluctuantes de los precios. K. AND HYNDMAN R. (1993). FREEMAN J. 1185-1197 10.J. nº 1.. 18. Neurove$t Journal. Market Volatility as a Leading Indicator. Y LAWRENCE W.B. HAMPTON J. Proceeedings vol.P.E.V JORNADAS ASEPUMA 5.. Y GONZALEZ PAREJA A. 6. GARCÍA GÜEMES A.(1995).A. BAESTAENS D. (1997). y PACHECO BONROSTRO J. Y SKAPURA D.A. ARAGÓN TORRE A. Self organization and associative memory. Y GARCÍA GÜEMES A. 7 .U. Berlín 16. pp. FLANAGAN J. (1992).(1996). Comunicación VI reunión ASEPELTESPAÑA.M. OTERO J. Prediction of the tendency of the Ibex-35 using the Boltzmann machine. pp. (1992).(1996). Y BERGH W.(1997). Neural networks for bankruptcy prediction: The power to solve financial problems. nº 4. FLITMAN A. Wilmington.5-32 12. N'GUS 97 Bilbao. Ed. Refenes A.E.M. Predicción multivariante y multiperiodo mediante una red neuronal: estudio de un caso. GRAETTINGER. KOHONEN T. John Wiley & Sons. Delaware. Addison-Wesley Iberoamericana. (1989). 13. Springer Werlag. AI Review July/August 9. (1996). Self-organizing neural networks: the financial state of spanish companies. Chichester. Comunicación VI reunión ASEPELT-ESPAÑA.Based Financial Forecasting Systems: Data Selection and Data Process. Granada. vol 2 nº 5.Neurove$t Journal vol. SWAN A.T. Refenes A. GALACHE.. pp 27-41 17. MARTIN DEL BRIO B. (1995). Some considerations of expansion neural network. Neural Networks vol 9 nº 7. PINO R. redes neuronales artificiales y espacios de estado.A. Y MAYO J.(1997). algoritmos.L. aplicaciones y técnicas de programación.P. Estudios de Economía Aplicada nº 5. FUENTE D. COLEMAN.

. (1993). 23. XI Reunión Asepelt-España. PARGA. 21. nº 23. (1993). J. Probus Publising Company. REFENES A.Junio 22. Y DELGADO SERNA C. YAO J. Bilbao. Bankruptcy prediction by neural network. ZAPRANIS A. Trippi y Turban. A. Forecasting the CHF-USD Exchange Rates using Neural Networks. Predicción multivariante y multiperiodo de una serie temporal económica mediante una red neuronal. vol 35. 8 . y otros 19.García Güemes.M. PACHECO BONROSTRO J. Estadística española. Tesis doctoral.7 nº 2. nº 2. (1997). SERRANO CINCA C. Modificaciones en el aprendizaje de la red de propagación hacia atrás. Ed. nº 133 20. (1995).P. y FRANCIS G. THAMMACHOTE T. Financial market applications of learning from hints. Las redes neuronales artificiales en el análisis financiero. SERRANO CINCA C. Y VIRMANI R. (1995). (1994).. Y MARTIN DEL BRIO B. Revista Española de financiación y contabilidad. 26. Refenes A. (1997).P. Stock Perfomance modeling using neural networks: A comparative study with regression models. OTERO J. Y TRUJILLO F. SINGH S. YASER S. LI Y. Inteligencia artificial en mercados financieros.. Zaragoza. pp 7-13 27. vol XXIII.D. Chicago. RAHIMIAN E. 25.. Neural Networks vol. Chichester. Neurove$t Journal vol 5. (1994).A. Ed. 24. Predicción de la quiebra bancaria mediante el empleo de redes neuronales artificiales. John Wiley & Sons. AND LIM TAN C. Bolsa de Madrid..