You are on page 1of 18

Predicciones de Valores Temporales

,
Caso de Uso: Bolsa de Valores
Diego Vel´ asquez R´ıos
diego.velasquez@ucsp.edu.pe
Universidad Cat´ olica San Pablo
Ciencia de la Computaci´ on
Arequipa - Per´ u
10 de Diciembre del 2011
Abstract
Este documento presenta un conjunto de procedimientos de miner´ıa de
datos, obteniendo indicadores econ´ omicos que ayudan a la construcci´ on
de predicciones de corto plazo para un nivel de actividad econ´ omica; los
cuales ser´ an indexados a una red neuronal para aprovechar la informaci´ o
y disminuir el riesgo de cualquier empresario para la toma de desiciones
en cuanto a la inversi´ on dentro de la bolsa de valores que se har´ a uso como
caso de estudio la bolsa de valores del Per´ u.
1 Introducci´ on
Tradicionalmente, la predicci´on de agregados macroecon´omicos se ha realizado
utilizando modelos estructurales que se construyen alrededor de las relaciones
que se derivan de la Teor´ıa Econ´omica. Estas estimaciones se utilizan prin-
cipalmente para realizar el dise˜ no y la evaluaci´on de la pol´ıtica econ´omica de
mediano y largo plazo.
Sin embargo, es frecuente que en el ejercicio real de la Pol´otica Macroecon´omica
se requieran predicciones de muy corto plazo. Por ejemplo, en la alta direcci´on
del Sector P´ ublico se necesita decidir el l´ımite de gasto p´ ublico en un determi-
nado mes, para lo cual se deben estimar los ingresos tributarios de ese per´ıodo.
Como es sabido, la recaudaci´on por impuestos est´a principalmente determi-
nada por el nivel de actividad econ´omica. Por lo tanto un buen indicador de
la evoluci´on del producto se reflejar´a en una correcta predicci´on del nivel de
ingresos, y con ello en una buena decisi´on respecto al monto de gastos que se
efectuar´a.
Otra utilidad de estas predicciones de frecuencia corta es que permiten prever
la inminencia de una recesi´on, con lo cual las autoridades econ´omicas tendr´ıan
un margen de acci´on que les ayude a minimizar los efectos de estas inevitables
fluctuaciones de las econom´ıas en la producci´on y en el empleo.
1
En este contexto, las relaciones en las que se basan los Modelos Macroeconom´etricos
pueden verse afectadas por el ruido propio de una frecuencia corta. A su vez, los
modelos econom´etricos son estructuras complicadas que utilizan gran cantidad
de variables ex´ogenas, que deben ser un tipo de entrada para las predicciones.
Es decir, las predicciones de estos modelos son condicionales a que los valores
que se han supuesto respecto a las variables ex´ogenas sean v´alidos. En modelos
para econom´oas peque˜ nas y abiertas como la Peruana, las variables ex´ogenas
t´ıpicamente suelen ser: precios de commodities, t´erminos de intercambio, crec-
imiento de la demanda mundial, entre otras. Como es claro, los supuestos que
se hagan sobre estas variables, adem´as de implicar un alto costo en tiempo de
investigaci´on y an´alisis de la coyuntura internacional suelen tener un alto mar-
gen de error, invalidando las predicciones de las variables end´ogenas.
Es por ello que desde hace mucho tiempo se vienen utilizando metodolog´ıas
estad´ısticas basadas en el concepto de “Indicadores & L´ıderes“ para realizar
predicciones de la evoluci´on futura del nivel de actividad en el muy corto
plazo. Estas t´ecnicas, a pesar de ser bastante antiguas reci´en se han gener-
alizado en nuestro pa´ıs. En particular bancos y consultoras privadas realizan
un seguimiento de estos indicadores y los utilizan para efectuar pron´osticos
de corto plazo. Adem´as, un reciente informe del Consorcio de Investigaci´on
Econ´omica propone tambi´en la utilizaci´on de un indicador adelantado, que es
conceptualmente consistente con el que aqu´ı se presenta. A su vez, debido al de-
sarrollo reciente de los m´etodos cuantitativos en la Ciencia Econ´omica, han ido
apareciendo nuevas t´ecnicas que aunadas a la mejora tecnol´ogica de las mod-
ernas computadoras han puesto a disposici´on de los investigadores una serie
de metodolog´ıas que permiten obtener mejores y m´as acertadas estimaciones y
predicciones.
1.1 Problema - Objetivo
La cantidad de datos que administra la bolsa de valores es grande, pero aun asi
no solo la transfomaci´on y comprensi´on de dichos datos son relevantes para que
un empresrio tome una desici´on de inversi´on confiable; la experiencia es la parte
m´as importante en este proceso, ya que aumenta el porcentaje de fiabilidad para
el empresario que se ded´ıca o labora en este campo.
Para poder determinar la fiabilidad de los datos y por ende para la toma de
desiciones final, es que se optar´a por aplicar un modelo de predicciones estad
isticas indexado a una mine´ıa de series temporales.
2 Conceptos
2.1 Series Temporales
Una serie temporal es una secuencia de valores observados a lo largo del tiempo,
y, por tanto, ordenados cronol´ogicamente. Aunque el tiempo es una variable
continua, en la pr´actica se usan mediciones en periodos equidistantes. Dada
esta definici´on, resulta dif´ıcil imaginar alg´ un ´area cient´ıfica en la que no aparez-
can datos que puedan ser considerados como series temporales.
2
Hoy en d´ıa el an´alisis de colecciones de datos ordenados en el tiempo es fun-
damental en muchos campos como la ingenier´ıa, la medicina o el mundo de
los negocios. Estudiar c´omo se ha comportado una variable hasta el momento
puede ser de gran valor a la hora de predecir su comportamiento futuro. Del
mismo modo, determinar qu´e otros valores han tenido un comportamiento sim-
ilar puede ayudar a decidir las acciones que se deber´an llevar a cabo, bien sea
para conservar la evoluci´on actual o bien para modificarla radicalmente.
Se puede pensar que con una comparaci´on secuencial de dos series temporales
dadas bastar´ıa para saber si son similares o no. Sin embargo, no se trata de
realizar un rastreo secuencial de dos secuencias temporales sino que se trata
de encontrar m´etodos o t´ecnicas que ayuden a disminuir ese rastreo. Esto es
muy importante si se tiene en cuenta la cantidad de informaci´on que se puede
encontrar en determinadas bases de datos, sobre todo si se tiene que extraer
informaci´on espec´ıfica de un dominio concreto. Las t´ecnicas que facilitan la
extracci´on de informaci´on de estas bases de datos forman parte del campo de
la miner´ıa de datos.
Lo primero que se necesita para poder hacer miner´ıa de datos con series tempo-
rales es una medida de la distancia ([2] , [3]) entre dos secuencias temporales. Lo
que se pretende es buscar secuencias temporales que se parecen entre s´ı, buscar
aquellas secuencias que se parecen a una dada o buscar patrones de compor-
tamiento dentro de una secuencia temporal. En definitiva, se necesita estudiar
cu´ando dos secuencias temporales son similares o no y por lo tanto una primera
cuesti´on importante es establecer una medida de la distancia. Sin embargo,
en muchos casos, esto no es suficiente dado que es necesario un paso previo
de limpieza y transformaci´on de las secuencias temporales antes de proceder a
la comparaci´on propiamente dicha. Estas transformaciones forman parte del
an´alisis de las series temporales, tanto lineales [4], como no lineales. Los traba-
jos desarrollados hasta la fecha buscan series o secciones de series temporales
que se parecen entre s´ı. Sin embargo, en algunos ´ambitos puede ser necesario
buscar una secci´on de la serie caracter´ıstica, normalmente denominada patr´on.
Existen varios trabajos relacionados con la b´ usqueda de patrones, campos como
la estad´ıstica, el procesamiento de la se˜ nal [5], algoritmos gen´eticos, y el re-
conocimiento de voz, los cuales ofrecen una variedad de t´ecnicas que se pueden
elegir para formalizar una algoritmo de comparaci´on.
Encontrar patrones ha sido una de las tareas b´asicas de la Ciencia. En oca-
siones se encuentran simetr´ıas que sirven para la predicci´on del comportamiento
de ciertos fen´omenos, incluso antes de que se entienda la raz´on o causa que jus-
tifica esa conducta.
Si dados los valores pasados de una serie no es posible predecir con total fi-
abilidad el siguiente valor esperado de la variable objeto de estudio, se dice que
la serie es no determinista o aleatoria. Este comportamiento es el que, en prin-
cipio, parecen tener las series temporales de la demanda econ´omica financiera.
En este contexto se engloba este estudio: se pretende demostrar la existencia
de un comportamiento l´ogico y ordenado de las curvas de precios utilizando
procedimientos propios de miner´ıa de datos. Evidentemente, aunque el valor
futuro de una serie temporal no sea predecible con total exactitud, para que
3
tenga inter´es su estudio, el resultado tampoco puede ser completamente aleato-
rio, existiendo alguna regularidad en cuanto a su comportamiento en el tiempo
haciendo posible su modelado y, por ende, su predicci´on. Por tanto, el objetivo
final es el de realizar una estimaci´on de valores futuros de la demanda en funci´on
del comportamiento pasado de la serie, ya que este hecho servir´a para hacer una
buena planificaci´on de recursos en funci´on de la demanda esperada en el futuro
prevista por el modelo.
Figure 1: Ejemplo de series temporales de la bolsa de valores
Modelado de Series Temporales
La forma t´ıpica de comenzar a analizar una serie temporal es mediante su rep-
resentaci´on gr´afica. Para tal fin, se utiliza un sistema cartesiano en el que los
valores o periodos de tiempo se llevan al eje de abscisas y los valores de la se-
rie, se llevan al eje de ordenadas. El resultado es un diagrama de dispersiv´on,
con la particularidad de que el eje de abscisas se reserva siempre a la misma
variable: el tiempo. Mediante este tipo de representaci´on se pueden detectar
las caracter´ısticas m´as sobresalientes de una serie, tales como la amplitud de las
oscilaciones, la posible existencia de ciclos, los puntos de ruptura o la presencia
de valores at´ıpicos o an´omalos. La metodolog´ıa utilizada para estudiar las se-
ries temporales se basa fundamentalmente en descomponer las series en varias
componentes: tendencia,variaci´on estacional o peri´odica y otras fluctuaciones
irregulares.
1. Tendencia. Es la direcci´on general de la variable en el periodo de ob-
servaci´on, es decir el cambio a largo plazo de la media de la serie. Para
determinar claramente si una serie responde a una determinada ley (crec-
imiento, decrecimiento o estabilidad) se requiere que ´esta posea un n´ umero
bastante elevado de muestras. Dicha tendencia puede corresponder a di-
versos perfiles, tales como lineal, exponencial o parab´olico. Cuando se
4
analiza este factor, se prescinde de las variaciones a corto y medio plazo.
Este par´ametro resulta de vital importancia al aplicar t´ecnicas de clus-
tering, ya que ser´a precisamente este par´ametro el que se utilizar´a para
modelar los diferentes grupos generados y sobre el que se realizar´an las
medidas de distancia para ver si un elemento pertenece a un grupo o a
otro.
2. Estacionalidad. Corresponde a fluctuaciones peri´odicas de la variable,
en periodos relativamente cortos de tiempo. Esta componente tiene un
marcado car´acter econ´omico.
3. Otras fluctuaciones irregulares (Aleatoriedad). Despu´es de extraer
de la serie la tendencia y variaciones c´ıclicas, nos quedar´a una serie de
valores residuales, que pueden ser, o no, totalmente aleatorios. Se trata
de una circunstancia similar a la del punto de partida, pues ahora tambi´en
interesa determinar si esa secuencia temporal de valores residuales puede
o no ser considerada como aleatoria pura. Los factores que causan estas
variaciones son de diferente ´ındole y son muy dif´ıciles de aislar y predecir.
No obstante, si por alguna causa se es capaz de determinar qu´e factores
son los que afectan a una serie temporal y se asume una influencia “de-
terminista” una vez ocurridos, se podr´ıa pensar en estos valores como
precursores de cambios en la tendencia de la serie.
Figure 2: Descomposici´on de una serie temporal en sus componentes
5
2.1.1 Defnici´on de volatilidad
En nuestros d´ıas el t´ermino volatilidad ha adquirido una gran importancia para
cualquier persona relacionada con los mercados financieros, aunque solo sea
como espectador. Para la mayor´ıa volatilidad es sin´onimo de riesgo, pero para
los operadores financieros este t´ermino adquiere diferentes significados seg´ un
sea el rol que desempe˜ nen en el mercado. Por lo tanto, se debe entender a la
volatilidad no como un ´ unico par´ametro, sino como un conjunto de conceptos
relacionados entre s´ı.
Ejemplo:
• Volatilidad de una acci´on: Par´ametro que mide el riesgo total de una
acci´on, esto es, el riesgo diversificable y el riesgo de mercado. Proporciona
una medida de la dispersi´on o variabilidad de la rentabilidad de dicha
acci´on. Matem´aticamente es la desviaci´on est´andar de la rentabilidad de
las acciones de una empresa.
• Volatilidad de una opci´on: Hace referencia a la volatilidad del activo
subyacente al que se refiere la opci´on.
• Volatilidad impl´ıcita: Es la volatilidad que, de acuerdo con las carac-
ter´ısticas de la opci´on, se ha de introducir en la f´ormula de valoraci´on para
obtener el precio al que cotiza la opci´on
• Volatilidad de las instituciones financieras: El riesgo administrativo
de las entidades financieras puede ser calculado mediante la estimaci´on de
probabilidad de riesgo de default, comparando las garant´ıas y plazos de
los valores prestados con los plazos de los valores tomados.
La propia estructura del mercado nos presenta los precios de los activos fi-
nancieros como un proceso que evoluciona a lo largo del tiempo, de igual forma
la rentabilidad derivada de esos cambios posee una estructura temporal asociada
a los cambios en los precios, por ende es adecuado considerar a la volatilidad
como una serie temporal y no como un ´ unico par´ametro que se mantiene a lo
largo del tiempo. Podemos, entonces, definir inicialmente a la volatilidad como
“una medida de la intensidad de los cambios aleatorios o impredecibles en la
rentabilidad o en el precio de un valor. Gr´aficamente se asocia la volatilidad
con la amplitud de las fluctuaciones del rendimiento en torno a su valor medio”.
La cl´asica visi´on de la volatilidad como una constante de la funci´on de dis-
tribuci´on de los rendimientos de un activo financiero qued´o obsoleta hace ya
mucho tiempo, para dar paso a una nueva idea del concepto de volatilidad que
se ajusta mucho m´as a la visi´on del fen´omeno de la gran variabilidad de los
mercados financieros. Los modelos financiero-econom´etricos se adaptan a esta
nueva realidad de la volatilidad. Introducen que cada vez m´as nuevos factores,
tal vez algo m´as subjetivos, pero m´as adecuados a esta cambiante realidad.
6
2.1.2 Caracter´ısticas de la Volatilidad
Repasando la literatura financiera se puede admitir que la volatilidad se carac-
teriza por:
• Exceso de curtosis: La distribuci´on de los rendimientos presenta un
elevado grado de concentraci´on alrededor de los valores centrales de la
variable.
• Existencia de clusters: periodos de alta y baja volatilidad. Si la volatil-
idad es alta en un periodo, tiende a seguir si
˜
A c ndolo; si es baja en un
periodo tiende a seguir siendo baja en el periodo siguiente.
• Discontinuidades de saltos en los precios: De manera ocasional se
pueden producir valores altos de volatilida en momentos concretos.
• Los periodos de alta y baja volatilidad acostumbran a venir seguidos
de periodos en los que la volatilidad es m´as moderada a largo plazo.
• Comportamiento asim´etrico de las series: La volatilidad puede ser
afectada de forma diferente (con rendimientos positivos o negativos) seg
˜
A
o
n
lleguen al mercado buenas o malas noticias. Los rendimientos negativos,
mayores y m
˜
A¡s infrecuentes llevan a incrementos mayores en las futuras
volatilidades.
• Movimientos conjuntos de la volatilidad: cuando se estudian difer-
entes series endito mercado, se observa como los movimientos importantes
en un mercado est
˜
A¡n relacionados con movimientos importantes en otros
mercados. Esto pone en evidencia la utilidad de los modelos multivariantes
para serie temporales, pues permiten analizar estas relaciones cruzadas.
2.2 Miner´ıa de Series Temporales
La miner´ıa de datos es una de las t´ecnicas m´as utilizadas actualmente para
analizar la informaci´on de las bases de datos. No es m´as que una etapa, aunque
la m´as importante, del descubrimiento de la informaci´on en bases de datos
(KDD o Knowledge discovery in databases), entendiendo por descubrimiento
la existencia de una informaci´on valiosa pero desconocida y escondida con an-
terioridad. Este proceso consta de varias fases, como se detalla m´as adelante,
e incorpora distintas t´ecnicas del aprendizaje autom´atico, las bases de datos,
la estad´ıstica, la inteligencia artificial y otras ´areas de la inform´atica y de la
informaci´on en general.
Algunos autores distinguen dos tipos de miner´ıa de datos[1]:
1. Mdp o miner´ıa de datos predictiva, es decir, predicci´on de datos, b´asicamente
t´ecnicas estad´ısticas. Las tareas de datos que producen modelos predic-
tivos son la clasificaci´on y la regresi´on.
2. Mddc o miner´ıa de datos para el descubrimiento del conocimiento, us-
ando b´asicamente t´ecnicas de ingenier´ıa artificial, siendo ´estas las t´ecnicas
descritas en este trabajo. Las tareas que producen modelos descriptivos
son el agrupamiento (clustering), las reglas de asociaci´on secuenciales y el
an´alisis correlacional, como se ver´a m´as delante.
7
• Clustering o agrupamiento. En s´ıntesis, consiste en la obtenci´on
de grupos, que tienen los elementos similares, a partir de los datos.
Estos elementos u objetos similares de un grupo son muy diferentes
a los objetos de otro grupo.
• Reglas de asociaci´on. Su objetivo es identificar relaciones no
expl´ıcitas entre atributos categ´oricos. Una de las variantes de re-
glas de asociaci´on es la secuencial, que usa secuencias de datos.
• An´alisis correlacional. Utilizada para comprobar el grado de simil-
itud de los valores de dos variables num´ericas.
El proceso de miner´ıa de datos tiene unas indiscutibles ventajas que se
pueden sintetizar en las siguientes:
• Proporciona poder de decisi´on a los usuarios y es capaz de medir las
acciones y resultados de la mejor manera.
• Contribuye a la toma de decisiones t´acticas y estrat´egicas.
• Supone un ahorro econ´omico a las empresas y abre nuevas posibilidades
de negocio.
• Es capaz de generar modelos prescriptitos y descriptivos.
2.2.1 Pasos necesarios para la extracci´on de conocimiento
Como se se˜ nal´o al comienzo del cap´ıtulo, la miner´ıa de datos es solo una fase
de un proceso m´as amplio cuya finalidad es el descubrimiento de conocimiento
en bases de datos (KDD). Independientemente de la t´ecnica que se use en el
proceso de extracci´on de datos, los pasos que deben ser seguidos son siempre
los mismos:
1. Definici´on del problema. En el proceso de miner´ıa de datos el primer
paso consiste en definir claramente el problema que se intenta abordar.
2. Integraci´on y recopilaci´on de datos. En un primer momento, hay
que localizar las fuentes de informaci´on, y los datos obtenidos se llevan a
un formato com´ un para que resulten m´as operativos.
3. Filtrado: selecci´on, limpieza y transformaci´on de datos. Una
vez homogeneizados los datos, se filtran y se rechazan los no v´alidos o los
incorrectos, seg´ un las necesidades, o bien se corrigen o se reduce el n´ umero
de variables posibles mediante clustering, redondeo, etc.
4. Fase de miner´ıa de datos. Algoritmos de extracci´on de conocimiento
Esta fase es la m´as caracter´ıstica y por ese motivo se suele denominar
miner´ıa de datos a todo el proceso en KDD.
Obtenci´on de un modelo de conocimiento
Una vez realizado el filtrado, se tiene que producir nuevo conocimiento
que pueda ser utilizado por el usuario. Hay que obtener un modelo de
conocimiento que se base en los datos recopilados y para ello hay que
8
determinar la tarea de miner´ıa m´as adecuada, descriptiva o prescriptiva;
posteriormente, elegir el tipo de modelo aunque pueden tambi´en usarse
varias t´ecnicas a la vez para generar distintos modelos teniendo en cuenta
que cada t´ecnica obliga a un preproceso diferente de los datos.
5. Fase de interpretaci´on y evaluaci´on del modelo. Una vez que ya
hemos obtenido el modelo hay que proceder a su validaci´on, comprobando
que las conclusiones son v´alidas y satisfactorias, es decir, verificando si los
resultados obtenidos son coherentes.
Figure 3: Fases de una miner´ıa de datos
3 Predicci´on de series temporales: t´ecnicas y
modelos a comparar
Cuando se habla de t´ecnica de predicci´on se hace referencia a aquellas t´ecnicas
dirigidas a descubrir comportamientos regulares que sean capaces de modelar
la conducta de un sistema. Consecuentemente, una aplicaci´on inmediata es
la de saber c´omo evolucionar´an los valores de una serie temporal. La mayor
parte del esfuerzo se invierte en descubrir los patrones de comportamiento y,
por esta raz´on, es un tema que est´a en constante investigaci´on [54]. El mayor
inconveniente que se encuentra en este tipo de tareas es la alta correlaci´on que
puede llegar a existir entre los atributos.
9
3.1 Predicci´on basada en m´etodos lineales
Los m´etodos de predicci´on lineales son aquellos que intentan modelar el com-
portamiento de una serie temporal mediante una funci´on lineal. Entre estos
m´etodos se destacan los modelos AR, MA, ARMA y ARIMA. Estos modelos
son una clase de procesos estoc´asticos y tienen una metodolog´ıa com´ un. Para
construir ambos modelos se siguen los pasos siguientes:
1. Identificaci´on del modelo bajo ciertas hip´otesis.
2. Estimaci´on de par´ametros.
3. Validaci´on del modelo.
4. Predicci´on.
Modelos ARCH y GARCH
Los modelo ARCH y GARCH se concentran principalmente en modelar los
cambios de varianza (o volatilidad). Generalmente estos modelos no llevan a un
mejor pron´ostico puntual de la serie, pero pueden llevar a una mejor estimaci´on
de la varianza, lo que permite tener intervalos de predicci´on m´as confiables y una
mejor medici´on del riesgo. Esto puede ser especialmente importante en algunas
series de tiempo econ´omicas y financieras, en las que pueden existir cambios im-
portantes en la varianza de la serie a lo largo del tiempo. Engle (1982) propuso
el modelo ARCH, que significa modelo auto regresivo condicionalmente hete-
roced´astico, el cual hace parte de la familia de modelos adecuados para modelar
la volatilidad de una serie.
Una clase m´as general de modelos, los GARCH (modelos generalizados auto
regresivos condicionalmente heteroced´asticos), que extiende la clase de los mod-
elos ARCH, fue introducida por Bollerslev (1991). En ´estos la estructura de la
varianza condicional depende, adem´as del cuadrado de los errores retrasados q
per´ıodos como en el modelo ARCH(q), de las varianzas condicionales retrasadas
p per´ıodos.
Modelo EGARCH o ”exponential GARCH”
Los modelos GARCH no reflejan completamente la naturaleza de la volatil-
idad de algunos activos financieros. Estos modelos no tienen en cuenta un
comportamiento asim´etrico propio de la volatilidad de los retornos de las series
financieras, que es el efecto de apalancamiento. En otras palabras, la volatilidad
se comporta diferente frente a innovaciones positivas que frente a negativas. No
reacciona de la misma manera frente a un alza en el precio de un activo que con
respecto a una ca´ıda en el precio de ´este. En los modelos GARCH, dado que la
volatilidad depende del cuadrado de los errores, esta es afectada sim´etricamente
por las innovaciones positivas y negativas. Adem´as, los par´ametros para la
volatilidad tienen restricciones: deben ser no negativos. Modelan el efecto de
asimetr´ıa de los GARCH.
10
3.2 Predicci´on basada en m´etodos no lineales
Los m´etodos de predicci´on no lineales son aquellos que intentan modelar el
comportamiento de una serie temporal mediante una funci´on no lineal. Esta
funci´on no lineal suele ser combinaci´on lineal de funciones no lineales cuyos
par´ametros hay que determinar. Los m´etodos globales se basan en encontrar
una funci´on no lineal que modele los datos de salida en funci´on de los datos
de entrada. Dentro de los m´etodos globales no lineales se encuentran las redes
neuronales artificiales que presentan la ventaja de que no necesitan conocer la
distribuci´on de los datos de entrada, las m´aquinas de vector soporte (SVM)
que son unos clasificadores muy potentes de filosof´ıa similar a las RNA y la
Programaci´on Gen´etica (PG) donde se puede elegir qu´e tipo de funci´on no
lineal modela el comportamiento de los datos.
Redes neuronales
Las redes neuronales buscan una soluci´on a determinados problemas como la
evoluci´on de unos sistemas inspirados en el cerebro humano y no como una se-
cuencia de pasos, tal y como se hace habitualmente. Estos sistemas, por tanto,
poseen una cierta inteligencia que resultante de combinar elementos simples de
proceso interconectados, neuronas, que operan de manera paralela son capaces
de resolver determinadas tareas entre las que destacan la predicci´on, la opti-
mizaci´on, el reconocimiento de patrones o el control.
Existen cuatro aspectos que caracterizan una red neuronal: su topolog´ıa, el
mecanismo de aprendizaje, tipo de asociaci´on realizada entre la informaci ’on
de entrada y salida, y la forma de representaci´on de estas informaciones.
1. Topolog´ıa de las redes neuronales. La arquitectura de las redes neu-
ronales consiste en la organizaci´on y disposici´on de las neuronas formando
capas m´as o menos alejadas de la entrada y salida de la red. En este
sentido, los par´ametros fundamentales de la red son: el n´ umero de capas,
el n´ umero de neuronas por capa, el grado de conectividad y el tipo de
conexiones entre neuronas.
2. Mecanismo de aprendizaje.El aprendizaje es el proceso por el cual una
red neuronal modifica sus pesos en respuesta a una informaci´on de entrada.
Los cambios que se producen durante el proceso de aprendizaje se reducen
a la destrucci´on, modificaci´on y creaci´on de conexiones entre las neuronas,
la creaci´on de una nueva conexi´on implica que el peso de la misma pasa
a tener un valor distinto de cero, una conexi´on se destruye cuando su
peso pasa a ser cero. Se puede afirmar que el proceso de aprendizaje ha
finalizado (la red ha aprendido) cuando los valores de los pesos permanecen
estables.
11
3. Tipo de asociaci´on entre las informaciones de entrada y salida.
Las redes neuronales artificiales no son mas que sistemas que almace-
nan cierta informaci´on aprendida. Dicha informaci´on se registra de forma
distribuida en los pesos asociados a las conexiones entre neuronas de en-
trada y salida. Existen dos formas primarias de realizar esa asociaci´on de
entrada/salida. Una primera ser´ıa la denominada heteroasociaci´on, que
se refiere al caso en el que la red aprende en parejas de datos [(A
1
,B
1
),
(A
2
,B
2
)...(A
n
,B
n
)], de tal forma que cuando se presente cierta informaci´on
de entrada A
i
, deber´a responder generandola correspondiente salida B
i
.
La segunda se conoce como autoasociaci´on, donde la red aprende cier-
tas informaciones A
1
,A
2
...A
n
, de tal forma que cuando se le presenta una
informaci´on de entrada realizar´a una autocorrelaci´on, respondiendo con
uno de los datos almacenados, el m´as parecido al de la entrada. Estos
dos mecanismos de asociaci´on de asociaci´on dan lugar a dos tipos de redes
neuronales: las redes heteroasociativas y las autoasociativas.
4. Representaci´on de la infomaci´on de entrada y salida. Las redes
neuronales pueden tambien clasificarse en funci´on de la forma en que se
representan las informaciones de entrada y las respuestas o datos de salida.
As´ı un gran n´ umero de redes, tanto los datos de entrada como de salida son
de naturaleza anal´ogica, cuando esto ocurre, las funciones de activaci´on de
las neuronas ser´an tambi´en continuas, del tipo lineal o sigmoidal. Otras
redes s´olo admiten valores discretos o binarios a su entrada, generando
tambi´en unas respuestas en la salida de tipo binario. En este caso, las
funciones de activaci´on de las neuronas son de tipo escal´on.
Figure 4: Ejemplo de una Red Neuronal
12
4 Implementaci´ on
4.1 Pasos Previos a un modelo ARCH
El inversionista tiene inter´es en analizar media y varianza condicional y al emisor
le interesa, adem´as, la media y varianza no condicional. Comencemos con un
modelo autorregresivo de primer orden:
y
t
= r
0
+ r
1
×y
t−1
+ a
t
(1)
donde el termino a
t
es un proceso de ruido blanco: sucesi´on de variables aleato-
rias, independientes y con media constante, suponemos igual a cero y varianza
asimismo constante
E(a
t
) = 0; V ar(a
t
) = σ
2
a (2)
• La media no condicional (la posici´on de largo plazo):
E [y
t
] =
r
0
1 −r
1
(3)
• La media condicional al tiempo t(la posici´on de corto plazo):
E [y
t+1
| Ω
t
] = r
0
+ r
1
y
t
(4)
donde y
t
es parte del conjunto de informaci´on
• La varianza no condicional es constante y es dada por:
V ar [y
t
] =
σ
2
1 −r
2
1
(5)
• La varianza condicional es constante y es dada por:
V ar [y
t
−E [y
t−1
| Ω
t−1
]] = σ
2
(6)
Es importante tener en cuenta que la media y varianza condicionales ofrecen
informaci´on relevante que no se debe desechar. La varianza condicional es m´as
peque˜ na por lo que el riesgo inversor es menor:
σ
2
1 −r
2
1
> σ
2
(7)
13
4.2 Modelos ARCH
La estructura b´asica del modelo es:
y
t
= a
t

t
(8)
σ
2
t
= α
0
+ α
1
.y
2
t−1
−−−−−α
0
> 0, 0 < α
1
< 1 (9)
Sustituyendo (8) en (9)
y
t
=
_
_
α
0
+ α
1
.y
2
t−1
_
.E
t−1
(y
t
) = 0 (10)
su esperanza y varianza condicional son:
V ar
t−1
(y
t
) = E
t−1
y
2
t−1
=
_
α
0
+ α
1
.y
2
t−1
_
.E
t−1
_
a
2
t
_
= α
0
+ α
1
.y
2
t−1
(11)
por lo que la varianza condicional de los rendimientos var´ıa en funci´on de la
realizaci´on del proceso y
t
.
En resumen tenemos que:
E [a
t
] = 0
1. La varianza no condicional de a
t
es constante:
E
_
a
2
t
¸
=
α
0
1 −α
1
2. La media condicional es:
E [a
t
| Ω
t−1
] = 0
3. La varianza condicional est´a dada por:
E
_
a
2
t
| Ω
t−1
¸
= α
0
+ α
1
.a
2
t−1
Lo importante es que la serie a
t
es no correlacionada. Es decir no existen
relaciones lineales entre sus valores en distintos instantes en el tiempo. Sin
embargo los errores no son independientes ya que est´an relacionados por sus
segundos momentos por una ecuaci´on en diferencias. Es decir que y
2
t
si est´a
autocorrelacionado.
14
A medida que el valor de α
1
se acerque mas a uno, tendremos el an´alogo
a una caminata al azar en la varianza y a medida que α
1
se acerque a cero,
el efecto ARCH tendr´a poca persistencia. Extendiendo esta clase de manera
general obtenemos:
a
t
= V
t
_
α
0
+ α
1
a
2
t−1
+ α
1
a
2
t−1
+ ... + α
q
a
2
t−q
(12)
siendo
α
0
> 0
α
q
0
La ecuaci´on (12) se llama un ARCH(q) con estos se incorpora al an´alisis los
fen´omenos de volatilidad variable, como son los episodios de alto nerviosismo o
incertidumbre en el mercado.
Su varianza condicional estar´a dada por:
σ
2
t
= α
0
+ α
1
a
2
t−1
+ ... + α
q
a
2
t−q
4.3 Modelos EGARCH o “exponencial de GARCH”
Para explicar bien este modelo se hace referencia a la curva de impactos
asim´etricos en la cual hacen notar que en el mercado de capitales no reper-
cuten igual las buenas noticias que las malas noticias, los movimientos a la baja
en el mercado vienen con mayores volatilidades que los movimientos al alza.
Cuando el rendimiento cae por abajo de lo esperado nos lleva a un escenario
donde las noticias son malas, esto viene asociado a la observaci´on de que la
volatilidad se incrementa y por otra parte cuando las noticias son buenas la
volatilidad disminuye.
Este modelo permite que la volatilidad condicional sea una funci´on asim´etrica
del pasado de los datos, su forma funcional puede ser escrita como:
a
t
= V
t
×
_
σ
2
t
log(σ
2
t
) = α
0
+ α
1
_
a
t−1
σ
2
t−1
_
+ β
1
log(σ
2
t−1
) + θ
_
¸
¸
¸
¸
a
t
σ
2
t−1
¸
¸
¸
¸

_
2
π
_
El modelo EGARCH permite que las noticias buenas o malas (shocks),
afecten a la volatilidad de diferentes maneras. El lado izquierdo de la ecuaci´on
es el logaritmo de la varianza condicional. Esto implica que el efecto palanca es
exponencial m´as que cuadr´atico.
La persistencia en la volatilidad viene indicada por el par´ametro β, mientras
que α
1
mide la magnitud del efecto apalancamiento. La hip´otesis del efecto
apalancamiento se testea con la significatividad de α
1
, si este coeficiente es dis-
tinto de cero significa que el impacto es asim´etrico. En este modelo se espera
que α
1
< 0, lo que implicar´ıa que innovaciones negativas tuviesen un mayor
impacto sobre la volatilidad que innovaciones positivas de igual tama˜ no.
15
El caso general ser´ıa:
a
t
= V
t
×
_
σ
2
t
(13)
log(σ
2
t
) = α
0
+ g
_
a
t−1
σ
2
t−1
_
+
p

j=1
α
j
g
_
a
t−j−1
σ
2
t−j−1
_
+
q

i=1
β
i
log
_
σ
2
t−i
_
(14)
Para esto se recomienda utilizar la funci´on g como:
g(z) = α
1
×z + α
2
×(|z| −E |z|) (15)
5 Resultados
Figure 5: Indice del Producto Bruto Real Peruano
16
Figure 6: Resultados con datos de tipo de cambio de dolar en el Peru, usando
indicadores y estadisticas pre-procesadas para insertarlo en los Modelos GARCH
y EGARCH
6 Propuesta
Los porcentajes de confiabilidad que plantean las diferentes t´ecnicas que se usan
en estad´ısticas financieras para que un empresario pueda descidir invertir o no en
la bolsa de valores no son tan buenos, es por eso ellos optan por sus conocimien-
tos y experiencia en el campo para “disminuir” los riesgos
Una ves optenidos los datos procesados y transformados en una miner´ıa de
series temporales, usaremos una red neuronal para aumentar la confiabilidad de
los datos y disminuir el porcentaje de riesgos que puede tener un empresario al
tomar una desici´on de inversi´ on en la bolsa de valores.
17
References
[1] U. M. Fayyad, G. Piatetski-Shapiro, and P. Smith ”From data mining to
knowledge discovery”. AAAI-MIT Press, 1996.
[2] T. H. Cormen and C. E. Leiserson. ”Introduction to algorithms”. The MIT
Press, 2003.
[3] H. V. Jagadish. ”A retrieval technique for similar shapes”. ACM SIGMO
Symp, on the Management of Data, 1991.
[4] A. Matus-Castillejos and R. Jentzsch. ”A time series data management
framework”. IEEE Proceedings of the International Conference on Infor-
mation Technology: Coding and Computing, 2005.
[5] R. Hippenstiel, H. El-Kishky, and P. Radev. ”On time-series analysis and
signal classification”. IEEE Conference Record of the 38th Asilomar Con-
ference on Signals, Systems and Computers, 2004.
[6] Rafael de Arce. ”Introducci´ on a los Modelos Autoregresivos con Het-
erocedasticidad condicional(ARCH)”. Programa de Doctorado en Mod-
elizaci´on Econ´omica del Instituto LR Klein diciembre de 1998.
http://www.uam.es/otroscentros/klein/doctras/doctra9806.pdf
[7] Fabian Moerchen ”Algorithms For Time Series Knowledge Mining”. Hans-
Meerwein-Str., Marburg, Germany, Databionic Research Group
[8] Hyong-Jun Kim, Seong-Min Yoon, Hwan-Gue Cho ”Capability and Lim-
itation of Financial Time-Series Data”. Prediction using Symbol String
Quantization International Conference on Convergence and Hybrid Infor-
mation Technology, 2009.
[9] Jessica Lin Eamonn Keogh Stefano Lonardi Jeffrey P. Lankford Donna M.
Nystrom ”Visually Mining and Monitoring Massive Time Series”. Com-
puter Science & Engineering Department University of California, River-
side
[10] Bera, A. K. y M.L. Higgins ”A Ssurvey of ARCH models: properties, esti-
mation and testing”. Journal of economics surveys, num 7, 1993
[11] Marta Casas Monsegny, Edilberto Cepeda Cuervo ”MODELOS ARCH,
GARCH Y EGARCH: APLICACIONES A SERIES FINANCIERAS”.
[12] De Arce, Rafael ”Introducci´ on a los modelos autoregresivos con heterocedas-
ticidad condicional (ARCH).”. I. L. Klein, diciembre de 1998
18