Professional Documents
Culture Documents
Mat 11 Tema4
Mat 11 Tema4
Tiempo
Germán
Aneiros Pérez
Introducción
Procesos
FARIMA: Part IV
Construcción
e
identificación
Estimación
Modelos de memoria larga
Diagnosis
Selección del
modelo
Predicción
Aplicación a
datos reales
Recapitulación
Series de
Tiempo
Germán
Aneiros Pérez
Introducción Introducción
Procesos
FARIMA: Comenzamos recordando la notación y suposiciones generales:
Construcción
e x1 , x2 , . . . , xT : serie de tiempo observada.
identificación
Aplicación a
datos reales
Recapitulación
Series de
Tiempo
Introducción
Germán
Aneiros Pérez Existen series reales estacionarias cuya fas:
Introducción Toma valores positivos.
Procesos
FARIMA: Presenta un decaimiento muy lento a cero a medida que el
Construcción
e
retardo crece.
identificación
El tipo de decaimiento que se observa es distinto del de los
Estimación
Diagnosis
ARIMA no estacionarios, en el sentido de que:
Selección del En los retardos bajos es más rápido.
modelo
Predicción
En los retardos altos es mucho más lento (memoria larga).
Aplicación a Estas caracterı́sticas se han observado principalmente en ciertas
datos reales
series meteorológicas, mediombientales, hidrológicas y
Recapitulación
financieras.
Series de
Tiempo
Germán
Aneiros Pérez Introducción
Introducción
El objetivo de este tema es la construcción de un modelo
Procesos estocástico (modelo FARIMA) que, de forma razonable, haya
FARIMA:
Construcción podido generar a una serie de tiempo de este tipo.
e
identificación
Estimación
Entonces, basándonos en dicho modelo, efectuaremos
Diagnosis predicciones de valores futuros de la serie de tiempo.
Selección del
modelo
De la misma forma que ocurrı́a en el caso de los modelos
Predicción
ARIMA, la base para construir los modelos FARIMA será la
Aplicación a
datos reales clase de modelos ARMA ya estudiada.
Recapitulación
Series de
Tiempo Procesos FARIMA: Construcción e identificación
Germán
Aneiros Pérez
El operador diferencia fraccional (1 − B)d (d no entero)
Introducción
Si d fuese un número entero positivo, se verificarı́a que:
Procesos
FARIMA:
(1 − B)d = di=0 di 1d−i (−B)i = di=0 αi B i ,
P P
Construcción
e
identificación
Estimación
donde αi puede escribirse como
(−1)i .
Diagnosis d!
αi = (d−i)!i!
Selección del
modelo
Predicción
Sea Γ la función gamma definida como
Aplicación a
R ∞ x−1 −t
datos reales 0 t e dt , si x > 0
Recapitulación Γ (x) = ∞ , si x = 0
−1
x Γ (1 + x) , si x < 0
Germán Aneiros Pérez Series de Tiempo
Modelos de memoria larga
Series de
Tiempo Procesos FARIMA: Construcción e identificación
Germán Teniendo en cuenta que:
Aneiros Pérez
Γ (x) = (x − 1)! para x = 1, 2, . . .
Introducción
Procesos
Γ (x) = ∞ para x = 0, −1, −2, . . .
FARIMA:
Construcción es sencillo observar que, cuando d es entero positivo,
e
identificación
(1 − B)d = ∞ i
P
Estimación i=0 αi B ,
Diagnosis
donde
Selección del
modelo Γ(d+1)
Predicción
αi = Γ(d−i+1)Γ(i+1) (−1)i .
Aplicación a
datos reales Puesto que la función Γ está definida para cualquier argumento
Recapitulación real, si mantenemos la última expresión de (1 − B)d para el
caso en que d es una fracción, tenemos construida la definición
del operador diferencia fraccional.
Germán Aneiros Pérez Series de Tiempo
Modelos de memoria larga
Series de
Tiempo
Procesos FARIMA: Construcción e identificación
Germán
Aneiros Pérez Un proceso FARIMA(p,d,q) (siendo p y q números enteros no
Introducción
negativos y −0.5 < d < 0.5) es aquél que, después de
Procesos
diferenciarlo d veces, se convierte en un proceso ARMA(p,q).
FARIMA:
Construcción
Es decir:
e
identificación
{Xt }t es FARIMA(p,d,q) ⇔ (1 − B)d Xt es ARMA(p,q).
Estimación
Diagnosis
Predicción
admite una representación del tipo:
Aplicación a
datos reales φ (B) (1 − B)d Xt = c + θ (B) at ,
Recapitulación
donde el polinomio φ (z) no tiene raı́ces de módulo 1.
Series de
Tiempo Procesos FARIMA: Construcción e identificación
Germán
Aneiros Pérez El proceso FARIMA(p,d,q):
Introducción
Es estacionario. Además,
P∞
Procesos c = (1 − φ1 − · · · − φp ) i=0 αi µ
FARIMA:
Construcción
e
Si φ (z) 6= 0 ∀z con |z| ≤ 1, entonces admite una
identificación
representación MA(∞)
Estimación
Xt = µ + ∞
P
Diagnosis i=0 ψi at−i ,
P∞ 2
Selección del con i=0 ψi < ∞ y ψ0 = 1.
modelo
Predicción
Si θ (z) 6= 0 ∀z con |z| ≤ 1, entonces admite una
Aplicación a
representación AR(∞)
at = ∞
datos reales P
Recapitulación
i=0 πi (Xt−i − µ),
P∞ 2
con i=0 πi < ∞ y π0 = 1.
Series de
Tiempo Procesos FARIMA: Construcción e identificación
Germán A partir de ahora nos centraremos en modelos FARIMA(p,d,q)
Aneiros Pérez
con 0 < d < 0.5, que son, entre los modelos fraccionales, los
Introducción
que tienen mayor interés práctico. Bajo este supuesto:
Procesos
FARIMA: Si φ (z) 6= 0 y θ (z) 6= 0 ∀z con |z| ≤ 1, entonces existe
Construcción
e una constante a > 0 tal que ρk ∼ ak 2d−1 cuando k → ∞
identificación
(decaimiento algebraico). Por tanto:
Estimación P∞
Diagnosis k=0 ρk = ∞
Selección del
modelo
(procesos de memoria larga).
Predicción
Series de
Tiempo Ejemplos de la fas de procesos FARIMA
Germán
Aneiros Pérez
Introducción
FARIMA(0,0.48,0) FARIMA(0,0.2,0)
Procesos
FARIMA:
Construcción
e
identificación
Estimación
Diagnosis
Selección del
modelo
Predicción
Aplicación a
datos reales
Recapitulación
Series de
Tiempo Ejemplos de la fas (log-log) de procesos FARIMA
Germán
Aneiros Pérez
FARIMA(0,0.48,0) FARIMA(0,0.2,0)
Introducción
Procesos
FARIMA:
Construcción
e
identificación
Estimación
Diagnosis
Selección del
modelo
Predicción
Aplicación a
datos reales
Recapitulación
Series de
Tiempo
Germán
Procesos FARIMA: Construcción e identificación
Aneiros Pérez
La serie de tiempo. . . ,
Introducción ¿ha sido generada por un proceso de memoria larga (FARIMA)?
Procesos
FARIMA: El gráfico de la serie frente al tiempo debe mostrar
Construcción
e estacionariedad. Sin embargo:
identificación
1 Una tı́pica caracterı́stica de las series generadas por
Estimación
procesos de memoria larga es la presencia de tendencias y
Diagnosis
ciclos locales (falsos), que desaparecen después de algún
Selección del
modelo
tiempo.
Predicción
2 Esta desaparición sólo es observable en series muy largas,
Aplicación a
lo que hace prácticamente imposible distinguir si una serie
datos reales corta procede de un proceso estacionario con memoria
Recapitulación larga o de uno no estacionario.
Series de
Tiempo
Germán
Aneiros Pérez
Rı́o Nilo Capa de sedimentos (log)
Introducción
Procesos
FARIMA:
Construcción
e
identificación
Estimación
Diagnosis
Selección del
modelo
Predicción
Aplicación a
datos reales
Recapitulación
Series de
Tiempo Procesos FARIMA: Construcción e identificación
Germán
Aneiros Pérez La fas muestral ρbk debe converger a cero muy lentamente,
en especial para retardos k grandes.
Introducción
Procesos
Para valores altos del retardo k, log (b
ρk ) decrece
FARIMA: linealmente a medida que log (k) aumenta.
Construcción
e Esta propiedad distingue un proceso de memoria larga
identificación
FARIMA de uno no estacionario ARIMA, pues en este
Estimación
último el decrecimiento lineal de log (b
ρk ) es con k y no
Diagnosis
con log (k).
Selección del
modelo
Predicción
Nota: Para procesos con memoria larga, no está garantizada la
Aplicación a
datos reales normalidad
√ asintótica de ρbk . Esto implica que las bandas
Recapitulación ±1.96/ T que por defecto se muestran en los gráficos de la
fas muestral pierden validez.
Series de
Tiempo
Germán
Aneiros Pérez Rı́o Nilo Capa de sedimentos (log)
Introducción
Procesos
FARIMA:
Construcción
e
identificación
Estimación
Diagnosis
Selección del
modelo
Predicción
Aplicación a
datos reales
Recapitulación
Series de
Tiempo Estimación
Germán
Aneiros Pérez
Suposiciones generales: La serie x1 , . . . , xT ha sido generada
por un proceso FARIMA(p,d,q)
Introducción
Procesos
FARIMA:
φ (B) (1 − B)d Xt = c + θ (B) at ,
Construcción
e
identificación Causal e invertible (en el sentido expresado en este tema)
Estimación
y Gaussiano.
Diagnosis
Cuyos órdenes p y q son conocidos.
Selección del
modelo
Predicción
Objetivo: Estimar c, φ1 , . . . , φp , θ1 , . . . , θq , σa2 y d.
Aplicación a
datos reales
Series de
Tiempo
Germán
Aneiros Pérez
Estimación
Introducción Método de máxima verosimilitud: Debido a la estructura
Procesos
FARIMA:
del proceso FARIMA (compárese con la del ARMA o con
Construcción
e
la del ARIMA), la aplicación de este método presenta
identificación inconvenientes prácticos motivados tanto por la dificultad
Estimación en la construcción como por la lentitud en el cálculo de la
Diagnosis
función de verosimilitud. Como consecuencia de esto, se
Selección del
modelo suelen utilizar otros métodos de estimación que,
Predicción manteniendo las propiedades asintóticas de los estimadores
Aplicación a de máxima verosimilitud, sean más sencillos de obtener.
datos reales
Recapitulación
Series de
Tiempo
Estimación
Germán
Aneiros Pérez Métodos basados en aproximaciones de la función de
verosimilitud:
Introducción
Procesos
Aproximación basada en la representación AR(∞) del
FARIMA: proceso: En esencia, se supone que se dispone de todo el
Construcción
e pasado de la serie: . . . , x−2 , x−1 , x0 , x1 , . . . , xT . Utilizando
identificación
dicho pasado se construye la función de verosimilitud,
Estimación posteriormente se trunca (se fijan a µ los valores
Diagnosis . . . , x−2 , x−1 , x0 ) y se obtienen los parámetros que
Selección del maximizan a dicha ”función de verosimilitud truncada”.
modelo
Aproximación de Whittle: Consiste en aproximar a la
Predicción
función de verosimilitud a través de cierta función del
Aplicación a
datos reales periodograma y de la función de densidad espectral de la
Recapitulación serie. Dicha aproximación es maximizada para obtener las
estimaciones.
Series de
Tiempo
Estimación
Germán
Aneiros Pérez Métodos basados en aproximaciones de la función de
verosimilitud:
Introducción
Aproximación de Haslett y Raftery (1989, Journal of the
Procesos
FARIMA: Royal Statistical Society, Series C): Una de las dificultades
Construcción
e prácticas que tiene la construcción de la función de
identificación verosimilitud exacta es la obtención de la dependencia
Estimación (correlación) entre las variables del proceso, la cual forma
Diagnosis parte de la función de verosimilitud. En esencia, estos
Selección del autores proponen utilizar valores aproximados de dicha
modelo
dependencia para retardos grandes (concretamente,
Predicción
utilizan los valores asintóticos). De esta forma, construyen
Aplicación a
datos reales una aproximación de la función de verosimilitud, la cual es
Recapitulación
maximizada para obtener las estimaciones. Éste es el
método utilizado tanto por el R como por el S-PLUS.
Series de
Tiempo Estimación
Germán Al igual que en el tema anterior:
Aneiros Pérez
Cuando hablamos de la función de verosimilitud nos
Introducción
referimos a la Gaussiana (como hipótesis de partida hemos
Procesos
FARIMA: supuesto que el proceso FARIMA(p,d,q) es Gaussiano).
Construcción
e
identificación
La Gaussianidad garantiza la eficiencia asintótica de los
Estimación
estimadores, ası́ como la normalidad de los errores de
Diagnosis predicción.
Selección del La ausencia de Gaussianidad implica la pérdida de
modelo
Predicción
eficiencia de los estimadores basados en la verosimilitud
Aplicación a
Gaussiana, aunque siguen siendo asintóticamente
datos reales insesgados y normales. Sin embargo, invalida a los
Recapitulación
intervalos de predicción construidos bajo la suposición
Gaussiana.
Germán Aneiros Pérez Series de Tiempo
Modelos de memoria larga
Series de
Tiempo
Germán
Aneiros Pérez
Introducción
Diagnosis
Procesos Una vez que un modelo FARIMA ha sido estimado, la etapa de
FARIMA:
Construcción diagnosis o chequeo de las hipótesis básicas realizadas sobre él
e
identificación se realiza de modo análogo a lo hecho en los procesos ARIMA.
Estimación
Predicción
comportamiento de los residuos.
Aplicación a
datos reales
Recapitulación
Series de
Tiempo
Selección del modelo
Germán
Aneiros Pérez Los órdenes p y q del modelo FARIMA se seleccionan a través
Introducción
de alguno de los criterios AIC, AICc o BIC utilizados en la
Procesos
selección de modelos Box-Jenkins, con las pertinentes
FARIMA:
Construcción
modificaciones provocadas por el método de estimación
e
identificación
utilizado. Concretamente, debe tenerse presente que:
Estimación Ahora hay un parámetro más: d.
Diagnosis
Si no se utiliza el método de máxima verosimilitud
Selección del
modelo (exacta) para obtener las estimaciones, entonces en la
Predicción expresión de las funciones AIC, AICc y BIC la función de
Aplicación a verosimilitud L debe ser sustituida por la aproximación
datos reales
utilizada (función de verosimilitud truncada, aproximación
Recapitulación
de Whittle ó aproximación de Haslett y Raftery).
Series de
Tiempo
Germán
Predicción
Aneiros Pérez
Suposiciones generales: Se dispone de una serie de tiempo
Introducción x1 , . . . , xT generada por un proceso estocástico {Xt }t .
Procesos
FARIMA:
Construcción Suposiciones particulares: {Xt }t tiene una estructura FARIMA
e
identificación con parámetros conocidos.
Estimación
Aplicación a
datos reales Notación: Al igual que en el tema anterior, dicha predicción
Recapitulación (con origen en T y horizonte k) será denotada por bxT (k).
Series de
Tiempo
Germán Predicción
Aneiros Pérez
Las predicciones se obtienen en base a la representación
Introducción AR(∞) del proceso:
Procesos
Xt = µ − ∞
FARIMA:
P
Construcción i=1 πi (Xt−i − µ) + at .
e
identificación
Ası́, para predecir con origen en T y horizonte k = 1 se hace
Estimación
uso de la expresión
Diagnosis
XT +1 = µ − ∞
Selección del
P
modelo i=1 πi (XT +1−i − µ) + aT +1 ,
Predicción
Aplicación a
en base a la cual obtenemos
datos reales
xT (1) = µ − T
P
Recapitulación b i=1 πi (xT +1−i − µ) .
Series de
Tiempo
Predicción
Germán
Aneiros Pérez Para predecir con origen en T y horizonte k = 2 utilizamos la
Introducción
predicción a horizonte 1 que acabamos de obtener (b xT (1)) y la
Procesos
expresión
FARIMA:
Construcción
XT +2 = µ − ∞
P
e i=1 πi (XT +2−i − µ) + aT +2 .
identificación
Aplicación a
datos reales
La aplicación sucesiva de este procedimiento nos permite
Recapitulación
obtener b
xT (k) para cualquier horizonte k.
Series de
Tiempo Predicción
Germán Intervalos de predicción
Aneiros Pérez
Del mismo modo que ocurrı́a en los procesos ARIMA, se tiene
Introducción que, cuando ”T es grande” y las innovaciones {at }t son
Procesos
FARIMA:
Gaussianas, el error de predicción verifica que
Construcción
bT (k) ≈ N 0, σ 2 1 + ψ 2 + · · · + ψ 2
e
identificación XT +k − X a 1 k−1 ,
Estimación
Diagnosis
donde ψi son los coeficientes de la representación MA(∞)
Selección del
modelo Xt = µ + at + ψ1 at−1 + ψ2 at−2 + · · ·
Predicción
Aplicación a
Por tanto, un intervalo de predicción (al 95%) para el valor de
datos reales XT +k será
Recapitulación
q
XbT (k) ± 1.96 σ 2 1 + ψ 2 + · · · + ψ 2 .
a 1 k−1
Germán Aneiros Pérez Series de Tiempo
Modelos de memoria larga
Series de
Tiempo
Germán
Aneiros Pérez
Aplicación a datos reales
Introducción
Procesos
Para finalizar, presentamos un ejemplo con datos reales en el
FARIMA: que se hace uso de gran parte de lo expuesto en este capı́tulo.
Construcción
e
identificación
La serie que analizaremos es la serie de niveles mı́nimos anuales
Estimación
del rı́o Nilo, medidos en el indicador del Roda (cerca de El
Diagnosis
Selección del
Cairo). Esta serie, que comienza en el año 622 y finaliza en el
modelo 1284, es una serie clásica dentro del contexto de los procesos
Predicción con memoria larga.
Aplicación a
datos reales
Recapitulación
Series de
Tiempo 1: Identificación de la presencia de memoria larga
Germán
Aneiros Pérez
Introducción
Nivel mı́nimo del rı́o Nilo El gráfico de la izquierda
Procesos sugiere que la serie ha sido
FARIMA:
Construcción generada por un proceso de
e
identificación memoria larga.
Estimación
Diagnosis
Selección del
modelo
Predicción
Aplicación a
datos reales
Recapitulación
Series de
Tiempo Aplicación a datos reales
Germán
Aneiros Pérez
2: Identificación (BIC) del FARIMA
Introducción
Se ha utilizado el criterio BIC para seleccionar los órdenes p y q
Procesos
FARIMA: del FARIMA que sugeriremos como generador de la serie.
Construcción
e
Dichos valores se han seleccionado dentro del rango {0, 1, 2}.
identificación
Aplicación a 1 (1 − B)d Xt = c + at
datos reales
Recapitulación
2 (1 − B)d (Xt − µ) = at
3 Xt = µ + (1 − B)−d at
Germán Aneiros Pérez Series de Tiempo
Modelos de memoria larga
Series de
Tiempo
Aplicación a datos reales
Germán
Aneiros Pérez 3: Estimación del FARIMA identificado
Introducción
Selección del
modelo
Predicción
Por tanto, si los residuos superan los distintos contrastes (ruido
Aplicación a blanco), tenemos corroborada la presencia de memoria larga
datos reales
(nótese que un intervalo de confianza al 95% para el parámetro
Recapitulación
de diferenciación fraccional d es (0.3340, 0.4536)).
Series de
Tiempo
4: Diagnosis del modelo FARIMA(0, 0.3938, 0)
Germán
Aneiros Pérez
Estimación
Diagnosis
Selección del
modelo
Predicción
Aplicación a
datos reales
Recapitulación
Series de
Tiempo
Germán
Aneiros Pérez
Introducción
Contrastes de media cero y Conclusión: Un modelo
Procesos normalidad FARIMA(0, 0.3938, 0) con
FARIMA:
Construcción H0 : µa = 0 innovaciones no Gaussianas
e
identificación p − valor = 0.8182 resulta adecuado como
Estimación H0 : Normalidad generador de la serie de niveles
Diagnosis Jarque-Bera: mı́nimos anuales del rı́o Nilo.
Selección del p − valor = 0.0000
modelo
Predicción
Shapiro-Wilk:
Aplicación a
datos reales p − valor = 0.0055
Recapitulación
Series de
Tiempo 5: Predicción en base al modelo FARIMA(0, 0.3938, 0)
Germán
Aneiros Pérez
Aplicación a
de la derecha (naranja), junto
datos reales con el valor de la media del
Recapitulación FARIMA (azul).
Series de
Tiempo
Germán
Aneiros Pérez
Aplicación a datos reales
Con el fin de comparar el comportamiento de las predicciones
Introducción
basadas en modelos de memoria larga (FARIMA) con el de las
Procesos
FARIMA: basadas en modelos de memoria corta (ARMA), se seleccionó a
Construcción
e través del criterio BIC un modelo ARMA como posible
identificación
generador de la serie que estamos estudiando. Sus órdenes p y
Estimación
Diagnosis
q se seleccionaron dentro del rango {0, 1, . . . , 8}.
Selección del El modelo seleccionado fue un ARMA(2,1) con constante.
modelo
Predicción
Una vez analizados los residuos, la conclusión fue que
Aplicación a dicho ARMA(2,1) con innovaciones no Gaussianas es un
datos reales
modelo razonable para haber generado la serie.
Recapitulación
Series de
Tiempo
Germán
Aneiros Pérez FARIMA(0, 0.3938, 0) ARMA(2, 1)
Introducción
Procesos
FARIMA:
Construcción
e
identificación
Estimación
Diagnosis
Selección del
modelo
Predicción
Aplicación a
datos reales
Recapitulación
Series de
Tiempo
Aplicación a datos reales
Germán
Aneiros Pérez Los 2 gráficos anteriores nos muestran la tı́pica diferencia entre
las predicciones basadas en modelos con memoria larga y las
Introducción
Procesos
basadas en modelos con memoria corta:
FARIMA:
Construcción Aunque en ambos casos convergen a la media, la
e
identificación velocidad de esta convergencia es muy superior en los de
Estimación memoria corta.
Diagnosis Puesto que la utilización de la media como predictor de
Selección del futuros valores del proceso es equivalente a la
modelo
independencia del futuro con el pasado, se tiene que:
Predicción
Memoria corta: el pasado ejerce muy poca influencia sobre
Aplicación a
datos reales el futuro lejano (prácticamente son independientes).
Recapitulación Memoria larga: la influencia del pasado sobre el futuro
persiste en el tiempo.
Series de
Tiempo Recapitulación
Germán
Aneiros Pérez A lo largo de este tema:
Introducción
Se ha construido la clase de modelos FARIMA (memoria
Procesos larga).
FARIMA:
Construcción Se han propuesto algunos métodos para detectar la
e
identificación presencia de memoria larga.
Estimación
Se han propuesto estimadores de sus parámetros y se han
Diagnosis
mostrado algunas de sus propiedades asintóticas.
Selección del
modelo Se han construido predictores e intervalos de predicción
Predicción para sus valores futuros.
Aplicación a
datos reales Se ha comparado el comportamiento de las predicciones
Recapitulación basadas en modelos de memoria larga con las basadas en
modelos de memoria corta.
Germán Aneiros Pérez Series de Tiempo