You are on page 1of 16

Departamento de Ingeniera Civil

Facultad de Ciencias Fsicas y Matemticas


Universidad de Chile

Estimacin de un modelo
odelo ARIMA en la cuenca del estero Puangue
en Boquern
CI6110 Anlisis Hidrolgico y Evaluacin de Recursos Hdricos

Alumno:

Profesores:
es:

Felipe Uribe

James Mc Phee.
Phee
Ximena Vargas

Auxiliar:

Yuri Castillo

Fecha:

03/06/2014
03/06

Contenido

1-

Introduccin ................................................................................................................................ 3

2-

Objetivos ..................................................................................................................................... 4
2.1- Objetivo General ...................................................................................................................... 4
2.2- Objetivos Especficos................................................................................................................ 4

3-

Metodologa ................................................................................................................................ 5

4-

Resultados ................................................................................................................................... 6
4.1- Caracterizacin de la cuenca.................................................................................................... 6
4.2- Identificacin de perodos Pluvial y Nival ................................................................................ 7
4.3- Normalizacin .......................................................................................................................... 8
4.4.- Estandarizacin ....................................................................................................................... 9
4.5. Intercalacin............................................................................................................................. 9
4.6- Estacionalidad ........................................................................................................................ 10
4.7- Identificacin de los posibles modelos ARIMA ...................................................................... 11
4.8- Generacin de los posibles modelos ARIMA ......................................................................... 12
4.9- Seleccin del modelo ARIMA ................................................................................................. 13
4.10- Generacin de 30 series sintticas ...................................................................................... 14
4.11- Curvas de duracin .............................................................................................................. 14

5-

Conclusiones.............................................................................................................................. 15

6-

Anexos ....................................................................................................................................... 16

1- Introduccin
Hace ms de 50 aos, los modelos auto-regressive integrated moving average (ARIMA) se han
utilizado para pronosticar variables, ya sea en economa, hidrologa u otras disciplinas. El supuesto
detrs de esto es que la variable de pronstico est ligada mediante una funcin lineal con varias
observaciones pasadas y errores aleatorios. Esto implica necesariamente que el proceso
subyacente que genera la serie de tiempo con media tiene la forma

Donde yt es la variable de pronstico, at son los errores aleatorios correspondientes al instante t.

Los polinomios anteriores corresponden a los parmetros del modelo, y tienen orden p y q
respectivamente. Finalmente
es el operador de retroceso, Los errores aleatorios
tienen el supuesto que distribuyen con media 0 y varianza 2.

2- Objetivos

2.1- Objetivo General


- Estimar el modelo ARIMA ms adecuado para representar la serie de caudales estacionales
de los ltimos 32 aos de Puangue en Boquern.

2.2- Objetivos Especficos


-

Caracterizar la cuenca en estudio


Identificar la estacin fluviomtrica representativa de la zona con informacin mensual
Generar 30 series alternativas que mantengan sus estadsticos constantes
Determinar las curvas de duracin de las series y obtener el promedio asociado al 85% de
caudal

3- Metodologa
A) Rellenar los datos restantes de Puangue en Boquern, con la estacin vecina Colliguay
como parmetro.
B) Sacar por separado los caudales promedios pluvial y nival
C) Verificar si cumplen la prueba de normalidad, en caso de que no cumplan se aplicar el
cambio de variable Zt=ln(Q) y se verificar normalidad nuevamente
D) Se chequear estacionalidad, verificando que los estadsticos de 2 rangos pluviales y 2
rangos nivales sean iguales entre si.
E) Intercalar los datos pluviales y nivales
F) Verificar si tienen tendencia con el test de Mann-Kendall, en caso de que la respuesta sea
afirmativa, se le sacar la tendencia.
G) Con los datos sin tendencia, se aplicar un test de anlisis descriptivo para ver cmo
andan los grficos de autocorrelograma y autocorrelograma parcial
H) Se elegir posibles modelos ARIMA.
I) Se le harn test de normalidad a los residuos, junto con el criterio de Parsimonia e ndice
de AIC en caso de determinar cual modelo es mejor
J) Se generarn 30 series a partir de un modelo ARIMA genrico, con errores aleatorios que
distribuyen con media 0 y desviacin estndar 1
K) Se agregar tendencia a los datos en caso de que existiera, y se aplicar exponencial a
estos datos en caso de que no hayan sido normales en la parte c)
L) Finalmente se construirn las curvas de duracin mediante Weibull, identificando los
caudales con 85% de excedencia.

4- Resultados

4.1- Caracterizacin de la cuenca


Puangue en Boquern es una cuenca que se localiza al norte de Curacav, en la sexta regin de
Valparaso. En general es una cuenca bastante pequea con tan solo 142 km2, y una pendiente
media de 0.412 m/m. Dado lo pequea que es la cuenca, est sometida a cambios bruscos de
escorrenta en el periodo pluvial, ya que tiene poco poder de regulacin. Su cota de desage es
aproximadamente 500 m.s.n.m, y su cota mxima es aproximadamente 2000 m.s.n.m.
Esta cuenca caracteriza al sector alto del estero Puangue, el cual termina en la comuna de
Melipilla.

Figura 1. Puangue en Boquern en WMS

4.2- Identificacin de perodos Pluvial y Nival


Los datos de Puangue en Boquern tenan en su minora datos faltantes, los cuales se rellenaron
con la ayuda de la estacin cercana Colliguay. El perodo de estudio se sita entre los aos 1981 y
2012. Una vez rellenada la informacin restante, se promedi cada mes y se obtuvo la figura 2.

Puangue en Boquern
3.00

Caudal [l/s]

2.50
2.00
1.50
Puangue en Boquern

1.00
0.50
0.00
0

10

12

14

Nmero del mes

Figura 2. Variacin mensual promedio de caudales en Puangue en Boquern

Finalmente, se escogi grficamente como perodo Pluvial entre Abril y Septiembre, mientras que
el perodo nival corresponde entre Octubre y Marzo.

4.3- Normalizacin
Al obtener las 2 series de tiempo promedio nival y pluvial, se hizo una prueba de normalidad a
cada una en XLSTAT, la cual arroj que ninguna serie era normal ya que los p-values en los 4 test
obtuvieron valores menores al 0.001, lo que implica rechazar la hiptesis de normalidad.
Para normalizar las series, se tom logaritmo natural a cada una de esas series y se les aplic
nuevamente el test. Esta vez ambas sacaron valores mayores al 0.05 en todos sus p-values, lo que
provoca que las series fueron transformadas a normal. A continuacin se muestran los p-valor con
sus respectivas pruebas, tanto para rgimen pluvial y nival.

Prueba
Shapiro- Wilk
Anderson Darling
Lilliefors
Jarque-Bara

p-valor
0.946
0.894
0.715
0.724

Tabla 1. Prueba de normalidad para rgimen pluvial

Prueba
Shapiro- Wilk
Anderson Darling
Lilliefors
Jarque-Bara

p-valor
0.646
0.841
0.921
0.654

Tabla 2. Pruebas de normalidad para rgimen nival

4.4.- Estandarizacin
La estandarizacin consiste en pasar cada serie de los regmenes por separado a otros trminos,
representados por la siguiente ecuacin:

4.5. Intercalacin
Una vez estandarizadas las 2 series por separado, se intercalaron para formar una sola serie. Luego
se aplic el test de Mann-Kendall en XLSTAT, obteniendo que matemticamente hay una
tendencia, tal como se muestra en la figura 3.

Con tendencia
2.5
2

y = -0.0096x + 0.3133

1.5
1

Series1

0.5
0
-0.5 0

Linear (Series1)
20

40

60

80

Linear (Series1)

-1
-1.5
-2
-2.5
Figura 3. Serie intercalada con tendencia

Para remover esta tendencia, a cada yt se le rest la ecuacin presentada en la figura 3, quedando
la muestra sin tendencia como se muestra en la figura 4.
9

Sin tendencia
2.5
2
1.5
1
0.5
0
-0.5 0
-1
-1.5
-2
-2.5
-3

Series1

20

40

60

Linear (Series1)

80

5 per. Mov. Avg.


(Series1)

Figura 4. Serie intercalada sin tendencia

Al graficar la media mvil en la figura 4, se puede inferir que la serie no es cclica.

4.6- Estacionalidad
La serie sin tendencia se dividi en 2 partes iguales, que son los primeros 32 trminos y los ltimos
32 trminos. A cada uno se le sac la media y la desviacin estndar, obtenindose que son
estadsticamente iguales (andan del mismo orden). Por supuesto si la serie tuviera ms datos,
entonces la convergencia a que los estadsticos sean iguales es mayor.
Media 32 prim

Media 32 ult

Desv 32 prim

Desv 32 ult

-0.186

0.145

0.939

0.998

Tabla 3. Estadsticos de la serie sin tendencia

10

4.7- Identificacin de los posibles modelos ARIMA


Segn la figura 5, al no decrecer y truncar en uno, el posible modelo es MA(1).
Autocorrelograma (-0.793991056084206)
1
0.8

Autocorrelacione

0.6
0.4
0.2
0
0

-0.2

10

11

12

13

14

15

16

17

18

-0.4
-0.6
-0.8
-1

Desplazamiento

Figura 5. Autocorrelograma

Para la autocorrelacin parcial es prcticamente el mismo caso, no decrece pero trunca en uno,
por lo que el posible modelo es un AR(1).
Autocorrelograma parcial (-0.793991056084206)
1

Autocorrelacin parcial

0.8
0.6
0.4
0.2
0
-0.2

10

11

12

13

14

15

16

17

18

-0.4
-0.6
-0.8
-1

Desplazamiento

Figura 6. Autocorrelograma parcial

Finalmente, se propone un modelo ARIMA(1,0,1).

11

4.8- Generacin de los posibles modelos ARIMA

Mediante XLSTAT se aplica ARIMA(1,0,1), obtenindose la siguientes figuras


ARIMA (-0.793991056084206)
3

-0.793991056084206

0
0

10

20

30

40

50

60

70

-1

-2

-3

Paso de tiempo
-0.793991056084206

ARIMA (-0.793991056084206)

Figura 7. Serie generada con ARIMA(1,0,1)

12

Residuos
3
2.5
2
1.5

Residuo

1
0.5
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63
-0.5
-1
-1.5
-2
-2.5

Paso de tiempo

Figura 8. Residuos generados con ARIMA(1,0,1)

En general se ve tentador confirmar el modelo, pero desafortunadamente al aplicar el test de


normalidad a los residuos estos no cumplen con los p-valor mnimo de 0.05 (salvo en Jarque-Bara),
por lo que se rechaza la hiptesis de que sea un ARIMA(1,0,1). Este motivo es suficiente como para
no seguir haciendo otros test, como el criterio de Parsimonia o el ndice AIC.

Prueba
Shapiro- Wilk
Anderson Darling
Lilliefors
Jarque-Bara

p-valor
0.449
0.382
0.358
0.987

Tabla 4. Pruebas de normalidad para Residuos

Tambin se hizo una diferenciacin para ver cmo andaba ese modelo, pero los residuos eran
mayores que 3, lo que provocaba que el modelo fuera peor.

4.9- Seleccin del modelo ARIMA


Por descarte, el modelo ARIMA se adoptar a ARIMA(0,0,0).

13

4.10- Generacin de 30 series sintticas


Un ARIMA(0,0,0) implica que los yt=at,lo que se traduce en generar 64 aleatorios entre 0 y 1 por
serie, sacar los valores de la distribucin normal asociado a estos aleatorios con media 0 y
desviacin estndar 1. Luego de eso se agregar la tendencia a los datos, para finalmente sacar
exponencial de los ltimos datos para tener los caudales a simular.
Para ms detalle ver el anexo de Excel.

4.11- Curvas de duracin


Al tener cada serie de caudales ordenados de mayor a menor, el siguiente paso es obtener su
probabilidad de excedencia mediante Weibull. De esta forma se puede llegar los valores de 85%
de excedencia de cada serie, presentados en la tabla
0.262
0.436
0.434

0.266
0.440
0.312

0.229
0.429
0.408

0.261
0.411
0.448

0.324
0.369
0.308

0.344
0.297
0.497

0.386
0.291
0.241

0.327
0.217
0.363

Tabla 5. 30 Caudales en l/s asociados a la probabilidad de excedencia del 85%

Curva de duracin
18
16
14
12
Caudal [l/s]

0.287
0.335
0.339

10
8

Series1

6
4
2
0
0

0.2

0.4

0.6

0.8

1.2

Probabilidad de excedencia

Figura 9. Curva de duracin en Puangue en Boquern

14

0.365
0.409
0.365

5- Conclusiones
Un modelo ARIMA(0,0,0) en realidad no es un modelo ARIMA como tal, ya que este asume que el
pronstico es una funcin lineal de las observaciones pasadas y errores aleatorios. Pero en este
caso no hay una funcin lineal que conecte el pronstico, lo que da a entender que todos los datos
son independientes entre s, lo cual es muy difcil que se d.
Un problema directo que influye en este problema son el nmero de datos de la muestra, ya que
mientras menor sean los datos peor ser el pronstico, ya que pueden haber ciclicidades que no
se hayan presentado en los datos conocidos, o tendencias ms generales y no tan especficas de la
serie histrica. Posiblemente un espectro de 32 aos no es suficiente para arrojar un buen
pronstico mediante un modelo ARIMA.
Como se vio en la tabla 5, si bien andan del orden los caudales asociados al 85% de excedencia,
igual se notan diferencias de hasta un 100% de diferencia, lo que provoca que estos resultados no
sean tan confiables con el mtodo utilizado.
Una ventaja significativa de estos modelos es poder predecir datos con tendencia, ciclicidad y no
normales. Por supuesto esto debe identificarse, procesarse y sacarlas a priori para escoger el
modelo ARIMA adecuado. Pero finalmente el pronstico debe ser consistente, una vez escogido el
modelo correspondiente hay que devolverse a las variables originales, lo que genera un mucho
mejor pronstico con respecto a los mtodos de hidrologa convencional.

15

6- Anexos
Excel Adjunto ARIMA1.xlsx

16