Professional Documents
Culture Documents
Series temporales
Series temporales
Produccin:
Barcelona Digital, SL
Rossell 77, 08029 Barcelona
p9
ndice
NDICE
TEORA DE SERIES TEMPORALES
1 Introduccin
5 Autocorrelacin
5.1
5.2
Correlograma..........................................................................................................58
Interpretacin de los correlogramas........................................................................63
Suavizado exponencial...........................................................................................65
Seleccin del factor de ponderacin .......................................................................67
Mtodo de Brown ...................................................................................................72
7 Otros ejemplos
7.1
7.2
Ventas de papel......................................................................................................77
Generacin de electricidad .....................................................................................81
p10
Series temporales
13.5.98 .................................................................................................................147
3.5.99 ...................................................................................................................148
23.6.99 .................................................................................................................149
12.1.00 .................................................................................................................150
17.5.00 .................................................................................................................151
2 Evaluaciones resueltas
2.1
2.2
2.3
2.4
2.5
13.5.98 .................................................................................................................153
3.5.99 ...................................................................................................................156
23.6.99 .................................................................................................................159
12.1.00 .................................................................................................................161
17.5.00 ..............................................................................................................164
Series temporales
BIBLIOGRAFA BSICA
n
Chatfield, C., The Analysis of Time Series, Chapman & Hall (1996).
Newbold, P., Estadstica para los negocios y la economa, Prentice Hall (1997).
p167
p11
Introduccin
1,5
1
0,5
0
-0,5
-1
-1,5
0
20
40
60
80
En general, las series de inters llevan asociados fenmenos aleatorios, de forma que el
estudio de su comportamiento pasado slo permite acercarse a la estructura o modelo
probabilstico para la prediccin del futuro. Estos modelos se denominan tambin procesos
estocsticos. As, un proceso estocstico es una sucesin de variables aleatorias {Yt}, con
t = 1, 2, ..., n, que evolucionan con el tiempo ( representado ste por el subndice t).
Cuando se dispone de n datos de un proceso estocstico, se est frente a n muestras, de
tamao unidad, extradas de la poblacin (variable aleatoria), correspondientes al tiempo en
que se realiz la medicin, y esto es lo que constituye la serie temporal o cronolgica.
Como ejemplo puede servir la evolucin a lo largo de un ao del ndice IBEX35, que recoge
los 35 valores de mayor cotizacin de la bolsa espaola, representada en la figura 1.2.
p12
Series temporales
Lgicamente, el valor del IBEX35 depender del valor alcanzado en los das previos,
adems de recoger la influencia de un conjunto de factores sociales, polticos, econmicos,
etc., que son continuamente cambiantes en el tiempo y cuya conjuncin, en un determinado
instante, configurara una hipottica distribucin de probabilidad del citado ndice econmico.
En casos como ste, es evidente que puede obtenerse un modelo que explique el
comportamiento de la serie en el perodo estudiado, pero puede ser muy arriesgada la
utilizacin de este modelo para hacer previsiones a medio o largo plazo. As, en todas las
series cronolgicas, es necesaria una gran cautela en la previsin a causa de la muy
probable inestabilidad del modelo en un futuro ms o menos alejado del ltimo instante del
que se conocen datos.
IBEX35
5
4,5
4
3,5
3
enero
diciembre
Fig. 1.2.- Evolucin del ndice IBEX35
Otro ejemplo puede ser el constituido por la sucesin de variables aleatorias {Y1, ...,Yt,...},
tales que Yt = 0,80Yt1 + t , con Y0 = 0 y los t distribuidos N(0; 1), independientes para todo
t = 1, 2,...
Esta serie puede expresarse tambin como Yt =
0,8t i i
y la distribucin de
i=1
p13
Introduccin
Yt
20
15
10
5
0
-5
-10
0
10
15
20
25
Todas las formas de estudio de una serie cronolgica, tal como se ir viendo, no conllevan
clculos complicados, pero s reiterativos, con gran volumen de datos manipulados y con
abundancia de grficos; es por ello que para su estudio se hace muy necesario el disponer
de un programa informtico que permita su correcta aplicacin y la obtencin de cuantos
grficos sean necesarios.
p14
Series temporales
Antes de abordar cualquier estudio analtico de una serie temporal, se impone una
representacin grfica de la misma y la observacin detenida de su aspecto evolutivo.
Para estudiar el comportamiento de cualquier serie temporal, y predecir los valores que
puede tomar en un futuro, puede hablarse de distintas metodologas, que denominaremos
modelizacin por componentes y enfoque Box-Jenkins.
Este mtodo consiste en identificar, en la serie Yt, cuatro componentes tericas, que no
tienen por qu existir todas, y que son:
Tendencia: Tt.
Estacionalidad: Et.
Ciclos: Ct.
Residuos: Rt.
Cada una de estas componentes es una funcin del tiempo y el anlisis consistir en la
separacin y obtencin de cada una de ellas, as como en determinar de qu forma se
conjugan para dar lugar a la serie original. Estas componentes se pueden observar en la
figura 2.1, en donde se ha considerado que actan de forma aditiva para dar lugar a la serie
cronolgica.
La tendencia es la componente general a largo plazo y se suele expresar como una funcin
2
del tiempo de tipo polinmico o logartmico, por ejemplo Tt = 0 + 1 t+ 2 t +
Las variaciones estacionales son oscilaciones que se producen, y repiten, en perodos de
tiempo cortos. Pueden estar asociadas a factores dinmicos, por ejemplo la ocupacin
hotelera, la venta de prendas de vestir, de juguetes, etc., cuya evolucin est claramente
ligada a la estacionalidad climtica, vacacional, publicitaria, etc.
Las variaciones cclicas se producen a largo plazo y suelen ir ligadas a etapas de
prosperidad o recesin econmica. Suelen ser tanto ms difciles de identificar cuanto ms
largo sea su perodo, debido, fundamentalmente, a que el tiempo de recogida de
informacin no aporta suficientes datos, por lo que a veces quedarn confundidas con las
otras componentes.
p15
200
175
150
TENDENCIA
125
100
40
20
ESTACIONALIDAD
0
-20
-40
60
30
0
CICLOS
-30
-60
5
3
0
RESIDUOS
-3
-5
300
200
SERIE
CRONOLGICA
100
p16
Series temporales
Para evaluar las distintas componentes se utilizan tcnicas estadsticas tales como modelo
lineal, medias mviles, diferencias finitas, etc.
Admitiendo que el componente aleatorio (residuo) es aditivo, una vez identificadas las otras
componentes surge un nuevo problema que es el cmo conjuntar tendencia, estacionalidad
y ciclos para dar lugar a la serie definitiva.
As se proponen, entre otros, modelos genricamente denominados aditivos y
multiplicativos.
Modelo aditivo: Y = T + E + C + R
Modelo multiplicativo: Y = T x E x C + R
Para una primera identificacin visual del caso, se puede considerar que si el patrn
estacional se mantiene con amplitud constante se tratar de modelo aditivo (figuras 2.1 y
2.2). Cuando dicho patrn se vaya amplificando con el tiempo, ser multiplicativo (figura
2.3).
Y 250
200
150
100
50
t
Fig. 2.2.- Serie aditiva
Y 400
300
200
100
0
t
Fig. 2.3.- Serie multiplicativa
p17
Yt = 0 + 1 t + Es + Rt = s + 1 t + Rt
con
t = p$ + s; s = 1, , p
As pues, cada estacin (s) componente del perodo conforma una recta con ordenada en el
origen distinta para cada caso y pendiente comn a todos; es decir, segn muestra la figura
2.4, el modelo es un conjunto de rectas paralelas, cada una de ellas asociada a una
estacin.
En el modelo multiplicativo, el componente estacional acta sobre la ordenada en el origen y
sobre la pendiente.
Y 250
200
150
100
50
t
Fig. 2.4.- Interpretacin de una serie con modelo aditivo
p18
Series temporales
Yt = Tt Es + Rt = (0 + 1t) Es + Rt,
es decir
Yt = (0 Es ) + ( 1Es ) t + Rt
o sea
Yt = 0s + 1s t + Rt
De esta forma, cada una de las p estaciones del perodo configura una recta distinta, tanto
en lo que se refiere a la ordenada en el origen (0s) como a la pendiente (1s).
El conjunto de las p rectas constituye el modelo de comportamiento de la serie (figura 2.5).
Es evidente que esta divisin, en modelo estrictamente aditivo o estrictamente multiplicativo,
es bastante restrictiva, ya que puede darse el caso de que en algunas estaciones cambie
slo la pendiente, o slo la ordenada en el origen. Esto constituira un modelo mixto mucho
ms general que los propuestos hasta ahora, los cuales pasaran a ser meros casos
particulares de ste. En la figura 2.6 se presenta una situacin de este tipo.
Y 500
400
300
200
100
0
t
Fig. 2.5.- Interpretacin de una serie con modelo multiplicativo
Y 200
150
100
50
0
t
p19
Y 4
3
2
1
0
-1
-2
-3
-4
t
Fig. 2.7.- Proceso de media mvil MA(4)
p20
Series temporales
Y 4
3
2
1
0
-1
-2
-3
-4
t
Fig. 2.8.- Proceso autorregresivo AR(2)
Y 90
80
70
60
50
40
30
20
10
0
t
Fig. 2.9.- Proceso ARIMA(2, 1, 3)
p21
(t) = 0 + 1t
polinmica:
2
(t) = 0 + 1t + 2 t + ...
exponencial: (t) = 0 t 1
p22
Series temporales
Ao
1990
1991
1992
1993
1994
1995
Trimestre
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
Ventas (Y)
40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,50
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Y 130
100
70
40
0
12
16
20
24 t
En este ejemplo se ha identificado un patrn estacional compuesto por los cuatro trimestres
y que se repite de ao en ao, adems de una tendencia aparentemente lineal. Si se
decidiese ajustar el modelo de tendencia directamente sobre los datos, se obtendran los
resultados de la tabla 3.II.
p23
Regresin
Residuos
Total
nu
1
22
23
Coef.
Ord. Origen 57,501
t
1,286
S. C.
1901,300
15623,686
17524,985
C. M.
1901,300
710,168
F
2,677
Error tpico
11,229
0,786
t
5,121
1,636
p-val
0,000
0,116
p-val
0,116
R^2 = 0,10849
Tabla 3.II.- Modelo de tendencia ajustado sobre todos los datos: Y = 0 + 1t +
El modelo presenta un coeficiente de determinacin (R^2) tan slo del 10,8% y no resulta
estadsticamente significativo, ya que el nivel de significacin (p-val), tanto del ajuste como
de la pendiente de la recta de tendencia, son claramente superiores a un riesgo de primera
especie del 5%. As, se demuestra que este procedimiento no es vlido ya que incluye en el
residuo todo el componente estacional, lo cual produce una inflacin de la suma de
cuadrados residual que desvirta el modelo y cualquier prueba de significacin de la
regresin y de sus coeficientes.
Para evitar esto es necesario estabilizar la serie liberndola de la estacionalidad; esto se
podra conseguir trabajando con los valores medios anuales, que son los de la tabla 3.III. En
la tabla 3.IV se detallan los resultados del clculo del modelo de tendencia, considerado tipo
rectilneo.
Ya
t (aos)
Ya
t (aos)
67,4925
75,0900
67,1550
80,7425
71,1875
79,7725
Regresin
Residuos
Total
nu
1
4
5
Coef.
Ord. Origen 62,967
t(aos)
3,030
S.C.
160,711
15,279
175,991
C.M.
160,711
3,820
F
42,073
Error tpico
1,819
0,467
t
34,607
6,486
p-val
0,000
0,003
R^2 = 0,91318
Tabla 3.IV.- Modelo lineal para las medias anuales
p-val
0,003
p24
Series temporales
7
t(aos)
p +1
t =
Y(p+1) / 2 =
i=1
Y1 + Y2
+ A + Yp
p
p25
p+ 1
p + 3
t =
2
Y(p + 3) / 2 =
i= 2
Y2
Y3 +
A +
Yp+ 1
t =
p + 2
2
Y(p+ 2) / 2 =
Y(p+ 1) / 2
t =
p + 4
2
Y(p + 4) / 2 =
Y(p+ 3) / 2
Y(p+ 3) / 2
2
+
Y(p+ 5) / 2
Y
1
2
3
4
5
40,22
54,89
63,51
111,35
46,95
67,4925
69,1750
68,3337
3
4
5
p26
t
3
4
5
6
7
Series temporales
68,3337
68,7662
68,1025
67,5012
66,4588
8
9
10
11
12
67,4725
69,5300
70,5325
72,6825
73,4363
t
13
14
15
16
17
Y
72,9325
74,1300
76,8450
78,1900
78,9000
t
18
19
20
21
22
Y
80,3812
79,3075
78,5175
79,2037
79,5088
Los resultados del modelo lineal, Y = 0 + 1t+ para el clculo de la tendencia constan en
la tabla 3.VII.
nu
1
17
18
Regresin
Residuos
Total
S.C.
393,692
41,108
434,800
Coef.
Error tpico
Ord. Origen 63,0065
0,9188
t
0,8311
0,0651
C.M.
393,692
2,418
F
162,810
t
68,5739
12,7597
p-val
0,0000
0,0000
p-val
0,000
R^2 = 0,905
Tabla 3.VII.- Modelo de tendencia sobre las medias mviles
Trabajando sobre 19 puntos, los 19 valores de las medias mviles, se ha obtenido un buen
ajuste, con un coeficiente de determinacin del 90,5 %. En consecuencia, el modelo de
tendencia resultante es
T = 63,0065 + 0,8311 t
Evidentemente, la interpretacin de la ecuacin de la tendencia permite afirmar que las
ventas se incrementan 0,8311 unidades cada trimestre (ya que el tiempo se ha medido en
trimestres). En la figura 3.3 puede observarse el suavizado conseguido con las medias
mviles junto con el modelo de tendencia estimado a partir de los citados valores.
130
100
70
40
0
12
16
20
24 t
p27
3.2 Estacionalidad
La componente estacional, que provoca una oscilacin sistemtica de perodo corto,
generalmente no superior al ao, puede enmascarar la evolucin a largo plazo, tendencia, si
no se asla convenientemente.
Se entiende como componente estacional, en modelos aditivos, la diferencia entre el valor
de la estacin y la media de todas las estaciones componentes del perodo.
El anlisis de la estacionalidad queda ligado al mtodo que se decida emplear para
modelizar la tendencia; as, en este punto estudiaremos la situacin para el caso de trabajar
con medias mviles.
Para calcular los valores de los ndices estacionales hay que seguir la siguiente sistemtica:
n
Calcular las medias mviles, Yt , sobre los datos, Yt , de la serie original, tomando el
perodo de agrupacin, p, que se considere oportuno.
Separar la parte explicada por la tendencia. Supuesto el modelo aditivo, esto equivale a
calcular Wt = Yt Yt ; si fuese multiplicativo, en lugar de diferencias seran cocientes, es
decir, Wt = Yt / Yt . Hay que destacar que en Wt estn incluidas las componentes
asociadas a la estacionalidad, los ciclos y los residuos.
Asumiendo que los residuos son variables aleatorias de media nula y que la
componente cclica, caso de existir, es de perodo suficientemente largo como para no
ser recogida por los datos, se procede a evaluar la estacionalidad asociada a cada
componente del perodo, a cada trimestre en el caso del ejemplo. Para ello se calculan
Wt
los promedios de los Wt de la misma estacin
E*s
t = s + p&
s = 1, , p
ns
donde s representa el ndice estacional y ns el nmero de valores asociados a este
ndice que se promedian.
Ya que los ndices estacionales miden discrepancias respecto a la media, sta se
necesita como valor de referencia; por tanto es necesario calcular la media general:
p
E
s=1
E =
n
*
s
p28
Series temporales
E
s =1
= 0.
E
s =1
= p . En modelo
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,5
Yt
----68,3337
68,7662
68,1025
67,5012
66,4588
67,4725
69,5300
70,5325
72,6825
73,4363
72,9325
74,1300
76,8450
78,1900
78,9000
80,3812
79,3075
78,5175
79,2037
79,5088
-----
Wt
-----4,8237
42,5838
-21,1525
-15,8812
-4,9888
41,1075
-28,1500
-5,2325
-8,4325
40,3837
-19,5925
-14,7600
-10,6950
43,3100
-11,5200
-24,2912
-4,1975
45,8725
-23,3037
-18,2588
-----
Estacin: s
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
p29
E*2 = 15,68477
E*3 = 6,6275
E*4 = 42,6515
*
s
s =1
E =
= 0,101125
E2 = 15,5836
E3 = 6,5264
E4 = 42,7526
Los valores de los ndices estacionales recin obtenidos se interpretan de la siguiente forma:
respecto a la media, el primer trimestre tiene una venta inferior en 20,6426 unidades; el
segundo est 15,5836 unidades por debajo de la media; el tercero 6,5264; mientras que el
cuarto supera a la media en 42,7526 unidades de venta.
t = 4$ + s
p30
Series temporales
130
100
Y
70
40
84
79
T 74
69
64
50
30
E 10
-10
-30
130
T
+
E
100
70
40
11
R 0
-11
Fig. 3.4.- Descomposicin de la serie de ventas de material deportivo por medias mviles
p31
Ao
1996
1997
Estacin: s
25
Tendencia:
T = 63,0065+0,8311 t
83,7840
26
27
28
Estacionalidad: E
#
Previsin: Y
20,6426
63,1414
84,6151
15,5836
69,0315
85,4462
6,5264
78,9198
86,2773
42,7526
129,0299
29
87,1084
20,6426
66,4658
30
87,9395
15,5836
72,3559
31
88,7706
6,5264
82,2442
32
89,6017
42,7526
132,3543
Tabla 3. IX.- Previsiones para 1996 y 1997, segn el modelo de descomposicin clsica
Y 140
90
40
0
12
16
20
24
28
32 t
p32
Series temporales
Ao
Mes
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
26,8
27,2
27,1
26,3
25,4
23,9
23,8
23,6
25,3
25,8
26,4
26,9
27,1
27,5
27,4
26,4
24,8
24,3
23,4
23,4
24,6
25,4
25,8
26,7
26,9
26,3
25,7
25,7
24,8
24,0
23,4
23,5
24,8
25,6
26,2
26,5
26,8
26,9
26,7
26,1
26,2
24,7
23,9
23,7
24,7
25,8
26,1
26,5
26,3
27,1
26,2
25,7
25,5
24,9
24,2
24,6
25,5
25,9
26,4
26,9
27,1
27,1
27,4
26,8
25,4
24,8
23,6
23,9
25,0
25,9
26,3
26,6
26,8
27,1
27,4
26,4
25,5
24,7
24,3
24,4
24,8
26,2
26,3
27,0
27,1
27,5
26,2
28,2
27,1
25,4
25,6
24,5
24,7
26,0
26,5
26,8
26,3
26,7
26,6
25,8
25,2
25,1
23,3
23,8
25,2
25,5
26,4
26,7
27,0
27,4
27,0
26,3
25,9
24,6
24,1
24,3
25,2
26,3
26,4
26,7
Y 30
28
26
24
22
0
24
48
72
96
120 t
p33
Y 30
28
26
24
22
0
24
48
72
96
120 t
Para evaluar la estacionalidad es necesario calcular los ndices estacionales, tal como se ha
detallado en el apartado 3.2. Los resultados obtenidos se encuentran en la tabla 3.XI, y se
presentan grficamente en la figura 3.8.
Mes
(s)
ndice Es
Mes
(s)
ndice Es
1,07496
VII
1,78846
II
1,31478
VIII
1,80143
III
0,97867
IX
0,77967
IV
0,62126
10
0,05413
0,15883
XI
11
0,52959
VI
1,03569
XII
12
0,99070
La interpretacin de los ndices es simple: desde octubre (X) a abril (IV), la temperatura est
por encima de la media anual; mientras que de mayo (V) a septiembre (IX) est por debajo
de la media. No olvidemos que los datos corresponden a una ciudad del hemisferio sur; por
tanto, de octubre a abril son los meses clidos, y los dems son los fros. Es de destacar
que la oscilacin trmica media, del mes ms clido al ms fro, es relativamente pequea
(1,31 + 1,80 = 3,01C). Esto, unido a los valores medios mensuales, que oscilan entre 23 y
29C permite afirmar que el estudio se est haciendo sobre una ciudad de clima muy suave
y casi permanentemente primaveral.
p34
Series temporales
-1
-2
0
12 s
Regresin
Residuos
Total
Ord. Origen
t
nu
1
106
107
S.C.
2,186
5,205
7,391
C.M.
2,186
0,049
F
44,512
Coeficientes
25,4733
0,00456
Error tpico
0,0459
0,0007
t
554,4281
6,6717
p-val
0,0000
0,0000
p-val
0,000
R^2 = 0,295735
Tabla 3.XII.- Modelo lineal para la tendencia:
Yt = 0 + 1 t +
A pesar del valor del coeficiente de determinacin del ajuste, (29,57 %), la explicacin del
modelo es significativa. As, se puede deducir que parece existir una tendencia muy ligera a
un incremento de la temperatura, que se ha estimado en un aumento de 0,00456 grados
mensuales en promedio.
La evolucin del modelo, junto con los datos reales, se presentan en la figura 3.9. Para su
obtencin, hay que tener en cuenta que, conocidos los ndices estacionales y el modelo de
tendencia, la suma mes a mes de los dichos valores darn lugar al modelo propuesto, es
decir:
# = 25,4733 + 0,00456 t + E
Y
t
s
con
t = 12$ + s
s = 1, , 12
p35
Y 30
28
26
24
22
0
24
48
72
96
120 t
Solamente hay que destacar la buena concordancia entre ambos, a pesar de que hay
algunos puntos que parecen presentar mayores discrepancias.
Esto ocurre, principalmente, desde abril hasta julio de 1993 que como, puede observarse, ya
en los datos iniciales presentaron unas temperaturas medias bastante superiores a las de
los dems aos (es decir hizo un otoo especialmente clido).
En la figura 3.10, se muestran los residuos resultantes de la descomposicin de esta serie,
# . Hay que destacar la buena modelizacin conseguida, pues
obtenidos como Rt = Yt Y
t
en la mayora de las 120 observaciones, el error es inferior a un grado, excepto en los
meses ya comentados.
R 2
-1
-2
0
24
48
72
96
120
p36
Series temporales
Ao
Mes
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
27,1
27,3
27,0
26,7
25,9
25,0
24,3
24,3
25,3
26,1
26,6
27,1
27,2
27,4
27,1
26,7
25,9
25,0
24,3
24,3
25,3
26,2
26,7
27,1
27,2
27,5
27,1
26,8
26,0
25,1
24,4
24,4
25,4
26,2
26,7
27,2
27,3
27,5
27,2
26,8
26,1
25,1
24,4
24,4
25,5
26,3
26,8
27,2
27,3
27,6
27,2
26,9
26,1
25,2
24,5
24,5
25,5
26,3
26,8
27,3
27,4
27,6
27,3
26,9
26,2
25,2
24,5
24,5
25,6
26,4
26,9
27,3
27,4
27,7
27,3
27,0
26,2
25,3
24,6
24,6
25,6
26,5
26,9
27,4
27,5
27,7
27,4
27,0
26,3
25,3
24,7
24,6
25,7
26,5
27,0
27,5
27,5
27,8
27,5
27,1
26,3
25,4
24,7
24,7
25,7
26,6
27,0
27,5
27,6
27,8
27,5
27,2
26,4
25,5
24,8
24,8
25,8
26,6
27,1
27,6
Tabla 3.XIII.- Temperatura prevista para los 10 aos siguientes a la recogida de datos
30
28
26
24
22
0
48
96
144
192
240 t
Fig. 3.11.- Datos desde 1986 a 1995 ( ) y previsiones desde 1996 a 2005 ( 1 )
p37
1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
90
88
109
103
103
122
134
132
115
101
91
112
111
115
129
121
112
125
164
158
133
127
110
120
127
107
141
135
133
154
175
174
158
139
112
140
142
139
145
162
144
176
192
190
160
151
134
140
146
155
182
165
165
191
195
205
182
165
138
155
164
151
180
164
184
206
198
235
197
163
148
163
175
161
179
195
189
208
227
249
224
193
170
166
176
194
197
211
191
235
248
273
202
189
167
168
208
189
232
226
222
245
252
242
229
202
192
198
199
190
228
220
222
233
303
253
253
223
191
185
207
198
251
231
234
251
316
285
250
232
190
201
219
206
229
223
231
266
290
294
258
214
206
199
Y 320
240
160
80
0
24
48
72
96
120
144 t
Hay una estacionalidad manifiesta que se repite anualmente. Ya que los datos son
mensuales, su perodo ser igual a 12.
p38
Series temporales
El patrn de estacionalidad tiene una forma constante pero presenta una amplificacin
continua en el tiempo. Esta situacin es la que indica que el modelo subyacente es
multiplicativo.
320
240
160
80
0
24
48
72
96
120
144 t
Regresin
Residuos
Total
Ord. Origen
t
t^2
nu
2
129
131
S.C.
194340,33
500,01
194840,34
C.M.
97170,17
3,88
F
25069,58
Coeficientes
100,4749
1,4326
-0,00297
Error tpico
0,6227
0,0197
0,0001
t
161,3636
72,8823
-22,5088
p-val
1,08E-150
1,08E-106
1,66E-46
p-val
7,937E-168
R^2 = 0,9974
Tabla 3.XV.- Estimacin del modelo de tendencia: Y = 0 + 1 t + 2 t2 +
p39
Yt
Yt
c) Asumiendo que los ciclos, caso de existir, son de perodo suficientemente largo como
para no ser recogidos por los datos, calcular los promedios de las Wt de cada estacin y la
media general. s es el indicador de la estacin (mes, en el ejemplo), y ns el nmero de
valores de W que se promedian en la citada estacin
E*s =
*
s
Wt
t = s + p$
s = 1, ..., p
ns
E =
s =1
E*s
E
100
En la tabla 3.XVI se muestran los valores de las componentes estacionales del presente
ejemplo, y se representan grficamente en la figura 3.14.
Mes
Es
Mes
Es
Mes
Es
92,38
97,04
IX
105,50
II
88,41
VI
109,53
94,11
III
101,72
VII
121,91
XI
81,54
IV
99,21
VIII
121,31
XII
87,33
p40
Series temporales
E 130
120
110
100
90
80
12 t
La interpretacin de los ndices podra ser en el sentido de que, por ejemplo, los usuarios de
los meses de julio y agosto son del orden de un 121% superior a la media, mientras que en
noviembre se est en un 81% de la media. Ello podra aconsejar una promocin en los
meses de noviembre, diciembre, enero y febrero, con el fin de conseguir una mayor
ocupacin de las plazas disponibles.
La figura 3.15 muestra la concordancia entre los datos y su modelizacin, a partir de la
tendencia y estacionalidad calculadas, de acuerdo con el modelo multiplicativo:
# =
Y
t
(100,4749
1,4326 t
0,00297 t2
Es
100
s = 1, ..., 12
t = s + 12$
320
240
160
80
0
24
48
72
96
120
144 t
Observando la figura 3.15 se puede destacar que hay unos desajustes ms acusados en
ciertos meses de julio o agosto, en concreto, los de los aos 1989, 90, 91, 93 y 94, por lo
que es posible afirmar que en los casos citados ha habido un comportamiento
sustancialmente distinto del esperado en los mismos meses de otros aos; en principio,
sera discutible afirmar la presencia de un cambio en los hbitos de utilizacin de este
transporte, ya que ni el ao 1993 ni el 1995, pertenecientes al perodo en cuestin,
presentan semejantes discrepancias.
p41
A pesar de todo, en este caso, sera prudente tomar con ciertas precauciones las
previsiones para aos venideros, mientras no se confirme la consolidacin en el futuro de un
cambio o de una permanencia de comportamiento. Tambin podra ser interesante intentar
averiguar qu ocurri en estos meses (quizs una campaa publicitaria, quizs una
disminucin de alternativas de la competencia,...).
La figura 3.16 muestra la evolucin de los residuos entre los datos experimentales y el
# . Se observa que, en la mayora de los casos, oscilan entre 16,
modelo ajustado, Rt = Yt Y
t
aunque en algn caso la discrepancia se aproxima a 30 unidades.
Asumiendo que se mantiene el mismo modelo, la previsin de usuarios hasta el ao 2000 se
presenta en la figura 3.17. Hay que tener en cuenta, para realizar correctamente los
clculos, que el ltimo valor de t para el que se dispone de datos, diciembre de 1995, es
144; por tanto, para las predicciones, que abarcan el perodo de los prximos 60 meses, los
valores de t irn desde 145 hasta 204.
R
32
16
-16
-32
0
24
48
72
96
120
144
24
48
72
96
120
144
Datos
168
192
Previsiones
p42
Series temporales
s = 1, 2 , @ , p
j = 2 , @ , p
p
j Qj t +
j=2
ti , que viene a
i=1
recoger la tendencia o evolucin general, a largo plazo, de los datos con el tiempo. Los
p
j= 2
del perodo estacional, introducen en la ordenada en el origen del modelo, parte aditiva
p
Q t
j
representan la influencia de la
j= 2
estacionalidad sobre la funcin del tiempo, lo que en el mtodo clsico se interpreta como
parte multiplicativa.
El estudio de la significacin de cada uno de los coeficientes , y , y la consiguiente
eliminacin de los no significativos conducir el modelo que definitivamente explica el
comportamiento de la serie.
p43
Para desarrollar la metodologa de las variables categricas sobre un ejemplo, se van a utilizar
los datos relativos a las ventas de material deportivo estudiados por el mtodo clsico, con el
fin de poder comparar posteriormente los resultados obtenidos. En la tabla 4.I se vuelven a
reproducir los datos de la serie cronolgica, junto a los valores de las variables categricas. La
representacin grfica de los mismos ya se present en la figura 3.1, cuya observacin
condujo a pensar en una tendencia lineal creciente y una estacionalidad de perodo p = 4.
A fin de no confundir los dos efectos, procede la creacin de variables categricas que
identifiquen cada una de las cuatro estaciones, que en este ejemplo constituyen el perodo
de repeticin del patrn estacional. Por otra parte, suponiendo que hubiese ciclos, el
intervalo de tiempo de recogida de datos es totalmente insuficiente para tomarlos, por lo que
su posible existencia quedar enmascarada en los residuos.
En la tabla 4.I estn las variables categricas Q2, Q3 y Q4, cuya conjuncin representa de
forma unvoca cada trimestre. Se insiste en que no es necesaria una Q1, puesto que el
primer trimestre es el que toma como referencia Q2 = Q3 = Q4 = 0, y son los dems que, a
travs del indicador, aportarn la parte del efecto estacional correspondiente.
En este caso, al ser la tendencia rectilnea, se plantea el modelo
Y = 0 + 1 t + 2 Q2 + 3 Q3 +
4 Q4+
2 Q2 +t
3 Q3 +t
4 Q4+ t
Trimestre (s)
Ventas (Y)
Q2
Q3
Q4
1990
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
40,22
54,89
63,51
111,35
46,95
51,62
61,47
108,58
41,38
65,30
64,25
113,82
53,34
59,37
66,15
121,5
67,38
56,09
75,11
124,39
55,90
61,25
75,44
126,50
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
1991
1992
1993
1994
1995
p44
Series temporales
Los resultados del modelo lineal general evidencian que todos los trminos del tipo Qjt no
son estadsticamente significativos, (p-val < 0,05), por tanto procede recalcular el modelo
prescindiendo de ellos.
Cabe destacar que este hecho manifiesta que la estacionalidad no modifica la pendiente de
la recta del tiempo, es decir, el incremento de las ventas es el mismo para cada trimestre.
Esto simplifica el caso al corresponder a un modelo aditivo puro, que puede ser,
alternativamente, estudiado por la metodologa de la descomposicin clsica, tal como se ha
hecho en el captulo 3. Si alguno de esos trminos hubiese resultado significativo, el sistema
clsico proporcionara un modelo bastante precario.
Regresin
Residuos
Total
Ord. Origen
Q2
Q3
Q4
t
t*Q2
t*Q3
t*Q4
nu
7
16
23
S.C.
17166,997
357,988
17524,985
C.M.
2452,428
22,374
F
109,609
Coeficientes
38,9463
15,7735
19,1936
65,6577
1,0832
-0,8026
-0,3513
-0,1485
Error tpico
3,660
5,351
5,535
5,726
0,283
0,400
0,400
0,400
t
10,640
2,948
3,468
11,466
3,832
-2,008
-0,879
-0,371
p-val
0,000
0,009
0,003
0,000
0,001
0,062
0,393
0,715
p-val
0,000
R^2 = 0,9796
Tabla 4.II.- Resultados del modelo lineal general
La tabla 4.III contiene los resultados del ajuste del modelo definitivo, es decir, de
Y = 0 + 1t +
Regresin
Residuos
Total
Ord. Origen
Q2
Q3
Q4
t
2 Q 2 +
3 Q3 +
4 Q 4 +
nu
4
19
23
S.C.
17064,626
460,359
17524,985
C.M.
4266,157
24,229
F
176,073
Coeficientes
42,5280
6,4674
15,2781
64,5555
0,7576
Error tpico
2,580
2,846
2,857
2,876
0,147
t
16,484
2,273
5,347
22,447
5,151
p-val
0,000
0,035
0,000
0,000
0,000
R^2 = 0,97373
Tabla 4.III.- Resultados del modelo definitivo
p-val
0,000
p45
Res
Res
%P
Res
Fig. 4.1.- Grficos de los residuos del modelo
p46
Series temporales
Para un tiempo correspondiente a un segundo trimestre, las variables categricas toman los
valores Q2 = 1 y Q3 = Q4 = 0 y el modelo es
# = 42,5280 + 0,7576 t + 6,4674 = 48,9954 + 0,7576 t
Y
t
con
t = 2 + 4$
Para un tiempo de tercer trimestre, las variables categricas toman los valores Q3 = 1 y Q2 =
Q4 = 0 y el modelo es
# = 42,5280 + 0,7576 t + 15,2781 = 57,8061 + 0,7576 t
Y
t
con
t = 3 + 4$
Y, en el caso del cuarto trimestre, las variables categricas toman los valores Q4 = 1 y
Q2 = Q3 = 0; el modelo es
# = 42,5280 + 0,7576 t + 64,5555 = 107,0835 + 0,7576 t con
Y
t
t = 4 + 4$
As, para cada trimestre (estacin del perodo), se obtiene un modelo del mismo tipo,
rectilneo con igual pendiente, en este caso, pero con distinta ordenada en el origen.
Esto se puede interpretar como que, tomando siempre como referencia el primer trimestre,
en el segundo el volumen de ventas aade a la funcin del tiempo 6,4674 unidades, en el
tercero el incremento es de 15,2782 y en el cuarto de 64,5555 unidades. Estos valores son,
evidentemente, los coeficientes de las variables categricas.
En consecuencia los coeficientes de las variables categricas representan la cantidad en
que una estacin, sistemticamente, supera (o no alcanza, segn sea el signo) el valor de la
primera estacin del perodo. Es decir, estos coeficientes son una forma de medir el
componente estacional.
Para evaluar la bondad del modelo, en la figura 4.2 se muestra la comparacin de los
valores medidos con los estimados a partir del modelo ajustado; se observa la buena
concordancia entre ambos.
La modelizacin tiene como objetivo principal el poder hacer previsiones para un futuro
prximo. En este caso se procede a calcular las previsiones para los prximos 2 aos, a
base de sustituir los valores del tiempo y de las variables categricas en el modelo obtenido.
Los resultados se muestran en la tabla 4.IV y en la figura 4.3.
Y 130
100
70
40
0
12
16
20
24 t
p47
Aqu se detecta la coherencia de la previsin con los datos histricos, siempre que no
cambie el modelo de comportamiento de la serie en el perodo previsto. Esto podra ocurrir,
por ejemplo, si hubiese una recesin econmica, la apertura de otro comercio de similares
caractersticas en las inmediaciones, un cambio de hbitos en la poblacin, una campaa
propagandstica con xito de la competencia, etc.
# = 42,5280 + 0,7576 t+ 6,4674Q + 15,2781Q + 64,5555Q
Y
t
2
3
4
Ao
Q2
Q3
Q4
#
Y
t
1996
25
61,4680
26
68,6930
27
78,2613
28
128,2963
29
64,4984
30
71,7234
31
81,2917
32
131,3267
1997
140
90
40
0
1990
12
datos
16
20
24
28
32 t
1995 1996 1997
previsiones
Fig. 4.3.- Datos, modelo y previsiones para los dos aos siguientes
p48
Series temporales
En las tablas 3.IX y 4.IV se han presentado las previsiones de ventas del material deportivo
para los ocho trimestres siguientes a la recogida de informacin, es decir, para los aos
1996 y 1997, siempre bajo el supuesto que el comportamiento de la serie no va a cambiar
en este perodo de tiempo. La figura 4.6 da idea de la casi coincidencia de las previsiones
para las dos formas de anlisis estudiadas.
Valores modelizados
130
100
70
40
0
12
16
20
24
p49
15
R(categricas)
10
5
0
-5
-10
-10
-5
10
15
R(descomp. clsica)
Fig. 4.5.- Residuos de la descomposicin frente a los del modelo en variables categricas
Ya que el objetivo del sistema clsico es descomponer la serie como un modelo aditivo, o
multiplicativo si fuese el caso, de tendencia, estacionalidad, ciclos y residuos, es necesario
identificar cada componente.
Previsiones
140
115
90
65
40
24
28
32
Fig. 4.6.- Previsiones para los dos aos siguientes segn la descomposicin clsica ( )
y las variables categricas ( )
Yt = 0 +
i
t +
i =1
L o s
a u t o r e s ,
j Qj
j=2
2 0 0 1 ;
E d i c i o n s
U P C ,
2 0 0 1 .
p50
Series temporales
a otro con sus componentes aisladas. Considerando el modelo aditivo, y suponiendo que los
ciclos, caso de existir, no sean identificables con los datos disponibles, tendremos
Yt =Tt + Et
En este caso, despus de estabilizar la serie, se habr modelizado la tendencia como
Tt = a0
i=1
ti
Debido a que es posible tener dos contadores del tiempo, uno asociado al momento de toma
de datos y otro que identifica la estacin a la que pertenece el dato, cualquier instante t
puede escribirse como t = s + k p = s + p$ , con k = 0, 1, 2, y s = 1, 2,..., p, es decir, t
es un mltiplo del perodo, p, ms el indicador de la estacin, s. As, resulta
Yt = Tt + Et = a0 +
i=1
ti +
Es
donde
s =1
i ti
Yt=1+ p$ = 0
Yt= 2+ p$ = 0
i=1
q
i=1
ti +
ti +
= a0 +
i=1
ti +
2=
a0 +
p =
a0 +
i=1
E1
ti +
E2
ti +
Ep
A
Yt=p+ p$ = 0
i=1
i=1
p 0 +
j = p a0
a0 = 0 +
j= 2
j= 2
p51
Tt = 0 +
j= 2
ti
i=1
i=1
Al ser la estacionalidad Es = Yt = s+ p$
ti + s s = 1, , p
t = s + p$
Tt resulta
p
Es = s
j= 2
Para el caso del ejemplo del material deportivo, p = 4, con variables categricas se obtuvo el
modelo
# = 42,5280 + 0,7576 t+ 6,4674Q + 15,2781Q + 64,5555Q
Y
t
2
3
4
4
j= 2
Tt = 0 +
j= 2
i=1
E1 =
0 21,57525
E2 =
E3 =
E4 =
= 21,57525
p52
Series temporales
Se comprueba que Es = 0 .
s =1
Estos valores, como era de esperar, son muy similares a los obtenidos por la
descomposicin clsica (captulo 3), que resultaron ser 20,6426; 15,5836; 6,5264 y
42,7526, respectivamente.
Como resumen, se puede reiterar la gran similitud de valores de los coeficientes del modelo
de tendencia y de los ndices estacionales obtenidos por los dos mtodos desarrollados.
Esta concordancia es buena para un caso como el que se acaba de estudiar, que se podra
etiquetar como modelo aditivo puro. Si se hubiera dado la circunstancia de una serie donde
la estacionalidad hubiese afectado a la tendencia de distinta forma en cada componente del
perodo, es decir, variando ya la pendiente, ya la ordenada en el origen, la descomposicin
clsica no hubiese conseguido modelizarla correctamente.
Es por todo ello que se puede afirmar que la modelizacin global con variables categricas
es un procedimiento mucho ms general para el estudio del comportamiento de una serie
temporal y la realizacin de previsiones.
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Y
99,30
65,27
48,27
20,58
75,17
104,76
58,96
67,18
28,44
83,71
121,13
51,52
64,30
25,60
76,50
t
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Y
117,66
52,67
63,96
40,85
76,12
116,48
52,86
79,80
44,25
88,39
125,34
46,45
80,05
50,67
94,03
t
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
Y
127,52
30,42
92,71
60,22
88,61
136,60
32,16
104,76
60,62
93,53
142,92
33,34
103,53
68,86
92,50
t
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
Y
149,66
34,13
118,31
64,06
106,09
150,28
25,74
114,62
74,64
106,34
149,02
29,06
121,42
76,33
114,29
p53
20
60 t
40
Y
99,3
65,27
48,27
20,58
75,17
104,76
58,96
67,18
28,44
83,71
121,13
51,52
Q2
0
1
0
0
0
0
1
0
0
0
0
1
Q3
0
0
1
0
0
0
0
1
0
0
0
0
Q4
0
0
0
1
0
0
0
0
1
0
0
0
Q5
0
0
0
0
1
0
0
0
0
1
0
0
...
...
...
...
...
...
p54
Series temporales
3 Q3 +
4 Q4 +
5Q 5 +
2Q2 t+
3Q3+t
4Q4+t
5Q+5t
Regresin
Residuos
Total
Ord. Origen
Q2
Q3
Q4
Q5
t
t*Q2
t*Q3
t*Q4
t*Q5
nu
9
50
59
Coef.
101,580
-38,364
-53,757
-83,296
-31,512
0,941
-1,636
0,385
0,106
-0,288
S.C.
C.M.
73631,982 8181,331
1151,873
23,037
74783,855
Error tpico
2,675
3,832
3,882
3,933
3,985
0,080
0,114
0,114
0,114
0,114
t
37,978
-10,012
-13,849
-21,179
-7,908
11,718
-14,408
3,387
0,935
-2,539
F
355,132
p-val
0,000
p-val
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,001
0,354
0,014
R^2 = 0,9846
Tabla 4.VII.- Resultados del modelo lineal inicial
Regresin
Residuos
Total
Ord. Origen
Q2
Q3
Q4
Q5
t
t*Q2
t*Q3
t*Q5
nu
8
51
59
Coef.
100,067
-36,851
-52,244
-80,110
-29,999
0,994
-1,689
0,331
-0,341
S.C.
C.M.
73611,831 9201,479
1172,023
22,981
74783,855
Error tpico
2,127
3,469
3,524
1,964
3,637
0,057
0,098
0,098
0,098
t
47,038
-10,622
-14,824
-40,780
-8,247
17,529
-17,198
3,376
-3,476
F
400,398
p-val
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,001
0,001
R^2 = 0,9843
Tabla 4.VIII.- Resultados del modelo lineal definitivo
p-val
0,000
p55
200
160
120
80
40
0
20
40
60 t
R 12
8
4
0
-4
-8
-12
0
20
40
60 t
#
Fig. 4.9.- Residuos del modelo: R = Y Y
p56
Lunes:
Viernes:
Series temporales
s=1
s=5
Q2 = Q3 = Q4 = Q5 = 0
Q2 = Q3 = Q4 = 0
Q5 = 1
# = 100,07 + 0,99 t
Y
# = 70,07 + 0,65 t
Y
con t = 5$ +1
con t = 5$ +5
En la figura 4.10, se puede observar cada una de las cinco rectas que componen el modelo,
sobre el fondo de los datos experimentales. Cada recta, a la derecha del grfico, lleva el
indicador estacional que le corresponde (lunes: s =1; martes: s = 2 ). De la ecuacin del
modelo general y del estudio de este grfico se puede concluir que el lunes y el jueves
tienen la misma tendencia (las rectas 1 y 4 son paralelas); sin embargo el lunes tiene,
sistemticamente, un mayor nmero de usuarios que el jueves. Esta discrepancia constante
es la diferencia de ordenadas de ambas rectas, o sea el coeficiente de Q4, que en este caso
es igual a 80,11. La tendencia comn indica un aumento sostenido de usuarios que se
evala en un incremento de 0,99 usuarios al da (coeficiente de t en las rectas 1 y 4).
Y 160
1
3
120
5
4
80
40
2
0
20
40
60
En cuanto a los mircoles y viernes (rectas 3 y 5), se puede decir que tienen un
comportamiento similar. En los primeros das haba algo ms de usuarios el viernes que el
mircoles; sin embargo, dicho nmero ha aumentado en ambos, pero con mayor velocidad
el mircoles, de forma que actualmente ste ya supera al viernes.
Especial atencin merece el martes (recta 2), ya que inicialmente tena un nmero de
usuarios situado ms o menos en el promedio de los otros das, pero ha sufrido un
decrecimiento progresivo que actualmente lo sita en un valor muy inferior a los dems das
de la semana, los cuales, en mayor o menor grado, han presentado un incremento de
demanda del servicio.
Est claro que, en la prctica, una situacin como sta requerira de un estudio en
profundidad de las causas que han conducido a esta situacin: quizs la persona que
atiende la lnea no es la misma, o hay mayores dificultades para establecer comunicacin y
el pblico deja de llamar los martes,...
La obtencin del modelo tiene como principal objetivo el poder hacer previsiones del
comportamiento de la demanda del servicio durante los prximos das, a fin de programar un
p57
aumento del nmero de lneas telefnicas, del nmero de personas que atienden a los
usuarios, plantearse una redistribucin en el tiempo, etc.
La tabla 4.IX muestra las previsiones para las dos semanas prximas, junto a los valores del
tiempo y de las variables categricas, necesarios para ser sustituidos en el modelo general.
t
61
62
63
64
65
66
67
68
69
70
Q2
0
1
0
0
0
0
1
0
0
0
Q3
0
0
1
0
0
0
0
1
0
0
Q4
0
0
0
1
0
0
0
0
1
0
Q5
0
0
0
0
1
0
0
0
0
1
Y prevista
160,686
20,129
131,312
83,557
112,478
165,655
16,654
137,938
88,526
115,741
En la figura 4.11 se pueden observar los valores de las previsiones como extrapolacin del
modelo ajustado sobre los datos disponibles, constatndose la gran disminucin del nmero
de usuarios del martes.
Y180
150
120
90
60
30
0
0
10
20
30
40
50
60
70 t
p58
Series temporales
5 AUTOCORRELACIN
En este captulo se presenta una herramienta de anlisis, el correlograma, o representacin
grfica de la funcin de autocorrelacin, que tiene una doble utilidad. Por una parte, puede
servir para confirmar la presencia de estacionalidad y determinar su perodo; por otra, indica
cuntas previsiones son admisibles, a partir del ltimo tiempo de recogida de informacin.
El concepto de autocorrelacin es bien simple; supongamos que se dispone de la serie
cronolgica Y1, Y2,... , Y1+k,... , YN, y se desplaza dicha serie k unidades de tiempo; se
pueden formar las parejas (Y1; Y1+k), (Y2; Y2+k), (Y3; Y3+k),..., (YNk; YN).
El coeficiente de correlacin entre ambas series, es decir, de las parejas citadas, se denota
por k y recibe el nombre de coeficiente de autocorrelacin de orden k; el desplazamiento k
tambin se denomina retardo, y representando grficamente k en funcin del retardo k, se
obtiene el autocorrelograma de la serie. De la estructura del planteamiento se deduce que
k=k.
5.1 Correlograma
Un valor no nulo de k indica que existe correlacin entre informaciones separadas k
unidades de tiempo, es decir, la historia se transmite k unidades de tiempo ms all. En
consecuencia, si el ltimo valor del tiempo del que se dispone de datos es el T, ser
admisible hacer previsiones para un tiempo igual a T+k. Evidentemente, si k fuese nulo,
sera inadmisible una prediccin para T+k, ya que los datos disponibles no transmiten
ninguna informacin relevante a una distancia como la considerada.
Sea que se dispone de una serie cronolgica de datos y1, y2,..., yt,..., yN, para elaborar el
correlograma o grfico de la funcin de autocorrelacin. Se estiman las siguientes
caractersticas:
N
Media:
= y =
m
yi
i=1
N
N k
Autocovariancia: k =
Autocorrelacin:
(yi y) (yi+ k y)
i =1
k = rk =
k = 0, 1,..., N1
k
0
Para poder estimar la autocovariancia, k, el nmero de componentes de la serie debe ser tal
que N > k+1, y es recomendable N 50 y k N/4.
p59
Autocorrelacin
1
N
K 1
(K 1)
i2
kK
k)
V(r
1
N
K 1
(K 1)
ri
V(rk )
V(rk )
1
N
1
N
k K
1 + 2
K 1
r
1
K =1
k K
K > 1
1
1
1
1
1
PN = 2
...
...
...
N - 1 N - 2 N - 3
. . . . . N - 1
. . . . . N - 2
. . . . . N - 3
.....
...
.....
1
p60
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Series temporales
Y
304
303
307
299
296
293
301
293
301
295
284
286
286
287
284
282
278
281
t
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
Y
278
277
279
278
270
268
272
273
279
279
280
275
271
277
278
279
283
284
t
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
Y
282
283
279
280
280
279
278
283
278
270
275
273
273
272
275
273
273
272
t
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
Y
273
272
273
271
272
271
273
277
274
274
272
280
282
292
295
295
294
290
t
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
Y
291
288
288
290
293
288
289
291
293
293
290
288
287
289
292
288
288
285
t
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
Y
282
286
286
287
284
283
286
282
287
286
287
292
292
294
291
288
289
310
300
290
280
270
260
0
40
80
120
En la tabla 5.II se presenta el detalle del clculo de las autocorrelaciones para los casos de
k =1 y k = 2, de los valores de la tabla 5.I. En primer lugar es necesario calcular la media de
todos los datos
= y =
m
1
( 304 + . . . + 295 ) = 299,2
10
p61
Autocorrelacin
k=0
k=1
k=2
304
303
307
299
296
y-y
20,44
19,44
23,44
15,44
12,44
304
303
307
y-y
20,44
19,44
y
y-y
...
105
106
107
291
288
289
...
7,44
4,44
5,44
299
...
294
291
288
23,44
15,44
...
10,44
7,44
4,44
304
303
307
...
292
294
291
20,44
19,44
23,44
...
8,44
10,44
7,44
1 =
1
107
107
(y
(y
- y )2 =
- y ) ( y i - 1 - y )=
r1 = 1 =
2 =
1
107
107
(y
20,442
107
1
107
0 =
= 74,695
2
59,775
=
= 0,800
0
74,695
etc.
Segn Bartlett las desviaciones tipo estimadas para r1 y r2 son:
S(r1) =
S(r2 ) =
1
N
= 66,123
1
66,123
=
= 0,885
0
74,695
- y ) ( y i - 2 - y )=
r2 = 2 =
+ ... + 5,442
107
1
N
(1 + 2 r12 ) =
1
107
= 0,097
1 + 2 0,8852
107
etc.
= 0,155
= 59,775
p62
Series temporales
Y los intervalos 2 S(rk) son, respectivamente, 0,194 y 0,310 para k=1 y k=2. En
consecuencia, con un riesgo del 5%, 1 y 2 pueden ser significativamente distintos de cero.
Analizando los 107 valores de la serie completa para k = 1, 2,..., 10, se obtienen los valores
mostrados en la tabla 5.III y presentados en la figura 5.2. De estos resultados, se verifica
que a partir de k = 7 ya se puede considerar k como nulo, es decir, no es admisible hacer
previsiones separadas en ms de 7 unidades de tiempo del ltimo momento de recogida de
datos.
10
rk
0,89
0,80
0,70
0,63
0,58
0,55
0,48
0,40
0,31
0,23
S(rk)
0,10
0,15
0,19
0,21
0,23
0,24
0,25
0,26
0,27
0,27
rk
0,5
0
k
-0,5
-1
Con los valores de la tabla 5.III, se puede escribir la matriz de autocorrelaciones que, para k
=3, adquiere la siguiente forma:
=
P3
0,885
0,800
0,885
0,800
1
0,885
0,885
1
0,699
0,800
0,885
0,800
0,885
1
0,699
p63
Autocorrelacin
En la figura 5.3 se muestran los correlogramas de las series analizadas hasta ahora.
El primero, que corresponde a los datos de la figura 1.2 de la evolucin del ndice IBEX35,
muestra que slo son significativos los tres primeros coeficientes de autocorrelacin; por
tanto, las previsiones dejan de ser vlidas a partir de tres unidades de tiempo despus del
ltimo dato. Es decir, lo que ocurra en un instante se transmite hasta tres unidades de
tiempo ms adelante.
El segundo, de los datos de la tabla 3.I y de la figura 3.1 sobre las ventas trimestrales de
material deportivo, confirma la estacionalidad de perodo cuatro, ya que cada cuatro barras
de autocorrelacin se repite la misma estructura de comportamiento. En este caso es
posible hacer previsiones a cuatro trimestres vista, ya que para k = 4 el coeficiente de
autocorrelacin es significativamente distinto de cero, aunque no lo sean los de k = 1, 2 y 3.
Este hecho se puede interpretar como que la informacin de un trimestre se transmite
directamente hasta una distancia temporal de cuatro trimestres, sin que afecte el
comportamiento de los tres trimestres intermedios. As, por ejemplo, una vez conocidas las
ventas de invierno, se puede hacer la previsin para el invierno prximo puesto que lo que
ocurra en primavera, verano y otoo no afectar al invierno siguiente.
p64
Series temporales
IBEX
rk
DEPORTE
rk 1,0
0,5
0,5
0,0
-0,5
-0,5
-1,0
-1
TEMPERATURAS
rk
USUARIOS TRANSPORTE
rk 1,0
0,5
0,5
0,0
-0,5
-0,5
-1
-1,0
k
USUARIOS TELFONO
rk
1
0,5
0
-0,5
-1
p65
#
El valor de St es la previsin para el tiempo siguiente, es decir, Y
t + 1 = St .
El anlisis de la expresin anterior permite interpretar este tipo de suavizado, de forma que
el valor de Y previsto para el perodo t+1, es decir St, se obtenga como promedio ponderado
de los valores reales que ha presentado la serie cronolgica desde el inicio de la recogida
de informacin. La discrepancia entre los valores obtenidos y los previstos, Yt+1 St, es
atribuible en parte al componente aleatorio y, posiblemente, a cambios bruscos en el
comportamiento de la serie.
El coeficiente de ponderacin juega el siguiente papel: cuanto mayor sea su valor, tanto
ms peso se dar a los valores recientes, en detrimento de los antiguos; mientras que
valores de prximos a cero dan gran peso a la historia y poca importancia a los valores
prximos.
p66
Series temporales
As, si la serie se mantiene estable, sern interesantes valores pequeos del coeficiente de
ponderacin ya que amortiguarn fuertemente la oscilacin aleatoria, mientras que si la
serie presentara cambios bruscos, la serie suavizada tardara mucho en detectarlos si su
fuese pequea, mientras que respondera prontamente a ellos con valores altos del
coeficiente .
Analizando la expresin del valor suavizado, para distintos valores de , se puede escribir,
por ejemplo,
= 0,10
= 0,50
= 0,90
Es decir, con un valor del factor de ponderacin de 0,10, la previsin para t = 5 est
constituida por un 10% del valor observado en t = 4, un 9% del de t = 3, un 8,1% del de t = 2
y un 72,9 % del de t = 1; o sea, con un valor pequeo de , la previsin est constituida
mayoritariamente por el valor ms antiguo.
Cuando es igual a 0,50, los pesos aplicados a cada valor recogido estn ms
uniformemente repartidos y, cuando es grande, por ejemplo 0,90, el mayor componente de
la previsin es el ltimo valor observado; los dems tendrn un valor de ponderacin tanto
ms pequeo cuanto ms alejados estn en el tiempo.
El suavizado exponencial puede verse como un mtodo alternativo a las medias mviles,
con sus ventajas e inconvenientes.
Entre las primeras hay que citar que con la ponderacin exponencial no se pierde ninguna
informacin, al contrario que con las medias mviles, pues cuanto mayor era la longitud del
perodo a promediar, tanta ms informacin se perda, en el inicio y en el fin de la serie.
Adems una serie con cambios de tendencia, ms o menos bruscos, se puede modelizar
por suavizado exponencial y no podra hacerse ni por descomposicin ni por variables
categricas. Por el contrario, si la serie presenta estacionalidad con las medias mviles,
siempre que se escoja correctamente el perodo, sta desaparece totalmente y da lugar a
una serie estabilizada que permite modelizar directamente la tendencia, hecho que no
ocurre con la ponderacin exponencial simple, que no es capaz de suavizar la oscilacin
debida a la estacionalidad.
Para solucionar este inconveniente, se han desarrollado tcnicas basadas en el suavizado
exponencial, que permiten incorporar un modelo de tendencia o bien una componente
estacionaria; stas son las tcnicas de Brown, para el primer caso, o de Winters para el
segundo.
p67
Error medio: promedio de los errores de previsin; atendiendo a que para hacer
previsiones hay que disponer de datos, el primer valor previsto posible ser el de t = 2:
n
ME=
n
Y t - St )
t=2
n -1
MSE=
n
2
Y t - St )
t=2
n -1
Error absoluto medio: promedio de los valores absolutos de los errores de previsin:
n
M AE=
Y t - St
t=2
n -1
Media del porcentaje del error: promedio de los porcentajes de los errores relativos de
previsin:
n
MPE =
n
t=2
Yt
%
Y
t
Yt
n -1
100
Media del porcentaje de error absoluto: promedio de los porcentajes de los valores
absolutos de los errores de previsin relativos:
n
M APE =
t=2
%t
Yt - Y
x 100
Yt
n -1
Hay que insistir en que en una serie en la que el tiempo es t = 1, 2,..., n, el suavizado
exponencial no ofrece ninguna previsin para t = 1, y, por tanto, no existe error de previsin
p68
Series temporales
en este punto; consecuentemente, en este caso los errores siempre son promedios de n 1
valores.
De los errores expuestos, aquellos que no toman valor absoluto, ME y MPE, tienen poco
inters ya que, a causa de la compensacin de valores positivos y negativos, pueden dar
valores de los promedios muy prximos a cero aun cuando existan errores de previsin muy
grandes. En general, se selecciona aquel valor de para el cual los valores del error
absoluto medio y del cuadrtico medio, MAE y MSE, alcancen los valores ms bajos.
Como ejemplo consideremos los datos de la tabla 6.I, serie cronolgica de 50 valores, cuya
representacin grfica puede verse en la figura 6.1.
Yt
Yt
Yt
Yt
Yt
1
2
3
4
5
6
7
8
9
10
9,958
10,096
11,552
9,113
13,898
11,487
11,114
9,505
17,934
12,339
11
12
13
14
15
16
17
18
19
20
16,510
12,674
17,504
13,462
16,945
18,653
18,942
15,084
16,568
20,733
21
22
23
24
25
26
27
28
29
30
26,267
20,401
18,748
20,800
21,683
27,069
23,728
24,890
26,132
24,663
31
32
33
34
35
36
37
38
39
40
25,217
24,653
28,062
27,317
26,122
29,837
28,854
27,129
30,194
34,104
41
42
43
44
45
46
47
48
49
50
28,448
35,726
30,602
31,011
31,732
31,538
32,175
35,543
35,534
37,336
Y 40
30
20
10
0
0
10
20
30
40
50 t
p69
Aplicando la ponderacin exponencial a estos datos, en funcin del valor de , los errores
evolucionan segn muestra la tabla 6.II.
0,100
0,150
0,200
0,250
0,300
0,350
0,400
0,450
0,500
0,550
0,600
0,650
0,700
0,750
0,800
0,850
0,900
0,950
ME
4,278
3,092
2,416
1,984
1,685
1,467
1,300
1,169
1,062
0,974
0,899
0,835
0,780
0,731
0,689
0,651
0,617
0,586
MSE
25,408
15,628
11,731
9,904
8,975
8,496
8,270
8,200
8,233
8,341
8,507
8,722
8,981
9,283
9,628
10,019
10,461
10,961
MAE
4,363
3,196
2,627
2,351
2,217
2,174
2,171
2,183
2,214
2,251
2,289
2,330
2,371
2,418
2,470
2,525
2,581
2,643
MPE
17,577
12,719
9,817
7,896
6,531
5,510
4,716
4,079
3,556
3,119
2,746
2,425
2,145
1,898
1,677
1,479
1,299
1,133
MAPE
18,494
13,812
11,622
10,632
10,214
10,157
10,271
10,449
10,696
10,960
11,233
11,508
11,786
12,082
12,396
12,723
13,052
13,406
p70
Series temporales
=0,30
40
40
30
30
20
20
10
10
0
0
0
10
20
30
40
50
60 t
=0,45
10
20
30
40
50
60 t
20
30
40
50
60 t
=0,95
40
40
30
30
20
20
10
10
0
0
10
20
30
40
50
60 t
10
) para distintas .
Fig. 6.3.- Serie original () y suavizada (
Directamente se observa que, en este caso, para valores pequeos de la serie suavizada
va por detrs de la real, es decir, tarda mucho en responder a la evolucin. Sin embargo,
cuando = 0,95, la suavizada est totalmente ligada a la oscilacin aleatoria de la serie, es
decir, la previsin para el tiempo inmediato siguiente es prcticamente igual al ltimo valor
medido. Cuando = 0,45, valor para el que ha resultado un error cuadrtico medio mnimo,
la serie suavizada exponencialmente, sigue ms claramente el esqueleto de la serie
cronolgica y queda amortiguada la oscilacin aleatoria.
p71
-6
0
10
20
30
= 0,10 ()
40
= 0,45 ( )
50 t
= 0,90 ( )
Para el valor del coeficiente de ponderacin seleccionado ( = 0,45), se calculan los valores
# = S ) y los residuos
de la serie suavizada, (St = 0,45 Yt + 0,55 St-1), las previsiones ( Y
t
t-1
#
(R =Y Y ), cuyos valores se muestran parcialmente en la tabla 6.III. En dicha tabla figuran
t
tambin los valores previstos para los tiempos 51, 52 y 53, de los que ya no se dispone de
datos.
p72
Series temporales
t
1
2
3
48
49
50
51
52
53
Yt
9,958
10,096
11,552
35,543
35,534
37,336
#
Y
t
9,958
10,020
31,825
33,498
34,414
35,729
35,729
35,729
St
9,958
10,020
10,709
33,498
34,414
35,729
35,729
35,729
35,729
Rt
0,138
1,532
3,718
2,036
2,922
40
30
20
10
0
0
10
15
20
25
30
35
40
45
50
55 t
p73
t1
St = (1 )i Yti
i=0
+ (1 )t S0
St = (1 )i
i=0
= (a + bt)
[a + b(t i)]
t 1
i=0
+ (1 )t S0 =
t 1
(1 )i b i (1 )i + (1 )t S0
i=0
(1 )i
i= 0
t 1
i (1 )i
i= 0
En consecuencia,
St = (a + bt) b
1
2
1
y
2
%
= Y
t
(1 ) t 0
Se observa que la serie ponderada de unos datos cronolgicos con tendencia lineal es una
1-
recta paralela a los datos con un desplazamiento igual a
b.
+ (1 ) S(2)
t 1
que, por desarrollo anlogo con el del primer suavizado, se puede expresar como
S(2)
= St
t
%
b = Y
t
St
S(2)
t
Si se dispone del valor de la serie para el tiempo t, se puede calcular la pendiente estimada
en ese instante, es decir, b t , que representa el incremento del valor de la serie por unidad
de tiempo. En ese momento, la previsin para un valor del tiempo igual a t + T se puede
obtener como el valor previsto para el tiempo t, ms T veces b t , es decir,
%
% + b T .
Y
= Y
t+ T
p74
Series temporales
Como consecuencia, a partir de los datos disponibles hasta un cierto instante se puede
predecir el inmediato siguiente. De esta manera la serie cronolgica formada por las
previsiones (estimaciones) de Y, segn el modelo lineal suavizado, estar constituida por los
valores
# =
Y
+ b 1 = + b
t 1
t 1
t 1
t 1
#
Y
t
bt T
Como ejemplo, se va a aplicar esta metodologa a los datos de la tabla 6.I. Para ello hay que
# y Rt . La evolucin
dar valores a y, para cada valor de t, calcular St , S(2)
t , a t , bt , Yt
de los errores en funcin de se muestra en la figura 6.6.
MSE
0,10
0,15
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
MSE
7,164
6,563
6,848
7,979
9,466
11,325
13,684
16,752
20,879
26,643
MAE
1,995
2,004
2,094
2,266
2,443
2,683
2,956
3,258
3,577
4,047
30
20
10
0
0
0,2
0,4
0,6
0,8
p75
Las previsiones desde t = 51 hasta t = 55, (T = 1,..., 4), que son las aceptables segn indic
el correlograma de la figura 6.2, se obtienen a partir de la expresin de las previsiones, es
decir,
#
Y
= at
t+ T
bt T = 35,794 + 0,549 T
La evolucin grfica de las series suavizada y prevista se muestran en la figura 6.7, donde
se observa una muy buena concordancia entre los datos reales y los suavizados, y se
aprecia que la previsin sigue la tendencia marcada por la serie cronolgica real.
t
Yt
St
S(2)
t
...
48
49
50
...
35,543
35,534
37,336
...
31,216
31,864
32,685
...
28,526
29,027
29,576
t
...
33,906
34,701
35,794
bt
#
Y
t
...
0,475
0,501
0,549
...
33,278
34,381
35,202
40
30
20
10
0
0
20
40
60
# , y da idea de la
La figura 6.8 contiene los residuos del modelo, o sea Rt = Yt Y
t
buena concordancia entre los datos reales y el modelo resultante del suavizado exponencial
de Brown. Este hecho avala la veracidad de las previsiones siempre y cuando no se
modifique el patrn de comportamiento que rega durante el perodo de recogida de datos.
p76
Series temporales
R 8
6
4
2
0
-2
-4
t
Fig. 6.8.- Residuos
p77
Otros ejemplos
7 OTROS EJEMPLOS
En este captulo se van a desarrollar algunos casos prcticos de aplicacin de las tcnicas
propuestas anteriormente.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
562,674
599,000
668,516
597,798
579,889
668,233
499,232
215,187
555,813
586,935
546,136
571,111
634,712
639,283
712,182
621,557
621,000
675,989
501,322
220,286
560,727
602,530
626,379
605,508
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
646,783
658,442
712,906
687,714
723,916
707,183
629,000
237,530
613,296
730,444
734,925
651,812
676,155
748,183
810,681
729,363
701,108
790,079
594,621
230,716
617,189
691,389
701,067
705,777
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
747,636
773,392
813,788
766,713
728,875
749,197
680,954
241,424
680,234
708,326
694,238
772,071
795,337
788,421
889,968
797,393
751,000
821,255
691,605
290,655
727,147
868,355
812,390
799,556
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
843,038
847,000
941,952
804,309
840,307
871,528
656,330
370,508
742,000
847,152
731,675
898,527
778,139
856,075
938,833
813,023
783,417
828,110
657,311
310,032
780,000
860,000
780,000
807,993
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
895,217
856,075
893,268
875,000
835,088
934,595
832,500
300,000
791,443
900,000
781,729
880,000
875,024
992,968
976,804
968,697
871,675
1006,852
832,037
345,587
849,528
913,871
868,746
993,733
Las figuras 7.1 y 7.2 muestran, respectivamente, la evolucin cronolgica de los datos y el
correlograma. De ellas se deduce la existencia de una estacionalidad de perodo 12,
naturalmente ligada a la evolucin mensual de los datos, y una tendencia creciente en los
primeros aos y ms estables en los ltimos; esto hace pensar en la posibilidad de un
p78
Series temporales
modelo parablico. Las previsiones, segn el correlograma, son aceptables a tres aos
vista.
Y 1000
800
600
400
200
0
0
24
48
72
96
120 t
0,5
-0,5
-1
k
Fig. 7.2.- Correlograma
Dada la generalidad del mtodo, para tratar modelos aditivos, multiplicativos o mixtos, se
optar por la modelizacin con variables categricas.
Inicialmente se plantea el modelo que incluye el trmino lineal y el cuadrtico del tiempo, las
11 variables categricas y su conjuncin con el tiempo, es decir:
Y = 0 + 1 t + 2 t + 2 Q2 + 3 Q3 + 4 Q4 + 5 Q5 + 6 Q6 + 7 Q7 + 8 Q8
2
p79
Otros ejemplos
nu
Regresin
Residuos
Total
Ord. Origen
t
t^2
Q3
Q7
Q8
Q9
tQ8
tQ11
8
99
107
Coeficientes
570,3432
4,1152
-0,0113
80,1576
-113,6589
-399,0648
-83,2560
-1,5549
-0,8270
S.C.
2782737,3
128237,3
2910974,6
Error tpico
10,9786
0,4487
0,0040
12,8019
12,8057
25,9335
12,8143
0,4051
0,1932
C.M.
347842,16
1295,33
t
51,9503
9,1704
-2,8242
6,2614
-8,8756
-15,3880
-6,4971
-3,8384
-4,2797
F
268,54
p-val
1,5011E-63
p-val
0,0000
0,0000
0,0057
0,0000
0,0000
0,0000
0,0000
0,0002
0,0000
R^2 = 0,9559
La figura 7.3. muestra el ajuste del modelo obtenido sobre los datos reales de los nueve
aos estudiados, y la 7.4 los residuos, diferencia entre el valor real y el modelizado,
observndose un buen ajuste general a todos los puntos. En la figura 7.3, a travs de los
tringulos de los valores modelizados, se ve claramente la homogeneidad de
comportamiento de un conjunto de meses, frente a la disparidad de los otros
p80
Series temporales
1000
900
800
700
600
500
400
300
200
100
0
0
20
40
60
80
100
120 t
100
120 t
R 100
75
50
25
0
-25
-50
-75
-100
0
20
40
60
80
Con el modelo disponible se puede proceder a hacer previsiones, por ejemplo para los
prximos doce meses. En la tabla 7.III se presentan los valores previstos junto a los que
realmente se obtuvieron en estos meses y que han sido separados y guardados a la hora de
hacer la modelizacin anterior; tambin se han calculado las diferencias entre ellas y el
porcentaje de error de previsin sobre el valor real. Hay que resaltar que las pequeas
discrepancias entre la previsin y el valor real, en parte, deben ser atribuidas al componente
aleatorio, cuya presencia en cada momento no hay que olvidar. La figura 7.5 muestra ambos
conjuntos de datos, de los que slo hay que comentar la gran concordancia entre la
previsin y la realidad, lo cual valida lo precedente de la aplicacin de la metodologa del
anlisis mediante variables categricas.
p81
Otros ejemplos
t
109
110
111
112
113
114
115
116
117
118
119
120
Y
875,024
992,968
976,804
968,697
871,675
1006,852
832,037
345,587
849,528
913,871
868,746
993,733
Previsin
884,998
886,645
968,430
889,872
891,451
893,008
780,882
316,626
814,283
899,010
802,041
901,876
Diferencia
-9,974
106,323
8,374
78,825
-19,776
113,844
51,155
28,961
35,245
14,861
66,705
91,857
%
-1,14
10,71
0,86
8,14
-2,27
11,31
6,15
8,38
4,15
1,63
7,68
9,24
1200
1000
800
600
400
200
108
110
112
114
116
118
120
122 t
p82
Series temporales
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Y
144,58
137,3
140,06
132,14
137,75
145,52
147,85
162,82
147,36
143,74
143,87
154,35
157,24
142,46
150,02
142,02
153,49
156,13
177,91
173,81
152,16
151,87
149,73
159,6
t
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
Y
164,33
147,08
155,48
146,22
153,23
162,44
176,82
179,72
155,22
154,94
152,79
169,35
178,31
156,67
164,16
153,15
157,35
173,36
186,41
186,38
164,97
163,63
168,99
183,09
t
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
Y
196,37
162,73
169,16
156,85
169,33
180,79
198,92
196,09
176,26
166,39
167,07
184,21
197,83
173,5
173,19
159,74
175,24
188,31
202,68
206,41
185,57
175,8
176,17
191,87
t
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
Y
209,69
186,35
182,85
169,96
178,07
186,68
202,25
204,85
180,75
179,71
177,5
188,71
200
188,72
187,47
168,72
175,73
189,43
216,78
215,39
191,48
178,56
178,55
195,59
Las figuras 7.6 y 7.7 corresponden, respectivamente, a la evolucin cronolgica de los datos
de los siete aos utilizados en la modelizacin, y su correlograma. Al ser los datos
mensuales, parece que de haber alguna estacionalidad, sta debera ser de perodo 12, es
decir anual, sin embargo no es esta la situacin del caso estudiado. El correlograma
muestra de forma inequvoca que existe una estacionalidad de perodo 6, la cual, aunque
menos evidente, tambin se detecta en la evolucin cronolgica. Intentando buscar una
explicacin a dicha periodicidad, quizs sera posible pensar que el consumo elctrico, y por
tanto la electricidad generada por las centrales, tiene similar comportamiento en los meses
clidos que en los fros como consecuencia del consumo por los aires acondicionados,
mientras que la parte del consumo atribuible a la industria en general, no tiene porque
presentar distinto comportamiento de un mes a otro. En cuanto a la tendencia, es posible
que sea cuadrtica, tal como se detecta en la evolucin cronolgica de los datos.
p83
Otros ejemplos
Y 220
200
180
160
140
120
100
0
12
24
36
48
60
72
84 t
rk
1
0,5
-0,5
-1
k
Fig.7.7.- Correlograma
p84
Series temporales
Regresin
Residuos
Total
Ord. Origen
t
Q4
tQ2
tQ3
tQ4
tQ5
tQ6
nu
7
76
83
S.C.
24674,8398
3803,6637
28478,5035
C.M.
3524,9771
50,0482
F
70,4316
Coeficientes
143,8383
0,9072
-8,7533
-0,2042
-0,4053
-0,4006
-0,4800
-0,2707
Error tpico
1,7040
0,0511
4,2164
0,0567
0,0562
0,0934
0,0553
0,0549
t
84,4105
17,7608
-2,0760
-3,6025
-7,2125
-4,2904
-8,6822
-4,9352
p - val
0,0000
0,0000
0,0413
0,0006
0,0000
0,0001
0,0000
0,0000
p-val
1,2626E-30
R^2 = 0,8664
Tabla 7.V.- Modelo resultante
En consecuencia, el modelo es
Y= 143,838 + 0,907 t 8,753 Q4 0,204 Q2 t 0,405 Q3 t
0,401 Q4 t 0,480 Q5 t 0,271 Q6 t
y de l se deduce que el trmino cuadrtico del tiempo no ha resultado significativo, pero la
serie presente una tendencia lineal y creciente, pendiente igual a 0,907. La figura 7.8
muestra la modelizacin de la energa elctrica producida para cada uno de los 6 meses que
componen un perodo. El comportamiento estacional no es fcil de interpretar; el cuarto mes
de cada perodo pierde 8,753 unidades (coeficiente de Q4) respecto a todos los dems, que
tienen una ordenada en el origen comn. En cada mes la evolucin con el tiempo es distinta,
pero frente al primer mes al que correspondera un crecimiento asociado a una pendiente
de 0,907, se podran hacer dos agrupaciones, los meses 2 y 6, con una prdida de
pendiente del orden de 0,20,3, (rectas casi coincidentes en la figura 7.8) y los 3, 4 y 5 con
una prdida, respecto al primero, de 0,40,5 unidades en la pendiente, que dan lugar a una
evolucin similar, tal como se observa en el grfico.
Y 240
220
200
180
160
140
120
0
12
24
36
48
60
72
84 t
p85
Otros ejemplos
La figura 7.9 contiene el grfico del modelo ajustado sobre los datos iniciales, y la 7.10 los
residuos. En ambas se puede apreciar la buena adecuacin del modelo a los datos. Quizs
se podra destacar que en el inicio de los datos (figura 7.9), hay algunos valores reales de
produccin de energa elctrica claramente distintos, en cuanto a su comportamiento del
resto. Esto incide en un mayor valor del residuo, y si no es posible conocer las causas de
estas producciones ms altas que lo previsto deberan atribuirse al azar.
Y 240
220
200
180
160
140
120
100
0
12
24
36
48
60
72
84 t
72
84 t
R 20
15
10
5
0
-5
-10
-15
-20
0
12
24
36
48
60
Con el modelo resultante, se pueden hacer previsiones para un perodo no superior al ao,
segn evidencia el correlograma. Esto es suficiente para comprobar la adecuacin de la
previsin, segn el modelo obtenido, con los 12 datos reales de los que se dispone y que
han sido reservados en la modelizacin para comprobar la fiabilidad de las predicciones. La
tabla 7.VI contiene los valores reales las previsiones segn el modelo obtenido y el error
respecto al valor medido, salvo el primero, los dems presentan una buena aproximacin
p86
Series temporales
t
85
86
87
88
89
90
91
92
93
94
95
96
Y
200
188,72
187,47
168,72
175,73
189,43
216,78
215,39
191,48
178,56
178,55
195,59
Previsin
220,95
204,30
187,50
179,67
181,86
201,12
226,40
208,52
190,51
182,70
184,00
204,31
Diferencia
-20,95
-15,58
-0,03
-10,95
-6,13
-11,69
-9,62
6,87
0,97
-4,14
-5,45
-8,72
%
-10,48
-8,25
-0,02
-6,49
-3,49
-6,17
-4,44
3,19
0,50
-2,32
-3,05
-4,46
86
88
90
92
94
96 t
p87
Otros ejemplos
Y 240
220
200
180
160
84
86
88
90
92
94
96
p89
Fig. 1.1
Una vez tenemos el archivo abierto, observamos que consta de una hoja llamada Datos
donde figuran 3 columnas de 72 valores cada una, con la estructura mostrada parcialmente
en la figura 1.2. En cada columna hay 72 valores, es decir, cada columna comienza en la fila
1 (con el ttulo) y acaba en la 73.
La columna A, llamada Semana contiene valores de 1 a 12 correspondientes a las 12
semanas en que se ha recogido la informacin; la B, Da, indica el da de la semana; y la C
contiene los valores de las ventas diarias, que se llaman Y.
p90
Series temporales
Fig. 1.2
En primer lugar, se debe preparar una nueva hoja donde es situarn los sucesivos grficos,
y que se denominar Grficos. Para ello, al hacer doble clic en la pestaa Hoja2 (figura
1.3), esta palabra quedar en vdeo inverso y permitir escribir Grficos.
Fig. 1.3
p91
Fig. 1.4
Fig. 1.5
p92
Series temporales
Fig. 1.6
Evolucin cronolgica
tiempo
ventas
En la pestaa Leyenda
eliminar la marca Z de Mostrar leyenda, pinchando sobre la misma, para dejar slo .
Siguiente
El paso 4 (figura 1.7), permite situar el grfico donde se desee, para ello se marca
Como objeto en
y pinchando la marca v aparece el conjunto de hojas disponibles; all se selecciona
Grficos.
Finalmente
Terminar
p93
Fig. 1.7
Con el grfico seleccionado (de forma que se muestre recuadrado externamente con las
marcas en el entorno), se puede situar en el lugar adecuado y darle el tamao que sea
necesario.
Si se quiere editar el grfico y, por ejemplo, eliminar el fondo gris del mismo:
rea
Ninguna
Aceptar
Para cambiar la escala del eje vertical y aprovechar toda la superficie de la figura:
p94
Series temporales
Fig. 1.8
Si se quiere cambiar la escala del tiempo, por ejemplo para que vaya de 6 en 6 unidades,
que son los valores que forman una semana, hay que situar el cursor sobre el eje de
abscisas (Eje de valores (X)) y con el botn derecho seguir los mismos pasos que antes,
para dejar un mnimo de 1, un mximo de 78, la unidad mayor a 6 y la menor a 1.
p95
como eso no lo podemos hacer en la hoja de clculo optamos por empezar en la casilla 5.
Situados entonces en E5, hacemos
= Promedio (D2:D7)
Arrastramos hasta E71, que contendr la media de los 6 ltimos valores de la serie
(Promedio(D68:D73)), en este caso 5256,33.
Al ser de perodo par debemos volver a la media de 2 en 2: la primera media mvil ocupar
el cuarto valor (5 fila), y la ltima el 69 (70 fila), ya que en total se pierden 3 valores al inicio
y 3 al final. Situados en F5 escribiremos
= Promedio (E5:E6)
Arrastramos hasta F70, que contendr la media de los 2 ltimos valores de la columna
anterior (Promedio(E70:E71)), en este caso 5262,33.
Titularemos la columna F, Y mvil, y lo escribiremos en F1. En las pginas 107 y 108 se
puede ver el conjunto de valores que resultan.
Seleccionar, manteniendo presionada la tecla Control, desde C2 hasta C73, (tiempo), desde
D2 hasta D73, (Y) y desde F2 hasta F73, (Y mvil).
Con el icono de grficos
Paso 1: Asistente para Grficos (figura 1.5),
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo medias mviles (p=6), sacar la leyenda y
Siguiente
Paso 4: Situar el grfico como Objeto en la hoja grficos.
Terminar
Es aconsejable editar el grfico, tal como se ha hecho con el anterior, para que la escala de
ordenadas vaya de cero a doce mil; tambin se puede cambiar la escala de tiempo como
antes. El resultado es el grfico de la pgina 111.
Conclusiones: Se detecta una tendencia decreciente, casi seguramente lineal, pero podra
ser cuadrtica? Se deber estudiar en el momento oportuno.
p96
Series temporales
1.4 Estacionalidad
El estudio de la estacionalidad incluye el clculo de los ndices estacionales, en modelo
aditivo que es el caso del ejemplo, y su representacin grfica.
Este clculo es muy cmodo hacerlo con una tabla dinmica. En primer lugar se deben
obtener los valores de W, que son las diferencias entre los valores de la serie (Y, columna
C) y las medias mviles (Y mvil, columna E). Estos valores se situarn en la columna G.
En la casilla G1 escribir W. Situados en G5, hacer
= D5 F5
(Y Y mvil)
En la barra de herramientas
p97
Fig. 1.9
Fig. 1.10
p98
Series temporales
Promedio de W
da
lunes
martes
mircoles
jueves
viernes
sbado
Total general
Total
-2331,37
-939,924
-1963,33
304,7803
3098,348
1898,394
11,14899
Los valores de las casillas C82 C87 son, respectivamente, E*1, E*2, , E*6; la casilla C88
(llamada Total general en B88) es la media de las anteriores, o sea, E * .
Para calcular los ndices estacionales, en la casilla E81 se escribe Ind. Est. como ttulo, y se
define E82 con la expresin
= C82 - $C$88
Aceptar
Grfico de la estacionalidad
Seleccionar los valores de los ndices estacionales, casillas E82 hasta E87 (o tambin desde
H2 hasta H7).
Con el icono de grficos
Paso 1: Lneas6
6 Lnea con marcadores (2, 1) de la figura 1.11
Siguiente
p99
Fig. 1.11
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo ndices estacionales, quitar la leyenda y
Siguiente
Paso 4: Situar el grfico como Objeto en la hoja Grficos.
Terminar
Fig. 1.12
p100
Series temporales
Terminar
Es necesario editar el grfico, tal como se ha hecho con el anterior, para que la escala de
ordenadas vaya desde cinco mil hasta siete mil. El resultado es el grfico de la pgina 112.
Con la nueva escala parece bastante claro que puede haber una tendencia cuadrtica, por
eso, se ha de proceder a ajustar un modelo parablico con el bien entendido de que si el
trmino cuadrtico no fuese significativo ya se detectara en el anlisis de los resultados, y
se procedera en consecuencia; es decir, se debera ajustar un nuevo modelo sin el trmino
que ha resultado no significativo.
Para aligerar la presentacin de la hoja de clculo, realizaremos el estudio de la tendencia,
de los residuos y de las previsiones en una nueva hoja, que ya tenemos preparada desde el
inicio con el nombre Tendencia-Modelo.
En primer lugar copiaremos todo lo que nos haga falta de la hoja Datos. Situados aqu:
Seleccionar las columnas Tiempo, Y, Y mvil y Ind. Est., es decir, C1
C73, D1
D73, (y
manteniendo presionada la tecla Ctrl) F1
F73 y H1
H73
Edicin 6 Copiar
Acceder a la hoja de Tendencia-Modelo, haciendo clic sobre la pestaa con su nombre.
Situados en la casilla A1
Edicin 6 Pegar
En este momento estn ocupadas las columnas A, B, C y D. Para poder hacer el ajuste
mnimo cuadrtico para la tendencia, mediante un modelo parablico, se debe disponer de
p101
una columna con los valores del tiempo al cuadrado, que necesariamente ha de estar
situada al lado de la columna del tiempo; por eso tendremos que insertarla entre las
columnas A y B.
Hacer clic sobre la letra B del encabezado de la columna, que quedar toda negra;
presionar el botn derecho para seleccionar Insertar (figura 1.4). La columna de los datos
se ha desplazado a la C y ha dejado la B vaca; aqu se introducirn los valores del tiempo
al cuadrado.
En B1 escribir Tiempo^2
Situados en B2 escribir la expresin =A2*A2
Arrastrar hasta B73; aqu habr el valor 5184, que es el cuadrado de 72. En las pginas 109
y 110, se puede ver la disposicin de los valores.
Abrir
D5:D70
A5:B70
(medias mviles)
(tiempo y tiempo^2)
Opciones de salida:
Rango de salida: A93
Fig. 1.13
p102
Series temporales
A
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
Resumen
stad st cos
R
R^2
R^2 ajust
Error tpico
n
0,92513
0,85587
0,85130
114,20021
66
ANOVA
u
Regresin
Residuos
Total
Ord. Origen
Tiempo
Tiempo^2
S de C
C
ao p
2 4879153,47 2439576,7 187,059889 3,1646E-27
63 821626,351 13041,688
65 5700779,82
Coefs
6311,5139
-27,3032
0,1832
o t p co
51,8296
3,2473
0,0433
t
Va o p
121,7743 1,7087E-76
-8,4079 6,9185E-12
4,2298 7,7177E-05
Fig. 1.14
Una vez obtenida la ecuacin de la tendencia, podemos calcular su valor para los diferentes
tiempos de los que se dispone de informacin. Para ello crearemos una nueva columna.
Situados en F1 escribir Tendencia, que ser el ttulo de la columna
En F2 escribir la expresin que acabamos de obtener,
= 6311,51 27,3*A2 + 0,18*B2
y arrastrarla hasta F73
Para ver la bondad del ajuste, se puede hacer un grfico que compare los valores de las
medias mviles y los de la tendencia ajustada. Por eso seleccionar, presionando la tecla
Ctrl, desde A1 hasta A73, desde D1 hasta D73 y desde F1 hasta F73
p103
Terminar
Es necesario editar el grfico, tal como se ha hecho con el anterior, para que la escala de
ordenadas vaya desde cinco mil hasta a siete mil.
Si se quiere, situados sobre uno de los puntos de la Serie tendencia, con el botn
derecho seleccionar
Formato de punto de datos
Marcador
Ninguno
El resultado es el grfico de la pgina 112, donde se puede valorar el ajuste.
= F2 + E2
(tendencia + estacionalidad)
= C2 G2
(Y Y mod)
Para hacer la representacin grfica del modelo ajustado en comparacin con los valores
originales, se debe seleccionar, de la hoja Tendencia
Modelo, los valores del tiempo, de la
Y y de la Y modelizada, o sea, A1
A73, C1
C73 y G1
G73.
p104
Series temporales
Terminar
Si se desea dejar con puntos la serie original y con lnea la del modelo ajustado, hay que
situarse sobre uno de los puntos de la Serie Y, y con el botn derecho del ratn
seleccionar:
Formato de punto de datos
Lnea
Ninguna
Situarse, luego, sobre un punto de la Serie Y mod, y con el botn derecho seleccionar
Formato de punto de datos
Marcador
Ninguno
El resultado es el grfico de la pgina 113, donde se puede valorar el modelo.
Para hacer la representacin grfica de los residuos en funcin del tiempo, seleccionar, de
la hoja Tendencia
Modelo, los valores del tiempo y de los residuos, o sea, A1
A73 y
H1
H73.
Con el icono de grficos
Asistente para Grficos (figura 1.5)
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Residuos, sacar la leyenda y Siguiente
Paso 4: Situar el grfico como Objeto en la hoja Grficos.
Terminar
Editar el grfico para, entre otras cosas, sacar los valores del eje de abscisas fuera del
mismo, para ello se sita el cursor sobre el eje de ordenadas, Eje de valores (Y), y
haciendo doble clic sale la pantalla Formato de ejes.
p105
1.7 Previsiones
Si se quieren conocer las previsiones de las ventas del supermercado que estamos
estudiando, a lo largo de las tres prximas semanas (18 das) en la hoja
Tendencia
Modelo prolongar las columnas del tiempo, la tendencia, la estacionalidad y
crear una nueva columna para las previsiones.
Para la columna A, Tiempo, arrastrar presionando la tecla Ctrl desde la casilla A73 hasta la
A91, donde ha de aparecer el valor 90.
En la E74, Estacionalidad, el primer valor que se debe aadir es el que corresponde al
tiempo 73, es decir mltiple de 6 ms 1; por tanto, hay que copiar desde el primer valor del
ndice hasta el 18. Marcar como bloque las casillas E2E19 y hacer Edicin 6 Copiar.
Situados en E74, Edicin 6 Pegar.
En la F, Tendencia, arrastrar la expresin desde el ltimo valor disponible, el 73, hasta el
deseado, el 91.
Situados en I1, poner como ttulo Previsiones.
En I74 escribir la expresin = E74 + F74 y arrastrarla hasta E91.
Haciendo eso, obtenemos los resultados que se muestran en la pgina 110.
El grfico de las previsiones, junto con la serie original, se obtendr seleccionando A1
A91,
C1
C91 y I1
I91 de la hoja Tendencia
Modelo.
Con el icono de grficos
Asistente para Grficos (figura 1.5)
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
p106
Series temporales
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Serie y previsiones, tiempo y ventas, sacar
la leyenda y Siguiente
Paso 4: Situar el grfico como Objeto en la hoja Grficos.
Terminar
Puede ser necesario editar el grfico por que la escala de abscisas vaya desde cero hasta
ochenta, y tambin modificar los tipos de lneas y puntos de la serie Y y de la serie
previsiones, para destacar claramente los dos grupos de puntos.
El resultado es el grfico de la pgina 114.
Conclusiones: Las previsiones siguen el mismo tipo de comportamiento que los datos
originales y, dada la bondad del modelo, pueden considerarse lo suficientemente fiables.
Pero, tenemos derecho a hacer previsiones de aqu a 18 das?; podramos hacer
previsiones a ms largo plazo? La prctica 2 nos dar herramientas para contestar a estas
preguntas.
p107
1.8 Resultados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
A
Semana
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
4
4
4
4
4
4
5
5
5
5
5
5
6
6
6
6
6
6
7
7
7
7
7
7
8
8
8
8
8
8
9
B
Dia
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
C
Tiempo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
D
Y
3968
4572
3964
6326
9673
8307
3593
5367
3763
6703
9485
8207
3717
4712
3538
5758
9112
7501
3108
4771
3643
6616
8907
7993
3618
4427
4314
5616
8778
7322
2899
4918
4226
6025
8712
7685
3408
4869
3589
5437
8239
7360
2915
4237
3679
6060
8755
7475
2979
E
Y(p=6)
6135,00
6072,50
6205,00
6171,50
6234,33
6203,00
6186,33
6207,00
6097,83
6060,33
5902,83
5840,67
5723,00
5621,50
5631,33
5648,83
5791,83
5757,67
5839,67
5924,67
5867,33
5979,17
5812,50
5791,00
5679,17
5559,33
5641,17
5626,50
5694,67
5683,67
5744,17
5829,00
5820,83
5714,67
5616,67
5537,83
5483,67
5401,50
5296,17
5311,17
5415,00
5501,00
5520,17
5530,83
5486,50
5421,83
Hoja: Datos
F
Y mvil
6103,75
6138,75
6188,25
6202,92
6218,67
6194,67
6196,67
6152,42
6079,08
5981,58
5871,75
5781,83
5672,25
5626,42
5640,08
5720,33
5774,75
5798,67
5882,17
5896,00
5923,25
5895,83
5801,75
5735,08
5619,25
5600,25
5633,83
5660,58
5689,17
5713,92
5786,58
5824,92
5767,75
5665,67
5577,25
5510,75
5442,58
5348,83
5303,67
5363,08
5458,00
5510,58
5525,50
5508,67
5454,17
5361,50
G
W
222,25
3534,25
2118,75
-2609,92
-851,67
-2431,67
506,33
3332,58
2127,92
-2264,58
-1159,75
-2243,83
85,75
3485,58
1860,92
-2612,33
-1003,75
-2155,67
733,83
3011,00
2069,75
-2277,83
-1374,75
-1421,08
-3,25
3177,75
1688,17
-2761,58
-771,17
-1487,92
238,42
2887,08
1917,25
-2257,67
-708,25
-1921,75
-5,58
2890,17
2056,33
-2448,08
-1221,00
-1831,58
534,50
3246,33
2020,83
-2382,50
H
Ind. Est
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
p108
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
Series temporales
A
9
9
9
9
9
10
10
10
10
10
10
11
11
11
11
11
11
12
12
12
12
12
12
B
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
C
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
D
3971
3291
5336
8392
6790
3539
4694
3120
6026
7792
7294
3254
4725
3227
5588
8320
6995
3229
4648
3450
5129
8159
6923
Promedio de W
dia
Total
lunes
-2331,37
martes
-939,924
mircoles
-1963,33
jueves
304,7803
viernes
3098,348
sbado
1898,394
Total general 11,14899
E
5301,17
5240,67
5126,50
5219,83
5340,33
5311,83
5426,83
5326,83
5410,83
5363,33
5368,50
5386,33
5313,33
5401,33
5351,50
5347,33
5334,50
5371,67
5295,17
5268,33
5256,33
Ind. Est
-2342,5202
-951,07323
-1974,4823
293,631313
3087,19949
1887,24495
F
5270,92
5183,58
5173,17
5280,08
5326,08
5369,33
5376,83
5368,83
5387,08
5365,92
5377,42
5349,83
5357,33
5376,42
5349,42
5340,92
5353,08
5333,42
5281,75
5262,33
G
-1299,92
-1892,58
162,83
3111,92
1463,92
-1830,33
-682,83
-2248,83
638,92
2426,08
1916,58
-2095,83
-632,33
-2149,42
238,58
2979,08
1641,92
-2104,42
-633,75
-1812,33
H
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
p109
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
A
Tiempo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
B
Tiempo^2
1
4
9
16
25
36
49
64
81
100
121
144
169
196
225
256
289
324
361
400
441
484
529
576
625
676
729
784
841
900
961
1024
1089
1156
1225
1296
1369
1444
1521
1600
1681
1764
1849
1936
2025
2116
2209
2304
2401
C
Y
3968
4572
3964
6326
9673
8307
3593
5367
3763
6703
9485
8207
3717
4712
3538
5758
9112
7501
3108
4771
3643
6616
8907
7993
3618
4427
4314
5616
8778
7322
2899
4918
4226
6025
8712
7685
3408
4869
3589
5437
8239
7360
2915
4237
3679
6060
8755
7475
2979
D
Y mvil
6103,75
6138,75
6188,25
6202,92
6218,67
6194,67
6196,67
6152,42
6079,08
5981,58
5871,75
5781,83
5672,25
5626,42
5640,08
5720,33
5774,75
5798,67
5882,17
5896,00
5923,25
5895,83
5801,75
5735,08
5619,25
5600,25
5633,83
5660,58
5689,17
5713,92
5786,58
5824,92
5767,75
5665,67
5577,25
5510,75
5442,58
5348,83
5303,67
5363,08
5458,00
5510,58
5525,50
5508,67
5454,17
5361,50
E
F
Ind. Est
Tendencia
-2342,52
6284,39
-951,07
6257,63
-1974,48
6231,23
293,63
6205,19
3087,20
6179,51
1887,24
6154,19
-2342,52
6129,23
-951,07
6104,63
-1974,48
6080,39
293,63
6056,51
3087,20
6032,99
1887,24
6009,83
-2342,52
5987,03
-951,07
5964,59
-1974,48
5942,51
293,63
5920,79
3087,20
5899,43
1887,24
5878,43
-2342,52
5857,79
-951,07
5837,51
-1974,48
5817,59
293,63
5798,03
3087,20
5778,83
1887,24
5759,99
-2342,52
5741,51
-951,07
5723,39
-1974,48
5705,63
293,63
5688,23
3087,20
5671,19
1887,24
5654,51
-2342,52
5638,19
-951,07
5622,23
-1974,48
5606,63
293,63
5591,39
3087,20
5576,51
1887,24
5561,99
-2342,52
5547,83
-951,07
5534,03
-1974,48
5520,59
293,63
5507,51
3087,20
5494,79
1887,24
5482,43
-2342,52
5470,43
-951,07
5458,79
-1974,48
5447,51
293,63
5436,59
3087,20
5426,03
1887,24
5415,83
-2342,52
5405,99
Hoja: TendenciaModelo
G
H
I
Y mod
Residuos Previsiones
3941,87
26,13
5306,56
-734,56
4256,75
-292,75
6498,82
-172,82
9266,71
406,29
8041,43
265,57
3786,71
-193,71
5153,56
213,44
4105,91
-342,91
6350,14
352,86
9120,19
364,81
7897,07
309,93
3644,51
72,49
5013,52
-301,52
3968,03
-430,03
6214,42
-456,42
8986,63
125,37
7765,67
-264,67
3515,27
-407,27
4886,44
-115,44
3843,11
-200,11
6091,66
524,34
8866,03
40,97
7647,23
345,77
3398,99
219,01
4772,32
-345,32
3731,15
582,85
5981,86
-365,86
8758,39
19,61
7541,75
-219,75
3295,67
-396,67
4671,16
246,84
3632,15
593,85
5885,02
139,98
8663,71
48,29
7449,23
235,77
3205,31
202,69
4582,96
286,04
3546,11
42,89
5801,14
-364,14
8581,99
-342,99
7369,67
-9,67
3127,91
-212,91
4507,72
-270,72
3473,03
205,97
5730,22
329,78
8513,23
241,77
7303,07
171,93
3063,47
-84,47
p110
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
Series temporales
A
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
B
2500
2601
2704
2809
2916
3025
3136
3249
3364
3481
3600
3721
3844
3969
4096
4225
4356
4489
4624
4761
4900
5041
5184
C
3971
3291
5336
8392
6790
3539
4694
3120
6026
7792
7294
3254
4725
3227
5588
8320
6995
3229
4648
3450
5129
8159
6923
D
5270,92
5183,58
5173,17
5280,08
5326,08
5369,33
5376,83
5368,83
5387,08
5365,92
5377,42
5349,83
5357,33
5376,42
5349,42
5340,92
5353,08
5333,42
5281,75
5262,33
E
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
-2342,52
-951,07
-1974,48
293,63
3087,20
1887,24
F
5396,51
5387,39
5378,63
5370,23
5362,19
5354,51
5347,19
5340,23
5333,63
5327,39
5321,51
5315,99
5310,83
5306,03
5301,59
5297,51
5293,79
5290,43
5287,43
5284,79
5282,51
5280,59
5279,03
5277,83
5276,99
5276,51
5276,39
5276,63
5277,23
5278,19
5279,51
5281,19
5283,23
5285,63
5288,39
5291,51
5294,99
5298,83
5303,03
5307,59
5312,51
Resumen
stad st cos
R
R^2
R^2 ajust
Error tpico
n
0,92513
0,85587
0,85130
114,20021
66
ANOVA
u
Regresin
Residuos
Total
Ord. Origen
Tiempo
Tiempo^2
S de C
C
Va o p
2 4879153,47 2439576,7 187,059889 3,1646E-27
63 821626,351 13041,688
65 5700779,82
Coefs
6311,5139
-27,3032
0,1832
o t p co
51,8296
3,2473
0,0433
t
Va o p
121,7743 1,7087E-76
-8,4079 6,9185E-12
4,2298 7,7177E-05
G
4445,44
3412,91
5672,26
8457,43
7249,43
3011,99
4396,12
3365,75
5627,26
8414,59
7208,75
2973,47
4359,76
3331,55
5595,22
8384,71
7181,03
2947,91
4336,36
3310,31
5576,14
8367,79
7166,27
H
-474,44
-121,91
-336,26
-65,43
-459,43
527,01
297,88
-245,75
398,74
-622,59
85,25
280,53
365,24
-104,55
-7,22
-64,71
-186,03
281,09
311,64
139,69
-447,14
-208,79
-243,27
2935,31
4325,92
3302,03
5570,02
8363,83
7164,47
2935,67
4328,44
3306,71
5576,86
8372,83
7175,63
2948,99
4343,92
3324,35
5596,66
8394,79
7199,75
p111
Evolucin cronolgica
12000
V
e
n
t
a
s
8000
4000
0
0
12
24
36
48
60
72
tiempo
8000
4000
0
0
12
24
36
48
Tiempo
Hoja: Grficos
60
72
p112
Series temporales
6000
5000
0
12
24
36
48
60
72
48
60
72
tiempo
Tendencia
7000
6000
5000
0
12
24
36
tiempo
p113
ndices estacionales
4000
3000
2000
1000
0
-1000
-2000
-3000
1
Modelo ajustado
12000
V
e
n
t
a
s
8000
4000
0
0
12
24
36
tiempo
48
60
72
p114
Series temporales
Residuos
800
400
0
-400
-800
0
12
24
36
48
60
72
tiempo
Serie y previsiones
12000
10000
V
e
n
t
a
s
8000
6000
4000
2000
0
0
30
60
tiempo
90
p115
rk = k s
0
Nk
donde
k =
i=1
(Yi Y ) (Yi+k Y )
y
0 =
i=1
(Yi Y)2
N
p116
Series temporales
G8 gamma_k
K8 2S(r_k)
H8 r_k
L8 +2S(r_k)
I8 r_k^2
Fig. 2.1
p117
En el cuadro siguiente (figura 2.2), especificaremos los valores que vamos a utilizar,
teniendo cuidado de fijar las posiciones inamovibles ($2 del primer vector y $73 por el
segundo), ya que, como se ha comentado, el primer vector siempre empieza en el primer
valor de la Y centrada, eso es, D2, mientras que el segundo siempre acaba en el ltimo
valor de Y centrada, o sea, D73. As el primer vector va de D$2 hasta D72 y el segundo de
D3 hasta D$73. Una vez se presiona la tecla Aceptar, en la ventana superior queda escrita
la expresin = SUMAPRODUCTO(D$2... D$73): dicha expresin hay que ponerla entre
parntesis y dividirla por el nmero total de observaciones (72 en este caso) a fin de obtener
la autocovariancia para k=1. En la figura 2.3 se muestra cmo finalmente queda definida la
casilla G9.
Fig. 2.2
Fig. 2.3
Esta expresin se debe arrastrar hasta G26 y, de momento, no hacer caso de lo que
resulte. Ahora hay que cambiar la posicin final del segundo elemento de la frmula en cada
casilla de esta columna. As
p118
Series temporales
Celda k
expresin actual
expresin definitiva
G10
=(SUMAPRODUCTO(D$2:D73 ...
=(SUMAPRODUCTO(D$2:D71...
G11
=(SUMAPRODUCTO(D$2:D74 ...
=(SUMAPRODUCTO(D$2:D70...
G25
17
=(SUMAPRODUCTO(D$2:D88 ...
=(SUMAPRODUCTO(D$2:D56...
G26
18
=(SUMAPRODUCTO(D$2:D89 ...
=(SUMAPRODUCTO(D$2:D55...
V(rk )
1
2
ri2
y
+
V(r1 )
N
N
i=1
Hacer
J9
J10
= 1/72
= (1+2*SUMA(I$9:I9))/72
y arrastrar hasta J26 donde habr la expresin =(1+2*SUMA(I$9:I25))/72. Los extremos del
intervalo de no significacin, 2S(r_k), estarn en las columnas K y L.
K9
L9
= 2*RAIZ(J9)
= 2*RAIZ(J9)
Arrastrar estas expresiones hasta K26 y L26. La tabla completa de resultados est en las
pginas 120 y 121.
2.3 Autocorrelograma
El grfico se obtiene seleccionando F9 F26, H9 H26, K9 K26 y L9 L26.
Con el icono de grficos
Asistente para Grficos
XY (Dispersin)
(3; 1), Dispersin con puntos conectados por lneas
Siguiente
Paso 1: Siguiente
p119
Paso 2: Siguiente
Paso 3: Poner los ttulos, por ejemplo Autocorrelograma, quitar la leyenda y
Siguiente
Paso 4: Situar el grfico con Objeto en la actual hoja Datos.
Terminar
Situar el grfico en la posicin y el tamao deseado, y editarlo para que presente el aspecto
habitual de un correlograma.
Seleccionando un punto de la Serie 1, y haciendo clic con el botn derecho del ratn, sale el
cuadro de la figura 2.4. Seleccionar:
Tipo de grfico 6 Columnas
Aceptar
Fig. 2.4
Marcador
Ninguno
Posiciones decimales
y para quitar los valores de k de dentro del grfico, en el Eje de categoras, eje de abscisas,
Formato de ejes
Carpeta Tramas
p120
Series temporales
2.4 Resultados
A
B
1 Seman Dia
2
1 lunes
3
1 martes
4
1 mircoles
5
1 jueves
6
1 viernes
7
1 sbado
8
2 lunes
9
2 martes
10
2 mircoles
11
2 jueves
12
2 viernes
13
2 sbado
14
3 lunes
15
3 martes
16
3 mircoles
17
3 jueves
18
3 viernes
19
3 sbado
20
4 lunes
21
4 martes
22
4 mircoles
23
4 jueves
24
4 viernes
25
4 sbado
26
5 lunes
27
5 martes
28
5 mircoles
29
5 jueves
30
5 viernes
31
5 sbado
32
6 lunes
33
6 martes
34
6 mircoles
35
6 jueves
36
6 viernes
37
6 sbado
38
7 lunes
39
7 martes
40
7 mircoles
41
7 jueves
42
7 viernes
43
7 sbado
44
8 lunes
45
8 martes
46
8 mircoles
47
8 jueves
48
8 viernes
49
8 sbado
50
9 lunes
51
9 martes
C
Y
3968
4572
3964
6326
9673
8307
3593
5367
3763
6703
9485
8207
3717
4712
3538
5758
9112
7501
3108
4771
3643
6616
8907
7993
3618
4427
4314
5616
8778
7322
2899
4918
4226
6025
8712
7685
3408
4869
3589
5437
8239
7360
2915
4237
3679
6060
8755
7475
2979
3971
D
E F
G
H
Y-Ybar
gamma_0
-1653,36
4003801
-1049,36
-1657,36
704,639
4051,64
2685,64
k gamma_k
r_k
-2028,36
-254,361
1 1089260,8 0,2721
-1858,36
2
-1528643 -0,3818
1081,64
3
-2302898 -0,5752
3863,64
4
-1654914 -0,4133
2585,64
5 873463,57 0,2182
-1904,36
6 3551137,5 0,8869
-909,361
7
978459,2 0,2444
-2083,36
8
-1429667 -0,3571
136,639
9
-2118164 -0,5290
3490,64
10 -1510880 -0,3774
1879,64
11 775336,95 0,1937
-2513,36
12 3213971,1 0,8027
-850,361
13 902365,54 0,2254
-1978,36
14 -1276624 -0,3189
994,639
15 -1892155 -0,4726
3285,64
16 -1373896 -0,3431
2371,64
17 700396,45 0,1749
-2003,36
18 2879249,8 0,7191
-1194,36
-1307,36
-5,36111
3156,64
1700,64
-2722,36
-703,361
-1395,36
403,639
3090,64
2063,64
-2213,36
-752,361
-2032,36
-184,361
2617,64
1738,64
-2706,36
-1384,36
-1942,36
438,639
3133,64
1853,64
-2642,36
-1650,36
Hoja: Datos
r_k^2
0,0740
0,1458
0,3308
0,1708
0,0476
0,7867
0,0597
0,1275
0,2799
0,1424
0,0375
0,6444
0,0508
0,1017
0,2233
0,1178
0,0306
0,5171
V(r_k)
0,0139
0,0159
0,0200
0,0292
0,0339
0,0353
0,0571
0,0588
0,0623
0,0701
0,0740
0,0751
0,0930
0,0944
0,0972
0,1034
0,1067
0,1075
- 2S(r_k) + 2S(r_k)
-0,2357 0,2357
-0,2525 0,2525
-0,2828 0,2828
-0,3417 0,3417
-0,3684 0,3684
-0,3755 0,3755
-0,4779 0,4779
-0,4848 0,4848
-0,4992 0,4992
-0,5294 0,5294
-0,5442 0,5442
-0,5480 0,5480
-0,6098 0,6098
-0,6144 0,6144
-0,6236 0,6236
-0,6432 0,6432
-0,6533 0,6533
-0,6559 0,6559
p121
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
A
9
9
9
9
10
10
10
10
10
10
11
11
11
11
11
11
12
12
12
12
12
12
B
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
lunes
martes
mircoles
jueves
viernes
sbado
C
3291
5336
8392
6790
3539
4694
3120
6026
7792
7294
3254
4725
3227
5588
8320
6995
3229
4648
3450
5129
8159
6923
D
E F
-2330,36
-285,361
2770,64
1168,64
-2082,36
-927,361
-2501,36
404,639
2170,64
1672,64
-2367,36
-896,361
-2394,36
-33,3611
2698,64
1373,64
-2392,36
-973,361
-2171,36
-492,361
2537,64
1301,64
AUTOCORRELOGRAMA
1,0
0,5
0,0
-0,5
-1,0
p122
Series temporales
Fig. 3.1
Una vez tenemos el archivo abierto, observamos que consta de una hoja denominada Datos
donde figuran 2 columnas de 62 valores cada una, con la estructura mostrada parcialmente
en la figura 3.2. En cada columna hay 62 valores, es decir, se empieza en la fila 1 (con el
ttulo) y se acaba en la 63.
La columna A, llamada t, contiene valores de 1 a 62, correspondientes a los 62 intervalos de
tiempo (trimestres) en que se ha recogido la informacin, y la B, con el nombre de Y,
contiene los valores del indicador econmico que se est estudiando.
Fig. 3.2
p123
, o tambin,
Fig. 3.3
p124
Series temporales
Para poder modelizar la serie, en primer lugar hemos de crear las variables categricas, o
indicatrices, teniendo en cuenta que, en el caso de la prctica, el perodo p es igual a 4.
Para ello, se preparan los ttulos de las columnas que contendrn los valores de las
variables categricas. Recordando que las representamos por Q y que sus ndices van
desde 2 hasta p (teora de series temporales), en las casillas C1, D1 y E1 escribiremos Q2,
Q3, y Q4, tal como muestra la figura 3.4.
A continuacin rellenaremos cada variable categrica con sus valores. Al ser el perodo igual
a 4, hay 4 combinaciones diferentes de ceros y unos, una para cada componente del
perodo, y sabiendo que Qi vale la unidad si el orden del tiempo asociado es igual a i, y vale
cero en cualquier otro caso, el conjunto de valores es el que se muestra en el bloque C2
E5, de la figura 3.4.
Una vez lleno el bloque anterior, slo hemos de seleccionarlo y con Cortar y Pegar, llenar
todas las casillas C ... E hasta la fila 63, o bien arrastrar el bloque presionando
simultneamente el Ctrl (pgina 130).
Adems, para estudiar el modelo, es necesario disponer de las columnas con los valores
tQ2, tQ3 y tQ4, tiempo (t) y tiempo al cuadrado (t^2). Estos valores estn en las columnas F,
... J. Para llenar estas columnas, es ya evidente que lo que debemos hacer es definirlas
como
y H2 = A2*A2.
F2 = A2*C2, G2 = A2*D2, H2 = A2*E2, I2 =A2
Despus arrastrar hasta la fila 63. En la figura 3.4 se puede ver la estructura que toman
estas columnas, y en la pgina 130 todos los valores.
Es una exigencia de Excel que todas las columnas de los trminos que constituyen el
modelo hayan de ser consecutivas y contiguas.
Fig. 3.4
p125
= + t +
Y
0
1
2 t + 2 Q2 + 3 Q3 + 4 Q4 + 5 Q2 t + 6 Q3 t + 7 Q4 t
(los valores de Y)
Z Rtulos
n Rango de salida $A$125
Los resultados se pueden ver en la pgina 133, con el ttulo Primer paso
Conclusiones: El coeficiente del trmino Q2 no es significativo (su nivel de significacin es p
= 0,292 > 0,05). Debemos eliminarlo del modelo lineal y volver a estimar los coeficientes.
Fig. 3.5
p126
Series temporales
Seleccionar con el ratn desde B1 hasta J63, presionar el botn derecho y hacer
Copiar.
Situarse, por ejemplo, en la casilla S1 (fila a partir de la cual todo est vaco) y
desplegar el men Insertar (figura 3.6).
Fig. 3.6
Fig. 3.7
p127
Ahora eliminar la columna asociada a Q2 (la T en el caso del ejemplo): para ello se
pincha sobre la letra T distintiva de la columna, que quedar enmarcada por una lnea
que parpadea; entonces se presiona el botn derecho y se selecciona Eliminar. De
esta manera las columnas siguientes avanzan un lugar y vuelven a estar todas juntas,
es decir, empiezan en la S (valores de Y) y acaban en la Z (valores de t^2)
Los resultados se pueden ver en la pgina 133 con el ttulo Segundo paso
Valores estimados
Una vez establecido el modelo tenemos que examinar el ajuste entre los datos y los valores
estimados segn el modelo ajustado.
Por eso, en primer lugar cogemos un bloque con los trminos y los coeficientes del modelo
definitivamente obtenido y hacemos un Cortar y Pegar en L2; en L1 escribimos Modelo:
resultarn las casillas destacadas en azul en la pgina 131.
Despus, en N1 escribimos el ttulo de la columna, Yest, y en N2 el modelo, es decir
= M$2+M$3*D2+M$4*E2+M$5*F2+M$6*G2+M$7*H2+M$8*I2+M$9*J2
Debemos destacar la exigencia de fijar las celdas que contienen los coeficientes del modelo,
para que al arrastrar la frmula se mantengan constantes.
Arrastrando la casilla N2 hasta la N63 se obtienen los valores calculados, como
estimaciones de la variable estudiada, que se pueden ver en la pgina 131.
p128
Series temporales
Es necesario seleccionar desde B2 hasta B63 y, presionando la tecla Ctrl, desde N2 hasta
N63. Despus se presiona el icono de los grficos
Asistente para Grficos
Lneas
(2, 1) Lnea con marcadores
Terminar
Grfico de residuos
En primer lugar debemos calcular los residuos; para esto es prepara la columna con el
ttulo y se calculan los valores:
O1 : Res
Terminar
3.5 Previsiones
Atendiendo a que, segn el correlograma (pgina 132), se pueden hacer previsiones para
los prximos 5 valores del tiempo, es necesario ampliar las columnas de las variables
categricas y del tiempo con los 5 valores nuevos, del 63 hasta el 67. Estos valores se han
de incorporar al final de la columna A, es decir desde A64 hasta A68 (pgina 130).
El primer valor para el que hay que hacer previsiones corresponde a t = 63, que es un
mltiple de 4 (154 = 60) ms 3. Por tanto, la variable categrica Q3 valdr 1 y las dems 0.
Situados en C64 podemos copiar el bloque C4 E8, que es el de las categricas que se
inicia en una tercera estacin. Ahora seleccionaremos con el ratn desde F63 hasta J63 y
arrastraremos hasta llenar la fila 68, que corresponde a la ltima previsin (pgina 130).
p129
(ttulo)
Para hacer el grfico se selecciona desde B2 hasta B68 y, presionando el Ctrl, desde K2
hasta K68 y desde N2 hasta N68. Se presiona el icono de los grficos
p130
Series temporales
3.6 Resultados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
A
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
A
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
B
Y
105,86
97,79
96,1
127,44
108,78
112,61
111,43
145,71
118,37
121,89
124,25
159,55
125,41
135,4
137,86
171,44
132,38
147,59
153,92
B
232,76
256,84
271,36
311,42
243,9
268,42
291,25
331,96
255,46
283,53
307,82
354,72
276,58
304,72
C
Q2
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
C
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
D
Q3
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
D
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
E
Q4
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
E
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
F
tQ2
0
2
0
0
0
6
0
0
0
10
0
0
0
14
0
0
0
18
0
F
0
50
0
0
0
54
0
0
0
58
0
0
0
62
0
0
0
66
0
Hoja: Datos
G
tQ3
0
0
3
0
0
0
7
0
0
0
11
0
0
0
15
0
0
0
19
G
0
0
51
0
0
0
55
0
0
0
59
0
0
0
63
0
0
0
67
H
tQ4
0
0
0
4
0
0
0
8
0
0
0
12
0
0
0
16
0
0
0
H
0
0
0
52
0
0
0
56
0
0
0
60
0
0
0
64
0
0
0
I
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
I
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
J
t^2
1
4
9
16
25
36
49
64
81
100
121
144
169
196
225
256
289
324
361
J
2401
2500
2601
2704
2809
2916
3025
3136
3249
3364
3481
3600
3721
3844
3969
4096
4225
4356
4489
p131
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
K
Y Prev
K
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
L
Modelo
Ord. Origen
Q3
Q4
tQ2
tQ3
tQ4
t
t^2
M
97,8112
-7,7472
20,5667
0,3863
0,8484
0,9877
2,0302
0,0143
N
Y est
99,856
102,701
98,828
130,677
108,319
112,823
110,913
143,433
117,238
123,402
123,454
156,645
126,613
134,437
136,451
170,314
136,445
145,928
149,905
N
231,526
254,283
273,960
313,863
245,464
269,881
291,520
332,095
259,859
285,935
309,537
350,782
274,710
302,445
328,010
369,926
290,018
319,412
346,939
Hoja: Datos (continuacin)
O
Res
6,004
-4,911
-2,728
-3,237
0,461
-0,213
0,517
2,277
1,132
-1,512
0,796
2,905
-1,203
0,963
1,409
1,126
-4,065
1,662
4,015
O
1,234
2,557
-2,600
-2,443
-1,564
-1,461
-0,270
-0,135
-4,399
-2,405
-1,717
3,938
1,870
2,275
p132
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
Series temporales
A
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
B
Y
105,86
97,79
96,1
127,44
108,78
112,61
111,43
145,71
118,37
121,89
124,25
159,55
125,41
135,4
137,86
171,44
132,38
147,59
153,92
179,39
141,59
159,6
163,23
205,54
161,71
172,24
173,17
C
Y-Ybar
-94,918
-102,988
-104,678
-73,338
-91,998
-88,168
-89,348
-55,068
-82,408
-78,888
-76,528
-41,228
-75,368
-65,378
-62,918
-29,338
-68,398
-53,188
-46,858
-21,388
-59,188
-41,178
-37,548
4,762
-39,068
-28,538
-27,608
F
gamma_0
4277,898
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
gamma_k
3562,405
3408,788
3149,145
3466,645
2791,202
2671,875
2435,804
2711,854
2076,334
1964,898
1745,883
1990,675
1385,336
1281,548
1082,582
1282,895
717,469
636,614
r_k
0,833
0,797
0,736
0,810
0,652
0,625
0,569
0,634
0,485
0,459
0,408
0,465
0,324
0,300
0,253
0,300
0,168
0,149
r_k^2
0,693
0,635
0,542
0,657
0,426
0,390
0,324
0,402
0,236
0,211
0,167
0,217
0,105
0,090
0,064
0,090
0,028
0,022
V(r_k)
0,016
0,038
0,059
0,076
0,098
0,111
0,124
0,134
0,147
0,155
0,162
0,167
0,174
0,178
0,180
0,182
0,185
0,186
- 2S(r_k)
-0,254
-0,392
-0,486
-0,553
-0,625
-0,667
-0,704
-0,733
-0,768
-0,787
-0,804
-0,818
-0,835
-0,843
-0,850
-0,854
-0,861
-0,863
AUTOCORRELOGRAMA
1,0
0,5
0,0
-0,5
-1,0
Hoja: Correl
+ 2S(r_k)
0,254
0,392
0,486
0,553
0,625
0,667
0,704
0,733
0,768
0,787
0,804
0,818
0,835
0,843
0,850
0,854
0,861
0,863
p133
Resultados de la regresin
Primer paso
Coef. de determinacin
R^2
0,99803327
ANLISIS DE VARIANZA
nu
8
Regresin
53
Residuos
61
Total
Ord. Origen
Q2
Q3
Q4
tQ2
tQ3
tQ4
t
t^2
S.C.
264708,064
521,636
265229,699
C.M.
33088,508
9,842
F
3361,908
Coefs
Error tpico
98,9145
1,7628
-2,3396
2,1976
-8,8900
2,2637
19,4201
2,2980
0,4416
0,0602
0,8756
0,0633
1,0150
0,0634
2,0067
0,0965
0,0142
0,0014
t
56,1129
-1,0646
-3,9271
8,4508
7,3341
13,8337
16,0203
20,7852
10,1580
p-val
6,95E-49
2,92E-01
2,50E-04
2,15E-11
1,31E-09
3,15E-19
5,78E-22
3,82E-27
4,85E-14
S.C.
264696,908
532,791
265229,699
C.M.
37813,844
9,867
F
3832,546
Coefs
Error tpico
97,8112
1,4278
-7,7472
1,9955
20,5667
2,0325
0,3863
0,0304
0,8484
0,0580
0,9877
0,0580
2,0302
0,0941
0,0143
0,0014
t
68,5071
-3,8823
10,1186
12,6897
14,6299
17,0261
21,5725
10,1963
p-val
3,52E-54
2,84E-04
4,50E-14
7,78E-18
1,97E-20
2,29E-23
3,26E-28
3,42E-14
p-val
7,37E-69
Segundo paso
Coef. de determinacin
0,99799121
R^2
ANLISIS DE VARIANZA
nu
7
Regresin
54
Residuos
61
Total
Ord. Origen
Q3
Q4
tQ2
tQ3
tQ4
t
t^2
p-val
2,00E-70
p134
Series temporales
16
24
32
40
48
56
64 t
Serie1
Real
Y 370
330
290
250
210
170
130
90
0
16
24
32
40
48
56
64 t
p135
Residuos
R 10
5
0
-5
-10
0
16
24
32
40
48
56
64 t
64
72
Real
Serie1
Model
Serie2
Serie3
Prev
Y 410
370
330
290
250
210
170
130
90
0
16
24
32
40
48
56
p136
Series temporales
Fig. 4.1
Una vez est abierto el archivo, observamos que consta de una hoja denominada Datos con
2 columnas de 31 valores cada una y la estructura mostrada en la figura 4.2.
La columna A, llamada Tiempo, contiene valores de 1 a 31 y la B, llamada Y, contiene los
valores del ndice econmico que se est estudiando.
Fig. 4.2
p137
Fig. 4.3
Y ahora la opcin (2; 1), es decir, Lnea con marcadores en cada valor de datos y
Terminar.
p138
Series temporales
En la casilla A40 escribimos el valor inicial de , = 0,1 para empezar, y etiquetamos las
columnas segn el contenido que tenemos destinado. As:
A
1 Tiempo
2
B
Y
C
S
D
S(2)
E
a^
F
b^
G
Y est
H
Error
I
Y prevista
casilla
Expresin
S1 = Y1
C2
= B2
St = Yt + ( 1 - ) St1
C3
$A$40)*C2
= $A$40*B3+(1
D2
= B2
St = St + ( 1 - ) S
D3
$A$40)*D2
= $A$40*C3+(1
at = 2St S(2)
t
E2
D2
= 2*C2
bt =
(S S(2)
t )
1
F2
$A$40))*(C2
D2)
= ($A$40/(1
= a + b
Y
t
t 1
t 1
G3
= E2+F2
Rt = et = Yt Y
t
H3
G3
= B3
(2)
1
= Y1
(2)
(2)
t1
p139
Se deben guardar los valores de cada y su ECM, a fin de escoger la ptima. En casillas
vacas preparamos una tabla como la que muestra la figura 4.4, donde etiquetamos C40
como Lambda y D40 como E.C.M. A continuacin escribimos en C41 el valor 0,1 (
utilizada en los clculos) y en D41 7,777, valor resultante de ECM segn ha salido en la
casilla H34. (Esto lo podemos hacer manualmente o con Cortar y Pegar slo valores).
Sustituyendo el valor de de la casilla A40 por 0,2, automticamente cambiarn todos los
valores de los clculos de las columnas C H. Ahora anotamos 0,2 en C42 y el valor de
H34 (2,679 en este caso) en D42.
Sucesivamente se van cambiando los valores de (A40) por 0,3, 0,9, y anotando junto
con sus ECM, desde C43
D43 hasta C49
D49. Con los datos actuales, se detecta que el
ptimo estar entre 0,4 y 0,5; por tanto, ponemos 0,45 en A40 y lo pasamos a C50
juntamente con su ECM (H34), que en este caso es igual a 1,822 y que anotamos en D50.
A
39
40
41
42
43
44
45
46
47
48
49
50
51
0,45
Lambda
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0,45
E.C.M.
7,777
2,679
1,989
1,836
1,833
1,917
2,077
2,321
2,669
1,822
ECM
8
6
4
2
0
0
0,5
Fig. 4.4
Previsiones
Una vez escogida la de trabajo, se puede pasar a calcular los valores previstos para los
prximos tres das, segn se ha deducido del correlograma. Por eso prolongamos la
columna A con los tres nuevos valores del tiempo (A33 = 32; A34 =33; A35 = 34).
El valor previsto para el instante t + T (31+T, en el caso de la prctica) es
#
Y
t + T = a t + bt
p140
Series temporales
y arrastrarla hasta I35. As acabamos de calcular los valores previstos para los prximos tres
das del ndice econmico estudiado. Todos los resultados se muestran en la pgina 141.
Conclusiones: Las previsiones siguen muy bien todos los datos, a lo largo del tiempo de
recogida de informacin. Los errores no muestran ninguna particularidad destacable.
p141
4.4 Resultados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
A
Tiempo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
0,45
B
Y
9,51
7,71
6,39
6,67
9,14
7,66
7,74
9,36
10,03
8,38
7,12
9,06
9,6
11,44
10,93
13,1
13,51
13,93
13,54
15,65
15,13
17,06
19,03
21,38
22,82
22,76
23,02
23,62
23,45
24,57
24,17
C
S
9,51
8,70
7,66
7,21
8,08
7,89
7,82
8,51
9,20
8,83
8,06
8,51
9,00
10,10
10,47
11,65
12,49
13,14
13,32
14,37
14,71
15,77
17,24
19,10
20,77
21,67
22,28
22,88
23,14
23,78
23,96
Lambda
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0,45
D
S(2)
9,51
9,15
8,48
7,91
7,99
7,94
7,89
8,17
8,63
8,72
8,42
8,46
8,70
9,33
9,85
10,66
11,48
12,23
12,72
13,46
14,02
14,81
15,90
17,34
18,89
20,14
21,10
21,90
22,46
23,05
23,46
E.C.M.
7,777
2,679
1,989
1,836
1,833
1,917
2,077
2,321
2,669
1,822
E
a^
9,51
8,25
6,84
6,52
8,18
7,84
7,76
8,86
9,76
8,94
7,70
8,56
9,30
10,86
11,10
12,65
13,50
14,05
13,92
15,27
15,40
16,73
18,57
20,86
22,66
23,20
23,45
23,86
23,82
24,51
24,45
ECM
F
b^
0,00
-0,36
-0,67
-0,57
0,08
-0,04
-0,05
0,28
0,46
0,09
-0,30
0,04
0,24
0,63
0,51
0,81
0,82
0,74
0,49
0,74
0,56
0,79
1,09
1,44
1,55
1,25
0,96
0,80
0,56
0,60
0,41
G
Y est
9,51
7,89
6,18
5,95
8,25
7,80
7,70
9,14
10,22
9,03
7,40
8,60
9,54
11,49
11,61
13,46
14,32
14,79
14,41
16,02
15,96
17,51
19,66
22,30
24,21
24,45
24,41
24,66
24,37
25,11
ECM =
H
Error
-1,800
-1,500
0,494
3,188
-0,593
-0,057
1,657
0,890
-1,842
-1,906
1,661
1,004
1,901
-0,562
1,487
0,045
-0,390
-1,253
1,240
-0,887
1,099
1,517
1,717
0,519
-1,448
-1,430
-0,795
-1,212
0,197
-0,936
1,822
8
6
4
2
0
0
Hoja: Datos
0,5
I
Y prevista
24,86
25,27
25,67
p142
Series temporales
Evolucin cronolgica
Y
30
20
10
0
0
10
20
30
40
Tiempo
Y est
Y prevista
30
20
10
0
0
10
20
Tiempo
30
40
p143
Errores
4
3
2
1
0
-1
-2
-3
0
10
20
30
40
Tiempo
A
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
Tiempo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
B
Y
9,51
7,71
6,39
6,67
9,14
7,66
7,74
9,36
10,03
8,38
7,12
9,06
9,6
11,44
10,93
13,1
13,51
13,93
13,54
15,65
15,13
17,06
19,03
21,38
22,82
22,76
23,02
23,62
23,45
24,57
24,17
C
Y - Ybar
-4,602
-6,402
-7,722
-7,442
-4,972
-6,452
-6,372
-4,752
-4,082
-5,732
-6,992
-5,052
-4,512
-2,672
-3,182
-1,012
-0,602
-0,182
-0,572
1,538
1,018
2,948
4,918
7,268
8,708
8,648
8,908
9,508
9,338
10,458
10,058
F
gamma_0
37,975
gamma_k
35,107
31,592
28,034
24,355
20,478
16,437
12,353
8,665
5,129
1,730
1
2
3
4
5
6
7
8
9
10
r_k
0,924
0,832
0,738
0,641
0,539
0,433
0,325
0,228
0,135
0,046
Hoja: Correl
r_k^2
0,855
0,692
0,545
0,411
0,291
0,187
0,106
0,052
0,018
0,002
p144
Series temporales
Autocorrelograma
1,0
0,5
0,0
-0,5
-1,0
p145
Evaluaciones
NDICE TEMTICO
1. DESCOMPOSICIN CLSICA
13.5.98................................................................... 1 2 3 4
3.5.99..................................................................... 1 2 3
23.6.99................................................................... 1 2 6
12.1.00................................................................... 1 2 3
17.5.00................................................................... 1 2 10
3. AUTOCORRELACIN
13.5.98................................................................... 5 10
3.5.99..................................................................... 7
23.6.99................................................................... 7
12.1.00................................................................... 6 7
17.5.00................................................................... 6 7
4. SUAVIZADO EXPONENCIAL
13.5.98................................................................... 6
3.5.99..................................................................... 8 9 10
23.6.99................................................................... 5 8
12.1.00................................................................... 8 9
17.5.00................................................................... 8 9
p146
Series temporales
1 EVALUACIONES PROPUESTAS
76,23+0,54t0,02t 76,23+0,54t
..
p147
Evaluaciones
13.5.98
? 1 Los valores disponibles de una serie temporal son: 11,2; 13,4; 9,9; 11,9; 14,2; 11,0; 13,1; 14,8;
12,2; 14,1; 16,3; .... Se trata de un modelo:
multiplicativo
tendencia rectilnea
estacionalidad de p=2
aditivo
tendencia parablica
estacionalidad de p=3
..........
ninguna tendencia
estacionalidad de p=4
................
.................
?2
..........
?3
Los primeros datos de una serie multiplicativa p = 4 son: 32; 26; 22; 45; 52; 42; 29; ... El valor
de la media mvil asociada a t = 4 es:
31,25
36,25
38,25
40,25
..........
?4
En una serie multiplicativa de p = 4, E1* = 43.4 E*2 = 37.9 E3* = 52.5 E*4 = 66.2 ; cul es el
valor de E3?
2.5
44.6
52.5
105
..........
? 5. Sobre 106 valores, la tendencia estimada es 254,9 + 0,25 t ; los ndices estacionales son E1 =
35,5; E2 = 72,8; E3 = 60,7 y E4 = 47,6 y el ltimo coeficiente de autocorrelacin significativo es 3.
El valor ms alejado que se puede prever de la serie es:
317,65
282,15
221,45
194,95
. ........
? 6. Se dispone de los datos cronolgicos: Y1 = 45,74; Y2 = 47,95; Y3 = 49,23; Y4 = 51,47; ...
Para un valor = 0,8, cul es el cuarto valor de la serie suavizada (S4)?
48,89
51,37
41,18
50,95
..........
? 7. Un modelo aditivo de perodo 3, ha dado los siguientes ndices estacionales: E1 = 10; E2 = 20 y E3 =
30. Los coeficientes 2 y 3 del modelo en variables categricas se estiman como:
20 y 30
10 y 40
25 y 45
10 y 10
...........
? 8. La modelizacin de una serie aditiva con variables categricas ha dado
Y = 104,8 0,5 t 8,2 Q2 + 15,4 Q3. El valor previsto para t = 50 es:
71,6
87
95,2
79,8
...........
? 9. En la serie de la pregunta anterior, el ltimo valor observado ha sido y = 81,5 para t = 49. Qu
valor tiene el residuo?
13,2
0
1,2
9,4
...........
? 10 Con 252 datos se han obtenido los coeficientes de autocorrelacin: r1= 0,983; r2= 0,537;
r3= 0,684; r4= 0,322; ... En qu intervalo de valores se puede considerar nulo 3?
0,266
0,236
0,299
0,225
...........
p148
Series temporales
3.5.99
???Se dispone de 100 valores de una serie siendo los 6 ltimos 53,0; 89,3; 66,6; 29,1; 194,8 y
61,2. Se detecta que tiene una estacionalidad de periodo 5 y que es de tipo multiplicativo.
? 1. El valor de la ltima media mvil es:
74,02
86,56
88,2
87,38
......................
? 2. Se ha obtenido E1 = 108,3; E2 = 75,1; E4 = 220,6 y E5 = 65,6. Qu valor tiene E3?
25,8
469,6
30,4
220,6
....
a = 65,24
T=a+bt
b = 0,79
0,0000
0,893
a = 65,62
T=a+bt+ct
b = 0,68
c= 0,0050
0,0221
0,6943
0,900
325,16
...... .
??? Una serie de la que tenemos 92 valores se ha modelizado con variables categricas
obtenindose Y = 250,83 + 1,27t 0,006t2 + 5,35Q2 8,27Q3 10,2Q4 + 15,60Q5
? 4. Cul es la longitud de la estacionalidad (p)?
3
4
5
6
no se sabe ..............................
? 5. Siendo Y92 = 320, qu valor tiene su residuo?
2,236
13,154
11,224
6,137
..............................
8,766
..............................
? 7. En una serie de 100 datos, los coeficientes de autocorrelacin calculados son r1 = 0,952 r2 =
0,741 r3 = 0,583 r4 = 0,492. 4 ser considerado nulo si r4 , en valor absoluto, es menor que
0,2792
0,4050
0,4285
0,5412 ..............................
?? Los valores de una serie son 40,22; 54,89; 63,51; ....
? 8. En un suavizado exponencial con = 0,4, cul es el valor de S3?
58,338
53,0568
49,0220
52,1252
? 9. Segn el mtodo de Brown, cul es el valor modelado para t = 3
63,790
56,614
51,956
40,220
..................
( Y 3 ) ?
..................
? 10. Los valores de una serie son 67,38; 56,09; 75,11; 55,90 y 61,25 y los estimados segn el
modelo resultante del anlisis han sido 56,44; 62,29; 72,13; 59,60; y 65,45.Cul es el valor
del error cuadrtico medio (MSE)?
42,931
40,697
40,374
39,667 ...............................
p149
Evaluaciones
23.6.99
????? Los primeros valores de una serie, de la que se dispone de 141 observaciones, son: 225;
219; 196; 197; 235; 208; 191; 212; 216; .... Se trata de un modelo aditivo con estacionalidad de
perodo 4. Por el sistema clsico se ha obtenido como tendencia Tt = 200 + 0,10 t y como ndices
estacionales E1 = 0,73; E2 = 0,87 y E3 = 0,4.
209,625
210,500 ...............
12,40
12,42
...............
..............
50
(y
y)2 = 4 ;
48
(yi+ 2 y) = 3,2 y
0,0600
0,0652
i=1
47
(y y)
i
(yi+1 y) = 3,6 ;
i=1
i=1
(y y)
49
(y y)
i=1
0,0712
0,0754
0,0780
..............
? 8. Los valores de una serie sin estacionalidad y con tendencia rectilnea son 7,3; 7,8; 8,1; 8,5; 8,8;
9,0; .... Con = 0,4, cul es el valor modelizado para t=3?
7,700
7,380
7,004
7,540
7,860
...............
p150
Series temporales
12.1.00
?? Unos datos cronolgicos trimestrales han dado lugar a una tendencia T=120+1,4 t0,2 t y a
una estacionalidad E1 = 10; E2 = 8; E3 = 15 y E4 = 3.
? 1. Qu diferencia existir entre los valores estimados del primer trimestre del primer ao
y el segundo del ao siguiente?
2
25
13
4
18
? 2. El ltimo dato disponible es el de t = 47. Cul es el valor previsto para t = 50?
310
348
378
318
345
?3. En una serie aditiva de p= 7, los pares de valores (t, Yt) son (1; 15), (2; 19), (3; 17), , (6;25), (7;
28), (8; 32), (9; 35), ... La media mvil para t = 4 es igual a 26. Qu vale la de t = 5?
faltan datos
28,86
28,43
29,52
?? Un modelo en variables categricas, con ordenada en el origen igual a 500, ajustado sobre una
serie de perodo p=3, ha evidenciado que la serie crece 0,5 unidades por unidad de tiempo y que
la segunda estacin supera a la primera en 20 unidades, mientras que la tercera est 30 unidades
por debajo de la segunda.
? 4. El valor del coeficiente Q3 es igual a
30
35
5
10
15
? 5. La previsin para t = 53 es
528
529,5
548
549,5
546,5
100
= 0;
i=1
Qu vale r3?
faltan datos 0
0,80
100
y
i=1
2
i
0,96
= 125 y
97
yi+ 3 = 120 .
i=1
? 7. En una serie con 80 datos se ha obtenido r1 = 0,90; r2 = 0,80; r3 = 0,70; r4 = 0,60. Cul es el
valor absoluto lmite de r5 para ser considerado distinto de cero?
0,43
0,50
0,53
0,61
0,64
.
? 8. Los valores de una serie son 16,4; 16,9; 18,1; 18,5; 19,3; 19,8; en un suavizado exponencial
con = 0,6. Cul es el error de previsin para t = 4?
0,805
0,925
0,960
1,115
1,300
... .
? 9. En la misma serie del apartado anterior y con igual factor de ponderacin, cul sera el valor
estimado para t = 4 ( Y ) utilizando el mtodo de Brown?
4
17,920
19,076
18,672
19,137
p151
Evaluaciones
17.5.00
182,66
.....................
224,46
100
0,371
(y y)
= 793,42
i=1
i=1
? 6. Qu vale r6?
hay un error
............................
0,609
0,684
............
...........................
? 10. En una serie multiplicativa de perodo p = 3, se ha obtenido E1* = 15,25; E*2 = 30,50 y
50
100
150
200
............
p123
Evaluaciones
2 EVALUACIONES RESUELTAS
l 1. En un anlisis de componentes principales los valores propios, de la matriz de correlaciones, son {2,78; 2; 0,16; 0,05; 0,01} y g13 = 0,768. Qu vale r13 ?.
0,143
0,527
0,12
0,3072 n
..............................................
Puesto que di = 5 es un valor entero, coincidente con el nmero de valores propios, necesariamente se trabaja con variables estandarizadas y se ha diagonalizado la matriz de correlaciones. Entonces,
r1 3 = g1 3
d3
= 0,768
= 0,3072
0,16
p124
Estadstica industrial
17.3.99
En una tabla de correspondencias la 3 columna es 13; 23; 17 y 20, y los totales de les columnas son 100; 97; 73; 133 y 152.
l 1. Cuntos valores propios no triviales hay?
3n
.........................................................................
0,314
0,240
0,175 n
0,711
..............................................
n j
f j =
ni j
i=1
p
n j
i=1
f 2 =
n j
97
= 0,175
555
0,714
0,132 n
0,312
0,511
.........................................
El perfil medio de las filas coincide con las masas de las columnas
f 3 =
n 3
73
= 0,132
555
1n
0,13
0,312
0,811
.....................................................
fi
i=1
f j
j=1
n
= 1
n
p125
Evaluaciones
5n
.........................................................
La dimensin del vector aleatorio X, coincide con el nmero de valores propios. En este caso p = 5.
l 6. Qu vale r13 ?.
0,143
0,527
0,12
0,3072 n
..............................................
Dado que di = 5, un valor entero coincidente con el nombre de valores propios, necesariamente se trabaja con variables estandardizadas y se ha diagonalizado la matriz de correlaciones. Entonces
r1 3 = g1 3
d3
= 0,768
0,16
= 0,3072
2n
..............................................................
La proporcin acumulada que representan los valores propios (variancias de los componentes
principales) con relacin al total es: 2,78/5 = 0,556 (2,78 + 2)/5 = 0,956 etc. Entonces los
dos primeros ya son suficientes ya que explican el 95,6% del total.
l 8. Al estudiar los componentes principales ha resultado tg1 = {0,48 0,32 0,47 0,48 0,46},
p
g2= {0,40 0,21 0,8 0,28 0,26} y Q = diag{4 9 6,25 7,75 8}. Qu vale di ?
i=1
No se sabe
3,14
35 n
p
di =
i=1
.............................................
p
i=1
si2
di = 35
i=1
resultando
p126
Estadstica industrial
19.4.99
En una tabla de correspondencias les 3 y 4 filas son {47; 65; 78; 35} y {82; 42; 76; 23};
Adems, las masas de las filas son {0,134; 0,268; 0,225; 0,223; 0,150}
l 1. Cul es la suma total, n?
225
223
n3
Resulta n =
f3
777
1000 n
...............................................
225
= 1000
0,225
0,2141
0,7197 n
Por definicin X3 3 =
f33
f3
f 3
0,0682
.............................................
0,078
0,225
= 0,7197
0,232
Al estudiar los componentes principales ha resultado tg1 = {0,47 0,32 0,48 0,46 0,48}, tg2 =
{0,40 0,28 0,8 0,21 0,26} y Q = diag{4 9 6,25 7,75 3,8}
l 3. Si r12 = 0,632, qu vale d2?
22,14
36,48
25,78
9,99 n
..............................................
Las variancias, expuestas en la diagonal de la matriz Q, son razonablemente homogneas,
indicando que se ha diagonalizado la matriz S, y teniendo en cuenta que
r12 =
g12
d2
r s
0,6322 4
= 9,99
d2 = 12 1 =
0,402
g12
resulta
s1
27
Dado que
32
p
di
i=1
64
p
si2
i=1
25,65 n
= 27 y que
d1+d2?
......................................................
d1 + d2
= 0,95 resulta
di
i
0,5236
La explicacin es
j=1
0,9984 n
.......................................
0,9763
p127
Evaluaciones
5.11.99
ri22 ?
i=1
d2
0,9
......
i=1
ri22
gi22
S2
i=1
d2
0,3 n
4,6
6,8
X2 3
1,4
....
U2 3 U3
33 30
=
=
= 0,3
S3
10
Estandarizar
Factorizar
.......................................
Si mx || = 0,307, las correlaciones entre las variables son muy reducidas, la informacin
redundante es prcticamente nula y se requerira un nmero muy elevado de componentes
para explicar razonablemente la variabilidad total. Por todo ello los componentes principales
son intiles.
1 1 1 1
1 1 1 1
Si D = diag(3,24 0,7 0,045 0,015) y G = 0,5
1 1 1 1
1 1 1 1
l 4. Qu proporcin de X3 es explicada por Y2?
17,5% n
92,3%
1,125%
No se sabe
....
p128
Estadstica industrial
1,2
0,9 n
0,1061
3,4
......
...........
No existe n
0,25
...
Dado que las matrices D y G son de orden 44, slo hay cuatro variables y, por tanto, el nmero de Componentes Principales es, tambin, 4 y no existe Y5.
l 8 Cul es la medida relativa de la informacin compartida por dos variables?
el factor especfico
la covariancia
.................................... .
Las correspondencias, comparando los perfiles mediante la distancia de 2.
ATENCIN, MARCAR LA NICA RESPUESTA INCORRECTA
l 10 Los componentes principales:
reducen la masa de datos
eliminan informacin redundante
reducen el nmero de variables
conservan la informacin
reducen el n de individuos n
p129
Evaluaciones
20.3.00
l 1. Una fila de una tabla de correspondencias es {13 26 39 22}, cul es el tercer elemento
de su perfil?
Falta n
0,39 n
39
...............................
ni3
39
=
= 0,39
j nij 13 + 26 + 39 + 22
l 2. Si el perfil de la 3 fila es {0,31 0,60 0,74 0,26} y n3 = 500, qu vale el tercer elemento
de esa fila?
Hay un error n
370
0,025
0,01
.........................
Hay un error ya que si fuese un perfil la suma de sus elementos sera 1 y aqu, obviamente, no
se cumple este requisito.
l 3. Si hay 14 puntos fila y 23 puntos columna, cuntos valores propios nulos hay en total?
10 n
13
.............................
Los valores propios no triviales (distintos de cero) son mn(p1, q1) = 13, por lo que los nulos
son
mx(p; q) mn(p1; q1) = 23 13 = 10.
l 4. Si n13 = 24, n1 = 100, n3 = 90 y n = 900, qu vale el elemento correspondiente de la matriz Z para el estudio de las distancias de 2 entre las columnas?
0,99
0,95
0,05
0,8 n
.............
n13 / n
n1 / n (n3 / n)
n13
n1
n3
24 900
100 90
= 0,8
.......................
Se reconoce que es un perfil si suma 1. Dado que la columna en cuestin cumple dicha condicin se trata, efectivamente, de un perfil.
p130
Estadstica industrial
l 6. Con Q = diag(2 4 1600 725), D = diag(3,5 0,4 0,07 0,03), si r12 = 0,87, cul es la parte
de V(X1) explicada por el segundo componente?
Falta g12
0,87
0,4
0,7569 n
.......
La matriz Q muestra que las variancias Si2 son harto heterogneas, por lo que se ha estandardizado (Opcin B), circunstancia corroborada por el hecho de que traza D = p = 4, y la parte
de V(X1) = 1 explicada por el segundo componente principal coincide con la proporcin, es
decir
r122 = 0,872 = 0,7569.
Falta n
1,8
0,9 n
0,361
............
Resulta
rX X = rX X =
3 1
1 3
cov(X1, X 3 )
S1 S3
18
16 25
= 0,9
l 9. U32 = 24, U23 = 32, U = t(9 12 16 8 14) y Q = diag(12 14 16 8 13), qu vale X32?
12 n
16
......................
Teniendo en cuenta que, como muestra la matriz Q, las variancias son del mismo orden de
magnitud, slo se requiere centrar y
X32 = U32 U2 = 24 12 = 12
No se sabe
0n
ri2j
j=1
......................................
nulos.